(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-25
(54)【発明の名称】CRISPR/Cas12f1(Cas14a1)システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
(51)【国際特許分類】
C12N 15/113 20100101AFI20231018BHJP
C12N 15/63 20060101ALI20231018BHJP
C12N 15/86 20060101ALI20231018BHJP
C12N 15/09 20060101ALI20231018BHJP
【FI】
C12N15/113 Z ZNA
C12N15/63 Z
C12N15/86 Z
C12N15/09 110
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023521490
(86)(22)【出願日】2021-10-08
(85)【翻訳文提出日】2023-06-07
(86)【国際出願番号】 KR2021013933
(87)【国際公開番号】W WO2022075816
(87)【国際公開日】2022-04-14
(31)【優先権主張番号】10-2020-0129937
(32)【優先日】2020-10-08
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2020-0185528
(32)【優先日】2020-12-29
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2021-0044152
(32)【優先日】2021-04-05
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】522127357
【氏名又は名称】ゲンコレ インコーポレイテッド
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】キム、ヨン-サム
(72)【発明者】
【氏名】キム、ド ヨン
(72)【発明者】
【氏名】リー、ジェオン ミ
(72)【発明者】
【氏名】ムン、ス ビン
(57)【要約】
本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムに関する。より具体的には、本発明は標的核酸の切断、編集または変形をさらに効果的に遂行するためのエンジニアリングされたガイドRNAおよびこれを含んだエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムに関する。また、本発明はエンジニアリングされたガイドRNAおよびこれを含んだエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した標的核酸の切断、編集または変形方法に関する。
【特許請求の範囲】
【請求項1】
CRISPR/Cas12f1(Cas14a1)システムのための、エンジニアリングされたtracrRNA(trans-activating crispr RNA)およびcrRNA(crispr RNA)を含むエンジニアリングされたガイドRNAであって、
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形され、第1配列、第2配列、第3配列、第4配列および第5配列を3'末端から5'末端方向に順に含み、
前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:194)配列またはSEQ ID NO:194配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記VはA、CまたはGであり、この時、前記SEQ ID NO:194配列の一部の配列は前記SEQ ID NO:194配列のうち5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつ前記SEQ ID NO:194配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列または前記SEQ ID NO:211配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列または前記SEQ ID NO:212配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列またはSEQ ID NO:213配列の一部の配列であり、この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり、
前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列またはSEQ ID NO:248配列の一部の配列であり、この時、前記SEQ ID NO:248配列の一部の配列は前記SEQ ID NO:248配列の3'末端部で順次的な一部の配列であり、
前記crRNAは野生型crRNAまたはエンジニアリングされたcrRNAであり、
前記野生型crRNAは野生型反復配列およびガイド配列を5'末端から3'末端方向に順に含み、
前記エンジニアリングされたcrRNAは第6配列、第7配列および前記ガイド配列を5'末端から3'末端方向に順に含み、
この時、前記第6配列は5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:373)配列またはSEQ ID NO:373配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記BはU、CまたはGであり、この時、前記SEQ ID NO:373配列の一部の配列は前記SEQ ID NO:373配列のうち5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつ前記SEQ ID NO:373配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
この時、前記ガイド配列は標的配列と混成化できる配列または標的配列と相補的な結合を形成する配列であり、15から30nt(nucleotide)配列である、
エンジニアリングされたガイドRNA。
【請求項2】
前記第1配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:111)配列またはSEQ ID NO:111配列の一部の配列であり、
この時、前記SEQ ID NO:111配列の一部の配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3'(SEQ ID NO:273)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3'(SEQ ID NO:274)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:275)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3'(SEQ ID NO:276)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3'(SEQ ID NO:277)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3'(SEQ ID NO:278)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUC-3'(SEQ ID NO:279)配列、5'-CAAAUUCANNNCNCCUCUCCAAUU-3'(SEQ ID NO:280)配列、5'-CAAAUUCANNNCNCCUCUCCAAU-3'(SEQ ID NO:281)配列、5'-CAAAUUCANNNCNCCUCUCCAA-3'(SEQ ID NO:282)配列、5'-CAAAUUCANNNCNCCUCUCCA-3'(SEQ ID NO:283)配列、5'-CAAAUUCANNNCNCCUCUCC-3'(SEQ ID NO:284)配列、5'-CAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:285)配列、5'-CAAAUUCANNNCNCCUCU-3'(SEQ ID NO:286)配列、5'-CAAAUUCANNNCNCCUC-3'(SEQ ID NO:287)配列、5'-CAAAUUCANNNCNCCU-3'(SEQ ID NO:288)配列、5'-CAAAUUCANNNCNCC-3'(SEQ ID NO:289)配列、5'-CAAAUUCANNNCNC-3'(SEQ ID NO:290)配列または5'-CAAAUUCANNNCN-3'(SEQ ID NO:272)配列であり、
この時、前記Nはそれぞれ独立的にA、C、GまたはUである、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項3】
前記SEQ ID NO:213配列の一部の配列は5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:214)配列、5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:215)配列、5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:216)配列、5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:217)配列、5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:231)配列、5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:232)配列、5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3'(SEQ ID NO:233)配列、5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:234)配列、5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3'(SEQ ID NO:235)配列、5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3'(SEQ ID NO:236)配列、5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3'(SEQ ID NO:237)配列、5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3'(SEQ ID NO:238)配列、5'-CCGCUUCACCUUAGGAGUGAAGGUG-3'(SEQ ID NO:239)配列、5'-CCGCUUCACUUAGAGUGAAGGUG-3'(SEQ ID NO:240)配列、5'-CCGCUUCACUUAGGUGAAGGUG-3'(SEQ ID NO:241)配列、5'-CCGCUUCAUUAGUGAAGGUG-3'(SEQ ID NO:242)配列、5'-CCGCUUCUUAGGAAGGUG-3'(SEQ ID NO:243)配列、5'-CCGCUUUUAGAAGGUG-3'(SEQ ID NO:244)配列、5'-CCGCUUUAGAGGUG-3'(SEQ ID NO:245)配列、5'-CCGCUUAGGGUG-3'(SEQ ID NO:246)配列、5'-CCGUUAGGUG-3'(SEQ ID NO:247)配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列または5'-UUAG-3'配列であり、
この時、前記SEQ ID NO:213配列の一部の配列内に含まれた前記5'-UUAG-3'配列は選択的に5'-GAAA-3'配列で置換される、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項4】
前記SEQ ID NO:248配列の一部の配列は5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列、5'-AAGUGGAGAA-3'(SEQ ID NO:249)配列、5'-AAAGUGGAGAA-3'(SEQ ID NO:250)配列、5'-UAAAGUGGAGAA-3'(SEQ ID NO:251)配列、5'-AUAAAGUGGAGAA-3'(SEQ ID NO:252)配列、5'-GAUAAAGUGGAGAA-3'(SEQ ID NO:253)配列、5'-UGAUAAAGUGGAGAA-3'(SEQ ID NO:254)配列、5'-CUGAUAAAGUGGAGAA-3'(SEQ ID NO:255)配列、5'-ACUGAUAAAGUGGAGAA-3'(SEQ ID NO:256)配列、5'-CACUGAUAAAGUGGAGAA-3'(SEQ ID NO:257)配列、5'-UCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:258)配列または5'-UUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:259)配列である、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項5】
前記第6配列は5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:408)配列またはSEQ ID NO:408配列の一部の配列であり、
この時、前記SEQ ID NO:408配列の一部の配列は5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:413)配列、5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:414)配列、5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:415)配列、5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:416)配列、5'-AGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:417)配列、5'-GAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:418)配列、5'-AACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:419)配列、5'-ACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:420)配列、5'-CCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:421)配列、5'-CCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:422)配列、5'-CGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:423)配列、5'-GAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:424)配列、5'-AAUAGNGNNNUGAAGGA-3'(SEQ ID NO:425)配列、5'-AUAGNGNNNUGAAGGA-3'(SEQ ID NO:426)配列、5'-UAGNGNNNUGAAGGA-3'(SEQ ID NO:427)配列、5'-AGNGNNNUGAAGGA-3'(SEQ ID NO:428)配列または5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列であり、
この時、前記Nはそれぞれ独立的にA、C、GまたはUである、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項6】
前記crRNAはU-rich tail配列を追加でさらに含み、
この時、前記U-rich tail配列は前記crRNAの3'末端に位置する、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項7】
前記U-rich tail配列は5'-(U
aN)
dU
e-3'配列、5'-U
aVU
aVU
e-3'配列または5'-U
aVU
aVU
aVU
e-3'配列であり、
この時、前記NはA、C、GまたはUであり、前記それぞれのVは独立的にA、CまたはGであり、前記aは0から4の整数であり、前記dは0から3の整数であり、前記eは0から10の整数である、請求項6に記載のエンジニアリングされたガイドRNA。
【請求項8】
前記エンジニアリングされたガイドRNAはdualガイドRNAまたはsingleガイドRNAであって、
この時、前記エンジニアリングされたガイドRNAが前記singleガイドRNAであるとき、前記エンジニアリングされたガイドRNAはlinker配列を追加でさらに含み、前記linker配列は前記エンジニアリングされたtracrRNAと前記crRNAの間に位置する、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項9】
前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:269)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:304)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:590)配列、5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:301)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:592)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:305)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:593)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUC-3'(SEQ ID NO:300)配列を含み、
この時、前記Nはそれぞれ独立的にA、C、GまたはUである、請求項1に記載のエンジニアリングされたガイドRNA。
【請求項10】
前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3'(SEQ ID NO:591)配列および前記ガイド配列を含むか、または5'-GAAUAGNGNNNUGAAGGAAUGCAAC-3'(SEQ ID NO:594)配列および前記ガイド配列を含み、
この時、前記Nはそれぞれ独立的にA、C、GまたはUである、請求項9に記載のエンジニアリングされたガイドRNA。
【請求項11】
前記第1配列内に存在する前記5'-NNNCN-3'配列が5'-UUUCU-3'配列、5'-GUUCU-3'配列、5'-UCUCU-3'配列、5'-UUGCU-3'配列、5'-UUUCC-3'配列、5'-GCUCU-3'配列、5'-GUUCC-3'配列、5'-UCGCU-3'配列、5'-UCUCC-3'配列、5'-UUGCC-3'配列、5'-GCGCU-3'配列、5'-GCUCC-3'配列、5'-GUGCC-3'配列、5'-UCGCC-3'配列、5'-GCGCC-3'配列または5'-GUGCU-3'配列である、請求項2に記載のエンジニアリングされたガイドRNA。
【請求項12】
前記第6配列内に存在する前記5'-NGNNN-3'配列が5'-AGGAA-3'配列、5'-AGCAA-3'配列、5'-AGAAA-3'配列、5'-AGCAU-3'配列、5'-AGCAG-3'配列、5'-AGCAC-3'配列、5'-AGCUA-3'配列、5'-AGCGA-3'配列、5'-AGCCA-3'配列、5'-UGCAA-3'配列、5'-UGCUA-3'配列、5'-UGCGA-3'配列、5'-UGCCA-3'配列、5'-GGCAA-3'配列、5'-GGCUA-3'配列、5'-GGCGA-3'配列、5'-GGCCA-3'配列、5'-CGCAA-3'配列、5'-CGCUA-3'配列、5'-CGCGA-3'配列または5'-CGCCA-3'配列である、請求項5に記載のエンジニアリングされたガイドRNA。
【請求項13】
前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:270)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:308)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:595)配列、5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:306)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3'(SEQ ID NO:596)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:309)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:597)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUC-3'(SEQ ID NO:307)配列を含む、請求項11に記載のエンジニアリングされたガイドRNA。
【請求項14】
前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO:539)配列および前記ガイド配列を含むか、または5'-GAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO:598)配列および前記ガイド配列を含む、請求項13に記載のエンジニアリングされたガイドRNA。
【請求項15】
CRISPR/Cas12f1(Cas14a1)システムのための、エンジニアリングされたガイドRNAを暗号化する核酸を含むベクターであって、
前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNA(trans-activating crispr RNA)およびcrRNA(crispr RNA)を含み、
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形され、第1配列、第2配列、第3配列、第4配列および第5配列を3'末端から5'末端方向に順に含み、
前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:194)配列またはSEQ ID NO:194配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記VはA、CまたはGであり、この時、前記SEQ ID NO:194配列の一部の配列は前記SEQ ID NO:194配列のうち5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつ前記SEQ ID NO:194配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列または前記SEQ ID NO:211配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列または前記SEQ ID NO:212配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列またはSEQ ID NO:213配列の一部の配列であり、この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり、
前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列またはSEQ ID NO:248配列の一部の配列であり、この時、前記SEQ ID NO:248配列の一部の配列は前記SEQ ID NO:248配列の3'末端部で順次的な一部の配列であり、
前記crRNAは野生型crRNAまたはエンジニアリングされたcrRNAであり、
前記野生型crRNAは野生型反復配列およびガイド配列を5'末端から3'末端方向に順に含み、
前記エンジニアリングされたcrRNAは第6配列、第7配列および前記ガイド配列を5'末端から3'末端方向に順に含み、
この時、前記第6配列は5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:373)配列またはSEQ ID NO:373配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記BはU、CまたはGであり、この時、前記SEQ ID NO:373配列の一部の配列は前記SEQ ID NO:373配列のうち5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつ前記SEQ ID NO:373配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
この時、前記ガイド配列は標的配列と混成化できる配列または標的配列と相補的な結合を形成する配列であり、15から30nt(nucleotide)配列である、ベクター。
【請求項16】
前記ベクターは前記エンジニアリングされたガイドRNAを暗号化する核酸のためのプロモーターをさらに含む、請求項15に記載のベクター。
【請求項17】
前記プロモーターはU6プロモーター、H1プロモーターまたは7SKプロモーターである、請求項16に記載のベクター。
【請求項18】
前記ベクターはプラスミド、PCRアンプリコンまたはウイルスベクターである、請求項15に記載のベクター。
【請求項19】
エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物であって、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAまたはこれを暗号化する核酸;およびCas12f1(Cas14a1)タンパク質またはこれを暗号化する核酸を含み、
前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNA(trans-activating crispr RNA)およびcrRNA(crispr RNA)を含み、
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形され、第1配列、第2配列、第3配列、第4配列および第5配列を3'末端から5'末端方向に順に含み、
前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:194)配列またはSEQ ID NO:194配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記VはA、CまたはGであり、この時、前記SEQ ID NO:194配列の一部の配列は前記SEQ ID NO:194配列のうち5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつ前記SEQ ID NO:194配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列または前記SEQ ID NO:211配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列または前記SEQ ID NO:212配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列またはSEQ ID NO:213配列の一部の配列であり、この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり、
前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列またはSEQ ID NO:248配列の一部の配列であり、この時、前記SEQ ID NO:248配列の一部の配列は前記SEQ ID NO:248配列の3'末端部で順次的な一部の配列であり、
前記crRNAは野生型crRNAまたはエンジニアリングされたcrRNAであり、
前記野生型crRNAは野生型反復配列およびガイド配列を5'末端から3'末端方向に順に含み、
前記エンジニアリングされたcrRNAは第6配列、第7配列および前記ガイド配列を5'末端から3'末端方向に順に含み、
この時、前記第6配列は5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:373)配列またはSEQ ID NO:373配列の一部の配列であり、この時、前記Nはそれぞれ独立的にA、C、GまたはUであり、前記BはU、CまたはGであり、この時、前記SEQ ID NO:373配列の一部の配列は前記SEQ ID NO:373配列のうち5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつ前記SEQ ID NO:373配列の3'末端から少なくとも1個以上のヌクレオチドを含まない配列であり、
この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり、
この時、前記ガイド配列は標的配列と混成化できる配列または標的配列と相補的な結合を形成する配列であり、15から30nt(nucleotide)配列である、組成物。
【請求項20】
前記組成物は前記エンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1(Cas14a1)タンパク質を暗号化する核酸を一つのベクターに含む、請求項19に記載の組成物。
【請求項21】
前記ベクターは前記エンジニアリングされたガイドRNAを暗号化する核酸のためのプロモーターおよび前記Cas12f1(Cas14a1)タンパク質を暗号化する核酸のためのプロモーターをさらに含む、請求項20に記載の組成物。
【請求項22】
前記プロモーターはU6プロモーター、H1プロモーター、7SKプロモーター、CMVプロモーター、LTRプロモーター、Ad MLPプロモーター、HSVプロモーター、SV40プロモーター、CBAプロモーターまたはRSVプロモーターである、請求項21に記載の組成物。
【請求項23】
前記ベクターはプラスミド、mRNA(転写物)、PCRアンプリコンまたはウイルスベクターである、請求項20に記載の組成物。
【請求項24】
前記組成物は核酸およびタンパク質の混合形態であって、エンジニアリングされたガイドRNAおよびCas14a1タンパク質が結合されたエンジニアリングされたCRISPR/Cas14a1複合体の形態で含む、請求項19に記載の組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2020年10月8日付で出願された大韓民国特許出願第10-2020-0129937号、2020年12月29日付で出願された大韓民国特許出願第10-2020-0185528号および2021年4月5日付で出願された大韓民国特許出願第10-2021-0044152号に対する優先権を主張し、これらの出願それぞれの内容はその全体が参照によって本明細書に含まれる。
【0002】
本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムに関する。より具体的には、本発明は標的核酸の切断(cleavage)、編集(editing)または変形(modifying)をさらに効果的に遂行するためのエンジニアリングされたガイドRNAおよびこれを含んだエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムおよびこの利用に関する。
【背景技術】
【0003】
CRISPR/Cas12f1システムはClass 2、Type Vに分類されるCRISPR/Casシステムである。先行研究(Harrington et al.,Science 362、839-842(2018))ではじめて古細菌由来のCRISPR/CasシステムであるCRISPR/Cas14aシステムに対して明らかになった。その後、後続研究(Tautvydas Karvelis et al.,Nucleic Acids Research 48、5016-5023(2020))で前記CRISPR/Cas14システムをCRISPR/Cas12fシステムに分類した。CRISPR/Cas12f1システムは前記Class 2、Type Vに分類されるCRISPR/Casシステムのうち一つのバリアントであるV-F1システムに属し、これはCas14a1をエフェクタータンパク質として有するCRISPR/Cas14a1システムを含む。前記CRISPR/Cas12f1システムは、CRISPR/Cas9システムに比べてエフェクタータンパク質の大きさが顕著に小さいという特徴がある。ただし、先行研究(Harrington et al.,Science 362、839-842(2018)、US 2020/0190494 A1)で明らかになったところでは、前記CRISPR/Cas12f1システム、特にCRISPR/Cas14a1システムは二本鎖DNA切断活性がないか、極めて低いため(Karvelis、T.et al.,bioRxiv、654897(2019))ゲノム編集技術に応用するのに限界がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の一目的はCRISPR/Cas12f1(Cas14a1)システムのためのエンジニアリングされたガイドRNA(engineered guide RNA)を提供することである。
【0005】
本発明の他の目的はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを提供することである。
【0006】
本発明のさらに他の目的はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を提供することである。
【0007】
本発明のさらに他の目的はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した標的核酸または標的遺伝子を変形する方法を提供することである。
【課題を解決するための手段】
【0008】
本発明はCRISPR/Cas12f1(Cas14a1)システムのためのエンジニアリングされたガイドRNAを提供する。前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNA(trans-activating CRISPR RNA)およびcrRNA(CRISPR RNA)を含む。この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたtracrRNAである。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形され、wildtype tracrRNAより長さが短いように変形されたtracrRNAである。
【0009】
一具現例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNA(trans-activating crispr RNA)およびcrRNA(crispr RNA)を含むことができる。
【0010】
前記エンジニアリングされたtracrRNA(engineered tracrRNA)は連続した5個以上のウリジン配列を含まないように変形されたtracrRNAであり得る。
【0011】
前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を3'末端から5'末端方向に順に含むことができる。
【0012】
この時、前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:194)配列またはSEQ ID NO:194配列の一部の配列であり得る。前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記SEQ ID NO:194配列の一部の配列は、前記SEQ ID NO:194配列のうち5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。一具体例において、前記第1配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:111)配列またはSEQ ID NO:111配列の一部の配列であり得る。前記SEQ ID NO:111配列の一部の配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3'(SEQ ID NO:273)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3'(SEQ ID NO:274)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:275)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3'(SEQ ID NO:276)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3'(SEQ ID NO:277)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3'(SEQ ID NO:278)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUC-3'(SEQ ID NO:279)配列、5'-CAAAUUCANNNCNCCUCUCCAAUU-3'(SEQ ID NO:280)配列、5'-CAAAUUCANNNCNCCUCUCCAAU-3'(SEQ ID NO:281)配列、5'-CAAAUUCANNNCNCCUCUCCAA-3'(SEQ ID NO:282)配列、5'-CAAAUUCANNNCNCCUCUCCA-3'(SEQ ID NO:283)配列、5'-CAAAUUCANNNCNCCUCUCC-3'(SEQ ID NO:284)配列、5'-CAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:285)配列、5'-CAAAUUCANNNCNCCUCU-3'(SEQ ID NO:286)配列、5'-CAAAUUCANNNCNCCUC-3'(SEQ ID NO:287)配列、5'-CAAAUUCANNNCNCCU-3'(SEQ ID NO:288)配列、5'-CAAAUUCANNNCNCC-3'(SEQ ID NO:289)配列、5'-CAAAUUCANNNCNC-3'(SEQ ID NO:290)配列または5'-CAAAUUCANNNCN-3'(SEQ ID NO:272)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。一例として、前記SEQ ID NO:111またはこれの一部の配列内に存在する5'-NNNCN-3'配列は5'-UUUCU-3'配列、5'-GUUCU-3'配列、5'-UCUCU-3'配列、5'-UUGCU-3'配列、5'-UUUCC-3'配列、5'-GCUCU-3'配列、5'-GUUCC-3'配列、5'-UCGCU-3'配列、5'-UCUCC-3'配列、5'-UUGCC-3'配列、5'-GCGCU-3'配列、5'-GCUCC-3'配列、5'-GUGCC-3'配列、5'-UCGCC-3'配列、5'-GCGCC-3'配列または5'-GUGCU-3'配列であり得る。
【0013】
この時、前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列またはSEQ ID NO:211配列に少なくとも70%、80%、または90%以上の配列同一性または配列類似性を有する配列であり得る。
【0014】
この時、前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列またはSEQ ID NO:212配列に少なくとも70%、80%、または90%以上の配列同一性または配列類似性を有する配列であり得る。
【0015】
この時、前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列またはSEQ ID NO:213配列の一部の配列であり得る。前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:213配列上で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。前記SEQ ID NO:213配列の一部の配列は5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:214)配列、5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:215)配列、5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:216)配列、5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:217)配列、5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:231)配列、5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:232)配列、5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3'(SEQ ID NO:233)配列、5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:234)配列、5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3'(SEQ ID NO:235)配列、5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3'(SEQ ID NO:236)配列、5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3'(SEQ ID NO:237)配列、5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3'(SEQ ID NO:238)配列、5'-CCGCUUCACCUUAGGAGUGAAGGUG-3'(SEQ ID NO:239)配列、5'-CCGCUUCACUUAGAGUGAAGGUG-3'(SEQ ID NO:240)配列、5'-CCGCUUCACUUAGGUGAAGGUG-3'(SEQ ID NO:241)配列、5'-CCGCUUCAUUAGUGAAGGUG-3'(SEQ ID NO:242)配列、5'-CCGCUUCUUAGGAAGGUG-3'(SEQ ID NO:243)配列、5'-CCGCUUUUAGAAGGUG-3'(SEQ ID NO:244)配列、5'-CCGCUUUAGAGGUG-3'(SEQ ID NO:245)配列、5'-CCGCUUAGGGUG-3'(SEQ ID NO:246)配列、5'-CCGUUAGGUG-3'(SEQ ID NO:247)配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列または5'-UUAG-3'配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列内に含まれた5'-UUAG-3'配列は選択的に5'-GAAA-3'配列で置換され得る。
【0016】
この時、前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列またはSEQ ID NO:248配列の一部の配列であり得る。前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であり得る。前記SEQ ID NO:248配列の一部の配列は5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列、5'-AAGUGGAGAA-3'(SEQ ID NO:249)配列、5'-AAAGUGGAGAA-3'(SEQ ID NO:250)配列、5'-UAAAGUGGAGAA-3'(SEQ ID NO:251)配列、5'-AUAAAGUGGAGAA-3'(SEQ ID NO:252)配列、5'-GAUAAAGUGGAGAA-3'(SEQ ID NO:253)配列、5'-UGAUAAAGUGGAGAA-3'(SEQ ID NO:254)配列、5'-CUGAUAAAGUGGAGAA-3'(SEQ ID NO:255)配列、5'-ACUGAUAAAGUGGAGAA-3'(SEQ ID NO:256)配列、5'-CACUGAUAAAGUGGAGAA-3'(SEQ ID NO:257)配列、5'-UCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:258)配列または5'-UUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:259)配列であり得る。
【0017】
前記crRNAは野生型crRNAまたはエンジニアリングされたcrRNA(engineered crRNA)であり得る。
【0018】
この時、前記野生型crRNAは野生型反復配列(repeat sequence)およびガイド配列(ガイドsequence)を5'末端から3'末端方向に順に含むことができる。前記野生型反復配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列であり得る。
【0019】
この時、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を5'末端から3'末端方向に順に含むことができる。
【0020】
この時、前記第6配列は5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:373)配列またはSEQ ID NO:373配列の一部の配列であり得る。前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記SEQ ID NO:373配列の一部の配列は前記SEQ ID NO:373配列のうち5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。一具体例において、前記第6配列は5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:408)配列またはSEQ ID NO:408配列の一部の配列であり得る。前記SEQ ID NO:408配列の一部の配列は5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:413)配列、5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:414)配列、5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:415)配列、5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:416)配列、5'-AGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:417)配列、5'-GAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:418)配列、5'-AACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:419)配列、5'-ACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:420)配列、5'-CCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:421)配列、5'-CCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:422)配列、5'-CGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:423)配列、5'-GAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:424)配列、5'-AAUAGNGNNNUGAAGGA-3'(SEQ ID NO:425)配列、5'-AUAGNGNNNUGAAGGA-3'(SEQ ID NO:426)配列、5'-UAGNGNNNUGAAGGA-3'(SEQ ID NO:427)配列、5'-AGNGNNNUGAAGGA-3'(SEQ ID NO:428)配列または5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。一例として、前記SEQ ID NO:408配列またはこれの一部の配列内に存在する5'-NGNNN-3'配列は5'-AGGAA-3'配列、5'-AGCAA-3'配列、5'-AGAAA-3'配列、5'-AGCAU-3'配列、5'-AGCAG-3'配列、5'-AGCAC-3'配列、5'-AGCUA-3'配列、5'-AGCGA-3'配列、5'-AGCCA-3'配列、5'-UGCAA-3'配列、5'-UGCUA-3'配列、5'-UGCGA-3'配列、5'-UGCCA-3'配列、5'-GGCAA-3'配列、5'-GGCUA-3'配列、5'-GGCGA-3'配列、5'-GGCCA-3'配列、5'-CGCAA-3'配列、5'-CGCUA-3'配列、5'-CGCGA-3'配列または5'-CGCCA-3'配列であり得る。
【0021】
この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%、80%、または90%以上の配列同一性または配列類似性を有する配列であり得る。
【0022】
この時、前記ガイド配列は標的配列と混成化(hybridizing)できる配列または標的配列と相補的な結合を形成する配列で、15~30nt(nucleotide)配列であり得る。
【0023】
前記crRNAはU-rich tail配列を追加でさらに含むことができる。この時、前記U-rich tail配列は前記crRNAの3'末端に位置することができる。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。前記NはA、C、GまたはUであり得る。前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり得る。前記dは0~3の整数であり得る。前記eは0~10の整数であり得る。
【0024】
前記エンジニアリングされたガイドRNAは変形されたtracrRNAおよびcrRNAが独立的な二つの分子で存在するdualガイドRNA;または変形されたtracrRNAおよびcrRNAが連結されて一つの分子で存在するsingleガイドRNAであり得る。前記エンジニアリングされたガイドRNAがsingleガイドRNAであるとき、前記エンジニアリングされたガイドRNAはlinker配列を追加でさらに含むことができる。この時、前記linker配列は前記エンジニアリングされたtracrRNAと前記crRNAの間に位置することができる。
【0025】
一具体例において、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:269)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:304)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:590)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:301)配列を含むことができる。前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3'(SEQ ID NO:591)配列およびガイド配列を含むことができる。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。一例として、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:270)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:308)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:595)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:306)配列を含むことができる。前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO:539)配列およびガイド配列を含むことができる。
【0026】
他の一具体例において、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:592)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:305)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:593)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUC-3'(SEQ ID NO:300)配列を含むことができる。前記エンジニアリングされたcrRNAは5'-GAAUAGNGNNNUGAAGGAAUGCAAC-3'(SEQ ID NO:594)配列およびガイド配列を含むことができる。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。一例として、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3'(SEQ ID NO:596)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:309)配列、5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:597)配列または5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUC-3'(SEQ ID NO:307)配列を含むことができる。前記エンジニアリングされたcrRNAは5'-GAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO:598)配列およびガイド配列を含むことができる。
【0027】
本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムのためのベクターを提供する。前記ベクターはエンジニアリングされたガイドRNAを暗号化する核酸を含む。
【0028】
一具現例として、前記ベクターはエンジニアリングされたガイドRNAを暗号化する核酸を含むことができる。
【0029】
前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含むことができる。この時、前記エンジニアリングされたガイドRNAは前述したエンジニアリングされたガイドRNAの具現例と同一の構成を有することができる。
【0030】
前記ベクターは前記エンジニアリングされたガイドRNAを暗号化する核酸のためのプロモーターをさらに含むことができる。この時、前記プロモーターはU6プロモーター、H1プロモーターまたは7SKプロモーターであり得る。
【0031】
前記ベクターはプラスミド、PCRアンプリコンまたはウイルスベクターであり得る。この時、前記ウイルスベクターはレトロウイルスベクター(retroviral(retrovirus)vector)、レンチウイルスベクター(lentiviral(lentivirus)vector)、アデノウイルスベクター(adenoviral(adenovirus vector)、アデノ-関連ウイルスベクター(adeno-associated viral(adeno-associated virus;AAV)vector)、ワクシニアウイルスベクター(vaccinia viral(vaccinia virus)vector)、ポックスウイルスベクター(poxviral(poxvirus)vector)および単純ヘルペスウイルスベクター(herpes simplex viral(herpes simplex virus)vector)で構成された群から選択される少なくとも一つのウイルスベクターであり得る。
【0032】
本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を提供する。前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAまたはこれを暗号化する核酸;およびCas14a1タンパク質またはこれを暗号化する核酸を含む。
【0033】
一具現例として、前記組成物はエンジニアリングされたガイドRNAまたはこれを暗号化する核酸;およびCas14a1タンパク質またはこれを暗号化する核酸を含むことができる。
【0034】
前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含むことができる。この時、前記エンジニアリングされたガイドRNAは前述したエンジニアリングされたガイドRNAの具現例と同一の構成を有することができる。
【0035】
前記組成物はベクター形態であり得る。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸;およびCas14a1タンパク質を暗号化する核酸を含むことができる。この時、前記ベクターはプラスミド、mRNA(転写物)、PCRアンプリコンまたはウイルスベクターであり得る。この時、前記ウイルスベクターはレトロウイルスベクター(retroviral(retrovirus)vector)、レンチウイルスベクター(lentiviral(lentivirus)vector)、アデノウイルスベクター(adenoviral(adenovirus vector)、アデノ-関連ウイルスベクター(adeno-associated viral(adeno-associated virus;AAV)vector)、ワクシニアウイルスベクター(vaccinia viral(vaccinia virus)vector)、ポックスウイルスベクター(poxviral(poxvirus)vector)および単純ヘルペスウイルスベクター(herpes simplex viral(herpes simplex virus)vector)で構成された群から選択される一つ以上のウイルスベクターであり得る。
【0036】
この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸;およびCas14a1タンパク質を暗号化する核酸をすべて含む一つのベクターを含むことができる。前記ベクターは前記エンジニアリングされたガイドRNAを暗号化する核酸のためのプロモーターを追加でさらに含むことができ、前記プロモーターはU6プロモーター、H1プロモーターまたは7SKプロモーターであり得る。また、前記ベクターは前記Cas14a1タンパク質を暗号化する核酸のためのプロモーターを追加でさらに含むことができ、前記プロモーターはCMVプロモーター、LTRプロモーター、Ad MLPプロモーター、HSVプロモーター、SV40プロモーター、CBAプロモーターまたはRSVプロモーターであり得る。または前記組成物は前記エンジニアリングされたガイドRNAを暗号化する核酸を含む第1ベクターおよびCas14a1タンパク質を暗号化する核酸を含む第2ベクターを含むことができる。前記第1ベクターは前記エンジニアリングされたガイドRNAを暗号化する核酸のためのプロモーターを追加でさらに含むことができ、前記プロモーターはU6プロモーター、H1プロモーターまたは7SKプロモーターであり得る。また、前記第2ベクターは前記Cas14a1タンパク質を暗号化する核酸のためのプロモーターを追加でさらに含むことができ、前記プロモーターはCMVプロモーター、LTRプロモーター、Ad MLPプロモーター、HSVプロモーター、SV40プロモーター、CBAプロモーターまたはRSVプロモーターであり得る。
【0037】
または前記組成物は核酸およびタンパク質の混合形態であり得る。この時、前記組成物はエンジニアリングされたガイドRNAおよびCas14a1タンパク質を含むことができる。前記組成物はエンジニアリングされたCRISPR/Cas14a1複合体の形態であるribonucleoprotein(RNP)形態であり得る。
【0038】
また、本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した対象細胞に存在する標的核酸または標的遺伝子を変形させる方法を提供する。前記方法は標的核酸または標的遺伝子が存在する対象細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を処理することを含む。
【0039】
一具現例として、前記方法は標的核酸または標的遺伝子が存在する真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を処理することを含むことができる。
【0040】
前記真核細胞は酵母(yeast)、植物細胞、非ヒト-動物細胞またはヒト細胞であり得る。
【0041】
前記標的核酸または標的遺伝子は標的配列を有する標的鎖を含む二本鎖DNAまたは一本鎖DNAであり得る。
【0042】
前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物は前述した組成物の具現例と同一であり得る。
【0043】
前記方法はin vitro、ex vivoまたは非ヒト動物生体内で遂行され得る。
【0044】
前記方法は、選択的に前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を処理した真核細胞を培養することを追加でさらに含むことができる。
【0045】
前記方法を通じて、前記標的核酸または標的遺伝子は前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムによる変形を含むことができる。この時、前記変形は前記標的核酸または標的遺伝子に少なくとも一つ以上のヌクレオチドの削除、置換および/または挿入であり得る。
【発明の効果】
【0046】
本発明はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムに関する。本明細書によって開示される技術を通じて、エンジニアリングされたガイドRNAおよびこれを含んだエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを提供することができる。また、エンジニアリングされたガイドRNAおよびこれを含んだエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した効果的な標的核酸の切断、編集または変形方法を提供することができる。
【図面の簡単な説明】
【0047】
【
図1】野生型tracrRNA(SEQ ID NO:1)および野生型crRNA(SEQ ID NO:405)を示し、各領域を表示した。野生型tracrRNAはstem形成により領域1(region 1)、領域2(region 2)、領域3(region 3)、領域4(region 4)および領域5(region 5)に分けて表示した。野生型crRNAは反復配列(repeat sequence;repeat seq.)およびガイド配列(ガイドsequence;ガイドseq.,またはスペーサー配列(spacer sequence))に分けて表示した。この時、前記ガイド配列は標的により配列および配列の長さが変わり、それぞれのNは独立的にA、C、GまたはUであり得る。
【
図2】エンジニアリングされたtracrRNAの構造を簡潔に示す。それぞれの配列を野生型tracrRNA(SEQ ID NO:1)に比較マッチングして示した。前記エンジニアリングされたtracrRNAは第1配列(first sequence;1st seq.)、第2配列(second sequence;2nd seq.)、第3配列(third sequence;3rd seq.)を3'末端から5'末端方向に順に含む。また、前記エンジニアリングされたtracrRNAは選択的に5'末端に第4配列(fourth sequence;4th seq.)および/または第5配列(fifth sequence;5th seq.)をさらに含むことができる。
【
図3】エンジニアリングされたcrRNAの構造を簡潔に示す。それぞれの配列を野生型crRNA(SEQ ID NO:405)と比較して示した。前記エンジニアリングされたcrRNAはi)野生型反復配列の一部およびガイド配列;ii)野生型反復配列の一部、ガイド配列およびU-rich tail配列(U-rich tail sequence;U-rich tail seq.);iii)野生型反復配列、ガイド配列およびU-rich tail配列;iv)第6配列(sixth sequence;6th seq.)、第7配列(seventh sequence;7th seq.)およびガイド配列;またはv)第6配列、第7配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記第6配列および第7配列は野生型crRNAの反復配列と関連する。この時、前記ガイド配列は標的により配列および配列の長さが変わり、それぞれのNは独立的にA、C、GまたはUであり得る。
【
図4】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図5】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図6】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図7】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図8】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図9】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図10】gRNAエンジニアリングの多様な例示に対する一模式図である。この時、前記ガイド配列は標的により配列および配列の長さが変わり得る。それぞれのNは独立的にA、C、GまたはUであり得、それぞれのVはA、CまたはGであり得、それぞれのBはU、CまたはGであり得る。
【
図11】野生型tracrRNA内に存在する連続した5個のウリジン配列をそれぞれアデノシン、シチジンまたはグアノシンで置き換えてindel(%)を確認した結果である。
【
図12】
図11の結果に基づいて141番目のウリジンをシチジンで置き換えて固定し、残りの4個のウリジン配列をそれぞれシチジンまたはグアノシンで置き換えてindel(%)を確認した。(n=3、*、p<0.05)
【
図13】
図12の結果に基づいてtracrRNAの変形された配列に対応するcrRNAの5'-ACGAA-3'をそれぞれアデノシン、ウリジン、シチジンまたはグアノシンで置き換えてindel(%)を確認した結果である。
【
図14】
図13の結果に基づいてcrRNAの5'-ACGAA-3'のうちシチジンとグアノシンをそれぞれアデノシン、ウリジン、シチジンまたはグアノシンで置き換えてindel(%)を確認した結果である。(n=3、*、p<0.05)
【
図15】
図14の結果に基づいてcrRNAの5'-AGCAA-3'のうちアデノシンをそれぞれウリジン、シチジンまたはグアノシンで置き換えてindel(%)を確認した結果である。(n=3、n.s.,not significant)
【
図16】M1-1を含むエンジニアリングされたtracrRNAおよび/またはエンジニアリングされたcrRNAを利用した場合のindel(%)を確認した結果である。エンジニアリングされたcrRNA(M1-1)はエンジニアリングされたtracrRNA(M1-1)とともに使った時にindel(%)が増加することを確認した。(n=3、*、p<0.05、n.s.,not significant)
【
図17】M1-1およびM1-2を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、M1-2はMS1(すなわち、stem5を構成する領域)でそれぞれ13nt、25ntおよび37ntを削除した変形である。(n=3)
【
図18】M1-1およびM2を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、M2はMS2(すなわち、stem2を構成する領域)でそれぞれ6nt、13ntおよび21ntを削除した変形である。(n=3)
【
図19】M1-1およびM3を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、M3はMS3(すなわち、stem1を構成する領域)でそれぞれ7nt、14ntおよび20ntを削除した変形である。(n=3)
【
図20】M1-1およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。(n=3、n.s.,not significant)
【
図21】M1-1およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、M4は前記
図20の結果に基づいてU
4VU
6で設計し、前記VはA、CまたはGである。(n=3、n.s.,not significant)
【
図22】M1-1およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。
【
図23】M1-1および/またはM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。M1-1およびM4をすべて含むエンジニアリングされたgRNAを利用した時にindel(%)が増加することを確認した。(n=3、*、p<0.05;**、p<0.01;***、p<0.001.n.s.,not significant)
【
図24】M1-1、M3およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、前記エンジニアリングされたgRNAはM1-1およびM4を含んでおり、M3を付加してその効果を比較した。この時、M3はMS3(すなわち、stem1を構成する領域)でそれぞれ12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20ntおよび21ntを削除した変形である。(n=3)
【
図25】M1-1、M1-2、M3およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、前記エンジニアリングされたgRNAはM1-1、M3およびM4を含んでおり、M1-2を付加してその効果を比較した。この時、M1-2はMS1(すなわち、stem5を構成する領域)でそれぞれ10bp、12bpおよび18bpを削除した変形である。(n=3、n.s.,not significant)
【
図26】M1-1、M1-2、M3およびM4を含むエンジニアリングされたgRNAを利用してindel(%)を確認した結果である。この時、前記エンジニアリングされたgRNAはM1-1、M3およびM4を含んでおり、M1-2を付加してその効果を比較した。この時、M1-2はMS1(すなわち、stem5を構成する領域)でそれぞれ1nt、3nt、5nt、7nt、9nt、11nt、13nt、15nt、17nt、19nt、21nt、23nt、25nt、27nt、29nt、31nt、33nt、35ntおよび37ntを削除した変形である。(n=3)
【
図27】M1-1、M1-2、M3およびM4を含むエンジニアリングされたgRNAを追加変形してindel(%)を確認した結果である。この時、前記追加変形はエンジニアリングされたtracrRNAの3'末端とエンジニアリングされたcrRNAの5'末端をhammerhead ribozymeヌクレオチド配列を利用して連結したものである。前記hammerhead ribozymeヌクレオチド配列を含むエンジニアリングされたgRNAはhammerhead ribozymeによってエンジニアリングされたtracrRNAの3'末端に連結されたhammerhead ribozymeヌクレオチド配列がself-cleavageされ、これによってエンジニアリングされたgRNAはdual gRNAとして作用することができる。(n=3)
【
図28】M1-1、M1-2、M2、M3および/またはM4を含むエンジニアリングされたgRNAを追加変形してindel(%)を確認した結果である。(n=3)
【
図29】M1-1、M1-2、M3およびM4を含むエンジニアリングされたgRNAを利用したエンジニアリングされたCRISPR/Cas14a1システムであるgeCas14a1_3.0システムによるインデルパターンを確認した結果である。
【
図30】gRNAエンジニアリング(M1-M4)の効果の基礎となる分子メカニズムを調査するための実験設計模式図(A)およびこの結果(BおよびC)である。Aに対する具体的な説明は以下に記載した実験方法の「8.Quantitative analysis of gRNA expression」セクションを参照することができる。BおよびCでgRNAエンジニアリング(M1-M4)により完全な配列を有するgRNAの発現が急激に増加することを示す。
【
図31】gRNAエンジニアリング(M1-M4)の試験管内の二本鎖DNA(dsDNA)の分解分析結果である。特に、M3の有無による二本鎖DNA(dsDNA)の分解効果に差があることを示す。
【
図32】Cas9、Cas12aおよびCas12f1で編集できる5'-TTTR-N20-NGG-3'配列を有する内因性ターゲットをin silicoで検索して無作為で選定した88個の内因性遺伝子座のプロトスペーサー配列を整理した表である。
【
図33】Cas9、Cas12aおよびCas12f1で編集できる5'-TTTR-N20-NGG-3'配列を有する内因性ターゲットをin silicoで検索して無作為で選定した88個の内因性遺伝子座のプロトスペーサー配列を整理した表である。
【
図34】Cas9、Cas12aおよびCas12f1で編集できる5'-TTTR-N20-NGG-3'配列を有する内因性ターゲットをin silicoで検索して無作為で選定した88個の内因性遺伝子座のプロトスペーサー配列を整理した表である。
【
図35】CRISPR/SpCas9システム、CRISPR/AsCas12aシステム、canonical(カノニカル) CRISPR/Cas14a1システムまたはgeCas14a1_3.0システムを利用した
図32~34で選別した88個の内因性遺伝子座でのインデル(%)を確認した結果である。AはCRISPR/SpCas9システム、CRISPR/AsCas12aシステム、canonical CRISPR/Cas14a1システムおよびgeCas14a1_3.0システムが有するそれぞれのガイドRNAを模式化したものであり、この時、DRはガイドRNAでスペーサー配列を除いた残りの部分である。BはそれぞれのCRISPR/Casシステムを利用して88個の内因性遺伝子座でのインデル(%)を確認した結果である。
【
図36】前記
図35の結果を多様な方法で整理したものである。Aは各CRISPR/Casシステムによる88個の内因性遺伝子座でのインデル(%)に対するbox-and-whisker plotであり、青緑色の横線は各CRISPR/Casシステムの平均値を示す。Bは各CRISPR/Casシステムによるインデル(%)を細分化して特定インデル範囲当たりの標的数の分布を整理した表である。Cは各CRISPR/Casシステムによって得た標的当たりのインデル(%)に対するheat mapである。
【
図37】in vitro cleavage assay結果である。プロトスペーサー配列であるIntergenic22配列(5'-TTTAAGAACACATACCCCTGGGCC-3'(SEQ ID NO:490))を含むプラスミドを利用して実験したし、対照群のために前記プラスミドにApaI制限酵素サイト(5'-GGGCCC-3')も含む。図面上に表示された配列は5'-GGGCGAATTGGGCCCTCTAGATGCATGCTCGAGCGGCCGCCAGTGTGATGGATATCTGCAGAATTCGCCCTTTGCATTTAAGAACACATACCCCTGGGCC AGGATGCATGCATGCATGCATG-3'(SEQ ID NO:737)であり、ApaI制限酵素サイトおよびプロトスペーサーはアンダーラインで表示した。
【発明を実施するための形態】
【0048】
用語の定義
本明細書で使われる用語に対する定義は以下の通りである。
【0049】
核酸(Nucleic acid)、ヌクレオチド(Nucleotide)、ヌクレオシド(Nucleoside)および塩基(Base)
「核酸(nucleic acid)」はヌクレオチド単位体で構成された生体分子(または生体高分子)であり、ポリヌクレオチド(polynucleotide)とも呼ばれる。核酸はDNAとRNAをすべて含む。
「ヌクレオチド(nucleotide)」は燐酸、五炭糖および塩基(または核塩基)からなる単位体である。RNA(リボ核酸)は五炭糖がリボースであり、DNA(デオキシリボ核酸)は五炭糖がデオキシリボースである。ヌクレオチドは核塩基としてアデニン(adenine;A)、グアニン(guanine;G)、シトシン(cytosine;C)、チミン(Thymine;T)およびウラシル(uracil;U)のうち選択された一つを有する。この時、アデニン、グアニンおよびシトシンはRNAとDNAに共通的に存在し、チミンはDNAにのみ存在し、ウラシルはRNAにのみ存在する。また、ヌクレオチドは燐酸とヌクレオシドで構成されるとも言える。
この時、「ヌクレオシド(nucleoside)」は五炭糖と核塩基からなる。ヌクレオシドは核塩基の種類によってアデノシン、チミジン、シチジン、グアノシンおよびウリジンに分類される。各ヌクレオシドはU(ウリジン)、A(アデノシン)、T(チミジン)、C(シチジン)およびG(グアノシン)で略称される。また、ヌクレオチドはヌクレオシドの種類によってU(ウリジン一リン酸)、A(アデノシン一リン酸)、T(チミジン一リン酸)、C(シチジン一リン酸)およびG(グアノシン一リン酸)で略称される。また、前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0050】
本明細書で塩基、ヌクレオシド、ヌクレオチド、核酸、RNAおよびDNAは塩基の種類によってA、T、G、CおよびUで略称して記載する。前記略称は文脈により適切に解釈され得る。例えば、5'-UUUUU-3'配列は連続した5個の塩基(ウラシル)配列、連続した5個のヌクレオシド(ウリジン)配列および/または連続した5個のヌクレオチド(ウリジン一リン酸)配列であり得る。また、核酸、RNAおよびDNAの場合、核酸、RNAおよびDNAを構成するヌクレオチドはヌクレオシドの種類によってウリジン、アデノシン、チミジン、シチジンおよびグアノシンで略称して記載する。前記略称は文脈により適切に解釈され得る。例えば、連続した4個のウリジン配列を含むRNAは連続した4個のウリジン一リン酸ヌクレオチドを含むRNAと解釈され得る。
【0051】
RNA duplex
「RNA duplex」は二つのRNA断片(fragment)の間に相補的な結合(または塩基対間の結合)により形成された二本鎖RNA構造を意味する。この時、前記二つのRNA断片は互いに異なる鎖(strand)に存在するか、または一つの鎖(一本鎖)に存在することができる。前記二つのRNA断片が一本鎖に存在する場合、一本鎖内の一部の領域(すなわち、二つのRNA断片)は塩基対間の結合を形成してステム-ループ(stem-loop)またはヘアピン(hairpin)構造を形成する。前記RNA duplexは「RNA stem」または「stem」とも呼ばれ、以下でRNA stemまたはstemと混用されて使われる。前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0052】
標的核酸(Target nucleic acid)または標的遺伝子(Target gene)
「標的核酸(Target nucleic acid)」または「標的遺伝子(Target gene)」はCRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)による編集の対象となる核酸または遺伝子を意味する。前記標的核酸または標的遺伝子は細胞内に存在したり人為的に合成されたりした核酸または遺伝子であり得る。細胞内に存在する場合、前記標的核酸または標的遺伝子は細胞が有する固有な遺伝子または核酸(すなわち、endogenous gene or nucleic acid)、または外部由来の遺伝子または核酸(すなわち、exogenous gene or nucleic acid)すべてを意味し得、CRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)による編集の対象となり得るのであれば特に制限されない。前記標的核酸または標的遺伝子は一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNAおよび/またはDNA-RNA hybridであり得る。前記標的核酸または標的遺伝子は混用され得、互いに同一の対象を指称し得る。また、前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0053】
標的配列(Target sequence)、標的鎖(Target strand)および非標的鎖(Non-target strand)
【0054】
「標的配列(target sequence)」は標的核酸または標的遺伝子内に存在する配列であって、CRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)のガイドRNAによって認識される配列またはCRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)により変形される対象配列を意味する。具体的には、前記標的配列はガイドRNAに含まれたガイド配列に相補性を有する配列またはガイド配列と相補的に結合する配列を意味する。
【0055】
「標的鎖(target strand)」は標的配列を含む鎖を意味する。標的核酸または標的遺伝子が一本鎖である場合、該当鎖は標的鎖であり得る。または標的核酸または標的遺伝子が二本鎖である場合、前記二本鎖のうち一つは標的鎖であり得、前記標的鎖に相補的な鎖が存在することができる。この時、前記標的鎖に相補的な鎖は「非標的鎖(non-target strand)」と指称される。
【0056】
非標的鎖(non-target strand)はPAM(Protospacer Adjacent Motif)配列およびプロトスペーサー(protospacer)配列を含む。前記PAM配列はCRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)のCas12f1(またはCas14a1)タンパク質が認識する配列である。前記プロトスペーサー配列はPAM配列の5'末端または3'末端に位置する配列であって、前記プロトスペーサー配列は、標的配列に相補性を有する配列または標的配列と相補的な結合をする配列である。プロトスペーサー配列と標的配列間の相関関係は標的配列とガイド配列間の相関関係と類似している。このような特徴によって、一般的にガイド配列の設計時にプロトスペーサー配列を利用して設計することができる。すなわち、標的配列に相補的に結合するガイド配列を設計時、ガイド配列はプロトスペーサー配列と同一の塩基配列を有するヌクレオチド配列で設計することができる。この時、プロトスペーサー配列の塩基配列のうちTはUに代替してガイド配列を設計する。
【0057】
ベクター(Vector)
「ベクター(vector)」は別途に特定されない限り、遺伝物質を細胞内に運搬できるすべての物質を総称するものである。例えば、ベクターは対象となる遺伝物質、例えば、CRISPR/Casシステムのエフェクタータンパク質(Casタンパク質)を暗号化する核酸、および/またはガイドRNAを暗号化する核酸を含むDNA分子であり得るが、これに制限されるものではない。前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0058】
作動可能に連結された(Operably linked)
「作動可能に連結された(operably linked)」という用語は、特定の構成が他の構成と機能的関係で配置されて前記特定の構成が意図された方式通りに機能できるように他の構成に連結されていることを意味する。例えば、プロモーター配列がAタンパク質を暗号化する配列と作動可能に連結されたとする時、前記プロモーターが細胞内で前記Aタンパク質を暗号化する配列を転写および/または発現するようにAタンパク質を暗号化する配列に連結されたことを意味する。また、前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0059】
エンジニアリングされた(Engineered)
「エンジニアリングされた(engineered)」という用語は、自然界にすでに存在する構成を有する物質、分子などと区分するために使う用語で、前記物質、分子などに人為的な変形が加えられたことを意味する。例えば、「エンジニアリングされたガイドRNA(engineered guide RNA)」の場合、自然界に存在するガイドRNAの構成に人為的な変更が加えられたガイドRNAを意味する。また、前記用語は当業界の通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0060】
NLS(Nuclear localization sequence、or signal)およびNES(Nuclear Export Sequence、or Signal)
「NLS(Nuclear Localization Sequence、or Signal)」とは、核輸送(nuclear transport)作用で細胞核外部の物質を核内部に輸送する時、輸送対象であるタンパク質に付着されて一種の「タグ」役割をする一定の長さのペプチド、またはその配列を意味する。NES」とは、核輸送(nuclear transport)作用で細胞核内部の物質を核外部に輸送する時、輸送対象であるタンパク質に付着されて一種の「タグ」役割をする一定の長さのペプチド、またはその配列を意味する。本明細書で使われる「NLS「および「NES」という用語は通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0061】
タグ(Tag)
「タグ(tag)」とは、ペプチドまたはタンパク質の追跡および/または分離精製を容易にするために付加される機能的ドメインを総称するものである。具体的には、前記タグはヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグおよびチオレドキシン(Trx)タグなどのタグタンパク質;緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、青緑色蛍光タンパク質(CFP)、青色蛍光タンパク質(BFP)、HcRED、DsRedなどの蛍光タンパク質;およびグルタチオン-S-トランスフェラーゼ(GST)、ホースラディッシュ(horseradish)過酸化酵素(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼなどのレポータータンパク質(酵素)を含むが、これに制限されるものではない。本明細書で使われる「タグ」という用語は通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。
【0062】
別途に定義されない限り、本明細書で使われるすべての技術的および科学的用語は本発明が属する技術分野の当業者によって通常的に理解されるものと同一の意味を有する。本明細書に記載されたものと類似または同じ方法および物質が本発明の実行または試験で使われ得るが、適合な方法および物質が以下に記載される。本明細書で言及されたすべての刊行物、特許およびその他の参考文献は全体が参照として含まれる。追加で、物質、方法および実施例は単に例示的であり、制限されるものと意図されない。
【0063】
以下、本発明を説明する。
【0064】
CRISPR/Cas12f1システム(またはCRISPR/Cas14a1システム)、この限界および解決方案
【0065】
CRISPR/Cas12f1システムはClass 2、Type Vに分類されるCRISPR/Casシステムである。先行研究(Harrington et al.,Science 362、839-842(2018))ではじめて古細菌由来のCRISPR/CasシステムであるCRISPR/Cas14システムに対して明らかになった。後続研究(Tautvydas Karvelis et al.,Nucleic Acids Research 48、5016-5023(2020))で前記CRISPR/Cas14システムをCRISPR/Cas12fシステムに分類した。CRISPR/Cas12f1システムは前記Class 2、Type Vに分類されるCRISPR/Casシステムのうち一つのオルソログ(ortholog)のV-F1システムに属し、これはCas14aをエフェクタータンパク質として有するCRISPR/Cas14aシステムを含む。
【0066】
本明細書で開示するCRISPR/Cas12f1システムはCRISPR/Cas14a1システムに関する。本明細書に記載されたCRISPR/Cas12f1システムはCRISPR/Cas14a1システムを指称し、CRISPR/Cas12f1システムとCRISPR/Cas14a1システムは混用されて使われる。またCRISPR/Cas12f1システムはCRISPR/Cas12f1(Cas14a1)システムまたはCRISPR/Cas14a1システムとも指称される。
【0067】
前記CRISPR/Cas12f1システムは、CRISPR/Cas9システムに比べてエフェクタータンパク質の大きさが顕著に小さいという特徴がある。このような特徴は既存に研究された殆どのCasヌクレアーゼの大きさによるAAV(アデノ関連ウイルス)に搭載の難しさおよびこれによる遺伝子治療剤としての適用困難性を解決可能にする。しかし、このような長所にもかかわらず、先行研究(Harrington et al.,Science 362、839-842(2018)、Tautvydas Karvelis et al.,Nucleic Acids Research 48、5016-5023(2020))で明らかになったところでは、前記CRISPR/Cas12f1システム、特にCRISPR/Cas14a1システムは細胞内で二本鎖DNAに対する切断活性を示さないか、切断活性を示してもその効率が非常に低いため、これを積極的にゲノム編集に活用し難いという限界を有している。
【0068】
本明細書で開示するエンジニアリングされたガイドRNAおよびこれを利用するCRISPR/Cas14a1システムは、標的核酸または標的遺伝子の編集または変形効率を増加させてこのような問題を解決する。より具体的には、本発明者らは野生型tracrRNAが有する配列上の問題を解決するためにガイドRNAを人為的に操作した。野生型tracrRNAは5個の連続したウリジン配列を含んでいる(野生型tracrRNA(wildtype tracrRNA)は5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(配列番号1(SEQ ID NO:1))配列を有する。)。野生型tracrRNAを細胞内でベクターなどを利用して発現させようとする時、野生型tracrRNAの5個の連続したウリジン配列はこれに対応する5個の連続したチミジン配列でベクター内に含まれることになる。この場合、前記5個の連続したチミジン配列は特定条件で転写終結信号として作用することができる。このような終結信号への作用はtracrRNAの正常な発現を阻害し、また正常なガイドRNAの形成を阻害する。これによって、最終的にCRISPR/Cas14a1システムの標的核酸または標的遺伝子の編集または変形効率を減少させることができる。
【0069】
そこで、本発明者らは野生型tracrRNAの5個の連続したウリジン配列を人為的に変形したエンジニアリングされたtracrRNAを開発した。また、本発明者らはガイドRNAを構成するtracrRNAおよびcrRNAの長さを減らして最適化した。発現および長さを最適化させた本出願のエンジニアリングされたガイドRNAは、ガイドRNA合成費用の削減またはウイルスベクターに挿入時に追加空間(容量)確保などの長所を有するので、遺伝子治療剤の適用に効果的である。また、本出願の最適化されたガイドRNAを利用したCRISPR/Cas14a1システムは、標的核酸または標的遺伝子の編集または変形効率を増加させる。
【0070】
以下で、エンジニアリングされたガイドRNAおよびエンジニアリングされたCRISPR/Cas14a1システムについて詳しく説明する。
【0071】
<Engineered guide RNA>
本明細書によって開示される一態様は、CRISPR/Cas12f1(Cas14a1)システムのためのエンジニアリングされたガイドRNAに関する。前記エンジニアリングされたガイドRNAは、CRISPR/Cas12f1(Cas14a1)システムの標的核酸または標的遺伝子の切断、編集または変形をさらに効果的に遂行されるようにする。特に、前記エンジニアリングされたガイドRNAは次のような効果を有することができる:
【0072】
ガイドRNAの長さ最適化、およびこれに伴うウイルスベクターに挿入時の追加空間(容量)確保
ガイドRNA長さ最適化による合成費用の削減;
細胞内tracrRNAの正常な発現;
機能(作動)可能なガイドRNA発現増加;
ガイドRNAのstability増加;
ガイドRNA-Cas12f1 protein complexのstability増加;
効果的なガイドRNA-Cas12f1 protein complex形成誘導;
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の切断効率増加;および
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の編集または変形効率増加.
【0073】
より具体的には、前記エンジニアリングされたガイドRNAは連続した5個以上のウリジン配列を含まないように変形されたり、および/またはwildtype tracrRNAより長さが短いように変形および/またはU-rich tail配列を含むように変形されたりしたエンジニアリングされたガイドRNAであり、エンジニアリングされたtracrRNA(trans-activating crispr RNA)およびcrRNA(crispr RNA)を含む。この時、前記crRNAは野生型(wildtype)crRNAまたはエンジニアリングされたcrRNAである。すなわち、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびwildtype crRNAを含んだり、またはエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含んだりする。
【0074】
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まず、wildtype tracrRNAの5'末端および/または3'末端の一部のヌクレオチド配列を含まない。
【0075】
前記エンジニアリングされたcrRNAはエンジニアリングされた反復配列を含み、この時、エンジニアリングされた反復配列はwildtype反復配列より長さが短いように変形されたり一部のヌクレオチド配列が変形されたりした配列である。前記野生型crRNAおよびエンジニアリングされたcrRNAは選択的に3'末端にU-rich tail配列を追加でさらに含むことができる。
【0076】
また、前記エンジニアリングされたガイドRNAは選択的にlinkerをさらに含むことができる。
【0077】
以下で各構成を詳しく説明する。
【0078】
1.エンジニアリングされたtracrRNA(Engineered tracrRNA)
エンジニアリングされたtracrRNAは野生型(wildtype)tracrRNAの一部のヌクレオチド配列が人為的に変形されたりおよび/またはwildtype tracrRNAより長さが短いように変形されたりしたtracrRNAである。
【0079】
より具体的には、エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたtracrRNAである。またはエンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形され、またwildtype tracrRNAより長さが短いように変形されたtracrRNAである。この時、前記エンジニアリングされたtracrRNAは連続した4個以下のウリジン配列を含む。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない。
【0080】
前記エンジニアリングされたtracrRNAは次のグループのうち選択された一つである:
i)連続した5個以上のウリジン配列を含まないように変形されたtracrRNA;
ii)連続した5個以上のウリジン配列を含まないように変形、およびwildtype tracrRNAの5'末端の一部のヌクレオチド配列を含まないように変形されたtracrRNA;
iii)連続した5個以上のウリジン配列を含まないように変形、およびwildtype tracrRNAの3'末端の一部のヌクレオチド配列を含まないように変形されたtracrRNA;
iv)連続した5個以上のウリジン配列を含まないように変形、およびwildtype tracrRNAの中間の一部のヌクレオチド配列を含まないように変形されたtracrRNA;および
v)連続した5個以上のウリジン配列を含まないように変形され、また、wildtype tracrRNAの5'末端の一部のヌクレオチド配列を含まないように変形、wildtype tracrRNAの中間の一部のヌクレオチド配列を含まないように変形および/またはwildtype tracrRNAの3'末端の一部のヌクレオチド配列を含まないように変形されたtracrRNA。
【0081】
前記エンジニアリングされたtracrRNAはcrRNAと相互作用したりおよび/またはCas12f1(Cas14a1)と相互作用したりすることができる。
【0082】
前記エンジニアリングされたtracrRNAは少なくとも2個以上のRNA stemを形成することができる。この時、前記RNA stemはCas12f1(Cas14a1)タンパク質と相互作用することができる。
【0083】
前記エンジニアリングされたtracrRNAはwildtype tracrRNAの一領域が変形されたものである。この時、前記wildtype tracrRNAの一領域は
図1に図示しているwildtype tracrRNAの変形対象領域のうち一つ以上であり得る。本明細書で、前記wildtype tracrRNAの変形対象領域はRNA duplexを形成する領域を基準として分けて設定する(
図1)。
【0084】
前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列のうち少なくとも3個以上の配列を含む。この時、前記少なくとも3個以上の配列は第1配列、第2配列および第3配列である。この時、前記第1配列、第2配列および第3配列はエンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置する。または前記第3配列、第2配列および第1配列はエンジニアリングされたtracrRNAの5'末端から3'末端方向に順に位置する。
【0085】
前記第1配列、第2配列、第3配列、第4配列および第5配列は前記wildtype tracrRNAの変形対象領域を基準として分けたものであり、前記各配列はRNA duplex形成したりRNA duplex形成に参加したりする。したがって、前記エンジニアリングされたtracrRNAは少なくとも二以上のRNA duplexを含むことができる(
図2)。以下で、wildtype tracrRNAの変形対象領域および各配列について詳細に記述する。
【0086】
Wildtype tracrRNAの変形対象領域(Region to be modified in wildtype tracrRNA)
【0087】
本明細書の記載されたエンジニアリングされたtracrRNAはwildtype tracrRNAの一領域が変形されたものである。前記wildtype tracrRNAの一領域はwildtype tracrRNAの変形対象領域のうち一つ以上である。この時、前記wildtype tracrRNAの変形対象領域はwildtype tracrRNA内でRNA duplex形成したりまたはRNA duplex形成に参加したりする領域を基準として分けて設定する。前記wildtype tracrRNAは4個のRNA duplexesを形成し、1個のRNA duplex形成に参加する。すなわち、前記wildtype tracrRNAは総5個のRNA duplex形成に関与する。
【0088】
本明細書で前記wildtype tracrRNAの変形対象領域は総5個の領域に分ける。前記5個の領域は変形対象領域1(region 1 to be modified)、変形対象領域2(region 2 to be modified)、変形対象領域3(region 3 to be modified)、変形対象領域4(region 4 to be modified)および変形対象領域5(region 5 to be modified)である。
【0089】
この時、前記変形対象領域1は前記wildtype tracrRNAの5'末端で130番目のシチジン(C)から161番目のアデノシン(A)までの領域であり得る。この時、前記変形対象領域2は前記wildtype tracrRNAの5'末端で91番目のアデノシン(A)から129番目のアデノシン(A)までの領域であり得る。この時、前記変形対象領域3は前記wildtype tracrRNAの5'末端で72番目のグアノシン(G)から90番目のアデノシン(A)までの領域であり得る。この時、前記変形対象領域4は前記wildtype tracrRNAの5'末端で22番目のシチジン(C)から71番目のグアノシン(G)までの領域であり得る。この時、前記変形対象領域5は前記wildtype tracrRNAの5'末端で1番目のシチジン(C)から21番目のアデノシン(A)までの領域であり得る(
図1)。このようなwildtype tracrRNAの変形対象領域の設定はエンジニアリングされたtracrRNAが含む各配列(第1配列、第2配列、第3配列、第4配列および第5配列)を説明するためである。
【0090】
1-1)First sequence(one strand for Stem5)-必須配列
前記エンジニアリングされたtracrRNAは第1配列(first sequence)を含む。前記第1配列は前記wildtype tracrRNAの変形対象領域1に対応する(
図2)。前記第1配列は前記エンジニアリングされたtracrRNAに含まれる必須配列である。前記第1配列はcrRNAの一部の配列と相補的な結合をする配列である。この時、前記第1配列はcrRNAの一部の配列と相補的な結合を通じてRNA duplexを形成する。この時、前記第1配列とcrRNAによって形成されたRNA duplexは本明細書でステム5(stem5)と命名される。前記ステム5を形成する少なくとも一つ以上のヌクレオチドはCas12f1タンパク質のWEDドメインおよび/またはZFドメインと相互作用することができる。
【0091】
前記第1配列は連続した5個以上のウリジン配列を含まない。
【0092】
前記第1配列は連続した4個以下のウリジン配列を含む。この時、前記第1配列は連続した4個のウリジン配列を含むことができる。または前記第1配列は連続した3個のウリジン配列を含むことができる。または前記第1配列は連続した二つのウリジン配列を含むことができる。または前記第1配列は1個のウリジン配列を含むことができる。または前記第1配列はウリジン配列を含まなくてもよい。
【0093】
前記第1配列はcrRNAと相補的結合を形成する少なくとも一つ以上のヌクレオチドを含む。この時、前記第1配列はcrRNAと相補的結合を形成しない少なくとも一つ以上のヌクレオチドを含むことができる。この時、前記第1配列はcrRNAと少なくとも一つ以上の相補的結合を形成することができる。
【0094】
前記第1配列はcrRNAと少なくとも一つ以上の塩基対を形成(base pairing)するヌクレオチドを含む。この時、前記第1配列はcrRNAと少なくとも一つ以上の塩基対を形成しないヌクレオチドを含むことができる。この時、前記第1配列はcrRNAと少なくとも一つ以上の塩基対を形成することができる。
【0095】
前記第1配列は前記エンジニアリングされたtracrRNAの3'末端に位置する。
【0096】
前記第1配列は次の配列のうち選択された一つの配列であり得る:
5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;
5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;
5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;
5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;
5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;
5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;および
SEQ ID NO:2~7配列のうち選択された一つの一部の配列。
【0097】
この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。
【0098】
この時、前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。
【0099】
この時、前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。例えば、前記dが3である場合、(N)3は5'-NNN-3'配列を意味し、この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0100】
この時、前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。例えば、前記aが4である場合、(V)4は5'-VVVV-3'配列を意味し、この時、それぞれのVは独立的にA、CまたはGであり得る。
【0101】
この時、前記SEQ ID NO:2~7配列の5'末端に位置する5'-CAAAUUCA-3'配列および/または3'末端に位置する5'-CCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:8)配列は選択的に変形され得る。前記変形は5'-CAAAUUCA-3'配列および/または5'-CCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:8)配列のうち少なくとも一つ以上のヌクレオチドが削除または他のヌクレオチドで置換されるものであり得る。または前記変形は5'-CAAAUUCA-3'配列および/または5'-CCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:8)配列に一つ以上のヌクレオチドが挿入されるものであり得る。
【0102】
i)5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列
一具現例として、前記第1配列は5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列であり得る。
【0103】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0104】
前記aは0~4の整数であり得る。
【0105】
一具体例において、前記第1配列は5'-CAAAUUCACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:9)配列であり得る。
【0106】
他の一具体例において、前記第1配列は5'-CAAAUUCANCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:10)配列であり得る。この時、前記NはA、C、GまたはUであり得る。例えば、前記第1配列は5'-CAAAUUCAACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:11)配列、5'-CAAAUUCACCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:12)配列、5'-CAAAUUCAGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:13)配列または5'-CAAAUUCAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:14)配列であり得る。
【0107】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:15)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。例えば、前記第1配列は5'-CAAAUUCAAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:16)配列、5'-CAAAUUCACUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:17)配列、5'-CAAAUUCAGUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:18)配列または5'-CAAAUUCAUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:19)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0108】
他の一具体例において、前記第1配列は5'-CAAAUUCANNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:20)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。例えば、前記第1配列は5'-CAAAUUCAUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:21)配列、5'-CAAAUUCAGUGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:22)配列、5'-CAAAUUCAGUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:23)配列または5'-CAAAUUCAUAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:24)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0109】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:25)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。例えば、前記第1配列は5'-CAAAUUCAUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:26)配列、5'-CAAAUUCAGUGCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:27)配列、5'-CAAAUUCAGUUCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:28)配列、5'-CAAAUUCAGUGUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:29)配列、5'-CAAAUUCAUUGCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:30)配列または5'-CAAAUUCAUUUCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:31)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0110】
ii)5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列
一具現例として、前記第1配列は5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列であり得る。
【0111】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0112】
前記それぞれのVは独立的にA、CまたはGであり得る。
【0113】
前記aは0~4の整数であり得る。
【0114】
一具体例において、前記第1配列は5'-CAAAUUCAANNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:32)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCAANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:33)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCAANNNNVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:34)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCAANNNNVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:35)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCAANNNNVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:36)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCAANNNNVVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:37)配列であり得る。
【0115】
例えば、前記第1配列は5'-CAAAUUCAAUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:38)配列、5'-CAAAUUCAAUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:39)配列、5'-CAAAUUCAAUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:40)配列または5'-CAAAUUCAAUGCUACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:41)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0116】
他の一具体例において、前記第1配列は5'-CAAAUUCACNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:42)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCACNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:43)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCACNNNNVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:44)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCACNNNNVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:45)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCACNNNNVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:46)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCACNNNNVVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:47)配列であり得る。
【0117】
例えば、前記第1配列は5'-CAAAUUCACUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:48)配列、5'-CAAAUUCACUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:49)配列、5'-CAAAUUCACUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:50)配列または5'-CAAAUUCACUGCUCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:51)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0118】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCAGNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:52)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCAGNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:53)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCAGNNNNVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:54)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCAGNNNNVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:55)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCAGNNNNVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:56)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCAGNNNNVVVVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:57)配列であり得る。
【0119】
例えば、前記第1配列は5'-CAAAUUCAGUUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:58)配列、5'-CAAAUUCAGUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:59)配列、5'-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:60)配列または5'-CAAAUUCAGUGCUGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:61)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0120】
iii)5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列
一具現例として、前記第1配列は5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列であり得る。
【0121】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0122】
前記VはA、CまたはGであり得る。
【0123】
前記bは0~1の整数であり得る。
【0124】
一具体例において、前記第1配列は5'-CAAAUUCANANNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:62)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記bは0または1の整数であり得る。この時、前記bが0である場合、前記第1配列は5'-CAAAUUCANANNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:63)配列であり得る。または前記bが1である場合、前記第1配列は5'-CAAAUUCANANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:64)配列であり得る。
【0125】
例えば、前記第1配列は5'-CAAAUUCAUAUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:65)配列、5'-CAAAUUCAUAUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:66)配列または5'-CAAAUUCAUAGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:67)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0126】
他の一具体例において、前記第1配列は5'-CAAAUUCANCNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:68)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記bは0または1の整数であり得る。この時、前記bが0である場合、前記第1配列は5'-CAAAUUCANCNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:69)配列であり得る。または前記bが1である場合、前記第1配列は5'-CAAAUUCANCNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:70)配列であり得る。
【0127】
例えば、前記第1配列は5'-CAAAUUCAGCUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:71)配列、5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:72)配列、5'-CAAAUUCAUCUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:73)配列または5'-CAAAUUCAUCGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:74)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0128】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANGNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:75)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記bは0または1の整数であり得る。この時、前記bが0である場合、前記第1配列は5'-CAAAUUCANGNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:76)配列であり得る。または前記bが1である場合、前記第1配列は5'-CAAAUUCANGNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:77)配列であり得る。
【0129】
例えば、前記第1配列は5'-CAAAUUCAUGUUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:78)配列、5'-CAAAUUCAUGUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:79)配列または5'-CAAAUUCAUGGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:80)配列であり得る。前記例示は単純例示であり、これに制限されない。前記例示は単純例示であり、これに制限されない。
【0130】
iv)5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列
一具現例として、前記第1配列は5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列であり得る。
【0131】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0132】
前記VはA、CまたはGであり得る。
【0133】
前記cは0~2の整数であり得る。
【0134】
一具体例において、前記第1配列は5'-CAAAUUCANNANN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:81)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記cは0~2の整数であり得る。この時、前記cが0である場合、前記第1配列は5'-CAAAUUCANNANNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:82)配列であり得る。または前記cが1である場合、前記第1配列は5'-CAAAUUCANNANNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:83)配列であり得る。または前記cが2である場合、前記第1配列は5'-CAAAUUCANNANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:84)配列であり得る。
【0135】
例えば、前記第1配列は5'-CAAAUUCAUUAUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:85)配列、5'-CAAAUUCAUUACUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:86)配列または5'-CAAAUUCAUCACUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:87)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0136】
他の一具体例において、前記第1配列は5'-CAAAUUCANNCNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:88)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記cは0~2の整数であり得る。この時、前記cが0である場合、前記第1配列は5'-CAAAUUCANNCNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:89)配列であり得る。または前記cが1である場合、前記第1配列は5'-CAAAUUCANNCNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:90)配列であり得る。または前記cが2である場合、前記第1配列は5'-CAAAUUCANNCNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:91)配列であり得る。
【0137】
例えば、前記第1配列は5'-CAAAUUCAUUCUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:92)配列、5'-CAAAUUCAUUCCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:93)配列または5'-CAAAUUCAGUCUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:94)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0138】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANNGNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:95)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記cは0~2の整数であり得る。この時、前記cが0である場合、前記第1配列は5'-CAAAUUCANNGNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:96)配列であり得る。または前記cが1である場合、前記第1配列は5'-CAAAUUCANNGNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:97)配列であり得る。または前記cが2である場合、前記第1配列は5'-CAAAUUCANNGNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:98)配列であり得る。
【0139】
例えば、前記第1配列は5'-CAAAUUCAUUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:99)配列、5'-CAAAUUCAUCGCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:100)配列または5'-CAAAUUCAGCGCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:101)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0140】
v)5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列
一具現例として、前記第1配列は5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列であり得る。
【0141】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0142】
前記VはA、CまたはGであり得る。
【0143】
前記dは0~3の整数であり得る。
【0144】
一具体例において、前記第1配列は5'-CAAAUUCANNNAN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:102)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記dは0~3の整数であり得る。この時、前記dが0である場合、第1配列は5'-CAAAUUCANNNANCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:103)配列であり得る。または前記dが1である場合、第1配列は5'-CAAAUUCANNNANNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:104)配列であり得る。または前記dが2である場合、第1配列は5'-CAAAUUCANNNANNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:105)配列であり得る。または前記dが3である場合、第1配列は5'-CAAAUUCANNNANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:106)配列であり得る。
【0145】
例えば、前記第1配列は5'-CAAAUUCAUUUAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:107)配列、5'-CAAAUUCAGUUAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:108)配列または5'-CAAAUUCAUUGAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:109)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0146】
他の一具体例において、前記第1配列は5'-CAAAUUCANNNCN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:110)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記dは0~3の整数であり得る。この時、前記dが0である場合、第1配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:111)配列であり得る。または前記dが1である場合、第1配列は5'-CAAAUUCANNNCNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:112)配列であり得る。または前記dが2である場合、第1配列は5'-CAAAUUCANNNCNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:113)配列であり得る。または前記dが3である場合、第1配列は5'-CAAAUUCANNNCNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:114)配列であり得る。
【0147】
例えば、前記第1配列は5'-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:115)配列、5'-CAAAUUCAGUGCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:116)配列、5'-CAAAUUCAGCGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:117)配列、5'-CAAAUUCAUUGCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:118)配列または5'-CAAAUUCAGCUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:119)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0148】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANNNGN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:120)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記dは0~3の整数であり得る。この時、前記dが0である場合、第1配列は5'-CAAAUUCANNNGNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:121)配列であり得る。または前記dが1である場合、第1配列は5'-CAAAUUCANNNGNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:122)配列であり得る。または前記dが2である場合、第1配列は5'-CAAAUUCANNNGNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:123)配列であり得る。または前記dが3である場合、第1配列は5'-CAAAUUCANNNGNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:124)配列であり得る。
【0149】
例えば、前記第1配列は5'-CAAAUUCAUUUGUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:125)配列、5'-CAAAUUCAUUGGUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:126)配列または5'-CAAAUUCAGUCGUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:127)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0150】
vi)5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列
一具現例として、前記第1配列は5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列であり得る。
【0151】
前記Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0152】
前記VはA、CまたはGであり得る。
【0153】
前記aは0~4の整数であり得る。
【0154】
一具体例において、前記第1配列は5'-CAAAUUCANNNNA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:128)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCANNNNACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:129)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCANNNNANCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:130)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCANNNNANNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:131)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCANNNNANNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:132)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCANNNNANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:133)配列であり得る。
【0155】
例えば、前記第1配列は5'-CAAAUUCAUUUUACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:134)配列、5'-CAAAUUCAUUUCACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:135)配列または5'-CAAAUUCAUUGCACCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:136)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0156】
他の一具体例において、前記第1配列は5'-CAAAUUCANNNNC(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:137)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCANNNNCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:138)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCANNNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:139)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCANNNNCNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:140)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCANNNNCNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:141)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCANNNNCNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:142)配列であり得る。
【0157】
例えば、前記第1配列は5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:143)配列、5'-CAAAUUCAGUUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:144)配列または5'-CAAAUUCAUUUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:145)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0158】
さらに他の一具体例において、前記第1配列は5'-CAAAUUCANNNNG(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:146)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。この時、前記aが0である場合、前記第1配列は5'-CAAAUUCANNNNGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:147)配列であり得る。または前記aが1である場合、前記第1配列は5'-CAAAUUCANNNNGNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:148)配列であり得る。または前記aが2である場合、前記第1配列は5'-CAAAUUCANNNNGNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:149)配列であり得る。または前記aが3である場合、前記第1配列は5'-CAAAUUCANNNNGNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:150)配列であり得る。または前記aが4である場合、前記第1配列は5'-CAAAUUCANNNNGNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:151)配列であり得る。
【0159】
例えば、前記第1配列は5'-CAAAUUCAUUUCGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:152)配列、5'-CAAAUUCAGUGCGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:153)配列または5'-CAAAUUCAGUUCGCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:154)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0160】
vii)SEQ ID NO:2~7配列のうち選択された一つの配列のうち一部の配列
一具現例として、前記第1配列は5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列の一部の配列であり、SEQ ID NO:2配列のうち5'-CAAAUUCA(N)a-3'配列を含み、かつSEQ ID NO:2配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。
【0161】
一具体例として、前記第1配列は5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:25)配列の一部の配列であり、5'-CAAAUUCANNNN-3'(SEQ ID NO:155)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCANNNNCCUCUCCAAUUCUGCAC-3'(SEQ ID NO:156)配列、5'-CAAAUUCANNNNCCUCUCCAAUUCUGC-3'(SEQ ID NO:157)配列、5'-CAAAUUCANNNNCCUCUCCAAUUCU-3'(SEQ ID NO:158)配列、5'-CAAAUUCANNNNCCUCUCCAAUU-3'(SEQ ID NO:159)配列、5'-CAAAUUCANNNNCCUCUCCAA-3'(SEQ ID NO:160)配列、5'-CAAAUUCANNNNCCUCUCC-3'(SEQ ID NO:161)配列、5'-CAAAUUCANNNNCCUCU-3'(SEQ ID NO:162)配列、5'-CAAAUUCANNNNCCU-3'(SEQ ID NO:163)配列、5'-CAAAUUCANNNNC-3'(SEQ ID NO:164)配列または5'-CAAAUUCANNNN-3'(SEQ ID NO:155)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0162】
他の一具現例として、前記第1配列は5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列の一部の配列であり、SEQ ID NO:3配列のうち5'-CAAAUUCAVNNNN-3'(SEQ ID NO:165)配列を含み、かつSEQ ID NO:3配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記aは0~4の整数であり得る。
【0163】
一具体例として、前記第1配列は5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:166)配列の一部の配列であり、5'-CAAAUUCAVNNNN-3'(SEQ ID NO:165)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:167)配列、5'-CAAAUUCAVNNNNCCUCUCCAAUUCUG-3'(SEQ ID NO:168)配列、5'-CAAAUUCAVNNNNCCUCUCCAAUUCU-3'(SEQ ID NO:169)配列、5'-CAAAUUCAVNNNNCCUCUCCAAUU-3'(SEQ ID NO:170)配列、5'-CAAAUUCAVNNNNCCUCUCCAA-3'(SEQ ID NO:171)配列、5'-CAAAUUCAVNNNNCCUCUCC-3'(SEQ ID NO:172)配列、5'-CAAAUUCAVNNNNCCUCU-3'(SEQ ID NO:173)配列、5'-CAAAUUCAVNNNNCCU-3'(SEQ ID NO:174)配列または5'-CAAAUUCAVNNNN-3'(SEQ ID NO:165)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0164】
さらに他の一具現例として、前記第1配列は5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列の一部の配列であり、SEQ ID NO:4配列のうち5'-CAAAUUCANVNNN-3'(SEQ ID NO:175)配列を含み、かつSEQ ID NO:4配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記bは0~1の整数であり得る。
【0165】
一具体例として、前記第1配列は5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:176)配列の一部の配列であり、5'-CAAAUUCANVNNN-3'(SEQ ID NO:175)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:177)配列、5'-CAAAUUCANVNNNCCUCUCCAAUUCU-3'(SEQ ID NO:178)配列、5'-CAAAUUCANVNNNCCUCUCCAAUU-3'(SEQ ID NO:179)配列、5'-CAAAUUCANVNNNCCUCUCCAA-3'(SEQ ID NO:180)配列、5'-CAAAUUCANVNNNCCUCUCC-3'(SEQ ID NO:181)配列、5'-CAAAUUCANVNNNCCUCU-3'(SEQ ID NO:182)配列、5'-CAAAUUCANVNNNCC-3'(SEQ ID NO:183)配列または5'-CAAAUUCANVNNN-3'(SEQ ID NO:175)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0166】
他の一具現例として、前記第1配列は5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列の一部の配列であり、SEQ ID NO:5配列のうち5'-CAAAUUCANNVNN-3'(SEQ ID NO:184)配列を含み、かつSEQ ID NO:5配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記cは0~2の整数であり得る。
【0167】
一具体例として、前記第1配列は5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:185)配列の一部の配列であり、5'-CAAAUUCANNVNN-3'(SEQ ID NO:184)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:186)配列、5'-CAAAUUCANNVNNCCUCUCCAAUUCU-3'(SEQ ID NO:187)配列、5'-CAAAUUCANNVNNCCUCUCCAAUU-3'(SEQ ID NO:188)配列、5'-CAAAUUCANNVNNCCUCUCCAA-3'(SEQ ID NO:189)配列、5'-CAAAUUCANNVNNCCUCUCC-3'(SEQ ID NO:190)配列、5'-CAAAUUCANNVNNCCUCU-3'(SEQ ID NO:191)配列、5'-CAAAUUCANNVNNCC-3'(SEQ ID NO:192)配列または5'-CAAAUUCANNVNN-3'(SEQ ID NO:184)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0168】
さらに他の一具現例として、前記第1配列は5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列の一部の配列であり、SEQ ID NO:6配列のうち5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつSEQ ID NO:6配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記dは0~3の整数であり得る。
【0169】
一具体例として、前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:194)配列の一部の配列であり、5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:195)配列、5'-CAAAUUCANNNVNCCUCUCCAAUUCU-3'(SEQ ID NO:196)配列、5'-CAAAUUCANNNVNCCUCUCCAAUU-3'(SEQ ID NO:197)配列、5'-CAAAUUCANNNVNCCUCUCCAA-3'(SEQ ID NO:198)配列、5'-CAAAUUCANNNVNCCUCUCC-3'(SEQ ID NO:199)配列、5'-CAAAUUCANNNVNCCUCU-3'(SEQ ID NO:200)配列、5'-CAAAUUCANNNVNCC-3'(SEQ ID NO:201)配列または5'-CAAAUUCANNNVN-3'(SEQ ID NO:193)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0170】
他の一具現例として、前記第1配列は5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列の一部の配列であり、SEQ ID NO:7配列のうち5'-CAAAUUCANNNNV-3'(SEQ ID NO:202)配列を含み、かつSEQ ID NO:7配列の3'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記VはA、CまたはGであり得る。前記aは0~4の整数であり得る。
【0171】
一具体例として、前記第1配列は5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:203)配列の一部の配列であり、5'-CAAAUUCANNNNV-3'(SEQ ID NO:202)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。例えば、前記第1配列は5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCA-3'(SEQ ID NO:204)配列、5'-CAAAUUCANNNNVCCUCUCCAAUUCU-3'(SEQ ID NO:205)配列、5'-CAAAUUCANNNNVCCUCUCCAAUU-3'(SEQ ID NO:206)配列、5'-CAAAUUCANNNNVCCUCUCCAA-3'(SEQ ID NO:207)配列、5'-CAAAUUCANNNNVCCUCUCC-3'(SEQ ID NO:208)配列、5'-CAAAUUCANNNNVCCUCU-3'(SEQ ID NO:209)配列、5'-CAAAUUCANNNNVCC-3'(SEQ ID NO:210)配列または5'-CAAAUUCANNNNV-3'(SEQ ID NO:202)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0172】
1-2)Second sequence(Stem4)-必須配列
前記エンジニアリングされたtracrRNAは第2配列(second sequence)を含む。前記第2配列は前記wildtype tracrRNAの変形対象領域2に対応する(
図2)。前記第2配列は前記エンジニアリングされたtracrRNAに含まれる必須配列である。前記第2配列は該当配列内で相補的な結合を通じてRNA duplexを形成する。この時、前記第2配列内で形成されたRNA duplexは本明細書でステム4(stem4)と命名される。前記ステム4を形成する少なくとも一つ以上のヌクレオチドはCas12f1タンパク質のRECドメインおよび/またはRuvCドメインと相互作用することができる。
【0173】
前記第2配列は連続した5個以上のウリジン配列を含まない。
【0174】
前記第2配列は前記第1配列の5'末端に位置する。
【0175】
前記第2配列は前記第1配列の5'末端と共有結合で連結される。
【0176】
一具現例として、前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列であり得る。
【0177】
他の一具現例として、前記第2配列はSEQ ID NO:211配列と少なくとも70%以上同一(identical)または類似する(similar)配列であり得る。または前記第2配列はSEQ ID NO:211配列に少なくとも70%以上の配列同一性(sequence identity)または配列類似性(sequence similarity)を有する配列であり得る。
【0178】
さらに他の一具現例として、前記第2配列はSEQ ID NO:211配列と少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%同一(identical)または類似する(similar)配列であり得る。または前記第2配列はSEQ ID NO:211配列に少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%の配列同一性または配列類似性を有する配列であり得る。または前記第2配列はSEQ ID NO:211配列と少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%同一または類似する配列であり得る。または前記第2配列はSEQ ID NO:211配列に少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%の配列同一性または配列類似性を有する配列であり得る。または前記第2配列はSEQ ID NO:211配列と少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%同一または類似する配列であり得る。または前記第2配列はSEQ ID NO:211配列に少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%の配列同一性または配列類似性を有する配列であり得る。
【0179】
さらに他の一具現例として、前記第2配列はSEQ ID NO:211配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%同一または類似する配列であり得る。または前記第2配列はSEQ ID NO:211配列に少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0180】
1-3)Third sequence(Stem3)-必須配列
前記エンジニアリングされたtracrRNAは第3配列(third sequence)を含む。前記第3配列は前記wildtype tracrRNAの変形対象領域3に対応する(
図2)。前記第3配列は前記エンジニアリングされたtracrRNAに含まれる必須配列である。前記第3配列はcrRNAの一部の配列と相補的な結合をする配列である。この時、前記第3配列はcrRNAの一部の配列と相補的な結合を通じてRNA duplexを形成する。また、前記第3配列は該当配列内で相補的な結合を通じてRNA duplexを形成する。この時、前記crRNAの一部の配列と相補的な結合および前記第3配列内の相補的な結合によって形成されたRNA duplexは本明細書でステム3(stem3)と命名される。前記ステム3を形成する少なくとも一つ以上のヌクレオチドはCas12f1タンパク質のWEDドメインおよび/またはRuvCドメインと相互作用することができる。
【0181】
前記第3配列はcrRNAと相補的結合を形成する少なくとも一つ以上のヌクレオチドを含む。この時、前記第3配列はcrRNAと相補的結合を形成しない少なくとも一つ以上のヌクレオチドを含むことができる。この時、前記第3配列はcrRNAと少なくとも一つ以上の相補的結合を形成することができる。
【0182】
前記第3配列はcrRNAと少なくとも一つ以上の塩基対を形成するヌクレオチドを含む。この時、前記第3配列はcrRNAと少なくとも一つ以上の塩基対を形成しないヌクレオチドを含むことができる。この時、前記第3配列はcrRNAと少なくとも一つ以上の塩基対を形成することができる。
【0183】
前記第3配列は連続した5個以上のウリジン配列を含まない。
【0184】
前記第3配列は前記第2配列の5'末端に位置する。
【0185】
前記第3配列は前記第2配列の5'末端と共有結合で連結される。
【0186】
一具現例として、前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列であり得る。
【0187】
他の一具現例として、前記第3配列はSEQ ID NO:212配列と少なくとも70%以上同一または類似する配列であり得る。または前記第3配列はSEQ ID NO:212配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり得る。
【0188】
さらに他の一具現例として、前記第3配列はSEQ ID NO:212配列と少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%同一または類似する配列であり得る。または前記第3配列はSEQ ID NO:212配列に少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%の配列同一性または配列類似性を有する配列であり得る。または前記第3配列はSEQ ID NO:212配列と少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%同一または類似する配列であり得る。または前記第3配列はSEQ ID NO:212配列に少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%の配列同一性または配列類似性を有する配列であり得る。または前記第3配列はSEQ ID NO:212配列と少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%同一または類似する配列であり得る。または前記第3配列はSEQ ID NO:212配列に少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%の配列同一性または配列類似性を有する配列であり得る。
【0189】
さらに他の一具現例として、前記第3配列はSEQ ID NO:212配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%同一または類似する配列であり得る。または前記第3配列はSEQ ID NO:212配列に少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0190】
1-4)Fourth sequence(Stem2)
前記エンジニアリングされたtracrRNAは第4配列(fourth sequence)を含むことができる。前記第4配列は前記wildtype tracrRNAの変形対象領域4に対応する(
図2)。前記第4配列は多様に変形が可能なヌクレオチド配列であり、1~50個のヌクレオチド配列(1~50nt配列)である。前記第4配列はエンジニアリングされたtracrRNAの必須配列である第3配列の5'末端に位置する。前記第4配列は該当配列内で相補的な結合を通じてRNA duplexを形成する。この時、前記第4配列内で形成されたRNA duplexは本明細書でステム2(stem2)と命名される。前記ステム2を形成する少なくとも一つ以上のヌクレオチドはCas12f1タンパク質のRuvCドメインと相互作用することができる。
【0191】
前記第4配列は連続した5個以上のウリジン配列を含まない。
【0192】
前記第4配列は前記第3配列の5'末端と共有結合で連結される。
【0193】
一具現例として、前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列であり得る。この時、前記第4配列は該当配列内で相補的な結合を通じてRNA duplexを形成することができ、形成されたRNA duplexは野生型ステム2(wildtype stem2)と命名する。
【0194】
他の一具現例として、前記第4配列はSEQ ID NO:213配列の一部の配列であり、前記SEQ ID NO:213配列によって形成された野生型ステム2の長さが短くなるように変形された配列であり得る。この時、前記第4配列は前記野生型ステム2より長さが短い変形されたステム2(modified stem2)を含むかRNA duplexを形成しないことができる。一具体例として、前記第4配列はSEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドが削除された配列であり得る。例えば、前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:214)配列、5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:215)配列、5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:216)配列、5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:217)配列、5'-CCGCUUCACCAAAAGCGUUAGUUGAACUUGAGUGAAGGUG-3'(SEQ ID NO:218)配列、5'-CCGCUUCACCAAAAGGUUAGUUAACUUGAGUGAAGGUG-3'(SEQ ID NO:219)配列、5'-CCGCUUCACCAAAGGUUAGUUAACUGAGUGAAGGUG-3'(SEQ ID NO:220)配列、5'-CCGCUUCACCAAGGUUAGUUAACGAGUGAAGGUG-3'(SEQ ID NO:221)配列、5'-CCGCUUCACAAGGUUAGUUAACAGUGAAGGUG-3'(SEQ ID NO:222)配列、5'-CCGCUUCAAAGGUUAGUUAACAUGAAGGUG-3'(SEQ ID NO:223)配列、5'-CCGCUUCAAGGUUAGUUAACAGAAGGUG-3'(SEQ ID NO:224)配列、5'-CCGCUUAAGGUUAGUUAACAAAGGUG-3'(SEQ ID NO:225)配列、5'-CCGCUAAGGUUAGUUAACAAGGUG-3'(SEQ ID NO:226)配列、5'-CCGCAAGGUUAGUUAACAGGUG-3'(SEQ ID NO:227)配列、5'-CCGAAGGUUAGUUAACAGUG-3'(SEQ ID NO:228)配列、5'-CGAAGGUUAGUUAACAUG-3'(SEQ ID NO:229)配列または5'-GAAGGUUAGUUAACAU-3'(SEQ ID NO:230)配列であり得、この時、前記SEQ ID NO:214~230配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。他の一具体例として、前記第4配列はSEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。例えば、前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:214)配列、5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:215)配列、5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:216)配列、5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:217)配列、5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:231)配列、5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:232)配列、5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3'(SEQ ID NO:233)配列、5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:234)配列、5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3'(SEQ ID NO:235)配列、5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3'(SEQ ID NO:236)配列、5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3'(SEQ ID NO:237)配列、5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3'(SEQ ID NO:238)配列、5'-CCGCUUCACCUUAGGAGUGAAGGUG-3'(SEQ ID NO:239)配列、5'-CCGCUUCACUUAGAGUGAAGGUG-3'(SEQ ID NO:240)配列、5'-CCGCUUCACUUAGGUGAAGGUG-3'(SEQ ID NO:241)配列、5'-CCGCUUCAUUAGUGAAGGUG-3'(SEQ ID NO:242)配列、5'-CCGCUUCUUAGGAAGGUG-3'(SEQ ID NO:243)配列、5'-CCGCUUUUAGAAGGUG-3'(SEQ ID NO:244)配列、5'-CCGCUUUAGAGGUG-3'(SEQ ID NO:245)配列、5'-CCGCUUAGGGUG-3'(SEQ ID NO:246)配列、5'-CCGUUAGGUG-3'(SEQ ID NO:247)配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列または5'-UUAG-3'配列であり得、この時、前記配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。さらに他の一具体例として、前記第4配列はSEQ ID NO:213配列で任意に選定された一つ以上のヌクレオチド配列が削除された配列であり得る。この時、前記任意に選定された一つ以上のヌクレオチド配列はSEQ ID NO:213配列内で順序または方向にかかわらず、無作為的に選定された配列であり得、この時、前記任意に選定された一つ以上のヌクレオチド配列が二以上のヌクレオチド配列である場合、連続的な二以上のヌクレオチド配列または非連続的な二以上のヌクレオチド配列であり得る。
【0195】
さらに他の一具現例として、前記第4配列は任意のヌクレオチド配列または任意に配列されたヌクレオチド配列であり得る。この時、前記任意のヌクレオチド配列または任意に配列されたヌクレオチド配列は1~50nt配列であり得る。
【0196】
さらに他の一具現例として、前記第4配列はSEQ ID NO:214~230のうち選択された配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0197】
1-5)Fifth sequence(Stem1)
前記エンジニアリングされたtracrRNAは第5配列(fifth sequence)を含むことができる。前記第5配列は前記wildtype tracrRNAの変形対象領域5に対応する(
図2)。前記第5配列は多様に変形が可能なヌクレオチド配列であり、1~21個のヌクレオチド配列(1~21nt配列)である。前記第5配列は該当配列内で相補的な結合を通じてRNA duplexを形成する。この時、前記第5配列内で形成されたRNA duplexは本明細書でステム1(stem1)と命名される。
【0198】
前記第5配列は連続した5個以上のウリジン配列を含まない。
【0199】
前記第5配列は前記第4配列の5'末端に位置する。
【0200】
前記第5配列は前記第4配列の5'末端と共有結合で連結される。
【0201】
一具現例として、前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列であり得る。
【0202】
他の一具現例として、前記第5配列はSEQ ID NO:248配列の一部の配列であり、SEQ ID NO:248配列の3'末端部で順次的な一部の配列であり得る。一具体例として、前記第5配列は5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列、5'-AAGUGGAGAA-3'(SEQ ID NO:249)配列、5'-AAAGUGGAGAA-3'(SEQ ID NO:250)配列、5'-UAAAGUGGAGAA-3'(SEQ ID NO:251)配列、5'-AUAAAGUGGAGAA-3'(SEQ ID NO:252)配列、5'-GAUAAAGUGGAGAA-3'(SEQ ID NO:253)配列、5'-UGAUAAAGUGGAGAA-3'(SEQ ID NO:254)配列、5'-CUGAUAAAGUGGAGAA-3'(SEQ ID NO:255)配列、5'-ACUGAUAAAGUGGAGAA-3'(SEQ ID NO:256)配列、5'-CACUGAUAAAGUGGAGAA-3'(SEQ ID NO:257)配列、5'-UCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:258)配列または5'-UUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:259)配列であり得る。
【0203】
さらに他の一具現例として、前記第5配列はSEQ ID NO:248配列で任意に選定された一つ以上のヌクレオチド配列が削除された配列であり得る。この時、前記任意に選定された一つ以上のヌクレオチド配列はSEQ ID NO:248配列内で順序または方向にかかわらず、無作為的に選定された配列であり得、この時、前記任意に選定された一つ以上のヌクレオチド配列が二以上のヌクレオチド配列である場合、連続的な二以上のヌクレオチド配列または非連続的な二以上のヌクレオチド配列であり得る。
【0204】
さらに他の一具現例として、前記第5配列は任意のヌクレオチド配列または任意に配列されたヌクレオチド配列であり得る。この時、前記任意のヌクレオチド配列または任意に配列されたヌクレオチド配列は1~21nt配列であり得る。
【0205】
さらに他の一具現例として、前記第5配列はSEQ ID NO:248~259のうち選択された配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0206】
1-6)追加配列(additional sequence)
前記エンジニアリングされたtracrRNAは追加配列(additional sequence)を選択的にさらに含むことができる。前記追加配列はエンジニアリングされたtracrRNAの3'末端に位置することができる。前記追加配列は前記第1配列の3'末端に位置することができる。前記追加配列はエンジニアリングされたtracrRNAの5'末端に位置することができる。前記追加配列は前記第5配列の5'末端に位置することができる。
【0207】
前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。
【0208】
一具現例として、前記追加配列は1~5個、1~10個、1~15個、1~20個、1~25個、1~30個、1~35個、1~40個、5~10個、5~15個、5~20個、5~25個、5~30個、5~35個または5~40個のヌクレオチド配列であり得る。または前記追加配列は10~15個、10~20個、10~25個、10~30個、10~35個、10~40個、15~20個、15~25個、15~30個、15~35個または15~40個のヌクレオチド配列であり得る。または前記追加配列は20~25個、20~30個、20~35個、20~40個、25~30個、25~35個または25~40個のヌクレオチド配列であり得る。または前記追加配列は30~35個、30~40個または35~40個のヌクレオチド配列であり得る。
【0209】
他の一具現例として、前記追加配列は1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39または40個のヌクレオチド配列であり得る。
【0210】
前記追加配列は任意のヌクレオチド配列または任意に配列されたヌクレオチド配列であり得る。例えば、前記追加配列は5'-AUAAAGGUGA-3'(SEQ ID NO:260)配列であり得る。前記例示は単純例示であり、これに制限されない。
【0211】
前記追加配列は公知のヌクレオチド配列であり得る。例えば、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。この時、前記hammerhead ribozymeヌクレオチド配列は5'-CUGAUGAGUCCGUGAGGACGAAACGAGUAAGCUCGUC-3'(SEQ ID NO:261)配列または5'-CUGCUCGAAUGAGCAAAGCAGGAGUGCCUGAGUAGUC-3'(SEQ ID NO:262)配列であり得る。または前記各配列と少なくとも85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0212】
前記例示は単純例示であり、これに制限されない。
【0213】
1-7)化学的変形(Chemical modification)
前述したエンジニアリングされたtracrRNAは選択的に少なくとも一つ以上のヌクレオチドの化学的変形を含むことができる。この時、前記化学的変形はヌクレオチドの塩基および/または糖で発生し得る多様な共有結合の変形であり得、例えば、前記化学的変形はmethylation、halogenation、acetylation、phosphorylation、phosphorothioate linkage、locked nucleic acid(LNA)、2'-O-methyl 3'phosphorothioate(MS)または2'-O-methyl 3'thioPACE(MSP)であり得、またはWO 2019/089820 A1に記載された核酸の変形をすべて含むことができるが、これに制限されない。
【0214】
1-8)エンジニアリングされたtracrRNAの例示
前記の説明に基づいて、エンジニアリングされたtracrRNAの例示を説明する。以下の例示に含まれた構成要素の具体的な説明は前記にて該当構成要素について記載した通りである。以下の例示は単純例示であり、これに制限されない。
【0215】
一具現例として、エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含むことができる。
【0216】
一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列および第3配列を含むことができる。この時、前記第1配列、第2配列および第3配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列および第3配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;および5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列は5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO:211)配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列は5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO:212)配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0217】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列および第3配列を含むことができる。この時、前記第1配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:111)配列またはSEQ ID NO:111配列に少なくとも70%以上の配列同一性(sequence identity)を有する配列であり得る。この時、前記SEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列は5'-CANNNCNC-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列および第3配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:111配列またはこれに少なくとも70%以上の配列同一性を有する配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:263)配列を含むことができる。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:264)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:265)配列を含むことができる。
【0218】
他の一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列および第4配列を含むことができる。この時、前記第1配列、第2配列、第3配列および第4配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列、第3配列および第4配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;および5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列は5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3'(SEQ ID NO:213)配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第4配列]-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0219】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列および第4配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記SEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列は5'-CANNNCNC-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列および第4配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:213配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:111配列またはこれに少なくとも70%以上の配列同一性を有する配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:266)配列を含むことができる。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:267)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUUCUUUCUUCGGAAAGUAAC CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:268)配列を含むことができる。
【0220】
さらに他の一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;および5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第5配列は5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO:248)配列またはSEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0221】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記SEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列は5'-CANNNCNC-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第5配列はSEQ ID NO:248配列またはSEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:248配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:213配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:111配列またはこれに少なくとも70%以上の配列同一性を有する配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:269)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:270)配列であり得る。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:271)配列であり得る。
【0222】
他の一具現例として、エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まず、wildtype tracrRNAより長さが短いように変形された配列である。この時、前記エンジニアリングされたtracrRNAは連続した4個以下のウリジン配列を含むことができ、wildtype tracrRNAの一部の配列を含まなくてもよい。
【0223】
一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列および第3配列を含むことができる。この時、前記第1配列、第2配列および第3配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列および第3配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列の一部の配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列の一部の配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列の一部の配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列の一部の配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列の一部の配列;および5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列の一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0224】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列および第3配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうち5'-CAAAUUCANNNCN-3'(SEQ ID NO:272)配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3'(SEQ ID NO:273)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3'(SEQ ID NO:274)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3'(SEQ ID NO:275)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3'(SEQ ID NO:276)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3'(SEQ ID NO:277)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3'(SEQ ID NO:278)配列、5'-CAAAUUCANNNCNCCUCUCCAAUUC-3'(SEQ ID NO:279)配列、5'-CAAAUUCANNNCNCCUCUCCAAUU-3'(SEQ ID NO:280)配列、5'-CAAAUUCANNNCNCCUCUCCAAU-3'(SEQ ID NO:281)配列、5'-CAAAUUCANNNCNCCUCUCCAA-3'(SEQ ID NO:282)配列、5'-CAAAUUCANNNCNCCUCUCCA-3'(SEQ ID NO:283)配列、5'-CAAAUUCANNNCNCCUCUCC-3'(SEQ ID NO:284)配列、5'-CAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:285)配列、5'-CAAAUUCANNNCNCCUCU-3'(SEQ ID NO:286)配列、5'-CAAAUUCANNNCNCCUC-3'(SEQ ID NO:287)配列、5'-CAAAUUCANNNCNCCU-3'(SEQ ID NO:288)配列、5'-CAAAUUCANNNCNCC-3'(SEQ ID NO:289)配列、5'-CAAAUUCANNNCNC-3'(SEQ ID NO:290)配列または5'-CAAAUUCANNNCN-3'(SEQ ID NO:272)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列および第3配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:272~290配列のうち選択された一つの配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:291)配列を含むことができる。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:292)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUC-3'(SEQ ID NO:293)配列を含むことができる。
【0225】
他の一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列および第4配列を含むことができる。この時、前記第1配列、第2配列、第3配列および第4配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列、第3配列および第4配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列の一部の配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第4配列]-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0226】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列および第4配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列および第4配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:213配列またはこれの一部の配列]-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:111配列またはこれの一部の配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUC UC-3'(SEQ ID NO:294)配列または5'-CCGCUUCACCGAAAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUC UC-3'(SEQ ID NO:295)配列を含むことができる。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCU GCACAA-3'(SEQ ID NO:296)配列または5'-CCGCUUGAAAAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCU GCACAA-3'(SEQ ID NO:297)配列を含むことができる。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCU CCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:298)配列または5'-CCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCU CCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:299)配列を含むことができる。
【0227】
さらに他の一具体例として、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は連続した5個以上のウリジン配列を含まない配列であり、連続した4個以下のウリジン配列を含む配列であり得る。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列またはSEQ ID NO:248配列の一部の配列であり得る。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-[追加配列]-3')。
【0228】
具体的な例を挙げると、前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列は5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:111)配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる(5'-[SEQ ID NO:248配列またはこれの一部の配列]-[SEQ ID NO:213配列またはこれの一部の配列]-[SEQ ID NO:212配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:211配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[SEQ ID NO:111配列またはこれの一部の配列]-3')。前記エンジニアリングされたtracrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記追加配列は前記エンジニアリングされたtracrRNAの3'末端に位置することができる。一例として、前記エンジニアリングされたtracrRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUC-3'(SEQ ID NO:300)配列、5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:301)配列、5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUC-3'(SEQ ID NO:302)配列または5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:303)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたtracrRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:304)配列または5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:305)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:306)配列、5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUC-3'(SEQ ID NO:307)配列、5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:308)配列または5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:309)配列であり得る。さらに他の一例として、前記エンジニアリングされたtracrRNAは5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:310)配列または5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUC-3'(SEQ ID NO:311)配列であり得る。
【0229】
2.Wildtype crRNA orエンジニアリングされたcrRNA(Engineered crRNA)
【0230】
本出願のcrRNA(crispr RNA)は標的核酸と相互作用する配列とCas12f1(Cas14a1)タンパク質と相互作用する配列(tracrRNAと相互作用する配列)を含む。前記crRNAは標的核酸を認識、結合またはターゲッティングすることができ、前記crRNAはtracrRNAを認識または結合することができる。また、前記crRNAはCas12f1(Cas14a1)タンパク質を認識または結合することができる。本明細書によって説明されるcrRNAは野生型crRNAおよびエンジニアリングされたcrRNAをすべて含む。
【0231】
野生型crRNAは野生型(wildtype)反復配列(repeat sequence)およびガイド配列(ガイドsequence)を含む。この時、前記野生型反復配列とガイド配列はwildtype crRNAの5'末端から3'末端方向に順に位置する。この時、前記野生型反復配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列である。
【0232】
本出願のエンジニアリングされたcrRNAはwildtype crRNAの一部のヌクレオチド配列が人為的に変形されたり、wildtype crRNAより長さが短いように変形されたりおよび/または3'末端にU-rich tail配列が付加されたcrRNAである(
図3)。この時、前記エンジニアリングされたcrRNAは前述したエンジニアリングされたtracrRNAとの相互作用を向上させるために変形されたり、またはエンジニアリングされたガイドRNA(またはエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム)の追加的な機能向上のために変形されたりしたものである。
【0233】
一具現例として、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含む。この時、前記第6配列、第7配列およびガイド配列はエンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる。
【0234】
一具現例として、前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を含む。この時、前記第6配列、第7配列、ガイド配列およびU-rich tail配列はエンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる。この時、前記第6配列および第7配列はそれぞれ前記エンジニアリングされたtracrRNAと結合する領域を基準として分けたものである(
図3)。
【0235】
一具現例として、前記エンジニアリングされたcrRNAは野生型反復配列、ガイド配列およびU-rich tail配列を含む。この時、前記野生型反復配列、ガイド配列およびU-rich tail配列はエンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる。この時、前記野生型反復配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列である。
【0236】
一具現例として、前記エンジニアリングされたcrRNAは野生型反復配列の一部の配列およびガイド配列を含んだりまたは野生型反復配列の一部の配列、ガイド配列およびU-rich tail配列を含んだりする。この時、前記野生型反復配列の一部の配列およびガイド配列;または野生型反復配列の一部の配列、ガイド配列およびU-rich tail配列はエンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる。この時、前記野生型反復配列の一部の配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列の一部の配列であり、SEQ ID NO:312配列の5'末端部で順次的な一部の配列を含まない配列である。
【0237】
以下で、前記第6配列、第7配列、ガイド配列およびU-rich tail配列について詳細に記述する。
【0238】
2-1)Sixth sequence(the other strand for Stem5 / a part of Repeat sequence)
【0239】
前記エンジニアリングされたcrRNAは第6配列(sixth sequence)を含む。前記第6配列は前記エンジニアリングされたcrRNAに含まれる必須配列である。前記第6配列は前記エンジニアリングされたtracrRNAの一部の配列と相補的な結合をする配列である。この時、前記第6配列は前記エンジニアリングされたtracrRNAの前記第1配列と相補的な結合を通じてRNA duplexを形成する。この時、前記第6配列と前記第1配列によって形成されたRNA duplexはステム5(stem5)である。前記ステム5を形成する少なくとも一つ以上のヌクレオチドはCas12f1タンパク質のWEDドメインおよび/またはZFドメインと相互作用することができる。
【0240】
前記第6配列は5'-ACGAA-3'配列を含まない。
【0241】
前記第6配列は前記第1配列と相補的結合を形成する少なくとも一つ以上のヌクレオチドを含む。この時、前記第6配列は前記第1配列と相補的結合を形成しない少なくとも一つ以上のヌクレオチドを含むことができる。すなわち、前記第6配列は前記第1配列と少なくとも一つ以上の相補的結合を形成することができる。
【0242】
前記第6配列は前記第1配列と少なくとも一つ以上の塩基対を形成するヌクレオチドを含む。この時、前記第6配列は前記第1配列と少なくとも一つ以上の塩基対を形成しないヌクレオチドを含むことができる。すなわち、前記第6配列は前記第1配列と少なくとも一つ以上の塩基対を形成することができる。
【0243】
前記第6配列は前記エンジニアリングされたcrRNAの5'末端に位置する。
【0244】
前記第6配列は前述したエンジニアリングされたtracrRNAの第1配列により多様に変形された配列であり得る。すなわち、前記第6配列は前記第1配列内に存在するNおよび/またはVにより多様に変形された配列であり得る。この時、前記第6配列は前記第1配列に存在する少なくとも一つのNおよび/またはVと相補的な結合を形成するヌクレオチドを含む配列であり得る。
【0245】
前記第6配列は次の配列のうち選択された一つの配列であり得る:
5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;
5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;
5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;
5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;
5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;
5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列;および
SEQ ID NO:313~318配列のうち選択された一つの一部の配列。
【0246】
この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。
【0247】
この時、前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。
【0248】
この時、前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。例えば、前記dが3である場合、(N)3は5'-NNN-3'配列を意味し、この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。
【0249】
この時、前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。例えば、前記aが4である場合、(B)4は5'-BBBB-3'配列を意味し、この時、それぞれのBは独立的にU、CまたはGであり得る。
【0250】
この時、前記SEQ ID NO:313~318配列の5'末端に位置する5'-GUUGCAGAACCCGAAUAG-3'(SEQ ID NO:319)配列および/または3'末端に位置する5'-UGAAGGA-3'配列は選択的に変形され得る。前記変形はSEQ ID NO:319配列および/または5'-UGAAGGA-3'配列のうち少なくとも一つ以上のヌクレオチドが削除または他のヌクレオチドで置換されるものであり得る。または前記変形はSEQ ID NO:319配列および/または5'-UGAAGGA-3'配列に一つ以上のヌクレオチドが挿入されるものであり得る。
【0251】
前記第6配列はエンジニアリングされたtracrRNAの第1配列により前記SEQ ID NO:313~318配列のうち選択された一つの配列であり得る。この時、前記第6配列は前記第1配列と有機的な関係を有することができる。前記第6配列は前記第1配列により多様に設計され得る。すなわち、前記第6配列は前記第1配列内に存在するNおよび/またはVにより多様に設計され得る。この時、前記第6配列は前記第1配列に存在する少なくとも一つ以上のNおよび/またはVと相補的な結合を形成するヌクレオチドを含むことができる。
【0252】
i)5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列
一具現例として、第1配列が5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。この時、前記第6配列の(N)aのうち少なくとも一つのNは前記第1配列の(N)aのうち少なくとも一つのNと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCAUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:320)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGUGCCUGAAGGA-3'(SEQ ID NO:321)配列であり得る((N)aに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0253】
ii)5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列
一具現例として、第1配列が5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBはU、CまたはGであり得る。前記aは0~4の整数であり得る。この時、前記第6配列の(B)aNNNNBのうち少なくとも一つのNおよび/またはBは前記第1配列のVNNNN(V)aのうち少なくとも一つのNおよび/またはVと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCACAUUCCCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:322)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGGAAAGCUGAAGGA-3'(SEQ ID NO:323)配列であり得る((B)aNNNNBおよびVNNNN(V)aに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0254】
iii)5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列
一具現例として、第1配列が5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり、BはU、CまたはGであり得る。前記bは0~1の整数であり得る。この時、前記第6配列の(N)bNNNBNのうち少なくとも一つのNおよび/またはBは前記第1配列のNVNNN(N)bのうち少なくとも一つのNおよび/またはVと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:324)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGA-3'(SEQ ID NO:325)配列であり得る((N)bNNNBNおよびNVNNN(N)bに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0255】
iv)5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列
一具現例として、第1配列が5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり、BはU、CまたはGであり得る。前記cは0~2の整数であり得る。この時、前記第6配列の(N)cNNBNNのうち少なくとも一つのNおよび/またはBは前記第1配列のNNVNN(N)cのうち少なくとも一つのNおよび/またはVと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:326)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGAGGAAUGAAGGA-3'(SEQ ID NO:327)配列であり得る((N)cNNBNNおよびNNVNN(N)cに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0256】
v)5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列
一具現例として、第1配列が5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり、BはU、CまたはGであり得る。前記dは0~3の整数であり得る。この時、前記第6配列の(N)dNBNNNのうち少なくとも一つのNおよび/またはBは前記第1配列のNNNVN(N)dのうち少なくとも一つのNおよび/またはVと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCACUGCCUUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:328)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGAAGGCAGUGAAGGA-3'(SEQ ID NO:329)配列であり得る((N)dNBNNNおよびNNNVN(N)dに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0257】
vi)5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列
一具現例として、第1配列が5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり、BはU、CまたはGであり得る。前記aは0~4の整数であり得る。この時、前記第6配列の(N)aBNNNNのうち少なくとも一つのNおよび/またはBは前記第1配列のNNNNV(N)aのうち少なくとも一つのNおよび/またはVと相補的な結合を形成することができる。例えば、第1配列が5'-CAAAUUCACAUUGAUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:330)配列である場合、前記第6配列は5'-GUUGCAGAACCCGAAUAGACGAAAGUGAAGGA-3'(SEQ ID NO:331)配列であり得る((N)aBNNNNおよびNNNNV(N)aに対応するヌクレオチドのうち互いに相補的結合を形成するヌクレオチドはそれぞれアンダーラインで表示する)。前記例示は単純例示であり、これに制限されない。
【0258】
vii)SEQ ID NO:313~318配列のうち選択された配列の一部の配列
一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列の一部の配列であり、SEQ ID NO:313配列のうち5'-(N)aUGAAGGA-3'配列を含み、かつSEQ ID NO:313配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記aは0~4の整数であり得る。
【0259】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:332)配列の一部の配列であり、5'-NNNNUGAAGGA-3'(SEQ ID NO:333)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:334)配列、5'-CAGAACCCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:335)配列、5'-GAACCCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:336)配列、5'-ACCCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:337)配列、5'-CCGAAUAGNNNNUGAAGGA-3'(SEQ ID NO:338)配列、5'-GAAUAGNNNNUGAAGGA-3'(SEQ ID NO:339)配列、5'-AUAGNNNNUGAAGGA-3'(SEQ ID NO:340)配列、5'-AGNNNNUGAAGGA-3'(SEQ ID NO:341)配列または5'-NNNNUGAAGGA-3'(SEQ ID NO:333)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記例示は単純例示であり、これに制限されない。
【0260】
他の一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列の一部の配列であり、SEQ ID NO:314配列のうち5'-NNNNBUGAAGGA-3'(SEQ ID NO:342)配列を含み、かつSEQ ID NO:314配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり得る。
【0261】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:343)配列の一部の配列であり、5'-NNNNBUGAAGGA-3'(SEQ ID NO:342)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:344)配列、5'-CAGAACCCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:345)配列、5'-GAACCCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:346)配列、5'-ACCCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:347)配列、5'-CCGAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:348)配列、5'-GAAUAGNNNNBUGAAGGA-3'(SEQ ID NO:349)配列、5'-AUAGNNNNBUGAAGGA-3'(SEQ ID NO:350)配列、5'-AGNNNNBUGAAGGA-3'(SEQ ID NO:351)配列または5'-NNNNBUGAAGGA-3'(SEQ ID NO:342)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記例示は単純例示であり、これに制限されない。
【0262】
さらに他の一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列の一部の配列であり、SEQ ID NO:315配列のうち5'-NNNBNUGAAGGA-3'(SEQ ID NO:352)配列を含み、かつSEQ ID NO:315配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記bは0~1の整数であり得る。
【0263】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:353)配列の一部の配列であり、5'-NNNBNUGAAGGA-3'(SEQ ID NO:352)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:354)配列、5'-CAGAACCCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:355)配列、5'-GAACCCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:356)配列、5'-ACCCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:357)配列、5'-CCGAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:358)配列、5'-GAAUAGNNNBNUGAAGGA-3'(SEQ ID NO:359)配列、5'-AUAGNNNBNUGAAGGA-3'(SEQ ID NO:360)配列、5'-AGNNNBNUGAAGGA-3'(SEQ ID NO:361)配列または5'-NNNBNUGAAGGA-3'(SEQ ID NO:352)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記例示は単純例示であり、これに制限されない。
【0264】
他の一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列の一部の配列であり、SEQ ID NO:316配列のうち5'-NNBNNUGAAGGA-3'(SEQ ID NO:362)配列を含み、かつSEQ ID NO:316配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記cは0~2の整数であり得る。
【0265】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:363)配列の一部の配列であり、5'-NNBNNUGAAGGA-3'(SEQ ID NO:362)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:364)配列、5'-CAGAACCCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:365)配列、5'-GAACCCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:366)配列、5'-ACCCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:367)配列、5'-CCGAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:368)配列、5'-GAAUAGNNBNNUGAAGGA-3'(SEQ ID NO:369)配列、5'-AUAGNNBNNUGAAGGA-3'(SEQ ID NO:370)配列、5'-AGNNBNNUGAAGGA-3'(SEQ ID NO:371)配列または5'-NNBNNUGAAGGA-3'(SEQ ID NO:362)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記例示は単純例示であり、これに制限されない。
【0266】
さらに他の一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列の一部の配列であり、SEQ ID NO:317配列のうち5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつSEQ ID NO:317配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記dは0~3の整数であり得る。
【0267】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:373)配列の一部の配列であり、5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:374)配列、5'-CAGAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:375)配列、5'-GAACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:376)配列、5'-ACCCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:377)配列、5'-CCGAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:378)配列、5'-GAAUAGNBNNNUGAAGGA-3'(SEQ ID NO:379)配列、5'-AUAGNBNNNUGAAGGA-3'(SEQ ID NO:380)配列、5'-AGNBNNNUGAAGGA-3'(SEQ ID NO:381)配列または5'-NBNNNUGAAGGA-3'(SEQ ID NO:372)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記例示は単純例示であり、これに制限されない。
【0268】
さらに他の一具現例として、前記第6配列は5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列の一部の配列であり、SEQ ID NO:318配列のうち5'-BNNNNUGAAGGA-3'(SEQ ID NO:382)配列を含み、かつSEQ ID NO:318配列の5'末端部で順次的な一部の配列を含まなくてもよい。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記aは0~4の整数であり得る。
【0269】
一具体例として、前記第6配列は5'-GUUGCAGAACCCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:383)配列の一部の配列であり、5'-BNNNNUGAAGGA-3'(SEQ ID NO:382)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。例えば、前記第6配列は5'-UGCAGAACCCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:384)配列、5'-CAGAACCCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:385)配列、5'-GAACCCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:386)配列、5'-ACCCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:387)配列、5'-CCGAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:388)配列、5'-GAAUAGBNNNNUGAAGGA-3'(SEQ ID NO:389)配列、5'-AUAGBNNNNUGAAGGA-3'(SEQ ID NO:390)配列、5'-AGBNNNNUGAAGGA-3'(SEQ ID NO:391)配列または5'-BNNNNUGAAGGA-3'(SEQ ID NO:382)配列であり得る。この時、前記Nはそれぞれ独立的にA、C、GまたはUであり得る。前記BはU、CまたはGであり得る。前記例示は単純例示であり、これに制限されない。
【0270】
2-2)Seventh sequence(interaction with the third sequence(or Stem3)/ a part of Repeat sequence)
前記エンジニアリングされたcrRNAは第7配列(seventh sequence)を含む。前記第7配列は前記エンジニアリングされたcrRNAに含まれる必須配列である。前記第7配列は前記エンジニアリングされたtracrRNAの一部の配列と相補的な結合をする配列である。この時、前記第7配列は前記エンジニアリングされたtracrRNAの前記第3配列の一部の配列と相補的な結合を通じてRNA duplexを形成する。
【0271】
前記第7配列は前記第3配列と相補的結合を形成する少なくとも一つ以上のヌクレオチドを含む。この時、前記第7配列は前記第3配列と相補的結合を形成しない少なくとも一つ以上のヌクレオチドを含むことができる。すなわち、前記第7配列は前記第3配列と少なくとも一つ以上の相補的結合を形成することができる。
【0272】
前記第7配列は前記第3配列と少なくとも一つ以上の塩基対を形成するヌクレオチドを含む。この時、前記第7配列は前記第3配列と少なくとも一つ以上の塩基対を形成しないヌクレオチドを含むことができる。すなわち、前記第7配列は前記第3配列と少なくとも一つ以上の塩基対を形成することができる。
【0273】
前記第7配列は前記第6配列の3'末端に位置する。
【0274】
前記第7配列は前記第6配列の3'末端と共有結合で連結される。
【0275】
一具現例として、前記第7配列は5'-AUGCAAC-3'配列であり得る。
【0276】
他の一具現例として、前記第7配列は5'-AUGCAAC-3'配列と少なくとも70%以上同一または類似する配列であり得る。または前記第7配列は5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性または配列類似性を有する配列であり得る。
【0277】
さらに他の一具現例として、前記第7配列は5'-AUGCAAC-3'配列と少なくとも70%~85%、少なくとも70%~100%または少なくとも85%~100%同一または類似する配列であり得る。または前記第7配列は5'-AUGCAAC-3'配列に少なくとも少なくとも70%~85%、少なくとも70%~100%または少なくとも85%~100%の配列同一性または配列類似性を有する配列であり得る。
【0278】
さらに他の一具現例として、前記第7配列は5'-AUGCAAC-3'配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%同一または類似する配列であり得る。または前記第7配列は5'-AUGCAAC-3'配列に少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0279】
2-3)ガイド配列(guide sequence)
前記wildtype crRNAおよびエンジニアリングされたcrRNAはガイド配列を含む。ガイド配列は標的核酸を認識(recognizing)、結合(binding)またはターゲッティング(targeting)するRNA配列である。より具体的には、ガイド配列は標的配列と相補的に結合するRNA配列、標的配列と相補的な結合を形成できるRNA配列または標的配列に相補性を有するRNA配列である。またはガイド配列はプロトスペーサー配列と同一または類似するRNA配列である。この時、プロトスペーサー配列は標的配列と有機的な関係を有し、これに関連した説明は前記用語の定義セクションの「標的配列、標的鎖および非標的鎖」で説明した通りである。ガイド配列は標的配列により変更される配列であって、ガイド配列は標的配列により変わる。また、ガイド配列はRNA配列であって、標的核酸がDNAである場合に標的配列内に存在するアデノシン(A)に対して、前記ガイド配列は相補的な結合を形成できるウリジン(U)を含む。または標的核酸がDNAである場合に、プロトスペーサー配列内に存在するチミジン(T)に対して、前記ガイド配列はチミジン(T)の代わりにウリジン(U)を含む。また、前記ガイド配列はスペーサー配列(spacer sequence)とも指称され、以下でガイド配列とスペーサー配列は併用されて使われる。
【0280】
前記ガイド配列は前記野生型反復配列の3'末端に位置する。または前記ガイド配列は前記第7配列の3'末端に位置する。
【0281】
前記ガイド配列は前記野生型反復配列の3'末端と共有結合で連結される。または前記ガイド配列は前記第7配列の3'末端と共有結合で連結される。
【0282】
前記ガイド配列は15~40個のヌクレオチド配列である。
【0283】
一具現例として、前記ガイド配列は15~20個、15~25個、15~30個、15~35個または15~40個のヌクレオチド配列であり得る。または前記ガイド配列は20~25個、20~30個、20~35個または20~40個のヌクレオチド配列であり得る。または前記ガイド配列は25~30個、25~35個または25~40個のヌクレオチド配列であり得る。または前記ガイド配列は30~35個または30~40個のヌクレオチド配列であり得る。または前記ガイド配列は35~40個のヌクレオチド配列であり得る。
【0284】
他の一具現例として、前記ガイド配列は15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39または40個のヌクレオチド配列であり得る。
【0285】
前記ガイド配列は標的配列と相補的な結合をする配列である。この時、前記相補的な結合は選択的に少なくとも一つ以上のミスマッチング結合を含むことができる。例えば、前記ガイド配列は標的配列と相補的な結合をする配列であり、この時、前記相補的な結合は0~5個のミスマッチング結合を含むことができる。
【0286】
前記ガイド配列は標的配列に対して相補的な配列である。この時、前記相補的な配列は標的配列に対して0~5個のミスマッチされた(mismatched)ヌクレオチド配列を含むことができる。または前記ガイド配列は標的配列に対して少なくとも70%以上相補的なヌクレオチド配列であり得る。この時、標的配列がDNAである場合に標的配列内に存在するアデノシン(A)に対して、前記ガイド配列は前記アデノシン(A)に相補的な結合を形成できるウリジン(U)を含むことができる。
【0287】
一具現例として、前記ガイド配列は標的配列に対して少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%相補的な配列であり得る。または前記ガイド配列は標的配列に対して少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%相補的な配列であり得る。または前記ガイド配列は標的配列に対して少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%相補的な配列であり得る。または前記ガイド配列は標的配列に対して少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%相補的な配列であり得る。
【0288】
前記ガイド配列はプロトスペーサー配列と同一または類似する配列である。すなわち、前記ガイド配列はプロトスペーサー配列に対して配列同一性または配列類似性を有する配列である。この時、前記配列同一性または配列類似性は少なくとも70%以上であるものであり得る。この時、プロトスペーサー配列がDNAである場合にプロトスペーサー配列内に存在するチミジン(T)に対して、前記ガイド配列はチミジン(T)の代わりにウリジン(U)を含むことができる。
【0289】
一具現例として、前記ガイド配列はプロトスペーサー配列と少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%同一または類似する配列であり得る。または前記ガイド配列はプロトスペーサー配列と少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%同一または類似する配列であり得る。または前記ガイド配列はプロトスペーサー配列と少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%同一または類似する配列であり得る。または前記ガイド配列はプロトスペーサー配列と少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%同一または類似する配列であり得る。
【0290】
他の一具現例として、前記ガイド配列はプロトスペーサー配列に少なくとも70%~75%、少なくとも70%~80%、少なくとも70%~85%、少なくとも70%~90%、少なくとも70%~95%、少なくとも70%~100%、少なくとも75%~80%、少なくとも75%~85%、少なくとも75%~90%、少なくとも75%~95%または少なくとも75%~100%の配列同一性または配列類似性を有する配列であり得る。または前記ガイド配列はプロトスペーサー配列に少なくとも80%~85%、少なくとも80%~90%、少なくとも80%~95%、少なくとも80%~100%、少なくとも85%~90%、少なくとも85%~95%または少なくとも85%~100%の配列同一性または配列類似性を有する配列であり得る。または前記ガイド配列はプロトスペーサー配列に少なくとも90%~95%、少なくとも90%~100%または少なくとも95%~100%の配列同一性または配列類似性を有する配列であり得る。または前記ガイド配列はプロトスペーサー配列に少なくとも70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100%の配列同一性または配列類似性を有する配列であり得る。
【0291】
2-4)U-rich tail sequence
前記エンジニアリングされたcrRNAはU-rich tail配列を選択的にさらに含むことができる。U-rich tail配列は前記エンジニアリングされたcrRNAの3'末端に付加されるウリジン(U)が豊富な配列である。前記U-rich tail配列はエンジニアリングされたガイドRNA(またはエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム)を利用した標的遺伝子(標的核酸)エディティング効率を上げる役割をすると本発明者の以前の研究で報告した(PCT/KR2020/014961)。
【0292】
前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。
【0293】
この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。
【0294】
この時、前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。
【0295】
一具現例として、前記U-rich tail配列は5'-(UaU)dUe-3'配列、すなわち、Ux配列であり得る。この時、前記xは0~22の整数であり得る。例えば、前記U-rich tail配列はU、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU、UUUUUUUUUまたはUUUUUUUUUU(SEQ ID NO:392)であり得る。
【0296】
他の一具現例として、前記U-rich tail配列は5'-(UaA)dUe-3'配列であり得る。例えば、前記U-rich tail配列はUAU、UUAUUAU、UUUUAUUUU、UUUAUUUUUまたはUUUAUUUAUUUAU(SEQ ID NO:393)であり得る。
【0297】
さらに他の一具現例として、前記U-rich tail配列は5'-(UaG)dUe-3'配列であり得る。例えば、前記U-rich tail配列はUUG、UUUGU、UUGUUGU、UUUUGUUUU、UGUGUGUUUU(SEQ ID NO:394)またはUUUGUUUGUUUU(SEQ ID NO:395)であり得る。
【0298】
他の一具現例として、前記U-rich tail配列は5'-(UaC)dUe-3'配列であり得る。例えば、前記U-rich tail配列はCUUUUU、UCUCUUU、UUCUU、UUUCU、UUUUCUUUUまたはUUUUCUUUUCUUUU(SEQ ID NO:396)であり得る。
【0299】
さらに他の一具現例として、前記U-rich tail配列は5'-UaAUaAUe-3'配列、5'-UaAUaCUe-3'配列、5'-UaAUaGUe-3'配列、5'-UaCUaAUe-3'配列、5'-UaCUaCUe-3'配列、5'-UaCUaGUe-3'配列、5'-UaGUaAUe-3'配列、5'-UaGUaCUe-3'配列または5'-UaGUaGUe-3'配列であり得る。例えば、前記U-rich tail配列はUUAUUUAUU、UUUCUAUUUU(SEQ ID NO:397)、UGUCU、UUAUGUUUUU(SEQ ID NO:398)またはUCUUUUGUUであり得る。
【0300】
さらに他の一具現例として、前記U-rich tail配列は5'-UaAUaAUaAUe-3'配列、5'-UaAUaAUaCUe-3'配列、5'-UaAUaAUaGUe-3'配列、5'-UaAUaCUaAUe-3'配列、5'-UaAUaCUaCUe-3'配列、5'-UaAUaCUaGUe-3'配列、5'-UaAUaGUaAUe-3'配列、5'-UaAUaGUaCUe-3'配列、5'-UaAUaGUaGUe-3'配列、5'-UaCUaAUaAUe-3'配列、5'-UaCUaAUaCUe-3'配列、5'-UaCUaAUaGUe-3'配列、5'-UaCUaCUaAUe-3'配列、5'-UaCUaCUaCUe-3'配列、5'-UaCUaCUaGUe-3'配列、5'-UaCUaGUaAUe-3'配列、5'-UaCUaGUaCUe-3'配列、5'-UaCUaGUaGUe-3'配列、5'-UaGUaAUaAUe-3'配列、5'-UaGUaAUaCUe-3'配列、5'-UaGUaAUaGUe-3'配列、5'-UaGUaCUaAUe-3'配列、5'-UaGUaCUaCUe-3'配列、5'-UaGUaCUaGUe-3'配列、5'-UaGUaGUaAUe-3'配列、5'-UaGUaGUaCUe-3'配列または5'-UaGUaGUaGUe-3'配列であり得る。例えば、前記U-rich tail配列はUUUAUUCUGUU(SEQ ID NO:399)、UUCUCUUUCUUU(SEQ ID NO:400)、UGUUAUUUAUU(SEQ ID NO:401)、UUUCUUUAUGUUU(SEQ ID NO:402)、UAUUUGUUUC(SEQ ID NO:403)またはUUCUUGUUUUAUU(SEQ ID NO:404)であり得る。
【0301】
2-5)追加配列(additional sequence)
【0302】
前記wildtype crRNAおよび/またはエンジニアリングされたcrRNAは追加配列(additional sequence)を選択的にさらに含むことができる。前記追加配列はwildtype crRNAおよび/またはエンジニアリングされたcrRNAの5'末端に位置することができる。前記追加配列は前記野生型反復配列またはエンジニアリングされた反復配列の5'末端に位置することができる。前記追加配列は前記第6配列の5'末端に位置することができる。
【0303】
前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。
【0304】
一具現例として、前記追加配列は1~5個、1~10個、1~15個、1~20個、1~25個、1~30個、1~35個、1~40個、5~10個、5~15個、5~20個、5~25個、5~30個、5~35個または5~40個のヌクレオチド配列であり得る。または前記追加配列は10~15個、10~20個、10~25個、10~30個、10~35個、10~40個、15~20個、15~25個、15~30個、15~35個または15~40個のヌクレオチド配列であり得る。または前記追加配列は20~25個、20~30個、20~35個、20~40個、25~30個、25~35個または25~40個のヌクレオチド配列であり得る。または前記追加配列は30~35個、30~40個または35~40個のヌクレオチド配列であり得る。
【0305】
他の一具現例として、前記追加配列は1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39または40個のヌクレオチド配列であり得る。
【0306】
前記追加配列は任意のヌクレオチド配列または任意に配列されたヌクレオチド配列であり得る。
【0307】
前記追加配列は公知のヌクレオチド配列であり得る。例えば、前記追加配列はhammerhead ribozymeヌクレオチド配列であり得る。この時、前記hammerhead ribozymeヌクレオチド配列はSEQ ID NO:261配列またはSEQ ID NO:262配列であり得る。前記例示は単純例示であり、これに制限されない。
【0308】
2-6)化学的変形(Chemical modification)
前述したwildtype crRNAまたはエンジニアリングされたcrRNAは選択的に少なくとも一つ以上のヌクレオチドの化学的変形を含むことができる。この時、前記化学的変形はヌクレオチドの塩基および/または糖で発生し得る多様な共有結合の変形であり得、例えば、前記化学的変形はmethylation、halogenation、acetylation、phosphorylation、phosphorothioate linkage、locked nucleic acid(LNA)、2'-O-methyl 3'phosphorothioate(MS)または2'-O-methyl 3'thioPACE(MSP)であり得、またはWO 2019/089820 A1に記載された核酸の変形をすべて含むことができるが、これに制限されない。
【0309】
2-7)crRNAの例示(エンジニアリングされたcrRNAの例示)
前記の説明に基づいて、wildtype crRNAおよびエンジニアリングされたcrRNAの例示を説明する。以下の例示に含まれた構成要素の具体的な説明は前記にて該当構成要素について記載した通りである。以下の例示は単純例示であり、これに制限されない。
【0310】
一具現例として、wildtype crRNAはwildtype反復配列およびガイド配列を含むことができる。この時、前記wildtype反復配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記wildtype反復配列とガイド配列はwildtype crRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列]-[ガイド配列]-3')。一例として、前記wildtype crRNAは5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:405)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0311】
一具現例として、エンジニアリングされたcrRNAはwildtype crRNAの3'末端にU-rich tail配列が付加されたcrRNAであり得る。
【0312】
一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記wildtype反復配列は5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO:312)配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記wildtype反復配列、ガイド配列およびU-rich tail配列はwildtype crRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列]-[ガイド配列]-[U-rich tail配列]-3')。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[wildtype反復配列]-[ガイド配列]-[U-rich tail配列]-3')。
【0313】
例えば、前記エンジニアリングされたcrRNAはSEQ ID NO:312配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAはSEQ ID NO:312配列、ガイド配列およびU-rich tail配列を5'末端から3'末端方向に順に含むことができる(5'-[SEQ ID NO:312配列]-[ガイド配列]-[U-rich tail配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3'(SEQ ID NO:406)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:407)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0314】
他の一具現例として、エンジニアリングされたcrRNAは野生型(wildtype)crRNAの一部のヌクレオチド配列が人為的に変形された配列であり得る。
【0315】
一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換された配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列、第7配列およびガイド配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;および5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[第6配列]-[第7配列]-[ガイド配列]-3')。
【0316】
例えば、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列は5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:408)配列またはSEQ ID NO:408配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記SEQ ID NO:408配列に少なくとも70%以上の配列同一性を有する配列は5'-GNGNNNUG-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を5'末端から3'末端方向に順に含むことができる(5'-[SEQ ID NO:408配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[5'-AUGCAAC-3'配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[ガイド配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:409)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:410)配列を含むことができる。
【0317】
さらに他の一具現例として、エンジニアリングされたcrRNAは野生型(wildtype)crRNAの一部のヌクレオチド配列が人為的に変形されたり、および/またはwildtype crRNAより長さが短いように変形されたりした配列であり得る。
【0318】
一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列のうち一部のヌクレオチド配列が削除された配列であり得る。前記エンジニアリングされたcrRNAはwildtype反復配列の一部の配列およびガイド配列を含むことができる。この時、前記wildtype反復配列の一部の配列およびガイド配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列の一部の配列]-[ガイド配列]-3')。この時、前記wildtype反復配列の一部の配列はSEQ ID NO:312配列の一部の配列であり、SEQ ID NO:312配列の5'末端部一部の配列を含まない配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[wildtype反復配列の一部の配列]-[ガイド配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:411)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0319】
他の一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換され、wildtype反復配列のうち一部のヌクレオチド配列が削除された配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列、第7配列およびガイド配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列;およびSEQ ID NO:313~318配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[第6配列]-[第7配列]-[ガイド配列]-3')。
【0320】
例えば、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列はSEQ ID NO:408配列またはSEQ ID NO:408配列の一部の配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:408配列のうち5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列は5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:413)配列、5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:414)配列、5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:415)配列、5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:416)配列、5'-AGAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:417)配列、5'-GAACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:418)配列、5'-AACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:419)配列、5'-ACCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:420)配列、5'-CCCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:421)配列、5'-CCGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:422)配列、5'-CGAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:423)配列、5'-GAAUAGNGNNNUGAAGGA-3'(SEQ ID NO:424)配列、5'-AAUAGNGNNNUGAAGGA-3'(SEQ ID NO:425)配列、5'-AUAGNGNNNUGAAGGA-3'(SEQ ID NO:426)配列、5'-UAGNGNNNUGAAGGA-3'(SEQ ID NO:427)配列、5'-AGNGNNNUGAAGGA-3'(SEQ ID NO:428)配列または5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を5'末端から3'末端方向に順に含むことができる(5'-[SEQ ID NO:408配列またはこれの一部の配列]-[5'-AUGCAAC-3'配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[ガイド配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:429)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:430)配列を含むことができる。
【0321】
他の一具現例として、エンジニアリングされたcrRNAは野生型(wildtype)crRNAの一部のヌクレオチド配列が人為的に変形されたり、wildtype crRNAより長さが短いように変形されたり、および/または3'末端にU-rich tail配列が付加された配列であり得る。
【0322】
一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列のうち一部のヌクレオチド配列が削除され、3'末端にU-rich tail配列が付加された配列であり得る。前記エンジニアリングされたcrRNAはwildtype反復配列の一部の配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記wildtype反復配列の一部の配列、ガイド配列およびU-rich tail配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列の一部の配列]-[ガイド配列]-[U-rich tail配列]-3')。この時、前記wildtype反復配列の一部の配列はSEQ ID NO:312配列の一部の配列であり、SEQ ID NO:312配列の5'末端部一部の配列を含まない配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[wildtype反復配列の一部の配列]-[ガイド配列]-[U-rich tail配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:431)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0323】
他の一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換され、3'末端にU-rich tail配列が付加された配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記第6配列、第7配列、ガイド配列およびU-rich tail配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-[U-rich tail配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;および5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[第6配列]-[第7配列]-[ガイド配列]-[U-rich tail配列]-3')。
【0324】
例えば、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列はSEQ ID NO:408配列またはSEQ ID NO:408配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記SEQ ID NO:408配列に少なくとも70%以上の配列同一性を有する配列は5'-GNGNNNUG-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を5'末端から3'末端方向に順に含むことができる(5'-[SEQ ID NO:408配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[5'-AUGCAAC-3'配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[ガイド配列]-[U-rich tail配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:432)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:433)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたcrRNAは5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3'(SEQ ID NO:434)配列を含むことができる。
【0325】
さらに他の一具体例として、前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換されたり、wildtype反復配列のうち一部のヌクレオチド配列が削除されたり、および/または3'末端にU-rich tail配列が付加された配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記第6配列、第7配列、ガイド配列およびU-rich tail配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-[U-rich tail配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列;およびSEQ ID NO:313~318配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記エンジニアリングされたcrRNAは選択的に追加配列をさらに含むことができる。この時、前記追加配列は1~40個のヌクレオチド配列(1~40nt配列)であり得る。前記追加配列は前記エンジニアリングされたcrRNAの5'末端に位置することができる(5'-[追加配列]-[第6配列]-[第7配列]-[ガイド配列]-[U-rich tail配列]-3')。
【0326】
例えば、前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列はSEQ ID NO:408配列またはSEQ ID NO:408配列の一部の配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:408配列のうち5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:412~428配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を5'末端から3'末端方向に順に含むことができる(5'-[SEQ ID NO:408配列の一部の配列]-[5'-AUGCAAC-3'配列またはこれに少なくとも70%以上の配列同一性を有する配列]-[ガイド配列]-[U-rich tail配列]-3')。一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:435)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。他の一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:436)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたcrRNAは5'-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3'(SEQ ID NO:545)配列を含むことができる。
【0327】
3.エンジニアリングされたガイドRNA(Engineered guide RNA)
エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNA(trans-activating crispr RNA)とcrRNA(crispr RNA)を含む。この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。この時、前記エンジニアリングされたtracrRNA、wildtype crRNAおよびエンジニアリングされたcrRNA関連説明は前記の通りである。
【0328】
前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。
【0329】
以下で、エンジニアリングされたdualガイドRNAおよびエンジニアリングされたsingleガイドRNAについて詳しく説明する。
【0330】
3-1)DualガイドRNA
エンジニアリングされたdualガイドRNAは二つのRNA分子であり、エンジニアリングされたtracrRNAおよびcrRNAそれぞれを別個のRNA分子で含む。すなわち、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAがそれぞれ独立的に存在する。
【0331】
この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。
【0332】
この時、前記エンジニアリングされたtracrRNA、wildtype crRNAおよびエンジニアリングされたcrRNA関連説明は前記の通りである。
【0333】
3-2)SingleガイドRNA
エンジニアリングされたsingleガイドRNAは一つのRNA分子であり、エンジニアリングされたtracrRNA、リンカー(linker)およびcrRNAを含む。この時、前記エンジニアリングされたsingleガイドRNAはエンジニアリングされたtracrRNA、linkerおよびcrRNAが連結された一つのRNA分子である。
【0334】
エンジニアリングされたsingleガイドRNAは5'-[エンジニアリングされたtracrRNA]-[linker]-[crRNA]-3'配列であり得る。
【0335】
この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。
【0336】
この時、前記エンジニアリングされたtracrRNA、wildtype crRNAおよびエンジニアリングされたcrRNA関連説明は前記の通りである。
【0337】
この時、前記linkerは前記エンジニアリングされたtracrRNAおよびcrRNAを連結する役割をする。すなわち、前記エンジニアリングされたsingleガイドRNAはエンジニアリングされたtracrRNAとcrRNAがlinkerを通じて連結された一つのRNA分子である。
【0338】
前記linkerはエンジニアリングされたtracrRNAおよび/またはcrRNAの機能に影響を与えない配列であり得る。または前記linkerはエンジニアリングされたtracrRNAおよび/またはcrRNAとRNA duplexを形成しない配列であり得る。
【0339】
前記linkerは1~30個のヌクレオチド配列であり得る。
【0340】
一具現例として、前記linkerは1~5個、5~10個、10~15個、15~20個、20個~25個または25~30個のヌクレオチド配列であり得る。
【0341】
他の一具現例として、前記linkerは1~30個、5~30個、10~30個、15~30個、20~30個または25~30個のヌクレオチド配列であり得る。
【0342】
さらに他の一具現例として、前記linkerは1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16 17、18、19、20、21、22、23、24、25、26、27、28、29または30個のヌクレオチド配列であり得る。例えば、前記linkerは5'-GAAA-3'配列であり得るが、これに制限されたのではない。
【0343】
3-3)エンジニアリングされたガイドRNAの例示
前記の説明に基づいて、エンジニアリングされたガイドRNAの例示を説明する。以下の例示に含まれた構成要素の具体的な説明は前記にて該当構成要素について記載した通りである。以下の例示は単純例示であり、これに制限されない。
【0344】
本出願で、エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含むことができる。この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。前記エンジニアリングされたtracrRNAは前記「1-8)エンジニアリングされたtracrRNAの例示」セクションに記載された例示のうち一つであり得る。前記crRNAは「2-7)crRNAの例示」セクションに記載された例示のうち一つであり得る。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとcrRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとcrRNAはlinkerを通じて連結されていてもよい。
【0345】
他の一具現例として、エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびwildtype crRNAを含むことができる。
【0346】
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した4個以下のウリジン配列を含むことができる。前記エンジニアリングされたtracrRNAは選択的にwildtype tracrRNAより長さが短いように追加で変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAはwildtype tracrRNAの一部の配列を含まなくてもよい。
【0347】
一具体例として、前記エンジニアリングされたガイドRNAは、
【0348】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含むエンジニアリングされたtracrRNAおよび(ii)wildtype crRNAを含む。
【0349】
この時、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;および5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第5配列はSEQ ID NO:248配列またはSEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記wildtype crRNAはwildtype反復配列およびガイド配列を含むことができる。この時、前記wildtype反復配列はSEQ ID NO:312配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記wildtype反復配列とガイド配列はwildtype crRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列]-[ガイド配列]-3')。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとwildtype crRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとwildtype crRNAはlinkerを通じて連結されていてもよい。
【0350】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびwildtype crRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記SEQ ID NO:111配列に少なくとも70%以上の配列同一性を有する配列は5'-CANNNCNC-3'配列の他に残りの配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列またはSEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第5配列はSEQ ID NO:248配列またはSEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記wildtype crRNAはwildtype反復配列およびガイド配列を含むことができる。この時、前記wildtype反復配列はSEQ ID NO:312配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記wildtype crRNAはwildtype反復配列とガイド配列が5'末端から3'末端方向に順に位置することができる。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとwildtype crRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:269)配列およびwildtype crRNAである5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:405)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:437)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:270)配列およびwildtype crRNAであるSEQ ID NO:405配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:438)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0351】
他の一具体例として、前記エンジニアリングされたガイドRNAは
【0352】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含み、選択的にwildtype tracrRNAの一部の配列を含まないエンジニアリングされたtracrRNAおよび(ii)wildtype crRNAを含む。
【0353】
この時、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。前記wildtype crRNAはwildtype反復配列およびガイド配列を含むことができる。この時、前記wildtype反復配列はSEQ ID NO:312配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記wildtype反復配列とガイド配列はwildtype crRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列]-[ガイド配列]-3')。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとwildtype crRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとwildtype crRNAはlinkerを通じて連結されていてもよい。
【0354】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびwildtype crRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記wildtype crRNAはwildtype反復配列およびガイド配列を含むことができる。この時、前記wildtype反復配列はSEQ ID NO:312配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記wildtype crRNAはwildtype反復配列とガイド配列が5'末端から3'末端方向に順に位置することができる。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとwildtype crRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:301)配列およびwildtype crRNAであるSEQ ID NO:405配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:439)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:304)配列およびwildtype crRNAであるSEQ ID NO:405配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NN-3'(SEQ ID NO:440)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:306)配列およびwildtype crRNAであるSEQ ID NO:405配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:441)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:308)配列およびwildtype crRNAであるSEQ ID NO:405配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NN-3'(SEQ ID NO:442)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0355】
さらに他の一具現例として、エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。
【0356】
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した4個以下のウリジン配列を含むことができる。前記エンジニアリングされたtracrRNAは選択的にwildtype tracrRNAより長さが短いように追加で変形されたものであり得る。例えば、前記エンジニアリングされたtracrRNAはwildtype tracrRNAの一部の配列を含まなくてもよい。前記エンジニアリングされたcrRNAはwildtype crRNAより反復の長さが短いように変形されたり、および/またはwildtype crRNAの3'末端にU-rich tail配列が付加されたりしたものであり得る。
【0357】
一具体例として、前記エンジニアリングされたガイドRNAは、
【0358】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含み、wildtype tracrRNAの一部の配列を含まないエンジニアリングされたtracrRNAおよび(ii)wildtype反復配列、U-rich tail配列を含むエンジニアリングされたcrRNAを含む。
【0359】
この時、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。
【0360】
前記エンジニアリングされたcrRNAはwildtype反復配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記wildtype反復配列はSEQ ID NO:312配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記wildtype反復配列、ガイド配列およびU-rich tail配列はwildtype crRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列]-[ガイド配列]-[U-rich tail配列]-3')。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとエンジニアリングされたcrRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。
【0361】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記エンジニアリングされたcrRNAはSEQ ID NO:312配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAはSEQ ID NO:312配列、ガイド配列およびU-rich tail配列を5'末端から3'末端方向に順に含むことができる。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:301配列およびエンジニアリングされたcrRNAである5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:407)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:443)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:304配列およびエンジニアリングされたcrRNAであるSEQ ID NO:407配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NNUUUU-3'(SEQ ID NO:444)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:306配列およびエンジニアリングされたcrRNAであるSEQ ID NO:407配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:445)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:308配列およびエンジニアリングされたcrRNAであるSEQ ID NO:407配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NNUUUU-3'(SEQ ID NO:446)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:269配列およびエンジニアリングされたcrRNAであるSEQ ID NO:407配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:447)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:270配列およびエンジニアリングされたcrRNAであるSEQ ID NO:407配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:448)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0362】
他の一具体例として、前記エンジニアリングされたガイドRNAは、
【0363】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含み、選択的にwildtype tracrRNAの一部の配列を含まないエンジニアリングされたtracrRNAおよび(ii)wildtype反復配列のうち一部のヌクレオチド配列が削除されたエンジニアリングされたcrRNAを含む。
【0364】
この時、前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。
【0365】
前記エンジニアリングされたcrRNAはwildtype反復配列のうち一部のヌクレオチド配列が削除された配列であり得る。前記エンジニアリングされたcrRNAはwildtype反復配列の一部の配列およびガイド配列を含むことができる。前記エンジニアリングされたcrRNAは選択的にU-rich tail配列をさらに含むことができる。この時、前記wildtype反復配列の一部の配列はSEQ ID NO:312配列の一部の配列であり、SEQ ID NO:312配列の5'末端部一部の配列を含まない配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記wildtype反復配列の一部の配列およびガイド配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[wildtype反復配列の一部の配列]-[ガイド配列]-3')。この時、選択的にU-rich tail配列をさらに含む場合、前記U-rich tail配列は前記エンジニアリングされたcrRNAの3'末端に位置することができる(5'-[wildtype反復配列の一部の配列]-[ガイド配列]-[U-rich tail]-3')。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとエンジニアリングされたcrRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。
【0366】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記エンジニアリングされたcrRNAはSEQ ID NO:312配列の一部の配列およびガイド配列を含むことができる。前記エンジニアリングされたcrRNAは選択的にU-rich tail配列をさらに含むことができる。この時、前記SEQ ID NO:312配列の一部の配列はSEQ ID NO:312配列の5'末端部一部の配列を含まない配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAはSEQ ID NO:312配列の一部の配列およびガイド配列を5'末端から3'末端方向に順に含むことができ、U-rich tail配列をさらに含む場合、前記U-rich tail配列は3'末端に含まれ得る。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUC-3'(SEQ ID NO:305)配列およびエンジニアリングされたcrRNAである5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:411)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:449)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:305配列およびエンジニアリングされたcrRNAである5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:431)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:450)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUC-3'(SEQ ID NO:307)配列およびエンジニアリングされたcrRNAであるSEQ ID NO:431配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCU CUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:451)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAである5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUC-3'(SEQ ID NO:309)配列およびエンジニアリングされたcrRNAであるSEQ ID NO:431配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:452)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0367】
さらに他の一具現例として、次のエンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。
【0368】
前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した4個以下のウリジン配列を含むことができる。前記エンジニアリングされたtracrRNAは選択的にwildtype tracrRNAより長さが短いように追加で変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAはwildtype tracrRNAの一部の配列を含まなくてもよい。
【0369】
本具現例で、前記エンジニアリングされたcrRNAは野生型crRNAの一部のヌクレオチド配列が人為的に変形されたり、wildtype crRNAより長さが短いように変形されたり、および/または3'末端にU-rich tail配列が付加されたものであり得る。
【0370】
一具体例として、前記エンジニアリングされたガイドRNAは
【0371】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含み、選択的にwildtype tracrRNAの一部の配列を含まないエンジニアリングされたtracrRNAおよび(ii)wildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換されたエンジニアリングされたcrRNAを含む。
【0372】
前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換されたものであり得る。前記エンジニアリングされたcrRNAは選択的にwildtype反復配列のうち一部のヌクレオチド配列が削除されたものであり得る。
【0373】
前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列、第7配列およびガイド配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列;およびSEQ ID NO:313~318配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとエンジニアリングされたcrRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。
【0374】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を含むことができる。この時、前記第6配列はSEQ ID NO:408配列またはSEQ ID NO:408配列の一部の配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:408配列のうち5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:412~428配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列およびガイド配列を5'末端から3'末端方向に順に含むことができる。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:301配列およびエンジニアリングされたcrRNAである5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:409)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:453)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:304配列およびエンジニアリングされたcrRNAであるSEQ ID NO:409配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NN-3'(SEQ ID NO:454)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:306配列およびエンジニアリングされたcrRNAである5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:410)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:455)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:308配列およびエンジニアリングされたcrRNAであるSEQ ID NO:410配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NN-3'(SEQ ID NO:456)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:269配列およびエンジニアリングされたcrRNAであるSEQ ID NO:409配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:457)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:270配列およびエンジニアリングされたcrRNAであるSEQ ID NO:410配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO:458)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0375】
他の一具体例として、前記エンジニアリングされたガイドRNAは
【0376】
(i)連続した5個以上のウリジン配列を含まず、連続した4個以下のウリジン配列を含み、選択的にwildtype tracrRNAの一部の配列を含まないエンジニアリングされたtracrRNAおよび(ii)wildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換され、3'末端にU-rich tail配列が付加されたエンジニアリングされたcrRNAを含む。
【0377】
前記エンジニアリングされたtracrRNAは第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列、第2配列、第3配列、第4配列および第5配列は前記エンジニアリングされたtracrRNAの3'末端から5'末端方向に順に位置することができる(5'-[第5配列]-[第4配列]-[第3配列]-[第2配列]-[第1配列]-3')。この時、前記第1配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:2)配列;5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:3)配列;5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:4)配列;5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:5)配列;5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:6)配列;5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO:7)配列;およびSEQ ID NO:2~7配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(V)aで、前記aが0または1でない整数の場合、前記(V)aのそれぞれのVは独立的にA、CまたはGであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。
【0378】
前記エンジニアリングされたcrRNAはwildtype反復配列と比較して少なくとも一つ以上のヌクレオチドが他の配列で置換され、3'末端にU-rich tail配列が付加されたものであり得る。前記エンジニアリングされたcrRNAは選択的にwildtype反復配列のうち一部のヌクレオチド配列が削除されたものであり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記第6配列、第7配列、ガイド配列およびU-rich tail配列は前記エンジニアリングされたcrRNAの5'末端から3'末端方向に順に位置することができる(5'-[第6配列]-[第7配列]-[ガイド配列]-[U-rich tail配列]-3')。この時、前記第6配列は次の配列のうち選択された少なくとも一つの配列であり得る:5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3'(SEQ ID NO:313)配列;5'-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3'(SEQ ID NO:314)配列;5'-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3'(SEQ ID NO:315)配列;5'-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3'(SEQ ID NO:316)配列;5'-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3'(SEQ ID NO:317)配列;5'-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3'(SEQ ID NO:318)配列;およびSEQ ID NO:313~318配列のうち選択された一つの一部の配列。この時、Nはそれぞれ独立的にA、C、GまたはUであり、それぞれのBは独立的にU、CまたはGであり得る。前記aは0~4の整数であり、前記bは0~1の整数であり、前記cは0~2の整数であり、前記dは0~3の整数であり得る。前記(N)a、(N)cまたは(N)dで、前記a、cおよびdが0または1でない整数の場合、前記(N)a、(N)cまたは(N)dのNはそれぞれ独立的にA、C、GまたはUであり得る。前記(B)aで、前記aが0または1でない整数の場合、前記(B)aのそれぞれのBは独立的にU、CまたはGであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-(UaN)dUe-3'配列、5'-UaVUaVUe-3'配列または5'-UaVUaVUaVUe-3'配列であり得る。この時、前記NはA、C、GまたはUであり得、前記それぞれのVは独立的にA、CまたはGであり得る。前記aは0~4の整数であり、前記dは0~3の整数であり、前記eは0~10の整数であり得る。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAであり得る。この時、前記エンジニアリングされたdualガイドRNAはエンジニアリングされたtracrRNAとエンジニアリングされたcrRNAをそれぞれ別個のRNA分子で含むことができる。または前記エンジニアリングされたガイドRNAはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。
【0379】
例えば、前記エンジニアリングされたガイドRNAは以下で説明するエンジニアリングされたtracrRNAおよびエンジニアリングされたcrRNAを含むことができる。前記エンジニアリングされたtracrRNAは以下で説明する第1配列、第2配列、第3配列、第4配列および第5配列を含むことができる。この時、前記第1配列はSEQ ID NO:111配列またはSEQ ID NO:111配列の一部の配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列は前記SEQ ID NO:111配列のうちSEQ ID NO:272配列を含み、かつ3'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:111配列の一部の配列はSEQ ID NO:272~290配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第2配列はSEQ ID NO:211配列またはSEQ ID NO:211配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第3配列はSEQ ID NO:212配列またはSEQ ID NO:212配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記第4配列はSEQ ID NO:213配列、SEQ ID NO:213配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:213配列の一部の配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列は前記SEQ ID NO:213配列で相補的結合を形成する少なくとも一対以上のヌクレオチドおよび/または相補的結合を形成しない少なくとも一つ以上のヌクレオチドが削除された配列であり得る。この時、前記SEQ ID NO:213配列の一部の配列はSEQ ID NO:214~217配列、SEQ ID NO:231~247配列、5'-CCUUAGGUG-3'配列、5'-CUUAGUG-3'配列、5'-CUUAGG-3'配列および5'-UUAG-3'配列で構成された群から選択された一つの配列であり得、この時、前記選択された一つの配列内に含まれた5'-UUAG-3'配列は5'-GAAA-3'配列で置換され得る。この時、前記第5配列はSEQ ID NO:248配列、SEQ ID NO:248配列に少なくとも70%以上の配列同一性を有する配列またはSEQ ID NO:248配列の一部の配列であり得る。この時、前記SEQ ID NO:248配列の一部の配列はSEQ ID NO:248配列の3'末端部で順次的な一部の配列であって、5'-A-3'配列、5'-AA-3'配列、5'-GAA-3'配列、5'-AGAA-3'配列、5'-GAGAA-3'配列、5'-GGAGAA-3'配列、5'-UGGAGAA-3'配列、5'-GUGGAGAA-3'配列、5'-AGUGGAGAA-3'配列およびSEQ ID NO:249~259配列で構成された群から選択された一つの配列であり得る。前記エンジニアリングされたtracrRNAは前記第1配列、第2配列、第3配列、第4配列および第5配列が3'末端から5'末端方向に順に位置することができる。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を含むことができる。この時、前記第6配列はSEQ ID NO:408配列またはSEQ ID NO:408配列の一部の配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:408配列のうち5'-NGNNNUGAAGGA-3'(SEQ ID NO:412)配列を含み、かつ5'末端部の一部の配列を含まない配列であり得る。この時、前記SEQ ID NO:408配列の一部の配列はSEQ ID NO:412~428配列のうち選択された一つの配列であり得る。この時、Nはそれぞれ独立的にA、C、GまたはUであり得る。この時、前記第7配列は5'-AUGCAAC-3'配列または5'-AUGCAAC-3'配列に少なくとも70%以上の配列同一性を有する配列であり得る。この時、前記ガイド配列は15~40個のヌクレオチド配列であり得る。この時、前記U-rich tail配列は5'-UUUU-3'配列、5'-UUUUAUU-3'配列または5'-UUUUAUUUU-3'配列であり得る。前記エンジニアリングされたcrRNAは第6配列、第7配列、ガイド配列およびU-rich tail配列を5'末端から3'末端方向に順に含むことができる。前記エンジニアリングされたガイドRNAはエンジニアリングされたdualガイドRNAまたはエンジニアリングされたsingleガイドRNAであり得る。この時、前記エンジニアリングされたsingleガイドRNAはlinkerをさらに含むことができ、前記エンジニアリングされたtracrRNAとエンジニアリングされたcrRNAはlinkerを通じて連結されていてもよい。一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:301配列およびエンジニアリングされたcrRNAである5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:432)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNC NCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:459)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:304配列およびエンジニアリングされたcrRNAであるSEQ ID NO:432配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NNUUUU-3'(SEQ ID NO:460)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:306配列およびエンジニアリングされたcrRNAである5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:433)配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:461)配列を含むことができる。また、一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:308配列およびエンジニアリングされたcrRNAであるSEQ ID NO:433配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNN NNUUUU-3'(SEQ ID NO:462)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:269配列およびエンジニアリングされたcrRNAであるSEQ ID NO:432配列を含むことができる。他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:463)配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAであるSEQ ID NO:270配列およびエンジニアリングされたcrRNAであるSEQ ID NO:433配列を含むことができる。さらに他の一例として、前記エンジニアリングされたガイドRNAは5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA ACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO:464)配列を含むことができる。この時、前記NはそれぞれA、C、GまたはUであり得る。
【0380】
4.エンジニアリングされたガイドRNAの用途
【0381】
前記エンジニアリングされたガイドRNAはCas12f1(Cas14a1)とともにエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを構成することができる。
【0382】
前記エンジニアリングされたガイドRNAはCas12f1(Cas14a1)タンパク質と結合してエンジニアリングされたCRISPR/Cas12f1複合体(またはCRISPR/Cas14a1複合体)をなすことができる。
【0383】
前記エンジニアリングされたガイドRNAはエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムの標的核酸または標的遺伝子の切断、編集または変形のための用途で使われ得、これをさらに効果的に遂行されるようにすることができる。
【0384】
<Engineered CRISPR/Cas12f1(Cas14a1)system>
本明細書によって開示される他の一態様はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムに関する。前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAおよびCas12f1(Cas14a1)タンパク質が正常に発現しおよび/または正常に作動するようにするすべての形態を含む。前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは標的核酸または標的遺伝子の切断、編集または変形をさらに効果的に遂行されるようにする。特に、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは次のような効果を伴うことができる:
【0385】
ガイドRNA-Cas12f1 protein complexのstability増加;
【0386】
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の切断効率増加;および
【0387】
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の編集または変形効率増加.
【0388】
より具体的には、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは
【0389】
エンジニアリングされたガイドRNAまたはこれを暗号化する核酸;および
【0390】
Cas12f1(Cas14a1)タンパク質またはこれを暗号化する核酸
【0391】
を含む。
【0392】
以下で各構成を詳しく説明する。
【0393】
1.エンジニアリングされたガイドRNA
本明細書によって開示されるエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは標的核酸または標的遺伝子に存在する標的配列を認識するエンジニアリングされたガイドRNAを含む。一般的に一つのエンジニアリングされたガイドRNAは一つの標的配列を認識することができる。前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0394】
また、エンジニアリングされたガイドRNAを暗号化する核酸はエンジニアリングされたガイドRNAを転写するためにエンジニアリングされたガイドRNAを暗号化するDNAであり得る。
【0395】
2.Cas12f1(Cas14a1)protein
Cas12f1タンパク質はCRISPR/Cas12f1(Cas14a1)システムの主なタンパク質構成要素であり、先行研究(Harrington et al.,Science、362、839-842(2018))でCas14と命名されたエフェクタータンパク質のうち一つであり、Cas14a1タンパク質とも呼ばれる。本明細書で、Cas12f1タンパク質はCas14a1タンパク質またはCas12f1(Cas14a1)タンパク質と混用されて使われる。本明細書によって開示されるCas12f1タンパク質は自然界に存在する野生型(wildtype)Cas12f1タンパク質(野生型Cas14a1タンパク質)であり得る。またはCas12f1タンパク質は野生型Cas12f1タンパク質の変異体(variant)であり得、この時、前記変異体は「Cas12f1変異体(Cas12f1 variant)」または「Cas14a1変異体(Cas14a1 variant)」と指称する。前記Cas12f1変異体は野生型Cas12f1タンパク質と同一の機能を有する変異体、機能の一部又は全部が変形された変異体および/または追加的な機能が付加された変異体であり得る。Cas12f1タンパク質の意味は文脈により適切に解釈され得、特別な場合でない限り最も広い意味で解釈される。以下でCas12f1タンパク質について詳しく説明する。
【0396】
2-1)Wildtype Cas12f1(Cas14a1)protein
前記Cas12f1タンパク質は野生型Cas12f1タンパク質であり得る。この時、前記Cas12f1タンパク質は標的核酸または標的遺伝子の二本鎖または一本鎖を切断することができる。前記Cas12f1タンパク質は標的核酸または標的遺伝子内に存在するProtospacer Adjacent Motif(PAM)配列を認識することができる。この時、PAM配列は前記Cas14a1タンパク質により定められる固有の配列である。前記Cas12f1タンパク質のためのPAM配列はT-rich配列であり得る。前記Cas12f1タンパク質のためのPAM配列は5'-TTTR-3'配列であり得る。この時、前記RはAまたはGであり得る。例えば、前記PAM配列は5'-TTTA-3'または5'-TTTG-3'配列であり得る。
【0397】
一具現例として、前記Cas12f1タンパク質はCas14ファミリー(Harrington et al.,Science 362、839-842(2018);US 2020/0172886 A1)から由来したものであり得る。
【0398】
他の一具現例として、前記Cas12f1タンパク質はUncultured archaeon由来のCas14a1タンパク質(Harrington et al.,Science 362、839-842(2018);US 2020/0172886 A1)であり得る。例えば、前記Cas14a1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。
【0399】
【表1】
Cas14a1(Cas12f1)タンパク質
【0400】
2-2)Cas12f1(Cas14a1)variant-Cas12f1(Cas14a1)mutant
前記Cas12f1タンパク質はCas12f1変異体であり得る。前記Cas12f1変異体は野生型Cas12f1タンパク質のアミノ酸配列のうち少なくとも一つ以上のアミノ酸が変形されたものであり得る。この時、前記変形は削除(deletion)および/または置換(substitution)であり得る。この時、前記Cas12f1変異体は「Cas12f1突然変異(Cas12f1 mutant)」または「Cas14a1突然変異(Cas14a1 mutant)」と指称する。
【0401】
一具現例として、前記Cas12f1突然変異は野生型Cas12f1タンパク質のアミノ酸配列のうち少なくとも一つ以上のアミノ酸が削除されたものであり得る。例えば、前記Cas12f1突然変異は野生型Cas12f1タンパク質に含まれたRuvCドメイン内少なくとも一つ以上のアミノ酸が削除されたものであり得る。または前記Cas12f1突然変異は野生型Cas12f1タンパク質に含まれたPAMを認識するドメイン内少なくとも一つ以上のアミノ酸が削除されたものであり得る。または前記Cas12f1突然変異はSEQ ID NO:465アミノ酸配列のうち少なくとも一つ以上のアミノ酸が削除されたものであり得る。
【0402】
他の一具現例として、前記Cas12f1突然変異は野生型Cas12f1タンパク質のアミノ酸配列のうち少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたものであり得る。この時、前記置換は一つのアミノ酸が一つの他のアミノ酸で置換されたものであり得る。または前記置換は一つのアミノ酸が多数個の他のアミノ酸で置換されたものであり得る。または前記置換は多数個のアミノ酸が一つの他のアミノ酸で置換されたものであり得る。または前記置換は多数個のアミノ酸が多数個の他のアミノ酸で置換されたことであり得、この時、置換されるアミノ酸の数と置き換えるアミノ酸の数は互いに同一または異なり得る。例えば、前記Cas12f1突然変異は野生型Cas12f1タンパク質に含まれたRuvCドメイン内少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたものであり得る。または前記Cas12f1突然変異は野生型Cas12f1タンパク質に含まれたPAMを認識するドメイン内少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたものであり得る。または前記Cas12f1突然変異はSEQ ID NO:465アミノ酸配列のうち少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたものであり得る。
【0403】
前記Cas12f1突然変異は野生型Cas12f1タンパク質と同一の機能を有する変異体または機能の一部又は全部が変形された変異体であり得る。例えば、前記Cas12f1突然変異は標的核酸の二本鎖のうち一つの鎖のみ切断するように変更されたものであり得る。または前記Cas12f1突然変異は5'-TTTA-3'または5'-TTTG-3'でない他のPAM配列を認識するように変形されたものであり得る。
【0404】
2-3)Cas12f1(Cas14a1)variant-Cas12f1(Cas14a1)fusion protein
前記Cas12f1タンパク質はCas12f1変異体であり得る。前記Cas12f1変異体は野生型Cas12f1タンパク質またはCas12f1突然変異に追加的な機能を有するドメイン、ペプチドまたはタンパク質が付加された変異体であり得る。この時、前記追加的な機能を有するドメイン、ペプチドまたはタンパク質が付加された変異体は「Cas12f1融合タンパク質」または「Cas14a1融合タンパク質」と指称される。前記追加的な機能を有するドメイン、ペプチドまたはタンパク質は野生型Cas12f1タンパク質またはCas12f1突然変異のN末端、C末端および/またはアミノ酸配列内に付加され得る。前記追加的な機能を有するドメイン、ペプチドまたはタンパク質は野生型Cas12f1タンパク質と同一または異なる機能を有するドメイン、ペプチドまたはタンパク質であり得る。例えば、前記追加的な機能を有するドメイン、ペプチドまたはタンパク質はメチラーゼ(methylase)活性、デメチラーゼ(demethylase)活性、転写促進(transcription activation)活性、転写阻害(transcription repression)活性、転写放出因子(transcription release factor)活性、ヒストン変形(histone modification)活性、RNA切断(cleavage)活性または核酸結合(nucleic acid binding)活性を有するドメイン、ペプチドまたはタンパク質であり得、またはタンパク質(ペプチド含む)の分離精製のためのタグ(tag)またはレポータータンパク質であり得るが、これに制限されない。または前記追加的な機能を有するドメイン、ペプチドまたはタンパク質は逆転写酵素(reverse transcriptase)またはデアミナーゼ(deaminase)であり得る。
【0405】
一具現例として、前記Cas12f1融合タンパク質は野生型Cas12f1タンパク質およびデアミナーゼを含むことができる。この時、前記デアミナーゼはシトシンデアミナーゼ(cytosine deaminase)、シチジンデアミナーゼ(cytidine deaminase)またはアデニンデアミナーゼ(adenine deaminase)であり得る。この時、前記Cas12f1融合タンパク質は選択的に追加的な機能を有するドメイン、ペプチドまたはタンパク質をさらに含むことができる。一具体例として、前記Cas12f1融合タンパク質はSEQ ID NO:466アミノ酸配列またはSEQ ID NO:467アミノ酸配列であり得る。他の一具体例として、前記Cas12f1融合タンパク質はSEQ ID NO:468アミノ酸配列またはSEQ ID NO:469アミノ酸配列であり得る。
【0406】
他の一具現例として、前記Cas12f1融合タンパク質は野生型Cas12f1タンパク質および逆転写酵素(reverse transcriptase)を含むことができる。この時、前記逆転写酵素はMoloney Murine Leukemia Virus(M-MLV)逆転写酵素またはこの変異体であり得る。この時、前記Cas12f1融合タンパク質は選択的に追加的な機能を有するドメイン、ペプチドまたはタンパク質をさらに含むことができる。一具体例として、前記Cas12f1融合タンパク質はSEQ ID NO:470アミノ酸配列であり得る。
【0407】
前記Cas12f1融合タンパク質は野生型Cas12f1タンパク質と同一の機能および追加的な機能を有する変異体であり得る。または前記Cas12f1融合タンパク質は野生型Cas12f1タンパク質の機能の一部又は全部の変形および追加的な機能を有する変異体であり得る。例えば、前記Cas12f1融合タンパク質は標的核酸の二本鎖のうち一つの鎖のみ切断することができ、切断しない鎖に対してベースエディティング(Base editing)またはプライムエディティング(Prime editing)ができるように変更されたものであり得る。この時、前記Cas12f1融合タンパク質はCas12f1突然変異およびデアミナーゼを含むことができ、この場合、前記ベースエディティングはデアミナーゼによるものであり得る。または前記Cas12f1融合タンパク質はCas12f1突然変異および逆転写酵素を含むことができ、この場合、前記プライムエディティングは逆転写酵素によるものであり得る。
【0408】
2-4)Cas2f1(Cas14a1)variantが含むその他付加要素
【0409】
前記Cas12f1タンパク質はCas12f1変異体であり得る。前記Cas12f1変異体は野生型Cas12f1タンパク質、Cas12f1突然変異またはCas12f1融合タンパク質に選択的にNLS(Nuclear Localization Sequence)またはNES(Nuclear Export Sequence)がさらに含まれたものであり得る。前記NLSおよびNESは細胞内または外でCas12f1タンパク質の位置決定のためのシグナルペプチドであって、通常の技術者が認識できる意味をすべて含み、文脈により適切に解釈され得る。例えば、前記NLSはアミノ酸配列PKKKRKV(SEQ ID NO:471)を有するSV40ウイルス大型T-抗原のNLS;ヌクレオプラスミン(nucleoplasmin)からのNLS(例えば、配列KRPAATKKAGQAKKKK(SEQ ID NO:472)を有するヌクレオプラスミンの二分(bipartite)NLS);アミノ酸配列PAAKRVKLD(SEQ ID NO:473)またはRQRRNELKRSP(SEQ ID NO:474)を有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:475)を有するhRNPA1 M9 NLS;インポーチン-アルファからのIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:476);マイオマ(myoma)Tタンパク質の配列VSRKRPRP(SEQ ID NO:477)およびPPKKARED(SEQ ID NO:478);ヒトp53の配列PQPKKKPL(SEQ ID NO:479);マウスc-abl IVの配列SALIKKKKKMAP(SEQ ID NO:480);インフルエンザウイルスNS1の配列DRLRR(SEQ ID NO:481)およびPKQKKRK(SEQ ID NO:482);肝炎ウイルスデルタ抗原の配列RKLKKKIKKL(SEQ ID NO:483);マウスMx1タンパク質の配列REKKKFLKRR(SEQ ID NO:484);ヒトポリ(ADP-リボース)重合酵素の配列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:485);またはステロイドホルモン受容体(ヒト)グルココルチコイドの配列RKCLQAGMNLEARKTKK(SEQ ID NO:486)から由来したNLS配列であり得るが、これに制限されない。
【0410】
例えば、前記Cas12f1変異体は野生型Cas12f1タンパク質にNLSが付加されたものであり得る。一具体例において、前記Cas12f1変異体はSEQ ID NO:738アミノ酸配列であり得る(PKKKRKVGIHGVPAAMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKL RGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTT KSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQT SYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPI TILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYF NFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEPKRPAATKKAGQAKKKK(SEQ ID NO:738))。
【0411】
また、前記Cas12f1変異体は野生型Cas12f1タンパク質、Cas12f1突然変異またはCas12f1融合タンパク質に選択的にタグがさらに含まれたものであり得る。前記タグはCas12f1タンパク質の分離精製および/または追跡のための機能的ドメイン、ペプチドまたはタンパク質で、前記の用語の定義のうち「タグ」セクションに例示されたもののうち一つであり得るが、これに制限されない。
【0412】
2-5)Nucleic acid encoding Cas12f1(Cas14a1)protein
【0413】
Cas12f1タンパク質を暗号化する核酸は野生型Cas12f1タンパク質を暗号化する核酸またはCas12f1変異体を暗号化する核酸であり得る。前記Cas12f1タンパク質を暗号化する核酸はCas12f1タンパク質を導入しようとする対象に合わせてコドン最適化(codon optimization)されたものであり得る。
【0414】
「コドン最適化」は固有配列の少なくとも一つのコドンを対象細胞の遺伝子にさらに頻繁にまたは最も頻繁に使われるコドンに代替しながら、固有アミノ酸配列を維持することによって関心対象細胞での発現の増進のために核酸配列を変形させる過程を意味する。多様な種は特定アミノ酸の特定コドンに対する特定偏向を有し、コドン偏向(有機体間のコドン使用の差)はたびたびmRNAの翻訳の効率と相互関連され、これは翻訳されるコドンの特性および特定tRNA分子の利用可能性によって左右されるものと思われる。細胞で選択されたtRNAの優勢は一般的にペプチド合成に最も頻繁に使われるコドンを反映したものである。したがって、遺伝子はコドン最適化に基づいて与えられた有機体で最適な遺伝子発現のためにカスタマイズされ得る。
【0415】
一具現例として、前記Cas12f1タンパク質を暗号化する核酸はヒトコドン最適化されたCas12f1タンパク質を暗号化する核酸であり得る。例えば、前記ヒトコドン最適化されたCas12f1タンパク質を暗号化する核酸はSEQ ID NO:487配列であり得る。
【0416】
【表2】
ヒトコドン最適化されたCas12f1タンパク質を暗号化する核酸
【0417】
3.Engineered guide RNA-Cas12f1(Cas14a1)protein(s)complex(CRISPR complex)
本明細書によって開示されるエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはCRISPR complex形態で提供され得る。前記CRISPR complexはエンジニアリングされたガイドRNAおよびCas12f1タンパク質を含む。この時、前記CRISPR complexはエンジニアリングされたガイドRNAおよび二つのCas12f1タンパク質を含む(Satoru N.Takeda et al.,Molecular Cell、81、1-13、(2021))。前記CRISPR complexはエンジニアリングされたガイドRNAとCas12f1タンパク質の間の相互作用によって形成されたribonucleoprotein(RNP)であり得る。この時、前記CRISPR complexはエンジニアリングされたガイドRNAと一つのCas12f1タンパク質の間の相互作用によって形成されたribonucleoprotein(RNP)またはエンジニアリングされたガイドRNAと二つのCas12f1タンパク質の間の相互作用によって形成されたRNPであり得る(Satoru N.Takeda et al.,Molecular Cell、81、1-13、(2021))。前記CRISPR complexは「エンジニアリングされたガイドRNA-Cas12f1(Cas14a1)タンパク質複合体」、「エンジニアリングされたCRISPR/Cas12f1複合体」または「エンジニアリングされたCRISPR/Cas14a1複合体」と指称され、前記用語は本明細書で混用されて使われる。以下の例示に含まれた構成要素の具体的な説明は前記にて該当構成要素について記載した通りである。以下の例示は単純例示であり、これに制限されない。
【0418】
一具現例として、前記CRISPR complexは野生型Cas12f1タンパク質およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記CRISPR complexは二つの野生型Cas12f1タンパク質およびエンジニアリングされたガイドRNAを含むことができる。この時、前記野生型Cas12f1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。この時、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含み、この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものまたは連続した5個以上のウリジン配列を含まず、wildtype tracrRNAより長さが短いように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない配列であり得る。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まず、かつwildtype tracrRNAの5'末端に位置した1~24個のヌクレオチド配列および/またはwildtype tracrRNAの3'末端に位置した1~28個のヌクレオチド配列を含まない配列であり得る。この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。
【0419】
一具体例として、前記CRISPR complexは野生型Cas12f1タンパク質およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記CRISPR complexは二つの野生型Cas12f1タンパク質およびエンジニアリングされたガイドRNAを含むことができる。この時、前記野生型Cas12f1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。この時、前記エンジニアリングされたガイドRNAは前記「3-3)エンジニアリングされたガイドRNAの例示」セクションに記載された例示のうち一つであり得る。
【0420】
他の一具現例として、前記CRISPR complexはCas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記CRISPR complexは二つのCas12f1変異体およびエンジニアリングされたガイドRNAを含むことができる。この時、前記Cas12f1変異体はCas12f1突然変異またはCas12f1融合タンパク質であり得る。この時、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含み、この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものまたは連続した5個以上のウリジン配列を含まず、wildtype tracrRNAより長さが短いように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない配列であり得る。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まず、かつwildtype tracrRNAの5'末端に位置した1~24個のヌクレオチド配列および/またはwildtype tracrRNAの3'末端に位置した1~28個のヌクレオチド配列を含まない配列であり得る。この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。
【0421】
一具体例として、前記CRISPR complexはCas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記CRISPR complexは二つのCas12f1変異体およびエンジニアリングされたガイドRNAを含むことができる。この時、前記Cas12f1変異体はSEQ ID NO:465アミノ酸配列のうち少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたCas14a1突然変異であり得る。この時、前記二つのCas12f1変異体は同一または異なり得る。この時、前記エンジニアリングされたガイドRNAは前記「3-3)エンジニアリングされたガイドRNAの例示」セクションに記載された例示のうち一つであり得る。
【0422】
他の一具体例として、前記CRISPR complexはCas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記CRISPR complexは二つのCas12f1変異体およびエンジニアリングされたガイドRNAを含むことができる。この時、前記Cas12f1変異体は野生型Cas12f1タンパク質またはCas12f1突然変異に追加的な機能を有するドメイン、ペプチドまたはタンパク質が付加されたCas12f1融合タンパク質であり得る。前記Cas12f1融合タンパク質はSEQ ID NO:466アミノ酸配列、SEQ ID NO:467アミノ酸配列、SEQ ID NO:468アミノ酸配列、SEQ ID NO:469アミノ酸配列またはSEQ ID NO:470アミノ酸配列を有するタンパク質であり得る。この時、前記二つのCas12f1変異体は同一または異なり得る。この時、前記エンジニアリングされたガイドRNAは前記「3-3)エンジニアリングされたガイドRNAの例示」セクションに記載された例示のうち一つであり得る。
【0423】
さらに他の一具現例として、前記CRISPR complexは野生型Cas12f1タンパク質、Cas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記野生型Cas12f1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。この時、前記Cas12f1変異体はCas12f1突然変異またはCas12f1融合タンパク質であり得る。この時、前記エンジニアリングされたガイドRNAはエンジニアリングされたtracrRNAおよびcrRNAを含み、この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まないように変形されたものまたは連続した5個以上のウリジン配列を含まず、wildtype tracrRNAより長さが短いように変形されたものであり得る。この時、前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まない配列であり得る。または前記エンジニアリングされたtracrRNAは連続した5個以上のウリジン配列を含まず、かつwildtype tracrRNAの5'末端に位置した1~24個のヌクレオチド配列および/またはwildtype tracrRNAの3'末端に位置した1~28個のヌクレオチド配列を含まない配列であり得る。この時、前記crRNAはwildtype crRNAまたはエンジニアリングされたcrRNAであり得る。
【0424】
一具体例として、前記CRISPR complexは野生型Cas12f1タンパク質、Cas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記野生型Cas12f1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。この時、前記Cas12f1変異体はSEQ ID NO:465アミノ酸配列のうち少なくとも一つ以上のアミノ酸が他のアミノ酸で置換されたCas12f1突然変異であり得る。この時、前記エンジニアリングされたガイドRNAは前記「3-3)エンジニアリングされたガイドRNAの例示」セクションに記載された例示のうち一つであり得る。
【0425】
他の一具体例として、前記CRISPR complexは野生型Cas12f1タンパク質、Cas12f1変異体およびエンジニアリングされたガイドRNAが結合して形成されたRNPであり得る。この時、前記野生型Cas12f1タンパク質はSEQ ID NO:465アミノ酸配列であり得る。この時、前記Cas12f1変異体は野生型Cas12f1タンパク質またはCas12f1突然変異に追加的な機能を有するドメイン、ペプチドまたはタンパク質が付加されたCas12f1融合タンパク質であり得る。前記Cas12f1融合タンパク質はSEQ ID NO:466アミノ酸配列、SEQ ID NO:467アミノ酸配列、SEQ ID NO:468アミノ酸配列、SEQ ID NO:469アミノ酸配列またはSEQ ID NO:470アミノ酸配列を有するタンパク質であり得る。この時、前記エンジニアリングされたガイドRNAは前記「3-3)エンジニアリングされたガイドRNAの例示」セクションに記載された例示のうち一つであり得る。
【0426】
4.エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムの用途
前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは標的核酸または標的遺伝子の切断、編集または変形のための用途で使うことができ、これをさらに効果的に遂行されるようにすることができる。
【0427】
一具現例として、前記用途はエンジニアリングされたCRISPR/Cas14a1複合体が対象細胞内で標的核酸または標的遺伝子と接触することを含むことができる。
【0428】
他の一具現例として、前記用途はエンジニアリングされたCRISPR/Cas14a1複合体が対象細胞内で標的核酸または標的遺伝子と接触するように誘導することを含むことができる。この時、前記誘導は前記エンジニアリングされたCRISPR/Cas14a1複合体が細胞内で標的核酸と接触するようにする方法であれば特に制限されない。例えば、前記誘導はエンジニアリングされたガイドRNAまたはこれを暗号化する核酸、およびCas14a1タンパク質またはこれを暗号化する核酸を細胞内に送達するものであり得る。
【0429】
<Modification of target using engineered CRISPR/Cas12f1(Cas14a1)system>
本明細書によって開示されるさらに他の一態様はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した標的の変形に関する。より具体的には、前記態様はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物およびこれを利用した方法によって標的核酸または標的遺伝子を変形させることに関する。前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物およびこれを利用した方法は標的核酸または標的遺伝子の切断、編集または変形をさらに効果的に遂行されるようにする。特に、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物の利用は次のような効果を伴うことができる:
ガイドRNA-Cas12f1 protein complexのstability増加;
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の切断効率増加;および
CRISPR/Cas12f1(Cas14a1)システムによる標的核酸の編集または変形効率増加.
【0430】
以下で、組成物およびこれを利用した方法について詳しく説明する。
【0431】
1.Composition
本明細書で開示する組成物はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含むことができる。前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは前述した「<エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0432】
より具体的には、前記組成物は
【0433】
エンジニアリングされたガイドRNAまたはこれを暗号化する核酸;および
【0434】
Cas12f1(Cas14a1)タンパク質またはこれを暗号化する核酸
【0435】
を含むことができる。
【0436】
この時、前記組成物は選択的に一つ以上のエンジニアリングされたガイドRNAまたはこれを暗号化する核酸をさらに含むことができる。この場合、前記組成物は多数のエンジニアリングされたガイドRNAを含むことができ、多数のエンジニアリングされたガイドRNAはそれぞれ互いに異なる標的配列を認識することができる。
【0437】
この時、前記組成物は選択的に一つ以上のCas12f1(Cas14a1)タンパク質またはこれを暗号化する核酸をさらに含むことができる。この場合、前記組成物は互いに異なるアミノ酸配列を有する二以上のCas12f1(Cas14a1)タンパク質を含むことができる。この時、前記互いに異なるアミノ酸配列を有する二以上のCas12f1(Cas14a1)タンパク質は野生型Cas12f1(Cas14a1)タンパク質およびCas14a1変異体であり得る。
【0438】
前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記Cas12f1(Cas14a1)タンパク質は前述した「2.Cas12f1(Cas14a1)protein」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0439】
前記組成物は核酸形態であり得る。または前記組成物は核酸およびタンパク質が混合された形態であり得る。以下で組成物の形態について詳しく説明する。
【0440】
1-1)核酸形態
前記組成物は核酸形態であり得る。前記核酸形態はDNA、RNAまたはこの混合形態であり得る。前記核酸形態はベクター形態であり得る。この時、前記ベクターはウイルスベクターまたは非ウイルスベクターであり得る。
【0441】
また、前記核酸の形態は円形または線形であり得る。
【0442】
また、前記核酸の形態は二本鎖または一本鎖であり得る。
【0443】
a)Viral vector
前記組成物はウイルスベクター形態であり得る。例えば、前記ウイルスベクターはレトロウイルスベクター(retroviral(retrovirus)vector)、レンチウイルスベクター(lentiviral(lentivirus)vector)、アデノウイルスベクター(adenoviral(adenovirus vector)、アデノ-関連ウイルスベクター(adeno-associated viral(adeno-associated virus;AAV)vector)、ワクシニアウイルスベクター(vaccinia viral(vaccinia virus)vector)、ポックスウイルスベクター(poxviral(poxvirus)vector)および単純ヘルペスウイルスベクター(herpes simplex viral(herpes simplex virus)vector)で構成された群から選択される一つ以上のウイルスベクターであり得る。
【0444】
一具現例として、前記組成物はウイルスベクター形態であり得る。すなわち、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1(Cas14a1)タンパク質を暗号化する核酸をウイルスベクター形態で含むことができる。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含む第1ウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含む第2ウイルスベクターを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含むウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含むアデノ-関連ウイルスベクターを含むことができる。
【0445】
他の具現例として、前記組成物が多数個のエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含む場合、前記組成物は多数個のエンジニアリングされたガイドRNAを暗号化する核酸をすべて含む第1ウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含む第2ウイルスベクターを含むことができる。または前記組成物は多数個のエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む一つのウイルスベクター形態であり得る。または前記組成物は一つのエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含むウイルスベクターが多数個(エンジニアリングされたガイドRNAの数だけ)で含まれ得る。
【0446】
さらに他の具現例として、前記組成物がエンジニアリングされたガイドRNAを暗号化する核酸および二以上のCas12f1タンパク質(例えば、第1 Cas12f1タンパク質および第2 Cas12f1タンパク質)を暗号化する核酸を含む場合、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含む第1ウイルスベクター、第1 Cas12f1タンパク質を暗号化する核酸を含む第2ウイルスベクターおよび第2 Cas12f1タンパク質を暗号化する核酸を含む第3ウイルスベクターを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸および二以上のCas12f1タンパク質(例えば、第1 Cas12f1タンパク質および第2 Cas12f1タンパク質)を暗号化する核酸をすべて含む一つのウイルスベクター形態であり得る。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸および第1 Cas12f1タンパク質を暗号化する核酸を含む第1ウイルスベクターおよび第2 Cas12f1タンパク質を暗号化する核酸を含む第2ウイルスベクターを含むことができる。
【0447】
b)Non-viral vector
前記組成物は非ウイルスベクター形態であり得る。この場合、前記組成物のエンジニアリングされたガイドRNAはRNA形態またはこれを暗号化する核酸形態であり得る。
【0448】
前記非ウイルスベクターはプラスミド、ファージ、ネイキッドDNA、DNA複合体、mRNA(転写物)またはPCRアンプリコン(amplicon)であり得るが、これに制限されるものではない。例えば、前記プラスミドはpcDNAシリーズ、pSC101、pGV1106、pACYC177、ColE1、pKT230、pME290、pBR322、pUC8/9、pUC6、pBD9、pHC79、pIJ61、pLAFR1、pHV14、pGEXシリーズ、pETシリーズ、およびpUC19からなる群から選択されたものであり得る。例えば、前記ファージはλgt4λB、λ-Charon、λΔz1、およびM13からなる群から選択されたものであり得る。
【0449】
一具現例として、前記組成物は非ウイルスベクター形態であり得る。すなわち、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を非ウイルスベクター形態で含むことができる。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含む第1非ウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含む第2非ウイルスベクターを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む非ウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含むプラスミドを含むことができる。他の一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化するmRNAを含むことができる。さらに他の具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化する核酸を含むネイキッドDNAを含むことができる。
【0450】
他の具現例として、前記組成物は非ウイルスベクター形態であり得る。すなわち、前記組成物はエンジニアリングされたガイドRNAおよびCas12f1タンパク質を暗号化する核酸を非ウイルスベクター形態で含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化するmRNAを含むことができる。他の一具体例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化する核酸を含むプラスミドを含むことができる。
【0451】
c)ウイルスベクターおよび非ウイルスベクター混合
前記組成物はウイルスベクターおよび非ウイルスベクター混合形態であり得る。前記ウイルスベクターおよび非ウイルスベクターに関する説明は前記の通りである。この場合、前記組成物のエンジニアリングされたガイドRNAはRNA形態またはこれを暗号化する核酸形態であり得る。
【0452】
一具現例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含む非ウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むアデノ-関連ウイルスベクターおよびCas12f1タンパク質を暗号化するmRNAを含むことができる。他の一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むレンチウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含むプラスミドを含むことができる。
【0453】
他の一具現例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含む非ウイルスベクターおよびCas12f1タンパク質を暗号化する核酸を含むウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化する核酸を含むアデノ-関連ウイルスベクターを含むことができる。他の一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むプラスミドおよびCas12f1タンパク質を暗号化する核酸を含むレンチウイルスベクターを含むことができる。
【0454】
さらに他の一具現例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化する核酸を含むウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化する核酸を含むアデノ-関連ウイルスベクターを含むことができる。
【0455】
他の一具現例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化する核酸を含む非ウイルスベクターを含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化するmRNAを含むことができる。他の具体例として、前記組成物はエンジニアリングされたガイドRNA、およびCas12f1タンパク質を暗号化する核酸を含むプラスミドを含むことができる。
【0456】
d)その他-ベクターの追加構成
前述したベクターは選択的に調節/制御構成要素、プロモーターおよび/または付加発現要素をさらに含むことができる。
【0457】
<調節/制御構成要素>
前記ベクターは選択的に調節/制御構成要素を含むことができる。この時、前記調節/制御構成要素はベクターに含まれた各構成要素を暗号化する配列(すなわち、エンジニアリングされたガイドRNAを暗号化する核酸および/またはCas12f1タンパク質を暗号化する核酸)に作動可能に連結され得る。前記調節/制御構成要素はエンハンサー、イントロン、終結信号、ポリアデニル化信号、コザック共通(Kozak consensus)配列、内部リボソーム流入部位(IRES、Internal Ribosome Entry Site)、スプライスアクセプター、2A配列および/または複製起点(replication origin)であり得るが、これに制限されるものではない。この時、前記複製起点はf1複製起点、SV40複製起点、pMB1複製起点、アデノ複製起点、AAV複製起点、および/またはBBV複製起点であり得るが、これに制限されるものではない。
【0458】
<プロモーター>
前記ベクターは選択的にプロモーターを含むことができる。この時、前記プロモーターはベクターに含まれた各構成要素を暗号化する配列(すなわち、エンジニアリングされたガイドRNAを暗号化する核酸および/またはCas12f1タンパク質を暗号化する核酸)に作動可能に連結され得る。前記プロモーターはベクターに含まれた各構成要素を暗号化する配列(すなわち、エンジニアリングされたガイドRNAを暗号化する核酸および/またはCas12f1タンパク質を暗号化する核酸)を適切に発現させ得るものであれば制限されない。一具現例として、前記プロモーター配列はRNA重合酵素(例えば、pol I、pol II、またはpol III)の転写を促進させるプロモーターであり得る。例えば、前記プロモーターはSV40初期プロモーター、mouse mammary tumor virus long terminal repeat(LTR)プロモーター、adenovirus major lateプロモーター(Ad MLP)、herpes simplex virus(HSV)プロモーター、CMV immediate early promoter region(CMVIE)のようなcytomegalovirus(CMV)プロモーター、rous sarcoma virus(RSV)プロモーター、CBAプロモーター、human U6 small nuclearプロモーター(U6)(Miyagishi et al.,Nature Biotechnology 20、497-500(2002))、enhanced U6プロモーター(e.g.,Xia et al.,Nucleic Acids Res.2003 Sep 1;31(17))、7SKプロモーターおよびhuman H1プロモーター(H1)のうち一つであり得るが、これに制限されるものではない。
【0459】
<付加発現要素>
前記ベクターは選択的に付加発現要素を含むことができる。前記ベクターはエンジニアリングされたガイドRNAを暗号化する核酸および/またはCas12f1タンパク質を暗号化する核酸の他に通常の技術者が必要によって発現させようとする付加発現要素を暗号化する核酸配列を含んでいてもよい。例えば、前記付加発現要素は、前記の用語の定義のうち「タグ」セクションで説明されたタグのうち一つであり得るが、これに制限されるものではない。例えば、前記付加発現要素は、グリホサート(glyphosate)、グルホシネートアンモニウム(glufosinate ammonium)またはホスフィノトリシン(phosphinothricin)のような除草剤抵抗性遺伝子;またはアンピシリン(ampicillin)、カナマイシン(kanamycin)、G418、ブレオマイシン(Bleomycin)、ハイグロマイシン(hygromycin)またはクロラムフェニコール(chloramphenicol)のような抗生剤耐性遺伝子であり得るが、これに制限されるものではない。
【0460】
1-2)核酸およびタンパク質の混合形態
前記組成物は核酸およびタンパク質の混合形態であり得る。この時、前記核酸は前記「1-1)核酸形態」に記載した通りである。この場合、前記組成物はCas12f1タンパク質を含む。この時、前記組成物は二つのCas12f1タンパク質を含むことができ、前記二つのCas12f1タンパク質は同一のアミノ酸配列を有するCas12f1タンパク質または互いに異なるアミノ酸配列を有するCas12f1タンパク質であり得る。
【0461】
一具現例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むウイルスベクターおよびCas12f1タンパク質を含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むアデノ-関連ウイルスベクターおよびCas12f1タンパク質を含むことができる。
【0462】
他の一具現例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含む非ウイルスベクターおよびCas12f1タンパク質を含むことができる。一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むプラスミドおよびCas12f1タンパク質を含むことができる。他の一具体例として、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を含むことができる。
【0463】
さらに他の一具現例として、前記組成物はエンジニアリングされたガイドRNAおよびCas12f1タンパク質を含むことができる。この場合、前記組成物はエンジニアリングされたCRISPR/Cas12f1複合体の形態であるRNP形態であり得る。もし多数のエンジニアリングされたガイドRNAおよびCas12f1タンパク質を含む組成物の場合、前記組成物は多数個のエンジニアリングされたCRISPR/Cas12f1複合体を含むことができ、多数個のエンジニアリングされたCRISPR/Cas12f1複合体はそれぞれ互いに異なる標的配列を認知することができる。
【0464】
1-3)Compositionの用途
前記組成物はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した標的核酸または標的遺伝子の切断、編集または変形のための用途で使うことができ、これをさらに効果的に遂行されるようにすることができる。
【0465】
2.Method for modifying a target usingエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム
本明細書で開示する方法はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを利用した方法に関する。より具体的には、前記方法はエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを含む組成物を対象体および/または対象細胞に導入(または送達)して対象体および/または対象細胞内に存在する標的核酸または標的遺伝子を変形させる方法に関する。または前記方法はエンジニアリングされたガイドRNAを対象体および/または対象細胞に導入(または送達)して対象体および/または対象細胞内に存在する標的核酸または標的遺伝子を標的する方法に関する。この時、対象体は植物、動物またはこれの一部組織であり、前記動物はヒトまたは非ヒト動物であり得る。この時、対象細胞は原核細胞または真核細胞であり得る。この時、前記真核細胞は酵母(yeast)、植物細胞、動物細胞、および/またはヒト細胞であり得るが、これに制限されない。前記方法はin vitro、ex vivoまたは生体内(in vivo)で遂行され得る。この時、前記生体内はヒト生体内または非ヒト動物生体内であり得る。
【0466】
前記方法はエンジニアリングされたガイドRNAまたはエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを対象体および/または対象細胞に導入(または送達、処理)することを含む方法であり得る。前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは前述した「<エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0467】
以下で、前記方法の具現例を利用して詳しく説明する。
【0468】
2-1)Method例示(1)
一具現例として、前記方法は真核細胞に組成物を処理することを含む標的核酸または標的遺伝子を変形させる方法であり得る。
【0469】
この時、前記組成物は
エンジニアリングされたガイドRNAまたはこれを暗号化する核酸;および
Cas12f1タンパク質またはこれを暗号化する核酸
を含むことができる。
【0470】
前記組成物は前述した「1.Composition」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記Cas12f1タンパク質は前述した<エンジニアリングされたCRISPR/Cas14a1システム>中の「2.Cas12f1(Cas14a1)protein」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0471】
前記組成物はウイルスベクター、非ウイルスベクターまたはこの混合形態であり得る。または前記組成物は核酸およびタンパク質の混合形態であり得る。前記ウイルスベクター、非ウイルスベクターまたはこの混合形態は前述した「1-1)核酸形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記核酸およびタンパク質の混合形態は前述した「1-2)核酸およびタンパク質の混合形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0472】
一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含むウイルスベクター形態であり得る。この時、前記ウイルスベクターはレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ-関連ウイルスベクター、ワクシニアウイルスベクター、ポックスウイルスベクターおよび単純ヘルペスウイルスベクターで構成された群から選択される一つ以上であり得る。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む一つのウイルスベクターを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をそれぞれ含む二つのウイルスベクターを含むことができる。
【0473】
他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含む非ウイルスベクター形態であり得る。この時、前記非ウイルスベクターはプラスミドであり得る。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む一つのプラスミドを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をそれぞれ含む二つのプラスミドを含むことができる。
【0474】
さらに他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化するmRNAを含むことができる。
【0475】
さらに他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を含むことができる。または前記組成物はエンジニアリングされたガイドRNAおよびCas12f1タンパク質が結合したエンジニアリングされたCRISPR/Cas12f1(Cas14a1)複合体を含むことができる。
【0476】
前記真核細胞は標的核酸または標的遺伝子を含むことができる。前記真核細胞は酵母(yeast)、植物細胞、動物細胞、および/またはヒト細胞であり得るが、これに制限されない。
【0477】
前記真核細胞に組成物を処理することは真核細胞でエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムが導入されるためのものであり得る。または前記真核細胞に組成物を処理することは真核細胞に存在する標的核酸または標的遺伝子にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを接触させるためのものであり得る。
【0478】
前記真核細胞に組成物を処理することは電気穿孔法、遺伝子銃、超音波穿孔法、磁気注入法(magnetofection)、ナノパーティクル方法および/または一時的な細胞圧縮またはスクイージング方法を利用したものであり得る。または前記真核細胞に組成物を処理することは陽イオンリポソーム法、酢酸リチウム-DMSO、脂質-媒介形質感染(transfection)、燐酸カルシウム沈殿法(precipitation)、lipofection、PEI(Polyethyleneimine)-媒介形質感染、DEAE-dextran媒介形質感染、および/またはナノパーティクル-媒介核酸送達(Panyam et al.,Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023参照)を利用したものであり得るが、これに制限されるものではない。
【0479】
前記方法は選択的に真核細胞を培養することをさらに含むことができる。この場合、前記培養は組成物を処理した後に真核細胞を培養するものであり得る。
【0480】
2-2.Method例示(2)
他の一具現例として、前記方法は真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することを含む標的核酸または標的遺伝子を変形させる方法であり得る。
【0481】
この時、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは
エンジニアリングされたガイドRNAまたはこれを暗号化する核酸;および
Cas12f1タンパク質またはこれを暗号化する核酸
を含むことができる。
【0482】
前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは前述した「<エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システム>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0483】
前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはウイルスベクター、非ウイルスベクターまたはこの混合形態であり得る。または前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムは核酸およびタンパク質の混合形態であり得る。前記ウイルスベクター、非ウイルスベクターまたはこの混合形態は前述した「1-1)核酸形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記核酸およびタンパク質の混合形態は前述した「1-2)核酸およびタンパク質の混合形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0484】
一具体例において、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化するmRNAを含むことができる。
【0485】
他の一具体例において、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を含むことができる。
【0486】
さらに他の一具体例において、前記エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムはエンジニアリングされたガイドRNAおよびCas12f1タンパク質が結合したエンジニアリングされたCRISPR/Cas12f1(Cas14a1)複合体を含むことができる。
【0487】
前記真核細胞は標的核酸または標的遺伝子を含むことができる。前記真核細胞は酵母(yeast)、植物細胞、動物細胞、および/またはヒト細胞であり得るが、これに制限されない。
【0488】
前記真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することは真核細胞でエンジニアリングされたCRISPR/Cas12f1(Cas14a1)複合体を形成するためのものであり得る。または前記真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することは真核細胞に存在する標的核酸または標的遺伝子にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)複合体を接触させるためのものであり得る。
【0489】
前記真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することは電気穿孔法、遺伝子銃、超音波穿孔法、磁気注入法(magnetofection)、ナノパーティクル方法および/または一時的な細胞圧縮またはスクイージング方法を利用したものであり得る。または前記真核細胞に組成物を処理することは陽イオンリポソーム法、酢酸リチウム-DMSO、脂質-媒介形質感染(transfection)、燐酸カルシウム沈殿法(precipitation)、lipofection、PEI(Polyethyleneimine)-媒介形質感染、DEAE-dextran媒介形質感染、および/またはナノパーティクル-媒介核酸送達(Panyam et al.,Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023参照)を利用したものであり得るが、これに制限されるものではない。
【0490】
前記真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することはエンジニアリングされたガイドRNAまたはこれを暗号化する核酸、およびCas12f1タンパク質またはこれを暗号化する核酸を同時に処理するものであり得る。または前記真核細胞にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理することはエンジニアリングされたガイドRNAまたはこれを暗号化する核酸、およびCas12f1タンパク質またはこれを暗号化する核酸を順次処理するものであり得る。
【0491】
前記方法は選択的に真核細胞を培養することをさらに含むことができる。この場合、前記培養は組成物を処理した後に真核細胞を培養するものであり得る。
【0492】
2-3.Method例示(3)
さらに他の一具現例として、前記方法は真核細胞にエンジニアリングされたガイドRNAまたはこれを暗号化する核酸を処理することを含む標的核酸または標的遺伝子を変形させる方法であり得る。
【0493】
この時、前記真核細胞はCas12f1タンパク質またはこれを暗号化する核酸を含む細胞であり得る。また、前記真核細胞は標的核酸または標的遺伝子を含むことができる。前記真核細胞は酵母(yeast)、植物細胞、動物細胞、および/またはヒト細胞であり得るが、これに制限されない。
【0494】
前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0495】
前記エンジニアリングされたガイドRNAを暗号化する核酸はウイルスベクターまたは非ウイルスベクター形態であり得る。前記ウイルスベクターまたは非ウイルスベクター形態は前述した「1-1)核酸形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0496】
一具体例において、前記エンジニアリングされたガイドRNAを暗号化する核酸はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコン形態であり得る。
【0497】
他の一具体例において、前記エンジニアリングされたガイドRNAを暗号化する核酸はエンジニアリングされたガイドRNAを暗号化する核酸を含むアデノ関連ウイルスベクター形態であり得る。
【0498】
前記真核細胞にエンジニアリングされたガイドRNAまたはこれを暗号化する核酸を処理することは真核細胞でエンジニアリングされたCRISPR/Cas12f1複合体を形成するためのものであり得る。または前記真核細胞にエンジニアリングされたガイドRNAまたはこれを暗号化する核酸を処理することは真核細胞に存在する標的核酸または標的遺伝子にエンジニアリングされたCRISPR/Cas12f1複合体を接触させるためのものであり得る。
【0499】
前記真核細胞にエンジニアリングされたCRISPR/Cas12f1システムを処理することは電気穿孔法、遺伝子銃、超音波穿孔法、磁気注入法(magnetofection)、ナノパーティクル方法および/または一時的な細胞圧縮またはスクイージング方法を利用したものであり得る。または前記真核細胞にエンジニアリングされたCRISPR/Cas12f1システムを処理することは陽イオンリポソーム法、酢酸リチウム-DMSO、脂質-媒介形質感染(transfection)、燐酸カルシウム沈殿法(precipitation)、lipofection、PEI(Polyethyleneimine)-媒介形質感染、DEAE-dextran媒介形質感染、および/またはナノパーティクル-媒介核酸送達(Panyam et al.,Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023参照)を利用したものであり得るが、これに制限されるものではない。
【0500】
前記方法は選択的に真核細胞を培養することをさらに含むことができる。この場合、前記培養は組成物を処理した後に真核細胞を培養するものであり得る。
【0501】
2-4.Method例示(4)
一具現例として、前記方法は対象体に組成物を導入(注入)することを含む標的核酸または標的遺伝子を変形させる方法であり得る。
【0502】
この時、前記組成物は
エンジニアリングされたガイドRNAまたはこれを暗号化する核酸;および
Cas12f1タンパク質またはこれを暗号化する核酸
を含むことができる。
【0503】
前記組成物は前述した「1.Composition」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記エンジニアリングされたガイドRNAは前述した「<エンジニアリングされたガイドRNA>」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記Cas12f1タンパク質は前述した<エンジニアリングされたCRISPR/Cas14a1システム>中の「2.Cas12f1(Cas14a1)protein」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0504】
前記組成物はウイルスベクター、非ウイルスベクターまたはこの混合形態であり得る。または前記組成物は核酸およびタンパク質の混合形態であり得る。前記ウイルスベクター、非ウイルスベクターまたはこの混合形態は前述した「1-1)核酸形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。また、前記核酸およびタンパク質の混合形態は前述した「1-2)核酸およびタンパク質の混合形態」セクションに記載した通りであり、前記セクションに説明された各構成と同一の特徴および構造を有する。
【0505】
一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含むウイルスベクター形態であり得る。この時、前記ウイルスベクターはレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ-関連ウイルスベクター、ワクシニアウイルスベクター、ポックスウイルスベクターおよび単純ヘルペスウイルスベクターで構成された群から選択される一つ以上であり得る。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む一つのウイルスベクターを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をそれぞれ含む二つのウイルスベクターを含むことができる。
【0506】
他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸を含む非ウイルスベクター形態であり得る。この時、前記非ウイルスベクターはプラスミドであり得る。この時、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をすべて含む一つのプラスミドを含むことができる。または前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸およびCas12f1タンパク質を暗号化する核酸をそれぞれ含む二つのプラスミドを含むことができる。
【0507】
さらに他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を暗号化するmRNAを含むことができる。
【0508】
さらに他の一具体例において、前記組成物はエンジニアリングされたガイドRNAを暗号化する核酸を含むPCRアンプリコンおよびCas12f1タンパク質を含むことができる。または前記組成物はエンジニアリングされたガイドRNAおよびCas12f1タンパク質が結合したエンジニアリングされたCRISPR/Cas12f1(Cas14a1)複合体を含むことができる。
【0509】
前記対象体は標的核酸または標的遺伝子を含んだゲノムを有することができる。前記対象体は植物、非ヒト動物、ヒトまたはこれの一部組織であり得るが、これに制限されない。
【0510】
前記対象体に組成物を導入(注入)することは対象体に存在する標的核酸または標的遺伝子にエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを接触させるためのものであり得る。
【0511】
前記対象体に組成物を導入(注入)することは微細注入(microinjection)、電気穿孔法、遺伝子銃、超音波穿孔法、磁気注入法(magnetofection)、ナノパーティクル方法および/または一時的な細胞圧縮またはスクイージング方法を利用したものであり得る。または前記対象体に組成物を導入(注入)することは陽イオンリポソーム法、酢酸リチウム-DMSO、脂質-媒介形質感染(transfection)、燐酸カルシウム沈殿法(precipitation)、lipofection、PEI(Polyethyleneimine)-媒介形質感染、DEAE-dextran媒介形質感染、および/またはナノパーティクル-媒介核酸送達(Panyam et al.,Adv Drug Deliv Rev.2012 Sep 13.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023参照)を利用したものであり得るが、これに制限されるものではない。
【0512】
3.Modification of target
本明細書で開示する組成物および方法を通じて標的遺伝子または標的核酸を変形させることができる。より具体的には、標的遺伝子または標的核酸はエンジニアリングされたCRISPR/Cas12f1(Cas14ai)システムによって変形され得る。この時、前記変形はi)エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムによる標的遺伝子または標的核酸の切断または損傷およびii)切断された(または損傷した)標的遺伝子または標的核酸の修繕または修復をすべて含むことができる。この時、前記変形は標的遺伝子または標的核酸配列の除去または置換であり得る。または前記変形は標的遺伝子または標的核酸に追加的な核酸配列の挿入(insertion)であり得る。または前記変形は、標的遺伝子または標的核酸の一部が配列除去されて追加配列挿入されるインデル(insertion and deletion;indel)であり得る。以下で前記変形について詳しく説明する。
【0513】
3-1)削除(Deletion)
本明細書で提供する方法の遂行結果として、標的遺伝子または標的核酸配列の全部または一部が除去され得る。前記除去は前記標的遺伝子または前記標的核酸内の一部の塩基配列を除去することを意味する。一具現例として、前記方法はCas12f1タンパク質またはこれを暗号化する核酸、第1エンジニアリングされたガイドRNAまたはこれを暗号化する核酸、および第2エンジニアリングされたガイドRNAまたはこれを暗号化する核酸を標的遺伝子または標的核酸を含む細胞内に導入することを含む。これによって、前記標的遺伝子または標的核酸内に特定配列部分の除去が起きる。
【0514】
3-2)挿入(Insertion)
本明細書で提供する方法の遂行結果として、標的遺伝子または標的核酸内ノックイン(knockin)が発生し得る。前記ノックインは標的遺伝子または標的核酸配列内に追加的な核酸配列を挿入することを意味する。前記ノックインが起きるためには、エンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムの他に前記追加的な核酸配列を含むドナーがさらに必要である。細胞内でエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムが標的遺伝子または標的核酸を切断する場合、前記切断された標的遺伝子または標的核酸の修復が起きることになる。この場合、相同組換え修復(homology directed repairing、HDR)を利用して修復することができ、この時、前記ドナーが前記修復過程に関与して前記追加的な核酸配列を標的遺伝子または標的核酸内に挿入する。一具現例として、前記方法は対象細胞内にドナーを送達することを追加的に含むことができる。この時、前記ドナーは追加対象核酸を含み、前記ドナーによって前記標的遺伝子または前記標的核酸内前記追加対象核酸の挿入が誘導される。この時、前記ドナーを対象細胞内に送達する時、前述したエンジニアリングされたCRISPR/Cas12f1(Cas14a1)システムを処理する方法のうち一つの方法が使われ得る。
【0515】
3-3)挿入および削除(またはインデル、Insertion and deletion(Indel))
本明細書で提供する方法の遂行結果として、標的遺伝子または標的核酸内インデル(deletion and insertion;indel)が発生し得る。前記インデルは非-相同性末端-結合(Non-homologous end joining、NHEJ)により発生し得る。一般的に、NHEJは二本鎖の破損(例えば、切断)により形成された2個の適合性末端が頻繁な接触を繰り返してDNA内二本鎖破損を修復または修繕する方法である。NHEJを利用した損傷した遺伝子または核酸の修復はNHEJ修繕部位に核酸配列の一部挿入および/または欠失(挿入欠失)を招く。このような挿入および/または欠失はリーディングフレームを変更させ、フレームシフトされた転写体mRNAを作り出し、結果的にナンセンス-媒介崩壊(nonsense mediated decay)を起こすか正常なタンパク質を合成するのに失敗することによって本来の機能を喪失することになる。したがって、標的遺伝子または標的核酸配列内インデルが起きれば、該当遺伝子または核酸が不活性化され得る。一具現例として、前記方法の遂行結果、標的遺伝子または標的核酸内一つ以上の塩基が欠失および/または追加され得る。
【0516】
3-4)置換(Substitution)または塩基編集(Base editing)
本明細書で提供する方法の遂行結果として、標的遺伝子または標的核酸内ベースエディティングが起き得る。これは標的遺伝子または標的核酸内任意のヌクレオチドが欠失および/または挿入されるインデルとは異なり、核酸内一つ以上の特定塩基を意図通りに変更することを意味する。換言すると、標的遺伝子または標的核酸内の特定位置で、予め意図した点突然変異(point mutation)を起こすことである。一具現例として、前記方法の遂行結果、標的遺伝子または標的核酸内一つ以上の塩基が他の塩基で置換され得る。
【0517】
3-5)標的変形による表現型(Phenotype by modification of target)
標的核酸または標的遺伝子の変形はノックアウト(knockout)、ノックダウン(knockdown)、ノックイン(knockin)の効果を招くことができる。「ノックアウト(knockout)」は標的遺伝子または標的核酸を不活性化させることを意味し、「標的遺伝子または標的核酸の不活性化」は標的遺伝子または標的核酸の転写および/または翻訳できない状態を意味する。ノックアウトを通じて疾病を誘発する遺伝子または非正常的機能を有する遺伝子の転写および翻訳を抑制してタンパク質の発現を防ぐことができる。「ノックダウン(knockdown)」は標的遺伝子または標的核酸の転写および/または翻訳を減少させたり標的タンパク質の発現が減少したりすることを意味する。ノックダウンを通じて過発現される遺伝子またはタンパク質の発現を調節して疾病の発生を防いだり疾病を治療したりすることができる。「ノックイン(knockin)」は標的遺伝子または標的核酸に特定核酸または遺伝子を挿入することを意味し、この時、「特定核酸または遺伝子」は挿入しようとするまたは発現させることを所望する遺伝子または核酸を意味する。ノックインを通じて疾病を誘発する突然変異遺伝子を正しく校正したり、正常遺伝子を挿入して正常遺伝子の発現を誘導したりして疾病治療に利用することができる。
【0518】
以下、実施例を通じて本発明を詳細に説明しようとする。
【0519】
これらの実施例は、単に本発明をより具体的に説明するためのものであり、本発明の範囲がこれらの実施例によって制限されないということは本発明が属した技術分野で通常の知識を有する者において自明であろう。
【実施例】
【0520】
[実験方法]
1.Plasmid vector construction
Cas12f1(Cas14a1)のヒトコドン最適化配列(SEQ ID NO:487)を適用してchicken b-actinプロモーター、5'末端および3'末端の両側にnuclear-localization signal配列およびT2A-linked eGFPを含むオリゴヌクレオチド(Bionics)を合成した。ガイドRNAのためのテンプレートDNAを合成してpTwist Ampプラスミドベクター(Twist Bioscience)に複製した。必要な場合、複製されたベクターはU6-complementary forward primerおよびprotospacer-complementary reverse primerを使ってgRNA-encoding PCR ampliconのためのテンプレートとして使われた。dualガイドRNAの構成のために、tracrRNAおよびcrRNAを暗号化するオリゴヌクレオチドはBamHIおよびHindIII制限酵素(New England Biolabs)を使ってpSilencer 2.0(ThermoFisher Scientific)にクローニングされた。エンジニアリングされたCRISPR/Cas14as1システム_3.0(geCas14a_3.0)ベクターはCas12f1(Cas14a1)のヒトコドン最適化オリゴヌクレオチドおよびCas14a1のためのエンジニアリングされたgRNA配列で構成される。SpCas9の場合、SpCas9のヒトコドン最適化オリゴヌクレオチドおよびSpCas9のためのsingleガイドRNA(sgRNA)はpSpCas9(BB)-2A-EGFP(PX458)V2.0(Addgene)をバックボーンプラスミドとして使ってGibsonアセンブリした。
【0521】
2.ガイドRNA engineering
gRNAの内部変形(i.stem5を構成するヌクレオチド配列の変形、以下で前記i変形をmodification 1(M1)と記載する、この時、stem5を構成するtracrRNAおよび/またはcrRNAのヌクレオチド配列の変形はM1-1で、stem5を構成するヌクレオチド配列の削除変形はM1-2で記載する;およびii.stem2を構成するヌクレオチド配列の変形、以下で前記ii変形をmodification 2(M2)と記載する)はApoIおよびBamHI制限酵素を使って線形化されたgRNAエンコーディングベクターに変形された配列を運搬する合成オリゴヌクレオチド(Macrogen)をクローニングして遂行された。tracrRNAの5'末端変形(stem1を構成するヌクレオチド配列の変形、以下で前記変形をmodification 3(M3)と記載する)はU6プロモーター領域を標的とする逆方向プライマーとtracrRNAの5'末端領域を標的とする正方向プライマーを使ってcanonicalまたはエンジニアリングされたテンプレートプラスミドベクターのPCR増幅によって遂行された。PCR増幅はQ5 Hot Start high-fidelity DNA polymerase(NEB)を利用して遂行されたし、PCR産物はKLD Enzyme Mix(NEB)を使ってligationさせた。ligationされた生成物を使ってDH5αE.coli細胞を形質転換させた。突然変異誘発はSangerシーケンシング分析によって確認された。変形されたプラスミドベクターはNucleoBond Xtra Midi EF kit(MN)を使って精製された。精製されたプラスミド1μgをT7 RNA重合酵素(NEB)およびNTP(Jena Bioscience)を使ってmRNA合成のためのテンプレートとして使った。ガイドRNAはMonarch RNA cleanup kit(NEB)を使って精製して液体窒素に保管する前にcryogenic vialに分注した。
【0522】
crRNAの3'末端変形(U-rich tail付加、以下で前記U-rich tail付加変形をmodification 4(M4)と記載する)は塩基配列変形されたプライマーとcanonical gRNAプラスミドベクターがある状態でPfu PCR Master Mix5(Biofact)を使って遂行された。PCRアンプリコンはHiGeneTM Gel&PCR Purificationシステム(Biofact)を使って精製した。
【0523】
3.Human cell culture and transfection
HEK-293T細胞(ATCC CRL-11268)を5%CO2インキュベーターで37℃で10%heat-inactivated FBS(Corning)および1%ペニシリン/ストレプトマイシンを補充されたDMEMで培養した。細胞形質感染はelectroporationまたはlipofection方法を通じて遂行された。Electroporationのために、2-5μgのCas14a1、AsCpf1またはSpCas9を暗号化する核酸を含むプラスミドベクターを2-5μgのgRNA暗号化するDNAとともにNeon transfectionシステム(Invitrogen)を使って4 X 105 HEK-293T細胞で形質感染させた。Electroporation条件は次の通りである:1,300V、10mA、3パルス。Lipofectionのために、6-15μL FuGene試薬(Promega)を2-5μgのCas14a1暗号化する核酸を含むプラスミドベクターおよび1.5-5μgのPCRアンプリコンと15分の間混合した。混合物(300μL)を1.5ml DMEM培地に添加し、ここで1 X 106細胞を形質感染1日前にプレーティングし、細胞を混合物の存在下で72-96時間の間培養させた。培養後、細胞を収穫し、PureHelixTM genomic DNA preparation kit(NanoHelix)を使ったりMaxwellTM RSC nucleic acid isolation workstation(Promega)を使ったりしてgenomic DNAを準備した。形質感染に対する標的の情報は下の表3に整理した。
【0524】
【0525】
aListed information is based on the Genome Reference Consortium Human Build 38 patch release 11(GRCh38.p11)。
【0526】
4.Measurement of indel efficiency
PureHelixTM genomic DNA preparation kit(NanoHelix)を使ってHEK-293T細胞でgenomic DNAを分離した。Target-specific primerは合成されたし、製造業者の指針によりKAPA HiFi HotStart DNA polymerase(Roche)がある状態でprotospacer-含有領域を増幅するのに使われた。生成されたPCRアンプリコンはIllumina TruSeq HT dual indexにラベリングされた。最終PCR産物はIllumina iSeq 100を使って150-bp paired-end sequencingした。Indel frequencyはMAUND(https://github.com/ibs-cge/maund)により計算された。
【0527】
5.Recombinant Cas14a1
Cas12f1遺伝子は変形されたpMAL-c2xプラスミドベクター(Addgene)にクローニングされたし、前記ベクター構築物を使ってBL21(DE3)E.coli細胞を形質転換した。E.coli形質転換体コロニーは0.7の光学密度に到達するまでLB brothで37℃で成長させた。前記細胞を0.1mM isopropylthio-β-D-galactosideの存在下で30℃で一晩中培養した後、30分の間3,500gで遠心分離して収集した。収集された細胞を20mM Tris-HCl(pH7.6)、500mM NaCl、5mMβ-mercaptoethanol、5%グリセロールに再懸濁させた。Cell lysateは超音波処理し、15,000gで30分の間遠心分離した後、0.45μm注射器フィルタ(Millipore)を通じて濾過して準備した。cleared lysateをFPLC精製システム(AKTA Purifier、GE Healthcare)を使ってNi2+-affinity columnにロードした。Ni2+-affinity columnに結合された分画は80-400mM imidazole gradientsから20mM Tris-HCl(pH7.5)に溶出された。溶出されたタンパク質は1mgのTEV proteaseで6時間の間処理された。切断されたタンパク質は0.15-1.6 M NaClの線形勾配でHeparin columnで精製された。組換えCas14a1タンパク質は20mM Tris pH7.6、150mM NaCl、5mMβ-mercaptoethanol、5%グリセロールに対して透析された。透析されたタンパク質を0.5-1.2M NaClの線形勾配でmonoS column(GE Healthcare)で再び精製した。選択された分画をプルリンハで20mM Tris pH7.6、150mM NaCl、5mMβ-mercaptoethanol、5%グリセロールに対して透析した。収得されたタンパク質の濃度はbovine serum albuminを標準として使ってcoomassie blue-stained SDS-PAGEゲルで電気球形的に(electropherometrically)測定された。
【0528】
6.Off-target analysis using Digenome-seq method
Genome-wide off-target分析はDigenome-seq方法を通じて遂行された。簡単に説明すると、genomic DNAをHEK-293T細胞から分離し、分離したgenomic DNAに10μg Cas12f1またはAsCas12a組換えタンパク質と900nMエンジニアリングされたガイドRNAを室温で2時間の間事前インキュベーションして形成されたribonucleoprotein complexを処理した。genomic DNAの分解(digestion)は100mM NaCl、10mM MgCl2、100μg/ml BSA、50mM Tris-HCl(pH7.9)を含む反応バッファーで37℃で8時間の間遂行された。分解されたgenomic DNAはRNase A(50μg/ml)で処理した後、DNeasy Tissue kit(Qiagen)を使って精製した。精製されたgenomic DNAはIllumina HiSeq X Ten Sequencerを使って30x~40xのsequencing depthで全体ゲノムシーケンシング(whole genome sequencing;WGS)に適用された。DNA cleavage scoreは方程式によりWGSデータを使って全体ゲノムにわたって各ヌクレオチド位置に割り当てられた。2.5のカットオフ値はオンターゲットシーケンスで6個以下の不一致基準が追加されたDigenome-seqプログラム(https://github.com/chizksh/digenome-toolkit2)を使って潜在的なオフターゲットをスクリーニングするために割り当てられた。選別された潜在的なオフ-ターゲットはHEK293-T細胞へのガイドRNAとともにCas14a1を処理した後、targeted deep sequencing分析によって検証された。
【0529】
7.Droplet digital PCR
ガイドRNAまたはgenomic DNAはそれぞれRNeasy Miniprep kit(Qiagen)またはPureHelixTM genomic DNA preparation kit(NanoHelix)を使ってHEK-293T細胞から抽出された。ガイドRNAの定量化のために、cDNA合成にcrRNA-specific primerを使ったし、合成されたcDNAは定量的リアルタイムPCRを鋳型として使った。エクソン欠失はiCycler(Bio-Rad)でQuantiTect SYBR Green RT-PCR kit(Qiagen)を使って分析された。
【0530】
8.Quantitative analysis of gRNA expression
CanonicalまたはエンジニアリングされたgRNAを暗号化するPCRアンプリコン(3μg)をNeon transfectionシステム(Invitrogen)を使ってHEK293-T細胞で形質感染させ、形質感染2日後に細胞を収穫した。収穫した細胞からmaxwell RSC miRNA Tissue Kit(Promega、AS1460)を使って総RNAを収得した。収得したRNAを5μgのRNA製剤をE.coli Poly(A)Polymerase(NEB、M0276)とともに37℃で30分の間培養してポリアデニル化させた。RNAをMonarch RNA Cleanup Kit(NEB、T2050)で精製した。500μgのpoly(A)-tailed RNAを3'末端にT6配列とアダプタ配列を送達するRT-specific primerの存在下でSuperScript IV Reverse Transcriptase(Invitrogen)を使って逆転写させた。ガイドRNAはアダプタおよびgRNA-specific primerを使ってPCR増幅された。PCR産物を2%アガロースゲルから分離した。
【0531】
9.Production of AAV vectors and transduction
ヒトコドン最適化されたCas12f1遺伝子およびsgRNA配列は逆末端反復を有するAAVベクタープラスミドにクローニングされた。前記Cas12f1遺伝子はnuclear localization signalおよび自己切断T2A配列を通じてenhanced green fluorescent protein(eGFP)遺伝子と連結される。Cas12f1およびsgRNA転写はそれぞれchickenβ-actinプロモーターおよびU6プロモーターによって誘導された。rAAV2ベクターを生産するために、pAAV-ITR-sgRNA-Cas12f1またはpAAV-ITR-sgRNA-SaCas9;pAAVED2/9;およびヘルパープラスミドをHEK-293T細胞に形質注入した。前記形質注入されたHEK-293T細胞を2%FBSが含まれたDMEMで培養した。PEIpro(Polyplus-transfection)とPEI coprecipitationおよびHEK-293T細胞で同一のモル比でプラスミドを使った三重-形質注入(triple-transfection)を使って組換えpseudotyped AAV vector stockを生成した。72時間のインキュベーション後、細胞を溶解させてparticleをiodixanol(Sigma-Aldrich)step-gradient ultracentrifugationを利用して精製した。ベクターゲノムの数は定量的PCRによって決定された。HEK-293T細胞は定量的PCRによって決定された通り、1、5、10、50および100の異なる感染多重度(multiplicity of infection;MOI)でrAAV2-Cas12f1-sgRNAまたはrAAV2-SaCas9-sgRNAに感染された。形質導入された細胞は2%FBSがあるDMEMで2週まで維持された。他のtime pointsでgenomic DNAの分離のために細胞を収集した。
【0532】
10.Statistical analysis
two-tailed Student's t-testによる統計的有意性検証がSigma Plot software(ver.14.0)により遂行された。0.05未満のp-valueが表れる場合、統計的に有意義なものと見なしたし、p-valueは各図面に図示されている。ボックスプロット(box plot)および点プロット(dot plot)でデータポイントは全体値の範囲を示し、各ボックスは4分位の範囲(25-75 percentile)にまたがっている。中位値および平均値はそれぞれ黒色および赤色の平行線で表示された。すべての点プロット(dot plot)およびバープロット(bar plot)データのエラーバーはSigmaplot(v.41.0)を使って図示されたし、各データの標準偏差値を意味する。統計的方法に基づいてサンプルの大きさを予め決定してはいない。Cas類型に対するブラインド情報で大規模検証が遂行された。
【実施例1】
【0533】
<ガイドRNA engineering>
先行研究(Harrington et al.,Science 362、839-842(2018)、Tautvydas Karvelis et al.,Nucleic Acids Research 48、5016-5023(2020))を通じてCRISPR/Cas14a1システムが一本鎖DNA(ssDNA)を切断するもののように報告されたし、CRISPR/Cas14a1システム自体が真核細胞のゲノム編集に適していないかもしれないと仮定した。このような問題を認識し、CRISPR/Cas12f1システムを真核細胞に適用するために、CRISPR/Cas14a1システムのためのガイドRNA(gRNA)を最適化する研究を遂行した。
【0534】
gRNAエンジニアリングはCRISPR/Cas14a1システムのgRNAを構成するtracrRNAおよびcrRNA全体に亘って4個の変形部位(modification site;MS)を次のように指定した(
図2):
1)MS1-tracrRNAのpenta-uridinylate(UUUUU)配列を含むstem5を構成する領域(wildtype tracrRNAの変形対象領域1に対応する)およびこれに対応するcrRNAの領域;
2)MS2-stem2を構成するtracrRNAの内部領域(wildtype tracrRNAの変形対象領域4に対応する);
3)MS3-stem1を構成するtracrRNAの5'末端領域(wildtype tracrRNAの変形対象領域5に対応する);および
4)MS4-crRNAの3'末端領域.
gRNAエンジニアリングはMS1、MS2、MS3およびMS4でそれぞれ個別的に遂行するか多様な組み合わせで遂行して非常に効率的なCRISPR-Cas14a1システムを導き出した。安定したtracrRNA-crRNA複合体の形成のために一部のエンジニアリングされたガイドRNAの場合、tracrRNAとcrRNAをlinkerであるGAAA配列に連結した単一ガイドRNA(singleガイドRNA;sgRNA)として使った。
【実施例2】
【0535】
<エンジニアリングされたガイドRNA(MS1)>
先行研究(Harrington et al.,Science 362、839-842(2018)により報告されたCas14a1に対するcanonical gRNA配列を綿密に調査した。その結果、wildtype tracrRNA(SEQ ID NO:1)が真核細胞で正常に転写し難い不適切な配列を含んでいることを確認した。wildtype tracrRNAはtracrRNAの5'末端から3'末端方向に138番目から142番目の位置に内部UUUUU(U5)配列を含む(
図1)。したがって、tracrRNAを転写するためにtracrRNAを暗号化する核酸は連続する5個のチミジン(T5)配列を含むことになる。この時、連続する5個のチミジン(T5)配列はU6プロモーターの下で終結配列として作用し得、これによってtracrRNAが正常に転写できず不完全なtracrRNAが生成される可能性が高い。したがって、本発明者はtracrRNAのpenta-uridinylate(UUUUU)配列を含むstem5を構成する領域(MS1)をgRNAエンジニアリングのためのホットスポットと見なした。
【0536】
[実施例2-1]
<エンジニアリングされたtracrRNA(M1-1):tracrRNAのpenta-uridinylate(UUUUU)配列を含むstem5を構成する領域変形>
以下で、tracrRNA内にUUUUU(U5)配列を含む領域が変形された場合、M1-1またはMS1エンジニアリングで表示した。すなわち、連続した5個以上のウリジン配列を含まないように変形された場合、tracrRNAはM1-1変形を含むエンジニアリングされたtracrRNAまたはエンジニアリングされたtracrRNA(M1-1)で表示した。また、前述した詳細な説明に基づき、MS1エンジニアリングによって生成されたエンジニアリングされたtracrRNA(M1-1)は前記1.エンジニアリングされたtracrRNAの説明中の「1-1)第1配列」セクションに記載された第1配列(連続した5個以上のウリジン配列を含まない配列)を有することができる(
図4のA)。
【0537】
終結信号として作用できる連続した5個以上のウリジン配列を除去するためにそれぞれのウリジン(U)をウリジン以外の他のヌクレオチド(A、CまたはG)で置き換えてエンジニアリングされたtracrRNAを生成した(表4)。生成されたエンジニアリングされたtracrRNAを利用してHEK293T細胞で内因性標的(Target 1)に対するインデル効率を調査した。Deep sequencing分析結果、それぞれの置換が少なくとも4倍のインデル効率の増加をもたらしたし、特に、141番目のウリジン(U141)がシチジン(C)で置換された時にインデル効率が約50倍程度に顕著に増加することを確認した(
図11)。シチジンは終結信号を除去するだけでなくその位置に構造的に適合するように作用したと推測される。
【0538】
【表4】
tracrRNA内に連続した5個以上のウリジン配列を含むMS1が変形されたエンジニアリングされたtracrRNA(tracrRNAのうちMS1アンダーラインで表示)
【0539】
また、追加的な置換によって効果を確認するために、141番目のUをCで固定し、残りのウリジンを
図12に基づいて多様に置き換えて組み合わせた16通りのエンジニアリングされたtracrRNAを比較した(表5)。比較分析した結果、殆どのエンジニアリングされたtracrRNAはUUUUUを含むcanonical tracrRNA(すなわち、野生型tarcrRNA)より高いインデル効率を示した。特に、tracrRNAでUUUUU配列を「GUGCU」配列で代替した場合、インデル効率がさらに増加することが明らかになった(
図12)。
【0540】
【表5】
tracrRNA内に連続した5個以上のウリジン配列を含むMS1が変形されたエンジニアリングされたtracrRNA(tracrRNAのうちMS1アンダーラインで表示)
【0541】
[実施例2-2]
<エンジニアリングされたcrRNA(M1-1):エンジニアリングされたtracrRNA(M1-1)に対応するcrRNAの変形>
また、インデル効率を最大化するために、前記エンジニアリングされたtracrRNA(M1-1)に対応するcrRNAを操作した。以下で、前記エンジニアリングされたtracrRNA(M1-1)により変形されるcrRNAはエンジニアリングされたcrRNA(M1-1)で表示した(
図4のA)。また、前述した詳細な説明に基づき、エンジニアリングされたcrRNA(MS1-1)は前記2.Wildtype crRNA orエンジニアリングされたcrRNAの説明中の「2-1)第6配列」セクションに記載された第6配列(5'-ACGAA-3'配列を含まない配列)を有することができる。
【0542】
前記エンジニアリングされたtracrRNA(M1-1)の5'-GUGCU-3'配列に対応するcrRNAの最適な配列を探すために、前記tracrRNAの操作方法と類似する方法を利用して多様な配列への置換による効果を分析した。前記エンジニアリングされたtracrRNA(M1-1)の5'-GUGCU-3'配列に対応するcrRNAの5'-ACGAA-3'配列のそれぞれのヌクレオチドを多様なヌクレオチドで置き換えて多様に組み合わせてエンジニアリングされたcrRNAを生成した。生成されたエンジニアリングされたcrRNAを利用してHEK293T細胞で3個の標的遺伝子に対するインデル効率を確認した結果、5'-AGCAA-3'配列がtracrRNAの5'-GUGCU-3'配列に対する最適な対応配列であることを確認した(
図13~15)。
【0543】
また、HEK293T細胞で3個の標的遺伝子でMS1変形を含んだエンジニアリングされたgRNAの効果を確認した。その結果、crRNAの単独変形(すなわち、エンジニアリングされたcrRNA(M1-1)は5'-AGCAA-3'配列を含み、すなわち、5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO:539)を含む)はCas12f1によるインデル活性に影響を与えなかったのであるが、tracrRNAの単独変形(すなわち、エンジニアリングされたtracrRNA(M1-1)は5'-GUGCU-3'配列を含むSEQ ID NO:270配列である)はすべての標的遺伝子に対してインデル効率を顕著に増加させた。また、前記tracrRNAとcrRNAを共に変形させた結果、tracrRNAを単独変形した場合よりインデル効率がさらに増加した(
図16)。
【0544】
簡単に整理すると、前記tracrRNAおよびcrRNAのengineering結果、エンジニアリングされたtracrRNA(M1-1)は5'-UUUUU-3'配列の代わりに5'-GUGCU-3'配列を含み、エンジニアリングされたcrRNA(M1-1)は5'-ACGAA-3'配列の代わりに5'-AGCAA-3'配列を含む場合、インデル効果が最大化されることを確認した。以下で、エンジニアリングされたtracrRNA(M1-1)およびエンジニアリングされたcrRNA(M1-1)を含むエンジニアリングされたgRNAはエンジニアリングされたgRNA(M-1)で表示した。
【0545】
[実施例2-3]
<エンジニアリングされたtracrRNA(M1-2)andエンジニアリングされたcrRNA(M1-2):Truncation of tracrRNA-crRNA complementary sequence in stem5>
前記の実施例2-1および2-3によって生成されたエンジニアリングされたtracrRNA(M1-1)およびエンジニアリングされたcrRNA(M1-1)を追加で操作した。Cas14a1のためのgRNAはtracrRNAとcrRNAで構成されて長い配列を有する。そこで、本発明者はindel効率を減少させないようにしつつ、gRNAの長さを減らすためにgRNAのcrRNA-tracrRNA相補的に結合する領域、すなわち、stem5を構成する領域(MS1)を追加変形した。これは今後の臨床適用を考慮したものであり、長さが200nt以上のsgRNAの化学的合成は臨床環境で負担となり得る。以下で、tracrRNA-crRNA相補的に結合する領域、すなわち、stem5を構成する領域に一部の塩基対配列を削除する場合、M1-2で表示した。すなわち、tracrRNAの3'末端およびcrRNAの5'末端に存在する相補的に結合する配列が全体または一部が削除された場合、tracrRNAはエンジニアリングされたtracrRNA(M1-2)で表示し、crRNAはエンジニアリングされたcrRNA(M1-2)で表示するか、またはエンジニアリングされたsgRNA(M1-2)で表示する。また、MS1の変形をすべて含んだ場合、すなわち、M1-1およびM1-2をすべて含んだ場合、エンジニアリングされたtracrRNA(M1)およびエンジニアリングされたcrRNA(M1)で表示するか、またはエンジニアリングされたgRNA(M1)で表示する(
図4のB)。
【0546】
インデル効率に及ぼす影響を確認するために、多様な長さのstem5(tracrRNA-crRNA相補的に結合する領域)を有するsgRNAを生成してテストした(表6、
図17)。その結果、tracrRNA-crRNA相補的に結合する領域が削除されたsgRNAは略インデル効率が維持された。
【0547】
【表6】
tracrRNA-crRNA相補的に結合する領域に一部の塩基対配列を削除したエンジニアリングされたsgRNA(M1)のガイド配列を除いた配列(ガイド配列の場合、下記の整理された配列の3'末端に位置する)
【実施例3】
【0548】
<エンジニアリングされたガイドRNA(MS1 and MS2):Truncation of tracrRNA-crRNA complementary sequence in stem2(エンジニアリングされたtracrRNA(M2))>
Cas14a1は他のclass II CRISPR syetemに比べてtracrRNAの大きな大きさによって非常に長いgRNAを有する。そこで、本発明者はCas12f1のコンパクトな大きさを考慮する時、全体tracrRNA配列がCas12f1との相互作用に参加する可能性が低いという仮設を立てた。この仮設を確認するために、tracrRNAのstem2を構成する領域(MS2)を追加変形した。これは今後の臨床適用を考慮したものであり、長さが200nt以上のsgRNAの化学的合成は臨床環境で負担となり得る。以下で、stem2を構成する領域に一部の塩基対配列を削除する場合、M2でまたはMS2エンジニアリングで表示した。すなわち、tracrRNAの3'末端およびcrRNAの5'末端に存在する相補的に結合する配列が全体または一部が削除された場合、tracrRNAはエンジニアリングされたtracrRNA(M2)で表示するか、またはエンジニアリングされたgRNA(M2)で表示する。また、MS1の一部変形を含んだ場合、すなわち、M1-1を含んだ場合、エンジニアリングされたtracrRNA(M1-1/2)で表示するか、またはエンジニアリングされたgRNA(M1-1/2)で表示する。また、MS1の変形をすべて含んだ場合、すなわち、M1-1およびM1-2を含んだ場合、エンジニアリングされたtracrRNA(M1/2)で表示するか、またはエンジニアリングされたgRNA(M1/2)で表示する(
図5)。
【0549】
インデル効率に及ぼす影響を確認するために、多様な長さのstem2を有するsgRNAを生成してテストした(表7、
図18)。その結果、tracrRNA-crRNA相補的に結合する領域が削除されたsgRNAは略インデル効率が維持された。
【0550】
【表7】
stem2を構成する領域に一部の塩基対配列を削除したエンジニアリングされたgRNA(M1-1/2)のガイド配列を除いた配列(ガイド配列の場合、下記の整理された配列の3'末端に位置する)
【実施例4】
【0551】
<エンジニアリングされたガイドRNA(MS1 and MS3):5'-Truncation of tracrRNA(エンジニアリングされたtracrRNA(M3))>
Cas14a1は他のclass II CRISPR syetemに比べてtracrRNAの大きな大きさによって非常に長いgRNAを有する。そこで、本発明者はCas12f1のコンパクトな大きさを考慮する時、全体tracrRNA配列がCas12f1との相互作用に参加する可能性が低いという仮設を立てた。この仮設を確認するために、tracrRNAの5'末端領域(stem1を構成するtracrRNAの5'末端領域)を削除するようにtracrRNAを設計した。以下で、tracrRNAの5'末端に一部の配列を削除する場合、M3またはMS3エンジニアリングで表示した。すなわち、tracrRNAの5'末端に一部の配列が削除された場合、tracrRNAはMS3変形を含むエンジニアリングされたtracrRNAまたはエンジニアリングされたtracrRNA(M3)で表示した。また、MS1の一部変形を含んだ場合、すなわち、M1-1を含んだ場合、エンジニアリングされたtracrRNA(M1-1/3)で表示するか、またはエンジニアリングされたgRNA(M1-1/3)で表示する。また、MS1の変形をすべて含んだ場合、すなわち、M1-1およびM1-2を含んだ場合、エンジニアリングされたtracrRNA(M1/3)で表示するか、またはエンジニアリングされたgRNA(M1/3)で表示する(
図6)。
【0552】
tracrRNAの5'末端領域を削除するように設計したエンジニアリングされたtracrRNA(M1-1/3)を利用して実験した結果(表8)、20ntが削除されたtracrRNAを利用した場合、インデル効率が顕著に増加することを確認した(
図19)。
【0553】
【表8】
tracrRNAの5'末端領域を削除するように設計したエンジニアリングされたtracrRNA(M1-1/3)
【実施例5】
【0554】
<エンジニアリングされたガイドRNA(MS1 and MS4):Addition of 3'-poly-uridinylates in crRNA(エンジニアリングされたcrRNA(M4))>
以前の研究でcrRNAにU-rich tail配列を付加する変形を通じてCRISPR/Cas12f1システムの向上したインデル効率を確認したところがある(PCT/KR2020/014961参考)。これに基づいてcrRNAの3'末端にU-rich tail配列を付加する変形を設計した。crRNAの3'末端にU-rich tail配列を含む場合、M4またはMS4エンジニアリングで表示した。すなわち、crRNAの3'末端にU-rich tail配列が付加された場合、crRNAはMS4変形を含むエンジニアリングされたcrRNAまたはエンジニアリングされたcrRNA(M4)で表示した。また、MS1の一部変形を含んだ場合、すなわち、M1-1を含んだ場合、エンジニアリングされたcrRNA(M1-1/4)で表示するか、またはエンジニアリングされたgRNA(M1-1/4)で表示する。また、MS1の変形をすべて含んだ場合、すなわち、M1-1およびM1-2を含んだ場合、エンジニアリングされたcrRNA(M1/4)で表示するか、またはエンジニアリングされたgRNA(M1/4)で表示する(
図7)。
【0555】
実施例2のエンジニアリングされたtracrRNA(M1-1)とともにU-rich tail配列が付加されたエンジニアリングされたcrRNA(M1-1/4)を含んだエンジニアリングされたgRNA(M1-1/4)のインデル効率を確認した。
【0556】
エンジニアリングされたcrRNA(M1-1/4)のために、Cas12f1のためのエンジニアリングされたcrRNA(M1-1)の3'末端に多様な長さのU-rich tail配列を含むように設計した。この時、crRNAを暗号化する核酸の3'末端にチミジンの長さを段階的に増やして多様な長さのU-rich tail配列を有するエンジニアリングされたcrRNA(M1-1/4)を設計した(表9)。特に、チミジンが5個以上である場合、さらにインデル効率が増加した(
図20)。この時、T
4A、T
4ATなど連続したチミジン配列の中間にAはU6プロモーター下で終結信号として作用する連続する5個のチミジン(T5)配列を除去するためで設計されたし、またAの代わりにCまたはGをTTTT後に付加してその効果を確認した(
図21)。
【0557】
【表9】
エンジニアリングされたcrRNA(M1-1)の3'末端に付加されるU-rich tail配列
【0558】
その結果、チミジンの長さが増加するほどインデル効率が増加することを確認した。特に、U
4AU
4を含んだエンジニアリングされたcrRNA(M1-1/4)とエンジニアリングされたtracrRNA(M1-1)を共に利用した場合、それぞれを単独で変形したものより大きいシナジー効果を示したし、Target 1に対して最大1,148倍までインデル効率が大きく向上することを確認した(
図22および
図23)。
【実施例6】
【0559】
<エンジニアリングされたガイドRNA(MS1、MS3 and MS4)>
前記の実施例に基づいてMS1エンジニアリング、MS3エンジニアリングおよびMS4エンジニアリングを含んだエンジニアリングされたtracrRNA(M1-1/3)(表9)およびエンジニアリングされたcrRNA(M1-1/4)(5'-[SEQ ID NO:516]-[ガイド配列]-[U4AU4]-3')を設計した。これを利用して実験した結果、3個のターゲットでいずれも高いインデル効率を確認した。特に、単独変形(M1-1)や二つの組み合わせ変形(M1-1/3またはM1-1/4)より3個の組み合わせ変形(M1-1/3/4)の場合、約3~6倍のインデル効率がさらに増加した。
【0560】
このような効果を確認した後、tracrRNAの5'末端領域に削除配列を最適化するために、tracrRNAの5'末端長さを-12~-21範囲内で微細調整して3個の標的に対するインデル効果を比較した(表10)。その結果、tracrRNA5'末端の18ntから21ntまでの範囲に削除(truncation)することがインデル効率に最も効果的であることを確認した(
図24)。特に、5'末端に20nt配列が削除された(truncated)tracrRNAが最も効果的であった。
【0561】
【表10】
tracrRNAの5'末端領域を削除するように設計したエンジニアリングされたtracrRNA(M1-1/3)
【実施例7】
【0562】
<エンジニアリングされたガイドRNA(MS1、MS3 and MS4)>
前記の実施例に基づいてMS1エンジニアリング、MS3エンジニアリングおよびMS4エンジニアリングを含んだエンジニアリングされたtracrRNA(M1/3)およびエンジニアリングされたcrRNA(M1/4)を設計した。
【0563】
前記実施例6によって3個の組み合わせ変形(M1-1/3/4)の場合、インデル効率が増加することを確認した。しかし、tracrRNAの5'末端削除(truncation)にもCas14a1のためのgRNAは依然として長い配列を有する。そこで、本発明者はgRNAの長さを最適化するためのM1-2変形をさらに含むように追加設計した(表11)。エンジニアリングされたtracrRNA(M1/3)およびエンジニアリングされたcrRNA(M1/4)を含むエンジニアリングされたsgRNA(M1/3/4)を利用した場合、実施例6でエンジニアリングされたtracrRNA(M1-1/3)およびエンジニアリングされたcrRNA(M1-1/4)を利用したインデル効率と類似または若干増加したインデル効率が確認された(
図25)。
【0564】
【表11】
エンジニアリングされたsgRNA(M1/3/4)のガイド配列およびU-rich tail配列を除いた配列(ガイド配列およびU-rich tail配列の場合、下記の整理された配列の3'末端に位置し、この時、U-rich tail配列は5'-U
4AU
4-3'配列である)
【0565】
このような結果に基づいてCas14a1との相互作用に影響を与えないようにしつつ、最適な長さを有するsgRNAを探すために追加的なスクリーニングを遂行した。tracrRNA-crRNA相補的に結合する領域(stem5)の全体範囲に亘って1bpずつ差を有するように多様なsgRNAを設計しテストした(表12、
図26)。
【0566】
【表12】
エンジニアリングされたsgRNA(M1/3/4)のガイド配列およびU-rich tail配列を除いた配列(ガイド配列およびU-rich tail配列の場合、下記の整理された配列の3'末端に位置し、この時、U-rich tail配列は5'-U4AU4-3'配列である)
【0567】
一方、sgRNAのlinker配列を利用した追加変形を試みた。一般的にsgRNAのためにリンカーとしてGAAAを利用する。この場合、gRNAは一つのRNA分子で作動する。反面GAAA配列をhammerhead ribozyme配列に代替する場合、発現段階でsgRNAが生成されるがhammerhead ribozymeによって自己切断(self-cleavage)されてtracrRNAまたはcrRNAにオーバーハングがある二重ガイドRNAが生成される。すなわち、tracrRNAおよびcrRNAとhammerhead ribozymeの結合は3'-truncated tracrRNAと5'-elongated crRNAを生成することができる(
図27)。または反対に、hammerhead ribozyme配列を反対方向に統合すると、5'-elongated tracrRNAおよび3'-truncated crRNAが生成される。このようなhammerhead ribozyme配列の特性を利用したgRNA構造変形をテストしてゲノム編集をさらに向上させることができるかどうかを調査した。その結果、hammerhead ribozyme配列を有するように設計されたgRNAのうちいずれも総25nt-trucated sgRNA(すなわち、crRNAおよびtracrRNAの場合それぞれ12ntおよび13nt切断)に比べて増加した効率を示さなかった(
図27)。
【実施例8】
【0568】
多様なエンジニアリングされたガイドRNA:MS1、MS2、MS3および/またはMS4
前記にて実施した実施例2~5で確認した多様なgRNAエンジニアリングに基づき、MS1、MS2、MS3およびMS4エンジニアリングを多様に組み合わせて多様なエンジニアリングされたgRNAを設計してその効果を確認した(
図4~10および表13)。その結果、多様なgRANのエンジニアリングはインデル効率を向上させた(
図28)。特に、M1/3/4組み合わせおよびM1/2/3/4組み合わせでエンジニアリングされたgRNAを利用したCRISPR/Cas14a1システムが最も優秀なゲノム編集性能を示した。以下では、M1/3/4組み合わせでエンジニアリングされたgRNAを含むエンジニアリングされたCRISPR/Cas14a1システムはgeCas14a1_3.0システムで表示した。また、HEK293T細胞でgeCas14a1_3.0システムを利用したインデルパターンを確認した(
図29)。総合すると、広範囲なgRNAエンジニアリングを通じて強力でさらにコンパクトなCRISPR/Cas12f1システムを開発したし、これを利用して真核細胞で既存CRISPR/Cas12f1システム(すなわち、野生型CRISPR/Cas12f1システム)で達成できなかった高効率のゲノム編集を可能にした。
【0569】
【表13】
多様なエンジニアリングされたsgRNAのガイド配列を除いた配列(ガイド配列の場合、下記の整理された配列の3'末端に位置する)。この時、M4を含む場合、ガイド配列の3'末端に5'-UUUUAUUUU-3'配列が付加される。
【実施例9】
【0570】
<gRNAエンジニアリングによる効果>
また、本発明者は増加したインデル効率に対するgRNAエンジニアリング(M1-M4)の効果の基礎となる分子メカニズムを調査した。その結果、予想通り、M1-1は標的RNA-seq分析によって評価されたように、完全な配列でgRNAの発現を急激に増加させることを確認した(
図30)。対照的にM3とM4はgRNA発現の変化と関連がなかった。M4に関連してU-rich tail配列は効率的なRNP形成を誘導した。しかし、M3の効果に対する具体的な情報を確認することができなかった。ただし、試験管内の二本鎖DNA(dsDNA)の分解分析を通じて、MS3エンジニアリングが追加されたエンジニアリングされたgRNAの場合、二本鎖切断がさらによく発生することを確認することができた。まだ具体的なメカニズムは分からないが、MS3エンジニアリングによってgRNAの5'末端に一部の配列が除去されることにより、Cas12f1の標的鎖に対する接近性が増加したものと予測され、MS3エンジニアリングにより野生型CRISPR/Cas12f1システムの標的鎖に対する低い切断効率を向上させたものと思われる(
図31)。換言すると、野生型CRISPR/Cas12f1システムは標的鎖の低効率切断によって主に一本鎖のみ切断するnickを生成して顕著に低いインデル効率を有する。しかし、MS3エンジニアリングをした場合、CRISPR/Cas12f1システムの切断パターンを変更することなく標的鎖の切断を顕著に増加させて結果的に二本鎖切断による顕著に増加したインデル効果を示した。
【実施例10】
【0571】
<Large-scale validation ofエンジニアリングされたCRISPR/Cas12f1 as an efficient genome editor>
前記にて実施したgRNAエンジニアリングは3個の内因性標的に対してのみインデル効率の変化をモニタリングして具現されたので、エンジニアリングされたCRISPR/Cas12f1システム(以下で、geCas14a1システムと混用して使う)が広範囲な標的に対するゲノム編集が可能であるかどうかを実験した。このために、Cas9、Cas12aおよびCas12f1で編集できるin silicoとして5'-TTTR-N20-NGG-3'配列を有する内因性ターゲットを検索して88個の内因性遺伝子座を無作為で選択した(
図32~34)。CRISPR/SpCas9システム、CRISPR/AsCas12aシステム、canonical CRISPR/Cas14a1システムまたはgeCas14a1_3.0システムを利用したHEK293-T細胞で形質感染後、deep sequencing分析を通じて選別した88個の内因性遺伝子座でのインデル効率を確認した(
図35)。その結果、canonical CRISPR/Cas14a1システムが標的の91%(80/88)がインデル効率が0.1%未満と示された。しかし、geCas14a1_3.0システムは広範囲な標的に対するインデル効率を大きく向上させた(
図35)。geCas14a1_3.0システムの平均効率はAsCas12a(p> 0.05)の効率と略同じであったしSpCas9の効率より若干低かった。
【0572】
このような大規模分析に対するbox-and-whiskerプロット(
図36)を通じて次のような結論を導き出した:1)canonical CRISPR/Cas14a1システム自体はヒト細胞で平均インデル効率が0.1%未満であり、ゲノム編集ツールへの使用が困難;2)gRNAエンジニアリングによるインデル効率の平均増加は540倍である;3)geCas14a1_3.0システムは真核細胞でCRISPR/SpCas9システムおよびCRISPR/AsCas12aシステムと共にゲノム編集ツールとして使うことができる、特にCRISPR/SpCas9システムおよびCRISPR/AsCas12aシステムに比べてgeCas14a1_3.0システムがさらに高い効率を示した標的(26%、23/88)があった;4)geCas14a1_3.0システムはCRISPR/SpCas9システムおよびCRISPR/AsCas12aシステムとは異なってGaussian分布を示さなかったし、かえって標的が全体範囲のindel効率にさらに均一に分布されている(
図36)。
【実施例11】
【0573】
Canonical gRNAおよびエンジニアリングされたgRNAのcleavage pattern比較
canonical gRNAおよびエンジニアリングされたgRNAを利用してtarget strand(TS)とnon-target strand(NTS)のcleavage patternをNGSで分析した。その結果、canonical gRNAはNTSのcleavageが相対的によくならないことを確認した。それに反し、エンジニアリングされたgRNAの場合、gRNAがengineeringされながらNTSのcleavageがますます増加することを確認した。また、TSのcleavageも少しずつ増加することも確認した。このような結果を通じて、エンジニアリングされたgRNAがNTSとTSで発生するcleavage差を減らすためdouble-strand cleavageを高めるものと理解され得る(
図37)。
【配列表】
【国際調査報告】