(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-09-12
(54)【発明の名称】真核生物ゲノム工学のための合成小型CRISPR-CAS(CASMINI)システム
(51)【国際特許分類】
C12N 15/55 20060101AFI20230905BHJP
C12N 15/09 20060101ALI20230905BHJP
C12N 15/63 20060101ALI20230905BHJP
C12N 9/22 20060101ALI20230905BHJP
C12N 15/11 20060101ALI20230905BHJP
C12N 15/864 20060101ALI20230905BHJP
A61K 38/46 20060101ALI20230905BHJP
A61P 1/16 20060101ALI20230905BHJP
A61P 7/00 20060101ALI20230905BHJP
A61P 7/04 20060101ALI20230905BHJP
A61P 7/06 20060101ALI20230905BHJP
A61P 9/00 20060101ALI20230905BHJP
A61P 11/00 20060101ALI20230905BHJP
A61P 13/12 20060101ALI20230905BHJP
A61P 19/00 20060101ALI20230905BHJP
A61P 21/00 20060101ALI20230905BHJP
A61P 25/00 20060101ALI20230905BHJP
A61P 25/16 20060101ALI20230905BHJP
A61P 25/18 20060101ALI20230905BHJP
A61P 25/28 20060101ALI20230905BHJP
A61P 25/30 20060101ALI20230905BHJP
A61P 27/02 20060101ALI20230905BHJP
A61P 27/06 20060101ALI20230905BHJP
A61P 29/00 20060101ALI20230905BHJP
A61P 31/12 20060101ALI20230905BHJP
A61P 35/00 20060101ALI20230905BHJP
A61P 37/02 20060101ALI20230905BHJP
A61P 43/00 20060101ALI20230905BHJP
A61K 35/76 20150101ALI20230905BHJP
A61K 48/00 20060101ALI20230905BHJP
A61P 31/00 20060101ALI20230905BHJP
A61K 9/127 20060101ALI20230905BHJP
A61K 9/14 20060101ALI20230905BHJP
A61K 9/12 20060101ALI20230905BHJP
A61K 47/62 20170101ALI20230905BHJP
【FI】
C12N15/55
C12N15/09 110
C12N15/63 Z ZNA
C12N9/22
C12N15/11 Z
C12N15/864 100Z
A61K38/46
A61P1/16
A61P7/00
A61P7/04
A61P7/06
A61P9/00
A61P11/00
A61P13/12
A61P19/00
A61P21/00
A61P25/00
A61P25/16
A61P25/18
A61P25/28
A61P25/30
A61P27/02
A61P27/06
A61P29/00
A61P31/12
A61P35/00
A61P37/02
A61P43/00 111
A61K35/76
A61K48/00
A61P31/00
A61K9/127
A61K9/14
A61K9/12
A61K47/62
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023513940
(86)(22)【出願日】2021-08-31
(85)【翻訳文提出日】2023-04-18
(86)【国際出願番号】 US2021048362
(87)【国際公開番号】W WO2022051250
(87)【国際公開日】2022-03-10
(32)【優先日】2020-09-01
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-05-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515158308
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(74)【代理人】
【識別番号】100102978
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100188433
【氏名又は名称】梅村 幸輔
(74)【代理人】
【識別番号】100128048
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100214396
【氏名又は名称】塩田 真紀
(74)【代理人】
【識別番号】100121072
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】チー レイ エス.
(72)【発明者】
【氏名】シュー シャオシュー
【テーマコード(参考)】
4C076
4C084
4C087
【Fターム(参考)】
4C076AA17
4C076AA19
4C076AA29
4C076AA95
4C076CC31
4C076CC41
4C076EE59
4C076FF70
4C084AA01
4C084AA02
4C084AA07
4C084AA13
4C084BA01
4C084BA08
4C084BA22
4C084BA23
4C084BA37
4C084BA38
4C084BA44
4C084CA04
4C084CA53
4C084DC22
4C084NA14
4C084ZA01
4C084ZA02
4C084ZA16
4C084ZA18
4C084ZA33
4C084ZA36
4C084ZA51
4C084ZA53
4C084ZA55
4C084ZA59
4C084ZA75
4C084ZA81
4C084ZA94
4C084ZA96
4C084ZB07
4C084ZB11
4C084ZB26
4C084ZB32
4C084ZB33
4C084ZC37
4C084ZC41
4C087AA01
4C087AA02
4C087AA03
4C087BC83
4C087CA08
4C087CA12
4C087NA13
4C087NA14
4C087ZA01
4C087ZA02
4C087ZA16
4C087ZA18
4C087ZA33
4C087ZA36
4C087ZA51
4C087ZA53
4C087ZA55
4C087ZA59
4C087ZA75
4C087ZA81
4C087ZA94
4C087ZA96
4C087ZB07
4C087ZB11
4C087ZB26
4C087ZB32
4C087ZB33
4C087ZC37
4C087ZC41
(57)【要約】
真核細胞において増加した活性を示すように操作されたCasタンパク質およびガイドRNA分子を本明細書に提供する。提供されるCasタンパク質およびRNA分子は、比較的小さい分子での真核生物核酸の調節が有利である適用に特に有用である。開示されるCasタンパク質およびガイドRNA分子をコードする核酸およびベクター、Casタンパク質およびガイドRNA分子を含む薬学的組成物、ならびに開示される材料を使用するための方法もまた提供する。
【特許請求の範囲】
【請求項1】
真核細胞中で機能的である操作されたCRISPR(Clustered Regularly Interspaced Short Palindromic Repeat)関連(Cas)タンパク質であって、
該Casタンパク質が、野生型Casタンパク質の天然アミノ酸配列と少なくとも80%同一である改変アミノ酸配列を含み、
該天然アミノ酸配列が、700アミノ酸未満の長さを有し、かつ、(D/E/K/N)X(R/F)(E/K)Nモチーフを含み;ならびに、
該改変アミノ酸配列が、該天然アミノ酸配列中に1つまたは複数の置換を含み、該1つまたは複数の置換のうちの少なくとも1つが、
(1)該(D/E/K/N)X(R/F)(E/K)Nモチーフ内の位置、または該(D/E/K/N)X(R/F)(E/K)Nモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、
(2)該天然アミノ酸配列の241位の位置、または該天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、
(3)該天然アミノ酸配列の516位の位置、または該天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、あるいは
(4)該天然アミノ酸配列中の荷電アミノ酸を有する位置
のいずれかの位置にある、
前記操作されたCasタンパク質。
【請求項2】
1つまたは複数の置換のうちの少なくとも1つが、アルギニン(R)、アラニン(A)、セリン(S)、およびグリシン(G)からなる群より選択されるアミノ酸への置換である、請求項1記載の操作されたCasタンパク質。
【請求項3】
野生型Casタンパク質がV型Casタンパク質である、請求項1記載の操作されたCasタンパク質。
【請求項4】
野生型Casタンパク質が、野生型V-F(Cas14もしくはCas 12f)タンパク質または野生型V-J(CasФもしくはCas12J)タンパク質である、請求項1記載の操作されたCasタンパク質。
【請求項5】
天然アミノ酸配列がSEQ ID NO: 1の配列である、請求項1記載の操作されたCasタンパク質。
【請求項6】
1つまたは複数の置換が、D143、K11、K73、T147、E151、K154、E241、D318、K330、K457、E425、E462、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換を含む、請求項1記載の操作されたCasタンパク質。
【請求項7】
置換が、D143R、K11R、K73R、T147R、E151R、K154R、E241R、D318R、K330R、E425N、K457R、E462R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、請求項6記載の操作されたCasタンパク質。
【請求項8】
置換が、D143R、T147R、E151R、およびE241Rからなる群より選択される、請求項7記載の操作されたCasタンパク質。
【請求項9】
1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での2つの置換を含む、請求項6記載の操作されたCasタンパク質。
【請求項10】
2つの置換が、D143での置換と、T147、E151、K154、E241、K330R、E425N、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、請求項9記載の操作されたCasタンパク質。
【請求項11】
2つの置換が、D143R、T147R、E151R、E151A、K154R、E241R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、請求項9記載の操作されたCasタンパク質。
【請求項12】
2つの置換が、D143R/T147R、D143R/E151R、D143R/E241R、D143R/E425N、D143R/E507R、D143R/N519R、D143R/E527R、D143R/E528R、D143R/R151S、D143/R151G、およびD143R/E151Aからなる群より選択される、請求項11記載の操作されたCasタンパク質。
【請求項13】
1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での3つの置換を含む、請求項9記載の操作されたCasタンパク質。
【請求項14】
3つの置換が、D143およびT147での置換と、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、請求項13記載の操作されたCasタンパク質。
【請求項15】
3つの置換が、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、請求項13記載の操作されたCasタンパク質。
【請求項16】
3つの置換が、D143R/T147R/K330R、D143R/T147R/K154R、D143R/T147R/E241R、D143R/T147R/E507R、D143R/T147R/N519R、D143R/T147R/E527R、D143R/T147R/E528R、D143R/T147R/E151S、D143R/T147R/E151G、およびD143R/T147R/E151Aからなる群より選択される、請求項15記載の操作されたCasタンパク質。
【請求項17】
1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での4つの置換を含む、請求項13記載の操作されたCasタンパク質。
【請求項18】
4つの置換が、D143、T147、およびK330での置換と、E151、K154、E241、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、請求項17記載の操作されたCasタンパク質。
【請求項19】
4つの置換が、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、請求項17記載の操作されたCasタンパク質。
【請求項20】
4つの置換が、D143R/T147R/K330R/E528R、D143R/T147R/K330R/E151A、およびD143R/T147R/K330R/E527Rからなる群より選択される、請求項19記載の操作されたCasタンパク質。
【請求項21】
1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での5つの置換を含む、請求項17記載の操作されたCasタンパク質。
【請求項22】
5つの置換が、D143、T147、K330、E151での置換と、K154、E241、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、請求項21記載の操作されたCasタンパク質。
【請求項23】
5つの置換が、D143R、T147R、E151R、E151A、K154R、E241R、K330R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、請求項21記載の操作されたCasタンパク質。
【請求項24】
5つの置換が、D143R/T147R/K330R/E151A/E528RおよびD143R/T147R/K330R/E151A/E527Rからなる群より選択される、請求項23記載の操作されたCasタンパク質。
【請求項25】
完全にまたは部分的にヌクレアーゼ不活性化されたCas(dCas)タンパク質である、請求項1記載の操作されたCasタンパク質。
【請求項26】
改変アミノ酸配列が、SEQ ID NO: 2、3、4、5、および6からなる群より選択される配列を含む、請求項1記載の操作されたCasタンパク質。
【請求項27】
野生型CRISPR RNA (crRNA)/トランス活性化型CRISPR RNA (tracrRNA)融合ヌクレオチド配列と少なくとも60%同一である操作されたcrRNA/tracrRNA融合ヌクレオチド配列を含むシングルガイドRNA(sgRNA)であって、
該野生型crRNA/tracrRNA融合ヌクレオチド配列が、(1)RNAステムループヘアピン構造に対応する3’領域、(2)該3’領域に近接するポリU領域、および(3)5’ポリG領域を含み;ならびに
該操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、該野生型crRNA/tracrRNA融合ヌクレオチド配列に対する1つまたは複数の改変を含み、該改変が、
該ポリU領域の少なくとも1つのUの置換、
該3’領域の少なくとも一部分の欠失;および
該5’ポリG領域の少なくとも一部分の欠失
からなる群より選択される、
前記シングルガイドRNA(sgRNA)。
【請求項28】
野生型crRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 7の配列である、請求項27記載のsgRNA。
【請求項29】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、ポリU領域の少なくとも1つのUの、Gによる置換を含む、請求項27記載のsgRNA。
【請求項30】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 8の配列を含む、請求項29記載のsgRNA。
【請求項31】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、3’領域の少なくとも一部分の欠失を含む、請求項29記載のsgRNA。
【請求項32】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 9の配列を含む、請求項31記載のsgRNA。
【請求項33】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、5’ポリG領域の少なくとも一部分の欠失を含む、請求項31記載のsgRNA。
【請求項34】
操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 10の配列を含む、請求項33記載のsgRNA。
【請求項35】
5’-TTTR-3’ヌクレオチド配列を有する5’プロトスペーサー隣接モチーフ(PAM)に対応するスペーサーヌクレオチド配列をさらに含む、請求項27記載のsgRNA。
【請求項36】
請求項1記載の操作されたCasタンパク質をコードする、核酸配列。
【請求項37】
請求項27記載のsgRNAをコードする、核酸配列。
【請求項38】
請求項36記載の核酸を含む、ベクター。
【請求項39】
1つまたは複数の核局在化シグナル(NLS)をさらに含む、請求項38記載のベクター。
【請求項40】
1つまたは複数の核局在化シグナルが、SV40 NLSおよびc-Myc NLSのうちの一方または両方を含む、請求項39記載のベクター。
【請求項41】
転写アクチベーターまたはエピジェネティック修飾アクチベーターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項42】
1つまたは複数の転写アクチベーターまたはエピジェネティック修飾アクチベーターが、VP64転写アクチベーター、トリパータイト(tripartite)VP64-p65-Rta(VPR)転写アクチベーター、p300転写アクチベーター、TET1転写アクチベーター、TET2転写アクチベーター、NFAT転写アクチベーター、NFkB転写アクチベーター、およびPRDM転写アクチベーターのうちの1つまたは複数を含む、請求項41記載のベクター。
【請求項43】
転写リプレッサーまたはエピジェネティック修飾リプレッサーを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項44】
1つまたは複数の転写リプレッサーまたはエピジェネティック修飾リプレッサーが、KRAB転写リプレッサー、DNMT3A DNAメチルトランスフェラーゼ、DNMT3B DNAメチルトランスフェラーゼ、DNMT3L DNAメチルトランスフェラーゼ、バイパータイト(bipartite)KRAB-DNMT3A (KA)リプレッサー、バイパータイトKRAB-DNMT3L (KL)リプレッサー、トリパータイトKRAB-DNMT3A-DNMT3L (KAL)リプレッサー、SID転写リプレッサー、EZH2転写リプレッサー、HP1ヘテロクロマチンタンパク質、Gli3転写リプレッサー、およびMBD3転写リプレッサーのうちの1つまたは複数を含む、請求項43記載のベクター。
【請求項45】
塩基エディターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項46】
プライムエディターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項47】
蛍光タンパク質を各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項48】
レトロンエレメントを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、請求項38記載のベクター。
【請求項49】
アデノ随伴ウイルス(AAV)ベクター、アデノウイルスベクター、レトロウイルスベクター、レンチウイルスベクター、または単純ヘルペスウイルス(HSV)ベクターである、請求項38記載のベクター。
【請求項50】
請求項1記載の操作されたCasタンパク質;および
sgRNA
を含む、システム。
【請求項51】
Casタンパク質;および
請求項27記載のsgRNA
を含む、システム。
【請求項52】
Casタンパク質が、請求項1記載の操作されたCasタンパク質である、請求項51記載のシステム。
【請求項53】
請求項36記載の核酸配列;および
sgRNAをコードする核酸配列
を含む、システム。
【請求項54】
Casタンパク質をコードする核酸配列;および
請求項37記載の核酸配列
を含む、システム。
【請求項55】
Casタンパク質をコードする核酸が、請求項36記載の核酸配列である、請求項54記載のシステム。
【請求項56】
細胞と請求項1記載の操作されたCasタンパク質とを接触させる工程を含む、細胞中の1つまたは複数の標的核酸を調節する方法。
【請求項57】
細胞が真核細胞である、請求項56記載の方法。
【請求項58】
真核細胞が動物細胞である、請求項57記載の方法。
【請求項59】
動物細胞が哺乳動物細胞である、請求項58記載の方法。
【請求項60】
哺乳動物細胞がヒト細胞である、請求項59記載の方法。
【請求項61】
細胞が幹細胞である、請求項57記載の方法。
【請求項62】
細胞が血液細胞である、請求項57記載の方法。
【請求項63】
細胞が免疫細胞である、請求項57記載の方法。
【請求項64】
細胞が植物細胞である、請求項57記載の方法。
【請求項65】
細胞がインビボにある、請求項56記載の方法。
【請求項66】
細胞がオルガノイドの一部である、請求項56記載の方法。
【請求項67】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つを活性化することを含む、請求項56記載の方法。
【請求項68】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つを抑制することを含む、請求項56記載の方法。
【請求項69】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つを編集することを含む、請求項56記載の方法。
【請求項70】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つのプライマーを編集することを含む、請求項56記載の方法。
【請求項71】
編集が、少なくとも1つの標的核酸をニッキングすることを含む、請求項69記載の方法。
【請求項72】
編集が、1つまたは複数の遺伝子ノックアウトを実行することを含む、請求項69記載の方法。
【請求項73】
編集が、1つまたは複数の遺伝子ノックインを実行することを含む、請求項69記載の方法。
【請求項74】
編集が、1つまたは複数の塩基置換を実行することを含む、請求項69記載の方法。
【請求項75】
調節が、ゲノムDNAを切断することを含む、請求項56記載の方法。
【請求項76】
調節が、ゲノムDNAを突然変異させることをさらに含む、請求項75記載の方法。
【請求項77】
突然変異が、1つまたは複数の挿入、1つまたは複数の欠失、1つまたは複数の置換、またはそれらの組み合わせを含む、請求項76記載の方法。
【請求項78】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つを標識することを含む、請求項56記載の方法。
【請求項79】
調節が、細胞内の1つまたは複数の標的核酸のうちの少なくとも1つの時空間的位置を変更することを含む、請求項56記載の方法。
【請求項80】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つのメチル化を変更することを含む、請求項56記載の方法。
【請求項81】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つのアセチル化を変更することを含む、請求項56記載の方法。
【請求項82】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのアセチル化を変更することを含む、請求項56記載の方法。
【請求項83】
調節が、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのメチル化を変更することを含む、請求項56記載の方法。
【請求項84】
請求項1記載の操作されたCasタンパク質を含む、薬学的組成物。
【請求項85】
治療有効量の薬学的に許容される賦形剤をさらに含む、請求項84記載の薬学的組成物。
【請求項86】
ある量の請求項84記載の薬学的組成物を対象へ投与する工程を含む、対象における遺伝性障害を予防または処置するための方法であって、該量が、遺伝性障害に関連する1つまたは複数の標的核酸を調節するために十分である、前記方法。
【請求項87】
前記量が、1つまたは複数の標的核酸中の1つまたは複数の突然変異を修正するために十分である、請求項86記載の方法。
【請求項88】
遺伝性障害が、X連鎖重症複合免疫不全、鎌状赤血球貧血、サラセミア、血友病、新生物、がん、加齢黄斑変性症、統合失調症、トリヌクレオチド反復障害、脆弱X症候群、プリオン関連障害、筋萎縮性側索硬化症、薬物中毒、自閉症、アルツハイマー病、パーキンソン病、嚢胞性線維症、血液および凝固疾患または障害、炎症、顔面肩甲上腕型筋ジストロフィー、網膜色素変性症、レーベル先天黒内障、緑内障、免疫関連疾患または障害、代謝性疾患および障害、肝臓疾患および障害、腎臓疾患および障害、筋/骨格疾患および障害、神経学的および神経疾患および障害、心血管疾患および障害、肺疾患および障害、ならびに眼疾患および障害からなる群より選択される、請求項86記載の方法。
【請求項89】
投与工程が、ウイルス、ナノ粒子、リポソーム、ミセル、ビロソーム、核酸複合体、タンパク質-RNAコンジュゲート、およびそれらの組み合わせからなる群より選択される送達システムを介する、請求項86記載の方法。
【請求項90】
投与工程が、シングルアデノ随伴ウイルス送達システムを介する、請求項89記載の方法。
【請求項91】
投与工程が、デュアルアデノ随伴ウイルス送達システムを介する、請求項89記載の方法。
【請求項92】
対象がヒトである、請求項86記載の方法。
【請求項93】
ある量の請求項84記載の薬学的組成物を対象へ投与する工程を含む、対象における感染症を処置する方法であって、該量が、感染症に関連する1つまたは複数の標的核酸を調節するために十分である、前記方法。
【請求項94】
1つまたは複数の標的核酸が、感染症を引き起こす感染因子の核酸である、請求項93記載の方法。
【請求項95】
前記量が、1つまたは複数の標的核酸のうちの少なくとも1つを切断またはニッキングするために十分である、請求項94記載の方法。
【請求項96】
感染因子がウイルスである、請求項94記載の方法。
【請求項97】
投与工程が、ウイルス、ナノ粒子、リポソーム、ミセル、ビロソーム、核酸複合体、タンパク質-RNAコンジュゲート、およびそれらの組み合わせからなる群より選択される送達システムを介する、請求項93記載の方法。
【請求項98】
投与工程が、シングルアデノ随伴ウイルス送達システムを介する、請求項97記載の方法。
【請求項99】
投与工程が、デュアルアデノ随伴ウイルス送達システムを介する、請求項97記載の方法。
【請求項100】
対象がヒトである、請求項93記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年9月1日に出願された米国仮出願第63/073,377号、および2021年5月21日に出願された米国仮出願第63/191,611号に対する優先権を主張し、これらの全開示は、すべての目的のために参照によりそれらの全体が組み入れられる。
【背景技術】
【0002】
背景
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeat)関連(Cas)タンパク質を伴う技術は、ゲノム工学適用に革命的な能力をもたらした(M. Jinek et al., Science 337, (2012): 816-21(非特許文献1); L. Cong et al., Science 339, (2013): 819-23(非特許文献2))。Casヌクレアーゼ(例えば、化膿レンサ球菌(Streptococcus pyogenes)Cas9、ラクノスピラ科(Lachnospiraceae)細菌Cas12a)は効率的かつ特異的なゲノム編集を可能にするが、転写およびエピゲノムエフェクターと融合されたヌクレアーゼ不活性化Cas(dCas)分子は、哺乳動物細胞における内在性遺伝子の標的制御を可能にする(L. S. Qi et al., Cell 152, (2013): 1173-83(非特許文献3); B. Zetsche et al., Cell 163, (2015): 759-71(非特許文献4); Y. E. Tak et al., Nat. Methods 14, (2017): 1163-66(非特許文献5); B. P. Kleinstiver et al., Nat. Biotechnol. 37, (2019): 276-82(非特許文献6); X. Xu & S. L. Qi, J. Mol. Biol. 431, (2019): 34-47(非特許文献7); D. C. Swarts, J. van der Oost, & M. Jinek, Mol. Cell 66, (2017): 221-33(非特許文献8))。これらのシステムは、遺伝性疾患に対する遺伝子治療への有望なアプローチを提供する(B. I. Hilton et al., Nat. Biotechnol. 33, (2015): 510-17(非特許文献9); T. S. Klann et al., Nat. Biotechnol. 35, (2017): 561-68(非特許文献10); C. Fellmann, B. G. Gowen, P. C. Lin, J. A. Doudna, & J. E. Corn, Nat. Rev. Drug Discov. 16, (2017): 89-100(非特許文献11))。しかし、それらの大きなサイズは、通常、適用を妨げる。例えば、アデノ随伴ウイルス(AAV)は限られたペイロードパッケージング容量(<4.5 kb)を有し、多くのCasエフェクターまたは融合タンパク質はこの限度を超えている。
【0003】
Cas9またはCas12a(通常1000~1500アミノ酸)と比較してより小さいサイズを有する、Cas14(Cas12f)およびCasΦを含む、天然に存在するCasエフェクターの発見は、コンパクトなCasエフェクターの天然リザーバーを提供した(L. B. Harrington et al., Science 362, (2018): 839-42(非特許文献12); T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016-23(非特許文献13); S. N. Takeda et al., Mol. Cell 81, (2021): 558-70(非特許文献14); P. Pausch et al., Science 369, (2020): 330-37(非特許文献15)) (
図1)。例えば、クラス2タイプV-Fシステム、CRISPR-Cas14(400~700アミノ酸)は、未培養古細菌由来の非常にコンパクトなRNA誘導型ヌクレアーゼのファミリーである。しかし、コンパクトなCas14エフェクターは哺乳動物細胞において有用であることは示されていない(L. B. Harrington et al., Science 362, (2018): 839-42(非特許文献12); T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016-23(非特許文献13))。同様に、報告されたコンパクトなCasΦは、真核細胞において中程度の活性のみを示すことが見出されている(P. Pausch et al., Science 369, (2020): 330-37(非特許文献15))。
【0004】
多くの既存のCRISPR-Casシステムの使用に関連するこれらおよび他の課題を考慮して、ゲノム工学適用のための改良されたCRISPR-Casシステム構成要素、例えば、コンパクトで高効率のCasエフェクターおよび/または関連するガイドRNA分子に対して、当技術分野において必要性がある。特に、哺乳動物細胞において十分に機能することができる改良されたCRISPR-Casシステムに対して必要性がある。本開示は、この必要性に対処し、関連するおよび他の利点を提供する。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】M. Jinek et al., Science 337, (2012): 816-21
【非特許文献2】L. Cong et al., Science 339, (2013): 819-23
【非特許文献3】L. S. Qi et al., Cell 152, (2013): 1173-83
【非特許文献4】B. Zetsche et al., Cell 163, (2015): 759-71
【非特許文献5】Y. E. Tak et al., Nat. Methods 14, (2017): 1163-66
【非特許文献6】B. P. Kleinstiver et al., Nat. Biotechnol. 37, (2019): 276-82
【非特許文献7】X. Xu & S. L. Qi, J. Mol. Biol. 431, (2019): 34-47
【非特許文献8】D. C. Swarts, J. van der Oost, & M. Jinek, Mol. Cell 66, (2017): 221-33
【非特許文献9】B. I. Hilton et al., Nat. Biotechnol. 33, (2015): 510-17
【非特許文献10】T. S. Klann et al., Nat. Biotechnol. 35, (2017): 561-68
【非特許文献11】C. Fellmann, B. G. Gowen, P. C. Lin, J. A. Doudna, & J. E. Corn, Nat. Rev. Drug Discov. 16, (2017): 89-100
【非特許文献12】L. B. Harrington et al., Science 362, (2018): 839-42
【非特許文献13】T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016-23
【非特許文献14】S. N. Takeda et al., Mol. Cell 81, (2021): 558-70
【非特許文献15】P. Pausch et al., Science 369, (2020): 330-37
【発明の概要】
【0006】
概要
概して、本明細書に提供されるのは、哺乳動物細胞における効率的な遺伝子活性化および塩基編集のための、例えばV-F型Cas14(529アミノ酸)から操作された、小型Casエフェクターである。天然のCasエフェクターが哺乳動物細胞中で機能しない場合、提供される操作Casエフェクターは、ガイドRNAおよびタンパク質工学を介して、これらの細胞タイプ中のレポーターおよび内在性遺伝子の活性化レベルを数千倍改善することができる。操作Casエフェクターは、さらに、オフターゲットが検出されずに高い特異性を有し、アデニン塩基エディターと融合された場合はロバストな塩基編集、およびロバストな欠失-挿入遺伝子編集を可能にすることができる。したがって、本明細書に開示される合成材料および関連方法は、遺伝子治療および細胞工学の分野におけるものを含む幅広い適用のための有用なツールを提供する。
【0007】
一局面において、本開示は、真核細胞中で機能的である操作されたCRISPR(Clustered Regularly Interspaced Short Palindromic Repeat)関連(Cas)タンパク質を提供する。Casタンパク質は、野生型Casタンパク質の天然アミノ酸配列と少なくとも80%同一である改変アミノ酸配列を含む。天然アミノ酸配列は、700アミノ酸未満の長さを有し、かつ、(D/E/K/N)X(R/F)(E/K)Nモチーフを含む。改変アミノ酸配列は、天然アミノ酸配列中に1つまたは複数の置換を含む。1つまたは複数の置換のうちの少なくとも1つは、(1)(D/E/K/N)X(R/F)(E/K)Nモチーフ内の位置、または(D/E/K/N)X(R/F)(E/K)Nモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、(2)天然アミノ酸配列の241位の位置、または天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、(3)天然アミノ酸配列の516位の位置、または天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、あるいは(4)天然アミノ酸配列中の荷電アミノ酸を有する位置、のいずれかの位置にある。
【0008】
別の局面において、本開示は、野生型CRISPR RNA (crRNA)/トランス活性化型CRISPR RNA (tracrRNA)融合ヌクレオチド配列と少なくとも60%同一である操作されたcrRNA/tracrRNA融合ヌクレオチド配列を含むシングルガイドRNA(sgRNA)を提供する。野生型crRNA/tracrRNA融合ヌクレオチド配列は、(1)RNAステムループヘアピン構造に対応する3’領域、(2)3’領域に近接するポリU領域、および(3)5’ポリG領域を含む。操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、野生型crRNA/tracrRNA融合ヌクレオチド配列に対する1つまたは複数の改変を含む。改変は、ポリU領域の少なくとも1つのUの、例えばGによる置換、3’領域の少なくとも一部分の欠失、5’ポリG領域の少なくとも一部分の欠失、またはこれらの改変のいずれかの組み合わせを含む。
【0009】
別の局面において、本開示は、本明細書に開示される操作されたCasタンパク質のいずれかをコードする核酸を提供する。別の局面において、本開示は、本明細書に開示されるsgRNA分子のいずれかをコードする核酸を提供する。
【0010】
別の局面において、本開示は、本明細書に開示される操作されたCasタンパク質のいずれかをコードする核酸、本明細書に開示されるsgRNA分子のいずれかをコードする核酸、またはその組み合わせを含む、ベクターを提供する。
【0011】
別の局面において、本開示は、sgRNAと本明細書に開示される操作されたCasタンパク質のいずれかとを含むシステムを提供する。別の局面において、本開示は、Casタンパク質と本明細書に開示されるsgRNA分子のいずれかとを提供する。別の局面において、本開示は、sgRNAをコードする核酸、および本明細書に開示される操作されたCasタンパク質のいずれかをコードする核酸の両方を含むシステムを提供する。別の局面において、本開示は、Casタンパク質をコードする核酸、および本明細書に開示されるsgRNA分子のいずれかをコードする核酸の両方を含むシステムを提供する。
【0012】
別の局面において、本開示は、細胞中の1つまたは複数の標的核酸を調節する方法を提供する。方法は、細胞と、本明細書に開示される操作されたCasタンパク質のいずれか、本明細書に開示されるsgRNA分子のいずれか、本明細書に開示される核酸のいずれか、本明細書に開示されるベクターのいずれか、または本明細書に開示されるシステムのいずれかとを接触させる工程を含む。
【0013】
別の局面において、本開示は薬学的組成物を提供する。薬学的組成物は、本明細書に開示される操作されたCasタンパク質のいずれか、本明細書に開示されるsgRNA分子のいずれか、本明細書に開示される核酸のいずれか、本明細書に開示されるベクターのいずれか、または本明細書に開示されるシステムのいずれかを含む。
【0014】
別の局面において、本開示は、対象における障害、例えば遺伝性障害を予防または処置する方法を提供する。方法は、本明細書に開示される薬学的組成物のいずれかの量を対象へ投与する工程を含み、ここで、量は、障害に関連する1つまたは複数の標的核酸を調節するために十分である。
【0015】
別の局面において、本開示は、対象における感染症を処置する方法を提供する。方法は、本明細書に開示される薬学的組成物のいずれかの量を対象へ投与する工程を含み、ここで、量は、感染症に関連する1つまたは複数の標的核酸を調節するために十分である。
【図面の簡単な説明】
【0016】
【
図1】操作された新規の小型Casエフェクター(CasMINI)が、より良い送達および発現を必要とするRNA誘導型標的ゲノム工学のためのツールとして役立ち得ることを示す。
【
図2】TRE3G-GFP HEK293Tレポーター細胞株におけるCRISPR活性化のためのdCas14-VPR融合体を試験するための図式的な構築物設計を提示する。ヌクレアーゼ不活性化dCas14を作製するために、Cas14のRuvCドメインに2つの突然変異を導入した。sgRNAは、TTTR PAMを有するTRE3Gプロモーターを標的とする。
【
図3】フローサイトメトリーによって測定された、
図2の構築物によるGFP活性化のパフォーマンスを示すグラフを提示する。標的群および非標的群の代表的なヒストグラムは、GFP陽性集団の割合、およびdCas14が哺乳動物細胞中で機能しないことを示す。
【
図4】sgRNA操作についての戦略の略図を提示する。デザイン1、G-U交換;デザイン2、ステムループ切り詰め;デザイン3、5'ポリG除去。
【
図5】野生型Cas14 sgRNAの略図を提示する。
【
図6】
図4のsgRNA操作デザイン1の略図を提示する。
【
図7】
図4のsgRNA操作デザイン2の略図を提示する。
【
図8】
図4のsgRNA操作デザイン3の略図を提示する。
【
図9】dCas14-VPR構築物および
図4~8の4つのターゲティングsgRNA、ならびに非ターゲティングsgRNAを含有するプラスミドをHEK293T TRE3Gレポーター株にトランスフェクトすることによるGFP活性化のパフォーマンスを示すグラフを提示する。左、バーは活性化GFP陽性パーセンテージを表し;右、バーはGFP平均値を表し;破線、非ターゲティングsgRNA群の平均値。ドットは3つの生物学的レプリケートを表す。倍率変化は非ターゲティングsgRNAに対して計算される。
【
図10】哺乳動物発現のための
図4~8の設計によるsgRNAプラスミドの設計の略図を提示する。
【
図11】
図4~8のsgRNA設計の各々についてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリー散布図を提示する。
【
図12】VPRをdCas14のNまたはC末端へ融合し、異なるSV40またはc-MYC核局在化シグナル(NLS)、および異なるリンカー(P2A、グリシン-セリンリンカー)と組み合わせることによるdCas14-VPR融合体についての設計のライブラリーの略図を提示する。
【
図13】
図12の異なるdCas14-VPR融合体の遺伝子活性化活性を特徴付けるパーセンテージ活性化GFP値を示すグラフである。ドットは3つの生物学的レプリケートを表す。破線は非ターゲティングsgRNAのGFP平均値を表す。非ターゲットsgRNAに対して正規化された活性化の倍率を示す値が表示されている。
【
図14】
図12の異なるdCas14-VPR融合体の遺伝子活性化活性を特徴付ける平均活性化GFP値を示すグラフである。ドットは3つの生物学的レプリケートを表す。破線は非ターゲティングsgRNAのGFP平均値を表す。非ターゲットsgRNAに対して正規化された活性化の倍率を示す値が表示されている。
【
図15】反復タンパク質操作戦略の概要を提示する。TRE3G-GFP HEK293T細胞株を使用し、トランスフェクションの48時間後にフローサイトメトリーによってdCas14-VPRバリアントのGFP活性化効率を測定する。GFP活性化について最良のdCas14-VPRバリアントを、スクリーニングの次のラウンドについての開始配列として使用する。
【
図16】報告されたCas12aタンパク質およびDtTnpBに対するCas14のアラインメントを示し、3つのRuvCドメインの保存された活性残基も共に示す。
【
図17】dCas14タンパク質の反復操作についての突然変異誘発のために選択された残基の位置を示す略図である。
【
図18】突然変異誘発の標的となるdCas14タンパク質残基、二本鎖DNA基質、sgRNA、および二量体の結合中心を示す略図である。
【
図19】
図15の反復タンパク質操作戦略の第1スクリーニングラウンドからの28個のバリアントのGFP活性化パフォーマンスを示すグラフを提示する。上部、GFP平均値。下部、GFPパーセンテージ値。lacZlを標的とする非ターゲットsgRNAに対して正規化されたGFP活性化の倍率が表示されている。
【
図20】非ターゲティングsgRNA(上部)およびターゲティングsgRNAを使用する野生型dCas14-VPRについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。
【
図21】非ターゲティングsgRNA(上部)およびターゲティングsgRNAを使用する野生型dCasMINI-V1-VPRについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。
【
図22】一重(赤色)、二重(青色)、三重(緑色)および四重(ベージュ色)突然変異を有するバリアントについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。値はGFP陽性細胞のパーセンテージを示す。
【
図23】
図15の反復タンパク質操作戦略の第2スクリーニングラウンドからの2つのライブラリー中のバリアントのGFP活性化パフォーマンスを示すグラフを提示する。
【
図24】非ターゲティングsgRNA(上部)およびターゲティングsgRNAを使用する野生型dCasMINI-V2-VPRについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。
【
図25】
図15の反復タンパク質操作戦略の第3および第4スクリーニングラウンドからのバリアントのGFP活性化パフォーマンスを示すグラフである。
【
図26】非ターゲティングsgRNA(上部)およびターゲティングsgRNAを使用する野生型dCasMINI-V3-VPRについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。
【
図27】非ターゲティングsgRNA(上部)およびターゲティングsgRNAを使用する野生型dCasMINI-V4-VPRについてのGFP陽性細胞のパーセンテージを示す代表的なフローサイトメトリーヒストグラムを提示する。
【
図28】GFP活性化の観点からのCasMINIパフォーマンスの徐々の改善を示すグラフである。各群の倍率変化は、遺伝子活性化を野生型dCas14-VPRに対して正規化することによって計算される。
【
図29】Cas14と代表的なCas12aタンパク質との間の配列アラインメントを示す。活性増強残基および保存されたモチーフ(D/E)XRKNを示す。
【
図30】dCasMINI-VPRシステムによる内在性遺伝子活性化を試験するために使用された構築物の略図、ならびに発現および核局在化を示す共焦点顕微鏡画像を示す。細胞核は、Hoechst 33342を用いて染色されている。バー、20μm。
【
図31】様々な単一のsgRNAと共にdCasMINI-VPRを使用するHEK293T細胞中での内在性HBGの遺伝子活性化からの結果を提示する。上部、sgRNA分布およびPAMの略図。転写開始部位(TSS)は「0」と指定され、各PAM中の最初の「T」の位置が表示されている。下部、上部のsgRNAの倍率変化が示されている。
【
図32】様々な単一のsgRNAと共にdCasMINI-VPRを使用するHEK293T細胞中での内在性IL1RNの遺伝子活性化からの結果を提示する。上部、sgRNA分布およびPAMの略図。転写開始部位(TSS)は「0」と指定され、各PAM中の最初の「T」の位置が表示されている。下部、上部のsgRNAの倍率変化が示されている。
【
図33】様々な単一のsgRNAと共にdCasMINI-VPRを使用するHEK293T細胞中での内在性ASCL1の遺伝子活性化からの結果を提示する。上部、sgRNA分布およびPAMの略図。転写開始部位(TSS)は「0」と指定され、各PAM中の最初の「T」の位置が表示されている。下部、上部のsgRNAの倍率変化が示されている。
【
図34】ヒト内在性IFNγ遺伝子を活性化することについてのdCasMINI-VPRを使用する10個のsgRNAのライブラリーの特徴付けからの結果を提示する。上部の略図は、転写開始部位(TSS、位置0)の500 bp以内を標的とするように設計された各sgRNAによって使用される結合部位およびPAMを示す。各PAMの最初の「T」の位置が示されている。下部のダイヤグラムは、qPCRを用いたすべてのsgRNAの特徴付けられた遺伝子活性化活性を示している。ドットは生物学的レプリケートを表す。
【
図35】ヒト内在性CD2遺伝子を活性化することについてのdCasMINI-VPRを使用する10個のsgRNAのライブラリーの特徴付けからの結果を提示する。上部の略図は、転写開始部位(TSS、位置0)の500 bp以内を標的とするように設計された各sgRNAによって使用される結合部位およびPAMを示す。各PAMの最初の「T」の位置が示されている。下部のダイヤグラムは、免疫染色とそれに続くフローサイトメトリーを用いたすべてのsgRNAの特徴付けられた遺伝子活性化活性を示している。ドットは生物学的レプリケートを表す。
【
図36】ヒト内在性CXCR4遺伝子を活性化することについてのdCasMINI-VPRを使用する10個のsgRNAのライブラリーの特徴付けからの結果を提示する。上部の略図は、転写開始部位(TSS、位置0)の500 bp以内を標的とするように設計された各sgRNAによって使用される結合部位およびPAMを示す。各PAMの最初の「T」の位置が示されている。下部のダイヤグラムは、免疫染色とそれに続くフローサイトメトリーを用いたすべてのsgRNAの特徴付けられた遺伝子活性化活性を示している。ドットは生物学的レプリケートを表す。
【
図37】ヒト内在性IFNγ遺伝子を活性化することについてのdCasMINI-VPRを使用する20個のsgRNAのライブラリーの特徴付けからの結果を提示する。上部の略図は、転写開始部位(TSS、位置0)の500 bp以内を標的とするように設計された各sgRNAによって使用される結合部位およびPAMを示す。各PAMの最初の「T」の位置が示されている。下部のダイヤグラムは、qPCRを用いたすべてのsgRNAの特徴付けられた遺伝子活性化活性を示している。ドットは生物学的レプリケートを表す。
【
図38】CasMINIおよびCas14を比較するためにdCasMINI-VPR、dCas14-VPR、およびsgRNAについて使用された構築物の略図を提示する。
【
図39】dCasMINI-VPRおよびdCas14-VPRによる内在性IFNγ遺伝子活性化を比較するグラフを提示する。dCas14-VPRと比べてのdCasMINI-VPRの改善の倍率変化を示す。
【
図40】dCasMINI-VPRおよびdCas14-VPRによる内在性HBB遺伝子活性化を比較するグラフを提示する。dCas14-VPRと比べてのdCasMINI-VPRの改善の倍率変化を示す。
【
図41】dCasMINI-VPRおよびdCas14-VPRによる内在性CD2遺伝子活性化を比較するグラフを提示する。dCas14-VPRと比べてのdCasMINI-VPRの改善の倍率変化を示す。
【
図42】dCasMINI-VPRおよびdCas14-VPRによる内在性CXCR4遺伝子活性化を比較するグラフを提示する。dCas14-VPRと比べてのdCasMINI-VPRの改善の倍率変化を示す。
【
図43】同じゲノム部位を標的とするsgRNAを使用するdCasMINI-VPRおよびLbdCas12a-VPRシステムの比較のために使用されたdCas12a-VPRおよびcrRNAの略図を提示する。
【
図44】
図43のdCasMINI-VPRおよびLbdCas12a-VPRシステム比較におけるGFPの活性化を示すグラフである。
【
図45】
図43のdCasMINI-VPRおよびLbdCas12a-VPRシステム比較における内在性遺伝子の活性化を示すグラフを提示する。
【
図46】
図43の比較からのdCasMINI-VPRおよびターゲティングsgRNA対非ターゲティングsgRNAがトランスフェクトされた細胞サンプルのRNA-seqデータを示すグラフである。2つの生物学的レプリケートの平均値がプロットされている。GFP転写産物についてのデータポイントが表示されている。
【
図47】
図43の比較からのdCas12a-VPRおよびターゲティングsgRNA対非ターゲティングsgRNAがトランスフェクトされた細胞サンプルのRNA-seqデータを示すグラフである。2つの生物学的レプリケートの平均値がプロットされている。GFP転写産物についてのデータポイントが表示されている。
【
図48】
図43~47の実験において試験された各条件についての生物学的レプリケートの比較を示すグラフを提示する。左上から右下へ、dCasMINI-VPR+非ターゲティングsgRNA、dCasMINI-VPR+ターゲティングsgRNA、dCas12a-VPR+非ターゲティングsgRNA、dCas12-VPR+ターゲティングsgRNA。各条件について計算されたピアソン相関が示されている。
【
図49】非ターゲティングガイド(左)およびターゲティングガイド(右)についてのdCasMINI-VPR対dCas12a-VPRのサイド・バイ・サイド比較の相関を示すグラフを提示する。各条件について計算されたピアソン相関が示されている。
【
図50】
図46および47のデータを重ね合わせるグラフである。
【
図51】dCasMINI-VPRおよびLbdCas12a-VPRそれぞれについての各遺伝子についての非ターゲティングおよびターゲティングレプリケート間のRNAシークエンシングライブラリー中の全遺伝子のlog
10[100万個当たりの転写産物(TPM)+1]値についての標準偏差の分布を示す
図43の比較からのグラフである。
【
図52】同じABE8eエディターへ融合されたdCasMINIまたはdCas12aを使用する塩基編集活性の比較を示す。概略図は、実験で使用された構築物を示す。グラフは、選択されたゲノム部位に対してdCas12a-ABEおよびdCasMINI-ABEを使用した場合に観察されたA・TからG・Cへの変換のパーセンテージを示す。NT、非ターゲティングsgRNAまたはcrRNA。T、T1、T2、ターゲティングsgRNAまたはcrRNA。
【
図53】転写リプレッサーKRABへ融合されたdCasMINIを使用してのGFPレポーター遺伝子のサイレンシングを示す。概略図は、実験で使用された構築物を示す。グラフは、dCasMINI-KRAB構築物で観察された抑制活性がdCas12a-KRABで観察されたものと同等であることを示している。
【
図54】3個の提供されるCasタンパク質のうちの1つおよび11個の異なるsgRNAのうちの1つを含むシステムを使用した場合に観察された、欠失、挿入、および置換を含む遺伝子編集インデルのパーセンテージを示すグラフを示すグラフを提示する。
【
図55】
図54の遺伝子編集試験におけるsgVEGFA05によって標的とされるゲノム領域からの代表配列およびsgRNAの対応するパーセンテージを示す。
【
図56】mCherry無し(デザイン1)またはmCherry有り(デザイン2)でTadA-8e(TadA*)をdCasMINIにN末端で融合させるか、TadA*をdCasMINIにC末端で融合させるか(デザイン3)、またはヘテロ二量体TadA-TadA*をdCasMINIにN末端で融合させる(デザイン4)ことによる、4つの設計についての構築物の略図を提示する。sgRNAの構築物を下部に示す。
【
図57】HEK293T細胞の3つの異なるゲノム部位における塩基編集効率についての4つのdCasMINI-ABEデザインを比較するグラフである。示されるデータは、ディープシークエンシングを使用したアライメントされたリード全体に対するA・TからG・Cへの変換を有するリードのパーセンテージである。データは、3つの生物学的レプリケートを代表するものである。GS0、ゲノム部位0。バーは平均値を表し、点は2つの独立した生物学的レプリケートを表す。
【
図58】塩基編集のためのサイド・バイ・サイド比較に用いたdCasMINI-ABEデザイン4およびそのsgRNAについての構築物ならびにdCas12a-ABEおよびそのcrRNAについての構築物の略図を提示する。
【
図59】同じゲノム部位を標的とするsgRNAまたはcrRNAを使用しての3つのゲノム部位でのdCasMINI-ABEおよびdCas12a-ABEを用いた塩基編集活性を示すグラフである。GS1、ゲノム部位1。バーは平均値を表し、データは3つの生物学的レプリケートを表す。
【
図60】IFNγ遺伝子座中の2つの部位、HBB遺伝子座中の3つの部位、およびVEGFA遺伝子座中の4つの部位を含む、dCasMINI-ABEデザイン4によるより多くのゲノム部位のHEK293T細胞における塩基編集効率を示すグラフである。示されるデータは、ディープシークエンシングを使用したアライメントされたリード全体に対するA・TからG・Cへの変換を有するリードのパーセンテージである。GS1~3、ゲノム部位1~3。バーは平均値を表し、点は3つの独立した生物学的レプリケートを表す。
【
図61】IFNγ遺伝子座中の部位3またはVEGFA遺伝子座の部位4を標的とするsgRNAおよびdCasMINI-ABEを使用したディープシークエンシングからの生のシークエンシングリードを示す。配列決定されたリード、およびアライメントされたリード全体中のパーセンテージが右側に示されている。CRISPResso2によって生成された総リードの>0.2%を有する代表的なバリアントが示されている。
【
図62】5つの部位についてのアデニンでのdCasMINI-ABEによるHEK293T細胞中のA・TからG・Cへの変換の塩基編集頻度を示すグラフである。ヌクレオチド位置の図が上部に示されている:TTTR PAM中の「R」は位置「0」である。矢印の付いているボックスは、観測された最も効率的なA・TからG・Cへの変換位置(位置3および4)を表す。示されるデータは、ディープシークエンシングを使用してのA・TからG・Cへの変換についてのリードの総数に対する特定の位置でのA・TからG・Cへの変換を有するリードの数である。GS1、ゲノム部位1。バーは平均値を表し、データは3つの独立した生物学的レプリケートを表す。
【
図63】遺伝子編集のためのヌクレアーゼ活性CasMINIおよびそのsgRNAをコードする構築物の略図、ならびに試験した3つのCasMINIバリアントを示す表を提示する。すべての実験はsgRNAデザイン2を使用した。
【
図64】HEK293T細胞におけるディープシークエンシングにより測定されたVEGFA遺伝子座の4つの部位での各CasMINIバリアントのインデル活性を示すグラフである。非ターゲティング(NT)sgRNAを用いたデータは代表的な陰性対照として示される。点線は野生型HEK293T細胞から検出された基底インデルレベルを示す。バーは平均値を表し、データは3つの独立した生物学的レプリケートを表す。
【
図65】HEK293T細胞におけるHBBおよびIFNγ遺伝子座の2つの部位での野生型Cas12f、CasMINI-V2、およびCasMINI-V3.1のインデル活性を示すグラフである。点線は、代表的な陰性対照としてsgNTを用いたデータを示す。バーは平均値を表し、データは3つの独立した生物学的レプリケートを表す。
【
図66】VEGFA遺伝子座中の部位3を標的とすることによる野生型Cas12f、CasMINI-V2、CasMINI-V3.1、CasMINI-V4を使用したディープシークエンシングからの生のシークエンシングリードを示す。配列決定されたリード、およびアライメントされたリード全体中のパーセンテージが右側に示されている。CRISPResso2によって生成された総リードの>0.2%を有する代表的なバリアントが示されている。
【
図67】8つの異なる部位(4つの活性部位を有するV4を除く)にわたるゲノム編集中の最大のインデル長を示す一連のグラフを提示する。データは、所与の長さの挿入または欠失を有するアライメントされたリードのパーセンテージを表す。
【
図68】8つの異なる部位(4つの活性部位を有するV4を除く)にわたるゲノム編集中の各ヌクレオチド位置でのインデル活性を示す一連のグラフを提示する。データは、その位置で欠失を有する総リードのパーセンテージを表す。上部の図は、各ヌクレオチド位置へアライメントされている、PAM(4 bp)およびスペーサー(23 bp)を示す。TTTR PAM中の「R」は位置「0」である。
【
図69】提供されるCasシステムの操作、特徴、および適用の図を提示する。
【発明を実施するための形態】
【0017】
詳細な説明
本明細書に提供されるのは、有利なことに哺乳動物細胞において非常に有効である、合成のコンパクトで効率的かつ特異的なゲノム工学システムを伴う材料および方法である。提供されるシステムは、例えば、シングルガイドRNA(sgRNA)設計の最適化および標的Casタンパク質工学を伴う特定の改良戦略によって開発した(M. T. Reetz & J. D. Carballeira, Mat. Protoc. 2, (2007): 891-903; G. Qu, A. Li, C. G Acevedo-Rocha, Z. Sun, & M. T. Reetz, Angew Chem Int. Ed. Engl. 59, (2020): 13204-31; X. Xu et al., Chembiochem 17 (2016): 56-64)。本明細書に記載される最適化および操作アプローチの多くは、以前に認識または実施されていない原理を使用する。これらのアプローチの結果として、提供されるバリアントは、例えば、真核(例えば哺乳動物)細胞におけるレポーターおよび内在性遺伝子発現を効率的に活性化することができる。特に、提供されるシステムは、野生型Cas14と比べて2~3ログの改善を示し、V-A型dCas12aシステムよりも優れており、検出可能なオフターゲット無しに哺乳動物細胞において特異的である。さらに、アデニン塩基エディターへ融合されると、システムは、A・TからG・Cへのロバストな変換を可能にすることができる。したがって、本明細書で開示されるシステムおよびプロセスは、真核細胞内のものならびに/または送達および機能のためにコンパクトなエフェクターサイズを必要とするものを含む、様々なゲノム工学適用のための有用なツールを提供する。
【0018】
ある態様は、天然に存在するV-F型Cas12f(Cas14)システムに由来する、CasMINIと命名された、操作された小型Casエフェクターを提供し、これは、一般的に使用されるSpCas9の1,368アミノ酸またはLbCas12aの1,228アミノ酸と比較してわずか529アミノ酸であった。天然のCas14は哺乳動物細胞では活性を示さないが、反復タンパク質スクリーニングおよび最適化sgRNA設計によって操作された合成CasMINIは、標的遺伝子の非常に効率的な活性化を示す。活性化の効率は、例えば、Cas12aシステムのそれと同等またはそれ以上である。また有利なことに、CasMINIシステムでは有意な検出可能なオフターゲット活性が検出されず、このシステムは塩基編集などの他の遺伝子工学適用に有用であることが示された。
【0019】
CRISPR-Casシステムの急速な進歩にもかかわらず、Casエフェクターの大きなサイズに起因して、特に真核細胞に関して、細胞工学またはインビボ送達についての生物工学的課題が残っている。本明細書に開示される操作されたコンパクト分子は、サイズを大幅に縮小しており、それらを医学的処置方法のための他のCasエフェクターよりも適したものにする。例えば、CasMINIシステムの小さいサイズは、それをアデノ随伴ウイルス(AAV)パッケージングと適合するものにし、脂質ナノ粒子を使用してmRNAペイロードを運ぶ場合の送達効率を高めることができる。さらに、小さいサイズは、有利に、大きなタンパク質ペイロードと比較した場合、提供される材料の免疫原性を低くする。さらに、研究において使用された一般的なRNAおよびタンパク質操作アプローチはまた、他の細菌種からの、Casエフェクター、例えばCas14/Cas12fエフェクターを操作することを可能にする。
【0020】
I.Casタンパク質
一局面において、操作されたCasタンパク質を提供する。本明細書に開示される操作されたCasタンパク質は、真核細胞において機能するその能力において驚くべき改良を提供する。操作されたCasタンパク質は、野生型Casタンパク質の天然アミノ酸配列と少なくとも80%同一である改変アミノ酸配列を有する。操作されたCasタンパク質の改変アミノ酸配列は、例えば、野生型Casタンパク質の天然アミノ酸配列と少なくとも80%、少なくとも82%、少なくとも84%、少なくとも86%、少なくとも88%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であり得る。
【0021】
CRISPRシステムは、一般に、2つのクラスに分けられ、クラス1システムは、外来核酸を分解するために複数のCasタンパク質の複合体を使用し、クラス2システムは、同じ目的のために単一の一般により大きなCasタンパク質を使用する。クラス1はI、III、およびIV型に分けられ、クラス2はII、V、およびVI型に分けられる。いくつかの態様において、操作されたCasタンパク質がその改変物である野生型Casタンパク質は、V型Casタンパク質である。野生型Casタンパク質は、例えば、V-A型Casタンパク質、V-B型Casタンパク質、V-C型Casタンパク質、V-D型Casタンパク質、V-E型Casタンパク質、V-F型Casタンパク質、V-G型Casタンパク質、V-H型Casタンパク質、V-I型Casタンパク質、V-J型Casタンパク質、V-K型Casタンパク質、またはV-U型Casタンパク質であり得る。いくつかの態様において、野生型Casタンパク質は、V-J型タンパク質、例えば、野生型CasФ(Cas12J)タンパク質である。
【0022】
いくつかの態様において、野生型Casタンパク質は、V-F型Casタンパク質、例えばCas14である。いくつかの態様において、野生型Casタンパク質は、SEQ ID NO: 1の天然アミノ配列を有するCas14(Cas12f)タンパク質である。Cas14タンパク質は、DNAおよび/またはRNAへ標的指向させ得るタイプVサブタイプF RNA誘導型核酸結合性タンパク質であり、典型的なCRISPRエフェクターよりも遥かに小さく、サイズが約400アミノ酸から約700アミノ酸の範囲である。配列比較に基づいて、3つのサブグループ、Cas14a、Cas14b、およびCas14cにクラスター化する、少なくとも24個の異なるCas14バリアントが同定されており、これらはすべて、V型CRISPR-Cas DNAターゲティング酵素に特徴的な予測RuvCヌクレアーゼドメインを共有する。Cas14タンパク質の小さいサイズは、初代細胞およびインビボ送達用の汎用性の高いアデノ随伴ウイルス(AAV)送達ビヒクルのパッケージングサイズ制限下に留まりながら、Cas14タンパク質およびそのエフェクタードメイン融合体が、多数のガイドRNAをコードするCRISPRアレイと対にされることを可能にする。細胞へのdCas14システムの標的指向型AAV送達は、永久的な遺伝子改変または頻繁な再投与を回避する補正ペイロードの長期発現を可能にすることができ、DNAヌクレアーゼ編集またはアンチセンスオリゴヌクレオチドなどの他の核酸ターゲティング技術を補完する。CRISPR-Cas14およびdCas14などの操作バリアントは、柔軟な核酸工学、遺伝子発現制御、および治療を可能にし、ゲノム編集および制御ツールボックスを拡張する。
【0023】
いくつかの態様において、操作されたCasタンパク質がその改変物である野生型Casタンパク質は、700アミノ酸未満の長さを有する天然アミノ酸配列を有する。この比較的小さいサイズは、提供される操作されたCasタンパク質にいくつかの利点を提供する。例えば、小さいサイズは、Casタンパク質が、そうでなければより大きなタンパク質を送達することができないであろうシングルアデノ随伴ウイルス送達システムを介して、宿主細胞、例えばヒト患者の細胞に送達されることを可能にし得る。天然アミノ酸配列は、例えば、500アミノ酸~700アミノ酸、例えば、500アミノ酸~620アミノ酸、540アミノ酸~660アミノ酸、560アミノ酸~680アミノ酸、または580アミノ酸~700アミノ酸である長さを有し得る。上限に関して、天然アミノ酸配列は、700アミノ酸未満、例えば、680アミノ酸未満、660アミノ酸未満、640アミノ酸未満、620アミノ酸未満、600アミノ酸未満、580アミノ酸未満、560アミノ酸未満、540アミノ酸、または520アミノ酸未満である長さを有し得る。下限に関して、天然アミノ酸配列は、500アミノ酸を超える、例えば、520アミノ酸を超える、540アミノ酸を超える、560アミノ酸を超える、580アミノ酸を超える、600アミノ酸を超える、620アミノ酸を超える、640アミノ酸を超える、660アミノ酸を超える、または700アミノ酸を超える長さを有し得る。より大きな長さ、例えば、700アミノ酸を超える、およびより小さな長さ、例えば、500アミノ酸未満も企図される。
【0024】
いくつかの態様において、操作されたCasタンパク質の改変アミノ酸配列は、天然アミノ酸配列中に1つまたは複数の置換を含み、これらの置換のうちの少なくともいくつかの位置は、操作されたCasタンパク質の特徴について驚くべき利点を有すると決定された1つまたは複数の特定の規則に従う。例えば、特定の置換規則は、真核細胞内で機能することができる操作されたCasタンパク質を産生する能力のために選択された。これらの特定の規則によれば、天然アミノ酸配列中の1つまたは複数の置換のうちの全部または一部は、(1)天然アミノ酸配列の(D/E/K/N)X(R/F)(E/K)Nモチーフ内または天然アミノ酸配列の(D/E/K/N)X(R/F)(E/K)Nモチーフから下流30アミノ酸以内、(2)天然アミノ酸配列の241位または天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内、(3)天然アミノ酸配列の516位または天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内、あるいは(4)天然アミノ酸配列中の荷電アミノ酸を有する、のいずれかである。
【0025】
いくつかの態様において、天然アミノ酸配列中の1つまたは複数の置換は、上記4つのカテゴリーのうちの1つ中の置換を含む。1つまたは複数の置換は、カテゴリー(1)、(2)、(3)または(4)のいずれかである1つのカテゴリー中の置換を含み得る。1つまたは複数の置換は、カテゴリー(1)、(2)、(3)、または(4)のいずれかである1つのカテゴリー中の置換からなり得る。いくつかの態様において、1つまたは複数の置換は、各々独立して、カテゴリー(1)および(2)、(1)および(3)、(1)および(4)、(2)および(3)、(2)および(4)、または(3)および(4)より選択される2つのカテゴリーのうちの1つ中にある。いくつかの態様において、1つまたは複数の置換は、2つのカテゴリー(1)および(2)、(1)および(3)、(1)および(4)、(2)および(3)、(2)および(4)、または(3)および(4)の各々中の置換を含む。いくつかの態様において、1つまたは複数の置換は、2つのカテゴリー(1)および(2)、(1)および(3)、(1)および(4)、(2)および(3)、(2)および(4)、または(3)および(4)の各々中の置換からなる。いくつかの態様において、1つまたは複数の置換は、各々独立して、3つのカテゴリー(1)、(2)および(3);(1)、(2)、および(4);(1)、(3)、および(4);または(2)、(3)、および(4)のうちの1つ中にある。いくつかの態様において、1つまたは複数の置換は、3つのカテゴリー(1)、(2)および(3);(1)、(2)、および(4);(1)、(3)、および(4);または(2)、(3)、および(4)の各々中の置換を含む。いくつかの態様において、1つまたは複数の置換は、3つのカテゴリー(1)、(2)および(3);(1)、(2)、および(4);(1)、(3)、および(4);または(2)、(3)、および(4)の各々中の置換からなる。いくつかの態様において、1つまたは複数の置換は、4つのカテゴリーの各々中の置換を含む。
【0026】
さらに、いくつかの態様において、天然アミノ酸配列中の1つまたは複数のアミノ酸置換のうちの全部または一部が、小さいアミノ酸、例えば、アルギニン(R)、アラニン(A)、セリン(S)、またはグリシン(G)へのものである、追加の置換規則に従う。いくつかの態様において、1つまたは複数の置換はRへの置換を含む。いくつかの態様において、1つまたは複数の置換の各々は、Rへの置換である。いくつかの態様において、1つまたは複数の置換はAへの置換を含む。いくつかの態様において、1つまたは複数の置換の各々はAへの置換である。いくつかの態様において、1つまたは複数の置換はSへの置換を含む。いくつかの態様において、1つまたは複数の置換の各々はSへの置換である。いくつかの態様において、1つまたは複数の置換はGへの置換を含む。いくつかの態様において、1つまたは複数の置換の各々はGへの置換である。いくつかの態様において、1つまたは複数の置換は、2つのアミノ酸RおよびA、RおよびS、RおよびG、AおよびS、AおよびG、またはSおよびGへの置換を含む。いくつかの態様において、1つまたは複数の置換は、各々独立して、2つのアミノ酸RおよびA、RおよびS、RおよびG、AおよびS、AおよびG、またはSおよびGのうちの1つへのものである置換からなる。いくつかの態様において、1つまたは複数の置換は、2つのアミノ酸RおよびA、RおよびS、RおよびG、AおよびS、AおよびG、またはSおよびGの各々への置換からなる。いくつかの態様において、1つまたは複数の置換は、3つのアミノ酸R、A、およびS;R、A、およびG;R、S、およびG;またはA、S、およびGへの置換を含む。いくつかの態様において、1つまたは複数の置換は、各々独立して、3つのアミノ酸R、A、およびS;R、A、およびG;R、S、およびG;またはA、S、およびGのうちの1つへのものである置換からなる。いくつかの態様において、1つまたは複数の置換は、3つのアミノ酸R、A、およびS;R、A、およびG;R、S、およびG;またはA、S、およびGの各々への置換からなる。いくつかの態様において、1つまたは複数の置換は、4つのアミノ酸R、A、S、およびGへの置換を含む。いくつかの態様において、1つまたは複数の置換は、各々独立して、4つのアミノ酸R、A、S、およびGのうちの1つへのものである置換からなる。いくつかの態様において、1つまたは複数の置換は、4つのアミノ酸R、A、S、およびGの各々への置換からなる。
【0027】
いくつかの態様において、天然アミノ酸配列は、(D/E/K/N)X(R/F)(E/K)Nモチーフを含み、改変アミノ酸配列は、モチーフ内またはモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置で1つまたは複数の置換を含む。改変アミノ酸配列は、例えば、モチーフ内またはモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内に1、2、3、4、5、6、7、8、9、10、または10を超える置換を含むことができる。天然アミノ酸配列に対する1つまたは複数の置換のうちの少なくとも1つは、モチーフ内またはモチーフから28アミノ酸以内、26アミノ酸以内、24アミノ酸以内、22アミノ酸以内、20アミノ酸以内、18アミノ酸以内、16アミノ酸以内、14アミノ酸以内、12アミノ酸以内、もしくは10アミノ酸以内にあり得る。いくつかの態様において、モチーフ内またはモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換のうちの少なくとも1つは、R、A、S、またはGへのものである。いくつかの態様において、モチーフ内またはモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換の各々は、独立して、R、A、S、またはGへのものである。いくつかの態様において、天然アミノ酸配列に対する置換の全てが、モチーフ内またはモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置にある。
【0028】
天然アミノ酸配列の(D/E/K/N)X(R/F)(E/K)Nモチーフ内または天然アミノ酸配列の(D/E/K/N)X(R/F)(E/K)Nモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置での1つまたは複数の置換は、例えば、天然アミノ酸配列の143、147、151、および154位より選択される位置での1つまたは複数の置換を含むことができる。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、D143、T147、E151、およびK154より選択される1つまたは複数の位置にある置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、D143R、T147R、E151R、およびK154Rより選択される1つまたは複数の置換を含む。
【0029】
いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列の241位または天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内に1つまたは複数の置換を含む。改変アミノ酸配列は、例えば、241位内または241位から上流30アミノ酸以内もしくは下流30アミノ酸以内に1、2、3、4、5、6、7、8、9、10、または10を超える置換を含むことができる。天然アミノ酸配列に対する1つまたは複数の置換のうちの少なくとも1つは、例えば、241位内または241位から28アミノ酸以内、26アミノ酸以内、24アミノ酸以内、22アミノ酸以内、20アミノ酸以内、18アミノ酸以内、16アミノ酸以内、14アミノ酸以内、12アミノ酸以内、もしくは10アミノ酸以内にあり得る。いくつかの態様において、241位内または241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換のうちの少なくとも1つは、R、A、S、またはGへのものである。いくつかの態様において、241位内または241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換の各々は、独立して、R、A、S、またはGへのものである。いくつかの態様において、天然アミノ酸配列に対する置換の全てが、241位内または241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置にある。
【0030】
天然アミノ酸配列の241位内または天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置での1つまたは複数の置換は、例えば、天然アミノ酸配列の241位での置換を含むことができる。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、E241位での置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、E241置換を含む。
【0031】
いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列の516位または天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内に1つまたは複数の置換を含む。改変アミノ酸配列は、例えば、516位内または516位から上流30アミノ酸以内もしくは下流30アミノ酸以内に1、2、3、4、5、6、7、8、9、10、または10を超える置換を含むことができる。天然アミノ酸配列に対する1つまたは複数の置換のうちの少なくとも1つは、例えば、516位内または516位から28アミノ酸以内、26アミノ酸以内、24アミノ酸以内、22アミノ酸以内、20アミノ酸以内、18アミノ酸以内、16アミノ酸以内、14アミノ酸以内、12アミノ酸以内、もしくは10アミノ酸以内にあり得る。いくつかの態様において、516位内または516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換のうちの少なくとも1つは、R、A、S、またはGへのものである。いくつかの態様において、516位内または516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の1つまたは複数の置換の各々は、独立して、R、A、S、またはGへのものである。いくつかの態様において、天然アミノ酸配列に対する置換の全てが、516位内または516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置にある。
【0032】
天然アミノ酸配列の516位内または天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置での1つまたは複数の置換は、例えば、天然アミノ酸配列の504、507、516、519、527、および528位より選択される位置での1つまたは複数の置換を含むことができる。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、N504、E507、N516、N519、E527、およびE528より選択される1つまたは複数の位置にある置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される1つまたは複数の置換を含む。
【0033】
いくつかの態様において、改変アミノ酸配列は、荷電アミノ酸を有する天然アミノ酸配列の位置で1つまたは複数の置換を含む。改変アミノ酸配列は、例えば、アスパラギン酸(D)、グルタミン酸(E)、リジン(K)、アルギニン(R)、またはヒスチジン(H)を有する位置での置換を含むことができる。いくつかの態様において、荷電アミノ酸についての1つまたは複数の置換のうちの少なくとも1つは、R、A、S、またはGへのものである。いくつかの態様において、荷電アミノ酸についての1つまたは複数の置換の各々は、独立して、R、A、S、またはGへのものである。いくつかの態様において、天然アミノ酸配列に対する置換の全てが、荷電アミノ酸を有する位置にある。
【0034】
いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、荷電アミノを有する位置での1つまたは複数の置換は、K11、K73、D143、E151、K154、E241、D318、K330、K457、E425、E462、E507、E527、およびE528より選択される1つまたは複数の位置にある置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、1つまたは複数の置換は、K11R、K73R、D143R、E151R、K154R、E241R、D318R、K330R、E425N、K457R、E462R、E507R、E527R、およびE528Rより選択される1つまたは複数の置換を含む。いくつかの態様において、改変アミノ酸配列はD143R置換を含む。いくつかの態様において、改変アミノ酸配列中の置換はD143Rのみである。いくつかの態様において、改変アミノ酸配列はSEQ ID NO: 2の配列である。
【0035】
いくつかの態様において、操作されたCasタンパク質の改変アミノ酸配列は、天然アミノ酸配列中に2つの置換を含む。いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列中に厳密に2つの置換を有する。いくつかの態様において、改変アミノ酸配列は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置での2つの置換を含む。いくつかの態様において、改変アミノ酸配列は厳密に2つの置換を有し、ここで、厳密に2つの置換は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置での2つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は厳密に2つの置換を有し、ここで、厳密に2つの置換は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置にある。
【0036】
いくつかの態様において、改変アミノ酸配列は、143位での置換と、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置での置換とを含む。いくつかの態様において、改変アミノ酸は、143位での置換と、厳密に1つの他の置換とを含み、ここで、厳密に1つの他の置換は、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143位での置換と、T147、E151、K154、E241、K330R、E425N、N504、E507、N516、N519、E527、およびE528位より選択される位置での置換とを含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143位での置換と、厳密に1つの他の置換とを含み、ここで、厳密に1つの他の置換は、T147、E151、K154、E241、K330R、E425N、N504、E507、N516、N519、E527、およびE528位より選択される位置にある。
【0037】
いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R、T147R、E151R、E151A、K154R、E241R、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される2つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に2つの置換を含み、ここで、2つの置換は、D143R、T147R、E151R、E151A、K154R、E241R、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R/T147R、D143R/E151R、D143R/E241R、D143R/E425N、D143R/E507R、D143R/N519R、D143R/E527R、D143R/E528R、D143R/R151S、D143/R151G、およびD143R/E151Aより選択される2つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に2つの置換を含み、ここで、2つの置換は、D143R/T147R、D143R/E151R、D143R/E241R、D143R/E425N、D143R/E507R、D143R/N519R、D143R/E527R、D143R/E528R、D143R/R151S、D143/R151G、およびD143R/E151Aより選択される。いくつかの態様において、改変アミノ酸配列は、D143R置換およびT147R置換を含む。いくつかの態様において、改変アミノ酸配列中の置換は、D143R置換およびT147R置換のみである。いくつかの態様において、改変アミノ酸配列はSEQ ID NO: 3の配列である。
【0038】
いくつかの態様において、操作されたCasタンパク質の改変アミノ酸配列は、天然アミノ酸配列中に3つの置換を含む。いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列中に厳密に3つの置換を有する。いくつかの態様において、改変アミノ酸配列は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置での3つの置換を含む。いくつかの態様において、改変アミノ酸配列は厳密に3つの置換を有し、ここで、厳密に3つの置換は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置での3つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は厳密に3つの置換を有し、ここで、厳密に3つの置換は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置にある。
【0039】
いくつかの態様において、改変アミノ酸配列は、143位での置換、147位での置換、ならびに151、154、241、330、425、504、507、516、519、527、および528位より選択される位置での置換を含む。いくつかの態様において、改変アミノ酸は、143位での置換、147位での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143位での置換、T147位での置換、ならびにE151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置での置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143位での置換、T147位での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置にある。
【0040】
いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される3つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に3つの置換を含み、ここで、3つの置換は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R/T147R/K330R、D143R/T147R/K154R、D143R/T147R/E241R、D143R/T147R/E507R、D143R/T147R/N519R、D143R/T147R/E527R、D143R/T147R/E528R、D143R/T147R/E151S、D143R/T147R/E151G、およびD143R/T147R/E151Aより選択される3つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に3つの置換を含み、ここで、3つの置換は、D143R/T147R/K330R、D143R/T147R/K154R、D143R/T147R/E241R、D143R/T147R/E507R、D143R/T147R/N519R、D143R/T147R/E527R、D143R/T147R/E528R、D143R/T147R/E151S、D143R/T147R/E151G、およびD143R/T147R/E151Aより選択される。いくつかの態様において、改変アミノ酸配列は、D143R置換、T147R置換、およびK330R置換を含む。いくつかの態様において、改変アミノ酸配列中の置換は、D143R置換、T147R置換、およびK330R置換のみである。いくつかの態様において、改変アミノ酸配列はSEQ ID NO: 4の配列である。
【0041】
いくつかの態様において、操作されたCasタンパク質の改変アミノ酸配列は、天然アミノ酸配列中に4つの置換を含む。いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列中に厳密に4つの置換を有する。いくつかの態様において、改変アミノ酸配列は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置での4つの置換を含む。いくつかの態様において、改変アミノ酸配列は厳密に4つの置換を有し、ここで、厳密に4つの置換は、143、147、151、154、241、330、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置での4つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は厳密に4つの置換を有し、ここで、厳密に4つの置換は、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528より選択される位置にある。
【0042】
いくつかの態様において、改変アミノ酸配列は、143位での置換、147位での置換、330位での置換、ならびに151、154、241、425、504、507、516、519、527、および528位より選択される位置での置換を含む。いくつかの態様において、改変アミノ酸は、143位での置換、147位での置換、330位での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、151、154、241、425、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143位での置換、T147位での置換、K330での置換、ならびにE151、K154、E241、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置での置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143位での置換、T147位での置換、K330位での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、E151、K154、E241、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置にある。
【0043】
いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される4つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に4つの置換を含み、ここで、4つの置換は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R/T147R/K330R/E528R、D143R/T147R/K330R/E151A、およびD143R/T147R/K330R/E527Rより選択される4つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に4つの置換を含み、ここで、4つの置換は、D143R/T147R/K330R/E528R、D143R/T147R/K330R/E151A、およびD143R/T147R/K330R/E527Rより選択される。いくつかの態様において、改変アミノ酸配列は、D143R置換、T147R置換、K330R置換、およびE528R置換を含む。いくつかの態様において、改変アミノ酸配列中の置換は、D143R置換、T147R置換、K330R置換、およびE528R置換のみである。いくつかの態様において、改変アミノ酸配列はSEQ ID NO: 5の配列である。
【0044】
いくつかの態様において、操作されたCasタンパク質の改変アミノ酸配列は、天然アミノ酸配列中に5つの置換を含む。いくつかの態様において、改変アミノ酸配列は、天然アミノ酸配列中に厳密に5つの置換を有する。いくつかの態様において、改変アミノ酸配列は、143、147、151、154、241、330、504、507、516、519、527、および528位より選択される位置での5つの置換を含む。いくつかの態様において、改変アミノ酸配列は厳密に5つの置換を有し、ここで、厳密に5つの置換は、143、147、151、154、241、330、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143、T147、E151、K154、E241、K330、N504、E507、N516、N519、E527、およびE528より選択される位置での5つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は厳密に5つの置換を有し、ここで、厳密に5つの置換は、D143、T147、E151、K154、E241、K330、N504、E507、N516、N519、E527、およびE528より選択される位置にある。
【0045】
いくつかの態様において、改変アミノ酸配列は、143位での置換、147位での置換、330位での置換、151位での置換、ならびに154、241、504、507、516、519、527、および528位より選択される位置での置換を含む。いくつかの態様において、改変アミノ酸は、143位での置換、147位での置換、330位での置換、151位での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、151、154、241、504、507、516、519、527、および528位より選択される位置にある。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸配列は、D143位での置換、T147位での置換、K330での置換、E151での置換、ならびにK154、E241、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置での置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143位での置換、T147位での置換、K330位での置換、E151での置換、および厳密に1つの他の置換を含み、ここで、厳密に1つの他の置換は、K154、E241、E425、N504、E507、N516、N519、E527、およびE528位より選択される位置にある。
【0046】
いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される5つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に5つの置換を含み、ここで、5つの置換は、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、N504R、E507R、N516R、N519R、E527R、およびE528Rより選択される。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は、D143R/T147R/K330R/E151A/E527RおよびD143R/T147R/K330R/E151A/E528Rより選択される5つの置換を含む。いくつかの態様において、例えば、天然アミノ酸配列がSEQ ID NO: 1の配列である場合、改変アミノ酸は厳密に5つの置換を含み、ここで、5つの置換は、D143R/T147R/K330R/E151A/E527RおよびD143R/T147R/K330R/E151A/E528Rより選択される。いくつかの態様において、改変アミノ酸配列は、D143R置換、T147R置換、K330R置換、E528R置換、およびE151A置換を含む。いくつかの態様において、改変アミノ酸配列中の置換は、D143R置換、T147R置換、K330R置換、E528R置換、およびE151A置換のみである。いくつかの態様において、改変アミノ酸配列はSEQ ID NO: 6の配列である。
【0047】
いくつかの態様において、操作されたCasタンパク質は、Casタンパク質が完全にまたは部分的にヌクレアーゼ不活性化されたCas(dCas)タンパク質であるようにさらに改変される。そのような変更または改変は、ヌクレアーゼ活性またはヌクレアーゼドメインを不活性化するために1つまたは複数のアミノ酸を変更すること、ならびに、ヌクレアーゼ活性を示すポリペプチド配列(単数または複数)(すなわち、ヌクレアーゼドメイン)がCas14タンパク質に存在しないように、ヌクレアーゼ活性を示すポリペプチド配列(単数または複数)(すなわち、ヌクレアーゼドメイン)を除去することを含む。したがって、いくつかの態様において、ヌクレアーゼ-ヌルCas14タンパク質(dCas14)は、ヌクレアーゼ活性を不活性化するように改変されたポリペプチド配列、またはヌクレアーゼ活性を不活性化するためのポリペプチド配列(単数または複数)の除去を含む。dCas14タンパク質は、ヌクレアーゼ活性が不活性化されていても、標的核酸へ結合する能力を保持している。したがって、dCas14タンパク質は、核酸結合に必要なポリペプチド配列(単数または複数)を含む。いくつかの態様において、D326およびD510の一方または両方が、ヌクレアーゼ活性を減少、実質的に排除、または排除するアミノ酸で置換される。いくつかの態様において、D326およびD510の一方または両方が、アラニンで置換される。
【0048】
いくつかの態様において、操作されたCasタンパク質は、転写調節ドメインまたはエピジェネティック修飾ドメインなどのエフェクタードメインへ付着され、結合され、またはこれと融合される。いくつかの態様において、エフェクタードメインは、操作されたCasタンパク質のC末端へ融合される。いくつかの態様において、エフェクタードメインは、操作されたCasタンパク質のN末端へ融合される。いくつかの態様において、エフェクタードメインは、細胞内局在化シグナルを含む。いくつかの態様において、細胞内局在化シグナルは、細胞小器官局在化シグナル、例えば核局在化シグナル(NLS)、核外輸送シグナル(NES)、またはミトコンドリア局在化シグナルである。いくつかの態様において、エフェクタードメインは、(i)核酸(例えば、DNAおよび/またはRNA)を切断する、(ii)RNA安定性に影響を与える、(iii)ヌクレオチドを編集する、(iv)転写を活性化する、(v)転写を抑制する、(iv)翻訳を活性化する、(v)翻訳を抑制する、(vi)核酸(例えば、DNAおよび/またはRNA)をメチル化する、(vii)核酸(例えば、DNAおよび/またはRNA)を脱メチル化する、(viii)RNAスプライシングに影響を与える、(ix)アフィニティー精製または免疫沈降を可能にする(例えば、FLAG、HA、ビオチン、またはHALOタグ)、および/または(x)近接ベースのタンパク質標識および同定を可能にすることができるポリペプチドを含む。
【0049】
II.ガイドRNA
別の局面において、シングルガイドRNA(sgRNA)タンパク質を提供する。本明細書に開示されるsgRNAは、真核細胞において機能するその能力において驚くべき改良を提供する。sgRNAタンパク質は、野生型CRISPR RNA (crRNA)/トランス活性化型CRISPR RNA (tracrRNA)融合ヌクレオチド配列と少なくとも60%同一である操作されたcrRNA/tracrRNA融合ヌクレオチド配列を有する。操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、例えば、野生型tracrRNAヌクレオチド配列と少なくとも60%、少なくとも64%、少なくとも68%、少なくとも72%、少なくとも76%、少なくとも80%、少なくとも82%、少なくとも84%、少なくとも86%、少なくとも88%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%同一であり得る。範囲に関して、いくつかの態様において、操作crRNA/tracRNA融合ヌクレオチド配列は、野生型crRNA/tracRNA融合ヌクレオチド配列と60%~100%、例えば、60%~82%、63%~86%、66%~90%、70%~95%、または74%~100%同一である。いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列は、SEQ ID NO: 7の配列中に含まれる。
【0050】
いくつかの態様において、操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、野生型crRNA/tracrRNA融合ヌクレオチド配列に対して1つまたは複数の改変を含み、ここで、改変は、提供されるsgRNAの特徴について驚くべき利点を有すると決定された1つまたは複数の特定の規則に従う。例えば、特定の改変規則は、真核細胞内で機能することができるsgRNAを産生する能力のために選択された。これらの特定の規則によれば、野生型crRNA/tracrRNA融合ヌクレオチド配列に対する改変のうちの全部または一部は、(1)野生型ヌクレオチド配列のポリU領域の少なくとも1つのUの、例えばGによる置換、(2)RNAステムループヘアピン構造に対応する野生型配列の3’領域の少なくとも一部分の欠失、または(3)野生型ヌクレオチド配列の5’ポリG領域の少なくとも一部分の欠失、のいずれかを伴う。
【0051】
いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列に対する1つまたは複数の改変は、上記3つのカテゴリーのうちの1つ中の改変を含む。1つまたは複数の改変は、カテゴリー(1)、(2)、または(3)のいずれかである1つのカテゴリー中の改変を含み得る。1つまたは複数の改変は、カテゴリー(1)、(2)、または(3)のいずれかである1つのカテゴリー中の改変からなり得る。いくつかの態様において、1つまたは複数の改変は、2つのカテゴリー(1)および(2)、(1)および(3)、または(2)および(3)の各々中の改変を含む。いくつかの態様において、1つまたは複数の改変は、2つのカテゴリー(1)および(2)、(1)および(3)、または(2)および(3)の各々中の改変からなる。いくつかの態様において、1つまたは複数の改変は、3つのカテゴリー(1)、(2)および(3)の各々中の改変を含む。
【0052】
いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列は、配列の3’末端に近接するポリU領域を含む。ポリU領域は、例えば、4個のウラシルヌクレオチド、5個のウラシルヌクレオチド、6個のウラシルヌクレオチド、7個のウラシルヌクレオチド、8個のウラシルヌクレオチド、または8個を超えるウラシルヌクレオチドを含み得る。いくつかの態様において、提供されるsgRNAの操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、ポリU領域の少なくとも1つのUの置換を含み、ここで、各置換は、独立して、Gへのものである。操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、ポリU領域の1個だけのウラシルヌクレオチドのGへの、ポリU領域の2個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の3個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の4個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の5個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の6個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の7個だけのウラシルヌクレオチドの各々Gへの、ポリU領域の8個だけのウラシルヌクレオチドの各々Gへの、またはポリU領域の8個を超えるウラシルヌクレオチドの各々Gへの、置換を含み得る。いくつかの態様において、ポリU領域の各ウラシルヌクレオチドがGで置換される。いくつかの態様において、ポリU領域中の置換は連続的である。いくつかの態様において、ポリU領域中の置換は非連続的である。いくつかの態様において、操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、SEQ ID NO: 8の配列を含む。
【0053】
いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列は、RNAステムループヘアピン構造に対応する3’領域を含み、提供されるsgRNAの操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、3’領域の少なくとも一部分の欠失を含む。操作されたcrRNA/tracrRNA融合ヌクレオチド配列の作製において欠失される、RNAヘアピン構造に対応する3’野生型crRNA/tracrRNA領域の量は、例えば、1%~100%、例えば、1%~60%、10%~70%、20%~80%、30%~90%、または40%~100%であり得る。上限に関して、操作されたcrRNA/tracrRNA融合ヌクレオチド配列の作製において欠失される、RNAヘアピン構造に対応する3’野生型crRNA/tracrRNA領域の量は、100%未満、例えば、90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、または10%未満であり得る。下限に関して、操作されたcrRNA/tracrRNA融合ヌクレオチド配列の作製において欠失される、RNAヘアピン構造に対応する3’野生型crRNA/tracrRNA領域の量は、例えば、少なくとも1%、例えば、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、または少なくとも90%であり得る。いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列に対する唯一の改変は、RNAヘアピン構造に対応する3’領域の少なくとも一部分の欠失である。いくつかの態様において、操作crRNA/tracrRNAヌクレオチド配列は、SEQ ID NO: 9の配列を含む。
【0054】
いくつかの態様において、野生型crRNA/tracrRNA融合ヌクレオチド配列は、配列の5’末端に近接するポリG領域を含む。ポリG領域は、例えば、3個のグアニンヌクレオチド、4個のグアニンヌクレオチド、5個のグアニンヌクレオチド、6個のグアニンヌクレオチド、7個のグアニンヌクレオチド、または7個を超えるウラシルヌクレオチドを含み得る。いくつかの態様において、提供されるsgRNAの操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、ポリG領域の少なくとも1つのグアニンの欠失を含む。操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、ポリG領域の1個だけのグアニンヌクレオチド、ポリG領域の2個だけのグアニンヌクレオチド、ポリG領域の3個だけのグアニンヌクレオチド、ポリG領域の4個だけのグアニンヌクレオチド、ポリG領域の5個だけのグアニンヌクレオチド、ポリG領域の6個だけのグアニンヌクレオチド、ポリG領域の7個だけのグアニンヌクレオチド、またはポリG領域の7個を超えるグアニンヌクレオチドの欠失を含み得る。いくつかの態様において、ポリG領域の各グアニンヌクレオチドが欠失される。いくつかの態様において、操作されたcrRNA/tracrRNA融合ヌクレオチド配列は、SEQ ID NO: 10の配列を含む。
【0055】
いくつかの態様において、提供されるsgRNAは、5’-TTTR-3’ヌクレオチド配列を有する5’プロトスペーサー隣接モチーフ(PAM)に対応するスペーサーヌクレオチド配列を含む。いくつかの態様において、提供されるsgRNAに関連する標的核酸は、dsDNAである。そのような態様において、dsDNAターゲティング特異性は、少なくとも部分的に、2つのパラメーターによって決定される:標的dsDNA中のプロトスペーサー(非相補的DNA鎖上のsgRNAスペーサーに対応する標的dsDNA中の配列)を標的とするsgRNAスペーサー、および非相補的DNA鎖上のプロトスペーサーのすぐ5'(上流)に位置する短いPAM配列。いくつかの態様において、PAMは5′-TTTG-3′または5′-TTTA-3′である。いくつかの態様において、PAMは5′-TTTG-3′である。いくつかの態様において、PAMは5′-TTTA-3′である。
【0056】
III.核酸
別の局面において、核酸配列を提供し、ここで、核酸配列は、本明細書に開示されかつ上記にさらに詳細に記載される操作されたCasタンパク質のいずれか、または本明細書に開示されかつ上記にさらに詳細に記載されるsgRNA分子のいずれかをコードする。いくつかの態様において、核酸配列は、DNAを含むか、またはDNAからなる。いくつかの態様において、核酸配列は、RNA、例えばmRNAを含むか、またはRNA、例えばmRNAからなる。
【0057】
IV.ベクター
別の局面において、ベクターを提供し、ここで、ベクターは、本明細書に開示される操作されたCasタンパク質のいずれかをコードする少なくとも1つの核酸配列、または本明細書に開示されるsgRNA分子のいずれかをコードする少なくとも1つの核酸配列を含む。いくつかの態様において、提供されるベクターは、本明細書に開示される操作されたCasタンパク質のいずれかをコードする少なくとも1つの核酸配列、および本明細書に開示されるsgRNA分子のいずれかをコードする少なくとも1つの核酸配列を含む。
【0058】
いくつかの態様において、提供されるベクターは、1つまたは複数の核局在化シグナル(NLS)を含む。いくつかの態様において、1つまたは複数の核局在化シグナルはSV40 NLSを含む。いくつかの態様において、1つまたは複数の核局在化シグナルはc-Myc NLSを含む。いくつかの態様において、1つまたは複数の核局在化シグナルは、SV40 NLSおよびc-Myc NLSの両方を含む。いくつかの態様において、1つまたは複数の核局在化シグナルは、SV40 NLSの2つ以上のコピーを含む。いくつかの態様において、1つまたは複数の核局在化シグナルは、c-Myc NLSの2つ以上のコピーを含む。いくつかの態様において、1つまたは複数の核局在化シグナルは、SV40 NLSの1つまたは複数のコピー、例えば2つ以上のコピー、およびc-Myc NLSの1つまたは複数のコピー、例えば2つ以上のコピー、の両方を含む。
【0059】
いくつかの態様において、提供されるベクターは、転写アクチベーターを各々独立してコードする1つまたは複数の追加の核酸配列を含む。提供されるベクターとの使用に適した転写アクチベーターとしては、VP64転写アクチベーター、トリパータイト(tripartite)VP64-p65-Rta(VPR)転写アクチベーター、p300転写アクチベーター、TET1転写アクチベーター、TET2転写アクチベーター、HSF1転写アクチベーター、NFAT転写アクチベーター、NFkB転写アクチベーター、PRDM転写アクチベーター、およびそれらの組み合わせが挙げられるが、これらに限定されない。
【0060】
いくつかの態様において、提供されるベクターは、転写リプレッサーを各々独立してコードする1つまたは複数の追加の核酸配列を含む。提供されるベクターとの使用に適した転写リプレッサーとしては、KRAB転写リプレッサー、バイパータイト(bipartite)KRAB-DNMT3L (KL)転写リプレッサー、トリパータイトKRAB-DNMT3A-DNMT3L (KAL)転写リプレッサー、SID転写リプレッサー、HP1転写リプレッサー、EZH2転写リプレッサー、およびそれらの組み合わせが挙げられるが、これらに限定されない。
【0061】
いくつかの態様において、提供されるベクターは、2つ以上のレポーター遺伝子または内在性遺伝子の同時活性化または抑制を可能にするように構成された1つまたは複数のsgRNAを含む。
【0062】
いくつかの態様において、提供されるベクターは、塩基エディターをさらに含む。いくつかの態様において、提供されるベクターは、プライムエディターをさらに含む。いくつかの態様において、提供されるベクターは、蛍光タンパク質をさらに含む。いくつかの態様において、提供されるベクターは、ウイルスベクターである。提供されるベクターは、例えば、アデノ随伴ウイルス(AAV)ベクター、アデノウイルスベクター、レトロウイルスベクター、レンチウイルスベクター、または単純ヘルペスウイルス(HSV)ベクターであり得る。
【0063】
V.システム
別の局面において、Casタンパク質およびsgRNAを含む、システム、例えばリボヌクレオチド複合体を提供する。いくつかの態様において、提供されるシステムのCasタンパク質は、本明細書に開示されかつ上記にさらに詳細に記載される操作されたCasタンパク質のいずれかである。いくつかの態様において、提供されるシステムのsgRNAは、本明細書に開示されかつ上記にさらに詳細に記載されるsgRNA分子のいずれかである。いくつかの態様において、提供されるシステムは、1つまたは複数の、例えば2つ以上の、本明細書に開示されるCasタンパク質、および1つまたは複数の、例えば2つ以上の、本明細書に開示されるsgRNA分子、の両方を含む。
【0064】
別の局面において、Casタンパク質をコードする核酸およびsgRNAをコードする核酸を含むシステムを提供する。いくつかの態様において、Casタンパク質をコードする核酸は、本明細書に開示されかつ上記にさらに詳細に記載されるもののいずれかである。いくつかの態様において、sgRNAをコードする核酸は、本明細書に開示されかつ上記にさらに詳細に記載されるもののいずれかである。いくつかの態様において、提供されるシステムは、1つまたは複数の、例えば2つ以上の、本明細書に開示されるようなCasタンパク質を各々独立してコードする核酸、および1つまたは複数の、例えば2つ以上の、本明細書に開示されるようなsgRNA分子を各々独立してコードする核酸、の両方を含む。
【0065】
一般に、提供されるシステムは、DNA分子またはRNA分子中に存在し得る標的配列の部位におけるCasタンパク質およびsgRNAを含む核酸ターゲティング複合体の形成を促進するエレメントによって特徴付けられる。本明細書において使用される場合、用語「標的配列」は、sgRNA中のガイド配列が相補性を有するように設計される配列(本明細書では「スペーサー」または「スペーサー配列」とも呼ばれる)を指し、ここで、標的配列とsgRNAとの間のハイブリダイゼーションは、標的配列へのCasタンパク質の局在化を可能にする。標的配列とsgRNAとの間のハイブリダイゼーションを可能にするのに十分な相補性があれば、完全な相補性は必ずしも必要ではない。いくつかの態様において、標的配列は、細胞の核または細胞質中に位置する。いくつかの態様において、標的配列は、真核細胞の細胞小器官、例えば、ミトコンドリアまたは葉緑体内にあってもよい。
【0066】
いくつかの態様において、標的ヌクレオチド配列は、遺伝子配列中に存在する。いくつかの態様において、標的ヌクレオチド配列は、遺伝子のプロモーター領域中に存在し、遺伝子のセンス鎖またはアンチセンス鎖中に存在することができる。いくつかの態様において、標的ヌクレオチド配列は、遺伝子の5'UTR領域中に存在し、遺伝子のセンス鎖またはアンチセンス鎖中に存在することができる。いくつかの態様において、標的ヌクレオチド配列は、遺伝子の5'UTR/RBS領域中に存在し、遺伝子のセンス鎖またはアンチセンス鎖中に存在することができる。いくつかの態様において、標的ヌクレオチド配列は、遺伝子のコード領域中に存在し、遺伝子のセンス鎖またはアンチセンス鎖中に存在することができる。
【0067】
いくつかの態様において、提供されるシステムの1つまたは複数のエレメントの発現を駆動する1つまたは複数のベクターが、システムのエレメントの発現が宿主細胞内の1つまたは複数の標的配列部位での核酸ターゲティング複合体の形成を指示するように、宿主細胞中へ導入される。例えば、Casタンパク質およびsgRNAは、それぞれ、別々のベクター上の別々の調節エレメントへ機能的に連結されることができる。あるいは、同一または異なる調節エレメントから発現される2つ以上のエレメントを単一のベクター中で組み合わせることができ、1つまたは複数の追加のベクターは、最初のベクター中に含まれないシステムの任意のコンポーネントを提供する。単一のベクター中で組み合わされるシステムエレメントは、あるエレメントを第2のエレメントに対して5′(「上流」)または3′(「下流」)に置くなど、任意の好適な配向で配置することができる。あるエレメントのコード配列を、第2のエレメントのコード配列と同じまたは反対の鎖上に置き、同じまたは反対の方向に配向させることができる。いくつかの態様において、単一のプロモーターが、Casタンパク質およびsgRNAをコードする転写産物の発現を駆動する。いくつかの態様において、Casタンパク質およびsgRNAは、同じプロモーターへ機能的に連結され、これから発現される。
【0068】
VI.薬学的組成物
別の局面において、薬学的組成物を提供する。提供される薬学的組成物は、1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載される操作されたCasタンパク質のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるsgRNA分子のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載される核酸のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるベクターのいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるシステムのいずれか;またはそれらの任意の組み合わせを含む。
【0069】
いくつかの態様において、薬学的組成物は、治療有効量の薬学的に許容される賦形剤を含む。いくつかの態様において、薬学的組成物は、投与、例えば哺乳動物への投与に適した製剤中に希釈剤、アジュバント、または担体のうちの1つまたは複数を含む。好適な希釈剤、アジュバント、または担体は、例えば、脂質、例えば、リポソーム、例えば、リポソームデンドリマー;液体、例えば、水および油(石油、動物、植物または合成起源のもの、例えば、落花生油、大豆油、鉱油、ゴマ油などを含む);アカシアガム;ゼラチン;でんぷんペースト;タルク;ケラチン;コロイダルシリカ;尿素などを含むことができる。好適な希釈剤のさらなる例には、蒸留水、緩衝水、生理食塩水、PBS、リンゲル溶液、デキストロース溶液、およびハンクス溶液が含まれる。薬学的組成物はまた、生理学的状態に近づけるための追加の物質、例えば、pH調整剤および緩衝剤、毒性調整剤、湿潤剤および界面活性剤を含むことができる。さらに、補助剤、増粘剤、滑沢剤および着色剤を代替的にまたは追加的に使用することができる。薬学的組成物は、固体、半固体、液体または気体の形態の調製物、例えば、錠剤、カプセル剤、散剤、顆粒剤、軟膏剤、液剤、坐剤、注射剤、吸入剤、ゲル剤、ミクロスフェア、およびエアロゾルに製剤化することができる。
【0070】
提供される薬学的組成物は、例えば抗酸化剤などの、様々な安定化剤のいずれかを含むこともできる。薬学的組成物がポリペプチドを含む場合、ポリペプチドは、ポリペプチドのインビボ安定性を増強し、またはそうでなければその薬理学的特性を増強する(例えば、ポリペプチドの半減期を増加させる、その毒性を減少させる、および/または溶解性もしくは取り込みを増強する)様々な周知の化合物と複合体化することができる。このような修飾または複合体化剤の例には、硫酸塩、グルコン酸塩、クエン酸塩、およびリン酸塩が含まれる。組成物の核酸またはポリペプチドは、それらのインビボ特性を増強する分子と複合体化することもできる。このような分子としては、例えば、炭水化物、ポリアミン、アミノ酸、他のペプチド、イオン(例えば、ナトリウム、カリウム、カルシウム、マグネシウム、マンガン)、および脂質が挙げられる。
【0071】
VII.核酸調節方法
別の局面において、細胞中の1つまたは複数の標的核酸を調節する方法を提供する。方法は、細胞と、1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載される操作されたCasタンパク質のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるsgRNA分子のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載される核酸のいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるベクターのいずれか;1つまたは複数の、例えば2つ以上の、本明細書に開示されかつ上記にさらに詳細に記載されるシステムのいずれか;またはそれらの任意の組み合わせとを接触させる工程を含む。
【0072】
いくつかの態様において、提供される方法は、細胞中の1つまたは複数の標的核酸の選択的調節をもたらす。例えば、選択的調節は、接触の非存在下での標的核酸の調節のレベルと比較して、少なくとも10%、例えば、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または90%を超えて、1つまたは複数の標的核酸を調節することができ、一方、非標的核酸を実質的に調節しない。いくつかの態様において、選択的調節は、非標的核酸を、10%未満、例えば、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、または1%未満、調節することを含む。
【0073】
いくつかの態様において、提供される方法は、1つまたは複数の標的核酸の転写の調節をもたらす。いくつかの態様において、方法は、標的DNAの転写の増加または減少をもたらす。いくつかの態様において、方法は、標的遺伝子コードRNA(タンパク質コードmRNA)および/または標的非コードRNA(例えば、tRNA、rRNA、snoRNA、siRNA、miRNA、長鎖ncRNAなど)の転写を制御するために使用される。いくつかの態様において、方法は、DNAに関連するポリペプチド(例えば、ヒストン)を修飾する。いくつかの態様において、方法は、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性(例えば、ユビキチン化活性)、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性 グリコシル化活性(例えば、GlcNAcトランスフェラーゼ由来)または脱グリコシル化活性などの酵素活性を伴う。本明細書に列挙される酵素活性は、タンパク質に対する共有結合修飾を触媒する。このような修飾は、標的タンパク質の安定性または活性を変化させることが当技術分野で公知である(例えば、キナーゼ活性によるリン酸化は、標的タンパク質に依存してタンパク質活性を刺激またはサイレンシングすることができる)。タンパク質標的として特に興味深いのはヒストンである。ヒストンタンパク質は、DNAに結合し、ヌクレオソームとして公知の複合体を形成することが当技術分野で公知である。ヒストンは、周囲のDNAの構造変化を誘発するために(例えば、メチル化、アセチル化、ユビキチン化、リン酸化によって)修飾することができ、したがって、転写因子、ポリメラーゼなどの相互作用因子への潜在的に大部分のDNAのアクセシビリティーを制御することができる。単一のヒストンを、多くの異なる方法でおよび多くの異なる組み合わせで修飾することができる(例えば、ヒストン3のリジン27、H3K27のトリメチル化は、抑制転写のDNA領域に関連しており、一方、ヒストン3のリジン4、H3K4のトリメチル化は、活性転写のDNA領域に関連している)。
【0074】
いくつかの態様において、提供される方法は、1つまたは複数の標的核酸の翻訳の調節をもたらす。いくつかの態様において、方法は、1つまたは複数の標的RNA分子の翻訳を調節する。
【0075】
いくつかの態様において、1つまたは複数の標的核酸は、真核細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、動物細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、哺乳動物細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、ヒト細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、幹細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、血液細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、免疫細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、植物細胞である細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、インビボにある細胞中にある。いくつかの態様において、1つまたは複数の標的核酸は、オルガノイドの一部である細胞中にある。
【0076】
いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つを活性化することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つを抑制することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つを編集することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つのプライマーを編集することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つをニッキングすることを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つを標識することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つの時空間的位置を変更することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つのメチル化を変更することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つのアセチル化を変更することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのアセチル化を変更することを含む。いくつかの態様において、1つまたは複数の標的核酸の調節は、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのメチル化を変更することを含む。
【0077】
VIII.処置方法
別の局面において、対象における障害、例えば遺伝性障害を予防する方法を提供する。方法は、本明細書に開示されかつ上記にさらに詳細に記載される薬学的組成物のいずれかの量を対象へ投与する工程を含み、ここで、投与される量は、障害に関連する1つまたは複数の標的核酸を調節するために十分である。いくつかの態様において、投与される量は、1つまたは複数の標的核酸中の1つまたは複数の突然変異を修正するために十分である。
【0078】
提供される方法での処置に適した障害としては、X連鎖重症複合免疫不全、鎌状赤血球貧血、サラセミア、血友病、新生物、がん、加齢黄斑変性症、統合失調症、トリヌクレオチド反復障害、脆弱X症候群、プリオン関連障害、筋萎縮性側索硬化症、薬物中毒、自閉症、アルツハイマー病、パーキンソン病、嚢胞性線維症、血液および凝固疾患または障害、炎症、顔面肩甲上腕型筋ジストロフィー、網膜色素変性症、レーベル先天黒内障、緑内障、免疫関連疾患または障害、代謝性疾患および障害、肝臓疾患および障害、腎臓疾患および障害、筋/骨格疾患および障害、神経学的および神経疾患および障害、心血管疾患および障害、肺疾患および障害、ならびに眼疾患および障害が挙げられるが、これらに限定されない。
【0079】
さらに、対象における感染症を処置する方法を提供する。方法は、本明細書に開示されかつ上記にさらに詳細に記載される薬学的組成物のいずれかの量を対象へ投与する工程を含み、ここで、投与される量は、感染症に関連する1つまたは複数の標的核酸を調節するために十分である。いくつかの態様において、投与される量は、1つまたは複数の標的核酸のうちの少なくとも1つを切断またはニッキングするために十分である。いくつかの態様において、感染因子はウイルスである。
【0080】
いくつかの態様において、提供される方法のいずれかの投与工程は、ウイルス、ナノ粒子、リポソーム、ミセル、ビロソーム、核酸複合体、タンパク質-RNAコンジュゲート、およびそれらの組み合わせを使用する送達システムを介する。投与は、経口投与、口腔内投与、直腸投与、非経口投与、腹腔内投与、皮内投与、経皮投与、気管内投与、眼内投与などを含む、様々な方法で達成することができる。活性剤は、投与後に全身的であってもよく、または局所投与、壁内投与の使用、もしくは移植部位で活性用量を保持するように作用するインプラントの使用によって局所的であってもよい。活性剤は、即時活性のために製剤化することができ、または徐放性のために製剤化してもよい。
【0081】
いくつかの態様において、提供される方法のいずれかの投与工程は、シングルアデノ随伴ウイルス送達システムを介する。いくつかの態様において、投与工程は、デュアルアデノ随伴ウイルス送達システムを介する。
【0082】
本明細書において使用される場合、用語「対象」は、一般に、脊椎動物、好ましくは哺乳動物、より好ましくはヒトを指す。場合によっては、対象は患者である。哺乳動物としては、マウス、サル、ヒト、家畜、スポーツ動物、およびペットが挙げられるが、これらに限定されない。いくつかの態様において、提供される方法のいずれかの対象はヒトである。
【0083】
IX.態様
以下の態様が企図される。特徴および態様のすべての組み合わせが企図される。
【0084】
態様1:真核細胞中で機能的である操作されたCRISPR(Clustered Regularly Interspaced Short Palindromic Repeat)関連(Cas)タンパク質であって、該Casタンパク質が、野生型Casタンパク質の天然アミノ酸配列と少なくとも80%同一である改変アミノ酸配列を含み、該天然アミノ酸配列が、700アミノ酸未満の長さを有し、かつ、(D/E/K/N)X(R/F)(E/K)Nモチーフを含み;ならびに、該改変アミノ酸配列が、該天然アミノ酸配列中に1つまたは複数の置換を含み、該1つまたは複数の置換のうちの少なくとも1つが、(1)該(D/E/K/N)X(R/F)(E/K)Nモチーフ内の位置、または該(D/E/K/N)X(R/F)(E/K)Nモチーフから上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、(2)該天然アミノ酸配列の241位の位置、または該天然アミノ酸配列の241位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、(3)該天然アミノ酸配列の516位の位置、または該天然アミノ酸配列の516位から上流30アミノ酸以内もしくは下流30アミノ酸以内の位置、あるいは(4)該天然アミノ酸配列中の荷電アミノ酸を有する位置、のいずれかの位置にある、前記操作されたCasタンパク質。
【0085】
態様2:1つまたは複数の置換のうちの少なくとも1つが、アルギニン(R)、アラニン(A)、セリン(S)、およびグリシン(G)からなる群より選択されるアミノ酸への置換である、態様1の態様。
【0086】
態様3:野生型Casタンパク質がV型Casタンパク質である、態様1の態様。
【0087】
態様4:野生型Casタンパク質が、野生型V-F(Cas14もしくはCas 12f)タンパク質または野生型V-J(CasФもしくはCas12J)タンパク質である、態様1の態様。
【0088】
態様5:天然アミノ酸配列がSEQ ID NO: 1の配列である、態様1の態様。
【0089】
態様6:1つまたは複数の置換が、D143、K11、K73、T147、E151、K154、E241、D318、K330、K457、E425、E462、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換を含む、態様1~5の態様のいずれかの態様。
【0090】
態様7:置換が、D143R、K11R、K73R、T147R、E151R、K154R、E241R、D318R、K330R、E425N、K457R、E462R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、態様6の態様。
【0091】
態様8:置換が、D143R、T147R、E151R、およびE241Rからなる群より選択される、態様7の態様。
【0092】
態様9:1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での2つの置換を含む、態様6~8の態様のいずれかの態様。
【0093】
態様10:2つの置換が、D143での置換と、T147、E151、K154、E241、K330R、E425N、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、態様9の態様。
【0094】
態様11:2つの置換が、D143R、T147R、E151R、E151A、K154R、E241R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、態様9または10の態様。
【0095】
態様12:2つの置換が、D143R/T147R、D143R/E151R、D143R/E241R、D143R/E425N、D143R/E507R、D143R/N519R、D143R/E527R、D143R/E528R、D143R/R151S、D143/R151G、およびD143R/E151Aからなる群より選択される、態様11の態様のいずれかの態様。
【0096】
態様13:1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での3つの置換を含む、態様9~12の態様のいずれかの態様。
【0097】
態様14:3つの置換が、D143およびT147での置換と、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、態様13の態様。
【0098】
態様15:3つの置換が、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、態様13または14の態様。
【0099】
態様16:3つの置換が、D143R/T147R/K330R、D143R/T147R/K154R、D143R/T147R/E241R、D143R/T147R/E507R、D143R/T147R/N519R、D143R/T147R/E527R、D143R/T147R/E528R、D143R/T147R/E151S、D143R/T147R/E151G、およびD143R/T147R/E151Aからなる群より選択される、態様15の態様。
【0100】
態様17:1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での4つの置換を含む、態様13~16の態様のいずれかの態様。
【0101】
態様18:4つの置換が、D143、T147、およびK330での置換と、E151、K154、E241、E425、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、態様17の態様。
【0102】
態様19:4つの置換が、D143R、T147R、E151R、E151A、E151S、E151G、K154R、E241R、K330R、E425N、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、態様17または18の態様。
【0103】
態様20:4つの置換が、D143R/T147R/K330R/E528R、D143R/T147R/K330R/E151A、およびD143R/T147R/K330R/E527Rからなる群より選択される、態様19の態様。
【0104】
態様21:1つまたは複数の置換が、D143、T147、E151、K154、E241、K330、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での5つの置換を含む、態様17~20の態様のいずれかの態様。
【0105】
態様22:5つの置換が、D143、T147、K330、E151での置換と、K154、E241、N504、E507、N516、N519、E527、およびE528からなる群より選択される位置での置換とを含む、態様21の態様。
【0106】
態様23:5つの置換が、D143R、T147R、E151R、E151A、K154R、E241R、K330R、N504R、E507R、N516R、N519R、E527R、およびE528Rからなる群より選択される、態様21または22の態様。
【0107】
態様24:5つの置換が、D143R/T147R/K330R/E151A/E528RおよびD143R/T147R/K330R/E151A/E527Rからなる群より選択される、態様23の態様。
【0108】
態様25:完全にまたは部分的にヌクレアーゼ不活性化されたCas(dCas)タンパク質である、態様1~24の態様のいずれかの態様。
【0109】
態様26:改変アミノ酸配列が、SEQ ID NO: 2、3、4、5、および6からなる群より選択される配列を含む、態様1の態様。
【0110】
態様27:野生型CRISPR RNA (crRNA)/トランス活性化型CRISPR RNA (tracrRNA)融合ヌクレオチド配列と少なくとも60%同一である操作されたcrRNA/tracrRNA融合ヌクレオチド配列を含むシングルガイドRNA(sgRNA)であって、該野生型crRNA/tracrRNA融合ヌクレオチド配列が、(1)RNAステムループヘアピン構造に対応する3’領域、(2)該3’領域に近接するポリU領域、および(3)5’ポリG領域を含み;ならびに、該操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、該野生型crRNA/tracrRNA融合ヌクレオチド配列に対する1つまたは複数の改変を含み、該改変が、該ポリU領域の少なくとも1つのUの置換、該3’領域の少なくとも一部分の欠失;および該5’ポリG領域の少なくとも一部分の欠失からなる群より選択される、前記シングルガイドRNA(sgRNA)。
【0111】
態様28:野生型crRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 7の配列である、態様27の態様。
【0112】
態様29:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、ポリU領域の少なくとも1つのUの、Gによる置換を含む、態様27または28の態様。
【0113】
態様30:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 8の配列を含む、態様29の態様。
【0114】
態様31:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、3’領域の少なくとも一部分の欠失を含む、態様29の態様。
【0115】
態様32:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 9の配列を含む、態様31の態様。
【0116】
態様33:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、5’ポリG領域の少なくとも一部分の欠失を含む、態様31の態様。
【0117】
態様34:操作されたcrRNA/tracrRNA融合ヌクレオチド配列が、SEQ ID NO: 10の配列を含む、態様33の態様。
【0118】
態様35:5’-TTTR-3’ヌクレオチド配列を有する5’プロトスペーサー隣接モチーフ(PAM)に対応するスペーサーヌクレオチド配列をさらに含む、態様27~34の態様のいずれかの態様。
【0119】
態様36:態様1~26の態様のいずれかの操作されたCasタンパク質をコードする、核酸配列。
【0120】
態様37:態様27~35の態様のいずれかのsgRNAをコードする、核酸配列。
【0121】
態様38:態様36の核酸および態様37の核酸のうちの一方または両方を含む、ベクター。
【0122】
態様39:1つまたは複数の核局在化シグナル(NLS)をさらに含む、態様38の態様。
【0123】
態様40:1つまたは複数の核局在化シグナルが、SV40 NLSおよびc-Myc NLSのうちの一方または両方を含む、態様39の態様。
【0124】
態様41:転写アクチベーターまたはエピジェネティック修飾アクチベーターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~40の態様のいずれかの態様。
【0125】
態様42:1つまたは複数の転写アクチベーターまたはエピジェネティック修飾アクチベーターが、VP64転写アクチベーター、トリパータイトVP64-p65-Rta(VPR)転写アクチベーター、p300転写アクチベーター、TET1転写アクチベーター、TET2転写アクチベーター、NFAT転写アクチベーター、NFkB転写アクチベーター(NFkB transctiptional activator)、およびPRDM転写アクチベーターのうちの1つまたは複数を含む、態様41の態様。
【0126】
態様43:転写リプレッサーまたはエピジェネティック修飾リプレッサーを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~42の態様のいずれかの態様。
【0127】
態様44:1つまたは複数の転写リプレッサーまたはエピジェネティック修飾リプレッサーが、KRAB転写リプレッサー、DNMT3A DNAメチルトランスフェラーゼ、DNMT3B DNAメチルトランスフェラーゼ、DNMT3L DNAメチルトランスフェラーゼ、バイパータイトKRAB-DNMT3A (KA)リプレッサー、バイパータイトKRAB-DNMT3L (KL)リプレッサー、トリパータイトKRAB-DNMT3A-DNMT3L (KAL)リプレッサー、SID転写リプレッサー、EZH2転写リプレッサー、HP1ヘテロクロマチンタンパク質、Gli3転写リプレッサー、およびMBD3転写リプレッサーのうちの1つまたは複数を含む、態様43の態様。
【0128】
態様45:塩基エディターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~44の態様のいずれかの態様。
【0129】
態様46:プライムエディターを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~45の態様のいずれかの態様。
【0130】
態様47:蛍光タンパク質を各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~46の態様のいずれかの態様。
【0131】
態様48:レトロンエレメントを各々独立してコードする1つまたは複数の追加の核酸配列をさらに含む、態様38~47の態様のいずれかの態様。
【0132】
態様49:アデノ随伴ウイルス(AAV)ベクター、アデノウイルスベクター、レトロウイルスベクター、レンチウイルスベクター、または単純ヘルペスウイルス(HSV)ベクターである、態様38~48の態様のいずれかの態様。
【0133】
態様50:態様1~26の態様のいずれかの操作されたCasタンパク質;およびsgRNAを含む、システム。
【0134】
態様51:Casタンパク質;および態様27~35の態様のいずれかのsgRNAを含む、システム。
【0135】
態様52:Casタンパク質が、態様1~26の態様のいずれかの操作されたCasタンパク質である、態様51の態様。
【0136】
態様53:態様36の核酸配列;およびsgRNAをコードする核酸配列を含む、システム。
【0137】
態様54:Casタンパク質をコードする核酸配列;および態様37の核酸配列を含む、システム。
【0138】
態様55:Casタンパク質をコードする核酸が、態様36の核酸配列である、態様54の態様。
【0139】
態様56:細胞と、態様1~26の態様のいずれかの操作されたCasタンパク質、態様27~35の態様のいずれかのsgRNA、態様36または37の態様のいずれかの核酸、態様38~49の態様のいずれかのベクター、または態様50~55の態様のいずれかのシステムとを接触させる工程を含む、細胞中の1つまたは複数の標的核酸を調節する方法。
【0140】
態様57:細胞が真核細胞である、態様56の態様。
【0141】
態様58:真核細胞が動物細胞である、態様57の態様。
【0142】
態様59:動物細胞が哺乳動物細胞である、態様58の態様。
【0143】
態様60:哺乳動物細胞がヒト細胞である、態様59の態様。
【0144】
態様61:細胞が幹細胞である、態様57~60の態様のいずれかの態様。
【0145】
態様62:細胞が血液細胞である、態様57~61の態様のいずれかの態様。
【0146】
態様63:細胞が免疫細胞である、態様57~62の態様のいずれかの態様。
【0147】
態様64:細胞が植物細胞である、態様57の態様。
【0148】
態様65:細胞がインビボにある、態様56~64の態様のいずれかの態様。
【0149】
態様66:細胞がオルガノイドの一部である、態様56~64の態様のいずれかの態様。
【0150】
態様67:調節が、1つまたは複数の標的核酸のうちの少なくとも1つを活性化することを含む、態様56~66の態様のいずれかの態様。
【0151】
態様68:調節が、1つまたは複数の標的核酸のうちの少なくとも1つを抑制することを含む、態様56~67の態様のいずれかの態様。
【0152】
態様69:調節が、1つまたは複数の標的核酸のうちの少なくとも1つを編集することを含む、態様56~68の態様のいずれかの態様。
【0153】
態様70:調節が、1つまたは複数の標的核酸のうちの少なくとも1つのプライマーを編集することを含む、態様56~69の態様のいずれかの態様。
【0154】
態様71:編集が、少なくとも1つの標的核酸をニッキングすることを含む、態様69または70の態様。
【0155】
態様72:編集が、1つまたは複数の遺伝子ノックアウトを実行することを含む、態様69または70の態様。
【0156】
態様73:編集が、1つまたは複数の遺伝子ノックインを実行することを含む、態様69または70の態様。
【0157】
態様74:編集が、1つまたは複数の塩基置換を実行することを含む、態様69または70の態様。
【0158】
態様75:調節が、ゲノムDNAを切断することを含む、態様56~74の態様のいずれかの態様。
【0159】
態様76:調節が、ゲノムDNAを突然変異させることをさらに含む、態様75の態様。
【0160】
態様77:突然変異が、1つまたは複数の挿入、1つまたは複数の欠失、1つまたは複数の置換、またはそれらの組み合わせを含む、態様76の態様。
【0161】
態様78:調節が、1つまたは複数の標的核酸のうちの少なくとも1つを標識することを含む、態様56~77の態様のいずれかの態様。
【0162】
態様79:調節が、細胞内の1つまたは複数の標的核酸のうちの少なくとも1つの時空間的位置を変更することを含む、態様56~78の態様のいずれかの態様。
【0163】
態様80:調節が、1つまたは複数の標的核酸のうちの少なくとも1つのメチル化を変更することを含む、態様56~79の態様のいずれかの態様。
【0164】
態様81:調節が、1つまたは複数の標的核酸のうちの少なくとも1つのアセチル化を変更することを含む、態様56~80の態様のいずれかの態様。
【0165】
態様82:調節が、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのアセチル化を変更することを含む、態様56~81の態様のいずれかの態様。
【0166】
態様83:調節が、1つまたは複数の標的核酸のうちの少なくとも1つに関連する少なくとも1つのヒストンまたはヌクレオソームのメチル化を変更することを含む、態様56~82の態様のいずれかの態様。
【0167】
態様84:態様1~26の態様のいずれかの操作されたCasタンパク質、態様27~35の態様のいずれかのsgRNA、態様36または37の核酸、態様38~49の態様のいずれかのベクター、または態様50~55の態様のいずれかのシステムを含む、薬学的組成物。
【0168】
態様85:治療有効量の薬学的に許容される賦形剤をさらに含む、態様84の態様。
【0169】
態様86:ある量の態様84または85の薬学的組成物を対象へ投与する工程を含む、対象における遺伝性障害を予防または処置するための方法であって、該量が、遺伝性障害に関連する1つまたは複数の標的核酸を調節するために十分である、前記方法。
【0170】
態様87:前記量が、1つまたは複数の標的核酸中の1つまたは複数の突然変異を修正するために十分である、態様86の態様。
【0171】
態様88:遺伝性障害が、X連鎖重症複合免疫不全、鎌状赤血球貧血、サラセミア、血友病、新生物、がん、加齢黄斑変性症、統合失調症、トリヌクレオチド反復障害、脆弱X症候群、プリオン関連障害、筋萎縮性側索硬化症、薬物中毒、自閉症、アルツハイマー病、パーキンソン病、嚢胞性線維症、血液および凝固疾患または障害、炎症、顔面肩甲上腕型筋ジストロフィー、網膜色素変性症、レーベル先天黒内障、緑内障、免疫関連疾患または障害、代謝性疾患および障害、肝臓疾患および障害、腎臓疾患および障害、筋/骨格疾患および障害、神経学的および神経疾患および障害、心血管疾患および障害、肺疾患および障害、ならびに眼疾患および障害からなる群より選択される、態様86または87の態様。
【0172】
態様89:投与工程が、ウイルス、ナノ粒子、リポソーム、ミセル、ビロソーム、核酸複合体、タンパク質-RNAコンジュゲート、およびそれらの組み合わせからなる群より選択される送達システムを介する、態様86~88の態様のいずれかの態様。
【0173】
態様90:投与工程が、シングルアデノ随伴ウイルス送達システムを介する、態様89の態様。
【0174】
態様91:投与工程が、デュアルアデノ随伴ウイルス送達システムを介する、態様89の態様。
【0175】
態様92:対象がヒトである、態様86~91の態様のいずれかの態様。
【0176】
態様93:ある量の態様84または85の薬学的組成物を対象へ投与する工程を含む、対象における感染症を処置する方法であって、該量が、感染症に関連する1つまたは複数の標的核酸を調節するために十分である、前記方法。
【0177】
態様94:1つまたは複数の標的核酸が、感染症を引き起こす感染因子の核酸である、態様93の態様。
【0178】
態様95:前記量が、1つまたは複数の標的核酸のうちの少なくとも1つを切断またはニッキングするために十分である、態様94の態様。
【0179】
態様96:感染因子がウイルスである、態様94または95の態様。
【0180】
態様97:投与工程が、ウイルス、ナノ粒子、リポソーム、ミセル、ビロソーム、核酸複合体、タンパク質-RNAコンジュゲート、およびそれらの組み合わせからなる群より選択される送達システムを介する、態様93~96の態様のいずれかの態様。
【0181】
態様98:投与工程が、シングルアデノ随伴ウイルス送達システムを介する、態様97の態様。
【0182】
態様99:投与工程が、デュアルアデノ随伴ウイルス送達システムを介する、態様97の態様。
【0183】
態様100:対象がヒトである、態様93~99の態様のいずれかの態様。
【実施例】
【0184】
X.実施例
本開示は、以下の非限定的な実施例を考慮してよりよく理解されるであろう。以下の実施例は、例示のみを目的としており、本発明の範囲を何ら限定するものではない。
【0185】
実施例1.哺乳動物細胞におけるCas14の機能試験
天然に存在するCas14が哺乳動物細胞において機能し得るかどうかを試験するために、RuvCドメイン中のCas14の保存活性部位へ2つの突然変異を導入することによってヌクレアーゼ不活性化Cas14を作製した(L. B. Harrington et al., Science 362, (2018): 839-42; T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016-23)。具体的には、Cas14配列をプラスミドAddgene #112500から増幅し、野生型配列へ2つの突然変異(D326AおよびD510A)を導入することによってdCas14を作製した。結果として生じたタンパク質を、次いで、トリパータイトVPRアクチベーターへ融合した(A. Chavez et al. Cell 155, (2016): 563-67)(
図2)。これらの実施例に記載されるこのCas構築物および他のものを、InFusionおよびStellarコンピテント細胞(Takara Bio)を用いてクローニングした。
【0186】
ドキシサイクリン(Dox)誘導性TRE3G-EGFP HEK293Tレポーター細胞株およびそのプロモーターを標的とするsgRNAを用いて、dCas14-VPRの活性化効率を測定した。野生型HEK293T細胞(ATCC)およびTet-Onプロモーター(pTRE3G)の下でEGFPを安定にコードするHEK293T TRE3G-GFPレポーター株(Y. Gao et al., Genome Res. 22, (2012): 1760-74)を、高グルコース、ピルビン酸ナトリウムおよびGlutaMAX (Thermo Fisher)と共にDMEM中で培養し、さらに10% FBS (Sigma)を補った。細胞を37℃および5% CO
2で増殖させ、80%未満のコンフルエンシーで維持した。すべてのトランスフェクションを、TransIT-LT1トランスフェクション試薬(Mirus)を用いて、プラスミド1μg当たり3μL試薬の比率で実行した。細胞を1日前に1x10
5細胞/mLでプレーティングした。これらの実施例に記載されるこのおよび他のGFP活性化アッセイのために、500 ngのdCas構築物および250 ngのsgRNAまたはcrRNAプラスミドを、24ウェルプレート中のHEK293T TRE3G-GFP細胞へトランスフェクトした。トランスフェクトされた細胞を、トランスフェクションの2日後にGFP活性化について分析した。ここで、レポーター活性化は観察されず(
図3)、天然のCas14システムはヒトゲノム状況では機能しないことを暗示している。
【0187】
実施例2.Cas14ガイドRNA操作
実施例1で観察されたCas14活性の欠如が、sgRNAの最適でない設計および/またはクロマチンDNAへのCas14の弱い結合活性に起因し得るかどうかを試験するために、代替ガイドRNA設計を試験した(
図4)。これらの代替設計は、天然のtracrRNA配列(
図5)に基づき、ポリU配列を破壊するためのG-U交換(
図4中のデザイン1、
図6)、RNAヘアピン切り詰め(
図4中のデザイン2、
図7)、およびポリG除去(
図4中のデザイン3、
図8)を含んだ(B. Chen et al., Cell 155, (2013): 1479-91)。
【0188】
sgRNA骨格断片を、Integrated DNA Technologies (IDT)からのgBlocksを介して注文した。このおよび他の実施例に記載されるsgRNAおよび/またはcrRNAプラスミドを、T4 DNAリガーゼ(New England Biolabs)を用いてクローニングした。蛍光タンパク質発現を分析するために、細胞を、0.05%トリプシンEDTA(Life Technologies)を用いて解離させ、5% FBSを含むPBS中に再懸濁し、CytoFLEX Sフローサイトメーター(Beckman Coulter)においてフローサイトメトリーによって分析した。各サンプルの関心対象の構築物を含有する少なくとも10,000個の細胞を、FlowJoを使用して分析した。分析した細胞を、構築物発現に対応する非トランスフェクト対照に基づいて陽性蛍光タンパク質発現についてゲーティングした。
【0189】
興味深いことに、試験されたsgRNA設計の各々は、遺伝子活性化を改善し、デザイン2は他のものよりも優れていた。野生型sgRNAは活性化を示さなかったが、デザイン2 sgRNAは適度な活性化を示した(3%のGFP+細胞、および非ターゲティングsgRNAと比べて3.6倍アップレギュレーション)(
図9~11)。デザイン2を後の実施例に使用した。
【0190】
異なるタンパク質融合体、リンカー、および核局在化シグナルを有する融合体のライブラリーも試験した(
図12)。sgRNAデザイン2を用いて、本発明者らは、1つのタンパク質融合体が他の融合体よりも優れていることを見出し(
図13および14)、後の実施例に使用した。しかし、この最適化にもかかわらず、他の融合体はわずかにより低いレポーター活性化を示しただけであった。
【0191】
実施例3.Cas14タンパク質操作
次に、遺伝子活性化アッセイを介してスクリーニングされたCas14バリアントのパフォーマンスを改善するために、誘導反復タンパク質操作戦略を使用した(
図15)。このアッセイにおいて、各サイクルにおけるGFPの活性化の増強を示すバリアントを次のサイクルの開始点として使用した。最初の突然変異について、Cas14のタンパク質配列を、標的DNA結合ポケット内の予測される保存されたモチーフおよび残基の同定のためにCas12aタンパク質のファミリーに整列させた(
図16~18)。この分析に基づいて、同定され標的とされた各アミノ酸をCas14-DNA相互作用を増強し得る正に荷電したアルギニン(R)に置き換えることによって、または選択された個々の残基をCas12a中の保存された残基に置き換えることによって、28個のバリアントを操作した(
図19)。驚くべきことに、ほとんどのバリアントは野生型dCas14-VPRに比べて活性化の改善を示さなかったが、少数のバリアント(D143R、T147R、E151R、E241R)が活性化を有意に増強した(
図19および22)。特に、D143R(CasMINI-V1)は、野生型に比べて24倍以上の改善を示した(
図19~21)。
【0192】
二重突然変異を有する2つのライブラリーをスクリーニングの第2ラウンドのために作製した:一方は、すべてがD143Rを含有する11個のバリアントを有し、他方は、すべてがD143Rと19個の非グルタミン酸(E)アミノ酸すべてへのE151の飽和突然変異とを含有する20個のバリアントを有した。第1ライブラリーから、D143R/T147R、D143R/E151R、D143R/E241R、D143R/E507Rは、D143Rバリアントと比べて改善を示すことが示された。D143R/T147Rバリアント(CasMINI-V2)は、最良の改善(最良の一重バリアントに比べて1.55倍の改善)を示した(
図23)。第2ライブラリーから、Rでの置換に加えて、セリン(S)、グリシン(G)、またはアラニン(A)での置換も活性化を改善した(
図23)。これらの結果は、小さなサイズのアミノ酸での置き換えが活性増強のために重要であることを示唆している。
【0193】
スクリーンの第3スクリーニングラウンドは、D143R/T147Rに基づく13個の三重バリアントを含んだ。D143R/T147R/K330Rバリアント(CasMINI-V3)は、他のバリアントよりも優れていた(最良の二重バリアントD143R/T147Rと比べて1.26倍、
図25)。D143R/T147R/K330Rに基づく四重ライブラリーを試験するスクリーンの第4ラウンドは、最良の三重バリアントと比べて1.15倍の改善を有する1つのバリアントD143R/T147R/K330R/E528R(CasMINI-V4)を示した(
図25)。このバリアントをさらなる特徴付けのために「CasMINI」として選択した。
【0194】
反復スクリーニングは、全体として、徐々に改善されたCas14バリアントライブラリーをもたらした(
図28)。興味深いことに、改善された活性を示すD143、T147、およびE151での一重突然変異は、すべて、Cas12aファミリーにおいて高度に保存されている(D/E)XRKNモチーフに近い位置にある(
図29)。これらの結果は、このドメインがCas14-DNA相互作用を増強するための有望なホットスポットであることを実証している。
【0195】
実施例4.内在性遺伝子のCasMINI活性化
実施例3の操作タンパク質が内在性遺伝子を活性化できるかどうかを試験するために、dCasMINIをVPR、N末端SV40 NLS、C末端MYC NLS、およびmCherryへ融合させた。核局在化は、共焦点顕微鏡蛍光イメージングを介して確認した(
図30)。dCasMINI-VPRレンチウイルスによって形質導入されたHEK293T細胞を、96ウェルμプレート(Ibidi, Inc.)に播種した。細胞をHoechst 33342 (Thermo Fisher Scientific)で染色し、核を37℃で10分間標識した。共焦点顕微鏡法は、TIRFを備えたNikon Spinning Disk共焦点顕微鏡で行った。HBG、IL1RN、およびASCL1を含む内在性遺伝子の活性化をHEK293T細胞において試験した。各遺伝子について、転写開始部位(TSS)から500 bp上流以内を標的とする、それぞれ異なるプロトスペーサー隣接モチーフ(PAM、TTTA、TTTC、またはTTTG)および結合配向を有する10個のsgRNAのパネルを設計した(T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016-23)(
図31~33)。スペーサーを標的とするためのオリゴをアニールし、BsmBI消化バックボーンベクター中へライゲーションした。
【0196】
これらのsgRNAにわたる試験は、遺伝子活性化がsgRNAターゲティング部位に大きく依存することを示した。3つの遺伝子すべてについて、試験されたsgRNAのうちのおよそ20~40%が有意な活性化を示し、最良のsgRNAは数百から数千倍の活性化改善によって標的遺伝子を活性化した。TTTGおよびTTTA PAMは最も良く機能したが、TTTC PAMは活性化を示さなかった。結果は、したがって、TTTR PAMが高効率な遺伝子活性化を可能にすることを確認した。
【0197】
実施例5.CasMINIおよびCas14の比較
次に、IFNγ、HBB、CD2、およびCXCR4を含む内在性遺伝子のパネルの遺伝子活性化についての野生型Cas14のパフォーマンスと比べてのCasMINIのパフォーマンスを比較した。IFNγ、CD2、およびCXCR4については、10個のsgRNAを設計し、HBBについては20個のsgRNAを設計した(
図34~37)。内在性遺伝子の活性化を試験するために、800 ngのdCasプラスミドおよび500 ngのsgRNAまたはcrRNAプラスミドを24ウェルプレート中のHEK293T細胞へトランスフェクトした。トランスフェクトされた細胞を、トランスフェクションの3日後に内在性遺伝子活性化について分析した。TTTR PAMを用いて、sgRNAの大部分が標的遺伝子を効率的に活性化することが観察された。これらの遺伝子に対する活性化の倍率改善は、遺伝子(IFNγ、CD2、HBB)がサイレンシングされた場合により高く、これはdCas9を介した活性化について報告されているものと一致した(S. Konermann et al., Nature 517, (2015): 583-88)。
【0198】
IFNγおよびHBBの活性化を、qPCRを使用して観察した。上記のようなトランスフェクトされた細胞を、Accutase (STEMCELL)を使用して採取し、全RNAを、RNeasy Plus Mini Kit (Qiagen)を使用して抽出した。cDNAを、iScript cDNA合成キット(Bio-Rad)を使用して調製し、-80℃で保存した。qPCR反応を、iTaq Universal SYBR Green Supermix (Bio-Rad)を用いて384ウェルプレート中で調製し、CFX384 Touch Real-Time PCRサーモサイクラー(BioRad)で実行した。すべてのプライマーをIDTから購入した。35を超えるCq値は、弱い発現レベルを有する転写産物について変動があったため、35と見なした。非ターゲティングsgRNAまたはcrRNAプラスミドがトランスフェクトされたサンプルを、陰性対照として使用した。相対発現倍率改善を、ΔΔCq法を用いて解析した。陰性対照に対する活性化倍率改善のレベルを、GAPDHの発現に対して正規化した。
【0199】
IFNγの活性化を、ELISAを用いても観察した。トランスフェクトされた細胞培養物からの上清を、トランスフェクションの3日後に採取し、-80℃で保存した。分泌されたタンパク質を、Synergy H1プレートリーダー(BioTek)上でヒトIFNγ用のELISA MAX Deluxeキットを使用して定量化した。450 nmおよび570 nmの吸光度を測定し、タンパク質濃度をべき乗則に適合した標準曲線によって決定した。
【0200】
CD2およびCXCR4の活性化を、免疫染色とそれに続くフローサイトメトリーを用いて観察した。細胞を、Accutase (STEMCELL)を使用して解離させ、PBS中5%FBS中で4℃にて30分間染色した。CD2およびCXCR4の抗体および関連するアイソタイプを、BioLegend (#309224、#306510、#400122、#400220)から購入した。
【0201】
トップのsgRNAを各遺伝子について選択し、dCasMINI-VPRおよびdCas14-VPRをサイド・バイ・サイドで比較するために使用した(
図38)。試験したすべてのsgRNAについて、各遺伝子について一貫した大幅に増強された活性化が観察された。例えば、dCasMINI-VPRとdCas14-VPRを比較すると、2つの異なるsgRNAを用いてIFNγ活性化について、定量的PCR(qPCR)によって測定された45倍または120倍の改善、および酵素結合免疫吸着アッセイ(ELISA)によって測定された25倍または7倍の改善が観察された(
図39)。両方のsgRNAを同時送達した場合、さらに良好な活性化が観察され、qPCRによって300倍の改善およびELISAによって768倍の改善で測定された改善が見られた。qPCRまたはフローサイトメトリーによって測定されたHBB、CD2、およびCXCR4についても同様の改善が観察された:dCasMINI-VPRは、最大で、HBB活性化の525倍改善、CD2活性化の64倍改善、およびCXCR4活性化の11倍改善を示した(
図40~42)。CXCR4に対する比較的低い活性化は、HEK293T細胞中のCXCR4の既に高い発現レベルに恐らく起因した。
【0202】
実施例6.CasMINIおよびLbCas12の比較
さらなる実験は、CasMINIがLbCas12aと同等に良好に作用するかどうかを試験した。Cas12aシステムは、CasMINIの2倍を超えるサイズである大きなCasエフェクター(1228アミノ酸)である(
図43)。Cas12aエフェクターをコンパレータとして選び、何故ならば、それは、dCasMINI(TTTR)と同様のPAM(TTTV)を共有し、同じゲノム部位を標的とするsgRNAを使用して2つのシステムのパフォーマンスをサイド・バイ・サイドで比較することが公正であるためである。GFP、IFNγ、HBB、CXCR4の4つの遺伝子を選択し、CasMINIの最も高性能なsgRNAの標的部位と同じ標的部位へ結合するようにCas12a crRNAを設計した。ヌクレアーゼ不活性化されたLbdCas12aおよびそのcrRNA骨格を、以前に記載されたように増幅させた(H. R. Kempton, L. E. Goudy, K. S. Love, & L. S. Qi, Mol. Cell 78, (2020): 184-91)。
【0203】
結果は、dCasMINI-VPRが、GFP活性化に関して2倍、dCas12a-VPRよりも優れていることを示した(活性化の244倍対112倍、
図44)。さらに、ほとんどの内在性遺伝子について、dCasMINI-VPRがdCas12a-VPRよりも優れていることが観察され、CasMINIシステムは遺伝子活性化に関してCas12aと同等またはそれ以上であることを示唆している(
図45)。最近の構造研究は、Cas14が標的DNAへ結合する際に二量体を形成することを示唆した(S. N. Takeda et al., Mol. Cell 81, (2021): 558-70)。各標的部位について、dCasMINI-VPRの二量体が標的部位へ結合し、活性化を促進すると理論化される。したがって、これらの知見は、CasMINIがCas12aシステムと同等かまたはそれよりも有効な小型エフェクターであることを実証している(Y. E. Tak et al., Nat. Methods 14, (2017): 1163-66)。
【0204】
実施例7.哺乳動物ゲノムにおけるCasMINI特異性の評価
CasMINIが哺乳動物ゲノム状況において特異的であるかどうかを試験するために、HEK293T細胞における全トランスクリプトームRNAシークエンシング(RNA-seq)。TRE3G-GFP HEK293Tレポーター細胞株にdCasおよび関連するsgRNAまたはcrRNAプラスミドをトランスフェクトし、トランスフェクションの2日後に蛍光タンパク質(mCherryおよびBFP)の発現に基づいて精製した。全RNAを、RNeasy Plus Mini Kit (Qiagen)を使用して単離した。RNAシークエンシングライブラリー調製および次世代シークエンシングは、Novogene Corporation (Chula Vista, CA)によって実施された。ライブラリーはNovoSeq6000プラットフォームで配列決定した。ペアエンド150-bpリードを取得し、STARを使用して、GFPが付加されたhg38ゲノムへアラインメントした。転写産物の存在量は、quantmodeオプションを用いるSTARおよびhtseqを使用して推定した。カウントは、tximportでインポートし、次いでDESeq2を用いて正規化し、統計的に比較した。hg38アノテーションはGencodeからダウンロードした(J. Harrow et al., Genome Res. 22, (2012): 1760-74)。Custom R Scriptsを使用して、さらなるtpm正規化および品質管理を実行した。下流のプロットは、カスタム修正されたEnhancedVolcano関数を含む、pheatmap、ggplot2、およびtidyverseパッケージを使用した。LbdCas12a-VPRシステム対dCasMINI-VPRシステムの変動は、4つのレプリケート(2つのターゲティングレプリケートおよび2つの非ターゲティングレプリケート)にわたる遺伝子発現についての標準偏差の分布を考慮することによって、バイオリンプロットで表した。線形モデルおよび相関係数は、QR分解および回帰を用いて得た。
【0205】
これらの実験において、調製されたHEK293T細胞に、ターゲティングまたは非ターゲティングsgRNAと共にdCasMINI-VPRをトランスフェクトし、比較のためにdCas12a-VPRをターゲティングおよび非ターゲティングsgRNAと共に用いた(
図46および47)。2つの生物学的レプリケートは、一貫したRNA-seqプロファイリングを示した(
図48および49)。dCasMINI-VPRおよびdCas12a-VPRの両方について、ターゲティングsgRNAと非ターゲティングsgRNAを比較して、有意なオフターゲット効果は検出されなかった。dCas12aおよびdCasMINIのRNA-seqデータ(2つのデュプリケートが示されている)を重ね合わせることは、より良い効率を有するdCasMINI活性化GFPを実証した(
図50)。両方のデータセットのバイオリンプロットもまた、2つのCasエフェクターが遺伝子活性化について同様のオフターゲットプロファイルを有することを確認した(D. Kim et al., Nat. Biotechnol. 34, (2016): 863-68)(
図51)。これらのデータは、哺乳動物細胞においてCasMINIを使用することの高い特異性を共に実証する。
【0206】
実施例8.哺乳動物細胞における塩基編集へのCasMINIの適用
Cas9またはCas12を塩基エディターと融合することによって得られた以前に開発された塩基編集システムは、AAVのパッケージング容量(約4.5 kb)に収まるには大きすぎる(M. F. Richter et al., Nat. Biotechnol. 38, (2020): 883-91; X. Li et al., Nat. Biotechnol. 36, (2018): 324-27)。対照的に、CasMINIのサイズが大幅に縮小されているため、このサイズ制限に合理的に適合できる。dCasMINIとアデニン塩基エディター(ABE8e)との融合体を構築し、コンパクトな融合タンパク質を得た(dCas12aを使用した場合の4.5 kbと比較して2.4 kb)。A・TをG・Cへ変換するための選択されたゲノム部位を、両方の塩基エディターを使用して試験した。A・TからG・Cへの変換の頻度を測定するために、編集された細胞のディープシークエンシングを使用した。
【0207】
塩基編集アッセイのために、細胞を48ウェルプレートにおいて1ウェル当たり40,000細胞でプレーティングし、750 ngのdCasプラスミドおよび250 ngのsgRNAまたはcrRNAプラスミドを用いてトランスフェクトした。トランスフェクトされた細胞を、トランスフェクションの3日後に内在性遺伝子活性化について分析した。ゲノムDNAライセートを、以前に記載されたように調製し(M. F. Richter et al., Nat. Biotechnol. 38, (2020): 883-91)、ハイスループットシークエンシング(HTS)のテンプレートとして使用した。関心対象の標的とされるゲノム領域を、2ラウンドPCRを使用してQ5 Hot Start High-Fidelity Mastermix, 2× (NEB, # M0494S)で増幅し、各サンプルについてIlluminaアダプターおよび固有のバーコードを付加した。ライブラリーを、以前に記載されたようにIllumina Mi-Seq上で配列決定した(M. F. Richter et al., Nat. Biotechnol. 38, (2020): 883-91)。Illuminaシークエンシング実行から得られたfastq.gzファイルを処理するために、CRISPResso2を使用した。30未満の平均phred33クオリティスコアを有するリードを除外するために、「min_average_read_quality」フラグを30に設定した。各サンプルについて、以下の手順を用いて置換パーセンテージを定量化するために、Alleles_frequency_table.txtを使用した。各リード:アンプリコンアラインメントについて、挿入または欠失を有するすべてのカラムを除去し、アンプリコンの5’および3’末端の5塩基対に対応するカラムも除去した。定量化領域は、sgRNAに対応するアラインメント中のカラム、ならびにガイドの両端から延びる10カラムと定義した。sgRNAがアンプリコンに対して逆相補的であった場合、真の突然変異をT-to-C突然変異と定義し;それ以外の場合、真の突然変異をA-to-G突然変異と定義する。すべての他の置換をランダム突然変異と定義した。置換パーセンテージを、定量化領域内に少なくとも1つの真の突然変異を含む残りのリードのパーセンテージと定義した。
【0208】
結果は、dCasMINI-ABEがdCas12a-ABEのそれと同等の編集効率を示したことを示した(
図52)。これらの知見は、CasMINIが幅広いゲノム工学適用に使用できることを確認した。
【0209】
次に、dCasMINIをデオキシアデノシンデアミナーゼTadA-8e(TadA*)ドメインまたはヘテロ二量体TadA-TadA*へ融合することによって異なる設計を作製した(
図56中のデザイン1~4)(T. P. Huang, G. A. Newby, & D. R. Liu, Nat. Protoc. 16, (2021): 1089; M. F. Richter et al., Nat Biotechnol. 38, (2020): 883)。A・TからG・Cへの変換効率は、3つのゲノム部位においてこれらの設計を用いたハイスループットシークエンシング(HTS)を介して測定した(
図57)。これらのタンパク質設計の中で、TadA-TadA*融合を用いたデザイン4は他のものよりも優れていた。次に、dCasMINI-ABEデザイン4(約3.0 kb)およびdCas12a-ABE(約4.5kb)を使用してのA・TからG・Cへの変換の頻度を、同じゲノム部位にてサイド・バイ・サイドで比較し、2つのシステムはこれらの部位にわたって同様の編集効率を示すことが分かった(
図58および59)。
【0210】
次に、A・TからG・Cへの塩基編集についてのこの融合体のパフォーマンスを、IFNγ、HBB、およびVEGFA遺伝子座の近傍領域中の複数の部位を含む合計12のゲノム部位で特徴付けた。多くのゲノム部位について、検出可能なA・TからG・Cへの塩基変換が観察された(
図60および61)。塩基編集効率は標的部位に依存し、A・TからG・Cへの変換についてのパターンをさらに分析した。興味深いことに、最も効率的なA・TからG・Cへの編集は、狭いウィンドウA3~A4(PAMの3~4bp下流、TTTR PAM中の「R」は位置「0」である)で起こったことが観察され(
図62)、これは、効率的な塩基編集のために慎重なsgRNA標的設計が必要であることを示唆している。
【0211】
実施例9.哺乳動物細胞における転写抑制へのCasMINIの適用
転写リプレッサーとしての提供されるCasMINIシステムの機能を評価するために、dCas12aおよびdCasMINI(4つの突然変異を有する)をそれぞれ独立して転写リプレッサードメインKRABへ融合させた。結果として生じた融合体を、次いで、HEK293T細胞中で合成レポーターシステム上の同じ部位(ゲノム中へ安定に挿入された、EGFPを駆動するSV40プロモーター)を標的とする単一のsgRNAを使用して試験した。dCas12a-KRAB + crRNAまたはdCasMINI-KRAB + sgRNAの両方がトランスフェクトされた細胞の観察は、標的GFP遺伝子の中程度ではあるが統計的に有意な抑制を検出した。
図53に示されるように、dCas12a(黄色のバー)は、非ターゲティングcrRNA(灰色のバー)と比較して最大34%の抑制を示した。dCasMINI(青色のバー)は、非ターゲティングsgRNA(薄い灰色)を用いたその対照群と比較して、標的GFPの最大25%の抑制を示した。これらの結果は、提供されるシステムがゲノム内の内在性遺伝子の転写抑制またはエピジェネティック抑制のために使用できることを実証している。
【0212】
実施例10.哺乳動物細胞における遺伝子編集へのCasMINIの適用
遺伝子を編集する提供されるCasMINIシステムの能力をさらに評価するために、3つの構築物を作製した。これらのうち2つ、CasMINI-V2_E2およびCasMINI-V2_E3は、Cas14アミノ酸配列に2つの置換を有するCasタンパク質バリアントを含み、1つ、CasMINI-V4_E4は、4つの置換を有するCasタンパク質バリアントを含んだ。E2構築物は3xFLAG(登録商標)タグを含み、一方、E3およびE4構築物は、ヒトインフルエンザヘマグルチニン(HA)タグを含んだ。さらに、11個の異なるsgRNAを下記の表1に示すように構築した。各ガイドRNAは、鋳型または非鋳型DNA鎖のTTTGまたはTTTA PAMのいずれか、およびヒトゲノムの遺伝子DNMT1またはVEGFAを標的とした。各遺伝子座について、各突然変異(例えば、挿入および欠失を含む、インデル)についてのバリアントのパーセンテージを定量化するために、ディープシークエンシングを実行するためのPCRプライマーを設計した。
【0213】
【0214】
sgRNAの50塩基対内の領域における欠失、挿入、および置換対立遺伝子突然変異を含むインデルのパーセンテージとして定量化された遺伝子編集結果を、
図54に提示する。データは、すべての試験されたCasMINIシステムが、インデル、したがって遺伝子編集を誘発できることを示している。試験された11個のsgRNAのうち、4つがバックグラウンドを上回る測定可能なインデルを誘発することができた。試験されたCasMINI構築物の中で、E2はわずかにより良い遺伝子編集を示し、編集効率は7%であった。これらの結果は、遺伝子編集のパフォーマンスがsgRNAターゲティング位置に依存し得ることを示唆している。さらに、
図54に提示される代表的な配列は、改変がsgRNAによる標的DNA PAM(プロトスペーサー隣接モチーフ、TTTR)の遠位領域に向かって偏っていることを示す。
【0215】
dCasMINIバリアントのヌクレアーゼ活性バージョン(CasMINI)がヒト細胞においてゲノムDNAを切断および編集できるかどうかをさらに調べるために、CasMINI-V2 (D143R/T147R)、V3.1 (D143R/T147R/E151A)、およびV4 (D143R/T147R/K330R/E528R)を野生型Cas12fサイド・バイ・サイドで比較した(
図63)。K330RおよびE528R突然変異がRuvCドメイン中の触媒部位に近接していることがCasMINI-V4のDNA切断能力に悪影響を与え得るという疑いのために、V2およびV3.1バリアントを含めた。sgRNAデザイン2を使用して、すべてのバリアントを、VEGFAゲノム遺伝子座中の4つの選択された部位を標的とすることによって試験し、ディープシークエンシングを介してインデル(挿入/欠失)形成効率を測定した。興味深いことに、CasMINI-V3.1はV2およびV4よりも優れ、すべての試験部位にわたって一貫してより高いインデル形成を示したことが観察された(
図64)。また、デザイン2 sgRNAを使用することで、哺乳動物細胞中で野生型Cas12fを用いて適度なインデル形成が可能になり、これは、これまで観察されていなかった。
【0216】
CasMINI-V3.1を用いて遺伝子編集をさらに特徴付けるために、HBBまたはIFNγ(
図34および39)における4つの追加のゲノム部位においてインデル形成効率を定量化した。これらの部位では、CasMINI-V3.1を用いてロバストな遺伝子編集が観察され、これは、野生型Cas12fやCasMINI-V2よりも効率的であった(
図65および66)。これらのデータは、最適な遺伝子編集を可能にするCasMINIバリアントが、最良の遺伝子活性化に使用されるものとは異なり得ることを示唆している。
【0217】
CasMINIバリアントによって形成されたインデルパターンを、トップのゲノム部位におけるインデル長を平均することによってさらに分析した。野生型Cas12fと比較して、CasMINI-V3.1はより大きな欠失(約20 bp)を示し、これはまたCas9について報告されたものよりも大きかった(
図67)(B. P. Kleinstiver, Nat. Biotechnol. 37, (2019): 276; J. Strecker et al., Nat. Commun. 10, (2019): 212)。各ヌクレオチド位置におけるインデル形成頻度も評価した。興味深いことに、主要なインデル編集は、sgRNA結合配列の外側にまたがるPAM遠位領域で観察された(
図68)。以前のインビトロアッセイは、Cas12f切断は主にPAM配列に対して20~24 bpの位置付近に集中することが示された(T. Karvelis et al., Nucleic Acids Res. 48, (2020): 5016)。一貫して、CasMINIを用いた本発明者らの結果は、インビボ遺伝子編集もPAMに対して20~30 bpの位置付近でピークに達することを示した(
図68)。本発明者らは、したがって、CasMINIは遺伝子活性化に加えて幅広いゲノム編集適用に利用できることを確認する。
【0218】
【0219】
前述の開示は、理解の明瞭化の目的で例示および例としてある程度詳細に説明されているが、当業者は、一定の変更および改変が、開示の精神および範囲内で、例えば、添付の特許請求の範囲内で、実施され得ることを理解するであろう。また、開示の局面ならびに様々な記載された態様および特徴の部分は、全体的または部分的に組み合わされまたは交換され得ることも理解されたい。様々な態様の前述の説明において、別の態様に言及する態様は、当業者によって理解されるように、他の態様と適宜組み合わされ得る。さらに、当業者は、前述の説明が単なる例としてのものであり、開示を限定するようには意図されないことを理解するであろう。加えて、本明細書中で提供される各参考文献は、各参考文献が参照により個々に組み入れられた場合と同程度に、あらゆる目的のために参照によりその全体が組み入れられる。
【手続補正書】
【提出日】2023-07-04
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
【国際調査報告】