IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビーム セラピューティクス インク.の特許一覧

特表2024-521750塩基エディターの自己不活性化のための組成物及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-04
(54)【発明の名称】塩基エディターの自己不活性化のための組成物及び方法
(51)【国際特許分類】
   C12N 15/31 20060101AFI20240528BHJP
   C12N 1/15 20060101ALI20240528BHJP
   C12N 1/19 20060101ALI20240528BHJP
   C12N 1/21 20060101ALI20240528BHJP
   C12N 5/10 20060101ALI20240528BHJP
   C12N 15/86 20060101ALI20240528BHJP
   C12N 15/88 20060101ALI20240528BHJP
   A61K 48/00 20060101ALI20240528BHJP
   A61P 43/00 20060101ALI20240528BHJP
   A61K 9/127 20060101ALI20240528BHJP
   A61K 9/14 20060101ALI20240528BHJP
   A61K 47/44 20170101ALI20240528BHJP
   A61K 35/76 20150101ALI20240528BHJP
   A61K 35/761 20150101ALI20240528BHJP
   A61K 35/763 20150101ALI20240528BHJP
   A61K 35/12 20150101ALI20240528BHJP
【FI】
C12N15/31
C12N1/15 ZNA
C12N1/19
C12N1/21
C12N5/10
C12N15/86 Z
C12N15/88 Z
A61K48/00
A61P43/00 105
A61K9/127
A61K9/14
A61K47/44
A61K35/76
A61K35/761
A61K35/763
A61K35/12
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023572544
(86)(22)【出願日】2022-05-27
(85)【翻訳文提出日】2023-11-22
(86)【国際出願番号】 US2022031419
(87)【国際公開番号】W WO2022251687
(87)【国際公開日】2022-12-01
(31)【優先権主張番号】63/194,431
(32)【優先日】2021-05-28
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PLURONIC
2.TRITON
(71)【出願人】
【識別番号】520439645
【氏名又は名称】ビーム セラピューティクス インク.
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【弁理士】
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】ブライソン、 デビッド
(72)【発明者】
【氏名】サリバン、 ジャック
【テーマコード(参考)】
4B065
4C076
4C084
4C087
【Fターム(参考)】
4B065AA01X
4B065AA57X
4B065AA72X
4B065AA90X
4B065AA90Y
4C076AA19
4C076AA29
4C076EE51
4C084AA13
4C084NA06
4C084ZB21
4C087AA01
4C087AA02
4C087BB65
4C087BC83
4C087CA09
4C087CA12
4C087NA06
4C087ZB21
(57)【要約】
デアミナーゼまたはnapDNAbpをコードするオープンリーディングフレーム内に挿入されたイントロンを含む、デアミナーゼまたはnapDNAbpポリペプチドをコードするポリヌクレオチドであって、さらに、イントロンが、mRNA編集のスプライシングを減少させるように機能する改変されたスプライスアクセプターまたはスプライスドナー部位を有する、ポリヌクレオチドが本明細書に開示される。また、イントロンを含む塩基エディターオープンリーディングフレームをコードするポリヌクレオチドであって、塩基エディターが、napDNAbpドメインまたはデアミナーゼドメインを含む、ポリヌクレオチドも開示される。
【特許請求の範囲】
【請求項1】
デアミナーゼドメインもしくは核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン、またはその断片をコードするポリヌクレオチドであって、前記ポリヌクレオチドが、イントロンを含み、前記イントロンが、前記デアミナーゼもしくはnapDNAbp、またはその断片をコードするオープンリーディングフレーム内に挿入されている、前記ポリヌクレオチド。
【請求項2】
イントロンを含むデアミナーゼドメインまたは核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインオープンリーディングフレームをコードするポリヌクレオチドであって、前記イントロンが、スプライスアクセプターまたはスプライスドナー部位での改変を含み、前記改変が、塩基エディターmRNAのスプライシングを低減または排除し、それによって、塩基エディターポリペプチドの発現を低減または排除する、前記ポリヌクレオチド。
【請求項3】
塩基エディターポリペプチドまたはその断片をコードするポリヌクレオチドであって、前記ポリヌクレオチドが、イントロンを含み、前記イントロンが、前記塩基エディターポリペプチドまたはその断片をコードするオープンリーディングフレーム内に挿入されている、前記ポリヌクレオチド。
【請求項4】
前記塩基エディターが、ゲノムDNAにおける高い編集効率を有する、請求項3に記載のポリヌクレオチド。
【請求項5】
イントロンを含む塩基エディターオープンリーディングフレームを含むポリヌクレオチドであって、前記イントロンが、スプライスアクセプターまたはスプライスドナー部位での改変を含み、前記改変が、塩基エディターmRNAのスプライシングを低減または排除し、それによって、塩基エディターポリペプチドの発現を低減または排除する、前記ポリヌクレオチド。
【請求項6】
前記塩基エディターが、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインまたはデアミナーゼドメインを含む、請求項3~5のいずれか1項に記載のポリヌクレオチド。
【請求項7】
核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインまたはデアミナーゼドメインを含む塩基エディターをコードするポリヌクレオチドであって、前記ポリヌクレオチドが、イントロンを含み、前記イントロンが、前記napDNAbpドメインまたは前記デアミナーゼドメインをコードするオープンリーディングフレーム内に挿入されている、前記ポリヌクレオチド。
【請求項8】
核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン及びデアミナーゼドメインを含む塩基エディターまたはその断片をコードするポリヌクレオチドであって、前記ポリヌクレオチドが、イントロンを含む塩基エディターオープンリーディングフレームを含み、前記イントロンが、スプライスアクセプターまたはスプライスドナー部位での改変を含み、前記改変が、塩基エディターmRNAのスプライシングを低減する、前記ポリヌクレオチド。
【請求項9】
前記デアミナーゼドメインが、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである、請求項1、2または6~8のいずれか1項に記載のポリヌクレオチド。
【請求項10】
前記napDNAbpドメインが、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインからなる群から選択されるCasドメインである、請求項1、2、または6~9のいずれか1項に記載のポリヌクレオチド。
【請求項11】
前記イントロンが、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6C、及びHMCN2からなる群から選択される配列に由来する、請求項1~10のいずれか1項に記載のポリヌクレオチド。
【請求項12】
前記イントロンが、NF1に由来する、請求項11に記載のポリヌクレオチド。
【請求項13】
前記イントロンが、PAX2に由来する、請求項11に記載のポリヌクレオチド。
【請求項14】
前記イントロンが、EEF1A1に由来する、請求項11に記載のポリヌクレオチド。
【請求項15】
前記イントロンが、HBBに由来する、請求項11に記載のポリヌクレオチド。
【請求項16】
前記イントロンが、IGHG1に由来する、請求項11に記載のポリヌクレオチド。
【請求項17】
前記イントロンが、SLC50A1に由来する、請求項11に記載のポリヌクレオチド。
【請求項18】
前記イントロンが、ABCB11に由来する、請求項11に記載のポリヌクレオチド。
【請求項19】
前記イントロンが、BRSK2に由来する、請求項11に記載のポリヌクレオチド。
【請求項20】
前記イントロンが、PLXNB3に由来する、請求項11に記載のポリヌクレオチド。
【請求項21】
前記イントロンが、TMPRSS6に由来する、請求項11に記載のポリヌクレオチド。
【請求項22】
前記イントロンが、IL32に由来する、請求項11に記載のポリヌクレオチド。
【請求項23】
前記イントロンが、PKHD1L1に由来する、請求項11に記載のポリヌクレオチド。
【請求項24】
前記イントロンが、PADI1に由来する、請求項11に記載のポリヌクレオチド。
【請求項25】
前記イントロンが、KRT6Cに由来する、請求項11に記載のポリヌクレオチド。
【請求項26】
前記イントロンが、HMCN2に由来する、請求項11に記載のポリヌクレオチド。
【請求項27】
前記イントロンが、哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する、請求項1~26のいずれか1項に記載のポリヌクレオチド。
【請求項28】
前記イントロンが、非哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する、請求項1~26のいずれか1項に記載のポリヌクレオチド。
【請求項29】
前記イントロンが、合成イントロンである、請求項1~10のいずれか1項に記載のポリヌクレオチド。
【請求項30】
前記イントロンが、以下:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)のうちの1つに対して少なくとも約85%の核酸配列同一性を有する配列を含む、請求項1~26のいずれか1項に記載のポリヌクレオチド。
【請求項31】
前記イントロンが、以下:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)のうちの1つからの核酸配列を含む、請求項1~26のいずれか1項に記載のポリヌクレオチド。
【請求項32】
前記イントロンが、約10塩基対~約500塩基対を含む、請求項1~31のいずれか1項に記載のポリヌクレオチド。
【請求項33】
前記イントロンが、約70塩基対~150塩基対を含む、請求項32に記載のポリヌクレオチド。
【請求項34】
前記イントロンが、約100塩基対~200塩基対を含む、請求項32に記載のポリヌクレオチド。
【請求項35】
前記イントロンが、プロトスペーサー配列に近接して挿入される、請求項1~34のいずれか1項に記載のポリヌクレオチド。
【請求項36】
前記イントロンが、前記プロトスペーサー配列の約10~30塩基対内に挿入される、請求項35に記載のポリヌクレオチド。
【請求項37】
前記プロトスペーサー配列が、NGGまたはNNGRRTである、請求項35または36に記載のポリヌクレオチド。
【請求項38】
前記デアミナーゼドメインが、TadAドメインを含む、請求項1、2、または6~37のいずれか1項に記載のポリヌクレオチド。
【請求項39】
前記イントロンが、TadAのコドン18、23、59、62、87、または129内もしくはその直後に挿入される、請求項38に記載のポリヌクレオチド。
【請求項40】
前記イントロンが、TadAのコドン87の直後に挿入される、請求項39に記載のポリヌクレオチド。
【請求項41】
前記改変が、単一塩基編集である、請求項2、5、または8のいずれか1項に記載のポリヌクレオチド。
【請求項42】
前記単一塩基編集が、A-to-G塩基編集である、請求項41に記載のポリヌクレオチド。
【請求項43】
前記単一塩基編集が、C-to-T塩基編集である、請求項41に記載のポリヌクレオチド。
【請求項44】
リンカーをコードするポリヌクレオチド配列をさらに含む、請求項1~43のいずれか1項に記載のポリヌクレオチド。
【請求項45】
前記イントロンが、前記リンカーをコードする前記ポリヌクレオチド配列内に挿入される、請求項44に記載のポリヌクレオチド。
【請求項46】
前記プログラマブルDNA結合タンパク質ドメインが、Cas9ドメインである、請求項1~45のいずれか1項に記載のポリヌクレオチド。
【請求項47】
前記Cas9ドメインが、Cas9のAsn309に対応するアミノ酸残基とThr310に対応するアミノ酸残基とに分割されており、残基310が、Thr310Cysに変異した、請求項46に記載のポリヌクレオチド。
【請求項48】
(i)デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記napDNAbpドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、
(ii)前記napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、前記napDNAbpドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドと、を含む、組成物であって、
前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、前記ポリヌクレオチドのオープンリーディングフレーム内に挿入されている、前記組成物。
【請求項49】
(i)デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記デアミナーゼドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、(ii)前記デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、前記デアミナーゼドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドと、を含む、組成物であって、
前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、前記ポリヌクレオチドのオープンリーディングフレーム内に挿入されている、前記組成物。
【請求項50】
前記イントロンが、スプライスアクセプターまたはスプライスドナー部位での改変を含み、前記改変が、塩基エディターmRNAのスプライシングを低減または排除する、請求項48または49に記載の組成物。
【請求項51】
前記デアミナーゼドメインが、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである、請求項48~50のいずれか1項に記載の組成物。
【請求項52】
前記デアミナーゼが、TadAドメインである、請求項48~51のいずれか1項に記載の組成物。
【請求項53】
前記napDNAbpドメインが、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインからなる群から選択されるCasドメインである、請求項48~52のいずれか1項に記載の組成物。
【請求項54】
前記napDNAbpドメインが、Cas9ドメインである、請求項48~53のいずれか1項に記載の組成物。
【請求項55】
前記Cas9ドメインのN末端ドメイン及びC末端ドメインが、アミノ酸残基Asn309とThr310とに分割されている、請求項54に記載の組成物。
【請求項56】
前記Cas9ドメインが、変異Thr310Cysを含む、請求項54または55に記載の組成物。
【請求項57】
前記イントロンが、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6C、及びHMCN2からなる群から選択される配列に由来する、請求項48~56のいずれか1項に記載の組成物。
【請求項58】
前記イントロンが、NF1に由来する、請求項57に記載の組成物。
【請求項59】
前記イントロンが、PAX2に由来する、請求項57に記載の組成物。
【請求項60】
前記イントロンが、EEF1A1に由来する、請求項57に記載の組成物。
【請求項61】
前記イントロンが、HBBに由来する、請求項57に記載の組成物。
【請求項62】
前記イントロンが、IGHG1に由来する、請求項57に記載の組成物。
【請求項63】
前記イントロンが、SLC50A1に由来する、請求項57に記載の組成物。
【請求項64】
前記イントロンが、ABCB11に由来する、請求項57に記載の組成物。
【請求項65】
前記イントロンが、BRSK2に由来する、請求項57に記載の組成物。
【請求項66】
前記イントロンが、PLXNB3に由来する、請求項57に記載の組成物。
【請求項67】
前記イントロンが、TMPRSS6に由来する、請求項57に記載の組成物。
【請求項68】
前記イントロンが、IL32に由来する、請求項57に記載の組成物。
【請求項69】
前記イントロンが、PKHD1L1に由来する、請求項57に記載の組成物。
【請求項70】
前記イントロンが、PADI1に由来する、請求項57に記載の組成物。
【請求項71】
前記イントロンが、KRT6Cに由来する、請求項57に記載の組成物。
【請求項72】
前記イントロンが、HMCN2に由来する、請求項57に記載の組成物。
【請求項73】
リンカーポリヌクレオチド配列をさらに含む、請求項48~72のいずれか1項に記載の組成物。
【請求項74】
前記イントロンが、前記リンカーポリヌクレオチド配列内に挿入される、請求項73に記載の組成物。
【請求項75】
(i)デアミナーゼドメインを含む塩基エディターまたはその断片をコードするポリヌクレオチドと、
(ii)前記塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iii)前記塩基エディターを誘導して前記塩基エディターをコードする前記ポリヌクレオチドを編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステムであって、前記編集が、前記コードされた塩基エディターの活性及び/または発現の減少をもたらす、前記塩基エディターシステム。
【請求項76】
前記編集が、前記デアミナーゼドメインの触媒残基を改変する、請求項75に記載の塩基エディターシステム。
【請求項77】
前記デアミナーゼドメインが、アデノシンデアミナーゼドメインである、請求項75または76に記載の塩基エディター。
【請求項78】
前記デアミナーゼドメインが、及びシチジンデアミナーゼドメインである、請求項75または76に記載の塩基エディター。
【請求項79】
前記デアミナーゼドメインの前記改変された触媒残基が、以下の参照配列:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)のHis57(H57)、Glu59(E59)、Cys87(C87)もしくはCys90(C90)、または別のアデノシンデアミナーゼにおける対応する位置である、請求項77に記載の塩基エディターシステム。
【請求項80】
前記改変された触媒残基が、E59である、請求項76または79に記載の塩基エディターシステム。
【請求項81】
前記触媒残基に対する前記改変が、E59Gである、請求項76または79に記載の塩基エディター。
【請求項82】
前記改変された触媒残基が、H57である、請求項76または79に記載の塩基エディターシステム。
【請求項83】
前記触媒残基に対する前記改変が、H57Rである、請求項76または79に記載の塩基エディター。
【請求項84】
前記改変された触媒残基が、C87である、請求項76または79に記載の塩基エディターシステム。
【請求項85】
前記触媒残基に対する前記改変が、C87Rである、請求項76または79に記載の塩基エディター。
【請求項86】
前記改変された触媒残基が、C90である、請求項76または79に記載の塩基エディターシステム。
【請求項87】
前記触媒残基に対する前記改変が、C90Rである、請求項76または79に記載の塩基エディター。
【請求項88】
(i)自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記ポリヌクレオチドと、
(ii)前記自己不活性化塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iii)前記自己不活性化塩基エディターを誘導して、前記自己不活性化塩基エディターをコードする前記ポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステム。
【請求項89】
(i)塩基エディターをコードする、請求項3~47のいずれか1項に記載のポリヌクレオチドと、
(ii)前記塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iii)前記塩基エディターを誘導して、前記塩基エディターをコードする前記ポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステム。
【請求項90】
(i)塩基エディターをコードする、請求項48~74のいずれか1項に記載の組成物と、
(ii)前記塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iii)前記塩基エディターを誘導して前記(i)の組成物の前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステム。
【請求項91】
(i)デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記napDNAbpドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、
(ii)前記napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、前記napDNAbpドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドと、を含み、
前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、オープンリーディングフレーム内に挿入されており、前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドが、塩基エディターをコードし、
(iii)前記塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iv)前記塩基エディターを誘導して前記(i)または(ii)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステム。
【請求項92】
(i)デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記デアミナーゼドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、
(ii)前記デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、前記デアミナーゼドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドと、を含み、
前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、オープンリーディングフレーム内に挿入されており、前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドが、塩基エディターをコードし、
(iii)前記塩基エディターを誘導して細胞のゲノム内の部位を編集させる1つ以上のガイドRNAと、
(iv)前記塩基エディターを誘導して前記(i)または(ii)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させる1つ以上のガイドRNAと、を含む、塩基エディターシステム。
【請求項93】
前記塩基エディターシステムが、以下:
a)gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号191)、
b)gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号192)、
c)gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号193)、
d)GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号194)、
e)gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号195)、
f)gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号196)、
g)gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号197)、
h)GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号198)、
i)GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号190)、
j)gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号200)、
k)gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号201)、
l)GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号202)、
m)gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号203)、
n)gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号204)、
o)gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号205)、
p)GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号206)、
q)gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号207)、
r)gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号208)、
s)gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号209)、
t)gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号210)、
u)gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号211)、
v)gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号212)、
w)gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号213)、
x)gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号214)、
y)GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号215)、
z)gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号216)、
aa)gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号217)、
bb)gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号218)、
cc)GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号219)、
dd)gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号220)、
ee)gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号221)、
ff)gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号222)、
gg)gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号223)、
hh)gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号224)、
ii)gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号225)、
jj)gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号524)、
kk)gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号525)、
ll)GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号526)、
mm)gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号527)、
nn)gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号528)、
oo)gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号529)、
pp)gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号530)、
qq)gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号531)、
rr)gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号532)、
ss)gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号533)、
tt)gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号534)、
uu)gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号535)、
vv)gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号536)、
ww)gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号537)、
xx)gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号538)、
yy)gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号539)、
zz)gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号540)、
aaa)gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号541)、
bbb)gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号542)、
ccc)gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号543)、
ddd)gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号544)、
eee)gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号545)、
fff)gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号546)、または
ggg)gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号547)から選択されるポリヌクレオチド配列を含む、請求項75~92のいずれか1項に記載の塩基エディターシステム。
【請求項94】
自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを含むベクターであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記ベクター。
【請求項95】
請求項1~47のいずれか1項に記載のポリヌクレオチド、または請求項75~93のいずれか1項に記載の塩基エディターシステムを含む、ベクター。
【請求項96】
請求項48~74のいずれか1項に記載の組成物の第1のポリヌクレオチド及び/または第2のポリヌクレオチドを含む、ベクター。
【請求項97】
発現ベクターが、哺乳類発現ベクターである、請求項94~96のいずれか1項に記載のベクター。
【請求項98】
前記ベクターが、脂質ナノ粒子である、請求項94~97のいずれか1項に記載のベクター。
【請求項99】
前記ベクターが、アデノ随伴ウイルス(AAV)、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、センダイウイルスベクター及びヘルペスウイルスベクターからなる群から選択されるウイルスベクターである、請求項94~98のいずれか1項に記載のベクター。
【請求項100】
前記ベクターが、AAVベクターである、請求項99に記載のベクター。
【請求項101】
前記AAVベクターが、AAV2またはAAV8である、請求項100に記載のベクター。
【請求項102】
前記ベクターが、プロモーターを含む、請求項94~101のいずれか1項に記載のベクター。
【請求項103】
前記プロモーターが、CMVプロモーターである、請求項102に記載のベクター。
【請求項104】
自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを含むベクターを含む、細胞であって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記細胞。
【請求項105】
請求項1~47のいずれか1項に記載のポリヌクレオチド、請求項48~74のいずれか1項に記載の組成物、請求項75~93のいずれか1項に記載の塩基エディターシステム、または請求項94~103のいずれか1項に記載のベクターを含む、細胞。
【請求項106】
前記細胞が、インビトロまたはインビボである、請求項104または105に記載の細胞。
【請求項107】
請求項1~47のいずれか1項に記載のポリヌクレオチド、請求項75~93のいずれか1項に記載の塩基エディターシステム、請求項94~103のいずれか1項に記載のベクター、または請求項104~106のいずれか1項に記載の細胞を含む、医薬組成物。
【請求項108】
薬学的に許容される賦形剤、希釈剤、または担体をさらに含む、請求項107に記載の医薬組成物。
【請求項109】
請求項1~47のいずれか1項に記載のポリヌクレオチド、請求項48~74のいずれか1項に記載の組成物、請求項75~93のいずれか1項に記載の塩基エディターシステム、請求項94~103のいずれか1項に記載のベクター、請求項104~106のいずれか1項に記載の細胞、または請求項107もしくは108に記載の医薬組成物を含む、キット。
【請求項110】
前記キットの使用説明書をさらに含む、請求項109に記載のキット。
【請求項111】
自己不活性化塩基エディターの発現を低減または排除するための方法であって、
(a)自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを提供することであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記提供することと、
(b)前記ポリヌクレオチドを、ガイドRNA及び自己不活性化塩基エディターポリペプチドと接触させることであって、前記ガイドRNAが、前記塩基エディターを誘導して前記イントロンのスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項112】
自己不活性化塩基編集の方法であって、
(a)細胞内で、デアミナーゼドメインを含む塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記塩基エディターを誘導して、前記塩基エディターをコードする前記ポリヌクレオチドを編集させ、前記編集が、前記コードされた塩基エディターの活性及び/または発現の減少をもたらし、それによって、前記塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項113】
前記編集が、前記デアミナーゼドメインの触媒残基を改変する、請求項112に記載の方法。
【請求項114】
前記デアミナーゼドメインが、アデノシンデアミナーゼドメインである、請求項112または113に記載の方法。
【請求項115】
前記デアミナーゼドメインが、及びシチジンデアミナーゼドメインである、請求項112または113に記載の方法。
【請求項116】
前記デアミナーゼドメインの前記改変された触媒残基が、以下の参照配列:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)のHis57(H57)、Glu59(E59)、Cys87(C87)もしくはCys90(C90)、または別のアデノシンデアミナーゼにおける対応する位置である、請求項114に記載の方法。
【請求項117】
前記改変された触媒残基が、E59である、請求項116に記載の方法。
【請求項118】
前記触媒残基に対する前記改変が、E59Gである、請求項116に記載の方法。
【請求項119】
前記改変された触媒残基が、H57である、請求項116に記載の方法。
【請求項120】
前記触媒残基に対する前記改変が、H57Rである、請求項116に記載の方法。
【請求項121】
前記改変された触媒残基が、C87である、請求項116に記載の方法。
【請求項122】
前記触媒残基に対する前記改変が、C87Rである、請求項116に記載の方法。
【請求項123】
前記改変された触媒残基が、C90である、請求項116に記載の方法。
【請求項124】
前記触媒残基に対する前記改変が、C90Rである、請求項116に記載の方法。
【請求項125】
自己不活性化塩基編集の方法であって、
(a)細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記自己不活性化塩基エディターを誘導して、前記(a)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項126】
生物のゲノムを編集する方法であって、
(a)前記生物の細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記(a)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項127】
対象を治療する方法であって、
(a)前記対象の細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、前記ポリヌクレオチドが、前記自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含む、前記発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記対象を治療するための、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記(a)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項128】
対象を治療する方法であって、前記対象に、請求項75~93のいずれか1項に記載の塩基エディターシステム、請求項94~103のいずれか1項に記載のベクター、請求項104~106のいずれか1項に記載の細胞、または請求項107もしくは108に記載の医薬組成物を投与し、それによって、前記対象を治療することを含む、前記方法。
【請求項129】
生物のゲノムを編集する方法であって、
(a)前記生物の細胞内で、デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記napDNAbpドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、前記napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、前記napDNAbpドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドとを発現させることであって、前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、オープンリーディングフレーム内に挿入されており、前記細胞内での前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドの発現が、自己不活性化塩基エディターの形成をもたらす、前記発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記(a)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項130】
生物のゲノムを編集する方法であって、
(a)前記生物の細胞内で、デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、前記デアミナーゼドメインの前記N末端断片が、スプリットインテイン-Nに融合されている、前記第1のポリヌクレオチドと、前記デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、前記デアミナーゼドメインの前記C末端断片が、スプリットインテイン-Cに融合されている、前記第2のポリヌクレオチドとを発現させることであって、前記第1のポリヌクレオチドまたは前記第2のポリヌクレオチドが、イントロンを含み、前記イントロンが、オープンリーディングフレーム内に挿入されており、前記細胞内での前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドの発現が、自己不活性化塩基エディターの形成をもたらす、前記発現させることと、
(b)前記細胞を、第1のガイドRNAと接触させることであって、前記第1のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記細胞のゲノム内の部位を編集させ、それによって、前記細胞の前記ゲノム内の改変を生成する、前記接触させることと、
(c)前記細胞を、第2のガイドRNAと接触させることであって、前記第2のガイドRNAが、前記自己不活性化塩基エディターを誘導して前記(a)のポリヌクレオチドの前記イントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集させ、それによって、前記自己不活性化塩基エディターの発現を低減または排除する改変を生成する、前記接触させることと、を含む、前記方法。
【請求項131】
前記方法が、インビボで実施される、請求項111~130のいずれか1項に記載の方法。
【請求項132】
前記第1のポリヌクレオチド及び/または前記第2のポリヌクレオチドが、ベクターによって細胞内で発現される、請求項129または130に記載の方法。
【請求項133】
前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドが、別個のベクターによって細胞内で発現される、請求項129または130に記載の方法。
【請求項134】
前記第1のガイドRNA及び/または前記第2のガイドRNAが、ベクターによって前記細胞に送達される、請求項112~133のいずれか1項に記載の方法。
【請求項135】
前記第1のガイドRNA及び/または前記第2のガイドRNAが、前記第1のポリヌクレオチド及び/または前記第2のポリヌクレオチドと同じベクターで、前記細胞に送達される、請求項112~133のいずれか1項に記載の方法。
【請求項136】
前記第1のガイドRNA及び/または前記第2のガイドRNAが、前記第1のポリヌクレオチド及び/または前記第2のポリヌクレオチドとは異なるベクターで、前記細胞に送達される、請求項129~135のいずれか1項に記載の方法。
【請求項137】
前記ベクターが、脂質ナノ粒子である、請求項132~136のいずれか1項に記載の方法。
【請求項138】
前記ベクターが、ウイルスベクターである、請求項132~137のいずれか1項に記載の方法。
【請求項139】
前記ウイルスベクターが、アデノ随伴ウイルス(AAV)ベクターである、請求項138に記載の方法。
【請求項140】
前記AAVベクターが、AAV2またはAAV8である、請求項139に記載の方法。
【請求項141】
前記napDNAbpドメインが、Cas9ドメインである、請求項129~140のいずれか1項に記載の方法。
【請求項142】
前記Cas9ドメインのN末端ドメイン及びC末端ドメインが、アミノ酸残基Asn309とThr310とに分割されている、請求項141に記載の方法。
【請求項143】
前記Cas9ドメインが、変異Thr310Cysを含む、請求項141または142に記載の方法。
【請求項144】
前記塩基エディターが、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン及びデアミナーゼドメインを含む、請求項111~143のいずれか1項に記載の方法。
【請求項145】
前記イントロンを含む前記オープンリーディングフレームが、前記napDNAbpドメインまたは前記デアミナーゼドメイン内にある、請求項144に記載の方法。
【請求項146】
前記自己不活性化塩基エディターポリペプチドが、ゲノムDNAにおける高い編集効率を維持する、請求項111または125~145のいずれか1項に記載の方法。
【請求項147】
前記デアミナーゼドメインが、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである、請求項83、84、112~124または129~146のいずれか1項に記載の方法。
【請求項148】
前記napDNAbpドメインが、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインからなる群から選択されるCasドメインである、請求項144または145に記載の方法。
【請求項149】
前記改変が、前記イントロンの5’末端でのコンセンサススプライスドナー部位内または前記イントロンの3’末端でのコンセンサススプライスアクセプター配列内にある、請求項111、125~127、または129~148のいずれか1項に記載の方法。
【請求項150】
前記イントロンが、約10塩基対~約500塩基対を含む、請求項111、125~127、または129~149のいずれか1項に記載の方法。
【請求項151】
前記イントロンが、約70塩基対~150塩基対を含む、請求項150に記載の方法。
【請求項152】
前記イントロンが、約100塩基対~200塩基対を含む、請求項150に記載の方法。
【請求項153】
前記イントロンが、プロトスペーサー配列に近接して挿入される、請求項111、125~127、または129~152のいずれか1項に記載の方法。
【請求項154】
前記イントロンが、前記プロトスペーサー配列の約10~30塩基対内に挿入される、請求項153に記載の方法。
【請求項155】
前記プロトスペーサー配列が、NGGまたはNNGRRTである、請求項153または154に記載の方法。
【請求項156】
前記アデノシンデアミナーゼドメインが、TadAドメインを含む、請求項147に記載の方法。
【請求項157】
前記イントロンが、TadAのコドン18、23、59、62、87、または129内もしくはその直後に挿入される、請求項156に記載の方法。
【請求項158】
前記イントロンが、TadAのコドン87の直後に挿入される、請求項157に記載の方法。
【請求項159】
前記改変が、単一塩基編集である、請求項111~127または129~158のいずれか1項に記載の方法。
【請求項160】
前記単一塩基編集が、A-to-G塩基編集である、請求項159に記載の方法。
【請求項161】
前記単一塩基編集が、C-to-T塩基編集である、請求項159に記載の方法。
【請求項162】
前記イントロンが、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6C、及びHMCN2からなる群から選択される配列に由来する、請求項111、125~127、または129~161のいずれか1項に記載の方法。
【請求項163】
前記イントロンが、NF1に由来する、請求項162に記載の方法。
【請求項164】
前記イントロンが、PAX2に由来する、請求項162に記載の方法。
【請求項165】
前記イントロンが、EEF1A1に由来する、請求項162に記載の方法。
【請求項166】
前記イントロンが、HBBに由来する、請求項162に記載の方法。
【請求項167】
前記イントロンが、IGHG1に由来する、請求項162に記載の方法。
【請求項168】
前記イントロンが、SLC50A1に由来する、請求項162に記載の方法。
【請求項169】
前記イントロンが、ABCB11に由来する、請求項162に記載の方法。
【請求項170】
前記イントロンが、BRSK2に由来する、請求項162に記載の方法。
【請求項171】
前記イントロンが、PLXNB3に由来する、請求項162に記載の方法。
【請求項172】
前記イントロンが、TMPRSS6に由来する、請求項162に記載の方法。
【請求項173】
前記イントロンが、IL32に由来する、請求項162に記載の方法。
【請求項174】
前記イントロンが、PKHD1L1に由来する、請求項162に記載の方法。
【請求項175】
前記イントロンが、PADI1に由来する、請求項162に記載の方法。
【請求項176】
前記イントロンが、KRT6Cに由来する、請求項162に記載の方法。
【請求項177】
前記イントロンが、HMCN2に由来する、請求項162に記載の方法。
【請求項178】
前記イントロンが、哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する、請求項111、125~127、または129~161のいずれか1項に記載の方法。
【請求項179】
前記イントロンが、非哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する、請求項111、125~127、または129~161のいずれか1項に記載の方法。
【請求項180】
前記イントロンが、合成イントロンである、請求項111、125~127、または129~161のいずれか1項に記載の方法。
【請求項181】
前記イントロンが、以下:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)のうちの1つに対して少なくとも約85%、90%、95%、または99%の核酸配列同一性を有する配列を含む、請求項111、125~127、または129~161のいずれか1項に記載の方法。
【請求項182】
前記イントロンが、以下:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)のうちの1つからの核酸配列を含む、請求項111、125~127、または129~161のうちのいずれか1項に記載の方法。
【請求項183】
前記第2のガイドRNAが、以下:
a)gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号191)、
b)gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号192)、
c)gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号193)、
d)GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号194)、
e)gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号195)、
f)gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号196)、
g)gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号197)、
h)GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号198)、
i)GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号190)、
j)gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号200)、
k)gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号201)、
l)GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号202)、
m)gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号203)、
n)gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号204)、
o)gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号205)、
p)GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号206)、
q)gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号207)、
r)gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号208)、
s)gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号209)、
t)gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号210)、
u)gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号211)、
v)gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号212)、
w)gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号213)、
x)gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号214)、
y)GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号215)、
z)gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号216)、
aa)gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号217)、
bb)gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号218)、
cc)GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号219)、
dd)gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号220)、
ee)gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号221)、
ff)gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号222)、
gg)gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号223)、
hh)gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号224)、
ii)gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号225)、
jj)gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号524)、
kk)gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号525)、
ll)GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号526)、
mm)gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号527)、
nn)gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号528)、
oo)gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号529)、
pp)gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号530)、
qq)gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号531)、
rr)gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号532)、
ss)gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号533)、
tt)gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号534)、
uu)gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号535)、
vv)gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号536)、
ww)gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号537)、
xx)gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号538)、
yy)gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号539)、
zz)gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号540)、
aaa)gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号541)、
bbb)gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号542)、
ccc)gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号543)、
ddd)gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号544)、
eee)gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号545)、
fff)gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号546)、または
ggg)gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号547)から選択されるポリヌクレオチド配列を含む、請求項112~182のいずれか1項に記載の方法。
【請求項184】
前記ポリヌクレオチドが、リンカーポリヌクレオチド配列をさらに含む、請求項111~127または129~183のいずれか1項に記載の方法。
【請求項185】
前記イントロンが、前記リンカーポリヌクレオチド配列内に挿入される、請求項184に記載の方法。
【請求項186】
前記対象または生物が、ヒトである、請求項126~130に記載の方法。
【請求項187】
前記対象または生物が、哺乳類である、請求項186に記載の方法。
【請求項188】
前記哺乳類が、ヒトである、請求項187に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年5月28日に出願された米国仮出願第63/194,431号の優先権及び利益を主張し、その内容全体が、参照により本明細書に援用される。
【0002】
配列表
本出願は、ASCII形式で電子的に提出された配列表を含み、その全体が参照により本明細書に援用される。2022年5月27日に作成された当該ASCIIコピーは、180802_049001_PCT_SL.txtと称され、2,089,884バイトのサイズを有する。
【背景技術】
【0003】
真核生物におけるCRISPR-Casシステムの適用及び塩基編集の出現などの遺伝子編集技術の進展は、ゲノムが多種多様の細胞型及び生物において効率的に編集されることを可能にし、ヒトにおける遺伝子疾患を治療するための利用可能な手法を急速に発展させている。CRISPR-Casシステム及び塩基エディターは、目的のゲノム標的について非常に特異的であり得るが、細胞内でのゲノム修飾ツールの一過的発現は、発現がより長い期間にわたって持続した場合に発生する可能性がより高い、潜在的なオフターゲット編集事象を軽減するのに好ましい。したがって、正常なオンターゲット編集後に編集活性をその後阻害または停止するための方法は、特に、長期の発現をもたらし得る送達方法、例えば、アデノ随伴ウイルス(AAV)形質導入、DNAトランスフェクションまたは他の方法が使用されるときに、広く関心が向けられるものである。
【発明の概要】
【0004】
以下に記載されるように、本発明は、自己不活性化塩基エディター、ならびに関連する組成物及び方法を特徴とする。
【0005】
一態様では、本開示の本発明は、デアミナーゼドメインもしくは核酸プログラマブルDNA結合タンパク質(nucleic acid programmable DNA binding protein:napDNAbp)ドメイン、またはその断片をコードするポリヌクレオチドを特徴とする。ポリヌクレオチドは、イントロンを含有する。イントロンは、デアミナーゼもしくはnapDNAbp、またはその断片をコードするオープンリーディングフレーム内に挿入されている。
【0006】
別の態様では、本開示の本発明は、イントロンを含有するデアミナーゼドメインまたは核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインオープンリーディングフレームをコードするポリヌクレオチドを特徴とする。イントロンは、スプライスアクセプターまたはスプライスドナー部位での改変を含有する。改変は、塩基エディターmRNAのスプライシングを低減または排除し、それによって、塩基エディターポリペプチドの発現を低減または排除する。
【0007】
別の態様では、本開示の本発明は、塩基エディターポリペプチドまたはその断片をコードするポリヌクレオチドを特徴とする。ポリヌクレオチドは、イントロンを含有する。イントロンは、塩基エディターポリペプチドまたはその断片をコードするオープンリーディングフレーム内に挿入されている。
【0008】
別の態様では、本開示の本発明は、イントロンを含有する塩基エディターオープンリーディングフレームを含有するポリヌクレオチドを特徴とする。イントロンは、スプライスアクセプターまたはスプライスドナー部位での改変を含有する。改変は、塩基エディターmRNAのスプライシングを低減または排除し、それによって、塩基エディターポリペプチドの発現を低減または排除する。
【0009】
別の態様では、本開示の本発明は、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインまたはデアミナーゼドメインを含有する塩基エディターをコードするポリヌクレオチドを特徴とする。ポリヌクレオチドは、イントロンを含有する。イントロンは、napDNAbpドメインまたはデアミナーゼドメインをコードするオープンリーディングフレーム内に挿入されている。
【0010】
別の態様では、本開示の本発明は、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン及びデアミナーゼドメインを含有する塩基エディターまたはその断片をコードするポリヌクレオチドを特徴とする。ポリヌクレオチドは、イントロンを含有する塩基エディターオープンリーディングフレームを含有する。イントロンは、スプライスアクセプターまたはスプライスドナー部位での改変を含有する。改変は、塩基エディターmRNAのスプライシングを低減する。
【0011】
別の態様では、本開示の本発明は、(i)デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、napDNAbpドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドを含有する組成物を特徴とする。組成物はまた、(ii)napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、napDNAbpドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドを含有する。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有し、イントロンは、ポリヌクレオチドのオープンリーディングフレーム内に挿入されている。
【0012】
別の態様では、本開示の本発明は、(i)デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、デアミナーゼドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドを含有する組成物を特徴とする。組成物はまた、(ii)デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、デアミナーゼドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドを含有する。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有し、イントロンは、ポリヌクレオチドのオープンリーディングフレーム内に挿入されている。
【0013】
別の態様では、本開示の本発明は、(i)デアミナーゼドメインを含有する塩基エディターまたはその断片をコードするポリヌクレオチドを含有する塩基エディターシステムを特徴とする。塩基エディターシステムはまた、(ii)塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAを含有する。塩基エディターシステムは、(iii)塩基エディターに、塩基エディターをコードするポリヌクレオチドを編集するように指示する1つ以上のガイドRNAをさらに含有する。編集は、コードされた塩基エディターの活性及び/または発現の減少をもたらす。
【0014】
別の態様では、本開示の本発明は、(i)自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドであって、ポリヌクレオチドが、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する、ポリヌクレオチドを含有する塩基エディターシステムを特徴とする。塩基エディターシステムは、(ii)自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAをさらに含有する。塩基エディターシステムはまた、(iii)自己不活性化塩基エディターに、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示する1つ以上のガイドRNAを含有する。
【0015】
別の態様では、本開示の本発明は、(i)塩基エディターをコードする、上記の態様のうちのいずれか1つのポリヌクレオチドを含有する塩基エディターシステムを特徴とする。塩基エディターシステムはまた、(ii)塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAを含有する。塩基エディターシステムは、(iii)塩基エディターに、塩基エディターをコードするポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示する1つ以上のガイドRNAをさらに含有する。
【0016】
別の態様では、本開示の本発明は、(i)塩基エディターをコードする上記の態様のうちのいずれかの組成物を含有する塩基エディターシステムを特徴とする。塩基エディターシステムは、(ii)塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAをさらに含有する。塩基エディターシステムはまた、(iii)塩基エディターに、(i)の組成物のイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示する1つ以上のガイドRNAを含有する。
【0017】
別の態様では、本開示の本発明は、(i)デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、napDNAbpドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドを含有する塩基エディターシステムを特徴とする。塩基エディターシステムはまた、(ii)napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、napDNAbpドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドを含有する。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有し、イントロンは、オープンリーディングフレーム内に挿入されており、第1のポリヌクレオチド及び第2のポリヌクレオチドは、塩基エディターをコードする。塩基エディターシステムは、(iii)塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAをさらに含有する。塩基エディターシステムはまた、(iv)塩基エディターに、(i)または(ii)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示する1つ以上のガイドRNAを含有する。
【0018】
別の態様では、本開示の本発明は、(i)デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、デアミナーゼドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドを含有する塩基エディターシステムを特徴とする。塩基エディターシステムはまた、(ii)デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、デアミナーゼドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドを含有する。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有し、イントロンは、オープンリーディングフレーム内に挿入されており、第1のポリヌクレオチド及び第2のポリヌクレオチドは、塩基エディターをコードする。塩基エディターシステムはまた、(iii)塩基エディターに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAを含有する。塩基エディターシステムはまた、(iv)塩基エディターに、(i)または(ii)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示する1つ以上のガイドRNAを含有する。
【0019】
別の態様では、本開示の本発明は、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを含有するベクターを特徴とする。ポリヌクレオチドは、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する。
【0020】
別の態様では、本開示の本発明は、上記の態様のうちのいずれかのポリヌクレオチド、もしくはそれらの実施形態、または上記の態様のうちのいずれかの塩基エディターシステム、もしくはそれらの実施形態を含有するベクターを特徴とする。
【0021】
別の態様では、本開示の本発明は、上記の態様のうちのいずれか1つの組成物の第1のポリヌクレオチド及び/または第2のポリヌクレオチドを含有するベクターを特徴とする。
【0022】
別の態様では、本開示の本発明は、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを含有するベクターを含有する細胞を特徴とする。ポリヌクレオチドは、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する。
【0023】
別の態様では、本開示の本発明は、上記の態様のいずれかのポリヌクレオチド、もしくはその実施形態、上記の態様のいずれかの組成物、もしくはその実施形態、上記の態様のいずれかの塩基エディターシステム、もしくはその実施形態、または上記の態様のいずれかのベクター、もしくはその実施形態を含有する細胞を特徴とする。
【0024】
別の態様では、本開示の本発明は、上記の態様のうちのいずれかのポリヌクレオチド、もしくはそれらの実施形態、上記の態様のうちのいずれかの塩基エディターシステム、もしくはそれらの実施形態、上記の態様のうちのいずれかのベクター、もしくはそれらの実施形態、または上記の態様のうちのいずれかの細胞、もしくはそれらの実施形態を含有する医薬組成物を特徴とする。
【0025】
別の態様では、本開示の本発明は、上記の態様のうちのいずれかのポリヌクレオチド、組成物、塩基エディターシステム、ベクター、細胞、もしくは医薬組成物、またはそれらの実施形態を含有するキットを特徴とする。
【0026】
別の態様では、本開示の本発明は、自己不活性化塩基エディターの発現を低減または排除するための方法を特徴とする。方法は、(a)自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを提供することであって、ポリヌクレオチドが、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する、提供することを含む。方法はまた、(b)ポリヌクレオチドを、ガイドRNA及び自己不活性化塩基エディターポリペプチドと接触させることであって、ガイドRNAが、塩基エディターに、イントロンのスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることを含む。
【0027】
別の態様では、本開示の本発明は、自己不活性化塩基編集の方法を特徴とする。方法は、(a)細胞内で、デアミナーゼドメインを含有する塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることを含む。方法はまた、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、細胞のゲノム内の改変を生成する、接触させることを含む。方法は、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、塩基エディターに、塩基エディターをコードするポリヌクレオチドを編集するように指示し、編集が、コードされた塩基エディターの活性及び/または発現の減少をもたらし、それによって、塩基エディターの発現を低減または排除する改変を生成する、接触させることをさらに含む。
【0028】
別の態様では、本開示の本発明は、自己不活性化塩基編集の方法を特徴とする。方法は、(a)細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、ポリヌクレオチドが、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する、発現させることを含む。方法はまた、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、細胞のゲノム内の改変を生成する、接触させることを含む。方法は、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、自己不活性化塩基エディターに、(a)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることをさらに含む。
【0029】
別の態様では、本開示の本発明は、生物のゲノムを編集する方法を特徴とする。方法は、(a)生物の細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、ポリヌクレオチドが、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する、発現させることを含む。方法はまた、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、細胞のゲノム内の改変を生成する、接触させることを含む。方法は、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、自己不活性化塩基エディターに、(a)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることをさらに含む。
【0030】
別の態様では、本開示の本発明は、対象を治療する方法を特徴とする。方法は、(a)対象の細胞内で、自己不活性化塩基エディターまたはその断片をコードするポリヌクレオチドを発現させることであって、ポリヌクレオチドが、自己不活性化塩基エディターまたはその断片のオープンリーディングフレーム内に挿入されたイントロンを含有する、発現させることを含む。方法は、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、対象を治療するための、細胞のゲノム内の改変を生成する、接触させることをさらに含む。方法はまた、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、自己不活性化塩基エディターに、(a)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることを含む。
【0031】
別の態様では、本開示の本発明は、対象を治療する方法を特徴とする。方法は、対象に、上記の態様のうちのいずれかの塩基エディターシステム、ベクター、細胞、もしくは医薬組成物、またはそれらの実施形態を投与することを伴い、それによって対象を治療する。
【0032】
別の態様では、本開示の本発明は、生物のゲノムを編集する方法を特徴とする。方法は、(a)生物の細胞内で、デアミナーゼドメイン及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインのN末端断片をコードする第1のポリヌクレオチドであって、napDNAbpドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドと、napDNAbpドメインのC末端断片をコードする第2のポリヌクレオチドであって、napDNAbpドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドとを発現させることを含む。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有する。イントロンは、オープンリーディングフレーム内に挿入されている。細胞内での第1のポリヌクレオチド及び第2のポリヌクレオチドの発現は、自己不活性化塩基エディターの形成をもたらす。方法はまた、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、細胞のゲノム内の改変を生成する、接触させることを含む。方法はまた、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、自己不活性化塩基エディターに、(a)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることを含む。
【0033】
別の態様では、本開示の本発明は、生物のゲノムを編集する方法を特徴とする。方法は、(a)生物の細胞内で、デアミナーゼドメインのN末端断片をコードする第1のポリヌクレオチドであって、デアミナーゼドメインのN末端断片が、スプリットインテイン-Nに融合されている、第1のポリヌクレオチドと、デアミナーゼドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインをコードする第2のポリヌクレオチドであって、デアミナーゼドメインのC末端断片が、スプリットインテイン-Cに融合されている、第2のポリヌクレオチドとを発現させることを含む。第1のポリヌクレオチドまたは第2のポリヌクレオチドは、イントロンを含有し、イントロンは、オープンリーディングフレーム内に挿入されている。細胞内での第1のポリヌクレオチド及び第2のポリヌクレオチドの発現は、自己不活性化塩基エディターの形成をもたらす。方法はまた、(b)細胞を、第1のガイドRNAと接触させることであって、第1のガイドRNAが、自己不活性化塩基エディターに、細胞のゲノム内の部位を編集するように指示し、それによって、細胞のゲノム内の改変を生成する、接触させることを含む。方法は、(c)細胞を、第2のガイドRNAと接触させることであって、第2のガイドRNAが、自己不活性化塩基エディターに、(a)のポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集するように指示し、それによって、自己不活性化塩基エディターの発現を低減または排除する改変を生成する、接触させることをさらに含む。
【0034】
上記の態様のうちのいずれか、またはそれらの実施形態では、塩基エディターは、ゲノムDNAにおいて高い編集効率を有する。上記の態様のうちのいずれか、またはそれらの実施形態では、塩基エディターは、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメインまたはデアミナーゼドメインを含有する。
【0035】
上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、TadAドメインである。
【0036】
上記の態様のうちのいずれか、またはそれらの実施形態では、napDNAbpドメインは、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインのうちの1つ以上から選択されるCasドメインである。
【0037】
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6C、及びHMCN2のうちの1つ以上から選択される配列に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、NF1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、PAX2に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、EEF1A1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、HBBに由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、IGHG1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、SLC50A1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、ABCB11に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、BRSK2に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、PLXNB3に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、TMPRSS6に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、IL32に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、PKHD1L1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、PADI1に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、KRT6Cに由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、HMCN2に由来する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、非哺乳類遺伝子に天然に存在するイントロンに対して少なくとも約85%の核酸配列同一性を有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、合成イントロンである。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、以下のうちの1つに対して少なくとも約85%の核酸配列同一性を有する配列を含有する:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)。
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、以下のうちの1つからの核酸配列を含有する:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)。
【0038】
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、約10塩基対~約500塩基対を含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、約70塩基対~150塩基対を含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、約100塩基対~200塩基対を含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、プロトスペーサー配列に近接して挿入される。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、プロトスペーサー配列の約10~30塩基対内に挿入される。上記の態様のうちのいずれか、またはそれらの実施形態では、プロトスペーサー配列は、NGGまたはNNGRRTである。
【0039】
上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、TadAドメインを含有する。
【0040】
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、TadAのコドン18、23、59、62、87、または129内もしくはその直後に挿入される。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、TadAのコドン87の直後に挿入される。上記の態様のうちのいずれか、またはそれらの実施形態では、改変は、単一塩基編集である。上記の態様のうちのいずれか、またはそれらの実施形態では、単一塩基編集は、A-to-G塩基編集である。上記の態様のうちのいずれか、またはそれらの実施形態では、単一塩基編集は、C-to-T塩基編集である。
【0041】
上記の態様のうちのいずれか、またはそれらの実施形態では、ポリヌクレオチドは、リンカーをコードするポリヌクレオチド配列をさらに含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、リンカーをコードするポリヌクレオチド配列内に挿入される。
【0042】
上記の態様のうちのいずれか、またはそれらの実施形態では、プログラマブルDNA結合タンパク質ドメインは、Cas9ドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、Cas9ドメインは、Cas9のAsn309に対応するアミノ酸残基とThr310に対応するアミノ酸残基とに分割され、残基310は、Thr310Cysに変異した。
【0043】
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、スプライスアクセプターまたはスプライスドナー部位に改変を含有し、この改変は、塩基エディターmRNAのスプライシングを低減または排除する。
【0044】
上記の態様のうちのいずれか、またはそれらの実施形態では、napDNAbpドメインは、Cas9ドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、Cas9ドメインのN末端ドメイン及びC末端ドメインは、アミノ酸残基Asn309とThr310とに分割される。上記の態様のうちのいずれか、またはそれらの実施形態では、Cas9ドメインは、変異Thr310Cysを含有する。
【0045】
上記の態様のうちのいずれか、またはそれらの実施形態では、組成物は、リンカーポリヌクレオチド配列をさらに含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、リンカーポリヌクレオチド配列内に挿入される。
【0046】
上記の態様のうちのいずれか、またはそれらの実施形態では、編集は、デアミナーゼドメインの触媒残基を改変させる。上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、アデノシンデアミナーゼドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、及びシチジンデアミナーゼドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインの改変された触媒残基は、以下の参照配列:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)のHis57(H57)、Glu59(E59)、Cys87(C87)、もしくはCys90(C90)、または別のアデノシンデアミナーゼにおける対応する位置である。上記の態様のうちのいずれか、またはそれらの実施形態では、改変された触媒残基は、E59である。上記の態様のうちのいずれか、またはそれらの実施形態では、触媒残基に対する改変は、E59Gである。上記の態様のうちのいずれか、またはそれらの実施形態では、改変された触媒残基は、H57である。上記の態様のうちのいずれか、またはそれらの実施形態では、触媒残基に対する改変は、H57Rである。上記の態様のうちのいずれか、またはそれらの実施形態では、改変された触媒残基は、C87である。上記の態様のうちのいずれか、またはそれらの実施形態では、触媒残基に対する改変は、C87Rである。上記の態様のうちのいずれか、またはそれらの実施形態では、改変された触媒残基は、C90である。上記の態様のうちのいずれか、またはそれらの実施形態では、触媒残基に対する改変は、C90Rである。
【0047】
上記の態様のうちのいずれか、またはそれらの実施形態では、塩基エディターシステムは、以下から選択されるポリヌクレオチド配列を含有する:
a)gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号191)、
b)gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号192)、
c)gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号193)、
d)GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号194)、
e)gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号195)、
f)gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号196)、
g)gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号197)、
h)GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号198)、
i)GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号190)、
j)gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号200)、
k)gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号201)、
l)GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号202)、
m)gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号203)、
n)gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号204)、
o)gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号205)、
p)GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号206)、
q)gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号207)、
r)gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号208)、
s)gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号209)、
t)gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号210)、
u)gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号211)、
v)gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号212)、
w)gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号213)、
x)gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号214)、
y)GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号215)、
z)gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号216)、
aa)gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号217)、
bb)gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号218)、
cc)GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号219)、
dd)gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号220)、
ee)gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号221)、
ff)gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号222)、
gg)gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号223)、
hh)gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号224)、
ii)gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号225)、
jj)gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号524)、
kk)gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号525)、
ll)GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号526)、
mm)gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号527)、
nn)gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号528)、
oo)gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号529)、
pp)gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号530)、
qq)gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号531)、
rr)gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号532)、
ss)gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号533)、
tt)gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号534)、
uu)gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号535)、
vv)gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号536)、
ww)gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号537)、
xx)gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号538)、
yy)gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号539)、
zz)gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号540)、
aaa)gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号541)、
bbb)gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号542)、
ccc)gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号543)、
ddd)gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号544)、
eee)gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号545)、
fff)gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号546)、または
ggg)gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号547)。
【0048】
上記の態様のうちのいずれか、またはそれらの実施形態では、発現ベクターは、哺乳類発現ベクターである。上記の態様のうちのいずれか、またはそれらの実施形態では、ベクターは、脂質ナノ粒子である。上記の態様のうちのいずれか、またはそれらの実施形態では、ベクターは、アデノ随伴ウイルス(AAV)、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、センダイウイルスベクター、及びヘルペスウイルスベクターのうちの1つ以上から選択されるウイルスベクターである。上記の態様のうちのいずれか、またはそれらの実施形態では、ベクターは、AAVベクターである。上記の態様のうちのいずれか、またはそれらの実施形態では、AAVベクターは、AAV2またはAAV8である。上記の態様のうちのいずれか、またはそれらの実施形態では、ベクターは、プロモーターを含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、プロモーターは、CMVプロモーターである。
【0049】
上記の態様のうちのいずれか、またはそれらの実施形態では、細胞は、インビトロまたはインビボである。
【0050】
上記の態様のうちのいずれか、またはそれらの実施形態では、組成物または医薬組成物は、薬学的に許容される賦形剤、希釈剤、または担体をさらに含有する。
【0051】
上記の態様のうちのいずれか、またはそれらの実施形態では、キットは、上記の態様のいずれか、またはその実施形態に記載の方法で使用するための説明書を含有する。
【0052】
上記の態様のうちのいずれか、またはそれらの実施形態では、本方法は、インビボで実施される。
【0053】
上記の態様のうちのいずれか、またはそれらの実施形態では、第1のポリヌクレオチド及び/または第2のポリヌクレオチドは、ベクターによって細胞内で発現される。上記の態様のうちのいずれか、またはそれらの実施形態では、第1のポリヌクレオチド及び第2のポリヌクレオチドは、別個のベクターによって細胞内で発現される。上記の態様のうちのいずれか、またはそれらの実施形態では、第1のガイドRNA及び/または第2のガイドRNAは、ベクターによって細胞に送達される。上記の態様のうちのいずれか、またはそれらの実施形態では、第1のガイドRNA及び/または第2のガイドRNAは、第1のポリヌクレオチド及び/または第2のポリヌクレオチドと同じベクターで細胞に送達される。上記の態様のうちのいずれか、またはそれらの実施形態では、第1のガイドRNA及び/または第2のガイドRNAは、第1のポリヌクレオチド及び/または第2のポリヌクレオチドとは異なるベクターで細胞に送達される。上記の態様のうちのいずれか、またはそれらの実施形態では、ベクターは、ウイルスベクターである。
【0054】
上記の態様のうちのいずれか、またはそれらの実施形態では、塩基エディターは、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン及びデアミナーゼドメインを含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンを含有するオープンリーディングフレームは、napDNAbpドメインまたはデアミナーゼドメインにある。
【0055】
上記の態様のうちのいずれか、またはそれらの実施形態では、自己不活性化塩基エディターポリペプチドは、ゲノムDNAにおいて高い編集効率を維持する。上記の態様のうちのいずれか、またはそれらの実施形態では、デアミナーゼドメインは、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである。上記の態様のうちのいずれか、またはそれらの実施形態では、改変は、イントロンの5’末端のコンセンサススプライスドナー部位、またはイントロンの3’末端のコンセンサススプライスアクセプター配列にある。
【0056】
上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、以下のうちの1つに対して少なくとも約85%、90%、95%、または99%の核酸配列同一性を有する配列を含有する:
a)GTGAGATCAAATGAAAGTTTCATATAGAAATACAAAACCTAGAGAACTGGCATGTAAGAGAAGCAAAAATTACTTCAGCAAGGCCATGTTAGTAAATTTGCATCTGTTTGTCCACATTAG(配列番号226)、
b)GTAGGTGACAATGCTGCAGCTGCCTAATCTAGGTGGGGGGAACTAAATTGTGGGTGAGCTGCTGAATGGTCTGTAGTCTGAGGCTGGGGTGGGGGGAGACACAACGTCCCCTCCCTGCAAACCACTGCTATTCTGTCCCTCTCTCTCCTTAG(配列番号227)、
c)GTAAGTGGCTTTCAAGACCATTGTTAAAAAGCTCTGGGAATGGCGATTTCATGCTTACATAAATTGGCATGCTTGTGTTTCAG(配列番号228)、
d)GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCTAGACAGAGAAGACTCTTGCGTTTCTGATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG(配列番号229)、
e)GTAAGCACAACTGGGATGGGGTGACAGGGGTGCAAGATTGAAAACTGGCTCCTCTCCTCATAGCAGTTCTTGTGATTTCAG(配列番号230)、
f)GTAAGAAATGTTATTTTTCAGTAAGTGATTTAGTTATTTTTCCTTTTTTCTCATTAAAATTTCTCTAACATCTCCCTCTTCATGTTTTAG(配列番号231)、
g)GTGAGACCCTAGCCCCCTCAACCCTGCCCTGGCCTCTCCCCAAACCTGCCCCCCCACGCTGACCCCCACACCCGGCCGCCCGCAG(配列番号232)、
h)GTGGGTGTCAGAGGCATCGGGGCTGCGGGGTAGGGGGCTGCCCCACCCCTAACGAAGTCTGCTCCTCCAG(配列番号233)、
i)GCAGGGAAGTCCTGCTTCCGTGCCCCACCGGTGCTCAGCTGAGGCTCCCTTGAAAATGCGAGGCTGTTTCCAACTTTGGTCTGTTTCCCTGGCAG(配列番号234)、
j)GTGGGGAGTTGGGGTCCCCGAAGGTGAGGACCCTCTGGGGATGAGGGTGCTTCTCTGAGACACTTTCTTTTCCTCACACCTGTTCCTCGCCAGCAG(配列番号235)、
k)GTATAGACCCCTTGATCTCCTAACCCTAACCCTAACCCTAACCCTAACCTACAAAATCTTAGAGCATCAGTGGGAGCATCTCACTGTCCAGGCTCAATATTTCTTCATTTTCTTGCAG(配列番号236)、
l)GTAATTATGATTAAAGATGGTGATTGTTTATTTTCTTTTATGATTGTCCTTAGTATTATGTAACCTGCAAATTCTATTGCAG(配列番号237)、
m)GTGAGTGACACAAGGTGTTGTCTGGGGAGTGGGGAAGGGGGATGGAAGTGAATCCTGTTGGTGGGGTGGAGAAAGGGCGATCTCAAGAGGGCCACTCTCTCCAG(配列番号238)、
n)GTAAGCATCTCCACCATCCTTCTGTTTACTCTGATGGGGTCTGCAAAGGGGAGATGATGTATAGGGTTGGGTATCTCTGTAAATGTCAGATGTGAAGTTGATCTTATGACCTTCTGTTCTGCAG(配列番号239)、
o)GTGAGGGTCTCCCAGGCTGGGCAGGGGGAGGGGGCTGCTGCCTTGATTGCGTCCCAGGACACAGCCCTCCTCCAGCCTGCCCTCGCCTTGCTCATCCCCTCCCCATCTCAGCCCCACCCCCACTAACTCTCTCTCTGCTCTGACTCAG(配列番号240)、
p)GTAATGATTGATTGCAATGTATGATTACAATAATCTCAGTATAAGTTCAGTAATAATAACCTTCCACTGCTGTCCTCTGTGTGCACCCAG(配列番号241)、または
q)GTAAATATATACAACAGTTTTTCATTTAAATAAGTGCACGGCACAAATAAGAAAAATATGTCAAAAATGTAACCAATAGTTTTTTTCAAATTTAG(配列番号242)。
上記の態様のうちのいずれか、またはそれらの実施形態では、第2のガイドRNAは、以下から選択されるポリヌクレオチド配列を含有する:
a)gGUUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号191)、
b)gUUUCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号192)、
c)gGUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号193)、
d)GCCACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号194)、
e)gACAUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号195)、
f)gGAUCUCACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号196)、
g)gUCCUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号197)、
h)GUCACCUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号198)、
i)GAUUUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号190)、
j)gGUGCUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号200)、
k)gUCCACAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号201)、
l)GAUACUUACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号202)、
m)gUGUUUUAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号203)、
n)gUUUCUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号204)、
o)gCUCCACAGCUGCGGCAAGGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号205)、
p)GAUACUUACAGCCAUAAUUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号206)、
q)gUGUUUUAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号207)、
r)gUUACCUGGCUCUCUUAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号208)、
s)gCUCCACAGGGACGAAAGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号209)、
t)gCUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号210)、
u)gAUUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号211)、
v)gUCUCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号212)、
w)gUCUGCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号213)、
x)gGACUCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号214)、
y)GCACCCAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号215)、
z)gAAUUUAGGUCAUGUGUGCUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号216)、
aa)gCAUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号217)、
bb)gCCUUAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号218)、
cc)GUUUCAGGUCGAGAUCACAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号219)、
dd)gACAUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号220)、
ee)gUCCUUAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号221)、
ff)gGUUUCAGGCUAAGAGAGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号222)、
gg)gACAUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号223)、
hh)gUCCUUAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号224)、
ii)gGUUUCAGAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号225)、
jj)gCACCAUGAGCGAGGUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号524)、
kk)gGCCACCAUGAGCGAGGUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号525)、
ll)GUGUCGAAGUUCGCCCUGGAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号526)、
mm)gAUGCCGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号527)、
nn)gAUGCCGAGAUAAUGGCCCUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号528)、
oo)gAUGCCGAGAUCAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号529)、
pp)gAUGCCGAGAUCAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号530)、
qq)gAUGCCGAGAUCAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号531)、
rr)gAUGCCGAGAUCAUGGCGCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号532)、
ss)gAUGCCGAGAUCAUGGCGCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号533)、
tt)gAUGCCGAGAUCAUGGCGUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号534)、
uu)gAUGCCGAGAUUAUGGCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号535)、
vv)gAUGCCGAGAUUAUGGCACUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号536)、
ww)gAUGCCGAGAUUAUGGCACUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号537)、
xx)gAUGCCGAGAUUAUGGCACUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号538)、
yy)gAUGCCGAGAUUAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号539)、
zz)gAUGCCGAGAUUAUGGCUCUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号540)、
aaa)gAUGCGGAGAUCAUGGCGCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号541)、
bbb)gAUGCUGAGAUAAUGGCCCUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号542)、
ccc)gAACCGCACAUGCCGAAAUUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号543)、
ddd)gGCAGGUGUCGACAUAUCUAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号544)、
eee)gAUGCCGAAAUUAUGGCUCUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号545)、
fff)gACACAUGACACAGGGCUCGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号546)、または
ggg)gGCCCCAGCACACAUGACACAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(配列番号547)。
【0057】
上記の態様のうちのいずれか、またはそれらの実施形態では、ポリヌクレオチドは、リンカーポリヌクレオチド配列をさらに含有する。上記の態様のうちのいずれか、またはそれらの実施形態では、イントロンは、リンカーポリヌクレオチド配列内に挿入される。
【0058】
上記の態様のうちのいずれか、またはそれらの実施形態では、対象または生物は、ヒトである。上記の態様のうちのいずれか、またはそれらの実施形態では、対象または生物は、哺乳類である。上記の態様のうちのいずれか、またはそれらの実施形態では、哺乳類は、ヒトである。
【0059】
定義
別段定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されている意味を有する。以下の参考文献は、本発明において使用する多くの用語の一般的な定義を当業者に提供する:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994)、The Cambridge Dictionary of Science and Technology(Walker ed.,1988)、The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991)、及びHale & Marham,The Harper Collins Dictionary of Biology(1991)。本明細書で使用される場合、以下の用語は、別途指定されない限り、以下の意味を有する。
【0060】
「アデニン」または「9H-プリン-6-アミン」とは、分子式C5H5N5を有し、構造
【化1】

を有し、CAS番号73-24-5に対応するプリン核酸塩基を意味する。
【0061】
「アデノシン」または「4-アミノ-1-[(2R,3R,4S,5R)-3,4-ジヒドロキシ-5-(ヒドロキシメチル)オキソラン-2-イル]ピリミジン-2(1H)-オン」とは、グリコシド結合を介してリボース糖に結合しており、構造
【化2】

を有し、CAS番号65-46-3に対応するアデニン分子を意味する。その分子式は、C10H13N5O4である。
【0062】
「アデノシンデアミナーゼ」または「アデニンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的な脱アミノ化を触媒することができるポリペプチドまたはその機能的断片を意味する。「アデニンデアミナーゼ」及び「アデノシンデアミナーゼ」という用語は、本出願全体にわたって互換的に使用される。一部の実施形態では、デアミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンへの、またはデオキシアデノシンからデオキシイノシンへの加水分解的な脱アミノ化を触媒するアデノシンデアミナーゼである。一部の実施形態では、アデノシンデアミナーゼは、デオキシリボ核酸(DNA)中のアデニンまたはアデノシンの加水分解的な脱アミノ化を触媒する。本明細書で提供されるアデノシンデアミナーゼ(例えば、改変されたアデノシンデアミナーゼ、進化したアデノシンデアミナーゼ)は、任意の生物(例えば、真核生物、原核生物)に由来し得、これには、藻類、細菌、菌類、植物、無脊椎動物(例えば、昆虫)、脊椎動物(例えば、両生類、哺乳類)が含まれるが、これらに限定されない。一部の実施形態では、アデノシンデアミナーゼは、1つ以上の改変を有するアデノシンデアミナーゼバリアントであり、標的ポリヌクレオチド(例えば、DNA、RNA)中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、標的ポリヌクレオチドは、一本鎖または二本鎖である。一部の実施形態では、アデノシンデアミナーゼバリアントは、DNA中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、アデノシンデアミナーゼバリアントは、一本鎖DNA中のアデニン及びシトシンの両方を脱アミノ化することができる。一部の実施形態では、アデノシンデアミナーゼバリアントは、RNA中のアデニン及びシトシンの両方を脱アミノ化することができる。
【0063】
「アデノシンデアミナーゼ活性」とは、ポリヌクレオチドにおけるアデニンまたはアデノシンのグアニンへの脱アミノ化を触媒することを意味する。一部の実施形態では、本明細書で提供するアデノシンデアミナーゼバリアントは、アデノシンデアミナーゼ活性を維持している(例えば、参照アデノシンデアミナーゼ(例えば、TadA*8.20またはTadA*8.19)の活性の少なくとも約30%、40%、50%、60%、70%、80%、90%、またはそれ以上)。
【0064】
「アデノシン塩基エディター(ABE)」とは、アデノシンデアミナーゼを含む塩基エディターを意味する。
【0065】
「アデノシン塩基エディター(ABE)ポリヌクレオチド」とは、ABEをコードするポリヌクレオチドを意味する。「アデノシン塩基エディター8(ABE8)ポリペプチド」または「ABE8」とは、アデノシンデアミナーゼまたはアデノシンデアミナーゼバリアントを含む、本明細書で定義される塩基エディターを意味し、アデノシンデアミナーゼまたはアデノシンデアミナーゼバリアントは、表14に列挙される改変のうちの1つ以上、表14に列挙される改変の組み合わせのうちの1つまたは表14に列挙されるアミノ酸位置のうちの1つ以上での改変を含み、このような改変は、以下の参照配列に対するものである:MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)、または別のアデノシンデアミナーゼにおける対応する位置に関連する。実施形態では、ABE8は、配列番号1のアミノ酸82及び/または166における改変を含む。
【0066】
一部の実施形態では、ABE8は、参照配列に対して、本明細書に記載するように、さらなる改変を含む。
【0067】
「アデノシン塩基エディター8(ABE8)ポリヌクレオチド」とは、ABE8ポリペプチドをコードするポリヌクレオチドを意味する。
【0068】
「投与すること」は、本明細書に記載の1つ以上の組成物を患者または対象に提供することとして、本明細書中では言及される。
【0069】
「薬剤」とは、任意の小分子化学化合物、抗体、核酸分子、もしくはポリペプチド、またはその断片を意味する。
【0070】
「改変」とは、当該技術分野で公知の標準的な方法、例えば、本明細書に記載の方法によって検出される、分析物、遺伝子またはポリペプチドのレベル、構造または活性における変化(増加または減少)を意味する。本明細書で使用される場合、改変には、発現レベルにおける10%の変化、発現レベルにおける25%の変化、40%の変化及び50%以上の変化が含まれる。一部の実施形態では、改変は、核酸塩基またはアミノ酸の挿入、欠失または置換を含む。
【0071】
「寛解する」は、疾患の発症または進行を、低下、抑制、減弱化、減少、抑止、または安定化することを意味する。
【0072】
「類似体」とは、同一ではないが類似した機能的または構造的特徴を有する分子を意味する。例えば、ポリペプチド類似体は、対応する天然のポリペプチドの生物活性を保持する一方で、類似体の機能を天然のポリペプチドに対して高める特定の生化学的修飾を有する。そのような生化学的修飾は、類似体のプロテアーゼ耐性、膜透過性または半減期を、例えば、リガンド結合を改変させることなく増加させ得る。類似体は、非天然のアミノ酸を含んでいてもよい。
【0073】
「塩基エディター(BE)」または「核酸塩基エディターポリペプチド(NBE)」とは、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態では、塩基エディターは、核酸塩基修飾ポリペプチド(例えば、デアミナーゼ)及びガイドポリヌクレオチド(例えば、ガイドRNA(gRNA))と組み合わせたポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9またはCpf1)を含む。塩基エディターの代表的な核酸及びタンパク質配列は、配列表で配列番号2~11として提供される。
【0074】
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変させるように作用することを意味する。一実施形態では、第1の塩基を、第2の塩基に変換する。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性、例えば、標的C・GからT・Aへの変換である。別の実施形態では、塩基編集活性は、アデノシンまたはアデニンデアミナーゼ活性、例えば、A・TからG・Cへの変換である。
【0075】
「塩基エディターシステム」という用語は、標的ヌクレオチド配列の核酸塩基を編集するための分子間複合体を指す。様々な実施形態では、塩基エディター(BE)システムは、(1)標的ヌクレオチド配列中の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン、デアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)、ならびに(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと組み合わせた1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。様々な実施形態では、塩基エディター(BE)システムは、アデノシンデアミナーゼまたはシチジンデアミナーゼから選択される核酸塩基エディタードメイン、及び核酸配列特異的結合活性を有するドメインを含む。一部の実施形態では、塩基エディターシステムは、(1)標的ヌクレオチド配列中の1つ以上の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルDNA結合ドメイン及びデアミナーゼドメインを含む塩基エディター(BE)、ならびに(2)ポリヌクレオチドプログラマブルDNA結合ドメインと組み合わせた1つ以上のガイドRNAを含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデニンまたはアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデニンもしくはアデノシン塩基エディター(ABE)、またはシチジンもしくはシトシン塩基エディター(CBE)である。
【0076】
「Cas9」または「Cas9ドメイン」という用語は、Cas9タンパク質またはその断片(例えば、Cas9の活性、不活性、もしくは部分的に活性なDNA切断ドメイン、及び/またはCas9のgRNA結合ドメインを含む、タンパク質)を含む、RNAガイドヌクレアーゼを指す。Cas9ヌクレアーゼは、casnlヌクレアーゼまたはCRISPR(クラスター化して規則的な配置の短い回文配列リピート)関連ヌクレアーゼと呼ばれることもある。
【0077】
「保存的アミノ酸置換」または「保存的変異」という用語は、あるアミノ酸が、共通の特性を有する別のアミノ酸に置換されることを指す。個々のアミノ酸間の共通の特性を定義する機能的な方法は、相同生物の対応するタンパク質間のアミノ酸変化の正規化された頻度を分析することである(Schulz,G.E.and Schirmer,R.H.,Principles of Protein Structure,Springer-Verlag,New York(1979))。そのような分析によれば、アミノ酸のグループは、グループ内のアミノ酸が互いに優先的に交換される場合に定義することができ、したがって、全体的なタンパク質構造への影響が互いに最も類似している(Schulz,G.E.and Schirmer,R.H.、上記)。保存的変異の非限定的な例として、アミノ酸置換、例えば、正電荷を維持することができるような、アルギニンからリジンへのアミノ酸置換、及びその逆、負電荷を維持することができるように、アスパラギン酸からグルタミン酸へ、及びその逆、遊離-OHを維持することができるように、スレオニンからセリンへ、ならびに遊離-NH2を維持することができるような、アスパラギンからグルタミンへの置換が挙げられる。
【0078】
本明細書で互換的に使用される「コード配列」または「タンパク質コード配列」という用語は、タンパク質をコードするポリヌクレオチドのセグメントを指す。コード配列は、オープンリーディングフレームとも呼ばれ得る。領域または配列は、開始コドンによって5’末端の近位に、そして終止コドンによって3’末端の近位に境界付けられている。本明細書に記載の塩基エディターで有用な終止コドンとして、以下が挙げられる:
【0079】
【0080】
「複合体」とは、相互作用が分子間力に依存する2つ以上の分子の組み合わせを意味する。分子間力の非限定的な例としては、共有結合性相互作用及び非共有結合性相互作用が挙げられる。非共有結合性相互作用の非限定的な例としては、水素結合、イオン結合、ハロゲン結合、疎水性結合、ファンデルワールス相互作用(例えば、双極子間相互作用、双極子誘起双極子相互作用、及びロンドン分散力)、ならびにπ効果が挙げられる。一実施形態では、複合体は、ポリペプチド、ポリヌクレオチド、または1つ以上のポリペプチドと1つ以上のポリヌクレオチドの組み合わせを含む。一実施形態では、複合体は、会合して塩基エディター(例えば、Cas9などの核酸プログラマブルDNA結合タンパク質、及びデアミナーゼを含む塩基エディター)及びポリヌクレオチド(例えば、ガイドRNA)を形成する1つ以上のポリペプチドを含む。一実施形態では、複合体は、水素結合によって一緒に保持される。塩基エディターの1つ以上の成分(例えば、デアミナーゼ、または核酸プログラマブルDNA結合タンパク質)は、共有結合または非共有結合で会合し得ることを理解されたい。一例として、塩基エディターは、(例えば、ペプチド結合により)核酸プログラマブルDNA結合タンパク質に共有結合したデアミナーゼを含み得る。代替として、塩基エディターは、非共有結合的に会合するデアミナーゼ及び核酸プログラマブルDNA結合タンパク質を含み得る(例えば、塩基エディターの1つ以上の成分がトランスで供給され、直接またはタンパク質もしくは核酸などの別の分子を介して会合する場合)。一実施形態では、複合体の1つ以上の成分は、水素結合によって一緒に保持される。本開示全体にわたって、塩基エディターの実施形態が、融合タンパク質を含有することが企図される場合はいつでも、塩基エディターの1つ以上のドメインまたはそれらの断片を含む複合体もまた、企図される。
【0081】
「シトシン」または「4-アミノピリミジン-2(1H)-オン」とは、分子式C4H5N3Oを有し、構造
【化3】

を有し、CAS番号71-30-7に対応するプリン核酸塩基を意味する。
【0082】
「シチジン」とは、グリコシド結合を介してリボース糖に結合しており、構造
【化4】

を有し、CAS番号65-46-3に対応するシトシン分子を意味する。その分子式は、C9H13N3O5である。
【0083】
「シチジン塩基エディター(CBE)」とは、シチジンデアミナーゼを含む塩基エディターを意味する。
【0084】
「シチジン塩基エディター(CBE)ポリヌクレオチド」とは、CBEを含むポリヌクレオチドを意味する。
【0085】
「シチジンデアミナーゼ」または「シトシンデアミナーゼ」とは、シチジンまたはシトシンを脱アミノ化することができるポリペプチドまたはその断片を意味する。一実施形態では、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに変換する。「シチジンデアミナーゼ」及び「シトシンデアミナーゼ」という用語は、本出願全体を通じて同じ意味で使用される。Petromyzon marinusシトシンデアミナーゼ1(PmCDA1)(配列番号12~13)、活性化誘導性シチジンデアミナーゼ(AICDA)(配列番号14~16及び18~21)及びAPOBEC(配列番号22~62)は、例示的なシチジンデアミナーゼである。さらに例示的なシチジンデアミナーゼ(CDA)配列を、配列番号63~67及び配列番号68~190として配列表に示す。
【0086】
「シトシンデアミナーゼ活性」とは、シトシンまたはシチジンの脱アミノ化を触媒することを意味する。一実施形態では、シトシンデアミナーゼ活性を有するポリペプチドは、アミノ基をカルボニル基に変換する。一実施形態では、シトシンデアミナーゼは、シトシンをウラシルに(すなわち、CからUに)変換するか、または5-メチルシトシンをチミンに(すなわち、5mCからTに)変換する。一部の実施形態では、本明細書で提供するシトシンデアミナーゼバリアントは、参照シトシンデアミナーゼに対して、高いシトシンデアミナーゼ活性(例えば、少なくとも10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、またはそれ以上)を有する。本明細書で使用される場合、「デアミナーゼ」または「デアミナーゼドメイン」という用語は、脱アミノ化反応を触媒するタンパク質またはその断片を指す。
【0087】
「検出」とは、検出される分析物の存在、非存在、または量を同定することを指す。一実施形態では、ポリヌクレオチドまたはポリペプチドにおける配列改変が検出される。別の実施形態では、インデルの存在が検出される。
【0088】
「検出可能な標識」とは、目的の分子に連結した場合に、分光学的、光化学的、生化学的、免疫化学的、または化学的手段を介して、目的の分子を検出可能にする組成物を意味する。例えば、有用な標識として、放射性同位元素、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光色素、高電子密度試薬、酵素(例えば、酵素結合免疫吸着測定法(ELISA)で一般的に使用される酵素)、ビオチン、ジゴキシゲニンまたはハプテンが挙げられる。
【0089】
「疾患」とは、細胞、組織、または器官の正常な機能を損傷または妨害するあらゆる病態または障害を意味する。
【0090】
「有効量」とは、未治療の患者もしくは疾患を有さない個体、すなわち、健常な個体に対して疾患の症状を寛解させるために必要とされる、薬剤もしくは活性化合物、例えば、本明細書に記載される塩基エディターの量を意味するか、または所望の生物学的応答を誘発するのに十分である、薬剤もしくは活性化合物の量である。疾患の治療的処置のために本発明を実施するために使用される活性化合物(複数可)の有効量は、投与様式、対象の年齢、体重、及び一般的健康によって異なる。最終的には、担当医師または獣医が適切な量及び投薬レジメンを決定するだろう。そのような量は、「有効」量と呼ばれる。一実施形態では、有効量は、細胞(例えば、インビトロまたはインビボの細胞)内の目的の遺伝子における改変を導入するのに十分である、本発明の塩基エディターの量である。一実施形態では、有効量は、治療効果を達成するために必要とされる、塩基エディターの量である。そのような治療効果は、対象、組織または臓器の全ての細胞内の病原性遺伝子を改変するのに十分である必要はなく、対象、組織または臓器に存在する約1%、5%、10%、25%、50%、75%またはそれ以上の細胞内の病原性遺伝子を改変するのに十分であればよい。一実施形態では、有効量は、疾患の1つ以上の症状を寛解させるのに十分である。
【0091】
「エキソヌクレアーゼ」という用語は、核酸(例えば、RNAまたはDNA)を遊離末端から消化することができるタンパク質またはポリペプチドを指す。
【0092】
「エンドヌクレアーゼ」という用語は、核酸(例えば、DNAまたはRNA)における内部領域を触媒(例えば、切断)することができるタンパク質またはポリペプチドを指す。
【0093】
「断片」とは、ポリペプチドまたは核酸分子の一部分を意味する。この部分は、参照核酸分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、または90%を含有する。断片は、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000ヌクレオチドまたはアミノ酸を含有し得る。
【0094】
「ガイドポリヌクレオチド」とは、標的配列に特異的であり、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインタンパク質(例えば、Cas9またはCpf1)と複合体を形成することができるポリヌクレオチドまたはポリヌクレオチド複合体を意味する。一実施形態では、ガイドポリヌクレオチドは、ガイドRNA(gRNA)である。gRNAは、2つ以上のRNAの複合体として、または単一RNA分子として存在し得る。
【0095】
一部の実施形態では、ガイドポリヌクレオチドは、以下から選択されるヌクレオチド配列を有し、ヌクレオチド配列において、小文字の「g」は、標的配列に対して5’不一致を示す:
【0096】

【0097】
「異種(heterologous)」または「外来性(exogenous)」とは、1)通常天然に見出されないポリヌクレオチドまたはポリペプチド配列に実験的に組み込まれた、または2)通常はそのポリヌクレオチドまたはポリペプチドを含まない細胞に実験的に配置されたポリヌクレオチドまたはポリペプチドを意味する。一部の実施形態では、「異種」は、ポリヌクレオチドまたはポリペプチドが実験的に非天然の状況に置かれたことを意味する。一部の実施形態では、異種ポリヌクレオチドまたはポリペプチドは、第1の種または宿主生物に由来し、第2の種または宿主生物に由来するポリヌクレオチドまたはポリペプチドに組み込まれる。一部の実施形態では、第1の種または宿主生物は、第2の種または宿主生物とは異なる。一部の実施形態では、異種ポリヌクレオチドはDNAである。一部の実施形態では、異種ポリヌクレオチドはRNAである。
【0098】
一部の実施形態では、異種ポリヌクレオチドは、異種イントロンである。一部の実施形態では、異種イントロンは、合成イントロンである。一部の実施形態では、異種イントロンは、哺乳類遺伝子に由来する(例えば、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6CまたはHMCN2)。一部の実施形態では、異種イントロンは、非哺乳類遺伝子に由来する(例えば、HMCN2-Salmon、ENPEP-Gecko)。一部の実施形態では、本明細書で提供される塩基エディターをコードするポリヌクレオチドは、異種イントロンを含む。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。
【0099】
一部の実施形態では、異種イントロンは、ポリヌクレオチドプログラマブルDNA結合タンパク質またはその断片をコードするポリヌクレオチド内に組み込まれている。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合タンパク質は、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus pyogenes Cas9(SpCas9)、またはそれらのバリアントである。
【0100】
一部の実施形態では、異種イントロンは、デアミナーゼまたはその断片をコードするポリヌクレオチド内に組み込まれている。一部の実施形態では、異種イントロンは、アデノシンデアミナーゼをコードするポリヌクレオチド内に組み込まれている。一部の実施形態では、アデノシンデアミナーゼは、TadAである。一部の実施形態では、異種イントロンは、シチジンデアミナーゼをコードするポリヌクレオチド内に組み込まれている。
【0101】
「ハイブリダイゼーション」とは水素結合を意味し、それは、相補的な核酸塩基間のワトソン・クリック型、フーグスティーン型、または逆フーグスティーン型の水素結合であってもよい。例えば、アデニンとチミンは、水素結合の形成を通じて対になる相補的な核酸塩基である。
【0102】
「増加」とは、少なくとも10%、25%、50%、75%、または100%の正の変化を意味する。
【0103】
「塩基修復の阻害剤」、「塩基修復阻害剤」、「IBR」という用語またはそれらの文法的均等物は、核酸修復酵素、例えば、塩基除去修復酵素の活性を阻害することが可能であるタンパク質を指す。
【0104】
「インテイン」とは、タンパク質スプライシングとして既知のプロセスにおいて、それ自身を切除し、残りの断片(エクステイン)をペプチド結合で結合することができるタンパク質の断片である。
【0105】
「イントロン」とは、転写物の翻訳前にスプライシングによって除去される非コードヌクレオチド配列を意味する。一部の実施形態では、イントロンは、mRNAの成熟の前駆体メッセンジャーRNA段階中に、RNAスプライシングによって除去される。一部の実施形態では、イントロンは、生物の遺伝子に由来する。一部の実施形態では、イントロンは、合成である。一部の実施形態では、イントロンは、スプライスアクセプター及びスプライスドナー部位を含む。一部の実施形態では、イントロンは、約10、25、50、75、100、125、150、175、200、250、300、350、400、450または500ヌクレオチド長である。一部の実施形態では、イントロンは、約50、100、125、150、175または200ヌクレオチド長さである。一部の実施形態では、イントロンは、約150ヌクレオチド長である。
【0106】
一部の実施形態では、イントロンは、哺乳類遺伝子に由来する(例えば、NF1、PAX2、EEF1A1、HBB、IGHG1、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32、ANTXRL、PKHD1L1、PADI1、KRT6CまたはHMCN2)。一部の実施形態では、イントロンは、非哺乳類遺伝子に由来する(例えば、HMCN2-Salmon、ENPEP-Gecko)。一部の実施形態では、イントロンは、以下から選択されるポリヌクレオチド配列を有する:
【0107】
一部の実施形態では、本明細書で提供される塩基エディターをコードするポリヌクレオチドは、異種イントロンを含む。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、イントロンは、ポリヌクレオチド配列内に異種的に組み込まれている。一部の実施形態では、ポリヌクレオチド配列は、DNAである。一部の実施形態では、ポリヌクレオチド配列は、RNAである。一部の実施形態では、イントロンは、ポリヌクレオチドプログラマブルDNA結合タンパク質をコードするポリヌクレオチド内に異種的に組み込まれている。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合タンパク質は、Cas9、Cas12a/Cpf1、Cas12b/C2c1、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、及びCas12j/CasΦドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、Streptococcus pyogenes Cas9(SpCas9)、またはそれらのバリアントである。
【0108】
一部の実施形態では、イントロンは、デアミナーゼをコードするポリヌクレオチド内に異種的に組み込まれている。一部の実施形態では、イントロンは、アデノシンデアミナーゼをコードするポリヌクレオチド内に異種的に組み込まれている。一部の実施形態では、アデノシンデアミナーゼは、TadAである。一部の実施形態では、イントロンは、シチジンデアミナーゼをコードするポリヌクレオチド内に異種的に組み込まれている。一部の実施形態では、イントロンは、ポリヌクレオチドプログラマブルDNA結合タンパク質(例えば、Cas9)内に異種的に組み込まれている。一部の実施形態では、イントロンは、リンカー領域内に異種的に組み込まれている。
【0109】
「単離された」、「精製された」、または「生物学的に純粋な」という用語は、天然状態で見出されるような通常それに付随する成分を、異なる程度で含まない材料を指す。「単離する」とは、元の供給源または周囲からの分離の程度を示す。「精製する」とは、単離よりも高い分離度を示す。「精製された」または「生物学的に純粋な」タンパク質は、他の物質を十分に含まないため、いかなる不純物もタンパク質の生物学的特性に実質的に影響を与えたり、他の有害事象を引き起こしたりしない。すなわち、本発明の核酸またはペプチドは、組換えDNA技術によって生成された場合は、細胞性物質、ウイルス性物質、もしくは培養培地を実質的に含んでいなければ精製され、または化学的に合成された場合は、化学前駆体もしくは他の化学物質を実質的に含んでいなければ精製される。純度及び均質性は、通常、分析化学技法、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィーを使用して決定される。「精製された」という用語は、核酸またはタンパク質が、電気泳動ゲルにおいて本質的に1つのバンドを生じさせることを示し得る。例えば、リン酸化またはグリコシル化などの修飾に供され得るタンパク質の場合、異なる修飾は、別々に精製することができる異なる単離されたタンパク質を生じさせ得る。
【0110】
「単離されたポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおいて、遺伝子に隣接する遺伝子を含まない核酸分子を意味する。実施形態では、核酸分子は、DNAを含有するかまたはDNA分子である。したがって、この用語には、例えば、ベクターに組み込まれる組換えDNA、自律的に複製するプラスミドまたはウイルスに組み込まれる組換えDNA、または原核生物もしくは真核生物のゲノムDNAに組み込まれる組換えDNA、または、他の配列とは独立した別個の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されるcDNAまたはゲノム断片もしくはcDNA断片)として存在する組換えDNAが含まれる。さらに、この用語には、DNA分子から転写されるRNA分子、ならびに追加のポリペプチド配列をコードするハイブリッド遺伝子の一部である組換えDNAが含まれる。
【0111】
「単離されたポリペプチド」とは、それに天然に付随する成分から分離された、本発明のポリペプチドを意味する。一般的には、ポリペプチドは、それが少なくとも60重量%であり、タンパク質及びそれが天然に関連する天然の有機分子を含まない場合に、単離されている。好ましくは、調製物は、本発明のポリペプチドが、少なくとも75重量%、より好ましくは、少なくとも90重量%、最も好ましくは、少なくとも99重量%である。本発明の単離されたポリペプチドを、例えば、天然の供給源からの抽出によって、そのようなポリペプチドをコードする組換え核酸の発現によって、またはそのタンパク質を化学的に合成することによって、取得することができる。純度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、またはHPLC分析によって測定することができる。
【0112】
本明細書で使用される場合、「リンカー」という用語は、2つの部分を連結する分子を指す。一実施形態では、用語「リンカー」とは、共有結合リンカー(例えば、共有結合)または非共有結合リンカーを指す。
【0113】
本明細書で使用される場合、「変異」という用語は、配列内の残基、例えば、核酸またはアミノ酸配列の別の残基による置換、または配列内の1つ以上の残基の欠失または挿入を指す。変異は、通常、元の残基を明らかにし、続いて配列内の残基の位置を明らかにし、そして新たに置換された残基を明らかにすることによって、本明細書に記載される。本明細書中で提供されるアミノ酸置換(変異)を行うための様々な方法は、当該技術分野で周知であり、例えば、Green and Sambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))に提供されている。
【0114】
本明細書で使用される場合、「核酸」及び「核酸分子」という用語は、核酸塩基及び酸性部分を含む化合物、例えば、ヌクレオシド、ヌクレオチド、またはヌクレオチドの重合体を指す。通常、高分子核酸、例えば、3つ以上のヌクレオチドを含む核酸分子は、直鎖状分子であり、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている。一部の実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチド及び/またはヌクレオシド)を指す。一部の実施形態では、「核酸」は、3つ以上の個々のヌクレオチド残基を含むオリゴヌクレオチド鎖を指す。本明細書で使用される場合、「オリゴヌクレオチド」及び「ポリヌクレオチド」という用語は、ヌクレオチドの重合体(例えば、少なくとも3つのヌクレオチドのストリング)を指すために同じ意味で用いられ得る。一部の実施形態では、「核酸」は、RNAならびに一本鎖及び/または二本鎖DNAを包含する。核酸は、例えば、ゲノム、転写産物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、クロマチド、または他の天然の核酸分子の状況下で、天然であり得る。一方、核酸分子は、非天然の分子、例えば、組換えDNAもしくはRNA、人工染色体、操作されたゲノムもしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッドであり得るか、または非天然のヌクレオチドもしくはヌクレオシドを含んでもよい。
【0115】
さらに、「核酸」、「DNA」、「RNA」、及び/または同様の用語には、核酸類似体、例えば、ホスホジエステル骨格以外を有する類似体が含まれる。核酸は、天然の供給源から精製することができ、組換え発現系を使用して生成し、任意選択で精製したり化学合成したりすることができる。必要に応じて、例えば、化学的に合成された分子の場合、核酸は、化学的に修飾された塩基または糖を有する類似体などのヌクレオシド類似体、及び骨格修飾を含み得る。核酸配列は、特に明記しない限り、5’から3’方向に提示される。一部の実施形態では、核酸は、天然のヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、及びデオキシシチジン)、ヌクレオチド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、及び2-チオシチジン)、化学的に修飾された塩基、生物学的に修飾された塩基(例えば、メチル化された塩基)、インターカレートされた塩基、修飾された糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、及びヘキソース)、及び/または修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホラミダイト結合)であるか、またはそれらを含む。
【0116】
用語「核局在化配列」、「核局在化シグナル」、または「NLS」とは、細胞核へのタンパク質の輸入を促進するアミノ酸配列を指す。核局在化配列は、当該技術分野で既知であり、例えば、Plankらの2000年11月23日に出願された国際PCT出願PCT/EP2000/011690(WO/2001/038547として2001年5月31日に公開)に記載されている(それらの内容は、例示的な核局在化配列のそれらの開示のために、参照により本明細書に援用される)。他の実施形態では、NLSは、例えば、Koblan et al.,Nature Biotech.2018 doi:10.1038/nbt.4172に記載されている最適化NLSである。一部の実施形態では、NLSは、アミノ酸配列KRTADGSEFESPKKKRKV(配列番号243)、KRPAATKKAGQAKKKK(配列番号244)、KKTELQTTNAENKTKKL(配列番号245)、KRGINDRNFWRGENGRKTR(配列番号246)、RKSGKIAAIVVKRPRK(配列番号247)、PKKKRKV(配列番号248)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号249)を含む。
【0117】
「核酸塩基」、「窒素塩基」、または「塩基」という用語は、本明細書で互換的に使用され、ヌクレオチドの成分であるヌクレオシドを形成する窒素含有生物学的化合物を指す。核酸塩基が塩基対を形成し、互いに積み重なる能力は、リボ核酸(RNA)及びデオキシリボ核酸(DNA)などの長鎖ヘリックス構造に直接つながる。アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)及びウラシル(U)の5つの核酸塩基は、一次または正準と称される。アデニン及びグアニンは、プリンに由来し、シトシン、ウラシル、及びチミンは、ピリミジンに由来する。DNA及びRNAはまた、修飾された他の(非一次)塩基を含むことができる。非限定的な例示的な修飾核酸塩基としては、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン(m5C)、及び5-ヒドロメチルシトシン(hydromethylcytosine)が挙げられる。ヒポキサンチンとキサンチンは、両方とも、変異誘発物質の存在により、脱アミノ化(アミン基をカルボニル基で置換すること)を介して生成され得る。ヒポキサンチンは、アデニンから修飾され得る。キサンチンは、グアニンから修飾され得る。ウラシルは、シトシンの脱アミノから生じ得る。「ヌクレオシド」は、核酸塩基及び五炭糖(リボースまたはデオキシリボースのいずれか)からなる。ヌクレオシドの例として、アデノシン、グアノシン、ウリジン、シチジン、5-メチルウリジン(m5U)、デオキシアデノシン、デオキシグアノシン、チミジン、デオキシウリジン、及びデオキシシチジンが挙げられる。修飾核酸塩基を有するヌクレオシドの例としては、イノシン(I)、キサントシン(X)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、5-メチルシチジン(m5C)、及びシュードウリジン(Ψ)が挙げられる。「ヌクレオチド」は、核酸塩基、五炭糖(リボースまたはデオキシリボースのいずれか)、及び少なくとも1つのリン酸基からなる。修飾された核酸塩基の非限定的な例及び/または修飾された核酸塩基が含み得る化学的修飾の非限定的な例は、以下:プソイドウリジン、5-メチル-シトシン、2’-O-メチル-3’-ホスホノアセテート、2’-O-メチルチオPACE(MSP)、2’-O-メチル-PACE(MP)、2’-フルオロRNA(2’-F-RNA)、拘束エチル(S-cEt)、2’-O-メチル(「M」)、2’-O-メチル-3’-ホスホロチオエート(「MS」)、2’-O-メチル-3’-チオホスホノアセテート(「MSP」)、5-メトキシウリジン、ホスホロチオエート及びN1-メチルプソイドウリジンである。
【0118】
用語「核酸プログラマブルDNA結合タンパク質」または「napDNAbp」は、「ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン」と同じ意味で用いられる場合があり、napDNAbpを特定の核酸配列に誘導するガイド核酸またはガイドポリヌクレオチド(例えば、gRNA)などの核酸(例えば、DNAまたはRNA)と会合するタンパク質を指し得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルRNA結合ドメインである。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、Cas9タンパク質である。Cas9タンパク質は、ガイドRNAに相補的な特定のDNA配列にCas9タンパク質をガイドするガイドRNAと会合することができる。一部の実施形態では、napDNAbpは、Cas9ドメイン、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。核酸プログラマブルDNA結合タンパク質の非限定的な例としては、Cas9(例えば、dCas9及びnCas9)、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i及びCas12j/CasΦ(Cas12j/Casphi)が挙げられる。Cas酵素の非限定的な例としては、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、(Csn1またはCsx12としても知られる)Cas9、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i、Cas12j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II型Casエフェクタータンパク質、V型Casエフェクタータンパク質、VI型Casエフェクタータンパク質、CARF、DinG、それらの相同体、またはそれらの修飾もしくは操作されたバージョンが挙げられる。他の核酸プログラマブルDNA結合タンパク質もまた、本開示の範囲内であるが、それらは本開示に具体的に列挙されていない可能性がある。例えば、Makarova et al.”Classification and Nomenclature of CRISPR-Cas Systems:Where from Here?”CRISPR J.2018 Oct;1:325-336.doi:10.1089/crispr.2018.0033、Yan et al.,”Functionally diverse type V CRISPR-Cas systems”Science.2019 Jan 4;363(6422):88-91.doi:10.1126/science.aav7271を参照されたい(各々の内容全体が参照により本明細書に援用される)。例示的な核酸プログラマブルDNA結合タンパク質及び核酸プログラマブルDNA結合タンパク質をコードする核酸配列は、配列表で配列番号250~283及び490として提供される。
【0119】
本明細書で使用される場合、「核酸塩基編集ドメイン」または「核酸塩基編集タンパク質」という用語は、シトシン(もしくはシチジン)からウラシル(もしくはウリジン)またはチミン(もしくはチミジン)への脱アミノ化、及びアデニン(もしくはアデノシン)からヒポキサンチン(もしくはイノシン)への脱アミノ化、ならびに非鋳型ヌクレオチド付加及び挿入などの、RNAもしくはDNAにおける核酸塩基修飾を触媒することができる、タンパク質または酵素を指す。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメイン(例えば、アデニンデアミナーゼもしくはアデノシンデアミナーゼ、またはシチジンデアミナーゼもしくはシトシンデアミナーゼ)である。
【0120】
本明細書で使用される場合、「薬剤の入手」における「入手」には、薬剤の合成、購入、または他の方法での入手が含まれる。
【0121】
本明細書で使用される「患者」または「対象」とは、疾患または障害と診断されているか、それを有するリスクもしくは発症するリスクがあるか、またはそれを有する疑いもしくは発症する疑いがある、哺乳類の対象または個体を指す。一部の実施形態では、用語「患者」とは、疾患または障害を発症する可能性が平均よりも高い哺乳類対象を指す。例示的な患者は、ヒト、非ヒト霊長類、ネコ、イヌ、ブタ、ウシ、ネコ、ウマ、ラクダ、ラマ、ヤギ、ヒツジ、げっ歯類(例えば、マウス、ウサギ、ラット、またはモルモット)及び本明細書に開示される療法から利益を得ることができる他の哺乳類であり得る。例示的なヒト患者は、男性及び/または女性であり得る。
【0122】
「それを必要としている患者」または「それを必要としている対象」とは、本明細書中では、疾患または障害と診断されている患者、そのリスクがあるもしくはそれを有する患者、それを有すると予め決定されている患者、またはそれを有すると疑われている患者を指す。
【0123】
用語「病原性変異」、「病原性バリアント」、「病因変異」、「病因バリアント」、「有害な変異」または「素因変異」とは、疾患もしくは障害に関連する遺伝子改変もしくは変異、または特定の疾患もしくは障害への個体の易罹患性もしくは素因を増加させる遺伝子改変もしくは変異を指す。一部の実施形態では、病原性変異は、遺伝子によってコードされるタンパク質内の少なくとも1つの病原性アミノ酸によって置換された少なくとも1つの野生型アミノ酸を含む。一部の実施形態では、病原性変異は、終結領域(例えば、終止コドン)内にある。一部の実施形態では、病原性変異は、非コード領域(例えば、イントロン、プロモーターなど)内にある。
【0124】
用語「タンパク質」、「ペプチド」、「ポリペプチド」、及びそれらの文法上の同等物は、本明細書中では同じ意味で使用され、ペプチド(アミド)結合によって一緒に連結されたアミノ酸残基の重合体を指す。タンパク質、ペプチド、またはポリペプチドは、天然の、組換え、もしくは合成、またはそれらの任意の組み合わせであり得る。
【0125】
本明細書で使用される「融合タンパク質」という用語は、少なくとも2つの異なるタンパク質に由来するタンパク質ドメインを含む、ハイブリッドポリペプチドを指す。
【0126】
タンパク質または核酸の文脈で本明細書で使用される「組換え」という用語は、天然には存在しないが、人間工学の産物であるタンパク質または核酸を指す。例えば、一部の実施形態では、組換えタンパク質または核酸分子は、任意の天然の配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸配列またはヌクレオチド配列を含む。
【0127】
「減少」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する。
【0128】
「参照」とは、標準または対照の条件を意味する。一実施形態では、参照は、イントロンを含まないポリヌクレオチドによってコードされた塩基エディターによって提供される編集のレベルである。別の実施形態では、参照は、スプライスアクセプターまたはスプライスドナー部位内の改変を含まないイントロンを含むポリヌクレオチドによってコードされた塩基エディターによって提供される編集のレベルである。一実施形態では、参照は、野生型の細胞または健常な細胞内に存在する分析物のレベル、構造または活性である。他の実施形態では、限定されないが、参照は、試験条件に供されていない未治療の細胞内、またはプラセボもしくは通常の生理食塩水、培地、緩衝液、及び/または目的のポリヌクレオチドを保有しない対照ベクターに供された未治療の細胞内に存在する分析物のレベル、構造または活性である。
【0129】
「参照配列」とは、配列比較の基礎として使用される規定の配列である。参照配列は、特定の配列のサブセットまたはその全体、例えば、全長のcDNAもしくは遺伝子配列のセグメント、または完全なcDNAもしくは遺伝子配列であってもよい。ポリペプチドの場合、参照ポリペプチド配列の長さは、一般的に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少なくとも約25アミノ酸、約35アミノ酸、約50アミノ酸、または約100アミノ酸である。核酸の場合、参照核酸配列の長さは、一般的に、少なくとも約50ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレオチド、または約300ヌクレオチド、またはその周辺またはそれらの間の任意の整数である。一部の実施形態では、参照配列は、目的のタンパク質の野生型配列である。他の実施形態では、参照配列は、野生型のタンパク質をコードするポリヌクレオチド配列である。
【0130】
用語「RNAプログラマブルヌクレアーゼ」及び「RNAガイドヌクレアーゼ」は、切断の標的ではない1つ以上のRNA(複数可)とともに使用される(例えば、結合または会合させる)。一部の実施形態では、RNAプログラマブルヌクレアーゼは、RNAとの複合体にある場合、ヌクレアーゼ:RNA複合体と呼ばれ得る。通常、結合したRNA(複数可)はガイドRNA(gRNA)と呼ばれる。一部の実施形態では、RNAプログラマブルヌクレアーゼは、(CRISPR関連システム)Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenesからのCas9(Csnl)(例えば、配列番号250)、Neisseria meningitidisからのCas9(NmeCas9、配列番号261)、Nme2Cas9(配列番号262)またはそれらの誘導体(例えば、Nme2Cas9またはspCas9などのCas9に対して少なくとも約85%の配列同一性を有する配列)である。
【0131】
用語「一塩基多型(SNP)」とは、ゲノム内の特定の位置で発生する単一ヌクレオチドの変異であり、各変異は集団内に一定程度(例えば、>1%)存在する。
【0132】
「特異的に結合する」とは、試料、例えば、生物学的試料において、核酸分子、ポリペプチド、ポリペプチド/ポリヌクレオチド複合体、化合物または分子が、本発明のポリペプチド及び/または核酸分子を認識しそれに結合するが、他の分子を実質的に認識せずそれらに実質的に結合しないことを意味する。
【0133】
「実質的に同一」とは、参照アミノ酸配列に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施形態では、参照配列は、野生型のアミノ酸配列または核酸配列である。別の実施形態では、参照配列は、本明細書に記載のアミノ酸配列または核酸配列のいずれか1つである。一実施形態では、そのような配列は、アミノ酸レベルまたは核酸レベルにおいて、比較に使用する配列と少なくとも60%、80%、85%、90%、95%、またはさらには99%同一である。
【0134】
配列同一性は、通常、配列解析ソフトウェア(例えば、Genetics Computer Group,University of Wisconsin Biotechnology Center,1710 University Avenue,Madison,Wis.53705の配列解析ソフトウェアパッケージ、BLAST、BESTFIT、GAPまたはPILEUP/PRETTYBOXプログラム)を使用して測定される。そのようなソフトウェアは、様々な置換、欠失、及び/または他の修飾に対して相同性の程度を割り当てることによって、同一または類似の配列を照合する。保存的置換は、通常、以下のグループ内の置換が含まれる:グリシン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、アスパラギン、グルタミン;セリン、スレオニン;リジン、アルギニン;及びフェニルアラニン、チロシン。同一性の程度を決定するための例示的なアプローチでは、密接に関連した配列を示すe-3~e-100の確率スコアを用いたBLASTプログラムを使用してもよい。
【0135】
COBALTを、例えば、以下のパラメータとともに使用する。
a)アラインメントパラメータ:ギャップペナルティ-11,-1及びエンドギャップペナルティ-5,-1、
b)CDDパラメータ:RPS BLASTを使用、Blast E値0.003、保存された列を見つけて再計算、及び
c)クエリクラスタリングパラメータ:クエリクラスターを使用、ワードサイズ4、最大クラスター距離0.8、アルファベット通常。
EMBOSS Needleを、例えば、以下のパラメータとともに使用する。
a)マトリックス:BLOSUM62、
b)GAP OPEN:10、
c)GAP EXTEND:0.5、
d)OUTPUT FORMAT:対、
e)END GAP PENALTY:偽、
f)END GAP OPEN:10、及び
g)END GAP EXTEND:0.5。
【0136】
本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。本発明の方法において有用な核酸分子には、本発明のポリペプチドまたはその断片をコードする任意の核酸分子が含まれる。そのような核酸分子は、内在性核酸配列と100%同一である必要はないが、典型的には、実質的な同一性を示すであろう。内在性配列に対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも1つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、対が、様々なストリンジェンシー条件下で、相補的ポリヌクレオチド配列(例えば、本明細書に記載の遺伝子)またはその一部の間で二本鎖分子を形成することを意味する。(例えば、Wahl,G.M.and S.L.Berger(1987)Methods Enzymol.152:399、Kimmel,A.R.(1987)Methods Enzymol.152:507を参照のこと)。
【0137】
例えば、ストリンジェントな塩濃度は、通常、約750mM未満のNaCl及び75mM未満のクエン酸三ナトリウムであり、好ましくは、約500mM未満のNaCl及び50mM未満のクエン酸三ナトリウムであり、より好ましくは、約250mM未満のNaCl及び25mM未満のクエン酸三ナトリウムである。有機溶媒、例えば、ホルムアミドの非存在下では、低いストリンジェンシーのハイブリダイゼーションを得ることができる一方で、少なくとも約35%のホルムアミド、より好ましくは少なくとも約50%のホルムアミドの存在下では、高いストリンジェンシーのハイブリダイゼーションを得ることができる。ストリンジェントな温度条件には、通常は、少なくとも約30℃、より好ましくは少なくとも約37℃、最も好ましくは少なくとも約42℃の温度が含まれる。ハイブリダイゼーションの時間、界面活性剤、例えば、ドデシル硫酸ナトリウム(SDS)の濃度、及び担体DNAの包含または除外などの様々な追加のパラメータは、当業者に周知である。必要に応じて、これらの様々な条件を組み合わせることによって、様々なレベルのストリンジェンシーが達成される。好ましい実施形態では、ハイブリダイゼーションを、750mMのNaCl、75mMのクエン酸三ナトリウム及び1%SDS中にて30℃で実施する。より好ましい実施形態では、ハイブリダイゼーションを、500mMのNaCl、50mMのクエン酸三ナトリウム、1%SDS、35%ホルムアミド、及び100μg/mlの変性サケ精子DNA(ssDNA)中にて37℃で実施する。最も好ましい実施形態では、ハイブリダイゼーションを、250mMのNaCl、25mMのクエン酸三ナトリウム、1%SDS、50%ホルムアミド、及び200μg/mlのssDNA中にて42℃で実施する。これらの条件の有用な変形は、当業者には容易に明らかであろう。
【0138】
ほとんどの用途では、ハイブリダイゼーションに続く洗浄ステップもまた、ストリンジェンシーが異なるであろう。洗浄のストリンジェンシー条件は、塩濃度及び温度によって定義することができる。上記のように、洗浄のストリンジェンシーは、塩濃度を下げるか、または温度を上げることによって、高めることができる。例えば、洗浄ステップのためのストリンジェントな塩濃度は、好ましくは約30mM未満のNaCl及び3mM未満のクエン酸三ナトリウム、及び最も好ましくは約15mM未満のNaCl及び1.5mM未満のクエン酸三ナトリウムである。洗浄ステップのためのストリンジェントな温度条件には、通常、少なくとも約25℃、より好ましくは少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度が含まれる。一実施形態では、洗浄ステップを、30mMのNaCl、3mMのクエン酸三ナトリウム、及び0.1%のSDS中にて、25℃で実施する。別の実施形態では、洗浄ステップを、15mMのNaCl、1.5mMのクエン酸三ナトリウム及び0.1%SDS中にて42℃で実施する。より好ましい実施形態では、洗浄ステップを、15mMのNaCl、1.5mMのクエン酸三ナトリウム、及び0.1%のSDS中にて、68℃で実施する。これらの条件における追加の変形は、当業者には容易に明らかであろう。ハイブリダイゼーション技術は、当業者に周知であり、例えば、Benton and Davis(Science 196:180,1977)、Grunstein and Hogness(Proc.Natl.Acad.Sci.,USA 72:3961,1975)、Ausubel et al.(Current Protocols in Molecular Biology,Wiley Interscience,New York,2001)、Berger and Kimmel(Guide to Molecular Cloning Techniques,1987,Academic Press,New York)、及びSambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,New Yorkに記載されている。
【0139】
「スプリット(split)」とは、2つ以上の断片に分割されることを意味する。
【0140】
「スプリットCas9タンパク質」または「スプリットCas9」とは、2つの別個のヌクレオチド配列によってコードされるN末端断片及びC末端断片として提供されるCas9タンパク質を指す。Cas9タンパク質のN末端部分及びC末端部分に対応するポリペプチドは、スプライシングされて「再構築された」Cas9タンパク質を形成し得る。
【0141】
「標的部位」という用語は、修飾される核酸分子内の配列を指す。実施形態では、核酸分子は、デアミナーゼ、デアミナーゼを含む融合タンパク質もしくは複合体、または本明細書に開示される塩基エディターによって脱アミノ化される。実施形態では、デアミナーゼは、シチジンまたはアデニンデアミナーゼである。一部の事例では、デアミナーゼは、dCas9-アデノシンデアミナーゼ融合タンパク質である。一部の場合では、塩基エディターは、アデニンもしくはアデノシン塩基エディター(ABE)、またはシチジンもしくはシトシン塩基エディター(CBE)である。
【0142】
本明細書で使用される場合、「治療する」、「治療すること」、及び「治療」などの用語は、障害及び/もしくはそれに関連する症状を低減するもしくは寛解させること、または所望の薬理学的及び/もしくは生理学的効果を得ることを指す。障害または状態を治療することは、障害、状態、またはそれらに関連する症状が完全に排除されることを、除外はしないものの、必ずしも必要としないことが理解されるだろう。一部の実施形態では、効果は治療的であり、すなわち、限定されないが、その効果は、疾患及び/または疾患に起因する有害な症状を、部分的または完全に、低減、減少、抑制、軽減、緩和、強度を低下させるか、または治癒する。一部の実施形態では、効果は予防的であり、すなわち、効果は、疾患または状態の発生または再発を、防御または予防する。この目的のために、本明細書に開示する方法は、本明細書に記載するような治療有効量の組成物を投与することを含む。
【0143】
「ウラシルグリコシラーゼ阻害剤」または「UGI」とは、ウラシル除去修復系を阻害する薬剤を意味する。シチジンデアミナーゼを含む塩基エディターは、シトシンをウラシルに変換し、次いで、ウラシルは、DNA複製または修復を介して、チミンに変換される。ウラシルDNAグリコシラーゼ(UGI)の阻害剤を塩基エディターにおいて含めることは、UをCに変化させ戻す塩基除去修復を防止する。例示的なUGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 ウラシルDNAグリコシラーゼ阻害剤
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(配列番号284)。
【0144】
本明細書に提供される範囲は、範囲内の全ての値の略記であることが理解される。例えば、1~50の範囲は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50からなる群からの任意の数、数字の組み合わせ、または部分範囲を含むことが理解される。
【0145】
本明細書の変数の任意の定義の中の化学基のリストの列挙は、任意の単一の基、または列挙した基の組み合わせとして、その変数の定義を含む。本明細書の変数または態様についての実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。
【0146】
全ての用語は、当業者によって理解されるように理解されることが意図されている。別途定義されない限り、本明細書で使用される全ての技術及び科学用語は、本開示が属する当該技術分野の当業者によって一般的に理解されるのと同じ意味を有する。
本出願では、単数形の使用は、特に断りのない限り、複数形を含む。本明細書で使用される場合、単数形の「a」、「an」及び「the」は、別途文脈により明らかに指示されない限り、複数の言及を含むことに留意されたい。本出願において、「または」の使用は、別段の定めのない限り、「及び/または」を意味する。さらに、「含む(including)」という用語、ならびに「含む(include)」、「含む(includes)」及び「含まれる(included)」などの他の形態の使用は、限定的でない。
【0147】
本明細書及び請求項(複数可)で使用される場合、「含む(comprising)」(ならびにそのいずれかの形態、例えば、「含む(comprise)」及び「含む(comprises)」)、「有する(having)」(ならびにそのいずれかの形態、例えば、「有する(have)」及び「有する(has)」)、「含む(including)」(ならびにそのいずれかの形態、例えば、「含む(includes)」及び「含む(include)」)または「含有する(containing)」(ならびにそのいずれかの形態、例えば、「含有する(contains)」及び「含有する(contain)」)という単語は、包含的またはオープンエンド的であり、追加の列挙されていない要素または方法ステップを除外しない。特定の構成要素(複数可)または要素(複数可)を「含む」として指定されるいずれかの実施形態はまた、一部の実施形態では、特定の構成要素(複数可)または要素(複数可)「からなる」または「から本質的になる」ことが企図される。本明細書で論じられる任意の実施形態は、本開示の任意の方法または組成物に関して実施され得、逆もまた同様であることが企図される。さらに、本開示の組成物を使用して、本開示の方法を達成することができる。
【0148】
「約」または「およそ」という用語は、当業者によって決定される特定の値に対する許容誤差の範囲内であることを意味し、それは、部分的には、どのようにその値が測定または決定されるか(すなわち、測定システムの限界)に依存する。
【0149】
本明細書における「一部の実施形態」、「実施形態」、「一実施形態」または「他の実施形態」への言及は、実施形態に関連して説明される特定の特徴、構造、または特徴が、本開示の少なくとも一部の実施形態に含まれるが、必ずしも全ての実施形態に含まれるわけではないことを意味する。
【図面の簡単な説明】
【0150】
図1A】塩基エディターの自己不活性化の機構を示す概略図を提供する。2つのgRNAは、塩基編集が宿主ゲノム内の標的部位でかつ塩基エディターのコード領域内で同時に発生するように指示する。使用されている塩基エディターが、アデニン塩基エディター(ABE)である場合に、デアミナーゼドメインの触媒残基(His57(H57)、Glu59(E59)、Cys87(C87)またはCys90(C90))は、単一A-to-Gエディターを介して不活性化されて、Arg、Gly、ArgまたはArgを、それぞれ、各々の部位でインストールすることができる。使用されている塩基エディターが、シトシン塩基エディター(CBE)である場合に、未熟終止コドンは、単一C-to-T編集を介して、エディター内のいずれかのArg、GlnまたはTrp残基でインストールされ得る。
図1B】2つのgRNAを使用する、ゲノム部位(ABCA4 c.5882G>A)及びTadAにおける自己不活性化部位(His57、Glu59、Cys87またはCys90)での、ABE7.10-m及びプレインストールされたTadA変異(His57Arg、Glu59Gly、Cys87ArgまたはCys90Arg)を含有するABE7.10-mバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図1C】TadAコード領域内の自己不活性化標的部位His57及びGlu59のDNA配列を示す概略図を提供する。3’PAM配列は、灰色でハイライトされ、各々の配列におけるプロトスペーサー内の標的ヌクレオチド及びその位置は、太字である。図1Cで提供されるヌクレオチド配列は、上から下への出現の順序で、配列番号458~459に対応する。図1Cで提供されるアミノ酸配列は、上から下への出現の順序で、配列番号460~461に対応する。
図1D】ABE8.5-mコドンバリアント、ならびにゲノム部位(ABCA4 c.5882G>A)及びTadAの自己不活性化部位Glu59を標的とする2つのgRNAのリポフェクション後のHEK293T細胞内での塩基編集活性を示すグラフを提供する。バリアントの活性は、自己不活性化gRNAが提供されなかったABE8.5-mの活性と比較された。
図1E】ARPE-19細胞内のゲノム部位及びABEのTadA触媒残基での、AAV2によって送達されたABE8.5-mコドンバリアント及び2つのgRNAの塩基編集動態を示す棒グラフを提供する。ABE8.5-mコドンバリアント及び2つのgRNAのAAV2送達後の、ゲノム部位(ABCA4 c.5882G>A)での塩基編集の5週間の時間経過を示す棒グラフを提供する。
図1F】ARPE-19細胞内のゲノム部位及びABEのTadA触媒残基での、AAV2によって送達されたABE8.5-mコドンバリアント及び2つのgRNAの塩基編集動態を示す棒グラフを提供する。5週間の時間経過からの同じ試料における、TadAの自己不活性化部位であるアミノ酸残基His57または残基Glu59での編集を示す棒グラフを提供する。
図1G】ARPE-19細胞内のゲノム部位及びABEのTadA触媒残基での、AAV2によって送達されたABE8.5-mコドンバリアント及び2つのgRNAの塩基編集動態を示す棒グラフを提供し、自己不活性化編集が、2つの異なる方法によって評価される。ABE8.5-mコドンバリアント及び2つのgRNAのAAV2送達の2週間後の、ゲノム部位(ABCA4 c.5882G>A)での塩基編集を示す棒グラフを提供する。
図1H】ARPE-19細胞内のゲノム部位及びABEのTadA触媒残基での、AAV2によって送達されたABE8.5-mコドンバリアント及び2つのgRNAの塩基編集動態を示す棒グラフを提供し、自己不活性化編集が、2つの異なる方法によって評価される。同じ実験における、細胞可溶化物からのDNAまたはテクニカルレプリケート試料のmRNAから生成されたcDNAのいずれかの標的配列決定によって評価された自己不活性化率を示す棒グラフを提供する。
図2A】ABE開始コドンの改変を介してエディターを不活性化するためにTadAになされた変異の図を提供する。DNA及びタンパク質配列における変異は、黒色でハイライトされる。代替アウトオブフレーム開始コドンは、灰色のボックスによって特定される。図2Aで提供されるヌクレオチド配列は、上から下への出現の順序で、配列番号462~466に対応する。図2Aで提供されるアミノ酸配列は、上から下への出現の順序で、配列番号467~469に対応する。
図2B】プレインストールされた開始コドン変異を含有するABE8.5-mバリアントのリポフェクション後のHEK293T細胞内のゲノム部位ABCA4 c.5882G>Aでの塩基編集活性を示す棒グラフを提供する。この実験において、自己不活性化gRNAは提供されなかった。
図2C】塩基編集がTadAのMet1で発生することを可能にするPAM配列(NGG)を組み込むためにABE8.5-mになされた変異を示す図を提供する。図2Cで提供されるヌクレオチド配列は、上から下への出現の順序で、配列番号470~476に対応する。図2Cで提供されるアミノ酸配列は、上から下への出現の順序で、配列番号477~480に対応する。
図2D】TadAにおけるインストールされたPAM配列を含有するABE8.5-mバリアントのリポフェクション後のHEK293T細胞内のゲノム部位ABCA4 c.5882G>Aでの塩基編集活性を、未変異の対照と比較して示す棒グラフを提供する。実験において、自己不活性化gRNAは提供されなかった。
図2E】2つのgRNAを使用する、ゲノム部位(ABCA4 c.5882G>A)及びTadAにおける自己不活性化部位Met1での、ABE8.5-m及びABE8.5-mバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図3A】アデニン塩基エディター(ABE)のDNA内へのイントロンの組み込みを介する、塩基エディターの自己不活性化の機構を示す概略図を提供する。
図3B】イントロンをTadAの特定のコドン(残基)後または内のコード配列において含有するABEバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。TadAの残基87後へのイントロン(NF1、PAX2、EEF1A1、Chimera、SLC50A1、ABCB11、BRSK2、PLXNB3、TMPRSS6、IL32)の組み込み、残基62後へのイントロン(Chimera、ABCB11、PLXNB3、IL32)の組み込みまたは残基23内へのイントロン(Chimera、ABCB11、PLXNB3、IL32)の組み込み後の塩基編集活性を示す棒グラフを提供する。
図3C】イントロンをTadAの特定のコドン(残基)後または内のコード配列において含有するABEバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。NF1、PAX2及びEEF1A1に加えて、残基87後へのいくつかの追加のイントロン(ANTXRL、PKHD1L1、PADI1、KRT6C、HMCN2、HMCN2-SalmonまたはENPEP-Gecko)の組み込み後の塩基編集活性を示す棒グラフを提供する。この実験において、自己不活性化gRNAは提供されなかった。
図3D】プレインストールされた編集をスプライスアクセプター部位またはスプライスドナー部位のいずれか内に有するイントロンを含有するABEバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。イントロンは、TadA残基87後に位置した(NF1アクセプター、PAX2アクセプター、EEF1A1アクセプター、Chimeraアクセプター、ANTXRLアクセプター、PKHK1L1アクセプター、PADI1アクセプター、KRT6Cアクセプター、HMCN2アクセプター、ENPEP-Geckoアクセプター、HMCN2-Salmonアクセプター、NF1ドナー、PAX2ドナー、EEF1A1ドナーまたはChimeraドナー)。この実験において、自己不活性化gRNAは提供されなかった。
図3E】プレインストールされた編集をスプライスアクセプター部位またはスプライスドナー部位のいずれか内に有するイントロンを含有するABEバリアントのリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。イントロンは、TadA残基129後に位置し(NF1アクセプター、PAX2アクセプター、EEF1A1アクセプター)、TadA残基59後に位置し(NF1アクセプター、PAX2アクセプター、EEF1A1アクセプター)、TadA残基18後に位置し(NF1アクセプター、PAX2アクセプター、EEF1A1アクセプター)、TadA残基62後に位置した(ABCB11アクセプター)かまたは残基23内に位置した(ABCB11ドナー)。この実験において、自己不活性化gRNAは提供されなかった。
図3F】ゲノム部位(ABCA4 c.5882G>A)及びTadA内で残基87後に配置されたイントロン(NF1またはPAX2)のアクセプター部位での、リポフェクションされたHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図3G】ゲノム部位(ABCA4 c.5882G>A)、ならびにTadA内で残基87後に配置されたイントロン(NF1、PAX2及びEEF1A1)及び残基62後に配置されたイントロン(ABCB11)のアクセプター部位での、リポフェクションされたHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図3H】プレインストールされた変異をスプライスアクセプター部位で有するまたは有さないイントロン(NF1、PAX2またはEEF1A1)をTadA内の様々な位置で(残基87、129、59または18後に)含有するABE8.5-mバリアントの塩基編集活性を示す棒グラフを提供する。この実験において、自己不活性化gRNAは提供されなかった。
図3I】ゲノム部位(ABCA4 c.5882G>A)、ならびにTadA内で残基87、129、59及び18後に配置されたイントロン(NF1、PAX2及びEEF1A1)のアクセプター部位での、リポフェクションされたHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図3J】ゲノム部位(ABCA4 c.5882G>A)、ならびにTadA内で残基87後に配置されたイントロンNF1、PAX2、EEF1A1、ANTXRL、PKHD1L1、PADI1及びENPEP-Geckoのアクセプター部位での、リポフェクションされたHEK293T細胞内での塩基編集活性を示す棒グラフを提供する。
図3K】自己不活性化gRNAと、ゲノム部位を標的とするgRNAと、イントロンをTadAのコード配列において含有するABEバリアントとをコードするプラスミドDNAのプラスミドリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフ及び積み上げ棒グラフを提供する。図3Kは、ゲノム部位(ABCA4 c.5882G>A)、及びTadA内で残基87後に配置されたイントロンNF1またはPAX2のアクセプター部位での塩基編集活性を示す棒グラフを提供し、編集は、細胞可溶化物からのDNAの標的配列決定によって評価された。図3L及び3Mは、全mRNAのRNA-seqによって評価された、ABE8.5-m mRNA内のスプライスバリアントの割合を示す積み上げ棒グラフを提供する。図3K、3L及び3Mの全ての解析は、同じ実験におけるテクニカルレプリケートにおいて実行された。
図3L】自己不活性化gRNAと、ゲノム部位を標的とするgRNAと、イントロンをTadAのコード配列において含有するABEバリアントとをコードするプラスミドDNAのプラスミドリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフ及び積み上げ棒グラフを提供する。図3Kは、ゲノム部位(ABCA4 c.5882G>A)、及びTadA内で残基87後に配置されたイントロンNF1またはPAX2のアクセプター部位での塩基編集活性を示す棒グラフを提供し、編集は、細胞可溶化物からのDNAの標的配列決定によって評価された。図3L及び3Mは、全mRNAのRNA-seqによって評価された、ABE8.5-m mRNA内のスプライスバリアントの割合を示す積み上げ棒グラフを提供する。図3K、3L及び3Mの全ての解析は、同じ実験におけるテクニカルレプリケートにおいて実行された。
図3M】自己不活性化gRNAと、ゲノム部位を標的とするgRNAと、イントロンをTadAのコード配列において含有するABEバリアントとをコードするプラスミドDNAのプラスミドリポフェクション後のHEK293T細胞内での塩基編集活性を示す棒グラフ及び積み上げ棒グラフを提供する。図3Kは、ゲノム部位(ABCA4 c.5882G>A)、及びTadA内で残基87後に配置されたイントロンNF1またはPAX2のアクセプター部位での塩基編集活性を示す棒グラフを提供し、編集は、細胞可溶化物からのDNAの標的配列決定によって評価された。図3L及び3Mは、全mRNAのRNA-seqによって評価された、ABE8.5-m mRNA内のスプライスバリアントの割合を示す積み上げ棒グラフを提供する。図3K、3L及び3Mの全ての解析は、同じ実験におけるテクニカルレプリケートにおいて実行された。
図3N】スプライスアクセプター部位を標的とする自己不活性化gRNAと、ゲノム部位を標的とするgRNAと、NF1イントロンをTadAのコード配列において残基87で含有するABEバリアントとのAAV2送達の2週間後のARPE-19細胞内での塩基編集活性を示す棒グラフを提供する。編集は、ゲノムDNAの標的配列決定によって、ゲノム部位で測定された。自己不活性化部位での編集は、回収されたAAVゲノムの標的配列決定及び細胞からの全mRNAのRNAseqの両方によって測定される。全ての測定は、同じ実験におけるテクニカルレプリケートにおいて行われた。
図4A】5週間のAAV2形質導入実験を示す棒グラフを提供し、実験において、A>G塩基変換は、網膜色素上皮に由来する細胞株であるARPE-19細胞内で1、3及び5週目(x軸)に測定された。ゲノム部位(ABCA4 c.5882G>A)での編集を示す棒グラフを提供する。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。NF1及びPAX2スプライスアクセプター部位が、それぞれ、ガイドg235及びg239を使用して編集された(表1Cを参照されたい)。
図4B】5週間のAAV2形質導入実験を示す棒グラフを提供し、実験において、A>G塩基変換は、網膜色素上皮に由来する細胞株であるARPE-19細胞内で1、3及び5週目(x軸)に測定された。DNA配列決定によって測定された、TadA触媒残基またはイントロンスプライスアクセプター部位での編集を示す棒グラフを提供する。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。NF1及びPAX2スプライスアクセプター部位が、それぞれ、ガイドg235及びg239を使用して編集された(表1Cを参照されたい)。
図4C】5週間のAAV2形質導入実験を示す棒グラフを提供し、実験において、A>G塩基変換は、網膜色素上皮に由来する細胞株であるARPE-19細胞内で1、3及び5週目(x軸)に測定された。RNAアンプリコン配列決定を介する、同じ遺伝子座の編集の測定を示す棒グラフを提供する。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。NF1及びPAX2スプライスアクセプター部位が、それぞれ、ガイドg235及びg239を使用して編集された(表1Cを参照されたい)。
図5A】形質導入の示される日数(x軸)後の、ARPE-19細胞内での2週間のAAV2形質導入実験を示す棒グラフを提供する。棒グラフは各々、細胞を形質導入するために付加されたウイルスゲノムの数(高、中または低)を示す。細胞を形質導入するために付加されたウイルスゲノムの数は、高(89kvg/細胞)、中(17kvg/細胞)または低(9kvg/細胞)のいずれかであった。付加されたウイルスの量についての、形質導入後3日目、7日目及び14日目のゲノム部位(ABCA4 c.5882G>A)の編集率を示す棒グラフを提供する。
図5B】形質導入の示される日数(x軸)後の、ARPE-19細胞内での2週間のAAV2形質導入実験を示す棒グラフを提供する。棒グラフは各々、細胞を形質導入するために付加されたウイルスゲノムの数(高、中または低)を示す。細胞を形質導入するために付加されたウイルスゲノムの数は、高(89kvg/細胞)、中(17kvg/細胞)または低(9kvg/細胞)のいずれかであった。示される時点でのDNA配列決定によって測定された、TadA触媒残基またはイントロンスプライスアクセプター部位での編集を示す棒グラフを提供する。
図6A】ARPE-19細胞内での2週間のAAV2時間経過形質導入実験を示す棒グラフを提供し、実験において、編集は、4、7及び14日目に測定された。次世代配列決定を介して測定された、ゲノム部位(ABCA4 c.5882G>A)の編集率を示す棒グラフを提供する。
図6B】ARPE-19細胞内での2週間のAAV2時間経過形質導入実験を示す棒グラフを提供し、実験において、編集は、4、7及び14日目に測定された。RNAアンプリコン配列決定を介して測定された、TadA触媒残基またはイントロンスプライスアクセプターの編集を示す棒グラフを提供する。
図7A】HEK293T細胞内でのプラスミドリポフェクションの結果、ならびにリポフェクション後2日目及び7日目に測定された編集率を示す棒グラフを提供する。次世代配列決定を介して測定された、ゲノム部位(ABCA4 c.5882G>A)の編集を示す棒グラフを提供する。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。
図7B】HEK293T細胞内でのプラスミドリポフェクションの結果、ならびにリポフェクション後2日目及び7日目に測定された編集率を示す棒グラフを提供する。RNAアンプリコン配列決定を介して測定された、TadA触媒残基またはイントロンスプライスアクセプター部位の編集を示す棒グラフを提供する。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。
図8A】BALB/cマウスにおける、AAV8のIV尾部静脈注射後に収集された編集データを示す棒グラフを提供する。DNA及びRNAアンプリコン配列決定の両方を介して形質導入の1週間後に測定された、ゲノム部位(ABCA4 c.5882G>A)での編集、及びTadA触媒残基またはイントロンスプライスアクセプター部位の編集を示すグラフを提供する。ゲノム部位の編集が、左y軸に示され、TadA触媒残基またはイントロンスプライスアクセプターの編集が、右y軸に示される。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。
図8B】BALB/cマウスにおける、AAV8のIV尾部静脈注射後に収集された編集データを示す棒グラフを提供する。4週間後の同じ結果を示すグラフを提供する。ゲノム部位の編集が、左y軸に示され、TadA触媒残基またはイントロンスプライスアクセプターの編集が、右y軸に示される。「_scrmbl」という用語は、自己不活性化ガイド配列がスクランブルされていることを示す。
【発明を実施するための形態】
【0151】
本発明は、自己不活性化塩基エディターを含む組成物及びこのようなエディターを使用する方法を特徴とする。本発明はまた、自己不活性化のための異種イントロンを有する塩基エディターをコードするポリヌクレオチド、このようなポリヌクレオチドを含む組成物、及びこのようなポリヌクレオチドによってコードされた塩基エディターを不活性化する方法を特徴とする。
【0152】
DNA塩基編集技術は、概して、シトシンデアミナーゼまたはアデニンデアミナーゼのいずれかとのタンパク質融合において、RNAガイドCas9ニッカーゼ(nCas9)などの操作されたDNA結合ドメインを使用する。シトシン塩基エディター(CBE)は、ウラシル中間体を介して、シトシンからチミン(C>T)へのトランスバージョンを触媒し、アデニン塩基エディター(ABE)は、ヒポキサンチン中間体を介して、アデニンからグアニン(A>G)へのトランスバージョンを触媒する(Rees,H.A.,& Liu,D.R.(2018).Base editing:precision chemistry on the genome and transcriptome of living cells.Nat Rev Genet,19(12),770-788)。DNA塩基編集は、RNAガイドnCas9ドメインが、ゲノム内の目的の領域で結合し、これが、ゲノムDNAの非標的鎖を移動させ、非標的鎖が、Rループとして、nCas9から押し出され、したがって、これらの不対塩基を脱アミノ化のために曝露することに依存する。gRNAに結合したDNAの標的鎖はまた、nCas9によってニックされ、これは、未編集の標的鎖の野生型の塩基対に分解するのではなく、細胞DNA不一致修復を、Rループにおけるインストールされた変異の組み込みへバイアスする。
【0153】
全てのゲノム修飾ツールと同様に、永続的であり潜在的に有害である、DNAにおける望ましくないオフターゲット編集から保護するように注意すべきである(Kim,D.,et al.(2017).Genome-wide target specificities of CRISPR RNA-guided programmable deaminases.Nat Biotechnol,35(5),475-480、Liang,P.,et al.(2019).Genome-wide profiling of adenine base editor specificity by EndoV-seq.Nature Communications,10(1),67、Zuo,E.,et al.(2019).Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos.Science,364(6437),289-292)。DNAエディターが無限に発現される状況、例えば、AAVによって送達されたとき(Colella,P.,et al.(2018).Emerging Issues in AAV-Mediated In Vivo Gene Therapy.Molecular Therapy-Methods & Clinical Development,8,87-104、Nathwani,A.C.,et al.(2011).Long-term Safety and Efficacy Following Systemic Administration of a Self-complementary AAV Vector Encoding Human FIX Pseudotyped With Serotype 5 and 8 Capsid Proteins.Molecular Therapy,19(5),876-885、Nguyen,G.N.,et al.(2021).A long-term study of AAV gene therapy in dogs with hemophilia A identifies clonal expansions of transduced liver cells.Nature Biotechnology,39(1),47-55、Niemeyer,G.P.,et al.(2009).Long-term correction of inhibitor-prone hemophilia B dogs treated with liver-directed AAV2-mediated factor IX gene therapy.Blood,113(4),797-806)は、これらの部位での編集のリスクが曝露時間とともに増加するため、オフターゲット活性が非常に低い場合でも、潜在的に問題であり得る。
【0154】
加えて、塩基エディターによるオフターゲットRNA脱アミノ化の持続は、非永続的であるが、罹患細胞のトランスクリプトームプロファイルを改変し得る(Grunewald,J.,et al.(2019).Transcriptome-wide off-target RNA editing induced by CRISPR-guided DNA base editors.Nature,569(7756),433-437、Rees,H.A.,et al.(2019).Analysis and minimization of cellular RNA editing by DNA adenine base editors.Sci Adv,5(5),eaax5717、Zhou,C.,et al.(2019).Off-target RNA mutation induced by DNA base editing and its elimination by mutagenesis.Nature,571(7764),275-278)。AAVによって送達されるCas9ヌクレアーゼのプログラム自己不活性化についての機構は、以前に記載されており、この機構において、Cas9を発現する導入遺伝子は、宿主ゲノム内のオンターゲット部位に加えて、二本鎖DNA切断のために標的とされる(Epstein,B.E.,& Schaffer,D.V.(2016).Engineering a Self-Inactivating CRISPR System for AAV Vectors.Molecular Therapy,24,S50、Li,A.,et al.(2019).A Self-Deleting AAV-CRISPR System for In Vivo Genome Editing.Mol Ther Methods Clin Dev,12,111-122)。したがって、Cas9発現のための指示は、Cas9が最初に送達された細胞から除去される。
【0155】
塩基編集技術の最も広範な治療的有用性を実現するために、本発明は、そうでなければ長期の発現をもたらし得る送達方法後に、塩基エディターの活性及び発現を減弱する方法を提供する。CRISPR-Casヌクレアーゼとは対照的に、塩基エディターは、未改変Cas9ヌクレアーゼからもたらされるインデルの形成を回避するために、nCas9または触媒不活性「デッド」型バリアント(dCas9)のいずれかを使用する(Gaudelli,N.M.,et al.(2017).Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage.Nature,551(7681),464-471、Komor,A.C.,et al.(2016).Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature,533(7603),420-424)。をコードするDNAにおける二本鎖切断の生成を介する塩基エディターの自己不活性化は、可能であるが、いくつかの考慮事項を有する。塩基エディターにおけるニッカーゼCas9は、ニックを、塩基エディターDNAをコードする両方の鎖上に生成するために使用され得る。各々のニックについての部位は、塩基対形成されたヌクレオチドの解離に好都合であるのに十分近接して、各々の鎖のニックまでを含む近い距離で発生して、平滑末端二本鎖DNA切断をもたらし得る。加えて、このような手法は、これらのニックが、それらの再ライゲーションを回避するために、順次ではなく同時になされることを必要とし得、ニックを標的とするために、少なくとも2つの追加のgRNAを含み得る。dCas9が組み込まれた塩基エディターは、この戦略を使用することが可能でない。したがって、一実施形態では、本発明は、エディターDNA内での単一塩基編集をなして、さらなる編集活性または発現を低減または排除することに依存する方法であって、ガイド依存性活性及びガイド非依存性(例えば、擬脱アミノ化)活性の両方についての潜在性を最小化することを目標とする方法を提供する(Yu,Y.,et al.(2020).Cytosine base editors with minimized unguided DNA and RNA off-target events and high on-target activity.Nature Communications,11(1),2052)。本発明はまた、CBEにおけるGln、Arg及びTrp残基をコードする4つのセンスコドンCAA、CAG、CGAまたはTGGのうちのいずれかが、単一C-to-T塩基編集を介して、終止コドンに直接変換され得ることを提供する(Billon,P.,et al.(2017).CRISPR-Mediated Base Editing Enables Efficient Disruption of Eukaryotic Genes through Induction of STOP Codons.Molecular Cell,67(6),1068-1079.e1064)。しかしながら、ABEでの自己不活性化を達成することは、センスコドンがA-to-G塩基編集を介してナンセンスコドンに変換されることがないため、代替手法を必要とする。
【0156】
本明細書に記載される本発明は、塩基エディターのコード遺伝子材料の細胞送達後のそれらの自己不活性化を促進するための組成物及び方法を特徴とする。ABEの自己不活性化のための本発明の方法は、センスコドンから終止コドンへの直接変換に依存せず、C-to-T単一塩基編集を使用して、CBEを不活性化するように適合され得る。これらの組成物及び方法は、塩基編集を使用して、単一塩基変異を、エディターをコードするDNA内にプログラム的にインストールし、DNA編集活性の除去または発現の改変をもたらす。
【0157】
一実施形態では、本発明は、ガイドRNAが、塩基エディターに、塩基エディターのデアミナーゼサブユニット内の活性部位残基を変異させて、触媒的に不活性な酵素及び塩基編集活性の喪失をもたらすように指示することができるという発見に少なくとも部分的に基づく。別の実施形態では、本発明はまた、塩基エディターの開始コドンを単一塩基変異のために標的とすることが、翻訳を防止するという発見に少なくとも部分的に基づく。
【0158】
別の実施形態では、本発明は、イントロンが、塩基エディターコード配列(例えば、オープンリーディングフレーム)内に挿入され得るという発見に少なくとも部分的に基づく。イントロンは、塩基編集のために標的とされ得る配列を提供して、塩基エディター転写物(例えば、mRNA)の産生的スプライシングを破壊または改変し、塩基エディター(例えば、ABE、CBE)の発現の喪失をもたらす。一部の実施形態では、塩基編集は、イントロン配列の5’または3’末端で(例えば、スプライスドナーまたはスプライスアクセプター部位内で)なされる。
標的ポリヌクレオチドの編集
【0159】
本発明の組成物は、例えば、定義される期間の遺伝子編集をもたらすために使用される。所望のレベルの編集が達せられると、塩基エディターの発現は、塩基エディターをコードするポリヌクレオチド配列において存在するイントロンのスプライスアクセプターまたはドナー部位を破壊することによって低減または排除される。
【0160】
概して、塩基編集は、対象の細胞のゲノム内での治療的変化を誘導するために実施される。本発明の一部の実施形態では、(インビボまたはインビトロの)細胞は、2つ以上のガイドRNAと接触し、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)を含む核酸塩基エディターポリペプチドと接触する。一部の実施形態では、編集される細胞は、少なくとも1つの核酸分子と接触し、少なくとも1つの核酸分子は、2つ以上のガイドRNA及び核酸塩基エディターポリペプチドをコードし、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインを含み、核酸塩基エディターポリペプチドをコードする核酸分子の一部分は、イントロンを含み、イントロンは、スプライスアクセプターまたはスプライスドナー部位を含む。一部の実施形態では、編集される細胞は、少なくとも1つの核酸分子と接触し、少なくとも1つの核酸分子は、2つ以上のガイドRNA及び核酸塩基エディターポリペプチドをコードし、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、シチジンデアミナーゼドメインを含み、核酸塩基エディターポリペプチドをコードする核酸分子の一部分は、イントロンを含み、イントロンは、スプライスアクセプターまたはスプライスドナー部位を含む。一部の実施形態では、編集される細胞は、少なくとも1つの核酸分子と接触し、少なくとも1つの核酸分子は、2つ以上のガイドRNA及び核酸塩基エディターポリペプチドをコードし、核酸塩基エディターポリペプチドは、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、アデノシンデアミナーゼドメインを含み、核酸塩基エディターポリペプチドをコードする核酸分子の一部分は、イントロンを含み、イントロンは、スプライスアクセプターまたはスプライスドナー部位を含む。一部の実施形態では、2つ以上のガイドRNA及び核酸塩基エディターポリペプチドをコードする少なくとも1つの核酸分子は、1つ以上のベクター(例えば、AAVベクター)によって、細胞に送達される。
【0161】
一部の実施形態では、編集される細胞は、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子と接触し、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子と接触し、1つの核酸分子は、スプリットインテイン-Nに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのN末端断片及びデアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインをコードし、第2の核酸分子は、スプリットインテイン-Cに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのC末端断片をコードし、第1の核酸分子または第2の核酸分子のいずれかは、イントロンを含み、イントロンは、スプライスアクセプターまたはスプライスドナー部位を含む。一部の実施形態では、編集される細胞は、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子と接触し、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子と接触し、1つの核酸分子は、スプリットインテイン-Nに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのN末端断片をコードし、第2の核酸分子は、スプリットインテイン-Cに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインをコードし、第1の核酸分子または第2の核酸分子のいずれかは、イントロンを含み、イントロンは、スプライスアクセプターまたはスプライスドナー部位を含む。
【0162】
一部の実施形態では、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子、ならびにスプリット核酸塩基エディターポリペプチドをコードする第1の核酸分子及び第2の核酸分子は、1つ以上のベクター(例えば、AAVベクター)によって、細胞に送達される。一部の実施形態では、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子、ならびにスプリット核酸塩基エディターポリペプチドをコードする第1の核酸分子及び第2の核酸分子は各々、別個のベクター(例えば、AAVベクター)によって、細胞に送達される。一部の実施形態では、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子、ならびにスプリット核酸塩基エディターポリペプチドをコードする第1の核酸分子及び第2の核酸分子は、同じベクター(例えば、AAVベクター)において、細胞に送達される。
【0163】
一部の実施形態では、核酸塩基エディターポリペプチドをコードする核酸分子は、リンカーを含む。一部の実施形態では、イントロンは、核酸塩基エディターポリペプチドをコードする核酸分子内のオープンリーディングフレーム内に挿入されている。一部の実施形態では、イントロンは、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインまたはリンカー内に挿入されている。一部の実施形態では、イントロンは、プロトスペーサー配列に近接して挿入されている。一部の実施形態では、イントロンは、プロトスペーサー配列の約10~30個の塩基対内に挿入されている。一部の実施形態では、プロトスペーサー配列は、NGGまたはNNGRRTである。一部の実施形態では、イントロンは、約10塩基対長~約500塩基対長である。一部の実施形態では、イントロンは、約70個の塩基対~150個の塩基対である。一部の実施形態では、イントロンは、約100個の塩基対~200個の塩基対である。
【0164】
一部の実施形態では、2つ以上のガイドRNAは、核酸塩基エディターポリペプチドに、細胞のゲノム内の部位を編集するように指示する1つ以上のガイドRNAと、核酸塩基エディターポリペプチドに、核酸塩基エディターポリヌクレオチドをコードする核酸のイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集(例えば、A-to-GまたはC-to-T塩基編集)するように指示する1つ以上のガイドRNAとを含む。一部の実施形態では、gRNAは、ヌクレオチド類似体を含む。これらのヌクレオチド類似体は、細胞プロセスによるgRNAの分解を阻害することができる。
【0165】
様々な事例では、スペーサー配列は、5’及び/または3’「G」ヌクレオチドを含むことが有利である。一部の場合では、例えば、本明細書で提供されるいずれかのスペーサー配列またはガイドポリヌクレオチドは、5’「G」を含むまたはさらに含み、一部の実施形態では、5’「G」は、標的配列に相補的であるまたは相補的でない。一部の実施形態では、5’「G」は、5’「G」を既に含有していないスペーサー配列に付加される。例えば、ガイドRNAがU6プロモーターなどの制御下で発現されるときに、ガイドRNAが5’末端「G」を含むことは、U6プロモーターが転写開始部位での「G」を好むため有利であり得る(Cong,L.et al.”Multiplex genome engineering using CRISPR/Cas systems.Science 339:819-823(2013)doi:10.1126/science.1231143を参照されたい)。一部の場合では、5’末端「G」は、プロモーターの制御下で発現されるガイドポリヌクレオチドに付加されるが、任意選択で、ガイドポリヌクレオチドがプロモーターの制御下で発現されない場合またはそのときに、ガイドポリヌクレオチドに付加されない。
【0166】
一部の実施形態では、本発明の塩基編集は、対象においてインビボで実施される。一部の実施形態では、少なくとも1つの核酸分子を含む1つ以上のベクター(例えば、AAVベクター)であって、少なくとも1つの核酸分子が、2つ以上のガイドRNA及び核酸塩基エディターポリペプチドをコードし、核酸塩基エディターポリペプチドが、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインを含み、核酸塩基エディターポリペプチドをコードする核酸分子の一部分が、イントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、1つ以上のベクターは、対象における細胞にインビボで送達される。
【0167】
一部の実施形態では、1つ以上のガイドRNAをコードする少なくとも1つの核酸分子であって、1つ以上のガイドRNAが、核酸塩基エディターポリペプチドに、細胞のゲノム内の部位を編集するように指示する、少なくとも1つの核酸分子と、核酸塩基エディターポリペプチドをコードする少なくとも1つの核酸分子であって、核酸塩基エディターポリペプチドが、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメイン、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメイン及びイントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、少なくとも1つの核酸分子とを含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達されて、細胞のゲノム内の部位を編集する。一部の実施形態では、所望のレベルの塩基編集が、対象において達成されると、1つ以上のガイドRNAをコードする少なくとも1つの核酸分子であって、1つ以上のガイドRNAが、核酸塩基エディターポリヌクレオチドをコードする核酸分子のイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集することを標的とする、少なくとも1つの核酸分子を含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達されて、核酸塩基エディターポリヌクレオチドをコードする核酸分子のイントロン内のスプライスアクセプターまたはスプライスドナー部位を編集(例えば、A-to-GまたはC-to-T塩基編集)し、それによって、核酸塩基エディターポリヌクレオチドを自己不活性化して、塩基編集活性を低減または排除する。
【0168】
一部の実施形態では、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子と、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子であって、1つの核酸分子が、スプリットインテイン-Nに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのN末端断片及びデアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインをコードし、第2の核酸分子が、スプリットインテイン-Cに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのC末端断片をコードし、第1の核酸分子または第2の核酸分子のいずれかが、イントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、少なくとも2つの核酸分子とを含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達される。一部の実施形態では、2つ以上のガイドRNAをコードする少なくとも1つの核酸分子と、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子であって、1つの核酸分子が、スプリットインテイン-Nに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのN末端断片をコードし、第2の核酸分子が、スプリットインテイン-Cに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインをコードし、第1の核酸分子または第2の核酸分子のいずれかが、イントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、少なくとも2つの核酸分子とを含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達される。
【0169】
一部の実施形態では、1つ以上のガイドRNAをコードする少なくとも1つの核酸分子であって、1つ以上のガイドRNAが、核酸塩基エディターポリペプチドに、細胞のゲノム内の部位を編集するように指示する、少なくとも1つの核酸分子と、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子であって、1つの核酸分子が、スプリットインテイン-Nに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのN末端断片及びデアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインをコードし、第2の核酸分子が、スプリットインテイン-Cに融合された、核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインのC末端断片をコードし、第1の核酸分子または第2の核酸分子のいずれかが、イントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、少なくとも2つの核酸分子とを含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達されて、細胞のゲノム内の部位を編集する。一部の実施形態では、1つ以上のガイドRNAをコードする少なくとも1つの核酸分子であって、1つ以上のガイドRNAが、核酸塩基エディターポリペプチドに、細胞のゲノム内の部位を編集するように指示する、少なくとも1つの核酸分子と、スプリット核酸塩基エディターポリペプチドをコードする少なくとも2つの核酸分子であって、1つの核酸分子が、スプリットインテイン-Nに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのN末端断片をコードし、第2の核酸分子が、スプリットインテイン-Cに融合された、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)ドメインのC末端断片及び核酸プログラマブルDNA結合タンパク質(napDNAbp)(例えば、Cas9)ドメインをコードし、第1の核酸分子または第2の核酸分子のいずれかが、イントロンを含み、イントロンが、スプライスアクセプターまたはスプライスドナー部位を含む、少なくとも2つの核酸分子とを含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達されて、細胞のゲノム内の部位を編集する。1つ以上のベクター(例えば、AAVベクター)が、細胞に送達されたときに、細胞は、スプリット核酸塩基エディターポリペプチドのN末端及びC末端断片を発現し、N末端及びC末端断片は、一緒に結合して、核酸塩基エディターポリペプチドを形成する。一部の実施形態では、所望のレベルの塩基編集が、対象において達成されると、1つ以上のガイドRNAをコードする少なくとも1つの核酸分子であって、1つ以上のガイドRNAが、核酸塩基エディターポリヌクレオチドをコードする核酸分子のイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位を編集することを標的とする、少なくとも1つの核酸分子を含む1つ以上のベクター(例えば、AAVベクター)は、対象における細胞にインビボで送達されて、核酸塩基エディターポリヌクレオチドのイントロンをコードする核酸分子内に存在するスプライスアクセプターまたはスプライスドナー部位を編集(例えば、A-to-GまたはC-to-T塩基編集)し、それによって、核酸塩基エディターポリヌクレオチドを自己不活性化して、塩基編集活性を低減または排除する。
【0170】
本発明は、例えば、疾患及び目的のSNPを有する患者を、本明細書で提供されるスプリットインテイン塩基エディターシステムを含有する2つのAAVベクターを投与することによって治療する方法を提供する。一部の実施形態では、AAVベクターは各々、塩基エディターの以下の一部分:インテイン-Nに融合されたN末端部分及びインテイン-Cに融合されたC末端部分をコードする。イントロン配列は、塩基エディターの2つの半分のうちの1つ以上のコード配列においてコードされている。一部の実施形態では、SNPを標的とするガイドRNAもまた、AAVベクターのうちの1つにおいて含まれる。一部の実施形態では、AAVベクターは、疾患を有する細胞、組織または臓器に関連する向性を有する(例えば、AAVベクターは、単一血清型のものである)。細胞が、塩基編集システムの2つのAAVベクターに感染しているときに、塩基エディターの2つの半分をコードする転写物が発現され、イントロンがスプライシングされ除去される。2つの半分のポリペプチドが発現すると、塩基エディターは、スプリットインテインタグを介する細胞内のタンパク質スプライシングによって再構成される。一部の実施形態では、塩基編集が、ある期間実行されて、塩基編集が発生することを可能した後に、第3のAAVが提供され、第3のAAVは、ガイドRNAをコードし、ガイドRNAは、細胞内の塩基エディターとともに、イントロン内のドナーまたはアクセプタースプライス部位を標的とする。塩基エディターを発現する細胞が、このAAVに感染したときに、AAVは、スプライス部位を改変して、スプライシングの発生を防止する。塩基エディターの一部分は、適切に発現されることがないため、塩基編集は、細胞内で、オンターゲット及びオフターゲット部位で不活性化または減弱される。
【0171】
本発明はまた、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロンを標的とするガイドRNAを提供する。表1Aは、gRNAがイントロンアクセプターまたはドナー部位を標的とするために使用される標的イントロン配列を提供する。
【表1A-1】

【表1A-2】
【0172】
表1Bは、イントロンアクセプターまたはドナー部位を標的とするためのgRNA配列を提供する。一部の実施形態では、gRNA配列は、U6プロモーターから発現される。以下の表1Bの小文字の「g」は、標的配列に対して5’不一致を示す。
【表1B-1】

【表1B-2】

【表1B-3】

【表1B-4】

【表1B-5】

【表1B-6】

【表1B-7】
【0173】
一部の実施形態では、デアミナーゼドメインは、TadAドメインである。一部の実施形態では、イントロンは、TadAのコドン内またはその直後に挿入されている。一部の実施形態では、イントロンは、TadAのコドン18、23、59、62、87もしくは129内、またはその直後に挿入されている。一部の実施形態では、イントロンは、TadAのコドン87の直後に挿入されている。
【0174】
以下の表1Cは、イントロンをTadAオープンリーディングフレーム内に挿入するための標的配列座標を提供する(例えば、c.100+1は、イントロン配列の第1の塩基対が、TadAの100番目のコードヌクレオチドの直後にあったことを示す)。したがって、一部の実施形態では、イントロン配列は、指定されるアミノ酸位置の直後に配置されている。他の実施形態では、イントロン配列は、指定されるアミノ酸位置の直前に配置されている。
【表1C-1】

【表1C-2】

【表1C-3】
【0175】
核酸塩基エディター
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変する核酸塩基エディター(例えば、自己不活性化核酸塩基エディター)は、本明細書に記載の方法及び組成物において有用である。本明細書に記載される核酸塩基エディターは、通常、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)を含む。ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と結合した場合、標的ポリヌクレオチド配列に特異的に結合することができ、それによって塩基エディターを編集したい標的核酸配列に局在化させることができる。一部の実施形態では、標的ポリヌクレオチド配列は、イントロン(例えば、スプライスアクセプターまたはスプライスドナー部位)内に存在する。
【0176】
特定の実施形態では、本明細書で提供する核酸塩基エディターは、塩基編集活性を改善する1つ以上の特徴を含む。例えば、本明細書で提供する核酸塩基エディターのいずれかは、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。一部の実施形態では、本明細書で提供する核酸塩基エディターのいずれかは、ヌクレアーゼ活性を有さないCas9ドメイン(dCas9)、またはCas9ニッカーゼ(nCas9)と呼ばれる二本鎖DNA分子の一方の鎖を切断するCas9ドメインを有し得る。いかなる特定の理論にも拘束されることを望まないが、触媒残基(例えば、H840)の存在により、標的核酸塩基の反対側の非編集(例えば、脱アミノ化されていない)鎖を切断するCas9の活性が維持される。触媒残基の変異(例えば、D10からA10)は、標的残基(例えば、AまたはC)を含む編集された(例えば、脱アミノ化された)鎖の切断を防止する。そのようなCas9バリアントは、gRNAで規定された標的配列に基づいて特定の位置に一本鎖DNA切断(ニック)を生成し、非編集鎖の修復を引き起こし、最終的には非編集鎖上の核酸塩基を変化させる。
【0177】
ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチド(例えば、RNA、DNA)に結合する。一部の実施形態では、イントロンは、塩基エディターのヌクレオチドプログラマブルヌクレオチド結合ドメインをコードするオープンリーディングフレーム内に存在する。塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、それ自体、1つ以上のドメイン(例えば、1つ以上のヌクレアーゼドメイン)を含み得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、エンドヌクレアーゼまたはエキソヌクレアーゼを含み得る。エンドヌクレアーゼは、二本鎖核酸分子の一本鎖、または二本鎖核酸分子の両方の鎖を切断することができる。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのヌクレアーゼドメインは、標的ポリヌクレオチドの0本、1本、または2本の鎖を切断することができる。
【0178】
塩基エディターに組み込むことができるポリヌクレオチドプログラマブルヌクレオチド結合ドメインの非限定的な例として、CRISPRタンパク質由来ドメイン、制限ヌクレアーゼ、メガヌクレアーゼ、TALヌクレアーゼ(TALEN)、及びジンクフィンガーヌクレアーゼ(ZFN)が挙げられる。一部の実施形態では、塩基エディターは、天然もしくは修飾タンパク質またはその一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含み、結合したガイド核酸を介して、CRISPR(すなわち、クラスター化して規則的な配置の短い回文配列リピート)を介した核酸の修飾中に核酸配列に結合することができる。そのようなタンパク質は、本明細書において「CRISPRタンパク質」と呼ばれる。したがって、本明細書において、CRISPRタンパク質の全部または一部を含むポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディター(すなわち、塩基エディターの「CRISPRタンパク質由来ドメイン」とも呼ばれる、CRISPRタンパク質の全部または一部をドメインとして含む塩基エディター)が開示される。塩基エディターに組み込まれたCRISPRタンパク質由来ドメインは、野生型または天然バージョンのCRISPRタンパク質と比較して、修飾され得る。例えば、以下に記載するように、CRISPRタンパク質由来ドメインは、CRISPRタンパク質の野生型または天然バージョンに対して、1つ以上の変異、挿入、欠失、再編、及び/または組換えを含み得る。
【0179】
本明細書で使用され得るCasタンパク質には、クラス1及びクラス2が挙げられる。Casタンパク質の非限定的な例として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、(Csn1またはCsx12としても知られる)Cas9、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、Cas12a/Cpf1、Cas12b/C2c1(例えば、配列番号320)、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12g、Cas12h、Cas12i及びCas12j/CasΦ、CARF、DinG、それらの相同体、またはそれらの修飾されたバージョンが挙げられる。CRISPR酵素は、標的配列で、例えば、標的配列内及び/または標的配列の相補配列内で、一方または両方の鎖の切断を指示することができる。例えば、CRISPR酵素は、標的配列の最初または最後のヌクレオチドから約1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、またはそれ以上の塩基対内の一方または両方の鎖の切断を指示することができる。
【0180】
変異型CRISPR酵素が、標的配列を含む標的ポリヌクレオチドの一方または両方の鎖を切断する能力を欠くように、対応する野生型酵素に対して変異導入したCRISPR酵素をコードするベクターを使用することができる。Casタンパク質(例えば、Cas9、Cas12)またはCasドメイン(例えば、Cas9、Cas12)は、野生型の例示的なCasポリペプチドまたはCasドメインに対して、少なくともまたは少なくとも約50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の配列同一性及び/または配列相同性を有するポリペプチドまたはドメインを指し得る。Cas(例えば、Cas9、Cas12)は、欠失、挿入、置換、バリアント、変異、融合、キメラ、またはそれらの任意の組み合わせなどのアミノ酸変化を含み得るCasタンパク質の野生型または修飾形態を指し得る。
【0181】
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、Corynebacterium ulcerans(NCBI参照:NC_015683.1、NC_017317.1)、Corynebacterium diphtheria(NCBI参照:NC_016782.1、NC_016786.1)、Spiroplasma syrphidicola(NCBI参照:NC_021284.1)、Prevotella intermedia(NCBI参照:NC_017861.1)、Spiroplasma taiwanense(NCBI参照:NC_021846.1)、Streptococcus iniae(NCBI参照:NC_021314.1)、Belliella baltica(NCBI参照:NC_018010.1)、Psychroflexus torquis(NCBI参照:NC_018721.1)、Streptococcus thermophilus(NCBI参照:YP_820832.1)、Listeria innocua(NCBI参照:NP_472073.1)、Campylobacter jejuni(NCBI参照:YP_002344900.1)、Neisseria meningitidis(NCBI参照:YP_002342100.1)、Streptococcus pyogenes、またはStaphylococcus aureus由来のCas9の全部または一部を含み得る。
【0182】
Cas9ヌクレアーゼの配列及び構造は、当業者に周知である(例えば、”Complete genome sequence of an Ml strain of Streptococcus pyogenes.”Ferretti et al.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、”CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、及び”A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。Cas9オルソログは、これらに限定されないが、S.pyogenes及びS.thermophilusを含む様々な種で記載されている。さらなる好適なCas9ヌクレアーゼ及び配列は、本開示に基づいて当業者には明らかであり、そのようなCas9ヌクレアーゼ及び配列として、Chylinski,Rhun,and Charpentier,”The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems”(2013)RNA Biology 10:5,726-737に開示されている生物及び遺伝子座に由来するCas9配列が挙げられ、その内容全体が、参照により本明細書に援用される。
【0183】
高忠実度Cas9ドメイン
本開示の一部の態様は、高忠実度Cas9ドメインを提供する。高忠実度Cas9ドメインは、当該技術分野で既知であり、例えば、Kleinstiver,B.P.,et al.”High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects.”Nature 529,490-495(2016)及びSlaymaker,I.M.,et al.”Rationally engineered Cas9 nucleases with improved specificity.”Science 351,84-88(2015)に記載されており、それらの各々の内容全体は、参照により本明細書に援用される。例示的な高忠実度Cas9ドメインを、配列番号321として配列表に示す。一部の実施形態では、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインに対して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を低下させる1つ以上の変異を含む改変Cas9ドメインである。DNAの糖リン酸骨格との静電相互作用が低下した高忠実度Cas9ドメインは、オフターゲット効果がより少ない。一部の実施形態では、Cas9ドメイン(例えば、野生型Cas9ドメイン(配列番号250及び253))は、Cas9ドメインとDNAの糖リン酸骨格との間の会合を低下させる1つ以上の変異を含む。一部の実施形態では、Cas9ドメインは、Cas9ドメインとDNAの糖リン酸骨格との間の会合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%低下させる1つ以上の変異を含む。
【0184】
一部の実施形態では、本明細書で提供されるCas9融合タンパク質のうちのいずれかは、D10A、N497X、R661X、Q695X及び/またはQ926X変異のうちの1つ以上、または本明細書で提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含み、Xは、いずれかのアミノ酸である。一部の実施形態では、高忠実度Cas9酵素は、SpCas9(K855A)、eSpCas9(1.1)、SpCas9-HF1、または超正確Cas9バリアント(HypaCas9)である。一部の実施形態では、修飾されたCas9であるeSpCas9(1.1)は、アラニン置換を含有し、アラニン置換は、HNH/RuvCグルーブと非標的DNA鎖との間の相互作用を弱め、鎖分離及びオフターゲット部位での切断を防止する。同様に、SpCas9-HF1は、Cas9とDNAリン酸骨格との相互作用を破壊するアラニン置換を介してオフターゲット編集を低下させる。HypaCas9は、REC3ドメイン内に、Cas9プルーフリーディング及び標的識別を高める変異(SpCas9 N692A/M694A/Q695A/H698A)を含む。3つ全ての高忠実度酵素は、野生型Cas9よりも少ないオフターゲット編集を生成する。
【0185】
排他性が低下したCas9ドメイン
典型的には、Cas9タンパク質、例えば、S.pyogenesからのCas9(spCas9)は、「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフを必要とし、PAMまたはPAM様モチーフは、CRISPR細菌適応免疫系におけるCas9ヌクレアーゼによって標的とされるDNA配列の直後の2~6つの塩基対のDNA配列である。NGG PAM配列の存在は、特定の核酸領域に結合するために必要とされ、「NGG」における「N」は、アデノシン(A)、チミジン(T)またはシトシン(C)であり、Gは、グアノシンである。これにより、ゲノム内で所望の塩基を編集する能力が制限され得る。一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置(例えば、PAMの上流にある標的塩基を含む領域)に配置される必要があり得る。例えば、Komor,A.C.,et al.,”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)を参照されたい(その内容全体が、参照により本明細書に援用される)。PAM配列に結合することができるspCas9タンパク質の例示的なポリペプチド配列を、配列番号250、254、及び322~325として配列表に示す。したがって、一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、正準(例えば、NGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非正準PAM配列に結合するCas9ドメインは、当該技術分野において記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,「Engineered CRISPR-Cas9 nucleases with altered PAM specificities」Nature 523,481-485(2015)、及びKleinstiver,B.P.,et al.,「Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition」Nature Biotechnology 33,1293-1298(2015)に記載されている(各々の内容全体が、参照により本明細書に援用される)。
【0186】
ニッカーゼ
一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ニッカーゼドメインを含むことができる。本明細書において、「ニッカーゼ」という用語は、二重鎖核酸分子(例えばDNA)の2本鎖のうちの1つの鎖のみを切断することができるヌクレアーゼドメインを含む、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指す。一部の実施形態では、ニッカーゼは、活性ポリヌクレオチドプログラマブルヌクレオチド結合ドメインに1つ以上の変異を導入することによって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの完全な触媒活性(例えば、天然)形態に由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインが、Cas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、D10A変異及び位置840のヒスチジンを含み得る。そのような実施形態では、残基H840は、触媒活性を保持し、それによって、核酸二重鎖の一本鎖を切断することができる。別の例では、Cas9由来のニッカーゼドメインは、H840A変異を含んでもよいが、位置10のアミノ酸残基はDのままである。一部の実施形態では、ニッカーゼは、ニッカーゼ活性に必要とされないヌクレアーゼドメインの全部または一部を除去することによって、完全に触媒活性な(例えば、天然の)形態のポリヌクレオチドプログラマブルヌクレオチド結合ドメインに由来し得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインがCas9に由来するニッカーゼドメインを含む場合、Cas9由来ニッカーゼドメインは、RuvCドメインまたはHNHドメインの全部または一部の欠失を含み得る。
【0187】
一部の実施形態では、野生型Cas9は、以下のアミノ酸配列に対応するか、またはそれを含む:

【0188】
一部の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン、Cas12由来ニッカーゼドメイン)を含む塩基エディターによって切断される、核酸二重鎖標的ポリヌクレオチド配列の鎖は、塩基エディターによって編集されない鎖である(すなわち、塩基エディターによって切断される鎖は、編集される塩基を含む鎖と反対である)。他の実施形態では、ニッカーゼドメイン(例えば、Cas9由来ニッカーゼドメイン、Cas12由来ニッカーゼドメイン)を含む塩基エディターは、編集のために標的とされているDNA分子の鎖を切断することができる。そのような実施形態では、非標的鎖は切断されない。
【0189】
一部の実施形態では、Cas9ヌクレアーゼは、不活性(例えば、不活性化)DNA切断ドメインを有し、すなわち、「nCas9」タンパク質(「ニッカーゼ」Cas9の場合)と呼ばれるニッカーゼである。Cas9ニッカーゼは、二重鎖核酸分子(例えば、二重鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク質であり得る。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の標的鎖を切断するが、これはCas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対形成する(相補的である)鎖を切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、D10A変異を含み、840位にヒスチジンを有する。一部の実施形態では、Cas9ニッカーゼは、二重鎖核酸分子の非標的の未塩基編集鎖を切断し、つまり、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えば、sgRNA)と塩基対を形成していない鎖を切断することを意味する。一部の実施形態では、Cas9ニッカーゼは、H840A変異を含み、位置10にアスパラギン酸残基、または対応する変異を有する。一部の実施形態では、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。さらなる好適なCas9ニッカーゼは、本開示及び当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。
【0190】
例示的な触媒性Cas9ニッカーゼ(nCas9)のアミノ酸配列は、以下の通りである:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号254)
【0191】
Cas9ヌクレアーゼは、2つの機能的なエンドヌクレアーゼドメイン(RuvC及びHNH)を有する。Cas9は、標的結合時にコンフォメーション変化を起こし、ヌクレアーゼドメインを標的DNAの反対側の鎖を切断するように位置付ける。Cas9媒介性DNA切断の最終結果は、(PAM配列の約3~4ヌクレオチド上流の)標的DNA内の二本鎖切断(DSB)である。次いで、得られたDSBは、以下の2つの一般的な修復経路のうちの1つによって修復される:(1)効率的だがエラーを起こしやすい非相同末端結合(NHEJ)経路、または(2)効率は低いが忠実度が高い相同組換え修復(HDR)経路。
【0192】
非相同末端結合(NHEJ)及び/または相同組換え修復(HDR)の「効率」は、任意の好都合な方法によって計算することができる。例えば、一部の実施形態では、効率は、成功したHDRのパーセンテージで表すことができる。例えば、サーベイヤーヌクレアーゼアッセイを使用して切断生成物を生成することができ、生成物と基質との比を使用してパーセンテージを計算することができる。例えば、サーベイヤーヌクレアーゼ酵素を使用して、HDRの成功で得られる新たに組み込まれた制限配列を含むDNAを、直接切断することができる。より多くの基質の切断は、より高いパーセントのHDRを示す(より高い効率のHDR)。例示的な例として、HDRの割合(パーセンテージ)は、以下の式[(切断生成物)/(基質+切断生成物)]を使用して計算することができる(例えば、(b+c)/(a+b+c)。式中、「a」はDNA基質のバンド強度であり、「b」及び「c」は切断生成物のバンド強度である)。
【0193】
一部の実施形態では、効率は、成功したNHEJのパーセンテージで表し得る。例えば、T7エンドヌクレアーゼIアッセイを使用して、切断生成物を生成することができ、生成物と基質との比を使用して、NHEJの割合を計算することができる。T7エンドヌクレアーゼIは、野生型及び変異型DNA鎖のハイブリダイゼーションから生じる不一致のヘテロ二重鎖DNAを切断する(NHEJは、元の切断部位で小さなランダムな挿入または欠失(インデル)を生成する)。より多くの切断は、より高いパーセントのNHEJ(より高い効率のNHEJ)を示す。例示的な例として、NHEJの割合(パーセンテージ)を、以下の式を使用して計算することができる:(1-(1-(b+c)/(a+b+c))1/2)×100(式中、「a」は、DNA基質のバンド強度であり、「b」及び「c」は、切断産物である)(Ran et.al.,Cell.2013 Sep.12;154(6):1380-9及びRan et al.,Nat Protoc.2013 Nov.;8(11):2281-2308)。
【0194】
NHEJ修復経路は、最も活性な修復機構であり、DSB部位において小さなヌクレオチドの挿入または欠失(インデル)を頻繁に引き起こす。Cas9及びgRNA、またはガイドポリヌクレオチドを発現する細胞集団は、多様な変異をもたらし得るため、NHEJ媒介性DSB修復のランダム性は、重要な実用的な意味を有する。ほとんどの実施形態では、NHEJは、標的DNA内に小さなインデルを生じさせ、標的遺伝子のオープンリーディングフレーム(ORF)内の未熟終止コドンにつながるアミノ酸の欠失、挿入、またはフレームシフト変異をもたらす。理想的な最終結果は、標的遺伝子内の機能喪失変異である。
【0195】
NHEJ媒介性DSB修復は、しばしば遺伝子のオープンリーディングフレームを破壊するが、相同組換え修復(HDR)を使用して、単一のヌクレオチド変化から大きな挿入(例えば、フルオロフォアまたはタグの添加)までの範囲の特定のヌクレオチド変化を生成することができる。
【0196】
HDRを遺伝子編集に利用するために、所望の配列を含むDNA修復鋳型を、gRNA(複数可)及びCas9またはCas9ニッカーゼを用いて目的の細胞型に送達することができる。修復鋳型は、所望の編集、ならびに標的のすぐ上流及び下流の追加の相同配列(左相同性アーム及び右相同性アームと称される)を含むことができる。各相同性アームの長さは、導入される変化のサイズに依存し得、より大きな挿入は、より長い相同性アームを必要とする。修復鋳型は、一本鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであってもよい。Cas9、gRNA、及び外因性修復鋳型を発現する細胞でさえ、HDRの効率は概して低い(修飾アレルの10%未満)。HDRは、細胞周期のS期及びG2期の間に行われるため、HDRの効率は、細胞を同期させることによって増強され得る。NHEJに関与する遺伝子を化学的または遺伝的に阻害することで、HDR頻度を増加させることもできる。
【0197】
一部の実施形態では、Cas9は、修飾Cas9である。所与のgRNA標的化配列は、部分的な相同性が存在するゲノム全体に追加の部位を有し得る。これらの部位はオフターゲットと呼ばれ、gRNAを設計する際に考慮する必要がある。gRNA設計の最適化に加えて、Cas9への修飾を通じて、CRISPRの特異性を高めることもできる。Cas9は、RuvCとHNHの2つのヌクレアーゼドメインの複合活性を介して二本鎖切断(DSB)を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは、1つのヌクレアーゼドメインを保持し、DSBではなくDNAニックを生成する。ニッカーゼシステムは、特定の遺伝子編集のためのHDRを介した遺伝子編集と組み合わせることもできる。
【0198】
触媒的に不活性なヌクレアーゼ
また、触媒的に不活性な(すなわち、標的ポリヌクレオチド配列を切断することができない)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターも本明細書に提供される。本明細書において、用語「触媒的に不活性な(catalytically dead)」及び「ヌクレアーゼ不活性型(nuclease dead)」は、核酸の鎖を切断することができないという結果をもたらす1つ以上の変異及び/または欠失を有するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを指すために同じ意味で用いられる。一部の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメイン塩基エディターは、1つ以上のヌクレアーゼドメインにおける特定の点変異の結果として、ヌクレアーゼ活性を欠損し得る。例えば、Cas9ドメインを含む塩基エディターの場合、Cas9はD10A変異及びH840A変異の両方を含み得る。そのような変異は、両方のヌクレアーゼドメインを不活性化し、それによってヌクレアーゼ活性の喪失をもたらす。他の実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、触媒ドメイン(例えば、RuvC1及び/またはHNHドメイン)の全部または一部の1つ以上の欠失を含み得る。さらなる実施形態では、触媒的に不活性なポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、点変異(例えば、D10AまたはH840A)、及びヌクレアーゼドメインの全部または一部の欠失を含む。dCas9ドメインは、当該技術分野で公知であり、例えば、Qi et al.,”Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression.”Cell.2013;152(5):1173-83に記載されており、その内容全体は、参照により本明細書に援用される。
【0199】
さらなる好適なヌクレアーゼ不活性dCas9ドメインは、本開示及び当該分野の知識に基づいて、当業者には明らかであり、本開示の範囲内である。そのようなさらなる例示的で好適なヌクレアーゼ不活性Cas9ドメインとして、D10A/H840A、D10A/D839A/H840A、及びD10A/D839A/H840A/N863A変異体ドメインが挙げられるが、これらに限定されない(例えば、Prashant et al.,CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering.Nature Biotechnology.2013;31(9):833-838を参照されたく、その内容全体は、参照により本明細書に援用される)。
【0200】
一部の実施形態では、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1つ以上の変異を有するCas9アミノ酸配列に対応するか、または部分的もしくは全体的にそれを含む。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10X変異及びH840X変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含み、Xは、任意のアミノ酸変化である。一部の実施形態では、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A変異及びH840A変異、または本明細書中で提供する任意のアミノ酸配列における対応する変異を含む。一部の実施形態では、ヌクレアーゼ不活性Cas9ドメインは、クローニングベクターpPlatTET-gRNA2(受託番号BAV54124)に記載されているアミノ酸配列を含む。
【0201】
一部の実施形態では、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、RuvCドメインの機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A(アミノ酸位置10でのアスパラギン酸からアラニンへ)を有し、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖標的核酸を切断する場合に、二本鎖切断(DSB)の代わりに、一本鎖切断(SSB)を生じさせる)(例えば、Jinek et al.,Science.2012 Aug.17;337(6096):816-21を参照のこと)。
【0202】
一部の実施形態では、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、バリアントCas9タンパク質は、HNHドメイン(RuvC/HNH/RuvCドメインモチーフ)の機能を低下させる変異(アミノ酸置換)を有し得る。非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A(アミノ酸位置840のヒスチジンからアラニンへ)を有し、したがって、ガイド標的配列の非相補鎖を切断することができるが、ガイド標的配列の相補鎖を切断する能力が低下している(したがって、バリアントCas9タンパク質が二本鎖ガイド標的配列を切断した場合に、DSBではなくSSBが生じる)。そのようなCas9タンパク質は、ガイド標的配列(例えば、一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば、一本鎖ガイド標的配列)に結合する能力は保持している。
【0203】
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、W476A及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。
【0204】
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。
【0205】
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、D10A、W476A、及びW1126A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。一部の実施形態では、バリアントCas9は、Cas9 HNHドメイン(A840H)の位置840に触媒His残基を回復させている。
【0206】
別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有し、それにより、このポリペプチドは標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持している。一部の実施形態では、バリアントCas9タンパク質がW476A及びW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1127A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、いくつかのそのような実施形態では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、本方法は、PAM配列を必要としない。言い換えれば、一部の実施形態では、そのようなバリアントCas9タンパク質を結合方法で使用する場合、本方法は、ガイドRNAを含むことができるが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的化セグメントによって提供される)。他の残基は、上記の効果を達成するために変異させることができる(すなわち、1つまたは他のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。
【0207】
一部の実施形態では、触媒活性が低下したバリアントCas9タンパク質(例えば、Cas9タンパク質が、D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987変異(例えば、D10A、G12A、G17A、E762A、H840A、N854A、N863A、H982A、H983A、A984A、及び/またはD986A)を有する場合)、バリアントCas9タンパク質は、それがガイドRNAと相互作用する能力を保持する限り、依然として部位特異的な様式で標的DNAに結合することができる(依然としてガイドRNAによって標的DNA配列に誘導されるため)。
【0208】
一部の実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9-VRER、xCas9(sp)、saCas9、saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。
【0209】
一部の実施形態では、Cas9ドメインは、Staphylococcus aureus(SaCas9)由来のCas9ドメインである。一部の実施形態では、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレアーゼ不活性SaCas9(SaCas9d)、またはSaCas9ニッカーゼ(SaCas9n)である。一部の実施形態では、SaCas9は、N579A変異または本明細書とともに提出される配列表で提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。
【0210】
一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメイン、SaCas9dドメインまたはSaCas9nドメインは、NNGRRTまたはNNGRRV PAM配列を有する核酸配列に結合することができる。一部の実施形態では、SaCas9ドメインは、E781X、N967X、及びR1014X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SaCas9ドメインは、E781K、N967K、及びR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SaCas9ドメインは、E781K、N967K、またはR1014H変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。
【0211】
一部の実施形態では、融合タンパク質に存在するCas9ドメインのうちの1つは、PAM配列を必要としないガイドヌクレオチド配列プログラマブルDNA結合タンパク質ドメインで置き換えられ得る。一部の実施形態では、Cas9は、SaCas9である。SaCas9の残基A579は、N579から変異して、SaCas9ニッカーゼを得ることができる。残基K781、K967及びH1014は、E781、N967及びR1014から変異して、SaKKH Cas9を得ることができる。
【0212】
一部の実施形態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E及びT1337R(SpCas9-MQKFRAER)を含み、改変PAM 5’-NGC-3’に対する特異性を有する修飾されたSpCas9を使用した。
【0213】
S.pyogenes Cas9の代替物としては、哺乳類細胞において切断活性を示すCpf1ファミリー由来のRNAガイドエンドヌクレアーゼを挙げることができる。Prevotella及びFrancisella 1由来のCRISPR(CRISPR/Cpf1)は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf1は、クラスIIのCRISPR/CasシステムのRNAガイドエンドヌクレアーゼである。この後天性免疫機構は、Prevotella菌及びFrancisella菌で見られる。Cpf1遺伝子は、CRISPR遺伝子座と関連付けられ、ガイドRNAを使用してウイルスDNAを発見及び切断するエンドヌクレアーゼをコードしている。Cpf1は、Cas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9システムのいくつかの制約を克服している。Cas9ヌクレアーゼとは異なり、Cpf1媒介性DNA切断は、短い3’オーバーハングを有する二本鎖切断をもたらす。Cpf1の互い違い(staggered)の切断パターンは、従来の制限酵素によるクローニングに類似した定方向遺伝子導入の可能性を開き、遺伝子編集の効率を高めることができる。上に記載のCas9バリアント及びオルソログと同様に、Cpf1はまた、CRISPRによって標的化され得る部位の数を、SpCas9に適したNGG PAM部位を欠くATリッチ領域またはATリッチゲノムまで拡張することができる。Cpf1遺伝子座は、混合されたアルファ/ベータドメイン、RuvC-I、続いてヘリカル領域、RuvC-II、及びジンクフィンガー様ドメインを含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメインを有する。
【0214】
さらに、Cpf1は、Cas9とは異なり、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のアルファヘリカル認識ローブを有しない。Cpf1 CRISPR-Casドメインアーキテクチャは、Cpf1が機能的に固有であり、クラス2のV型CRISPRシステムとして分類されることを示す。Cpf1遺伝子座は、II型システムよりもI型及びIII型システムに類似したCas1、Cas2、及びCas4タンパク質をコードする。機能的なCpf1は、トランス活性化CRISPR RNA(tracrRNA)を必要とせず、したがって、CRISPR(crRNA)のみが必要である。これは、Cpf1がCas9よりも小さいだけでなく、より小さなsgRNA分子(Cas9の約半分のヌクレオチド数)を有するため、ゲノム編集に有益である。Cpf1-crRNA複合体は、Cas9によって標的とされるGリッチPAMとは対照的に、プロトスペーサー隣接モチーフ5’-YTN-3’または5’-TTN-3’を特定することによって標的DNAまたはRNAを切断する。PAMの識別後、Cpf1は、4または5ヌクレオチドのオーバーハングを有する粘着末端様のDNA二本鎖切断を導入する。
【0215】
一部の実施形態では、Cas9は、改変PAM配列に対する特異性を有するCas9バリアントである。一部の実施形態では、追加のCas9バリアント及びPAM配列は、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)に記載されており、その全体が、参照により本明細書に援用される。一部の実施形態では、Cas9バリアントは、特定のPAM要件を有しない。一部の実施形態では、Cas9バリアント、例えば、SpCas9バリアントは、NRNH PAMに対する特異性を有し、Rは、AまたはGであり、Hは、A、C、またはTである。一部の実施形態では、SpCas9バリアントは、PAM配列AAA、TAA、CAA、GAA、TAT、GAT、またはCACに対する特異性を有する。一部の実施形態では、SpCas9バリアントは、1114、1134、1135、1137、1139、1151、1180、1188、1211、1218、1219、1221、1249、1256、1264、1290、1318、1317、1320、1321、1323、1332、1333、1335、1337、もしくは1339の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1135、1218、1219、1221、1249、1320、1321、1323、1332、1333、1335、もしくは1337の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1134、1135、1137、1139、1151、1180、1188、1211、1219、1221、1256、1264、1290、1318、1317、1320、1323、1333の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1131、1135、1150、1156、1180、1191、1218、1219、1221、1227、1249、1253、1286、1293、1320、1321、1332、1335、1339の位置、またはそれらの対応する位置に、アミノ酸置換を含む。一部の実施形態では、SpCas9バリアントは、1114、1127、1135、1180、1207、1219、1234、1286、1301、1332、1335、1337、1338、1349の位置、またはそれらの対応する位置に、アミノ酸置換を含む。SpCas9バリアントの例示的なアミノ酸置換及びPAM特異性は、表2A~2Dに示される。
【0216】
【表2A】

【0217】
【表2B】
【0218】
【表2C】

【0219】
【表2D】
【0220】
変更されたPAM認識を有するさらなる例示的なCas9(例えば、SaCas9)ポリペプチドは、Kleinstiver,et al.”Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition,”Nature Biotechnology,33:1293-1298(2015)DOI:10.1038/nbt.3404に記載されており、その開示は、その全体が全ての目的で参照により本明細書に援用される。一部の実施形態では、改変E782K、N929R、N968K及び/またはR1015Hのうちの1つ以上を含むCas9バリアント(例えば、SaCas9バリアント)は、NNNRRTまたはNNHRRT PAM配列での、参照ポリペプチド(例えば、SaCas9)に対して増加した編集活性への特異性を有するかまたはそれに関連し、Nは、いずれかのヌクレオチドを表し、Hは、G以外の(すなわち、「Gでない」)いずれかのヌクレオチドを表し、Rは、プリンを表す。実施形態では、Cas9バリアント(例えば、SaCas9バリアント)は、改変E782K、N968K及びR1015H、または改変E782K、K929R及びR1015Hを含む。
【0221】
一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)は、微生物CRISPR-Casシステムの単一エフェクターである。微生物CRISPR-Casシステムの単一エフェクターには、限定されないが、Cas9、Cpf1、Cas12b/C2c1、及びCas12c/C2c3が含まれる。通常、微生物CRISPR-Casシステムは、クラス1及びクラス2システムに分けられる。クラス1システムは、マルチサブユニットエフェクター複合体を有し、クラス2システムは、単一のタンパク質エフェクターを有する。例えば、Cas9及びCpf1は、クラス2エフェクターである。Cas9及びCpf1に加えて、3つの異なるクラス2のCRISPR-Casシステム(Cas12b/C2c1及びCas12c/C2c3)が、Shmakov et al.,”Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems”,Mol.Cell,2015 Nov.5;60(3):385-397により記載され、その内容全体は、参照により本明細書に援用される。システムのうちの2つのエフェクター、Cas12b/C2c1及びCas12c/C2c3は、Cpf1に関連するRuvC様エンドヌクレアーゼドメインを含む。第3のシステムは、2つの予測HEPN RNaseドメインを有するエフェクターを含む。成熟CRISPR RNAの生成は、Cas12b/C2c1によるCRISPR RNAの生成とは異なり、tracrRNAに依存しない。Cas12b/C2c1は、DNA切断に関してCRISPR RNA及びtracrRNAの両方に依存する。
【0222】
一部の実施形態では、napDNAbpは環状置換体である(例えば、配列番号326)。
【0223】
キメラ単一分子ガイドRNA(sgRNA)と複合体を形成しているAlicyclobaccillus acidoterrastris Cas12b/C2c1(AacC2c1)の結晶構造が報告されている。例えば、Liu et al.,”C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism”,Mol.Cell,2017 Jan.19;65(2):310-322を参照されたく、その内容全体は、参照により本明細書に援用される。結晶構造は、三元複合体として標的DNAに結合したAlicyclobacillus acidoterrestris C2c1でも報告されている。例えば、Yang et al.,”PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease”,Cell,2016 Dec.15;167(7):1814-1828を参照されたく、その内容全体は、参照により本明細書に援用される。標的DNA鎖と非標的DNA鎖の両方で、単一のRuvC触媒ポケット内に独立して配置され、Cas12b/C2c1を介した切断により、標的DNAのねじれ形の7か所のヌクレオチド切断を生じさせる、AacC2c1の触媒能力のあるコンフォメーションが捕捉されている。Cas12b/C2c1の三元複合体と、以前に同定されたCas9及びCpf1対応物との構造比較は、CRISPR-Cas9システムによって使用されるメカニズムの多様性を示している。
【0224】
一部の実施形態では、本明細書中で提供する融合タンパク質のいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12b/C2c1またはCas12c/C2c3タンパク質であり得る。一部の実施形態では、napDNAbpは、Cas12b/C2c1タンパク質である。一部の実施形態では、napDNAbpは、Cas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然のCas12b/C2c1またはCas12c/C2c3タンパク質である。一部の実施形態では、napDNAbpは、本明細書中で提供するnapDNAbp配列のいずれか1つと、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12b/C2c1またはCas12c/C2c3もまた、本開示に従って使用してもよいことを理解されたい。
【0225】
一部の実施形態では、napDNAbpは、Cas12cを指す。一部の実施形態では、Cas12cタンパク質は、Cas12c1(配列番号327)またはCas12c1のバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12c2(配列番号328)またはCas12c2のバリアントである。一部の実施形態では、Cas12タンパク質は、Oleiphilus種HI0009(すなわち、OspCas12c、配列番号329)またはOspCas12cのバリアント由来のCas12cタンパク質である。これらのCas12c分子は、Yan et al.,”Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されており、その内容全体は、参照により本明細書に援用される。一部の実施形態では、napDNAbpは、天然のCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然のCas12c1、Cas12c2、またはOspCas12cタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12c1、Cas12c2、またはOspCas12cタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12c1、Cas12c2、またはOspCas12cもまた、本開示に従って使用してもよいことを理解されたい。
【0226】
一部の実施形態では、napDNAbpとは、例えば、Yan et al.,”Functionally Diverse Type V CRISPR-Cas Systems,”Science,2019 Jan.4;363:88-91に記載されている、Cas12g、Cas12hまたはCas12iを指し、各々の内容全体は、参照により本明細書に援用される。例示的なCas12g、Cas12h、及びCas12iポリペプチド配列を、配列番号330~333として配列表に示す。10テラバイトを超える配列データを集約することにより、Cas12g、Cas12h、及びCas12iなどの、以前に特徴付けられたクラスVタンパク質と弱い類似性を示すV型Casタンパク質の新しい分類が特定された。一部の実施形態では、Cas12タンパク質は、Cas12gまたはCas12gのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12hまたはCas12hのバリアントである。一部の実施形態では、Cas12タンパク質は、Cas12iまたはCas12iのバリアントである。他のRNAガイドDNA結合タンパク質が、napDNAbpとして使用されてもよく、本開示の範囲内であることを理解されたい。一部の実施形態では、napDNAbpは、天然のCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然のCas12g、Cas12h、またはCas12iタンパク質である。一部の実施形態では、napDNAbpは、本明細書に記載の任意のCas12g、Cas12h、またはCas12iタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。他の細菌種由来のCas12g、Cas12h、またはCas12iもまた、本開示に従って使用してもよいことを理解されたい。一部の実施形態では、Cas12iは、Cas12i1またはCas12i2である。
【0227】
一部の実施形態では、本明細書で提供する融合タンパク質のいずれかの核酸プログラマブルDNA結合タンパク質(napDNAbp)は、Cas12j/CasΦタンパク質であり得る。Cas12j/CasΦは、Pausch et al.,”CRISPR-CasΦ from huge phages is a hypercompact genome editor,”Science,17 July 2020,Vol.369,Issue 6501,pp.333-337に記載されており、これは、その全体が参照により本明細書に援用される。一部の実施形態では、napDNAbpは、天然のCas12j/CasΦタンパク質と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。一部の実施形態では、napDNAbpは、天然のCas12j/CasΦタンパク質である。一部の実施形態では、napDNAbpは、ヌクレアーゼ不活性(「不活性型(dead)」)Cas12j/CasΦタンパク質である。他の種に由来するCas12j/CasΦもまた、本開示に従って使用してもよいことを理解されたい。
【0228】
内部挿入を伴う融合タンパク質
本明細書において、核酸プログラマブル核酸結合タンパク質、例えば、napDNAbpに融合させた異種ポリペプチドを含む融合タンパク質を提供する。以下に詳述されるように、本開示は、異種ポリペプチドを特徴とする融合タンパク質をコードするポリヌクレオチドを提供し、ポリヌクレオチドは、融合タンパク質の異種ドメインの全てまたは一部分をコードするオープンリーディングフレーム内のイントロンを含む。異種ポリペプチドは、天然または野生型napDNAbpポリペプチド配列には見られないポリペプチドであり得る。異種ポリペプチドは、napDNAbpのC末端、napDNAbpのN末端でnapDNAbpに融合するか、またはnapDNAbpの内部位置に挿入することができる。一部の実施形態では、異種ポリペプチドは、デアミナーゼ(例えば、アデノシンデアミナーゼのシチジン)またはその機能的断片である。例えば、融合タンパク質は、Cas9またはCas12(例えば、Cas12b/C2c1)ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含むことができる。一部の実施形態では、シチジンデアミナーゼは、APOBECデアミナーゼ(例えば、APOBEC1)である。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10またはTadA*8)である。一部の実施形態では、TadAは、TadA*8またはTadA*9である。本明細書に記載されるTadA配列(例えば、TadA7.10またはTadA*8)は、上記の融合タンパク質に好適なデアミナーゼである。
【0229】
一部の実施形態では、融合タンパク質は、以下の構造:
NH2-[napDNAbpのN末端断片]-[デアミナーゼ]-[napDNAbpのC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[アデノシンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[アデノシンデアミナーゼ]-[Cas12のC末端断片]-COOH、
NH2-[Cas9のN末端断片]-[シチジンデアミナーゼ]-[Cas9のC末端断片]-COOH、
NH2-[Cas12のN末端断片]-[シチジンデアミナーゼ]-[Cas12のC末端断片]-COOHを含み、
式中、「]-[」の各インスタンスは、任意選択のリンカーである。
【0230】
デアミナーゼは、円順列変異体(circular permutant)デアミナーゼであり得る。例えば、デアミナーゼは、円順列変異体アデノシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼは、TadA参照配列において番号付けされたアミノ酸残基116、136または65で環状に置換された円順列変異型TadAである。
【0231】
融合タンパク質は、複数のデアミナーゼを含み得る。融合タンパク質は、例えば、1、2、3、4、5つ、またはそれ以上のデアミナーゼを含み得る。一部の実施形態では、融合タンパク質は、1つまたは2つのデアミナーゼを含む。融合タンパク質の2つ以上のデアミナーゼは、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはそれらの組み合わせであり得る。2つ以上のデアミナーゼは、ホモ二量体またはヘテロ二量体であり得る。2つ以上のデアミナーゼは、napDNAbpにおいて直列に挿入され得る。一部の実施形態では、2つ以上のデアミナーゼは、napDNAbpにおいて直列ではない場合がある。
【0232】
一部の実施形態では、融合タンパク質内のnapDNAbpは、Cas9ポリペプチドまたはその断片である。Cas9ポリペプチドは、バリアントCas9ポリペプチドであり得る。一部の実施形態では、Cas9ポリペプチドは、Cas9ニッカーゼ(nCas9)ポリペプチドまたはその断片である。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼ不活性型Cas9(dCas9)ポリペプチドまたはその断片である。融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドであり得る。いくつかの場合では、融合タンパク質内のCas9ポリペプチドは、全長のCas9ポリペプチドでなくてもよい。Cas9ポリペプチドは、例えば、天然のCas9タンパク質と比較して、N末端またはC末端で短縮され得る。Cas9ポリペプチドは、環状に置換されたCas9タンパク質であり得る。Cas9ポリペプチドは、Cas9ポリペプチドの断片、一部、またはドメインであり得るが、それは依然として標的ポリヌクレオチド及びガイド核酸配列に結合することができる。
【0233】
一部の実施形態では、Cas9ポリペプチドは、Streptococcus pyogenes Cas9(SpCas9)、Staphylococcus aureus Cas9(SaCas9)、Streptococcus thermophilus 1 Cas9(St1Cas9)、または本明細書に記載されるCas9ポリペプチドのうちのいずれかの断片もしくはバリアントである。
【0234】
一部の実施形態では、融合タンパク質は、Cas9内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、アデノシンデアミナーゼを、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。
【0235】
アデノシンデアミナーゼ及びシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas9(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9(アデノシンデアミナーゼ)]-COOH、
NH2-[Cas9(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH2-[アデノシンデアミナーゼ]-[Cas9(シチジンデアミナーゼ)]-COOH。
【0236】
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
【0237】
様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8を、Cas9内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、TadA*8を、Cas9内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、TadA*8を、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas9内で融合させ、TadA*8を、N末端に融合させる。TadA*8及びシチジンデアミナーゼならびにCas9を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas9(TadA*8)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9(TadA*8)]-COOH、
NH2-[Cas9(シチジンデアミナーゼ)]-[TadA*8]-COOHまたは
NH2-[TadA*8]-[Cas9(シチジンデアミナーゼ)]-COOH。
【0238】
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
【0239】
異種ポリペプチド(例えば、デアミナーゼ)は、例えば、napDNAbpが標的ポリヌクレオチド及びガイド核酸に結合する能力を保持するように、好適な位置でnapDNAbp(例えば、Cas9またはCas12(例えば、Cas12b/C2c1))に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、デアミナーゼ(例えば、塩基編集活性)またはnapDNAbp(例えば、標的核酸及びガイド核酸に結合する能力)の機能を損なうことなく、napDNAbpに挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、結晶学的研究によって示されるように、例えば、無秩序領域、または高温因子(high temperature factor)もしくはB因子を含む領域で、napDNAbpに挿入することができる。タンパク質の秩序領域、無秩序領域、または非構造化領域(例えば、溶媒曝露領域及びループ)は、構造または機能を損なうことなく、挿入に使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、可動性ループ(flexible loop)領域または溶媒曝露領域においてnapDNAbpに挿入することができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、Cas9またはCas12b/C2c1ポリペプチドの可動性ループに挿入される。
【0240】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)の挿入位置は、Cas9ポリペプチドの結晶構造のB因子分析によって決定される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、平均B因子よりも高い(例えば、全タンパク質または無秩序領域を含むタンパク質ドメインと比較して、より高いB因子)を含むCas9ポリペプチドの領域に挿入される。B因子または温度因子は、(例えば、温度依存性の原子振動または結晶格子内の静的乱れ(static disorder)の結果としての)原子のそれらの平均位置からの変動を示し得る。骨格原子の高いB因子(例えば、平均よりも高いB因子)は、比較的高い局所移動度(local mobility)を有する領域を示し得る。このような領域は、構造または機能を損なうことなくデアミナーゼを挿入するために使用することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、全タンパク質の平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有するCα原子を有する残基を含む位置に挿入することができる。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基を含むCas9タンパク質ドメインの平均B因子よりも、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、または200%超であるB因子を有する残基を含む位置に挿入することができる。平均よりも高いB因子を含むCas9ポリペプチドの位置は、例えば、上記のCas9参照配列において番号付けされた残基768、792、1052、1015、1022、1026、1029、1067、1040、1054、1068、1246、1247、及び1248を含むことができる。平均B因子よりも高いB因子を含むCas9ポリペプチド領域は、例えば、上記のCas9参照配列において番号付けされた残基792~872、792~906、及び2~791を含むことができる。
【0241】
異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、791-792、792-793、1015-1016、1022-1023、1026-1027、1029-1030、1040-1041、1052-1053、1054-1055、1067-1068、1068-1069、1247-1248、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置769-770、792-793、793-794、1016-1017、1023-1024、1027-1028、1030-1031、1041-1042、1053-1054、1055-1056、1068-1069、1069-1070、1248-1249、もしくは1249-1250、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされた残基768、791、792、1015、1016、1022、1023、1026、1029、1040、1052、1054、1067、1068、1069、1246、1247、及び1248、または別のCas9ポリペプチドの対応するアミノ酸残基。挿入位置に関して、上記のCas9参照配列への言及は、例示的な目的のためであることを理解されたい。本明細書で論じられる挿入は、上記のCas9参照配列のCas9ポリペプチド配列に限定されないが、バリアントCas9ポリペプチド(例えば、Cas9ニッカーゼ(nCas9)、ヌクレアーゼ不活性型Cas9(dCas9)、ヌクレアーゼドメインを欠くCas9バリアント、切断型Cas9、またはHNHドメインを部分的または完全に欠くCas9ドメイン)における対応する場所における挿入を含む。
【0242】
異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置768-769、792-793、1022-1023、1026-1027、1029-1030、1040-1041、1068-1069、もしくは1247-1248、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、上記のCas9参照配列において番号付けされたアミノ酸位置769-770、793-794、1023-1024、1027-1028、1030-1031、1041-1042、1069-1070、もしくは1248-1249、またはそれらの対応するアミノ酸位置の間に挿入される。一部の実施形態では、異種ポリペプチドは、以下からなる群から選択されるアミノ酸残基を置き換える:上記のCas9参照配列において番号付けされたアミノ酸残基768、792、1022、1026、1040、1068、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0243】
異種ポリペプチド(例えば、デアミナーゼ)は、本明細書に記載のアミノ酸残基または別のCas9ポリペプチドの対応するアミノ酸残基において、napDNAbpに挿入され得る。一実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、以下からなる群から選択されるアミノ酸残基において、napDNAbpに挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1002、1003、1025、1052~1056、1242~1247、1061~1077、943~947、686~691、569~578、530~539、及び1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基。デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基のN末端またはC末端で挿入されるか、または残基を置き換えることができる。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、残基のC末端において挿入される。
【0244】
一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、以下からなる群から選択されるアミノ酸残基において挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼ(例えば、TadA)は、上記のCas9参照配列において番号付けされた残基792~872、792~906、もしくは2~791、または別のCas9ポリペプチドの対応するアミノ酸残基の代わりに挿入される。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、アデノシンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0245】
一部の実施形態では、シチジンデアミナーゼ(例えば、APOBEC1)は、以下からなる群から選択されるアミノ酸残基において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のN末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸のC末端において挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。一部の実施形態では、シチジンデアミナーゼは、以下からなる群から選択されるアミノ酸を置き換えるために挿入される:上記のCas9参照配列において番号付けされたアミノ酸残基1016、1023、1029、1040、1069、及び1247、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0246】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基768、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0247】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791もしくはアミノ酸残基792、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基791のN末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791のC末端もしくはアミノ酸792のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸791もしくはアミノ酸792、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0248】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1016、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0249】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のN末端もしくはアミノ酸残基1023のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022のC末端もしくはアミノ酸残基1023のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1022もしくはアミノ酸残基1023、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0250】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のN末端もしくはアミノ酸残基1029のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026のC末端もしくはアミノ酸残基1029のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1026もしくはアミノ酸残基1029、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0251】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1040、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0252】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のN末端もしくはアミノ酸残基1054のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052のC末端もしくはアミノ酸残基1054のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1052もしくはアミノ酸残基1054、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0253】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のN末端もしくはアミノ酸残基1068のN末端もしくはアミノ酸残基1069のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067のC末端もしくはアミノ酸残基1068のC末端もしくはアミノ酸残基1069のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1067もしくはアミノ酸残基1068もしくはアミノ酸残基1069、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0254】
一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のN末端もしくはアミノ酸残基1247のN末端もしくはアミノ酸残基1248のN末端、または別のCas9ポリペプチドの対応するアミノ酸残基のN末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246のC末端もしくはアミノ酸残基1247のC末端もしくはアミノ酸残基1248のC末端、または別のCas9ポリペプチドの対応するアミノ酸残基のC末端において挿入される。一部の実施形態では、デアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、上記のCas9参照配列において番号付けされたアミノ酸残基1246もしくはアミノ酸残基1247もしくはアミノ酸残基1248、または別のCas9ポリペプチドの対応するアミノ酸残基を置き換えるために挿入される。
【0255】
一部の実施形態では、異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの可動性ループに挿入される。可動性ループ部分は、上記のCas9参照配列において番号付けされたアミノ酸残基530~537、569~570、686~691、943~947、1002~1025、1052~1077、1232~1247、もしくは1298~1300、または別のCas9ポリペプチドの対応するアミノ酸残基からなる群から選択することができる。可動性ループ部分は、以下からなる群から選択することができる:上記のCas9参照配列において番号付けされたアミノ酸残基1~529、538~568、580~685、692~942、948~1001、1026~1051、1078~1231、もしくは1248~1297、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0256】
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、以下のアミノ酸残基に対応するCas9ポリペプチド領域に挿入され得る:上記のCas9参照配列において番号付けされたアミノ酸残基1017~1069、1242~1247、1052~1056、1060~1077、1002~1003、943~947、530~537、568~579、686~691、1242~1247、1298~1300、1066~1077、1052~1056、もしくは1060~1077、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0257】
異種ポリペプチド(例えば、アデニンデアミナーゼ)は、Cas9ポリペプチドの欠失領域の代わりに挿入され得る。欠失領域は、Cas9ポリペプチドのN末端部分またはC末端部分に対応し得る。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792~872、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基792~906、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基2~791、または別のCas9ポリペプチドの対応するアミノ酸残基に対応する。一部の実施形態では、欠失領域は、上記のCas9参照配列において番号付けされた残基1017~1069、またはその対応するアミノ酸残基に対応する。
【0258】
以下の表3に、例示的な内部融合塩基エディターが提供される。

【表3】
【0259】
異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの構造または機能ドメイン内に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、Cas9ポリペプチドの2つの構造または機能ドメイン間に挿入され得る。異種ポリペプチド(例えば、デアミナーゼ)は、例えば、Cas9ポリペプチドからドメインを欠失させた後に、Cas9ポリペプチドの構造または機能ドメインの代わりに挿入され得る。Cas9ポリペプチドの構造または機能ドメインは、例えば、RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHを含むことができる。
【0260】
一部の実施形態では、Cas9ポリペプチドは、以下からなる群から選択される1つ以上のドメインを欠く:RuvCI、RuvCII、RuvCIII、Rec1、Rec2、PI、またはHNHドメイン。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインを欠く。一部の実施形態では、Cas9ポリペプチドは、HNHドメインの一部を欠き、そのため、Cas9ポリペプチドは、HNH活性が低下または消失している。一部の実施形態では、Cas9ポリペプチドは、ヌクレアーゼドメインの欠失を含み、デアミナーゼが、ヌクレアーゼドメインを置き換えるために挿入される。一部の実施形態では、HNHドメインが欠失され、デアミナーゼが、その場所に挿入される。一部の実施形態では、RuvCドメインのうちの1つ以上が欠失され、デアミナーゼが、その場所に挿入される。
【0261】
異種ポリペプチドを含む融合タンパク質は、napDNAbpのN末端断片及びC末端断片に隣接し得る。一部の実施形態では、融合タンパク質は、Cas9ポリペプチドのN末端断片及びC末端断片に隣接するデアミナーゼを含む。N末端断片またはC末端断片は、標的ポリヌクレオチド配列に結合することができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドの可動性ループの一部を含むことができる。N末端断片のC末端またはC末端断片のN末端は、Cas9ポリペプチドのアルファヘリックス構造の一部を含むことができる。N末端断片またはC末端断片は、DNA結合ドメインを含むことができる。N末端断片またはC末端断片は、RuvCドメインを含むことができる。N末端断片またはC末端断片は、HNHドメインを含むことができる。一部の実施形態では、N末端断片及びC末端断片のいずれかは、HNHドメインを含まない。
【0262】
一部の実施形態では、N末端Cas9断片のC末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。一部の実施形態では、C末端Cas9断片のN末端は、融合タンパク質が標的核酸塩基を脱アミノ化するときに標的核酸塩基に近接しているアミノ酸を含む。異なるデアミナーゼの挿入場所は、標的核酸塩基とN末端Cas9断片のC末端またはC末端Cas9断片のN末端のアミノ酸との間に近接性を持たせるために、異なり得る。例えば、デアミナーゼの挿入位置は、以下からなる群から選択されるアミノ酸残基にあり得る:上記のCas9参照配列において番号付けされたアミノ酸残基1015、1022、1029、1040、1068、1247、1054、1026、768、1067、1248、1052、及び1246、または別のCas9ポリペプチドの対応するアミノ酸残基。
【0263】
融合タンパク質のN末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するN末端Cas9断片)は、Cas9ポリペプチドのN末端を含むことができる。融合タンパク質のN末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のN末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1~56、1~95、1~200、1~300、1~400、1~500、1~600、1~700、1~718、1~765、1~780、1~906、1~918、もしくは1~1100、または別のCas9ポリペプチドの対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%の配列同一性を含む配列を含むことができる。
【0264】
融合タンパク質のC末端Cas9断片(すなわち、融合タンパク質のデアミナーゼに隣接するC末端Cas9断片)は、Cas9ポリペプチドのC末端を含むことができる。融合タンパク質のC末端Cas9断片は、少なくとも約:100、200、300、400、500、600、700、800、900、1000、1100、1200、または1300アミノ酸の長さを含むことができる。融合タンパク質のC末端Cas9断片は、以下のアミノ酸残基に対応する配列を含むことができる:上記のCas9参照配列において番号付けされたアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368もしくは56~1368、または別のCas9ポリペプチドにおける対応するアミノ酸残基。N末端Cas9断片は、上記のCas9参照配列において番号付けされたアミノ酸残基1099~1368、918~1368、906~1368、780~1368、765~1368、718~1368、94~1368、もしくは56~1368、または別のCas9ポリペプチドの対応するアミノ酸残基と、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または少なくとも99.5%の配列同一性を含む配列を含むことができる。
【0265】
融合タンパク質のN末端Cas9断片及びC末端Cas9断片は、一緒にまとめて、例えば、上記のCas9参照配列に記載されるような、天然の全長のCas9ポリペプチド配列に対応しない場合がある。
【0266】
本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位(例えば、オフターゲット部位)における脱アミノ化が低減される(例えば、ゲノムワイドの擬脱アミノ化が低減される)。本明細書に記載の融合タンパク質は、標的化された脱アミノ化をもたらすことができ、非標的部位におけるバイスタンダー(bystander)脱アミノが低減される。望ましくない脱アミノまたはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端(end terminus)融合タンパク質と比較して、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または少なくとも99%低減され得る。望ましくない脱アミノ化またはオフターゲット脱アミノ化は、例えば、Cas9ポリペプチドのN末端またはC末端に融合されたデアミナーゼを含む末端融合タンパク質と比較して、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、または少なくとも100倍低減され得る。
【0267】
一部の実施形態では、融合タンパク質のデアミナーゼ(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)は、Rループの範囲内の2つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の3つ以下の核酸塩基を脱アミノ化する。一部の実施形態では、融合タンパク質のデアミナーゼは、Rループの範囲内の2、3、4、5、6、7、8、9、または10個以下の核酸塩基を脱アミノ化する。Rループは、三本鎖核酸構造であり、DNA:RNAハイブリッド、DNA:DNA、またはRNA:RNA相補構造を含み、一本鎖DNAと会合している。本明細書で使用される場合、Rループは、標的ポリヌクレオチドがCRISPR複合体または塩基編集複合体と接触すると形成され得、ガイドポリヌクレオチドの一部分(例えば、ガイドRNA)が、標的ポリヌクレオチドの一部分(例えば、標的DNA)とハイブリダイズし、それを置換する。一部の実施形態では、Rループは、スペーサー配列及び標的DNA相補配列のハイブリダイズした領域を含む。Rループ領域は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50核酸塩基対長の領域であり得る。一部の実施形態では、Rループ領域は、約20核酸塩基対長である。本明細書で使用される場合、Rループ領域は、ガイドポリヌクレオチドとハイブリダイズする標的DNA鎖に限定されないことを理解されたい。例えば、Rループ領域内の標的核酸塩基の編集は、ガイドRNAに対する相補鎖を含むDNA鎖に対するものであってもよく、またはガイドRNAに対する相補鎖の反対側の鎖であるDNA鎖に対するものであってもよい。一部の実施形態では、Rループの領域における編集は、標的DNA配列におけるガイドRNAに対する非相補鎖(プロトスペーサー鎖)上の核酸塩基を編集することを含む。
【0268】
本明細書に記載の融合タンパク質は、正準塩基編集とは異なる編集ウィンドウにおける標的脱アミノ化をもたらすことができる。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約1~約20塩基上流にある。一部の実施形態では、標的核酸塩基は、標的ポリヌクレオチド配列におけるPAM配列の約2~約12塩基上流にある。一部の実施形態では、標的核酸塩基は、約1~9塩基対、約2~10塩基対、約3~11塩基対、約4~12塩基対、約5~13塩基対、約6~14塩基対、約7~15塩基対、約8~16塩基対、約9~17塩基対、約10~18塩基対、約11~19塩基対、約12~20塩基対、約1~7塩基対、約2~8塩基対、約3~9塩基対、約4~10塩基対、約5~11塩基対、約6~12塩基対、約7~13塩基対、約8~14塩基対、約9~15塩基対、約10~16塩基対、約11~17塩基対、約12~18塩基対、約13~19塩基対、約14~20塩基対、約1~5塩基対、約2~6塩基対、約3~7塩基対、約4~8塩基対、約5~9塩基対、約6~10塩基対、約7~11塩基対、約8~12塩基対、約9~13塩基対、約10~14塩基対、約11~15塩基対、約12~16塩基対、約13~17塩基対、約14~18塩基対、約15~19塩基対、約16~20塩基対、約1~3塩基対、約2~4塩基対、約3~5塩基対、約4~6塩基対、約5~7塩基対、約6~8塩基対、約7~9塩基対、約8~10塩基対、約9~11塩基対、約10~12塩基対、約11~13塩基対、約12~14塩基対、約13~15塩基対、約14~16塩基対、約15~17塩基対、約16~18塩基対、約17~19塩基対、約18~20塩基対、PAM配列から離れているか、またはPAM配列の上流にある。一部の実施形態では、標的核酸塩基は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20塩基対、もしくはそれ以上、PAM配列から離れているか、またはPAM配列の上流にある。一部の実施形態では、標的核酸塩基は、PAM配列の約1、2、3、4、5、6、7、8、または9塩基対上流にある。一部の実施形態では、標的核酸塩基は、PAM配列の約2、3、4、または6塩基対上流にある。
【0269】
融合タンパク質は、複数の異種ポリペプチドを含むことができる。例えば、融合タンパク質は、1つ以上のUGIドメイン及び/または1つ以上の核局在化シグナルをさらに含むことができる。2つ以上の異種ドメインは、直列に挿入され得る。2つ以上の異種ドメインは、それらがNapDNAbpにおいて直列ではないような位置に挿入され得る。
【0270】
融合タンパク質は、デアミナーゼとnapDNAbpポリペプチドとの間にリンカーを含むことができる。リンカーは、ペプチドまたは非ペプチドリンカーであってもよい。例えば、リンカーは、XTEN、(GGGS)n(配列番号334)、(GGGGS)n(配列番号335)、(G)n、(EAAAK)n(配列番号336)、(GGS)n、SGSETPGTSESATPES(配列番号337)であり得る。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含む。一部の実施形態では、napDNAbpのN末端断片及びC末端断片は、リンカーでデアミナーゼに接続されている。一部の実施形態では、N末端断片及びC末端断片は、リンカーなしでデアミナーゼドメインに連結される。一部の実施形態では、融合タンパク質は、N末端Cas9断片とデアミナーゼとの間にリンカーを含むが、C末端Cas9断片とデアミナーゼとの間にリンカーを含まない。一部の実施形態では、融合タンパク質は、C末端Cas9断片とデアミナーゼとの間にリンカーを含むが、N末端Cas9断片とデアミナーゼとの間にリンカーを含まない。
【0271】
一部の実施形態では、融合タンパク質中のnapDNAbpは、Cas12ポリペプチド(例えば、Cas12b/C2c1)またはその断片である。Cas12ポリペプチドは、バリアントCas12ポリペプチドであり得る。他の実施形態では、Cas12ポリペプチドのN末端断片またはC末端断片は、核酸プログラマブルDNA結合ドメインまたはRuvCドメインを含む。他の実施形態では、融合タンパク質は、Cas12ポリペプチドと触媒ドメインとの間にリンカーを含む。他の実施形態では、リンカーのアミノ酸配列は、GGSGGS(配列番号338)またはGSSGSETPGTSESATPESSG(配列番号339)である。他の実施形態では、リンカーは、剛性リンカー(rigid linker)である。上記の態様の他の実施形態では、リンカーは、GGAGGCTCTGGAGGAAGC(配列番号340)またはGGCTCTTCTGGATCTGAAACACCTGGCACAAGCGAGAGCGCCACCCCTGAGAGCTCTGGC(配列番号341)によってコードされる。
【0272】
Cas12ポリペプチドのN末端断片及びC末端断片に隣接する異種触媒ドメインを含む融合タンパク質は、本明細書に記載される方法における塩基編集にも有用である。Cas12及び1つ以上のデアミナーゼドメインを含む(例えば、アデノシンデアミナーゼ、またはCas12配列に隣接するアデノシンデアミナーゼドメインを含む)融合タンパク質は、標的配列の非常に特異的かつ効率的な塩基編集にも有用である。一実施形態では、キメラCas12融合タンパク質は、Cas12ポリペプチド内に挿入された異種触媒ドメイン(例えば、アデノシンデアミナーゼ、シチジンデアミナーゼ、またはアデノシンデアミナーゼ及びシチジンデアミナーゼ)を含む。一部の実施形態では、融合タンパク質は、Cas12内に挿入されたアデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む。一部の実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、C末端に融合させる。一部の実施形態では、アデノシンデアミナーゼを、Cas12内で融合させ、シチジンデアミナーゼを、N末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、アデノシンデアミナーゼを、N末端に融合させる。アデノシンデアミナーゼ及びシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
NH2-[Cas12(アデノシンデアミナーゼ)]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12(アデノシンデアミナーゼ)]-COOH、
NH2-[Cas12(シチジンデアミナーゼ)]-[アデノシンデアミナーゼ]-COOH、または
NH2-[アデノシンデアミナーゼ]-[Cas12(シチジンデアミナーゼ)]-COOH、
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
【0273】
様々な実施形態では、触媒ドメインは、アデノシンデアミナーゼ活性などのDNA修飾活性(例えば、デアミナーゼ活性)を有する。一部の実施形態では、アデノシンデアミナーゼは、TadA(例えば、TadA*7.10)である。一部の実施形態では、TadAは、TadA*8である。一部の実施形態では、TadA*8は、Cas12内で融合され、シチジンデアミナーゼは、C末端に融合される。一部の実施形態では、TadA*8は、Cas12内で融合され、シチジンデアミナーゼは、N末端に融合される。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、TadA*8を、C末端に融合させる。一部の実施形態では、シチジンデアミナーゼを、Cas12内で融合させ、TadA*8を、N末端に融合させる。TadA*8及びシチジンデアミナーゼならびにCas12を有する融合タンパク質の例示的な構造は、以下のように提供される:
N-[Cas12(TadA*8)]-[シチジンデアミナーゼ]-C、
N-[シチジンデアミナーゼ]-[Cas12(TadA*8)]-C、
N-[Cas12(シチジンデアミナーゼ)]-[TadA*8]-C、または
N-[TadA*8]-[Cas12(シチジンデアミナーゼ)]-C。
一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。
【0274】
他の実施形態では、融合タンパク質は1つ以上の触媒ドメインを含む。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチド内に挿入されるか、またはCas12のN末端もしくはC末端で融合される。他の実施形態では、1つ以上の触媒ドメインのうちの少なくとも1つは、Cas12ポリペプチドのループ、アルファヘリックス領域、非構造化部分、または溶媒アクセス可能部分内に挿入される。他の実施形態では、Cas12ポリペプチドは、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、またはCas12j/CasΦである。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12bまたはAlicyclobacillus acidiphilus Cas12b(配列番号342)に対して少なくとも約85%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b(配列番号343)、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12bに対して、少なくとも約90%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b(配列番号344)、Bacillus種V3-13 Cas12b、またはAlicyclobacillus acidiphilus Cas12b(配列番号345)に対して、少なくとも約95%のアミノ酸配列同一性を有する。他の実施形態では、Cas12ポリペプチドは、Bacillus hisashii Cas12b、Bacillus thermoamylovorans Cas12b、Bacillus種V3-13 Cas12b、もしくはAlicyclobacillus acidiphilus Cas12bの断片を含むか、または本質的にそれからなる。実施形態では、Cas12ポリペプチドは、BvCas12b(V4)を含み、これは、一部の実施形態では、5’mRNACap---5’UTR---bhCas12b---終止配列---3’UTR---120ポリAテール(配列番号346~348)として表現される。
【0275】
他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸位置153-154、255-256、306-307、980-981、1019-1020、534-535、604-605、もしくは344-345の間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸P153とS154との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K255とE256との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸D980とG981との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K1019とL1020との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸F534とP535との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸K604とG605との間に挿入される。他の実施形態では、触媒ドメインは、BhCas12bのアミノ酸H344とF345との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸位置147と148、248と249、299と300、991と992、もしくは1031と1032との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P147とD148との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G248とG249との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸P299とE300との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸G991とE992との間に挿入される。他の実施形態では、触媒ドメインは、BvCas12bのアミノ酸K1031とM1032との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸位置157と158、258と259、310と311、1008と1009、もしくは1044と1045との間、またはCas12a、Cas12c、Cas12d、Cas12e、Cas12g、Cas12h、Cas12i、もしくはCas12j/CasΦの対応するアミノ酸残基の間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸P157とG158との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸V258とG259との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸D310とP311との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1008とE1009との間に挿入される。他の実施形態では、触媒ドメインは、AaCas12bのアミノ酸G1044とK1045との間に挿入される。
【0276】
他の実施形態では、融合タンパク質は、核局在化シグナル(例えば、二分核局在化シグナル)を含む。他の実施形態では、核局在化シグナルのアミノ酸配列は、MAPKKKRKVGIHGVPAA(配列番号349)である。上記の態様の他の実施形態では、核局在化シグナルは、以下の配列によってコードされる:
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCC(配列番号350)。他の実施形態では、Cas12bポリペプチドは、RuvCドメインの触媒活性をサイレンシングする変異を含む。他の実施形態では、Cas12bポリペプチドは、D574A、D829A及び/またはD952A変異を含む。他の実施形態では、融合タンパク質は、タグ(例えば、インフルエンザヘマグルチニンタグ)をさらに含む。
【0277】
一部の実施形態では、融合タンパク質は、napDNAbpドメイン(例えば、Cas12由来ドメイン)を含み、内部融合核酸塩基編集ドメイン(例えば、デアミナーゼドメイン(例えば、アデノシンデアミナーゼドメイン)の全部または一部)を有する。一部の実施形態では、napDNAbpは、Cas12bである。一部の実施形態では、塩基エディターは、BhCas12bドメインを含み、以下の表4に提供される遺伝子座に挿入された内部融合TadA*8ドメインを有する。

【表4】
【0278】
非限定的な例として、アデノシンデアミナーゼ(例えば、TadA*8.13)をBhCas12bに挿入して、核酸配列を効果的に編集する融合タンパク質(例えば、TadA*8.13-BhCas12b)を生成することができる。
【0279】
一部の実施形態では、本明細書に記載の塩基エディターシステムは、TadAがCas9に挿入されたABEである。Cas9内に挿入されたTadAを有する関連するABEのポリペプチド配列は、添付の配列表で配列番号351~396として提供される。
【0280】
一部の実施形態では、アデノシン塩基エディターを生成して、TadAまたはそのバリアントをCas9ポリペプチドの同定された位置に挿入した。
【0281】
例示的であるが非限定的な融合タンパク質は、国際PCT出願第PCT/US2020/016285号及び米国仮出願第62/852,228号及び同第62/852,224号に記載されている(これらの内容は、その全体が参照により本明細書に援用される)。
【0282】
AからGの編集
一部の実施形態では、本明細書に記載の塩基エディターは、アデノシンデアミナーゼドメインを含む。塩基エディターのそのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成の特性を示すイノシン(I)を形成することによって、アデニン(A)核酸塩基のグアニン(G)核酸塩基への編集を促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸(DNA)のデオキシアデノシン残基のアデニンを脱アミノ化する(すなわち、アミン基を除去する)ことができる。一部の実施形態では、AからGの(A-to-G)塩基エディターは、イノシン塩基除去修復の阻害剤、例えば、ウラシルグリコシラーゼ阻害剤(UGI)ドメインまたは触媒不活性のイノシン特異的ヌクレアーゼをさらに含む。いかなる特定の理論に拘束されることを望むものではないが、UGIドメインまたは触媒不活性イノシン特異的ヌクレアーゼは、脱アミノ化アデノシン残基(例えば、イノシン)の塩基除去修復を阻害または防止することができ、これは、塩基エディターの活性または効率を改善することができる。
【0283】
アデノシンデアミナーゼを含む塩基エディターは、DNA、RNA、及びDNA-RNAハイブリッドを含む任意のポリヌクレオチドに作用することができる。特定の実施形態では、アデノシンデアミナーゼを含む塩基エディターは、RNAを含むポリヌクレオチドの標的Aを脱アミノ化することができる。例えば、塩基エディターは、RNAポリヌクレオチド及び/またはDNA-RNAハイブリッドポリヌクレオチドの標的Aを脱アミノ化することができるアデノシンデアミナーゼドメインを含むことができる。一実施形態では、塩基エディターに組み込まれるアデノシンデアミナーゼは、RNA(ADAR、例えば、ADAR1またはADAR2)またはtRNA(ADAT)に作用するアデノシンデアミナーゼの全部または一部を含む。アデノシンデアミナーゼドメインを含む塩基エディターは、DNAポリヌクレオチドのA核酸塩基を脱アミノ化することもできる。一実施形態では、塩基エディターのアデノシンデアミナーゼドメインは、ADATがDNA中の標的Aを脱アミノ化することを可能にする1つ以上の変異を含むADATの全部または一部を含む。例えば、塩基エディターは、以下の変異のうちの1つ以上を含むEscherichia coli由来のADAT(EcTadA)の全部または一部を含むことができる:D108N、A106V、D147Y、E155V、L84F、H123Y、I156F、または別のアデノシンデアミナーゼにおける対応する変異。例示的なADAT相同体ポリペプチド配列は、配列表で配列番号1、397~403として提供される。
【0284】
アデノシンデアミナーゼは、任意の好適な生物(例えば、E.coli)に由来し得る。一部の実施形態では、アデノシンデアミナーゼは、原核生物由来である。一部の実施形態では、アデノシンデアミナーゼは、細菌由来である。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、またはBacillus subtilis由来である。一部の実施形態では、アデノシンデアミナーゼは、E.coli由来である。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供される変異(例えば、ecTadAにおける変異)のいずれかに対応する1つ以上の変異を含む、天然のアデノシンデアミナーゼである。任意の相同タンパク質における対応する残基は、例えば、配列アラインメント及び相同残基の決定によって特定することができる。本明細書に記載の変異のいずれか(例えば、ecTadAにおいて特定された変異のいずれか)に対応する、任意の天然のアデノシンデアミナーゼにおける(例えば、ecTadAと相同性を有する)変異は、それに応じて生成することができる。
【0285】
一部の実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるアデノシンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
本明細書に提供される変異のいずれか(例えば、TadA参照配列に基づく)が、E.coli TadA(ecTadA)、S.aureus TadA(saTadA)、または他のアデノシンデアミナーゼ(例えば、細菌アデノシンデアミナーゼ)などの他のアデノシンデアミナーゼに導入され得ることを理解されたい。追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることは、当業者には明らかであろう。したがって、TadA参照配列において特定された変異のいずれかは、相同アミノ酸残基を有する他のアデノシンデアミナーゼ(例えば、ecTada)において作製され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。
【0286】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108G、D108N、D108V、D108A、もしくはD108Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。しかしながら、追加のデアミナーゼを、同様に整列させて相同アミノ酸残基を特定することができ、本明細書に提供されるように変異導入され得ることを理解されたい。
【0287】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0288】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、またはE155V変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。
【0289】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD147X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、D147Y、TadA参照配列における変異、または別のアデノシンデアミナーゼにおける対応する変異(例えば、ecTadA)を含む。
【0290】
一部の実施形態では、アデノシンデアミナーゼは、A106X、E155X、またはD147X、TadA参照配列における変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼの対応するアミノ酸以外の任意のアミノ酸を示す)。一部の実施形態では、アデノシンデアミナーゼは、E155D、E155G、またはE155V変異を含む。一部の実施形態では、アデノシンデアミナーゼは、D147Yを含む。
【0291】
本明細書に提供される変異のいずれかは、ecTadAまたは別のアデノシンデアミナーゼにおいて、個別に、または任意の組み合わせで作製され得ることも理解されたい。例えば、アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、及び/またはD147Y変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する変異を含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列における以下の変異群(変異群は、「;」によって分離される)、または別のアデノシンデアミナーゼにおける対応する変異を含む:D108N及びA106V;D108N及びE155V;D108N及びD147Y;A106V及びE155V;A106V及びD147Y;E155V及びD147Y;D108N、A106V、及びE155V;D108N、A106V、及びD147Y;D108N、E155V、及びD147Y;A106V、E155V、及びD147Y;ならびにD108N、A106V、E155V、及びD147Y。しかしながら、本明細書に提供される対応する変異の任意の組み合わせが、アデノシンデアミナーゼ(例えば、ecTadA)において作製され得ることを理解されたい。
【0292】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列(例えば、TadA*7.10)における以下の変異または別のアデノシンデアミナーゼにおける対応する変異の組み合わせを含む。V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、またはL36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0293】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I156X及び/またはK157X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、T17S、L18E、W23L、L34S、W45L、R51H、A56EもしくはA56S、E59G、E85KもしくはE85G、M94L、I95L、V102A、F104L、A106V、R107CもしくはR107HもしくはR107P、D108GもしくはD108NもしくはD108VもしくはD108AもしくはD108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、及び/またはK157R変異のうちの1つ以上、あるいは別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。
【0294】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X及び/またはN127X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xは、いずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及び/またはN127S変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。
【0295】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X、K161X、Q163X及び/またはT166X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155GもしくはE155VもしくはE155D、K161Q、Q163H、及び/またはT166Pのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。
【0296】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、D147X、R152X、及びQ154Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E155X、及びQ163Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、N127X、E155X、及びT166Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
【0297】
一部の実施形態では、アデノシンデアミナーゼは、H8X、A106X、及びD108Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、H8X、R26X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
【0298】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R126X、L68X、D108X、N127X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、6、もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X及びE155Xからなる群から選択される1、2、3、4もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
【0299】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、R152C、及びQ154Hからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155G、及びQ163Hからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、及びT166Pからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E155D、及びK161Qからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、L68Q、D108N、N127S、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、6、7、もしくは8つの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異(複数可)を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、A109T、N127S及びE155Gからなる群から選択される1、2、3、4もしくは5つの変異、または別のアデノシンデアミナーゼ(例えば、ecTadA)における対応する1つ以上の変異を含む。
【0300】
一部の実施形態では、アデノシンデアミナーゼは、上記の変異のうちの1つ以上または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D108G、もしくはD108V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V及びD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107C及びD108N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びQ154H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、D147Y、及びE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、及びE155V変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、及びN127S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Y、及びE155Vの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0301】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、H8X、I49X、L84X、H123X、N127X、I156X及び/またはK160X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、H8Y、I49F、L84F、H123Y、N127S、I156F、及び/またはK160S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異のうちの1つ以上を含む。
【0302】
一部の実施形態では、アデノシンデアミナーゼは、L84X変異アデノシンデアミナーゼを含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0303】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH123Y変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0304】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるI156F変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0305】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84X、A106X、D108X、H123X、D147X、E155X及びI156Xからなる群から選択される1、2、3、4、5、6もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2X、I49X、A106X、D108X、D147X、及びE155Xからなる群から選択される1、2、3、4、5、もしくは6つの変異、または別のアデノシンデアミナーゼにおける対応する変異を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8X、A106X、D108X、N127X、及びK160Xからなる群から選択される1、2、3、4、もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する変異(複数可)を含む(ここで、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存在を示す)。
【0306】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるL84F、A106V、D108N、H123Y、D147Y、E155V及びI156Fからなる群から選択される1、2、3、4、5、6もしくは7つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS2A、I49F、A106V、D108N、D147Y、及びE155Vからなる群から選択される1、2、3、4、5、または6つの変異を含む。
【0307】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S及びK160Sからなる群から選択される1、2、3、4もしくは5つの変異、または別のアデノシンデアミナーゼにおける対応する1つ以上の変異を含む。
【0308】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X、R26X、R107X、A142X及び/またはA143X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、E25Y、R26G、R26N、R26Q、R26C、R26L、R26K、R107P、R107K、R107A、R107N、R107W、R107H、R107S、A142N、A142D、A142G、A143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、及び/またはA143Rのうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含む。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の変異、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異のうちの1つ以上を含む。
【0309】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E25V、E25S、もしくはE25Y変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0310】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q、R26C、R26L、もしくはR26K変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0311】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R107K、R107A、R107N、R107W、R107H、もしくはR107S変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0312】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G変異、または別のアデノシンデアミナーゼ(例えばecTadA)の対応する変異を含む。
【0313】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A143L、A143W、A143M、A143S、A143Q、及び/またはA143Rの変異、または別のアデノシンデアミナーゼ(例えばecTadA)における対応する変異を含む。
【0314】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X及び/またはK161X変異のうちの1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の対応する変異を含み、Xの存在は、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、及び/またはK161Tの変異のうちの1つ以上、または別のアデノシンデアミナーゼ(例えばecTadA)における1つ以上の対応する変異を含む。
【0315】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるH36L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0316】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるN37TもしくはN37S変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0317】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48TもしくはP48L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0318】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR51HもしくはR51L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0319】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるS146RもしくはS146C変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0320】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるK157N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0321】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、もしくはP48A変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0322】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるA142N変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0323】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるW23RもしくはW23L変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0324】
一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152X変異または別のアデノシンデアミナーゼにおける対応する変異を含み、Xは、野生型のアデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列におけるR152PもしくはR52H変異、または別のアデノシンデアミナーゼにおける対応する変異を含む。
【0325】
一実施形態では、アデノシンデアミナーゼは、変異H36L、R51L、L84F、A106V、D108N、H123Y、S146C、D147Y、E155V、I156F及びK157Nを含み得る。一部の実施形態では、アデノシンデアミナーゼは、TadA参照配列に対して以下の変異の組み合わせを含む(ここで、組み合わせの各変異は、「_」によって区切られ、変異の各組み合わせは、括弧の間にある:
(A106V_D108N)、
(R107C_D108N)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(H8Y_D108N_N127S_D147Y_E155V)、
(D108N_D147Y_E155V)、
(H8Y_D108N_N127S)、
(H8Y_D108N_N127S_D147Y_Q154H)、
(A106V_D108N_D147Y_E155V)、
(D108Q_D147Y_E155V)、
(D108M_D147Y_E155V)、
(D108L_D147Y_E155V)、
(D108K_D147Y_E155V)、
(D108I_D147Y_E155V)、
(D108F_D147Y_E155V)、
(A106V_D108N_D147Y)、
(A106V_D108M_D147Y_E155V)、
(E59A_A106V_D108N_D147Y_E155V)、
(E59A cat dead_A106V_D108N_D147Y_E155V)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D103A_D104N)、
(G22P_D103A_D104N)、
(D103A_D104N_S138A)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I156F)、
(R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F)、
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I156F)、
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F)、
(A106V_D108N_A142N_D147Y_E155V)、
(R26G_A106V_D108N_A142N_D147Y_E155V)、
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V)、
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V)、
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V)、
(A106V_R107K_D108N_A142N_D147Y_E155V)、
(A106V_D108N_A142N_A143G_D147Y_E155V)、
(A106V_D108N_A142N_A143L_D147Y_E155V)、
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F)、
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F)、
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F)、
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F)、
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)
(H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N)、
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E)、
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F)、
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F)、
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F)、
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L)、
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_D147Y_E155V_I156F)、
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T)、
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F)、
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F)、
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F)、
(P48S_A142N)、
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N)、
(P48T_I49V_A142N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P_E155V_I156F_K157N)、
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T)、
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F_K157N)、
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V_I156F_K157N)。
【0326】
一部の実施形態では、TadAデアミナーゼは、TadAバリアントである。一部の実施形態では、TadAバリアントは、TadA*7.10である。特定の実施形態では、融合タンパク質は、(例えば、単量体として提供される)単一のTadA*7.10ドメインを含む。他の実施形態では、融合タンパク質は、ヘテロ二量体を形成することができるTadA*7.10及びTadA(wt)を含む。一実施形態では、本発明の融合タンパク質は、TadA*7.10に結合した野生型TadAを含み、これはCas9ニッカーゼに結合している。
【0327】
一部の実施形態では、TadA*7.10は、少なくとも1つの改変を含む。一部の実施形態では、アデノシンデアミナーゼは、以下の配列における改変を含む:
TadA*7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(配列番号1)
【0328】
一部の実施形態では、TadA*7.10は、アミノ酸82及び/または166における改変を含む。特定の実施形態では、TadA*7.10は、以下の改変のうちの1つ以上を含む:Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R。他の実施形態では、TadA*7.10のバリアントは、以下の群から選択される改変の組み合わせを含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R。
【0329】
一部の実施形態では、TadA*7.10のバリアントは、L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K、及び/またはD167Nの群から選択される1つ以上の改変を含む。一部の実施形態では、TadA*7.10のバリアントは、V82G、Y147T/D、Q154S、ならびにL36H、I76Y、F149Y、N157K、及びD167Nのうちの1つ以上を含む。他の実施形態では、TadA*7.10のバリアントは、以下の群から選択される改変の組み合わせを含む:V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0330】
一部の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、欠失を含む。一部の実施形態では、アデノシンデアミナーゼのバリアントは、C末端の欠失を含む。特定の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10、TadA参照配列に対して、残基149、150、151、152、153、154、155、156、及び157から始まるC末端の欠失、または別のTadAにおける対応する変異を含む。
【0331】
他の実施形態では、アデノシンデアミナーゼのバリアント(例えば、TadA*8)は、以下の改変のうちの1つ以上を含む単量体である:TadA*7.10、TadA参照配列に対してY147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154R、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)は、以下の群から選択される改変の組み合わせを含む単量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
【0332】
他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むホモ二量体であり、各々、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を有する。他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含む単量体であり、各々、以下の群から選択される改変の組み合わせを有する:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
【0333】
他の実施形態では、本開示の塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*8)単量体を含み、以下の改変のうちの1つ以上を含む:TadA*7.10、TadA参照配列に対してR26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167N、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)単量体は、以下の群から選択される改変の組み合わせを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0334】
一部の実施形態では、アデノシンデアミナーゼバリアント(例えば、MSP828)は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、以下の改変、L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K、及び/またはD167Nのうちの1つ以上を含む単量体である。一部の実施形態では、アデノシンデアミナーゼバリアント(例えば、MSP828)は、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、V82G、Y147T/D、Q154S、ならびにL36H、I76Y、F149Y、N157K、及びD167Nのうちの1つ以上を含む単量体である。他の実施形態では、アデノシンデアミナーゼバリアント(TadAバリアント)は、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む単量体である:V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0335】
他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼのバリアントは、野生型アデノシンデアミナーゼドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
【0336】
他の実施形態では、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、それぞれが以下の改変、R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167Nのうちの1つ以上を有する2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含むアデノシンデアミナーゼバリアント(例えば、TadA*8)ホモ二量体を含む本開示の塩基エディター。他の実施形態では、アデノシンデアミナーゼのバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*8)を含む単量体であり、各々、以下の群から選択される改変の組み合わせを有する:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0337】
一部の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、それぞれが以下の改変、L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K、及び/またはD167Nのうちの1つ以上を有する2つのアデノシンデアミナーゼドメイン(例えば、TadA*7.10)を含むホモ二量体である。一部の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、それぞれが以下の改変、V82G、Y147T/D、Q154S、ならびにL36H、I76Y、F149Y、N157K、及びD167Nのうちの1つ以上を有する2つのアデノシンデアミナーゼバリアントドメイン(例えば、MSP828)を含むホモ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、2つのアデノシンデアミナーゼドメイン(例えば、TadA*7.10)を含むホモ二量体であり、2つのアデノシンデアミナーゼドメインは各々、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を有する:V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0338】
他の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R及びI76Y+V82S+Y123H+Y147R+Q154R。
【0339】
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及び/またはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインのヘテロ二量体と、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0340】
他の実施形態では、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、以下の改変、L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K、及び/またはD167Nのうちの1つ以上を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*7.10)とのヘテロ二量体である。一部の実施形態では、アデノシンデアミナーゼバリアントは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、以下の改変、V82G、Y147T/D、Q154S、ならびにL36H、I76Y、F149Y、N157K、及びD167Nのうちの1つ以上を有するアデノシンデアミナーゼバリアントドメイン(例えば、MSP828)とを含むヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、野生型のアデノシンデアミナーゼドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*7.10)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む:V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0341】
他の実施形態では、アデノシンデアミナーゼのバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変Y147T、Y147R、Q154S、Y123H、V82S、T166R、及び/またはQ154Rのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む:Y147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R及びI76Y+V82S+Y123H+Y147R+Q154R。
【0342】
特定の実施形態では、アデノシンデアミナーゼヘテロ二量体は、TadA*8ドメインと、Staphylococcus aureus(S.aureus)TadA、Bacillus subtilis(B.subtilis)TadA、Salmonella typhimurium(S.typhimurium)TadA、Shewanella putrefaciens(S.putrefaciens)TadA、Haemophilus influenzae F3031(H.influenzae)TadA、Caulobacter crescentus(C.crescentus)TadA、Geobacter sulfurreducens(G.sulfurreducens)TadA、またはTadA*7.10.から選択されるアデノシンデアミナーゼドメインとを含む。
【0343】
一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。一実施形態では、アデノシンデアミナーゼは、以下の配列またはアデノシンデアミナーゼ活性を有するその断片を含むか、または本質的にそれからなるTadA*8である。
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCTFFRMPRQVFNAQKKAQSSTD(配列番号404)
【0344】
一部の実施形態では、TadA*8は、切断型(truncated)である。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼのバリアントは、全長TadA*8である。
【0345】
一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
【0346】
他の実施形態では、本開示の塩基エディターは、アデノシンデアミナーゼのバリアント(例えば、TadA*8)単量体を含み、以下の改変のうちの1つ以上を含む:TadA*7.10、TadA参照配列に対してR26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167N、または別のTadAにおける対応する変異。他の実施形態では、アデノシンデアミナーゼのバリアント(TadA*8)単量体は、以下の群から選択される改変の組み合わせを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0347】
他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及び/またはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む。他の実施形態では、塩基エディターは、野生型アデノシンデアミナーゼドメインのヘテロ二量体と、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とを含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0348】
他の実施形態では、塩基エディターは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列に対して以下の改変R26C、V88A、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I及び/またはD167Nのうちの1つ以上、または別のTadAにおける対応する変異を含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体である。他の実施形態では、塩基エディターは、TadA*7.10ドメインと、以下の群から選択される改変の組み合わせを含むアデノシンデアミナーゼバリアントドメイン(例えば、TadA*8)とのヘテロ二量体を含む:TadA*7.10、TadA参照配列に対してR26C+A109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、V88A+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、R26C+A109S+T111R+D119N+H122N+F149Y+T166I+D167N、V88A+T111R+D119N+F149Y、及びA109S+T111R+D119N+H122N+Y147D+F149Y+T166I+D167N、または別のTadAにおける対応する変異。
【0349】
他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*7.10)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対して以下の改変のうちの1つ以上または別のTadAにおける対応する変異を含む:L36H、I76Y、V82G、Y147T、Y147D、F149Y、Q154S、N157K及び/またはD167N。一部の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、TadA*7.10、TadA参照配列、または別のTadAの対応する変異に対して、以下の改変、V82G、Y147T/D、Q154S、ならびにL36H、I76Y、F149Y、N157K、及びD167Nのうちの1つ以上を有するアデノシンデアミナーゼバリアントドメイン(例えば、MSP828)とを含むヘテロ二量体である。他の実施形態では、アデノシンデアミナーゼバリアントは、TadA*7.10ドメインと、アデノシンデアミナーゼバリアントドメイン(例えば、TadA*7.10)とのヘテロ二量体であり、アデノシンデアミナーゼバリアントドメインは、TadA参照配列TadA*7.10に対する以下の群から選択される改変の組み合わせまたは別のTadAにおける対応する変異を含む:V82G+Y147T+Q154S、I76Y+V82G+Y147T+Q154S、L36H+V82G+Y147T+Q154S+N157K、V82G+Y147D+F149Y+Q154S+D167N、L36H+V82G+Y147D+F149Y+Q154S+N157K+D167N、L36H+I76Y+V82G+Y147T+Q154S+N157K、I76Y+V82G+Y147D+F149Y+Q154S+D167N、L36H+I76Y+V82G+Y147D+F149Y+Q154S+N157K+D167N。
【0350】
一部の実施形態では、TadA*8は、表5に示されるバリアントである。表5は、TadAアミノ酸配列における特定のアミノ酸位置の番号、及びTadA-7.10アデノシンデアミナーゼにおけるそれらの位置に存在するアミノ酸を示す。また、表5は、M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-z(その内容全体が、参照により本明細書に援用される)に記載されているファージ支援非持続的進化(PANCE)及びファージ支援持続的進化(PACE)後のTadA-7.10に対するTadAバリアントのアミノ酸変化を示す。一部の実施形態では、TadA*8は、TadA*8a、TadA*8b、TadA*8c、TadA*8d、またはTadA*8eである。一部の実施形態では、TadA*8は、TadA*8eである。
【0351】
【表5】
【0352】
一部の実施形態では、TadAバリアントは、表5.1に示されるバリアントである。表5.1は、TadAアミノ酸配列における特定のアミノ酸位置番号及びTadA*7.10アデノシンデアミナーゼにおけるこれらの位置に存在するアミノ酸を示す。一部の実施形態では、TadAバリアントは、MSP605、MSP680、MSP823、MSP824、MSP825、MSP827、MSP828、またはMSP829である。一部の実施形態では、TadAバリアントはMSP828である。一部の実施形態では、TadAバリアントはMSP829である。
【0353】
一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、融合タンパク質は、TadA*8とTadA(wt)とを含み、これらは、ヘテロ二量体を形成することができる。
【0354】
一部の実施形態では、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデアミナーゼのいずれかに記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるアデノシンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、アデノシンデアミナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、アデノシンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
【0355】
特定の実施形態では、TadA*8は、太字で示される以下の位置のいずれかにおいて、1つ以上の変異を含む。他の実施形態では、TadA*8は、以下の下線で示される位置のいずれかにおいて、1つ以上の変異を含む:
【0356】
例えば、TadA*8は、TadA*7.10、TadA参照配列に対して、アミノ酸位置82及び/または166(例えば、V82S、T166R)単独での改変、または以下のY147T、Y147R、Q154S、Y123H、及び/またはQ154Rのうちのいずれか1つ以上との組み合わせでの改変、あるいは別のTadAにおける対応する変異を含む。特定の実施形態では、改変の組み合わせは、以下の群から選択される:TadA*7.10、TadA参照配列に対してY147T+Q154R、Y147T+Q154S、Y147R+Q154S、V82S+Q154S、V82S+Y147R、V82S+Q154R、V82S+Y123H、I76Y+V82S、V82S+Y123H+Y147T、V82S+Y123H+Y147R、V82S+Y123H+Q154R、Y147R+Q154R+Y123H、Y147R+Q154R+I76Y、Y147R+Q154R+T166R、Y123H+Y147R+Q154R+I76Y、V82S+Y123H+Y147R+Q154R、及びI76Y+V82S+Y123H+Y147R+Q154R、または別のTadAにおける対応する変異。
【0357】
一部の実施形態では、TadA*8は、切断型(truncated)である。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20個のN末端アミノ酸残基を欠く。一部の実施形態では、切断型TadA*8は、全長TadA*8に対して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20個のC末端アミノ酸残基を欠く。一部の実施形態では、アデノシンデアミナーゼのバリアントは、全長TadA*8である。
【0358】
一実施形態では、本発明の融合タンパク質は、野生型TadAを含み、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)に連結され、Cas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単一のTadA*8ドメイン(例えば、単量体として提供される)を含む。他の実施形態では、塩基エディターは、TadA*8とTadA(wt)とを含み、ヘテロ二量体を形成することができる。
【0359】
特定の実施形態では、融合タンパク質は、単一の(例えば、単量体として提供される)TadA*8を含む。一部の実施形態では、TadA*8は、Cas9ニッカーゼに連結される。一部の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結された野生型TadA(TadA(wt))を含む。他の実施形態では、本発明の融合タンパク質は、ヘテロ二量体としてのTadA*8に連結されたTadA*7.10を含む。一部の実施形態では、塩基エディターは、TadA*8バリアント単量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA(wt)とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8とTadA*7.10とのヘテロ二量体を含むABE8である。一部の実施形態では、塩基エディターは、TadA*8のヘテロ二量体を含むABE8である。一部の実施形態では、TadA*8は、表5、11、または12から選択される。一部の実施形態では、ABE8は、表11、12、または14から選択される。
【0360】
一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントである。一部の実施形態では、アデノシンデアミナーゼは、TadA*9バリアントであり、以下に記載されるバリアントから選択され、以下の配列(TadA*7.10と称される)を参照する:
【0361】
一部の実施形態では、アデノシンデアミナーゼは、以下の改変のうちの1つ以上を含む:R21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、V82T、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K。1つ以上の改変が、下線及び太字で上記の配列に示されている。
【0362】
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:V82S+Q154R+Y147R、V82S+Q154R+Y123H、V82S+Q154R+Y147R+Y123H、Q154R+Y147R+Y123H+I76Y+V82S、V82S+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、Q154R+Y147R+Y123H+I76Y、V82S+Y147R、V82S+Y147R+Y123H、V82S+Q154R+Y123H、V82S+Q154R+Y147R、V82S+Q154R+Y147R、Q154R+Y147R+Y123H+I76Y、Q154R+Y147R+Y123H+I76Y+V82S、I76Y_V82S_Y123H_Y147R_Q154R、Y147R+Q154R+H123H、及びV82S+Q154R。
【0363】
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:E25F+V82S+Y123H,T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、Q71M+V82S+Y123H+Y147R+Q154R、E25F+V82S+Y123H+T133K+Y147R+Q154R、E25F+V82S+Y123H+Y147R+Q154R、V82S+Y123H+P124W+Y147R+Q154R、L51W+V82S+Y123H+C146R+Y147R+Q154R、P54C+V82S+Y123H+Y147R+Q154R、Y73S+V82S+Y123H+Y147R+Q154R、N38G+V82T+Y123H+Y147R+Q154R、R23H+V82S+Y123H+Y147R+Q154R、R21N+V82S+Y123H+Y147R+Q154R、V82S+Y123H+Y147R+Q154R+A158K、N72K+V82S+Y123H+D139L+Y147R+Q154R、E25F+V82S+Y123H+D139M+Y147R+Q154R、及びM70V+V82S+M94V+Y123H+Y147R+Q154R。
【0364】
一部の実施形態では、アデノシンデアミナーゼは、以下の改変の組み合わせのうちの1つ以上を含む:Q71M+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、E25F+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82T+Y123H+Y147R+Q154R、N38G+I76Y+V82S+Y123H+Y147R+Q154R、R23H+I76Y+V82S+Y123H+Y147R+Q154R、P54C+I76Y+V82S+Y123H+Y147R+Q154R、R21N+I76Y+V82S+Y123H+Y147R+Q154R、I76Y+V82S+Y123H+D139M+Y147R+Q154R、Y73S+I76Y+V82S+Y123H+Y147R+Q154R、及びV82S+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R、N72K_V82S+Y123H+Y147R+Q154R、Q71M_V82S+Y123H+Y147R+Q154R、M70V+V82S+M94V+Y123H+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R、V82S+Y123H+T133K+Y147R+Q154R+A158K、及びM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。一部の実施形態では、アデノシンデアミナーゼは、単量体として発現される。他の実施形態では、アデノシンデアミナーゼは、ヘテロ二量体として発現される。一部の実施形態では、デアミナーゼまたは他のポリペプチド配列は、例えば、融合タンパク質の成分として含まれる場合、メチオニンを欠く。これにより、位置の番号付けが改変する場合がある。しかしながら、当業者は、そのような対応する変異が、同じ変異(例えば、Y73S及びY72S、ならびにD139M及びD138M)を指すことを理解するであろう。
【0365】
一部の実施形態では、TadA*9バリアントは、本明細書に記載されるように、表15に記載の改変を含む。一部の実施形態では、TadA*9バリアントは、単量体である。一部の実施形態では、TadA*9バリアントは、野生型TadAアデノシンデアミナーゼを有するヘテロ二量体である。一部の実施形態では、TadA*9バリアントは、別のTadAバリアント(例えば、TadA*8、TadA*9)を有するヘテロ二量体である。TadA*9アデノシンデアミナーゼのさらなる詳細は、国際PCT出願第2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。
【0366】
本明細書に提供される変異のいずれか、及び(例えば、ecTadAアミノ酸配列に基づく)任意の追加の変異は、任意の他のアデノシンデアミナーゼに導入され得る。本明細書に提供される変異のいずれかは、TadA参照配列または別のアデノシンデアミナーゼ(例えば、ecTadA)において個別にまたは任意の組み合わせで作製され得る。
【0367】
AからGへの核酸塩基編集タンパク質の詳細は、国際PCT出願第2017/045381号(WO2018/027078)及びGaudelli,N.M.,et al.,”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature,551,464-471(2017)に記載されており、それらの内容全体は、参照により本明細書に援用される。
【0368】
CからTの編集
一部の実施形態では、本明細書に開示される塩基エディターは、シチジンデアミナーゼを含む融合タンパク質を含み、ポリヌクレオチドの標的シチジン(C)塩基を脱アミノ化して、チミンの塩基対形成の特性を有するウリジン(U)を生成することができる。一部の実施形態では、例えば、ポリヌクレオチドが二本鎖(例えば、DNA)である場合、ウリジン塩基は、次いで、(例えば、細胞の修復機構によって)チミジン塩基で置換されて、C:GからT:Aへの遷移が生じ得る。他の実施形態では、塩基エディターによる核酸のCからUへの脱アミノ化は、UからTへの置換を伴うことはできない。
【0369】
Uを生じさせるためのポリヌクレオチドの標的Cの脱アミノ化は、塩基編集の種類の非限定的な例であり、本明細書に記載の塩基エディターによって実行され得る。別の例では、シチジンデアミナーゼドメインを含む塩基エディターは、シトシン(C)塩基のグアニン(G)塩基への変換を媒介することができる。例えば、塩基エディターのシチジンデアミナーゼドメインによるシチジンの脱アミノ化によって産生されたポリヌクレオチドのUは、塩基除去修復機構によって(例えば、ウラシルDNAグリコシラーゼ(UDG)ドメインによって)ポリヌクレオチドから除去され、脱塩基部位を産生することができる。次いで、脱塩基部位と反対側の核酸塩基を、別の塩基(例えば、C)で、例えば、損傷乗り越え(translesion)ポリメラーゼによって(例えば、塩基修復機構によって)置換することができる。脱塩基部位と反対側の核酸塩基がCで置き換わることが典型的であるが、他の置換(例えば、A、GまたはT)も生じ得る。
【0370】
したがって、一部の実施形態では、本明細書に記載の塩基エディターは、ポリヌクレオチドの標的CをUに脱アミノ化することができる脱アミノ化ドメイン(例えば、シチジンデアミナーゼドメイン)を含む。さらに、以下に記載されるように、塩基エディターは、一部の実施形態では、脱アミノ化から生じるUからTまたはUからGの変換を促進する追加のドメインを含み得る。例えば、シチジンデアミナーゼドメインを含む塩基エディターは、TによるUの置換を媒介するウラシルグリコシラーゼ阻害剤(UGI)ドメインをさらに含み得、CからTの塩基編集事象を完了する。別の例では、損傷乗り越えポリメラーゼが、脱塩基部位と反対側のCの組み込みを促進することができる(すなわち、脱塩基部位でGの組み込みをもたらし、CからGの塩基性編集事象を完了する)ため、塩基エディターに、損傷乗り越えポリメラーゼを組み込んで、CからGの塩基編集の効率を向上させることができる。
【0371】
ドメインとしてシチジンデアミナーゼを含む塩基エディターは、DNA、RNA、及びDNA-RNAハイブリッドを含む、任意のポリヌクレオチドの標的Cを脱アミノ化することができる。典型的には、シチジンデアミナーゼは、ポリヌクレオチドの一本鎖部分の文脈に位置するC核酸塩基を触媒する。一部の実施形態では、標的Cを含むポリヌクレオチド全体が、一本鎖であり得る。例えば、塩基エディターに組み込まれたシチジンデアミナーゼは、一本鎖RNAポリヌクレオチドの標的Cを脱アミノ化することができる。他の実施形態では、シチジンデアミナーゼドメインを含む塩基エディターは、二本鎖ポリヌクレオチドに作用し得るが、標的Cは、脱アミノ化反応時に一本鎖状態にあるポリヌクレオチドの一部に位置し得る。例えば、NAGPBドメインがCas9ドメインを含む実施形態では、いくつかのヌクレオチドは、Cas9-gRNA標的DNA複合体の形成中に不対のままであり得、Cas9の「R-ループ複合体」の形成をもたらす。これらの不対のヌクレオチドは、一本鎖DNAのバブル(bubble)を形成することができ、一本鎖特異的ヌクレオチドデアミナーゼ酵素(例えば、シチジンデアミナーゼ)の基質として機能することができる。
【0372】
一部の実施形態では、塩基エディターのシチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部または一部を含むことができる。APOBECは進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUの編集酵素である。APOBEC様タンパク質のN末端ドメインは、触媒ドメインであり、C末端ドメインは、偽触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(現在、「APOBEC3E」は、これを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、及び活性化誘導(シチジン)デアミナーゼが含まれる。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC2デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Aデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Bデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Cデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Dデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Eデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Fデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Gデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC3Hデアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC4デアミナーゼの全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、活性化誘導デアミナーゼ(AID)の全部または一部を含む。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、シチジンデアミナーゼ1(CDA1)の全部または一部を含む。塩基エディターは、任意の好適な生物(例えば、ヒトまたはラット)由来のデアミナーゼを含み得ることを理解されたい。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウス由来である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ラット(例えば、ラットAPOBEC1)に由来する。一部の実施形態では、塩基エディターのデアミナーゼドメインは、ヒトAPOBEC1である。一部の実施形態では、塩基エディターのデアミナーゼドメインは、pmCDA1である。
【0373】
本開示の態様に従って、Cas9に融合され得る他の例示的なデアミナーゼを、以下に提供する。実施形態では、デアミナーゼは、活性化誘導デアミナーゼ(AID)である。一部の実施形態では、それぞれの配列の活性ドメイン、例えば、局在化シグナルがないドメイン(核局在化配列、核輸送シグナルなし、細胞質局在化シグナル)が使用され得ることを理解されたい。
【0374】
本開示の一部の態様は、例えば、デアミナーゼドメインにおける点変異を作製することによって、本明細書に記載の融合タンパク質のいずれかのデアミナーゼドメインの触媒活性を調節することが、融合タンパク質(例えば、塩基エディター)の処理性に影響するという認識に基づく。例えば、塩基編集融合タンパク質内のデアミナーゼドメインの触媒活性を低下させるが除去しない変異は、デアミナーゼドメインが標的残基に隣接する残基の脱アミノ化を触媒し、それによって、脱アミノ化のウィンドウを狭める可能性を低くすることができる。脱アミノ化のウィンドウを狭める能力は、特定の標的残基に隣接する残基の望ましくない脱アミノ化を防ぐことができ、オフターゲット効果を低減または防止することができる。
【0375】
例えば、一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121X、H122X、R126X、R126X、R118X、W90X、W90X、及びR132X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R、H122R、R126A、R126E、R118A、W90A、W90Y、及びR132Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。
【0376】
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316X、D317X、R320X、R320X、R313X、W285X、W285X、R326X(ここで、Xは、任意のアミノ酸である)からなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのD316R、D317R、R320A、R320E、R313A、W285A、W285Y、R326Eからなる群から選択される1つ以上の変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。
【0377】
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のH121R及びH122R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR118A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y及びR126E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のR126E及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、rAPOBEC1のW90Y、R126E、及びR132E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。
【0378】
一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのD316R及びD317R変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、hAPOBEC3GのR320A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含む。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR313A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285A変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y及びR320E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのR320E及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。一部の実施形態では、塩基エディターに組み込まれるAPOBECデアミナーゼは、hAPOBEC3GのW285Y、R320E、及びR326E変異、または別のAPOBECデアミナーゼにおける1つ以上の対応する変異を含むAPOBECデアミナーゼを含むことができる。
【0379】
いくつかの修飾シチジンデアミナーゼが市販されており、これらに限定されないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、及びYEE-BE3が挙げられ、これらは、Addgeneから入手可能である(プラスミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。一部の実施形態では、塩基エディターに組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部または一部を含む。
【0380】
一部の実施形態では、本発明の融合タンパク質は、1つ以上のシチジンデアミナーゼドメインを含む。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、シトシンまたは5-メチルシトシンをウラシルまたはチミンに脱アミノすることができる。一部の実施形態では、本明細書に提供されるシチジンデアミナーゼは、DNAのシトシンを脱アミノ化することができる。シチジンデアミナーゼは、任意の好適な生物に由来し得る。一部の実施形態では、シチジンデアミナーゼは、本明細書に提供される変異のいずれかに対応する1つ以上の変異を含む、天然のシチジンデアミナーゼである。当業者は、例えば、配列アラインメント及び相同残基の決定によって、任意の相同タンパク質の対応する残基を特定することができるであろう。したがって、当業者であれば、本明細書に記載の変異のいずれかに対応する任意の天然のシチジンデアミナーゼにおける変異を生成することができるであろう。一部の実施形態では、シチジンデアミナーゼは、原核生物由来である。一部の実施形態では、シチジンデアミナーゼは、細菌由来である。一部の実施形態では、シチジンデアミナーゼは、哺乳類(例えば、ヒト)由来である。
【0381】
一部の実施形態では、シチジンデアミナーゼは、本明細書に記載のアミノ酸配列のいずれか1つと、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%同一であるアミノ酸配列を含む。本明細書に提供されるシチジンデアミナーゼが、1つ以上の変異(例えば、本明細書に提供される変異のいずれか)を含み得ることを理解されたい。一部の実施形態は、任意の以前の態様または本明細書に記載のシチジンデアミナーゼ核酸塩基エディターポリペプチドをコードするポリヌクレオチド分子を提供する。一部の実施形態では、ポリヌクレオチドは、コドン最適化されている。
【0382】
本開示は、特定のパーセント同一性、加えて、本明細書に記載の変異またはそれらの組み合わせのうちのいずれかを有する、任意のデアミナーゼドメインを提供する。一部の実施形態では、シチジンデアミナーゼは、参照配列または本明細書に提供されるシチジンデアミナーゼのいずれかと比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個、またはそれ以上の変異を有するアミノ酸配列を含む。一部の実施形態では、シチジンデアミナーゼは、当該技術分野において既知であるか、または本明細書に記載のアミノ酸配列のいずれか1つと比較して、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、少なくとも150、少なくとも160、または少なくとも170個の同一の連続したアミノ酸残基を有するアミノ酸配列を含む。
【0383】
本発明の融合タンパク質は、2つ以上の核酸編集ドメインを含む。
【0384】
CからTの核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/US2016/058344号(WO2017/070632)及びKomor,A.C.,et al.,”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)に記載されている(それらの内容全体が、参照により本明細書に援用される)。
【0385】
ガイドポリヌクレオチド
ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、結合したガイドポリヌクレオチド(例えば、gRNA)と併せた場合、標的ポリヌクレオチド配列に特異的に結合し(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)、それによって、塩基エディターを編集が望まれる標的核酸配列に局在化させ得る。一部の実施形態では、標的ポリヌクレオチド配列は、一本鎖DNAまたは二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、RNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。
【0386】
CRISPRは、可動遺伝要素(ウイルス、転位要素、及び接合性プラスミド)に対する保護を提供する適応免疫系である。CRISPRクラスターは、スペーサー、先行可動要素に相補的な配列、及び標的侵入核酸を含む。CRISPRクラスターが転写され、CRISPR RNA(crRNA)に加工される。II型CRISPRシステムでは、crRNA前駆体の正しいプロセシングには、トランスコード化低分子RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)、及びCas9タンパク質が必要である。tracrRNAは、crRNA前駆体のリボヌクレアーゼ3支援プロセシングのガイドとして機能する。続いて、Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状のdsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合及びDNA切断は、典型的には、タンパク質及び両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)は、crRNA及びtracrRNAの両方の態様をシングルRNA種内に組み込むように操作され得る。例えば、Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。Cas9は、CRISPR反復配列の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己の区別を助ける。例えば、”Complete genome sequence of an M1 strain of Streptococcus pyogenes.”Ferretti,J.J.et al.,Natl.Acad.Sci.U.S.A.98:4658-4663(2001)、”CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.”Deltcheva E.,et al.,Nature 471:602-607(2011)、及び”Programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.,et al.,Science 337:816-821(2012)を参照されたい。それらの各々の内容全体が、参照により本明細書に援用される)。
【0387】
PAM配列は、当該技術分野で既知の任意のPAM配列であり得る。好適なPAM配列は、NGG、NGA、NGC、NGN、NGT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAWまたはNAAAACを含むが、これらに限定されない。Yは、ピリミジンであり、Nは、任意のヌクレオチド塩基であり、Wは、AまたはTである。
【0388】
一実施形態では、本明細書に記載されるガイドポリヌクレオチドは、RNAまたはDNAであることができる。一実施形態では、ガイドポリヌクレオチドは、gRNAである。RNA/Cas複合体は、Casタンパク質を標的DNAへ「ガイド」するのを支援することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な直鎖または環状dsDNA標的をエンドヌクレアーゼ分解的に切断する。crRNAに相補的でない標的鎖は、まず、エンドヌクレアーゼ分解的に切断され、次いで、3’-5’エキソヌクレアーゼ分解的にトリミングされる。本質的に、DNA結合及びDNA切断は、典型的には、タンパク質及び両方のRNAを必要とする。しかしながら、シングルガイドRNA(「sgRNA」または単純に「gRNA」)は、crRNA及びtracrRNAの両方の態様をシングルRNA種内に組み込むように操作され得る。例えば、Jinek M.,et al.Science 337:816-821(2012)を参照されたい(その内容全体が、参照により本明細書に援用される)。
【0389】
一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのシングルガイドRNA(「sgRNA」または「gRNA」)である。一部の実施形態では、ガイドポリヌクレオチドは、2つ以上の個々のポリヌクレオチドを含み、これらのポリヌクレオチドは、例えば、相補的塩基対形成(例えば、デュアルガイドポリヌクレオチド、デュアルgRNA)を介して、互いに相互作用することができる。例えば、ガイドポリヌクレオチドは、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)を含んでもよく、または1つ以上のトランス活性化CRISPR RNA(tracrRNA)を含んでもよい。
【0390】
一部の実施形態では、ガイドポリヌクレオチドは、少なくとも1つのtracrRNAである。一部の実施形態では、ガイドポリヌクレオチドは、ポリヌクレオチドプログラマブルDNA結合ドメイン(例えば、Cas9またはCpf1)を標的ヌクレオチド配列に誘導するためのPAM配列を必要としない。
【0391】
ガイドポリヌクレオチドは、天然のまたは天然でない(または非天然の)ヌクレオチド(例えば、ペプチド核酸またはヌクレオチド類似体)を含み得る。一部の場合では、ガイド核酸配列の標的領域は、少なくとも15、16、17、18、19、20、21、22、23、24、25、26、27、28、29または30ヌクレオチド長であることができる。ガイド核酸の標的領域は、10~30ヌクレオチド長、または15~25ヌクレオチド長、または15~20ヌクレオチド長であり得る。
【0392】
一部の実施形態では、本明細書に提供される塩基エディターは、1つ以上のガイドポリヌクレオチド(例えば、マルチプルgRNA)を利用する。一部の実施形態では、シングルガイドポリヌクレオチドは、本明細書に記載の異なる塩基エディター用に利用される。例えば、シングルガイドポリヌクレオチドは、シチジン塩基エディター及びアデノシン塩基エディター用に利用され得る。
【0393】
一部の実施形態では、本明細書に記載の方法は、操作されたCasタンパク質を利用することができる。ガイドRNA(gRNA)は、Cas結合のために必要な足場配列と、修飾されるゲノム標的を定義する、ユーザー定義の約20ヌクレオチドスペーサーとから構成された短い合成RNAである。例示的なgRNA足場配列は、配列番号405~415として配列表に示す。したがって、当業者は、Casタンパク質特異性のゲノム標的を変えることができ、gRNAの標的配列がゲノムの残部と比較して、ゲノム標的に対してどの程度特異的であるかによって部分的に決定される。
【0394】
他の実施形態では、ガイドポリヌクレオチドは、単一分子(すなわち、単一分子ガイド核酸)中の核酸のポリヌクレオチド標的化部分と核酸の足場部分との両方を含むことができる。例えば、単一分子ガイドポリヌクレオチドは、シングルガイドRNA(sgRNAまたはgRNA)であり得る。本明細書において、ガイドポリヌクレオチド配列という用語は、塩基エディターと相互作用し、標的ポリヌクレオチド配列に誘導し得る任意のシングル、デュアル、またはマルチプル核酸を企図する。
【0395】
典型的には、ガイドポリヌクレオチド(例えば、crRNA/trRNA複合体またはgRNA)は、標的ポリヌクレオチド配列を認識して結合することができる配列を含む「ポリヌクレオチド標的化セグメント」、及び塩基エディターのポリヌクレオチドプログラマブルヌクレオチド結合ドメイン成分内のガイドポリヌクレオチドを安定化する「タンパク質結合セグメント」を含む。一部の実施形態では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、DNAポリヌクレオチドを認識して結合し、それによって、DNA中の塩基の編集を促進する。他の場合では、ガイドポリヌクレオチドのポリヌクレオチド標的化セグメントは、RNAポリヌクレオチドを認識しそれに結合し、それによって、RNAにおける塩基の編集を容易にする。本明細書では、「セグメント」とは、分子のセクションまたは領域、例えば、ガイドポリヌクレオチドにおけるヌクレオチドの連続したストレッチを指す。セグメントはまた、セグメントが複数の分子の領域を含むことができるような、複合体の領域/セクションも指し得る。例えば、ガイドポリヌクレオチドが複数の核酸分子を含む場合、のタンパク質結合セグメントは、例えば、相補領域に沿ってハイブリダイズする複数の別個の分子の全部または一部を含み得る。一部の実施形態では、2つの別個の分子を含むDNA標的化RNAのタンパク質結合セグメントは、(i)長さが100塩基対である第1のRNA分子の40~75塩基対、及び(ii)長さが50塩基対である第2のRNA分子の10~25塩基対、を含み得る。「セグメント」の定義は、特定の文脈において別途具体的に定義されない限り、特定の数の総塩基対に限定されず、所与のRNA分子からの任意の特定の数の塩基対に限定されず、複合体内の特定の数の別個の分子に限定されず、任意の全長であり、かつ他の分子と相補性を有する領域を含み得るRNA分子の領域を含み得る。
【0396】
ガイドポリヌクレオチドは、化学的に合成されてもよく、酵素的に合成されてもよくまたはそれらの組み合わせで合成されてもよい。例えば、gRNAは、標準的なホスホラミダイトベースの固相合成法を使用して合成され得る。代替として、gRNAは、gRNAをコードするDNAを、ファージRNAポリメラーゼによって認識されるプロモーター制御配列に動作可能に連結することによって、インビトロで合成され得る。好適なファージプロモーター配列の例としては、T7、T3、SP6プロモーター配列、またはそれらのバリエーションが挙げられる。gRNAが2つの別個の分子(例えば、crRNA及びtracrRNA)を含む実施形態では、crRNAは、化学的に合成され得、tracrRNAは、酵素的に合成され得る。
【0397】
ガイドポリヌクレオチドは、例えば、gRNAをコードするDNA、例えば、gRNAをコードする配列を含むDNAベクターによって発現され得る。gRNAは、単独でコードされてもよくまたはコードされた塩基エディターと一緒にコードされてもよい。そのようなDNA配列は、発現システム(例えば、細胞)に、一緒にまたは別々に導入され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及びgRNAをコードするDNA配列は、細胞内に導入され得、各々のDNA配列は、別個の分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインコード配列を含有する1つのベクター及びgRNAコード配列を含有する第2のベクター)の一部分であってもよくまたは両方が、同じ分子(例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及びgRNAの両方のためのコード(及び調節)配列を含有する1つのベクター)の一部分であってもよい。RNAは、合成DNA分子、例えば、gBlocks(登録商標)遺伝子断片から転写され得る。gRNA分子は、インビトロで転写され得る。
【0398】
gRNAまたはガイドポリヌクレオチドは、以下の3つの領域:染色体配列における標的部位に相補的であることができる、5’末端での第1の領域と、ステムループ構造を形成することができる第2の内部領域と、一本鎖であることができる第3の3’領域とを含むことができる。各々のgRNAの第1の領域はまた、各々のgRNAが融合タンパク質を特定の標的部位へガイドするように異なることができる。さらに、各々のgRNAの第2の領域及び第3の領域は、全てのgRNAにおいて同一であることができる。
【0399】
gRNAまたはガイドポリヌクレオチドの第1の領域は、gRNAの第1の領域が標的部位と塩基対形成することができるように、染色体配列における標的部位での配列に相補的であることができる。一部の場合では、gRNAの第1の領域は、10個のヌクレオチド~25個のヌクレオチドもしくは約10個のヌクレオチド~約25個のヌクレオチド(すなわち、10個のヌクレオチド~25個のヌクレオチドまたは約10個のヌクレオチド~約25個のヌクレオチドまたは10個のヌクレオチド~約25個のヌクレオチドまたは約10個のヌクレオチド~25個のヌクレオチド)、またはそれ以上を含むことができる。例えば、gRNAの第1の領域と染色体配列における標的部位との間の塩基対形成の領域は、10、11、12、13、14、15、16、17、18、19、20、22、23、24もしくは25ヌクレオチド長以上であってもよく、または約10、11、12、13、14、15、16、17、18、19、20、22、23、24もしくは25ヌクレオチド長以上であってもよい。しばしば、gRNAの第1の領域は、19、20もしくは21ヌクレオチド長であってもよく、または約19、20もしくは21ヌクレオチド長であってもよい。
【0400】
gRNAまたはガイドポリヌクレオチドはまた、二次構造を形成する第2の領域を含むことができる。例えば、gRNAによって形成された二次構造は、ステム(またはヘアピン)及びループを含むことができる。ループ及びステムの長さは、異なり得る。例えば、ループは、3~10ヌクレオチド長または約3~10ヌクレオチド長の範囲であり得、ステムは、6~20塩基対長または約6~20塩基対長の範囲であり得る。ステムは、1~10ヌクレオチドまたは約10ヌクレオチドの1つ以上のバルジを含むことができる。第2の領域の全長は、16~60ヌクレオチド長または約16~60ヌクレオチド長の範囲であり得る。例えば、ループは、4ヌクレオチド長または約4ヌクレオチド長であり得、ステムは、12塩基対長または約12塩基対であり得る。
【0401】
gRNAまたはガイドポリヌクレオチドはまた、本質的に一本鎖であることができる、3’末端での第3の領域を含むことができる。例えば、第3の領域は、しばしば、目的の細胞内のいずれかの染色体配列に相補的でなく、しばしば、gRNAの残部に相補的でない。さらに、第3の領域の長さは、異なり得る。第3の領域は、4ヌクレオチド長以上または約4ヌクレオチド長以上であり得る。例えば、第3の領域の長さは、5~60ヌクレオチド長または約5~60ヌクレオチド長の範囲であり得る。
【0402】
gRNAまたはガイドポリヌクレオチドは、遺伝子標的のいずれかのエキソンまたはイントロンを標的とすることができる。一部の場合では、ガイドは、遺伝子のエキソン1または2を標的とすることができ、他の場合では、ガイドは、遺伝子のエキソン3または4を標的とすることができる。一部の実施形態では、組成物は、全てが同じエキソンを標的とする複数のgRNAまたは異なるエキソンを標的とする複数のgRNAを含む。遺伝子のエキソン及び/またはイントロンが標的とされ得る。
【0403】
gRNAまたはガイドポリヌクレオチドは、約20個のヌクレオチドもしくは約20個未満のヌクレオチド(例えば、少なくとも約5、10、15、16、17、18、19、20、21、22、23、24、25、30個のヌクレオチド)、または約1~100個のうちのいずれかの個数(例えば、5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100個)のヌクレオチドの核酸配列を標的とすることができる。標的核酸配列は、PAMの第1のヌクレオチドのすぐ5’の20個の塩基であってもよくまたは約20個の塩基であってもよい。gRNAは、核酸配列を標的とすることができる。標的核酸は、少なくともまたは少なくとも約1~10、1~20、1~30、1~40、1~50、1~60、1~70、1~80、1~90、または1~100ヌクレオチドであり得る。
【0404】
ガイドポリヌクレオチド、例えば、gRNA及び標的配列を選択、設計及び検証するための方法は、本明細書に記載され、当業者に既知である。例えば、核酸塩基エディターシステムにおけるデアミナーゼドメイン(例えば、AIDドメイン)の潜在的な基質混乱の影響を最小化するために、脱アミノ化のために意図せずに標的とされ得る残基(例えば、標的核酸遺伝子座内の一本鎖DNAにおいて潜在的に存在し得るオフターゲットC残基)の数が、最小化され得る。さらに、ソフトウェアツールを使用して、標的核酸配列に対応するgRNAを最適化し、例えば、ゲノムにわたって総オフターゲット活性を最小化することができる。例えば、S.pyogenes Cas9を使用する各可能な標的化ドメインの選択の場合、全てのオフターゲット配列(前述の選択されたPAM、例えば、NAGまたはNGG)は、最大で一定数(例えば、1、2、3、4、5、6、7、8、9、または10)の不一致塩基対を含むゲノムにわたって特定され得る。標的部位に相補的なgRNAの第1の領域を特定することができ、全ての第1の領域(例えば、crRNA)は、その総予測オフターゲットスコアに従ってランク付けすることができ、上位の標的化ドメインは、最大のオンターゲット活性及び最小のオフターゲット活性を有する可能性が高いものを表す。gRNAを標的とする候補は、当該技術分野で既知である方法、及び/または本明細書に記載の方法を使用することによって機能的に評価することができる。
【0405】
非限定的な例として、Cas9とともに使用するための、gRNAのcrRNAにおける標的DNAハイブリダイズ配列は、DNA配列検索アルゴリズムを使用して特定され得る。gRNA設計は、パブリックツールcas-OFFinderに基づくカスタムgRNA設計ソフトウェアを使用して実施され、これは、Bae S.,Park J.,& Kim J.-S.Cas-OFFinder:A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA-guided endonucleases.Bioinformatics 30,1473-1475(2014)に記載されている。このソフトウェアは、ゲノム全体のオフターゲット傾向を計算した後、ガイドをスコア付けする。典型的には、長さが17~24の範囲のガイドの場合、完全一致から7つの不一致までの範囲の一致が考慮される。オフターゲット部位が計算的に決定されると、各ガイドについて集計スコアが計算され、ウェブインターフェースを使用して表形式出力で要約される。本ソフトウェアは、PAM配列に隣接する潜在的な標的部位を特定することに加えて、選択された標的部位から1、2、3個、または3個超のヌクレオチドが異なる全てのPAM隣接配列も特定する。標的核酸配列(例えば、標的遺伝子)のゲノムDNA配列を取得してもよく、公的に利用可能なツール(例えば、RepeatMaskerプログラム)を使用して、反復エレメントをスクリーニングしてもよい。RepeatMaskerは、入力DNA配列を、反復エレメント及び低複雑度領域について検索する。出力は、所与のクエリ配列に存在する反復の詳細な注釈である。
特定後に、gRNAの第1の領域、例えば、crRNAは、標的部位へのそれらの距離、それらの直交性及び関連するPAM配列との密接な一致についての5’ヌクレオチドの存在(例えば、関連するPAM、例えば、S.pyogenesについてはNGG PAM、S.aureusについてはNNGRRTまたはNNGRRV PAMを含有するヒトゲノム内での密接な一致の特定に基づく5’G)に基づいて、階層にランク付けされる。本明細書で使用される場合、直交性(orthogonality)は、標的配列に対する最小数の不一致を含むヒトゲノム内の配列の数を指す。「高レベルの直交性」または「良好な直交性」は、例えば、ヒトゲノム中に、意図された標的以外に同一の配列を有しないか、または標的配列中に1つもしくは2つの不一致を含む任意の配列も有しない20量体の標的化ドメインを指し得る。良好な直交性を有する標的化ドメインは、オフターゲットDNA切断を最小化するために選択され得る。
【0406】
次いで、gRNAは、RNA分子としてまたは非RNA核酸分子、例えば、DNA分子として、細胞または胚内に導入され得る。一実施形態では、gRNAをコードするDNAは、目的の細胞または胚内でのgRNAの発現のためのプロモーター制御配列に動作可能に連結されている。RNAコード配列は、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に動作可能に連結され得る。gRNAを発現させるために使用され得るプラスミドベクターは、px330ベクター及びpx333ベクターを含むが、これらに限定されない。一部の場合では、プラスミドベクター(例えば、px333ベクター)は、gRNAをコードする少なくとも2つのDNA配列を含むことができる。さらに、ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、GFPまたはピューロマイシンなどの抗生物質耐性遺伝子)及び複製起点などを含むことができる。gRNAをコードするDNA分子はまた、直鎖であることができる。gRNAまたはガイドポリヌクレオチドをコードするDNA分子はまた、環状であることができる。
【0407】
一部の実施形態では、レポーターシステムは、塩基編集活性を検出し候補ガイドポリヌクレオチドを試験するために使用される。一部の実施形態では、レポーターシステムは、レポーター遺伝子ベースのアッセイを含み、このアッセイにおいて、塩基編集活性は、レポーター遺伝子の発現をもたらす。例えば、レポーターシステムは、非活性化開始コドン(例えば、鋳型鎖上の3’-TAC-5’から3’-CAC-5’への変異)を含むレポーター遺伝子を含み得る。標的Cの脱アミノ化に成功すると、対応するmRNAは、5’-GUG-3’の代わりに5’-AUG-3’として転写され、レポーター遺伝子の翻訳を可能にする。好適なレポーター遺伝子は、当業者には明らかであろう。レポーター遺伝子の非限定的な例としては、緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質(RFP)、ルシフェラーゼ、分泌型アルカリホスファターゼ(SEAP)をコードする遺伝子、または当業者にとって検出可能であり、かつ明らかな任意の他の遺伝子が挙げられる。レポーターシステムは、多くの異なるgRNAを試験するために使用され得、gRNAは、例えば、標的DNA配列に対して、対応するデアミナーゼが標的とする残基(複数可)を決定するために試験される。非鋳型鎖を標的とするsgRNAもまた、特定の塩基編集タンパク質、例えば、Cas9デアミナーゼ融合タンパク質のオフターゲット効果を評価するために試験され得る。一部の実施形態では、このようなgRNAは、変異した開始コドンがgRNAと塩基対を形成しないように設計することができる。ガイドポリヌクレオチドは、標準的なリボヌクレオチド、修飾されたリボヌクレオチド(例えば、プソイドウリジン)、リボヌクレオチド異性体及び/またはリボヌクレオチド類似体を含むことができる。一部の実施形態では、ガイドポリヌクレオチドは少なくとも1つの検出可能な標識を含むことができる。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、テキサスレッド、Oregon Green、Alexa Fluor、Halo tagまたは好適な蛍光色素)、検出タグ(例えば、ビオチン及びジゴキシゲニンなど)、量子ドットまたは金粒子であることができる。
【0408】
一部の実施形態では、塩基エディターシステムは、複数のガイドポリヌクレオチド(例えば、gRNA)を含み得る。例えば、gRNAは、塩基エディターシステムにおいて含まれる1つ以上の標的遺伝子座(例えば、少なくとも1つのgRNA、少なくとも2つのgRNA、少なくとも5つのgRNA、少なくとも10個のgRNA、少なくとも20個のgRNA、少なくとも30個のgRNA、少なくとも50個のgRNA)を標的とし得る。複数のgRNA配列は、直列に配置され得、好ましくは、ダイレクトリピートによって分離されている。
修飾されたポリヌクレオチド
【0409】
発現、安定性及び/またはゲノム/塩基編集効率を増強するために、及び/または可能性のある毒性を低減するために、塩基エディターコード配列(例えば、mRNA)及び/またはガイドポリヌクレオチド(例えば、gRNA)は、1つ以上の修飾されたヌクレオチド及び/または化学的修飾を含むように、例えば、プソイドウリジン、5-メチル-シトシン、2’-O-メチル-3’-ホスホノアセテート、2’-O-メチルチオPACE(MSP)、2’-O-メチル-PACE(MP)、2’-フルオロRNA(2’-F-RNA)、拘束エチル(S-cEt)、2’-O-メチル(「M」)、2’-O-メチル-3’-ホスホロチオエート(「MS」)、2’-O-メチル-3’-チオホスホノアセテート(「MSP」)、5-メトキシウリジン、ホスホロチオエート及びN1-メチルプソイドウリジンを使用して修飾され得る。化学的に保護されたgRNAは、安定性及び編集効率をインビボ及びエクスビボで増強することができる。化学的修飾されたmRNA及びガイドRNAを使用する方法は当技術分野で公知であり、例えば、Jiang et al., Chemical modifications of adenine base editor mRNA and guide RNA expand its application scope.Nat Commun 11,1979(2020).doi.org/10.1038/s41467-020-15892-8,Callum et al.,N1-Methylpseudouridine substitution enhances the performance of synthetic mRNA switches in cells,Nucleic Acids Research,Volume 48,Issue 6,06 April 2020,Page e35及びAndries et al.,Journal of Controlled Release,Volume 217,10 November 2015,Pages 337-344によって記載されており、それらの各々は、その全体が参照により本明細書に援用される。
【0410】
特定の実施形態では、化学的修飾は2’-O-メチル(2’-OMe)修飾である。修飾されたガイドRNAは、saCas9の有効性、及び特異性も向上させる可能性がある。個々の修飾の効果は、使用する化学的修飾の位置と組み合わせ、及び他の修飾ヌクレオチドとの分子間及び分子内相互作用に基づいて異なる。一例として、S-cEtは、オリゴヌクレオチド分子内フォールディングを改善するために使用されている。
【0411】
一部の実施形態では、ガイドポリヌクレオチドは、1つ以上の修飾されたヌクレオチドを、ガイドの5’末端及び/または3’末端で含む。一部の実施形態では、ガイドポリヌクレオチドは、2つ、3つまたは4つ以上の修飾されたヌクレオチドを、ガイドの5’末端及び/または3’末端で含む。一部の実施形態では、ガイドポリヌクレオチドは、2つ、3つまたは4つ以上の修飾されたヌクレオチドを、ガイドの5’末端及び/または3’末端で含む。一部の実施形態では、ガイドポリヌクレオチドは、4つの修飾されたヌクレオチドを、ガイドの5’末端で含み、4つの修飾されたヌクレオチドを、ガイドの3’末端で含む。一部の実施形態では、修飾されたヌクレオチドは、2’-O-メチルまたはホスホロチオエートを含む。
【0412】
一部の実施形態では、ガイドは、少なくとも約50%~75%の修飾されたヌクレオチドを含む。一部の実施形態では、ガイドは、少なくとも約85%以上の修飾されたヌクレオチドを含む。一部の実施形態では、gRNAの5’末端での少なくとも約1~5つのヌクレオチドが修飾されており、gRNAの3’末端での少なくとも約1~5つのヌクレオチドが修飾されている。一部の実施形態では、gRNAの5’及び3’末端の各々での少なくとも約3~5つの連続したヌクレオチドが修飾されている。一部の実施形態では、ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドの少なくとも約20%が修飾されている。一部の実施形態では、ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドの少なくとも約50%が修飾されている。一部の実施形態では、ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドの少なくとも約50~75%が修飾されている。一部の実施形態では、ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドのうちの少なくとも約100個が修飾されている。一部の実施形態では、gRNA足場内に存在するヘアピン内に存在するヌクレオチドの少なくとも約20%以上が修飾されている。一部の実施形態では、gRNA足場内に存在するヘアピン内に存在するヌクレオチドの少なくとも約50%以上が修飾されている。一部の実施形態では、ガイドは、可変長スペーサーを含む。一部の実施形態では、ガイドは、20~40ヌクレオチドスペーサーを含む。一部の実施形態では、ガイドは、少なくとも約20~25個のヌクレオチドまたは少なくとも約30~35個のヌクレオチドを含むスペーサーを含む。一部の実施形態では、スペーサーは、修飾されたヌクレオチドを含む。一部の実施形態では、ガイドは、以下のうちの2つ以上を含む:
gRNAの5’末端での少なくとも約1~5つのヌクレオチドが修飾されており、gRNAの3’末端での少なくとも約1~5つのヌクレオチドが修飾されていること、
ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドの少なくとも約20%が修飾されていること、
ダイレクトリピートまたはアンチダイレクトリピート内に存在するヌクレオチドの少なくとも約50~75%が修飾されていること、
gRNA足場内に存在するヘアピン内に存在するヌクレオチドの少なくとも約20%以上が修飾されていること、
可変長スペーサー、及び
修飾されたヌクレオチドを含むスペーサー。
【0413】
実施形態では、gRNAは、多数の修飾されたヌクレオチド及び/または化学的修飾(「重い修飾(heavy mod)」)を含有する。このような重い修飾は、インビボまたはインビトロで、塩基編集を約2倍増加させることができる。このような修飾については、当業者には理解されるように、mN=2’-OMeであり、Ns=ホスホロチオエート(PS)であり、「N」は、いずれかのヌクレオチドを表す。場合によっては、ヌクレオチド(N)に2つの修飾、例えば、2’-OMe修飾とPS修飾の両方が含まれる場合がある。例えば、ホスホロチオエートと、2’-OMeとを有するヌクレオチドは、「mNs」と示され、2つの修飾が互いに隣にあるときに、「mNsmNs」と示される。
【0414】
修飾されたgRNAの一部の実施形態では、gRNAは、2’-O-メチル(2’-OMe)、ホスホロチオエート(PS)、2’-O-メチルチオPACE(MSP)、2’-O-メチル-PACE(MP)、2’-O-メチルチオPACE(MSP)、2’-フルオロRNA(2’-F-RNA)及び拘束エチル(S-cEt)からなる群から選択される1つ以上の化学的修飾を含む。実施形態では、gRNAは、2’-O-メチルまたはホスホロチオエート修飾を含む。一実施形態では、gRNAは、2’-O-メチル及びホスホロチオエート修飾を含む。一実施形態では、修飾は、塩基編集を少なくとも約2倍増加させる。
【0415】
ガイドポリヌクレオチドは、新しい特徴または増強された特徴を有する核酸を提供するために、1つ以上の修飾を含むことができる。ガイドポリヌクレオチドは、核酸親和性タグを含むことができる。ガイドポリヌクレオチドは、合成ヌクレオチド、合成ヌクレオチド類似体、ヌクレオチド誘導体、及び/または修飾ヌクレオチドを含むことができる。
【0416】
一部の場合では、gRNAまたはガイドポリヌクレオチドは、修飾を含むことができる。修飾は、gRNAまたはガイドポリヌクレオチドの任意の位置で行われ得る。単一のgRNAまたはガイドポリヌクレオチドに対して、複数の修飾を行うことができる。gRNAまたはガイドポリヌクレオチドは、修飾後に、品質管理に供され得る。一部の場合では、品質管理は、PAGE、HPLC、MSまたはそれらのいずれかの組み合わせを含むことができる。
【0417】
gRNAまたはガイドポリヌクレオチドの修飾は、置換、挿入、欠失、化学的修飾、物理修飾、安定化、精製、またはそれらの任意の組み合わせであり得る。
【0418】
gRNAまたはガイドポリヌクレオチドはまた、5’アデニレート、5’グアノシン-トリホスフェートキャップ、5’N7-メチルグアノシン-トリホスフェートキャップ、5’トリホスフェートキャップ、3’ホスフェート、3’チオホスフェート、5’ホスフェート、5’チオホスフェート、シス-シンチミジン二量体、三量体、C12スペーサー、C3スペーサー、C6スペーサー、dスペーサー、PCスペーサー、rスペーサー、スペーサー18、スペーサー9、3’-3’修飾、2’-O-メチルチオPACE(MSP)、2’-O-メチル-PACE(MP)及び拘束エチル(S-cEt)、5’-5’修飾、脱塩基、アクリジン、アゾベンゼン、ビオチン、ビオチンBB、ビオチンTEG、コレステリルTEG、デスチオビオチンTEG、DNP TEG、DNP-X、DOTA、dT-ビオチン、デュアルビオチン、PCビオチン、ソラレンC2、ソラレンC6、TINA、3’DABCYL、black hole quencher 1、black hole quencher 2、DABCYL SE、dT-DABCYL、IRDye QC-1、QSY-21、QSY-35、QSY-7、QSY-9、カルボキシルリンカー、チオールリンカー、2’-デオキシリボヌクレオチド類似体プリン、2’-デオキシリボヌクレオチド類似体ピリミジン、リボヌクレオチド類似体、2’-O-メチルリボヌクレオチド類似体、糖修飾された類似体、ゆらぎ/ユニバーサル塩基、蛍光色素標識、2’-フルオロRNA、2’-O-メチルRNA、メチルホスホネート、ホスホジエステルDNA、ホスホジエステルRNA、ホスホチオエートDNA、ホスホロチオエートRNA、UNA、プソイドウリジン-5’-トリホスフェート、5’-メチルシチジン-5’-トリホスフェート、またはそれらのいずれかの組み合わせによって修飾され得る。
【0419】
一部の場合では、修飾は、永続的である。他の場合では、修飾は、一過的である。一部の場合では、複数の修飾が、gRNAまたはガイドポリヌクレオチドになされる。gRNAまたはガイドポリヌクレオチド修飾は、ヌクレオチドの生理化学的特性(例えば、ヌクレオチドの立体構造、極性、疎水性、化学反応性、塩基対相互作用、またはそれらの任意の組み合わせ)を改変させることができる。
【0420】
ガイドポリヌクレオチドは、細胞を、単離されたgRNAで、またはガイドRNA及びプロモーターをコードする配列を含むプラスミドDNAでトランスフェクトすることによって、細胞内に移入され得る。gRNAまたはガイドポリヌクレオチドはまた、他の様式で、例えば、ウイルス媒介性遺伝子送達を使用して、細胞内に移入され得る。gRNAまたはガイドポリヌクレオチドは、単離され得る。例えば、gRNAは、単離されたRNAの形態で、細胞または生物内にトランスフェクトされ得る。gRNAは、インビトロ転写によって、当該技術分野で既知のいずれかのインビトロ転写システムを使用して調製され得る。gRNAは、gRNAについてのコード配列を含むプラスミドの形態ではなく、単離されたRNAの形態で、細胞に移入され得る。
【0421】
修飾は、ホスホロチオエート置換体であり得る。一部の場合では、天然のホスホジエステル結合は、細胞ヌクレアーゼによって急速に分解されやすいことがあり、ホスホロチオエート(PS)結合置換を使用するヌクレオチド間連結の修飾は、細胞分解による加水分解に対してより安定していることがある。修飾は、gRNAまたはガイドポリヌクレオチドにおける安定性を増加させることができる。修飾はまた、生物学的活性を増強することもできる。一部の場合では、ホスホロチオエートで増強されたRNAであるgRNAは、RNase A、RNase T1、ウシ血清ヌクレアーゼまたはそれらのいずれかの組み合わせを阻害することができる。これらの特性は、インビボまたはインビトロでヌクレアーゼに曝露される可能性が高い用途において、PS-RNA gRNAの使用を可能にすることができる。例えば、ホスホロチオエート(PS)結合は、gRNAの5’または3’末端での最後の3~5つのヌクレオチド間に導入され得、これは、エキソヌクレアーゼ分解を阻害することができる。一部の場合では、ホスホロチオエート結合は、エンドヌクレアーゼによる攻撃を低減するために、gRNA全体にわたって付加され得る。
【0422】
一部の実施形態では、ガイドRNAは、スプライス部位(すなわち、スプライスアクセプター(SA)またはスプライスドナー(SD))を破壊するように設計される。一部の実施形態では、ガイドRNAは、塩基編集が未熟終止コドンをもたらすように設計される。
プロトスペーサー隣接モチーフ
【0423】
「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフという用語は、CRISPR細菌適応免疫系において、Cas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対のDNA配列を指す。一部の実施形態では、PAMは、5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置するPAM)であることができる。他の実施形態では、PAMは、3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置するPAM)であることができる。PAM配列は、標的結合に必須であるが、正確な配列はCasタンパク質の種類に依存する。PAM配列は、当該技術分野で既知の任意のPAM配列であり得る。好適なPAM配列には、NGG、NGA、NGC、NGN、NGT、NGTT、NGCG、NGAG、NGAN、NGNG、NGCN、NGCG、NGTN、NNGRRT、NNNRRT、NNGRR(N)、TTTV、TYCV、TYCV、TATV、NNNNGATT、NNAGAAW、またはNAAAACが含まれるが、これらに限定されない。Yは、ピリミジンであり、Nは、任意のヌクレオチド塩基であり、Wは、AまたはTである。
【0424】
本明細書に提供される塩基エディターは、CRISPRタンパク質由来ドメインを含むことができ、これは、正準または非正準プロトスペーサー隣接モチーフ(PAM)配列を含むヌクレオチド配列に結合することができる。PAM部位は、標的ポリヌクレオチド配列に近接したヌクレオチド配列である。本開示の一部の態様は、塩基エディターを提供し、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む。
【0425】
例えば、典型的には、S.pyogenes(spCas9)由来のCas9などのCas9タンパク質は、特定の核酸領域に結合するために正準NGG PAM配列を必要とする(ここで、「NGG」における「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Gは、グアニンである)。PAMは、CRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは、標的配列の5’または3’であることができる。PAMは、標的配列の上流または下流であり得る。PAMは、1、2、3、4、5、6、7、8、9、10ヌクレオチド長、またはそれ以上であり得る。多くの場合、PAMは、2~6ヌクレオチド長である。
【0426】
一部の実施形態では、PAMは、「NRN」PAMであるか(ここで、「NRN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Rは、アデニン(A)またはグアニン(G)である)、またはPAMは、「NYN」PAMである(ここで、「NYN」の「N」は、アデニン(A)、チミン(T)、グアニン(G)、またはシトシン(C)であり、Yは、シチジン(C)またはチミン(T)である)。例えば、R.T.Walton et al.,2020,Science,10.1126/science.aba8853(2020)に記載されている(その内容全体が、参照により本明細書に援用される)。
【0427】
以下の表6に、いくつかのPAMバリアントを記載する。
【0428】
【表6】
【0429】
一部の実施形態では、PAMは、NGCである。一部の実施形態では、NGC PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGC PAMバリアントは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337Rから選択される1つ以上のアミノ酸置換を含む(総称して「MQKFRAER」)。
一部の実施形態では、PAMは、NGTである。一部の実施形態では、NGT PAMは、Cas9バリアントによって認識される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1335、1337、1135、1136、1218、及び/または1219における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1219、1335、1337、1218における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、1つ以上の残基1135、1136、1218、1219、及び1335における標的化変異導入を介して作製される。一部の実施形態では、NGT PAMバリアントは、以下の表7A及び7Bに示す標的変異のセットから選択される。
【0430】
【表7A】

【0431】
【表7B】
【0432】
一部の実施形態では、NGT PAMバリアントは、表7A及び7Bのバリアント5、7、28、31、または36から選択される。一部の実施形態では、バリアントは、改善されたNGT PAM認識を有する。
【0433】
一部の実施形態では、NGT PAMバリアントは、残基1219、1335、1337、及び/または1218に変異を有する。一部の実施形態では、NGT PAMバリアントは、認識を改善するための変異を有する、以下の表8に提供されるバリアントから選択される。
【0434】
【表8】
【0435】
一部の実施形態では、NGT PAMは、以下の表9に提供されるバリアントから選択される。
【0436】
【表9】
【0437】
一部の実施形態では、NGTNバリアントは、バリアント1である。一部の実施形態では、NGTNバリアントは、バリアント2である。一部の実施形態では、NGTNバリアントは、バリアント3である。一部の実施形態では、NGTNバリアントは、バリアント4である。一部の実施形態では、NGTNバリアントは、バリアント5である。一部の実施形態では、NGTNバリアントは、バリアント6である。
【0438】
一部の実施形態では、Cas9ドメインは、Streptococcus pyogenes(SpCas9)由来のCas9ドメインである。一部の実施形態では、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレアーゼ不活性SpCas9(SpCas9d)、またはSpCas9ニッカーゼ(SpCas9n)である。一部の実施形態では、SpCas9は、D9X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含み、Xは、Dを除く任意のアミノ酸である。一部の実施形態では、SpCas9は、D9A変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NGG、NGA、またはNGCG PAM配列を有する核酸配列に結合することができる。
【0439】
一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135E、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。一部の実施形態では、SpCas9ドメインは、D1135X、G1218X、R1335X、及びT1337X変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む(ここで、Xは、任意のアミノ酸である)。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異のうちの1つ以上を含む。一部の実施形態では、SpCas9ドメインは、D1135V、G1218R、R1335Q、及びT1337R変異、または本明細書に提供されるアミノ酸配列のうちのいずれかにおける対応する変異を含む。
【0440】
一部の実施例では、本明細書に開示される塩基エディターのCRISPRタンパク質由来ドメインによって認識されるPAMは、塩基エディターをコードする挿入物(例えば、AAV挿入物)に別個に対するオリゴヌクレオチド上で、細胞に提供され得る。そのような実施形態では、別個のオリゴヌクレオチド上にPAMを提供することで、標的配列の切断を可能になり、さもなければ、隣接するPAMが標的配列と同じポリヌクレオチド上に存在しないため、切断することができない。
【0441】
一実施形態では、S.pyogenes Cas9(SpCas9)は、ゲノム操作のためのCRISPRエンドヌクレアーゼとして使用することができる。ただし、他のものも使用することができる。一部の実施形態では、異なるエンドヌクレアーゼを使用して、特定のゲノム標的を標的とすることができる。一部の実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアントを使用することができる。加えて、様々な種に由来する他のCas9オルソログが同定されており、これらの「非SpCas9」は、本開示にも有用であり得る様々なPAM配列に結合することができる。例えば、比較的大きなサイズのSpCas9(約4kbのコード配列)は、細胞内で効率的に発現され得ないSpCas9 cDNAを有するプラスミドをもたらす可能性がある。逆に、Staphylococcus aureus Cas9(SaCas9)のコード配列は、SpCas9よりも約1キロ塩基短く、おそらく、細胞内でそれを効率的に発現させる。SpCas9と同様に、SaCas9エンドヌクレアーゼは、インビトロ及びマウスにおけるインビボで、哺乳類細胞の標的遺伝子を修飾することができる。一部の実施形態では、Casタンパク質は、異なるPAM配列を標的とすることができる。一部の実施形態では、標的遺伝子は、例えば、Cas9 PAMである5’-NGGに隣接することができる。他の実施形態では、他のCas9オルソログは、異なるPAM要件を有し得る。例えば、S.thermophilusのPAM(CRISPR1については5’-NNAGAA及びCRISPR3については5’-NGGNG)及びNeisseria meningitidisのPAM(5’-NNNNGATT)などの他のPAMもまた、標的遺伝子に隣接して見出され得る。
【0442】
一部の実施形態では、S.pyogenesシステムについては、標的遺伝子配列は、5’-NGG PAMに先行する(すなわち、5’側である)ことができ、20ntガイドRNA配列は、反対の鎖と塩基対形成して、PAMに隣接するCas9切断を媒介することができる。一部の実施形態では、隣接カットは、PAMの3塩基対上流であり得るか、または約3塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの10塩基対上流であり得るか、または約10塩基対上流であり得る。一部の実施形態では、隣接カットは、PAMの0~20塩基対上流であり得るか、または約0~20塩基対上流であり得る。例えば、隣接カットは、PAMの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対上流に隣接し得る。隣接カットは、PAMの1~30塩基対下流であり得る。PAM配列に結合することができる例示的なSpCas9タンパク質の配列は、以下のとおりである。
【0443】
一部の実施形態では、操作されたSpCas9バリアントは、3’H(非G PAM)に隣接するプロトスペーサー隣接モチーフ(PAM)配列を認識することが可能である(表2A~2Dを参照されたい)。一部の実施形態では、SpCas9バリアントは、NRNH PAMを認識する(ここで、Rは、AまたはGであり、Hは、A、C、またはTである)。一部の実施形態では、非G PAMは、NRRH、NRTH、またはNRCHである(例えば、Miller,S.M.,et al.Continuous evolution of SpCas9 variants compatible with non-G PAMs,Nat.Biotechnol.(2020)を参照されたい(その内容は、その全体が参照により本明細書に援用される)。
【0444】
一部の実施形態では、Cas9ドメインは、組換えCas9ドメインである。一部の実施形態では、組換えCas9ドメインは、SpyMacCas9ドメインである。一部の実施形態では、SpyMacCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9(SpyMacCas9d)、またはSpyMacCas9ニッカーゼ(SpyMacCas9n)である。一部の実施形態では、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非正準PAMを有する核酸配列に結合することができる。一部の実施形態では、SpyMacCas9ドメイン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合することができる。
【0445】
天然の5’-NAAN-3’PAM特異性を有するStreptococcus macacaeにおけるSpy Cas9の例示的なCas9 A相同体の配列は、当技術分野で既知であり、例えば、Chatterjee,et al.,”A Cas9 with PAM recognition for adenine dinucleotides”,Nature Communications,vol.11,article no.2474(2020)によって記載されており、配列表で配列番号325としてある。
【0446】
一部の実施形態では、バリアントCas9タンパク質は、ポリペプチドが標的DNAまたはRNAを切断する能力が低下するように、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有する。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、一部の実施形態では、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有し、そのため、ポリペプチドが標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的DNA(例えば、一本鎖標的DNA)を切断する能力が低下しているが、標的DNA(例えば、一本鎖標的DNA)に結合する能力を保持する。一部の実施形態では、バリアントCas9タンパク質がW476A及びW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、及びD1218A変異を有する場合、バリアントCas9タンパク質は、PAM配列に効率的に結合しない。したがって、一部のそのような事例では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、PAM配列を必要としない。言い換えると、一部の実施形態では、このようなバリアントCas9タンパク質が結合方法に使用される場合、本方法は、ガイドRNAを含み得るが、本方法は、PAM配列の不在下で実施することができる(したがって、結合の特異性が、ガイドRNAの標的化セグメントによって提供される)。他の残基を変異させて、上記の効果を達成することができる(すなわち、一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、及び/またはA987を改変(すなわち、置換)することができる。また、アラニン置換以外の変異も好適である。
【0447】
一部の実施形態では、塩基エディターのCRISPRタンパク質由来ドメインは、正準PAM配列(NGG)を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基エディターのCas9由来ドメインは、非正準PAM配列を用いることができる。そのような配列は当該技術分野において記載されており、当業者には明らかであろう。例えば、非正準PAM配列に結合するCas9ドメインは、Kleinstiver,B.P.,et al.,”Engineered CRISPR-Cas9 nucleases with altered PAM specificities”Nature 523,481-485(2015)、及びKleinstiver,B.P.,et al.,”Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology 33,1293-1298(2015)、R.T.Walton et al.”Unconstrained genome targeting with near-PAMless engineered CRISPR-Cas9 variants”Science 10.1126/science.aba8853(2020)、Hu et al.”Evolved Cas9 variants with broad PAM compatibility and high DNA specificity,”Nature,2018 Apr.5,556(7699),57-63、Miller et al.,”Continuous evolution of SpCas9 variants compatible with non-G PAMs”Nat.Biotechnol.,2020 Apr;38(4):471-481によって記載されており、各々の内容全体は、参照により本明細書に援用される。
【0448】
NapDNAbpとシチジンデアミナーゼ及び/またはアデノシンデアミナーゼを含む融合タンパク質
本開示の一部の態様は、Cas9ドメインまたは他の核酸プログラマブルDNA結合タンパク質(例えば、Cas12)と、1つ以上のシチジンデアミナーゼまたはアデノシンデアミナーゼドメインとを含む融合タンパク質を提供する。Cas9ドメインは、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のいずれであり得ることを理解されたい。一部の実施形態では、本明細書に提供されるCas9ドメインまたはCas9タンパク質(例えば、dCas9またはnCas9)のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼ及び/またはアデノシンデアミナーゼのうちのいずれかと融合され得る。本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。
【0449】
一部の実施形態では、融合タンパク質は、以下のドメインA~C、A~D、またはA~Eを含み:
NH2-[A-B-C]-COOH、
NH2-[A-B-C-D]-COOH、または
NH2-[A-B-C-D-E]-COOH、
式中、A及びC、またはA、C、及びEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
式中、B、またはB及びDは、各々、核酸配列特異的結合活性を有する1つ以上のドメインを含む。
【0450】
一部の実施形態では、融合タンパク質は、以下の構造を含み:
NH2-[An-Bo-Cn]-COOH、
NH2-[An-Bo-Cn-Do]-COOH、または
NH2-[An-Bo-Cp-Do-Eq]-COOH、
式中、A及びC、またはA、C、及びEは、各々、以下のうちの1つ以上を含み:
アデノシンデアミナーゼドメインまたはその活性断片、
シチジンデアミナーゼドメインまたはその活性断片、
式中、nは整数:1、2、3、4、または5であり、pは、整数:0、1、2、3、4、または5であり、qは、整数:0、1、2、3、4、または5であり、式中、B、またはB及びDは、各々、核酸配列特異的結合活性を有するドメインを含み、式中、oは、整数:1、2、3、4、または5である。
【0451】
例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas9ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH2-[Cas9ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOHを含む。
【0452】
一部の実施形態では、本明細書に提供されるCas12ドメインまたはCas12タンパク質のうちのいずれかが、本明細書に提供されるシチジンデアミナーゼまたはアデノシンデアミナーゼのうちのいずれかと融合され得る。例えば、限定されないが、一部の実施形態では、融合タンパク質は、以下の構造を含む:
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[Cas12ドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas12ドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[Cas12ドメイン]-COOH、
NH2-[Cas12ドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、または
NH2-[Cas12ドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH。
【0453】
一部の実施形態では、アデノシンデアミナーゼは、TadA*8である。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*8]-[Cas9ドメイン]-COOH、
NH2-[Cas9ドメイン]-[TadA*8]-COOH、
NH2-[TadA*8]-[Cas12ドメイン]-COOH、または
NH2-[Cas12ドメイン]-[TadA*8]-COOH。
【0454】
一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*8と、シチジンデアミナーゼ及び/またはアデノシンデアミナーゼとを含む。一部の実施形態では、TadA*8は、TadA*8.1、TadA*8.2、TadA*8.3、TadA*8.4、TadA*8.5、TadA*8.6、TadA*8.7、TadA*8.8、TadA*8.9、TadA*8.10、TadA*8.11、TadA*8.12、TadA*8.13、TadA*8.14、TadA*8.15、TadA*8.16、TadA*8.17、TadA*8.18、TadA*8.19、TadA*8.20、TadA*8.21、TadA*8.22、TadA*8.23、またはTadA*8.24である。
【0455】
例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*8]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH、
NH2-[TadA*8]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH2-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*8]-COOH。
【0456】
一部の実施形態では、融合タンパク質のアデノシンデアミナーゼは、TadA*9と、シチジンデアミナーゼ及び/またはアデノシンデアミナーゼとを含む。例示的な融合タンパク質の構造としては、以下が挙げられる:
NH2-[TadA*9]-[Cas9/Cas12]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH、
NH2-[TadA*9]-[Cas9/Cas12]-[シチジンデアミナーゼ]-COOH、または
NH2-[シチジンデアミナーゼ]-[Cas9/Cas12]-[TadA*9]-COOH。
【0457】
一部の実施形態では、融合タンパク質は、N末端断片に隣接するデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するシチジンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。一部の実施形態では、融合タンパク質は、N末端断片に隣接するアデノシンデアミナーゼと、Cas9またはCas12ポリペプチドのC末端断片とを含む。
【0458】
一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12ドメイン)とを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、リンカーは、シチジンデアミナーゼまたはアデノシンデアミナーゼとnapDNAbpとの間に存在する。一部の実施形態では、上記の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。
【0459】
本開示の融合タンパク質は、1つ以上の追加の特徴を含み得ることを理解されたい。例えば、一部の実施形態では、融合タンパク質は、阻害剤、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグを含んでもよい。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられる。さらなる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
【0460】
例示的であるが非限定的な融合タンパク質は、国際PCT出願第2017/044935号、第PCT/US2019/044935号、及び第PCT/US2020/016288号に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。
【0461】
核局在化配列(NLS)を含む融合タンパク質
一部の実施形態では、本明細書に提供される融合タンパク質は、1つまたは複数の(例えば、2、3、4、5)核標的化配列、例えば、核局在化配列(NLS)をさらに含む。一実施形態では、二分NLSが使用される。一部の実施形態では、NLSは、(例えば、核内輸送によって)細胞核へのNLSを含むタンパク質の移入を促進するアミノ酸配列を含む。一部の実施形態では、NLSは、融合タンパク質のN末端またはC末端に融合されている。一部の実施形態では、NLSは、nCas9ドメインまたはdCas9ドメインのC末端またはN末端に融合されている。一部の実施形態では、NLSは、Cas12ドメインのN末端またはC末端に融合されている。一部の実施形態では、NLSは、シチジンまたはアデノシンデアミナーゼのN末端またはC末端に融合されている。一部の実施形態では、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。一部の実施形態では、NLSは、リンカーなしで融合タンパク質に融合される。一部の実施形態では、NLSは、本明細書で提供または参照されるNLS配列のいずれか1つのアミノ酸配列を含む。追加の核局在化配列は、当該技術分野で既知であり、当業者には明らかであろう。例えば、NLS配列は、Plank et al.,PCT/EP2000/011690に記載されている(それらの内容は、例示的な核局在化配列の開示のために、参照により本明細書に援用される)。一部の実施形態では、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFESPKKKRKV(配列番号416)、KRTADGSEFESPKKKRKV(配列番号243)、KRPAATKKAGQAKKKK(配列番号244)、KKTELQTTNAENKTKKL(配列番号245)、KRGINDRNFWRGENGRKTR(配列番号246)、RKSGKIAAIVVKRPRKPKKKRKV(配列番号417)またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLC(配列番号249)を含む。
【0462】
一部の実施形態では、シチジンデアミナーゼまたはアデノシンデアミナーゼ、Cas9ドメイン、及びNLSを含む融合タンパク質は、リンカー配列を含まない。一部の実施形態では、ドメインまたはタンパク質(例えば、シチジンデアミナーゼもしくはアデノシンデアミナーゼ、Cas9ドメイン、またはNLS)のうちの1つ以上の間に、リンカー配列が存在する。一部の実施形態では、リンカーは、シチジンデアミナーゼ及びアデノシンデアミナーゼドメインと、napDNAbpとの間に存在する。一部の実施形態では、以下の一般的なアーキテクチャで使用される「-」は、任意選択のリンカーの存在を示す。一部の実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼと、napDNAbpとは、本明細書に提供されるリンカーのいずれかを介して融合される。例えば、一部の実施形態では、シチジンデアミナーゼ及びアデノシンデアミナーゼと、napDNAbpとは、本明細書で提供されるリンカーのうちのいずれかを介して融合されている。
【0463】
一部の実施形態では、シチジンまたはアデノシンデアミナーゼと、napDNAbp(例えば、Cas9またはCas12)ドメインとを有する例示的なnapDNAbp(例えば、Cas9またはCas12)融合タンパク質の一般的なアーキテクチャは、以下の構造のうちのいずれか1つを含み、以下の構造において、NLSは、核局在化配列(例えば、本明細書で提供されるいずれかのNLS)であり、NH2は、融合タンパク質のN末端であり、COOHは、融合タンパク質のC末端である:
NH2-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH2-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH2-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH2-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH2-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH2-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH2-NLS-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-COOH、
NH2-NLS-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-COOH、
NH2-NLS-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH2-NLS-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-COOH、
NH2-NLS-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-COOH、
NH2-NLS-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-COOH、
NH2-[シチジンデアミナーゼ]-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-NLS-COOH、
NH2-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-[シチジンデアミナーゼ]-NLS-COOH、
NH2-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH2-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-[napDNAbpドメイン]-NLS-COOH、
NH2-[napDNAbpドメイン]-[アデノシンデアミナーゼ]-[シチジンデアミナーゼ]-NLS-COOH、または
【0464】
NH2-[napDNAbpドメイン]-[シチジンデアミナーゼ]-[アデノシンデアミナーゼ]-NLS-COOH。一部の実施形態では、NLSは、例えば、本明細書に記載されるように、リンカー内に存在するか、またはNLSは、リンカーに隣接している。二分NLSは、2つの塩基性アミノ酸クラスターを含み、比較的短いスペーサー配列によって分離されている(したがって、二分(bipartite)-2つの部分であり、一方、一分(monopartite)NLSはそうではない)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKK(配列番号244)は、ユビキタスな双節型シグナルのプロトタイプであり、約10アミノ酸のスペーサーによって分離された塩基性アミノ酸の2つのクラスターである。例示的な二分NLSの配列は、以下のとおりである:PKKKRKVEGADKRTADGSEFESPKKKRKV(配列番号416)。
【0465】
1つ以上の核局在化配列(NLS)を含むCRISPR酵素をコードするベクターを使用することができる。例えば、1、2、3、4、5、6、7、8、9、10個、または約1、2、3、4、5、6、7、8、9、10個のNLSが使用され得る。CRISPR酵素は、アミノ末端もしくはその近くにNLSを含むか、カルボキシ末端もしくはその近くに約1、2、3、4、5、6、7、8、9、10個もしくは約1、2、3、4、5、6、7、8、9、10個以上のNLSを含むか、またはそれらの任意の組み合わせのNLS(例えば、アミノ末端に1つ以上のNLS、及びカルボキシ末端に1つ以上のNLS)を含むことができる。複数のNLSが存在する場合、単一のNLSが複数のコピーに存在し得るように、及び/または1つ以上の他のNLSとの組み合わせで1つ以上のコピーに存在し得るように、各々が、他とは独立して選択され得る。
【0466】
本方法で使用されるCRISPR酵素は、約6個のNLSを含むことができる。NLSは、NLSに最も近いアミノ酸が、N末端またはC末端から、ポリペプチド鎖に沿って、約50アミノ酸以内(例えば、1、2、3、4、5、10、15、20、25、30、40、または50アミノ酸以内)にある場合、N末端またはC末端付近とみなされる。
【0467】
追加のドメイン
本明細書に記載の塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進するのを助ける任意のドメインを含むことができる。様々な実施形態では、これらの追加のドメインのうちのいずれかをコードするオープンリーディングフレームは、本明細書に記載される方法による不活性化に供されるイントロンを含むように修飾され得る。一部の実施形態では、塩基エディターは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)、及び1つ以上の追加のドメインを含む。一部の実施形態では、追加のドメインは、塩基エディターの酵素機能もしくは触媒機能、塩基エディターの結合機能を促進させ得るか、または所望の塩基編集結果を妨げ得る細胞機構(例えば、酵素)の阻害剤であり得る。一部の実施形態では、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写活性化因子、または転写リプレッサードメインを含むことができる。
【0468】
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)ドメインを含むことができる。一部の実施形態では、U:Gヘテロ二重鎖DNAの存在に対する細胞のDNA修復応答は、細胞における核酸塩基編集効率の低下の原因となり得る。そのような実施形態では、ウラシルDNAグリコシラーゼ(UDG)は、細胞のDNAからのUの除去を触媒することができ、塩基除去修復(BER)を開始して、主に、U:G対からC:G対への復帰をもたらすことができる。このような実施形態では、BERは、塩基エディターにおいて阻害され得、塩基エディターは、1つ以上のドメインを含み、1つ以上のドメインは、一本鎖に結合し、編集された塩基を遮断し、UGIを阻害し、BERを阻害し、編集された塩基を保護し及び/または未編集の鎖の修復を促進する。したがって、本開示は、UGIドメインを含む塩基エディター融合タンパク質を企図する。
【0469】
一部の実施形態では、塩基エディターは、ドメインとして、二本鎖切断(DSB)結合タンパク質の全部または一部を含む。例えば、DSB結合タンパク質は、DSBの末端に結合し、それらを分解から保護することができるバクテリオファージMuのGamタンパク質を含むことができる。Komor,A.C.,et al.,”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい(その内容全体が、参照により本明細書に援用される)。
【0470】
加えて、一部の実施形態では、Gamタンパク質は、塩基エディターのN末端に融合され得る。一部の実施形態では、Gamタンパク質は、塩基エディターのC末端に融合され得る。バクテリオファージMuのGamタンパク質は、二本鎖切断(DSB)の末端に結合し、それらを分解から保護することができる。一部の実施形態では、DSBの遊離末端に結合するGamを使用して、塩基編集のプロセス中のインデルの形成を低減することができる。一部の実施形態では、174残基のGamタンパク質が、塩基エディターのN末端に融合される。Komor,A.C.,et al.,”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたい。一部の実施形態では、変異(複数可)は、野生型ドメインに対して、塩基エディタードメインの長さを変化させることができる。例えば、少なくとも1つのドメインにおける少なくとも1つのアミノ酸の欠失は、塩基エディターの長さを減少させ得る。別の場合、変異(複数可)は、野生型ドメインに対して、ドメインの長さを変化させない。例えば、任意のドメインにおける置換は、塩基エディターの長さを変化させない。
【0471】
全てのドメインの長さが野生型ドメインと同じである場合、そのような塩基エディターの非限定的な例としては、以下が挙げられる:
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-[UGI]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-リンカー1-[APOBEC1]-[核酸塩基編集ドメイン]-COOH、
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[UGI]-[核酸塩基編集ドメイン]-[APOBEC1]-[核酸塩基編集ドメイン]-COOH。
【0472】
塩基エディターシステム
自己不活性化塩基エディターを特徴とする塩基エディターシステムを使用して核酸塩基を編集するためのシステム、組成物及び方法が本明細書で提供される。一部の実施形態では、塩基エディターシステムは、(1)塩基エディター(BE)であって、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び核酸塩基を編集するための核酸塩基編集ドメイン(例えば、デアミナーゼドメイン)を含む、塩基エディターと、(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと併せてガイドポリヌクレオチド(例えば、ガイドRNA)と、を含む。一部の実施形態では、塩基エディターシステムは、シチジン塩基エディター(CBE)またはアデノシン塩基エディター(ABE)である。イントロンは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン、核酸塩基編集ドメインまたはこれらのドメインのうちの1つの断片をコードするオープンリーディングフレーム内に挿入され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNAまたはRNA結合ドメインである。一部の実施形態では、核酸塩基編集ドメインは、デアミナーゼドメインである。一部の実施形態では、デアミナーゼドメインは、シチジンデアミナーゼまたはシトシンデアミナーゼであり得る。一部の実施形態では、デアミナーゼドメインは、アデニンデアミナーゼまたはアデノシンデアミナーゼであり得る。一部の実施形態では、アデノシン塩基エディターは、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNAのシチジンを脱アミノ化することができる。
【0473】
一部の実施形態では、本明細書で提供する塩基編集システムは、ゲノム編集への新しい手法を提供し、このゲノム編集は、触媒欠損型Streptococcus pyogenes Cas9と、デアミナーゼ(例えば、シチジンまたはアデノシンデアミナーゼ)と、塩基除去修復の阻害剤とを含有する融合タンパク質を使用して、二本鎖DNA切断をもたらすことなく、ドナーDNA鋳型を必要とすることなく、かつ過剰な確率的挿入及び欠失を誘導することなく、DNAにおけるプログラマブル単一ヌクレオチド(C→TまたはA→G)変化を誘導する。
【0474】
核酸塩基編集タンパク質の詳細は、国際PCT出願第PCT/2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,「Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage」Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,「Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage」Nature 551,464-471(2017)、及びKomor,A.C.,et al.,「Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity」Science Advances 3:eaao4774(2017)(これらの全内容は、参照により本明細書に組み込まれる)も参照されたい。
【0475】
本明細書で提供される自己不活性化塩基エディターシステムの使用は、(a)対象のポリヌクレオチド(例えば、二本鎖または一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)と、ガイドポリ核酸(例えば、gRNA)とを含む塩基エディターシステムと接触させるステップであって、標的ヌクレオチド配列が、標的核酸塩基対を含む、接触させるステップと、(b)当該標的領域の鎖分離を誘導するステップと、(c)標的領域の一本鎖における当該標的核酸塩基対の第1の核酸塩基を、第2の核酸塩基に変換するステップと、(d)当該標的領域の1つ以下の鎖を切断するステップであって、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基によって置換される、切断するステップと、(e)核酸塩基エディターのドメインをコードするオープンリーディングフレーム内に存在する標的イントロン配列を、イントロンのスプライスアクセプターまたはスプライスドナー部位を標的とするガイドRNAと接触させ、ステップb~dに記載される編集を導入し、それによって、塩基エディターを不活性化するステップとを含む。不活性化は、所望のレベルの編集が達せられたときに、いつでも誘導され得る。一部の実施形態では、ステップ(b)または(e)が省略されることを理解されたい。一部の実施形態では、当該標的核酸塩基対は、1つ以上の遺伝子における複数の核酸塩基対である。一部の実施形態では、本発明に提供される塩基エディターシステムは、1つ以上の遺伝子において、複数の核酸塩基対を多重編集することができる。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子に位置する。一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子に位置し、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
【0476】
一部の実施形態では、切断された一本鎖(ニック鎖)は、ガイド核酸にハイブリダイズする。一部の実施形態では、切断された一本鎖は、第1の核酸塩基を含む鎖と反対側である。一部の実施形態では、塩基エディターは、Cas9ドメインを含む。一部の実施形態では、第1の塩基は、アデニンであり、第2の塩基は、G、C、A、またはTではない。一部の実施形態では、第2の塩基は、イノシンである。
【0477】
一部の実施形態では、シングルガイドポリヌクレオチドを利用して、デアミナーゼを標的核酸配列に標的化してもよい。一部の実施形態では、一対のガイドポリヌクレオチドを利用して、異なるデアミナーゼを標的核酸配列に標的化してもよい。
【0478】
塩基エディターシステムの構成要素(例えば、デアミナーゼドメイン、ガイドRNA及び/またはポリヌクレオチドプログラマブルヌクレオチド結合ドメイン)は、共有結合的にまたは非共有結合的に互いに会合し得る。例えば、一部の実施形態では、デアミナーゼドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列を標的とするようにされ得、任意選択で、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチド(例えば、ガイドRNA)と複合体を形成する。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するか、またはデアミナーゼドメインと会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的化することができる。例えば、一部の実施形態では、核酸塩基編集構成要素(例えば、デアミナーゼ構成要素)は、追加の異種部分またはドメインを含み、追加の異種部分またはドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び/またはそれと複合体を形成するガイドポリヌクレオチド(例えば、ガイドRNA)の一部分である対応する異種部分、抗原またはドメインと相互作用する、会合するまたは複合体を形成することが可能である。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン及び/またはそれと複合体を形成するガイドポリヌクレオチド(例えば、ガイドRNA)は、追加の異種部分またはドメインを含み、追加の異種部分またはドメインは、核酸塩基編集ドメイン(例えば、デアミナーゼ構成要素)の一部分である対応する異種部分、抗原またはドメインと相互作用する、会合するまたは複合体を形成することが可能である。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合することが可能である。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、ポリペプチド、例えば、ラムダバクテリオファージ抗ターミネータータンパク質Nの22アミノ酸RNA結合ドメイン(N22p)、2G12 IgGホモ二量体ドメイン、ABI、抗体(例えば、塩基エディターシステムの構成要素またはその異種部分に結合する抗体)もしくはその断片(例えば、IgM(MHD2)もしくはIgE(EHD2)の重鎖ドメイン2(CH2)、免疫グロブリンFc領域、IgGもしくはIgAの重鎖ドメイン3(CH3)、IgMもしくはIgEの重鎖ドメイン4(CH4)、Fab、Fab2、ミニ抗体、及び/またはZIP抗体)、バルナーゼ-バルスター二量体ドメイン、Bcl-xLドメイン、カルシニューリンA(CAN)ドメイン、心筋ホスホランバン膜貫通五量体ドメイン、コラーゲンドメイン、Com RNA結合タンパク質ドメイン(例えば、SfMu Comコートタンパク質ドメイン及びSfMu Com結合タンパク質ドメイン)、シクロフィリン-Fas融合タンパク質(CyP-Fas)ドメイン、Fabドメイン、Feドメイン、フィブリチンフォールドンドメイン、FK506結合タンパク質(FKBP)ドメイン、mTORのFKBP結合ドメイン(FRB)ドメイン、フォールドンドメイン、断片Xドメイン、GAIドメイン、GID1ドメイン、グリコホリンA膜貫通ドメイン、GyrBドメイン、Halo tag、HIV Gp41三量体化ドメイン、HPV45腫瘍性タンパク質E7のC末端二量体ドメイン、疎水性ポリペプチド、K相同(KH)ドメイン、Kuタンパク質ドメイン(例えば、Kuヘテロ二量体)、ロイシンジッパー、LOVドメイン、ミトコンドリア抗ウイルスシグナルタンパク質CARDフィラメントドメイン、MS2コートタンパク質ドメイン(MCP)、対応するRNAモチーフ/アプタマーに結合する天然でないRNAアプタマーリガンド、副甲状腺ホルモン二量体化ドメイン、PP7コートタンパク質(PCP)ドメイン、PSD95-Dlgl-zo-1(PDZ)ドメイン、PYLドメイン、SNAP tag、SpyCatcher部分、SpyTag部分、ストレプトアビジンドメイン、ストレプトアビジン結合タンパク質ドメイン、ストレプトアビジン結合タンパク質(SBP)ドメイン、テロメラーゼSm7タンパク質ドメイン(例えば、Sm7ホモ七量体または単量体Sm様タンパク質)、及び/またはそれらの断片を含む。実施形態では、追加の異種部分は、ポリヌクレオチド(例えば、RNAモチーフ)、例えば、MS2ファージオペレーターステムループ(例えば、MS2、MS2 C-5変異体またはMS2 F-5変異体)、天然でないRNAモチーフ、PP7オプテレーターステムループ、SfMu phate Comステムループ、ステライルアルファモチーフ、テロメラーゼKu結合モチーフ、テロメラーゼSm7結合モチーフ及び/またはそれらの断片を含む。追加の異種部分の非限定的な例としては、配列番号492、494、496、498~500のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリペプチドまたはそれらの断片が挙げられる。追加の異種部分の非限定的な例としては、配列番号491、493、495、497のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリヌクレオチドまたはそれらの断片が挙げられる。
【0479】
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含んでもよい。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。一部の実施形態では、デアミナーゼドメインは、ガイドポリヌクレオチドによって標的ヌクレオチド配列に標的化され得る。例えば、一部の実施形態では、塩基エディターシステムの核酸塩基編集構成要素(例えば、デアミナーゼ構成要素)は、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み、追加の異種部分またはドメインは、ガイドポリヌクレオチドの異種部分もしくはセグメント(例えば、ポリヌクレオチドモチーフ)、または抗原と相互作用する、会合するまたは複合体を形成することが可能である。一部の実施形態では、追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、またはポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、ポリペプチド、例えば、ラムダバクテリオファージ抗ターミネータータンパク質Nの22アミノ酸RNA結合ドメイン(N22p)、2G12 IgGホモ二量体ドメイン、ABI、抗体(例えば、塩基エディターシステムの構成要素またはその異種部分に結合する抗体)もしくはその断片(例えば、IgM(MHD2)もしくはIgE(EHD2)の重鎖ドメイン2(CH2)、免疫グロブリンFc領域、IgGもしくはIgAの重鎖ドメイン3(CH3)、IgMもしくはIgEの重鎖ドメイン4(CH4)、Fab、Fab2、ミニ抗体、及び/またはZIP抗体)、バルナーゼ-バルスター二量体ドメイン、Bcl-xLドメイン、カルシニューリンA(CAN)ドメイン、心筋ホスホランバン膜貫通五量体ドメイン、コラーゲンドメイン、Com RNA結合タンパク質ドメイン(例えば、SfMu Comコートタンパク質ドメイン及びSfMu Com結合タンパク質ドメイン)、シクロフィリン-Fas融合タンパク質(CyP-Fas)ドメイン、Fabドメイン、Feドメイン、フィブリチンフォールドンドメイン、FK506結合タンパク質(FKBP)ドメイン、mTORのFKBP結合ドメイン(FRB)ドメイン、フォールドンドメイン、断片Xドメイン、GAIドメイン、GID1ドメイン、グリコホリンA膜貫通ドメイン、GyrBドメイン、Halo tag、HIV Gp41三量体化ドメイン、HPV45腫瘍性タンパク質E7のC末端二量体ドメイン、疎水性ポリペプチド、K相同(KH)ドメイン、Kuタンパク質ドメイン(例えば、Kuヘテロ二量体)、ロイシンジッパー、LOVドメイン、ミトコンドリア抗ウイルスシグナルタンパク質CARDフィラメントドメイン、MS2コートタンパク質ドメイン(MCP)、対応するRNAモチーフ/アプタマーに結合する天然でないRNAアプタマーリガンド、副甲状腺ホルモン二量体化ドメイン、PP7コートタンパク質(PCP)ドメイン、PSD95-Dlgl-zo-1(PDZ)ドメイン、PYLドメイン、SNAP tag、SpyCatcher部分、SpyTag部分、ストレプトアビジンドメイン、ストレプトアビジン結合タンパク質ドメイン、ストレプトアビジン結合タンパク質(SBP)ドメイン、テロメラーゼSm7タンパク質ドメイン(例えば、Sm7ホモ七量体または単量体Sm様タンパク質)、及び/またはそれらの断片を含む。実施形態では、追加の異種部分は、ポリヌクレオチド(例えば、RNAモチーフ)、例えば、MS2ファージオペレーターステムループ(例えば、MS2、MS2 C-5変異体またはMS2 F-5変異体)、天然でないRNAモチーフ、PP7オプテレーターステムループ、SfMu phate Comステムループ、ステライルアルファモチーフ、テロメラーゼKu結合モチーフ、テロメラーゼSm7結合モチーフ及び/またはそれらの断片を含む。追加の異種部分の非限定的な例としては、配列番号492、494、496、498~500のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリペプチドまたはそれらの断片が挙げられる。追加の異種部分の非限定的な例としては、配列番号491、493、495、497のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリヌクレオチドまたはそれらの断片が挙げられる。
【0480】
一部の実施形態では、塩基エディターシステムは、塩基除去修復(BER)成分の阻害剤をさらに含み得る。塩基エディターシステムの成分が、共有結合、非共有結合性相互作用、またはそれらの会合及び相互作用の任意の組み合わせを介して互いに会合し得ることを理解されたい。BER成分の阻害剤は、塩基除去修復阻害剤を含んでもよい。一部の実施形態では、塩基除去修復の阻害剤は、ウラシルDNAグリコシラーゼ阻害剤(UGI)であり得る。一部の実施形態では、塩基除去修復の阻害剤は、イノシン塩基除去修復阻害剤であり得る。一部の実施形態では、塩基除去修復の阻害剤は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインによって、標的ヌクレオチド配列を標的にするようにされ得、任意選択で、ヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチド(例えば、ガイドRNA)と複合体を形成する。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害剤に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメイン及び塩基除去修復の阻害剤に融合または連結され得る。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、塩基除去修復の阻害剤と非共有結合的に相互作用するか、または塩基除去修復の阻害剤と会合することによって、塩基除去修復の阻害剤を標的ヌクレオチド配列に標的化することができる。例えば、一部の実施形態では、塩基除去修復構成要素の阻害剤は、追加の異種部分またはドメインを含み、追加の異種部分またはドメインは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部分である対応する追加の異種部分、抗原またはドメインと相互作用する、会合するまたは複合体を形成することが可能である。一部の実施形態では、ポリヌクレオチドプログラミングヌクレオチド結合ドメイン構成要素及び/またはそれと複合体を形成するガイドポリヌクレオチド(例えば、ガイドRNA)は、追加の異種部分またはドメインを含み、追加の異種部分またはドメインは、塩基除去修復構成要素の阻害剤の一部分である対応する異種部分、抗原またはドメインと相互作用する、会合するまたはこれを形成することが可能である。一部の実施形態では、塩基除去修復の阻害剤は、ガイドポリヌクレオチドによって、標的ヌクレオチド配列に標的化され得る。例えば、一部の実施形態では、塩基除去修復の阻害剤は、追加の異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)を含み、追加の異種部分またはドメインは、ガイドポリヌクレオチドの一部分またはセグメント(例えば、ポリヌクレオチドモチーフ)と相互作用する、会合するまたは複合体を形成することが可能である。一部の実施形態では、ガイドポリヌクレオチドの追加の異種部分または異種ドメイン(例えば、RNA結合タンパク質またはDNA結合タンパク質などのポリヌクレオチド結合ドメイン)は、塩基除去修復の阻害剤に融合または連結され得る。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、またはポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、ポリペプチド、例えば、ラムダバクテリオファージ抗ターミネータータンパク質Nの22アミノ酸RNA結合ドメイン(N22p)、2G12 IgGホモ二量体ドメイン、ABI、抗体(例えば、塩基エディターシステムの構成要素またはその異種部分に結合する抗体)もしくはその断片(例えば、IgM(MHD2)もしくはIgE(EHD2)の重鎖ドメイン2(CH2)、免疫グロブリンFc領域、IgGもしくはIgAの重鎖ドメイン3(CH3)、IgMもしくはIgEの重鎖ドメイン4(CH4)、Fab、Fab2、ミニ抗体、及び/またはZIP抗体)、バルナーゼ-バルスター二量体ドメイン、Bcl-xLドメイン、カルシニューリンA(CAN)ドメイン、心筋ホスホランバン膜貫通五量体ドメイン、コラーゲンドメイン、Com RNA結合タンパク質ドメイン(例えば、SfMu Comコートタンパク質ドメイン及びSfMu Com結合タンパク質ドメイン)、シクロフィリン-Fas融合タンパク質(CyP-Fas)ドメイン、Fabドメイン、Feドメイン、フィブリチンフォールドンドメイン、FK506結合タンパク質(FKBP)ドメイン、mTORのFKBP結合ドメイン(FRB)ドメイン、フォールドンドメイン、断片Xドメイン、GAIドメイン、GID1ドメイン、グリコホリンA膜貫通ドメイン、GyrBドメイン、Halo tag、HIV Gp41三量体化ドメイン、HPV45腫瘍性タンパク質E7のC末端二量体ドメイン、疎水性ポリペプチド、K相同(KH)ドメイン、Kuタンパク質ドメイン(例えば、Kuヘテロ二量体)、ロイシンジッパー、LOVドメイン、ミトコンドリア抗ウイルスシグナルタンパク質CARDフィラメントドメイン、MS2コートタンパク質ドメイン(MCP)、対応するRNAモチーフ/アプタマーに結合する天然でないRNAアプタマーリガンド、副甲状腺ホルモン二量体化ドメイン、PP7コートタンパク質(PCP)ドメイン、PSD95-Dlgl-zo-1(PDZ)ドメイン、PYLドメイン、SNAP tag、SpyCatcher部分、SpyTag部分、ストレプトアビジンドメイン、ストレプトアビジン結合タンパク質ドメイン、ストレプトアビジン結合タンパク質(SBP)ドメイン、テロメラーゼSm7タンパク質ドメイン(例えば、Sm7ホモ七量体または単量体Sm様タンパク質)、及び/またはそれらの断片を含む。実施形態では、追加の異種部分は、ポリヌクレオチド(例えば、RNAモチーフ)、例えば、MS2ファージオペレーターステムループ(例えば、MS2、MS2 C-5変異体またはMS2 F-5変異体)、天然でないRNAモチーフ、PP7オプテレーターステムループ、SfMu phate Comステムループ、ステライルアルファモチーフ、テロメラーゼKu結合モチーフ、テロメラーゼSm7結合モチーフ及び/またはそれらの断片を含む。追加の異種部分の非限定的な例としては、配列番号492、494、496、498~500のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリペプチドまたはそれらの断片が挙げられる。追加の異種部分の非限定的な例としては、配列番号491、493、495、497のうちのいずれか1つ以上に対して少なくとも約85%の配列同一性を有するポリヌクレオチドまたはそれらの断片が挙げられる。
【0481】
一部の事例では、塩基編集システムの構成要素は、ロイシンジッパードメイン(例えば、配列番号499及び500)の相互作用を介して互いに会合している。一部の場合では、塩基編集システムの構成要素は、ポリペプチドドメイン(例えば、FokIドメイン)を介して互いに会合しており、ポリペプチドドメインは、会合して、タンパク質複合体を形成し、タンパク質複合体は、約1、2(すなわち、二量体化)、3、4、5、6、7、8、9、10個のポリペプチドドメイン単位、少なくとも約1、2、3、4、5、6、7、8、9、10個のポリペプチドドメイン単位または約1、2、3、4、5、6、7、8、9、10個以下のポリペプチドドメイン単位を含有し、任意選択で、ポリペプチドドメインは、それらの活性を低減または排除する改変を含み得る。
【0482】
一部の事例では、塩基編集システムの構成要素は、多量体抗体またはそれらの断片(例えば、IgG;IgD;IgA;IgM;IgE;IgM(MHD2)またはIgE(EHD2)の重鎖ドメイン2(CH2);免疫グロブリンFc領域;IgGまたはIgAの重鎖ドメイン3(CH3);IgMまたはIgEの重鎖ドメイン4(CH4);Fab;及びFab2)の相互作用を介して互いに会合している。一部の事例では、抗体は、二量体、三量体または四量体である。実施形態では、二量体抗体は、塩基編集システムのポリペプチドまたはポリヌクレオチド構成要素に結合する。
【0483】
一部の場合では、塩基編集システムの構成要素は、ポリヌクレオチド結合タンパク質ドメイン(複数可)とポリヌクレオチド(複数可)との相互作用を介して互いに会合している。一部の事例では、塩基編集システムの構成要素は、1つ以上のポリヌクレオチド結合タンパク質ドメインとポリヌクレオチドとの相互作用を介して互いに会合しており、ポリヌクレオチドは、自己相補的及び/または互いに相補的であり、これにより、ポリヌクレオチドの互いへの相補的結合が、それらの対応する結合したポリヌクレオチド結合タンパク質ドメイン(複数可)会合をもたらす。
【0484】
一部の事例では、塩基編集システムの構成要素は、ポリペプチドドメイン(複数可)と小分子(複数可)(例えば、「二量体化剤」としても既知の二量体誘導化合物(CID))との相互作用を介して互いに会合している。CIDの非限定的な例としては、Amara,et al.,”A versatile synthetic dimerizer for the regulation of protein-protein interactions,”PNAS,94:10618-10623(1997)及びVoβ,et al.”Chemically induced dimerization:reversible and spatiotemporal control of protein function in cells,”Current Opinion in Chemical Biology,28:194-201(2015)に開示されているものが挙げられ、それらの各々の開示は、それらの全体が全ての目的で参照により本明細書に援用される。二量体化することができるポリペプチド及びそれらに対応する二量体化剤の非限定的な例は、以下の表10.1で提供される。
【0485】

【表10-1】
【0486】
実施形態では、追加の異種部分は、ガイドRNA分子の一部分である。一部の事例では、追加の異種部分は、RNAモチーフを含有するかまたはRNAモチーフである。RNAモチーフは、ガイドRNA分子の5’もしくは3’末端に、またはガイドRNA分子の様々な位置に配置され得る。実施形態では、任意選択で、RNAモチーフは、RNA足場の他のかさばったループに関連する立体障害を低減するために、ガイドRNA内に配置されている。一部の事例では、RNAモチーフを連結するリンカーによって、ガイドRNAの他の部分に連結されていることが有利であり、リンカーは、約1、2、3、4、5、6、7、8、9もしくは10ヌクレオチド長、少なくとも約1、2、3、4、5、6、7、8、9もしくは10ヌクレオチド長、約1、2、3、4、5、6、7、8、9もしくは10ヌクレオチド長以下、または約1、2、3、4、5、6、7、8、9もしくは10ヌクレオチド長以上のヌクレオチド長であることができる。任意選択で、リンカーは、GCリッチヌクレオチド配列を含有する。ガイドRNAは、1、2、3、4または5つ以上のコピーのRNAモチーフを含有することができ、任意選択で、これらは、連続して配置されており及び/または任意選択で、これらは各々、リンカー(複数可)によって互いに分離されている。RNAモチーフは、本明細書に記載されるポリヌクレオチド修飾のうちのいずれか1つ以上を含み得る。RNAモチーフの好適な修飾の非限定的な例としては、2’デオキシ-2-アミノプリン、2’リボース-2-アミノプリン、ホスホロチオエート修飾、2’-O-メチル修飾、2’-フルロ修飾及びLNA修飾が挙げられる。有利には、修飾は、安定性を増加させるのを助長し、RNAモチーフによって形成されたヘアピン(複数可)のより強い結合/フォールディング構造を促進するのを助長する。
【0487】
一部の実施形態では、RNAモチーフは、伸長を含むように修飾されている。実施形態では、伸長は、約2、3、4、5、10、15、20もしくは25個のヌクレオチド、少なくとも約2、3、4、5、10、15、20もしくは25個のヌクレオチド、または約2、3、4、5、10、15、20もしくは25個以下のヌクレオチドを含有する。一部の事例では、伸長は、RNAモチーフによって形成されたステムの長さの改変(例えば、延長または短縮)をもたらす。RNAモチーフによって形成されたステムは、約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95もしくは100ヌクレオチド長、少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95もしくは100ヌクレオチド長、または約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95もしくは100ヌクレオチド長以下であることが有利であり得る。様々な実施形態では、伸長は、RNAモチーフの柔軟性を増加させ及び/または対応するRNAモチーフとの結合を増加させる。
【0488】
一部の実施形態では、塩基エディターは、編集された鎖の塩基除去修復(BER)を阻害する。一部の実施形態では、塩基エディターは、未編集鎖を保護または結合する。一部の実施形態では、塩基エディターは、UGI活性を含む。一部の実施形態では、塩基エディターは、触媒不活性イノシン特異的ヌクレアーゼを含む。一部の実施形態では、塩基エディターは、ニッカーゼ活性を含む。一部の実施形態では、塩基対の意図される編集は、PAM部位の上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流にある。一部の実施形態では、塩基対の意図される編集は、PAM部位の下流にある。一部の実施形態では、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。
【0489】
一部の実施形態では、本方法は、正準(例えば、NGG)PAM部位を必要としない。一部の実施形態では、核酸塩基エディターは、リンカーまたはスペーサーを含む。一部の実施形態では、リンカーまたはスペーサーは、1~25アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、5~20アミノ酸長である。一部の実施形態では、リンカーまたはスペーサーは、10、11、12、13、14、15、16、17、18、19、または20アミノ酸長である。
【0490】
一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあり得る。一部の実施形態では、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor,A.C.,et al.,「Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage」Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,「Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage」Nature 551,464-471(2017)、及びKomor,A.C.,et al.,「Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity」Science Advances 3:eaao4774(2017)(これらの全内容は、参照により本明細書に組み込まれる)を参照されたい。
【0491】
一部の実施形態では、標的領域は、標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。一部の実施形態では、標的ウィンドウは、1~10ヌクレオチドを含む。一部の実施形態では、標的ウィンドウは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド長である。一部の実施形態では、塩基対の意図される編集は、標的ウィンドウ内にある。一部の実施形態では、標的ウィンドウは、塩基対の意図された編集を含む。一部の実施形態では、本方法は、本明細書に提供される塩基エディターのいずれかを使用して実施される。一部の実施形態では、標的ウィンドウは、脱アミノ化ウィンドウである。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。
【0492】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとポリヌクレオチドプログラマブルヌクレオチド結合ドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインのC末端に局在する。
【0493】
本明細書に開示される塩基エディターに存在し得る他の例示的な特徴は、細胞質局在化配列、輸送配列(例えば、核外輸送配列)、または他の局在化配列、ならびに融合タンパク質の可溶化、精製、または検出に有用な配列タグなどの局在化配列である。本明細書に提供される好適なタンパク質タグとしては、これらに限定されないが、ビオチンカルボキシラーゼキャリアタンパク質(BCCP)タグ、mycタグ、カルモジュリンタグ、FLAGタグ、ヘマグルチニン(HA)タグ、ヒスチジンタグまたはHisタグとも呼ばれるポリヒスチジンタグ、マルトース結合タンパク質(MBP)タグ、nusタグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、緑色蛍光タンパク質(GFP)タグ、チオレドキシンタグ、Sタグ、ソフトタグ(例えば、ソフトタグ1、ソフトタグ3)、ストレプタグ、ビオチンリガーゼタグ、FlAsHタグ、V5タグ、及びSBPタグが挙げられる。さらなる好適な配列は、当業者には明らかであろう。一部の実施形態では、融合タンパク質は、1つ以上のHisタグを含む。
【0494】
一部の実施形態では、非限定的な例示的なシチジン塩基エディター(CBE)は、BE1(APOBEC1-XTEN-dCas9)、BE2(APOBEC1-XTEN-dCas9-UGI)、BE3(APOBEC1-XTEN-dCas9(A840H)-UGI)、BE3-Gam、saBE3、saBE4-Gam、BE4、BE4-Gam、saBE4、またはsaB4E-Gamを含む。BE4は、32アミノ酸のAPOBEC1-Cas9n(D10A)リンカー及び9アミノ酸のCas9n-UGIリンカーが延び、UGIの第2のコピーが、別の9アミノ酸のリンカーとともに、構築物のC末端に付加されて、単一の塩基エディター構築物になる。塩基エディターであるsaBE3及びsaBE4は、より小さいS.aureus Cas9n(D10A)で置き換えられたS.pyogenes Cas9n(D10A)を有する。BE3-Gam、saBE3-Gam、BE4-Gam、及びsaBE4-Gamは、16アミノ酸XTENリンカーを介して、BE3、saBE3、BE4、及びsaBE4のN末端に融合された174残基のGamタンパク質を有する。
【0495】
一部の実施形態では、アデノシン塩基エディター(ABE)は、DNAのアデニンを脱アミノ化することができる。一部の実施形態では、ABEは、BE3のAPOBEC1成分を、天然または操作されたE.coli TadA、ヒトADAR2、マウスADA、またはヒトADAT2で置き換えることによって生成される。一部の実施形態では、ABEは、進化したTadAバリアントを含む。一部の実施形態では、ABEは、ABE1.2(TadA*-XTEN-nCas9-NLS)である。一部の実施形態では、TadA*は、A106V及びD108N変異を含む。
【0496】
一部の実施形態では、ABEは、第2世代のABEである。一部の実施形態では、ABEは、ABE2.1であり、TadA*(TadA*2.1)における追加の変異D147Y及びE155Vを含む。一部の実施形態では、ABEは、ABE2.2であり、触媒不活性化バージョンのヒトアルキルアデニンDNAグリコシラーゼ(E125Q変異を有するAAG)に融合されたABE2.1である。一部の実施形態では、ABEは、ABE2.3であり、触媒不活性化(D35A変異による不活性化)バージョンのE.coli EndoVに融合された、ABE2.1である。一部の実施形態では、ABEは、ABE2.6であり、ABE2.6は、ABE2.1におけるリンカーの2倍の長さ(32個のアミノ酸、(SGGS)2(配列番号418)-XTEN-(SGGS)2(配列番号418))のリンカーを有する。一部の実施形態では、ABEは、ABE2.7であり、追加の野生型TadA単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.8であり、追加のTadA*2.1単量体で繋がれたABE2.1である。一部の実施形態では、ABEは、ABE2.9であり、進化したTadA(TadA*2.1)のABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.10であり、野生型TadAのABE2.1のN末端への直接融合物である。一部の実施形態では、ABEは、ABE2.11であり、TadA*単量体のN末端に不活性化E59A変異を有するABE2.9である。一部の実施形態では、ABEは、ABE2.12であり、TadA*単量体の内部に不活性化E59A変異を有するABE2.9である。
【0497】
一部の実施形態では、ABEは、第3世代のABEである。一部の実施形態では、ABEは、ABE3.1であり、3つの追加のTadA変異(L84F、H123Y、及びI156F)を有するABE2.3である。
【0498】
一部の実施形態では、ABEは、第4世代のABEである。一部の実施形態では、ABEは、ABE4.3であり、追加のTadA変異A142N(TadA*4.3)を有するABE3.1である。
【0499】
一部の実施形態では、ABEは、第5世代のABEである。一部の実施形態では、ABEは、ABE5.1であり、生存クローンからのコンセンサスセットの変異(H36L、R51L、S146C、及びK157N)をABE3.1に移入することによって生成される。一部の実施形態では、ABEは、ABE5.3であり、進化したTadA*の内部に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABEは、ABE5.2、ABE5.4、ABE5.5、ABE5.6、ABE5.7、ABE5.8、ABE5.9、ABE5.10、ABE5.11、ABE5.12、ABE5.13、またはABE5.14であり、以下の表10に示される。一部の実施形態では、ABEは、第6世代のABEである。一部の実施形態では、ABEは、ABE6.1、ABE6.2、ABE6.3、ABE6.4、ABE6.5、またはABE6.6であり、以下の表10に示される。一部の実施形態では、ABEは、第7世代のABEである。一部の実施形態では、ABEは、ABE7.1、ABE7.2、ABE7.3、ABE7.4、ABE7.5、ABE7.6、ABE7.7、ABE7.8、ABE7.9、またはABE7.10であり、以下の表10に示される。
【0500】
【表10-2】

【表10-3】
【0501】
一部の実施形態では、塩基エディターは、第8世代のABE(ABE8)である。一部の実施形態では、ABE8は、TadA*8バリアントを含む。一部の実施形態では、ABE8は、TadA*8バリアントを含む単量体構築物(「ABE8.x-m」)を有する。一部の実施形態では、ABE8は、ABE8.1-mであり、Y147T変異を有するTadA*7.10(TadA*8.1)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-mであり、Y147R変異を有するTadA*7.10(TadA*8.2)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-mであり、Q154S変異を有するTadA*7.10(TadA*8.3)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-mであり、Y123H変異を有するTadA*7.10(TadA*8.4)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-mであり、V82S変異を有するTadA*7.10(TadA*8.5)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-mであり、T166R変異を有するTadA*7.10(TadA*8.6)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-mであり、Q154R変異を有するTadA*7.10(TadA*8.7)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-mであり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-mであり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-mであり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-mであり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-mであり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)を含む単量体構築物を有する。
【0502】
一部の実施形態では、ABE8は、ABE8.13-mであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-mであり、I76Y及びV82S変異を有するTadA*7.10(TadA*8.14)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-mであり、V82S及びY147R変異を有するTadA*7.10(TadA*8.15)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-mであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-mであり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-mであり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.19-mであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.20-mであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-mであり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-mであり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-mであり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-mであり、ABE8.24-mは、単量体構築物を有し、単量体構築物は、V82S、Y123H(H123Yから復帰させたY123H)及びY147T変異を有するTadA*7.10(TadA*8.24)を含有する。
【0503】
一部の実施形態では、ABE8は、TadA*8バリアントに融合された野生型E.coli TadAを含むヘテロ二量体構築物(「ABE8.x-d」)を有する。一部の実施形態では、ABE8は、ABE8.1-dであり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-dであり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-dであり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-dであり、Y123H変異を有するTadA*7.10(TadA*8.4)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-dであり、V82S変異を有するTadA*7.10(TadA*8.5)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-dであり、T166R変異を有するTadA*7.10(TadA*8.6)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-dであり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-dであり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-dであり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-dであり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-dであり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-dであり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.13-dであり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-dであり、I76Y及びV82S変異を有するTadA*7.10(TadA*8.14)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-dであり、V82S及びY147R変異を有するTadA*7.10(TadA*8.15)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-dであり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.19-dであり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.20-dであり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-dであり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-dであり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-dであり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-dであり、V82S、Y123H(H123Yから復帰したY123H)、及びY147T変異を有するTadA*7.10(TadA*8.24)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。
【0504】
一部の実施形態では、ABE8は、TadA*8バリアントに融合されたTadA*7.10を含むヘテロ二量体構築物(「ABE8.x-7」)を有する。一部の実施形態では、ABE8は、ABE8.1-7であり、Y147T変異を有するTadA*7.10(TadA*8.1)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.2-7であり、Y147R変異を有するTadA*7.10(TadA*8.2)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.3-7であり、Q154S変異を有するTadA*7.10(TadA*8.3)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.4-7であり、Y123H変異を有するTadA*7.10に融合されたTadA*7.10(TadA*8.4)を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.5-7であり、V82S変異を有するTadA*7.10(TadA*8.5)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.6-7であり、T166R変異を有するTadA*7.10(TadA*8.6)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.7-7であり、Q154R変異を有するTadA*7.10(TadA*8.7)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.8-7であり、Y147R、Q154R、及びY123H変異を有するTadA*7.10(TadA*8.8)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.9-7であり、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.9)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.10-7であり、Y147R、Q154R、及びT166R変異を有するTadA*7.10(TadA*8.10)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.11-7であり、Y147T及びQ154R変異を有するTadA*7.10(TadA*8.11)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.12-7であり、Y147T及びQ154S変異を有するTadA*7.10(TadA*8.12)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.13-7であり、Y123H(H123Yから復帰したY123H)、Y147R、Q154R、及びI76Y変異を有するTadA*7.10(TadA*8.13)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.14-7であり、I76Y、及びV82S変異を有するTadA*7.10(TadA*8.14)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.15-7であり、V82S、及びY147R変異を有するTadA*7.10(TadA*8.15)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.16-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びY147R変異を有するTadA*7.10(TadA*8.16)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.17-7であり、V82S及びQ154R変異を有するTadA*7.10(TadA*8.17)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.18-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びQ154R変異を有するTadA*7.10(TadA*8.18)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.19-7であり、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.19)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の態様では、ABE8は、ABE8.20-7であり、I76Y、V82S、Y123H(H123Yから復帰したY123H)、Y147R、及びQ154R変異を有するTadA*7.10(TadA*8.20)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.21-7であり、Y147R及びQ154S変異を有するTadA*7.10(TadA*8.21)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.22-7であり、V82S及びQ154S変異を有するTadA*7.10(TadA*8.22)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.23-7であり、V82S及びY123H(H123Yから復帰したY123H)変異を有するTadA*7.10(TadA*8.23)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8.24-7であり、V82S、Y123H(H123Yから復帰したY123H)、及びY147T変異を有するTadA*7.10(TadA*8.24)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。
一部の実施形態では、ABEは、ABE8.1-m、ABE8.2-m、ABE8.3-m、ABE8.4-m、ABE8.5-m、ABE8.6-m、ABE8.7-m、ABE8.8-m、ABE8.9-m、ABE8.10-m、ABE8.11-m、ABE8.12-m、ABE8.13-m、ABE8.14-m、ABE8.15-m、ABE8.16-m、ABE8.17-m、ABE8.18-m、ABE8.19-m、ABE8.20-m、ABE8.21-m、ABE8.22-m、ABE8.23-m、ABE8.24-m、ABE8.1-d、ABE8.2-d、ABE8.3-d、ABE8.4-d、ABE8.5-d、ABE8.6-d、ABE8.7-d、ABE8.8-d、ABE8.9-d、ABE8.10-d、ABE8.11-d、ABE8.12-d、ABE8.13-d、ABE8.14-d、ABE8.15-d、ABE8.16-d、ABE8.17-d、ABE8.18-d、ABE8.19-d、ABE8.20-d、ABE8.21-d、ABE8.22-d、ABE8.23-d、またはABE8.24-dであり、以下の表11に示されている。
【0505】
【表11-1】

【表11-2】
【0506】
一部の実施形態では、ABE8は、ABE8a-mであり、R26C、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-mであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8b)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-mであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-mであり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)を含む単量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-mであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)を含む単量体構築物を有する。
【0507】
一部の実施形態では、ABE8は、ABE8a-dであり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-dであり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167Nの変異を有するTadA*7.10(TadA*8b)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-dであり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-dであり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-dであり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)に融合された野生型E.coli TadAを含むヘテロ二量体構築物を有する。
【0508】
一部の実施形態では、ABE8は、ABE8a-7であり、R26C、A109S、T111R、D119、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8a)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8b-7であり、V88A、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8b)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8c-7であり、R26C、A109S、T111R、D119N、H122N、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8c)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8d-7であり、V88A、T111R、D119N、及びF149Y変異を有するTadA*7.10(TadA*8d)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。一部の実施形態では、ABE8は、ABE8e-7であり、A109S、T111R、D119N、H122N、Y147D、F149Y、T166I、及びD167N変異を有するTadA*7.10(TadA*8e)に融合されたTadA*7.10を含むヘテロ二量体構築物を有する。
【0509】
一部の実施形態では、ABEは、ABE8a-m、ABE8b-m、ABE8c-m、ABE8d-m、ABE8e-m、ABE8a-d、ABE8b-d、ABE8c-d、ABE8d-d、またはABE8e-dであり、以下の表12に示される。一部の実施形態では、ABEは、ABE8e-mまたはABE8e-dである。ABE8eは、SpCas9以外のCas相同体(例えば、SaCas9、SaCas9-KKH、Cas12a相同体(例えば、LbCas12a、enAs-Cas12a)、SpCas9-NG、及び円順列変異体CP1028-SpCas9及びCP1041-SpCas9)とともに使用した場合、効率的なアデニン塩基編集活性及び低いインデル形成を示す。表12に示されるABE8eの変異に加えて、TadAドメインにV106W置換を導入することによって、オフターゲットのRNA編集及びDNA編集が低減された(M.Richter et al.,2020,Nature Biotechnology,doi.org/10.1038/s41587-020-0453-zに記載されている。その内容全体が、参照により本明細書に援用される)。
【0510】
【表12】
【0511】
一部の実施形態では、塩基エディター(例えば、ABE8)は、アデノシンデアミナーゼのバリアント(例えば、TadA*8)を、円順列変異体Cas9(例えば、CP5またはCP6)及び二部核局在化配列を含む足場内にクローニングすることによって生成される。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP5バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、NGC PAM CP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。一部の実施形態では、塩基エディター(例えば、ABE7.9、ABE7.10、またはABE8)は、AGA PAM CP6バリアント(S.pyogenes Cas9またはspVRQR Cas9)である。
【0512】
一部の実施形態では、ABEは、以下の表13に示される遺伝子型を有する。
【0513】
【表13】
【0514】
以下の表14に示されるように、40個のABE8の遺伝子型が記載されている。進化したE.coli TadA部分のABEの残基位置を示す。ABE7.10変異とは異なる場合に、ABE8の変異変化が示される。一部の実施形態では、ABEは、以下の表14に示されるABEのうちの1つの遺伝子型を有する。
【表14-1】

【表14-2】

【表14-3】
【0515】
一部の実施形態では、塩基エディターは、アデノシンデアミナーゼ活性を有する以下の配列またはその断片を含むか、または本質的にそれからなるABE8.1である:
ABE8.1_Y147T_CP5_NGC PAM_単量体

【0516】
上記の配列において、平文は、アデノシンデアミナーゼ配列を示し、太字の配列は、Cas9に由来する配列を示し、斜体の配列は、リンカー配列を示し、下線の配列は、二分核局在化配列を示す。他のABE8配列を、添付の配列表に示す(配列番号420~442)。
【0517】
一部の実施形態では、塩基エディターは、第9世代ABE(ABE9)である。一部の実施形態では、ABE9は、TadA*9バリアントを含む。ABE9塩基エディターは、アデノシンデアミナーゼのバリアントを含み、本明細書に記載されるように、ABE7*10参照配列に対して改変を含むアミノ酸配列を含む。例示的なABE9バリアントは、表15に列挙される。ABE9塩基エディターの詳細は、国際PCT出願第2020/049975号に記載されている(その全体が、参照により本明細書に援用される)。
【0518】
【表15-1】

【表15-2】
【0519】
一部の実施形態では、塩基エディターには、本明細書に記載するように、ABE7*10参照配列に対して改変を含むアミノ酸配列を含むアデノシンデアミナーゼバリアントが含まれる。表15.1で使用される場合、「単量体」という用語は、記載される改変を含むTadA*7.10の単量体形態を指す。表15.1で使用される場合、「ヘテロ二量体」という用語は、記載される改変を含むTadA*7.10に融合された特定の野生型のE.coli TadAアデノシンデアミナーゼを指す。
【0520】
【0521】
一部の実施形態では、塩基エディターは、ウラシルグリコシラーゼ阻害剤(UGI)の全てまたは一部分を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼの全部または一部を含むドメインを含む。一部の実施形態では、塩基エディターは、核酸ポリメラーゼ(NAP)の全部または一部をドメインとして含み得る。例えば、塩基エディターは、真核生物のNAPの全部または一部を含み得る。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、DNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えポリメラーゼ活性を有する。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、損傷乗り越えDNAポリメラーゼである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、Rev7、Rev1複合体、ポリメラーゼイオタ、ポリメラーゼカッパ、またはポリメラーゼエータである。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、真核生物ポリメラーゼアルファ、ベータ、ガンマ、デルタ、イプシロン、ガンマ、エータ、イオタ、カッパ、ラムダ、ミュー、またはニュー成分である。一部の実施形態では、塩基エディターに組み込まれるNAPまたはその一部は、核酸ポリメラーゼ(例えば、損傷乗り越えDNAポリメラーゼ)と、少なくとも75%、80%、85%、90%、95%、96%、97%、98%、99%、または99.5%同一であるアミノ酸配列を含む。一部の実施形態では、塩基エディターに組み込まれる核酸ポリメラーゼまたはその一部は、損傷乗り越えDNAポリメラーゼである。
【0522】
一部の実施形態では、塩基エディターのドメインは、複数のドメインを含むことができる。例えば、Cas9に由来するポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む塩基エディターは、野生型または天然のCas9のRECローブ及びNUCローブに対応するRECローブ及びNUCローブを含むことができる。別の例では、塩基エディターは、RuvCIドメイン、BHドメイン、REC1ドメイン、REC2ドメイン、RuvCIIドメイン、L1ドメイン、HNHドメイン、L2ドメイン、RuvCIIIドメイン、WEDドメイン、TOPOドメイン、またはCTDドメインのうちの1つ以上を含み得る。一部の実施形態では、塩基エディターの1つ以上のドメインは、ドメインを含むポリペプチドの野生型バージョンに対して変異(例えば、置換、挿入、欠失)を含む。例えば、ポリヌクレオチドプログラマブルDNA結合ドメインのHNHドメインは、H840A置換を含むことができる。別の例では、ポリヌクレオチドプログラマブルDNA結合ドメインのRuvCIドメインは、D10A置換を含むことができる。
【0523】
本明細書に開示される塩基エディターの異なるドメイン(例えば、隣接ドメイン)は、1つ以上のリンカードメイン(例えば、XTENリンカードメイン)の使用の有無にかかわらず、互いに接続され得る。一部の実施形態では、リンカードメインは、結合(例えば、共有結合)、化学基、または2つの分子もしくは部分(例えば、融合タンパク質の2つのドメイン、例えば、第1のドメイン(例えば、Cas9由来ドメイン)及び第2のドメイン(例えば、アデノシンデアミナーゼドメインもしくはシチジンデアミナーゼドメイン))を連結する分子であり得る。一部の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。一部の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。一部の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。一部の実施形態では、リンカーは、RNAプログラマブルヌクレアーゼ(Cas9ヌクレアーゼドメインを含む)のgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインとを結合する。一部の実施形態では、リンカーは、dCas9と、第2のドメイン(例えば、UGIなど)とを連結する。
【0524】
リンカー
特定の実施形態では、リンカーを使用して、本発明のペプチドまたはペプチドドメインのいずれかを結合し得る。リンカーは、共有結合のように単純であってもよく、または数原子の長さの高分子リンカーであってもよい。特定の実施形態では、リンカーは、ポリペプチドであるか、またはアミノ酸に基づく。特定の実施形態では、ポリペプチドまたはアミノ酸ベースのリンカーは、本発明のポリヌクレオチドのうちのいずれかによってコードされ得る。一部の実施形態では、デアミナーゼドメイン及び/または核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン、またはその断片をコードするポリヌクレオチドは、リンカーポリヌクレオチド配列を含む。一部の実施形態では、デアミナーゼドメイン及び/または核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン、またはその断片と、リンカーポリヌクレオチド配列とをコードするポリヌクレオチドは、オープンリーディングフレーム内に挿入されたイントロンを含む。一部の実施形態では、イントロンは、リンカーポリヌクレオチド配列内に挿入されている。
【0525】
他の実施形態では、リンカーは、ペプチド様ではない。特定の実施形態では、リンカーは、共有結合(例えば、炭素-炭素結合、ジスルフィド結合、炭素-ヘテロ原子結合など)である。特定の実施形態では、リンカーは、アミド結合の炭素-窒素結合である。特定の実施形態では、リンカーは、環式または非環式、置換または非置換、分岐または非分岐の脂肪族または複素脂肪族のリンカーである。特定の実施形態では、リンカーは、ポリマー(例えば、ポリエチレン、ポリエチレングリコール、ポリアミド、ポリエステルなど)である。特定の実施形態では、リンカーは、アミノアルカン酸の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸など)を含む。特定の実施形態では、リンカーは、アミノヘキサン酸(Ahx)の単量体、二量体、またはポリマーを含む。特定の実施形態では、リンカーは、炭素環式部分(例えば、シクロペンタン、シクロヘキサン)に基づく。他の実施形態では、リンカーは、ポリエチレングリコール部分(PEG)を含む。他の実施形態では、リンカーは、アミノ酸を含む。特定の実施形態では、リンカーは、ペプチドを含む。特定の実施形態では、リンカーは、アリール部分またはヘテロアリール部分を含む。特定の実施形態では、リンカーは、フェニル環に基づく。リンカーは、ペプチドからリンカーへの求核剤(例えば、チオール、アミノ)の結合を促進する官能化部分を含むことができる。任意の求電子剤をリンカーの一部として使用することができる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケルアクセプター、ハロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、及びイソチオシアネートが挙げられるが、これらに限定されない。
【0526】
典型的には、リンカーは、2つの基、分子、もしくは他の部分の間に配置されるか、またはそれらに隣接し、共有結合を介して各々に連結され、したがって、両者を連結する。一部の実施形態では、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペプチドまたはタンパク質)である。一部の実施形態では、リンカーは、有機分子、基、ポリマー、または化学部分である。一部の実施形態では、リンカーは、2~100アミノ酸長、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30~35、35~40、40~45、45~50、50~60、60~70、70~80、80~90、90~100、100~150、または150~200アミノ酸長である。一部の実施形態では、リンカーは、約3~約104(例えば、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95、または100)アミノ酸長である。また、より長いまたはより短いリンカーも企図される。
【0527】
一部の実施形態では、本明細書に提供される融合タンパク質のいずれかは、リンカーを介して互いに融合されるシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとを含む。シチジンまたはアデノシンデアミナーゼとCas9ドメインとの間の様々なリンカー長さ及び柔軟性(例えば、(GGGS)n(配列番号334)、(GGGGS)n(配列番号335)及び(G)nの形態の非常に柔軟なリンカーから、(EAAAK)n(配列番号336)、(SGGS)n(配列番号443)、SGSETPGTSESATPES(配列番号337)(例えば、Guilinger JP,et al.Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32(6):577-82を参照されたく、内容全体は、参照により本明細書に援用される)及び(XP)nの形態のより剛性なリンカーまでの範囲)が、シチジンまたはアデノシンデアミナーゼ核酸塩基エディターの活性に最適な長さを達成するために用いられ得る。一部の実施形態では、nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、または15である。一部の実施形態では、リンカーは、(GGS)nモチーフを含み、nは、1、3、または7である。一部の実施形態では、本明細書に提供される融合タンパク質のうちのいずれかのシチジンデアミナーゼまたはアデノシンデアミナーゼとCas9ドメインとは、アミノ酸配列SGSETPGTSESATPES(配列番号237)を含むリンカー(これは、XTENリンカーとも称され得る)を介して融合される。
【0528】
一部の実施形態では、塩基エディターのドメインは、以下のアミノ酸配列:
SGGSSGSETPGTSESATPESSGGS(配列番号444)、
SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号445)、または
GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS(配列番号446)を含むリンカーを介して融合される。
【0529】
一部の実施形態では、塩基エディターのドメインは、アミノ酸配列SGSETPGTSESATPES(配列番号237)を含むリンカー(これは、XTENリンカーとも称され得る)を介して融合される。一部の実施形態では、リンカーは、アミノ酸配列SGGSを含む。一部の実施形態では、リンカーは、24アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPES(配列番号447)を含む。一部の実施形態では、リンカーは、40アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS(配列番号448)を含む。一部の実施形態では、リンカーは、64アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号449)を含む。一部の実施形態では、リンカーは、92アミノ酸長である。一部の実施形態では、リンカーは、アミノ酸配列:PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS(配列番号450)を含む。
【0530】
一部の実施形態では、リンカーは、複数のプロリン残基を含み、5~21、5~14、5~9、5~7アミノ酸長であり、例えば、PAPAP(配列番号451)、PAPAPA(配列番号452)、PAPAPAP(配列番号453)、PAPAPAPA(配列番号454)、P(AP)4(配列番号455)、P(AP)7(配列番号456)、P(AP)10(配列番号457)である(例えば、Tan J,Zhang F,Karcher D,Bock R.Engineering of high-precision base editors for site-specific single nucleotide replacement.Nat Commun.2019 Jan 25;10(1):439を参照されたく、内容全体は、参照により本明細書に援用される)。このようなプロリンに富むリンカーは、「剛性」リンカーとも称される。
【0531】
別の実施形態では、塩基エディターシステムは、デアミナーゼ(DNAデアミナーゼ、例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)と非共有結合的に相互作用し、かつ、特定の編集のために、アデノシンデアミナーゼまたはシチジンデアミナーゼを標的ポリヌクレオチド配列内の標的核酸塩基に一過的に引き付ける成分(タンパク質)を含み、バイスタンダー効果または標的隣接効果が最小化または低減される。デアミナーゼ相互作用タンパク質を伴うそのような非共有結合のシステム及び方法は、DNAデアミナーゼを特定のゲノム標的核酸塩基に引き付ける役割を果たし、オンターゲット及び標的隣接編集の事象を切り離し、したがって、より正確な単一塩基置換変異の達成を強化する。一実施形態では、デアミナーゼ相互作用タンパク質は、デアミナーゼ(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)に結合し、デアミナーゼの活性(触媒)部位が標的核酸塩基(例えば、それぞれ、アデノシンまたはシチジン)に結合するのを遮断または妨害しない。「MagnEdit」と称されるシステムなどは、Cas9とgRNAとの複合体に繋がれた相互作用タンパク質を含み、共発現された(外因性または内因性のいずれかの)アデノシンまたはシチジンデアミナーゼを引き付けて、特定のゲノム標的部位を編集することができ、McCann,J.et al.,2020,”MagnEdit-interacting factors that recruit DNA-editing enzymes to single base targets,”Life-Science-Alliance,Vol.3,No.4(e201900606),(doi 10.26508/Isa.201900606)に記載されており、それらの内容は、それらの全体が参照により本明細書に援用される。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。
【0532】
別の実施形態では、「Suntag」と称されるシステムは、非共有結合的に相互作用する構成要素を含み、これらの構成要素は、塩基エディターのタンパク質(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)構成要素またはそれらの複数のコピーを、ポリヌクレオチド標的部位にリクルートして、隣接する標的編集が低減された部位での塩基編集を達成するために使用され、これは、例えば、Tanenbaum,M.E.et al.,”A protein tagging system for signal amplification in gene expression and fluorescence imaging,”Cell.2014 October 23;159(3):635-646.doi:10.1016/j.cell.2014.09.039及びHuang,Y.-H.et al.,2017,”DNA epigenome editing using CRISPR-Cas SunTag-directed DNMT3A,”Genome Biol 18:176.doi:10.1186/s13059-017-1306-zに記載されており、それらの各々の内容は、それらの全体が参照により本明細書に援用される。一実施形態では、DNAデアミナーゼは、本明細書に記載のアデノシンデアミナーゼのバリアント(例えば、TadA*8)である。
【0533】
ガイドRNAを有する核酸プログラマブルDNA結合タンパク質
細胞内で塩基エディターを塩基編集及び/または不活性化するための組成物及び方法が本明細書で提供される。ガイドポリ核酸配列(例えば、ガイドRNA配列)または本明細書に提供される2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上のガイドRNAの組み合わせを含む組成物が本明細書にさらに提供される。一部の実施形態では、本明細書に提供される塩基編集のための組成物は、塩基エディター(例えば、C塩基エディターまたはA塩基エディター)をコードするポリヌクレオチドをさらに含む。例えば、塩基編集のための組成物は、BE、BE4、ABE、及び提供される1つ以上のガイドRNAの組み合わせをコードするmRNA配列を含み得る。一部の実施形態では、塩基エディターをコードするポリヌクレオチドは、異種イントロンを含む。塩基編集のための組成物は、塩基エディターポリペプチドと、本明細書に提供される任意のガイドRNAのうちの1つ以上の組み合わせとを含み得る。このような組成物は、細胞内で、異なる送達手法、例えば、エレクトロポレーション、ヌクレオフェクション、ウイルス形質導入またはトランスフェクションを介して、塩基エディターを塩基編集または不活性化するために使用され得る。一部の実施形態では、塩基エディターを塩基編集及び/または不活性化するための組成物は、エレクトロポレーションのための、塩基エディターをコードするmRNA配列と、本明細書で提供される1つ以上のガイドRNA配列の組み合わせとを含む。一部の実施形態では、塩基エディターをコードするmRNA配列は、異種イントロンを含む。
【0534】
本開示の一部の態様は、複合体を提供し、本明細書に提供される融合タンパク質のうちのいずれかと、融合タンパク質の核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン(例えば、Cas9(例えば、dCas9、ヌクレアーゼ活性Cas9、またはCas9ニッカーゼ)またはCas12)に結合したガイドRNAと、を含む。これらの複合体は、リボ核タンパク質(RNP)とも呼ばれる。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、15~100ヌクレオチド長であり、標的配列に相補的な、少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド長である。一部の実施形態では、ガイドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列は、DNA配列である。一部の実施形態では、標的配列は、RNA配列である。一部の実施形態では、標的配列は、細菌、酵母、真菌、昆虫、植物、または動物のゲノムの配列である。一部の実施形態では、標的配列は、ヒトのゲノムの配列である。一部の実施形態では、標的配列の3’末端は、正準PAM配列(NGG)に直接隣接する。一部の実施形態では、標的配列の3’末端は、非正準PAM配列(例えば、表6で列挙される配列または5’-NAA-3’)に直接隣接する。一部の実施形態では、ガイド核酸(例えば、ガイドRNA)は、目的の遺伝子(例えば、疾患または障害に関連する遺伝子)の配列に相補的である。
【0535】
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書に提供される融合タンパク質のいずれかと、少なくとも1つのガイドRNAと接触させることを含む方法を提供し、ガイドRNAは、約15~100ヌクレオチド長であり、標的配列に相補的な少なくとも10個の連続したヌクレオチドの配列を含む。一部の実施形態では、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’(TTTV)配列に直接隣接する。一部の実施形態では、標的配列の3’末端は、例えば、TTN、DTTN、GTTN、ATTN、ATTC、DTTNT、WTTN、HATY、TTTN、TTTV、TTTC、TG、RTR、またはYTN PAM部位に直接隣接している。
【0536】
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質及び番号付けのスキームに依存することが理解されるであろう。番号付けは、例えば、成熟タンパク質の前駆体及び成熟タンパク質自体において異なる場合があり、種ごとの配列の違いは番号付けに影響を及ぼす場合がある。当業者であれば、当該技術分野で周知の方法(例えば、配列アラインメント及び相同残基の決定)によって、任意の相同タンパク質及びそれぞれのコード核酸におけるそれぞれの残基を特定することができるであろう。
【0537】
本明細書に開示される融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的化するために、典型的には、融合タンパク質をガイドRNAとともに共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、napDNAbp(例えば、Cas9またはCas12)結合を可能にするtracrRNAフレームワークと、napDNAbp:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替として、ガイドRNA及びtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。特定のゲノム標的部位にnapDNAbp:核酸編集酵素/ドメイン融合タンパク質を標的化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。そのような好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。
【0538】
sgRNAの異なる部分は、Cas9(例えば、SpyCas9)及び/またはDNA標的と相互作用する様々な特徴を形成することが予測される。6つの保存されたモジュールが、天然のcrRNA:tracrRNA二重鎖及びCas9エンドヌクレアーゼ活性を指示するシングルガイドRNA(sgRNA)内で特定されている(Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339を参照されたい)。6つのモジュールには、DNA標的化を担うスペーサー、CRISPRリピート:tracrRNA二重鎖によって形成される上部ステム、バルジ、下部ステム、連結部、及びtracrRNAの3’末端からのヘアピンが含まれる。上部ステム及び下部ステムは、主に、リン酸骨格との配列非依存性相互作用を通してCas9と相互作用する。一部の実施形態では、上部ステムは、不要である。一部の実施形態では、下部ステムの基部の保存されたウラシルヌクレオチド配列は、不要である。バルジは、Cas9のRec1ドメインとの特定の側鎖相互作用に関与する。U44の核酸塩基は、Tyr325及びHis328の側鎖と相互作用し、G43は、Tyr329と相互作用する。ネクサスは、sgRNA:Cas9相互作用のコアを形成し、sgRNAと、Cas9及び標的DNAの両方との間の交点にある。A51及びA52の核酸塩基は、Phe1105の側鎖と相互作用し、U56は、Arg457及びAsn459と相互作用し、U59の核酸塩基は、Arg74、Asn77、Pro475、Leu455、Phe446、及びIle448の側鎖によって既定される疎水性ポケットに挿入し、C60は、Leu455、Ala456、及びAsn459と相互作用し、C61は、Arg70の側鎖と相互作用し、次に、C15と相互作用する。一部の実施形態では、これらの変異のうちの1つ以上は、sgRNA:Cas9相互作用を最適化するために、Cas9(例えば、spyCas9)に対するsgRNAのバルジ及び/またはネクサスにおいて作製される。
【0539】
さらに、tracrRNAのネクサス及びヘアピンは、Cas9の対形成にとって重要であり、異なるCas9タンパク質を分離する直交性障壁(orthogonality barrier)を交差するようにスワップ(swap)することができ、これは、直交Cas9(orthogonal Cas9)タンパク質のさらなる利用に役立つ。一部の実施形態では、ネクサス及びヘアピンは、直交Cas9タンパク質を標的とするようにスワップされる。一部の実施形態では、sgRNAは、よりコンパクトで、立体構造的に安定なガイドRNAを設計するために、上部ステム、ヘアピン1、及び/または下部ステムの配列柔軟性が省かれる。一部の実施形態では、モジュールは、様々なキメラガイドを有する単一のCas9を使用するか、またはキメラsgRNAの異なる組み合わせを有する直交系を同時に使用することによって、多重編集を最適化するように修飾される。ガイド機能的モジュール及びそれらの方法に関する詳細は、例えば、Briner et al.,Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality Mol Cell.2014 Oct 23;56(2):333-339に記載されており、その内容は、その全体が参照により本明細書に援用される。
【0540】
本明細書に開示される塩基エディターのドメインは、任意の順序で配置され得る。例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9またはCas12)及びデアミナーゼドメイン(例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼ)を含む融合タンパク質を含む塩基エディターの非限定的な例としては、以下のように配置することができる:
NH2-[核酸塩基編集ドメイン]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-リンカー2-[UGI]-COOH、
NH2-[デアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[アデノシンデアミナーゼ]-リンカー1-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH2-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[デアミナーゼ]-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-[デアミナーゼ]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-[デアミナーゼ]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-[イノシンBER阻害剤]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-リンカー1-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH、
NH2-[イノシンBER阻害剤]-[核酸塩基編集ドメイン]-[デアミナーゼ]-リンカー2-[核酸塩基編集ドメイン]-COOH、または
NH2-[イノシンBER阻害剤]NH2-[核酸塩基編集ドメイン]-[デアミナーゼ]-[核酸塩基編集ドメイン]-COOH。
【0541】
一部の実施形態では、本明細書に提供される塩基編集融合タンパク質は、正確な位置に配置される必要があり、例えば、標的塩基が所定の領域(例えば、「脱アミノ化ウィンドウ」)内に配置される必要がある。一部の実施形態では、標的は、4塩基領域内にあることができる。一部の実施形態では、そのような定義された標的領域は、PAMの約15塩基上流にあり得る。Komor,A.C.,et al.,”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。
【0542】
定義された標的領域は、脱アミノ化ウィンドウであり得る。脱アミノ化ウィンドウは、塩基エディターが標的ヌクレオチドに作用し、脱アミノ化する所定の領域であり得る。一部の実施形態では、脱アミノ化ウィンドウは、2、3、4、5、6、7、8、9、または10塩基領域内にある。一部の実施形態では、脱アミノ化ウィンドウは、PAMの5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25塩基上流にある。
【0543】
本開示の塩基エディターは、標的ポリヌクレオチド配列の編集を容易にする任意のドメイン、特徴、またはアミノ酸配列を含むことができる。例えば、一部の実施形態では、塩基エディターは、核局在化配列(NLS)を含む。一部の実施形態では、塩基エディターのNLSは、デアミナーゼドメインとnapDNAbpドメインとの間に局在する。一部の実施形態では、塩基エディターのNLSは、napDNAbpドメインに局在するC末端である。
【0544】
融合タンパク質内に含まれ得るタンパク質ドメインの非限定的な例としては、デアミナーゼドメイン(例えば、アデノシンデアミナーゼまたはシチジンデアミナーゼ)、ウラシルグリコシラーゼ阻害剤(UGI)ドメイン、エピトープタグ、レポーター遺伝子配列及び/または本明細書に記載される活性のうちの1つ以上を有するタンパク質ドメインが挙げられる。
【0545】
ドメインは、エピトープタグ、レポータータンパク質、及び他の結合ドメインで検出または標識され得る。エピトープタグの非限定的な例としては、ヒスチジン(His)タグ、V5タグ、FLAGタグ、インフルエンザヘマグルチニン(HA)タグ、Mycタグ、VSV-Gタグ、及びチオレドキシン(Trx)タグが挙げられる。レポーター遺伝子の例としては、これらに限定されないが、グルタチオン-5-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、緑色蛍光タンパク質(GFP)、HcRed、DsRed、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、及び青色蛍光タンパク質(BFP)を含む自家蛍光タンパク質が挙げられる。追加のタンパク質配列としては、DNA分子に結合するアミノ酸配列、または他の細胞分子に結合するアミノ酸配列を挙げることができ、これらに限定されないが、マルトース結合タンパク質(MBP)、Sタグ、LexA DNA結合ドメイン(DBD)融合物、GAL4 DNA結合ドメイン融合物、及び単純ヘルペスウイルス(HSV)BP16タンパク質融合物が含まれる。
【0546】
シチジンまたはアデノシンデアミナーゼと、Cas9ドメインとを含む融合タンパク質を使用する方法
本開示の一部の態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示の一部の態様は、DNA分子を、本明細書で提供される融合タンパク質のうちのいずれかと接触させ、本明細書に記載される少なくとも1つのガイドRNAと接触させることを含む方法を提供する。
【0547】
一部の実施形態では、本発明の融合タンパク質は、目的の標的遺伝子またはポリヌクレオチド配列を編集するために使用される。特に、本明細書に記載のシチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターは、標的配列内で複数の変異を作製することができる。これらの変異は、標的の機能に影響を及ぼし得る。例えば、シチジンデアミナーゼまたはアデノシンデアミナーゼの核酸塩基エディターを使用して調節領域を標的化すると、調節領域の機能が改変し、下流タンパク質の発現が低減または排除される。別の例では、シチジンデアミナーゼまたはアデノシンデアミナーゼ核酸塩基エディターは、塩基エディターをコードするポリヌクレオチド配列内に組み込まれた異種イントロン内のスプライスアクセプターまたはスプライスドナー部位を標的とするために使用されるときに、イントロンのスプライシングが改変され、塩基エディターの発現または活性が低減または排除される。
【0548】
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパク質及び番号付けのスキームに依存することが理解されるであろう。番号付けは、例えば、成熟タンパク質の前駆体及び成熟タンパク質自体において異なる場合があり、種ごとの配列の違いは番号付けに影響を及ぼす場合がある。当業者であれば、当該技術分野で周知の方法(例えば、配列アラインメント及び相同残基の決定)によって、任意の相同タンパク質及びそれぞれのコード核酸におけるそれぞれの残基を特定することができるであろう。
【0549】
本明細書に開示されるCas9ドメインとシチジンデアミナーゼまたはアデノシンデアミナーゼとを含む融合タンパク質のいずれかを標的部位(例えば、編集される変異を含む部位)に標的化するために、典型的には、融合タンパク質をガイドRNA(例えば、sgRNA)と共発現させる必要があることは、当業者には明らかであろう。本明細書の他箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtracrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付与するガイド配列と、を含む。代替として、ガイドRNA及びtracrRNAは、2つの核酸分子として別々に提供され得る。一部の実施形態では、ガイドRNAは、構造を含み、ガイド配列は、標的配列に相補的な配列を含む。ガイド配列は、典型的には、20ヌクレオチド長である。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位に標的化するための好適なガイドRNAの配列は、本開示に基づいて、当業者には明らかであろう。そのような好適なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレオチド上流または下流以内の核酸配列に相補的なガイド配列を含む。提供される融合タンパク質のいずれかを特定の標的配列に標的化するのに好適ないくつかの例示的なガイドRNA配列が本明細書に提供される。
【0550】
塩基エディターの効率
一部の実施形態では、本発明で提供される方法の目的は、遺伝子編集を介して、遺伝子及び/または遺伝子産物を改変することである。本明細書で提供される核酸塩基編集タンパク質は、遺伝子編集ベースのヒト治療薬のために、インビトロまたはインビボで使用され得る。本明細書で提供される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と、核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)とを含む融合タンパク質は、ヌクレオチドをAからGまたはCからTへ編集するために使用され得ることが、当業者には理解されよう。一部の実施形態では、塩基エディターは、自己不活性化塩基エディターであり、不活性化は、塩基エディターをコードするポリヌクレオチド内に存在するイントロンを編集することによって誘導される。
【0551】
有利には、本明細書で提供される塩基編集システムは、CRISPRが行い得るように、二本鎖DNA切断をもたらすことなく、ドナーDNA鋳型を必要とすることなく、かつ過剰な確率的挿入及び欠失を誘導することなく、ゲノム編集を提供する。一部の実施形態では、本開示は、著しい数の意図されない変異、例えば、意図されない点変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)における意図された変異、例えば、終止コドンを効率的に生成する塩基エディターを提供する。一部の実施形態では、意図された変異は、意図された変異を生成するように特異的に設計されたガイドポリヌクレオチド(例えば、gRNA)に結合した特異的な塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)によって生成される変異である。一部の実施形態では、意図された変異は、疾患または障害に関連する標的抗原に関連する遺伝子内にある。一部の実施形態では、意図された変異は、疾患または障害に関連する標的抗原に関連する遺伝子におけるアデニン(A)からグアニン(G)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、意図された変異は、疾患または障害に関連する標的抗原に関連する遺伝子におけるシトシン(C)からチミン(T)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、遺伝子のコード領域または非コード領域(例えば、調節領域または調節要素)内のチミン(T)からシトシン(C)への点変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する点変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。
【0552】
一部の実施形態では、意図された編集は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内にある。一部の実施形態では、意図された編集は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位内にある。一部の実施形態では、意図された編集は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内のアデニン(A)からグアニン(G)への点変異(例えば、SNP)である。一部の実施形態では、意図された編集は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位内のアデニン(A)からグアニン(G)への点変異である。一部の実施形態では、意図された編集は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内のシトシン(C)からチミン(T)への点変異(例えば、SNP)である。一部の実施形態では、意図された変異は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内に存在するスプライスアクセプターまたはスプライスドナー部位内のシトシン(C)からチミン(T)への点変異である。
【0553】
本発明の塩基エディターは、有利には、著しい割合のインデルを生成することなく、タンパク質をコードする特定のヌクレオチド塩基を修飾する。本明細書で使用される場合、「インデル」は、核酸内のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、遺伝子のコード領域内のフレームシフト変異をもたらし得る。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異)する塩基エディターを生成することが望ましい。一部の実施形態では、核酸内に多数の挿入または欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異またはメチル化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、メチル化)を生成することができる。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、変異)を生成することができる。
【0554】
一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超えるインデルに対する意図された変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、またはそれ以上であるインデルに対する意図された変異の比率を生成することができる。意図された変異及びインデルの数は、任意の好適な方法を使用して決定され得る。
【0555】
一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、核酸の領域におけるインデルの形成を、1%未満、1.5%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、12%未満、15%未満、または20%未満に制限し得る。核酸領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、核酸(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。
【0556】
本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、相当数の意図しない変異(例えば、偽オフターゲット編集またはバイスタンダー編集)を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異を効率的に生成することができるという認識に基づく。一部の実施形態では、意図された変異は、意図された変異を生成するように特別に設計された、gRNAに結合した特定の塩基エディターによって生成される変異である。一部の実施形態では、意図された変異は、終止コドン(例えば、遺伝子のコード領域内の未熟終止コドン)を生成する変異である。一部の実施形態では、意図された変異は、終止コドンを排除する変異である。一部の実施形態では、意図された変異は、遺伝子のスプライシングを改変させる変異である。一部の実施形態では、意図された変異は、遺伝子の調節配列(例えば、遺伝子のプロモーターまたは遺伝子のリプレッサー)を改変させる変異である。一部の実施形態では、本明細書に提供される塩基エディターは、1:1(すなわち、意図された点変異:意図されていない点変異)を超える意図された変異:意図されていない変異の比率を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、少なくとも500:1、もしくは少なくとも1000:1、またはそれ以上である、意図された変異:意図されていない変異の比率を生成することができる。本明細書に記載の塩基エディターの特徴が、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。
【0557】
塩基編集は、遺伝的修飾、遺伝子修飾、及び核酸配列の修飾などの「修飾(modification)」と呼ばれることが多く、修飾が塩基編集修飾である文脈に基づいて、明確に理解され得る。したがって、塩基編集修飾は、例えば、本開示全体通して論じられるデアミナーゼ活性の結果として、ヌクレオチド塩基レベルでの修飾であり、これは次いで、遺伝子配列の変化をもたらし、遺伝子産物に影響を及ぼし得る。したがって、本質的には、本明細書に記載される遺伝子編集修飾は、遺伝子の修飾を構造的及び/または機能的にもたらし得、遺伝子産物の発現が修飾されてもよく(例えば、遺伝子の発現がノックアウトまたは逆に増強される)、または一部の状況では、遺伝子機能もしくは活性が修飾されてもよい。本明細書に開示される方法を使用して、塩基編集効率は、塩基編集が実行される遺伝子のノックダウン効率として決定され得、塩基編集は、遺伝子の発現をノックダウンするように意図されている。ノックダウンレベルは、いずれかの検出アッセイ、例えば、タンパク質発現レベルのためのアッセイ、例えば、フローサイトメトリー;RNA発現を検出するためのアッセイ、例えば、定量的RT-PCR、ノーザンブロット解析;またはいずれかの他の好適なアッセイ、例えば、パイロシークエンシングによって発現レベルを決定することによって定量的に検証され得、ヌクレオチド配列決定反応によって定性的に検証され得る。
【0558】
一部の実施形態では、修飾、例えば、単一塩基編集は、標的遺伝子の発現の少なくとも10%の低減をもたらす。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも10%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも20%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも30%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的遺伝子の発現の少なくとも40%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、遺伝子標的化発現の少なくとも50%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも60%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも70%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも80%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも90%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも91%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも92%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも93%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも94%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも95%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも96%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも97%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも98%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化遺伝子発現の少なくとも99%の低減をもたらし得る。一部の実施形態では、塩基編集効率は、標的化される遺伝子のノックアウト(遺伝子発現の100%ノックダウン)をもたらし得る。
【0559】
一部の実施形態では、本明細書で提供される塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満または0.01%未満のインデル形成をもたらす。
【0560】
一部の実施形態では、標的とされる修飾、例えば、単一塩基編集は、異なるガイドRNAでの塩基編集のための少なくとも4、5、6、7、8、9、10、11、12 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50個の異なる内因性配列を標的とするために同時に使用される。一部の実施形態では、標的とされる修飾、例えば、単一塩基編集は、異なるガイドRNAでの塩基編集のための少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49または50個以上の異なる内因性遺伝子配列を順次標的とするために使用される。
【0561】
本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、意図しない点変異(すなわち、バイスタンダーの変異)などの相当数の意図しない変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)において意図された変異(例えば、点変異)を効率的に生成することができるという認識に基づく。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも0.01%の意図された変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、意図された変異の少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、または99%を生成することができる。
【0562】
一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満または0.01%未満のインデル形成をもたらす。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における0.8%未満のインデル形成をもたらす。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における最大0.8%のインデル形成をもたらす。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における0.3%未満のインデル形成をもたらす。一部の実施形態では、記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列におけるより低いインデル形成をもたらす。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、ABE7.10を含む塩基エディターシステムと比較して、標的ポリヌクレオチド配列におけるより低いインデル形成をもたらす。
【0563】
一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、インデル頻度低減を有する。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、ABE7塩基エディターのうちの1つを含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%または少なくとも95%のインデル頻度低減を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムは、ABE7.10を含む塩基エディターシステムと比較して、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、または少なくとも95%のインデル頻度の減少を有する。
【0564】
本発明は、効率及び特異性の増加を有するアデノシンデアミナーゼのバリアント(例えば、ABE8バリアント)を提供する。特に、本明細書に記載のアデノシンデアミナーゼのバリアントは、ポリヌクレオチド内の所望の塩基を編集する可能性がより高く、改変されることを意図しない塩基(例えば、「バイスタンダー」)を編集する可能性がより低い。
【0565】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、減少したバイスタンダーの編集または変異を有する。一部の実施形態では、意図しない編集または変異は、標的ヌクレオチド配列の標的ウィンドウにおける意図しない位置または非標的位置における標的塩基(例えば、AまたはC)のバイスタンダー変異またはバイスタンダー編集である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、バイスタンダー編集または変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムを含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少している。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少したバイスタンダー編集または変異を有する。
【0566】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基編集システムのいずれかは、減少した偽編集を有する。一部の実施形態では、意図しない編集または意図しない変異は、偽変異または偽編集(例えば、ゲノムの意図しない領域または非標的領域における標的塩基(例えば、AまたはC)の非特異的編集またはガイド非依存性編集)である。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、偽編集または偽変異の減少を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%減少した偽編集を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのいずれかは、ABE7塩基エディター(例えば、ABE7.10)を含む塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍減少した偽編集または偽変異を有する。
【0567】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。一部の実施形態では、塩基編集効率は、細胞集団における編集された核酸塩基の割合を計算することによって測定され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の塩基編集効率を有する。
【0568】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い塩基編集効率を有する。
【0569】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高い塩基編集効率を有する。
【0570】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、細胞集団における編集された標的核酸塩基によって測定した場合、少なくとも0.01%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット塩基編集効率を有する。
【0571】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディターと比較して、より高いオンターゲット塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット塩基編集効率を有する。
【0572】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、ABE7塩基エディター(例えば、ABE7.10)と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット塩基編集効率を有する。
【0573】
本明細書に記載のABE8塩基エディターバリアントは、プラスミド、ベクター、LNP複合体、またはmRNAを介して宿主細胞に送達され得る。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAとして宿主細胞に送達される。一部の実施形態では、核酸ベースの送達システム(例えば、mRNA)を介して送達されるABE8塩基エディターは、編集された核酸塩基によって測定した場合、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%のオンターゲット編集効率を有する。一部の実施形態では、mRNAシステムによって送達されるABE8塩基エディターは、プラスミドまたはベクターシステムによって送達されるABE8塩基エディターと比較して、より高い塩基編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高いオンターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも3.6倍、少なくとも3.7倍、少なくとも3.8倍、少なくとも3.9倍、少なくとも4.0倍、少なくとも4.1倍、少なくとも4.2倍、少なくとも4.3倍、少なくとも4.4倍、少なくとも4.5倍、少なくとも4.6倍、少なくとも4.7倍、少なくとも4.8倍、少なくとも4.9倍、または少なくとも5.0倍高いオンターゲット編集効率を有する。
【0574】
一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む塩基エディターシステムのうちのいずれかは、標的ポリヌクレオチド配列における50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満または0.01%未満のオフターゲット編集をもたらす。
【0575】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、より低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、または少なくとも3.0倍低いガイドオフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも約2.2倍減少したガイドオフターゲット編集効率を有する。
【0576】
一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、ガイド非依存性オフターゲット編集効率が低い。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのいずれかは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも5.0倍、少なくとも10.0倍、少なくとも20.0倍、少なくとも50.0倍、少なくとも70.0倍、少なくとも100.0倍、少なくとも120.0倍、少なくとも130.0倍、または少なくとも150.0倍低いガイド非依存性オフターゲット編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、mRNAシステムによって送達された場合、プラスミドまたはベクターシステムによって送達された場合と比較して、134.0倍低いガイド非依存性オフターゲット編集効率(例えば、偽RNA脱アミノ化)有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントは、ゲノムにわたってガイド非依存性変異率を増加させない。
【0577】
一部の実施形態では、単一の遺伝子送達事象を使用して(例えば、形質導入、トランスフェクション、エレクトロポレーション、または任意の他の方法により)、細胞のゲノム内の5つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の6個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の7個の配列の塩基編集を標的化することができる。一部の実施形態では、単一のエレクトロポレーション事象を使用して、細胞のゲノム内の8つの配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の9個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の10個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の20個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の30個の配列の塩基編集を標的化することができる。一部の実施形態では、単一の遺伝子送達事象を使用して、細胞のゲノム内の40個の配列の塩基編集を標的化することができる。一部の実施形態では、単一遺伝子送達事象は、細胞のゲノム内の50個の配列の塩基編集を標的とするために使用され得る。
【0578】
一部の実施形態では、本明細書に記載される方法、例えば、塩基編集方法は、最小オフターゲット効果から無オフターゲット効果までを有する。
【0579】
一部の実施形態では、本明細書に記載される塩基編集方法は、細胞集団の少なくとも50%が、正常に編集されている(すなわち、細胞が、正常に操作されている)ことをもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも55%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも60%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも65%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも70%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも75%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも80%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも85%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも90%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載の塩基編集方法は、少なくとも95%の正常に編集された細胞集団をもたらす。一部の実施形態では、本明細書に記載される塩基編集方法は、細胞集団の約91%、92%、93%、94%、95%、96%、97%、98%、99%または100%が、正常に編集されていることをもたらす。
【0580】
一部の実施形態では、塩基編集介入後の生細胞回収率は、塩基編集事象の時点での開始細胞集団の少なくとも60%、70%、80%、90%超である。一部の実施形態では、上に記載される生細胞の回収率は、約70%である。一部の実施形態では、上に記載される生細胞の回収率は、約75%である。一部の実施形態では、上に記載される生細胞の回収率は、約80%である。一部の実施形態では、上に記載される生細胞の回収率は、約85%である。一部の実施形態では、上記の生細胞回収率は、塩基編集事象の時点での集団内の細胞の約90%、あるいは、約91%、92%、93%、94%、95%、96%、97%、98%もしくは99%、または100%である。
【0581】
一部の実施形態では、操作された細胞集団は、インビトロでさらに約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、約15倍、約20倍、約25倍、約30倍、約35倍、約40倍、約45倍、約50倍、または約100倍に増殖され得る。
【0582】
意図された変異及びインデルの数は、いずれかの好適な方法を使用して決定され得、好適な方法は、例えば、国際PCT出願第2017/045381号(WO2018/027078)及び同第PCT/US2016/058344号(WO2017/070632)、Komor,A.C.,et al.,”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)に記載されており、それらの内容全体は、参照により本明細書に援用される。
【0583】
一部の実施形態では、インデル頻度を計算するために、配列決定リード(sequencing reads)は、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列と正確に一致するようにスキャンされる。正確な一致が見つからない場合、リードは、分析から除外される。このインデルウィンドウの長さが参照配列と完全に一致する場合、リードは、インデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長いまたは短い場合、配列決定リードは、それぞれ、挿入または欠失として分類される。一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、または塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、もしくは10ヌクレオチド以内の領域にある。
【0584】
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数または割合は、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、または少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、融合タンパク質、または本明細書に提供される融合タンパク質を使用する方法のいずれかに適用され得ることを理解されたい。
【0585】
塩基エディター効率の詳細は、国際PCT出願第2017/045381号(WO2018/027078)及び第PCT/US2016/058344号(WO2017/070632)に記載されている(これらの各々は、その全体が参照により本明細書に援用される)。また、Komor,A.C.,et al.,”Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,”Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature 551,464-471(2017)及びKomor,A.C.,et al.,”Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774(2017)を参照されたく、それらの内容全体は、参照により本明細書に援用される。一部の実施形態では、本明細書に提供される方法を使用して、1つ以上の遺伝子における複数の核酸塩基対を編集することで、少なくとも1つの意図された変異の形成がもたらされる。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子の正常な機能の破壊をもたらす。一部の実施形態では、当該少なくとも1つの意図された変異の当該形成は、遺伝子によってコードされるタンパク質の発現を低減または排除する。多重編集が、本明細書に提供される任意の方法または方法の組み合わせを使用して達成され得ることを理解されたい。
【0586】
多重編集
一部の実施形態では、本発明で提供される塩基エディターシステムは、1つ以上の遺伝子またはポリヌクレオチド配列における複数の核酸塩基対を多重編集することが可能である。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子内または1つ以上の遺伝子内に位置し、少なくとも1つの遺伝子は、異なる遺伝子座内に位置する。一部の実施形態では、多重編集は、1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、単一ガイドポリヌクレオチドまたは複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、多重編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への結合を標的とするために、PAM配列を必要とする少なくとも1つのガイドポリヌクレオチドまたはPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。一部の実施形態では、多重編集は、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への標的結合に対してPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される任意の塩基エディターを使用する方法の任意の組み合わせに適用され得ることを理解されたい。本明細書に記載される塩基エディターのいずれを使用した多重編集は、複数の核酸塩基対の順次編集を含むこともできることを理解されたい。
【0587】
一部の実施形態では、複数の核酸塩基対は、1つ以上の遺伝子内にある。一部の実施形態では、複数の核酸塩基対は、同じ遺伝子内にある。一部の実施形態では、1つ以上の遺伝子内の少なくとも1つの遺伝子が、異なる遺伝子座に位置する。
【0588】
一部の実施形態では、複数の核酸塩基対は、1つ以上の標的ポリヌクレオチド配列内にある。一部の実施形態では、複数の核酸塩基対は、同じ標的ポリヌクレオチド配列内にある。一部の実施形態では、1つ以上の標的ポリヌクレオチド配列は、自己不活性化塩基エディターをコードするポリヌクレオチドのイントロン内に存在する。
【0589】
一部の実施形態では、編集は、少なくとも1つのタンパク質コード領域内、少なくとも1つのタンパク質非コード領域内、または少なくとも1つのタンパク質コード領域及び少なくとも1つのタンパク質非コード領域内の複数の核酸塩基対の編集である。
【0590】
一部の実施形態では、編集は、1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを含むことができる。一部の実施形態では、塩基エディターシステムは、1つ以上の塩基エディターシステムを、単一ガイドポリヌクレオチドまたは複数のガイドポリヌクレオチドとともに含むことができる。一部の実施形態では、編集は、単一の塩基エディターシステムを有する1つ以上のガイドポリヌクレオチドと併される。一部の実施形態では、編集は、標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドとともに、または標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとともに、または標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチド及び標的ポリヌクレオチド配列への結合を標的とするためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドの混合とともに行われる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の組み合わせのいずれかに適用され得ることを理解されたい。また、編集は、複数の核酸塩基対の順次編集を含むことができることも理解されたい。
【0591】
一部の実施形態では、1つ以上の遺伝子における複数の核酸塩基対を多重編集することが可能である塩基エディターシステムは、ABE7、ABE8及び/またはABE9塩基エディターのうちの1つを含む。一部の実施形態では、本明細書に記載されるABE8塩基エディターバリアントのうちの1つを含む、多重編集することが可能である塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む、多重編集することが可能である塩基エディターシステムと比較してより高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集が可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも105%、少なくとも110%、少なくとも115%、少なくとも120%、少なくとも125%、少なくとも130%、少なくとも135%、少なくとも140%、少なくとも145%、少なくとも150%、少なくとも155%、少なくとも160%、少なくとも165%、少なくとも170%、少なくとも175%、少なくとも180%、少なくとも185%、少なくとも190%、少なくとも195%、少なくとも200%、少なくとも210%、少なくとも220%、少なくとも230%、少なくとも240%、少なくとも250%、少なくとも260%、少なくとも270%、少なくとも280%、少なくとも290%、少なくとも300%、少なくとも310%、少なくとも320%、少なくとも330%、少なくとも340%、少なくとも350%、少なくとも360%、少なくとも370%、少なくとも380%、少なくとも390%、少なくとも400%、少なくとも450%、または少なくとも500%高い多重編集効率を有する。一部の実施形態では、本明細書に記載のABE8塩基エディターバリアントのうちの1つを含む多重編集可能な塩基エディターシステムは、ABE7塩基エディターのうちの1つを含む多重編集が可能な塩基エディターシステムと比較して、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、少なくとも1.5倍、少なくとも1.6倍、少なくとも1.7倍、少なくとも1.8倍、少なくとも1.9倍、少なくとも2.0倍、少なくとも2.1倍、少なくとも2.2倍、少なくとも2.3倍、少なくとも2.4倍、少なくとも2.5倍、少なくとも2.6倍、少なくとも2.7倍、少なくとも2.8倍、少なくとも2.9倍、少なくとも3.0倍、少なくとも3.1倍、少なくとも3.2倍、少なくとも3.3倍、少なくとも3.4倍、少なくとも3.5倍、少なくとも4.0倍、少なくとも4.5倍、少なくとも5.0倍、少なくとも5.5倍、または少なくとも6.0倍高い多重編集効率を有する。
【0592】
送達システム
ポリヌクレオチド配列(例えば、遺伝子またはイントロン)における1つ以上のヌクレオチドを標的とするための核酸塩基エディターの適合性は、本明細書に記載されるように評価される。一実施形態では、目的の単一細胞は、本明細書に記載される塩基エディターシステムをコードする1つ以上の核酸分子で、レポーター(例えば、GFP)をコードする少量のベクターと一緒にトランスフェクト、形質導入またはそうでなければ修飾される。これらの細胞は、当該技術分野で既知のいずれかの細胞株(例えば、HEK293T細胞)であることができる。代替として、初代細胞(例えば、ヒト)を使用してもよい。細胞は、対象または個体から(例えば、組織生検、手術、血液、血漿、血清、または他の生体液からも得ることができる。そのような細胞は、最終的な細胞標的に関連し得る。
【0593】
送達は、ウイルスベクターを使用して行ってもよい。一実施形態では、トランスフェクションは、脂質トランスフェクション(例えば、LipofectamineまたはFugene)を使用して、またはエレクトロポレーションによって行ってもよい。トランスフェクション後、レポーター(例えば、GFP)の発現は、蛍光顕微鏡法またはフローサイトメトリーのいずれかによって決定して、一貫した高レベルのトランスフェクションを確認することができる。これらの予備トランスフェクションは、どのエディターの組み合わせが最大の活性を与えるかを決定するために、異なる核酸塩基エディターを含むことができる。システムは、1つ以上の異なるベクターを含むことができる。一実施形態では、塩基エディターは、所望の細胞型、好ましくは真核細胞、好ましくは哺乳類細胞またはヒト細胞の発現のために、コドン最適化される。
【0594】
核酸塩基エディターの活性は、本明細書に記載のように、すなわち、細胞のゲノムを配列決定して標的配列における改変を検出することによって、評価される。サンガー配列決定の場合、精製されたPCRアンプリコンをプラスミド骨格にクローニングし、形質転換し、ミニプレッドし、単一のプライマーを用いて配列決定する。配列決定は、次世代配列決定(NGS)技術を使用してもよい。次世代配列決定を使用する場合、アンプリコンは、300~500bpであり得、非対称に配置された意図された切断部位を有する。PCR後、次世代配列決定のアダプター及びバーコード(例えば、Illumina多重アダプター及びマルチプレックスインデックス)を、例えば、ハイスループット配列決定(例えば、Illumina MiSeq)で使用するために、アンプリコンの末端に添加してもよい。初期試験において最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価のために選択することができる。
【0595】
特定の実施形態では、核酸塩基エディターは、目的のポリヌクレオチドを標的化するために使用される。一実施形態では、本発明の核酸塩基エディターは、細胞のゲノム内の1つ以上の目的の核酸配列を標的とするために使用される1つ以上のガイドRNAとともに、細胞に送達され、それによって、標的遺伝子(複数可)を改変する。一部の実施形態では、塩基エディターは、1つ以上のガイドRNAによって標的とされて、1つ以上の編集を、1つ以上の目的の遺伝子の配列に導入する。一部の実施形態では、1つ以上の目的の遺伝子の配列への1つ以上の編集は、宿主細胞内の遺伝子によってコードされたタンパク質の発現を減少させるまたは排除する。一部の実施形態では、1つ以上の目的の遺伝子によってコードされた1つ以上のタンパク質の発現は、宿主細胞内で完全にノックアウトまたは排除される。
【0596】
一部の実施形態では、本発明の核酸塩基エディターまたは核酸塩基エディターをコードするポリヌクレオチドは、塩基エディターをコードするポリヌクレオチド配列内の異種イントロンを標的とする1つ以上のガイドRNAとともに、細胞(例えば、宿主細胞)に送達され、それによって、標的とされるイントロン(例えば、スプライスアクセプター、スプライスドナー部位)を改変する。一部の実施形態では、イントロンの配列への1つ以上の編集は、塩基編集活性の発現、活性またはレベルを減少させるまたは排除する。
【0597】
一部の実施形態では、宿主細胞は、細菌細胞、植物細胞、昆虫細胞、ヒト細胞または哺乳類細胞から選択される。一部の実施形態では、宿主細胞は、哺乳類細胞である。一部の実施形態では、宿主細胞は、ヒト細胞である。一部の実施形態では、細胞は、インビトロである。一部の実施形態では、細胞は、インビボである。
【0598】
塩基エディターシステムの核酸ベースの送達
本開示による塩基エディターシステムをコードする核酸分子は、当技術分野で公知の方法により、または本明細書に記載されるように、対象に投与するか、またはインビトロもしくはインビボで細胞に送達することができる。一部の実施形態では、自己不活性化塩基エディターをコードする核酸分子は、細胞内の塩基エディターのレベル、発現または活性を低減するように編集され得るイントロンを含む。例えば、デアミナーゼ(例えば、シチジンまたはアデニンデアミナーゼ)を含む塩基エディターシステムを、ベクター(例えば、ウイルスまたは非ウイルスベクター)によって、または裸のDNA、DNA複合体、脂質ナノ粒子、もしくは前述の組成物の組み合わせによって送達することができる。
【0599】
有機または無機のナノ粒子は、塩基エディターシステムまたはその成分を送達するうえで有用である。ナノ粒子は当技術分野で周知であり、任意の適切なナノ粒子を使用して、塩基エディターシステムもしくはその成分、またはそのような成分をコードする核酸分子を送達することができる。一例では、有機(例えば、脂質及び/またはポリマー)ナノ粒子は、本開示の特定の実施形態における送達ビヒクルとしての使用に適している。表16(以下)に、ナノ粒子製剤、及び/または遺伝子導入に使用するための例示的な脂質を示す。
【0600】
【表16-1】

【表16-2】
【0601】
表17は、遺伝子導入及び/またはナノ粒子製剤に使用される例示的なポリマーを列挙する。

【表17】
【0602】
表18は、本明細書に記載の融合タンパク質をコードするポリヌクレオチドの送達方法を要約する。
【0603】
【表18】
【0604】
別の態様では、塩基エディターシステム構成要素またはこのような構成要素をコードする核酸、例えば、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、例えば、Cas9またはそのバリアント、及び目的の核酸配列を標的とするgRNAの送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)を、標的gRNAとの複合体内に含む。本明細書に記載されるRNPまたはポリヌクレオチドは、既知の方法、例えば、エレクトロポレーション、ヌクレオフェクションまたはカチオン性脂質を媒介する方法を使用して、細胞に送達され得、カチオン性脂質を媒介する方法は、例えば、Zuris,J.A.et al.,2015,Nat.Biotechnology,33(1):73-80に報告されており、これは、その全体が参照により援用される。RNPは、CRISPR塩基エディターシステムでの使用に有利であり、特に、トランスフェクトが困難な細胞(例えば、初代細胞)に有利である。加えて、RNPはまた、特に、CRISPRプラスミドにおいて使用され得る真核生物プロモーター(例えば、CMVまたはEF1A)が十分に発現していない場合、細胞内のタンパク質発現で生じ得る困難を緩和することができる。有利には、RNPの使用は、細胞内への外来DNAの送達を必要としない。さらに、核酸結合タンパク質とgRNA複合体とを含むRNPは、時間とともに分解されるため、RNPの使用は、オフターゲット効果を制限する可能性がある。プラスミドベースの技術の場合と同様の様式で、RNPを使用して、結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を誘導することができる。
【0605】
塩基エディターシステムをコードする核酸分子は、ネイキッドDNAもしくはRNAとして、例えば、トランスフェクションもしくはエレクトロポレーションによって、細胞に直接送達されてもよく、または標的細胞による取り込みを促進する分子(例えば、N-アセチルガラクトサミン)にコンジュゲートされてもよい。塩基エディターシステム及び/またはそれらの構成要素をコードするベクターもまた、使用され得る。特定の実施形態では、ポリヌクレオチド、例えば、塩基エディターシステムまたはその機能的構成要素をコードするmRNAは、本明細書に記載される1つ以上のガイドRNAとともに共エレクトロポレーションされ得る。
【0606】
核酸ベクターは、本明細書に記載の融合タンパク質のドメインをコードする1つ以上の配列を含むことができる。ベクターはまた、核局在化シグナル、核小体局在化シグナルまたはミトコンドリア局在化シグナルに動作可能に連結された、塩基エディターシステムのタンパク質構成要素をコードすることができる。一例として、ベクターは、Cas9コード配列を含むことができ、Cas9コード配列は、1つ以上の核局在化配列(例えば、SV40からの核局在化配列)と、1つ以上のデアミナーゼとを含む。
【0607】
ベクターはまた、いずれかの好適な数の調節/制御エレメント、例えば、プロモーター、エンハンサー、イントロン、ポリアデニル化シグナル、コザックコンセンサス配列または配列内リボソーム進入部位(IRES)を含むことができる。これらのエレメントは、当該技術分野で周知である。
【0608】
本開示によるベクターは、組換えウイルスベクターを含む。例示的なウイルスベクターは、上記の本明細書に記載されている。当該技術分野で既知の他のウイルスベクターも使用することができる。加えて、ウイルス粒子は、核酸及び/またはタンパク質の形態の塩基エディターシステム構成要素を送達するために使用され得る。例えば、「空の」ウイルス粒子は、カーゴとしての塩基エディターシステムまたは構成要素を含有するように構築され得る。ウイルスベクター及びウイルス粒子は、標的組織特異性を改変するために、標的化リガンドを組み込むように操作することもできる。
【0609】
本明細書に記載されるベクターは、塩基エディターシステムまたはその構成要素の発現を駆動するための調節エレメントを含み得る。このようなベクターは、長い逆位末端リピート(AAV ITR)を有するアデノ随伴ウイルスを含む。AAV ITRの使用は、ベクターにおけるスペースを取り得る追加のプロモーターエレメントの必要性を排除するために有利であり得る。解放された追加の空間を使用して、追加のエレメント(例えば、ガイド核酸または選択可能なマーカー)の発現を駆動することができる。ITR活性は、過剰発現に起因する潜在的な毒性を低減するために使用され得る。
【0610】
いずれかの好適なプロモーターが、塩基エディターシステムまたはその構成要素の発現を駆動するために使用され得、適切な場合、ガイド核酸の発現を駆動するために使用され得る。遍在的発現については、プロモーターは、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖または軽鎖を含む。脳または他のCNS細胞発現については、好適なプロモーターは、全てのニューロンのためのシナプシンI、興奮性ニューロンのためのCaMKIIアルファ、GABA作動性ニューロンのためのGAD67またはGAD65またはVGATを含む。肝細胞発現については、好適なプロモーターは、アルブミンプロモーターを含む。肺細胞発現については、好適なプロモーターは、SP-Bを含む。内皮細胞については、好適なプロモーターは、ICAMを含む。造血細胞発現については、好適なプロモーターは、IFNベータまたはCD45を含む。骨芽細胞発現については、好適なプロモーターは、OG-2を含むことができる。
【0611】
一部の実施形態では、本開示の塩基エディターは、別個のプロモーターが同じ核酸分子内の塩基エディター及び適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズのものである。例えば、ベクターまたはウイルスベクターは、塩基エディターをコードする核酸に作動可能に連結された第1のプロモーターと、ガイド核酸に作動可能に連結された第2のプロモーターとを含むことができる。
【0612】
ガイド核酸の発現を駆動するために使用されるプロモーターは、U6またはH1などのPol IIIプロモーター、gRNAアデノ随伴ウイルス(AAV)を発現させるための、Pol IIプロモーター及びイントロンカセットの使用を含むことができる。
【0613】
特定の実施形態では、本発明の融合タンパク質は、ウイルスベクター(例えば、アデノ随伴ウイルス(AAV)、AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10、及びそれらのバリアント)中に存在するポリヌクレオチド、または任意のウイルスベクターの好適なカプシドタンパク質によってコードされる。したがって、一部の態様では、本開示は、融合タンパク質のウイルス送達に関する。ウイルスベクターの例としては、レトロウイルスベクター(例えば、マロニー(Maloney)マウス白血病ウイルス、MML-V)、アデノウイルスベクター(例えば、AD100)、レンチウイルスベクター(HIV及びFIVベースのベクター)、ヘルペスウイルスベクター(例えば、HSV-2)が挙げられる。
【0614】
ウイルスベクター
本明細書に記載される塩基エディターは、ウイルスベクターで送達され得る。一部の実施形態では、本明細書に開示される塩基エディターは、ウイルスベクターに含まれる核酸上にコードされ得る。一部の実施形態では、塩基エディターシステムの1つ以上の成分は、1つ以上のウイルスベクター上にコードされ得る。例えば、塩基エディター及びガイド核酸は、単一のウイルスベクター上にコードされ得る。他の実施形態では、塩基エディター及びガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合も、塩基エディター及びガイド核酸は、各々、プロモーター及びターミネーターに作動可能に連結され得る。ウイルスベクター上にコードされる成分の組み合わせは、選択されたウイルスベクターのカーゴサイズ制約によって決定され得る。
【0615】
塩基エディターの送達のためのRNAまたはDNAウイルスベースのシステムの使用は、培養物中または宿主内の特定の細胞にウイルスを標的化し、ウイルスペイロードを核または宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、培養物中の細胞、患者に(インビボで)直接投与することができ、または、インビトロで細胞を処理するためにそれらを使用することができ、修飾細胞は、任意選択的に(エクスビボで)患者に投与され得る。従来のウイルスベースのシステムは、遺伝子導入用のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、及び単純ヘルペスウイルスのベクターを含み得る。宿主ゲノムへの組み込みは、レトロウイルス、レンチウイルス、及びアデノ随伴ウイルスの遺伝子導入法で可能であり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。さらに、多くの異なる細胞型及び標的組織において、高い形質導入効率が観察されている。
【0616】
ウイルスベクターとしては、レンチウイルスベクター(例えば、HIV及びFIVベースのベクター)、アデノウイルスベクター(例えば、AD100)、レトロウイルスベクター(例えば、マロニーマウス白血病ウイルス、MML-V)、ヘルペスウイルスベクター(例えば、HSV-2)、及びアデノ随伴ウイルス(AAV)ベクター、または他のプラスミドまたはウイルスベクタータイプが挙げられ得、例えば、米国特許第8,454,972号(アデノウイルスのための製剤、用量)、米国特許第8,404,658号(AAVのための製剤、用量)、及び米国特許第5,846,946号(DNAプラスミドのための製剤、用量)からの製剤及び用量、ならびにレンチウイルス、AAV、及びアデノウイルスを伴う臨床試験に関する臨床試験及び刊行物からの製剤及び用量が使用される。例えば、AAVの場合、投与経路、製剤、及び投与量は、米国特許第8,454,972号及びAAVを伴う臨床試験と同様であり得る。アデノウイルスの場合、投与経路、製剤、及び投与量は、米国特許第8,404,658号及びアデノウイルスを伴う臨床試験と同様であり得る。プラスミド送達の場合、投与経路、製剤、及び投与量は、米国特許第5,846,946号及びプラスミドを伴う臨床試験と同様であり得る。用量は、平均70kgの個体(例えば、成体ヒト男性)に基づくか、または推定され得、患者、対象、異なる体重及び種の哺乳類に対して調整され得る。投与頻度は、年齢、性別、全般的な健康状態、患者もしくは対象の他の状態、及び対処される特定の状態もしくは症状を含む通常の要因に応じて、医師または獣医(例えば、医師、獣医)の範疇である。ウイルスベクターは、目的の組織に注射され得る。細胞型特異的塩基エディターの場合、塩基エディター及び任意のガイド核酸の発現は、細胞型特異的プロモーターによって駆動され得る。
【0617】
外来エンベロープタンパク質を組み込むことによって、標的細胞の潜在的な標的集団を拡大することによって、レトロウイルスのトロピズムを改変させることができる。レンチウイルスベクターは、非分裂細胞を形質導入または感染させることができ、典型的には、高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入システムの選択は、標的組織に依存することになる。レトロウイルスベクターは、最大6~10kbの外来配列のパッケージング容量を有する、シス作用性の長鎖末端反復からなる。最小のシス作用性LTRは、ベクターの複製及びパッケージングに十分であり、次いで、治療用遺伝子を標的細胞に組み込んで、永続的な導入遺伝子の発現を提供するために使用される。広く使用されているレトロウイルスベクターは、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)及びそれらの組み合わせに基づくものを含む(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992)、Johann et al.,J.Virol.66:1635-1640(1992)、Sommnerfelt et al.,Virol.176:58-59(1990)、Wilson et al.,J.Virol.63:2374-2378(1989)、Miller et al.,J.Virol.65:2220-2224(1991)、PCT/US94/05700を参照されたい)。
【0618】
レトロウイルスベクター、特に、レンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、9kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して、低いウイルス力価をもたらし得る。一部の態様では、本開示の塩基エディターは、効率的なパッケージング及びレトロウイルスベクターを介した標的細胞への送達を可能にするように十分なサイズである。一部の実施形態では、塩基エディターは、ガイド核酸及び/または標的化可能なヌクレアーゼシステムの他の成分と一緒に発現された場合でも、効率的なパッキング及び送達を可能にするようなサイズである。
【0619】
パッケージング細胞は、典型的には、宿主細胞に感染することが可能なウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi.2細胞またはPA317細胞が含まれる。遺伝子療法に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、典型的には、パッケージング及びその後の宿主への組み込みに必要な最小限のウイルス配列を含み、他のウイルス配列は、発現されるポリヌクレオチド(複数可)のための発現カセットによって置き換えられる。欠損したウイルス機能は、典型的には、パッケージング細胞株によってトランスで供給される。例えば、遺伝子療法で使用されるアデノ随伴ウイルス(「AAV」)ベクターは、典型的には、宿主ゲノムへのパッケージング及び組み込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子(すなわち、rep及びcap)をコードするがITR配列を欠くヘルパープラスミドを含む細胞株にパッケージングすることができる。細胞株は、ヘルパーとしてアデノウイルスで感染され得る。ヘルパーウイルスは、AAVベクターの複製及びヘルパープラスミド由来のAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列を欠くために、かなりの量でパッケージ化されない。アデノウイルスによる汚染は、例えば、アデノウイルスがAAVよりも感受性が高い熱処理によって低減され得る。
【0620】
一過的な発現が好ましい用途では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率を有することが可能であり、細胞分裂を必要としない。このようなベクターを用いて、高い力価及び発現レベルが得られている。このベクターは、比較的単純なシステムで大量に産生され得る。AAVベクターはまた、例えば、核酸及びペプチドのインビトロ産生において、かつインビボ及びエクスビボ遺伝子療法手順のために細胞を標的核酸で形質導入するために使用され得る(例えば、West et al.,Virology 160:38-47(1987)、米国特許第4,797,368号、WO93/24641、Kotin,Human Gene Therapy 5:793-801(1994)、Muzyczka,J.Clin.Invest.94:1351(1994)を参照されたい)。組換えAAVベクターの構築は、いくつかの刊行物に記載されており、これらの刊行物は、米国特許第5,173,414号、Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985)、Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984)、Hermonat & Muzyczka,PNAS 81:6466-6470(1984)及びSamulski et al.,J.Virol.63:03822-3828(1989)を含む。
【0621】
一部の実施形態では、AAVベクターは、目的の細胞を、本明細書で提供される塩基エディターまたは塩基エディターシステムをコードするポリヌクレオチドで形質導入するために使用される。AAVは、パルボウイルス科に属する小型の一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのカプシドタンパク質とをコードする2つの遺伝子で構成され、両側に145bpの逆位末端反復(ITR)が隣接している。ビリオンは、3つのカプシドタンパク質であるVp1、Vp2、及びVp3から構成され、同じオープンリーディングフレームから1:1:10の比率で生成されるが、差次的スプライシング(Vp1)及び選択的翻訳開始部位(それぞれ、Vp2及びVp3)から産生される。Vp3は、ビリオン内で最も豊富なサブユニットであり、ウイルスのトロピズムを定義する細胞表面での受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインは、Vp1の固有のN末端に特定されている。
【0622】
wtAAVと同様に、組換えAAV(rAAV)は、隣接ベクター導入遺伝子カセットに対する145bpのシス作用性ITRを利用し、外来DNAのパッケージングのために最大4.5kbを提供する。感染後、rAAVは、本発明の融合タンパク質を発現することができ、環状ヘッド・トゥ・テール(head-to-tail)コンカテマーでエピソーム的に存在することによって、宿主ゲノムに組み込まれることなく持続する。このシステムをインビトロ及びインビボで使用したrAAVの成功例は多数あるが、遺伝子のコード配列の長さがwtAAVゲノムと同等またはそれ以上である場合、パッケージング容量の制限により、AAV媒介性遺伝子送達の使用が制限される。
【0623】
ウイルスベクターは、用途に基づいて選択することができる。例えば、インビボでの遺伝子送達の場合、AAVは、他のウイルスベクターよりも有利であり得る。一部の実施形態では、AAVは低毒性を可能にし、これは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。一部の実施形態では、AAVは、宿主ゲノムに組み込まれないため、挿入変異誘発を引き起こす可能性が低くなる。アデノウイルスは、それらが強い免疫原性応答を誘導するため、ワクチンとして一般的に使用される。ウイルスベクターのパッケージング容量は、ベクター内にパッケージングされ得る塩基エディターのサイズを制限し得る。
【0624】
AAVは、2つの145塩基の逆位末端反復(ITR)を含む、約4.5Kbまたは4.75Kbのパッケージング容量を有する。これは、開示される塩基エディター、ならびにプロモーター及び転写ターミネーターが、単一のウイルスベクターに適合され得ることを意味する。4.5Kbまたは4.75Kbを超える構築物は、ウイルス産生の著しい低下をもたらし得る。例えば、SpCas9はかなり大きく、遺伝子自体は4.1Kb超であり、これは、AAV内へのパッケージングを困難にする。したがって、本開示の実施形態は、従来の塩基エディターよりも長さが短い開示される塩基エディターの利用を含む。一部の実施例では、塩基エディターは、4kb未満である。開示される塩基エディターは、4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb、または1.5kb未満であり得る。一部の実施形態では、本開示の塩基エディターの長さは、4.5kb以下である。
【0625】
AAVは、AAV1、AAV2、AAV5、またはそれらの任意の組み合わせであり得る。AAVのタイプは、標的とされる細胞に関して選択され得、例えば、AAV血清型1、2、5もしくはハイブリッドカプシドAAV1、AAV2、AAV5、またはそれらのいずれかの組み合わせが、脳またはニューロン細胞を標的とするために選択され得、AAV4が、心臓組織を標的とするために選択され得る。AAV8は、肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の表は、Grimm,D.et al,J.Virol.82:5887-5911(2008)に見出すことができる。
【0626】
一部の実施形態では、レンチウイルスベクターは、目的の細胞を、本明細書で提供される塩基エディターまたは塩基エディターシステムをコードするポリヌクレオチドで形質導入するために使用される。レンチウイルスは複雑なレトロウイルスであり、分裂細胞と分裂終了細胞の両方において感染し、それらの遺伝子を発現する能力を有する。最も一般的に知られているレンチウイルスは、ヒト免疫不全ウイルス(HIV)であり、他のウイルスのエンベロープ糖タンパク質を使用して、広範囲の細胞型を標的化する。
【0627】
レンチウイルスは、以下のように調製することができる。pCasES10(レンチウイルス転写プラスミド骨格を含む)をクローニングした後、トランスフェクションの前日に、低継代(p=5)のHEK293FTを、10%ウシ胎仔血清を含み抗生物質を含まないDMEM中で、T-75フラスコ内で50%コンフルエンスに播種した。20時間後、培地をOptiMEM(無血清)培地に交換し、4時間後にトランスフェクションを行った。細胞を、10μgのレンチウイルス導入プラスミド(pCasES10)及び以下のパッケージングプラスミドを用いてトランスフェクトする:5μgのpMD2.G(VSV-gシュードタイプ)、及び7.5μgのpsPAX2(gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50μlのLipofectamine 2000及び100μlのPlus試薬)を含む4mLのOptiMEM中で行うことができる。6時間後、培地を、10%胎仔ウシ血清を含み抗生物質を含まないDMEMに交換する。これらの方法は、細胞培養中に血清を使用するが、無血清の方法が好ましい。
【0628】
レンチウイルスは、以下のように精製することができる。ウイルス上清を48時間後に回収する。上清は、最初にデブリを除去し、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、超遠心分離機で、24,000rpmで2時間スピンする。ウイルスペレットを、50μlのDMEM中に、4℃で一晩再懸濁する。次いで、それらをアリコートし、-80℃ですぐに凍結する。
【0629】
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小非霊長類レンチウイルスベクターも企図される。別の実施形態では、RetinoStat(登録商標)は、ウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子療法ベクターであり、血管新生抑制タンパク質であるエンドスタチン及びアンジオスタチンを発現し、これは、網膜下注射によって送達されることが企図される。別の実施形態では、自己不活性化レンチウイルスベクターの使用が企図される。
【0630】
システムの任意のRNA、例えば、ガイドRNAまたは塩基エディターをコードするmRNAは、RNAの形態で送達され得る。塩基エディターをコードするmRNAは、インビトロ転写を使用して生成することができる。例えば、ヌクレアーゼのmRNAは、以下のエレメントを含むPCRカセットを使用して合成することができる:T7プロモーター、任意選択のコザック配列(GCCACC)、ヌクレアーゼ配列及び3’UTR、例えば、ベータグロビン-ポリAテールからの3’UTR。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーター、続いて、配列「GG」、及びガイドポリヌクレオチド配列を含むカセットからのインビトロ転写を使用して転写することもできる。
【0631】
発現を増強し、可能性のある毒性を低減するために、塩基エディターのコード配列及び/またはガイド核酸は、例えば、シュードUまたは5-メチルCを使用して、1つ以上の修飾ヌクレオシドを含むように修飾され得る。
【0632】
AAVベクターの小さなパッケージング容量は、このサイズを超えるいくつかの遺伝子の送達及び/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質(複数可)を2つ以上の断片に分割することによって対処することができ、N末端断片は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。次いで、これらの断片は、2つ以上のAAVベクターにパッケージングされる。本明細書で使用される場合、「インテイン」とは、隣接するN末端及びC末端のエクステイン(例えば、連結される断片)をライゲーションする自己スプライシングタンパク質のイントロン(例えば、ペプチド)を指す。異種タンパク質断片を結合するための、特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntN及びIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステイン及びC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。
【0633】
本発明の融合タンパク質の断片は、長さが変化し得る。一部の実施形態では、タンパク質断片は、2アミノ酸長~約1000アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約5アミノ酸長~約500アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約20アミノ酸長~約200アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約10アミノ酸長~約100アミノ酸長の範囲である。他の長さの好適なタンパク質断片は、当業者には明らかであろう。
【0634】
一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半分(5’末端及び3’末端、または頭部及び尾部)に分割することによって生成され、カセットの各半分は、単一のAAVベクター(5kb未満)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクター、続いて、(1)5’ゲノムと3’ゲノムとの間の相同組換え(HR)(デュアルAAV重複ベクター)、(2)5’ゲノムと3’ゲノムとのITR媒介性テール・トゥ・ヘッド(tail-to-head)コンカテマー化(デュアルAAVトランススプライシングベクター)、または(3)これらの2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって同じ細胞を同時感染させると達成される。インビボでのデュアルAAVベクターの使用は、全長タンパク質の発現をもたらす。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kb超の導入遺伝子のための効率的かつ実行可能な遺伝子導入戦略を表す。
【0635】
インテイン
インテイン(介在タンパク質)は、タンパク質スプライシングとして知られるプロセスを行う様々な多様な生物に見られる自動処理ドメインである。タンパク質スプライシングは、ペプチド結合の切断及び形成の両方からなる多段階の生化学反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見出されるが、インテインは、事実上、任意のポリペプチド骨格を化学的に操作するために使用することもできる。
【0636】
タンパク質スプライシングでは、インテインは、2つのペプチド結合を切断することによって前駆体ポリペプチドから自ら切除し、それによって、新たなペプチド結合の形成を介して隣接するエクセイン(外部タンパク質)配列をライゲーションする。この再編成は、翻訳後(または、場合によっては翻訳時(co-translationally))に起こる。インテイン媒介性タンパク質スプライシングは、インテインドメインのフォールディングのみを必要とする、自発的に起こる。
【0637】
インテインの約5%はスプリットインテインであり、これらは2つの別個のポリペプチド(N-インテイン及びC-インテイン)として転写及び翻訳され、それぞれが1つのエクステインに融合される。翻訳時に、インテイン断片は、正準インテイン構造に自発的かつ非共有結合的に構築され、トランスでタンパク質スプライシングを行う。タンパク質スプライシングのメカニズムは、インテイン-エクステイン接合部における2つのペプチド結合の切断、及びN-エクステインとC-エクステインとの間の新しいペプチド結合の形成をもたらす一連のアシル転位反応を伴う。このプロセスは、N-エクステインとインテインのN末端とを結合するペプチド結合の活性化によって開始される。ほぼ全てのインテインは、C末端N-エクステイン残基のカルボニル炭素を攻撃するシステインまたはセリンを、N末端に有する。このNからO/Sへのアシル転位は、一般的に見出されるアスパラギン酸と一緒に、(TXXHモチーフ(配列番号17)と称される)保存されたスレオニン及びヒスチジンによって容易にされ、これは、直鎖(チオ)エステル中間体の形成をもたらす。次に、この中間体は、システイン、セリン、またはスレオニンである第1のC-エクステイン残基(+1)の求核攻撃によるトランス(チオ)エステル化に供される。得られた分枝(チオ)エステル中間体は、インテインの高度に保存されたC末端アスパラギンの環化という独自の変換によって解決される。このプロセスは、ヒスチジン(高度に保存されたHNFモチーフ中に見出される)及び最後から2番目のヒスチジンによって促進され、アスパラギン酸もまた関与し得る。このスクシンイミド形成反応は、反応性複合体からインテインを切除し、非ペプチド結合を介して結合したエクステインを残す。この構造は、インテイン非依存的な様式で急速に安定なペプチド結合に再編成される。一部の実施形態では、スプリットインテインは、Gp41.1、IMPDH.1、NrdJ.1及びGp41.8から選択される(Carvajal-Vallejos,Patricia et al.”Unprecedented rates and efficiencies revealed for new natural split inteins from metagenomic sources.”J.Biol.Chem.,vol.287,34(2012))。
【0638】
インテインの非限定的な例としては、当該技術分野で既知のいずれかのインテインまたはインテイン対が挙げられ、インテインまたはインテイン対は、dnaEインテインに基づく合成インテイン、Cfa-N(例えば、スプリットインテイン-N)とCfa-C(例えば、スプリットインテイン-C)とのインテイン対(例えば、Stevens et al.,J Am Chem Soc.2016 Feb.24;138(7):2162-5に記載されており、これは、参照により本明細書に援用される)及びDnaEを含む。本開示により使用され得るインテインの対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテイン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBインテイン及びCne Prp8インテイン(例えば、米国特許第8,394,604号に記載されており、これは、参照により本明細書に援用される)が挙げられる。インテインの例示的なヌクレオチド及びアミノ酸配列は、配列表で配列番号482~489で提供される。
【0639】
インテイン-N及びインテイン-Cは、それぞれ、スプリットCas9のN末端部分及びスプリットCas9のC末端部分の結合のために、スプリットCas9のN末端部分及びスプリットCas9のC末端部分に融合され得る。例えば、一部の実施形態では、インテイン-Nは、スプリットCas9のN末端部分のC末端に融合され、すなわち、N-[スプリットCas9のN末端部分]-[インテイン-N]-Cの構造を形成する。一部の実施形態では、インテイン-Cは、スプリットCas9のC末端部分のN末端に融合され、すなわち、N-[インテイン-C]-[スプリットCas9のC末端部分]-Cの構造を形成する。インテインが(例えば、スプリットCas9)に融合されるタンパク質を連結するためのインテイン媒介性タンパク質スプライシングのメカニズムは既知であり、例えば、Shah et al.,Chem Sci.2014;5(1):446-461に記載されている(参照により本明細書に援用される)。インテインを設計及び使用するための方法は、当該技術分野で既知であり、例えば、WO2014/004336、WO2017/132580、US2015/0344549及びUS2018/0127780によって記載されており、それらの各々は、それらの全体が参照により本明細書に援用される。
【0640】
一部の実施形態では、ヌクレアーゼ(例えば、Cas9)の一部分または断片がインテインに融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。一部の実施形態では、融合タンパク質の一部分または断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、及びカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。一部の実施形態では、塩基エディター(例えば、ABE、CBE)のN末端断片は、スプリットインテイン-Nに融合されており、C末端断片は、スプリットインテイン-Cに融合されている。一部の実施形態では、核酸プログラマブルDNA結合タンパク質(napDNAbp)ドメイン(例えば、Cas9)のN末端断片は、スプリットインテイン-Nに融合されており、C末端断片は、スプリットインテイン-Cに融合されている。一部の実施形態では、デアミナーゼドメインのN末端断片(例えば、アデノシンまたはシチジンデアミナーゼ)は、スプリットインテイン-Nに融合されており、C末端断片は、スプリットインテイン-Cに融合されている。
【0641】
次いで、これらの断片は、2つ以上のAAVベクター内にパッケージングされている。一部の実施形態では、インテインを特徴とする塩基エディター(例えば、自己不活性化塩基エディター)をコードするポリヌクレオチドは、イントロンを含む。一部の実施形態では、インテインのN末端は、融合タンパク質のC末端に融合され、インテインのC末端は、AAVカプシドタンパク質のN末端に融合される。
【0642】
一実施形態では、インテインは、AAVカプシドタンパク質上に移植されたシチジンまたはアデノシン塩基エディタータンパク質の断片または部分を結合するために使用される。異種タンパク質断片を結合するための、特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntN及びIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステイン及びC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。
【0643】
一部の実施形態では、ABEは、SpCas9の選択された領域内のAla、Ser、Thr、またはCys残基において、N末端断片及びC末端断片に分割された。これらの領域は、Cas9結晶構造解析によって特定されたループ領域に対応する。
【0644】
アミノ酸位置S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589及びS590で、各々の断片のN末端は、インテイン-Nに融合されており、各々の断片のC末端は、インテイン-Cに融合されており、これらのアミノ酸位置は、(「Cas9参照配列」と称される)以下の配列において大文字で示される。
1 mdkkysigld igtnsvgwav itdeykvpsk kfkvlgntdr hsikknliga llfdsgetae
61 atrlkrtarr rytrrknric ylqeifsnem akvddsffhr leesflveed kkherhpifg
121 nivdevayhe kyptiyhlrk klvdstdkad lrliylalah mikfrghfli egdlnpdnsd
181 vdklfiqlvq tynqlfeenp inasgvdaka ilsarlsksr rlenliaqlp gekknglfgn
241 lialslgltp nfksnfdlae daklqlskdt ydddldnlla qigdqyadlf laaknlsdai
301 llSdilrvnT eiTkaplsas mikrydehhq dltllkalvr qqlpekykei ffdqSkngya
361 gyidggasqe efykfikpil ekmdgteell vklnredllr kqrtfdngsi phqihlgelh
421 ailrrqedfy pflkdnreki ekiltfripy yvgplArgnS rfAwmTrkSe eTiTpwnfee
481 vvdkgasaqs fiermtnfdk nlpnekvlpk hsllyeyftv yneltkvkyv tegmrkpafl
541 sgeqkkaivd llfktnrkvt vkqlkedyfk kieCfdSvei sgvedrfnAS lgtyhdllki
601 ikdkdfldne enedilediv ltltlfedre mieerlktya hlfddkvmkq lkrrrytgwg
661 rlsrklingi rdkqsgktil dflksdgfan rnfmqlihdd sltfkediqk aqvsgqgdsl
721 hehianlags paikkgilqt vkvvdelvkv mgrhkpeniv iemarenqtt qkgqknsrer
781 mkrieegike lgsqilkehp ventqlqnek lylyylqngr dmyvdqeldi nrlsdydvdh
841 ivpqsflkdd sidnkvltrs dknrgksdnv pseevvkkmk nywrqllnak litqrkfdnl
901 tkaergglse ldkagfikrq lvetrqitkh vaqildsrmn tkydendkli revkvitlks
961 klvsdfrkdf qfykvreinn yhhahdayln avvgtalikk ypklesefvy gdykvydvrk
1021 miakseqeig katakyffys nimnffktei tlangeirkr plietngetg eivwdkgrdf
1081 atvrkvlsmp qvnivkktev qtggfskesi lpkrnsdkli arkkdwdpkk yggfdsptva
1141 ysvlvvakve kgkskklksv kellgitime rssfeknpid fleakgykev kkdliiklpk
1201 yslfelengr krmlasagel qkgnelalps kyvnflylas hyeklkgspe dneqkqlfve
1261 qhkhyldeii eqisefskrv iladanldkv lsaynkhrdk pireqaenii hlftltnlga
1321 paafkyfdtt idrkrytstk evldatlihq sitglyetri dlsqlggd
(配列番号250)
【0645】
医薬組成物
一部の態様では、本発明は、医薬組成物を提供し、医薬組成物は、本明細書に記載されるポリヌクレオチド、ベクター、細胞、塩基エディター(例えば、自己不活性化塩基エディター)、塩基エディターシステム、ガイドポリヌクレオチド、融合タンパク質または融合タンパク質-ガイドポリヌクレオチド複合体のうちのいずれかを含む。
【0646】
本発明の医薬組成物は、既知の技術に従って調製することができる。例えば、Remington,The Science And Practice of Pharmacy(21st ed.2005)を参照されたい。概して、細胞またはその集団は、投与または貯蔵の前に、好適な担体と混合され、一部の実施形態では、医薬組成物は、薬学的に許容される担体をさらに含む。好適な薬学的に許容される担体は、概して、不活性物質を含み、医薬組成物を対象に投与するのを助けるか、医薬組成物を送達可能な調製物に加工するのを助けるか、または投与前に医薬組成物を保管するのを助ける。薬学的に許容される担体は、製剤の形態、一貫性、粘性、pH、薬物動態、溶解性を、安定化、最適化、またはその他改変させ得る薬剤を含むことができる。そのような薬剤には、緩衝剤、湿潤剤、乳化剤、希釈剤、封入剤、及び皮膚浸透促進剤が含まれる。例えば、担体には、生理食塩水、緩衝生理食塩水、デキストロース、アルギニン、スクロース、水、グリセロール、エタノール、ソルビトール、デキストラン、カルボキシメチルセルロースナトリウム、及びそれらの組み合わせが含まれ得るが、これらに限定されない。
【0647】
薬学的に許容される担体としての役割を果たすことができる材料のいくつかの非限定的な例としては、以下が挙げられる:(1)糖類(例えば、乳糖、グルコース及びスクロース)、(2)デンプン(例えば、トウモロコシデンプン及びジャガイモデンプン)、(3)セルロース及びその誘導体(例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、及び酢酸セルロース)、(4)粉末トラガント、(5)麦芽、(6)ゼラチン、(7)潤滑剤(例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク)、(8)賦形剤(例えば、ココアバター及び坐剤ワックス)、(9)油(例えば、ピーナッツ油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油、及び大豆油)、(10)グリコール(例えば、プロピレングリコール)、(11)ポリオール(例えば、グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG))、(12)エステル(例えば、オレイン酸エチル及びラウリン酸エチル)、(13)寒天、(14)緩衝剤(例えば、水酸化マグネシウム及び水酸化アルミニウム)、(15)アルギン酸、(16)パイロジェンフリー水、(17)等張生理食塩水、(18)リンゲル溶液、(19)エチルアルコール、(20)pH緩衝溶液、(21)ポリエステル、ポリカーボネート、及び/またはポリ酸無水物、(22)膨張剤(例えば、ポリペプチド及びアミノ酸)、(23)血清アルコール(例えば、エタノール)、ならびに(23)薬学的製剤に用いられる他の非毒性の適合性物質。湿潤剤、着色剤、剥離剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤、及び抗酸化剤も、製剤中に存在してもよい。
【0648】
医薬組成物は、製剤のpHを、生理学的pHを反映する所定のレベルに(例えば、約5.0~約8.0の範囲に)維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体製剤に使用されるpH緩衝化合物は、アミノ酸、またはアミノ酸の混合物(例えば、ヒスチジン、またはヒスチジン及びグリシンなどのアミノ酸の混合物)であり得る。代替として、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベル、例えば、約5.0~約8.0の範囲に維持し、カルシウムイオンをキレート化しない薬剤である。そのようなpH緩衝化合物の例示的な例としては、イミダゾール及び酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに好適な任意の量で存在してもよい。
【0649】
医薬組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、張力、オスモラリティ、及び/または浸透圧)を、レシピエント個体の血流及び血液細胞で許容されるレベルに調節する化合物を含み得る。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する、当業者に既知または利用可能な任意の化合物であり得る。当業者は、本発明の製剤で使用される所与の浸透圧調節剤の適合性を経験的に決定することができる。好適なタイプの浸透圧調節剤の例示的な例としては、塩、例えば、塩化ナトリウム及び酢酸ナトリウム;糖、例えば、スクロース、デキストロース及びマンニトール;アミノ酸、例えば、グリシン;ならびにこれらの薬剤及び/またはこれらのタイプの薬剤のうちの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤(複数可)は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在してもよい。
【0650】
修飾された細胞またはその集団、及び担体に加えて、本発明の医薬組成物は、疾患の治療において有用な少なくとも1つの追加の治療剤を含むことができる。例えば、本明細書に記載の医薬組成物の一部の実施形態は、化学療法剤をさらに含む。一部の実施形態では、医薬組成物は、サイトカインペプチドまたはサイトカインペプチドをコードする核酸配列をさらに含む。一部の実施形態では、細胞またはその集団を含む医薬組成物は、追加の治療剤とは別個に投与され得る。
【0651】
本発明の遺伝子修飾された細胞の治療的使用に関する1つの考慮事項は、最適または良好な効果を達成するために必要な細胞の量である。投与される細胞の量は、処置される対象によって異なり得る。一実施形態では、104~1010、105~109または106~108個の本発明の遺伝子修飾された細胞が、ヒト対象に投与される。一部の実施形態では、少なくとも約1×108、2×108、3×108、4×108及び5×108個の本発明の遺伝子修飾された細胞が、ヒト対象に投与される。正確な有効用量の決定は、各個々の対象の要因(サイズ、年齢、性別、体重、及び状態を含む)に基づいてもよい。用量は、本開示及び当該技術分野における知識から、当業者によって容易に確かめられ得る。
【0652】
当業者は、組成物中の及び本発明の方法において投与される、細胞の数ならびに任意選択的な添加剤、ビヒクル、及び/または担体の量を容易に決定することができる。典型的には、(細胞(複数可)に加えて)添加剤は、リン酸緩衝生理食塩水中の0.001~50%(重量)溶液の量で存在し、活性成分は、マイクログラム~ミリグラムのオーダーで存在し、例えば、約0.0001~約5重量%、好ましくは、約0.0001~約1重量%、さらにより好ましくは、約0.0001~約0.05重量%または約0.001~約20重量%、好ましくは、約0.01~約10重量%、さらにより好ましくは、約0.05~約5重量%で存在する。もちろん、動物またはヒトに投与される任意の組成物、及び任意の特定の投与方法に対して、したがって、毒性を決定すること(例えば、好適な動物モデル(例えば、マウスなどのげっ歯類)における致死量(LD)及びLD50を決定することによる)、ならびに好適な応答を誘発する組成物の投薬量(複数可)、その中の成分の濃度、及び組成物の投与のタイミング(複数可)を決定することが好ましい。そのような決定は、当業者の知識、本開示、及び本明細書で引用される文書から、過度の実験を必要としない。また、順次投与の時間は、過度の実験なしに確かめることができる。
【0653】
一部の実施形態では、医薬組成物は、対象への送達のために製剤化される。本明細書に記載の医薬組成物を投与する好適な経路としては、局所、皮下、皮内、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が挙げられるが、これらに限定されない。
【0654】
一部の実施形態では、本明細書に記載の医薬組成物は、疾患部位に局所的に投与される。一部の実施形態では、本明細書に記載の医薬組成物は、注射によって、カテーテルによって、坐剤によって、またはインプラントによって、対象に投与され、インプラントは、シアラスティック(sialastic)膜または繊維などの膜を含む、多孔性、非多孔性、またはゲル状物質である。
【0655】
他の実施形態では、本明細書に記載の医薬組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプが使用され得る(例えば、Langer,1990,Science 249:1527-1533;、Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201、Buchwald et al.,1980,Surgery 88:507、Saudek et al.,1989,N.Engl.J.Med.321:574を参照されたい)。別の実施形態では、ポリマー材料を使用することができる。(例えば、Medical Applications of Controlled Release(Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974)、Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984)、Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照されたい。また、Levy et al.,1985,Science 228:190、During et al.,1989,Ann.Neurol.25:351、Howard et al.,1989,J.Neurosurg.71:105を参照されたい)。他の制御放出システムは、例えば、上記のLangerで考察されている。
【0656】
一部の実施形態では、医薬組成物は、対象(例えば、ヒト)への静脈内または皮下投与に適した組成物として、通常の手順に従って製剤化される。一部の実施形態では、注射による投与のための医薬組成物は、可溶化剤としての滅菌等張使用における溶液、及び注射部位の疼痛を緩和するためのリグノカインなどの局所麻酔剤である。一般的に、成分は、単位剤形で、例えば、活性剤の量を示すアンプルもしくはサシェなどの気密封止容器内に乾燥させた凍結乾燥粉末または水不含濃縮物として、別々に供給するか、あるいは一緒に混合して供給される。医薬品が注入によって投与される場合、医薬品は、滅菌医薬品グレードの水または生理食塩水を含む注入ボトルを用いて分注され得る。医薬組成物が注射によって投与される場合、投与前に成分が混合され得るように、注射用の滅菌水または生理食塩水のアンプルが提供され得る。
【0657】
全身投与のための医薬組成物は、液体(例えば、滅菌生理食塩水、乳酸リンゲル溶液、またはハンクス溶液)であってもよい。加えて、医薬組成物は、固体形態であってもよく、使用の直前に再溶解または懸濁され得る。凍結乾燥形態も企図される。医薬組成物は、脂質粒子または小胞(例えば、非経口投与にも好適なリポソームまたは微結晶)内に含まれ得る。粒子は、組成物がその中に含まれている限り、単層(unilamellar)または多層(plurilamellar)などの任意の好適な構造の粒子であり得る。化合物は、膜融合性脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低いレベル(5~10mol%)のカチオン性脂質を含有する「安定化されたプラスミド-脂質粒子」(SPLP)内に捕捉され得、ポリエチレングリコール(PEG)コーティングによって安定化され得る(Zhang Y.P.et al.,Gene Ther.1999,6:1438-47)。そのような粒子及び小胞には、N-[1-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェートまたは「DOTAP」などの正に帯電した脂質が特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号、同第4,906,477号、同第4,911,928号、同第4,917,951号、同第4,920,016号、及び同第4,921,757号を参照されたい(それらの各々は、参照により本明細書に援用される)。
【0658】
本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装され得る。「単位用量」という用語は、本開示の医薬組成物に関して使用される場合、対象のための単位投薬量として好適な物理的に分離された単位を指し、各単位は、必要な希釈剤(すなわち、担体またはビヒクル)と関連して所望の治療効果がもたらされるように計算された所定の量の活性物質を含む。
【0659】
さらに、医薬組成物は、薬学的キットとして提供され得、(a)凍結乾燥形態の本発明の化合物を含む容器、及び(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構築または希釈に使用される滅菌物)を含む第2の容器を含む。任意選択的に、そのような容器(複数可)に付随するものが、医薬品または生物学的製品の製造、使用、または販売を規制する政府機関によって規定される形態の通知であってもよく、この通知は、ヒトへの投与のための製造、使用、または販売の機関による承認を反映する。
【0660】
別の態様では、上に記載の疾患の治療に有用な材料を含む製造品(article of manufacture)が含まれる。一部の実施形態では、製造品は、容器及びラベルを含む。好適な容器としては、例えば、ボトル、バイアル、注射器、及び試験管が挙げられる。容器は、ガラスまたはプラスチックなどの様々な材料から形成され得る。一部の実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する、静脈内輸液バッグまたはバイアルであり得る。組成物中の活性剤は、本発明の化合物である。一部の実施形態では、容器上の、または容器に付随するラベルは、組成物が、選択された疾患を治療するために使用されることを示す。製造品は、リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器をさらに含み得る。これには、商業及び使用者の観点から望ましい他の材料がさらに含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用説明書を含む添付文書が挙げられる。
【0661】
一部の実施形態では、本明細書に記載の融合タンパク質、gRNA、及び/または複合体のいずれかは、医薬組成物の一部として提供される。一部の実施形態では、医薬組成物は、本明細書に提供される融合タンパク質のいずれかを含む。一部の実施形態では、医薬組成物は、本明細書に提供される複合体のいずれかを含む。一部の実施形態では、医薬組成物は、gRNAとカチオン性脂質との複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボ核タンパク質複合体を含む。一部の実施形態では、医薬組成物は、gRNA、核酸プログラマブルDNA結合タンパク質、カチオン性脂質、及び薬学的に許容される賦形剤を含む。医薬組成物は、任意選択的に、1つ以上の追加の治療活性物質を含むことができる。
【0662】
一部の実施形態では、本明細書に提供される組成物は、対象内の標的ゲノム修飾をもたらすように、対象に(例えば、ヒト対象に)投与される。一部の実施形態では、細胞は、対象から得られ、本明細書に提供される医薬組成物のいずれかと接触する。一部の実施形態では、対象から取り出され、エクスビボで医薬組成物と接触させた細胞は、任意選択的に、所望のゲノム修飾が細胞内で実施または検出された後、対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は既知であり、例えば、米国特許第6,453,242号、同第6,503,717号、同第6,534,261号、同第6,599,692号、同第6,607,882号、同第6,689,558号、同第6,824,978号、同第6,933,113号、同第6,979,539号、同第7,013,219号、及び同第7,163,824号に記載されている(それらの全ての開示は、それらの全体が参照により本明細書に援用される)。本明細書に提供される医薬組成物の説明は、主に、ヒトへの投与に好適な医薬組成物を対象とするが、そのような組成物が、概して、あらゆる種類の動物または生物への投与に(例えば、獣医学的使用に)好適であることが、当業者によって理解されるであろう。
【0663】
組成物が様々な動物への投与に好適であるようにするため、ヒトへの投与に好適な医薬組成物を修飾することは十分に理解されており、通常の熟練した獣医薬理学者は、もしあったとしても単に通常の実験で、そのような修飾を設計及び/または実施することができる。医薬組成物の投与が企図される対象としては、ヒト及び/または他の霊長類、哺乳類、家畜化された動物、ペット、ならびに商業的に関連する哺乳類(例えば、ウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、及び/またはラット)、及び/または鳥類(ニワトリ、アヒル、ガチョウ、及び/またはシチメンチョウなどの商業的に関連する鳥類を含む)が挙げられるが、これらに限定されない。
【0664】
本明細書に記載の医薬組成物の製剤は、薬理学の分野で既知のまたは今後開発される任意の方法によって調製することができる。一般に、そのような調製方法は、活性成分(複数可)を、賦形剤及び/または1つ以上の他の副成分と会合させるステップと、次いで、必要及び/または望ましい場合、製品を所望の単回用量単位または複数回用量単位に成形及び/または包装するステップと、を含む。薬学的製剤は、薬学的に許容される賦形剤をさらに含むことができ、本明細書で使用される場合、所望の特定の剤形に適した、あらゆる溶媒、分散媒、希釈剤、または他の液体ビヒクル、分散助剤または懸濁助剤、表面活性剤、等張剤、増粘剤または乳化剤、防腐剤、固体結合剤、潤滑剤などが含まれる。Remington’s The Science and Practice of Pharmacy,21st Edition,A.R.Gennaro(Lippincott,Williams & Wilkins,Baltimore,MD,2006(その全体が参照により本明細書に援用される)には、医薬組成物の製剤化に使用される様々な賦形剤及びそれらの調製のための既知の技術が開示されている。また、ヌクレアーゼを含む医薬組成物を製造するための追加の好適な方法、試薬、賦形剤及び溶媒については、PCT出願第PCT/US2010/055131号(2010年11月2日に出願された公開番号WO2011/053982(A8))を参照されたく、これは、その全体が参照により本明細書に援用される。
【0665】
任意の従来の賦形剤媒体が、任意の望ましくない生物学的作用を生み出すことによって、またはその他、医薬組成物の任意の他の成分(複数可)と有害な様式で相互作用することによって、物質またはその誘導体と適合しない場合を除いて、その使用は、本開示の範囲内であることとが企図される。
【0666】
組成物は、上に記載のように、有効量で投与され得る。有効量は、投与様式、治療される特定の状態、及び所望の転帰に依存する。これはまた、状態のステージ、対象の年齢及び身体状態、同時療法の性質(もしあれば)、ならびに医師に周知の同様の要因に依存し得る。それは、治療用途において、医学的に望ましい結果を達成するのに十分な量である。
【0667】
一部の実施形態では、本開示による組成物は、様々な疾患、障害、及び/または状態のうちのいずれかの治療に使用することができる。
【0668】
治療方法
本発明の一部の態様は、治療を必要とする対象を治療する方法を提供し、本方法は、それを必要とする対象に、有効量の本明細書に記載の医薬組成物を投与することを含む。より具体的には、治療の方法は、それを必要としている対象に、少なくとも1つの編集された遺伝子を有する1つ以上の細胞を含む1つ以上の医薬組成物を投与することを含む。他の実施形態では、本発明の方法は、細胞内で、塩基エディターポリペプチド(例えば、自己不活性化塩基エディター)と、少なくとも1つのポリペプチドをコードする核酸分子を標的とすることが可能である1つ以上のガイドRNAとを発現させること、またはこれらを細胞内に導入することを含む。
【0669】
一実施形態では、対象は、少なくとも0.1×105個の細胞、少なくとも0.5×105個の細胞、少なくとも1×105個の細胞、少なくとも5×105個の細胞、少なくとも1×106個の細胞、少なくとも0.5×107個の細胞、少なくとも1×107個の細胞、少なくとも0.5×108個の細胞、少なくとも1×108個の細胞、少なくとも0.5×109個の細胞、少なくとも1×109個の細胞、少なくとも2×109個の細胞、少なくとも3×109個の細胞、少なくとも4×109個の細胞、少なくとも5×109個の細胞または少なくとも1×1010個の細胞を投与される。特定の実施形態では、約1×107個の細胞~約1×109個の細胞、約2×107個の細胞~約0.9×109個の細胞、約3×107個の細胞~約0.8×109個の細胞、約4×107個の細胞~約0.7×109個の細胞、約5×107個の細胞~約0.6×109個の細胞または約5×107個の細胞~約0.5×109個の細胞が、対象に投与される。
【0670】
一実施形態では、対象は、少なくとも0.1×104個の細胞/体重kg、少なくとも0.5×104個の細胞/体重kg、少なくとも1×104個の細胞/体重kg、少なくとも5×104個の細胞/体重kg、少なくとも1×105個の細胞/体重kg、少なくとも0.5×106個の細胞/体重kg、少なくとも1×106個の細胞/体重kg、少なくとも0.5×107個の細胞/体重kg、少なくとも1×107個の細胞/体重kg、少なくとも0.5×108個の細胞/体重kg、少なくとも1×108個の細胞/体重kg、少なくとも2×108個の細胞/体重kg、少なくとも3×108個の細胞/体重kg、少なくとも4×108個の細胞/体重kg、少なくとも5×108個の細胞/体重kgまたは少なくとも1×109個の細胞/体重kgを投与される。特定の実施形態では、約1×106個の細胞/体重kg~約1×108個の細胞/体重kg、約2×106個の細胞/体重kg~約0.9×108個の細胞/体重kg、約3×106個の細胞/体重kg~約0.8×108個の細胞/体重kg、約4×106個の細胞/体重kg~約0.7×108個の細胞/体重kg、約5×106個の細胞/体重kg~約0.6×108個の細胞/体重kgまたは約5×106個の細胞/体重kg~約0.5×108個の細胞/体重kgが、対象に投与される。
【0671】
特定の実施形態で企図される医薬組成物の複数回投与が、所望の療法に影響を及ぼすために必要とされ得ることを、当業者は理解するであろう。例えば、組成物は、対象に、1週間、2週間、3週間、1ヶ月、2ヶ月、3ヶ月、4ヶ月、5ヶ月、6ヶ月、1年、2年、5年、10年、またはそれ以上の期間にわたって、1、2、3、4、5、6、7、8、9、もしくは10回、またはそれ以上投与され得る。このような方法のうちのいずれかにおいて、方法は、対象に、有効量の編集された細胞または塩基エディターシステムまたはこのようなシステムをコードするポリヌクレオチドを投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1日当たり1つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1日当たり2つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1日当たり3つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1週間当たり1つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1週間当たり2つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1週間当たり3つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1ヶ月当たり1つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1ヶ月当たり2つ以上の用量の有効量の編集された細胞を投与することを含み得る。このような方法のうちのいずれかにおいて、方法は、1ヶ月当たり3つ以上の用量の有効量の編集された細胞を投与することを含み得る。
【0672】
本明細書で企図される医薬組成物の投与は、これらに限定されないが、注入、輸液、または非経口を含む従来の技術を使用して実施され得る。一部の実施形態では、非経口投与は、血管内、静脈内、筋肉内、動脈内、髄腔内、腫瘍内、皮内、腹腔内、経気管、皮下、表皮下、関節内、嚢下、くも膜下、及び胸骨内に注入または注射を含む。
【0673】
一部の実施形態では、本明細書に記載される組成物(例えば、編集された細胞、塩基編集システム)は、ヒト対象の体重1キログラム当たり約0.5~30mgである投与量で投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.5~20mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.5~10mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約0.04mg、約0.08mg、約0.16mg、約0.32mg、約0.64mg、約1.25mg、約1.28mg、約1.92mg、約2.5mg、約3.56mg、約3.75mg、約5.0mg、約7.12mg、約7.5mg、約10mg、約14.24mg、約15mg、約20mgまたは約30mgである。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1週間2回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1週間2回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1週間1回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1週間1回投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.92mg、約3.75mg、約7.5mg、約15.0mgまたは約30.0mgであり、組成物は、1日1回、7日間の期間3回、5回または7回投与される。別の実施形態では、組成物は、1日1回、7日間の期間7回静脈内投与される。別の実施形態では、投与される組成物の量は、ヒト対象の体重1キログラム当たり約1.28mg、約2.56mg、約5.0mg、約10mgまたは約20mgであり、組成物は、1日1回、7日間の期間3回、5回または7回投与される。別の実施形態では、組成物は、1日1回、7日間の期間7回静脈内投与される。
【0674】
一部の実施形態では、組成物は、0.25時間、0.5時間、1時間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間または12時間の期間にわたって投与される。別の実施形態では、組成物は、0.25~2時間の期間にわたって投与される。別の実施形態では、組成物は、1時間の期間にわたって徐々に投与される。別の実施形態では、組成物は、2時間の期間にわたって徐々に投与される。
【0675】
キット
本発明は、自己不活性化塩基エディターを特徴とするキットを提供する。一部の実施形態では、キットは、自己不活性化塩基エディターをコードする異種イントロンを含むポリヌクレオチドを含む。一部の実施形態では、イントロンは、核酸プログラマブルDNA結合タンパク質(napDNAbp)またはその断片をコードするポリヌクレオチド内に存在する。一部の実施形態では、イントロンは、デアミナーゼをコードするポリヌクレオチド内に存在する。一部の実施形態では、キットは、1つ以上のガイドポリヌクレオチド(例えば、ゲノム配列を標的とするガイドポリヌクレオチド、自己不活性化塩基エディターをコードするポリヌクレオチド内に存在する異種イントロンを標的とするガイドポリヌクレオチド)をさらに含む。一部の実施形態では、キットは、塩基エディターシステムを含み、塩基エディターシステムは、核酸プログラマブルDNA結合タンパク質(napDNAbp)及びデアミナーゼを含む自己不活性化塩基エディターと、1つ以上のガイドポリヌクレオチドとを含む。一部の実施形態では、キットは、自己不活性化塩基エディターをコードするポリヌクレオチドを含むベクターを含み、ポリヌクレオチドのオープンリーディングフレームは、異種イントロンを含む。一部の実施形態では、キットは、1つ以上のガイドポリヌクレオチドをコードするポリヌクレオチドを含むベクターを含む。一部の実施形態では、キットは、本明細書で提供されるポリヌクレオチド、塩基エディター、塩基エディターシステム、細胞またはベクターのうちのいずれかを含む細胞を含む。
【0676】
キットは、本明細書に記載される塩基エディター(例えば、自己不活性化塩基エディター)の使用または不活性化についての書面による説明書をさらに含み得る。他の実施形態では、説明書は、注意事項、警告、臨床試験、及び/または参考文献のうちの少なくとも1つを含む。説明書は、(存在する場合)容器に直接印刷されてもよく、あるいは容器に適用されるラベルとして、または容器内にもしくは容器とともに、供給される別個のシート、パンフレット、カード、もしくはフォルダとして印刷されてもよい。さらなる実施形態では、キットは、好適な操作パラメータのためのラベルまたは別個のインサート(添付文書)の形態の説明書を含むことができる。さらに別の実施形態では、キットは、適切な陽性対照及び陰性対照または対照試料を有する1つ以上の容器を含み、検出、較正、または正規化のための標準(複数可)として使用され得る。キットは、(滅菌)リン酸緩衝生理食塩水、リンゲル溶液、またはデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器をさらに含み得る。これには、商業及び使用者の観点から望ましい他の材料がさらに含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用説明書を含む添付文書が挙げられる。
【0677】
本発明の実践には、別段の指示がない限り、分子生物学(組換え技法を含む)、微生物学、細胞生物学、生化学、及び免疫学の従来の技術が用いられ、十分に当業者の範囲内である。そのような技術は、文献、例えば、「Molecular Cloning:A Laboratory Manual」,second edition(Sambrook,1989)、「Oligonucleotide Synthesis」(Gait,1984)、「Animal Cell Culture」(Freshney,1987)、「Methods in Enzymology」「Handbook of Experimental Immunology」(Weir,1996)、「Gene Transfer Vectors for Mammalian Cells」(Miller and Calos,1987)、「Current Protocols in Molecular Biology」(Ausubel,1987)、「PCR:The Polymerase Chain Reaction」,(Mullis,1994)、「Current Protocols in Immunology」(Coligan,1991)で十分に説明されている。これらの技術は、本発明のポリヌクレオチド及びポリペプチドの産生に適用可能であり、したがって、作製及び本発明を実施する際に考慮され得る。特定の実施形態のための特に有用な技術は、以下のセクションで論じられる。
以下の実施例は、当業者に、本発明のアッセイ、スクリーニング、及び治療方法を作製及び使用する方法の完全な開示及び説明を提供するために提示されるのであって、本発明者らが彼らの発明とみなすものの範囲を限定するものではない。
【実施例
【0678】
実施例1:デアミナーゼドメインの触媒不活性化による自己不活性化
従来のアデニン塩基エディター(ABE)は、進化したTadA酵素を使用して、アデニンDNA塩基を脱アミノ化し、2’-デオキシイノシン産物をもたらし、この産物は、DNA修復中に、細胞によって2’-デオキシグアノシンとして認識される(Gaudelli,N.M.,et al.(2017).Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage.Nature,551(7681),464-471、Gaudelli,N.M.,et al.(2020).Directed evolution of adenine base editors with increased activity and therapeutic application.Nat Biotechnol,38(7),892-900、Richter,M.F.,et al.(2020).Phage-assisted evolution of an adenine base editor with improved Cas domain compatibility and activity.Nature Biotechnology,38(7),883-891)。TadAは、脱アミノ化活性をもたらす以下の4つの触媒残基:His57(H57)、Glu59(E59)、Cys87(C87)またはCys90(C90)を含有する(Kim,J.,et al.(2006).Structural and kinetic characterization of Escherichia coli TadA,the wobble-specific tRNA deaminase.Biochemistry,45(20),6407-6416)。
【0679】
1)これらの部位が、ABEのコードDNAを細胞へ送達した後にABEを自己不活性化するために活用され得るかを試験し、2)2つのガイドRNA及びABEをコードするDNAの共送達が、目的のゲノム標的部位と、ABEをコードするエピソームDNAとを効率的に同時に編集して、TadA触媒残基を不活性アミノ酸に変換し得るかを試験するための概念実証アッセイを確立した(図1A)。アッセイは、HEK293T細胞のプラスミドリポフェクションを使用し、DNAベクターは、ABEと、4つのTadA触媒残基(His57(H57)、Glu59(E59)、Cys87(C87)またはCys90(C90))のうちの1つを標的とするガイドRNAと、細胞ゲノム内の部位を標的とする第2のガイドRNAとをコードした。細胞を、リポフェクション後に5日間インキュベートし、Illumina次世代配列決定を、各々の標的アンプリコンにおいて実行した。標的アンプリコンは、細胞可溶化物から生成され、これは、細胞ゲノムDNA及び回収されたプラスミドDNAの両方を含んだ。TadA残基が、編集された場合に触媒不活性型であることを確認するために、対応する変異を、ABE7.10-mのTadAサブユニット内の(アミノ酸置換H57R、E59G、C87RまたはC90Rを提供する)対照プラスミド内にプレインストールし、それらの塩基編集活性を、細胞ゲノム標的部位のみにおいて評価した。各々の場合に、プレインストールされた変異は、目的の部位での編集(0.1%未満のA-to-G変換)を実質的にもたらさず、これは、これらのTadA変異が不活性型であることを確認した(図1B)。機能的ABE7.10-mでトランスフェクトされた試料において、ゲノム部位での編集及び回収された塩基エディタープラスミドにおける編集の両方を評価した。TadAにおける標的部位のうちの2つ(H57R及びE59G)のみが、それらの対応する自己不活性化ガイドRNAによって明らかに編集されたが、ゲノム標的における編集率は、スクランブルされた自己不活性化ガイドRNAを含有する対照のものと同様であった。これは、触媒部位での自己編集率が、相対的に低い(5%未満のA-to-G変換)が、塩基エディターABEをコードするDNAを標的とすることが可能であり、宿主ゲノム内のオンターゲット編集効率が、エディターの自己不活性化によって悪影響を受けないことを明らかにした。
【0680】
自己不活性化率が改善され得るかを決定するために、TadA内でのコドン使用を最適化して、編集が発生するのに最適化されたスペーサー配列を作製した。TadA内の利用可能なNGG PAMを考慮して、E59コドンの標的アデノシンは、ABE7.10及びより最近記載されたABE8バリアントの編集ウィンドウ内のより好都合な位置であると予測される位置(E59については位置A7であるのに対し、H57については位置A9)に配置されている(図1C)。したがって、E59部位を最適化した。標的領域内でのTadAの全ての可能な同義コドン使用を、生物情報学的に解析し、高い相対的同義コドン使用(RSCU)スコアを優先することと、各々の対応するガイドRNAについてのシリコオフターゲット予測プロファイルが低いことを優先することとによってランク付けした。次いで、17個の候補を、ABE8.5-mの状況において試験し、これは別個に、ABE7.10-mと比較して、目的の細胞ゲノム標的におけるより高い編集効率を実証した。プラスミドベースのアッセイを使用して、編集の自己不活性化率は、変動し、全体的に低かった(5%未満)(図1D)が、細胞ゲノム部位での編集は、バリアントにわたって約30~50%の範囲であった。その後、全てがABE8.5-mの状況におけるものである、新しいバリアントのうちの4つ、第1世代のバリアントのうちの2つ及びスクランブルされたガイドRNAを特徴とする第1世代のバリアントを、AAV2内にパッケージングし、ARPE-19細胞内に形質導入した。細胞ゲノム内での得られた編集及びAAV導入遺伝子における得られた編集を、最大5週間、複数の時点で評価した。細胞ゲノム遺伝子座は、5週目で、全ての試験されたバリアントにわたって、約70~76%のNGSリードで編集されたが(図1E)、自己不活性化編集の存在量は、同じ時点で、最も最適化されたバリアントについて、回収されたエディターDNAにおいて低かった(3.54%)(図1F)。しかしながら、同じアッセイにおける最適化されていない第1世代のバリアントと比較して、新しいバリアントの自己不活性化率は、最大10.4倍改善された。
【0681】
ABE DNAの自己不活性化の見かけの率は、概して、プラスミドベース及びウイルスベースのインビトロアッセイにわたって低かったが、これは、回収されたエピソームDNAにおける自己不活性化の測定は、機能的不活性化率を過小報告している可能性があると疑われた。例えば、形質導入されたAAV2の一部分のみが、インビトロで、細胞核に輸送されることが報告されている(Xiao,P.-J.,Li,C.,et al.(2012).Quantitative 3D Tracing of Gene-delivery Viral Vectors in Human Cells and Animal Tissues.Molecular Therapy,20(2),317-328)。アッセイにおけるAAVまたはLNP粒子のある部分が、細胞質内に依然として封入されている場合に、それらは、おそらく、塩基エディターにアクセス可能でなく、それらは、転写されて追加の塩基エディターmRNA及びタンパク質をなすこともない。細胞内のmRNAは、いずれかの所与の時点で発現されているタンパク質をより示すため、標的アンプリコン配列決定を、DNAと、mRNAから調製されたcDNAとの両方について実行して、新しい実験において、自己不活性化の測定された量におけるいずれかの差を調査した。5つのAAV2パッケージングされたエディターバリアント及びガイドRNAを、ARPE-19細胞内に形質導入した。ゲノム標的部位で、編集は、形質導入の2週間後に、試験された全ての5つのバリアントにわたって堅牢であった(約80%のA-to-G編集)(図1G)。自己不活性化率はまた、回収されたエピソームDNAにおいて測定されたときに、他のバリアントでの以前の研究(3%未満)と同様であったが、mRNAから調製されたcDNAの標的アンプリコン配列決定は、編集されたABE転写物の割合が、5つのバリアントにわたって平均48.5%に近づくことを示した。これらの結果は、正常に核に送達され能動的に転写されたABE DNAの割合が、効率的に自己不活性化され、2週間後に約50%の不活性化に近づき、ゲノム標的での同時編集が、依然として非常に効率的であることを示唆した。これらの結果はまた、同様の手法が、CBEの自己不活性化のために行われ得、例えば、亜鉛配位(CysまたはHis)をもたらすAPOBEC活性部位残基が、C-to-T塩基変換のために標的とされて、いずれの場合も、Tyrを生成し得ることを示唆した。
【0682】
実施例2:塩基エディター開始コドンの変異による自己不活性化
別の手法において、ABEの開始コドンを、エディター開始コドンの第1のヌクレオチドを塩基編集することによる自己不活性化のために標的とし、Met1Val変異(ATG>GTG)をもたらした。代替として、相補的DNA鎖を標的とすることによる開始コドンの第2のヌクレオチドでの塩基編集がまた、可能であり、Met1Thr変異(ATG>ACG)をもたらす。最初に、これらの変異が塩基エディターの翻訳を有効に防止するかを決定するために、所望の変異を、ABE8.5-m発現プラスミド内にプレインストールした。Met1が変異したときに、切断型エディターは、TadAの下流Met12が代替開始コドンとして機能する場合に産生される潜在性がある。この問題を回避するために、His8のコドン使用を、アウトオブフレームATG配列がMet12の上流に存在するように調整し、細胞ゲノム内の目的の部位での塩基編集を測定して、エディター発現を防止するこれらの変異の能力を決定した(図2A)。Met1Thr変異は、Met1Valよりも、目的の部位での編集を有効に防止し、アウトオブフレーム開始コドンの付加は、編集を半分にさらに低減させた(図2B)。
【0683】
Streptococcus pyogenes Cas9のニッカーゼバリアントを含有するABE8.5-m DNAにおけるMet1Thr塩基編集を実行するために、NGG PAM配列を、TadA内で、自己不活性化のための標的塩基をプロトスペーサーの編集ウィンドウ内に配置する位置で必要とした。この配置をなすために、TadA変異Phe8Trp、Phe8ValまたはPhe8Alaを有するエディターのバリアントを調製して、Met1における塩基編集のために使用され得る3つの異なるNGG PAM配列(図2C)を生成した。各々のバリアントは、未改変対照ABE8.5-mと比較して同等の効率で、細胞ゲノム部位を編集することが可能であり、これは、TadAにおけるPhe8のこれらの変異が十分に許容されることを示唆した。回収されたエピソームエディターDNAの標的アンプリコン配列決定によって測定された自己不活性化率は、各々のバリアントについて可変であり低く(3%未満の塩基変換)、全ての新しいバリアントにわたるゲノム標的での同時編集は、不活性化ガイドRNAを欠く対照ABE8.5-mと同様に効率的であった(図2E)。これらの結果は、細胞ゲノム内の所望の部位での編集効率を犠牲にすることなく、塩基エディターを、単一A-to-G塩基編集を介して開始コドンを非Metアミノ酸に変換することによって自己不活性化することも可能であることを実証した。これらの結果はまた、同様の手法が、CBEの自己不活性化のために行われ得、Met開始コドンが、翻訳の開始を防止または阻害するために、Ileに変換され得ることを示唆した。
【0684】
実施例3:カスタマイズされた自己不活性化のための、塩基エディターをコードするポリヌクレオチド内へのイントロンの組み込み
ABE自己不活性化の最大の有用性を達成するために、理想的な手法は、PAM要件、編集ウィンドウ及び所与の標的部位における相対的活性によって変動し得る、ABEのいずれかの選択されたバリアントにわたって一般化可能であるべきである。TadA活性部位残基、開始コドンまたはエディター内のいずれかの他の特定の残基内での編集によるABEの自己不活性化のための戦略は各々、標的部位の局所アミノ酸配列と、酵素によって許容されるいずれかの許容変異とによって制約される。これらの制限への解決策を展開するために、小さいイントロンを、ABEをコードするDNA内に組み込む有用性を探究した(図3A)。イントロンは、概して、それらの5’末端でのコンセンサススプライスドナー配列GT及びそれらの3’末端でのコンセンサススプライスアクセプター配列AGを特徴とする。これらの部位の各々は、コンセンサス配列をそれぞれGC及びGGに変換することによってスプライシングを中断するために、ABEによって標的とされ得る。エディター内のいずれかのスプライス部位が破壊されたときに、イントロン配列は、完全または部分的に保持され得、これは、未熟終結または塩基エディター配列におけるフレームシフトをもたらし得る。この手法への重要な進展は、イントロンが、カスタマイズされ得、選択される塩基エディターバリアントによって指示されるように効率的なベース編集を促進するのに理想的な編集位置、プロトスペーサー及びPAMを提供する、エディターのいずれかの有益な部分内に挿入され得るため、自己不活性化標的配列の設計の柔軟性が提供されることである。
【0685】
また、CBEのイントロンベースの不活性化は、それぞれGTをATにまたはAGをAAに変換する、非コードDNA鎖のC-to-T編集を介する正準スプライスドナーまたはアクセプター部位の破壊を介して可能である。さらに、代替として、イントロンは、エディターの他のサブユニット、例えば、Cas9またはリンカー領域内に組み込まれ得、これは、円順列置換された塩基エディターバリアントまたはエディターの他の構成を不活性化するためにより有利であり得る(Huang,T.P.,et al.(2019).Circularly permuted and PAM-modified Cas9 variants broaden the targeting scope of base editors.Nat Biotechnol,37(6),626-631, Nguyen Tran,M.T.,et al.(2020)Engineering domain-inlaid SaCas9 adenine base editors with reduced RNA off-targets and increased on-target DNA editing.Nat Commun,11(1),4871)。
【0686】
ABEの進化したTadA構成要素は、本来、細菌に由来し、したがって、その天然の状況においてイントロンを欠く。イントロンを含めることがABE発現に有害であるかを決定するために、編集率を、イントロン含有ABEバリアントによって触媒されたゲノム標的部位で測定し、イントロンを欠く対照ABEと比較した。自己不活性化ガイドRNAを、実験において含めなかった。エディターの全サイズを可能な限り小さく保つために、小さいイントロン(約150bp以下)のみを試験した。ヒトベータグロビン及びマウスIgG遺伝子に由来する、9つのヒトイントロン及び1つのキメライントロンのセットを、TadAのコドン87の直後に挿入した。加えて、イントロンのサブセットもまた、TadAのコドン62の直後またはTadAのコドン23の第2のヌクレオチドの直後に挿入して、イントロンの位置が編集率に影響を与えたかを決定した。必要とされるイントロン編集を調査されているエディターバリアントの既知の塩基編集ウィンドウ内に配置する、TadAコード配列内のNGG PAM配列へのイントロンの相対的近接性について、イントロン位置の各々を選択した。HEK293T細胞内のゲノム標的部位での、これらのイントロン含有バリアントの編集効率は、イントロン配列及びTadA内の挿入の位置の両方に依存し(図3B)、これは、いくつかの構成が、他の構成よりも効率的にスプライシングされることを示唆した。TadA残基87での5つの異なるイントロン(NF1、PAX2、EEF1A1、Chimera及びSLC50A1)は、ゲノムDNAにおける高い編集効率を維持した。加えて、イントロンChimera及びABCB11は、TadAの残基62または23で挿入されたときに、相対的に高いレベルの編集を可能にした。残りの4つのイントロン(BRSK2、PLXNB3、TMPRSS6及びIL32)を含有するABEバリアントは、目的の部位での編集をもたらさなかったかまたは対照と比較して編集率の著しい減少をもたらした。TadA残基87でのさらに7つのイントロンの活性を試験し、これらは全て、同等に良好に許容された(図3C)。これらのデータは、カスタムイントロン配列が、ゲノム部位での編集活性を犠牲にすることなく、ABE遺伝子のTadAサブユニット内に挿入され得ることを示した。
【0687】
このシステムにおいて、真核生物において見出されるコンセンサススプライスドナー及びアクセプター配列を特徴とするイントロンを選択した。しかしながら、これらのジヌクレオチド配列は、全ての真核生物イントロンにわたって完全に保存されておらず、変異へのそれらの感受性は可変であり得る。したがって、所望のスプライスアクセプター部位またはドナー部位編集を、TadAイントロン内にプレインストールし、塩基編集活性を、ゲノム部位で評価して、イントロンを欠くABE8.5-mと比較して、それらの対応する不活性化レベルを決定した。TadA残基87でのイントロンNF1、PAX2、EEF1A1、ANTXRL、PKHD1L1、PADI1、HMCN2、ENPEP-gecko及びHMCN2-salmonは、プレインストールされたスプライスアクセプター変異によって完全に破壊された(図3D)。これらの9つのイントロン構成はまた、以前の実験において示されているように、変異の非存在下での最も効率的なABEバリアントのうちのものであり、これは、これらのバリアントが、スプライスアクセプター部位での単一A-to-G塩基編集の存在または非存在に依存して、バイナリーの様式で機能することを示唆した。また、NF1及びPAX2イントロンは、スプライスドナー変異によって不活性化されたが、EEF1A1は不活性化されなかった。Chimeraイントロンは、スプライスドナーまたはアクセプター部位での変異によって完全に妨害されなかった唯一のバリアントであった。また、プレインストールされたスプライスアクセプターまたはドナー変異を有する追加の構成、及びこれを有さない追加の構成を試験し、これらは、TadA残基18、59または129に配置されたNF1イントロンが、スプライスアクセプター変異によって完全に不活性化され、EEF1A1が、TadA残基18または59に配置されたときに、スプライスアクセプター変異によって不活性化されることをさらに実証した(図3E)。これらのデータは、TadA内の非天然のイントロンのスプライシングが、スプライシングの部位でのA-to-G置換によって完全に破壊され得、編集が、DNAにおける塩基編集活性を除去することが可能であることを実証した。さらに、これらのデータは、エディターを有するイントロンの配置が、スプライス部位変異への感受性及びイントロンの全体的なスプライシング性能に影響を及ぼし得ることを実証した。
【0688】
どのイントロンバリアントが、それらのそれぞれのスプライス部位で効率的に塩基編集され得るかを決定するために、HEK293T細胞を、ABEバリアントと、一致する自己不活性化ガイドRNAと、ゲノム部位を標的とするガイドRNAとをコードするプラスミドでリポフェクションした。TadA残基87でのイントロンNF1及びPAX2のスプライスドナー部位を標的とすることは、ゲノム部位での高い編集率を維持し、イントロンドナー部位内の自己不活性化編集の程度は、回収されたプラスミドDNAにおいて約6%と高かった(図3F)。代替として、TadA残基87でのNF1のスプライスアクセプター部位での自己不活性化編集の量は、ゲノム部位での効率的な編集も維持しつつ、30%であった(図3G)。
【0689】
TadA残基87での良好な性能のイントロンの追加の構成(NF1、PAX2及びEEF1A1)を評価した。このセットを、TadAのコドン129、59及び18後に挿入し、対応するプレインストールされたスプライスアクセプター変異も調製した。プレインストールされた変異を欠くNF1バリアントの編集効率は、イントロンが挿入された位置に依存して変動した(図3H)。PAX2及びEEF1A1は、全ての構成において高いゲノム編集を維持したが、これらのイントロンは、変異がプレインストールされたときに、TadA内の全ての位置にわたって一貫して不活性化されなかった。
【0690】
自己不活性化ガイドRNAによって標的とされるこれらのバリアントの各々の能力を調査した。TadA残基59でのNF1の自己不活性化率は、TadA残基87でのNF1のものと同様であった(図3I)。加えて、イントロン配列ANTXRL、PKHD1L1、PADI1及びENPEP-geckoを、スプライスアクセプター部位でのガイド依存性自己不活性化について、TadA残基87で試験した。イントロンのこのセットは、この構成において、変異によって完全に不活性化されたことが以前に検証されているため、この試験を行った。これらを、同じ実験におけるNF1、PAX2及びEEF1A1と比較し、これは、NF1が、その自己不活性化ガイドRNAによって最も効率的に標的とされ、続いて、PAX2及びANTXRLが効率的に標的とされることを明らかにした(図3J)。残りのイントロンの各々は、同様の低いレベルのガイドRNA依存性自己不活性化を示した。特に、ゲノム部位における塩基編集活性は、イントロンまたは自己不活性化ガイドRNAを欠くABE8.5-mバリアントと比較して、これらの実施例のうちのいずれにおいても、自己不活性化ガイドRNAの存在によって妨げられなかった。これらのデータは、イントロンが、TadA内に戦略的に配置されて、適応可能な塩基編集標的部位を提供することができ、これを使用して、塩基編集活性を、経時的にガイドRNA依存性様式で遮断することができることを実証した。これらの結果はまた、自己不活性化率が、追加のガイドRNAによって指示される、宿主ゲノムDNA内の所望の部位での効率的な塩基編集を同時に可能にするのに十分に遅いことを実証した。
【0691】
回収されたエピソームDNAを配列決定することによる自己不活性化率が、イントロンベースの研究において、自己不活性化の機能的レベルについて過少報告されたかを決定するために、リポフェクションを、TadA残基87でのNF1またはPAX2イントロンを含有するABE8.5-mと、スプライスアクセプター部位を標的とする一致する自己不活性化ガイドRNAと、ゲノム部位を標的とする第2のガイドRNAとを発現するプラスミドで再実行した。標的アンプリコン配列決定によって、いずれかのイントロンバリアントで処理された細胞からのゲノムDNAにおいて観察された編集の量は、イントロンまたは自己標的ガイドRNAを欠く対照ABE8.5-mエディターのものと同様であった。回収されたエピソームDNAから測定された自己不活性化編集の量は、NF1及びPAX2について、それぞれ、5.38%及び4.16%であった。細胞のRNAからの機能的不活性化率を決定するために、RNAseq解析を、スプライシングされたABE転写物とスプライシングされていないABE転写物との間のサイズ差に起因して発生し得るPCRバイアスの可能性を回避するために、全mRNAにおいて実行した。プラスミドにおいて測定及び感知された不活性化率とは全く対照的に、NF1転写物の84%超が、編集されたスプライシングされていないイントロンを含有し、転写物の3.7%のみが、機能的にスプライシングされた(図3L)。残りのABE転写物の大部分(11.25%)が、翻訳中の未熟終結をもたらすはずである、転写物内に保持された未編集のイントロンを含有し、転写物のわずかな部分(0.66%)が、選択的にスプライシングされた。同様に、PAX2転写物の79%超が、編集されたスプライシングされていないイントロンを含有し、転写物の約16.5%が、機能的にスプライシングされた(図3M)。これらのデータは、この5日間の実験の終わりに、能動的に転写されたABE DNAの大部分が、スプライシングの発生を防止する編集されたイントロン配列を含有したことを示唆し、したがって、塩基エディターの発現も低減されたと合理的に想定され得る。
【0692】
最後に、TadA残基87に配置されたNF1イントロンを、AAV送達によって試験した。エディター及びガイドRNAを、AAV2内にパッケージングし、これを使用して、ARPE-19細胞をインビトロで形質導入し、編集率を、形質導入の2週間後に評価した。標的アンプリコン配列決定によって、ゲノムDNA編集は、所望の標的部位で堅牢であった(約76%のA-to-G)が、回収されたAAVゲノム内での編集率は、イントロンスプライスアクセプター部位で低かった(約5.4%のA-to-G)(図3N)。対照的に、全mRNAにおけるRNA-seq解析は、はるかにより高い自己不活性化効率を示し、転写物の約88.5%が、編集及び保持されたイントロンを含有した。このデータは、AAVによって送達された塩基エディターが、効率的なゲノム編集が第2のガイドRNAによって実行されることも可能にする時間尺度で、スプライシングの改変によって自己不活性化され得ることを実証した。
【0693】
実施例4:標的ゲノム部位の同時の自己不活性化及び塩基編集の効率の評価
ABE8.5-mと、ガイドRNAの異なる組み合わせとを含有する塩基エディターシステムを使用する、同時の自己不活性化及び標的(すなわち、「所望の」)ゲノム部位塩基編集についての効率を評価するための実験を行った。ガイドRNAのうちの一方を使用して、標的ゲノム部位を編集し、他方を使用して、ABE8.5-mを自己不活性化した。
【0694】
自己不活性化のための2つの異なる戦略を使用する、自己不活性化及び標的部位塩基編集についての効率を評価するための実験を行った。戦略は、1)E59G改変の導入を介するABE8.5-mのTadA触媒部位の改変を介する自己不活性化、及び2)ABE8.5-mをコードするポリヌクレオチド内に挿入されたNF1またはPAX2イントロンのスプライスアクセプター部位の改変を介する自己不活性化を含んだ。イントロンを、ABE8.5-mをコードするポリヌクレオチド内で、ABE8.5-mのTadAデアミナーゼのコドン87後に挿入した。E59G自己不活性化改変を、ガイドRNA v1、v122、v224、v139、v110またはv113(配列は、表1Bで提供される)を使用して導入した。NF1のスプライスアクセプター部位への自己不活性化改変を、ガイドg235(表1Bを参照されたい)を使用して導入し、PAX2のスプライスアクセプター部位への自己不活性化改変を、ガイドg239(表1Bを参照されたい)を使用して導入した。この実施例全体にわたって、標的ゲノム部位を編集するために使用されたガイドは、g756(表1Bを参照されたい)であった。ARPE-19細胞を、AAV2ウイルス粒子を使用して感染させた。AAV2ウイルス粒子は、NF1またはPAX2イントロン挿入を有するまたは有さない、ABE8.5-mをコードするポリヌクレオチドを、ガイドRNAとの組み合わせで含有し、図4A~4Cに示されるように、標的ゲノム部位の塩基編集と、ABE8.5-mのTadAデアミナーゼドメインをコードするポリヌクレオチドの一部分への自己不活性化塩基編集とを容易にした。ゲノム部位での所望の(すなわち、「標的」)塩基変換百分率(%)及びABE8.5-mの自己不活性化のための所望の塩基変換%を、DNA次世代配列決定及び/またはRNA-seqを使用して測定した。測定を、形質導入の1、3及び5週間後に行った。また、陰性対照として、細胞を、配列スクランブルされた(「scrmbl」)ガイドを使用して形質導入した。図4A~4Cに示されるように、ABE8.5-m塩基エディターシステムは、標的ゲノム部位を同時に自己不活性化及び編集することが可能であった。
【0695】
次に、滴定実験を行って、標的ゲノム部位の塩基編集及びABE8.5-mの自己不活性化へのAAV2用量の効果を決定した(図5A及び5Bを参照されたい)。ABE8.5-mを、ガイドRNA v110(表1Bを参照されたい)を使用する、上記のようなABE8-5-m内に挿入されたNF1イントロンのスプライスアクセプター部位の改変または上記のようなE59G改変の導入のいずれかを介して、自己不活性化した。ARPE-19細胞を、AAV2ウイルス粒子を使用して感染させた。AAV2ウイルス粒子は、NF1イントロン挿入を有するまたは有さない、ABE8.5-mをコードするポリヌクレオチドを、ガイドRNAとの組み合わせで含有し、図5A及び5Bに示されるように、標的ゲノム部位の塩基編集と、ABE8.5-mのTadAデアミナーゼドメインをコードするポリヌクレオチドの一部分への自己不活性化塩基編集とを容易にした。細胞を、89kvg/細胞(高)、17kvg/細胞(中)または9kvg/細胞(低)の用量のAAV2粒子を使用して形質導入した。形質導入の3、7及び14週間後に行われた次世代DNA配列決定測定を介して決定された場合に、標的ゲノム部位での塩基編集の効率は、投与量とともに増加することと、自己不活性化の効率は、評価された投与量にわたって依然として同じであることとの両方が決定された。また、自己不活性化及び標的ゲノム部位の改変の両方についての塩基編集効率が、経時的に増加することが観察された。
【0696】
次に、上記の2つの自己不活性化戦略を使用する、同時の標的ゲノム部位塩基編集及び自己不活性化についての効率を決定するための実験を行った(図6A及び6Bを参照されたい)。E59G自己不活性化改変を、ガイドRNA v110(表1Bを参照されたい)を使用して導入した。NF1のスプライスアクセプター部位への自己不活性化改変を、ガイドg235を使用して導入し、PAX2のスプライスアクセプター部位への自己不活性化改変を、ガイドg239を使用して導入した。標的ゲノム部位を編集するために使用されたガイドは、g756(表1Bを参照されたい)であった。ARPE-19細胞を、AAV2ウイルス粒子を使用して感染させた。AAV2ウイルス粒子は、NF1またはPAX2イントロン挿入を有するまたは有さない、ABE8.5-mをコードするポリヌクレオチドを、ガイドRNAとの組み合わせで含有し、図6A及び6Bに示されるように、標的ゲノム部位の塩基編集と、ABE8.5-mのTadAデアミナーゼドメインをコードするポリヌクレオチドの一部分への自己不活性化塩基編集とを容易にした。ゲノム部位での所望の(すなわち、「標的」)塩基変換百分率(%)及びABE8.5-mの自己不活性化のための所望の塩基変換%を、それぞれ、DNA次世代配列決定及びRNA-seqを使用して測定した。測定を、形質導入の4、7及び14週間後に行った。図6A及び6Bに示されるように、ABE8.5-m塩基エディターシステムは、標的ゲノム部位を同時に自己不活性化及び編集することが可能であった。
【0697】
上記の2つの自己不活性化戦略を使用する、同時の標的ゲノム部位塩基編集及び自己不活性化についての効率を決定する実験を行い(図7A及び7Bを参照されたい)、実験において、細胞を、プラスミドを使用して形質導入(すなわち、リポフェクション)した。E59G自己不活性化改変を、ガイドRNA v110(表1Bを参照されたい)を使用して導入した。NF1のスプライスアクセプター部位への自己不活性化改変を、ガイドg235を使用して導入した。標的ゲノム部位を編集するために使用されたガイドは、g756(表1Bを参照されたい)であった。HEK293T細胞を、脂質ナノ粒子と接触させた。脂質ナノ粒子は、NF1イントロン挿入を有するまたは有さない、ABE8.5-mをコードするポリヌクレオチドを、ガイドRNAとの組み合わせで含有し、図7A及び7Bに示されるように、標的ゲノム部位の塩基編集と、ABE8.5-mのTadAデアミナーゼドメインをコードするポリヌクレオチドの一部分への自己不活性化塩基編集とを容易にした。ゲノム部位での所望の(すなわち、「標的」)塩基変換百分率(%)及びABE8.5-mの自己不活性化のための所望の塩基変換%を、それぞれ、DNA次世代配列決定及びRNA-seqを使用して測定した。また、陰性対照として、細胞を、配列スクランブルされた(「scrmbl」)ガイドを使用して形質導入した。測定を、形質導入の2及び7週間後に行った。図7A及び7Bに示されるように、ABE8.5-m塩基エディターシステムは、標的ゲノム部位を同時に自己不活性化及び編集することが可能であり、標的ゲノム部位の自己不活性化及び編集の効率は両方、時間とともに増加した。
【0698】
次に、上記の2つの自己不活性化戦略を使用する、同時の標的ゲノム部位塩基編集及び自己不活性化についての効率を決定するための実験を行い(図8A及び8Bを参照されたい)、実験において、細胞を、AAV8ウイルス粒子を使用して形質導入した。E59G自己不活性化改変を、ガイドRNA v110(表1Bを参照されたい)を使用して導入した。NF1のスプライスアクセプター部位への自己不活性化改変を、ガイドg235を使用して導入した。標的ゲノム部位を編集するために使用されたガイドは、g756(表1Bを参照されたい)であった。ARPE-19細胞を、AAV8ウイルス粒子を使用して感染させた。AAV8ウイルス粒子は、NF1イントロン挿入を有するまたは有さない、ABE8.5-mをコードするポリヌクレオチドを、ガイドRNAとの組み合わせで含有し、図8A及び8Bに示されるように、標的ゲノム部位の塩基編集と、ABE8.5-mのTadAデアミナーゼドメインをコードするポリヌクレオチドの一部分への自己不活性化塩基編集とを容易にした。ゲノム部位での所望の(すなわち、「標的」)塩基変換百分率(%)及びABE8.5-mの自己不活性化のための所望の塩基変換%を、DNA次世代配列決定及び/またはRNA-seqを使用して測定した。また、陰性対照として、細胞を、配列スクランブルされた(「scrmbl」)ガイドを使用して形質導入した。測定は、形質導入の4週間後(図8A)及び4週間後(図8B)に行った。図8A及び8Bに示されるように、ABE8.5-m塩基エディターシステムは、標的ゲノム部位を同時に自己不活性化及び編集することが可能であった。
【0699】
以下の材料及び方法を、上記の実施例において用いた。
【0700】
一般的な方法
実施例1~3において使用された構築物を、USER酵素クローニング、制限酵素消化及びT4 DNAライゲーション、Gibsonアセンブリを介して生成したかまたはGenewizによって合成した。全てのPCR反応は、Phusion U DNA Polymerase Green MultiPlex PCR Master Mix(Thermo Fisher)またはQ5 Hot Start HiFi 2x Master Mix(New England Biolabs)のいずれかを使用した。イントロンを、遺伝子断片として、Integrated DNA Technologies(IDT)から注文した。プラスミドリポフェクションによって実行された実験及びAAV形質導入によって実行された実験を含む全ての実験は、Cfa(GEP)スプリットインテイン融合を使用して組換えされたスプリット塩基エディターを使用し、Cfa(GEP)スプリットインテイン融合において、エディターを、Cas9のAsn309に対応するアミノ酸残基と、Cas9のThr310に対応するアミノ酸残基とで分割し、残基310を、Thr310Cysに変異させた。スプリットエディターを、共トランスフェクションまたは共形質導入をそれぞれ必要とする2つの別個のプラスミドまたはAAVベクターによってコードした。各々のABE断片を、CMVプロモーターから発現させた。1つ以上のガイドRNAを、塩基エディターのN末端スプリットもコードしたベクターにおいて直列にコードし、ガイドRNAを、U6プロモーターを使用して発現させた。ガイドRNAを、IDTから注文されたアニールされた相補的オリゴのライゲーションによって、消化されたレシピエントプラスミド内に挿入した。ガイドオリゴを、試料を95℃に3分間加熱し0.1℃/秒の速度で20℃に冷却することによって、IDT duplex buffer中でアニールした。プラスミドDNAを、QIAGEN Plasmid Plus Kitを使用して、100μg/mLのカルベニシリンを含有するLB培地中で増殖させた35mlのMach1(Thermo Fisher)またはNEB Stable細胞培養物(New England Biolabs)のいずれかから調製した。ゲノム標的部位を標的とすることを説明する全ての実験において、所望の編集は、研究において使用された全ての細胞株内にレンチウイルスで組み込まれたABCA4 c.5882G>A点変異のAからGへの変換に対応した。細胞のリポフェクションまたは形質導入からもたらされた編集活性を、テクニカルレプリケートから測定した。
【0701】
AAV産生及び滴定
rAAVベクターを、(a)AAV Rep及びCap遺伝子と、(b)逆位末端リピート(ITR)配列に隣接する導入遺伝子と、(c)AAV複製に必要なアデノウイルス遺伝子(E4、E2a及びVA)(ヘルパープラスミド)とを含有するプラスミドでの、HEK293T細胞の懸濁培養物の一過的三重トランスフェクションを使用して産生した。トランスフェクションの72時間後に、細胞を溶解させ、パッケージングされていないDNAを、Triton X-100、MgCl2及びTurbonucleaseをそれぞれ0.25%(v/v)、2mM及び10U/mlの最終濃度で付加することによって除去した。溶解を、シェーカーインキュベーター内で、37℃で2~5時間実行した。細胞可溶化物を、浄化デプスフィルターに通して濾過し、続いて、0.2ミクロンの濾過を行った。浄化された可溶化物を、Cytiva AKTA Pureクロマトグラフィーシステムを使用する親和性クロマトグラフィーカラム上にロードした。捕らえられたAAVを、pH2.5~3の溶離緩衝液を使用して溶離した。溶離液を捕らえ、pHを速やかに中和した。フルのAAV粒子及び空のAAV粒子を、塩化セシウム密度勾配超遠心分離によって分離した。フルのAAV粒子を含有するバンドを収集し、力価を、qPCRによって決定した。次いで、フルの粒子試料を、CsCl保存溶液中で、最終標的濃度まで希釈し、適切なサイズの透析カセット(MWCO 100kDa)を使用して、配合緩衝液(10mMのNa2HPO4、2mMのKH2PO4、2.7mMのKCl、192mMのNaCl、0.001%のPluronic F-68、pH7.4)中に透析した。透析液を、低タンパク質結合0.1ミクロンシリンジフィルターを使用して濾過し、次いで、アリコートし、-80℃で貯蔵した。最終AAV力価を、液滴デジタルPCR(ddPCR)を使用して、バイアル材料から決定した。また、他の品質属性、例えば、エンドトキシンレベル、凝集状態、浸透圧及びpHを決定した。
【0702】
レンチウイルス挿入を使用する、組み込まれた目的の標的部位を含有する細胞株の生成
レンチウイルス産生プラスミドを、制限クローニングによって、(IDTから注文された)5’HpaI及び3’ApaIに隣接するg-blockを使用して生成した。g-blockは、エクソン42の72bp前からエクソン42の123bp後までの配列を含むヒトABCA4遺伝子断片をコードし、また、ABCA4 c.5882G>Aに対応する点変異を含んだ。g-blockを、HpaI/ApaIで消化されたpLenti6.4 R4R2 V5-DESTベクター(Thermo Fisher Scientific)内にライゲーションし、最終プラスミドを、Vigene Biosciencesでの小規模のレンチウイルス産生のために使用した。レンチウイルスを使用して、HEK293T細胞[CRL-3216、American Type Cell Culture Collection(ATCC)]及びARPE-19細胞(CRL-2302、ATCC)を、0.3~10IFU/細胞の感染多重度(MOI)で形質導入した。安定して組み込まれた細胞を、10μg/mLのブラストサイジンで補充された基礎培地において増殖させることによって選択し、確立されると、細胞を、5μg/mLのブラストサイジンで補充された基礎培地において維持した。MOIによるプールされた各々の細胞集団内の1細胞当たりのレンチウイルス組み込みの平均数を、標的アンプリコン配列決定によって、プライマーoBTx361及びoBTx362を使用して評価して、ウイルスで組み込まれたABCA4断片と内因性ABCA4遺伝子座とを同時に増幅した。各々の試料におけるウイルス組み込みの数を、ABCA4 c.5882G>A変異を含有するNGSリードの数に2を掛け、積を野生型のリードの数で割ること(組み込み数=変異リード×2/WTリード)によって推定した。平均1細胞当たり2つ以下の組み込みを含有する細胞株プールを、全ての塩基編集実験のために使用した。
【0703】
HEK293Tの細胞培養
細胞を、37℃で5%のCO2で培養した。レンチウイルスで組み込まれた細胞を、ATCCによって提供される培養方法に従って、10%(v/v)のウシ胎児血清(A31606-02、Thermo Fisher Scientific)と、5μg/mlのブラストサイジンS HCl(A1113903、Thermo Fisher Scientific)とを有するダルベッコ変法イーグル培地プラスGlutamax(10566-016、Thermo Fisher Scientific)中で維持した。
【0704】
ARPE-19の細胞培養
細胞を、37℃で5%のCO2で培養した。レンチウイルスで組み込まれた細胞を、ATCCによって提供される培養方法に従って、10%(v/v)のウシ胎仔血清(FBS)(A31606-02、Thermo Fisher Scientific)と、5μg/mlのブラストサイジンS HCl(A1113903、Thermo Fisher Scientific)とを有するダルベッコ変法イーグル培地/Nutrient Mixture F-12(DMEM/F-12)(11320033、Thermo Fisher Scientific)中で維持した。
【0705】
プラスミドトランスフェクション
HEK293T細胞を、Corning(登録商標)CellBIND(登録商標)48ウェルマルチプルウェルプレート(3338、Corning)内で、1ウェル当たり35,000個の細胞の密度で、10%(v/v)のFBSを有しブラストサイジンを有さないダルベッコ変法イーグル培地プラスGlutamax中に播種した。細胞を、播種の約24時間後にトランスフェクションした。スプリット塩基エディターと、最大2つのガイドRNAとを含有する相補的プラスミド対を、1:1のモル比で合計1000ngで組み合わせ、続いて、1.5μLのLipofectamine 2000(Thermo Fisher Scientific)及びOpti-MEM低血清培地(Thermo Fisher Scientific)を、25μlの全体積で付加した。試薬混合物を、製造業者の説明書に従って、ウェルに付加した。培地を、細胞溶解前の5日間(120時間)の期間にわたって48時間毎に置換した。
【0706】
AAV形質導入
ARPE-19細胞を、Corning(登録商標)CellBIND(登録商標)48ウェルマルチプルウェルプレート内で、1ウェル当たり23,000個の細胞の密度で、ブラストサイジンを有さないDMEM/F-12培地及び10%のFBS中に播種した。播種の約24時間後に、培地を除去し、スプリット塩基エディターを含有する2つのAAVの各々を、1ウェル当たり125μlの全体積の、FBSを欠くDMEM/F-12中で、1ウイルス/細胞当たり50,000個のウイルスゲノムまで希釈した。細胞を、ウイルスとともに、37℃で5%のCO2で3時間インキュベートし、20%のFBSを有する125μlのDMEM/F-12を、各々の試料に付加して、最終濃度10%のFBSとした。標準的なAAV形質導入実験については、培地を、細胞溶解前の14日間の期間にわたって48時間毎に、DMEM/F-12及び10%のFBSで置換した。時間経過実験については、レプリケートを、5週間の期間にわたって7日毎に溶解させた。
【0707】
ゲノムDNA及びエディターDNAの抽出
培地を除去し、細胞を、100μlの1×PBS(Thermo Fisher)で2回洗浄した後に、75μlの細胞溶解緩衝液(10mMのトリスHCl(pH8.0)+0.05%のSDS+100μg/mLのプロテイナーゼK)を付加した。ウェルを、(マルチチャネルを使用して)ピペットチップでこすり、96ウェルプレートに直ちに移した。96ウェルプレートを、55℃で1時間インキュベートし、続いて、95℃で20分間熱不活性化した。次いで、試料を、-20℃で貯蔵した。
【0708】
代替として、Turbo DNAse(Thermo Fisher)を含む追加の洗浄ステップを、自己不活性化解析に影響を与える残存細胞外プラスミドDNAの存在の潜在性を軽減するために、溶解前に試験した。Turbo DNaseの付加または非存在は、NGS解析による同じ結果をもたらし、このため、Turbo DNAseを、後続の実験において除外した。
【0709】
標的アンプリコン配列決定のための、cDNAへのmRNAの逆転写
全RNAを、製造業者のプロトコルに従って、MagMAX(商標)mirVana(商標)トータルRNA単離キット(A27828、Thermo Fisher Scientific)を使用して単離した。全RNAを、ランダム六量体プライマーを反応から除外し、代わりに、固定されたオリゴdTプライマーを使用した(5’-TTTTTTTTTTTTTTTTTTTTNN(配列番号481))ことを除いて製造業者のプロトコルに従って、RevertAid RT Reverse Transcription Kit(K1691、Thermo Fisher Scientific)を使用して、cDNAに逆転写した。逆転写反応物を、25℃で10分間、37℃で60分間及び95℃で5分間インキュベートした。粗cDNAを、下流用途において直接使用した。
【0710】
標的アンプリコン配列決定DNA及びcDNA試料
細胞可溶化物(2μL)またはcDNAを、Q5 Hot Start HiFi 2x Master Mixと、5’Illuminaアダプターオーバーハングを含有する0.5μMの各々のプライマーとを含有する25μLのPCR反応物に付加した。各々の試料を、2つの別個の反応物中で増幅した。これらの反応物は、以下の2つの固有のプライマー対:目的の細胞ゲノム部位に隣接する1つのプライマー対(oBTx360及びoBTx368)と、エディターDNA配列の所望の編集部位に隣接する別のプライマー対とを有した。プライマーoBTx360及びoBTx368は、ABCA4のエクソン42及びABCA4断片に隣接するV5タグにプライミングすることによって、レンチウイルスで組み込まれたゲノム標的部位を選択的に増幅する。PCR反応を、以下:95℃で2分間、30サイクルの(95℃で15秒、65℃で20秒及び72℃で20秒)、ならびに最後の72℃の延長で2分間実施した。増幅後に、目的の増幅された部位を含有する2μLの粗PCR産物を、25μLの全体積の、0.5μMの各々の固有のIlluminaバーコード化プライマー対及びQ5 Hot Start High-Fidelity 2X Master Mixを使用してバーコード化した。反応を、以下:98℃で2分間、10サイクルの(98℃で20秒間、60℃で30秒間及び72℃で30秒間)、ならびに最後の72℃の延長で2分間実施した。次いで、等しい体積のバーコード化されたPCR産物を、プールし、0.6×ビーズ/試料比を使用するSPRISelect常磁性ビーズ(Beckman Coulter)を使用して清浄化した。溶離されたDNAの濃度を、製造業者のプロトコルに従って、Qubit 4(Thermo Fisher Scientific)で定量化し、Illumina MiSeq機器で配列決定した。
【0711】
全mRNAのRNA-seq
細胞を、培養し、上記のようにトランスフェクトした。実験の終わりに、培地を除去し、細胞を、分離し、50μLのTrypLE(商標)Express Enzyme(1×)、フェノールレッド(12605036、Thermo Fisher Scientific)で解離させた。次いで、細胞を、ペレット化し、完全培地で1回洗浄し、次いで、以下の2つのペレット:上記のDNAの標的配列決定のために使用されるペレットと、RNA-seqのために使用されるペレットとに分割した。全RNAを、製造業者のプロトコルに従って、MagMAX(商標)mirVana(商標)トータルRNA単離キット(A27828、Thermo Fisher Scientific)を使用して単離した。次に、200ngの全RNAを、製造業者の説明書(NEBNext Poly(A)mRNA Magnetic Isolation Module(NEB E7490)とともに使用するためのプロトコル)に従って、NEBNext Ultra II Directional RNA Library Prep Kit for Illumina(E7760L、New England Biolabs)を使用して処理した。最終cDNA産物を、TapeStation(Agilent)において定量化し、4nMに正規化し、等しい体積でプールし、次いで、製造業者のプロトコルに従って、Illumina NextSeq 550機器で配列決定した。
【0712】
アンプリコン配列決定解析の詳細
1.FASTQファイルを、Illumina blc2fastq(v2.20.0.422)を使用するMiSeq機器によって、以下のパラメータで作成されたベースコールファイル(BCF)から生成した。
bcl2fastq\
--ignore-missing-bcls\
--ignore-missing-filter\
--ignore-missing-positions\
--ignore-missing-controls\
--auto-set-to-zero-barcode-mismatches\
--find-adapters-with-sliding-window\
--adapter-stringency0.9\
--mask-short-adapter-reads35\
--minimum-trimmed-read-length35\
【0713】
2.次いで、作成されたFASTQファイルを、trimmomatic(v0.39)を使用し、パラメータを、Illumina TruSeqアダプターをクリップし、20塩基未満のリードを除外し、4bpのスライドウィンドウ内の平均塩基品質(Phredスコア)が15を下回った場合にリードの残りの3’末端をトリミングし、リードの終了で3以下の品質スコアを有するいずれの塩基もトリミングし、ラウンド1のPCRプライマーから導入された4つのランダム化塩基をトリミングするように設定して処理した。
次のコマンドを使用して、trimmomaticを実行した:
trimmomatic SE-phred33 $input_fastq $output_fastq\
ILLUMINACLIP:illumine_adapters.fa:2:30:10\
LEADING:3 TRAILING:3\
SLIDINGWINDOW:4:15\
MINLEN:20\
HEADCROP:4
【0714】
3.トリミングされたリードを、エンドツーエンドモードのbowtie2(v2.35)を使用し--very-sensitiveフラグを指定して、予想されるアンプリコン配列とアラインメントした。bowtie2によって作成されたSAMファイルを、BAMファイルに変換し、ソートし、samtools(v1.9)を使用してインデックス化した。
【0715】
4.ステップ(3)で作成されたBAMファイルを、bam-readcountツール(github.com/genome/bam-readcount)を使用して処理して、アラインメント内の各々の位置での非参照塩基、削除及び挿入の数を概説するプレーンテキストファイルを生成した。非参照塩基をカウントするための最小塩基品質(Phredスコア)を、低い信頼度のベースコールを編集率に関する統計から除外するために、29に設定した。標的部位内の各々の位置についての編集率を、アラインメント内の所与の位置での塩基品質閾値を超える塩基の全数に対する所与のタイプ(例えば、G)の非参照塩基の割合として計算した。
【0716】
全mRNA配列決定解析の詳細
レーンレベルのFASTQファイルを別個に、STAR(v2.7.2a)を使用して、パラメータを、ReadGroupを指定し、ゲノムアラインメントBAMファイル及びトランスクリプトームアラインメントBAMファイルの両方を出力するように設定して、ヒトゲノム(Gencode GRCh38v31一次アセンブリ)と、塩基エディター構築物とを含むカスタムビルドゲノムにアラインメントした。ステップで作成された、各々の試料についてのレーンレベルのゲノムアラインメントを、マージし、座標によってソートし、重複を、Picard(v2.20.5)を使用してマーキングした。次いで、BAMファイルを、編集率の視覚化及び定量化のために、IGV内にロードした。
【0717】
他の実施形態
前述の説明から、本明細書に記載の発明に変形及び修正を加えて、それを様々な用法及び条件に採用することができることは明らかであろう。そのような実施形態もまた、以下の特許請求の範囲の範囲内である。
【0718】
本明細書における変数の任意の定義における要素のリストの列挙は、任意の単一の要素として、または列挙された要素の組み合わせ(またはサブコンビネーション)として、その変数の定義を含む。本明細書における実施形態の列挙は、任意の単一の実施形態として、または任意の他の実施形態もしくはその一部と組み合わせて、その実施形態を含む。
【0719】
本明細書で言及される全ての特許及び刊行物は、各々の独立した特許及び刊行物が参照により援用されることが具体的かつ個別に示されるのと同じ程度に、参照により本明細書に援用される。
図1A
図1B
図1C
図1D
図1E
図1F
図1G
図1H
図2A
図2B
図2C
図2D
図2E
図3A
図3B
図3C
図3D
図3E
図3F
図3G
図3H
図3I
図3J
図3K
図3L
図3M
図3N
図4A
図4B
図4C
図5A
図5B
図6A
図6B
図7A
図7B
図8A
図8B
【配列表】
2024521750000001.app
【国際調査報告】