(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025028857
(43)【公開日】2025-03-05
(54)【発明の名称】核酸塩基編集システムを送達するための組成物および方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20250226BHJP
C12N 15/62 20060101ALI20250226BHJP
C12N 15/63 20060101ALN20250226BHJP
C12N 15/864 20060101ALN20250226BHJP
C12N 15/861 20060101ALN20250226BHJP
C12N 15/867 20060101ALN20250226BHJP
C12N 15/869 20060101ALN20250226BHJP
C12N 5/10 20060101ALN20250226BHJP
C12N 15/55 20060101ALN20250226BHJP
C07K 19/00 20060101ALN20250226BHJP
【FI】
C12N15/09 110
C12N15/62 Z ZNA
C12N15/62 Z
C12N15/63 Z
C12N15/864 100Z
C12N15/861 Z
C12N15/867 Z
C12N15/869 Z
C12N5/10
C12N15/55
C07K19/00
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024192680
(22)【出願日】2024-11-01
(62)【分割の表示】P 2021512514の分割
【原出願日】2019-09-07
(31)【優先権主張番号】62/728,703
(32)【優先日】2018-09-07
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/779,404
(32)【優先日】2018-12-13
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】520439645
【氏名又は名称】ビーム セラピューティクス インク.
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100111235
【弁理士】
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【弁理士】
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】ブライソン、 デイビッド
(57)【要約】 (修正有)
【課題】細胞へのCRISPR/Cas9成分の送達を達成するのを助けるための組成物および方法を提供する。
【解決手段】1つ以上のデアミナーゼ(例えばアデノシンデアミナーゼ)とnCas9とを含むA→G塩基エディター融合タンパク質の断片をそれぞれコードする第1および第2のポリヌクレオチドを送達するための組成物および方法を提供し、ここで、第1のポリヌクレオチドは、分割インテイン対のインテイン-Nに融合されたnCas9のN末端断片をコードし、第2のポリヌクレオチドは、分割インテイン対のインテイン-Cに融合されたnCas9のC末端断片をコードする。これらの断片をsgRNAと共に細胞に送達(例えばAAV送達)するための方法も提供され、これらの断片は分割インテイン系によって一緒に連結され、それによって細胞中で機能的な塩基編集系を再構成する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
(a) デアミナーゼとCas9のN末端断片とを含む融合タンパク質をコードする第1のポリヌ
クレオチドであって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2におけ
る番号付けでCas9のA292~G364の位置で終結する連続配列であり、ここで、Cas9の前記N
末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、および
(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、Cas9の前記C末端
断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まりCas9のC末端で終
結する連続配列であり、Cas9の前記C末端断片は分割インテイン-Cに融合される、第2のポ
リヌクレオチド
を含む、組成物。
【請求項2】
(a) Cas9のN末端断片をコードする第1のポリヌクレオチドであって、Cas9の前記N末端
断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364の位置で
終結する連続配列であり、ここで、Cas9の前記N末端断片は分割インテイン-Nに融合され
る、第1のポリヌクレオチド、および
(b) Cas9のC末端断片とデアミナーゼとを含む融合タンパク質をコードする第2のポリヌ
クレオチドであって、Cas9の前記C末端断片は、配列番号2における番号付けでCas9のA292
~G364の位置で始まりCas9のC末端で終結する連続配列であり、Cas9の前記C末端断片は分
割インテイン-Cに融合される、第2のポリヌクレオチド
を含む、組成物。
【請求項3】
(a) デアミナーゼとCas9のN末端断片とを含む融合タンパク質をコードする第1のポリヌ
クレオチドであって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2におけ
る番号付けでCas9のA292~G364、F445~K483、またはE565~T637の位置で終結する連続配
列であり、ここで、Cas9の前記N末端断片は分割インテイン-Nに融合される、第1のポリヌ
クレオチド、および
(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、Cas9の前記C末端
断片は、配列番号2における番号付けでCas9のA292~G364、F445~K483、またはE565~T63
7の位置で始まりCas9のC末端で終結する連続配列であり、ここでCas9の前記C末端断片のN
末端残基は、Ala、Ser、またはThrを置換したCysであり、Cas9の前記C末端断片は分割イ
ンテイン-Cに融合される、第2のポリヌクレオチド
を含む、組成物。
【請求項4】
(a) Cas9のN末端断片をコードする第1のポリヌクレオチドであって、Cas9の前記N末端
断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364、F445~
K483、またはE565~T637の位置で終結する連続配列であり、ここで、Cas9の前記N末端断
片は分割インテイン-Nに融合される、第1のポリヌクレオチド、および
(b) Cas9のC末端断片とデアミナーゼとを含む融合タンパク質をコードする第2のポリヌ
クレオチドであって、Cas9の前記C末端断片は、配列番号2における番号付けでCas9のA292
~G364、F445~K483、またはE565~T637の位置で始まりCas9のC末端で終結する連続配列
であり、ここでCas9の前記C末端断片のN末端残基は、Ala、Ser、またはThrを置換したCys
であり、Cas9の前記C末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチド
を含む、組成物。
【請求項5】
Cas9の前記N末端断片が、配列番号2における番号付けでアミノ酸302、309、312、354、
455、459、462、465、471、473、576、588、または589までを含む、請求項1~4のいず
れか一項に記載の組成物。
【請求項6】
Cas9の前記C末端断片またはCas9の前記N末端断片が、配列番号2における番号付けでア
ミノ酸S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S5
77、A589、またはS590に対応する残基におけるAla/Cys、Ser/Cys、またはThr/Cys変異を
含む、請求項1~4のいずれか一項に記載の組成物。
【請求項7】
単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチドをさらに含む、請求
項1または2に記載の組成物。
【請求項8】
前記第1および第2のポリヌクレオチドが連結されている、請求項1~7のいずれか一項
に記載の組成物。
【請求項9】
前記第1および第2のポリヌクレオチドが別々に発現される、請求項1~7のいずれか一
項に記載の組成物。
【請求項10】
前記デアミナーゼがアデノシンデアミナーゼである、請求項1~9のいずれか一項に記
載の組成物。
【請求項11】
前記デアミナーゼが野生型TadAまたはTadA7.10である、請求項10記載の組成物。
【請求項12】
前記デアミナーゼがTadA二量体である、請求項1~11のいずれか一項に記載の組成物
。
【請求項13】
前記TadA二量体が野生型TadAおよびTadA7.10を含む、請求項12記載の組成物。
【請求項14】
前記融合タンパク質が核局在化シグナル(NLS)を含む、請求項1~13のいずれか一
項に記載の組成物。
【請求項15】
Cas9の前記N末端断片またはCas9の前記C末端断片がNLSに連結されている、請求項1~
13のいずれか一項に記載の組成物。
【請求項16】
前記NLSが二部分NLSである、請求項14または15に記載の組成物。
【請求項17】
Cas9の前記N末端断片と前記融合タンパク質とが連結されて、デアミナーゼおよびSpCas
9を含む塩基エディタータンパク質を形成する、請求項1~16のいずれか一項に記載の
組成物。
【請求項18】
Cas9の前記C末端断片と前記融合タンパク質とが連結されて、デアミナーゼおよびSpCas
9を含む塩基エディタータンパク質を形成する、請求項1~16のいずれか一項に記載の
組成物。
【請求項19】
前記SpCas9はニッカーゼ活性を有するか、または触媒的に不活性である、請求項17ま
たは18に記載の組成物。
【請求項20】
請求項1~19のいずれか一項に記載の融合タンパク質およびCas9のN末端断片を含む
組成物。
【請求項21】
請求項1~20のいずれか一項に記載の融合タンパク質およびCas9のC末端断片を含む
組成物。
【請求項22】
Cas9の前記N末端断片またはCas9の前記C末端断片とデアミナーゼとがリンカーによって
連結される、請求項1~21のいずれか一項に記載の組成物。
【請求項23】
前記リンカーがペプチドリンカーである、請求項22記載の組成物。
【請求項24】
請求項1~23のいずれか一項に記載の第1および第2のポリヌクレオチドを含むベクタ
ー。
【請求項25】
前記ベクターがプロモーターを含む、請求項24記載のベクター。
【請求項26】
前記プロモーターは構成的プロモーターである、請求項25に記載のベクター。
【請求項27】
前記構成的プロモーターはCMVまたはCAGプロモーターである、請求項26に記載のベク
ター。
【請求項28】
前記ベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルス
ベクター、ヘルペスウイルスベクター、およびアデノ随伴ウイルスベクターからなる群よ
り選択される、請求項24~27のいずれか一項に記載のベクター。
【請求項29】
前記ベクターがアデノ随伴ウイルスベクターである、請求項28に記載のベクター。
【請求項30】
請求項1~13のいずれか一項に記載の組成物または請求項24~30のいずれか一項
に記載のベクターを含む、細胞。
【請求項31】
前記細胞が哺乳動物細胞である、請求項30に記載の細胞。
【請求項32】
Ala/Cys、Ser/Cys、またはThr/Cys変異を含むCas9ドメインを含む、再構成されたA→G
塩基エディタータンパク質。
【請求項33】
前記変異が、SpCas9のアミノ酸S303、T310、T313、S355、A456、S460、A463、T466、S4
69、T472、T474、C574、S577、A589、またはS590に対応する残基におけるものである、請
求項32に記載の再構成された塩基エディタータンパク質。
【請求項34】
(a) Cas9のN末端断片であって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列
番号2における番号付けでCas9のA292~G364の位置で終結する連続配列であり、Cas9の前
記N末端断片は分割インテイン-Nに融合されている、N末端断片、および
(b) Cas9のC末端断片であって、Cas9の前記C末端断片は、配列番号2における番号付け
でCas9のA292~G364の位置で始まりCas9のC末端で終結する連続配列であり、Cas9の前記C
末端断片は、分割インテイン-Cに融合されている、C末端断片
をコードする1つまたは複数のポリヌクレオチドを含む、組成物。
【請求項35】
(a) Cas9のN末端断片であって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列
番号2における番号付けでCas9のアミノ酸302、309、312、354、455、459、462、465、471
、473、576、588または589で終結する連続配列であり、Cas9の前記N末端断片は分割イン
テイン-Nに融合されている、N末端断片、および
(b) Cas9のC末端断片であって、Cas9の前記C末端断片は、配列番号2における番号付け
でCas9のアミノ酸303、310、313、355、456、460、463、466、472、474、577、589または
590で始まりCas9のC末端で終結する連続配列であり、Cas9の前記C末端断片は、分割イン
テイン-Cに融合されている、C末端断片
をコードする1つまたは複数のポリヌクレオチドを含む、組成物。
【請求項36】
Cas9の前記N末端断片またはCas9の前記C末端断片が核局在シグナル(NLS)に連結され
ている、請求項34または35に記載の組成物。
【請求項37】
Cas9の前記N末端断片およびCas9の前記C末端断片の両方がNLSに連結されている、請求
項36に記載の組成物。
【請求項38】
前記NLSが二部分NLSである、請求項36または37に記載の組成物。
【請求項39】
Cas9の前記N末端断片とCas9の前記C末端断片が連結されてSpCa9を形成する、請求項3
4~38のいずれか一項に記載の組成物。
【請求項40】
前記SpCas9は、ニッカーゼ活性を有するか、または触媒的に不活性である、請求項39
に記載の組成物。
【請求項41】
請求項34~40のいずれか一項の(a)におけるCas9のN末端断片と(b)におけるCas9のC
末端断片とを含む、組成物。
【請求項42】
請求項34~40のいずれか一項に記載の1つまたは複数のポリヌクレオチドを含む、
ベクター。
【請求項43】
前記ベクターがプロモーターを含む、請求項42に記載のベクター。
【請求項44】
前記プロモーターが構成的プロモーターである、請求項43に記載のベクター。
【請求項45】
前記構成的プロモーターがCMVまたはCAGプロモーターである、請求項44に記載のベク
ター。
【請求項46】
前記ベクターが、レトロウイルスベクター、アデノウイルスベクター、レンチウイルス
ベクター、ヘルペスウイルスベクター、およびアデノ随伴ウイルスベクターからなる群よ
り選択される、請求項42~45のいずれか一項に記載のベクター。
【請求項47】
前記ベクターがアデノ随伴ウイルスベクターである、請求項46に記載のベクター。
【請求項48】
請求項34~41のいずれか一項に記載の組成物または請求項42~47のいずれか一
項に記載のベクターを含む、細胞。
【請求項49】
前記細胞が哺乳動物細胞である、請求項48に記載の細胞。
【請求項50】
Ala/Cys、Ser/Cys、またはThr/Cys変異を含むCas9バリアントポリペプチド。
【請求項51】
アミノ酸303、310、313、355、456、460、463、466、472または474にCys残基を含む、C
as9バリアントポリペプチド。
【請求項52】
細胞を、
(a) デアミナーゼとCas9のN末端断片とを含む融合タンパク質をコードする第1のポリヌ
クレオチドであって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2におけ
る番号付けでCas9のA292~G364の位置で終結する連続配列であり、ここで、Cas9の前記N
末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、
(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、Cas9の前記C末端
断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まりCas9のC末端で終
結する連続配列であり、Cas9の前記C末端断片は、分割インテイン-Cに融合される、第2の
ポリヌクレオチド、および
(c) 単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチド
に接触させることを含む、
塩基エディターシステムを細胞に送達するための方法。
【請求項53】
細胞を、
(a) Cas9のN末端断片を含む融合タンパク質をコードする第1のポリヌクレオチドであっ
て、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9
のA292~G364の位置で終結する連続配列であり、ここで、Cas9の前記N末端断片は分割イ
ンテイン-Nに融合される、第1のポリヌクレオチド、
(b) Cas9のC末端断片とデアミナーゼとをコードする第2のポリヌクレオチドであって、
Cas9の前記C末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まり
Cas9のC末端で終結する連続配列であり、Cas9の前記C末端断片は、分割インテイン-Cに融
合される、第2のポリヌクレオチド、および
(c) 単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチド
に接触させることを含む、
塩基エディターシステムを細胞に送達するための方法。
【請求項54】
細胞を、
(a) デアミナーゼとCas9のN末端断片とを含む融合タンパク質をコードする第1のポリヌ
クレオチドであって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2におけ
る番号付けでCas9のA292~G364、F445~K483、またはE565~T637の位置で終結する連続配
列であり、ここで、Cas9の前記N末端断片は分割インテイン-Nに融合される、第1のポリヌ
クレオチド、
(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、Cas9の前記C末端
断片は、配列番号2における番号付けでCas9のA292~G364、F445~K483、またはE565~T63
7の位置で始まりCas9のC末端で終結する連続配列であり、ここで、Cas9の前記C末端断片
のN末端残基は、Ala、Ser、またはThrを置換したCysであり、Cas9の前記C末端断片は、分
割インテイン-Cに融合される、第2のポリヌクレオチド、および
(c) 単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチド
に接触させることを含む、
塩基エディターシステムを細胞に送達するための方法。
【請求項55】
細胞を、
(a) Cas9のN末端断片を含む融合タンパク質をコードする第1のポリヌクレオチドであっ
て、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9
のA292~G364、F445~K483、またはE565~T637の位置で終結する連続配列であり、ここで
、Cas9の前記N末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、
(b) Cas9のC末端断片とデアミナーゼとをコードする第2のポリヌクレオチドであって、
Cas9の前記C末端断片は、配列番号2における番号付けでCas9のA292~G364、F445~K483、
またはE565~T637の位置で始まりCas9のC末端で終結する連続配列であり、ここで、Cas9
の前記C末端断片のN末端残基は、Ala、Ser、またはThrを置換したCysであり、Cas9の前記
C末端断片は、分割インテイン-Cに融合される、第2のポリヌクレオチド、および
(c) 単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチド
に接触させることを含む、
塩基エディターシステムを細胞に送達するための方法。
【請求項56】
前記sgRNAは標的ポリヌクレオチドに対して相補的である、請求項52~55のいずれ
か一項に記載の方法。
【請求項57】
前記標的ポリヌクレオチドが生物のゲノム中に存在する、請求項56記載の方法。
【請求項58】
前記生物が動物、植物、または細菌である、請求項57に記載の方法。
【請求項59】
前記第1のポリヌクレオチド、前記第2のポリヌクレオチド、および/または前記をコー
ドするポリヌクレオチドが、ベクターを介して前記細胞に接触される、請求項52~58
のいずれか一項に記載の方法。
【請求項60】
前記ベクターは、レトロウイルスベクター、アデノウイルスベクター、レンチウイルス
ベクター、ヘルペスウイルスベクター、およびアデノ随伴ウイルスベクターからなる群よ
り選択される、請求項59記載の方法。
【請求項61】
前記ベクターがアデノ随伴ウイルスベクターである、請求項60記載の方法。
【請求項62】
Cas9の前記C末端断片またはCas9の前記N末端断片が、配列番号2における番号付けでア
ミノ酸S303、T310、T313、S355、A456、S460、A463、T466、S469、T472、T474、C574、S5
77、A589、またはS590に対応する残基においてAla/Cys、Ser/Cys、またはThr/Cys変異を
含む、請求項52~61のいずれか一項に記載の方法。
【請求項63】
前記デアミナーゼがアデノシンデアミナーゼである、請求項52~62のいずれか一項
に記載の方法。
【請求項64】
前記デアミナーゼがTadAまたはそのバリアントである、請求項63に記載の方法。
【請求項65】
前記デアミナーゼが野生型TadAまたはTad7.10である、請求項64に記載の方法。
【請求項66】
前記デアミナーゼがTadA二量体である、請求項52~65のいずれか一項に記載の方法
。
【請求項67】
前記TadA二量体が野生型TadAおよびTadA7.10を含む、請求項66に記載の方法。
【請求項68】
Cas9の前記N末端断片またはCas9の前記C末端断片がNLSを含む、請求項52~67のい
ずれか一項に記載の方法。
【請求項69】
Cas9の前記N末端断片およびCas9の前記C末端断片の両方がNLSを含む、請求項68に記
載の方法。
【請求項70】
前記NLSが二部分NLSである、請求項68または69に記載の方法。
【請求項71】
Cas9の前記N末端断片とCas9の前記C末端断片が連結されてSpCa 9を形成する、請求項5
2~70のいずれか一項に記載の方法。
【請求項72】
前記SpCas9は、ニッカーゼ活性を有するか、または触媒的に不活性である、請求項71
に記載の方法。
【請求項73】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質はデアミ
ナーゼとCas9のN末端断片とを含み、Cas9の前記N末端断片は、Cas9のN末端で始まり、配
列番号2における番号付けでCas9のA292~G364の位置で終結する連続配列であり、Cas9の
前記N末端断片は分割インテイン-Nに融合される、ポリヌクレオチド。
【請求項74】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質はデアミ
ナーゼとCas9のN末端断片とを含み、Cas9の前記N末端断片は、Cas9のN末端で始まり、配
列番号2における番号付けでCas9のF445~K483の位置で終結する連続配列であり、Cas9の
前記N末端断片は分割インテイン-Nに融合される、ポリヌクレオチド。
【請求項75】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質はデアミ
ナーゼとCas9のN末端断片とを含み、Cas9の前記N末端断片は、Cas9のN末端で始まり、配
列番号2における番号付けでCas9のE565~T637の位置で終結する連続配列であり、Cas9の
前記N末端断片は分割インテイン-Nに融合される、ポリヌクレオチド。
【請求項76】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質は、デア
ミナーゼとCas9のC末端断片とを含み、ここで、Cas9の前記C末端断片は、配列番号2にお
ける番号付けでCas9のA292~G364の位置で始まりCas9のC末端で終結する連続配列であり
、Cas9の前記C末端断片は、分割インテイン-Cに融合される、ポリヌクレオチド。
【請求項77】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質は、デア
ミナーゼとCas9のC末端断片とを含み、ここで、Cas9の前記C末端断片は、配列番号2にお
ける番号付けでCas9のF445~K483の位置で始まりCas9のC末端で終結する連続配列であり
、Cas9の前記C末端断片は、分割インテイン-Cに融合される、ポリヌクレオチド。
【請求項78】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質は、デア
ミナーゼとCas9のC末端断片とを含み、ここで、Cas9の前記C末端断片は、配列番号2にお
ける番号付けでCas9のE565~T637の位置で始まりCas9のC末端で終結する連続配列であり
、Cas9の前記C末端断片は、分割インテイン-Cに融合される、ポリヌクレオチド。
【請求項79】
融合タンパク質をコードするポリヌクレオチドであって、前記融合タンパク質は、デア
ミナーゼとCas9のC末端断片とを含み、ここで、Cas9の前記C末端断片は、配列番号2にお
ける番号付けでCas9のA292~G364、F445~K483、またはE565~T637の位置で始まりCas9の
C末端で終結する連続配列であり、Cas9の前記C末端断片のN末端残基はAla、Ser、またはT
hrを置換したCysであり、Cas9の前記C末端断片は、分割インテイン-Cに融合される、ポリ
ヌクレオチド。
【請求項80】
Cas9の前記C末端断片またはCas9の前記N末端断片が、Ala/Cys、Ser/Cys、またはThr/Cy
s変異を含む、請求項73~79のいずれか一項に記載のポリヌクレオチド。
【請求項81】
前記変異が、配列番号2における番号付けでアミノ酸S303、T310、T313、S355、A456、S
460、A463、T466、S469、T472、T474、C574、S577、A589、またはS590に対応する残基に
おけるものである、請求項80に記載のポリヌクレオチド。
【請求項82】
前記デアミナーゼはアデノシンデアミナーゼである、請求項73~81のいずれか一項
に記載のポリヌクレオチド。
【請求項83】
前記デアミナーゼはTadAまたはそのバリアントである、請求項82記載のポリヌクレオ
チド。
【請求項84】
前記デアミナーゼは野生型TadAまたはTad7.10である、請求項83に記載のポリヌクレ
オチド。
【請求項85】
前記融合タンパク質は、互いに連結された2つのデアミナーゼを含む、請求項73~8
4のいずれか一項に記載のポリヌクレオチド。
【請求項86】
前記融合タンパク質が野生型TadAおよびTadA7.10の両方を含む、請求項85に記載のポ
リヌクレオチド。
【請求項87】
前記融合タンパク質がNLSを含む、請求項73~86のいずれか一項に記載のポリヌク
レオチド。
【請求項88】
前記NLSは二部分NLSである、請求項87に記載のポリヌクレオチド。
【請求項89】
Cas9の前記N末端断片またはCas9の前記C末端断片がSpCas9のアミノ酸配列を含む、請求
項73~88のいずれか一項に記載のポリヌクレオチド。
【請求項90】
Cas9の前記N末端断片またはCas9の前記C末端断片が、ヌクレアーゼ活性の低減に関連す
る1つ以上のアミノ酸置換を含む、請求項73~89のいずれか一項に記載のポリヌクレ
オチド。
【請求項91】
アミノ酸302、309、312、354、455、459、462、465、471、または473までが、分割され
たインテイン-Nに融合されたものを含む、Cas9タンパク質のN末端断片。
【請求項92】
Cas9タンパク質のC末端タンパク質断片であって、前記C末端断片のN末端アミノ酸は、
アミノ酸303、310、313、355、456、460、463、466、472または474におけるCys置換であ
り、かつ分割インテイン-Cに融合されている、C末端タンパク質断片。
【請求項93】
A→G塩基エディター融合タンパク質の断片をコードするポリヌクレオチドであって、前
記融合タンパク質は1つ以上のデアミナーゼとCas9のN末端断片とを含み、前記N末端断片
は分割インテイン-Nに融合される、ポリヌクレオチド。
【請求項94】
A→G塩基エディター融合タンパク質の断片をコードするポリヌクレオチドであって、前
記融合タンパク質は1つ以上のデアミナーゼとCas9のC末端断片とを含み、前記C末端断片
は分割インテイン-Cに融合される、ポリヌクレオチド。
【請求項95】
A→G塩基エディター融合タンパク質のタンパク質断片であって、前記融合タンパク質は
1つ以上のデアミナーゼとCas9のN末端断片とを含み、前記N末端断片は分割インテイン-N
に融合されている、タンパク質断片。
【請求項96】
A→G塩基エディター融合タンパク質のタンパク質断片であって、前記融合タンパク質は
1つ以上のデアミナーゼとCas9のC末端断片とを含み、前記C末端断片は分割インテイン-C
に融合されている、タンパク質断片。
【請求項97】
1つ以上のデアミナーゼとCas9とを含むA→G塩基エディター融合タンパク質の断片をそ
れぞれがコードする第1および第2のポリヌクレオチドを含む組成物であって、前記第1の
ポリヌクレオチドは、Cas9のN末端断片が分割インテイン-Nに融合されたものをコードし
、前記第2のポリヌクレオチドは、Cas9のC末端断片が分割インテイン-Cに融合されたもの
をコードする、組成物。
【請求項98】
1つ以上のデアミナーゼとSpCas9とを含むA→G塩基エディター融合タンパク質のN末端断
片およびC末端断片を含む組成物であって、前記N末端断片は、SpCas9の断片が分割インテ
イン-Nに融合されたものを含み、前記C末端断片は、SpCas9の残部が分割インテイン-Cに
融合されたものを含む、組成物。
【請求項99】
細胞に塩基エディターシステムを送達するための方法であって、1つ以上のデアミナー
ゼとCas9とを含むA→G塩基エディター融合タンパク質の断片をそれぞれコードする第1お
よび第2のポリヌクレオチドに細胞を接触させることを含み、ここで、前記第1のポリヌク
レオチドは、Cas9のN末端断片が分割インテイン-Nに融合されたものをコードし、前記第2
のポリヌクレオチドは、Cas9のC末端断片が分割インテイン-Cに融合されたものをコード
し、前記第1または第2のポリヌクレオチドのどちらかが、単一ガイドRNAをコードする、
方法。
【請求項100】
細胞に塩基エディターシステムを送達するための方法であって、1つまたは複数のデア
ミナーゼとSpCas9とを含むA→G塩基エディター融合タンパク質のN末端断片およびC末端断
片、ならびにガイドRNAに細胞を接触させることを含み、ここで、前記N末端断片は、SpCa
s9の断片が分割インテイン-Nに融合されたものを含み、前記C末端断片は、SpCas9の残部
が分割インテイン-Cに融合されたものを含む、方法。
【請求項101】
1つまたは複数のデアミナーゼとCas9とを含むA→G塩基エディター融合タンパク質の断
片をそれぞれコードする第1および第2のポリヌクレオチドに細胞を接触させる工程であっ
て、ここで、前記第1のポリヌクレオチドは、Cas9のN末端断片が分割インテイン-Nに融合
されたものをコードし、前記第2のポリヌクレオチドは、Cas9のC末端断片が分割インテイ
ン-Cに融合されたものをコードし、前記第1または第2のポリヌクレオチドのどちらかが単
一ガイドRNAをコードする、工程と、
前記コードされたタンパク質および単一ガイドRNAを細胞中で発現させる工程と
を含む、細胞中の標的ポリヌクレオチドを編集するための方法。
【発明の詳細な説明】
【背景技術】
【0001】
関連出願の相互参照
本出願は、2018年9月7日に出願された米国仮特許出願第62/728,703号及び2018年12月13
日に出願された米国仮特許出願第62/779,404号の利益を主張するものであり、これらの全
ての内容は参照により本明細書に組み込まれる。
【0002】
Clustered Regularly-Interspaced Short Palindromic Repeats(CRISPR)の発見は、
分子生物学の分野に革命をもたらした。この熱狂の多くは、CRISPR/Cas9がヒトの疾患を
治療しヒトゲノムを編集する臨床的可能性に集中している。疾患を引き起こす突然変異は
、CRISPRあるいはCRISPRベースのシステムを用いて修復される可能性がある。この目標を
達成するための1つの課題は、ゲノム編集のために必要な要素を送達することである。例
えば、CRISPR/Cas9に関して、SpCas9およびsgRNAがDNAプラスミドベクター中にコードさ
れ、アデノ随伴ウイルス(AAV) を介して送達され得る。しかしながら、AAVはパッケージ
ング能力が小さいため、細胞へのCRISPR/Cas9成分の送達を達成するのを助け、および/ま
たは所望の遺伝子編集目的を満たすために他のエレメント(例えばポリペプチドドメイン
、プロモーター、レポーター、蛍光タグ、複数のsgRNA、またはHDRのためのDNAテンプレ
ートなど)を含めさせることは、困難である。
【発明の概要】
【0003】
いくつかの態様において、 (a) デアミナーゼとCas9のN末端断片とを含む融合タンパク
質をコードする第1のポリヌクレオチドであって、ここでCas9のN末端断片は、Cas9のN末
端で始まり、配列番号2における番号付けでCas9のA292~G364の位置で終結する連続配列
であり、Cas9のN末端断片は分割(split)インテイン-Nに融合される、第1のポリヌクレ
オチド、および (b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、こ
こでCas9のC末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まり
Cas9のC末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合され
る、第2のポリヌクレオチドを含む、組成物が本明細書で提供される。
【0004】
いくつかの態様において、 (a) Cas9のN末端断片をコードする第1のポリヌクレオチド
であって、ここでCas9のN末端断片は、Cas9のN末端で始まり、配列番号2における番号付
けでCas9のA292~G364の位置で終結する連続配列であり、Cas9のN末端断片は分割インテ
イン-Nに融合される、第1のポリヌクレオチド、および (b) Cas9のC末端断片とデアミナ
ーゼとを含む融合タンパク質をコードする第2のポリヌクレオチドであって、ここでCas9
のC末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まりCas9のC
末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合される、第2
のポリヌクレオチドを含む、組成物が本明細書で提供される。
【0005】
いくつかの態様において、 (a) デアミナーゼとCas9のN末端断片とを含む融合タンパク
質をコードする第1のポリヌクレオチドであって、ここでCas9のN末端断片は、Cas9のN末
端で始まり、配列番号2における番号付けでCas9のA292~G364、F445~K483、またはE565
~T637の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合さ
れる、第1のポリヌクレオチド、および (b) Cas9のC末端断片をコードする第2のポリヌク
レオチドであって、ここでCas9のC末端断片は、配列番号2における番号付けでCas9のA292
~G364、F445~K483、またはE565~T637の位置で始まり、Cas9のC末端で終結する連続配
列であり、Cas9のC末端断片のN末端残基は、Ala、Ser、またはThrを置換したCysであり、
Cas9のC末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチドを含む、組成
物が本明細書で提供される。
【0006】
いくつかの態様において、 (a) Cas9のN末端断片をコードする第1のポリヌクレオチド
であって、ここでCas9のN末端断片は、Cas9のN末端で始まり、配列番号2における番号付
けでCas9のA292~G364、F445~K483、またはE565~T637の位置で終結する連続配列であり
、Cas9のN末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、および (
b) Cas9のC末端断片とデアミナーゼとを含む融合タンパク質をコードする第2のポリヌク
レオチドであって、ここでCas9のC末端断片は、配列番号2における番号付けでCas9のA292
~G364、F445~K483、またはE565~T637の位置で開始し、Cas9のC末端で終結する連続配
列であり、Cas9のC末端断片のN末端残基は、Ala、Ser、またはThrを置換したCysであり、
Cas9のC末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチドを含む、組成
物が本明細書で提供される。
【0007】
いくつかの実施形態において、Cas9のN末端断片は、配列番号2における番号付けでアミ
ノ酸302、309、312、354、455、459、462、465、471、473、576、588、または589までを
含む。いくつかの実施形態において、Cas9のC末端断片またはCas9のN末端断片は、配列番
号2における番号付けでアミノ酸S303、T310、T313、S355、A456、S460、A463、T466、S46
9、T472、T474、C574、S577、A589、またはS590に対応する残基においてAla/Cys、Ser/Cy
s、またはThr/Cys突然変異を含む。いくつかの実施形態において、組成物は、単一ガイド
RNA(sgRNA)またはそれをコードするポリヌクレオチドをさらに含む。いくつかの実施形
態において、第1および第2のポリヌクレオチドは連結される。ある態様において、第1お
よび第2のポリヌクレオチドは別々に発現される。ある態様において、デアミナーゼはア
デノシンデアミナーゼである。ある態様において、デアミナーゼは、野生型TadAまたはTa
dA7.10である。ある態様において、デアミナーゼは、TadA二量体である。いくつかの実施
形態において、TadA二量体は、野生型TadAおよびTadA 7.10を含む。ある態様において、
融合タンパク質は、核局在化シグナル(NLS)を含む。いくつかの実施形態において、Cas
9のN末端断片またはCas9のC末端断片は、NLSと連結される。いくつかの実施形態において
、NLSは二部分(bipartite)NLSである。いくつかの実施形態において、Cas9のN末端断片
および融合タンパク質は連結されて、デアミナーゼおよびSpCas9を含む塩基エディタータ
ンパク質を形成する。ある態様において、Cas9のC末端断片および融合タンパク質は連結
されて、デアミナーゼおよびSpCas9を含む塩基エディタータンパク質を形成する。いくつ
かの態様において、SpCas9は、ニッカーゼ活性を有するか、または触媒的に不活である。
【0008】
いくつかの態様において、本明細書に開示される融合タンパク質とCas9のN末端断片と
を含む組成物が本明細書に提供される。いくつかの態様において、本明細書に開示される
融合タンパク質とCas9のC末端断片とを含む組成物が本明細書に提供される。いくつかの
態様において、Cas9のN末端断片またはCas9のC末端断片とデアミナーゼとは、リンカーに
よって連結される。ある態様において、リンカーは、ペプチドリンカーである。
【0009】
いくつかの態様において、本明細書に開示される第1および第2のポリヌクレオチドを含
むベクターが本明細書で提供される。ある態様において、ベクターはプロモーターを含む
。ある態様において、プロモーターは構成的プロモーターである。ある態様において、構
成的プロモーターは、CMVまたはCAGプロモーターである。ある態様において、ベクターは
、レトロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペ
スウイルスベクター、およびアデノ随伴ウイルスベクターからなる群より選択される。あ
る態様において、ベクターは、アデノ随伴ウイルスベクターである。
【0010】
いくつかの態様において、本明細書に開示される組成物または本明細書に開示されるベ
クターを含む、細胞が本明細書で提供される。ある態様において、細胞は哺乳動物細胞で
ある。
【0011】
いくつかの態様において、本明細書では、Ala/Cys、Ser/Cys、またはThr/Cys突然変異
を含むCas9ドメインを含む、再構成されたA→G塩基エディタータンパク質が提供される。
いくつかの実施形態において、突然変異は、SpCas9のアミノ酸S303, T310, T313, S355,
A456, S460, A463, T466, S469, T472, T474, C574, S577, A589, またはS590に対応する
残基にある。
【0012】
いくつかの態様において、 (a) Cas9のN末端で始まり、配列番号2における番号付けでC
as9のA292~G364の位置で終結する連続配列であり、分割インテイン-Nに融合される、Cas
9のN末端断片と、(b) 配列番号2における番号付けでCas9のA292~G364の位置で始まりCas
9のC末端で終結する連続配列であり、分割インテイン-Cに融合される、Cas9のC末端断片
とをコードする、1つ以上のポリヌクレオチドを含む組成物が本明細書で提供される。
【0013】
いくつかの態様において、 (a) Cas9のN末端で始まり、配列番号2における番号付けでC
as9のアミノ酸302, 309, 312, 354, 455, 459, 462, 465, 471, 473, 576, 588, または5
89で終結する連続配列であり、分割インテイン-Nに融合される、Cas9のN末端断片と、(b)
配列番号2における番号付けでCas9の303, 310, 313, 355, 456, 460, 463, 466, 472, 4
74, 577, 589, または590で始まり、Cas9のC末端で終結する連続配列であり、分割インテ
イン-Cに融合される、Cas9のC末端断片とをコードする、1つ以上のポリヌクレオチドを含
む組成物が本明細書で提供される。
【0014】
いくつかの実施形態において、Cas9のN末端断片またはCas9のC末端断片は、核局在シグ
ナル (NLS) と連結される。いくつかの実施形態において、Cas9のN末端断片およびCas9の
C末端断片は両方ともNLSに連結される。いくつかの実施形態において、NLSは、二部分NLS
である。いくつかの実施形態において、Cas9のN末端断片およびCas9のC末端断片は、連結
されてSpCa9を形成する。いくつかの態様において、SpCas9は、ニッカーゼ活性を有する
か、または触媒的に不活である。
【0015】
いくつかの態様において、本明細書で開示される(a) においてCas9のN末端断片を、 (b
) においてCas9のC末端断片を含む組成物が本明細書で提供される。
【0016】
いくつかの態様において、本明細書で開示される1以上のポリヌクレオチドを含むベク
ターが本明細書で提供される。ある態様において、ベクターはプロモーターを含む。ある
態様において、プロモーターは構成的プロモーターである。ある態様において、構成的プ
ロモーターは、CMVまたはCAGプロモーターである。ある態様において、ベクターは、レト
ロウイルスベクター、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイ
ルスベクター、およびアデノ随伴ウイルスベクターからなる群より選択される。ある態様
において、ベクターはアデノ随伴ウイルスベクターである。
【0017】
いくつかの態様において、本明細書に開示される組成物または本明細書に開示されるベ
クターを含む、細胞が本明細書で提供される。ある態様において、細胞は哺乳動物細胞で
ある。
【0018】
いくつかの態様において、Ala/Cys、Ser/Cys、またはThr/Cys突然変異を含むCas9バリ
アントポリペプチドが本明細書で提供される。いくつかの態様において、本明細書では、
アミノ酸303, 310, 313, 355, 456, 460, 463, 466, 472, または474においてCys残基を
含むCas9バリアントポリペプチドが提供される。
【0019】
いくつかの態様において、本明細書では、細胞に塩基エディターシステムを送達するた
めの方法が提供され、この方法は、細胞を、(a) デアミナーゼとCas9のCas9のN末端断片
とを含む融合タンパク質をコードする第1のポリヌクレオチドであって、ここで、Cas9のN
末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364の位
置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合される、第1の
ポリヌクレオチド、(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、
ここで、Cas9のC末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始
まり、Cas9のC末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融
合される、第2のポリヌクレオチド、および(c) 単一ガイドRNA (sgRNA) またはそれをコ
ードするポリヌクレオチドと接触させることを含む。
【0020】
いくつかの態様において、本明細書では、細胞に塩基エディターシステムを送達するた
めの方法が提供され、この方法は、細胞を、(a) Cas9のN末端断片を含む融合タンパク質
をコードする第1のポリヌクレオチドであって、ここで、Cas9のN末端断片は、Cas9のN末
端で始まり、配列番号2における番号付けでCas9のA292~G364の位置で終結する連続配列
であり、Cas9のN末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、 (
b) Cas9のC末端断片とデアミナーゼとをコードする第2のポリヌクレオチドであって、こ
こで、Cas9のC末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始ま
り、Cas9のC末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合
される、第2のポリヌクレオチド、および(c) 単一ガイドRNA (sgRNA) またはそれをコー
ドするポリヌクレオチドと接触させることを含む。
【0021】
いくつかの態様において、塩基エディターシステムを細胞に送達するための方法が本明
細書で提供され、この方法は、細胞を、(a) デアミナーゼとCas9のN末端断片とを含む融
合タンパク質をコードする第1のポリヌクレオチドであって、ここで、Cas9のN末端断片は
、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364、F445~K483ま
たはE565~T637の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-N
に融合される、第1のポリヌクレオチド、(b) Cas9のC末端断片をコードする第2のポリヌ
クレオチドであって、ここでCas9のC末端断片は、配列番号2における番号付けでCas9のA2
92~G364、F445~K483、またはE565~T637の位置で始まりCas9のC末端で終結する連続配
列であり、Cas9のC末端断片のN末端残基がAla、Ser、またはThrを置換したCysであり、Ca
s9のC末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチド、および(c) 単
一ガイドRNA (sgRNA) またはそれをコードするポリヌクレオチドと接触させることを含む
。
【0022】
いくつかの態様において、塩基エディターシステムを細胞に送達するための方法が本明
細書で提供され、この方法は、細胞を、(a) Cas9のN末端断片を含む融合タンパク質をコ
ードする第1のポリヌクレオチドであって、ここで、Cas9のN末端断片はCas9のN末端で始
まり、配列番号2における番号付けでCas9のA292~G364、F445~K483、またはE565~T637
の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合される、
第1のポリヌクレオチド、(b) Cas9のC末端断片とデアミナーゼとをコードする第2のポリ
ヌクレオチドであって、ここでCas9のC末端断片は、配列番号2における番号付けでCas9の
A292~G364、F445~K483、またはE565~T637の位置で始まりCas9のC末端で終結する連続
配列であり、Cas9のC末端断片のN末端残基はAla、Ser、またはThrを置換したCysであり、
Cas9のC末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチド、および(c)
単一ガイドRNA(sgRNA)またはそれをコードするポリヌクレオチドと接触させることを含
む。
【0023】
ある態様において、sgRNAは、標的ポリヌクレオチドに相補的である。ある態様におい
て、標的ポリヌクレオチドは、生物のゲノム中に存在する。ある態様において、生物は、
動物、植物、または細菌である。いくつかの実施形態において、第1のポリヌクレオチド
、第2のポリヌクレオチド、および/またはこれらをコードするポリヌクレオチドは、ベク
ターを介して細胞と接触される。ある態様において、ベクターは、レトロウイルスベクタ
ー、アデノウイルスベクター、レンチウイルスベクター、ヘルペスウイルスベクター、お
よびアデノ随伴ウイルスベクターからなる群より選択される。ある態様において、ベクタ
ーは、アデノ随伴ウイルスベクターである。いくつかの実施形態において、Cas9のC末端
断片またはCas9のN末端断片は、配列番号2における番号付けでアミノ酸S303、T310、T313
、S355、A456、S460、A463、T466、S469、T472、T474、C574、S577、A589、またはS590に
対応する残基においてAla/Cys、Ser/Cys、またはThr/Cys突然変異を含む。ある態様にお
いて、デアミナーゼは、アデノシンデアミナーゼである。ある態様において、デアミナー
ゼは、TadAまたはそのバリアントである。いくつかの実施形態において、デアミナーゼは
野生型TadAまたはTad7.10である。ある態様において、デアミナーゼは、TadA二量体であ
る。いくつかの実施形態において、TadA二量体は、野生型TadAおよびTadA7.10を含む。い
くつかの実施形態において、Cas9のN末端断片またはCas9のC末端断片はNLSを含む。いく
つかの実施形態において、Cas9のN末端断片およびCas9のC末端断片は両方ともNLSを含む
。いくつかの実施形態において、NLSは二部分NLSである。いくつかの実施形態において、
Cas9のN末端断片およびCas9のC末端断片は、連結されてSpCa9を形成する。いくつかの態
様において、SpCas9は、ニッカーゼ活性を有するか、または触媒的に不活である。
【0024】
いくつかの態様において、本明細書では融合タンパク質をコードするポリヌクレオチド
が提供され、ここで、融合タンパク質は、デアミナーゼとCas9のN末端断片とを含み、Cas
9のN末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364
の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合される。
いくつかの態様において、本明細書では融合タンパク質をコードするポリヌクレオチドが
提供され、ここで、融合タンパク質は、デアミナーゼとCas9のN末端断片とを含み、Cas9
のN末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のF445~K483
の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合される。
いくつかの態様において、本明細書では融合タンパク質をコードするポリヌクレオチドが
提供され、ここで、融合タンパク質は、デアミナーゼとCas9のN末端断片とを含み、Cas9
のN末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のE565~T637
の位置で終結する連続配列であり、Cas9のN末端断片は分割インテイン-Nに融合される。
いくつかの態様において、本明細書では融合タンパク質をコードするポリヌクレオチドが
提供され、ここで、融合タンパク質は、デアミナーゼとCas9のC末端断片とを含み、Cas9
のC末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まりCas9のC
末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合される。い
くつかの態様において、本明細書では、融合タンパク質をコードするポリヌクレオチドが
提供され、ここで、融合タンパク質は、デアミナーゼとCas9のC末端断片とを含み、Cas9
のC末端断片は、配列番号2における番号付けでCas9のF445~K483の位置で始まりCas9のC
末端で終結する連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合される。あ
る態様において、融合タンパク質をコードするポリヌクレオチドが本明細書で提供され、
ここで、融合タンパク質は、デアミナーゼとCas9のC末端断片とを含み、Cas9のC末端断片
は、配列番号2における番号付けでCas9のE565~T637の位置で始まりCas9のC末端で終結す
る連続配列であり、Cas9のC末端断片は分割インテイン-Cに融合される。ある態様におい
て、融合タンパク質をコードするポリヌクレオチドが本明細書で提供され、ここで、融合
タンパク質は、デアミナーゼとCas9のC末端断片とを含み、Cas9のC末端断片は、配列番号
2における番号付けでCas9のA292~G364、F445~K483、またはE565~T637の位置で始まり
、Cas9のC末端で終結する連続配列であり、Cas9のC末端断片のN末端残基は、Ala、Ser、
またはThrを置換したCysであり、Cas9のC末端断片は分割インテインCに融合される。
【0025】
いくつかの実施形態において、Cas9のC末端断片またはCas9のN末端断片は、Ala/Cys、S
er/Cys、またはThr/Cys突然変異を含む。いくつかの実施形態において、突然変異は、配
列番号2における番号付けでアミノ酸S303、T310、T313、S355、A456、S460、A463、T466
、S469、T472、T474、C574、S577、A589、またはS590に対応する残基にある。ある態様に
おいて、デアミナーゼは、アデノシンデアミナーゼである。ある態様において、デアミナ
ーゼは、TadAまたはそのバリアントである。いくつかの実施形態において、デアミナーゼ
は野生型TadAまたはTad7.10である。ある態様において、融合タンパク質は、互いに連結
された2つのデアミナーゼを含む。ある態様において、融合タンパク質は、野生型TadAお
よびTadA7.10の両方を含む。ある態様において、融合タンパク質は、NLSを含む。ある態
様において、NLSは、二部分NLSである。ある態様において、Cas9のN末端断片またはCas9
のC末端断片は、SpCas9のアミノ酸配列を含む。いくつかの実施形態において、Cas9のN末
端断片またはCas9のC末端断片は、ヌクレアーゼ活性の減少に関連する1つ以上のアミノ酸
置換を含む。
【0026】
いくつかの態様において、本明細書では、アミノ酸302、309、312、354、455、459、46
2、465、471、または473までを含むCas9タンパク質のN末端断片が分割インテイン-Nに融
合されたものが提供される。いくつかの態様において、本明細書では、Cas9タンパク質の
C末端タンパク質断片が提供され、ここで、C末端断片のN末端アミノ酸は、アミノ酸303,
310, 313, 355, 456, 460, 463, 466, 472, または474におけるCys置換であり、分割イン
テイン-Cに融合される。いくつかの態様において、本明細書では、A→G塩基エディター融
合タンパク質の断片をコードするポリヌクレオチドが提供され、融合タンパク質は、1つ
以上のデアミナーゼとCas9のN末端断片とを含み、該N末端断片は分割インテイン-Nに融合
されている。いくつかの態様において、本明細書では、A→G塩基エディター融合タンパク
質の断片をコードするポリヌクレオチドが提供され、融合タンパク質は、1つ以上のデア
ミナーゼとCas9のC末端断片とを含み、該C末端断片は分割インテイン-Cに融合されている
。いくつかの態様において、本明細書では、A→G塩基エディター融合タンパク質のタンパ
ク質断片が提供され、融合タンパク質は、1つ以上のデアミナーゼとCas9のN末端断片とを
含み、該N末端断片は分割インテイン-Nに融合されている。いくつかの態様において、本
明細書では、A→G塩基エディター融合タンパク質のタンパク質断片が提供され、融合タン
パク質は、1つ以上のデアミナーゼとCas9のC末端断片とを含み、該C末端断片は分割イン
テイン-Cに融合されている。
【0027】
いくつかの態様において、それぞれが1つ以上のデアミナーゼとCas9とを含むA→G塩基
エディター融合タンパク質の断片をコードする第1および第2のポリヌクレオチドを含む組
成物が本明細書で提供され、ここで、第1のポリヌクレオチドは、分割インテイン-Nに融
合されたCas9のN末端断片をコードし、第2のポリヌクレオチドは、分割インテイン-Cに融
合されたCas9のC末端断片をコードする。いくつかの態様において、1つ以上のデアミナー
ゼとCas9とを含むA→G塩基エディター融合タンパク質のN-およびC末端断片を含む組成物
が本明細書で提供され、ここで、N末端断片は、分割インテイン-Nに融合されたSpCas9の
断片を含み、C末端断片は、分割インテイン-Cに融合されたSpCas9の残部を含む。
【0028】
いくつかの態様において、細胞に塩基エディターシステムを送達するための方法が本明
細書で提供され、この方法は、細胞を、1つ以上のデアミナーゼとCas9とを含むA→G塩基
エディター融合タンパク質の断片をそれぞれコードする第1および第2のポリヌクレオチド
と接触させることを含み、ここで、第1のポリヌクレオチドは、分割インテイン-Nに融合
されたCas9のN末端断片をコードし、第2のポリヌクレオチドは、分割インテイン-Cに融合
されたCas9のC末端断片をコードし、そして第1または第2のポリヌクレオチドのどちらか
が、単一ガイドRNAをコードする。いくつかの態様において、塩基エディターシステムを
細胞に送達するための方法が本明細書で提供され、この方法は、細胞を、1つ以上のデア
ミナーゼとSpCas9とを含むA→G塩基エディター融合タンパク質のN-およびC末端断片、な
らびにガイドRNAと接触させることを含み、ここで、該N末端断片は、分割インテイン-Nに
融合されたSpCas9の断片を含み、C末端断片は、分割インテイン-Cに融合されたSpCas9の
残部を含む。いくつかの態様において、細胞中の標的ポリヌクレオチドを編集するための
方法が本明細書で提供され、この方法は、細胞を、1つ以上のデアミナーゼとCas9とを含
むA→G Base Editor融合タンパク質の断片をそれぞれコードする第1および第2のポリヌク
レオチドと接触させること(ここで、第1のポリヌクレオチドは、分割インテイン-Nに融
合されたCas9のN末端断片をコードし、第2のポリヌクレオチドは、分割インテイン-Cに融
合されたCas9のC末端断片をコードし、第1または第2のポリヌクレオチドのいずれかが単
一ガイドRNAをコードする)、および、コードされたタンパク質および単一ガイドRNAを細
胞中で発現させることを含む。
【0029】
本発明の他の特徴および利点は、詳細な説明および特許請求の範囲から明らかになるで
あろう。
【0030】
[定義]
別段の定義がされない限り、本明細書で使用されるすべての技術的および科学的用語は
、本発明が属する技術分野の当業者によって一般に理解される意味を有する。以下の参考
文献は、本発明において使用される多くの用語の一般的な定義を当業者に提供する: Sing
leton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); T
he Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossa
ry of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); および
Hale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書中で使
用される場合、以下の用語は、別段の指定がない限り、以下においてそれらに宛てがわれ
る意味を有する。
【0031】
「アデノシンデアミナーゼ」とは、アデニンまたはアデノシンの加水分解的脱アミノ化
を触媒することができるポリペプチドまたはその断片を意味する。ある態様において、デ
アミナーゼまたはデアミナーゼドメインは、アデノシンからイノシンへの加水分解脱アミ
ノ化またはデオキシアデノシンからデオキシイノシンへの加水分解脱アミノ化を触媒する
アデノシンデアミナーゼである。ある態様において、アデノシンデアミナーゼは、デオキ
シリボ核酸 (DNA) 中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。
本明細書で提供されるアデノシンデアミナーゼ(例えば、遺伝子操作されたアデノシンデ
アミナーゼ、進化されたアデノシンデアミナーゼ)は、例えば細菌など、任意の生物由来
のものであり得る。ある態様において、デアミナーゼまたはデアミナーゼドメインは、生
物由来の天然デアミナーゼのバリアントである。いくつかの態様において、デアミナーゼ
またはデアミナーゼドメインは、天然には存在しないものである。例えば、いくつかの態
様において、デアミナーゼまたはデアミナーゼドメインは、天然に存在するデアミナーゼ
に対して少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70
%、少なくとも75% 少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少
なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%
の同一性を有する。ある態様において、アデノシンデアミナーゼは、例えばE. coli、S.
aureus、S. typhi、S. putrefaciens、H. influenzae、またはC. crescentusなどの、細
菌に由来する。ある態様において、アデノシンデアミナーゼは、TadAデアミナーゼである
。ある態様において、TadAデアミナーゼは、E. coli TadA(ecTadA)デアミナーゼまたは
その断片である。
【0032】
例えば、切詰め型(truncated)のecTadAは、全長ecTadAと比較して1つ以上のN末端ア
ミノ酸を欠失していてもよい。いくつかの実施形態において、切詰め型ecTadAは、全長ec
TadAと比較して1, 2, 3, 4, 5 ,6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19,
または20のN末端アミノ酸残基を欠失していてもよい。いくつかの実施形態において、切
詰め型ecTadAは、全長ecTadAと比較して1, 2, 3, 4, 5 ,6, 7, 8, 9, 10, 11, 12, 13, 1
4, 15, 6, 17, 18, 19, または20のC末端アミノ酸残基を欠失していてもよい。いくつか
の実施形態において、ecTadAデアミナーゼは、N末端メチオニンを含まない。いくつかの
実施形態において、TadAデアミナーゼは、N末端切詰め型のTadAである。特定の実施形態
において、TadAは、その全体が参照により本明細書に組み込まれるPCT/US2017/045381に
記載されているTadAのいずれかで1つある。
【0033】
特定の実施形態では、アデノシンデアミナーゼは、以下のアミノ酸配列を含む:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPT AHAEIMALRQGGLVMQNYRLIDAT
LYVTLEPCVMCAGAMIHSRIGRVVFGARDAKT GAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKA
QKKAQSSTD
これは「TadA参照配列」と呼ばれる。
【0034】
或る実施態様では、TadAデアミナーゼは全長E. coli TadAデアミナーゼである。例えば
、特定の実施形態において、アデノシンデアミナーゼは、以下のアミノ酸配列を含む:
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEG WNRPIGRHDPTAHAEIMALRQGGL
VMQNYRLIDATLYVTLEPCVMCAGAMIHSRIG RVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSD
FFRMRRQEI KAQKKAQSSTD
【0035】
しかしながら、本願において有用なさらなるアデノシンデアミナーゼは、当業者には明
らかであり、本開示の範囲内であることが理解されるべきである。例えば、アデノシンデ
アミナーゼは、tRNAに作用するアデノシンデアミナーゼ(AD AT)のホモログであり得る
。例示的なAD ATホモログには、限定されるものではないが、以下のものが含まれる:
【0036】
Staphylococcus aureus TadA:
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAH AEHIAIERAAKVLGSWRLEGCT
LYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCS GS LMNLLQQS NFNHRAIVDKG VLKE AC S TLLTTFFKNL
RANKKS TN
【0037】
Bacillus subtilis TadA:
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVT
LEPCPMCAGAVVLSRVEKVVFGAFDPKGGC S GTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAAR
KNLSE
【0038】
Salmonella typhimurium (S. typhimurium) TadA:
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEG WNRPIGRHDPTAHAEIMALRQGGL
VLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIG RVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSD
FFRMRRQEIK ALKKADRAEGAGPAV
【0039】
Shewanella putrefaciens (S. putrefaciens) TadA:
MDE YWMQVAMQM AEKAEAAGE VPVGA VLVKDGQQIATGYNLS IS QHDPT AHAEI LCLRSAGKKLENYRLLDA
TLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGT VVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKK
ALKLAQRAQQGIE
【0040】
Haemophilus influenzae F3031 (H. influenzae) TadA:
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQS DPT ΑΗ AEIIALRNG AKNI
QN YRLLNS TLY VTLEPCTMC AG AILHS RIKRLVFG AS D YK TGAIGSRFHFFDDYKMNHTLEITSGVLAEE
CSQKLSTFFQKRREEKKIEKALLKSLSD K
【0041】
Caulobacter crescentus (C. crescentus) TadA:
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAH DPTAHAEIAAMRAAAAKLGNYRL
TDLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRK
AKI
【0042】
Geobacter sulfurreducens (G. sulfurreducens) TadA:
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSN DPSAHAEMIAIRQAARRSANWRL
TGATLYVTLEPCLMCMGAIILARLERVVFGCYDP KGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRR
RKKAKATPALF IDERKVPPEP
【0043】
TadA7.10
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQK
KAQSSTD
【0044】
「薬剤(agent)」とは、任意の小分子化合物、抗体、核酸分子、またはポリペプチド
、またはそれらの断片を意味する。
【0045】
「改変」とは、本明細書に記載されるような標準技術の公知の方法によって検出される
ような、遺伝子またはポリペプチドの構造、発現レベルまたは活性の変化を意味する。本
明細書で使用される場合、改変(例えば増加または減少)は、発現レベルの10%の変化、2
5%の変化、40%の変化、50%以上の発現レベルの変化を含む。
【0046】
「アナログ」とは、同一ではないが、類似の機能的または構造的特徴を有する分子を意
味する。例えば、ポリペプチドアナログは、対応する天然ポリペプチドの生物学的活性を
少なくともいくらか保持しながら、天然ポリペプチドと比較してそのアナログの機能を増
強させる特定の配列改変を有する。そのような改変は、例えばポリヌクレオチド結合活性
を変化させることなく、アナログのプロテアーゼ抵抗性、膜透過性、または半減期を増加
させることができる。別の例では、ポリヌクレオチドアナログは、天然ポリヌクレオチド
と比べてアナログの機能を増強させるある種の改変を有しながら、対応する天然ポリヌク
レオチドの生物学的活性を保持する。そのような改変は、ポリヌクレオチドのDNAに対す
る親和性、半減期、および/またはヌクレアーゼ耐性を増加させ得、アナログは、非天然
のヌクレオチドまたはアミノ酸を含み得る。
【0047】
「塩基エディター(BE)」あるいは「核酸塩基エディター(NBE)」とは、ポリヌクレ
オチドに結合して核酸塩基修飾活性を有する薬剤を意味する。一実施形態において、該薬
剤は、塩基編集活性を有するドメイン、すなわち、核酸分子(例えばDNA)内の塩基(例
えばA、T、C、G、U)を改変することができるドメインを含む融合タンパク質である。い
くつかの実施形態において、塩基編集活性を有するドメインは、核酸分子内の塩基を脱ア
ミノ化することができる。ある態様において、塩基エディターは、DNA分子内の塩基を脱
アミノ化することができる。ある態様において、塩基エディターは、DNA内のシトシン (C
) またはアデノシンを脱アミノ化することができる。ある態様において、塩基エディター
は、DNA内のシトシン (C) およびアデノシン (A) を脱アミノ化することができる。ある
態様において、塩基エディターは、シチジン塩基エディター (CBE) である。一部の実施
形態では、塩基エディターはアデノシン塩基エディター (ABE) である。いくつかの実施
形態において、塩基エディターは、アデノシン塩基エディター (ABE) およびシチジン塩
基エディター (CBE) である。ある態様において、塩基エディターは、アデノシンデアミ
ナーゼに融合されたヌクレアーゼ不活Cas9(dCas9)である。いくつかの実施形態におい
て、Cas9は、循環置換体(circular permutant)のCas9(例えばspCas9またはsaCas9)で
ある。循環置換体Cas9は当該分野で公知であり、例えば、Oakes et al., Cell 176, 254-
267, 2019に記載されている。いくつかの態様において、塩基エディターは、塩基除去修
復の阻害因子、例えばUGIドメインに融合される。ある態様において、融合タンパク質は
、デアミナーゼと、UGIドメインのような塩基除去修復の阻害因子に融合されたCas9ニッ
カーゼを含む。他の実施形態では、塩基エディターは脱塩基塩基エディターである。
【0048】
塩基エディター系の核酸塩基成分およびポリヌクレオチドプログラミング可能なヌクレ
オチド結合成分は、互いに共有結合的または非共有結合的により結合され得る。例えば、
いくつかの実施形態において、デアミナーゼドメインが、ポリヌクレオチドプログラミン
グ可能なヌクレオチド結合ドメインによって標的ヌクレオチド配列にターゲティングされ
得る。ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメ
インは、デアミナーゼドメインに融合または連結され得る。いくつかの実施形態において
、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼド
メインと非共有結合的に相互作用または結合することによって、デアミナーゼドメインを
標的ヌクレオチド配列にターゲティングすることができる。例えば、いくつかの実施形態
において、核酸塩基編集成分、例えばデアミナーゼ成分は、ポリヌクレオチドプログラミ
ング可能なヌクレオチド結合ドメインの一部をなすさらなる異種部分またはドメインと相
互作用し、会合し、または複合体を形成することができる、さらなる異種部分またはドメ
インを含むことができる。いくつかの実施形態において、追加の異種部分は、ポリペプチ
ドと結合し、相互作用し、会合し、または複合体を形成することができる。いくつかの実
施形態において、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、
または複合体を形成することができる。いくつかの実施形態において、追加の異種部分は
、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追加
の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態にお
いて、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の異
種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の異
種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ド
メイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合
モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、また
はRNA認識モチーフであり得る。
【0049】
塩基エディターシステムは、ガイドポリヌクレオチド成分をさらに含むことができる。
塩基エディターシステムの構成要素は、共有結合、非共有結合的相互作用、またはそれら
の結合および相互作用の任意の組合せを介して互いに結合され得ることが理解されるべき
である。ある態様において、デアミナーゼドメインは、ガイドポリヌクレオチドによって
標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態において
、塩基エディター系の核酸塩基編集成分、例えばデアミナーゼ成分は、ガイドポリヌクレ
オチドの一部またはセグメント(例えばポリヌクレオチドモチーフ) と相互作用し、結合
し、または複合体を形成し得るさらなる異種部分またはドメイン(例えばRNAまたはDNA結
合タンパク質のようなポリヌクレオチド結合ドメイン)を含み得る。いくつかの実施形態
において、追加の異種部分またはドメイン(例えばRNAまたはDNA結合タンパク質などのポ
リヌクレオチド結合ドメイン)は、デアミナーゼドメインに融合または連結され得る。い
くつかの実施形態において、追加の異種部分は、ポリペプチドと結合し、相互作用し、会
合し、またはポリペプチドと複合体を形成することができる。いくつかの実施形態におい
て、追加の異種部分は、ポリヌクレオチドと結合し、相互作用し、会合し、またはポリヌ
クレオチドと複合体を形成することができる。いくつかの実施形態において、追加の異種
部分は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において
、追加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形
態において、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追
加の異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追
加の異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパ
ク質ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラー
ゼKu結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク
質、またはRNA認識モチーフであり得る。
【0050】
ある態様において、塩基エディターシステムは、1以上のタンパク質、融合タンパク質
、ポリペプチド、またはそれらをコードするポリヌクレオチドを含み得る。いくつかの実
施形態において、塩基エディターシステムは、デアミナーゼとnapDNAbpのN末端断片とを
含む融合タンパク質をコードする第1のポリヌクレオチド、および、napDNAbpのC末端断片
をコードする第2のポリヌクレオチドを含み得る。例えば、特定の実施形態では、napDNAb
pのN末端断片とC末端断片とが再構成されて塩基エディタータンパク質を形成するように
、napDNAbpのN末端断片がインテイン-Nに融合され、napDNAbpのC末端断片がインテイン-C
に融合され得る。
【0051】
ある実施形態において、塩基エディターシステムは、塩基除去修復(BER)コンポーネ
ントの阻害因子をさらに含むことができる。ある実施形態において、塩基エディターシス
テムは、塩基除去修復(BER)コンポーネントの阻害因子をさらに含むことができる。塩
基エディターシステムの構成要素は、共有結合、非共有結合的相互作用、またはそれらの
結合および相互作用の任意の組み合わせを介して互いに結合され得ることが理解されるべ
きである。BER成分の阻害因子は、塩基除去修復阻害因子を含み得る。ある態様において
、塩基除去修復の阻害因子は、ウラシルDNAグリコシラーゼ阻害因子 (UGI) であり得る。
ある態様において、塩基除去修復の阻害因子は、イノシン塩基除去修復阻害因子であり得
る。ある態様において、塩基除去修復の阻害因子は、ポリヌクレオチドプログラミング可
能なヌクレオチド結合ドメインにより標的ヌクレオチド配列にターゲティングされ得る。
ある態様において、ポリヌクレオチドプログラミング可能なヌクレオチド結合ドメインは
、塩基除去修復の阻害因子に融合または連結され得る。ある態様において、ポリヌクレオ
チドプログラミング可能なヌクレオチド結合ドメインは、デアミナーゼドメインおよび塩
基除去修復の阻害因子に融合または連結され得る。いくつかの実施形態において、ポリヌ
クレオチドプログラミング可能なヌクレオチド結合ドメインは、塩基除去修復の阻害因子
と非共有結合的に相互作用するか、または塩基除去修復の阻害因子と会合することによっ
て、塩基除去修復の阻害因子を標的ヌクレオチド配列へとターゲティングすることができ
る。例えば、いくつかの実施形態において、塩基除去修復成分の阻害因子は、ポリヌクレ
オチドプログラミング可能なヌクレオチド結合ドメインの一部であるさらなる異種部分ま
たはドメインと相互作用、会合、または複合体形成し得るさらなる異種部分またはドメイ
ンを含み得る。ある態様において、塩基除去修復の阻害因子は、ガイドポリヌクレオチド
により標的ヌクレオチド配列にターゲティングされ得る。例えば、いくつかの実施形態に
おいて、塩基除去修復の阻害因子は、ガイドポリヌクレオチドの一部またはセグメント(
例えば、ポリヌクレオチドモチーフ)と相互作用、会合、または複合体形成し得るさらな
る異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリヌクレオ
チド結合ドメイン)を含み得る。いくつかの実施形態において、ガイドポリヌクレオチド
のさらなる異種部分またはドメイン(例えば、RNAまたはDNA結合タンパク質のようなポリ
ヌクレオチド結合ドメイン)は、塩基除去修復の阻害因子に融合または連結され得る。い
くつかの実施形態において、追加の異種部分は、ポリヌクレオチドと結合、相互作用、会
合、または複合体形成することができる。いくつかの実施形態において、追加の異種部分
は、ガイドポリヌクレオチドに結合することができる。いくつかの実施形態において、追
加の異種部分は、ポリペプチドリンカーに結合することができる。いくつかの実施形態に
おいて、追加の異種部分は、ポリヌクレオチドリンカーに結合することができる。追加の
異種部分は、タンパク質ドメインであってもよい。いくつかの実施形態において、追加の
異種部分は、K相同(KH) ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質
ドメイン、SfMu Comコートタンパク質ドメイン、無菌アルファモチーフ、テロメラーゼKu
結合モチーフおよびKuタンパク質、テロメラーゼSm7結合モチーフおよびSm7タンパク質、
またはRNA認識モチーフであり得る。
【0052】
「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に変化させるように作用す
ることを意味する。一実施形態では、第1の塩基が第2の塩基に変換される。別の実施形態
では、塩基がポリヌクレオチドから切り出される。一実施形態において、塩基編集活性は
、シチジンデアミナーゼ活性であり、例えば、標的C・GをT・Aに変換する活性である。別
の実施形態において、塩基編集活性は、アデノシンデアミナーゼ活性であり、例えば、A
・TをG・Cに変換する活性である。
【0053】
用語「Cas9」または「Cas9ドメイン」は、Cas9タンパク質またはその断片(例えばCas9
の活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCas9のgRNA結合
ドメインを含むタンパク質)を含むRNA誘導ヌクレアーゼを指す。Cas9ヌクレアーゼは、c
asn1ヌクレアーゼまたはCRISPR(clustered regularly interspaced short palindromic
repeat)関連ヌクレアーゼと呼ばれることもある。CRISPRは、可動遺伝要素(ウイルス、
転移因子、接合プラスミド)に対する防御を提供する適応免疫系である。CRISPRクラスタ
ーは、スペーサー、先行する可動要素に相補的な配列、および標的侵入核酸を含む。CRIS
PRクラスターは転写され、CRISPR RNA(crRNA)にプロセシングされる。II型CRISPRシス
テムでは、pre‐crRNAの正しいプロセシングはトランスコード小RNA(tracrRNA)、内因
性リボヌクレアーゼ3(rnc)、およびCas9タンパク質を必要とする。tracrRNAはリボヌク
レアーゼ3によるpre-crRNAのプロセシングのガイドとなる。続いて、Cas9/crRNA/tracrRN
Aが、スペーサーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼで切断する
。crRNAに相補的でない標的鎖は、最初にエンドヌクレアーゼ的に切断され、次にエキソ
ヌクレアーゼ的に3’-5’にトリムされる。crRNAおよびtracrRNAの両方の側面を単一のRN
A種に組み込むように、単一ガイドRNA(「sgRNA」、あるいは単に「gRNA」)を作製する
ことができる。例えばJinek M., Chylinski K., Fonfara I., Hauer M., Doudna J. A.,
Charpentier E. Science 337:816-821(2012)を参照されたい(その内容全体が参照により
本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMあるいは
プロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別することを助ける。Ca
s9ヌクレアーゼの配列および構造は、当業者によく知られている(例えば“Complete gen
ome sequence of an Ml strain of Streptococcus pyogenes.” Ferretti et al., J.J.,
McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C, Sezate S.,
Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren
Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E.,
Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); “CRISPR RNA maturation by tr
ans-encoded small RNA and host factor RNase III.” Deltcheva E., Chylinski K., S
harma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentie
r E., Nature 471:602-607(2011); および “A programmable dual-RNA-guided DNA endo
nuclease in adaptive bacterial immunity.” Jinek M., Chylinski K., Fonfara I.,
Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照。その内容全
体が参照により本明細書に組み入れられる。)。Cas9オーソログは、限定されるものでは
ないが、S. pyogenesおよびS. thermophilusを含む種々の種において記述されてきた。さ
らなる適切なCas9ヌクレアーゼおよび配列は、本開示に基づいて当業者に明らかとなり、
そのようなCas9ヌクレアーゼおよび配列は、Chylinski, Rhun, and Charpentier, “The
tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems” (2013) RNA B
iology 10:5, 726-737に開示されている生物および遺伝子座由来のCas9配列を含む。その
全内容は参照により本明細書に組み込まれる。
【0054】
ヌクレアーゼ不活性化Cas9タンパク質は、互換的に「dCas9」タンパク質(nuclease-“
dead” Cas9の意)または触媒的に不活なCas9とも称され得る。不活性なDNA切断ドメイン
を有するCas9タンパク質(又はその断片)を生成する方法は公知である(例えばJinek et
al, Science. 337:816-821(2012); Qi et al, “Repurposing CRISPR as an RNA-Guided
Platform for Sequence-Specific Control of Gene Expression”(2013) Cell. 28; 152
(5): 1173-83参照(各内容は参照により本明細書に組み込まれる))。例えば、Cas9のDN
A切断ドメインは、HNHヌクレアーゼサブドメインとRuvC1サブドメインという2つのサブド
メインを含むことが知られている。HNHサブドメインはgRNAに相補的な鎖を切断し、RuvC1
サブドメインは非相補的な鎖を切断する。これらのサブドメイン内の変異はCas9のヌクレ
アーゼ活性を抑制し得る。例えば、突然変異D10AおよびH840Aは、S. pyogenes Cas9 のヌ
クレアーゼ活性を完全に不活性化する(Jinek et al, Science. 337:816-821(2012); Qi
et al, Cell. 28;152(5): 1173-83 (2013))。ある態様において、Cas9ヌクレアーゼは、
不活性な(例えば不活化された)DNA切断ドメインを有し、すなわち、Cas9は、「nCas9」
タンパク質(「nickase」Cas9の意)と呼ばれるニッカーゼである。ある態様において、C
as9の断片を含むタンパク質が提供される。例えば、いくつかの実施形態において、タン
パク質は、以下の2つのCas9ドメインのうちの1つを含む:(1) Cas9のgRNA結合ドメイン;(
2) Cas9のDNA切断ドメイン。ある態様において、Cas9またはその断片を含むタンパク質は
、「Cas9バリアント」と称される。Cas9バリアントは、Cas9またはその断片と相同性を共
有する。例えば、Cas9バリアントは、野生型Cas9と少なくとも約70%同一、少なくとも約8
0%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約96%同一、少なくと
も約97%同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、ま
たは少なくとも約99.9%同一である。いくつかの実施形態において、Cas9変異体は、野生
型Cas9と比較して、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38,
39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50またはそれ以上のアミノ酸変化を有
し得る。いくつかの実施形態において、Cas9バリアントは、Cas9の断片 (例えばgRNA結合
ドメインまたはDNA切断ドメイン)を含み、その断片は、野生型Cas9の対応する断片と少な
くとも約70%同一であり、少なくとも約80%同一であり、少なくとも約90%同一であり、少
なくとも約95%同一であり、少なくとも約96%同一であり、少なくとも約97%同一であり、
少なくとも約98%同一であり、少なくとも約99%同一であり、少なくとも約99.5%同一であ
り、または少なくとも約99.9%同一である。ある態様において、断片は、対応する野生型C
as9のアミノ酸長の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少
なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なく
とも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%同一、少なく
とも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%であ
る。
【0055】
ある実施形態において、断片は、長さが少なくとも100アミノ酸である。ある実施形態
において、断片は、少なくとも100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 60
0, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, または
少なくとも 1300アミノ酸の長さである。ある態様において、野生型Cas9は、Streptococc
us pyogenes由来のCas9に対応する(NCBI参照配列:NC_17053.1、ヌクレオチド配列およ
びアミノ酸配列は以下の通り)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGT
TCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTG
GCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGT
TATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGT
GGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAA
CTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCAT
ATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCA
GTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTG
CACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAAT
CTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTC
AAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTA
AGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCA
ATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTA
TAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATA
AATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGC
AAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGA
AGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTC
CATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAA
GTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGT
ACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAA
TGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACC
GTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATT
TAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAG
ATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCT
CACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGAT
TAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTA
TGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTA
CATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACT
GGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGA
AAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTT
GAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATT
AGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATA
AGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAAC
TATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTT
GAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTT
TGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAA
TTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTA
TCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAG
TTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAAT
ATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGA
AACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTG
TCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCT
CGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAA
GGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTG
AAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATAT
AGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCT
GCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAA
AACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATT
TTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAA
TATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAAC
GATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGAT
TTGAGTCAGCTAGGAGGTGACTGA (配列番号1)
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0056】
ある実施形態において、野生型Cas9は、以下のヌクレオチド配列および/またはアミノ
酸配列に対応するか、またはそれを含む:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGT
ACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCG
ATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGT
TACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGT
CGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAA
CGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCAT
ATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCA
GTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCG
CCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAAC
CTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAG
TAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCA
AAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCA
ATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATA
TAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACA
AGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGA
AAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGA
GGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGAC
CCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAA
GTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGT
ATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCA
TGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACA
GTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATT
TAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAG
ATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCT
CACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTAT
CAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTA
TGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTG
CACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCT
AGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGC
AAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCT
GTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGA
ACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACA
ATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAG
AACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGG
CTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGA
TACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCA
AAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGC
TTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACA
AAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCT
AACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGG
GGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACA
TAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATC
GCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGC
AAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTT
TTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAG
TATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGC
ACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAAC
AGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTC
ATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGA
AAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCA
AACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATA
GATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGA
TTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0057】
いくつかの実施形態において、野生型Cas9は、Streptococcus pyogenesからのCas9に対
応する(NCBI参照配列:NC_002737.2(以下のヌクレオチド配列);およびUniprot参照配
列:Q99ZW2(以下のアミノ酸配列)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGT
TCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTG
ACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGT
TATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGT
GGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAA
CTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCAT
ATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCA
GTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTG
CACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAAT
CTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTC
AAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTA
AGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCA
ATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTA
TAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATA
AATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGC
AAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGA
AGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTC
CATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAA
GTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGT
ACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAA
TGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACC
GTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATT
TAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAG
ATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCT
CACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGAT
TAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTA
TGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTA
CATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATT
GGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCC
AGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCT
GTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGA
ATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACA
ATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAA
AACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGG
TTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAA
TTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCT
AAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGC
GTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATA
AAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCT
AATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGG
GGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATA
TTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATT
GCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGC
TAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCT
TTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAA
TATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGC
TCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAAC
AAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTT
ATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGA
AAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTA
AACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATT
GATTTGAGTCAGCTAGGAGGTGACTGA
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0058】
いくつかの実施形態において、Cas9は、Corynebacterium ulcerans (NCBI Refs: NC_01
5683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016
786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia
(NCBI Ref: NC_017861.1); Spiroplasma taiwanense (NCBI Ref: NC_021846.1); Strept
ococcus iniae(NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1);
Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCB
I Ref: YP_820832.1), Listeria innocua (NCBI Ref: NP_472073.1), Campylobacter jej
uni (NCBI Ref: YP_002344900.1) もしくは Neisseria. meningitidis (NCBI Ref: YP_00
2342100.1)由来のCas9、または任意の他の生物由来のCas9を指す。
【0059】
いくつかの実施形態において、dCas9は、Cas9ヌクレアーゼ活性を不活性化する1以上の
突然変異を有するCas9アミノ酸配列に対応するか、またはその一部もしくは全体を含む。
例えば、いくつかの実施形態において、dCas9ドメインは、D10AおよびH840A突然変異また
は別のCas9における対応する突然変異を含む。いくつかの実施形態において、dCas9は、
以下のdCas9(D10AおよびH840A)のアミノ酸配列を含む:
(一重下線:HNHドメイン;二重下線:RuvCドメイン)
【0060】
いくつかの実施形態において、Cas9ドメインはD10A突然変異を含み、一方、上記で提供
したアミノ酸配列における位置840における残基、または本明細書で提供されるアミノ酸
配列のいずれかにおける対応する位置における残基は、ヒスチジンのままである。
【0061】
他の実施形態において、例えばヌクレアーゼ不活性化Cas9 (dCas9) をもたらす、D10A
およびH840A以外の突然変異を有するdCas9バリアントが提供される。このような突然変異
は、例えば、D10およびH840における他のアミノ酸置換、またはCas9のヌクレアーゼドメ
イン内の他の置換(例えば、HNHヌクレアーゼサブドメインおよび/またはRuvC1サブドメイ
ンにおける置換)を含む。ある態様において、dCas9のバリアントまたはホモログであって
、少なくとも約70%同一、少なくとも約80%同一、少なくとも約90%同一、少なくとも約95%
同一、少なくとも約98%同一、少なくとも約99%同一、少なくとも約99.5%同一、または少
なくとも約99.9%の同一性を有するものが提供される。ある態様において、約5アミノ酸、
約10アミノ酸、約15アミノ酸、約20アミノ酸、約25アミノ酸、約30アミノ酸、約40アミノ
酸、約50アミノ酸、約75アミノ酸、約100アミノ酸またはそれ以上だけ短いまたは長いア
ミノ酸配列を有するdCas9のバリアントが提供される。
【0062】
いくつかの実施形態において、本明細書に提供されるCas9融合タンパク質は、Cas9タン
パク質の全長アミノ酸配列、例えば、本明細書に提供されるCas9配列の1つを含む。しか
しながら、他の実施形態において、本明細書に提供される融合タンパク質は、全長Cas9配
列を含まず、その1つ以上の断片のみを含む。
【0063】
好適なCas9ドメインおよびCas9断片の例示的アミノ酸配列が本明細書に提供され、Cas9
ドメインおよび断片のさらなる好適な配列は、当業者には明らかであろう。
【0064】
いくつかの実施態様において、Cas9は、Corynebacterium ulcerans (NCBI Refs: NC_01
5683.1, NC_017317.1); Corynebacterium diphtheria (NCBI Refs: NC_016782.1, NC_016
786.1); Spiroplasma syrphidicola (NCBI Ref: NC_021284.1); Prevotella intermedia
(NCBI Ref: NC_017861.1); Spiroplasma taiwanense(NCBI Ref: NC_021846.1); Strepto
coccus iniae (NCBI Ref: NC_021314.1); Belliella baltica (NCBI Ref: NC_018010.1);
Psychroflexus torquisI (NCBI Ref: NC_018721.1); Streptococcus thermophilus (NCB
I Ref: YP_820832.1); Listeria innocua (NCBI Ref: NP_472073.1); Campylobacter jej
uni (NCBI Ref: YP_002344900.1); またはNeisseria. meningitidis (NCBI Ref: YP_0023
42100.1)由来のCas9を指す。
【0065】
追加的なCas9タンパク質(例えば、ヌクレアーゼ不活(dead)Cas9(dCas9)、Cas9ニ
ッカーゼ(nCas9)、またはヌクレアーゼ活性Cas9)は、そのバリアントおよびホモログ
を含めて、本開示の範囲内にあることが理解されるべきである。例示的なCas9タンパク質
は、限定されるものではないが、下記に提供されるものを含む。ある態様において、Cas9
タンパク質は、ヌクレアーゼ不活Cas9(dCas9)である。ある態様において、Cas9タンパ
ク質は、Cas9ニッカーゼ(nCas9)である。いくつかの実施形態において、Cas9タンパク
質はヌクレアーゼ活性Cas9である。
【0066】
例示的な触媒不活性Cas9(dCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD
【0067】
例示的な触媒的Cas9ニッカーゼ(nCas9):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD
【0068】
例示的な触媒的活性Cas9:
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD.
【0069】
ある態様において、Cas9は、単細胞原核微生物のドメインおよび界を構成する古細菌(
例えばナノアーキア)由来のCas9を指す。ある態様において、Casタンパク質は、例えば、
Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res.
2017 Feb 21. doi: 10.1038/cr.2017.21に記載されているCasXまたはCasYを指し、その全
体の内容は参照により本明細書に組み込まれる。ゲノム分解メタゲノミクスを用いて、生
命の古細菌ドメインにおいて最初に報告されたCas9を含め、多くのCRISPR‐Cas系が同定
された。この分岐Cas9タンパク質は、ほとんど研究されていないナノアーキアにおいて、
活性CRISPR‐Cas系の一部として発見された。細菌では、それまで知られていなかった二
つの系、CRISPR-CasXとCRISPR-CasYが発見され、それらは、これまでに発見された中でも
最もコンパクトな系に入る。いくつかの実施形態において、Cas9は、CasXまたはCasXのバ
リアントを表す。いくつかの実施形態において、Cas9は、CasYまたはCasYのバリアントを
表す。核酸プログラミング可能DNA結合タンパク質(napDNAbp:nucleic acid programmab
le DNA binding protein)として他のRNA誘導DNA結合タンパク質も使用され得、本開示の
範囲内であることが理解されるべきである。
【0070】
いくつかの実施形態において、napDNAbpは、Cas9ドメインであり、例えばヌクレアーゼ
活性Cas9、Cas9ニッカーゼ(nCas9)、またはヌクレアーゼ不活性Cas9(dCas9)である。
核酸プログラミング可能なDNA結合タンパク質の非限定的な例としては、Cas9(例えばdCa
s9およびnCas9)、タイプII Casエフェクタータンパク質、タイプV Casエフェクタータン
パク質、タイプVI Casエフェクタータンパク質、CARF、DinG、それらのホモログ、または
それらの改変もしくは遺伝子操作バージョンが挙げられる。他の核酸プログラミング可能
DNA結合タンパク質もまた、本開示に具体的に列記されていないとしても、本開示の範囲
内である。例えばMakarova et al. “Classification and Nomenclature of CRISPR-Cas
Systems: Where from Here?” CRISPR J. 2018 Oct;1:325-336. doi: 10.1089/crispr.20
18.0033; Yan et al., “Functionally diverse type V CRISPR-Cas systems” Science.
2019 Jan 4;363(6422):88-91. doi: 10.1126/science.aav7271参照(それぞれの内容全
体が参照により本明細書に組み込まれる)。
【0071】
いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかの核酸
プログラム可能DNA結合タンパク質 (napDNAbp) は、CasXまたはCasYタンパク質であり得
る。いくつかの実施形態において、napDNAbpはCasXタンパク質である。いくつかの実施形
態において、napDNAbpはCasYタンパク質である。いくつかの実施形態において、napDNAbp
は、天然に存在するCasXまたはCasYタンパク質に対して少なくとも85%、少なくとも90%、
少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少な
くとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の
同一性を有するアミノ酸配列を含む。いくつかの実施形態において、napDNAbpは、天然に
存在するCasXまたはCasYタンパク質である。いくつかの実施形態において、napDNAbpは、
本明細書に記載されるいずれかのCasXまたはCasYタンパク質に対して少なくとも85%、少
なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なく
とも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少な
くとも99.5%の同一性を有するアミノ酸配列を含む。他の細菌種由来のCasXおよびCasYも
また、本開示に従って使用され得ることを理解されたい。
【0072】
CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-associated Casx protein OS = Sulfolobus islandicu
s (strain HVE10/4) GN = SiH_0402 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIIL
PLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAA
AGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAV
GQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNL
NSDDGKVRDLKLISAYVNGELIRGEG
【0073】
>tr|F0NH53|F0NH53_SULIR CRISPR associated protein, Casx OS = Sulfolobus islandic
us (strain REY15A) GN=SiRe_0771 PE=4 SV=1
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIIL
PLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAA
AGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAV
GQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLN
SDDGKVRDLKLISAYVNGELIRGEG
【0074】
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacte
rium]
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEE
KVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKD
IIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNR
NRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELE
KRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVS
SLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKET
IDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIF
SVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWK
DLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLA
GLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHY
FGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSG
SFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQN
FISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYA
TLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKD
FMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKN
IKVLGQMKKI
【0075】
用語「CRISPR-Casドメイン」または「CRISPR-Cas DNA結合ドメイン」は、CRISPR関連(
Cas)タンパク質またはその断片を含むRNA誘導型タンパク質(例えば、Casタンパク質の
活性、不活性、または部分的に活性なDNA切断ドメイン、および/またはCasタンパク質のg
RNA結合ドメインを含むタンパク質)を指す。CRISPRクラスターは転写されてCRISPR RNA
(crRNA)にプロセスされる。CRISPRクラスターは転写されてCRISPR RNA(crRNA)にプロ
セスされる。いくつかのCRISPRシステムでは、pre-crRNAの正しいプロセシングにトラン
スコード化小RNA(tracrRNA)、内因性リボヌクレアーゼ3(rnc)およびCasタンパク質が
必要とされる。このtracrRNAは、リボヌクレアーゼ3に補助されるpre-crRNAのプロセシン
グのためのガイドとして働く。続いて、Cas9/crRNAおよび/またはtracrRNAが、スペーサ
ーに相補的な線状または環状のdsDNA標的をエンドヌクレアーゼ的に切断する。自然界で
は、DNA結合と切断のために両方のRNAを必要とし得る。しかし、crRNAおよびtracrRNAの
両方の側面を単一のRNA種に組み込むように単一ガイドRNA(「sgRNA」あるいは単に「gNR
A」)を遺伝子操作することができる。例えばJinek M., Chylinski K., Fonfara I., Hau
er M., Doudna J.A., Charpentier E. Science 337:816-821(2012)参照(その内容全体が
参照により本明細書に組み込まれる)。Casタンパク質はCRISPR反復配列中の短いモチー
フ(PAMあるいはプロトスペーサー隣接モチーフ)を認識し、自己と非自己を区別するこ
とを助ける。CRISPR-Casタンパク質としては、Cas9、CasX、CasY、Cpf1、C2c1、およびC2
c3またはそれらの活性断片が挙げられるが、これらに限定されない。さらなる適切なCRIS
PR-Casタンパク質および配列は、本開示に基づいて当業者には明らかであろう。
【0076】
ヌクレアーゼ不活性化されたCRISPR-Casタンパク質は、互換的に「dCas」タンパク質(
ヌクレアーゼ「dead」Casの意)または触媒的に不活性なCasと呼ばれ得る。不活性なDNA
切断ドメインを有するCasタンパク質(またはその断片)を生成する方法は既知である(
例えばJinek et al., Science. 337:816-821(2012); Qi et al., “Repurposing CRISPR
as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression” (20
13) Cell. 28;152(5):1173-83参照。その内容全体が参照により本明細書に組み込まれる
。)。例えば、Cas9のDNA切断ドメインは、HNHヌクレアーゼサブドメインおよびRuvC1サ
ブドメインという2つのサブドメインを含むことが知られている。HNHサブドメインはgRNA
に相補的な鎖を切断する一方、RuvC1サブドメインは非相補的な鎖を切断する。これらの
サブドメイン内の変異はCas9のヌクレアーゼ活性を抑制する。例えば、突然変異D10Aおよ
びH840Aは、S. pyogenes Cas9のヌクレアーゼ活性を完全に不活化する(Jinek et al., S
cience. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013))。ある実施
形態において、Casヌクレアーゼは不活性な(例えば不活性化された)DNA切断ドメインを
有し、すなわちCasは「nCas」タンパク質と呼ばれるニッカーゼである(「nickase」Cas
の意)。Casバリアントは、CRISPR-Casタンパク質またはその断片と相同性を共有する。
例えば、Casバリアントは、野生型CRISPR-Casタンパク質に対して少なくとも約70%の同一
性、少なくとも約80%の同一性、少なくとも約90%の同一性、少なくとも約95%の同一性、
少なくとも約96%の同一性、少なくとも約97%の同一性、少なくとも約98%の同一性、少な
くとも約99%の同一性、少なくとも約99.5%の同一性、または少なくとも約99.9%の同一性
を有する。いくつかの実施形態において、Casバリアントは、野生型CRISPR-Casタンパク
質と比較して、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19
、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39
、40、41、42、43、44、45、46、47、48、49、50個またはそれ以上のアミノ酸変化を有し
得る。いくつかの実施形態において、Casバリアントは、その断片が野生型CRISPR-Casタ
ンパク質の対応する断片に対して少なくとも約70%の同一性、少なくとも約80%の同一性、
少なくとも約90%の同一性、少なくとも約95%の同一性、少なくとも約96%の同一性、少な
くとも約97%の同一性、少なくとも約98%の同一性、少なくとも約99%の同一性、少なくと
も約99.5%の同一性、または少なくとも約99.9%の同一性を有するようにCRISPR-Casタンパ
ク質の断片(例えばgRNAプログラミング可能DNA結合ドメインまたはDNA切断ドメイン)を
含む。ある態様において、該断片は、対応する野生型CRISPR-Casタンパク質のアミノ酸長
の少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少
なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なく
とも80%、少なくとも85%、少なくとも90%、少なくとも95% identical、少なくとも96%、
少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%である。ある態
様において、断片は、長さが少なくとも100アミノ酸である。ある態様において、断片は
、長さが少なくとも100、150、200、250、300、350、400、450、500、550、600、650、70
0、750、800、850、900、950、1000、1050、1100、1150、1200、1250、または少なくとも
1300アミノ酸である。
【0077】
本開示において、「含む(comprises)」、「含む(comprising)」、「含有する(con
taining)」、および「有する(having)」等は米国特許法に規定される意味を有するこ
とができ、「含む(includes)」、「含む(including)」等を意味し得、「~から本質
的に成る(consisting essentially of)」または「本質的に成る(consists essentiall
y)」も同様に、米国特許法に規定される意味を有し、該用語はオープンエンドであって
、記載されたものの基本的または新規な特性が、その記載されたものより他の存在によっ
て変えられない限り、記載されたものより他の存在を許容するが、ただし先行技術の実施
態様を除外する。
【0078】
「シチジンデアミナーゼ」とは、アミノ基をカルボニル基に変換する脱アミノ化反応を
触媒することができるポリペプチドまたはその断片を意味する。1つの実施形態において
、シチジンデアミナーゼは、シトシンをウラシルに、または5-メチルシトシンをチミンに
変換する。Petromyzon marinus由来のPmCDA1(Petromyzon marinus cytosine deaminase
1、「PmCDA1」)、哺乳動物(例えば、ヒト、ブタ、ウシ、ウマ、サル等)由来のAID(活
性化誘導シチジンデアミナーゼ; AICDA)、およびAPOBECは、例示的シチジンデアミナー
ゼである。
【0079】
PmCDA1の塩基配列およびアミノ酸配列、ならびにヒトAIDのCDSの塩基配列およびアミノ
酸配列を以下に示す。
【0080】
>tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus OX=7757 PE=2 SV
=1
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSG
TERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLK
IWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKT
LKRAEKRRSELSIMIQVKILHTTKSPAV
【0081】
>EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase mRNA, complet
e cds
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGA
CATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGA
GAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCA
TAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTG
AATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAAT
ACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGC
TGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGC
AAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGT
TGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATT
GAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATG
ATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
【0082】
>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX
=9606 GN=AICDA PE=2 SV=1
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
【0083】
>NG_011588.1:5001-15681 Homo sapiens activation induced cytidine deaminase (AICD
A), RefSeqGene (LRG_17) on chromosome 12
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTG
GACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAA
ATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGAT
CAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAAT
TCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTA
CTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTT
TAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAA
TTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTT
AGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTAT
GATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGG
CAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGG
TGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTA
TTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAAT
TTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACA
GGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAA
GTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAAT
GTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAA
ACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAA
AGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAA
GGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCA
GGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAG
CACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAG
GACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAA
AGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTA
GGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCT
TCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACAC
ACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGA
TGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGT
AAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAA
GCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGG
TTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTT
TTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTG
GAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGG
CCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATG
CATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGT
TTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAAC
AGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTT
GAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGG
CATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGG
TCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCA
AAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACT
TAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAAT
ATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACC
CCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAA
TGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAG
AGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTAC
AGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAA
GATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGG
GAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTG
GTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAA
AATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAA
AAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACT
TCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGC
ATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCT
TGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTT
CCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGG
AGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGC
AGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACT
AGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACA
CTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTAT
TCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTT
TGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTC
AAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATG
TTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGG
ATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGC
TCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATA
GGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGT
CAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGG
GCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCA
GATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCG
ACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAA
AGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCT
TCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTAT
TTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGG
GCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCA
ACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTG
CTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATA
TTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAAT
ATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTT
AATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTT
GGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCA
GGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCC
AAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATT
TTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTC
CGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCT
TTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGT
CAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCT
ATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAA
AATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAA
CAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAA
GCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGT
CTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCC
AAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCA
GAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTT
CCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCC
TAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTG
GCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATC
TCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTAC
TTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCT
TTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACA
ATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACA
AATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCC
ACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTG
TGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATC
ATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTC
TGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCC
TGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCC
GACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACC
GCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAA
AGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAAT
GAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAA
GATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGG
GTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTT
TTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCC
TGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCT
TCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTC
TTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTC
TGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCA
CATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTT
TTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTT
CCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTT
GAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACG
CATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAG
ACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTT
ACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTC
TGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACT
GCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGT
AGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTG
AGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAA
CTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCAT
CTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGT
ACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAAT
AAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGC
AAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATC
ATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGG
TCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCA
AAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCT
CATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGG
GCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTG
GCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGA
CCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGG
CACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCA
GTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAA
AAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAAT
TGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGT
CCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAG
CAACCCTTGCAATGAAGATGAGCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTA
TTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTG
CGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAA
ATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAA
GCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTA
AATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTAT
ATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
【0084】
アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様(APOBEC:Apolipoprotein B
mRNA editing enzyme, catalytic polypeptide-like)は、進化的に保存されたシチジン
デアミナーゼファミリーである。このファミリーのメンバーはCからUへの編集酵素である
。APOBEC様タンパク質のN末端ドメインは触媒ドメインであり、C末端ドメインは偽触媒ド
メインである。より具体的には、触媒ドメインは亜鉛依存性シチジンデアミナーゼドメイ
ンであり、シチジン脱アミノ化のために重要である。APOBECファミリーメンバーには、AP
OBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(今では「APOBEC3E」がこれ
を指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、および活性化誘導型(シチジン)
デアミナーゼが含まれる。限定するものではないが、SaBE3、SaKKH-BE3、VQR-BE3、EQR-B
E3、VRER-BE3、VRER-BE3、YE1-BE3、EE-BE3、YE2-BE3、およびYEE-BE3を含む多数の改変
シチジンデアミナーゼが市販されており、これらはAddgene社から入手可能である(プラ
スミド85169、85170、85171、85172、85173、85174、85175、85176、85177)。
【0085】
本開示の態様に従ってCas9に融合され得る他の例示的デアミナーゼが、以下に提供され
る。いくつかの実施形態において、それぞれの配列の活性ドメイン、例えば、局在化シグ
ナル(核局在化配列、核外搬出シグナル、細胞質局在化シグナル)を伴わないドメインが
使用され得ることが理解されるべきである。
【0086】
Human AID:
(下線:核局在化配列;二重下線:核外搬出シグナル)
【0087】
Mouse AID:
(下線:核局在化配列;二重下線:核外搬出シグナル)
【0088】
Canine AID:
(下線:核局在化配列;二重下線:核外搬出シグナル)
【0089】
Bovine AID:
(下線:核局在化配列;二重下線:核外搬出シグナル)
【0090】
Rat AID
(下線:核局在化配列;二重下線:核外搬出シグナル)
【0091】
Mouse APOBEC-3
(斜体:核酸編集ドメイン)
【0092】
Rat APOBEC-3 :
(斜体:核酸編集ドメイン)
【0093】
Rhesus macaque APOBEC-3 G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
【0094】
Chimpanzee APOBEC-3 G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
【0095】
Green monkey APOBEC-3G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
【0096】
Human APOBEC-3G:
(斜体:核酸編集ドメイン;下線:細胞質局在化シグナル)
【0097】
Human APOBEC-3F:
(斜体:核酸編集ドメイン)
【0098】
Human APOBEC-3B:
(斜体:核酸編集ドメイン)
【0099】
Rat APOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRK
QGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCR
LIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRY
YRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILR
IYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
【0100】
Bovine APOBEC-3B:
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQL
KQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHW
IKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
【0101】
Chimpanzee APOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQL
SAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENF
VYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCN
EAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYK
EALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGP
CLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWA
SVSKEGRDLG
【0102】
Human APOBEC-3C:
(斜体:核酸編集ドメイン)
【0103】
Gorilla APOBEC3C
(斜体:核酸編集ドメイン)
【0104】
Human APOBEC-3A:
(斜体:核酸編集ドメイン)
【0105】
Rhesus macaque APOBEC-3A:
(斜体:核酸編集ドメイン)
【0106】
Bovine APOBEC-3A:
(斜体:核酸編集ドメイン)
【0107】
Human APOBEC-3H:
(斜体:核酸編集ドメイン)
【0108】
Rhesus macaque APOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYL
TWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPS
EKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
【0109】
Human APOBEC-3D:
(斜体:核酸編集ドメイン)
【0110】
Human APOBEC-1 :
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSM
SCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYP
PGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
【0111】
Mouse APOBEC-1 :
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNT
RCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYP
PSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
【0112】
Rat APOBEC-1 :
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNT
RCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYS
PSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
【0113】
Human APOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKG
GQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEP
EIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
【0114】
Mouse APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKG
GQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEP
EVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
【0115】
Rat APOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKG
GQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEP
EVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
【0116】
Bovine APOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKG
GQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEP
EIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
【0117】
Petromyzon marinus CDA1 (pmCDAl)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLR
DNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCR
KIFIQSSHNQLNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
【0118】
Human APOBEC3G D316R D317R
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKL
HRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCW
SKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGF
LCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTC FTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRC
QEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
【0119】
Human APOBEC3G chain A
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDY
RVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISF TYSEFKHCWDTFVDHQGCP
FQPWDGLD EHSQDLSGRLRAILQ
【0120】
Human APOBEC3G chain A D120R D121R
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQD
YRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGC
PFQPWDGLDEHSQDLSGRLRAILQ
【0121】
用語「デアミナーゼ」または「デアミナーゼドメイン」は、脱アミノ化反応を触媒する
タンパク質またはその断片を指す。
【0122】
「検出する」とは、検出されるべき分析物の存在、不在または量を同定することを指す
。一実施形態において、ポリヌクレオチドまたはポリペプチドにおける配列変化が検出さ
れる。別の実施形態では、インデル(indel)の存在が検出される。
【0123】
「検出可能な標識」とは、目的の分子に連結されたときに、分光学的、光化学的、生化
学的、免疫化学的、または化学的手段を介してそれを検出可能にする組成物を意味する。
例えば、有用な標識には、放射性同位体、磁気ビーズ、金属ビーズ、コロイド粒子、蛍光
色素、高電子密度試薬、酵素(例えばELISAで一般的に使用されるもの)、ビオチン、ジゴ
キシゲニン、またはハプテンが含まれる。
【0124】
「疾患」とは、細胞、組織または器官の正常な機能を損傷または妨害する任意の状態ま
たは障害を意味する。特定の実施形態において、本発明の組成物による治療に適した疾患
は、点突然変異、スプライシング事象、未熟終止コドン、またはミスフォールディング事
象と関連する。
【0125】
「DNA結合タンパク質ドメイン」とは、DNAに結合するポリペプチドまたはその断片を意
味する。いくつかの実施形態において、DNA結合タンパク質ドメインは、配列特異的DNA結
合活性を有するジンクフィンガーまたはTALEドメインである。他の実施形態において、DN
A結合タンパク質ドメインは、DNAに結合するCRISPR-Casタンパク質のドメインであり(例
えばCas9)、例えば、プロトスペーサー隣接モチーフ (PAM) に結合するものを含む。あ
る態様において、DNA結合タンパク質ドメインは、ポリヌクレオチド(例えば、単一ガイド
RNA)と複合体を形成し、その複合体が、gRNAおよびプロトスペーサー隣接モチーフによっ
て特定されるDNA配列に結合する。ある態様において、DNA結合タンパク質ドメインは、ニ
ッカーゼ活性を含むか(例えばnCas9)、または触媒的に不活性である(例えばdCas9、ジ
ンクフィンガードメイン、TALE)。さらに他の実施形態において、DNA結合タンパク質ド
メインは、ホーミングエンドヌクレアーゼI-SceIの触媒的に不活性なバリアント、または
TALEタンパク質AvrBs4のDNA結合ドメインである。例えばGabsalilow et al., Nucleic Ac
ids Research, Volume 41, Issue 7, 1 April 2013, Pages e83参照。ある態様において
、DNA結合タンパク質ドメインは、触媒活性を有するドメイン(例えばFokI、MutH)に融
合される。特定の実施形態において、ジンクフィンガードメインは、エンドヌクレアーゼ
FokIの触媒ドメインに融合される。他の実施形態において、TALEが、部位特異的DNAニッ
キング活性を含むMutHに融合される。
【0126】
本明細書で使用される用語「有効量」は、所望の生物学的応答を誘発するのに十分な、
生物学的に活性な薬剤の量を指す。特定の実施形態において、有効量は、プラスミドでト
ランスフェクトされた細胞において活性塩基編集系を発現するのに十分な、塩基エディタ
ーシステムの部分を含む2つ以上のプラスミドの量である。当業者には理解されるように
、薬剤(例えば融合タンパク質)の有効量は、例えば望まれる生物学的応答、例えば編集
されるべき特定のアリル、ゲノム、または標的部位、標的化される細胞または組織、およ
び使用される薬剤など、様々な因子に応じて変動し得る。
【0127】
「断片」とは、ポリペプチドまたは核酸分子の一部を意味する。この部分は、参照核酸
分子またはポリペプチドの全長の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%
、または90%を含む。断片は、10、20、30、40、50、60、70、80、90、または100、200、3
00、400、500、600、700、800、900、または1000のヌクレオチドまたはアミノ酸を含み得
る。
【0128】
「ハイブリダイゼーション」は、相補的な核酸塩基間の水素結合を意味し、ワトソン-
クリック、フーグスティーンまたは逆フーグスティーン水素結合であり得る。たとえば、
アデニンとチミンは相補的な核酸塩基で、水素結合を形成して対を形成する。
【0129】
用語「塩基修復の阻害因子」または「IBR」とは、核酸修復酵素、例えば塩基除去修復
酵素の活性を阻害することができるタンパク質を指す。ある態様において、IBRは、イノ
シン塩基除去修復の阻害因子である。塩基修復の阻害因子の例としては、APE1、Endo III
、Endo IV、Endo V、Endo VIII、Fpg、hOGGl、hNEILl、T7 Endol、T4 PDG、UDG、hSMUGL
およびhAAGの阻害因子が挙げられる。ある実施形態では、IBRは、Endo VまたはhAAGの阻
害因子である。ある実施形態では、IBRは、触媒的に不活性なEndoVまたは触媒的に不活性
なhAAGである。
【0130】
「インテイン(intein)」は、それ自身を切り出してそして残った断片(エクステイン
(extein))をタンパク質スプライシングとして知られるプロセスにおいてペプチド結合
で連結することができるタンパク質の断片である。インテインは「タンパク質イントロン
」とも呼ばれる。インテインがそれ自身を切り出し、タンパク質の残りの部分を連結する
プロセスは、本明細書において、「タンパク質スプライシング」または「インテイン媒介
タンパク質スプライシング」と呼ばれる。ある態様において、前駆体タンパク質(インテ
イン媒介タンパク質スプライシングの前のインテイン含有タンパク質)のインテインは、
二つの遺伝子に由来する。そのようなインテインは、本明細書では分割(split)インテ
インと呼ばれる(例えば、分割インテイン-Nおよび分割インテイン-C)。たとえば、シア
ノバクテリアでは、DNAポリメラーゼIIIの触媒サブユニットaであるDnaEは2つの別々の遺
伝子dnaE-nおよびdnaE-cによってコードされている。dnaE-n遺伝子によってコードされる
インテインは本明細書において「インテインN」と称され得る。dnaE-c遺伝子によってコ
ードされるインテインは本明細書において「インテインC」と称され得る。
【0131】
他のインテイン系も使用され得る。例として、dnaEインテイン、すなわちCfa-N(例え
ば分割インテイン-N)およびCfa-C(例えば分割インテイン-C)のインテイン対に基づく
合成インテインが記述されている(例えば、参照により本明細書に組み入れられるSteven
s et al., J Am Chem Soc. 2016 Feb. 24; 138(7):2162-5)。本開示に従って使用するこ
とができるインテイン対の非限定的な例としては、Cfa DnaEインテイン、Ssp GyrBインテ
イン、Ssp DnaXインテイン、Ter DnaE3インテイン、Ter ThyXインテイン、Rma DnaBイン
テイン、およびCne Prp8インテイン(例えば、参照により本明細書に組み込まれる米国特
許第8,394,604号に記載のようなもの)が挙げられる。
【0132】
インテインの例示的なヌクレオチドおよびアミノ酸配列を提供する。
【0133】
DnaEインテイン-N DNA:TGCCTGTCATACGAAACCGAGATACTGACAGTAGAATATGGCCTTCTGCC AATCGGG
AAGATTGTGGAGAAACGGATAGAATGCACAGTTTACTCTGTCG ATAACAATGGTAACATTTATACTCAGCCAGTTGCCC
AGTGGCACGACCGG GGAGAGCAGGAAGTATTCGAATACTGTCTGGAGGATGGAAGTCTCATTAG GGCCACTAAGGACC
ACAAATTTATGACAGTCGATGGCCAGATGCTGCCTA TAGACGAAATCTTTGAGCGAGAGTTGGACCTCATGCGAGTTGA
CAACCTT CCTAAT
【0134】
DnaEインテイン-N タンパク質:CLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQPVAQWHDR
GEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNL PN
【0135】
DnaEインテイン-C DNA:ATGATCAAGATAGCTACAAGGAAGTATCTTGGCAAACAAAACGTTTATGA TATTGGA
GTCGAAAGAGATCACAACTTTGCTCTGAAGAACGGATTCATAG CTTCTAAT
【0136】
インテイン-C: MIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASN
【0137】
Cfa-N DNA:
TGCCTGTCTTATGATACCGAGATACTTACCGTTGAATATGGCTTCTTGCC TATTGGAAAGATTGTCGAAGAGAGAATTG
AATGCACAGTATATACTGTAG ACAAGAATGGTTTCGTTTACACACAGCCCATTGCTCAATGGCACAATCGC GGCGAAC
AAGAAGTATTTGAGTACTGTCTCGAGGATGGAAGCATCATACG AGCAACTAAAGATCATAAATTCATGACCACTGACGG
GCAGATGTTGCCAA TAGATGAGATATTCGAGCGGGGCTTGGATCTCAAACAAGTGGATGGATTG CCA
【0138】
Cfa-Nタンパク質:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNR GEQEVFEYCLEDGSIIRATKDHKFMTTDG
QMLPIDEIFERGLDLKQVDGL P
【0139】
Cfa-C DNA:
ATGAAGAGGACTGCCGATGGATCAGAGTTTGAATCTCCCAAGAAGAAGAG GAAAGTAAAGATAATATCTCGAAAAAGTC
TTGGTACCCAAAATGTCTATG ATATTGGAGTGGAGAAAGATCACAACTTCCTTCTCAAGAACGGTCTCGTA GCCAGCA
AC
【0140】
Cfa-Cタンパク質:MKRTADGSEFESPKKKRKVKIISRKSLGTQNVYDIGVEKDHNFLLKNGLV ASN
【0141】
分割Cas9のN末端部と分割Cas9のC末端部とを接合するために、インテインNおよびイン
テインCをそれぞれ分割Cas9のN末端部および分割Cas9のC末端部に融合させ得る。例えば
、いくつかの実施形態において、インテイン-Nが、分割されたCas9のN-末端部分のC-末端
に融合され、すなわち、N--[分割Cas9のN末端部分]-[インテイン-N]--Cの構造を形成する
。いくつかの実施形態において、インテイン-Cが、分割されたCas9のC-末端部分のN-末端
に融合され、すなわち、N-[インテイン-C]--[分割Cas9のC末端部分]-Cの構造を形成する
。インテインが融合されたところのタンパク質(例えば分割Cas9)を連結するためのイン
テイン媒介性タンパク質スプライシングの機構は、例えば、参照により本明細書に組み入
れられるShah et al., Chem Sci. 2014; 5(1):446-461に記載されているように、当該技
術分野において公知である。インテインを設計および使用する方法は当該技術分野で公知
であり、例えばWO2014004336、WO2017132580、US20150344549およびUS20180127780によっ
て記載されており、これらの各々はその全体が参照により本明細書に組み込まれる。
【0142】
用語「単離された」、「精製された」、または「生物学的に純粋な」とは、その天然状
態で見出される場合に通常それに付随する成分が、様々な程度まで除去されている物質を
指す。「単離」は、元の入手源又は周囲環境からの分離の程度を示す。「精製」は、単離
よりも高い分離度を示す。「精製された」又は「生物学的に純粋な」タンパク質は、不純
物がタンパク質の生物学的特性に実質的に影響を与えたり他の有害な結果を引き起こさな
いように、他の物質が十分に除去されている。すなわち、本発明の核酸またはペプチドは
、組換えDNA技術によって産生された場合には細胞物質、ウイルス物質または培地を実質
的に含まない場合、あるいは化学的に合成された場合には化学的前駆体その他の化学物質
を実質的に含まない場合には、精製されている。純度および均一性は、典型的には、分析
化学技術、例えば、ポリアクリルアミドゲル電気泳動または高速液体クロマトグラフィー
を用いて決定される。用語「精製された」は、核酸またはタンパク質が電気泳動ゲルにお
いて本質的に1つのバンドを生じることを意味し得る。修飾、例えば、リン酸化またはグ
リコシル化を受けることができるタンパク質については、異なる修飾は、別々に精製する
ことができる異なる単離されたタンパク質を生じ得る。
【0143】
「単離ポリヌクレオチド」とは、本発明の核酸分子が由来する生物の天然ゲノムにおい
て当該遺伝子に隣接する遺伝子を含まない核酸(例えばDNA)を意味する。したがって、こ
の用語は、例えば、ベクターに組み込まれた;自律的に複製するプラスミドやウイルスに
組み込まれた;原核生物や真核生物のゲノムDNAに組み込まれた;または他の配列とは独
立した別の分子(例えば、PCRまたは制限エンドヌクレアーゼ消化によって生成されたcDNA
またはゲノムもしくはcDNA断片)として存在する組換えDNAを含む。さらに、この用語は、
DNA分子から転写されるRNA分子、ならびに、さらなるポリペプチド配列をコードするハイ
ブリッド遺伝子の一部である組換えDNAを含む。
【0144】
「単離ポリペプチド」とは、天然状態で付随する成分から分離された本発明のポリペプ
チドを意味する。典型的には、ポリペプチドは、それが天然状態で会合しているタンパク
質および天然有機分子から重量で少なくとも60%フリーである場合に、単離されている。
好ましくは、調製物は、重量で少なくとも75%、より好ましくは少なくとも90%、そして最
も好ましくは少なくとも99%が本発明のポリペプチドである。本発明の単離されたポリペ
プチドは、例えば、天然源からの抽出、そのようなポリペプチドをコードする組換え核酸
の発現;または化学的にタンパク質を合成することにより得ることができる。純度は、任
意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動
、またはHPLC分析によって測定することができる。
【0145】
本明細書で使用される用語「リンカー」は、2つの分子または部分(例えば融合タンパ
ク質の2つのドメイン)を連結する結合(例えば共有結合)、化学基、または、分子を指
す。ある実施形態において、リンカーは、Cas9ヌクレアーゼドメインを含む、RNAプログ
ラミング可能ヌクレアーゼのgRNA結合ドメインと、核酸編集タンパク質の触媒ドメインと
を繋げる。ある態様において、リンカーは、dCas9と核酸編集タンパク質とを繋げる。典
型的には、リンカーは、2つの基、分子、または他の部分の間に配置されるか、またはそ
れらによって隣接され、共有結合を介して各々に連結され、かくしてそれら2つのものを
連結する。ある態様において、リンカーは、アミノ酸または複数のアミノ酸(例えば、ペ
プチドまたはタンパク質)である。ある態様において、リンカーは、有機の分子、基、ポ
リマー、または化学的部分である。ある態様において、リンカーは、長さが5~200アミノ
酸であり、例えば長さが5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20
、25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102
、103、104、105、110、120、130、140、150、160、175、180、190、または200アミノ酸
である。より長いまたはより短いリンカーも企図される。ある態様において、リンカーは
、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含む。ある態様において
、リンカーは、アミノ酸配列SGGSを含む。ある態様において、リンカーは、(SGGS)n、(GG
GS)n、(GGGGS) n、(G)n、(EAAAK)n、(GGS)n、SGSETPGTSESATPES、もしくは(XP)nモチーフ
、またはこれらのいずれかの組合せを含み、ここで、nは独立して1~30の整数であり、X
は任意のアミノ酸である。いくつかの実施形態において、nは1、2、3、4、5、6、7、8、9
、10、11、12、13、14、または15である。
【0146】
いくつかの実施形態において、核酸塩基エディターのドメインは、SGGSSGSETPGTSESATP
ESSGGS、SGGSSGGSSGSETPGTSESATPESSGGSSGGS、またはGGSGGSPGSPAGSPTSTEEGTSESATPESGPG
TSTEPSEGSAPGSPAGSPTSTEEGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGSのアミ
ノ酸配列を含むリンカーを介して融合される。いくつかの実施形態において、核酸塩基エ
ディターのドメインは、XTENリンカーとも呼ばれ得るアミノ酸配列SGSETPGTSESATPESを含
むリンカーを介して融合される。ある態様において、リンカーは、長さが24アミノ酸であ
る。ある態様において、リンカーは、アミノ酸配列SGGSSGGSSGSETPGTSESATPESを含む。あ
る態様において、リンカーは、長さが40アミノ酸である。ある態様において、リンカーは
、アミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSを含む。ある態様において、
リンカーは、長さが64アミノ酸である。ある態様において、リンカーは、アミノ酸配列SG
GSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGS SGGSを含む。ある態様
において、リンカーは、長さが92アミノ酸である。ある態様において、リンカーは、アミ
ノ酸配列PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGS
APGTSESATPESGPGSEPATSを含む。
【0147】
「マーカー」とは、疾患または障害に関連する発現レベルまたは活性の変化を有する任
意のタンパク質またはポリヌクレオチドを意味する。
【0148】
本明細書中で使用される場合、用語「変異」とは、配列内、例えば核酸もしくはアミノ
酸配列内の残基が、別の残基により置換されること、または配列内の1以上の残基の欠失
もしくは挿入をいう。変異は、本明細書中において典型的には、元の残基を同定し、次い
で配列内の残基の位置を同定し、そして新たに置換された残基を同定することによって、
記載される。本明細書中に提供されるアミノ酸置換 (変異) を作製するための種々の方法
は、当該技術分野においてよく知られており、例えば、Green and Sambrook, Molecular
Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold
Spring Harbor, N.Y. (2012))によって提供されている。
【0149】
本明細書中で使用される場合、用語「核酸」および「核酸分子」とは、核酸塩基および
酸性部分を含む化合物、例えばヌクレオシド、ヌクレオチド、またはヌクレオチドのポリ
マーをいう。典型的には、ポリマー核酸、例えば3つ以上のヌクレオチドを含む核酸分子
は、隣接するヌクレオチドがホスホジエステル結合を介して互いに連結されている直鎖分
子である。ある態様において、「核酸」は、個々の核酸残基(例えばヌクレオチドおよび/
またはヌクレオシド)を指す。ある態様において、「核酸」は、三つ以上の個々のヌクレ
オチド残基を含むオリゴヌクレオチド鎖をいう。本明細書中で使用される、用語「オリゴ
ヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのポリマー(例えば少な
くとも3つのヌクレオチドの鎖)を指すために交換可能に使用され得る。ある態様において
、「核酸」は、RNAならびに一本鎖および/または二本鎖DNAを包含する。核酸は、例えば
、ゲノム、転写物、mRNA、tRNA、rRNA、siRNA、snRNA、プラスミド、コスミド、染色体、
染色分体、または他の天然に存在する核酸分子との関連において、天然に存在し得る。他
方、核酸分子は、例えば非天然に存在する分子、組換えDNAもしくはRNA、人工染色体、操
作されたゲノム、もしくはその断片、または合成DNA、RNA、DNA/RNAハイブリッド、また
は非天然に存在するヌクレオチドもしくはヌクレオシドを含む、非天然に存在する分子で
あり得る。さらに、用語「核酸」、「DNA」、「RNA」、および/または類似の用語は、核
酸アナログ、例えばホスホジエステル骨格以外を有するアナログを含む。核酸は、天然源
から精製される、組換え発現系を用いて産生され必要に応じて精製される、化学的に合成
される、等が可能である。化学的に合成された分子の場合、核酸は、適切な場合には、例
えば、化学的に修飾された塩基または糖、および骨格修飾を有するアナログなどのヌクレ
オシドアナログを含み得る。核酸配列は、特に示されない限り、5’~3’方向に示される
。ある態様において、核酸は、天然ヌクレオシド(例えばアデノシン、チミジン、グアノ
シン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシ
ン、およびデオキシシチジン);ヌクレオシド類似体(例えば2-アミノアデノシン、2-チ
オチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、2
-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5
-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノ
シン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアニ
ン、O(6)-メチルグアニン、および2-チオシチジン);化学修飾塩基;生物学的に修飾さ
れた塩基(例えばメチル化塩基);挿入塩基;修飾糖(例えば2’-フルオロリボース、リ
ボース、2’-デオキシリボース、アラビノース、およびヘキソース);および/または修
飾リン酸基(例えばホスホロチオエートおよび5’-N-ホスホロアミダイト結合)であるか
、またはそれらを含む。
【0150】
「核局在化配列」、「核局在化シグナル」または「NLS」という用語は、タンパク質の
細胞核への移入を促進するアミノ酸配列を意味する。核局在化配列は当該技術分野におい
て公知であり、例えば、2000年11月23日に出願され2001年5月31日にWO/2001/038547とし
て公開された国際PCT出願PCT/EP 2000/011690のPlank et al.に記載されており、その内
容は、例示的な核局在化配列の開示について参照により本明細書に組み入れられる。他の
実施形態では、NLSは、例えばKoblan et al., Nature Biotech. 2018 doi:10.1038/nbt.4
172によって記載された、最適化されたNLSである。ある態様において、NLSは、アミノ酸
配列KRTADGSEFESPKKKRKV、KRPAATKKAGQAKKKK、KKTELQTTNAENKTKKL、KRGINDRNFWRGENGRKTR
、RKSGKIAAIVVKRPRK、PKKKRKV、またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。
【0151】
用語「核酸プログラミング可能なDNA結合タンパク質」あるいは「napDNAbp」は、napDN
Abpを特定の核酸配列に誘導するガイド核酸などの核酸(例えばDNAまたはRNA)と会合す
るタンパク質を表す。例えば、Cas9タンパク質は、そのCas9タンパク質をガイドRNAに相
補的な特異的DNA配列へと誘導するガイドRNAと結合し得る。いくつかの実施形態において
、napDNAbpは、Cas9ドメインであり、例えば、ヌクレアーゼ活性Cas9、Cas9ニッカーゼ(
nCas9)、またはヌクレアーゼ不活Cas9(dCas9)である。核酸プログラミング可能なDNA
結合タンパク質の例としては、Cas9(例えばdCas9およびnCas9)、CasX、CasY、Cpf1、C2
c1、およびC2c3が挙げられるが、これらに限定されない。他の核酸プログラミング可能DN
A結合タンパク質も、本開示に具体的に列記されていないとしても本開示の範囲内である
。
【0152】
本明細書で使用される場合、「薬剤を取得する」におけるような「取得する」は、その
薬剤を合成すること、購入すること、または他の方法で獲得することを含む。
【0153】
本明細書で使用される「患者」または「対象」は、疾患または障害と診断されている、
またはそれらを有するかもしくは生ずる疑いがある、例えば哺乳動物対象などの対象を指
す。ある態様において、用語「患者」は、疾患または障害を生ずる可能性が平均より高い
哺乳動物対象を指す。例示的な患者は、ヒト、ヒト以外の霊長類、ネコ、イヌ、ブタ、ウ
シ、ネコ、ウマ、ヤギ、ヒツジ、齧歯類(例えば、マウス、ウサギ、ラット、モルモット)
および本明細書に開示される治療から利益を得ることができる他の哺乳動物であり得る。
例示的なヒト患者は、男性および/または女性であり得る。「それを必要とする患者」ま
たは「それを必要とする対象」は、本明細書では、疾患または障害を有すると診断された
またはその疑いがある患者として言及される。
【0154】
用語「RNAプログラム可能なヌクレアーゼ」および「RNA誘導ヌクレアーゼ」は、切断の
標的ではない一つ以上のRNAをとともに使用される(例えば、それに結合または付随する)
。ある態様において、RNAプログラム可能ヌクレアーゼは、RNAと複合体である場合、ヌク
レアーゼ:RNA複合体と称され得る。典型的には、結合したRNAはガイドRNA (gRNA) と呼ば
れる。gRNAは2個以上のRNAの複合体として存在することもあれば、1個のRNA分子として存
在することもある。単一のRNA分子として存在するgRNAは、単一ガイドRNA(sgRNA)と呼
ばれることがあるが、 「gRNA」は、単一の分子として、または2つ以上の分子の複合体と
して存在するガイドRNAを指すために互換的に使用される。典型的には、単一のRNA種とし
て存在するgRNAは、(1) 標的核酸と相同性を共有するドメイン(例えば、標的へのCas9複
合体の結合を指示する);および(2) Cas9タンパク質に結合するドメインという二つのド
メインを含む。ある態様において、ドメイン (2) は、tracrRNAとして知られる配列に対
応し、ステム-ループ構造を含む。例えば、いくつかの態様において、ドメイン (2) は、
Jinek et al., Science 337:816-821(2012)(その全内容が参照により本明細書に組み入
れられる)に提供されるようなtracrRNAと同一または相同である。gRNA (例えばドメイン
2を含むもの)の他の例は、「Switchable Cas9 Nucleases and Uses Thereof」と題され20
13年9月6日に出願された米国仮特許出願U.S.S.N.61/874,682および「Delivery System Fo
r Functional Nucleases」と題され2013年9月6日に出願された米国仮特許出願U.S.S.N.61
/874,746に見出され得、それら各々の全内容が参照により本明細書に組み入れられる。い
くつかの実施形態において、gRNAは、ドメイン (1) および (2) の二つ以上を含み、「伸
長されたgRNA」と称され得る。例として、伸長されたgRNAは、本明細書に記載されるよう
に、例えば二つ以上のCas9タンパク質と結合し、二つ以上の異なる領域における標的核酸
と結合する。gRNAは、標的部位を相補するヌクレオチド配列を含み、これが上記標的部位
へのヌクレアーゼ/RNA複合体の結合を媒介し、ヌクレアーゼ:RNA複合体の配列特異性を
提供する。ある態様において、RNAプログラム可能ヌクレアーゼは、(CRISPR関連システム
) Cas9エンドヌクレアーゼ、例えば、Streptococcus pyogenes由来のCas9 (Csnl) である
(例えば、"Complete genome sequence of an Ml strain of Streptococcus pyogenes."
Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux
C, Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Na
jar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., Mc
Laughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA mat
uration by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chy
linski K., Sharma CM., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J.
, Charpentier E., Nature 471:602-607(2011)参照)。
【0155】
タンパク質または核酸に関連して本明細書中で使用される用語「組み換え体」とは、自
然界には存在しないが、人間の工学の産物であるタンパク質または核酸を指す。例えば、
いくつかの実施形態において、組換えタンパク質または核酸分子は、任意の天然に存在す
る配列と比較して、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少
なくとも5つ、少なくとも6つ、または少なくとも7つの変異を含むアミノ酸またはヌクレ
オチド配列を含む。
【0156】
「減少する」とは、少なくとも10%、25%、50%、75%、または100%の負の変化を意味する
。
【0157】
「参照」とは、標準または対照の条件を意味する。一実施形態において、参照は、イン
テイン依存性再構築のためのインテインを含む断片において発現される核酸塩基エディタ
ーと同じ条件下で同じ細胞内で、単一プラスミドにおいて発現される、全長核酸塩基エデ
ィターの活性である。
【0158】
「参照配列」は、配列比較の基礎として使用される定義済み配列である。参照配列は、
特定の配列のサブセット又は全体であり得る;例えば、完全長のcDNAもしくは遺伝子配列
のセグメント、または完全なcDNAまたは遺伝子配列。ポリペプチドについては、参照ポリ
ペプチド配列の長さは、一般に、少なくとも約16アミノ酸、少なくとも約20アミノ酸、少
なくとも約25アミノ酸、さらにより好ましくは約35アミノ酸、約50アミノ酸、または約10
0アミノ酸である。核酸については、参照核酸配列の長さは、一般に、少なくとも約50ヌ
クレオチド、少なくとも約60ヌクレオチド、少なくとも約75ヌクレオチド、約100ヌクレ
オチドまたは約300ヌクレオチドまたはそれらの周辺もしくはそれらの間の任意の整数で
ある。
【0159】
用語「一塩基多型 (SNP)」は、ゲノム中の特定の位置で起こる単一ヌクレオチドの変異
であり、ここで、各変異は集団内で認識できるある程度(例>1%)まで存在する。たとえば
、ヒトゲノムの特定の塩基位置では、ほとんどの個体でCヌクレオチドが出現しうるが、
少数の個体ではその位置がAで占められている。これは、この特定の位置にSNPがあり、C
またはAという2つのヌクレオチドのバリエーションがこの位置のアリルであるという。SN
Pは疾患に対する感受性の差の根底にある。病気の重症度や治療に対する体の反応も、遺
伝的バリエーションの表れである。SNPは、遺伝子のコード領域、遺伝子の非コード領域
、または遺伝子間領域(遺伝子と遺伝子の間の領域)に存在しうる。ある態様において、コ
ード配列内のSNPは、遺伝子コードの縮重のために、産生されるタンパク質のアミノ酸配
列を必ずしも変化させない。コード領域のSNPには、同義SNPと非同義SNPの2種類がある。
同義SNPはタンパク質配列に影響しないが、非同義SNPはタンパク質のアミノ酸配列を変化
させる。非同義SNPにはミスセンスとナンセンスの2種類がある。タンパク質をコードする
領域にないSNPは、遺伝子のスプライシング、転写因子の結合、メッセンジャーRNAの分解
、または非コードRNAの配列に影響を与えることがある。この種のSNPによって影響を受け
る遺伝子発現はeSNP (発現SNP)と呼ばれ、遺伝子の上流または下流にあり得る。一塩基バ
リアント (SNV) は、頻度に制限のない一塩基のバリエーションであり、体細胞で生じ得
る。体細胞一塩基バリエーションは一塩基改変とも呼ばれ得る。
【0160】
「特異的に結合する」とは、本発明のポリペプチドおよび/または核酸分子を認識およ
び結合するが、試料(例えば生物学的試料)中の他の分子を実質的に認識および結合しな
い核酸分子、ポリペプチド、もしくはそれらの複合体(例えば、核酸プログラム可能なDN
A結合ドメインおよびガイド核酸)、化合物、または分子を意味する。
【0161】
本発明の方法において有用な核酸分子は、本発明のポリペプチドまたはその断片をコー
ドする任意の核酸分子を含む。そのような核酸分子は、内因性核酸配列と100%同一である
必要はないが、典型的には実質的同一性を示す。内因性配列に対して「実質的同一性」を
有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少なくとも一つの鎖とハイブ
リダイズすることができる。本発明の方法において有用な核酸分子は、本発明のポリペプ
チドまたはその断片をコードする任意の核酸分子を含む。そのような核酸分子は、内因性
核酸配列と100%同一である必要はないが、典型的には実質的同一性を示す。内因性配列に
対して「実質的同一性」を有するポリヌクレオチドは、典型的には、二本鎖核酸分子の少
なくとも一つの鎖とハイブリダイズすることができる。「ハイブリダイズする」とは、種
々のストリンジェンシー条件下で相補的ポリヌクレオチド配列(例えば、本明細書に記載
の遺伝子)の間、またはその一部の間に二本鎖分子を形成する対をなすことを意味する。(
例えばWahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R
. (1987) Methods Enzymol. 152:507参照)。
【0162】
例えば、ストリンジェントな塩濃度は、通常、約750 mM未満 NaClおよび75 mMクエン酸
三ナトリウム、好ましくは約500 mM未満 NaClおよび50 mMクエン酸三ナトリウム、より好
ましくは約250 mM未満 NaClおよび25 mMクエン酸三ナトリウムである。低ストリンジェン
シーハイブリダイゼーションは、有機溶媒、例えばホルムアミドの非存在下で得ることが
でき、一方、高ストリンジェンシーハイブリダイゼーションは、少なくとも約35%ホルム
アミド、より好ましくは少なくとも約50%ホルムアミドの存在下で得ることができる。ス
トリンジェントな温度条件は、通常、少なくとも約30℃、より好ましくは少なくとも約37
℃、最も好ましくは少なくとも約42℃の温度を含むであろう。ハイブリダイゼーション時
間、界面活性剤 (例えば、ドデシル硫酸ナトリウム (SDS) ) の濃度、および担体DNAの含
入または排除などの様々な追加のパラメーターは、当業者によく知られている。必要に応
じてこれら様々な条件を組み合わせることによって、様々なレベルのストリンジェンシー
が達成される。一実施形態では、ハイブリダイゼーションは、30℃で、750 mM NaCl、75
mMクエン酸三ナトリウムおよび1% SDS中で起こる。別の実施形態では、ハイブリダイゼー
ションは、37℃で、500 mM NaCl、50 mMクエン酸三ナトリウム、1% SDS、35%ホルムアミ
ドおよび100. μg/ml変性サケ精子DNA (ssDNA) 中で起こる。別の実施形態において、ハ
イブリダイゼーションは、42℃において、250 mM NaCl、25 mMクエン酸三ナトリウム、1%
SDS、50%ホルムアミドおよび200μg/ml ssDNA中で起こる。これらの条件の有用なバリエ
ーションは、当業者には容易に明らかになるであろう。
【0163】
ほとんどの用途では、ハイブリダイゼーションに続く洗浄工程もまた、ストリンジェン
シーが異なる。洗浄ストリンジェンシー条件は、塩濃度および温度によって定義すること
ができる。上記のように、洗浄ストリンジェンシーは、塩濃度を低下させるか、または温
度を上昇させることによって増加させることができる。例えば、洗浄工程のためのストリ
ンジェントな塩濃度は、好ましくは約30 mM未満NaClおよび3 mMクエン酸三ナトリウムで
あり、最も好ましくは約15 mM未満 NaClおよび1.5 mMクエン酸三ナトリウムである。洗浄
工程のためのストリンジェントな温度条件は、通常、少なくとも約25℃、より好ましくは
少なくとも約42℃、さらにより好ましくは少なくとも約68℃の温度を含む。一実施形態に
おいて、洗浄工程は、25℃で、30 mM NaCl、3 mMクエン酸三ナトリウム、および0.1% SDS
中で行われる。より好ましい実施形態において、洗浄工程は、42℃で、15 mM NaCl、1.5
mMクエン酸三ナトリウム、および0.1% SDS中で行われる。より好ましい実施形態において
、洗浄工程は、68℃で、15 mM NaCl、1.5 mMクエン酸三ナトリウム、および0.1% SDS中で
行われる。これらの条件のさらなるバリエーションは、当業者には容易に明らかになるで
あろう。ハイブリダイゼーション技術は、当業者によくしられており、例えば、Benton a
nd Davis (Science 196:180, 1977); Grunstein and Hogness (Proc. Natl. Acad. Sci.,
USA 72:3961, 1975); Ausubel et al. (Current Protocols in Molecular Biology, Wil
ey Interscience, New York, 2001); Berger and Kimmel (Guide to Molecular Cloning
Techniques, 1987, Academic Press, New York); および Sambrook et al., Molecular C
loning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New Yorkに記述
されている。
【0164】
「分割(split)」とは、2つ以上の断片に分割されることを意味する。
【0165】
「分割されたCas9タンパク質」あるいは「分割Cas9」とは、二つの別個のヌクレオチド
配列によってコードされるN末端断片およびC末端断片として提供されるCas9タンパク質を
いう。Cas9タンパク質のN末端部分およびC末端部分に対応するポリペプチドは、スプライ
スされて「再構成」Cas9タンパク質を形成することができる。特定の実施形態において、
Cas9タンパク質は、例えば、Nishimasu et al., Cell, Volume 156, Issue 5, pp. 935-9
49, 2014に記載されるように、またはJiang et al. (2016) Science 351: 867-871. PDB
file: 5F9Rに記載されるように(それぞれ参照により本明細書に組み込まれる)、タン
パク質の非秩序的な領域内で2つの断片に分割される。非秩序的領域は、X線結晶学、NMR
分光法、電子顕微鏡法(例えばクライオEM)、および/またはin silicoタンパク質モデリ
ングを含むがこれらに限定されない、当技術分野で公知の1以上のタンパク質構造決定技
術によって決定され得る。いくつかの実施形態において、タンパク質は、SpCas9のおよそ
アミノ酸A292-G364、F445-K483、もしくはE565-T637の間の領域内の任意のC、T、A、もし
くはSにおいて、または任意の他のCas9、Cas9バリアント(例えばnCas9、dCas9)、もし
くは他のnapDNAbpにおける対応位置において、二つの断片に分割される。ある態様におい
て、タンパク質は、SpCas9 T310、T313、A456、S469、またはC574において2つの断片に分
割される。いくつかの実施形態において、タンパク質を2つの断片に分割するプロセスは
、タンパク質を「分割(スプリッティング)する」と称される。
【0166】
「実質的に同一である」とは、参照アミノ酸配列(例えば、本明細書に記載のアミノ酸
配列のいずれか1つ)または核酸配列(例えば、本明細書に記載の核酸配列のいずれか1つ)
に対して少なくとも50%の同一性を示すポリペプチドまたは核酸分子を意味する。一実施
形態において、そのような配列は、比較のために使用される配列とアミノ酸レベルまたは
核酸において少なくとも60%、80%または85%、90%、95%または99%までもの同一性を有する
。
【0167】
配列同一性は、典型的には、配列解析ソフトウェア(例えば、Genetics Computer Group
, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison,
Wis. 53705のSequence Analysis Software Package、BLAST、BESTFIT、GAP、またはPILE
UP/PRETTYBOXプログラム)を用いて測定される。そのようなソフトウェアは、種々の置換
、欠失、および/または他の改変に相同性の程度を割り当てることによって、同一または
類似の配列をマッチさせる。保存的置換は、典型的には、以下の群内の置換を含む:グリ
シン、アラニン;バリン、イソロイシン、ロイシン;アスパラギン酸、グルタミン酸、ア
スパラギン、グルタミン;セリン、トレオニン;リジン、アルギニン;フェニルアラニン
、チロシン。同一性の程度を決定するための例示的なアプローチにおいて、BLASTプログ
ラムを使用することができ、e -3とe -100の間の確率スコアが密接に関連した配列を示す
。
【0168】
「対象」とは、限定されるものではないが、ウシ、ウマ、イヌ、ヒツジまたはネコなど
のヒトまたは非ヒト哺乳動物を含む哺乳動物を意味する。対象は、家畜、労働力を生じ食
料などの商品を供給するために飼育される飼育動物を含み、ウシ、ヤギ、ニワトリ、ウマ
、ブタ、ウサギ、およびヒツジを含むが、これらに限定されない。
【0169】
用語「標的部位」とは、核酸分子内の配列であって、核酸塩基エディターによって改変
される配列をいう。一実施形態において、標的部位は、デアミナーゼまたはそれを含む融
合タンパク質(例えば、シチジンまたはアデニンデアミナーゼ)によって脱アミノ化され
る。
【0170】
RNAプログラム可能なヌクレアーゼ(例:Cas9)は、DNA切断部位を標的とするためにRNA:D
NAハイブリダイゼーションを使用するので、これらのタンパク質は、原理的に、ガイドRN
Aによって指定されるあらゆる配列を標的とすることができる。部位特異的切断のためにC
as9のようなRNAプログラム可能なヌクレアーゼを使用する方法(例えばゲノムを改変する
ために)は、当該技術分野において公知である(例えば、Cong, L. et al., Multiplex gen
ome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P.
et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013
); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas
system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programme
d genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., G
enome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic
acids research (2013); Jiang, W. et al., RNA-guided editing of bacterial genomes
using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)を参照。これら
の各々の全内容は参照により本明細書に組み入れられる)。
【0171】
本明細書で提供される範囲は、範囲内のすべての値についての省略形であると理解され
る。例えば、1~50の範囲は、1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16
, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36
, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, または 50からなる群からの
任意の数、数の組み合わせ、またはサブ範囲を含むと理解される。
【0172】
本明細書中で使用される、用語「治療する(treat)」、「治療する(treating)」、「治
療(treatment)」 などは、障害および/またはそれに関連する症状を軽減もしくは改善す
ることを指す。障害または状態を治療することは、関連する障害、状態または症状を完全
に除去することを必要としないことが理解されるであろう(完全な除去が除外されるわけ
でもない)。
【0173】
用語「ウラシルグリコシラーゼ阻害剤」または「UGI」は、本明細書中で使用される場
合、ウラシル-DNAグリコシラーゼ塩基除去修復酵素を阻害することができるタンパク質を
指す。ある態様において、UGIドメインは、野生型UGIまたはその改変版を含む。いくつか
の実施形態において、本明細書で提供されるUGIタンパク質は、UGIの断片、およびUGIま
たはUGI断片と相同的なタンパク質を含む。例えば、いくつかの実施形態において、UGIド
メインは、下記に提供されるアミノ酸配列の断片を含む。いくつかの実施形態において、
UGI断片は、本明細書に提供される例示的UGI配列の少なくとも60%、少なくとも65%、少な
くとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくと
も95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%を
含むアミノ酸配列を含む。ある態様において、UGIは、本明細書において下記に提供する
アミノ酸配列と相同的なアミノ酸配列、または本明細書において下記に提供するアミノ酸
配列の断片と相同的なアミノ酸配列を含む。いくつかの実施形態において、UGIもしくはU
GIの断片、またはUGIもしくはUGIの断片のホモログを含むタンパク質は、「UGIバリアン
ト」と称される。UGIバリアントは、UGI又はその断片と相同性を有する。例えば、UGIバ
リアントは、野生型UGIまたは本明細書に記載のUGIに対して少なくとも70%の同一性、少
なくとも75%の同一性、少なくとも80%の同一性、少なくとも85%の同一性、少なくとも90%
の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、
少なくとも98%の同一性、少なくとも99%の同一性、少なくとも99.5%の同一性、または少
なくとも99.9%の同一性を有する。いくつかの実施形態において、UGIバリアントは、UGI
の断片を含み、その断片は、野生型UGIまたは下記に提供されるUGIの対応する断片に対し
て、少なくとも70%の同一性、少なくとも80%の同一性、少なくとも90%の同一性、少なく
とも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同
一性、少なくとも99%の同一性、少なくとも99.5%の同一性、または少なくとも99.9%の同
一性を有する。ある態様において、UGIは、以下のアミノ酸配列を含む:
>splP14739IUNGI_BPPB2 Uracil-DNA glycosylase inhibitor
MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLT S D APE YKPW ALVIQDS
NGENKIKML
【0174】
特に述べない限り、または文脈から明白でない限り、本明細書で使用されるところの「
または」という用語は、包括的であると理解される。特に述べない限り、または文脈から
明らかでない限り、本明細書で使用されるところの用語「a」、「an」および「the」は、
単数または複数であると理解される。
【0175】
特に述べない限り、または文脈から明らかでない限り、本明細書で使用されるところの
用語「約」は、当技術分野における通常の許容範囲内、例えば平均値の2標準偏差内にあ
ると理解される。約は、記載された値の10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5
%、0.1%、0.05%、または0.01%以内と理解され得る。文脈から特に明らかでない限り、本
明細書で提供される全ての数値は、約という用語によって修飾される。
【0176】
本明細書における可変因子の定義における化学基のリストの記載は、いずれかの単一の
基またはリストされた基の組合せとしてのその可変因子の定義を含む。本明細書における
可変因子または態様に関する実施形態の記載は、いずれかの単一の実施形態としての、ま
たは任意の他の実施形態もしくはその一部と組み合わせられた、その実施形態を含む。
【0177】
本明細書に提供される組成物または方法は、本明細書に提供される他の任意の組成物お
よび方法の1つ以上と組み合わせることができる。
【図面の簡単な説明】
【0178】
【
図1】
図1は、2つのアデノシンデアミナーゼドメインである野生型 (wt) TadAおよび進化 (evo) 型のTadAが、C末端二部分核局在化シグナル (NLS) を有するS. pyogenes (Sp) Cas9ニッカーゼ (nCas9) に融合されたものを含む、A→G塩基エディター (ABE) 融合タンパク質核酸塩基エディターの模式図である。この模式図はまた、分割インテイン系を用いて再構成され得るN-およびC末端断片に融合タンパク質が分割され得る(すなわち、インテイン-Nおよびインテイン-CをそれぞれN末端断片およびC末端断片に融合して)、構造化されていないCas9タンパク質の3つの領域を同定している。
【0179】
【
図2】
図2は、
図1に記載された融合タンパク質を再現し、スプライスされたnCas9を含む核酸塩基エディター融合タンパク質(すなわちABE)を含む塩基編集システムの塩基編集活性を定量化する3つのグラフを提供する。ABEは示されたアミノ酸位置で分割された(例えば、SpCas9アミノ酸配列に関してT310、T313、A456、S469、およびC574)。ABEのN‐及びC‐末端断片をそれぞれインテイン‐N及びインテイン‐Cに融合した。これらの断片および示されたガイドRNAは、それぞれ、5882G>A突然変異を有するABCA4遺伝子を有するタンパク質を発現する培養HEK293細胞中の別々のプラスミド上で発現された。ABCA4 5882A>G標的に対する、再構成されたABEの塩基編集活性を、対照ABEの活性と比較した。塩基編集活性は、ABEのN末端断片およびC末端断片の両方の存在に依存していた。ABEのN末端断片またはC末端断片のうちの一方のみが発現された場合には、塩基編集活性は観察されなかった。
【0180】
【
図3】
図3は、
図2で説明した21 ntガイドによる塩基編集活性を確認するグラフである。
図3の実験は、
図2の実験とは異なるフォーマットで行われたことに留意されたい。再構成された全てのABEは良好な塩基編集活性を示した。この活性は、nCas9のN‐およびC‐末端断片の両方の存在に依存した。nCas9のN‐またはC‐末端断片のみを発現した場合、活性は観察されなかった。再構成ABEの活性を、対照ABE7.09およびABE7.10融合タンパク質の活性と比較した。
【0181】
【
図4】
図4は、
図2で説明した塩基編集活性を定量化するグラフである。
図4において、ハンマーリボザイム (HRz) を含む20ヌクレオチド (nt) ガイドRNAを使用した。種々の再構成ABEの活性を対照ABE7.09およびABE7.10融合タンパク質の活性と比較した。
【0182】
【
図5】
図5A~5Dは、ARPE-19細胞のAAV2共感染についての感染多重度 (MOI) の決定を示す。
図5Aは、種々のウイルス負荷 (vg/細胞) におけるAAV2/CMV-mCherryおよびAAV2/CMV-EmGFPの1:1同時感染を示すグラフである。
図5Bは、EmGFP (左) およびmCherry (中央) を検出する蛍光画像、ならびにEmGFPとmCherryの共局在を示す重ね合わせ画像 (右) を示す。
図5Cは、AAV2/CMV-mCherryで感染された場合の様々なウイルス負荷 (vg/細胞) における、mCherryを発現する細胞の割合を示すグラフである。
図5Dは、AAV2/EmGFPで感染された場合の様々なウイルス負荷 (vg/細胞)における、EmGFPを発現する細胞の割合を示すグラフである。
【0183】
【
図6】
図6は、二重AAV2感染を介するARPE-19細胞への分割エディターの送達が、ABCA4 5882Aにおいて高いA>G変換率を生じることを示す一連のグラフである。20,000 vg/細胞(左上);30,000 vg/細胞(右上);40,000 vg/細胞(左下);6万 vg/細胞(右下)の二重感染の感染多重度(MOI)が示されている。
【発明を実施するための形態】
【0184】
以下に説明するように、本発明は、塩基編集システムを送達するための組成物および方
法を提供する。本発明は、AからGへの核酸塩基エディター (ABE) が、分割インテインを
用いて「分割」され再構成され得るという発見に少なくとも部分的に基づく。分割インテ
イン対のインテイン-Nおよびインテイン-Cにそれぞれ融合されたABEのN-およびC末端断片
をコードするポリヌクレオチドが、別々のベクター上で、単一ガイドRNAと共に細胞に送
達された。コードされたABE断片は、一緒にスプライシングされて、核酸配列の標的化さ
れた編集のためにとりわけ有用な機能的な核酸塩基エディター融合タンパク質を再構成し
た。
【0185】
[インテイン]
インテイン(intervening protein)は、多種多様な生物に見出される自己プロセシン
グドメインであり、タンパク質スプライシングとして知られるプロセスを行うものである
。タンパク質スプライシングは、ペプチド結合の切断と形成の両方からなる多段階の生化
学的反応である。タンパク質スプライシングの内因性基質は、インテインを含む生物に見
出されるタンパク質であるが、インテインはまた、実質的にあらゆるポリペプチド骨格を
化学的に操作するために使用することもできる。
【0186】
タンパク質スプライシングでは、インテインは、二つのペプチド結合を切断することに
よって一前駆体ポリペプチドから自身を切り出し、それによって、隣接するエクステイン
(外部タンパク質)配列を、新しいペプチド結合の形成を介して連結する。この転位は翻
訳後に起こる(翻訳と同時に起こる可能性もある)。インテイン媒介性タンパク質スプラ
イシングは自発的に起こり、インテインドメインの折りたたみだけを必要とする。
【0187】
インテインの約5%が分割インテインであり、これらはN-インテインとC-インテインとい
う二つの別々のポリペプチドとして転写され翻訳され、その各々が一つのエクステインに
融合している。翻訳の際に、インテイン断片は、自発的にかつ非共有結合的に標準インテ
イン構造へとアセンブルし、トランスにタンパク質スプライシングを行う。タンパク質ス
プライシングの機序には一連のアシル転移反応が関わっており、これが、インテイン-エ
キステイン接合部における2つのペプチド結合の切断と、N-エキステインとC-エキステイ
ンの間の新しいペプチド結合の形成とをもたらす。このプロセスは、N‐エクステインと
インテインのN‐末端とを繋げるペプチド結合の活性化によって開始される。事実上すべ
てのインテインは、N末端にシステインまたはセリンを有し、これがN-エクステインのC末
端残基のカルボニル炭素を攻撃する。このNからO/Sへのアシル基の移動は、保存されたト
レオニンとヒスチジン(TXXHモチーフと呼ばれる)、および一般的に見出されるアスパラ
ギン酸によって促進され、直鎖状 (チオ)エステル中間体の形成をもたらす。次に、この
中間体は、システイン、セリン、またはトレオニンであるC-エクステインの最初の残基 (
+1) の求核攻撃によってトランス-(チオ)エステル化される。生成した分枝 (チオ)エステ
ル中間体は、インテインの高度に保存されたC末端アスパラギンの環化というユニークな
変換によって、解消される。この過程は、ヒスチジン(高度に保存されたHNFモチーフに
見出されるもの)と最後から2番目のヒスチジンによって促進され、アスパラギン酸も関
与し得る。このスクシンイミド生成反応は、反応複合体からインテインを切除し、非ペプ
チド結合を介して結合されたエクステインを残す。この構造は、インテイン非依存的態様
で迅速に転位し、安定なペプチド結合になる。
【0188】
[アデノシンデアミナーゼ]
いくつかの実施形態では、本発明の融合タンパク質は、アデノシンデアミナーゼドメイ
ンを含む。いくつかの実施形態において、本明細書に提供されるアデノシンデアミナーゼ
は、アデニンを脱アミノ化することができる。いくつかの実施形態において、本明細書で
提供されるアデノシンデアミナーゼは、DNAのデオキシアデノシン残基中のアデニンを脱
アミノ化することができる。アデノシンデアミナーゼは、任意の適切な生物(例えば大腸
菌)に由来することができる。ある態様において、アデニンデアミナーゼは、本明細書に
提供される突然変異のいずれか(例えばecTadAにおける突然変異)に対応する一つ以上の
突然変異を含む、天然に存在するアデノシンデアミナーゼである。当業者は、例えば配列
アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質中の対応する
残基を同定することができる。従って、当業者は、任意の天然に存在するアデノシンデア
ミナーゼ(例えばecTadA対する相同性を有するもの)において、本明細書に記載された突
然変異のいずれか(例えば、ecTadAにおいて同定される突然変異のいずれか)に対応する
突然変異を生成することができる。ある態様において、アデノシンデアミナーゼは原核生
物由来である。ある態様において、アデノシンデアミナーゼは、細菌由来である。ある態
様において、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、S
almonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter cr
escentus、またはBacillus subtilisに由来する。ある態様において、アデノシンデアミ
ナーゼは、大腸菌由来である。
【0189】
一実施形態において、本発明の融合タンパク質は、TadA7.10に連結された野生型TadAを
含み、それがCas9ニッカーゼに連結される。特定の実施形態では、融合タンパク質は、単
一のTadA7.10ドメイン(例えば、モノマーとして提供されるもの)を含む。他の実施形態
では、ABE7.10エディターは、ヘテロダイマーを形成することができるTadA7.10およびTad
A (wt) を含む。関連する配列は以下のとおりである:
【0190】
TadA(wt):
SEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLY
VTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKK
AQSSTD
【0191】
TadA7.10:
SEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLY
VTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKK
AQSSTD
【0192】
いくつかの実施態様において、TadA(例えば、二本鎖基質活性を有するもの)またはTa
dA7.10は、ホモ二量体またはモノマーとして提供される。
【0193】
ある態様において、アデノシンデアミナーゼは、本明細書に提供されるアデノシンデア
ミナーゼのいずれかに記載のアミノ酸配列のいずれかに対して少なくとも60%、少なくと
も65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%
、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、ま
たは少なくとも99.5%の同一性であるアミノ酸配列を含む。本明細書において提供される
アデノシンデアミナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変
異のいずれか)を含み得ることが理解されるべきである。本開示は、特定のパーセント同
一性を有するデアミナーゼドメインが加えて本明細書に記載される突然変異のいずれかま
たはその組合せを含むものを提供する。いくつかの実施形態において、アデノシンデアミ
ナーゼは、参照配列または本明細書に提供されるアデノシンデアミナーゼのいずれかと比
較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21
、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41
、42、43、44、45、46、47、48、49、50、またはそれ以上の変異を有するアミノ酸配列を
含む。いくつかの実施形態において、アデノシンデアミナーゼは、当該技術分野において
既知であるかまたは本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくと
も5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくと
も30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくと
も60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なく
とも110個、少なくとも120個、少なくとも130個、少なくとも140個、少なくとも150個、
少なくとも160個、または少なくとも170個の同一の連続するアミノ酸残基を有するアミノ
酸配列を含む。
【0194】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD108X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるD108G、D108N、D108V、D108A
、またはD108Y突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異
を含む。しかしながら、さらなるデアミナーゼを同様にアラインメントして、本明細書に
提供されるように変異させることができる相同的なアミノ酸残基を同定し得ることが理解
されるべきである。
【0195】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA106X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるA106V突然変異、または別の
アデノシンデアミナーゼにおける対応する突然変異を含む。
【0196】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xの存在は、野
生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。あ
る態様において、アデノシンデアミナーゼは、TadA参照配列におけるE155D、E155G、また
はE155V突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む
。
【0197】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xの存在は、野
生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。あ
る態様において、アデノシンデアミナーゼは、TadA参照配列におけるD147Y突然変異、ま
たは別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0198】
本明細書に提供される突然変異(例えば、TadA参照配列のecTadAアミノ酸配列に基づく
もの)のいずれも、黄色ブドウ球菌TadA (saTadA) などの他のアデノシンデアミナーゼ、
またはその他のアデノシンデアミナーゼ(例えば、細菌のアデノシンデアミナーゼ)に導入
することができることが理解されるべきである。ecTadA中の変異残基にいかに相同的であ
るかは当業者に明らかであろう。従って、ecTadA中に同定された突然変異のいずれも、相
同的アミノ酸残基を有する他のアデノシンデアミナーゼにおいて作製され得る。また、本
明細書に提供される突然変異のいずれも、ecTadAまたは別のアデノシンデアミナーゼにお
いて、個々にまたは任意の組合せで作製され得ることも理解されるべきである。例えば、
アデノシンデアミナーゼは、TadA参照配列におけるD108N、A106V、E155V、および/または
D147Y突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み得
る。ある態様において、アデノシンデアミナーゼは、TadA参照配列における以下の突然変
異群(変異のグループは「;」で分けられる)、または別のアデノシンデアミナーゼにおけ
る対応する突然変異を含む:D108NおよびA106V;D108NおよびE155V;D108NおよびD147Y;
A106VおよびE155V;A106VおよびD147Y;E155VおよびD147Y;D108N、A106V、およびE55V;
D108N、A106V、およびD147Y;D108N、E55V、およびD147Y;A106V、E55V、およびD147Y;
ならびにD108N、A106V、E55V、およびD147Y;ただし、ここで提供される対応する突然変
異の任意の組合せがアデノシンデアミナーゼ(例えばecTadA)において作製され得ることを
理解されたい。
【0199】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X
、T17X、L18X、W23X、L34X、W45X、R51X、A56X、E59X、E85X、M94X、I95X、V102X、F104X
、A106X、R107X、D108X、K110X、M118X、N127X、A138X、F149X、M151X、R153X、Q154X、I
156X、および/またはK157X突然変異のうちの1以上、または他のアデノシンデアミナーゼ
における1以上の対応する突然変異を含み、ここで、Xの存在は、野生型アデノシンデアミ
ナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態
において、アデノシンデアミナーゼは、TadA参照配列に関連するH8Y、T17S、L18E、W23L
、L34S、W45L、R51H、A56E、またはA56S、E59G、E85K、またはE85G、M94L、1951、V102A
、F104L、A106V、R107C、またはR107H、またはR107P、D108G、またはD108N、またはD108A
、D108Y、K110I、M118K、N127S、A138V、F149Y、M151V、R153C、Q154L、I156D、および/
またはK157R突然変異のうちの1つ以上、または他のアデノシンデアミナーゼにおける1つ
以上の対応する突然変異を含む。
【0200】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、D108X、お
よび/またはN127X突然変異のうちの1つ以上、または別のアデノシンデアミナーゼにおけ
る1つ以上の対応する突然変異を含み、Xは任意のアミノ酸の存在を示す。いくつかの実施
形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、および/
またはN127S突然変異の1以上、または別のアデノシンデアミナーゼにおける1以上の対応
する突然変異を含む。
【0201】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X
、R26X、M61X、L68X、M70X、A106X、D108X、A109X、N127X、D147X、R152X、Q154X、E155X
、K161X、Q163X、および/またはT166X突然変異の1以上、または別のアデノシンデアミナ
ーゼにおける1以上の対応する突然変異を含み、ここでXは、野生型アデノシンデアミナー
ゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形
態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R26W、M61I、L68Q
、M70V、A106T、D108N、A109T、N127S、D147Y、R152C、Q154HもしくはQ154R、E155Gもし
くはE155VもしくはE155D、K161Q、Q163H、および/もしくはT166P突然変異の1つ以上、ま
たは他のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含む。
【0202】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8X
、D108X、N127X、D147X、R152X、およびQ154Xからなる群より選択される1つ、2つ、3つ、
4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼにおける対応する
突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応する
アミノ酸以外のいずれかのアミノ酸の存在を示す。いくつかの実施形態において、アデノ
シンデアミナーゼは、TadA参照配列におけるH8X、M61X、M70X、D108X、N127X、Q154X、E1
55X、およびQ163Xからなる群より選択される1つ、2つ、3つ、4つ、5つ、6つ、7つ、また
は8つの突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異(複数
可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の
いずれかのアミノ酸の存在を示す。ある態様において、アデノシンデアミナーゼは、TadA
参照配列におけるH8X、D108X、N127X、E155X、およびT166Xからなる群より選択される1つ
、2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼにおける対
応する突然変異(複数可)を含み、ここでXは野生型アデノシンデアミナーゼにおける対
応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシン
デアミナーゼは、H8X、A106X、D108X、別のアデノシンデアミナーゼにおける突然変異(
複数可)からなる群から選択される1、2、3、4、5、または6個の突然変異を含み、ここで
Xは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸の存
在を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH8X、R
126X、L68X、D108X、N127X、D147X、およびE155Xからなる群より選択される1つ、2つ、3
つ、4つ、5つ、6つ、7つ、または8つの突然変異、または別のアデノシンデアミナーゼに
おける対応する突然変異(複数可)を含み、Xは野生型アデノシンデアミナーゼにおける
対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシ
ンデアミナーゼは、TadA参照配列におけるH8X、D108X、A109X、N127X、およびE155Xから
なる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノシ
ンデアミナーゼにおける対応する突然変異(複数可)を含み、Xは野生型アデノシンデア
ミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示す。
【0203】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y
、D108N、N127S、D147Y、R152C、およびQ154Hからなる群より選択される1つ、2つ、3つ、
4つ、5つ、または6つの突然変異、または別のアデノシンデアミナーゼにおける対応する
突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配
列におけるH8Y、M61I、M70V、D108N、N127S、Q154R、E155GおよびQ163Hからなる群より選
択される1つ、2つ、3つ、4つ、5つ、6つ、7つまたは8つの突然変異、または他のアデノシ
ンデアミナーゼにおける対応する突然変異を含む。いくつかの実施形態において、アデノ
シンデアミナーゼは、TadA参照配列におけるH8Y、D108N、N127S、E155V、およびT166Pか
らなる群より選択される1つ、2つ、3つ、4つ、または5つの突然変異、または別のアデノ
シンデアミナーゼにおける対応する突然変異(複数可)を含む。いくつかの実施形態にお
いて、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、A106T、D108N、N127S、E1
55D、およびK161Qからなる群から選択される1つ、2つ、3つ、4つ、5つ、または6つの突然
変異、または他のアデノシンデアミナーゼにおける対応する突然変異を含む。いくつかの
実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、R126W、L68Q
、D108N、N127S、D147Y、およびE155Vからなる群より選択される1つ、2つ、3つ、4つ、5
つ、6つ、7つ、または8つの突然変異、または他のアデノシンデアミナーゼにおける対応
する突然変異を含む。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参
照配列におけるH8Y、D108N、A109T、N127S、およびE155Gからなる群より選択される1つ、
2つ、3つ、4つ、または5つの突然変異、または別のアデノシンデアミナーゼにおける対応
する突然変異(複数可)を含む。
【0204】
ある態様において、アデノシンデアミナーゼは、別のアデノシンデアミナーゼにおいて
一つ以上の対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、Ta
dA参照配列においてD108N、D108G、もしくはD108V突然変異、または別のアデノシンデア
ミナーゼにおいて対応する突然変異を含む。ある態様において、アデノシンデアミナーゼ
は、TadA参照配列におけるA106VおよびD108N突然変異、または別のアデノシンデアミナー
ゼにおける対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、Ta
dA参照配列におけるR107CおよびD108N突然変異、または別のアデノシンデアミナーゼにお
ける対応する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照
配列におけるH8Y、D108N、N127S、D147Y、およびQ154H突然変異、または別のアデノシン
デアミナーゼにおける対応する突然変異を含む。ある態様において、アデノシンデアミナ
ーゼは、TadA参照配列におけるH8Y、R24W、D108N、N127S、D147Y、およびE155V突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。ある態様におい
て、アデノシンデアミナーゼは、TadA参照配列におけるD108N、D147Y、およびE155V突然
変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるH8Y、D108N、およびS127S突
然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるA106V、D108N、D147Yおよ
びE155V突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む
。
【0205】
いくつかの実施形態において、アデノシンデアミナーゼは、tadA参照配列におけるS2X
、H8X、I49X、L84X、H123X、N127X、I156Xおよび/またはK160X突然変異の1つ以上、また
は別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含み、Xの存在は、
野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示
す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるS2
A、H8Y、I49F、L84F、H123Y、N127S、I156Fおよび/またはK160S突然変異のうちの1つ以上
、または別のアデノシンデアミナーゼにおける1つ以上の対応する突然変異を含む。
【0206】
ある態様において、アデノシンデアミナーゼは、L84X突然変異アデノシンデアミナーゼ
を含み、Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のア
ミノ酸を示す。ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるL8
4F突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0207】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるH123X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるH123Y突然変異、または別
のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0208】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるI157X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるI157F突然変異、または別
のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0209】
ある態様において、アデノシンデアミナーゼは、TadA参照配列において、L84X、A106X
、D108X、H123X、D147X、E155X、およびI156Xからなる群より選択される1つ、2つ、3つ、
4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼにおける対応
する突然変異(複数可)を含み、ここでXは、野生型アデノシンデアミナーゼにおける対
応するアミノ酸以外のいずれかのアミノ酸の存在を示す。ある態様において、アデノシン
デアミナーゼは、tadA参照配列においてS2X、I49X、A106X、D108X、D147X、およびE155X
からなる群より選択される1つ、2つ、3つ、4つ、5つ、または6つの突然変異、または別の
アデノシンデアミナーゼにおける対応する突然変異(複数可)を含み、ここでXは野生型
アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸の存在を示
す。ある態様において、アデノシンデアミナーゼは、TadA参照配列においてH8X、A106X、
D108X、N127X、およびK160Xからなる群より選択される1、2、3、4、または5個の突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異(複数可)を含み、ここ
でXは野生型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ
酸の存在を示す。
【0210】
ある態様において、アデノシンデアミナーゼは、TadA参照配列において、L84F、A106V
、D108N、H123Y、D147Y、E155V、およびI156Fからなる群より選択される1つ、2つ、3つ、
4つ、5つ、6つ、または7つの突然変異、または別のアデノシンデアミナーゼにおける対応
する突然変異を含む。ある態様において、アデノシンデアミナーゼは、TadA参照配列にお
いて、S2A、I49F、A106V、D108N、D147Y、およびE155Vからなる群より選択される1つ、2
つ、3つ、4つ、5つ、または6つの突然変異を含む。
【0211】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてH8Y
、A106T、D108N、N127S、およびK160Sからなる群より選択される1つ、2つ、3つ、4つ、ま
たは5つの突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異もし
くは突然変異を含む。
【0212】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列においてE 25
X、R 26 X、R 107 X、A 142 X、および/またはA 143 X突然変異のうちの1以上、または
別のアデノシンデアミナーゼにおける1以上の対応する突然変異を含み、Xの存在は、野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外のいずれかのアミノ酸を示す。
ある態様において、アデノシンデアミナーゼは、TadA基準配列においてE25M, E25D, E25A
, E25R, E25V, E25S, E25Y, R26G, R26N, R26Q, R26C, R26L, R26K, R107P, R07K, R107A
, R107N, R107W, R107H, R107S, A142N, A142D, A142G, A143D, A143G, A143E, A143L, A
143W, A143M, A143S, A143Q および/または A143R突然変異のうちの1以上、または他のア
デノシンデアミナーゼにおける1以上の対応する突然変異を含む。いくつかの実施形態に
おいて、アデノシンデアミナーゼは、TadA参照配列に対応する本明細書に記載の突然変異
のうちの1つ以上、または別のアデノシンデアミナーゼにおける対応する突然変異のうち
の1つ以上を含む。
【0213】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるE25X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるE25M、E25D、E25A、E25R、E2
5V、E25S、またはE25Y突然変異、または別のアデノシンデアミナーゼにおける対応する突
然変異を含む。
【0214】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR26X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。いくつかの
実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるR26G、R26N、R26Q
、R26C、R26L、またはR26K突然変異、または別のアデノシンデアミナーゼにおける対応す
る突然変異を含む。
【0215】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR107X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるR107P、R07K、R107A、R107
N、R107W、R107H、またはR107S突然変異、または別のアデノシンデアミナーゼにおける対
応する突然変異を含む。
【0216】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるA142N、A142D、A142G突然
変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0217】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA143X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは、野生型ア
デノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様
において、アデノシンデアミナーゼは、TadA参照配列におけるA143D、A143G、A143E、A14
3L、A143W、A143M、A143S、A143Qおよび/またはA143Rの突然変異、または別のアデノシン
デアミナーゼにおける対応する突然変異を含む。
【0218】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X
、N37X、P48X、I49X、R51X、M70X、N72X、D77X、E134X、S146X、Q154X、K157X、および/
またはK161X突然変異の1つ以上、または別のアデノシンデアミナーゼにおける1つ以上の
対応する突然変異を含み、ここでXの存在は、野生型アデノシンデアミナーゼにおける対
応するアミノ酸以外のいずれかのアミノ酸を示す。いくつかの実施形態において、アデノ
シンデアミナーゼは、TadA参照配列におけるH36L、N37T、N37S、P48T、P48L、I49V、R51H
、R51L、M70L、N72S、D77G、E134G、S146R、S146C、Q154H、K157N、および/またはK161T
突然変異の1以上、または別のアデノシンデアミナーゼにおける1以上の対応する突然変異
を含む。
【0219】
いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列におけるH36X
突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、ここで
Xは、野生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を
示す。いくつかの実施形態において、アデノシンデアミナーゼは、TadA参照配列における
H36L突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0220】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるN37X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノ
シンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様にお
いて、アデノシンデアミナーゼは、TadA参照配列におけるN37TまたはN37S突然変異、また
は別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0221】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、ここでXは、野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある
態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48TまたはP48L突然変
異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0222】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR51X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデノ
シンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様にお
いて、アデノシンデアミナーゼは、TadA参照配列におけるR51HまたはR51L突然変異、また
は別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0223】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるS146X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるS146RまたはS146C突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0224】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるK157X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるK157N突然変異、または別の
アデノシンデアミナーゼにおける対応する突然変異を含む。
【0225】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、ここでXは、野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある
態様において、アデノシンデアミナーゼは、TadA参照配列におけるP48S、P48T、またはP4
8A突然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0226】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるA142X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、Xは野生型アデ
ノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある態様に
おいて、アデノシンデアミナーゼは、TadA参照配列におけるA142N突然変異、または別の
アデノシンデアミナーゼにおける対応する突然変異を含む。
【0227】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるW23X突然変異、
または別のアデノシンデアミナーゼにおける対応する突然変異を含み、ここでXは、野生
型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。ある
態様において、アデノシンデアミナーゼは、TadA参照配列におけるW23RまたはW23L突然変
異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0228】
ある態様において、アデノシンデアミナーゼは、TadA参照配列におけるR152X突然変異
、または別のアデノシンデアミナーゼにおける対応する突然変異を含み、ここでXは、野
生型アデノシンデアミナーゼにおける対応するアミノ酸以外の任意のアミノ酸を示す。あ
る態様において、アデノシンデアミナーゼは、TadA参照配列におけるR152PまたはR52H突
然変異、または別のアデノシンデアミナーゼにおける対応する突然変異を含む。
【0229】
一実施形態では、アデノシンデアミナーゼは、突然変異H36L、R51L、L84F、A106V、D10
8N、H123Y、S146C、D147Y、E155V、I156F、およびK157Nを含むことができる。一部の実施
形態では、アデノシンデアミナーゼは、tadA基準配列に関連する突然変異の以下の組合せ
を含み、ここで、組合せの各突然変異は「_」によって分離され、突然変異の各組合せは
括弧内にある:
(A106V_D108N), (R107C_D108N),
(H8Y_D108N_S 127S_D 147Y_Q154H), (H8Y_R24W_D108N_N127S_D147Y_E155V), (D108N_D147
Y_E155V), (H8Y_D108N_S 127S), (H8Y_D108N_N127S_D147Y_Q154H), (A106V D108N D147Y
E155V) (D108Q D147Y E155V) (D108M_D147Y_E155V), (D108L_D147Y_E155V), (D108K_D147
Y_E155V), (D108I_D147Y_E155V),
(D108F_D147Y_E155V), (A106V_D108N_D147Y), (A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V), (E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F), (D103A_D014N),
(G22P_D 103 A_D 104N), (G22P_D 103 A_D 104N_S 138 A) , (D 103 A_D 104N_S 138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I15
6F), (E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_I15 6F), (R
26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V_I15 6F), (R26C_L
84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A1
42N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V_I15 6F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S 146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
57N),
(H36L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S 146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S 146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S 146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F_K157N_K160E), (R74Q
L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F), (P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S 146C_A142N_D147Y_E155V_I156F (H36L_P48T
_I49V_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S 146C_D147Y_E155V_ I156F _K15
7N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S 146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_R152P_E155V _I156F _K15
7N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S 146C_D147Y_E155 V_I156F _K15
7N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S 146C_D147Y_R152P _E155V_I156
F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S 146C_D147Y_R152P_E155V _I156F _K15
7N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S 146C_D147Y_R152P_E155 V_I156F _K1
57N).
【0230】
[シチジンデアミナーゼ]
1つの実施形態において、本発明の融合タンパク質は、シチジンデアミナーゼを含む。
ある態様において、本明細書において提供されるシチジンデアミナーゼは、シトシンまた
は5-メチルシトシンを脱アミノ化してウラシルまたはチミンにすることができる。いくつ
かの実施形態において、本明細書に提供されるシトシンデアミナーゼは、DNA中のシトシ
ンを脱アミノ化することができる。シチジンデアミナーゼは、任意の適切な生物に由来す
ることができる。いくつかの実施形態において、シチジンデアミナーゼは、天然に存在す
るシチジンデアミナーゼが本明細書に提供される突然変異のいずれかに対応する1つ以上
の突然変異を含むところのものである。当業者は、例えば、配列アラインメントおよび相
同的残基の決定によって、任意の相同的タンパク質中の対応する残基を同定することがで
きる。従って、当業者は、本明細書に記載された突然変異のいずれかに対応する突然変異
を、任意の天然に存在するシチジンデアミナーゼにおいて生じさせることができる。ある
態様において、シチジンデアミナーゼは、原核生物由来である。ある態様において、シチ
ジンデアミナーゼは、細菌由来である。ある態様において、シチジンデアミナーゼは、哺
乳動物(例えばヒト)由来である。
【0231】
いくつかの実施形態において、シチジンデアミナーゼは、本明細書に記載されるシチジ
ンデアミナーゼアミノ酸配列のいずれかに対して少なくとも60%、少なくとも65%、少なく
とも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも9
5%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも
99.5%の同一性であるアミノ酸配列を含む。本明細書において提供されるシチジンデアミ
ナーゼは、一つ以上の突然変異(例えば、本明細書に提供される突然変異のいずれか)を含
み得ることを理解されたい。本開示は、特定のパーセント同一性を有する任意のデアミナ
ーゼドメインに、本明細書に記載される突然変異またはその組合せのいずれかが加えられ
たものを提供する。いくつかの実施形態において、シチジンデアミナーゼは、参照配列ま
たは本明細書に提供されるいずれかのシチジンデアミナーゼと比較して、1, 2, 3, 4, 5,
6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26,
27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46,
47, 48, 49, 50個またはそれ以上の変異を有するアミノ酸配列を含む。いくつかの実施
形態において、シチジンデアミナーゼは、当技術分野において既知であるかまたは本明細
書に記載されたアミノ酸配列のいずれかと比較して、少なくとも5、少なくとも10、少な
くとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、
少なくとも45、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも
90、少なくとも100、少なくとも110、少なくとも120、少なくとも130、少なくとも140、
少なくとも150、少なくとも160、または少なくとも170個の同一の連続するアミノ酸残基
を有するアミノ酸配列を含む。
【0232】
本発明の融合タンパク質は、核酸編集ドメインを含む。ある態様において、核酸編集ド
メインは、CからUへの塩基変化を触媒することができる。ある態様において、核酸編集ド
メインは、デアミナーゼドメインである。ある態様において、デアミナーゼは、シチジン
デアミナーゼまたはアデノシンデアミナーゼである。ある態様において、デアミナーゼは
、アポリポタンパク質B mRNA編集複合体 (APOBEC) ファミリーデアミナーゼである。ある
態様において、デアミナーゼは、APOBEClデアミナーゼである。ある態様において、デア
ミナーゼは、APOBEC 2デアミナーゼである。ある態様において、デアミナーゼは、APOBEC
3デアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Aデアミナーゼであ
る。ある態様において、デアミナーゼは、APOBEC3Bデアミナーゼである。ある態様におい
て、デアミナーゼは、APOBEC3Cデアミナーゼである。ある態様において、デアミナーゼは
、APOBEC3Dデアミナーゼである。ある態様において、デアミナーゼは、APOBEC3Eデアミナ
ーゼである。ある態様において、デアミナーゼは、APOBEC3Fデアミナーゼである。ある態
様において、デアミナーゼは、APOBEC3Gデアミナーゼである。ある態様において、デアミ
ナーゼは、APOBEC3Hデアミナーゼである。ある態様において、デアミナーゼは、APOBEC4
デアミナーゼである。ある態様において、デアミナーゼは、活性化誘導デアミナーゼ (AI
D) である。ある態様において、デアミナーゼは、脊椎動物デアミナーゼである。ある態
様において、デアミナーゼは、無脊椎動物デアミナーゼである。ある態様において、デア
ミナーゼは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、またはマウスデ
アミナーゼである。ある態様において、デアミナーゼは、ヒトデアミナーゼである。ある
態様において、デアミナーゼは、ラットデアミナーゼ、例えば、rAPOBEC1である。ある態
様において、デアミナーゼは、Petromyzon marinusシチジンデアミナーゼ1 (pmCDAl) で
ある。ある態様において、デアミナーゼは、ヒトAPOBEC3Gである。ある態様において、デ
アミナーゼは、ヒトAPOBEC3Gの断片である。ある態様において、デアミナーゼは、D316R
D317R突然変異を含むヒトAPOBEC3Gバリアントである。ある態様において、デアミナーゼ
は、ヒトAPOBEC3Gの断片であり、D316R D317R突然変異に対応する突然変異を含む。ある
態様において、核酸編集ドメインは、本明細書に記載される任意のデアミナーゼのデアミ
ナーゼドメインに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも92%
、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%) 、
または少なくとも99.5%の同一性である。
【0233】
特定の実施形態では、本明細書で提供される融合タンパク質は、融合タンパク質の塩基
編集活性を改善する1つ以上の特徴を含む。例えば、本明細書に提供される融合タンパク
質は、ヌクレアーゼ活性が低下したCas9ドメインを含み得る。いくつかの実施形態におい
て、本明細書で提供される融合タンパク質は、ヌクレアーゼ活性を有さないCas9ドメイン
(dCas9) 、またはCas9ニッカーゼ (nCas9) と呼ばれる、二本鎖DNA分子の1鎖を切断する
Cas9ドメインを有し得る。
【0234】
[その他の核酸塩基エディター]
本発明は、本発明に係る融合タンパク質におけるシチジンデアミナーゼまたはアデノシ
ンデアミナーゼのドメインが、当技術分野で知られる実質的にあらゆる核酸塩基エディタ
ーで置き換えられた核酸塩基エディター融合タンパク質を提供する。
【0235】
いくつかの態様において、核酸プログラミング可能DNA結合タンパク質 (napDNAbp) は
、Cas9ドメインである。非限定的な例示的Cas9ドメインが本明細書で提供される。Cas9ド
メインは、ヌクレアーゼ活性Cas9ドメイン、ヌクレアーゼ不活性Cas9ドメイン、またはCa
s9ニッカーゼであり得る。ある態様において、Cas9ドメインは、ヌクレアーゼ活性ドメイ
ンである。例えば、Cas9ドメインは、二本鎖核酸の両方の鎖(例えば二本鎖DNA分子の両
方の鎖)を切断するCas9ドメインであり得る。いくつかの実施形態において、Cas9ドメイ
ンは、本明細書に記載のアミノ酸配列のいずれか1つを含む。いくつかの実施形態におい
て、Cas9ドメインは、本明細書に記載されたアミノ酸配列のいずれか1つに対して少なく
とも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも8
5%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、
少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの
実施形態において、Cas9ドメインは、本明細書に記載されるアミノ酸配列のいずれか1つ
と比較して1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20
、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40
、41、42、43、44、45、46、47、48、49、50、またはそれ以上の突然変異を有するアミノ
酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に記載されたア
ミノ酸配列のいずれか1つと比較して、少なくとも10、少なくとも15、少なくとも20、少
なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80
、少なくとも90、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少な
くとも300、少なくとも350、少なくとも400、少なくとも500、少なくとも600、少なくと
も700、少なくとも800、少なくとも900、少なくとも1000、少なくとも1100、または少な
くとも1200個の同一の一続きのアミノ酸残基を有するアミノ酸配列を含む。
【0236】
ある態様において、Cas9ドメインは、ヌクレアーゼ不活性Cas9ドメイン(dCas9) である
。例えば、dCas9ドメインは、二本鎖核酸分子のいずれの鎖も切断することなく、二本鎖
核酸分子に結合し得る(例えばgRNA分子を介して)。いくつかの実施形態において、ヌク
レアーゼ不活性dCas9ドメインは、本明細書中に記載されたアミノ酸配列のD10X突然変異
およびH840X突然変異、または本明細書中に提供されたアミノ酸配列のいずれかにおける
対応する突然変異を含み、Xは任意のアミノ酸変化である。いくつかの実施形態において
、ヌクレアーゼ不活性dCas9ドメインは、本明細書に記載のアミノ酸配列のD10A突然変異
およびH840A突然変異、または本明細書に記載のアミノ酸配列のいずれかにおける対応す
る突然変異を含む。一例として、ヌクレアーゼ不活性Cas9ドメインは、クローニングベク
ターpPlatTET-gRNA2(アクセス番号BAV54124)に記載の以下のアミノ酸配列を含む:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
(Qi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specifi
c control of gene expression.” Cell. 2013; 152(5):1173-83参照。その全内容が参照
により本明細書に組み入れられる。)。
【0237】
さらなる適切なヌクレアーゼ不活性dCas9ドメインは、本開示および当該分野における
知識に基づいて当業者に明らかとなり、本開示の範囲内である。このようなさらなる例示
的な適切なヌクレアーゼ不活性Cas9ドメインには、限定されるものではないが、D10A/H84
0A、D10A/D839A/H840A、およびD10A/D839A/H840A/N863A突然変異体ドメインが含まれる(
例えば、Prashant et al., CAS9 transcriptional activators for target specificity
screening and paired nickases for cooperative genome engineering. Nature Biotech
nology. 2013; 31(9): 833-838を参照されたい (その全内容は参照により本明細書に組み
込まれる))。いくつかの実施形態において、dCas9ドメインは、本明細書に提供されるdCa
s9ドメインのいずれかに対して少なくとも60%、少なくとも65%、少なくとも70%、少なく
とも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも9
6%、少なくとも97%、少なくとも98%、少なくとも99%、または少なくとも99.5%の同一性を
有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメインは、本明細書に
記載されるアミノ酸配列のいずれかと比較して1、2、3、4、5、6、7、8、9、10、11、12
、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32
、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそ
れ以上の突然変異を有するアミノ酸配列を含む。いくつかの実施形態において、Cas9ドメ
インは、本明細書に記載されたアミノ酸配列のいずれかと比較して、少なくとも10、少な
くとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、
少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも150、少なくと
も200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも500
、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少
なくとも1100、または少なくとも1200の同一の連続したアミノ酸残基を有するアミノ酸配
列を含む。
【0238】
ある態様において、Cas9ドメインは、Cas9ニッカーゼである。Cas9ニッカーゼは、二本
鎖核酸分子(例えば二本鎖DNA分子)の一方の鎖のみを切断することができるCas9タンパク
質であり得る。いくつかの実施形態において、Cas9ニッカーゼは、二本鎖核酸分子の標的
鎖を切断し、これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩
基対を形成している(相補的である)鎖を切断することを意味する。ある態様において、
Cas9ニッカーゼは、D10A突然変異を含み、位置840にヒスチジンを有する。いくつかの実
施形態において、Cas9ニッカーゼは、二本鎖核酸分子の非標的、非塩基編集鎖を切断し、
これは、Cas9ニッカーゼが、Cas9に結合しているgRNA(例えばsgRNA)と塩基対を形成し
ていない鎖を切断することを意味する。ある態様において、Cas9ニッカーゼは、H840A突
然変異を含み位置10にアスパラギン酸残基を有するか、または対応する突然変異。いくつ
かの実施形態において、Cas9ニッカーゼは、本明細書に提供されるCas9ニッカーゼのいず
れかと少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%
、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少
なくとも98%、少なくとも99%、または少なくとも99.5%の同一性であるアミノ酸配列を含
む。さらなる適切なCas9ニッカーゼは、本開示および当該分野における知識に基づいて当
業者に明らかであり、本開示の範囲内である。
【0239】
[PAM排他性が低減されたCas9ドメイン]
1つの特定の実施形態において、本発明は、2つの断片に分割されたCas9ドメインを含む
核酸塩基エディターを特徴とし、2つの断片の各々が末端インテインを有し、すなわち、N
末端断片はそのC末端においてインテイン系の1つのメンバーに融合され、C末端断片はそ
のN末端においてインテイン系のメンバーを有する。
【0240】
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸
領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」の「N」はアデノ
シン (A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、
ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態において、本明
細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的
塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Progr
ammable editing of a target base in genomic DNA without double-stranded DNA clea
vage” Nature 533, 420-424 (2016)参照(これらの内容全体は、参照により本明細書に
組み込まれる)。従って、いくつかの実施形態において、本明細書で提供される融合タン
パク質のいずれかは、標準的(例えばNGG)PAM配列を含まないヌクレオチド配列に結合す
ることができるCas9ドメインを含み得る。非標準的PAM配列に結合するCas9ドメインは本
技術分野において記述されており当業者には明らかであろう。例えば、非標準PAM配列に
結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nuc
leases with altered PAM specificities” Nature 523, 481-485 (2015); およびKleins
tiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus
CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2
015)に記述されており、それぞれの全内容を参照によりここに組み込む。下記表1に、い
くつかのPAMバリアントを記載する。
【0241】
表1.Cas9タンパク質および対応するPAM配列
【表1】
【0242】
いくつかの実施形態において、PAMはNGCである。いくつかの実施形態において、NGC PA
MはCas9バリアントによって認識される。いくつかの実施形態において、NGC PAMバリアン
トは、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335EおよびT1337R(合わせ
て「MQKFRAER」と呼ばれる)から選択される1つ以上のアミノ酸置換を含む。
【0243】
ある態様において、Cas9ドメインは、Staphylococcus aureus由来のCas9ドメイン(SaCa
s9)である。ある態様において、SaCas9ドメインは、ヌクレアーゼ活性SaCas9、ヌクレア
ーゼ不活性SaCas9 (SaCas9d) 、またはSaCas9ニッカーゼ (SaCas9n) である。いくつかの
実施形態において、SaCas9は、N579A突然変異、または本明細書に提供されるアミノ酸配
列のいずれかにおける対応する突然変異を含む。
【0244】
いくつかの実施形態において、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメ
インは、非標準PAMを有する核酸配列に結合することができ、いくつかの実施形態におい
て、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、NNGRRT PAM配列を有
する核酸配列に結合することができる。いくつかの実施形態において、SaCas9ドメインは
、E781X、N967X、およびR1014X突然変異の1以上、または本明細書に提供されるアミノ酸
配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ酸である。い
くつかの実施形態において、SaCas9ドメインは、E781K、N967K、およびR1014H突然変異の
うちの1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける1つ以上の
対応する突然変異を含む。いくつかの実施形態において、SaCas9ドメインは、E781K、N96
7K、またはR1014H突然変異、または本明細書に提供されるアミノ酸配列のいずれかにおけ
る対応する突然変異を含む。
【0245】
例示的なSaCas9配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG
下線を引いて太字にした上記残基N579は、変異されて(例えばA579に)SaCas9ニッカー
ゼを生じることができる。
【0246】
例示的なSaCas9n配列
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG
上記残基A579は、N579から変異されてSaCas9ニッカーゼを生じることができ、下線、太
字で示されている。
【0247】
例示的なSaKKH Cas9
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHS
ELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKD
GEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFP
EELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKP
EFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAIN
LILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELARE
KNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPR
SVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDF
INRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKL
DKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLI
VNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIK
YYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAE
FIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEV
KSKKHPQIIKKG.
上記残基A579は、N579から変異されてSaCas9ニッカーゼを生じることができ、下線、太
字で示されている。上記残基K781、K967、およびH1014は、E781、N967、およびR1014から
変異されてSaKKH Cas9を生じることができ、下線、斜体で示されている。
【0248】
ある態様において、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインであ
る (SpCas9)。ある態様において、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレ
アーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつか
の実施形態において、SpCas9は、D9X突然変異、または本明細書に提供されるアミノ酸配
列のいずれかにおける対応する突然変異を含み、ここでXはD以外の任意のアミノ酸である
。いくつかの実施形態において、SpCas9は、D9A突然変異、または本明細書に提供される
アミノ酸配列のいずれかにおける対応する突然変異を含む。ある態様において、SpCas9ド
メイン、SpCas9dドメインまたはSpCas9nドメインは、非標準PAMを有する核酸配列に結合
することができる。ある態様において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9n
ドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。い
くつかの実施形態において、SpCas9ドメインは、D1134X、R1334X、およびT1336X突然変異
の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然
変異突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、S
pCas9ドメインは、D1134E、R1334Q、およびT1336R突然変異の1つ以上、または本明細書に
提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形
態において、SpCas9ドメインは、D1134E、R1334Q、およびT1336R突然変異、または本明細
書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実
施形態において、SpCas9ドメインは、D1134X、R1334X、およびT1336X突然変異のうちの1
つ以上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突
然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9
ドメインは、D1134V、R1334Q、およびT1336R突然変異の1以上、または本明細書に提供さ
れるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態にお
いて、SpCas9ドメインは、D1134V、R1334Q、およびT1336R突然変異、または本明細書に提
供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態
において、SpCas9ドメインは、D1134X、G1217X、R1334X、およびT1336X突然変異の1以上
、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み
、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D
1134V、G1217R、R1334Q、およびT1336R突然変異の1つ以上、または本明細書に提供される
アミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において
、SpCas9ドメインは、D1134V、G1217R、R1334Q、およびT1336R突然変異、または本明細書
において提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
【0249】
いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9
ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくと
も65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%
、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、ま
たは少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において
、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載さ
れる任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態において、本明
細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任
意のCas9ポリペプチドのアミノ酸配列からなる。
【0250】
例示的SpCas9
DKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD
【0251】
例示的SpCas9n
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD
【0252】
例示的SpEQR Cas9
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRID
LSQLGGD
上記の残基E1134、Q1334、およびR1336は、D1134、R1334、およびT1336から変異されて
SpEQR Cas9を生じさせることができ、下線、太字で示されている。
【0253】
例示的SpVQR Cas9
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRID
LSQLGGD
上記の残基V1134、Q1334、およびR1336は、D1134、R1334、およびT1336から変異されて
SpVQR Cas9を生じることができ、下線、太字で示されている。
【0254】
例示的SpVRER Cas9
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRID
LSQLGGD
上記の残基V1134、R1217、Q1334、およびR1336は、D1134、G1217、R1334、およびT1336
から変異されてSpVRER Cas9を生じることができ、下線、太字で示されている。
【0255】
特定の実施形態では、本発明の融合タンパク質は、正準PAM配列に結合するdCas9ドメイ
ンおよび非正準PAM配列(例えば、表1で特定された非正準PAM)に結合するnCas9ドメイン
を含む。別の実施形態では、本発明の融合タンパク質は、正準PAM配列に結合するnCas9ド
メインおよび非正準PAM配列(例えば、表1で特定された非正準PAM)に結合するdCas9ドメ
インを含む。
【0256】
[高忠実度Cas9ドメイン]
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態に
おいて、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメイ
ンとDNAの糖-リン酸骨格との間の静電相互作用を減少させる1つ以上の突然変異を含む人
工Cas9ドメインである。特定の理論に縛られることを望まないが、DNAの糖-リン酸骨格と
の静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を
有し得る。ある態様において、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメ
インとDNAの糖-リン酸骨格との間の結合を低減させる一つ以上の突然変異を含む。ある態
様において、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を少なく
とも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、
少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少な
くとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくと
も65%、または少なくとも70%だけ低減させる一つ以上の突然変異を含む。
【0257】
いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のいずれかは
、N497X、R661X、Q695X、および/またはQ926X突然変異の1以上、または本明細書で提供さ
れるアミノ酸配列のいずれかにおける対応する突然変異を含み、ここでXは任意のアミノ
酸である。いくつかの実施形態において、本明細書で提供されるCas9融合タンパク質のい
ずれかは、N497A、R661A、Q695A、および/またはQ926A突然変異の1以上、または本明細書
で提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施
形態において、Cas9ドメインは、D10A突然変異、または本明細書に提供されるアミノ酸配
列のいずれかにおける対応する突然変異を含む。高い忠実度を有するCas9ドメインは当技
術分野で公知であり、当業者には明らかであろう。例えば、高い忠実度を有するCas9ドメ
インは、Kleinstiver, B.P., et al. “High-fidelity CRISPR-Cas9 nucleases with no
detectable genome-wide off-target effects.” Nature 529, 490-495 (2016); およびS
laymaker, I.M., et al. “Rationally engineered Cas9 nucleases with improved spec
ificity.” Science 351, 84-88 (2015)に記述されており、それぞれの全内容は参照によ
り本明細書に組み入れられる。
【0258】
Cas9に対する高忠実度Cas9ドメイン変異を太字、下線で示している。
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICY
LQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRID
LSQLGGD
【0259】
Cas9ヌクレアーゼはRuvCとHNHという二つの機能性エンドヌクレアーゼ領域をもってい
る。Cas9は標的DNAに結合するとコンホメーション変化を起こし、これがヌクレアーゼド
メインを位置付け、標的DNAの反対側の鎖を切断させる。Cas9を介したDNA切断の最終結果
は、標的DNA内の二本鎖切断 (DSB) である(PAM配列の約3~4ヌクレオチド上流)。生じたD
SBは、次の二つの一般的修復経路のうちの一つにより修復される: (1) 効率的だが誤りが
ちな非相同末端結合 (NHEJ) 経路;または (2) 効率は低いが忠実度の高い相同性誘導修
復 (HDR) 経路。
【0260】
非相同末端結合 (NHEJ) および/または相同性指向修復 (HDR) の「効率」は、任意の簡
便な方法によって計算することができる。例えば、ある場合には、効率は、成功したHDR
のパーセンテージで表すことができる。例えば、検査用ヌクレアーゼ分析を用いて切断産
物を生成し、基質に対する産物の比を用いてパーセンテージを計算することができる。た
とえば、HDRが成功した結果として新たに組み込まれた制限配列を含むDNAを直接切断する
測量用ヌクレアーゼ酵素を使用することができる。切断される基質が多いほどHDRの割合
が高かった(HDRの効率がより高かった)ことを示す。例示的な例として、HDRの割合 (パー
センテージ) は、以下の式を用いて計算することができる[(切断産物)/(基質+切断産物)]
(例えば、 (b+c) / (a+b+c) ここで、「a」はDNA基質のバンド強度であり、「b」およ
び「c」は切断生成物である。)。
【0261】
場合によっては、効率はNHEJの成功率で表すことができる。例えば、T7エンドヌクレア
ーゼIアッセイを用いて切断産物を生成し、基質に対する産物の比を用いてNHEJのパーセ
ンテージを計算することができる。T7エンドヌクレアーゼIは、野生型および突然変異体D
NA鎖(NHEJは最初の切断部位に小さなランダムな挿入や欠失 (インデル) を生じる)のハイ
ブリダイゼーションから生じるミスマッチのヘテロ二本鎖DNAを切断する。切断が多いほ
どNHEJの割合が高いこと(NHEJの効率が高いこと)を示す。例示的な例として、NHEJの割合
(パーセンテージ) は、式(1-(1-(b+c)/(a+b+c))1/2) ×100を用いて計算することができ
、ここで、「a」はDNA基質のバンド強度であり、「b」および「c」は切断生成物である(
Ran et. al., 2013 Sep. 12; 154(6):1380-9; および Ran et al., Nat Protoc. 2013 No
v.; 8(11): 2281-2308)。
【0262】
NHEJ修復経路は最も活性な修復機構であり、DSB部位での小ヌクレオチド挿入または欠
失 (インデル) を頻繁に引き起こす。NHEJ媒介DSB修復のランダム性は、Cas9およびgRNA
またはガイドポリヌクレオチドを発現する細胞集団が多様な突然変異のアレイをもたらし
得るので、重要な実際的意味を有する。ほとんどの場合、NHEJは標的DNAに小さなインデ
ルを生じさせ、その結果、標的遺伝子のオープンリーディングフレーム (ORF) 内に未熟
な終止コドンをもたらすアミノ酸欠失、挿入、またはフレームシフト突然変異が生じる。
理想的な最終結果は、標的遺伝子内の機能喪失型変異である。
【0263】
NHEJ媒介DSB修復はしばしば遺伝子のオープンリーディングフレームを破壊するが、相
同性指向修復 (HDR) は単一ヌクレオチド変化からフルオロフォアまたはタグの付加のよ
うな大きな挿入までの範囲の特異的ヌクレオチド変化を生成するために使用できる。
【0264】
HDRを遺伝子編集に利用するために、所望の配列を含むDNA修復テンプレートを、gRNAお
よびCas9またはCas9ニッカーゼと共に目的の細胞型に送達することができる。修復テンプ
レートは、所望の編集ならびにその標的のすぐ上流および下流(左右相同アームと呼ばれ
る)にさらなる相同配列を含むことができる。各相同アームの長さは導入される変化の大
きさに依存し得、より大きな挿入はより長い相同アームを必要とする。修復鋳型は、一本
鎖オリゴヌクレオチド、二本鎖オリゴヌクレオチド、または二本鎖DNAプラスミドであり
得る。HDRの効率は、Cas9、gRNAおよび外因性修復テンプレートを発現する細胞において
も、一般的に低い(10%未満の修正アリル)。HDRは細胞周期のS期とG2期の間に起こるので
、細胞を同調させることによってHDRの効率を高めることができる。NHEJに関与する遺伝
子を化学的または遺伝的に阻害することもHDR頻度を増加させ得る。
【0265】
いくつかの実施態様において、Cas9は、修飾Cas9である。所与のgRNA標的配列は、ゲノ
ム全体にわたり、部分的な相同性が存在するさらなる部位を有し得る。これらの部位はオ
フターゲットと呼ばれ、gRNAを設計する際に考慮する必要があるが、gRNAの設計を最適化
することに加えて、Cas9を修飾することによってCRISPRの特異性を高めることもできる。
Cas9は2つのヌクレアーゼドメイン、RuvCおよびHNHの組合せ活性を介して二本鎖切断 (DS
B) を生成する。SpCas9のD10A変異体であるCas9ニッカーゼは1つのヌクレアーゼドメイン
を保持し、DSBではなくDNAニックを生成する。特異的遺伝子編集のためのHDR媒介遺伝子
編集にニッカーゼを組み合わせることもできる。
【0266】
ある場合には、Cas9はバリアントCas9タンパク質である。バリアントCas9ポリペプチド
は、野生型Cas9タンパク質のアミノ酸配列と比較して、一アミノ酸単位で異なる(例えば
、欠失、挿入、置換、融合を有する)アミノ酸配列を有する。いくつかの例において、バ
リアントCas9ポリペプチドは、Cas9ポリペプチドのヌクレアーゼ活性を低下させるアミノ
酸変化(例えば欠失、挿入、または置換)を有する。例えば、いくつかの例において、バリ
アントCas9ポリペプチドは、対応する野生型Cas9タンパク質のヌクレアーゼ活性の50%未
満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満を有する。ある場合に
は、バリアントCas9タンパク質は実質的なヌクレアーゼ活性をもたない。対象Cas9タンパ
ク質が、実質的なヌクレアーゼ活性を有さないバリアントCas9タンパク質である場合、そ
れは「dCas9」と称され得る。
【0267】
ある場合には、バリアントCas9タンパク質はヌクレアーゼ活性を低下させる。例えば、
バリアントCas9タンパク質は、野生型Cas9タンパク質(例えば野生型Cas9タンパク質)の
エンドヌクレアーゼ活性の約20%未満、約15%未満、約10%未満、約5%未満、約1%未満、ま
たは約0.1%未満を示す。
【0268】
ある場合には、バリアントCas9タンパク質は、ガイド標的配列の相補鎖を切断すること
ができるが、二本鎖ガイド標的配列の非相補鎖を切断する能力が低下している。例えば、
バリアントCas9タンパク質は、RuvCドメインの機能を低下させる突然変異(アミノ酸置換)
を有することができる。非限定的な例として、いくつかの実施形態において、バリアント
Cas9タンパク質は、D10A (アミノ酸位置10におけるアスパラギン酸からアラニン)を有し
、したがって、二本鎖ガイド標的配列の相補鎖を切断することができるが、二本鎖ガイド
標的配列の非相補鎖を切断する能力が低下している(したがって、このバリアントCas9タ
ンパク質が二本鎖標的核酸を切断するとき、二本鎖切断 (DSB) の代わりに一本鎖切断 (S
SB) を生じる) (例えばJinek et al., Science. 2012 Aug. 17; 337(6096):816-21参照)
。
【0269】
ある場合には、バリアントCas9タンパク質は、二本鎖ガイド標的配列の非相補鎖を切断
することができるが、ガイド標的配列の相補鎖を切断する能力が低下している。例えば、
バリアントCas9タンパク質は、HNHドメインの機能を低下させる変異(アミノ酸置換)を有
することができる(RuvC/HNH/RuvCドメインモチーフ)。非限定的な例として、いくつかの
実施形態において、バリアントCas9タンパク質は、H840A (アミノ酸位置840におけるヒス
チジンからアラニン)突然変異を有し、したがって、ガイド標的配列の非相補的ストラン
ドを切断することができるが、ガイド標的配列の相補的ストランドを切断する能力が低下
している(したがって、このバリアントCas9タンパク質が二本鎖ガイド標的配列を切断す
ると、DSBの代わりにSSBが生じる)。このようなCas9タンパク質は、ガイド標的配列(例え
ば一本鎖ガイド標的配列)を切断する能力が低下しているが、ガイド標的配列(例えば一本
鎖ガイド標的配列)に結合する能力を保持している。
【0270】
ある場合には、バリアントCas9タンパク質は、二本鎖標的DNAの相補鎖および非相補鎖
の両方を切断する能力が低下している。非限定的な例として、ある場合には、バリアント
Cas9タンパク質は、D10AおよびH840A突然変異の両方を有し、その結果、ポリペプチドは
、二本鎖標的DNAの相補鎖および非相補鎖の両方を切断する能力が低下している。このよ
うなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下している
が、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。
【0271】
別の非限定的な例として、いくつかの場合において、バリアントCas9タンパク質は、W4
76AおよびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例えば一本鎖標
的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能
力は保持している。
【0272】
別の非限定的な例として、いくつかの場合において、バリアントCas9タンパク質は、P4
75A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペ
プチドは、標的DNAを切断する能力が低下している。そのようなCas9タンパク質は、標的D
NAを切断する能力を低下しているが(例えば一本鎖標的DNA)、標的DNA (例えば一本鎖標的
DNA)に結合する能力を保持している。
【0273】
別の非限定的な例として、いくつかの場合において、バリアントCas9タンパク質は、H8
40A、W476A、およびW1126A突然変異を有し、その結果、ポリペプチドは、標的DNA (例え
ば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば一本鎖標的DNA)に
結合する能力は保持している。別の非限定的な例として、いくつかの場合において、バリ
アントCas9タンパク質は、H840A、D10A、W476A、およびW1126A突然変異を有し、その結果
、ポリペプチドは、標的DNAを切断する能力が低下している。このようなCas9タンパク質
は、標的DNA (例えば一本鎖標的DNA)を切断する能力が低下しているが、標的DNA (例えば
一本鎖標的DNA)に結合する能力は保持している。いくつかの実施形態において、バリアン
トCas9は、Cas9 HNHドメインの位置840における触媒的His残基が回復されている(A840H)
。
【0274】
別の非限定的な例として、いくつかの場合において、バリアントCas9タンパク質は、H8
40A、P475A、W476A、N477A、D1125A、W1126A、およびD1127A突然変異を有し、その結果、
ポリペプチドは、標的DNA (例えば一本鎖標的DNA)を切断する能力を低下させるが、標的D
NA (例えば一本鎖標的DNA)に結合する能力を保持する。別の非限定的な例として、いくつ
かの場合において、バリアントCas9タンパク質は、D10A、H840A、P475A、W476A、N477A、
D1125A、W1126A、およびD1127A突然変異を有し、その結果、ポリペプチドは、標的DNAを
切断する能力が低下している。そのようなCas9タンパク質は、標的DNA (例えば一本鎖標
的DNA)を切断する能力を低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能
力を保持している。バリアントCas9タンパク質がW476AおよびW1126A変異を有する場合、
またはバリアントCas9タンパク質がP475A、W476A、N477A、D1125A、W1126A、およびD1127
A変異を有する場合、バリアントCas9タンパク質はPAM配列に効率的に結合しない。したが
って、このような場合には、このようなバリアントCas9タンパク質を結合の方法に用いる
と、この方法はPAM配列を必要としない。換言すれば、ある場合には、このようなバリア
ントCas9タンパク質を結合の方法に用いる場合、この方法はガイドRNAを含み得るが、こ
の方法は、PAM配列の非存在下で行うことができる(したがって、結合の特異性はガイドRN
Aの標的セグメントによってもたらされる)。上記の効果を達成するために、他の残基を変
異させ得る(すなわち一方または他方のヌクレアーゼ部分を不活性化する)。非限定的な例
として、残基D10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、およ
び/またはA987を変更(すなわち置換)することができる。また、アラニン置換以外の変異
も好適である。
【0275】
ある態様において、低減された触媒活性を有するバリアントCas9タンパク質(例えばCa
s9タンパク質がD10、G12、G17、E762、H840、N854、N863、H982、H983、A984、D986、お
よび/またはA987突然変異、例えばD10A、G12A、G17A、E762A、H840A、N854A、N863A、H98
2A、H983A、A984A、および/またはD986Aを有する場合)は、それがガイドRNAと相互作用
する能力を保持する限り、部位特異的様式で標的DNAに結合することができる(ガイドRNA
によって標的DNA配列に誘導されるからである)。
【0276】
いくつかの実施形態では、バリアントCasタンパク質は、spCas9、spCas9-VRQR、spCas9
-VRER、xCas9 (sp)、saCas9, saCas9-KKH、spCas9-MQKSER、spCas9-LRKIQK、またはspCas
9-LRVSQLであり得る。
【0277】
S. pyogenes Cas9の代替としては、哺乳動物細胞において切断活性を示すCpf1ファミリ
ー由来のRNA誘導エンドヌクレアーゼが挙げられ得る。PrevotellaおよびFrancisella 1由
来のCRISPR (CRISPR/Cpf1) は、CRISPR/Cas9システムに類似したDNA編集技術である。Cpf
1はクラスII CRISPR/Cas系のRNA誘導エンドヌクレアーゼである。この獲得免疫機構はPre
votellaやFrancisella細菌に見られる。Cpf1遺伝子はCRISPR遺伝子座に関連しており、ウ
イルスDNAを見出して切断するためにガイドRNAを用いるエンドヌクレアーゼをコードして
いる。Cpf1はCas9より小さく単純なエンドヌクレアーゼであり、CRISPR/Cas9系の制限の
いくつかを克服する。Cas9ヌクレアーゼとは異なり、Cpf1を介したDNA切断の結果は、短
い3'突出を伴う二本鎖切断である。Cpf1の互い違いの切断パターンは、伝統的な制限酵素
クローニングに類似した、方向性のある遺伝子導入の可能性を開くことができ、これは遺
伝子編集の効率を高め得る。上述したCas9のバリアントおよびオーソログと同様に、Cpf1
は、CRISPRが標的とすることができる部位の数を、SpCas9が好むNGG PAM部位を欠くATに
富む領域またはATに富むゲノムに拡大することもできる。Cpf1遺伝子座はα/β混合ドメ
イン、RuvC‐Iとそれに続くらせん領域、RuvC‐IIおよびジンクフィンガー様ドメインを
含む。Cpf1タンパク質は、Cas9のRuvCドメインに類似したRuvC様エンドヌクレアーゼドメ
インを有する。さらに、Cpf1はHNHエンドヌクレアーゼ領域をもたず、Cpf1のN末端はCas9
のαヘリックス認識ローブをもたない。Cpf1 CRISPR‐Casドメイン構成は、Cpf1が機能的
にユニークであり、クラス2、タイプV CRISPRシステムとして分類されることを示した。C
pf1遺伝子座は、II型系よりもI型およびIII型に類似したCas1、Cas2およびCas4タンパク
質をコードしていた。機能的Cpf1はトランス活性化CRISPR RNA (tracrRNA) を必要としな
い;したがって、CRISPR (crRNA) だけを要する。Cpf1はCas9より小さいだけでなく、より
小さいsgRNA分子(Cas9の約半分の数のヌクレオチド)を有するので、これはゲノム編集に
有益である。Cas9が標的とするGリッチPAMとは対照的に、Cpf1-crRNA複合体は、モチーフ
5'-YTN-3'に隣接するプロトスペーサーの同定によって標的DNAまたはRNAを切断する。PAM
の同定後、Cpf1は、4または5ヌクレオチドの突出を有するスティッキーエンド様のDNA二
本鎖切断を導入する。
【0278】
[プロトスペーサ隣接モチーフ]
用語「プロトスペーサー隣接モチーフ(PAM)」あるいはPAM様モチーフは、CRISPR細菌適
応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2~6塩基対DNA
配列を指す。いくつかの実施形態では、PAMは5’PAM(すなわちプロトスペーサの5’末端
の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM(すなわちプロトスペ
ーサの5’末端の下流に位置する)であり得る。
【0279】
PAM配列は標的結合のために必須であるが、その正確な配列はCasタンパク質の種類に依
存する。
【0280】
本明細書で提供される塩基エディターは、標準的または非標準的プロトスペーサー隣接
モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質
由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌ
クレオチド配列である。本開示のいくつかの側面は、異なるPAM特異性を有するCRISPRタ
ンパク質の全部または一部を含む塩基エディターを提供する。例えば、S. pyogenes由来
のCas9 (spCas9) などのCas9タンパク質は、典型的に、特定の核酸領域に結合するために
標準的なNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン (A) 、チミン(T)
、グアニン (G) 、またはシトシン (C) であり、Gはグアニンである。PAMはCRISPRタンパ
ク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター
間で異なり得る。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流また
は下流にあり得る。PAMは、1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチ
ドの長さであり得る。多くの場合、PAMは2~6ヌクレオチドの長さである。いくつかのPAM
バリアントが表1に記載されている。
【0281】
いくつかの実施形態において、SpCas9は、PAM核酸配列5'-NGC-3'または5'-NGC-3'に対
する特異性を有する。上記態様の様々な実施形態において、SpCas9は、Cas9または表1に
列挙されたCas9バリアントである。上記態様の種々の実施形態において、改変SpCas9は、
spCas9-MQKFRAERである。いくつかの実施形態において、バリアントCasタンパク質は、sp
Cas9、spCas9-VRQR、spCas9-VRER、xCas9 (sp)、saCas9、saCas9-KKH、SpCas9-MQKFRAER
、spCas9-MQKSER、spCas9-LRKIQK、またはspCas9-LRVSQLであり得る。1つの特定の実施形
態では、アミノ酸置換D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、およ
びT1337Rを含み(SpCas9-MQKFRAER)改変されたPAM 5'-NGC-3'に対する特異性を有する改
変SpCas9が使用される。
【0282】
一部の実施形態では、PAMはNGTである。一部の実施形態では、NGT PAMはバリアントで
ある。いくつかの実施形態において、NGT PAMバリアントは、一つまたは複数の残基1335
、1337、1135、1136、1218、および/または1219における標的化変異を通じて作製される
。いくつかの実施形態において、NGT PAMバリアントは、一つ以上の残基1219、1335、133
7、1218における標的化変異を通じて作製される。いくつかの実施形態において、NGT PAM
バリアントは、一つ以上の残基1135、1136、1218、1219、および1335における標的化変異
を通じて作製される。いくつかの実施形態において、NGT PAMバリアントは、下記の表2お
よび3に提供される標的化変異のセットから選択される。
【0283】
表2:残基1219、1335、1337、1218におけるNGT PAMバリアント変異
【表2】
【0284】
表3:残基1135、1136、1218、1219、および1335におけるNGT PAMバリアント変異
【表3】
【0285】
いくつかの実施形態において、NGT PAMバリアントは、表2および3のバリアント5、7、2
8、31、または36から選択される。いくつかの実施形態では、バリアントは改善されたNGT
PAM認識を有する。
【0286】
いくつかの実施形態において、NGT PAMバリアントは、残基1219、1335、1337、および/
または1218に変異を有する。いくつかの実施形態において、NGT PAMバリアントは、下記
表4に提供されるバリアントからの、認識を改善するための突然変異を伴って選択される
。
【0287】
表4:残基1219、1335、1337、および1218におけるNGT PAMバリアント変異
【表4】
【0288】
いくつかの実施形態では、NGT PAMは、下記表5に提供されるバリアントから選択される
。
【0289】
【0290】
ある態様において、Cas9ドメインは、Streptococcus pyogenes由来のCas9ドメインであ
る (SpCas9)。ある態様において、SpCas9ドメインは、ヌクレアーゼ活性SpCas9、ヌクレ
アーゼ不活性SpCas9 (SpCas9d) 、またはSpCas9ニッカーゼ (SpCas9n) である。いくつか
の実施形態において、SpCas9は、D9X突然変異、または本明細書に提供されるアミノ酸配
列のいずれかにおける対応する突然変異を含み、ここでXはD以外の任意のアミノ酸である
。いくつかの実施形態において、SpCas9は、D9A突然変異、または本明細書に提供される
アミノ酸配列のいずれかにおける対応する突然変異を含む。ある態様において、SpCas9ド
メイン、SpCas9dドメインまたはSpCas9nドメインは、非標準PAMを有する核酸配列に結合
することができる。ある態様において、SpCas9ドメイン、SpCas9dドメインまたはSpCas9n
ドメインは、NGG、NGAまたはNGCG PAM配列を有する核酸配列に結合することができる。
【0291】
いくつかの実施形態において、SpCas9ドメインは、D1135X、R1335X、およびT1336X突然
変異の1つ以上、または本明細書に提供されるアミノ酸配列のいずれかにおける対応する
突然変異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas
9ドメインは、D1135E、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供
されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態に
おいて、SpCas9ドメインは、D1135E、R1335Q、およびT1336R突然変異、または本明細書に
提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形
態において、SpCas9ドメインは、D1135X、R1335X、およびT1336X突然変異のうちの1つ以
上、または本明細書において提供されるアミノ酸配列のいずれかにおける対応する突然変
異を含み、ここでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメ
インは、D1135V、R1335Q、およびT1336R突然変異の1以上、または本明細書に提供される
アミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において
、SpCas9ドメインは、D1135V、R1335Q、およびT1336R突然変異、または本明細書に提供さ
れるアミノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態にお
いて、SpCas9ドメインは、D1135X、G1217X、R1335X、およびT1336X突然変異の1以上、ま
たは本明細書に提供されるアミノ酸配列のいずれかにおける対応する突然変異を含み、こ
こでXは任意のアミノ酸である。いくつかの実施形態において、SpCas9ドメインは、D1135
V、G1217R、R1335Q、およびT1336R突然変異の1つ以上、または本明細書に提供されるアミ
ノ酸配列のいずれかにおける対応する突然変異を含む。いくつかの実施形態において、Sp
Cas9ドメインは、D1135V、G1217R、R1335Q、およびT1336R突然変異、または本明細書にお
いて提供されるアミノ酸配列のいずれかにおける対応する突然変異を含む。
【0292】
いくつかの実施形態において、本明細書に提供される融合タンパク質のいずれかのCas9
ドメインは、本明細書に記載されるCas9ポリペプチドに対して少なくとも60%、少なくと
も65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%
、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、ま
たは少なくとも99.5%の同一性であるアミノ酸配列を含む。いくつかの実施形態において
、本明細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載さ
れる任意のCas9ポリペプチドのアミノ酸配列を含む。いくつかの実施形態において、本明
細書に提供される融合タンパク質のいずれかのCas9ドメインは、本明細書に記載される任
意のCas9ポリペプチドのアミノ酸配列からなる。
【0293】
いくつかの例において、本明細書に開示される塩基エディターのCRISPRタンパク質由来
ドメインによって認識されるPAMは、塩基エディターをコードするインサート(例えばAAV
インサート)とは別個のオリゴヌクレオチド上で細胞に提供され得る。そのような実施形
態では、、別個のオリゴヌクレオチド上にPAMを提供することは、さもなくば標的配列と
同じポリヌクレオチド上に隣接するPAMが存在しないために切断することができない標的
配列の切断を可能にする。
【0294】
一実施形態において、S. pyogenes Cas9 (SpCas9) を、ゲノム工学のためのCRISPRエン
ドヌクレアーゼとして使用することができる。ただし、他のものも使用され得る。いくつ
かの実施形態では、異なるエンドヌクレアーゼを用いて特定のゲノム標的を標的化するこ
とができる。いくつかの実施形態では、非NGG PAM配列を有する合成SpCas9由来バリアン
トを使用することができる。さらに、様々な種からの他のCas9オルソログが同定されてお
り、これらの 「非SpCas9」は、本開示でも有用になり得る種々のPAM配列に結合し得る。
例えば、比較的大きなサイズのSpCas9(約4キロベース(kb)のコード配列)は、細胞内
で効率的に発現することができないSpCas9 cDNAプラスミドをもたらすこともあり得る。
逆に、Staphylococcus aureus Cas9 (SaCas9) のコード配列は、SpCas9よりも約1キロ塩
基短いので、細胞内で効率的に発現させ得る。SpCas9と同様に、SaCas9エンドヌクレアー
ゼは、in vitroの哺乳類細胞およびin vivoのマウスにおいて標的遺伝子を修飾する能力
がある。ある実施形態では、Casタンパク質は異なるPAM配列を標的とすることができる。
いくつかの実施形態において、標的遺伝子は、Cas9 PAM、例えば、5’-NGGに隣接し得る
。他の実施形態では、他のCas9オーソログは異なるPAM要件を有し得る。例えば、S. ther
mophilus のもののようなPAM(CRISPR1の場合は5’-NNAGAA、CRISPR3の場合は5’-NGGNG
)およびNeisseria meningiditis のもの(5’-NNNNGATT)のような他のPAMも標的遺伝子
に隣接して見出され得る。
【0295】
いくつかの実施形態において、S. pyogenes系について、標的遺伝子配列は、5’-NGG P
AMの前(すなわち、その5’側)にあり得、20 ntガイドRNA配列が、反対側の鎖と塩基対を
形成して、PAMに隣接するCas9切断を媒介することができる。ある実施形態では、隣接切
断は、PAMの(約)3塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの(約
)10塩基対上流であり得る。ある実施形態では、隣接切断は、PAMの(約)0~20塩基対上
流であり得る。例えば、隣接切断は、PAM上流の1、2、3、4、5、6、7、8、9、10、11、12
、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩
基対の隣であり得る。隣接切断はPAMの1~30塩基対下流でもあり得る。以下はPAM配列に
結合することができる例示的SpCas9タンパク質の配列である:
【0296】
例示的なPAM結合SpCas9のアミノ酸配列は以下の通り:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
【0297】
例示的なPAM結合SpCas9nのアミノ酸配列は以下の通り:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRI
DLSQLGGD.
【0298】
例示的なPAM結合SpEQR Cas9のアミノ酸配列は以下の通り:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHM
IKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNL
IALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASM
IKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRK
QRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEV
VDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTV
KQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAH
LFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLH
EHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIA
RKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKY
SLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVI
LADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRID
LSQLGGD
この配列において、D1135、R1335、およびT1337から変異されてSpEQR Cas9を生じるこ
とができる残基E1135、Q1335、およびR1337は、下線、太字で示される。
【0299】
例示的なPAM結合SpVQR Cas9のアミノ酸配列は以下の通り:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
この配列において、D1135、R1335、およびT1336から変異されてSpVQR Cas9を生じるこ
とができる残基V1135、Q1335、およびR1336は、下線、太字で示されている。
【0300】
例示的なPAM結合SpVRER Cas9のアミノ酸配列は以下の通り:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHP
VENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMK
NYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYS
NIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLI
ARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRV
ILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRI
DLSQLGGD
【0301】
ある態様において、Cas9ドメインは、組換えCas9ドメインである。ある態様において、
組換えCas9ドメインは、SpyMacCas9ドメインである。いくつかの実施形態において、SpyM
acCas9ドメインは、ヌクレアーゼ活性SpyMacCas9、ヌクレアーゼ不活性SpyMacCas9 (SpyM
acCas9d) 、またはSpyMacCas9ニッカーゼ(SpyMacCas9n) である。いくつかの実施形態に
おいて、SaCas9ドメイン、SaCas9dドメイン、またはSaCas9nドメインは、非標準PAMを有
する核酸配列に結合することができる。いくつかの実施形態において、SpyMacCas9ドメイ
ン、SpCas9dドメイン、またはSpCas9nドメインは、NAA PAM配列を有する核酸配列に結合
することができる。
【0302】
例示的SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRIC
YLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAH
MIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSAS
MIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLR
KQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVT
VKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYA
HLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSL
HEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPV
ENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKN
YWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSK
LVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSN
IMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVT
PSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDI
GDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVY
SNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
【0303】
ある場合には、バリアントCas9タンパク質はH840A、P475A、W476A、N477A、D1125A、W1
126A、D1218Aの突然変異を有し、その結果、標的DNAまたはRNAを切断する能力が低下して
いる。このようなCas9タンパク質は、標的DNA (例えば一本鎖標的DNA)を切断する能力は
低下しているが、標的DNA (例えば一本鎖標的DNA)に結合する能力は保持している。別の
非限定的な例として、いくつかの場合において、バリアントCas9タンパク質は、D10A、H8
40A、P475A、W476A、N477A、D1125A、W1126A、およびD1218A突然変異を有し、その結果、
ポリペプチドは、標的DNA(例えば一本鎖標的DNA)を切断する能力が低下している。そのよ
うなCas9タンパク質は、標的DNA(例えば一本鎖標的DNA)を切断する能力を低下しているが
、標的DNA(例えば一本鎖標的DNA)に結合する能力を保持している。バリアントCas9タンパ
ク質がW476AおよびW1126A変異を有する場合、またはバリアントCas9タンパク質がP475A、
W476A、N477A、D1125A、W1126A、およびD1218A変異を有する場合、バリアントCas9タンパ
ク質はPAM配列に効率的に結合しない。したがって、このような場合には、このようなバ
リアントCas9タンパク質を結合の方法に用いると、この方法はPAM配列を必要としない。
換言すれば、ある場合には、このようなバリアントCas9タンパク質を結合の方法に用いる
場合、この方法はガイドRNAを含み得るが、この方法は、PAM配列の非存在下で行うことが
できる(したがって、結合の特異性はガイドRNAの標的セグメントによってもたらされる)
。上記の効果を達成するために、他の残基が変異され得る(すなわち一方または他方のヌ
クレアーゼ部分を不活性化する)。非限定的な例として、残基D10、G12、G17、E762、H840
、N854、N863、H982、H983、A984、D986、および/またはA987を変更(すなわち置換)する
ことができる。また、アラニン置換以外の変異も好適である。
【0304】
ある態様において、塩基エディターのCRISPRタンパク質由来ドメインは、標準的PAM配
列(NGG) を有するCas9タンパク質の全部または一部を含み得る。他の実施形態では、塩基
エディターのCas9由来ドメインは、非標準的PAM配列を用いることができる。そのような
配列は本技術分野で記述されており当業者には明らかであろう。例えば、非標準的PAM配
列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9
nucleases with altered PAM specificities” Nature, 523, 481-485 (2015); および
Kleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus a
ureus CRISPR-Cas9 by modifying PAM recognition”Nature Biotechnology, 33, 1293-1
298 (2015)に記述されており、それぞれの全内容を参照によりここに組み込む。
【0305】
[核局在化配列 (NLS) を含む融合タンパク質]
いくつかの態様において、本明細書で提供される融合タンパク質は、一つ以上 (例:2,
3, 4, 5) の核ターゲティング配列、例えば、核局在化配列 (NLS) をさらに含む。一実施
形態では、二部分(bipartite)NLSが使用される。いくつかの態様において、NLSは、NLS
を含むタンパク質の細胞核中への輸入(例えば核輸送によるもの)を促進するアミノ酸配列
を含む。いくつかの実施形態において、本明細書において提供される融合タンパク質のい
ずれかは、核局在化配列 (NLS) をさらに含む。いくつかの実施形態において、NLSは融合
タンパク質のN末端に融合される。いくつかの実施形態において、NLSは融合タンパク質の
C末端に融合される。いくつかの実施形態において、NLSはCas9ドメインのN末端に融合さ
れる。いくつかの実施形態において、NLSはnCas9ドメインまたはdCas9ドメインのC末端に
融合される。いくつかの実施形態において、NLSはデアミナーゼのN末端に融合される。い
くつかの実施形態において、NLSはデアミナーゼのC末端に融合される。いくつかの実施形
態において、NLSは、1つ以上のリンカーを介して融合タンパク質に融合される。ある態様
において、NLSは、リンカーなしで融合タンパク質に融合される。いくつかの実施形態に
おいて、NLSは、本明細書において提供または参照されるNLS配列のいずれか1つのアミノ
酸配列を含む。さらなる核局在化配列は当技術分野で公知であり、当業者には明らかであ
ろう。例えば、NLS配列は、Plank et al., PCT/EP2000/011690に記載されており、その内
容は、例示的な核局在化配列の開示について参照により本明細書に組み込まれる。ある態
様において、NLSは、アミノ酸配列PKKKRKVEGADKRTADGSEFES PKKKRKV, KRTADGSEFESPKKKRK
V, KRPAATKKAGQAKKKK, KKTELQTTNAENKTKKL, KRGINDRNFWRGENGRKTR, RKSGKIAAIVVKRPRKPKK
KRKV, またはMDSLLMNRRKFLYQFKNVRWAKGRRETYLCを含む。いくつかの実施形態において、NL
Sはリンカー中に存在するか、またはNLSはリンカー、例えば本明細書に記載されるリンカ
ーによって隣接される。いくつかの実施形態において、N末端またはC末端NLSは、二部分N
LSである。二部分NLSは、比較的短いスペーサー配列によって分離される二つの塩基性ア
ミノ酸クラスターを含む(それゆえにbipartite、2部分と呼ばれ、一部分(monopartite
)NLSは異なる)。ヌクレオプラスミンのNLSであるKR[PAATKKAGQA]KKKKは遍在的な二部分
シグナルのプロトタイプであり、塩基性アミノ酸の二つのクラスターが約10アミノ酸のス
ペーサーによって隔てられたものである。例示的な二部分NLSの配列は、PKKKRKVEGADKRTA
DGSEFES PKKKRKVである。
【0306】
いくつかの態様において、本発明の融合タンパク質は、リンカー配列を含まない。ある
態様において、1以上のドメインまたはタンパク質の間にリンカー配列が存在する。
【0307】
本開示の融合タンパク質は、1つ以上のさらなる特徴を含み得ることが理解されるべき
である。例えば、いくつかの態様において、融合タンパク質は、阻害因子、細胞質局在化
配列、核輸出配列などの輸出配列、または他の局在化配列、ならびに融合タンパク質の可
溶化、精製、または検出に有用な配列タグを含むことができる。本明細書において提供さ
れる適切なタンパク質タグには、限定されるものではないが、ビオチンカルボキシラーゼ
キャリアータグ (BCCP) タグ、myc-タグ、カルモジュリンタグ、FLAG-タグ、ヘマグルチ
ニン (HA) -タグ、ポリヒスチジンタグ(ヒスチジンタグまたはHis-タグとも呼ばれる)
、マルトース結合タンパク質 (MBP) -タグ、nus-タグ、グルタチオン-S-トランスフェラ
ーゼ (GST) -タグ、緑色蛍光タンパク質 (GFP) -タグ、チオレドキシンタグ、S-タグ、ソ
フタグ(例えばSoftag1、Softag3)、ストレプトタグ、ビオチンリガーゼタグ、FLAsHタグ
、V5タグ、およびSBP-タグが含まれる。さらなる適切な配列は、当業者には明らかであろ
う。いくつかの実施形態において、融合タンパク質は、1つ以上のHisタグを含む。
【0308】
[リンカー]
ある実施形態において、本発明のペプチドまたはペプチドドメインのいずれかを連結す
るためにリンカーが使用され得る。リンカーは、共有結合のように単純であり得、または
それは、多原子の長さであるポリマーリンカーであり得る。リンカーはペプチドリンカー
または非ペプチドリンカーであり得る。特定の実施形態では、リンカーはUV切断可能なリ
ンカーであり得る。いくつかの実施形態では、リンカーはポリヌクレオチドリンカー、例
えばRNAリンカーであり得る。ある実施形態において、リンカーは、ポリペプチドである
か、またはアミノ酸に基づくものである。他の実施形態において、リンカーはペプチド様
ではない。ある実施形態において、リンカーは、共有結合(例えば、炭素-炭素結合、ジ
スルフィド結合、炭素-ヘテロ原子結合、等)である。ある実施形態において、リンカー
は、アミド連結の炭素-窒素結合である。特定の実施形態では、リンカーは、環状又は非
環状、置換又は非置換、分枝又は非分枝の脂肪族又はヘテロ脂肪族リンカーである。ある
実施形態において、リンカーは、ポリマー(例えばポリエチレン、ポリエチレングリコー
ル、ポリアミド、ポリエステル、その他)である。特定の実施形態では、リンカーは、ア
ミノアルカン酸のモノマー、ダイマー又はポリマーを含む。ある実施形態において、リン
カーは、アミノアルカン酸(例えば、グリシン、エタン酸、アラニン、ベータ-アラニン
、3-アミノプロパン酸、4-アミノブタン酸、5-ペンタン酸、等)を含む。特定の実施形態
では、リンカーは、アミノヘキサン酸 (Ahx) のモノマー、ダイマー又はポリマーを含む
。ある態様において、リンカーは、炭素環部分(例えばシクロペンタン、シクロヘキサン
)に基づく。他の実施形態において、リンカーは、ポリエチレングリコール部分 (PEG)
を含む。他の実施形態において、リンカーはアミノ酸を含む。ある態様において、リンカ
ーはペプチドを含む。ある実施形態において、リンカーは、アリールまたはヘテロアリー
ル部分を含む。ある実施形態において、リンカーは、フェニル環に基づく。リンカーは、
ペプチドからの求核剤(例えばチオール、アミノ)がリンカーに結合することを促進する
ための官能化部分を含み得る。リンカーの一部として任意の求電子剤を使用することがで
きる。例示的な求電子剤としては、活性化エステル、活性化アミド、マイケル受容体、ハ
ロゲン化アルキル、ハロゲン化アリール、ハロゲン化アシル、およびイソチオシアナート
が挙げられるが、これらに限定されない。
【0309】
ある実施形態において、リンカーは、一アミノ酸または複数のアミノ酸(例えばペプチ
ドまたはタンパク質)である。いくつかの実施形態において、リンカーは、結合(例えば
共有結合)、有機分子、基、ポリマー、または化学的部分である。ある実施形態において
、リンカーは、長さが約3~約104(例えば5、6、7、8、9、10、11、12、13、14、15、16
、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36
、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、61、62、63、64
、65、70、75、80、85、90、95、または100)アミノ酸である。
【0310】
[ガイドRNAを伴うCas9複合体]
本開示のいくつかの側面は、本明細書で提供された融合タンパク質のいずれかを含む複
合体を提供し、核酸塩基エディターの活性のための最適な長さを達成するために、ガイド
RNAが利用され得る(例えば、(GGGS)n、(GGGGS)n、および(G)nの形態の非常に柔軟なリン
カーから、(EAAAK)n、(SGGS)n、SGSETPGTSESATPESの形態のより剛性の高いリンカーまで
(例えばGuilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9
to FokI nuclease improves the specificity of genome modification. Nat. Biotechn
ol. 2014; 32(6): 577-82参照。その全内容は参照によりここに組み込まれる)、および
(XP)n)。いくつかの実施態様において、nは、1、2、3、4、5、6、7、8、9、10、11、12
、13、14又は15である。ある実施形態において、リンカーは、(GGS)nモチーフを含み、こ
こで、nは、1、3、または7である。いくつかの実施形態において、本明細書で提供される
融合タンパク質のCas9ドメインは、アミノ酸配列SGSETPGTSESATPESを含むリンカーを介し
て融合される。
【0311】
ある態様において、ガイド核酸(例えばガイドRNA)は、15~100ヌクレオチド長であり、
標的配列に相補的である少なくとも10個の連続するヌクレオチドの配列を含む。いくつか
の実施形態において、ガイドRNAは、15、16、17、18、19、20、21、22、23、24、25、26
、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46
、47、48、49、または50ヌクレオチドの長さである。いくつかの実施形態において、ガイ
ドRNAは、標的配列に相補的な15、16、17、18、19、20、21、22、23、24、25、26、27、2
8、29、30、31、32、33、34、35、36、37、38、39、または40個の連続したヌクレオチド
の配列を含む。ある態様において、標的配列はDNA配列である。ある態様において、標的
配列は、細菌、酵母、真菌、昆虫、植物または動物のゲノムにおける配列である。ある態
様において、標的配列は、ヒトのゲノムにおける配列である。いくつかの実施形態におい
て、標的配列の3’末端は、標準PAM配列 (NGG) にすぐ隣接している。いくつかの実施形
態において、標的配列の3’末端は、非標準PAM配列(例えば表1に列挙されている配列)
にすぐ隣接している。ある態様において、ガイド核酸(例えばガイドRNA)は、疾患また
は障害に関連する配列に相補的である。
【0312】
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用
する方法を提供する。例えば、本開示のいくつかの局面は、DNA分子を、本明細書中に提
供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させるこ
とを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配
列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施
形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接し
ている。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、NGN、NNGRRT
、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している
。
【0313】
いくつかの実施形態において、本発明の融合タンパク質は、目的の標的に変異誘発する
ために使用される。これらの変異は標的の機能に影響を及ぼし得る。例えば、核酸塩基エ
ディターを使用して調節領域を標的とすると、調節領域の機能が変化し、下流のタンパク
質の発現が減少する。
【0314】
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパ
ク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タン
パク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの
配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、
配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそ
れぞれのコード核酸中のそれぞれの残基を同定することができる。
【0315】
本明細書に開示された融合タンパク質のいずれかを標的部位、例えば、編集される突然
変異を含む部位にターゲティングするためには、融合タンパク質をガイドRNAと共に共発
現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の箇
所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするtra
crRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を付
与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子とし
て別々に提供され得る。いくつかの態様において、ガイドRNAは、ガイド配列が標的配列
に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長であ
る。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティン
グするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。そ
のような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌクレ
オチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融合
タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガイ
ドRNA配列が本明細書に提供される。
【0316】
[シチジンデアミナーゼ、アデノシンデアミナーゼおよびCas9ドメインを含む融合タンパ
ク質を使用する方法]
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用
する方法を提供する。例えば、本開示のいくつかの局面は、DNA分子を、本明細書中に提
供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させるこ
とを含む方法を提供し、ここで、ガイドRNAは、約15~100ヌクレオチド長であり、標的配
列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施
形態において、標的配列の3’末端は、正準PAM配列 (NGG) に直接隣接する。いくつかの
実施形態において、標的配列の3'末端は、正準PAM配列 (NGG) に直接隣接していない。い
くつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列
にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NGCG、
NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣
接している。
【0317】
いくつかの実施形態において、本発明の融合タンパク質は、目的の標的に変異誘発する
ために使用される。特に、本明細書に記載されるマルチエフェクター核酸塩基エディター
は、標的配列内に複数の突然変異を作製することができる。これらの変異は標的の機能に
影響を及ぼし得る。例えば、マルチエフェクター核酸塩基エディターを使用して調節領域
を標的とすると、調節領域の機能が変化し、下流のタンパク質の発現が減少する。
【0318】
それぞれの配列における特定の位置または残基の番号付けは、使用される特定のタンパ
ク質および番号付けスキームに依存することが理解されるであろう。たとえば、成熟タン
パク質の前駆体と成熟タンパク質そのものとでは番号付けが異なることがあり、種ごとの
配列の違いが番号付けに影響することがある。当業者は、当業者に周知の方法、例えば、
配列アラインメントおよび相同的残基の決定によって、任意の相同的タンパク質およびそ
れぞれのコード核酸中のそれぞれの残基を同定することができる。
【0319】
本明細書に開示された、Cas9ドメインとシチジンデアミナーゼまたはアデノシンデアミ
ナーゼを含む融合タンパク質のいずれかを標的部位、例えば、編集される突然変異を含む
部位にターゲティングするためには、融合タンパク質をガイドRNA、例えばsgRNAと共に共
発現させることが典型的に必要であることは当業者には明らかであろう。本明細書の他の
箇所でより詳細に説明されるように、ガイドRNAは、典型的には、Cas9結合を可能にするt
racrRNAフレームワークと、Cas9:核酸編集酵素/ドメイン融合タンパク質に配列特異性を
付与するガイド配列とを含む。あるいは、ガイドRNAおよびtracrRNAは、2つの核酸分子と
して別々に提供され得る。いくつかの態様において、ガイドRNAは、ガイド配列が標的配
列に相補的な配列を含むという構造を含む。ガイド配列は典型的には20ヌクレオチド長で
ある。Cas9:核酸編集酵素/ドメイン融合タンパク質を特定のゲノム標的部位にターゲティ
ングするための適切なガイドRNAの配列は、本開示に基づいて当業者に明らかであろう。
そのような適切なガイドRNA配列は、典型的には、編集される標的ヌクレオチドの50ヌク
レオチド以内の上流または下流内の核酸配列に相補的なガイド配列を含む。提供された融
合タンパク質のいずれかを特定の標的配列に標的化するのに適したいくつかの例示的なガ
イドRNA配列が本明細書に提供される。
【0320】
[塩基エディターの効率性]
本発明の融合タンパク質は、著しい割合のインデルを生成することなく特定のヌクレオ
チド塩基を改変することにより、塩基エディター効率を改善させる。本明細書において使
用されるところの「インデル(indel)」は、核酸内のヌクレオチド塩基の挿入または欠
失を指す。このような挿入または欠失は、遺伝子のコード領域内でフレームシフト突然変
異を引き起こす可能性がある。いくつかの実施形態において、核酸において多数の挿入ま
たは欠失(すなわちインデル)を生じることなく、核酸内の特定のヌクレオチドを効率的
に改変(例えば変異)する塩基エディターを生成することが望ましい。特定の実施形態で
は、本明細書に提供される塩基エディターのいずれかが、インデルと比べて意図された改
変(例えば突然変異)のより大きな割合を生成することができる。いくつかの実施形態に
おいて、本明細書に提供される塩基エディターは、1:1より大きい、意図された突然変異
対インデルの比を生成することができる。いくつかの実施形態において、本明細書に提供
される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なく
とも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なく
とも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少な
くとも8:1、少なくとも10:1、少なくとも12:1、少なくとも15:1、少なくとも20:1、少な
くとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少
なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:
1、少なくとも700:1、少なくとも800:1、少なくとも900:1、もしくは少なくとも1000:1、
またはそれ以上の、意図される突然変異対インデルの比を生じることができる。意図する
突然変異およびインデルの数は、任意の適切な方法を用いて決定することができる。
【0321】
いくつかの態様において、本明細書において提供される塩基エディターは、核酸の領域
におけるインデルの形成を制限することができる。ある態様において、その領域は、塩基
エディターによって標的化されるヌクレオチドのところにあるか、または塩基エディター
によって標的化されるヌクレオチドの2、3、4、5、6、7、8、9または10ヌクレオチド以内
の領域である。いくつかの実施形態では、本明細書で提供される塩基エディターのいずれ
かは、核酸の領域においてインデルの形成を1%未満、1.5%未満、2%未満、2.5%未満、3%未
満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、10%未満
、12%未満、15%未満、または20%未満に制限することができる。核酸領域で形成されるイ
ンデルの数は、核酸(例えば細胞のゲノム内の核酸)が塩基エディターに曝される時間の
量に依存し得る。いくつかの実施形態において、インデルの数または割合は、核酸(例え
ば細胞のゲノム内の核酸)を塩基エディターに曝してから少なくとも1時間、少なくとも2
時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少
なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少な
くとも10日、または少なくとも14日後に決定される。
【0322】
本開示のいくつかの態様は、本明細書で提供されるいずれかの塩基エディターが、有意
な数の非意図的突然変異を生成することなく、核酸(例えば対象のゲノム内の核酸)にお
いて意図された突然変異を効率的に生成することができるという認識に基づく。いくつか
の実施形態において、意図される突然変異は、その意図される突然変異を生ずるように特
に設計されたgRNAに結合した特異的塩基エディターによって生成される突然変異である。
いくつかの実施形態において、意図される突然変異は、停止コドン、例えば、遺伝子のコ
ード領域内の未熟停止コドンを生成する突然変異である。いくつかの実施形態において、
意図される突然変異は、終止コドンを除去する突然変異である。ある態様において、意図
される突然変異は、遺伝子のスプライシングを変化させる突然変異である。ある態様にお
いて、意図される突然変異は、遺伝子の調節配列(例えば遺伝子プロモーターまたは遺伝
子リプレッサー)を変化させる突然変異である。いくつかの実施形態において、本明細書
で提供されるいずれかの塩基エディターは、意図された突然変異対意図されていない突然
変異の比(例えば、意図した突然変異:意図しない突然変異)を1:1より大きくすること
ができるいくつかの実施形態において、本明細書で提供されるいずれかの塩基エディター
は、意図された突然変異対意図されていない突然変異の比を、少なくとも1.5:1、少なく
とも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なく
とも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少な
くとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも10:1、少なくとも12:1、少な
くとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少な
くとも50:1、少なくとも100:1、少なくとも150:1、少なくとも200:1、少なくとも250:1、
少なくとも500:1、または少なくとも1000:1にすることができる。本明細書の「塩基エデ
ィターの効率性」の節に記載される塩基エディターの特徴は、本明細書に提供される融合
タンパク質、または融合タンパク質を使用する方法のいずれにも適用され得ることが理解
されるべきである。
【0323】
[核酸を編集する方法]
本開示のいくつかの態様は、核酸を編集するための方法を提供する。いくつかの実施形
態において、本方法は、核酸の核酸塩基(例えば二本鎖DNA配列の塩基対)を編集するた
めの方法である。いくつかの実施形態において、本方法は、a) 核酸(例えば二本鎖DNA配
列)の標的領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触
させる工程と、b) 前記標的領域の鎖分離を誘導する工程と、c) 標的領域の一本鎖におけ
る前記標的核酸塩基対の第一の核酸塩基を第二の核酸塩基に変換する工程と、d) nCas9を
使用して、前記標的領域の、一本を超えない数の鎖を切断する工程とを含み、ここで、第
一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な第四の核酸塩基に
よって置き換えられる。ある実施形態において、本方法は、核酸において20%未満のイン
デル形成をもたらす。一部の実施形態では、工程bが省略されることが理解されるべきで
ある。いくつかの実施形態において、本方法は、19%未満、18%未満、16%未満、14%未満、
12%未満、10%未満、8%未満、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、ま
たは0.1%未満のインデル形成をもたらす。いくつかの実施態様において、本方法は、第二
の核酸塩基を、第四の核酸塩基に相補的な第五の核酸塩基で置き換え、それによって意図
された編集塩基対(例えばG・CからA・T)を生成することをさらに含む。いくつかの実施
形態では、意図された塩基対の少なくとも5%が編集される。いくつかの実施形態では、意
図された塩基対の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、または50%が編
集される。
【0324】
ある実施形態において、標的ヌクレオチドにおける意図された生成物対意図されない生
成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくとも20:1、少なく
とも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくとも70:1、少なく
とも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1、またはそれ以
上である。いくつかの実施形態において、意図された突然変異対インデル形成の比は、1:
1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそれ以上である。
いくつかの実施形態において、切断された一本鎖(ニック鎖)が、ガイド核酸にハイブリ
ダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を含
む鎖とは反対の鎖である。一部の実施形態では、塩基エディターはdCas9ドメインを含む
。いくつかの実施形態において、塩基エディターは、編集されていない鎖を保護または結
合する。いくつかの実施形態において、意図される編集塩基対は、PAM部位の上流にある
。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8
、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド上流である。い
くつかの実施形態において、意図される編集塩基対は、PAM部位の下流にある。いくつか
の実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4、5、6、7、8、9、
10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下流にある。いくつか
の実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要としない。一部の実
施形態では、核酸塩基エディターはリンカーを含む。ある態様において、リンカーは、長
さが1~25アミノ酸である。ある態様において、リンカーは、長さが5~20アミノ酸である
。ある実施形態において、リンカーは、長さが10、11、12、13、14、15、16、17、18、19
、または20アミノ酸である。一実施形態において、リンカーは、長さが32アミノ酸である
。別の実施形態では、「長いリンカー(long linker)」は、長さが少なくとも約60アミ
ノ酸である。他の実施形態において、リンカーは、長さが約3~100アミノ酸である。一部
の実施形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を
含む。ある実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつか
の実施形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、
1~3、1~2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さ
が1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌ
クレオチドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィン
ドウ内にある。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対
を含む。いくつかの実施形態において、本方法は、本明細書に提供される塩基エディター
のいずれかを用いて実施される。
【0325】
いくつかの実施形態において、本開示は、ヌクレオチドを編集するための方法を提供す
る。いくつかの実施形態において、本開示は、二本鎖DNA配列の核酸塩基対を編集するた
めの方法を提供する。いくつかの実施形態において、本方法は、a) 二本鎖DNA配列の標的
領域を、塩基エディターおよびガイド核酸(例えばgRNA)を含む複合体と接触させ、ここ
で、標的領域が標的核酸塩基対を含む、工程と、b) 上記標的領域の鎖分離を誘導する工
程と、c) 標的領域の一本鎖における前記標的核酸塩基対の第一の核酸塩基を第二の核酸
塩基に変換する工程と、d) 前記標的領域の一本を超えない数の鎖を切断する工程と、を
含み、ここで、第一の核酸塩基に相補的な第三の核酸塩基が、第二の核酸塩基に相補的な
第四の核酸塩基によって置き換えられ、第二の核酸塩基が、第四の核酸塩基に相補的な第
五の核酸塩基によって置き換えられ、それによって、意図された編集塩基対を生成し、こ
こで意図された塩基対を生成する効率は少なくとも5%である。一部の実施形態では、工程
bは省略されることが理解されるべきである。いくつかの実施形態では、意図された塩基
対の少なくとも5%が編集される。いくつかの実施形態では、意図された塩基対の少なくと
も10%、15%、20%、25%、30%、35%、40%、45%、または50%が編集される。いくつかの態様
において、本方法は、19%未満、18%未満、16%未満、14%未満、12%未満、10%未満、8%未満
、6%未満、4%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満のインデル形
成を引き起こす。ある実施形態において、標的ヌクレオチドにおける意図された生成物対
意図されない生成物の比は、少なくとも2:1、少なくとも5:1、少なくとも10:1、少なくと
も20:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも60:1、少なくと
も70:1、少なくとも80:1、少なくとも90:1、少なくとも100:1、もしくは少なくとも200:1
、またはそれ以上である。いくつかの実施形態において、意図された突然変異対インデル
形成の比は、1:1超、10:1超、50:1超、100:1超、500:1超、もしくは1000:1超、またはそ
れ以上である。いくつかの実施形態において、切断された一本鎖が、ガイド核酸にハイブ
リダイズされる。いくつかの実施態様において、切断された一本鎖は、第一の核酸塩基を
含む鎖とは反対の鎖である。いくつかの実施形態において、意図される編集塩基対は、PA
M部位の上流にある。ある実施形態において、意図される編集塩基対は、PAM部位の1、2、
3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチ
ド上流である。いくつかの実施形態において、意図される編集塩基対は、PAM部位の下流
にある。いくつかの実施形態において、意図される編集塩基対は、PAM部位の1、2、3、4
、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド下
流にある。いくつかの実施形態において、本方法は、正準(例えばNGG)PAMサイトを必要
としない。ある態様において、リンカーは、長さが1~25アミノ酸である。ある態様にお
いて、リンカーは、長さが5~20アミノ酸である。ある実施形態において、リンカーは、
長さが10、11、12、13、14、15、16、17、18、19、または20アミノ酸である。一部の実施
形態では、標的領域は標的ウィンドウを含み、標的ウィンドウは標的核酸塩基対を含む。
ある実施形態において、標的ウィンドウは、1~10ヌクレオチドを含む。いくつかの実施
形態において、標的ウィンドウは、長さが1~9、1~8、1~7、1~6、1~5、1~4、1~3、
1~2、または1ヌクレオチドである。ある態様において、標的ウィンドウは、長さが1、2
、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオ
チドである。いくつかの実施形態において、意図される編集塩基対は、標的ウィンドウ内
で起こる。いくつかの実施態様において、標的ウィンドウは、意図される編集塩基対を含
む。いくつかの実施形態において、核酸塩基エディターは、本明細書に提供される塩基エ
ディターのいずれかである。
【0326】
[宿主細胞における融合タンパク質の発現]
本発明の融合タンパク質は、当業者に知られるルーチンの方法を用いて、細菌、酵母、
真菌、昆虫、植物、および動物細胞を含むがこれらに限定されない実質的にあらゆる目的
宿主細胞において発現され得る。核酸塩基修飾活性を有する一つ以上のドメイン(例えば
アデノシンデアミナーゼまたはシチジンデアミナーゼ)をコードする一つ以上のポリヌク
レオチドを、napDNAbpをコードするポリヌクレオチドに作動可能に連結して、本発明の融
合タンパク質をコードするポリヌクレオチドを調製することにより、融合タンパク質が生
成される。
【0327】
本明細書中に記載されるタンパク質ドメインをコードするDNAは、例えばDNA鎖を化学的
に合成することによる方法、PCRによる方法、またはGibsonアセンブリ法による方法など
、当技術分野で公知の任意の方法によって得ることができる。化学合成またはPCR法の組
み合わせまたはGibsonアセンブリ法によって全長DNAを構築する利点は、コドンを最適化
して、融合タンパク質が宿主細胞において高レベルで発現されることを確実にできること
である。最適化されたコドンは、上総DNA研究所のホームページに開示されている遺伝子
コード使用頻度データベース(http://www.kazusa.or.jp/codon/index.html)を用いて選
択することができる。一旦得られれば、融合タンパク質をコードするポリヌクレオチドは
、適切な発現ベクターに組み込まれる。
【0328】
適切な発現ベクターとしては、Escherichia coli由来プラスミド(例えばpBR322、pBR3
25、pUC12、pUC13);Bacillus subtilis由来プラスミド(例えばpUB110、pTP5、pC194)
;酵母由来のプラスミド(例えばpSH19、pSH15);昆虫細胞での発現に適したプラスミド
(例えばpFast-Bac);哺乳動物細胞における発現に適したプラスミド(例えばpA1-11、p
XT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);そしてラムダファージなどのバクテリオファー
ジが挙げられ、使用され得る他のベクターとしては、バキュロウイルスなどの昆虫ウイル
スベクター(例えばBmNPV、AcNPV);レトロウイルス、ワクシニアウイルス、アデノウイ
ルスなど、哺乳類細胞での発現に適したウイルスベクターが挙げられる。
【0329】
ポリヌクレオチドをコードする融合タンパク質は、典型的には、所望の宿主細胞におけ
る発現のために有用な適切なプロモーターの制御下で発現される。例えば、宿主が動物細
胞である場合には、SRアルファプロモーター、SV40プロモーター、LTRプロモーター、CMV
(サイトメガロウイルス) プロモーター、RSV (ラウス肉腫ウイルス)プロモーター、MoMu
LV (モロニーマウス白血病ウイルス) LTR、HSV-TK (単純ヘルペスウイルスのチミジンキ
ナーゼ)プロモーター等が用いられる。一実施形態において、プロモーターはCMVプロモー
ターまたはSRアルファプロモーターである。宿主細胞が大腸菌である場合、trpプロモー
ター、lacプロモーター、recAプロモーター、ラムダP.sub.Lプロモーター、lppプロモー
ター、T7プロモーター等のいずれかのプロモーターを使用することができる。宿主がバチ
ルス属である場合、SPO1プロモーター、SPO2プロモーター、penPプロモーター等のいずれ
かのプロモーターを使用することができる。宿主が酵母の場合には、Gal1/10プロモータ
ー、PHO5プロモーター、PGKプロモーター、GAPプロモーター、ADHプロモーター等のいず
れかのプロモーターを用いることができる。宿主が昆虫細胞である場合には、ポリヘドリ
ンプロモーター、P10プロモーター等を用いてもよい。宿主が植物細胞である場合、CaMV3
5Sプロモーター、CaMV19Sプロモーター、NOSプロモーター等のいずれかのプロモーターを
用いることができる。
【0330】
所望であれば、発現ベクターは、エンハンサー、スプライシングシグナル、ターミネー
ター、ポリA付加シグナル、選択マーカー(例えば、薬剤耐性遺伝子、栄養要求性相補遺
伝子等)、または複製起点のいずれか一つ以上も含む。
【0331】
本明細書に記載されるタンパク質ドメインをコードするRNAは、例えば、インビトロ転
写系においてmRNAを転写することによって調製することができる。
【0332】
融合タンパク質をコードする発現ベクターを宿主細胞に導入し、該宿主細胞を培養する
ことにより、本発明の融合タンパク質を発現させることができる。本発明において有用な
宿主細胞としては、細菌細胞、酵母、昆虫細胞、哺乳動物細胞などが挙げられる。
【0333】
Escherichia属には、Escherichia coli K12.cndot.DH1[Proc. Natl. Acad. USA, 60,
160 (1968)]、Escherichia coli JM103[Nucleic Acids Research, 9, 309 (1981)]、E
scherichia coli JA221[Journal of Molecular Biology, 120, 517 (1978)]、Escheric
hia coli HB101[Journal of Molecular Biology, 41, 459 (1969)]、Escherichia coli
C600[Genetics, 39, 440 (1954)]等が含まれる。
【0334】
Bacillus属には、Bacillus subtilis M1114 [Gene, 24, 255 (1983)]、Bacillus subti
lis 207-21 [Journal of Biochemistry, 95, 87 (1984)] 等が含まれる。
【0335】
本発明の融合タンパク質を発現するために有用な酵母としては、Saccharomyces cerevi
siae AH22、AH22R.sup.-、NA87-11A、DKD-5D、20B-12、Schizosaccharomyces pombe NCYC
1913、NCYC2036、Pichia pastoris KM71等が用られる。
【0336】
融合タンパク質は、例えばAcNPVのようなウイルスベクターを用いて昆虫細胞で発現さ
れる。昆虫宿主細胞としては、ヨトウガ幼虫由来樹立株(Spodoptera frugiperda細胞;S
F細胞)、Trichoplusianiの中腸由来MG1細胞、High Five、Trichoplusianiの卵由来の細
胞、Mamestra brassicae由来細胞、Estigmena acrea由来細胞等のいずれかの細胞株が用
いられる。ウイルスがBmNPVの場合には、Bombyx mori由来株の細胞(Bombyx mori N 細胞
;BmN細胞)等を用いる。Sf細胞としては、例えば、Sf9細胞(ATCC CRL1711)、Sf 21細
胞[上記すべて、In Vivo, 13, 213-217 (1977)]等が挙げられる。
【0337】
昆虫に関しては、Bombyx moriの幼虫、Drosophila、コオロギなどを用いて融合タンパ
ク質が発現される[Nature, 315,592 (1985)]。
【0338】
融合タンパク質を発現するために哺乳動物細胞株が使用され得る。このような細胞株と
しては、サルCOS-7細胞、サルVero細胞、チャイニーズハムスター卵巣 (CHO) 細胞、dhfr
遺伝子欠損CHO細胞、マウスL細胞、マウスAtT-20細胞、マウスミエローマ細胞、ラットGH
3細胞、ヒトFL細胞などが挙げられる。ヒトその他の哺乳動物のiPS細胞、ES細胞などの多
能性幹細胞、および種々の組織から調製された初代培養細胞が使用される。また、ゼブラ
フィッシュ胚、Xenopus卵母細胞などを用いることもできる。
【0339】
当業者によく知られる方法を用いて植物細胞が培養物中に維持され得る。植物細胞培養
には、様々な植物(例えば、イネ、コムギ、トウモロコシ、トマト、キュウリ、ナス、カ
ーネーション、Eustoma russellianum、タバコ、Arabidopsis thaliana)から調製される
、懸濁培養細胞、カルス、プロトプラスト、葉断片、根断片等が関わる。
【0340】
上記の宿主細胞は全て、ハプロイド(一倍体)または倍数体(例えば二倍体、三倍体、
四倍体など)であり得る。
【0341】
本発明の融合タンパク質をコードする発現ベクターは、任意のトランスフェクション法
を用いて宿主細胞に導入される(例えばリゾチーム、PEG、CaCl2共沈法、エレクトロポレ
ーション、マイクロインジェクション、粒子銃、リポフェクション、アグロバクテリウム
等を使用して)。トランスフェクション方法は、トランスフェクションされるべき宿主細
胞に基づいて選択される。Escherichia coliは、例えばProc. Natl. Acad. Sci. USA, 69
, 2110 (1972)、Gene, 17, 107 (1982)等に記載された方法に従って形質転換され得る。
バチルス属で形質導入する方法は、例えば、Molecular & General Genetics, 168, 111 (
1979) に記載されている。
【0342】
酵母細胞は、例えばMethods in Enzymology, 194, 182-187 (1991)、Proc. Natl. Acad
. Sci. USA, 75, 1929 (1978) 等に記載された方法を用いて形質導入され得る。
【0343】
昆虫細胞は、例えばBio/Technology, 6, 47-55 (1988)等に記載された方法を用いてト
ランスフェクトされる。
【0344】
哺乳動物細胞は、例えば、Cell Engineering additional volume 8, New Cell Enginee
ring Experiment Protocol, 263-267 (1995)(Shujunsha刊行)、およびVirology, 52, 4
56 (1973) に記載されている方法を用いてトランスフェクトされる。
【0345】
本発明の発現ベクターを含む細胞は、宿主に応じて変わる公知の方法に従って培養され
る。
【0346】
例えば、Escherichia coliまたはBacillus属細胞を培養する場合、液体培地が使用され
る。培地は、好ましくは、炭素源、窒素源、無機物質、および形質転換体の成長に必要な
他の成分を含む。炭素源の例としては、グルコース、デキストリン、可溶性デンプン、ス
クロースなどが挙げられる。窒素源の例としては、アンモニウム塩、硝酸塩、コーンステ
ィープリカー、ペプトン、カゼイン、肉エキス、大豆ケーキ、ジャガイモエキス等のよう
な無機又は有機物質が挙げられ、無機物質としては、塩化カルシウム、リン酸二水素ナト
リウム、塩化マグネシウム等が挙げられる。培地はまた、酵母エキス、ビタミン、成長促
進因子などを含有してもよい。培地のpHは好ましくは約5~約8である。
【0347】
Escherichia coliを培養するための培地としては、例えば、グルコース、カザミノ酸を
含むM 9培地が用いられる[Journal of Experiments in Molecular Genetics, 431-433,
Cold Spring Harbor Laboratory, New York 1972]。Escherichia coliは通常約15~約43
℃で培養される。必要に応じて曝気及び攪拌を行ってもよい。
【0348】
Bacillus属は一般に約30~約40°Cで培養する。必要に応じて曝気及び攪拌が行われる
。
【0349】
酵母の培養に適した培地の例としては、バークホルダー最少培地[Proc. Natl. Acad.
Sci. USA, 77, 4505 (1980)]、0.5%カザミノ酸含有SD培地[Proc. Natl. Acad. Sci. US
A, 81, 5330 (1984)]等が挙げられる。培地のpHは好ましくは約5~約8である。培養は、
一般に約20℃~約35℃で行う。必要に応じて曝気及び攪拌を行ってもよい。
【0350】
昆虫細胞や昆虫を培養するための培地としては、不活化10%ウシ血清の添加剤を含有す
るグレース昆虫培地(Nature, 195, 788 (1962))等が用いられる。培地のpHは好ましく
は約6.2~約6.4である。細胞は約27℃で培養される。必要に応じて通気および撹拌を行っ
てもよい。
【0351】
哺乳動物細胞は、例えば、約5~約20%のウシ胎児血清を含有する最小必須培地 (MEM)(
Science, 122, 501 (1952))、Dulbecco改変イーグル培地 (DMEM)(Virology, 8, 396 (1
959))、RPMI 1640培地(The Journal of the American Medical Association, 199, 519
(1967))、199培地(Proceeding of the Society for the Biological Medicine, 73, 1
(1950))等のいずれかで培養される。培地のpHは好ましくは約6~約8である。培養は、
約30℃~約40℃で行われる。必要に応じて通気および撹拌を行ってもよい。
【0352】
植物細胞を培養するための培地としては、例えば、MS培地、LS培地、B5培地等が用いら
れる。培地のpHは好ましくは約5~約8である。培養は、一般に約20℃~約30℃で行われる
。必要に応じて曝気及び攪拌を行ってもよい。
【0353】
融合タンパク質の発現は、誘導性プロモーター(例えばメタロチオネインプロモーター
(重金属イオンによって誘導される)、熱ショックタンパク質プロモーター(熱ショック
によって誘導される)、Tet-ON/Tet-OFF系プロモーター(テトラサイクリンまたはその誘
導体の追加または除去によって誘導される)、ステロイド応答性プロモーター(ステロイ
ドホルモンまたはその誘導体によって誘導される)等)を用いて調節することができ、誘
導剤が適切な段階で培地に添加されて(または培地から除去されて)融合タンパク質の発
現を誘導する。
【0354】
大腸菌などの原核細胞は誘導プロモーターを利用することができる。誘導性プロモータ
ーの例としては、lacプロモーター(IPTGによって誘導される)、cspAプロモーター(寒
冷ショックによって誘導される)、araBADプロモーター(アラビノースによって誘導され
る)などが挙げられるが、これらに限定されない。
【0355】
[核酸塩基エディターの、核酸に基づく送達]
本開示による核酸塩基エディターをコードする核酸は、当技術分野で公知の方法により
、または本明細書に記載されるように、対象に投与され得、または細胞(例えば細菌、酵
母、真菌、昆虫、植物、および動物の細胞)に送達され得る。例えば、核酸塩基エディタ
ーは、例えばベクター(例えばウイルス性または非ウイルス性ベクター)、ベクターに基
づかない方法(例えば、裸のDNAまたはDNA複合体の使用)、またはそれらの組合せによっ
て送達することができる。
【0356】
核酸塩基エディターをコードする核酸は、例えばトランスフェクションまたはエレクト
ロポレーションによって、裸のDNAまたはRNAとして細胞(例えば、細菌、酵母、真菌、昆
虫、植物、および動物細胞)に直接送達され得るか、または標的細胞による取り込みを促
進させる分子(例えばN-アセチルガラクトサミン)にコンジュゲート化され得る。ベクタ
ーのような核酸ベクターも使用され得る。
【0357】
核酸ベクターは、本明細書中に記載される融合タンパク質のドメインをコードする1以
上の配列を含むことができる。ベクターはまた、タンパク質をコードする配列に付随する
(例えば、挿入されているか、融合されている)シグナルペプチド(例えば、核局在化、
核小体局在化、またはミトコンドリア局在化のためのもの)をコードする配列も含むこと
ができる。一例として、核酸ベクターは、一つ以上の核局在化配列(例えばSV40からの核
局在化配列)を含むCas9コード配列と、一つ以上のデアミナーゼを含むことができる。
【0358】
核酸ベクターはまた、任意の適切な数の調節/制御エレメント、例えばプロモーター、
エンハンサー、イントロン、ポリアデニル化シグナル、Kozakコンセンサス配列、または
内部リボソームエントリー部位 (IRES) を含むことができる。これらのエレメントは当技
術分野でよく知られている。
【0359】
本開示による核酸ベクターは、組換えウイルスベクターを含む。例示的なウイルスベク
ターは、本明細書中で上記した。当技術分野で知られる他のウイルスベクターも使用する
ことができる。さらに、ウイルス粒子を用いて、核酸および/またはペプチドの形態のゲ
ノム編集システム成分を送達することができる。例えば、「空の」ウイルス粒子は、任意
の適切なカーゴを含有するようにアセンブルされ得る。ウイルスベクターおよびウイルス
粒子はまた、標的化リガンドを組み込んで標的組織特異性を変化させるように操作するこ
とができる。
【0360】
ウイルス性ベクターに加えて、本開示によるゲノム編集システムをコードする核酸を送
達するために非ウイルス性ベクターを使用することもできる。非ウイルス性核酸ベクター
の1つの重要なカテゴリーは、有機または無機であり得るナノ粒子のものである。ナノ粒
子は当技術分野でよく知られており、任意の適切なナノ粒子設計を用いて、ゲノム編集シ
ステム構成要素またはそのような構成要素をコードする核酸を送達することができる。例
えば、有機(例えば、脂質および/またはポリマー)ナノ粒子が、本開示の特定の実施形
態において送達ビヒクルとしての使用のために適切となり得る。ナノ粒子製剤、および/
または遺伝子導入において使用するための例示的な脂質を、表6(下記)に示す。
【0361】
【0362】
表7は、遺伝子移入および/またはナノ粒子製剤における使用のための例示的なポリマ
ーを列記する。
【表7】
【0363】
表8は、本明細書に記載される融合タンパク質をコードするポリヌクレオチドのための
送達方法を要約する。
【表8】
【0364】
ある態様において、本開示は、例えばウイルスベクターを使用した、融合タンパク質の
ウイルス性送達に関する。例示的なウイルスベクターとしては、レトロウイルスベクター
(例えばMaloney murine leukemia virus, MML-V)、アデノウイルスベクター(例えばAD 10
0)、レンチウイルスベクター(HIVおよびFIVベースのベクター)、ヘルペスウイルス(例え
ばHSV-2)、およびアデノ関連ウイルスベクターが挙げられる。
【0365】
[アデノ随伴ウイルスベクター]
AAVはパルボウイルスファミリーに属する小さな一本鎖DNA依存性ウイルスである。4.7
kbの野生型 (wt) AAVゲノムは、それぞれ四つの複製タンパク質および三つのキャプシド
タンパク質をコードする二つの遺伝子からなり、両側に145 bpの逆方向末端反復配列 (IT
R) がある。ビリオンは三つのキャプシドタンパク質Vp1、Vp2およびVp3から成り、これら
は同じオープンリーディングフレームから1:1:10比で産生されるが、異なるスプライシン
グ (Vp1) および選択的翻訳開始部位(Vp2とVp3のそれぞれ)から産生される。Vp3はビリオ
ン中に最も豊富に存在するサブユニットであり、ウイルスの指向性を規定する細胞表面で
の受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインがVp
1のユニークなN末端に同定されている。
【0366】
組換えAAV (rAAV) は、wt AAVと同様に、ベクター導入遺伝子カセットを挟むシス作用
性145 bp ITRを利用し、外来DNAのパッケージングのために最大4.5 kbを提供する。感染
後、rAAVは本発明の融合タンパク質を発現することができ、環状の頭・尾コンカテマーの
状態のエピソームとして存在することにより、宿主ゲノムに組み込まれることなく存続す
ることができる。このシステムを用いたrAAVの成功例は数多くあるが、in vitroおよびin
vivoでは、パッケージング能力が限られているため、遺伝子のコード配列の長さがwt AA
Vゲノムの長さ以上である場合にAAV媒介遺伝子送達の使用が制限されている。
【0367】
AAVベクターの小さいパッケージング能力は、このサイズを超える多数の遺伝子の送達
および/または大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例
えば、送達されるタンパク質を2つ以上の断片に分割することによって対処することがで
き、ここで、N末端断片を分割インテイン-Nに融合し、C末端断片を分割インテイン-Cに融
合する。そしてこれらの断片を2つ以上のAAVベクターにパッケージングする。一実施形態
では、AAVキャプシドタンパク質上にグラフトされる核酸塩基エディタータンパク質の断
片または部分が、インテインを利用して繋げられる。本明細書中で使用される場合、「イ
ンテイン」とは、隣接するN末端エクステインおよびC末端エクステイン(例えば、連結さ
れるべき断片)をライゲートする自己スプライシングタンパク質イントロン(例えばペプ
チド)を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えば
、Wood et al., J. Biol. Chem. 289(21); 14512-9 (2014)に記載されている。例えば、
インテインIntNおよびIntCは、別々のタンパク質断片に融合された場合、互いを認識して
、自身をスプライスして排出し、それと同時に、融合している上記タンパク質断片の隣接
するN-およびC-末端エクステインをライゲートして、それによってそれによって2つのタ
ンパク質断片から完全長タンパク質を再構成する。他の適切なインテインは当業者に明ら
かであろう。
【0368】
本発明の融合タンパク質の断片は、長さを変えることができる。ある態様において、タ
ンパク質断片は、長さが2アミノ酸~約1000アミノ酸の範囲である。ある態様において、
タンパク質断片は、長さが約5アミノ酸~約500アミノ酸の範囲である。ある態様において
、タンパク質断片は、長さが約20アミノ酸~約200アミノ酸の範囲である。ある態様にお
いて、タンパク質断片は、長さが約10アミノ酸~約100アミノ酸の範囲である。他の長さ
の適切なタンパク質断片は、当業者には明らかであろう。
【0369】
ある態様において、ヌクレアーゼの一部または断片(例えば、シチジンデアミナーゼ、
アデノシンデアミナーゼのようなデアミナーゼの断片、またはCas9の断片)がインテイン
に融合される。ヌクレアーゼは、インテインのN末端またはC末端に融合され得る。ある態
様において、融合タンパク質の一部または断片は、インテインに融合され、AAVキャプシ
ドタンパク質に融合される。インテイン、ヌクレアーゼおよびキャプシドタンパク質は、
任意の配置(例えば、ヌクレアーゼ-インテイン-キャプシド、インテイン-ヌクレアーゼ-
キャプシド、キャプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。いくつ
かの実施形態において、インテインのN末端は融合タンパク質のC末端に融合され、インテ
インのC末端はAAVキャプシドタンパク質のN末端に融合される。
【0370】
一実施形態では、大きな導入遺伝子発現カセットを二つの別々の半分(5’および3’末
端、またはヘッドおよびテール)に分割することによって二重AAVベクターが生成され、カ
セットの各半分が単一のAAVベクター(5 kb未満)内にパッケージングされる。次いで、両
方の二重AAVベクターによる同一細胞の同時感染に続いて、(1) 5’および3’ゲノム(二
重AAV重複ベクター)間の相同組換え (HR);(2) ITRを介した5′及び3′ゲノム(二重AAV
トランススプライシングベクター)の尾・頭コンカテマー化;または (3) それら二つのメ
カニズムの組み合わせ(二重AAVハイブリッドベクター)により、完全長トランスジーン発
現カセットの再構築が達成される。in vivoでの二重AAVベクターの使用は完全長タンパク
質の発現をもたらす。二重AAVベクタープラットフォームの使用は、>4.7 kbの大きさの導
入遺伝子のための効率的で実行可能な遺伝子導入戦略を表す。
【0371】
[核酸塩基エディターのスクリーニング]
「分割された」および再構築されたCas9を含む核酸塩基エディター融合タンパク質の適
合性は、本明細書中に記載されるような様々なスクリーニングアプローチにおいて評価す
ることができる。試験される融合タンパク質の各断片は、レポーター(例えばGFP)をコ
ードする少量のベクターと共に目的の単一細胞(例えば、細菌、酵母、真菌、昆虫、植物
、または動物細胞)に送達される。これらの細胞は、例えば293T、K562またはU20Sなどの
ヒト細胞株において不死化することができる。あるいは、初代ヒト細胞を使用することが
できる。そのような細胞は、最終的な細胞標的に関連し得る。
【0372】
送達は、ウイルスベクターを用いて実施され得る。一実施形態において、トランスフェ
クションは、脂質トランスフェクション(LipofectamineやFugeneなど)を用いて、または
エレクトロポレーションによって実施することができる。トランスフェクション後、GFP
の発現を蛍光顕微鏡またはフローサイトメトリーのいずれかによって測定して、一貫した
高レベルのトランスフェクションを確認することができる。最も高い活性を与えるエディ
ターの組み合わせを決定するために、これらの予備的なトランスフェクションは異なる複
数の核酸塩基エディターを含むことができる。
【0373】
核酸塩基エディターの活性は、本明細書に記載のように、すなわち細胞のゲノムの配列
決定をして標的配列の変化を検出することによって評価される。サンガー配列決定のため
には、精製されたPCRアンプリコンをプラスミド骨格中にクローン化し、形質転換し、ミ
ニプレップし、単一のプライマーで配列決定する。配列決定はまた、次世代配列決定技術
を用いて実施されてもよい。次世代配列決定を使用する場合、アンプリコンは、意図され
た切断部位が非対称に配置された300~500 bpであり得る。PCRに続いて、次世代配列決定
のアダプターおよびバーコード(たとえば、Illumina multiplexアダプターとインデック
ス)をアンプリコンの末端に付加し得る(例えば高スループット配列決定(例えばIllumina
MiSeq上でのもの)で使用するために)。
【0374】
最初の試験で最大レベルの標的特異的改変を誘導する融合タンパク質を、さらなる評価
のために選択し得る。
【0375】
特定の実施形態では、核酸塩基エディターを用いて、目的のポリヌクレオチドを標的化
する。一実施形態では、核酸塩基エディターを用いて、スプライス部位、エンハンサー、
および転写調節エレメントを含むがこれらに限定されない調節配列を標的化する。次いで
、その調節エレメントにより制御される遺伝子の発現に対する該改変の影響を、当該技術
分野で知られる任意の方法を用いてアッセイする。
【0376】
他の実施形態では、本発明の核酸塩基エディターを用いて、相補性決定領域(CDR)を
コードするポリヌクレオチドを標的化し、それによって、発現されるCDRにおける改変を
生じさせる。次いで、CDR機能に対するこれらの改変の効果を、例えば抗原に対するCDRの
特異的結合を測定することによって、アッセイする。
【0377】
さらに他の実施形態では、本発明の核酸塩基エディターを用いて、生物(例えば、細菌
、酵母、真菌、昆虫、植物、および動物)のゲノム内の目的のポリヌクレオチドを標的化
する。一実施形態において、本発明の核酸塩基エディターは、細胞のゲノム内の様々な配
列をタイル状にカバーするために使用されるガイドRNAのライブラリと共に細胞に送達さ
れ、それによってゲノム全体に渡って配列を系統的に改変する。
【0378】
[核酸塩基エディターのアプリケーション]
核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質発現を
改変する変化を作り出すことができる。一実施形態では、核酸塩基エディターは、スプラ
イス部位、エンハンサー、および転写調節エレメントを含むがこれらに限定されない非コ
ード配列または調節配列を改変するために使用される。次いで、当該技術分野で公知の任
意の方法を用いて、その調節エレメントによって制御される遺伝子の発現に対する当該改
変の影響をアッセイする。特定の実施形態において、核酸塩基エディターは、調節配列を
実質的に変化させて、それによって、遺伝子発現を調節するその能力を消失させることが
できる。有利なことに、これは、他のRNAプログラミング可能ヌクレアーゼとは対照的に
、ゲノム標的配列に二本鎖切断を生じることなく行うことができる。
【0379】
核酸塩基エディターを用いて、目的のポリヌクレオチドを標的とし、タンパク質活性を
改変する変化を作り出すことができる。例えば、突然変異誘発の文脈において、核酸塩基
エディターは、エラープローンPCRおよび他のポリメラーゼベースの方法と比べて多くの
利点を有する。ポリヌクレオチド全体にわたってランダムな変化を誘導するエラープロー
ンPCRとは異なり、本発明の核酸塩基エディターは、対象タンパク質の規定された領域内
の特定のアミノ酸を標的化するために使用できる。
【0380】
他の実施形態において、本発明の核酸塩基エディターは、生物のゲノム内の目的のポリ
ヌクレオチドを標的化するために使用される。一実施形態において、生物は、微生物叢の
細菌(例えばBacteriodetes、Verrucomicrobia、Firmicutes;ガンマプロテオバクテリア
、アルファプロテオバクテリア、Bacteriodetes、Clostridia、Erysipelotrichia、Bacil
li;Enterobacteriales、Bacteriodales、Verrucomicrobiales、Clostridiales、Erysiop
elotrichales、Lactobacillales;Enterobacteriaceae、Bacteroidaceae、Erysiopelotri
chaceae、Prevotellaceae、Coriobacteriaceae、およびAlcaligenaceae;Escherichia、B
acteroides、Alistipes、Akkermansia、Clostridium、Lactobacillus)である。別の実施
形態では、生物は農業上重要な動物(例えば牛、羊、山羊、馬、鶏、七面鳥)または植物
(例えば大豆、小麦、トウモロコシ、綿、アブラナ、米、タバコ、リンゴ、ブドウ、モモ
、プラム、チェリー)である。一実施形態において、本発明の核酸塩基エディターは、細
胞のゲノム内の種々の配列をタイル状にカバーするために使用されるガイドRNAのライブ
ラリーと共に細胞に送達され、それによってゲノム全体に渡る配列を系統的に変化させる
。
【0381】
突然変異を、種々のタンパク質のいずれかにおいて作製して、構造-機能分析を促進さ
させ、またはタンパク質の内因性活性を変化させ得る。突然変異は、例えば、酵素(例え
ばキナーゼ、ホスファターゼ、カルボキシラーゼ、ホスホジエステラーゼ)または酵素基
質、受容体またはそのリガンド、ならびに抗体およびその抗原において作製され得る。一
実施形態では、核酸塩基エディターは、酵素の活性部位、受容体のリガンド結合部位、ま
たは抗体の相補性決定領域 (CDR) をコードする核酸分子を標的とする。酵素の場合、活
性部位に変異を導入すると、酵素活性が増加、減少、または消失し得る。酵素に対する突
然変異の影響は、当技術分野で知られるおよび/または当業者には明らかである多くのア
ッセイのいずれかを含む、酵素活性アッセイにおいて特徴付けされる。受容体の場合、リ
ガンド結合部位に生成された変異は、リガンドに対する受容体の親和性を増加、減少、ま
たは消失させ得る。このような突然変異の効果は、当技術分野で知られるおよび/または
当業者には明らかである多くのアッセイのいずれかを含む、受容体/リガンド結合アッセ
イにおいてアッセイされる。CDRの場合、CDR内に生成された突然変異は、抗原への結合を
増加、減少、または消失させ得る。あるいは、CDR内に生成された突然変異は、抗原に対
する抗体の特異性を変化させ得る。次いで、例えばその抗原に対するCDRの特異的結合を
測定することによって、または任意の他の種類のイムノアッセイにおいて、CDR機能に対
するこれらの改変の影響がアッセイされる。
【0382】
本開示は、本明細書に提供される塩基エディターシステムによって補正することができ
る遺伝子変異(遺伝子変換を含む)、スプライシングに影響を及ぼす(例えば、スプライ
スドナーまたはアクセプター部位を変化させる)点突然変異、点突然変異に起因する異常
タンパク質もしくはミスフォールドタンパク質に関連するかまたはそれらによって引き起
こされる疾患と診断された対象の治療のための方法を提供する。例えば、いくつかの実施
形態において、そのような疾患(例えば遺伝子変換または他の遺伝子突然変異によって引
き起こされる疾患)を有する対象に、その疾患関連遺伝子における突然変異と直接的また
は間接的に関連するヌクレオシド塩基を編集する有効量の核酸塩基エディター(例えば1
つまたは複数のDNA結合タンパク質ドメインを含む、アデノシンデアミナーゼ塩基エディ
ターまたはシチジンデアミナーゼ塩基エディター)を投与することを含む方法が提供され
る。特定の態様において、追加の疾患または障害、例えばデアミナーゼ媒介遺伝子編集に
よって補正または改善することができる点突然変異に関連するかまたはそれによって引き
起こされる疾患または障害の治療のための方法が提供される。いくつかのそのような疾患
が本明細書に記載されており、本明細書に提供される戦略および融合タンパク質で治療す
ることができるさらなる適切な疾患は、本開示に基づいて当業者に明らかであろう。
【0383】
[医薬組成物]
本開示の他の態様は、本明細書に記載される塩基エディター、融合タンパク質、または
融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。
用語「医薬組成物」は、本明細書中で使用される場合、薬学的使用のために処方される組
成物を指す。いくつかの態様において、薬学的組成物は、薬学的に許容される担体をさら
に含む。ある態様において、薬学的組成物は、さらなる薬剤(例えば特異的送達、半減期
の延長のためのもの、または他の治療化合物)を含む。
【0384】
ここで使用されるところの用語「薬学的に許容される担体」は、液体または固体の充填
剤、希釈剤、賦形剤、製造助剤(例えば潤滑剤、タルクマグネシウム、ステアリン酸カル
シウムまたはステアリン酸亜鉛、あるいはステアリン酸)、または溶媒カプセル化材料な
どの、身体のある部位(例えば送達部位)から別の部位(例えば器官、組織または身体の一
部)への化合物の運搬または輸送に関与する薬学的に許容される材料、組成物またはビヒ
クルを意味する。薬学的に許容される担体は、製剤の他の成分と適合し、対象の組織に有
害でないという意味で許容される(例えば生理的適合性、無菌性、生理的pH等)。
【0385】
薬学的に許容される担体として役立つことができる物質のいくつかの非限定的な例は、
以下を含む: (1) ラクトース、グルコースおよびスクロースのような糖;(2) コーンスタ
ーチ、ジャガイモでん粉等のでん粉;(3) セルロース及びその誘導体 (カルボキシメチル
セルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、酢酸
セルロース等);(4) トラガント末;(5) モルト;(6)ゼラチン;(7) ステアリン酸マグネシウ
ム、ラウリル硫酸ナトリウム、タルク等の潤滑剤;(8) ココアバター、坐剤用ワックス等
の添加剤;(9) 落花生油、綿実油、ベニバナ油、ゴマ油、オリーブ油、コーン油、大豆油
等の油;(10) プロピレングリコール等のグリコール;(11) ポリオール、例えばグリセリン
、ソルビトール、マンニトール及びポリエチレングリコール (PEG); (12) エステル、例
えばオレイン酸エチルおよびラウリン酸エチルなど;(13) 寒天;(14) 水酸化マグネシウム
、水酸化アルミニウム等の緩衝剤;(15) アルギン酸;(16) パイロジェンフリー水;(17) 生
理食塩液;(18) リンガー液;(19)エチルアルコール;(20) pH緩衝液;(21) ポリエステル、
ポリカーボネート及び/又はポリ無水物;(22) ポリペプチドおよびアミノ酸のような増量
剤 (23) エタノールのような血清アルコール;及び (23) 製剤に使用される他の非毒性適
合性物質。湿潤剤、着色剤、離型剤、コーティング剤、甘味剤、風味料、香料、保存剤お
よび抗酸化剤も製剤中に存在させることができる。「賦形剤」、「担体」、「薬学的に許
容される担体」、「ビヒクル」などの用語は、本明細書では交換可能に使用される。
【0386】
薬学的組成物は、約5.0~約8.0の範囲などの生理学的pHを反映する所定のレベルに製剤
のpHを維持するために、一つ以上のpH緩衝化合物を含むことができる。水性液体製剤で使
用されるpH緩衝化合物は、アミノ酸またはヒスチジンなどのアミノ酸の混合物、またはヒ
スチジンおよびグリシンなどのアミノ酸の混合物であり得る。あるいは、pH緩衝化合物は
、製剤のpHを所定のレベル、例えば約5.0~約8.0の範囲に維持し、カルシウムイオンをキ
レートしない剤であることが好ましい。このようなpH緩衝化合物の典型的な例としては、
イミダゾールおよび酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は
、製剤のpHを所定のレベルに維持するのに適した任意の量で存在し得る。
【0387】
薬学的組成物はまた、一つ以上の浸透圧調節剤、すなわち、処方物の浸透圧特性(例え
ば、等張性、オスモラリティ、および/または浸透圧)をレシピエント個体の血流および
血液細胞にとって許容可能なレベルに調節する化合物を含有することができる。浸透圧調
節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸
透圧特性を調節する当業者に公知または入手可能な任意の化合物であり得る。当業者は、
本発明の処方における使用のための所定の浸透圧調節剤の適合性を経験的に決定すること
ができる。適切なタイプの浸透圧調節剤の例示的な例としては、塩化ナトリウムおよび酢
酸ナトリウムのような塩;スクロース、デキストロース、マンニトールなどの糖;グリシ
ンなどのアミノ酸;これらの薬剤および/または薬剤タイプの1つ以上の混合物が挙げられ
るが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な
任意の濃度で存在し得る。
【0388】
いくつかの態様において、薬学的組成物は、対象への送達のために、例えば遺伝子編集
のために製剤化される。本明細書に記載の医薬組成物を投与する適切な経路は、限定され
るものではないが、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜
、歯肉、歯内、蝸牛内、経鼓膜、器官内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨
内、眼周囲、腫瘍内、脳内、および脳室内投与を含む。
【0389】
いくつかの態様において、本明細書に記載される薬学的組成物は、患部(例えば腫瘍部
位)に局所的に投与される。いくつかの実施形態において、本明細書に記載される薬学的
組成物は、注射、カテーテル、坐剤、またはインプラントによって、対象に投与され、イ
ンプラントは、多孔質、非多孔質、またはゼラチン質材料であり、例えば、シアラスティ
ック膜、または繊維などの膜を含む。
【0390】
他の態様において、本明細書に記載される薬学的組成物は、制御放出システムにおいて
送達される。一実施形態では、ポンプを使用することができる(例えばLanger, 1990, Sci
ence 249: 1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald
et al., 1980, Surgery 88:507; Saudek et al, 1989, N. Engl. J. Med. 321:574参照)
。別の実施形態では、ポリマー材料を使用することができる。(例えばMedical Applicati
ons of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 19
74); Controlled Drug Bioavailability, Drug Product Design and Performance (Smole
n and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci.
Rev. Macromol. Chem. 23:61. See also Levy et al., 1985, Science 228: 190; Durin
g et al., 1989, Ann. Neurol. 25:351; Howard et ah, 1989, J. Neurosurg. 71: 105.)
。他の制御放出システムは、例えば、上記Langerに記載されている。
【0391】
いくつかの態様において、薬学的組成物は、対象、例えばヒトへの静脈内または皮下投
与に適合された組成物として、ルーチンの手順に従って製剤化される。いくつかの態様に
おいて、注射による投与のための医薬組成物は、可溶化剤としての無菌等張使用の溶液お
よび注射部位の痛みを緩和するためのリグノカインなどの局所麻酔薬である。一般に、成
分は、単位投与形態、例えば、活性剤の量を示すアンプルまたはサシェットのような密閉
容器内の乾燥凍結乾燥粉末または水を含まない濃縮物として、別々にまたは一緒に供給さ
れる。薬剤が注入によって投与される場合には、無菌の医薬グレードの水または生理食塩
水を含む注入ボトルを用いてそれを分注することができる。医薬組成物が注射によって投
与される場合、投与前に成分を混合することができるように、注射用滅菌水または生理食
塩水のアンプルを提供することができる。
【0392】
全身投与のための医薬組成物は、液体、例えば滅菌生理食塩水、乳酸化リンゲル液また
はハンク液であり得る。さらに、医薬組成物は、固体形態であって、使用の直前に再溶解
または懸濁され得る。凍結乾燥形態もまた考えられる。医薬組成物は、非経口投与にも適
した、リポソームまたは微結晶などの脂質粒子または小胞内に含有することができる。粒
子は、組成物がその中に含まれる限り、単ラメラまたは複数ラメラのような任意の適切な
構造であり得る。化合物は、融合性脂質ジオレオイルホスファチジルエタノールアミン(D
OPE)、低量(5-10モル%)のカチオン性脂質を含み、ポリエチレングリコール (PEG) コーテ
ィングにより安定化された、「安定化プラスミド脂質粒子」(SPLP)中に捕捉され得る (Zh
ang Y. P. et ah, Gene Ther. 1999, 6: 1438-47)。このような粒子および小胞には、N-[
l-(2,3-ジオレオイルキシ)プロピル]-N,N,N-トリメチル-アモニウムメチル硫酸塩、ある
いは「DOTAP」のような正電荷脂質が特に好ましい。このような脂質粒子の調製はよく知
られている。例えば、米国特許第4,880,635;4,906,477;4,911,928;4,917,951;4,920,
016;および4,921,757号参照(その各々は、参照により本明細書に組み込まれる)。
【0393】
本明細書に記載の医薬組成物は、例えば、単位用量として投与または包装することがで
きる。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象
のための単一用量として適した物理的に個別の単位を指し、各単位は、必要な希釈剤(例
えば担体、またはビヒクル)と合わせて所望の治療効果を生じるように計算された所定量
の活性物質を含有する。
【0394】
さらに、この薬学的組成物は、 (a) 凍結乾燥形態の本発明の化合物を含有する容器、
および (b) 本発明の凍結乾燥化合物の再構成または希釈のために使用される、薬学的に
許容される希釈剤 (例えば無菌のもの) を含有する第2の容器を含む薬学的キットとして
提供することができる。必要に応じて、そのような容器には、医薬品又は生物学的製剤の
製造、使用又は販売を規制する政府機関によって規定された様式の通知であって、人に投
与するための製造、使用又は販売の機関による承認を反映するものとすることができる。
【0395】
別の態様では、上記疾患の治療に有用な材料を含む製品が含まれる。いくつかの実施態
様において、製品は、容器及びラベルを含む。適切な容器は、例えばボトル、バイアル、
シリンジ、および試験管を含む。容器は、ガラスまたはプラスチックなどの様々な材料か
ら形成することができる。いくつかの実施形態において、容器は、本明細書に記載される
疾患を治療するために有効である組成物を保持し、無菌アクセスポートを有し得る。例え
ば、容器は、静脈内溶液バッグ、または皮下注射針によって穿刺可能なストッパーを有す
るバイアルであり得る。組成物中の活性剤は、本発明の化合物である。いくつかの態様に
おいて、容器上のまたは容器に付随するラベルは、選択される疾患を治療するために組成
物が使用されることを示す。製品は、リン酸緩衝生理食塩水、リンゲル液、またはデキス
トロース溶液などの薬学的に許容される緩衝液を含む第2の容器をさらに含むことができ
る。さらに、他の緩衝剤、希釈剤、フィルター、針、注射器、および使用説明書付き添付
文書を含め、商業的観点および使用者の観点から望ましい他の物質を含むことができる。
【0396】
いくつかの態様において、本明細書に記載される融合タンパク質、gRNA、および/また
は複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの態様において
、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。いくつかの
態様において、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。いくつ
かの態様において、薬学的組成物は、gRNAおよびカチオン性脂質と複合体を形成するRNA-
ガイドヌクレアーゼ(例えばCas9)を含むリボ核タンパク質複合体を含む。ある態様におい
て、薬学的組成物は、gRNA、核酸プログラム可能DNA結合タンパク質、カチオン性脂質、
および薬学的に許容される賦形剤を含む。薬学的組成物は、場合により、1つ以上の追加
の治療活性物質を含むことができる。
【0397】
いくつかの態様において、本明細書に記載される融合タンパク質、gRNA、システム、お
よび/または複合体のいずれかは、薬学的組成物の一部として提供される。いくつかの態
様において、薬学的組成物は、本明細書に提供される融合タンパク質のいずれかを含む。
いくつかの態様において、薬学的組成物は、本明細書に提供されるシステムまたは複合体
のいずれかを含む。いくつかの態様において、薬学的組成物は、gRNAおよびカチオン性脂
質と複合体を形成するRNA-ガイドヌクレアーゼ(例えばCas9)またはその断片を含むリボ
核タンパク質複合体を含む。ある態様において、薬学的組成物は、複数のプログラミング
可能DNA結合タンパク質(例えば、Cas9、ジンクフィンガー、TALE、TALE-Nタンパク質ま
たはそれらの断片)を含むリボ核タンパク質複合体を含む。プログラミング可能DNA結合
タンパク質は、ヌクレアーゼ活性、もしくはニッカーゼ活性を含み得、またはヌクレアー
ゼ活性を含まなくてもよい。ある態様において、薬学的組成物は、gRNA、核酸プログラム
可能DNA結合タンパク質、カチオン性脂質、および薬学的に許容される賦形剤を含む。本
明細書に記載される薬学的組成物は、場合により、1つ以上の追加の治療活性物質を含む
ことができる。
【0398】
いくつかの実施形態において、本明細書で提供される組成物は、対象内で標的化された
ゲノム改変を行うために、対象、例えばヒト対象に投与される。いくつかの実施形態にお
いて、対象から細胞が取得され、本明細書中に提供される医薬組成物のいずれかと接触さ
れる。いくつかの実施形態において、対象から取り出されて医薬組成物とex vivoで接触
された細胞は、任意で、所望のゲノム改変が細胞内で行われたかまたは検出された後に、
対象に再導入される。ヌクレアーゼを含む医薬組成物を送達する方法は公知であり、例え
ば米国特許第6,453,242号、6,503,717号、6,534,261号、6,599,692号、6,607,882号、6,6
89,558号、6,824,978号、6,933,113号、6,979,539号、7,013,219号、および7,163,824号
に記載されており、それらの全ての開示は、その全体が参照により本明細書に組み込まれ
る。本明細書で提供される医薬組成物の説明は、主として、ヒトへの投与に適した医薬組
成物に向けられているが、当業者には、そのような組成物が、あらゆる種類の動物または
生物への投与に一般的に適していることが理解される。種々の動物への投与に適した組成
物を与えるための、ヒトへの投与に適した医薬組成物の改変は十分に理解されており、通
常の熟練した獣医薬理学者は、もし必要だとしても単に通常の実験で、そのような改変を
設計および/または実施することができる。薬学的組成物の投与が意図される対象には、
限定されるものではないが、ヒトおよび/または他の霊長類;哺乳動物、家畜、ペット、お
よびウシ、ブタ、ウマ、ヒツジ、ネコ、イヌ、マウス、および/またはラットなどの商業
的に関連のある哺乳動物;ニワトリ、カモ、ガチョウ及び/又は七面鳥のような商業的に関
連のある鳥類が含まれる。
【0399】
本明細書に記載される薬学的組成物の製剤は、薬学の分野において公知の、または今後
開発される任意の方法によって調製することができる。一般に、このような調製方法は、
活性成分を賦形剤および/または1つ以上の他の補助成分と会合させ、次いで、必要および
/または所望であれば、製品を所望の単回または複数回投与単位に成形および/または包装
する工程を含む。
【0400】
薬学的製剤はさらに、薬学的に許容される賦形剤を含むことができ、それは、本明細書
で使用される場合、所望の特定の剤形に適した、溶媒、分散媒体、希釈剤、または他の液
体ビヒクル、分散または懸濁助剤、界面活性剤、等張剤、増粘剤または乳化剤、保存剤、
固体結合剤、潤滑剤などのいずれかおよび全てを含む。Remington’s The Science and P
ractice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins
, Baltimore, MD, 2006(参照によりその全体が本明細書に組み込まれる)は、薬学的組
成物を製剤化する際に使用される種々の賦形剤およびその調製のための公知の技術を開示
する。ヌクレアーゼを含む医薬組成物を製造するためのさらなる適切な方法、試薬、賦形
剤および溶媒については、参照によりその全体が本明細書に組み込まれるPCT出願PCT/US2
010/055131(2010年11月2日出願、公開番号WO2011053982 A8)も参照のこと。あらゆる従来
の賦形剤媒体は、望ましくない生物学的効果を生じさせること、または他のかたちで医薬
組成物の何らかの他の成分と有害な様式で相互作用することなどによって、物質またはそ
の誘導体と不適合である場合を除き、その使用が本開示の範囲内にあると考えられる。い
くつかの実施形態では、本発明による組成物は、多様な疾患、障害、および/または状態
のいずれかの処置のために使用され得る。
【0401】
[キット、ベクター、細胞]
本開示の種々の態様は、デアミナーゼと、2つの断片に「分割」されたSpnCas9ドメイン
(N末端断片がインテイン系の1つのメンバーを含み、C末端断片がおよびインテイン系の
別のメンバーを含む)と、NLSとを含む核酸塩基エディター融合タンパク質をコードする
ヌクレオチド配列を含む核酸構築物を含むキットを提供し、ここで、該ヌクレオチド配列
は、融合タンパク質の発現を駆動する異種プロモーターの制御下にある。
【0402】
本開示のいくつかの態様は、本明細書に提供される核酸塩基エディター/融合タンパク
質のいずれかを含む細胞(例えば、細菌、酵母、真菌、昆虫、植物、および動物細胞)を
提供する。ある態様において、細胞は、本明細書に提供されるヌクレオチドまたはベクタ
ーのいずれかを含む。
【0403】
本発明の実施は、別段の表示がない限り、分子生物学(組換え技術を含む)、微生物学
、細胞生物学、生化学および免疫学の従来の技術を利用し、これらは当業者の技量の範囲
内である。そのような技術は、“Molecular Cloning: A Laboratory Manual”, second e
dition (Sambrook, 1989); “Oligonucleotide Synthesis”(Gait, 1984); “Animal Cel
l Culture” (Freshney, 1987); “Methods in Enzymology” “Handbook of Experiment
al Immunology” (Weir, 1996); “Gene Transfer Vectors for Mammalian Cells” (Mil
ler and Calos, 1987); “Current Protocols in Molecular Biology” (Ausubel, 1987)
; “PCR: The Polymerase Chain Reaction”, (Mullis, 1994); “Current Protocols i
n Immunology” (Coligan, 1991)などの文献で詳しく説明されている。これらの技術は、
本発明のポリヌクレオチドおよびポリペプチドの製造に適用可能であり、したがって、本
発明の製造および実施において考慮され得る。特定の実施形態のために特に有用な技術は
、以下のセクションで論じられる。
【0404】
以下の実施例は、当業者に本発明のアッセイ、スクリーニング、および治療方法をいか
に作って使用するかの完全な開示および説明を提供するために記載されており、本発明者
らがその発明とみなすものの範囲を限定することを意図するものではない。
【実施例0405】
[実施例1:分割され再構成されたCas9は塩基編集システムにおける機能と活性を保持す
る]
ウイルスベクターは、魅力的な送達システムを提供するが、現在の技術は、より大きな
ポリヌクレオチドを送達する能力に限界がある。塩基編集系に関連するこれらの課題を検
討するために、N末端からC末端の順で、野生型アデノシンデアミナーゼであるTadA、それ
に融合された進化型のTadA、それに融合されたnCas9、それに融合された二部分NLSを含む
融合タンパク質を作製した。該融合タンパク質は、SpCas9の非構造化領域内でN末端断片
とC末端断片に分割され、ガイドRNAをコードする第3のプラスミドとともに2つのベクター
において送達された。nCas9のN末端断片およびC末端断片はそれぞれインテイン-Nおよび
インテイン-Cに融合された。これらのインテインをコードするアミノ酸配列は以下の通り
である。
【0406】
融合体におけるCfa-N インテイン:
CLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQ
MLPIDEIFERGLDLKQVDGLP
【0407】
融合体におけるCfa(GEP)-C インテイン:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNC
【0408】
これらのインテインをコードするポリヌクレオチド配列は以下の通りである。
【0409】
融合体におけるCfa-N インテイン:
TGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGA
GTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAG
AGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAG
ATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCT
【0410】
融合体におけるCfa(GEP)-C インテイン:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGC
【0411】
spCas9の3つの領域が選択され、そこでABE融合タンパク質が、SpCas9の選択された領域
内のAla、Ser、ThrまたはCys残基においてN‐およびC‐末端断片に分割された。これらの
領域はCas9結晶構造解析によって同定されたループ領域に相当する。各断片のN末端がイ
ンテイン-Nに融合され、各断片のC末端が、
図2~4に示されるアミノ酸位置、すなわち、
下記の配列において太字の大文字で示されるS303、T310、T313、S355、A456、S460、A463
、T466、S469、T472、T474、C574、S577、A589、およびS590でインテインCに融合された
。
【0412】
HEK 293細胞をプラスミドでトランスフェクトした。培養細胞でN末端断片とC末端断片
が発現され一緒に連結されたときに、分割インテイン系を用いた融合タンパク質の再構成
が起こり、そこでそれらはガイドRNAと結合し、それによって機能的な核酸塩基編集系を
生成した。使用されたガイドRNAの配列は以下の通りである。
【0413】
20-ntガイドプロトスペーサー(PAM: AGG)
5’-TGTCGAAGTTCGCCCTGGAG-3’
【0414】
ハンマーヘッド型リボザイム(下記配列)が、上記のプロトスペーサーの5’末端に融
合されている。
5’-GTCGACACTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTC-3’
【0415】
21-nt ABCA4ガイドプロトスペーサー(PAM: AGG)
5’-GTGTCGAAGTTCGCCCTGGAG-3’
【0416】
HEK2ガイドプロトスペーサー(PAM: GGG)
5’-GAACACAAAGCATAGACTGC-3’
【0417】
完全ガイド配列は、プロトスペーサー配列が以下の配列の5’-側に直接付加されたもの
である。
5’-GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAAC TTGAAAAAGTGGCACCGAGTCGGTG
CTTTTTT-3’
【0418】
完全ガイド写産物は、20 ntガイドの場合はハンマーヘッド切断前で、以下の通りであ
る。
【0419】
20-ntガイド
5’-GTCGACACTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTCTGTCGA AGTTCGCCCTGGAGGTTTTAGAGCT
AGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT-3’
【0420】
21-ntガイド
5’-GTGTCGAAGTTCGCCCTGGAGGTTTTAGAGCTAGAAATAGCAAGTTAAAA TAAGGCTAGTCCGTTATCAACTTGA
AAAAGTGGCACCGAGTCGGTGCTTTTTT-3’
【0421】
HEK2ガイド
5’-GAACACAAAGCATAGACTGCGTTTTAGAGCTAGAAATAGCAAGTTAAAAT AAGGCTAGTCCGTTATCAACTTGAA
AAAGTGGCACCGAGTCGGTGCTTTTTT-3’
【0422】
塩基編集活性は、ABCA4遺伝子の変化を検出することによってアッセイした。塩基編集
後の配列変化は、ハイスループットシークエンシング (HTS) を用いて検出した。再構成
したABEの活性を、同じ細胞型で発現されたがただし単一プラスミドベクターを用いて送
達されたABE7.10の活性と比較した。これらの実験の結果を
図2-4に示す。
【0423】
図2は、Cas9の第1の領域内、アミノ酸292~365内でABEを2つの断片に分割することが、
再構成された融合タンパク質の塩基編集活性に与える影響を示す。驚くべきことに、再構
成された塩基エディターは、21ヌクレオチド、20ヌクレオチド、およびHEK 2ガイドRNAの
存在下で、単一ベクターで発現された対照塩基エディターと同等の活性を示した。
【0424】
SpCas9のF445~K483およびE565~T637の領域内のアミノ酸においてABEを2つの断片に分
割することが、再構成された融合タンパク質の塩基編集活性に与える影響を
図3に示す。A
BEが分割される位置に関わらず、インテイン系を用いて融合タンパク質が再構成された場
合には、それはABE7.10と同等の活性を示した。断片化融合タンパク質のN-またはC-末端
部分のみを発現した場合には、塩基編集活性は観察されなかった。このように、編集はCa
s9のN末端断片とC末端断片の両方の存在に依存していた。
図4に示すように、分割インテ
イン系を用いて再構成された融合タンパク質は、20ヌクレオチドガイドRNAがハンマーヘ
ッドリボザイムを含んだ場合にも活性を示した。
図2の実験は
図3および
図4とは異なるフ
ォーマットで行われた。
【0425】
ここに報告された結果は、以下の方法および材料を用いて実施された。
【0426】
塩基編集システムを、5882G>A変異を含むレンチウイルス組み入れABCA4ポリヌクレオチ
ドを含む培養HEK 293T細胞(HEK/ABCA4/5882G>A細胞)にトランスフェクトした。トラン
スフェクションは、トランスフェクトされるDNAのμg当たり1.5μLのリポフェクタミン20
00を用いて行った。塩基編集システムは、野生型アデノシンデアミナーゼであるTadA、そ
れに融合されたTadAの進化バージョン、それに融合されたSpCas9、それに融合されたC末
端二部分NLSを含む融合タンパク質、ABE7.10を含む。
【0427】
ABE7.10のN末端およびC末端断片をそれぞれpCAGプラスミドにクローン化し、そこでそ
れらの発現はCAGプロモーターによって駆動された。参照として、CMVプロモーター制御下
のABE7.10をHEK 293T細胞に発現させた。前記核酸配列の各々はコドンを最適化されたも
のである。インテイン-Nに融合されたABE7.10のN末端断片をコードする第1のプラスミド
、インテイン-Cに融合されたABE7.10のC末端断片をコードする第2のプラスミド、および
ガイドRNAを発現するプラスミドという、3つのプラスミドで細胞をトランスフェクトした
。塩基エディターをコードする2つのプラスミドは等モル比でトランスフェクトした(各
半部分を9.05×10-14モル;863 ngの全エディターDNA)。ガイドに関しては、127 ngのガ
イドプラスミド(9.05×10^-14モル)を各トランスフェクションで使用した。
【0428】
対照:二部分NLS(C末端)およびGeneArtコドン最適化を有するpCMV-ABE7.10を490 ng
(9.05×10-14モル)+ pNMG-B8(哺乳動物細胞では発現せず、トランスフェクトされるDN
Aの量をノーマライズするために使用された無関係のプラスミド)。
【0429】
図2~
図4に示された全長ABE7.10およびABE7.10「分割」Cas9をコードするポリヌクレオ
チド配列およびアミノ酸配列は、以下の通りである。
【0430】
完全ABE7.10:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAG
GGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCA
CAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCG
CCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTG
AAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCT
GGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGG
ACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGAC
GACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCG
GGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTC
ACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATT
GCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGAT
GGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCC
GCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACC
CAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAA
CAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGA
CCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGA
CAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACT
GGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTC
GGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCC
GATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGC
CGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACG
TGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAAC
TTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGA
GATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAA
CCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAG
GACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAA
GGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATC
CGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTC
GAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAA
ATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGT
TTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGAC
GCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCA
CCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCT
CCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAA
CTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTG
A
【0431】
ABE7.10_Cfa-N_Split_S303C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTC
GAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAA
CAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGA
CCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0432】
ABE7.10_Cfa-N_Split_T310C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTC
CTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCA
GCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCA
CCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAA
CAGGTGGACGGACTGCCTTGA
【0433】
ABE7.10_Cfa-N_Split_T313C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAA
TACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGT
GTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCA
TCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTG
GACCTGAAACAGGTGGACGGACTGCCTTGA
【0434】
ABE7.10_Cfa-N_Split_S355C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGG
AACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGA
GGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCAC
CGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0435】
ABE7.10_Cfa-N_Split_A456C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGTGCCTGA
GCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACA
GTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTT
CGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGC
CCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0436】
ABE7.10_Cfa-N_Split_S460C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGG
ATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGA
GCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACG
GCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0437】
ABE7.10_Cfa-N_Split_A463C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTC
GAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAA
CAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGA
CCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0438】
ABE7.10_Cfa-N_Split_T466C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGC
AAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCA
GTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACA
AGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGA
CTGCCTTGA
【0439】
ABE7.10_Cfa-N_Split_S469C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTG
CCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCC
TATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCA
AGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAG
GTGGACGGACTGCCTTGA
【0440】
ABE7.10_Cfa-N_Split_T472C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAATGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATAC
GGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTA
CACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCC
GGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGAC
CTGAAACAGGTGGACGGACTGCCTTGA
【0441】
ABE7.10_Cfa-N_Split_T474C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCTGCCTGAGCTACGATACCGAGATCCTGACCGTG
GAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTT
CGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCA
TCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGC
CTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0442】
ABE7.10_Cfa-N_Split_C574C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAG
GGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCA
CAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCG
CCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTG
AAAGAGGACTACTTCAAGAAAATCGAGTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTAT
CGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCG
CTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGAC
CACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGA
CGGACTGCCTTGA
【0443】
ABE7.10_Cfa-N_Split_S577C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAG
GGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCA
CAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCG
CCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTG
AAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTGCCTGAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTT
CCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCC
AGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCC
ACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAA
ACAGGTGGACGGACTGCCTTGA
【0444】
ABE7.10_Cfa-N_Split_A589C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAG
GGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCA
CAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCG
CCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTG
AAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATTGCCTGAG
CTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAG
TGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTC
GAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCC
CATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0445】
ABE7.10_Cfa-N_Split_S590C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCAGCGACAAGAAG
TATTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAA
ATTCAAGGTGCTGGGCAACACCGACAGGCACAGCATCAAGAAGAACCTGATCGGCGCACTGCTGTTCGACTCTGGCGAAA
CAGCCGAGGCCACCAGACTGAAGAGAACAGCCCGCAGACGGTACACCAGAAGAAAGAACCGGATCTGCTACCTCCAAGAG
ATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAA
GAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACC
TGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTATCTGGCCCTGGCTCACATGATCAAGTTC
CGGGGCCACTTCCTGATCGAGGGCGACCTGAATCCTGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC
CTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGAGTGGATGCCAAGGCCATCCTGTCTGCCAGACTGAGCA
AGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTG
AGCCTGGGCCTGACACCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAACTGCAGCTGAGCAAGGACACCTA
CGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAATCTGAGCG
ACGCCATCCTGCTGTCCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGA
TACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTT
CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGC
CCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACC
TTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCC
ATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAG
GCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAG
GGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCA
CAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCG
CCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTG
AAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCTGCCT
GAGCTACGATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCA
CAGTGTACACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTG
TTCGAGTACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCT
GCCCATCGACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0446】
ABE7.10_Cfa-N_Split_S-1C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTCCGGCGGAAGCAGCGGAGGATCTT
CTGGAAGCGAAACCCCAGGCACCAGCGAGTCTGCCACACCAGAATCATCTGGCGGTAGCTCCGGCGGCTGCCTGAGCTAC
GATACCGAGATCCTGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTA
CACCGTGGATAAGAATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGT
ACTGCCTGGAAGATGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATC
GACGAGATCTTTGAGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0447】
ABE7.10_Cfa-N_Split_S-32C:
ATGAGCGAGGTGGAATTCAGCCACGAGTACTGGATGCGGCACGCCCTGACACTGGCCAAAAGAGCTTGGGACGAGAGGGA
AGTGCCTGTGGGAGCTGTGCTGGTGCACAACAACAGAGTGATCGGCGAAGGCTGGAACAGACCCATCGGCAGACACGATC
CTACAGCTCACGCCGAGATCATGGCCCTGAGACAAGGCGGACTGGTCATGCAGAACTACCGGCTGATCGACGCCACACTG
TACGTGACCCTGGAACCTTGCGTGATGTGTGCCGGCGCTATGATCCACAGCAGAATCGGCAGAGTGGTGTTCGGCGCCAG
AGATGCCAAAACAGGCGCTGCCGGAAGCCTGATGGATGTGCTGCATCACCCCGGCATGAACCACAGAGTGGAAATCACCG
AGGGCATCCTGGCCGATGAATGTGCCGCTCTGCTGAGCGACTTCTTCCGGATGCGGCGGCAAGAGATCAAGGCCCAGAAG
AAGGCCCAGTCCAGCACAGATAGCGGCGGATCTAGCGGAGGCAGCTCTGGATCTGAGACACCTGGCACAAGCGAGAGCGC
CACACCTGAAAGTTCTGGCGGTTCTTCTGGCGGCAGCAGCGAGGTCGAGTTCTCTCACGAATATTGGATGAGACACGCTC
TCACCCTGGCTAAGAGAGCCAGGGACGAAAGAGAGGTGCCAGTTGGCGCTGTCCTGGTGTTGAACAATCGCGTCATCGGA
GAAGGATGGAATCGCGCCATTGGCCTGCACGATCCAACCGCACATGCCGAAATTATGGCTCTGCGGCAAGGCGGCCTCGT
GATGCAAAATTACAGACTGATCGATGCTACCCTCTACGTCACCTTCGAGCCCTGTGTCATGTGTGCTGGGGCAATGATTC
ACTCCCGGATTGGCCGCGTGGTGTTTGGAGTGCGGAATGCCAAGACTGGCGCCGCTGGATCTCTGATGGACGTCCTGCAC
TATCCTGGGATGAACCACCGGGTCGAGATCACAGAGGGAATTCTGGCTGACGAGTGCGCTGCCCTGCTGTGCTACTTCTT
TAGAATGCCCAGACAGGTGTTCAACGCCCAGAAAAAAGCTCAGAGCAGCACCGATTGCCTGAGCTACGATACCGAGATCC
TGACCGTGGAATACGGCTTCCTGCCTATCGGCAAGATCGTCGAGGAACGGATCGAGTGCACAGTGTACACCGTGGATAAG
AATGGCTTCGTGTACACCCAGCCTATCGCTCAGTGGCACAACAGAGGCGAGCAAGAGGTGTTCGAGTACTGCCTGGAAGA
TGGCAGCATCATCCGGGCCACCAAGGACCACAAGTTTATGACCACCGACGGCCAGATGCTGCCCATCGACGAGATCTTTG
AGAGAGGCCTGGACCTGAAACAGGTGGACGGACTGCCTTGA
【0448】
ABE7.10_Cfa(GEP)-C_Split_S303C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCACCTCTGAGCGCCT
CTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAG
TACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTA
CAAGTTCATCAAGCCCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGA
GAAAGCAGAGAACCTTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAA
GAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGG
ACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGG
AAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAG
GTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGG
AATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGA
CCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGG
TTCAATGCCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGA
GGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACG
CCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTG
ATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTT
CATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTC
TGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAG
CTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGG
ACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACC
CCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAA
GAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGA
CAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGA
AGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGC
GGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACA
GATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGT
CCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGAC
GCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTA
CAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACA
GCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAAC
GGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAA
TATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGA
TCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTG
GCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAG
CTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCA
AGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTG
GCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGA
GCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAG
TGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCC
GAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCG
GAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGA
TCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAA
AAGCGCAAAGTGTGA
【0449】
ABE7.10_Cfa(GEP)-C_Split_T310C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCGAGATCACCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGATACGACG
AGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGAC
CAGAGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCT
CGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACCTTCGACA
ACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTG
AAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAG
CAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCA
GCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGCCTG
CTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCT
GAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGG
ACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACA
TACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGT
GCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAG
TGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAG
CAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGA
CAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACC
TGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGA
CACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAG
AATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGC
AGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTG
TCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATC
CGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGC
TGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAG
GCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAA
CACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCC
GGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTT
GGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAA
GATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCA
AGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTG
TGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGT
GCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGG
ACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAG
TCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGA
TTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGG
AAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTG
AACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGA
ACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATC
TGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTT
ACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAA
AGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAG
GCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0450】
ABE7.10_Cfa(GEP)-C_Split_T313C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAAGGCACCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACC
AGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAG
AACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTCGAGAAGAT
GGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACCTTCGACAACGGCAGCA
TCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAAC
CGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGC
CTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGT
CCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAG
TACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGA
GCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCA
AGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGAT
CTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACT
GACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGC
AACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGC
AAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCAC
CTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCT
CTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCC
GAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCG
GATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGA
AGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTAC
GATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAA
TCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCA
AGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTC
ATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTA
CGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATT
TCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCC
CTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGC
CAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGA
TCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAG
GGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGG
CGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGA
AGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAA
CTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGA
GGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCC
GGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTG
TACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAA
GCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAG
TGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACC
AACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCT
GGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAG
GCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0451】
ABE7.10_Cfa(GEP)-C_Split_S355C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAAT
TCTACAAGTTCATCAAGCCCATCCTCGAGAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTG
CTGAGAAAGCAGAGAACCTTCGACAACGGCAGCATCCCTCACCAGATCCACCTGGGAGAACTGCACGCCATTCTGCGGAG
ACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAAATCCTGACCTTCAGGATCCCCTACTACG
TGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTC
GAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGA
GAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCG
AGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAA
GTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGA
TCGGTTCAATGCCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGA
ACGAGGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACA
TACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAA
GCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAA
ACTTCATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGAT
TCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGA
CGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGA
AGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAA
CACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGA
CCAAGAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCA
TCGACAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAG
ATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAG
AGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGG
CACAGATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTG
AAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCA
CGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCG
ACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTC
TACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGAC
AAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAG
TGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAG
CTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGT
GGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAA
GCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTC
CCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGA
ACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACA
ATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAG
AGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCA
GGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCG
ACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACA
CGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAA
GAAAAAGCGCAAAGTGTGA
【0452】
ABE7.10_Cfa(GEP)-C_Split_A456C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCA
TCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGAT
AAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAA
AGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGT
TCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAG
ATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTT
CCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCG
AGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGG
GGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGA
CGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGG
TGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAG
ACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGA
GAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCA
GCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGA
CGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTT
TCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCG
AAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAAT
CTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCA
GATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAG
TGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAAC
AACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAG
CGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAA
CCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAG
CGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGT
GCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTA
AGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTG
GCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGAT
CACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGG
ACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAA
CTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAA
GGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGA
TCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGAC
AAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTA
CTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCA
CCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCT
GAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0453】
ABE7.10_Cfa(GEP)-C_Split_S460C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGA
ACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCT
AACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGT
GACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACC
GGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTG
GAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGA
AGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGA
AAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCT
CGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAA
CAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGG
GCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTG
GTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCAC
ACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGA
AAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTAC
GTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGA
CTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCA
AGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCC
GAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCA
CGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCA
CCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCAC
GCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTA
CGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACT
TCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATC
GAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCC
CCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCG
ACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTG
CTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGA
AAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCA
AGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGA
AACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGA
GGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTA
GCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGA
GAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCAC
CATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACG
AGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGC
CCCAAGAAAAAGCGCAAAGTGTGA
【0454】
ABE7.10_Cfa(GEP)-C_Split_A463C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCTGGATGACCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGG
AAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAG
GTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGG
AATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGA
CCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGG
TTCAATGCCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGA
GGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACG
CCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTG
ATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTT
CATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTC
TGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAG
CTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGG
ACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACC
CCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAA
GAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGA
CAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGA
AGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGC
GGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACA
GATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGT
CCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGAC
GCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTA
CAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACA
GCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAAC
GGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAA
TATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGA
TCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTG
GCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAG
CTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCA
AGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTG
GCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGA
GCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAG
TGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCC
GAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCG
GAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGA
TCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAA
AAGCGCAAAGTGTGA
【0455】
ABE7.10_Cfa(GEP)-C_Split_T446C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAGAAAGAGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGG
ACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCC
AAGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAA
GCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGC
AGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCC
AGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCT
TGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGT
TCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGC
ATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCT
GATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGC
ACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAA
GTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAA
CAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAA
ACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGAC
ATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGT
CCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACT
GGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGC
GAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGA
CTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGG
TGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTG
AATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTA
CGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCA
TGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACC
GGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAA
GAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAA
AGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTG
GAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAA
GAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCC
TGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCT
AGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCA
GCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGG
CCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATC
ATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTA
CACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGT
CTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAA
GTGTGA
【0456】
ABE7.10_Cfa(GEP)-C_Split_T469C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCGAGGAAACCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCG
CCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGC
CTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTT
TCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAG
AGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGC
ACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACAT
CGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACA
AAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGAT
AAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGA
CGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCA
ACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGC
AGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGA
GAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGC
TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGA
CTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAG
ATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGC
TGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGAT
AAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGAT
GAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATT
TCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTT
GTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCG
GAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTT
TCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATT
GTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGA
GGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACT
GGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGC
AAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGAT
CGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGC
TGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATAT
GTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGT
GGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCA
ATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTG
TTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCAC
CAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCG
GAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0457】
ABE7.10_Cfa(GEP)-C_Split_T472C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCATCACTCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTC
AGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTAC
GAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGG
CGAGCAGAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACT
TCAAGAAAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCAC
GATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGAC
ACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGA
AGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCC
GGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCT
CACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCG
GCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAG
CCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAA
GCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACG
AGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGAC
TACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAA
GAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACG
CCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGC
TTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAA
GTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGG
ATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACA
GCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGAT
CGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAG
AGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGAT
AAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGAC
AGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCA
AGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAG
AAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCT
CGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACG
GCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTC
CTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCA
CAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACA
AAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTG
ACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGT
GCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACG
AAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0458】
ABE7.10_Cfa(GEP)-C_Split_T474C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCT
TCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTAC
TTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCA
GAAAAAGGCCATCGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGA
AAATCGAGTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGATCTG
CTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACTGAC
CCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAAC
TGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAG
ACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCACCTT
CAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTC
CCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAG
AACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGAT
CGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGC
TGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTACGAT
GTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAATCG
GGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGC
TGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATC
AAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTACGA
CGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCC
AGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTG
ATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAA
GAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCA
CCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGC
AGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGG
CTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGT
ACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTC
AAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGC
CAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGA
AGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTAC
CTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCA
CTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGC
TGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAAC
CTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGA
CGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCG
CCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0459】
ABE7.10_Cfa(GEP)-C_Split_C574C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCTTCGACAGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCC
TGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAG
GACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGA
CGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCC
GGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATT
CACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACAT
TGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGA
TGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGC
CGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACAC
CCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCA
ACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTG
ACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCG
ACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAAC
TGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCT
CGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTC
CGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATG
CCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGAC
GTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAA
CTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCG
AGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAA
ACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAA
GGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAA
AGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAAT
CCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTT
CGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCA
AATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTG
TTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGA
CGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCC
ACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACC
TCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCA
ACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGT
GA
【0460】
ABE7.10_Cfa(GEP)-C_Split_S577C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCGTCGAGATCTCCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACAT
ACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTG
CTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGT
GATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGC
AGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGAC
AGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCT
GGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGAC
ACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGA
ATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCA
GAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGT
CCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCC
GACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCT
GAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGG
CCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAAC
ACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCG
GAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTG
GAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAG
ATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAA
GACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGT
GGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTG
CAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGA
CCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGT
CCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGAT
TTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGA
AAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGA
ACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAA
CAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCT
GGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTA
CCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAA
GAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGG
CGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0461】
ABE7.10_Cfa(GEP)-C_Split_A589C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCAGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACT
TCCTGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATC
GAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTG
GGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCG
ACGGCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAG
GTGTCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCA
GACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAG
AGAACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGC
AGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGG
ACGGGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTT
TTCTGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCC
GAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAA
TCTGACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGC
AGATCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAA
GTGAAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAA
CAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAA
GCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCA
ACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAA
GCGGCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAG
TGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCT
AAGCGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGT
GGCCTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGA
TCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAG
GACCTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGA
ACTGCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGA
AGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAG
ATCAGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGA
CAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGT
ACTTTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATC
ACCGGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTC
TGAGTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0462】
ABE7.10_Cfa(GEP)-C_Split_S590C:
ATGGTCAAGATCATCAGCAGAAAGAGCCTGGGCACCCAGAACGTGTACGATATCGGAGTGGGCGAGCCCCACAACTTTCT
GCTCAAGAATGGCCTGGTGGCCAGCAACTGCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCC
TGGACAACGAAGAGAACGAGGACATCCTTGAGGACATCGTGCTGACACTGACCCTGTTTGAGGACAGAGAGATGATCGAG
GAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGCGGAGATACACCGGCTGGGG
CAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACCATCCTGGACTTTCTGAAGTCCGACG
GCTTCGCCAACAGAAACTTCATGCAGCTGATTCACGACGACAGCCTCACCTTCAAAGAGGATATCCAGAAAGCCCAGGTG
TCCGGCCAGGGCGATTCTCTGCATGAGCACATTGCCAACCTGGCCGGCTCTCCCGCCATTAAGAAAGGCATCCTGCAGAC
AGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGA
ACCAGACCACACAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGC
CAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACG
GGATATGTACGTGGACCAAGAGCTGGACATCAACAGACTGTCCGACTACGATGTGGACCATATCGTGCCCCAGTCTTTTC
TGAAGGACGACTCCATCGACAACAAGGTCCTGACCAGATCCGACAAGAATCGGGGCAAGAGCGACAACGTGCCCTCCGAA
GAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGACAATCT
GACCAAGGCCGAAAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGA
TCACAAAGCACGTGGCACAGATTCTGGACTCTCGGATGAACACTAAGTACGACGAGAACGACAAACTGATCCGCGAAGTG
AAAGTCATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGCGAGATCAACAA
CTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCG
AGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAAGAGATTGGCAAGGCAACC
GCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTCGCCAACGGCGAGATCAGAAAGCG
GCCTCTGATCGAGACAAACGGCGAAACCGGCGAGATTGTGTGGGATAAGGGCAGAGACTTTGCCACAGTGCGGAAAGTGC
TGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAG
CGGAACTCCGACAAGCTGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGATTCTCCTACCGTGGC
CTATAGCGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTCAAGAGCGTGAAAGAGCTGCTGGGGATCA
CCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCGATCGATTTCCTCGAGGCCAAGGGCTACAAAGAAGTGAAAAAGGAC
CTGATCATCAAGCTCCCCAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCTGGCGAACT
GCAGAAGGGAAACGAACTGGCCCTGCCTAGCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGG
GCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATC
AGCGAGTTTAGCAAGAGAGTGATTCTGGCCGACGCCAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGACAA
GCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACT
TTGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAAGAGGTGCTGGACGCCACTCTGATCCACCAGTCTATCACC
GGCCTGTACGAGACACGGATCGACCTGTCTCAACTCGGAGGCGACGAAGGCGCCGATAAGAGAACCGCCGATGGCTCTGA
GTTCGAGAGCCCCAAGAAAAAGCGCAAAGTGTGA
【0463】
完ABE7.10:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDK
GASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQL
KEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFD
DKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHI
ANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENT
QLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWR
QLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVS
DFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMN
FFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKK
DWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF
ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILAD
ANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQ
LGGDEGADKRTADGSEFESPKKKRKV
【0464】
ABE7.10_Cfa-N_Split_S303C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLCLSYDTEILTVEYGFLPIGKIV
EERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0465】
ABE7.10_Cfa-N_Split_T310C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNCLSYDTEILTVEYGF
LPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLK
QVDGLP
【0466】
ABE7.10_Cfa-N_Split_T313C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEICLSYDTEILTVE
YGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGL
DLKQVDGLP
【0467】
ABE7.10_Cfa-N_Split_S355C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNR
GEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0468】
ABE7.10_Cfa-N_Split_A456C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLCLSYDTEILTVEYGFLPIGKIVEERIECT
VYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0469】
ABE7.10_Cfa-N_Split_S460C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNCLSYDTEILTVEYGFLPIGKIVEER
IECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0470】
ABE7.10_Cfa-N_Split_A463C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFCLSYDTEILTVEYGFLPIGKIV
EERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0471】
ABE7.10_Cfa-N_Split_T466C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMCLSYDTEILTVEYGFLPIG
KIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDG
LP
【0472】
ABE7.10_Cfa-N_Split_S469C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKCLSYDTEILTVEYGFL
PIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQ
VDGLP
【0473】
ABE7.10_Cfa-N_Split_T472C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEECLSYDTEILTVEY
GFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLD
LKQVDGLP
【0474】
ABE7.10_Cfa-N_Split_T474C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETICLSYDTEILTV
EYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERG
LDLKQVDGLP
【0475】
ABE7.10_Cfa-N_Split_C574C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDK
GASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQL
KEDYFKKIECLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRATKD
HKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0476】
ABE7.10_Cfa-N_Split_S577C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDK
GASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQL
KEDYFKKIECFDCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVFEYCLEDGSIIRA
TKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0477】
ABE7.10_Cfa-N_Split_A589C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDK
GASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQL
KEDYFKKIECFDSVEISGVEDRFNCLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEVF
EYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0478】
ABE7.10_Cfa-N_Split_S590C:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATL
YVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQK
KAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIG
EGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLH
YPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKK
YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQE
IFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKF
RGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIAL
SLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKR
YDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT
FDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDK
GASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQL
KEDYFKKIECFDSVEISGVEDRFNACLSYDTEILTVEYGFLPIGKIVEERIECTVYTVDKNGFVYTQPIAQWHNRGEQEV
FEYCLEDGSIIRATKDHKFMTTDGQMLPIDEIFERGLDLKQVDGLP
【0479】
ABE7.10_Cfa(GEP)-C_Split_S303C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEK
YKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQ
EDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEK
VLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDR
FNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDE
LVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQ
ELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
GLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHD
AYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVV
AKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNEL
ALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQA
ENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKK
KRKV
【0480】
ABE7.10_Cfa(GEP)-C_Split_T310C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFD
QSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFL
KDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSL
LYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGT
YHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDK
QSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGR
HKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRL
SDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDK
AGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVV
GTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIV
WDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGK
SKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYV
NFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLF
TLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0481】
ABE7.10_Cfa(GEP)-C_Split_T313C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSK
NGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDN
REKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYE
YFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHD
LLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSG
KTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKP
ENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDY
DVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGF
IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTA
LIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDK
GRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKK
LKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFL
YLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLT
NLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0482】
ABE7.10_Cfa(GEP)-C_Split_S355C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDL
LRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNF
EEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRK
VTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKT
YAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGD
SLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKE
HPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITL
KSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF
YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDK
LIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKL
PKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSK
RVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYET
RIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0483】
ABE7.10_Cfa(GEP)-C_Split_A456C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCRGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFD
KNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVE
ISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW
GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQ
TVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNG
RDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDN
LTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREIN
NYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRK
RPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTV
AYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGE
LQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRD
KPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGS
EFESPKKKRKV
【0484】
ABE7.10_Cfa(GEP)-C_Split_S460C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLP
NEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGV
EDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLS
RKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKV
VDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMY
VDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA
ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHH
AHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLI
ETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSV
LVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKG
NELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIR
EQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFES
PKKKRKV
【0485】
ABE7.10_Cfa(GEP)-C_Split_A463C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEK
VLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDR
FNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKL
INGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDE
LVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQ
ELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERG
GLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHD
AYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETN
GETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVV
AKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNEL
ALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQA
ENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKK
KRKV
【0486】
ABE7.10_Cfa(GEP)-C_Split_T446C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP
KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNA
SLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLING
IRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVK
VMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELD
INRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLS
ELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYL
NAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGET
GEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKV
EKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALP
SKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENI
IHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRK
V
【0487】
ABE7.10_Cfa(GEP)-C_Split_T469C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHS
LLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLG
TYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRD
KQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMG
RHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINR
LSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELD
KAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAV
VGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEI
VWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKG
KSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKY
VNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHL
FTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0488】
ABE7.10_Cfa(GEP)-C_Split_T472C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLY
EYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYH
DLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQS
GKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHK
PENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSD
YDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAG
FIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGT
ALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWD
KGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSK
KLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNF
LYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTL
TNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0489】
ABE7.10_Cfa(GEP)-C_Split_T474C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEY
FTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDL
LKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGK
TILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPE
NIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYD
VDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFI
KRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTAL
IKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKG
RDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKL
KSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLY
LASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTN
LGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0490】
ABE7.10_Cfa(GEP)-C_Split_C574C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILE
DIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLI
HDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNS
RERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVL
TRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDS
RMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYD
VRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKK
TEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKN
PIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL
FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYT
STKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0491】
ABE7.10_Cfa(GEP)-C_Split_S577C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIV
LTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDD
SLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRER
MKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRS
DKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMN
TKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRK
MIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEV
QTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPID
FLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVE
QHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTK
EVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0492】
ABE7.10_Cfa(GEP)-C_Split_A589C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCSLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMI
EERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQ
VSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG
SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPS
EEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIRE
VKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKA
TAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILP
KRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKK
DLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQ
ISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSI
TGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0493】
ABE7.10_Cfa(GEP)-C_Split_S590C:
MVKIISRKSLGTQNVYDIGVGEPHNFLLKNGLVASNCLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIE
ERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQV
SGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGS
QILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSE
EVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREV
KVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKAT
AKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPK
RNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKD
LIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQI
SEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSIT
GLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
【0494】
[実施例2:二重AAV感染を介した分割A→G塩基エディター(ABE)の送達は高度なA>G変
換をもたらす]
インテイン-Nおよびインテイン-Cに融合させた分割A→G塩基エディターのAAV送達を、
同時感染細胞において再会合して塩基編集活性を再構成する分割ABEの能力を含め、評価
した。初期研究は、網膜細胞におけるAAV2同時感染のための最適な感染多重度 (MOI) を
決定するために蛍光レポーター構築物を用いて行った。CMV-mCherryおよびCMV-EmGFPを含
有するAAV2発現ベクターを用いて、同時感染をモニターした。フローサイトメトリーによ
り、ARPE-19細胞におけるAAV2同時感染のための最適MOIは60,000~100,000 vg/細胞であ
ることが明らかになった(
図5A)。60,000 vg/細胞での共感染後3日目の蛍光顕微鏡観察
は、EmGFPとmCherryの共局在を示した(
図5B)。単感染でも、CMV-mCherry(
図5C)とCMV
-EmGFP(
図5D)の両方について50,000 vg/細胞で蛍光レポーター発現を有する多数の細胞
を示した(>95%)。蛍光細胞のパーセンテージは総ウイルス負荷に依存していた。
【0495】
二重AAV 2感染を介したARPE-19網膜細胞への分割エディターの送達は、ABCA4 5882Aに
おいて高度なA>G変換を生じた(
図6)。この実験では、Cas9 T310において分割されたABE
(Cas9アミノ酸位置N309でインテイン-Nに融合されたN末端、およびCas9アミノ酸位置T31
0でインテインCに融合されたC末端)を評価した。AAVパッケージングのための通常の方法
に従って(ウイルスベクターコア、マサチューセッツ大学医学部)、以下の構築物をAAV2
ベクター中にパッケージ化した。
AAV2-N: AAV2/ P
CMV Split_ABE7.10
N(T310)-Int
N-rGpA | P
U6sgRNA
AAV2-C: AAV2/ P
CMV Int
C-Split_ABE7.10
C(T310)-rGpA
網膜ARPE-19細胞を、両方のAAVベクターで共感染させるか、各AAVベクター単独で感染
させるか、または未処置とした。20,000~60,000 vg/細胞の様々なMOI(二重感染)で示
されているように、ABCA4 5882AにおいてA>G変換が観察された。二重感染のMOIの増加と
ともにA>G変換は増加した(20,000 vg/細胞で約13%~60,000 vg/細胞で約30%)。A>G変換
は、低いレベルの(<0.1%)インデル形成を伴っていた。N-またはC-末端断片のみで感染
した細胞および未処置細胞では、標的部位でのA>G変換は観察されなかった。
【0496】
[他の実施形態]
上述の説明から、種々の用途および条件に適用するために、本明細書に記載する本発明
に変形および修正を加えることができることが明らかであろう。そのような実施形態もま
た、特許請求の範囲内である。
【0497】
本明細書における変数の定義における要素のリストの記載は、単一要素としての、また
はリストされた要素の組合せ(またはサブコンビネーション)としてのその変数の定義を含
む。本明細書における実施形態の説明は、単一の実施形態として、または任意の他の実施
形態またはその一部と組み合わせての、その実施形態を含む。
【0498】
本明細書で言及されているすべての特許および刊行物は、それぞれの独立した特許およ
び刊行物が、参照により組み入れられることが具体的かつ個別に示されている場合と同じ
程度に、参照により本明細書に組み入れられる。
(a) デアミナーゼとCas9のN末端断片とを含む融合タンパク質をコードする第1のポリヌクレオチドであって、Cas9の前記N末端断片は、Cas9のN末端で始まり、配列番号2における番号付けでCas9のA292~G364の位置で終結する連続配列であり、ここで、Cas9の前記N末端断片は分割インテイン-Nに融合される、第1のポリヌクレオチド、および
(b) Cas9のC末端断片をコードする第2のポリヌクレオチドであって、Cas9の前記C末端断片は、配列番号2における番号付けでCas9のA292~G364の位置で始まりCas9のC末端で終結する連続配列であり、Cas9の前記C末端断片は分割インテイン-Cに融合される、第2のポリヌクレオチド
を含む、組成物。