(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-25
(54)【発明の名称】最適化されたタンパク質リンカーおよび使用方法
(51)【国際特許分類】
C12N 15/62 20060101AFI20230818BHJP
C07K 19/00 20060101ALI20230818BHJP
C12N 9/16 20060101ALI20230818BHJP
C12N 15/63 20060101ALI20230818BHJP
C12N 15/09 20060101ALI20230818BHJP
C12N 1/15 20060101ALI20230818BHJP
C12N 1/19 20060101ALI20230818BHJP
C12N 1/21 20060101ALI20230818BHJP
C12N 5/10 20060101ALI20230818BHJP
【FI】
C12N15/62 Z
C07K19/00 ZNA
C12N9/16
C12N15/63 Z
C12N15/09 110
C12N1/15
C12N1/19
C12N1/21
C12N5/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023504348
(86)(22)【出願日】2021-07-21
(85)【翻訳文提出日】2023-03-20
(86)【国際出願番号】 US2021042457
(87)【国際公開番号】W WO2022020407
(87)【国際公開日】2022-01-27
(32)【優先日】2020-07-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522269901
【氏名又は名称】ペアワイズ・プランツ・サーヴィシズ,インコーポレイテッド
【氏名又は名称原語表記】PAIRWISE PLANTS SERVICES, INC.
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100180231
【氏名又は名称】水島 亜希子
(72)【発明者】
【氏名】ガフィー,シャロン・リー
(72)【発明者】
【氏名】ワッツ,ジョセフ・マシュー
【テーマコード(参考)】
4B065
4H045
【Fターム(参考)】
4B065AA01X
4B065AA01Y
4B065AA57X
4B065AA83X
4B065AA87X
4B065AA87Y
4B065AA90X
4B065AA90Y
4B065AB01
4B065AC14
4B065BA02
4B065CA24
4B065CA60
4H045AA10
4H045AA20
4H045AA30
4H045BA10
4H045BA41
4H045CA01
4H045CA11
4H045DA89
4H045EA60
4H045FA74
(57)【要約】
本発明は、ペプチドリンカーおよび、それに含まれるタンパク質の活性を最適化するために設計されたリンカーを含む融合タンパク質、ならびにそれらを使用する方法に関する。本発明はさらに、新たに設計されたCas12aに基づくアデニン塩基エディタに関する。
【特許請求の範囲】
【請求項1】
配列番号1~24のアミノ酸配列のいずれか1つを含むポリペプチド。
【請求項2】
注目するポリペプチドおよび配列番号1~24のアミノ酸配列のいずれか1つをさらに含む、請求項1に記載のポリペプチド。
【請求項3】
Cas12aドメインおよび配列番号1~24のアミノ酸配列のいずれか1つを含むポリペプチド。
【請求項4】
Cas12aドメイン、注目するポリペプチド、および配列番号1~24のアミノ酸配列のいずれか1つを含む融合タンパク質。
【請求項5】
前記Cas12aドメインがヌクレアーゼ活性部位内に変異を含む、請求項3に記載のポリペプチドまたは請求項4に記載の融合タンパク質。
【請求項6】
前記Cas12aドメインがそのC末端および/またはそのN末端にて配列番号1~24のアミノ酸配列のいずれか1つに連結されている、請求項4または請求項5に記載の融合タンパク質。
【請求項7】
前記Cas12aドメインのC末端が配列番号1~24のアミノ酸配列のいずれか1つのN末端に連結され、配列番号1~24のアミノ酸配列のいずれか1つのC末端が前記注目するポリペプチドのN末端に連結されている、請求項4から6のいずれか1項に記載の融合タンパク質。
【請求項8】
前記Cas12aドメインのN末端が配列番号1~24のアミノ酸配列のいずれか1つのC末端に連結され、配列番号1~24のアミノ酸配列のいずれか1つのN末端が前記注目するポリペプチドのC末端に連結されている、請求項4から6のいずれか1項に記載の融合タンパク質。
【請求項9】
前記注目するポリペプチドが、デアミナーゼ(脱アミノ化)活性(例えば、シトシンデアミナーゼ、アデニンデアミナーゼ)、ニッカーゼ活性、リコンビナーゼ活性、トランスポザーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害活性(例えば、ウラシル-DNAグリコシラーゼインヒビター(UGI))、脱メチル化酵素活性、転写活性化活性、転写抑制活性、転写解除因子活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン酸活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有するタンパク質ドメインを含む、請求項2に記載のポリペプチドまたは請求項4から8のいずれか1項に記載の融合タンパク質。
【請求項10】
前記注目するポリペプチドがアデニンデアミナーゼドメインを含む、請求項2もしくは請求項3に記載のポリペプチドまたは請求項4から8のいずれか1項に記載の融合タンパク質。
【請求項11】
前記アデニンデアミナーゼドメインがTadA(tRNA特異的アデノシンデアミナーゼ)および/またはTadA
*(進化したtRNA特異的アデノシンデアミナーゼ)である、請求項2、3もしくは10のいずれか1項に記載のポリペプチド、または請求項4から10のいずれか1項に記載の融合タンパク質。
【請求項12】
請求項1から3、5もしくは9から11のいずれか1項に記載のポリペプチド、または請求項4から11のいずれか1項に記載の融合タンパク質をコードするポリヌクレオチド。
【請求項13】
前記ポリヌクレオチドが生物における発現のためにコドン最適化されている、請求項12に記載のポリヌクレオチド。
【請求項14】
前記生物が、動物、植物、真菌、古細菌、または細菌である、請求項13に記載のポリヌクレオチド。
【請求項15】
請求項4から9のいずれか1項に記載の融合タンパク質およびガイド核酸を含む複合体。
【請求項16】
請求項10または請求項11に記載の融合タンパク質およびガイド核酸を含む複合体。
【請求項17】
請求項15または請求項16に記載の複合体をコードする核酸構築物。
【請求項18】
(a)請求項1から3、5もしくは9のいずれか1項に記載のポリペプチド、または請求項4から9のいずれか1項に記載の融合タンパク質、および(b)ガイド核酸を含む組成物。
【請求項19】
請求項12から14のいずれか1項に記載のポリヌクレオチドまたは請求項17に記載の核酸構築物を含む発現カセットもしくはベクター。
【請求項20】
(a)Cas12aドメイン、配列番号1~24のいずれか1つのアミノ酸配列を含むリンカー、および注目するポリペプチドを含む融合タンパク質であって、前記Cas12aドメインが配列番号1~24のアミノ酸配列のいずれか1つを介して前記注目するポリペプチドに連結されている融合タンパク質、または前記融合タンパク質をコードする核酸;ならびに
(b)スペーサー配列および反復配列を含むガイド核酸であって、前記ガイド核酸は前記融合タンパク質の前記Cas12aドメインと複合体を形成することができ、前記スペーサー配列は標的核酸にハイブリダイズすることができ、それにより前記Cas12aドメインおよび前記注目するポリペプチドを前記標的核酸にガイドし、それによりシステムが前記標的核酸を修飾(例えば、切断もしくは編集)または調節(例えば、転写を調節)することができるガイド核酸
を含むV型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システム。
【請求項21】
前記Cas12aドメインがヌクレアーゼ活性部位に変異を含む、請求項20に記載のシステム。
【請求項22】
前記Cas12aドメインがそのC末端および/またはそのN末端にて配列番号1~24のアミノ酸配列のいずれか1つに連結されている、請求項20または請求項21に記載のシステム。
【請求項23】
前記Cas12aドメインがそのC末端によって前記注目するポリペプチドのN末端に配列番号1~24のアミノ酸配列のいずれか1つを介して連結されている、請求項20から22のいずれか1項に記載のシステム。
【請求項24】
前記Cas12aドメインがそのN末端によって前記注目するポリペプチドのC末端に配列番号1~24のアミノ酸配列のいずれか1つを介して連結されている、請求項20から22のいずれか1項に記載のシステム。
【請求項25】
前記注目するポリペプチドが、デアミナーゼ(脱アミノ化)活性、ニッカーゼ活性、リコンビナーゼ活性、トランスポザーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害活性(例えば、ウラシル-DNAグリコシラーゼインヒビター(UGI))、脱メチル化酵素活性、転写活性化活性、転写抑制活性、転写解除因子活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン酸活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有する少なくとも1つのポリペプチドまたはタンパク質ドメインを含む、請求項20から24のいずれか1項に記載のシステム。
【請求項26】
前記注目するポリペプチドがアデニンデアミナーゼまたはアデニンデアミナーゼドメインである、請求項20から25のいずれか1項に記載のシステム。
【請求項27】
前記アデニンデアミナーゼがtRNA特異的アデノシンデアミナーゼ(TadA)である、請求項26に記載のシステム。
【請求項28】
注目するポリペプチドがアデニンデアミナーゼダイマー(例えば、第1のアデニンデアミナーゼおよび第2のアデニンデアミナーゼ)である、請求項26に記載のシステム。
【請求項29】
(a)および(b)の一方または両方が、1つまたは複数の発現カセットおよび/またはベクターに含まれている、請求項20から28のいずれか1項に記載のシステム。
【請求項30】
請求項12から14のいずれか1項に記載のポリヌクレオチド、請求項17に記載の核酸構築物、請求項19に記載の発現カセットもしくはベクター、または請求項20から29のいずれか1項に記載のシステムを含む細胞。
【請求項31】
標的核酸を
(a)(i)請求項4から11のいずれか1項に記載の融合タンパク質、および(a)(ii)ガイド核酸;
(b)請求項15もしくは16に記載の複合体;
(c)請求項4から11のいずれか1項に記載の融合タンパク質およびガイド核酸を含む組成物;ならびに/または
(d)請求項20から28のいずれか1項に記載のシステム
と接触させることを含み、それにより標的核酸を修飾する、標的核酸を修飾する方法。
【請求項32】
標的核酸を含む細胞または無細胞システムを
(a)(i)請求項3もしくは請求項5に記載のポリペプチド、または請求項4から11のいずれか1項に記載の融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットもしくはベクター、および(a)(ii)ガイド核酸またはそれを含む発現カセットもしくはベクター;ならびに/または
(b)請求項15もしくは請求項16に記載の複合体をコードする核酸構築物および/またはそれを含む発現カセットもしくはベクター
と、前記融合タンパク質が発現され、前記ガイド核酸と複合体を形成する条件下で、接触させることを含み、前記複合体が前記標的核酸とハイブリダイズし、それにより標的核酸を修飾する、標的核酸を修飾する方法。
【請求項33】
標的核酸を
(a)(i)請求項10または請求項11に記載の融合タンパク質、および(a)(ii)ガイド核酸;
(b)請求項16に記載の複合体;
(c)(i)請求項10もしくは請求項11に記載の融合タンパク質および(c)(ii)ガイド核酸を含む組成物;ならびに/または
(d)(i)請求項26から28のいずれか1項に記載のシステム
と接触させることを含み、前記アデニンデアミナーゼドメインが前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して変異(例えば、点変異)を生じさせる、標的核酸を編集する方法。
【請求項34】
標的核酸を含む細胞または無細胞システムを、
(a)(i)請求項10または請求項11に記載の融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットもしくはベクター、および(a)(ii)ガイド核酸またはそれを含む発現カセットもしくはベクター;
(b)請求項16に記載の複合体をコードする核酸構築物、またはそれを含む発現カセットもしくはベクター、ならびに/または
(c)請求項29に記載のシステム
と、前記融合タンパク質が発現され、前記ガイド核酸と複合体を形成する条件下で、接触させることを含み、前記複合体が前記標的核酸にハイブリダイズし、前記アデニンデアミナーゼドメインが前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して(点)変異を生じさせる、標的核酸を編集する方法。
【請求項35】
前記点変異が、前記標的核酸のセンス(例えば、「+」;鋳型)鎖におけるA→G変換、または前記標的核酸のアンチセンス(例えば、「-」;相補)鎖におけるT→C変換である、請求項33または34に記載の方法。
【請求項36】
(a)結合したガイド核酸(例えば、gRNA)と共にある場合に標的核酸配列に特異的に結合するCas12aドメイン;
(b)第1のアデニンデアミナーゼドメイン、
(c)第2のアデニンデアミナーゼドメイン
を含み、
前記第1および第2のアデニンデアミナーゼドメインが前記Cas12aドメインおよび前記gRNAと共にある場合に前記標的核酸配列の一本鎖部分中のアデノシン塩基を脱アミノ化し、
前記Cas12aドメインは配列番号1~24のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインまたは前記第2のアデニンデアミナーゼドメインに連結されている、融合タンパク質。
【請求項37】
前記第1のアデニンデアミナーゼが野生型アデニンデアミナーゼであり、前記第2のアデニンデアミナーゼドメインが変異/進化したアデニンデアミナーゼドメインであり、前記Cas12aドメインのC末端が配列番号11~15のアミノ酸配列のいずれか1つを介して前記第2のアデニンデアミナーゼドメインのN末端に連結されており;前記Cas12aドメインのC末端が配列番号11~24のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインのN末端に連結されているか;または前記Cas12aドメインのN末端が配列番号1~10のアミノ酸配列のいずれか1つを介して前記第2のアデニンデアミナーゼドメインのC末端に連結されている、請求項36に記載の融合タンパク質。
【請求項38】
(a)第1のアデニンデアミナーゼドメイン;
(b)第2のアデニンデアミナーゼドメイン;および
(c)ヌクレアーゼ活性部位に変異を含むCas12a(Cpf1)ドメイン
を含み、
前記第2のアデニンデアミナーゼドメインは前記第1のアデニンデアミナーゼドメインと異なり、前記第1のアデニンデアミナーゼドメインのC末端が前記第2のデアミナーゼドメインのN末端に連結され、前記Cas12aドメインのN末端が配列番号1~10のアミノ酸配列のいずれか1つを介して前記第2のアデニンデアミナーゼドメインのC末端に連結されている、融合タンパク質。
【請求項39】
前記第1のアデニンデアミナーゼドメインが野生型アデノシンデアミナーゼドメインである、請求項36から38のいずれか1項に記載の融合タンパク質。
【請求項40】
前記第2のアデニンデアミナーゼドメインが変異/進化したアデノシンデアミナーゼドメインである、請求項36から39のいずれか1項に記載の融合タンパク質。
【請求項41】
(a)Cas12a(Cpf1)ドメイン;
(b)第1のアデニンデアミナーゼドメイン;および
(c)第2のアデニンデアミナーゼドメイン、
を含み、
前記第2のアデニンデアミナーゼドメインは前記第1のアデニンデアミナーゼドメインと異なり、前記第1のアデニンデアミナーゼドメインのC末端が前記第2のデアミナーゼドメインのN末端に連結され、前記Cas12aドメインのC末端が前記第1のアデニンデアミナーゼドメインのN末端に連結されており、そして
前記第1のデアミナーゼドメインが野生型アデニンデアミナーゼドメインである場合、前記Cas12aドメインは配列番号11~24のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインのN末端に連結され、前記第1のデアミナーゼドメインが変異/進化したアデニンデアミナーゼドメインである場合、前記Cas12aドメインは配列番号11~15のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインのN末端に連結されている、融合タンパク質。
【請求項42】
前記第1のアデニンデアミナーゼドメインが野生型tRNA特異的アデノシンデアミナーゼまたは変異/進化したtRNA特異的アデノシンデアミナーゼドメインである、請求項41に記載の融合タンパク質。
【請求項43】
前記第2のアデニンデアミナーゼドメインが野生型tRNA特異的アデノシンデアミナーゼまたは変異/進化したtRNA特異的アデノシンデアミナーゼドメインである、請求項41または請求項42に記載の融合タンパク質。
【請求項44】
前記野生型tRNA特異的アデノシンデアミナーゼが野生型大腸菌TadAである、請求項39、42または43のいずれか1項に記載の融合タンパク質。
【請求項45】
前記変異/進化したtRNA特異的アデノシンデアミナーゼドメインが、進化した大腸菌TadA
*である、請求項40、42または43のいずれか1項に記載の融合タンパク質。
【請求項46】
前記大腸菌TadAが配列番号47のアミノ酸配列を含む、請求項44に記載の融合タンパク質。
【請求項47】
前記大腸菌TadA
*が配列番号48のアミノ酸配列を含む、請求項45に記載の融合タンパク質。
【請求項48】
前記Cas12aドメインがヌクレアーゼ活性部位に変異を含む、請求項36から47のいずれか1項に記載の融合タンパク質。
【請求項49】
前記第1のデアミナーゼドメインがリンカーを介して前記第2のデアミナーゼドメインに連結されている、請求項36から48のいずれか1項に記載の融合タンパク質。
【請求項50】
前記リンカーがGSリンカーである、請求項49に記載の融合タンパク質。
【請求項51】
前記GSリンカーが(GSS)n、S(GGS)n(配列番号25)、SGGS(配列番号26)、SGGSGGSGGS(配列番号27)、SGSETPGTSESATPES(配列番号28)、および/またはSGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号29)である、請求項50に記載の融合タンパク質。
【請求項52】
前記リンカーがSGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号29)である、請求項50に記載の融合タンパク質。
【請求項53】
請求項36から52のいずれか1項に記載の融合タンパク質をコードするポリヌクレオチド。
【請求項54】
前記ポリヌクレオチドが生物における発現のためにコドン最適化されている、請求項53に記載のポリヌクレオチド。
【請求項55】
請求項36から52のいずれか1項に記載の融合タンパク質およびガイド核酸を含む複合体。
【請求項56】
請求項55に記載の複合体をコードする核酸構築物。
【請求項57】
請求項53もしくは請求項54に記載のポリヌクレオチドまたは請求項56に記載の核酸構築物を含む発現カセットもしくはベクター。
【請求項58】
請求項53もしくは請求項54に記載のポリヌクレオチドまたは請求項56に記載の核酸構築物または請求項57に記載の発現カセットもしくはベクターを含む細胞。
【請求項59】
請求項36から52のいずれか1項に記載の融合タンパク質およびガイド核酸を含む組成物。
【請求項60】
標的核酸を
(a)(i)請求項36から52のいずれか1項に記載の融合タンパク質、および(a)(ii)ガイド核酸;
(b)請求項55に記載の複合体;ならびに/または
(c)請求項59に記載の組成物
と接触させることを含み、
前記アデニンデアミナーゼドメインは前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して前記標的核酸中に(点)変異を生じさせる、標的核酸を編集する方法。
【請求項61】
標的核酸を含む細胞または無細胞システムを、
(a)(i)請求項53もしくは請求項54に記載のポリヌクレオチドおよび(a)(ii)ガイド核酸、ならびに/または(a)(i)および/もしくは(a)(ii)を含む発現カセットもしくはベクター;ならびに/または
(b)請求項56に記載の核酸構築物および/またはそれを含む発現カセットもしくはベクター
と、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、前記複合体は前記標的核酸とハイブリダイズし、
前記アデニンデアミナーゼドメインは前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して前記標的核酸中に(点)変異を生じさせる、標的核酸を編集する方法。
【請求項62】
前記点変異が、前記標的核酸のセンス(例えば、「+」;鋳型)鎖におけるA→G変換、または前記標的核酸のアンチセンス(例えば、「-」;相補)鎖におけるT→C変換である、請求項60または61に記載の方法。
【請求項63】
前記ガイド核酸が5’から3’に反復配列およびスペーサー配列を含み、前記スペーサー配列が標的核酸(プロトスペーサー)に対して70%~100%相補的である、請求項60または請求項61に記載の方法。
【請求項64】
前記標的核酸がプロトスペーサー隣接モチーフ(PAM)に隣接している、請求項60から63のいずれか1項に記載の方法。
【請求項65】
前記PAMが5’-TTN、5’-TTTVまたは5’-TTTNのヌクレオチド配列を含む、請求項64に記載の方法。
【請求項66】
請求項1から3のいずれか1項に記載のポリペプチド、請求項4から11または36から52のいずれか1項に記載の融合タンパク質を、場合によってはその使用説明書と共に含むキット。
【請求項67】
請求項12から14、53もしくは54のいずれか1項に記載のポリヌクレオチド、および/またはそれを含む発現カセットもしくはベクターを、場合によってはその使用説明書と共に含むキット。
【請求項68】
Cas12aガイド核酸および/またはそれを含む発現カセットもしくはベクターをさらに含む、請求項66または67に記載のキット。
【請求項69】
前記ガイド核酸が、標的核酸配列と同一または相補的な核酸配列を前記ガイド核酸の骨格中にクローニングするためのクローニング部位を含む、請求項68に記載のキット。
【請求項70】
前記ポリペプチドが前記融合タンパク質に融合された1つもしくは複数の核局在化シグナル、またはそれをコードするポリヌクレオチドをさらに含む、請求項66から69のいずれか1項に記載のキット。
【請求項71】
前記ポリヌクレオチドが1つまたは複数の選択マーカーをさらにコードする、請求項66から70のいずれか1項に記載のキット。
【請求項72】
前記ポリヌクレオチドがmRNAであり、前記コードされた融合タンパク質内に1つまたは複数のイントロンをコードする、請求項66から71のいずれか1項に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
配列表の電子ファイルに関する陳述
37C.F.R.§1.821に従って提出した、表題1499.50.WO_ST25.txtの、722,708バイトのサイズの、2021年7月14日に作成した、EFS-Webを介して提出したASCIIテキストフォーマットの配列表を、紙コピーの代わりに提供する。この配列表は、その開示について、引用することにより本明細書の一部をなすものとする。
【0002】
優先権の陳述
本出願は、35U.S.C.§119(e)に従って、2020年7月21日出願の米国仮特許出願第63/054,449号の利益を主張し、この出願の全体の内容は、引用することにより本明細書の一部をなすものとする。
【0003】
本発明の分野
本発明は、ペプチドリンカーおよび、それに含まれるタンパク質の活性を最適化するために設計されたリンカーを含む融合タンパク質、ならびにそれらを使用する方法に関する。本発明はさらに、新たに設計されたCas12aに基づくアデニン塩基エディタに関する。
【背景技術】
【0004】
過去6年間にわたり、CRISPRに基づく遺伝子編集ツール(特にCas9に基づくもの)がますます普及してきた。初期のツールは、相同組換えおよび非相同末端結合などの二本鎖切断修復機構と共に、DNAにおいて平滑末端二本鎖切断を生成するCas9の能力に依存していたが、他の共有結合したエフェクタータンパク質の標的化ツールとして修正バージョンのヌクレアーゼを主に使用する、より新しい方法が開発された。注目すべきことに、Cas9に基づく最初の塩基エディタが、Cas9をデアミナーゼドメインに連結させることによって開発された(例えば、Gaudelli et al.Nature551:464-471(2017)を参照)。最初のシトシン塩基エディタは、RNAおよびDNAの両方におけるシトシンをウラシルへと脱アミノ化するラットのAPOBEC1ドメイン(アポリポタンパク質B mRNA編集酵素)を、以前に発表された、構造化をとらないXTENタンパク質に基づくリンカーを使用して、Cas9のN末端に連結させることによって構築された(Komor et al.Nature533(7603):420-424(2016)。ウラシルDNAグリコシラーゼインヒビター(UGI)ドメインが、塩基除去修復活性を低下させるためにCas9のC末端に連結された。Cas9シトシン塩基エディタ(CBE)の後のバージョンは、柔軟なグリシンおよびセリン残基を追加することで両方のリンカーの長さを2倍にし、追加のUGIドメインを加えた。その後、UGIドメインを取り除き、APOBEC1ドメインを、典型的にはtRNAを標的とするがDNAを標的とするように進化した大腸菌TadA(tRNA特異的アデノシンデアミナーゼ)ドメインに置換することにより、同じアーキテクチャとリンカーを用いて、アデニン塩基エディタ(ABE)が開発された。進化したTadAはアデニンを脱アミノ化して、DNA複製中にシトシンと塩基対を形成するイノシンを形成し、これはA→GまたはT→C編集を導く。ABEの最新のバージョンは、コドンの最適化と改良された核局在化シグナルによって、ヒト細胞での使用に最適化された。
【0005】
Cpf1としても知られるCas12aは、より最近に発見されたCRISPRエンドヌクレアーゼであり、ゲノム編集ツールとしてもますます使用されている。Cas12aは、例えば、そのサイズ、ヌクレアーゼ活性、ヌクレアーゼがそのガイドRNAに結合する方向、認識されるプロトスペーサー隣接モチーフ(PAM)を含むいくつかの点でCas9とは異なる。しかしながら、Cas12aを用いたアデニン塩基編集の成功は実証されていない。したがって、当該技術における欠点を克服するには、Cas12aを使用した新しいアデノシン塩基編集ツールが必要である。
【発明の概要】
【0006】
最先端のCRISPRに基づくアデニン塩基エディタはもっぱら、GS-XTEN-GSリンカーを介して進化したTadAヘテロダイマーにCas9のN末端を融合させたものである。これらのCas9に基づくABEはDNAを効率的に編集するが、同様なCas12aへの融合が編集をうまく生成することは見出されていない。Cas9 ABEのリンカー配列は、まだデアミナーゼドメインの位置に基づいて最適化されていない。さらに、Cas9とCas12aの構造上の違いに基づき、Cas9に基づくABEに有用なリンカー配列とドメインアーキテクチャは、Cas12aに基づくABEには理想的ではない可能性がある。本発明者らは、新規のリンカー配列を設計し、Cas12aに基づくアデニン塩基エディタのドメインアーキテクチャを最適化したが、これは、新たな部位の標的化および/または部位特異的塩基編集ツールのレパートリーの拡大を可能とし、かつ/または商業用途に適したものとなり得る。また、本発明の融合タンパク質および/またはそれをコードするポリヌクレオチドを使用して核酸を修飾する方法も提供される。これらのエディタは、商業的に関連する作物のゲノムの編集を含む、原核生物および/または真核生物への応用に使用され得る。
【0007】
本発明の一態様は、配列番号1~24(L1~L24)のアミノ酸配列のいずれか1つを含むポリペプチドを提供する。
【0008】
本発明の第2の態様は、Cas12aドメインおよび配列番号1~24のアミノ酸配列のいずれか1つを含むポリペプチドを提供する。
【0009】
第3の態様は、Cas12aドメイン、注目するポリペプチド、および配列番号1~24のアミノ酸配列のいずれか1つを含む融合タンパク質を提供する。
【0010】
第4の態様は、(a)Cas12aドメイン、配列番号1~24のいずれか1つのアミノ酸配列を含むリンカー、および注目するポリペプチドを含む融合タンパク質であって、前記Cas12aドメインが配列番号1~24のアミノ酸配列のいずれか1つを介して注目するポリペプチドに連結されている融合タンパク質、または前記融合タンパク質をコードする核酸、ならびに(b)スペーサー配列および反復配列を含むガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA、gRNA)であって、前記ガイド核酸は前記融合タンパク質の前記Cas12aドメインと複合体を形成することができ、前記スペーサー配列は標的核酸にハイブリダイズすることができ、それにより前記Cas12aドメインおよび前記注目するポリペプチドを前記標的核酸にガイドし、それにより系が前記標的核酸を修飾または調節することができるガイド核酸を含むV型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システムを提供する。
【0011】
本発明の第5の態様は、(a)結合したガイド核酸(例えば、gRNA)と共にある場合にCas12aドメインが標的核酸配列に特異的に結合する、Cas12aドメイン、(b)第1のアデニンデアミナーゼドメイン、(c)第2のアデニンデアミナーゼドメインを含み、第1および第2のアデニンデアミナーゼドメインが前記Cas12aドメインおよび前記gRNAと共にある場合に前記標的核酸配列の一本鎖部分中のアデノシン塩基を脱アミノ化し、前記Cas12aドメインが配列番号1~24のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインまたは前記第2のアデニンデアミナーゼドメインに連結されている、融合タンパク質を提供する。
【0012】
第6の態様は、(a)第1のアデニンデアミナーゼドメイン、(b)第2のアデニンデアミナーゼドメイン、および(c)ヌクレアーゼ活性部位に変異を含むCas12a(Cpf1)ドメインを含み、前記第2のアデニンデアミナーゼドメインは前記第1のアデニンデアミナーゼドメインと異なり、前記第1のアデニンデアミナーゼドメインのC末端は前記第2のデアミナーゼドメインのN末端に連結され、前記Cas12aドメインのN末端は配列番号1~10(L1~10)のアミノ酸配列のいずれか1つを介して前記第2のアデニンデアミナーゼドメインのC末端に連結されている、融合タンパク質を提供する。
【0013】
第7の態様は、(a)Cas12a(Cpf1)ドメイン、(b)第1のアデニンデアミナーゼドメイン、および(c)第2のアデニンデアミナーゼドメインを含み、前記第2のアデニンデアミナーゼドメインは前記第1のアデニンデアミナーゼドメインと異なり、前記第1のアデニンデアミナーゼドメインのC末端は前記第2のデアミナーゼドメインのN末端に連結され、前記Cas12aドメインのC末端は前記第1のアデニンデアミナーゼドメインのN末端に連結され、そして前記第1のデアミナーゼドメインが野生型アデニンデアミナーゼドメインである場合、前記Cas12aドメインは配列番号11~24(L11~24)のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインのN末端に連結されており、前記第1のデアミナーゼドメインが変異/進化したアデニンデアミナーゼドメインである場合、前記Cas12aドメインは配列番号11~15(L11~15)のアミノ酸配列のいずれか1つを介して前記第1のアデニンデアミナーゼドメインのN末端に連結されている、融合タンパク質を提供する。
【0014】
本発明の第8の態様は、標的核酸を(a)(i)本発明の融合タンパク質および(a)(ii)ガイド核酸、(b)本発明の融合タンパク質およびガイド核酸を含む複合体、(c)本発明の融合タンパク質およびガイド核酸を含む組成物、ならびに/または(d)本発明のシステムと接触させて、標的核酸を修飾することを含む、標的核酸を修飾する方法を提供する。
【0015】
本発明の第9の態様は、標的核酸を含む細胞または無細胞システムを(a)(i)本発明のポリペプチドもしくは融合タンパク質をコードするポリヌクレオチドまたはそれを含む発現カセットもしくはベクター、および(a)(ii)ガイド核酸またはそれを含む発現カセットもしくはベクター、ならびに/または(b)本発明の融合タンパク質を含む複合体およびガイド核酸をコードする核酸構築物および/またはそれを含む発現カセットもしくはベクターと、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、前記複合体が前記標的核酸とハイブリダイズし、それにより標的核酸を修飾する、標的核酸を修飾する方法を提供する。
【0016】
本発明の第10の態様は、標的核酸を(a)(i)本発明の融合タンパク質および(a)(ii)ガイド核酸、(b)本発明の融合タンパク質およびガイド核酸を含む複合体、(c)(i)本発明の融合タンパク質および(c)(ii)ガイド核酸を含む組成物、ならびに/または(d)(i)本発明のシステムと接触させることを含み、前記アデニンデアミナーゼドメインが前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して(点)変異を生じさせる、標的核酸を編集する方法を提供する。
【0017】
本発明の第11の態様は、標的核酸を含む細胞または無細胞システムを(a)(i)本発明の融合タンパク質をコードするポリヌクレオチドまたはそれを含む発現カセットもしくはベクター、および(a)(ii)ガイド核酸またはそれを含む発現カセットもしくはベクター、ならびに/または(b)本発明の融合タンパク質を含む複合体およびガイド核酸をコードする核酸構築物および/またはそれを含む発現カセットもしくはベクターと、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、前記複合体が前記標的核酸とハイブリダイズし、前記アデニンデアミナーゼドメインが前記標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより前記標的核酸を編集して(点)変異を生じさせる、標的核酸を編集する方法を提供する。
【0018】
本発明はさらに、本発明のポリペプチドおよび/または融合タンパク質を含む構築物、複合体、組成物、発現カセット、ベクターおよび細胞、ならびに/または本発明の融合タンパク質および複合体をコードするポリヌクレオチドおよび核酸構築物を提供する。
【0019】
本発明のこれらおよび他の態様は、以下の本発明の説明においてより詳細に記載される。
【配列表フリーテキスト】
【0020】
配列番号1~24は、ポリペプチドを連結するのに有用な本発明のアミノ酸配列である。
配列番号25~29は、ポリペプチドを連結するのに有用な例示的なペプチドリンカーのアミノ酸配列である。
配列番号30~46は、本発明に有用な、例となるCas12aアミノ酸配列である。
配列番号47~48および79~82は、本発明に有用な、例となるTadAアミノ酸配列である。
配列番号49~77および90~96は例示的な融合タンパク質である。
配列番号83~89はスペーサー配列の例である。
【図面の簡単な説明】
【0021】
【
図1】
図1A~Cは、スクリーニングのために選択された本発明のCas12aに基づくアデニン塩基エディタの例示的なドメイン配置を提供している。10個のリンカー設計をCpf1のN末端に融合させたTadAヘテロダイマーと共に選択し(
図1A)、14個をCpf1のC末端に融合させたTadAヘテロダイマーと共に選択した(
図1B)。さらに、14個のC末端リンカーのうちの5つ(Cterm_1、Cterm_4、Cterm_5、C9R、およびCterm_10)をTadAおよびTadA
*ドメインの順序を逆にして選択した(
図1C)。「GS-」はGSリンカーであり、例えばGS-XTEN-GSを含む。
【
図2】
図2は、同じ実験で3つの例示的スペーサーのそれぞれで観察されたLbCas12aヌクレアーゼの平均活性を示している。
【
図3】
図3は、DMNT1スペーサー1を有する本発明の融合タンパク質の編集頻度のグラフである。
【
図4】
図4は、DMNT1スペーサー2を有する本発明の融合タンパク質の編集頻度のグラフである。
【
図5】
図5は、DMNT1スペーサー3を有する本発明の融合タンパク質の編集頻度のグラフである。
【
図6】
図6は、4つの例示的なスペーサーであるRNF2スペーサー1、RNF2スペーサー2、RNF2スペーサー3、およびRNF2スペーサー4のそれぞれで観察されたLbCas12aヌクレアーゼの平均活性を示している。
【
図7】
図7は、RNF2スペーサー1を有する本発明の融合タンパク質で観察されたアデニンからグアニンへの平均編集頻度を示すグラフである。
【
図8】
図8は、RNF2スペーサー2を有する本発明の融合タンパク質で観察されたアデニンからグアニンへの平均編集頻度を示すグラフである。
【
図9】
図9は、RNF2スペーサー3を有する本発明の融合タンパク質で観察されたアデニンからグアニンへの平均編集頻度を示すグラフである。
【
図10】
図10は、RNF2スペーサー4を有する本発明の融合タンパク質で観察されたアデニンからグアニンへの平均編集頻度を示すグラフである。
【発明を実施するための形態】
【0022】
次に本発明を、本発明の実施形態を示す添付の図面および実施例を参照して、以降で説明する。この説明は、本発明が実行され得る様々な全方法の詳細なカタログであることも、本発明に加えられ得る全ての特徴であることも意図されない。例えば、一実施形態に関して具体的に説明される特徴が、他の実施形態に組み込まれてもよく、そして特定の実施形態に関して具体的に説明される特徴が、その実施形態から消されてもよい。ゆえに、本発明は、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを、除外することも省略することもできることを意図する。また、本明細書中で示唆される種々の実施形態に対する、本発明から逸脱しない多数の変形および追加が、本開示を考慮して、当業者にとって明らかであろう。それゆえに、以下の説明は、本発明の一部の特定の実施形態を示すことが意図されており、全ての配列、それらの組合せおよび変形を網羅的に指定することは意図されない。
【0023】
別段定義されない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が属する技術の当業者によって一般的に理解されるのと同じ意味を有する。本明細書中で本発明の説明に用いられる専門用語は、特定の実施形態のみを説明する目的のものであり、本発明の限定であることは意図されない。
【0024】
本明細書中で引用される全ての刊行物、特許出願、特許、および他の参照は、参照が示されるセンテンスおよび/または段落に関連する教示について、それらの全体が、引用することにより本明細書の一部をなすものとする。
【0025】
文脈が別途指示しない限り、本明細書中に記載される本発明の種々の特徴を、あらゆる組合せで用いることができることが具体的に意図される。さらに、本発明はまた、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを除外することも省略することもできることを意図する。組成物が、構成要素A、B、およびCを含むと明細書が述べているかを示すために、A、B、もしくはCのいずれか、またはそれらの組合せを単独で、またはあらゆる組合せで省略かつ放棄することができることが具体的に意図される。
【0026】
本発明および添付の特許請求の範囲の記載に用いられている単数形「a」、「an」、および「the」は、文脈が別途明らかに指示しない限り、複数形を同様に含むことが意図される。
【0027】
また、本明細書中で用いられる「および/または」は、関連する記載された項目の1つまたは複数のあらゆる全ての考えられる組合せ、および択一的に解釈される場合(「または」)の組合せの欠如を指し、かつ包含する。
【0028】
測定可能な値、例えば量または濃度等に言及する場合に本明細書中で用いられる用語「約」は、指定された値の±10%、±5%、±1%、±0.5%、または±0.1%の変動、ならびに指定された値を包含することを意図する。例えば、Xが測定可能な値である場合の「約X」は、X、ならびにXの±10%、±5%、±1%、±0.5%、または±0.1%の変動を含むことを意図する。計測可能な値について本明細書中で提供される範囲は、他のあらゆる範囲および/またはその中の個々の値を含み得る。
【0029】
本明細書中で用いられる「XとYとの間」および「約XとYとの間」等のフレーズは、XおよびYを含むと解釈されるべきである。本明細書中で用いられる「約XとYとの間」等のフレーズは、「約Xと約Yとの間」を意味し、そして「約XからY」等のフレーズは、「約Xから約Y」を意味する。
【0030】
本明細書中で用いられる用語「含む(「comprise」、「comprises」、および「comprising」)」は、明示される特徴、整数、工程、操作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しない。
【0031】
本明細書中で用いられる移行句「から本質的になる」は、特許請求の範囲が、特許請求の範囲に列挙される指定された材料または工程、および特許請求される本発明の基本的かつ新規の特徴に物質的に影響を与えないものを包含すると解釈されるべきであることを意味する。ゆえに、本発明の特許請求の範囲で用いられる場合の用語「から本質的になる」は、「含む」に等しいと解釈されることは意図されない。
【0032】
本明細書中で用いられる用語「増大させる」、「増大させること」、「増大される」、「増強させる」、「増強される」、「増強させること」、および「増強」(およびその文法上の変形)は、対照と比較して少なくとも約25%、50%、75%、100%、150%、200%、300%、400%、500%、またはそれを超える上昇を説明する。
【0033】
本明細書中で用いられる用語「引き下げる」、「引き下げられた」、「引き下げること」、「引下げ」、「減少させる」、および「低下させる」(およびその文法上の変形)は、例えば、対照と比較して少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の低下を説明する。特定の実施形態において、引下げは、検出可能な活性または量をもたらし得ないか、または本質的にもたらし得ない(すなわち、有意でない量、例えば、約10%または5%未満)。
【0034】
「異種」または「組換え」ヌクレオチド配列は、これが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然に存在するヌクレオチド配列の天然に存在しない複数のコピーが挙げられる。
【0035】
「天然」または「野生型」の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列は、天然に存在するか、または内因性の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列を指す。ゆえに、例えば、「野生型mRNA」は、生物内に天然に存在するか、または生物に内因性のmRNAである。「相同」核酸配列は、これが導入される宿主細胞と天然に関連するヌクレオチド配列である。
【0036】
本明細書中で用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」、および「ポリヌクレオチド」は、直鎖状であるか、もしくは分岐している、一本鎖もしくは二本鎖、またはそれらのハイブリッドであるRNAまたはDNAを指す。また、当該用語は、RNA/DNAハイブリッドを包含する。また、dsRNAが合成的に生成される場合、あまり一般的でない塩基、例えばイノシン、5-メチルシトシン、6-メチルアデニン、ヒポキサンチンその他を、アンチセンス、dsRNA、およびリボザイム対形成に用いることができる。例えば、ウリジンおよびシチジンのC-5プロピン類似体を含有するポリヌクレオチドは、高い親和性でRNAに結合すること、そして遺伝子発現の強力なアンチセンスインヒビターであることが示されている。また、他の修飾、例えば、ホスホジエステル骨格、またはRNAのリボース糖基内の2’-ヒドロキシへの修飾をすることができる。
【0037】
本明細書中で用いられる用語「ヌクレオチド配列」は、核酸分子の5’末端から3’末端までの、ヌクレオチドのヘテロポリマーまたはヌクレオチドの配列を指し、cDNA、DNA断片または部分、ゲノムDNA、合成(例えば、化学的に合成された)DNA、プラスミドDNA、mRNA、およびアンチセンスRNA(いずれも一本鎖または二本鎖であり得る)が挙げられる、DNA分子またはRNA分子が挙げられる。また、用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのヘテロポリマーを指すのに本明細書中で互換的に用いられる。本明細書中で提供される核酸分子および/またはヌクレオチド配列が、本明細書中で左から右に5’から3’の向きに示されており、そして米国配列規則、37CFR§§1.821-1.825、および世界知的所有権機関(WIPO)基準ST.25に示されるヌクレオチド性質を示すための標準コードを用いて表される。本明細書中で用いられる「5’領域」は、ポリヌクレオチドの5’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの5’領域内の要素を、ポリヌクレオチドの5’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。本明細書中で用いられる「3’領域」は、ポリヌクレオチドの3’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの3’領域内の要素を、ポリヌクレオチドの3’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。
【0038】
本明細書中で用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、および抗マイクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)等を生成するのに用いることができる核酸分子を指す。遺伝子は、機能タンパク質または遺伝子産物を生成するのに用いることができる場合もあるし、できない場合もある。遺伝子は、コード領域および非コード領域(例えば、イントロン、調節要素、プロモーター、エンハンサ、終結配列、ならびに/または5’および3’非翻訳領域)の双方を含むことができる。遺伝子は、「単離」されていてもよく、これは、天然の状態で核酸と関連して通常見出される構成要素から実質的に、または本質的に遊離している核酸が意図される。そのような構成要素として、他の細胞物質、組換え生成物由来の培地、および/または核酸を化学的に合成するのに用いられる種々の化学物質が挙げられる。
【0039】
用語「変異」は、点変異(例えば、ミスセンス、またはナンセンス、またはフレームシフトをもたらす単一の塩基対の挿入もしくは欠失)、挿入、欠失、および/またはトランケーションを指す。変異が、アミノ酸配列内の残基の、別の残基による置換、または配列内の1つもしくは複数の残基の欠失もしくは挿入である場合、変異は、典型的に、元の残基に続く配列内の残基の位置を同定することによって、そして新たに置換された残基を同定することによって説明される。
【0040】
本明細書中で用いられる用語「相補的な」または「相補性」は、許容可能な塩および温度条件の下での塩基対合によるポリヌクレオチドの天然の結合を指す。例えば、配列「A-G-T」(5’から3’)は、相補的な配列「T-C-A」(3’から5’)に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であってもよいし、一本鎖分子間に総相補性が存在する場合、完全であってもよい。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して大きな影響を有する。
【0041】
本明細書中で用いられる「相補体」は、コンパレータヌクレオチド配列との100%の相補性を意味し得るし、100%未満の相補性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、および99%等の相補性)をも意味し得る。
【0042】
本発明のヌクレオチド配列の「部分」または「断片」は、参照核酸またはヌクレオチド配列と比較して、長さが引き下げられ(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれを超えるヌクレオチドが引き下げられ)、かつ参照核酸またはヌクレオチド配列と同一であるかまたはほぼ同一の(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一の)連続したヌクレオチドのヌクレオチド配列を含む、これから本質的になる、かつ/またはこれからなるヌクレオチド配列を意味することが理解される。本発明に従うそのような核酸断片または部分は、適切な場合には、これが構成成分であるより大きなポリヌクレオチド内に含まれてもよい。一例として、本発明のガイド核酸の反復配列は、野生型Cas12a反復配列の一部を含んでもよい。
【0043】
ポリペプチドに関して本明細書中で用いられる用語「断片」または「部分」は、参照ポリペプチドと比較して長さが引き下げられ、参照ポリペプチドの対応する部分と同一であるかまたはほぼ同一の(例えば、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一)連続したアミノ酸のアミノ酸配列を含む、これから本質的になる、かつ/またはこれからなるポリペプチドを指し得る。そのようなポリペプチド断片は、適切な場合には、それが構成成分であるより大きなポリペプチドに含まれてもよい。一部の実施形態において、ポリペプチド断片は、参照ポリペプチドの少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、260、270、280、290、またはそれを超える連続したアミノ酸残基を含むか、それらから本質的になるか、またはそれらからなる。
【0044】
相同性を有する異なる核酸またはタンパク質は、本明細書中で「相同体(homologues)」と称する。用語相同体は、同じ種および他の種由来の相同配列、ならびに同じ種および他の種由来のオーソログ配列を含む。「相同性」は、位置同一性(例えば、配列類似性または同一性)のパーセントに換算した、2つ以上の核酸および/またはアミノ酸配列間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似した機能特性の概念を指す。ゆえに、本発明の組成物および方法はさらに、本発明のヌクレオチド配列およびポリペプチド配列に対する相同体を含む。本明細書中で用いられる「オーソログ」は、種形成の間に共通祖先遺伝子から生じた異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列の相同体は、本発明の前記ヌクレオチド配列に対して実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%)を有する。
【0045】
本明細書中で用いられる「配列同一性」は、2つの最適にアラインされたポリヌクレオチドまたはポリペプチド配列が、構成要素、例えば、ヌクレオチドまたはアミノ酸のアラインメントのウィンドウの全体を通して不変である程度を指す。「同一性」は、Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988)、Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993)、Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994)、Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987)、およびSequence Analysis Primer(Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載されるものが挙げられるがこれらに限定されない、知られている方法によって容易に算出することができる。
【0046】
本明細書中で用いられる用語「配列同一性パーセント」または「同一性パーセント」は、試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリ」)ポリヌクレオチド分子(またはその相補鎖)の直鎖状ポリヌクレオチド配列内の、2つの配列が最適にアラインされた場合の同一のヌクレオチドのパーセンテージを指す。一部の実施形態において、「同一性パーセント」は、参照ポリペプチドと比較したアミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。
【0047】
本明細書中で用いられるフレーズ、2つの核酸分子、ヌクレオチド配列、またはタンパク質配列の文脈における「実質的に同一の」または「実質的同一性」は、以下の配列比較アルゴリズムの1つを用いて、または目視検査によって測定して、最大対応について比較かつアラインした場合のヌクレオチドまたはアミノ酸残基同一性が、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%である2つ以上の配列またはサブ配列を指す。本発明の一部の実施形態において、実質的同一性は、約10ヌクレオチド~約30ヌクレオチド、約15ヌクレオチド~約25ヌクレオチド、約30ヌクレオチド~約40ヌクレオチド、約50ヌクレオチド~約60ヌクレオチド、約70ヌクレオチド~約80ヌクレオチド、約90ヌクレオチド~約100ヌクレオチド、またはそれを超えるヌクレオチド長、およびそれらにおけるあらゆる範囲、最大で配列の完全長である本発明のヌクレオチド配列の連続ヌクレオチドの領域にわたって存在する。一部の実施形態において、ヌクレオチド配列は、少なくとも約20ヌクレオチド(例えば、約20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40ヌクレオチド)にわたって、実質的に同一であり得る。一部の実施形態において、実質的に同一のヌクレオチドまたはタンパク質配列は、これが実質的に同一であるヌクレオチド(またはコードされたタンパク質配列)と実質的に同じ機能を実行する。
【0048】
配列比較について、典型的に、一配列が、試験配列が比較される参照配列として機能する。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピュータに入力されて、必要であれば、サブ配列座標が指定されて、配列アルゴリズムプログラムパラメータが指定される。続いて、配列比較アルゴリズムは、指定されたプログラムパラメータに基づいて、参照配列と比較した試験配列についての配列同一性パーセントを算出する。
【0049】
比較ウィンドウをアラインするための配列の最適なアラインメントが、当業者に周知であり、ツール、例えばSmith and Watermanのローカル相同性アルゴリズム、Needleman and Wunschの相同性アラインメントアルゴリズム、Pearson and Lipmanの類似性の検索方法によって、そして場合によってはこれらのアルゴリズムのコンピュータによる実施、例えばGCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、およびTFASTAによって行われてもよい。試験配列および参照配列のアラインされたセグメントについての「同一性分率」は、参照配列セグメント内の構成要素の総数、例えば、参照配列全体、または参照配列の、定義したより小さな部分で割った、2つのアラインされた配列によって共有される同一の構成要素の数である。配列同一性パーセントは、100を乗算した同一性分率として表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列もしくはその一部、またはより長いポリヌクレオチド配列に対してであってもよい。また、本発明の目的上、「同一性パーセント」は、翻訳されたヌクレオチド配列についてBLASTXバージョン2.0、そしてポリヌクレオチド配列についてBLASTNバージョン2.0を用いて求められてもよい。
【0050】
また、2つのヌクレオチド配列は、2つの配列がストリンジェント条件の下で互いにハイブリダイズする場合、実質的に相補的であると考えてもよい。代表的な一部の実施形態において、実質的に相補的であると考えられる2つのヌクレオチド配列は、高度にストリンジェントな条件の下で、互いにハイブリダイズする。
【0051】
サザンハイブリダイゼーションおよびノーザンハイブリダイゼーション等の核酸ハイブリダイゼーション実験の文脈における「ストリンジェントハイブリダイゼーション条件」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列依存的であり、様々な環境パラメータの下で異なる。核酸のハイブリダイゼーションの広範囲にわたるガイドが、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)において見出される。通常、高度にストリンジェントなハイブリダイゼーションおよび洗浄条件は、定義したイオン強度およびpHでの特定の配列についての熱融点(Tm)よりも約5℃低くなるように選択される。
【0052】
Tmは、標的配列の50%が、完全にマッチするプローブにハイブリダイズする(定義したイオン強度およびpH下での)温度である。特定のプローブについてのTmと等しくなるように、非常にストリンジェントな条件が選択される。サザンブロットまたはノーザンブロットにおいてフィルター上に100を超える相補的な残基を有する相補的なヌクレオチド配列のハイブリダイゼーション用のストリンジェントハイブリダイゼーション条件の例として、ハイブリダイゼーションが一晩実行される、42℃での1mgヘパリン入り50%ホルムアミドがある。高度にストリンジェントな洗浄条件の例として、72℃にて約15分間の0.1 5M NaClがある。ストリンジェント洗浄条件の例として、65℃にて15分間の0.2×SSC洗浄がある(SSCバッファの解説について、以下のSambrook参照)。多くの場合、高ストリンジェンシー洗浄が、バックグラウンドプローブシグナルを取り除くために、低ストリンジェンシー洗浄の後にある。例えば100を超えるヌクレオチドの二重鎖についての中程度のストリンジェンシー洗浄の例として、45℃にて15分間の1×SSCがある。例えば100を超えるヌクレオチドの二重鎖についての低ストリンジェンシー洗浄の例として、40℃にて15分間の4~6×SSCがある。短いプローブ(例えば約10~50ヌクレオチド)について、ストリンジェント条件は、典型的に、約1.0M Naイオン未満の塩濃度、典型的にはpH7.0~8.3にて約0.01~1.0M Naイオン濃度(または他の塩)を包含し、温度は、典型的に、少なくとも約30℃である。また、ストリンジェント条件は、ホルムアミド等の不安定化剤を添加することで達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて無関係なプローブについて観察されるよりも2×(またはより高い)の信号雑音比が、特異的ハイブリダイゼーションの検出を示す。ストリンジェント条件下で互いにハイブリダイズしないヌクレオチド配列は、コードするタンパク質が実質的に同一であるならば、やはり実質的に同一である。これは、例えば、ヌクレオチド配列のコピーが、遺伝コードによって容認される最大コドン縮重を用いて生じる場合に、起こり得る。
【0053】
本発明のあらゆるヌクレオチド配列、ポリヌクレオチドおよび/または組換え核酸構築物は、注目するあらゆる生物において発現のためにコドン最適化されていてもよい。コドン最適化は、当該技術において周知であり、コドン使用頻度バイアスについて、種特異的コドン使用頻度表を用いたヌクレオチド配列の修飾を包含する。コドン使用頻度表は、注目する生物/種について最も高度に発現される遺伝子の配列分析に基づいて作成される。ヌクレオチド配列が核内で発現されることとなる場合、コドン使用頻度表は、注目する種について高度に発現される核遺伝子の配列分析に基づいて作成される。ヌクレオチド配列の修飾は、種特異的コドン使用頻度表を、天然のポリヌクレオチド配列内に存在するコドンと比較することによって決定される。当該技術において理解されているように、ヌクレオチド配列のコドン最適化は、天然のヌクレオチド配列に対して100%未満の同一性(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または99.9%、およびその中のあらゆる範囲または値)を有するが、元の天然のヌクレオチド配列によってコードされるのと同じ機能を有するポリペプチドを依然としてコードするヌクレオチド配列をもたらす。ゆえに、本発明の一部の実施形態において、本発明のポリヌクレオチド、核酸構築物、発現カセット、および/またはベクター(本発明のポリペプチド、融合タンパク質、複合体、例えば、Cas12a、注目するポリペプチド、アデニンデアミナーゼ、リンカーを含む/コードする)は、注目する特定の種、例えば、特定の植物種、特定の細菌種、特定の動物種等における発現のためにコドン最適化されていてもよい。一部の実施形態において、コドン最適化された本発明のポリヌクレオチド、核酸構築物、発現カセットおよび/もしくはベクターは、コドン最適化されていない本発明のポリヌクレオチド、核酸構築物、発現カセットおよび/もしくはベクターに対して約70%~約99.9%、またはそれを超える(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%または100%)同一性を有する。
【0054】
本明細書中に記載される実施形態のいずれにおいても、本発明のポリヌクレオチドまたは核酸構築物は、注目する生物および/または注目する生物の細胞内での発現用の種々のプロモーターおよび他の調節要素と作動可能に関連し得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドまたは核酸構築物を含む発現カセットもしくはベクターはさらに、1つまたは複数のポリヌクレオチドまたは核酸構築物に動作可能に連結した1つまたは複数のプロモーター、エンハンサ、および/またはターミネーターを含んでもよい。
【0055】
本明細書中で用いられる「作動可能に連結した」または「作動可能に関連した」は、示される要素が、互いに機能的に関連しており、かつ通常物理的にも関連していることを意味する。ゆえに、本明細書中で用いられる用語「作動可能に連結した」または「作動可能に関連した」は、機能的に関連する単一の核酸分子上のヌクレオチド配列を指す。ゆえに、第2のヌクレオチド配列に作動可能に連結した第1のヌクレオチド配列は、第1のヌクレオチド配列が第2のヌクレオチド配列と機能的に関係して配置されている状況を意味する。例えば、プロモーターは、プロモーターが前記ヌクレオチド配列の転写または発現をもたらすならば、ヌクレオチド配列と作動可能に関連している。当業者であれば、制御配列(例えばプロモーター)がその発現を導くように機能する限り、制御配列が、作動可能に関連するヌクレオチド配列と連続している必要がないことを理解するであろう。ゆえに、例えば、転写はされるが翻訳されない介在配列が、プロモーターとヌクレオチド配列との間に存在し得、そしてプロモーターは依然として、ヌクレオチド配列に「作動可能に連結している」と考えることができる。
【0056】
本明細書中で用いられる用語、ポリペプチドに関して「連結した」は、一方のポリペプチドの、もう一方への付着を指す。ポリペプチドは、別のポリペプチドに(N末端またはC末端にて)直接(例えば、ペプチド結合を介して)連結されても、リンカーを介して連結されてもよい。
【0057】
用語「リンカー」は、当該技術において認識されており、2つの分子または部分、例えば、Cas12aドメインと核酸-編集ドメイン(例えば、アデノシンデアミナーゼ)等の融合タンパク質の2つのドメインを連結する結合、化学基、または分子を指す。リンカーは、単一の連結分子で構成されてもよいし、複数の連結分子を含んでもよい(例えば、アミノ酸)。一部の実施形態において、リンカーは、有機分子、基、ポリマー、または化学部分であり得る。一部の実施形態において、リンカーは、アミノ酸であってもよいし、ペプチドリンカーであってもよい。一部の実施形態において、ペプチドリンカーは、約4~100、またはそれを超えるアミノ酸長、例えば、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、またはそれを超えるアミノ酸長であり得る。一部の実施形態においては、ペプチドリンカーはGSリンカーであってもよい。一部の実施形態においては、リンカーは、アミノ酸配列SGGS(配列番号25)、(GGS)n、またはS(GGS)n(配列番号26の1つまたは複数の繰り返し)を含んでいてもよく、ここで、nは1~20(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、およびその中のあらゆる範囲または値)である。一部の実施形態において、リンカーは、アミノ酸配列SGGSGGSGGS(配列番号27)を含んでいてもよい。一部の実施形態において、リンカーは、XTENリンカーとも呼ばれるアミノ酸配列、SGSETPGTSESATPES(配列番号28)を含んでいてもよい。一部の実施形態では、リンカーは、GS-XTEN-GSリンカーとも呼ばれるアミノ酸配列SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号29)を含んでいてもよい。一部の実施形態では、リンカーは、配列番号1~24のアミノ酸配列のいずれか1つを含むか、それから本質的になるか、またはそれからなる。
【0058】
「プロモーター」は、プロモーターと作動可能に関連するヌクレオチド配列(例えばコード配列)の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび/または機能RNAをコードし得る。典型的には、「プロモーター」は、RNAポリメラーゼIIの結合部位を含有し、かつ転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域の開始点に対して、5’側、または上流側に見出される。プロモーター領域は、遺伝子発現の調節因子の働きをする他の要素を含んでもよい。これは、TATAボックスコンセンサス配列および多くの場合CAATボックスコンセンサス配列を含む(Breathnach and Chambon,(1981)Annu.Rev.Biochem.50:349)。植物では、CAATボックスは、AGGAボックスによって置換されている場合がある(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211-227)。
【0059】
プロモーターの例として、組換え核酸分子、例えば、「合成核酸構築物」または「タンパク質-RNA複合体」の調製に用いられる構成的、誘導性、時間的に調節された、発生的に調節された、化学的に調節された、組織選好および/または組織特異的プロモーターが挙げられ得る。これらの種々のタイプのプロモーターが、当該技術において知られている。
【0060】
プロモーターの選択は、発現の時間的かつ空間的必要条件に応じて変わってもよいし、形質転換されることとなる宿主細胞に基づいて変わってもよい。様々な多くの生物用のプロモーターが、当該技術において周知である。当該技術において存在する広範囲にわたる知識に基づいて、注目する特定の宿主生物に適したプロモーターを選択することができる。ゆえに、例えば、モデル生物において高度に構成的に発現される遺伝子の上流側のプロモーターについてかなり知られており、そのような知識は、必要に応じて、他のシステムにおいて容易にアクセスすることができ、かつ実行することができる。
【0061】
一部の実施形態において、本発明のポリヌクレオチドおよび/または核酸構築物は、「発現カセット」であってもよいし、または発現カセット内に含まれていてもよい。本明細書中で用いられる「発現カセット」は、例えば、本発明の核酸構築物(例えば、本発明の複合体(例えば、本発明の融合タンパク質およびガイド核酸)をコードする)を含む組換え核酸分子を意味し、核酸構築物は、少なくとも1つの制御配列(例えば、プロモーター)と作動可能に関連する。ゆえに、本発明の一部の実施形態は、例えば、本発明の核酸構築物を発現するように設計された発現カセットを提供する。
【0062】
注目するヌクレオチド配列を含む発現カセットは、キメラであってもよく、これは、その構成要素の少なくとも1つが、その他の構成要素の少なくとも1つに関して、異種であることを意味する(例えば、宿主生物において発現されることとなる、注目するポリヌクレオチドと作動可能に連結した、宿主生物由来のプロモーター。ここで、注目するポリヌクレオチドは、宿主とは異なる生物由来であるか、または当該プロモーターと関連して通常は見出されない)。また、発現カセットは、天然に存在するが、異種発現に有用な組換え形態で得られたものであってもよい。
【0063】
発現カセットは、場合によっては、選択された宿主細胞内で機能的である転写および/または翻訳停止領域(すなわち、停止領域)および/またはエンハンサ領域を含んでもよい。種々の転写ターミネーターおよび/またはエンハンサが、発現カセットに用いるのに入手可能であり、転写の終止および正確なmRNAポリアデニル化を担っている。停止領域および/またはエンハンサ領域は、注目する作動可能に連結されたヌクレオチド配列に固有であってもよく、宿主細胞に固有であってもよく、または別の源に由来してもよい(例えば、プロモーター、注目するヌクレオチド配列、宿主、またはそれらのあらゆる組合せに対して外来であるか、または異種である)。
【0064】
また、本発明の発現カセットは、選択マーカーをコードするヌクレオチド配列を含むことができ、これは、形質転換された宿主細胞を選択するのに用いることができる。本明細書中で用いられる「選択マーカー」は、発現された場合に、マーカーを発現する宿主細胞に目立った表現型を与えるので、そのような形質転換された細胞を、マーカーを有していない細胞から区別することができるヌクレオチド配列を意味する。そのようなヌクレオチド配列は、マーカーが、化学手段によって、例えば選択剤(例えば抗生物質等)を用いることによって選択され得る形質を付与するかどうかに応じて、またはマーカーが単純に、観察もしくは試験を通して、例えばスクリーニング(例えば蛍光)によって識別することができる形質であるかに応じて、選択マーカーまたはスクリーニングマーカーをコードし得る。適した選択マーカーの多くの例が、当該技術において知られており、本明細書中に記載される発現カセットに用いることができる。
【0065】
発現カセットに加えて、本明細書中に記載される核酸分子/構築物およびポリヌクレオチド配列は、ベクターと関連させて用いることができる。用語「ベクター」は、細胞中に核酸(複数可)を伝達するか、送達するか、または導入するための組成物を指す。ベクターは、伝達されるか、送達されるか、導入されるヌクレオチド配列を含む核酸分子を含む。宿主生物の形質転換に用いられるベクターは、当該技術において周知である。ベクターの一般的なクラスの非限定的な例として、以下に限定されないが、自己伝染性であっても可動性であってもよいしそうでなくてもよい二本鎖または一本鎖の直鎖状または環状の形態の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、またはアグロバクテリウム(Agrobacterium)属バイナリーベクターが挙げられる。一部の実施形態において、ウイルスベクターとして、以下に限定されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスのベクターが挙げられ得る。本明細書中で定義されるベクターは、細胞ゲノム中への組込み、または染色体外の存在(例えば、複製起点を有する自律複製プラスミド)のいずれかによって、原核生物宿主または真核生物宿主を形質転換することができる。加えて、含まれるのは、2つの異なる宿主生物内での複製が天然で、または設計によって可能なDNAビヒクルを意味するシャトルベクターであり、これは、アクチノミセスおよび関連する種、細菌、および真核生物(例えば、より高次の植物、哺乳動物、酵母、または真菌の細胞)から選択され得る。一部の実施形態において、ベクター内の核酸は、宿主細胞内での転写に適したプロモーターまたは他の調節要素の制御下にあり、かつこれと作動可能に連結されている。ベクターは、複数の宿主において機能する二元機能性発現ベクターであってもよい。ゲノムDNAの場合には、これは、それ自体のプロモーターまたは他の調節要素を含有してもよく、そしてcDNAの場合には、これは、宿主細胞内での発現に適したプロモーターまたは他の調節要素の制御下にあってもよい。したがって、本発明のポリヌクレオチドおよび核酸構築物、および/またはそれを含む発現カセットが、本明細書中に記載されるベクター、および当該技術において知られているベクター内に含まれていてもよい。
【0066】
本明細書中で用いられる「接触させる」、「接触させている」、「接触した」、およびその文法上の変形は、所望される反応(例えば、形質転換、転写制御、ゲノム編集、ニッキング、および/または切断)の構成要素を、所望される反応を実行するのに適した条件下に一緒に置くことを指す。したがって、例えば、標的核酸に本発明の融合タンパク質およびガイド核酸を接触させて、それにより標的核酸を修飾することができる。一部の実施形態では、標的DNAを、本発明の融合タンパク質をコードするポリヌクレオチドまたは核酸構築物およびガイド核酸と、融合タンパク質が発現され、ガイド核酸と複合体を形成し、それから複合体が標的核酸にハイブリダイズして標的核酸を修飾する条件下で、接触させることができる。
【0067】
本明細書中で用いられる、標的核酸に関する「修飾すること」または「修飾」は、編集(例えば変異)、共有結合修飾、核酸/ヌクレオチド塩基の交換/置換、欠失、切断、ニッキング、および/または標的核酸の転写制御を含む。
【0068】
注目するポリヌクレオチドの文脈における「導入すること」、「導入する」、「導入された」(およびその文法上の変形)は、注目するヌクレオチド配列(例えば、ポリヌクレオチド、核酸構築物、複合体(例えば、タンパク質-RNAキメラ複合体)、および/またはガイド核酸)を、宿主生物または前記生物の細胞(例えば、宿主細胞)に、ヌクレオチド配列が細胞の内部へのアクセスを獲得するように提示することを意味する。よって、例えば、本発明の融合タンパク質をコードするポリヌクレオチドおよびガイド核酸を、生物の細胞に導入して、それにより細胞を形質転換してもよい。
【0069】
本明細書中で用いられる用語「形質転換」は、細胞中への異種核酸の導入を指す。細胞の形質転換は、安定していてもよいし、一過性であってもよい。ゆえに、一部の実施形態において、宿主細胞または宿主生物は、本発明の核酸分子で安定して形質転換される。他の実施形態では、宿主細胞または宿主生物は、本発明の組換え核酸分子で一時的に形質転換される。
【0070】
ポリヌクレオチドの文脈における「一過性の形質転換」は、ポリヌクレオチドが細胞中に導入されて、細胞のゲノム中に組み込まれないことを意味する。
【0071】
細胞中に導入されるポリヌクレオチドの文脈における、「安定して導入すること」または「安定して導入される」によって意図されるのは、導入されたポリヌクレオチドが、細胞のゲノム中に安定して組み込まれていることで、細胞は、ポリヌクレオチドで安定して形質転換されていることである。
【0072】
本明細書中で用いられる「安定した形質転換」または「安定して形質転換された」は、核酸分子が細胞中に導入されて、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その後代によって、より詳細には複数の連続する世代の後代によって遺伝することができる。本明細書中で用いられる「ゲノム」は、核ゲノムおよび色素体ゲノムを含むので、例えば、葉緑体ゲノムまたはミトコンドリアゲノム中への核酸の組込みを含む。また、本明細書中で用いられる安定した形質転換は、例えば微小染色体またはプラスミドとして、染色体外に維持される導入遺伝子を指し得る。
【0073】
一過性の形質転換は、例えば、酵素結合免疫吸着アッセイ(ELISA)またはウェスタンブロットによって検出され得、これらは、生物中に導入される1つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することができる。細胞の安定した形質転換は、例えば、核酸配列との細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイによって検出することができ、これは、生物(例えば植物)中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズするものである。細胞の安定した形質転換は、例えば、核酸配列との細胞のRNAのノーザンブロットハイブリダイゼーションアッセイによって検出することができ、これは、宿主生物中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする。また、細胞の安定した形質転換は、例えば、当該技術において周知のポリメラーゼ連鎖反応(PCR)または他の増幅反応によって検出することができ、これは、導入遺伝子の標的配列とハイブリダイズする特異的プライマー配列を使用して、導入遺伝子配列の増幅をもたらし、これが標準的な方法に従って検出され得る。また、形質転換は、当該技術において周知である直接の配列決定および/またはハイブリダイゼーションプロトコールによって検出することができる。
【0074】
したがって、一部の実施形態において、本発明のヌクレオチド配列、核酸構築物、および/または発現カセットは、一過性に発現され得、かつ/または宿主生物のゲノム中に安定して組み込まれ得る。ゆえに、一部の実施形態において、本発明の融合タンパク質またはそれをコードするポリヌクレオチドは、ガイド核酸と共に細胞に導入されるので、DNAは細胞内で維持され得ない。
【0075】
本発明の核酸構築物/ポリヌクレオチドが、当業者に知られているあらゆる方法によって、細胞中に導入され得る。本発明の一部の実施形態において、細胞の形質転換は、核形質転換を含む。他の実施形態において、細胞の形質転換は、色素体形質転換(例えば葉緑体形質転換)を含む。更なる実施形態において、本発明の核酸構築物/ポリヌクレオチドは、従来の育種技術を介して細胞中に導入することができる。
【0076】
真核生物および原核生物の双方を形質転換する手順は、当該技術において周知であり、かつルーチンであり、文献の全体を通して記載されている(例えば、Jiang et al.2013.Nat.Biotechnol.31:233-239、Ran et al.Nature Protocols8:2281-2308(2013)参照)。
【0077】
したがって、ヌクレオチド配列は、当該技術において周知であるいくつもの方法により、宿主生物またはその細胞中に導入することができる。本発明の方法は、1つまたは複数のヌクレオチド配列を生物中に導入するが、生物の少なくとも1つの細胞の内部にアクセスする特定の方法に依存しない。複数のヌクレオチド配列が導入されることとなる場合、これらは、単一の核酸構築物の一部として、または別々の核酸構築物としてアセンブルすることができ、そして同じであるか、または異なる核酸構築物上に位置決めすることができる。したがって、ヌクレオチド配列は、単一の形質転換事象で、もしくは別々の形質転換事象で、注目する細胞中に導入することができ、またはこれ以外にも、関連する場合、ヌクレオチド配列は、植物中に、例えば育種プロトコールの一部として、組み込むことができる。
【0078】
本発明は、例えば、2つ以上のタンパク質/タンパク質ドメインを連結するために使用され得るポリペプチド(例えば、配列番号1~24)を対象とする。一部の実施形態において、本発明のポリペプチドは、配列番号1~24のアミノ酸配列のいずれか1つに対して約70%~100%同一であり得る(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%同一)。一部の実施形態において、本発明は、配列番号1~24のアミノ酸配列のいずれか1つをコードするポリヌクレオチド、および/または配列番号1~24のアミノ酸配列のいずれか1つをコードするポリヌクレオチドに対して70%~100%(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%)の同一性を有するポリヌクレオチドを提供する。一部の実施形態において、配列番号1~24のアミノ酸配列のいずれか1つをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されていてもよい。
【0079】
本発明は、これらのポリペプチドを含む合成融合タンパク質も対象とする。一部の実施形態において、本発明は配列番号1~24のアミノ酸配列のいずれか1つと、注目するポリペプチドとを含むポリペプチドを提供する。一部の実施形態において、注目するポリペプチドは、そのC末端および/またはそのN末端にて、配列番号1~24のアミノ酸配列のいずれか1つに、場合によってはC末端またはN末端にて、連結されていてもよい。一部の実施形態において、注目するポリペプチドは、同じであっても異なっていてもよい2つ以上の注目するポリペプチド(例えば、2、3、4、5、6、7またはそれ以上)を含んでいてもよく、ここで、注目する2つ以上のポリペプチドの少なくとも2つは、配列番号1~24のアミノ酸配列のいずれか1つを介して互いに連結されていてもよい。
【0080】
本発明に有用な注目するポリペプチドは、デアミナーゼ(脱アミノ化)活性(例えば、シトシンデアミナーゼ、アデニンデアミナーゼ)、ニッカーゼ活性、リコンビナーゼ活性、トランスポザーゼ活性、メチラーゼ活性、グリコシラーゼ(DNAグリコシラーゼ)活性、グリコシラーゼ阻害活性(例えば、ウラシル-DNAグリコシラーゼインヒビター(UGI)、脱メチル化酵素活性、転写活性化活性、転写抑制活性、転写解除因子活性、ヒストン修飾活性、ヌクレアーゼ活性、一本鎖RNA切断活性、二本鎖RNA切断活性、制限エンドヌクレアーゼ活性(例えば、Fok1)、核酸結合活性、メチルトランスフェラーゼ活性、DNA修復活性、DNA損傷活性、ジスムターゼ活性、アルキル化活性、脱プリン酸活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、および/またはフォトリアーゼ活性を有するポリペプチドまたはタンパク質ドメインを含むことができるが、これらに限定されない。一部の実施形態において、注目するポリペプチドは、アデニンデアミナーゼ、シトシンデアミナーゼ、Fok1ヌクレアーゼ、またはウラシル-DNAグリコシラーゼインヒビターである。一部の実施形態において、注目するポリヌクレオチドは、生物における発現のためにコドン最適化されていてもよい。
【0081】
一部の実施形態において、注目するポリペプチドは、CRISPR Cas12aポリペプチドまたはCas12aドメインであり、Cas12aは配列番号1~24のアミノ酸配列のいずれか1つのC末端またはN末端と、そのC末端および/またはN末端で連結されている。
【0082】
一部の実施形態では、Cas12a、注目するポリペプチド、および配列番号1~24のアミノ酸配列のいずれか1つを含む、融合タンパク質が提供される。一部の実施形態において、配列番号1~24のアミノ酸配列は、Cas12aと1つまたは複数(例えば、1、2、3、4、5、6、7またはそれ以上)の注目するポリペプチド(例えば、アデニンデアミナーゼドメイン、例えば、TadA/TadA*)のCas12aドメインに対する最適な配置を可能にする。配列番号1~24のアミノ酸配列は、例えば核酸修飾、例えば塩基編集のために、非標的鎖の一本鎖部分へのアクセスを可能にするように、Cas12aと注目するポリペプチドを連結するために使用されてもよい。
【0083】
一部の実施形態では、Cas12aを注目するポリペプチドと連結するために使用される場合、配列番号1~24のアミノ酸配列は、核酸の修飾または編集のための異なるウィンドウを提供し得る。例えば、注目するポリペプチドをCas12aに連結する配列番号1~24のアミノ酸配列は、標的核酸(例えば、DNA)中の対応するPAM(プロトスペーサー隣接モチーフ)から1から約25ヌクレオチドの編集または修飾のためのウィンドウを提供し得る(例えば、PAMから1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド、およびそのあらゆる範囲または値の編集/修飾ウィンドウ)。一部の実施形態において、編集または修飾ウィンドウは、PAMから1、2、3、4、5、6、7、8、9、10から約11、12、13、14、15、16、17、18、19、20、21、22、23、24、25ヌクレオチドであり得る(例えば、PAMから1から20、1から15、1から10、3から15、4から10、5から25、5から20、5から15、5から10、7から15ヌクレオチド等)。
【0084】
Cas12aは、V型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)-Casヌクレアーゼである。Cas12aは、より周知のII型CRISPR Cas9ヌクレアーゼとは、いくつかの点において異なる。例えば、Cas9は、そのガイドRNA(gRNA、sgRNA)結合部位(プロトスペーサー、標的核酸、標的DNA)の3’側にあるGリッチプロトスペーサー隣接モチーフ(PAM)(3’-NGG)を認識する一方、Cas12aは、標的核酸の5’側に位置決めされているTリッチPAM(5’-ttN、5’TTTN)を認識する。実際、Cas9およびCas12aがそれらのガイドRNAに結合する向きは、それらのN末端およびC末端に関して、大半が逆転している。さらに、Cas12a酵素は、天然のCas9システムにおいて見出されるデュアルガイドRNA(sgRNA(例えば、crRNAおよびtracrRNA))ではなくシングルガイドRNA(gRNA、CRISPRアレイ、crRNA)を用い、そしてCas12aは、自己のgRNAをプロセシングする。加えて、Cas12aヌクレアーゼ活性は、Cas9ヌクレアーゼ活性によって生成される平滑末端の代わりに、スタガーDNA二本鎖切断を生成し、そしてCas12aは、双方のDNA鎖を切断するのに、単一のRuvCドメインをあてにするが、Cas9は、切断にHNHドメインおよびRuvCドメインを利用する。
【0085】
本発明に有用なCRISPR Cas12aポリペプチドまたはCRISPR Cas12aドメインは、知られているか、または後に同定されるあらゆるCas12aヌクレアーゼ(以前にCpf1として知られていた)であり得る(例えば、米国特許第9,790,490号(Cpf1(Cas12a)配列の開示について、引用することにより本明細書の一部をなすものとする)参照)。用語「Cas12a」、「Cas12aポリペプチド」、または「Cas12aドメイン」は、Cas12aのガイド核酸結合ドメイン、および/またはCas12aの活性のある、不活性である、もしくは部分的に活性のあるDNA切断ドメインを含む、Cas12aポリペプチドまたはその断片を含むRNAガイドヌクレアーゼを指す。一部の実施形態において、本発明に有用なCas12aは、変異をヌクレアーゼ活性部位(例えば、Cas12aドメインのRuvC部位)内に含んでもよい。そのヌクレアーゼ活性部位内に変異を有するので、ヌクレアーゼ活性をもはや含んでいないCas12aドメインまたはCas12aポリペプチドは、一般に、deadCas12a(例えばdCas12a)と称される。一部の実施形態において、そのヌクレアーゼ活性部位内に変異を有するCas12aドメインまたはCas12aポリペプチドは、活性が損なわれ得る。
【0086】
一部の実施形態において、Cas12aドメインは、配列番号30~46(例えば、配列番号30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46)のいずれか1つのアミノ酸配列、またはそれをコードするポリヌクレオチドを含むことができるが、これらに限定されない。一部の実施形態において、本発明の融合タンパク質は、ラクノスピラ科(Lachnospiraceae)細菌ND2006のCas12a(LbCas12a)のCas12aドメイン(例えば、配列番号30)を含んでいてもよい。
【0087】
一部の実施形態において、Cas12aドメインをコードするポリヌクレオチドは、生物における発現のためにコドン最適化されていてもよい。ゆえに、一部の実施形態において、本発明は、配列番号30~46のいずれか1つのアミノ酸配列をコードするポリヌクレオチドに対して少なくとも約70%の同一性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%の同一性)を有するポリヌクレオチドを提供する。
【0088】
一部の実施形態では、V型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)関連(Cas)(CRISPR-Cas)システムであって、(a)Cas12aドメイン、配列番号1~24のアミノ酸配列のいずれか1つを含むリンカー、および注目するポリペプチドを含む融合タンパク質であって、前記Cas12aドメインが配列番号1~24のアミノ酸配列のいずれか1つを介して注目するポリペプチドに連結されている融合タンパク質、または前記融合タンパク質をコードする核酸、ならびに(b)スペーサー配列および反復配列を含むガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA)であって、前記ガイド核酸は前記融合タンパク質の前記Cas12aドメインと複合体を形成することができ、前記スペーサー配列は標的核酸にハイブリダイズすることができ、それにより前記Cas12aドメインおよび前記注目するポリペプチドを前記標的核酸にガイドし、それにより前記システムが前記標的核酸を修飾(例えば、切断もしくは編集)または調節(例えば、転写を調節)することができるガイド核酸を含むシステムが提供される。
【0089】
一部の実施形態では、Cas12a、注目するポリペプチド、および配列番号1~24のアミノ酸配列のいずれか1つを含む融合タンパク質が提供され、ここで、注目するポリペプチドはアデニンデアミナーゼポリペプチドまたはドメインである。
【0090】
一部の実施形態において、本発明は、(a)結合したガイド核酸(例えば、gRNA)と共にある場合に標的核酸配列に特異的に結合するCas12aドメイン、(b)第1のアデニンデアミナーゼドメイン、(c)第2のアデニンデアミナーゼドメインを含む融合タンパク質を提供し、ここで、第1および第2のアデニンデアミナーゼドメインは、前記Cas12aドメインおよび前記gRNAと共にある場合に前記標的核酸配列の一本鎖部分中のアデノシン塩基を脱アミノ化し、前記Cas12aドメインは、配列番号1~24のアミノ酸配列のいずれか1つを介して、前記第1のアデニンデアミナーゼドメインまたは前記第2のアデニンデアミナーゼドメインに連結されている。一部の実施形態において、Cas12aドメインのN末端は、配列番号1~10のアミノ酸配列のいずれか1つを介して第2のアデニンデアミナーゼドメインのC末端に連結されてもよく、またはCas12aドメインのC末端は、配列番号11~24のアミノ酸配列のいずれか1つを介して第1のアデニンデアミナーゼドメインもしくは第2のアデニンデアミナーゼドメインのN末端に連結されていてもよい。一部の実施形態において、第1のアデニンデアミナーゼは野生型アデニンデアミナーゼ(例えば、TadA(tRNA特異的アデノシンデアミナーゼ、(例えば、配列番号47))であり、第2のアデニンデアミナーゼドメインは変異/進化したアデニンデアミナーゼドメイン(例えば、TadA*(進化したtRNA特異的アデノシンデアミナーゼ、例えば、配列番号48または78~82))であり、Cas12aドメインのC末端は配列番号11~15のアミノ酸配列のいずれか1つを介して第2のアデニンデアミナーゼドメインのN末端に、または配列番号11~24のアミノ酸配列のいずれか1つを介して第1のアデニンデアミナーゼドメインのN末端に連結されているか、またはCas12aドメインのN末端は配列番号1~10のアミノ酸配列のいずれか1つを介して第2のアデニンデアミナーゼドメインのC末端に連結されている。本発明の例示的な融合タンパク質には、配列番号49~77および/または配列番号90~96のアミノ酸配列が含まれるが、これらに限定されない。
【0091】
一部の実施形態では、(a)第1のアデニンデアミナーゼドメイン、(b)第2のアデニンデアミナーゼドメイン、および(c)Cas12a(Cpf1)ドメインを含む融合タンパク質であって、前記Cas12aドメインはヌクレアーゼ活性部位に変異を含み、前記第2のアデニンデアミナーゼドメインは前記第1のアデニンデアミナーゼドメインと異なり、前記第1のアデニンデアミナーゼドメインのC末端は前記第2のデアミナーゼドメインのN末端に連結され、前記Cas12aドメインのN末端は配列番号1~10(L1~10)のアミノ酸配列のいずれか1つを介して前記第2のアデニンデアミナーゼドメインのC末端に連結されている、融合タンパク質が提供される。一部の実施形態では、第1のアデニンデアミナーゼは、野生型アデニンデアミナーゼ(例えば、TadA)(例えば、配列番号47)であり、第2のアデニンデアミナーゼドメインは、変異/進化したアデニンデアミナーゼドメイン(例えば、TadA*)(例えば、配列番号48または78~82)である。一部の実施形態では、配列番号49~77および/または配列番号90~96のアミノ酸配列のいずれか1つを含む融合タンパク質が提供される。
【0092】
一部の実施形態では、(a)Cas12aドメイン、(b)第1のアデニンデアミナーゼドメイン、および(c)第2のアデニンデアミナーゼドメインを含む融合タンパク質であって、ここで、第2のアデニンデアミナーゼドメインは第1のアデニンデアミナーゼドメインとは異なり、第1のアデニンデアミナーゼドメインのC末端が第2のデアミナーゼドメインのN末端に連結され、Cas12aドメインのC末端が第1のアデニンデアミナーゼドメインのN末端に連結されており、第1のデアミナーゼドメインが野生型アデニンデアミナーゼドメインである場合、Cas12aドメインは配列番号11~24(L11~24)のアミノ酸配列のいずれか1つを介して第1のアデニンデアミナーゼドメインのN末端に連結され、そして第1のデアミナーゼドメインが変異/進化したアデニンデアミナーゼドメインである場合、Cas12aドメインは配列番号11~15(L11~15)のアミノ酸配列のいずれか1つを介して第1のアデニンデアミナーゼドメインのN末端に連結されている、融合タンパク質が提供される。一部の実施形態において、第1のアデニンデアミナーゼドメインは、野生型アデノシンデアミナーゼ(例えば、野生型tRNA特異的アデノシンデアミナーゼドメイン)または変異/進化したアデノシンデアミナーゼドメイン(例えば、変異/進化したtRNA特異的アデノシンデアミナーゼドメイン)である(例えば、配列番号47、48または78~82)。一部の実施形態において、第2のアデニンデアミナーゼドメインは、野生型アデノシンデアミナーゼ(例えば、野生型tRNA特異的アデノシンデアミナーゼドメイン)または変異/進化したアデノシンデアミナーゼドメイン(例えば、変異/進化したtRNA特異的アデノシンデアミナーゼドメイン)である(例えば、配列番号47、48または78~82)。一部の実施形態において、第1のアデニンデアミナーゼおよび第2のアデニンデアミナーゼはダイマーを形成する。一部の実施形態では、配列番号49~77および/または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質が提供される。
【0093】
本発明に有用なアデニンデアミナーゼ(またはアデノシンデアミナーゼ)は、あらゆる生物由来の、知られているか、または後に同定されるあらゆるアデニンデアミナーゼであり得る(例えば、米国特許第10,113,163号(アデニンデアミナーゼの開示について、引用することにより本明細書の一部をなすものとする)参照)。本明細書中で用いられる「アデニンデアミナーゼ」および「アデノシンデアミナーゼ」は、アデニンまたはアデノシンの加水分解的脱アミノ化(例えば、アデニンからのアミン基の除去)を触媒するか、または触媒することができるポリペプチドまたはそのドメインを指す。一部の実施形態では、アデニンデアミナーゼは、アデノシンまたはデオキシアデノシンのイノシンまたはデオキシイノシンへの加水分解的脱アミノ化をそれぞれ触媒し得る。一部の実施形態において、アデノシンデアミナーゼは、DNA中のアデニンまたはアデノシンの加水分解的脱アミノ化を触媒する。一部の実施形態において、本発明の核酸構築物によってコードされるアデニンデアミナーゼは、標的核酸のセンス(例えば、「+」;鋳型)鎖にA→G変換を生じさせ、または標的核酸のアンチセンス(例えば、「-」、相補)鎖にT→C変換を生じさせることができる。本発明に有用なアデニンデアミナーゼは、あらゆる生物由来の、知られているか、または後に同定されるあらゆるアデニンデアミナーゼであり得る(例えば、米国特許第10,113,163号(アデニンデアミナーゼの開示について、引用することにより本明細書の一部をなすものとする)参照)。
【0094】
一部の実施形態において、アデノシンデアミナーゼは、天然に存在するアデニンデアミナーゼの変異体であってもよい。ゆえに、一部の実施形態において、本発明に有用なアデノシンデアミナーゼは、野生型アデニンデアミナーゼに対して約70%~100%同一(例えば、天然に存在するアデニンデアミナーゼに対して約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または100%同一)であり得る。一部の実施形態において、デアミナーゼまたはデアミナーゼは、天然には存在せず、操作された、変異した、または進化したアデノシンデアミナーゼとして参照され得る。ゆえに、例えば、操作された、変異した、または進化したアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインは、天然に存在するアデニンデアミナーゼポリペプチド/ドメインに対して約70%~99.9%同一(例えば、天然に存在するアデニンデアミナーゼポリペプチドまたはアデニンデアミナーゼドメインに対して約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、または99.9%同一)であり得る。一部の実施形態において、アデノシンデアミナーゼは、細菌(例えば、大腸菌、黄色ブドウ球菌(Staphylococcus aureus)、インフルエンザ菌(Haemophilus influenzae)、カウロバクター・クレセンタス(Caulobacter crescentus)等)に由来するものである。一部の実施形態において、アデニンデアミナーゼポリペプチド/ドメインをコードするポリヌクレオチドは、生物(例えば、植物)における発現のためにコドン最適化されていてもよい。
【0095】
一部の実施形態において、アデニンデアミナーゼドメインは、野生型tRNA特異的アデノシンデアミナーゼドメイン、例えば、tRNA特異的アデノシンデアミナーゼ(TadA)および/または変異/進化したアデノシンデアミナーゼドメイン、例えば、変異/進化したtRNA特異的アデノシンデアミナーゼドメイン(TadA*)であってもよい。一部の実施形態において、TadAドメインは大腸菌由来であってもよい。一部の実施形態において、TadAは修飾、例えば、切断され、完全長TadAと比較して、1つまたは複数のN末端および/またはC末端アミノ酸を欠落していてもよい(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、6、17、18、19、または20個のN末端および/またはC末端アミノ酸残基が、全長TadAと比較して欠落していてもよい)。一部の実施形態において、TadAポリペプチドまたはTadAドメインは、N末端メチオニンを含まない。一部の実施形態において、野生型大腸菌TadAは、配列番号47のアミノ酸配列を含む。一部の実施形態において、変異/進化した大腸菌TadA*は、配列番号48または78~82のアミノ酸配列を含む。一部の実施形態において、TadA/TadA*をコードするポリヌクレオチドは、生物における発現のためにコドン最適化されていてもよい。
【0096】
一部の実施形態において、第1のデアミナーゼドメインは、リンカー(例えば、ペプチドリンカー)を介して第2のデアミナーゼドメインに連結されて、アデニンデアミナーゼダイマーを形成してもよい。一部の実施形態において、第1のデアミナーゼドメインは、GSリンカーを介して第2のデアミナーゼドメインに連結されていてもよい。一部の実施形態においては、GSリンカーは、アミノ酸配列SGGS(配列番号25)、(GGS)n、またはS(GGS)n(配列番号26の1つまたは複数の繰り返し)を含んでいてもよく、ここで、nは1~20(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、およびその中のあらゆる範囲または値)である。一部の実施形態において、GSリンカーは、アミノ酸配列SGGSGGSGGS(配列番号27)、SGSETPGTSESATPES(配列番号28)、および/またはSGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号29)を含んでいてもよい。一部の実施形態において、アデニンデアミナーゼダイマーは、SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号29)を介して第2のデアミナーゼドメインに連結された第1のデアミナーゼドメインを含む。一部の実施形態において、第1のデアミナーゼドメインは、そのC末端にて第2のデアミナーゼドメインのN末端に連結されている。一部の実施形態において、第2のデアミナーゼドメインは、そのC末端にて第1のデアミナーゼドメインのN末端に連結されている。
【0097】
本明細書中に記載される注目するポリペプチドに連結されたCas12aドメインを含む本発明の融合タンパク質は、標的核酸を修飾するためにCas12aドメインと共に機能するように設計されたガイドRNA(gRNA、CRISPRアレイ、CRISPR RNA、crRNA)と組み合わせて使用され得る。本発明に有用なガイド核酸(CRISPR RNA、CRISPR DNA、crRNA、crDNA)は、スペーサー配列および反復配列を含む。ガイド核酸は、融合タンパク質のCas12aドメインと複合体を形成することができ、スペーサー配列は、標的核酸にハイブリダイズして、それによりCas12aドメインおよび注目するポリペプチドを標的核酸にガイドすることができ、標的核酸が、融合タンパク質の注目するポリペプチドによって修飾(例えば、切断もしくは編集)または調節(例えば、転写を調節)される。一例として、本明細書中に記載されるアデニンデアミナーゼドメインに連結されたCas12aドメインを含む融合タンパク質を、Cas12aガイド核酸と組み合わせて使用して、標的核酸を修飾することができるが、ここで、融合タンパク質のアデニンデアミナーゼドメインは、標的核酸中のアデノシン塩基を脱アミノ化し、それにより標的核酸を編集する。
【0098】
本明細書中で用いられる「ガイド核酸」、「ガイドRNA」、「gRNA」、「CRISPR RNA/DNA」、「crRNA」または「crDNA」は、標的DNA(例えば、プロトスペーサー)に相補的で(ハイブリダイズする)少なくとも1つのスペーサー配列、および少なくとも1つの反復配列(例えば、V型Cas12a CRISPR-Casシステムの反復、またはその断片もしくは部分)を含む核酸を意味し、ここで、反復配列はスペーサー配列の5’末端に連結されている。本発明のgRNAの設計は、V型Cas12a CRISPR-Casシステムに基づく。一部の実施形態において、Cas12aのgRNAは、5’から3’に、反復配列(完全長またはその一部(「ハンドル」)、例えばシュードノット様構造)およびスペーサー配列を含んでもよい。一部の実施形態において、ガイド核酸は、複数の反復配列-スペーサー配列(例えば、2、3、4、5、6、7、8、9、10個、またはそれを超える反復-スペーサー配列)を含んでもよい(例えば、反復-スペーサー-反復、例えば、反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー等)。本発明のガイド核酸は、合成の、人工の、天然に見出されないものである。gRNAは非常に長くなり得、そして(MS2動員戦略にあるような)アプタマー、またはスペーサーをぶら下げる他のRNA構造として用いられてもよい。
【0099】
本明細書中で用いられる「反復配列」は、例えば、野生型CRISPR Cas12a遺伝子座のあらゆる反復配列、または合成crRNAの反復配列を指す。本発明に有用な反復配列は、CRISPR Cas12a遺伝子座(V型)の、知られているか、もしくは後に同定されるあらゆる反復配列であり得、またはV型CRISPR-Casシステムにおいて機能するように設計された合成反復であり得る。反復配列は、ヘアピン構造および/またはステムループ構造を含んでもよい。一部の実施形態において、反復配列は、その5’末端に、シュードノット様構造(すなわち「ハンドル」)を形成し得る。ゆえに、一部の実施形態において、反復配列は、野生型V型CRISPR遺伝子座由来の反復配列と同一または実質的に同一(例えば、少なくとも70%同一)であり得る。野生型Cas12a(V型)CRISPR遺伝子座由来の反復配列が、確立されたアルゴリズムによって、例えばCRISPRdbによって提供されるCRISPRfinder(Grissa et al.Nucleic Acids Res.35(ウェブサーバー刊行物):W52-7参照)を用いて決定され得る。一部の実施形態において、反復配列またはその一部は、スペーサー配列の5’末端に連結されており、それによって、反復-スペーサー配列(例えば、ガイドRNA、crRNA)を形成する。
【0100】
一部の実施形態において、反復配列は、特定の反復、および反復を含むガイドRNAがプロセシングされるか、プロセシングされないかに応じて、少なくとも10ヌクレオチド(例えば、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50~100個、もしくはそれを超えるヌクレオチド、またはその中のあらゆる範囲もしくは値)を含むか、またはそれから本質的になるか、またはそれからなる。一部の実施形態において、反復配列は、約10~約20、約10~約30、約10~約45、約10~約50、約15~約30、約15~約40、約15~約45、約15~約50、約20~約30、約20~約40、約20~約50、約30~約40、約40~約80、約50~約100個、またはそれを超えるヌクレオチドを含むか、またはそれから本質的になるか、またはそれからなる。
【0101】
スペーサー配列の5’末端に連結された反復配列は、反復配列の一部(例えば、野生型反復配列の5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35個、またはそれを超える連続ヌクレオチド)を含み得る。一部の実施形態において、スペーサー配列の5’末端に連結された反復配列の一部は、約5~約10連続ヌクレオチド(例えば、約5、6、7、8、9、10ヌクレオチド)長であり得、そして野生型Cas12a反復ヌクレオチド配列の同じ領域(例えば5’末端)に対して少なくとも90%(例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)の同一性を有する。一部の実施形態において、反復配列の一部は、その5’末端にてシュードノット様構造(例えば「ハンドル」)を含む。
【0102】
本明細書中で用いられる「スペーサー配列」は、標的核酸(例えば標的DNA)と相補的なヌクレオチド配列(例えばプロトスペーサー)である。スペーサー配列は、標的核酸と完全に相補的であり得るか、または実質的に相補的であり得る(例えば、少なくとも約70%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。ゆえに、一部の実施形態において、スペーサー配列は、標的核酸と比較して、1、2、3、4、または5つのミスマッチを有し得、当該ミスマッチは、連続していてもよいし、非連続であってもよい。一部の実施形態において、スペーサー配列は、標的核酸に対して70%の相補性を有し得る。他の実施形態において、スペーサーヌクレオチド配列は、標的核酸に対して80%の相補性を有し得る。さらに他の実施形態において、スペーサーヌクレオチド配列は、標的核酸(プロトスペーサー)に対して85%、90%、95%、96%、97%、98%、99%、または99.5%等の相補性を有し得る。一部の実施形態において、スペーサー配列は、標的核酸と100%相補的である。スペーサー配列は、長さが約15ヌクレオチド~約30ヌクレオチド(例えば、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30ヌクレオチド、またはその中のあらゆる範囲もしくは値)であり得る。ゆえに、一部の実施形態において、スペーサー配列は、少なくとも約15ヌクレオチド~約30ヌクレオチド長である標的核酸(例えばプロトスペーサ)の領域にわたって完全な相補性または実質的な相補性を有し得る。一部の実施形態において、スペーサーは、約20ヌクレオチド長である。一部の実施形態において、スペーサーは、約23ヌクレオチド長である。
【0103】
一部の実施形態において、ガイドRNAのスペーサー配列の5’領域は、標的DNAと同一であり得る一方、スペーサーの3’領域は、標的DNAと実質的に同一であり得、ゆえに、標的DNAに対するスペーサー配列の全体的な相補性は100%未満であってもよい。ゆえに、例えば、20ヌクレオチドのスペーサー配列(すなわち、シード領域)の5’領域内の例えば、最初の1、2、3、4、5、6、7、8等のヌクレオチドは、標的DNAに100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的(例えば、少なくとも約70%相補的)である。一部の実施形態において、スペーサー配列の5’末端の最初の1~8ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8ヌクレオチド、およびその中のあらゆる範囲)は、標的DNAと100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的である(例えば、少なくとも約50%(例えば、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。一部の実施形態において、スペーサーのシード領域は、長さが約5~6ヌクレオチドであり得る。一部の実施形態では、スペーサーのシード領域は、長さが5ヌクレオチドである。一部の実施形態では、スペーサーのシード領域は、長さが6ヌクレオチドである。
【0104】
本明細書中で用いられる「標的核酸」、「標的DNA」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム内の標的領域」は、本発明のガイドRNA内のスペーサー配列と完全に相補的(100%相補的)または実質的に相補的(例えば、少なくとも70%相補的(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える))である生物のゲノムの領域を指す。CRISPR-Cas12aシステムに有用な標的領域は、生物のゲノム内のPAM配列に対して直ぐ3’側に位置決めされる。標的領域は、PAM配列に直ぐ隣接して位置決めされる少なくとも15個の連続ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ヌクレオチド等)のいずれかから選択され得る。
【0105】
「プロトスペーサー配列」は、CRISPR反復-スペーサー配列のスペーサー配列と完全に、または実質的に相補的である(かつこれにハイブリダイズする)標的二本鎖DNA、具体的には標的DNAの一部(例えば、またはゲノム内の標的領域)を指す(例えば、ガイドRNA、CRISPRアレイ、crRNA)。V型CRISPR-Cas Cas12aシステムの場合、プロトスペーサー配列は、プロトスペーサー隣接モチーフ(PAM)が隣に(例えば直ちに隣接して)位置する。PAMは、非標的鎖上の5’末端に、そして標的鎖の3’末端に位置決めされる(一例として、下記参照)。
【化1】
【0106】
カノニカルCas12a PAMは、Tリッチである。一部の実施形態において、カノニカルCas12a PAM配列は、5’-TTN、5’-TTTN、または5’-TTTVであってよい。一部の実施形態において、非カノニカルPAMが用いられてもよいが、あまり有効でない可能性がある。
【0107】
更なるPAM配列が、確立されている実験的アプローチおよび計算論的アプローチにより、当業者によって決定されてもよい。ゆえに、例えば、実験的アプローチは、考えられる全てのヌクレオチド配列が隣に位置する配列を標的とすることと、例えば標的プラスミドDNAの形質転換により、標的化を受けない配列メンバーを識別することとを含む(Esvelt et al.2013.Nat Methods10:1116-1121、Jiang et al.2013.Nat.Biotechnol.31:233-239)。一部の態様において、計算論的アプローチは、天然のスペーサーのBLAST検索を実行して、バクテリオファージまたはプラスミド内の元の標的DNA配列を同定することと、これらの配列をアラインして、標的配列に隣接する保存された配列を決定することとを含み得る(Briner and Barrangou.2014.Appl.Environ.Microbiol.80:994-1001、Mojica et al.2009.Microbiology155:733-740)。
【0108】
一部の実施形態では、本発明の1つまたは複数(例えば、1、2、3、4、5、6、7、8、またはそれ以上)の融合タンパク質および1つまたは複数(例えば、1、2、3、4、5、6、7、8、またはそれ以上)のガイド核酸(例えば、CRISPR RNA/DNA、例えば、crRNA/crDNA)を含む複合体および組成物が提供される。一部の実施形態では、本発明のポリペプチド、融合タンパク質、ガイド核酸、および/または複合体をコードするポリヌクレオチドまたは核酸構築物が提供される。一部の実施形態では、本発明のポリヌクレオチドおよび/または1つまたは複数のガイド核酸を含む核酸構築物、発現カセットおよび/またはベクターが提供される。一部の実施形態において、本発明の融合タンパク質をコードするポリヌクレオチドは、ガイド核酸を含むものと同じか、または別個のポリヌクレオチド、核酸構築物、発現カセットもしくはベクター上にコードされていてもよい。融合タンパク質が、ガイド核酸を含むものとは別個のポリヌクレオチド、核酸構築物、発現カセットもしくはベクター上にコードされている場合、本発明の融合タンパク質をコードするポリヌクレオチド、核酸構築物、発現カセットもしくはベクターは、ガイド核酸が提供される(例えば、標的核酸と接触させる)前、それと同時に、またはその後に提供されてもよい(例えば、標的核酸と接触させる)。
【0109】
一部の実施形態において、本発明のポリヌクレオチド、核酸構築物、発現カセットおよび/またはベクターは、生物における発現のためにコドン最適化されていてもよい。一部の実施形態において、最適化された本発明のポリヌクレオチド、核酸構築物、または発現カセットは、本発明のポリペプチド、融合タンパク質および複合体をコードするポリヌクレオチド、核酸構築物または発現カセットに対して約70%~100%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%)同一であり得る。
【0110】
一部の実施形態では、本発明の1つまたは複数のポリヌクレオチド、ガイド核酸、核酸構築物、発現カセットまたはベクターを含む細胞が提供される。
【0111】
本発明のポリペプチド、融合タンパク質、ガイドRNA、複合体、および組成物、ならびにそれらをコードするポリヌクレオチド/核酸構築物/発現カセット/ベクターは、標的核酸および/またはそれらの発現を修飾するために使用され得る。
【0112】
一部の実施形態では、本発明の融合タンパク質は、標的核酸の塩基編集に使用するためのアデニン塩基エディタ(ABE)であり、ここで、融合タンパク質は、アデニンデアミナーゼドメインに連結されたCas12aドメインを含む。
【0113】
一部の実施形態では、標的核酸を(a)(i)本発明の融合タンパク質および(a)(ii)ガイド核酸(例えば、CRISPR RNA、CRISPR DNA、crRNA、crDNA)、(b)本発明の融合タンパク質およびガイド核酸を含む複合体、(c)本発明の融合タンパク質およびガイド核酸を含む組成物、ならびに/または(d)本発明のシステムと接触させて、標的核酸を修飾することを含む、標的核酸を修飾する方法が提供される。標的核酸は、標的核酸とガイド核酸を接触させる前、接触と同時、または接触させた後に、融合タンパク質と接触させてもよい。
【0114】
一部の実施形態では、標的核酸を配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質とガイド核酸とに接触させることを含む、標的核酸を修飾する方法が提供される。標的核酸は、標的核酸をガイド核酸と接触させる前、接触と同時、または接触させた後に、本発明の融合タンパク質と接触させてもよい。
【0115】
一部の実施形態では、標的核酸を含む細胞または無細胞システムを(a)(i)本発明のポリペプチドもしくは本発明の融合タンパク質をコードするポリヌクレオチド、またはそれを含む発現カセットもしくはベクター、および(a)(ii)ガイド核酸、および/またはそれを含む発現カセットもしくはベクター、ならびに/または(b)本発明の融合タンパク質およびガイド核酸を含む複合体をコードする核酸構築物、および/またはそれを含む発現カセットまたはベクターと、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、複合体が標的核酸にハイブリダイズして、それにより標的核酸を修飾する、標的核酸を修飾する方法が提供される。別個の構築物上に提供される場合、標的核酸は、標的核酸をガイド核酸と接触させる前、接触と同時、または接触させた後に、融合タンパク質をコードするポリヌクレオチド、核酸構築物、発現カセット、またはベクターと接触させられ得る。
【0116】
一部の実施形態では、標的核酸を含む細胞または無細胞システムを、配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質をコードするポリヌクレオチドまたはそれを含む発現カセットもしくはベクター、およびガイド核酸またはそれを含む発現カセットもしくはベクターと、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、複合体が標的核酸にハイブリダイズして、それにより標的核酸を修飾する、標的核酸を修飾する方法が提供される。別個の構築物上に提供される場合、標的核酸は、標的核酸をガイド核酸と接触させる前、接触と同時、または接触させた後に、融合タンパク質をコードするポリヌクレオチド、核酸構築物、発現カセット、またはベクターと接触させられ得る。
【0117】
一部の実施形態において、本発明は、標的核酸を(a)(i)本発明の融合タンパク質および(a)(ii)ガイド核酸、(b)本発明の融合タンパク質およびガイド核酸を含む複合体、(c)(i)本発明の融合タンパク質および(ii)ガイド核酸を含む組成物、ならびに/または(d)(i)本発明のCRISPR-Casシステムと接触させることを含み、アデニンデアミナーゼドメインが、標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより標的核酸を編集して(点)変異を生成する、標的核酸を編集する方法を提供する。標的核酸は、標的核酸をガイド核酸と接触させる前、接触と同時、または接触させた後に、本発明の融合タンパク質と接触させてもよい。
【0118】
一部の実施形態では、標的核酸を配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質およびガイド核酸に接触させることを含み、それにより標的核酸を編集する、標的核酸を編集する方法が提供される。標的核酸は、標的核酸をガイド核酸と接触させる前、接触と同時、または接触させた後に、本発明の融合タンパク質と接触させてもよい。
【0119】
一部の実施形態では、標的核酸を含む細胞または無細胞システムを(a)(i)本発明の融合タンパク質をコードするポリヌクレオチド、および/またはそれを含む発現カセットもしくはベクター、ならびに(a)(ii)ガイド核酸、および/または(a)(i)および/または(a)(ii)を含む発現カセットもしくはベクター、ならびに/または(b)本発明の融合タンパク質およびガイド核酸を含む複合体をコードする核酸構築物、またはそれを含む発現カセットもしくはベクターと、融合タンパク質が発現し、ガイド核酸と複合体を形成する条件下で、接触させることを含み、複合体が標的核酸にハイブリダイズして、アデニンデアミナーゼドメインが、標的核酸中のアデノシン(A)をグアニン(G)に変換し、それにより標的核酸を編集して(点)変異を生成する、標的核酸を編集する方法が提供される。別個の構築物上に提供される場合、標的核酸は、標的核酸とガイド核酸を接触させる前、接触と同時、または接触させた後に、融合タンパク質と接触させてもよい。
【0120】
一部の実施形態では、標的核酸を含む細胞または無細胞システムを、配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質をコードするポリヌクレオチドまたはそれを含む発現カセットもしくはベクター、およびガイド核酸またはそれを含む発現カセットもしくはベクターと、融合タンパク質が発現され、ガイド核酸と複合体を形成する条件下で、接触させることを含み、複合体が標的核酸にハイブリダイズして、それにより標的核酸を編集する、標的核酸を編集する方法が提供される。配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質をコードするポリヌクレオチドは、ガイド核酸を含むものと同じ発現カセットもしくはベクター上に存在してもよい。配列番号49~77または90~96のアミノ酸配列のいずれか1つを含む融合タンパク質をコードするポリヌクレオチドが、ガイド核酸を含むものとは別個の発現カセットまたはベクター上にある場合、標的核酸を、ガイド核酸を含む発現カセット/ベクターと接触させる前、接触と同時、または接触させた後に、標的核酸を、融合タンパク質を含む発現カセット/ベクターに接触させてもよい。
【0121】
一部の実施形態において、本発明の融合タンパク質のアデニンデアミナーゼは、標的核酸のセンス(例えば、「+」;鋳型)鎖にA→G変換を生じさせ、または標的核酸のアンチセンス(例えば、「-」;相補)鎖にT→C変換を生じさせる。
【0122】
本発明の融合タンパク質およびポリペプチドおよびそれをコードする核酸構築物は、プラスミド配列を含むがこれに限定されない標的核酸におけるA→GまたはT→C変異の生成、アミノ酸の同一性を変更するためのコード配列におけるA→GまたはT→C変異の生成、終止コドンを生成するためのコード配列におけるA→GまたはT→C変異の生成、開始コドンを破壊するためのコード配列におけるA→GまたはT→C変異の生成、転写因子結合を破壊するためのゲノムDNA中における点変異の生成、スプライスジャンクションを破壊するためのゲノムDNA中における点変異の生成、ならびに/または配列番号1~24のアミノ酸配列(例えば、ペプチドリンカー)のいずれか1つを介して他のドメイン(注目するポリペプチド)に融合されたCas12aドメインを含む融合タンパク質によって生成される他の核酸修飾を含むがこれらに限定されない標的核酸の修飾のために、ガイド核酸と組み合わせて使用され得る。
【0123】
本発明の融合タンパク質およびそれをコードするポリペプチドおよび核酸構築物は、動物、植物、真菌、古細菌、または細菌を含むがこれらに限定されない、あらゆる生物の標的核酸を修飾するのに有用であり得る。動物には、哺乳動物、昆虫、魚、鳥等が含まれるが、これらに限定されない。
【0124】
本発明が有用であり得る例示的な哺乳動物は、霊長類(ヒトおよび非ヒト(例えば、チンパンジー、ヒヒ、サル、ゴリラその他))、ネコ、イヌ、マウス、ラット、フェレット、スナネズミ、ハムスター、ウシ、ブタ、ウマ、ヤギ、ロバ、またはヒツジを含み得るが、これらに限定されない。
【0125】
本発明の融合タンパク質ならびにそれをコードするポリペプチドおよび核酸構築物を用いて、あらゆる植物または植物部分の標的核酸が修飾され得る。被子植物、裸子植物、単子葉植物、双子葉植物、C3、C4、CAM植物、蘚苔門植物、シダおよび/またはシダの仲間、微細藻類、ならびに/または大型藻が挙げられるあらゆる植物(または植物の群、例えば、属またはより高いオーダーの分類)が、本発明を実施する際に用いられ得る。本発明に有用な植物および/または植物部分は、あらゆる植物種/変種/品種の植物および/または植物部分であり得る。本明細書中で用いられる用語「植物部分」は、以下に限定されないが、胚、花粉、胚珠、種子、葉、幹、シュート、花卉、枝、果実、仁、穂、コッブ、外皮、茎、根、根端、葯、植物細胞(植物および/または植物の部分において無傷の植物細胞、植物プロトプラスト、植物組織、植物細胞組織培養体、植物カルス、植物塊等が挙げられる)が挙げられる。本明細書中で用いられる「シュート」は、葉および幹を含む地上部を指す。さらに、本明細書中で用いられる「植物細胞」は、植物の構造的生理学的単位を指し、これは、細胞壁を含み、そしてまたプロトプラストを指し得る。植物細胞は、単離された単一の細胞の形態であってもよいし、培養された細胞であってもよいし、より高度に組織化された単位、例えば植物組織または植物器官の一部であってもよい。
【0126】
本発明の融合タンパク質およびポリペプチドおよびそれをコードする核酸構築物は、あらゆる植物または植物部分の標的核酸を修飾する(例えば、塩基編集、切断、ニック等)ために使用され得る。本発明に有用な植物の非限定的な例として、芝草(例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ属)、ウモウヨシ、ヒロハノコメススキ、ススキ属、ダンチク属、スイッチグラス、蔬菜作物(アーティチョーク、コールラビ、キバナスズシロ、ニラネギ、アスパラガス、レタス(例えば、サラダ菜、リーフレタス、タチチシャ)、マランガ、メロン(例えば、マスクメロン、スイカ、クレンショーメロン、ハネデューメロン、カンタロープ)、アブラナ属作物(例えば、メキャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、ハクサイ、パクチョイ)、カルドニ(cardoni)、ニンジン、ハクサイ、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物(例えば、マロウ、キュウリ、ズッキーニ、スカッシュ、カボチャ、ハネデューメロン、スイカ、カンタロープ)、ハツカダイコン、乾球タマネギ、ルタバガ、ナス、セイヨウゴボウ、キクヂシャ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、ネギ、スカッシュ、グリーン、ビート(シュガービートおよび飼料ビート)、サツマイモ、フダンソウ、セイヨウワサビ、トマト、カブ、およびスパイスが挙げられる)、果実作物、例えば、リンゴ、アプリコット、チェリー、ネクタリン、モモ、西洋ナシ、プラム、プルーン、チェリー、マルメロ、イチジク、ナッツ(例えば、クリ、ペカン、ピスタチオ、ヘイゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカダミアナッツ、アーモンド等)、柑橘類(例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジールミカン、ミカン、レモン、ライム等)、ブルーベリー、ブラックラズベリー、ボイゼンベリー、クランベリー、カランツ、グズベリー、ローガンベリー、ラズベリー、ストロベリー、ブラックベリー、ブドウ(ワイン用および食用)、アボカド、バナナ、キーウィ、柿、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイア、およびライチ、農作物、例えば、クローバー、アルファルファ、チモシー、マツヨイグサ、メドウフォーム、トウモロコシ(飼料用、スイートコーン、ポップコーン)、ホップ、ホホバ、ソバ、ベニバナ、キノア、コムギ、イネ、オオムギ、ライムギ、キビ、モロコシ、エンバク、ライコムギ、モロコシ、タバコ、カポック、マメ科植物(インゲンマメ(例えば、サヤインゲンおよび乾燥インゲンマメ)、レンズマメ、エンドウ、ダイズ)、油料植物(ナタネ、キャノーラ、マスタード、ポピー、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、カカオ豆、落花生類、アブラヤシ)、ウキクサ、シロイヌナズナ(Arabidopsis)属、繊維植物(ワタ、アマ、アサ、ジュート)、カンナビス(例えば、アサ(Cannabis sativa)、インド麻(Cannabis indica)、およびカンナビス・ルデラリス(Cannabis ruderalis))、クスノキ科(シナモン、カンファー)、もしくはコーヒー、サトウキビ、チャ、および天然ゴム植物等の植物、ならびに/または花壇用花卉、例えば、顕花植物、サボテン、多肉植物、および/もしくは観賞植物(例えば、バラ、チューリップ、スミレ)、ならびに樹木、例えば森林樹木(広葉樹および常緑植物、例えば針葉樹、例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、スギ、マツ、カバノキ、イトスギ、ユーカリノキ、ヤナギ)、ならびに潅木および他の苗木が挙げられる。一部の実施形態において、本発明の融合タンパク質およびポリペプチドおよびそれをコードする核酸構築物は、トウモロコシ、ダイズ、コムギ、キャノーラ、イネ、トマト、コショウ、ヒマワリ、ラズベリー、ブラックベリー、ブラックラズベリー、および/またはチェリーを修飾するのに用いられ得る。
【0127】
本発明はさらに、本発明の方法を実行するためのキットを含む。本発明のキットは、試薬、バッファ、および混合、測定、ソーティング、標識その他のための装置、ならびに標的核酸を修飾するのに適した説明書等を含み得る。
【0128】
一部の実施形態において、本発明は、本発明の1つまたは複数のポリペプチド、本発明の1つまたは複数の融合タンパク質、本発明の1つまたは複数の融合タンパク質をコードする1つまたは複数のポリヌクレオチド、本発明のCRISPR-Casシステム、および/またはそれを含む発現カセットまたはベクターを含むキットを、場合によってはその使用説明書と共に提供する。一部の実施形態において、キットはさらに、Cas12aガイド核酸および/またはそれを含む発現カセットもしくはベクターを含んでいてもよい。一部の実施形態において、ガイド核酸は、本発明の融合タンパク質をコードするポリヌクレオチドと同じ発現カセットまたはベクター上に提供されてもよい。
【0129】
ゆえに、一部の実施形態では、(a)本明細書中で提供される融合タンパク質をコードするポリヌクレオチド、および(b)(a)のポリヌクレオチドの発現を駆動するプロモーターを含む核酸構築物を含むキットが提供される。一部の実施形態において、キットはさらに、ガイド核酸をコードする核酸構築物を含んでもよく、構築物は、標的核酸配列と同一であるか、または相補的な核酸配列の、ガイド核酸の骨格中へのクローニングのためのクローニング部位を含む。
【0130】
一部の実施形態において、キットのポリペプチドは、融合タンパク質に融合された1つまたは複数の核局在化シグナル、またはそれをコードするポリヌクレオチドをさらに含んでいてもよい。一部の実施形態において、キットのポリヌクレオチドはさらに、形質転換体を識別するのに有用な1つまたは複数の選択マーカー(例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子等をコードする核酸)をコードしていてもよい。一部の実施形態において、ポリヌクレオチドは、コードされた融合タンパク質内に1つまたは複数のイントロンをコードし得るmRNAであってもよい。
【0131】
次に、本発明を、以下の実施例に関して説明する。これらの実施例は、特許請求の範囲を本発明に限定することは意図されず、むしろ特定の実施形態の例示となることが意図されることが認識されるべきである。当業者が思い浮かべる、例示される方法におけるあらゆる変形が、本発明の範囲に入ることが意図される。
【実施例】
【0132】
[実施例1]
現在、Cas12aに基づくアデニン塩基エディタの成功したバージョンは実証されていない。そこで発明者らは、編集されるDNA鎖に対するデアミナーゼの理想的な配置に基づき、最適なリンカーの長さと配列、Cas12aとアデニンデアミナーゼ(例えば、TadA/TadA*ダイマー)のN末端またはC末端のいずれかの融合物を設計することにより、最適化されたCas12aに基づくアデニン塩基エディタを開発することを試みた。
【0133】
初期の融合タンパク質の設計では、温度感受性が低く、植物細胞での活性が証明されていることから、ラクノスピラ科細菌ND2006のCas12a(LbCas12a)(例えば、配列番号30)を使用した、しかしながら、異なるCas12aエンドヌクレアーゼ間の構造的な類似性が高いため、これらの設計は、他の種(例えば、アシダミノコッカス属(Acidaminococcus sp.)のCpf1(AsCpf1)、フランシセラ・ノビシダ(Francisella novicida)のCpf1(FnCpf1)、およびその他のもの、例えば、配列番号31~46を参照)からのCas12a酵素にも拡張されるはずである。
【0134】
構造に基づくアプローチを用いて、発明者らはCas12aドメインに対するアデニンデアミナーゼドメイン(例えば、TadA/TadA*)の最適な配置を可能にするように設計された、いくつかのリンカー配列を開発した。これらのリンカーは、塩基編集のための非標的鎖一本鎖部分へのアクセスを可能とする。Cas12aの末端の配置とそのガイドRNAの向きにより、理想的なリンカーの配列と長さは、Cas9 ABEで使用されている現在の最先端のリンカーとは大きく異なる可能性が高い。この例では、リンカーは、いくつかの可能な塩基エディタドメインアーキテクチャに対応し、アデニンデアミナーゼドメインをCas12aのいずれかの末端に連結させ、また、野生型と進化したTadAドメインの順序を交互に入れ替えるように設計されている。設計した例示的なリンカーを表1に記載する。
【0135】
【0136】
設計したリンカーを用いて開発した種々の構築物の概要が
図1A~1Cに提供される。
【0137】
設計した各リンカー配列の有効性(長さ、柔軟性、およびプロテアーゼに対する感受性を含む)を試験するために、哺乳動物細胞における発現のためのベクター中に各リンカー配列を含む構築物を作製した(例えば、配列番号49~77または90~96を参照)。各リンカーを、関連するドメイン配置(LbCpf1のN末端またはC末端へのTadAヘテロダイマーの融合)において試験する(
図1Aおよび
図1B)。C末端リンカーの一部(Cterm_1、Cterm_4、Cterm_5、C9R、およびCterm_10)については、デアミナーゼ構成要素の順番(変異型と野生型)を逆にして試験する(
図1C)。哺乳動物細胞でのスクリーニング後、安定した植物形質転換(例えば、ダイズ)における試験のために、各アーキテクチャの最も効果的なリンカーを選択する。
【0138】
[実施例2]HEK293T細胞における編集
HEK293T細胞を、DMEM培地を使用して、抗生物質の非存在下で、48ウェルコラーゲンコーティングプレート(Corning)に播種した。70~80%のコンフルエンシーにて、750ngの塩基エディタプラスミドと250ngのガイドRNAプラスミドを用いて、メーカーのプロトコールに従って、1.5μLのリポフェクタミン3000(ThermoFisher Scientific)を細胞にトランスフェクトした。3日後、細胞を溶解し、MagMax DNA抽出キット(Applied Biosystems)を用いてDNAを抽出した。
ガイドRNAにおいて使用されるスペーサー配列:
DMNT1スペーサー1:AAGAAATATTACAACATATAAAA 配列番号83
DMNT1スペーサー2:AAATCCAGAATGCACAAAGTACT 配列番号84
DMNT1スペーサー3:ATATAATGCATAATAAAAAACTT 配列番号85
RNF2スペーサー1:TATGAGTTACAACGAACACCTCA 配列番号86
RNF2スペーサー2:CACGTCTCATATGCCCCTTGGCA 配列番号87
RNF2スペーサー3:GAACATGAAAACTTAAATAGAAC 配列番号88
RNF2スペーサー4:ATGTTCTAAAAATGTATCCCAGT 配列番号89
【0139】
3つの試験されたスペーサーにおいて観察された編集位置におけるアデニンからグアニンへの編集の平均頻度が表2に記載されている。全ての実験的リンカー構築物は、表示のリンカーを用いて、表示の末端からのdLbCas12aからTadA8.20mへの融合物として構築されている(例えば、Cterm1_8.20m構築物はdLbCas12a-Cterm1-TadA8.20mを含んでいる)。GS-XTEN-GSリンカーを有するTadA8.20mまたはTadA8eのdLbCas12aへのN末端融合物を対照として使用した。
【0140】
【0141】
図3~5は、表2の編集頻度をグラフ形式で示している。各構築物について、スペーサー内の各編集位置にて観察されたアデニンからグアニンへの編集の量は、個別のバーで指し示されている(例えば、
図3のA8、A11、
図4のA9、A10、A14、
図5のA10、A12その他)。
図2は、同じ実験で3つの試験スペーサーのそれぞれで観察されたLbCas12aヌクレアーゼの平均活性を示している。これらのデータに基づき、TadA8eデアミナーゼとの融合物としてさらに試験するための候補として、5つのリンカーを選択した(Cterm10、Cterm12、Nterm7、Nterm10、およびNterm11)。これらの構築物と2つの対照ABEの編集データが、表3および
図6~10に示されている。
【0142】
【0143】
図7~10は、5つの選択されたリンカーについて、標的スペーサー内の各位置で観測されたアデニンからグアニンへの編集頻度の平均値を示している。
図6は、同じ実験で4つの試験スペーサーのそれぞれで観察されたLbCas12aヌクレアーゼの平均活性を示している。これらの図のそれぞれにおいて、エラーバーは3回の反復の標準偏差を示している。
【0144】
これらのデータは、設計されたリンカーCterm12を用いたdLbCas12へのアデニンデアミナーゼのC末端融合が、対照の構築物よりも一貫して優れていることを指し示している。
【0145】
前述のものは、本発明の実例であり、その限定と解釈されるべきでない。本発明は、以下の特許請求の範囲によって定義され、特許請求の範囲の等価物もその中に含まれるべきである。
【配列表】
【国際調査報告】