(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-15
(54)【発明の名称】鋳型を用いた編集のためのDNAポリメラーゼのリクルート
(51)【国際特許分類】
C12N 15/62 20060101AFI20230308BHJP
C12N 15/11 20060101ALI20230308BHJP
C12N 15/63 20060101ALI20230308BHJP
C12N 15/54 20060101ALI20230308BHJP
C12N 15/09 20060101ALI20230308BHJP
C12N 9/12 20060101ALI20230308BHJP
C07K 19/00 20060101ALI20230308BHJP
【FI】
C12N15/62 Z
C12N15/11 Z ZNA
C12N15/63 Z
C12N15/54
C12N15/09 110
C12N15/09 100
C12N9/12
C07K19/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022541803
(86)(22)【出願日】2021-01-06
(85)【翻訳文提出日】2022-09-05
(86)【国際出願番号】 US2021012283
(87)【国際公開番号】W WO2021141970
(87)【国際公開日】2021-07-15
(32)【優先日】2020-01-06
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】522269901
【氏名又は名称】ペアワイズ・プランツ・サーヴィシズ,インコーポレイテッド
【氏名又は名称原語表記】PAIRWISE PLANTS SERVICES, INC.
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100180231
【氏名又は名称】水島 亜希子
(74)【代理人】
【識別番号】100096769
【氏名又は名称】有原 幸一
(72)【発明者】
【氏名】ニィエ,ジンイー
(72)【発明者】
【氏名】ヒュンメル,アーロン
(72)【発明者】
【氏名】ローイット,シャイ・ジョシュア
【テーマコード(参考)】
4B050
4H045
【Fターム(参考)】
4B050CC05
4B050DD02
4B050GG06
4B050KK11
4B050LL05
4H045AA10
4H045AA30
4H045BA10
4H045BA41
4H045CA11
4H045CA40
4H045DA89
4H045EA61
4H045FA74
(57)【要約】
本発明は、配列特異的DNA結合タンパク質、DNA依存性DNAポリメラーゼ、およびDNAによりコードされた修復鋳型、場合によってはDNAエンドヌクレアーゼを含む組換え核酸構築体(配列特異的DNA結合タンパク質は、DNAエンドヌクレアーゼ活性を含む)、ならびにその、細胞および生物において核酸を修飾するための使用方法に関する。
【特許請求の範囲】
【請求項1】
(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、および
(b)第1のDNA依存性DNAポリメラーゼ
を含む第1の複合体。
【請求項2】
第1の、DNAによりコードされた修復鋳型をさらに含む、請求項1に記載の第1の複合体。
【請求項3】
第1のDNAエンドヌクレアーゼをさらに含み、前記DNAエンドヌクレアーゼが、一本鎖ニックもしくは二本鎖切断を導入することができ、または標的核酸上の第1の部位に結合することができる前記第1の配列特異的DNA結合タンパク質がさらに、一本鎖ニックまたは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む、請求項1または請求項2に記載の第1の複合体。
【請求項4】
(a)標的核酸上の第1の部位に結合することができ、かつ一本鎖ニックまたは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、
(b)第1のDNA依存性DNAポリメラーゼ、および
(c)第1の、DNAによりコードされた修復鋳型
を含む第1の複合体。
【請求項5】
(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、
(b)第1のDNA依存性DNAポリメラーゼ、
(c)第1のDNAエンドヌクレアーゼ、および
(d)第1の、DNAによりコードされた修復鋳型
を含む第1の複合体。
【請求項6】
前記第1の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来である、請求項1から5のいずれか1項に記載の第1の複合体。
【請求項7】
前記第1のDNAエンドヌクレアーゼが、エンドヌクレアーゼ(例えばFok1)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)である、請求項3から6のいずれか1項に記載の第1の複合体。
【請求項8】
前記第1のDNAエンドヌクレアーゼが、ヌクレアーゼまたはニッカーゼである、請求項3から7のいずれか1項に記載の第1の複合体。
【請求項9】
ガイド核酸(例えば、crRNA、crDNA)をさらに含む、請求項1から8のいずれか1項に記載の第1の複合体。
【請求項10】
前記第1の配列特異的DNA結合タンパク質が、エンドヌクレアーゼ活性またはニッカーゼ活性を含む、請求項1、2、または6から9のいずれか1項に記載の第1の複合体。
【請求項11】
前記第1の配列特異的DNA結合タンパク質の前記エンドヌクレアーゼ活性またはニッカーゼ活性が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来である、請求項10に記載の第1の複合体。
【請求項12】
前記第1の配列特異的DNA結合タンパク質が、(そのN末端またはC末端にて)前記第1のDNA依存性DNAポリメラーゼに、場合によってはリンカーを介して融合されている、請求項1から11のいずれか1項に記載の第1の複合体。
【請求項13】
前記第1のDNA依存性DNAポリメラーゼが、高いフィデリティおよび/または高いプロセッシビティを示す、請求項1から12のいずれか1項に記載の第1の複合体。
【請求項14】
前記第1のDNA依存性DNAポリメラーゼが、高い分配プロファイルを示す、請求項1から12のいずれか1項に記載の第1の複合体。
【請求項15】
前記第1のDNA依存性DNAポリメラーゼが、3’-5’エキソヌクレアーゼ活性、5’-3’エキソヌクレアーゼ活性、および/または5’-3’RNA依存性DNAポリメラーゼ活性を含む、請求項1から14のいずれか1項に記載の第1の複合体。
【請求項16】
前記第1のDNA依存性DNAポリメラーゼが、3’-5’エキソヌクレアーゼ活性、5’-3’エキソヌクレアーゼ活性、および5’-3’RNA依存性DNAポリメラーゼ活性の1つまたは複数を取り除くように修飾されている、請求項15に記載の第1の複合体。
【請求項17】
前記第1のDNA依存性DNAポリメラーゼが、クレノウ断片またはそのサブ断片を含む、請求項1から16のいずれか1項に記載の第1の複合体。
【請求項18】
前記第1のDNA依存性DNAポリメラーゼが、配列非特異的DNA結合タンパク質に融合されている、請求項1から17のいずれか1項に記載の第1の複合体。
【請求項19】
前記配列非特異的dsDNA結合タンパク質が、スルホロブス・ソルファタリカス由来のSso7d由来である、請求項18に記載の第1の複合体。
【請求項20】
前記第1のDNA依存性DNAポリメラーゼが、ヒト、酵母、細菌、または植物由来のDNA依存性DNAポリメラーゼである、請求項1から19のいずれか1項に記載の第1の複合体。
【請求項21】
前記第1のDNA依存性DNAポリメラーゼが、DNAポリメラーゼε(例えば、ヒトおよび酵母)、DNAポリメラーゼδ、大腸菌ポリメラーゼI、Phusion(登録商標)DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Vent(exo-)(登録商標)DNAポリメラーゼ、Deep Vent(登録商標)DNAポリメラーゼ、Deep Vent(exo-)(登録商標)DNAポリメラーゼ、9°Nm(商標)DNAポリメラーゼ、Q5(登録商標)DNAポリメラーゼ、Q5U(登録商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、および/またはPhire(商標)DNAポリメラーゼである、請求項1から19のいずれか1項に記載の第1の複合体。
【請求項22】
前記第1のDNAポリメラーゼが、ヒトDNA依存性DNAポリメラーゼε、植物DNA依存性DNAポリメラーゼε、および/または酵母DNA依存性DNAポリメラーゼεである、請求項1から20のいずれか1項に記載の第1の複合体。
【請求項23】
前記第1のDNA依存性DNAポリメラーゼが、分配型ポリメラーゼである、請求項1から22のいずれか1項に記載の第1の複合体。
【請求項24】
前記第1の配列特異的DNA結合タンパク質が、ペプチドタグに融合され、前記第1のDNA依存性DNAポリメラーゼが、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、前記第1のDNA依存性DNAポリメラーゼが、前記ペプチドタグに融合された前記第1の配列特異的DNA結合タンパク質にリクルートされる、請求項1から23のいずれか1項に記載の第1の複合体。
【請求項25】
前記第1のDNA依存性DNAポリメラーゼが、ペプチドタグに融合され、前記第1の配列特異的DNA結合タンパク質が、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、前記第1のDNA依存性DNAポリメラーゼが、前記親和性ポリペプチドに融合された前記第1の配列特異的DNA結合タンパク質にリクルートされる、請求項1から23のいずれか1項に記載の第1の複合体。
【請求項26】
前記ペプチドタグが、GCN4ペプチドタグ(例えばSun-タグ)、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープを含む、請求項24または請求項25に記載の第1の複合体。
【請求項27】
前記親和性ポリペプチドが、抗体、場合によっては、scFv抗体、アフィボディ、アンチカリン、モノボディ、および/またはDARPinである、請求項24から26のいずれか1項に記載の第1の複合体。
【請求項28】
前記ガイド核酸が、RNAリクルートモチーフに連結されており、前記第1のDNA依存性DNAポリメラーゼが、前記RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されている、請求項9から23のいずれか1項に記載の第1の複合体。
【請求項29】
前記RNAリクルートモチーフが、CRISPR核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されている、請求項28に記載の第1の複合体。
【請求項30】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、テロメラーゼKu結合モチーフ(例えばKu結合ヘアピン)およびKuの親和性ポリペプチド(例えばKuヘテロダイマー)、テロメラーゼSm7結合モチーフおよびSm7の親和性ポリペプチド、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、PP7ファージオペレーターステム-ループおよび親和性ポリペプチドPP7コートタンパク質(PCP)、SfMuファージComステム-ループおよび親和性ポリペプチドCom RNA結合タンパク質、PUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)、ならびに/または合成RNAアプタマーおよび対応するアプタマーリガンドである、請求項28または請求項29に記載の第1の複合体。
【請求項31】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、ならびに/またはPUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)である、請求項28または請求項29に記載の第1の複合体。
【請求項32】
前記第1の、DNAによりコードされた修復鋳型が、前記ガイド核酸に連結されている、請求項9から31のいずれか1項に記載の第1の複合体。
【請求項33】
前記第1のDNA結合ドメインおよび/または第1のDNAエンドヌクレアーゼが、CRISPR-Casエフェクタタンパク質である、請求項1から32のいずれか1項に記載の第1の複合体。
【請求項34】
前記CRISPR-Casエフェクタタンパク質が、I型CRISPR-Cas系、II型CRISPR-Cas系、III型CRISPR-Cas系、IV型CRISPR-Cas系、またはV型CRISPR-Cas系由来である、請求項33に記載の第1の複合体。
【請求項35】
前記CRISPR-Casエフェクタタンパク質が、II型CRISPR-Cas系またはV型CRISPR-Cas系由来である、請求項33に記載の第1の複合体。
【請求項36】
前記V型CRISPR-Casエフェクタタンパク質が、Cas12a、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c1、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b、および/またはCas14cである、請求項34または請求項35に記載の第1の複合体。
【請求項37】
前記CRISPR-Casエフェクタタンパク質が、Cas9エフェクタタンパク質またはCas12エフェクタタンパク質である、請求項33から34に記載の第1の複合体。
【請求項38】
(a)標的核酸上の第2の部位に結合することができる第2の配列特異的DNA結合タンパク質、および
(b)DNAによりコードされた修復鋳型
を含む第2の複合体。
【請求項39】
前記第2の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来である、請求項38に記載の第2の複合体。
【請求項40】
第2のDNAエンドヌクレアーゼをさらに含み、前記第2のDNAエンドヌクレアーゼが、一本鎖ニックまたは二本鎖切断を導入することができる、請求項39に記載の第2の複合体。
【請求項41】
前記第2のDNAエンドヌクレアーゼが、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来である、請求項40に記載の第2の複合体。
【請求項42】
標的核酸上の第2の部位に結合することができる前記第2の配列特異的DNA結合タンパク質がさらに、一本鎖ニックまたは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む、請求項38または請求項39に記載の第2の複合体。
【請求項43】
エンドヌクレアーゼ活性をさらに含む前記第2の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)である、請求項42に記載の第2の複合体。
【請求項44】
第2のDNA依存性DNAポリメラーゼをさらに含む、請求項38から43のいずれか1項に記載の第2の複合体。
【請求項45】
前記第2の、DNAによりコードされた修復鋳型が、DNAリクルートモチーフに連結されており、前記第2の配列特異的DNA結合タンパク質が、前記DNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合されており、場合によっては、前記DNAリクルートモチーフ/親和性ポリペプチドが、HUH-タグ、DNAアプタマー、細菌レトロンのmsDNA、またはT-DNAリクルートを含む、請求項38から43のいずれか1項に記載の第2の複合体。
【請求項46】
前記第2の配列特異的DNA結合タンパク質が、(そのN末端またはC末端にて)ブタサーコウイルス2(PCV)Repタンパク質に融合されており、前記DNA鋳型がPCV認識部位を含む、請求項38から45のいずれか1項に記載の第2の複合体。
【請求項47】
前記第2の、DNAによりコードされた修復鋳型が、ガイド核酸に連結されている、請求項38から46のいずれか1項に記載の第2の複合体。
【請求項48】
ペプチドタグまたはRNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合された操作(修飾)されたDNA依存性DNAポリメラーゼ。
【請求項49】
前記DNA依存性DNAポリメラーゼが、配列非特異的DNA結合ドメインに融合されている、請求項48に記載の操作されたDNA依存性DNAポリメラーゼ。
【請求項50】
前記配列非特異的dsDNA結合タンパク質が、スルホロブス・ソルファタリカス由来のSso7d由来である、請求項49に記載の操作されたDNA依存性DNAポリメラーゼ。
【請求項51】
前記DNA依存性DNAポリメラーゼが、[本明細書中に記載されるように操作されていない同じDNA依存性DNAポリメラーゼと比較して]プロセッシビティの増大、フィデリティの増大、親和性の増大、配列特異性の増大、配列特異性の低下、および/または協同作用の増大を示す、請求項48から50のいずれか1項に記載の操作されたDNA依存性DNAポリメラーゼ。
【請求項52】
前記DNA依存性DNAポリメラーゼが、5’→3’-ポリメラーゼ活性、3’→5’エキソヌクレアーゼ活性、5’→3’エキソヌクレアーゼ活性、および/または5’→3’RNA依存性DNAポリメラーゼ活性の少なくとも1つを含まない、請求項48から51のいずれか1項に記載の操作されたDNA依存性DNAポリメラーゼ。
【請求項53】
第1の部位および第2部位とは異なる鎖上にある標的核酸上の第3の部位に結合することができる第3の配列特異的DNA結合タンパク質、ならびに第3のDNAエンドヌクレアーゼを含むことによって、ミスマッチ修復を向上させ、かつ修復の効率をブーストする第3の複合体。
【請求項54】
請求項1から37のいずれか1項に記載の第1の複合体をコードするポリヌクレオチド。
【請求項55】
請求項38から47のいずれか1項に記載の第2の複合体をコードするポリヌクレオチド。
【請求項56】
請求項53に記載の第3の複合体をコードするポリヌクレオチド。
【請求項57】
請求項48から52のいずれか1項に記載の操作されたDNA依存性DNAポリメラーゼをコードするポリヌクレオチド。
【請求項58】
請求項54から57のいずれか1項に記載のポリヌクレオチドの1つまたは複数を含む発現カセットまたはベクター。
【請求項59】
(a)CRISPR-Casエフェクタタンパク質との相互作用を媒介する核酸配列、(b)前記CRISPR-Casエフェクタタンパク質を特異的核酸標的部位にDNA-RNA相互作用を介して向ける核酸配列、および(c)請求項48から52のいずれか1項に記載の操作されたDNA依存性DNAポリメラーゼと相互作用することができるステムループ構造を形成する核酸配列を含むRNA分子。
【請求項60】
標的核酸を修飾する方法であって、前記標的核酸を、請求項4から37のいずれか1項に記載の第1の複合体と接触させるステップによって、前記標的核酸を修飾するステップを含む方法。
【請求項61】
前記標的核酸を、請求項38から47のいずれか1項に記載の第2の複合体と接触させるステップによって、前記標的核酸を修飾するステップをさらに含む、請求項60に記載の方法。
【請求項62】
前記標的核酸を、請求項53に記載の第3の複合体と接触させるステップによって、前記標的核酸の修飾の修復効率を向上させるステップをさらに含む、請求項61に記載の方法。
【請求項63】
標的核酸を修飾する方法であって、前記標的核酸を、
(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、
(b)第1のDNA依存性DNAポリメラーゼ、
(c)第1のDNAエンドヌクレアーゼ、および
(d)第1の、DNAによりコードされた修復鋳型
と接触させるステップによって、前記標的核酸を修飾するステップを含む方法。
【請求項64】
前記第1の配列特異的DNA結合タンパク質、前記第1のDNA依存性DNAポリメラーゼ、前記第1のDNAエンドヌクレアーゼ、および前記第1の、DNAによりコードされた修復鋳型が、(前記標的核酸と相互作用する)複合体を形成する、請求項63に記載の方法。
【請求項65】
前記第1の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来である、請求項63または請求項64に記載の方法。
【請求項66】
前記第1のDNAエンドヌクレアーゼが、エンドヌクレアーゼ(例えばFok1)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)である、請求項63から65のいずれか1項に記載の方法。
【請求項67】
前記第1のDNAエンドヌクレアーゼが、ヌクレアーゼまたはニッカーゼである、請求項63から66のいずれか1項に記載の方法。
【請求項68】
標的核酸を修飾する方法であって、前記標的核酸を、
(a)標的核酸上の第1の部位に結合することができ、かつ一本鎖ニックまたは二本鎖切断を導入することができるニッカーゼ活性および/またはエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、
(b)第1のDNA依存性DNAポリメラーゼ、ならびに
(c)第1の、DNAによりコードされた修復鋳型
と接触させるステップによって、前記標的核酸を修飾するステップを含む方法。
【請求項69】
エンドヌクレアーゼ活性を含む前記第1の配列特異的DNA結合タンパク質、前記第1のDNA依存性DNAポリメラーゼ、および前記第1の、DNAによりコードされた修復鋳型が、(前記標的核酸と相互作用する)複合体を形成する、請求項68に記載の方法。
【請求項70】
前記第1の配列特異的DNA結合タンパク質の前記エンドヌクレアーゼ活性および/またはニッカーゼ活性が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来である、請求項68または請求項69に記載の方法。
【請求項71】
前記第1の配列特異的DNA結合タンパク質が、前記第1のDNA依存性DNAポリメラーゼに、場合によってはリンカーを介して融合されている、請求項63から70のいずれか1項に記載の方法。
【請求項72】
前記第1の配列特異的DNA結合タンパク質が、ペプチドタグに融合され、前記第1のDNA依存性DNAポリメラーゼが、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、前記第1のDNA依存性DNAポリメラーゼが、前記ペプチドタグに融合された前記第1の配列特異的DNA結合タンパク質にリクルートされる、請求項63から70のいずれか1項に記載の方法。
【請求項73】
前記第1のDNA依存性DNAポリメラーゼが、ペプチドタグに融合され、前記第1の配列特異的DNA結合タンパク質が、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、前記第1のDNA依存性DNAポリメラーゼが、前記親和性ポリペプチドに融合された前記第1の配列特異的DNA結合タンパク質にリクルートされる、請求項63から70のいずれか1項に記載の方法。
【請求項74】
前記ペプチドタグが、GCN4ペプチドタグ(例えばSun-タグ)、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープを含む、請求項72または請求項73に記載の方法。
【請求項75】
前記親和性ポリペプチドが、抗体、場合によっては、scFv抗体、アフィボディ、アンチカリン、モノボディ、および/またはDARPinである、請求項72から74のいずれか1項に記載の方法。
【請求項76】
前記第1のDNA結合ドメインおよび/または第1のDNAエンドヌクレアーゼが、CRISPR-Casエフェクタタンパク質である、請求項63から75のいずれか1項に記載の方法。
【請求項77】
前記標的核酸を、第1のガイド核酸(例えば、crRNA、crDNA)と接触させることをさらに含む、請求項76に記載の方法。
【請求項78】
前記第1の、DNAによりコードされた修復鋳型が、前記第1のガイド核酸に連結されており、それによって、前記第1の、DNAによりコードされた修復鋳型が前記標的核酸へとガイドされる、請求項77に記載の方法。
【請求項79】
前記第1のガイド核酸が、RNAリクルートモチーフに連結されており、前記第1のDNA依存性DNAポリメラーゼが、前記RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されており、それによって、前記第1のDNA依存性DNAポリメラーゼが前記標的核酸へとガイドされる、請求項77または請求項78に記載の方法。
【請求項80】
前記RNAリクルートモチーフが、CRISPR核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されている、請求項79に記載の方法。
【請求項81】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、テロメラーゼKu結合モチーフ(例えばKu結合ヘアピン)およびKuの親和性ポリペプチド(例えばKuヘテロダイマー)、テロメラーゼSm7結合モチーフおよびSm7の親和性ポリペプチド、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、PP7ファージオペレーターステム-ループおよび親和性ポリペプチドPP7コートタンパク質(PCP)、SfMuファージComステム-ループおよび親和性ポリペプチドCom RNA結合タンパク質、PUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)、ならびに/または合成RNAアプタマーおよび対応するアプタマーリガンドである、請求項79または請求項80に記載の方法。
【請求項82】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、ならびに/またはPUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)である、請求項79または請求項80に記載の方法。
【請求項83】
前記CRISPR-Casエフェクタタンパク質が、I型CRISPR-Cas系、II型CRISPR-Cas系、III型CRISPR-Cas系、IV型CRISPR-Cas系、またはV型CRISPR-Cas系由来である、請求項76から82のいずれか1項に記載の方法。
【請求項84】
前記CRISPR-Casエフェクタタンパク質が、II型CRISPR-Cas系またはV型CRISPR-Cas系由来である、請求項76から82のいずれか1項に記載の方法。
【請求項85】
前記V型CRISPR-Casエフェクタタンパク質が、Cas12a、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c1、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b、および/またはCas14cである、請求項84に記載の方法。
【請求項86】
前記CRISPR-Casエフェクタタンパク質が、Cas9エフェクタタンパク質またはCas12エフェクタタンパク質である、請求項76から84のいずれか1項に記載の方法。
【請求項87】
前記標的核酸を、
(a)前記標的核酸上の第2の部位に結合することができる第2の配列特異的DNA結合タンパク質、および
(b)DNAによりコードされた修復鋳型
を含む第2の複合体と接触させるステップをさらに含む、請求項63から86のいずれか1項に記載の方法。
【請求項88】
前記標的核酸がさらに、第2のDNAエンドヌクレアーゼと接触し、前記第2のDNAエンドヌクレアーゼが、一本鎖ニックもしくは二本鎖切断を導入することができ、または前記第2の配列特異的DNA結合タンパク質が、一本鎖ニックもしくは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む、請求項87に記載の方法。
【請求項89】
前記第2のDNAエンドヌクレアーゼが、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエンドヌクレアーゼ(例えばCRISPR-Casエフェクタタンパク質)、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来であり、またはエンドヌクレアーゼ活性を含む前記第2の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)である、請求項88に記載の方法。
【請求項90】
前記標的核酸上の第2の部位に結合することができる前記第2の配列特異的DNA結合タンパク質、前記第2の、DNAによりコードされた修復鋳型、および場合によっては前記DNAエンドヌクレアーゼが、前記標的核酸上の前記第2の部位と相互作用する複合体を形成する、請求項87から89のいずれか1項に記載の方法。
【請求項91】
前記第2の配列特異的DNA結合タンパク質が、ペプチドタグに融合され、前記第2のDNAエンドヌクレアーゼが、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、前記第2のDNAエンドヌクレアーゼが、前記ペプチドタグに融合された前記第2の配列特異的DNA結合タンパク質にリクルートされる、請求項87から90のいずれか1項に記載の方法。
【請求項92】
前記第2のDNAエンドヌクレアーゼが、ペプチドタグに融合され、前記第2の配列特異的DNA結合タンパク質が、前記ペプチドタグに結合することができる親和性ポリペプチドに融合されており、それによって、第2のDNAエンドヌクレアーゼが、前記親和性ポリペプチドに融合された前記第2の配列特異的DNA結合タンパク質にリクルートされる、請求項87から91のいずれか1項に記載の方法。
【請求項93】
前記ペプチドタグが、GCN4ペプチドタグ(例えばSun-タグ)、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープを含む、請求項87または請求項92に記載の方法。
【請求項94】
前記親和性ポリペプチドが、抗体、場合によっては、scFv抗体、アフィボディ、アンチカリン、モノボディ、および/またはDARPinである、請求項89から93のいずれか1項に記載の方法。
【請求項95】
前記第2の、DNAによりコードされた修復鋳型が、DNAリクルートモチーフに連結されており、前記第2の配列特異的DNA結合タンパク質が、前記DNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合されており、場合によっては、前記DNAリクルートモチーフ/親和性ポリペプチドが、HUH-タグ、DNAアプタマー、細菌レトロンのmsDNA、またはT-DNAリクルートを含む、請求項87から94のいずれか1項に記載の方法。
【請求項96】
前記第2の配列特異的DNA結合タンパク質が、ブタサーコウイルス2(PCV)Repタンパク質に融合されており、前記DNAによりコードされた修復鋳型が、PCV認識部位を含む、請求項87から95のいずれか1項に記載の方法。
【請求項97】
前記第2の配列特異的DNA結合タンパク質が、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来である、請求項89から96のいずれか1項に記載の方法。
【請求項98】
前記第2のDNA結合ドメインおよび/または第2のDNAエンドヌクレアーゼが、CRISPR-Casエフェクタタンパク質である、請求項89から97のいずれか1項に記載の方法。
【請求項99】
前記標的核酸を、第2のガイド核酸(例えば、crRNA、crDNA)と接触させるステップをさらに含む、請求項98に記載の方法。
【請求項100】
前記第2の、DNAによりコードされた修復鋳型が、前記第2のガイド核酸に連結されており、それによって、前記第2の、DNAによりコードされた修復鋳型が前記標的核酸へとガイドされる、請求項99に記載の方法。
【請求項101】
前記第2のガイド核酸が、RNAリクルートモチーフに連結されており、前記第2のDNAエンドヌクレアーゼが、前記RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されており、それによって、前記第2のDNAエンドヌクレアーゼが前記標的核酸へとガイドされる、請求項99または請求項100に記載の方法。
【請求項102】
前記RNAリクルートモチーフが、ガイド核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されている、請求項101に記載の方法。
【請求項103】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、テロメラーゼKu結合モチーフ(例えばKu結合ヘアピン)およびKuの親和性ポリペプチド(例えばKuヘテロダイマー)、テロメラーゼSm7結合モチーフおよびSm7の親和性ポリペプチド、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、PP7ファージオペレーターステム-ループおよび親和性ポリペプチドPP7コートタンパク質(PCP)、SfMuファージComステム-ループおよび親和性ポリペプチドCom RNA結合タンパク質、PUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)、ならびに/または合成RNAアプタマーおよび対応するアプタマーリガンドである、請求項101または請求項102に記載の方法。
【請求項104】
前記RNAリクルートモチーフおよび対応する親和性ポリペプチドが、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、ならびに/またはPUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)である、請求項101または請求項102に記載の方法。
【請求項105】
前記標的核酸を、第2のDNA依存性DNAポリメラーゼと接触させるステップをさらに含む、請求項87から104のいずれか1項に記載の方法。
【請求項106】
前記標的核酸を、第3の複合体と接触させるステップを含み、前記第3の複合体が、前記第1の部位および前記第2の部位とは異なる鎖上にある前記標的核酸上の第3の部位に結合することができる第3の配列特異的DNA結合タンパク質を含み、前記第3の配列特異的DNA結合タンパク質が、ヌクレアーゼ活性またはニッカーゼ活性を含むことによって、前記標的核酸の修飾の修復効率を向上させる、請求項87から105のいずれか1項に記載の方法。
【請求項107】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、3’-5’エキソヌクレアーゼ活性、5’-3’エキソヌクレアーゼ活性、および5’-3’RNA依存性DNAポリメラーゼ活性の1つまたは複数を取り除くように修飾されている、請求項63から106のいずれか1項に記載の方法。
【請求項108】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、クレノウ断片またはそのサブ断片を含む、請求項63から107のいずれか1項に記載の方法。
【請求項109】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、配列非特異的DNA結合タンパク質に融合されている、請求項63から108のいずれか1項に記載の方法。
【請求項110】
前記配列非特異的dsDNA結合タンパク質が、スルホロブス・ソルファタリカス由来のSso7d由来である、請求項109に記載の方法。
【請求項111】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、ヒト、酵母、細菌、または植物由来のDNA依存性DNAポリメラーゼである、請求項63から110のいずれか1項に記載の方法。
【請求項112】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、DNAポリメラーゼε(例えば、ヒトおよび酵母)、DNAポリメラーゼδ、大腸菌ポリメラーゼI、Phusion(登録商標)DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Vent(exo-)(登録商標)DNAポリメラーゼ、Deep Vent(登録商標)DNAポリメラーゼ、Deep Vent(exo-)(登録商標)DNAポリメラーゼ、9°Nm(商標)DNAポリメラーゼ、Q5(登録商標)DNAポリメラーゼ、Q5U(登録商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、および/またはPhire(商標)DNAポリメラーゼである、請求項63から111のいずれか1項に記載の方法。
【請求項113】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、ヒトDNA依存性DNAポリメラーゼε、植物DNA依存性DNAポリメラーゼε、および/または酵母DNA依存性DNAポリメラーゼεである、請求項63から111のいずれか1項に記載の方法。
【請求項114】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、高いフィデリティおよび/または高いプロセッシビティを示す、請求項63から113のいずれか1項に記載の方法。
【請求項115】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、高い分配プロファイルを示す、請求項63から113のいずれか1項に記載の方法。
【請求項116】
前記第1のDNA依存性DNAポリメラーゼおよび/または前記第2のDNA依存性DNAポリメラーゼが、請求項48から52のいずれか1項に記載の操作されたDNA依存性DNAポリメラーゼである、請求項63から115のいずれか1項に記載の方法。
【請求項117】
請求項4、6から9または12から37のいずれか1項に記載の第1の複合体、これをコードするポリヌクレオチド、および/または前記ポリヌクレオチドを含む発現カセットもしくはベクターを含む、標的核酸を修飾するためのシステムであって、
(a)DNAエンドヌクレアーゼ活性を含む前記第1の配列特異的DNA結合タンパク質が、前記標的核酸上の第1の部位に結合し、
(b)前記第1のDNA依存性DNAポリメラーゼが、前記第1の配列特異的DNA結合タンパク質と相互作用することができ、かつ前記第1の配列特異的DNA結合タンパク質に、そして前記標的核酸上の前記第1の部位にリクルートされ、
(c)(i)前記第1の、DNAによりコードされた修復鋳型が、前記標的核酸上の前記第1の部位に対して実質的な相補性を有するスペーサー配列を含む第1のガイド核酸に連結されており、それによって、前記第1の、DNAによりコードされた修復鋳型が、前記標的核酸上の前記第1の部位へとガイドされ、または
(c)(ii)前記第1の、DNAによりコードされた修復鋳型が、前記第1の配列特異的DNA結合タンパク質もしくは前記第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ前記第1の配列特異的DNA結合タンパク質もしくは前記第1のDNA依存性DNAポリメラーゼに、そして前記標的核酸上の前記第1の部位にリクルートされることによって、前記標的核酸を修飾する、システム。
【請求項118】
請求項5から9または12から37のいずれか1項に記載の第1の複合体、これをコードするポリヌクレオチド、および/または前記ポリヌクレオチドを含む発現カセットもしくはベクターを含む、標的核酸を修飾するためのシステムであって、
(a)前記第1の配列特異的DNA結合タンパク質が、前記標的核酸上の第1の部位に結合し、
(b)前記第1のDNAエンドヌクレアーゼが、前記第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ前記第1の配列特異的DNA結合タンパク質に、そして前記標的核酸上の前記第1の部位にリクルートされ、
(c)前記第1のDNA依存性DNAポリメラーゼが、前記第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ前記第1の配列特異的DNA結合タンパク質に、そして前記標的核酸上の前記第1の部位にリクルートされ、
(d)(i)前記第1の、DNAによりコードされた修復鋳型が、前記標的核酸上の前記第1の部位に対して実質的な相補性を有するスペーサー配列を含むガイド核酸に連結されており、それによって、前記第1の、DNAによりコードされた修復鋳型が、前記標的核酸上の前記第1の部位へとガイドされ、または
(d)(ii)前記第1の、DNAによりコードされた修復鋳型が、前記第1の配列特異的DNA結合タンパク質もしくは前記第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ前記配列特異的DNA結合タンパク質もしくは前記第1のDNA依存性DNAポリメラーゼに、そして前記標的核酸上の前記第1の部位にリクルートされることによって、前記標的核酸を修飾する、システム。
【請求項119】
請求項38から47のいずれか1項に記載の第2の複合体、これをコードするポリヌクレオチド、ならびに/または前記ポリヌクレオチドを含む発現カセットおよび/もしくはベクターをさらに含み、前記第2の配列特異的DNA結合ドメインが、前記標的核酸上の前記第1の部位に近位の第2の部位に結合し、前記第2の、DNAによりコードされた修復鋳型が、前記第2の配列特異的DNA結合タンパク質に(共有結合性の相互作用または非共有結合性の相互作用を介して)リクルートされることによって、前記標的核酸を修飾する、請求項117または118に記載の標的核酸を修飾するシステム。
【請求項120】
標的核酸を修飾する方法であって、
前記標的核酸を、
請求項117から119のいずれか1項に記載の複合体と接触させるステップによって、前記標的核酸を修飾するステップ
を含む方法。
【発明の詳細な説明】
【技術分野】
【0001】
配列表の電子ファイルに関する陳述
37C.F.R.§1.821に従って提出した、表題1499.14.WO_ST25.txtの、435,310バイトのサイズの、2021年1月6日に作成した、EFS-Webを介して提出したASCIIテキストフォーマットの配列表を、紙コピーの代わりに提供する。この配列表は、その開示について、引用することにより本明細書の一部をなすものとする。
【0002】
優先権の陳述
本出願は、35U.S.C.§119(e)に従って、2019年1月6日出願の米国仮特許出願第62/957,542号の利益を主張し、この出願の全体の内容は、引用することにより本明細書の一部をなすものとする。
【0003】
本発明の分野
本発明は、配列特異的DNA結合タンパク質、DNA依存性DNAポリメラーゼ、およびDNAによりコードされた修復鋳型、場合によってはDNAエンドヌクレアーゼを含む組換え核酸構築体(配列特異的DNA結合タンパク質は、DNAエンドヌクレアーゼ活性を含む)、ならびにその、細胞および生物において核酸を修飾するための使用方法に関する。
【背景技術】
【0004】
正確な、鋳型を用いた編集は典型的に、二本鎖切断(DSB)を標的部位内に導入することと、組み込まれることが所望される編集を有する鋳型を用意することとを包含する。編集鋳型から標的部位への配列の組込みは、相同組換えパスウェイを介したDSBの、鋳型を用いた修復に依存するが、当該パスウェイは、ほとんどの真核細胞におけるDNA修復にとって支配的なパスウェイではない。また、内因性相同組換えパスウェイは、複数の工程による複雑なプロセスであり、当該工程は各々、固有のボトルネックを有しており、操作するのが困難となり得る。全体として、鋳型を用いた相同組換え媒介編集の効率は典型的に、ヒト細胞において低く、そして植物細胞においてさらに低い。これは、試薬送達の低い効率、および編集された植物を回復させる困難に起因する。
【0005】
酵母以外の真核生物における最良の、鋳型を用いた編集の効率は、試薬(例えば、DNAエンドヌクレアーゼまたはニッカーゼ、修復鋳型、NHEJインヒビター、HDR刺激因子)のカクテルの送達を容易に調整することができるヒト細胞培養において達成され、効率が高い。具体的に、ヒト細胞において、鋳型を用いた正確な編集は、3つの構成要素の複合体、1)ガイドRNAによって配列特異的部位にリクルートされ得るニッカーゼ、2)ニックが入れられたDNAの3’に結合し、かつ所望の編集を有する修復鋳型をコードする伸長配列を有するガイドRNA、および3)ニックが入れられたDNAの3’末端およびプライマーを用いてDNAを合成する(例えば編集を組み込む)、ニッカーゼに融合されたRNA依存性DNAポリメラーゼ(逆転写酵素)を用いて実証されてきた。特定のヒト細胞型において、鋳型を用いた正確な編集の最大50%が報告されている(Anzalone et al. Nature576:149-157(2019))。
【0006】
ヒト細胞におけるのとは異なり、植物において、様々な組成物中の複数の試薬の送達は、困難となり得る。また、細胞における修復鋳型の可用性を増大させることによって、鋳型を用いた編集の効率を向上させることができる高用量の修復鋳型を送達することは、困難となり得る。現在まで、植物における鋳型を用いた編集の大部分の成功は、DNA発現カセットの粒子衝撃(particle bombardment)および修復鋳型によって達成されてきた。最良の編集効率は、10%未満の範囲内にあり、多くの研究が1%未満である。報告されている最も高い効率は、多くの場合、HDRのより高い効率に至るかもしれない機構の理解がないか、または不十分である、ゲノム内の特定の修復遺伝子座におけるもののみである。
【発明の概要】
【0007】
本発明の一態様は、(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、および(b)第1のDNA依存性DNAポリメラーゼを含む第1の複合体を提供する。
【0008】
本発明の第2の態様は、(a)標的核酸上の第1の部位に結合することができ、かつ一本鎖ニックまたは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、および(c)第1の、DNAによりコードされた修復鋳型を含む第1の複合体を提供する。
【0009】
本発明の第3の態様は、(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、(c)第1のDNAエンドヌクレアーゼ、および(d)第1の、DNAによりコードされた修復鋳型を含む第1の複合体を提供する。
【0010】
本発明の第4の態様は、(a)標的核酸上の第2の部位に結合することができる第2の配列特異的DNA結合タンパク質、および(b)DNAによりコードされた修復鋳型を含む第2の複合体を提供する。
【0011】
本発明の第5の態様は、ペプチドタグまたはRNAリクルートモチーフ(RNA recruiting motif)と相互作用することができる親和性ポリペプチドに融合された操作された(修飾された)DNA依存性DNAポリメラーゼを提供する。
【0012】
本発明の第6の態様は、(a)CRISPR-Casエフェクタタンパク質との相互作用を媒介する核酸配列、(b)CRISPR-Casエフェクタタンパク質を特異的核酸標的部位にDNA-RNA相互作用を介して向ける核酸配列、および(c)本発明の操作されたDNA依存性DNAポリメラーゼと相互作用することができるステムループ構造を形成する核酸配列を含むRNA分子を提供する。
【0013】
本発明の第7の態様は、標的核酸を修飾する方法であって、標的核酸を、本発明の第1の複合体と接触させることによって、標的核酸を修飾することを含む方法を提供する。
【0014】
本発明の第8の態様は、標的核酸を修飾する方法であって、標的核酸を、(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、(c)第1のDNAエンドヌクレアーゼ、および(d)第1の、DNAによりコードされた修復鋳型と接触させることによって、標的核酸を修飾することを含む方法を提供する。
【0015】
本発明の第9の態様は、標的核酸を修飾する方法であって、標的核酸を、(a)標的核酸上の第1の部位に結合することができ、かつ一本鎖ニックまたは二本鎖切断を導入することができるニッカーゼ活性および/またはエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、ならびに(c)第1の、DNAによりコードされた修復鋳型と接触させることによって、標的核酸を修飾することを含む方法を提供する。
【0016】
本発明の第10の態様は、本発明の第1の複合体、これをコードするポリヌクレオチド、および/または当該ポリヌクレオチドを含む発現カセットもしくはベクターを含む、標的核酸を修飾するためのシステムを提供し、(a)DNAエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質は、標的核酸上の第1の部位に結合し、(b)第1のDNA依存性DNAポリメラーゼは、第1の配列特異的DNA結合タンパク質と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(c)(i)第1の、DNAによりコードされた修復鋳型は、標的核酸上の第1の部位に対して実質的な相補性を有するスペーサー配列を含む第1のガイド核酸に連結されており、それによって、第1の、DNAによりコードされた修復鋳型が、標的核酸上の第1の部位へとガイドされ、または(c)(ii)第1の、DNAによりコードされた修復鋳型は、第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼに、そして標的核酸上の第1の部位にリクルートされることによって、標的核酸を修飾する。
【0017】
本発明の第11の態様は、本発明の第1の複合体、これをコードするポリヌクレオチド、および/または当該ポリヌクレオチドを含む発現カセットもしくはベクターを含む、標的核酸を修飾するためのシステムを提供し、(a)第1の配列特異的DNA結合タンパク質は、標的核酸上の第1の部位に結合し、(b)第1のDNAエンドヌクレアーゼは、第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(c)第1のDNA依存性DNAポリメラーゼは、第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(d)(i)第1の、DNAによりコードされた修復鋳型は、標的核酸上の第1の部位に対して実質的な相補性を有するスペーサー配列を含むガイド核酸に連結されており、それによって、第1の、DNAによりコードされた修復鋳型が、標的核酸上の第1の部位へとガイドされ、または(d)(ii)第1の、DNAによりコードされた修復鋳型は、第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼに、そして標的核酸上の第1の部位にリクルートされることによって、標的核酸を修飾する。
【配列表フリーテキスト】
【0018】
配列番号1~20は、本発明に有用な、例となるCas12aアミノ酸配列である。
配列番号21~22は、プロモーターおよびイントロンをコードする例示的な調節配列である。
配列番号23~25は、例となるペプチドタグおよび対応する親和性ポリペプチドを提供する。
配列番号26~36は、例となるRNAリクルートモチーフおよび対応する親和性ポリペプチドを提供する。
配列番号37~39は、V型CRISPR-Cas12aヌクレアーゼについてのプロトスペーサー隣接モチーフ位置の例を提供する。
配列番号40~47は、例となるHUH-タグおよび対応する認識配列を提供する。
配列番号48~58および配列番号88~94は、種々の異なる生物由来の例となるDNA依存性DNAポリメラーゼを提供する。
配列番号59~62は、例となるCas9配列を提供する。
配列番号63~70は、例となるレトロン逆転写酵素およびレトロン足場を提供する。
配列番号71~74は、例となるキメラガイド核酸配列を提供する。
配列番号75は、例となるCas12aリボ核タンパク(RNP)を提供する。
配列番号76~87は、実施例11由来の標的配列およびcrRNA配列を提供する。
【発明を実施するための形態】
【0019】
次に本発明を、本発明の実施形態を示す添付の図面および実施例を参照して、以降で説明する。この説明は、本発明が実行され得る様々な全方法の詳細なカタログであることも、本発明に加えられ得る全ての特徴であることも意図されない。例えば、一実施形態に関して具体的に説明される特徴が、他の実施形態に組み込まれてもよく、そして特定の実施形態に関して具体的に説明される特徴が、その実施形態から削除されてもよい。ゆえに、本発明は、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを、除外することも省略することもできることを意図する。また、本明細書中で示唆される種々の実施形態に対する、本発明から逸脱しない多数の変形および追加が、本開示を考慮して、当業者にとって明らかであろう。それゆえに、以下の説明は、本発明の一部の特定の実施形態を示すことが意図されており、全ての配列、それらの組合せおよび変形を網羅的に指定することは意図されない。
【0020】
別段定義されない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が属する技術の当業者によって一般的に理解されるのと同じ意味を有する。本明細書中で本発明の説明に用いられる専門用語は、特定の実施形態のみを説明する目的のものであり、本発明の限定であることは意図されない。
【0021】
本明細書中で引用される全ての刊行物、特許出願、特許、および他の引用は、引用が示されるセンテンスおよび/または段落に関連する教示について、それらの全体が引用することにより本明細書の一部をなすものとする。
【0022】
文脈が別途指示しない限り、本明細書中に記載される本発明の種々の特徴を、あらゆる組合せで用いることができることが具体的に意図される。さらに、本発明はまた、本発明の一部の実施形態において、本明細書中で示されるあらゆる特徴または特徴の組合せを除外することも省略することもできることを意図する。組成物が、構成要素A、B、およびCを含むと明細書が述べているかを示すために、A、B、もしくはCのいずれか、またはそれらの組合せを単独で、またはあらゆる組合せで省略かつ放棄することができることが具体的に意図される。
【0023】
本発明および添付の特許請求の範囲の記載に用いられている単数形「a」、「an」、および「the」は、文脈が別途明らかに指示しない限り、複数形を同様に含むことが意図される。
【0024】
また、本明細書中で用いられる「および/または」は、関連する記載された項目の1つまたは複数のあらゆる全ての考えられる組合せ、および択一的に解釈される場合(「または」)の組合せの欠如を指し、かつ包含する。
【0025】
測定可能な値、例えば量または濃度等に言及する場合に本明細書中で用いられる用語「約」は、指定された値の±10%、±5%、±1%、±0.5%、または±0.1%の変動、ならびに指定された値を包含することを意図する。例えば、Xが測定可能な値である場合の「約X」は、X、ならびにXの±10%、±5%、±1%、±0.5%、または±0.1%の変動を含むことを意図する。計測可能な値について本明細書中で提供される範囲は、他のあらゆる範囲および/またはその中の個々の値を含み得る。
【0026】
本明細書中で用いられる「XとYとの間」および「約XとYとの間」等のフレーズは、XおよびYを含むと解釈されるべきである。本明細書中で用いられる「約XとYとの間」等のフレーズは、「約Xと約Yとの間」を意味し、そして「約XからY」等のフレーズは、「約Xから約Y」を意味する。
【0027】
本明細書中の値の範囲の詳述は、本明細書中で示されない限り、単に、当該範囲内にある別個の各値に個々に言及する速記の方法の役目を果たすことが意図されており、そして別個の各値は、あたかも本明細書中で個々に列挙されているかの如く、本明細書に組み込まれる。例えば、範囲10~15が開示されていれば、11、12、13、および14もまた開示されている。
【0028】
本明細書中で用いられる用語「含む(「comprise」、「comprises」、および「comprising」)」は、明示される特徴、整数、工程、操作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しない。
【0029】
本明細書中で用いられる移行句「から本質的になる」は、特許請求の範囲が、特許請求の範囲に列挙される指定された材料または工程、および特許請求される本発明の基本的かつ新規の特徴に物質的に影響を与えないものを包含すると解釈されるべきであることを意味する。ゆえに、本発明の特許請求の範囲で用いられる場合の用語「から本質的になる」は、「含む」に等しいと解釈されることは意図されない。
【0030】
本明細書中で用いられる用語「増大させる」、「増大させること」、「増強させる」、「増強させること」、「向上させる」、および「向上させること」(およびその文法上の変形)は、対照と比較して少なくとも約25%、50%、75%、100%、150%、200%、300%、400%、500%、またはそれを超える上昇を説明する。
【0031】
本明細書中で用いられる用語「引き下げる」、「引き下げられた」、「引き下げること」、「引下げ」、「減少させる」、および「低下させる」(およびその文法上の変形)は、例えば、対照と比較して少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の低下を説明する。特定の実施形態において、引下げは、検出可能な活性または量をもたらし得ないか、または本質的にもたらし得ない(すなわち、有意でない量、例えば、約10%または5%未満)。
【0032】
「異種(heterologous)」または「組換え」ヌクレオチド配列は、これが導入される宿主細胞と天然に関連しないヌクレオチド配列であり、天然に存在するヌクレオチド配列の天然に存在しない複数のコピーが挙げられる。
【0033】
「天然」または「野生型」の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列は、天然に存在するか、または内因性の核酸、ヌクレオチド配列、ポリペプチド、またはアミノ酸配列を指す。ゆえに、例えば、「野生型mRNA」は、参照生物内に天然に存在するか、または参照生物に内因性のmRNAである。「相同」核酸配列は、これが導入される宿主細胞と天然に関連するヌクレオチド配列である。
【0034】
本明細書中で用いられる用語「核酸」、「核酸分子」、「ヌクレオチド配列」、および「ポリヌクレオチド」は、直鎖状であるか、もしくは分岐している、一本鎖もしくは二本鎖、またはそれらのハイブリッドであるRNAまたはDNAを指す。また、当該用語は、RNA/DNAハイブリッドを包含する。また、dsRNAが合成的に生成される場合、あまり一般的でない塩基、例えばイノシン、5-メチルシトシン、6-メチルアデニン、ヒポキサンチンその他を、アンチセンス、dsRNA、およびリボザイム対形成に用いることができる。例えば、ウリジンおよびシチジンのC-5プロピン類似体を含有するポリヌクレオチドは、高い親和性でRNAに結合すること、そして遺伝子発現の強力なアンチセンスインヒビターであることが示されている。また、他の修飾、例えば、ホスホジエステル骨格、またはRNAのリボース糖基内の2’-ヒドロキシへの修飾をすることができる。
【0035】
本明細書中で用いられる用語「ヌクレオチド配列」は、核酸分子の5’末端から3’末端までの、ヌクレオチドのヘテロポリマーまたはヌクレオチドの配列を指し、cDNA、DNA断片または部分、ゲノムDNA、合成(例えば、化学的に合成された)DNA、プラスミドDNA、mRNA、およびアンチセンスRNA(いずれも一本鎖または二本鎖であり得る)が挙げられる、DNA分子またはRNA分子が挙げられる。また、用語「ヌクレオチド配列」、「核酸」、「核酸分子」、「核酸構築体」、「オリゴヌクレオチド」、および「ポリヌクレオチド」は、ヌクレオチドのヘテロポリマーを指すのに本明細書中で互換的に用いられる。本明細書中で提供される核酸分子および/またはヌクレオチド配列が、本明細書中で左から右に5’から3’の向きに示されており、そして米国配列規則、37CFR§§1.821-1.825、および世界知的所有権機関(WIPO)基準ST.25に示されるヌクレオチド性質を示すための標準コードを用いて表される。本明細書中で用いられる「5’領域」は、ポリヌクレオチドの5’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの5’領域内の要素を、ポリヌクレオチドの5’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。本明細書中で用いられる「3’領域」は、ポリヌクレオチドの3’末端に最も近いポリヌクレオチドの領域を意味し得る。ゆえに、例えば、ポリヌクレオチドの3’領域内の要素を、ポリヌクレオチドの3’末端に位置決めされた第1のヌクレオチドから、ポリヌクレオチドの途中に位置決めされたヌクレオチドまでのどこでも位置決めすることができる。
【0036】
本明細書中で用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、および抗マイクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)等を生成するのに用いることができる核酸分子を指す。遺伝子は、機能タンパク質または遺伝子産物を生成するのに用いることができる場合もあるし、できない場合もある。遺伝子は、コード領域および非コード領域(例えば、イントロン、調節要素、プロモーター、エンハンサ、終結配列、ならびに/または5’および3’非翻訳領域)の双方を含むことができる。遺伝子は、「単離」されていてもよく、これは、天然の状態で核酸と関連して通常見出される構成要素から実質的に、または本質的に遊離している核酸が意図される。そのような構成要素として、他の細胞物質、組換え生成物由来の培地、および/または核酸を化学的に合成するのに用いられる種々の化学物質が挙げられる。
【0037】
用語「変異」は、点変異(例えば、ミスセンス、またはナンセンス、またはフレームシフトをもたらす単一の塩基対の挿入もしくは欠失)、挿入、欠失、および/またはトランケーションを指す。変異が、アミノ酸配列内の残基の、別の残基による置換、または配列内の1つもしくは複数の残基の欠失もしくは挿入である場合、変異は、典型的に、元の残基に続く配列内の残基の位置を同定することによって、そして新たに置換された残基を同定することによって説明される。
【0038】
本明細書中で用いられる用語「相補的な」または「相補性」は、許容可能な塩および温度条件の下での塩基対合によるポリヌクレオチドの天然の結合を指す。例えば、配列「A-G-T」(5’から3’)は、相補的な配列「T-C-A」(3’から5’)に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であってもよいし、一本鎖分子間に総相補性が存在する場合、完全であってもよい。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率および強度に対して大きな影響を有する。
【0039】
本明細書中で用いられる「相補体」は、コンパレータヌクレオチド配列(comparator nucleotide sequence)との100%の相補性を意味し得るし、100%未満の相補性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、および99%等の相補性)をも意味し得る。
【0040】
本発明のヌクレオチド配列の「部分」または「断片」は、参照核酸またはヌクレオチド配列と比較して、長さが引き下げられ(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれを超えるヌクレオチドが引き下げられ)、かつ参照核酸またはヌクレオチド配列と同一であるかまたはほぼ同一の(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一の)連続したヌクレオチドのヌクレオチド配列を含む、これから本質的になる、かつ/またはこれからなるヌクレオチド配列を意味することが理解される。本発明に従うそのような核酸断片または部分は、適切な場合には、これが構成成分であるより大きなポリヌクレオチド内に含まれてもよい。一例として、本発明のガイド核酸の反復配列は、野生型CRISPR-Cas反復配列の一部(例えば、野生型CRISR-Cas反復、例えば、Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b、および/またはCas14c等のCRISPR Cas系由来の反復)を含んでもよい。
【0041】
相同性を有する異なる核酸またはタンパク質は、本明細書中で「相同体」と称する。用語相同体は、同じ種および他の種由来の相同配列、ならびに同じ種および他の種由来のオーソログ配列を含む。「相同性」は、位置同一性(すなわち、配列類似性または同一性)のパーセントに換算した、2つ以上の核酸および/またはアミノ酸配列間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似した機能特性の概念を指す。ゆえに、本発明の組成物および方法はさらに、本発明のヌクレオチド配列およびポリペプチド配列に対する相同体を含む。本明細書中で用いられる「オーソログ」は、種形成の間に共通祖先遺伝子から生じた異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列の相同体は、本発明の前記ヌクレオチド配列に対して実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%)を有する。
【0042】
本明細書中で用いられる「配列同一性」は、2つの最適にアラインされたポリヌクレオチドまたはポリペプチド配列が、構成要素、例えば、ヌクレオチドまたはアミノ酸のアラインメントのウィンドウの全体を通して不変である程度を指す。「同一性」は、Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988)、Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993)、Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994)、Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987)、およびSequence Analysis Primer(Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載されるものが挙げられるがこれらに限定されない、知られている方法によって容易に算出することができる。
【0043】
本明細書中で用いられる用語「配列同一性パーセント」または「同一性パーセント」は、試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリ」)ポリヌクレオチド分子(またはその相補鎖)の直鎖状ポリヌクレオチド配列内の、2つの配列が最適にアラインされた場合の同一のヌクレオチドのパーセンテージを指す。一部の実施形態において、「同一性パーセント」は、参照ポリペプチドと比較したアミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。
【0044】
本明細書中で用いられるフレーズ、2つの核酸分子、ヌクレオチド配列、またはタンパク質配列の文脈における「実質的に同一の」または「実質的同一性」は、以下の配列比較アルゴリズムの1つを用いて、または目視検査によって測定して、最大対応について比較かつアラインした場合のヌクレオチドまたはアミノ酸残基同一性が、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%である2つ以上の配列またはサブ配列を指す。本発明の一部の実施形態において、実質的同一性は、約10ヌクレオチド~約20ヌクレオチド、約10ヌクレオチド~約25ヌクレオチド、約10ヌクレオチド~約30ヌクレオチド、約15ヌクレオチド~約25ヌクレオチド、約30ヌクレオチド~約40ヌクレオチド、約50ヌクレオチド~約60ヌクレオチド、約70ヌクレオチド~約80ヌクレオチド、約90ヌクレオチド~約100ヌクレオチド、またはそれを超えるヌクレオチド長、およびそれらにおけるあらゆる範囲、最大で配列の完全長である本発明のヌクレオチド配列の連続ヌクレオチドの領域にわたって存在する。一部の実施形態において、ヌクレオチド配列は、少なくとも約20ヌクレオチド(例えば、約20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40ヌクレオチド)にわたって、実質的に同一であり得る。一部の実施形態において、実質的に同一のヌクレオチドまたはタンパク質配列は、これが実質的に同一であるヌクレオチド(またはコードされたタンパク質配列)と実質的に同じ機能を実行する。
【0045】
配列比較について、典型的に、一配列が、試験配列が比較される参照配列として機能する。配列比較アルゴリズムを用いる場合、試験配列および参照配列がコンピュータに入力されて、必要であれば、サブ配列座標が指定されて、配列アルゴリズムプログラムパラメータが指定される。続いて、配列比較アルゴリズムは、指定されたプログラムパラメータに基づいて、参照配列と比較した試験配列についての配列同一性パーセントを算出する。
【0046】
比較ウィンドウをアラインするための配列の最適なアラインメントが、当業者に周知であり、ツール、例えばSmith and Watermanのローカル相同性アルゴリズム、Needleman and Wunschの相同性アラインメントアルゴリズム、Pearson and Lipmanの類似性の検索方法によって、そして場合によってはこれらのアルゴリズムのコンピュータによる実施、例えばGCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、およびTFASTAによって行われてもよい。試験配列および参照配列のアラインされたセグメントについての「同一性分率」は、参照配列セグメント内の構成要素の総数、例えば、参照配列全体、または参照配列の、定義されたより小さな部分で割った、2つのアラインされた配列によって共有される同一の構成要素の数である。配列同一性パーセントは、100を乗算した同一性分率として表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列もしくはその一部、またはより長いポリヌクレオチド配列に対してであってもよい。また、本発明の目的上、「同一性パーセント」は、翻訳されたヌクレオチド配列についてBLASTXバージョン2.0、そしてポリヌクレオチド配列についてBLASTNバージョン2.0を用いて求められてもよい。
【0047】
また、2つのヌクレオチド配列は、2つの配列がストリンジェント条件の下で互いにハイブリダイズする場合、実質的に相補的であると考えてもよい。代表的な一部の実施形態において、実質的に相補的であると考えられる2つのヌクレオチド配列は、高度にストリンジェントな条件の下で、互いにハイブリダイズする。
【0048】
サザンハイブリダイゼーションおよびノーザンハイブリダイゼーション等の核酸ハイブリダイゼーション実験の文脈における「ストリンジェントハイブリダイゼーション条件」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列依存的であり、様々な環境パラメータの下で異なる。核酸のハイブリダイゼーションの広範囲にわたるガイドが、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)において見出される。通常、高度にストリンジェントなハイブリダイゼーションおよび洗浄条件は、定義したイオン強度およびpHでの特定の配列についての熱融点(Tm)よりも約5℃低くなるように選択される。
【0049】
Tmは、標的配列の50%が、完全にマッチするプローブにハイブリダイズする(定義したイオン強度およびpH下での)温度である。特定のプローブについてのTmと等しくなるように、非常にストリンジェントな条件が選択される。サザンブロットまたはノーザンブロットにおいてフィルター上に100を超える相補的な残基を有する相補的なヌクレオチド配列のハイブリダイゼーション用のストリンジェントハイブリダイゼーション条件の例として、ハイブリダイゼーションが一晩実行される、42℃での1mgヘパリン入り50%ホルムアミドがある。高度にストリンジェントな洗浄条件の例として、72℃にて約15分間の0.1 5M NaClがある。ストリンジェント洗浄条件の例として、65℃にて15分間の0.2×SSC洗浄がある(SSCバッファの解説について、以下のSambrook参照)。多くの場合、高ストリンジェンシー洗浄が、バックグラウンドプローブシグナルを取り除くために、低ストリンジェンシー洗浄の後にある。例えば100を超えるヌクレオチドの二重鎖についての中程度のストリンジェンシー洗浄の例として、45℃にて15分間の1×SSCがある。例えば100を超えるヌクレオチドの二重鎖についての低ストリンジェンシー洗浄の例として、40℃にて15分間の4~6×SSCがある。短いプローブ(例えば約10~50ヌクレオチド)について、ストリンジェント条件は、典型的に、約1.0M Naイオン未満の塩濃度、典型的にはpH7.0~8.3にて約0.01~1.0M Naイオン濃度(または他の塩)を包含し、温度は、典型的に、少なくとも約30℃である。また、ストリンジェント条件は、ホルムアミド等の不安定化剤を添加することで達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて無関係なプローブについて観察されるよりも2×(またはより高い)の信号雑音比が、特異的ハイブリダイゼーションの検出を示す。ストリンジェント条件下で互いにハイブリダイズしないヌクレオチド配列は、コードするタンパク質が実質的に同一であるならば、やはり実質的に同一である。これは、例えば、ヌクレオチド配列のコピーが、遺伝コードによって容認される最大コドン縮重を用いて生じる場合に、起こり得る。
【0050】
本発明のあらゆるポリヌクレオチド、核酸構築体、発現カセット、および/またはベクターは、注目するあらゆる種において、発現のためにコドン最適化されていてもよい。コドン最適化は、当該技術において周知であり、コドン使用頻度バイアスについて、種特異的コドン使用頻度表を用いたヌクレオチド配列の修飾を包含する。コドン使用頻度表は、注目する種について最も高度に発現される遺伝子の配列分析に基づいて作成される。ヌクレオチド配列が核内で発現されることとなる場合、コドン使用頻度表は、注目する種について高度に発現される核遺伝子の配列分析に基づいて作成される。ヌクレオチド配列の修飾は、種特異的コドン使用頻度表を、天然のポリヌクレオチド配列内に存在するコドンと比較することによって決定される。当該技術において理解されているように、ヌクレオチド配列のコドン最適化は、天然のヌクレオチド配列に対して100%未満の同一性(例えば、50%、60%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、および99%等)を有するが、元のヌクレオチド配列によってコードされるのと同じ機能(そして一部の実施形態において、同じ構造)を有するポリペプチドを依然としてコードするヌクレオチド配列をもたらす。ゆえに、一部の実施形態において、本発明のポリヌクレオチド、核酸構築体、発現カセット、および/またはベクター(例えば、配列特異的DNA結合ドメイン、DNA依存性DNAポリメラーゼ、およびDNAエンドヌクレアーゼ等を含む/コードする)は、生物(例えば、植物(例えば、特定の植物種)、動物、細菌、真菌その他)における発現のためにコドン最適化されていてもよい。一部の実施形態において、コドン最適化された本発明の核酸構築体、ポリヌクレオチド、発現カセット、および/またはベクターは、コドン最適化されていない本発明のポリヌクレオチド、核酸構築体、発現カセット、および/またはベクターに対して約70%~約99.9%、またはそれを超える(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%、または100%)同一性を有する。
【0051】
本明細書中に記載される実施形態のいずれにおいても、本発明のポリヌクレオチドまたは核酸構築体は、植物および/または植物の細胞内での発現用の種々のプロモーターおよび/または他の調節要素と作動可能に関連し得る。ゆえに、一部の実施形態において、本発明のポリヌクレオチドまたは核酸構築体はさらに、1つまたは複数のヌクレオチド配列と作動可能に連結した1つまたは複数のプロモーター、イントロン、エンハンサ、および/またはターミネーターを含んでもよい。一部の実施形態において、プロモーターは、イントロンと作動可能に関連し得る(例えば、Ubi1プロモーターおよびイントロン)。一部の実施形態において、イントロンと関連するプロモーターは、「プロモーター領域」と称され得る(例えば、Ubi1プロモーターおよびイントロン)。
【0052】
ポリヌクレオチドに関して本明細書中で用いられる「作動可能に連結した」または「作動可能に関連した」は、示される要素が、互いに機能的に関連しており、かつ通常物理的にも関連していることを意味する。ゆえに、本明細書中で用いられる用語「作動可能に連結した」または「作動可能に関連した」は、機能的に関連する単一の核酸分子上のヌクレオチド配列を指す。ゆえに、第2のヌクレオチド配列に作動可能に連結した第1のヌクレオチド配列は、第1のヌクレオチド配列が第2のヌクレオチド配列と機能的に関係して配置されている状況を意味する。例えば、プロモーターは、プロモーターが前記ヌクレオチド配列の転写または発現をもたらすならば、ヌクレオチド配列と作動可能に関連している。当業者であれば、制御配列(例えばプロモーター)がその発現を導くように機能する限り、制御配列が、作動可能に関連するヌクレオチド配列と連続している必要がないことを理解するであろう。ゆえに、例えば、転写はされるが翻訳されない介在核酸配列が、プロモーターとヌクレオチド配列との間に存在し得、そしてプロモーターは依然として、ヌクレオチド配列に「作動可能に連結している」と考えることができる。
【0053】
本明細書中で用いられる用語、ポリペプチドに関して「連結した」は、一方のポリペプチドの、もう一方への付着を指す。ポリペプチドは、別のポリペプチドに(N末端またはC末端にて)直接(例えば、ペプチド結合を介して)連結されても、リンカーを介して連結されてもよい。
【0054】
用語「リンカー」は、当該技術において認識されており、2つの分子または部分、例えば、融合タンパク質、例えばDNA結合ポリペプチドまたはドメイン、ならびにペプチドタグおよび/または逆転写酵素、ならびにペプチドタグに結合する親和性ポリペプチド、あるいはDNAエンドヌクレアーゼポリペプチドまたはドメインおよびペプチドタグ、ならびに/または逆転写酵素、ならびにペプチドタグに結合する親和性ポリペプチドの2つのドメインを連結する化学基または分子を指す。リンカーは、単一の連結分子で構成されてもよいし、複数の連結分子を含んでもよい。一部の実施形態において、リンカーは、有機分子、基、ポリマー、または化学部分、例えば二価有機部分であり得る。一部の実施形態において、リンカーは、アミノ酸であってもよいし、ペプチドであってもよい。一部の実施形態において、リンカーはペプチドである。
【0055】
一部の実施形態において、本発明に有用なペプチドリンカーは、約2~約100、またはそれを超えるアミノ酸長、例えば、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、またはそれを超えるアミノ酸長(例えば、約2~約40、約2~約50、約2~約60、約4~約40、約4~約50、約4~約60、約5~約40、約5~約50、約5~約60、約9~約40、約9~約50、約9~約60、約10~約40、約10~約50、約10~約60、または約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25アミノ酸~約26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、またはそれを超えるアミノ酸長(例えば、約105、110、115、120、130、140、150、またはそれを超えるアミノ酸長))であり得る。一部の実施形態において、ペプチドリンカーは、GSリンカーであってもよい。
【0056】
「プロモーター」は、プロモーターと作動可能に関連するヌクレオチド配列(例えばコード配列)の転写を制御または調節するヌクレオチド配列である。プロモーターによって制御または調節されるコード配列は、ポリペプチドおよび/または機能RNAをコードし得る。典型的には、「プロモーター」は、RNAポリメラーゼIIの結合部位を含有し、かつ転写の開始を指示するヌクレオチド配列を指す。一般に、プロモーターは、対応するコード配列のコード領域の開始点に対して、5’側、または上流側に見出される。プロモーターは、遺伝子発現の調節因子の働きをする他の要素、例えばプロモーター領域を含んでもよい。これは、TATAボックスコンセンサス配列および多くの場合CAATボックスコンセンサス配列を含む(Breathnach and Chambon,(1981)Annu.Rev.Biochem.50:349)。植物では、CAATボックスは、AGGAボックスによって置換されている場合がある(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211-227)。一部の実施形態において、プロモーター領域は、少なくとも1つのイントロン(例えば、配列番号21または22)を含んでもよい。
【0057】
本発明に有用なプロモーターの例として、組換え核酸分子、例えば、「合成核酸構築体」または「タンパク質-RNA複合体」の調製に用いられる構成的、誘導性、時間的に調節された、発生的に調節された、化学的に調節された、組織選好および/または組織特異的プロモーターが挙げられ得る。これらの種々のタイプのプロモーターが、当該技術において知られている。
【0058】
プロモーターの選択は、発現の時間的かつ空間的必要条件に応じて変わってもよいし、形質転換されることとなる宿主細胞に基づいて変わってもよい。様々な多くの生物用のプロモーターが、当該技術において周知である。当該技術において存在する広範囲にわたる知識に基づいて、注目する特定の宿主生物に適したプロモーターを選択することができる。ゆえに、例えば、モデル生物において高度に構成的に発現される遺伝子の上流側のプロモーターについてかなり知られており、そのような知識は、必要に応じて、他の系において容易にアクセスすることができ、かつ実行することができる。
【0059】
一部の実施形態において、植物において機能的なプロモーターが、本発明の構築体に用いられてもよい。植物における発現を駆動するのに有用なプロモーターの非限定的な例として、RubisCo小サブユニット遺伝子1のプロモーター(PrbcS1)、アクチン遺伝子のプロモーター(Pactin)、硝酸還元酵素遺伝子のプロモーター(Pnr)、および重複炭素脱水酵素遺伝子1のプロモーター(Pdca1)が挙げられる(Walker et al.Plant Cell Rep.23:727-735(2005)、Li et al.Gene403:132-142(2007)、Li et al.Mol Biol.Rep.37:1143-1154(2010)参照)。PrbcS1およびPactinは構成的プロモーターであり、PnrおよびPdca1は誘導性プロモーターである。Pnrは、ニトラートによって誘導されて、アンモニウムによって抑制され(Li et al.Gene403:132-142(2007))、そしてPdca1は、塩によって誘導される(Li et al.Mol Biol.Rep.37:1143-1154(2010))。一部の実施形態において、本発明に有用なプロモーターは、RNAポリメラーゼII(Pol II)プロモーターである。一部の実施形態において、トウモロコシ(Zea mays)由来のU6プロモーターまたは7SLプロモーターが、本発明の構築体に有用であり得る。一部の実施形態において、トウモロコシ由来のU6cプロモーターおよび/または7SLプロモーターは、ガイド核酸の発現を駆動するのに有用であり得る。一部の実施形態において、ダイズ(Glycine max)由来のU6cプロモーター、U6iプロモーター、および/または7SLプロモーターが、本発明の構築体に有用であり得る。一部の実施形態において、ダイズ由来のU6cプロモーター、U6iプロモーター、および/または7SLプロモーターは、ガイド核酸の発現を駆動するのに有用であり得る。
【0060】
植物に有用な構成的プロモーターの例として、以下に限定されないが、セストラムウイルスプロモーター(cmp)(米国特許第7,166,770号)、イネアクチン1プロモーター(Wang et al.(1992)Mol.Cell.Biol.12:3399-3406、および米国特許第5,641,876号)、CaMV35Sプロモーター(Odell et al.(1985)Nature313:810-812)、CaMV19Sプロモーター(Lawton et al.(1987)Plant Mol.Biol.9:315-324)、nosプロモーター(Ebert et al.(1987)Proc.Natl.Acad.Sci USA84:5745-5749)、Adhプロモーター(Walker et al.(1987)Proc.Natl.Acad.Sci.USA84:6624-6629)、スクロース合成酵素プロモーター(Yang & Russell(1990)Proc.Natl.Acad.Sci.USA87:4144-4148)、およびユビキチンプロモーターが挙げられる。ユビキチンに由来する構成的プロモーターは、多くの細胞型において蓄積している。ユビキチンプロモーターは、トランスジェニック植物に用いられるいくつかの植物種、例えば、ヒマワリ(Binet et al.,1991.Plant Science79:87-94)、トウモロコシ(Christensen et al.,1989.Plant Molec.Biol.12:619-632)、およびアラビドプシス(Arabidopsis)(Norris et al.1993.Plant Molec.Biol.21:895-906)からクローニングされている。トウモロコシユビキチンプロモーター(UbiP)は、トランスジェニック単子葉植物系において開発されており、その配列、および単子葉植物形質転換のために構築されたベクターが、欧州特許出願公開第0342926号に開示されている。ユビキチンプロモーターは、トランスジェニック植物、とりわけ単子葉植物における本発明のヌクレオチド配列の発現に適している。さらに、McElroyet al.(Mol.Gen.Genet.231:150-160(1991))によって記載されるプロモーター発現カセットは、本発明のヌクレオチド配列の発現用に容易に修飾することができ、そして単子葉植物宿主に用いるのに特に適している。
【0061】
一部の実施形態において、組織特異的/組織選好プロモーターは、植物細胞内での異種ポリヌクレオチドの発現に用いることができる。組織特異的または組織選好発現パターンとして、以下に限定されないが、緑色組織特異的もしくは緑色組織選好、根特異的もしくは根選好、茎特異的もしくは茎選好、花卉特異的もしくは花卉選好、または花粉特異的もしくは花粉選好なものが挙げられる。緑色組織内での発現に適したプロモーターとして、光合成に関与する遺伝子を調節する多くのものが挙げられ、これらの多くは、単子葉植物および双子葉植物の双方からクローニングされている。一実施形態において、本発明に有用なプロモーターとして、ホスホエノールカルボキシラーゼ遺伝子由来のトウモロコシPEPCプロモーターがある(Hudspeth & Grula,Plant Molec.Biol.12:579-589(1989))。組織特異的プロモーターの非限定的な例として、種子貯蔵タンパク質(例えば、β-コングリシニン、クルシフェリン、napin、およびファゼオリン)、ゼインもしくは油体タンパク質(例えばオレオシン)、または脂肪酸生合成に関与するタンパク質(アシルキャリアタンパク質、ステアロイル-ACPデサチュラーゼ、および脂肪酸デサチュラーゼ(fad2-1)が挙げられる)をコードする遺伝子、および胚発生中に発現される他の核酸(例えばBce4、例えば、Kridl et al.(1991)Seed Sci.Res.1:209-219、および欧州特許出願公開第255378号参照)と関連するものが挙げられる。植物、特にトウモロコシにおける本発明のヌクレオチド配列の発現に有用な組織特異的または組織選好性プロモーターとして、以下に限定されないが、根、髄、葉、または花粉内での発現を導くものが挙げられる。そのようなプロモーターは、例えば、国際公開第93/07278号(その全体が引用することにより本明細書の一部をなすものとする)に開示されている。本発明に有用な組織特異的または組織選好プロモーターの他の非限定的な例として、米国特許第6,040,504号に開示されるワタルビスコプロモーター、米国特許第5,604,121号に開示されるイネスクロース合成酵素プロモーター、de Framond(FEBS290:103-106(1991)、Ciba-Geigyの欧州特許出願公開第0452269号)によって記載される根特異的プロモーター、米国特許第5,625,136号(Ciba-Geigy)に記載され、トウモロコシtrpA遺伝子の発現を駆動する茎特異的プロモーター、国際公開第01/73087号に開示されるケストルムイエローリーフカーリングウイルスプロモーター、ならびに花粉特異的または花粉選好プロモーター(イネ由来のProOsLPS10およびProOsLPS11(Nguyen et al.Plant Biotechnol.Reports9(5):297-306(2015))、トウモロコシ由来のZmSTK2_USP(Wang et al.Genome60(6):485-495(2017))、トマト由来のLAT52およびLAT59(Twell et al.Development109(3):705-713(1990))、Zm13(米国特許第10,421,972号)、アラビドプシス由来のPLA2-δプロモーター(米国特許第7,141,424号)、ならびに/またはトウモロコシ由来のZmC5プロモーター(国際公開第1999/042587号)が挙げられるが、これらに限定されない)がある。
【0062】
植物組織特異的/組織選好プロモーターの更なる例として、以下に限定されないが、根毛特異的シスエレメント(RHE)(Kim et al.The Plant Cell18:2958-2970(2006))、根特異的プロモーターRCc3(Jeong et al.Plant Physiol.153:185-197(2010))およびRB7(米国特許第5459252号)、レクチンプロモーター(Lindstrom et al.(1990)Der.Genet.11:160-167およびVodkin(1983)Prog.Clin.Biol.Res.138:87-98)、トウモロコシアルコール脱水素酵素1プロモーター(Dennis et al.(1984)Nucleic Acids Res.12:3983-4000)、S-アデノシル-L-メチオニン合成酵素(SAM)(Vander Mijnsbrugge et al.(1996)Plant and Cell Physiology,37(8):1108-1115)、トウモロコシ集光性複合体プロモーター(Bansal et al.(1992)Proc.Natl.Acad.Sci.USA89:3654-3658)、トウモロコシヒートショックタンパク質プロモーター(O’Dell et al.(1985)EMBO J.5:451-458およびRochesteret al.(1986)EMBO J.5:451-458)、エンドウ小サブユニットRuBPカルボキシラーゼプロモーター(Cashmore,“Nuclear genes encoding the small subunit of ribulose-1,5-bisphosphate carboxylase”pp.29-39 In:Genetic Engineering of Plants(Hollaender ed.,Plenum Press1983、およびPoulsen et al.(1986)Mol.Gen.Genet.205:193-200)、Tiプラスミドマンノピン合成酵素プロモーター(Langridge et al.(1989)Proc.Natl.Acad.Sci.USA86:3219-3223)、Tiプラスミドノパリン合成酵素プロモーター(Langridge et al.(1989)、前掲)、ペチュニアカルコンイソメラーゼプロモーター(van Tunen et al.(1988)EMBO J.7:1257-1263)、インゲンマメグリシンリッチタンパク質1プロモーター(Keller et al.(1989)Genes Dev.3:1639-1646)、トランケート型CaMV35Sプロモーター(O’Dell et al.(1985)Nature313:810-812)、ジャガイモパタチンプロモーター(Wenzler et al.(1989)Plant Mol.Biol.13:347-354)、根細胞プロモーター(Yamamoto et al.(1990)Nucleic Acids Res.18:7449)、トウモロコシゼインプロモーター(Kriz et al.(1987)Mol.Gen.Genet.207:90-98、Langridge et al.(1983)Cell34:1015-1022、Reina et al.(1990)Nucleic Acids Res.18:6425、Reina et al.(1990)Nucleic Acids Res.18:7449、およびWandelt et al.(1989)Nucleic Acids Res.17:2354)、グロブリン-1プロモーター(Belanger et al.(1991)Genetics129:863-872)、α-チューブリンcabプロモーター(Sullivan et al.(1989)Mol.Gen.Genet.215:431-440)、PEPCaseプロモーター(Hudspeth & Grula(1989)Plant Mol.Biol.12:579-589)、R遺伝子複合体-関連プロモーター(Chandler et al.(1989)Plant Cell1:1175-1183)、ならびにカルコン合成酵素プロモーター(Franken et al.(1991)EMBO J.10:2605-2612)が挙げられる。
【0063】
種子特異的発現に有用なものとして、エンドウビシリンプロモーター(Czako et al.(1992)Mol.Gen.Genet.235:33-40)、および米国特許第5,625,136号に開示される種子特異的プロモーターがある。成葉内での発現に有用なプロモーターとして、老化の開始時にスイッチされるもの、例えばアラビドプシス由来のSAGプロモーター(Gan et al.(1995)Science270:1986-1988)がある。
【0064】
また、葉緑体内で機能的なプロモーターを用いることができる。そのようなプロモーターの非限定的な例として、バクテリオファージT3遺伝子9 5’UTR、および米国特許第7,579,516号中で開示される他のプロモーターが挙げられる。本発明に有用な他のプロモーターとして、以下に限定されないが、S-E9小サブユニットRuBPカルボキシラーゼプロモーターおよびクニッツトリプシンインヒビター遺伝子プロモーター(Kti3)が挙げられる。
【0065】
本発明に有用な更なる調節要素として、以下に限定されないが、イントロン、エンハンサ、終止配列、ならびに/または5’および3’非翻訳領域が挙げられる。
【0066】
本発明に有用なイントロンとして、植物において同定されて、植物から単離されてから、植物の形質転換に用いられることとなる発現カセット中に挿入されるイントロンがあり得る。当業者によって理解されるように、イントロンは、自己切除に必要とされる配列を含むことができ、そして核酸構築体/発現カセット中にフレーム単位で(in frame)組み込まれる。イントロンを、一核酸構築体内で複数のタンパク質コード配列を分離するスペーサーとして用いることもできるし、イントロンを、例えば、mRNAを安定させるのに、一タンパク質コード配列の内側で用いることもできる。イントロンは、タンパク質コード配列内で用いられるならば、切除部位を含んだ「フレーム単位で」挿入される。また、イントロンは、発現を向上させるか、または修飾するように、プロモーターと関連してもよい。一例として、本発明に有用なプロモーター/イントロンの組合せとして、以下に限定されないが、トウモロコシUbi1プロモーターおよびイントロンが挙げられる。
【0067】
本発明に有用なイントロンの非限定的な例として、ADHI遺伝子(例えば、Adh1-Sイントロン1、2、および6)、ユビキチン遺伝子(Ubi1)、RuBisCo小サブユニット(rbcS)遺伝子、RuBisCo大サブユニット(rbcL)遺伝子、アクチン遺伝子(例えばアクチン-1イントロン)、ピルビン酸脱水素酵素キナーゼ遺伝子(pdk)、硝酸還元酵素遺伝子(nr)、重複炭素脱水酵素遺伝子1(Tdca1)、psbA遺伝子、atpA遺伝子、またはそれらのあらゆる組合せ由来のイントロンが挙げられる。
【0068】
一部の実施形態において、本発明のポリヌクレオチドおよび/または核酸構築体は、「発現カセット」であってもよいし、発現カセット内に含まれていてもよい。本明細書中で用いられる「発現カセット」は、例えば、本発明の核酸構築体(例えば、配列特異的DNA結合ポリペプチドまたはドメイン、DNA依存性DNAポリメラーゼ(例えば、操作したDNA依存性DNAポリメラーゼ)、DNAエンドヌクレアーゼポリペプチドまたはドメイン、DNAによりコードされた修復鋳型、ガイド核酸、第1の複合体、第2の複合体、第3の複合体その他)を含む組換え核酸分子を意味し、核酸構築体は、1つまたは複数の制御配列(例えば、プロモーター、ターミネーター等)と作動可能に関連する。ゆえに、本発明の一部の実施形態は、例えば、本発明の1つまたは複数のポリヌクレオチドを発現するように設計された発現カセットを提供する。発現カセットが複数のポリヌクレオチドを含む場合、ポリヌクレオチドは、ポリヌクレオチドの全ての発現を駆動する単一のプロモーターに作動可能に連結されていてもよいし、ポリヌクレオチドは、1つまたは複数の別々のプロモーターに作動可能に連結されていてもよい(例えば、3つのポリヌクレオチドが、1つ、2つ、または3つのプロモーターによってあらゆる組合せで駆動されてもよい)。2つ以上の別々のプロモーターが用いられる場合、プロモーターは、同じプロモーターであってもよいし、異なるプロモーターであってもよい。ゆえに、例えば、配列特異的DNA結合ポリペプチドまたはドメインをコードするポリヌクレオチド、DNAエンドヌクレアーゼポリペプチドまたはドメインをコードするポリヌクレオチド、DNA依存性DNAポリメラーゼポリペプチドまたはドメインをコードするポリヌクレオチド、DNAによりコードされた修復鋳型、および/またはガイド核酸(発現カセット内に含まれる場合)は各々、別々のプロモーターに作動可能に連結されていてもよいし、2つ以上のプロモーターにあらゆる組合せで作動可能に連結されていてもよい。一部の実施形態において、発現カセットおよび/またはその中に含まれるポリヌクレオチドは、植物内での発現のために最適化されていてもよい。
【0069】
本発明の核酸構築体を含む発現カセットは、キメラであってもよく、このことは、その構成要素の少なくとも1つが、その他の構成要素の少なくとも1つに関して、異種である(例えば、宿主生物において発現されることとなる、注目するポリヌクレオチドと作動可能に連結した、宿主生物由来のプロモーター。ここで、注目するポリヌクレオチドは、宿主とは異なる生物由来であるか、または当該プロモーターと関連して通常見出されない)ことを意味する。また、発現カセットは、天然に存在するが、異種発現に有用な組換え形態で得られたものであってもよい。
【0070】
発現カセットは、場合によっては、選択された宿主細胞内で機能的である転写および/または翻訳終止領域(すなわち、終止領域)および/またはエンハンサ領域を含み得る。種々の転写ターミネーターおよびエンハンサが、当該技術において知られており、発現カセットに用いるのに入手可能である。転写ターミネーターは、転写の終止および正確なmRNAポリアデニル化を担っている。終止領域および/またはエンハンサ領域は、転写開始領域に固有であってもよく、配列特異的DNA結合ポリペプチドをコードする遺伝子に固有であってもよく、DNAエンドヌクレアーゼポリペプチドをコードする遺伝子、DNA依存性DNAポリメラーゼをコードする遺伝子等は、宿主細胞に固有であってもよいし、別の源(例えば、プロモーター、配列特異的DNA結合ポリペプチドをコードする遺伝子、DNAエンドヌクレアーゼポリペプチドをコードする遺伝子、DNA依存性DNAポリメラーゼをコードする遺伝子等、宿主細胞、またはそれらのあらゆる組合せに対して外来であるか、異種である)に固有であってもよい。
【0071】
また、本発明の発現カセットは、選択マーカーをコードするポリヌクレオチドを含むことができ、これは、形質転換された宿主細胞を選択するのに用いることができる。本明細書中で用いられる「選択マーカー」は、発現された場合に、マーカーを発現する宿主細胞に目立った表現型を与えるので、そのような形質転換された細胞を、マーカーを有していない細胞から区別することができるポリヌクレオチド配列を意味する。そのようなポリヌクレオチド配列は、マーカーが、化学手段によって、例えば選択剤(例えば抗生物質等)を用いることによって選択され得る形質を付与するかどうかに応じて、またはマーカーが単純に、観察もしくは試験を通して、例えばスクリーニング(例えば蛍光)によって識別することができる形質であるかに応じて、選択マーカーまたはスクリーニングマーカーをコードし得る。適した選択マーカーの多くの例が、当該技術において知られており、本明細書中に記載される発現カセットに用いることができる。
【0072】
発現カセットに加えて、本明細書中に記載される核酸分子/構築体およびポリヌクレオチド配列は、ベクターと関連させて用いることができる。用語「ベクター」は、細胞中に核酸(複数可)を伝達するか、送達するか、または導入するための組成物を指す。ベクターは、伝達されるか、送達されるか、導入されるヌクレオチド配列を含む核酸構築体を含む。宿主生物の形質転換に用いられるベクターは、当該技術において周知である。ベクターの一般的なクラスの非限定的な例として、自己伝染性であっても可動性であってもよいしそうでなくてもよい二本鎖または一本鎖の直鎖状または環状の形態の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、ミニサークル、またはアグロバクテリウム(Agrobacterium)属バイナリベクターが挙げられる。一部の実施形態において、ウイルスベクターとして、以下に限定されないが、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、または単純ヘルペスウイルスのベクターが挙げられ得る。本明細書中で定義されるベクターは、細胞ゲノム中への組込み、または染色体外の存在(例えば、複製起点を有する自律複製プラスミド)のいずれかによって、原核生物宿主または真核生物宿主を形質転換することができる。加えて、含まれるのは、2つの異なる宿主生物内での複製が天然で、または設計によって可能なDNAビヒクルを意味するシャトルベクターであり、これは、アクチノミセスおよび関連する種、細菌、および真核生物(例えば、より高次の植物、哺乳動物、酵母、または真菌の細胞)から選択され得る。一部の実施形態において、ベクター内の核酸は、宿主細胞内での転写に適したプロモーターまたは他の調節要素の制御下にあり、かつこれと作動可能に連結されている。ベクターは、複数の宿主において機能する二元機能性発現ベクターであってもよい。ゲノムDNAの場合には、これは、それ自体のプロモーターおよび/または他の調節要素を含有してもよく、そしてcDNAの場合には、これは、宿主細胞内での発現に適したプロモーターおよび/または他の調節要素の制御下にあってもよい。したがって、本発明の核酸構築体もしくはポリヌクレオチド、および/またはこれを含む発現カセットが、本明細書中に記載されるベクター、および当該技術において知られているベクター内に含まれてもよい。
【0073】
本明細書中で用いられる「接触させる」、「接触させている」、「接触した」、およびその文法上の変形は、所望される反応(例えば、形質転換、転写制御、ゲノム編集、ニッキング、および/または切断)の構成要素(複数)を、所望される反応を実行するのに適した条件下に一緒に置くことを指す。非限定的な例として、標的核酸を、配列特異的DNA結合ドメイン、DNAエンドヌクレアーゼ、DNA依存性DNAポリメラーゼ、DNAによりコードされた修復鋳型、ガイド核酸、および/またはこれをコードする/含む核酸構築体/発現カセットと、配列特異的DNA結合タンパク質、DNAエンドヌクレアーゼ、およびDNA依存性DNAポリメラーゼが発現され、かつ配列特異的DNA結合タンパク質が標的核酸に結合し、かつDNA依存性DNAポリメラーゼが、配列特異的DNA結合タンパク質に融合されるか、または配列特異的DNA結合タンパク質にリクルートされる(例えば、配列特異的DNA結合タンパク質に融合されたペプチドタグ、およびDNA依存性DNAポリメラーゼに融合された親和性ポリペプチド(例えば、ペプチドタグに結合することができるポリペプチド)を介して)ことによって、DNA依存性DNAポリメラーゼを、標的核酸の付近にリクルートすることによって、標的核酸を修飾する条件下で、接触させてもよい。
【0074】
本明細書中で用いられる、標的核酸に関する「修飾すること」または「修飾」は、編集(例えば変異)、共有結合修飾、核酸/ヌクレオチド塩基の交換/置換、欠失、切断、ニッキング、および/または標的核酸の転写制御を含む。一部の実施形態において、修飾は、あらゆるサイズのインデルおよび/またはあらゆるタイプの単一塩基変化(SNP)を含んでもよい。
【0075】
注目するポリヌクレオチドの文脈における「導入すること」、「導入する」、「導入された」(およびその文法上の変形)は、注目するヌクレオチド配列(例えば、ポリヌクレオチド、核酸構築体、および/またはガイド核酸)を、宿主生物または前記生物の細胞(例えば、宿主細胞、例えば、植物細胞、動物細胞、細菌細胞、真菌細胞)に、ヌクレオチド配列が細胞の内部にアクセスするように提示することを意味する。
【0076】
用語「形質転換」または「形質移入」は、互換的に用いられ得、そして本明細書中で用いられるような、細胞中への異種核酸の導入を指す。細胞の形質転換は、安定していてもよいし、一過性であってもよい。ゆえに、一部の実施形態において、宿主細胞または宿主生物は、本発明のポリヌクレオチド/核酸分子で安定して形質転換されていてもよい。一部の実施形態において、宿主細胞または宿主生物は、本発明の核酸構築体で一時的に形質転換されていてもよい。
【0077】
ポリヌクレオチドの文脈における「一過性の形質転換」は、ポリヌクレオチドが細胞中に導入されて、細胞のゲノム中に組み込まれないことを意味する。
【0078】
細胞中に導入されるポリヌクレオチドの文脈における、「安定して導入すること」または「安定して導入される」によって意図されるのは、導入されたポリヌクレオチドが、細胞のゲノム中に安定して組み込まれていることで、細胞は、ポリヌクレオチドで安定して形質転換されていることである。
【0079】
本明細書中で用いられる「安定した形質転換」または「安定して形質転換された」は、核酸分子が細胞中に導入されて、細胞のゲノム中に組み込まれることを意味する。したがって、組み込まれた核酸分子は、その後代によって、より詳細には複数の連続する世代の後代によって遺伝することができる。本明細書中で用いられる「ゲノム」は、核ゲノムおよび色素体ゲノムを含むので、例えば、葉緑体ゲノムまたはミトコンドリアゲノム中への核酸の組込みを含む。また、本明細書中で用いられる安定した形質転換は、例えば微小染色体またはプラスミドとして、染色体外に維持される導入遺伝子を指し得る。
【0080】
一過性の形質転換は、例えば、酵素結合免疫吸着アッセイ(ELISA)またはウェスタンブロットによって検出され得、これらは、生物中に導入される1つまたは複数の導入遺伝子によってコードされるペプチドまたはポリペプチドの存在を検出することができる。細胞の安定した形質転換は、例えば、核酸配列との細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイによって検出することができ、これは、生物(例えば植物)中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズするものである。細胞の安定した形質転換は、例えば、核酸配列との細胞のRNAのノーザンブロットハイブリダイゼーションアッセイによって検出することができ、これは、宿主生物中に導入される導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする。また、細胞の安定した形質転換は、例えば、当該技術において周知のポリメラーゼ連鎖反応(PCR)または他の増幅反応によって検出することができ、これは、導入遺伝子の標的配列とハイブリダイズする特異的プライマー配列を使用して、導入遺伝子配列の増幅をもたらし、これが標準的な方法に従って検出され得る。また、形質転換は、当該技術において周知である直接の配列決定および/またはハイブリダイゼーションプロトコールによって検出することができる。
【0081】
したがって、一部の実施形態において、本発明のヌクレオチド配列、ポリヌクレオチド、核酸構築体、および/または発現カセットは、一過性に発現され得、かつ/または宿主生物のゲノム中に安定して組み込まれ得る。ゆえに、一部の実施形態において、本発明の核酸構築体(例えば、例えば、配列特異的DNA結合ポリペプチドまたはドメイン、DNAエンドヌクレアーゼポリペプチドまたはドメイン、DNA依存性DNAポリメラーゼポリペプチドまたはドメインその他をコードする1つまたは複数の発現カセット)が、ガイド核酸により細胞中に一過性に導入されるので、DNAは細胞内で維持され得ない。
【0082】
本発明の核酸構築体が、当業者に知られているあらゆる方法によって、細胞中に導入され得る。本発明の一部の実施形態において、細胞の形質転換は、核形質転換を含む。他の実施形態において、細胞の形質転換は、色素体形質転換(例えば葉緑体形質転換)を含む。更なる実施形態において、本発明の組換え核酸構築体は、従来の育種技術を介して細胞中に導入することができる。
【0083】
真核生物および原核生物の双方を形質転換する手順は、当該技術において周知であり、かつルーチンであり、文献の全体を通して記載されている(例えば、Jiang et al.2013.Nat.Biotechnol.31:233-239、Ran et al.Nature Protocols8:2281-2308(2013)参照)。
【0084】
したがって、ヌクレオチド配列は、当該技術において周知であるいくつもの方法により、宿主生物またはその細胞中に導入することができる。本発明の方法は、1つまたは複数のヌクレオチド配列を生物中に導入するが、生物の少なくとも1つの細胞の内部にアクセスする特定の方法に依存しない。複数のヌクレオチド配列が導入されることとなる場合、これらは、単一の核酸構築体の一部として、または別々の核酸構築体としてアセンブルすることができ、そして同じであるか、または異なる核酸構築体上に位置決めすることができる。したがって、ヌクレオチド配列は、単一の形質転換事象で、かつ/もしくは別々の形質転換事象で、注目する細胞中に導入することができ、またはこれ以外にも、関連する場合、ヌクレオチド配列は、植物中に、例えば育種プロトコールの一部として、組み込むことができる。
【0085】
相同組換えによる内因性DSB修復は、操作するのが困難であり、エラー傾向がある非相同末端結合パスウェイ由来の競合に直面する。本発明において、鋳型を用いた編集は、修復の効率を引き下げるDSBのバイパス工程の向上である。ポリペプチドおよび核酸、ならびにタンパク質-タンパク質融合および非共有結合性のリクルート(recruitments)の新規の組合せを利用して、高いフィデリティの、プロセッシブまたは分配型DNAポリメラーゼ、および修復鋳型を、配列特異的に標的部位に送達する。標的部位は、配列特異的DNA結合タンパク質と組み合わせて提供される、DNAエンドヌクレアーゼもしくはニッカーゼ活性を含む配列特異的DNA結合ドメインによって、またはエンドヌクレアーゼ活性もしくはニッカーゼ活性を有するDNAエンドヌクレアーゼによって切断されるか、またはニックが入れられる。DNAによりコードされた修復鋳型、および一本鎖ニックまたは二本鎖切断を有する標的DNAをプライマーとして用いて、DNA依存性DNAポリメラーゼは、DNA合成を直ちに開始して、所望の変異または大きな挿入断片を標的部位中にコピーすることができる。本発明を用いて、単一塩基もしくは数塩基の特定の変化、定義されたゲノム配列の欠失、または小さな断片もしくは大きな断片の挿入を生成することができる。
【0086】
複数のDNAリクルート戦略が、本明細書中に記載されるように、標的への修復鋳型の送達を向上させるのに用いられてもよく、例えば、HUH-タグ、DNAアプタマー、細菌レトロンのmsDNA、および/またはT-DNAリクルートが挙げられる。鋳型可用性を向上させるための一具体例として、HUH-タグの一タイプであるPCVの使用がある。PCVドメインを、例えば、標的核酸内にニックまたは切断を生じさせる、ニッカーゼ活性またはエンドヌクレアーゼ活性を有するCRISPR-Casエフェクタタンパク質に融合することができる。PCV認識部位の配列が、修復鋳型内に含まれるので、修復鋳型は、対応するPCVドメインと相互作用する能力により標的部位にリクルートされ得る。リクルートは、ニックまたは切断がCRISPR-Casエフェクタタンパク質によって標的核酸内に生じるのとおおよそ同時に起こり得る。
【0087】
DNA依存性DNAポリメラーゼは、相同組換えを実行するのに重要な構成要素である。一本鎖ニックまたは二本鎖切断を含む標的核酸の3’末端は、DNAによりコードされた修復鋳型にアニールすることができ、そして、鎖合成を開始することによって修復鋳型から標的部位までの遺伝的情報をコピーするDNA依存性DNAポリメラーゼのプライマーとしての役目を果たす。一部の実施形態において、本プロセスに用いられるDNAポリメラーゼは、エラーを防ぐ高いフィデリティを有し得、かつ/またはDNAポリメラーゼが解離する前に長い鋳型がコピーされるのを確実にする高いプロセッシビティを示し得る。標的核酸に結合するCRISPR-Casエフェクタポリペプチド/複合体とのDNA依存性DNAポリメラーゼの関連の文脈において、標的中への鋳型組込みの効率を最大にする分配機能を有するDNA依存性DNAポリメラーゼを有することが有利であり得る。この工程を促進するために、高いフィデリティ、ならびにプロセッシブプロファイルおよび分配プロファイルを有するDNA依存性DNAポリメラーゼを、例えば配列特異的DNA結合ドメインおよびDNAエンドヌクレアーゼ(例えばCRISPR-Casエフェクタタンパク質)との、タンパク質融合または非共有結合性の相互作用のいずれかによってリクルートすることができる。直接的融合は、最適化されたリンカーアーキテクチャを介してなされ得る。非共有結合性のリクルート戦略として、ガイド核酸(例えばRNAリクルートモチーフ、例えばMS2ループ)を介したリクルート、または配列特異的DNA結合ドメイン(例えば、CRISPR-Casエフェクタタンパク質)および/もしくはDNAエンドヌクレアーゼ(例えば、ペプチドタグ、例えば抗体/エピトープ相互作用、例えばSunTagを介する)を介したリクルートが挙げられ得る。勿論、本発明は、これらの特定のリクルート技術によって制限されず、そして他の、知られているか、もしくは後に開発されるあらゆるタンパク質-タンパク質、または現在知られているか、もしくは後に開発される核酸-タンパク質リクルート技術を、本発明を実行するのに用いてもよい。
【0088】
本発明者らは、鋳型を用いた編集の向上を実現する組成物および方法を開発した。タンパク質-タンパク質融合および非共有結合性のリクルートの組合せを用いて、高いフィデリティの、プロセッシブまたは分配型DNAポリメラーゼが、標的部位に配列特異的に送達され、当該部位は、例えば、CRISPRエンドヌクレアーゼまたはニッカーゼによって切断されてもよいし、ニックが入れられてもよい。DNA依存性DNAポリメラーゼは、DNAによりコードされた修復鋳型と組み合わせて、一本鎖ニックまたは二本鎖切断を有する標的DNAをプライマーとして用いることによって、DNA合成を直ちに開始して、所望の変異または大きな挿入断片を標的部位中にコピーすることができる。本明細書中に記載される本発明およびその変形を利用して、単一塩基もしくは少数の塩基の特定の変化、定義されたゲノム配列の欠失、または小さな断片もしくは大きな断片の挿入を形成することができる。
【0089】
ゆえに、一部の実施形態において、本発明は、(a)標的核酸上の部位(例えば第1の部位)に結合することができる配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質)、および(b)DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼ)を含む複合体(例えば第1の複合体)を提供する。一部の実施形態において、複合体は、DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型)を含んでもよい。一部の実施形態において、複合体は、DNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ)を含んでもよく、DNAエンドヌクレアーゼは、一本鎖ニックもしくは二本鎖切断を導入することができ、または標的核酸上の部位(例えば第1の部位)に結合することができる配列特異的DNA結合タンパク質もまた、一本鎖ニックもしくは二本鎖切断(例えばCRISPR-Casエフェクタタンパク質)を導入することができるエンドヌクレアーゼ活性を含む。
【0090】
一部の実施形態において、本発明は、(a)標的核酸上の部位(例えば第1の部位)に結合することができ、かつ一本鎖ニックまたは二本鎖切断を導入することができるエンドヌクレアーゼ活性を含む配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質)、(b)第1のDNA依存性DNAポリメラーゼ、および(c)DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型)を含む複合体(例えば第1の複合体)を提供する。
【0091】
一部の実施形態において、本発明は、(a)標的核酸上の部位(例えば第1の部位)に結合することができる配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質)、(b)DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼ)、(c)DNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ)、および(d)DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型)を含む複合体(例えば第1の複合体)を提供する。
【0092】
一部の実施形態において、本発明の複合体(例えば第1の複合体)の配列特異的DNA結合タンパク質は、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来であってもよい。一部の実施形態において、配列特異的DNA結合タンパク質は、CRISPR-Casポリペプチド、ジンクフィンガー、転写アクティベータ様エフェクタ、および/またはアルゴノートタンパク質由来であってもよい。
【0093】
一部の実施形態において、本発明の複合体(例えば第1の複合体)に有用なDNAエンドヌクレアーゼまたはDNAエンドヌクレアーゼ活性は、エンドヌクレアーゼ(例えばFok1)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)であってもよいし、これらに由来してもよい。一部の実施形態において、DNAエンドヌクレアーゼは、ヌクレアーゼであってもニッカーゼであってもよいし、DNAエンドヌクレアーゼ活性は、ヌクレアーゼ活性であってもニッカーゼ活性であってもよい。
【0094】
一部の実施形態において、配列特異的DNA結合タンパク質は、DNA依存性DNAポリメラーゼに、場合によってはリンカーを介して融合されていてもよい。一部の実施形態において、配列特異的DNA結合タンパク質は、そのN末端にて、DNA依存性DNAポリメラーゼに融合されていてもよい。一部の実施形態において、配列特異的DNA結合タンパク質は、そのC末端にて、DNA依存性DNAポリメラーゼに融合されていてもよい。
【0095】
本発明はさらに、ペプチドタグまたはRNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合された操作された(修飾された)DNA依存性DNAポリメラーゼを提供する。一部の実施形態において、本発明の操作されたDNA依存性DNAポリメラーゼは、配列非特異的DNA結合ドメインに融合されたDNA依存性DNAポリメラーゼを含んでもよく、場合によっては、配列非特異的DNA結合ドメインは、スルホロブス・ソルファタリカス(Sulfolobus solfataricus)由来のSso7d由来の配列非特異的dsDNA結合タンパク質であってもよい。本発明の操作されたDNA依存性DNAポリメラーゼは、本明細書中に記載されるように操作されていない同じDNA依存性DNAポリメラーゼと比較して、プロセッシビティの増大、フィデリティの増大、親和性の増大、配列特異性の増大、配列特異性の低下、および/または協同作用の増大を示し得る。一部の実施形態において、操作されたDNA依存性DNAポリメラーゼは、5’→3’-ポリメラーゼ活性、3’→5’エキソヌクレアーゼ活性、5’→3’エキソヌクレアーゼ活性、および/または5’→3’RNA依存性DNAポリメラーゼ活性の少なくとも1つを引き下げるか、または排除するように修飾されていてもよい。ゆえに、操作されたDNA依存性DNAポリメラーゼは、5’→3’-ポリメラーゼ活性、3’→5’エキソヌクレアーゼ活性、5’→3’エキソヌクレアーゼ活性、および/または5’→3’RNA依存性DNAポリメラーゼ活性の少なくとも1つの活性を含まなくてもよい
【0096】
一部の実施形態において、配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質)が、ペプチドタグに融合されていてもよく、DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼ)が、ペプチドタグに結合することができる親和性ポリペプチドに融合されていてもよく、DNA依存性DNAポリメラーゼは、ペプチドタグに融合された配列特異的DNA結合タンパク質に(そして、配列特異的DNA結合タンパク質が結合している可能性がある標的核酸に)リクルートされ得る。一部の実施形態において、DNA依存性DNAポリメラーゼ(例えば、第1の配列特異的DNA結合タンパク質)が、ペプチドタグに融合されていてもよく、配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質)が、ペプチドタグに結合することによって、DNA依存性DNAポリメラーゼを、親和性ポリペプチドに融合された配列特異的DNA結合タンパク質に、そして配列特異的DNA結合タンパク質が結合する標的核酸にリクルートすることができる親和性ポリペプチドに融合されていてもよい。
【0097】
本発明の複合体はさらに、ガイド核酸(例えば、CRISPR核酸、crRNA、crDNA)を含んでもよい。ガイド核酸は、CRISPR-Casエフェクタタンパク質と組み合わせて用いられてもよく、これは、一部の実施形態において、エンドヌクレアーゼ活性またはニッカーゼ活性を含んでもよい。一部の実施形態において、配列特異的DNA結合タンパク質のエンドヌクレアーゼ活性またはニッカーゼ活性は、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)に由来してもよい。
【0098】
一部の実施形態において、ガイド核酸は、RNAリクルートモチーフに連結されていてもよく、DNA依存性DNAポリメラーゼが、RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されていてもよい。一部の実施形態において、RNAリクルートモチーフは、CRISPR核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されていてもよい。
【0099】
一部の実施形態において、DNAによりコードされた修復鋳型は、標的核酸に、DNAによりコードされた修復鋳型を、標的核酸に対して相補性を有するスペーサーを含むガイド核酸に連結することによってリクルートされてもよい。
【0100】
本発明は、更なる複合体(例えば第2の複合体)を提供してもよく、当該複合体は、(a)標的核酸上の第2の部位に結合することができる配列特異的DNA結合タンパク質(例えば、第2の配列特異的DNA結合タンパク質)、および(b)DNAによりコードされた修復鋳型(例えば、第1または第2の、DNAによりコードされた修復鋳型)を含む。一部の実施形態において、配列特異的DNA結合タンパク質は、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来であってもよい。一部の実施形態において、複合体(例えば、第2の複合体)はさらに、DNAエンドヌクレアーゼ(例えば、第2のDNAエンドヌクレアーゼ)を含んでもよく、DNAエンドヌクレアーゼは、一本鎖ニックまたは二本鎖切断を標的核酸中に導入することができる。一部の実施形態において、DNAエンドヌクレアーゼは、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来であってもよい。一部の実施形態において、標的核酸上の第2の部位に結合することができる第2の複合体の配列特異的DNA結合タンパク質はさらに、一本鎖ニックまたは二本鎖切断を標的核酸内に導入することができるエンドヌクレアーゼ活性を含んでもよい。一部の実施形態において、エンドヌクレアーゼ活性をさらに含む配列特異的DNA結合タンパク質(例えば、第2の配列特異的DNA結合タンパク質)は、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)であってもよい。
【0101】
一部の実施形態において、DNAによりコードされた修復鋳型が、DNAリクルートモチーフに連結されていてもよく、配列特異的DNA結合タンパク質は、DNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合されていてもよく、場合によっては、DNAリクルートモチーフ/親和性ポリペプチドは、HUH-タグ、DNAアプタマー、細菌レトロンのmsDNA、または抗体/エピトープ対(例えばT-DNAリクルート)を含む。一部の実施形態において、配列特異的DNA結合タンパク質が、ブタサーコウイルス2(PCV)Repタンパク質に融合されていてもよく、DNA鋳型は、PCV認識部位を含む。一部の実施形態において、配列特異的DNA結合タンパク質は、そのN末端にて、PCV Repタンパク質に融合されていてもよい。一部の実施形態において、配列特異的DNA結合タンパク質は、そのC末端にて、PCV Repタンパク質に融合されていてもよい。本発明に有用であり得るHUH-タグの非限定的な例およびその対応する認識配列を、表1に記載する。
【0102】
【0103】
一部の実施形態において、DNAによりコードされた修復鋳型を、アグロバクテリウム属エフェクタタンパク質(例えば、アグロバクテリウム属病原性ポリペプチド、場合によってはvirD2および/またはvirE2)と相互作用するT-DNA配列中に組み込むことによって、DNAによりコードされた修復鋳型を標的核酸にリクルートしてもよく、配列特異的DNA結合タンパク質は、例えば、アグロバクテリウム属エフェクタタンパク質にリクルートされることによって、DNAによりコードされた修復鋳型を、配列特異的DNA結合タンパク質に、そして配列特異的DNA結合タンパク質が結合する標的核酸にリクルートし得る。一例として、1つまたは複数のエピトープタグが、配列特異的DNA結合タンパク質に融合されていてもよく、エピトープタグを認識する抗体が、アグロバクテリウム属エフェクタタンパク質に融合されており、それによって、配列特異的DNA結合タンパク質およびアグロバクテリウム属エフェクタタンパク質は、植物細胞内で相互作用することが可能となり得る。アグロバクテリウム属エフェクタタンパク質と関連するあらゆるT-DNA配列が、配列特異的DNA結合タンパク質の作用によって、標的核酸にリクルートされることとなる。
【0104】
一部の実施形態において、DNAによりコードされた修復鋳型へのDNAアプタマーの付着によって、DNAによりコードされた修復鋳型が標的核酸にリクルートされてもよい。DNAアプタマーは、その固有の二次構造に起因して、高い親和性で特定の標的に結合することができるDNAの配列である。DNAアプタマーガイド遺伝子ターゲティングが、ヒトおよび酵母系におけるエンドヌクレアーゼI-SceI媒介遺伝子ターゲティングについて実証されている。候補DNAアプタマーのプールが、特異的CRIPSRタンパク質(Cas9、Cpf1その他)との親和性について、キャピラリ電気泳動によってスクリーニングされ得る。選択されたCRISPRヌクレアーゼタンパク質への親和性が最も高いDNAアプタマーは、単鎖DNA鋳型に付着されて、DNA鋳型をCRISPRタンパク質標的遺伝子座へとガイドすることとなる。
【0105】
一部の実施形態において、修復鋳型は、ガイドRNAに付着される細菌レトロン足場からmsDNAとして発現され得る。細菌レトロンは、逆転写酵素をコードする細菌要素であり、これは、転写されたレトロンゲノムの特定の部分を認識して、これを、単鎖DNA(msDNA)の複数のコピーを生成する鋳型として用いる。msDNAは、RNA鋳型に繋がれたままである。レトロンRNA足場配列を、CRISPRガイドRNA足場に、遺伝子編集に所望の修復鋳型で置換されたレトロンゲノムの部分を有する伸長部として加えることができる。ガイドRNA足場伸長部に繋がれたmsDNAとしての鋳型の発現により、切断がなされると同時に、修復鋳型の複数のコピーの切断部位への送達が可能となる。この系は、酵母において実証されているが、哺乳動物系においても植物系においても実証されていない。本発明に有用な、例示的な細菌レトロンが、表2に記載されている。
【0106】
【0107】
鋳型を用いた編集をヒトゲノム標的FANCF01内に導入するように設計されたキメラガイド核酸配列(ガイドDNA)の例として、
ec67レトロン足場の後に続く、単一のガイド核酸(sg核酸)(イタリック体の小文字)内に埋め込まれている修復鋳型(太字):
【0108】
ec86レトロン足場の後に続く、単一のガイド核酸(sg核酸)(イタリック体の小文字)内に埋め込まれている修復鋳型(太字):
【0109】
ec107レトロン足場の後に続く、単一のガイド核酸(sg核酸)(イタリック体の小文字)内に埋め込まれている修復鋳型(太字):
【0110】
mx162レトロン足場の後に続く、単一のガイド核酸(sg核酸)(イタリック体の小文字)内に埋め込まれている修復鋳型(太字):
が挙げられるが、これらに限定されない。
【0111】
一部の実施形態において、複合体(例えば第2の複合体)はさらに、DNA依存性DNAポリメラーゼ(例えば、第2のDNA依存性DNAポリメラーゼ)を含んでもよい。
【0112】
一部の実施形態において、複合体(例えば、第2の複合体)はさらに、ガイド核酸を含んでもよく、場合によっては、ガイド核酸は、DNAによりコードされた修復鋳型(例えば、第1または第2の、DNAによりコードされた修復鋳型)に連結されていてもよい。
【0113】
一部の実施形態において、第3の複合体が提供されてもよく、第3の複合体は、第1の部位および第2の部位とは異なる鎖上にある標的核酸上の部位(例えば、第3の部位)に結合することができる配列特異的DNA結合タンパク質(例えば、第3の配列特異的DNA結合タンパク質)、ならびにDNAエンドヌクレアーゼ(例えば、第3のDNAエンドヌクレアーゼ)(例えば、単鎖切断を生成することができるニッカーゼ)を含む。一部の実施形態において、標的核酸を第3の複合体と接触させることで、ミスマッチ修復を向上させることによって、修復の効率をブーストし得る。
【0114】
一部の実施形態において、本発明は、RNA分子を提供し、RNA分子は、(a)CRISPR-Casエフェクタタンパク質との相互作用を媒介する核酸配列、(b)CRISPR-Casエフェクタタンパク質を特異的核酸標的部位にDNA-RNA相互作用を介して向ける核酸配列、および(c)本発明の操作されたDNA依存性DNAポリメラーゼと相互作用することができるステムループ構造(例えば、RNAリクルートモチーフ)を形成する核酸配列を含む。一部の態様において、本発明は、(a)CRISPR-Casエフェクタタンパク質との相互作用を媒介する核酸配列、(b)CRISPR-Casエフェクタタンパク質を特定の核酸標的部位にDNA-RNA相互作用を介して向ける核酸配列、および(c)ステムループ構造を形成する核酸配列を含むRNA分子と複合体形成された、本発明の操作されたDNA依存性DNAポリメラーゼを提供する。
【0115】
本発明はさらに、本発明の複合体(例えば、第1の複合体、第2の複合体、および/または第3の複合体)をコードし、かつ/あるいは配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質、第2の配列特異的DNA結合タンパク質、および/または第3の配列特異的DNA結合タンパク質)、DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼおよび/または第2のDNA依存性DNAポリメラーゼ)、DNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ、第2のDNAエンドヌクレアーゼ、および/または第3のDNAエンドヌクレアーゼ)の1つまたは複数をコードし、あるいはDNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型および/または第2の、DNAによりコードされた修復鋳型)の1つもしくは複数、または1つもしくは複数のガイド核酸(例えば、第1のガイド核酸、第2のガイド核酸、および/または第3のガイド核酸等)を含むポリヌクレオチドを提供する。一部の実施形態において、本発明の操作されたDNA依存性DNAポリメラーゼをコードするポリヌクレオチドが提供される。本明細書中でさらに提供されるのは、本発明のポリヌクレオチドの1つまたは複数を含む1つまたは複数の発現カセットおよび/またはベクターである。
【0116】
本発明の一部の実施形態において、配列特異的DNA結合ドメイン、配列非特異的DNA結合タンパク質、DNAエンドヌクレアーゼ、DNA依存性DNAポリメラーゼをコードするポリヌクレオチド、ならびに/またはこれを含む発現カセットおよび/もしくはベクターが、細胞または生物(例えば、例えば、動物(例えば、哺乳動物、昆虫、魚等)、植物(例えば、双子葉植物、単子葉植物)、細菌、古細菌等の生物および/または細胞)内での発現のためにコドン最適化されていてもよい。一部の実施形態において、本発明のポリヌクレオチドを含む/本発明の複合体/ポリペプチドをコードする発現カセットは、双子葉植物内での発現のために、または単子葉植物内での発現のためにコドンが最適化されていてもよい。
【0117】
本発明はさらに、標的核酸を修飾するための本発明の組成物を用いる方法を提供する。したがって、本発明は、標的核酸を修飾する方法を提供し、当該方法は、標的核酸または標的核酸を含む細胞を、本発明の複合体もしくはシステム、これらをコードする/含むポリヌクレオチド、または本発明の複合体もしくはシステムの構成要素の1つまたは複数、ならびに/あるいはこれらを含む発現カセットおよび/またはベクターと接触させることを含む。当該方法は、インビボ系で(例えば、細胞内で、または生物内で)実行されてもよいし、インビトロ系で(例えば、細胞フリーで)実行されてもよい。本発明のポリペプチドおよび複合体、ならびにこれらをコードするポリヌクレオチド/発現カセット/ベクターは、例えば植物または植物細胞内で、標的核酸を修飾する方法に用いられ得、当該方法は、本発明の1つまたは複数の発現カセットを、植物または植物細胞中に導入することによって、植物または植物細胞内で標的核酸を修飾して、修飾された標的核酸を含む植物または植物細胞を生成することを含む。一部の実施形態において、当該方法はさらに、修飾された標的核酸を含む植物細胞を再生して、修飾された標的核酸を含む植物を生成することを含み得る。
【0118】
一部の実施形態において、標的核酸を修飾する方法が提供され、当該方法は、標的核酸を本発明の複合体(例えば第1の複合体)と接触させることによって、標的核酸を修飾することを含む。一部の実施形態において、当該方法はさらに、標的核酸を本発明の第2の複合体と接触させることによって、標的核酸を修飾することを含み得る。一部の実施形態において、標的核酸はさらに、本発明の第3の複合体と接触することによって、標的核酸の修飾の修復効率を向上させ得る。
【0119】
一部の実施形態において、標的核酸を修飾する方法が提供され、当該方法は、標的核酸を、(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、(c)第1のDNAエンドヌクレアーゼ、および(d)第1の、DNAによりコードされた修復鋳型と接触させることによって、標的核酸を修飾することを含む。一部の実施形態において、第1の配列特異的DNA結合タンパク質、第1のDNA依存性DNAポリメラーゼ、第1のDNAエンドヌクレアーゼ、および第1の、DNAによりコードされた修復鋳型は、複合体を形成し得、当該複合体は、標的核酸と相互作用し得る。
【0120】
一部の実施形態において、標的核酸を修飾する方法が提供され、当該方法は、標的核酸を、(a)標的核酸上の第1の部位に結合することができる第1の配列特異的DNA結合タンパク質であって、一本鎖ニックまたは二本鎖切断を導入することができるニッカーゼ活性またはエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、(b)第1のDNA依存性DNAポリメラーゼ、および(c)第1の、DNAによりコードされた修復鋳型と接触させることによって、標的核酸を修飾することを含む。一部の実施形態において、エンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質、第1のDNA依存性DNAポリメラーゼ、および第1の、DNAによりコードされた修復鋳型は、標的核酸と相互作用することができる複合体を形成し得る。第1の配列特異的DNA結合タンパク質のエンドヌクレアーゼ活性および/またはニッカーゼ活性は、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)由来であってもよい。一部の実施形態において、エンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質は、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)であってもよい。第1の配列特異的DNA結合タンパク質は、例えば、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来であってもよい。
【0121】
一部の実施形態において、第1の配列特異的DNA結合タンパク質は、第1のDNA依存性DNAポリメラーゼに、場合によってはリンカーを介して融合されていてもよい。一部の実施形態において、第1の配列特異的DNA結合タンパク質は、そのN末端にて、第1のDNA依存性DNAポリメラーゼに融合されていてもよい。一部の実施形態において、第1の配列特異的DNA結合タンパク質は、そのC末端にて、第1のDNA依存性DNAポリメラーゼに融合されていてもよい。一部の実施形態において、第1の配列特異的DNA結合タンパク質は、ペプチドタグに融合されていてもよく、第1のDNA依存性DNAポリメラーゼは、ペプチドタグに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、第1のDNA依存性DNAポリメラーゼが、ペプチドタグに融合された第1の配列特異的DNA結合タンパク質に、そして配列特異的DNA結合タンパク質が結合し、かつ/または結合することができる標的核酸にリクルートされる。一部の実施形態において、第1のDNA依存性DNAポリメラーゼは、ペプチドタグに融合されていてもよく、第1の配列特異的DNA結合タンパク質は、ペプチドタグに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、第1のDNA依存性DNAポリメラーゼが、親和性ポリペプチドに融合された第1の配列特異的DNA結合タンパク質に、そして配列特異的DNA結合タンパク質が結合し、かつ/または結合することができる標的核酸にリクルートされる。
【0122】
本発明の一部の実施形態において、第1の配列特異的DNA結合ドメインおよび/または第1のDNAエンドヌクレアーゼは、CRISPR-Casエフェクタタンパク質であってもよいし、これに由来してもよく、標的核酸は、DNA-RNA相互作用を介してCRISPR-Casエフェクタタンパク質を特定の核酸標的部位に向けるガイド核酸(例えば、CRISPR核酸、crRNA、crDNA)(例えば、第1のガイド核酸)と接触し得る。一部の実施形態において、DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型)は、ガイド核酸に連結されていてもよく、それによって、DNAによりコードされた修復鋳型が標的核酸へとガイドされる。一部の実施形態において、ガイド核酸は、RNAリクルートモチーフに連結されていてもよく、DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼ)は、RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、DNA依存性DNAポリメラーゼが標的核酸へとガイドされる。RNAリクルートモチーフは、ガイド核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されていてもよい。
【0123】
一部の実施形態において、本発明の第1の複合体と接触した標的核酸は、本発明の第2の複合体と接触し得、第2の複合体は、(a)標的核酸上の第2の部位に結合することができる第2の配列特異的DNA結合タンパク質、および(b)DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型または第2の、DNAによりコードされた修復鋳型)を含む。一部の実施形態において、標的核酸はさらに、第2のDNAエンドヌクレアーゼと接触し、または第2の複合体はさらに、第2のDNAエンドヌクレアーゼを含み、第2のDNAエンドヌクレアーゼは、標的核酸中に一本鎖ニックまたは二本鎖切断を導入することができる。代わりに、または加えて、第2の複合体の第2の配列特異的DNA結合タンパク質は、一本鎖ニックまたは二本鎖切断を標的核酸中に導入し得るエンドヌクレアーゼ活性それ自体を含んでもよい。一部の実施形態において、標的核酸上の第2の部位に結合することができる第2の配列特異的DNA結合タンパク質、第2の、DNAによりコードされた修復鋳型、および場合によっては、DNAエンドヌクレアーゼは、標的核酸上の第2の部位と相互作用する複合体を形成し得る。
【0124】
一部の実施形態において、第2の配列特異的DNA結合タンパク質は、ペプチドタグに融合されていてもよく、第2のDNAエンドヌクレアーゼは、ペプチドタグに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、第2のDNAエンドヌクレアーゼが、ペプチドタグに融合された第2の配列特異的DNA結合タンパク質に、そして第2の配列特異的DNA結合タンパク質が結合し、かつ/または結合することができる標的核酸上の第2の部位にリクルートされる。一部の実施形態において、第2のDNAエンドヌクレアーゼは、ペプチドタグに融合されていてもよく、第2の配列特異的DNA結合タンパク質は、ペプチドタグに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、第2のDNAエンドヌクレアーゼが、親和性ポリペプチドに融合された第2の配列特異的DNA結合タンパク質に、そして第2の配列特異的DNA結合タンパク質が結合し、かつ/または結合することができる標的核酸上の第2の部位にリクルートされる。
【0125】
一部の実施形態において、第2の複合体の、DNAによりコードされた修復鋳型(例えば、第1の、DNAによりコードされた修復鋳型または第2の、DNAによりコードされた修復鋳型)は、DNAリクルートモチーフに連結されていてもよく、第2の配列特異的DNA結合タンパク質は、DNAリクルートモチーフと相互作用することができる親和性ポリペプチドに融合されていてもよく、場合によっては、DNAリクルートモチーフ/親和性ポリペプチドは、HUH-タグ(例えば、表1参照)、DNAアプタマー、細菌レトロンのmsDNA、またはT-DNAリクルートを含むことによって、第2の、DNAによりコードされた修復鋳型を配列特異的DNA結合タンパク質、および配列特異的DNA結合タンパク質が結合することができる標的核酸にリクルートする。一部の実施形態において、第2の配列特異的DNA結合タンパク質は、例えば、ブタサーコウイルス2(PCV)Repタンパク質に融合されていてもよく、DNAによりコードされた修復鋳型は、PCV認識部位を含んでもよい。
【0126】
一部の実施形態において、第2の配列特異的DNA結合タンパク質は、以下に由来してもよく、かつ/またはポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/もしくはアルゴノートタンパク質であってもよい。一部の実施形態において、第2のDNA結合ドメインおよび/または第2のDNAエンドヌクレアーゼは、以下に由来してもよく、かつ/またはCRISPR-Casエフェクタタンパク質であってもよく、標的核酸は、CRISPR-Casエフェクタタンパク質を特定の核酸標的部位にDNA-RNA相互作用を介して向けるガイド核酸(例えば、CRISPR核酸、crRNA、crDNA)(例えば、第2のガイド核酸)と接触し得る。一部の実施形態において、DNAによりコードされた修復鋳型(例えば、第2の、DNAによりコードされた修復鋳型)は、ガイド核酸に連結されていてもよく、それによって、DNAによりコードされた修復鋳型が標的核酸へとガイドされる。一部の実施形態において、第2のガイド核酸は、RNAリクルートモチーフに連結されていてもよく、第2のDNAエンドヌクレアーゼは、RNAリクルートモチーフに結合することができる親和性ポリペプチドに融合されていてもよく、それによって、ガイド核酸は、第2のDNAエンドヌクレアーゼを標的核酸へとガイドする。RNAリクルートモチーフは、ガイド核酸(例えば、リクルートcrRNA、リクルートcrDNA)の5’末端に、または3’末端に連結されていてもよい。
【0127】
一部の実施形態において、第2の複合体と接触した標的核酸はさらに、DNA依存性DNAポリメラーゼ(例えば、第2のDNA依存性DNAポリメラーゼ)と接触し得る。一部の実施形態において、DNA依存性DNAポリメラーゼは、第2の複合体内に含まれてもよい。
【0128】
本発明の方法はさらに、標的核酸を第3の複合体と接触させることを含んでもよく、第3の複合体は、第1の部位および第2の部位と異なる鎖上にある標的核酸上の第3の部位に結合することができる第3の配列特異的DNA結合タンパク質を含み、第3の配列特異的DNA結合タンパク質は、ヌクレアーゼ活性またはニッカーゼ活性を含むことによって、標的核酸の修飾の修復効率を向上させる。
【0129】
一部の実施形態において、本発明は、本発明の第1の複合体、これをコードするポリヌクレオチド、および/または当該ポリヌクレオチドを含む発現カセットもしくはベクターを含む、標的核酸を修飾するためのシステムを提供し、(a)DNAエンドヌクレアーゼ活性を含む第1の配列特異的DNA結合タンパク質は、標的核酸上の第1の部位に結合し、(b)第1のDNA依存性DNAポリメラーゼは、第1の配列特異的DNA結合タンパク質と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(c)(i)第1の、DNAによりコードされた修復鋳型は、標的核酸上の第1の部位に対して実質的な相補性を有するスペーサー配列を含む第1のガイド核酸に連結されており、それによって、第1の、DNAによりコードされた修復鋳型が、標的核酸上の第1の部位へとガイドされ、または(c)(ii)第1の、DNAによりコードされた修復鋳型は、第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼに、そして標的核酸上の第1の部位にリクルートされることによって、標的核酸を修飾する。
【0130】
一部の実施形態において、標的核酸を修飾するためのシステムが提供され、当該システムは、本発明の第1の複合体、これをコードするポリヌクレオチド、および/または当該ポリヌクレオチドを含む発現カセットもしくはベクターを含み、(a)第1の配列特異的DNA結合タンパク質は、標的核酸上の第1の部位に結合し、(b)第1のDNAエンドヌクレアーゼは、第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(c)第1のDNA依存性DNAポリメラーゼは、第1の配列特異的DNA結合タンパク質および/またはガイド核酸と相互作用することができ、かつ第1の配列特異的DNA結合タンパク質に、そして標的核酸上の第1の部位にリクルートされ、(d)(i)第1の、DNAによりコードされた修復鋳型は、標的核酸上の第1の部位に対して実質的な相補性を有するスペーサー配列を含むガイド核酸に連結されており、それによって、第1の、DNAによりコードされた修復鋳型が、標的核酸上の第1の部位へとガイドされ、または(d)(ii)第1の、DNAによりコードされた修復鋳型は、第1の配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼと相互作用することができ、かつ配列特異的DNA結合タンパク質もしくは第1のDNA依存性DNAポリメラーゼに、そして標的核酸上の第1の部位にリクルートされることによって、標的核酸を修飾する。
【0131】
一部の実施形態において、標的核酸を修飾するための本発明のシステムはさらに、本発明の第2の複合体、これをコードするポリヌクレオチド、ならびに/または当該ポリヌクレオチドを含む発現カセットおよび/もしくはベクターを含んでもよく、第2の配列特異的DNA結合ドメインは、標的核酸上の第1の部位に近位の第2の部位に結合し、第2の、DNAによりコードされた修復鋳型は、第2の配列特異的DNA結合タンパク質に(共有結合性の相互作用または非共有結合性の相互作用を介して)リクルートされることによって、標的核酸を修飾する。
【0132】
本発明に有用なDNA依存性DNAポリメラーゼ(例えば、第1および/または第2のDNA依存性DNAポリメラーゼ)は、あらゆるDNA依存性DNAポリメラーゼであり得る。DNA依存性DNAポリメラーゼは、当該技術において周知であり、その非限定的なリストが、Polbaseウェブサイト(polbase.neb.com)にて見出され得る。一部の実施形態において、本発明に有用なDNA依存性DNAポリメラーゼは、3’-5’エキソヌクレアーゼ活性、5’-3’エキソヌクレアーゼ活性、および/または5’-3’RNA依存性DNAポリメラーゼ活性を含んでもよい。一部の実施形態において、DNA依存性DNAポリメラーゼは、3’-5’エキソヌクレアーゼ活性、5’-3’エキソヌクレアーゼ活性、および5’-3’RNA依存性DNAポリメラーゼ活性の1つまたは複数を取り除くように修飾または操作されていてもよい。
【0133】
一部の実施形態において、送達および/または活性が向上したDNA依存性DNAポリメラーゼ(例えば、第1および/または第2のDNA依存性DNAポリメラーゼ)が提供され得、DNA依存性DNAポリメラーゼは、クレノウ断片またはそのサブ断片を含む。一例として、約68kDaのサイズであるか、または完全長(109kDa)のDNAポリメラーゼIの分子量の62%である大腸菌クレノウ断片が用いられてもよい。
【0134】
DNA依存性DNAポリメラーゼが、温度感受性、プロセッシビティ、およびDNA結合ドメインへの融合を介した鋳型親和性について向上し得る。ゆえに、例えば、DNA依存性DNAポリメラーゼ(例えば、第1および/または第2のDNA依存性DNAポリメラーゼ)が、配列非特異的DNA結合タンパク質に融合されて、温度感受性、プロセッシビティ、および/または鋳型親和性が向上したDNA依存性DNAポリメラーゼが提供され得る。一部の実施形態において、配列非特異的DNA結合タンパク質は、スルホロブス・ソルファタリカス由来のSso7dが挙げられ得るがこれに限定されない配列非特異的dsDNA結合タンパク質であってもよい。
【0135】
DNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼおよび/または第2のDNA依存性DNAポリメラーゼ)は、ヒト、酵母、細菌、または植物由来であってもよい。一部の実施形態において、本発明に有用なDNA依存性DNAポリメラーゼとして、以下に限定されないが、DNAポリメラーゼε(例えば、ヒトおよび酵母)、DNAポリメラーゼδ、大腸菌ポリメラーゼI、Phusion(登録商標)DNAポリメラーゼ、Vent(登録商標)DNAポリメラーゼ、Vent(exo-)(登録商標)DNAポリメラーゼ、Deep Vent(登録商標)DNAポリメラーゼ、Deep Vent(exo-)(登録商標)DNAポリメラーゼ、9°Nm(商標)DNAポリメラーゼ、Q5(登録商標)DNAポリメラーゼ、Q5U(登録商標)DNAポリメラーゼ、Pfu DNAポリメラーゼ、および/またはPhire(商標)DNAポリメラーゼが挙げられ得る。一部の実施形態において、DNA依存性DNAポリメラーゼは、ヒトDNA依存性DNAポリメラーゼε、植物DNA依存性DNAポリメラーゼε、および/または酵母DNA依存性DNAポリメラーゼε(例えば、配列番号48~58参照)であってもよい。
【0136】
一部の実施形態において、本発明に有用なDNA依存性DNAポリメラーゼは、高いフィデリティおよび/または高いプロセッシビティを示し得る。プロセッシビティは、鋳型へのポリメラーゼの単回の結合事象に組み込まれるヌクレオチドの数に関する。場合によっては、DNA依存性DNAポリメラーゼは、プロセッシビティが100kbを超え得る(例えば、約100、110、120、130、140、150、160、170、180、190、200kb、またはそれ以上、およびその中でのあらゆる範囲または値)。一部の実施形態において、DNA依存性DNAポリメラーゼは、高い分配プロファイルを示し得る。ゆえに、DNA依存性DNAポリメラーゼは、高いフィデリティDNA依存性DNAポリメラーゼおよび/または高いプロセッシビティDNA依存性DNAポリメラーゼであってもよい。一部の実施形態において、DNA依存性DNAポリメラーゼは、分配型ポリメラーゼ(例えば、低いプロセッシビティのポリメラーゼ)であってもよいし、分配プロファイルが高いDNA依存性DNAポリメラーゼであってもよい。
【0137】
本発明に有用なDNA依存性DNAポリメラーゼ(例えば、第1のDNA依存性DNAポリメラーゼおよび/または第2のDNA依存性DNAポリメラーゼ)は、本発明の操作されたDNA依存性DNAポリメラーゼであり得る。
【0138】
一部の実施形態において、配列特異的DNA結合タンパク質(例えば、第1の配列特異的DNA結合タンパク質、第2の配列特異的DNA結合タンパク質、および/または第3の配列特異的DNA結合タンパク質)は、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、転写アクティベータ様エフェクタヌクレアーゼ(TALEN)、および/またはアルゴノートタンパク質由来であってもよい。一部の実施形態において、配列特異的DNA結合タンパク質は、エンドヌクレアーゼ活性またはニッカーゼ活性を含んでもよく、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)であってもよい。
【0139】
DNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ、第2のDNAエンドヌクレアーゼ、および/または第3のDNAエンドヌクレアーゼ)は、ヌクレアーゼおよび/またはニッカーゼ(核酸内にそれぞれ二本鎖切断または一本鎖切断を生成することができる)であってもよい。一部の実施形態において、DNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ、第2のDNAエンドヌクレアーゼ、および/または第3のDNAエンドヌクレアーゼ)は、エンドヌクレアーゼ(例えば、Fok1または他の類似したエンドヌクレアーゼドメイン)、ポリヌクレオチドガイドエンドヌクレアーゼ、CRISPR-Casエフェクタタンパク質、タンパク質ガイドエンドヌクレアーゼ(例えばジンクフィンガーヌクレアーゼ)、および/または転写アクティベータ様エフェクタヌクレアーゼ(TALEN)であってもよい。
【0140】
一部の実施形態において、配列特異的DNA結合ドメイン(例えば、第1の配列特異的DNA結合タンパク質、第2の配列特異的DNA結合タンパク質、および/または第3の配列特異的DNA結合タンパク質)および/またはDNAエンドヌクレアーゼ(例えば、第1のDNAエンドヌクレアーゼ、第2のDNAエンドヌクレアーゼ、および/または第3のDNAエンドヌクレアーゼ)は、CRISPR-Casエフェクタタンパク質であってもよく、場合によっては、CRISPR-Casエフェクタタンパク質は、I型CRISPR-Cas系、II型CRISPR-Cas系、III型CRISPR-Cas系、IV型CRISPR-Cas系、V型CRISPR-Cas系、またはVI型CRISPR-Cas系由来であってもよい。一部の実施形態において、本発明のCRISPR-Casエフェクタタンパク質は、II型CRISPR-Cas系またはV型CRISPR-Cas系由来であってもよい。一部の実施形態において、CRISPR-Casエフェクタタンパク質は、II型CRISPR-Casエフェクタタンパク質、例えばCas9エフェクタタンパク質であってもよい。一部の実施形態において、CRISPR-Casエフェクタタンパク質は、V型CRISPR-Casエフェクタタンパク質、例えばCas12エフェクタタンパク質であってもよい。
【0141】
CRISPR-Casエフェクタタンパク質の非限定的な例として、Cas9、C2c1、C2c3、Cas12a(Cpf1とも称される)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られている)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/またはCsf5ヌクレアーゼが挙げられ得、場合によっては、CRISPR-Casエフェクタタンパク質は、Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b、および/またはCas14cエフェクタタンパク質であってもよい。
【0142】
一部の実施形態において、本発明に有用なCRISPR-Casエフェクタタンパク質は、ヌクレアーゼ活性部位(例えば、RuvC、HNH、例えばCas12aヌクレアーゼドメインのRuvC部位、例えば、Cas9ヌクレアーゼドメインのRuvC部位および/またはHNH部位)内に変異を含んでもよい。ヌクレアーゼ活性部位内に変異を有するCRISPR-Casエフェクタタンパク質は、変異なしの同じCRISPR-Casエフェクタタンパク質と比較して、活性が損なわれ得るか、または活性が引き下げられ得る。一部の実施形態において、ヌクレアーゼ活性部位内の変異は、ニッカーゼ活性(例えばCas9n)を有するCRISPR-Casエフェクタタンパク質をもたらす。
【0143】
本発明に有用なCRISPR Cas9エフェクタタンパク質またはCRISPR Cas9エフェクタドメインは、知られているか、または後に同定されるあらゆるCas9ポリペプチドであり得る。一部の実施形態において、CRISPR Cas9ポリペプチドは、例えば、連鎖球菌(Streptococcus)属種(例えば、化膿連鎖球菌(S.pyogenes)、S.サーモフィルス(S.thermophilus))、ラクトバチルス(Lactobacillus)属種、ビフィドバクテリウム(Bifidobacterium)属種、カンドレリア(Kandleria)属種、リューコノストック(Leuconostoc)属種、オエノコッカス(Oenococcus)属種、ペディオコッカス(Pediococcus)属種、ワイセラ(Weissella)属種、および/またはオルセネラ(Olsenella)属種由来のCas9ポリペプチドであり得る(例えば、配列番号59~62参照)。
【0144】
Cas12aは、V型Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)-Casヌクレアーゼである。Cas12aは、より周知のII型CRISPR Cas9ヌクレアーゼとは、いくつかの点において異なる。例えば、Cas9は、そのガイドRNA(gRNA、sgRNA)結合部位(プロトスペーサー、標的核酸、標的DNA)の3’側にあるGリッチプロトスペーサー隣接モチーフ(PAM)(3’-NGG)を認識する一方、Cas12aは、標的核酸の5’側に位置決めされているTリッチPAM(5’-TTN、5’-TTTN)を認識する。実際、Cas9およびCas12aがそれらのガイドRNAに結合する向きは、それらのN末端およびC末端に関して、大半が逆転している。さらに、Cas12a酵素は、天然のCas9系において見出されるデュアルガイドRNA(sgRNA(例えば、crRNAおよびtracrRNA))ではなくシングルガイドRNA(gRNA、CRISPRアレイ、crRNA)を用い、そしてCas12aは、自己のgRNAをプロセシングする。加えて、Cas12aヌクレアーゼ活性は、Cas9ヌクレアーゼ活性によって生成される平滑末端の代わりに、スタガーDNA二本鎖切断を生成し、そしてCas12aは、双方のDNA鎖を切断するのに、単一のRuvCドメインをあてにするが、Cas9は、切断にHNHドメインおよびRuvCドメインを利用する。
【0145】
本発明に有用なCRISPR Cas12aエフェクタタンパク質/ドメインは、知られているか、または後に同定されるあらゆるCas12aポリペプチド(以前にCpf1として知られていた)であり得る(例えば、米国特許第9,790,490号参照(Cpf1(Cas12a)配列の開示について、引用することにより本明細書の一部をなすものとする))。用語「Cas12a」、「Cas12aポリペプチド」、または「Cas12aドメイン」は、Cas12aのガイド核酸結合ドメイン、および/またはCas12aの活性のある、不活性である、もしくは部分的に活性のあるDNA切断ドメインを含む、Cas12aポリペプチドまたはその断片を含むRNAガイドヌクレアーゼを指す。一部の実施形態において、本発明に有用なCas12aは、変異をヌクレアーゼ活性部位(例えば、Cas12aドメインのRuvC部位)内に含んでもよい。そのヌクレアーゼ活性部位内に変異を有するので、ヌクレアーゼ活性をもはや含んでいないCas12aドメインまたはCas12aポリペプチドは、一般に、deadCas12a(例えばdCas12a)と称される。一部の実施形態において、そのヌクレアーゼ活性部位内に変異を有するCas12aドメインまたはCas12aポリペプチドは、活性が損なわれ得る。
【0146】
一部の実施形態において、選択された位置(例えば、標的核酸、標的核酸上の部位)にポリペプチドをリクルートするのに有用な本発明のペプチドタグ(例えば、エピトープ、ペプチド反復単位)は、1コピーまたは2コピー以上のペプチドタグ(エピトープ、多量体化されたエピトープ)を含んでもよい(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25コピー(反復単位)、またはそれ以上)。一部の実施形態において、本発明に有用なペプチドタグとして、以下に限定されないが、GCN4ペプチドタグ(例えばSun-タグ)(例えば、配列番号23~24参照)、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープが挙げられ得る。一部の実施形態において、ペプチドタグは、GCN4ペプチドタグであってもよい。一部の実施形態において、ペプチドタグは、2コピー以上のペプチドタグ(ペプチド反復、例えば、2タンデムコピー以上、例えば、GCN4のタンデムコピー)を含んでもよい。
【0147】
一部の実施形態において、ペプチドタグに結合することができる親和性ポリペプチドとして、以下に限定されないが、抗体、場合によっては、ペプチドタグ(例えば、GCN4ペプチドタグ(例えば、配列番号25参照)、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープ)に結合することができるscFv抗体、アフィボディ、アンチカリン、モノボディ、および/またはDARPin(これらは各々、ペプチドタグ(例えば、GCN4ペプチドタグ、c-Mycアフィニティタグ、HAアフィニティタグ、Hisアフィニティタグ、Sアフィニティタグ、メチオニン-Hisアフィニティタグ、RGD-Hisアフィニティタグ、FLAGオクタペプチド、strepタグもしくはstrepタグII、V5タグ、および/またはVSV-Gエピトープ)に結合することができる)が挙げられ得る。
【0148】
本発明の一部の実施形態において、ガイド核酸(CRISPR核酸、crRNA、crDNA)は、1つまたは2つ以上のRNAリクルートモチーフ(例えば、1、2、3、4、5、6、7、8、9、10モチーフ、またはそれ以上、例えば、少なくとも10~約25モチーフ)に連結されていてもよく、場合によっては、2つ以上のRNAリクルートモチーフは、同じRNAリクルートモチーフであっても、異なるRNAリクルートモチーフであってもよく、これによって、1つまたは複数のRNAリクルートモチーフに連結されたガイド核酸が、ガイドに連結されるRNAリクルートモチーフと相互作用/に結合することができる親和性ポリペプチドに融合された1つまたは複数のポリペプチドをリクルートするのに用いられ得る。
【0149】
一部の実施形態において、RNAリクルートモチーフおよびRNAリクルートモチーフと相互作用することができる親和性ポリペプチド(例えば、対応する親和性ポリペプチド)として、以下に限定されないが、テロメラーゼKu結合モチーフ(例えばKu結合ヘアピン)および対応する親和性ポリペプチドKu(例えばKuヘテロダイマー)、テロメラーゼSm7結合モチーフおよび対応する親和性ポリペプチドSm7、MS2ファージオペレーターステム-ループおよび対応する親和性ポリペプチドMS2コートタンパク質(MCP)、PP7ファージオペレーターステム-ループおよび対応する親和性ポリペプチドPP7コートタンパク質(PCP)、SfMuファージComステム-ループおよび対応する親和性ポリペプチドCom RNA結合タンパク質、ならびに/または合成RNAアプタマーおよび対応する親和性ポリペプチドとしてのアプタマーリガンド(例えば、配列番号26~36参照)が挙げられ得る。一部の実施形態において、本発明に有用なRNAリクルートモチーフおよびその対応する親和性ポリペプチドは、MS2ファージオペレーターステム-ループおよび親和性ポリペプチドMS2コートタンパク質(MCP)、ならびに/またはPUF結合部位(PBS)および親和性ポリペプチドプミリオ/fem-3mRNA結合因子(PUF)であってもよい。
【0150】
本明細書中に記載される、本発明のポリペプチドは、互いに連結されている1つまたは複数のポリペプチドを含む融合タンパク質であってもよい。一部の実施形態において、融合は、リンカーを介する。一部の実施形態において、リンカーは、アミノ酸リンカーであってもペプチドリンカーであってもよい。一部の実施形態において、ペプチドリンカーは、約2~約100アミノ酸(残基)長であってもよい。一部の実施形態において、ペプチドリンカーはGSリンカーであってもよい。
【0151】
本明細書中で用いられる「ガイド核酸」、「ガイドRNA」、「gRNA」、「CRISPR RNA/DNA」、「crRNA」、または「crDNA」は、標的DNA、および少なくとも1つの反復配列(例えば、V型Cas12a CRISPR-Cas系の反復、またはその断片もしくは一部、II型Cas9CRISPR-Cas系の反復またはその断片、V型C2c1CRISPR Cas系の反復またはその断片、例えば、C2c3、Cas12a(Cpf1とも称される)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3’、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(CsnlおよびCsx12としても知られている)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG)、および/もしくはCsf5のCRISPR-Cas系の反復、またはその断片)と相補的である(かつこれにハイブリダイズする)少なくとも1つのスペーサー配列(例えばプロトスペーサー)を含む核酸を意味し、反復配列は、スペーサー配列の5’末端および/または3’末端に連結されていてもよい。本発明のgRNAの設計は、I型、II型、III型、IV型、V型、またはVI型CRISPR-Cas系に基づいてもよい。
【0152】
一部の実施形態において、Cas12a gRNAは、5’から3’まで、反復配列(完全長またはその一部(「ハンドル」)、例えば、シュードノット様構造)、およびスペーサー配列を含んでもよい。
【0153】
一部の実施形態において、ガイド核酸は、複数の反復配列-スペーサー配列(例えば、2、3、4、5、6、7、8、9、10個、またはそれを超える反復-スペーサー配列)を含んでもよい(例えば、反復-スペーサー-反復、例えば、反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー-反復-スペーサー等)。本発明のガイド核酸は、合成の、人工の、天然に見出されないものである。gRNAは、非常に長くなり得、そして(MS2リクルート戦略にあるような)アプタマー、またはスペーサーをぶら下げる(hanging off)他のRNA構造として用いられてもよい。一部の実施形態において、本明細書中に記載されるガイドRNAは、編集のための鋳型、およびプライマー結合部位を含み得る。一部の実施形態において、ガイドRNAは、編集鋳型(逆転写酵素鋳型)と相補的であることによって、編集鋳型を標的核酸にリクルートする、5’末端または3’末端上の領域または配列を含み得る。
【0154】
本明細書中で用いられる「反復配列」は、例えば、野生型CRISPR Cas遺伝子座(例えば、Cas9遺伝子座、Cas12a遺伝子座、C2c1遺伝子座その他)のあらゆる反復配列、または塩基エディタをコードする本発明の核酸構築体によってコードされるCRISPR-Casヌクレアーゼにより機能的な合成crRNAの反復配列を指す。本発明に有用な反復配列は、CRISPR-Cas遺伝子座(例えば、I型、II型、III型、IV型、V型、またはVI型)の、知られているか、もしくは後に同定されるあらゆる反復配列であり得、またはI、II、III、IV、V、もしくはVI型CRISPR-Cas系において機能するように設計された合成反復であり得る。反復配列は、ヘアピン構造および/またはステムループ構造を含んでもよい。一部の実施形態において、反復配列は、その5’末端に、シュードノット様構造(すなわち「ハンドル」)を形成し得る。ゆえに、一部の実施形態において、反復配列は、野生型I型CRISPR-Cas遺伝子座、II型CRISPR-Cas遺伝子座、III型CRISPR-Cas遺伝子座、IV型CRISPR-Cas遺伝子座、V型CRISPR-Cas遺伝子座、および/またはVI型CRISPR-Cas遺伝子座由来の反復配列と同一であり得るか、または実質的に同一であり得る。野生型CRISPR-Cas遺伝子座由来の反復配列が、確立されたアルゴリズムによって、例えばCRISPRdbによって提供されるCRISPRfinder(Grissa et al.Nucleic Acids Res.35(ウェブサーバー刊行物):W52-7参照)を用いて決定され得る。一部の実施形態において、反復配列またはその一部は、スペーサー配列の3’末端~5’末端に連結されており、それによって、反復-スペーサー配列(例えば、ガイドRNA、crRNA)を形成する。
【0155】
一部の実施形態において、反復配列は、特定の反復、および反復を含むガイドRNAがプロセシングされるか、プロセシングされないかに応じて、少なくとも10ヌクレオチド(例えば、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50~100個、もしくはそれを超えるヌクレオチド、またはその中のあらゆる範囲もしくは値、例えば約)を含むか、またはそれから本質的になるか、またはそれからなる。一部の実施形態において、反復配列は、約10~約20、約10~約30、約10~約45、約10~約50、約15~約30、約15~約40、約15~約45、約15~約50、約20~約30、約20~約40、約20~約50、約30~約40、約40~約80、約50~約100個、またはそれを超えるヌクレオチドを含むか、またはそれから本質的になるか、またはそれからなる。
【0156】
スペーサー配列の5’末端に連結された反復配列は、反復配列の一部(例えば、野生型反復配列の5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35個、またはそれを超える連続ヌクレオチド)を含み得る。一部の実施形態において、スペーサー配列の5’末端に連結された反復配列の一部は、約5~約10連続ヌクレオチド(例えば、約5、6、7、8、9、10ヌクレオチド)長であり得、そして野生型CRISPR Cas反復ヌクレオチド配列の同じ領域(例えば5’末端)に対して少なくとも90%(例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)の同一性を有する。一部の実施形態において、反復配列の一部は、その5’末端にてシュードノット様構造(例えば「ハンドル」)を含み得る。
【0157】
本明細書中で用いられる「スペーサー配列」は、標的核酸(例えば標的DNA)と相補的なヌクレオチド配列(例えばプロトスペーサー)である。スペーサー配列は、標的核酸と完全に相補的であり得るか、または実質的に相補的であり得る(例えば、少なくとも約70%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。ゆえに、一部の実施形態において、スペーサー配列は、標的核酸と比較して、1、2、3、4、または5つのミスマッチを有し得、当該ミスマッチは、連続していてもよいし、非連続であってもよい。一部の実施形態において、スペーサー配列は、標的核酸に対して70%の相補性を有し得る。他の実施形態において、スペーサーヌクレオチド配列は、標的核酸に対して80%の相補性を有し得る。さらに他の実施形態において、スペーサーヌクレオチド配列は、標的核酸(プロトスペーサー)に対して85%、90%、95%、96%、97%、98%、99%、または99.5%等の相補性を有し得る。一部の実施形態において、スペーサー配列は、標的核酸と100%相補的である。スペーサー配列は、長さが約15ヌクレオチド~約30ヌクレオチド(例えば、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30ヌクレオチド、またはその中のあらゆる範囲もしくは値)であり得る。ゆえに、一部の実施形態において、スペーサー配列は、少なくとも約15ヌクレオチド~約30ヌクレオチド長である標的核酸(例えばプロトスペーサ)の領域にわたって完全な相補性または実質的な相補性を有し得る。一部の実施形態において、スペーサーは、約20ヌクレオチド長である。一部の実施形態において、スペーサーは、約23ヌクレオチド長である。
【0158】
一部の実施形態において、ガイドRNAのスペーサー配列の5’領域は、標的DNAと同一であり得る一方、スペーサーの3’領域は、標的DNA(例えばV型CRISPR-Cas)と実質的に相補的であり得、またはガイドRNAのスペーサー配列の3’領域は、標的DNAと同一であり得る一方、スペーサーの5’領域は、標的DNA(例えばII型CRISPR-Cas)と実質的に相補的であり得るので、標的DNAに対するスペーサー配列の全体的な相補性は、100%未満であってもよい。ゆえに、例えば、V型CRISPR-Cas系用のガイドにおいて、例えば20ヌクレオチドスペーサー配列の、5’領域内の最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド(すなわちシード領域)は、標的DNAと100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的である(例えば、少なくとも約70%相補的である)。一部の実施形態において、スペーサー配列の5’末端の最初の1~8ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8ヌクレオチド、およびその中のあらゆる範囲)は、標的DNAと100%相補的であり得る一方、スペーサー配列の3’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的である(例えば、少なくとも約50%(例えば、50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的である)。
【0159】
更なる例として、II型CRISPR-Cas系用のガイドにおいて、例えば20ヌクレオチドスペーサー配列の、3’領域内の最初の1、2、3、4、5、6、7、8、9、10ヌクレオチド(すなわちシード領域)は、標的DNAと100%相補的であり得る一方、スペーサー配列の5’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的である(例えば、少なくとも約70%相補的である)。一部の実施形態において、スペーサー配列の3’末端の最初の1~10ヌクレオチド(例えば、最初の1、2、3、4、5、6、7、8、9、10ヌクレオチドおよびその中のあらゆる範囲)は、標的DNAと100%相補的であり得る一方、スペーサー配列の5’領域内の残りのヌクレオチドは、標的DNAと実質的に相補的である(例えば、少なくとも約50%(例えば、少なくとも約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくはそれを超える、またはその中のあらゆる範囲もしくは値)相補的である)。
【0160】
一部の実施形態において、スペーサーのシード領域は、約8~約10ヌクレオチド長、約5~約6ヌクレオチド長、または約6ヌクレオチド長であってもよい。
【0161】
本明細書中で用いられる「標的核酸」、「標的DNA」、「標的ヌクレオチド配列」、「標的領域」、または「ゲノム内の標的領域」は、本発明のガイドRNA内のスペーサー配列と完全に相補的な(100%相補的な)、または実質的に相補的な(例えば、少なくとも70%(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれを超える)相補的な)生物のゲノムの領域を指す。CRISPR-Cas系に有用な標的領域は、生物のゲノム(例えば、植物ゲノム、動物ゲノム、細菌ゲノム、真菌ゲノム等)内のPAM配列に対して直ぐ3’側に(例えばV型CRISPR-Cas系)、または直ぐ5’側に(例えばII型CRISPR-Cas系)位置決めされてもよい。標的領域は、PAM配列に直ぐ隣接して位置決めされる少なくとも15個の連続ヌクレオチド(例えば、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ヌクレオチド等)のあらゆる領域から選択され得る。
【0162】
「プロトスペーサー配列」は、CRISPR反復-スペーサー配列のスペーサー配列と完全に、または実質的に相補的である(かつこれにハイブリダイズする)標的二本鎖DNA、具体的には標的DNAの一部(例えば、またはゲノム内の標的領域)を指す(例えば、ガイドRNA、CRISPRアレイ、crRNA)。
【0163】
V型CRISPR-Cas(例えばCas12a)系およびII型CRISPR-Cas(Cas9)系の場合、プロトスペーサー配列は、プロトスペーサー隣接モチーフ(PAM)が隣に(例えば直ちに隣接して)位置する。IV型CRISPR-Cas系について、PAMは、非標的鎖上の5’末端に、そして標的鎖の3’末端に位置決めされる(一例として、下記参照)。
【0164】
II型CRISPR-Cas(例えばCas9)系の場合、PAMは、標的領域の直ぐ3’側に位置決めされる。I型CRISPR-Cas系用のPAMは、標的鎖の5’側に位置決めされる。III型CRISPR-Cas系用のPAMは知られていない。Makarova et al.は、CRISPR系の全てのクラス、型、およびサブタイプについての命名法を記載している(Nature Reviews Microbiology13:722-736(2015))。ガイド構造およびPAMが、R.Barrangou(Genome Biol.16:247(2015))によって記載されている。
【0165】
カノニカルCas12a PAMは、Tリッチである。一部の実施形態において、カノニカルCas12a PAM配列は、5’-TTN、5’-TTTN、または5’-TTTVであってよい。一部の実施形態において、カノニカルCas9(例えば化膿連鎖球菌)PAMは、5’-NGG-3’であってもよい。一部の実施形態において、非カノニカルPAMが用いられてもよいが、あまり有効でない可能性がある。
【0166】
更なるPAM配列が、確立されている実験的アプローチおよび計算論的アプローチにより、当業者によって決定されてもよい。ゆえに、例えば、実験的アプローチは、考えられる全てのヌクレオチド配列が隣に位置する配列を標的とすることと、例えば標的プラスミドDNAの形質転換により、標的化を受けない配列メンバーを識別することとを含む(Esvelt et al.2013.Nat Methods10:1116-1121、Jiang et al.2013.Nat.Biotechnol.31:233-239)。一部の態様において、計算論的アプローチは、天然のスペーサーのBLAST検索を実行して、バクテリオファージまたはプラスミド内の元の標的DNA配列を同定することと、これらの配列をアラインして、標的配列に隣接する保存された配列を決定することとを含み得る(Briner and Barrangou.2014.Appl.Environ.Microbiol.80:994-1001、Mojica et al.2009.Microbiology155:733-740)。
【0167】
一部の実施形態において、植物内での発現のために最適化された本発明の核酸構築体、発現カセット、またはベクターは、同じものをコードするが、植物内での発現のためにコドン最適化されていない核酸構築体、発現カセット、またはベクターと約70%~100%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、または100%)同一であり得る。
【0168】
一部の実施形態において、本発明は、本発明の1つまたは複数のポリヌクレオチド、ガイド核酸、核酸構築体、発現カセット、またはベクターを含む細胞を提供する。
【0169】
ガイド核酸と組み合わせて用いられる場合、本発明の核酸構築体は、標的核酸を修飾するのに用いられ得る。標的核酸は、本発明の核酸構築体と、標的核酸をガイド核酸と接触させる前に、これと同時に、またはこの後に、接触し得る。一部の実施形態において、本発明の核酸構築体およびガイド核酸は、同じ発現カセットまたはベクター内に含まれ得るので、標的核酸は、本発明の核酸構築体およびガイド核酸と同時に接触し得る。一部の実施形態において、本発明の核酸構築体およびガイド核酸は、異なる発現カセットまたはベクター内にあり得るので、標的核酸は、本発明の核酸構築体と、ガイド核酸と接触する前に、これと同時に、またはこの後に、接触し得る。
【0170】
あらゆる生物またはその細胞の標的核酸は、本発明の核酸構築体(例えば、ポリペプチドおよび複合体(例えば、配列特異的DNA結合タンパク質、DNA依存性DNAポリメラーゼ(例えば、操作されたDNA依存性DNAポリメラーゼ)、DNAエンドヌクレアーゼ、DNAによりコードされた修復鋳型、ガイド核酸等)、ならびにポリヌクレオチド、発現カセット、および/またはこれをコードするベクター)を用いて修飾され得る(例えば、変異する、例えば、塩基編集される、切断される、ニックが入れられるその他)。
【0171】
一部の実施形態において、あらゆる植物または植物部分の標的核酸は、本発明の核酸構築体(例えば、ポリペプチドおよび複合体(例えば、配列特異的DNA結合タンパク質、DNA依存性DNAポリメラーゼ(例えば、操作されたDNA依存性DNAポリメラーゼ)、DNAエンドヌクレアーゼ、DNAによりコードされた修復鋳型、ガイド核酸等)、ならびにポリヌクレオチド、発現カセット、および/またはこれをコードするベクター)を用いて修飾され得る(例えば、変異する、例えば、塩基編集される、切断される、ニックが入れられるその他)。被子植物、裸子植物、単子葉植物、双子葉植物、C3、C4、CAM植物、蘚苔門植物、シダおよび/もしくはシダの仲間、微細藻類、ならびに/または大型藻類が挙げられるあらゆる植物(または植物の群、例えば、属またはより高いオーダーの分類)が、本発明の核酸構築体を用いて修飾され得る。本発明に有用な植物および/または植物部分は、あらゆる植物種/変種/品種の植物および/または植物部分であり得る。本明細書中で用いられる用語「植物部分」は、以下に限定されないが、胚、花粉、胚珠、種子、葉、幹、シュート、花卉、枝、果実、仁、穂、コッブ、外皮、茎、根、根端、葯、植物細胞(植物および/または植物の部分において無傷の植物細胞、植物プロトプラスト、植物組織、植物細胞組織培養体、植物カルス、植物塊等が挙げられる)が挙げられる。本明細書中で用いられる「シュート」は、葉および幹を含む地上部を指す。さらに、本明細書中で用いられる「植物細胞」は、植物の構造的生理学的単位を指し、これは、細胞壁を含み、そしてまたプロトプラストを指し得る。植物細胞は、単離された単一の細胞の形態であってもよいし、培養された細胞であってもよいし、より高度に組織化された単位、例えば植物組織または植物器官の一部であってもよい。
【0172】
本発明に有用な植物の非限定的な例として、芝草(例えば、ブルーグラス、ベントグラス、ライグラス、ウシノケグサ属)、ウモウヨシ、ヒロハノコメススキ、ススキ属、ダンチク属、スイッチグラス、蔬菜作物(アーティチョーク、コールラビ、キバナスズシロ、ニラネギ、アスパラガス、レタス(例えば、サラダ菜、リーフレタス、タチチシャ)、マランガ、メロン(例えば、マスクメロン、スイカ、クレンショーメロン、ハネデューメロン、カンタロープ)、アブラナ属作物(例えば、メキャベツ、キャベツ、カリフラワー、ブロッコリー、コラード、ケール、ハクサイ、パクチョイ)、カルドニ(cardoni)、ニンジン、ハクサイ、オクラ、タマネギ、セロリ、パセリ、ヒヨコマメ、パースニップ、チコリ、コショウ、ジャガイモ、ウリ科植物(例えば、マロウ、キュウリ、ズッキーニ、スカッシュ、カボチャ、ハネデューメロン、スイカ、カンタロープ)、ハツカダイコン、乾球タマネギ、ルタバガ、ナス、セイヨウゴボウ、キクヂシャ、エシャロット、エンダイブ、ニンニク、ホウレンソウ、ネギ、スカッシュ、グリーン、ビート(シュガービートおよび飼料ビート)、サツマイモ、フダンソウ、セイヨウワサビ、トマト、カブ、およびスパイスが挙げられる)、果実作物、例えば、リンゴ、アプリコット、チェリー、ネクタリン、モモ、西洋ナシ、プラム、プルーン、チェリー、マルメロ、イチジク、ナッツ(例えば、クリ、ペカン、ピスタチオ、ヘイゼルナッツ、ピスタチオ、ピーナッツ、クルミ、マカダミアナッツ、アーモンド等)、柑橘類(例えば、クレメンタイン、キンカン、オレンジ、グレープフルーツ、タンジールミカン、ミカン、レモン、ライム等)、ブルーベリー、ブラックラズベリー、ボイゼンベリー、クランベリー、カランツ、グズベリー、ローガンベリー、ラズベリー、ストロベリー、ブラックベリー、ブドウ(ワイン用および食用)、アボカド、バナナ、キーウィ、柿、ザクロ、パイナップル、トロピカルフルーツ、梨状果、メロン、マンゴー、パパイア、およびライチ、農作物、例えば、クローバー、アルファルファ、チモシー、マツヨイグサ、メドウフォーム、トウモロコシ(飼料用、スイートコーン、ポップコーン)、ホップ、ホホバ、ソバ、ベニバナ、キノア、コムギ、イネ、オオムギ、ライムギ、キビ、モロコシ、エンバク、ライコムギ、モロコシ、タバコ、カポック、マメ科植物(インゲンマメ(例えば、サヤインゲンおよび乾燥インゲンマメ)、レンズマメ、エンドウ、ダイズ)、油料植物(ナタネ、キャノーラ、マスタード、ポピー、オリーブ、ヒマワリ、ココナッツ、ヒマシ油植物、カカオ豆、落花生類、アブラヤシ)、ウキクサ、シロイヌナズナ(Arabidopsis)属、繊維植物(ワタ、アマ、アサ、ジュート)、カンナビス(例えば、アサ(Cannabis sativa)、インド麻(Cannabis indica)、およびカンナビス・ルデラリス(Cannabis ruderalis))、クスノキ科(シナモン、カンファー)、もしくはコーヒー、サトウキビ、チャ、および天然ゴム植物等の植物、ならびに/または花壇用花卉、例えば、顕花植物、サボテン、多肉植物、および/もしくは観賞植物(例えば、バラ、チューリップ、スミレ)、ならびに樹木、例えば森林樹木(広葉樹および常緑植物、例えば針葉樹、例えば、ニレ、トネリコ、オーク、カエデ、モミ、トウヒ、スギ、マツ、カバノキ、イトスギ、ユーカリノキ、ヤナギ)、ならびに潅木および他の苗木が挙げられる。一部の実施形態において、本発明の核酸構築体、ならびに/またはこれをコードする発現カセットおよび/もしくはベクターは、トウモロコシ、ダイズ、コムギ、キャノーラ、イネ、トマト、コショウ、ヒマワリ、ラズベリー、ブラックベリー、ブラックラズベリー、および/またはチェリーを修飾するのに用いられ得る。一部の実施形態において、本発明の核酸構築体、ならびに/またはこれをコードする発現カセットおよび/もしくはベクターは、キイチゴ(Rubus)属種(例えば、ブラックベリー、ブラックラズベリー、ボイゼンベリー、ローガンベリー、ラズベリー、例えばケーンベリー)、スノキ(Vaccinium)属種(例えばクランベリー)、リブ(Ribes)属種(例えば、グズベリー、カラント(例えば、レッドカラント、ブラックカラント))、またはオランダイチゴ(Fragaria)属種(例えばストロベリー)を修飾するのに用いられ得る。
【0173】
本発明はさらに、本発明の方法を実行するためのキットを含む。本発明のキットは、試薬、バッファ、および混合、測定、ソーティング、標識その他のための装置、ならびに標的核酸を修飾するのに適した説明書等を含み得る。
【0174】
一部の実施形態において、本発明は、本発明の1つもしくは複数の核酸構築体、ならびに/またはこれを含む(例えば、本発明のポリペプチド/複合体を含む、またはコードする)発現カセットおよび/もしくはベクターを含むキットを、場合によってはその使用説明書と共に提供する。一部の実施形態において、キットはさらに、CRISPR-Casガイド核酸(本発明のポリヌクレオチドによってコードされるCRISPR-Casヌクレアーゼに対応する)、ならびに/またはこれを含む発現カセットおよび/もしくはベクターを含んでもよい。一部の実施形態において、ガイド核酸は、本発明の核酸構築体と同じ発現カセットおよび/またはベクター上に提供されてもよい。一部の実施形態において、ガイド核酸は、本発明の核酸構築体を含むものとは別個の発現カセットまたはベクター上に提供されてもよい。
【0175】
一部の実施形態において、キットはさらに、ガイド核酸をコードする核酸構築体を含んでもよく、構築体は、標的核酸配列と同一であるか、または相補的な核酸配列の、ガイド核酸の骨格中へのクローニングのためのクローニング部位を含む。
【0176】
一部の実施形態において、本発明の核酸構築体、ならびに/またはこれを含む発現カセットおよび/もしくはベクターはさらに、形質転換体(例えば、抗生物質耐性遺伝子、除草剤耐性遺伝子等をコードする核酸)を識別するのに有用な1つまたは複数の選択マーカーをコードしていてもよい。
【0177】
次に、本発明を、以下の実施例に関して説明する。これらの実施例は、特許請求の範囲を本発明に限定することは意図されず、むしろ特定の実施形態の例示となることが意図されることが認識されるべきである。当業者が思い浮かべる、例示される方法におけるあらゆる変形が、本発明の範囲に入ることが意図される。
【実施例】
【0178】
[実施例1.鋳型を用いた正確なインビボ編集]
構成要素の混合物をヒト細胞株HEK293T中に同時形質移入することによって、ヒト細胞内でのCRISPRタンパク質へのDNA依存性DNAポリメラーゼの融合を介した、鋳型を用いた正確な編集を実証することができる。構成要素の混合物は、CMVプロモーターによって駆動されるミュータントEGFP遺伝子のコピーを含有するレシピエントプラスミド、標的部位への鋳型の結合を促進するように、100~200ntの相同配列が隣に位置するミュータントEGFP用の補正配列を含有する一本鎖DNA修復鋳型、CRISPRタンパク質(例えば、eCas9、nCas9(D10A)、またはnCas9(H840A))の融合タンパク質を発現する第2のプラスミド、注目するDNA依存性DNAポリメラーゼ(例えば、大腸菌由来のPol I)(NまたはC末端CRISPRタンパク質へのDNA依存性DNAポリメラーゼの融合は、リンカーを介する)、およびミュータントEGFP配列を標的とするガイドRNAを発現する第3のプラスミドを含む。対照として、第2のプラスミドを、相対的なCRISPRタンパク質のみを発現するプラスミドで置換する。所望の、鋳型を用いた編集事象は、ミュータントEGFPが、緑色の蛍光表現型をもたらすEGFPの機能的コピーに補正されているから、フローサイトメトリにより識別する。
【0179】
これ以外にも、DNA修復鋳型、およびガイドRNA(またはガイドDNA)を発現する第3のプラスミドを、修復鋳型を含有するレトロン足場と共に、レトロン逆転写酵素およびキメラガイドRNA(またはキメラガイドDNA)を発現するプラスミドによって置換することができる。
【0180】
[実施例2.CRISPRタンパク質およびDNA依存性DNAポリメラーゼを介した、鋳型を用いた正確なインビトロ編集。]
CRISPRタンパク質およびDNA依存性DNAポリメラーゼを介した、鋳型を用いた正確なインビトロ編集。CRISPRニッカーゼnCas9(H840A)によって導入されたニックからの、標的DNA配列の、鋳型を用いた置換を行う潜在性について、商業的に入手可能なDNA依存性DNAポリメラーゼをインビトロ評価する。評価用のDNA依存性DNAポリメラーゼの非限定的な例として、Q5高フィデリティDNAポリメラーゼ、Phusion(登録商標)高フィデリティDNAポリメラーゼ、Hemo Klen Taq DNAポリメラーゼ、Bst2.0DNAポリメラーゼ、Bsu DNAポリメラーゼ、Phi29DNAポリメラーゼ、T7DNAポリメラーゼ、Therminator(商標)DNAポリメラーゼ、クレノウ断片(3’→5’exo-)、Vent(exo-)が挙げられる。
【0181】
断片の中央にCas9結合部位を含有する2kbのDNA断片をレシピエントとして用い、約100ntの一本鎖DNA修復鋳型を用いて、Cas9標的部位に隣接するレシピエントにミスマッチを導入する。レシピエントDNA、修復鋳型、nCas9(H840A)タンパク質およびガイドRNA、ならびにDNA依存性DNAポリメラーゼの混合物を、37℃または25℃にてインキュベートする。ミスマッチを含有する所望の修復生成物を、T7エンドヌクレアーゼIによって消化して、他の生成物から分離して、ゲル電気泳動によって定量化することができる。
【0182】
[実施例3.標的部位へのDNA依存性DNAポリメラーゼのMS2RNAループリクルートを介した、鋳型を用いた正確な編集。]
構成要素の混合物を、ヒト細胞株HEK293T中に同時形質移入することによって、標的部位へのDNA依存性DNAポリメラーゼのMS2RNAループリクルートを介した、鋳型を用いた正確な編集を実証することができる。構成要素の混合物は、CMVプロモーターによって駆動されるミュータントEGFP遺伝子のコピーを含有するレシピエントプラスミド、標的部位への鋳型の結合を促進するように、100~200ntの相同配列が隣に位置するミュータントEGFP用の補正配列を含有する一本鎖DNA修復鋳型、注目するDNA依存性DNAポリメラーゼ(例えば、大腸菌由来のPol I)を、リンカーを介してN末端に融合されたMCPドメインと共に発現する第2のプラスミド、ミュータントEGFP配列を標的とするガイドRNAを発現する第3のプラスミド(ガイド核酸足場は、MCPドメインと相互作用するMS2ステムループを含有するように修飾されている)、およびCRISPRタンパク質(例えば、eCas9、nCas9(D10A)、またはnCas9(H840A))を発現する第4のプラスミドを含む。対照として、第2のプラスミドを、形質移入混合物から省略する。鋳型を用いた所望の編集事象は、ミュータントEGFPが、EGFPの機能的コピーに補正されているから、フローサイトメトリにより識別する。これ以外にも、DNA修復鋳型、およびMS2ガイドRNAを発現する第3のプラスミドを、修復鋳型を含有するレトロン足場と共に、レトロン逆転写酵素およびキメラMS2ガイドRNAを発現するプラスミドによって置換することができる。
【0183】
[実施例4.標的部位へのDNA依存性DNAポリメラーゼのPUF-結合部位(PBS)RNAアプタマーリクルートを介した、鋳型を用いた正確な編集。]
構成要素の混合物をヒト細胞株HEK293T中に同時形質移入することによって、標的部位へのDNA依存性DNAポリメラーゼのPUF-結合部位(PBS)RNAアプタマーリクルートを介した、鋳型を用いた正確な編集を実証することができる。構成要素の混合物は、CMVプロモーターによって駆動されるミュータントEGFP遺伝子のコピーを含有するレシピエントプラスミド、標的部位への鋳型の結合を促進するように、100~200ntの相同配列が隣に位置するミュータントEGFP用の補正配列を含有する一本鎖DNA修復鋳型、注目するDNA依存性DNAポリメラーゼ(例えば、大腸菌由来のPol I)を、リンカーを介してN末端に融合されたPUFドメインと共に発現する第2のプラスミド、ミュータントEGFP配列を標的とするガイドRNAを発現する第3のプラスミド(ガイドRNA足場は、PUFドメインと相互作用するPUF-結合部位を含有するように修飾されている)、およびCRISPRタンパク質(例えば、eCas9、nCas9(D10A)、またはnCas9(H840A))を発現する第4のプラスミドを含む。対照として、第2のプラスミドを、形質移入混合物から省略する。鋳型を用いた所望の編集事象は、ミュータントEGFPが、EGFPの機能的コピーに補正されているから、フローサイトメトリにより識別する。これ以外にも、DNA修復鋳型、およびガイドRNAをPBSと共に発現する第3のプラスミドを、PBS、および修復鋳型を含有するレトロン足場と共に、レトロン逆転写酵素およびキメラガイドRNAを発現するプラスミドによって置換することができる。
【0184】
[実施例5.標的部位へのDNA依存性DNAポリメラーゼのPUF-結合部位(PBS)RNAアプタマーリクルートを介した、鋳型を用いた正確な編集。]
構成要素の混合物をヒト細胞株HEK293T中に同時形質移入することによって、標的部位へのDNA依存性DNAポリメラーゼの抗体/エピトープリクルートを介した、鋳型を用いた正確な編集を実証することができる。構成要素の混合物は、CMVプロモーターによって駆動されるミュータントEGFP遺伝子のコピーを含有するレシピエントプラスミド、標的部位への鋳型の結合を促進するように、100~200ntの相同配列が隣に位置するミュータントEGFP用の補正配列を含有する一本鎖DNA修復鋳型、注目するDNA依存性DNAポリメラーゼ(例えば、大腸菌由来のPol I)を、リンカーを介してN末端に融合されたscFVドメインと共に発現する第2のプラスミド、ミュータントEGFP配列を標的とするガイドRNAを発現する第3のプラスミド、およびCRISPRタンパク質(例えば、eCas9、nCas9(D10A)、またはnCas9(H840A))を、C末端に融合されたGCN4タグの8コピーと共に発現する第4のプラスミドを含む。対照として、第2のプラスミドを、形質移入混合物から省略する。鋳型を用いた所望の編集事象は、ミュータントEGFPが、EGFPの機能的コピーに補正されているから、フローサイトメトリにより識別する。これ以外にも、DNA修復鋳型、およびガイドRNAを発現する第3のプラスミドを、修復鋳型を含有するレトロン足場と共に、レトロン逆転写酵素およびキメラガイドRNAを発現するプラスミドによって置換することができる。
【0185】
[実施例6.標的部位へのDNA依存性DNAポリメラーゼのPUF-結合部位(PBS)RNAアプタマーリクルートを介した、鋳型を用いた正確な編集。]
フレーム内のEGFP遺伝子(約700bp)を、高度に発現される遺伝子(例えばアクチン)のエキソン中に挿入することによって、植物内でのDNA依存性DNAポリメラーゼのリクルートを介した、長い断片の、鋳型を用いた正確な編集および部位特異的統合を実証することができる。この実験設計において、2つのT-DNAが、植物組織中に同時形質転換されることとなる。第1のT-DNAは、標的部位へのDNA依存性DNAポリメラーゼの有効なリクルート用の正確なアーキテクチャにおいて、CRISPRタンパク質およびDNA依存性DNAポリメラーゼを発現するツールカセット、ならびにタンパク質リクルートに必須の立体配置においてアクチンの最後のエキソンを標的とするガイドRNAを発現するガイドカセットを含有する。第2のT-DNAは、EGFPの完全長、および標的エキソン内の終止コドンのインフレーム欠失をコードする修復鋳型を含有する。当該修復鋳型は、第1のT-DNAにおいて発現されるガイドRNAによって認識される標的部位が隣に位置する。EGFPの所望の部位特異的統合により、アクチン遺伝子のプロモーターによって駆動されるEGFPが発現する一方、ランダムな統合により、プロモーターの欠如に起因して、EGFPは発現しない。部位特異的統合の頻度を、顕微鏡観察によって定量化することができる。これ以外にも、第1のT-DNAは、ツールカセットのみを発現することとなり、第2のT-DNAは、レトロン逆転写酵素カセット、およびガイドRNA足場に付着されるレトロン足場内に修復鋳型をコードするキメラガイドRNAカセットを含有することとなる。
【0186】
[実施例7.DNA依存性DNAポリメラーゼのリクルートおよび最適化]
先の実施例および本明細書中により一般的に記載されるように、多くの異なる方法を用いて、DNA依存性DNAポリメラーゼを編集部位にリクルートすることができる。例えば、DNA依存性DNAポリメラーゼを、例えば塩基エディタのアーキテクチャにおいて、フレキシブルリンカーを介してCRISPRタンパク質のC末端またはN末端に融合することができる。これ以外にも、DNA依存性DNAポリメラーゼを、切断されたか、またはニックが入れられた標的DNAに、ガイドRNA(例えばMS2ループ)またはCRISPRタンパク質(例えばSunTag)との相互作用を介してリクルートすることができる。
【0187】
以下に限定されないが、3’-5’エキソヌクレアーゼ、5’-3’エキソヌクレアーゼ、および/または5’-3’RNA依存性DNAポリメラーゼ活性を取り除くことが挙げられるいくつもの方法で、DNA依存性DNAポリメラーゼの機能を向上させる/最適化することができる。DNA依存性DNAポリメラーゼはさらに、タンパク質のクレノウ断片または他のサブ断片を含んでもよい。クレノウ断片または他の活性断片は、送達または活性目的に有用であり得る。一例として、大腸菌クレノウ断片は、68kDaであり、または完全(109kDa)DNAポリメラーゼIの分子量の62%である。
【0188】
DNA依存性DNAポリメラーゼ酵素へのタンパク質ドメイン融合が、編集システムの温度感受性およびプロセッシビティに大きな作用を及ぼし得る。DNA依存性DNAポリメラーゼ酵素は、DNA結合ドメイン(DBD)への融合を介して、温度感受性、プロセッシビティ、および鋳型親和性について向上し得る。これらのDBDは、配列特異性、非特異性、または配列選択を有し得る。異なる細胞環境およびインビトロ環境において、広範な親和性分配が、編集に有益であり得る。DNA依存性DNAポリメラーゼ酵素への1つまたは複数のDBD追加により、親和性が増大し、配列特異性が増大もしくは低下し、かつ/または協同作用が促進し得る。DNA依存性DNAポリメラーゼのプロセッシビティを増大させることが知られている特定の一DBDが、スルホロブス・ソルファタリカス由来の、配列非特異的dsDNA結合タンパク質Sso7dである(Wang,2004)。dsDNA結合タンパク質は、ポリメラーゼのC末端、N末端、またはフレキシブルループに融合され得る。フレーム内のより大きなリポーター遺伝子、例えばtdTomato(約1500bp)を、高度に発現される遺伝子(例えばアクチン)のエキソン中に挿入することによって、プロセッシビティの増大を実証することができる。例えば、2つのT-DNAが、植物組織中に同時形質転換され得る。第1のT-DNAは、DNA依存性DNAポリメラーゼ::ssDBDの標的部位への有効なリクルート用の正確なアーキテクチャにおいてCRISPRタンパク質およびDNA依存性DNAポリメラーゼ::ssDBDを発現するツールカセット、およびタンパク質リクルートに必須の立体配置においてアクチンの最後のエキソンを標的とするガイドRNAを発現するガイドカセットを含有する。第2のT-DNAは、tdTomato(または他のリポーター)の完全長、および標的エキソン内の終止コドンのインフレーム欠失をコードする修復鋳型を含有する。当該修復鋳型は、第1のT-DNAにおいて発現されるガイドRNAによって認識される標的部位が隣に位置する。tdTomato(または他のリポーター)の所望の部位特異的統合により、アクチン遺伝子のプロモーターによって駆動されるtdTomatoが発現する一方、ランダムな統合により、プロモーターの欠如に起因して、tdTomatoは発現しない。部位特異的統合の頻度を、顕微鏡観察によって定量化することができる。
【0189】
[実施例8.CRISPRポリペプチド]
本発明は、高プロセッシビティDNA依存性DNAポリメラーゼを利用して、提供される修復鋳型にアニールされる、切断されたか、またはニックが入れられた標的DNAの3’末端によって開始されるDNA合成を迅速に開始する。Cas9ヌクレアーゼおよびニッカーゼ、ならびにCas12aヌクレアーゼ、ならびにニッカーゼおよび他のCRISPR-Casエフェクタポリペプチドを用いて、3’DNA標的末端を生成することができる。修復鋳型、特にサイズが大きい鋳型の組込みの成功は、切断された部位またはニック部位から離れてDNA鋳型に沿って移動するDNA依存性DNAポリメラーゼの能力次第であり得る。切断されたか、またはニックが入れられたDNAに結合したままであり得るCas9タンパク質への直接的融合は、DNA依存性DNAポリメラーゼの移動を妨げ得る可能性がある。その理由で、eCas9(3つのアミノ酸変異(K848A、K1003A、R1060A)4)ヌクレアーゼまたはニッカーゼ等の、DNAへの結合親和性が引き下げられたCas9を用いてもよい。これ以外にも、CRISPR複合体へのポリメラーゼの非共有結合性のリクルートを用いて、ポリメラーゼが立体阻害または移動制約なしで機能する機会を最大にすることができる。いくつかの共有結合性のリクルート戦略および非共有結合性のリクルート戦略を、本明細書中に記載する。例えば、Cpf1/Cas12aは、安定した結合(Cas9について、17-bp対9~10-bp)のために、より長いシード配列を有する。これは、標的DNAに対するより低い親和性を示し(Jeon et. al,2018)、Cpf1により見出される編集のより低いオフターゲット速度と一致する。Cas9と比較したCpf1の、標的DNAに対するより低い親和性は、編集ツールの移動を必要とするポリメラーゼ融合の利点であり得る。
【0190】
[実施例9.修復鋳型リクルート]
ヒト細胞実験において、修復鋳型を、以下が挙げられるがこれに限定されないいくつかの異なる戦略によってリクルートすることができる、1)CRISPRタンパク質に融合されたPCVドメインと、修復鋳型内に埋め込まれたPCV認識部位との相互作用、および2)キメラレトロン-ガイドRNA足場から生成され、かつガイドRNA足場に繋がれる修復鋳型をコードするmsDNA。
【0191】
[実施例10.植物におけるゲノム編集]
植物の編集において、修復鋳型送達の種々の方法を用いることができ、これらは、形質転換方法に応じて変動し得る。例えば、アグロバクテリウム属媒介植物形質転換について、VirD2またはVirE2媒介T-DNAリクルートを用いることができ、またはmsDNAであってもよく、そして粒子衝撃について、HUHタギング系およびmsDNAを用いることができる。
【0192】
[実施例11.ヒト細胞における編集]
真核生物HEK293T(ATCC CRL-3216)細胞を、10%(v/v)FBSを補充したダルベッコ改変イーグル培地プラスGlutaMax(ThermoFisher)(FBS)内で、5% CO2、37℃にて培養した。HEK293T細胞を、48ウェルのコラーゲンコーティングしたBioCoatプレート(Corning)上に播種した。細胞を、約70%コンフルエンシーにて形質移入した。ウェルあたり1.5μlのリポフェクタミン3000(ThermoFisher Scientific)を用いて、メーカーのプロトコールに従ってDNAを形質移入した。ウェルあたり1.5μlのRNAiMAX(ThermoFisher Scientific)を用いて、メーカーのプロトコールに従ってRNPを形質移入した。形質移入された細胞由来のゲノムDNAを3日後に得て、高スループットIlluminaアンプリコン配列決定を用いて、正確な編集を検出かつ定量化した。
【0193】
DNA鋳型のDNAポリメラーゼ媒介伸長を試験するために、以下を行った。HEK293T細胞を、最初に、Klentaq、Therminator、Pfu-Ssod7、クレノウ、大腸菌polI、HU pol E(N-term)、酵母pol Eが挙げられる種々のDNA依存性DNAポリメラーゼを構成的CMVプロモーター下にコードする1ugのDNAで形質移入した(例えば、配列番号48~58、88~94参照)。全てのDNA依存性DNAポリメラーゼを、少なくとも1つのSV40核局在化配列で増強して、核中へのインポートを確実にした。4時間後に、細胞をフレッシュな培地下に置いた。その後、種々の合成crRNA伸長(例えば、配列番号78、79、82、83、86、87参照)を含有するCas12a RNP複合体(例えば配列番号75参照)を細胞中に形質移入した。Cas12a切断部位の下流側に相同アームをコードするDNA伸長部、および所望の編集をコードする鋳型配列を、化学合成(Integrated DNA Technologies)を介して、crRNAにコンジュゲートした。2つの異なる相同長さ(PBS;24bpおよび36bp)を試験した。所望の編集(RTT)を含有する鋳型の長さは36塩基対であった(表2)。3つの異なるスペーサーを用いて、システムを試験した(PWsp137(配列番号76)、PWsp453(配列番号80)、PWsp454(配列番号84))(表2)。全ての構築体について、鋳型は、スペーサーの位置-2および-3での、アデニンへの正確なジヌクレオチド変化(TTからAA)を含有した。PAM配列(TTTV)は、位置-4、-3、-2、および-1に対応する。
【0194】
発明者らは、DNAポリメラーゼを、crRNA上にDNA伸長部を含有するCas12a RNPと併用して、如何なる副産物もない正確な編集を検出した(表2)。正確な編集を、試験した3つ全てのスペーサーにおいて検出した(表2)。インデル率は、LbCas12a RNPから有効であると予想される(293Tにおいて、5~50%の編集効率、例えば、Liu et al.Nucleic Acids Res.47(8):4169-4180(2019)参照)ので、発明者らの低い(約1%)インデル率(表3)は、発明者らの実験における2ラウンドの形質移入は、送達システムの効率を大幅に低下させたことを示唆している。発明者らの実験における正確な編集率がインデル率(表3および表4)に類似していた事実は、DNA依存性DNAポリメラーゼを介した正確な編集が、正確な編集にとって潜在的に非常に有効であることを示唆している。正確な編集のバックグラウンドレベルを減算して、正確な編集を、(形質移入および生存率について正規化するために)インデル編集率に対して正規化した場合、DNAポリメラーゼおよび鋳型の追加は、ほとんどのスペーサー部位およびPBS長でのDNAポリメラーゼなし対照と比較して、正確な編集における実質的な増大に至ることが明らかである(表4)。
【0195】
【0196】
【0197】
【0198】
前述のものは、本発明の実例であり、その限定と解釈されるべきでない。本発明は、以下の特許請求の範囲によって定義され、特許請求の範囲の均等物もその中に含まれるべきである。
【配列表】
【国際調査報告】