IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アストラゼネカ・アクチエボラーグの特許一覧

特表2023-522848改善された部位特異的改変のための組成物及び方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-06-01
(54)【発明の名称】改善された部位特異的改変のための組成物及び方法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20230525BHJP
   C12N 15/11 20060101ALI20230525BHJP
   C12N 15/62 20060101ALI20230525BHJP
   C12N 15/63 20060101ALI20230525BHJP
   C12N 15/52 20060101ALI20230525BHJP
   C12N 15/54 20060101ALI20230525BHJP
   C12N 15/55 20060101ALI20230525BHJP
   C07K 19/00 20060101ALI20230525BHJP
   C12N 9/00 20060101ALI20230525BHJP
   C12N 9/10 20060101ALI20230525BHJP
   C12N 9/16 20060101ALI20230525BHJP
   C12N 1/15 20060101ALI20230525BHJP
   C12N 1/19 20060101ALI20230525BHJP
   C12N 1/21 20060101ALI20230525BHJP
   C12N 5/10 20060101ALI20230525BHJP
【FI】
C12N15/09 110
C12N15/09 100
C12N15/11 Z ZNA
C12N15/62 Z
C12N15/63 Z
C12N15/52 Z
C12N15/54
C12N15/55
C07K19/00
C12N9/00
C12N9/10
C12N9/16 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022561099
(86)(22)【出願日】2021-04-07
(85)【翻訳文提出日】2022-12-05
(86)【国際出願番号】 EP2021059062
(87)【国際公開番号】W WO2021204877
(87)【国際公開日】2021-10-14
(31)【優先権主張番号】63/104,123
(32)【優先日】2020-10-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/006,997
(32)【優先日】2020-04-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】391008951
【氏名又は名称】アストラゼネカ・アクチエボラーグ
【氏名又は名称原語表記】ASTRAZENECA AKTIEBOLAG
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100138911
【弁理士】
【氏名又は名称】櫻井 陽子
(72)【発明者】
【氏名】マレスカ,マルチェッロ
【テーマコード(参考)】
4B050
4B065
4H045
【Fターム(参考)】
4B050CC04
4B050DD02
4B050DD20
4B050LL01
4B050LL10
4B065AA93X
4B065AB01
4B065AC14
4B065BA02
4B065CA24
4B065CA27
4B065CA29
4B065CA31
4B065CA44
4H045AA10
4H045AA30
4H045BA10
4H045BA41
4H045DA89
4H045EA20
4H045EA60
4H045FA74
(57)【要約】
本開示は、改善された遺伝子編集効率のためのタンパク質、組成物、方法、及びキットを提供する。いくつかの実施形態では、本開示は、Casヌクレアーゼと、逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む融合タンパク質を提供する。
【特許請求の範囲】
【請求項1】
(i)Casヌクレアーゼと、(ii)逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む融合タンパク質であって、前記Casヌクレアーゼが、二本鎖ポリヌクレオチド開裂を生成することができる融合タンパク質。
【請求項2】
前記Casヌクレアーゼが、Cas9、Cas12、又はCas14である、請求項1に記載の融合タンパク質。
【請求項3】
前記Casヌクレアーゼが、配列番号1、29、又は30のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項2に記載の融合タンパク質。
【請求項4】
前記Cas9が、IIB型Cas9である、請求項2に記載の融合タンパク質。
【請求項5】
前記融合タンパク質が、Casヌクレアーゼと、逆転写酵素と、を含む、請求項1に記載の融合タンパク質。
【請求項6】
前記逆転写酵素が、MMLV逆転写酵素又はR2逆転写酵素である、請求項5に記載の融合タンパク質。
【請求項7】
前記逆転写酵素が、配列番号2~3のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項5又は6に記載の融合タンパク質。
【請求項8】
前記融合タンパク質が、Casヌクレアーゼと、DNAポリメラーゼと、を含む、請求項1に記載の融合タンパク質。
【請求項9】
前記DNAポリメラーゼが、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、DNAポリメラーゼミュー、DNAポリメラーゼデルタ、又はDNAポリメラーゼイプシロンである、請求項7に記載の融合タンパク質。
【請求項10】
前記DNAポリメラーゼが、配列番号4~6のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項7又は8に記載の融合タンパク質。
【請求項11】
前記融合タンパク質が、Casヌクレアーゼと、DNAリガーゼと、を含む、請求項1に記載の融合タンパク質。
【請求項12】
前記DNAリガーゼが、T4 DNAリガーゼである、請求項11に記載の融合タンパク質。
【請求項13】
前記DNAリガーゼが、配列番号7に対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項11又は12に記載の融合タンパク質。
【請求項14】
DNA-結合又はRNA-結合ドメインを更に含む、請求項1~13のいずれか一項に記載の融合タンパク質。
【請求項15】
前記DNA-結合ドメインが、ジンクフィンガーDNA-結合ドメイン、転写因子、又はアデノ随伴ウイルスRepタンパク質である、請求項14に記載の融合タンパク質。
【請求項16】
前記RNA-結合ドメインが、MS2コートタンパク質(MCP2)である、請求項14に記載の融合タンパク質。
【請求項17】
前記RNA-結合ドメインが、KHドメインを含む、請求項14に記載の融合タンパク質。
【請求項18】
前記RNA-結合ドメインが、ヘテロ核リボ核タンパク質K(hnRNPK)である、請求項17に記載の融合タンパク質。
【請求項19】
前記DNA-結合ドメインが、一本鎖DNA(ssDNA)を結合することができる、請求項14に記載の融合タンパク質。
【請求項20】
DNA-結合ドメインが、はるか上流のエレメント結合タンパク質(FUBP)である、請求項19に記載の融合タンパク質。
【請求項21】
前記DNA-結合又は前記RNA-結合ドメインが、配列番号8~11のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項14~20のいずれか一項に記載の融合タンパク質。
【請求項22】
(i)と(ii)との間にポリペプチドリンカーを更に含む、請求項1~21のいずれか一項に記載の融合タンパク質。
【請求項23】
配列番号18~26のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む、請求項1に記載の融合タンパク質。
【請求項24】
a)請求項1~23のいずれか一項に記載の融合タンパク質と、
b)前記融合タンパク質と複合体を形成し、(i)ガイド配列と、(ii)前記逆転写酵素、前記DNAポリメラーゼ、又は前記DNAリガーゼのための鋳型配列と、を含むポリヌクレオチドと、
を含む組成物。
【請求項25】
前記ポリヌクレオチドが、RNAを含む、請求項24に記載の組成物。
【請求項26】
前記ガイド配列がRNAを含み、前記鋳型配列がDNAを含む、請求項24に記載の組成物。
【請求項27】
前記鋳型配列が、脱塩基部位、トリエチレングリコール(TEG)リンカー、又はその両方を含む、請求項24に記載の組成物。
【請求項28】
前記ガイド配列が、約15~約20ヌクレオチド長である、請求項24~27のいずれか一項に記載の組成物。
【請求項29】
前記ポリヌクレオチドが、tracrRNAを更に含む、請求項24~28のいずれか一項に記載の組成物。
【請求項30】
前記組成物が、tracrRNAを含む第2のポリヌクレオチドを含む、請求項24~28のいずれか一項に記載の組成物。
【請求項31】
前記鋳型配列が、プライマー-結合配列及び対象とする配列を含む、請求項24~30のいずれか一項に記載の組成物。
【請求項32】
前記プライマー-結合配列及び前記対象とする配列が、DNAを含む、請求項31に記載の組成物。
【請求項33】
前記対象とする配列が、DNAを含む、請求項31に記載の組成物。
【請求項34】
前記鋳型配列が、約25~約10000ヌクレオチド長である、請求項24~33のいずれか一項に記載の組成物。
【請求項35】
前記プライマー-結合配列が、約4~約30ヌクレオチド長である、請求項24~34のいずれか一項に記載の組成物。
【請求項36】
前記対象とする配列が、約5ヌクレオチド長~約9000ヌクレオチド長である、請求項24~35のいずれか一項に記載の組成物。
【請求項37】
前記ポリヌクレオチドが、前記ガイド配列と前記鋳型配列との間にスペーサーを含む、請求項24~36のいずれか一項に記載の組成物。
【請求項38】
前記スペーサーが、約10~約200ヌクレオチド長である、請求項37に記載の組成物。
【請求項39】
前記スペーサーが、前記逆転写酵素又はDNAポリメラーゼのための停止配列を含む、請求項37又は38に記載の組成物。
【請求項40】
前記スペーサーが、2つ以上の停止配列を含む、請求項39に記載の組成物。
【請求項41】
前記停止配列が、二次構造を含む、請求項39又は40に記載の組成物。
【請求項42】
前記二次構造が、ヘアピンループである、請求項41に記載の組成物。
【請求項43】
a)請求項1~23のいずれか一項に記載の融合タンパク質と、
b)前記融合タンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドと、
c)前記逆転写酵素、前記DNAポリメラーゼ、又は前記DNAリガーゼのための鋳型配列を含む鋳型ポリヌクレオチドと、を含む組成物。
【請求項44】
前記ガイドポリヌクレオチドが、RNAである、請求項43に記載の組成物。
【請求項45】
前記鋳型ポリヌクレオチドが、RNAを含む、請求項43に記載の組成物。
【請求項46】
前記鋳型配列が、DNAを含む、請求項43に記載の組成物。
【請求項47】
前記鋳型配列が、脱塩基部位、トリエチレングリコール(TEG)リンカー、又はその両方を含む、請求項43に記載の組成物。
【請求項48】
前記ガイド配列が、約15~約20ヌクレオチド長である、請求項43~47のいずれか一項に記載の組成物。
【請求項49】
前記ガイドポリヌクレオチドが、tracrRNAを更に含む、請求項43~48のいずれか一項に記載の組成物。
【請求項50】
前記組成物が、tracrRNAを含む第3のポリヌクレオチドを更に含む、請求項43~48のいずれか一項に記載の組成物。
【請求項51】
前記鋳型配列が、約25~約10000ヌクレオチド長である、請求項43~50のいずれか一項に記載の組成物。
【請求項52】
前記鋳型配列が、対象とする配列を含む、請求項43~51のいずれか一項に記載の組成物。
【請求項53】
前記対象とする配列が、約5ヌクレオチド長~約9800ヌクレオチド長である、請求項52に記載の組成物。
【請求項54】
前記対象とする配列が、DNAを含む、請求項52又は53に記載の組成物。
【請求項55】
前記鋳型ポリヌクレオチドが、プライマー-結合配列を更に含む、請求項43~54のいずれか一項に記載の組成物。
【請求項56】
前記プライマー-結合配列が、約4~約30ヌクレオチド長である、請求項55に記載の組成物。
【請求項57】
前記プライマー-結合配列及び前記対象とする配列が、DNAを含む、請求項55又は56に記載の組成物。
【請求項58】
前記鋳型ポリヌクレオチドが、前記逆転写酵素又はDNAポリメラーゼのための停止配列を更に含む、請求項43~57のいずれか一項に記載の組成物。
【請求項59】
前記鋳型ポリヌクレオチドが、2つ以上の停止配列を含む、請求項58に記載の組成物。
【請求項60】
前記停止配列が、二次構造を含む、請求項58又は59に記載の組成物。
【請求項61】
前記二次構造が、ヘアピンループである、請求項60に記載の組成物。
【請求項62】
前記鋳型ポリヌクレオチドが、対象となる配列を含むアデノ随伴ウイルス(AAV)ベクターを含む、請求項43~61のいずれか一項に記載の組成物。
【請求項63】
請求項1~23のいずれか一項に記載の融合タンパク質をコードするポリヌクレオチド。
【請求項64】
請求項1~23のいずれか一項に記載の融合タンパク質をコードする前記ポリヌクレオチドを含むベクター。
【請求項65】
請求項1~23のいずれか一項に記載の融合タンパク質を含む細胞。
【請求項66】
請求項1~23のいずれか一項に記載の融合タンパク質をコードする前記ポリヌクレオチド又は請求項64に記載のベクターを含む細胞。
【請求項67】
請求項24~62のいずれか一項に記載の組成物を含む細胞。
【請求項68】
標的ポリヌクレオチド中の標的配列において部位特異的改変を提供する方法であって、前記標的ポリヌクレオチドを請求項24~62のいずれか一項に記載の組成物と接触させることを含む方法。
【請求項69】
前記標的ポリヌクレオチドが、DNAである、請求項68に記載の方法。
【請求項70】
前記ガイド配列が、前記標的配列にハイブリダイズすることができる、請求項68又は69に記載の方法。
【請求項71】
前記接触が、前記Casヌクレアーゼが前記標的配列において二本鎖ポリヌクレオチド開裂を生成するのに十分な条件下で行われる、請求項68~70のいずれか一項に記載の方法。
【請求項72】
前記鋳型配列が、対象とする配列を含む、請求項68~71のいずれか一項に記載の方法。
【請求項73】
前記鋳型配列が、前記標的配列にハイブリダイズすることができるプライマー-結合配列を含む、請求項68~72のいずれか一項に記載の方法。
【請求項74】
前記接触が、前記逆転写酵素が前記対象とする配列の相補鎖を転写するのに十分な条件下で行われる、請求項68~73のいずれか一項に記載の方法。
【請求項75】
前記鋳型配列を開裂して前記対象とする配列を含む二本鎖配列を生成することを更に含む、請求項74に記載の方法。
【請求項76】
前記開裂が、RNアーゼHにより行われる、請求項75に記載の方法。
【請求項77】
前記接触が、前記DNAポリメラーゼが前記対象とする配列を含む二本鎖配列を生成するのに十分な条件下で行われる、請求項68~72のいずれか一項に記載の方法。
【請求項78】
前記接触が、前記DNAリガーゼが前記対象とする配列を前記開裂された標的配列にライゲートするのに十分な条件下で行われる、請求項68~72のいずれか一項に記載の方法。
【請求項79】
前記対象とする配列を含む前記二本鎖配列が、非相同末端結合(NHEJ)により、前記開裂された標的配列に挿入される、請求項71~78のいずれか一項に記載の方法。
【請求項80】
前記対象とする配列を含む前記二本鎖配列が、DNAリガーゼにより、前記開裂された標的配列に挿入される、請求項71~78のいずれか一項に記載の方法。
【請求項81】
前記標的ポリヌクレオチド中の第2の標的配列において第2の二本鎖ポリヌクレオチド開裂を生成することを更に含む、請求項68~77のいずれか一項に記載の方法。
【請求項82】
前記対象とする配列が、前記標的配列と前記第2の標的配列との間の前記標的ポリヌクレオチドの配列を置換する、請求項81に記載の方法。
【請求項83】
請求項1~23のいずれか一項に記載の融合タンパク質を含むキット。
【請求項84】
前記融合タンパク質と複合体を形成するポリヌクレオチド及び/又は前記ポリヌクレオチドを発現させるためのベクターを更に含む、請求項83に記載のキット。
【請求項85】
前記逆転写酵素、前記DNAポリメラーゼ、又は前記DNAリガーゼのための鋳型配列を含む鋳型ポリヌクレオチド及び/又は前記鋳型ポリヌクレオチドを発現させるためのベクターを更に含む、請求項83に記載のキット。
【請求項86】
tracrRNAを含むポリヌクレオチドを更に含む、請求項83又は84に記載のキット。
【請求項87】
RNアーゼHを更に含む、請求項83~86のいずれか一項に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、改善された遺伝子編集効率のためのタンパク質、組成物、方法、及びキットを提供する。いくつかの実施形態では、本開示は、Casヌクレアーゼと、逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む融合タンパク質を提供する。
【背景技術】
【0002】
CRISPR/Cas9などのプログラム可能なヌクレアーゼは、標的部位で挿入及び欠失(インデル)の混合物を誘導することによって遺伝子を破壊できる部位特異的二本鎖切断(DSB)を生成することができる。しかしながら、鋳型依存相同性配向型修復(HDR)に依存するDSB修復は、低い頻度を有し得るが、高効率の鋳型非依存非相同末端結合(NHEJ)はエラーが発生しやすく、所望の挿入を優先しない場合がある。
【0003】
非特許文献1は、開裂部位に短い配列を挿入することができる逆転写酵素に融合された、一本鎖切断を生成するプログラム可能なニッカーゼを利用するプライム編集の開発について記載している。しかしながら、プライム編集は、最大22塩基対の短い配列のみを挿入することができ、RNAの除去及び標的部位への一本鎖DNAのハイブリダイゼーションの複雑なメカニズムに依存し、細胞平衡による重複する「フラップ」配列の除去も必要とする。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Anzalone et al.(Nature 576:149-157(2019))
【発明の概要】
【課題を解決するための手段】
【0005】
いくつかの実施形態では、本開示は、(i)Casヌクレアーゼと、(ii)逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む融合タンパク質であって、Casヌクレアーゼが、二本鎖ポリヌクレオチド開裂を生成することができる融合タンパク質を提供する。
【0006】
いくつかの実施形態では、本開示は、(i)Casヌクレアーゼと、(ii)逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む融合タンパク質であって、Casヌクレアーゼが、二本鎖ポリヌクレオチド開裂を生成することができる融合タンパク質を提供する。
【0007】
いくつかの実施形態では、Casヌクレアーゼは、Cas9又はCas12である。いくつかの実施形態では、Cas9は、IIB型Cas9である。いくつかの実施形態では、Cas9は、配列番号1に対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0008】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼと、逆転写酵素と、を含む。いくつかの実施形態では、逆転写酵素は、MMLV逆転写酵素又はR2逆転写酵素である。いくつかの実施形態では、逆転写酵素は、配列番号2~3のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0009】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼと、DNAポリメラーゼと、を含む。いくつかの実施形態では、DNAポリメラーゼは、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、DNAポリメラーゼミュー、DNAポリメラーゼデルタ、又はDNAポリメラーゼイプシロン、Rev3、DNAポリメラーゼI、DNAポリメラーゼIのKlenow断片である。いくつかの実施形態では、DNAポリメラーゼは、配列番号4~6のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0010】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼと、DNAリガーゼと、を含む。いくつかの実施形態では、DNAリガーゼは、T4DNAリガーゼである。いくつかの実施形態では、DNAリガーゼは、配列番号7に対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0011】
いくつかの実施形態では、融合タンパク質は、DNA-結合又はRNA-結合ドメインを更に含む。いくつかの実施形態では、DNA-結合ドメインは、ジンクフィンガーDNA-結合ドメイン、転写因子、又はアデノ随伴ウイルスRepタンパク質である。いくつかの実施形態では、RNA-結合ドメインは、MS2コートタンパク質(MCP2)である。いくつかの実施形態では、RNA-結合ドメインは、KHドメインを含む。いくつかの実施形態では、RNA-結合ドメインは、ヘテロ核リボ核タンパク質K(hnRNPK)である。いくつかの実施形態では、DNA-結合ドメインは、一本鎖DNA(ssDNA)を結合することができる。いくつかの実施形態では、DNA-結合ドメインは、はるか上流のエレメント結合タンパク質(FUBP)である。いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、配列番号8~11のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0012】
いくつかの実施形態では、融合タンパク質は、(i)と(ii)との間にポリペプチドリンカーを更に含む。
【0013】
いくつかの実施形態では、融合タンパク質は、配列番号18~26のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。
【0014】
いくつかの実施形態では、本開示は、(a)本明細書で提供される融合タンパク質と、(b)融合タンパク質と複合体を形成し、(i)ガイド配列と、(ii)逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼのための鋳型配列と、を含むポリヌクレオチドと、を含む組成物を提供する。
【0015】
いくつかの実施形態では、ポリヌクレオチドは、RNAを含む。いくつかの実施形態では、ガイド配列はRNAを含み、鋳型配列はDNAを含む。いくつかの実施形態では、鋳型配列は、脱塩基部位、トリエチレングリコール(TEG)リンカー、又はその両方を含む。いくつかの実施形態では、ガイド配列は、約15~約20ヌクレオチド長である。いくつかの実施形態では、ポリヌクレオチドは、tracrRNAを更に含む。いくつかの実施形態では、組成物は、tracrRNAを含む第2のヌクレオチドを含む。
【0016】
いくつかの実施形態では、鋳型配列は、プライマー-結合配列及び対象とする配列を含む。いくつかの実施形態では、プライマー-結合配列及び対象とする配列は、DNAを含む。いくつかの実施形態では、対象とする配列は、DNAを含む。いくつかの実施形態では、鋳型配列は、約25~約10000ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約4~約30ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5ヌクレオチド長~約9800ヌクレオチド長である。
【0017】
いくつかの実施形態では、ポリヌクレオチドは、ガイド配列と鋳型配列との間にスペーサーを含む。いくつかの実施形態では、スペーサーは、約10~約200ヌクレオチド長である。いくつかの実施形態では、スペーサーは、逆転写酵素又はDNAポリメラーゼのための停止配列を含む。いくつかの実施形態では、スペーサーは、2つ以上の停止配列を含む。いくつかの実施形態では、停止配列は、二次構造を含む。いくつかの実施形態では、二次構造は、ヘアピンループである。
【0018】
いくつかの実施形態では、本開示は、(a)本明細書で提供される融合タンパク質と、(b)融合タンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドと、(c)逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼのための鋳型配列を含む鋳型ポリヌクレオチドと、を含む組成物を提供する。
【0019】
いくつかの実施形態では、ガイドポリヌクレオチドは、RNAである。いくつかの実施形態では、鋳型ポリヌクレオチドは、RNAを含む。いくつかの実施形態では、鋳型配列は、DNAを含む。いくつかの実施形態では、鋳型配列は、脱塩基部位、トリエチレングリコール(TEG)リンカー、又はその両方を含む。いくつかの実施形態では、ガイド配列は、約15~約20ヌクレオチド長である。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNAを更に含む。いくつかの実施形態では、組成物は、tracrRNAを含む第3のポリヌクレオチドを更に含む。
【0020】
いくつかの実施形態では、鋳型配列は、約25~約10000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、対象とする配列を含む。いくつかの実施形態では、対象とする配列は、約5ヌクレオチド長~約9800ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、DNAを含む。
【0021】
いくつかの実施形態では、鋳型ポリヌクレオチドは、プライマー-結合配列を更に含む。いくつかの実施形態では、プライマー-結合配列は、約10~約20ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列及び対象とする配列は、DNAを含む。
【0022】
いくつかの実施形態では、鋳型ポリヌクレオチドは、逆転写酵素又はDNAポリメラーゼのための停止配列を更に含む。いくつかの実施形態では、鋳型ポリヌクレオチドは、2つ以上の停止配列を含む。いくつかの実施形態では、停止配列は、二次構造を含む。いくつかの実施形態では、二次構造は、ヘアピンループである。
【0023】
いくつかの実施形態では、鋳型ポリヌクレオチドは、対象となる配列を含むアデノ随伴ウイルス(AAV)ベクターを含む。
【0024】
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチドを提供する。いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチドを含むベクターを提供する。
【0025】
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質を含む細胞を提供する。いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチド、又は本明細書で提供されるベクターを含む細胞を提供する。
【0026】
いくつかの実施形態では、本開示は、本明細書で提供される組成物を含む細胞を提供する。
【0027】
いくつかの実施形態では、本開示は、標的ポリヌクレオチド中の標的配列において部位特異的改変を提供する方法であって、標的ポリヌクレオチドを本明細書で提供される組成物と接触させることを含む方法を提供する。
【0028】
いくつかの実施形態では、標的ポリヌクレオチドは、DNAである。いくつかの実施形態では、ガイド配列は、標的配列にハイブリダイズすることができる。いくつかの実施形態では、接触は、Casヌクレアーゼが標的配列において二本鎖ポリヌクレオチド開裂を生成するのに十分な条件下で行われる。
【0029】
いくつかの実施形態では、鋳型配列は、対象とする配列を含む。いくつかの実施形態では、鋳型配列は、標的配列にハイブリダイズすることができるプライマー-結合配列を含む。
【0030】
いくつかの実施形態では、接触は、逆転写酵素が対象とする配列の相補鎖を転写するのに十分な条件下で行われる。いくつかの実施形態では、方法は、鋳型配列を開裂して対象とする配列を含む二本鎖配列を生成することを更に含む。いくつかの実施形態では、開裂は、RNアーゼHにより行われる。
【0031】
いくつかの実施形態では、接触は、DNAポリメラーゼが対象とする配列を含む二本鎖配列を生成するのに十分な条件下で行われる。いくつかの実施形態では、接触は、DNAリガーゼが対象とする配列を開裂された標的配列にライゲートするのに十分な条件下で行われる。
【0032】
いくつかの実施形態では、対象とする配列を含む二本鎖配列は、非相同末端結合(NHEJ)により、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNAリガーゼにより、開裂された標的配列に挿入される。
【0033】
いくつかの実施形態では、方法は、標的ポリヌクレオチド中の第2の標的配列において第2の二本鎖ポリヌクレオチド開裂を生成することを更に含む。いくつかの実施形態では、対象とする配列は、標的配列と第2の標的配列との間の標的ポリヌクレオチドの配列を置換する。
【0034】
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質を含むキットを提供する。
【0035】
いくつかの実施形態では、キットは、融合タンパク質と複合体を形成するポリヌクレオチド及び/又はポリヌクレオチドを発現させるためのベクターを更に含む。いくつかの実施形態では、キットは、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼのための鋳型配列を含む鋳型ポリヌクレオチド及び/又は鋳型ポリヌクレオチドを発現させるためのベクターを更に含む。いくつかの実施形態では、キットは、tracrRNAを含むヌクレオチドを更に含む。いくつかの実施形態では、キットは、RNアーゼHを更に含む。
【0036】
いくつかの実施形態では、Cas9-RT融合物をpegRNA及びDNAPK阻害剤と併用して、遺伝子編集効率を高める。
【図面の簡単な説明】
【0037】
図1A-1D】図1A~1Dは、本明細書の実施形態で記載される例示的な方法を示す。図1A及び1Bは、「NHEJ促進ドメイン」、例えば、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼに融合されたCas9、PRimed INSertion(PRINS)と呼ばれる融合タンパク質を示す。図1Aでは、「SPRINgRNA」(シングルプライム化挿入ガイドRNA)は、対象とする配列(「ins」)及びプライマー結合部位(PBS)を含む。図1Bでは、融合タンパク質は、DNA又はRNA結合ドメイン(例えば、MCP2、ZF、TALE、FBP、Pumilio、HUH、又はSNAP)を更に含み、PBSを伴う対象とする配列は分離ポリヌクレオチドとして提供される。図1Cは、図1Aに示されるPRINS複合体の作用メカニズムを示す。Cas9ヌクレアーゼは、標的ポリヌクレオチドにて二本鎖開裂を生成する。PBS及び対象とする配列を含有するCas9複合体中の鋳型配列を使用して、対象とする配列の複製を含む二本鎖挿入配列を生成する。次いで、生成された二本鎖挿入配列を、NHEJにより開裂された標的ポリヌクレオチドにライゲートすることができる。図1Dは、挿入及び欠失を組み合わせるための更なる実施形態を示す。Cas9ヌクレアーゼは、標的ポリヌクレオチドに二本鎖切断を生成する。PBS及び対象とする配列を含有するCas9複合体中の鋳型配列を使用して、対象とする配列の複製を含む二本鎖挿入配列を生成する。次いで、生成された二本鎖挿入配列は、NHEJによって、第2のCRISPR/Cas複合体によって下流で生成された別の切断にライゲートすることができる。2つのCRISPR/Cas複合体の間の配列は、対象となる配列に置換される。
図2A-2E】図2A~2Eは、本明細書の実施形態で記載される例示的な方法を示す。図2Aは、標的配列中で二本鎖切断を生じさせる挿入配列を含むガイドRNA(gRNA)を有するCas9-RT融合タンパク質(PRINS)を示す。PRINSは伸長のためにgRNAに結合する。図2Bは伸長の結果を示し、伸長された配列は破線で示される。図2Cは、例えばRNアーゼHによる、伸長配列における二本鎖切断の生成を示す。図2Dは、NHEJによる開裂された標的配列への伸長配列の組み込みを示す。図2Eは、挿入された配列を示す。
図3A-3B】図3A及び3Bは実施例1に関し、AAVS1部位でのCas9編集(図3A)対PRINS編集(図3B)の比較を示す。相対編集頻度は、実施例1に記載されているようにRIMAによって決定された。挿入は楕円で示されている。図3Bは、PRINSが配列AAGATGの鋳型挿入を容易にし、PRINSがCas9を介して挿入を促進することを示す。全ての挿入は、元の配列AAGATGに由来する。
図4図4は、本明細書の実施形態で記載される例示的な方法を示す。Casヌクレアーゼは、gRNAによって標的配列にガイドされ、二本鎖DNA切断を生成する。鋳型配列は、開裂されたDNAとハイブリダイズするプライマー-結合配列を含み、プライマーとして機能し、対象とする配列を含む。例えばCas9ヌクレアーゼに融合した逆転写酵素は、プライマーから第1のcDNAを合成する。第1のcDNAに相補的なDNA鎖は、ポリメラーゼ、例えばDNAポリメラーゼによって生成される。第1のcDNA及び第1のcDNAに相補的なDNA鎖はハイブリダイズして二本鎖配列を生成し、DNA修復経路、例えばNHEJによって開裂されたDNAに挿入することができる。
図5A-5D】図5A~5Dは、実施例2に関連し、プライム編集ガイドRNA(pegRNA)(Anzalone et al.,Nature 576:149-157(2019)により記載されているとおり)を利用したプライム編集対AAGATG配列を挿入するためのAAVS1部位でのシングルプライム化挿入ガイドRNA(springRNA)を利用したPRINS編集の比較を示す。相対編集頻度は、本明細書に記載の断片分析によって決定された。図5A(PRINS)の図5B(プライム編集)との比較は、PRINSがプライム編集よりも効率的であることを示している。図5C及び5Dは、PRINSのNHEJ依存性を実証する。図5C及び5Dは、NHEJに関与するDNA依存性タンパク質キナーゼ阻害剤の存在下でのPRINS(図5C)及びプライム編集(図5D)挿入頻度の比較を示す。
図6図6は、実施例3に関し、AAVS1部位でPRINSとともにpegRNA及びspringRNAを使用してAAGATG配列を挿入する効果を示す。相対編集頻度は、本明細書に記載の断片分析によって決定された。図6に示されるとおり、pegRNA及びspringRNAは、PRINSによるDNA挿入を、プライム編集と同様の経路又はPRINSと同様の経路(プライム化編集挿入)のいずれかによって促進することができる。
図7図7は、実施例4に関し、DNA依存性キナーゼ(DNA-PK)阻害剤AZD7648の存在下又は非存在下で、PRINS編集又はプライム編集を使用した効果を示す。特異的な組み込みは、本明細書に記載されているように、NGS Amplicon-Seqによって決定された。棒グラフは、n=2の平均を標準偏差で表す。「#1」又は「#2」とラベル付けされた棒は、様々なspringRNA(PRINS編集の場合)又は様々なpegRNA(プライム編集の場合)を指す。
図8図8は、実施例5に関する。図8は、本明細書に記載されるように、springRNAを含むDNA鋳型配列(「DNAテール」)又はspringRNAを含むRNA鋳型配列(「RNAテール」)のいずれかを使用した、Cas9+RT(「PE0」)融合物、Cas9+DNAポリメラーゼD(「PE0 PolD」)融合物、Cas9+Phi29 DNAポリメラーゼ(「PE0 Phi」)融合物、又はCas9対照を使用した場合の編集効率のまとめを示す。
図9図9は、実施例5に関する。図9は、本明細書に記載のとおり、Cas9+RT(「PE0」)融合タンパク質と3つの異なるガイドRNA(1つはRNAテール(「123RNA MS」)を含み、2つはDNAテール(「123DNA」及び「123DNA PS」)を含む)を使用した編集パターンを示す。図9の上部、中央、及び下部のパネルは、それぞれ123RNA MSテール、123DNAテール、又は123DNA PSテールを使用したPE0の編集パターンを示している。
図10図10は、実施例5に関する。図10は、本明細書に記載のとおり、Cas9+DNAポリメラーゼD(「PE0 PolD」)融合タンパク質と3つの異なるガイドRNA(1つはRNAテール(「123RNA MS」)を含み、2つはDNAテール(「123DNA」及び「123DNA PS」)を含む)を使用した編集パターンを示す。図10の上部、中央、及び下部のパネルは、それぞれ123RNA MSテール、123DNAテール、又は123DNA PSテールを使用したPE0 PolDの編集パターンを示している。
図11図11は、実施例5に関する。図11は、本明細書に記載のとおり、Cas9+Phi29 DNAポリメラーゼ(「PE0 Phi」)融合タンパク質と3つの異なるガイドRNA(1つはRNAテール(「123RNA MS」)を含み、2つはDNAテール(「123DNA」及び「123DNA PS」)を含む)を使用した編集パターンを示す。図11の上部、中央、及び下部のパネルは、それぞれ123RNA MSテール、123DNAテール、又は123DNA PSテールを使用したPE0 Phiの編集パターンを示している。
図12図12は、実施例5に関する。図12は、本明細書に記載のとおり、Cas9と3つの異なるガイドRNA(1つはRNAテール(「123RNA MS」)を含み、2つはDNAテール(「123DNA」及び「123DNA PS」)を含む)を使用した編集パターンを示す。図12の上部、中央、及び下部のパネルは、それぞれ123RNA MSテール、123DNAテール、又は123DNA PSテールを使用したCas9の編集パターンを示している。
図13図13は、実施例6に関する。図13は、PRINS編集(「PRINS#1」及び「PRINS#2」と表示)及びプライム編集(「PE#1」及び「PE#2」と表示)の例示的なガイドRNAデザインを示す。図13で示されるように、プライム編集ガイドRNAは、更なる3’相同性領域を含む。
図14A-14B】図14A及び14Bは、実施例6に関する。図14A及び14Bは、PRINS編集又はプライム編集を用いた、DNA-PK阻害剤AZA7648の存在下又は非存在下での、図13に示される異なるガイドRNAの使用効果を示す。特異的な組み込みは、本明細書に記載されているように、NGS Amplicon-Seqによって決定された。棒グラフは、n=2の平均を標準偏差で表す。
図15図15は、実施例7に関する。図15は、本明細書に記載のジフテリア毒素選択系の例示的な概略図を示す。図15で示されるように、DT受容体であるHbEGFのイントロンは、PRINS編集又はCas9編集標的として選択された。二重対立遺伝子の大きな欠失のみが、細胞にDT抵抗性を提供する。
図16図16は、実施例7に関する。図16は、Cas9-RT融合物(PRINS編集、「PE0」)、Cas9、又はCas9ニッカーゼ-RT融合物(プライム編集、「PE2」)、及び3つの異なるガイドRNAでトランスフェクトされた細胞の顕微鏡画像を示す。陽性対照は、HbEGFを標的とするCas9でトランスフェクトされた細胞を示す。
図17図17は、実施例8に関する。図17は、本明細書に記載されるように、Cas9とRTの間(「PRINS_MS2_v1」)又はRTの下流(「PRINS_MS2_v2」)のいずれかにMCPドメインを含有する2つのCas9+RT融合タンパク質の例示的な概略図を示す。3つの異なるポリヌクレオチド系を試験した:(1)分離ポリヌクレオチドとしてのMS2アプタマーに融合した逆転写酵素のためのガイドRNA及び鋳型ポリヌクレオチド、(2)対照、非標的ガイドRNA、並びに(3)逆転写酵素鋳型に融合したガイドRNA。
図18図18は、実施例8に関する。図18は、Cas9+RT+MCP融合タンパク質を、図17に記載の3つの異なるポリヌクレオチド系とともに使用して、所望の配列AAGATGを挿入するためのPRINS編集の編集効率を示す。
図19図19は実施例9に関し、Cas12及び標的EXM1のための例示的なガイドRNAを示す。
図20図20は実施例10に関し、Cas9-DNAポリメラーゼ融合タンパク質によるPRINS編集の結果を示す。springRNA挿入配列の挿入頻度は、Cas9、Cas9-RT(「PE0」)、又は様々なDNAポリメラーゼ:3’→5’エキソヌクレアーゼ活性がないKlenow断片(「Cas9-Klenow exo-」)、3’→5’エキソヌクレアーゼ活性を有するKlenow断片(「Cas9-Klenow exo+」)、又はREV3ポリメラーゼ(「Cas9-REV3」)に融合したCas9でトランスフェクトされた細胞で分析した:各円は、各々独立したトランスフェクションごとの正確な挿入の頻度を表す。点線は、Cas9のみによる挿入の平均値(すなわち、バックグラウンド値)を表し、試験された各条件についてのバックグラウンドとの差は、多重比較ANOVA(Brown-Forsythe及びWelch調整)によって計算された。10~15回の測定値の平均及び標準偏差は、ウィスカープロットとして表される。***:p<0.0005;****:p<0.0001。
図21A-21C】図21A~21Cは実施例11に関し、キメラspringRNAを用いたCas9-DNAポリメラーゼ融合タンパク質によるPRINS編集の結果を示す。Cas9-DNAポリメラーゼの、DNA及びRNA挿入配列並びにPBSを有するキメラspringRNA(「DiHP」)又はDNA挿入配列を有するspringRNA(「DiRP」)との同時トランスフェクションは、図27Aに示されるように、全体的な挿入効率を増加させ、図27Bに示されるように、所望の配列を挿入する頻度を増加させる。図27A及び27Bでは、各記号(円形、四角形、又は六角形)は、サンプルごとに観察される編集を表す。円形はspringRNAを表し、四角形はDiHPを表し、六角形はDiRPを表す。平均及び標準偏差は、ウィスカープロットにより表される。図27Cは、Cas9、PE0、及びCas9-DNAポリメラーゼ融合タンパク質のspringRNA、DiHP、及びDiRPとの代表的な編集パターンを示す。図27Cでは、挿入は、指定された配列とともに影付きの長方形で表され、欠失は接続線で表される。
図22図22は、実施例12に関し、改変(脱塩基部位又はTEGリンカー)を有するspringRNAを用いたCas9-RTによるPRINS編集の結果を示す。Cas9-RTの改変したspringRNAとの同時トランスフェクションにより、所望の長さの挿入頻度が増加したため、より正確な改変が行われた。
図23A-23B】図23A~23Bは、実施例13に関する。図23Aは、蛍光標識PCRプライマーで増幅しキャピラリー電気泳動で分解した後の、PE0(上パネル)並びに個別に表現されたCas9及びRT(下パネル)とのPRINS編集後の、AAVS1遺伝子座のエレクトログラムを示す。アスタリスクは、野生型配列に対応するDNA産物を表し、6bpの挿入のある大きな分子はPRINS編集された配列に対応する。図23Bは、個別に発現させたCas9、PE0、Cas9及びRT、並びに個別に発現させたCas9-LigD及びRTのPRINS編集の結果を示す。Cas9-LigD及びRTの同時発現は、Cas9及びRTの同時発現と比較して、所望の配列の挿入を改善した。円形は、>4の生物学的複製の個々の編集測定値を表す。平均及び標準偏差は、クロスバー及びウィスカープロットにより表される。統計的差異はANOVAによって計算された(****:p<0.0001)。
図24A-24B】図24A~24Bは実施例14に関し、springRNA PBSにおけるミスマッチを伴う又は伴わないPRINS編集効率の結果を示す。図24Aは、核酸塩基ミスマッチのないspringRNAを使用したPRINS編集が、6bpの挿入配列について37.13%の相対挿入頻度を有したことを示す。図24Bは、PBSの3’末端に2bpの核酸塩基ミスマッチを有するspringRNAを使用したPRINS編集が、4ntの挿入配列(元の6bp配列から2bpミスマッチを引いたもの)について59.59%の相対挿入頻度を有したことを示す。
図25図25は実施例15に関連し、以下のDNA修復遺伝子の1つで部分的に欠損した細胞におけるPRINS編集の結果を示す:PRKDC(DNAPKとしても知られる)、LIG4、TP53BP1、PARP1、POLQ、LIG3、及びATM。実験は、DMSO対照(「d」)又はDNAPK阻害剤(「i」)の存在下で3回行った。左のパネルは、Cas9-RT融合物(「PE0」)及びspringRNAを用いた実験を示す。右のパネルは、PE0及びpegRNAを用いた実験を示す。
図26A-26B】図26A~26Bは、実施例16に関する。図26A~26Bにおける配列番号29は、MHCas9用のtracrRNAスキャホールド、6bpの挿入配列、及びPBSを含有するspringRNAを示す。図26Aは、MHCas9-RTによる最も効率的なPRINS編集イベントを示す。図26Bは、MHCas9-RTによる最も頻度の高い10個のPRINS編集イベントを示しており、最も頻度の高い3つの編集イベントによって示されるように、RTが、鋳型挿入だけでなく、MHCas9によって生成されたオーバーハング配列(CCC)の伸長も仲介していることを示している。
図27A-27B】図27A~27Bは、実施例17に関し、pegRNAを用いたCas9-RTによる標的化置換/挿入及び欠失の結果を示す。図27Aは、DMSO又はDNAPK阻害剤(DNAPKi)を用いたAAVS1遺伝子座でのAからGへの置換の頻度を示す。図27Bは、DMSO又はDNAPKiによるAAVS1遺伝子座での1ヌクレオチドの欠失の頻度を示す。
【発明を実施するための形態】
【0038】
本開示は、改善されたCRISPR系及びその成分、並びにそれらを使用する方法に関する。一般に、CRISPR系、例えばCRISPR/Cas系は、標的ポリヌクレオチド、例えば標的DNA配列の部位で、ガイドポリヌクレオチド及びCasタンパク質などのCRISPR複合体の形成を促進するエレメントを含む。天然CRISPR系(例えば、細菌免疫CRISPR/Cas9系)では、外来DNAはCRISPRアレイに組み込まれ、次いでCRISPR-RNA(crRNA)を生成する。crRNAは、外来DNA部位に相補的なプロトスペーサー領域を含み、CRISPR系によってもコードされるトランス活性化CRISPR-RNA(tracrRNA)とハイブリダイズする。tracrRNAは、ステムループなどの二次構造を形成し、Cas9タンパク質に結合することができる。crRNA/tracrRNAハイブリッドはCas9と会合し、crRNA/tracrRNA/Cas9複合体はプロトスペーサー配列を持つ外来DNAを認識して開裂し、侵入するウイルス又はプラスミドに対する免疫を付与する。
【0039】
その最初の発見以来、広範な調査は遺伝子編集を含む遺伝子工学におけるCRISPR系の応用可能性に焦点を当ててきた(例えば、Jinek et al.,Science 337(6096):816-821(2012);Cong et al.,Science 339(6121):819-823(2013);及びMali et al.,Science 339(6121):823-826(2013)を参照)。CRISPR/Cas系は、本明細書に記載されている天然のCRISPR系の成分を利用しており、広範囲の生物や細胞株で、遺伝子編集などの部位特異的なゲノム改変に使用されている。遺伝子編集に加えて、CRISPR系は、複数の他の用途、例として調節遺伝子発現、遺伝子回路構築、機能的ゲノム学などを有する(Sander and Joung,Nat Biotechnol 32:347-355(2014)に概説)。
【0040】
本明細書において特に定義しない限り、本開示において使用される科学技術用語は、当業者が一般に理解する意味を有するものとする。更に、文脈から別の解釈が要求されない限り、単数形の用語は複数形を含み、複数形の用語は単数形を含むものとする。本明細書において使用される「a」又は「an」(1つの)は、1つ以上を意味し得る。本明細書において使用され、語「含む(comprising)」と同時に使用される場合、語「a」又は「an」は、1つ又は2つ以上を意味し得る。本明細書において使用される「別の」又は「さらなる」は、少なくとも第2のもの以上を意味し得る。
【0041】
核酸分子は、別の核酸分子、例えば、cDNA、ゲノムDNA、又はRNAに、温度及び溶液イオン強度の適切な条件の下で、核酸分子の一本鎖形態が当該別の核酸分子にアニールし得る場合、「ハイブリダイズ可能である」又は「ハイブリダイズされる」。ハイブリダイゼーション及び洗浄条件は、既知であり、Sambrook et al.,Molecular Cloning:A Laboratory Manual、Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989)、特にその中の第11章及び表11.1に例示されている。温度及びイオン強度の条件は、ハイブリダイゼーションのストリンジェンシーを決定する。ハイブリダイゼーション条件のストリンジェンシーは、2つの相補的核酸ポリヌクレオチドの所望のハイブリダイゼーション産物の選択的な形成又は維持を、潜在的に交差反応又は干渉する他のポリヌクレオチドの存在下で実現するように選択することができる。ストリンジェントな条件は、配列依存性である;典型的には、相補的配列が長いほど、より短い相補的配列よりも高い温度にて特異的にハイブリダイズする。通常、ストリンジェントなハイブリダイゼーション条件は、特定のポリヌクレオチドについて、定義されたイオン強度、化学変性剤の濃度、pH、及びハイブリダイゼーションパートナーの濃度での熱融点(T)(すなわち、配列の50%が、実質的に相補的な配列にハイブリダイズする温度)よりも約5℃~約10℃低い。通常、ヌクレオチド配列は、G塩基及びC塩基のパーセンテージが高いほど、G塩基及びC塩基のパーセンテージがより低いヌクレオチド配列よりもストリンジェントな条件の下で、ハイブリダイズする。通常、ストリンジェンシーは、温度を上げることによって、pHを上げることによって、イオン強度を低下させることによって、且つ/又は化学核酸変性剤(例えば、ホルムアミド、ジメチルホルムアミド、ジメチルスルホキシド、エチレングリコール、プロピレングリコール、及び炭酸エチレン)の濃度を上げることによって、増大させることができる。ストリンジェントなハイブリダイゼーション条件は、典型的には、約1M、500mM、200mM、100mM、又は50mM未満の塩濃度又はイオン強度;約20℃、30℃、40℃、60℃、又は80℃超のハイブリダイゼーション温度;及び約10%、20%、30%、40%、又は50%を上回る化学変性剤濃度を含む。多くの要因が、ハイブリダイゼーションのストリンジェンシーに影響を与え得るので、パラメータの組み合わせは、任意のパラメータ単独の絶対値よりも重要であり得る。
【0042】
例えば55℃のTmに対応する、例示的な低ストリンジェンシーハイブリダイゼーション条件として、5×クエン酸ナトリウム緩衝生理食塩水(SSC)、0.1%SDS、0.25%ミルク、及びホルムアミドなし;又は30%ホルムアミド、5×SSC、及び0.5%SDSが挙げられる。約55℃~約65℃のより高いTに対応する例示的な中程度のストリンジェンシーハイブリダイゼーション条件として、40%ホルムアミド及び5×又は6×SCCが挙げられる。65℃を超える最も高いTmに対応する例示的な高ストリンジェンシーハイブリダイゼーション条件として、50%ホルムアミド及び5×又は6×SCCが挙げられる。
【0043】
更に例示的なハイブリダイゼーション条件としては、およそ6.5~8.5のpHの、約20mM~200mMのイオン強度を有する、約15℃~40℃の温度の緩衝溶液(例えば、およそ20mM~200mMの緩衝成分を有するリン酸、トリス、又はHEPES緩衝溶液)が挙げられる。例えば、バッファは、塩を、約10mM~約1M、約20mM~約500mM、約30mM~約100mM、約40mM~約80mM、又は約50mMの濃度にて含んでもよい。例示的な塩としては、NaCl、KCl、(NHSO、NaSO、及びCHCOONHが挙げられる。
【0044】
用語「相補的」は、互いにハイブリダイズし得るヌクレオチド塩基間の関係を記載するために使用される。例えば、DNAに関して、アデノシンは、チミンに相補的であり、シトシンは、グアニンに相補的である。したがって、本開示には、本明細書で開示又は使用される完全配列に相補的な単離核酸断片及びそれらと実質的に類似する核酸配列も含まれる。
【0045】
用語「相同組換え」は、外来ポリヌクレオチド(例えば、DNA)の別の核酸(例えば、DNA)分子中への挿入、例えば染色体中のベクターの挿入を指す。場合により、ベクターは、相同組換えについて特異的な染色体部位を標的化する。特異的相同組換えのため、ベクターは、典型的には、相補的結合及び染色体中へのベクターの組み込みを可能とするために染色体の配列と相同性の十分に長い領域を含有する。より長い相補性の領域及びより大きい配列類似性の程度は、相同組換えの効率を増加させ得る。いくつかの実施形態では、本明細書に記載の融合タンパク質又は組成物は、切断、例えば核酸配列中の二本鎖切断を生成することにより相同組換えを促進する。
【0046】
本明細書で使用する場合、用語「操作可能に連結される」とは、対象とするポリヌクレオチド、例えばヌクレアーゼをコードするポリヌクレオチドが、ポリヌクレオチドの発現を可能にするように調節エレメントに連結されることを意味する。いくつかの実施形態では、調節エレメントは、プロモーターである。いくつかの実施形態では、対象とするポリペプチドを発現するポリヌクレオチドは、発現ベクター上でプロモーターに操作可能に連結されている。
【0047】
「ベクター」は、宿主細胞中に核酸をクローニングし、及び/又は移行させる任意の手段である。ベクターは、別のDNAセグメントを付着させて付着セグメントの複製を生じさせることができるレプリコンであり得る。「レプリコン」は、in vivoでDNA複製の自律的単位として機能する、すなわち、それ自体の制御下で複製し得る任意の遺伝子エレメント(例えば、プラスミド、ファージ、コスミド、染色体、ウイルス)である。いくつかの実施形態では、ベクターは、例えば、非対称分配により多数の細胞世代後に細胞の集団から除去/消失されるエピソーマルベクターである。用語「ベクター」には、in vitro、ex vivo、又はin vivoで細胞中に核酸を導入するためのウイルス性及び非ウイルス性手段の両方が含まれる。当該技術分野で知られている多数のベクターを使用して、核酸を操作し、応答エレメント及びプロモーターを遺伝子に組み込んだりすることができる。ベクターは、1つ以上の調節領域、並びに/又は核酸導入結果(どの組織への導入、発現期間など)の選択、測定、及びモニタリングに有用な選択マーカーを含み得る。
【0048】
考えられるベクターとしては、例えば、プラスミド又は改変ウイルス、例として、例えば、バクテリオファージ、例えば、ラムダ誘導体、又はプラスミド、例えば、PBR322若しくはpUCプラスミド誘導体、又はBluescriptベクターが挙げられる。例えば、好適ベクター中への、応答エレメント及びプロモーターに対応するDNA断片の挿入は、相補的粘着末端を有する選択ベクター中に適切なDNA断片をライゲートすることにより達成することができる。代わりに、DNA分子の末端を酵素的に改変することができるか、又はポリヌクレオチド(リンカー)をDNA末端中にライゲートすることにより任意の部位を産生することができる。このようなベクターは、細胞ゲノム中にマーカーを組み込んだ細胞の選択を提供する選択マーカー遺伝子を含有するように改変することができる。このようなマーカーは、マーカーを組み込み、そのマーカーによりコードされるタンパク質を発現する宿主細胞の同定及び/又は選択を可能とする。
【0049】
ウイルスベクター、特にレトロウイルスベクターは、細胞及び生存動物対象における広範な遺伝子送達用途において使用されている。使用することができるウイルスベクターとしては、限定されるものではないが、レトロウイルス、アデノウイルスアデノ随伴ウイルス(adenovirus adeno-associated virus)、ポックス、バキュロウイルス、ワクシニア、単純ヘルペス、エプスタインバール、アデノウイルス、ジェミニウイルス、及びカリモウイルスベクターが挙げられる。いくつかの実施形態では、ウイルスベクターを利用して、本明細書に記載のポリヌクレオチドを提供する。いくつかの実施形態では、ウイルスベクターを利用して、本明細書に記載のポリペプチドをコードするポリヌクレオチドを提供する。
【0050】
ベクターは、既知の方法、例として、限定されるものではないが、トランスフェクション、形質導入、細胞融合、及びリポフェクションにより所望の宿主細胞中に導入することができる。ベクターは、種々の調節エレメント、例としてプロモーターを含み得る。いくつかの実施形態では、ベクター設計は、Mali et al.,Nat Methods 10:957-63(2013)により設計された構築物をベースとすることができる。
【0051】
当該技術分野において公知の方法を使用して、本明細書で提供されるポリヌクレオチド及び/又はベクターを伝播させることができる。好適な宿主系及び成長条件を確立したら、組換え発現ベクターを伝播させ、多量に調製することができる。本明細書で説明する通り、使用され得る発現ベクターとしては、以下のベクター又はその誘導体が挙げられるが、これらに限定されない:ヒト又は動物ウイルス、例えばワクシニアウイルス又はアデノウイルス、昆虫ウイルス、例えばバキュロウイルス、酵母ベクター、バクテリオファージベクター(例えば、ラムダ)並びにプラスミド及びコスミド DNAベクター。
【0052】
用語「プラスミド」は、細胞の中央代謝の一部でない遺伝子を担持することが多く、通常、環状二本鎖DNA分子の形態である外部染色体エレメントを指す。このようなエレメントは、任意の資源に由来する自律複製配列、ゲノム組み込み配列、ファージ又はポリヌクレオチド、線状、環状、又はスーパーコイルドの一本鎖又は二本鎖DNA又はRNAであり得、その中では多数のポリヌクレオチドが、適切な3’非翻訳配列とともに選択遺伝子産物についてのプロモーター断片及びDNA配列を細胞中に導入し得るユニーク構築物中に結合し、又は組換えされている。いくつかの実施形態では、プラスミドを利用して、本明細書に記載のポリヌクレオチドを提供する。いくつかの実施形態では、プラスミドを利用して、本明細書に記載のポリペプチドをコードするポリヌクレオチドを提供する。
【0053】
本明細書において使用される用語「トランスフェクション」は、細胞中への外因性核酸分子、例えばベクターの導入を意味する。「トランスフェクトされた」細胞は、細胞内部の外因性核酸分子を含み、「形質転換された」細胞は、細胞内の外因性核酸分子が細胞の表現型変化を誘導する細胞である。トランスフェクトされた核酸分子は、宿主細胞のゲノムDNA中に組み込むことができ、及び/又は一時的若しくは長期間にわたり染色体外で細胞により維持させることができる。外因性核酸分子又は断片を発現する宿主細胞又は生物は、本明細書では、「組換え」、「形質転換」、又は「トランスジェニック」生物と称される。いくつかの実施形態では、本開示は、本明細書に記載の発現ベクターのいずれか、例えばヌクレアーゼ、融合タンパク質、又はそのバリアントをコードするポリヌクレオチドを含む発現ベクターを含む宿主細胞を提供する。
【0054】
用語「宿主細胞」は、組換え発現ベクターが導入された細胞を指すか、又は「宿主細胞」はそのような細胞の子孫を指す場合もある。例えば、変異又は環境の影響により改変が後の世代に発生する場合があるため、そのような後代は、親細胞と同一ではない場合があるが、用語「宿主細胞」の範囲内に依然として含まれる。
【0055】
用語「ペプチド」、「ポリペプチド」、及び「タンパク質」は、本明細書において互換的に使用され、任意の長さのアミノ酸のポリマー形態を指し、それとしては、コード及び非コードアミノ酸、化学的若しくは生化学的改変又は誘導体化アミノ酸、並びに改変ペプチド骨格を有するポリペプチドを挙げることができる。
【0056】
タンパク質又はポリペプチドの始点は、「N末端」(及びアミノ末端、NH末端、N末端部、又はアミン末端としても呼ばれる)として知られ、これらはタンパク質又はポリペプチドの第1のアミノ酸残基の遊離アミン(-NH)基を指す。タンパク質又はポリペプチドの終点は、「C末端」(及びカルボキシ末端、カルボキシル末端、C-末端部、又はCOOH末端としても呼ばれる)として知られ、これは、タンパク質又はポリペプチドの最後のアミノ酸残基の遊離カルボキシル基(-COOH)を指す。
【0057】
本明細書で使用するとき、「アミノ酸」は、カルボキシル(-COOH)及びアミノ(-NH)基の両方を含有する化合物を指す。「アミノ酸」は、天然及び非天然(すなわち合成)のアミノ酸の両方を指す。3文字及び1文字の略記を有する天然アミノ酸としては、アラニン(Ala;A);アルギニン(Arg、R);アスパラギン(Asn;N);アスパラギン酸(Asp;D);システイン(Cys;C);グルタミン(Gln;Q);グルタミン酸(Glu;E);グリシン(Gly;G);ヒスチジン(His;H);イソロイシン(Ile;I);ロイシン(Leu;L);リジン(Lys;K);メチオニン(Met;M);フェニルアラニン(Phe;F);プロリン(Pro;P);セリン(Ser;S);トレオニン(Thr;T);トリプトファン(Trp;W);チロシン(Tyr;Y);及びバリン(Val;V)が挙げられる。非天然又は合成アミノ酸としては、上記で提供される天然アミノ酸とは異なる側鎖を含み、例えば、フルオロフォア、翻訳後修飾、金属イオンキレート剤、光ケージ及び光架橋部分、独特の反応性官能基、並びにNMR、IR、及びX線結晶プローブが挙げられ得る。例示的な非天然又は合成アミノ酸は、例えば、Mitra et al.,Mater Methods 3:204(2013)及びWals et al.,Front Chem 2:15(2014)で提供される。非天然アミノ酸はまた、例えば、シトルリン(Cit)、セレノシステイン(Sec)、及びピロリジン(Pyl)などの、タンパク質又はポリペプチドに典型的に組み込まれない天然に存在する化合物を含み得る。
【0058】
「アミノ酸置換」は、野生型又は天然発生アミノ酸の、その野生型又は天然発生アミノ酸に対して異なるアミノ酸による、そのアミノ酸残基における1つ以上の置換を含むポリペプチド又はタンパク質を指す。置換アミノ酸は、合成又は天然発生アミノ酸であり得る。いくつかの実施形態では、置換アミノ酸は、A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y、及びVからなる群から選択される天然発生アミノ酸である。いくつかの実施形態では、置換アミノ酸は、非天然又は合成アミノ酸である。置換変異体は、略語系を使用して記述される場合がある。例えば、5番目のアミノ酸残基が置換されている置換変異は「X5Y」と略記することができ、「X」は、置き換えられるべき野生型又は天然発生アミノ酸であり、「5」は、タンパク質又はポリペプチドのアミノ酸配列内のアミノ酸残基位置であり、「Y」は、置換、又は非野生型又は非天然発生アミノ酸である。
【0059】
「単離」ポリペプチド、タンパク質、ペプチド、又は核酸は、その天然環境から取り出された分子である。「単離」ポリペプチド、タンパク質、ペプチド、又は核酸は賦形剤、例えば、希釈剤又は助剤と配合することができ、依然として単離されているとみなされることも理解される。本明細書で使用する場合、「単離」は、ポリペプチド、タンパク質、ペプチド、又は核酸の任意の特定レベルの純度を必ずしも意味するものではない。
【0060】
用語「組換え」は、核酸分子、ペプチド、ポリペプチド、又はタンパク質に関して使用される場合、天然に存在することが公知でない遺伝子材料の新たな組み合わせのそれら、又はその組み合わせから生じるそれらを意味する。組換え分子は、組換え技術の分野において利用可能な技術のいずれか、例として、限定されるものではないが、ポリメラーゼ連鎖反応(PCR)、遺伝子スプライシング(例えば、制限エンドヌクレアーゼを使用)及び核酸分子、ペプチド又はタンパク質の固相合成により産生することができる。
【0061】
用語「ドメイン」は、ポリペプチド又はタンパク質に関して使用される場合、タンパク質中の区別される機能的及び/又は構造的単位を意味する。ドメインは、タンパク質の全体的な役割に寄与する特定の機能又は相互作用を担う場合がある。ドメインは、種々の生物学的コンテクストで存在し得る。類似のドメインは、異なる機能を有するタンパク質中で見出すことができる。或いは、低い配列同一性(すなわち、約50%未満、約40%未満、約30%未満、約20%未満、約10%未満、約5%未満、又は約1%未満の配列同一性)を有するドメインは、同一の機能を有し得る。
【0062】
ポリペプチド又はタンパク質に関して使用される場合、用語「モチーフ」は、一般的に、タンパク質の機能に重要であり得る、典型的には長さが20アミノ酸より短い保存アミノ酸残基の組を指す。特定の配列モチーフは、様々なタンパク質において、特定の細胞内位置に対するタンパク質の結合又は標的化などの一般的な機能を媒介することができる。モチーフの例としては、核局在化シグナル、マイクロボディ標的化モチーフ、分泌を防止又は促進するモチーフ並びにタンパク質の認識及び結合を促進するモチーフが挙げられるが、これらに限定されない。モチーフデータベース及び/又はモチーフ検索ツールは、当該分野で公知であり、これとしては、例えば、PROSITE(expasy.ch/sprot/prosite.html)、Pfam(pfam.wustl.edu)、PRINTS(biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS/PRINTS.html)、及びMinimotif Minerが挙げられる。
【0063】
本明細書で使用するとき、「操作された」タンパク質とは、タンパク質中に所望の特性を達成するための1つ以上の改変を含むタンパク質を意味する。例示的な改変としては、挿入、欠失、置換、及び/又は別のドメイン若しくはタンパク質との融合が挙げられるが、これらに限定されない。「融合タンパク質」(「キメラタンパク質」とも呼ばれる)は、典型的には2つの別個の遺伝子によってコードされる少なくとも2つのドメインを含むタンパク質であり、それらが単一のユニットとして転写及び翻訳されるように結合され、これにより、各ドメインの機能特性を有する単一のポリペプチドが生成される。本開示の操作されたタンパク質としては、ヌクレアーゼ及び融合タンパク質、例えばCasヌクレアーゼ及び逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼが挙げられる。
【0064】
いくつかの実施形態では、操作されたタンパク質は、野生型タンパク質から生成される。本明細書で使用する場合、「野生型」タンパク質又は核酸は、天然の未改変タンパク質又は核酸である。例えば、野生型Cas9タンパク質は、生物であるストレプトコッカス・ピオゲネス(Streptococcus pyogenes)から単離することができる。野生型は、「変異型」と対比され得、変異型は、タンパク質又は核酸のアミノ酸及び/又はヌクレオチド配列中に1つ以上の改変を含む。いくつかの実施形態では、操作されたタンパクは、実質的に、野生型タンパク質と同一の活性、例えば、野生型タンパク質の約80%超、約85%超、約90%超、約95%%超、又は約99%超の活性を有し得る。いくつかの実施形態では、本明細書で記載される融合タンパク質のCasヌクレアーゼは、実質的に、野生型Casヌクレアーゼと同一の活性を有する。
【0065】
本明細書において使用される用語「配列類似性」又は「%類似性」は、核酸配列間又はアミノ酸配列間の同一性又は対応性の程度を指す。ポリヌクレオチドの文脈において、「配列類似性」は、1つ以上のヌクレオチド塩基の変化が1つ以上のアミノ酸の置換をもたらすが、ポリヌクレオチドによってコードされるタンパク質の機能的特性に影響しない核酸配列を指す。また、「配列類似性」は、結果として生じる転写産物の機能的特性に実質的に影響しないポリヌクレオチドの改変、例えば、1つ以上のヌクレオチド塩基の欠失又は挿入を指し得る。したがって、本開示は、特定の例示的な配列よりも多くのものを包含することが理解される。ヌクレオチド塩基の置換を形成する方法は、コードされるポリペプチドの生物活性の保持を判定する方法と同様に、既知である。
【0066】
更に、当業者であれば、本開示によって包含される類似のポリヌクレオチドが、ストリンジェントな条件下で、本明細書中で例示される配列とハイブリダイズする能力によっても定義されることを認識する。本開示の類似のポリヌクレオチドは、本明細書中で開示されるポリヌクレオチドと、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約99%、少なくとも約99%、又は約100%同一である。
【0067】
ポリペプチドの文脈において、「配列類似性」は、アミノ酸の約40%超が同一であり、又はアミノ酸の約60%超が機能的に同一である2つ以上のポリペプチドを指す。「機能的に同一」又は「機能的に類似の」アミノ酸は、化学的に類似の側鎖を有する。例えば、アミノ酸は、機能的類似性に従って以下のようにグループ分けすることができる:
正荷電側鎖:Arg、His、Lys;
負荷電側鎖:Asp、Glu;
極性非荷電側鎖:Ser、Thr、Asn、Gln;
疎水性側鎖:Ala、Val、Ile、Leu、Met、Phe、Tyr、Trp;
その他:Cys、Gly、Pro。
【0068】
いくつかの実施形態では、本開示の類似のポリペプチドは、約40%、少なくとも約40%、約45%、少なくとも約45%、約50%、少なくとも約50%、約55%、少なくとも約55%、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%、又は約100%同一であるアミノ酸を有する。
【0069】
いくつかの実施形態では、本開示の類似のポリペプチドは、約60%、少なくとも約60%、約65%、少なくとも約65%、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%、又は約100%機能的に同一であるアミノ酸を有する。
【0070】
配列類似性は、当該分野において既知の方法を使用する配列アラインメント、例えばBLAST、MUSCLE、Clustal(ClustalW及びClustalXを含む)、及びT-Coffee(異型、例えばM-Coffee、R-Coffee、及びExpressoを含む)によって判定することができる。
【0071】
ポリヌクレオチド又はポリペプチド配列が指定された比較ウィンドウで整列されている場合に、ポリヌクレオチド又はポリペプチドの同一性パーセントを決定することができる。いくつかの実施形態では、2つ以上の配列の特定の一部のみをアラインして配列同一性が決定される。いくつかの実施形態では、2つ以上の配列の特定のドメインのみをアラインして配列類似性が判定される。比較ウィンドウは、配列をアラインして比較することができる少なくとも10個~1000個超の残基、少なくとも20~約1000個の残基、又は少なくとも50~500個の残基のセグメントであり得る。配列同一性の判定のためのアラインメント方法は周知であり、公的に利用可能なデータベース、例えばBLASTを使用して実行することができる。例えば、いくつかの実施形態では、2つのアミノ酸配列の「パーセント同一性」は、Karlin and Altschul,Proc Nat Acad Sci USA 90:5873-5877(1993)のとおり修正されたKarlin and Altschul,Proc Nat Acad Sci USA 87:2264-2268(1990)のアルゴリズムを用いて判定される。そのようなアルゴリズムは、BLASTプログラム、例えばAltschul et al.,J Mol Biol,215:403-410(1990)に記載されるBLAST+又はNBLAST及びXBLASTプログラム中に組み込まれている。BLASTタンパク質検索は、プログラム、例えば、XBLASTプログラム、スコア=50、ワード長さ=3により実行されて、本開示のタンパク質分子と相同であるアミノ酸配列を得ることができる。2つの配列間にギャップが存在する場合、Gapped BLASTを、Altschul et al.,Nucleic Acids Res 25(17):3389-3402(1997)に記載のとおり利用することができる。BLAST及びGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、XBLAST及びNBLAST)のデフォルトパラメータを使用することができる。
【0072】
いくつかの実施形態では、ポリペプチド又はポリヌクレオチドは、本明細書中で提供される参照ポリペプチド又はポリヌクレオチド(又は参照ポリペプチド又はポリヌクレオチドの断片)と、70%、少なくとも70%、75%、少なくとも75%、80%、少なくとも80%、85%、少なくとも85%、90%、少なくとも90%、95%、少なくとも95%、97%、少なくとも97%、98%、少なくとも98%、99%、少なくとも99%、又は100%の配列同一性を有する。いくつかの実施形態では、ポリペプチド又はポリヌクレオチドは、本明細書中で提供される参照ポリペプチド又はポリヌクレオチド(又は参照ポリペプチド又は核酸分子の断片)と、約70%、少なくとも約70%、約75%、少なくとも約75%、約80%、少なくとも約80%、約85%、少なくとも約85%、約90%、少なくとも約90%、約95%、少なくとも約95%、約97%、少なくとも約97%、約98%、少なくとも約98%、約99%、少なくとも約99%、又は約100%の配列同一性を有する。
【0073】
本明細書で使用する場合、「複合体」は、2つ以上の会合しているポリヌクレオチド及び/又はポリペプチドの群を指す。複合体形成の文脈において、用語「会合する」又は「会合」は、共有結合することなく、静電的、疎水性/親水性、及び/又は水素結合相互作用を介して互いに結合した分子を指す。互いに共有結合した異なる部分を含む分子が知られている。いくつかの実施形態では、複合体は、複合体の全ての成分が一緒に存在する場合に形成され、すなわち、自己集合複合体である。いくつかの実施形態では、複合体は、複合体の異なる成分間の化学的相互作用、例えば、水素結合などを介して形成される。いくつかの実施形態では、ポリヌクレオチド、例えばRNAポリヌクレオチドは、タンパク質又はポリペプチドによるポリヌクレオチドの二次構造認識を通じて、タンパク質又はポリペプチド、例えばRNA誘導タンパク質と複合体を形成する。
【0074】
融合タンパク質
本開示の融合タンパク質は、野生型Casヌクレアーゼに比べて向上した遺伝子編集効率を提供する。
【0075】
いくつかの実施形態では、本開示は、(i)Casヌクレアーゼと、(ii)逆転写酵素、又はDNAポリメラーゼ、又はDNAリガーゼと、を含む融合タンパク質であって、Casヌクレアーゼが、二本鎖ポリヌクレオチド開裂を生成することができる融合タンパク質を提供する。
【0076】
本明細書で記載されるとおり、融合タンパク質は、典型的には、異なる機能を有する少なくとも2つのドメインを含む。いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼを含む。一般に、Casヌクレアーゼは、CRISPR/Cas系の一部である。本明細書で記載されるとおり、CRISPR/Cas系は、部位特異的ゲノム改変のために利用することができる。CRISPR/Cas系は、Casヌクレアーゼ及びガイドポリヌクレオチド(例えば、ガイドRNA)を含み得る。いくつかの実施形態では、ガイドポリヌクレオチドは、Casヌクレアーゼを結合及び/又は活性化するポリペプチド結合セグメントと、標的配列にハイブリダイズするガイド配列(例えば、crRNA)とを含む。本明細書で使用する場合、「セグメント」とは、分子の一部、セクション、又は領域、例えば、ガイドポリヌクレオチド分子のヌクレオチドの連続ストレッチを指す。「セグメント」の定義は、特に具体的に定義されない限り、特定の数の総塩基対に限定されない。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNAを含む。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNAを含まず、tracrRNAは、CRISPR/Cas系における分離ポリヌクレオチドして提供される。いくつかの実施形態では、tracrRNAは、Casヌクレアーゼを活性化する。いくつかの実施形態では、Casヌクレアーゼの活性化は、ヌクレアーゼ活性を開始又は増加させる。いくつかの実施形態では、Casヌクレアーゼの活性化は、ヌクレアーゼの標的ポリヌクレオチド中の標的配列への結合を含む。
【0077】
CRISPR/Cas系は、系内のヌクレアーゼタンパク質に基づいて、I型~VI型に分類することができる。例えば、Cas9はII型系で見つけることができるが、Cas12はV型系で見つけることができる。各タイプは、更に亜型に分類することができる。例えば、II型は亜型II-A、II-B、及びII-Cを含むことができ、V型は亜型V-A及びV-Bを含むことができる。CRISPR/Cas系及びCasヌクレアーゼの分類は、例えば、Makarova et al.,Methods Mol Biol 1311:47-75(2015);Makarova et al.,The CRISPR Journal Oct 2018;325-336;及びKoonin et al.,Phil Trans R Soc B 374:20180087(2018)で更に議論されている。本明細書に記載のCasヌクレアーゼは、別段の指定がない限り、任意の型又はバリアントを包含することができる。
【0078】
いくつかの実施形態では、Casヌクレアーゼは、二本鎖ポリヌクレオチド開裂、例えば二本鎖DNA開裂を生成することができる。一般に、Casヌクレアーゼは、1つ以上のヌクレアーゼドメイン、例えばRuvC及びHNHなどを含むことができ、二本鎖DNAを開裂することができる。いくつかの実施形態では、Casヌクレアーゼは、RuvCドメインとHNHドメインとを含み、その各々が二本鎖DNAの1本の鎖を開裂する。いくつかの実施形態では、Casヌクレアーゼは、平滑末端を生成する。いくつかの実施形態では、CasヌクレアーゼのRuvC及びHNHは、各DNA鎖を同じ位置で開裂し、それによって平滑末端を生成する。いくつかの実施形態では、Casヌクレアーゼは、粘着末端を生成する。いくつかの実施形態では、CasヌクレアーゼのRuvC及びHNHは、各DNA鎖を異なる位置で開裂(すなわち、「オフセット」で切断)し、それによって粘着末端を生成する。本明細書において使用される用語「粘着末端(cohesive ends)」、「段違い末端」、又は「付着末端(sticky ends)」は、不均等の長さの鎖を有する核酸断片を指す。「平滑末端」と対照的に、粘着末端は、二本鎖核酸(例えば、DNA)上の段違い切断により生成される。付着又は粘着末端は、非対合ヌクレオチド、又は「オーバーハング」、例えば、3’又は5’オーバーハングを有する突出一本鎖を有する。
【0079】
いくつかの実施形態では、Casヌクレアーゼは、Cas9である。Cas9は、本明細書に記載のII型CRISPR/Cas系に見られる。例示的なCas9タンパク質としては、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)、ストレプトコッカス・ミュータンス(Streptococcus mutans)、リステリア・イノキュア(Listeria innocua)、ナイセリア・メニンギティディス(Neisseria meningitidis)、スタフィロコッカス・アウレウス(Staphylococcus aureus)、クレブシエラ・ニューモニアエ(Klebisella pneumoniae)、及びその他多数の細菌由来のCas9タンパク質が挙げられるが、これらに限定されない。更なる例示的なCas9ヌクレアーゼは、例えば、米国特許第8,771,945号明細書、同第9,023,649号明細書、同第10,000,772号明細書、及び同第10,407,697号明細書に記載されている。いくつかの実施形態では、Cas9は、配列番号1のポリペプチドを指す。
【0080】
いくつかの実施形態では、Cas9は、IIB型Cas9である。一般に、IIB型Cas9タンパク質は、本明細書に記載されるように、粘着末端を生成することができる。例示的なIIB型Cas9タンパク質としては、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、パラサテレラ・エクスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、ウォリネラ-サクシノゲネス(Wolinella succinogenes)、及びその他多数の細菌由来のCas9タンパク質が挙げられるが、これらに限定されない。いくつかの実施形態では、IIB型Cas9は、配列決定された腸メタゲノムMH0245_GL0161830.1(MHCas9)由来である。更なるIIB型Cas9タンパク質は、例えば、国際公開第2019/099943号パンフレットに記載されている。
【0081】
いくつかの実施形態では、Cas9は、配列番号1を含む。いくつかの実施形態では、Cas9は、配列番号1に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチド配列を含む。いくつかの実施形態では、本開示は、配列番号1に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、Cas9は、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0082】
いくつかの実施形態では、Casヌクレアーゼは、Cas12である。Cas12ヌクレアーゼは、「Cpf1」又は「C2c1」ヌクレアーゼとして知られることもあり、本明細書に記載のV型CRISPR/Cas系に見られる。Cas12ヌクレアーゼは、典型的には、Cas9ヌクレアーゼよりも小さく、粘着末端を生成することができる。例示的なCas12タンパク質としては、フランシセラ・ノビシダ(Francisella novicida)、アシダミノコッカス種(Acidaminococcus sp.)、ラクノスピラ種(Lachnospiraceae sp.)、プレボテラ種(Prevotella sp.)、及びその他多数の細菌由来のCas12タンパク質が挙げられるが、これらに限定されない。更なるCas12ヌクレアーゼは、例えば米国特許第9,580,701号明細書、米国特許出願公開第2016/0208243号明細書、Zetsche et al.,Cell 163(3):759-771(2015)、及びChen et al.,Science 360:436-439(2018)に記載されている。
【0083】
いくつかの実施形態では、Cas12は、配列番号29を含む。いくつかの実施形態では、Cas12は、配列番号29に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。いくつかの実施形態では、本開示は、配列番号29に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、Cas12は、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0084】
いくつかの実施形態では、Casヌクレアーゼは、Cas14である。もともと古細菌で発見されたCas14ヌクレアーゼは、典型的には、一本鎖DNA(ssDNA)を標的とする小さな酵素であり、PAM配列を必要としない。Cas14は古細菌のDPANN上門に見られ、例えば、Harrington et al.,Science 362:839-842(2018)及び米国特許出願公開第2020/0087640号明細書に更に記載されている。
【0085】
いくつかの実施形態では、Cas14は、配列番号30を含む。いくつかの実施形態では、Cas14は、配列番号30に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。いくつかの実施形態では、本開示は、配列番号30に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、Cas14は、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0086】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼと、逆転写酵素、DNAポリメラーゼ、DNAリガーゼ、又はそれらの組み合わせと、を含む。
【0087】
いくつかの実施形態では、融合タンパク質は、逆転写酵素を含む。逆転写酵素(RTと略されることもある)は、逆転写と呼ばれるプロセスであるRNA鋳型からのDNA(例えば、相補的DNA又はcDNA)を生成するために使用される酵素である。典型的な逆転写反応は、RNA鋳型及びRNA鋳型の末端に結合するプライマーを用いて開始される。いくつかの実施形態では、逆転写酵素は、プライマー(例えばPBS)に結合し、第1のcDNAを提供するプロセスにおいて(例えばRNA鋳型に基づいて)cDNA鎖を合成する。対象とする配列を挿入するためのCasヌクレアーゼ、逆転写酵素、ポリメラーゼ、及びNHEJの使用の例示的で非限定的な概要を図4で提供する。いくつかの実施形態では、RNアーゼ、例えばRNアーゼHは、RNA鋳型を除去する。いくつかの実施形態では、逆転写酵素は、RNアーゼ活性、例えばRNアーゼHを含む。いくつかの実施形態では、次いで、第1のcDNAに相補的なDNA鎖は、DNAポリメラーゼにより合成され、二本鎖配列を生成する。いくつかの実施形態では、逆転写酵素は、DNAポリメラーゼ活性を含む。いくつかの実施形態では、DNA修復メカニズム、例えばNHEJを使用して、対象とする配列を含む二本鎖配列を二本鎖ポリヌクレオチドに挿入することができる。
【0088】
例示的な逆転写酵素としては、AMV逆転写酵素、MMLV(M-MuLV)逆転写酵素、R2逆転写酵素、及びHIV逆転写酵素が挙げられるがこれらに限定されない。いくつかの実施形態では、逆転写酵素は、MMLV逆転写酵素又はR2逆転写酵素である。いくつかの実施形態では、逆転写酵素は、DNAポリメラーゼ活性が可能である。
【0089】
いくつかの実施形態では、融合タンパク質のCasヌクレアーゼは、標的ポリヌクレオチド、例えば標的DNA配列中の標的配列において二本鎖ポリヌクレオチド開裂を生成する。いくつかの実施形態では、開裂されたDNAの1つの鎖は、融合タンパク質の逆転写酵素のためのプライマーとして機能する。いくつかの実施形態では、逆転写酵素のための鋳型配列を含有する鋳型ポリヌクレオチドが提供され、逆転写酵素が第1のcDNAを生成する。いくつかの実施形態では、鋳型配列はRNAである、RNアーゼは鋳型配列を除去する。いくつかの実施形態では、逆転写酵素は、RNアーゼ活性を含む。いくつかの実施形態では、鋳型配列は、分離RNアーゼにより除去される。いくつかの実施形態では、RNアーゼは、RNアーゼHである。いくつかの実施形態では、第1のcDNAに対して相補的なDNA鎖は、DNAポリメラーゼ、例えば分離DNAポリメラーゼ又はDNAポリメラーゼ活性を有する逆転写酵素によって生成される。いくつかの実施形態では、第1のcDNA及び第1のcDNAに相補的なDNA鎖をハイブリダイズして、二本鎖配列を形成する。いくつかの実施形態では、二本鎖配列は、開裂された標的配列に挿入することができる。いくつかの実施形態では、二本鎖配列は、DNA修復経路により、開裂された標的配列に挿入される。いくつかの実施形態では、DNA修復経路は、非相同末端結合(NHEJ)、マイクロホモロジー媒介末端結合(MMEJ)、相同性配向型修復(HDR)、又はそれらの組み合わせである。いくつかの実施形態では、二本鎖配列は、ライゲーションにより、例えばDNAリガーゼを使用して、開裂された標的配列に挿入される。
【0090】
いくつかの実施形態では、逆転写酵素は、配列番号2~3のいずれか1つを含む。いくつかの実施形態では、逆転写酵素は、配列番号2~3のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。いくつかの実施形態では、本開示は、配列番号2~3のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリヌクレオチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、逆転写酵素は、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0091】
いくつかの実施形態では、融合タンパク質は、DNAポリメラーゼを含む。DNAポリメラーゼは、既存の1本のDNA鎖にヌクレオチドを付加することによりDNAを合成する酵素である。いくつかの実施形態では、DNAポリメラーゼは、逆転写酵素によって生成された第1の合成鎖から二本鎖配列を生成する。いくつかの実施形態では、DNAポリメラーゼは、一本鎖DNA鋳型(ssDNA)から二本鎖DNAを生成する。
【0092】
いくつかの実施形態では、融合タンパク質のCasヌクレアーゼは、標的ポリヌクレオチド、例えば標的DNA配列中の標的配列において二本鎖ポリヌクレオチド開裂を生成する。いくつかの実施形態では、鋳型ポリヌクレオチド、例えばssDNA鋳型が提供され、融合タンパク質のDNAポリメラーゼは、ssDNA鋳型から二本鎖配列を生成する。いくつかの実施形態では、二本鎖配列は、開裂された標的配列に挿入することができる。いくつかの実施形態では、二本鎖配列は、DNA修復経路により、開裂された標的配列に挿入される。いくつかの実施形態では、DNA修復経路は、非相同末端結合(NHEJ)、マイクロホモロジー媒介末端結合(MMEJ)、又は相同性配向型修復(HDR)である。いくつかの実施形態では、二本鎖配列は、ライゲーションにより、例えばDNAリガーゼを使用して、開裂された標的配列に挿入される。
【0093】
例示的なDNAポリメラーゼとしては、DNAポリメラーゼ(Pol)I、II、III、IV、及びV;DNAポリメラーゼ(Pol)α、β、λ、γ、σ、μ、δ、ε、η、ι、κ、ζ、θ、Rev1、及びRev3;例えば、Bst、T4、及びΦ29(phi29)DNAポリメラーゼを含む等温DNAポリメラーゼ;並びに例えば、Taq、Pfu、KOD、Tth、及びPwo DNAポリメラーゼを含む熱安定性DNAポリメラーゼが挙げられるが、これらに限定されない。いくつかの実施形態では、DNAポリメラーゼは、DNA修復経路の一部である。いくつかの実施形態では、DNA修復経路DNAポリメラーゼは、Polβ、Polγ、Polσ、又はPolμである。いくつかの実施形態では、DNAポリメラーゼは、Rev3である。DNA修復経路は、本明細書に更に記載される。いくつかの実施形態では、DNAポリメラーゼは、高処理能力を有する、すなわち、DNAポリメラーゼは、単一の結合イベントで多数のヌクレオチドを処理することができる。いくつかの実施形態では、高処理能力のDNAポリメラーゼは、1つの結合事象当たり、100bp超、200bp超、300bp超、400bp超、500bp超、600bp超、700bp超、800bp超、1kp超、5kp超、10kp超、50kb超、又は100kb超が可能である。いくつかの実施形態では、高処理能力のDNAポリメラーゼは、長い鋳型及び高GC含有量などの二次構造を有する配列の合成に有利である。いくつかの実施形態では、高処理能力のDNAポリメラーゼは、Polα、Polδ、Polε、又はΦ29DNAポリメラーゼである。いくつかの実施形態では、DNAポリメラーゼは、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、DNAポリメラーゼμ(ミュー)、DNAポリメラーゼδ(デルタ)、又はDNAポリメラーゼε(イプシロン)である。いくつかの実施形態では、融合タンパク質のDNAポリメラーゼは、DNAポリメラーゼの触媒的に活性な断片又はトランケーションを含む。本明細書で使用する場合、酵素の「触媒的に活性な」断片、トランケーション、又はドメインは、断片又はトランケーションが、全長又は野生型酵素(例えば、DNAポリメラーゼ)と実質的に同じ活性を有することを意味する。いくつかの実施形態では、本明細書の酵素の触媒的に活性な断片、トランケーション、又はドメインは、全長又は野生型酵素(例えば、DNAポリメラーゼ)の活性の約50%、約60%、約70%、約80%、約90%、約100%、約110%、約120%、約130%、約140%、約150%、約160%、約170%、約180%、約190%、約200%、又は200%超を有する。いくつかの実施形態では、本明細書の酵素の触媒的に活性な断片、トランケーション、又はドメインは、全長又は野生型酵素(例えば、DNAポリメラーゼ)と比べて1つ以上の改善された特性、例えば改善された安定性及び/又は処理能力を有する。いくつかの実施形態では、DNAポリメラーゼは、E.コリ(E.coli)DNAポリメラーゼIのKlenow断片である。いくつかの実施形態では、DNAポリメラーゼは、Lee et al.,PNAS(2014),doi:10.1073/pnas.1324001111で記載されるRev3のトランケーションである。
【0094】
いくつかの実施形態では、DNAポリメラーゼは、配列番号4~6のいずれか1つを含む。いくつかの実施形態では、DNAポリメラーゼは、配列番号4~6のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。いくつかの実施形態では、本開示は、配列番号4~6のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、DNAポリメラーゼは、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0095】
いくつかの実施形態では、融合タンパク質は、DNAリガーゼを含む。DNAリガーゼは、ホスホジエステル結合の形成を触媒することにより、DNA鎖の結合を促進する酵素である。DNAリガーゼは、DNA中の一本又は二本鎖切断を修復することができる。いくつかの実施形態では、DNAリガーゼは、一本鎖DNAをライゲートする。いくつかの実施形態では、DNAリガーゼは、二本鎖DNAの平滑末端をライゲートする。いくつかの実施形態では、DNAリガーゼは、二本鎖DNAの粘着末端をライゲートする。いくつかの実施形態では、DNAリガーゼは、二本鎖挿入配列の二本鎖ポリヌクレオチドへの組換えを促進する。いくつかの実施形態では、標的ポリヌクレオチドで2つの二本鎖ポリヌクレオチド開裂が起こる場合(例えば、第1の標的部位及び第2の標的部位で)、DNAリガーゼは二本鎖ポリヌクレオチドの組換えを促進し、それによって第1の標的部位と第2の標的部位の間の配列を除去することができる。
【0096】
いくつかの実施形態では、融合タンパク質のCasヌクレアーゼは、標的ポリヌクレオチド、例えば標的DNA配列中の標的配列において二本鎖ポリヌクレオチド開裂を生成する。いくつかの実施形態では、鋳型ポリヌクレオチド、例えばDNA鋳型が提供され、融合タンパク質のDNAリガーゼは、鋳型ポリヌクレオチドを開裂された標的配列にライゲートする。いくつかの実施形態では、DNA鋳型は、平滑末端を含む二本鎖ポリヌクレオチドである。いくつかの実施形態では、DNA鋳型は、粘着末端を含む二本鎖ポリヌクレオチドである。いくつかの実施形態では、DNA鋳型は、一本鎖ポリヌクレオチドである。
【0097】
例示的なDNAリガーゼとしては、E.コリ(E.coli)DNAリガーゼ、Taq DNAリガーゼ、T4 DNAリガーゼ、T7 DNAリガーゼ、DNAリガーゼI、III、及びIV、並びにAmpligase DNAリガーゼが挙げられるが、これらに限定されない。いくつかの実施形態では、DNAリガーゼは、T4リガーゼである。
【0098】
いくつかの実施形態では、DNAリガーゼは、配列番号7を含む。いくつかの実施形態では、DNAリガーゼは、配列番号7に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。いくつかの実施形態では、本開示は、配列番号7に対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。いくつかの実施形態では、DNAリガーゼは、宿主細胞における発現のためにコドン最適化されたポリヌクレオチドによってコードされる。
【0099】
いくつかの実施形態では、融合タンパク質は、DNA-結合又はRNA-結合ドメインを更に含む。いくつかの実施形態では、融合タンパク質のDNA-結合又はRNA-結合ドメインは、融合タンパク質と鋳型ポリヌクレオチドを互いに近接させる。いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、鋳型ポリヌクレオチドの融合タンパク質への結合を促進する。いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、鋳型ポリヌクレオチド及び融合タンパク質を互いに近接させることにより、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼ反応の効率を改善する。いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、逆転写酵素又はDNAポリメラーゼ反応から生じる二本鎖配列を、開裂された標的配列に組み込む効率を高める。
【0100】
いくつかの実施形態では、融合タンパク質は、DNA-結合ドメインを更に含む。したがって、いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、逆転写酵素、及びDNA-結合ドメインを含む。いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、DNAポリメラーゼ、及びDNA-結合ドメインを含む。いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、DNAリガーゼ、及びDNA-結合ドメインを含む。DNA結合ドメインは、ウイルス、細菌、及び真核生物(哺乳類など)の転写因子の一部として見つけることができる。いくつかの実施形態では、DNA-結合ドメインは、一本鎖DNAに結合する。いくつかの実施形態では、DNA-結合ドメインは、二本鎖DNAに結合する。いくつかの実施形態では、DNA-結合ドメインは、一本鎖及び二本鎖DNAの両方に結合する。二本鎖DNAを結合する例示的なDNA-結合ドメインとしては、ヘリックスターンヘリックス(HTH)、ジンクフィンガー(ZF)、転写活性化様エフェクター(TALE)、核内低分子RNA活性化タンパク質(SNAP)、ロイシンジッパー、ウィングドヘリックス、ヘリックス-ループ-ヘリックス、HMG-box、Wor3、及びOB-foldが挙げられるが、これらに限定されない。一本鎖DNAに結合する例示的なDNA-結合ドメインとしては、T4遺伝子32タンパク質(T4g32)、ウイルス性Repタンパク質などのHUH酵素、及びはるか上流のエレメント結合タンパク質1(FUBP)が挙げられるが、これらに限定されない。更なるDNA-結合ドメインは、例えば、Alberts B et al.Molecular Biology of the Cell.4th edition.New York:Garland Science;2002.DNA-Binding Motifs in Gene Regulatory Proteins;Yesudhas et al.,Genes(Basel)8(8):192(2017);及びVidangos et al.,Biopolymers 99(12):1082-1096(2013)で提供される。いくつかの実施形態では、DNA-結合ドメインは、ジンクフィンガーDNA-結合ドメイン、転写因子、又はアデノ随伴ウイルスRepタンパク質である。いくつかの実施形態では、DNA-結合ドメインは、はるか上流のエレメント結合タンパク質(FUBP)である。
【0101】
いくつかの実施形態では、融合タンパク質は、RNA-結合ドメインを更に含む。したがって、いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、逆転写酵素、及びRNA-結合ドメインを含む。いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、DNAポリメラーゼ、及びRNA-結合ドメインを含む。いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ、DNAリガーゼ、及びRNA-結合ドメインを含む。RNA-結合ドメインは、RNAプロセシングタンパク質の一部として見つけることができ、例えば、RNA生合成、成熟、輸送、細胞局在化、及び安定性に関与している。いくつかの実施形態では、RNA-結合ドメインは、RNA認識モチーフを含む。いくつかの実施形態では、RNA-結合ドメインは、二本鎖RNA-結合モチーフを含む。いくつかの実施形態では、RNA-結合ドメインは、ジンクフィンガーを含む。いくつかの実施形態では、RNA-結合ドメインは、例えば、ヘテロ核リボ核タンパク質K(hnRNPK)などのKHドメインを含む。例示的なRNA-結合ドメインとしては、限定されるものではないが、NOVA1、ADAR、CPSF、TAP/NXF1:p15、ZBP1、Elav、Sxl、tra-2、FOG-1、MOG-1、MOG-4、MOG-5、RNP-4、GLD-1、GLD-3、DAZ-1、PGL1、OMA-1、OMA2、MEC-8、UNC-75、EXC-7、Pumilio、Nanos、FMRP、CPEB、Staufen1、FXR1、及びMCP2が挙げられる。更なるRNA-結合ドメインは、例えば、Lunde et al.,Nat Rev Mol Cell Biol 8(6):479-490(2007)及びGlisovic et al.,FEBS Lett 582(14):1977-1986(2008)で提供される。いくつかの実施形態では、RNA-結合ドメインは、MS2コートタンパク質(MCP2)である。いくつかの実施形態では、RNA-結合ドメインは、KHドメインを含む。いくつかの実施形態では、RNA-結合ドメインは、hnRNPKである。
【0102】
いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、配列番号8~11のいずれか1つを含む。いくつかの実施形態では、DNA-結合又はRNA-結合ドメインは、配列番号8~11のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチド配列を含む。いくつかの実施形態では、本開示は、配列番号8~11のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを提供する。
【0103】
いくつかの実施形態では、本明細書で提供される融合タンパク質は、配列番号18~26のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有する。
【0104】
いくつかの実施形態では、融合タンパク質は、核局在化シグナル(NLS)を更に含む。本明細書で使用する場合、「核局在化シグナル」又は「核局在化配列」(NLS)は、核輸送による細胞核中への輸送のためにタンパク質を「タグ付けする」ポリペプチドを指し、すなわち、NLSを有するタンパク質は、細胞核中に輸送される。典型的には、NLSは、タンパク質表面上で露出される正電荷Lys又はArg残基を含む。例示的な核局在化配列としては、SV40ラージT-抗原、核質、EGL-13、c-Myc及びTUS-タンパク質由来のNLSが挙げられるが、これらに限定されない。いくつかの実施形態では、NLSは、配列PKKKRKV(配列番号14)を含む。いくつかの実施形態では、NLSは、配列AVKRPAATKKAGQAKKKKLD(配列番号29)を含む。いくつかの実施形態では、NLSは、配列PAAKRVKLD(配列番号30)を含む。いくつかの実施形態では、NLSは、配列MSRRRKANPTKLSENAKKLAKEVEN(配列番号31)を含む。いくつかの実施形態では、NLSは、配列KLKIKRPVK(配列番号32)を含む。他の核局在化配列としては、hnRNP A1の酸性M9ドメイン、酵母転写抑制因子Matα2中の配列KIPIK(配列番号33)及びPY-NLSが挙げられるが、これらに限定されない。
【0105】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼドメインを連結するリンカー、並びに逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼを更に含む。いくつかの実施形態では、リンカーは、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼからの立体障害なしにCasヌクレアーゼを配置できるように、十分な長さ及び/又は柔軟性を備えている。いくつかの実施形態では、リンカーは、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼがCasヌクレアーゼからの立体障害なしにそれぞれの反応を実行できるように、十分な長さ及び/又は柔軟性を備えている。いくつかの実施形態では、リンカーは、約3~約100アミノ酸長である。いくつかの実施形態では、リンカーは、約5~約80アミノ酸長である。いくつかの実施形態では、リンカーは、約10~約60アミノ酸長である。いくつかの実施形態では、リンカーは、約20~約50アミノ酸長である。いくつかの実施形態では、リンカーは、約25~約40アミノ酸長である。例示的なリンカー配列は、本明細書に記載されており、例えば、配列番号15~16である。
【0106】
ポリヌクレオチド
いくつかの実施形態では、本開示は:(a)本明細書で提供される融合タンパク質と、(b)融合タンパク質と複合体を形成し、(i)ガイド配列と、(ii)逆転写酵素、又はDNAリポリメラーゼのための鋳型配列と、を含むポリヌクレオチドと、を含む組成物を提供する。
【0107】
いくつかの実施形態では、組成物のポリヌクレオチドは、RNAである。いくつかの実施形態では、ポリヌクレオチドは、ガイドポリヌクレオチドの成分を含む。本明細書で記載されるとおり、CRISPR/Cas系は、ガイドポリヌクレオチド、例えばガイドRNAを含む。いくつかの実施形態では、ガイドポリヌクレオチドは、RNAである。RNAガイドポリヌクレオチドは、本明細書においては、「ガイドRNA」、「gRNA」、又は「DNA-標的化RNA」と称され得る。
【0108】
いくつかの実施形態では、ガイドポリヌクレオチドは、ガイド配列を含む。いくつかの実施形態では、ガイドポリヌクレオチドは、ガイド配列及びポリペプチド-結合セグメントを含む。いくつかの実施形態では、ガイド配列は、標的ポリヌクレオチド中の標的配列とハイブリダイズすることができる。いくつかの実施形態では、ガイドポリヌクレオチドのポリペプチド結合セグメントは、Casヌクレアーゼに結合する。いくつかの実施形態では、ポリペプチド-結合セグメントは、本明細書で提供される融合タンパク質のCasヌクレアーゼに結合する。いくつかの実施形態では、ポリペプチド-結合セグメントは、Casヌクレアーゼを結合及び/又は活性化する。
【0109】
いくつかの実施形態では、組成物のポリヌクレオチドは、標的ポリヌクレオチド中の標的配列とハイブリダイズすることができるガイド配列を含む。いくつかの実施形態では、組成物のポリヌクレオチドは、融合タンパク質のCasヌクレアーゼに結合することができるポリペプチド-結合セグメントを含み、それにより融合タンパク質と複合体を形成する。いくつかの実施形態では、ポリヌクレオチドは、tracrRNAを更に含む。いくつかの実施形態では、組成物は、tracrRNAを含む第2のポリヌクレオチドを更に含む。いくつかの実施形態では、tracrRNAは、Casヌクレアーゼを活性化する。いくつかの実施形態では、Casヌクレアーゼの活性化は、そのヌクレアーゼ活性を開始又は増加させる。いくつかの実施形態では、Casヌクレアーゼの活性化は、ヌクレアーゼの標的配列への結合を含む。いくつかの実施形態では、Casヌクレアーゼは、標的ポリヌクレオチド中の標的配列において二本鎖ポリヌクレオチドを生成する。
【0110】
いくつかの実施形態では、ガイド配列は、約10~約40ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約12~約30ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約15~約20ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30、約31、約32、約33、約34、約35、約36、約37、約38、約39、又は約40ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、標的配列にハイブリダイズするのに十分な長さである。
【0111】
いくつかの実施形態では、組成物のポリヌクレオチドは、鋳型配列を含む。いくつかの実施形態では、鋳型配列は、プライマー-結合配列及び対象とする配列を含む。いくつかの実施形態では、鋳型配列は、標的配列と相同性領域を含む。いくつかの実施形態では、相同性領域は、プライマー-結合配列である。いくつかの実施形態では、鋳型配列は、プライマー-結合配列に続く標的配列に対してミスマッチのヌクレオチドを含む。いくつかの実施形態では、鋳型配列は、プライマー-結合配列に続く標的配列に対して1、2、3、4、5、6、7、8、9、又は10個のミスマッチのヌクレオチドを含む。本明細書で使用する場合、「ミスマッチのヌクレオチド」は、塩基対を形成しないヌクレオチドを指す。いくつかの実施形態では、ミスマッチのヌクレオチドを含む鋳型配列は、ミスマッチのヌクレオチドを含まない鋳型配列に比べて挿入頻度が高い。いくつかの実施形態では、鋳型配列は、標的配列と1つ以上の相同性追加領域を含む。いくつかの実施形態では、鋳型配列は、2つの相同性領域を含む。いくつかの実施形態では、鋳型配列は、少なくとも2つの相同性領域を含む。いくつかの実施形態では、鋳型配列は、5’から3’方向に、第1の相同性領域、対象とする配列、及び第2の相同性領域を含む。いくつかの実施形態では、もう1つの追加相同性領域は、対象とする配列の標的配列への挿入を容易にする。いくつかの実施形態では、鋳型配列は、一本鎖である。いくつかの実施形態では、鋳型配列は、二本鎖である。いくつかの実施形態では、鋳型配列は、DNAを含む。いくつかの実施形態では、対象とする配列は、DNAを含む。いくつかの実施形態では、対象とする配列及びプライマー-結合配列は、DNAを含む。いくつかの実施形態では、鋳型配列は、RNAを含む。いくつかの実施形態では、鋳型配列は、ゼノ核酸(XNA)を含む。本明細書で使用する場合、XNAは、そのポリマー鎖に非天然の骨格を含む核酸を指す。例えば、DNA又はRNA骨格のリボース糖の代わりに、XNAは、ヘキソース、トレオース、グリコール、シクロヘキセニル、デオキシリボースなどを含むことができる。XNAは、例えば、Schmidt,M.(2010),Bioessays 32(4):322-331に更に記載されている。いくつかの実施形態では、鋳型配列は、アプタマーを含む。いくつかの実施形態では、鋳型配列は、逆転写酵素及び/又はDNAポリメラーゼによる対象とする配列の伸長を防止する改変を含む。いくつかの実施形態では、改変は、脱塩基部位(アプリン/アピリミジン部位又はAP部位としても知られる)、トリエチレングリコール(TEG)リンカー、又はその両方を含む。いくつかの実施形態では、改変により、対象とする配列の過度の伸長が防止され、それによって対象とする配列の挿入精度が向上する。
【0112】
融合タンパク質が、Casヌクレアーゼ及び逆転写酵素を含む実施形態では、ポリヌクレオチドは、逆転写酵素のための鋳型配列を含む。いくつかの実施形態では、融合タンパク質のCasヌクレアーゼは、標的ポリヌクレオチド、例えば標的DNA配列中の標的配列において二本鎖ポリヌクレオチド開裂を生成し、開裂されたDNAの1つの鎖は、鋳型配列上のプライマー-結合配列にハイブリダイズし、逆転写酵素が鋳型配列を逆転写するためのプライマーとして機能する。いくつかの実施形態では、対象とする配列は逆転写酵素によって逆転写され、第1のcDNAを生成する。いくつかの実施形態では、第1のcDNAに相補的なDNA鎖はDNAポリメラーゼによって生成され、それによって対象とする配列を含む二本鎖配列を生成する。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、例えば、本明細書に記載されるライゲーション又はDNA修復経路により、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼのための認識部位を更に含み、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼは、二本鎖配列を標的ポリヌクレオチドに組み込む。いくつかの実施形態では、本明細書に記載の鋳型配列上の相同性領域は、対象とする配列を含む二本鎖配列を開裂された標的配列に挿入するのを容易にする。
【0113】
融合タンパク質が、Casヌクレアーゼ及びDNAポリメラーゼを含む実施形態では、ポリヌクレオチドは、DNAポリメラーゼのための鋳型を含む。いくつかの実施形態では、融合タンパク質のCasヌクレアーゼは、標的ポリヌクレオチド、例えば標的DNA配列中の標的配列において二本鎖ポリヌクレオチド開裂を生成し、開裂されたDNAの1つの鎖は、鋳型配列上のプライマー-結合配列にハイブリダイズし、DNAポリメラーゼのためのプライマーとして機能する。いくつかの実施形態では、DNAポリメラーゼは対象とする配列に相補的なDNA鎖を合成し、それにより対象とする配列を含む二本鎖配列を生成する。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、例えば、本明細書に記載されるライゲーション又はDNA修復経路により、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼのための認識部位を更に含み、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼは、二本鎖配列を標的ポリヌクレオチドに組み込む。いくつかの実施形態では、本明細書に記載の鋳型配列上の相同性領域は、対象とする配列を含む二本鎖配列を開裂された標的配列に挿入するのを容易にする。
【0114】
いくつかの実施形態では、鋳型配列は、約10~約25000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約15~約20000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約20~約15000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約25~約10000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約10、約15、約20、約25、約50、約100、約150、約200、約250、約300、約350、約400、約450、約500、約550、約600、約650、約700、約750、約800、約850、約900、約950、約1000、約2500、約5000、約7500、約10000、約15000、約20000、又は約25000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約10ヌクレオチド長超、約15ヌクレオチド長超、約20ヌクレオチド長超、約25ヌクレオチド長超、約30ヌクレオチド長超、約35ヌクレオチド長超、約40ヌクレオチド長超、約45ヌクレオチド長超、又は約50ヌクレオチド長超である。
【0115】
いくつかの実施形態では、プライマー-結合配列は、約3~約50ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約4~約30ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約5~約40ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約7~約30ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約10~約20ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約3、約4、約5、約6、約7、約8、約9、約10、約12、約15、約17、約20、約22、約25、約27、約30、約32、約35、約38、又は約40ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、開裂された標的DNA配列の領域とハイブリダイズするのに十分な長さのものである。
【0116】
いくつかの実施形態では、対象とする配列は、約1~約20000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約2~約17000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約3~約15000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約4~約12000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5~約10000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約10~約9000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約50~約8000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約100~約7000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約200~約6000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約500~約5000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5、約6、約7、約8、約9、約10、約15、約20、約25、約30、約35、約40、約45、約50、約75、約100、約150、約200、約250、約300、約350、約400、約450、約500、約550、約600、約650、約700、約750、約800、約850、約900、約950、約1000、約1250、約1500、約1750、約2000、約2500、約3000、約3500、約4000、約4500、約5000、約5500、約6000、約6500、約7000、約7500、約8000、約8500、約9000、約10000、約12500、約15000、約17500、又は約25000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5ヌクレオチド長超、約10ヌクレオチド長超、約15ヌクレオチド長超、約20ヌクレオチド長超、約25ヌクレオチド長超、約30ヌクレオチド長超、約35ヌクレオチド長超、約40ヌクレオチド長超、約45ヌクレオチド長超、又は約50ヌクレオチド長超である。
【0117】
いくつかの実施形態では、組成物のポリヌクレオチドは、ガイド配列と鋳型配列との間にスペーサーを更に含む。いくつかの実施形態では、スペーサーは、対象とする配列の相補鎖を転写又は合成した後に逆転写酵素又はDNAポリメラーゼが停止されるように、逆転写酵素又はDNAポリメラーゼのための停止配列を含む。いくつかの実施形態では、スペーサーは、2つ以上の停止配列を含む。いくつかの実施形態では、スペーサーは、1つ、2つ、3つ、4つ、5つ、又は5つ超の停止配列を含む。いくつかの実施形態では、複数の停止配列は、逆転写酵素又はDNAポリメラーゼを停止する際の冗長をもたらす。いくつかの実施形態では、停止配列は、逆転写酵素及び/又はDNAポリメラーゼの活性化を阻害する。いくつかの実施形態では、停止配列は、鋳型配列からの逆転写酵素及び/又はDNAポリメラーゼの解離を促進する。
【0118】
いくつかの実施形態では、停止配列は、二次構造を含む。いくつかの実施形態では、二次構造は、逆転写酵素及び/又はDNAポリメラーゼ活性の阻害剤である。いくつかの実施形態では、二次構造は、鋳型配列からの逆転写酵素及び/又はDNAポリメラーゼの解離を促進する。いくつかの実施形態では、二次構造は、ヘアピンループ(ステムループとしても知られる)である。いくつかの実施形態では、二次構造は、シュードノットである。
【0119】
いくつかの実施形態では、スペーサーは、約5~約500ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約10~約400ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約10~約300ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約10~約200ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約20~約150ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約30~約100ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約50~約100ヌクレオチド長である。いくつかの実施形態では、スペーサーは、約5、約10、約15、約20、約25、約30、約35、約40、約45、約50、約75、約100、約110、約120、約130、約140、約150、約160、約170、約180、約190、又は約200ヌクレオチド長である。
【0120】
いくつかの実施形態では、本開示は、(a)本明細書で提供される融合タンパク質と、(b)融合タンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドと、(c)逆転写酵素又はDNAポリメラーゼのための鋳型配列を含む鋳型ポリヌクレオチドと、を含む組成物を提供する。
【0121】
ガイドポリヌクレオチドは、本明細書に記載されている。いくつかの実施形態では、組成物のガイドポリヌクレオチドは、標的配列とハイブリダイズすることができるガイド配列を含む。いくつかの実施形態では、組成物のガイドポリヌクレオチドは、融合タンパク質のCasヌクレアーゼに結合することができるポリペプチド-結合セグメントを含み、それにより融合タンパク質と複合体を形成する。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNAを更に含む。いくつかの実施形態では、組成物は、tracrRNAを含む第3のポリヌクレオチドを更に含む。いくつかの実施形態では、tracrRNAは、Casヌクレアーゼを活性化する。いくつかの実施形態では、Casヌクレアーゼの活性化は、そのヌクレアーゼ活性を開始又は増加させる。いくつかの実施形態では、Casヌクレアーゼの活性化は、ヌクレアーゼの標的配列への結合を含む。
【0122】
いくつかの実施形態では、ガイド配列は、約10~約40ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約12~約30ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約15~約20ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30、約31、約32、約33、約34、約35、約36、約37、約38、約39、又は約40ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、標的配列にハイブリダイズするのに十分な長さである。
【0123】
鋳型ポリヌクレオチドの成分、例えば、逆転写酵素又はDNAポリメラーゼの鋳型配列、プライマー-結合配列、停止配列、対象とする配列、及び/又は追加相同性領域は、本明細書に記載されている。いくつかの実施形態では、鋳型配列は、約10~約25000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約15~約20000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約20~約15000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約25~約10000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約10、約15、約20、約25、約50、約100、約150、約200、約250、約300、約350、約400、約450、約500、約550、約600、約650、約700、約750、約800、約850、約900、約950、約1000、約2500、約5000、約7500、約10000、約15000、約20000、又は約25000ヌクレオチド長である。いくつかの実施形態では、鋳型配列は、約10ヌクレオチド長超、約15ヌクレオチド長超、約20ヌクレオチド長超、約25ヌクレオチド長超、約30ヌクレオチド長超、約35ヌクレオチド長超、約40ヌクレオチド長超、約45ヌクレオチド長超、又は約50ヌクレオチド長超である。
【0124】
いくつかの実施形態では、鋳型配列は、対象とする配列を含む。いくつかの実施形態では、対象とする配列は、約1~約20000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約2~約17000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約3~約15000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約4~約12000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5~約10000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約10~約9000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約50~約8000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約100~約7000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約200~約6000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約500~約5000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5、約6、約7、約8、約9、約10、約15、約20、約25、約30、約35、約40、約45、約50、約75、約100、約150、約200、約250、約300、約350、約400、約450、約500、約550、約600、約650、約700、約750、約800、約850、約900、約950、約1000、約1250、約1500、約1750、約2000、約2500、約3000、約3500、約4000、約4500、約5000、約5500、約6000、約6500、約7000、約7500、約8000、約8500、約9000、約10000、約12500、約15000、約17500、又は約25000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5ヌクレオチド長超、約10ヌクレオチド長超、約15ヌクレオチド長超、約20ヌクレオチド長超、約25ヌクレオチド長超、約30ヌクレオチド長超、約35ヌクレオチド長超、約40ヌクレオチド長超、約45ヌクレオチド長超、又は約50ヌクレオチド長超である。
【0125】
いくつかの実施形態では、鋳型ポリヌクレオチドは、本明細書に記載のプライマー-結合配列を更に含む。いくつかの実施形態では、プライマー-結合配列は、約3~約50ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約4~約30ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約5~約40ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約7~約30ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約10~約20ヌクレオチド長である。いくつかの実施形態では、プライマー-結合配列は、約3、約4、約5、約6、約7、約8、約9、約10、約12、約15、約17、約20、約22、約25、約27、約30、約32、約35、約38、又は約40ヌクレオチド長である。いくつかの実施形態では、ガイド配列は、融合タンパク質のCasヌクレアーゼによって開裂された標的配列をハイブリダイズするのに十分な長さである。
【0126】
いくつかの実施形態では、鋳型ポリヌクレオチドは、本明細書で記載される逆転写酵素又はDNAポリメラーゼのための停止配列を含む。いくつかの実施形態では、鋳型ポリヌクレオチドは、2つ以上の停止配列を含む。いくつかの実施形態では、スペーサーは、1つ、2つ、3つ、4つ、5つ、又は5つ超の停止配列を含む。いくつかの実施形態では、停止配列は、二次構造を含む。いくつかの実施形態では、二次構造は、逆転写酵素及び/又はDNAポリメラーゼ活性の阻害剤である。いくつかの実施形態では、二次構造は、鋳型配列からの逆転写酵素及び/又はDNAポリメラーゼの解離を促進する。いくつかの実施形態では、二次構造は、ヘアピンループ(ステムループとしても知られる)である。いくつかの実施形態では、二次構造は、シュードノットである。
【0127】
融合タンパク質が、DNA-結合又はRNA-結合ドメインを更に含む実施形態では、鋳型ポリヌクレオチドは、DNA-結合又はRNA-結合ドメインに結合することができる配列を更に含む。FUBPについて、例えばジンクフィンガーDNA-結合ドメイン、転写因子、アデノ随伴ウイルスRepタンパク質などのDNA-結合ドメインに結合するためのDNA配列の非限定的な例は、例えば、Bulyk et al.,Proc Natl Acad Sci USA 98(13):7158-7163(2001);Fornes et al.,Nucleic Acids Res 2019;doi:10.1093/nar/gkz1001;Gearing et al.,PLOS One 14(9):e0215495(2019);Wonderling et al.,J Virol 71(3):2528-2534(1997);Benjamin et al.,Proc Natl Acad Sci USA 105(47):18296-18301(2008)、及びHudson et al.,Nat Rev Mol Cell Biol 15(11):749-760(2014)に記載されている。例えばMCP2などのRNA-結合ドメインに結合するためのRNA配列の非限定的な例は、例えば、Castello et al.,Mol Cell 63:696-710(2016);Rube et al.,Nat Comm 7:11025(2016);Peabody et al.,EMBO J 12(2):595-600(1993),及びHudson et al.,Nat Rev Mol Cell Biol 15(11):749-760(2014)に記載されている。
【0128】
いくつかの実施形態では、鋳型ポリヌクレオチドは、対象となる配列を含むアデノ随伴ウイルス(AAV)ベクターを含む。AAVは、対象とする配列を標的細胞に送達するように操作できる非エンベロープウイルスである。例えば、Naso et al.,BioDrugs 31(4):317-334(2017)を参照されたい。いくつかの実施形態では、AAVベクターは、一本鎖DNAである。いくつかの実施形態では、AAVベクターは、逆位末端反復(ITR)、プロモーター、対象とする配列、及びターミネーターを含む。いくつかの実施形態では、AAVベクターは、ITR及び対象とする配列を含む。いくつかの実施形態では、AAVベクターは、ウイルス遺伝子を含まない。いくつかの実施形態では、鋳型ポリヌクレオチドはAAVベクターを含み、融合タンパク質はCasヌクレアーゼ及びDNAポリメラーゼを含む。いくつかの実施形態では、AAVベクターは、約200、約300、約400、約500、約600、約700、約800、約900、約1000、約2000、約3000、約4000、又は約5000ヌクレオチド長である。いくつかの実施形態では、AAVベクター中の対象とする配列は、約10、約20、約30、約40、約50、約60、約70、約80、約90、約100、約200、約300、約400、約500、約600、約700、約800、約900、約1000、約1200、約1500、約1700、約2000、約2200、約2500、約2700、約3000、約3200、約3500、約3700、約4000、約4200、約4500、又は約4700ヌクレオチド長である。
【0129】
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチドを提供する。いくつかの実施形態では、ポリヌクレオチドは、配列番号18~26のいずれか1つに対して少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は約100%の配列同一性を有するポリペプチドをコードする。
【0130】
いくつかの実施形態では、本明細書のポリヌクレオチド、例えば融合タンパク質をコードするポリヌクレオチド、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、並びに/又は鋳型ポリヌクレオチドは、真核細胞での発現のためにコドン最適化されている。いくつかの実施形態では、本明細書のポリヌクレオチドは、細菌細胞中での発現のためにコドン最適化されている。いくつかの実施形態では、本明細書のポリヌクレオチドは、哺乳類細胞中での発現のためにコドン最適化されている。いくつかの実施形態では、本明細書のポリヌクレオチドは、ヒト細胞中での発現のためにコドン最適化されている。本明細書で使用する場合、「コドン最適化」は、組換え又は異種タンパク質発現の収量及び効率を増加させるためにその発現を宿主のtRNA存在量にマッチさせるようにコドンを調整することを指す。コドン最適化法は当該技術分野で公知であり、例えばIntegrated DNA TechnologiesのCodon Optimizationツール、EntelechonからのCodon Usage Table分析ツール、GENEMAKERからのBlue Heronソフトウェア、AptagenからのGene Forgeソフトウェア、並びにDNA Builder、OPTIMIZER、及びOptimumGeneアルゴリズムなどの他のソフトウェアなどのソフトウェアプログラムを使用して、実施されてもよい。
【0131】
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチドを含むベクターを提供する。いくつかの実施形態では、本開示は、融合タンパク質をコードするポリヌクレオチド、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、鋳型ポリヌクレオチド、又はそれらの組み合わせを含むベクターを提供する。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチド並びにガイド配列及び鋳型配列を含むポリヌクレオチドは、単一ベクター上にある。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチド並びにガイド配列及び鋳型配列を含むポリヌクレオチドは、1つ以上のベクター上にある。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチド、ガイドポリヌクレオチド、及び鋳型オリゴヌクレオチドは、単一のベクター上にある。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチド、ガイドポリヌクレオチド、及び鋳型オリゴヌクレオチドは、1つ以上のベクター上にある。
【0132】
様々な種類のベクター、例えば、ウイルス及び非ウイルスベクターが、本明細書で提供される。いくつかの実施形態では、ベクターは、発現ベクターである。いくつかの実施形態では、ベクターは、細菌発現ベクターである。いくつかの実施形態では、ベクターは、哺乳動物発現ベクターである。いくつかの実施形態では、ベクターは、ヒト発現ベクターである。いくつかの実施形態では、ベクターは、植物発現ベクターである。
【0133】
いくつかの実施形態では、ベクターは、ウイルスベクターである。いくつかの実施形態では、ウイルスベクターは、レトロウイルス、アデノ随伴ウイルス、ポックス、バキュロウイルス、ワクシニア、単純ヘルペス、エプスタインバールウイルス、アデノウイルス、ジェミニウイルス、又はカリモウイルスベクターである。いくつかの実施形態では、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスベクターである。アデノウイルス、アデノ随伴ウイルス(AAV)、及びレンチウイルスベクターによるウイルス形質導入(投与は、局所的、標的化、又は全身的であり得る)が、in vivo遺伝子療法のための送達方法として使用されている。ウイルスベクターなどのベクターを細胞に導入する方法(例えばトランスフェクション)は、本明細書に記載される。
【0134】
いくつかの実施形態では、ベクターは、融合タンパク質をコードするポリヌクレオチドに操作可能に連結された調節エレメントを更に含み、ポリヌクレオチドは、ガイド配列及び鋳型配列、ガイドポリヌクレオチド、並びに/又は鋳型ポリヌクレオチドを含む。いくつかの実施形態では、調節エレメントは、細菌プロモーターである。いくつかの実施形態では、調節エレメントは、ウイルスプロモーターである。いくつかの実施形態では、調節エレメントは、哺乳類プロモーターである。いくつかの実施形態では、調節エレメントは、ターミネーターである。調節エレメントは、本明細書で更に記載されている。
【0135】
いくつかの実施形態では、融合タンパク質、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、並びに/又は鋳型ポリヌクレオチドは、送達粒子を介して細胞に導入される。送達粒子は、例えば、本明細書に記載のポリヌクレオチド及びタンパク質などの外因性生体物質を送達するために使用することができる。いくつかの実施形態では、送達粒子は、固体、半固体、エマルション、又はコロイドである。いくつかの実施形態では、送達粒子は、脂質系粒子、リポソーム、ミセル、ベシクル、又はエキソソームである。いくつかの実施形態では、送達粒子は、ナノ粒子である。送達粒子は、例えば、米国特許出願公開第2011/0293703号明細書、同第2012/0251560号明細書、同第2013/0302401号明細書、米国特許第5,543,158号明細書、米国特許第5,855,913号明細書、米国特許第5,895,309号明細書、米国特許第6,007,845号明細書、及び米国特許第8,709,843号明細書に更に記載されている。
【0136】
いくつかの実施形態では、融合タンパク質、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、並びに/又は鋳型ポリヌクレオチドは、ベシクルを介して細胞に導入される。いくつかの実施形態では、ベシクルは、エキソソーム又はリポソームを含む。外因性生体物質を標的細胞に送達するために操作されたベシクルは、例えば、Alvarez-Erviti et al.,Nat Biotechnol 29:341(2011)、El-Andaloussi et al.,Nat Protocols 7:2112-2116(2012)、Wahlgren et al.,Nucleic Acid Res 40(17):e130(2012)、Morrissey et al.,Nat Biotechnol 23(8):1002-1007(2005)、Zimmerman et al.,Nat Letters 441:111-114(2006)、及びLi et al.,Gene Therapy 19:775-780 (2012)に記載されている。
【0137】
細胞
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質を含む細胞を提供する。いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質をコードするポリヌクレオチドを含む細胞を提供する。いくつかの実施形態では、本開示は、融合タンパク質をコードするポリヌクレオチド、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、鋳型ポリヌクレオチド、又はそれらの組み合わせを含む細胞を提供する。いくつかの実施形態では、本開示は、例えば、融合タンパク質をコードするポリヌクレオチド、ガイド配列及び鋳型配列を含むポリヌクレオチド、ガイドポリヌクレオチド、鋳型ポリヌクレオチド、又はそれらの組み合わせを含む本明細書で提供されるベクターを含む細胞を提供する。
【0138】
いくつかの実施形態では、細胞は、細菌細胞である。いくつかの実施形態では、細菌細胞は、実験室株である。このような細菌細胞の例としては、E.コリ(E.coli)、S.アウレウス(S.aureus)、V.コレラ(V.cholerae)、S.ニューモニエ(S.pneumoniae)、B.サブチルス(B.subtilis)、C.クレセンタス(C.crescentus)、M.ジェニタリウム(M.genitalium)、A.フィシェリ(A.fischeri)、シネコシスティス(Synechocystis)、P.フルオレッセンス(P.fluorescens)、A.ビネランジイ(A.vinelandii)、S.コエリカラー(S.coelicolor)が挙げられるが、これらに限定されない。いくつかの実施形態では、細菌細胞は、食料及び/又は飲料の調製に用いられる細菌からなる。こうした細胞の非限定的な例示の属としては、アセトバクター(Acetobacter)、アルスロバクター(Arthrobacter)、バチルス(Bacillus)、ビフィドバクテリウム(Bifidobacterium)、ブラキバクテリウム(Brachybacterium)、ブレビバクテリウム(Brevibacterium)、カルノバクテリウム(Carnobacterium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、グルコナセトバクター(Gluconacetobacter)、ハフニア(Hafnia)、ハロモナス(Halomonas)、Kocuria(コクリア)、ラクトバシラス(Lactobacillus)、(L.アセトトレランス(L.acetotolerans)、L.アシジピスシス(L.acidipiscis)、L.アシドフィルス(L.acidophilus)、L.アリメンタリウス(L.alimentarius)、L.ブレビス(L.brevis)、L.ブチエリ(L.bucheri)、L.カゼイ(L.casei)、L.カルバツス(L.curvatus)、L.ファーメンタム(L.fermentum)、L.ヒルガルジイ(L.hilgardii)、L.ジェンセニイ(L.jensenii)、L.キムチイ(L.kimchii)、L.ラクチス(L.lactis)、L.パラカゼイ(L.paracasei)、L.プランタルム(L.plantarum)及びL.サケイ(L.sakei)を含む)リューコノストック(Leuconostoc)、ミクロバクテリウム(Microbacterium)、ペジオコックス(Pediococcus)、プロピオニバクテリウム(Propionibacterium)、ワイセラ(Weissella)及びザイモモナス(Zymomonas)が挙げられるが、これらに限定されない。
【0139】
いくつかの実施形態では、細胞は、真核細胞である。いくつかの実施形態では、真核細胞は、哺乳類細胞である。いくつかの実施形態では、真核細胞は、動物細胞である。いくつかの実施形態では、真核細胞は、哺乳類細胞である。いくつかの実施形態では、真核細胞は、動物又はヒト細胞、細胞系(cell line)、又は細胞株(cell strain)のものである。動物又は哺乳類の細胞、細胞系、又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)、チャイニーズハムスター卵母(CHO)、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓)、EBX、EB14、EB24、EB26、EB66、又はEbvl3、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS(例えば、COS1及びCOS7)、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解細胞又はハイブリドーマ細胞が挙げられる。いくつかの実施形態では、真核細胞は、CHO細胞である。いくつかの実施形態では、細胞は、CHO-K1細胞、CHO-K1 SV細胞、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO-K1 SV GSノックアウト細胞であり得る。
【0140】
いくつかの実施形態では、真核細胞は、ヒト幹細胞である。幹細胞は、例えば、多能性幹細胞、例として、胚性幹細胞(ESC)、成体幹細胞、誘発された多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。いくつかの実施形態では、細胞は、本明細書に記載の細胞のいずれかの分化形態である。いくつかの実施形態では、真核細胞は、培養下の任意の初代細胞に由来する細胞である。
【0141】
いくつかの実施形態では、真核細胞は、肝細胞、例えばヒト肝細胞、動物肝細胞、又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10-ドナー及び20-ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD-1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague-Dawley、Wistar Han及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
【0142】
いくつかの実施形態では、真核細胞は、植物細胞である。例えば、植物細胞は、作物植物、例えばキャッサバ、トウモロコシ、モロコシ、コムギ又はイネのものであり得る。植物細胞は、藻類、樹木又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの又は作物若しくは穀類植物、生産植物、果実若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば柑橘樹木、例えばオレンジ、グレープフルーツ又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;堅果樹木、例えばアーモンド又はクルミ又はピスタチオ樹木;ナス属の植物、例えばジャガイモ、トマト、ナス、コショウ、パプリカ;ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物、スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;綿、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
【0143】
部位特異的改変の方法
いくつかの実施形態では、本開示は、標的ポリヌクレオチド中の標的配列において部位特異的改変を提供する方法であって、標的ポリヌクレオチドを本明細書で提供される組成物と接触させることを含む方法を提供する。いくつかの実施形態では、組成物は、(a)本明細書で記載される融合タンパク質と、(b)ガイド配列及び鋳型配列を含む本明細書で記載されるポリヌクレオチドと、を含む。いくつかの実施形態では、組成物は、(a)本明細書で記載される融合タンパク質と、(b)本明細書で記載されるガイドポリヌクレオチドと、(c)本明細書で記載される鋳型オリゴヌクレオチドと、を含む。いくつかの実施形態では、標的ポリヌクレオチドは、二本鎖である。いくつかの実施形態では、標的ポリヌクレオチドは、DNAである。
【0144】
例示的な方法は、図1及び2に図示されている。図1A及び1Bは、「NHEJ促進ドメイン」、例えば、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼに融合されたCas9を示す。図1Aでは、「SPRINgRNA」(シングルプライム化挿入ガイドRNA)は、対象とする配列(「ins」)及びプライマー結合部位(PBS)を含む。図1Bでは、融合タンパク質は、DNA又はRNA結合ドメイン(例えば、MCP2、ZF、TALE、FBP、Pumilio、HUH、又はSNAP)を更に含み、PBSを伴う対象とする配列は分離ポリヌクレオチドとして提供される。図1Cは、図1Aに示されるPRINS複合体の作用メカニズムを示す。Cas9ヌクレアーゼは、標的ポリヌクレオチドに二本鎖開裂を生成する。PBS及び対象とする配列を含有するCas9複合体中の鋳型配列を使用して、対象とする配列を複製する。次いで、生成された二本鎖配列を、NHEJにより開裂された標的ポリヌクレオチドにライゲートすることができる。
【0145】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ及び逆転写酵素を含む。いくつかの実施形態では、鋳型配列は、RNAを含む。いくつかの実施形態では、組成物中のポリヌクレオチドのガイド配列又はガイドポリヌクレオチドは、標的配列にハイブリダイズすることができる。いくつかの実施形態では、ガイド配列及び標的配列をハイブリダイズすることにより融合タンパク質を標的配列に誘導する。いくつかの実施形態では、方法の接触工程は、Casヌクレアーゼが標的配列において二本鎖ポリヌクレオチド開裂を生成するのに十分な条件下で行われる。いくつかの実施形態では、開裂された標的配列の1つの鎖は、逆転写酵素のためのプライマーである。いくつかの実施形態では、組成物中のポリヌクレオチドの鋳型配列又は鋳型ポリヌクレオチドは、プライマーに結合することができるプライマー-結合部位を含む。いくつかの実施形態では、鋳型配列は、対象とする配列を含む。いくつかの実施形態では、方法の接触工程は、逆転写酵素が標的配列にハイブリダイズされたプライマー-結合配列を認識し、対象とする配列の相補鎖を逆転写して第1のcDNAを生成するのに十分な条件下で行われる。いくつかの実施形態では、DNAポリメラーゼは、第1のcDNAに相補的なDNA鎖を合成する。いくつかの実施形態では、DNAポリメラーゼが第1のcDNAに相補的なDNA鎖を合成し、それによって対象とする配列を含む二本鎖配列を生成することができるように、鋳型配列はRNアーゼによって第1のcDNAから除去される。逆転写酵素がRNアーゼ活性が可能であるいくつかの実施形態では、鋳型配列は逆転写酵素により除去される。いくつかの実施形態では、方法は、RNアーゼを提供して鋳型配列を除去することを更に含む。いくつかの実施形態では、RNアーゼはRNアーゼHである。RNアーゼHは、DNAにハイブリダイズされるRNAを特異的に加水分解することができる。
【0146】
いくつかの実施形態では、RNアーゼ、例えばRNアーゼHによる第1のcDNAからの鋳型配列の除去、例えば消化又は開裂後、DNAポリメラーゼは、第1のcDNAに相補的なDNA鎖を生成し、それによって対象とする配列を含む二本鎖配列を生成する。逆転写酵素がDNAポリメラーゼ活性が可能であるいくつかの実施形態では、第1のcDNAに相補的なDNA鎖は、逆転写酵素によって生成される。方法が細胞中で行われるいくつかの実施形態では、第1のcDNAに相補的なDNA鎖は、細胞中のネイティブなDNAポリメラーゼによって生成される。方法がin vitroで行われるいくつかの実施形態では、方法は、DNAポリメラーゼを提供して第1のcDNAに相補的なDNA鎖を生成することを更に含む。いくつかの実施形態では、第1のcDNA及び第1のcDNAに相補的なDNA鎖はハイブリダイズして、対象とする配列を含む二本鎖配列を形成する。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、開裂された標的配列に挿入することができる。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNA修復経路、例えば非相同末端結合(NHEJ)により、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNAリガーゼにより、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼのための認識部位を更に含み、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼは、二本鎖配列を標的ポリヌクレオチドに組み込む。いくつかの実施形態では、本明細書に記載の鋳型配列上の相同性領域は、対象とする配列を含む二本鎖配列を開裂された標的配列に挿入するのを容易にする。
【0147】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ及びDNAポリメラーゼを含む。いくつかの実施形態では、鋳型配列は、DNAを含む。いくつかの実施形態では、鋳型配列は、一本鎖DNA(ssDNA)を含む。いくつかの実施形態では、組成物中のポリヌクレオチドのガイド配列又はガイドポリヌクレオチドは、標的配列にハイブリダイズすることができる。いくつかの実施形態では、ガイド配列及び標的配列をハイブリダイズすることにより融合タンパク質を標的配列に誘導する。いくつかの実施形態では、方法の接触工程は、Casヌクレアーゼが標的配列において二本鎖ポリヌクレオチド開裂を生成するのに十分な条件下で行われる。いくつかの実施形態では、開裂された標的配列の1つの鎖は、DNAポリメラーゼのためのプライマーである。いくつかの実施形態では、組成物中のポリヌクレオチドの鋳型配列又は鋳型ポリヌクレオチドは、プライマーに結合することができるプライマー-結合部位を含む。いくつかの実施形態では、鋳型配列は、対象とする配列を含む。いくつかの実施形態では、方法の接触工程は、DNAポリメラーゼが標的配列にハイブリダイズされたプライマー-結合配列を認識し、対象とする配列を含む二本鎖配列を生成するのに十分な条件下で行われる。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、開裂された標的配列に挿入することができる。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNA修復経路、例えば非相同末端結合(NHEJ)により、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNAリガーゼにより、開裂された標的配列に挿入される。いくつかの実施形態では、対象とする配列を含む二本鎖配列は、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼのための認識部位を更に含み、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼは、二本鎖配列を標的ポリヌクレオチドに組み込む。いくつかの実施形態では、本明細書に記載の鋳型配列上の相同性領域は、対象とする配列を含む二本鎖配列を開裂された標的配列に挿入するのを容易にする。
【0148】
いくつかの実施形態では、方法は、標的ポリヌクレオチド中の第2の標的配列において第2の二本鎖ポリヌクレオチド開裂を生成することを更に含む。いくつかの実施形態では、第2の標的配列は、標的配列の上流である。いくつかの実施形態では、第2の標的配列は、標的配列の下流である。いくつかの実施形態では、第2の二本鎖ポリヌクレオチド開裂は、第2のCasヌクレアーゼによって生成される。いくつかの実施形態では、例えば、逆転写酵素及び/又はDNAポリメラーゼによって生成された対象とする配列を含む二本鎖配列の一端は、開裂された標的配列と結合され、二本鎖配列の他端は、開裂された第2の標的配列と結合され、それにより、標的配列と第2の標的配列との間で標的ポリヌクレオチドの配列を置換する。そのような実施形態は、図1Dに例示されている。Cas9ヌクレアーゼは、標的ポリヌクレオチドに二本鎖切断を生成する。PBS及び対象とする配列を含有するCas9複合体中の鋳型配列を使用して、対象とする配列を複製する。次いで、生成された二本鎖配列は、NHEJによって、第2のCRISPR/Cas複合体によって下流で生成された別の切断にライゲートすることができる。2つのCRISPR/Cas複合体の間の標的ポリヌクレオチド上の配列は、対象となる配列に置換される。
【0149】
いくつかの実施形態では、対象とする配列を含む二本鎖配列は、DNA修復経路により、開裂された標的配列に挿入される。方法が細胞中で行われる実施形態では、二本鎖配列は、細胞固有のDNA修復経路成分によって標的配列に挿入される。DNA修復経路としては、非相同末端結合(NHEJ)経路、マイクロホモロジー媒介末端結合(MMEJ)経路、及び相同性配向型修復(HDR)経路が挙げられる。NHEJは相同な鋳型を必要としない。一般に、NHEJは、HDRと比較して高い修復効率を有するものの、忠実度は低いが、二本鎖切断が適合性のある粘着末端又はオーバーハングを有する場合、誤りは低減する。二本鎖切断の両側にミクロ相同性(例えば、約2~約10塩基対)を有するMMEJ。HDRは修復を指示するために相同な鋳型を必要とし、HDR修復は、典型的には、NHEJ及びMMEJと比較して忠実度は高いが、効率が低くなる。いくつかの実施形態では、方法は、非相同末端結合(NHEJ)に十分な条件下で行われる。
【0150】
いくつかの実施形態では、例えば、逆転写酵素及び/又はDNAポリメラーゼによって生成された対象とする配列を含む二本鎖配列は、ライゲーションにより開裂された標的配列に挿入される。いくつかの実施形態では、ライゲーションは、リガーゼ、例えば、DNAリガーゼによって行われる。いくつかの実施形態では、方法は、リガーゼを提供することを更に含む。リガーゼは、本明細書に更に記載されている。いくつかの実施形態では、リガーゼは、T4DNAリガーゼである。
【0151】
いくつかの実施形態では、例えば、逆転写酵素及び/又はDNAポリメラーゼによって生成された対象とする配列を含む二本鎖配列は、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼの認識部位を更に含む。いくつかの実施形態では、エンドヌクレアーゼ、トランスポザーゼ、又はリコンビナーゼは、二本鎖配列を標的ポリヌクレオチドに組み込む。エンドヌクレアーゼ、トランスポザーゼ、及びリコンビナーゼによる配列組み込みのメカニズムは、当業者に公知であり、例えば、Carlson et al.,Mol Microbiol 27(4):671-676(1998)、Nesmelova et al.,Adv Drug Deliv Rev 62:1187-1195(2010)、及びHallet et al.,FEMS Microbiol Rev 21(2):157-178(1997)に更に記載されている。
【0152】
いくつかの実施形態では、融合タンパク質は、Casヌクレアーゼ及びDNAリガーゼを含み、組成物は、二本鎖鋳型ポリヌクレオチドを含み、二本鎖鋳型ポリヌクレオチドは、対象となる配列を含む。いくつかの実施形態では、組成物中のポリヌクレオチドのガイド配列又はガイドポリヌクレオチドは、標的配列にハイブリダイズすることができる。いくつかの実施形態では、ガイド配列及び標的配列をハイブリダイズすることにより融合タンパク質を標的配列に誘導する。いくつかの実施形態では、方法の接触工程は、Casヌクレアーゼが標的配列において二本鎖ポリヌクレオチド開裂を生成するのに十分な条件下で行われる。いくつかの実施形態では、二本鎖鋳型ポリヌクレオチドは、ライゲーションにより、開裂された標的配列に挿入することができる。いくつかの実施形態では、鋳型配列及び開裂された標的配列は相補的な粘着末端を含み、DNAリガーゼは粘着末端をライゲートすることができる。いくつかの実施形態では、鋳型配列及び開裂された標的配列は、平滑末端を含み、DNAリガーゼは平滑末端をライゲートすることができる。いくつかの実施形態では、方法の接触工程は、DNAリガーゼが対象とする配列を含む鋳型配列を開裂された標的配列にライゲートするのに十分な条件下で行われ、それにより、鋳型配列を開裂された標的配列に組み込む。リガーゼは、本明細書に更に記載されている。いくつかの実施形態では、リガーゼは、T4DNAリガーゼである。いくつかの実施形態では、融合タンパク質はCasヌクレアーゼ及びDNAリガーゼを含み、鋳型配列は対象となる配列及びプライマー-結合配列を含み、方法は標的ポリヌクレオチドを逆転写酵素と接触させることを更に含む。いくつかの実施形態では、逆転写酵素は、対象とする配列の相補鎖を逆転写し、それによって、本明細書に記載の対象とする配列を含む二本鎖配列を形成する。いくつかの実施形態では、融合タンパク質のDNAリガーゼは、二本鎖配列を開裂された標的配列にライゲートする。
【0153】
組成物がガイド配列及び鋳型配列を含むポリヌクレオチドを含むいくつかの実施形態では、鋳型配列は、開裂部位及び融合タンパク質に近接している。組成物が鋳型ポリヌクレオチドを含むいくつかの実施形態では、融合タンパク質は、鋳型ポリヌクレオチドを結合するためのDNA-結合ドメイン又はRNA-結合ドメインを更に含み、それにより、鋳型配列を開裂部位及び融合タンパク質に近接するようにする。いくつかの実施形態では、鋳型配列が融合タンパク質に近接していると、逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼの活性が促進される。いくつかの実施形態では、鋳型配列が開裂部位に近接していると、逆転写酵素又はDNAポリメラーゼ反応から生じる二本鎖配列の開裂された標的配列への組み込みが促進される。
【0154】
いくつかの実施形態では、本方法は、開裂された標的配列に近接して二本鎖配列を提供することによって、二本鎖配列を開裂された標的配列に組み込む効率を向上させる。いくつかの実施形態では、本方法は、開裂された標的配列のリライゲーションを低減することによって、二本鎖配列を開裂された標的配列に組み込む効率を向上させる。いくつかの実施形態では、本方法は、二本鎖開裂を生成するために融合逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼなしでCasヌクレアーゼを利用する方法と比較して、改善された効率を有する。いくつかの実施形態では、本方法は、二本鎖開裂を生成するために融合逆転写酵素、DNAポリメラーゼ、又はDNAリガーゼなしでCasヌクレアーゼを利用する方法と比較して、少なくとも2倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、少なくとも150倍、若しくは少なくとも200倍、又はそれ以上の効率を有する。いくつかの実施形態では、本方法は、対象となる配列を開裂された標的配列に近接させない方法と比較して、改善された効率を有する。いくつかの実施形態では、本方法は、対象となる配列を開裂された標的配列に近接させない方法と比較して、少なくとも2倍、少なくとも5倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、少なくとも150倍、若しくは少なくとも200倍、又はそれ以上の効率を有する。
【0155】
いくつかの実施形態では、本方法は、対象となる長い配列を標的配列に挿入することができる。例えば、本方法は、逆転写酵素又はDNAポリメラーゼがそのような長さの配列を生成する能力を有する限り、約10,000ヌクレオチド長の配列を標的配列に挿入することができる。高処理能力を有する逆転写酵素及びDNAポリメラーゼの例が、本明細書で提供される。いくつかの実施形態では、対象とする配列は、約5ヌクレオチド長超、約10ヌクレオチド長超、約15ヌクレオチド長超、約20ヌクレオチド長超、約25ヌクレオチド長超、約30ヌクレオチド長超、約35ヌクレオチド長超、約40ヌクレオチド長超、約45ヌクレオチド長超、又は約50ヌクレオチド長超である。いくつかの実施形態では、対象とする配列は、約1~約20000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約2~約17000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約3~約15000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約4~約12000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約5~約10000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約10~約9000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約50~約8000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約100~約7000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約200~約6000ヌクレオチド長である。いくつかの実施形態では、対象とする配列は、約500~約5000ヌクレオチド長である。
【0156】
いくつかの実施形態では、方法は、in vitroで行われる。いくつかの実施形態では、方法は、細胞中で行われる。細胞の例は、本明細書で提供される。
【0157】
キット
いくつかの実施形態では、本開示は、本明細書で提供される融合タンパク質を含むキットを提供する。いくつかの実施形態では、キット中の融合タンパク質は、融合タンパク質をコードするポリヌクレオチドとして提供される。いくつかの実施形態では、融合タンパク質をコードするポリヌクレオチドは、ベクター、例えば本明細書で記載のベクター上に提供される。
【0158】
いくつかの実施形態では、キットは、融合タンパク質と複合体を形成するポリヌクレオチドを更に含む。いくつかの実施形態では、ポリヌクレオチドは、tracrRNAを含む。いくつかの実施形態では、融合タンパク質と複合体を形成するポリヌクレオチドは、ベクター、例えば本明細書で記載のベクター上に提供される。
【0159】
いくつかの実施形態では、キットは、逆転写酵素又はDNAポリメラーゼのための鋳型配列を含む鋳型ポリヌクレオチドを更に含む。いくつかの実施形態では、鋳型ポリヌクレオチドは、ベクター、例えば本明細書で記載のベクター上に提供される。
【0160】
いくつかの実施形態では、キットは、tracrRNAを含むポリヌクレオチドを更に含む。いくつかの実施形態では、tracrRNAは、融合タンパク質のCasヌクレアーゼを結合及び/又は活性化する。いくつかの実施形態では、tracrRNAを含むポリヌクレオチドは、ベクター、例えば本明細書で記載のベクター上に提供される。
【0161】
いくつかの実施形態では、キットは、DNAポリメラーゼを更に含む。いくつかの実施形態では、キットは、phi29 DNAポリメラーゼ、DNAポリメラーゼミュー、DNAポリメラーゼデルタ、又はDNAポリメラーゼイプシロンを更に含む。いくつかの実施形態では、キットは、DNAリガーゼを更に含む。いくつかの実施形態では、キットは、T4 DNAリガーゼを更に含む。いくつかの実施形態では、キットは、RNアーゼを更に含む。いくつかの実施形態では、キットは、RNアーゼHを更に含む。
【0162】
いくつかの実施形態では、キットは、融合タンパク質、DNAポリメラーゼ、DNAリガーゼ、及び/又はRNアーゼのための反応緩衝液及び/又は保存緩衝液を更に含む。いくつかの実施形態では、キットは、DNA開裂反応、逆転写酵素反応、DNAポリメラーゼ反応、DNAリガーゼ反応、及び/又はRNase反応を行うための試薬を更に含む。いくつかの実施形態では、試薬は、ATP、dNTP、MgCl、Oligo(dT)、及び/又はRNアーゼ阻害剤を含む。いくつかの実施形態では、キットは、1つ以上の対照、例えば、融合タンパク質のための対照標的ポリヌクレオチドを含む。例えば、対照標的ポリヌクレオチドは、融合タンパク質のCasヌクレアーゼによって一定の効率で特異的に開裂されるように設計することができ、それによってCasヌクレアーゼの活性を較正することができる。
【0163】
いくつかの実施形態では、キットは、1つ以上の容器を含む。いくつかの実施形態では、キットは、消耗品、例えば、方法の1つ以上の工程中にサンプル及び/若しくは試薬を含むように設計されたチューブ、バイアル、又はプレート;液体サンプル及び試薬を移すためのピペット若しくはピペットチップ;方法で使用されるチューブ、バイアル、プレート、及び/若しくはその他の消耗品のカバー及びシール;消耗品を保持するためのラック;サンプルを識別するためのラベル;並びに/又は本明細書に記載の方法のように、キットを利用して標的ポリヌクレオチドの標的配列において部位特異的改変を提供するための説明書を更に含む。
【0164】
本明細書に引用される全ての参考文献、例えば、特許、特許出願、論文、教科書など、及びこれらに引用される参考文献は、それらがまだ引用されていない限りにおいて、その全体が参照により本明細書中に組み込まれる。
【実施例
【0165】
実施例1.
本実施例では、Cas9及び逆転写酵素に融合したCas9(「PRINS」)を、対応するガイドRNAとともに細胞に導入した。
【0166】
HEK293細胞を、1mLの完全増殖培地(DMEM+10%ウシ胎児血清)に12ウェルプレートの1ウェルあたり2×10細胞の密度でトランスフェクションの前日に播種した。CRISPR複合体成分は、野生型Cas9又はPRINSを発現する0.55μgのプラスミドと、AAVS1遺伝子座を標的とする0.55μgのgRNAを52μLの総量で組み合わせることによって調製した。PRINS用のガイドRNA配列は、配列番号27~28に記載されており、AAVS1部位を標的として、AAGATG配列を挿入する。この混合物に、3.3μLのFUGENE(登録商標)HD試薬を添加した。溶液をピペッティング(約15回)又は簡単なボルテックスによって注意深く混合し、次いで室温で5~10分間インキュベートした。細胞が入った各ウェルに、50μLの複合体を添加し、ウェルを振盪させた。
【0167】
トランスフェクションの3日後、ゲノムDNAを抽出し、Amplicon-Seqを実施して編集された配列を増幅した。Taheri-Ghahfarokhi et al.,Nucleic Acids Res 46(16):8417-8434(2018)で記載されているように、Amplicon-SeqデータでRational InDel Meta-Analysis(RIMA)を実行し、Cas9誘導の変化を分析した。
【0168】
結果を図3A及び図3Bに示す。図3Aで示されるように、Cas9をトランスフェクトしたほとんどの細胞が、可変長の欠失を有した。図3Bでは、PRINSをトランスフェクトした細胞は、挿入イベントの数が多く(楕円で示される)、Cas9と比較して編集効率が高かった。
【0169】
実施例2.
本実施例では、RTに融合したCas9ニッカーゼ(「PE」)及びRTに融合したCas9(PRINS)は、対応するPE用のプライム編集ガイドRNA(pegRNA)及びPRINS用のシングルプライム化編集挿入ガイドRNA(springRNA)とともに、実施例1に記載のAAVS1部位を標的とする両方を細胞に導入した。PE及びpegRNAは、Anzalone et al.,Nature 576:149-157(2019)に記載されている。要約すると、pegRNAは、標的配列に相補的なガイド配列、及び標的配列と相同な2つの領域が隣接する挿入用配列(AAGATG)を含む鋳型配列を含み、そのうちの1つはプライマー結合配列として機能する。springRNAは、標的配列に相補的なガイド配列、挿入用配列(AAGATG)を含む鋳型配列、及びプライマー-結合配列を含む。
【0170】
図5A及び5Bは、それぞれPRINS/springRNA及びPE/pegRNAの挿入頻度を示す。相対的な編集頻度は断片分析によって決定された(Yang et al.,Nucleic Acids Research 43(9):e59(2015)を参照のこと)。PRINSは42.4%の挿入率で、14.3%の挿入しかなかったPEよりも効率的である。
【0171】
PRINSについてNHEJへの依存性を実証するために、NHEJに関与することが知られている特定のDNA依存性プロテインキナーゼ(DNAPK)のための2.5μMの阻害剤を使用して、同じ実験を繰り返した。図5C及び5Dにおける結果は、それぞれPRINS/springRNA及びPE/pegRNAの挿入頻度を示す。PEではDNAPK阻害の効果は観察されなかったが(図5D)、PRINSはDNAPK阻害剤の存在下で挿入頻度を減少させた(図5C)。
【0172】
実施例3.
本実施例では、RTに融合したCas9ニッカーゼ(「PE」)、RTに融合したCas9(PRINS)は、両方とも、実施例2に記載されているように、AAVS1部位を標的とするpegRNAで試験された。
【0173】
挿入頻度は、実施例2に記載の断片分析によって分析した。図6の結果は、pegRNAがPRINSによる挿入を促進できることを示す。Anzalone et al.,Nature 576:149-157(2019)に記載されているとおり、PRINSは、おそらくPEと同様の方法でpegRNAを利用できる可能性がある。
【0174】
実施例4.PRINS編集対プライム編集の作用メカニズムの決定
本実施例では、PRINS編集のためにRTに融合されたCas9の作用メカニズムを評価し、プライム編集のためにRTに融合されたCas9ニッカーゼのメカニズムと比較した。PRINS編集及びプライム編集がDNA修復に非相同末端結合(NHEJ)を利用するかどうかを判断するために、NHEJ経路の既知の酵素であるDNA依存性プロテインキナーゼ(DNA-PK)の阻害剤を導入した。
【0175】
HEK-T細胞をDNA-PK阻害剤AZD7648で4時間処理した後、実施例2について上述したように、PRINS編集及びプライム編集のための成分をトランスフェクトした。AAVS1遺伝子座への特定の6bp組み込み(AAGATG)の割合は、NGS Amplicon-Seqを使用して評価した。
【0176】
結果を図7に示す。棒グラフは、n=2の平均を標準偏差で表す。「#1」又は「#2」とラベル付けされた棒は、様々なspringRNA(PRINS編集の場合)又は様々なpegRNA(プライム編集の場合)を指す。データは、PRINS媒介組み込みがDNA-PK阻害によって大幅に減少することを示したが、プライム編集は比較的影響を受けなかった。
【0177】
実施例5.DNA及びRNA鋳型配列並びにDNAポリメラーゼ融合物の評価
本実施例では、springRNAは、DNA鋳型配列(「DNAテール」)又はRNA鋳型配列(「RNA テール」)を使用して調製した。Cas9+RT(「PE0」)、Cas9+DNAポリメラーゼD(「PE0 PolD」)、Cas9+Phi29 DNAポリメラーゼ(「PE0 Phi」)、及びCas9対照の融合物を試験した。3つのガイドRNA(1つはRNAテール(「123RNA MS」)を含み、2つはDNAテール(「123DNA」及び「123DNA PS」)を含む)は、Agilentによって合成した。配列を表1に示す。
【0178】
【表1】
【0179】
1日目にFUGENEを使用して融合タンパク質を細胞にトランスフェクトし、2日目にガイドRNAをRNAiMAXでトランスフェクトした。
【0180】
結果を図8~12に示す。図8は、様々なタンパク質による編集効率の概要を示している。すべての融合タンパク質は、Cas9と比較して、DNAテール配列でより高い編集効率を達成した。図9~12の上部、中央、及び下部のパネルは、それぞれ123RNA MSテール、123DNAテール、又は123DNA PSテールを使用した示されたタンパク質(PE0、PE0 PolD、PE0 Phi、又はCas9)の編集パターンを示している。驚くべきことに、DNAテールを含むガイドRNAは、図9に示されるように、PE0を使用して同様の編集パターンを達成した。図10及び11は、DNAポリメラーゼPolD及びPhi29がDNAテールをコピーできるが、RNAテールをコピーできないことを示している。
【0181】
実施例6.ガイド配列の評価
本実施例では、様々なガイド配列が設計され、PRINS編集又はプライム編集によるDNA編集への影響を評価した。本明細書の実施形態で記載されるように、PRINS編集は、単一のPRINSガイドRNA(springRNA)を利用して、特定のゲノム遺伝子座を標的化して改変する。Cas9標的化系のための従来のsgRNAに見られるスペーサー及びスキャホールド配列に加えて、springRNAには、標的DNA鎖にハイブリダイズし、逆転写用のプライマーとして機能するプライマー結合部位(PBS)を含む3’伸長が含まれる。PBSの後には、所望の改変を含むDNA合成鋳型が続く。比較すると、プライム編集ガイドRNA(pegRNA)は、図13に示されるように、DNA合成鋳型に続く追加の相同性領域を含む。
【0182】
PRINS編集及びプライム編集に対する異なるプライマー設計の効果を研究するために、実施例2で上述したように、及び実施例4で上述したようにDNA-PK阻害剤AZD7648の非存在下又は存在下で、HEK-T細胞をPRINS編集及びプライム編集成分で同時トランスフェクトした。
【0183】
結果を図14A及び図14Bに示す。データは、PRINS編集(図14A)及びプライム編集(図14B)を用いたAAVS1遺伝子座への特異的6bp組み込み(AAGATG)のパーセンテージを表す。棒グラフは、n=2の平均を標準偏差で表す。「#1」又は「#2」と標識された棒は、図13に示されるように、異なるspringRNA及びpegRNA設計を指す。結果は、PRINS編集がspringRNA及びpegRNAの両方の設計で機能することを示している。PRINS編集とpegRNA及びDNA-PK阻害剤との組み合わせは、最高の特異的編集をもたらし、同じpegRNAを使用した場合、プライム編集よりも2倍優れていた。プライム編集は、pegRNAで検出可能な改変を生成したが、springRNAでは検出可能な改変を生成しなかった。
【0184】
実施例7.PRINS編集毒性の評価
本実施例では、Cas9編集と比較したPRINS編集の毒性は、二本鎖切断の生成後に誘発される大きな欠失の数を決定することによって評価された。
【0185】
ジフテリア毒素(DT)選択系(例えば、2020年4月12日に出願された米国仮出願第62/833,404号明細書及びPCT/EP2020/060250号明細書に記載されている)を使用して、大きな欠失の量を評価した。図15は、実験設計の概略を示す。要約すると、DT受容体であるHbEGFのイントロンは、PRINS編集又はCas9編集標的として選択された。二重対立遺伝子の大きな欠失のみが、細胞にDT抵抗性を提供し、したがって、DT処理後の細胞生存率は、大きな欠失の量を示す。
【0186】
細胞を、Cas9-RT融合物(PRINS編集、「PE0」)、Cas9、又はCas9ニッカーゼ-RT融合物(プライム編集、「PE2」)、及び3つの異なるガイドRNAでトランスフェクトした。図16の結果は、同量のDNAで同数の細胞をトランスフェクトした後、PE0プレートがCas9プレートと比較してより少ない細胞を示し、PRINS編集による大きな欠失の数が少ないことを示している。PRINS編集による大きな欠失の数は、PE2によるプライム編集に匹敵する。
【0187】
実施例8.外因性鋳型ポリヌクレオチドの評価
本実施例では、PRINS編集又はプライム編集のためのガイドRNAに融合されていない外因性鋳型ポリヌクレオチドの付加を評価した。
【0188】
実験設計の模式図を図17に示す。MS2アプタマーに結合するMCPドメインは、Cas9とRTの間(「PRINS_MS2_v1」)又はRTの下流(「PRINS_MS2_v2」)のいずれかで、PRINS編集に使用されるCas9-RTタンパク質に融合された。逆転写用の鋳型は、ガイドRNAの代わりにMS2アプタマーに融合された。PRINS_MS2、MS2-RT鋳型、及び標的gRNAをHEK-T細胞に同時トランスフェクトし、標的化挿入について試験した。対照gRNA及びgRNAに融合したRT鋳型は、それぞれ陰性対照と陽性対照として機能した。
【0189】
図18の結果は、gRNAに融合したRT鋳型を使用したPRINS編集よりも編集効率が低いにもかかわらず、DNA配列がPRINS編集によって特異的にMS2-RT鋳型からうまく複製及び挿入されたことを示している。
【0190】
実施例9.PRINS編集のためのCas12融合物の評価
本実施例では、Cas12-RT融合タンパク質は、PRINS編集及びプライム編集能力について評価された。
【0191】
RTは、LbCas12(LbCpf1としても知られている)に融合された。ガイドRNAは、EMX1及びDNMT1部位でPRINS編集(springRNA)及びプライム編集(pegRNA)用に設計された。EMX1を標的とする例示的なガイドRNAを図19に示し、以下の配列が含まれ、一重下線は挿入配列を示し、二重下線は相同性配列を示す:
【化1】
【0192】
上記のガイドRNAを使用したEMX1部位での挿入は、表2に示すように決定された。
【0193】
【表2】
【0194】
突然変異の型は、表3に示されるように決定した。
【0195】
【表3】
【0196】
表2及び3の結果は、PRINS編集を使用して、DNA配列が特異的にCas12-RT融合タンパク質によってうまく複製及び挿入されたことを示している。全体の編集効率は約0.25%であった。
【0197】
実施例10.Cas9-DNAポリメラーゼ融合物を用いたPRINS編集
DNAポリメラーゼに融合したCas9は、PRINS編集について評価された。DNAポリメラーゼは、in vitro及びin vivoで逆転写酵素活性を示すことが報告されている(例えば、Ricchetti et al.,EMBO J.12(2):387-396(1993)を参照されたい)。以下に示すように、Cas9、Cas9-RT融合物(「PE0」)、又はDNAポリメラーゼと融合したCas9のいずれかを発現するプラスミドを、AAVS1遺伝子座を標的とするシングルプライム化編集挿入ガイドRNA(springRNA)を発現するプラスミドとともにHEK293T細胞にトランスフェクトした。Cas9-DNAポリメラーゼ融合物には、次のDNAポリメラーゼ構築物が含まれていた:
【0198】
Cas9-Klenow exo:E.コリ(E.coli)DNAポリメラーゼIのコドン最適化Klenow断片;
【0199】
Cas9-Klenow exo:DNAポリメラーゼの3’→5’エキソヌクレアーゼ活性を無効にするD355A及びE357A突然変異を伴うE.コリ(E.coli)DNAポリメラーゼIのコドン最適化Klenow断片;
【0200】
Cas9-REV3:ヒトREV3ポリメラーゼの触媒的に活性なトランケーション、これは、全長REV3(REV TR5と表示:Lee et al.,PNAS(2014),doi:10.1073:pnas.1324001111を参照)と比較して、安定性が高く、発現レベルが高いことが確認された。
【0201】
トランスフェクションの72時間後に細胞を回収した。ゲノムDNAを抽出し、AAVS1遺伝子座をPCRによって増幅し、イルミナシーケンスプラットフォームを使用して配列決定を行った。
【0202】
図20の結果は、3つのCas9-DNAポリメラーゼ融合タンパク質が、PRINS編集が可能であったことを示す。
【0203】
実施例11.Cas9-DNAポリメラーゼ融合物及びキメラspringRNAを用いたPRINS編集
キメラspringRNAは、Cas9、PE0、及びCas9-DNAポリメラーゼ融合タンパク質を用いたPRINS編集で評価された。FUGENE(登録商標)HDを使用して、HEK293T細胞を、Cas9、PEO、又は実施例10に記載の3つのCas9-DNAポリメラーゼ融合タンパク質を発現するプラスミドでトランスフェクトした。24時間後、LIPOFECTAMINE(商標)RNAiMAXを使用して、以下の合成springRNAのうちの1つを2pmol用いて細胞を更にトランスフェクトした:
【0204】
springRNA-全てのRNAヌクレオチド;配列はガイドRNA配列を含む;Cas9を結合するためのtracrRNAスキャホールド;並びにspringRNAの3’にある6-ヌクレオチド挿入配列(「AATATG」)及びプライマー結合部位(PBS);
【0205】
キメラspringRNA DiHP-springRNAについての上記と同じ配列、挿入配列及びPBSの10ヌクレオチドを除く全てのRNAヌクレオチドはデオキシリボヌクレオチドである;
【0206】
キメラspringRNA DiRP-springRNAについての上記と同じ配列、挿入配列を除く全てのRNAヌクレオチドはデオキシリボヌクレオチドである。
【0207】
トランスフェクションの48時間後に細胞を回収した。ゲノムDNAを抽出し、AAVS1遺伝子座をPCRによって増幅し、イルミナシーケンスプラットフォームを使用して配列決定を行った。
【0208】
図21A~Cの結果は、Cas9-DNAポリメラーゼ融合タンパク質が、キメラDNA含有springRNAを使用した場合、PE0に匹敵する効率でPRINS編集が可能であったことを示す。
【0209】
実施例12.Cas9-DNAポリメラーゼ融合物及び改変されたspringRNAを用いたPRINS編集
化学修飾を施した様々なspringRNAをPRINS編集で評価した。FUGENE(登録商標)HDを使用して、HEK293T細胞を、Cas9又はPE0を発現するプラスミドでトランスフェクトした。24時間後、LIPOFECTAMINE(商標)RNAiMAXを使用して、以下のspringRNAのうちの1つを2pmol用いて細胞を更にトランスフェクトした:
【0210】
springRNA-全てのRNAヌクレオチド;配列はガイドRNA配列を含む;Cas9を結合するためのtracrRNAスキャホールド;並びに6-ヌクレオチド挿入配列(「AATATG」)及びspringRNAの3’にあるプライマー結合部位(PBS);
【0211】
脱塩基部位を有するspringRNA-springRNAについての上記と同じ配列、挿入配列の3番目のヌクレオチドがdSpacerヌクレオチド1’2’-ジデオキシリボース(脱塩基部位)に置き換えられていることを除く全てのRNAヌクレオチド;
【0212】
TEGリンカーを有するspringRNA-springRNAについての上記と同じ配列、挿入配列の3番目のヌクレオチドがトリエチレングリコール(TEG)に共有結合されていることを除く全てのRNAヌクレオチド。
【0213】
トランスフェクションの48時間後に細胞を回収した。ゲノムDNAを抽出し、AAVS1遺伝子座をPCRによって増幅し、イルミナシーケンスプラットフォームを使用して配列決定を行った。
【0214】
図22の結果は、化学的に改変されたspringRNAが挿入物の過度の伸長を防ぎ、突然変異誘発の精度を高めることができたことを示している。
【0215】
実施例13.Cas9-DNAリガーゼ融合物を用いたPRINS編集
細胞は、別々の発現プラスミド及びspringRNAを含むプラスミド上でCas9及びRTとトランスフェクトされ、PRINS編集について評価された。図23Aで示されるように、PRINS編集は、依然として、Cas9及びRTタンパク質の同時発現で発生した(アスタリスクは野生型配列を示す)。
【0216】
次いで、DNAリガーゼに融合したCas9は、PRINS編集について評価した。Cas9は、DNA切断の非相同末端結合に関与するDNAリガーゼであるヒト型結核菌(Mycobacterium tuberculosis)LigDに融合された(「Cas9-LigD」)。Cas9-LigD融合タンパク質を発現するプラスミドを、RTを発現するプラスミド及びspringRNAプラスミドと同時トランスフェクトし、PRINS編集について評価した。
【0217】
図23Bの結果は、Cas9-LigD融合タンパク質及びRTの同時トランスフェクションが、Cas9及びRTの同時発現と比較して、所望の配列の挿入を改善したことを示す。
【0218】
実施例14.挿入物及びspringRNAにおけるPBSのミスマッチ
springRNAの5’と3’の間の相同性を低下させるために、springRNAのプライマー結合部位(PBS)にミスマッチが導入され、PBSにアニーリングされた標的DNA鎖の3’末端の間に2つのミスマッチが生じた。典型的には、鋳型との3’ミスマッチが存在する場合、DNAのプライム化効率が低下する。驚くべきことに、図24A~24Bで示されるように、4bp挿入配列(元の6bp配列から2bpミスマッチを差し引いたもの)の挿入は、完全に相補的な6bp挿入の挿入よりも効率的であった。2bpミスマッチを伴う4bp挿入は59.59%の相対挿入効率を有し(図24B)、ミスマッチを伴わない6bp挿入は37.13%の相対挿入効率を有した(図24A)。
【0219】
実施例15.PRINSのDNA修復経路及びプライム編集効率
springRNAを用いたPE0のPRINS編集効率及びpegRNAを用いたPE0のプライム編集効率は、以下のDNA修復遺伝子が部分的に欠損している細胞系で評価された:PRKDC(DNAPKとしても知られる)、LIG4、TP53BP1、PARP1、POLQ、LIG3、及びATM。細胞はまた、DNAPK阻害剤の存在下又は非存在下で培養した。
【0220】
結果は図25に示され、また、これらの遺伝子の欠失又はPRKDCタンパク質の阻害によりPRINS効率が低下したため、PRINS編集はPRKDC及びTP53BP1などのNHEJ経路酵素に依存していることを示す。図25はまた、PRKDC、LIG4、若しくはTP53BP1の阻害又は欠失がより高い挿入効率をもたらしたため、PE0及びpegRNAによるプライム編集がNHEJ酵素と逆相関を有したことを示す。
【0221】
実施例16.PRINS編集のためのII-B型Cas9融合物の評価
II-B型Cas9タンパク質、配列決定された腸メタゲノムMH0245_GL0161830.1由来のCas9(MHCas9)を含む融合タンパク質は、粘着末端(「オーバーハング」)及びMMLV逆転写酵素を生成する。SpringRNAは、MHCas9に結合し、実施例10に記載されたようにAAVS1遺伝子座を標的とする6ヌクレオチド挿入配列を含むように設計された。HEK293T細胞をトランスフェクトし、ゲノムDNAを抽出し、Amplicon-Seqを使用して標的挿入を検出した。
【0222】
図26Aの結果は、MHCas9-RT融合タンパク質が、標的遺伝子座でPRINS媒介挿入をうまく実施したことを示す。最も効率的な挿入物は0.072%の挿入頻度であった。図26Bは、MHCas9-RTによる最も頻繁な10個の編集イベントを示している。RTは挿入配列の挿入を媒介するだけでなく、最も頻繁な3つの編集イベントによって示されるように、MHCas9によって生成されたオーバーハング配列(CCC)も伸長した。
【0223】
実施例17.MHCas9-RT融合物を用いた標的化挿入及び欠失
前の実施例で説明したCas9-RT融合タンパク質(「PE0」)を、pegRNAを使用して標的化された挿入及び欠失を行う能力について評価した。Cas9ニッカーゼ-RT融合物及びpegRNAを利用するプライム編集とは対照的に、pegRNAを用いたPE0は、二本鎖DNA切断を導入するため、プライム編集に関与しない二本鎖DNA切断修復経路によって修復される。PegRNA及びプライム編集は、実施例2及びAnzalone et al.,Nature 576:149-157(2019)に記載されている。
【0224】
HEK293T細胞は、MHCas9-RTを発現するプラスミド及びAAVS1部位を標的とするpegRNAと、前の実施例に記載されるようにトランスフェクトされた。2つの異なるpegRNA構築物を試験した:1)1ヌクレオチドの欠失を提供する構築物;及び2)PAM-3部位でAからGへの置換を生成するための構築物。トランスフェクション後、ゲノムDNAは、前の実施例に記載されているように、NGSによって抽出及び処理された。
【0225】
図27A(AからGへの置換)及び27B(1ヌクレオチドの欠失)の結果は、pegRNAを用いたPE0が置換/挿入及び欠失を誘導できることを示している。図27A及び27Bの棒グラフの濃い灰色の部分は、所望の突然変異を表し、薄い灰色の部分は望ましくない突然変異を表す。実験は、DNAPK阻害剤(DNAPKi)の存在下でも実施され、望ましくない突然変異と比較して所望の突然変異のパーセンテージが増加した。
【0226】
配列
様々なポリヌクレオチド及びポリペプチドの配列を、本明細書で提供する。
【0227】
Cas9ヌクレアーゼのアミノ酸配列(配列番号1)
【化2】
【0228】
Cas12ヌクレアーゼ(LbCas12a)のアミノ酸配列(配列番号29)
【化3】
【0229】
Cas14ヌクレアーゼ(Cas14a1)のアミノ酸配列(配列番号30)
【化4】
【0230】
MMLV逆転写酵素のアミノ酸配列(配列番号2)
【化5】
【0231】
R2逆転写酵素のアミノ酸配列(配列番号3)
【化6】
【0232】
Phi29 DNAポリメラーゼのアミノ酸配列(配列番号4)
【化7】
【0233】
DNAポリメラーゼデルタのアミノ酸配列(配列番号5)
【化8】
【0234】
T4 DNAポリメラーゼのアミノ酸配列(配列番号6)
【化9】
【0235】
T4 DNAリガーゼのアミノ酸配列(配列番号7)
【化10】
【0236】
MEPC2のアミノ酸配列(配列番号8)
【化11】
【0237】
Repタンパク質のアミノ酸配列(配列番号9)
【化12】
【0238】
T4遺伝子32タンパク質のアミノ酸配列(配列番号10)
【化13】
【0239】
FUBPのアミノ酸配列(配列番号11)
【化14】
【0240】
核局在化配列(配列番号12~14)
MKRTADGSEFESPKKKRKV(配列番号12)
SGGSKRTADGSEFEPKKKRKV(配列番号13)
PKKKRKV(配列番号14)
【0241】
リンカー配列(配列番号15~16)
SGGSSGGSSGSETPGTSESATPESSGGSSGGS(配列番号15)
SGGSSGGSSGSETPGTSESATPESSG(配列番号16)
【0242】
REP_Y156F(1-197)-Cas9 P2A EGFPのアミノ酸配列(配列番号17)
【化15】
【0243】
Cas9-MMLV RTのアミノ酸配列(配列番号18)
【化16】
【0244】
MCP2-RTのアミノ酸配列(配列番号19)
【化17】
【0245】
Cas9-Phi29のアミノ酸配列(配列番号20)
【化18】
【0246】
Cas9-PolDのアミノ酸配列(配列番号21)
【化19】
【0247】
Cas9-R2 RTのアミノ酸配列(配列番号22)
【化20】
【0248】
Cas9-T4 DNAリガーゼのアミノ酸配列(配列番号23)
【化21】
【0249】
Cas9-MCP2 MMLV RTのアミノ酸配列(配列番号24)
【化22】
【0250】
Cas9-T4 DNA Polのアミノ酸配列(配列番号25)
【化23】
【0251】
T4gp32-FUBPのアミノ酸配列(配列番号26)
【化24】
【0252】
AAVS 123 AAGATG gRNAのポリヌクレオチド配列(配列番号27)
【化25】
【0253】
AAVS 123 AAGATG 20伸長gRNAのポリヌクレオチド配列(配列番号28)
【化26】
図1
図2-1】
図2-2】
図3
図4
図5
図6
図7
図8
図9-1】
図9-2】
図10-1】
図10-2】
図11-1】
図11-2】
図12-1】
図12-2】
図13
図14
図15
図16
図17
図18
図19
図20
図21-1】
図21-2】
図21-3】
図21-4】
図22
図23-1】
図23-2】
図24-1】
図24-2】
図25
図26
図27
【国際調査報告】