IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ モンサント テクノロジー エルエルシーの特許一覧

特表2022-543241HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物
<>
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図1
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図2
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図3
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図4
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図5
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図6
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図7
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図8
  • 特表-HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-10-11
(54)【発明の名称】HUHエンドヌクレアーゼを用いた標的化ゲノム修飾を促進するための方法及び組成物
(51)【国際特許分類】
   C12N 15/09 20060101AFI20221003BHJP
   C12N 15/63 20060101ALI20221003BHJP
   C12N 9/16 20060101ALI20221003BHJP
   C12N 5/10 20060101ALI20221003BHJP
   C12N 1/15 20060101ALI20221003BHJP
   C12N 1/21 20060101ALI20221003BHJP
【FI】
C12N15/09 110
C12N15/63 Z ZNA
C12N9/16 Z
C12N5/10
C12N1/15
C12N1/21
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022506632
(86)(22)【出願日】2020-07-31
(85)【翻訳文提出日】2022-03-31
(86)【国際出願番号】 US2020044501
(87)【国際公開番号】W WO2021025999
(87)【国際公開日】2021-02-11
(31)【優先権主張番号】62/882,266
(32)【優先日】2019-08-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】501231613
【氏名又は名称】モンサント テクノロジー エルエルシー
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】アーヴィン・ディー・ナジ
【テーマコード(参考)】
4B050
4B065
【Fターム(参考)】
4B050CC05
4B050DD02
4B050DD20
4B050FF01
4B050LL01
4B050LL10
4B065AA26X
4B065AA57X
4B065AA88X
4B065AA90X
4B065AB01
4B065AC14
4B065BA02
4B065CA27
4B065CA44
4B065CA53
(57)【要約】
本開示は、HUHエンドヌクレアーゼとカップリングしたRNAガイド型ヌクレアーゼを用いて、核酸の部位特異的組込みを改善するための組成物及び方法を提供する。一態様では、本開示は、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;及び(b)少なくとも1つのガイド核酸を含むリボ核タンパク質を提供する。
【特許請求の範囲】
【請求項1】
(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;
(ii)リンカーをコードするアミノ酸配列;及び
(iii)HUHヌクレアーゼをコードするアミノ酸配列
を含む組換えポリペプチド;並びに
(b)少なくとも1つのガイド核酸
を含むリボ核タンパク質。
【請求項2】
(c)Cas12aヌクレアーゼをコードする第1の核酸配列;
(d)リンカーをコードする第2の核酸配列;及び
(e)HUHヌクレアーゼをコードする第3の核酸配列
を含む組換え核酸。
【請求項3】
前記組換え核酸が、(d)少なくとも1つのガイド核酸をコードする第4の核酸配列を更に含む、請求項2に記載の組換え核酸。
【請求項4】
前記組換え核酸が、(d)少なくとも1つの鋳型核酸分子をコードする第4の核酸配列を更に含む、請求項2に記載の組換え核酸。
【請求項5】
前記組換え核酸が、(d)少なくとも1つのガイド核酸をコードする第4の核酸配列;及び(e)少なくとも1つの鋳型核酸分子をコードする第5の核酸配列を更に含む、請求項2に記載の組換え核酸。
【請求項6】
前記Cas12aヌクレアーゼが、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも80%の配列同一性又は類似性を有するアミノ酸配列を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項7】
前記リンカーが、配列番号3のアミノ酸配列と少なくとも95%同一又は類似のアミノ酸配列を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項8】
前記HUHヌクレアーゼが、ソラマメ壊死性黄色ウイルス(FBNYV)HUHエンドヌクレアーゼ、ブタサーコウイルス2(PCV)HUHエンドヌクレアーゼ、アヒルサーコウイルス(DCV)HUHエンドヌクレアーゼ、ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)複製タンパク質RepB(RepB)、フルクトバシラス・トロパエオリ(Fructobacillus tropaeoli) RepB(RepBm)、大腸菌(Escherichia coli)コンジュゲーションタンパク質TraI(TraI)、大腸菌動員タンパク質A(mMobA)、及び黄色ブドウ球菌(Staphylococcus aureus)ニッキング酵素(NES)からなる群から選択される、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項9】
前記HUHヌクレアーゼが、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも80%の配列同一性又は類似性を有するアミノ酸配列を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項10】
前記組換えポリペプチドが、配列番号20~23及び25からなる群から選択されるアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む、請求項1に記載のリボ核タンパク質。
【請求項11】
前記組換え核酸が、配列番号20~23及び25からなる群から選択されるアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列をコードする、請求項2に記載の組換え核酸。
【請求項12】
前記リボ核タンパク質が、核局在化シグナルを含む、請求項1に記載のリボ核タンパク質。
【請求項13】
前記リボ核タンパク質が、少なくとも1つの鋳型核酸分子を更に含む、請求項1に記載のリボ核タンパク質。
【請求項14】
前記鋳型核酸分子が、一本鎖DNAを含む、請求項13に記載のリボ核タンパク質。
【請求項15】
前記鋳型核酸分子が、少なくとも25ヌクレオチドを含む、請求項13に記載のリボ核タンパク質、又は請求項4若しくは5に記載の組換え核酸。
【請求項16】
前記鋳型核酸分子が、複製起点(ori)をコードする核酸配列を含む、請求項13に記載のリボ核タンパク質、又は請求項4若しくは5に記載の組換え核酸。
【請求項17】
前記oriが、前記HUHヌクレアーゼにハイブリダイズすることができる、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項18】
前記複製起点が、前記鋳型核酸分子の5'末端に配置されている、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項19】
前記複製起点が、前記鋳型核酸分子の3'末端に配置されている、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項20】
前記複製起点が、少なくとも10ヌクレオチドを含む、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項21】
前記複製起点が、配列番号12又は配列番号27を含む、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項22】
前記鋳型核酸分子が、目的の遺伝子をコードする核酸配列を含む、請求項13に記載のリボ核タンパク質、又は請求項4若しくは5に記載の組換え核酸。
【請求項23】
前記目的の遺伝子が、タンパク質又はタンパク質をコードしないRNA分子をコードする、請求項22に記載のリボ核タンパク質又は組換え核酸。
【請求項24】
前記タンパク質をコードしないRNA分子が、マイクロRNA、低分子干渉RNA(siRNA)、又はトランス作用性siRNAからなる群から選択される、請求項23に記載のリボ核タンパク質又は組換え核酸。
【請求項25】
前記リンカーが、少なくとも10個のアミノ酸を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項26】
前記リンカーが、10~20個のアミノ酸を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項27】
前記リンカーのアミノ酸配列が、少なくとも5%の疎水性アミノ酸を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項28】
前記リンカーのアミノ酸配列の少なくとも50%が、グリシン、スレオニン、又はセリンを含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項29】
前記リンカーのアミノ酸配列が、少なくとも15%の負に荷電したアミノ酸を含む、請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸。
【請求項30】
前記少なくとも1つのガイド核酸が、DNA、RNA又はそれらの組合せを含む、請求項1に記載のリボ核タンパク質。
【請求項31】
前記少なくとも1つのガイド核酸が、単一のガイドRNAを含む、請求項1に記載のリボ核タンパク質。
【請求項32】
前記少なくとも1つのガイド核酸が、crRNAを含む、請求項1に記載のリボ核タンパク質。
【請求項33】
前記少なくとも1つのガイド核酸が、tracrRNAを含む、請求項1に記載のリボ核タンパク質。
【請求項34】
前記少なくとも1つのガイド核酸が、標的部位に対して少なくとも80%の相補性を含む、請求項1に記載のリボ核タンパク質。
【請求項35】
前記少なくとも1つのガイド核酸が、標的部位にハイブリダイズすることができる、請求項1に記載のリボ核タンパク質。
【請求項36】
前記組換え核酸が、少なくとも1つのプロモーターを更に含む、請求項2に記載の組換え核酸。
【請求項37】
前記第1の核酸配列、前記第2の核酸配列、前記第3の核酸配列、又はそれらの任意の組合せが、原核細胞に対してコドン最適化されている、請求項2に記載の組換え核酸。
【請求項38】
前記第1の核酸配列、前記第2の核酸配列、前記第3の核酸配列、又はそれらの任意の組合せが、真核細胞に対してコドン最適化されている、請求項2に記載の組換え核酸。
【請求項39】
前記真核細胞が、植物細胞、哺乳動物細胞、真菌細胞、昆虫細胞、クモ類細胞、トリ細胞、魚細胞、爬虫類細胞、及び両生類細胞からなる群から選択される、請求項38に記載の組換え核酸。
【請求項40】
請求項1に記載のリボ核タンパク質、又は請求項2に記載の組換え核酸を含む宿主細胞。
【請求項41】
前記宿主細胞が、植物細胞、細菌細胞、哺乳動物細胞、真菌細胞、昆虫細胞、クモ類細胞、トリ細胞、魚細胞、爬虫類細胞、及び両生類細胞からなる群から選択される、請求項40に記載の宿主細胞。
【請求項42】
前記植物細胞が、トウモロコシ細胞、大豆細胞、綿細胞、キャノーラ細胞、イネ細胞、小麦細胞、ソルガム細胞、アルファルファ細胞、サトウキビ細胞、キビ細胞、トマト細胞、ジャガイモ細胞、アブラナ細胞、及び藻類細胞からなる群から選択される、請求項41に記載の宿主細胞。
【請求項43】
前記原核細胞が、大腸菌細胞である、請求項37に記載の宿主細胞。
【請求項44】
請求項2に記載の組換え核酸を含むプラスミド。
【請求項45】
標的DNA分子において編集を生成する方法であって、前記標的DNA分子をリボ核タンパク質と接触させる工程を含み、前記リボ核タンパク質が、
(f)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;
(ii)リンカーをコードするアミノ酸配列;及び
(iii)HUHヌクレアーゼをコードするアミノ酸配列
を含む組換えポリペプチド;
(g)少なくとも1つのガイド核酸;並びに
(h)少なくとも1つの鋳型核酸分子
を含み、
前記リボ核タンパク質が、前記標的DNA分子において少なくとも1つの編集を生成する、方法。
【請求項46】
標的DNA分子において編集を生成する方法であって、細胞に、
(i)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;
(ii)リンカーをコードするアミノ酸配列;及び
(iii)HUHヌクレアーゼをコードするアミノ酸配列
を含む組換えポリペプチド、
又は前記組換えポリペプチドをコードする1つ以上の核酸分子;
(j)少なくとも1つのガイド核酸、又は前記少なくとも1つのガイド核酸をコードする少なくとも1つの核酸分子;並びに
(k)少なくとも1つの鋳型核酸分子、又は前記少なくとも1つの鋳型核酸分子をコードする少なくとも1つの核酸分子
を提供する工程を含み、
前記組換えポリペプチド、少なくとも1つのガイド核酸、及び少なくとも1つの鋳型核酸分子が、リボ核タンパク質を形成し、前記リボ核タンパク質が、前記細胞内の前記標的DNA分子において少なくとも1つの編集を生成する、方法。
【請求項47】
前記リボ核タンパク質が、細胞内で形成される、請求項45に記載の方法。
【請求項48】
前記リボ核タンパク質が、細胞外で形成される、請求項45に記載の方法。
【請求項49】
前記少なくとも1つの編集が、突然変異を含む、請求項45又は46に記載の方法。
【請求項50】
前記突然変異が、挿入、欠失、置換、又は逆位を含む、請求項49に記載の方法。
【請求項51】
前記突然変異が、部位特異的組込みを含む、請求項49に記載の方法。
【請求項52】
前記部位特異的組込みが、前記少なくとも1つの鋳型核酸分子からの少なくとも5個の連続するヌクレオチドの前記標的DNA分子への組込みを含む、請求項51に記載の方法。
【請求項53】
前記部位特異的組込みが、細胞に内因性の非相同末端結合修復メカニズムの使用を含む、請求項51に記載の方法。
【請求項54】
前記部位特異的組込みが、細胞に内因性の相同組換え修復メカニズムの使用を含む、請求項51に記載の方法。
【請求項55】
前記方法が、(d)前記標的DNA分子における前記少なくとも1つの編集を検出する工程を更に含む、請求項45又は46に記載の方法。
【請求項56】
検出する工程が、サザンブロット、PCR、及びDNA配列決定からなる群から選択される技術を含む、請求項50に記載の方法。
【請求項57】
前記標的DNA分子が、非遺伝子性DNAを含む、請求項45又は46に記載の方法。
【請求項58】
前記標的DNA分子が、遺伝子性DNAを含む、請求項45又は46に記載の方法。
【請求項59】
前記提供する工程が、アグロバクテリウム媒介性形質転換、ポリエチレングリコール媒介性形質転換、バイオリスティック形質転換、リポソーム媒介性トランスフェクション、ウイルス形質導入、使用又は1以上の送達粒子、マイクロインジェクション、及びエレクトロポレーションからなる群から選択される技術を含む、請求項46に記載の方法。
【請求項60】
前記細胞が、原核細胞又は真核細胞である、請求項46に記載の方法。
【請求項61】
前記標的DNAが、インビボ、インビトロ、又はエクスビボで存在する、請求項45に記載の方法。
【請求項62】
前記細胞が、インビボ、インビトロ、又はエクスビボで存在する、請求項46に記載の方法。
【請求項63】
前記標的DNA分子が、ゲノムDNA分子である、請求項45又は46に記載の方法。
【請求項64】
前記ゲノムDNA分子が、核ゲノムDNA分子、ミトコンドリアゲノムDNA分子、及び色素体ゲノムDNA分子からなる群から選択される、請求項63に記載の方法。
【請求項65】
配列番号3のアミノ酸配列を含む単離されたポリペプチド。
【請求項66】
前記アミノ酸配列が、第1のヌクレアーゼをコードするアミノ酸配列と第2のヌクレアーゼをコードするアミノ酸配列との間に配置されている、請求項65に記載の単離されたポリペプチド。
【請求項67】
前記第1のヌクレアーゼが、Cas12aヌクレアーゼ、CasXヌクレアーゼ、Cas9ヌクレアーゼ、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクチベーター様ヌクレアーゼ、及びHUHエンドヌクレアーゼからなる群から選択されるヌクレアーゼである、請求項66に記載の単離されたポリペプチド。
【請求項68】
第2のヌクレアーゼが、Cas12aヌクレアーゼ、CasXヌクレアーゼ、Cas9ヌクレアーゼ、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクチベーター様ヌクレアーゼ、及びHUHエンドヌクレアーゼからなる群から選択される、請求項65に記載の単離されたポリペプチド。
【請求項69】
前記複製起点が、配列番号12を含む、請求項16に記載のリボ核タンパク質又は組換え核酸。
【請求項70】
配列番号7及び17~25から選択されるアミノ酸配列を含むポリペプチド。
【請求項71】
配列番号7及び17~25から選択されるアミノ酸配列をコードする発現カセット。
【請求項72】
請求項69に記載のポリペプチド及び/又は請求項70に記載の発現カセットを含む細胞。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照及び配列表の組込み
本出願は、2019年8月2日出願の米国仮出願第62/882,266号の利益を主張し、その全体が参照により本明細書に組み込まれる。「P34742WO00_SL.TXT」という名称のファイルに含まれる配列表は、136,904バイト(MS-Windows(登録商標)で測定された)であり、2020年7月31日に作成され、電子的にここにファイルされ、その全体が参照により本明細書に組み込まれる。
【0002】
分野
本開示は、所望の配列のゲノムへの標的化された組込みを改善するために、HUHエンドヌクレアーゼに連結されたRNAガイド型ヌクレアーゼを使用することに関する組成物及び方法に関する。
【0003】
配列表の組込み
46-21-63706_US0001_SEQという名称のファイルに含まれる配列表は、133キロバイト(MS-Windows(登録商標)で測定された)であり、2020年7月17日に作成され、28配列を含み、電子的にここにファイルされ、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0004】
背景
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)ヌクレアーゼ(例えば、Cas12a、CasX、Cas9)は、標的核酸分子へとガイドRNAによってガイドされるタンパク質であり、このヌクレアーゼは標的核酸分子の一本鎖又は二本鎖を切断することができる。HUH(ヒスチジン-疎水性アミノ酸-ヒスチジン)エンドヌクレアーゼは、特定の一本鎖DNA配列と共有結合を形成することができるHUHタグを含むヌクレアーゼである。
【0005】
この開示は、鋳型配列の標的DNA分子への部位特異的組込みを改善するために、新規なリンカーアミノ酸を用いて、Cas12aヌクレアーゼをHUHエンドヌクレアーゼに繋ぐことができることを実証する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2016/205711号
【特許文献2】国際公開第2019/084148号
【特許文献3】米国特許第5,550,318号
【特許文献4】米国特許第5,538,880号
【特許文献5】米国特許第6,160,208号
【特許文献6】米国特許第6,399,861号
【特許文献7】米国特許第6,153,812号
【特許文献8】米国特許第5,159,135号
【特許文献9】米国特許第5,824,877号
【特許文献10】米国特許第5,591,616号
【特許文献11】米国特許第6,384,301号
【特許文献12】米国特許第5,750,871号
【特許文献13】米国特許第5,463,174号
【特許文献14】米国特許第5,188,958号
【特許文献15】米国特許第5,049,386号
【特許文献16】米国特許第4,946,787号
【特許文献17】米国特許第4,897,355号
【特許文献18】国際公開第91/17424号
【特許文献19】国際公開第91/16024号
【特許文献20】国際公開第2014/093622号
【特許文献21】米国特許第6,194,636号
【特許文献22】米国特許第6,232,526号
【特許文献23】米国特許出願公開第2004/0216189号
【特許文献24】米国特許第6,437,217号
【特許文献25】米国特許第5,641,876号
【特許文献26】米国特許第6,426,446号
【特許文献27】米国特許第6,429,362号
【特許文献28】米国特許第6,232,526号
【特許文献29】米国特許第6,177,611号
【特許文献30】米国特許第5,322,938号
【特許文献31】米国特許第5,352,605号
【特許文献32】米国特許第5,359,142号
【特許文献33】米国特許第5,530,196号
【特許文献34】米国特許第6,433,252号
【特許文献35】米国特許第6,429,357号
【特許文献36】米国特許第5,837,848号
【特許文献37】米国特許第6,294,714号
【特許文献38】米国特許第6,140,078号
【特許文献39】米国特許第6,252,138号
【特許文献40】米国特許第6,175,060号
【特許文献41】米国特許第6,635,806号
【特許文献42】米国特許出願第09/757,089号
【特許文献43】米国特許第6,051,753号
【特許文献44】米国特許第5,378,619号
【特許文献45】米国特許第5,850,019号
【特許文献46】米国特許第5,106,739号
【非特許文献】
【0007】
【非特許文献1】「The American Heritage(R)Science Dictionary」(Editors of the American Heritage Dictionaries、2011、Houghton Mifflin Harcourt、Boston and New York)
【非特許文献2】「McGraw-Hill Dictionary of Scientific and Technical Terms」(第6版、2002、McGraw-Hill、New York)、
【非特許文献3】「Oxford Dictionary of Biology」(第6版、2008、Oxford University Press、Oxford and New York)
【非特許文献4】Green及びSambrook、Molecular Cloning: A Laboratory Manual、第4版(2012)
【非特許文献5】Current Protocols In Molecular Biology (F. M. Ausubelら編、(1987))
【非特許文献6】Plant Breeding Methodology (N.F. Jensen、Wiley-Interscience (1988))
【非特許文献7】the series Methods In Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M. J. MacPherson、B. D. Hames and G. R. Taylor編(1995))
【非特許文献8】Harlow及びLane編(1988) Antibodies、A Laboratory Manual
【非特許文献9】Animal Cell Culture (R. I. Freshney編(1987))
【非特許文献10】Recombinant Protein Purification: Principles And Methods、18-1142-75、GE Healthcare Life Sciences
【非特許文献11】C. N. Stewart、A. Touraev V. Citovsky、T. Tzfira編(2011) Plant Transformation Technologies (Wiley-Blackwell)
【非特許文献12】R. H. Smith (2013) Plant Tissue Culture: Techniques and Experiments (Academic Press, Inc.)
【非特許文献13】Compendium of Transgenic Crop Plants (2009) Blackwell Publishing
【非特許文献14】Kamら(2004) /. Am. Chem. Soc、126 (22):6850-6851
【非特許文献15】Liuら(2009) Nano Lett、9(3): 1007-1010
【非特許文献16】Khodakovskayaら(2009) ACS Nano、3(10):3221-3227
【非特許文献17】PCR Primer: A Laboratory Manual、Dieffenbach及びDveksler編、Cold Spring Harbor Laboratory Press、1995
【非特許文献18】Sambrookら(1989, Molecular Cloning: A Laboratory Manual、第2版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY)
【非特許文献19】Chenna R.ら、「Multiple sequence alignment with the Clustal series of programs」、Nucleic Acids Research 31 : 3497-3500 (2003)
【非特許文献20】Thompson JDら、「Clustal W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice」、Nucleic Acids Research 22: 4673-4680 (1994)
【非特許文献21】Larkin MAら「Clustal W and Clustal X version 2.0」、Bioinformatics 23: 2947-48 (2007)
【非特許文献22】Altschul, S.F.、Gish, W.、Miller, W.、Myers, E.W.及びLipman, D.J. (1990)「Basic local alignment search tool」J. Mol. Biol. 215:403-410 (1990)
【非特許文献23】Sambrook, J.及びRussell, W.、Molecular Cloning: A Laboratory Manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor (2001)
【非特許文献24】Zhang及びMadden, Genome Res., 1997, 7, 649-656
【非特許文献25】Smith及びWaterman (Adv. Appl. Math., 1981, 2, 482-489)
【非特許文献26】Schramm及びHernandez、2002、Genes & Development、16:2593-2620
【非特許文献27】Lawtonら、Plant Molecular Biology (1987) 9: 315-324
【非特許文献28】Odellら、Nature (1985) 313: 810-812
【非特許文献29】Yang及びRussell, Proceedings of the National Academy of Sciences、USA (1990) 87: 4144-4148
【非特許文献30】Chandlerら、Plant Cell (1989) 1: 1175-1183
【非特許文献31】Depickerら、 Journal of Molecular and Applied Genetics (1982) 1: 561-573
【非特許文献32】Nakamuraら、2000、Nucl. Acids Res. 28:292
【非特許文献33】Campbell及びGowri、1990、Plant Physiol.、92: 1-11
【非特許文献34】Murrayら、1989. Nucleic Acids Res. 17:477-98
【非特許文献35】Vega-Rochaら、2007、Biochemistry 46: 6201
【非特許文献36】Timchenkoら、1999、J. of Virol. 73: 10173
【非特許文献37】Dostalら、2011、Nucleic Acids Res 39: 2658
【図面の簡単な説明】
【0008】
図1図1は、パネル1A及び1Bを含む図である。図1Aは、二本鎖(ds)染色体DNAの切断(ハサミ)を増加させるために、HUH認識配列(ori)を含む一本鎖DNA(ssDNA)鋳型に繋がれた、RNAガイド型ヌクレアーゼ(Cas12a;Cas12aに相当)及びヒスチジン-疎水性-ヒスチジンエンドヌクレアーゼ(HUH EN)のグラフ表示を示す。図1Bは、C末端のcys不含LbCas12a:HUH融合発現構築物及びN末端のHUH:cys不含LbCas12a融合発現構築物のグラフ表示を示す。
図2図2は、3つの標的部位における次世代シークエンシングによる標的化されたインデルの定量化を示す図である。Cys不含LbCas12a:HUH融合及びcys不含LbCas12aは同等の活性を有した。バーは、4つの技術的複製の平均インデル率を表す。実験(cys不含LbCas12a:HUH/crRNA/鋳型)及び陽性対照(cys不含LbCas12a/crRNA/鋳型)のいずれも、p=0.05で陰性対照(crRNA/鋳型)と比較してインデルの有意に高いパーセンテージを示した。「t」は鋳型を指す。
図3図3Aは、植物体内において融合タンパク質を試験するための試験系及び制御系の図解を示す図である。制御系は、ssDNA鋳型がHUHエンドヌクレアーゼに結合するのに必要なori配列を欠いている。図3Bは、図3Aに示された試験系及び制御系を用いた2つの独立した粒子衝撃実験の結果を示す図である。Cas12aの染色体切断活性は、7つのヌクレオチド標的部位内の標的化されたインデルを定量化することによって決定された。少なくとも20%の標的化されたインデルリードを生成した植物は突然変異体とみなされる。
図4図4は、GmTS1標的部位に隣接するゲノム領域、及びリボ核タンパク質複合体に付加された適合する外因性鋳型を示す図である。鋳型の識別可能な中間のシグネチャーモチーフは影付きである。二本鎖染色体が切断されると、鋳型は非相同末端結合(non-homologous end-joining)(NHEJ)又は相同組換え(HR)によって組み込まれ得る。配列決定後、中間のシグネチャーモチーフの存在/不在は、標的化された組込みを示す。組込みの性質、例えば、NHEJ、HR又はそれらの組合せは、示されるように、5'及び3'の染色体-鋳型接合における配列によって示される。この例示には示されていないのは、試験試料で使用された鋳型の5'末端に存在したori認識配列である。ori認識配列は陰性対照には存在しなかった。黒い三角形はPCRプライマーを示す。
図5図5は、R0植物における標的化された組込みのためのcys不含LbCas12a:HUH融合タンパク質の植物体内試験の結果を示す図である。
図6図6は、N末端又はC末端のHUH融合タンパク質、GmTS1ゲノム部位を標的とするcrRNA、及び一本鎖DNA鋳型(ss鋳型)又は二本鎖DNAオリゴ(dsOligo)のいずれかを含む鋳型を含むRNP複合体を同時に大豆プロトプラストに送達した場合の予想される編集結果を示す図である。
図7図7は、LbCas12aのN末端(HUH:cys不含LbCas12a)及びC末端(cys不含LbCas12a:HUH)融合誘導体による、酵素、コグネートcrRNA、ori配列の有無に関わらずss鋳型、及び標的領域に関係のないDNA配列を有するdsOligoの種々の組合せを含む16の処理(Tr)に亘る染色体切断を示す図である。各プロトプラスト処理における試薬の組合せについてはTable 7(表7)を参照されたい。染色体切断は、標的化されたインデル率によって定量化された。バーは4つの生物学的複製の平均を表し、誤差バーは標準偏差である。いくつかの重要な処置の間の統計学的有意性は、バーの上の水平線で示される。
図8図8は、LbCas12aのN末端(HUHcys不含LbCas12a)及びC末端(cys不含LbCas12a:HUH)融合誘導体を用いた鋳型の標的化された組込みを示す図である。バーは4つの生物学的複製の平均を表し、誤差バーは標準偏差である。NHEJ(標的化された単一コピー及び多重コピー組込みの合計;黒いバー)による全組込み、NHEJ(濃い灰色のバー)による単一コピー組込み、及びHR(薄い灰色のバー)による鋳型編集は、鋳型がRNP複合体に繋がれた場合、いずれも有意に良好であった。各処置における試薬の組合せについてはTable 7(表7)を参照されたい。いくつかの重要な処置の間の統計学的有意性は、バーの上の水平線で示される。
図9図9は、LbCas12aのN末端(HUH:cys不含LbCas12a)及びC末端(cys不含LbCas12a:HUH)融合誘導体を用いたNHEJによる外因性の繋がれていないdsオリゴヌクレオチド(90bp)の標的化された組込みを示す図である。バーは4つの生物学的複製の平均を表し、誤差バーは標準偏差である。「dsDNAオリゴ、合計」は、NHEJ(黒いバー)による標的化された単一コピー及び多重コピー組込みの合計を示す。「dsDNAオリゴ、1x」は、NHEJ(濃い灰色のバー)による単一コピーの組込みを示す。各処置における試薬の組合せについてはTable 7(表7)を参照されたい。いくつかの重要な処置の間の統計学的有意性は、バーの上の水平線で示される。
【発明の概要】
【0009】
概要
一態様では、本開示は、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;並びに(b)少なくとも1つのガイド核酸を含むリボ核タンパク質を提供する。
【0010】
一態様では、本開示は、(a)Cas12aヌクレアーゼをコードする第1の核酸配列;(b)リンカーをコードする第2の核酸配列;及び(c)HUHヌクレアーゼをコードする第3の核酸配列含む組換え核酸を提供する。
【0011】
一態様では、本開示は、標的DNA分子において編集を生成する方法であって、標的DNA分子をリボ核タンパク質と接触させる工程を含み、リボ核タンパク質は、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;(b)少なくとも1つのガイド核酸;並びに(c)少なくとも1つの鋳型核酸分子を含み、リボ核タンパク質が標的DNA分子において少なくとも1つの編集を生成する方法を提供する。
【0012】
一態様では、本開示は、標的DNA分子において編集を生成する方法であって、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド、又は組換えポリペプチドをコードする1つ以上の核酸分子;(b)少なくとも1つのガイド核酸、又は少なくとも1つのガイド核酸をコードする少なくとも1つの核酸分子;並びに(c)少なくとも1つの鋳型核酸分子、又は少なくとも1つの鋳型核酸分子をコードする少なくとも1つの核酸分子を細胞に提供する工程を含み、組換えポリペプチド、少なくとも1つのガイド核酸、及び少なくとも1つの鋳型核酸分子がリボ核タンパク質を形成し、かつリボ核タンパク質が細胞内の標的DNA分子において少なくとも1つの編集を生成する方法を提供する。
【発明を実施するための形態】
【0013】
詳細な説明
別段の定義がない限り、使用される全ての技術用語及び科学用語は、本開示が属する当業者によって一般的に理解されるものと同じ意味を有する。用語が単数形で提供される場合、発明者らはまた、その用語の複数形によって説明される開示の態様を意図する。参照により組み込まれる参照文献において使用される用語及び定義に相違がある場合は、本出願において使用される用語は、本明細書において与えられる定義を有するものとする。使用される他の技術用語は、それらが使用される当該技術分野において通常の意味を有しており、例えば、「The American Heritage(R) Science Dictionary」(Editors of the American Heritage Dictionaries、2011、Houghton Mifflin Harcourt、Boston and New York)、「McGraw-Hill Dictionary of Scientific and Technical Terms」(第6版、2002、McGraw-Hill、New York)、又は「Oxford Dictionary of Biology」(第6版、2008、Oxford University Press、Oxford and New York)等の種々の技術分野特異的な辞書によって例示される。本発明者らは、作用機序又は作用様式に限定されることを意図していない。その参照は、例示的な目的のためにのみ提供される。
【0014】
本開示の実施には、特に断らない限り、当技術の範囲内である、生化学、化学、分子生物学、微生物学、細胞生物学、植物生物学、ゲノミクス、バイオテクノロジー及び遺伝学の従来技術が含まれる。例えば、Green及びSambrook、Molecular Cloning: A Laboratory Manual、第4版(2012); Current Protocols In Molecular Biology (F. M. Ausubelら編、(1987)); Plant Breeding Methodology (N.F. Jensen、Wiley-Interscience (1988)); the series Methods In Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M. J. MacPherson、B. D. Hames and G. R. Taylor編(1995)); Harlow及びLane編(1988) Antibodies、A Laboratory Manual; Animal Cell Culture (R. I. Freshney編(1987)); Recombinant Protein Purification: Principles And Methods、18-1142-75、GE Healthcare Life Sciences; C. N. Stewart、A. Touraev V. Citovsky、T. Tzfira編(2011) Plant Transformation Technologies (Wiley-Blackwell);及びR. H. Smith (2013) Plant Tissue Culture: Techniques and Experiments (Academic Press, Inc.)を参照されたい。
【0015】
全ての特許、公開された特許出願、及び非特許公開を含む、本明細書に引用された全ての参考文献は、それらの全体が参照により本明細書に組み込まれる。
【0016】
選択肢のグループ化が提示される場合、選択肢のグループ化を構成するメンバーの任意の及び全ての組合せが、特に想定される。例えば、項目がA、B、C及びDからなる群から選択される場合、本発明者らは、個別に各選択肢(例えば、A単独、B単独等)、並びにA、B及びD;A及びC;B及びC等の組合せを特に想定する。
【0017】
本明細書で使用される場合、単数及び単数形の用語「1つの(a)」、「1つの(an)」、及び「その(the)」は、例えば、その内容が明確に別段の指示をしない限り、複数の指示対象を含む。
【0018】
本明細書において提供される任意の組成物、核酸分子、ポリペプチド、細胞、植物等は、本明細書において提供される任意の方法とともに使用することを特に想定される。
【0019】
一態様では、本開示は、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;並びに(b)少なくとも1つのガイド核酸を含むリボ核タンパク質を提供する。一態様では、リボ核タンパク質は、少なくとも1つの鋳型核酸分子を更に含む。
【0020】
一態様では、本開示は、(a)(i)CasXヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;並びに(b)少なくとも1つのガイド核酸を含むリボ核タンパク質を提供する。一態様では、リボ核タンパク質は少なくとも1つの鋳型核酸分子を更に含む。
【0021】
一態様では、本開示は、(a)Cas12aヌクレアーゼをコードする第1の核酸配列;(b)リンカーをコードする第2の核酸配列;及び(c)HUHエンドヌクレアーゼをコードする第3の核酸配列を含む組換え核酸を提供する。一態様では、本開示は、(a)CasXヌクレアーゼをコードする第1の核酸配列;(b)リンカーをコードする第2の核酸配列;及び(c)HUHエンドヌクレアーゼをコードする第3の核酸配列を含む組換え核酸を提供する。一態様では、組換え核酸は、(d)少なくとも1つのガイド核酸をコードする第4の核酸配列を更に含む。一態様では、組換え核酸は、(d)少なくとも1つの鋳型核酸分子をコードする第4の核酸配列を更に含む。別の態様では、組換え核酸は、(d)少なくとも1つのガイド核酸をコードする第4の核酸配列;及び(e)少なくとも1つの鋳型核酸分子をコードする第5の核酸配列を更に含む。
【0022】
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)ヌクレアーゼ(例えば、Cas9、CasX、Cas12a(Cpf1とも呼ばれる)、CasY)は、標的核酸分子にガイドRNA(「gRNA」)によってガイドされる細菌において見出されるタンパク質であり、次に、エンドヌクレアーゼは、標的核酸分子の1つ又は2つの鎖を切断することができる。CRISPRヌクレアーゼの起源は細菌であるが、多くのCRISPRヌクレアーゼが真核細胞で機能することが示されている。
【0023】
特定の科学的理論に制限されないが、CRISPRヌクレアーゼはガイドRNA(gRNA)と複合体を形成し、相補的標的部位とハイブリダイズし、それによってCRISPRヌクレアーゼを標的部位にガイドする。クラスII CRISPR-Casシステムでは、スペーサーを含むCRISPRアレイは、認識された侵襲性DNAとの遭遇中に転写され、低分子干渉CRISPR RNA(crRNA)にプロセシングされる。crRNAは、侵入病原体中の特定のプロトスペーサー配列に相補的である反復配列及びスペーサー配列を含む。スペーサー配列は、真核生物ゲノム中の標的配列に相補的であるように設計することができる。
【0024】
CRISPRヌクレアーゼは、それらの活性型でそれぞれのcrRNAと会合する。CasXは、クラスIIエンドヌクレアーゼCas9と同様に、機能的活性を有するために、トランス活性化crRNA(tracrRNA)と呼ばれる別の非コードRNA成分を必要とする。本明細書において提供される核酸分子は、crRNA及びtracrRNAを、本明細書において「単一ガイドRNA」(sgRNA)と呼ばれる1つの核酸分子に組み合わせることができる。Cas12aは標的部位へのtracrRNAのガイドを必要とせず、Cas12aにはcrRNAだけで十分である。gRNAは活性なCRISPRヌクレアーゼ複合体を標的部位にガイドし、CRISPRヌクレアーゼは標的部位を切断することができる。
【0025】
RNAガイド型CRISPRヌクレアーゼ及びガイドRNAが複合体を形成する場合、システム全体は「リボ核タンパク質」と呼ばれる。本明細書において提供されるリボ核タンパク質は、限定されないが、鋳型核酸分子等の追加の核酸も含むことができる。本明細書において提供されるリボ核タンパク質はまた、リンカー及びHUHエンドヌクレアーゼ等の追加のタンパク質も含むことができる。
【0026】
CRISPRリボ核タンパク質による標的部位の切断の前提条件は、標的部位近傍に保存されたプロトスペーサー隣接モチーフ(PAM)の存在である。CRISPRヌクレアーゼに依存して、切断は、PAM部位からの一定数のヌクレオチド(例えば、Cas12aについては18~23ヌクレオチド)内で起こり得る。PAM部位はI型及びII型CRISPR関連タンパク質にのみ必要であり、異なるCRISPRエンドヌクレアーゼは異なるPAM部位を認識する。限定されないが、Cas12aは、少なくとも次のPAM部位:TTTN及びYTNを認識することができる;並びにCasXはまた、少なくとも次のPAM部位:TTCN、TTCA及びTTC(ここで、Tはチミン;Cはシトシン;Aはアデニン;Yはチミン又はシトシン;及びNはチミン、シトシン、グアニン又はアデニンである)を認識することができる。
【0027】
Cas12aはクラスII、V型CRISPR/CasシステムのRNAガイド型ヌクレアーゼである。Cas12aヌクレアーゼは、標的核酸分子を切断する場合に、互い違いの切断を生じる。
【0028】
一態様では、本明細書において提供されるCas12aヌクレアーゼは、ラクノスピラ(Lachnospiraceae)細菌Cas12a(LbCas12a)ヌクレアーゼである。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、フランシセラ・ノビシダ(Francisella novicida) Cas12a(FnCas12a)ヌクレアーゼである。一部の実施形態では、Cas12aヌクレアーゼのアミノ酸配列は、システインを除去するように操作されている。
【0029】
一態様では、Cas12aヌクレアーゼ、又はCas12aヌクレアーゼをコードする核酸は、
ストレプトコッカス(Streptococcus)属、カンピロバクター(Campylobacter)属、ニトロチフラクター(Nitratifractor)属、スタフィロコッカス(Staphylococcus)属、パルビバキュラム(Parvibaculum)属、ローズブリア(Roseburia)属、ナイセリア(Neisseria)属、グルコナセトバクター(Gluconacetobacter)属、アゾスピリルム(Azospirillum)属、スフェロケタ(Sphaerochaeta)属、ラクトバチルス(Lactobacillus)属、ユウバクテリウム(Eubacterium)属、コリナバクター(Corynebacter)属、カルノバクテリウム(Carnobacterium)属、ロドバクター(Rhodobacter)属、リステリア(Listeria)属、パルディバクター(Paludibacter)属、クロストリジウム(Clostridium)属、ラクノスピラ(Lachnospiraceae)属、クロストリジアリジウム(Clostridiaridium)属、レプトトリキア(Leptotrichia)属、フランシセラ(Francisella)属、レジオネラ(Legionella)属、アリシクロバチルス(Alicyclobacillus)属、メタノメチオフィラス(Methanomethyophilus)属、ポルフィロモナス(Porphyromonas)属、プレボテラ(Prevotella)属、バクテロイデス(Bacteroidetes)属、ヘルココッカス(Helcococcus)属、レトスピラ(Letospira)属、デサルフォビブリオ(Desulfovibrio)属、デスルフォナトロナム(Desulfonatronum)属、オピトゥトゥ(Opitutaceae)属、テュベリバシラス(Tuberibacillus)属、バチルス(Bacillus)属、ブレビバチルス(Brevibacilus)属、メチロバクテリウム(Methylobacterium)属、アシドアミノコッカス(Acidaminococcus)属、ペレグリニバクテリア(Peregrinibacteria)属、ブチリビブリオ(Butyrivibrio)属、パークバクテリア(Parcubacteria)属、スミセラ(Smithella)属、カンジダトゥス(Candidatus)属、モラクセラ(Moraxella)属、及びレプトスピラ(Leptospira)からなる群から選択される細菌属に由来する。
【0030】
一実施形態では、本明細書において提供されるCas12aヌクレアーゼは、cys不含LbCas12aをコードする配列番号1に開示されるアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む。本明細書で使用される場合、「cys不含LbCas12a」とは、天然LbCas12a配列(国際公開第2016/205711号-1150)中に存在する9個のシステインが全て突然変異しているLbCas12aタンパク質バリアントを指す。一態様では、cys不含LbCas12aは、wt LbCas12aタンパク質配列と比較した場合、以下の9個のアミノ酸置換:C10L、C175L、C565S、C632L、C805A、C912V、C965S、C1090P、C1116Lを含む。タンパク質中のシステイン残基はジスルフィド架橋を形成することができ、システイン間に強い可逆的結合を与える。標的化された様式でCas12aの結合を制御し、導くために、天然システインを除去して、これらの架橋の形成を制御する。特定の理論に拘束されることを望まないが、タンパク質骨格からシステインを除去することは、ジスルフィド連結によるこれらの可逆的連結の配置を制御するために、新しいシステイン残基の標的化された挿入を可能にする。これは、タンパク質ドメイン間であり得るか、又はバイオリスティック法による送達のための金粒子等の粒子に対してであり得る。システインのいくつかの残基を含むタグを、cys不含LbCas12aに添加することにより、それが均一な方法で金属ビーズ(特に金)に特異的に結合させることができる。
【0031】
一態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも85%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも90%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも95%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも96%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも97%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも98%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と少なくとも99%同一又は類似のアミノ酸配列を含む。別の態様では、本明細書において提供されるCas12aヌクレアーゼは、配列番号1、15及び26からなる群から選択されるアミノ酸配列と100%同一又は類似のアミノ酸配列を含む。
【0032】
一態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも80%同一の配列を含むポリヌクレオチドによりコードされる。
【0033】
別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも85%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも90%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも95%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも96%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも97%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも98%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと少なくとも99%同一の配列を含むポリヌクレオチドによりコードされる。別の態様では、Cas12aヌクレアーゼは、配列番号4及び16からなる群から選択されるポリヌクレオチドと100%同一の配列を含むポリヌクレオチドによりコードされる。
【0034】
CasXは、細菌門デルタプロテオバクテリア(Deltaproteobacteria)及びプランクトミケス(Planctomycetes)で同定されたクラスII CRISPR-Casヌクレアーゼの一種である。Cas12aと同様に、CasXヌクレアーゼは、標的核酸分子を切断する場合に、互い違いの切断を生じる。しかしながら、Cas12aとは異なり、CasXヌクレアーゼは、標的核酸を標的にして切断するために、crRNA及びtracrRNA、又は単一ガイドRNAを必要とする。
【0035】
一態様では、本明細書において提供されるCasXヌクレアーゼは、デルタプロテオバクテリア門由来のCasXヌクレアーゼである。別の態様では、本明細書において提供されるCasXヌクレアーゼは、プランクトミケス門由来のCasXヌクレアーゼである。更なる適切なCasXヌクレアーゼは、国際公開第2019/084148号に記載されているものであり、これは、その全体が参照により本明細書に組み込まれる。
【0036】
一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、インビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、インビトロで組換えベクターから発現され得る。一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、エクスビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、インビボで核酸分子から発現され得る。一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、インビトロで核酸分子から発現され得る。一態様では、本明細書において提供されるCas12aヌクレアーゼ又はCasXヌクレアーゼは、エクスビボで核酸分子から発現され得る。
【0037】
本明細書で使用される場合、「ガイド核酸」とは、CRISPRヌクレアーゼ(例えば、限定されないが、Cas12a、CasX)と複合体を形成し、次に、標的核酸分子中の特異的配列に複合体をガイドする核酸を指し、ガイド核酸及び標的核酸分子は相補的配列を共有する。一態様では、本明細書において提供されるリボ核タンパク質は、少なくとも1つのガイド核酸を含む。
【0038】
一態様では、ガイド核酸はDNAを含む。別の態様では、ガイド核酸はRNAを含む。一態様では、ガイド核酸は、DNA、RNA、又はそれらの組合せを含む。一態様では、ガイド核酸は一本鎖である。別の態様では、ガイド核酸は少なくとも部分的に二本鎖である。
【0039】
ガイド核酸がRNAを含む場合、それは「ガイドRNA」と呼ぶことができる。別の態様では、ガイド核酸はDNA及びRNAを含む。別の態様では、ガイド核酸は一本鎖である。別の態様では、ガイド核酸は二本鎖である。更なる態様では、ガイド核酸は部分的に二本鎖である。
【0040】
別の態様では、ガイド核酸は、少なくとも10ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも11ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも12ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも13ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも14ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも15ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも16ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも17ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも18ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも19ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも20ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも21ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも22ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも23ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも24ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも25ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも26ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも27ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも28ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも30ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも35ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも40ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも45ヌクレオチドを含む。別の態様では、ガイド核酸は、少なくとも50ヌクレオチドを含む。
【0041】
別の態様では、ガイド核酸は、10ヌクレオチド~50ヌクレオチドを含む。別の態様では、ガイド核酸は、10ヌクレオチド~40ヌクレオチドを含む。別の態様では、ガイド核酸は、10ヌクレオチド~30ヌクレオチドを含む。別の態様では、ガイド核酸は、10ヌクレオチド~20ヌクレオチドを含む。別の態様では、ガイド核酸は、16ヌクレオチド~28ヌクレオチドを含む。別の態様では、ガイド核酸は、16ヌクレオチド~25ヌクレオチドを含む。別の態様では、ガイド核酸は、16ヌクレオチド~20ヌクレオチドを含む。
【0042】
一態様では、ガイド核酸は、標的部位に対して少なくとも70%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも75%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも80%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも85%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも90%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも91%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも92%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも93%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも94%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも95%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも96%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも97%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも98%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して少なくとも99%の配列相補性を含む。一態様では、ガイド核酸は、標的部位に対して100%の配列相補性を含む。別の態様では、ガイド核酸は、標的部位に対して70%~100%の配列相補性を含む。別の態様では、ガイド核酸は、標的部位に対して80%~100%の配列相補性を含む。別の態様では、ガイド核酸は、標的部位に対して90%~100%の配列相補性を含む。
【0043】
一態様では、ガイド核酸は、標的部位にハイブリダイズすることができる。
【0044】
上述のように、CasX及びCas9等の一部のRNAガイド型CRISPRヌクレアーゼは、機能的活性を有するために、トランス活性化crRNA(tracrRNA)と呼ばれる別の非コードRNA成分を必要とする。本明細書において提供されるガイド核酸分子は、crRNA及びtracrRNAを、本明細書において「単一ガイドRNA」(sgRNA)と呼ばれる1つの核酸分子に組み合わせることができる。gRNAは活性なCasX複合体を標的部位にガイドし、CasXは標的部位を切断することができる。他の実施形態では、crRNA及びtracrRNAは、別個の核酸分子として提供される。
【0045】
一態様では、ガイド核酸はcrRNAを含む。別の態様では、ガイド核酸はtracrRNAを含む。更なる態様では、ガイド核酸はsgRNAを含む。
【0046】
一態様では、本明細書において提供されるガイド核酸は、インビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるガイド核酸は、インビトロで組換えベクターから発現され得る。一態様では、本明細書において提供されるガイド核酸は、エクスビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるガイド核酸は、インビボで核酸分子から発現され得る。一態様では、本明細書において提供されるガイド核酸は、インビトロで核酸分子から発現され得る。一態様では、本明細書において提供されるガイド核酸は、エクスビボで核酸分子から発現され得る。別の態様では、本明細書において提供されるガイド核酸は、合成的に合成することができる。
【0047】
リンカーは、2つ以上のタンパク質又はタンパク質ドメインを1つのより大きいタンパク質複合体に接続させるために使用される短いアミノ酸配列である。リンカーは、それらが結合しているタンパク質、又はタンパク質ドメインの本来の機能に干渉しない。
【0048】
一態様では、リンカーは、第1のヌクレアーゼをコードするアミノ酸配列と第2のヌクレアーゼをコードするアミノ酸配列との間に配置される。一態様では、第1のヌクレアーゼは、Cas12aヌクレアーゼ、CasXヌクレアーゼ、Cas9ヌクレアーゼ、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクチベーター様ヌクレアーゼ、及びHUHエンドヌクレアーゼからなる群から選択される。一態様では、第2のヌクレアーゼは、Cas12aヌクレアーゼ、CasXヌクレアーゼ、Cas9ヌクレアーゼ、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写アクチベーター様ヌクレアーゼ、及びHUHエンドヌクレアーゼからなる群から選択される。
【0049】
一態様では、リンカーは、ヌクレアーゼをコードするアミノ酸配列と機能ドメインをコードするアミノ酸配列との間に配置される。一態様では、ヌクレアーゼは、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、アルゴノート(アルゴノートタンパク質の非制限的な例には、サーマス・サーモフィルス(Thermus thermophilus)アルゴノート(TtAgo)、ピュロコックス・フリオスス(Pyrococcus furiosus)アルゴノート(PfAgo)、ナトロノバクテリウム・グレゴリイ(Natronobacterium gregoryi)アルゴノート(NgAgo)が挙げられる)、RNAガイド型ヌクレアーゼ、例えば、CRISPR関連ヌクレアーゼ(CRISPR関連ヌクレアーゼの非制限的な例には、Casl、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9 (Csn1及びCsx12としても公知である)、Cas10、Cas12a (Cpf1としても公知である)、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csl3、Csf4、CasX、CasY、そのホモログ、又はそれらの修飾されたバージョンが挙げられる)からなる群から選択される。一態様では、機能ドメインは、デアミナーゼ、ウラシルDNAグリコシラーゼ(UGI)、転写アクチベーター、リコンビナーゼ、トランスポザーゼ、ヘリカーゼ及びメチラーゼからなる群から選択される。一部の実施形態では、デアミナーゼはシチジンデアミナーゼである。一部の実施形態では、デアミナーゼはアデニンデアミナーゼである。一部の実施形態では、デアミナーゼはAPOPECデアミナーゼである。一部の実施形態では、デアミナーゼは活性化誘導型シチジンデアミナーゼ(AID)である。リコンビナーゼの非限定的な例は、本明細書において提供されるリンカーに結合したチロシンリコンビナーゼを含み、Creリコンビナーゼ、Ginリコンビナーゼ、Flpリコンビナーゼ、及びTnplリコンビナーゼからなる群から選択される。別の態様では、本明細書において提供されるリンカーに結合したセリンリコンビナーゼは、PhiC31インテグラーゼ、R4インテグラーゼ、及びTP-901インテグラーゼからなる群から選択される。別の態様では、本明細書において提供されるリンカーに結合したDNAトランスポザーゼは、TALE-piggyBac及びTALE-Mutatorからなる群から選択される。
【0050】
一態様では、リンカーは、Cas12aヌクレアーゼをコードする第1のアミノ酸配列とHUHエンドヌクレアーゼをコードする第2のアミノ酸配列との間に配置される。別の態様では、リンカーは、CasXヌクレアーゼをコードする第1のアミノ酸配列とHUHエンドヌクレアーゼをコードする第2のアミノ酸配列との間に配置される。
【0051】
一態様では、リンカーはCas12aヌクレアーゼの5'末端に配置される。別の態様では、リンカーはCas12aヌクレアーゼの3'末端に配置される。別の態様では、リンカーはCasXヌクレアーゼの5'末端に配置される。別の態様では、リンカーはCasXヌクレアーゼの3'末端に配置される。別の態様では、リンカーはHUHエンドヌクレアーゼの5'末端に配置される。別の態様では、リンカーはHUHエンドヌクレアーゼの3'末端に配置される。
【0052】
一態様では、リンカーは少なくとも5個のアミノ酸を含む。別の態様では、リンカーは少なくとも10個のアミノ酸を含む。別の態様では、リンカーは少なくとも15個のアミノ酸を含む。別の態様では、リンカーは少なくとも20個のアミノ酸を含む。別の態様では、リンカーは少なくとも25個のアミノ酸を含む。別の態様では、リンカーは少なくとも30個のアミノ酸を含む。別の態様では、リンカーは少なくとも40個のアミノ酸を含む。別の態様では、リンカーは少なくとも50個のアミノ酸を含む。
【0053】
一態様では、リンカーは、5個のアミノ酸と50個のアミノ酸との間を含む。別の態様では、リンカーは、5個のアミノ酸と40個のアミノ酸との間を含む。別の態様では、リンカーは、5個のアミノ酸と30個のアミノ酸との間を含む。別の態様では、リンカーは、5個のアミノ酸と20個のアミノ酸との間を含む。別の態様では、リンカーは、10個のアミノ酸と50個のアミノ酸との間を含む。別の態様では、リンカーは、10個のアミノ酸と40個のアミノ酸との間を含む。別の態様では、リンカーは、10個のアミノ酸と30個のアミノ酸との間を含む。別の態様では、リンカーは、10個のアミノ酸と20個のアミノ酸との間を含む。
【0054】
一態様では、リンカーは1個のアミノ酸を含む。別の態様では、リンカーは2個のアミノ酸を含む。別の態様では、リンカーは3個のアミノ酸を含む。別の態様では、リンカーは4個のアミノ酸を含む。一態様では、リンカーは5個のアミノ酸を含む。別の態様では、リンカーは6個のアミノ酸を含む。別の態様では、リンカーは7個のアミノ酸を含む。別の態様では、リンカーは8個のアミノ酸を含む。別の態様では、リンカーは9個のアミノ酸を含む。別の態様では、リンカーは10個のアミノ酸を含む。別の態様では、リンカーは11個のアミノ酸を含む。別の態様では、リンカーは12個のアミノ酸を含む。別の態様では、リンカーは13個のアミノ酸を含む。別の態様では、リンカーは14個のアミノ酸を含む。別の態様では、リンカーは15個のアミノ酸を含む。別の態様では、リンカーは16個のアミノ酸を含む。別の態様では、リンカーは17個のアミノ酸を含む。別の態様では、リンカーは18個のアミノ酸を含む。別の態様では、リンカーは19個のアミノ酸を含む。別の態様では、リンカーは20個のアミノ酸を含む。別の態様では、リンカーは21個のアミノ酸を含む。別の態様では、リンカーは22個のアミノ酸を含む。別の態様では、リンカーは23個のアミノ酸を含む。別の態様では、リンカーは24個のアミノ酸を含む。別の態様では、リンカーは25個のアミノ酸を含む。別の態様では、リンカーは26個のアミノ酸を含む。別の態様では、リンカーは27個のアミノ酸を含む。別の態様では、リンカーは28個のアミノ酸を含む。別の態様では、リンカーは29個のアミノ酸を含む。別の態様では、リンカーは30個のアミノ酸を含む。
【0055】
一態様では、本開示は、配列番号3と少なくとも70%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも75%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも80%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも85%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも90%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも91%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも92%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも93%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも94%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも95%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも96%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも97%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも98%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と少なくとも99%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。一態様では、本開示は、配列番号3と100%同一又は類似のアミノ酸配列を含む単離されたポリペプチドを提供する。
【0056】
一態様では、リンカーは、配列番号3と少なくとも70%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも75%同一又は類似のアミノ酸配列を含む。一態様では、リンカーは、配列番号3と少なくとも80%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも85%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも90%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも91%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも92%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも93%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも94%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも95%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも96%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも97%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも98%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と少なくとも99%同一又は類似のアミノ酸配列を含む。別の態様では、リンカーは、配列番号3と100%同一又は類似のアミノ酸配列を含む。
【0057】
一態様では、本明細書において提供されるリンカーは、配列番号3を含む。
【0058】
一態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも70%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも75%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも80%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも85%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも90%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも91%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも92%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも93%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも94%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも95%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも96%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも97%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも98%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と少なくとも99%同一のポリヌクレオチド配列を含む。別の態様では、リンカーをコードするポリヌクレオチドは、配列番号6と100%同一のポリヌクレオチド配列を含む。
【0059】
アミノ酸は、炭素原子に結合したカルボン酸(COOH)基及びアミノ基(NH2)を含み、各アミノ酸は更に可変R基を含む。R基の特性に基づいて、アミノ酸は、疎水性(非極性)及び親水性(極性)アミノ酸のグループに特徴付けることができる。
【0060】
疎水性アミノ酸には、グリシン、アラニン、バリン、ロイシン、イソロイシン、メチオニン、プロリン、フェニルアラニン、及びトリプトファンが含まれる。親水性アミノ酸には、チロシン、セリン、スレオニン、システイン、グルタミン、アスパラギン、グルタミン酸、アスパラギン酸、リジン、ヒスチジン、及びアルギニンが含まれる。
【0061】
一態様では、リンカーのアミノ酸配列は、少なくとも5%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも10%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも15%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも20%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも25%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも30%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも35%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも40%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも45%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも50%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも55%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも60%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも65%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも70%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも75%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも80%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも85%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも90%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも95%の疎水性アミノ酸残基を含む。
【0062】
一態様では、リンカーのアミノ酸配列は、5%~90%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~75%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~50%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~25%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、25%~75%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、50%~75%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、10%~75%の疎水性アミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、10%~90%の疎水性アミノ酸残基を含む。
【0063】
一態様では、リンカーのアミノ酸配列の少なくとも10%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも15%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも20%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも25%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも30%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも35%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも40%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも45%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも50%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも55%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも60%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも65%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも70%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも75%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも80%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも85%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも90%は、グリシン、スレオニン、
及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の少なくとも95%は、グリシン、スレオニン、及びセリンの任意の組合せから構成される。
【0064】
一態様では、リンカーのアミノ酸配列の10%~95%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の10%~75%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の10%~50%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の10%~25%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の25%~75%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。別の態様では、リンカーのアミノ酸配列の50%~75%は、グリシン、スレオニン及びセリンの任意の組合せから構成される。
【0065】
生理的pH(例えば、7.4)では、いくつかのアミノ酸は電気的に荷電したR基を有する。例えば、アルギニン、ヒスチジン、及びリジンは正に荷電したアミノ酸であり、セリン、スレオニン、アスパラギン、及びグルタミンは荷電していないアミノ酸であり、アスパラギン酸及びグルタミン酸は負に荷電したアミノ酸である。
【0066】
一態様では、リンカーのアミノ酸配列は、少なくとも5%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも10%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも15%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも20%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも25%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも30%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも35%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも40%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも45%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも50%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも55%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも60%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも65%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも70%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも75%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも80%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも85%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも90%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、少なくとも95%の負に荷電したアミノ酸残基を含む。
【0067】
一態様では、リンカーのアミノ酸配列は、5%~90%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~75%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~50%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、5%~25%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、25%~75%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、50%~75%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、10%~75%の負に荷電したアミノ酸残基を含む。別の態様では、リンカーのアミノ酸配列は、10%~90%の負に荷電したアミノ酸残基を含む。
【0068】
一態様では、本明細書において提供されるリンカーは、インビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるリンカーは、インビトロで組換えベクターから発現され得る。一態様では、本明細書において提供されるリンカーは、エクスビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるリンカーは、インビボで核酸分子から発現され得る。一態様では、本明細書において提供されるリンカーは、インビトロで核酸分子から発現され得る。一態様では、本明細書において提供されるリンカーは、エクスビボで核酸分子から発現され得る。
【0069】
HUHエンドヌクレアーゼは、第1のヒスチジン残基(H)、疎水性アミノ酸残基(U)、及び第2のヒスチジン残基(H)を含む特徴的なモチーフを含む。HUHエンドヌクレアーゼは、古細菌、細菌、及び真核生物から公知である。内因性HUHエンドヌクレアーゼは、ウイルスにおけるローリングサークル複製及び細菌プラスミドコンジュゲーション等の、二本鎖DNAから一本鎖DNAへの移行を伴う細胞プロセスに関与する。HUHエンドヌクレアーゼはまず、複製起点(ori)の特定の配列で一本鎖DNAにニックを入れ、続いて共有結合性のホスホチロシン中間体を形成し、それによってDNA鎖の5'末端がHUHタンパク質の特定のチロシンに連結する。ホスホチロシン連結はインビボでは中間体であるが、精製されたHUHタンパク質はインビトロでori配列を有する合成オリゴヌクレオチドと安定な共有結合を形成することができる。
【0070】
一態様では、HUHエンドヌクレアーゼは複製起点(ori)配列にハイブリダイズする。
【0071】
一態様では、HUHエンドヌクレアーゼは、ブタサーコウイルス2(PCV)HUHエンドヌクレアーゼである。別の態様では、HUHエンドヌクレアーゼは、アヒルサーコウイルス(DCV)HUHエンドヌクレアーゼである。別の態様では、HUHエンドヌクレアーゼは、ソラマメ壊死性黄色ウイルス(FBNYV)HUHエンドヌクレアーゼである。別の態様では、HUHエンドヌクレアーゼは、ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)複製タンパク質RepB(RepB)である。別の態様では、HUHエンドヌクレアーゼは、フルクトバシラス・トロパエオリ(Fructobacillus tropaeoli)RepB(RepBm)である。別の態様では、HUHエンドヌクレアーゼは、大腸菌(Escherichia coli)コンジュゲーションタンパク質TraI(TraI)である。別の態様では、HUHエンドヌクレアーゼは、大腸菌動員タンパク質A(mMobA)である。別の態様では、HUHエンドヌクレアーゼは、黄色ブドウ球菌(Staphylococcus aureus)ニッキング酵素(NES)である。
【0072】
一態様では、HUHエンドヌクレアーゼは、FBNYV HUHエンドヌクレアーゼ、PCV HUHエンドヌクレアーゼ、DCV HUHエンドヌクレアーゼ、RepB、RepBm、Tral、mMobA、及びNESからなる群から選択される。
【0073】
一態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも85%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも90%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも95%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも96%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも97%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも98%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と少なくとも99%同一又は類似のアミノ酸配列を含む。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号2のアミノ酸配列と100%同一又は類似のアミノ酸配列を含む。
【0074】
一態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも85%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも90%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも95%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも96%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも97%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも98%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と少なくとも99%同一又は類似のアミノ酸配列を含む。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号14のアミノ酸配列と100%同一又は類似のアミノ酸配列を含む。
【0075】
一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも80%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも85%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも90%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも95%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも96%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも97%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも98%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と少なくとも99%同一又は類似のアミノ酸配列を含む。一態様では、HUHエンドヌクレアーゼは、配列番号2及び14からなる群から選択されるアミノ酸配列と100%同一又は類似のアミノ酸配列を含む。
【0076】
一態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも80%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも85%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも90%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも95%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも96%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも97%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも98%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と少なくとも99%同一の核酸配列によりコードされる。別の態様では、FBNYV HUHエンドヌクレアーゼは、配列番号5の核酸配列と100%同一の核酸配列によりコードされる。
【0077】
一態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも80%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも85%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも90%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも95%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも96%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも97%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも98%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と少なくとも99%同一の核酸配列によりコードされる。別の態様では、PCV HUHエンドヌクレアーゼは、配列番号13の核酸配列と100%同一の核酸配列によりコードされる。
【0078】
一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも80%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも85%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも90%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも95%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも96%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも97%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも98%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と少なくとも99%同一の核酸配列によりコードされる。一態様では、HUHエンドヌクレアーゼは、配列番号5及び13からなる群から選択される核酸配列と100%同一の核酸配列によりコードされる。
【0079】
一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、インビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、インビトロで組換えベクターから発現され得る。一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、エクスビボで組換えベクターから発現され得る。一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、インビボで核酸分子から発現され得る。一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、インビトロで核酸分子から発現され得る。一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、エクスビボで核酸分子から発現され得る。
【0080】
一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも80%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも85%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも90%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも95%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも96%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも97%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも98%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも99%同一又は類似のアミノ酸配列を含む。一態様では、リボ核タンパク質は、配列番号20~23及び25からなる群から選択されるアミノ酸と100%同一又は類似のアミノ酸配列を含む。
【0081】
一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも80%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも85%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも90%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも95%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも96%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも97%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも98%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と少なくとも99%同一又は類似のアミノ酸配列をコードする。一態様では、組換え核酸は、配列番号20~23及び25からなる群から選択されるアミノ酸と100%同一又は類似のアミノ酸配列をコードする。
【0082】
態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも80%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも85%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも90%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも95%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも96%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも97%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも98%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも99%同一のポリヌクレオチド配列を含む。態様では、組換え核酸は、配列番号7、17~19、及び24からなる群から選択される配列と少なくとも100%同一のポリヌクレオチド配列を含む。
【0083】
本明細書中で使用される「鋳型核酸分子」とは、標的DNA分子に挿入されるべき核酸配列を含む核酸分子を指す。一態様では、鋳型核酸分子は一本鎖DNAを含む。別の態様では、鋳型核酸分子は二本鎖DNAを含む。更なる態様では、鋳型核酸分子は一本鎖RNAを含む。なお別の態様では、鋳型核酸分子は二本鎖RNAを含む。別の態様では、鋳型核酸分子はDNA及びRNAを含む。
【0084】
一態様では、リボ核タンパク質は、少なくとも1つの鋳型核酸分子を含む。別の態様では、リボ核タンパク質は、少なくとも2つの鋳型核酸分子を含む。
【0085】
一態様では、鋳型核酸分子は少なくとも10ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも25ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも50ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも75ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも100ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも250ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも500ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも750ヌクレオチドを含む。別の態様では、鋳型核酸分子は少なくとも1000ヌクレオチドを含む。別の態様では、鋳型核酸分子は、少なくとも2500ヌクレオチドを含む。
【0086】
一態様では、鋳型核酸分子は、10ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、25ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、50ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、75ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、100ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、250ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、500ヌクレオチド~2500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、25ヌクレオチド~1000ヌクレオチドを含む。別の態様では、鋳型核酸分子は、25ヌクレオチド~500ヌクレオチドを含む。別の態様では、鋳型核酸分子は、25ヌクレオチド~250ヌクレオチドを含む。
【0087】
上述のように、HUHエンドヌクレアーゼはまず、複製起点(ori)の特定の配列で一本鎖DNAにニックを入れ、続いて共有結合性のホスホチロシン中間体を形成し、それによってDNA鎖の5'末端がHUHタンパク質の特定のチロシンに連結する。ホスホチロシン連結はインビボでは中間体であるが、精製されたHUHタンパク質はインビトロでori配列を有する合成オリゴヌクレオチドと安定な共有結合を形成することができる。
【0088】
態様では、鋳型核酸分子は、複製起点(ori)をコードする核酸配列を含む。一態様では、本明細書において提供されるoriは、HUHエンドヌクレアーゼにハイブリダイズすることができる。一態様では、oriは、配列番号12と少なくとも80%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも85%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも90%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも95%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも96%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも97%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも98%同一の核酸配列を含む。別の態様では、oriは、配列番号12と少なくとも99%同一の核酸配列を含む。別の態様では、oriは、配列番号12と100%同一の核酸配列を含む。一態様では、oriは、配列番号27と少なくとも80%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも85%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも90%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも95%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも96%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも97%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも98%同一の核酸配列を含む。別の態様では、oriは、配列番号27と少なくとも99%同一の核酸配列を含む。別の態様では、oriは、配列番号27と100%同一の核酸配列を含む。一態様では、oriは、配列番号28と少なくとも80%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも85%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも90%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも95%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも96%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも97%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも98%同一の核酸配列を含む。別の態様では、oriは、配列番号28と少なくとも99%同一の核酸配列を含む。別の態様では、oriは、配列番号28と100%同一の核酸配列を含む。
【0089】
一態様では、oriは、少なくとも10ヌクレオチドを含む。一態様では、oriは、少なくとも15ヌクレオチドを含む。一態様では、oriは、少なくとも20ヌクレオチドを含む。一態様では、oriは、少なくとも25ヌクレオチドを含む。一態様では、oriは、少なくとも30ヌクレオチドを含む。一態様では、oriは、少なくとも40ヌクレオチドを含む。
【0090】
一態様では、oriは、鋳型核酸分子の5'末端に配置される。別の態様では、oriは、鋳型核酸分子の3'末端に配置される。
【0091】
一態様では、鋳型核酸分子は、目的とする遺伝子をコードする核酸配列を含む。本明細書で使用される場合、「目的の遺伝子」とは、標的DNA分子に挿入されるべきタンパク質又はタンパク質をコードしない(non-protein-coding)RNA分子をコードするポリヌクレオチド配列を指す。一態様では、目的の遺伝子は、タンパク質をコードする。別の態様では、目的の遺伝子は、タンパク質をコードしないRNA分子をコードする。
【0092】
タンパク質をコードしないRNA分子の非限定的な例には、マイクロRNA(miRNA)、miRNA前駆体(プレmiRNA)、低分子干渉RNA(siRNA)、低分子RNA(長さが18~26ヌクレオチド)及びそれをコードする前駆体、ヘテロクロマチンsiRNA(hc-siRNA)、Piwi相互作用RNA(piRNA)、ヘアピン二本鎖RNA(ヘアピンdsRNA)、トランス作用性siRNA(ta-siRNA)、天然に存在するアンチセンスsiRNA(nat-siRNA)、CRISPR RNA(crRNA)、トレーサーRNA(tracrRNA)、ガイドRNA(gRNA)、及び単一ガイドRNA(sgRNA)が挙げられる。一態様では、タンパク質をコードしないRNA分子はmiRNAを含む。一態様では、タンパク質をコードしないRNA分子はsiRNAを含む。一態様では、タンパク質をコードしないRNA分子はta-siRNAを含む。一態様では、タンパク質をコードしないRNA分子は、miRNA、siRNA、及びta-siRNAからなる群から選択される。
【0093】
一態様では、目的の遺伝子は、標的DNA分子に対して外因性である。一態様では、目的の遺伝子は、標的DNA分子の内因性遺伝子を置換する。
【0094】
本明細書で使用される場合、「標的DNA分子」とは、修飾(例えば、切断、部位特異的組込み)が所望される、選択されたDNA分子、又はDNA分子の選択された配列若しくは領域を指す。
【0095】
本明細書で使用される場合、「標的領域」とは、CRISPRヌクレアーゼによって切断される標的DNA分子の一部を指す。非標的核酸(例えば、非標的ssDNA)又は非標的領域とは対照的に、標的部位は、ガイド核酸又はガイドRNAに対して有意な相補性を含む。
【0096】
一態様では、標的部位は、ガイド核酸に対して100%相補的である。別の態様では、標的部位は、ガイド核酸に対して99%相補的である。別の態様では、標的部位は、ガイド核酸に対して98%相補的である。別の態様では、標的部位は、ガイド核酸に対して97%相補的である。別の態様では、標的部位は、ガイド核酸に対して96%相補的である。別の態様では、標的部位は、ガイド核酸に対して95%相補的である。別の態様では、標的部位は、ガイド核酸に対して94%相補的である。別の態様では、標的部位は、ガイド核酸に対して93%相補的である。別の態様では、標的部位は、ガイド核酸に対して92%相補的である。別の態様では、標的部位は、ガイド核酸に対して91%相補的である。別の態様では、標的部位は、ガイド核酸に対して90%相補的である。別の態様では、標的部位は、ガイド核酸に対して85%相補的である。別の態様では、標的部位は、ガイド核酸に対して80%相補的である。
【0097】
一態様では、標的部位は、少なくとも1つのPAM部位を含む。一態様では、標的部位は、少なくとも1つのPAM部位を含む核酸配列に隣接する。別の態様では、標的部位は、少なくとも1つのPAM部位の5ヌクレオチド内にある。更なる態様では、標的部位は、少なくとも1つのPAM部位の10ヌクレオチド内にある。別の態様では、標的部位は、少なくとも1つのPAM部位の15ヌクレオチド内にある。別の態様では、標的部位は、少なくとも1つのPAM部位の20ヌクレオチド内にある。別の態様では、標的部位は、少なくとも1つのPAM部位の25ヌクレオチド内にある。別の態様では、標的部位は、少なくとも1つのPAM部位の30ヌクレオチド内にある。
【0098】
一態様では、標的DNA分子は一本鎖である。別の態様では、標的DNA分子は二本鎖である。
【0099】
一態様では、標的DNA分子はゲノムDNAを含む。一態様では、標的DNA分子は核ゲノム内に配置される。一態様では、標的DNA分子は染色体DNAを含む。一態様では、標的DNA分子はプラスミドDNAを含む。一態様では、標的DNA分子はプラスミド内に配置される。一態様では、標的DNA分子はミトコンドリアDNAを含む。一態様では、標的DNA分子はミトコンドリアゲノム内に配置される。一態様では、標的DNA分子は色素体DNAを含む。一態様では、標的DNA分子は色素体ゲノム内に配置される。一態様では、標的DNA分子は葉緑体DNAを含む。一態様では、標的DNA分子は葉緑体ゲノム内に配置される。一態様では、標的DNA分子は、核ゲノム、ミトコンドリアゲノム、及び色素体ゲノムからなる群から選択されるゲノム内に配置される。
【0100】
一態様では、標的DNA分子は遺伝子DNAを含む。本明細書で使用される場合、「遺伝子DNA」とは、1つ以上の遺伝子をコードするDNAを指す。別の態様では、標的DNA分子は遺伝子間DNAを含む。遺伝子DNAとは対照的に、「遺伝子間DNA」は非コードDNAを含み、遺伝子をコードするDNAを欠く。一態様では、遺伝子間DNAは2つの遺伝子の間に配置される。
【0101】
一態様では、標的核酸は遺伝子をコードする。本明細書で使用される場合、「遺伝子」とは、機能的ユニット(例えば、限定されないが、タンパク質又は非コードRNA分子)を産生することができるポリヌクレオチドを指す。遺伝子は、プロモーター、エンハンサー配列、リーダー配列、転写開始部位、転写停止部位、ポリアデニル化部位、1つ以上のエキソン、1つ以上のイントロン、5'-UTR、3'-UTR、又はそれらの任意の組合せを含むことができる。「遺伝子配列」は、プロモーター、エンハンサー配列、リーダー配列、転写開始部位、転写停止部位、ポリアデニル化部位、1つ以上のエキソン、1つ以上のイントロン、5'-UTR、3'-UTR、又はそれらの任意の組合せをコードするポリヌクレオチド配列を含むことができる。一態様では、遺伝子は、タンパク質をコードしないRNA分子又はその前駆体をコードする。別の態様では、遺伝子はタンパク質をコードする。一部の実施形態では、標的DNA分子は、プロモーター、エンハンサー配列、リーダー配列、転写開始部位、転写停止部位、ポリアデニル化部位、エキソン、イントロン、スプライス部位、5'-UTR、3'-UTR、タンパク質をコードする配列、タンパク質をコードしない配列、miRNA、プレmiRNA及びmiRNA結合部位からなる群から選択される。
【0102】
一態様では、本開示は、標的DNA分子において編集を生成する方法であって、標的DNA分子をリボ核タンパク質と接触させる工程を含み、リボ核タンパク質は、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;(b)少なくとも1つのガイド核酸;並びに(c)少なくとも1つの鋳型核酸分子を含み、リボ核タンパク質は標的DNA分子を編集する方法を提供する。一態様では、本開示は、標的DNA分子において編集を生成する方法であって、標的DNA分子をリボ核タンパク質と接触させる工程を含み、リボ核タンパク質は、(a)(i)CasXヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド;(b)少なくとも1つのガイド核酸;並びに(c)少なくとも1つの鋳型核酸分子を含み、リボ核タンパク質は標的DNA分子を編集する方法を提供する。一態様では、本明細書において提供される方法は、(d)標的DNA分子における少なくとも1つの編集を検出する工程を更に含む。
【0103】
一態様では、本開示は、標的DNA分子において編集を生成する方法であって、細胞に、(a)(i)Cas12aヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド、又は組換えポリペプチドをコードする1つ以上の核酸分子;(b)少なくとも1つのガイド核酸、又は少なくとも1つのガイド核酸をコードする少なくとも1つの核酸分子;並びに(c)少なくとも1つの鋳型核酸分子、又は少なくとも1つの鋳型核酸分子をコードする少なくとも1つの核酸分子を提供する工程を含み、組換えポリペプチド、少なくとも1つのガイド核酸、及び少なくとも1つの鋳型核酸はリボ核タンパク質を形成し、リボ核タンパク質は細胞内の標的DNA分子において少なくとも1つの編集を生成する方法を提供する。一態様では、本開示は、標的DNA分子において編集を生成する方法であって、細胞に、(a)(i)CasXヌクレアーゼをコードするアミノ酸配列;(ii)リンカーをコードするアミノ酸配列;及び(iii)HUHエンドヌクレアーゼをコードするアミノ酸配列を含む組換えポリペプチド、又は組換えポリペプチドをコードする1つ以上の核酸分子;(b)少なくとも1つのガイド核酸、又は少なくとも1つのガイド核酸をコードする少なくとも1つの核酸分子;並びに(c)少なくとも1つの鋳型核酸分子、又は少なくとも1つの鋳型核酸分子をコードする少なくとも1つの核酸分子を提供する工程を含み、組換えポリペプチド、少なくとも1つのガイド核酸、及び少なくとも1つの鋳型核酸はリボ核タンパク質を形成し、リボ核タンパク質は細胞内の標的DNA分子において少なくとも1つの編集を生成する方法を提供する。一態様では、本明細書において提供される方法は、(d)標的DNA分子における少なくとも1つの編集を検出する工程を更に含む。一態様では、リボ核タンパク質は細胞内で形成される。一態様では、リボ核タンパク質は細胞外で形成される。一態様では、リボ核タンパク質はインビボで形成される。一態様では、リボ核タンパク質はインビトロで形成される。
【0104】
一態様では、本明細書において提供される編集は突然変異を含む。本明細書で使用される場合、「突然変異」とは、同じ生物由来の天然に存在する参照核酸又はアミノ酸配列と比較した場合、核酸又はアミノ酸配列に対する天然に存在しない変更を指す。突然変異を同定する場合、参照配列は、同じ核酸(例えば、遺伝子、非コードRNA)又はアミノ酸(例えば、タンパク質)からでなければならないことが理解される。2つの配列間の差異が突然変異を含むかどうかを決定する際に、当該技術分野では、2つの異なる種の相同配列間、又は単一の種の2つの異なる種の相同配列間で比較すべきではないことが理解される。むしろ、編集された配列と、同じ生物の内因性の編集されていない(例えば、「野生型」)配列との比較を行うべきである。
【0105】
一態様では、突然変異は、少なくとも1つのヌクレオチド又はアミノ酸の挿入を含む。別の態様では、突然変異は、少なくとも1つのヌクレオチド又はアミノ酸の欠失を含む。更なる態様では、突然変異は、少なくとも1つのヌクレオチド又はアミノ酸の置換を含む。なお更なる態様では、突然変異は、少なくとも2つのヌクレオチド又はアミノ酸の逆位を含む。別の態様では、突然変異は、挿入、欠失、置換、及び逆位からなる群から選択される。
【0106】
一態様では、突然変異は、部位特異的組込みを含む。一態様では、部位特異的組込みは、鋳型核酸分子の全部又は一部を標的DNA分子に挿入することを含む。
【0107】
本明細書で使用される場合、「部位特異的組込み」とは、植物ゲノム(例えば、標的DNA分子)内の所望の部位若しくは遺伝子座に挿入又は組み込まれる所望の配列(例えば、鋳型核酸分子)の全て又は一部を指す。所望の配列は、導入遺伝子又は構築物を含むことができる。一態様では、鋳型核酸分子は、相同組換え及び/又は相同性指向性修復を介して標的化された挿入事象を促進するために、所望の配列に隣接する1つ又は2つの相同アームを含む。
【0108】
植物、動物、真菌、若しくは細菌のゲノム内の任意の部位又は遺伝子座は、潜在的に、本開示の導入遺伝子又は構築物の部位特異的組込みのために選択され得る。
【0109】
部位特異的組込みのために、二本鎖切断(DSB)又はニックは、まず、本明細書において提供されるRNAガイド型CRISPRヌクレアーゼ又はリボ核タンパク質を介して標的DNA分子で作製され得る。鋳型核酸分子の存在下では、次に、DSB又はニックは、鋳型核酸分子の相同アームと標的DNA分子との間の相同組換え(HR)によって、又は非相同末端結合(NHEJ)によって修復され得、鋳型核酸分子の全部又は一部の標的DNA分子への部位特異的組込みをもたらし、DSB又はニックの部位で標的化された挿入事象を作製する。
【0110】
一態様では、部位特異的組込みは、細胞に内因性のNHEJ修復メカニズムの使用を含む。別の態様では、部位特異的組込みは、細胞に内因性のHR修復メカニズムの使用を含む。
【0111】
一態様では、突然変異は、鋳型核酸分子の少なくとも5個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも10個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも15個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも20個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも25個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも50個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも100個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも250個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも500個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも1000個の連続するヌクレオチドの標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の少なくとも2000個の連続するヌクレオチドの標的DNA分子への組込みを含む。
【0112】
一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと3500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと2500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと1500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと750個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと250個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の5個の連続ヌクレオチドと150個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の25個の連続ヌクレオチドと2500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の25個の連続ヌクレオチドと1500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の25個の連続ヌクレオチドと750個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の50個の連続ヌクレオチドと2500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の50個の連続ヌクレオチドと1500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の50個の連続ヌクレオチドと750個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の100個の連続ヌクレオチドと2500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の100個の連続ヌクレオチドと1500個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。一態様では、突然変異は、鋳型核酸分子の1
00個の連続ヌクレオチドと750個の連続ヌクレオチドとの間の標的DNA分子への組込みを含む。
【0113】
一態様では、本明細書において提供される方法は、標的DNA分子における編集又は突然変異を検出する工程を含む。標的DNA分子における編集又は突然変異を検出することができる当該技術分野において利用可能な任意の方法。限定されないが、編集又は突然変異を検出するための適切な方法には、サザンブロット、ポリメラーゼ連鎖反応(PCR)、及び核酸配列決定が挙げられる。
【0114】
本明細書において提供される任意の方法は、目的の細胞(例えば、真核細胞、原核細胞)の一過性のトランスフェクション又は安定な形質転換を伴うことができる。一態様では、本明細書において提供される核酸分子は、細胞に安定に形質転換される。一態様では、本明細書において提供される核酸分子は、細胞に一過性にトランスフェクトされる。
【0115】
一態様では、Cas12aヌクレアーゼをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、Cas12aヌクレアーゼをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、Cas12aヌクレアーゼは細胞にトランスフェクトされる。
【0116】
一態様では、CasXヌクレアーゼをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、CasXヌクレアーゼをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、CasXヌクレアーゼは細胞にトランスフェクトされる。
【0117】
一態様では、リンカーをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、リンカーをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、リンカーは細胞にトランスフェクトされる。
【0118】
一態様では、HUHエンドヌクレアーゼをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、HUHエンドヌクレアーゼをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、HUHエンドヌクレアーゼは細胞にトランスフェクトされる。
【0119】
一態様では、FBNYV HUHエンドヌクレアーゼをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、FBNYV HUHエンドヌクレアーゼをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、FBNYV HUHエンドヌクレアーゼは細胞にトランスフェクトされる。
【0120】
一態様では、PCV HUHエンドヌクレアーゼをコードする核酸分子は、細胞に安定に形質転換される。別の態様では、PCV HUHエンドヌクレアーゼをコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、PCV HUHエンドヌクレアーゼは細胞にトランスフェクトされる。
【0121】
一態様では、ガイド核酸をコードする核酸分子は、細胞に安定に形質転換される。別の態様では、ガイド核酸をコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、ガイド核酸は細胞にトランスフェクトされる。
【0122】
一態様では、鋳型核酸分子をコードする核酸分子は、細胞に安定に形質転換される。別の態様では、鋳型核酸分子をコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、鋳型核酸分子は細胞にトランスフェクトされる。
【0123】
一態様では、リボ核タンパク質の1つ以上の成分をコードする核酸分子は、細胞に安定に形質転換される。別の態様では、リボ核タンパク質の1つ以上の成分をコードする核酸分子は、細胞に一過性にトランスフェクトされる。別の態様では、リボ核タンパク質は細胞にトランスフェクトされる。
【0124】
組換え核酸分子又は構築物で細胞を形質転換するための多数の方法は、当該技術分野において公知であり、本出願の方法に従って使用することができる。当該技術分野において公知である細胞の形質転換のための任意の適切な方法又は技術が、本方法に従って使用することができる。植物の形質転換のための効果的な方法には、アグロバクテリウム(Agrobacterium)を媒介した形質転換又はリゾビウム(Rhizobium)を媒介した形質転換等の細菌を媒介した形質転換、及びマイクロプロジェクタイル衝撃を媒介した形質転換が含まれる。細菌を媒介した形質転換又はマイクロプロジェクタイル衝撃を介して、外植片を形質転換ベクターで形質転換し、次に、それらの外植片を培養する等して、トランスジェニック植物を再生又は発生させるための種々の方法が当該技術分野において公知である。
【0125】
一態様では、方法は、アグロバクテリウム媒介性形質転換を介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、ポリエチレングリコール媒介性形質転換を介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、バイオリスティック法による形質転換を介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、リポソーム媒介性トランスフェクションを介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、ウイルス形質導入を介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、1つ以上の送達粒子の使用を介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、マイクロインジェクションを介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。一態様では、方法は、エレクトロポレーションを介して、核酸分子、タンパク質、又はリボ核タンパク質を細胞に提供する工程を含む。
【0126】
一態様では、核酸分子は、アグロバクテリウム媒介性形質転換、ポリエチレングリコール媒介性形質転換、バイオリスティック形質転換、リポソーム媒介性トランスフェクション、ウイルス形質導入、1つ以上の送達粒子の使用、マイクロインジェクション、及びエレクトロポレーションからなる群から選択される方法を介して細胞に提供される。
【0127】
一態様では、タンパク質は、アグロバクテリウム媒介性形質転換、ポリエチレングリコール媒介性形質転換、バイオリスティック形質転換、リポソーム媒介性トランスフェクション、ウイルス形質導入、1つ以上の送達粒子の使用、マイクロインジェクション、及びエレクトロポレーションからなる群から選択される方法を介して細胞に提供される。
【0128】
一態様では、リボ核タンパク質は、アグロバクテリウム媒介性形質転換、ポリエチレングリコール媒介性形質転換、バイオリスティック形質転換、リポソーム媒介性トランスフェクション、ウイルス形質導入、1つ以上の送達粒子の使用、マイクロインジェクション、及びエレクトロポレーションからなる群から選択される方法を介して細胞に提供される。
【0129】
真空浸透、圧力、超音波処理、及び炭化ケイ素繊維撹拌等の形質転換するための他の方法もまた当該技術分野において公知であり、本明細書において提供される任意の方法とともに使用することが想定される。
【0130】
細胞を形質転換するための方法は、当業者によって周知である。例えば、組換えDNAでコーティングされた粒子(例えば、バイオリスティック法による形質転換)を用いたマイクロプロジェクタイル衝撃によって植物細胞を形質転換するための具体的な説明書は、米国特許第5,550,318号、同第5,538,880号、同第6,160,208号、同第6,399,861号、及び同第6,153,812号に見出され、アグロバクテリウム媒介性形質転換は、米国特許第5,159,135号、同第5,824,877号、同第5,591,616号、同第6,384,301号、同第5,750,871号、同第5,463,174号、及び同第5,188,958号に見出され、それらの全ては参照により本明細書に組み込まれる。植物を形質転換するための更なる方法は、例えば、Compendium of Transgenic Crop Plants (2009) Blackwell Publishingに見出すことができる。当業者に公知である任意の適切な方法を使用して、本明細書において提供される核酸分子のいずれかを用いて植物細胞を形質転換することができる。
【0131】
リポフェクションは、例えば、米国特許第5,049,386号、同第4,946,787号及び同第4,897,355号に記載され、リポフェクション試薬は市販されている(例えば、Transfectam(商標)及びLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションに適したカチオン性及び中性脂質には、Felgner、国際公開第91/17424号、同第91/16024号のものが含まれる。送達は、細胞(例えば、インビトロ又はエクスビボでの投与)又は標的組織(例えば、インビボでの投与)に対してであり得る。
【0132】
核酸分子又はタンパク質の1つ以上のエレメントを発現させるための送達ビヒクル、ベクター、粒子、ナノ粒子、製剤及びそれらの成分は、国際公開第2014/093622号(PCT/US2013/074667)において使用される。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、送達粒子を介した送達を含む。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、送達小胞を介した送達を含む。一態様では、送達小胞は、エキソソーム及びリポソームからなる群から選択される。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、ウイルスベクターを介した送達を含む。一態様では、ウイルスベクターは、アデノウイルスベクター、レンチウイルスベクター、及びアデノ随伴ウイルスベクターからなる群から選択される。別の態様では、核酸分子又はタンパク質を細胞に提供するための方法は、ナノ粒子を介した送達を含む。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、マイクロインジェクションを含む。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、ポリカチオンを含む。一態様では、核酸分子又はタンパク質を細胞に提供するための方法は、カチオン性オリゴペプチドを含む。
【0133】
一態様では、送達粒子は、エキソソーム、アデノウイルスベクター、レンチウイルスベクター、アデノ随伴ウイルスベクター、ナノ粒子、ポリカチオン、及びカチオン性オリゴペプチドからなる群から選択される。一態様では、本明細書において提供される方法は、1つ以上の送達粒子の使用を含む。別の態様では、本明細書において提供される方法は、2つ以上の送達粒子の使用を含む。別の態様では、本明細書において提供される方法は、3つ以上の送達粒子の使用を含む。
【0134】
植物細胞へのタンパク質、核酸、突然変異原及びリボ核タンパク質の移動を容易にするのに適した薬剤には、植物細胞の外側の透過性を増加させる薬剤、又は植物細胞のオリゴヌクレオチド、ポリヌクレオチド、タンパク質、若しくはリボ核タンパク質に対する透過性を増加させる薬剤が含まれる。植物細胞への組成物の移動を容易にするこのような薬剤は、化学的薬剤、又は物理的薬剤、又はそれらの組合せを含む。馴化のための化学的薬剤は、(a)界面活性剤、(b)有機溶媒若しくは水性溶液若しくは有機溶媒の水性混合物、(c)酸化剤、(e)酸、(f)塩基、(g)油、(h)酵素、又はそれらの組合せを含む。
【0135】
ポリヌクレオチドによって透過させるために植物の馴化に有用な有機溶媒には、DMSO、DMF、ピリジン、N-ピロリジン、ヘキサメチルホスホルアミド、アセトニトリル、ジオキサン、ポリプロピレングリコール、水と混和するか又は非水系にホスホヌクレオチドを溶解する他の溶媒(合成反応用いられるもの等)が含まれる。界面活性剤若しくは乳化剤を含むか又は含まない天然由来又は合成の油を使用することができ、例えば、植物供給源の油、穀物油(例えば、www.herbicide.adjuvants.comでオンラインにて公衆に利用可能である第9回Compendium of Herbicide Adjuvantsに列挙されているもの)、例えば、パラフィン油、ポリオール脂肪酸エステル、又はポリエチレンイミン又はN-ピロリジン等のアミド又はポリアミンで修飾された短鎖分子を有する油を用いることができる。
【0136】
有用な界面活性剤の例としては、脂肪酸のナトリウム塩又はリチウム塩(獣油又はタロワミン又はリン脂質等)及び有機シリコーン界面活性剤が挙げられる。他の有用な界面活性剤には、有機シリコーン界面活性剤、例えば、非イオン性有機シリコーン界面活性剤、例えば、トリシロキサンエトキシレート界面活性剤又はシリコーンポリエーテルコポリマー、例えば、ポリアルキレンオキシド修飾されたヘプタメチルトリシロキサンとアリルオキシポリプロピレングリコールメチルエーテルのコポリマー(Silwet(登録商標)L-77として市販されている)が挙げられる。
【0137】
有用な物理的な薬剤は、(a)研磨剤、例えば、カーボランダム、コランダム、サンド、カルサイト、軽石、ガーネット等、(b)ナノ粒子、例えば、カーボンナノチューブ、又は(c)物理的力を含むことができる。カーボンナノチューブは、Kamら(2004) /. Am. Chem. Soc、126 (22):6850-6851、Liuら(2009) Nano Lett、9(3): 1007-1010、及びKhodakovskayaら(2009) ACS Nano、3(10):3221-3227により開示されている。物理的な力薬剤には、加熱、冷却、陽圧の印加、又は超音波処置が含まれ得る。本方法の実施形態は、場合により、インキュベーション工程、中和工程(例えば、酸、塩基、若しくは酸化剤を中和するため、又は酵素を不活化するため)、濯ぎ工程、又はそれらの組合せを含むことができる。本発明の方法は、更に、特定の遺伝子のサイレンシングに起因して増強された効果を有する他の薬剤の適用を含むことができる。例えば、ポリヌクレオチドが除草剤耐性を提供する遺伝子を調節するように設計される場合、除草剤のその後の適用は除草剤の効力に劇的な影響を及ぼす可能性がある。
【0138】
ポリヌクレオチドによる透過への植物細胞の実験室馴化のための薬剤には、例えば、化学的薬剤の適用、酵素処理、加熱若しくは冷却、陽圧若しくは陰圧処理、又は超音波処理が含まれる。野外の植物を馴化するための薬剤には、界面活性剤及び塩等の化学的薬剤が含まれる。
【0139】
一態様では、形質転換又はトランスフェクトされた細胞は原核細胞である。別の態様では、形質転換又はトランスフェクトされた細胞は真核細胞である。別の態様では、形質転換又はトランスフェクトされた細胞は植物細胞である。別の態様では、形質転換又はトランスフェクトされた細胞は動物細胞である。別の態様では、形質転換又はトランスフェクトされた細胞は真菌細胞である。
【0140】
形質転換のためのレシピエント植物細胞又は外植片標的には、限定されないが、種子細胞、果実細胞、葉細胞、子葉細胞、胚軸細胞、メリステム細胞、胚細胞、内胚乳細胞、根細胞、シュート細胞、幹細胞、鞘細胞、花細胞、花序細胞、茎細胞、小花柄細胞、スタイル細胞、柱頭細胞、花托細胞、花弁細胞、萼片細胞(sepal cell)、花粉細胞、葯細胞、フィラメント細胞、子房細胞、胚珠細胞、果皮細胞、師管細胞、芽細胞、又は維管束組織細胞が挙げられる。別の態様では、本開示は、植物葉緑体を提供する。更なる態様では、本開示は、表皮細胞、気孔細胞、トリコーム細胞、根毛細胞、貯蔵根細胞、又は塊茎細胞を提供する。別の態様では、本開示は、プロトプラストを提供する。別の態様では、本開示は、植物カルス細胞を提供する。受精植物が再生され得る任意の細胞は、本開示の実施のための有用な受容細胞として企図される。カルスは、種々の組織供給源から開始することができ、限定されないが、未成熟胚、又は胚の一部、実生頂端メリステム、小胞子等が挙げられる。カルスとして増殖することができるそれらの細胞は、形質転換の受容細胞として役立つことができる。本開示のトランスジェニック植物を作製するための実際的な形質転換方法及び材料(例えば、種々の培地及び受容標的細胞、未成熟胚の形質転換、及びその後の受精トランスジェニック植物の再生)は、例えば、米国特許第6,194,636号及び同第6,232,526号並びに米国特許出願公開第2004/0216189号に開示されており、これらの全ては、参照により本明細書に組み込まれる。形質転換された外植片、細胞又は組織は、当該技術分野において公知である、カルス誘導、選択、再生等の追加の培養工程に供することができる。組換えDNA挿入を含む形質転換された細胞、組織又は外植片は、当該技術分野において公知である方法に従って、培養、プラグ又は土壌中で、トランスジェニック植物に増殖、発生又は再生することができる。一態様では、本開示は、繁殖材料ではなく、植物の自然繁殖を媒介しない植物細胞を提供する。別の態様では、本開示はまた、繁殖材料であり、植物の自然繁殖を媒介する植物細胞を提供する。別の態様では、本開示は、光合成を介して自らを維持することができない植物細胞を提供する。別の態様では、本開示は、体細胞植物細胞を提供する。体細胞は、生殖系列細胞とは対照的に、植物の繁殖を媒介しない。一態様では、本開示は、非繁殖植物細胞を提供する。
【0141】
一態様では、本明細書において提供される任意の核酸分子、ポリペプチド、又はリボ核タンパク質は細胞内にある。別の態様では、本明細書において提供される任意の核酸分子、ポリペプチド、又はリボ核タンパク質は原核細胞内にある。一態様では、本明細書中で提供される任意の核酸分子、ポリペプチド、又はリボ核タンパク質は真核細胞内にある。
【0142】
一態様では、本明細書において提供される任意の細胞は宿主細胞である。一態様では、宿主細胞は、本明細書において提供される任意のリボ核タンパク質を含む。一態様では、宿主細胞は、本明細書において提供される任意のポリペプチドを含む。一態様では、宿主細胞は、本明細書において提供される任意の核酸分子を含む。
【0143】
一態様では、宿主細胞は、植物細胞、細菌細胞、哺乳動物細胞、真菌細胞、昆虫細胞、クモ類細胞、トリ細胞、魚細胞、爬虫類細胞、及び両生類細胞からなる群から選択される。別の態様では、宿主植物細胞は、トウモロコシ細胞、大豆細胞、綿細胞、キャノーラ細胞、イネ細胞、小麦細胞、ソルガム細胞、アルファルファ細胞、サトウキビ細胞、キビ細胞、トマト細胞、ジャガイモ細胞、及び藻類細胞からなる群から選択される。別の態様では、宿主細胞は大腸菌細胞である。
【0144】
一態様では、原核細胞は、アシドバクテリア(Acidobacteria)門、アクチノバクテリア(Actinobacteria)門、アクウィフェクス(Aquificae)門、アルマティモナス(Armatimonadetes)門、バクテロイデス(Bacteroidetes)門、カルディセリクム(Caldiserica)門、クラミジア(Chlamydie)門、クロロビウム(Chlorobi)門、クロロフレクサス(Chloroflexi)門、クリシオゲネス(Chrysiogenetes)門、コプロサーモバクテリオタ(Coprothermobacterota)門、シアノバクテリア(Cyanobacteria)門、デフェリバクター(Deferribacteres)門、デイノコッカス-サーマス(Deinococcus-Thermus)門、ディクチオグロミ(Dictyoglomi)門、エルシミクロビウム(Elusimicrobia)門、フィブロバクター(Fibrobacteres)門、ファーミキューテス(Firmicutes)門、フソバクテリウム(Fusobacteria)門、ゲンマティモナス(Gemmatimonadetes)門、レンティスファエラ(Lentisphaerae)門、ニトロスピラ(Nitrospirae)門、プランクトミケス(Planctomycetes)門、プロテオバクテリア(Proteobacteria)門、スピロヘータ(Spirochaetes)門、シネルギステス(Synergistetes)門、テネリクテス(Tenericutes)門、サーモデスルフォバクテリア(Thermodesulfobacteria)門、サーモトーガ(Thermotogae)門、及びウェルコミクロビウム(Verrucomicrobia)門からなる群から選択される門から由来の細胞である。別の態様では、原核細胞は大腸菌細胞である。別の態様では、原核細胞は、エシェリキア(Escherichia)属、アグロバクテリウム(Agrobacterium)属、リゾビウム(Rhizobium)属、シノリゾビウム(Sinorhizobium)属、及びスタフィロコッカス(Staphylococcus)属からなる群から選択される属から選択される。
【0145】
一態様では、真核細胞はエクスビボ細胞である。別の態様では、真核細胞は植物細胞である。別の態様では、真核細胞は、培養中の植物細胞である。別の態様では、真核細胞は被子植物細胞である。別の態様では、真核細胞は裸子植物細胞である。別の態様では、真核細胞は単子葉植物細胞である。別の態様では、真核細胞は双子葉植物細胞である。別の態様では、真核細胞はトウモロコシ細胞である。別の態様では、真核細胞はイネ細胞である。別の態様では、真核細胞はソルガム細胞である。別の態様では、真核細胞は小麦細胞である。別の態様では、真核細胞はキャノーラ細胞である。別の態様では、真核細胞はアルファルファ細胞である。別の態様では、真核細胞は、大豆細胞である。別の態様では、真核細胞は綿細胞である。別の態様では、真核細胞はトマト細胞である。別の態様では、真核細胞はジャガイモ細胞である。更なる態様では、真核細胞はキュウリ細胞である。別の態様では、真核細胞はキビ細胞である。別の態様では、真核細胞は大麦細胞である。別の態様では、真核細胞はアブラナ細胞である。別の態様では、真核細胞は草細胞である。別の態様では、真核細胞はセタリア細胞である。別の態様では、真核細胞は、シロイヌナズナ細胞である。更なる態様では、真核細胞は藻類細胞である。
【0146】
一態様では、植物細胞は表皮細胞である。別の態様では、植物細胞は気孔細胞である。別の態様では、植物細胞はトリコーム細胞である。別の態様では、植物細胞は根細胞である。別の態様では、植物細胞は葉細胞である。別の態様では、植物細胞はカルス細胞である。別の態様では、植物細胞はプロトプラスト細胞である。別の態様では、植物細胞は花粉細胞である。別の態様では、植物細胞は子房細胞である。別の態様では、植物細胞は花細胞である。別の態様では、植物細胞はメリステム細胞である。別の態様では、植物細胞は内胚乳細胞である。別の態様では、植物細胞は、繁殖材料を含まず、植物の自然繁殖を媒介しない。別の態様では、植物細胞は体細胞植物細胞である。
【0147】
追加の提供される植物細胞、組織及び器官は、種子、果実、葉、子葉、胚軸、メリステム、胚、内胚乳、根、シュート、幹、鞘、花、花序、茎、小花柄、スタイル、柱頭、花托、花弁、萼片、花粉、葯、フィラメント、子房、胚珠、果皮、師管、及び維管束組織由来であり得る。
【0148】
更なる態様では、真核細胞は動物細胞である。別の態様では、真核細胞は培養中の動物細胞である。更なる態様では、真核細胞はヒト細胞である。別の態様では、真核細胞はヒト幹細胞ではない。更なる態様では、真核細胞は培養中のヒト細胞である。更なる態様では、真核細胞は体細胞ヒト細胞である。更なる態様では、真核細胞はがん細胞である。更なる態様では、真核細胞は哺乳動物細胞である。更なる態様では、真核細胞はマウス細胞である。更なる態様では、真核細胞はブタ細胞である。更なる態様では、真核細胞はウシ細胞である。更なる態様では、真核細胞はトリ細胞である。更なる態様では、真核細胞は爬虫類細胞である。更なる態様では、真核細胞は両生類細胞である。更なる態様では、真核細胞は昆虫細胞である。更なる態様では、真核細胞は節足動物細胞である。更なる態様では、真核細胞は頭足動物細胞である。更なる態様では、真核細胞は、クモ類細胞である。更なる態様では、真核細胞は軟体動物細胞である。更なる態様では、真核細胞は線虫細胞である。更なる態様では、真核細胞は魚細胞である。
【0149】
別の態様では、真核細胞は原生動物細胞である。別の態様では、真核細胞は真菌細胞である。一態様では、真菌細胞は酵母細胞である。一態様では、酵母細胞はシゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)細胞である。別の態様では、酵母細胞は、出芽酵母(Saccharomyces cerevisiae)細胞である。
【0150】
「ポリヌクレオチド」又は「核酸分子」という用語の使用は、本開示を、デオキシリボ核酸(DNA)を含むポリヌクレオチドに限定することを意図していない。例えば、リボ核酸(RNA)分子もまた想定される。当業者は、ポリヌクレオチド及び核酸分子が、デオキシリボヌクレオチド、リボヌクレオチド、又はリボヌクレオチドとデオキシリボヌクレオチドの組合せを含み得ることを認識する。このようなデオキシリボヌクレオチド及びリボヌクレオチドには、天然に存在する分子と合成類似体の両方が含まれる。本開示のポリヌクレオチドはまた、限定されないが、一本鎖形態、二本鎖形態、ヘアピン、ステム-アンド-ループ構造等を含む全ての形態の配列を包含する。一態様では、本明細書において提供される核酸分子はDNA分子である。別の態様では、本明細書において提供される核酸分子はRNA分子である。一態様では、本明細書において提供される核酸分子は一本鎖である。別の態様では、本明細書において提供される核酸分子は二本鎖である。
【0151】
本明細書で使用される場合、用語「組換え体」とは、核酸(DNA又はRNA)分子、タンパク質、構築物、ベクター等に関して、人工的であり、通常は天然に見出されない、及び/又は通常は天然に見出されない文脈で存在する核酸若しくはアミノ酸分子又はアミノ酸配列を指し、ヒトの介入なしに、隣接して又は近接して一緒には天然に見出されないポリヌクレオチド又はタンパク質配列の組合せを含む核酸分子(DNA又はRNA)分子、タンパク質、構築物等、及び/又は互いに異種性である少なくとも2つのポリヌクレオチド又はタンパク質配列を含むポリヌクレオチド分子、タンパク質、構築物等が挙げられる。
【0152】
一態様では、本明細書において提供される方法及び組成物はベクターを含む。本明細書で使用される場合、用語「ベクター」又は「プラスミド」は、互換的に使用され、染色体DNAから物理的に分離された環状二本鎖DNA分子を指す。一態様では、本明細書において使用されるプラスミド又はベクターは、インビボで複製することができる。
【0153】
一態様では、本開示は、本明細書に提供される任意の核酸分子を含むプラスミドを提供する。別の態様では、本開示は、本明細書において提供される任意のアミノ酸配列をコードするプラスミドを提供する。別の態様では、本開示は、本明細書において提供される任意のリボ核タンパク質をコードするプラスミドを提供する。
【0154】
別の態様では、Cas12aヌクレアーゼ又はCasXヌクレアーゼをコードする核酸はベクターに提供される。更なる態様では、リンカーをコードする核酸はベクターに提供される。更なる態様では、HUHエンドヌクレアーゼをコードする核酸はベクターに提供される。更なる態様では、ガイド核酸をコードする核酸はベクターに提供される。更なる態様では、鋳型核酸分子をコードする核酸はベクターに提供される。
【0155】
本明細書で使用される場合、用語「ポリペプチド」とは、少なくとも2つの共有結合したアミノ酸の鎖を指す。ポリペプチドは、本明細書において提供されるポリヌクレオチドによりコードされ得る。ポリペプチドの例はタンパク質である。本明細書において提供されるタンパク質は、本明細書において提供される核酸分子によってコードされ得る。
【0156】
核酸は、当該技術分野における日常の技術を用いて単離することができる。例えば、核酸は、限定されないが、組換え核酸技術及び/又はポリメラーゼ連鎖反応(PCR)を含む任意の方法を用いて単離することができる。一般的なPCR技術は、例えば、PCR Primer: A Laboratory Manual、Dieffenbach及びDveksler編、Cold Spring Harbor Laboratory Press、1995に記載される。組換え核酸技術には、例えば、核酸を単離するために使用することができる制限酵素消化及び連結が含まれる。単離された核酸はまた、単一の核酸分子として、又は一連のオリゴヌクレオチドとして、化学的に合成することもできる。ポリペプチドは、DEAEイオン交換、ゲル濾過、及びヒドロキシアパタイトクロマトグラフィー等の公知の方法によって、天然源(例えば、生物学的試料)から精製することができる。ポリペプチドはまた、例えば、発現ベクター中に核酸を発現させることによって精製することができる。更に、精製されたポリペプチドは、化学合成によって得ることができる。ポリペプチドの純度の程度は、任意の適切な方法、例えば、カラムクロマトグラフィー、ポリアクリルアミドゲル電気泳動、又はHPLC分析を用いて測定することができる。
【0157】
限定されないが、核酸は、ハイブリダイゼーションを用いて検出することができる。核酸間のハイブリダイゼーションについては、Sambrookら(1989, Molecular Cloning: A Laboratory Manual、第2版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、NY)において詳細に検討されている。
【0158】
抗体を用いてポリペプチドを検出することができる。抗体を用いてポリペプチドを検出するための技術には、酵素結合免疫吸着アッセイ(ELISA)、ウエスタンブロット、免疫沈降及び免疫蛍光が含まれる。本明細書において提供される抗体は、ポリクローナル抗体又はモノクローナル抗体であり得る。本明細書において提供されるポリペプチドに対する特異的結合親和性を有する抗体は、当該技術分野において周知である方法を使用して生成することができる。本明細書において提供される抗体は、当該技術分野において公知である方法を使用して、マイクロタイタープレート等の固体支持体に結合させることができる。
【0159】
用語「同一性パーセント」又は「同一なパーセント」は、2つ以上のヌクレオチド又はタンパク質配列に関して、本明細書で使用される場合、(i)比較ウィンドウ上で2つの最適に整列された配列(ヌクレオチド又はタンパク質)を比較すること、(ii)同一の核酸塩基(ヌクレオチド配列について)又はアミノ酸残基(タンパク質について)が両方の配列中で生じる位置の数を決定して、一致した位置の数を生じさせること、(iii)一致した位置の数を比較ウィンドウ内の位置の総数で割ること、次に(iv)この商に100%を掛けて、同一性パーセントを生じさせることによって計算される。特定の比較ウィンドウが指定されていない参照配列に関して「同一性パーセント」を計算する場合、同一性パーセントは、アラインメントの領域上で一致した位置の数を参照配列の全長で割ることによって決定される。したがって、本出願の目的のために、2つの配列(クエリー及びサブジェクト)が最適に整列される場合(それらのアラインメントにおけるギャップを許容する)、クエリー配列の「同一性パーセント」は、その長さ(又は比較ウィンドウ)上でのクエリー配列の位置の総数で割り、次に100%を掛けた2つの配列間の同一の位置の数に等しい。配列同一性のパーセンテージがタンパク質に関して使用される場合、同一でない残基位置は、しばしば保存的アミノ酸置換によって異なることが認識され、アミノ酸残基は、類似の化学的特性(例えば、電荷又は疎水性)を有する他のアミノ酸残基で置換され、したがって、分子の機能的特性を変化させない。保存的置換が配列によって異なる場合、置換の保存的性質を補正するために、配列同一性パーセントを上方に調節することができる。このような保存的置換によって異なる配列は、「配列類似性」又は「類似性」を有するといわれる。
【0160】
用語「配列相補性パーセント」又は「相補性パーセント」は、2つのヌクレオチド配列に関して本明細書で使用される場合、同一性パーセントの概念に類似しているが、クエリー及びサブジェクト配列が、ループ、ステム又はヘアピン等の二次折り畳み構造を伴わずに直鎖状に配列され、最適に塩基対形成される場合に、サブジェクト配列にヌクレオチドと最適に塩基対形成するか又はハイブリダイズするクエリー配列のヌクレオチドのパーセンテージを指す。このような相補性パーセントは、2つのDNA鎖、2つのRNA鎖、又は1つのDNA鎖と1つのRNA鎖の間であり得る。「相補性パーセント」は、(i)比較ウィンドウ上で2つのヌクレオチド配列を(折り畳みも二次構造もなく)直線状であり、完全に伸長した配置で、最適に塩基対形成又はハイブリダイズさせ、(ii)比較ウィンドウ上で2つの配列間で塩基対を形成する位置の数を決定し、相補的な位置の数を得、(iii)相補的な位置の数を比較ウィンドウ内の位置の総数で割り、及び(iv)この商に100%を掛けて、2つの配列の相補性パーセントを得ることによって計算され得る。2つの配列の最適な塩基対形成は、水素結合を介して、G-C、A-T、及びA-U等のヌクレオチド塩基の公知の対形成に基づいて決定することができる。特定の比較ウィンドウを指定せずに参照配列に関して「相補性パーセント」を計算している場合、同一性パーセントは、2つの直鎖状配列間の相補的位置の数を参照配列の全長で割ることによって決定される。したがって、本出願の目的のために、2つの配列(クエリー及びサブジェクト)が最適に塩基対形成する場合(ミスマッチ又は非塩基対形成したヌクレオチドを許容する場合)、クエリー配列の「相補性パーセント」は、その長さ上でのクエリー配列の位置の総数で割り、次に100%を掛けた2つの配列間の塩基対形成した位置の数に等しい。
【0161】
それらの同一性パーセントを計算するための配列の最適なアラインメントのために、種々のペアワイズ又は多重配列アラインメントアルゴリズム及びプログラムは、当該技術分野において公知であり、例えば、ClustalW又は基本的な局所アラインメント検索ツール(BLAST(登録商標))等が挙げられ、2つ以上のヌクレオチド又はタンパク質配列間の配列同一性又は類似性を比較するために用いることができる、他のアラインメント及び比較方法は、当該技術分野で公知であるが、2つの配列間のアラインメント及び同一性パーセント(上記される同一性パーセントの範囲を含む)は、ClustalWアルゴリズムによって決定することができる。例えば、その全内容及び開示が参照により本明細書に組み込まれるChenna R.ら、「Multiple sequence alignment with the Clustal series of programs」、Nucleic Acids Research 31 : 3497-3500 (2003); Thompson JDら、「Clustal W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice」、Nucleic Acids Research 22: 4673-4680 (1994); Larkin MAら「Clustal W and Clustal X version 2.0」、Bioinformatics 23: 2947-48 (2007);及びAltschul, S.F.、Gish, W.、Miller, W.、Myers, E.W.及びLipman, D.J. (1990)「Basic local alignment search tool」J. Mol. Biol. 215:403-410 (1990)を参照されたい。
【0162】
本明細書で使用される場合、第1の核酸分子は、温度及び溶液イオン強度の適切なインビトロ及び/又はインビボ条件下で、配列特異的な逆平行様式(すなわち、核酸が相補的核酸に特異的に結合する)で、非共有結合相互作用(例えば、ワトソン-クリック塩基対形成)を介して第2の核酸分子を「ハイブリダイズ」することができる。当該技術分野において公知であるように、標準的なワトソン-クリック塩基対形成には、チミンとのアデニン対形成、ウラシルとのアデニン対形成、及びシトシン(C)とのグアニン(G)対形成が含まれる[DNA、RNA]。更に、2つのRNA分子(例えば、dsRNA)間のハイブリダイゼーションのために、グアニン塩基がウラシルと対形成することも当該技術分野において公知である。例えば、G/U塩基対形成は、tRNAのアンチコドンとmRNAのコドンとの塩基対形成という文脈で遺伝暗号の縮重(重複)に部分的に関与している。この開示の文脈において、対象DNA標的RNA分子のタンパク質結合セグメント(dsRNA二重鎖)のグアニンは、ウラシルと相補的であると考えられ、逆も同様である。したがって、G/U塩基対を所定のヌクレオチド位置で、対象DNA標的RNA分子のタンパク質結合セグメント(dsRNA二重鎖)で作製することができる場合、その位置は非相補的であるとはみなされず、代わりに相補的であるとみなされる。
【0163】
ハイブリダイゼーション及び洗浄条件は周知であり、Sambrook, J., Fritsch, E. F.及びManiatis, T. Molecular Cloning: A Laboratory Manual、第2版、Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989)、特にその中で11章及び表11.1;並びにSambrook, J.及びRussell, W.、Molecular Cloning: A Laboratory Manual、第3版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor (2001)に例示される。
【0164】
ハイブリダイゼーションは、2つの核酸が相補的配列を含むことを必要とするが、塩基間のミスマッチは可能である。2つの核酸間のハイブリダイゼーションに適した条件は、当該技術分野において周知である変数である核酸の長さ及び相補性の程度に依存する。2つのヌクレオチド配列間の相補性の程度が大きいほど、それらの配列を有する核酸のハイブリッドの融解温度(Tm)の値が大きくなる。短いストレッチの相補性(例えば、35以下のヌクレオチドの相補性)を有する核酸間のハイブリダイゼーションについては、ミスマッチの位置が重要になる(Sambrookらを参照されたい)。典型的には、ハイブリダイズ可能な核酸の長さは、少なくとも10ヌクレオチドである。ハイブリダイズ可能な核酸についての例示的な最小長は、少なくとも15ヌクレオチド;少なくとも18ヌクレオチド;少なくとも20ヌクレオチド;少なくとも22ヌクレオチド;少なくとも25ヌクレオチド;及び少なくとも30ヌクレオチドである。更に、当業者は、相補性領域の長さ及び相補性の程度等の因子に従って、温度及び洗浄溶液塩濃度を必要に応じて調整することができることを認識する。
【0165】
当該技術分野において、ポリヌクレオチドの配列は、特異的にハイブリダイズ可能であるか又はハイブリダイズ可能であるために、その標的核酸の配列と100%相補的である必要はないことが理解される。更に、ポリヌクレオチドは、介在又は隣接セグメントがハイブリダイゼーション事象(例えば、ループ構造又はヘアピン構造)に関与しないように、1つ以上のセグメント上でハイブリダイズすることができる。例えば、アンチセンス化合物の20ヌクレオチドのうち18ヌクレオチドが標的領域に相補的であり、したがって、特異的にハイブリダイズするアンチセンス核酸は、90%の相補性を表す。この例では、残りの非相補的ヌクレオチドは、クラスター化され得るか、又は相補的ヌクレオチドと散在され得、互いに又は相補的ヌクレオチドと隣接する必要はない。核酸内の核酸配列の特定のストレッチ間の相補性パーセントは、当該技術分野において公知であるBLAST(登録商標)プログラム(基本的な局所アラインメント検索ツール)及びPowerBLASTプログラム(Altschul et al., J. Mol. Biol., 1990, 215, 403-410; Zhang及びMadden, Genome Res., 1997, 7, 649-656を参照されたい)を用いて、Smith及びWaterman (Adv. Appl. Math., 1981, 2, 482-489)のアルゴリズムを用いる、デフォルト設定を使用する、Gapプログラム(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)を用いることによって日常的に決定することができる。
【0166】
本明細書で使用される場合、「インビボ」とは、生きている細胞、組織、又は生物内を指す。本明細書で使用される場合、「インビトロ」は、実験機器内を指す。実験機器の非限定的な例としては、試験管、フラスコ、ビーカー、メスシリンダー、ピペット、ペトリ皿、及びマイクロタイタープレートが挙げられる。本明細書で使用される場合、「エクスビボ」とは、外部環境中の生物由来の細胞又は組織内を指す。「植物体外」とは、外部環境における植物細胞又は組織を指し、一方、「植物体内」とは、生きている植物体内の細胞を指す。非限定的な例として、ペトリ皿又は試験管中の植物プロトプラストは、エクスビボと植物体外の両方であると考えられる。
【0167】
一態様では、本明細書において提供される任意の核酸分子又はポリペプチドは、インビボで用いることができる。一態様では、本明細書において提供される任意の核酸分子又はポリペプチドは、インビトロで用いることができる。一態様では、本明細書において提供される任意の核酸分子又はポリペプチドは、エクスビボで用いることができる。一態様では、本明細書において提供される任意の核酸分子又はポリペプチドは、植物体内で用いることができる。一態様では、本明細書において提供される任意の核酸分子又はポリペプチドは、植物体外で用いることができる。
【0168】
一態様では、本明細書において提供される任意の細胞はインビボで存在する。一態様では、本明細書において提供される任意の細胞はインビトロで存在する。一態様では、本明細書において提供される任意の細胞はエクスビボで存在する。一態様では、本明細書において提供される任意の植物細胞は植物体内に存在する。一態様では、本明細書において提供される任意の植物細胞は植物体外に存在する。
【0169】
当該技術分野において一般的に理解されるように、用語「プロモーター」とは、RNAポリメラーゼ結合部位、転写開始部位、及び/又はTATAボックスを含み、関連する転写可能なポリヌクレオチド配列及び/又は遺伝子(又は導入遺伝子)の転写及び発現を支援又は促進するDNA配列を指す。プロモーターは、合成的に生成することができ、変化させることができ、或いは公知若しくは天然に存在するプロモーター配列又は他のプロモーター配列から誘導することができる。プロモーターはまた、2つ以上の異種配列の組合せを含むキメラプロモーターを含むことができる。したがって、本出願のプロモーターは、組成が類似しているが、公知であるか又は本明細書において提供される他のプロモーター配列とは同一ではないプロモーター配列のバリアントを含むことができる。プロモーターは、構成的、発生的、組織特異的、誘導的等、プロモーターに作動可能に連結された関連するコード配列若しくは転写可能な配列又は遺伝子(導入遺伝子を含む)の発現パターンに関する種々の基準に従って分類することができる。
【0170】
一態様では、本明細書において提供される組換え核酸は、少なくとも1つのプロモーターを含む。別の態様では、Cas12aヌクレアーゼをコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。別の態様では、CasXヌクレアーゼをコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能的に連結される。別の態様では、HUHエンドヌクレアーゼをコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。別の態様では、FBNYV HUHエンドヌクレアーゼをコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。別の態様では、PCV HUHエンドヌクレアーゼをコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。別の態様では、ガイド核酸をコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。別の態様では、鋳型核酸分子をコードするポリヌクレオチドは、少なくとも1つのプロモーターに作動可能に連結される。
【0171】
植物の全組織又は大部分の組織において発現を駆動するプロモーターは、「構成的」プロモーターと呼ばれる。ある期間又は発生段階で発現を駆動するプロモーターは、「発生」プロモーターと呼ばれる。生物の他の組織と比較して、生物の特定の組織において増強された発現を駆動するプロモーターは、「組織優先」プロモーターと呼ばれる。したがって、「組織優先」プロモーターは、植物の特定の組織において比較的高いか又は優先的な発現を引き起こすが、植物の他の組織においては発現レベルが低い。生物の特定の組織内で発現するプロモーターは、他の組織ではほとんどか又は全く発現せず、「組織特異的」プロモーターと呼ばれる。「誘導性」プロモーターは、熱、寒冷、干ばつ、光、又は創傷若しくは化学的適用等の他の刺激等の環境刺激に応答して転写を開始するプロモーターである。プロモーターはまた、その起源、例えば、異種、相同、キメラ、合成である等の観点から分類することができる。
【0172】
本明細書で使用される場合、用語「異種である」は、プロモーターに関して、その関連する転写可能なDNA配列、コード配列又は遺伝子(又は導入遺伝子)に対して異なる起源を有し、及び/又は形質転換される植物種において天然に存在しないプロモーター配列である。用語「異種である」とは、プロモーター及び関連する転写可能なDNA配列、コード配列又は遺伝子等の、2つ以上のDNA分子又は配列の組合せを、このような組合せが人為的に作製され、通常は天然に見出されない場合、より広く指すことができる。
【0173】
一態様では、本明細書において提供されるプロモーターは、構成的プロモーターである。別の態様では、本明細書において提供されるプロモーターは、組織特異的プロモーターである。更なる態様では、本明細書において提供されるプロモーターは、組織優先プロモーターである。更に別の態様では、本明細書において提供されるプロモーターは、誘導性プロモーターである。一態様では、本明細書において提供されるプロモーターは、構成的プロモーター、組織特異的プロモーター、組織優先プロモーター、及び誘導性プロモーターからなる群から選択される。
【0174】
RNAポリメラーゼIII(Pol III)プロモーターを用いて、タンパク質をコードしないRNA分子の発現を駆動することができる。一態様では、本明細書において提供されるプロモーターは、Pol IIIプロモーターである。別の態様では、本明細書において提供されるPol IIIプロモーターは、タンパク質をコードしないRNAをコードする核酸分子に作動可能に連結される。更に別の態様では、本明細書において提供されるPol IIIプロモーターは、ガイド核酸をコードする核酸分子に作動可能に連結される。更に別の態様では、本明細書において提供されるPol IIIプロモーターは、単一ガイドRNAをコードする核酸分子に作動可能に連結される。更なる態様では、本明細書において提供されるPol IIIプロモーターは、CRISPR RNA(crRNA)をコードする核酸分子に作動可能に連結される。別の態様では、本明細書において提供されるPol IIIプロモーターは、トレーサーRNA(tracrRNA)をコードする核酸分子に作動可能に連結される。
【0175】
Pol IIIプロモーターの非限定的な例には、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターが挙げられる。例えば、その全体が参照により本明細書に組み込まれる、Schramm及びHernandez、2002、Genes & Development、16:2593-2620を参照されたい。一態様では、本明細書において提供されるPol IIIプロモーターは、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターからなる群から選択される。別の態様では、本明細書において提供されるガイドRNAは、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターからなる群から選択されるプロモーターに作動可能に連結される。別の態様では、本明細書において提供される単一ガイドRNAは、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターからなる群から選択されるプロモーターに作動可能に連結される。別の態様では、本明細書において提供されるCRISPR RNAは、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターからなる群から選択されるプロモーターに作動可能に連結される。別の態様では、本明細書において提供されるトレーサーRNAは、U6プロモーター、H1プロモーター、5Sプロモーター、アデノウイルス2(Ad2)VAIプロモーター、tRNAプロモーター、及び7SKプロモーターからなる群から選択されるプロモーターに作動可能に連結される。
【0176】
一態様では、本明細書において提供されるプロモーターはダリアモザイクウイルス(DaMV)プロモーターである。別の態様では、本明細書において提供されるプロモーターはU6プロモーターである。別の態様では、本明細書において提供されるプロモーターはアクチンプロモーターである。
【0177】
本明細書において用いることができるプロモーターを記載する例には、限定されないが、米国特許第6,437,217号(トウモロコシRS81プロモーター)、米国特許第5,641,876号(イネアクチンプロモーター)、米国特許第6,426,446号(トウモロコシRS324プロモーター)、米国特許第6,429,362号(トウモロコシPR-1プロモーター)、米国特許第6,232,526号(トウモロコシA3プロモーター)、米国特許第6,177,611号(構成的トウモロコシプロモーター)、米国特許第5,322,938号、同第5,352,605号、同第5,359,142号及び同第5,530,196号(35Sプロモーター)、米国特許第6,433,252号(トウモロコシL3オレオシンプロモーター)、米国特許第6,429,357号(イネアクチン2プロモーター及びイネアクチン2イントロン)、米国特許第5,837,848号(根特異的プロモーター)、米国特許第6,294,714号(光誘導性プロモーター)、米国特許第6,140,078号(塩誘導性プロモーター)、米国特許第6,252,138号(病原体誘導性プロモーター)、米国特許第6,175,060号(リン欠乏誘導性プロモーター)、米国特許第6,635,806号(ガンマコイキシンプロモーター)、及び米国特許出願第09/757,089号(トウモロコシ葉緑体アルドラーゼプロモーター)が挙げられる。使用を見出すことができる更なるプロモーターは、ノパリンシンターゼ(NOS)プロモーター(Ebertら、1987)、オクトピンシンターゼ(OCS)プロモーター(アグロバクテリウム-ツメファシエンス(Agrobacterium tumefaciens)の腫瘍誘導性プラスミドに保有される)、カリモウイルスプロモーター、例えば、カリフラワーモザイクウイルス(CaMV)19Sプロモーター(Lawtonら、Plant Molecular Biology (1987) 9: 315-324)、CaMV 35Sプロモーター(Odellら、Nature (1985) 313: 810-812)、フィグワートモザイクウイルス35Sプロモーター(米国特許第6,051,753号;同第5,378,619号)、スクロースシンターゼプロモーター(Yang及びRussell, Proceedings of the National Academy of Sciences、 USA (1990) 87: 4144-4148)、R遺伝子複合体プロモーター(Chandlerら、Plant Cell (1989) 1: 1175-1183)、及びクロロフィル a/b結合タンパク質遺伝子プロモーター、PC1SV(米国特許第5,850,019号)、及びAGRtu.nos (GenBankアクセッション番号V00087; Depickerら, Journal of Molecular and Applied Genetics (1982) 1: 561-573; Bevanら, 1983)プロモーターである。
【0178】
プロモーターハイブリッドはまた使用及び構築されて、転写活性を増強するか(米国特許第5,106,739号を参照されたい)、又は所望の転写活性、誘導性及び組織特異性若しくは発生特異性を組み合わせることができる。植物において機能するプロモーターには、限定されないが、誘導性、ウイルス性、合成性、構成性、時間的調節性、空間的調節性、及び空間的時間的調節性であるプロモーターが挙げられる。組織増強された、組織特異的な、又は発生的に調節された他のプロモーターもまた、当該技術分野において公知であり、本開示の実施において有用であると想定される。
【0179】
プロモーター配列の断片が、作動可能に連結された核酸分子の転写を駆動するように機能し得ることが当該技術分野において認識される。例えば、限定されないが、1000bpのプロモーターが500bpに切断され、500bpの断片が転写を駆動することができる場合、500bpの断片は「機能的断片」と呼ばれる。
【0180】
本明細書で使用される場合、「核局在化シグナル」(NLS)は、細胞の核内に取り込むためにタンパク質を「タグ付けする」アミノ酸配列を指す。一態様では、本明細書において提供される核酸分子は、核局在化シグナルをコードする。別の態様では、本明細書において提供される核酸分子は、2つ以上の核局在化シグナルをコードする。
【0181】
一態様では、本明細書において提供されるCas12aヌクレアーゼは、核局在化シグナルを含む。一態様では、核局在化シグナルは、Cas12aヌクレアーゼのN末端に配置される。更なる態様では、核局在化シグナルは、Cas12aヌクレアーゼのC末端に配置される。更に別の態様では、核局在化シグナルは、Cas12aヌクレアーゼのN末端とC末端の両方に配置される。
【0182】
一態様では、本明細書において提供されるCasXヌクレアーゼは、核局在化シグナルを含む。一態様では、核局在化シグナルは、CasXヌクレアーゼのN末端に配置される。更なる態様では、核局在化シグナルは、CasXヌクレアーゼのC末端に配置される。更に別の態様では、核局在化シグナルは、CasXヌクレアーゼのN末端とC末端の両方に配置される。
【0183】
一態様では、本明細書において提供されるHUHエンドヌクレアーゼは、核局在化シグナルを含む。一態様では、核局在化シグナルは、HUHエンドヌクレアーゼのN末端に配置される。更なる態様では、核局在化シグナルは、HUHエンドヌクレアーゼのC末端に配置される。更に別の態様では、核局在化シグナルは、HUHエンドヌクレアーゼのN末端とC末端の両方に配置される。
【0184】
一態様では、本明細書において提供されるFBNYV HUHエンドヌクレアーゼは、核局在化シグナルを含む。一態様では、核局在化シグナルは、FBNYV HUHエンドヌクレアーゼのN末端に配置される。更なる態様では、核局在化シグナルは、FBNYV HUHエンドヌクレアーゼのC末端に配置される。更に別の態様では、核局在化シグナルは、FBNYV HUHエンドヌクレアーゼのN末端とC末端の両方に配置される。
【0185】
一態様では、本明細書において提供されるPCV HUHエンドヌクレアーゼは、核局在化シグナルを含む。一態様では、核局在化シグナルは、PCV HUHエンドヌクレアーゼのN末端に配置される。更なる態様では、核局在化シグナルは、PCV HUHエンドヌクレアーゼのC末端に配置される。更に別の態様では、核局在化シグナルは、PCV HUHエンドヌクレアーゼのN末端とC末端の両方に配置される。
【0186】
一態様では、リボ核タンパク質は、少なくとも1つの核局在化シグナルを含む。別の態様では、リボ核タンパク質は、少なくとも2つの核局在化シグナルを含む。
【0187】
一態様では、本明細書において提供される核局在化シグナルは、配列番号8によりコードされる。一態様では、本明細書において提供される核局在化シグナルは、配列番号9によりコードされる。別の態様では、核局在化シグナルは、配列番号8及び9からなる群から選択される。
【0188】
種々の種は、特定のアミノ酸の特定のコドンに対して特定のバイアスを示す。コドンバイアス(生物間のコドン利用の違い)は、しばしばメッセンジャーRNA(mRNA)の翻訳効率と相関しており、とりわけ、翻訳されるコドンの特性及び特定のトランスファーRNA(tRNA)分子の利用可能性に次に依存していると考えられる。細胞で選択されたtRNAが優勢であるのは、一般にペプチド合成において最も頻繁に使用されるコドンの反映である。したがって、コドン最適化に基づいて、所与の生物における最適な遺伝子発現のために遺伝子を調整することができる。コドン使用表は、例えば、www.kazusa.or.jp/codonにて入手可能な「コドン使用データベース」で容易に入手可能であり、これらの表は、多くの方法で適合させることができる。Nakamuraら、2000、Nucl. Acids Res. 28:292を参照されたい。特定の宿主細胞における発現のための特定の配列を最適化するコドンのためのコンピューターアルゴリズムもまた利用可能であり、例えば、Gene Forge(Aptagen社; Jacobus, PA)もまた利用可能である。
【0189】
本明細書で使用される場合、「コドン最適化」とは、元のアミノ酸配列を維持ながら(例えば、サイレント突然変異を導入しながら)、宿主細胞の遺伝子においてより頻繁に又は最も頻繁に使用されるコドンを用いて、配列の少なくとも1つのコドン(例えば、少なくとも1、2、3、4、5、10、15、20、25、50又はそれ以上のコドン)を置換することによって、目的の宿主細胞における発現を増強させるための核酸配列を修飾するプロセスを指す。
【0190】
一態様では、Cas12aヌクレアーゼ、CasXヌクレアーゼ、又はHUHエンドヌクレアーゼをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50若しくはそれ以上のコドン、又は全てのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。藻類を含む植物におけるコドンの使用に関しては、各々が参照によりそれらの全体が本明細書に組み込まれる、Campbell及びGowri、1990、Plant Physiol.、92: 1-11;及びMurrayら、1989. Nucleic Acids Res. 17:477-98を参照されたい。
【0191】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているCas12aヌクレアーゼをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコ
ドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているCas12aヌクレアーゼをコードする。
【0192】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているCasXヌクレアーゼをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコドン最適化されているCasXヌクレアーゼをコード
する。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているCasXヌクレアーゼをコードする。
【0193】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているHUHエンドヌクレアーゼをコードする。
【0194】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコド
ン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているFBNYV HUHエンドヌクレアーゼをコードする。
【0195】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコドン最適化されているPCV HUHエンドヌクレ
アーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているPCV HUHエンドヌクレアーゼをコードする。
【0196】
一態様では、本明細書において提供される核酸分子は、原核細胞のためにコドン最適化されているリンカーをコードする。一態様では、本明細書において提供される核酸分子は、大腸菌細胞のためにコドン最適化されているリンカーをコードする。一態様では、本明細書において提供される核酸分子は、真核細胞のためにコドン最適化されているリンカーをコードする。一態様では、本明細書において提供される核酸分子は、動物細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、真菌細胞のためにコドン最適化されている。一態様では、本明細書において提供される核酸分子は、酵母細胞のためにコドン最適化されている。別の態様では、本明細書において提供される核酸分子は、植物細胞のためにコドン最適化されているリンカーをコードする。別の態様では、本明細書において提供される核酸分子は、単子葉植物種のためにコドン最適化されているリンカーをコードする。別の態様では、タンパク質をコードする核酸分子は、双子葉植物種のためにコドン最適化されている。更なる態様では、本明細書において提供される核酸分子は、裸子植物種のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、被子植物種のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、トウモロコシ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、大豆細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、イネ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、小麦細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、綿細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、ソルガム細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、アルファルファ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、サトウキビ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、シロイヌナズナ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、トマト細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、キュウリ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、ジャガイモ細胞のためにコドン最適化されているリンカーをコードする。更なる態様では、本明細書において提供される核酸分子は、藻類細胞のためにコドン最適化されているリンカーをコードする。
【実施例
【0197】
(実施例1)
発現ベクターの設計
Cys不含LbCas12aタンパク質(配列番号1)を、新規な16アミノ酸長の可撓性リンカー(配列番号3)を介してソラマメ壊死性黄色ウイルス(FBNYV)由来のHUHエンドヌクレアーゼ(配列番号2)に融合させた。リンカーの最適な特徴の1つは、多数のグリシン、セリン、及びスレオニン残基の存在である。いかなる科学的理論に制限されることなく、これらの残基は疎水性ではなく、2つのタンパク質ドメイン間で溶媒と容易に会合することができる。いかなる科学的理論に制限されることなく、これらの残基はまた最も柔軟なアミノ酸の一つでもあり、それによってリンカーに多くの異なる立体配座をとる能力を与え、その結果、2つのタンパク質ドメインが互いに相対的に移動する自由を可能にする。また、いかなる科学的理論に制限されることなく、アスパラギン酸及びグルタミン酸残基は高度に荷電しており、これは溶媒との相互作用を促進し、タンパク質凝集の可能性を低下させる特徴である。
【0198】
融合タンパク質の3成分(cys不含LbCas12a、リンカー、HUH)をコードする配列を、大腸菌における最適発現のためにコドン最適化した。cys不含LbCas12aをコードするヌクレオチド配列は、配列番号4として示される。HUHエンドヌクレアーゼをコードするヌクレオチド配列は配列番号5として示され、リンカーをコードするヌクレオチド配列は配列番号6として示される。N末端とC末端の両方のHUH融合タンパク質を設計した。cys不含LbCas12a:リンカー:HUHをコードするヌクレオチド配列は配列番号7として示され、HUH:リンカー:cys不含LbCas12aをコードするヌクレオチド配列は配列番号17として示される。核局在化シグナル(NLS)(配列番号8及び9)を、それぞれLbCas12a-リンカー:HUHオープンリーディングフレームの5'末端及び3'末端に導入した。更に、ヒスチジン(HIS)タグ(配列番号10)をコードするヌクレオチド配列を5'から5'NLS配列に導入した。HISタグ:NLSl:cys不含LbCas12a:リンカー:HUH:NLS2(以下「cys不含LbCas12a:HUH」と呼ばれる)配列をコードするヌクレオチド配列を、P-Ec.tacプロモーター(配列番号11)の制御下に置き、細菌発現ベクターに挿入した。N末端及びC末端HUH融合タンパク質発現カセットの図解を図1Bに示す。P-Ec.tacプロモーターの制御下に、HISタグ:NLSl:cys不含LbCas12a:NLS2(以下、「cys不含LbCas12a対照」と呼ばれる)配列を含む対照発現ベクターもまた設計した。図1Bを参照されたい。cys不含LbCas12a:HUH及びcys不含LbCas12a対照タンパク質を発現させ、上記の発現ベクターで形質転換した大腸菌細胞から精製した。
【0199】
(実施例2)
融合タンパク質の試験
cys不含LbCas12a:HUHがコグネートガイドRNAの存在下で染色体DNAを認識し切断することができるかどうかを試験するために、大豆(Glycine max)ゲノム内の3つの固有の標的部位を選択した。crRNAは、cys不含LbCas12a:HUH及びcys不含LbCas12a対照タンパク質を各標的部位にガイドするように設計された。精製したcys不含LbCas12a:HUH融合タンパク質又はcys不含LbCas12a及びコグネートcrRNAを含むリボ核タンパク質(RNP)複合体を集合させた。
【0200】
70ヌクレオチド長のssDNA鋳型を設計した。鋳型は、GmTS1部位に隣接する配列との相同性を含む相同性アームに隣接する10ヌクレオチドのシグネチャーモチーフを含む。ssDNA鋳型をPCVの15ヌクレオチド起点(ori)HUH認識配列(配列番号12)に融合させた。実施例6に示されるように、PCV由来のori配列は、FBNYV HUHエンドヌクレアーゼと適合する。
【0201】
この一本鎖DNA鋳型(ssDNA鋳型)をRNP複合体に添加した。次に、この三部分RNP複合体(図1Aを参照されたい)を、(a)標的化DNA切断及び(b)ssDNA鋳型を共有結合的に繋ぐという2つの融合ドメインの予想される機能性について、インビトロで試験した。ssDNA鋳型をcys不含LbCas12a:HUHに共有結合的に繋ぐことを調べるためにゲルシフトアッセイを行った(Table 1(表1)を参照されたい)。ゲルシフトアッセイにより、cys不含のLbCas12a:HUHの存在下では、ssDNA鋳型は、cys不含LbCas12a対照又はその非結合状態のssDNA鋳型のいずれかの存在下よりも有意に遅く移動することが確認された(Table 1(表1)を参照されたい)。より遅い移動は、cys不含LbCas12a:HUH::ssDNAを繋げた複合体の形成を示す。
【0202】
【表1】
【0203】
標的DNAを切断するcys不含LbCas12a:HUHの能力をインビトロアッセイにより評価した。2つの標的部位(GmTS1及びGmTS2)に亘る1020ヌクレオチドPCRアンプリコンを野生型大豆生殖質A3555から生成した。cys不含LbCas12a:HUHが、コグネートcrRNAの存在下で予想される部位でPCRアンプリコンを切断する能力を試験した。Cys不含LbCas12aを陽性対照として用い、ヌクレアーゼを欠くアッセイを陰性対照として役立てた。
【0204】
crRNA-TS1の存在下でのcys不含LbCas12aによるPCRアンプリコンの標的化切断は、892ヌクレオチド及び128ヌクレオチド消化産物をもたらすことが予想される。crRNA-TS2の存在下でのcys不含LbCas12aによるPCRアンプリコンの標的化切断は、734ヌクレオチド及び286ヌクレオチド消化産物をもたらすことが予想される。Table 2(表2)に示されるように、PCRアンプリコンは、cys不含LbCas12a:HUH複合体とcys不含LbCas12a対照複合体の両方によって、予想されるパターンで消化された。
【0205】
【表2】
【0206】
(実施例3)
プロトプラストにおける融合タンパク質の試験
プロトプラスト細胞における染色体切断について、三分体cys不含LbCas12a:HUH/crRNA/ssDNA鋳型RNP複合体を試験した。プロトプラストは大豆胚から調製され、その後、当該技術分野において公知である標準的方法によって、cys不含LbCas12a:HUH/crRNA/ssDNA鋳型及びcys不含LbCas12aを保有するそれらの陽性対照対応物を含むRNP複合体で形質転換された。陰性対照には、適合crRNA及びssDNA鋳型が含まれたが、融合タンパク質は含まれなかった(Table 3(表3)を参照されたい)。
【0207】
定性的アッセイ(Table 3(表3))を、cys不含LbCas12a:HUHの活性を調べるために開発した。室温で2日間インキュベートした後、全試料から全ゲノムDNAを単離し、標的部位GmTS1及びGmTS2に亘る1020ヌクレオチドのPCRアンプリコンを生成した。アンプリコンは、野生型及び編集された標的部位を含むDNA配列の不均一な集団を含み、後者はインデルを含むことが予想された。PCR増幅されたアンプリコンを、その後、インビトロでcys不含LbCas12aにより再消化した。編集された標的部位を示す未消化アンプリコンが、試験対照と陽性対照の両方において観察された。未消化アンプリコンは、陰性対照では検出できなかった。未消化画分の配列決定により、試験と陽性対照のいずれにおいても標的化されたインデルの存在が確認された。
【0208】
【表3】
【0209】
処置間の定量的比較のために、標的部位に亘るアンプリコンを生成し、当該技術分野において公知である標準的方法によって次世代シークエンシング(NGS)により配列決定した。配列決定リードは、LbCas12a PAM部位の18~24ヌクレオチド下流に配置されている7ヌクレオチドLbCas12a切断部位にインデルを含む場合、突然変異体とみなした。試験した3つの標的部位全てにおいて、試験対照と陽性対照の両方において7~19%のインデル率が検出された。陰性対照は同じ領域で0.3%以下のインデル率であったが、これは全部位の試験/陽性対照切断率よりも有意に低かった(図2)。
【0210】
(実施例4)
融合タンパク質の植物体内試験
cys不含LbCas12a:HUH/crRNA/鋳型複合体を、染色体切断及び植物体内における標的化組込みについて試験した。試験試料及び対照試料は、実施例1に記載されるように、cys不含LbCas12a:HUH融合タンパク質とGmTS1標的部位のcrRNAの両方を含んだ。試験アッセイの鋳型は、実施例2に記載されるように、PCVからの15ヌクレオチドori HUH認識配列を含むssDNA鋳型を含んだ。対照アッセイはori配列を欠くssDNA鋳型を含んだ。図3Aを参照されたい。
【0211】
RNP複合体を集合させ、植物形質転換に使用した。粒子衝撃を用いて2つの独立した形質転換を行った。RNP(cys不含LbCas12a:HUH/crRNA/鋳型)複合体を、スペクチノマイシン耐性遺伝子aadAをコードする直鎖状dsDNA断片とともに、コーティング剤としてCaCl2とスペルミジンの混合物を用いて0.6μm金粒子上にコーティングした。コーティング粒子を、Biolistic PDS-1000/HE粒子送達システム(Biorad社)を用いて、大豆乾燥摘出胚に送達させた。
【0212】
形質転換された実生は、選択のためにスペクチノマイシンを用いて組織培養において増殖させた。RNP及びスペクチノマイシン選択マーカー遺伝子の近化学量論的送達を仮定すると、生存植物では、RNP複合体を保有する植物が富化されることが予想された。少なくとも1つの三出葉を有する実生をDNA分析のためにサンプリングした。
【0213】
GmTS1標的部位に亘るアンプリコンを生成し、当該技術分野において公知である標準的方法を用いてNGSに供した。cys不含LbCas12a:HUHの染色体切断活性は、7ヌクレオチドGmTS1切断部位内の標的化されたインデルの存在を定量化することによって決定された。少なくとも20%の標的化されたインデルリードを生成した植物は突然変異体と呼ばれた(Table 4(表4);及び図3Bを参照されたい)。突然変異率は全ての処置において30%を超え、cys不含LbCas12a:HUH融合タンパク質による強固な切断活性を示唆する(Table 4(表4);及び図3Bを参照されたい)。
【0214】
【表4】
【0215】
標的化された組込みは、GmTS1標的部位に亘るNGSアンプリコン中の鋳型の固有のシグネチャーモチーフの存在によって定義された(図4を参照されたい)。組込みは、非相同末端結合(NHEJ)及び相同組換え(HR)、又はNHEJとHRの組合せという2つの基本的なDNA修復プロセスを介して起こり得る。異なる鋳型-染色体接合は、NHEJ及びHRによって作られ、組込みのメカニズムを決定するのに用いることができる(図4を参照されたい)。
【0216】
全体的に、外因性ssDNAのcys不含LbCas12aへのHUHを媒介して繋ぐことが、標的化された組込みを促進した(Table 5(表5);Table 6(表6);及び図5を参照されたい)。例えば、NHEJによる単一コピー鋳型の組込みは、全バッチにおいて対照と比較して試験において有意に高かった。相同組換えでは、最大3.8%の組込みが試験において検出されたのに対し、対照では1.3%以下であった。ssDNA鋳型をLbCas12a:HUHに共有結合的に繋ぐと、植物体内において標的化鋳型の組込みが増強される。
【0217】
【表5】
【0218】
【表6】
【0219】
(実施例5)
プロトプラストにおけるN末端及びC末端のHUH融合タンパク質の試験
実施例1及び図1Bに記載されるFBNYV HUH融合タンパク質を用いたLbCas12aのN末端及びC末端配置は、大豆プロトプラスト中のGmTS1標的部位での標的化された染色体切断及びその後のDNA修復について植物体外で試験された(図6を参照されたい)。プロトプラストは、Table 7(表7)に列挙された試薬の種々の組合せを用いて、当該技術分野において公知である標準的方法により形質転換された。試薬には、「N末端」(HUH:cys不含LbCas12a)又は「C末端」(cys不含LbCas12a:HUH)タンパク質、GmTS1標的部位のcrRNA、5'PCVori伸長を伴う又は伴わない70ntのssDNA鋳型(実施例4に記載される)が含まれ、HUHドメイン及び90bpのdsDNAオリゴヌクレオチド(dsDNAオリゴ)に繋ぐことを容易にする。
【0220】
【表7】
【0221】
室温で2日間インキュベートした後、全ゲノムDNAを単離した。PCRは、GmTS1標的部位に隣接するプライマーを用いて行われた。アンプリコンはMiSeq技術(www.illmina.com)を用いて配列決定された。配列は、(1)標的化された挿入及び欠失(インデル)、(2)HR又は代替メカニズムのいずれかによるssDNA鋳型の標的化された組込みについて分析され、これらをNHEJを媒介した組込みとしてまとめて標識した。後者の場合、単一コピー及び多重コピーの組込みもまた区別された。HRは、定義上、鋳型のコピーを1つだけ組み込むことができる。(3)NHEJによるdsDNAオリゴヌクレオチドの多重コピー及び単一コピーの組込みもまた定量化された。
【0222】
染色体切断は、融合タンパク質及びコグネートgRNAのいずれかの存在下での標的部位におけるインデルの存在により証明されるように、N末端とC末端の酵素配置(HUH:cys不含LbCas12a及びcys不含LbCas12a:HUH)の両方について確認された。例えば、図7における対照処理13~16と比較した処理1~8、11及び12を参照されたい。Cys不含LbCas12a:HUH(「C末端」融合)は、HUH:cys不含LbCas12a(「N末端融合」)より高いインデル率を示し、したがって良好な切断率を示した。HUHドメインにssDNA鋳型を繋ぐことは、染色体切断率に悪影響を及ぼした。いかなる特定の理論に拘束されることなく、DNA鋳型とCas12a-染色体界面との間の空間的干渉がヌクレアーゼ活性を干渉する場合がある。しかしながら、NHEJによる鋳型の組込みは、鋳型が両方のタンパク質配置についてHUHドメインに繋がれた場合に有意に高かった(図8を参照されたい)。同様に、HRによるssDNA鋳型の組込みは、鋳型が両方のタンパク質配置についてHUHドメインに繋がれた場合に有意に高かった(図8及びTable 8(表8)を参照されたい)。dsDNAオリゴの組込み率は、HUHを繋ぐことの影響を除いて、ssDNA鋳型の組込み率よりも高かった(図9を参照されたい)。インデル率と一致して、C末端融合タンパク質は、その差が統計的に有意ではないとしても、N末端融合タンパク質と比較して、dsオリゴを組み込むために改善された活性を示した。また、インデル率の所見と一致して、ssDNA鋳型を融合タンパク質に繋ぐことによって、dsオリゴの標的化された組込みが悪影響を受けた。一般に、ssDNA又はdsDNAオリゴヌクレオチドのいずれかのNHEJを媒介した組込みは、染色体切断率と密接な相関を示した。
【0223】
【表8】
【0224】
(実施例6)
種々の種由来のウイルス複製起点とCys不含LbCas12aに融合したFBNYV-HUHエンドヌクレアーゼとの適合性
ソラマメ壊死性黄色ウイルス(FBNYV)とブタサーコウイルス2(PCV)の両者は、アルフィビリセテス(Arfiviricetes)のクラスに属し、保存された構造を有するHUHタンパク質を保有している。同様に、それらの複製起点(ori)は、認識及び切断に必要な最小限の同じノナマーコア配列(agtattacc)を共有している。Vega-Rochaら、2007、Biochemistry 46: 6201及びTimchenkoら、1999、J. of Virol. 73: 10173を参照されたい。FBNYV HUHエンドヌクレアーゼを保有するCas12a融合タンパク質によるFBNYV ori(配列番号27)及びPCV ori(配列番号12)配列の認識を調べた。細菌コンジュゲーションFプラスミド(Dostalら、2011、Nucleic Acids Res 39: 2658を参照されたい)由来の無関係なHUHリラクセーズTralからのTral ori配列(配列番号28)及びPCV2 oriと類似したサイズの15bp大豆断片を含む「模擬」ori配列を陰性対照として組み込んだ。3つのori配列及び模擬ori配列を70ヌクレオチド長のssDNA鋳型に融合させ、実施例2に記載したものと類似したゲルシフトアッセイを行った。ゲルシフトアッセイ(Table 6(表6)を参照されたい)により、cys不含LbCas12a:HUHの存在下では、FBNYV ori及びPCV oriを含むssDNA鋳型は、Tral ori又は模擬oriを含むものよりも有意に遅く移動することが確認された。より遅い移動は、cys不含LbCas12a:HUH::ssDNAを繋いだ複合体の形成を示す。繋がれたオリゴのゲルシフトは、PCV及びFBNYV由来のori配列がFBNYVのHUHタンパク質と適合する一方で、遠く離れたホモログTral由来のori及び類似したサイズの模擬oriは適合しないことを示す。
【0225】
【表9】
図1
図2
図3
図4
図5
図6
図7
図8
図9
【配列表】
2022543241000001.app
【国際調査報告】