(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-25
(45)【発行日】2023-10-03
(54)【発明の名称】ゲノムを修飾するための組成物及び方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20230926BHJP
A01H 1/00 20060101ALI20230926BHJP
A01H 5/00 20180101ALI20230926BHJP
A01H 5/10 20180101ALI20230926BHJP
C12N 15/31 20060101ALI20230926BHJP
C12N 15/82 20060101ALI20230926BHJP
C12N 15/55 20060101ALI20230926BHJP
C12N 1/15 20060101ALI20230926BHJP
C12N 1/19 20060101ALI20230926BHJP
C12N 1/21 20060101ALI20230926BHJP
C12N 5/10 20060101ALI20230926BHJP
C12N 9/16 20060101ALI20230926BHJP
C07K 14/245 20060101ALN20230926BHJP
【FI】
C12N15/09 100
A01H1/00 A ZNA
A01H5/00 A
A01H5/10
C12N15/31
C12N15/82 154Z
C12N15/82 Z
C12N15/55
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N9/16 Z
C07K14/245
(21)【出願番号】P 2020507102
(86)(22)【出願日】2018-08-08
(86)【国際出願番号】 IB2018055972
(87)【国際公開番号】W WO2019030695
(87)【国際公開日】2019-02-14
【審査請求日】2021-08-06
(32)【優先日】2017-08-09
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-08-30
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-09-29
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-12-15
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518289221
【氏名又は名称】ベンソン ヒル,インコーポレイティド
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【氏名又は名称】武居 良太郎
(72)【発明者】
【氏名】マシュー ベーグマン
(72)【発明者】
【氏名】ベンジャミン ニール グレイ
【審査官】飯濱 翔太郎
(56)【参考文献】
【文献】国際公開第2017/141173(WO,A2)
【文献】Zetsche, B. et al.,Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System.,Cell,2015年10月22日,Vol.163, No.3,p.759-771
(58)【調査した分野】(Int.Cl.,DB名)
C12N
A01H
C07K
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
真核細胞のゲノムにおける標的部位でヌクレオチド配列を修飾する方法であって、前記真核細胞に
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用する第2のセグメントを含む;ならびに
(ii)Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチド、ここで、Cms1ポリペプチドは、(a)DNA標的化RNAと相互作用するRNA結合部分;及び(b)部位特異的酵素活性を示す活性部分を含む、
を導入することを含み、
ここで、前記Cms1ポリペプチドは、配列番号62に示されるアミノ酸配列と少なくとも95%の同一性を有し、Cms1エンドヌクレアーゼ活性を有し、前記方法は、前記標的部位で前記ヌクレオチド配列を修飾し、真核細胞の前記ゲノムは、核、色素体、又はミトコンドリアのゲノムであり、
該方法は、ヒトを治療する方法でなく、ヒトの生殖細胞系列の遺伝的同一性を修飾するプロセスを含まない、上記方法。
【請求項2】
原核細胞のゲノムにおける標的部位でヌクレオチド配列を修飾する方法であって、前記原核細胞に
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用する第2のセグメントを含む;ならびに
(ii)Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチド、ここで、Cms1ポリペプチドは、(a)DNA標的化RNAと相互作用するRNA結合部分;及び(b)部位特異的酵素活性を示す活性部分を含む、
を導入することを含み、
ここで、前記Cms1ポリペプチドは、配列番号62に示されるアミノ酸配列と少なくとも95%の同一性を有し、Cms1エンドヌクレアーゼ活性を有し、原核細胞の前記ゲノムは、染色体、プラスミド、又は他の細胞内DNA配列であり、前記原核細胞は前記Cms1ポリペプチドをコードする遺伝子の天然の宿主ではない上記方法。
【請求項3】
前記真核細胞が植物細胞である、請求項1に記載の方法。
【請求項4】
Cms1ポリペプチドが発現され、標的部位でヌクレオチド配列を切断して修飾ヌクレオチド配列を生成する条件下で植物細胞を培養して植物を生成し;及び
前記修飾ヌクレオチド配列を含む植物を選択する
ことをさらに含む、請求項3に記載の方法。
【請求項5】
前記Cms1ポリペプチドが、配列番号62に示されるアミノ酸配列を含む、請求項1に記載の方法。
【請求項6】
前記Cms1ポリペプチドが、配列番号62に示されるアミノ酸配列を含む、請求項2に記載の方法。
【請求項7】
前記修飾ヌクレオチド配列が、細胞のゲノムへの異種DNAの挿入、細胞のゲノムからのヌクレオチド配列の欠失、又は細胞のゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項1に記載の方法。
【請求項8】
前記修飾ヌクレオチド配列が、細胞のゲノムへの異種DNAの挿入、細胞のゲノムからのヌクレオチド配列の欠失、又は細胞のゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項2に記載の方法。
【請求項9】
前記修飾ヌクレオチド配列が、形質転換細胞に抗生物質又は除草剤耐性を付与するタンパク質をコードするポリヌクレオチドの挿入を含む、請求項1に記載の方法。
【請求項10】
抗生物質又は除草剤耐性を付与するタンパク質をコードする前記ポリヌクレオチドが、配列番号7を含むか、又は配列番号8を含むタンパク質をコードする、請求項9に記載の方法。
【請求項11】
Cms1ポリペプチドをコードするポリヌクレオチド配列を含む核酸分子であって、前記ポリヌクレオチド配列は、配列番号142に示される核酸配列と少なくとも95%の同一性を有し、又は前記ポリヌクレオチド配列は、配列番号62示されるアミノ酸配列と少なくとも95%の同一性を有するCms1ポリペプチドをコードし、Cms1エンドヌクレアーゼ活性を有し、Cms1ポリペプチドをコードする前記ポリヌクレオチド配列は、Cms1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに作動可能に連結されている上記核酸分子。
【請求項12】
Cms1ポリペプチドをコードするポリヌクレオチド配列を含む前記核酸分子が、配列番号142に示される核酸配列を含み、又は配列番号62示されるアミノ酸配列を含むCms1ポリペプチドをコードする、請求項11に記載の核酸分子。
【請求項13】
請求項11に記載の核酸分子によってコードされるCms1ポリペプチド。
【請求項14】
請求項11に記載の核酸分子を含む、植物細胞、真核細胞、又は原核細胞。
【請求項15】
請求項12に記載の核酸分子を含む、植物細胞、真核細胞、又は原核細胞。
【請求項16】
請求項11に記載の核酸分子を含む植物。
【請求項17】
請求項12に記載の核酸分子を含む植物。
【請求項18】
請求項3に記載の方法によって生成された植物であって、該植物はゲノムにおける標的部位で修飾されたヌクレオチド配列を含む上記植物。
【請求項19】
請求項16に規定される植物の種子であって、該種子は前記核酸分子を含む上記種子。
【請求項20】
請求項
17に規定される植物の種子であって、該種子は前記核酸分子を含む上記種子。
【請求項21】
Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、植物細胞における発現のためにコドン最適化されている、請求項11に記載の核酸分子。
【請求項22】
Cms1ポリペプチドをコードする前記ポリヌクレオチドが、植物細胞における発現のためにコドン最適化されている、請求項3記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予め選択された位置でゲノム配列を編集し、遺伝子発現を調節するための組成物及び方法に関する。
【0002】
EFS-WEBを介してテキストファイルとして送信された配列リストへの参照
配列リストの公式コピーは、仕様と同時に、EFS-Webを介して、米国規格情報交換(ASCII)に準拠したテキストファイルとして、ファイル名BHP017P5配列リスト ST25.txt、作成日とともに送信される。2018年8月3日、サイズは1,848Kbである。EFS-Webを介して提出された配列リストは仕様の一部であり、参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0003】
ゲノムDNAの修飾は、基礎研究及び応用研究にとって非常に重要である。ゲノム修飾は、疾患の原因を解明し、場合によっては治癒し、前記修飾を含む細胞及び/又は個体に望ましい特性を提供する可能性を有する。ゲノム修飾は、例えば、植物、動物、真菌、及び/又は原核生物のゲノム修飾の修飾を含み得る。ゲノムDNAを変更する最も一般的な方法は、ゲノム内のランダムな部位でDNAを変更する傾向があるが、最近の発見により、部位固有のゲノム変更が可能になった。このようなテクノロジーは、目的の部位でのDSBの作成に依存する。このDSBは、DSBへの宿主細胞のネイティブDNA修復機構の動員を引き起こす。DNA修復機構を利用して、所定の部位に異種DNAを挿入したり、ネイティブゲノムDNAを削除したり、目的の部位に点変異、挿入、又は削除を行ったりすることができる。部位特異的なゲノム修飾に特に関心があるのは、クラスター化され、規則的に散在している短い回文構造反復(CRISPR)ヌクレアーゼである。CRISPRヌクレアーゼは、標的分子とヌクレアーゼ及び塩基対と相互作用するガイド分子、多くの場合ガイドRNA分子を使用して、ヌクレアーゼが目的の部位で二本鎖切断(DSB)を生成できるようにする。DSBの作成には、プロトスペーサー隣接モチーフ(PAM)配列の存在が必要である。PAM配列が認識されると、CRISPRヌクレアーゼは目的のDSBを生成できる。Cms1 CRISPRヌクレアーゼは、Cas9ヌクレアーゼなどの他のCRISPRヌクレアーゼと比較して特定の望ましい特性を持つCRISPRヌクレアーゼのクラスである。
【0004】
ゲノム修飾が行われている分野の1つは、植物ゲノムDNAの修飾である。植物ゲノムDNAの修飾は、基礎及び応用植物研究の両方にとって非常に重要である。ゲノムDNAが安定的に修飾されたトランスジェニック植物は、除草剤耐性、耐虫性、及び/又はそれらに付与された医薬品タンパク質や工業用酵素を含む貴重なタンパク質の蓄積などの新しい特性を持つことができる。天然植物遺伝子の発現は、アップ又はダウンレギュレートされるか、又はその他の方法で変更され(例えば、天然植物遺伝子が発現される組織を変更することにより)、それらの発現は完全に廃止され、DNA配列が変更される(例えば、点突然変異、挿入、又は削除を介して)、又は新しい非ネイティブ遺伝子を植物ゲノムに挿入して、植物に新しい特性を付与することができる。
【発明の概要】
【0005】
Cms1 CRISPRシステムを使用してゲノムDNA配列を変更するための構成と方法が提供される。本明細書で使用される場合、ゲノムDNAは、線状及び/又は染色体DNA、及び/又は目的の細胞又は細胞群に存在するプラスミド又は他の染色体外DNA配列を指す。この方法は、ゲノムDNA配列の所定の標的部位で二本鎖切断(DSB)を生成し、ゲノムの標的部位でのDNA配列の突然変異、挿入、及び/又は削除を引き起こす。組成物は、目的の細胞において作動可能であるプロモーターに作動可能に連結されたCms1タンパク質をコードするヌクレオチド配列を含むDNA構築物を含む。いくつかの実施形態では、Cms1タンパク質は、配列番号177~186からなる群から選択される少なくとも1つのアミノ酸モチーフを含む。他の実施形態では、Cms1タンパク質は、配列番号288~289及び187~201からなる群から選択される少なくとも1つのアミノ酸モチーフを含む。他の実施形態では、Cms1タンパク質は、配列番号290~296からなる群から選択される少なくとも1つのアミノ酸モチーフを含む。特定の好ましい実施形態では、Cms1タンパク質は、配列番号177~186からなる群から選択される2つ以上のアミノ酸モチーフを含む。特定の好ましい実施形態では、Cms1タンパク質は、配列番号288~289及び187~201からなる群から選択される2つ以上のアミノ酸モチーフを含む。特定の好ましい実施形態では、Cms1タンパク質は、配列番号290~296からなる群から選択される2つ以上のアミノ酸モチーフを含む。特定のCms1タンパク質配列は、配列番号10、11、20~23、30~69、154~156、208~211、及び222~254に示されている。特定のCms1タンパク質をコードするポリヌクレオチド配列は、配列番号16~19、24~27、70~146、174~176、212~215、及び255~287に記載されている。特定の好ましい実施形態では、Cms1タンパク質は、配列番号16~19、24~27、70~146、174~176、212~215、及び255~287からなる群から選択される配列と少なくとも約80%の同一性を有する。本発明のCms1タンパク質をコードするポリヌクレオチド配列を含むDNA構築物、又は本発明のCms1タンパク質自体を使用して、所定のゲノム遺伝子座でのゲノムDNAの改変を誘導することができる。これらのDNA構築物を使用してゲノムDNA配列を改変する方法は、本明細書に記載されている。酵母、アメーバ、昆虫、真菌、哺乳動物、植物、植物細胞、植物の部分及び種子を含む修飾真核生物及び真核細胞、ならびに細菌及び古細菌を含む修飾原核生物も含まれる。遺伝子の発現を調節するための組成物及び方法も提供される。この方法は、タンパク質をゲノムの所定の部位にターゲティングし、遺伝子の発現がゲノムの標的部位によって調節される1つ又は複数の遺伝子のアップレギュレーション又はダウンレギュレーションを行う。組成物は、ヌクレアーゼ活性が低下又は消失した修飾Cms1タンパク質をコードするヌクレオチド配列を含み、任意で転写活性化又は抑制ドメインに融合したDNA構築物を含む。これらのDNA構築物を使用して遺伝子発現を改変する方法は、本明細書に記載されている。
【図面の簡単な説明】
【0006】
【
図1】
図1は、示されたV型ヌクレアーゼのアミノ酸配列のRuvCアンカーMUSCLEアラインメントから得られた系統樹を示している。Smタイプ、Sulfタイプ、及びUnk40タイプのCms1ヌクレアーゼが示されている。
【
図2】
図2は、Sm型Cms1タンパク質に共通するアミノ酸モチーフのまとめである。ボックス1~10のウェブログの図は、それぞれ配列番号177~186に対応し、SmCms1タンパク質(配列番号10)上の位置が示されている。
【
図3】
図3は、Sulf型Cms1タンパク質に共通するアミノ酸モチーフのまとめである。ボックス1~17のウェブログの図は、それぞれ配列番号288~289及び配列番号187~201に対応し、SulfCms1タンパク質(配列番号11)上の位置が示されている。
【
図4】
図4は、Unk40型Cms1タンパク質に共通するアミノ酸モチーフのまとめである。ボックス1~7のウェブログの図は、それぞれ配列番号290~296に対応し、Unk40Cms1タンパク質(配列番号68)上の位置が示されている。
【発明を実施するための形態】
【0007】
本明細書では、CRISPR-Cmsシステム及びその構成要素に関連する、ゲノム摂動又は遺伝子編集などの配列ターゲティングを含む遺伝子発現の制御のための方法及び組成物が提供される。本発明のCRISPR酵素は、Cms酵素から選択される。Cms1オーソログ又は変異Cms1酵素である。Cms1は、Microgenomates及びSmithellaからのCRISPRの略語であり、これらのグループの一部の細菌種がCms1ヌクレアーゼをコードするため、そのように呼ばれている。Csm1及びCms1という用語は、ここでは互換的に使用される。Cms1ヌクレアーゼは、Cas12fヌクレアーゼとも呼ばれている。この方法及び組成物は、標的DNA配列に結合するための核酸を含む。核酸は、例えばペプチドよりも製造がはるかに簡単で安価であるため、これは有利であり、相同性が求められるストレッチの長さに応じて特異性を変えることができる。例えば、複数の指の複雑な3D配置は必要ない。
【0008】
また、Cms1ポリペプチドをコードする核酸、ならびにCms1ポリペプチドを使用して、植物細胞を含む宿主細胞の染色体(すなわち、ゲノム)又はオルガネラDNA配列を修飾する方法も提供される。Cms1ポリペプチドは、Cms1エンドヌクレアーゼを特定の標的部位に誘導する特定のガイドRNA(gRNA)と相互作用する。この部位で、Cms1エンドヌクレアーゼは、DNA修復プロセスによって修復可能な二本鎖切断を導入し、DNA配列が変更された。特異性はガイドRNAによって提供されるため、Cms1ポリペプチドは普遍的であり、様々なガイドRNAとともに使用して様々なゲノム配列をターゲットにすることができる。Cms1エンドヌクレアーゼは、CRISPRアレイで伝統的に使用されているCasヌクレアーゼ(Cas9など)よりも優れている。例えば、Cms1関連のCRISPRアレイは、追加のトランス活性化crRNA(tracrRNA)を必要とせずに、成熟したcrRNAに処理される。また、Cms1-crRNA複合体は、多くのCas9システムのターゲットDNAに続くGリッチPAMとは対照的に、Tリッチであることが多い短いプロトスペーサー隣接モチーフ(PAM)が前にあるターゲットDNAを切断できる。さらに、Cms1ヌクレアーゼは、互い違いのDNA二本鎖切断を導入する可能性がある。本明細書に開示される方法を使用して、特定の染色体配列を標的化及び修飾し、及び/又は外因性配列を真核細胞及び原核細胞のゲノムの標的位置に導入することができる。これらの方法はさらに、オルガネラ(例えば、葉緑体及び/又はミトコンドリア)内の配列を導入するか又は領域を修飾するために使用され得る。さらに、ターゲティングは特定のものであり、対象外効果は限られている。
【0009】
I.Cms1エンドヌクレアーゼ
本明細書では、植物ゲノムを含むゲノムの修飾に使用するためのCms1エンドヌクレアーゼ、ならびにその断片及び変異体を提供する。本明細書で使用される場合、用語Cms1エンドヌクレアーゼ又はCms1ポリペプチドは、配列番号10、11、20~23、30~69、154~156、208~211、及び222-254に示されるCms1ポリペプチド配列のホモログ、オルソログ、及び変異体を指す。通常、Cms1エンドヌクレアーゼは、tracrRNAを使用せずに作用し、互い違いのDNA二本鎖切断を引き起こす可能性がある。一般に、Cms1ポリペプチドは、少なくとも1つのRNA認識及び/又はRNA結合ドメインを含む。RNA認識及び/又はRNA結合ドメインは、ガイドRNAと相互作用する。典型的には、ガイドRNAは、Cms1ポリペプチドと相互作用するステムループ構造を持つ領域を含む。このステムループは、多くの場合、配列UCUACN3-5GUAGAU(配列番号312-314、配列番号315-317によってエンコードされる)を含み、「UCUAC」と「GUAGA」の塩基対がステム-ループのステムを形成する。N3-5は、任意の塩基がこの位置に存在する可能性があり、3、4、又は5ヌクレオチドがこの位置に含まれる可能性があることを示す。Cms1ポリペプチドはまた、ヌクレアーゼドメイン(すなわち、DNase又はRNaseドメイン)、DNA結合ドメイン、ヘリカーゼドメイン、RNAseドメイン、タンパク質-タンパク質相互作用ドメイン、二量体化ドメイン、ならびに他のドメインを含み得る。特定の実施形態では、Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチドは、以下を含む:DNA標的化RNAと相互作用するRNA結合部分、及びRuvCエンドヌクレアーゼドメインなどの部位特異的酵素活性を示す活性部分。
【0010】
Cms1ポリペプチドは、野生型Cms1ポリペプチド、修飾Cms1ポリペプチド、又は野生型又は修飾Cms1ポリペプチドの断片であり得る。Cms1ポリペプチドは、核酸結合親和性及び/又は特異性を増大させるため、酵素活性を修飾するため、及び/又はタンパク質の別の特性を変化させるために修飾され得る。例えば、Cms1ポリペプチドのヌクレアーゼ(すなわち、DNアーゼ、RNアーゼ)ドメインは、修飾、削除、又は不活性化することができる。又は、Cms1ポリペプチドを切り詰めて、タンパク質の機能に必須ではないドメインを削除することもできる。
【0011】
いくつかの実施形態では、Cms1ポリペプチドは、野生型Cms1ポリペプチド又はその断片に由来し得る。他の実施形態では、Cms1ポリペプチドは、修飾されたCms1ポリペプチドに由来し得る。例えば、Cms1ポリペプチドのアミノ酸配列を修飾して、タンパク質の1つ又は複数の特性(例えば、ヌクレアーゼ活性、親和性、安定性など)を変更することができる。あるいは、RNA誘導切断に関与しないCms1ポリペプチドのドメインをタンパク質から除去して、修飾Cms1ポリペプチドが野生型Cms1ポリペプチドよりも小さくなるようにすることができる。
【0012】
一般に、Cms1ポリペプチドは少なくとも1つのヌクレアーゼ(すなわち、DNase)ドメインを含むが、Cas9タンパク質に見られるようなHNHドメインを含む必要はない。例えば、Cms1ポリペプチドは、RuvC又はRuvC様ヌクレアーゼドメインを含み得る。いくつかの実施形態において、Cms1ポリペプチドは、ヌクレアーゼドメインを不活性化するように修飾され得、その結果、それはもはや機能的ではない。ヌクレアーゼドメインの1つが不活性であるいくつかの実施形態では、Cms1ポリペプチドは二本鎖DNAを切断しない。特定の実施形態では、変異Cms1ポリペプチドは、最大に整列した場合、SmCms1の701位又は922位(配列番号10)又はSulfCms1の848位及び1213位(配列番号11)に対応する位置に1つ以上の変異を含む(ヌクレアーゼ活性を低減又は排除する最大同一性のために整列させた場合)。ヌクレアーゼドメインは、部位特異的変異誘発、PCR媒介変異誘発、及び全遺伝子合成などの周知の方法、ならびに当技術分野で既知の他の方法を使用して修飾することができる。ヌクレアーゼドメインが不活性化されたCms1タンパク質(dCms1タンパク質)を使用すると、DNA配列を変更せずに遺伝子発現を調整できる。特定の実施形態では、dCms1タンパク質は、適切なgRNAを使用することにより、1つ又は複数の目的の遺伝子のプロモーターなどのゲノムの特定の領域を標的とすることができる。dCms1タンパク質は、DNAの望ましい領域に結合でき、DNAのこの領域へのRNAポリメラーゼの結合や、DNAのこの領域への転写因子の結合を妨害する可能性がある。この技術は、対象となる1つ以上の遺伝子の発現を上方又は下方制御するために使用できる。特定の他の実施形態では、dCms1タンパク質をリプレッサードメインに融合させて、RNAポリメラーゼ、転写因子、又は他の転写レギュレーターが標的とする染色体DNAの領域との相互作用によって発現が調節される1つ又は複数の遺伝子の発現をさらにダウンレギュレートすることができるgRNA。特定の他の実施形態では、dCms1タンパク質を活性化ドメインに融合させて、RNAポリメラーゼ、転写因子、又は他の転写調節因子と標的とする、gRNAによる染色体DNAの領域との相互作用によってその発現が調節される1つ又は複数の遺伝子の上方制御を行うことができる。
【0013】
本明細書に開示されるCms1ポリペプチドは、少なくとも1つの核局在化シグナル(NLS)をさらに含み得る。一般に、NLSは一連の塩基性アミノ酸を含む。核局在化シグナルは、当該分野で公知である(例えば、Langeら、J.Biol.Chem.(2007)282:5101-5105を参照のこと)。NLSは、N末端、C末端、又はCms1ポリペプチドの内部位置に配置できる。一部の実施形態では、Cms1ポリペプチドは、少なくとも1つの細胞透過ドメインをさらに含むことができる。細胞透過ドメインは、N末端、C末端、又はタンパク質の内部に配置できる。
【0014】
本明細書に開示されるCms1ポリペプチドは、少なくとも1つの色素体標的化シグナルペプチド、少なくとも1つのミトコンドリア標的化シグナルペプチド、又はCms1ポリペプチドを色素体及びミトコンドリアの両方に標的化するシグナルペプチドをさらに含み得る。色素体、ミトコンドリア、及びデュアルターゲティングシグナルペプチド局在化シグナルは当技術分野で知られている(例えば、Nassoury and Morse(2005)Biochim Biophys Acta 1743:5-19;Kunze and Berger(2015)Front Physiol 6:259;Herrmann、Neupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol 5:529-535;Carrie and Small(2013)Biochim Biophys Acta 1833:253-259;Carrie et al(2009)FEBS J 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;Peeters and Small(2001)Biochim Biophys Acta 1541:54-63;Murcha et al(2014)J Exp Bot 65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glaser et al(1998)Plant Mol Biol 38:311-338参照)。色素体、ミトコンドリア、又はデュアルターゲティングシグナルペプチドは、N末端、C末端、又はCms1ポリペプチドの内部に配置できる。
【0015】
さらに他の実施形態では、Cms1ポリペプチドはまた、少なくとも1つのマーカードメインを含み得る。マーカードメインの非限定的な例には、蛍光タンパク質、精製タグ、及びエピトープタグが含まれる。特定の実施形態では、マーカードメインは、蛍光タンパク質であり得る。適切な蛍光タンパク質の非限定的な例には、緑色蛍光タンパク質(例:GFP、GFP-2、tagGFP、turboGFP、EGFP、エメラルド、アザミグリーン、モノマーアザミグリーン、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例:YFP、EYFP)、シトリン、金星、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例:EBFP、EBFP2、アズライト、mKalama1、GFPuv、サファイア、T-サファイア)、シアン蛍光タンパク質(例:ECFP、セルリアン、CyPet、AmCyan1、ミドリシシアン)、赤色蛍光タンパク質(mKate、mKate2、mPlum、DsRedモノマー、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、及びオレンジ色の蛍光タンパク質(mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)又はその他の適切な蛍光タンパク質が挙げられる。他の実施形態では、マーカードメインは、精製タグ及び/又はエピトープタグであり得る。例示的なタグには、グルタチオン-S-トランスフェラーゼ(GST)、キチン結合タンパク質(CBP)、マルトース結合タンパク質、チオレドキシン(TRX)、ポリ(NANP)、タンデムアフィニティー精製(TAP)タグ、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、ビオチンカルボキシルキャリアタンパク質(BCCP)、及びカルモジュリンが挙げられる。
【0016】
特定の実施形態では、Cms1ポリペプチドは、ガイドRNAを含むタンパク質-RNA複合体の一部であり得る。ガイドRNAはCms1ポリペプチドと相互作用して、Cms1ポリペプチドを特定の標的部位に誘導する。ガイドRNAの5’末端は、植物ゲノムの目的のヌクレオチド配列の特定のプロトスペーサー配列と塩基対を形成できる。核、色素体、ミトコンドリアゲノム。本明細書で使用される場合、「DNA標的化RNA」という用語は、植物細胞のゲノムにおける目的のヌクレオチド配列のCms1ポリペプチド及び標的部位と相互作用するガイドRNAを指す。DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチドは、標的DNA中の配列に相補的なヌクレオチド配列を含む第1のセグメント、及びCms1ポリペプチドと相互作用する第2のセグメントを含み得る。
【0017】
本明細書に開示されるCms1ポリペプチドをコードするポリヌクレオチドを使用して、他の原核生物又は真核生物から、又は天然の宿主生物が不明又は不明であるメタゲノム由来の配列から対応する配列を単離することができる。このようにして、PCR、ハイブリダイゼーションなどの方法を使用して、本明細書に記載される配列に対するそれらの配列相同性又は同一性に基づいてそのような配列を同定することができる。本明細書に記載の全Cms1配列又はそれらの変異体及び断片に対するそれらの配列同一性に基づいて単離された配列は、本発明に含まれる。そのような配列には、開示されたCms1配列のオルソログである配列が含まれる。「オルソログ」とは、共通の祖先遺伝子に由来し、種分化の結果として異なる種で見つかる遺伝子を意味することを意図する。それらのヌクレオチド配列及び/又はそれらがコードするタンパク質配列が少なくとも約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、又はそれ以上の配列同一性を共有する場合、異なる種で見つかる遺伝子はオルソログと見なされる。オーソログの機能は、種間でよく保存されている。したがって、Cms1エンドヌクレアーゼ活性を有するポリペプチドをコードし、本明細書に開示される配列と少なくとも約75%以上の配列同一性を共有する単離されたポリヌクレオチドは、本発明に含まれる。本明細書で使用する場合、Cms1エンドヌクレアーゼ活性は、CRISPRエンドヌクレアーゼ活性を指し、Cms1ポリペプチドに関連するガイドRNA(gRNA)がCms1-gRNA複合体を、gRNAに相補的な所定のヌクレオチド配列に結合させる。及び、Cms1活性は、gRNAによって標的化された部位又はその近くに二本鎖切断を導入することができる。特定の実施形態では、この二本鎖切断は、互い違いのDNA二本鎖切断であり得る。本明細書で使用される場合、「千鳥状のDNA二本鎖切断」は、約1、約2、約3、約4、約5、約6、約7、約8、約9、又は約10の二本鎖切断をもたらし得る。切断後の3’又は5’末端のオーバーハングのヌクレオチド。特定の実施形態では、Cms1ポリペプチドは、5’オーバーハングを有する互い違いのDNA二本鎖切断を導入する。二本鎖切断は、DNA標的化RNA(例えば、ガイドRNA)配列が標的化される配列又はその近くで起こり得る。
【0018】
Cms1ヌクレアーゼ活性を保持する、Cms1ポリヌクレオチド及びそれによりコードされるCms1アミノ酸配列の断片及び変異体は、本明細書に含まれる。「Cms1ヌクレアーゼ活性」とは、ガイドRNAによって媒介される所定のDNA配列の結合を意図している。Cms1ヌクレアーゼが機能的なRuvCドメインを保持する実施形態では、Cms1ヌクレアーゼ活性は、二本鎖切断誘導をさらに含むことができる。「断片」とは、ポリヌクレオチドの一部又はアミノ酸配列の一部を意味する。「変異体」は、実質的に類似した配列を意味することを意図している。ポリヌクレオチドの場合、変異体は、5’及び/又は3’末端に欠失(すなわち、トランケーション)を有するポリヌクレオチドを含む。天然ポリヌクレオチドの1つ又は複数の内部部位での1つ又は複数のヌクレオチドの削除及び/又は付加;及び/又は天然ポリヌクレオチドの1つ以上の部位での1つ以上のヌクレオチドの置換。本明細書中で使用される場合、「ネイティブな」ポリヌクレオチド又はポリペプチドは、それぞれ、天然に存在するヌクレオチド配列又はアミノ酸配列を含む。一般に、本発明の特定のポリヌクレオチドの変異体は、本明細書の他の箇所に記載される配列アラインメントプログラム及びパラメーターによって決定されるような、その特定のポリヌクレオチドに対する少なくとも約75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を有する。
【0019】
「変異体」アミノ酸又はタンパク質は、N末端及び/又はC末端の1つ又は複数のアミノ酸の削除(いわゆるトランケーション)により、天然のアミノ酸又はタンパク質に由来するアミノ酸又はタンパク質を意味することを意図している天然タンパク質の;天然タンパク質の1つ以上の内部部位での1つ以上のアミノ酸の削除及び/又は追加;又は天然タンパク質の1つ以上の部位での1つ以上のアミノ酸の置換である。本発明に包含される変異タンパク質は生物学的に活性であり、すなわちそれらは天然タンパク質の所望の生物学的活性を保持し続ける。天然ポリペプチドの生物学的に活性な変異体は、本明細書に記載される配列アラインメントプログラム及びパラメーターにより決定した場合、天然配列のアミノ酸配列と少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性配列を有する。本発明のタンパク質の生物学的に活性な変異体は、わずか1~15アミノ酸残基、わずか1~10、例えば6~10、わずか5、わずか4、3、2、又は1アミノ酸残基のようにそのタンパク質とは異なり得る。
【0020】
変異配列はまた、配列決定されたゲノムの既存のデータベースの分析によって特定されてもよい。このようにして、対応する配列を同定し、本発明の方法で使用することができる。
【0021】
比較のための配列のアラインメントの方法は、当技術分野でよく知られている。従って、任意の2つの配列間のパーセント配列同一性の決定は、数学的アルゴリズムを使用して達成することができる。そのような数学的アルゴリズムの非限定的な例は、Myers and Miller(1988)CABIOS 4:11-17のアルゴリズム;Smith et al.(1981)Adv.Appl.Math.2:482のローカルアライメントアルゴリズム;Needleman and Wunsch(1970)J.Mol.Biol.48:443-453のグローバルアライメントアルゴリズム;Pearson and Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448のsearch-for-localアルゴリズム法;Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877として修飾されたKarlin and Altschul(1990)のアルゴリズムが挙げられる。
【0022】
これらの数学的アルゴリズムのコンピューター実装は、配列の同一性を決定するための配列の比較に利用することができる。このような実装には、以下が含まれるが、これらに限定されない。CLUSTAL(PC/Geneプリグラム(Intelligenetics,Mountain View,Californiakら利用可能);ALIGNプログラム(Version 2.0)、GAP、BESTFIT、BLAST、FASTA、及びTFASTA(GCG Wisconsin Genetics Software Package、Version 10(Accelrys Inc.,9685 Scranton Road,San Diego,California,USAから利用可能である)。これらのプログラムを使用した生越は、デフォルトのパラメーターを使用して実行できる。CLUSTALプログラムは、Higgins et al.(1988)Gene 73:237-244;Higgins et al.(1989)CABIOS 5:151-153;Corpet et al.(1988)Nucleic Acids Res.16:10881-90;Huang et al.(1992)CABIOS 8:155-65;Pearson et al.(1994)Meth.Mol.Biol.24:307-331により報告されている。ALIGNプログラムは、上記のMyers and Miller(1988)のアルゴリズムに基づいている。アミノ酸配列を比較する場合、ALIGNプログラムでは、PAM120重み付け残差テーブル、ギャップ長ペナルティ12、ギャップペナルティ4を使用できる。複数の配列アラインメントのMUSCLEアルゴリズムは、複数の核酸又はタンパク質配列の比較に使用することができる(Edgar(2004)Nucleic Acids Research 32:1792-1797)。Altschulら(1990)J.Mol.215:403のBLASTプログラムは、上記のKarlin and Altschul(1990)のアルゴリズムに基づいている。BLASTヌクレオチド検索は、BLASTNプログラム、スコア=100、ワードレングス=12で実行して、本発明のタンパク質をコードするヌクレオチド配列に相同なヌクレオチド配列を得ることができる。BLASTタンパク質検索は、BLASTXプログラム、スコア=50、ワードレングス=3で実行して、本発明のタンパク質又はポリペプチドに相同なアミノ酸配列を得ることができる。比較のためにギャップのあるアラインメントを取得するにはAltschul et al.(1997)Nucleic Acids Res. 25:3389に記載されているように、ギャップのあるBLAST(BLAST 2.0)を利用することができる。あるいは、PSI-BLAST(BLAST 2.0)を使用して、分子間の遠い関係を検出する反復検索を実行できる。Altschulら(前掲)を参照されたい。BLAST、ギャップ付きBLAST、PSI-BLASTを利用する場合、それぞれのプログラムのデフォルト・パラメーター(例えば、ヌクレオチド配列にはBLASTN、タンパク質にはBLASTX)を使用できる。ウェブ部位www.ncbi.nlm.nih.govを参照されたい。整列はまた、検査により手動で行うこともできる。
【0023】
Cms1ポリペプチド、又はその断片若しくは変異体をコードする核酸分子は、目的の植物又は目的の他の細胞若しくは生物における発現のためにコドン最適化することができる。「コドン最適化遺伝子」は、宿主細胞の好ましいコドン使用頻度を模倣するように設計されたそのコドン使用頻度を有する遺伝子である。核酸分子は、全体的又は部分的に、コドン最適化することができる。任意の1つのアミノ酸(メチオニンとトリプトファンを除く)はいくつかのコドンによってコードされているため、コードされたアミノ酸を変更することなく、核酸分子の配列を変更できる。コドン最適化は、アミノ酸が変更されないが特定の宿主生物における発現が増加するように、1つ又は複数のコドンが核酸レベルで変更される場合である。当業者は、広範な生物についての選好情報を提供するコドン表及び他の参考文献が当技術分野で利用可能であることを認識するであろう(例えば、Zhangら(1991)Gene 105:61-72;Murrayら(1989)Nucl。Acids Res.17:477-508を参照)。植物での発現のためにヌクレオチド配列を最適化するための方法論は、例えば、米国特許第5,693,047号に提供されている。米国特許第6,015,891号、及びそこに引用されている参考文献。植物での発現のためのコドン最適化ポリヌクレオチドの例は、配列番号16~19、110~120、及び174~176に示されている。
【0024】
II.融合タンパク質
本明細書では、Cms1ポリペプチド、又はその断片若しくは変異体、及びエフェクタードメインを含む融合タンパク質が提供される。Cms1ポリペプチドは、ガイドRNAによって標的部位に向けられ得、その部位で、エフェクタードメインは、標的化された核酸配列を修飾又は影響し得る。エフェクタードメインは、切断ドメイン、後成的修飾ドメイン、転写活性化ドメイン、又は転写リプレッサードメインであり得る。融合タンパク質は、核局在化シグナル、色素体シグナルペプチド、ミトコンドリアシグナルペプチド、複数の細胞内位置へのタンパク質輸送が可能なシグナルペプチド、細胞透過ドメイン、又はマーカードメイン、これは、N末端、C末端、又は融合タンパク質の内部位置に配置できる。Cms1ポリペプチドは、N末端、C末端、又は融合タンパク質の内部に配置できる。Cms1ポリペプチドは、エフェクタードメインに直接融合することも、リンカーと融合することもできる。特定の実施形態では、Cms1ポリペプチドをエフェクタードメインと融合するリンカー配列は、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、又は長さ50アミノ酸。例えば、リンカーは、1~5、1~10、1~20、1~50、2~3、3~10、3~20、5~20、又は10~50アミノ酸の長さの範囲であり得る。
【0025】
いくつかの実施形態では、融合タンパク質のCms1ポリペプチドは、野生型Cms1タンパク質に由来することができる。Cms1由来のタンパク質は、修飾された変異体又は断片であり得る。いくつかの実施形態において、Cms1ポリペプチドは、ヌクレアーゼ活性が低減又は排除されたヌクレアーゼドメイン(例えば、RuvC又はRuvC様ドメイン)を含むように修飾され得る。例えば、Cms1由来のポリペプチドは、ヌクレアーゼドメインがもはや機能しない(すなわち、ヌクレアーゼ活性が存在しない)ように、ヌクレアーゼドメインが削除又は変異されるように修飾され得る。特に、Cms1ポリペプチドは、最大の同一性のために整列された場合、SmCms1の701位又は922位(配列番号10)又はSulfCms1の848位及び1213位(配列番号11)に対応する位置に変異を有し得る。ヌクレアーゼドメインは、部位特異的変異誘発、PCRを介した変異誘発、全遺伝子合成などの既知の方法、ならびに当該技術分野において公知の他の方法を用いて、1つ又は複数の削除変異、挿入変異、及び/又は置換変異により不活性化し得る。例示的な実施形態では、融合タンパク質のCms1ポリペプチドは、Cms1ポリペプチドがヌクレアーゼ活性を持たないようにRuvC様ドメインを変異させることによって修飾される。
【0026】
融合タンパク質はまた、N末端、C末端、又は融合タンパク質の内部位置に位置するエフェクタードメインを含む。いくつかの実施形態では、エフェクタードメインは切断ドメインである。本明細書で使用される場合、「切断ドメイン」は、DNAを切断するドメインを指す。切断ドメインは、エンドヌクレアーゼ又はエキソヌクレアーゼから取得できる。切断ドメインが由来し得るエンドヌクレアーゼの非限定的な例には、制限エンドヌクレアーゼ及びホーミングエンドヌクレアーゼが含まれるが、これらに限定されない。例えば、New England Biolabs Catalog又はBelfortら(1997)Nucleic Acids Res.25:3379-3388を参照されたい。DNAを切断する追加の酵素が知られている(S1ヌクレアーゼ、緑豆ヌクレアーゼ、膵DNase I、小球菌ヌクレアーゼ、酵母HOエンドヌクレアーゼなど)。Linn et al.(編)Nucleases、Cold Spring Harbour Laboratory Press、1993も参照されたい。これらの酵素(又はその機能的断片)の1つ以上を切断ドメインのソースとして使用できる。
【0027】
いくつかの実施形態では、切断ドメインは、II-S型エンドヌクレアーゼに由来し得る。タイプII-Sエンドヌクレアーゼは、通常、認識部位から数塩基対離れた部位でDNAを切断し、分離可能な認識及び切断ドメインを有する。これらの酵素は、一時的に会合して二量体を形成し、互い違いの位置でDNAの各鎖を切断する単量体である。適切なII-S型エンドヌクレアーゼの非限定的な例には、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MbolI、及びSapIが含まれる。
【0028】
特定の実施形態では、タイプII-S切断は、2つの異なる切断ドメイン(それぞれがCms1ポリペプチド又はその断片に結合している)の二量体化を促進するように修飾することができる。エフェクタードメインが切断ドメインである実施形態では、Cms1ポリペプチドは、そのエンドヌクレアーゼ活性が排除されるように、本明細書で論じられるように修飾され得る。例えば、Cms1ポリペプチドは、ポリペプチドがもはやエンドヌクレアーゼ活性を示さないようにRuvC様ドメインを変異させることにより修飾することができる。
【0029】
他の実施形態では、融合タンパク質のエフェクタードメインは、後成的修飾ドメインであり得る。一般に、エピジェネティックな修飾ドメインは、DNA配列を変更せずにヒストン構造や染色体構造を変更する。ヒストン及び/又はクロマチン構造の変化は、遺伝子発現の変化につながる可能性がある。エピジェネティック修飾の例には、ヒストンタンパク質のリジン残基のアセチル化又はメチル化、及びDNAのシトシン残基のメチル化が含まれるが、これらに限定されない。適切なエピジェネティック修飾ドメインの非限定的な例には、ヒストンアセチルタンスフェラーゼドメイン、ヒストンデアセチラーゼドメイン、ヒストンメチルトランスフェラーゼドメイン、ヒストンデメチラーゼドメイン、DNAメチルトランスフェラーゼドメイン、及びDNAデメチラーゼドメインが含まれる。
【0030】
エフェクタードメインがヒストンアセチルタンスフェラーゼ(HAT)ドメインである実施形態では、HATドメインは、EP300(すなわち、E1A結合タンパク質p300)、CREBBP(すなわち、CREB結合タンパク質)、CDY1、CDY2、CDYL1、CLOCK、ELP3、ESA1、GCN5(KAT2A)、HAT1、KAT2B、KAT5、MYST1、MYST2、MYST3、MYST4、NCOA1、NCOA2、NCOA3、NCOAT、P/CAF、Tip60、TAFII250、又はTF3C4に由来し得る。エフェクタードメインが後成的修飾ドメインである実施形態では、Cms1ポリペプチドは、そのエンドヌクレアーゼ活性が排除されるように、本明細書で論じられるように修飾され得る。例えば、Cms1ポリペプチドは、ポリペプチドがもはやヌクレアーゼ活性を持たないようにRuvC様ドメインを変異させることによって修飾することができる。
【0031】
いくつかの実施形態では、融合タンパク質のエフェクタードメインは、転写活性化ドメインであり得る。一般に、転写活性化ドメインは、転写制御要素及び/又は転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼなど)と相互作用して、1つ又は複数の遺伝子の転写を増加及び/又は活性化する。いくつかの実施形態では、転写活性化ドメインは、限定されないが、単純ヘルペスウイルスVP16活性化ドメイン、VP64(VP16の四量体誘導体である)、NFκBp65活性化ドメイン、p53活性化ドメイン1及び2、CREB(cAMP応答要素結合タンパク質)活性化ドメイン、E2A活性化ドメイン、及びNFAT(活性化T細胞の核因子)活性化ドメインが挙げられる。他の実施形態では、転写活性化ドメインは、Gal4、Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、及びLeu3であり得る。転写活性化ドメインは、野生型であっても、元の転写活性化ドメインの修飾バージョンであってもよい。いくつかの実施形態では、融合タンパク質のエフェクタードメインは、VP16又はVP64転写活性化ドメインである。エフェクタードメインが転写活性化ドメインである実施形態では、Cms1ポリペプチドは、そのエンドヌクレアーゼ活性が排除されるように、本明細書で論じられるように修飾され得る。例えば、Cms1ポリペプチドは、ポリペプチドがもはやヌクレアーゼ活性を持たないようにRuvC様ドメインを変異させることによって修飾することができる。
【0032】
さらに他の実施形態では、融合タンパク質のエフェクタードメインは、転写リプレッサードメインであり得る。一般に、転写リプレッサードメインは、転写制御要素及び/又は転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼなど)と相互作用して、1つ又は複数の遺伝子の転写を減少及び/又は終了させる。適切な転写リプレッサードメインの非限定的な例には、誘導性cAMPアーリーリプレッサー(ICER)ドメイン、クルッペル関連ボックスA(KRAB-A)リプレッサードメイン、YY1グリシンリッチリプレッサードメイン、Sp1様リプレッサー、E(spl)リプレッサー、I kappa.Bリプレッサー、及びMeCP2が含まれる。エフェクタードメインが転写リプレッサードメインである実施形態では、Cms1ポリペプチドは、そのエンドヌクレアーゼ活性が排除されるように、本明細書で論じられるように修飾され得る。例えば、Cms1ポリペプチドは、ポリペプチドがもはやヌクレアーゼ活性を持たないようにRuvC様ドメインを変異させることによって修飾することができる。
【0033】
いくつかの実施形態では、融合タンパク質は、少なくとも1つの追加のドメインをさらに含む。適切な追加のドメインの非限定的な例には、核局在化シグナル、細胞透過又は転座ドメイン、及びマーカードメインが含まれる。
【0034】
融合タンパク質のエフェクタードメインが切断ドメインである場合、少なくとも1つの融合タンパク質を含む二量体が形成され得る。二量体は、ホモ二量体又はヘテロ二量体であり得る。いくつかの実施形態では、ヘテロ二量体は2つの異なる融合タンパク質を含む。他の実施形態では、ヘテロダイマーは、1つの融合タンパク質及び追加のタンパク質を含む。
【0035】
二量体は、2つの融合タンパク質単量体が一次アミノ酸配列に関して同一であるホモ二量体であり得る。二量体がホモ二量体である一実施形態では、エンドヌクレアーゼ活性が排除されるようにCms1ポリペプチドを修飾することができる。エンドヌクレアーゼ活性が排除されるようにCms1ポリペプチドが修飾される特定の実施形態では、各融合タンパク質モノマーは、同一のCms1ポリペプチド及び同一の切断ドメインを含み得る。切断ドメインは、本明細書で提供される例示的な切断ドメインのいずれかなど、任意の切断ドメインであり得る。そのような実施形態では、特定のガイドRNAは、融合タンパク質モノマーを異なるが密接に隣接する部位に導き、その結果、二量体形成時に、2つのモノマーのヌクレアーゼドメインが標的DNAに二本鎖切断を作成する。
【0036】
二量体は、2つの異なる融合タンパク質のヘテロ二量体であることもできる。例えば、各融合タンパク質のCms1ポリペプチドは、異なるCms1ポリペプチドから、又はオーソロガスCms1ポリペプチドから得ることができる。例えば、各融合タンパク質は、異なる供給源に由来するCms1ポリペプチドを含み得る。これらの実施形態では、各融合タンパク質は、異なる標的部位(すなわち、プロトスペーサー及び/又はPAM配列によって特定される)を認識するであろう。例えば、ガイドRNAは、それらのヌクレアーゼドメインが標的DNAにおいて効果的な二本鎖切断を生成するように、ヘテロ二量体を異なるが密接に隣接する部位に配置することができる。
【0037】
あるいは、ヘテロ二量体の2つの融合タンパク質は異なるエフェクタードメインを持つことができる。エフェクタードメインが切断ドメインである実施形態では、各融合タンパク質は、異なる修飾切断ドメインを含むことができる。これらの実施形態において、Cms1ポリペプチドは、それらのエンドヌクレアーゼ活性が排除されるように修飾され得る。ヘテロダイマーを形成する2つの融合タンパク質は、Cms1ポリペプチドドメインとエフェクタードメインの両方が異なる可能性がある。
【0038】
上記の実施形態のいずれかにおいて、ホモダイマー又はヘテロダイマーは、核局在化シグナル(NLS)、色素体シグナルペプチド、ミトコンドリアシグナルペプチド、タンパク質を複数の細胞内位置に輸送することができるシグナルペプチド、細胞-上記のように、浸透、転座ドメイン及びマーカードメインが含まれ得る。上記の実施形態のいずれかにおいて、Cms1ポリペプチドの一方又は両方は、ポリペプチドのエンドヌクレアーゼ活性が排除又は修飾されるように修飾され得る。
【0039】
ヘテロ二量体はまた、1つの融合タンパク質及び追加のタンパク質を含み得る。例えば、追加のタンパク質はヌクレアーゼであり得る。一実施形態では、ヌクレアーゼはジンクフィンガーヌクレアーゼである。ジンクフィンガーヌクレアーゼは、ジンクフィンガーDNA結合ドメイン及び切断ドメインを含む。ジンクフィンガーは3つのヌクレオチドを認識して結合する。ジンクフィンガーDNA結合ドメインは、約3つのジンクフィンガーから約7つのジンクフィンガーを含み得る。ジンクフィンガーDNA結合ドメインは、天然に存在するタンパク質に由来するか、操作することができる。例えば、Beerli et al.(2002)Nat.Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan et al.(2001)Nat.Biotechnol.19:656-660;Segal et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416;Zhang et al.(2000)J.Biol.Chem.275(43):33850-33860;Doyon et al.(2008)Nat.Biotechnol.26:702-708;and Santiago et al.(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814を参照されたい。ジンクフィンガーヌクレアーゼの切断ドメインは、本明細書で詳述される任意の切断ドメインであり得る。いくつかの実施形態では、ジンクフィンガーヌクレアーゼは、核局在化シグナル、色素体シグナルペプチド、ミトコンドリアシグナルペプチド、タンパク質を複数の細胞内位置に輸送することができるシグナルペプチド、詳細な細胞浸透ドメイン又は転座ドメインから選択される少なくとも1つの追加ドメインを含むことができ、本明細書に詳述される。
【0040】
特定の実施形態では、上で詳述した任意の融合タンパク質又は少なくとも1つの融合タンパク質を含む二量体は、少なくとも1つのガイドRNAを含むタンパク質-RNA複合体の一部であり得る。ガイドRNAは、融合タンパク質のCms1ポリペプチドと相互作用して、融合タンパク質を特定の標的部位に向け、ガイドRNA塩基の5’末端は、特定のプロトスペーサー配列と対を形成する。
【0041】
III.Cms1ポリペプチド又は融合タンパク質をコードする核酸
本明細書に記載される任意のCms1ポリペプチド又は融合タンパク質をコードする核酸が提供される。核酸はRNA又はDNAであり得る。Cms1ポリペプチドをコードするポリヌクレオチドの例は、配列番号16~19、24~27、70~146、174~176、212~215、及び255~287に示されている。一実施形態では、Cms1ポリペプチド又は融合タンパク質をコードする核酸はmRNAである。mRNAは5’キャップ及び/又は3’ポリアデニル化することができる。別の実施形態では、Cms1ポリペプチド又は融合タンパク質をコードする核酸はDNAである。DNAはベクター内に存在できる。
【0042】
Cms1ポリペプチド又は融合タンパク質をコードする核酸は、目的の植物細胞内のタンパク質への効率的な翻訳のためにコドン最適化できる。コドン最適化のためのプログラムは、当技術分野で利用可能である(例えば、genomics.urv.es/OPTIMIZERのOPTIMIZER;www.genscript.com/codon opt.htmlのGenScriptのOptimumGene.TM)。
【0043】
特定の実施形態では、Cms1ポリペプチド又は融合タンパク質をコードするDNAは、少なくとも1つのプロモーター配列に作動可能に連結され得る。DNAコード配列は、目的の宿主細胞における発現のためにプロモーター制御配列に作動可能に連結され得る。いくつかの実施形態では、宿主細胞は植物細胞である。「作動可能に連結された」は、2つ以上の要素間の機能的連結を意味することを意図している。例えば、プロモーターと目的のコード領域(例えば、Cms1ポリペプチド又はガイドRNAをコードする領域)との間の作動可能な連結は、目的のコード領域の発現を可能にする機能的リンクである。動作可能にリンクされた要素は、隣接していても、隣接していなくてもよい。2つのタンパク質コード領域の結合を指すために使用される場合、作動可能に連結されることにより、コード領域が同じリーディングフレーム内にあることが意図される。
【0044】
プロモーター配列は、構成的、調節的、成長段階特異的、又は組織特異的であり得る。Cms1ポリペプチド及び/又はガイドRNAの発現のタイミング、位置及び/又はレベルを調節するために、核酸分子における異なるプロモーターを使用することにより、異なる適用が増強され得ることが認識される。そのような核酸分子はまた、必要に応じて、プロモーター調節領域(例えば、誘導的、構成的、環境的又は発生的に調節される、又は細胞又は組織特異的/選択的発現を与えるもの)、転写開始部位、リボソーム結合部位、RNA処理シグナル、転写終結部位、及び/又はポリアデニル化シグナルを含み得る。
【0045】
いくつかの実施形態では、本明細書で提供される核酸分子は、植物での発現のために、構成的、組織優先、発生優先、又は他のプロモーターと組み合わせることができる。植物細胞で機能する構成的プロモーターの例には、カリフラワーモザイクウイルス(CaMV)35S転写開始領域、Agrobacterium tumefaciensのT-DNAに由来する1’又は2’プロモーター、ユビキチン1プロモーター、Smasプロモーター、シンナミルなどがある。アルコールデヒドロゲナーゼプロモーター(米国特許第5,683,439号)、Nosプロモーター、pEmuプロモーター、rubiscoプロモーター、GRP1-8プロモーター、及び当業者に知られている様々な植物遺伝子からの他の転写開始領域が含まれる。低レベルの発現が望まれる場合、弱いプロモーターを使用することができる。弱い構成的プロモーターには、例えば、Rsyn7プロモーターのコアプロモーター(WO99/43838及び米国特許第6,072,050号)、コア35S CaMVプロモーターなどが含まれる。他の構成的プロモーターとしては、例えば、米国特許第4,693,047号、5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;及び第5,608,142号。また、米国特許第5,693,047号も参照されたい。参照により本明細書に組み込まれる米国特許第6,177,611号も参照されたい。
【0046】
誘導性プロモーターの例は、低酸素症又は低温ストレスによって誘導可能なAdh1プロモーター、熱ストレスによって誘導可能なHsp70プロモーター、両方とも光によって誘導可能なPPDKプロモーター及びペプカルボキシラーゼプロモーターである。化学的に誘導可能なプロモーター、例えば、より安全に誘導される(米国特許第5,364,780号)、エストロゲン誘導されるEREプロモーター、及びオーキシン誘導及びタペータム特異的であるが、カルスで活性化されるAxig1プロモーターも有用である(PCT US01/22169)。
【0047】
植物の発生制御下にあるプロモーターの例には、葉、根、果実、種子、又は花などの特定の組織で優先的に転写を開始するプロモーターが含まれる。「組織特異的」プロモーターは、特定の組織でのみ転写を開始するプロモーターである。遺伝子の構成的発現とは異なり、組織特異的発現は、いくつかの相互作用する遺伝子調節レベルの結果である。したがって、相同又は密接に関連する植物種からのプロモーターは、特定の組織における導入遺伝子の効率的かつ信頼性の高い発現を達成するために使用することが好ましい場合がある。いくつかの実施形態では、発現は、組織優先プロモーターを含む。「組織優先」プロモーターは、特定の組織において転写を優先的に開始するが、必ずしも完全に又は単独で開始するわけではないプロモーターである。
【0048】
いくつかの実施形態では、Cms1ポリペプチド及び/又はガイドRNAをコードする核酸分子は、細胞型特異的プロモーターを含む。「細胞型特異的」プロモーターは、1つ又は複数の臓器における特定の細胞型での発現を主に駆動するプロモーターである。植物で機能する細胞型特異的プロモーターが主に活性である植物細胞のいくつかの例には、例えば、BETL細胞、根の血管細胞、葉、茎細胞、及び幹細胞が含まれる。核酸分子はまた、細胞型の好ましいプロモーターを含み得る。「細胞型優先」プロモーターは、1つ又は複数の器官における特定の細胞型において、必ずしもほとんど又は完全にではなく、主に発現を駆動するプロモーターである。植物で機能する細胞型の好ましいプロモーターが優先的に活性であり得る植物細胞のいくつかの例には、例えば、BETL細胞、根の血管細胞、葉、茎細胞、及び幹細胞が含まれる。本明細書に記載される核酸分子はまた、種子優先プロモーターを含み得る。いくつかの実施形態では、種子優先プロモーターは、胚嚢、初期胚、初期胚乳、アリューロン、及び/又は基底内胚乳移植細胞層(BETL)において発現を有する。
【0049】
種子に好ましいプロモーターの例には、限定されないがm27kDのガンマゼインプロモーター及びワキシープロモーターが含まれ、Boronat,A.et al.(1986)Plant Sci.47:95-102;Reina,M.et al.Nucl.Acids Res.18(21):6426;Kloesgen,R.B.et al.(1986)Mol.Gen.Genet.203:237-244に記載される。胚、果皮、及び胚乳で発現するプロモーターは、米国特許第6,225,529号及びPCT公開WO00/12733に開示されている。これらのそれぞれの開示は、その全体が参照により本明細書に組み込まれる。
【0050】
胚嚢、初期胚、初期胚乳、アリューロン及び/又は基底内胚乳移動細胞層(BETL)での発現を伴う植物種子優先様式で遺伝子発現を駆動することができるプロモーターを、本明細書で開示される組成物及び方法で使用することができる。このようなプロモーターとしては、限定されないが、Zea mays初期胚乳5遺伝子、Zea mays初期胚乳1遺伝子、Zea mays初期胚乳2遺伝子、GRMZM2G124663、GRMZM2G006585、GRMZM2G120008、GRMZM2G157806、GRMZM2G176390、GRMZM2G472234、GRMZM2G138727、Zea mays CLAVATA1、Zea mays MRP1、Oryza sativa PR602、Oryza sativa PR9a、Zea mays BET1、Zea mays BETL-2、Zea mays BETL-3、Zea mays BETL-4、Zea mays BETL-9、Zea mays BETL-10、Zea mays MEG1、Zea mays TCCR1、Zea mays ASP1、Oryza sativa ASP1、Triticum durum PR60、Triticum durum PR91、Triticum durum GL7、AT3G10590、AT4G18870、AT4G21080、AT5G23650、AT3G05860、AT5G42910、AT2G26320、AT3G03260、AT5G26630、AtIPT4、AtIPT8、AtLEC2、LFAH12に天然に連結されるプロモーターが含まれる。追加のそのようなプロモーターは、米国特許第7803990号、8049000号、7745697号、7119251号、7964770号、7847160号、7700836号、米国特許出願公開第20100313301号、20090049571号、20090089897号、20100281569、20100281570、20120066795、20040003427;PCT公開番号WO/1999/050427、WO/2010/129999、WO/2009/094704、WO/2010/019996及びWO/2010/147825(これらのそれぞれは、すべての目的のためにその全体が参照により本明細書に組み込まれるに記載されている)に記載されている。本明細書に記載されるプロモーターの機能的変異体又は機能的断片は、本明細書に開示される核酸に機能的に連結することもできる。
【0051】
化学的に調節されたプロモーターは、外因性の化学調節因子の適用を通じて遺伝子の発現を調節するために使用することができる。目的に応じて、プロモーターは、化学物質の適用が遺伝子発現を誘導する化学誘導性プロモーター、又は化学物質の適用が遺伝子発現を抑制する化学抑制性プロモーターであり得る。化学誘導性プロモーターは当技術分野で知られており、限定されないが、ベンゼンスルホンアミド除草剤薬害軽減剤によって活性化されるトウモロコシIn2-2プロモーター、プレ-発芽性除草剤として使用される疎水性求電子化合物によって活性化されるトウモロコシGSTプロモーター、及びサリチル酸によって活性化されるタバコPR-1aプロモーターが含まれる。関心のある他の化学的に調節されたプロモーターには、ステロイド応答性プロモーターが含まれる(例えば、Schena et al.(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425、及びMcNellis et al.(1998)Plant J.14(2):247-257におけるグルココルチコイド誘導性プロモーターを参照)、及びテトラサイクリン誘導性及びテトラサイクリン抑制性プロモーター(例えば、Gatz et al.(1991)Mol.Gen.Genet.227:229-237、U.S.Pat.Nos.5,814,618及び5,789,156)が含まれる(これらの文献は参照により本明細書に組み込まれる)。
【0052】
組織優先プロモーターを利用して、特定の組織内の発現構築物の増強された発現を標的とすることができる。特定の実施形態では、組織優先プロモーターは、植物組織において活性であり得る。組織優先プロモーターは当技術分野で知られている。例えば、Yamamoto et al.(1997)Plant J.12(2):255-265;Kawamata et al.(1997)Plant Cell Physiol.38(7):792-803;Hansen et al.(1997)Mol.Gen Genet.254(3):337-343;Russell et al.(1997)Transgenic Res.6(2):157-168;Rinehart et al.(1996)Plant Physiol.112(3):1331-1341;Van Camp et al.(1996)Plant Physiol.112(2):525-535;Canevascini et al.(1996)Plant Physiol.112(2):513-524;Yamamoto et al.(1994)Plant Cell Physiol.35(5):773-778;Lam(1994)Results Probl.Cell Differ.20:181-196;Orozco et al.(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka et al.(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;Guevara-Garcia et al.(1993)Plant J.4(3):495-505を参照されたい。そのようなプロモーターは、必要に応じて、弱い発現のために修飾することができる。
【0053】
葉に好ましいプロモーターは当技術分野で知られている。例えば、Yamamoto et al.(1997)Plant J.12(2):255-265;Kwon et al.(1994)Plant Physiol.105:357-67;Yamamoto et al.(1994)Plant Cell Physiol.35(5):773-778;Gotor et al.(1993)Plant J.3:509-18;Orozco et al.(1993)Plant Mol.Biol.23(6):1129-1138;Matsuoka et al.(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590を参照されたい。さらに、cab及びrubiscoのプロモーターも使用できる。例えば、Simpson et al.(1958)EMBO J 4:2723-2729及びTimko et al.(1988)Nature 318:57-58を参照されたい。
【0054】
ルート優先プロモーターは知られており、文献から入手可能な多くのものから選択するか、又は様々な適合種から新規に単離することができる。例えば、Hire et al.(1992)Plant Mol.Biol.20(2):207-218(大豆根特異的グルタミン合成酵素遺伝子);Keller and Baumgartner (1991)Plant Cell 3(10):1051-1061(インゲンマメのGRP1.8遺伝子の根特異的制御要素);Sanger et al.(1990)Plant Mol.Biol.14(3):433-443(Agrobacterium tumefaciensのマンノピンシンターゼ(MAS)遺伝子の根特異的プロモーター);Miao et al.(1991)Plant Cell 3(1):11-22 ダイズの根及び根粒で発現する部位ゾルのグルタミン合成酵素(GS)をコードする完全長のcDNAクローン).を参照されたい。Bogusz et al.(1990)Plant Cell 2(7):633-641を参照されたい。ここでは、窒素固定非マメ科Parasponia andersoniiからのヘモグロビン遺伝子から分離された2つの根特異的プロモーターと、関連する非窒素固定非マメ科Trema tomentosaについて説明されている。これらの遺伝子のプロモーターは、β-グルクロニダーゼレポーター遺伝子にリンクされ、非マメ科ニコチアナタバクムとマメ科ロータスコルニキュラタスの両方に導入され、どちらの場合も根特異的プロモーター活性が維持された。リーチとアオヤギ(1991)は、Agrobacterium rhizogenesの高発現roIC及びroID根誘導遺伝子のプロモーターの分析について説明する(Plant Science(Limerick)79(1):69-76を参照)。彼らは、エンハンサーと組織優先のDNA決定基がそれらのプロモーターで解離していると結論した。コードするアグロバクテリウムT-DNA遺伝子が根端の表皮で特に活性であり、TR2’遺伝子が無傷の植物に根特異的であり、葉組織の損傷により刺激されることを示した。殺虫性又は殺虫性遺伝子で使用するための特に望ましい特性の組み合わせである(EMBO J.8(2):343-350を参照)。nptII(ネオマイシンホスホトランスフェラーゼII)に融合したTR1’遺伝子は、同様の特性を示した。追加のルート優先プロモーターには、VfENOD-GRP3遺伝子プロモーターが含まれる(Kuster et al.(1995)Plant Mol.Biol.29(4):759-772);及びroIBプロモーター(Capana et al.(1994)Plant Mol.Biol.25(4):681-691。米国特許第5,837,876号、5,750,386号、5,633,363号、5,459,252号、5,401,836号、5,110,732号、及び5,023,179号も参照。ファセオリン遺伝子(Murai et al.(1983)Science 23:476-482及びSengopta-Gopalen et al.(1988)PNAS 82:3320-3324)。プロモーター配列は野生型でも、より効率的又は効果的な発現のために修飾することもできる。
【0055】
Cms1ポリペプチド又は融合タンパク質をコードする核酸配列は、インビトロmRNA合成のためにファージRNAポリメラーゼによって認識されるプロモーター配列に機能的に連結することができる。そのような実施形態では、インビトロ転写されたRNAは、本明細書に記載されているゲノム修飾の方法で使用するために精製することができる。例えば、プロモーター配列は、T7、T3、又はSP6プロモーター配列、又はT7、T3、又はSP6プロモーター配列のバリエーションであり得る。いくつかの実施形態では、Cms1ポリペプチド又は融合タンパク質をコードする配列は、植物細胞におけるCms1ポリペプチド又は融合タンパク質のインビトロ発現のためのプロモーター配列に作動可能に連結され得る。そのような実施形態では、発現されたタンパク質は、本明細書に記載されるゲノム修飾の方法で使用するために精製することができる。
【0056】
特定の実施形態において、Cms1ポリペプチド又は融合タンパク質をコードするDNAはまた、ポリアデニル化シグナル(例えば、SV40ポリAシグナル及び目的の細胞において機能的な他のシグナル)及び/又は少なくとも1つの転写終結配列に連結され得る。さらに、Cms1ポリペプチド又は融合タンパク質をコードする配列は、少なくとも1つの核移行シグナル、少なくとも1つの色素体シグナルペプチド、少なくとも1つのミトコンドリアシグナルペプチド、複数の細胞内位置にタンパク質を輸送できる少なくとも1つのシグナルペプチド、少なくとも1つの細胞浸透ドメイン、及び/又は本明細書の他の箇所に記載されている少なくとも1つのマーカードメインをコードする配列に連結することもできる。
【0057】
Cms1ポリペプチド又は融合タンパク質をコードするDNAは、ベクター中に存在することができる。適切なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、及びウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクターなど)が含まれる。一実施形態では、Cms1ポリペプチド又は融合タンパク質をコードするDNAは、プラスミドベクター中に存在する。適切なプラスミドベクターの非限定的な例には、pUC、pBR322、pET、pBluescript、pCAMBIA、及びそれらの変異体が含まれる。ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含み得る。追加情報は、「Current Protocols in Molecular Biology」Ausubel et al.,John Wiley & Sons,New York,2003又は「Molecular Cloning:A Laboratory Manual」Sambrook & Russell,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,3rd edition,2001に見出すことができる。
【0058】
いくつかの実施形態では、Cms1ポリペプチド又は融合タンパク質をコードする配列を含む発現ベクターは、ガイドRNAをコードする配列をさらに含み得る。ガイドRNAをコードする配列は、目的の植物又は植物細胞におけるガイドRNAの発現のために、少なくとも1つの転写制御配列に作動可能に連結され得る。例えば、ガイドRNAをコードするDNAは、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。適切なPol IIIプロモーターの例としては、哺乳動物U6、U3、H1、及び7SL RNAプロモーターならびにイネU6及びU3プロモーターが挙げられるが、これらに限定されない。
【0059】
IV.ゲノムのヌクレオチド配列を変更する方法
本明細書では、ゲノムのヌクレオチド配列を修飾するための方法が提供される。ゲノムの非限定的な例には、細胞、核、オルガネラ、プラスミド、及びウイルスのゲノムが含まれる。この方法は、ゲノム宿主(例えば、細胞又はオルガネラ)に、DNA標的化RNA(「ガイドRNA」、「gRNA」、「CRISPR RNA」、又は「crRNA」)、又はDNA標的化RNAをコードするDNAポリヌクレオチドなどの1つ以上のDNA標的化ポリヌクレオチドを導入することを含む。ここで、DNA標的化ポリヌクレオチドは、(a)標的DNA中の配列に相補的であるヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用し、ゲノムホストにCms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチドを導入する第2セグメントを含む。ここで、Cms1ポリペプチドは、(a)gRNA又は他のDNA標的ポリヌクレオチドと相互作用するポリヌクレオチド結合部分;及び(b)部位特異的酵素活性を示す活性部分を含む。次に、ゲノム宿主は、Cms1ポリペプチドが発現され、gRNAによって標的とされるヌクレオチド配列を切断する条件下で培養することができる。本明細書に記載されるシステムは、外因性のMg2+又は他の任意のイオンの添加を必要としないことに留意されたい。最後に、修飾ヌクレオチド配列を含むゲノム宿主を選択することができる。
【0060】
本明細書に開示される方法は、本明細書に記載されるように、ゲノム宿主に少なくとも1つのCms1ポリペプチド又は少なくとも1つのCms1ポリペプチドをコードする核酸を導入することを含む。いくつかの実施形態では、Cms1ポリペプチドは、単離されたタンパク質としてゲノム宿主に導入され得る。そのような実施形態では、Cms1ポリペプチドは、タンパク質の細胞取り込みを促進する少なくとも1つの細胞透過ドメインをさらに含むことができる。いくつかの実施形態では、Cms1ポリペプチドは、ガイドポリヌクレオチドと複合した核タンパク質として(例えば、ガイドRNAと複合したリボ核タンパク質として)ゲノム宿主に導入することができる。他の実施形態では、Cms1ポリペプチドは、Cms1ポリペプチドをコードするmRNA分子としてゲノム宿主に導入することができる。さらに他の実施形態では、Cms1ポリペプチドは、Cms1ポリペプチドをコードするオープンリーディングフレームを含むDNA分子としてゲノム宿主に導入することができる。一般に、本明細書に記載されるCms1ポリペプチド又は融合タンパク質をコードするDNA配列は、ゲノム宿主で機能するプロモーター配列に機能的に連結されている。DNA配列は線状であっても、DNA配列がベクターの一部であってもよい。さらに他の実施形態では、Cms1ポリペプチド又は融合タンパク質は、ガイドRNA又は融合タンパク質及びガイドRNAを含むRNA-タンパク質複合体としてゲノム宿主に導入することができる。
【0061】
特定の実施形態では、Cms1ポリペプチドをコードするmRNAは、オルガネラ(例えば、色素体又はミトコンドリア)を標的とし得る。特定の実施形態では、1つ又は複数のガイドRNAをコードするmRNAは、オルガネラ(例えば、色素体又はミトコンドリア)を標的とすることができる。特定の実施形態では、Cms1ポリペプチドをコードするmRNA及び1つ以上のガイドRNAは、オルガネラ(例えば、色素体又はミトコンドリア)を標的とし得る。オルガネラにmRNAをターゲティングする方法は、当技術分野で知られており(例えば、米国特許出願2011/0296551、米国特許出願2011/0321187、Gomez and Pallas(2010)PLoS One 5:e12269を参照)、参照により本明細書に組み入れられる。
【0062】
特定の実施形態では、Cms1ポリペプチドをコードするDNAは、ガイドRNAをコードする配列をさらに含み得る。一般に、Cms1ポリペプチド及びガイドRNAをコードする各配列は、ゲノム宿主におけるCms1ポリペプチド及びガイドRNAのそれぞれの発現を可能にする1つ又は複数の適切なプロモーター制御配列に機能的に連結されている。Cms1ポリペプチド及びガイドRNAをコードするDNA配列は、追加の発現制御、調節、及び/又はプロセシング配列をさらに含むことができる。Cms1ポリペプチド及びガイドRNAをコードするDNA配列は、線状であり得、又はベクターの一部であり得る。
【0063】
本明細書に記載の方法はさらに、ガイドRNAなどの少なくとも1つのポリヌクレオチドをコードする少なくとも1つのガイドRNA又はDNAをゲノム宿主に導入することを含み得る。ガイドRNAは、Cms1ポリペプチドと相互作用して、Cms1ポリペプチドを特定の標的部位に誘導し、その部位で、ガイドRNA塩基は、標的部位の特定のDNA配列と対になる。ガイドRNAは3つの領域で構成される。ターゲットDNA配列の標的部位に相補的な第1領域、ステムループ構造を形成する第2領域、及び本質的に一本鎖のままである第3領域である。各ガイドRNAの最初の領域は、各ガイドRNAがCms1ポリペプチドを特定の標的部位に誘導するように異なる。各ガイドRNAの2番目と3番目の領域は、すべてのガイドRNAで同じにすることができる。
【0064】
ガイドRNAの第1の領域が標的部位と塩基対を形成できるように、ガイドRNAの1つの領域は、標的化DNAの標的部位における配列(すなわち、プロトスペーサー配列)に相補的である。様々な実施形態では、ガイドRNAの第1の領域は、約8ヌクレオチドから約30を超えるヌクレオチドを含み得る。例えば、ガイドRNAの最初の領域とヌクレオチド配列の標的部位との間の塩基対合の領域は、約8、約9、約10、約11、約12、約13、約14、約15であり得る。約16、約17、約18、約19、約20、約22、約23、約24、約25、約27、約30又は30以上のヌクレオチド長であり得る。例示的な実施形態では、ガイドRNAの第1の領域は、長さが約23、24、又は25ヌクレオチドである。ガイドRNAはまた、二次構造を形成する第2の領域を含み得る。いくつかの実施形態では、二次構造は、ステム又はヘアピンを含む。茎の長さは様々である。例えば、ステムは、約5~約6、約10、約15、約20、約25塩基対の長さの範囲であり得る。ステムは、1~約10ヌクレオチドの1つ又は複数のバルジを含むことができる。いくつかの好ましい実施形態では、ヘアピン構造は、「UCUAC」と「GUAGA」の塩基対合がステムを形成する、配列UCUACN3-5GUAGAU(配列番号312-314、配列番号315-317によりコードされる)を含む。「N3-5」は、3、4、又は5ヌクレオチドを示す。したがって、第2の領域の全長は、約14から約25ヌクレオチド長の範囲であり得る。特定の実施形態では、ループは約3、4、又は5ヌクレオチド長であり、ステムは約5、6、7、8、9、又は10塩基対を含む。
【0065】
ガイドRNAはまた、本質的に一本鎖のままである第3の領域を含み得る。したがって、第3の領域は、目的の細胞内のいかなるヌクレオチド配列に対しても相補性を有さず、ガイドRNAの残りに対しては相補性を有さない。3番目の領域の長さは様々である。一般に、第3の領域は、長さが約4ヌクレオチドを超える。例えば、第3の領域の長さは、約5~約60ヌクレオチドの長さの範囲であり得る。ガイドRNAの第2及び第3の領域(ユニバーサル又は足場領域とも呼ばれる)を合わせた長さは、約30~約120ヌクレオチド長の範囲であり得る。一態様では、ガイドRNAの第2及び第3の領域を合わせた長さは、約40から約45ヌクレオチド長の範囲である。
【0066】
いくつかの実施形態では、ガイドRNAは、3つの領域すべてを含む単一の分子を含む。他の実施形態では、ガイドRNAは、2つの別個の分子を含み得る。第1のRNA分子は、ガイドRNAの第1の領域及びガイドRNAの第2の領域の「ステム」の半分を含み得る。第2のRNA分子は、ガイドRNAの第2の領域及びガイドRNAの第3の領域の「ステム」の他の半分を含み得る。したがって、この実施形態では、第1及び第2のRNA分子はそれぞれ、互いに相補的なヌクレオチドの配列を含む。例えば、一実施形態では、第1及び第2のRNA分子はそれぞれ、他の配列と塩基対を形成して機能的ガイドRNAを形成する配列(約6~約25ヌクレオチド)を含む。特定の実施形態では、ガイドRNAは、第2のガイドRNA(すなわち、tracrRNA)を必要とせずに、染色体の標的部位及びCms1ポリペプチドと相互作用する単一分子(すなわち、crRNA)である。
【0067】
特定の実施形態では、ガイドRNAは、RNA分子としてゲノム宿主に導入することができる。RNA分子はin vitroで転写することができる。あるいは、RNA分子は化学的に合成することができる。他の実施形態では、ガイドRNAは、DNA分子としてゲノム宿主に導入することができる。このような場合、ガイドRNAをコードするDNAは、ゲノム宿主におけるガイドRNAの発現のために1つ以上のプロモーター配列に作動可能に連結され得る。例えば、RNAコード配列は、RNAポリメラーゼIII(Pol III)によって認識されるプロモーター配列に作動可能に連結され得る。
【0068】
ガイドRNAをコードするDNA分子は、線状又は環状であり得る。いくつかの実施形態では、ガイドRNAをコードするDNA配列は、ベクターの一部であり得る。適切なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、及びウイルスベクターが含まれる。例示的な実施形態では、ガイドRNAをコードするDNAは、プラスミドベクター中に存在する。適切なプラスミドベクターの非限定的な例には、pUC、pBR322、pET、pBluescript、pCAMBIA、及びそれらの変異体が含まれる。ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含み得る。
【0069】
Cms1ポリペプチド及びガイドRNAの両方がDNA分子としてゲノム宿主に導入される実施形態において、それぞれは、別個の分子(例えば、Cms1ポリペプチド又は融合タンパク質コード配列を含む1つのベクター及びガイドRNAを含む第2のベクター)の一部であり得る。コード配列)又は両方は、同じ分子の一部であり得る(例えば、1つのベクターは、Cms1ポリペプチド又は融合タンパク質及びガイドRNAの両方のためのコード(及び調節)配列を含む)。
【0070】
ガイドRNAと組み合わせたCms1ポリペプチドは、ゲノム宿主の標的部位に向けられ、Cms1ポリペプチドは、標的化DNAに二本鎖切断を導入する。標的部位には、配列の直前に(上流)コンセンサス配列があることを除いて、配列の制限はない。このコンセンサス配列は、プロトスペーサー隣接モチーフ(PAM)とも呼ばれる。
PAM配列の例には、TTTN、NTTN、TTTV、及びNTTVが含まれる(Nは任意のヌクレオチドとして定義され、VはA、G、又はCとして定義される)。Cms1ヌクレアーゼが所望の二本鎖切断を生成することを可能にするために、適切なPAM配列が標的化DNA配列に対して正しい位置に配置されなければならないことは、当該技術分野で周知である。これまでに特徴付けられたすべてのCms1ヌクレアーゼについて、PAM配列はターゲットDNA配列のすぐ5’に位置する。特定のCms1ヌクレアーゼのPAM部位要件は、現時点では計算で予測できず、代わりに、当技術分野で利用可能な方法を使用して実験的に決定する必要がある(Zetsche et al.(2015)Cell 163:759-771;Marshall et al.(2018)Mol Cell 69:146-157)。所与のヌクレアーゼ酵素に対するPAM配列特異性が酵素濃度によって影響を受けることは当技術分野でよく知られている(Karvelis et al.(2015)Genome Biol 16:253)。したがって、目的の細胞又はインビトロ系に送達されるCms1タンパク質の濃度を調節することは、そのCms1酵素に関連する1つ又は複数のPAM部位を変更する方法を表す。目的のシステムでのCms1タンパク質濃度の調整は、例えば、Cms1をコードする遺伝子の発現に使用されるプロモーターを変更することによって、細胞又はin vitroシステムに送達されるリボ核タンパク質の濃度を変更することによって、又はイントロンを追加又は削除することによって達成できる。それは遺伝子発現レベルの調節に役割を果たす場合がある。本明細書で詳述されるように、ガイドRNAの最初の領域は、標的配列のプロトスペーサーに相補的である。典型的には、ガイドRNAの最初の領域は、約19から21ヌクレオチドの長さである。
【0071】
標的部位は、遺伝子のコード領域、遺伝子のイントロン、遺伝子の制御領域、遺伝子間の非コード領域などにあり得る。遺伝子は、タンパク質コード遺伝子又はRNAコード遺伝子であり得る。遺伝子は、本明細書に記載されるように、関心のある任意の遺伝子であり得る。
【0072】
いくつかの実施形態では、本明細書に開示される方法は、少なくとも1つのドナーポリヌクレオチドをゲノム宿主に導入することをさらに含む。ドナーポリヌクレオチドは、少なくとも1つのドナー配列を含む。いくつかの態様では、ドナーポリヌクレオチドのドナー配列は、標的化DNAに見られる内因性又は天然の配列に対応する。例えば、ドナー配列は、標的部位又はその近くのDNA配列の一部と本質的に同一であり得るが、少なくとも1つのヌクレオチド変化を含む。したがって、ドナー配列は、野生型配列の修飾バージョンを標的部位に含むことができ、天然配列との統合又は交換時に、標的位置の配列が少なくとも1つのヌクレオチド変化を含むようにする。例えば、変化は、1つ以上のヌクレオチドの挿入、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの置換、又はそれらの組み合わせであり得る。修飾された配列の統合の結果として、ゲノム宿主は、標的化された染色体配列から修飾された遺伝子産物を産生することができる。
【0073】
あるいは、ドナーポリヌクレオチドのドナー配列は、外因性配列に対応し得る。本明細書で使用される場合、「外因性」配列は、ゲノム宿主にとって天然ではない配列、又はゲノム宿主におけるその天然の位置が異なる位置にある配列を指す。例えば、外因性配列は、タンパク質コーディング配列を含み得、これは、ゲノムへの組み込み時に、ゲノム宿主が組み込まれた配列によってコードされるタンパク質を発現できるように、外因性プロモーター制御配列に作動可能に連結され得る。例えば、ドナー配列は、本明細書の他の箇所に記載されているような農学的に重要な形質をコードするものなど、対象の任意の遺伝子であり得る。あるいは、その発現が内因性プロモーター制御配列によって調節されるように、外因性配列を標的化DNA配列に組み込むことができる。他の反復では、外因性配列は、転写制御配列、別の発現制御配列、又はRNAコード配列であり得る。外因性配列の標的DNA配列への組み込みは、「ノックイン」と呼ばれる。ドナー配列は、数ヌクレオチドから数百ヌクレオチドから数十万ヌクレオチドまでの長さが異なり得る。
【0074】
いくつかの実施形態では、ドナーポリヌクレオチドのドナー配列は、標的部位の上流及び下流にそれぞれ位置する配列と実質的な配列同一性を有する上流配列及び下流配列に隣接している。これらの配列類似性のため、ドナーポリヌクレオチドの上流及び下流配列は、ドナーポリヌクレオチドと標的配列との間の相同組換えを可能にし、ドナー配列を標的DNA配列に組み込む(又は交換する)ことができる。
【0075】
本明細書で使用される上流配列は、標的部位の上流のDNA配列と実質的な配列同一性を共有する核酸配列を指す。同様に、下流配列は、標的部位の下流のDNA配列と実質的な配列同一性を共有する核酸配列を指す。本明細書で使用する場合、「実質的な配列同一性」という語句は、少なくとも約75%の配列同一性を有する配列を指す。したがって、ドナーポリヌクレオチドの上流及び下流配列は、標的部位の上流又は下流の配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の配列同一性を有し得る。例示的な実施形態では、ドナーポリヌクレオチドの上流及び下流配列は、標的部位の上流又は下流のヌクレオチド配列と約95%又は100%の配列同一性を有することができる。一実施形態では、上流配列は、標的部位のすぐ上流に(すなわち、標的部位に隣接して)位置するヌクレオチド配列と実質的な配列同一性を共有する。他の実施形態では、上流配列は、標的部位の上流約100ヌクレオチド内に位置するヌクレオチド配列と実質的な配列同一性を共有する。したがって、例えば、上流配列は、標的部位から上流にある約1~約20、約21~約40、約41~約60、約61~約80、又は約81~約100ヌクレオチドに位置するヌクレオチド配列と実質的な配列同一性を共有することができる。一実施形態では、下流配列は、標的部位のすぐ下流に(すなわち、標的部位に隣接して)位置するヌクレオチド配列と実質的な配列同一性を共有する。他の実施形態では、下流配列は、標的部位から下流の約100(100)ヌクレオチド内に位置するヌクレオチド配列と実質的な配列同一性を共有する。したがって、例えば、下流配列は、標的部位の下流から約1~約20、約21~約40、約41~約60、約61~約80、又は約81~約100ヌクレオチドに位置するヌクレオチド配列と実質的な配列同一性を共有することができる。
【0076】
各上流又は下流配列は、長さが約20ヌクレオチド~約5000ヌクレオチドの範囲であり得る。いくつかの実施形態では、上流及び下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、又は5000ヌクレオチドを含み得る。例示的な実施形態では、上流及び下流配列は、長さが約50~約1500ヌクレオチドの範囲であり得る。
【0077】
標的ヌクレオチド配列に対して配列類似性を有する上流及び下流配列を含むドナーポリヌクレオチドは、直線状又は環状であり得る。ドナーポリヌクレオチドが環状である実施形態では、それはベクターの一部であり得る。例えば、ベクターはプラスミドベクターであり得る。
【0078】
特定の実施形態では、ドナーポリヌクレオチドは、Cms1ポリペプチドによって認識される少なくとも1つの標的化切断部位をさらに含み得る。ドナーポリヌクレオチドに加えられる標的化切断部位は、ドナー配列の上流又は下流に、又は上流及び下流の両方に配置することができる。例えば、ドナー配列は、Cms1ポリペプチドによる切断時に、ドナー配列が、Cms1ポリペプチドによる切断時に生成されるヌクレオチド配列におけるそれらと適合するオーバーハングにより隣接されるように、標的化切断部位により隣接され得る。したがって、ドナー配列は、非相同修復プロセスによる二本鎖切断の修復中に、切断されたヌクレオチド配列と連結することができる。一般に、標的化された切断部位を含むドナーポリヌクレオチドは、環状である(例えば、プラスミドベクターの一部であり得る)。
【0079】
ドナーポリヌクレオチドは、Cms1ポリペプチドによって生成されるオーバーハングと互換性のある任意の短いオーバーハングを有する短いドナー配列を含む線状分子であり得る。そのような実施形態では、二本鎖切断の修復中に、ドナー配列を切断された染色体配列と直接連結することができる。場合によっては、ドナー配列は、約1,000未満、約500未満、約250未満、又は約100未満のヌクレオチドであり得る。特定の場合において、ドナーポリヌクレオチドは、平滑末端を有する短いドナー配列を含む線状分子であり得る。他の反復において、ドナーポリヌクレオチドは、5’及び/又は3’オーバーハングを有する短いドナー配列を含む線状分子であり得る。オーバーハングは1、2、3、4、又は5ヌクレオチドを含むことができる。
【0080】
一部の実施形態では、ドナーポリヌクレオチドはDNAである。DNAは、一本鎖又は二本鎖及び/又は線状又は環状であり得る。ドナーポリヌクレオチドは、DNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウイルスベクター、DNAの線状片、PCR断片、裸の核酸、又はリポソーム若しくはポロキサマーなどの送達ビヒクルと複合化した核酸であり得る。特定の実施形態では、ドナー配列を含むドナーポリヌクレオチドは、プラスミドベクターの一部であり得る。これらの状況のいずれにおいても、ドナー配列を含むドナーポリヌクレオチドは、少なくとも1つの追加の配列をさらに含むことができる。
【0081】
いくつかの実施形態では、方法は、1つのCms1ポリペプチド(又はコード核酸)及び1つのガイドRNA(又はコードDNA)をゲノム宿主に導入することを含み得、Cms1ポリペプチドは、標的DNAに1つの二本鎖切断を導入する。任意のドナーポリヌクレオチドが存在しない実施形態では、ヌクレオチド配列の二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが発生しやすいため、少なくとも1つのヌクレオチドの削除、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復中に発生する可能性がある。したがって、標的ヌクレオチド配列は、修飾又は不活化され得る。例えば、単一ヌクレオチド変化(SNP)は、変化したタンパク質産物を生じ得るか、又はコード配列のリーディングフレームのシフトは、タンパク質産物が作製されないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する場合、ドナーポリヌクレオチド中のドナー配列は、二本鎖切断の修復中に標的部位でヌクレオチド配列と交換又は統合することができる。ヌクレオチド配列中の標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列により、ドナー配列は、相同性により媒介される修復中に標的部位のヌクレオチド配列と交換又は組み込まれ得る。あるいは、ドナー配列が互換性のあるオーバーハング(又は互換性のあるオーバーハング)に隣接している実施形態では、angsはCms1ポリペプチドによってその場で生成される)二本鎖切断の修復中に、非相同修復プロセスにより、ドナー配列を切断されたヌクレオチド配列と直接ライゲーションできる。ドナー配列のヌクレオチド配列への交換又は組み込みは、標的ヌクレオチド配列を修飾するか、又は外来ヌクレオチド配列を標的ヌクレオチド配列に導入する。
【0082】
本明細書に開示される方法はまた、1つ又は複数のCms1ポリペプチド(又はコード核酸)及び2つのガイドポリヌクレオチド(又はコードDNA)をゲノム宿主に導入することを含むことができ、Cms1ポリペプチドは標的ヌクレオチド配列に2つの二本鎖切断を導入する。2つの切断は、数塩基対内、数十塩基対内、又は数千塩基対で区切ることができる。任意のドナーポリヌクレオチドが存在しない実施形態では、結果として生じる二本鎖切断は、2つの切断部位間の配列が失われ、及び/又は少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせが切断の修復中に起こり得るように、非相同修復プロセスによって修復することができる。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチド中のドナー配列は、相同性に基づく修復プロセス(例えば、ドナー配列が、ヌクレオチド配列の標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列に隣接している実施形態における)、又は非相同修復プロセス(例えば、ドナー配列が互換性のあるオーバーハングに隣接する実施形態における)のいずれかによる二本鎖切断の修復中に標的ヌクレオチド配列と交換又は統合され得る。
【0083】
A.植物ゲノムのヌクレオチド配列を修飾する方法
植物細胞は、核、色素体、ミトコンドリアのゲノムを有する。本発明の組成物及び方法は、核、色素体、及び/又はミトコンドリアゲノムの配列を修飾するために使用され得るか、又は核、色素体、及び/若しくはミトコンドリアゲノムによってコードされる遺伝子の発現を調節するために使用され得る。したがって、「染色体」又は「染色体」は、核、色素体、又はミトコンドリアのゲノムDNAを意図している。植物細胞に適用される「ゲノム」は、核内に見られる染色体DNAだけでなく、細胞の細胞内成分(例えば、ミトコンドリア又は色素体)内に見られるオルガネラDNAを含む。植物細胞、オルガネラ、又は胚における目的のヌクレオチド配列は、本明細書に記載の方法を使用して修飾することができる。特定の実施形態において、本明細書に開示される方法は、植物ホルモン、植物防御タンパク質、栄養素輸送タンパク質、生物関連タンパク質、望ましい入力形質、望ましい出力形質、ストレス耐性遺伝子、疾患/病原体耐性遺伝子、雄性不妊症、発生遺伝子、調節遺伝子、光合成に関与する遺伝子、DNA修復遺伝子、転写調節遺伝子、又は任意の他の、目的のポリヌクレオチド及び/若しくはポリペプチドなどの農学的に重要な形質をコードするヌクレオチド配列を修飾するために使用される。油、デンプン、タンパク質含有量などの農学的に重要な特性も変更できる。変更には、オレイン酸、飽和及び不飽和油の含有量の増加、リジンと硫黄のレベルの増加、必須アミノ酸の提供、及びデンプンの変更が含まれる。ホルドチオニンタンパク質修飾は、米国特許第5,703,049号、第5,885,801号、第5,885,802号、及び第5,990,389号に記載されており、参照により本明細書に組み入れられる。別の例は、米国特許第5,850,016号に記載されているダイズ2Sアルブミンによりコードされるリジン及び/又は硫黄に富む種子タンパク質、ならびにWilliamson et al.(1987)Eur.J.Biochem.165:99-106に記載されている大麦由来のキモトリプシン阻害剤であり、それらの開示は参照により本明細書に組み込まれる。
【0084】
Cms1ポリペプチド(又はコード化核酸)、ガイドRNA(又はコード化DNA)、及びオプションのドナーポリヌクレオチドは、形質転換を含む様々な方法で植物細胞、細胞小器官、又は植物胚に導入できる。形質転換プロトコル、ならびにポリペプチド又はポリヌクレオチド配列を植物に導入するためのプロトコルは、形質転換の標的となる植物又は植物細胞のタイプ、すなわち単子葉植物又は双子葉植物に応じて異なり得る。ポリペプチド及びポリヌクレオチドを植物細胞に導入する適切な方法には、マイクロインジェクション(Crossway et al.(1986)Biotechniques 4:320-334)、エレクトロポレーション(Riggs et al.(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606)、アグロバクテリウム媒介形質転換(U.S.Patent No.5,563,055及びU.S.Patent No.5,981,840)、直接遺伝子導入(Paszkowski et al.(1984)EMBO J.3:2717-2722)、及び衝撃粒子加速(例えば、U.S.Patent Nos.4,945,050;U.S.Patent No.5,879,918;U.S.Patent No.5,886,244;and,5,932,782;Tomes et al.(1995)in Plant Cell,Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin);McCabe et al.(1988)Biotechnology 6:923-926);及びLec1形質転換(WO00/28058)が含まれる。Weissinger et al.(1988)Ann.Rev.Genet.22:421-477;Sanford et al.(1987)Particulate Science and Technology 5:27-37(オニオン);Christou et al.(1988)Plant Physiol.87:671-674(大豆;McCabe et al.(1988)Bio/Technology 6:923-926(soybean);Finer and McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182(大豆);Singh et al.(1998)Theor.Appl.Genet.96:319-324(大豆);Datta et al.(1990)Biotechnology 8:736-740(イネ);Klein et al.(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(トウモロコシ);Klein et al.(1988)Biotechnology 6:559-563(トウモロコシ);U.S.Patent Nos.5,240,855;5,322,783;5,324,646;Klein et al.(1988)Plant Physiol.91:440-444(トウモロコシ);Fromm et al.(1990)Biotechnology 8:833-839(トウモロコシ);Hooykaas-Van Slogteren et al.(1984)Nature(London)311:763-764;U.S.Patent No.5,736,369(オオムギ);Bytebier et al.(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(ユリ科);De Wet et al.(1985)in The Experimental Manipulation of Ovule Tissues,ed.Chapman et al.(Longman,New York),pp.197-209(花粉);Kaeppler et al.(1990)Plant Cell Reports 9:415-418及びKaeppler et al.(1992)Theor.Appl.Genet.84:560-566 (whisker-mediated transformation);D’Halluin et al.(1992)Plant Cell 4:1495-1505(エレクトロポレーシ);Li et al.(1993)Plant Cell Reports 12:250-255及びChristou and Ford(1995)Annals of Botany 75:407-413(イネ);Osjoda et al.(1996)Nature Biotechnology 14:745-750(maize via Agrobacterium tumefaciens)もまた参照されたい。これらはすべて参照により本明細書に組み込まれる。ヌクレアーゼと適切なガイドRNAを含むリボ核タンパク質のバイオリスティック導入による植物細胞の部位固有のゲノム編集が実証されている(Svitashev et al (2016) Nat Commun 7:13274);これらの方法は、参照により本明細書に組み込まれる。「安定した形質転換」とは、植物に導入されたヌクレオチド構築物が植物のゲノムに組み込まれ、その子孫に遺伝することができることを意味することを意図する。ヌクレオチド構築物は、植物の核、色素体、又はミトコンドリアのゲノムに組み込まれていてもよい。プラスチド形質転換の方法は当技術分野で知られており(例えば、Chloroplast Biotechnology:Methods and Protocols (2014)Pal Maliga,ed.、U.S.Patent Application 2011/0321187を参照)、植物ミトコンドリア形質転換の方法は当技術分野で説明されている(例えば、参照により本明細書に組み入れられる米国特許出願2011/0296551を参照されたい。
【0085】
形質転換された細胞は、従来の方法に従って植物に成長(すなわち、培養)され得る。例えば、McCormick et al.(1986)Plant Cell Reports 5:81-84を参照されたい。このようにして、本発明は、ゲノムに安定に組み込まれた核酸修飾を有する形質転換種子(「トランスジェニック種子」とも呼ばれる)を提供する。
【0086】
核酸断片(例えば、組換えDNA構築物)を細胞に挿入する文脈において「導入される」とは、「トランスフェクション」又は「形質転換」又は「形質導入」を意味し、植物への核酸断片の組み込みへの言及を含む。核酸断片が細胞のゲノムに組み込まれる可能性がある細胞(例:核染色体、プラスミド、色素体染色体、ミトコンドリア染色体)、自律レプリコンに変換される、又は一過性に発現される(例:トランスフェクトされたmRNA)。
【0087】
本発明は、単子葉植物及び双子葉植物(すなわち、それぞれ、単子葉植物の及び双子葉植物の)を含むがこれらに限定されない任意の植物種の形質転換に使用され得る。対象となる植物種の例には、限定されないが、トウモロコシ(Zea mays)、Brassica sp.(例えば、B.napus、B.rapa、B.juncea)、種子油の供給源として有用なそれらのBrassica種、アルファルファ(Medicago sativa)、イネ(Oryza sativa)、ライ麦(Secale cereale)、ソルガム(Sorghum bicolor、Sorghum vulgare)、カメリナ(Camelina sativa)、キビ(例えば、パールミレット(Pennisetum glaucum)、キビ(Panicum miliaceum)、アワキビ(Setaria italica)、シコクビエ(Eleusine coracana))、ヒマワリ(Helianthus annuus)、キノア(Chenopodium quinoa)、チコリ(Cichorium intybus)、レタス(Lactuca sativa)、ベニバナ(Carthamus tinctorius)、小麦(Triticum aestivum)、大豆(Glycine max)、タバコ(Nicotiana tabacum)、ジャガイモ(Solanum tuberosum)、ピーナッツ(Arachis hypogaea)、綿(Gossypium barbadense、Gossypium hirsutum)、サツマイモ(Ipomoea batatus)、キャッサバ(Manihot esculenta)、コーヒー(Coffea spp.)、ココナッツ(Cocos nucifera)、パイナップル(Ananas comosus)、柑橘類(Citrus spp.)、ココア(Theobroma cacao)、お茶(Camellia sinensis)、バナナ(Musa spp.)、アボカド(Persea americana)、イチジク(Ficus casica)、グアバ(Psidium guajava)、マンゴー(Mangifera indica)、オリーブ(Olea europaea)、パパイヤ(Carica papaya)、カシュー(Anacardium occidentale)、マカダミア(Macadamia integrifolia)、アーモンド(Prunus amygdalus)、サトウダイコン(Beta vulgaris)、サトウキビ(Saccharum spp.)、アブラヤシ(Elaeis guineensis)、ポプラ(Populus spp.)、ユーカリ(Eucalyptus spp.)、オート麦(Avena sativa)、大麦(Hordeum vulgare)、野菜、観賞植物、及び針葉樹が挙げられる。
【0088】
Cms1ポリペプチド(又はコードする核酸)、ガイドRNA(又はガイドRNAをコードするDNA)、及びオプションのドナーポリヌクレオチドは、植物細胞、オルガネラ、又は植物胚に同時に又は連続して導入できる。Cms1ポリペプチド(又はコード化核酸)とガイドRNA(又はコード化DNA)の比は、一般に、ほぼ化学量論的であり、2つの成分がターゲットDNAとRNA-タンパク質複合体を形成できる。一実施形態では、Cms1ポリペプチドをコードするDNA及びガイドRNAをコードするDNAは、プラスミドベクター内で一緒に送達される。
【0089】
本明細書に開示される組成物及び方法は、光合成に関与する遺伝子などの、植物における目的の遺伝子の発現を変化させるために使用され得る。したがって、光合成に関与するタンパク質をコードする遺伝子の発現は、対照植物と比較して調節され得る。「対象の植物又は植物細胞」は、突然変異などの遺伝子修飾が目的の遺伝子に関して行われたものであるか、又はそのように修飾された植物又は細胞に由来し、変更を含む植物又は植物細胞である。「対照」又は「対照植物」又は「対照植物細胞」は、対象の植物又は植物細胞の表現型の変化を測定するための基準点を提供する。したがって、発現レベルは、本発明の方法に応じて、対照植物における発現レベルよりも高い又は低い。
【0090】
対照植物又は植物細胞は、例えば、以下を含み得る:(a)野生型植物又は細胞、すなわち、対象の植物又は細胞をもたらした遺伝子改変のための出発材料と同じ遺伝子型のもの;(b)出発物質と同じ遺伝子型であるが、ヌル構築物(すなわち、マーカー遺伝子を含む構築物などの目的の形質に既知の影響を及ぼさない構築物)で形質転換された植物又は植物細胞;(c)対象の植物又は植物細胞の子孫の中で非形質転換分離個体である植物又は植物細胞;(d)対象の植物又は植物細胞と遺伝的に同一であるが、目的の遺伝子の発現を誘導する条件又は刺激に曝露されていない植物又は植物細胞;又は(e)対象の遺伝子が発現されない条件下での対象植物又は植物細胞自体。
【0091】
本発明は形質転換植物に関して記載されているが、本発明の形質転換生物はまた、植物細胞、植物プロトプラスト、植物を再生することができる植物細胞組織培養物、植物カルス、植物塊、及び胚芽、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、殻、茎、根、根の先端、葯などの植物又は植物の一部に無傷である植物細胞を含むことが認識される。穀物とは、種の栽培又は繁殖以外の目的で商業栽培者が生成する成熟した種子を意味する。再生された植物の子孫、変異体、及び突然変異体もまた、これらの部分が導入されたポリヌクレオチドを含むという条件で、本発明の範囲内に含まれる。
【0092】
コード配列の誘導体は、コードされたポリペプチドにおける予め選択されたアミノ酸のレベルを増加させるために、本明細書に開示された方法を使用して作製され得る。例えば、オオムギ高リジンポリペプチド(BHL)をコードする遺伝子は、オオムギキモトリプシン阻害剤に由来し、1996年11月1日出願の米国出願番号08/740,682、及びWO98/20133を参照されたい。これらの開示は、参照により本明細書に組み込まれる。他のタンパク質には、ヒマワリの種(Lilley et al.(1989)Proceedings of the World Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs,ed.Applewhite(American Oil Chemists Society,Champaign,Illinois),pp.497-502;本明細書に援用);トウモロコシ(Pedersen et al.(1986)J.Biol.Chem.261:6279;Kirihara et al.(1988)Gene 71:359;ともに本明細書に援用);及びイネ(Musumura et al.(1989)Plant Mol. Biol.12:123、本明細書に援用)などに由来するメチオニンに富む植物タンパク質が含まれる。他の農学的に重要な遺伝子は、ラテックス、Floury 2、成長因子、種子貯蔵因子、及び転写因子をコードする。
【0093】
本明細書に開示される方法は、除草剤耐性形質を修飾するために使用でき、例えば、アセト乳酸シンターゼ(ALS)の作用を阻害するように作用する除草剤、特にスルホニル尿素型除草剤(例えば、このような耐性をもたらす突然変異、特にS4及び/又はHra突然変異、を含むアセト乳酸シンターゼ(ALS)遺伝子)に対する耐性をコードする遺伝子、又はホスフィノスリシン若しくはバスタなどのグルタミンシンターゼの作用を阻害するように作用する除草剤;グリホサート(例えば、EPSPS遺伝子及びGAT遺伝子;例えば、米国公開番号20040082770及びWO03/092360を参照されたい)に対する耐性をコードする遺伝子(例えば、バー遺伝子);又は当該技術分野において公知である他のこのような遺伝子が含まれる。bar遺伝子は、除草剤バスタに対する耐性をコードし、nptII遺伝子は抗生物質カナマイシン及びジェネティシンに対する耐性をコードし、ALS遺伝子変異体は除草剤クロルスルフロンに対する耐性をコードする。追加の除草剤耐性特性は、例えば、参照により本明細書に組み入れられる米国特許出願2016/0208243に記載されている。
【0094】
生殖不能遺伝子も修飾することができ、物理的な分解の代替手段となる。そのような方法で使用される遺伝子の例には、米国特許第5,583,210号に記載されている、雄性組織優先遺伝子及びQMなどの雄性不妊表現型を有する遺伝子が含まれる。他の遺伝子には、キナーゼと、雄性又は雌性の配偶体発生に毒性のある化合物をコードする遺伝子が含まれる。追加の無菌特性は、例えば、参照により本明細書に組み込まれる米国特許出願2016/0208243に記載されている。
【0095】
穀物の品質は、油のレベルとタイプ、飽和と不飽和、必須アミノ酸の品質と量、セルロースのレベルなどの特性をコードする遺伝子を変更することによって変更できる。トウモロコシにおいて、修飾されたホルドチオニンタンパク質は、米国特許第5,703,049号、第5,885,801号、第5,885,802号、及び第5,990,389号に記載されている。
【0096】
商業的特徴はまた、遺伝子を修飾することによって変更することができ、又は例えばエタノール生成のためのデンプンを増加させることができ、又はタンパク質の発現を提供することができる。修飾された植物の別の重要な商業的用途は、米国特許第5,602,321号に記載されているようなポリマー及びバイオプラスチックの生成である。β-ケトチオラーゼ、PHBase(ポリヒドロキシブリーレートシンターゼ)、アセトアセチル-CoAレダクターゼ(Schubert et al.(1988)J.Bacteriol.170:5837-5847を参照)などの遺伝子は、ポリヒドロキシアルカノエート(PHAs)の発現を促進する。
【0097】
外因性産物には、植物酵素及び産物、ならびに原核生物及び他の真核生物を含む他の供給源からの産物が含まれる。そのような製品には、酵素、補因子、ホルモンなどが含まれる。タンパク質のレベル、特に植物の栄養価を改善するためにアミノ酸分布が改善された修飾タンパク質のレベルを上げることができる。これは、強化されたアミノ酸含有量を有するそのようなタンパク質の発現によって達成される。
【0098】
本明細書に開示される方法はまた、異種遺伝子の挿入及び/又は天然植物遺伝子発現の修飾のために使用されて、望ましい植物形質を達成することができる。そのような特性には、例えば、耐病性、除草剤耐性、干ばつ耐性、耐塩性、昆虫耐性、寄生雑草に対する耐性、植物栄養価の向上、飼料消化率の向上、穀物収量の増加、細胞質雄性不稔、果実熟成の変化、貯蔵の増加植物又は植物部分の寿命、アレルゲン産生の減少、及びリグニン含有量の増加又は減少が含まれる。これらの望ましい特性を与えることができる遺伝子は、参照により本明細書に組み込まれる米国特許出願2016/0208243に開示されている。
【0099】
B.非植物真核生物ゲノムのヌクレオチド配列を修飾する方法
非植物真核細胞又は非植物真核細胞小器官のヌクレオチド配列を修飾するための方法が本明細書で提供される。いくつかの実施形態では、非植物真核細胞は哺乳動物細胞である。特定の実施形態では、非植物真核細胞は非ヒト哺乳動物細胞である。この方法は、標的細胞又はオルガネラに、DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチドを導入することを含み、ここで、DNA標的化RNAは、(a)ターゲットDNAの配列に相補的なヌクレオチド配列を含む第1のセグメントを含む;及び(b)Cms1ポリペプチドと相互作用し、Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチドを標的細胞又は細胞小器官に導入する第2セグメント、ここで、Cms1ポリペプチドは、(a)相互作用するRNA結合部分DNAをターゲットとするRNA;(b)部位特異的酵素活性を示す活性部分。次いで、標的細胞又はオルガネラは、キメラヌクレアーゼポリペプチドが発現され、ヌクレオチド配列を切断する条件下で培養され得る。本明細書に記載されるシステムは、外因性のMg2+又は他の任意のイオンの添加を必要としないことに留意されたい。最後に、修飾されたヌクレオチド配列を含む非植物真核細胞又はオルガネラを選択することができる。
【0100】
いくつかの実施形態では、方法は、1つのCms1ポリペプチド(又はコード核酸)及び1つのガイドRNA(又はコードDNA)を非植物真核細胞又はオルガネラに導入することを含むことができ、Cms1ポリペプチドは、核又はオルガネラ染色体DNAの標的ヌクレオチド配列に1つの二本鎖切断を導入する。いくつかの実施形態では、方法は、1つのCms1ポリペプチド(又はコード核酸)及び少なくとも1つのガイドRNA(又はコードDNA)を非植物真核細胞又はオルガネラに導入することを含むことができ、Cms1ポリペプチドは、核又はオルガネラ染色体DNAの標的ヌクレオチド配列に2つ以上の二本鎖切断(すなわち、2つ、3つ、又は4つ以上の二本鎖切断)を導入する。任意のドナーポリヌクレオチドが存在しない実施形態では、ヌクレオチド配列の二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが発生しやすいため、少なくとも1つのヌクレオチドの削除、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復中に発生する可能性がある。したがって、標的ヌクレオチド配列は、修飾又は不活化され得る。例えば、単一ヌクレオチド変化(SNP)は、変化したタンパク質産物を生じさせることができ、又はコード配列のリーディングフレームのシフトは、タンパク質産物が作製されないように配列を不活性化又は「ノックアウト」することができる。任意のドナーポリヌクレオチドが存在する実施形態では、二本鎖切断の修復中に、ドナーポリヌクレオチド中のドナー配列を標的部位のヌクレオチド配列と交換又は組み込むことができる。例えば、ドナー配列が、非植物真核細胞又はオルガネラのヌクレオチド配列における標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列に隣接している実施形態では、ドナー配列相同性指向の修復プロセスによって媒介される修復中に、標的部位のヌクレオチド配列と交換又は統合することができる。あるいは、ドナー配列が適合性オーバーハングに隣接している(又は適合性オーバーハングがCms1ポリペプチドによりインサイチュで生成される)実施形態では、ドナー配列は、二本鎖切断の修復中の非相同修復プロセスにより、切断されたヌクレオチド配列と直接ライゲーションされ得る。ドナー配列のヌクレオチド配列への交換又は組み込みは、標的ヌクレオチド配列を修飾するか、又は非植物真核細胞又はオルガネラの標的ヌクレオチド配列に外因性配列を導入する。
【0101】
いくつかの実施形態では、Cms1ヌクレアーゼ又はヌクレアーゼの作用によって引き起こされる二本鎖切断は、非植物真核細胞又はオルガネラの染色体からDNAが削除されるように修復される。いくつかの実施形態では、1塩基、数塩基(すなわち、2、3、4、5、6、7、8、9、又は10塩基)、又はDNAの大きなセクション(すなわち、10を超える、50を超える、100を超える、又は500を超える塩基)が非植物真核細胞又はオルガネラの染色体から削除される。
【0102】
いくつかの実施形態では、非植物真核生物遺伝子の発現は、Cms1ヌクレアーゼ又はヌクレアーゼによって引き起こされる二本鎖切断の結果として調節され得る。いくつかの実施形態では、非植物真核生物遺伝子の発現は、Cms1ヌクレアーゼが二本鎖切断を生成できないようにする突然変異を含む変異Cms1酵素によって調節され得る。いくつかの好ましい実施形態では、Cms1ヌクレアーゼが二本鎖切断を生成できないようにする突然変異を含む変異体Cms1ヌクレアーゼは、転写活性化又は転写抑制ドメインに融合され得る。
【0103】
いくつかの実施形態では、1つ又は複数のCms1ヌクレアーゼの作用によって引き起こされるその核及び/又はオルガネラ染色体DNAに変異を含む真核細胞を培養して、真核生物を産生する。いくつかの実施形態では、1つ又は複数のCms1ヌクレアーゼ、又は1つ又は複数の変異型Cms1ヌクレアーゼの結果として遺伝子発現が調節される真核細胞を培養して、真核生物を産生する。非植物真核細胞を培養して真核生物を産生する方法は、当技術分野で知られており、例えば、米国特許出願2016/0208243及び2016/0138008であり、それぞれ参照により本明細書に組み入れられる。
【0104】
本発明は、動物(哺乳動物、昆虫、魚、鳥、及び爬虫類を含むがこれらに限定されない)、真菌、アメーバ、及び酵母を含むがこれらに限定されない任意の真核生物種の形質転換に使用できる。
【0105】
ヌクレアーゼタンパク質、ヌクレアーゼタンパク質をコードするDNA又はRNA分子、ガイドRNA又はガイドRNAをコードするDNA分子、及び任意のドナー配列DNA分子を非植物真核細胞又はオルガネラに導入する方法は、当技術分野で、例えば米国特許出願2016/0208243で知られている。これは、参照により本明細書に組み込まれる。非植物真核細胞又はオルガネラに対する例示的な遺伝的修飾は、産業用途に特に価値がある可能性があり、例えば、参照により本明細書に組み入れられる米国特許出願2016/0208243において、当技術分野においても知られている。
【0106】
C.原核生物ゲノムのヌクレオチド配列を修飾する方法
原核生物(例えば、細菌又は古細菌)細胞のヌクレオチド配列を修飾するための方法が本明細書で提供される。この方法は、DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチドを標的細胞に導入することを含み、ここで、DNA標的化RNAは、(a)中の配列に相補的なヌクレオチド配列を含む第1のセグメントを含む。ターゲットDNA;及び(b)Cms1ポリペプチドと相互作用し、Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチドを標的細胞に導入する第2のセグメント。ここで、Cms1ポリペプチドは以下を含む:(a)と相互作用するRNA結合部分DNAターゲティングRNA;(b)部位特異的酵素活性を示す活性部分。次に、標的細胞を、Cms1ポリペプチドが発現され、ヌクレオチド配列を切断する条件下で培養することができる。本明細書に記載されるシステムは、外因性のMg2+又は他の任意のイオンの添加を必要としないことに留意されたい。最後に、修飾ヌクレオチド配列を含む原核細胞を選択することができる。さらに、修飾ヌクレオチド配列を含む原核細胞は、目的のCms1ポリペプチドをコードするポリヌクレオチドの天然の宿主細胞ではなく、非天然のガイドRNAを使用して、原核細胞ヌクレオチド配列に望ましい変化をもたらす。さらに、標的DNAは原核生物の染色体の一部として存在してもよく、又は原核生物の細胞内の1つ又は複数のプラスミド又は他の非染色体DNA分子上に存在してもよいことに留意されたい。
【0107】
いくつかの実施形態では、方法は、1つのCms1ポリペプチド(又はコード核酸)及び1つのガイドRNA(又はコードDNA)を原核細胞に導入することを含むことができ、Cms1ポリペプチドは、原核細胞DNAの標的ヌクレオチド配列に1つの二本鎖切断を導入する。いくつかの実施形態では、方法は、1つのCms1ポリペプチド(又はコード化核酸)及び少なくとも1つのガイドRNA(又はコード化DNA)を原核細胞に導入することを含むことができ、Cms1ポリペプチドは2つ以上の二本鎖切断(すなわち、2つ、原核細胞DNAの標的ヌクレオチド配列における3つ、又は4つ以上の二本鎖切断)を導入する。任意のドナーポリヌクレオチドが存在しない実施形態では、ヌクレオチド配列の二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが発生しやすいため、少なくとも1つのヌクレオチドの削除、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復中に発生する可能性がある。したがって、標的ヌクレオチド配列は、修飾又は不活化され得る。例えば、単一ヌクレオチド変化(SNP)は、変化したタンパク質産物を生じさせることができ、又はコード配列のリーディングフレームのシフトは、タンパク質産物が作製されないように配列を不活性化又は「ノックアウト」することができる。任意のドナーポリヌクレオチドが存在する実施形態では、二本鎖切断の修復中に、ドナーポリヌクレオチド中のドナー配列を標的部位のヌクレオチド配列と交換又は組み込むことができる。例えば、ドナー配列が、原核細胞のヌクレオチド配列における標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列に隣接している実施形態では、ドナー配列は、又は相同性指向の修復プロセスによって媒介される修復中に、標的部位のヌクレオチド配列に組み込まれる。あるいは、ドナー配列が適合性オーバーハングに隣接している(又は適合性オーバーハングがCms1ポリペプチドによりインサイチュで生成される)実施形態では、ドナー配列は、二本鎖切断の修復中の非相同修復プロセスにより、切断されたヌクレオチド配列と直接ライゲーションされ得る。ドナー配列のヌクレオチド配列への交換又は組み込みは、標的ヌクレオチド配列を修飾するか、又は外因性配列を原核細胞DNAの標的ヌクレオチド配列に導入する。
【0108】
いくつかの実施形態では、Cms1ヌクレアーゼ又はヌクレアーゼの作用によって引き起こされる二本鎖切断は、DNAが原核細胞のDNAから削除されるように修復される。いくつかの実施形態では、1塩基、数塩基(すなわち、2、3、4、5、6、7、8、9、又は10塩基)、又はDNAの大きなセクション(すなわち、10以上、50以上、100以上、又は500以上の塩基)が原核細胞のDNAから削除される。
【0109】
いくつかの実施形態では、Cms1ヌクレアーゼ又はヌクレアーゼによって引き起こされる二本鎖切断の結果として、原核生物遺伝子の発現を調節することができる。いくつかの実施形態では、原核生物遺伝子の発現は、Cms1ヌクレアーゼが二本鎖切断を生成できないようにする突然変異を含む変異型Cms1ヌクレアーゼによって調節することができる。いくつかの好ましい実施形態では、Cms1ヌクレアーゼが二本鎖切断を生成できないようにする突然変異を含む変異体Cms1ヌクレアーゼは、転写活性化又は転写抑制ドメインに融合され得る。
【0110】
本発明は、任意の原核生物種、例えば、限定されないが、シアノバクテリア、Corynebacterium sp.、Bifidobacterium sp.、Mycobacterium sp.、Streptomyces sp.、Thermobifida sp.、Chlamydia sp.、Prochlorococcus sp.、Synechococcus sp.、Thermosynechococcus sp.、Thermus sp.、Bacillus sp.、Clostridium sp.、Geobacillus sp.、Lactobacillus sp.、Listeria sp.、Staphylococcus sp.、Streptococcus sp.、Fusobacterium sp.、Agrobacterium sp.、Bradyrhizobium sp.、Ehrlichia sp.、Mesorhizobium sp.、Nitrobacter sp.、Rickettsia sp.、Wolbachia sp.、Zymomonas sp.、Burkholderia sp.、Neisseria sp.、Ralstonia sp.、Acinetobacter sp.、Erwinia sp.、Escherichia sp.、Haemophilus sp.、Legionella sp.、Pasteurella sp.、Pseudomonas sp.、Psychrobacter sp.、Salmonella sp.、Shewanella sp.、Shigella sp.、Vibrio sp.、Xanthomonas sp.、Xylella sp.、Yersinia sp.、Campylobacter sp.、Desulfovibrio sp.、Helicobacter sp.、Geobacter sp.、Leptospira sp.、Treponema sp.、Mycoplasma sp.、及びThermotoga sp.の形質転換に使用することができる。
【0111】
ヌクレアーゼタンパク質、ヌクレアーゼタンパク質をコードするDNA又はRNA分子、ガイドRNA又はガイドRNAをコードするDNA分子、及び任意のドナー配列DNA分子を原核細胞又はオルガネラに導入する方法は、例えば米国特許出願2016/0208243に記載れ、参照により本明細書に組み込まれる。産業用途に特定の価値があり得る原核細胞への例示的な遺伝子修飾もまた、例えば、参照により本明細書に組み入れられる米国特許出願2016/0208243において当技術分野で知られている。
【0112】
D.ウイルスゲノムのヌクレオチド配列を修飾する方法
本明細書では、ウイルスゲノムのヌクレオチド配列を修飾するための方法が提供される。この方法は、目的のウイルスを含む細胞に、DNA標的RNA又はDNA標的RNAをコードするDNAポリヌクレオチドを導入することを含み、ここで、DNA標的RNAは、以下を含む:(a)ターゲットDNA内の配列に相補的であるヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用し、Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチドを標的細胞に導入する第2のセグメント。ここで、Cms1ポリペプチドは以下を含む:(a)と相互作用するRNA結合部分DNAターゲティングRNA;(b)部位特異的酵素活性を示す活性部分。次に、目的のウイルスを含む標的細胞を、Cms1ポリペプチドが発現され、ウイルスのヌクレオチド配列を切断する条件下で培養することができる。あるいは、ウイルスゲノムをインビトロで操作することができ、ガイドポリヌクレオチド、Cms1ポリペプチド、及び任意のドナーポリヌクレオチドは、細胞宿主の外側で目的のウイルスDNA配列とインキュベートされる。
【0113】
V.遺伝子発現を調節する方法
本明細書に開示される方法は、ヌクレオチド配列の修飾又はゲノム宿主におけるヌクレオチド配列の発現の調節をさらに包含する。この方法は、ゲノム宿主に、少なくとも1つの融合タンパク質又は少なくとも1つの融合タンパク質をコードする核酸を導入することを含み得、ここで、融合タンパク質は、Cms1ポリペプチド又はその断片若しくは修飾体及びエフェクタードメインを含み、及び(b)少なくとも1つガイドRNA又はガイドRNAをコードするDNA、ここで、ガイドRNAは融合タンパク質のCms1ポリペプチドを標的DNAの標的部位に導き、融合タンパク質のエフェクタードメインは染色体配列を修飾するか、又は標的DNA配列の近くで1つ以上の遺伝子の発現を調節する。
【0114】
Cms1ポリペプチド又はその断片又は変異体及びエフェクタードメインを含む融合タンパク質は、本明細書に記載されている。一般に、本明細書に開示される融合タンパク質は、少なくとも1つの核局在化シグナル、色素体シグナルペプチド、ミトコンドリアシグナルペプチド、又はタンパク質を複数の細胞内位置に輸送することができるシグナルペプチドをさらに含み得る。融合タンパク質をコードする核酸は本明細書に記載されている。一部の実施形態では、融合タンパク質は、単離されたタンパク質(細胞透過ドメインをさらに含むことができる)としてゲノム宿主に導入することができる。さらに、単離された融合タンパク質は、ガイドRNAを含むタンパク質-RNA複合体の一部であり得る。他の実施形態では、融合タンパク質は、RNA分子(キャッピング及び/又はポリアデニル化することができる)としてゲノム宿主に導入することができる。さらに他の実施形態では、融合タンパク質は、DNA分子としてゲノム宿主に導入することができる。例えば、融合タンパク質及びガイドRNAは、別個のDNA分子として、又は同じDNA分子の一部としてゲノム宿主に導入され得る。そのようなDNA分子はプラスミドベクターであり得る。
【0115】
いくつかの実施形態では、方法は、本明細書の他の場所に記載されている少なくとも1つのドナーポリヌクレオチドをゲノム宿主に導入することをさらに含む。細胞などのゲノム宿主に分子を導入するための手段、ならびに細胞(オルガネラを含む細胞を含む)を培養するための手段は、本明細書に記載されている。
【0116】
融合タンパク質のエフェクタードメインが切断ドメインである特定の実施形態では、方法は、1つの融合タンパク質(又は1つの融合タンパク質をコードする核酸)及び2つのガイドRNA(又は2つのガイドRNAをコードするDNA)をゲノム宿主に導入することを含み得る。2つのガイドRNAは、融合タンパク質を染色体配列の2つの異なる標的部位に向け、そこで融合タンパク質は二量体化し(例えば、ホモ二量体を形成)、その結果、2つの切断ドメインは、標的DNA配列に二本鎖切断を導入することができる。任意のドナーポリヌクレオチドが存在しない実施形態では、標的化DNA配列の二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが発生しやすいため、少なくとも1つのヌクレオチドの削除、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復中に発生する可能性がある。したがって、標的とされる染色体配列は、修飾又は不活化され得る。例えば、単一ヌクレオチド変化(SNP)は、変化したタンパク質産物を生じ得るか、又はコード配列のリーディングフレームのシフトは、タンパク質産物が作製されないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する場合、ドナーポリヌクレオチド中のドナー配列は、二本鎖切断の修復中に標的部位で標的DNA配列と交換又は統合することができる。標的DNA配列の標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列に隣接し、修復により標的部位で標的部位の標的DNA配列とドナー配列を交換又は統合することができる。あるいは、ドナー配列が互換性のあるオーバーハング(又は互換性のあるオーバーハング)に隣接している実施形態では、オーバーハングはCms1ポリペプチドによってその場で生成される)ドナー配列は、二本鎖切断の修復中に非相同修復プロセスによって切断された標的DNA配列と直接ライゲーションできる。標的DNA配列へのドナー配列の交換又は統合は、標的DNA配列を修飾するか、又は外来DNA配列を標的DNA配列に導入する。
【0117】
融合タンパク質のエフェクタードメインが切断ドメインである他の実施形態では、方法は、2つの異なる融合タンパク質(又は2つの異なる融合タンパク質をコードする核酸)及び2つのガイドRNA(又は2つのガイドRNAをコードするDNA)をゲノム宿主に導入することを含み得る。融合タンパク質は、本明細書の他の場所で詳述されるように異なり得る。各ガイドRNAは、融合タンパク質を標的DNA配列の特定の標的部位に誘導する。融合タンパク質は二量体化(例えば、ヘテロ二量体を形成)できるため、2つの切断ドメインが標的DNA配列に二本鎖切断を導入できる。任意のドナーポリヌクレオチドが存在しない実施形態では、結果として生じる二本鎖切断は、非相同修復プロセスによって修復され得、少なくとも1つのヌクレオチドの削除、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの置換、又はそれらの組み合わせは、切断の修復中に発生する可能性がある。任意のドナーポリヌクレオチドが存在する実施形態では、ドナーポリヌクレオチド中のドナー配列は、相同性に基づく修復プロセス(例えば、ドナー配列が、染色体配列の標的部位の上流及び下流配列とそれぞれ実質的な配列同一性を有する上流及び下流配列に隣接している実施形態において)又は非相同修復プロセス(例えば、ドナー配列が適合するオーバーハングにより隣接されている実施形態において)のいずれかによる二本鎖切断の修復中に染色体配列と交換又は統合することができる。
【0118】
融合タンパク質のエフェクタードメインが転写活性化ドメイン又は転写リプレッサードメインである特定の実施形態では、方法は、1つの融合タンパク質(又は1つの融合タンパク質をコードする核酸)及び1つのガイドRNA(又は1つのガイドRNAをコードするDNA)をゲノムホストに導入することを含むことができる。ガイドRNAは、融合タンパク質を特定の標的化DNA配列に向け、転写活性化ドメイン又は転写リプレッサードメインは、標的化DNA配列の近くに位置する遺伝子の発現をそれぞれ活性化又は抑制する。すなわち、転写は、標的化されたDNA配列に近接した遺伝子に影響を及ぼし得るか、又は標的化されたDNA配列からさらに離れて位置する遺伝子に影響を及ぼし得る。遺伝子転写は、転写開始部位から数千塩基離れた位置にある、又は別の染色体上にさえある遠くに位置する配列によって調節できることは、当技術分野でよく知られている(Harmston and Lenhard(2013)Nucleic Acids Res 41:7185-7199)。
【0119】
融合タンパク質のエフェクタードメインがエピジェネティック修飾ドメインである別の実施形態では、方法は、ゲノム宿主に1つの融合タンパク質(又は1つの融合タンパク質をコードする核酸)及び1つのガイドRNA(又は1つのガイドRNAをコードするDNA)を導入することを含み得る。ガイドRNAは、融合タンパク質を特定の標的化DNA配列に向け、ここで、エピジェネティック修飾ドメインは、標的化DNA配列の構造を修飾する。エピジェネティックな修飾には、アセチル化、ヒストンタンパク質のメチル化及び/又はヌクレオチドのメチル化が含まれる。いくつかの例において、染色体配列の構造的修飾は、染色体配列の発現の変化をもたらす。
【0120】
VI.遺伝子組み換えを含む生物
A.真核生物
本明細書に提供されるのは、本明細書に記載されるCms1ポリペプチド媒介又は融合タンパク質媒介プロセスを使用して修飾された少なくとも1つのヌクレオチド配列を含む真核生物、真核細胞、オルガネラ、及び植物胚である。対象の染色体配列又は融合タンパク質を標的とするCms1ポリペプチド又は融合タンパク質をコードする少なくとも1つのDNA又はRNA分子、少なくとも1つのガイドRNA、及びオプションで1つ以上の真核生物、真核細胞、オルガネラ、及び植物胚も提供される。ドナーポリヌクレオチド。本明細書に開示される遺伝子修飾真核生物は、修飾ヌクレオチド配列についてヘテロ接合性であり得るか、又は修飾ヌクレオチド配列についてホモ接合性であり得る。オルガネラDNAに1つ又は複数の遺伝子修飾を含む真核細胞は、ヘテロプラズム又はホモプラズムであり得る。
【0121】
真核生物、真核細胞、オルガネラ、及び植物胚の修飾された染色体配列は、それが不活性化され、発現が上方制御又は下方制御され、又は変化したタンパク質産物を生成するか、又は統合配列を含むように修飾され得る。修飾された染色体配列は、配列が転写されないように、及び/又は機能的タンパク質産物が産生されないように、不活性化され得る。したがって、不活性化された染色体配列を含む遺伝子修飾された真核生物は、「ノックアウト」又は「条件付きノックアウト」と呼ばれる場合がある。不活性化された染色体配列は、欠失突然変異(すなわち、1つ又は複数のヌクレオチドの欠失)、挿入突然変異(すなわち、1つ又は複数のヌクレオチドの挿入)、又はナンセンス突然変異(すなわち、停止コドンが導入されるように、単一ヌクレオチドの別のヌクレオチドへの置換など)を含むことができる。突然変異の結果として、標的とされた染色体配列は不活性化され、機能的なタンパク質は産生されません。不活性化された染色体配列は、外から導入された配列を含まない。また、本明細書には、2、3、4、5、6、7、8、9、又は10以上の染色体配列が不活性化されている遺伝子組み換え真核生物も含まれる。
【0122】
修飾された染色体配列はまた、修飾タンパク質産物をコードするように修飾され得る。例えば、修飾された染色体配列を含む遺伝子修飾された真核生物は、修飾されたタンパク質産物が産生されるように、標的化された点突然変異又は他の修飾を含み得る。一実施形態では、染色体配列は、少なくとも1つのヌクレオチドが変化し、発現したタンパク質が1つの変化したアミノ酸残基(ミスセンス変異)を含むように修飾することができる。別の実施形態では、染色体配列は、複数のアミノ酸が変化するように、複数のミスセンス変異を含むように修飾することができる。さらに、染色体配列は、発現されたタンパク質が単一のアミノ酸の欠失又は挿入を含むように、3ヌクレオチドの欠失又は挿入を有するように修飾され得る。修飾又は変異タンパク質は、野生型タンパク質と比較して、基質特異性の変化、酵素活性の変化、反応速度の変化など、特性又は活性が変化する可能性がある。
【0123】
いくつかの実施形態では、遺伝子修飾真核生物は、少なくとも1つの染色体に組み込まれたヌクレオチド配列を含み得る。組み込まれた配列を含む遺伝子修飾された真核生物は、「ノックイン」又は「条件付きノックイン」と呼ばれ得る。組み込まれた配列であるヌクレオチド配列は、例えば、オーソロガスタンパク質、内因性タンパク質、又は両方の組み合わせをコードすることができる。一実施形態では、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、染色体配列が不活性化されるが外因性配列が発現されるように、タンパク質をコードする核又はオルガネラ染色体配列に組み込まれ得る。そのような場合、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、プロモーター制御配列に作動可能に連結され得る。あるいは、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、染色体配列の発現に影響を与えることなく、核又はオルガネラ染色体配列に組み込まれ得る。例えば、タンパク質をコードする配列は、「セーフハーバー」遺伝子座に組み込むことができる本開示はまた、2、3、4、5、6、7、8、9、又は10以上の配列である遺伝子修飾真核生物を包含する。タンパク質をコードする配列を含む配列は、ゲノムに組み込まれる。本明細書に開示される任意の目的の遺伝子は、真核生物の核又はオルガネラの染色体配列に組み込まれて導入され得る。特定の実施形態では、植物の成長又は収量を増加させる遺伝子が染色体に組み込まれる。
【0124】
タンパク質をコードする染色体に組み込まれた配列は、目的のタンパク質の野生型をコードするか、又はタンパク質の修飾バージョンが生成されるように少なくとも1つの修飾を含むタンパク質をコードすることができる。例えば、疾患又は障害に関連するタンパク質をコードする染色体に組み込まれた配列は、生成されたタンパク質の修飾バージョンが関連する障害を引き起こすか又は増強するように、少なくとも1つの修飾を含み得る。あるいは、疾患又は障害に関連するタンパク質をコードする染色体に組み込まれた配列は、タンパク質の修飾バージョンが真核生物又は真核細胞を関連する疾患又は障害の発症から保護するように、少なくとも1つの修飾を含み得る。
【0125】
特定の実施形態では、遺伝子修飾真核生物は、タンパク質の発現パターンが変化するように、タンパク質をコードする少なくとも1つの修飾染色体配列を含むことができる。例えば、プロモーター又は転写因子結合部位などのタンパク質の発現を制御する調節領域は、タンパク質が過剰発現されるように、又はタンパク質の組織特異的又は時間的発現が変更されるように変更することができる、又はそれらの組み合わせ。あるいは、タンパク質の発現パターンは、条件付きノックアウトシステムを使用して変更することができる。条件付きノックアウトシステムの非限定的な例には、Cre-lox組換えシステムが含まれる。Cre-lox組換えシステムは、Creリコンビナーゼ酵素、すなわち、核酸分子の特定の部位(lox部位)間の核酸配列の組換えを触媒することができる部位特異的DNAリコンビナーゼを含む。このシステムを使用して時間的及び組織特異的発現を生成する方法は、当技術分野で知られている。
【0126】
B.原核生物
本明細書に提供されるのは、本明細書に記載されるようなCms1ポリペプチド媒介又は融合タンパク質媒介プロセスを使用して修飾された少なくとも1つのヌクレオチド配列を含む原核生物及び原核細胞である。目的のDNA配列又は融合タンパク質を標的とするCms1ポリペプチド又は融合タンパク質をコードする少なくとも1つのDNA又はRNA分子、少なくとも1つのガイドRNA、及び任意で1つ以上のドナーポリヌクレオチドを含む原核生物及び原核細胞も提供される。
【0127】
原核生物及び原核細胞の修飾されたDNA配列は、それが不活性化されるか、発現が上方調節又は下方調節されるか、又は変化したタンパク質産物を産生するか、又は組み込まれた配列を含むように修飾され得る。修飾されたDNA配列は、配列が転写されないように、及び/又は機能性タンパク質産物が生成されないように、不活性化され得る。したがって、不活性化された染色体配列を含む遺伝子修飾された原核生物は、「ノックアウト」又は「条件付きノックアウト」と呼ばれる場合がある。不活性化されたDNA配列は、欠失突然変異(すなわち、1つ又は複数のヌクレオチドの欠失)、挿入突然変異(すなわち、1つ又は複数のヌクレオチドの挿入)、又はナンセンス突然変異(すなわち、停止コドンが導入されるように、単一ヌクレオチドの別のヌクレオチドへの置換など)を含むことができる。突然変異の結果として、標的DNA配列は不活性化され、機能性タンパク質は産生されません。不活性化されたDNA配列は、外因的に導入された配列を含まない。本明細書には、2、3、4、5、6、7、8、9、又は10以上のDNA配列が不活性化されている遺伝子組み換え原核生物も含まれる。
【0128】
修飾されたDNA配列はまた、修飾タンパク質産物をコードするように修飾され得る。例えば、修飾されたDNA配列を含む遺伝子修飾された原核生物は、修飾されたタンパク質産物が産生されるように、標的化された点突然変異又は他の修飾を含み得る。一実施形態では、DNA配列は、少なくとも1つのヌクレオチドが変化し、発現したタンパク質が1つの変化したアミノ酸残基(ミスセンス変異)を含むように修飾することができる。別の実施形態では、DNA配列は、複数のアミノ酸が変化するように、複数のミスセンス変異を含むように修飾することができる。さらに、DNA配列は、発現されたタンパク質が単一のアミノ酸の欠失又は挿入を含むように、3ヌクレオチドの欠失又は挿入を有するように修飾され得る。修飾又は変異タンパク質は、野生型タンパク質と比較して、基質特異性の変化、酵素活性の変化、反応速度の変化など、特性又は活性が変化する可能性がある。
【0129】
いくつかの実施形態では、遺伝子修飾原核生物は、少なくとも1つの組み込まれたヌクレオチド配列を含み得る。組み込まれた配列を含む遺伝的に修飾された原核生物は、「ノックイン」又は「条件付きノックイン」と呼ばれ得る。組み込まれた配列であるヌクレオチド配列は、例えば、オーソロガスタンパク質、内因性タンパク質、又は両方の組み合わせをコードすることができる。一実施形態では、オルソロガスタンパク質又は内因性タンパク質をコードする配列は、原核生物配列が不活性化されるが、外因性配列が発現されるように、タンパク質をコードする原核生物DNA配列に組み込まれ得る。そのような場合、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、プロモーター制御配列に作動可能に連結され得る。あるいは、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、天然の原核生物配列の発現に影響を与えることなく原核生物のDNA配列に組み込まれ得る。例えば、タンパク質をコードする配列は、「セーフハーバー」遺伝子座に組み込むことができる本開示はまた、2、3、4、5、6、7、8、9、又は10以上の配列である遺伝子組み換え原核生物を包含する。タンパク質をコードする配列を含む、原核生物がホストする原核生物のゲノム又はプラスミドに組み込まれる。ここに開示されている目的の遺伝子は、原核生物の染色体、プラスミド、又は他の染色体外DNAのDNA配列に組み込まれて導入できる。
【0130】
タンパク質をコードする統合された配列は、目的のタンパク質の野生型をコードするか、又はタンパク質の修飾バージョンが生成されるように少なくとも1つの修飾を含むタンパク質をコードすることができる。例えば、疾患又は障害に関連するタンパク質をコードする統合配列は、生成されたタンパク質の修飾バージョンが関連する障害を引き起こすか又は増強するように、少なくとも1つの修飾を含むことができる。あるいは、疾患又は障害に関連するタンパク質をコードする統合配列は、タンパク質の修飾バージョンが原核生物の感染性を低下させるように、少なくとも1つの修飾を含むことができる。
【0131】
特定の実施形態では、遺伝子修飾原核生物は、タンパク質の発現パターンが変化するように、タンパク質をコードする少なくとも1つの修飾DNA配列を含み得る。例えば、プロモーター又は転写因子結合部位などのタンパク質の発現を制御する調節領域は、タンパク質が過剰発現されるように、又はタンパク質の一時的発現が変更されるように、又はそれらの組み合わせが変更され得る。あるいは、タンパク質の発現パターンは、条件付きノックアウトシステムを使用して変更することができる。条件付きノックアウトシステムの非限定的な例には、Cre-lox組換えシステムが含まれる。Cre-lox組換えシステムは、Creリコンビナーゼ酵素、すなわち、核酸分子の特定の部位(lox部位)間の核酸配列の組換えを触媒することができる部位特異的DNAリコンビナーゼを含む。このシステムを使用して時間的発現を生成する方法は、当技術分野で知られている。
【0132】
C.ウイルス
本明細書に提供されるのは、本明細書に記載されるCms1ポリペプチド媒介又は融合タンパク質媒介プロセスを使用して修飾された少なくとも1つのヌクレオチド配列を含むウイルス及びウイルスゲノムである。目的のDNA配列又は融合タンパク質を標的とするCms1ポリペプチド又は融合タンパク質をコードする少なくとも1つのDNA又はRNA分子、少なくとも1つのガイドRNA、及びオプションで1つ以上のドナーポリヌクレオチドを含むウイルス及びウイルスゲノムも提供される。
【0133】
ウイルス及びウイルスゲノムの修飾されたDNA配列は、それが不活化されるか、発現が上方調節又は下方調節されるか、又は変化したタンパク質産物を産生するか、又は組み込まれた配列を含むように修飾され得る。修飾されたDNA配列は、配列が転写されないように、及び/又は機能性タンパク質産物が生成されないように、不活性化され得る。したがって、不活性化された染色体配列を含む遺伝子修飾ウイルスは、「ノックアウト」又は「条件付きノックアウト」と呼ばれる場合がある。不活性化されたDNA配列は、欠失突然変異(すなわち、1つ又は複数のヌクレオチドの欠失)、挿入突然変異(すなわち、1つ又は複数のヌクレオチドの挿入)、又はナンセンス突然変異(すなわち、停止コドンが導入されているように、単一ヌクレオチドの別のヌクレオチドへの置換など)を含むことができる。突然変異の結果として、標的DNA配列は不活性化され、機能性タンパク質は産生されない。不活性化されたDNA配列は、外因的に導入された配列を含まない。本明細書には、2、3、4、5、6、7、8、9、又は10以上のウイルス配列が不活性化されている遺伝子組み換えウイルスも含まれる。
【0134】
修飾されたDNA配列はまた、修飾タンパク質産物をコードするように修飾され得る。例えば、修飾されたDNA配列を含む遺伝子修飾されたウイルスは、修飾されたタンパク質産物が産生されるように、標的化された点突然変異又は他の修飾を含み得る。一実施形態では、DNA配列は、少なくとも1つのヌクレオチドが変化し、発現したタンパク質が1つの変化したアミノ酸残基(ミスセンス変異)を含むように修飾することができる。別の実施形態では、DNA配列は、複数のアミノ酸が変化するように、複数のミスセンス変異を含むように修飾することができる。さらに、DNA配列は、発現されたタンパク質が単一のアミノ酸の欠失又は挿入を含むように、3ヌクレオチドの欠失又は挿入を有するように修飾され得る。修飾又は変異タンパク質は、野生型タンパク質と比較して、基質特異性の変化、酵素活性の変化、反応速度の変化など、特性又は活性が変化する可能性がある。
【0135】
いくつかの実施形態では、遺伝子修飾ウイルスは、少なくとも1つの組み込まれたヌクレオチド配列を含み得る。組み込まれた配列を含む遺伝的に修飾されたウイルスは、「ノックイン」又は「条件付きノックイン」と呼ばれ得る。組み込まれた配列であるヌクレオチド配列は、例えば、オーソロガスタンパク質、内因性タンパク質、又は両方の組み合わせをコードすることができる。一実施形態では、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、ウイルス配列が不活性化されるが、外因性配列は発現されるように、タンパク質をコードするウイルスDNA配列に組み込まれ得る。そのような場合、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、プロモーター制御配列に作動可能に連結され得る。あるいは、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、天然のウイルス配列の発現に影響を与えることなくウイルスDNA配列に組み込まれ得る。例えば、タンパク質をコードする配列を「セーフハーバー」遺伝子座に組み込むことができる本開示はまた、2、3、4、5、6、7、8、9、又は10以上の配列である遺伝子修飾ウイルスも包含する。本明細書に開示されるような任意の目的の遺伝子は、ウイルスゲノムのDNA配列に組み込まれて導入され得る。
【0136】
タンパク質をコードする統合された配列は、目的のタンパク質の野生型をコードするか、又はタンパク質の修飾バージョンが生成されるように少なくとも1つの修飾を含むタンパク質をコードすることができる。例えば、疾患又は障害に関連するタンパク質をコードする統合配列は、生成されたタンパク質の修飾バージョンが関連する障害を引き起こすか又は増強するように、少なくとも1つの修飾を含むことができる。あるいは、疾患又は障害に関連するタンパク質をコードする統合配列は、タンパク質の修飾バージョンがウイルスの感染力を低下させるように、少なくとも1つの修飾を含むことができる。
【0137】
特定の実施形態では、遺伝子組み換えウイルスは、タンパク質の発現パターンが変化するように、タンパク質をコードする少なくとも1つの修飾DNA配列を含むことができる。例えば、プロモーター又は転写因子結合部位などのタンパク質の発現を制御する調節領域は、タンパク質が過剰発現されるように、又はタンパク質の一時的発現が変更されるように、又はそれらの組み合わせが変更され得る。あるいは、タンパク質の発現パターンは、条件付きノックアウトシステムを使用して変更することができる。条件付きノックアウトシステムの非限定的な例には、Cre-lox組換えシステムが含まれる。Cre-lox組換えシステムは、Creリコンビナーゼ酵素、すなわち、核酸分子の特定の部位(lox部位)間の核酸配列の組換えを触媒することができる部位特異的DNAリコンビナーゼを含む。このシステムを使用して時間的発現を生成する方法は、当技術分野で知られている。
【0138】
本明細書で言及されるすべての刊行物及び特許出願は、本発明が関係する当業者の技能のレベルを示す。すべての出版物及び特許出願は、あたかも各個々の出版物又は特許出願が参照により組み込まれることが具体的かつ個別に示されたかのように、参照により本明細書に組み込まれる。
【0139】
前述の発明は、理解を明確にする目的で例証及び例としてある程度詳細に説明されてきたが、添付の特許請求の範囲内で特定の変更及び修正を実施できることは明らかであろう。
【0140】
本発明の実施形態は以下を含む。
1.真核細胞のゲノムの標的部位でヌクレオチド配列を修飾する方法であって、前記真核細胞に
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、DNA標的化RNAは以下を含む:(a)標的DNAの配列に相補的なヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用する第2のセグメント;ならびに
(ii)Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチド、ここで、Cms1ポリペプチドは以下を含む:(a)DNA標的化RNAと相互作用するRNA結合部分;及び(b)部位特異的酵素活性を示す活性部分
を導入することを含む。
【0141】
2.原核細胞のゲノムの標的部位でヌクレオチド配列を修飾する方法であって、前記原核細胞に
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、DNA標的化RNAは以下を含む:(a)標的DNAの配列に相補的なヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用する第2のセグメント;ならびに
(ii)Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチド、ここで、Cms1ポリペプチドは以下を含む:(a)DNA標的化RNAと相互作用するRNA結合部分;及び(b)部位特異的酵素活性を示す活性部分、ここで、前記原核細胞は、前記Cms1ポリペプチドをコードする遺伝子の天然の宿主ではない
を導入することを含む。
【0142】
3.植物細胞のゲノムの標的部位でヌクレオチド配列を修飾する方法であって、前記植物細胞に
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、DNA標的化RNAは以下を含む:(a)標的DNAの配列に相補的なヌクレオチド配列を含む第1のセグメント;及び(b)Cms1ポリペプチドと相互作用する第2のセグメント;ならびに
(ii)Cms1ポリペプチド、又はCms1ポリペプチドをコードするポリヌクレオチド、ここで、Cms1ポリペプチドは以下を含む:(a)DNA標的化RNAと相互作用するRNA結合部分;及び(b)部位特異的酵素活性を示す活性部分
を導入することを含む。
【0143】
実施形態3の方法であって、さらに、
Cms1ポリペプチドが発現され、標的部位でヌクレオチド配列を切断して修飾ヌクレオチド配列を生成する条件下で植物を培養すること;及び前記修飾ヌクレオチド配列を含む植物を選択することを含む。
【0144】
5.標的部位でのヌクレオチド配列の切断が、DNA標的化RNA配列が標的化される配列又はその近くの二本鎖切断を含む、実施形態1~4のいずれか1つの方法。
【0145】
6.前記二本鎖切断が千鳥状の二本鎖切断である、実施形態5に記載の方法。
【0146】
7.千鳥状の二本鎖切断が3~6ヌクレオチドの5’オーバーハングを作成する、実施形態6に記載の方法。
【0147】
8.前記DNA標的化RNAがガイドRNA(gRNA)である、実施形態1~7のいずれか1つに記載の方法。
【0148】
9.前記修飾ヌクレオチド配列が、細胞のゲノムへの異種DNAの挿入、細胞のゲノムからのヌクレオチド配列の欠失、又は細胞のゲノムにおいて少なくとも1つのヌクレオチドの変異を含む、実施形態1~8のいずれか1つの方法。
【0149】
10.前記Cms1ポリペプチドが、配列番号20~23、30~69、208~211、及び222~254からなる群から選択される、実施形態1~9のいずれか1つに記載の方法。
【0150】
11.Cms1ポリペプチドをコードする前記ポリヌクレオチドが、配列番号16~19、24~27、70~146、174~176、212~215、及び255-287からなる群から選択される、実施形態1~10のいずれか1つに記載の方法。
【0151】
12.前記Cms1ポリペプチドが、配列番号20~23、30~69、208~211、及び222-254からなる群から選択される1つ又は複数のポリペプチド配列と少なくとも80%の同一性を有する、実施形態1~11のいずれか1つに記載の方法。
【0152】
13.Cms1ポリペプチドをコードする前記ポリヌクレオチドが、配列番号16~19、24~27、70-146、174-176、212-215、及び255-287からなる群から選択される1つ又は複数の核酸配列と少なくとも70%の同一性を有する、実施形態1~12のいずれか1つに記載の方法。
【0153】
14.Cms1ポリペプチドがホモダイマー又はヘテロダイマーを形成する、実施形態1~13のいずれか1つに記載の方法。
【0154】
15.前記植物細胞が単子葉植物種に由来する、実施形態3に記載の方法。
【0155】
16.前記植物細胞が双子葉植物種に由来する、実施形態3に記載の方法。
【0156】
17.Cms1ポリペプチドの発現が誘導性又は構成的プロモーターの制御下にある、実施形態1~16のいずれか1つに記載の方法。
【0157】
18.Cms1ポリペプチドの発現が、細胞型特異的又は発生上好ましいプロモーターの制御下にある、実施形態1~17のいずれか1つに記載の方法。
【0158】
19.PAM配列が5’-TTNを含み、Nが任意のヌクレオチドであり得る、実施形態1~18のいずれか1つに記載の方法。
【0159】
20.植物細胞のゲノム中の標的部位における前記ヌクレオチド配列が、SBPアーゼ、FBPアーゼ、FBPアルドラーゼ、AGPアーゼ大サブユニット、AGPアーゼ小サブユニット、スクロースリン酸シンターゼ、デンプンシンターゼ、PEPカルボキシラーゼをコードするピルビン酸リン酸ジキナーゼ、トランスケトラーゼ、ルビスコスモールサブユニット、若しくはルビスコアクチバーゼタンパク質をコードするか、又はSBPase、FBPase、FBPアルドラーゼ、AGPaseラージサブユニット、AGPaseスモールサブユニット、スクロースリン酸シンターゼ、デンプンシンターゼ、PEPカルボキシラーゼ、ピルビン酸リン酸ジキナーゼ、トランスケトラーゼ、ルビスコ小サブユニット、若しくはルビスコアクティベースタンパク質をコードする1つ以上の遺伝子の発現を調節する転写因子をコードする、実施形態3の方法。
【0160】
21.標的部位をドナーポリヌクレオチドと接触させることをさらに含み、ドナーポリヌクレオチド、ドナーポリヌクレオチドの一部、ドナーポリヌクレオチドのコピー、又はドナーポリヌクレオチドの一部であり、ドナーポリヌクレオチドのコピーがターゲットDNAに組み込まれる、実施形態1~20のいずれか1つの方法。
【0161】
22.標的DNAが、標的DNA内のヌクレオチドが欠失されるように修飾される、実施形態1~21のいずれか1つに記載の方法。
【0162】
23.Cms1ポリペプチドをコードする前記ポリヌクレオチドが、植物細胞における発現のために最適化されたコドンである、実施形態1から22のいずれか一項に記載の方法。
【0163】
24.前記ヌクレオチド配列の発現が増加又は減少する、実施形態1~23のいずれか1つに記載の方法。
【0164】
25.Cms1ポリペプチドをコードするポリヌクレオチドが、構成的、細胞特異的、誘導可能、又は自殺エクソンの選択的スプライシングによって活性化されるプロモーターに機能的に連結される、実施形態1~24のいずれか1つに記載の方法。
【0165】
26.前記Cms1ポリペプチドが、前記Cms1ポリペプチドのヌクレアーゼ活性を低減又は排除する1つ又は複数の変異を含む、実施形態1~25のいずれか1つに記載の方法。
【0166】
27.前記変異Cms1ポリペプチドが、アイデンティティを最大化するたえに整列した場合、SmCms1(配列番号:10)の701又は922位に対応する位置、又はSulfCms1(配列番号:11)の848又は1213位に対応する位置に変異を含む、実施形態26に記載の方法。
【0167】
28.SmCms1(配列番号10)の701位又は922位に対応する位置の前記変異がそれぞれD701A及びE922Aであり、又はSulfCms1(配列番号:11)の848位及び1213位の1213位に対応する位置の前記変異がそれぞれD848A及びD1213Aである、実施形態27の方法。
【0168】
29.変異Cms1ポリペプチドが転写活性化ドメインに融合される、実施形態26~28のいずれか1つに記載の方法。
【0169】
30.変異Cms1ポリペプチドが転写活性化ドメインに直接融合されるか、又はリンカーを用いて転写活性化ドメインに融合される、実施形態29に記載の方法。
【0170】
31.変異Cms1ポリペプチドが転写抑制因子ドメインに融合される、実施形態26~28のいずれか1つに記載の方法。
【0171】
32.変異Cms1ポリペプチドがリンカーを用いて転写リプレッサードメインに融合される、実施形態31の方法。
【0172】
33.前記Cms1ポリペプチドが核局在化シグナルをさらに含む、実施形態1~32のいずれか1つに記載の方法。
【0173】
34.前記核局在化シグナルが配列番号1を含むか、又は配列番号2によってコードされる、実施形態33に記載の方法。
【0174】
35.前記Cms1ポリペプチドが葉緑体シグナルペプチドをさらに含む、実施形態1~32のいずれか1つに記載の方法。
【0175】
36.前記Cms1ポリペプチドがミトコンドリアシグナルペプチドをさらに含む、実施形態1~32のいずれか1つに記載の方法。
【0176】
37.前記Cms1ポリペプチドが、前記Cms1ポリペプチドを複数の細胞内位置に標的化するシグナルペプチドをさらに含む、実施形態1~32のいずれか1つに記載の方法。
【0177】
38.Cms1ポリペプチドをコードするポリヌクレオチド配列を含む核酸分子であって、前記ポリヌクレオチド配列は、植物細胞における発現のためにコドン最適化されている、核酸分子。
【0178】
39.Cms1ポリペプチドをコードするポリヌクレオチド配列を含む核酸分子であって、前記ポリヌクレオチド配列は、真核細胞での発現のためにコドン最適化されている、核酸分子。
【0179】
40.Cms1ポリペプチドをコードするポリヌクレオチド配列を含む核酸分子であって、前記ポリヌクレオチド配列は、原核細胞における発現のためにコドン最適化されており、前記原核細胞は、前記Cms1ポリペプチドの天然宿主ではない。
【0180】
41.実施形態38~40のいずれか1つの核酸分子であって、前記ポリヌクレオチド配列が、配列番号16~19、24~27、70~146、174~176、212~215、及び255-287、又はその断片若しくは変異体からなる群から選択され、あるいは前記ポリヌクレオチド配列は、配列番号20~23、30~69、208~211、及び222~254からなる群から選択されるCms1ポリペプチドをコードし、ここで、Cms1ポリペプチドをコードする前記ポリヌクレオチド配列は、Cms1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに機能的に連結される。
【0181】
42.実施形態38~40のいずれか1つの核酸分子であって、前記変異ポリヌクレオチド配列が、配列番号16~19、24~27、70~146、174~176、212~215、及び255~287からなる群から選択されるポリヌクレオチド配列と少なくとも70%の配列同一性を有し、又は前記ポリヌクレオチド配列は、配列番号20~23、30~69、208~211、及び222~254からなる群から選択されるポリペプチドと少なくとも80%の配列同一性を有するCms1ポリペプチドをコードし、Cms1ポリペプチドをコードする前記ポリヌクレオチド配列は、Cms1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに作動可能に連結される。
【0182】
43.前記Cms1ポリペプチドが、配列番号20~23、30~69、208~211、及び222~254、又はその断片又は変異体からなる群から選択されるアミノ酸配列を含む、実施形態38~40のいずれか1つの核酸分子。
【0183】
44.前記変異ポリペプチド配列が、配列番号20~23、30~69、208~211、及び222~254からなる群から選択されるポリペプチド配列と少なくとも70%の配列同一性を有する、実施形態43に記載の核酸分子。
【0184】
45.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、植物細胞において活性であるプロモーターに作動可能に連結されている、実施形態38~44のいずれか1つの核酸分子。
【0185】
46.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、真核細胞において活性であるプロモーターに機能的に連結されている、実施形態38~44のいずれか1つに記載の核酸分子。
【0186】
47.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、原核細胞において活性であるプロモーターに機能的に連結されている、実施形態38~44のいずれか1つに記載の核酸分子。
【0187】
48.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、構成的プロモーター、誘導性プロモーター、細胞型特異的プロモーター、又は発生上好ましいプロモーターに機能的に連結される、実施形態38~44のいずれか1つに記載の核酸分子。
【0188】
49.前記核酸分子が、前記Cms1ポリペプチド及びエフェクタードメインを含む融合タンパク質をコードする、実施形態38~44のいずれか1つに記載の核酸分子。
【0189】
50.前記エフェクタードメインが、転写アクチベーター、転写リプレッサー、核局在化シグナル、及び細胞透過シグナルからなる群から選択される、実施形態49に記載の核酸分子。
【0190】
51.前記Cms1ポリペプチドがヌクレアーゼ活性を低減又は排除するように変異されている、実施形態50に記載の核酸分子。
【0191】
52.前記変異Cms1ポリペプチドが、同一性が最大になるように整列させた場合、SmCms1(配列番号10)の701位又は922位、又はSulfCms1(配列番号11)の848位及び1213位に対応する位置に変異を含む、実施形態51に記載の核酸分子。
【0192】
53.前記Cms1ポリペプチドがリンカーを用いて前記エフェクタードメインに融合される、実施形態49~52のいずれか1つの核酸分子。
【0193】
54.前記Cms1ポリペプチドが二量体を形成する、実施形態38~53のいずれか1つの核酸分子。
【0194】
55.実施形態49~54のいずれか1つの核酸分子によってコードされる融合タンパク質。
【0195】
56.実施形態38~44のいずれか1つの核酸分子によってコードされるCms1ポリペプチド。
【0196】
57.ヌクレアーゼ活性を低減又は排除するように変異したCms1ポリペプチド。
【0197】
58.前記変異Cms1ポリペプチドが、同一性が最大になるように整列させた場合、SmCms1(配列番号10)の701又は922位に対応する位置、又はSulfCms1(配列番号11)の848及び1213位に対応する位置に突然変異を含む、実施形態57に記載のCms1ポリペプチド。
【0198】
59.実施形態38~54のいずれか1つの核酸分子を含む、植物細胞、真核細胞、又は原核細胞。
【0199】
60.実施形態55~58のいずれか1つの融合タンパク質又はポリペプチドを含む植物細胞、真核細胞、又は原核細胞。
【0200】
61.実施形態1及び3~37のいずれか1つの方法によって生成された植物細胞。
【0201】
62.実施形態38~54のいずれか1つの核酸分子を含む植物。
【0202】
63.実施形態55~58のいずれか1つの融合タンパク質又はポリペプチドを含む植物。
【0203】
64.実施形態1及び3~37のいずれか1つの方法によって生成された植物。
【0204】
65.実施形態62~64のいずれか1つの植物の種子。
【0205】
66.前記修飾ヌクレオチド配列が、形質転換細胞に抗生物質又は除草剤耐性を付与するタンパク質をコードするポリヌクレオチドの挿入を含む、実施形態1及び3~37のいずれか1つに記載の方法。
【0206】
67.抗生物質又は除草剤耐性を付与するタンパク質をコードする前記ポリヌクレオチドが配列番号7を含むか、又は配列番号8を含むタンパク質をコードする、実施形態66に記載の方法。
【0207】
68.植物細胞のゲノム中の前記標的部位が配列番号12を含む、又は配列番号12の一部若しくは断片と少なくとも80%の同一性を共有する、実施形態3~37のいずれか1つに記載の方法。
【0208】
69.DNA標的化RNAをコードする前記DNAポリヌクレオチドが配列番号15を含む、実施形態1~37のいずれか1つに記載の方法。
【0209】
70.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が核移行シグナルをコードするポリヌクレオチド配列をさらに含む、実施形態38~54のいずれか1つに記載の核酸分子。
【0210】
71.前記核局在化シグナルが配列番号1を含むか、又は配列番号2によってコードされる、実施形態70に記載の核酸分子。
【0211】
72.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、葉緑体シグナルペプチドをコードするポリヌクレオチド配列をさらに含む、実施形態38~54のいずれか1つに記載の核酸分子。
【0212】
73.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、ミトコンドリアシグナルペプチドをコードするポリヌクレオチド配列をさらに含む、実施形態38~54のいずれか1つに記載の核酸分子。
【0213】
74.Cms1ポリペプチドをコードする前記ポリヌクレオチド配列が、前記Cms1ポリペプチドを複数の細胞内位置に標的化するシグナルペプチドをコードするポリヌクレオチド配列をさらに含む、実施形態38~54のいずれか1つに記載の核酸分子。
【0214】
75.前記融合タンパク質が、核移行シグナル、葉緑体シグナルペプチド、ミトコンドリアシグナルペプチド、又は前記Cms1ポリペプチドを複数の細胞内位置に標的化するシグナルペプチドをさらに含む、実施形態55に記載の融合タンパク質。
【0215】
76.前記Cms1ポリペプチドが、核局在化シグナル、葉緑体シグナルペプチド、ミトコンドリアシグナルペプチド、又は前記Cms1ポリペプチドを複数の細胞内位置に標的化するシグナルペプチドをさらに含む、実施形態56~58のいずれか1つのCms1ポリペプチド。
【0216】
77.前記Cms1ポリペプチドが、配列番号177~186からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態1~37のいずれか1つに記載の方法。
【0217】
78.前記Cms1ポリペプチドが、配列番号288~289及び187~201からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態1~37のいずれか1つに記載の方法。
【0218】
79.前記Cms1ポリペプチドが、配列番号290~296からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態1~37のいずれか1つに記載の方法。
【0219】
80.前記Cms1ポリペプチドが、配列番号177~186からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態38~54のいずれか1つの核酸分子。
【0220】
81.前記Cms1ポリペプチドが、配列番号288~289及び187~201からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態38~54のいずれか1つの核酸分子。
【0221】
82.前記Cms1ポリペプチドが、配列番号290~296からなる群から選択される1つ又は複数の配列モチーフを含む、実施形態38~54のいずれか1つに記載の核酸分子。
【0222】
以下の例は、説明のために提供されており、限定のためではない。
【実施例】
【0223】
実験
実施例1-植物形質転換構築物のクローニング
Cms1を含むコンストラクトを表1にまとめる。簡単に言うと、Cms1遺伝子を植物コドン最適化し、GenScript(Piscataway、NJ)でde novo合成し、PCRで増幅して、N末端SV40核局在化タグ(配列番号2)目的のCms1コード配列及びクローニングのための制限酵素部位とインフレームで行う。適切な制限酵素部位を使用して、各Cms1遺伝子を2x35sプロモーター(配列番号3)の下流にクローニングした。ADurb.160Cms1タンパク質(配列番号20)をコードする配列番号16は、使用された普遍的な遺伝暗号のように、停止コドンではなくTGAコドンを使用してグリシンをコードしているように見える生物に由来することに留意されたい。ほとんどの生物によって。したがって、ADurb.160Cms1タンパク質(配列番号24)をコードするネイティブ遺伝子には、複数の時期尚早の停止コドンのように見えるものが含まれる。ただし、グリシンをコードするTGAを使用したこの遺伝子の分析では、完全長のオープンリーディングフレームが明らかになる。同様に、配列番号82、91、92、100、105、213、255、259、266、267、268、270、271、272、273、275、276、277、279、280、284、285、また286は、グリシンをコードするTGAコドンとともに、非普遍的な遺伝暗号を使用している。
【0224】
イネ(Oryza sativa cv.Kitaake)の領域をターゲットとするガイドRNAをコードするプラスミドCAO1遺伝子(配列番号12)は、イネU6(OsU6)プロモーター(配列番号5)が隣接するガイドRNAと合成された。その5’末端とその3’末端のOsU6ターミネーター(配列番号6)。ガイドRNAは、配列番号15の配列を有していた。ガイドRNAプラスミドを表2にまとめる。
【0225】
修復ドナーカセット(配列番号13)を含むプラスミド131632は、OsCAO1遺伝子内の標的部位の上流と下流に約1,000塩基対の相同性を持つように設計されている。修復ドナーカセットには、3末端にカリフラワーモザイクが隣接しているハイグロマイシン耐性遺伝子(配列番号7、配列番号8をコードする)に作動可能に連結されたトウモロコシユビキチンプロモーター(配列番号9)が含まれた。ウイルス35SポリA配列(配列番号4)。プラスミド131592はプラスミド131632と同様に設計されているが、ハイグロマイシンカセットの上流又は下流に相同性アームはない。そのため、プラスミド131592は、3’末端にカリフラワーモザイクウイルス35SポリA配列(配列番号4)が隣接している、ハイグロマイシン耐性遺伝子(配列番号7、配列番号8をコードする)に機能的に連結されたトウモロコシユビキチンプロモーター(配列番号9)を含む、配列番号13のヌクレオチド1,001~4,302を含む。
【0226】
【0227】
【0228】
【表1C】
1-各Cms1遺伝子は、5’末端でSV40核局在化シグナル(配列番号2、配列番号1のアミノ酸配列をコードする)とインフレームで融合された。
【0229】
【0230】
実施例2-イネの形質転換
イネ細胞へのCms1カセット、gRNA含有プラスミド、及び修復ドナーカセットの導入には、パーティクルボンバードメントが使用された。衝撃のために、0.6μmの金粒子2mgを量り取り、滅菌1.5mLチューブに移した。500mLの100%エタノールを加え、チューブを10~15秒間超音波処理した。遠心分離後、エタノールを除去した。次に、1ミリリットルの無菌の二重蒸留水を金のビーズが入っているチューブに加えた。ビーズペレットを短時間ボルテックスし、遠心分離により再形成した後、チューブから水を除去した。無菌層流フード内で、DNAをビーズにコーティングした。表3に、ビーズに添加されたDNAの量を示す。Cms1カセットを含むプラスミド、gRNAを含むプラスミド、及び修復ドナーカセットをビーズに加え、滅菌二重蒸留水を加えて、総容量を50μLにした。これに、20μLのスペルミジン(1M)、続いて50μLのCaCl2(2.5M)を加えた。金粒子を重力によって数分間ペレット化させ、その後遠心分離によってペレット化した。上澄み液を除去し、100%エタノール800μLを加えた。短時間の超音波処理に続いて、金粒子を重力により3~5分間ペレット化し、次にチューブを遠心分離してペレットを形成した。上清を除去し、30μLの100%エタノールをチューブに加えた。DNA被覆金粒子をボルテックスによりこのエタノールに再懸濁し、再懸濁した金粒子10μLを3つのマクロ担体(Bio-Rad、Hercules、CA)のそれぞれに添加した。マクロ担体を層流フード内で5~10分間風乾させて、エタノールを蒸発させた。
【0231】
【0232】
イネカルス組織が衝撃に使用された。イネのカルスはカルス誘導培地(CIM;3.99g/L N6塩とビタミン、0.3g/Lカゼイン加水分解物、30g/Lスクロース、2.8g/L L-プロリン、2mg/L 2,4-D、8g/L寒天、pH5.8に調整)、衝撃前の暗所で28℃で4~7日間維持された。約80~100個のカルス片(それぞれサイズが0.2~0.3cm、重量が合計で1~1.5g)を、浸透圧固形培地(0.4Mのソルビトールと0.4Mのマンニトールを添加したCIM)を含むペトリ皿の中央に、粒子衝撃前の4時間の浸透前処理のために配置した。衝撃のために、DNAコーティングされた金粒子を含むマクロキャリアをマクロキャリアホルダーに組み立てた。ラプチャーディスク(1,100psi)、停止スクリーン、及びマクロキャリアホルダーは、製造元の指示に従って組み立てられた。衝撃されるイネカルスを含むプレートを停止スクリーンの下6cmに配置し、真空チャンバーが25~28インチHgに達した後、カルス片を衝撃した。衝撃の後、カルスを浸透培地に16~20時間置いた後、カルス片を選択培地(50mg/Lハイグロマイシン及び100mg/Lタイムテンチンを添加したCIM)に移した。プレートをインキュベーターに移し、28℃で暗所に保持して、形質転換細胞の回収を開始した。2週間ごとに、カルスを新鮮な選択培地で継代培養した。ハイグロマイシン耐性カルス片は、選択培地で約5~6週間後に出現し始めた。個々のハイグロマイシン耐性カルス片を新しい選択プレートに移し、細胞を分裂及び成長させて、分子分析用にサンプリングするのに十分な組織を作製した。表4は、これらのイネ襲撃実験に使用されたDNAベクターの組み合わせをまとめたものである。
【0233】
【0234】
【0235】
実施例3-イネの分子分析
各形質転換実験からの個々のハイグロマイシン耐性カルス片を新しいプレートに移した後、それらはサンプリングに十分なサイズに成長させた。ハイグロマイシン耐性イネカルスの個々のピースから少量の組織を採取し、PCR、DNA配列、及びT7エンドヌクレアーゼ(T7EI)分析のためにこれらの組織サンプルからDNAを抽出した。PCR分析は、野生型イネDNAからも修復ドナープラスミドのみからもアンプリコンを生成しないプライマーを用いて設計されたが、代わりに相同性アームの外側のイネゲノムにある1つのプライマー結合部位と、挿入カセットの別のプライマー結合を有し、したがって、イネCAO1遺伝子座での挿入イベントを示す。
【0236】
上記のPCR分析から生成されたPCRアンプリコンのサンガー配列及び/又は次世代配列を実行して、PCRアンプリコンが実際の実験的アーチファクトではなく、意図したゲノム遺伝子座での挿入を実際に示していることを確認した。表5は、これらの配列分析の結果をまとめたものである。
【0237】
【0238】
【0239】
PCR及びDNA配列分析に加えて、T7EI分析を実行して、CAO1遺伝子座での小さな挿入及び/又は欠失の存在を検出した。
T7EI分析は、以前に説明されているように実行された(Begemann et al.(2017)Sci Reports 7:11606)。T7EI分析が挿入又は欠失の可能性を示すカルスサンプルの場合、DNA配列分析を実行して、CAO1遺伝子座での挿入及び/又は削除の存在を検出した。
【0240】
実施例4-CAO1遺伝子座での遺伝子修飾によるイネ植物の再生
上記のように形質転換されたイネカルスは、組織培養培地で培養されて苗条を生成する。その後、これらの苗条は発根培地に移され、発根した植物は温室での栽培のために土壌に移される。発根した植物からDNAを抽出し、PCR及びDNA配列解析を行う。T0世代の植物は成熟するまで育てられ、自家受粉してT1世代の種子を生成する。これらのT1世代の種子が植えられ、その結果得られたT1世代の植物が遺伝子型決定されて、ホモ接合性、ヘミ接合性、及びヌル分離植物が識別される。植物は、CAO1遺伝子のホモ接合型ノックアウトに関連する黄葉表現型を検出するために表現型分類される(Lee et al.(2005)Plant Mol Biol 57:805-818)。
【0241】
実施例5-トウモロコシ(Zea mays)の所定のゲノム遺伝子座の編集
1つ又は複数のgRNAは、トウモロコシのゲノム内の目的の部位にアニールし、1つ以上のCms1タンパク質との相互作用を可能にするように設計される。これらのgRNAは、植物細胞において作動可能であるプロモーター(「gRNAカセット」)に作動可能に連結されるようにベクターにクローニングされる。Cms1タンパク質をコードする1つ以上の遺伝子は、植物細胞で機能するプロモーター(「Cms1カセット」)に機能的に連結されるようにベクターにクローニングされる。gRNAカセットとCms1カセットは単一のベクターにクローン化されるか、あるいは植物の形質転換に適した2つの別々のベクターにクローン化され、このベクター又はこれらのベクターはその後アグロバクテリウム細胞に形質転換される。これらの細胞は、形質転換に適したトウモロコシ組織と接触させられる。このアグロバクテリウム細胞とのインキュベーションに続いて、トウモロコシ細胞は無傷の植物の再生に適した組織培養培地で培養される。トウモロコシ植物は、Cms1カセットとgRNAカセットを含むベクターを保持するアグロバクテリウム細胞と接触させられた細胞から再生される。トウモロコシ植物の再生に続いて、植物組織が収穫され、DNAが組織から抽出される。必要に応じて、T7EIアッセイ、PCRアッセイ、及び/又は配列アッセイを実行して、目的のゲノム位置でDNA配列の変化が発生したかどうかを判断する。
【0242】
あるいは、微粒子銃を使用して、Cms1カセットとgRNAカセットをトウモロコシ細胞に導入する。Cms1カセットとgRNAカセットを含む単一のベクター、又はCms1カセットとgRNAカセットをそれぞれ含む個別のベクターは、それぞれ再生に適したトウモロコシ組織を砲撃するために使用される金ビーズ又はチタンビーズにコーティングされる。衝撃に続いて、トウモロコシ組織をトウモロコシ植物の再生のために組織培養培地に移す。トウモロコシ植物の再生に続いて、植物組織が収穫され、DNAが組織から抽出される。必要に応じて、T7EIアッセイ、PCRアッセイ、及び/又は配列アッセイを実行して、目的のゲノム位置でDNA配列の変化が発生したかどうかを判断する。
【0243】
実施例6-Cms1ヌクレアーゼ及び他のタイプVヌクレアーゼの計算分析
CRISPRヌクレアーゼは、タイプによって分類されることが多く、例えば、Cas9ヌクレアーゼはタイプIIヌクレアーゼとして分類され、Cpf1ヌクレアーゼはタイプVとして分類される(Kooninら(2017年)Curr Opin Microbiol 37:67-78)。Cms1ヌクレアーゼタンパク質配列を調べると、これらのヌクレアーゼは、RuvCドメインの存在とHNHドメインの不在に一部基づいてタイプVヌクレアーゼとしてグループ化する必要があることが示唆されている。Cpf1(タイプV-Aとも呼ばれる)、C2c1(タイプV-Bとも呼ばれる)、C2c3(タイプV-Cとも呼ばれる)、CasY(タイプV-Dと呼ばれる)、及びCasX(タイプV-Eとも呼ばれる)を含む、ヌクレアーゼの複数のグループが科学文献に記載されている。
【0244】
タイプVアミノ酸配列の筋肉アラインメントは、通常、これらのタンパク質のRuvCI、RuvCII、及びRuvCIIIドメインの触媒残基を正しく整列することができなかった。タンパク質の機能におけるこれらのドメインの中心的な重要性を考えると、これらの残基の正しい配置が不可欠である。本明細書及び米国特許第9,896,696号に開示されているCms1ヌクレアーゼのアミノ酸配列(配列番号:10、11、20~23、30~69、及び154~156)について、RuvCI、RuvCII、及びRuvCIII触媒残基が同定された。3つのCpf1ヌクレアーゼ(配列番号:147-149)、C2c1ヌクレアーゼ(配列番号:150及び157-164)、C2c3ヌクレアーゼ(配列番号:152及び166-168)(Shmakov et al.(2016)Mol Cell 60:385-397)、CasXヌクレアーゼ(配列番号:151及び165)、及びCasYヌクレアーゼ(配列番号:153及び169-173)(Burstein et al.(2017)Nature 542:237-241)。表6は、これらの各ドメインの触媒残基と、触媒残基の直前の3つのアミノ酸及び触媒残基の直後の3つのアミノ酸を示している。
【0245】
【0246】
【0247】
【0248】
配列のアライメントと他の計算分析では、CasY.5又はCasY.6の明確なRuvCIII触媒残基は示されなかった。Unk64とUnk69の推定触媒残基は、それぞれリジンとアスパラギンであるが、他のすべての残基にはこの位置に不変のアスパラギン酸残基がある。残りのタイプVヌクレアーゼについて、表6にまとめたRuvC触媒残基を使用して、以前に記載された方法(Begemann et al.(2017)BioRxiv doi:10.1101/192799)を用いて、触媒残基が固定されたアンカーとして薬出すRuvCアンカー型配列アライメントを生じさせた。結果のRuvCアンカー型アミノ酸アラインメントを使用して、系統樹を構築した(
図1を参照)。この図が示すように、Cms1ヌクレアーゼは他のタイプVヌクレアーゼとは別のクレードにある。さらに、この分析で一緒にクラスター化するCms1ヌクレアーゼの少なくとも3つの別個のグループがある(表6では、これらのグループはそれぞれMicroCms1からUnk78Cms1、SulfCms1からUnk71Cms1、及びUnk40Cms1からUnk76Cms1で構成されている)。これは、この大きなグループ内のCms1ヌクレアーゼの少なくとも3つのグループの存在を示唆している。これらの3つのグループは、それぞれSmCms1(配列番号10)、SulfCms1(配列番号11)、及びUnk40Cms1(配列番号68)を含むヌクレアーゼのグループに対して、それぞれ「Smタイプ」、「Sulfタイプ」、及び「Unk40タイプ」というラベルが付けられている。
【0249】
Cms1ヌクレアーゼのアミノ酸配列アラインメントを調べて、これらのヌクレアーゼ間でよく保存されているタンパク質配列内のモチーフを特定した。Cms1ヌクレアーゼは、
図1に示されている系統樹の3つの十分に分離されたクレードで検出されたことが観察された。これらのクレードの1つにはSmCms1(配列番号10)が含まれ、別のクレードにはSulfCms1(配列番号11)が含まれ、もう1つにはUnk40Cms1(配列番号68)が含まれる。したがって、これらの各クレードのメンバーは、これらのヌクレアーゼ間で部分的及び/又は完全に保存されたアミノ酸モチーフを特定するために別々に整列された。SmCms1様ヌクレアーゼのアラインメントについては、配列番号10、20、23、30、32-34、37-39、41、43、44、46-60、67、154-156、208-211、222、223、225、228、229、232、234、236、237、241、243、245、248、250、251、253、及び254が整列された。SulfCms1様ヌクレアーゼのアラインメントのために、配列番号11、21、22、31、35、36、40、42、45、61-66、69、227、230、231、235、239、240、242、244、及び247が整列された。Unk40様ヌクレアーゼの整列のために、配列番号68、224、226、233、238、246、249、及び252が整列された。これらのアライメントはMUSCLEを使用して実行され、結果として得られたアライメントは手動で検査され、整列されたすべてのタンパク質間で保存性を示した領域が特定された。配列番号177~186に示されるアミノ酸モチーフは、SmCms1様ヌクレアーゼの整列から同定された。配列番号288~289及び187~201に示されるアミノ酸モチーフは、SulfCms1様ヌクレアーゼのアラインメントから同定された。配列番号290~296に示されるアミノ酸モチーフは、Unk40Cms1様ヌクレアーゼのアラインメントから同定された。ウェブログは、配列アラインメントを使用して作成され、
図2~4(SmCms1-like、SulfCms1-like、及びUnk40Cms1-like配列モチーフ、それぞれweblogo.berkeley.edu)に図示されている。それと同時に、SmCms1、SulfCms1、及びUnk40Cms1タンパク質配列上のこれらの保存されたモチーフの位置を示す概略図が示されている。
【0250】
本明細書に記載のCms1ヌクレアーゼによる植物ゲノムの編集は、タイプVヌクレアーゼの他のいくつかの説明と一致して、TTTN又はTTN PAM部位がすべてではないにしても多くのCms1ヌクレアーゼからアクセス可能であることを示唆した。Cms1ヌクレアーゼをコードするコンティグに存在するCRISPRスペーサーに対応するBLASTヒットを特定するために、計算分析が行われた。CRISPRスペーサーは、CRISPRfinderオンライン(crispr.i2bc.paris-saclay.fr/Server/)を使用して特定された;これらのスペーサーは、メタゲノムに対するBLAST検索のシードとして使用された。BLASTヒットは、AuxCms1、Unk15Cms1、Unk19Cms1、及びUnk40Cms1(それぞれ、配列番号297~300)をコードするコンティグからのCRISPRスペーサーに対して識別された。これらのBLASTヒットは、配列番号:301~307に示され、BLASTヒットの前後のヌクレオチドと共に表7にまとめられている。
【0251】
【0252】
表7では、下線が引かれた塩基がCRISPRスペーサーBLASTヒットを表す。特に、BLASTヒットの5’直後の塩基はすべてTTA又はTTCを示し、この表の11個のBLASTヒットの7つはTTTA又はTTTCを示す。これらのデータと上記の植物ゲノム編集データを組み合わせると、少なくともこれらのCms1ヌクレアーゼ(及びおそらくほとんど又はすべてのCms1ヌクレアーゼ)が、TTTM PAM部位を優先して、少なくともTTM PAM部位から下流の標的部位にアクセスできることが強く示唆される。特に、これらのタイプの計算で特定されたPAM部位は、ヌクレアーゼPAM要件だけでなく、CRISPRスペーサー取得機構要件も考慮に入れているため、ヌクレアーゼは、計算で特定されたものよりも幅広いPAM部位にアクセスできる可能性がある。
【配列表】