(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022184892
(43)【公開日】2022-12-13
(54)【発明の名称】ゲノムを改変するための組成物及び方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20221206BHJP
C12N 1/15 20060101ALI20221206BHJP
C12N 1/19 20060101ALI20221206BHJP
C12N 1/21 20060101ALI20221206BHJP
C12N 5/10 20060101ALI20221206BHJP
A01H 5/00 20180101ALI20221206BHJP
A01H 5/10 20180101ALI20221206BHJP
A01H 1/00 20060101ALI20221206BHJP
C12N 15/55 20060101ALN20221206BHJP
C12N 15/31 20060101ALN20221206BHJP
【FI】
C12N15/09 110
C12N1/15
C12N1/19
C12N1/21
C12N5/10
A01H5/00 A
A01H5/10
A01H1/00 A
C12N15/55 ZNA
C12N15/31
【審査請求】有
【請求項の数】25
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022142420
(22)【出願日】2022-09-07
(62)【分割の表示】P 2018561102の分割
【原出願日】2017-02-15
(31)【優先権主張番号】62/295,325
(32)【優先日】2016-02-15
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/372,108
(32)【優先日】2016-08-08
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/403,854
(32)【優先日】2016-10-04
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/429,112
(32)【優先日】2016-12-02
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/450,743
(32)【優先日】2017-01-26
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】518289221
【氏名又は名称】ベンソン ヒル,インコーポレイティド
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【弁理士】
【氏名又は名称】武居 良太郎
(72)【発明者】
【氏名】マシュー ベゲマン
(72)【発明者】
【氏名】ベンジャミン ニール グレイ
(57)【要約】 (修正有)
【課題】ゲノムDNA配列を改変するための組成物及び方法を提供する。
【解決手段】真核生物細胞に(i)及び(ii)を導入する工程を含み:(i)DNA標的化RNA又はDNA標的化RNAをコードするDNA、ここでDNA標的化RNAは、(a)細胞のゲノムの標的化配列に相補的なヌクレオチド配列を含む第一のセグメントと(b)Cpf1ポリペプチドと相互作用する第二のセグメントとを含む;(ii)Cpf1ポリペプチド又はCpf1ポリペプチドをコードするポリヌクレオチド、ここで、Cpf1ポリペプチドは、(a)RNA結合部分と(b)部位特異的酵素活性を示す活性部分とを含む;ここで、Cpf1ポリペプチドは特定の配列から選択される配列と95%以上の同一性を有し、かつヌクレアーゼ活性を有し、標的化配列は細胞のゲノム中のPAM部位の3´直近に位置し、Cpf1ポリペプチドは標的部位でヌクレオチド配列を改変する、方法である。
【選択図】
図1
【特許請求の範囲】
【請求項1】
真核生物細胞のゲノム中の標的部位でヌクレオチド配列を改変する方法であって、
前記真核生物細胞に以下の(i)及び(ii)を導入する工程を含み:
(i)DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで前記DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第一のセグメントと(b)Cpf1又はCsm1ポリペプチドと相互作用する第二のセグメントとを含む;
(ii)Cpf1又はCsm1ポリペプチド、あるいはCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド、ここで、前記Cpf1又はCsm1ポリペプチドは、(a)DNA標的化RNAと相互作用をするRNA結合部分と(b)部位特異的酵素活性を示す活性部分とを含む;
ここで、前記Cpf1又はCsm1ポリペプチドは、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択され、
前記真核生物細胞のゲノムは核、色素体、又はミトコンドリアゲノムである、
方法。
【請求項2】
原核生物細胞のゲノム中の標的部位でヌクレオチド配列を改変する方法であって、
前記原核生物細胞に以下の(i)及び(ii)を導入する工程を含み:
(i)DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで前記DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第一のセグメントと(b)Cpf1又はCsm1ポリペプチドと相互作用する第二のセグメントとを含む;
(ii)Cpf1又はCsm1ポリペプチド、あるいはCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド、ここで、前記Cpf1又はCsm1ポリペプチドは、(a)DNA標的化RNAと相互作用をするRNA結合部分と(b)部位特異的酵素活性を示す活性部分とを含む;
ここで、前記Cpf1又はCsm1ポリペプチドは、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択され、
前記原核生物細胞のゲノムは染色体、プラスミド又は他の細胞内のDNA配列であり、
前記原核生物細胞は前記Cpf1又はCsm1ポリペプチドをコードする遺伝子の天然の宿主ではない、
方法。
【請求項3】
前記真核生物細胞が植物細胞である、請求項1に記載の方法。
【請求項4】
Cpf1又はCsm1ポリペプチドが発現され、そして標的部位のヌクレオチド配列を開裂して、改変されたヌクレオチド配列を生成する条件下で植物を栽培する工程、及び
前記改変されたヌクレオチド配列を含む植物を選択する工程
をさらに含む、請求項3に記載の方法。
【請求項5】
前記DNA標的化RNAが、ガイドRNA(gRNA)である、請求項1に記載の方法。
【請求項6】
前記DNA標的化RNAが、ガイドRNA(gRNA)である、請求項2に記載の方法。
【請求項7】
前記改変されたヌクレオチド配列が、細胞ゲノムへの異種DNAの挿入、細胞ゲノムからのヌクレオチド配列の欠失、又は細胞ゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項1に記載の方法。
【請求項8】
前記改変されたヌクレオチド配列が、細胞ゲノムへの異種DNAの挿入、細胞ゲノムからのヌクレオチド配列の欠失、又は細胞ゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項2に記載の方法。
【請求項9】
前記改変されたヌクレオチド配列が、形質転換細胞に抗生物質耐性又は除草剤耐性を与えるタンパク質をコードするポリヌクレオチドの挿入を含む、請求項1に記載の方法。
【請求項10】
抗生物質耐性又は除草剤耐性を与えるタンパク質をコードする前記ポリヌクレオチドが、配列番号76を含むか、又は配列番号77を含むタンパク質をコードする、請求項9に記載の方法。
【請求項11】
Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列を含む核酸分子であって、
前記ポリヌクレオチド配列が、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択されるか、又はそれらの断片若しくは変異体であり、あるいは
前記ポリヌクレオチド配列が、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択されているCpf1又はCsm1ポリペプチドをコードし、そして
前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列は、Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに操作可能に連結されている、
核酸分子。
【請求項12】
(i)配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択される配列、あるいはそれらの断片又は変異体と、
(ii)エフェクタードメインをコードする核酸分子と
を含む核酸分子によってコードされる、融合タンパク質。
【請求項13】
請求項11に記載の核酸分子によってコードされる、Cpf1又はCsm1ポリペプチド。
【請求項14】
前記断片又は変異体が、最大の同一性で整列された場合に、FnCpf1(配列番号3)の917又は1006の位置、あるいはSmCsm1(配列番号160)の701又は922の位置に対応する、一つ以上の位置における一つ以上の突然変異を含む、Cpf1又はCsm1ポリペプチドをコードする、請求項11に記載の核酸。
【請求項15】
請求項11に記載の核酸分子を含む、植物細胞、真核生物細胞又は原核生物細胞。
【請求項16】
請求項12に記載の融合タンパク質を含む、植物細胞、真核生物細胞又は原核生物細胞。
【請求項17】
請求項1に記載の方法によって製造される、真核生物細胞。
【請求項18】
前記真核生物細胞が植物細胞である、請求項17に記載の真核生物細胞。
【請求項19】
請求項11に記載の核酸分子を含む、植物。
【請求項20】
請求項12に記載の融合タンパク質又はポリペプチドを含む、植物。
【請求項21】
請求項3に記載の方法によって製造される、植物。
【請求項22】
請求項19に記載の植物の種。
【請求項23】
請求項21に記載の植物の種。
【請求項24】
Cpf1又はCsm1ポリペプチドをコードする前記ポリヌクレオチド配列が、植物細胞中での発現のためにコドン最適化されている、請求項11に記載の核酸分子。
【請求項25】
Cpf1又はCsm1ポリペプチドをコードする前記ポリヌクレオチド配列が、植物細胞中での発現のためにコドン最適化されている、請求項3に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予め選択された位置におけるゲノム配列編集及び遺伝子発現の調節のための組成物及び方法に関する。
【0002】
EFS-WEB上のテキストファイルとして提出した配列表に関する参照
本配列表の公式コピーが、EFS-Webを通じてテキストファイルとして本明細書とともに同時に提出されている。ファイル名B88552_1060WO_0057_1_Seq_List.txt、ファイルサイズ1.62MBとして、情報交換コード(ASCII)で2017年2月14日に作成。EFS-Webを通じて出願された配列表は本明細書の一部でありここに参照としてその全体が援用される。
【背景技術】
【0003】
ゲノムDNAの改変 (modification)は、基礎及び応用研究のため非常に重要である。ゲノム改変は、疾患の原因を解明し、場合によってはそれを治癒し、その改変を含む細胞及び/又は個体に望ましい形質を提供する可能性を有する。ゲノム改変は、例えば、植物の改変、動物、真菌、及び/又は原核生物のゲノム改変等を含んでいる。ゲノム改変が実施される領域の一つは、植物ゲノムDNAの改変の分野である。
【0004】
植物ゲノムDNAの改変は、基礎及び応用植物研究両方にとって非常に重要である。安定して改変されたゲノムDNAを持つ遺伝子導入植物は、除草剤耐性、昆虫抵抗性、及び/又はそれらに与えられた医薬タンパク質及び工業的酵素を含む貴重なタンパク質の蓄積などの新しい特性を持つことができる。天然植物遺伝子の発現は、(例えば、天然植物遺伝子が発現される組織を変化させることによって)アップレギュレートされてもダウンレギュレートされてもいずれにせよ変化させられてもよく、その発現は、完全に破壊されてもよく、DNA配列は変更されてもよく(例えば、点突然変異、挿入、又は欠失を通して)、あるいは、新たな非天然遺伝子を植物ゲノムに挿入して、植物に新しい形質を与えてもよい。
【0005】
植物ゲノムDNAを改変するもっとも一般的な方法は、ゲノム内のランダムな部位でDNAを改変しがちである。その様な方法には、例えば、アグロバクテリウム媒介植物形質転換及び、粒子ボンバートメントとも呼ばれる、遺伝子銃形質転換が含まれる。しかし、多くの場合、例えば、天然植物遺伝子の破壊を避けること又は頑強な遺伝子発現を提供すると知られている導入遺伝子カセットをゲノム遺伝子座に挿入することなど、興味の対象の植物ゲノム内の所定の標的部位でゲノムDNAを改変することが望まれている。つい最近になって、植物ゲノムDNAの対象とする改変技術が利用できるようになっている。その様な技術は、所望の部位で、二本鎖切断 (double-stranded break)(DSB)を創り出すことに依っている。このDSBは、DSBに対して植物の天然DNA修復機構の漸増を引き起こす。DNA修復機構は、所定の部位に異種DNAを挿入するため、天然の植物ゲノムDNAを欠失するため、又所望の部位に点突然変異、挿入、または欠失を起こすために利用され得る。
【発明の概要】
【0006】
ゲノムDNA配列を改変する組成物及び方法が提供される。ここで用いられる場合、ゲノムDNAは、線状及び/又は染色体DNAを言い、及び/又は興味の対象の細胞内にあるプラスミド又はその他の染色体外DNA配列を言う。この方法は、ゲノムDNA配列の所定の標的部位における二本鎖切断(DSB)を生じさせ、ゲノム中の標的部位にDNA配列の突然変異、挿入及び/又は欠失をもたらす。組成物は、興味の対象の細胞内に操作可能なプロモーターに操作可能に連結されたCpf1又はCsm1タンパク質コードするヌクレオチド配列を含んでいるDNAコンストラクトを含んでいる。DNAコンストラクトは、所定のゲノム遺伝子座でゲノムDNAの改変を指揮するために用いることができる。ゲノムDNA配列を改変するためのこれらのDNAコンストラクトを用いる方法は、本明細書に記載されている。改変された植物、植物細胞、植物部分及び種も包含される。遺伝子発現を調節する組成物及び方法もまた提供される。該方法は、ゲノム中の標的位置によってその発現が規制される遺伝子のアップレギュレーション又はダウンレギュレーションを実施するためにゲノム中の所定の部位にタンパク質を向ける。組成物は、低下した又は消失したヌクレアーゼ活性をもち、任意に転写活性又は抑制ドメインに融合された、改変されたCpf1又はCsm1タンパク質をコードするヌクレオチド配列を含んでいる。遺伝子発現を改変するためにこれらのDNAコンストラクトを使用する方法は、本明細書に記載されている。
【図面の簡単な説明】
【0007】
【
図1】
図1は、イネCAO1遺伝子座にハイグロマイシン耐性遺伝子カセットを挿入する模式図を示す。星印は、野生型DNAにおける意図するCpf1媒介性二本鎖切断の部位を示す。破線は、修復ドナーカセットと野生型DNAの間の相同性を示す。小さな矢印は、意図するゲノム遺伝子座における挿入を確認するために用いられるPCR反応のためのプライマー結合部位を示す。35STerm.、CaMV35Sターミネーター;hphハイグロマイシン耐性遺伝子;ZmUbi、トウモロコシユビキチンプロモーター。
【
図2】
図2は、実験1中に生成されたイネカルスから得られた配列データを示す。
図2Aは、CAO1遺伝子座にhphカセットを挿入した結果を示す。PAM配列は、囲まれており、ガイドRNAにより標的とされた配列は下線が引かれている。省略記号は大きな挿入の存在を示しており、ここでは完全な配列データは示されていない。
図2B、2C、及び2Dは、実験01(表7)で、FnCpf1媒介による欠失事象が起こったイネカルスから得られたデータを示す。
図2B及び2Cにおいて、レーンは、左から右に、分子量ラダーレーンを伴っているカルス部分#1~16を示している。
図2Bは、FnCpf1遺伝子カセットのPCR増幅を示し、カルス片1、2、4、6、7、及び15におけるイネゲノム中へのこのカセットの挿入を示している。
図2Cは、挿入または欠失の可能性を示すカルス#15のダブルバンドパターンとともに、同じカルス片から抽出されたDNAによるT7EIアッセイの結果を示している。実験01の繰りかえしにおいて追加のカルスについて同様のT7EIアッセイの結果がえられ、結果としてカルス片01~20、01~21、01~30、及び01~31の生成につながった。
図2Dは、カルス片01~20、01~21、01~30、及び01~31から得られた配列データと共に、カルス#15(01~15)から得られた配列データのアライメントを示している。PAM配列は囲んであり、ガイドRNAにより標的とされた配列は下線が引かれている。
【
図3】
図3は、実験31、46、80、81、91、及び93からの配列データを示しており、イネCAO1ゲノム遺伝子座におけるCpf1媒介による及びCsm1介在によるインデル(挿入、欠失)が確認できる。
図3Aは、実験31からのカルス片#21(31~21)、実験80からのカルス片#33(80~33)、実験81からのカルス片#9、30、及び46(各々81~09、81~30、及び81~46)、実験93からのカルス片#47(93~47)、実験91からのカルス片#4(91~04)、実験97からのカルス片#112及び141(97~112及び97~141)及び実験119からのカルス片#4及び11(119~04及び119~11)と共に野生型イネCAO1遺伝子座のアライメントを示している。
図3Bは、実験46からのカルス片46~38、46~77、46~86、46~88、及び46~90からの配列データを示す。4A及び4Bの両方において、PAM部位は囲まれており、ガイドRNAにより標的とされた配列は下線が引かれている。
【
図4-1】
図4は、実験70及び75から回復された予期せぬ組換え事象の概要を示す。
図4Aは、実験70から回復された組換え事象につながった35Sターミネーター及び下流アームの相同領域を含んでいる131633プラスミドの部分の概略図を示している。意図しないHDR事象を媒介したように見える相同の領域には下線が引かれている。
図4Bは、カルス片70~15からの配列データを示す。WT、野生型配列;GE70、カルス片70~15配列;131633_上流、プラスミド131633からの上流アーム及び35STerm配列;131633_下流、プラスミド131633からの下流アーム配列。
図4Cは、実験75から回復された組換え事象につながる35Sターミネーター及び下流アームの相同領域を含む131633プラスミドの部分の概略図を示す。意図しないHDR事象を媒介したように見える相同の領域には下線が引かれている。
図4Dは、カルス片75~46からの配列データを示す。WT、野生型配列;GE75、カルス片75~46配列;131633_上流、プラスミド131633からの上流アーム及び35STerm配列;131633_下流、プラスミド131633からの下流アーム配列。35STarm、CaMV35Sターミネーター及;hph、ハイグロマイシンホスホォトランスフェラーゼコード領域;pZmUbi、トウモロコシユビキチンプロモーター。
図4B及び4Dにおいて、PAM部位が囲まれている。
【
図4-2】
図4は、実験70及び75から回復された予期せぬ組換え事象の概要を示す。
図4Aは、実験70から回復された組換え事象につながった35Sターミネーター及び下流アームの相同領域を含んでいる131633プラスミドの部分の概略図を示している。意図しないHDR事象を媒介したように見える相同の領域には下線が引かれている。
図4Bは、カルス片70~15からの配列データを示す。WT、野生型配列;GE70、カルス片70~15配列;131633_上流、プラスミド131633からの上流アーム及び35STerm配列;131633_下流、プラスミド131633からの下流アーム配列。
図4Cは、実験75から回復された組換え事象につながる35Sターミネーター及び下流アームの相同領域を含む131633プラスミドの部分の概略図を示す。意図しないHDR事象を媒介したように見える相同の領域には下線が引かれている。
図4Dは、カルス片75~46からの配列データを示す。WT、野生型配列;GE75、カルス片75~46配列;131633_上流、プラスミド131633からの上流アーム及び35STerm配列;131633_下流、プラスミド131633からの下流アーム配列。35STarm、CaMV35Sターミネーター及;hph、ハイグロマイシンホスホォトランスフェラーゼコード領域;pZmUbi、トウモロコシユビキチンプロモーター。
図4B及び4Dにおいて、PAM部位が囲まれている。
【
図5】
図5は、実験46(表7)からのカルス片#46~161の上流領域の配列を示している。PAM部位が囲まれており、形質転換されたイネカルスにおけるこの部位の予期された突然変異を示しており、又配列データは、イネCAO1遺伝子座においてベクター131633の挿入の成功を示している。
【発明を実施するための形態】
【0008】
発明の詳細な説明
CRISPR-Cpf又はCRISPR-Csm系及びそれらの成分に関連する、ゲノム摂動又は遺伝子編集などの、配列ターゲティングを含む遺伝子発現の制御の方法及び組成物が本明細書で提供される。ある実施形態において、CRISPR酵素は、例えばCpf1オルソログなどの、Cpf酵素である。ある実施形態において、該CRISPR酵素は、例えばCsm1オルソログなどの、Csm酵素である。該方法及び組成物は、標的DNA配列に結合するため核酸を含んでいる。例えばペプチドと較べると、核酸は製造がはるかに容易で安価であり、相同性が求められるストレッチの長さに応じて特異性が変えられるので、上記のことは有利な点である。例えば、複数のフィンガーの複雑な3-D配置は必要ではない。
【0009】
更に提供されているのは、Cpf1又はCsm1ポリペプチドをコードする核酸であり、並びに植物細胞を含む宿主細胞の染色体(すなわち、ゲノム)又はオルガネラDNA配列を改変するためのCpf1又はCsm1ポリペプチドの使用方法である。Cpf1ポリペプチドは、特定のガイドRNA(gRNA)と相互作用を起こすが、このガイドRNAはCpf1又はCsm1エンドヌクレアーゼを特定の標的部位へと向かわせ、この部位でDNA配列が改変されるようにCpf1又はCsm1エンドヌクレアーゼはDNA修復工程によって修復できる二本鎖切断を導入するものである。該ガイドRNAによって特性が提供されるので、Cpf1又はCsm1ポリペプチドは普遍的であり、異なるゲノム配列を標的とするために異なるガイドRNAとともに用いることができる。Cpf1及びCsm1エンドヌクレアーゼは、CRISPRアレイと共に伝統的に用いられてきたCasヌクレアーゼ(例えば、Cas9)よりも確かな優位点を有する。例えば、Cpf1が結び付けられたCRISPRアレイは、追加のトランス活性化crRNA(tracrRNA)を必要とせずに成熟crRNAへと加工される。また、Cpf1-crRNA複合体は、多くのCas9系の標的DNAの後に続くG-リッチPAMとは対照的に、しばしばT-リッチである短いプロトスペーサー隣接モチーフ(PAM)に先行される標的DNAを開裂 (cleave)することができる。更にCpf1は、4又は5ヌクレオチド(nt)の5’オーバーハングを有するスタガード(staggered)DNA二本鎖切断を導入することができる。理論に拘束されないが、Csm1タンパク質は、追加のトランス活性化crRNA(tracrRNA)を必要とせずに同じようにそのCRISPRアレイを成熟crRNAへと加工し、ブラントカット(blunt cuts)よりむしろスタガードカット(staggered cuts)を作り出す。本明細書に開示されている方法は、特定の染色体配列を標的にし改変するために及び/又は植物細胞又は植物胚の標的位置に外因性配列を導入するために採用することができる。この方法は、更にオルガネラ(例えば、葉緑体及び/又はミドコンドリア)内に配列を導入するか又は領域を改変するために採用することができる。更に、ターゲティングは、制限されたオフターゲット効果と共に特異的である。
【0010】
I. Cpf1及びCsm1エンドヌクレアーゼ
植物ゲノムを含むゲノム改変に用いるため、Cpf1及びCsm1エンドヌクレアーゼ及びそれらの断片及び変異体が、本明細書に、提供される。本明細書で用いられている場合、Cpf1エンドヌクレアーゼ又はCpf1ポリペプチドという用語は、Zetscheら、(2015)Cell 163:759-771に開示されているCpf1ポリペプチドの、又米国特許出願2016/0208243号明細書に開示されているCpf1ポリペプチドの、相同体及びオルソログ、及びそれらの断片及び変異体を言う。Cpf1ポリペプチドの例は、配列番号:3、6、9、12、15、18、20、23、106~133、135~146、148~158、161~173、及び231~236に記載されている。本明細書で用いられている場合、Csm1エンドヌクレアーゼ又はCsm1ポリペプチドという用語は、配列番号134、147、159、160、及び230の相同体及びオルソログを言う。典型的には、Cpf1及びCsm1エンドヌクレアーゼは、tracrRNAを用いることなく作用でき、スタガードDNA二本鎖切断を導入することができる。一般的に、Cpf1及びCsm1ポリペプチドは、少なくとも一つのRNA認識及び/又はRNA結合ドメインを含んでいる。RNA認識及び/又はRNA結合ドメインはガイドRNAと相互作用する。Cpf1及びCsm1ポリペプチドは、またヌクレアーゼドメイン(例えば、DNase又はRNaseドメイン)、DNA結合ドメイン、ヘリカーゼドメイン、RNAseドメイン、タンパク質-タンパク質相互作用ドメイン、二量体化ドメイン、並びにその他のドメインも含むことができる。特定の実施形態において、Cpf1又はCsm1ポリペプチド、又はCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドは、DNA標的化RNAと相互作用するRNA結合部分及びRuvCエンドヌクレアーゼドメインなどの、部位特異的酵素活性を示す活性部分を含んでいる。
【0011】
Cpf1又はCsm1ポリペプチドは野生型Cpf1又はCsm1ポリペプチド、改変されたCpf1又はCsm1ポリペプチド、又は野生型または改変されたCpf1又はCsm1ポリペプチドの断片であってもよい。Cpf1又はCsm1ポリペプチドは核酸結合親和性及び/又は特異性を増加させ、酵素活性を変化させ、及び/又はタンパク質のその他の性質を変化させるために改変されてもよい。例えば、Cpf1又はCsm1ポリペプチドのヌクレアーゼ(すなわちDNase、RNase)ドメインは、改変されるか、欠失されるか、又は不活性化されてもよい。あるいは、Cpf1又はCsm1ポリペプチドはタンパク質の機能に必須ではないドメインを取り除くため切断してもよい。特定の実施形態において、Cpf1又はCsm1ポリペプチドは、ホモ二量体又はヘテロ二量体を形成する。
【0012】
幾つかの実施形態において、Cpf1又はCsm1ポリペプチドは、野生型Cpf1又はCsm1ポリペプチド又はその断片から誘導させることができる。他の実施形態において、Cpf1又はCsm1ポリペプチドは、改変されたCpf1又はCsm1ポリペプチドから誘導させることができる。例えば、Cpf1又はCsm1ポリペプチドのアミノ酸配列は、タンパク質の一つ以上の性質(例えば、ヌクレアーゼ活性、親和性、安定性、等)を変化させるため改変することができる。あるいは、RNA誘導開裂 (RNA-guided cleavage)に関与しないCpf1又はCsm1ポリペプチドのドメインは、野生型Cpf1又はCsm1ポリペプチドより、改変されたCpf1又はCsm1ポリペプチドがより小さくなるようにタンパク質から除去することができる。
【0013】
一般的に、Cpf1又はCsm1ポリペプチドは少なくとも一つのヌクレアーゼドメインを含んでいるが、Cas9タンパク質にみられるようなHNHドメインを含む必要はない。例えば、Cpf1又はCsm1ポリペプチドは、RuvC様ヌクレアーゼドメインを含むことができる。幾つかの実施形態において、Cpf1又はCsm1ポリペプチドを改変させ、ヌクレアーゼドメインをもはや機能的ではないように、ヌクレアーゼドメインを不活性化することができる。ヌクレアーゼドメインが不活性である幾つかの実施形態において、Cpf1又はCsm1ポリペプチドは二本鎖DNAを切断しない。特定の実施形態において、突然変異を起こされたCpf1又はCsm1ポリペプチドは、ヌクレアーゼ活性を減じるか又は欠失する最大の同一性で配列された場合に、FnCpf1(配列番号3)の位置917又は1006と対応する位置又はSmCsm1(配列番号160)の位置701又は922と対応する位置に突然変異を含む。例えば、アスパラギン酸塩からアラニン(D1255A)への変換が開裂活性を有意に減ずる一方、RuvC様ドメインにおけるアスパラギン酸塩からアラニン(D917A)及びグルタミン酸塩からアラニン(E1006A)への変換は、FnCpf1(配列番号3)のDNA開裂活性を完全に不活性化した(Zetscheら、(2015)Cell 163:759-711)。ヌクレアーゼドメインは、部位特異的突然変異誘発、PCR媒介突然変異誘発、及び前遺伝子合成など周知の方法、同様に当該分野で知られている他の方法を用いて改変することができる。不活性化されたヌクレアーゼドメイン(dCpf又はdCsm1タンパク質)を有するCpf1又はCsm1タンパク質は、DNA配列を改変することなく遺伝子発現を調節するために用いることができる。ある実施形態において、dCpf1又はdCsm1タンパク質は、適したgRNAを通して、興味の対象の遺伝子のためのプロモーター等ゲノムの特定の領域に向けられてよい。該dCpf1又はdCsm1タンパク質は、DNAの所望の領域に結合することができ、DNAのこの領域へのRNAポリメラーゼ結合及び/又はDNAのこの領域への転写因子の結合を妨害することができる。この技術は、興味の対象の細胞内に一つ以上の遺伝子の発現をアップ又はダウンレギュレートするために用いてもよい。あるその他の実施形態において、dCpf1又はdCsm1タンパク質は、RNAポリメラーゼ、転写因子、又は他の転写調節因子とgRNAによって標的化された染色体DNAの領域との相互作用によってその発現が調節される遺伝子の発現を更にダウンレギュレートするためリプレッサーと融合されてもよい。あるその他の実施形態において、dCpf1又はdCsm1タンパク質は、RNAポリメラーゼ、転写因子、又は他の転写調節因子とgRNAによって標的化された染色体DNAの領域との相互作用によってその発現が調節される遺伝子のアップレギュレーションを実行するために活性化ドメインと融合されてもよい。
【0014】
本明細書に開示されているCpf1又はCsm1ポリペプチドは、少なくとも一つの核局在化シグナル(NLS)を更に含んでいる。一般的に、NLSは、一続きの塩基性アミノ酸を含んでいる。局在化シグナルは当該分野でこうちである(例えば、Langeら、J. Biol. Chem.(2007)282:5101-5105参照)。NLSは、N末端、C末端、又はCpf1又はCsm1ポリペプチドの内部位置に位置することができる。幾つかの実施形態において、Cpf1又はCsm1ポリペプチドは、少なくとも一つの細胞浸透ドメインを更に含むことができる。細胞浸透ドメインは、N末端、C末端、又は単発の内部位置に位置することができる。
【0015】
本明細書に開示されているCpf1又はCsm1ポリペプチドは、シグナルペプチドを標的にする少なくとも一つの色素体 (plastid)、シグナルペプチドを標的にする少なくとも一つのミトコンドリア、又はCpf1又はCsm1ポリペプチドを色素体及びミトコンドリアの両方に向けさせるシングルペプチドを更に含むことができる。色素体、ミトコンドリア、及び二重標的化シングルペプチド局在化シグナルは、当該分野で公知である(例えば、NassouryとMorse(2005)Biochim Biophys Acta1743:5-19;KunzeとBerger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;HerrmannとNeupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol 5:529-535;CarrieとSmall(2013)Biochim Biophys Acta 1833:253-259;Carrieら(2009)FEBS J 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;PeetersとSmall(2001)Biochim Biophys Acta 1541:54-63;Murchaら(2014)J Exp Bot 65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glasterら(1998)Plant Biol 38:311-338参照)。色素体、ミトコンドリア、又は二重標的シングルペプチドは、N末端、C末端、又はCpf1又はCsm1ポリペプチドの内部位置に位置することができる。
【0016】
更に他の実施形態において、Cpf1又はCsm1ポリペプチドは少なくとも一つのマーカードメインを含むこともできる。マーカードメインの非限定的例としては、蛍光タンパク、精製タグ、及びエピトープタグが含まれる。ある実施形態において、マーカードメインは、蛍光タンパク質であってもよい。適した蛍光タンパク質の非限定的例としては、緑色蛍光タンパク質(例えば、GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えば、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、シアン蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(mKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、及びオレンジ色蛍光タンパク質(mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)又はその他の全ての適した蛍光タンパク質が含まれる。他の実施形態において、マーカードメインは、精製タグ及び/又はエピトープタグであり得る。限定はされないが、タグの例としては、グルタチオン-S-トランスフェラーゼ(GST)、キチン結合タンパク質(CBP)、マルトース結合タンパク質、チオレドキシン(TRX)、ポリ(NANP)、タンデムアフィニティ(TAP)タグ、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、ビオチンカルボキシルキャリアタンパク質(BCCP)、及びカルモジュリンが含まれる。
【0017】
ある実施形態において、Cpf1又はCsm1ポリペプチドは、ガイドRNAを含んでいるタンパク質-RNA複合体の一部であってもよい。ガイドRNAは、Cpf1又はCsm1ポリペプチドと相互作用し、Cpf1又はCsm1ポリペプチドを特定の標的部位へと向かわせるものであるが、ここで該ガイドRNAの5’末端は植物ゲノム、これが核、色素体、及び/又はミトコンドリアゲノムの一部であってもよいが、における興味の対象のヌクレオチド配列の特定のプロトスペーサー配列と塩基対を形成することができる。ここで用いられている場合、用語「DNA標的化RNA」は、Cpf1又はCsm1ポリペプチド及び植物細胞のゲノムにおける興味の対象のヌクレオチド配列の標的部位と相互作用するガイドRNAを言う。DNA標的化RNA、またはDNA標的化RNAをコードするDNAポリヌクレオチドは、標的DNAにおける配列に相補的であるヌクレオチド配列を含む第一のセグメント及びCpf1又はCsm1ポリペプチドと相互作用を及ぼす第二のセグメントを含むことができる。
【0018】
本明細書に開示されているCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドは、他の原核生物又は真核生物から対応する配列を単離するために用いることができる。このように、PCR、異種交配等の方法は、配列同一性に基づいてその様な配列、又は本明細書に記載の配列に対する同一性を同定するために用いることができる。本明細書に記載のCpf1又はCsm1配列全体又はそれらの変異体および断片に対するそれらの配列同一性に基づいて単離された配列は、本発明に含まれる。その様な配列は、開示されたCpf1又はCsm1配列のオルソログである配列を含んでいる。「オルソログ」は共通の先祖遺伝子に由来し、種分化の結果として異なる種に見出される遺伝子を意味するように意図している。異なる種に見出される遺伝子は、それらのヌクレオチド配列及び/又はそれらのコード化されたタンパク質配列が少なくとも約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、又はそれ以上の配列同一性を共有する場合、オルソログと見なされる。オルソログの機能は種間で大変良く保存されていることが多い。従って、Cpf1又はCsm1エンドヌクレアーゼ活性をもつポリペプチドをコードし、本明細書に開示されている配列に対し少なくとも約75%以上の配列同一性を共有する単離されたポリヌクレオチドは、本発明に含められる。本明細書に用いられている場合、Cpf1又はCsm1エンドヌクレアーゼ活性はCRISPRエンドヌクレアーゼ活性を言い、ここで、Cpf1又はCsm1ポリペプチドと組み合わされたガイドRNA(gRNA)は、Cpf1-gRNA又はCsm1-gRNA複合体を該RNAに相補的である所定のヌクレオチド配列に結合させ、またここで、Cpf1又はCsm1活性は該ガイドRNAによって標的とされた部位であるいはその近くで二本鎖切断を導入することができる。ある実施形態において、この二本鎖切断は、スタガードDNA二本鎖切断であってもよい。本明細書に記載されている場合、「スタガード二本鎖切断 (staggered DNA double-stranded break)」は、開裂の後の、3’末端又は5’末端上に約1、約2、約3、約4、約5、約6、約7、約8、約9、又は約10ヌクレオチドオーバーハングを持つ二本鎖切断に帰結する。特定の実施形態において、Cpf1又はCsm1ポリペプチドは、4又は5-nt5’オーバーハングを有するスタガードDNA二本鎖切断を導入する。二本鎖切断は、DNA標的化RNA(例えば、ガイドRNA)配列が標的とされるその配列で又はそのそばで起こり得る。
【0019】
Cpf1又はCsm1ポリペプチドの断片及び変異体、及びそれによってコード化されるCpf1又はCsm1アミノ酸配列は、本明細書に含まれる。「断片 (fragment)」は、ポリペプチドの一部分又はアミノ酸配列の一部分を意図している。「変異体(variants)」は、実質的に同様の配列を意味することを意図している。ポリヌクレオチドの場合、変異体は、5’及び/又は3’に欠失(すなわちトランケーション)、天然ポリヌクレオチドにおける一つ以上の内部部位に一つ以上のヌクレオチドの欠失及び/又は追加ポリヌクレオチド、及び/又は天然ポリヌクレオチドにおける一つ以上の部位において一つ以上の置換を持つポリヌクレオチドを含んでいる。本明細書に用いられている場合、「天然(native)」ポリヌクレオチド又はポリペプチドは、それぞれ天然に存在するヌクレオチド配列又はアミノ酸配列を含む。一般的に、本発明の特定のポリヌクレオチドの変異体は、本明細書に記載されている配列アライメントプログラム及びパラメータによって決定される場合、その特定のポリヌクレオチドに少なくとも約75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又はそれ以上の配列同一性を持つであろう。
【0020】
「変異体」アミノ酸又はタンパク質は、天然アミノ酸のN末端及び/又はC末端で一つ以上のアミノ酸の欠失(いわゆるトランケート)により、天然タンパク質の一つ以上の内部部位で一つ以上のアミノ酸を欠失及び/又は添加により、又は天然タンパク質の一つ以上の部位で一つ以上のアミノ酸の置換により天然アミノ酸又はタンパク質に由来するアミノ酸又はタンパク質を意味することを意図している。本発明により含まれる変異体タンパク質は、生物学的に活性であり、すなわち、天然タンパク質の望まれる生物活性を保持し続ける。天然ポリペプチドの生物学的に活性な変異体は、本明細書に記載されている配列アライメントプログラム及びパラメータによって決定される場合、その天然配列のアミノ酸配列に少なくとも約80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又はそれ以上の配列同一性を持つであろう。本発明のタンパク質の生物学的に活性な変異体は、わずか1-15のアミノ酸残基、わずか1-10、例えば6-10、わずか5、わずか4、3、2、又はたった1個のアミノ酸残基がそのタンパク質と異なりえる。
【0021】
変異体配列は、配列決定されたゲノムの既存のデータベースの分析によっても特定することができる。このように、対応する配列は、同定することができ本発明の方法において用いることができる。
【0022】
比較のための配列のアライメントの方法は、当該分野でよく知られている。このように、二つの配列間の配列同一性の百分率は、数学的アルゴリズムを用いて決定することができる。その様な数学的アルゴリズムの例としては、限定はしないが、MyersとMillerのアルゴリズム(1988)CABIOS4:11-17;Smithらの局所アライメントアルゴリズム(1981)Adv. Appl. Math.2:482;NeedlemanとWunschのグローバルアライメントアルゴリズム(1970)J. Mol. Biol. 48:443-453;PearsonとLipmanの局所アライメント法の研究(1988)Proc. Natl. Acad. Sci. 85:2444-2448;KarlinとAltschulのアルゴリズム(1990)Proc. Natl. Acad. Sci. USA87:2264-2268、KarlinとAltschulにより改変(1993)Proc. Natl. Acad. Sci. 90:5873-5877が含まれる。
【0023】
配列同一性を決定するために、配列の比較に、これらの数学的アルゴリズムのコンピュータ実施を採用することができる。その様な実施には、限定はされないが、PC/GeneプログラムにおけるCLUSTAL(Intelligeneticsより入手可能、Mountain View,California);ALIGNプログラム(Version2.0)及びGCG Wisconsin Genetics Software Package Version 10におけるGAP、BESTFIT、BLAST、FASTA、及びTFASTA(Accelrys Inc.より入手可能、9685 Scranton Road,San Diego,California,USA)が含まれる。これらのプログラムを用いたアライメントは、デフォルトのパラメータを用いて実行される。CLUSTALプログラムは、Higginsら(1988)Gene73:237-244;Higginsら(1989)CABIOS 5:151-153;Corpetら(1988)Nucleic Acids Res. 16:10881-90;Huangら(1992)CABIOS 8:155-65;及びPearsonら(1994)Meth. Mol. Biol. 24:307-331に詳しく述べられている。ALIGNプログラムは、上記のMayersとMiller(1988)のアルゴリズムに基づいている。アミノ酸配列を較べるとき、PAM120加重残基表、ギャップ長さペナルティ12、及びギャップ伸長ペナルティ4をALIGNプログラムと共に採用することができる。AltschulらのBLASTプログラム(1990)J. Mol. Biol. 215:403は、上記KarlinとAltschul(1990)のアルゴリズムに基づいている。BLASTヌクレオチドの検索は、本発明のタンパク質をコードするヌクレオチド配列と相同するヌクレオチド配列を得るため、BLASTNプログラム、スコア=100、ワード長=12で、行うことができる。BLASTプログラムの検索は、本発明のタンパク質又はポリペプチドと相同するアミノ酸配列を得るため、BLASTXプログラム、スコア=50、ワード長=3で、行うことができる。比較目的のため、ギャップのあるアライメントを得るため、Altschulら(1997)Nucleic Acids Res.25:3389に記述されている通り、Gapped BLAST(BLAST2.0)を採用することができる。あるいは、分子間の遠い関係を検出する反復検索を実行するため、PSI-BLAST(BLAST2.0)を用いることができる。上記、Altschulら(1997)参照。BLAST、Gapped BLAST、PSI-BLASTを採用する場合、各プログラムのデフォルトパラメータ(例えば、BLASTNにはヌクレオチド配列、BLASTXにはタンパク質)を用いることができる。ウェブサイトwww.ncbi.nlm.nih.gov.参照。アライメントは、検査によって手動で行うこともできる。
【0024】
Cpf1及びCsm1ポリペプチドをコードする核酸分子、又はそれらの断片又は変異体は、興味の対象の植物又は興味の対象の他の細胞又は生物における発現のためコドン最適化することができる。「コドン最適化遺伝子」は、宿主細胞の好ましいコドン使用頻度を模倣するように設計されたコドン使用頻度を有する遺伝子である。核酸分子は、全体的または部分的にコドン最適化することができる。アミノ酸のいずれも(メチオニンとトリプトファンを除く)多くのコドンによってコードされているので、核酸分子の配列は、コード化されてアミノ酸を変えることなく変えることができる。コドン最適化は、アミノ酸は変化されないが特定の宿主生物における発現は増加するような核酸レベルで一つ以上のコドンが変更される場合である。広い範囲の生物に対する好ましい情報が当該分野で利用可能であるとするなら、当該分野で通常の技術も持つものであれば、コドン表及びその他の参考文献を認識するであろう(例えばZhangら(1991)Gene 105:61-72;Murrayら(1989)Nucl. Acids Res.17:477-508参照)。植物における発現のためヌクレオチド配列を最適化する方法論は、例えば、米国特許第6015891号明細書及びそこに引用されている参考文献に記載されている。植物における発現のためのコドン最適化ポリヌクレオチドの例は、配列番号5、8、11、14、17、19、22、25、及び174~206に記載されている。
【0025】
II. 融合タンパク質
Cpf1又はCsm1ポリペプチド、又はそれらの断片又は変異体と、エフェクタードメインとを含んでいる融合タンパク質が本明細書に提示されている。該Cpf1又はCsm1ポリペプチドは、エフェクタードメインが核酸配列を改変又実行できる部位である、標的部位にガイドRNAによって向けられる。該エフェクタードメインは、開裂ドメイン、エピジェネティック改変ドメイン、転写活性化ドメイン、又は転写リプレッサードメインであり得る。該融合タンパク質は、核局在化シグナル、プラスチドシグナルペプチド、ミトコンドリアシグナルペプチド、複数の細胞内位置へタンパク質輸送が可能なシグナルペプチド、細胞浸透ドメイン、又はマーカードメイン、これらのいずれもN末端、C末端、又は融合タンパク質の内部位置に位置することができるものであるが、から選択される少なくとも一つの追加のドメイン更に含むことができる。該Cpf1又はCsm1ポリペプチドは、N末端、C末端、又は融合タンパク質の内部位置に位置することができる。該Cpf1又はCsm1ポリペプチドは、エフェクタードメインに直接融合され得るか、又はリンカーと融合され得る。特定の実施形態において、該Cpf1又はCsm1ポリペプチドをエフェクタードメインと融合させるリンカー配列は、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、又は50個のアミノ酸の長さである。例えば、該リンカーは、1~5、1~10、1~20、1~50、2~3、3~10、3~20、5~20、又は10~50個のアミノ酸の長さである。
【0026】
幾つかの実施形態において、融合タンパク質のCpf1又はCsm1ポリペプチドは、野生型Cpf1又はCsm1タンパク質に由来し得る。該Cpf1由来又はCsm1由来タンパク質は、改変された変異体又は断片であってよい。幾つか実施形態において、Cpf1又はCsm1ポリペプチドは、低下した又消失したヌクレアーゼ活性をもつヌクレアーゼドメインを(例えば、RuvC様ドメイン)を含むため改変され得る。例えば、Cpf1由来又はCsm1由来のポリペプチドは、ヌクレアーゼドメインが欠失されあるいは改変されそれによってもはや機能的でないよう(すなわち、ヌクレアーゼ活性が無いよう)に改変できる。特に、最大同一性のために整列された場合、Cpf1又はCsm1ポリペプチドは、FnCpf1(配列番号3)の917又は1006の位置に又はSmCsm1(配列番号160)の701又は922の位置に対応する位置における突然変異を含んでいる。例えば、アスパラギン酸塩からアラニン(D1255A)への変換が切断活性を有意に減ずる一方、RuvC様ドメインにおけるアスパラギン酸塩からアラニン(D917A)及びグルタミン酸塩からアラニン(E1006A)への変換は、FnCpf1のDNA開裂活性を完全に不活性化した(Zetscheら、(2015)Cell 163:759-711)。RuvCドメインに突然変異を有するCpf1ポリペプチドの例は、配列番号26~41及び63~70に記載されている。ヌクレアーゼドメインは、部位特異的突然変異誘発、PCR媒介突然変異誘発、及び全遺伝子合成などの一つ以上の欠失突然変異、挿入突然変異、及び/又は置換突然変異により同様に当該分野で知られている他の方法を用いて改変することができる。例示の実施形態において、融合タンパク質のCpf1又はCsm1ポリペプチドは、該Cpf1又はCsm1ポリペプチドがヌクレアーゼ活性をもたないように、RuvC様ドメインを突然変異させることにより改変される。
【0027】
融合タンパク質は、N末端、C末端、又は該融合タンパク質の内部位置に位置するエフェクタードメインを含む。幾つかの実施形態において、エフェクタードメインは開裂ドメインである。本明細書に用いられる「開裂ドメイン (cleavage domain)」は、DNAを開裂するドメインを言う。該開裂ドメインは、任意のエンドヌクレアーゼまたはエキソヌクレアーゼから得ることができる。それから開裂ドメインが由来することができるエンドヌクレアーゼの非制限的例としては、制限エンドヌクレアーゼ及びホーミングヌクレアーゼが含まれるが、これらに限定されない。例えば、New England Biolabs Catalog又はBelfortら(1997)Nucleic Acids Res.25:3379-3388参照。DNAを開裂する更なる酵素が知られている(例えば、S1ヌクレアーゼ;緑豆ヌクレアーゼ;膵臓DNaseI;ミクロコッカスヌクレアーゼ;イーストHOエンドヌクレアーゼ)。また、Linnら(編集)Nucleases、Cold Spring Harbor Laboratory Press、1993参照。開裂ドメインの供給源としては、これらの酵素(又は、それらの機能性断片)の一つ以上を用いることができる。
【0028】
幾つかの実施形態において、開裂ドメインは、II-S型エンドヌクレアーゼから由来し得る。II-S型エンドヌクレアーゼは、認識部位から典型的には幾つかの塩基対離れた部位でDNAを切断し、それ自体分離可能な認識ドメイン及び開裂ドメインを有する。これらの酵素は、一般的には、一時的に会合して二量体を形成し、スタガード位置でDNAの各鎖を開裂するモノマーである。限定しない、適切なII-Sエンドヌクレアーゼの例としては、Bfil、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MbolIおよびSapIが含まれる。
【0029】
ある実施形態において、II-S型開裂は、二つの異なる開裂ドメイン(そのおのおのは、Cpf1又はCsm1ポリペプチド又はその断片に結合している)の二量体化を促進するために改変されている。エフェクタードメインが開裂ドメインである実施形態において、本明細書で論じられているようにエンドヌクレアーゼ活性が除かれるように該Cpf1又はCsm1ポリペプチドは改変され得る。例えば、Cpf1又はCsm1ポリペプチドは、ポリペプチドがもはやエンドヌクレアーゼ活性を示さないように、RuvC様ドメインを突然変異させることによって改変され得る。
【0030】
他の実施形態において、融合タンパク質のエフェクタードメインは、エピジェネティック改変ドメインであってよい。一般的に、エピジェネティック改変ドメインは、DNA配列を変更せずに、ヒストン構造及び/又は染色体構造を変化させる。ヒストン及び/又はクロマチン構造の変化は遺伝子発現における変化につながり得る。エピジェネティック改変の例は、制限はないが、ヒストンタンパク質におけるリジン残基のアセチル化又はメチル化、及びDNAにおけるシトシン残基のメチル化が含まれる。適したエピジェネティック改変ドメインの例としては、制限はしないが、ヒストンアセチルトランスフェラーゼドメイン、ヒストンデアセチラーゼドメイン、ヒストンメチルトランスフェラードメイン、ヒストンデメチラーゼドメイン、DNAメチルトランスフェラードメイン、及びDNAデメチラーゼドメインが含まれる。
【0031】
該エフェクタードメインがヒストンアセチルトランスフェラーゼ(HAT)ドメインである実施形態において、該HATドメインは、EP300(すなわち、E1A結合タンパク質p300)、CREBBP(すなわち、CREB結合タンパク質)、CDY1、CDY2、CDYL1、CLOCK、ELP3、ESA1、GCN5(KAT2A)、HAT1、KAT2B、KAT5、MYST1、MYST2、MYST3、MYST4、NCOA1、NCOA2、NCOA3、NCOAT、P/CAF、Tip60、TAFII250、又はTF3C4から由来し得る。該エフェクタードメインがエピジェネティック改変ドメインである実施形態において、Cpf1又はCsm1ポリペプチドは、そのエンドヌクレアーゼ活性が欠失されるように、本明細書で論じられているように改変され得る。例えば、Cpf1又はCsm1ポリペプチドは、該ポリペプチドがもはやエンドヌクレアーゼ活性を示さないように、RuvC様ドメインを突然変異させることによって改変され得る。
【0032】
幾つかの実施形態において、融合タンパク質のエフェクタードメインは、転写活性化ドメインであってもよい。一般的に、転写活性化ドメインは、一つ以上の遺伝子の転写を増加させるため及び/又は活性化させるため転写制御エレメント及び/又は転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼ、等)と相互作用する。幾つかの実施形態において、転写活性化ドメインは、制限はしないが、単純ヘルペスウィルスVP16活性化ドメイン、VP64(これは、VP16の四量体誘導体である)NFκBp65活性化ドメイン、p53活性化ドメイン1と2、CREB(cAMP応答エレメント結合タンパク質)活性化ドメイン、E2A活性化ドメイン、及びNFAT(活性化T細胞の核因子)活性化ドメインを含んでいる。他の実施形態において、該転写活性化ドメインは、Gal4、Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、及びLeu3であってもよい。該転写活性化ドメインは、野生型でもよく、又は元の転写活性化ドメインの改変版であってもよい。幾つかの実施形態において、融合タンパク質のエフェクタードメインはVP16又はVP64転写活性化ドメインである。エフェクタードメインが転写活性化ドメインである実施形態において、Cpf1又はCsm1ポリペプチドは、本明細書に論じられているように、そのエンドヌクレアーゼ活性が欠失されるように改変することができる。例えば、該Cpf1又はCsm1ポリペプチドは、該ポリペプチドがもはやエンドヌクレアーゼ活性をもたないように、RuvC様ドメインを突然変異させることによって改変され得る。
【0033】
更に他の実施形態において、融合タンパク質のエフェクタードメインは、転写リプレッサードメインであり得る。一般的に、転写リプレッサードメインは、一つ以上の遺伝子の転写を減少させるため及び/又は終結させるため転写制御エレメント及び/又は転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼ、等)と相互作用する。適した転写リプレッサードメインの例としては、限定はされないが、誘因性cAMP初期リプレッサー(ICER)ドメイン、Kruppel関連ボックスA(KRAB-A)リプレッサードメイ、YY1グリシンリッチリプレッサードメイン、Sp1様リプレッサー、E(sp1)リプレッサー、I.κ.Bリプレッサー、及びMeCP2が含まれる。エフェクタードメインが転写リプレッサードメインである実施形態において、該Cpf1又はCsm1ポリペプチドは、そのエンドヌクレアーゼ活性が欠失されるように、本明細書で論じられているように改変され得る。例えば、Cpf1又はCsm1ポリペプチドは、該ポリペプチドがもはやヌクレアーゼ活性をもたないように、RuvC様ドメインを突然変異させることによって改変され得る。
【0034】
幾つかの実施形態において、該融合タンパク質は、少なくとも一つの更なるドメインを含んでいる。適当な更なるドメインの例としては、限定はされないが、核局在化シグナル、細胞浸透ドメイン又は転座ドメイン、及びマーカードメインが含まれる。
【0035】
融合タンパク質のエフェクタードメインが開裂ドメインの場合、少なくとも一つの融合タンパク質を含む二量体が形成され得る。該二量体は、ホモ二量体又はヘテロ二量体であってよい。幾つかの実施形態において、ヘテロ二量体は、異なる二つの融合タンパク質を含んでいる。他の実施形態において、ヘテロ二量体は、一つの融合タンパク質と追加のタンパク質を含んでいる。
【0036】
該二量体は、二つの融合タンパク質モノマーが互いに一次アミノ酸配列に関して同一であるホモ二量体であってもよい。二量体がホモ二量体であるひとつの実施形態において、Cpf1又はCsm1ポリペプチドは、エンドヌクレアーゼ活性が欠失されるように改変することができる。エンドヌクレアーゼ活性が欠失されるようにCpf1又はCsm1ポリペプチドが改変されている、ある実施形態において、各融合タンパク質モノマーは、同一のCpf1又はCsm1ポリペプチド及び同一の開裂ドメインを含むことができる。該開裂ドメインは、本明細書に提示されている全ての例示開裂ドメインなど、どのような開裂ドメインであってもよい。その様な実施形態において、特定のガイドRNAは、二量体形成時に、二つのモノマーのヌクレアーゼドメインが標的DNAにおいて二本鎖切断を生じられるように融合タンパク質モノマーを異なってはいるが、近接した部位に向けるであろう。
【0037】
二量体はまた、異なる二つの融合タンパク質のヘテロ二量体であってもよい。例えば、各融合タンパク質のCpf1又はCsm1ポリペプチドは、異なるCpf1又はCsm1ポリペプチドから由来することができ、又は、異なるバクテリア種からのオルソログCpf1又はCsm1ポリペプチドから由来することができる。例えば、各融合タンパク質は、異なるバクテリア種から由来するCpf1又はCsm1ポリペプチドを含むことができる。これらの実施形態において、各融合タンパク質は、異なる標的部位(すなわち、プロトスペーサー及び/又はPAM配列によって特定される)を認識するであろう。例えば、ガイドRNAは、そのヌクレアーゼドメインが標的DNAにおいて効果的な二本鎖切断を生ずるように、ヘテロ二量体を異なってはいるが近接した部位に位置させ得る。
【0038】
あるいは、ヘテロ二量体の二つの融合タンパク質は、異なるエフェクタードメインを持っていてもよい。エフェクタードメインが開裂ドメインである実施形態において、各融合タンパク質は、異なる改変された開裂ドメインを含むことができる。これらの実施形態において、Cpf1又はCsm1ポリペプチドは、それらのエンドヌクレアーゼ活性が欠失されるように改変させられる。ヘテロ二量体を形成するこの二つの融合タンパク質は、Cpf1又はCsm1ポリペプチドドメイン及びエフェクタードメインの両方において異なり得る。
【0039】
上記実施形態のいずれかにおいて、ホモ二量体又はヘテロ二量体は、上に詳細に述べたとおり、核局在化シグナル(NLS)、プラスチドシグナルペプチド、ミトコンドリアシグナルペプチド、複数の細胞内位置へタンパク質輸送が可能なシグナルペプチド、細胞浸透転座ドメイン及びマーカードメインを含むことができる。上述の実施形態のいずれかにおいて、一つまたは両方のCpf1又はCsm1ポリペプチドは、エンドヌクレアーゼ活性が欠失されるように又は改変されるように改変され得る。
【0040】
ヘテロ二量体は、一つ融合タンパク質及び追加のタンパク質を更に含んでもよい。例えば、追加のタンパク質は、ヌクレアーゼであってもよい。一実施形態では、ヌクレアーゼは、ジンクフィンガーヌクレアーゼである。ジンクフィンガーヌクレアーゼは、ジンクフィンガーDNA結合ドメイン及び開裂ドメインを含んでいる。ジンクフィンガーは、三つ(3)のヌクレオチドを認識し結合させる。ジンクフィンガーDNA結合ドメインは、約3個から約7個のジンクフィンガーを含み得る。ジンクフィンガーDNA結合ドメインは、天然に存在するタンパク質から由来し得るか、又は、操作されてもよい。例えば、Beerliら(2002)Nat. Biotechnol.20:135-141;Paboら(2001)Ann. Rev. Biochem.70:313-340;Isalanら(2001)Nat. Biotechnol.19:656-660;Segalら(2001)Curr. Opin. Biotechol.12:632-637;Chooら(2000)Curr. Opin. Struct. Biol.10:411-416;Zhangら(2000)J. Biol. Chem. 275(43):33850-33860;Doyonら(2008)Nat. Biotechnol.26:702-708;及びSantiagoら(2008)Proc. Natl. Acad. Sci. USA105:5809-5814参照。ジンクフィンガーヌクレアーゼの開裂ドメインは、本明細書に詳細に述べられているいずれの開裂ドメインであってもよい。幾つかの実施形態において、ジンクフィンガーヌクレアーゼは、核局在化シグナル、プラスチドシグナルペプチド、ミトコンドリアシグナルペプチド、複数の細胞内位置へタンパク質輸送が可能なシグナルペプチド、細胞浸透又は転座ドメイン、これらは本明細書に詳細に述べられているが、から選択される少なくとも一つの追加のドメイン更に含むことができる。
【0041】
ある実施形態において、上に詳細に述べられている融合タンパク質のいずれか又は少なくとも一つの融合タンパク質を含んでいる二量体は、少なくとも一つのガイドRNAを含んでいるタンパク質-RNA複合体の一部であってもよい。ガイドRNAは、融合タンパク質のCpf1又はCsm1ポリペプチドと相互作用し、融合タンパク質を標的部位に向かわせるが、ここで、ガイドRNA塩基の5’末端は特定のプロトスペーサー配列と対になる。
【0042】
III.Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする核酸
本明細書に記載されているCpf1及びCsm1ポリペプチド又は融合タンパク質のいずれかをコードする核酸が提供される。該核酸は、RNA又はDNAであってよい。Cpf1ポリペプチドをコードするポリヌクレオチドの例は、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174-184、187-192、194-201、及び203-206に記載されている。Csm1ポリペプチドをコードするポリヌクレオチドの例は、配列番号185、186、193、及び202に記載されている。一つの実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする核酸は、mRNAである。該mRNAは、5’キャップ付け及び/又は3’ポリアデニル化され得る。別の実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする核酸は、DNAである。該DNAは、ベクター内に存在することができる。
【0043】
Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする核酸は、興味の対象の植物細胞内でタンパク質への効率的な翻訳のためコドン最適化することができる。コドン最適化のためのプログラムは、当該分野で利用可能である(例えば、OPTIMIZER、genomes.urv.es/OPTIMIZER; OptimumGene. TM.、GenScript社、www.genscript.com/codon_opt.html)。
【0044】
ある実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードするDNAは、少なくとも一つのプロモーター配列に操作可能に連結されてもよい。DNAコード配列は、興味の対象の宿主植物において発現のためプロモーター制御配列に操作可能に連結され得る。幾つかの実施形態において、宿主細胞は、植物細胞である。「操作可能に連結された」とは、二つ以上の要素間の機能的結合を意味することを意図している。例えば、プロモーターと興味の対象の植物コードする領域(例えば、Cpf1又はCsm1ポリペプチド又はガイドRNA)の間の操作可能な結合は、興味の対象の結合領域の発現を許可する機能性結合である。操作可能に連結された要素は、連続していても不連続であってもよい。二つのタンパクコード領域の結合を言うために用いられる場合、「操作可能に連結されることにより」ということは、コード領域が同じリーディングフレームにあることを意図している。
【0045】
プロモーター配列は、構成的、規制的、成長段階特異的、又は組織特異的であり得る。Cpf1又はCsm1ポリペプチド及び/又はガイドRNAの発現のタイミング、位置、及び/又は発現の程度を調節するために、核酸分子において異なるプロモーターを用いることにより、異なる応用が強化され得ることが認識できる。その様な核酸分子は、所望により、プロモーター調節領域(例えば、誘導性、公正性、環境的または発生的に調節される、または細胞又組織特異的/選択的発現)、転写開始部位、リボソーム結合部位、RNAプロセシングシグナル、転写終結部位、及び/又はポリアデニル化シグナルも含んでいてもよい。
【0046】
幾つかの実施形態において、本明細書で提供されている核酸分子は、植物内での発現のため構成的、組織優先、発生的に好ましい、発生的に好ましい、又はその他のプロモーターと組み合わせることができる。植物細胞において機能的な構成的プロモーターとの例としては、カリフラワーモザイクウィルス(CaMV)35S転写開始領域、Agrobacterium tumefaciensのT-DNA由来の1’-又は2’-プロモーター、ユビキチン1プロモーター、Smasプロモーター、シンナミルアルコールデヒドロゲナーゼプロモーター(米国特許第5683439号明細書)、Nosプロモーター、pEmuプロモーター、rubiscoプロモーター、GRP1-8プロモーター、及びその他の当該分野で知られている種々の植物遺伝子からの転写開始領域が含まれる。もし、低い発現レベルが望まれるなら、弱いプロモーターを用いることができる。弱い構成的プロモーターは、例えば、Rsyn7プロモーターの核プロモーター(国際公開第99/43838号及び米国特許第6072050号明細書)、核35SCaMVプロモーター、等が含まれる。他の構成的プロモーターは、例えば、米国特許第5608149号明細書;第5608144号明細書;第5604121号明細書;第5569597号明細書;第5466785号明細書;第5399680号明細書;第5268463号明細書;及び第5608142号明細書が含まれる。また、米国特許第6177611号明細書参照、これらは、本明細書に参照として援用される。
【0047】
誘導性プロモーターは、低酸素又は低温ストレスによって誘導されるAdh1プロモーター、熱ストレスによって誘導されるHsp70プロモーター、及び両方ともに光によって誘導されるPPDKとpepカルボキシラーゼプロモーターである。また、薬害軽減剤により誘導されるIn2-2プロモーター(米国特許第5364780号明細書)、エストロゲンにより誘導されるEREプロモーター、及びオーキシン誘導性でタペートム特異性であるが、カルス中でも活性であるAxig1プロモーター(国際出願PCT/US01/22169号明細書)など化学的に誘導性のプロモーターも有用なプロモーターである。
【0048】
植物中での発生制御下のプロモーターの例としては、葉、根、果実、種、又は花などある組織において優先的に転写を開始させるプロモーターが含まれる。「組織特異的」プロモーターは、ある特定の組織のみにおいて転写を開始するプロモーターである。遺伝子の構成的発現とは異なり、組織特異性発現は、遺伝に調節の幾つかの相互作用をレベルの結果である。このように、相同又は密接に関連する植物種由来のプロモーターは、特定の組織において効率的かつ信頼できる導入遺伝子の発現を達成するために用いることが好ましい。幾つかの実施形態において、発現は、組織優先プロモーターを含んでいる。「組織優先」プロモーターは、転写を優先的に開始するがプロモーターであるが、必ずしも完全に又は特定の組織においてのみ転写を開始するものではない。
【0049】
幾つかの実施形態において、Cpf1又はCsm1ポリペプチド及び/又はガイドRNAをコードする核酸分子は、細胞型特異プロモーターを含んでいる。「細胞型特異プロモーター」は、主に一つ以上の器官においてある種の細胞型における発現を推進するプロモーターである。植物において機能的である細胞型特異プロモーターが主に活性でありうる植物細胞の幾つかの例としては、例えば、BETL細胞、根の血管細胞、葉、茎細胞、及び幹細胞が含まれる。核酸分子はまた細胞型優先プロモーターも含むことができる。「細胞型優先」プロモーターは、一つ以上の組織においてある種の細胞型に主に転写を促進するがプロモーターであるが、しかし必ずしも完全にそれのみに転写を促進するものではない。植物において機能的である細胞型優先プロモーターが優先的に活性でありうる植物細胞の幾つかの例としては、例えば、BETL細胞、根の血管細胞、葉、茎細胞、及び幹細胞が含まれる。本明細書に記載されている核酸分子はまた種優先プロモーターも含むことができる。幾つかの実施形態において、種優先プロモーターは、胚嚢、初期胚、早期胚乳、アリューロン、及び/又は基底乳胚転移細胞層(BETL)における発現を有する。
【0050】
種優先プロモーターの例としては、限定はされないが、27kDガンマゼインプロモーター及びワキシプロモーター、Boronat,A.ら(1986)Plant Sci.47:95-102;Reina,M.らNucl.Acids Res.18(21):6426;及びKloesgen,R.B.ら(1986)Mol. Gen. Genet. 203:237-244がある。胚、果皮、及び胚乳において発現するプロモーターは、米国特許第6225529号明細書及び国際出願PCT公開00/12733号明細書に記載されている。これらの各々についての開示は、その全体が参照により本明細書に援用される。
【0051】
胚嚢、初期胚、早期胚乳、アリューロン、及び/又は基底乳胚転移細胞層(BETL)における発現と共に、植物種子優先的の方法で遺伝子発現を促進することができるプロモーターは、本明細書に開示されている組成物や方法において用いることができる。その様なプロモーターとしては、限定はしないが、Zea mays早期胚乳5遺伝子、Zea mays早期胚乳1遺伝子、Zea mays早期胚乳2遺伝子、GRMZM2G124663、GRMZM2G006585、GRMZM2G120008、GRMZM2G157806、GRMZM2G176390、GRMZM2G472234、GRMZM2G138727、Zea mays CLAVATA1、Zea mays MRP1、Oryza sativa PR602、Oryza sativa PR9a、Zea mays BET1、Zea mays BETL-2、Zea mays BETL-3、Zea mays BETL-4、Zea mays BETL-9、Zea mays BETL-10、Zea mays MEG1、Zea mays TCCR1、Zea mays ASP1、Oryza sativa ASP1、Triticum durum PR60、Triticum durum PR91、Triticum durum GL7、AT3G10590、AT4G18870、AT4G21080、AT5G23650、AT3G05860、AT5G42910、AT2G26320、AT3G03260、AT5G26630、AtlPT4、AtlPT8、AtLEC2、及びLFAH12が含まれる。更なるその様なプロモーターは、米国特許第7803990号明細書、第8049000号明細書、第7745697号明細書、第7119251号明細書、第7964770号明細書、第7847160号明細書、第7700836号明細書、米国特許出願公開第20100313301号明細書、第20090049571号明細書、第20090089897号明細書、第20100281569号明細書、第20100281570号明細書、第20120066795号明細書、第20040003427号明細書;国際公開第1999/050427号、国際公開第2010/129999号、国際公開第2009/094704号、国際公開2010/019996号および国際公開2010/147825号が含まれ、これらの各々は、全ての目的のためその全体が参照により本明細書に援用される。本明細書に記載されているプロモーターの機能的変異体又は機能的断片はまた、本明細書に開示されている核酸と操作可能に連結され得る。
【0052】
外因性化学調節因子の適用を通して遺伝子の発現を調節するために化学調節プロモーターを用いることができる。目的に応じて、プロモーターは、化学誘導性プロモーターでもよく、ここでは化学物質の適用が遺伝子発現を誘引し、又は化学抑制性プロモーターでもよく、ここでは化学物質の適用が遺伝子発現を抑制する。当該分野で知られている化学誘導性プロモーターは、限定はしないが、ベンゼンスルフォンアミド除草剤薬害軽減剤によって活性化されるものであるトウモロコシIn2-2プロモーター、出芽前散布除草剤として用いられる疎水性求電子化合物により活性化されるものであるトウモロコシGSTプロモーター、及び、サリチル酸により活性化されるものであるタバコPR-1aプロモーターが含まれる。興味の対象の他の化学調節プロモーターは、ステロイド応答性プロモーターである(例えば、Schenaら(1991)Proc. Natl. Acad. Sci. USA88:10421-10425及びMcNellisら(1998)Plant J.14(2):247-257に記載のグルココルチコイド誘導性プロモーター参照)及びテトラサイクリン誘導性及びテトラサイクリン抑制性プロモーター(例えば、Gatzら(1991)Mol. Gen. Genet.227:229-237及び米国特許第5814618号明細書及び第5789156号明細書参照)、これらは、参照により本明細書に援用される。
【0053】
組織優先プロモーターは、特定の組織内で発現コンストラクトの増強された発現を狙うために用いることができる。ある実施形態において、組織優先プロモーターは、植物組織において活性である。組織優先プロモーターは、当該分野で知られている。例えば、Yamamotoら(1997)Plant J.12(2):255-265;Kawamataら(1997)Plant Cell Physiol 38(7):792-803;Hansenら(1997)Mol. Gen Genet.254(3):337-343;Russellら(1997)Transgenic Res.6(2):157-168;Rinehartら(1996)Plant Physiol 112(3):1331-1341;Van Campら(1996)Plant Physiol 112(2):525-535;Canevasciniら(1996)Plant Physiol 112(2):513-524;Yamamotoら(1994) Plant Cell Physiol35(5):773-778;Lam(1994)Results Probl. Cell Differ.20:181-196;Orozcoら(1993)Plant Mol Biol.23(6):1129-1138;Matsuokaら(1993)Proc Natl. Acad. Sci. USA90(20):9586-9590;及びGuevara-Garciaら(1993)PlantJ.4(3):495-505参照。このようなプロモーターは、もし必要であれば、弱い発現のために改変することができる。
【0054】
葉優先プロモーターは、当該分野で知られている。例えば、Yamamotoら(1997)Plant J.12(2):255-265;Kwonら(1994)Plant Physiol 105:357-67;Yamamotoら(1994) Plant Cell Physiol 35(5):773-778;Gotorら(1993) Plant J. 3:509-18;Orozcoら(1993)Plant Mol. Biol.23(6):1129-1138;及びMatsuokaら(1993)Proc. Natl. Acad. Sci. USA90(20):9586-9590参照。更に、Cab及びrubiscoの該プロモーターもまた用いることができる。例えば、Simpsonら(1958)EMBO J4:2723-2729及びTimkoら(1988)Nature318:57-58参照。
【0055】
根優先プロモーターは、良く知られており、文献から入手可能な多くのものから選択でき、又は様々な適合性の種から新たに単離できる。例えば、Hireら(1992)Plant Mol. Biol.20(2):207-218(大豆根特異的グルタミン合成酵素遺伝子);KellerとBaumgartner(1991)Plant Cell 3(10):1051-1061(フランス豆のGRP1.8遺伝子における根特異的制御エレメント;Sangerら(1990)Plant Mol. Biol.14(3):433-443(Agrobacterium tumefacienのマンノピンシンターゼ(MAS)遺伝子の根特異的プロモーター);及びMiaoら(1991)Plant Cell 3(1):11-22(大豆の根及び根粒において発現するものである細胞質ゾルグルタミン合成酵素(GS)をコードする全長cDNAクローン)参照。また、Boguszら(1990)Plant Cell 2(7):633-641参照、ここでは、窒素固定非マメ科Parasponia andersonii及び関連する非窒素固定非マメ科Trema tomentosaからのヘモグロビン遺伝子から単離された2つの根特異的プロモーターが記載されている。これらの遺伝子のプロモーターは、β-グルクロニダーゼレポーター遺伝子に結び付けられ、非マメ科Nicotiana tabacum及びマメ科Lotus Corniculatusの両方へ導入され、両方の場合に、根特異的プロモーター活性は、保存されていた。LeachとAoyagi(1991)は、Agrobacterium rhizogenesの高度に発現されたroIC及びroID根誘導遺伝子のプロモーターを記載している(参照、Plant Science(Limerick)79(1):69-76)。彼らは、エンハンサー及び組織優先DNA決定基、それらのプロモーターにおいて解離していると結論付けた。Teeriら(1989)は、オクトピン合成酵素をコードするAgrobacterium T-DNA遺伝子が、根端の表皮において特に活性であり、TR2’遺伝子は、無傷植物において根特異的であり、使用のために殺虫遺伝子又は殺幼虫遺伝子との特に望ましい性質の組み合わせで葉組織に傷をつけることによって刺激されることを示すためlaZに融合した遺伝子を用いた(EMBO J.8(2):343-350参照)。nptII(ネオマイシンホスホトランスフェラーゼII)に融合されているTR1’遺伝子は、同様の性質を示した。更なる根優先プロモーターは、VfENOD-GRP3遺伝子プロモーター(Kusterら(1995)Plant Mol. Biol.29(4):759-772);及びroIBプロモーター(Capanaら(1994)Plant Mol. Biol.25(4):681-691を含んでいる。また、米国特許第5837876号明細書;第5750386号明細書;第5633363号明細書;第5459252号明細書;第5401836号明細書;第5110732号明細書;及び第5023179明細書を参照されたい。phaseolin遺伝子(Muraiら(1983)Science23:476-482及びSengopta-Gopalenら(1988)PNAS82:3320-3324。該プロモーター配列は、野生型であってもよく又はより効率的又は有効な発現のため改変されていてもよい。
【0056】
Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする核酸配列は、インビトロmRNA合成のためのファージRNAポリメラーゼによって認識されるプロモーター配列に操作可能に連結することができる。その様な実施形態において、インビトロで転写されたRNAは、本明細書に記載されているゲノム改変の方法において用いるために精製することができる。例えば、プロモーター配列は、T7、T3、又はSP6プロモーター配列又はT7、T3、又はSP6プロモーター配列の変異体である。幾つかの実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする配列は、植物細胞におけるインビトロCpf1又はCsm1ポリペプチド又は融合タンパク質の発現のためのプロモーター配列に操作可能に連結することができる。その様な実施形態において、発現されたタンパク質は、本明細書に記載されているゲノム改変方法において利用されるため精製することができる。
【0057】
ある実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードするDNAは、ポリアデニル化シグナル(例えば、植物において機能的なSV40ポリAシグナルや他のシグナル)及び/又は少なくとも一つの転写終結配列と結合させることもできる。更に、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする配列は、本明細書に記載されているが、少なくとも一つの局在化シグナルをコードする配列、少なくとも一つのプラスチドシグナルペプチド、少なくとも一つのミトコンドリアシグナルペプチド、タンパク質を複数の細胞内位置に輸送することができる少なくとも一つのシグナルペプチド、少なくとも一つの細胞浸透ドメイン、及び/又は少なくとも一つのマーカードメインに、結合することができる。
【0058】
Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードするDNAは、ベクター中に存在し得る。適切なベクターは、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、及びウィルス対策ソフトベクター(例えば、レンチウィルスベクター、アデノ随伴ウィルスベクター等)が含まれる。一実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードするDNAは、プラスミドベクター中に存在する。適切なプラスミドベクターの例としては、限定はしないが、pUC、pBR322、pET、pCAMBIA、及びその変異体が含まれる。ベクターは、追加の発言制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択マーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含むことが出来る。追加情報は、「Current Protocols in Molecular」Ausubelら、John Wiley & Sons、New York,2003又は、「分子クローニング:実験室マニュアル」Sambrook & Russell、Cold Spring Harbor、N.Y.、第3版、2001に見出される。
【0059】
幾つかの実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質をコードする配列を含む発現ベクターは、ガイドRNAをコードする配列も更に含むことができる。ガイドRNAをコードする配列は、興味の対象の植物において又は植物細胞においてガイドRNAの発現のための少なくとも一つの転写制御配列に操作可能に連結することができる。例えば、ガイドRNAをコードするDNAは、RNAポリメラーゼIII(PolIII)によって認識されるプロモーター配列に操作可能に連結することができる。適したPolIIIIプロモーターの例としては、限定はされないが、哺乳動物U6、U3、H1、および7SLRNAプロモーター及びイネU6及びU3プロモーターが含まれる。
【0060】
IV. 植物ゲノムにおけるヌクレオチド配列を改変する方法
植物細胞、植物小器官、又は植物胚のヌクレオチド配列を改変する方法が、本明細書に提案されている。該方法は、植物細胞、植物小器官、又は植物胚に、(a)標的DNAにおける配列を補足するヌクレオチド配列を含む第一のセグメント及び(b)Cpf1又はCsm1ポリペプチドと相互作用を引き起こす第二のセグメントを含むDNA標的化RNA、このDNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチドを導入すること、更に(a)DNA標的化RNAと相互作用を引き起こすRNA結合部分及び(b)部位特異的酵素活性を示す活性部分を含むCpf1又はCsm1ポリペプチド、このCpf1又はCsm1ポリペプチド又はこのCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドを植物細胞に導入することも含んでいる。そして、植物細胞又は植物胚は、Cpf1又はCsm1ポリペプチドが発現されヌクレオチド配列を開裂する条件下で培養することができる。本明細書に記載されている系は、外因性Mg2+又は他のどのイオンの添加も必要としないことに留意されたい。最後に、改変されたヌクレオチド配列を含む植物細胞又は小器官は選択できるものである。
【0061】
幾つかの実施形態において、該方法は、植物細胞、小器官、又は胚へ、一つのCpf1又はCsm1ポリペプチド(又はコード化核酸)及び一つのRNA(又はコード化DNA)を導入することを含むことができ、ここで該Cpf1又はCsm1ポリペプチドは、植物染色体DNAの標的ヌクレオチド配列において一つの二本鎖切断を導入するものである。任意のドナーポリヌクレオチドが存在しない実施形態において、ヌクレオチド配列における該二本鎖切断は、非相同末端結合(NHEJ)修復プロセスにより修復することができる。NHEJはエラーが起こりがちなので、切断の修復時、少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが発生し得る。このように、標的ヌクレオチド配列は改変又は非活性化され得る。例えば、単一ヌクレオチド変化(SNP)は、変化したタンパク質産物の増加をもたらし得る又は、コード化配列のリーディングフレームのシフトは、タンパク質産物が作られないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチドおけるドナー配列は、二重切断の修復中、標的部位において、ヌクレオチド配列と交換又はヌクレオチド配列に組み込まれ得る。例えば、ドナー配列が、植物のヌクレオチド配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において、該ドナー配列は、相同性志向修復プロセスによって仲介される修復の間に、標的部位のヌクレオチド配列と交換又はヌクレオチド配列に組み込まれ得る。あるいは、ドナー配列が互換性オーバーハングに隣接する(あるいは、互換性オーバーハングがその場でCpf1又はCsm1ポリペプチドによって生成される)実施形態において、該ドナー配列は、二重切断の修復中非相同性修復プロセスによって、開裂されたヌクレオチド配列と直接に結合され得る。ドナー配列のヌクレオチド配列との交換又はへの組み込みは、植物の標的ヌクレオチド配列を改変するか又は外因性配列を植物細胞、植物小器官、又は植物胚のヌクレオチド配列に導入することになる。
【0062】
本明細書に開示されている方法は、更に2つのCpf1又はCsm1ポリペプチド(又はコード化核酸)及び二つのガイドRNA(又はコード化DNA)を植物細胞、小器官、又は胚に導入することも含むことができ、ここで該Cpf1又はCsm1ポリペプチドは核の及び/又は小器官の染色体DNAのヌクレオチド配列における二本鎖切断を導入するものである。二つの切断は、数個塩基対内で、数十個の塩基対内で起こり得るか、又は数千個の塩基対によって離されていてもよい。任意のドナーヌクレオチドが存在しない実施形態において、得られた二本鎖切断は、切断の修復中に二つの開裂部位間の配列が失われるように及び/又は少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが起こり得るように、非相同性修復プロセスにより修復され得る。任意のドナーヌクレオチドが存在する実施形態において、相同性に基づく修復プロセス(例えば、ドナー配列が、植物のヌクレオチド配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において)又は非相同性修復プロセス(例えば、ドナー配列が、互換性オーバーハングに隣接する実施形態において)のいずれかによる二本鎖切断の修復中、ドナーポリヌクレオチドにおけるドナー配列は、植物のヌクレオチド配列と交換されるか又は植物のヌクレオチド配列の中に組み込まれ得る。
【0063】
遺伝子の発現レベルを「変化させる (altering)」又は「調節する (modulating)」ことによりとは、遺伝子の発現がアップレギュレーション又はダウンレギュレーションされることを意図する。幾つかの例において、光合成においてタンパク質をコードする一つ以上の遺伝子の発現レベルが上昇すること、すなわちアップレギュレーション発現、によって植物成長及び収量が増加することが認識されている。同様に、いくつかの例において、光合成においてタンパク質をコードする一つ以上の遺伝子の発現レベルを減少させること、すなわちダウンレギュレーション発現、によって植物成長及び収量が減少され得る。このように、本発明は、本明細書に開示されているCpf1又はCsm1ポリペプチドを用いることにより、光合成に関与するタンパク質をコードする一つ以上の遺伝子の発現レベルのアップギュレーション又はダウンレギュレーションを含んでいる。更に、本方法は、興味の対象の植物において光合成に関与するタンパク質をコードする少なくとも一つの遺伝子のアップギュレーション及び光合成に関与するタンパク質をコードする少なくとも一つの遺伝子のダウンギュレーションを含んでいる。形質転換植物において光合成に関与するタンパク質をコードする少なくとも一つの遺伝子の濃度及び/又は活性を調節することにより、紹介している本発明の配列を持っていなかった天然の対照植物、植物部分、又は細胞と較べると少なくとも約1%、約5%、約10%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、またはそれ以上濃度及び/又は活性が増加されるか又は減少されることを意図している。
【0064】
植物細胞は、核、色素体、及びミトコンドリアゲノムを有する。本発明の組成物及び方法は、核、色素体、及び/又はミトコンドリアゲノムの配列を変更するために用いることもでき又は核、色素体、及び/又はミトコンドリアゲノムを調節するために用いることもできる。従って、「染色体」又は「染色体の」によってとは、核、色素体、ミトコンドリアゲノムDNAを意図する。植物細胞に適用される場合「ゲノム」は、核内に見出される染色体DNAのみならず、細胞の亜細胞成分(例えば、ミトコンドリア又は色素体)内に見出される小器官DNAも含んでいる。植物細胞、小器官、又は胚における興味の対象のいずれのヌクレオチド配列も、本明細書に開示されている方法を用いることにより改変することができる。特定の実施形態において、本明細書に開示されている方法は、植物ホルモン、植物防御タンパク質、栄養輸送タンパク質、生物学的関連タンパク質、望ましい入力形質、望ましい出力形質、ストレス耐性遺伝子、疾患/病原体耐性遺伝子、雄性不稔性遺伝子、発生遺伝子、調節遺伝子、光合成に関与する遺伝子、DNA修復遺伝子、転写調節遺伝子、又は興味の対象の他の任意のポリヌクレオチド及び/又はポリペプチド等の農業上重要な形質をコードするヌクレオチド配列を改変するために用いることができる。油、デンプン及びタンパク質含量などの農業上重要な形質も改変することができる。改質は、オレイン酸、飽和及び不飽和油含量の増加、リジン及び硫黄値の増加、必須アミノ酸の提供、及びデンプンの改変が含まれている。ホルドチオニンタンパク質改質は、米国特許第5703049号明細書、第5885801号明細書、第5885802号明細書及び第5990389号明細書に記載されており、これらは本明細書に参照として援用される。別の例としては、米国特許第5850016号明細書に記載されている大豆2Sアルブミンによってコードされているリジン及び/又はイオウリッチ種子、及びWilliamsonら(1987)Eur.J.Biochem.165:99-106に記載されているオオムギ由来のキモトリプシン阻害剤があり、これらの開示は本明細書に参照として援用される。
【0065】
本明細書に開示されている方法を用いて、コード配列の誘導体が作られ、コード化されたポリペプチド中のあらかじめ選択されたアミノ酸値を増加させることができる。例えば、大麦高リジン(BHL)ポリペプチドをコードする遺伝子は、1996年11月1日に出願された米国特許出願第08/740682号明細書及び国際公開98/20133号のオオムギキモトリプシン阻害剤に由来し、その開示は本明細書に参考として援用される。他のタンパク質としては、ヒマワリ種子(Lilleyら(1989)Proceedings of the world Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs,ed. Applewhite(American oil Chemists Society,Champain,Illinois)pp.497-502;本明細書に参照として援用される);トウモロコシ(Pedersenら(1986)J. Biol. Chem.261:6279及びKiriharaら(1988)Gene71:359;これら両方とも本明細書に参照として援用される);及びイネ(Musumuraら(1989)Plant Mol. Biol.12:123、本明細書に参照として援用される)等から由来するメチオニンに富むタンパク質が含まれる。その他の農学的に重要な遺伝子は、ラテックス、Floury2成長因子、種子貯蔵因子及び転写因子をコードする。
【0066】
本明細書に開示されている方法は、アセトラクテート合成酵素(ALS)の作用を阻害するように作用する除草剤、特にスルホニルウレア型除草剤に対する耐性のためコードしている遺伝子(例えば、そのような耐性につながる突然変異、特にS4及び/又はHra突然変異、を含んでいるアセトラクテート合成酵素(ALS)遺伝子)、ホスフィノトリシン又はバスタ(例えば、バー(bar) 遺伝子)のようなグルタミン合成酵素(ALS)の作用を阻害するように作用する除草剤に対する耐性のためコードしている遺伝子;グリホサート(例えば、EPSPS遺伝子及びGAT遺伝子;例えば米国公開第20040082770号明細書及び国際公開第03/092360号参照);又は当該分野で知られている他のその様な遺伝子を含んでいる除草剤耐性形質を改変するために用いることができる。バー遺伝子は、除草剤バスタに対する耐性をコードし、nptII遺伝子は、抗生物質カナマイシン及びジェネテシンに対する耐性をコードし、また、ALS遺伝子突然変異体は、除草剤クロルスルフロンに対する耐性をコードする。更なる除草剤耐性形質は、例えば、米国特許出願第2016/0208243号明細書に述べられており、本明細書に参照として援用される。
【0067】
不稔性遺伝子も改変することができ、代替の物理的雄穂除去を提供できる。その様なやり方に用いられる遺伝子の例としては、雄性組織優先遺伝子や、米国特許第5583210号明細書に記載されているQMなど、雄性不稔表現型を有する遺伝子が含まれる。他の遺伝子としては、キナーゼ、及び雄性又は雌性配偶体発生のいずれかに有毒な化合物をコードするものなどが含まれる。更なる不稔性形質は、例えば、米国特許出願第2016/0208243号明細書に記載されており、本明細書に参照として援用される。
【0068】
穀物の品質は、油の値や種類、飽和及び不飽和、必須アミノ酸の質及び量、セルロースの値などの形質をコードする遺伝子を改変することにより変えることができる。トウモロコシにおいて、改変されたホルドチオニンタンパク質は、米国特許第5703049号明細書、第5885801号明細書、第5885802号明細書、及び第5990389号明細書に記載されている。
【0069】
商業上形質も遺伝子を改変することによって、又は例えばエタノール生産のためにデンプンを増加させることができるか、又はタンパク質の発現を提供することにより改変することができる。改変植物のもう一つの重要な商業上の応用は、米国特許第5602321号明細書に記載されているようなポリマー及びバイオプラスチックの製造である。β-ケトチオラーゼ、PHBアーゼ(ポリハイドロブチレート合成酵素)及びアセトアセチル-CoA還元酵素(Schubertら(1988)J.Bacteriol.170:5837-5847)等の遺伝子は、ポリハイドロキシアルカノアーゼ(PHA)の発現を促進する。
【0070】
外因性生成物は、植物酵素並びに原核生物及び他の真核生物を含む他の供給源からのものを含んでいる。その様な生成物としては、酵素、捕因子、ホルモンなどが含まれる。タンパク質、特にアミノ酸分布が改善され植物の栄養価が改善されている改変タンパク質、の値は増加できる。これは、増強されたアミノ酸含量を持つその様なタンパク質の発現によって達成される。
【0071】
本明細書に開示されている方法は、所望の植物形質を達成するため異種遺伝子の挿入及び/又は天然植物遺伝子発現の改変のために用いることもできる。その様な形質は、例えば、耐病性、除草剤耐性、乾燥耐性、耐塩性、虫害抵抗性、寄生雑草耐性、植物栄養価の改善、飼料消化率の向上、穀物収量の増加、細胞質雄性不稔性、果実熟成の変化、植物又は植物部分の保存期間の増加、アレルゲン生産の減少、及びリグニン含量の増加または減少が含まれる。これらの望ましい形質を付与できる遺伝子は米国特許出願第2016/0208243号明細書に述べられており、本明細書に参照として援用される。
【0072】
(a)Cpf1又はCsm1ポリペプチド
本明細書に開示されている方法は、本明細書に記載されているように、少なくとも一つのCpf1又はCsm1ポリペプチドを又は少なくとも一つのCpf1又はCsm1ポリペプチドをコードする核酸を植物細胞、植物小器官、又は植物胚に導入することを含んでいる。幾つかの実施形態において、Cpf1又はCsm1ポリペプチドが、単離されたタンパク質として、植物細胞、小器官、又は胚に導入され得る。このような実施形態において、該Cpf1又はCsm1ポリペプチドは、タンパク質の細胞への取り込みを促進するものである細胞浸透ドメインを更に少なくとも一つ含むことができる。幾つかの実施形態において、該Cpf1又はCsm1ポリペプチドは、ガイドRNAと複合体を形成するリボ核タンパク質として、植物細胞、小器官、又は胚に導入することができる。他の実施形態において、該Cpf1又はCsm1ポリペプチドは、mRNAとして植物細胞、小器官、又は胚に導入することができる。更に他の実施形態において、該Cpf1又はCsm1ポリペプチドは、DNA分子として植物細胞、小器官、又は胚に導入することができる。一般的に、本明細書に記載されているCpf1又はCsm1ポリペプチド又は融合タンパク質をコードする配列は、興味の対象の植物細胞、小器官、又は胚において機能するプロモーター配列に操作可能に連結される。DNA配列は、線状であってもよく又はDNA配列は、ベクターの一部であってもよい。更に他の実施形態において、Cpf1又はCsm1ポリペプチド又は融合タンパク質は、ガイドRNAあるいは融合タンパク質とガイドRNAを含むRNA-タンパク質複合体として、植物細胞、小器官、又は胚に導入することができる。
【0073】
ある実施形態において、Cpf1又はCsm1ポリペプチドをコードするmRNAは、小器官(例えば、色素体又はミトコンドリア)に向けられてもよい。ある実施形態において、一つ以上のガイドRNAをコードするmRNAは、小器官(例えば、色素体又はミトコンドリア)に向けられてもよい。ある実施形態において、Cpf1又はCsm1ポリペプチド及び一つ以上のガイドRNAをコードするmRNAは、小器官(例えば、色素体又はミトコンドリア)に向けられてもよい。mRNAを小器官に向けるための方法は、当該分野で公知であり(例えば米国特許出願第2011/0296551号明細書;米国特許出願第2011/0321187号明細書;GomesとPallas(2010)PLos One5:e12269参照)参照として本明細書に参照として援用される。
【0074】
ある実施形態において、Cpf1又はCsm1ポリペプチドをコードするDNAは、ガイドRNAをコードする配列を更に含むことができる。一般的に、Cpf1又はCsm1ポリペプチド及びガイドRNAをコードする各配列は、植物細胞、小器官、又は胚において、該Cpf1又はCsm1ポリペプチド及びガイドRNAのそれぞれの発現を許可する一つ以上の適当なプロモーター制御配列に操作可能に連結する。Cpf1又はCsm1ポリペプチド及びガイドRNAをコードするDNA配列は、更なる発現制御、調節、及び/又はプロセシング配列を更に含むことができる。Cpf1又はCsm1ポリペプチド及びガイドRNAをコードするDNA配列は、直鎖上であってもよく又はベクターの一部であってもよい。
【0075】
(b)ガイドRNA
本明細書に記載されている方法は、少なくともガイドRNA又は少なくともガイドRNAをコードするDNAを植物細胞、小器官、又は胚に導入することも含んでいてもよい。ガイドRNAは、Cpf1又はCsm1ポリペプチドと相互作用し、ガイドRNAの塩基の5’末端が植物ヌクレオチド配列内の特定のプロトスペーサー配列と対になる部位、その特定標的部位に該Cpf1又はCsm1ポリペプチドを向かわせるようにする。ガイドRNAは、3つの領域を含むことができる:標的染色体配列における標的部位に相補的である第一の領域、ステムループ構造を形成する第二の領域、及び本質的に一本鎖のままである第三の領域。各ガイドRNAの第一の領域は、各ガイドRNAがCpf1又はCsm1ポリペプチドを特定の標的部位に導くように異なっている。各ガイドRNAの第二及び第三の領域は全てのガイドRNAにおいて同じでもよい。
【0076】
ガイドRNAの一つの領域は、ガイドRNAの第一の領域が標的部位と塩基対をつくることができるように、核染色体配列同様に色素体又はミトコンドリア1配列を含む植物ゲノムにおける標的部位にある配列(すなわちプロトスペーサー配列)に相補的である。様々な実施形態において、ガイドRNAの第一の領域は約8個のヌクレオチド~約30個以上のヌクレオチドを含み得る。例えば、ヌクレオチド配列中のガイドRNAと標的部位の間の塩基対を形成している領域は、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約22、約23、約24、約25、約27、約30、又は30個を超えるヌクレオチドの長さである。例示的な実施形態において、ガイドRNAの第一の領域は約23、24、又は25個のヌクレオチドの長さである。ガイドRNAは、第二の構造を形成している第二の領域も含むことができる。幾つかの実施形態において、第二の構造はステム又はヘアピンを含んでいる。ステムの長さは様々であってよい。例えば、ステムは、約6から、約10、約15、約20、又は約25の塩基対の範囲の長さであってよい。ステムは、1から10個のヌクレオチドの一つ以上のバルジを含むことができる。このように、第二の領域の全長は、約16から約25個のヌクレオチドの長さの範囲であり得る。ある実施形態において、ループは、約5個のヌクレオチドの長さであり、ステムは約10個の塩基対を含んでいる。
【0077】
ガイドRNAは、又本質的に一本鎖のまま残る第三の領域も含むことができる。このように、第三の領域は、興味の対象の細胞におけるいかなるヌクレオチド配列に対しても相補性を持たず、ガイドRNAの残りの部分とも相補性を持たない。第三の領域の長さは、様々であり得、一般的に第三の領域は約4個以上のヌクレオチドの長さである。例えば、第三の領域の長さは、約5から約60個のヌクレオチドの長さの範囲内である。ガイドRNAの第二および第三の領域(ユニバーサル又はスキャフォールド領域とも呼ばれる)の合計長さは、約30から約120個のヌクレオチドの長さの範囲内である。一つの態様において、第二および第三の領域の合計長さは、約40から約45個のヌクレオチドの長さの範囲内である。
【0078】
幾つかの実施形態において、ガイドRNAは、3つの領域の全てを含んでいる単一の分子を含んでいる。他の実施形態において、ガイドRNAは、二つの別々な分子を含んでいる。第一のRNA分子は、ガイドRNAの第一の領域とガイドRNAの第二の領域のステムの半分を含んでいてよい。第二のRNA分子は、ガイドRNAの第二の領域のステムの残り半分とガイドRNAの第三の領域を含んでいてよい。このように、この実施形態において、第一及び第二のRNA分子は、それぞれ互いに相補的なヌクレオチドの配列を含んでいる。例えば、一つの実施形態において、第一及び第二のRNA分子は、各々が、機能的なガイドRNAを形成するため残りの配列と塩基対を形成している配列(約6~約25個のヌクレオチド)を含んでいる。特定の実施形態において、ガイドRNAは、第二のガイドRNA(すなわち、tracrRNA)を必要とせずに、染色体及びCpf1ポリペプチドにおける標的部位と相互作用を起こす単一の分子(すなわちcrRNA)である。
【0079】
ある実施形態において、ガイドRNAは、RNA分子として、植物細胞、小器官、又は胚へ導入することができる。該RNA分子は、インビトロで転写され得る。あるいは、該RNA分子は、化学的に合成することができる。他の実施形態において、ガイドRNAは、DNA分子として、植物細胞、小器官、又は胚へ導入することができる。その様な場合、ガイドRNAをコードするDNAは、興味の対象の植物細胞、小器官、又は胚におけるガイドRNAの発現のためのプロモーター制御配列に操作可能に連結され得る。例えば、RNAコード配列は、RNAポリメラーゼIII(PolIII)によって認識されるプロモーター配列に操作可能に連結され得る。例示的な実施形態において、RNAコード配列は、植物特異的プロモーターに結合される。
【0080】
ガイドRNAをコードするDNAは、直線状又は環状であり得る。幾つかの実施形態において、ガイドRNAをコードするDNAは、ベクターの一部であってもよい。適切なベクターには、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、及びウィルスベクターが含まれる。例示的な実施形態において、Cpf1又はCsm1ポリペプチドをコードするDNAは、プラスミドベクター中に存在する。適切なプラスミドベクターとしては、限定はされないが、pUC、pBR322、pET、pBluescript、pCAMBIA、及びそれらの変異体が挙げられる。ベクターは、追加の発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終結配列など)、選択マーカー配列(例えば、抗生物質耐性遺伝子)、複製機店などを含むことができる。
【0081】
Cpf1又はCsm1ポリペプチド及びガイドRNAの両方が、DNA分子として植物細胞、小器官、又は胚へ導入されている実施形態において、各々は、別個の分子の一部であり得る(例えば、Cpf1又はCsm1ポリペプチド又は融合タンパク質コード配列及びガイドRNAコード配列を含んでいる第二ベクター)又は、両方は同じ分子の部分(例えば、Cpf1又はCsm1ポリペプチド又は融合タンパク質コード配列及びガイドRNA両方のためのコード(及び調節)配列を含む一つのベクター)であってもよい。
【0082】
(c)標的部位
Cpf1又はCsm1ポリペプチドは、ガイドRNAと共に、植物染色体配列、植物細胞、植物小器官(例えば色素体又はミトコンドリア)を含む植物又は植物胚における標的部位に向けられるが、ここで該Cpf1又はCsm1ポリペプチドは染色体配列における二本鎖切断をそこで導入する。標的部位は、配列がコンセンサス配列の直前(上流)にあること以外は配列制限がない。このコンセンサス配列は、プロトスペーサー隣接モチーフ(PAM)としても知られている。PAM配列の例としては、限定はされないが、TTN、CTN、TCN、CCN、TTTN、TCTN、TTCN、CTTN、ATTN、TCCN、TTGN、GTTN、CCCN、CCTN、TTAN、TCGN、CTCN、ACTN、GCTN、TCAN、GCCN、及びCCGN(ここでNは、任意のヌクレオチドとして定義される)を含んでいる。所与のヌクレアーゼ酵素に対するPAM配列特異性は、酵素濃度により影響を受けることは当該分野で公知である(Karvelisら(2015)Genome Biol 16:253)。このように、興味の対象の細胞又はインビトロ系に送達されたCpf1又はCsm1タンパク質の濃度を調節することは、PAM部位又はそのCpf1又はCsm1酵素に関連する部位を変更する方法を表す。興味の対象の系におけるCpf1又はCsm1タンパク質濃度の調節は、例えば、Cpf1をコードする又はCsm1をコードする遺伝子を発現するために用いられるプロモーターを変更することによって、細胞又はインビトロ系に送達されるリボ核タンパク質の濃度を変更することによって、又は遺伝子発現レベルを調節する際に役割を果たすであろうイントロンを加えたり又は除いたりすることによって達成することができる。本明細書に詳細に記されているように、ガイドRNAの第一の領域は標的配列のプロトスペーサーに相補性である。典型的には、ガイドRNAは、約19から21ヌクレオチドの長さである。
【0083】
標的部位は、遺伝子のコード領域の中、遺伝子のイントロンの中、遺伝子の制御領域の中、遺伝子間の非コード領域の中、等に在り得る。遺伝子は、タンパク質コード遺伝子又はRNAコード遺伝子で在り得る。遺伝子は、本明細書に記載されている用にいずれの興味の対象の遺伝子であってもよい。
【0084】
(d)ドナーポリヌクレオチド
幾つかの実施形態において、本明細書に開示されている方法は、少なくとも一つのドナーポリヌクレオチドを植物細胞、小器官、又は胚に導入することを更に含んでいる。ドナーポリヌクレオチドは、少なくとも一つのドナー配列を含んでいる。幾つかの態様において、ドナーポリヌクレオチドのドナー配列は、興味の対象の細胞核において又は小器官(例えば、色素体又はミトコンドリア)において見出される内因性又は天然の植物ゲノム配列に対応する。例えば、ドナー配列は、標的部位の又その近くの染色体配列の部分と本質的に同一であり得るが、このことは、少なくとも一つのヌクレオチド変化を含んでいる。このように、ドナー配列は、天然配列との組み込み又は置換に際し、標的部位にある配列が少なくとも一つのヌクレオチド変化を含むように、標的部位にある野生型配列の改変バージョンを含むことができる。例えば、変化は、一つ以上のヌクレオチドの挿入、一つ以上のヌクレオチドの欠失、一つ以上のヌクレオチドの置換、又はそれらの組み合わせであり得る。改変配列の組み込みの結果として、植物、植物細胞、又は植物胚は、標的染色体配列から改変遺伝子産物を生産することができる。
【0085】
あるいはドナーポリヌクレオチドのドナー配列は、外因性配列に対応していてもよい。本明細書に用いられる場合、「外因性」配列とは、植物細胞、小器官、又は胚に対して天然ではない配列、又は細胞、小器官又は胚のゲノムにおける天然の位置が、異なる位置にある配列を言う。例えば、外因性配列は、外因性プロモーターに操作可能に連結することができるタンパク質コード配列である、そのタンパク質コード配列を含むことができ、それにより、ゲノムへの組み込みに際し、植物細胞又は小器官が、組み込まれた配列によりコードされるタンパク質を発現することができる。例えば、ドナー配列は、本明細書の他のところに述べられているように、農学的に重要な形質をコードするものなど、興味の対象の任意の遺伝子であり得る。あるいは、外因性配列は、その発現が外因性プロモーター制御配列により調節されるように、核、色素体、及び/又はミトコンドリア1染色体配列に組み込むことができる。他の反復において、外因性配列は、転写制御配列、別の発現制御配列、又はRNAコード配列であり得る。外因性配列の染色体配列への組み込みは、「ノックイン」と呼ばれる。ドナー配列は、数ヌクレオチドから数百ヌクレオチド、数十万ヌクレオチドの長さで多様でありうる。
【0086】
幾つかの実施形態において、ドナーポリヌクレオチドのドナー配列は、植物核、色素体、及び/又はミトコンドリア1染色体配列における標的部位の上流及び下流各々に位置する配列と実質的配列同一性を有する上流配列及び下流配列、その上流配列及び下流配列に隣接する。これらの配列類似性により、ドナーポリヌクレオチドの上流及び下流配列はドナー配列が標的植物配列へ組み込まれる(又は入れ換えられる)ように、ドナーポリヌクレオチドと標的配列間の相同組換えを可能にする。
【0087】
本明細書に用いられる場合、上流配列は、標的部位の上流の染色体配列と実質的に配列同一性を共有する核酸配列を言う。同様に、下流配列は、標的部位の下流の染色体配列と実質的に配列同一性を共有する核酸配列を言う。本明細書に用いられる場合、「実質的に配列同一性」という句は、少なくとも約75%配列同一性を持つ配列を言う。このように、ドナーポリヌクレオチドにおける上流及び下流配列は、標的部位の上流及び下流の配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%の同一性を持つことができる。例示的な実施形態において、ドナーポリヌクレオチドの上流及び下流の配列は、標的部位の上流及び下流のヌクレオチド配列と約95%又は100%の同一性を持つことができる。一つの実施形態において、上流配列は、標的部位のすぐ上流に(すなわち、標的部位に隣接する)位置するヌクレオチド配列と実質的に配列同一性を共有する。他の実施形態において、上流配列は、標的部位の上流約百(100)個のヌクレオチド内に位置するヌクレオチド配列と実質的に配列同一性を共有する。このように、例えば、上流配列は、標的部位の上流約1~約20、約21~40、約41~60、約61~80、又は約81~100個のヌクレオチドに位置するヌクレオチド配列と実質的に配列同一性を共有することができる。一つの実施形態において、標的部位のすぐ下流に(すなわち、標的部位に隣接する)位置するヌクレオチド配列と実質的に配列同一性を共有する。他の実施形態において、下流配列は、標的部位の下流約百(100)個のヌクレオチド内に位置するヌクレオチド配列と実質的に配列同一性を共有する。このように、例えば、下流配列は、標的部位の下流約1~約20、約21~40、約41~60、約61~80、又は約81~100個のヌクレオチドに位置するヌクレオチド配列と実質的に配列同一性を共有することができる。
【0088】
上流又は下流配列は各々、約20個のヌクレオチド~約5000個ヌクレオチドの長さの範囲であり得る。幾つかの実施形態において、上流又は下流配列は、50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、又は5000個のヌクレオチドを含むことができる。例示的な実施形態において、上流又は下流配列は、約50個~約1500個のヌクレオチドの範囲内であってよい。
【0089】
標的ヌクレオチド配列と同様な配列を持つ上流及び下流配列を含むドナーポリヌクレオチドは、直線状又は環状であり得る。ドナーポリヌクレオチドが環状である実施形態において、ドナーポリヌクレオチドはベクターの一部であってよい。例えば、ベクターはプラスミドベクターであってよい。
【0090】
ある実施形態において、ドナーポリヌクレオチドは、Cpf1又はCsm1ポリペプチドによって認識される少なくとも一つの標的開裂部位を更に含んでいてもよい。ドナーポリヌクレオチドに加えられる該標的開裂部位は、ドナー配列の上流又は下流又は上流及び下流両方に位置することができる。例えば、ドナー配列は、標的開裂部位に隣接することができ、それによって、Cpf1又はCsm1ポリペプチドによる開裂の際に、ドナー配列は、Cpf1又はCsm1ポリペプチドによる開裂の際に精製されたヌクレオチド配列と適合するオーバーハングに隣接する。したがって、ドナー配列は、非相同修復プロセスによる二本鎖切断の修復期間、開裂ヌクレオチド配列とライゲートされる(ligated)ことができる。一般的に、標的開裂部位を含んでいるドナーポリヌクレオチドは環状であり得る(例えば、プラスミドベクターの一部であり得る)。
【0091】
ドナーポリヌクレオチドは、Cpf1又はCsm1ポリペプチドによって生成されるオーバーハングと適合する任意の短いオーバーハングを有する短いドナー配列を含んでいる線状分子であり得る。このような実施形態において、ドナー配列は、二本鎖切断の修復の間に開裂染色体配列に直接ライゲートされ得る。幾つかの例において、ドナー配列は、約1000未満、約500未満、約250未満又は約100未満のヌクレオチドであり得る。ある場合には、ドナーヌクレオチドは、平滑末端を有する短いドナー配列を含んでいる線状分子であり得る。他の反復において、ドナーポリヌクレオチドは、5’及び/又は3’オーバーハングを有する短いドナー配列を含んでいる線状分子であり得る。該オーバーハングは、1、2、3、4又は5個のヌクレオチドを含んでいてもよい。
【0092】
幾つかの実施形態において、ドナーポリヌクレオチドは、DNAであろう。DNAは一本鎖又は二本鎖及び/又は線状又は環状であってよい。ドナーポリヌクレオチドは、DNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウィルスベクター、DNAの線状断片、裸の核酸、又はリポソーム又はポロクサマーなど送達ビヒクルと複合化された核酸であってよい。ある実施形態において、ドナー配列を含むドナーポリヌクレオチドは、プラスミドベクターの一部であることができる。これらいずれかの状況において、ドナー配列を含むドナーポリヌクレオチドは、少なくとも一つの追加配列を更に含むことができる。
【0093】
(e)植物細胞への導入
Cpf1又はCsm1ポリペプチド(又はコード核酸)、ガイドRNA(又はコードDNA)、及び任意のドナーポリヌクレオチドは、種々の手段により植物細胞、小器官、又は胚へ導入することができる。ポリペプチド又はポリヌクレオチド配列を植物に導入するための形質転換プロトコル並びにプロトコルは、形質転換の標的とされる植物の種類又は植物細胞、すなわち単子葉植物又は双子葉植物によって様々である。ポリペプチド及びポリヌクレオチドを植物細胞へ導入するのに適した方法は、マイクロインジェクション(Crosswayら(1986)Biotechniques4:320-334)、エレクトロポレーション(Biggsら(1986)Proc.Natl.Acad.USA83:5602-5606、アグロバクテリウム媒介形質転換(米国特許第5563055号明細書及び米国特許第5981840号明細書)、直接遺伝子転移(Paszkowskiら(1984)EMBO J. 3:2717-2722)、及び弾道粒子加速(例えば、米国特許第4945050号明細書;米国特許第5879918号明細書;米国特許第5886244号明細書;及び第5932782号明細書;Tomesら(1995)in Plant Cell、Tissue、and Organ Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag、Berlin);MaCabeら(1988)Biotechnology 6:923-926);及びレクチン変換(国際公開第00/28058号)を含んでいる。更なる参照は、Weissingerら(1988)Ann.Rev.Genet. 22:421-477;Sanfordら(1987)Particulate Science and Technology 5:27-37(玉ねぎ);Christouら(1988)Plant Physiol 87:671-674(大豆);McCabeら(1988)Bio/Technology 6:923-926(大豆);Finer and McMullen(1991)In Vitro Cell Dev. Biol. 27p:175-182(大豆);Singhら(1998)Theor. Appl. Genet. 96:319-324(大豆);Dattaら(1990)Biotechnology 8:736-740(イネ);Kleinら(1988)Proc. Natl. Acad.Sci.USA 85:4305-4309(トウモロコシ);Kleinら(1988)Biotechnology 6:559-563(トウモロコシ);米国特許第5240855号明細書;第5322783号明細書;及び第5324646号明細書;Kleinら(1988)Plant Physiol 91:440-444(トウモロコシ);Frommら(1990)Biotechnology 8:833-839(トウモロコシ);Hooykaas-Van Slogterenら(1984)Nature(London) 311:763-764;米国特許第5736369号明細書(穀物);Bytebierら(1987)Proc. Natl. Acad. Sci. USA 84:5345-5349(ユリ科);De Wetら(1985)in The Experimental Manipulation of Ovule Tissues,ed. Chapmanら(Longman、New York)、pp.197-209(花粉);Kaepplerら(1990)Plant Cell Reports 9:415-418及びKepplerら(1992)Theor. Appl. Genet. 84:560-566(ウィスカー媒介形質転換);D’Halluinら(1992)Plant Cell 4:1495-1505(エレクトロポレーション);Liら(1993)Plant Cell Reports 12:250-255及びChristonとFord(1995)Annals of Botany 75:407-413(イネ);Osjodaら(1996)Nature Biotechnology14:745-750(Agrobacterium tumefacienによるトウモロコシ)があり、これらの全ては、本明細書に参照として援用される。ヌクレアーゼ及び適したガイドRNAを含んでいるリボ核酸タンパク質の遺伝子銃での導入による植物細胞の部位特異的ゲノム編集が実証されている(Svitashevら(2016)Nat Commun doi:10.1038/ncomms13274);これらの方法は、本明細書に参照として援用される。「安定な形質転換」は、植物へ導入されたヌクレオチドコンストラクトは植物のゲノム内に組み込まれその子孫に受け継がれることができることを意味する意図がある。ヌクレオチドコンストラクトは、植物の核、色素体、又はミトコンドリアゲノムへ組み込まれてもよい。色素体形質転換の方法は、当該分野で知られている(例えば、Chloroplast Biotechnology:Methods and Protocols(2014)Pal Maliga、ed.と米国特許出願第2011/0321187号明細書参照)、又植物ミトコンドリア形質転換の方法は、当該分野で開示されている(例えば、米国特許出願第2011/0296551号明細書参照)、これらは参照として援用される。
【0094】
形質転換された細胞は、従来の方法に従って植物内で成長させる(すなわち、培養される)ことができる。例えば、McCormickら(1986)Plant Cell Reports 5:81-84参照。このように、本発明は、そのゲノムに安定的に組み込まれた核酸改変を有する形質転換された種子(「トランスジェニック種子」とも言う)を提供する。
【0095】
核酸フラグメント(例えば、組換えDNAコンストラクト)を細胞へ挿入するという文脈で「導入される」とは「トランスフェクション」又は「形質転換」又は「形質導入」を意味し、また、核酸フラグメントが細胞のゲノム(例えば、核染色体、プラスミド、色素体染色体又はミトコンドリア染色体)中に組み込まれているか、自律的レプリコンに変換されているか、又は一時的に発現(例えばtランスフェクとされたmRNA)されていてもよい植物細胞、その植物細胞中への該核酸フラグメントの組込みも含んでいる。
【0096】
本発明は、限定はされないが、単子葉植物及び双子葉植物(すなわち、それぞれ単子葉及び双子葉)を含む任意の植物種の形質転換のために採用することができる。興味の対象の植物種の例としては、限定はされないが、トウモロコシ(Zea mays)、アブラナ属(例えば、B.napus、B.rapa、B.Juncea)、特に種油の原料として有用なアブラナ属、アルファルファ(Medicago sativa)、イネ(Oryza sativa)、ライムギ(Secale cereale)、ソルガム(Sorghum bicolor、Sorghum vulgare)、キビ(例えば、パールミレット(Pennisetum glaucum)、プロソミレット(Panicummiliaceum)、アワ(Setaria italica)、フィンビ(Eleusine coracana))、ヒマワリ(Helianthus annuus)、ベニバナ(Carthamus tinctorius)、コムギ(Triticum aestivum)、大豆(Glycine max)、タバコ(Nicotiana tabacum)、ジャガイモ(Solanum tuberosum)、ピーナッツ(Arachis hypogaea)、メンカ(Gossypium barbadense、Gossypium hirsutum)、サツマイモ(Ipomoea batatus)、キャッサバ(Manihot esculenta)、コーヒー(Coffea spp.)、ココナッツ(Cocos nucifera)、パイナップル(Ananas comosus)、柑橘類の木(Citrus spp.)、ココア(Theobroma cacao)、茶(Camellia sinensis)、バナナ(Musaspp.)、アボカド(Persea americana)、イチジク(Ficus casica)、グァバ(Psidiumguajava)、マンゴー(Mangifera indica)、オリーブ(Olea europaer)パパイヤ(Carica papaya)、カシューナッツ(Anacardium occidentale)、マカダミア(Macadamia integrifolia)、アーモンド(Prunus amygdalus)、甜菜(Beta vulgaris)、サトウキビ(Saccharum spp.)、アブラヤシ(Elaeis guineensis)、ポプラ(Populus spp.)、ユーカリ(Eucalyptus spp.)、燕麦(Avena sativa)、オオムギ(Hordeum vulgare)、野菜、観賞用植物、及び針葉樹が挙げられる。
【0097】
Cpf1又はCsm1ポリペプチド(又はコード核酸)、ガイドRNA(又はガイドRNAをコードするDNA)及び任意のドナーポリヌクレオチドは、植物細胞、小器官、又は胚に同時に又は順次導入することができる。Cpf1ポリペプチド(又はコード核酸)のガイドRNA(コードDNA)に対する比は一般的にほぼ化学量論的になり、それによってその二つの成分は標的DNAを有するRNA-タンパク質複合体を形成することができる。一つの実施形態において、Cpf1又はCsm1ポリペプチドをコードするDNA及びガイドRNAをコードするDNAはプラスミドベクター内に共に送達される。
【0098】
本明細書に開示されている組成物及び方法は、光合成に関与する遺伝子など、植物内の興味の対象の遺伝子の発現を変更するために用いることができる。それ故、光合成に関与するタンパク質をコードする遺伝子の発現は、対照の植物と較べ改変されていてもよい。「対象植物又は植物細胞」は、興味の対象の遺伝子に関して突然変異など、遺伝子的変更が実行されたもの、又はその様に改変された植物又は細胞に由来する植物又は植物細胞であり変更を含んでいるものである。「対照」又は「対照植物」又は「対照植物細胞」は、対象植物又は植物細胞の表現型の変化を測定するための参照点を提供する。このように、発現レベルは、本発明の方法に依り対照植物におけるものより高いまたは低い。
【0099】
対照植物又は植物細胞は、例えば、(a)野生型植物又は細胞、すなわち、対象植物又は細胞をもたらす遺伝子改変のための出発物質と同じ遺伝子型の植物又は植物細胞;(b)出発物質と同じ遺伝子型の植物又は植物細胞であるが、無効のコンストラクト(すなわち、マーカー遺伝子を含むコンストラクトなど、興味の対象の形質に影響を及ぼさないコンストラクト)によって形質玄関された植物又は植物細胞;(c)対象植物又は細胞の子孫間で非形質転換分離体である植物又は植物細胞;(d)対象植物又は細胞と遺伝的に同一であるが、興味の対象の遺伝子発現を誘導する条件又は刺激に暴露されていない植物又は植物細胞;又は(e)興味の対象の遺伝子が発現されない条件下の対象植物又は細胞そのもの。
【0100】
本発明は、形質転換植物に関して記載されているが、本発明の形質転換された生物は、植物細胞、植物プロトプラスト、そこで植物が再生することができる植物細胞組織培養物、植物カルス、植物塊、及び胚、花粉、卵子、種子、葉、花、枝、果実、穀粒、穂、穂軸、殻、茎、根、根の先端、葯等の植物又は植物の部分において無傷の植物細胞を含んでいることを認識されたい。穀物とは、種を栽培するか又は再生させるかする以外の目的で商業生産者によって生成された成熟した種子を意味することを意図している。再生された植物の子孫、変異体、及び突然変異体もまた、もしこれらの部分が導入されたポリヌクレオチドを含んでいるならば、本発明の範囲内に含まれている。
【0101】
(f)植物配列を改変するため又は植物配列の発現を調節するための融合タンパク質の利用法
本明細書に開示されている方法は、植物細胞、植物小器官、又は植物胚におけるヌクレオチド配列の改変又はヌクレオチド配列の発現の調節を更に含んでいる。該方法は、植物細胞または植物胚を少なくとも一つの融合タンパク質又は少なくとも一つの融合タンパク質をコードする核酸内に導入することを含んでおり、ここで該融合タンパク質は、Cpf1又はCsm1ポリペプチド又はそれらの断片又は変異体とエフェクタードメイン及び(b)少なくとも一つのガイドRNA又はガイドRNAをコードするDNAを含むものであり、ここで該ガイドRNAは、該融合タンパク質のCpf1又はCsm1ポリペプチドを蚕食体配列における標的部位に導くものであり、又該融合タンパク質のエフェクタードメインは染色体配列を改変するか又は染色体配列の発現を調節するものである。
【0102】
Cpf1又はCsm1ポリペプチド又はそれらの断片又は変異体とエフェクタードメインを含んでいる融合タンパク質が、本明細書に述べられている。一般的に、本明細書に開示されている該融合タンパク質は、更に少なくとも一つの核局在化シグナル、プラスチドシグナルペプチド、ミトコンドリアシグナルペプチド又はタンパク質を複数の細胞内位置に輸送することができるシグナルペプチドを更に含み得る。融合タンパク質をコードする核酸が、本明細書に述べられている。幾つかの実施形態において、該融合タンパク質は、単離された融合タンパク(これは更に細胞浸透ドメインを含み得る)として細胞又は胚に導入される。更に、単離された融合タンパク質は、ガイドRNAを含んでいるタンパク質-RNA複合体の部分であり得る。他の実施形態において、該融合タンパク質は、RNA分子(これはキャップされている及び/又はポリアデニル化されている)として細胞又は胚に導入され得る。更に他の実施形態において、該融合タンパク質は、DNA分子として細胞又は胚に導入され得る。例えば、該融合タンパク質及びガイドRNAは、別々のDNA分子又は同じDNA分子の一部として細胞又は胚に導入され得る。その様なDNA分子は、プラスミドベクターであり得る。
【0103】
幾つかの実施形態において、本明細書の他のところに記載されているように、少なくとも一つのドナーポリヌクレオチドを細胞、小器官又は胚に導入することを含んでいる。植物細胞、小器官、又は植物胚へ分子を導入する手段、並びに細胞(小器官を含む細胞を含む)又は胚を倍良する手段が、本明細書に記載されている。
【0104】
該融合タンパクのエフェクタードメインが開裂ドメインである、ある実施形態において、該方法は、植物細胞、小器官、又は胚に一つの融合タンパク質(又は一つの融合タンパク質をコードする核酸)及び二つのガイドRNA(又は二つのガイドRNAをコードするDNA)を導入することを含むことができる。二つのRNAは、該融合タンパク質を染色体配列における二つの異なる標的部位に向けるものであるが、ここで該融合タンパク質は二量体化し(例えば、ホモダイマーを形成し)それによって二つの開裂ドメインは染色体配列に二本鎖切断を導入することができる。任意のドナーポリヌクレオチドが存在しない実施形態において、染色体配列における二本鎖切断は非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが起こりやすいので、少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復の間に起こり得る。したがって、標的化された染色体配列は改変又は不活性化され得る。例えば、単一のヌクレオチド(SNP)は、変化したタンパク質産物の増加をもたらし得る又は、コード化配列のリーディングフレームのシフトは、タンパク質産物が作られないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチドおけるドナー配列は、二重切断の修復中、標的部位において、染色体配列と交換又は染色体配列に組み込まれ得る。例えば、ドナー配列が染色体配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において、該ドナー配列は、相同性志向修復プロセスによって仲介される修復の間に、標的部位の染色体配列と交換又は染色体配列に組み込まれ得る。あるいは、ドナー配列が互換性オーバーハングに隣接する(あるいは、互換性オーバーハングがその場でCpf1又はCsm1ポリペプチドによって生成される)実施形態において、該ドナー配列は、二重切断の修復中非相同性修復プロセスによって、開裂された染色体配列と直接にライゲートされ得る。ドナー配列の染色体配列との交換又は染色体配列への組み込みは、標的染色体配列を改変するか又は外因性配列を植物細胞、小器官、又は胚の標的染色体配列に導入することになる。
【0105】
融合タンパク質のエフェクタードメインが開裂ドメインである他の実施形態において、該方法は、二つの異なる融合タンパク質(又は二つの異なる融合タンパク質をコードする核酸)及び二つのガイドRNA(又は二つのガイドRNAをコードするDNA)を植物細胞、小器官、又は胚へ導入することができる。該融合タンパク質は、本明細書の他のところに記載されているように異なっている。各RNAは、染色体配列における特定の標的部位に融合タンパク質を向けさせるが、そこで該融合タンパク質は二つの開裂ドメインが染色体配列中に二本鎖切断を導入することができるように二量体化できる(例えば、ヘテロダイマーを形成することができる)。任意のドナーポリヌクレオチドが存在しない実施形態において、得られる二本鎖切断は、切断の修復の間に少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが発生し得るように非相同性修復プロセスによって修復され得る。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチドにおけるドナー配列は、相同性に基づく修復プロセス(例えば、ドナー配列が染色体配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において)又は非相同性修復プロセス(例えば、ドナー配列が互換性のあるオーバーハングに隣接している実施形態において)のいずれかによる二本鎖切断の修復の間、染色体配列と交換されるか又は染色体配列に組み込むことができる。
【0106】
融合タンパク質のエフェクタードメインが転写活性化ドメイン又は転写リプレッサードメインである、ある実施形態において、該方法は、一つの融合タンパク質(又は一つの融合タンパク質をコードする核酸)及び一つのガイドRNA(又は一つのガイドRNA)を植物細胞、小器官、又は胚に導入することを含むことができる。ガイドRNAは、特定の染色体配列に融合タンパク質を向けさせるが、ここで転写活性化ドメイン又は転写リプレッサードメインは、標的化された染色体配列近くに位置する一つまたは複数の遺伝子の発現をそれぞれ活性化するまたは抑制する。すなわち、転写は、標的化された染色体配列に近接した遺伝子に対して影響されてもよく又は標的化された染色体配列から遠くの位置にある遺伝子に対して影響されてもよい。遺伝子転写は、転写開始部位から数千塩基離れて位置する配列によっても、又は別の染色体上でも調節できることは当該分野で公知である。(HarmstonとLenhard(2013)Nucleic Acids Res41:7185-7199)。
【0107】
融合タンパク質のエフェクタードメインが、エピジェネティック改変ドメインである別の実施形態において、該方法は、植物細胞、小器官、又は胚に一つの融合タンパク質(又はひとつの融合タンパク質をコードする核酸)及び一つガイドRNA(又は一つのガイドRNAをコードするDNA)を導入することを含むことができる。ガイドRNAは、融合タンパク質を特定の染色体配列に向けさせ、ここでエピジェネティック改変ドメインは、標的化された染色体配列の構造を改変する。エピジェネティック改変は、タンパク質のアセチル化、メチル化及び/又はヌクレオチドのメチル化を含んでいる。幾つかの例において、染色体配列の構造的改変は、染色体配列の発現における変化につながる。
【0108】
V.遺伝子改変を含む植物及び植物細胞
提供されているのは、本明細書に記載されているCpf1又はCsm1ポリペプチド媒介又は融合タンパク質媒介プロセスを採用することによって改変された少なくとも一つのヌクレオチド配列を含んでいる植物細胞、植物小器官、及び植物胚である。更に提供されているのは、興味の対象の染色体配列又は融合タンパク質に向けられたCpf1又はCsm1ポリペプチド又は融合タンパク質をコードする少なくとも一つのDNA又はRNA分子、少なくとも一つのガイドRNA、及び任意に一つ以上のドナーポリヌクレオチドを含んでいる植物細胞、小器官、および植物胚である。本明細書に開示されている遺伝子的に改変された植物は、改変されたヌクレオチド配列に対してヘテロ接合性であり得るか又は改変されたヌクレオチド配列に対してホモ接合的であり得る。一つ以上の遺伝子的改変を小器官DNAに含んでいる植物細胞は、ヘテロプラスミー又はホモプラスミーである。
【0109】
植物、植物小器官、又は植物細胞の改変された染色体配列は、不活性化されるよう、発現がアップレギュレート又はダウンレギュレートされるよう、又は改変されたタンパク質を生成するように改変されてもよく、又は組み込まれた配列を含んでいる。改変された染色体配列は、該配列が転写されないように不活性化されてもよく、及び/又は機能性タンパク質産物は生産されない。このように、不活性化された染色体配列を含む遺伝子的に改変された植物は、「ノックアウト」又は「条件付きノックアウト」と名付けてもよい。不活性化された染色体配列は、欠失突然変異(すなわち、一つ以上のヌクレオチドの欠失)、挿入突然変異(すなわち、一つ以上のヌクレオチドの挿入)、無意味な突然変異(すなわち、一つ以上のヌクレオチド終止コドンが導入されるように他のヌクレオチドのために単一ヌクレオチドの置換)を含んでいてもよい。突然変異の結果として、標的化された染色体配列は、不活性化され機能性タンパク質は生産されない。不活性化された染色体配列は、外因的に導入された配列を含んでいない。本明細書には、2、3、4、5、6、7、8、9、10又はそれ以上の染色体配列が不活性化されている遺伝子的に改変された植物も含まれている。
【0110】
改変された染色体配列は、変異体タンパク質産物をコードするように変化させることもできる。例えば、改変された染色体配列を含む遺伝子的に改変された植物は、改変されたタンパク質産物が生成されるように標的点突然変異又は他の突然変異を含み得る。一つの実施形態において、該染色体配列は、少なくとも一つのヌクレオチドが変化されるように、又発現されたタンパク質産物が一つの変化されたアミノ酸残基(ミスセンス突然変異)を含んでいるように改変され得る。別の実施形態において、染色体配列は、一つより多くのアミノ酸が変化させられるように一つより多くのミスセンス突然変異を含むために改変され得る。加えて、染色体配列は、発現されたタンパク質が単一のアミノ酸欠失又は挿入を含むように三つのヌクレオチド欠失または挿入を有するために改変され得る。改変された又は変異体タンパク質は、改変された基質特異性、改変された酵素活性、改変された反応速度など、野生型タンパク質と比べ、改変された性質又は活性をもち得る。
【0111】
幾つかの実施形態において、遺伝子的に改変された植物は、少なくとも一つの染色体に組み込まれたヌクレオチド配列を含むことができる。組み込まれた配列を含む遺伝子的に改変された植物は、「ノックイン」又は「条件的ノックイン (conditional knock in)」と名付けてもよい。組み込まれた配列であるヌクレオチド配列は、例えば、オーソロガスタンパク質、内因性タンパク質、又は両方の組み合わせをコードすることができる。一つの実施形態において、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、染色体配列が非活性化されるが、外因性配列は発現されるように、タンパク質をコードする核又は小器官染色体配列に組み込まれ得る。その様な場合、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、プロモーター制御配列に操作可能に連結することができる。あるいは、オーソロガスタンパク質又は内因性タンパク質をコードする配列は、染色体配列の発現に影響を与えずに核又は小器官染色体配列に組み込まれる。例えば、タンパク質をコードする配列は、「安全な港 (safe harbor)」の座に組み込まれ得る。本開示は、また、タンパク質をコードする配列を含む、2、3、4、5、6、7、8、9、10、又はそれ以上の配列がゲノム中に組み込まれている遺伝子的に改変された植物を含んでいる。本明細書に開示されているように、興味の対象のいかなる遺伝子も、植物核又は小器官の染色体配列に導入され組み込まれ得る。特定の実施形態において、植物の成長又は生産を増加させる遺伝子が、染色体に組み込まれている。
【0112】
タンパク質をコードする染色体上に組み込まれた配列は、興味の対象のタンパク質の野生型をコードできる、又は改変バージョンのタンパク質が生産されるように少なくとも一つの改変を含むタンパク質をコードすることができる。例えば、病気又は障害に関連するタンパク質をコードする染色体上に組み込まれた配列は、生産された改変バージョンのタンパク質が関連する障害を引き起こす又は増強するように少なくとも一つの改変を含んでもよい。あるいは、病気又は障害に関連するタンパク質をコードする染色体上に組み込まれた配列は、生産された改変バージョンのタンパク質が関連する病気又は障害の発症から植物を守るように少なくとも一つの改変を含むことができる。
【0113】
ある実施形態において、遺伝子的に改変された植物は、タンパク質の発現パターンが改変されるように、タンパク質をコードする少なくとも一つの改変された染色体配列を含むことができる。例えば、プロモーター又は転写遺伝子結合部位のような、タンパク質の発現を制御する調節領域は、タンパク質が過剰発現されるように又はタンパク質の組織特異性又は一時的な発現が改変されるように又はそれらの組み合わせであるように、改変することができる。あるいは、タンパク質の発現パターンは、条件的ノックアウト系を用いて改変することができる。条件的ノックアウト系の例としては、制限はされないが、Cre-lox組換えシステムを含んでいる。Cre-lox組換えシステムは、Cre組換え酵素、すなわち、核酸分子中の特定の部位(lox部位)間の核酸配列の組換えを触媒できる部位特異性DNAリコンビナーゼ、を含んでいる。一時的及び組織特異的発言を生ずるこの系を用いる方法は、当該分野で公知である。
【0114】
VI.非植物性真核生物ゲノムにおけるヌクレオチド配列を改変する方法及び遺伝子改変を含む非植物性真核生物細胞
非植物性真核生物細胞又は非植物性真核生物小器官のヌクレオチド配列を改変するための方法が、本明細書において提供されている。該方法は、(a)標的DNAにおける配列を補足するヌクレオチド配列を含む第一のセグメント及び(b)Cpf1又はCsm1ポリペプチドと相互作用を引き起こす第二のセグメントを含むDNA標的化RNA、このDNA標的化RNA又はこのDNA標的化RNAをコードするDNAポリヌクレオチドを標的細胞又は小器官に導入すること、及び(a)DNA標的化RNAと相互作用を引き起こすRNA結合部分及び(b)部位特異的酵素活性を示す活性部分を含む該Cpf1又はCsm1ポリペプチド、この該Cpf1又はCsm1ポリペプチド又はこのCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドを標的細胞又は小器官に導入することも含んでいる。該標的細胞又は小器官は、次にキメラヌクレアーゼポリペプチドが発現しヌクレオチド配列を開裂する条件下で培養され得る。本明細書に記載されている系は、外因性Mg2+又はその他のイオンの添加を必要としないことに留意されたい。最後に、改変されたヌクレオチド配列を含む非植物性真核生物細胞又は小器管を選ぶことができる。
【0115】
幾つかの実施形態において、該方法は、一つのCpf1又はCsm1ポリペプチド(又はコードする核酸)及び一つのガイドRNA(又はコードするDNA)を、非植物性真核生物細胞又は小器官に導入することを含み、ここで該Cpf1又はCsm1ポリペプチドは、核又は小器官の染色体DNAの標的ヌクレオチド配列に一つの二本鎖切断を導入する。幾つかの実施形態において、該方法は、一つのCpf1又はCsm1ポリペプチド(又はコード化核酸)及び少なくとも一つのガイドRNA(又はコード化DNA)を、非植物性真核生物細胞又は小器官に導入することを含むことができ、ここで該Cpf1又はCsm1ポリペプチドは、核又は小器官染色体DNAの標的ヌクレオチド配列において一つ以上の二本鎖切断(すなわち、2、3、又は3より多い二本鎖切断)を導入するものである。任意のドナーポリヌクレオチドが存在しない実施形態において、ヌクレオチド配列における該二本鎖切断は、非相同末端結合(NHEJ)修復プロセスにより修復することができる。NHEJはエラーが起こりやすいので、少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復の間に起こり得る。したがって、標的化されたヌクレオチド配列は改変又は不活性化され得る。例えば、単一のヌクレオチド(SNP)は、変化したタンパク質産物の増加をもたらし得る又は、コード化配列のリーディングフレームのシフトは、タンパク質産物が作られないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチドおけるドナー配列は、二本切断の修復中、標的部位において、ヌクレオチド配列と交換又はヌクレオチド配列に組み込まれ得る。例えば、ドナー配列が非植物性真核生物細胞又は小器官のヌクレオチド配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において、該ドナー配列は、相同性志向修復プロセスによって仲介される修復の間に、標的部位のヌクレオチド配列と交換又はヌクレオチド配列に組み込まれ得る。あるいは、ドナー配列が互換性オーバーハングに隣接する(あるいは、互換性オーバーハングがその場でCpf1又はCsm1ポリペプチドによって生成される)実施形態において、該ドナー配列は、二重切断の修復中非相同性修復プロセスによって、切断されたヌクレオチド配列と直接に結合され得る。ドナー配列のヌクレオチド配列との交換又はヌクレオチド配列への組み込みは、標的ヌクレオチド配列を改変するか又は外因性配列を非植物性真核生物細胞は小器官の標的ヌクレオチド配列に導入することになる。
【0116】
幾つかの実施形態において、Cpf1又はCsm1ヌクレアーゼの作用によって引き起こされた二本鎖切断は、DNAが非植物性真核生物細胞又は小器官の染色体から欠失されるような方法に依って修復される。幾つかの実施形態において、一つの塩基、数個の塩基(すなわち、2、3、4、5、6、7、8、9、または10個の塩基)、又はDNAの大きな区画(すなわち、10以上、50以上、100以上、又は500以上の塩基)が、非植物性真核生物細胞又は小器官の染色体から欠失される。
【0117】
幾つかの実施形態において、非植物性真核遺伝子の発現は、Cpf1又はCsm1ヌクレアーゼによって引き起こされた二本鎖切断の結果として、改変することができる。幾つかの実施形態において、非植物性真核遺伝子の発現は、Cpf1又はCsm1ヌクレアーゼを二本鎖切断が作り出せないようにする突然変異を含む変異体Cpf1又はCsm1酵素によって改変され得る。幾つかの好ましい実施形態において、Cpf1又はCsm1ヌクレアーゼを二本鎖切断が作り出せないようにする突然変異を含む変異体Cpf1又はCsm1ヌクレアーゼは、転写活性化又は転写不活性化ドメインに融合させてもよい。
【0118】
幾つかの実施形態において、Cpf1又はCsm1ヌクレアーゼの作用によって引き起こされた、核及び/又は小器官染色体DNAにおける突然変異を有する真核生物細胞は、培養され真核生物を生成する。幾つかの実施形態において、一つの以上のCpf1又はCsm1ヌクレアーゼ又は一つ以上の変異体Cpf1又はCsm1ヌクレアーゼの結果として遺伝子発現が改変されている真核生物細胞は、培養され真核生物を生成する。真核生物を生成するための非植物性真核生物細胞を培養する方法は、当該分野、例えば米国特許出願第2016/0208243号明細書及び第2016/0138008号明細書において公知であり、本明細書に参照として援用される。
【0119】
本発明は、限定はされないが、動物(限定はされないが、哺乳動物、昆虫、魚、鳥、及び爬虫類を含む)、菌類、アメーバ、及び酵母などいずれであっても真核種の形質転換のために採用することができる。
【0120】
非植物性真核生物細胞又は小器官へのヌクレアーゼタンパク質、ヌクレアーゼタンパク質をコードするDNA又はRNA分子、ガイドRNA又はガイドRNAをコードするDNA分子、及び任意のドナー配列DNA分子の導入の方法は、当該分野、例えば米国特許出願第2016/0208243号明細書において、公知であり、本明細書に参照として援用される。工業的応用において特別な価値があり得る非植物性真核生物細胞又は小器官への例示的な遺伝子改変もまた当該分野、例えば米国特許出願第2016/0208243号明細書において、公知であり、本明細書に参照として援用される。
【0121】
VII.原核生物ゲノムにおけるヌクレオチド配列を改変する方法及び遺伝子改変を含む原核生物細胞
原核(例えば、細菌又は古細菌)細胞のヌクレオチド配列を改変するための方法が本明細書において提供されている。該方法は、標的細胞に、DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチドを導入することを含んでおり、ここで、該DNA標的化RNAは(a)標的DNAにおける配列を補足するヌクレオチド配列を含む第一のセグメント及び(b)Cpf1又はCsm1ポリペプチドと相互作用を引き起こす第二のセグメントを含むものであり、更にまた該標的細胞に、Cpf1又はCsm1ポリペプチド又はCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドを導入することも含んでおり、ここで該Cpf1又はCsm1ポリペプチドは、(a)DNA標的化RNAと相互作用を起こすRNA結合部分及び(b)部位特異的酵素活性を示す活性部分を含んでいる。標的細胞は次に、Cpf1又はCsm1ポリペプチドが発現されヌクレオチド配列を開裂する条件下で培養される。本明細書に記載されている系は、外因性Mg2+又はその他のイオンの添加を必要としないことに留意されたい。最後に、改変されたヌクレオチド配列を含む原核生物細胞を選択することができる。更に、改変されたヌクレオチド配列を含む原核生物細胞は、興味の対象のCpf1又はCsm1ポリペプチドをコードするポリヌクレオチドの天然の宿主細胞ではないこと、また天然には存在しないガイドRNAが原核ヌクレオチド配列における所望の変化を実行するために用いられることに留意されたい。更に、標的化されたDNAは、原核染色体の一部として存在しているかもしれず又は原核生物細胞における一つ以上のプラスミド又はその他の非染色体DNA分子上に存在しているかもしれないことに留意されたい。
【0122】
幾つかの実施形態において、該方法は、一つのCpf1又はCsm1ポリペプチド(又はコード化核酸)及び一つのガイドRNA(又はコード化DNA)を原核生物細胞へ導入することを含むことができ、ここで該Cpf1又はCsm1ポリペプチドは、原核生物細胞DNAの標的ヌクレオチド配列において一つの二本鎖切断を導入するものである。幾つかの実施形態において、該方法は、一つのCpf1又はCsm1ポリペプチド(又はコード化核酸)及び少なくとも一つのガイドRNA(又はコード化DNA)を原核生物細胞へ導入することを含むことができ、ここで該Cpf1又はCsm1ポリペプチドは、原核生物細胞DNAの標的ヌクレオチド配列において一つより多くの二本鎖切断(すなわち、2、3、又は3より多くの二本鎖切断)を導入するものである。任意のドナーポリヌクレオチドが存在しない実施形態において、ヌクレオチド配列における二本鎖切断は、非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーが起こりやすいので、少なくとも一つのヌクレオチドの欠失、少なくとも一つのヌクレオチドの挿入、少なくとも一つのヌクレオチドの置換、又はそれらの組み合わせが、切断の修復の間に起こり得る。したがって、標的化されたヌクレオチド配列は改変又は不活性化され得る。例えば、単一のヌクレオチド(SNP)は、変化したタンパク質産物の増加をもたらし得る又は、コード化配列のリーディングフレームのシフトは、タンパク質産物が作られないように配列を不活性化又は「ノックアウト」し得る。任意のドナーポリヌクレオチドが存在する実施形態において、ドナーポリヌクレオチドおけるドナー配列は、二本切断の修復中、標的部位において、ヌクレオチド配列と交換又はヌクレオチド配列に組み込まれ得る。例えば、ドナー配列が原核生物細胞のヌクレオチド配列における標的部位の上流及び下流の配列とそれぞれ実質的な配列同一性を持ち、上流及び下流の配列に隣接する実施形態において、該ドナー配列は、相同性志向修復プロセスによって仲介される修復の間に、標的部位のヌクレオチド配列と交換又は染色体配列に組み込まれ得る。あるいは、ドナー配列が互換性オーバーハングに隣接する(あるいは、互換性オーバーハングがその場でCpf1又はCsm1ポリペプチドによって生成される)実施形態において、該ドナー配列は、二重切断の修復中、非相同性修復プロセスによって、切断されたヌクレオチド配列と直接に結合され得る。ドナー配列のヌクレオチド配列との交換又はヌクレオチド配列への組み込みは、標的ヌクレオチド配列を改変するか又は外因性配列を原核生物細胞DNAの標的ヌクレオチド配列に導入することになる。
【0123】
幾つかの実施形態において、Cpf1又はCsm1ヌクレアーゼの作用によって引き起こされた二本鎖切断は、DNAが原核生物細胞DNAから欠失されるような方法に依って修復される。幾つかの実施形態において、一つの塩基、数個の塩基(すなわち、2、3、4、5、6、7、8、9、または10個の塩基)、又はDNAの大きな区画(すなわち、10以上、50以上、100以上、又は500以上の塩基)が、原核生物細胞DNAから欠失される。
【0124】
幾つかの実施形態において、原核遺伝子の発現は、Cpf1又はCsm1ヌクレアーゼによって引き起こされた二本鎖切断の結果として改変され得る。幾つかの実施形態において、原核遺伝子の発現は、Cpf1又はCsm1ヌクレアーゼを二本鎖切断が作り出せないようにする突然変異を含む変異体Cpf1又はCsm1ヌクレアーゼによって改変され得る。幾つかの好ましい実施形態において、Cpf1又はCsm1ヌクレアーゼを二本鎖切断が作り出せないようにする突然変異を含む変異体Cpf1又はCsm1ヌクレアーゼは、転写活性化又は転写不活性化ドメインに融合させてもよい。
【0125】
本発明は、制限はされないが、シアノバクテリア、コリネバクテリウム属(Corynebacterium属)、ビフィドバクテリウム属(Bifidobacterium属)、マイコバクテリウム属(Mycobacterium属)、ストレプトマイシン属(Streptomyces属)、サーモビフィダ属(Thermobifida属)、クラミジア属(Chlamydia属)、プロクロロコッカス属(Prochlorococcus属)、シネココッカス属(Synechococcus属)、サーモシネココッカス属(Thermosynechococcus属)、サーマス属(Thermus属)、バチルス属(Bacillus属)、クロストリジウム属(Clostridium属)、ゲオバシルス属(Geobacillus属)、ラクトバシルス属(Lactobacillus属)、リステリア属(Listeria属)、スタフィロコッカス属(Staphylococcus属)、ストレプトコッカス属(Streptococcus属)、フソバクテリウム属(Fusobacterium属)、アグロバクテリウム属(Agrobacterium属)、ブラディリゾビウム属(Bradyrhizobium属)、エーリキア属(Ehrlichia属)、メソリゾビウム属(Mesorhizobium属)、ニトロバクター属(Nitrobacter属)、リケッチア属(Rickettsia属)、ウルバチア属(Wolbachia属)、ザイモモナス属(Zymomonas属)、バークホルデリア属(Burkholderia属)、ナイセリア属(Neisseria属)、ラルストニア属(Ralstonia属)、アジネトバクター属(Acinetobacter属)、アーウィニア属(Erwinia属)、エシェリキアコリ属(Escherichia属)、ハエモフィラス属(Haemophilus属)、レジオネラ属(Legionella属)、パステウレラ属(Pasteurella属)、シュードモナス属(Pseudomonas属)、シコロバクター属(Psychrobacter属)、サルモネラ属(Salmonella属)、シュワネラ属(Shewanella属)シゲラ属(Shigella属)、ビブリオ属(Vibrio属)、キサントモナス属(Xanthomonas属)、キシラ属(Xylella属)イェルシニア属(Yersinia属)、カンピロバクター属(Campylobacter属)、デサルフォビブリオ属(Desulfovibrio属)、ヘリコバクター属(Helicobacter属)、ゲオバクター属(Geobacter属)、レプトスピラ属(Leptospira属)、トレポネーマ属(Treponema属)、マイコプラズマ属(Mycoplasma属)、及びサーモトガ属(Thermotoga属)を含む、原核生物種のいずれかの形質転換のために用いることができる。
【0126】
ヌクレアーゼタンパク質、ヌクレアーゼタンパク質をコードするDNA又はRNA、ガイドRNA又はガイドRNAをコードするDNA、及び任意のドナー配列DNA分子を、原核生物細胞又は小器官へ導入する方法は、例えば米国特許出願第2016/0208243にあるように、当該分野で公知であり、本明細書に参照として援用される。工業的応用において特別な価値があり得る原核生物細胞への例示的な遺伝子改変もまた当該分野、例えば米国特許出願第2016/0208243号明細書において、公知であり、本明細書に参照として援用される。
【0127】
本明細書において言及される全ての刊行物及び特許出願は、本発明の属する分野における当業者の技術レベルを示すものである。全ての刊行物及び特許出願は、個々の刊行物又は特許出願が具体的かつ個別に示されているのと同程度の範囲内で、本明細書に参照として援用される。
【0128】
上述の通り本発明は、理解を明確にするため解説及び例示によって詳細に記載されているが、添付の特許請求の範囲内である種の変更および修正ができることは明らかであろう。
【0129】
本発明の実施形態は以下のものを含んでいる。
【0130】
1.
真核生物細胞のゲノム中の標的部位でヌクレオチド配列を改変する方法であって、
前記真核生物細胞に以下の(i)及び(ii)を導入する工程を含む、方法:
(i)DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで前記DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第一のセグメントと(b)Cpf1又はCsm1ポリペプチドと相互作用する第二のセグメントとを含む;
(ii)Cpf1又はCsm1ポリペプチド、あるいはCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド、ここで、前記Cpf1又はCsm1ポリペプチドは、(a)DNA標的化RNAと相互作用をするRNA結合部分と(b)部位特異的酵素活性を示す活性部分とを含む。
【0131】
2.
原核生物細胞のゲノム中の標的部位でヌクレオチド配列を改変する方法であって、
前記原核生物細胞に以下の(i)及び(ii)を導入する工程を含む、方法:
(i)DNA標的化RNA又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで前記DNA標的化RNAは、(a)標的DNAの配列に相補的なヌクレオチド配列を含む第一のセグメントと(b)Cpf1又はCsm1ポリペプチドと相互作用する第二のセグメントとを含む;
(ii)Cpf1又はCsm1ポリペプチド、あるいはCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド、ここで、前記Cpf1又はCsm1ポリペプチドは、(a)DNA標的化RNAと相互作用をするRNA結合部分と(b)部位特異的酵素活性を示す活性部分とを含む。
【0132】
3.
植物細胞のゲノム内の標的部位にあるヌクレオチド配列を改変する方法であって、
植物細胞内に以下の(i)及び(ii)を導入する工程を含む、方法:
(i)DNA標的化RNA、又はDNA標的化RNAをコードするDNAポリヌクレオチド、ここで、該DNA標的化RNAは(a)標的DNAにおける配列を補足するヌクレオチド配列を含む第一のセグメント及び(b)Cpf1又はCsm1ポリペプチドと相互作用する第二のセグメントを含む;
(ii)Cpf1又はCsm1ポリペプチド、又はCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド、ここで、該Cpf1又はCsm1ポリペプチドは(a)DNA標的化RNAと相互作用を引き起こすRNA結合部分及び(b)部位特異的酵素活性を示す活性部分を含む。
【0133】
4. Cpf1又はCsm1ポリペプチドが発現され、そして該標的部位のヌクレオチド配列を開裂し、改変されたヌクレオチド配列を生成する条件下で植物を栽培する工程、及び該改変されたヌクレオチド配列を含む植物を選択する工程を更に含む、実施形態1~3のいずれかひとつの方法。
【0134】
5. 該標的部位のヌクレオチド配列を開裂することは、標的とするDNA標的化RNA配列において又はその近くの配列を二本鎖切断することを含む、実施形態1~4のいずれかひとつの方法。
【0135】
6. 該二本鎖切断が、スタガード二本鎖切断である、実施形態5の方法。
【0136】
7. スタガード二本鎖切断が、3~6のヌクレオチドの5’末端オーバーハング型を作り出す、実施形態6の方法。
【0137】
8. 該DNA標的化RNAがガイドRNA(gRNA)である、実施形態1~7のいずれかひとつの方法。
【0138】
9. 前記改変されたヌクレオチド配列が、細胞のゲノム内への異種DNAの挿入、細胞のゲノムからのヌクレオチド配列の欠失、又は細胞のゲノム内で少なくとも一つのヌクレオチドの突然変異を含んでいる、実施形態1~8のいずれかひとつの方法。
【0139】
10. 前記Cpf1又はCsm1ポリペプチドが、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択される、実施形態1~9のいずれかひとつの方法。
【0140】
11. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチドが、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択される、実施形態1~10のいずれかひとつの方法。
【0141】
12. 前記Cpf1又はCsm1ポリペプチドが、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択される一つ以上のポリペプチド配列と少なくとも80%の同一性を有する、実施形態1~11のいずれかひとつの方法。
【0142】
13. 前記Cpf1又はCsm1ポリペプチドが、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択される一つ以上の核酸配列と少なくとも70%の同一性を有する、実施形態1~12のいずれかひとつの方法。
【0143】
14. Cpf1又はCsm1ポリペプチドが、ホモダイマー又はヘテロダイマーを形成している、実施形態1~13のいずれかひとつの方法。
【0144】
15. 前記植物細胞が単子葉植物類由来である、実施形態1~14のいずれかひとつの方法。
【0145】
16. 前記植物細胞が双子葉植物類由来である、実施形態1~14のいずれかひとつの方法。
【0146】
17. Cpf1又はCsm1ポリペプチドの発現が誘導性又は構成的プロモーターの制御下である、実施形態1~16のいずれかひとつの方法。
【0147】
18. Cpf1又はCsm1ポリペプチドの発現が、細胞型特異性又は発生的に好ましいプロモーターの制御下である、実施形態1~17のいずれかひとつの方法。
【0148】
19. 前記PAM配列が5’-TTNを含み、ここで、Nは任意のヌクレオチドであり得る、実施形態1~18のいずれかひとつの方法。
【0149】
20. 細胞のゲノム内の標的部位にある前記ヌクレオチド配列が、SBPアーゼ、FBPアーゼ、FBPアルドラーゼ、AGPアーゼ大サブユニット、AGPアーゼ小サブユニット、ショ糖リン酸シンターゼ、デンプン合成酵素、PEPカルボキシラーゼ、ピルビン酸リン酸ジキナーゼ、トランスケトラーゼ、ルビスコ小サブユニット、又はルビスコアクチベースタンパク質をコードするか、又はSBPアーゼ、FBPアーゼ、FBPアルドラーゼ、AGPアーゼ大サブユニット、AGPアーゼ小サブユニット、ショ糖リン酸シンターゼ、デンプン合成酵素、PEPカルボキシラーゼ、ピルビン酸リン酸ジキナーゼ、トランスケトラーゼ、ルビスコ小サブユニット、又はルビスコアクチベースタンパク質をコードする一つ以上の遺伝子の発現を規制する転写因子をコードする、実施形態1~19のいずれかひとつの方法。
【0150】
21. 該標的部位をドナーポリヌクレオチドに接触させることを更に含み、ここで、該ドナーポリヌクレオチド、該ドナーポリヌクレオチドの一部、該ドナーポリヌクレオチドのコピー、又は該ドナーポリヌクレオチドのコピーの一部は標的DNAに組み込まれている、実施形態1~20のいずれかひとつの方法。
【0151】
22. 該標的DNAは、その標的DNA内のヌクレオチドが欠失されるように改変されている、実施形態1~21のいずれかひとつの方法。
【0152】
23. Cpf1又はCsm1ポリペプチドをコードする前記ポリヌクレオチドは、植物細胞における発現のために最適化されたコドンである、実施形態1~22のいずれかひとつの方法。
【0153】
24. 前記ヌクレオチドの発現が増加又は減少されている、実施形態1~23のいずれかひとつの方法。
【0154】
25. Cpf1又はCsm1ポリペプチドをコードする前記ポリヌクレオチドは、構成性であるか、細胞特異的であるか、誘導性であるか、又はスーサイドエクソン(suicide exon)の選択的スプライシングにより活性化されているプロモーターに操作可能に連結されている、実施形態1~24のいずれかひとつの方法。
【0155】
26. 前記Cpf1又はCsm1ポリペプチドが、前記Cpf1又はCsm1ポリペプチドのヌクレアーゼ活性を減少させるか又は欠失する一つ以上の突然変異を含んでいる、実施形態1~25のいずれかひとつの方法。
【0156】
27. 前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合に、FnCpf1(配列番号3)の917又は1006の位置に対応する位置か、SmCsm1(配列番号160)の701又は922の位置に対応する位置に、突然変異を含んでいるか、又は前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合に、FnCpf1(配列番号3)の917又は1006の位置又はSmCsm1(配列番号160)の701又は922の位置に突然変異を含んでいる、実施形態26の方法。
【0157】
28. FnCpf1(配列番号3)の917又は1006の位置に対応する位置における前記突然変異は、各々D917A及びE1006Aであるか、又はSmCsm1(配列番号160)の701又は922の位置に対応する位置における前記突然変異は、各々D701A及びE922Aである、実施形態27の方法。
【0158】
29. 前記突然変異したCpf1又はCsm1ポリペプチドが、配列番号26~41及び63~70からなる群に記載されているアミノ酸配列を含んでいる、実施形態26~28のいずれかひとつの方法。
【0159】
30. 前記突然変異したCpf1又はCsm1ポリペプチドが転写活性化ドメインに融合されている、実施形態26~29のいずれかひとつの方法。
【0160】
31. 前記突然変異したCpf1又はCsm1ポリペプチドが転写活性化ドメインに直接融合されているか、又はリンカーによって転写活性化ドメインに融合されている、実施形態30の方法。
【0161】
32. 前記突然変異したCpf1又はCsm1ポリペプチドが転写抑制因子ドメインに融合されている、実施形態26~29のいずれかひとつの方法。
【0162】
33. 前記突然変異したCpf1又はCsm1ポリペプチドが転写リンカーによって転写抑制因子ドメインに融合されている、実施形態32の方法。
【0163】
34. 前記Cpf1又はCsm1ポリペプチドが、核局在化シグナルを更に含んでいる、実施形態1~33のいずれかひとつの方法。
【0164】
35. 前記核局在化シグナルは配列番号1を含んでいるか、又は配列番号2によってコードされる、実施形態34の方法。
【0165】
36. 前記Cpf1又はCsm1ポリペプチドが、葉緑体シグナルペプチドを更に含んでいる、実施形態1~33のいずれかひとつの方法。
【0166】
37. 前記Cpf1又はCsm1ポリペプチドが、ミトコンドリアシグナルペプチドを更に含んでいる、実施形態1~33のいずれかひとつの方法。
【0167】
38. 前記Cpf1又はCsm1ポリペプチドが、このCpf1又はCsm1ポリペプチドを複数の細胞内位置に向けるシグナルペプチドを更に含んでいる、実施形態1~33のいずれかひとつの方法。
【0168】
39. Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列を含み、該ポリヌクレオチド配列は植物細胞内での発現のためコドン最適化されている、核酸分子。
【0169】
40. Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列を含み、該ポリヌクレオチド配列は真核生物細胞内での発現のためコドン最適化されている、核酸分子。
【0170】
41. Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列を含み、該ポリヌクレオチド配列は前記Cpf1又はCsm1ポリペプチドの天然ホストではない原核生物細胞である該原核生物細胞内での発現のためコドン最適化されている、核酸分子。
【0171】
42. 前記ポリヌクレオチド配列が、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択されるか、又はこれらの断片若しくは変異体であるか、あるいは
前記ポリヌクレオチド配列が、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択されているCpf1又はCsm1ポリペプチドをコードし、
該Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列は、そのCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに操作可能に連結されている、実施形態39~41のいずれかひとつの核酸分子。
【0172】
43. 前記変異体ポリヌクレオチド配列が、配列番号4、5、7、8、10、11、13、14、16、17、19、21、22、24、25、及び174~206からなる群から選択されるポリヌクレオチド配列と少なくとも70%の配列同一性を持つか、又は前記ポリヌクレオチド配列が、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択されるポリペプチドと少なくとも80%の配列同一性を持つCpf1又はCsm1ポリペプチドをコードし、該Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列は、そのCpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列に対して異種であるプロモーターに操作可能に連結されている、実施形態39~41のいずれかひとつの実施形態の核酸分子。
【0173】
44. 前記Cpf1又はCsm1ポリペプチドが、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択されるアミノ酸配列か、又はそれらの断片又は変異体を含んでいる、39~41のいずれかひとつの核酸分子。
【0174】
45. 前記変異体ポリペプチド配列が、配列番号3、6、9、12、15、18、20、23、106~173、及び230~236からなる群から選択されるポリペプチド配列と少なくとも70%の配列同一性を有する、実施形態44の核酸分子。
【0175】
46. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が、植物細胞中で活性であるプロモーターに操作可能に連結されている、実施形態39~45のいずれかひとつの核酸分子。
【0176】
47. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が、真核生物細胞中で活性であるプロモーターに操作可能に連結されている、実施形態39~45のいずれかひとつの核酸分子。
【0177】
48. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が、原核生物細胞中で活性であるプロモーターに操作可能に連結されている、実施形態39~45のいずれかひとつの核酸分子。
【0178】
49. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が、構成的プロモーター、誘導性のプロモーター、細胞特異的プロモーター、又は発生的に好ましいプロモーターに操作可能に連結されている、実施形態39~45のいずれかひとつの核酸分子。
【0179】
50. 前記核酸分子が前記Cpf1又はCsm1ポリペプチド及びエフェクタードメインを含む融合タンパク質をコードするものである、実施形態39~45のいずれかひとつの核酸分子。
【0180】
51. 前記エフェクタードメインが転写活性因子、転写抑制因子、核局在化シグナル、及び細胞透過シグナルからなる群から選択される、実施形態50の核酸分子。
【0181】
52. 前記Cpf1又はCsm1ポリペプチドが、ヌクレアーゼ活性を減ずるか又は欠失するために突然変異したものである、実施形態51の核酸分子。
【0182】
53. 前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合に、FnCpf1(配列番号3)の917又は1006の位置に対応する位置又はSmCsm1(配列番号160)の701又は922の位置に対応する位置における突然変異を含んでいるか、又は前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合に、FnCpf1(配列番号3)の917又は1006の位置又はSmCsm1(配列番号160)の701又は922の位置に突然変異を含んでいる、実施形態52の核酸分子。
【0183】
54. 前記Cpf1又はCsm1ポリペプチドが前記エフェクタードメインとリンカーによって融合されている、実施形態50~53のいずれかひとつの核酸分子。
【0184】
55. 前記Cpf1又はCsm1ポリペプチドが二量体を形成している、実施形態39~54のいずれかひとつの核酸分子。
【0185】
56. 実施形態50~55のいずれかひとつの核酸分子によりコードされる、融合タンパク質。
【0186】
57. 実施形態39~45のいずれかひとつの核酸分子によりコードされる、Cpf1又はCsm1ポリペプチド。
【0187】
58. ヌクレアーゼ活性を削減するか又は欠失するために突然変異したCpf1又はCsm1ポリペプチド。
【0188】
59. 前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合に、FnCpf1(配列番号3)の917又は1006の位置に対応する位置、又はSmCsm1(配列番号160)の701又は922の位置に対応する位置における突然変異を含んでいるか、又は前記突然変異したCpf1又はCsm1ポリペプチドが、最大同一性であるように配列された場合FnCpf1(配列番号3)の917又は1006の位置又はSmCsm1(配列番号160)の701又は922の位置に突然変異を含んでいる、実施形態58のCpf1又はCsm1ポリペプチド。
【0189】
60. 実施形態39~55のいずれかひとつの核酸分子を含んでいる、植物細胞、真核生物細胞、又は原核生物細胞。
【0190】
61. 実施形態56~59のいずれかひとつの融合タンパク質又はポリペプチドを含んでいる、植物細胞、真核生物細胞、又は原核生物細胞。
【0191】
62. 実施形態1及び3~38のいずれかひとつの方法により生成された、植物細胞。
【0192】
63. 実施形態39~55のいずれかひとつの方法により生成された核酸分子を含む、植物。
【0193】
64. 実施形態56~59のいずれかひとつの融合タンパク質又はポリペプチドを含む、植物。
【0194】
65. 実施形態1及び3~38のいずれかひとつの方法により生成された、植物。
【0195】
66. 実施形態63~65のいずれかひとつの植物の種。
【0196】
67. 前記改変されたヌクレオチド配列が、抗生物質又は除草剤耐性を形質転換細胞に与えるタンパク質をコードするポリヌクレオチドの挿入を含んでいる、実施形態1及び3~38のいずれかひとつの方法。
【0197】
68. 前記抗生物質又は除草剤耐性を形質転換細胞に与えるタンパク質をコードするポリヌクレオチドが配列番号76を含んでいるか、又は配列番号77を含むタンパク質をコードする、実施形態67の方法。
【0198】
69. 前記植物細胞のゲノム内の標的部位が配列番号71を含んでいるか、又は配列番号71の一部又は断片と少なくとも80%の同一性を共有している、実施形態3~38のいずれかひとつの方法。
【0199】
70. 前記DNA標的化RNAをコードするDNAポリヌクレオチドが配列番号73、配列番号91、配列番号92、配列番号93、又は配列番号95を含んでいる、実施形態1~38のいずれかひとつの方法。
【0200】
71. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が核局在化シグナルをコードするポリヌクレオチド配列を更に含んでいる、実施形態39~55のいずれかひとつの核酸分子。
【0201】
72. 前記核局在化シグナルが配列番号1を含んでいるか、又は配列番号2でコードされる、実施形態71の核酸分子。
【0202】
73. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が葉緑体シグナルペプチドをコードするポリヌクレオチド配列を更に含んでいる、実施形態39~55のいずれかひとつの核酸分子。
【0203】
74. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列がミトコンドリアシグナルペプチドをコードするポリヌクレオチド配列を更に含んでいる、実施形態39~55のいずれかひとつの核酸分子。
【0204】
75. 前記Cpf1又はCsm1ポリペプチドをコードするポリヌクレオチド配列が、前記Cpf1又はCsm1ポリペプチドを複数の細胞内位置に向けるシグナルペプチドをコードするポリヌクレオチド配列を更に含んでいる、実施形態39~55のいずれかひとつの核酸分子。
【0205】
76. 前記融合タンパク質が、前記Cpf1又はCsm1ポリペプチドを複数の細胞内位置に向ける核局在化シグナル、葉緑体シグナルペプチド、ミトコンドリアシグナルペプチド、又はシグナルペプチドを更に含んでいる、実施形態56の融合タンパク質。
【0206】
77. 前記Cpf1又はCsm1ポリペプチドが、このCpf1又はCsm1ポリペプチドを複数の細胞内位置に向ける核局在化シグナル、葉緑体シグナルペプチド、ミトコンドリアシグナルペプチド、又はシグナルペプチドを更に含んでいる、実施形態57~59のいずれかひとつのCpf1又はCsm1ポリペプチド。
【0207】
以下の実施例は、実例として挙げられているものであり、なんら限定するためのものではない。
【実施例0208】
実施例1 cpf1コンストラクトのクローニング
Cpf-1を含むコンストラクト(コンストラクト番号131306~131311及び131313)は表1に要約されている。手短に言えば、cpf1遺伝子が、GenScript(Piscataway,NJ)社によってデノボ合成され、興味の対象のcpf1コード配列と同様にクローニングのための制限酵素部位とインフレームでN-末端SV40核局在化タグ(配列番号2)を付け加えるため、PCR(ポリメラーゼ連鎖反応)によって増大された。適した制限酵素部位を用いることにより、各cpf1遺伝子が2x35プロモーター(配列番号43)の下流にクローニングされた。
【0209】
プロモーターとGFPコーディング領域の5’末端の連接を結びつけるDNAの領域に向けられているガイドRNAは、完全なカセットとしてIntegrated DNA Technologies社(Coralville,IA)により合成された。各カセットは、U3ターミネーター(配列番号44)に操作可能に連結されている適当なgRNA(配列番号47~53)に操作可能に連結されたU3プロモーター(配列番号42)を含んでいた。各gRNAが、プロモーターとGFP遺伝子の同じ領域に向けられている一方、各gRNAは、それの各々のCpf1酵素と正確に相互作用を及ぼすため適当なスキャフォールドを含むことを確実にするようにデザインされている。
【0210】
コンストラクトは、植物にハイグロマイシンB耐性を与えることができるhptII遺伝子を含む改変されたpSB11ベクター主鎖の中に集められ、クローニングされた。hptII遺伝子は、トウモロコシユビキチンプロモーターと5’UTR(pZmUbi;配列番号46)から下流に位置していた。
【0211】
【0212】
実施例2 アグロバクテリウム(Agrobacterium)の媒介によるイネの形質転換
イネ(Oryza sativa cv. Kitaake)カルスが構成的プロモーターに操作可能に連結している緑色蛍光タンパク質(GFP;配列番号56をコードする配列番号55)を含むスーバーバイナリープラスミドを含有するアグロバグテリウム細胞に感染させられた。外観検査に基づく高レベルのGFP由来の蛍光を示す三つの感染したカルスが選択され多くの断片に分けられた。これらの断片は、選択培地上で増殖するようにされた。カルスの部分が回復しより大きく成長するようにされた後、これらのカルスは、Cpf1酵素とその各々のガイドRNA(gRNAs)をコードする遺伝子を含有するアグロバクテリウム細胞に再感染させられた。cpf1含有ベクターによる感染に続いて、ハイグロマイシンbを含んでいる選択培地上で増殖された。機能性Cpf1タンパク質を発現するものと推定されるカルス断片が、もはや可視的に発光しない領域のカルス断片を外観的に検査することにより選ばれた。この発光の喪失は、継続的なCpf1媒介によるGFPコード化配列の改正に由来するものであると思われ、非機能性GFP遺伝子に帰結する。例えば、イネカルスは、GFP由来の蛍光の明らかな喪失を示すカルスの部分につながるAcidaminococcus属BV3L6(配列番号8、配列番号6をコードする)からのCpf1タンパク質をコードする遺伝子を含んでいるので、初めにGFPコンストラクトにより転換し、次に131307コンストラクトによって転換した。GFP由来の蛍光を示さない細胞クラスターを含むこれらのイネカルス部分は、より深い分子特性ゆえに、優先される。
【0213】
実施例3 T7EIアッセイ
T7エンドヌクレアーゼI(T7EI)アッセイは、望みの位置への挿入及び/又はからの欠失により試料を同定し酵素をコードする標的ゲノムの効率を評価するために用いられている。アッセイの実施要綱は、Shanら、(2014)Nature Protocols 9:2395-2410のものを改変している。アッセイの基本は、T7EIが不完全一致のDNAを認識し分断することにある。手短に言うなら、PCR反応が実行されgRNAにより標的とするDNA配列を含んでいるDNA領域を増幅する。改変された及び改変されない両方のDNAが試料に含まれることが予期されるので、PCR生成物の混合物が得られる。PCR生成物は、溶融され、続いて再アニールすることができる。改変されないPCR生成物が改変されたPCR生成物とともに再アニールする場合、DNAの不一致につながる。これらのDNA不一致がT7EIにより分解されゲルに基づくアッセイにより同定することができる。DNAは、GFP由来の蛍光の喪失を示すように出現したイネカルスから抽出される。プロモーターとGFPオープンリーディングフレーム間の接合を架け渡しているDNA領域を増幅するように設計されているプライマーを用いて、DNAを鋳型としてPCRが実行される。PCR生成物は、溶融され、再アニールされ、続いて製造元の実施要綱によると、T7EI(New England Biolabs社製、Ipswich、MA)により分解される。得られたDNAは2%アガロースゲル上で電気泳動にかけられる。Cpf1が望みの位置に挿入又は欠失を創り出したこれらの試料において、最初の帯は、より小さい二つの帯を作るため分解される。
【0214】
実施例4 イネカルスからのDNAの配列
外観検査に基づく傾向の喪失及び/又はT7EIアッセイの結果に基づき、機能性Cpf1酵素の蓄積の結果として改変されたゲノムDNAを含むために出現したイネカルスから抽出されたDNAが、配列に基づくアッセイ用に選択される。DNAは、適当なイネカルス部分から抽出され、プライマーが、このDNAからのGFPコーディング配列をPCR増幅するために用いられる。得られたPCR生成物は、その後に大腸菌細胞内へ転写されるプラスミド内にクローン化される。これらのプラスミドは回収され、GFPコード化DNA内への挿入、欠失及び/又は点突然変異を同定するためにDNDアッセイに、サンガー配列決定が用いられる。
【0215】
実施例5 遺伝子発現を調節するための不活性化Cpf1タンパク質の使用
Cpf1のRuvC様ドメインは、天然アミノ酸からアラニンへ突然変異を起こされた時にCpf1酵素内に同定されたDNA開裂活性を完全に不活性化するFrancisella tularensis亜種novicida U112(すなわち、D917及びE1006)からの特定の残基とともに、DNA開裂(Zetscheら(2015)Cell 163:759-771)を仲介することが示されている。ここで調査された8つのCpf1酵素のClustal W多重整列(Thompsonら(1994)Nucleic Acid Research 22:4673-4680)を用いたアミノ酸に基づく整列が、その他の酵素内において対応するアミノ酸残を同定するために実施された。表2に、これらのアミノ酸残基を示している。表2に挙げられているアミノ酸残基の各々における点突然変異に対応する不活性化されたCpf1タンパク質のアミノ酸配列は、配列番号26~41内に見つけられる。表2におけるcpf1タンパク質ごとに、掲載されている両残基にある突然変異を含む二本変異体不活性化されたCpf1タンパク質のアミノ酸配列が配列番号63~70に見つけられる。
【0216】
【0217】
適したプライマーが、配列番号26~41に挙げられている不活性化されたCpf1配列をコードする遺伝子を生成するため又配列番号63~70に挙げられている不活性化されたCpf1配列をコードする遺伝子を生成するためにQuickchanger PCR(Agilent Technologies、Santa Clara、CA)が実行されるように設計されている。PCRは、5’末端の遺伝子とインフレーム融合したSV40局在化シグナル(配列番号2、配列番号1をコードする)により、EDLL又はTAL活性化ドメイン又はSRDX抑制因子ドメインなどの遺伝子発現活性化又は抑制化ドメインと融合した不活性化されたCpf1を含む融合タンパク質をコードする遺伝子を生成するために実行される。ガイドRNA(gRNA)は、該RNAが不活性化されたCpf1タンパク質と相互作用を起こせるように、また不活性化されたCpf1タンパク質を植物ゲノム内の望みの位置に導くように設計されている。植物細胞内で操作可能なプロモーターと操作可能に連結され、活性化及び/又は抑制ドメインと溶融されたCpf1融合タンパク質をコードする遺伝子を含んでいる、興味の対象のgRNAを含むカセットが、植物形質転換に適したベクターの中にクローン化される。このベクターは植物細胞に形質転換され、植物細胞内でgRNAとCpf1融合タンパク質の生成につながる。不活性化されたCpf1タンパク質を含む融合タンパク質及び活性化因子又は抑制因子ドメインは、植物ゲノム内の隣接する遺伝子の発現の調整をもたらす。
【0218】
実施例6 トウモロコシ(Zea mays)における所定のゲノム遺伝子座の編集
一つ以上のgRNAが、トウモロコシゲノム中の望みの部位とアニールし、一つ以上のCpf1又はCsm1タンパク質と相互作用を起こすように設計される。これらのgRNAは、植物細胞内で操作可能なプロモーターに操作可能に連結されるようにベクター内にクローン化される(gRNAカセット)。Cpf1又はCsm1タンパク質をコードする一つ以上の遺伝子は、植物細胞内で操作可能なプロモーターに操作可能に連結されるようにベクター内にクローン化される(cpf1カセット又はcsm1カセット)。該gRNAカセット及びcpf1カセット又はcsm1カセットは、各々植物形質転換に適したベクター内にクローン化され、このベクターはその後アグロバクテリウム細胞内に形質転換される。これらの細胞を形質転換に適したトウモロコシ組織と接触させる。アグロバクテリウム細胞とのインキュベーションに続き、トウモロコシ細胞は、完全な植物再生に適した組織培養地上で培養される。トウモロコシ植物は、cpf1又はcsm1カセット及びgRNAカセットを含んでいるベクターを内部に持つアグロバクテリウム細胞と接触させた細胞から再生される。糖頃腰植物の再生後、植物組織を収穫し、DNAがその組織から抽出される。適当ならば、T7EIアッセイ及び/又は配列決定アッセイが、所望のゲノム位置でDNA配列の変化が起こったかどうか分析するために実施される。
【0219】
あるいは、粒子ボンバードメント(bombardment)を用いて、cpf1又はcsm1カセット及びgRNAカセットをトウモロコシ細胞に導入する。cpf1又はcsm1カセット及びgRNAカセットを含んでいるベクターを、金ビーズ又はチタンビーズにコーティングし、次いで、これらは、再生に適したトウモロコシ組織に撃ち込むために用いられる。撃ち込みに続き、該トウモロコシ組織は、トウモロコシ植物の再生のための組織培養培地へ移される。トウモロコシ植物の再生に続き、植物組織を収穫し、DNAが該組織から抽出される。DNA配列の変化が所望のゲノム位置で起こったかどうかを決定するために、必要に応じて、T7EIアッセイ及び/又は配列アッセイを実施する。
【0220】
実施例7 エノコログサにおける所定のゲノム遺伝子座の編集
一つ以上のgRNAを、エノコログサゲノムの所望の部位とアニールされるように、そして一つ以上のCpf1又はCsm1タンパク質と相互作用するように設計する。これらのRNAを、植物細胞(「gRNAカセット」)内で操作可能なプロモーターと操作可能に連結するように、ベクター内でクローニングする。Cpf1又はCsm1タンパク質をコードする一つ以上の遺伝子は、植物細胞(「cpf1カセット」又は「csm1カセット」)内で操作可能なプロモーターと操作可能に連結するように、ベクター内でクローニングする。該gRNAカセット及びcpf1カセット又はcsm1カセットを、各々、植物形質転換に適したベクター内へクローニングし、このベクターは、続いてアグロバクテリウム細胞内に形質転換する。これらの細胞を、形質転換に適したエノコログサ組織と接触させる。アグロバクテリウム細胞とのインキュベーションに続き、エノコログサ細胞を、無傷植物の再生に適した組織培養培地上で培養する。エノコログサ植物は、cpf1カセット又はcsm1カセットとgRNAカセットを含んでいるベクターを内部に持つアグロバクテリウム細胞と触れあわせられた細胞から再生する。エノコログサ植物の再生に続き、植物組織を収穫し、DNAを組織から抽出する。DNA配列の変化が所望のゲノム位置で起こったかどうかを決定するために、必要に応じて、T7EIアッセイ及び/又は配列アッセイを実施する。
【0221】
あるいは、粒子ボンバードメントを用いて、cpf1又はcsm1カセット及びgRNAカセットをエノコログサ細胞に導入する。cpf1又はcsm1カセット及びgRNAカセットを含んでいるベクターを金ビーズ又はチタンビーズ上にコーティングし、次いで、これらは、再生に適したエノコログサ組織に撃ち込むために用いられる。撃ち込みに続き、該エノコログサ組織は、無傷植物の再生のための組織培養培地へ移される。植物の再生に続き、植物組織を収穫し、DNAが該組織から抽出される。DNA配列の変化が所望のゲノム位置で起こったかどうかを決定するために、必要に応じて、T7EIアッセイ及び/又は配列アッセイを実施する。
【0222】
実施例8 所定のゲノム遺伝子座からのDNA欠失
第一のgRNAを、興味の対象の植物のゲノムにおける第一の所望の部位とアニールされるように、そして一つ以上のCpf1又はCsm1タンパク質と相互作用するように設計する。第二のgRNAを、興味の対象の植物のゲノムにおける第一の所望の部位とアニールされるように、そして一つ以上のCpf1又はCsm1タンパク質と相互作用するように設計する。これらのRNAの各々を、植物細胞内で操作可能なプロモーターと操作可能に連結させ、続いて植物の形質転換に適したベクター内でクローニングする。Cpf1又はCsm1タンパク質をコードする一つ以上の遺伝子を、植物細胞(「cpf1カセット」又は「csm1カセット」)内で操作可能なプロモーターと操作可能に連結するように、ベクター内でクローニングする。該cpf1カセット又はcsm1カセット及びgRNAカセットを、単一植物形質転換ベクター内へクローニングし、続いてこのベクターをアグロバクテリウム細胞内に形質転換する。これらの細胞を、形質転換に適した植物組織と接触させる。このアグロバクテリウム細胞とのインキュベーションに続き、植物細胞を、無傷植物の再生に適した組織培養培地上で培養する。あるいは、cpf1カセット又はcsm1カセットとgRNAカセットを含んでいるベクターを、植物細胞のボンバードメントに適した金又はチタニウムビーズ上コーティングする。撃ち込まれた細胞は、次に無傷植物の再生に適した組織培養培地に移される。該gRNA-Cpf1又はgRNA-Csm1複合体は、所望のゲノム遺伝子座で二本鎖切断を実行し、幾つかの場合で、DNA修復機構が、該二つの標的ゲノム遺伝子座間に位置していた天然のDNA配列を欠失するようにDNAが修復されるようにする。植物が、cpf1カセット又はcsm1カセットとgRNAカセットを含んでいるベクターを内部に持つアグロバクテリウム細胞と接触させられた細胞か、又はこのベクターでコーティングされたビーズを撃ち込まれた細胞から再生される。植物の再生に続いて、植物組織を収穫し、DNAが該組織から抽出される。DNAが所望のゲノム位置から欠失されたかどうかを決定するために、必要に応じて、T7EIアッセイ及び/又は配列アッセイを実施する。
【0223】
実施例9 所定のゲノム遺伝子座でのDNA挿入
gRNAを、興味の対象の植物のゲノムにおける第一の所望の部位とアニールされるように、そして一つ以上のCpf1又はCsm1タンパク質と相互作用するように設計する。該gRNAを、植物細胞内で操作可能なプロモーターに操作可能に連結させ、続いて植物形質転換に適したベクターにクローニングする。Cpf1又はCsm1タンパク質をコードする一つ以上の遺伝子を、植物細胞(「cpf1カセット」又は「csm1カセット」)内で操作可能なプロモーターに操作可能に連結されるように、ベクターにクローニングする。該cpf1カセット又はcsm1カセット及びgRNAカセットを、単一植物形質転換ベクター内へクローニングし、続いてこのベクターをアグロバクテリウム細胞内に形質転換する。これらの細胞を、形質転換に適している植物組織と接触させる。同時に、ドナーDNAを、これらの同じ植物細胞内に導入する。前記ドナーDNAは、上流及び下流の隣接する領域に隣接し、植物下の縫内の所望の位置に挿入されるべきDNA分子を含んでいる。上流の隣接領域は、gRNAによって標的化されるゲノム遺伝子座のゲノムDNA上流の領域に相同であり、下流の隣接領域は、gRNAによって標的化されるゲノム遺伝子座のゲノムDNA下流の領域に相同である。上流及び下流の隣接領域は、植物ゲノムの所望の部位へのDNA挿入を媒介する。アグロバクテリウム細胞とのこのインキュベーション及びドナーDNAの導入に続き、該植物細胞を、無傷植物の再生に適した組織培養培地上で培養する。該cpf1カセット又はcsm1カセット及びgRNAカセットを含んでいたベクターを内部に持つアグロバクテリウム細胞と接触させた細胞から、植物が再生される。植物の再生に続いて、植物組織を収穫し、DNAが該組織から抽出される。DNAが所望のゲノム位置から欠失されたかどうかを決定するために、必要に応じて、T7EIアッセイ及び/又は配列アッセイを実施する。
【0224】
実施例10 イネCAO1遺伝子座での遺伝子銃的DNA挿入
所定のゲノム遺伝子座にDNAを遺伝子銃的に挿入するために、ベクターをcpf1カセット又はcsm1カセットで設計した。これらのベクターは、cpf1又はcsm1ORFの上流に2X35Sプロモーター(配列番号43)及びcpf1又はcsm1ORFの下流に35SpolyAターミネーター配列(配列番号54)を含んでいた。表3に、これらのcpf1又はcsm1ベクターをまとめている。
【0225】
【0226】
表3に記載のcpf1及びcsm1ベクターに加え、gRNAカセットを持つベクターを、該gRNAがイネ(Oryza sativa)ゲノム(配列番号71)におけるCAO1遺伝子座の領域とアニールされるようにまた適したCpf1又はCsm1タンパク質と相互作用ができるように設計した。これらのベクターにおいて、該gRNAは、イネU6プロモーター(配列番号72)及びターミネーター(配列番号74)と操作可能に連結させられた。表4は、これらのgRNAベクターをまとめている。
【0227】
【0228】
ハイグロマイシン遺伝子カセットのイネCAO1ゲノム遺伝子座への挿入を容易にするため、修復ドナーカセットを、この遺伝子座を標的とするgRNAと組み合わされたCpf1又はCsm1酵素の作用により引き起こされる意図した二本鎖切断の部位の上流及び下流と相同である約1000の塩基対で設計した。
図1は、CAO1ゲノム遺伝子座及びCAO1ゲノム遺伝子座におけるハイグロマイシン遺伝子カセットの相同組換え及び挿入を誘導するために用いられた相同性アームの概略図である。イネCAO1ゲノム遺伝子座に挿入されたハイグロマイシン遺伝子カセットは、カリフラワーモザイクウィルス35SpolyA配列(配列番号54)によって3’末端に隣接しているハイグロマイシン耐性遺伝子(配列番号76、配列番号77をコードする)の発現を駆動するトウモロコシユビキチンプロモーター(配列番号46)を含んでいた。表5は、イネCAO1ゲノム遺伝子座へのハイグロマイシン挿入のために構築された修正ドナーカセットベクターの概略である。
【0229】
【0230】
イネ細胞へのcpf1カセット又はcsm1カセット、含gRNAプラスミド、及び修復ドナーカセットを導入するため、粒子ボンバードメントを採用した。ボンバードメントのため、0.6μmの金粒子2mgを計量し、無菌の1.5mL試験管に移した。100%エタノール500mLを加え、試験管を10~15秒間超音場処理した。遠心分離につづいて、エタノールを除いた。次に、無菌で二度蒸留された水1mLを、該金ビーズを含んでいる試験管に加えた。ビーズペレットを、手短に攪拌し、次に遠心分離により再形成した、その後、水を試験管から除いた。無菌のラミナーフローフード内で、DNAを該ビーズにコーティングした。表6は、ビーズに加えたDNA量を示している。cpf1カセット又はcsm1カセット、含gRNAプラスミド、及び修復ドナーカセットを含んでいるプラスミドをビーズに加え、無菌で二度蒸留された水を全量が50μLになるまで加えた。そこへ、20μLのスペルミジン(1M)を加え、続いて50μLのCaCl2(2.5M)を加えた。金粒子を数分間、重力によって小球として撃ち付け、次に遠心分離小球化した。上澄み液が取り除かれ、100%エタノール800μLを加えた。手短な超音波処理に続き、金粒子を3~5分間重力で打付け、次に試験管を遠心分離し小球を形成した。上澄み液が取り除かれ、100%エタノール30μLを試験管に加えた。DNAにコーティングされた金粒子は再度、攪拌によりこのエタノール中に懸濁させ、再懸濁された金粒子10μLを三つのマクロ担体(Bio-Rad,Hercules,CA)の各々にくわえた。マクロ担体を、ラミナーフローフード中で5~10分間風乾させ、エタノールを蒸発させた。
【0231】
【0232】
イネカルス組織をボンバードメント用に用いた。ボンバードメントに先立ち、イネカルスを、カルス誘導培地(CIM;3.99g/L N6塩及びビタミン、0.3g/Lカゼイン加水分解物、30g/Lショ糖、2.8g/L L-プロリン、2mg/L 24-D8g/L寒天、pH5.8に調整)に4~7日間28度に保った。粒子ボンバードメントに先立ち、4時間の浸透前処理のため、浸透性個体培地(0.4Mのソルビトール及び0.4Mのマンニトールが補充されたCIM)を含んでいるペトリ皿の中央に、各0.2~0.3cmの大きさで、総重量が1~1.5gの約80~100個のカルス片を並べた。ボンバードメントのため、DNAにコーティングされた金粒子を含むマクロキャリアをマクロキャリアホルダーに組み込んだ。破裂プレート(1100psi)、停止スクリーン、及びマイクロキャリア―ホルダーを製造者の指示に従って組み立てた。撃ち込まれるイネカルスを含んでいるプレートを停止スクリーンの下6cmのところに置き、真空チャンバーが25~28インチHgに達したのち、カルス片を撃ち込んだ。ボンバードメントの後、カルスを浸透培地に16~20時間放置し、続いてカルス片を、選択培地(50mg/Lのハイグロマイシンと100mg/Lのチメンチンを補充したCIM)に移した。プレートをインキュベータに移し、暗所で28℃に保ち形質転換細胞の回復を始めた。二週間ごとに、新鮮な選択培地でカルスを継代培養した。選択培地上で約5~6週間の後、ハイグロマイシン耐性カルス片が表れ始めた。個々のハイグロマイシン耐性カルス片を新たな選択プレートに移し、細胞を分裂させ増殖させ、分子分析用に採取するのに充分な組織を生成させた。表7は、これらのイネボンバードメント実験用に用いられたDNAベクターの組み合わせをまとめたものである。
【0233】
【0234】
各実験からの個々のハイグロマイシン耐性カルス片を新たなプレートに移した後、採取に十分な大きさになるまで増殖させた。少量の組織を個々の各ハイグロマイシン耐性イネカルス片から収穫し、PCR及びDNA配列分析用にこれらの組織サンプルからからDNAを抽出した。修復ドナープラスミド131760又は131632を用いた実験では、
図1に概略的に示しているように、ZmUbiプロモーターから下流修復ドナーアームの外側にあるイネゲノムの領域内にまでまたがるDNA領域を増幅するように設計された配列番号78と79の配列を持つプライマーを用いて、これらのDNA抽出物に対してPCRを実行した。修復ドナープラスミド131633を用いたこれらの実験では、
図1に概略的に示しているように、配列番号102と103の配列を持つプライマーを用いてCaMV35Sターミネーターから上流修復ドナーアームの外側にあるイネゲノムの領域内にまでまたがるDNA領域を増幅した。これらのPCR反応は、野生型イネDNAからも修復ドナープラスミドからもアンプリコンを生成せず、このようにイネCAO1遺伝子座における挿入事象を示唆している。表8は、表7に示されている各実験から生成されたハイグロマイシン耐性カルス片の数並びに挿入事象が生じたと推定されるPCR-陽性カルス片の数をまとめたものである。各ボンバードメント実験に用いられたカルス片の数は、重量に基づいて、1プレートあたり159±11.1個のカルス片を有する10枚の板の調査により推定した。
【0235】
【0236】
表8に列挙されたPCR陽性カルス片について、両相同性アームとイネゲノム間の接合部を横切って増幅させるため更なるPCR分析を行なった。配列番号96及び97の配列を持つプライマーをもちいて、修復ドナープラスミド131760又は131632を用いたこれらの実験のための上流領域を増幅させた。これらのプライマー結合部位の位置は、
図1に概略的に示されている。
【0237】
挿入事象の下流領域を増幅させるために上記プライマー対を用いて生成されたPCRアンプリコンのサンガー配列決定により、予期された配列が形質転換されたイネカルス内に存在することが示され、Cpf1又はCsm1酵素により作り出された二本鎖切断で仲介された予期されたゲノム遺伝子座にハイグロマイシン遺伝子カセットの挿入が確認された。挿入事象の上流領域を増幅させるために上記プライマー対を用いて生成されたPCRアンプリコンのサンガー配列決定もまた、予期された配列が形質転換されたイネカルス内に存在することを示し、Cpf1又はCsm1酵素により作り出された二本鎖切断で仲介された予期されたゲノム遺伝子座にハイグロマイシン遺伝子カセットの挿入が確認された。重要なことは、イネゲノム配列から5つの塩基対(GCCTT)の欠失が、Cpf1媒介性DSB形成に続いて上流挿入部位で起こることが予測されたことであり、この欠失が配列データから確認されたことであり、このように観察された挿入事象はCpf1の作用によって仲介されたことを証明している。
図2Aは、実験1で標的とされたイネCAO1遺伝子座における挿入事象を確認した配列データを要約するアライメントを示している(表7参照)。
【0238】
実験5と7(表7参照)において標的とされたように、イネCAO1遺伝子座で標的挿入の存在を確認するために用いられたPCR産物の配列決定を行った。配列番号104と105の配列を持つプライマーを、これらの挿入事象の下流領域を増殖させるため用いた。これらのPCR産物を配列決定し、FnCpf1(実験5)とMbCpf1(実験7)によるDSB生産で媒介された挿入事象について予期された配列を観察した。該hph鎖セットが、下流アームにおける塩基の変化を持たない標的部位でCAO1遺伝子座に挿入された。
【0239】
実験70(表7)は、全hphカセットの挿入よりむしろ、イネCAO1ゲノム遺伝子座における意図した挿入部位でプラスミド131633に存在する35Sターミネーターを挿入する結果となった。配列分析は、35Sターミネーターが、下流アーム(
図4A)と10塩基を共有する11塩基対の領域を含んでいることを示した。35Sターミネーターにおけるこの領域がイネカルス片番号70-15における下流アームと意図しない相同性組換え事象を媒介し、一方プラスミド131633がこのプラスミドとガイドRNAとCpf1酵素によって標的化されたイネCAO1遺伝子における座の配列上流との間の意図する組換え事情を媒介し、
図4Bに示す挿入配列の結果をもたらしたように見える。得られた挿入は、イネCAO1遺伝子座での179塩基対欠失及び133塩基対挿入につながった。実験70で明らかとなった挿入事象が、挿入を意図した全hphカセットよりむしろ35Sターミネーターのほんの一部分を含んでいる一方、事象が見つけられたのは、Prevotella bryantii Cpf1酵素(配列番号179によりコード化された、配列番号138)により標的化されたCAO1遺伝子座における意図した部位であり、このCpf1酵素が、CAO1遺伝子座に意図したDSBを生成するのに効果的であることを示している。
【0240】
実験75(表7)は、全hphカセットの挿入よりむしろ、イネCAO1ゲノム遺伝子座における意図した挿入部位でプラスミド131633に存在する35Sターミネーターの一部を挿入する結果となった。配列分析は、35Sターミネーターが、下流アーム(
図4C)と8塩基を共有する12塩基対の領域を含んでいることを示した。35Sターミネーターにおけるこの領域がイネカルス片番号75-46における下流アームと意図しない相同性組換え事象を媒介し、一方プラスミド131633における上流アームがこのプラスミドとガイドRNAとCpf1酵素によって標的化されたイネCAO1遺伝子における座の配列上流との間の意図する組換え事情を媒介し、
図4Dに示す挿入配列の結果をもたらしたように見える。得られた挿入は、イネCAO1遺伝子座での47塩基対欠失及び24塩基対挿入につながった。実験75で明らかとなった挿入事象が、挿入を意図した全hphカセットよりむしろ35Sターミネーターのほんの一部分を含んでいる一方、事象が見つけられたのは、Proteocatella sphenisci Cpf1酵素(配列番号191によりコード化された、配列番号142)により標的化されたCAO1遺伝子座における意図した部位であり、このCpf1酵素が、CAO1遺伝子座に意図したDSBを生成するのに効果的であることを示している。
【0241】
実験46(表7)は、Lachnospiraceae bacteriumND2006Cpf1酵素(配列番号19によりコード化された、配列番号18)による媒介で、イネCAO1ゲノム遺伝子座の意図する挿入部位での挿入の結果であった。CAO1遺伝子座における意図した部位の領域のPCR分析は、カルス片番号46-161における挿入の診断に役立つバンドが増幅されている結果を示した。このゲノム領域は、イネCAO1遺伝子座での意図したDNA挿入の存在を確認するため配列分析に付された。
図5は、予期した部位におけるイネDNAに存在する131633ベクターからの予期された挿入とともに、この配列分析の結果を示している。131633ベクターに存在する突然変異したPAM部位(TTTC>TAGC)も、カルス片番号46-161からイネDNAにおいて検出され、更に、Lachnospiraceae bacteriumND2006Cpf1酵素による部位特異性DSB導入によって媒介されたように、イネCAO1遺伝子での131633ベクターインサートのHDR媒介挿入を更に裏付けている。
【0242】
実験58(表7)は、Anaerovibrio属RM50Cpf1酵素(配列番号176によりコード化された、配列番号143)による媒介で、イネCAO1ゲノム遺伝子座の意図する挿入部位での挿入の結果であった。CAO1遺伝子座における意図した挿入部位の領域のPCR分析は、カルス片番号58-169における挿入の診断に役立つバンドが増幅されている結果を示した。このゲノム領域は、イネCAO1遺伝子座での意図したDNA挿入の存在を確認するため配列分析に付された。
【0243】
実施例11 イネCAO1遺伝子座におけるCpf1媒介ゲノムDNA改変
上述の通り、cpf1及びgRNAベクターでコーティングされた金ビーズを用いてイネカルスが撃ち付けられた。上述の通り、実験1(表7)用に撃ち付けられたイネカルスは、ボンバードメントに続き16~20時間浸透培地に置き、次にイネカルスを、選択培地選択培地(50mg/Lのハイグロマイシンと100mg/Lのチメンチンを補充したCIM)に移した。プレートを、インキュベータに移し、暗所で28℃に保ち形質転換細胞の回復を始めた。二週間ごとに、新鮮な選択培地でカルスを継代培養した。選択培地上で約5~6週間の後、ハイグロマイシン耐性カルス片が表れ始めた。個々のハイグロマイシン耐性カルス片を新たな選択プレートに移し、細胞を分裂させ増殖させ、分子分析用に採取するのに充分な組織を生成させた。
【0244】
実験01(表7)で生成された16のハイグロマイシン耐性カルス片からDNAを抽出し、cpf1カセットの存在を確かめるため配列番号100と101の配列を持つプライマーを用いてPCRを実施した。このPCR反応は、番号1、2、4、6、7、及び15のイネカルスから抽出されたDNAが、イネゲノム(
図2B)におけるcpf1カセットの挿入と一致する、予想された853塩基対アプリコンを生成したことを示した。ベクター131608中のgRANによって標的化されたイネCAOゲノム遺伝子座の領域を増殖するため、配列番号98と99の配列を持つプライマーを用いてハイグロマイシン耐性カルス片から抽出されたDNAによってPCRも実施された。このPCR反応は、野生型イネDNAをテンプレートとして用いたとき、595塩基対アプリコンを生成した。プライマーとしての配列番号98と99とのPCR反応に続き、この座での小さな挿入及び/又は欠失を調べるため、T7エンドヌクレアーゼ分析が得られたPCR産物によって実施された。15番のカルス片からのDNAが、小挿入又は欠失と一致するバンドパターンを示した(
図2C)。配列番号98と99のプライマーを用いた反応から生成されたPCR産物を、pGEM(登録商標)系(Promega、Madison、WI)を用いて、製造者の指示に従って大腸菌細胞にクローニングした。配列決定のため、8つの単一大腸菌コロニーからDNAを抽出した。8つの内の5つのコロニーが、CAO1座における、予想されたCpf1媒介二本鎖切断部位で同じ7塩基対欠失を示した(
図2D)。理論によって制限されないならば、この欠失の可能性のある説明は、イネ細胞DNA修復機構が、CAO1座でFnCpf1により引き起こされた二本鎖切断の修復に続いて欠失が生成したということである。
【0245】
最初に得られた結果の再現性を確認するために実験01(表7)が、追加のイネカルス片で繰り返された。実験01の繰りかえしは、T7EI分析の結果に基づきインデルの生成に陽性であることを表す4つの追加のカルス片の同定につながった。配列分析のためDNAが、これらのカルス片から抽出された。PCRが、CAO1遺伝子座の標的化されたイネ部位を囲むイネゲノムの領域を増幅させるため実施され、サンガー配列決定が実施された。配列決定の結果により、T7EI分析結果が確認された。
図2Dは、得られた配列データを示す。これらの4つのカルス片は、3つの塩基対~75の塩基対の欠失の範囲内の様々な欠失の大きさを示し、すべてFnCpf1(配列番号5によってコード化された、配列番号3)により標的化された、予測された部位に位置していた。
【0246】
実験31及び46(表7)で、イネCAO1遺伝子における二つの異なる位で、DSBを引き起こすためLbCpf1(配列番号19によってコード化された、配列番号18)の能力を試験した。実験31は、gRNA源として、プラスミド132033を用い、一方実験46は、gRNA源として、プラスミド132054を用いた。これらの実験で用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAがハイグロマイシン耐性イネカルス片から抽出され、T7EIアッセイに付された。イネCAO1ゲノム遺伝子座のPCR増幅に続いて、T7EIアッセイにより、予期された部位にインデルを含んでいるように見える実験31から一つのカルス片及び実験46から五つのカルス片が同定された。これらのイネカルス片からのPCR産物が、サンガー配列決定により分析され、これらのカルス片におけるCAO1座に存在する配列を同定した。
図3はサンガー配列決定分析の結果を示しており、イネCAO1遺伝子座における予想された位置でのインデルの存在が確認できた。
図3Aは、実験31からの結果を示し、
図3Bは、実験46の結果を示している。
図3Aが示すようにカルス片31-21は、10の塩基対挿入に沿って56の塩基対の欠失を示した。実験46からのカルス(
図3Bにデータが示されている)は、3~15塩基対の範囲内の欠失の大きさを示した。カルス片46-38及び46-77は異なる二つのインデルを示し、これらのカルス片内の独立した細胞で複数のインデル生成事象を起こしたことを示していることに留意すべきである。これらの実験からのインデルの全てが、それぞれのガイドRNAによって標的化されたCAO1座の予測された部位に位置しており、LbCfp1酵素によるこの部位でのDSBの忠実な生成を示した。
【0247】
実験80(表7)は、イネCAO1遺伝子座でのDSBを引き起こすためMoraxella capraeCpf1酵素(配列番号175によってコード化された、配列番号133)の能力を試験した。この実験で用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAがハイグロマイシン耐性イネカルス片から抽出され、T7EIアッセイに付された。イネCAO1ゲノム遺伝子座のPCR増幅に続いて、T7EIアッセイにより、予期された部位にインデルを含んでいる実験からの一つのカルス片を同定した。このイネカルス片からのPCR産物は、サンガー配列決定により分析し、このカルス片におけるCAO1座に存在する配列を同定した。
図3Aは、各ガイドRNAにより標的化されたCAO1座における予想された部位のカルス片番号80-33にある8つの塩基対欠失とともに、これらの配列アッセイの結果を示しており、Moraxella capraeCpf1酵素によるこの部位でのDSBの忠実な生成を示した。
【0248】
実験91(表7)は、イネCAO1座でのDSBを引き起こすため、Lachnospiraceae bacterium COE1 Cpf1酵素(配列番号189によってコード化された、配列番号125)の能力を試験した。この実験で用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAがハイグロマイシン耐性イネカルス片から抽出され、T7EIアッセイに付された。イネCAO1ゲノム座のPCR増幅に続いて、T7EIアッセイにより、予期された部位にインデルを含んでいる実験からの一つのカルス片を同定した。このイネカルス片からのPCR産物は、サンガー配列決定により分析し、このカルス片におけるCAO1座に存在する配列を同定した。
図3Aは、各ガイドRNAにより標的化されたCAO1座における予想された部位のカルス片番号91-4にある9つの塩基対欠失とともに、これらの配列アッセイの結果を示しており、Lachnospiraceae bacterium COE1 Cpf1酵素によるこの部位でのDSBの忠実な生成を示した。
【0249】
実験119(表7)は、イネCAO1座でのDSBを引き起こすため、Eubacterium coprostanoligenes Cpf1酵素(配列番号205によってコード化された、配列番号173)の能力を試験した。この実験で用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAがハイグロマイシン耐性イネカルス片から抽出され、T7EIアッセイに付された。イネCAO1ゲノム座のPCR増幅に続いて、T7EIアッセイにより、予期された部位にインデルを含んでいる実験からの二つのカルス片を同定した。このイネカルス片からのPCR産物は、サンガー配列決定により分析し、このカルス片におけるCAO1座に存在する配列を同定した。
図3Aは、各ガイドRNAにより標的化されたCAO1座における予想された部位のカルス片番号119-4と119-11の両方にある8つの塩基対欠失とともに、これらの配列アッセイの結果を示しており、Eubacterium coprostanoligenes Cpf1酵素によるこの部位でのDSBの忠実な生成を示した。
【0250】
実施例12 CAO1遺伝子座における挿入を有するイネ植物の再生
実験1(表7及び8参照)におけるFnCpf1媒介DSBによってCAO1遺伝子座を標的とするhphカセットで形質転換されたライスカルスを組織培養培地で培養し、苗条を生成した。続いて、これらの苗条を発根培地に移し、発根した植物を温室内で栽培するため土壌に移した。発根した植物は、土壌で表現型的に正常であるようであった。PCR分析のために発根した植物からDNAを抽出した。上流下流アームのPCR増殖により、hphカセットがイネCAO1ゲノム遺伝子座に存在する子が確認された。
【0251】
CAO1におけるhphカセット挿入により実験1で生成されたT0世代のイネ植物を栽培し、自己受粉させてT1世代の種子を生成した。この種子を植え、得られたT1世代植物を、遺伝子型分類し、ホモ接合型、ヘミ接合型、及びヌル植物を同定した。T1植物は、予想通りに分かれ、hph挿入によりT1植物の約25%がヘミ接合状態であり、25%がヌル分離株であり、50%がヘテロ接合であった。ホモ接合型植物は、CAO1遺伝子(Leeら(2005)Plant Mol Biol57:805-818)のノックアウトに関連する予期された黄色葉表現型で、表現型的に観察された。
【0252】
T7EIアッセイ及び(カルス片番号90の)配列検証を通してインデルに陽性の結果を示したGE0046カルス片番号33、40、62、及び90からT0世代植物を再生した(
図3B)。カルス片46-33、40、62、及び90に由来する、再生された植物は、再生された植物組織から抽出されたDNAを用いたT7EIアッセイに基づいて、CAO1座におけるインデルの存在に陽性であった。GE0046カルス片46-96及び46-161、これらはCAO1座におけるハイグロマイシンマーカーの挿入を有することを事前に示されているが、からも植物を再生した。カルス片46-96及び46-161由来の植物は、PCRスクリーニングによって検出されているように、全て挿入について陽性であった。カルス片番号46-90から再生された二つの植物から抽出したDNAから得られた配列データは、カルスにおいて検出された同じ8つの塩基対の欠失を示しており(
図3B)、再生工程を通してこの欠失が安定であることを示していた。カルス片番号46-40及び番号46-62から由来する植物から抽出したDNAから得られた配列データは、8-、9-、10-、及び11塩基対の欠失を示した(データは示されていない)。
【0253】
実施例13 推定上新しいクラスのCpf1様タンパク質の同定
BLAST検索を通して同定されたCpf1タンパク質及びCpf1様タンパク質の配列分析とともに、推定Cpf1タンパク質の系統樹の試験(Zetscheら(2015)Cell163:759-771、データは示されていない)が、Cpf1タンパク質に関連するとみられるが、既知のCpf1タンパク質と較べると有意に異なる配列を持つ小グループのタンパク質を明らかにした。これらのタンパク質のうち二つはSmithella属SCADC及びMicrogenomatesにおいて見つけられるので、この推定新クラスのタンパク質は、Csm1(Smithella及びMicrogenomates由来のCRISPR関連タンパク質)と名付けられた。Cpf1タンパク質の様に、これらのCsm1タンパク質は、RuvCI、RuvCII、及びRuvCIIIドメインを含んでいるが、重要なことには、これらのドメインのアミノ酸配列は、Cpf1タンパク質アミノ酸配列、特にRuvCIIIドメインのもの、と較べしばしばかなり相違している。更に、Cpf1タンパク質と較べ、Csm1タンパク質におけるRuVCI-RuVCII及びRuVCII-RuVCIIIの間隔は有意に変化している。
【0254】
BLASTPアルゴリズムデフォルトパラメータ(blast.ncbi.nlm.nih.gov/Blast.cgi)を用いた既知のCpf1タンパク質とのSmithella属SCADC Csm1タンパク質(SmCsm1;配列番号160)のアライメントは、これらのタンパク質間でほとんど明らかな配列同一性を示さない。SmCsm1タンパク質におけるRuvCIドメインが、Cpf1タンパク質において存在し、対応する配列とよく並べられているように見える一方、Cpf1タンパク質によく保存されているRuvCII及びRuvCIII(Shmakovら(2016) Mol Cell60:385-397)は推定上のCsm1タンパク質には最初は存在しないように見えることは特に明らかである。HHPred(toolkit.tuebingen.mpg.de/hhpred;Sodingら(2006)Nucleic Acids Res 34:W374-W378)を採用する更なる分析は、このSmCsm1タンパク質の中の推定上のRuvCII及びRuvCIIIドメインを明らかにした。表9は、列挙されたRuvCII配列に対応する各配列リストのアミノ酸残基と共に、いくつかのCpf1及び推定上のCsm1タンパク質の推定上のRuvCIIに対応するドメイン及び代表的C2c1タンパク質を示している。推定上の活性残基は、列挙された各タンパク質について下線が引かれている。
【0255】
【0256】
表10は、列挙されたRuvCIII配列に対応する各配列リストのアミノ酸残基と共に、代表的C2c1タンパク質と合わせ、いくつかのCpf1及び推定上のCsm1タンパク質の推定上のRuvCIIIドメインを示している。推定上の活性残基は、列挙された各タンパク質について下線が引かれている。
【0257】
【0258】
表9と10に示されているように、推定Csm1タンパク質(配列番号134、147、159、160、及び230)について、HHPredによって同定されたRuvCII及びRuvCIIIドメインは、Cpf1タンパク質(上に示した代表的配列、配列番号6及び18)に見出されたものからは有意に異なる。特に、RuvCIIIドメインに中の活性残基に続くANGAYモチーフは、Cpf1タンパク質の間で非常によく保存されている(Shmakovら(2016) Mol Cell60:385-397、データはしめされていない)が、これらのCsm1タンパク質のほとんどにおいては存在しないか変化されている。Csm1、Cpf1、及びC2c1タンパク質(Shmakovら(2016) Mol Cell60:385-397)のRuvCII及びRuvCIIIドメインの分析は、Csm1 RuvCII配列がCpf1タンパク質に見出されるものに類似しており、一方Csm1 RuvCIII配列がC2c1タンパク質に見出されるものに類似しているので、Csm1タンパク質がCpf1及びC2c1タンパク質の間で中間体であるように見えることを示唆している。Csm1タンパク質のRuvCIIIドメインは、主にC2c1タンパク質配列中に捕存されているDXXAAモチーフを含んでいる。
【0259】
Csm1タンパク質がC2c1タンパク質と幾つかの配列類似性を共有する一方、これらのゲノムの前後関係は、Csm1タンパク質は、多くの点でCpf1タンパク質のように機能することを示している。具体的には、tracrRNAがcrRNA配列に部分的に相補的である状況で、C2c1タンパク質がcrRNA及びtracrRNAの両方を必要とすることである。Smithella属SCADC(配列番号238)からのCsm1をコードするORFを含むゲノム遺伝子座は、Csm1 ORF、Cas4 ORF、Cas1 ORF、及びCas2 ORFの後に、Cpf1様の直接の繰り返しを持つCRISPRのアレイを含んでいる。このことが、Cpf1をコードするゲノムにみられるゲノム構成と一致する(Shmakovら(2017)Nat Rev Microbiol doi:10.1038/nrmicro.2016.184)。対照的に、C2c1ゲノム構成は、融合したCas1/Cas4ORFを含む傾向がある。更に、含C2c1ゲノム遺伝子座は、crRNAアレイとcrRNA直接反復に対する部分的相補性を持つtracrRNAの両方をコードする傾向がある。Csm1をコードするORF及び組み込まれているcrRNA配列を含んでいるSmithella属SCADCゲノム遺伝子座の検査では、いかなるtrarRNA様配列も見つけられず、二本鎖切断を生成するのにtracrRNAを必要としないことを強く示唆していた。
【0260】
最近、CasXタンパク質と呼ばれる新しいクラスのヌクレアーゼが報告された(Bursteinら(2016)Nature http://dx.doi.org10.1038/nature20159)。Deltaproteobacteria(配列番号239)由来のCasXタンパク質は、Cas1、Cas4、及びCas2タンパク質をコードする領域並びにCRISPR繰り替えし領域、およびtracrRNAを含むゲノム領域に見出された約980のアミノ酸タンパク質として述べられている。CasXを述べているこの報告は、このtracrRNAはエンドヌクレアーゼの機能に必要とされており、Csm1タンパク質がtracrRNAを必要としないことと明らかに対照的であると結論付けている。SmCsm1(配列番号160)とDeltaproteobacterial CasX(配列番号239)のBLASTPアライメントは、非常に不良なアライメントであることを示した(データは示されていない)。このCasXタンパク質のHHRred分析を、推定RuvCI、RuvCII、及びRuvCIIIドメイン及びそれらのそれぞれの活性部位残基を同定するために採用した。
【0261】
Cpf1タンパク質と比較してCsm1タンパク質の推定RuvCI、RuvCII、及びRuvCIIIドメインの変化したアミノ酸配列に加え、これらのドメイン間の間隔がCsm1及びCpf1タンパク質間のものと有意に異なるように、タンパク質構成が有意に変えられている。表11は、これらの推定Csm1タンパク質(配列番号134、147、159、160、及び230)、Deltaproteobacterial CasXタンパク質(配列番号239)及び代表的C2c1タンパク質(配列番号237)における間隔と比べ、既知のCpf1タンパク質(AsCpf1及びLbCpf1;配列番号6および18)のRuVCサブドメイン中の活性残基間の間隔の比較を示している。表11のデータは、Cpf1、C2c1、及びCsm1タンパク質が、Cpf1に似たCasX RuvCI-RuvCII間隔とCsm1/C2c1に似たRuvCII-RuvCIII間隔である、特徴的なRuvCドメイン間隔を有することを明らかに示している。C2c1及びCsm1タンパク質におけるRuvCI、RuvCII、及びRuvCIIIの間隔は似ているが、Csm1系における異なるRuvCIII配列及びtracrRNAの欠如は、C2c1ヌクレアーゼとは別のものとして、Csm1ヌクレアーゼを分類することを支持している。
【0262】
【0263】
Cpf1タンパク質と比べ、Csm1タンパク質における異なるRuvCII及びRuvCIIIアミノ酸配列及びこれらのドメインの変化した配列とともに、多くの場合、HHPred分析は、FnCpf1(配列番号3)におけるD1225(AsCpf1(配列番号6)におけるD1234及びLbCpf1(配列番号18)におけるD1148)に対応するアミノ酸残基に対応するいかなるCsm1配列を見いだせなかったことには留意すべきである。FnCpf1D1225の突然変異分析は、この残基の突然変異がこのヌクレアーゼの触媒的活性を非常に有意に減少させることをしめしており、この残基の酵素的機能がCpf1酵素にとって非常に重要であることを示唆している(Zetscheら(2015)Cell163:759-771)。
【0264】
Cpf1タンパク質と較べCsm1タンパク質における推定RuvCドメインの変化したアミノ酸配列に加え、既知のCpf1タンパク質に基づくHHPred分析と対照すると、Csm1タンパク質のHHPred分析は、これらのN末端においてCpf1タンパク質と一致しないことを示している。FnCpf1アミノ酸配列(配列番号3)を用いたHHPred分析は、FnCpf1アミノ酸配列の全てにおいて100%の確率でAsCpf1(配列番号6)とLbCpf1(配列番号18)とのたった2つの一致のみである結果であった。対照的に、SmCsm1(配列番号160)を用いたHHPred分析は、SmCsm1のアミノ酸391-1017及び1003-1064に由来する領域をカバーするCpf1タンパク質との一致のみを見出している。アミノ酸1003-1030は、恐らくリジン生合成タンパク質、アミノ酸キャリアタンパク質、転写開始因子、50S及び30Sリボソームタンパク質、及びDNA指向性RNAポリメラーゼを含む様々なタンパク質との一致を見出している。Csm1の初めの390個のアミノ酸に一致するものは、このHHPred分析では、見いだせない。追加のCsm1タンパク質(配列番号134、147、159、160、及び230)を用いた同様のHHPred分析は、これらのCsm1タンパク質のN末端についての一致も見出すことはできず、これらのタンパク質は、Cpf1タンパク質といくつかの類似性を共有するが、Cpf1タンパク質そのものではないという結論を更に支持している。
【0265】
実施例14 Csm1の機能的特性
Cpf1タンパク質と較べ、Csm1タンパク質の異なる性質を考慮して、我々は、これらのタンパク質がDSBを生体内で生成しうることを確認しようと努めた。Csm1タンパク質のアミノ酸配列が、Cpf1タンパク質と較べかなり異なっている一方、これらのCsm1タンパク質の源である生物のゲノム分析は、CRISPRアレイ(データは示されていない)を明らかにし、これらのタンパク質が実際機能的であることを示唆している。
【0266】
実験81(表7)では、イネCAO1遺伝子座でDSBを実行するSmithella属SCADC Csm1酵素(配列番号185によってコードされる、配列番号160)の能力を試験した。この実験に用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAをハイグロマイシン耐性イネカルス片から抽出し、T7EIアッセイに付した。イネCAO1ゲノム遺伝子座のPCR増幅に続いて、T7EI分析により予期した部位にインデルを含んでいる本実験からの3つのカルス片を同定した。このカルスのCAO1座にある配列を同定するためこれらのイネカルス由来のPCR産物をサンガー配列決定により分析した。
図3Aは、各ガイドRNAにより標的とされたCAO1座の予期した部位の、番号81-46のカルス片にある8塩基対の欠失、番号81-30のカルス片にある同一の8塩基対の欠失、及び番号81-9のカルス片にある12塩基対の欠失で、これらの配列アッセイの結果を示しており、Smithella属SCADC Csm1酵素によるこの部位の忠実なDSB生成を示している。
【0267】
実験93(表7)では、イネCAO1遺伝子座でDSBを実行するSulfuricurvum属Csm1酵素(配列番号186によってコードされる、配列番号147)の能力を試験した。この実験に用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAをハイグロマイシン耐性イネカルス片から抽出し、T7EIアッセイに付した。イネCAO1ゲノム遺伝子座のPCR増幅に続いて、T7EI分析により予期した部位にインデルを含んでいる本実験からの一つのカルス片を同定した。このカルスのCAO1座にある配列を同定するため番号93-47のイネカルス片由来のPCR産物をサンガー配列決定により分析した。
図3Aは、各ガイドRNAにより標的とされたCAO1座の予期した部位の、番号93-47のカルス片にある42塩基対の欠失で、これらの配列アッセイの結果を示しており、Sulfuricurvum属Csm1酵素によるこの部位の忠実なDSB生成を示している。
【0268】
実験97(表7)では、イネCAO1遺伝子座でDSBを実行するMicrogenomates(Roizmanbacteria)bacterium Csm1酵素(配列番号193によってコードされる、配列番号134)の能力を試験した。この実験に用いられたプラスミドによるイネカルスのボンバードメントに続いて、DNAをハイグロマイシン耐性イネカルス片から抽出し、T7EIアッセイに付した。イネCAO1ゲノム遺伝子座のPCR増幅に続いて、T7EI分析により、予期した部位にインデルを含んでいる本実験からの三つのカルス片を同定した。番号97-112、97-130、及び97-141のカルス片は、Microgenomates(Roizmanbacteria)bacterium Csm1酵素によるこの部位での忠実なDSB生成と一致するT7EI実験分析におけるバンドパターンを示した。番号97-112及び97-141のカルス片から抽出したDNAを配列分析(
図3A)に付した。この配列分析は、これらのカルスに同一の8塩基対の欠失を示し、Microgenomates(Roizmanbacteria)bacterium Csm1酵素によるこの部位での忠実なDSB生成を示している。
前記改変されたヌクレオチド配列が、細胞ゲノムへの異種DNAの挿入、細胞ゲノムからのヌクレオチド配列の欠失、又は細胞ゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項1に記載の方法。
前記改変されたヌクレオチド配列が、細胞ゲノムへの異種DNAの挿入、細胞ゲノムからのヌクレオチド配列の欠失、又は細胞ゲノムにおける少なくとも1つのヌクレオチドの突然変異を含む、請求項2に記載の方法。
前記改変されたヌクレオチド配列が、形質転換細胞に抗生物質耐性又は除草剤耐性を与えるタンパク質をコードするポリヌクレオチドの挿入を含む、請求項1に記載の方法。