(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-10-30
(54)【発明の名称】ゲノム編集の改善のための操作されたCasエンドヌクレアーゼバリアント
(51)【国際特許分類】
C12N 15/09 20060101AFI20231023BHJP
C12N 15/55 20060101ALI20231023BHJP
C12N 15/31 20060101ALI20231023BHJP
C07K 14/315 20060101ALI20231023BHJP
C12N 9/16 20060101ALI20231023BHJP
【FI】
C12N15/09 110
C12N15/55 ZNA
C12N15/31
C07K14/315
C12N9/16 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023522947
(86)(22)【出願日】2021-10-13
(85)【翻訳文提出日】2023-06-08
(86)【国際出願番号】 US2021071839
(87)【国際公開番号】W WO2022082179
(87)【国際公開日】2022-04-21
(32)【優先日】2020-10-14
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-04-08
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-06-02
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-06-19
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-13
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500207899
【氏名又は名称】パイオニア ハイ-ブレッド インターナショナル, インコーポレイテッド
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100095360
【氏名又は名称】片山 英二
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(72)【発明者】
【氏名】アラルコン,クララ
(72)【発明者】
【氏名】ガスイオアー,ステファン ローレンス
(72)【発明者】
【氏名】ホウ,ゼングリン
(72)【発明者】
【氏名】ファン ヒンケル,エリザベス ソマーズ
(72)【発明者】
【氏名】ヤング,ジョシュア ケイ.
【テーマコード(参考)】
4H045
【Fターム(参考)】
4H045AA10
4H045AA30
4H045BA10
4H045CA11
4H045DA89
4H045EA50
4H045FA74
(57)【要約】
新規の操作されたCasエンドヌクレアーゼを使用する、細胞のゲノム中の標的配列のゲノム改変のための組成物及び方法が提供される。この方法及び組成物は、ガイドポリヌクレオチド/エンドヌクレアーゼシステムを用いて、細胞又は生物のゲノム内の標的配列を改変するか又は変化させるための有効なシステムを提供する。エンドヌクレアーゼを含むガイドポリヌクレオチド/エンドヌクレアーゼシステム等の、新規のエフェクター及びエンドヌクレアーゼシステム並びにそのようなシステムを含むエレメントも提供される。少なくとも1つのさらなるタンパク質サブユニットに任意選択的に共有結合若しくは非共有結合で連結されるか又はそれと集合された少なくとも1つのエンドヌクレアーゼを含むガイドポリヌクレオチド/エンドヌクレアーゼシステムのための組成物及び方法、並びにリボヌクレオチドタンパク質としてエンドヌクレアーゼを直接送達するための組成物及び方法も提供される。
【特許請求の範囲】
【請求項1】
操作されたCasポリペプチドであって、
(a)C末端三スプリット型RuvCドメイン及び3つのジンクフィンガーモチーフ;
並びに
(b)配列番号20とのアラインメントに対する位置での下記のアミノ酸の内の1つ又は複数:226でのグリシン、230でのグリシン、327でのグルタミン酸、329でのグルタミン酸、376でのシステイン、379でのシステイン、395でのシステイン、398でのシステイン、及び406でのシステイン
を含み、
前記操作されたCasポリペプチドは、下記:相対的な38位置でのフェニルアラニン、相対的な40位でのアラニン、相対的な79位でのヒスチジン、相対的な81位でのグルタミン酸、相対的な87位でのアラニン、相対的な335位でのスレオニン、相対的な409位でのシステイン、相対的な421位でのグルタミン酸、相対的な467位でのリシン、又は相対的な468位でのグルタミン酸の内の少なくとも1つを含まず、
前記操作されたCasポリペプチドは、ポリヌクレオチドの標的部位に部位特異的に結合し得る、
操作されたCasポリペプチド。
【請求項2】
配列番号23~26、31~44、80~85、90~142、197、及び331~333からなる群から選択される配列に対して少なくとも95%の同一性を共有するポリヌクレオチドを含む操作されたCasポリペプチド。
【請求項3】
下記:相対的な38位でのアスパラギン酸若しくはグルタミン酸、相対的な40位でのグリシン、相対的な79位でのアスパラギン酸、相対的な81位でのグリシン、相対的な87位でのリシン、相対的な120位でのプロリン、相対的な149位でのアスパラギン酸、相対的な190位でのリシン、相対的な217位でのヒスチジン、相対的な293位でのヒスチジン、相対的な298位でのセリン、相対的な306位でのフェニルアラニン、相対的な313位でのセリン、相対的な325位でのアスパラギン、相対的な335位でのアルギニン、相対的な338位でのバリン、相対的な405位でのアスパラギン、相対的な409位でのリシン若しくはアルギニン、相対的な421位でのアスパラギン若しくはアルギニン、相対的な430位でのプロリン、相対的な467位でのアルギニン、又は相対的な468位でのプロリンの内の少なくとも1つをさらに含む請求項1又は2に記載の操作されたCasポリペプチド。
【請求項4】
前記操作されたCasポリペプチドは、下記の温度:約40℃、約37℃、約35℃、約30℃、約25℃、又は約20℃の内の1つ又は複数にて、配列番号20と比べて高い活性を有するエンドヌクレアーゼである、請求項1~3のいずれか一項に記載の操作されたCasポリペプチド。
【請求項5】
前記ポリペプチドは、約500個未満のアミノ酸の長さを有する、請求項1~4のいずれか一項に記載の操作されたCasポリペプチド。
【請求項6】
前記ポリペプチドは、複合体中に存在しており、前記複合体は、二本鎖DNAポリヌクレオチド上の標的部位を含む、請求項1~5のいずれか一項に記載の操作されたCasポリペプチド。
【請求項7】
ポリヌクレオチドの前記標的部位に相補的な領域を含む可変ターゲティングドメインを含むガイドポリヌクレオチドをさらに含む、請求項1~5のいずれか一項に記載の操作されたCasポリペプチド。
【請求項8】
前記ガイドポリヌクレオチド可変ターゲティングドメインは、20個未満のヌクレオチドを含む、請求項7に記載の操作されたCasポリペプチド。
【請求項9】
前記操作されたCasポリペプチドは、標的ポリヌクレオチド上のPAM配列を認識し、前記ガイドポリヌクレオチド及び前記Casポリペプチドは、二本鎖DNAポリヌクレオチド上の前記標的部位に結合する複合体を形成する、請求項7又は8に記載の操作されたCasポリペプチド。
【請求項10】
前記Casポリペプチドは、二本鎖DNAポリヌクレオチドを開裂するエンドヌクレアーゼである、請求項1~9のいずれか一項に記載の操作されたCasポリペプチド。
【請求項11】
前記操作されたCasポリペプチドは、エンドヌクレアーゼ活性に対して触媒的に不活性である、請求項1~3又は6~10のいずれか一項に記載の操作されたCasポリペプチド。
【請求項12】
前記操作されたCasポリペプチドは、N(T>W>C)TTCを含むPAM配列を認識する、請求項1~11のいずれか一項に記載の操作されたCasポリペプチド。
【請求項13】
前記Casポリペプチドは、融合タンパク種の一部である、請求項1~12のいずれか一項に記載の操作されたCasポリペプチド。
【請求項14】
前記Casポリペプチドは、融合タンパク質の一部であり、前記融合タンパク質は、異種ヌクレアーゼドメインをさらに含む、請求項1~13のいずれか一項に記載の操作されたCasポリペプチド。
【請求項15】
デアミナーゼをさらに含む請求項1~14のいずれか一項に記載の操作されたCasポリペプチド。
【請求項16】
請求項1~15のいずれか一項に記載の操作されたCasポリペプチドを含む合成組成物であって、異種ポリヌクレオチドをさらに含む合成組成物。
【請求項17】
前記異種ポリヌクレオチドは、発現エレメント、導入遺伝子、ドナーDNA分子、又はポリヌクレオチド改変鋳型である、請求項16に記載の合成組成物。
【請求項18】
前記異種ポリヌクレオチドは、温度誘導性プロモーターである、請求項16に記載の合成組成物。
【請求項19】
合成組成物であって、
(a)請求項1~15のいずれか一項に記載の操作されたCasポリペプチド;
(b)標的二本鎖DNAポリヌクレオチド;
及び
(c)標的二本鎖DNAポリヌクレオチドに相補的な領域を含む可変ターゲティングドメインを含むガイドポリヌクレオチド
を含み、
前記Casポリペプチドは、前記標的二本鎖DNAポリヌクレオチド上のPAM配列を認識し、前記ガイドポリヌクレオチド及び前記Casポリペプチドは、前記標的二本鎖DNAポリヌクレオチドに結合する複合体を形成している、
合成組成物。
【請求項20】
請求項1~15のいずれか一項に記載の操作されたCasポリペプチド又は請求項16~19のいずれか一項に記載の合成組成物をコードするポリヌクレオチド。
【請求項21】
前記ポリヌクレオチドは、前記操作されたCasポリペプチドと、少なくとも1種の発現エレメントとをコードする、請求項20に記載のポリヌクレオチド。
【請求項22】
前記ポリヌクレオチドは、前記操作されたCasポリペプチドと、遺伝子とをコードする、請求項20に記載のポリヌクレオチド。
【請求項23】
前記Casポリペプチドは、固体マトリックスに付着しているか、又は前記Casポリペプチドは、ガイドポリヌクレオチドと複合体化しており、前記Casポリペプチド/ガイドポリヌクレオチド複合体は、固体マトリックスに付着している、請求項1~16のいずれか一項に記載の操作されたCasポリペプチド。
【請求項24】
請求項1~15のいずれか一項に記載の操作されたCasポリペプチド、請求項16~19のいずれか一項に記載の合成組成物、又は請求項20~22のいずれか一項に記載のポリヌクレオチドを含む真核細胞。
【請求項25】
前記真核細胞は、植物細胞、動物細胞、又は真菌細胞である、請求項24に記載の真核細胞。
【請求項26】
前記真核細胞は、単子葉植物細胞又は双子葉植物細胞である、請求項24に記載の真核細胞。
【請求項27】
前記植物細胞は、トウモロコシ、ダイズ、ワタ、コムギ、キャノーラ、アブラナ、モロコシ、イネ、ライムギ、オオムギ、キビ、カラスムギ、サトウキビ、芝草、スイッチグラス、アルファルファ、ヒマワリ、タバコ、ピーナッツ、ジャガイモ、アラビドプシス(Arabidopsis)、ベニバナ、又はトマト由来の細胞である、請求項26に記載の真核細胞。
【請求項28】
前記真核細胞は、約40℃以下、約37℃以下、約35℃以下、約30℃以下、約25℃以下、又は約20度以下の温度で存在している、請求項24~27のいずれか一項に記載の真核細胞。
【請求項29】
標的ポリヌクレオチド中に標的化編集を導入する方法であって、
(a)請求項7~9のいずれか一項に記載のCasポリペプチド及びガイドポリヌクレオチドを準備することであって、前記Casポリペプチド/ガイドポリヌクレオチドは、前記標的ポリヌクレオチド上のPAM配列を認識する複合体を形成する、準備すること;
並びに
(b)前記Casポリペプチド/ガイドポリヌクレオチド複合体と、前記標的とを接触させること;
並びに
(c)前記標的ポリヌクレオチド中に標的化編集を導入すること
を含む方法。
【請求項30】
前記標的ポリヌクレオチドは、細胞の標的ゲノム配列であり、前記方法は、
(i)前記Casポリペプチド/ガイドポリヌクレオチド複合体を前記細胞に送達すること;
(ii)前記細胞を、約40℃以下、約37℃以下、約35℃以下、約30℃以下、約25℃以下、又は約20度以下の温度でインキュベートすること;
(iii)前記細胞の前記標的ゲノム配列中の少なくとも1つのヌクレオチドを改変して、前記Casポリペプチド/ガイドポリヌクレオチド複合体の送達前の前記細胞の前記標的ゲノム配列と比較して改変されたゲノム配列を生成すること;
及び
(iv)前記細胞から全生物を生成することであって、前記生物は、前記改変されたゲノム配列を含む、生成すること
を含む、請求項29に記載の方法。
【請求項31】
前記細胞は、真核細胞である、請求項30に記載の方法。
【請求項32】
前記真核細胞は、動物、真菌、又は植物に由来するか又はそれから得られる、請求項31に記載の方法。
【請求項33】
前記真核細胞は、単子葉植物又は双子葉植物である植物に由来する、請求項32に記載の方法。
【請求項34】
前記植物は、トウモロコシ、ダイズ、ワタ、コムギ、キャノーラ、アブラナ、モロコシ、イネ、ライムギ、オオムギ、キビ、カラスムギ、サトウキビ、芝草、スイッチグラス、アルファルファ、ヒマワリ、タバコ、ピーナッツ、ジャガイモ、アラビドプシス(Arabidopsis)、ベニバナ、及びトマトからなる群から選択される、請求項33に記載の方法。
【請求項35】
前記ガイドポリヌクレオチド可変ターゲティングドメインは、20個未満のヌクレオチドを含む、請求項29~34のいずれか一項に記載の方法。
【請求項36】
異種ポリヌクレオチドを提供することをさらに含む請求項29~35のいずれか一項に記載の方法。
【請求項37】
前記異種ポリヌクレオチドは、ドナーDNA分子である、請求項36に記載の方法。
【請求項38】
前記異種ポリヌクレオチドは、前記細胞中の配列と少なくとも50%同一の配列を含むポリヌクレオチド改変鋳型である、請求項36に記載の方法。
【請求項39】
前記異種ポリヌクレオチドは、誘導性プロモーターである、請求項36に記載の方法。
【請求項40】
前記標的化編集を、約40℃以下、約37℃以下、約35℃以下、約30℃以下、約25℃以下、又は約20度以下の温度で導入する、請求項29~39のいずれか一項に記載の方法。
【請求項41】
請求項12に記載の不活性化された操作されたCasポリペプチドであって、前記不活性化されたCasポリペプチドは、
(a)配列番号21のアミノ酸配列、
(b)配列番号143のアミノ酸配列、
(c)配列番号144のアミノ酸配列、
又は
(d)配列番号20とのアラインメントに対する位置での下記のアミノ酸の内の1つ若しくは複数:相対的な228位でのアラニン、相対的な327位でのアラニン、434位でのアラニン
を含む、不活性化された操作されたCasポリペプチド。
【請求項42】
前記不活性化されたポリペプチドは、エフェクター、エフェクタータンパク質、塩基編集分子、又はデアミナーゼに連結されている、請求項12又は41に記載の不活性化された操作されたCasポリペプチド。
【請求項43】
請求項1~15のいずれか一項に記載のCasポリペプチド、請求項20~22のいずれか一項に記載のポリヌクレオチド、又は請求項23に記載のCasエンドヌクレアーゼ及び固体マトリックスを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
電子的に提出された配列表の参照
配列表の正式な写しは、2021年10月12日に作成された8534-WO-PCT_ST25.txtというファイル名の、サイズが489キロバイトであるASCIIフォーマットの配列表としてEFS-Webを介して電子的に提出されており、且つ本明細書と同時に提出されている。このASCIIフォーマット文書に含まれる配列表は、本明細書の一部であり、全体が参照により本明細書に組み込まれる。
【0002】
本開示は、分子生物学の分野に関し、特に、新規のRNA誘導型Casエンドヌクレアーゼシステムの組成物、並びに細胞のゲノムを編集するか又は改変するための組成物及び方法に関する。
【背景技術】
【0003】
組換えDNA技術により、標的のゲノム位置にDNA配列を挿入し、且つ/又は特定の内在性染色体配列を改変することが可能になった。部位特異的組換えシステムを使用する部位特異的組み込み技術は、他の種類の組換え技術と同様に、様々な生物における目的の遺伝子の標的化される挿入の生成に使用されている。デザイナージンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、又はホーミングメガヌクレアーゼ等のゲノム編集技術は、標的ゲノムパータベーションの生成に利用可能であるが、これらの系は、特異性が低く、各標的部位用に再設計することが必要であり、そのために作製に多額の費用及び時間を要する設計ヌクレアーゼを使用する傾向がある。
【0004】
多様な活性(DNAの認識、結合、及び任意選択的な開裂)を包含するエフェクタータンパク質の様々なドメインを含むCRISPR(クラスター化規則的配置短回文配列リピート)と称される古細菌又は細菌の適応免疫系を利用するより新しい技術が同定されている。
【0005】
これらの系のいくつかの同定及び特徴付けにもかかわらず、内在性の及び以前に導入された異種ポリヌクレオチドの編集を行うために、新規のエフェクター及び系を操作すること並びに真核生物(特に、動物及び植物)における活性を実証することが依然として必要とされている。
【0006】
本明細書では、新規の操作されたCasポリペプチド及びエンドヌクレアーゼ、並びにこれらの使用のための方法及び組成物が説明されている。
【発明の概要】
【0007】
本明細書で開示されているのは、新規の操作されたCasポリペプチドの組成物、及びその使用方法である。このCasポリペプチドは、ガイドポリヌクレオチドにより誘導されて、PAM依存的に二本鎖DNAを標的とし得る。一部の実施形態では、この操作されたCasポリペプチドは、標的二本鎖DNAの標的部位で切断を導入可能な活性エンドヌクレアーゼである。一部の実施形態では、このCasポリペプチドは、このCasポリペプチドを、二本鎖切断を不可能にするが一本鎖切断を可能にする1つ又は複数の変異を含む。一部の実施形態では、このCasポリペプチドは、このCasポリペプチドを、二本鎖ポリヌクレオチドのいずれか又は両方の鎖の開裂を不可能にするが、標的ポリヌクレオチド配列に結合する能力を保持させる1つ又は複数の変異を含む。
【0008】
一態様では、少なくとも1つのジンクフィンガー様ドメイン、少なくとも1つのブリッジヘリックス様ドメイン、三スプリット型RuvCドメイン(非連続のRuvC-Iドメイン、RuvC-IIドメイン、及びRuvC-IIIドメインを含む)を含み、任意選択的に異種ポリヌクレオチドを含む新規の操作されたCasポリペプチドが提供される。同様に提供されるのは、この新規の操作されたCasポリペプチド又はエンドヌクレアーゼを含む合成組成物である。
【0009】
任意の態様では、組成物又は方法のいずれかにおいて、真核細胞、特に、植物細胞、真菌細胞、又は動物細胞における発現に最適化されている少なくとも1種の構成要素が提供される。
【0010】
一態様では、シントロフォモナス・パルミタチカ(Syntrophomonas palmitatica)から得られるか又は由来する天然エフェクタータンパク質とは異なるアミノ酸配列を含むように操作されたCRISPR-Casエフェクタータンパク質をコードするポリヌクレオチドを含む合成組成物が提供される。
【0011】
一態様では、真核細胞及び異種CRISPR-Casエフェクターを含む合成組成物であって、前記異種CRISPR-Casエフェクタータンパク質は、約500個未満のアミノ酸を含む、合成組成物が提供される。
【0012】
一態様では、CRISPR-Casポリヌクレオチド又はエンドヌクレアーゼを含む合成組成物であって、前記CRISPR-Casポリヌクレオチド又はエンドヌクレアーゼは、配列番号20とアラインされた場合には、配列番号20のアミノ酸位置番号に対して、下記:相対的な38位でのアスパラギン酸若しくはグルタミン酸、相対的な40位でのグリシン、相対的な79位でのアスパラギン酸、相対的な81位でのグリシン、相対的な87位でのリシン、相対的な120位でのプロリン、相対的な149位でのアスパラギン酸、相対的な190位でのリシン、相対的な217位でのヒスチジン、相対的な293位でのヒスチジン、相対的な298位でのセリン、相対的な306位でのフェニルアラニン、相対的な313位でのセリン、相対的な325位でのアスパラギン、相対的な335位でのアルギニン、相対的な338位でのバリン、相対的な405位でのアスパラギン、相対的な409位でのリシン若しくはアルギニン、相対的な421位でのアスパラギン若しくはアルギニン、相対的な430位でのプロリン、相対的な467位でのアルギニン、又は相対的な468位でのプロリンの内の少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、又は7個を含む、合成組成物が提供される。
【0013】
一態様では、配列番号20とアラインされた場合には、操作されたCasポリペプチド又はエンドヌクレアーゼは、下記:相対的な38位でのフェニルアラニン、相対的な40位でのアラニン、相対的な79位でのヒスチジン、81位でのグルタミン酸、相対的な87位でのアラニン、相対的な335位でのスレオニン、相対的な409位でのシステイン、相対的な421位でのグルタミン酸、相対的な467位でのリシン、又は相対的な468位でのグルタミン酸の内の少なくとも1つを含まない。
【0014】
一態様では、CRISPR-Casポリペプチド又はエンドヌクレアーゼを含む合成組成物であって、前記CRISPR-Casエンドヌクレアーゼは、下記のモチーフ:GxxxG、ExL、及び/又は1つ若しくは複数のCxn(C,H)(n=1つ若しくは複数のアミノ酸、このモチーフは、例えば、CxnC若しくはCxnHであり得る)の内の1つ、2つ、又は3つを含む、合成組成物が提供される。
【0015】
一態様では、CRISPR-Casポリペプチド又はエンドヌクレアーゼを含む合成組成物であって、前記CRISPR-Casエンドヌクレアーゼは、1つ又は複数のジンクフィンガーモチーフを含む、合成組成物が提供される。
【0016】
一態様では、合成組成物であって、配列番号23~26、31~44、80~85、90~142、197、及び331~333からなる群から選択される配列の少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400個、又は400個を超える連続するアミノ酸と少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有するCRISPR-Casエフェクタータンパク質を含む合成組成物が提供される。
【0017】
一態様では、合成組成物であって、配列番号23~26、31~44、80~85、90~142、197、及び331~333からなる群から選択されるポリペプチドの少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400個、又は400個を超えるアミノ酸と少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有するCRISPR-Casエフェクタータンパク質をコードするポリヌクレオチドを含む合成組成物が提供される。
【0018】
一態様では、合成組成物であって、標的部位の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個、又は30個を超える連続するヌクレオチドと少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有するポリヌクレオチドとハイブリダイズし得るCRISPR-Casエフェクタータンパク質をコードするポリヌクレオチドを含む合成組成物が提供される。
【0019】
一態様では、本明細書の方法及び組成物のいずれに関して、ガイドポリヌクレオチドの可変ターゲティングドメイン部分は、20個未満のリボヌクレオチドを含む。
【0020】
本明細書中の方法又は組成物のいずれかは、異種ポリヌクレオチドをさらに含み得る。この異種ポリヌクレオチドは、非コード調節発現エレメント、例えば、プロモーター、イントロン、エンハンサー、又はターミネーター;ドナーポリヌクレオチド;細胞中のポリヌクレオチド配列と比較して少なくとも1つのヌクレオチド改変を任意選択的に含むポリヌクレオチド改変鋳型;導入遺伝子;ガイドRNA;ガイドDNA;ガイドRNA-DNAハイブリッド;エンドヌクレアーゼ;核局在化シグナル;及び細胞トランジットペプチドからなる群から選択され得る。
【0021】
一態様では、本明細書中で開示されている組成物のいずれかを使用するための方法が提供される。一部の実施形態では、例えば、細胞のゲノム中又はインビトロでCasポリペプチド又はエンドヌクレアーゼをポリヌクレオチドの標的配列に結合させるための方法が提供される。一部の実施形態では、Casポリペプチド又はエンドヌクレアーゼは、ガイドポリヌクレオチド(例えばガイドRNA)と複合体を形成する。一部の実施形態では、複合体は、標的配列で又はその付近でポリヌクレオチド中のニック(一本鎖)又は切断(二本鎖)を認識し、それに結合し、且つ任意選択的に生成する。一部の実施形態では、ニック又は切断は、非相同末端結合(NHEJ)により修復される。一部の実施形態では、ニック又は切断は、ポリヌクレオチド改変鋳型又はドナーDNA分子を用いて、相同組換え修復(HDR)又は相同組換え(HR)により修復される。
【0022】
任意の態様では、操作されたCasポリペプチド又はエンドヌクレアーゼは、合成組成物中に存在し得、且つ約45℃未満の温度でインキュベートされ得、例えば、約40℃以下、約37℃以下、約35℃以下、約30℃以下、約28℃以下、又は約25℃以下の温度でインキュベートされ得る。そのため、同様に提供されるのは、ポリヌクレオチドと、本明細書で開示されている任意の操作されたCasエンドヌクレアーゼとを接触させること、及び約45℃未満の温度(例えば、約40℃以下、約35℃以下、約30度以下、約28℃以下、又は約25℃以下の温度)でポリヌクレオチド中に切断を生じさせることを含む方法である。この切断を使用して、ポリヌクレオチド中に標的化改変又は変更標的部位(例えば、塩基の編集、欠失、又は挿入)を生成し得る。
【0023】
本明細書で説明されている新規の操作されたCasエンドヌクレアーゼは、任意の原核細胞又は真核細胞において、適切なPAMを含み且つガイドポリヌクレオチドによって誘導される標的ポリヌクレオチドにおいて又はそれに隣接して二本鎖切断を生成し得る。一部の例では、細胞は、植物細胞、又は動物細胞、又は真菌細胞である。一部の例では、植物細胞は、トウモロコシ、ダイズ、ワタ、コムギ、キャノーラ、アブラナ、モロコシ、イネ、ライムギ、オオムギ、キビ、カラスムギ、サトウキビ、芝草、スイッチグラス、アルファルファ、ヒマワリ、タバコ、ピーナッツ、ジャガイモ、タバコ、アラビドプシス(Arabidopsis)、ベニバナ、及びトマトからなる群から選択される。
【0024】
別の態様では、本明細書で説明されている操作されたCasポリペプチドは、ヌクレアーゼ不活性化又は死滅Casポリペプチドをもたらす1つ又は複数の変異を含む。例えば、本明細書で開示されている操作されたCasポリペプチドは、配列番号20とのアラインメントに対して、相対的な228位でのアラニン、相対的な327位でのアラニン、又は434位でのアラニンを含むように変更され得る。同様に開示されているのは、配列番号21、配列番号143、又は配列番号144のアミノ酸配列を含む不活性化Casポリペプチドである。本開示の不活性化された操作されたCasポリペプチドは、エフェクター又はエフェクタータンパク質と連結され得、このエフェクター又はエフェクタータンパク質は、ポリヌクレオチド標的を認識、それに結合し、及び/又は開裂するか若しくは切れ目を入れる分子であり得る。本開示の不活性化された操作されたCasポリペプチドは、標的化塩基編集のために、塩基編集分子(例えばデアミナーゼ)に連結され得る。エフェクター又はエフェクタータンパク質に作動可能に連結された本開示の不活性化された操作されたCasポリペプチドは、約45℃以下、約40℃以下、約37℃以下、約35℃以下、約30℃以下、約25℃以下、又は約20℃以下の温度で、エフェクター分子の標的化送達に使用され得る。
【0025】
図面及び配列表の簡単な説明
本開示は、本出願の一部を形成する下記の詳細な説明並びに付随する図面及び配列表から、より十分に理解され得る。
【図面の簡単な説明】
【0026】
【
図1】Casエンドヌクレアーゼバリアント酵母発現ベクターを示しており、ここで、A=ROX3プロモーター(配列番号1);B=酵母最適化Casエンドヌクレアーゼ遺伝子(配列番号2);C=SV40 NLSをコードする配列(配列番号3);D=CYC1 ターミネーター(配列番号4)==;E=SNR52プロモーター(配列番号5);F=ハンマーヘッド型リボザイムをコードする配列(配列番号7);G=CasエンドヌクレアーゼsgRNAをコードする配列(Casエンドヌクレアーゼ認識ドメイン)(配列番号8);H=CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン1をコードする配列(配列番号9);I=CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン2をコードする配列(配列番号10);J=CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン3をコードする配列(配列番号11);K=CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン4をコードする配列(配列番号12);L=CasエンドヌクレアーゼsgRNA1をコードする配列(配列番号13);M=CasエンドヌクレアーゼsgRNA2をコードする配列(配列番号14);N=CasエンドヌクレアーゼsgRNA3をコードする配列(配列番号15);O=CasエンドヌクレアーゼsgRNA4をコードする配列(配列番号16);P=デルタ型肝炎ウイルスリボザイム(配列番号17);Q=SUP4ターミネーター(配列番号18);dB=酵母最適化ヌクレアーゼ不活性化又は死滅Casエンドヌクレアーゼ遺伝子(配列番号19)。配列番号は、例示である。
【
図2】Casエンドヌクレアーゼのポリペプチド配列(配列番号20)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。
【
図3】ヌクレアーゼ不活性化(死滅)Casエンドヌクレアーゼのポリペプチド配列(配列番号21)である。アラニンで置換された重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。
【
図4A】
図4:
図4Aは、S.セレビシエ(S.cerevisiae)での標的開裂検出に関する概要であり、標的開裂及び細胞修復により、アデニン栄養要求性、及び白色から赤色/ピンク色の細胞表現型への切り替えをもたらす非機能性ade2遺伝子が形成される。
図4Bは、標的化DSB活性が改善されているCasエンドヌクレアーゼバリアント及び/又は関連するガイドRNAを発現する細胞を選択するために使用される表現型の差違を示す。1枚目の画像(左端)は、機能性ade2遺伝子を有するコロニー(白色)を示す。2枚目の画像は、非機能性ade2遺伝子を有するコロニーを示す。3枚目の画像は、非機能性ade2遺伝子を含む複数のセクターを有するコロニー(斑点状の外観)を示す。4枚目の画像(右端)は、非機能性ade2遺伝子を含む単一のセクターを有するコロニー(赤色部分を有する白色)を示す。白黒写真では、赤色部分は、白色部分と比較して濃い陰影として表示されており、且つ矢印で示されている。
【
図5】バリアントCasエンドヌクレアーゼA40Gのポリペプチド配列(配列番号23)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40位を、太字の二重下線フォントで示す。
【
図6】バリアントCasエンドヌクレアーゼE81Gのポリペプチド配列(配列番号24)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸81位を、太字の二重下線フォントで示す。
【
図7】バリアントCasエンドヌクレアーゼA40G+E81Gのポリペプチド配列(配列番号25)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40位及び81位を、太字の二重下線フォントで示す。
【
図8A】
図8:
図8Aは、赤色のade2表現型を含む酵母コロニーの割合を示す。形質転換後、蒔いた細胞を、一晩37℃でインキュベートし、次いで、コロニーが見えるまで30℃で増殖させ(典型的には2日間)、その時点で採点した。
図8Bは、赤色のade2表現型を含む酵母コロニーの割合を示す。形質転換後、蒔いた細胞を、一晩45℃でインキュベートし、次いで、コロニーが見えるまで30℃で増殖させ、その時点で採点した。コロニーを、完全に赤色(2)、複数の赤色セクター(3)、又は単一の赤色セクター(4)と採点した。赤色コロニーの割合を、各群(2、3、及び4)での赤色コロニーの数をコロニーの総数で除算することにより算出した。
【
図9】30℃、37℃、及び45℃での、20ntスペーサーを有するsgRNA1(配列番号27)を有する「死滅」/不活性化Casエンドヌクレアーゼ(配列番号21)の活性を示す。
【
図10】20ntスペーサーを有するsgRNA1の配列(配列番号27)を示す。
【
図11】18ntスペーサーを有するsgRNA2の配列(配列番号28)を示す。
【
図12】18ntスペーサー(配列番号28)を使用した場合での、赤色のade2表現型を含む酵母コロニーの割合を示す。形質転換後、蒔いた細胞を、一晩37℃又は45℃でインキュベートし、次いで、コロニーが見えるまで30℃で増殖させ(典型的には2日間)、その時点で、コロニーを、完全に赤色(2)、複数の赤色セクター(3)、又は単一の赤色セクター(4)と採点した。赤色コロニーの割合を、各群(2、3、及び4)での赤色コロニーの数をコロニーの総数で除算することにより算出した。
【
図13】アルギニンスキャン及びジンクフィンガー飽和変異誘発ライブラリーから同定されたバリアントに関して、赤色のade2表現型を含む酵母コロニーの割合を示す。A40G+E81Gと組み合わせて、37℃での一晩のインキュベーションによりアッセイした場合では、T335R、C409K、C409R、及びE421Nは、活性の改善を示したが、E421R、K467R、及びE468Pは、赤色コロニーの回復に劇的な影響を及ぼさない中性的であると思われた。A40G+E81G(配列番号25)に対して、A40G+E81G+T335R(配列番号38(
図22))は、スコアが3である赤色の酵母コロニー回復において、約10倍の増加を提供する最大の増強をもたらした。A40G+E81G+C409K(配列番号39(
図23))、A40G+E81G+C409R(配列番号40(
図24))、及びA40G+E81G+E421N(配列番号41(
図25))は、A40G+E81G(配列番号25)と比較した場合に、約6~8倍の改善が得られた。
【
図14】バリアントCasエンドヌクレアーゼA40G+E81G+T335Rのポリペプチド配列(配列番号38)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40、81、及び335位を、太字の二重下線フォントで示す。
【
図15】バリアントCasエンドヌクレアーゼA40G+E81G+C409Kのポリペプチド配列(配列番号39)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40、81、及び409位を、太字の二重下線フォントで示す。
【
図16】バリアントCasエンドヌクレアーゼA40G+E81G+C409Rのポリペプチド配列(配列番号40)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40、81、及び409位を、太字の二重下線フォントで示す。
【
図17】バリアントCasエンドヌクレアーゼA40G+E81G+E421Nのポリペプチド配列(配列番号41)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。アミノ酸40、81、及び412位を、太字の二重下線フォントで示す。
【
図18】植物組織でCasアルファバリアントを試験するための方法及び組成物を示す。
【
図19A】
図19:
図19Aは、
図26に示す方法を使用する45℃での熱処理におけるDNA配列の変化の存在を示す。
図19Bは、編集の大部分が、片方又は両方のアレルで発生する生殖細胞系であったことを示す。
【
図20】得られたms26遺伝子及びwaxy遺伝子での変異を示す。
【
図21】バリアントCasエンドヌクレアーゼA40G+H79D+E81G+T335Rのポリペプチド配列(配列番号84)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。バリアントのアミノ酸位置を、太字の二重下線フォントで示す。
【
図22】バリアントCasエンドヌクレアーゼA40G+E81G+A87K+T335Rのポリペプチド配列(配列番号85)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。バリアントのアミノ酸位置を、太字の二重下線フォントで示す。
【
図23】バリアントCasエンドヌクレアーゼA40G+E81G+T335R(配列番号38)、A40G+H79D+E81G+T335R(配列番号84)、A40G+E81G+A87K+T335R(配列番号85)、F38E+H79D+A87K+T335R(配列番号90)、及びF38D+H79D+A87K+T335R(配列番号91)に関する、37℃での一晩のインキュベーション後での、赤色のade2表現型を含む酵母コロニーの割合を示す。
【
図24】バリアントCasエンドヌクレアーゼF38E+H79D+A87K+T335Rのポリペプチド配列(配列番号90)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。バリアントのアミノ酸位置を、太字の二重下線フォントで示す。
【
図25】バリアントCasエンドヌクレアーゼF38D+H79D+A87K+T335Rのポリペプチド配列(配列番号91)である。重要な触媒残基を、太字の下線付きフォントで示す。ジンクフィンガードメインを、破線の下線で示す。バリアントのアミノ酸位置を、太字の二重下線フォントで示す。
【
図26A】
図26:
図26Aは、ネイティブ(配列番号20)又は不活性化(配列番号21)Casエンドヌクレアーゼ、並びに配列番号38、配列番号85、及び配列番号101~109のそれぞれのバリアントCasエンドヌクレアーゼに関する、30℃での3日間のインキュベーション後の、赤色のade2表現型を含む酵母コロニー赤色領域(写真画像におけるピクセルの数で決定される)の総割合を示す。
図26Bは、配列番号90、及び配列番号110~118のそれぞれのバリアントCasエンドヌクレアーゼに関する、30℃での3日間のインキュベーション後の、赤色のade2表現型を含む酵母コロニー赤色領域(写真画像におけるピクセルの数で決定される)の総割合を示す。
【
図27A】
図27:
図27Aは、配列番号101、及び配列番号119~125のそれぞれのバリアントCasエンドヌクレアーゼに関する、30℃での3日間のインキュベーション後の、赤色のade2表現型を含む酵母コロニー赤色領域(写真画像におけるピクセルの数で決定される)の総割合を示す。
図27Bは、配列番号110、及び配列番号126~132のそれぞれのバリアントCasエンドヌクレアーゼに関する、30℃での3日間のインキュベーション後の、赤色のade2表現型を含む酵母コロニー赤色領域(写真画像におけるピクセルの数で決定される)の総割合を示す。
【
図28】配列番号133~142のバリアントCasエンドヌクレアーゼに関する、30℃での3日間のインキュベーション後の、赤色のade2表現型を含む酵母コロニー赤色領域(写真画像におけるピクセルの数で決定される)の総割合を示す。
【
図29】野生型Casエンドヌクレアーゼ、CasエンドヌクレアーゼバリアントA40G+E81G(配列番号25)又はA40G+E81G+T335R(配列番号38)によるゼア・マイス(Zea mays)の一過性形質転換の3日後に回収した標的化変異の割合を示す。形質転換後、
図18に示すように、胚を、3日にわたり好ましい温度(ここでは28℃)でインキュベートし、3回(3×)の熱ショック(それぞれ、45℃で4時間継続)を行ったか;或いは形質転換した胚を、3日にわたり一定の37℃又は28℃でインキュベートした。
【
図30A】
図30:
図30Aは、下記の処置:45℃での3回の4時間インキュベーション、又は37℃、33℃、若しくは28℃で3日間下での、野生型(Wt)Casエンドヌクレアーゼ(配列番号20)及びバリアントCasエンドヌクレアーゼ(配列番号38、85、135、又は139)をコードするゼア・マイス(Zea mays)最適化発現カセットによる一過性形質転換の3日後の回収した遺伝子間領域(IR)標的部位での標的化変異の割合を示す。
図30Bは、下記の処置:45℃での3回の4時間インキュベーション、又は37℃、33℃、若しくは28℃で3日間下での、野生型(Wt)Casエンドヌクレアーゼ(配列番号20)及びバリアントCasエンドヌクレアーゼ(配列番号38、85、135、又は139)をコードするゼア・マイス(Zea mays)最適化発現カセットによる一過性形質転換の3日後の回収した雄性不稔26(Ms26)部位での標的化変異の割合を示す。
【
図31】下記の処置:45℃での3回の4時間インキュベーション、又は37℃、33℃、若しくは28℃で3日間下での、示されたCasエンドヌクレアーゼ(配列番号38、85、135、又は139)と比較した最初の野生型(Wt)Casエンドヌクレアーゼ(配列番号20)に対する形質転換後の3日後に回収した標的化変異の割合の倍数改善を示す。
【
図32】A40G+E81G+A87K+T335R(配列番号85)Cas-アルファ10バリアントの不活性化バージョンであり且つCBF1タンパク質由来の転写活性化ドメイン(配列番号147)に連結されているヌクレアーゼ不活性又は死滅(d)Cas-アルファ10(配列番号144)の発現コンストラクトを示す。
【
図33】
図32に示すCBF1活性化ドメインを有していないヌクレアーゼ不活性又は死滅(d)Cas-アルファ10(配列番号144)の発現コンストラクトを示す。
【
図34】本明細書のコンストラクトの送達に関して試験した5つの異なる形質転換レジメンを示す。各レジメン1~5は、熱処理時間、熱処理回数、及びいつ熱処理(ある場合)を施したか(コンストラクト送達後の日数)を示す。
【
図35】dCas-アルファ10及びdCas-アルファ10-CBF1(それぞれ、それぞれのsgRNAを有する)の混合物(ヘテロ二量体)と比較して、dCas-アルファ10-CBF1単量体のみで構成されている二量体を生じるdCas-アルファ10-CBF1を発現するアントシアニン陽性細胞の平均数を示す。
【
図36】シトシンデアミナーゼと連結されたヌクレアーゼ不活性又は死滅(d)Cas-アルファヌクレアーゼをコードする発現コンストラクトを示す。
【
図37】バリアントCasエンドヌクレアーゼA40G+E81G+T335R(配列番号38)の発現後に回収した標的部位変異の割合を示す。
【
図38】Cas-アルファ4 tracrRNAにおける抗リピート領域及び二次構造を示す。
【
図39】Cas-アルファ8 tracrRNAにおける抗リピート領域及び二次構造を示す。
【
図40】Cas-アルファ10 tracrRNAにおける抗リピート領域及び二次構造を示す。
【
図41】Cas-アルファ14 tracrRNAにおける抗リピート領域及び二次構造を示す。
【
図42】Cas-アルファ4、Cas-アルファ8、及びCas-アルファ10、並びに本明細書で開示されているこれらそれぞれのバリアントとの使用のために設計された3種のsgRNAを示す。
【
図43】コード配列に隣接する(即ち、リボザイムが介在していない)U6プロモーター及びU6ターミネーターを含むCas-アルファ10 sgRNA(Cas-アルファ10バリアントと共に使用され得る)をコードする発現コンストラクトを示す。
【発明を実施するための形態】
【0027】
配列の説明及び本明細書に添付した配列表は、37C.F.R.§§1.821及び1.825に規定されている特許出願におけるヌクレオチド配列及びアミノ酸配列の開示を管理する規則に従う。配列の説明は、参照により本明細書に組み込まれる37C.F.R.§§1.821及び1.825に規定されたアミノ酸の3文字コードを含む。
【0028】
配列番号1は、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA ROX3プロモーター配列である。
【0029】
配列番号2は、人工DNA酵母最適化Casエンドヌクレアーゼ遺伝子配列である。
【0030】
配列番号3は、SV40 NLS配列をコードする人工DNA配列である。
【0031】
配列番号4は、未知のDNA CYC1ターミネーター配列である。
【0032】
配列番号5は、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA SNR52プロモーター配列である。
【0033】
配列番号6は、人工DNAターミネーター配列である。
【0034】
配列番号7は、ハンマーヘッド型リボザイム配列をコードするDNA配列である。
【0035】
配列番号8は、CasエンドヌクレアーゼsgRNA(Casエンドヌクレアーゼ認識ドメイン)配列をコードする人工DNA配列である。
【0036】
配列番号9は、CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン1配列をコードするサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA配列である。
【0037】
配列番号10は、CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン2配列をコードするサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA配列である。
【0038】
配列番号11は、CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン3配列をコードするサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA配列である。
【0039】
配列番号12は、CasエンドヌクレアーゼsgRNA可変ターゲティングドメイン4配列をコードするサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA配列である。
【0040】
配列番号13は、CasエンドヌクレアーゼsgRNA 1配列をコードする人工DNA配列である。
【0041】
配列番号14は、CasエンドヌクレアーゼsgRNA 2配列をコードする人工DNA配列である。
【0042】
配列番号15は、CasエンドヌクレアーゼsgRNA 3配列をコードする人工DNA配列である。
【0043】
配列番号16は、CasエンドヌクレアーゼsgRNA 4配列をコードする人工DNA配列である。
【0044】
配列番号17は、デルタ型肝炎ウイルスリボザイム配列をコードするデルタ型肝炎ウイルスDNA配列である。
【0045】
配列番号18は、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA SUP4ターミネーター配列である。
【0046】
配列番号19は、人工DNA酵母最適化ヌクレアーゼの不活性化されたか又は死滅されたCasエンドヌクレアーゼ遺伝子配列である。
【0047】
配列番号20は、シントロフォモナス・パルミタチカ(Syntrophomonas palmitatica)PRT Casエンドヌクレアーゼ配列である。
【0048】
配列番号21は、人工PRTヌクレアーゼの不活性化されたか又は死滅したCasエンドヌクレアーゼ配列である。
【0049】
配列番号22は、シミアンウイルス40 PRT SV40 NLS配列である。
【0050】
配列番号23は、人工PRT CasエンドヌクレアーゼA40Gバリアント配列である。
【0051】
配列番号24は、人工PRT CasエンドヌクレアーゼE81Gバリアント配列である。
【0052】
配列番号25は、人工PRT CasエンドヌクレアーゼA40G+E81Gバリアント配列である。
【0053】
配列番号26は、40及び81位用の人工DNA Casエンドヌクレアーゼバリアント鋳型の配列である。
【0054】
配列番号27は、人工RNA CasエンドヌクレアーゼsgRNA 1配列である。
【0055】
配列番号28は、人工RNA CasエンドヌクレアーゼsgRNA 2配列である。
【0056】
配列番号29は、人工RNA CasエンドヌクレアーゼsgRNA 3配列である。
【0057】
配列番号30は、人工RNA CasエンドヌクレアーゼsgRNA 4配列である。
【0058】
配列番号31は、人工PRT T335R Cas-アルファエンドヌクレアーゼ配列である。
【0059】
配列番号32は、人工PRT C409K Cas-アルファエンドヌクレアーゼ配列である。
【0060】
配列番号33は、人工PRT C409R Cas-アルファエンドヌクレアーゼ配列である。
【0061】
配列番号34は、人工PRT E421N Cas-アルファエンドヌクレアーゼ配列である。
【0062】
配列番号35は、人工PRT E421R Cas-アルファエンドヌクレアーゼ配列である。
【0063】
配列番号36は、人工PRT K467R Cas-アルファエンドヌクレアーゼ配列である。
【0064】
配列番号37は、人工PRT E468P Cas-アルファエンドヌクレアーゼ配列である。
【0065】
配列番号38は、人工PRT A40G+E81G+T335R Cas-アルファエンドヌクレアーゼ配列である。
【0066】
配列番号39は、人工PRT A40G+E81G+C409K Cas-アルファエンドヌクレアーゼ配列である。
【0067】
配列番号40は、人工PRT A40G+E81G+C409R Cas-アルファエンドヌクレアーゼ配列である。
【0068】
配列番号41は、人工PRT A40G+E81G+E421N Cas-アルファエンドヌクレアーゼ配列である。
【0069】
配列番号42は、人工PRT A40G+E81G+E421R Cas-アルファエンドヌクレアーゼ配列である。
【0070】
配列番号43は、人工PRT A40G+E81G+K467R Cas-アルファエンドヌクレアーゼ配列である。
【0071】
配列番号44は、人工PRT A40G+E81G+E468P Cas-アルファエンドヌクレアーゼ配列である。
【0072】
配列番号45は、ゼア・マイス(Zea mays)DNAゼア・マイス(Zea mays)UBIプロモーター配列である。
【0073】
配列番号46は、ゼア・マイス(Zea mays)DNAゼア・マイス(Zea mays) UBI5’UTR配列である。
【0074】
配列番号47は、ゼア・マイス(Zea mays)DNAゼア・マイス(Zea mays)UBIイントロン1配列である。
【0075】
配列番号48は、ST-LS1イントロン2配列を含む人工DNAゼア・マイス(Zea mays)最適化cas-アルファ10遺伝子である。
【0076】
配列番号49は、ジャガイモ(Solanum tuberosum)DNA ST-LS1イントロン2配列である。
【0077】
配列番号50は、SV40 NLS配列をコードする人工DNAゼア・マイス(Zea mays)最適化配列である。
【0078】
配列番号51は、ゼア・マイス(Zea mays)DNAゼア・マイス(Zea mays)UBIターミネーター配列である。
【0079】
配列番号52は、ゼア・マイス(Zea mays)DNAゼア・マイス(Zea mays)U6プロモーター(転写を促進するための3’Gを含む)配列である。
【0080】
配列番号53は、Cas-アルファ10 sgRNA配列をコードする人工DNA配列である。
【0081】
配列番号54は、Ms26標的配列用のCas-アルファ10 sgRNAスペーサーをコードするゼア・マイス(Zea mays)DNA配列である。
【0082】
配列番号55は、ワクシー(waxy)標的配列用のCas-アルファ10 sgRNAスペーサーをコードするゼア・マイス(Zea mays)DNA配列である。
【0083】
配列番号56は、HDVリボザイム配列をコードするデルタ型肝炎ウイルスDNA配列である。
【0084】
配列番号57は、人工DNAターミネーター配列である。
【0085】
配列番号58は、Ms26 Cas-アルファ10標的部位配列のゼア・マイス(Zea mays)DNA基準である。
【0086】
配列番号59は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失1配列である。
【0087】
配列番号60は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失2配列である。
【0088】
配列番号61は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失3配列である。
【0089】
配列番号62は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失4配列である。
【0090】
配列番号63は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失5配列である。
【0091】
配列番号64は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失6配列である。
【0092】
配列番号65は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失7配列である。
【0093】
配列番号66は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失8配列である。
【0094】
配列番号67は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失9配列である。
【0095】
配列番号68は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型Ms26欠失10配列である。
【0096】
配列番号69は、ワクシー(waxy)Cas-アルファ10標的部位配列のゼア・マイス(Zea mays)DNA基準である。
【0097】
配列番号70は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失1配列である。
【0098】
配列番号71は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失2配列である。
【0099】
配列番号72は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失3配列である。
【0100】
配列番号73は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失4配列である。
【0101】
配列番号74は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失5配列である。
【0102】
配列番号75は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失6配列である。
【0103】
配列番号76は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失7配列である。
【0104】
配列番号77は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失8配列である。
【0105】
配列番号78は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失9配列である。
【0106】
配列番号79は、ゼア・マイス(Zea mays)DNA Cas-アルファ10誘発型ワクシー(waxy)欠失10配列である。
【0107】
配列番号80は、人工PRT F38D Cas-アルファエンドヌクレアーゼ配列である。
【0108】
配列番号81は、人工PRT F38E Cas-アルファエンドヌクレアーゼ配列である。
【0109】
配列番号82は、人工PRT H79D Cas-アルファエンドヌクレアーゼ配列である。
【0110】
配列番号83は、人工PRT A87K Cas-アルファエンドヌクレアーゼ配列である。
【0111】
配列番号84は、人工PRT A40G+H79D+E81G+T335R Cas-アルファエンドヌクレアーゼ配列である。
【0112】
配列番号85は、人工PRT A40G+E81G+A87K+T335R Cas-アルファエンドヌクレアーゼ配列である。
【0113】
配列番号86は、ゴマノハグサ属モザイクウイルス(Figwort Mosaic Virus)DNA FMV由来エンハンサー配列である。
【0114】
配列番号87は、ピーナッツ・クロロティック・ストリーク・ウイルス(Peanut Chlorotic Streak Caulimovirus)DNA PCSVエンハンサー配列である。
【0115】
配列番号88は、オシロイバナ属モザイクウイルス(Mirabilis Mosaic Virus)DNA MMVエンハンサー配列である。
【0116】
配列番号89は、IR標的配列のCas-アルファ10 sgRNAスペーサーをコードするゼア・マイス(Zea mays)DNA配列である。
【0117】
配列番号90は、人工PRT F38E+H79D+A87K+T335R Cas-アルファエンドヌクレアーゼ配列である。
【0118】
配列番号91は、人工PRT F38D+H79D+A87K+T335R Cas-アルファエンドヌクレアーゼ配列である。
【0119】
配列番号92は、人工PRT T190K Cas-アルファエンドヌクレアーゼ配列である。
【0120】
配列番号93は、人工PRT T217H Cas-アルファエンドヌクレアーゼ配列である。
【0121】
配列番号94は、人工PRT L293H Cas-アルファエンドヌクレアーゼ配列である。
【0122】
配列番号95は、人工PRT K298S Cas-アルファエンドヌクレアーゼ配列である。
【0123】
配列番号96は、人工PRT H306F Cas-アルファエンドヌクレアーゼ配列である。
【0124】
配列番号97は、人工PRT V313S Cas-アルファエンドヌクレアーゼ配列である。
【0125】
配列番号98は、人工PRT S338V Cas-アルファエンドヌクレアーゼ配列である。
【0126】
配列番号99は、人工PRT I405N Cas-アルファエンドヌクレアーゼ配列である。
【0127】
配列番号100は、人工PRT N430P Cas-アルファエンドヌクレアーゼ配列である。
【0128】
配列番号101は、人工PRT A40G+E81G+A87K+T335R+T190K Cas-アルファエンドヌクレアーゼ配列である。
【0129】
配列番号102は、人工PRT A40G+E81G+A87K+T335R+T217H Cas-アルファエンドヌクレアーゼ配列である。
【0130】
配列番号103は、人工PRT A40G+E81G+A87K+T335R+L293 Cas-アルファエンドヌクレアーゼ配列である。
【0131】
配列番号104は、人工PRT A40G+E81G+A87K+T335R+K298S Cas-アルファエンドヌクレアーゼ配列である。
【0132】
配列番号105は、人工PRT A40G+E81G+A87K+T335R+H306F Cas-アルファエンドヌクレアーゼ配列である。
【0133】
配列番号106は、人工PRT A40G+E81G+A87K+T335R+V313S Cas-アルファエンドヌクレアーゼ配列である。
【0134】
配列番号107は、人工PRT A40G+E81G+A87K+T335R+S338V Cas-アルファエンドヌクレアーゼ配列である。
【0135】
配列番号108は、人工PRT A40G+E81G+A87K+T335R+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0136】
配列番号109は、人工PRT A40G+E81G+A87K+T335R+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0137】
配列番号110は、人工PRT F38E+H79D+A87K+T335R+T190K Cas-アルファエンドヌクレアーゼ配列である。
【0138】
配列番号111は、人工PRT F38E+H79D+A87K+T335R+T217H Cas-アルファエンドヌクレアーゼ配列である。
【0139】
配列番号112は、人工PRT F38E+H79D+A87K+T335R+L293H Cas-アルファエンドヌクレアーゼ配列である。
【0140】
配列番号113は、人工PRT F38E+H79D+A87K+T335R+K298S Cas-アルファエンドヌクレアーゼ配列である。
【0141】
配列番号114は、人工PRT F38E+H79D+A87K+T335R+H306F Cas-アルファエンドヌクレアーゼ配列である。
【0142】
配列番号115は、人工PRT F38E+H79D+A87K+T335R+V313S Cas-アルファエンドヌクレアーゼ配列である。
【0143】
配列番号116は、人工PRT F38E+H79D+A87K+T335R+S338V Cas-アルファエンドヌクレアーゼ配列である。
【0144】
配列番号117は、人工PRT F38E+H79D+A87K+T335R+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0145】
配列番号118は、人工F38E+H79D+A87K+T335R+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0146】
配列番号119は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H Cas-アルファエンドヌクレアーゼ配列である。
【0147】
配列番号120は、人工PRT A40G+E81G+A87K+T335R+T190K+L293H Cas-アルファエンドヌクレアーゼ配列である。
【0148】
配列番号121は、人工PRT A40G+E81G+A87K+T335R+T190K+K298S Cas-アルファエンドヌクレアーゼ配列である。
【0149】
配列番号122は、人工PRT A40G+E81G+A87K+T335R+T190K+H306F Cas-アルファエンドヌクレアーゼ配列である。
【0150】
配列番号123は、人工PRT A40G+E81G+A87K+T335R+T190K+S338V Cas-アルファエンドヌクレアーゼ配列である。
【0151】
配列番号124は、人工PRT A40G+E81G+A87K+T335R+T190K+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0152】
配列番号125は、人工PRT A40G+E81G+A87K+T335R+T190K+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0153】
配列番号126は、人工PRT F38E+H79D+A87K+T335R+T190K+T217H Cas-アルファエンドヌクレアーゼ配列である。
【0154】
配列番号127は、人工PRT F38E+H79D+A87K+T335R+T190K+L293H Cas-アルファエンドヌクレアーゼ配列である。
【0155】
配列番号128は、人工PRT F38E+H79D+A87K+T335R+T190K+K298S Cas-アルファエンドヌクレアーゼ配列である。
【0156】
配列番号129は、人工PRT F38E+H79D+A87K+T335R+T190K+H306F Cas-アルファエンドヌクレアーゼ配列である。
【0157】
配列番号130は、人工PRT F38E+H79D+A87K+T335R+T190K+S338V Cas-アルファエンドヌクレアーゼ配列である。
【0158】
配列番号131は、人工PRT F38E+H79D+A87K+T335R+T190K+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0159】
配列番号132は、人工PRT F38E+H79D+A87K+T335R+T190K+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0160】
配列番号133は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0161】
配列番号134は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+L293H+K298S+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0162】
配列番号135は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0163】
配列番号136は、人工PRT A40G+E81G+A87K+T335R+T190K+L293H+K298S+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0164】
配列番号137は、人工PRT A40G+E81G+A87K+T335R+T190K+K298S+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0165】
配列番号138は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+L293H+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0166】
配列番号139は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0167】
配列番号140は、人工PRT A40G+E81G+A87K+T335R+T190K+T217H+ K298S+H306F Cas-アルファエンドヌクレアーゼ配列である。
【0168】
配列番号141は、人工PRT A40G+E81G+A87K+T335R+T190K+H306F+I405N Cas-アルファエンドヌクレアーゼ配列である。
【0169】
配列番号142は、人工PRT A40G+E81G+A87K+T335R+T190K+K298S+ H306F+N430P Cas-アルファエンドヌクレアーゼ配列である。
【0170】
ネイティブCasエンドヌクレアーゼの最適温度は、植物及び酵母等のいくつかの生物の典型的な生物学的温度を超えている。このために、Casエンドヌクレアーゼは、最適な活性のために約45℃の熱ショックを必要とすることになる。用途によっては、この特性を変更することが有利な場合がる。本明細書では、新規の操作されたCRISPRエフェクター、システム及びそのようなエフェクターを含むエレメント、例えば、限定されないが、新規のガイドポリヌクレオチド/エンドヌクレアーゼ複合体、ガイドポリヌクレオチド、ガイドRNAエレメント、Casタンパク質、及びエンドヌクレアーゼ、並びにエンドヌクレアーゼ機能性を含むタンパク質(ドメイン)のための方法及び組成物示されている。また、エンドヌクレアーゼ、開裂準備完了複合体、ガイドRNA、及びガイドRNA/Casエンドヌクレアーゼ複合体の直接送達のための組成物及び方法が提供される。本開示は、細胞のゲノム中における標的配列のゲノム改変、遺伝子編集、及び細胞のゲノムへの目的のポリヌクレオチドの挿入のための組成物及び方法をさらに含む。同定されたバリアントは、ヒト等の様々な細胞型におけるゲノム編集結果を改善し、且つこの小型RNAによりガイドされたCasヌクレアーゼの広範な採用に役立つだろう。
【0171】
特許請求の範囲及び明細書において使用される用語は、他に特に明記されない限り、下記に記載するように定義される。本明細書及び添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」、及び「その」は、文脈上明らかに別段の指示がない限り、複数の指示対象を含むことに留意しなければならない。
【0172】
本明細書で使用される場合、「核酸」は、ポリヌクレオチドを意味しており、デオキシリボヌクレオチド塩基又はリボヌクレオチド塩基の一本鎖又は二本鎖のポリマーを含む。核酸はまた、断片及び改変ヌクレオチドも含み得る。そのため、「ポリヌクレオチド」、「核酸配列」、「ヌクレオチド配列」、及び「核酸断片」という用語は、一本鎖又は二本鎖であるRNA、及び/又は、DNA、及び/又はRNA-DNAのポリマーを示すために互換的に使用され、任意選択的に、合成ヌクレオチド塩基、非天然ヌクレオチド塩基、又は変化したヌクレオチド塩基を含む。ヌクレオチド(通常、5’-一リン酸塩形態で見出される)は、単一文字表示により、以下のように称される:アデノシン又はデオキシアデノシンに対し(それぞれ、RNA又はDNAに対し)「A」、シトシン又はデオキシシトシンに対し「C」、グアノシン又はデオキシグアノシンに対し「G」、ウリジンに対し「U」、デオキシチミジンに対し「T」、プリン(A又はG)に対し「R」、ピリミジン(C又はT)に対し「Y」、G又はTに対し「K」、A又はC又はTに対し「H」、イノシンに対し「I」、及び任意のヌクレオチドに対し「N」。
【0173】
「ゲノム」という用語は、原核及び真核細胞又は生物細胞に適用される場合、核内で見出される染色体DNAだけでなく、細胞の細胞成分(例えば、ミトコンドリア又はプラスチド)内で見出されるオルガネラDNAも包含する。
【0174】
「オープンリーディングフレーム」を、ORFと略記する。
【0175】
「選択的にハイブリダイズする」という用語には、ストリンジェントなハイブリダイゼーション条件下において、核酸配列の、非標的核酸配列及び非標的核酸の実質的排除へのハイブリダイゼーションと比較して特定の核酸標的配列への検出可能に大きい程度(例えば、バックグラウンドと比較して少なくとも2倍)のハイブリダイゼーションについての言及が含まれる。選択的にハイブリダイズする配列は、典型的には、相互に少なくとも約80%の配列同一性又は90%の配列同一性、及び100%までの配列同一性(即ち、完全相補性)を有する。
【0176】
「ストリンジェントな条件」又は「ストリンジェントなハイブリダイゼーション条件」という用語には、プローブがインビトロハイブリダイゼーションアッセイにおいてその標的配列に選択的にハイブリダイズするであろう条件についての言及が含まれる。ストリンジェントな条件は、配列によって変わり、環境によっても異なるであろう。ハイブリダイゼーション条件及び/又は洗浄条件のストリンジェンシーを制御することによって、プローブに対して100%相補的な標的配列を同定し得る(相同プロービング)。或いは、より低い類似性が検出されるように配列の不一致を認めるように、ストリンジェンシー条件を調整し得る(非相同プロービング)。一般に、プローブは、長さが約1000個のヌクレオチド未満であり、任意選択的に長さが500個のヌクレオチド未満である。典型的には、ストリンジェントな条件は、pH7.0~8.3で、且つ短いプローブ(例えば、10~50個のヌクレオチド)の場合には少なくとも約30℃で、長いプローブ(例えば、50個超のヌクレオチド)の場合には少なくとも約60℃で、塩濃度が、約1.5M Naイオン濃度であり、典型的には約0.01~1.0M Naイオン濃度であるものである。ストリンジェントな条件をまた、ホルムアミド等の不安定化剤の添加によっても達成し得る。低ストリンジェンシー条件の例として、37℃での、30~35%のホルムアミド、1M NaCl、1%SDS(ドデシル硫酸ナトリウム)からなる緩衝液によるハイブリダイゼーション、及び50~55℃での、1×~2×SSC(20×SSC=3.0M NaCl/0.3M クエン酸三ナトリウム)による洗浄が挙げられる。中度ストリンジェンシー条件の例として、37℃での、40~45%のホルムアミド、1M NaCl、1%SDSにおけるハイブリダイゼーション、及び55~60℃での、0.5×~1×SSCによる洗浄が挙げられる。高ストリンジェンシー条件の例として、37℃での、50%のホルムアミド、1M NaCl、1%SDSにおけるハイブリダイゼーション、及び60~65℃での、0.1×SSCによる洗浄が挙げられる。
【0177】
「相同性」は、類似するDNA配列を意味する。例えば、ドナーDNA上で見出される「ゲノム領域に対する相同領域」とは、細胞又は生物のゲノム中の所与の「ゲノム領域」と類似する配列を有するDNAの領域のことである。相同領域は、開裂される標的部位での相同組換えを促進するのに十分である任意の長さであり得る。例えば、相同領域は、この相同領域が、対応するゲノム領域との相同組換えを受けるのに十分な相同性を有するように、少なくとも5~10、5~15、5~20、5~25、5~30、5~35、5~40、5~45、5~50、5~55、5~60、5~65、5~70、5~75、5~80、5~85、5~90、5~95、5~100、5~200、5~300、5~400、5~500、5~600、5~700、5~800、5~900、5~1000、5~1100、5~1200、5~1300、5~1400、5~1500、5~1600、5~1700、5~1800、5~1900、5~2000、5~2100、5~2200、5~2300、5~2400、5~2500、5~2600、5~2700、5~2800、5~2900、5~3000、5~3100個、又はより多くの塩基の長さを含み得る。「十分な相同性」は、2つのポリヌクレオチド配列が相同組換え反応のための基質として作用するために十分な構造的類似性を有することを示す。この構造的類似性は、各ポリヌクレオチド断片の全長とポリヌクレオチドの配列類似性とを含む。配列類似性を、配列の全長にわたる配列同一性パーセントで、並びに/又は100%配列同一性を有する連続ヌクレオチド等の局在化した類似性を含む保存領域、及び配列の長さの一部にわたる配列同一性パーセントで説明し得る。
【0178】
本明細書で使用される場合、「ゲノム領域」は、標的部位のいずれかの側上に存在する、細胞のゲノム中の染色体のセグメントであるか、又は代わりに標的部位の一部も含むセグメントである。このゲノム領域は、少なくとも5~10、5~15、5~20、5~25、5~30、5~35、5~40、5~45、5~50、5~55、5~60、5~65、5~70、5~75、5~80、5~85、5~90、5~95、5~100、5~200、5~300、5~400、5~500、5~600、5~700、5~800、5~900、5~1000、5~1100、5~1200、5~1300、5~1400、5~1500、5~1600、5~1700、5~1800、5~1900、5~2000、5~2100、5~2200、5~2300、5~2400、5~2500、5~2600、5~2700、5~2800、5~2900、5~3000、5~3100個、又はより多くの塩基を含み得、の結果、このゲノム領域は、対応する相同領域との相同組換えを受けるのに十分な相同性を有する。
【0179】
本明細書で使用される場合、「相同組換え」(HR)は、相同部位での2つのDNA分子間でのDNA断片の交換を含む。相同組換えの頻度は、多くの因子に影響される。相同組換え量、及び相同組換えと非相同組組換えとの相対的比率は、異なる生命体間で変わる。一般に、相同領域の長さは相同組換え事象の頻度に影響を及ぼし、相同領域が長ければ長いほど、頻度が高くなる。相同組換えの観察に必要な相同領域の長さは、種によっても変わる。多くの場合、少なくとも5kbの相同性が利用されてきたが、25~50bpと小さい相同性を用いた相同組換えが観察されている。例えば、Singer et al.,(1982)Cell 31:25-33;Shen and Huang,(1986)Genetics 112:441-57;Watt et al.,(1985)Proc.Natl.Acad.Sci.USA 82:4768-72、Sugawara and Haber,(1992)Mol Cell Biol 12:563-75、Rubnitz and Subramani、(1984)Mol Cell Biol 4:2253-8;Ayares et al.,(1986)Proc.Natl.Acad.Sci.USA 83:5199-203;Liskay et al.,(1987)Genetics 115:161-7を参照されたい。
【0180】
核酸配列又はポリペプチド配列の状況における「配列同一性」又は「同一性」は、特定の比較窓全体にわたり最大の一致に対してアラインされた場合に同一である2つの配列における核酸塩基又はアミノ酸残基を意味する。
【0181】
「配列同一性のパーセンテージ」という用語は、比較窓全体にわたり2つの適切にアラインされた配列を比較することにより決定される数値を指しており、この比較窓中のポリヌクレオチド配列又はポリペプチド配列の部分は、これら2つの配列の最適なアラインメントのために、参照配列(付加又は欠失を含まない)と比較して付加又は欠失(即ち、ギャップ)を含む場合がある。このパーセンテージは、配列同一性のパーセンテージを得るために、一致した位置数を生じさせるために両方の配列内で同一の核酸塩基又はアミノ酸残基が発生する位置の数を決定し、一致した位置数を比較窓内の位置の総数で除算し、その結果に100を乗算することによって算出される。配列同一性パーセントの有用な例として、50%、55%、60%、65%、70%、75%、80%、85%、90%、若しくは95%、又は50%~100%の任意のパーセンテージが挙げられるが、これらに限定されない。これらの同一性を、本明細書で説明されているプログラムのいずれかを使用して決定し得る。
【0182】
配列アラインメント、及び同一性パーセント、又は類似性算出を、LASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.、Madison、WI)のMegAlign(商標)プログラムが挙げられるがこれに限定されない相同配列を検出するために設計された様々な比較方法を使用して決定し得る。本出願に関連して、配列分析ソフトウェアを分析に使用する場合には、別途指定しない限り、分析結果は、言及したプログラムの「デフォルト値」をベースとすることが理解されるであろう。本明細書で使用される場合、「デフォルト値」は、最初に初期化した場合にソフトウェアで最初にロードされる値又はパラメータの任意のセットを意味する。
【0183】
「アラインメントのClustal V法」は、Clustal V(Higgins and Sharp,(1989)CABIOS 5:151-153、Higgins et al.,(1992)Comput Appl Biosci 8:189-191により説明されている)と表示され且つLASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.、Madison,WI)のMegAlign(商標)プログラム中に見出されるアラインメント法に対応する。多重アラインメントの場合、デフォルト値は、GAP PENALTY=10、及びGAP LENGTH PENALTY=10に対応する。Clustal方法を使用するタンパク質配列のペアワイズアラインメント(pairwise alignment)用の及び同一性パーセントの算出用のデフォルトパラメータは、KTUPLE=1、GAP PENALTY=3、WINDOW=5、及びDIAGONALS SAVED=5である。核酸の場合には、これらのパラメータは、KTUPLE=2、GAP PENALTY=5、WINDOW=4、及びDIAGONALS SAVED=4である。Clustal Vプログラムを使用した配列のアラインメントの後、同じプログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。「アラインメントのClustal W法」は、Clustal W(Higgins and Sharp,(1989)CABIOS 5:151-153、Higgins et al.,(1992)Comput Appl Biosci 8:189-191により説明されている)と表示され且つLASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.、Madison,WI)のMegAlign(商標)v6.1プログラム中に見出されるアラインメント法に対応する。多重アラインメント用のデフォルトパラメータ(GAP PENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet Series、DNA Weight Matrix=IUB)。Clustal Wプログラムを使用した配列のアラインメントの後、同じプログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。別途指定しない限り、本明細書に示される配列同一性/類似性値は、下記のパラメータを使用するGAPバージョン10(GCG、Accelrys、San Diego、CA)を使用して得られた値を指す:ヌクレオチド配列の同一性%及び類似性%は、ギャップ生成ペナルティウエイト 50、ギャップ長伸長ペナルティウエイト 3、及びnwsgapdna.cmpスコアリングマトリックスを使用し;アミノ酸配列の同一性%及び類似性%は、ギャップ生成ペナルティウエイト 8、ギャップ長伸長ペナルティ 2、及びBLOSUM62スコアリングマトリックスを使用する(Henikoff and Henikoff,(1989)Proc.Natl.Acad.Sci.USA89:10915)。GAPは、Needleman and Wunsch,(1970)J Mol Biol 48:443-53のアルゴリズムを使用して、一致した数を最大化し且つギャップ数を最小限に抑える2つの配列全体のアラインメントを見出す。GAPは、全ての可能なアラインメント及びギャップ位置を考慮し、一致した塩基の単位でギャップ生成ペナルティ及びギャップ伸長ペナルティを使用して、一致した塩基の最大数及び最小のギャップを有するアラインメントを作成する。「BLAST」は、国立生物工学情報センター(National Center for Biotechnology Information)(NCBI)によって提供されている、生物学的配列間の類似領域を見出すために使用される検索アルゴリズムである。このプログラムでは、ヌクレオチド配列又はタンパク質配列を配列データベースと比較し、一致の統計学的有意性を算出して、クエリ配列に十分類似した配列を、類似性がランダムに起こったと予想されないように特定する。BLASTは、特定された配列、及びそのクエリ配列に対するローカルアライメントを報告する。多くのレベルの配列同一性が、他の種からの又は天然に若しくは合成により改変されているポリペプチド(そのようなポリペプチドは、同一の又は類似した機能又は活性を有する)の特定に有用であることは、当業者によく理解されるであろう。同一性パーセントの有用な例として、50%、55%、60%、65%、70%、75%、80%、85%、90%、若しくは95%、又は50%~100%の任意のパーセンテージが挙げられるが、これらに限定されない。実際に、50%~100%の任意のアミノ酸同一性、例えば、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%の同一性は、本開示の説明に有用であり得る。
【0184】
ポリヌクレオチド配列及びポリペプチド配列、それらのバリアント、並びにこれらの配列の構造的関係を、本明細書では互換的に使用される「相同性」、「相同の」、「実質的に同一の」、「実質的に類似の」、及び「実質的に対応する」という用語により説明し得る。これらは、1つ又は複数のアミノ酸又はヌクレオチド塩基の変化が分子の機能(例えば、遺伝子の発現を仲介する能力、又はある特定の表現型を生じさせる能力)に影響することのないポリペプチド配列又は核酸配列を指す。これらの用語はまた、得られる核酸の機能特性が、初期の改変されていない核酸と比較して実質的に変わらない核酸配列の改変も指す。これらの改変には、核酸断片中の1つ又は複数のヌクレオチドの欠失、置換、及び/又は挿入が含まれる。包含される実質的に類似の核酸配列を、(中度ストリンジェンシー条件下、例えば、0.5×SSC、0.1% SDS、60℃で)本明細書に例示した配列と又は本明細書で開示されているヌクレオチド配列の任意の部分にハイブリダイズする能力によって規定し得、これらは、本明細書で開示されている核酸配列のいずれかと機能的に等価である。ストリンジェンシー条件を調節して、中度の類似性を有する断片(例えば、遠縁の生物由来の相同配列)を、高い類似性を有する断片(例えば、近縁の生物由来の機能酵素を複製する遺伝子)に対してスクリーニングし得る。ハイブリダイゼーション後洗浄が、ストリンジェンシー条件を決定する。
【0185】
「センチモルガン」(cM)又は「マップ単位」は、2つのポリヌクレオチド配列、結合遺伝子、マーカー、標的部位、遺伝子座、又はこれらの任意の対間の距離であり、ここで、減数分裂の結果の1%は、組換えである。そのため、センチモルガンは、2つの結合遺伝子、マーカー、標的部位、遺伝子座、又はこれらの任意の対間の平均組換え頻度1%に等しい距離と均等である。
【0186】
「単離された」又は「精製された」核酸分子、ポリヌクレオチド、ポリペプチド、若しくはタンパク質、又はこれらの生物学的に活性な部分は、通常、その自然発生的環境で見られるような、そのポリヌクレオチド又はタンパク質と同時に生じるか又はそれらと相互作用する成分を実質的に又は本質的に含まない。そのため、単離されたか又は精製されたポリヌクレオチド又はポリペプチド又はタンパク質は、組換え技術によって生成された場合には、他の細胞物質も培養培地も実質的に含まないか、又は化学的に合成された場合には、化学的前駆体も他の化学物質も実質的に含まない。最適には、「単離された」ポリヌクレオチド(最適には、タンパク質をコードする配列)は、このポリヌクレオチドが由来する生物のゲノムDNA中に、天然ではこのポリヌクレオチドに隣接している配列(即ち、このポリヌクレオチドの5’末端及び3’末端に位置する配列)を含まない。例えば、様々な実施形態において、単離ポリヌクレオチドは、このポリヌクレオチドが由来する細胞のゲノムDNA中のこのポリヌクレオチドに天然に隣接しているヌクレオチド配列の約5kb、4kb、3kb、2kb、1kb、0.5kb、又は0.1kb未満を含み得る。単離ポリヌクレオチドを、これが天然に存在する細胞から精製し得る。当業者に既知の従来の核酸精製方法を使用して、単離ポリヌクレオチドを得ることができる。この用語にはまた、組換えポリヌクレオチド及び化学的に合成されたポリヌクレオチドも包含される。
【0187】
「断片」という用語は、ヌクレオチド又はアミノ酸の連続したセットを指す。一実施形態では、断片は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、又は20個超の連続したヌクレオチドである。一実施形態では、断片は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、又は20個超の連続したアミノ酸である。断片は、前記断片の全長にわたっていくらかの同一性パーセントを共有する配列の機能を示してもよいし示さなくてもよい。
【0188】
「機能的に均等である断片」及び「機能的に均等な断片」という用語は、本明細書では互換的に使用される。これらの用語は、由来するより長い配列と同じ活性又は機能を示す単離された核酸断片又はポリペプチドの一部又は部分配列を指す。一例において、断片は、この断片が活性タンパク質をコードするか否かにかかわらず、遺伝子発現を変化させる能力又はある特定の表現型を生成する能力を保持する。例えば、断片を、改変された植物に所望の表現型を生じさせる遺伝子の設計に使用し得る。遺伝子を、核酸断片を、それが活性酵素をコードするか否かにかかわらず、植物プロモーター配列に対してセンス配向又はアンチセンス配向で結合させることにより、抑制的に使用されるように設計し得る。
【0189】
「遺伝子」には、例えば、コード配列に先行する(5’非コード配列)及び後続する(3’非コード配列)調節配列を含む、特異的タンパク質等であるがこれに限定されない機能的分子を発現する核酸断片が含まれる。「天然遺伝子」は、遺伝子であって、それ自体の調節配列と共にその天然の内在的な位置に見出される遺伝子を指す。
【0190】
「内在性」という用語は、細胞又は生物中に天然に存在する配列又は他の分子を意味する。一態様では、内在性ポリヌクレオチドは、通常、細胞のゲノム中に見出されており、即ち異種ではない。
【0191】
「アレル」は、染色体の所与の遺伝子座を占める遺伝子のいくつかの代替形態の1つである。染色体の所与の遺伝子座に存在する全てのアレルが同じである場合には、この植物はこの遺伝子座でホモ接合性である。染色体の所与の遺伝子座に存在するアレルが異なる場合には、この植物はその遺伝子座でヘテロ接合性である。
【0192】
「コード配列」は、特定のアミノ酸配列をコードするポリヌクレオチド配列を指す。「調節配列」は、コード配列の上流(5’-非コード配列)、コード配列内、又はコード配列の下流(3’-非コード配列)に位置するヌクレオチド配列を指しており、これは、関連するコード配列の転写、RNAプロセシング若しくは安定性、又は翻訳に影響を及ぼす。調節配列として、プロモーター、翻訳リーダー配列、5’非翻訳配列、3’非翻訳配列、イントロン、ポリアデニル化標的配列、RNAプロセシング部位、エフェクター結合部位、及びステムループ構造が挙げられるが、これらに限定されない。
【0193】
「変異遺伝子」は、ヒト介入により変化している遺伝子である。そのような「変異遺伝子」は、少なくとも1つのヌクレオチドの付加、欠失、又は置換によって、対応する非変異遺伝子の配列とは異なる配列を有する。本開示のある特定の実施形態では、変異遺伝子は、本明細書で開示されているガイドポリヌクレオチド/Casエンドヌクレアーゼシステムから結果として生じる改変を含む。変異植物は、変異遺伝子を含む植物である。
【0194】
本明細書で使用される場合、「標的化変異」とは、本明細書で開示されている誘導型Casエンドヌクレアーゼシステムを含む方法を含む、当業者に既知の任意の方法を使用して標的遺伝子内の標的配列を変化させることによって作製された、天然遺伝子を含む、遺伝子(標的遺伝子と呼ばれる)中の変異のことである。
【0195】
「ノックアウト」、「遺伝子ノックアウト」、及び「遺伝的ノックアウト」という用語は、本明細書では互換的に使用される。ノックアウトは、Casタンパク質によるターゲティングによって部分的に又は完全に無効とされた、細胞のDNA配列を意味しており、例えば、ノックアウト前のDNA配列は、アミノ酸配列をコードしていた場合もあり、調節機能(例えばプロモーター)を有していた場合もある。
【0196】
「ノックイン」、「遺伝子ノックイン」、「遺伝子挿入」、及び「遺伝的ノックイン」という用語は、本明細書では互換的に使用される。ノックインは、Casタンパク質を用いるターゲティングによる(例えば、相同組換え(HR)により、好適なドナーDNAポリヌクレオチドも使用される)細胞中の特定のDNA配列におけるDNA配列の置換又は挿入を意味する。ノックインの例は、遺伝子のコード領域における異種アミノ酸コード配列の特異的挿入、又は遺伝子座における転写調節エレメントの特異的挿入である。
【0197】
「ドメイン」は、連続した一続きのヌクレオチド(RNA、DNA、及び/又はRNA-DNA組み合わせ配列であり得る)又はアミノ酸を意味する。
【0198】
「保存ドメイン」又は「モチーフ」という用語は、進化的に関連するタンパク質のアラインされた配列に沿って特定の位置で保存された一連のポリヌクレオチド又はアミノ酸を意味する。他の位置でのアミノ酸は相同タンパク質間で変動し得るが、特定の位置で高度に保存されているアミノ酸は、タンパク質の構造、安定性、又は活性に必須のアミノ酸を指す。これらは、そのタンパク質相同体ファミリーのアラインされた配列の高い保存度によって同定されることから、新しく決定された配列を有するタンパク質が予め同定されたタンパク質ファミリーに属するか否かを決定する識別子又は「シグネチャー」として使用され得る。
【0199】
「コドン改変遺伝子」、又は「コドン優先遺伝子」、又は「コドン最適化遺伝子」とは、宿主細胞の好ましいコドン使用頻度を模倣するように設計されているコドン使用頻度を有する遺伝子のことである。
【0200】
「最適化(された)」ポリヌクレオチドとは、特定の異種宿主細胞における発現を改善するために最適化された配列のことである。
【0201】
「植物最適化ヌクレオチド配列」とは、植物における発現に最適化されており、特に植物における発現の増加に最適化されているヌクレオチド配列のことである。植物最適化ヌクレオチド配列は、コドン最適化遺伝子を含む。植物最適化ヌクレオチド配列を、発現の改善のための1つ又は複数の植物優先コドンを使用して、例えば、本明細書で開示されているCasエンドヌクレアーゼ等のタンパク質をコードするヌクレオチド配列を改変することによって合成し得る。例えば、宿主優先コドンの利用についての考察には、Campbell and Gowri(1990)Plant Physiol.92:1-11を参照されたい。
【0202】
「プロモーター」は、RNAポリメラーゼ及び転写を開始する他のタンパク質の認識及び結合に関係するDNAの領域である。プロモーター配列は、近位の及びより遠位の上流エレメントからなり、後者のエレメントは、エンハンサーと称されることが多い。「エンハンサー」は、プロモーター活性を刺激し得るDNA配列であり、プロモーター固有のエレメントであり得るか、又はプロモーターのレベル若しくは組織特異性を増強するために挿入された異種エレメントであり得る。プロモーターは、その全体が天然遺伝子に由来していてもよいし、天然に見出される異なるプロモーターに由来する異なるエレメントで構成され、及び/又は合成DNAセグメントを含んでいてもよい。様々なプロモーターが、様々な組織型若しくは細胞型で、又は様々な発達段階で、又は様々な環境条件に応じて、遺伝子の発現を誘導し得ることは、当業者に理解されている。さらに、殆どの場合には調節配列の正確な境界が完全には定義されていないことから、いくつかのバリエーションのDNA断片が同一のプロモーター活性を有する場合があることは認識されている。
【0203】
殆どの細胞型で最も多く遺伝子の発現を引き起こすプロモーターは、一般に、「構成型プロモーター」と称される。「誘導性プロモーター」という用語は、例えば化学的化合物(化学的誘導因子)によって内在性若しくは外因性刺激の存在に応答して、又は環境、ホルモン、化学的及び/若しくは発育シグナルに応答して、コード配列若しくは機能的RNAを選択的に発現するプロモーターを指す。誘導性又は調節プロモーターとして、例えば、光、熱、ストレス、フラッディング若しくは乾燥、塩ストレス、浸透圧ストレス、植物ホルモン、創傷、又はエタノール、アブシジン酸(ABA)、ジャスモン酸、サリチル酸、若しくは毒性緩和剤等の化学物質によって誘導されるか又は調節されるプロモーターが挙げられる。
【0204】
「翻訳リーダー配列」は、遺伝子のプロモーター配列とコード配列と間に位置するポリヌクレオチド配列を指す。翻訳リーダー配列は、mRNAの翻訳開始配列の上流に存在する。翻訳リーダー配列は、mRNAへの一次転写物のプロセシング、mRNAの安定性又は翻訳効率に影響し得る。翻訳リーダー配列の例は、報告されている(例えば、Turner and Foster、(1995)Mol Biotechnol 3:225-236)。
【0205】
「3’非コード配列」、「転写ターミネーター」、又は「終結配列」は、コード配列の下流に位置するDNA配列を指しており、ポリアデニル化認識配列、及びmRNAプロセシング又は遺伝子配列に影響を及ぼし得る調節シグナルをコードする他の配列が含まれる。ポリアデニル化シグナルは、通常は、mRNA前駆体の3’末端へのポリアデニル酸区域の付加に影響を及ぼすことを特徴とする。異なる3’非コード配列の使用は、Ingelbrecht et al.、(1989)Plant Cell 1:671-680によって例示されている。
【0206】
「RNA転写物」は、DNA配列のRNAポリメラーゼ触媒性転写により生じる産物を意味する。RNA転写物がDNA配列の完全相補性コピーである場合は、RNA転写物は、一次転写物又はプレ-mRNAと称される。RNA転写物は、一次転写物プレRNAの転写後プロセシングで得られたRNA配列である場合には、成熟RNA又はmRNAと称される。「メッセンジャーRNA」又は「mRNA」は、イントロンを有しておらず且つ細胞によりタンパク質に翻訳され得るRNAを指す。「cDNA」は、mRNA鋳型に相補的であり且つ逆転写酵素を使用してmRNA鋳型から合成されるDNAを指す。cDNAは、一本鎖であり得るか、又はDNAポリメラーゼIのKlenow断片を使用して、二本鎖形態に変換され得る。「センス」RNAは、mRNAを含むRNA転写物を指し、細胞内又はインビトロでタンパク質に翻訳され得る。「アンチセンスRNA」は、標的一次転写物又はmRNAの全部又は一部に対して相補的であり且つ標的遺伝子の発現をブロックするRNA転写物を意味する(例えば米国特許第5,107,065号明細書を参照されたい)。アンチセンスRNAの相補性は、特定の遺伝子転写物の任意の部分、即ち、5’非コード配列、3’非コード配列、イントロン、又はコード配列との相補性であり得る。「機能的RNA」は、アンチセンスRNA、リボザイムRNA、又は翻訳され得ないがそれにもかかわらず細胞内プロセスに影響を及ぼす他のRNAを指す。「相補体」及び「逆相補体」という用語は、mRNA転写物に関して本明細書では互換的に使用され、メッセージのアンチセンスRNAを定義することが意図されている。
【0207】
「ゲノム」という用語は、生物の各細胞又はウイルス若しくは細胞小器官に存在する遺伝的材料(遺伝子及び非コード配列)の構成要素全体;並びに/或いは1つの親から(ハプロイド)単位として受け継いだ一式の染色体を指す。
【0208】
「作動可能に連結された」という用語は、一方の機能が他方によって調節されるような単一核酸断片上での核酸配列の会合を指す。例えば、プロモーターは、コード配列の発現を調節し得る場合には、このコード配列と作動可能に連結されている(即ち、このコード配列は、プロモーターの転写制御下にある)。コード配列は、センス又はアンチセンス方向で調節配列に作動可能に連結され得る。別の例では、相補性RNA領域は、直接的若しくは間接的のいずれかで、5’で標的mRNAに、若しくは3’で標的mRNAに、又は標的mRNA内で作動可能に連結され得るか、又は第1相補性領域は5’であり、その相補体は3’から標的mRNAまでである。
【0209】
一般に、「宿主」は、異種成分(ポリヌクレオチド、ポリペプチド、他の分子、細胞)が導入されている生物又は細胞を指す。本明細書で使用される場合、「宿主細胞」は、異種ポリヌクレオチド又はポリペプチドが導入されている、単細胞実体として培養された、インビボ又はインビトロの真核細胞、原核細胞(例えば、細菌若しくは古細菌細胞)又は多細胞生物由来の細胞(例えば細胞株)を指す。一部の実施形態では、細胞は、下記からなる群から選択される。古細菌細胞、細菌細胞、真核細胞、真核単細胞生物、体細胞、生殖細胞、幹細胞、植物細胞、藻類細胞、動物細胞、無脊椎動物細胞、脊椎動物細胞、魚類細胞、カエル細胞、鳥類細胞、昆虫細胞、哺乳動物細胞、ブタ細胞、ウシ細胞、ヤギ細胞、ヒツジ細胞、齧歯類細胞、ラット細胞、マウス細胞、非ヒト霊長類細胞、及びヒト細胞。一部の例では、細胞は、インビトロである。一部の例では、細胞は、インビボである。
【0210】
「組換え」という用語は、例えば、化学合成によって、又は遺伝子工学技術による核酸の単離セグメントの操作によって、2つのさもなければ分離している配列セグメントの人工的組合せを指す。
【0211】
「プラスミド」、「ベクター」、及び「カセット」という用語は、細胞の中央代謝の一部でない遺伝子を多くの場合に運ぶ線状又は環状の追加の染色体要素を指しており、通常、二本鎖DNAの形態をとる。そのような要素は、線状又は環状形態の、一本鎖又は二本鎖のDNA又はRNAの、任意の起源に由来する、自己複製配列、ゲノム組込み配列、ファージ、又はヌクレオチド配列であり得、これらでは、いくつかのヌクレオチド配列は、目的のポリヌクレオチドを細胞に導入し得る固有のコンストラクトに結合されているか又は組み換えられている。「形質転換カセット」は、遺伝子を含み且つこの遺伝子に加えて特定の宿主細胞の形質転換を促進する要素を有する特定のベクターを指す。「発現カセット」は、遺伝子を含み且つこの遺伝子に加えて宿主中でこの遺伝子を発現させる要素を有する特定のベクターを指す。
【0212】
「組換えDNA分子」、「組換えDNAコンストラクト」、「発現コンストラクト」、「コンストラクト」、及び「組換えコンストラクト」という用語は、本明細書では互換的に使用される。組換えDNAコンストラクトは、天然には一緒に見出されるとは限らない核酸配列(例えば、調節配列及びコード配列)の人工的な組み合わせを含む。例えば、組換えDNAコンストラクトは、異なる起源に由来する調節配列及びコード配列を含み得るか、又は同一起源に由来するが天然に見出されるのとは異なる方法で配列された調節配列及びコード配列を含み得る。そのようなコンストラクトは、それ自体で使用され得るか、又はベクターと共に使用され得る。ベクターが使用される場合には、ベクターの選択は、当業者に公知であるように、宿主細胞にベクターを導入するために使用する方法に依存する。例えば、プラスミドベクターを使用し得る。当業者は、宿主細胞を問題なく形質転換し、選択し、且つ繁殖させるためにベクター上に存在しなければならない遺伝要素について熟知している。当業者は、異なる独立した形質転換事象が、発現の異なるレベル及びパターンをもたらし得(Jones et al.,(1985)EMBO J 4:2411-2418;De Almeida et al.,(1989)Mol Gen Genetics 218:78-86)、そのため所望の発現レベル及びパターンを示す菌株を得るためには通常は複数の事象がスクリーニングされることも認識するであろう。そのようなスクリーニングを、DNAのサザン分析、mRNA発現のノーザン分析、PCR、実時間定量PCR(qPCR)、逆転写PCR(RT-PCR)、タンパク質発現の免疫ブロッティング分析、酵素若しくは活性分析、及び/又は表現型分析を含む標準的な分子生物学的アッセイ、生化学的アッセイ、及び他のアッセイにより行い得る。
【0213】
「異種(の)」という用語は、特定のポリヌクレオチド配列又はポリペプチド配列の元の環境、場所、又は組成と、その現在の環境、場所、又は組成との間の相違を指す。非限定的な例として、下記が挙げられる:分類学的由来の相違(例えば、ゼア・マイス(Zea mays)から得られるポリヌクレオチド配列は、イネ(Oryza sativa)植物のゲノム若しくはゼア・マイス(Zea mays)の異なる亜種若しくは品種に挿入される場合には異種である;又は細菌から得られたポリヌクレオチドが、植物の細胞に導入された)、又は配列の相違(例えば、ゼア・マイス(Zea mays)から得られ、単離され、改変され、トウモロコシ植物に再導入されたポリヌクレオチド配列)。本明細書で使用される場合、配列に関連した「異種(の)」は、異なる種、亜種、外来種を起源とする配列を指し得るか、又は同種からのものであれば、組成及び/又はゲノム遺伝子座が意図的なヒト介入により天然の形態から実質的に改変されている配列を指し得る。例えば、異種ポリヌクレオチドに作動可能に連結されたプロモーターは、このポリヌクレオチドが由来した種と異なる種からのものであるか、又は同一/類似種からのものであれば、一方若しくは両方が元の形態及び/若しくはゲノム遺伝子座から実質的に改変されているか、又はこのプロモーターが、作動可能に連結されたポリヌクレオチドの天然プロモーターではない。或いは、本明細書中に示される1種又は複数種の調節領域及び/又はポリヌクレオチドが、完全に合成であり得る。別の例では、Casエンドヌクレアーゼによる開裂用の標的ポリヌクレオチドは、Casエンドヌクレアーゼと異なる生物のものであり得る。別の例では、Casエンドヌクレアーゼ及びガイドRNAは、標的ポリヌクレオチドへの挿入のために鋳型又はドナーとして作用する追加のポリヌクレオチドと共に標的ポリヌクレオチドに導入され得、ここで、追加のポリヌクレオチドは、標的ポリヌクレオチド及び/又はCasエンドヌクレアーゼに対して異種である。
【0214】
「発現」という用語は、本明細書で使用される場合、前駆体又は成熟形態での機能的最終産物(例えば、mRNA、ガイドRNA、又はタンパク質)の産生を指す。
【0215】
「成熟」タンパク質は、翻訳後プロセシングされたポリペプチド(即ち、一次翻訳産物中に存在するプレペプチド又はプロペプチドが全て除去されたポリペプチド)を指す。
【0216】
「前駆体」タンパク質は、mRNAの翻訳の一次産物(即ち、プレペプチド及びプロペプチドが依然として存在している)を指す。プレペプチド及びプロペプチドは、細胞内局在化シグナルであり得るが、これに限定されない。
【0217】
「CRISPR」(クラスター化規則的配置短回文配列リピート)遺伝子座は、例えば、外来DNAを破壊するために細菌及び古細菌細胞によって使用される、DNA開裂システムの成分をコードするある特定の遺伝子座を指す(Horvath and Barrangou,2010,Science 327:167-170;2007年3月1日公開の国際公開第2007025097号パンフレット)。CRISPR遺伝子座は、短い可変DNA配列(スペーサーと呼ばれる)によって分離された短いダイレクトリピート(CRISPRリピート)を含むCRISPRアレイからなり得、これには、多様なCas(CRISPR関連)遺伝子が隣接し得る。
【0218】
本明細書で使用される場合、「エフェクター」又は「エフェクタータンパク質」は、ポリヌクレオチド標的を認識し、それに結合し、且つ/又は開裂するか若しくは切れ目を入れることを含む活性を包含するタンパク質である。エフェクター又はエフェクタータンパク質は、エンドヌクレアーゼでもあり得る。CRISPRシステムの「エフェクター複合体」には、crRNAと標的の認識及び結合に関与するCasタンパク質が含まれる。成分であるCasタンパク質の一部は、標的ポリヌクレオチド開裂に関与するドメインをさらに含み得る。
【0219】
「Casタンパク質」という用語は、Cas(CRISPR関連)遺伝子によってコードされるポリペプチドを指す。Casタンパク質は、cas遺伝子座の遺伝子によってコードされるタンパク質を含み、且つアダプテーション分子及び干渉分子を含む。細菌の適応免疫複合体の干渉分子には、エンドヌクレアーゼが含まれる。本明細書で説明されているCasエンドヌクレアーゼは、1つ又は複数のヌクレアーゼドメインを含む。Casエンドヌクレアーゼとして下記が挙げられるが、これらに限定されない:本明細書で開示されている新規のCasエンドヌクレアーゼタンパク質、Cas9タンパク質、Cpf1(Cas12)タンパク質、C2c1タンパク質、C2c2タンパク質、C2c3タンパク質、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10、又はこれらの組み合わせ若しくは複合体。Casタンパク質は、好適なポリヌクレオチド成分との複合体である場合には、特定のポリヌクレオチド標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的に切れ目を入れるか又は開裂を行うことができる「Casエンドヌクレアーゼ」又は「Casエフェクタータンパク質」であり得る。本開示のCas-ベータエンドヌクレアーゼには、1つ又は複数のRuvCヌクレアーゼドメインを有するものが含まれる。Casタンパク質は、天然のCasタンパク質の機能的断片若しくは機能的バリアントとさらに定義されるか、又は天然Casタンパク質の少なくとも50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも500個、又は500個を超える連続するアミノ酸と、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有しており且つ天然配列の少なくとも一部の活性を保持するタンパク質とさらに定義される。
【0220】
Casエンドヌクレアーゼの「機能的断片」、「機能的に均等である断片」、及び「機能的に均等な断片」は、本明細書では互換的に使用され、標的部位を認識し、それに結合し、且つ任意選択的にほどくか、切れ目を入れるか、又は開裂する(標的部位内に一本鎖又は二本鎖切断を導入する)能力が保持されている本開示のCasエンドヌクレアーゼの一部又は部分配列を指す。このCasエンドヌクレアーゼの一部又は部分配列は、そのドメインのいずれか1つの完全な又は部分的(機能的)なペプチドを含み得、例えば、限定されないが、Cas3 HDドメインの全機能的部分、Cas3ヘリカーゼドメインの全機能的部分、タンパク質の全機能的部分(例えば、限定されないが、Cas5、Cas5d、Cas7、及びCas8b1)を含み得る。
【0221】
本明細書で説明されているCasエンドヌクレアーゼを含むCasエンドヌクレアーゼ又はCasエフェクタータンパク質の「機能的バリアント」、「機能的に均等であるバリアント」、及び「機能的に均等なバリアント」という用語は、本明細書では互換的に使用され、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的ほどくか、切れ目を入れるか、又は開裂する能力が保持されている、本明細書で開示されているCasエフェクタータンパク質のバリアントを指す。
【0222】
Casエンドヌクレアーゼはまた、多機能性Casエンドヌクレアーゼも含み得る。「多機能性Casエンドヌクレアーゼ」及び「多機能性Casエンドヌクレアーゼポリペプチド」という用語は、本明細書では互換的に使用され、Casエンドヌクレアーゼ機能(Casエンドヌクレアーゼとして作用し得る少なくとも1つのタンパク質ドメインを含む)、及び限定されないが複合体を形成する機能(他のタンパク質と複合体を形成し得る少なくとも第2のタンパク質ドメインを含む)等の少なくとも1つの他の機能を有する単一のポリペプチドへの言及を含む。一態様では、多機能性Casエンドヌクレアーゼは、Casエンドヌクレアーゼに典型的なドメインに対して(内部、上流(5’)、下流(3’)、若しくは内部5’及び3’の両方、又はこれらの任意の組み合わせで)少なくとも1つのさらなるタンパク質ドメインを含む。
【0223】
「カスケード」及び「カスケード複合体」という用語は、本明細書では互換的に使用され、ポリヌクレオチドと集合してポリヌクレオチド-タンパク質複合体(PNP)を形成し得る多サブユニットタンパク質複合体への言及を含む。カスケードは、複合体の集合及び安定性、並びに標的核酸配列の特定に関してポリヌクレオチドに依存するPNPである。カスケードは、ガイドポリヌクレオチドの可変ターゲティングドメインに相補的な標的核酸を見出して任意選択的に結合するサーベイランス複合体として機能する。
【0224】
「開裂準備完了カスケード」、「crカスケード」、「開裂準備完了カスケード複合体」、「crカスケード複合体」、「開裂準備完了カスケードシステム」、「CRC」、及び「crカスケードシステム」という用語は、本明細書では互換的に使用され、ポリヌクレオチド-タンパク質複合体(PNP)を形成するポリヌクレオチドと集合し得る多サブユニットタンパク質複合体への言及を含み、ここで、カスケードタンパク質の1つは、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的にほどくか、切れ目を入れるか、又は開裂し得るCasエンドヌクレアーゼである。
【0225】
「5’-キャップ」及び「7-メチルグアニル酸(m7G)キャップ」という用語は、本明細書では互換的に使用される。7-メチルグアニル酸残基は、真核細胞内のメッセンジャーRNA(mRNA)の5’末端上に位置する。RNAポリメラーゼII(Pol II)は、真核細胞内でmRNAを転写する。メッセンジャーRNAキャッピングは、一般には次のように発生する:mRNA転写産物の最末端5’リン酸基は、RNA末端ホスファターゼによって除去され、2つの末端リン酸が残る。グアノシン一リン酸(GMP)は、グアニリルトランスフェラーゼによって転写物の末端リン酸に加えられ、転写物末端に5’-5’三リン酸結合グアニンが残る。最後に、この末端グアニンの7-窒素が、メチルトランスフェラーゼによってメチル化される。
【0226】
本明細書での「5’-キャップを有していない」という専門用語は、5’-キャップの代わりに例えば5’-ヒドロキシル基を有するRNAを指すために使用される。そのようなRNAは、例えば「脱キャップRNA」と称され得る。5’-キャップドRNAは核外輸送を受けるので、脱キャップRNAは、転写後には核内でより十分に蓄積され得る。本明細書での1種又は複数種のRNA成分は、脱キャップされている。
【0227】
本明細書で使用される場合、「ガイドポリヌクレオチド」という用語は、Casエンドヌクレアーゼ(例えば、本明細書で説明されているCasエンドヌクレアーゼ)と複合体を形成し得、且つCasエンドヌクレアーゼがDNA標的部位を認識し、任意選択的に結合し、任意選択的に開裂することを可能にするポリヌクレオチド配列に関する。ガイドポリヌクレオチド配列は、RNA配列、DNA配列、又はこれらの組み合わせ(RNA-DNA組み合わせ配列)であり得る。
【0228】
ガイドRNA、crRNA、又はtracrRNAの「機能的断片」、「機能的に均等である断片」、及び「機能的に均等な断片」という用語は、本明細書では互換的に使用され、それぞれ、ガイドRNA、crRNA、又はtracrRNAとしてそれぞれ機能する能力が保持されている、本開示のガイドRNA、crRNA、又はtracrRNAの一部又は部分配列を指す。
【0229】
ガイドRNA、crRNA、又はtracrRNA(それぞれ)の「機能的バリアント」、「機能的に均等であるバリアント」、及び「機能的に均等なバリアント」という用語は、本明細書では互換的に使用され、それぞれ、ガイドRNA、crRNA、又はtracrRNAとしてそれぞれ機能する能力が保持されている、本開示のガイドRNA、crRNA、又はtracrRNAのバリアントを指す。
【0230】
「単一ガイドRNA」及び「sgRNA」という用語は、本明細書では互換的に使用され、tracrRNA(トランス活性化CRISPR RNA)に融合した(tracrRNAにハイブリダイズするtracrメイト配列に結合した)可変ターゲティングドメインを含むcrRNA(CRISPR RNA)である、2つのRNA分子の合成融合に関する。単一ガイドRNAは、II型Casエンドヌクレアーゼと複合体を形成し得るII型CRISPR/CasシステムのcrRNA又はcrRNA断片及びtracrRNA又はtracrRNA断片を含み得、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に誘導し得、CasエンドヌクレアーゼがDNA標的部位を認識し、任意選択的に結合し、任意選択的に切れ目を入れるか又は開裂(一本鎖又は二本鎖切断を導入)するのを可能にする。
【0231】
「可変ターゲティングドメイン」又は「VTドメイン」という用語は、本明細書では互換的に使用され、二本鎖DNA標的部位の1本の鎖(ヌクレオチド配列)にハイブリダイズし得る(相補的である)ヌクレオチド配列を含む。第1のヌクレオチド配列ドメイン(VTドメイン)と標的配列との間の相補性率は、少なくとも50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%であり得る。可変ターゲティングドメインの長さは、少なくとも12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30個のヌクレオチドであり得る。一部の実施形態では、可変ターゲティングドメインは、連続する一続きの12~30個のヌクレオチドを含む。可変ターゲティングドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列、又はこれらの任意の組み合わせで構成され得る。
【0232】
(ガイドポリヌクレオチドの)「Casエンドヌクレアーゼ認識ドメイン」又は「CERドメイン」という用語は、本明細書中では互換的に使用され、Casエンドヌクレアーゼポリペプチドと相互作用するヌクレオチド配列を含む。CERドメインは、(トランス作用)tracrヌクレオチドメイト配列に続いてtracrヌクレオチド配列を含む。CERドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列(例えば、2015年2月26日に公開された米国特許出願公開第20150059010A1号明細書を参照されたい)、又はこれらの任意の組み合わせで構成され得る。
【0233】
本明細書で使用される場合、「ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体」、「ガイドポリヌクレオチド/Casエンドヌクレアーゼシステム」、「ガイドポリヌクレオチド/Cas複合体」、「ガイドポリヌクレオチド/Casシステム」及び「誘導型Casシステム」「ポリヌクレオチド誘導型エンドヌクレアーゼ」、「PGEN」という用語は、本明細書では互換的に使用され、複合体を形成し得る少なくとも1つのガイドポリヌクレオチド及び少なくとも1つのCasエンドヌクレアーゼを指しており、ここで、前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に誘導し得、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択的に切れ目を入れるか又は開裂する(一本鎖又は二本鎖切断を導入する)ことを可能にする。本明細書におけるガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、既知のCRISPRシステム(Horvath and Barrangou,2010,Science 327:167-170;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular Cell 60,1-13)のいずれかのCasタンパク質及び好適なポリヌクレオチド成分を含み得る。
【0234】
「ガイドRNA/Casエンドヌクレアーゼ複合体」、「ガイドRNA/Casエンドヌクレアーゼシステム」、「ガイドRNA/Cas複合体」、「ガイドRNA/Casシステム」、「gRNA/Cas複合体」、「gRNA/Casシステム」、「RNA誘導型エンドヌクレアーゼ」、「RGEN」という用語は、本明細書では互換的に使用され、複合体を形成し得る少なくとも1つのRNA成分及び少なくとも1つのCasエンドヌクレアーゼを指しており、ここで、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位誘導し得、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択的に切れ目を入れるか又は開裂する(一本鎖又は二本鎖切断を導入する)ことを可能にする。
【0235】
「標的部位」、「標的配列」、「標的部位配列」、「標的DNA」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」、及び「プロトスペーサー」という用語は、本明細書では互換的に使用され、ポリヌクレオチド配列を指しており、例えば、限定はされないが、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体が認識し、それに結合し、且つ任意選択的に切れ目を入れ得るか又は開裂し得る、細胞の、染色体、エピソーム、遺伝子座、又はゲノム中の他の任意のDNA分子(例えば、染色体DNA、葉緑体DNA、ミトコンドリアDNA、プラスミドDNA)上のヌクレオチド配列を指す。標的部位は、細胞のゲノム中の内在性部位であり得るか、又は代わりに、標的部位は、細胞に対して異種であり得、そのため、細胞のゲノム中に天然には存在し得るか、若しくは標的部位は、天然で生じる場所に対して異種のゲノム位置に見出され得る。本明細書で使用される場合、「内在性標的配列」及び「天然標的配列」という用語は、本明細書では互換的に使用され、細胞のゲノムに内在するか又は天然の標的配列であって、細胞のゲノム中のこの標的配列の内在性又は天然の位置に存在する標的配列を指す。「人工標的部位」又は「人工標的配列」は、本明細書では互換的に使用され、細胞のゲノムに導入される標的配列を指す。そのような人工標的配列は、細胞のゲノム中の内因性標的配列又は天然標的配列と配列が同一であり得るが、細胞のゲノム中の異なる位置(即ち、非内在位置又は非発生位置)に位置し得る。
【0236】
本明細書の「プロトスペーサー隣接モチーフ」(PAM)は、本明細書で説明されているガイドポリヌクレオチド/Casエンドヌクレアーゼシステムによって認識される(標的とされる)標的配列(プロトスペーサー)に隣接する短鎖ヌクレオチド配列を指す。Casエンドヌクレアーゼは、標的DNA配列の後にPAM配列が続かない場合には、標的DNA配列を成功裏に認識し得ない。本明細書のPAMの配列及び長さは、使用されるCasタンパク質又はCasタンパク質複合体に依存して異なる可能性がある。PAM配列は、任意の長さの配列であり得るが、典型的には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個のヌクレオチドの長さである。
【0237】
「変化した標的部位」、「変化した標的配列」、「改変標的部位」、「改変標的配列」は、本明細書では互換的に使用され、未変化の標的配列と比較した場合に少なくとも1つの変化を含む、本明細書で開示されている標的配列を指す。そのような「変化」として、例えば下記が挙げられる:(i)少なくとも1つのヌクレオチドの置換、(ii)少なくとも1つのヌクレオチドの欠失、(iii)少なくとも1つのヌクレオチドの挿入、(iv)少なくとも1つのヌクレオチドの化学的変化、又は(v)(i)~(iv)の任意の組み合わせ。
【0238】
「改変ヌクレオチド」又は「編集ヌクレオチド」は、この非改変ヌクレオチド配列と比較した場合に少なくとも1つの変化を含む目的のヌクレオチド配列を指す。そのような「変化」として、例えば下記が挙げられる:(i)少なくとも1つのヌクレオチドの置換、(ii)少なくとも1つのヌクレオチドの欠失、(iii)少なくとも1つのヌクレオチドの挿入、(iv)少なくとも1つのヌクレオチドの化学的変化、又は(v)(i)~(iv)の任意の組み合わせ。
【0239】
「標的部位を改変する」及び「標的部位を変化させる」ための方法は、本明細書では互換的に使用され、変化した標的部位を生成するための方法を指す。
【0240】
本明細書で使用される場合、「ドナーDNA」は、Casエンドヌクレアーゼの標的部位内に挿入される目的のポリヌクレオチドを含むDNAコンストラクトである。
【0241】
「ポリヌクレオチド改変鋳型」という用語には、編集されるヌクレオチド配列と比較した場合に少なくとも1つのヌクレオチド改変を含むポリヌクレオチドが含まれる。ヌクレオチド改変は、少なくとも1つのヌクレオチドの置換、付加、又は欠失であり得る。任意選択的に、ポリヌクレオチド改変鋳型は、少なくとも1つのヌクレオチド改変に隣接する相同ヌクレオチド配列をさらに含み得、この隣接相同ヌクレオチド配列は、編集される所望のヌクレオチド配列に十分な相同性を提供する。
【0242】
本明細書中の「植物最適化Casエンドヌクレアーゼ」という用語は、植物細胞又は植物中での発現に最適化されたヌクレオチド配列によってコードされるCasタンパク質(例えば多機能性Casタンパク質)を指す。
【0243】
「Casエンドヌクレアーゼをコードする植物最適化ヌクレオチド配列」、「Casエンドヌクレアーゼをコードする植物最適化コンストラクト」、及び「Casエンドヌクレアーゼをコードする植物最適化ポリヌクレオチド」は、本明細書では互換的に使用され、植物細胞又は植物中での発現に最適化された、Casタンパク質をコードするヌクレオチド配列、又はそのバリアント若しくは機能的断片を指す。植物最適化Casエンドヌクレアーゼを含む植物は、Cas配列をコードするヌクレオチド配列を含む植物、及び/又はCasエンドヌクレアーゼタンパク質を含む植物を含む。一態様では、植物最適化Casエンドヌクレアーゼヌクレオチド配列は、トウモロコシ最適化、イネ最適化、コムギ最適化、ダイズ最適化、ワタ最適化、又はキャノーラ最適化Casエンドヌクレアーゼである。
【0244】
「植物」という用語には、一般に、全植物、植物器官、植物組織、種子、植物細胞、種子、及びこれらの子孫が含まれる。植物は、単子葉植物又は双子葉植物である。植物細胞として、種子、懸濁培養物、胚、分裂組織領域、カルス組織、葉、根、シュート、配偶体、胞子体、花粉、及び小胞子由来の細胞が挙げられるが、これらに限定されない。「植物要素」は、全植物又は植物構成要素を指すことが意図されており、これには、分化及び/又は未分化組織(例えば、限定されないが、植物組織、部分及び細胞型)が含まれ得る。一実施形態では、植物要素は、下記の内の1つである:全植物、実生、分裂組織、基本組織、維管束組織、表皮組織、種子、葉、根、シュート、茎、花、果実、ストロン、球根、塊茎、球茎、ケイキ、シュート、芽、腫瘍組織、並びに様々な形態の細胞及び培養物(例えば、単一細胞、プロトプラスト、胚、カルス組織)。プロトプラストは細胞壁を欠いているため、プロトプラストは、(全ての構成要素と共に天然に見出されるような)技術的に「無傷の」植物細胞ではないことに留意すべきである。「植物器官」という用語は、植物組織を指すか、又は植物の形態的にも機能的にも独立した部分を構成する一群の組織を指す。本明細書で使用される場合、「植物要素」は、植物の「部分」と同義であり、植物の任意の部分を指しており、別個の組織及び/又は器官を含み得、全体を通して「組織」という用語と互換的に使用され得る。同様に、「植物生殖要素」は、植物の有性生殖又は無性生殖によって他の植物を開始し得る植物の任意の部分(例えば、限定されないが、種子、実生、根、シュート、切片、若枝、接ぎ穂、走根、球根、塊茎、球茎、ケイキ、又は芽)に一般に言及することが意図されている。植物要素は、植物若しくは植物の器官、組織培養物、又は細胞培養物中に存在し得る。
【0245】
「子孫」は、植物のその後の任意の世代を含む。
【0246】
本明細書で使用される場合、「植物部分」という用語は、植物細胞、植物プロトプラスト、植物が再生し得る植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物部分中で無傷の植物細胞(例えば、胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、さや、柄、根、根端、葯、及び同類のもの)、並びにこれらの一部自体を指す。穀粒は、種の栽培又は繁殖以外の目的で栽培業者が生産する成熟種子を意味することが意図されている。再生植物の子孫、バリアント、及び変異体もまた、これらの一部が導入ポリヌクレオチドを含むことを条件として、本発明の範囲に含まれる。
【0247】
「単子葉植物の(monocotyledonous)」又は「単子葉植物(monocot)」という用語は、「単子葉植物綱(monocotyledoneae)」としても既知の被子植物のサブクラスを指しており、この種子は、典型的には、1枚の初期葉又は子葉のみを含む。この用語には、全植物、植物要素、植物器官(例えば、葉、茎、根等)、種子、植物細胞、及びこれらの子孫への言及が含まれる。
【0248】
「双子葉植物の(dicotyledonous)」又は「双子葉植物(dicot)」という用語は、「双子葉植物綱(dicotyledoneae)」としても既知の被子植物のサブクラスを指しており、この種子は、典型的には、2枚の初期葉又は子葉のみを含む。この用語には、全植物、植物要素、植物器官(例えば、葉、茎、根等)、種子、植物細胞、及びこれらの子孫への言及が含まれる。
【0249】
本明細書で使用される場合、「雄性不稔植物」は、生存可能な又はそうでなければ受精可能な雄性配偶子を作らない植物である。本明細書で使用される場合、「雌性不稔植物」は、生存可能な又はそうでなければ受精可能な雌性配偶子を作らない植物である。雄性不稔植物及び雌性不稔植物はそれぞれ、雌性稔性及び雄性捻性であり得ることが認められている。さらに、雄性稔性(雌性捻性以外)植物は、雌性稔性植物と交雑されると、生存可能な子孫を産生し得、雌性稔性(雄性捻性以外)植物は、雄性稔性植物と交配されると、生存可能な子孫を産生し得ることが認められている。
【0250】
本明細書中の「非従来型酵母」という用語は、サッカロマイセス(Saccharomyces)属酵母種(例えば、S.セレビシエ(S.cerevisiae))でもシゾサッカロマイセス(Schizosaccharomyces)属酵母種でもない任意の酵母を指す。(“Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols”,K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer-Verlag,Berlin,Germany,2003を参照されたい)。
【0251】
本開示との関連では、「交雑した」、又は「交雑」、又は「交雑している」という用語は、子孫(即ち、細胞、種子、又は植物)を生成するための授粉による配偶子の融合を意味する。この用語は、有性交配(1種の植物と他の植物との授粉)、並びに自植(自家受粉、即ち、花粉及び胚珠(又は小胞子及び大胞子)が、同一植物又は遺伝的に同一の植物に由来する場合)の両方を包含する。
【0252】
「遺伝子移入」とう用語は、ある遺伝的背景から別の遺伝的背景への遺伝子座の所望のアレルの伝達を意味する。例えば、特定遺伝子座での所望のアレルの遺伝子移入は、2種の親植物間の有性交配により少なくとも1つの子孫植物へ伝達され得、ここで、親植物の少なくとも1つは、そのゲノム内に所望のアレルを有する。或いは、例えば、アレルの伝達は、例えば融合プロトプラスト内の2つのドナーゲノム間の組換えによって発生する可能性があり、ここで、ドナープロトプラストの少なくとも1つは、そのゲノム内に所望のアレルを有する。所望のアレルは、例えば導入遺伝子、改変した(変異したか又は編集された)天然のアレル、又はマーカー若しくはQTLの選択されたアレルであり得る。
【0253】
「同質遺伝子系統」という用語は、比較用語であり、遺伝的には同一であるが処理が異なる基準生物である。一例では、2つの遺伝的に同一であるトウモロコシ植物胚を、1つは処理(例えばCRISPR-Casエフェクターエンドヌクレアーゼの導入)を受けており、もう1つはそのような処理を受けないコントロールである2つの異なるグループに分け得る。そのため、2つのグループ間の表現型の違いは、処理のみに起因し、植物の内在性遺伝子構造のいかなる固有性にも起因しない場合がある。
【0254】
「導入」は、成分が生物の細胞の内部又は細胞自体へ侵入するような方法で、細胞又は生物等の標的に、ポリヌクレオチド、又はポリペプチド、又はポリヌクレオチド-タンパク質複合体を提供することを意味することが意図されている。
【0255】
「目的のポリヌクレオチド」は、作物の望ましさ、即ち、農学的利益の形質を改善するタンパク質又はポリペプチドをコードする任意のヌクレオチド配列を含む。目的のポリヌクレオチドとして下記が挙げられるが、これらに限定されない:農業経済学的に重要な形質、除草剤耐性、殺虫剤耐性、病害耐性、線虫耐性、除草剤耐性、微生物耐性、真菌耐性、ウイルス耐性、稔性又は不稔性、穀物特性、市販品、表現型マーカー、又は農業的若しくは商業的に重要なあらゆる他の形質をコードするポリヌクレオチド。目的のポリヌクレオチドは、センス又はアンチセンス配向でさらに利用され得る。さらに、複数種の目的のポリヌクレオチドは、さらなる利益を提供するために、合わせて利用され得るか、又は「積み重ねられ」得る。
【0256】
「複合形質遺伝子座」は、遺伝子的に互いに連結した複数の導入遺伝子を有するゲノムの遺伝子座を含む。
【0257】
本明細書中の組成物及び方法は、植物に対して、「農学的形質」、又は「農学的に重要な形質」、又は「農学的利益の形質」の改善を提供し得、そのような形質として下記が挙げられ得るが、これらに限定されない:本明細書の方法又は組成物による改変を含まない同質遺伝子系統の植物と比較した、病害耐性、乾燥耐性、耐熱性、耐寒性、耐塩性、金属耐性、除草剤耐性、水利用効率の改善、窒素利用の改善、窒素固定の改善、有害生物耐性、草食動物耐性、病原体耐性、収率の向上、健康増強、活力改善、成長改善、光合成能の改善、栄養強化、タンパク質含有量の改変、油分含有量の改変、バイオマスの増加、苗条長の増加、根長の増加、根構造の改善、代謝産物の調整、プロテオームの調整、種子重量の増加、種子炭水化物組成の改変、種子油組成の改変、種子タンパク質組成の改変、種子栄養組成の改変。
【0258】
「農学的形質ポテンシャル」は、ライフサイクル中のある時点での、表現型(好ましくは改善した農学的形質)を示すか又は同じ植物の関連する別の植物要素に前記表現型を伝達する植物要素の能力を意味することが意図されている。
【0259】
「減少した」、「より少ない」、「より遅い」、及び「増加した」、「より速い」、「強化された」、「より大きい」という用語は、本明細書で使用される場合、改変されていない植物要素又は得られる植物と比較した、改変された植物要素又は得られる植物の特性の減少又は増加を指す。例えば、特性の減少は、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、5%~10%、少なくとも10%、10%~20%、少なくとも15%、少なくとも20%、20%~30%、少なくとも25%、少なくとも30%、30%~40%、少なくとも35%、少なくとも40%、40%~50%、少なくとも45%、少なくとも50%、50%~60%、少なくとも約60%、60%~70%、70%~80%、少なくとも75%、少なくとも約80%、80%~90%、少なくとも約90%、90%~100%、少なくとも100%、100%~200%、少なくとも200%、少なくとも約300%、少なくとも約400%、又はそれを超えて未処理のコントロールより低い場合があり、特性の増加は、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、5%~10%、少なくとも10%、10%~20%、少なくとも15%、少なくとも20%、20%~30%、少なくとも25%、少なくとも30%、30%~40%、少なくとも35%、少なくとも40%、40%~50%、少なくとも45%、少なくとも50%、50%~60%、少なくとも約60%、60%~70%、70%~80%、少なくとも75%、少なくとも約80%、80%~90%、少なくとも約90%、90%~100%、少なくとも100%、100%~200%、少なくとも200%、少なくとも約300%、少なくとも約400%、又はそれを超えて未処理のコントロールより高い場合がある。
【0260】
本明細書で使用される場合、「前に」という用語は、配列位置に関しては、ある配列の、別の配列の上流又は5’側の存在を指す。
【0261】
略語の意味は、下記のとおりである:「sec」は秒を意味しており、「min」は分を意味しており、「h」は時間を意味しており、「d」は日を意味しており、「μL」はマイクロリットルを意味しており、「mL」はミリリットルを意味しており、「L」はリットルを意味しており、「μM」は「マイクロモルの」を意味しており、「mM」は「ミリモルの」を意味しており、「M」は「モルの」を意味しており、「mmol」はミリモルを意味しており、「μmole」又は「umole」はマイクロモルを意味しており、「g」はグラムを意味しており、「μg」又は「ug」はマイクログラムを意味しており、「ng」はナノグラムを意味しており、「U」は単位を意味しており、「bp」は塩基対を意味しており、「kb」はキロベースを意味している。
【0262】
CRISPR-Casシステムの分類
CRISPR-Casシステムは、成分の配列及び構造分析に従って分類されている。マルチサブユニットエフェクター複合体(I型、III型、及びIV型を含む)を有するクラス1システム、並びに単一タンパク質エフェクター(II型、V型、及びVI型を含む)を有するクラス2システムを含む、複数のCRISPR/Casシステムが説明されている(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular Cell 60,1-13;Haft et al.,2005,Computational Biology,PLoS Comput Biol 1(6):e60;及びKoonin et al.2017,Curr Opinion Microbiology 37:67-78)。
【0263】
CRISPR-Casシステムは、少なくとも、CRISPR RNA(crRNA)分子と少なくとも1つのCRISPR関連(Cas)タンパク質を含み、crRNAリボ核タンパク質(crRNP)エフェクター複合体を形成する。CRISPR-Cas遺伝子座は、crRNA成分をコードするDNAターゲティングスペーサーが散在する同一リピートからなるアレイ、及びCasタンパク質成分をコードするcas遺伝子のオペロン様ユニットを含む。得られたリボ核タンパク質複合体は、配列特異的な方法でポリヌクレオチドを認識する(Jore et al.,Nature Structural&Molecular Biology 18,529-536(2011))。crRNAは、非相補鎖を移動させながら、相補DNA鎖と塩基対を形成して、いわゆるRループを形成することにより、エフェクター(タンパク質又は複合体)を二本鎖DNA配列に配列特異的に結合させるガイドRNAとして機能する。(Jore et al.,2011.Nature Structural&Molecular Biology 18,529-536)。
【0264】
CRISPR遺伝子座のRNA転写物(pre-crRNA)は、I型及びIII型システムにおけるCRISPR関連(Cas)エンドリボヌクレアーゼによるか、又はII型システムにおけるRNase IIIにより、リピート配列において特異的に開裂される。所与のCRISPR遺伝子座におけるCRISPR関連遺伝子の数は、種によって変わり得る。
【0265】
異なるドメインを有するタンパク質をコードする異なるcas遺伝子が、異なるCRISPRシステムに存在する。casオペロンは、1つ又は複数のエフェクターエンドヌクレアーゼ及び他のCasタンパク質をコードする遺伝子を含む。タンパク質サブユニットとして、Makarova et al.2011,Nat Rev Microbiol.2011 9(6):467-477;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15;及びKoonin et al.2017,Current Opinion Microbiology 37:67-78で説明されているものが挙げられる。ドメインの種類として、発現に関与するもの(pre-crRNAプロセシング、例えば、Cas 6又はRNase III)、緩衝に関与するもの(crRNA及び標的結合のためのエフェクターモジュール並びに標的切断のためのドメインを含む)、アダプテーションに関与するもの(スペーサー挿入、例えば、Cas1又はCas2)、及び補助に関与するもの(調節、又はヘルパー、又は未知の機能)が挙げられる。一部のドメインは、複数の目的のために機能する場合があり、とりわけ、例えばCas9は、エンドヌクレアーゼ機能のドメインと、標的開裂のためのドメインとを含む。
【0266】
Casエンドヌクレアーゼは、直接的RNA-DNA塩基対形成を介して、単一のCRISPR RNA(crRNA)により誘導されて、プロトスペーサー隣接モチーフ(PAM)に近接するDNA標的部位を認識する(Jore,M.M.et al.,2011,Nat.Struct.Mol.Biol.18:529-536、Westra,E.R.et al.,2012,Molecular Cell 46:595-605及びSinkunas,T.et al.,2013,EMBO J.32:385-394)。
【0267】
クラスI CRISPR-Casシステム
クラスI CRISPR-Casシステムは、I型、III型、及びIV型を含む。クラスIシステムの特有の特徴は、単一のタンパク質の代わりにエフェクターエンドヌクレアーゼ複合体が存在することである。カスケード複合体は、RNA認識モチーフ(RRM)及び多様なRAMP(リピート関連ミステリアスタンパク質)タンパク質スーパーファミリのコアフォールドである核酸結合ドメインを含む(Makarova et al.2013,Biochem Soc Trans 41,1392-1400;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。RAMPタンパク質サブユニットは、(crRNA-エフェクター複合体の骨格を含む)Cas5及びCas7を含み(ここで、Cas5サブユニットは、crRNAの5’ハンドルに結合し、大きいサブユニットと相互作用する)、多くの場合には、エフェクター複合体と緩く会合し且つ典型的にはpre-crRNAプロセシングにおいてリピート特異的RNaseとして機能するCas6を含む(Charpentier et al.,FEMS Microbiol Rev 2015,39:428-441;Niewoehner et al.,RNA 2016,22:318-329)。
【0268】
I型CRISPR-Casシステムは、少なくともCas5及びCas7を含む、カスケード(抗ウイルス防御のためのCRISPR関連複合体)と呼ばれるエフェクタータンパク質の複合体を含む。エフェクター複合体は、単一のCRISPR RNA(crRNA)及びCas3と共に機能して、侵入するウイルスDNAから防御する(Brouns,S.J.J. et al. Science 321:960-964;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。I型CRISPR-Cas遺伝子座は、二本鎖DNA(dsDNA)及びRNA-DNA二本鎖をほどく能力が実証されている一本鎖DNA(ssDNA)刺激スーパーファミリ2ヘリカーゼを有する金属依存性ヌクレアーゼをコードするシグネチャー遺伝子cas3(又はバリアントcas3’若しくはcas3”)を含む(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。標的認識に続いて、Cas3エンドヌクレアーゼをカスケード-crRNA-標的DNA複合体に動員して、DNA標的を開裂して分解する(Westra,E.R. et al. (2012)Molecular Cell 46:595-605、Sinkunas,T.et al.(2011)EMBO J.30:1335-1342、及びSinkunas,T.et al.(2013)EMBO J.32:385-394)。一部のI型システムでは、Cas6は、crRNAプロセシングに関与する活性エンドヌクレアーゼであり得、Cas5及びCas7は、非触媒性RNA結合タンパク質として機能するが、I型-Cシステムでは、crRNAプロセシングは、Cas5によって触媒され得る(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。I型システムは、7つのサブタイプに分けられる(Makarova et al.2011,Nat Rev Microbiol.2011 9(6):467-477;Koonin et al.2017,Curr Opinion Microbiology 37:67-78)。少なくともタンパク質サブユニットCas7、Cas5、及びCas6を含む適応抗ウイルス防御のための改変I型CRISPR関連複合体(カスケード)であって、これらのサブユニットの1つがCas3エンドヌクレアーゼ又は改変制限エンドヌクレアーゼFokIに合成的に融合されている、改変I型CRISPR関連複合体が説明されている(2013年7月4日に公開された国際公開第2013098244号パンフレット)。
【0269】
複数のcas7遺伝子を含むIII型CRISPR-Casシステムは、ssRNA又はssDNAを標的とし、RNase及び標的RNA活性化DNAヌクレアーゼのいずれかとして機能する(Tamulaitis et al.,Trends in Microbiology 25(10)49-61,2017)。Csm(III-A型)及びCmr(III-B型)複合体は、標的RNA結合/開裂をssDNA分解と結合させるRNA活性化一本鎖(ss)DNaseとして機能する。外来DNAに感染すると、CRISPR RNA(crRNA)に誘導されたCsm又はCmr複合体の新たな転写物への結合により、盛んに転写されているファージDNAにCas10 DNaseが動員され、その結果、転写物とファージDNAとの両方が分解されるが、宿主DNAは分解されない。Cas10 HDドメインはssDNase活性に関与し、Csm3/Cmr4サブユニットはCsm/Cmr複合体のエンドリボヌクレアーゼ活性に関与する。標的RNAの3’隣接配列は、Csm/CmrのssDNase活動に重要であり:crRNAの5’ハンドルとの塩基対形成は、宿主DNAを分解から保護する。
【0270】
IV型システムは、cas8様ドメインに加えて典型的なI型cas5及びcas7ドメインを含むが、ほとんどの他のCRISPR-Casシステムの特徴であるCRISPRアレイを欠失し得る。
【0271】
クラスII CRISPR-Casシステム
クラスII CRISPR-Casシステムは、II型、V型、及びVI型を含む。クラスIIシステムの特有の特徴は、エフェクター複合体の代わりに単一Casエフェクタータンパク質が存在することである。II型及びV型Casタンパク質は、RNase Hフォールドを採用するRuvCエンドヌクレアーゼドメインを含む。
【0272】
II型CRISPR/Casシステムは、CasエンドヌクレアーゼをそのDNA標的に誘導するために、crRNA及びtracrRNA(トランス活性化CRISPR RNA)を使用する。crRNAは、二本鎖DNA標的の1本の鎖に相補的なスペーサー領域と、tracrRNA(トランス活性化CRISPR RNA)と塩基対合して、CasエンドヌクレアーゼにDNA標的を開裂させるRNA二本鎖を形成し、平滑末端を残す領域とを含む。スペーサーは、Cas1及びCas2タンパク質を伴う十分解明されていないプロセスによって得られる。II型CRISPR/Cas遺伝子座は、典型的には、cas9遺伝子に加えてcas1及びcas2遺伝子を含む(Chylinski et al.,2013,RNA Biology 10:726-737;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。II型CRISR-Cas遺伝子座は、それぞれのCRISPRアレイ内のリピートに部分的に相補的なtracrRNAをコードし得、Csn1及びCsn2等の他のタンパク質を含み得る。cas1及びcas2遺伝子の近傍にcas9が存在することが、II型遺伝子座の特徴である(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。
【0273】
V型CRISPR/Casシステムは、Cpf1(Cas12)を含む単一のCasエンドヌクレアーゼを含み(Koonin et al.,Curr Opinion Microbiology 37:67-78,2017)、これは、Cas9と異なり、標的開裂のためにさらなるトランス活性化CRISPR(tracr)RNAを必ずしも必要としない活性RNA誘導型エンドヌクレアーゼである。
【0274】
VI型CRISPR-Casシステムは、2つのHEPN(高等真核生物及び原核生物ヌクレオチド結合)ドメインを有するがHNHドメインもRuvCドメインを有さず且つtracrRNA活性に依存しないヌクレアーゼをコードするcas13遺伝子を含む。HEPNドメインの大部分は、金属非依存性エンドRNase活性部位を構成する保存モチーフを含む(Anantharam et al.,Biol Direct 8:15,2013)。この特徴のために、VI型システムは、他のCRISPR-Casシステムに共通のDNA標的の代わりにRNA標的に作用すると考えられる。
【0275】
新規のCasエンドヌクレアーゼCRISPR-Casシステム
本明細書で開示されているのは、新規のCRISPR-Casシステム、その成分、及び前記成分を使用する方法である。このシステムは、新規のCasエフェクタータンパク質であるCasエンドヌクレアーゼを含む。
【0276】
本明細書で説明されている新規のCRISPR-Casシステム成分は、異なるCasシステムに由来する1つ又は複数のサブユニット、複数種の異なる細菌若しくは古細菌原核生物に由来するか若しくはそれらから改変されたサブユニット、及び/又は合成されたか若しくは操作された成分を含み得る。
【0277】
本明細書で説明されているのは、cas遺伝子の新規配列を含む、新たに特定されたCRISPR-Casシステムである。さらに説明されているのは、新規のcas遺伝子及びタンパク質である。
【0278】
新規のCasエンドヌクレアーゼシステム10の1つの特徴は、CRISPRアレイの上流のエンドヌクレアーゼ遺伝子を含むがcas1遺伝子、cas2遺伝子、又はcas4遺伝子を含まない遺伝子座構造である。
【0279】
CRISPR-Casシステム成分
Casタンパク質
アダプテーション(スペーサー挿入)、干渉(エフェクターモジュール標的結合、標的ニッキング若しくは開裂-例えば、エンドヌクレアーゼ活性)、発現(pre-crRNAプロセシング)、調節、又はその他に関与するタンパク質を含む多数のタンパク質が、CRISPR casオペロンにコードされ得る。
【0280】
2つのタンパク質Cas1及びCas2は、多くのCRISPRシステム間で保存されている(例えば、Koonin et al.,Curr Opinion Microbiology 37:67-78,2017で説明されている)。Cas1は、二本鎖DNA断片を産生する金属依存性DNA特異的エンドヌクレアーゼである。一部のシステムでは、Cas1は、Cas2と安定な複合体を形成し、これは、CRISPRシステムのためのスペーサー獲得及び挿入に必須である(Nunez et al.,Nature Str Mol Biol 21:528-534,2014)。
【0281】
Cas4(これは、RecBヌクレアーゼと類似性を有し得る)を含む多くの他のタンパク質が、種々のシステムで特定されており、CRISPRアレイへ組み込むための新規のウイルスDNA配列の捕捉に役割を果たすと考えられている(Zhang et al.,PLOS One 7(10):e47232,2012)。
【0282】
一部のタンパク質は、複数の機能を包含し得る。例えば、クラス2のII型システムのシグネチャータンパク質であるCas9は、pre-crRNAプロセシング、標的結合、及び標的開裂に関与することが実証されている。
【0283】
シントロフォモナス・パルミタチカ(Syntrophomonas palmitatica)からのCasエンドヌクレアーゼCRISPRシステム等の一部の天然のシステムでは、エンドヌクレアーゼ遺伝子の付近では、Cas1、Cas2、又はCas4タンパク質をコードする遺伝子が検出されなかった。
【0284】
Casエンドヌクレアーゼ及びエフェクター
エンドヌクレアーゼは、ポリヌクレオチド鎖間のリン酸ジエステル結合を開裂する酵素であり、塩基を損傷することなく特定の部位でDNAを開裂する制限エンドヌクレアーゼを含む。エンドヌクレアーゼの例として、制限エンドヌクレアーゼ、メガヌクレアーゼ、TALエフェクターヌクレアーゼ(TALEN)、ジンクフィンガーヌクレアーゼ、及びCas(CRISPR関連)エフェクターエンドヌクレアーゼが挙げられる。
【0285】
Casエンドヌクレアーゼは、単一のエフェクタータンパク質として又は他の成分とエフェクター複合体を形成して、標的配列でDNA二本鎖をほどき、Casエフェクタータンパク質と複合体を形成しているポリヌクレオチド(例えば、限定されないが、crRNA又はガイドRNA)による標的配列の認識によって媒介された場合に、少なくとも1つのDNA鎖を任意選択的に切断する。Casエンドヌクレアーゼによる標的配列のそのような認識及び切断は、典型的には、正確なプロトスペーサー隣接モチーフ(PAM)が、DNA標的配列の3’末端に位置するか又はDNA標的配列の3’末端に隣接する場合に生じる。或いは、本明細書中のCasエンドヌクレアーゼは、DNA切断活性又はニッキング活性を欠いている場合があるが、好適なRNA成分と複合化した場合に、DNA標的配列に依然として特異的に結合し得る。(2015年3月19日公開の米国特許出願公開第20150082478号明細書、及び2015年2月26日公開の米国特許出願公開第20150059010号明細書も参照されたい)。
【0286】
Casエンドヌクレアーゼは、個々のエフェクター(クラス2 CRISPRシステム)又はより大きいエフェクター複合体(クラスI CRISPRシステム)の一部として生じ得る。
【0287】
説明されているCasエンドヌクレアーゼとして、例えば、Cas3(クラス1 I型システムの特徴)、Cas9(クラス2 II型システムの特徴)、及びCas12(Cpf1)(クラス2 V型システムの特徴)が挙げられるが、これらに限定されない。
【0288】
Cas3(並びにそのバリアントCas3’及びCas3”)は、一本鎖DNAヌクレアーゼ(HDドメイン)及びATP依存性ヘリカーゼとして機能する。Cas3エンドヌクレアーゼのバリアントを、Cas3エンドヌクレアーゼポリペプチドの一方又は両方のドメインの機能的活性を無効にすることによって得ることができる。ATPase依存性ヘリカーゼ活性を(Cas3-ヘリカーゼドメインの欠失、ノックアウトにより、又は重要な残基の変異誘発により、又は既に説明されているようにATPの非存在下で反応を組み立てることにより(Sinkunas,T,et al.,2013,EMBO J.32:385-394)無効にすることで、改変Cas3エンドヌクレアーゼを含む開裂準備完了カスケードをニッカーゼに変換し得る(HDドメインは依然として機能しているため)。HDエンドヌクレアーゼ活性の無効を、当該技術分野で既知の任意の方法(例えば、限定されないが、HDドメインの重要な残基の変異誘発)で達成し得、この無効により、改変Cas3エンドヌクレアーゼを含む開裂準備完了カスケードをヘリカーゼに変換し得る。Casヘリカーゼ及びCas3 HDエンドヌクレアーゼ活性の両方の無効を、当該技術分野で既知の任意の方法(例えば、限定されないが、ヘリカーゼ及びHDドメインの両方の重要な残基の変異誘発)で達成し得、この無効により、改変Cas3エンドヌクレアーゼを含む開裂準備完了カスケードを、標的配列に結合する結合タンパク質に変換し得る。
【0289】
Cas9(以前は、Cas5、Csn1、又はCsx12と呼ばれた)は、crヌクレオチド及びtracrヌクレオチドと複合体を形成するか又は単一ガイドポリヌクレオチドと複合体を形成してDNA標的配列の全て又は一部を特異的に認識して開裂するCasエンドヌクレアーゼである。Cas9は、標的dsDNAの3’GCリッチPAM配列を認識する。Cas9タンパク質は、RuvC-IIドメインに隣接するHNH(H-N-H)ヌクレアーゼと共にRuvCヌクレアーゼを含む。RuvCヌクレアーゼ及びHNHヌクレアーゼは、それぞれ標的配列で1本のDNA鎖を開裂し得る(両方のドメインの協調作用は、DNA二本鎖の開裂をもたらす一方、1つのドメインの活性は、ニックをもたらす)。一般に、RuvCドメインは、サブドメインI、II、及びIIIを含み、ドメインIは、Cas9のN末端近くに位置しており、サブドメインII及びIIIは、タンパク質の中央に位置しており、HNHドメインに隣接している(Hsu et al,2013,Cell 157:1262-1278)。Cas9エンドヌクレアーゼは、典型的には、少なくとも1つのポリヌクレオチド成分と複合体を形成するCas9エンドヌクレアーゼを利用するDNA開裂システムを含むII型CRISPRシステムに由来する。例えば、Cas9は、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)と複合体を形成し得る。別の例では、Cas9は、単一ガイドRNAとの複合体で存在し得る(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。
【0290】
Cas12(以前は、Cpf1、並びにバリアントc2c1、c2c3、CasX、及びCasYと呼ばれていた)は、RuvCヌクレアーゼドメインを含み、dsDNA標的にねじれ型の5’オーバーハングを生成した。一部のバリアントは、Cas9の機能性と異なり、tracrRNAを必要としない。Cas12及びそのバリアントは、標的dsDNA上の5’ATリッチPAM配列を認識する。Cas12aタンパク質のNucと呼ばれる挿入ドメインは、標的鎖開裂に関与することが実証されている(Yamano et al.,Cell 2016,165:949-962)。他のCas12タンパク質におけるさらなる変異の研究により、Nucドメインが、開裂に関与するRuvCドメインと共に誘導及び標的結合に寄与することが実証された(Swarts et al.,Mol Cell 2017,66:221-233 e224)。
【0291】
Casエンドヌクレアーゼ及びエフェクタータンパク質は、標的ゲノム編集(単一及び多重の二本鎖切断及びニックによる)及び標的ゲノム調節(Casタンパク質又はsgRNAにエピジェネティックエフェクタードメインを結合させることによる)に使用し得る。Casエンドヌクレアーゼはまた、RNA誘導型リコンビナーゼとして機能するようにも操作され得、RNAテザーにより、多重タンパク質及び核酸複合体の集合の足場として機能し得た(Mali et al.,2013,Nature Methods Vol.10:957-963)。
【0292】
Casエンドヌクレアーゼ及びそのバリアント
Casエンドヌクレアーゼ又はその機能的バリアントは、約500個未満のアミノ酸からなる機能的RNA誘導型PAM依存性dsDNA開裂タンパク質と定義され、3つのサブドメインに分割され且つブリッジヘリックス及び1つ又は複数のジンクフィンガーモチーフをさらに含むC末端RuvC触媒ドメイン;並びにヘリカルバンドル、WED楔状(又は「オリゴヌクレオチド結合ドメイン」、OBD)ドメイン、及び任意選択的にジンクフィンガーモチーフを有するN末端Recサブユニットを含む。
【0293】
本明細書で開示されている新規のCasエンドヌクレアーゼバリアントタンパク質として、エフェクタータンパク質(エンドヌクラーゼ)が挙げられる。野生型(WT)Casエンドヌクレアーゼタンパク質は、標的二本鎖ポリデオキシリボヌクレオチドの標的部位に又はこの標的部位付近に、N(T>W>C)TTCのPAM配列を必要とする。
【0294】
Casエンドヌクレアーゼの機能的バリアントは、二本鎖切断活性又は一本鎖ニック活性を有しており、この活性は、WT Casエンドヌクレアーゼの活性未満であってもよいし、ほぼ同一であってもよいし、さらに高い活性であってもよい。様々なレベルの活性は、施術者の希望に応じて異なる用途を有し得る。Casエンドヌクレアーゼ又は機能的バリアントは、配列番号20とアラインされた場合に、配列番号20のアミノ酸位置番号に対して、下記のアミノ酸モチーフ:アミノ酸226位で始まるGxxxG;アミノ酸327位で始まるExL;アミノ酸376位で始まるCxnC;アミノ酸395位で始まるCxn(C,H)を含み、ここで、Xは、任意のヌクレオチドであり、nは、任意の数である。一部の態様では、機能的バリアントは、配列番号20とのアラインメントに対して、40位でアラニン(A)を有していないものである。一部の態様では、機能的バリアントは、配列番号20とのアラインメントに対して、40位でグリシン(G)を有するものである。一部の態様では、機能的バリアントは、配列番号20とのアラインメントに対して、81位でグルタミン酸(E)を有していないものである。一部の態様では、機能的バリアントは、配列番号20とのアラインメントに対して、81位でグリシン(G)を有するものである。機能的バリアントは、前述の内のいずれかの1種又は複数種のバリアントヌクレオチドを含み得る。一部の態様では、機能的バリアントは、配列番号23、24、又は25の内のいずれかの少なくとも50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも450個、又は450個を超える連続するアミノ酸と、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を含み、配列番号26の少なくとも50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも450個、又は450個を超える連続するアミノ酸と、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を含み;ここで、配列番号20に対する40位は、アラニンではないか、又は配列番号20に対する81位は、グルタミン酸ではないか、又は前述の任意の組み合わせである。
【0295】
Casエンドヌクレアーゼバリアントエンドヌクレアーゼの「機能的断片」は、配列番号20の少なくとも50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも450、又は450個を超える連続するアミノ酸と、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、少なくとも90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有する497個未満のアミノ酸のポリヌクレオチドを指しており、二本鎖ポリヌクレオチドの一方の鎖を認識するか、この一方の鎖に結合するか、若しくはこの一方の鎖に切れ目を入れる能力を含むか、又は二本鎖ポリヌクレオチドの両方の鎖を開裂する能力を含むか、又は前述の任意の組み合わせを含む。
【0296】
RuvCドメインは、エンドヌクレアーゼの機能性を包含することが文献で実証されている。Casエンドヌクレアーゼは、エフェクタータンパク質をコードするCasエンドヌクレアーゼ遺伝子及び複数のリピートを含むアレイを含む遺伝子座から単離され得るか、又は特定され得る。
【0297】
ジンクフィンガーモチーフは、1つ又は複数の亜鉛イオンを、通常はシステイン及びヒスチジン側鎖によって配位させて、これらのフォールドを安定化させるドメインである。ジンクフィンガーは、亜鉛イオンに配位するシステイン残基及びヒスチジン残基のパターンで命名されている(例えば、C4は、亜鉛イオンに4つのシステイン残基が配位していることを意味しており、C3Hは、亜鉛イオンに3つのシステイン残基と1つのヒスチジン残基とが配位していることを意味する)。
【0298】
Casエンドヌクレアーゼタンパク質は、亜鉛結合ドメインを形成し得る1つ又は複数のジンクフィンガー(ZFN)配位モチーフを含む。ジンクフィンガー様モチーフは、標的鎖及び非標的鎖の分離、並びにDNA標的へのガイドRNAのローディングを助けることができる。1つ又は複数のジンクフィンガーモチーフを含むCasエンドヌクレアーゼタンパク質は、標的ポリヌクレオチド上のリボ核タンパク質複合体にさらなる安定性を提供し得る。Casエンドヌクレアーゼタンパク質は、C4亜鉛結合ドメイン又はC3H亜鉛結合ドメインを含む。
【0299】
本明細書で使用される場合、「ドメイン」は、「モチーフ」と同義である。例えば、ジンクフィンガードメイン及びジンクフィンガーモチーフは、同義に使用される。同様に、亜鉛結合ドメイン及び亜鉛結合モチーフは、同義に使用される。
【0300】
Casエンドヌクレアーゼは、(1)ガイドRNAのヌクレオチド配列と相同性を共有する配列、及び(2)PAM配列を含む二本鎖DNA標的に結合して開裂し得るRNA誘導型エンドヌクレアーゼである。
【0301】
Casエンドヌクレアーゼは、二本鎖切断誘導剤として機能し、ニッカーゼ又は一本鎖切断誘導剤でもあり得る。一部の態様では、触媒的に不活性なCasエンドヌクレアーゼを使用して標的DNA配列を標的化するか又は標的DNA配列に動員させ得るが、開裂を誘発し得ない。一部の態様では、触媒的に不活性なCasエンドヌクレアーゼタンパク質を、機能的エンドヌクレアーゼと共に使用して、標的配列を開裂し得る。一部の態様では、触媒的に不活性なCasエンドヌクレアーゼタンパク質を、デアミナーゼ等の塩基編集分子と組み合わせ得る。一部の態様では、デアミナーゼは、シチジンデアミナーゼであり得る。一部の態様では、デアミナーゼは、アデニンデアミナーゼであり得る。一部の態様では、デアミナーゼは、ADAR-2であり得る。
【0302】
Casエンドヌクレアーゼは、配列番号20の50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも450個、若しくは450個を超える連続するアミノ酸と、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、少なくとも90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、若しくは100%の配列同一性を共有するRNA誘導型二本鎖DNA開裂タンパク質、又は少なくとも部分的な活性を保持するその機能的断片若しくはその機能的バリアントとしてさらに定義される。
【0303】
本開示の操作されたCasエンドヌクレアーゼ、又は不活性の操作されたCasポリペプチドは、配列番号23~26、31~44、80~85、90~142、197、及び331~333の内のいずれかをコードする任意の配列の少なくとも50、50~100、少なくとも100、100~150、少なくとも150、150~200、少なくとも200、200~250、少なくとも250、250~300、少なくとも300、300~350、少なくとも350、350~400、少なくとも400、400~450、少なくとも500、500~550、少なくとも600、600~650、少なくとも650、650~700、少なくとも700、700~750、少なくとも750、750~800、少なくとも800、800~850、少なくとも850、850~900、少なくとも900、900~950、少なくとも950、950~1000、少なくとも1000個、又は1000個を超える連続するヌクレオチドと、少なくとも50%、50%~55%、少なくとも55%、55%~60%、少なくとも60%、60%~65%、少なくとも65%、65%~70%、少なくとも70%、70%~75%、少なくとも75%、75%~80%、少なくとも80%、80%~85%、少なくとも85%、85%~90%、少なくとも90%、90%~95%、少なくとも95%、95%~96%、少なくとも96%、96%~97%、少なくとも97%、97%~98%、少なくとも98%、98%~99%、少なくとも99%、99%~100%、又は100%の配列同一性を共有するポリヌクレオチドによりコードされ得る。
【0304】
本開示の方法での使用のためのCasエンドヌクレアーゼ、エフェクタータンパク質、又はこれらの機能的断片を、天然の供給源から単離し得るか、又は遺伝子改変された宿主細胞がこのタンパク質をコードする核酸配列を発現するように改変されている組換え供給源から単離し得る。或いは、Casタンパク質を、無細胞タンパク質発現システムを使用して生成し得るか、又は合成的に生成し得る。エフェクターCasヌクレアーゼを、単離して異種細胞に導入し得るか、又はその天然の形態から、その天然源と異なる型又は活性の大きさを示すように改変し得る。そのような改変として、断片、バリアント、置換、欠失、及び挿入が挙げられるが、これらに限定されない。CasエンドヌクレアーゼWT組成物は、2020年7月16日に公開された国際公開第2020123887号パンフレットで説明されている。
【0305】
Casエンドヌクレアーゼ及びCasエンドヌクレアーゼエフェクタータンパク質の断片及びバリアントを、部位特異的変異誘発及び合成構築等の方法により得ることができる。エンドヌクレアーゼ活性を測定する方法は、当該技術分野で公知であり、2013年11月7日に公開された国際公開第2013166113号パンフレット、2016年11月24日に公開された国際公開第2016186953号パンフレット、及び2016年11月24日に公開された国際公開第2016186946号パンフレットが挙げられるが、これらに限定されない。
【0306】
Casエンドヌクレアーゼは、Casポリペプチドの改変形態を含み得る。Casポリペプチドの改変形態として、Casタンパク質の自然に存在するヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入、又は置換)が挙げられ得る。例えば、一部の例では、Casタンパク質の改変形態は、対応する野生型Casポリペプチドの50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、又は1%未満のヌクレアーゼ活性を有する(2014年3月6日に公開された米国特許出願公開第20140068797号明細書)。一部の例では、Casポリペプチドの改変形態は、ヌクレアーゼ活性を実質的に有しておらず、触媒的に「不活化されたCas」又は「失活したcas(dCas)」と呼ばれる。不活化されたCas/失活したCasは、失活したCasエンドヌクレアーゼ(dCas)を含む。触媒的に不活性なCasエフェクタータンパク質を異種配列に融合させて、活性を誘発し得るか、又は改変し得る。
【0307】
Casエンドヌクレアーゼは、1つ又は複数の異種タンパク質ドメイン(例えば、Casタンパク質に加えて1つ、2つ、3つ又はより多くのドメイン)を含む融合タンパク質の一部であり得る。そのような融合タンパク質は、任意のさらなるタンパク質配列と、任意の2つのドメイン間(例えば、Casと第1の異種ドメインとの間)の任意選択的なリンカー配列とを含み得る。本明細書のCasタンパク質に融合され得るタンパク質ドメインの例として、エピトープタグ(例えば、ヒスチジン[His]、V5、FLAG、インフルエンザ赤血球凝集素[HA]、myc、VSV-G、チオレドキシン[Trx])、レポーター(例えば、グルタチオン-5-トランスフェラーゼ[GST]、西洋ワサビペルオキシダーゼ[HRP]、クロラムフェニコールアセチルトランスフェラーゼ[CAT]、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ[GUS]、ルシフェラーゼ、緑色蛍光タンパク質[GFP]、HcRed、DsRed、シアン蛍光タンパク質[CFP]、黄色蛍光タンパク質[YFP]、青色蛍光タンパク質[BFP])、及び下記の活性の内の1つ又は複数を有するドメインが挙げられるが、これらに限定されない:メチル化酵素活性、脱メチル化酵素活性、転写活性化活性(例えば、VP16又はVP64)、転写抑制活性、転写放出因子活性、ヒストン改変活性、RNA開裂活性、及び核酸結合活性。Casタンパク質は、DNA分子又は他の分子、例えばマルトース結合タンパク質(MBP)、S-タグ、Lex A DNA結合ドメイン(DBD)、GAL4A DNA結合ドメイン、及び単純ヘルペスウイルス(HSV)VP16に結合するタンパク質とも融合し得る。
【0308】
触媒的に活性な及び/又は不活性なCasエンドヌクレアーゼを、異種配列に融合させ得る(2014年3月6日に公開された米国特許出願公開第20140068797号明細書)。好適な融合パートナーとして、標的DNA又は標的DNAに関連するポリペプチド(例えば、ヒストン又は他のDNA結合性タンパク質)に直接作用することにより転写を間接的に増加させる活性を提供するポリペプチドが挙げられるが、これに限定されない。さらなる好適な融合パートナーとして、メチルトランスフェラーゼ活性、脱メチル化活性、アセチルトランスフェラーゼ活性、脱アセチル化活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、又は脱ミリストイル化活性を提供するポリペプチドが挙げられるが、これに限定されない。さらに好適な融合パートナーとして、標的核酸の転写増加を直接引き起こすポリペプチド(例えば、転写活性化因子又はその断片、転写活性化因子、小分子/薬剤反応性転写調節因子を誘導するタンパク質又はその断片等)が挙げられるが、これに限定されない。部分的に活性な又は触媒的に不活性なCas-ベータエンドヌクレアーゼはまた、別のタンパク質又はドメイン(例えば、Clo51ヌクレアーゼ又はFokIヌクレアーゼ)にも融合して、二本鎖切断を生成し得る(Guilinger et al.Nature biotechnology,volume 32,number 6,June 2014)。
【0309】
本明細書で説明されているCasエンドヌクレアーゼ等の触媒的に活性な又は不活性なCasタンパク質はまた、ポリヌクレオチド配列中の単一又は複数の塩基の編集を指示する分子(例えば、ヌクレオチドの同一性を例えばC・GからT・Aに又はA・TからG・Cに変化させ得る部位特異的デアミナーゼ)とも融合し得る(Gaudelli et al.,Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage.”Nature(2017);Nishida et al.“Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.”Science 353(6305)(2016);Komor et al.“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.”Nature 533(7603)(2016):420-4)。塩基編集融合タンパク質は、例えば、活性な(二本鎖切断性)、部分的に活性な(ニッカーゼ)、又は不活化された(触媒的に不活性な)Casエンドヌクレアーゼ、及びデアミナーゼ(例えば、限定されないが、シチジンデアミナーゼ、アデニンデアミナーゼ、APOBEC1、APOBEC3A、BE2、BE3、BE4、ABE、又は同類のもの)を含み得る。塩基編集修復阻害剤及びグリコシラーゼ阻害剤(例えば、(ウラシルの除去を防止する)ウラシルグリコシラーゼ阻害剤)は、一部の実施形態では、塩基編集システムの他の成分として企図されている。
【0310】
本明細書で説明されているCasエンドヌクレアーゼは、当該技術分野で既知の方法(例えば、2016年11月24日に公開された国際公開第2016/186953号パンフレットで説明されている方法)により発現させて精製し得る。
【0311】
これまでに、特定のPAM配列を認識し得(2016年11月24日に公開された国際公開第2016186953号パンフレット、2016年11月24日に公開された国際公開第2016186946号パンフレット、及びZetsche B et al.2015.Cell 163,1013)、且つ特定の位置で標的DNAを開裂し得る多くのCasエンドヌクレアーゼが説明されている。新規の誘導型Casシステムを使用する本明細書で説明されている方法及び実施形態に基づいて、当業者は、これらの方法を、これらの方法が任意の誘導型エンドヌクレアーゼシステムを使用し得るように適合させることが可能であることが理解される。
【0312】
Casエフェクタータンパク質は、異種核局在化配列(NLS)を含み得る。本明細書中の異種NLSアミノ酸配列は、例えば、本明細書中の酵母細胞の核内で検出可能な量のCasタンパク質の蓄積を駆動するのに十分な強度を有し得る。NLSは、塩基性の、正に帯電する残基(例えば、リシン及び/又はアルギニン)の1つ(一分節)又は複数(例えば、二分節)の短い配列(例えば、2~20個の残基)を含み得、且つタンパク質表面上に曝されるのであれば、Casアミノ酸配列中のどこにでも位置決めされ得る。NLSは、例えば、本明細書中のCasタンパク質のN末端又はC末端に作動可能に連結され得る。例えば、2つ以上のNLS配列が、Casタンパク質に連結され得、例えばCasタンパク質のN末端及びC末端の両方に連結され得る。Casエンドヌクレアーゼ遺伝子は、Casコドン領域のSV40核ターゲティングシグナル上流、及びCasコドン領域の二分VirD2核定位シグナル(Tinland et al.(1992)Proc.Natl.Acad.Sci.USA 89:7442-6)下流に作動可能に連結され得る。本明細書中の好適なNLS配列の非限定的な例として、米国特許第6,660,830号明細書及び同第7,309,576号明細書で開示されているものが挙げられる。
【0313】
ガイドポリヌクレオチド
ガイドポリヌクレオチドは、Casエンドヌクレアーゼによる標的の認識、標的への結合、及び任意選択的な標的の開裂を可能にし、且つ単一分子又は二重分子であり得る。ガイドポリヌクレオチド配列は、RNA配列、DNA配列、又はこれらの組み合わせ(RNA-DNA組み合わせ配列)であり得る。任意選択的に、ガイドポリヌクレオチドは、少なくとも1つのヌクレオチド、ホスホジエステル結合、又は結合改変を含み得、結合改変として下記が挙げられるが、これらに限定されない:ロックド核酸(LNA)、5-メチルdC、2,6-ジアミノプリン、2’-フルオロA、2’-フルオロU、2’-O-メチルRNA、ホスホロチオエート結合、コレステロール分子への連結、ポリエチレングリコール分子への連結、スペーサー18(ヘキサエチレングリコール鎖)分子への連結、又は環化をもたらす5’から3’への共有結合的な連結。リボ核酸のみを含むガイドポリヌクレオチドは、「ガイドRNA」又は「gRNA」とも呼ばれる(2015年3月19日に公開された米国特許出願公開第20150082478号明細書、及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書)。ガイドポリヌクレオチドは、操作されてもよいし、合成されてもよい。
【0314】
ガイドポリヌクレオチドには、天然には一緒に見出されない複数の領域(即ち、これらは、互いに異種である)を含むキメラ非天然ガイドRNAが含まれる。例えば、Casエンドヌクレアーゼを認識し得る第2のヌクレオチド配列に連結された、標的DNA中のヌクレオチド配列にハイブリダイズし得る第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)を含むキメラ非天然ガイドRNAでは、第1のヌクレオチド配列及び第2のヌクレオチド配列は、天然には一緒に連結されて見出されない。
【0315】
ガイドポリヌクレオチドは、crヌクレオチド配列(例えばcrRNA)及びtracrヌクレオチド(例えばtracrRNA)配列を含む二重分子(二本鎖ガイドポリヌクレオチドとも呼ばれる)であり得る。場合によっては、crRNA及びtracrRNAを連結して単一のガイド(例えばsgRNA)を形成するリンカーポリヌクレオチドが存在する。
【0316】
crヌクレオチドは、標的DNA中のヌクレオチド配列にハイブリダイズし得る第1のヌクレオチド配列ドメイン(可変標的ドメイン又はVTドメインと呼ばれる)、及びCasエンドヌクレアーゼ認識(CER)ドメインの一部である第2のヌクレオチド配列(tracrメイト配列とも呼ばれる)を含む。tracrメイト配列は、tracrヌクレオチドに、相補性領域に沿ってハイブリダイズし得、且つCasエンドヌクレアーゼ認識ドメイン(即ちCERドメイン)を共に形成し得る。CERドメインは、Casエンドヌクレアーゼポリペプチドと相互作用し得る。二本鎖ガイドポリヌクレオチドのcrヌクレオチド及びtracrヌクレオチドは、RNA、DNA、及び/又はRNA-DNA組み合わせ配列であり得る。一部の実施形態では、二本鎖ガイドポリヌクレオチドのcrヌクレオチド分子は、(DNAヌクレオチドの連続ストレッチで構成されている場合には)「crDNA」と称され、(RNAヌクレオチドの連続ストレッチで構成されている場合には)「crRNA」と称され、(DNAヌクレオチドとRNAヌクレオチドとの組み合わせで構成されている場合には)「crDNA-RNA」と称される。crヌクレオチドは、細菌中及び古細菌中に天然に存在するcrRNAの断片を含み得る。本明細書で開示されているcrヌクレオチド中に存在し得る、細菌中及び古細菌中に天然に存在するcrRNAの断片のサイズは、限定されないが、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、又はより多くのヌクレオチドの範囲であり得る。
【0317】
一部の実施形態では、tracrヌクレオチドは、(RNAヌクレオチドの連続ストレッチで構成されている場合には)「tracrRNA」と称され、(DNAヌクレオチドの連続ストレッチで構成されている場合には)「tracrDNA」と称され、(DNAヌクレオチドとRNAヌクレオチドとの組み合わせで構成されている場合には)「tracrDNA-RNA」と称される。一実施形態では、RNA/Cas9エンドヌクレアーゼ複合体を誘導するRNAは、二本鎖crRNA-tracrRNAを含む二本鎖RNAである。tracrRNA(トランス活性化CRISPR RNA)は、5’から3’の方向に、(i)CRISPR II型crRNAのリピート領域とアニールする配列、及び(ii)ステムループ含有部分を含む(Deltcheva et al.,Nature 471:602-607)。二本鎖ガイドポリヌクレオチドは、Casエンドヌクレアーゼと複合体を形成し得、前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体(ガイドポリヌクレオチド/Casエンドヌクレアーゼシステムとも呼ばれる)は、Casエンドヌクレアーゼをゲノム標的部位に誘導し得、Casエンドヌクレアーゼがこの標的部位を認識し、この標的部位に結合し、且つ任意選択的にこの標的部位に切れ目を入れるか又は開裂する(一本鎖又は二本鎖切断を導入する)のを可能にする。(2015年3月19日に公開された米国特許出願公開第20150082478号明細書、及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書)。
【0318】
一態様では、ガイドポリヌクレオチドは、本明細書で説明されているPGENを形成し得るガイドポリヌクレオチドであり、前記ガイドポリヌクレオチドは、標的DNAのヌクレオチド配列に相補的な第1のヌクレオチド配列ドメイン、及び前記Casエンドヌクレアーゼポリペプチドと相互作用する第2のヌクレオチド配列ドメインを含む。
【0319】
一態様では、ガイドポリヌクレオチドは、本明細書で説明されているガイドポリヌクレオチドであって、第1のヌクレオチド配列及び第2のヌクレオチド配列ドメインは、DNA配列、RNA配列、及びこれらの組み合わせからなる群から選択される、ガイドポリヌクレオチドである。
【0320】
一態様では、ガイドポリヌクレオチドは、本明細書で説明されているガイドポリヌクレオチドであって、第1のヌクレオチド配列及び第2のヌクレオチド配列ドメインは、安定性を増強するRNA骨格改変、安定性を増強するDNA骨格改変、及びこれらの組み合わせからなる群から選択される、ガイドポリヌクレオチドである(Kanasty et al.,2013,Common RNA-backbone modifications,Nature Materials 12:976-977;2015年3月19日に公開された米国特許出願公開第20150082478号明細書、及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書を参照されたい)。
【0321】
ガイドRNAは、少なくとも1つのtracrRNAに連結されたキメラ非天然crRNAを含む二重分子を含む。キメラ非天然crRNAには、天然には一緒に見出されない複数の領域(即ち、これらは、互いに異種である)を含むcrRNAが含まれる。例えば、第2のヌクレオチド配列(tracrメイト配列とも呼ばれる)に連結された、標的DNA中のヌクレオチド配列にハイブリダイズし得る第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)を含むcrRNAでは、第1の配列及び第2の配列は天然には一緒に連結されて見出されない。
【0322】
ガイドポリヌクレオチドはまた、tracrヌクレオチド配列に連結されたcrヌクレオチド配列を含む単一分子(単一ガイドポリヌクレオチドとも呼ばれる)でもあり得る。単一ガイドポリヌクレオチドは、標的DNA中のヌクレオチド配列にハイブリダイズし得る第1のヌクレオチド配列ドメイン(可変標的ドメイン又はVTドメインと呼ばれる)、及びCasエンドヌクレアーゼポリペプチドと相互作用するCasエンドヌクレアーゼ認識ドメイン(CERドメイン)を含む。
【0323】
単一ガイドポリヌクレオチドのVTドメイン及び/又はCERドメインは、RNA配列、DNA配列、又はRNA-DNA組み合わせ配列を含み得る。crヌクレオチド及びtracrヌクレオチド由来の配列から構成される単一ガイドポリヌクレオチドは、「単一ガイドRNA」(連続した一続きのRNAヌクレオチドで構成されている場合)、又は「単一ガイドDNA」(連続した一続きのDNAヌクレオチドで構成されている場合)、又は「単一ガイドRNA-DNA」(RNAヌクレオチドとDNAヌクレオチドとの組み合わせで構成されている場合)と称され得る。単一ガイドポリヌクレオチドは、Casエンドヌクレアーゼと複合体を形成し得、前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体(ガイドポリヌクレオチド/Casエンドヌクレアーゼシステムとも呼ばれる)は、Casエンドヌクレアーゼをゲノム標的部位に誘導し得、Casエンドヌクレアーゼがこの標的部位を認識し、この標的部位に結合し、且つ任意選択的にこの標的部位に切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)のを可能にする。(2015年3月19日に公開された米国特許出願公開第20150082478号明細書、及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書)。
【0324】
キメラ非天然単一ガイドRNA(sgRNA)には、天然には一緒に見出されない複数の領域(即ち、これらは、互いに異種である)を含むsgRNAが含まれる。例えば、天然には一緒に連結されて見出されない第2のヌクレオチド配列(tracrメイト配列とも呼ばれる)に連結された、標的DNA中のヌクレオチド配列にハイブリダイズし得る第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)を含むsgRNA。
【0325】
単一ガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、RNA配列、DNA配列、又はRNA-DNA組み合わせ配列を含み得る。一実施形態では、単一ガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列(「ループ」とも呼ばれる)は、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、又は100個のヌクレオチドの長さであり得る。別の実施形態では、単一ガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、テトラループ配列(例えば、限定されないが、GAAAテトラループ配列)を含み得る。
【0326】
ガイドポリヌクレオチドを、ガイドポリヌクレオチドを化学的に合成すること(例えば、限定されないが、Hendel et al.2015,Nature Biotechnology 33、985-989)、ガイドポリヌクレオチドのインビトロでの生成、及び/又はガイドRNAの自己スプライシング(例えば、限定されないが、Xie et al.,2015、PNAS 112:3570-3575)を含む、当該技術分野で既知の任意の方法によって生成し得る。
【0327】
プロトスペーサー隣接モチーフ(PAM)
本明細書中の「プロトスペーサー隣接モチーフ」(PAM)は、ガイドポリヌクレオチド/Casエンドヌクレアーゼシステムにより認識され得る(標的化され得る)標的配列(プロトスペーサー)に隣接する短いヌクレオチド配列を指す。Casエンドヌクレアーゼは、標的DNA配列の後にPAM配列がなければ、この標的DNA配列を正しく認識し得ない。本明細書中のPAMの配列及び長さは、使用されるCasタンパク質又はCasタンパク質複合体に応じて異なり得る。PAM配列は任意の長さであり得るが、典型的には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個のヌクレオチドの長さである。
【0328】
「ランダム化PAM」及び「ランダム化プロトスペーサー隣接モチーフ」は、本明細書では互換的に使用され、ガイドポリヌクレオチド/Casエンドヌクレアーゼシステムによって認識される(標的化される)標的配列(プロトスペーサー)に隣接するランダムDNA配列を指す。ランダム化PAM配列は任意の長さであり得るが、典型的には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個のヌクレオチドの長さである。ランダム化されたヌクレオチドは、ヌクレオチドA、C、G、又はTのいずれか1つを含む。
【0329】
ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体
本明細書で説明されているガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的に切れ目を入れるか、ほどくか、又は切断することができる。
【0330】
DNA標的配列の両方の鎖を開裂し得るガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、典型的には、エンドヌクレアーゼドメインの全てを機能的な状態で有するCasタンパク質(例えば、野生型エンドヌクレアーゼドメイン、又は各エンドヌクレアーゼドメインの一部若しくは全ての活性を保持しているそのバリアント)を含む。そのため、野生型Casタンパク質(例えば、本明細書で開示されているCasタンパク質)又はCasタンパク質の各エンドヌクレアーゼドメインの一部又は全ての活性を保持しているそのバリアントは、DNA標的配列の両方の鎖を開裂し得るCasタンパク質の好適な例である。
【0331】
DNA標的配列の一本鎖を開裂し得るガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、本明細書では、ニッカーゼ活性(例えば、部分的開裂能力)を有すると特徴付けられ得る。Casニッカーゼは、典型的には、CasがDNA標的配列の一本鎖のみを開裂する(即ち、切れ目を入れる)ことを可能にする1つの機能的エンドヌクレアーゼドメインを含む。例えば、Cas9ニッカーゼは、(i)変異した機能不全RuvCドメイン、及び(ii)機能的HNHドメイン(例えば野生型HNHドメイン)を含み得る。別の例として、Cas9ニッカーゼは、(i)機能的RuvCドメイン(例えば野生型RuvCドメイン)、及び(ii)変異した機能不全HNHドメインを含み得る。本明細書での使用に適したCas9ニッカーゼの非限定的な例は、2014年7月3日に公開された米国特許出願公開第20140189896号明細書で開示されている。一対のCasニッカーゼを使用して、DNAターゲティングの特異性を増加させ得る。一般に、このことを、異なるガイド配列を備えるRNA成分と結び付けられることにより、所望のターゲティングのために領域内の逆鎖上のDNA配列を標的としてごく近くで切れ目を入れる2つのCasニッカーゼを提供することにより行ない得る。そのような各DNA鎖の近くの開裂は、二本鎖切断(即ち、一本鎖オーバーハングを有するDSB)を引き起こし、これは、その後、非相同性末端結合NHEJ(変異につながる不完全な修復になりやすい)又は相同組換えHRの基質として認識される。これらの実施形態における各ニックは、例えば、少なくとも約5、5~10、少なくとも10、10~15、少なくとも15、15~20、少なくとも20、20~30、少なくとも30、30~40、少なくとも40、40~50、少なくとも50、50~60、少なくとも60、60~70、少なくとも70、70~80、少なくとも80、80~90、少なくとも90、90~100個、又は100個以上(又は5~100個の任意の整数)の塩基分、互いに離れた状態であり得る。本明細書中の1つ又は2つのCasニッカーゼタンパク質は、Casニッカーゼ対で使用され得る。例えば、変異したRuvCドメインを有するがHNHドメインが機能するCas9ニッカーゼ(即ち、Cas9 HNH+/RuvC-)を使用し得る(例えば、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)Cas9 HNH+/RuvC-)。各Cas9ニッカーゼ(例えば、Cas9 HNH+/RuvC-)は、各ニッカーゼをそれぞれの特定のDNA部位に標的として向けるガイドRNA配列を有する本明細書中の好適なRNA成分を使用することにより、互いに近い(最大で100塩基対離れている)特定のDNA部位に誘導され得る。
【0332】
ある特定の実施形態でのガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、DNA標的部位配列に結合し得るが、標的部位配列ではどの鎖も開裂しない。そのような複合体は、ヌクレアーゼドメインの全てが変異して機能不全であるCasタンパク質を含み得る。例えば、DNA標的部位配列に結合し得るが標的部位配列でいかなる鎖も開裂しないCas9タンパク質は、変異した機能不全RuvCドメイン及び変異した機能不全HNHドメインの両方を含み得る。標的DNA配列に結合するがこの標的DNA配列を開裂しない本明細書中のCasタンパク質を使用して、遺伝子発現を調整し得、例えば、この場合には、Casタンパク質は、転写因子(又はその一部)(例えば、リプレッサー又は活性化因子、例えば本明細書で開示されるもののいずれか)と融合する可能性がある。
【0333】
一態様では、本明細書で説明されているガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体(PGEN)は、PGENであって、前記Casエンドヌクレアーゼは、任意選択的に、少なくとも1つのタンパク質サブユニット又はその機能的断片に共有結合しているか、又は非共有結合的に連結されているか、又は集められている、PGENである。
【0334】
本開示の一実施形態では、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、少なくとも1つのガイドポリヌクレオチド及び少なくとも1つのCasエンドヌクレアーゼポリペプチドを含むガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体(PGEN)であって、前記Casエンドヌクレアーゼポリペプチドは、少なくとも1つのタンパク質サブユニット又はその機能的断片を含み、前記ガイドポリヌクレオチドは、キメラ非天然ガイドポリヌクレオチドであり、前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的に切れ目を入れるか、ほどくか、又は開裂し得る。
【0335】
Casエフェクタータンパク質は、本明細書で開示されるCasエンドヌクレアーゼエフェクタータンパク質であり得る。
【0336】
本開示の一実施形態では、ガイドポリヌクレオチド/Casエフェクター複合体は、少なくとも1つのガイドポリヌクレオチド及びCasエンドヌクレアーゼエフェクタータンパク質を含むガイドポリヌクレオチド/Casエフェクタータンパク質複合体(PGEN)であって、前記ガイドポリヌクレオチド/Casエフェクタータンパク質複合体は、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的に切れ目を入れるか、ほどくか、又は開裂し得る。
【0337】
PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質は、少なくとも1つのタンパク質サブユニット又はその機能的断片の1つのコピー又は複数のコピーをさらに含む。一部の実施形態では、前記タンパク質サブユニットは、Cas1タンパク質サブユニット、Cas2タンパク質サブユニット、Cas4タンパク質サブユニット、及びこれらの任意の組み合わせからなる群から選択される。PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質は、Cas1、Cas2、及びCas4からなる群から選択される少なくとも2つの異なるタンパク質サブユニットをさらに含む。
【0338】
PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質は、Cas1、Cas2、及び任意選択的にCas4を含む1つのさらなるCasタンパク質からなる群から選択される少なくとも3つの異なるタンパク質サブユニット又はその機能的断片をさらに含む。
【0339】
一態様では、本明細書で説明されているガイドポリヌクレオチド/Casエフェクタータンパク質複合体(PGEN)は、PGENであって、前記Casエフェクタータンパク質は、少なくとも1つのタンパク質サブユニット又はその機能的断片に共有結合的に又は非共有結合的に連結されている、PGENである。PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質ポリペプチドは、Cas1タンパク質サブユニット、Cas2タンパク質サブユニット、任意選択的にCas4タンパク質サブユニットを含む1つのさらなるCasタンパク質サブユニット、及びこれらの任意の組み合わせからなる群から選択される少なくとも1つのタンパク質サブユニット又はその機能的断片の1つのコピー又は複数のコピーに共有結合的に又は非共有結合的に連結されるか又は集められる。PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質は、Cas1、Cas2、及び任意選択的にCas4を含む1つのさらなるCasタンパク質からなる群から選択される少なくとも2つの異なるタンパク質サブユニットに共有結合的に又は非共有結合的に連結されるか又は集められる。PGENは、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体であり得、ここで、前記Casエフェクタータンパク質は、Cas1、Cas2、及び任意選択的にCas4を含む1つのさらなるCasタンパク質、並びにこれらの任意の組み合わせからなる群から選択される少なくとも3つの異なるタンパク質サブユニット又はその機能的断片に、共有結合的に又は非共有結合的に連結されている。
【0340】
ガイドポリヌクレオチド/Casエフェクタータンパク質複合体の任意の成分、ガイドポリヌクレオチド/Casエフェクタータンパク質複合体自体、並びにポリヌクレオチド改変鋳型及び/又はドナーDNAを、当該技術分野で既知の任意の方法により、異種細胞又は生物に導入し得る。
【0341】
細胞の形質転換のための組換えコンストラクト
本開示のガイドポリヌクレオチド、Casエンドヌクレアーゼ、ポリヌクレオチド改変鋳型、ドナーDNA、本明細書で開示されているガイドポリヌクレオチド/Casエンドヌクレアーゼシステム、及び任意選択的に目的の1つ又は複数のポリヌクレオチドをさらに含むこれらのいずれか1つの組み合わせを、細胞に導入し得る。細胞として、ヒト、非ヒト、動物、細菌、真菌、昆虫、酵母、非従来型酵母、及び植物の細胞、並びに本明細書で説明されている方法によって作製された植物及び種子が挙げられるが、これらに限定されない。
【0342】
本明細書で使用される標準の組み換えDNA及び分子クローニング技術は、当該技術分野では公知であり、Sambrook et al.、Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)でより完全に説明されている。形質転換法は、当業者に公知であり、下記で説明する。
【0343】
ベクター及びコンストラクトには、環状プラスミド及び線形ポリヌクレオチドが含まれ、これらには、目的のポリヌクレオチド、及び任意選択的な他の構成要素(例えば、リンカー、アダプター、調節要素、又は分析要素)が含まれる。一部の例では、認識部位及び/又は標的部位を、イントロン、コード配列、5’UTR、3’UTR、及び/又は調節領域内に含有させ得る。
【0344】
原核細胞及び真核細胞における新規のCRISPR-Casシステムの発現及び利用のための成分
本発明は、原核細胞/生物又は真核細胞/生物において、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択的に切れ目を入れるか、ほどくか、又は開裂し得るガイドRNA/Casシステムを発現させるための発現コンストラクトをさらに提供する。
【0345】
一実施形態では、本開示の発現コンストラクトは、Cas遺伝子(又は本明細書で説明されているCasエンドヌクレアーゼ遺伝子を含む、最適化された植物)をコードするヌクレオチド配列に作動可能に連結されたプロモーター、及び本開示のガイドRNAに作動可能に連結されたプロモーターを含む。プロモーターは、原核細胞/生物又は真核細胞/生物において、作動可能に連結されたヌクレオチド配列の発現を駆動し得る。
【0346】
ガイドポリヌクレオチド、VTドメイン、及び/又はCERドメインのヌクレオチド配列改変は、5’キャップ、3’ポリアデニル化テイル、リボスイッチ配列、安定した制御配列、dsRNA二本鎖を形成する配列、ガイドポリヌクレオチドを細胞内位置に標的化する改変又は配列、追跡をもたらす改変又は配列、タンパク質のための結合部位をもたらす改変又は配列、ロックド核酸(LNA)、5-メチルdCヌクレオチド、2,6-ジアミノプリンヌクレオチド、2’-フルオロAヌクレオチド、2’-フルオロUヌクレオチド;2’-O-メチルRNAヌクレオチド、ホスホロチオエート結合、コレステロール分子への連結、ポリエチレングリコール分子への連結、スペーサー18分子への連結、5’から3’への共有結合的な連結、又はこれらの任意の組み合わせからなる群から選択され得るが、これらに限定されない。これらの改変は、少なくとも1種の追加の有利な特徴をもたらし得、この追加の有利な特徴は、安定性の改変又は調節、細胞内ターゲティング、追跡、蛍光標識、タンパク質用又はタンパク質複合体用の結合部位、相補的な標的配列に対する結合親和性の改変、細胞分解に対する耐性の改変、及び細胞透過性の増大の群から選択される。
【0347】
Cas9媒介DNAターゲティングを行うために真核細胞中でgRNA等のRNA成分を発現させる方法は、RNAポリメラーゼIII(Pol III)プロモーターを使用することであり、これは、正確に定義された改変されていない5’末端及び3’末端を有するRNAの転写を可能にする(DiCarlo et al.,Nucleic Acids Res.41:4336-4343;Ma et al.,Mol.Ther.Nucleic Acids 3:e161)。この戦略は、トウモロコシ及びダイズを含むいくつかの異なる種の細胞に問題なく適用されている(2015年3月19日に公開された米国特許出願公開第20150082478号明細書)。5’キャップを有していないRNA成分を発現させる方法が説明されている(2016年2月18日に公開された国際公開第2016/025131号パンフレット)。
【0348】
Casエンドヌクレアーゼのための標的部位に挿入される目的のポリヌクレオチドを有する細胞又は生物を得るために、様々な方法及び組成物を用い得る。そのような方法は、標的部位に目的のポリヌクレオチドを組み込む相同組換え(HR)を用い得る。本明細書で説明されいてる1つの方法において、目的のポリヌクレオチドは、ドナーDNAコンストラクトによって生物細胞に導入される。
【0349】
ドナーDNAコンストラクトは、目的のポリヌクレオチドに隣接する第1及び第2の相同領域をさらに含む。ドナーDNAの第1の及び第2の相同領域は、細胞又は生物のゲノムの標的部位中に存在するか又はこの標的部位に隣接する第1及び第2のゲノム領域に対し相同性をそれぞれ共有する。
【0350】
ドナーDNAを、ガイドポリヌクレオチドに繋留させ得る。繋留されたドナーDNAは、ゲノムの編集、遺伝子の挿入、及び標的ゲノムの調節で有用な標的及びドナーDNAの共局在化を可能にし得、且つ内在性HR機構の機能が大きく低下していると予想される有糸分裂終細胞のターゲティングでも有用であり得る(Mali et al.,2013,Nature Methods Vol.10:957-963)。
【0351】
標的及びドナーポリヌクレオチドによって共有される相同性又は配列同一性の量は、変動し得、約1~20bp、20~50bp、50~100bp、75~150bp、100~250bp、150~300bp、200~400bp、250~500bp、300~600bp、350~750bp、400~800bp、450~900bp、500~1,000bp、600~1,250bp、700~1,500bp、800~1,750bp、900~2,000bp、1~2.5kb、1.5~3kb、2~4kb、2.5~5kb、3~6kb、3.5~7kb、4~8kb、5~10kb、又は標的部位の全長以下の範囲内の単位整数値を有する全長及び/又は領域を含む。これらの範囲には、この範囲内の全ての整数が含まれており、例えば、1~20bpの範囲には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、及び20bpが含まれる。相同性の量を、2種のポリヌクレオチドの完全にアラインされた長さ全体にわたる配列同一性パーセントでも説明し得、これには、少なくとも約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98%~99%、99%、99%~100%、又は100%の配列同一性パーセントが含まれる。十分な相同性は、ポリヌクレオチドの長さと、全体的な配列同一性パーセントと、任意選択的な連続したヌクレオチドの保存領域又は局所的な配列同一性パーセントとの任意の組み合わせを含み、例えば、十分な相同性を、標的遺伝子座の領域に対して少なくとも80%の配列同一性を有する75~150bpの領域と説明し得る。十分な相同性をまた、高ストリンジェンシー条件下で特異的にハイブリダイズする2つのポリヌクレオチドの予測能力によって説明し得、例えば、Sambrook et al.,(1989)Molecular Cloning:A Laboratory Manual、(Cold Spring Harbor Laboratory Press,NY);Current Protocols in Molecular Biology,Ausubel et al.,Eds(1994)Current Protocols、(Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.);及びTijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes,(Elsevier,New York)を参照されたい。
【0352】
所定のゲノム領域とドナーDNA上で見出される対応する相同領域との間の構造的類似性は、相同組換えが発生することを可能にする任意の程度の配列同一性であり得る。例えば、ドナーDNAの「相同領域」及び生物ゲノムの「ゲノム領域」によって共有される相同性又は配列同一性の量は、これらの配列が相同組換えを受けるように、少なくとも50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%の配列同一性であり得る。
【0353】
ドナーDNA上の相同領域は、標的部位に隣接する任意の配列に対する相同性を有する可能性がある。一部の例では、相同領域は、標的部位に直接隣接するゲノム配列に対して相当の配列相同性を共有するが、この相同領域を、標的部位に対してさらに5’又は3’であり得る領域に対して十分な相同性を有するように設計し得ることが認識される。相同領域はまた、下流のゲノム領域に加えて標的部位の断片との相同性も有し得る。
【0354】
一実施形態では、第1の相同領域は、標的部位の第1の断片をさらに含み、第2の相同領域は、標的部位の第2の断片を含み、第1の断片及び第2の断片は異なる。
【0355】
目的のポリヌクレオチド
本明細書では、目的のポリヌクレオチドについてさらに説明するが、これには、商業市場及び作物の開発に関係する商業市場の関心を反映するポリヌクレオチドが含まれる。目的の作物及び市場は変化しており、開発途上国が世界市場を広げるにつれて、新規の作物及びテクノロジーもまた出現するであろう。加えて、農業形質、並びに収量及び雑種強勢等の特徴に関する我々の理解が高まるにつれて、遺伝子操作のための遺伝子の選択は、これに応じて変化するであろう。
【0356】
目的のポリヌクレオチドの一般的なカテゴリとして、例えば、ジンクフィンガー等の情報に関与する目的の遺伝子、キナーゼ等の伝達に関与する目的の遺伝子、及び熱ショックタンパク質等のハウスキーピングに関与する目的の遺伝子が挙げられる。より具体的な目的のポリヌクレオチドとして下記が挙げられるが、これらに限定されない:作物の収量、穀物の品質、作物の栄養素含有量、デンプン及び炭水化物の品質及び量、並びに穀粒サイズ、スクロース負荷、タンパク質の品質及び量、窒素固定及び/又は利用、脂肪酸及び油組成に影響を及ぼすもの挙げられるがこれらに限定されない農学的利益の形質に関与する遺伝子、非生物的ストレス(例えば、乾燥、窒素、温度、塩分、毒性金属、若しくは微量元素、又は殺虫剤及び除草剤等の毒素に対する抵抗性を付与するもの)に対する抵抗性を付与するタンパク質をコードする遺伝子、生物的ストレス(例えば、真菌、ウイルス、細菌、昆虫、及び線虫による攻撃、並びにこれらの生物に関連する病気の進行)に対する抵抗性を付与するタンパク質をコードする遺伝子。
【0357】
油、デンプン、及びタンパク質の含有量等の農学的に重要な形質を、従来の育種方法の使用に加え、遺伝子的に改変し得る。改変として、オレイン酸、飽和油、及び不飽和油の含有量の増加、リシン及び硫黄の濃度上昇、必須アミノ酸の提供、またデンプンの改変が挙げられる。ホリドチオニンタンパク質の改変は、米国特許第5,703,049号明細書、同第5,885,801号明細書、同第5,885,802号明細書、及び同第5,990,389号明細書で説明されている。
【0358】
目的のポリヌクレオチド配列は、病気耐性又は有害生物耐性の導入に関与するタンパク質をコードし得る。「病気耐性」又は「有害生物耐性」は、植物と病原体との相互作用の結果である有害な症状を植物が回避することが意図されている。有害生物耐性遺伝子は、ネキリムシ、ヨトウムシ、ヨーロッパアワノメイガ、及び同類のもの等の高収量を阻害する有害生物に対する耐性をコードし得る。抗菌性を保護するリゾチーム若しくはセクロピン等の病気耐性及び昆虫耐性遺伝子、又は抗真菌性を保護するデフェンシン、グルカナーゼ、若しくはキチナーゼ等のタンパク質、又は線虫若しくは昆虫を制御する、バチルス・チューリンゲンシス(Bacillus thuringiensis)エンドトキシン、プロテアーゼ阻害剤、コラゲナーゼ、レクチン、若しくはグルコシダーゼは、いずれも有用な遺伝子産物の例である。病気耐性形質をコードする遺伝子として、フモニシンに対する等の解毒遺伝子(米国特許第5,792,931号明細書)、非病原性(avr)遺伝子及び病気耐性(R)遺伝子(Jones et al.(1994)Science 266:789;Martin et al.(1993)Science 262:1432;及びMindrinos et al.(1994)Cell 78:1089)、及び同類のものが挙げられる。昆虫耐性遺伝子は、根切り虫、ヨトウムシ、ヨーロッパアワノメイガ、及び同類のもの等の穀粒収穫量の低下(yield drag)をもたらす有害生物に対する耐性をコードし得る。そのような遺伝子として、例えば、バチルス・チューリンゲンシス(Bacillus thuringiensis)毒性タンパク質遺伝子(米国特許第5,366,892号明細書;同第5,747,450号明細書;同第5,736,514号明細書;同第5,723,756号明細書;同第5,593,881号明細書;及びGeiser et al.(1986)Gene 48:109)、及び同類のものが挙げられる。
【0359】
「除草剤耐性タンパク質」、又は「除草剤耐性をコードする核酸分子」の発現により得られるタンパク質として、このタンパク質を発現しない細胞より、より高濃度の除草剤に耐える能力、又はこのタンパク質を発現しない細胞より、より長期間ある特定の濃度の除草剤に耐える能力を細胞に付与するタンパク質が挙げられる。除草剤耐性形質を、アセト乳酸合成酵素(ALS、アセトヒドロキシ酸合成酵素、AHASとも呼ばれる)の働きを阻害するように作用する除草剤、特に、スルホニル尿素(sulfonylurea)(UK:スルホニル尿素(sulphonylurea))型除草剤に対する耐性をコードする遺伝子、グルタミン合成酵素の働きを阻害するように作用する除草剤、例えば、ホスフィノトリシン若しくはbastaに対する耐性をコードする遺伝子(例えば、bar遺伝子)、グリホサートに対する耐性をコードする遺伝子(例えば、EPSP合成酵素遺伝子及びGAT遺伝子)、HPPD阻害剤に対する耐性をコードする遺伝子(例えば、HPPD遺伝子)、又は当該技術分野で既知の他のそのような遺伝子によって植物に導入し得る。例えば、米国特許第7,626,077号明細書、同第5,310,667号明細書、同第5,866,775号明細書、同第6,225,114号明細書、同第6,248,876号明細書、同第7,169,970号明細書、同第6,867,293号明細書、及び同第9,187,762号明細書を参照されたい。bar遺伝子は、除草剤bastaに対する耐性をコードし、nptII遺伝子は、抗生物質カナマイシン及びジェネテシンに対する耐性をコードし、ALS遺伝子変異体は、除草剤クロロスルフロンに対する耐性をコードする。
【0360】
さらに、目的のポリヌクレオチドはまた、目的の標的化遺伝子配列のためのメッセンジャーRNA(mRNA)の少なくとも一部分に対して相補的であるアンチセンス配列も含み得る。アンチセンスヌクレオチドは、対応するmRNAとハイブリダイズするために構築される。アンチセンス配列の改変を、この配列が対応するmRNAとハイブリダイズして対応するmRNAの発現を妨害する限り作成し得る。この方法で、対応するアンチセンス配列に対する70%、80%、又は85%の配列同一性を有するアンチセンスコンストラクトを使用し得る。さらに、標的遺伝子の発現を崩壊させるためにアンチセンスヌクレオチドの部分が使用されてもよい。一般に、少なくとも50個のヌクレオチド、100個のヌクレオチド、200個のヌクレオチド、又はより多くの配列を使用し得る。
【0361】
加えて、目的のポリヌクレオチドをまた、植物の内在性遺伝子の発現を抑制するセンス配向でも使用し得る。センス配向のポリヌクレオチドを使用して植物中での遺伝子の発現を抑制する方法は、当該技術分野で既知である。この方法は、一般に、内因性の遺伝子の転写に対応するヌクレオチド配列の少なくとも一部に作動可能に連結された、植物内での発現を駆動するプロモーターを含むDNAコンストラクトで植物を形質転換することを含む。典型的には、そのようなヌクレオチド配列は、内因性遺伝子の転写配列に対し相当の配列同一性を有しており、一般に、約65%を超える配列同一性、約85%を超える配列同一性、又は約95%を超える配列同一性を有する。米国特許第5,283,184号明細書及び同第5,034,323号明細書を参照されたい。
【0362】
目的のポリヌクレオチドはまた、表現型マーカーでもあり得る。表現型マーカーは、陽性選択マーカーであるか又は陰性選択マーカーであるかにかかわらず、視覚マーカー及び選択マーカーを含むスクリーニングマーカー又は選択マーカーである。任意の表現型マーカーを使用し得る。具体的には、選択マーカー又はスクリーニングマーカーは、多くの場合は特定の条件下において、分子若しくはこの分子を含む細胞を特定するか、又はこの分子若しくは細胞に有利若しくは不利に選択することを可能にするDNAセグメントを含む。これらのマーカーは、限定されないがRNA、ペプチド、若しくはタンパク質の産生等の活性をコードし得るか、又はRNA、ペプチド、タンパク質、無機及び有機化合物若しくは組成物、及び同類のものの結合部位を提供し得る。
【0363】
選択マーカーの例として下記が挙げられるが、これらに限定されない:制限酵素部位を含むDNAセグメント;スペクチノマイシン、アンピシリン、カナマイシン、テトラサイクリン、Basta、ネオマイシンホスホトランスフェラーゼII(NEO)、及びハイグロマイシンホスホトランスフェラーゼ(HPT))等の抗生物質を含む、他の点では毒性の化合物に対する耐性を提供する産物をコードするDNAセグメント;レシピエント細胞において他の点では欠失している産物をコードするDNAセグメント(例えば、tRNA遺伝子、栄養要求性マーカー);容易に同定され得る産物をコードするDNAセグメント(例えば、β-ガラクトシダーゼ、GUS等の表現型マーカー;緑色蛍光タンパク質(GFP)、シアン(CFP)、黄色(YFP)、赤色(RFP)等の蛍光タンパク質、及び細胞表面タンパク質);PCRにとっての新規のプライマー部位(例えば、以前には並置されていなかった2つのDNA配列の並列)の生成、制限エンドヌクレアーゼ又は他のDNA改変酵素、化学物質等の作用を受けていないか又は受けたDNA配列の含有、並びにその同定を可能にする特異的改変(例えばメチル化)に必要なDNA配列の含有。
【0364】
さらなる選択マーカーとして、スルホニル尿素、グルホシネートアンモニウム、ブロモキシニル、イミダゾリノン、及び2,4-ジクロロフェノキシアセテート(2,4-D)等の除草化合物に対する耐性を付与する遺伝子が挙げられる。例えば、スルホニル尿素、イミダゾリノン、トリアゾロピリミジンスルホンアミド、ピリミジニルサリチル酸、及びスルホニルアミノカルボニル-トリアゾリノンに対する耐性のためのアセト乳酸合成酵素(ALS)(Shaner and Singh,1997,Herbicide Activity:Toxicol Biochem Mol Biol 69-110);グリホサート耐性5-エノールピルビルシキメイト-3-ホスフェート(EPSPS)(Saroha et al. 1998,J.Plant Biochemistry&Biotechnology Vol 7:65-72)を参照されたい。
【0365】
目的のポリヌクレオチドは、他の形質(例えば、限定されないが、除草剤耐性、又は本明細書で説明されている任意の他の形質)と組み合わせて積み重ねられ得るか又は使用され得る遺伝子を含む。目的のポリヌクレオチド及び/又は形質は、2013年10月3日に公開された米国特許出願公開第20130263324号明細書及び2013年8月1日に公開された国際公開第2013/112686号パンフレットで説明されているような複合形質遺伝子座に一緒に積み重ねられ得る。
【0366】
目的のポリペプチドは、本明細書で説明されている目的のポリヌクレオチドによってコードされる任意のタンパク質又はポリペプチドを含む。
【0367】
さらに提供されるのは、標的部位に組み込まれた目的のポリヌクレオチドをゲノム中に含む少なくとも1種の植物細胞を同定する方法である。ゲノムの標的部位又はその近傍への挿入がなされた植物細胞の同定に、様々な方法が使用可能である。そのような方法を、標的配列中の変化を検出するための標的配列の直接分析と見なし得、PCR法、配列決定法、ヌクレアーゼ消化法、サザンブロット法、及びこれらの任意の組み合わせが挙げられるが、これらに限定されない。例えば、2009年5月21日に公開された米国特許出願公開第20090133152号明細書を参照されたい。この方法はまた、ゲノムに組み込まれた目的のポリヌクレオチドを含む植物細胞から植物を回収することも含む。植物は、不稔性又は稔性であり得る。任意の目的ポリヌクレオチドが提供され、植物のゲノムの標的部位に組み込まれ、植物で発現され得ることが確認される。
【0368】
植物における発現のための配列の最適化
植物好適遺伝子の合成方法は、当該技術分野で使用可能である。例えば、米国特許第5,380,831号明細書及び同第5,436,391号明細書、並びにMurray et al.(1989)Nucleic Acids Res.17:477-498を参照されたい。植物宿主において遺伝子発現を高めるためのさらなる配列の改変が知られている。これらの改変として、例えば、疑似のポリアデ二ル化シグナルをコードする1つ又は複数の配列の除去、1つ又は複数のエクソン-イントロンスプライス部位シグナルの除去、1つ又は複数のトランスポゾン様リピートの除去、及び遺伝子発現に有害であるおそれのあるそのようなよく特徴付けられた他の配列の除去が挙げられる。配列のG-C含量を、所与の植物宿主の平均レベル(この宿主植物細胞で発現される既知の遺伝子を参照して算出される)に調整し得る。可能であれば、配列が改変されて、1つ又は複数のmRNAの予測されるヘアピン二次構造が回避される。そのため、本開示の「植物最適化ヌクレオチド配列」は、1つ又は複数のそのような配列改変を含む。
【0369】
発現エレメント
本明細書で開示されているCasタンパク質又は他のCRISPRシステム成分をコードする任意のポリヌクレオチドは、宿主細胞における転写又は調節を容易にするために、異種発現エレメントに機能的に連結され得る。そのような発現エレメントとして、プロモーター、リーダー、イントロン、及びターミネーターが挙げられるが、これらに限定されない。発現エレメントは、「最小」であり得、これは、発現調節因子又は修飾因子として依然として機能する、天然の供給源に由来する短い配列を意味する。或いは、発現エレメントは、「最適化」され得、これは、そのポリヌクレオチド配列が特定の宿主細胞においてより望ましい特徴を伴って機能するために、その天然の状態から改変されていることを意味する(例えば、限定されないが、トウモロコシ植物中での発現を改善するために、細菌プロモーターが「トウモロコシ最適化」され得る)。或いは、発現エレメントは、「合成」であり得、これは、発現エレメントがインシリコで設計され、宿主細胞で使用するために合成されることを意味する。合成発現エレメントは、全体的に合成であってもよいし、部分的に合成(天然に存在するポリヌクレオチド配列の断片を含む)であってもよい。
【0370】
ある特定のプロモーターは、他のものよりも高率でRNAの合成を誘導し得ることが示されている。これは、「強力なプロモーター」と呼ばれている。ある特定の他のプロモーターは、特定の細胞型又は組織型でのみ高いレベルでRNAの合成を誘導し得ることが示されており、このプロモーターが、ある特定の組織で好適にRNA合成を誘導するが他の組織では低いレベルでRNA合成を誘導する場合には、「組織特異性プロモーター」又は「組織優勢プロモーター」と呼ばれることが多い。
【0371】
植物プロモーターは、植物細胞において転写を開始し得るプロモーターを含む。植物プロモーターの説明については、Potenza et al.,2004、In vitro Cell Dev Biol 40:1-22;Porto et al.,2014,Molecular Biotechnology(2014),56(1),38-49を参照されたい。
【0372】
構成型プロモーターとして、例えば、コアCaMV 35Sプロモーター(Odell et al.,(1985)Nature 313:810-2);イネアクチン(McElroy et al.,(1990)Plant Cell 2:163-71);ユビキチン(Christensen et al.,(1989)Plant Mol Biol 12:619-32;ALSプロモーター(米国特許第5,659,026号明細書)、及び同類のものが挙げられる。
【0373】
組織優先プロモーターは、特定の植物組織内での強化された発現をターゲティングするために使用され得る。組織優先プロモーターとして、例えば、2013年7月11日に公開された国際公開第2013103367号パンフレット、Kawamata et al.,(1997)Plant Cell Physiol 38:792-803;Hansen et al.,(1997)Mol Gen Genet 254:337-43;Russell et al.,(1997)Transgenic Res 6:157-68;Rinehart et al.,(1996)Plant Physiol 112:1331-41;Van Camp et al.,(1996)Plant Physiol 112:525-35;Canevascini et al.,(1996)Plant Physiol 112:513-524;Lam,(1994)Results Probl Cell Differ 20:181-96;及びGuevara-Garcia et al.,(1993)Plant J 4:495-505が挙げられる。葉優先プロモーターとして、例えば、Yamamoto et al.,(1997)Plant J 12:255-65;Kwon et al.,(1994)Plant Physiol105:357-67;Yamamoto et al.,(1994)Plant Cell Physiol 35:773-8;Gotor et al.,(1993)Plant J 3:509-18;Orozco et al.,(1993)Plant Mol Biol 23:1129-38;Matsuoka et al.,(1993)Proc.Natl.Acad.Sci.USA90:9586-90;Simpson et al.,(1958)EMBO J 4:2723-9;Timko et al.,(1988)Nature 318:57-8を参照されたい。根優先プロモーターとしては、例えば、Hire et al.,(1992)Plant Mol Biol 20:207-18(ダイズ根特異的グルタミン合成酵素遺伝子);Miao et al.,(1991)Plant Cell 3:11-22(サイトゾルグルタミン合成酵素(GS));Keller and Baumgartner,(1991)Plant Cell 3:1051-61(サヤインゲンのGRP 1.8遺伝子における根特異的制御エレメント);Sanger et al.,(1990)Plant Mol Biol 14:433-43(A.ツメファシエンス(A.tumefaciens)マンノピン合成酵素(MAS)の根特異的プロモーター);Bogusz et al.,(1990)Plant Cell 2:633-41(パラスポニア・アンデルソニイ(Parasponia andersonii)及びトレマ・トメントサ(Trema tomentosa)から単離された根特異的プロモーター);Leach and Aoyagi,(1991)Plant Sci 79:69-76(A.リゾゲネス(A.rhizogenes)rolC及びrolD根誘導遺伝子);Teeri et al.,(1989)EMBO J 8:343-50(アグロバクテリウム(Agrobacterium)創傷誘導TR1’及びTR2’遺伝子);VfENOD-GRP3遺伝子プロモーター(Kuster et al.,(1995)Plant Mol Biol 29:759-72);及びrolBプロモーター(Capana et al.,(1994)Plant Mol Biol 25:681-91;ファゼオリン遺伝子(Murai et al.,(1983)Science 23:476-82;Sengopta-Gopalen et al.,(1988)Proc.Natl.Acad.Sci.USA82:3320-4)が挙げられる。米国特許第5,837,876号明細書、同第5,750,386号明細書、同第5,633,363号明細書、同第5,459,252号明細書、同第5,401,836号明細書、同第5,110,732号明細書、及び同第5,023,179号明細書も参照されたい。
【0374】
種子優先プロモーターには、種子発育中活性な種子特異的プロモーター、及び種子発芽中活性な種子発芽プロモーターの両方が含まれる。Thompson et al.,(1989)BioEssays 10:108を参照されたい。種子優先プロモーターとして、Cim1(サイトカイニン誘導メッセージ);cZ19B1(トウモロコシ19kDaゼイン);及びmilps(ミオイノシトール-1-リン酸合成酵素);並びに例えば2000年3月2日に公開された国際公開第2000011177号パンフレット及び米国特許第6,225,529号明細書で開示されているものが挙げられるが、これらに限定されない。双子葉植物用の種子優先プロモーターとして、インゲンマメ-β-ファセオリン、ナピン(napin)、β-コングリシニン、ダイズレクチン、クルシフェリン、及び同類のものが挙げられるが、これらに限定されない。単子葉植物用の種子優先プロモーターとして、トウモロコシ15kDaゼイン、22kDaゼイン、27kDaガンマゼイン、ワクシー(waxy)、シュランケン(shrunken)1、シュランケン(shrunken)2、グロブリン1、オレオシン、及びnuc1が挙げられるが、これらに限定されない。2000年3月9日に公開された国際公開第2000012733号パンフレットも参照されたい。この文献には、END1及びEND2遺伝子由来の種子優先プロモーターが開示されている。
【0375】
化学誘導性(調節)プロモーターを使用して、外因性の化学調節剤の適用によって原核及び真核細胞又は生物での遺伝子発現を調節し得る。このプロモーターは、化学物質の適用が遺伝子発現を誘導する化学誘導性プロモーター、又は化学物質の適用が遺伝子発現を抑制する化学抑制性プロモーターであり得る。化学誘導性プロモーターとして下記が挙げられるが、これらに限定されない:ベンゼンスルホンアミド除草剤毒性緩和剤によって活性化されるトウモロコシIn2-2プロモーター(De Veylder et al.,(1997)Plant Cell Physiol 38:568-77)、発芽前除草剤として使用されている疎水性求電子性化合物によって活性化されるトウモロコシGSTプロモーター(GST-II-27、1993年1月21日に公開された国際公開第1993001294号パンフレット)、及びサリチル酸によって活性化されるタバコPR-1aプロモーター(Ono et al.,(2004)Biosci Biotechnol Biochem 68:803-7)。他の化学調節プロモーターとして、ステロイド応答性プロモーター(例えば、グルココルチコイド誘導性プロモーター(Schena et al.,(1991)Proc.Natl.Acad.Sci.USA88:10421-5;McNellis et al.,(1998)Plant J 14:247-257を参照されたい);テトラサイクリン誘導性及びテトラサイクリン抑制性プロモーター(Gatz et al.,(1991)Mol Gen Genet 227:229-37;米国特許第5,814,618号明細書、及び同第5,789,156号明細書)が挙げられる。
【0376】
病原体の感染後に誘導される病原体誘導性プロモーターとして、PRタンパク質、SARタンパク質、ベータ-1,3-グルカナーゼ、キチナーゼ等の発現を調節するものが挙げられるが、これらに限定されない。
【0377】
ストレス誘導性プロモーターとして、RD29Aプロモーター(Kasuga et al.(1999)Nature Biotechnol.17:287-91)が挙げられる。当業者は、乾燥、浸透圧ストレス、塩ストレス、及び温度ストレス等のストレス条件をシミュレートするためのプロトコル、並びにシミュレートしたか又は天然に発生したストレス条件に置かれた植物のストレス耐性を評価するためのプロトコルに精通している。
【0378】
植物細胞に有用な誘導性プロモーターの別の例は、2013年11月21日に公開された米国特許出願公開第20130312137号明細書で説明されているZmCAS1プロモーターである。
【0379】
植物細胞に有用な様々な種類の新規のプロモーターが絶えず発見されており、多くの例を、Okamuro及びGoldberg編集(1989)のThe Biochemistry of Plants,Vol.115,Stumpf and Conn,eds(New York,NY:Academic Press),pp.1-82に見出し得る。
【0380】
新規のCRISPR-Casシステム成分によるゲノムの改変
本明細書で説明されているように、誘導されたCasエンドヌクレアーゼは、DNA標的配列を認識して結合し得、且つ一本鎖(ニック)又は二本鎖切断を導入し得る。一本鎖又は二本鎖切断がDNA内に導入されると、細胞のDNA修復機構は、この切断を修復するように活性化される。エラープローンDNA修復機構は、二本鎖切断部位で変異を作り出し得る。破損した末端を1つに結合させるための最も一般的な修復機構は、非相同末端結合(NHEJ)経路である(Bleuyard et al.,(2006)DNA Repair 5:1-12)。染色体の構造的完全性は、典型的には、修復により維持されるが、欠失、挿入、又は他の再配列(例えば染色体転座)もあり得る(Siebert and Puchta,2002,Plant Cell 14:1121-31;Pacher et al.,2007,Genetics 175:21-9)。
【0381】
DNA二本鎖切断は、相同組換え経路を刺激するための効果的な因子であると思われる(Puchta et al.,(1995)Plant Mol Biol 28:281-92;Tzfira and White,(2005)Trends Biotechnol 23:567-9;Puchta,(2005)J Exp Bot 56:1-14)。DNA切断剤を使用すると、植物において人工的に構築された相同DNAリピート間で相同組換えの2~9倍の増加が観察された(Puchta et al.,(1995)Plant Mol Biol 28:281-92)。トウモロコシのプロトプラストにおける線状DNA分子による実験で、プラスミド間の相同組み換えの増進が示された(Lyznik et al.,(1991)Mol Gen Genet 230:209-18)。
【0382】
相同組換え修復(HDR)は、細胞内の二本鎖及び一本鎖DNA切断を修復する機構である。相同組換え修復として、相同組換え(HR)及び一本鎖アニーリング(SSA)が挙げられる(Lieber.2010 Annu.Rev.Biochem.79:181-211)。HDRの最も一般的な形態は、ドナーDNAとアクセプターDNAとの間の最長配列相同性要件を有する相同組換え(HR)と呼ばれる。HDRの他の形態には、一本鎖アニーリング(SSA)及び切断誘導性複製が含まれ、これらは、HRと比較して短い配列相同性を必要とする。ニック(一本鎖切断)での相同組換え修復は、二本鎖切断に対するHDRと異なる機構で起こり得る(Davis and Maizels.PNAS(0027-8424),111(10),p.E924-E932)。
【0383】
例えば相同組換え(HR)による原核細胞及び真核生細胞又は生物細胞のゲノムの改変は、遺伝子操作の強力なツールである。相同組換えは、植物(Halfter et al.,(1992)Mol Gen Genet 231:186-93)及び昆虫(Dray and Gloor,1997,Genetics 147:689-99)において実証されている。相同組換えはまた、他の生物においても実施されてきた。例えば、寄生原虫であるリーシュマニア属(Leishmania)における相同組換えのために、少なくとも150~200bpの相同性が必要とされた(Papadopoulou and Dumas,(1997)Nucleic Acids Res 25:4278-86)。糸状菌であるアスペルギルス・ニデュランス(Aspergillus nidulans)では、遺伝子置換えは50bpと少ない隣接相同性を用いて達成されている(Chaveroche et al.,(2000)Nucleic Acids Res 28:e97)。標的化遺伝子置換えはまた、繊毛虫類であるテトラヒメナ・サーモフィラ(Tetrahymena thermophila)においても実証されている(Gaertig et al.,(1994)Nucleic Acids Res 22:5391-8)。哺乳動物では、相同組換えは、培養で増殖させ、形質転換し、選択し、マウス胚に導入し得る多能性胚性幹細胞株(ES)を使用してマウスにおいて最も成功している(Watson et al.,1992,Recombinant DNA,2nd Ed.,Scientific American Books distributed by WH Freeman&Co.)。
【0384】
遺伝子ターゲティング
本明細書で説明されているガイドポリヌクレオチド/Casシステムを、遺伝子ターゲティングに使用し得る。
【0385】
一般に、DNAターゲティングを、好適なポリヌクレオチド成分と関連するCasタンパク質により、細胞中の特定のポリヌクレオチド配列において一方又は両方の鎖を開裂することによって実施し得る。DNA中に一本鎖又は二本鎖切断が誘導されると、細胞のDNA修復機構が活性化され、非相同末端結合(NHEJ)又は相同組換え修復(HDR)プロセスによって切断が修復され、これにより標的部位が改変され得る。
【0386】
標的部位のDNA配列の長さは変動し得、例えば長さが少なくとも12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、又は30個を超えるヌクレオチドである標的部位が含まれる。標的部位は、回文構造であり得、即ち、一方の鎖上の配列が相補鎖上で反対方向に同じものを読み取ることがさらに可能である。ニック/開裂部位は標的配列内に存在し得るか、又はニック/開裂は標的配列の外側に存在する可能性がある。別のバリエーションでは、開裂は、互いに直接向かい合ったヌクレオチド位置で起きて平滑末端切断を生じる可能性があり、又は他の場合には、切り込みがずれて、「粘着末端」とも呼ばれる一本鎖オーバーハング(5’オーバーハング又は3’オーバーハングであり得る)を生じさせる可能性がある。ゲノム標的部位の活性バリアントも使用し得る。そのような活性バリアントは、所与の標的部位に対して少なくとも65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又はより高い配列同一性を含み得、この活性バリアントは生物学的活性を保持しており、従って、Casエンドヌクレアーゼにより認識されて開裂され得る。
【0387】
エンドヌクレアーゼによる標的部位の一本鎖又は二本鎖切断を測定するためのアッセイは、当該技術分野で既知であり、一般には、認識部位を含むDNA基質への作用物質の全体的活性及び特異性を測定する。
【0388】
本明細書におけるターゲティング法を、例えば、この方法で2つ以上のDNA標的部位が標的化されるように実施し得る。そのような方法は、任意選択により、多重法として特徴付けられ得る。ある特定の実施形態では、2、3、4、5、6、7、8、9、10個、又はより多い標的部位が同時に標的化され得る。多重法は、典型的には、複数の異なるRNA成分(そのそれぞれが、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体を固有のDNA標的部位に誘導するように設計されている)が提供される、本明細書中のターゲティング法により実施される。
【0389】
遺伝子編集
DSBと改変鋳型とを組み合わせるゲノム配列の編集プロセスは、一般に、染色体配列中の標的配列を認識し、ゲノム配列にDSBを導入し得るDSB誘導物質又はDSB誘導物質をコードする核酸、及び編集対象のヌクレオチド配列と比較して少なくとも1つのヌクレオチドの改変を含む少なくとも1つのポリヌクレオチド改変鋳型を宿主細胞に導入することを含む。ポリヌクレオチド改変鋳型は、少なくとも1つのヌクレオチド改変部に隣接するするヌクレオチド配列をさらに含み得。この隣接する配列は、DSBに隣接する染色体領域に実質的に相同である。DSB誘導物質(例えばCas-gRNA複合体)を使用するゲノム編集は、例えば、2015年3月19日に公開された米国特許出願公開第20150082478号明細書、2015年2月26日に公開された国際公開第2015026886号パンフレット、2016年1月14日に公開された国際公開第2016007347号パンフレット、及び2016年2月18日に公開された国際公開第2016/025131号パンフレットで説明されている。
【0390】
ガイドRNA/Casエンドヌクレアーゼシステムのいくつかの使用が説明されており(例えば、2015年3月19日に公開された米国特許出願公開第20150082478A1号明細書、2015年2月26日に公開された国際公開第2015026886号パンフレット、及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書を参照されたい)、これとして、目的のヌクレオチド配列(例えば調節エレメント)の改変又は置換、目的のポリヌクレオチドの挿入、遺伝子ノックアウト、遺伝子ノックイン、スプライシング部位の改変、及び/又は代替スプライシング部位の導入、目的のタンパク質をコードするヌクレオチド配列の改変、アミノ酸及び/又はタンパク質の融合、並びに目的の遺伝子中に逆方向リピートを発現することによる遺伝子サイレンシングが挙げられるが、これらに限定されない。
【0391】
タンパク質を、アミノ酸の置換、欠失、トランケーション、及び挿入を含む様々な方法で改変し得る。そのような操作のための方法は、一般に既知である。例えば、タンパク質のアミノ酸配列バリアントを、DNA内の変異により調製し得る。変異誘発法、及びヌクレオチド配列の改変として、例えば、Kunkel,(1985)Proc.Natl.Acad.Sci.USA 82:488-92;Kunkel et al.,(1987)Meth Enzymol 154:367-82;米国特許第4,873,192号明細書;Walker and Gaastra,eds.(1983)Techniques in Molecular Biology(MacMillan Publishing Company、New York)、及びこれらで引用されている文献が挙げられる。タンパク質の生物学的活性に影響を与えそうにないアミノ酸置換についてのガイダンスは、例えば、Dayhoff et al.(1978)Atlas of Protein Sequence and Structure(Natl Biomed Res Found、Washington、D.C.)のモデルで見出される。1つのアミノ酸を類似の特性を有する別のアミノ酸と交換する等の保存的置換が好ましい場合がある。保存的な欠失、挿入、及びアミノ酸置換は、タンパク質の特性に過激な変化を引き起こさないことが期待されており、任意の置換、欠失、挿入、又はこれらの組み合わせの影響を、ルーチンのスクリーニング分析で評価し得る。二本鎖切断誘導活性についてのアッセイは既知であり、一般には、標的部位を含むDNA基質上の作用物質の全体的活性及び特異性を測定する。
【0392】
本明細書で説明されているのは、Casエンドヌクレアーゼ、並びにCasエンドヌクレアーゼ及びガイドポリヌクレオチドを含む複合体を用いたゲノム編集方法である。ガイドRNA及びPAM配列の特徴付けに続いて、エンドヌクレアーゼ及び関連するCRISPR RNA(crRNA)の成分を、植物を含む他の生物において染色体DNAを改変するために利用し得る。最適な発現及び核局在化(真核細胞の場合)を容易にするために、この複合体を含む遺伝子は、2016年11月24日に公開された国際公開第2016186953号パンフレットで説明されている通りに最適化され得、次いで当該技術分野で既知の方法によってDNA発現カセットとして細胞に送達され得る。活性複合体を含むために必要な成分は、RNAを分解から保護する改変を伴うか若しくは伴わないRNAとしても送達され得るか、又はキャップされたか若しくはキャップされていないmRNAとしても送達され得るか、(Zhang,Y.et al.,2016,Nat.Commun.7:12617)、又はCasタンパク質ガイドポリヌクレオチド複合体としても送達され得るか、(2017年4月27日に公開された国際公開第2017070032号パンフレット)、又はこれらの任意の組み合わせとしても送達され得る。加えて、複合体の一部又は複数の部分、及びcrRNAを、DNAコンストラクトから発現させ得、一方、他の成分は、RNAを分解から保護する改変を伴うか又は伴わないRNAとして送達され、又はキャップされたか若しくはキャップされていないmRNAとして送達され(Zhang et al.2016 Nat.Commun.7:12617)、又はCasタンパク質ガイドポリヌクレオチド複合体として送達され(2017年4月27日に公開された国際公開第2017070032号パンフレット)、又はこれらの任意の組み合わせとして送達される。crRNAをインビボで生成するために、例えば、2017年6月22日に公開された国際公開第2017105991号明細書で説明されているように、tRNA由来エレメントを使用して、crRNA転写産物をそのDNA標的部位に複合体を誘導し得る成熟形態に開裂するために内在性RNAseも動員し得る。ニッカーゼ複合体を個別に又は協調して使用して、DNA鎖の一方又は両方に単一又は複数のDNAニックを生成し得る。さらに、Casエンドヌクレアーゼの開裂活性を、その開裂ドメイン中の重要な触媒残基を改変することによって不活性化させ得(Sinkunas,T et al.,2013,EMBO J.32:385-394)、その結果、相同組換え修復を増強するか、転写活性化を誘導するか、又はDNA局部構造を再構築するために使用され得るRNA誘導ヘリカーゼが生じる。さらに、Cas開裂ドメイン及びヘリカーゼドメインの活性を、両方ともノックアウトし得、且つ他のDNA切断、DNAニッキング、DNA結合、転写活性化、転写抑制、DNA再構築、DNA脱アミノ化、DNAのほどき、DNA組換え増強、DNA組込み、DNA逆位、及びDNA修復剤と組み合わせて使用し得る。
【0393】
CRISPR-CasシステムのtracrRNA(存在する場合)及びCRISPR-Casシステムの他の成分(例えば、可変ターゲティングドメイン、crRNAリピート、ループ、抗リピート)の転写方向を、2016年11月24日に公開された国際公開第2016186946号パンフレット、及び2016年11月24日に公開された国際公開第2016186953号パンフレットで説明されているように推定し得る。
【0394】
本明細書で説明されているように、適切なガイドRNA要件が確立されると、本明細書で開示されている新規の各システムについてのPAM優先度を調べ得る。開裂複合体がランダム化PAMライブラリーの分解をもたらす場合には、重要な残基の変異誘発により、又は既に説明されているようにATPの非存在下で反応を組み立てることにより(Sinkunas,T.et al.,2013,EMBO J.32:385-394)、ATPase依存性ヘリカーゼ活性を無効にすることによって複合体をニッカーゼに変換することができる。2つのプロトスペーサー標的によって分離されたPAMランダム化の2つの領域を利用して二本鎖DNA切断を生成し得、これを捕捉して配列決定して、それぞれの複合体による開裂を支持するPAM配列を調べ得る。
【0395】
一実施形態では、本発明は、細胞のゲノム中の標的部位を改変する方法であって、本明細書で説明されている少なくとも1つのPGENを細胞に導入すること、及び前記標的で改変を有する少なくとも1つの細胞を同定することを含み、前記標的部位での改変は、(i)少なくとも1つのヌクレオチドの置き換え、(ii)少なくとも1つのヌクレオチドの欠失、(iii)少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの化学的改変、及び(v)(i)~(iv)の任意の組み合わせからなる群から選択される、方法を説明する。
【0396】
編集されるヌクレオチドは、Casエンドヌクレアーゼによって認識されて開裂される標的部位内又はその外に位置し得る。一実施形態では、少なくとも1つのヌクレオチド改変は、Casエンドヌクレアーゼにより認識されて開裂される標的部位での改変ではない。別の実地形態では、編集される少なくとも1つのヌクレオチドとゲノム標的部位との間に、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、40、50、100、200、300、400、500、600、700、900、又は1000個のヌクレオチドが存在する。
【0397】
ノックアウトは、インデル(NHEJによる標的DNA配列中のヌクレオチド塩基の挿入若しくは欠失)により生じ得るか、又は標的部位での若しくはその近傍の配列の機能を低下させるか若しくは完全に喪失させる配列の特異的除去により生じ得る。
【0398】
ガイドポリヌクレオチド/Casエンドヌクレアーゼ誘導標的化変異は、Casエンドヌクレアーゼによって認識されて開裂されるゲノム標的部位の内又は外に位置するヌクレオチド配列内で発生し得る。
【0399】
細胞のゲノム中のヌクレオチド配列を編集する方法は、非機能性遺伝子産物の機能を回復させることにより、外因性選択マーカーを使用しない方法であり得る。
【0400】
一実施形態では、本発明は、細胞のゲノム中の標的部位を改変する方法であって、本明細書で説明されている少なくとも1つのPGEN、及び少なくとも1つのドナーDNAを細胞に導入することであり、前記ドナーDNAは、目的のポリヌクレオチドを含む、導入することを含み、任意選択的に、前記標的部位又はその近傍に前記目的のポリヌクレオチドが組み込まれた少なくとも1つの細胞を同定することをさらに含む方法を説明する。
【0401】
一態様では、本明細書で開示されている方法は、標的部位で目的のポリヌクレオチドの組み込みを提供するために、相同組換え(HR)を使用し得る。
【0402】
本明細書で説明されているCRISPR-Casシステム成分の活性により、標的部位に挿入された目的のポリヌクレオチドを有する細胞又は生物を生成するために、種々の方法及び組成物が使用され得る。本明細書で説明されている1つの方法では、目的のポリヌクレオチドは、ドナーDNAコンストラクトによって生物細胞に導入される。本明細書で使用される場合、「ドナーDNA」は、Casエンドヌクレアーゼの標的部位内に挿入される目的のポリヌクレオチドを含むDNAコンストラクトである。ドナーDNAコンストラクトは、目的のポリヌクレオチドに隣接する第1及び第2の相同領域をさらに含む。ドナーDNAの第1及び第2の相同領域は、細胞又は生物のゲノムの標的部位中に存在するか又はこの標的部位に隣接する第1及び第2のゲノム領域に対し相同性をそれぞれ共有する。
【0403】
ドナーDNAを、ガイドポリヌクレオチドに繋留させ得る。繋留されたドナーDNAは、ゲノムの編集、遺伝子の挿入、及び標的ゲノムの調節で有用な標的及びドナーDNAの共局在化を可能にし得、且つ内在性HR機構の機能が大きく低下していると予想される有糸分裂終細胞のターゲティングでも有用であり得る(Mali et al.,2013,Nature Methods Vol.10:957-963)。
【0404】
標的及びドナーポリヌクレオチドによって共有される相同性又は配列同一性の量は、変動し得、約1~20bp、20~50bp、50~100bp、75~150bp、100~250bp、150~300bp、200~400bp、250~500bp、300~600bp、350~750bp、400~800bp、450~900bp、500~1,000bp、600~1,250bp、700~1,500bp、800~1,750bp、900~2,000bp、1~2.5kb、1.5~3kb、2~4kb、2.5~5kb、3~6kb、3.5~7kb、4~8kb、5~10kb、又は標的部位の全長以下の範囲内の単位整数値を有する全長及び/又は領域を含む。これらの範囲には、この範囲内の全ての整数が含まれており、例えば、1~20bpの範囲には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、及び20bpが含まれる。相同性の量を、2種のポリヌクレオチドの完全にアラインされた長さ全体にわたる配列同一性パーセントでも説明し得、これには、少なくとも約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%の配列同一性パーセントが含まれる。十分な相同性は、ポリヌクレオチドの長さと、全体的な配列同一性パーセントと、任意選択的な連続したヌクレオチドの保存領域又は局所的な配列同一性パーセントとの任意の組み合わせを含み、例えば、十分な相同性を、標的遺伝子座の領域に対して少なくとも80%の配列同一性を有する75~150bpの領域と説明し得る。十分な相同性をまた、高ストリンジェンシー条件下で特異的にハイブリダイズする2つのポリヌクレオチドの予測能力によって説明し得、例えば、Sambrook et al.,(1989)Molecular Cloning:A Laboratory Manual、(Cold Spring Harbor Laboratory Press,NY);Current Protocols in Molecular Biology,Ausubel et al.,Eds(1994)Current Protocols、(Greene Publishing Associates,Inc.and John Wiley &Sons,Inc.);及びTijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes,(Elsevier,New York)を参照されたい。
【0405】
エピソームDNA分子をまた、二本鎖切断内にライゲートし得、例えば、染色体二本鎖切断内にT-DNAを組み込み得る(Chilton and Que,(2003)Plant Physiol 133:956-65;Salomon and Puchta,(1998)EMBO J 17:6086-95)。二本鎖切断の周囲の配列が、例えば、二本鎖切断の成熟に関係するエキソヌクレアーゼ活性によって改変されると、遺伝子変換経路は、例えば、非分割性体細胞中の相同染色体又はDNA複製後の姉妹染色分体等の相同配列を利用できる場合には、原初の構造を取り戻し得る(Molinier et al.,(2004)Plant Cell 16:342-52)。異所性及び/又は後成的DNA配列も相同組換えのためのDNA修復鋳型として機能し得る(Puchta,(1999)Genetics 152:1173-81)。
【0406】
一実施形態では、本開示は、細胞のゲノム中のヌクレオチド配列を編集する方法であって、本明細書で説明されている少なくとも1つのPGEN、及びポリヌクレオチド改変鋳型を細胞に導入することであり、前記ポリヌクレオチド改変鋳型は、前記ヌクレオチド配列の少なくとも1つのヌクレオチド改変を含む、導入することを含み、任意選択的に、編集されたヌクレオチド配列を含む少なくとも1つの細胞を選択することをさらに含む方法を含む。
【0407】
本ガイドポリヌクレオチド/Casエンドヌクレアーゼシステムを少なくとも1種のポリヌクレオチド改変鋳型と組み合わせて
使用して、目的のゲノムヌクレオチド配列の編集(改変)を可能にし得る。(2015年3月19日に公開された米国特許出願公開第20150082478号明細書及び2015年2月26日に公開された国際公開第2015026886号パンフレットも参照されたい)。
【0408】
目的のポリヌクレオチド及び/又は形質は、2012年9月27日に公開された国際公開第2012129373号パンフレット及び2013年8月1日に公開された国際公開第2013112686号パンフレットで説明されているような複合形質遺伝子座に一緒に積み重ねられ得る。本明細書で説明されているガイドポリヌクレオチド/Cas9エンドヌクレアーゼシステムは、二本鎖切断を効率よく生成するシステムを提供し、複合形質遺伝子座における形質の積み重ねを可能にする。
【0409】
遺伝子ターゲティングを媒介する、本明細書で説明されているガイドポリヌクレオチド/Casシステムを、異種遺伝子挿入を誘導する方法及び/又は複数の異種遺伝子を含む複合形質遺伝子座を生成する方法において、2012年9月27日に公開された国際公開第2012129373号パンフレットで開示されているのと同様の方法で使用し得、この方法では、目的の遺伝子を導入するための二本鎖切断誘発剤の使用に代えて、本明細書で開示されているガイドポリヌクレオチド/Casシステムが使用される。独立した導入遺伝子を、互いに0.1、0.2、0.3、0.4、0.5、1.0、2、又は5センチモルガン(cM)以内に挿入することにより、単一の遺伝子座として導入遺伝子を繁殖させ得る(例えば、2013年10月3日に公開された米国特許出願公開第20130263324号明細書又は2013年3月14日に公開された国際公開第2012129373号パンフレットを参照されたい)。導入遺伝子を含む植物を選択した後、(少なくとも)1つの導入遺伝子を含む植物を交雑させて、両導入遺伝子を含むF1を形成し得る。これらのF1(F2又はBC1)からの子孫のうち、1/500の子孫は、同一の染色体上に組み換えられた2つの異なる導入遺伝子を有するであろう。その後、複雑な遺伝子座を、単一遺伝子座として両導入形質と共に繁殖させ得る。この過程は繰り返して、所望する形質を幾らでも積み上げ得る。
【0410】
ガイドRNA/Casエンドヌクレアーゼシステムのさらなる使用が説明されており(例えば、2015年3月19日に公開された米国特許出願公開第20150082478号明細書、2015年2月26日に公開された国際公開第2015026886号パンフレット、2015年2月26日に公開された米国特許出願公開第20150059010号明細書、2016年1月14日に公開された国際公開第2016007347号パンフレット、及び2016年2月18日に公開されたPCT出願の国際公開第2016025131号パンフレットを参照されたい)、これとして、目的のヌクレオチド配列(例えば調節エレメント)の改変又は置換、目的のポリヌクレオチドの挿入、遺伝子ノックアウト、遺伝子ノックイン、スプライシング部位の改変、及び/又は代替スプライシング部位の導入、目的のタンパク質をコードするヌクレオチド配列の改変、アミノ酸及び/又はタンパク質の融合、並びに目的の遺伝子中に逆方向リピートを発現することによる遺伝子サイレンシングが挙げられるが、これらに限定されない。
【0411】
本明細書で説明されている遺伝子編集組成物及び方法から得られる特徴を評価し得る。目的の表現型又は形質と相関する染色体間隔を同定することができる。染色体間隔を同定するために、当該技術分野で公知の様々な方法が利用可能である。そのような染色体間隔の境界は、目的の形質を制御する遺伝子に連結されるであろうマーカーを包含すると描出される。換言すると、染色体間隔は、その間隔(間隔の境界を定義す末端マーカーを含む)内に存在する任意のマーカーが特定の形質のマーカーとして使用され得るように決められる。一実施形態では、染色体間隔は、少なくとも1つのQTLを含み、さらには、実際複数のQTLを含み得る。同じ間隔内に複数のQTLが非常に近接していると、1つのマーカーが複数のQTLと連結するので、特定のマーカーの特定のQTLとの関連が不明確になる場合がある。逆に、例えば、非常に近接している2つのマーカーが所望の表現型形質と共分離している場合には、これらのマーカーのそれぞれが同じQTL又は2つの異なるQTLを特定しているのかどうか、しばしば不明確になる。「量的形質遺伝子座」又は「QTL」という用語は、少なくとも1つの遺伝的背景(例えば、少なくとも1つの育種集団)中における量的表現型形質の発現差異に関連するDNAの領域を指す。QTL領域は、問題の形質に影響する遺伝子を包含するか、又はこの遺伝子と緊密に関連している。「QTLのアレル」は、ハプロタイプ等の連続したゲノム領域内又は連鎖群内に、複数の遺伝子又は他の遺伝因子を含み得る。QTLのアレルは、特定のウィンドウ内のハプロタイプを示し得、前記ウィンドウは、1つ又は複数の多型マーカーのセットで定義され得、且つ追跡され得る連続したゲノム領域である。ハプロタイプを、特定のウィンドウ内の各マーカーで、アレルの固有の指紋によって定義し得る。
【0412】
細胞へのCRISPR-Casシステム成分の導入
本明細書で説明されている方法及び組成物は、生物又は細胞に配列を導入する特定の方法に依存せず、この生物の少なくとも1つの細胞の内部にポリヌクレオチド又はポリペプチドを侵入させるのみである。導入には、核酸が細胞のゲノム内に組み込まれ得る、真核細胞又は原核細胞内への核酸の組込みに関する言及が含まれ、且つ核酸、タンパク質、又はポリヌクレオチド-タンパク質複合体(PGEN、RGEN)の細胞への一過性(直接)提供への言及が含まれる。
【0413】
ポリヌクレオチド若しくはポリペプチド、又はポリヌクレオチド-タンパク質複合体を細胞又は生物に導入する方法は、当該技術分野で既知であり、マイクロインジェクション、エレクトロポレーション、安定形質転換法、一過性形質転換法、弾道粒子加速法(粒子衝撃法)、ウィスカー媒介形質転換、アグロバクテリウム(Agrobacterium)媒介形質転換、直接遺伝子導入、ウイルス媒介導入、トランスフェクション、形質導入、細胞透過性ペプチド、メソポーラスシリカナノ粒子(MSN)媒介直接タンパク質送達、局所適用、有性交雑、有性繁殖、及びこれらの任意の組み合わせが挙げられるが、これらに限定されない。
【0414】
例えば、ガイドポリヌクレオチド(ガイドRNA、crヌクレオチド+tracrヌクレオチド、ガイドDNA及び/又はガイドRNA-DNA分子)は、一本鎖又は二本鎖ポリヌクレオチド分子として細胞に直接(一過性に)導入され得る。ガイドRNA(又はcrRNA+tracrRNA)をまた、細胞内に、前記細胞内でガイドRNA(crRNA+tracrRNA分子)を転写し得る特定のプロモーターに作動可能に連結された、ガイドRNA(又はcrRNA+tracrRNA)をコードする異種核酸断片を含む組換えDNA分子を導入することによって間接的に導入し得る。特定のプロモーターは、限定はされないが、厳密に定義され、改変されていない5’末端及び3’末端を有するRNAの転写を可能にする、RNAポリメラーゼIIIプロモーターであり得る(Ma et al.,2014,Mol.Ther.Nucleic Acids 3:e161;DiCarlo et al.,2013,Nucleic Acids Res.41:4336-4343;2015年2月26日に公開された国際公開第2015026887号パンフレット)。細胞内でガイドRNAを転写し得る任意のプロモーターを使用し得、このプロモーターとして、ガイドRNAをコードするヌクレオチド配列に作動可能に連結された熱ショック/熱誘導性プロモーターが挙げられる。
【0415】
植物細胞は、動物細胞(例えばヒト細胞)、真菌細胞(例えば酵母細胞)、及びプロトプラストと異なり、例えば、植物細胞は、成分の送達に障壁として作用し得る植物細胞壁を含む。
【0416】
Casエンドヌクレアーゼ、及び/又はガイドRNA、及び/又はリボ核タンパク質複合体、及び/又は前述のいずれか1つ若しくは複数をコードするポリヌクレオチドの植物細胞への送達を、当該技術分野で既知の方法により達成し得、この方法として下記が挙げられるが、これらに限定されない:リゾビウム目(Rhizobiales)媒介形質転換(例えば、アグロバクテリウム属(Agrobacterium)、オクロバクテリウム属(Ochrobactrum))、粒子媒介送達法(粒子衝撃法)、(例えば、プロトプラストへの)ポリエチレングリコール(PEG)媒介トランスフェクション、エレクトロポレーション、細胞透過性ペプチド、又はメソポーラスシリカナノ粒子(MSN)媒介直接タンパク質送達。
【0417】
本明細書で説明されているCasエンドヌクレアーゼ等のCasエンドヌクレアーゼを、Casポリペプチド自体(Casエンドヌクレアーゼの直接送達と呼ばれる)、Casタンパク質をコードするmRNA、及び/又はガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体自体を当該技術分野で既知の任意の方法を使用して直接導入することにより、細胞に導入し得る。Casエンドヌクレアーゼをまた、このCasエンドヌクレアーゼをコードする組換えDNA分子を導入することによって間接的に細胞に導入し得る。エンドヌクレアーゼを、当該技術分野で既知の任意の方法を使用して、細胞に一過性で導入し得るか、又は宿主細胞のゲノムに組み込み得る。エンドヌクレアーゼ及び/又は誘導ポリヌクレオチドの細胞への取り込みを、2016年5月12日に公開された国際公開第2016073433号パンフレットで説明されているような細胞透過性ペプチド(CPP)を用いて促進し得る。細胞内でCasエンドヌクレアーゼを発現し得る任意のプロモーターを使用し得、このプロモーターとして、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された熱ショック/熱誘導性プロモーターが挙げられる。
【0418】
ポリヌクレオチド改変鋳型の植物細胞への直接送達を、粒子媒介送達によって達成し得、限定されないが、プロトプラストへのポリエチレングリコール(PEG)媒介トランスフェクション、ウィスカー媒介形質転換、エレクトロポレーション、粒子衝撃法、細胞透過性ペプチド、又はメソポーラスシリカナノ粒子(MSN)媒介直接タンパク質送達等の他の任意の直接送達法を、植物細胞等の真核細胞におけるポリヌクレオチド改変鋳型の送達に問題なく使用し得る。
【0419】
ドナーDNAを、当該技術分野で既知の任意の手段によって導入し得る。ドナーDNAを、例えば、アグロバクテリウム(Agrobacterium)媒介性形質転換又はバイオリスティック粒子衝突法を含む当該技術分野で既知の任意の形質転換法によって提供し得る。ドナーDNAは、細胞内で一過性で存在し得るか、又はウイルスレプリコンを介して導入される可能性がある。Casエンドヌクレアーゼ及び標的部位の存在下において、ドナーDNAは、形質転換された植物ゲノムに挿入される。
【0420】
誘導型Casシステム成分の任意の1つの直接送達は、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体成分を受容する細胞の富化及び/又は可視化を促進し得る他のmRNAの直接送達(共送達)を伴い得る。例えば、ガイドポリヌクレオチド/Casエンドヌクレアーゼ成分(及び/又はガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体自体)を、表現型マーカー(例えば、限定されないが、CRC(Bruce et al.2000 The Plant Cell 12:65-79)等の転写活性化因子)をコードするmRNAと一緒に直接共送達することにより、2017年4月27日に公開された国際公開第2017070032号パンフレットで説明されているように非機能性遺伝子産物の機能が回復することによって、外因性選択マーカーを使用することなく細胞の選択及び濃縮を可能にし得る。
【0421】
本明細書で説明されているガイドRNA/Casエンドヌクレアーゼ複合体(本明細書で説明されている開裂準備完了複合体を表す)の細胞への導入には、前記複合体の個々の成分を別々に又はまとめて細胞に導入すること、並びに直接(ガイドのためのRNA及びCasエンドヌクレアーゼのためのタンパク質及びタンパク質サブユニット、又はこれらの機能的断片として直接送達)又は成分を発現する組換えコンストラクト(ガイドRNA、Casエンドヌクレアーゼ、タンパク質サブユニット又はこれらの機能的断片)によって導入することが含まれる。ガイドRNA/Casエンドヌクレアーゼ複合体(RGEN)の細胞への導入には、リボヌクレオチド-タンパク質としてガイドRNA/Casエンドヌクレアーゼ複合体を細胞に導入することが含まれる。このリボヌクレオチド-タンパク質を、本明細書で説明されているように、細胞に導入する前に組み立て得る。ガイドRNA/Casエンドヌクレアーゼリボヌクレオチドタンパク質を構成する成分(少なくとも1つのCasエンドヌクレアーゼ、少なくとも1つのガイドRNA、少なくとも1つのタンパク質サブユニット)を、インビトロで又は細胞(本明細書で説明されているようなゲノム改変の標的とされる)に導入される前に、当該技術分野で既知の任意の手段によって組み立て得る。
【0422】
RGENリボ核タンパク質の直接送達は、その後、複合体が急速に分解し、細胞内での複合体の存在が一時的となるような形での、細胞ゲノムの標的部位におけるゲノム編集を可能にする。このRGEN複合体の一時的存在は、オフターゲット効果を減少させることに繋がり得る。対照的に、プラスミドDNA配列によるRGEN成分(ガイドRNA、Cas9エンドヌクレアーゼ)の送達は、これらのプラスミドからのRGENの持続的な発現をもたらし得、これはオフターゲット効果を増大させ得る(Cradick,T.J.et al.(2013)Nucleic Acids Res 41:9584-9592;Fu,Y et al.(2014)Nat.Biotechnol.31:822-826)。
【0423】
直接送達を、ガイドRNA/Casエンドヌクレアーゼ複合体(RGEN)(本明細書で説明されている開裂準備完了複合体を表す)の任意の1つの成分(例えば、少なくとも1つのガイドRNA、少なくとも1つのCasタンパク質、及び任意選択的な1つのさらなるタンパク質)を、微粒子(例えば、限定されないが、金粒子、タングステン粒子、及び炭化ケイ素ウィスカー粒子)を含む送達マトリックスと組み合わせることによって達成し得る(2017年4月27日に公開された国際公開第2017070032号パンフレットも参照されたい)。この送達マトリックスは、成分の任意の1つ、例えばCasエンドヌクレアーゼを含み得、これは、固体マトリックス(例えば、衝撃用粒子)に付着している。
【0424】
一態様では、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、ガイドRNA/Casエンドヌクレアーゼ複合体を形成するガイドRNA及びCasエンドヌクレアーゼタンパク質がそれぞれRNA及びタンパク質として細胞に導入される複合体である。
【0425】
一態様では、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、ガイドRNA/Casエンドヌクレアーゼ複合体を形成するガイドRNA及びCasエンドヌクレアーゼタンパク質並びに複合体の少なくとも1つのタンパク質サブユニットがそれぞれRNA及びタンパク質として細胞に導入される複合体である。
【0426】
一態様では、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、ガイドRNA及びCasエンドヌクレアーゼ複合体(開裂準備完了複合体)を形成するガイドRNA及びCasエンドヌクレアーゼタンパク質並びに複合体の少なくとも1つのタンパク質サブユニットがインビトロで予め組み立てられ、リボヌクレオチド-タンパク質複合体として細胞に導入される複合体である。
【0427】
ポリヌクレオチド、ポリペプチド、又はポリヌクレオチド-タンパク質複合体(PGEN、RGEN)を、植物又は植物細胞等の真核細胞に導入するためのプロトコルは既知であり、下記が挙げられる:マイクロインジェクション(Crossway et al.,(1986)Biotechniques 4:320-34及び米国特許第6,300,543号明細書)、分裂組織形質転換(米国特許第5,736,369号明細書)、エレクトロポレーション(Riggs et al.,(1986)Proc.Natl.Acad.Sci.USA 83:5602-6、アグロバクテリウム(Agrobacterium)媒介形質転換(米国特許第5,563,055号明細書及び同第5,981,840号明細書)、ウィスカー媒介形質転換(Ainley et al.2013,Plant Biotechnology Journal 11:1126-1134;Shaheen A.and M.Arshad 2011 Properties and Applications of Silicon Carbide(2011),345-358 Editor(s):Gerhardt,Rosario.Publisher:InTech、Rijeka、Croatia.CODEN:69PQBP;ISBN:978-953-307-201-2)、直接遺伝子導入(Paszkowski et al.,(1984)EMBO J 3:2717-22)、及び弾道粒子加速法(米国特許第4,945,050号明細書;同第5,879,918号明細書;同第5,886,244号明細書;同第5,932,782号明細書;Tomes et al.,(1995)“Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment” in Plant Cell,Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg&Phillips(Springer-Verlag,Berlin);McCabe et al.,(1988)Biotechnology 6:923-6;Weissinger et al.,(1988)Ann Rev Genet 22:421-77;Sanford et al.,(1987)Particulate Science and Technology 5:27-37(タマネギ);Christou et al.,(1988)Plant Physiol 87:671-4(ダイズ);Finer and McMullen,(1991)In vitro Cell Dev Biol 27P:175-82(ダイズ);Singh et al.,(1998)Theor Appl Genet 96:319-24(ダイズ);Datta et al.,(1990)Biotechnology 8:736-40(イネ);Klein et al.,(1988)Proc.Natl.Acad.Sci.USA 85:4305-9(トウモロコシ);Klein et al.,(1988)Biotechnology 6:559-63(トウモロコシ);米国特許第5,240,855号明細書;同第5,322,783号明細書、及び同第5,324,646号明細書;Klein et al.,(1988)Plant Physiol 91:440-4(トウモロコシ);Fromm et al.,(1990)Biotechnology 8:833-9(トウモロコシ);Hooykaas-Van Slogteren et al.,(1984)Nature 311:763-4;米国特許第5,736,369号明細書(穀草類);Bytebier et al.,(1987)Proc.Natl.Acad.Sci.USA 84:5345-9(ユリ科(Liliaceae));De Wet et al,(1985)in The Experimental Manipulation of Ovule Tissues,ed.Chapman et al.,(Longman、New York),pp.197-209(花粉);Kaeppler et al.,(1990)Plant Cell Rep 9:415-8)、及びKaeppler et al.,(1992)Theor Appl Genet 84:560-6(ウィスカー媒介形質転換);D’Halluin et al.,(1992)Plant Cell 4:1495-505(エレクトロポレーション);Li et al.,(1993)Plant Cell Rep 12:250-5;Christou and Ford(1995)Annals Botany 75:407-13(イネ)、並びにOsjoda et al.,(1996)Nat Biotechnol 14:745-50(アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)経由トウモロコシ)。
【0428】
或いは、ポリヌクレオチドを、細胞又は生物をウイルス又はウイルス核酸と接触させることにより植物又は植物細胞内に導入し得る。一般に、そうした方法は、ポリヌクレオチドをウイルス性DNA又はRNA分子内に組み込むことを含む。一部の例では、目的のポリペプチドを、最初、ウイルス性ポリタンパク質の一部として合成し得、これは、後でインビボ又はインビトロのタンパク質分解処理を受けて、所望の組み換えタンパク質が生成される。ウイルス性DNA又はRNA分子を含む、ポリヌクレオチドを植物に導入し、そこにコードされているタンパク質を発現させる方法は既知であり、例えば、米国特許第5,889,191号明細書、同第5,889,190号明細書、同第5,866,785号明細書、同第5,589,367号明細書、及び同第5,316,931号明細書を参照されたい。
【0429】
ポリヌクレオチド又は組換えDNAコンストラクトを、種々の一過性形質転換法を使用して、原核及び真核細胞又は生物に提供し得るか、又は導入し得る。そのような一過性形質転換法として、植物へのポリヌクレオチドコンストラクトの直接導入が挙げられるが、これに限定されない。
【0430】
誘導型Casシステムのいずれかの又は全ての成分(タンパク質及び/又は核酸)の取り込みを容易にする分子(例えば、細胞透過性ペプチド及びナノキャリア)を使用する方法を含む任意の方法で、核酸及びタンパク質を細胞に提供し得る。2011年2月10日に公開された米国特許出願公開第20110035836号明細書及び2015年1月7日に公開された欧州特許出願公開第2821486A1号明細書も参照されたい。
【0431】
原核細胞及び真核細胞若しくは生物又は植物部分にポリヌクレオチドを導入する他の方法(例えば、プラスチド形質転換法及び実生又は成熟種子から組織にポリヌクレオチドを導入する方法)を使用し得る。
【0432】
安定形質転換は、生物に導入されたヌクレオチドコンストラクトが生物のゲノムに組み込まれ、その子孫に受け継がれ得ることを意味することが意図されている。一過性形質転換は、ポリヌクレオチドが生物に導入されるが、この生物のゲノムに組み込まれないか、又はポリペプチドが生物に導入されることを意味することが意図されている。一過性形質転換は、導入された組成物が生物内で一時的にのみ発現されるか又は存在することを示す。
【0433】
スクリーニングマーカー表現型を使用することなく標的部位に又は標的部位の近くで改変ゲノムを有する細胞を同定するために、様々な方法を利用し得る。そのような方法を、PCR法、シークエンシング法、ヌクレアーゼ消化、サザンブロット、及びこれらの任意の組合せが挙げられるがこれらに限定されない、標的配列内の何らかの変化を検出するために標的配列を直接的に分析することであると見なし得る。
【0434】
細胞及び植物
本開示のポリヌクレオチド及びポリペプチドを、細胞に導入し得る。細胞として下記が挙げられるが、これらに限定されない:ヒト、非ヒト、動物、哺乳動物、細菌、真菌、昆虫、酵母、非従来型酵母、及び植物細胞、並びに本明細書で説明されている方法によって作製された植物及び種子。単子葉植物及び双子葉植物並びに植物要素を含む任意の植物を、本明細書で説明されている組成物及び方法と共に使用し得る。
【0435】
使用可能な単子葉植物の例として下記が挙げられるが、これらに限定されない:トウモロコシ(ゼア・マイス(Zea mays))、イネ(オリザ・サティバ(Oryza sativa))、ライムギ(セカレ・セレアレ(Secale cereale))、ソルガム(ソルガム・ビカラー(Sorghum bicolor)、ソルガム・ブルガレ(Sorghum vulgare))、ヒエ(例えば、トウジンビエ(ペニセツム・グラウクム(Pennisetum glaucum)))、キビ(パニクム・ミリアセウム(Panicum miliaceum))、アワ(セタリア・イタリカ(Setaria italica))、シコクビエ(エレウシネ・コラカナ(Eleusine coracana))、コムギ(コムギ属(Triticum)の種、例えば、トリティクム・アエスティバム(Triticum aestivum)、トリティクム・モノコクム(Triticum monococcum))、サトウキビ(サッカルム属の種(Saccharum spp.))、カラスムギ(アヴィーナ属(Avena))、オオムギ(ホルデウム属(Hordeum))、スイッチグラス(パニクム・ヴィルガツム(Panicum virgatum))、パイナップル(アナナス・コモスス(Ananas comosus))、バナナ(ムサ属の種(Musa spp.))、ヤシ、観賞植物、芝草、及び他の草。
【0436】
使用可能な双子葉植物の例として下記が挙げられるが、これらに限定されない:ダイズ(グリシン・マックス(Glycine max))、アブラナ属(Brassica)の種(例えば、限定はされないが、アブラナ又はキャノーラ)(ブラシカ・ナプス(Brassica napus)、B.カンペストリス(B.campestris)、ブラシカ・ラパ(Brassica rapa)、ブラシカ・ジュンケア(Brassica.juncea))、アルファルファ(メディカゴ・サティバ(Medicago sativa))、タバコ(ニコチアナ・タバクム(Nicotiana tabacum))、アラビドプシス(アラビドプシス・タリアナ(Arabidopsis thaliana))、ヒマワリ(ヘリアントゥス・アヌウス(Helianthus annuus))、ワタ(ゴシピウム・アルボレウム(Gossypium arboreum)、ゴシピウム・バルバデンセ(Gossypium barbadense))、及びラッカセイ(アラキス・ヒポガエア(Arachis hypogaea))、トマト(ソラナム・リコペルシカム(Solanum lycopersicum))、ジャガイモ(ソラナム・ツベロスム(Solanum tuberosum)。
【0437】
使用可能なさらなる植物として、下記が挙げられる:ベニバナ(カルタムス・ティンクトリウス(Carthamus tinctorius))、サツマイモ(イポモエア・バタタス(Ipomoea batatus))、キャッサバ(マニホット・エスキュレンタ(Manihot esculenta))、コーヒー(コフィア属(Coffea)種)、ココナッツ(ココス・ヌキフェラ(Cocos nucifera))、カンキツ樹(ミカン属(Citrus)種)、ココア(テオブロマ・カカオ(Theobroma cacao))、チャノキ(カメリア・シネンシス(Camellia sinensis))、バナナ(ムサ属(Musa)種)、アボカド(ペルセア・アメリカーナ(Persea americana))、イチジク(フィークス・カシカ(Ficus casica))、グアバ(シジウム・グアジャバ(Psidium guajava))、マンゴー(マンギフェラ・インディカ(Mangifera indica))、オリーブ(オレア・エウロパエ(Olea europaea))、パパイア(カリカ・パパヤ(Carica papaya))、カシュー(アナカルジウム・オクシデンタレ(Anacardium occidentale))、マカデミア(マカダミア・インテグリフォリア(Macadamia integrifolia))、アーモンド(プルヌス・アミグダルス(Prunus amygdalus))、サトウダイコン(ベタ・ブルガリス(Beta vulgaris))、野菜類、観賞植物、及び針葉樹。
【0438】
使用可能な野菜類として、下記が挙げられる:トマト(トマト(Lycopersicon esculentum))、レタス(例えば、レタス(Lactuca sativa))、サヤマメ(インゲンマメ(Phaseolus vulgaris))、ライマメ(ライマメ(Phaseolus limensis))、エンドウマメ(レンリソウ属(Lathyrus)種)、並びにキュウリ(キュウリ(C.sativus))、カンタロープ(C.カンタルペンシス(C.cantalupensis))及びマスクメロン(C.メロ(C.melo))等のキュウリ属(Cucumis)のメンバー。観賞植物として、下記が挙げられる:アザレア(ツツジ属(Rhododendron)種)、アジサイ(アジサイ(Macrophylla hydrangea)、ハイビスカス(ブッソウゲ(Hibiscus rosasanensis))、バラ(バラ属(Rosa)種)、チューリップ(チューリップ属(Tulipa)種)、ラッパズイセン(スイセン属(Narcissus)種)、ペチュニア(ツクバネアサガオ(Petunia hybrida))、カーネーション(カーネーション(Dianthus caryophyllus))、ポインセチア(ポインセチア(Euphorbia pulcherrima))、及びキク。
【0439】
使用可能な針葉樹として、下記が挙げられる:マツ、例えば、テーダマツ(ピヌス・タエダ(Pinus taeda))、スラッシュパイン(ピヌス・エリオッティ(Pinus elliotii))、ポンデローサマツ(ピヌス・ポンデローサ(Pinus ponderosa))、ロッジポールパイン(ピヌス・コントルタ(Pinus contorta))、及びモントレーマツ(ピヌス・ラジアータ(Pinus radiata));ダグラスモミ(シュードツガ・メンジエシイ(Pseudotsuga menziesii));アメリカツガ(ツガ・カナデンシス(Tsuga canadensis));ベイトウヒ(ピケア・グラウカ(Picea glauca));アメリカスギ(セコイアセンペルビレンズ(Sequoia sempervirens));トドマツ、例えば、ヨーロッパモミ(アビエス・アマビリス(Abies amabilis))及びバルサムモミ(アビエス・バルサメア(Abies balsamea));並びにヒマラヤスギ、例えば、ベイスギ(ツヤ・プリカータ(Thuja plicata))及びアラスカイエローシーダー(カマエキパリス・ノットカテンシス(Chamaecyparis nootkatensis))。
【0440】
本開示のある特定の実施形態では、稔性植物は、生存可能な雄性及び雌性配偶子を生み出す植物であり、自家稔性植物である。そのような自家稔性植物は、他の植物の配偶子及びこれに含まれる遺伝的材料の貢献によらずに子孫植物を作り得る。本開示の他の実施形態は、植物が生存可能な又はそうでなければ受精可能な雄性配偶子若しくは雌性配偶子又は両方を作らないことから、自家稔性でない植物の使用を伴い得る。
【0441】
本開示は、1種又は複数種の導入された形質又は編集されたゲノムを含む植物の育種での使用を見出す。
【0442】
2種の形質を、例えば互いから5cMの遺伝距離でゲノムにどのようにして積み重ね得るかの非限定的な例は、下記のように説明される:ゲノムウインドウ内の第1のDSB標的部位に組み込まれた第1のトランスジェニック標的部位を含み、且つ第1の目的のゲノム遺伝子座を有していない第1の植物を、ゲノムウインドウ内の異なるゲノム挿入部位で目的のゲノム遺伝子座を含む第2のトランスジェニック植物に交配させ、第2の植物は、第1のトランスジェニック標的部位を含まない。この交配からの植物子孫の約5%は、第1のDSB標的部位に組み込まれた第1のトランスジェニック標的部位、及びゲノムウインドウ内の異なるゲノム挿入部位に組み込まれた第1の目的のゲノム遺伝子座の両方を有する。規定されたゲノムウインドウ内に両方の部位を有する子孫植物を、第2のDSB標的部位に組み込まれた第2のトランスジェニック標的部位及び/又は規定されたゲノムウインドウ内に第2の目的のゲノム遺伝子座を含み、且つ第1のトランスジェニック標的部位及び第1の目的のゲノム遺伝子座を欠いている第3のトランスジェニック植物とさらに交配させ得る。この後、第1のトランスジェニック標的部位、第1の目的のゲノム遺伝子座、及びゲノムウインドウ内の異なるゲノム挿入部位に組み込まれた第2の目的のゲノム遺伝子座を有する子孫を選択する。そのような方法を使用して、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、19、20、21、22、23、24、25、26、27、28、29、30、31個、又はより多い、DSB対象部位に組み込まれたトランスジェニック標的部位、及び/又はゲノムウインドウ内の異なる部位に組み込まれた目的のゲノム遺伝子座を有する複合形質遺伝子座を含むトランスジェニック植物を作り得る。このようにして、様々な複合形質遺伝子座を生成し得る。
【0443】
細胞及び動物
本開示のポリヌクレオチド及びポリペプチドは、動物細胞に導入し得る。動物細胞として下記が挙げられるが、これらに限定されない:脊索動物、節足動物、軟体動物、環形動物、刺胞動物、若しくは棘皮動物を含む門の生物;又は哺乳動物、昆虫、鳥類、両生類、爬虫類、若しくは魚類を含む綱の生物。一部の態様では、動物は、ヒト、マウス、C.エレガンス(C.elegans)、ラット、ショウジョウバエ(ショウジョウバエ属(Drosophila)種)、ゼブラフィッシュ、ニワトリ、イヌ、ネコ、モルモット、ハムスター、ニワトリ、ミナミメダカ、ウミヤツメ、フグ、アマガエル(例えば、ゼノパス属(Xenopus)種)、サル、又はチンパンジーである。企図される特定の細胞種として、下記が挙げられる:単数体細胞、二倍体細胞、生殖細胞、ニューロン、筋肉細胞、内分泌又は外分泌細胞、上皮細胞、筋肉細胞、腫瘍細胞、胚細胞、造血細胞、骨細胞、生殖細胞、体細胞、幹細胞、多能性幹細胞、誘導多能性幹細胞、前駆細胞、減数分裂細胞、及び有糸分裂細胞。一部の態様では、生物由来の複数の細胞が使用され得る。
【0444】
開示されている新規の操作されたCasポリペプチドを使用して、動物細胞のゲノムを種々の方法で編集し得る。一態様では、1つ又は複数のヌクレオチドを欠失させることが所望され得る。別の態様では、1つ又は複数のヌクレオチドを挿入することが所望され得る。一態様では、1つ又は複数のヌクレオチドを置換させることが所望され得る。別の態様では、別の原子又は分子との共有結合的な又は非共有結合的な相互作用によって1つ又は複数のヌクレオチドを改変することが所望され得る。
【0445】
開示されている操作されたCasポリペプチドによるゲノム改変を使用して、標的生物の遺伝子型及び/又は表現型の変化をもたらし得る。そのような変化は、好ましくは、目的の表現型若しくは生理学的に重要な特性の改善、内因性欠陥の是正、又はいくつかの型の発現マーカーの発現に関連する。一部の態様では、目的の表現型又は生理学的に重要な特性は、動物の全体的な健康、適応性、若しくは生殖能、動物の生態学的適応性、又はその環境におけるこの動物と他の生物との関係若しくは相互作用に関連している。一部の態様では、目的の表現型又は生理学的に重要な特性は、下記からなる群から選択される:健康全般の改善、疾患の好転、疾患の改善、疾患の安定化、疾患の予防、寄生虫感染症の処置、ウイルス感染症の処置、レトロウイルス感染症の処置、細菌感染症の処置、神経障害の処置(例えば、限定されないが、多発性硬化症)、内因性遺伝子欠陥の是正(例えば、限定されないが、代謝性障害、軟骨形成不全症、アルファ-1アンチトリプシン欠乏症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎、バース症候群、乳癌、シャルコー・マリー・トゥース病、大腸癌、ネコなき症候群、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、前立腺癌、網膜色素変性症、重症複合免疫不全症(SCID)、鎌状赤血球症、皮膚癌、脊髄性筋萎縮症、テイ=サックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、及びウィルソン病)、先天性免疫障害の処置(例えば、限定されないが、免疫グロブリンサブクラス欠損症)、後天性免疫障害の処置(例えば、限定されないが、AIDS及び他のHIV関連障害)、癌の処置、並びに他の方法による効果的な治療選択肢のない、希少な又は「オーファン」病態を含む疾患の処置。
【0446】
本明細書で開示されている組成物又は方法を使用して遺伝子改変されている細胞を、遺伝子治療等の目的のために、例えば、疾患を処置するために、又は抗ウイルス、抗病原体、若しくは抗癌治療剤として、農業において遺伝子改変された生物の生産のために、又は生物学的研究のために、対象に移植し得る。
【0447】
インビトロでのポリヌクレオチドの検出、結合、及び改変
本明細書に開示されている組成物を、単離されたポリヌクレオチド配列を伴う一部の態様では、インビトロ方法において使用するための組成物としてさらに使用し得る。前記単離されたポリヌクレオチド配列は、改変のための1つ又は複数の標的配列を含み得る。一部の態様では、前記単離されたポリヌクレオチド配列は、ゲノムDNA、PCR産物、又は合成されたオリゴヌクレオチドであり得る。
【0448】
組成物
標的配列の改変は、ヌクレオチド挿入、ヌクレオチド欠失、ヌクレオチド置換、既存のヌクレオチドへの原子分子の付加、ヌクレオチド改変、又は前記標的配列への異種ポリヌクレオチド若しくはポリペプチドの結合の形態であり得る。1つ又は複数のヌクレオチドの挿入は、反応混合物中にドナーポリヌクレオチドを含めることによって達成され得、前記ドナーポリヌクレオチドは、本明細書で開示されている操作されたCasエンドヌクレアーゼによって生成される二本鎖切断部分に挿入される。この挿入は、非相同末端結合又は相同組換えによって行われ得る。
【0449】
一態様では、標的ポリヌクレオチドの配列は、改変前に既知であり、操作されたCasエンドヌクレアーゼによる処理から得られるポリヌクレオチドの配列と比較される。一態様では、標的ポリヌクレオチドの配列は、改変前は未知であり、操作されたCasエンドヌクレアーゼによる処理は、前記標的ポリヌクレオチドの配列を決定するための方法の一部として使用される。
【0450】
操作されたCasポリペプチドによるポリヌクレオチド改変は、Cas遺伝子座から同定された完全長ポリペプチドの使用により達成され得るか、又はCas遺伝子座から同定されたポリペプチドの断片、改変、若しくはバリアントから達成され得る。一部の態様では、前記操作されたCasポリペプチドは、表1に列挙されている生物から得られるか、又は誘導される。一部の態様では、前記Casポリペプチドバリアントは、配列番号23~26、31~44、80~85、90~142、197、及び331~333の内のいずれかと少なくとも80%の同一性を共有するポリペプチドである。一部の態様では、前記Casポリペプチドバリアントは、配列番号23~26、31~44、80~85、90~142、197、及び331~333の内のいずれかの機能的バリアントである。一部の態様では、前記Casポリペプチドバリアントは、配列番号23~26、31~44、80~85、90~142、197、及び331~333の内のいずれかの機能的断片である。一部の態様では、前記Casポリペプチドバリアントは、配列番号23~26、31~44、80~85、90~142、197、及び331~333からなる群から選択されるポリヌクレオチドによりコードされるCasポリペプチドである。一部の態様では、前記Casポリペプチドは、N(T>W>C)TTCのPAM配列を認識するCasエンドヌクレアーゼポリペプチドである。一部の態様では、Casポリペプチドバリアントは、Casポリペプチドポリヌクレオチドとして提供される。一部の態様では、前記ポリヌクレオチドは、配列番号23~26、31~44、80~85、90~142、197、及び331~333、又は23~26、31~44、80~85、90~142、197、及び331~333の内のいずれか1つと少なくとも80%、85%、90%、95%、97%、99%、若しくは100%を共有する配列からなる群から選択されるCasポリペプチドをコードする。
【0451】
一部の態様では、操作されたCasポリペプチドは、操作されたか又は改変された野生型Casエンドヌクレアーゼオルソログ、機能的Casエンドヌクレアーゼオルソログバリアント、機能的な操作されたCasポリペプチド断片、活性の又は不活化された操作されたCasポリペプチドバリアントを含む融合タンパク質、C末端若しくはN末端又はN末端及びC末端の両方で1つ又は複数の核局在化配列(NLS)をさらに含む操作されたCasポリペプチド、ビオチン化された操作されたCasポリペプチド、操作されたCasエンドヌクレアーゼニッカーゼ、操作されたCasポリペプチドオルソログエンドヌクレアーゼ、ヒスチジンタグをさらに含む操作されたCasポリペプチド、並びにこれらの任意の2つ以上の混合物
からなる群から選択され得る。
【0452】
一部の態様では、操作されたCasポリペプチドは、ヌクレアーゼドメイン、転写アクチベータードメイン、転写リプレッサードメイン、エピジェネティック改変ドメイン、開裂ドメイン、核局在化シグナル、細胞透過ドメイン、転座ドメイン、マーカー、又は標的ポリヌクレオチド配列又は前記標的ポリヌクレオチド配列が得られるか若しくは誘導される細胞に対して異種である導入遺伝子をさらに含む融合タンパク質である。
【0453】
一部の態様では、複数の操作されたCasポリペプチドが所望され得る。一部の態様では、前記複数の操作されたCasポリペプチドは、異なる生物源に由来するか又は同じ生物内の異なる遺伝子座に由来する操作されたCasポリペプチドを含み得る。一部の態様では、前記複数の操作されたCasポリペプチドは、標的ポリヌクレオチドに対し異なる結合特異性を有する操作されたCasポリペプチドを含み得る。一部の態様では、前記複数の操作されたCasポリペプチドは、異なる開裂効率を有する操作されたCasエンドヌクレアーゼを含み得る。一部の態様では、前記複数の操作されたCasポリペプチドは、異なるPAM特異性を有する操作されたCasポリペプチドを含み得る。一部の態様では、前記複数の操作されたCasポリペプチドは、分子組成が異なる操作されたCasポリペプチド(即ち、操作されたCasポリペプチドをコードするポリヌクレオチド、及び操作されたCasポリペプチドであるポリペプチド)を含み得る。
【0454】
ガイドポリヌクレオチドは、単一ガイドRNA(sgRNA)、tracrRNAを含むキメラ分子、crRNAを含むキメラ分子、キメラRNA-DNA分子、DNA分子、又は1つ若しくは複数の化学的改変ヌクレオチドを含むポリヌクレオチドとして提供され得る。
【0455】
操作されたCasポリペプチド及び/又はガイドポリヌクレオチドの貯蔵条件は、温度、物質の状態、及び時間に関するパラメータを含む。一部の態様では、Casポリペプチド及び/又はガイドポリヌクレオチドは、約-80℃、約-20℃、約4℃、約20~25℃、又は約37℃で保存される。一部の態様では、Casポリペプチド及び/又はガイドポリヌクレオチドは、液体、凍結液体、又は凍結乾燥粉末として保存される。一部の態様では、Casポリペプチド及び/又はガイドポリヌクレオチドは、少なくとも1日間、少なくとも1週間、少なくとも1ヶ月間、少なくとも1年間、又は1年超にわたって安定である。
【0456】
反応の可能なポリヌクレオチド成分(例えば、ガイドポリヌクレオチド、ドナーポリヌクレオチド、任意選択的なCasポリペプチドポリヌクレオチド)のいずれか又は全ては、ベクター、コンストラクト、線状化若しくは環状化プラスミドの一部として提供され得るか、又はキメラ分子の一部として提供され得る。各成分は、別々に又は一緒に反応混合物に供給され得る。一部の態様では、1種又は複数種のポリヌクレオチド成分は、その発現を調節する異種の非コード調節エレメントに作動可能に連結されている。
【0457】
標的ポリヌクレオチドの改変のための方法は、最小要素を組み合わせて、操作されたCasポリペプチド(又は上記で説明されているバリアント、断片、若しくは他の関連分子)、標的ポリヌクレオチドの標的ポリヌクレオチド配列に実質的に相補的であるか又は選択的にハイブリダイズする配列を含むガイドポリヌクレオチド、及び改変のための標的ポリヌクレオチドを含む反応混合物にすることを含む。一部の態様では、操作されたCasポリペプチドは、ポリペプチドとして提供される。一部の態様では、操作されたCasポリペプチドは、Casポリペプチドポリヌクレオチドとして提供される。一部の態様では、ガイドポリヌクレオチドは、RNA分子、DNA分子、RNA:DNAハイブリッド、又は化学的改変ヌクレオチドを含むポリヌクレオチド分子として提供される。
【0458】
成分のいずれか1つの貯蔵緩衝液、又は反応混合物は、安定性、有効性、又は他のパラメータについて最適化され得る。貯蔵緩衝液又は反応混合物のさらなる成分は、緩衝組成物、Tris、EDTA、ジチオスレイトール(DTT)、リン酸緩衝生理食塩水(PBS)、塩化ナトリウム、塩化マグネシウム、HEPES、グリセロール、BSA、塩、乳化剤、洗剤、キレート剤、レドックス剤、抗体、ヌクレアーゼ非含有水、プロテイナーゼ、及び/又は粘性剤を含み得る。一部の態様では、貯蔵緩衝液又は反応混合物は、下記の成分の少なくとも1つを含む緩衝液をさらに含む:HEPES、MgCl2、NaCl、EDTA、プロテイナーゼ、プロテイナーゼK、グリセロール、ヌクレアーゼ非含有水。
【0459】
インキュベーション条件は、所望の結果に従って変化する。温度は、好ましくは、少なくとも10℃、10~15℃、少なくとも15℃、15~17℃、少なくとも17℃、17~20℃、少なくとも20℃、20~22℃、少なくとも22℃、22~25℃、少なくとも25℃、25~27℃、少なくとも27℃、27~30℃、少なくとも30℃、30~32℃、少なくとも32℃、32~35℃、少なくとも35℃、少なくとも36℃、少なくとも37℃、少なくとも38℃、少なくとも39℃、少なくとも40℃、又は40℃超である。インキュベーション時間は、少なくとも1分、少なくとも2分、少なくとも3分、少なくとも4分、少なくとも5分、少なくとも6分、少なくとも7分、少なくとも8分、少なくとも9分、少なくとも10分、又は10分超である。
【0460】
インキュベーション前、インキュベーション中、又はインキュベーション後の反応混合物中のポリヌクレオチドの配列を、当該技術分野で既知の任意の方法によって決定し得る。一態様では、標的ポリヌクレオチドの改変を、Casエンドヌクレアーゼオルソログと組み合わせる前に、反応混合物から精製されたポリヌクレオチドの配列を標的ポリヌクレオチドの配列と比較することによって確認し得る。
【0461】
インビトロ又はインビボでのポリヌクレオチドの検出、結合、及び/又は改変に有用な、本明細書で開示されている組成物のいずれか1つ又は複数が、キット内に含まれ得る。キットは、Casエンドヌクレアーゼオルソログ又はそのようなものをコードするポリヌクレオチドCasエンドヌクレアーゼオルソログを含み、任意選択的に、効率的な貯蔵を可能にする緩衝液成分、及び前記Casエンドヌクレアーゼオルソログ、又はCasエンドヌクレアーゼオルソログの異種ポリヌクレオチドへの導入を可能にする1種又は複数種のさらなる組成物をさらに含み、ここで、前記Casエンドヌクレアーゼオルソログ又はCasエンドヌクレアーゼオルソログは、前記異種ポリヌクレオチドの少なくとも1つのヌクレオチドの改変、付加、欠失、又は置換をもたらし得る。さらなる態様では、本明細書で開示されているCasエンドヌクレアーゼオルソログは、混合プールからの1種又は複数種のポリヌクレオチド標的配列の富化のために使用され得る。さらなる態様では、本明細書で開示されているCasエンドヌクレアーゼオルソログは、インビトロでの標的ポリヌクレオチドの検出、結合、及び/又は改変での使用のために、マトリックス上に固定化され得る。
【0462】
Casエンドヌクレアーゼは、貯蔵、精製、及び/又は特性評価の目的のために、固体マトリックスに付着され得るか、会合し得るか、又は添付され得る。固体マトリックスの例として下記が挙げられるが、これらに限定されない:フィルタ、クロマトグラフィー樹脂、アッセイプレート、試験管、極低温バイアル等。Casエンドヌクレアーゼは、実質的に精製され、適切な緩衝溶液中に保存されるか又は凍結乾燥され得る。
【0463】
検出方法
標的ポリヌクレオチドに結合した操作されたCasポリペプチド:ガイドポリヌクレオチド複合体を検出する方法として、当該技術分野において知られる任意の方法が挙げられ得、例えば、限定されないが、顕微鏡法、クロマトグラフィー分離、電気泳動、免疫沈降、ろ過、ナノポア分離、マイクロアレイ、及び下記で説明するものが挙げられ得る。
【0464】
DNA電気泳動移動度シフトアッセイ(EMSA)は、既知のDNAオリゴヌクレオチドプローブに結合するタンパク質を調べ、相互作用の特異性を評価する。この技術は、ポリアクリルアミド又はアガロースゲルの電気泳動に供された場合にはタンパク質-DNA複合体が遊離DNA分子よりもゆっくりと移動するという原理に基づいている。DNAの移動速度は、タンパク質に結合すると遅くなるため、このアッセイはまた、ゲル遅延度アッセイとも呼ばれる。タンパク質特異的抗体を結合成分に添加すると、電気泳動中にさらにゆっくりと移動するより大きい複合体(抗体-タンパク質-DNA)が生成され、これは、スーパーシフトとして既知であり、タンパク質の同一性を確認するために使用され得る。
【0465】
DNAプルダウンアッセイは、ビオチン等の高親和性タグで標識されたDNAプローブを使用し、このタグにより、このプローブの回収又は固定化が可能となる。DNAプローブは、EMSAで使用されるものと同様の反応で、細胞ライセートからのタンパク質と複合体化され得、次いで、アガロース又は磁気ビーズを使用して複合体を精製するために使用され得る。その後、タンパク質をDNAから溶出し、ウェスタンブロットによって検出するか、又は質量分析によって同定する。或いは、タンパク質を親和性タグで標識し得るか、又はDNA-タンパク質複合体を、目的のタンパク質に対する抗体を使用して単離し得る(スーパーシフトアッセイと同様)。この場合、タンパク質に結合した未知のDNA配列を、サザンブロット法やPCR分析により検出する。
【0466】
レポーターアッセイは、目的のプロモーターの翻訳活性のインビボリアルタイム読み出しを提供する。レポーター遺伝子は、標的プロモーターDNA配列と、研究者によってカスタマイズされたレポーター遺伝子DNA配列との融合体であり、DNA配列は、ホタル/ウミシイタケルシフェラーゼ又はアルカリホスファターゼのような検出可能な特性を有するタンパク質をコードする。これらの遺伝子は、目的のプロモーターが活性化されたときにのみ酵素を産生する。酵素は次に、基質を触媒して、分光器によって検出され得る光又は色の変化をもたらす。レポーター遺伝子からのシグナルは、同じプロモーターから駆動される内在性タンパク質の翻訳の間接的決定因子として使用される。
【0467】
マイクロプレート捕捉・検出アッセイは、固定化されたDNAプローブを使用して、特異的なタンパク質-DNA相互作用を捕捉し、標的特異的抗体とのタンパク質同一性及び相対量を確認する。一般的には、DNAプローブは、ストレプトアビジンでコーティングされた96ウェル又は384ウェルマイクロプレートの表面に固定化される。細胞抽出物を調製し、添加して、結合タンパク質をオリゴヌクレオチドに結合させる。次に、抽出物を除去し、各ウェルを数回洗浄して、非特異的に結合したタンパク質を除去する。最後に、検出のために標識された特異的抗体を使用して、タンパク質を検出する。この方法は極めて高感度であり得、1ウェル当たり0.2pg未満の標的タンパク質が検出される。この方法はまた、アミン反応性表面化学でコーティングされたマイクロプレート上に固定化され得る第一級アミン等の他のタグで標識されたオリゴヌクレオチドにも利用され得る。
【0468】
DNAフットプリント法は、生細胞内でも、タンパク質-DNA複合体中の個々のヌクレオチドについての詳細な情報を得るために最も広く使用されている方法の1つである。そのような実験では、化学物質又は酵素がDNA分子を改変するか又は消化するために使用される。配列特異的タンパク質がDNAに結合する場合には、これらは結合部位を改変又は消化から保護し得る。これは、その後、変性ゲル電気泳動によって可視化され得、保護されていないDNAはおおよそランダムに開裂される。従って、それは、バンドの「ラダー」として現れ、タンパク質によって保護された部位は、対応するバンドがなく、バンドのパターンにおいて足跡のように見える。従って、この足跡により、タンパク質-DNA結合部位における特定のヌクレオシドが確認される。
【0469】
顕微鏡技術には、光学顕微鏡、蛍光顕微鏡、電子顕微鏡、及び原子間力顕微鏡(AFM)が含まれる。
【0470】
クロマチン免疫沈降分析(ChIP)は、タンパク質をこのDNA標的に共有結合させ、その後、これらに結合を解き、別々に特徴付ける。
【0471】
試験管内進化法(SELEX)は、標的タンパク質をオリゴヌクレオチドのランダムライブラリーに曝露する。結合するこれらの遺伝子は、分離され、PCRによって増幅される。
【0472】
本発明は、特に、好ましい実施形態及び様々な代替実施形態を参照して示されおり且つ説明されてきたが、関連する技術分野の当業者であれば、本発明の趣旨及び範囲から逸脱することなく、形態及び詳細における様々な変更がその中でなされ得ることを理解するであろう。例えば、下記の特定の実施例は、特定の標的部位又は標的生物を使用して、本明細書で説明されている方法及び実施形態を例示し得るが、これらの実施例における原理は、任意の標的部位又は標的生物に適用され得る。従って、本発明の範囲は、下記で例示される具体例ではなく、本明細書で列挙されている本発明の実施形態に包含されることが理解されるであろう。本出願において参照される全ての引用された特許、出願、及び刊行物は、あらゆる目的のために、それぞれが個々に且つ具体的に参照により組み込まれたのと同程度に、その全体が参照により本明細書に組み込まれる。
【実施例】
【0473】
下記は、本発明のいくつかの態様の特定の実施形態の例である。実施例は、説明の目的のためにのみ提供されるものであり、決して本発明の範囲を限定することを意図するものではない。使用される数値(例えば、量、温度等)に関して正確さを確実にする努力がなされているが、当然のことながら、多少の実験誤差及び偏差が許容されるべきである。
【0474】
実施例1:サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)DNA発現カセット
この実施例では、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)細胞で使用するためのCas-アルファエンドヌクレアーゼ及びガイドRNA発現カセットを生成する方法が説明されている。
【0475】
一方法では、S.セレビシエ(S.cerevisiae)中で効率的な発現させるために、Cas-アルファエンドヌクレアーゼをコードする遺伝子を、当該技術分野で既知の標準的な方法により酵母コドン最適化させた。この最適化されたCas-アルファエンドヌクレアーゼタンパク質の核局在化を容易にするために、シミアンウイルス40(Simian virus 40)(SV40)単節型核局在化シグナル(NLS)((PKKKRKV配列番号22))をコードするヌクレオチド配列を、5’末端又は3’末端のいずれかに任意選択的に付加した。次いで、最適化されたcas-アルファエンドヌクレアーゼ遺伝子及びNLSバリアントのヌクレオチド配列を合成し、ROX3プロモーターとCYC1ターミネーターとの間の2ミクロン酵母プラスミドDNA(GenScript)に作動可能にクローニングした。酵母最適化Cas-アルファヌクレアーゼ発現カセットの一例、及び本明細書で説明されている配列への言及を、
図1に見出し得る。
【0476】
Cas-アルファエンドヌクレアーゼは、5’プロトスペーサー隣接モチーフ(PAM)の存在下で二本鎖DNAを開裂するように、小型RNA(本明細書ではガイドRNAと称される)により誘導される(Karvelis et al.(2020),Nucleic Acids Research.48,5016-5023、及び米国特許出願公開第20200190494A1号明細書)。このガイドRNAは、Cas-アルファによる認識を補助する配列(Cas-アルファ認識ドメインと称される)、及びDNA標的部位の1本の鎖と塩基対合することによってCas-アルファ開裂を誘導する働きをする配列(Cas-アルファ可変ターゲティングドメイン)を含む。S.セレビシエ(S.cerevisiae)細胞中でCas-アルファエンドヌクレアーゼ開裂活性を誘導するのに必要な小型RNAを転写するために、ハンマーヘッド(例えば、Cas-アルファガイドRNAの最初に対して相補性を有する6bpの5’配列(例えば、Cas-アルファ10の場合にはGTAAAT)及びデルタ型肝炎ウイルスリボザイムをコードするDNA配列を、最初に、酵母ade2遺伝子を標的とし得る可変ターゲティングドメインを有するCas-アルファ単一ガイドRNA(sgRNA)をコードするDAN配列の5’末端及び3’末端それぞれに付加した。次に、リボザイム及びCas-アルファをコードするsgRNAの末端に、SNR52プロモーター及びSUP4ターミネーターを作動可能に連結させた。次いで、DNA断片を合成し、cas-アルファ遺伝子を含むS.セレビシエ(S.cerevisiae)2ミクロンベクター(GenScript)にクローニングした。酵母最適化Cas-アルファガイドRNA発現カセットの一例、及び本明細書で説明されている配列への言及を、
図1に見出し得る。
【0477】
陰性コントロールとして使用するために、ヌクレアーゼ不活性化又は死滅(d)Cas-アルファ酵母発現コンストラクトも生成した。ここで、DNAホスホジエステル骨格開裂の調整に関与するRuvCヌクレアーゼドメイン内の3つのアミノ酸(Cas-アルファ10の場合には、D228、E327、及びD434)を、アラニン残基で置換した(
図2及び3)。このことを、部位特異的変異誘発(GenScript)を使用して酵母最適化cas-アルファ遺伝子内のコドンを変更することにより達成した。ade2ガイドRNA発現カセットも含む酵母最適化dCas-アルファ発現コンストラクトの一例を、
図1に示す。
【0478】
実施例2:サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)の形質転換
この実施例では、Cas-アルファエンドヌクレアーゼ及びガイドRNA発現カセットをサッカロマイセス・セレビシエ(Saccharomyces cerevisiae)細胞に形質転換する方法が説明されている。
【0479】
S.セレビシエ(S.cerevisiae)を形質転換するために、いくつかの方法(酢酸リチウム、ポリエチレングリコール(PEG)、熱ショック、エレクトロポレーション、バイオリスティック等)を使用し得る(Kawai et al.(2010)Bioengineered Bugs.1:395-403)。ここで、Frozen-EZ yeast Transformation IIキット(Zymo Research)を使用して、リチウムカチオンベースの方法に類似するアプローチを使用した。製造者の説明に従って、S.セレビシエ(S.cerevisiae)コンピテント細胞を産生した。このことを、S.セレビシエ(S.cerevisiae)(BY4742)(Baker et al.(1998)Yeast.14:115-132)(ATCC))を、酵母抽出物-ペプトン-デキストロース(YPD)ブロス(Gibco)中で、0.8~1.0のOD600nmに相当する対数増殖期の中期まで増殖させることにより達成した。次に、この細胞を、遠心分離(500×g、4分間)によってペレット化し、培地をデカントし、ペレットを、EZ 1溶液 10mlで穏やかに洗浄し、再び細胞を遠心分離で沈降させ、その後、洗浄液を除去した。次いで、この細胞を、EZ 2溶液 1mlに再懸濁させ、等分し、-70℃で保存したか、又は次の工程で使用した。次に、2ミクロン酵母プラスミドDNA 0.5~1μg(5μl未満中)をコンピテント細胞 50μlに添加することにより、形質転換を実施した。任意選択的に、予想されるCas-アルファ二本鎖切断部位に隣接する、相同性を有する二本鎖DNA修復鋳型もまた、含めた(50μMで0.5μl)。DNA中で穏やかに混合した後、EZ 3溶液 500μlを添加した。次に、細胞を、60~90分にわたり30℃でインキュベートし、このインキュベーションの間に、細胞を3~4回フリッキング又はボルテックスした。形質転換後、細胞を、約3時間にわたりYPDブロス中で増殖させ、ペレット化し、滅菌水1mlで1回洗浄し、滅菌水1mlに再懸濁させ、次いで約200μlを、選択培地(例えば、限定されないが、6.7g/Lの、アミノ酸を含まない酵母窒素ベース(Becton Dickinson)、20g/Lのグルコース(Phytotechnology Labs)、1.92g/Lの酵母ヒスチジンドロップアウト培地(MP Biomedicals)、及び20g/LのBacto Agar(Becton Dickinson)))上に蒔いた。活性に最適な培養条件を決定するために、細胞を、コロニーが形成されるまで30℃でインキュベートしたか、又は一晩ある温度範囲(典型的には37℃及び45℃)でインキュベートし、次いで、コロニーの増殖が見えるまで30℃で戻した。
【0480】
実施例3:細胞DNA標的開裂の改善のための選択
この実施例では、二本鎖DNA標的開裂が改善されたCas-アルファエンドヌクレアーゼ又はガイドRNAバリアントを選択する方法が説明されている。
【0481】
一方法では、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)中のade2遺伝子(BY4742,遺伝子型-MATαhis3Δ1 leu2Δ0 lys2Δ0 ura3Δ0)を、Cas-アルファエンドヌクレアーゼ標的開裂の標的とした(
図4A)。ここで、非機能性ade2遺伝子が形成される標的開裂及び細胞修復により、アデニン栄養要求性、及び白色から赤色(ピンク色)の細胞表現型への切り替え生じる(Ugolini et al.(1996)Curr.Genet.30:485-492、及び米国特許出願公開第20200190494A1号明細書)。この色の変化を使用して、標的化DSB活性が改善されたCasヌクレアーゼバリアント及び/又は関連するガイドRNA(gRNA)を発現する細胞を選択した(
図4B)。コロニーと見なされた場合に、且つade2遺伝子がどれだけ早く破壊されたかに応じて、赤色の着色は、完全に赤色(
図4B、画像2)から、他は白色コロニー内の小さい赤色セクターの観察までの様々であった(
図4B、画像3及び4)。この表現型パターンも使用して、バリアント間の活性の差違も定量した(
図4B)。完全な赤色と採点されたコロニー、いくつかのセクターを含むもの、又は1つだけ赤色セクターを含むものを計数し、存在するコロニーの総数で除算した。一部の例では、コロニーの計数の代わりに、酵母コロニーの画像を、Nikon Digital Sight Ds-Fi1カメラ(株式会社ニコン,日本)及びNIS-Elements BRソフトウェア(バージョン4.00.07)(株式会社ニコン,日本)で撮影し、総酵母領域を(ピクセルとして)最初に決定し、次いで、カスタムスクリプトを使用して、赤色の総割合を算出することにより分析した。
【0482】
改善されたCasバリアントを同定すると、ヒスチジンを含まない酵母ブロス 5ml(例えば、限定されないが、6.7g/Lの、アミノ酸を含まない酵母窒素ベース(Becton Dickinson)、20g/Lのグルコース(Phytotechnology Labs)、及び1.92g/Lの酵母ヒスチジンドロップアウト培地(MP Biomedicals))に移し、振盪しつつ30℃で一晩インキュベートした。次いで、Yeast Plasmid Miniprep 96キット(Zymo Research)を使用して、バリアントをコードする2ミクロンプラスミドを単離した。精製後、プラスミドを、製造業者の指示に従ってTransforMax EPI300(Lucigen)大腸菌(E.coli)コンピテント細胞に形質転換させ、選択培地(例えば、限定されないが、6.7g/Lの、アミノ酸を含まない酵母窒素ベース(Becton Dickinson)、20g/Lのグルコース(Phytotechnology Labs)、1.92g/Lの酵母ヒスチジンドロップアウト培地(MP Biomedicals)、及び20g/LのBacto Agar(Becton Dickinson))上に蒔いた。複数の2ミクロンベクターを単一の酵母細胞中で維持し得ることから、各大腸菌(E.coli)形質転換から6つのコロニーを選択し、それぞれを使用して、2X YT培地(Sigma-Aldrich)又はカルベニシリンを含む同等のもの 2mlに接種した。培養物を、振盪しつつ37℃で一晩増殖させ、次いで、培養物の半分を、cas-アルファ遺伝子に直接隣接するか又はこの遺伝子内の領域に特異的なプライマーを使用するローリングサークル増幅及びサンガー配列決定(Eurofins Scientific)に供した。配列決定後、Qiagen Spin Miniprep Kit(Qiagen)を使用して、様々なバリアントを含むことが分かっている大腸菌(E.coli)培養物(残り半分)から、プラスミドDNAを単離した。最後に、各プラスミド 約1μgを、S.セレビシエ(S.cerevisiae)に再形質転換させ、赤色の細胞表現型に関して評価して改善を確認した。改善されたバリアント、及び元(野生型)のCas-アルファエンドヌクレアーゼとの比較を行なうために、典型的には、全てのプラスミドでさらなる酵母形質転換を実施し、ade2標的部位を認識して開裂する能力を比較した。ヌクレアーゼ活性が存在しない赤色コロニーの形成割合を測定するために、ヌクレアーゼ不活化又は死滅(d)Cas-アルファ発現プラスミド(実施例1を参照されたい)を、陰性コントロールとして使用した。
【0483】
実施例4:ライブラリーの設計及び生成
この実施例では、二本鎖DNA標的開裂を改善するためにCasエンドヌクレアーゼバリアントを設計して生成する方法が説明されている。
【0484】
一方法では、Cas-アルファエンドヌクレアーゼ(例えば、限定されないが、Cas-アルファ10(配列番号2))の各位置(既にグリシンを含む位置を除く)にグリシンアミノ酸を導入した(グリシンスキャンとも呼ばれる)。第2の方法では、Cas-アルファジンクフィンガードメインを包含する領域(例えば、限定されないが、Cas-アルファ10のアミノ酸372~428及び456~497位(
図2))の各位置に全ての他のアミノ酸(合計19種)を導入して、飽和変異誘発を実施した。第3の方法では、Cas-アルファエンドヌクレアーゼ(例えば、限定されないが、Cas-アルファ10(
図2))の各位置(既にアルギニンを含む位置を除く)でアルギニンアミノ酸置換を行なった(アルギニンスキャンとも呼ばれる)。第4の方法では、タンパク質全体(例えば、限定されないが、Cas-アルファ10(
図2))の各位置で全ての他のアミノ酸(合計19種)を導入して、飽和変異誘発を実施した。第5の方法では、Cas-アルファ認識ドメインを含む、Cas-アルファガイドRNAの部分を、各位置に3種の他の可能なヌクレオチド全てを導入する飽和変異誘発に供した(例えば、限定されないが、配列番号8)。第6の方法では、本明細書で列挙された他のアプローチで同定された有益な変化を、1つ又は複数の有益な変化を既に含むバリアントに(単独で又は組み合わせて)組み込み、これらの複合効果に関してアッセイした。
【0485】
全てのライブラリーアプローチに関して、
図1に示されている酵母発現プラスミド中のcas-アルファヌクレアーゼ遺伝子内のコドン(構成要素B(配列番号2))を、GenPlus遺伝子合成技術(GenScript)を使用して、様々なアミノ酸をコードするように変更した。
【0486】
実施例5:DNA標的開裂が改善されたCasエンドヌクレアーゼバリアント
この実施例では、二本鎖DNA開裂活性が改善されたCasエンドヌクレアーゼが説明されている。実施例4で生成した全てのバリアントを試験した。これらには、各位置でグリシン置換及びアルギニン置換が行なわれたバリアント(既にグリリン又はアルギニンを含んでいたバリアントを除く)、ジンクフィンガードメイン(配列番号20に対して、372~428及び456~497位)に対して並びにタンパク質全長(配列番号20に対して1~497位)わたり全ての可能なアミノ酸置換、並びに有益な改変の組み合わせを含むバリアントが含まれた。アッセイを実行して、所望の活性が改善されているバリアントを捕捉した。
【0487】
2つの異なる位置でのグリシンアミノ酸の置換A40G(配列番号23(
図5))及びE81G(配列番号23(
図6))により、非改変(Wt)Cas-アルファ10(配列番号20(
図2))と比較して、37℃での一晩のインキュベーションで回収された赤色の分泌されたS.セレビシエ(S.cerevisiae)コロニー(スコア4)の数が増加した(
図8A)。45℃処置により、完全に赤色のコロニー(スコア2)の頻度が約2倍改善された(
図8B)。組み合わせた場合には(配列番号25(
図7))、これらの効果は相加的であり、二本鎖DNA開裂活性がさらに大きく増強された。その結果、45℃インキュベーションを使用する場合には、完全に赤色のコロニー(スコア2)の回収が約3倍増強され、37℃処置により、セクター化されたコロニー(スコア4)の回収が10倍を超えて改善された(
図8A及び8B)。最後に、dCas-アルファ10を使用する実験では、赤色のコロニーが得られず(
図9)、このことから、得られた結果がCas-アルファ開裂活性の変化と直接関連していたことが示される。
【0488】
アルギニンスキャン及びジンクフィンガー飽和変異誘発ライブラリー(実施例4を参照されたい)により、Wt Cas-アルファ10タンパク質と比較して二本鎖DNA開裂活性が顕著に増強されるさらなる変更が得られた。これらには、T335R(配列番号31)、C409K(配列番号32)、C409R(配列番号33)、E421N(配列番号34)、E421R(配列番号35)、K467R(配列番号36)、及びE468P(配列番号37)が含まれた。A40G+E81Gと組み合わせて、37℃一晩インキュベーションでアッセイした場合には、T335R、C409K、C409R、及びE421Nは、活性の改善を示したが、E421R、K467R、及びE468Pは、赤色コロニーの回収に劇的な影響を及ぼさない中性であると思われた(
図13)。A40G+E81G(配列番号25)と比較して、A40G+E81G+T335R(配列番号38(
図14))により、スコア3の赤色の酵母コロニーの回収が約10倍増加する最大増強が得られた(
図13)。A40G+E81G+C409K(配列番号39(
図15))、A40G+E81G+C409R(配列番号40(
図16))、及びA40G+E81G+E421N(配列番号41(
図17))は、A40G+E81G(配列番号25)(
図13)と比較した場合に、約6~8倍の改善が得られた。
【0489】
タンパク質全体にわたる飽和変異誘発により、37℃でのWt Cas-アルファ10活性を改善する更なる残基が得られた。これには、F38D(配列番号80)、F38E(配列番号81)、H79D(配列番号82)、及びA87K(配列番号83)が含まれた。先に同定された最良のバリアントであるA40G+E81G+T335R(配列番号38)と個別に組み合わせた場合には、H79D及びA87Kは、37℃での活性をさらに増強し、F38D及びF38Eは、中性効果を有していた。具体的には、A40G+H79D+E81G+T335R(配列番号84)(
図21)及びA40G+E81G+A87K+T335R(配列番号85)(
図22)により、酵母コロニー増殖でade2遺伝子破壊が早期に起こることを示す表現型カテゴリ2及び3に採点されるコロニーの高い割合が得られた(
図23)。A40G+E81G+A87K+T335R(配列番号85)は、活性を最大に増強し、A40G+H79D+E81G+T335R(配列番号84)と比べて、完全に赤色の表現型を有する酵母コロニーが多く得られた(
図23)。F38D(配列番号80)、F38E(配列番号81)、H79D(配列番号82)、及びA87K(配列番号83)を、T335Rとだけ試験した場合には、2つの組み合わせF38E+H79D+A87K+T335R(配列番号90)(
図24)及びF38D+H79D+A87K+T335R(配列番号91)(
図25)は、A40G+E81G+T335Rと比べて優れていることも示され、ade2遺伝子機能性を破壊する能力において、A40G+E81G+A87K+T335Rと同様のスコアを示した(
図23)。
【0490】
飽和変異誘発ライブラリーからの追加のラウンドのスクリーニングから、37℃でのWt Cas-アルファ10活性を増強する9つのさらなるバリアントが生じた。これらは、T190K(配列番号92)、T217H(配列番号93)、L293H(配列番号94)、K298S(配列番号95)、H306F(配列番号96)、V313S(配列番号97)、S338V(配列番号98)、I405N(配列番号99)、及びN430P(配列番号100)であった。コンビナトリアル増強に関して試験するために、2つの先のバリアントA40G+E81G+A87K+T335R(配列番号85)及びF38E+H79D+A87K+T335R(配列番号90)を、親タンパク質として選択した。また、A40G+E81G+A87K+T335R(配列番号85)及びF38E+H79D+A87K+T335R(配列番号90)に関する37℃での活性は飽和に近かったことから、30℃でのインキュベーションを使用して改善を評価した。さらに、より多くのバリアントの比較を可能にするために、カスタム画像解析スクリプトを使用して、赤色に着色された酵母領域の総割合を算出した。A40G+E81G+A87K+T335R(配列番号85)(親1としても既知である)に関して、T190K(配列番号101)、L293H(配列番号103)、K298S(配列番号104)、H306F(配列番号105)、I405N(配列番号108)、及びN430P(配列番号109)と対形成した場合には、30℃での細胞活性は、先のバリアントと比べて著しく増強された(
図26A)。これらの同一のバリアントを、F38E+H79D+A87K+T335R(配列番号90)(親2としても既知である)と組み合わせた場合には、N430P(配列番号118)との対形成により、破壊されたAde2表現型が大幅に増加した(
図26B)。
【0491】
次に、A40G+E81G+A87K+T335R+T190K(配列番号101)及びF38E+H79D+A87K+T335R+T190K(配列番号110)を、T217H、L293H、K298S、H306F、S338V、I405N、及びN430Pと組み合わせて試験した。
図27A及び27Bに示すように、A40G+E81G+A87K+T335R+T190K+T217H(配列番号119)を除いて、ほとんどの組み合わせが相加的であった。さらに、A40G+E81G+A87K+T335R+T190K(配列番号101)との組み合わせにより、概して、F38E+H79D+A87K+T335R+T190K(配列番号110)との同様の組み合わせと比べて高い細胞活性が得られた(
図27A及び27B)。この観察に基づいて、A40G+E81G+A87K+T335R+T190K(配列番号101)を使用して、活性をさらに改善するさらなる組み合わせに関してスクリーニングした。このことから、下記が同定された:A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N+N430P(配列番号133)、A40G+E81G+A87K+T335R+T190K+T217H+L293H+K298S+H306F+I405N(配列番号134)、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N(配列番号135)、A40G+E81G+A87K+T335R+T190K+L293H+K298S+H306F+I405N(配列番号136)、A40G+E81G+A87K+T335R+T190K+K298S+H306F+I405N(配列番号137)、A40G+E81G+A87K+T335R+T190K+T217H+L293H+H306F+I405N(配列番号138)、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+N430P(配列番号139)、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F(配列番号140)、A40G+E81G+A87K+T335R+T190K+H306F+I405N(配列番号141)、及びA40G+E81G+A87K+T335R+T190K+K298S+H306F+N430P(配列番号142)。これらの組み合わせにより、A40G+E81G+A87K+T335R+T190K(配列番号101)と比較して、30℃で活性が3~5倍増加した(
図27A及び28)。
【0492】
A40G+E81G+A87K+T335R+T190K(配列番号101)及びF38E+H79D+A87K+T335R+T190K(配列番号110)の活性を増強する組み合わせを、さらに調べた。このため、親開始タンパク質としてA40G+E81G+A87K+T335R+T190K又はF38E+H79D+A87K+T335R+T190Kのいずれかを使用して、A120P(配列番号331)、Y149E(配列番号332)、T190K(配列番号92)、T217H(配列番号93)、L293H(配列番号94)、K298S(配列番号95)、H306F(配列番号96)、Q325N(配列番号197)、S338V(配列番号98)、I405N(配列番号99)、E421H(配列番号333)、及びN430P(配列番号100)の全ての可能な組み合わせを含む2つの新規のライブラリーを生成した。酵母中で28℃にてアッセイした場合に、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N(配列番号135)と同等以上の活性を示す合計92個のさらなる組み合わせを同定した(表1)。
【0493】
実施例6:オルソログの活性の改善
この実施例では、Casオルソログの細胞活性を改善する方法が説明されている。
【0494】
一方法では、1種のCasタンパク質に関して特定された有益なアミノ酸変化を最初にマッピングし、次いでオルソログタンパク質に変換する。このために、改善されたCasタンパク質とオルソログとの間の保存領域を、複数配列アラインメントツールであるMUSCLE 3.8.31(Edgar (2004)Nucleic Acids Research. 32,1792-1797)及びMSAPRobs(Liu et.al. (2010)Bioinformatics.26:1958-1964)を使用して特定した。二次構造及び3D予測(MODELLER、DiscoveryStudio(BIOVIA)、及びPymol(Schrodinger))も使用して、保存された構造的特徴を特定してアラインメントを改善し得る。次に、保存領域と重複するCasタンパク質活性を改善するアミノ酸をオルソログに転置し、実施例3で説明したように独立して又は組み合わせて細胞活性の増強に関して調べた。
【0495】
Cas-アルファ10とCas-アルファオルソログ4、8、14、15、16、及び31(配列番号198~202)とのアラインメントにより、活性を改善するために変更され得るオルソログ中の位置を特定した(表2)。
【0496】
実施例7:DNA標的開裂が改善されたガイドRNAバリアント
この実施例では、二本鎖DNA開裂活性が改善されたCasエンドヌクレアーゼガイドRNAバリアントが説明されている。
【0497】
一方法では、Cas-アルファ10操作一本鎖ガイドRNA(sgRNA)の可変ターゲティングドメインの長さを、20個から18個のヌクレオチド(nts)へと短縮し、二本鎖DNA開裂活性への影響に関して評価した(配列番号27及び28、
図10及び11を参照されたい)。このことを、酵母2ミクロン発現カセット中のade2 sgRNA1(配列番号13)をコードする配列を合成して、sgRNA2をコードする配列(配列番号14)(GenScript)で置き換え、続いてS.セレビシエ(S.cerevisiae)に形質転換させ、(実施例2及び3で説明したように)赤色コロニー表現型に関して評価することにより達成した。
【0498】
図12及び8Aで示すように、37℃での一晩の処理で赤色に着色されたセクターを示すコロニー(スコア4)の数は、18ntの長さのスペーサーを使用する場合には、20nt長さのスペーサーと共に生成した場合と比べて約4倍多かった(26%対6%)。まとめると、このとから、約18ntというより短いスペーサー長により二本鎖DNA開裂活性の増強が支持されることが分かる。
【0499】
別の方法では、ガイドRNAのスペーサー以外の領域をトランケートし、実施例3で説明されているように活性の増強を評価した。このために、トランス活性化(tracr)RNAの領域を、BLAST 2.7.3(Altschulet al. (1990)Journal of Molecular Biology. 215,403-410)を使用して、CRISPR RNA(crRNA)中のリピートと塩基対形成可能な配列(5bp以上)に関して最初に評価し、「blastn-short」パラメータ下で、及び目視検査により、低複雑度配列フィルタを無効にした。Cas-アルファ4、8、10、及び14ヌクレアーゼ(配列番号198、199、20、及び200)に属するtracrRNA(配列番号204~206、334)は全て、それぞれのcrRNAのCRISPRリピート部分(配列番号207~209、及び335)と塩基対形成可能な少なくとも2つの領域を示した(
図38~41)。Cas-アルファ4、8、及び10の場合には、最初の領域(抗リピート1)は、tracrRNAの5’半分中に存在しており、2番目(抗リピート2)は、tracrRNAの3’半分中に存在していた(
図38~40)。Cas-アルファ14の場合には、抗リピート1及び2は、tracrRNAの5’半分に位置しており、3番目(抗リピート3)は、3’部分に位置していた(
図41)。これらの領域を定義すると、sgRNAを、tracrRNa及びcrRNAを接続配列(例えば、限定されないが、5’-GAAA-3’)で連結することにより操作した。Cas-アルファ4、8、及び10の場合には、各crRNA及びtracrRNAから3種のsgRNAを設計し、これらのsgRNAは、これらのsgRNAのスペーサー領域中に、A、T、C、又はGを表す20Nsのストレッチを有していた(
図42)。第1の設計(
図42)は、抗リピート1及び2により提供される完全長相補性を利用した(配列番号210~212)。第2の設計(
図42)では、crRNAリピート及び抗リピート2の両方の領域を短縮させた(配列番号213~216)。そして第3の設計(
図42)では、crRNAリピートをさらにトランケートし、抗リピート2を完全に除去した(配列番号217~219)。Cas-アルファ14に関しても同様のsgRNA設計プロセスに従ったが、3つの抗リピートシグネチャーの存在に起因して変更した。この場合には、第1のsgRNAは、crRNA中の抗リピートとCRISPRリピートとの間の全塩基対形成を利用した(配列番号345)。第2のsgRNAでは、抗リピート1配列、及びCRISPRリピート中に相補性を有する対応する領域を除去した(配列番号346)。そして第3の設計では、抗リピート1及び3と、CRISPRリピート中の塩基対形成領域との両方を除去した(配列番号347)。
【0500】
次に、得られたsgRNAの二次構造を、Vienna Packageバージョン2.4.18(Hofacker et al. (1994)Monatsh. Chem.125167)を使用して評価した。全てのガイドRNAに関して、sgRNAの5’末端から1番目又は2番目のステム-ループは、ステム構造中にミスマッチした塩基対を有する不完全なフォールドを含んでいた(Cas-アルファ4に関するステム-ループ1(
図38)、Cas-アルファ8に関するステム-ループ2(
図39)、Cas-アルファ10に関するステム-ループ2(
図40)、及びCas-アルファ14に関するステム-ループ2(
図41)) より安定した構造を生成するために、ステム領域中のミスマッチした塩基を除去してフォールドをトリミングした(配列番号220~242、348~350)。或いは、tracrRNAの5’末端から5ntsずつ最大25ntsを欠失させ、抗リピート1の配列が損なわれることになった場合には、トランケーションを中止した(配列番号243~308)。さらに、A、G、又はCヌクレオチドを、先に説明したように3個を超えるウラシルヌクレオチドのポリヌクレオチドストリング中に置換して(Karvelis et al.,2015)、操作されたsgRNA中の早期ポリメラーゼIII終結シグナルを除去した(配列番号355~364)。
【0501】
2つの抗リピート配列に加えて、Cas-アルファ10のtracrRNAはまた、塩基対形成し得る5’末端及び3’末端で、ウラシルヌクレオチドにより中断された16bp領域も示した。この特性をさらに試験するために、設計4~7(配列番号309~312)であるsgRNAの別のセットを操作した。ここで、5’末端及び3’末端で相補性を示す領域をトランケートし(配列番号310及び311))、且つcrRNA中のCRISPRリピートをトランケートした(配列番号312)。ステム-ループ2をまた、sgRNA設計のそれぞれの安定性を増加させるために改変した(配列番号313~324)。
【0502】
別の方法では、様々な植物ポリメラーゼIIIターミネーター(配列番号325~329)を、Cas-アルファガイドRNA発現、及び関連するCas-アルファヌクレアーゼ活性への影響に関して試験した。DNAデータベースに対するBLAST検索において、ゼア・マイス(Zea mays)由来のU6非コード小型核RNAをコードする配列(配列番号330)をクエリとして使用して、ポリメラーゼIIIターミネーターを特定した。次いで、70%超の同一性及びカバー率を有するアラインメントからのターミネーター領域を単離し、ガイドRNA発現コンストラクトを構築し(
図43)、実施例8で説明するように、Cas-アルファ細胞活性を増強する能力に関して試験した。
【0503】
別の方法では、Cas-アルファ二本鎖DNA標的結合及び任意選択的な開裂を誘導可能なガイドポリヌクレオチドを改変する。一例では、2’-デオキシヌクレオチド(DNA)を、CRISPR RNA(crRNA)又はtracrRNAとcrRNAとのsgRNA融合物のスペーサーに導入して、Cas9に関して先に説明したように特異性を増強し得る(Donohoue et al.(2021)Molecular Cell.81:3637-3649)。Cas-アルファヌクレアーゼの場合には、この改変を、許容される特異性を有することが分かっている位置に配置し得る(例えば、 ガイドRNA(r)とDNA(d)標的との間又は標的認識の遠位端の位置(17、18、19、及び20位)でのrG:dT、rU:dT、又はrU:dGミスマッチ(実施例11を参照されたい))。他の状況では、この改変を、例えば、Kim et al.(2014)Genome Research.24,1012-1019又はSvitashev et al.(2016)Nature Communications.7,13274の方法を使用して、ガイドRNAスペーサー全体の位置に配置して、最大のオンターゲット活性及び最小のオフターゲット活性に関して経験的に評価し得る。
【0504】
実施例8:温度依存性ゲノム編集
この実施例では、Cas-アルファエンドヌクレアーゼ及びガイドRNAの細胞内活性を細胞中の温度で制御する方法が説明されている。細胞の一例として、ゼア・マイス(Zea mays)細胞が使用される。
【0505】
トウモロコシ最適化Cas-アルファエンドヌクレアーゼ及びガイドRNA発現コンストラクト
Wt又はバリアントcas-アルファ10遺伝子をコードする配列を、最初に、トウモロコシ細胞中での発現にコドン最適化させ、この遺伝子に、各局在化シグナル(NLS)をコードする配列を付加した(
図18)。得られた遺伝子を、熱ショック条件下での構成的発現を確実にするための、ゼア・マイス(Zea mays)ユビキチン(UBI)遺伝子に由来する配列、及び大腸菌(E.coli)又はアグロバクテリウム(Agrobacterium)中での発現を防ぐために組み込まれるジャガイモ(Solanum tuberosum)由来のST-LS1イントロン2から完全に構成されている発現カセットに入れた(
図18)(Streatfield et al. (2004)Transgenic Research. 13,299-312、及びLibiakova et al.(2001)Plant Cell Reports.20,610-615)。 一部の例では、これは、発現をブーストするのに有利な場合がある。例えば、エンハンサーも、ZM-UBIプロモーターの上流に含まれ得る(例えば、限定されないが、配列番号86~88)。次に、標的を、トウモロコシ雄性不稔26(Ms26)及びワクシー(waxy)遺伝子(Djukanovic et al. (2013)The Plant Journal. 76,888-899;Fan et al.(2009)PLoS ONE. 4,e7612)内で又は遺伝子間領域(IR)中で選択した。このことを、Cas-アルファ10の最適なPAM(5’-TTC-3’)を最初に同定することにより行なった(Karvelis et al.,2020)。次いで、PAMの3’直後の14~30ntsの連続したストレッチを、sgRNA中でスペーサーとして使用するために単離した。発現を容易にするために、Ms26、ワクシー(waxy)、又はIR部位を標的とするCas-アルファ10 sgRNAをコードする配列を、Cas9からのsgRNAに関して既に説明されているトウモロコシU6発現カセットに挿入した(Svitashev et al.(2015)Plant Physiology.169,931-945、及びKarvelis et al.(2015)Genome Biology.16,253)(
図18)。スペーサーの長さを厳密に制御するために、デルタ型肝炎ウイルス(HDV)シス作用型リボザイムをコードする配列を、スペーサーの3’直後に任意選択的に追加した(
図18)。一部の例では、リボザイムを省略し、ガイドRNAスペーサーをコードする配列の3’直後にU6ターミネーターを置いた(
図43)。
【0506】
トウモロコシ細胞の形質転換
他の形質転換方法(例えば、限定されないが、アグロバクテリウム(Agrobacterium)、エンサイファ(Ensifer)ベース、ナノ粒子媒介、又はプロトプラストを利用するアプローチ)を使用し得る(Sardesai and Subramanyam(2018)Agrobacterium Biology:From Basic Science to Biotechnology. Cham:Springer International Publishing,463-488、Rathore et al. (2019)Transgenic Plants:Methods and Protocols. New York,NY:Springer New York,37-48、Wang et al.(2019)Molecular Plant.12,1037-1040、Rhodes et al.(1988)Science.240,204-207、及びGolovkin et al.(1993)Plant Science.90,41-52)が、Wt Cas-アルファ10ヌクレアーゼ及びsgRNAプラスミド発現カセットを、既に説明されているような粒子媒介バイオリスティック形質転換を使用して、視覚的選択マーカー(例えば、限定されないが、シアン蛍光タンパク質(CFP))又は化学的選択マーカー(例えば、限定されないが、ネオマイシンホスホトランスフェラーゼII)をコードする発現コンストラクトと一緒に、9~10日齢のトウモロコシ未熟胚に共送達した(Svitashev et al.,2015、及びKarvelis et al.,2015)。細胞分裂を促進するために、非構成型プロモーターから発現されるベビーブーム(baby boom)及びwuschel2遺伝子、トウモロコシリン脂質トランスフェラーゼタンパク質、並びにトウモロコシオーキシン誘発性も、それぞれ、前述した発現カセットと一緒に送達した(Lowe et al. (2018)In vitro cellular & developmental biology-Plant. 54,240-252)。
【0507】
トウモロコシでの温度による活性の調節
二本鎖DNA標的開裂を刺激するために、DNA発現カセットの形質転換後に、1日又は3日連続にわたり、短い熱パルスを適用した(
図18)。温度インキュベーションの前後に、細胞を、その好ましい温度(例えば、限定されないが、28℃)で培養した(
図18)。他の例では、高温でのより長いインキュベーションを適用した(例えば、限定されないが、3日間)(
図18)。コントロールとして、熱処理しない実験も行なった。
【0508】
細胞DNA二本鎖の切断及び修復に関する標的部位の分析
一方法では、再生植物をサンプリングし、既に説明されているものと同様のAmpli-Seqを使用して、Cas-アルファ10標的を、細胞DNA二本鎖の切断及び修復の証拠に関して調べた(Svitashev et al.,2015)(
図26)。遺伝の可能性を評価するために、各植物に関して、編集配列及び野生型配列の読み取りの頻度も算出した。トウモロコシは2倍体であることから、変異体の読み取りが約50%及び約100%である植物を、それぞれ、標的変異に関してヘテロ接合及びホモ接合であると仮定し得た(
図18)(Zhang et al.,(2014)Plant Biotechnology Journal.12,797-807、Svitashev et al.2015,Svitashev et al.2016)。
【0509】
別の方法では、一過性実験を、Svitashev et al.,2015及びKarvelis et al.,2015で説明されているものと同様に実施した。このために、形質転換の2~10日後に、形質転換された未成熟胚を回収し、ゲノムDNAを抽出し、Cas-アルファ標的を、Cas-アルファDNA開裂及び修復を示す変異の存在に関して、Ampli-seqにより調べた。
【0510】
結果
Wt Cas-アルファ10による実験では、再生したT0植物の分析により、45℃熱処理でのみDNA配列の変化が明らかになった(
図19A)。この変化は、Ms26及びワクシー(waxy)標的の予想される切断部位を中心としていた(
図20)。この改変は、典型的には、gRNA標的認識の部分と重複する欠失で構成されていた(
図20)。単回の4時間での45℃インキュベーション後、形質転換植物の38%が、ヘテロ接合又はホモ接合のいずれかに分類されるワクシー(waxy)遺伝子中の標的変異を含んでいた(
図19A)。3回の4時間での45℃熱パルスにより、ワクシー(waxy)変異を有するT0植物の頻度は、59%に上昇した(
図19A)。ワクシー(waxy)標的では、回収された編集はまた、ヘテロ接合状態及びホモ接合状態のほぼ均等な分布を含む傾向もあった(
図19B)。Ms26標的では、単回の温度処理を適用した場合に、T0植物の14%が、ヘテロ接合又はホモ接合と評価される標的配列改変を含んでいた(
図19A)。これは、3回連続の熱ショック後に、31%まで増加した(
図19A)。ワクシー(waxy)部位とは対照的には、編集の大部分は、ヘテロ接合に分類された(
図19B)。
【0511】
A40G+E81Gバリアント(配列番号25)及びA40G+E81G+T335Rバリアント(配列番号38)の活性も調べた。一過性実験セットアップを使用して、A40G+E81G及びA40G+E81G+T335Rは両方とも、IR標的部位においてWt Cas-アルファ10(配列番号20)と比較してインデル頻度が上昇した(
図29)。3回の4時間での45℃処理により、これは、A40G+E81Gを使用した場合には約2倍の増強と等しく、A40G+E81G+T335Rによる活性のほぼ3倍の増加と等しかった(
図29)。形質転換された胚を、回収するまで37℃で保持した場合には、A40G+E81G及びA40G+E81G+T335Rでは改善がさらに顕著であり、それぞれ、標的変異活性が約5倍及び17倍増加した(
図29)。野生型酵素及びA40G+E81G酵素は、28℃でインデルを生じなかったが、A40G+E81G+T335Rは、非常に低い頻度の標的変異誘発を生じた(
図29)。
【0512】
追加の一過性実験により、A40G+E81G+A87K+T335R(配列番号85)、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N(配列番号135)、及びA40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+N430P(配列番号139)はまた、植物細胞中における編集頻度も増強することを確認した。IR標的部位及びMs26標的部位の両方を、3回の4時間にわたる45℃インキュベーション、37℃で3日間、33℃で3日間、及び30℃で3日間という4回温度レジメン下で調べた。比較対象として使用するために、Wt Cas-アルファ10(配列番号20)及びA40G+E81G+T335R(配列番号38)も含めた。3種の新規のバリアント(配列番号85、135、及び139)は全て、両方の標的部位でWt Cas-アルファ10と比較してインデル頻度を増加させ、37℃で改善が最高になった(
図30A及びB)。IR部位及びMs26部位全体で平均化した場合には、A40G+E81G+A87K+T335R、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N、及びA40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+N430Pは、それぞれ、37℃でのインデル頻度が56.9倍、91.9倍、及び85.8倍増加した(
図31)。活性の顕著な増加を、33℃及び30℃でも観察した(
図31)。
【0513】
実施例9:遺伝子活性化
この実施例では、Cas-アルファタンパク質、ガイドRNA、及び転写活性化ドメインを使用して遺伝子転写を活性化する方法が説明されている。転写活性化ドメインの一例として、冷因子結合1(cold factor binding 1)(CBF1)タンパク質由来の転写活性化ドメインが使用される。
【0514】
一方法では、ゼア・マイス(Zea mays)細胞中のアントシアニン色素沈着経路が活性化される。赤色の細胞表現型が得られるアントシアニンの産生を刺激するには、2つの転写因子R及びC1の協調的な作用が必要であることから(Grotewold et al. (2000)Proceedings of the National Academy of Sciences of the United States of America. 97,13579-13584)、r遺伝子を、Cas-アルファによる転写上方制御の標的とし得、さらに、c1遺伝子を、Young et al.(2019)Communications Biology.2,383においてCas9又はI-E CRISPR系に関して説明されていたのと同様の成分を有するトランスジェニックコンストラクトから過剰発現させる。
【0515】
図18に示すCas-アルファヌクレアーゼ発現コンストラクトを、最初に、標的結合及び遺伝子活性化が可能なCas-アルファタンパク質をコードするように操作した。一例として、A40G+E81G+A87K+T335R(配列番号85)Cas-アルファ10バリアントが、ヌクレアーゼ不活性又は死滅(d)Cas-アルファ10(配列番号144)へと変換され、且つCBF1タンパク質(配列番号147)由来の転写活性化ドメインと連結された、
図32を参照されたい。Cas-アルファ10の二量体化、標的認識、及びその後の遺伝子活性化へのCBF1融合の効果を試験するために、CBF1ドメインを含まない別のCas-アルファ10発現コンストラクトも操作した(
図33)。次に、r遺伝子プロモーター領域で3つの標的を選択し、実施例8で説明されているようにsgRNA発現コンストラクトを作製した。次いで、得られた発現コンストラクトを、C1過剰発現カセットと一緒に、実施例8で説明されている粒子媒介バイオリスティック形質転換を使用して、未成熟トウモロコシ杯に共送達した。最初に、2つの実験を設定した。1番目を、CBF1連結dCas-アルファ10(
図32)及びsgRNA発現カセットのみで実施し、2番目を、sgRNAコンストラクトと一緒に、非連結(
図33)とCBF1連結dCas-アルファ10(
図32)発現プラスミドとの1:4混合物を使用して組み立てた。
図34、レジメン2で示されているように、形質転換後に、胚を、3日にわたり37℃に暴露した。形質転換の4日後に、両方の処理からの胚の表面上で、赤色のアントシアニン表現型を観察し、写真で記録した。rプロモーターsgRNAをコードするコンストラクトを使用することなく実施した陰性コントロール実験から、アントシアニン色素沈着の証拠が得られず、このことから、観察された表現型の変化は、dCas-アルファ10及びそのsgRNAによるCBF1のr遺伝子のプロモーターへの動員に直接関係していたことが示される。加えて、dCas-アルファ10-CBF1及びそれぞれのsgRNA発現カセットのみで組み立てられた実験により、dCas-アルファ10-CBF1のみで構成された二量体が、
dCas-アルファ10及びdCas-アルファ10-CBF1で構成されたヘテロ二量体と比べて遺伝子発現を効率的に活性化することを示すアントシアニン陽性細胞の最大数が得られた(
図35を参照されたい)。
【0516】
実施例10:塩基編集
この実施例では、Cas-アルファタンパク質、ガイドRNA、及びデアミナーゼを使用して一塩基多型(SNP)をDNA標的に導入する方法が説明されている。デアミナーゼの一例として、シトシンデアミナーゼが使用される。
【0517】
一方法では、ゼア・マイス(Zea mays)バイオリスティック形質転換実験(実施例8を参照されたい)を、ワクシー(waxy)遺伝子を標的とする単一ガイドRNAと、シトシンデアミナーゼと連結されたヌクレアーゼ不活性又は死滅(d)Cas-アルファヌクレアーゼとをコードするDNA発現コンストラクトで実行した(
図36で示されているコンストラクトを参照されたい)。次いで、再生T0植物を、Ampli-Seqを使用して、DNA標的部位内での変化の存在に関して分析した(実施例8を参照されたい)。
【0518】
再生された11例の植物から、1例は、ワクシー(waxy)ガイドRNA標的(5’-AGTTCAGAGAAGGCAACCTT-3’(配列番号55))内にSNPを含むことが分かった。編集は、C-GからT-A bpへの変化が生じる5位で起こり、且つT0植物では約50%の頻度で起こっており(配列読み取りの45%は、T-A bp変化を含んでおり、55%は改変されていなかった)、このことから、この変化は遺伝するであろうことが示されている。陰性コントロールとして、実験を、デアミナーゼ融合を含まないdCas-アルファDNA発現コンストラクト(
図33を参照されたい)と、ワクシー(waxy)ターゲティング単一ガイドRNAをコードするDNA発現プラスミドとでも実施した。この実験から再生されたT0植物(n=125)から、ワクシー(waxy)標的改変の証拠が得られなかった。
【0519】
実施例11:二本鎖DNAターゲティング特異性
この実施例では、Cas-アルファタンパク質及びガイドRNAの二本鎖(ds)DNAターゲティング特異性が説明されている。
【0520】
一方法では、ガイドRNAの、スペーサーと呼ばれるdsDNAターゲティングに関与する領域に、単一点変異を導入した。一部の例では、単一改変は、ヌクレオチドトランスバージョンであったが、別の例では、単一改変は、ヌクレオチド転位であり、他の実験では、オリジナル以外の3つの可能なヌクレオチド全てを導入した。dsDNAターゲティング特異性を迅速に評価するために、ade2遺伝子を標的とするガイドRNAを使用して、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)で実験を実施した。このアプローチにより、ミスマッチしたガイドRNA及びCas-アルファエンドヌクレアーゼをコードするDNA発現カセットを、酵母に形質転換させ(実施例2を参照されたい)、ade2遺伝子の開裂及び非機能的修復から得られる赤色の細胞表現型の存在を、視覚マーカーとして使用した(実施例3を参照されたい)。
【0521】
A40G+E81G+A87K+T335R(配列番号85)は、スペーサーとDNA標的との間の単一ミスマッチに対してSpCas9と比べて感受性であった(表3、4、及び5)。一般に、単一ヌクレオチドミスマッチにより、開裂効率が全く低下しないか、又は大幅に低下した。この例外として、ガイドRNA(r)とDNA(d)標的との間又は標的認識の遠位端の位置(例えば、17、18、19、及び20位)でのrG:dT、又はrU:dT、及び一部の例ではrU:dGミスマッチが挙げられた(表4及び5)。この傾向はまた、より活性なバリアント(例えば、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N(配列番号135))にも及んでいた(表6)。
【0522】
別の方法では、Cas-アルファ10標的認識に隣接するDNAターゲティング特異性を評価した。ここで、Cas-アルファ標的開裂に起因する不正確な二本鎖切断修復の頻度をランク付けし、高活性群及び低活性群に分類し、部位の各側に隣接する標的配列を、優先度に関して評価した。このために、ゼア・マイス(Zea mays)一過性実験(実施例8を参照されたい)を、Cas-アルファエンドヌクレアーゼをコードするDNA発現カセット及び39箇所の位置を標的とする単一ガイドRNAによるパーティクルガン形質転換を使用して実施した。
【0523】
A40G+E81G+T335R(配列番号38)により標的化された部位の38%(39箇所中15箇所)は、高活性を示した(
図37)。位置頻度マトリックスを使用する高活性標的の両側に隣接する10塩基対の分析(Stormo(2013)Quant Biol.1,115-130)により、さらなる特異性が明らかになった(表7)。ここで、PAM認識の5’直後のA-T又はG-C bp(PAMの5’ 1位)、並びに予想された切断部位内のT-A、G-C、及びC-G塩基対(ガイドRNA標的の3’ 4位)は、高活性標的部位で好ましいことが分かった(表7)。
【0524】
表1は、A40G+E81G+A87K+T335R+T190K(親(P)1)及びF38E+H79D+A87K+T335R+T190K(P2)コンビナトリアルライブラリーをスクリーニングすることにより同定されたさらなるバリアントを示す。各Cas-アルファ10バリアントに関して同定された位置及びアミノ酸変化を、下記で列挙する。各実験からの2枚の写真からの赤色酵母ピクセルの割合を平均化し、この平均を使用して、A40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N(配列番号135)と比較した赤色の細胞表現型の倍数変化(FC)を算出した。反復間の標準偏差(SD)を示す。
【0525】
【0526】
【0527】
【0528】
表2は、Cas-アルファ4、8、14、15、16、及び31にマッピングされて転位され得るCas-アルファ10活性増強改変を示す。各オルソログに関して、転位に起因する位置及びアミノ酸変化を示す。
【0529】
【0530】
表3は、SpCas9 dsDNAターゲティング特異性を示す。スペーサーの各位置に、3つの可能性があるミスマッチしたヌクレオチド全てを導入し、独立してアッセイした。完全に一致したスペーサー及びDNA標的鎖の配列を示す。空白のセルは、スペーサー中に存在するオリジナルのヌクレオチドを表す。スペーサー及びDNA標的中の位置を、PAM近位から遠位まで番号付けし、1は、PAMから最も近く、20は、PAMから最も遠い。実験を、形質転換後に、37℃での一晩インキュベーションで実施した。開裂を、3回の複製全体で平均化し、赤色酵母ピクセルの割合として示す。参照として、完全に(P)一致するスペーサーで実施した実験からの赤色の割合を示す。
【0531】
【0532】
表4は、標的1でのA40G+E81G+A87K+T335R dsDNAターゲティング特異性を示す。スペーサーの各位置に、3つの可能性があるミスマッチしたヌクレオチド全てを導入し、独立してアッセイした。完全に一致したスペーサー及びDNA標的鎖の配列を示す。空白のセルは、スペーサー中に存在するオリジナルのヌクレオチドを表す。スペーサー及びDNA標的中の位置を、PAM近位から遠位まで番号付けし、1は、PAMから最も近く、20は、PAMから最も遠い。実験を、形質転換後に、37℃での一晩インキュベーションで実施した。開裂を、3回の複製全体で平均化し、赤色酵母ピクセルの割合として示す。参照として、完全に(P)一致するスペーサーで実施した実験からの赤色の割合を示す。
【0533】
【0534】
表5は、標的2でのA40G+E81G+A87K+T335R dsDNAターゲティング特異性を示す。スペーサーの各位置に、3つの可能性があるミスマッチしたヌクレオチド全てを導入し、独立してアッセイした。完全に一致したスペーサー及びDNA標的鎖の配列を示す。空白のセルは、スペーサー中に存在するオリジナルのヌクレオチドを表す。スペーサー及びDNA標的中の位置を、PAM近位から遠位まで番号付けし、1は、PAMから最も近く、20は、PAMから最も遠い。実験を、形質転換後に、37℃での一晩インキュベーションで実施した。開裂を、3回の複製全体で平均化し、赤色酵母ピクセルの割合として示す。参照として、完全に(P)一致するスペーサーで実施した実験からの赤色の割合を示す。
【0535】
【0536】
表6は、標的2でのA40G+E81G+A87K+T335R+T190K+T217H+K298S+H306F+I405N dsDNA(配列番号135)ターゲティング特異性を示す。スペーサーの全ての奇数位置に、反転変異(例えば、AからTへ、TからAへ、CからGへ、又はGからCへ)を導入した。完全に一致したスペーサー及びDNA標的鎖の配列を示す。空白のセルは、アッセイしなかった位置及びヌクレオチドの組み合わせを表す。スペーサー及びDNA標的中の位置を、PAM近位から遠位まで番号付けし、1は、PAMから最も近く、20は、PAMから最も遠い。実験を、形質転換後に、37℃での一晩インキュベーションで実施した。1回の反復からの開裂を、赤色酵母ピクセルの割合として示す。参照として、完全に(P)一致するスペーサーで実施した実験からの赤色の割合を示す。
【0537】
【0538】
表7は、高活性Cas-アルファ10(A40G+E81G+T335R(配列番号38))標的部位に隣接するDNA領域の塩基対組成の正規化された百分率を示す。標的部位のTS鎖及び優先度に下線を引いている。予想される切断部位は、ガイドRNA標的の3’領域中における3位の直前及び4位の直後で生じる。
【0539】
【配列表】
【国際調査報告】