(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-20
(45)【発行日】2024-10-01
(54)【発明の名称】真核ゲノム修飾のための操作されたCas9システム
(51)【国際特許分類】
C07K 19/00 20060101AFI20240924BHJP
C12N 9/16 20060101ALI20240924BHJP
C07K 14/47 20060101ALI20240924BHJP
C12N 15/113 20100101ALI20240924BHJP
C12N 15/09 20060101ALN20240924BHJP
C12N 15/62 20060101ALN20240924BHJP
C12N 15/55 20060101ALN20240924BHJP
C12N 15/12 20060101ALN20240924BHJP
【FI】
C07K19/00
C12N9/16 Z
C07K14/47
C12N15/113 Z ZNA
C12N15/09 110
C12N15/62 Z
C12N15/55
C12N15/12
【外国語出願】
(21)【出願番号】P 2022083820
(22)【出願日】2022-05-23
(62)【分割の表示】P 2020531575の分割
【原出願日】2019-02-15
【審査請求日】2022-06-20
(32)【優先日】2018-02-15
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-08-21
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】311016949
【氏名又は名称】シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】Sigma-Aldrich Co. LLC
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(74)【代理人】
【識別番号】100221545
【氏名又は名称】白江 雄介
(72)【発明者】
【氏名】ティモシー・シーベック
(72)【発明者】
【氏名】フーチアン・チェン
(72)【発明者】
【氏名】グレゴリー・デイビス
【審査官】西 賢二
(56)【参考文献】
【文献】国際公開第2018/007976(WO,A1)
【文献】国際公開第2017/223538(WO,A1)
【文献】特表2016-521555(JP,A)
【文献】Tsui, T. K. M. et al.,ACS Synth. Biol.,2017年,Vol. 6,pp. 1103-1113
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C07K 1/00-19/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
UniProt/GeneSeq
GenBank/EMBL/DDBJ/GeneSeq
(57)【特許請求の範囲】
【請求項1】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:121または122に対して少なくとも90%配列同一性を有するアミノ酸配列を有し、融合タンパク質が、配列番号:4に示されているアミノ酸配列を有するタンパク質と同じ機能を有する、融合タンパク質。
【請求項2】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:121または122に示されているアミノ酸配列を有する、融合タンパク質。
【請求項3】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:117または118に対して少なくとも90%配列同一性を有するアミノ酸配列を有し、融合タンパク質が、配列番号:6に示されているアミノ酸配列を有するタンパク質と同じ機能を有する、融合タンパク質。
【請求項4】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:117または118に示されているアミノ酸配列を有する、融合タンパク質。
【請求項5】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:123または124に対して少なくとも90%配列同一性を有するアミノ酸配列を有し、融合タンパク質が、配列番号:8に示されているアミノ酸配列を有するタンパク質と同じ機能を有する、融合タンパク質。
【請求項6】
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、またはマイコプラズマ・カニスのCas9タンパク質であり、融合タンパク質は、操作されたガイドRNAをさらに含み、操作されたガイドRNAは、Cas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、
Cas9タンパク質がラクトバチルス・ラムノサスCas9タンパク質であるとき配列5’-NGAAA-3’、
Cas9タンパク質がパラサテレラ・エクスクレメンティホミニスCas9タンパク質であるとき配列5’-NGG-3’、または
Cas9タンパク質がマイコプラズマ・カニスCas9タンパク質であるとき配列5’-NNGG-3’を含み、NはA、C、G、またはTであ
り、融合タンパク質が、配列番号:123または124に示されているアミノ酸配列を有する、融合タンパク質。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願に対する相互参照
本願は、2018年2月15日に提出された米国仮出願番号62/631,304、および2018年8月21日に提出された米国仮出願番号62/720,525の利益を請求し、各記載をその全体において出典明示によりここに包含させる。
【0002】
配列表
本願は、ASCIIフォーマットで電子的に提出された配列表を含み、その全体において出典明示によりここに包含させる。2019年2月12日に作成された該ASCIIコピーは、P18_023PCT_SL.txtと名付けられ370,305バイトサイズである。
【0003】
分野
本開示は、操作されたCas9システム、該システムをコードする核酸、およびゲノム修飾のための該システムを使用する方法に関する。
【背景技術】
【0004】
背景
ゲノム編集ツールとしての細菌クラス2 クラスター化反復短回文配列リピート(CRISPR)およびCRISPR関連(Cas)CRISPR/Casシステムの最近の開発は、真核ゲノム修飾のための部位特異的エンドヌクレアーゼを操作する前例のない簡単さおよび単純さを提供している。しかしながら、各CRISPR/Casシステムは標的DNA結合のための特定のプロトスペーサー隣接モチーフ(PAM)を必要とするため、各システムはあるゲノム部位に限定される。現在最も広く採用されている化膿連鎖球菌Cas9(SpyCas9)は、頻繁に発生するPAM(5’-NGG-3’)を標的化のために使用するが、真核のゲノム、とりわけ哺乳動物のゲノムおよび植物が、DNA配列において非常に複雑であり不均一であるため、このようなモチーフを欠いている多くのゲノム部位から未だ除外される。さらに、相同組み換え修復(HDR)または塩基エディター、例えばdCas9/シチジンデアミナーゼおよびdCas9/アデノシンデアミナーゼを使用する正確な遺伝子編集は、しばしば、最適な編集結果をなし遂げるために、単一の塩基対の分解能(resolution)でさえ、正確なDNA結合位置を必要とする。したがって、ゲノムのカバレッジ密度を増加させるために標的化のための新規なPAMを使用する新規なCRISPR/Casシステムを開発する必要性が存在する。
【発明の概要】
【0005】
概要
本開示の種々の局面の中には、操作されたCas9タンパク質および操作されたガイドRNAを含む操作されたCas9システムであって、各操作されたガイドRNAは、操作されたCas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、表Aに列挙されている配列を有する、操作されたCas9システムを含む。
【0006】
本開示の別の局面は、該操作されたCas9システムをコードする複数の核酸および複数の該核酸を含む少なくとも1つのベクターを含む。
【0007】
さらなる局面は、少なくとも1つの操作されたCas9システムおよび/または該操作されたCas9システムをコードする少なくとも1つの核酸を含む真核細胞を含む。
【0008】
本開示のさらに別の局面は、真核細胞における染色体配列を修飾するための方法を含む。方法は、真核細胞に、操作されたCas9タンパク質および操作されたガイドRNAを含む少なくとも1つの操作されたCas9システムおよび/または該操作されたCas9システムをコードする少なくとも1つの核酸、および所望により、少なくとも1つのドナーポリヌクレオチドを導入することを含み、少なくとも1つの操作されたガイドRNAは、染色体配列の修飾が起こるように染色体配列における標的部位に少なくとも1つの操作されたCas9タンパク質をガイドする。
【0009】
本開示の他の局面および特徴は、以下に詳細に説明される。
【図面の簡単な説明】
【0010】
【
図1】
図1は、Cas9オルソログによるインビトロ標的DNA切断のために必要とされるプロトスペーサー隣接モチーフ(PAM)のWebLogo分析を示す。横軸の数字は、PAM配列におけるヌクレオチドの位置を示す。
【0011】
【
図2-1】
図2Aは、McaCas9、McaCas9-HN1HB1融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でHMGB1ボックスA)、およびMcaCas9-HN1H1G融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でヒストンH1中央球状モチーフ)の切断効率(インデルのパーセントとして)を示す。各遺伝子座の標的部位は、表6において示される。エラーバーは平均±SD(n=3 生物学的再現)を示す。
図2Bは、PexCas9、PexCas9-HN1HB1融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でHMGB1ボックスA)、およびPexCas9-HN1H1G融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でヒストンH1中央球状モチーフ)の切断効率(インデルのパーセントとして)を示す。各遺伝子座の標的部位は、表6において示される。エラーバーは平均±SD(n=3 生物学的再現)を示す。
【0012】
【
図2-2】
図2Cは、BsmCas9、BsmCas9-HN1HB1融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でHMGB1ボックスA)、およびBsmCas9-HN1H1G融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でヒストンH1中央球状モチーフ)の切断効率(インデルのパーセントとして)を示す。各遺伝子座の標的部位は、表6において示される。エラーバーは平均±SD(n=3 生物学的再現)を示す。
図2Dは、LrhCas9、LrhCas9-HN1HB1融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でHMGB1ボックスA)、およびLrhCas9-HN1H1G融合物(すなわち、アミノ末端でHMGN1およびカルボキシル末端でヒストンH1中央球状モチーフ)の切断効率(インデルのパーセントとして)を示す。各遺伝子座の標的部位は、表6において示される。エラーバーは平均±SD(n=3 生物学的再現)を示す。
【0013】
【
図3】
図3は、コントロールCas9およびCas9-CMM融合ヌクレアーゼのオフターゲット活性(インデルのパーセントとして)を示す。エラーバーは平均±SD(n=3 生物学的再現)を示す。
【発明を実施するための形態】
【0014】
詳細な説明
本開示は、標的DNA結合のために代替PAMを使用し、それによりゲノムのカバレッジ密度を増加させるオーソロガスCas9システムを提供する。例えば、これらの代替PAMのいくつかはAおよび/またはT残基を含み、他の代替PAMSはGCリッチである。そのため、これらの代替PAMを利用する操作されたCas9システムは、以前にアクセスできなかったゲノム遺伝子座の標的化ゲノム編集またはゲノム修飾を可能にする。
【0015】
(I)操作されたCas9システム
本開示の1つの局面は、操作されたCas9タンパク質および操作されたガイドRNAを含む操作されたCas9システムであって、各操作されたガイドRNAは、特定の操作されたCas9タンパク質と複合体を形成するように設計されている、操作されたCas9システムを提供する。各操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、表Aに列挙されている配列を有する。これらの操作されたCas9システムは、天然に起こらない。
【0016】
(a)操作されたCas9タンパク質
操作されたCas9タンパク質は、その野生型対応物と比較して、少なくとも1つのアミノ酸置換、挿入、または欠失を含む。Cas9タンパク質は、種々の細菌に存在するタイプII CRISPRシステムにおける単一のエフェクタータンパク質である。本願明細書に記載されている操作されたCas9タンパク質は、アカリオクロリス(Acaryochloris)種、アセトハロビウム(Acetohalobium)種、アシダミノコッカス(Acidaminococcus)種、アシドチオバシラス(Acidithiobacillus)種、アシドサーマス(Acidothermus)種、アッカーマンシア(Akkermansia)種、アリシクロバチルス(Alicyclobacillus)種、アロクロマチウム(Allochromatium)種、アモニフィックス(Ammonifex)種、アナベナ(Anabaena)種、アルトロスピラ(Arthrospira)種、バチルス(Bacillus)種、ビフィドバクテリウム(Bifidobacterium)種、バークホルデリア(Burkholderiales)種、カルジセルロシルプター(Caldicelulosiruptor)種、カンピロバクター(Campylobacter)種、カンジダタス(Candidatus)種、クロストリジウム(Clostridium)種、コリネバクテリウム(Corynebacterium)種、クロコスフェラ(Crocosphaera)種、シアノテス(Cyanothece)種、エキシグオバクテリウム(Exiguobacterium)種、フィネゴルディア(Finegoldia)種、フランシセラ(Francisella)種、クテドノバクテル(Ktedonobacter)種、ラクノスピラ(Lachnospiraceae)種、ラクトバチルス(Lactobacillus)種、リングビア(Lyngbya)種、マリノバクター(Marinobacter)種、メタノハロビウム(Methanohalobium)種、ミクロシラ(Microscilla)種、ミクロコレウス(Microcoleus)種、ミクロキスティス(Microcystis)種、マイコプラズマ(Mycoplasma)種、ナトラナエロビウス(Natranaerobius)種、ナイセリア(Neisseria)種、ニトラティフラクター(Nitratifractor)種、ニトロソコッカス(Nitrosococcus)種、ノカルジオプシス(Nocardiopsis)種、ネンジュモ(Nodularia)種、ネンジュモ(Nostoc)種、オエノコッカス(Oenococcus)種、オスキラトリア(Oscillatoria)種、パラサテレラ(Parasutterella)種、ペロトマキュルム(Pelotomaculum)種、ペトロトーガ(Petrotoga)種、ポラロモナス(Polaromonas)種、プレボテーラ(Prevotella)種、シュードアルテロモナス(Pseudoalteromonas)種、ラルストニア(Ralstonia)種、スタフィロコッカス(Staphylococcus)種、ストレプトコッカス(Streptococcus)種、ストレプトマイセス(Streptomyces)種、ストレプトスポランギウム(Streptosporangium)種、シネココッカス(Synechococcus)種、サーモシフォ(Thermosipho)種、ベルコミクロビア(Verrucomicrobia)種、およびウォリネラ(Wolinella)種に由来してよい。
【0017】
1つの態様において、本願明細書に記載されている操作されたCas9タンパク質は、アシドサーマス種、アッカーマンシア種、アリシクロバチルス種、バチルス種、ビフィドバクテリウム種、バークホルデリア種、コリネバクテリウム種、ラクトバチルス種、マイコプラズマ種、ニトラティフラクター種、オエノコッカス種、パラサテレラ種、ラルストニア種、またはウォリネラ種に由来する。
【0018】
特定の態様において、本願明細書に記載されている操作されたCas9タンパク質は、アシッドサーマス・セルロリティカス(Acidothermus cellulolyticus)(Ace)、アッカーマンシア・グリカニフィラ(Akkermansia glycaniphila)(Agl)、アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)(Amu)、アリサイクロバチラス・ヘスペリダム(Alicyclobacillus hesperidum)(Ahe)、バチルス・スミスイ(Bacillus smithii)(Bsm)、ビフィドバクテリウム・ボンビ(Bifidobacterium bombi)(Bbo)、コリネバクテリウム・ジフテリア(Corynebacterium diphtheria)(Cdi)、ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)(Lrh)、マイコプラズマ・カニス(Mycoplasma canis)(Mca)、マイコプラズマ・ガリセプティカム(Mycoplasma gallisepticum)(Mga)、ニトラティフラクター・サルスギニス(Nitratifractor salsuginis)(Nsa)、オエノコッカス・キタハラエ(Oenococcus kitaharae)(Oki)、パラサテレラ・エクスクレメンティホミニス(Parasutterella excrementihominis)(Pex)、ラルストニア・シジギ(Ralstonia syzygii)(Rsy)、またはウォリネラ・サクシノゲネス(Wolinella succinogenes)(Wsu)に由来する。
【0019】
野生型Cas9タンパク質は、2つのヌクレアーゼドメイン、すなわち、RuvCおよびHNHドメインを含み、これらそれぞれは二本鎖配列の一本鎖を切断する。Cas9タンパク質はまた、ガイドRNA(例えば、REC1、REC2)またはRNA/DNAヘテロ二本鎖(例えば、REC3)と相互作用するRECドメイン、およびプロトスペーサー隣接モチーフ(PAM)(すなわち、PAM相互作用ドメイン)と相互作用するドメインを含む。
【0020】
Cas9タンパク質は、Cas9タンパク質が改変された活性、特異性、および/または安定性を有するように1つ以上の修飾(すなわち、少なくとも1つのアミノ酸の置換、少なくとも1つのアミノ酸の欠失、少なくとも1つのアミノ酸の挿入)を含むように操作されてもよい。
【0021】
例えば、Cas9タンパク質は、ヌクレアーゼドメインの1つまたは両方を不活性化するように1つ以上の変異および/または欠失により操作されてもよい。1つのヌクレアーゼドメインの不活性化は、二本鎖配列の一本鎖を切断するCas9タンパク質(すなわち、Cas9ニッカーゼ)を産生する。RuvCドメインは、変異、例えばD10A、D8A、E762A、および/またはD986Aにより不活性化されてもよく、HNHドメインは、変異、例えばH840A、H559A、N854A、N856A、および/またはN863A(化膿連鎖球菌Cas9、SpyCas9の番号制を基準にして)により不活性化されてもよい。両方のヌクレアーゼドメインの不活性化は、切断活性を有さないCas9タンパク質(すなわち、触媒的に不活性な、または不活性型(dead)Cas9)を産生する。
【0022】
Cas9タンパク質はまた、改善された標的化特異性、改善された忠実性、改変されたPAM特異性、減少したオフターゲット効果、および/または増加した安定性を有するように1つ以上のアミノ酸置換、欠失、および/または挿入により操作されてよい。標的化特異性を改善する、忠実性を改善する、および/またはオフターゲット効果を減少させる1つ以上の変異の非限定的な例は、N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060A、および/またはD1135E(SpyCas9の番号制を基準にして)を含む。
【0023】
(i)異種ドメイン
Cas9タンパク質は、少なくとも1つの異種ドメインを含むように操作されてよい、すなわち、Cas9は、1つ以上の異種ドメインに融合される。2つ以上の異種ドメインがCas9と融合される状況において、2つ以上の異種ドメインは同じであってよく、またはそれらは異なっていてよい。1つ以上の異種ドメインは、N末端、C末端、内部位置、またはそれらの組合せに融合されてよい。融合は化学結合を介して直接的であってよく、または結合は1つ以上のリンカーを介して間接的であってよい。種々の態様において、異種ドメインは、核局在化シグナル、細胞膜透過ドメイン、マーカードメイン、クロマチン破壊ドメイン、エピジェネティック修飾ドメイン(例えば、シチジンデアミナーゼドメイン、ヒストンアセチルトランスフェラーゼドメインなど)、転写制御ドメイン、RNAアプタマー結合ドメイン、または非Cas9ヌクレアーゼドメインであってよい。
【0024】
いくつかの態様において、1つ以上の異種ドメインは、核局在化シグナル(NLS)であってよい。核局在化シグナルの非限定的な例は、PKKKRKV(配列番号:78)、PKKKRRV(配列番号:79)、KRPAATKKAGQAKKKK(配列番号:80)、YGRKKRRQRRR(配列番号:81)、RKKRRQRRR(配列番号:82)、PAAKRVKLD(配列番号:83)、RQRRNELKRSP(配列番号:84)、VSRKRPRP(配列番号:85)、PPKKARED(配列番号:86)、PQPKKKPL(配列番号:87)、SALIKKKKKMAP(配列番号:88)、PKQKKRK(配列番号:89)、RKLKKKIKKL(配列番号:90)、REKKKFLKRR(配列番号:91)、KRKGDEVDGVDEVAKKKSKK(配列番号:92)、RKCLQAGMNLEARKTKK(配列番号:93)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号:94)、およびRMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号:95)を含む。
【0025】
他の態様において、1つ以上の異種ドメインは、細胞膜透過ドメインであってよい。適当な細胞膜透過ドメインの例は、限定はしないが、GRKKRRQRRRPPQPKKKRKV(配列番号:96)、PLSSIFSRIGDPPKKKRKV(配列番号:97)、GALFLGWLGAAGSTMGAPKKKRKV(配列番号:98)、GALFLGFLGAAGSTMGAWSQPKKKRKV(配列番号:99)、KETWWETWWTEWSQPKKKRKV(配列番号:100)、YARAAARQARA(配列番号:101)、THRLPRRRRRR(配列番号:102)、GGRRARRRRRR(配列番号:103)、RRQRRTSKLMKR(配列番号:104)、GWTLNSAGYLLGKINLKALAALAKKIL(配列番号:105)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号:106)、およびRQIKIWFQNRRMKWKK(配列番号:107)を含む。
【0026】
代替態様において、1つ以上の異種ドメインは、マーカードメインであってよい。マーカードメインは、蛍光タンパク質および精製またはエピトープタグを含む。適当な蛍光タンパク質は、限定することなく、緑色蛍光タンパク質(例えば、GFP、eGFP、GFP-2、tagGFP、turboGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えば、BFP、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、シアン色蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(例えば、mKate、mKate2、mPlum、DsRed monomer、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、橙色蛍光タンパク質(例えば、mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)、またはそれらの組合せを含む。マーカードメインは、1つ以上の蛍光タンパク質のタンデムリピート(例えば、Suntag)を含んでよい。適当な精製またはエピトープタグの非限定的な例は、6xHis(配列番号:134)、FLAG(登録商標)、HA、GST、Myc、SAMなどを含む。CRISPR複合体の検出または濃縮を容易にする異種融合の非限定的な例は、ストレプトアビジン(Kipriyanov et al., Human Antibodies, 1995, 6(3):93-101.)、アビジン(Airenne et al., Biomolecular Engineering, 1999, 16(1-4):87-92)、アビジンの単量体形態(in (Laitinen et al., Journal of Biological Chemistry, 2003, 278(6):4010-4014)、組み換え生産中にビオチン化を容易にするペプチドタグ(Cull et al., Methods in Enzymology, 2000, 326:430-440)を含む。
【0027】
さらに他の態様において、1つ以上の異種ドメインは、クロマチン調節モチーフ(CMM)であってよい。CMMの非限定的な例は、高移動度グループ(HMG)タンパク質(例えば、HMGB1、HMGB2、HMGB3、HMGN1、HMGN2、HMGN3a、HMGN3b、HMGN4、およびHMGN5タンパク質)、ヒストンH1変異体の中央球状ドメイン(例えば、ヒストン H1.0、H1.1、H1.2、H1.3、H1.4、H1.5、H1.6、H1.7、H1.8、H1.9、およびH.1.10)、またはクロマチンリモデリング複合体のDNA結合ドメイン(例えば、SWI/SNF(スイッチ/スクロース非発酵性(
SWItch/
Sucrose
Non-
Fermentable))、ISWI(模倣スイッチ(
Imitation
SWItch))、CHD(クロモドメイン-ヘリカーゼ-DNA結合(
Chromodomain-
Helicase-
DNA binding))、Mi-2/NuRD(ヌクレオソームリモデリングおよびデアセチラーゼ)、INO80、SWR1、およびRSC複合体に由来するヌクレオソーム相互作用ペプチドを含む。他の態様において、CMMはまた、トポイソメラーゼ、ヘリカーゼ、またはウイルスタンパク質に由来してよい。CMMの供給源は、変化してもよく、変化するであろう。CMMは、ヒト、動物(すなわち、脊椎動物および無脊椎動物)、植物、藻類、または酵母であってよい。特定のCMMの非限定的な例は、以下の表に列挙されている。当業者は、他の種におけるホモログおよび/またはそれとの関連融合モチーフを容易に同定することができる。
【表a】
【0028】
さらに他の態様において、1つ以上の異種ドメインは、エピジェネティック修飾ドメインであってよい。適当なエピジェネティック修飾ドメインの非限定的な例は、DNA脱アミノ化(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、グアニンデアミナーゼ)、DNAメチルトランスフェラーゼ活性(例えば、シトシンメチルトランスフェラーゼ)、DNAデメチラーゼ活性、DNAアミノ化、DNA酸化活性、DNAヘリカーゼ活性、ヒストンアセチルトランスフェラーゼ(HAT)活性(例えば、E1A結合タンパク質p300に由来するHATドメイン)、ヒストンデアセチラーゼ活性、ヒストンメチルトランスフェラーゼ活性、ヒストンデメチラーゼ活性、ヒストンキナーゼ活性、ヒストンホスファターゼ活性、ヒストンユビキチンリガーゼ活性、ヒストン脱ユビキチン化活性、ヒストンアデニル化活性、ヒストン脱アデニル化活性、ヒストンSUMO化活性、ヒストン脱SUMO化活性、ヒストンリボシル化活性、ヒストン脱リボシル化活性、ヒストンミリストイル化活性、ヒストン脱ミリストイル化活性、ヒストンシトルリン化活性、ヒストンアルキル化活性、ヒストン脱アルキル化活性、またはヒストン酸化活性を有するものを含む。特定の態様において、エピジェネティック修飾ドメインは、シチジンデアミナーゼ活性、アデノシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性、またはDNAメチルトランスフェラーゼ活性を含んでよい。
【0029】
他の態様において、1つ以上の異種ドメインは、転写制御ドメイン(すなわち、転写活性化ドメインまたは転写リプレッサードメイン)であってよい。適当な転写活性化ドメインは、限定することなく、単純ヘルペスウイルスVP16ドメイン、VP64(すなわち、VP16の4つのタンデムコピー)、VP160(すなわち、VP16の10個のタンデムコピー)、NFκB p65活性化ドメイン(p65)、エプスタイン-バー・ウイルスR転写活性化因子(Rta)ドメイン、VPR(すなわち、VP64+p65+Rta)、p300-依存性転写活性化ドメイン、p53活性化ドメイン1および2、ヒートショック因子1(HSF1)活性化ドメイン、Smad4活性化ドメイン(SAD)、cAMP応答要素結合タンパク質(CREB)活性化ドメイン、E2A活性化ドメイン、活性化T細胞の核因子(NFAT)活性化ドメイン、またはそれらの組合せを含む。適当な転写リプレッサードメインの非限定的な例は、Kruppel関連ボックス(KRAB)リプレッサードメイン、Mxiリプレッサードメイン、誘導cAMP初期リプレッサー(ICER)ドメイン、YY1グリシンリッチリプレッサードメイン、Sp1様リプレッサー、E(spl)リプレッサー、IκBリプレッサー、Sin3リプレッサー、メチル-CpG結合タンパク質2(MeCP2)リプレッサー、またはそれらの組合せを含む。転写活性化または転写リプレッサードメインは、Cas9タンパク質に遺伝的に融合されてよく、または非共有タンパク質-タンパク質、タンパク質-RNA、またはタンパク質-DNA相互作用を介して結合されてよい。
【0030】
さらなる態様において、1つ以上の異種ドメインは、RNAアプタマー結合ドメイン(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)であってよい。適当なRNAアプタマータンパク質ドメインの例は、MS2コートタンパク質(MCP)、PP7バクテリオファージコートタンパク質(PCP)、MuバクテリオファージComタンパク質、ラムダバクテリオファージN22タンパク質、ステムループ結合タンパク質(SLBP)、脆弱性X精神遅滞症候群-関連タンパク質1(FXR1)、バクテリオファージに由来するタンパク質、例えばAP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP-β、TW18、TW19、およびVK、それらのフラグメント、またはそれらの誘導体を含む。
【0031】
さらに他の態様において、1つ以上の異種ドメインは、非Cas9ヌクレアーゼドメインであってよい。適当なヌクレアーゼドメインは、あらゆるエンドヌクレアーゼまたはエキソヌクレアーゼから得ることができる。ヌクレアーゼドメインが由来することができるエンドヌクレアーゼの非限定的な例は、限定はしないが、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼを含む。いくつかの態様において、ヌクレアーゼドメインは、タイプII-S制限エンドヌクレアーゼに由来してよい。タイプII-Sエンドヌクレアーゼは、典型的に認識/結合部位から数塩基対離れた部位でDNAを切断し、分離可能な結合および切断ドメインを有する。これらの酵素は、一般的に、一時的に会合し、二量体を形成し、互い違いの位置でDNAの各鎖を切断する、単量体である。適当なタイプII-Sエンドヌクレアーゼの非限定的な例は、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboII、およびSapIを含む。いくつかの態様において、ヌクレアーゼドメインは、FokIヌクレアーゼドメインまたはその誘導体であってよい。タイプII-Sヌクレアーゼドメインは、2つの異なるヌクレアーゼドメインの二量化を容易にするように修飾されてよい。例えば、FokIの切断ドメインは、特定のアミノ酸残基を変異することによって修飾されてよい。非限定的な例として、FokIヌクレアーゼドメインの位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537、および538でのアミノ酸残基が、修飾のための標的である。特定の態様において、FokIヌクレアーゼドメインは、Q486E、I499L、および/またはN496D変異を含む第1のFokIハーフドメイン、およびE490K、I538K、および/またはH537R変異を含む第2のFokIハーフドメインを含んでよい。
【0032】
1つ以上の異種ドメインは、Cas9タンパク質に、1つ以上の化学結合(例えば、共有結合)を介して直接的に連結されてよく、または1つ以上の異種ドメインは、Cas9タンパク質に、1つ以上のリンカーを介して間接的に連結されてよい。
【0033】
リンカーは、少なくとも1つの共有結合を介して1つ以上の他の化学基に連結する化学基である。適当なリンカーは、アミノ酸、ペプチド、ヌクレオチド、核酸、有機リンカー分子(例えば、マレイミド誘導体、N-エトキシベンジルイミダゾール、ビフェニル-3,4’,5-トリカルボン酸、p-アミノベンジルオキシカルボニル、など)、ジスルフィドリンカー、およびポリマーリンカー(例えば、PEG)を含む。リンカーは、限定はしないが、アルキレン、アルケニレン、アルキニレン、アルキル、アルケニル、アルキニル、アルコキシ、アリール、ヘテロアリール、アラルキル、アラルケニル、アラルキニルなどを含む、1つ以上のスペーサー(spacing)基を含んでよい。リンカーは、中性であってよく、または正または負の電荷を有してもよい。さらに、リンカーは、リンカーを別の化学基に連結するリンカーの共有結合が、pH、温度、塩濃度、光、触媒、または酵素を含む特定の条件下で破壊または切断することができるように切断可能であってよい。いくつかの態様において、リンカーは、ペプチドリンカーであってよい。ペプチドリンカーは、フレキシブルな(flexible)アミノ酸リンカー(例えば、小さい非極性または極性アミノ酸を含む)であってよい。フレキシブルな(flexible)リンカーの非限定的な例は、LEGGGS(配列番号:108)、TGSG(配列番号:109)、GGSGGGSG(配列番号:110)、(GGGGS)1-4(配列番号:111)、および(Gly)6-8(配列番号:112)を含む。あるいは、ペプチドリンカーは、硬い(rigid)アミノ酸リンカーであってよい。かかるリンカーは、(EAAAK)1-4(配列番号:113)、A(EAAAK)2-5A(配列番号:114)、PAPAP(配列番号:115)、および(AP)6-8(配列番号:116)を含む。適当なリンカーのさらなる例は当分野でよく知られており、リンカーを設計するプログラムは容易に利用できる(Crasto et al., Protein Eng., 2000, 13(5):309-312)。
【0034】
いくつかの態様において、操作されたCas9タンパク質は、無細胞システム、細菌細胞、または真核細胞において組換え的に生産されてよく、標準精製手段を使用して精製されてよい。他の態様において、操作されたCas9タンパク質は、操作されたCas9タンパク質をコードする核酸から興味ある真核細胞においてインビボで生産される(以下のセクション(II)参照)。
【0035】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む態様において、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインをさらに含んでよい。操作されたCas9タンパク質がエピジェネティック修飾ドメインに連結される態様において、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインをさらに含んでよい。さらに、操作されたCas9タンパク質が転写制御ドメインに連結される態様において、操作されたCas9タンパク質は、少なくとも1つの核局在化シグナル、細胞膜透過ドメイン、および/またはマーカードメイン、ならびに少なくとも1つのクロマチン破壊ドメインおよび/または少なくとも1つのRNAアプタマー結合ドメインをさらに含んでよい。
【0036】
(ii)特定の操作されたCas9タンパク質
特定の態様において、操作されたCas9タンパク質は、バチルス・スミスイ、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、マイコプラズマ・カニス、マイコプラズマ・ガリセプティカム、アッカーマンシア・グリカニフィラ、アッカーマンシア・ムシニフィラ、オエノコッカス・キタハラエ、ビフィドバクテリウム・ボンビ、アシッドサーマス・セルロリティカス、アリサイクロバチラス・ヘスペリダム、ウォリネラ・サクシノゲネス、ニトラティフラクター・サルスギニス、ラルストニア・シジギ、またはコリネバクテリウム・ジフテリアに由来し、少なくとも1つのNLSに連結される。いくつかの反復において、操作されたCas9タンパク質は、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、または30と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有してよい。1つの態様において、操作されたCas9タンパク質は、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、または30と少なくとも約95%配列同一性を有してよい。他の反復において、操作されたCas9タンパク質は、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、または30のアミノ酸配列を有する。
【0037】
他の態様において、操作されたCas9タンパク質は、少なくとも1つのクロマチン調節モチーフ(CMM)に連結された、バチルス・スミスイ、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、マイコプラズマ・カニス、マイコプラズマ・ガリセプティカム、アッカーマンシア・グリカニフィラ、アッカーマンシア・ムシニフィラ、オエノコッカス・キタハラエ、ビフィドバクテリウム・ボンビ、アシッドサーマス・セルロリティカス、アリサイクロバチラス・ヘスペリダム、ウォリネラ・サクシノゲネス、ニトラティフラクター・サルスギニス、ラルストニア・シジギ、またはコリネバクテリウム・ジフテリアのCas9タンパク質であってよい。Cas9タンパク質およびCMM間の結合は、直接的に、またはリンカーを介してであってよい。Cas9-CMM融合タンパク質は、少なくとも1つのNLSをさらに含んでよい。特定の態様において、Cas9-CMM融合タンパク質は、配列番号:117、118、119、1200、121、122、123、または124と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有してよい。1つの態様において、Cas9-CMM融合タンパク質は、配列番号:117、118、119、120、121、122、123、または124と少なくとも約95%配列同一性を有してよい。特定の反復において、Cas9-CMM融合タンパク質は、配列番号:117、118、119、120、121、122、123、または124のアミノ酸配列を有する。
【0038】
(b)操作されたガイドRNA
操作されたガイドRNAは、特定の操作されたCas9タンパク質と複合体を形成するように設計される。ガイドRNAは、(i)標的配列とハイブリダイズする5’末端でガイド配列を含むCRISPR RNA(crRNA)および(ii)Cas9タンパク質を動員するトランス作用crRNA(tracrRNA)配列を含む。各ガイドRNAのcrRNAガイド配列は、異なっている(すなわち、配列特異的である)。tracrRNA配列は、一般的に、特定の細菌種に由来するCas9タンパク質と複合体を形成するように設計されたガイドRNAにおいて同じである。
【0039】
crRNAガイド配列は、二本鎖配列において標的配列(すなわち、プロトスペーサー)とハイブリダイズするように設計される。一般的に、crRNAおよび標的配列間の相補性は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%である。特定の態様において、相補性は完全である(すなわち、100%)。種々の態様において、crRNAガイド配列の長さは、約15ヌクレオチドから約25ヌクレオチドの範囲であってよい。例えば、crRNAガイド配列は、約15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長であってよい。特定の態様において、crRNAは、約19、20、または21ヌクレオチド長である。1つの態様において、crRNAガイド配列は、20ヌクレオチドの長さを有する。
【0040】
ガイドRNAは、Cas9タンパク質と相互作用する少なくとも1つのステムループ構造を形成するリピート配列、および一本鎖のままである3’配列を含む。各ループおよびステムの長さは変化してよい。例えば、ループは約3から約10ヌクレオチド長の範囲であってよく、ステムは約6から約20塩基対の長さの範囲であってよい。ステムは、1から約10ヌクレオチドの1つ以上の突出部を含んでよい。一本鎖3’領域の長さは変化してよい。操作されたガイドRNAにおけるtracrRNA配列は、一般的に、興味ある細菌種における野生型tracrRNAをコード配列に基づく。野生型配列は、二次構造の形成を容易にするように、二次構造の安定性を増加させるように、真核細胞における発現を容易にするなどのように修飾されてよい。例えば、1つ以上のヌクレオチド変化は、ガイドRNAコード配列に導入されてよい(以下の実施例3参照)。tracrRNA配列は、約50ヌクレオチドから約300ヌクレオチドの長さの範囲であってよい。種々の態様において、tracrRNAは、約50から約90ヌクレオチド、約90から約110ヌクレオチド、約110から約130ヌクレオチド、約130から約150ヌクレオチド、約150から約170ヌクレオチド、約170から約200ヌクレオチド、約200から約250ヌクレオチド、または約250から約300ヌクレオチドの長さの範囲であってよい。
【0041】
一般的に、操作されたガイドRNAは、crRNA配列がtracrRNA配列に連結されている単一の分子(すなわち、単一のガイドRNAまたはsgRNA)である。いくつかの態様において、しかしながら、操作されたガイドRNAは、2つの別々の分子であってよい。第1の分子は、第2の分子の5’末端と塩基対合することができる3’配列(約6から約20ヌクレオチドを含む)を含むcrRNAを含み、第2の分子は、第1の分子の3’末端と塩基対合することができる5’配列(約6から約20ヌクレオチドを含む)を含むtracrRNAを含む。
【0042】
いくつかの態様において、操作されたガイドRNAのtracrRNA配列は、1つ以上のアプタマー配列を含むように修飾されてよい(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。適当なアプタマー配列は、MCP、PCP、Com、SLBP、FXR1、AP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP-β、TW18、TW19、VK、それらのフラグメント、またはそれらの誘導体から選択されるアダプタータンパク質を結合するものを含む。当業者は、アプタマー配列の長さが変化してよいことを理解する。
【0043】
他の態様において、ガイドRNAは、少なくとも1つの検出可能な標識をさらに含んでよい。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、Halo tags、または適当な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドット、または金粒子であってよい。
【0044】
ガイドRNAは、標準リボヌクレオチドおよび/または修飾リボヌクレオチドを含んでよい。いくつかの態様において、ガイドRNAは、標準または修飾デオキシリボヌクレオチドを含んでよい。ガイドRNAが酵素的に合成される(すなわち、インビボまたはインビトロ)態様において、ガイドRNAは、一般的に、標準リボヌクレオチドを含む。ガイドRNAが化学的に合成される態様において、ガイドRNAは、標準または修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドを含んでよい。修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドは、塩基修飾(例えば、プソイドウリジン、2-チオウリジン、N6-メチルアデノシンなど)および/または糖修飾(例えば、2’-O-メチル、2’-フルオロ、2’-アミノ、ロックド核酸(LNA)など)を含む。ガイドRNAの骨格はまた、ホスホロチオエート結合、ボラノホスフェート結合、またはペプチド核酸を含むように修飾されてよい。
【0045】
特定の態様において、操作されたガイドRNAは、配列番号:31、32、33、34、35、36、37、38、39、40、41、42、43、44、または45と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有する。いくつかの態様において、操作されたCas9ガイドRNAは、配列番号:31、32、33、34、35、36、37、38、39、40、41、42、43、44、または45の配列を有する。
【0046】
(c)PAM配列
上記詳細な操作されたCas9システムは、新規なPAM配列の上流に位置する二本鎖DNAにおける特定の配列を標的とする。操作されたCas9システムによって好ましいPAM配列は、縮重PAMSのライブラリーを使用してインビトロで同定され(実施例1および
図1参照)、ゲノム編集実験後の配列決定により確認した(実施例2参照)。本願明細書に記載されている操作されたCas9システムのそれぞれについてのPAMは、以下の表Aに示されている。
【表A】
* KはGまたはTであり;MはAまたはCであり;RはAまたはGであり;YはCまたはTであり;NはA、C、G、またはTである。
【0047】
(II) 核酸
本開示のさらなる局面は、セクション(I)において上記の操作されたCas9システムをコードする核酸を提供する。システムは、単一の核酸または複数の核酸によってコードされてよい。核酸は、DNAまたはRNA、線状または環状、一本鎖または二本鎖であってよい。RNAまたはDNAは、興味ある真核細胞においてタンパク質への効率的な翻訳のために最適化されたコドンであってよい。コドン最適化プログラムは、フリーウェアとしてまたは市販の供給源から利用できる。
【0048】
いくつかの態様において、核酸は、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、または30のアミノ酸配列と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有するタンパク質をコードする。1つの態様において、操作されたCas9タンパク質をコードする核酸は、配列番号:1、3、5、7、9、11、13、15、17、19、21、23、25、27、または29のDNA配列と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有してよい。1つの態様において、操作されたCas9タンパク質をコードするDNAは、配列番号:1、3、5、7、9、11、13、15、17、19、21、23、25、27、または29のDNA配列を有する。さらなる態様において、核酸は、配列番号:117、118、119、120、121、122、123、または124のアミノ酸配列と少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または少なくとも約99%配列同一性を有するタンパク質をコードする。
【0049】
いくつかの態様において、操作されたCas9タンパク質をコードする核酸はRNAであってよい。RNAは、インビトロで酵素的に合成されてよい。このため、操作されたCas9タンパク質をコードするDNAは、インビトロRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に作動可能に連結されてよい。例えば、プロモーター配列は、T7、T3、またはSP6プロモーター配列またはT7、T3、またはSP6プロモーター配列の変異体であってよい。操作されたタンパク質をコードするDNAは、以下に詳細に説明されているとおりベクターの一部であってよい。このような態様において、インビトロで転写されたRNAは、精製、キャップド、および/またはポリアデニル化されてよい。他の態様において、操作されたCas9タンパク質をコードするRNAは、自己複製RNAの一部であってよい(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)。自己複製RNAは、限られた数の細胞分裂のために自己複製を可能にする一本鎖プラス鎖RNAであり、興味あるタンパク質をコードするように修飾することができる、非感染性の自己複製のベネズエラウマ脳炎(VEE)ウイルスRNAレプリコンに由来してもよい(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)。
【0050】
他の態様において、操作されたCas9タンパク質をコードする核酸はDNAであってよい。DNAコード配列は、興味ある細胞における発現のための少なくとも1つのプロモーターコントロール配列に作動可能に連結されてよい。1つの態様において、DNAコード配列は、細菌(例えば、大腸菌)細胞または真核(例えば、酵母、昆虫、または哺乳動物)細胞における操作されたCas9タンパク質の発現のためのプロモーター配列に作動可能に連結されてよい。適当な細菌プロモーターは、限定することなく、T7プロモーター、lacオペロンプロモーター、trpプロモーター、tacプロモーター(trpおよびlacプロモーターのハイブリッドである)、前記いずれかの変異、および前記いずれかの組合せを含む。適当な真核プロモーターの非限定的な例は、構成的、調節、または細胞もしくは組織特異的なプロモーターを含む。適当な真核構成的プロモーターコントロール配列は、限定はしないが、サイトメガロウイルス前初期プロモーター(CMV)、シミアンウイルス(SV40)プロモーター、アデノウイルス主要後期プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳房腫瘍ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、延長因子(ED1)-アルファプロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらのフラグメント、または前記いずれかの組合せを含む。適当な真核調節プロモーターコントロール配列の例は、限定することなく、熱ショック、金属、ステロイド、抗生物質、またはアルコールによって調節されるものを含む。組織特異的なプロモーターの非限定的な例は、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、NphsIプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーター、およびWASPプロモーターを含む。プロモーター配列は野生型であってよく、またはそれはより効率的または有効な発現のために修飾されてよい。いくつかの態様において、DNAコード配列はまた、ポリアデニル化シグナル(例えば、SV40 polyAシグナル、ウシ成長ホルモン(BGH)polyAシグナルなど)および/または少なくとも1つの転写終結配列に連結されてよい。いくつかの状況において、操作されたCas9タンパク質は、細菌または真核細胞から精製されてよい。
【0051】
さらに他の態様において、操作されたガイドRNAはDNAによってコードされてよい。場合によっては、操作されたガイドRNAをコードするDNAは、インビトロRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に作動可能に連結されてよい。例えば、プロモーター配列は、T7、T3、またはSP6プロモーター配列またはT7、T3、またはSP6プロモーター配列の変異体であってよい。他の例では、操作されたガイドRNAをコードするDNAは、興味ある真核細胞における発現のためのRNAポリメラーゼIII(Pol III)により認識されるプロモーター配列に作動可能に連結されてよい。適当なPol IIIプロモーターの例は、限定はしないが、哺乳動物U6、U3、H1、および7SL RNAプロモーターを含む。
【0052】
種々の態様において、操作されたCas9タンパク質をコードする核酸は、ベクターにおいて存在してよい。いくつかの態様において、ベクターは、操作されたガイドRNAをコードする核酸をさらに含んでよい。適当なベクターは、プラスミドベクター、ウイルスベクター、および自己複製RNAを含む(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)。いくつかの態様において、複合または融合タンパク質をコードする核酸は、プラスミドベクターにおいて存在してよい。適当なプラスミドベクターの非限定的な例は、pUC、pBR322、pET、pBluescript、およびそれらの変異体を含む。他の態様において、複合または融合タンパク質をコードする核酸は、ウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクター、アデノウイルスベクターなど)の一部であってよい。プラスミドまたはウイルスベクターは、さらなる発現コントロール配列(例えば、エンハンサー配列、Kozak配列、ポリアデニル化配列、転写終結配列など)、選択可能なマーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含んでよい。ベクターおよびその使用についてのさらなる情報は、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003 or “Molecular Cloning: A Laboratory Manual” Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001に見ることができる。
【0053】
(III)真核細胞
本開示の別の局面は、セクション(I)において詳細に説明されている少なくとも1つの操作されたCas9システム、および/または、セクション(II)において詳細に説明されている操作されたCas9タンパク質および/または操作されたガイドRNAをコードする少なくとも1つの核酸を含む真核細胞を含む。
【0054】
真核細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物であってよい。適当な真核細胞の例は、セクション(IV)(c)において詳細に説明されている。真核細胞は、インビトロ、エキソビボ、またはインビボであってよい。
【0055】
(IV)染色体配列を修飾するための方法
本開示のさらなる局面は、真核細胞における染色体配列を修飾するための方法を含む。一般的に、方法は、興味ある真核細胞に、セクション(I)において詳細に説明されている少なくとも1つの操作されたCas9システム、および/または、セクション(II)において詳細に説明されている該操作されたCas9タンパク質をコードする少なくとも1つの核酸を導入することを含む。
【0056】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む態様において、染色体配列修飾は、少なくとも1つのヌクレオチドの置換、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入を含んでよい。いくつかの反復において、方法は、操作されたCas9単数のシステムまたは複数のシステムが染色体配列における標的部位の二本鎖破壊を導入し、細胞性DNA修復プロセスによる二本鎖破壊の修復が少なくとも1つのヌクレオチド変化(すなわち、インデル)を導入し、それにより染色体配列を不活性化する(すなわち、遺伝子ノックアウト)ように、真核細胞に、ヌクレアーゼ活性を含む1つの操作されたCas9システムまたはニッカーゼ活性を含みドナーポリヌクレオチドを含まない2つの操作されたCas9システムを導入することを含む。他の反復において、方法は、操作されたCas9単数のシステムまたは複数のシステムが染色体配列における標的部位の二本鎖破壊を導入し、細胞性DNA修復プロセスによる二本鎖破壊の修復が染色体配列における標的部位へのドナーポリヌクレオチドにおける配列の挿入または交換(すなわち、遺伝子修正または遺伝子ノックイン)をもたらすように、真核細胞に、ニッカーゼ活性を含む1つの操作されたCas9システム、またはニッカーゼ活性ならびにドナーポリヌクレオチドを含む2つの操作されたCas9システムを導入することを含む。
【0057】
操作されたCas9タンパク質がエピジェネティック的修飾活性または転写制御活性を含む態様において、染色体配列修飾は、標的部位内または付近で少なくとも1つのヌクレオチドの変換、標的部位内または付近で少なくとも1つのヌクレオチドの修飾、標的部位内または付近で少なくとも1つのヒストンタンパク質の修飾、および/または染色体配列における標的部位内または付近で転写の変化を含んでよい。
【0058】
(a)細胞への導入
上記のとおり、方法は、真核細胞に、少なくとも1つの操作されたCas9システムおよび/または該システムをコードする核酸(および所望のドナーポリヌクレオチド)を導入することを含む。少なくとも1つのシステムおよび/または核酸/ドナーポリヌクレオチドは、種々の手段により興味ある細胞に導入されてよい。
【0059】
いくつかの態様において、細胞は、適当な分子(すなわち、タンパク質、DNA、および/またはRNA)でトランスフェクトされてよい。適当なトランスフェクション方法は、ヌクレオフェクション(nucleofection)(またはエレクトロポレーション)、リン酸カルシウム媒介トランスフェクション、陽イオン性ポリマートランスフェクション(例えば、DEAE-デキストランまたはポリエチレンイミン)、ウイルス形質導入、ビロゾームトランスフェクション、ビリオントランスフェクション、リポソームトランスフェクション、陽イオン性リポソームトランスフェクション、免疫リポソームトランスフェクション、非リポソーム脂質トランスフェクション、デンドリマートランスフェクション、熱ショックトランスフェクション、マグネトフェクション、リポフェクション、遺伝子銃送達、インペールフェクション(impalefection)、ソノポレーション、光学的トランスフェクション、および核酸のプロプライエタリー(proprietary)剤で増強された摂取を含む。トランスフェクション方法は、当分野でよく知られている(例えば、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003または“Molecular Cloning: A Laboratory Manual” Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001参照)。他の態様において、分子は、微量注入により細胞に導入されてよい。例えば、分子は、興味ある細胞の細胞質または核に注入されてよい。細胞に導入される各分子の量は変動してよいが、当業者は適当な量を決定するための手段をよく知っている。
【0060】
種々の分子は、同時にまたは連続して細胞に導入されてよい。例えば、操作されたCas9システム(またはそのコードする核酸)およびドナーポリヌクレオチドは、同時に導入されてよい。あるいは、細胞に、一方が最初に導入されてよく、次に他方が後に導入されてよい。
【0061】
一般的に、細胞は、細胞成長および/または維持のために適当な条件下で維持される。適当な細胞培養条件は、当分野でよく知られており、例えば、Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105:5809-5814; Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104:3055-3060; Urnov et al., Nature, 2005, 435:646-651; およびLombardo et al., Nat. Biotechnol., 2007, 25:1298-1306に記載されている。当業者は、細胞を培養するための方法は、当分野で知られており、細胞型に依存して変化してよく、変化するであろうことを理解している。すべての場合において、日常的な最適化が使用されて、特定の細胞型のための最適な技術を決定することができる。
【0062】
(b)所望のドナーポリヌクレオチド
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む態様において、方法は、少なくとも1つのドナーポリヌクレオチドを細胞に導入することをさらに含んでよい。ドナーポリヌクレオチドは、一本鎖または二本鎖、線状または環状、および/またはRNAまたはDNAであってよい。いくつかの態様において、ドナーポリヌクレオチドは、ベクター、例えば、プラスミドベクターであってよい。
【0063】
ドナーポリヌクレオチドは、少なくとも1つのドナー配列を含む。いくつかの局面において、ドナーポリヌクレオチドのドナー配列は、内因性または天然の染色体配列の修飾バージョンであってよい。例えば、ドナー配列は、操作されたCas9システムによって標的化される配列でまたは付近で染色体配列の一部と本質的に同一であってよいが、少なくとも1つのヌクレオチド変化を含む。したがって、天然配列での組み込みまたは交換時に、標的化される染色体位置での配列は少なくとも1つのヌクレオチド変化を含む。例えば、変化は、1つ以上のヌクレオチドの挿入、1つ以上のヌクレオチドの欠失、1つ以上のヌクレオチドの置換、またはそれらの組合せであってよい。修飾される配列の「遺伝子修正」組み込みの結果として、細胞は、標的化された染色体配列から修飾された遺伝子産物を生産することができる。
【0064】
他の局面において、ドナーポリヌクレオチドのドナー配列は外因性配列であってよい。本願明細書において使用される「外因性」配列は、細胞に対して天然でない配列、または天然の位置が細胞のゲノムにおける異なる位置である配列を指す。例えば、外因性配列は、ゲノムへの組み込み時に、細胞が組み込まれる配列によってコードされるタンパク質を発現することができるように、外因性プロモーターコントロール配列に作動可能に連結されてよいタンパク質コード配列を含んでよい。あるいは、外因性配列は、その発現が内因性プロモーターコントロール配列によって調節されるように、染色体配列に組み込まれてよい。他の反復において、外因性配列は、転写コントロール配列、別の発現コントロール配列、RNAコード配列などであってよい。上記のとおり、染色体配列への外因性配列の組み込むは、「ノックイン」と称される。
【0065】
当業者によって理解されることができるように、ドナー配列の長さは、変化してよく、変化するであろう。例えば、ドナー配列は、長さにおいて数ヌクレオチドから数百ヌクレオチドから数十万ヌクレオチドで変化してよい。
【0066】
典型的に、ドナーポリヌクレオチドにおけるドナー配列は、操作されたCas9システムによって標的化される配列の上流および下流それぞれに位置する配列に対して実質的な配列同一性を有する上流配列および下流配列に隣接している。これらの配列類似性のため、ドナーポリヌクレオチドの上流および下流配列は、ドナー配列が染色体配列に組み込まれて(またはと交換されて)よいように、ドナーポリヌクレオチドおよび標的化される染色体配列間の相同組換えを可能にする。
【0067】
本願明細書において使用される上流配列は、操作されたCas9システムによって標的化される配列の上流の染色体配列と実質的な配列同一性を共有する核酸配列を指す。同様に、下流配列は、操作されたCas9システムによって標的化される配列の下流の染色体配列と実質的な配列同一性を共有する核酸配列を指す。本願明細書において使用される「実質的な配列同一性」なるフレーズは、少なくとも約75%配列同一性を有する配列を指す。したがって、ドナーポリヌクレオチドにおける上流および下流配列は、標的配列に対する上流または下流配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%配列同一性を有してよい。例示的な態様において、ドナーポリヌクレオチドにおける上流および下流の配列は、操作されたCas9システムによって標的化される配列に対する上流または下流の染色体配列と約95%または100%配列同一性を有してよい。
【0068】
いくつかの態様において、上流配列は、操作されたCas9システムによって標的化される配列のすぐ上流に位置する染色体配列と実質的な配列同一性を共有する。他の態様において、上流配列は、標的配列から上流に約百(100)ヌクレオチド内に位置される染色体配列と実質的な配列同一性を共有する。したがって、例えば、上流配列は、標的配列から上流に約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチドに位置される染色体配列と実質的な配列同一性を共有してよい。いくつかの態様において、下流配列は、操作されたCas9システムによって標的化される配列のすぐ下流に位置する染色体配列と実質的な配列同一性を共有する。他の態様において、下流配列は、標的配列から下流に約百(100)ヌクレオチド内に位置される染色体配列と実質的な配列同一性を共有する。したがって、例えば、下流配列は、標的配列から下流に約1から約20、約21から約40、約41から約60、約61から約80、または約81から約100ヌクレオチドに位置される染色体配列と実質的な配列同一性を共有してよい。
【0069】
各上流または下流配列は、長さにおいて約20ヌクレオチドから約5000ヌクレオチドの範囲であってよい。いくつかの態様において、上流および下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800、または5000ヌクレオチドを含んでよい。特定の態様において、上流および下流配列は、長さにおいて約50から約1500ヌクレオチドの範囲であってよい。
【0070】
(c)細胞型
種々の真核細胞は、本願明細書に記載されている方法における使用のために適当である。例えば、細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、昆虫細胞、植物細胞、酵母細胞、または単細胞真核生物であってよい。いくつかの態様において、細胞は、1つの細胞胚であってよい。例えば、非ヒト哺乳動物胚は、ラット、ハムスター、齧歯動物、ウサギ、ネコ、イヌ、ヒツジ、ブタ、ウシ、ウマ、および霊長類胚を含む。さらなる他の態様において、細胞は、幹細胞、例えば、胚幹細胞、ES様幹細胞、胎児幹細胞、成体幹細胞などであってよい。1つの態様において、幹細胞は、ヒト胚幹細胞ではない。さらに、幹細胞は、その内容をここに包含されるWO2003/046141またはChung et al. (Cell Stem Cell, 2008, 2:113-117)に記載されている技術によって作られるものを含んでよい。細胞は、インビトロで(すなわち、培養物において)、エキソビボで(すなわち、生物体から単離された組織内で)、またはインビボで(すなわち、生物体内で)あってよい。例示的な態様において、細胞は、哺乳動物細胞または哺乳動物細胞系である。特定の態様において、細胞は、ヒト細胞またはヒト細胞系である。
【0071】
適当な哺乳動物細胞または細胞系の非限定的な例は、ヒト胚腎臓細胞(HEK293、HEK293T);ヒト頸部癌腫細胞(HELA);ヒト肺細胞(W138);ヒト肝細胞(Hep G2);ヒトU2-OS骨肉腫細胞、ヒトA549細胞、ヒトA-431細胞、およびヒトK562細胞;チャイニーズハムスター卵巣(CHO)細胞、ベイビーハムスター腎臓(BHK)細胞;マウス骨髄腫NS0細胞、マウス胎児繊維芽細胞3T3細胞(NIH3T3)、マウスBリンパ腫A20細胞;マウス黒色腫B16細胞;マウス筋芽細胞C2C12細胞;マウス骨髄腫SP2/0細胞;マウス胎児間葉性C3H-10T1/2細胞;マウス癌腫CT26細胞、マウス前立腺DuCuP細胞;マウス乳房EMT6細胞;マウス肝臓癌Hepa1c1c7細胞;マウス骨髄腫J5582細胞;マウス上皮性MTD-1A細胞;マウス心筋MyEnd細胞;マウス腎臓RenCa細胞;マウス膵臓RIN-5F細胞;マウス黒色腫X64細胞;マウスリンパ腫YAC-1細胞;ラットグリア芽腫9L細胞;ラットBリンパ腫RBL細胞;ラット神経芽腫B35細胞;ラット肝臓癌細胞(HTC);buffaloラット肝臓BRL 3A細胞;イヌ腎臓細胞(MDCK);イヌ乳房(CMT)細胞;ラット骨肉腫D17細胞;ラット単球/マクロファージDH82細胞;サル腎臓SV-40形質転換繊維芽細胞(COS7)細胞;サル腎臓CVI-76細胞;アフリカミドリザル腎臓(VERO-76)細胞を含む。哺乳動物細胞系の広範なリストは、アメリカン・タイプ・カルチャー・コレクション カタログ(ATCC、Manassas、VA)において見つけることができる。
【0072】
(V)適用
本願明細書に記載されている組成物および方法は、種々の治療、診断、産業、および研究用途において使用することができる。いくつかの態様において、本開示は、遺伝子の機能をモデル化および/または研究する、興味ある遺伝的またはエピジェネティック状態を研究する、または種々の疾患または障害に関与する生化学的経路を研究するために、細胞、動物、または植物における興味ある染色体配列を修飾するために使用することができる。例えば、疾患または障害と関連する1つ以上の核酸配列の発現が改変されている疾患または障害をモデル化するトランスジェニック生物を、作成することができる。疾患モデルは、生物体における変異の効果を研究する、疾患の発症および/または進行を研究する、疾患における薬学的に活性な化合物の効果を研究する、および/または起こりうる遺伝子治療戦略の有効性を評価するために使用することができる。
【0073】
他の態様において、組成物および方法は、特定の生物学的プロセスに関与する遺伝子の機能およびどのような遺伝子発現における変化が生物学的プロセスに影響することができるかを研究するために使用することができる、効率的なおよびコスト的に有効な機能性ゲノムスクリーニングを実施する、または細胞表現型と共にゲノム遺伝子座のサチュレイティング(saturating)またはディープスキャニング(deep scanning)突然変異誘発を実施するために使用することができる。サチュレイティングまたはディープスキャニング突然変異誘発は、例えば、遺伝子発現、薬剤耐性、および疾患の反転のために必要な機能要素の重要な最小限の特徴および別々の脆弱性を決定するために使用することができる。
【0074】
さらなる態様において、本願明細書に記載されている組成物および方法は、疾患または障害の存在を確立するための診断試験のために、および/または処置選択肢を決定することにおける使用のために使用することができる。適当な診断試験の例は、癌細胞における特定の変異の検出(例えば、EGFR、HER2などにおける特定の変異)、特定の疾患と関連する特定の変異の検出(例えば、トリヌクレオチドリピート、鎌状細胞疾患と関連するβ-グロブリンにおける変異、特定のSNPなど)、肝炎の検出、ウイルスの検出(例えば、Zika)などを含む。
【0075】
さらなる態様において、本願明細書に記載されている組成物および方法は、特定の疾患または障害と関連する遺伝子変異を正す、例えば、鎌状赤血球疾患またはサラセミアと関連するグロブリン遺伝子変異を正す、重症複合免疫不全(SCID)と関連するアデノシンデアミナーゼ遺伝子における変異を正す、ハンチントン病の原因遺伝子であるHTTの発現を低下させる、または網膜色素変性の処置のためのロドプシン遺伝子における変異を正すために使用することができる。かかる修飾は、エキソビボで細胞において作られてよい。
【0076】
さらに他の態様において、本願明細書に記載されている組成物および方法は、改善された特性または環境ストレスに対する耐性の増加を有する作物植物を生成するために使用することができる。本開示はまた、改善された特性を有する家畜または生産動物を生成するために使用することができる。例えば、ブタは、とりわけ再生医療または異種移植において、生物医学モデルとして魅力的な多くの機能を有する。
【0077】
定義
他に定義されていない限り、本願明細書において使用される全ての専門および科学用語は、本願発明が属する当業者によって一般的に理解される意味を有する。以下の文献は、本願発明において使用される多くの用語の一般的な定義を当業者に提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991);およびHale & Marham, The Harper Collins Dictionary of Biology (1991)。本願明細書において使用される以下の用語は、別段の指定がない限り、それらに帰する意味を有する。
【0078】
本開示またはその好ましい態様の要素を紹介するとき、冠詞「a」、「an」、「the」および「said」は、要素の1つ以上が存在することを意味することを意図する。「含む」、「含有する」および「有する」なる用語は、包括的であることを意図し、リストされた要素以外の追加の要素があってもよいことを意味する。
【0079】
「約」なる用語は、数値、例えばxに関して使用されるとき、x±5%を意味する。
【0080】
本願明細書において使用される「相補的」または「相補性」なる用語は、特定の水素結合を介する塩基対合による二本鎖核酸の会合を指す。塩基対合は、標準のワトソンクリック塩基対合(例えば、相補的配列3’-T C A G-5’との5’-A G T C-3’対)であり得る。塩基対合はまた、フーグスティーン型(Hoogsteen)または逆フーグスティーン型水素結合であってよい。相補性は、典型的に二本鎖領域に対して測定され、したがって例えばオーバーハングを除く。二本鎖領域の2つの鎖間の相補性は、部分的であってよく、塩基の一部(例えば、70%)のみが相補的であるとき、パーセンテージ(例えば、70%)として表現されてよい。相補的でない塩基は「不一致」である。相補性はまた、二本鎖領域における全ての塩基が相補的であるとき、完全(すなわち、100%)であってよい。
【0081】
本願明細書において使用される「CRISPR/Casシステム」または「Cas9システム」なる用語は、Cas9タンパク質(すなわち、ヌクレアーゼ、ニッカーゼ、または触媒的に不活性型のタンパク質)およびガイドRNAを含む複合体を指す。
【0082】
本願明細書において使用される「内因性配列」なる用語は、細胞に対して天然の染色体配列を指す。
【0083】
本願明細書において使用される「外因性」なる用語は、細胞に対して天然でない配列、または細胞のゲノムにおける天然の位置が異なる染色体位置である染色体配列を指す。
【0084】
本願明細書において使用される「遺伝子」は、遺伝子産物をコードするDNA領域(エクソンおよびイントロンを含む)、ならびに調節配列がコードおよび/または転写配列に隣接しているか否かにかかわらず、遺伝子産物の生産を調節する全てのDNA領域を指す。したがって、遺伝子は、必ずしも限定されないが、プロモーター配列、ターミネーター、翻訳調節配列、例えばリボソーム結合部位および内部リボソーム侵入部位、エンハンサー、サイレンサー、インシュレーター(insulator)、境界要素(boundary element)、複製起点、マトリックス付着部位(matrix attachment site)、および遺伝子座調節領域を含む。
【0085】
「異種」なる用語は、興味ある細胞に対して内因性または天然でない実体(entity)を指す。例えば、異種タンパク質は、外因性に導入された核酸配列のような外因性供給源に由来するかまたは当初由来されたタンパク質を指す。場合によっては、異種タンパク質は、通常、興味ある細胞によって産生されない
【0086】
「ニッカーゼ」なる用語は、二本鎖核酸配列の一本鎖を切断する(すなわち、二本鎖配列にニックを入れる)酵素を指す。例えば、二本鎖切断活性を有するヌクレアーゼは、ニッカーゼとして機能し、二本鎖配列の一本鎖のみを切断するように、変異および/または欠失によって修飾されてよい。
【0087】
本願明細書において使用される「ヌクレアーゼ」なる用語は、二本鎖核酸配列の両方の鎖を切断する酵素を指す。
【0088】
「核酸」および「ポリヌクレオチド」なる用語は、線状または環状構造における、および一本鎖または二本鎖形態のいずれかにおけるデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指す。本開示の目的のために、これらの用語は、ポリマーの長さに対して限定するとして解釈されるべきではない。この用語は、天然ヌクレオチドの既知のアナログ、ならびに塩基、糖、および/またはリン酸部分(例えば、ホスホロチオエート骨格)で修飾されているヌクレオチドを包含してよい。一般的に、特定のヌクレオチドのアナログは、同じ塩基対特異性を有する;すなわち、AのアナログはTと塩基対を形成する。
【0089】
「ヌクレオチド」なる用語は、デオキシリボヌクレオチドまたはリボヌクレオチドを指す。ヌクレオチドは、標準ヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジン、およびウリジン)、ヌクレオチド異性体、またはヌクレオチドアナログであってよい。ヌクレオチドアナログは、修飾されたプリンまたはピリミジン塩基または修飾されたリボース部分を有するヌクレオチドを指す。ヌクレオチドアナログは、天然ヌクレオチド(例えば、イノシン、プソイドウリジンなど)または非天然ヌクレオチドであってよい。ヌクレオチドの糖または塩基部分における修飾の非限定的な例は、アセチル基、アミノ基、カルボキシル基、カルボキシメチル基、ヒドロキシル基、メチル基、ホスホリル基、およびチオール基の付加(または除去)、ならびに塩基の炭素および窒素原子の他の原子(例えば、7-デアザプリン)での置換を含む。ヌクレオチドアナログはまた、ジデオキシヌクレオチド、2’-O-メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)、およびモルホリノを含む。
【0090】
「ポリペプチド」および「タンパク質」なる用語は、アミノ酸残基のポリマーを指すように互換的に使用される。
【0091】
「標的配列」、「標的染色体配列」および「標的部位」なる用語は、操作されたCas9システムが標的とする染色体DNAにおける特定の配列、および操作されたCas9システムがDNAまたはDNAと関連するタンパク質を修飾する部位を指すように互換的に使用される。
【0092】
核酸およびアミノ酸配列同一性を決定するための技術は、当分野で知られている。典型的には、かかる技術は、遺伝子に対するmRNAのヌクレオチド配列を決定することおよび/またはそれによりコードされるアミノ酸配列を決定すること、およびこれらの配列と第2のヌクレオチドまたはアミノ酸配列とを比較することを含む。ゲノム配列もまた、この様式において決定し、比較してもよい。一般的に、同一性は、2つのポリヌクレオチドまたはポリペプチド配列のそれぞれの正確なヌクレオチド-対-ヌクレオチドまたはアミノ酸-対-アミノ酸対応を指す。2つ以上の配列(ポリヌクレオチドまたはアミノ酸)は、これらの同一性パーセントを決定することによって比較してもよい。核酸またはアミノ酸配列のいずれであれ、2つの配列の同一性パーセントは、2つの整列された配列間の正確な一致の数を、より短い方の配列の長さで割り、100を掛けたものである。核酸配列のおおよそのアラインメントは、Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)の局所相同性アルゴリズムによって提供される。このアルゴリズムは、Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USAによって開発され、Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)によって正規化されるスコアリングマトリックスを使用することによってアミノ酸配列に適用することができる。配列の同一性パーセントを決定するためのこのアルゴリズムの例示的な実施は、「BestFit」有用性用途においてGenetics Computer Group (Madison, Wis.)により提供される。配列間の同一性または類似性パーセントを計算するための他の適当なプログラムは、一般的に当分野で知られている、例えば、別のアラインメントプログラムはデフォルトパラメーターで使用されるBLASTである。例えば、BLASTNおよびBLASTPは、次のデフォルトパラメーターを使用して使用することができる:genetic code=standard; filter=none; strand=both; cutoff=60; expect=10; Matrix=BLOSUM62; Descriptions=50 sequences; sort by=HIGH SCORE; Databases=non-redundant, GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR。これらのプログラムの詳細は、GenBankウェブサイトにて見ることができる。
【0093】
本願発明の範囲から逸脱することなく、上記細胞および方法に様々な変更を行うことができるため、上記の説明および以下に示す実施例に含まれるすべての事項は、例示的として解釈され、限定的な意味ではないと解釈されることを意図する。
本開示は、例えば、以下に関する。
[項1]
操作されたCas9タンパク質および操作されたガイドRNAを含むシステムであって、操作されたガイドRNAは、操作されたCas9タンパク質と複合体を形成するように設計され、操作されたガイドRNAは、二本鎖配列において標的配列とハイブリダイズするように設計された5’ガイド配列を含み、標的配列は、プロトスペーサー隣接モチーフ(PAM)に対して5’であり、PAMは、表Aに列挙されている配列を有する、システム。
[項2]
操作されたCas9タンパク質が、その野生型対応物と比較して少なくとも1つの修飾を含む、項1に記載のシステム。
[項3]
少なくとも1つの修飾が、少なくとも1つの異種ドメインの付加を含む、項2に記載のシステム。
[項4]
少なくとも1つの異種ドメインが、核局在化シグナル、細胞膜透過ドメイン、マーカードメイン、クロマチン調節モチーフ、エピジェネティック修飾ドメイン、転写制御ドメイン、RNAアプタマー結合ドメイン、またはそれらの組合せである、項2または3に記載のシステム。
[項5]
少なくとも1つの修飾が、1つ以上のアミノ酸の置換、1つ以上のアミノ酸の挿入、1つ以上のアミノ酸の欠失、またはそれらの組合せを含む、項2に記載のシステム。
[項6]
少なくとも1つの修飾が、RuvCドメイン、HNHドメイン、RECドメイン、PAM相互作用ドメイン、またはそれらの組合せ内にある、項5に記載のシステム。
[項7]
操作されたCas9タンパク質が、ヌクレアーゼであり二本鎖配列の両方の鎖を切断するか、ニッカーゼであり二本鎖配列の一本鎖を切断するか、または、ヌクレアーゼまたはニッカーゼ活性を有さない、項1から6のいずれかに記載のシステム。
[項8]
操作されたガイドRNAが、単一の分子である、項1から7のいずれかに記載のシステム。
[項9]
操作されたガイドRNA配列が、操作されたガイドRNA内で塩基対形成を容易にするように最適化される、操作されたガイドRNA内で塩基対形成を最小限にする、操作されたガイドRNAの安定性を増加させる、真核細胞において操作されたガイドRNAの転写を容易にする、またはそれらの組合せである、項1から8のいずれかに記載のシステム。
[項10]
操作されたCas9タンパク質が、バチルス・スミスイ(Bacillus smithii)、ラクトバチルス・ラムノサス(Lactobacillus rhamnosus)、パラサテレラ・エクスクレメンティホミニス(Parasutterella excrementihominis)、マイコプラズマ・カニス(Mycoplasma canis)、マイコプラズマ・ガリセプティカム(Mycoplasma gallisepticum)、アッカーマンシア・グリカニフィラ(Akkermansia glycaniphila)、アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)、オエノコッカス・キタハラエ(Oenococcus kitaharae)、ビフィドバクテリウム・ボンビ(Bifidobacterium bombi)、アシッドサーマス・セルロリティカス(Acidothermus cellulolyticus)、アリサイクロバチラス・ヘスペリダム(Alicyclobacillus hesperidum)、ウォリネラ・サクシノゲネス(Wolinella succinogenes)、ニトラティフラクター・サルスギニス(Nitratifractor salsuginis)、ラルストニア・シジギ(Ralstonia syzygii)、またはコリネバクテリウム・ジフテリア(Corynebacterium diphtheria)に由来する、項1から9のいずれかに記載のシステム。
[項11]
操作されたCas9タンパク質がバチルス・スミスイに由来し、それが認識するPAM配列が5’-NNNNCAAA-3’である、操作されたCas9タンパク質がラクトバチルス・ラムノサスに由来し、それが認識するPAM配列が5’-NGAAA-3’である、操作されたCas9タンパク質がパラサテレラ・エクスクレメンティホミニスに由来し、それが認識するPAM配列が5’-NGG-3’である、操作されたCas9タンパク質がマイコプラズマ・カニスに由来し、それが認識するPAM配列が5’-NNGG-3’である、操作されたCas9タンパク質がマイコプラズマ・ガリセプティカムに由来し、それが認識するPAM配列が5’-NNAAT-3’である、操作されたCas9タンパク質がアッカーマンシア・グリカニフィラに由来し、それが認識するPAM配列が5’-NNNRTA-3’である、操作されたCas9タンパク質がアッカーマンシア・ムシニフィラに由来し、それが認識するPAM配列が5’-MMACCA-3’である、操作されたCas9タンパク質がオエノコッカス・キタハラエに由来し、それが認識するPAM配列が5’-NNG-3’である、操作されたCas9タンパク質がビフィドバクテリウム・ボンビに由来し、それが認識するPAM配列が5’-NNNNGRY-3’である、操作されたCas9タンパク質がアシッドサーマス・セルロリティカスに由来し、それが認識するPAM配列が5’-NGG-3’である、操作されたCas9タンパク質がアリサイクロバチラス・ヘスペリダムに由来し、それが認識するPAM配列が5’-NGG-3’である、操作されたCas9タンパク質がウォリネラ・サクシノゲネスに由来し、それが認識するPAM配列が5’-NGG-3’である、操作されたCas9タンパク質がニトラティフラクター・サルスギニスに由来し、それが認識するPAM配列が5’-NRGNK-3’である、操作されたCas9タンパク質がラルストニア・シジギに由来し、それが認識するPAM配列が5’-GGGRG-3’である、または、操作されたCas9タンパク質がコリネバクテリウム・ジフテリアに由来し、それが認識するPAM配列が5’-NNAMMMC-3’である、ここでKはGまたはTであり;MはAまたはCであり:NはA、C、G、またはTであり;RはAまたはGであり;YはCまたはTである、項1から10のいずれかに記載のシステム。
[項12]
操作されたCas9タンパク質が、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、117、118、119、120、121、122、123、または124に対して少なくとも約90%配列同一性を有するアミノ酸配列を有する、項1から11のいずれかに記載のシステム。
[項13]
操作されたCas9タンパク質が、配列番号:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、117、118、119、120、121、122、123、または124に示されているアミノ酸配列を有する、項1から12のいずれかに記載のシステム。
[項14]
複数の核酸が、操作されたCas9タンパク質をコードする少なくとも1つの核酸、および操作されたガイドRNAをコードする少なくとも1つの核酸を含む、項1から13のいずれかに記載のシステムをコードする複数の核酸。
[項15]
操作されたCas9タンパク質をコードする少なくとも1つの核酸がRNAである、項14に記載の複数の核酸。
[項16]
操作されたCas9タンパク質をコードする少なくとも1つの核酸がDNAである、項14に記載の複数の核酸。
[項17]
操作されたCas9タンパク質をコードする少なくとも1つの核酸が、真核細胞における発現のために最適化されたコドンである、項14から16のいずれかに記載の複数の核酸。
[項18]
真核細胞が、ヒト細胞、非ヒト哺乳動物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、植物細胞、または単細胞真核生物である、項17に記載の複数の核酸。
[項19]
操作されたガイドRNAをコードする少なくとも1つの核酸がDNAである、項14に記載の複数の核酸。
[項20]
操作されたCas9タンパク質をコードする少なくとも1つの核酸が、インビトロRNA合成または細菌細胞におけるタンパク質発現のためのファージプロモーター配列に作動可能に連結しており、操作されたガイドRNAをコードする少なくとも1つの核酸が、インビトロRNA合成のためのファージプロモーター配列に作動可能に連結している、項14から19のいずれかに記載の複数の核酸。
[項21]
操作されたCas9タンパク質をコードする少なくとも1つの核酸が、真核細胞における発現のための真核プロモーター配列に作動可能に連結しており、操作されたガイドRNAをコードする少なくとも1つの核酸が、真核細胞における発現のための真核プロモーター配列に作動可能に連結している、項14から19のいずれかに記載の複数の核酸。
[項22]
項14から21のいずれかに記載の複数の核酸を含む、少なくとも1つのベクター。
[項23]
プラスミドベクター、ウイルスベクター、または自己複製ウイルスRNAレプリコンである、項22に記載の少なくとも1つのベクター。
[項24]
項1から13のいずれかに定義された操作されたCas9タンパク質および操作されたガイドRNAを含む少なくとも1つのシステム、項14から21のいずれかに定義された少なくとも1つの核酸、または項22または23に定義された少なくとも1つのベクター、を含む真核細胞。
[項25]
ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、または単細胞真核生物である、項24に記載の真核細胞。
[項26]
インビボ、エキソビボ、またはインビトロである、項24または25に記載の真核細胞。
[項27]
真核細胞に、項1から13のいずれかに定義された操作されたCas9タンパク質および操作されたガイドRNAを含む少なくとも1つのシステム、項14から21のいずれかに定義された少なくとも1つの核酸、または項22または23に定義された少なくとも1つのベクター、および所望により、少なくとも1つのドナーポリヌクレオチドを導入することを含む、真核細胞における染色体配列を修飾するための方法であって、少なくとも1つの操作されたガイドRNAは、染色体配列の修飾が起こるように染色体配列における標的部位に少なくとも1つの操作されたCas9タンパク質をガイドする、方法。
[項28]
修飾が、少なくとも1つのヌクレオチドの置換、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入、少なくとも1つのヌクレオチドの変換、少なくとも1つのヌクレオチドの修飾、少なくとも関連したヒストンタンパク質の修飾、またはそれらの組合せを含む、項27に記載の方法。
[項29]
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を有し、少なくとも1つのドナーポリヌクレオチドが細胞に導入されず、修飾が少なくとも1つのインデルを含む、項27または28に記載の方法。
[項30]
修飾が染色体配列の不活性化を含む、項29に記載の方法。
[項31]
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を有し、少なくとも1つのドナーポリヌクレオチドが細胞に導入され、修飾が染色体配列における少なくとも1つのヌクレオチドの変化を含む、項27または28に記載の方法。
[項32]
少なくとも1つのドナーポリヌクレオチドが、染色体配列における標的部位付近の配列と比較して少なくとも1つのヌクレオチド変化を有するドナー配列である、項31に記載の方法。
[項33]
少なくとも1つのドナーポリヌクレオチドが、外因性配列に対応するドナー配列を含む、項31に記載の方法。
[項34]
ドナー配列が、染色体配列における標的部位の上流および下流に位置する配列に対して実質的な配列同一性を有する配列に隣接している、項32または33に記載の方法。
[項35]
ドナー配列が、少なくとも1つの操作されたCas9タンパク質により生成されるオーバーハングと適合性のある短いオーバーハングに隣接している、項32または33に記載の方法。
[項36]
真核細胞が、ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳動物脊椎動物細胞、無脊椎動物細胞、または単細胞真核生物である、項27から35のいずれかに記載の方法。
[項37]
真核細胞がインビボ、エキソビボ、またはインビトロである、項27から36のいずれかに記載の方法。
[項38]
少なくとも1つのクロマチン調節モチーフに連結したCas9タンパク質を含む融合タンパク質であって、Cas9タンパク質は、バチルス・スミスイ、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、マイコプラズマ・カニス、マイコプラズマ・ガリセプティカム、アッカーマンシア・グリカニフィラ、アッカーマンシア・ムシニフィラ、オエノコッカス・キタハラエ、ビフィドバクテリウム・ボンビ、アシッドサーマス・セルロリティカス、アリサイクロバチラス・ヘスペリダム、ウォリネラ・サクシノゲネス、ニトラティフラクター・サルスギニス、ラルストニア・シジギ、またはコリネバクテリウム・ジフテリアのCas9タンパク質である、融合タンパク質。
[項39]
少なくとも1つのクロマチン調節モチーフが、高移動度グループ(HMG)ボックス(HMGB)DNA結合ドメイン、HMGヌクレオソーム結合(HMGN)タンパク質、ヒストンH1変異体に由来する中央球状ドメイン、クロマチンリモデリング複合体タンパク質に由来するDNA結合ドメイン、またはそれらの組合せである、項38に記載の融合タンパク質。
[項40]
少なくとも1つのクロマチン調節モチーフが、HMGB1ボックスAドメイン、HMGN1タンパク質、HMGN2タンパク質、HMGN3aタンパク質、HMGN3bタンパク質、ヒストンH1中央球状ドメイン、模倣スイッチ(ISWI)タンパク質DNA結合ドメイン、クロモドメイン-ヘリカーゼ-DNAタンパク質1(CHD1)DNA結合ドメイン、またはそれらの組合せである、項38または39に記載の融合タンパク質。
[項41]
少なくとも1つのクロマチン調節モチーフが、Cas9タンパク質に、化学結合を介して直接的に、リンカーを介して間接的に、またはそれらの組合せで連結している、項38から40のいずれかに記載の融合タンパク質。
[項42]
少なくとも1つのクロマチン調節モチーフが、Cas9タンパク質に、そのN-末端、C-末端、内部位置、またはそれらの組合せで連結している、項38から41のいずれかに記載の融合タンパク質。
[項43]
少なくとも1つの核局在化シグナルをさらに含む、項38から42のいずれかに記載の融合タンパク質。
[項44]
少なくとも1つの、少なくとも1つの細胞膜透過ドメイン、少なくとも1つのマーカードメイン、またはそれらの組合せをさらに含む、項38から43のいずれかに記載の融合タンパク質。
[項45]
融合タンパク質が、配列番号:117、118、119、120、121、122、123、または124に対して少なくとも90%配列同一性を有するアミノ酸配列を有する、項38から44のいずれかに記載の融合タンパク質。
[項46]
融合タンパク質が、配列番号:117、118、119、120、121、122、123、または124に示されているアミノ酸配列を有する、項38から45のいずれかに記載の融合タンパク質。
【実施例】
【0094】
実施例
以下の実施例は、本開示の特定の局面を説明する。
【0095】
実施例1:Cas9オルソログによる標的DNA切断のためのPAM要件の決定
バチルス・スミスイ、ラクトバチルス・ラムノサス、パラサテレラ・エクスクレメンティホミニス、マイコプラズマ・カニス、マイコプラズマ・ガリセプティカム、アッカーマンシア・グリカニフィラ、アッカーマンシア・ムシニフィラ、オエノコッカス・キタハラエ、ビフィドバクテリウム・ボンビ、アシッドサーマス・セルロリティカス、アリサイクロバチラス・ヘスペリダム、ウォリネラ・サクシノゲネス、ニトラティフラクター・サルスギニス、ラルストニア・シジギ、およびコリネバクテリウム・ジフテリア由来のCas9オルソログは、ヒト細胞において発現のために最適化され、C末端にてSV40大型T抗原核局在化(NLS)でタグ化されたコドンであった(配列番号:1-30;以下の表6参照)。各オルソログの発現は、ヒトサイトメガロウイルス(CMV)前初期エンハンサーおよびプロモーターによって駆動された。各オルソログのためのCRISPR RNA(crRNA)および推定トランス活性化crRNA(tracrRNA)を、単一のガイドRNA(sgRNA)を形成するように互いに結合させた(配列番号:31-45;以下の表6参照)。各sgRNAの発現は、ヒトU6プロモーターによって駆動された。インビトロで転写されたsgRNAは、インビトロ消化用のサプリメントとしてT7プロモータータグ付きPCR鋳型から調製された。
【0096】
ヒトK562細胞を、ヌクレオフェクション(nucleofection)によりCas9をコードするプラスミドおよびsgRNA発現プラスミドでトランスフェクトした。各トランスフェクションは、200万の細胞、5μgのCas9をコードするプラスミドDNA、および3μgのsgRNA発現プラスミドDNAからなった。細胞をトランスフェクションの約24時間後に回収し、氷冷PBSバッファーで洗浄し、4℃冷室で30分間一定攪拌しながら150μLの溶解溶液(20mM HEPES、pH7.5;100mM KCl;5mM MgCl2、1mM DTT、5% グリセロール、0.1% Triton X-100、1x プロテアーゼインヒビター)に溶解した。4℃で16,000 x gで2分間遠心分離して残留細胞残屑を除去することによって上清を調製し、プラスミドDNA PAMライブラリーのインビトロ消化のためのCas9 RNPの供給源として使用した。ライブラリーは、以下の配置:5’-GTACAAACGGCAGAAGCTGGNNNNNNNN-3’(配列番号:46)でのプロトスペーサーによりそれぞれすぐに始まる48の縮退PAMを含んだ。各インビトロ消化は、20μLの反応容量において、10μLの細胞溶解物上清、2μLの5x 消化バッファー(100mM HEPES、pH7.5;500mM KCl;25mM MgCl2;5mM DTT;25% グリセロール)、800ngのPAMライブラリーDNA、および20pmolのインビトロで転写されたsgRNAサプリメントからなった。反応を37℃で30分間維持し、次にPCR精製キットで精製した。Illumina NextSeq配列決定ライブラリーを消化された生成物から調製し、ディープシーケンスに付した。ディープシーケンスデータをWeblogoプログラムを使用して分析し、各Cas9オルソログのためのPAM要件を推測した。
【0097】
結果は、
図1において要約されている。結果は、インビトロ標的DNA切断のためのAおよび/またはTを含むPAMを使用するいくつかのCas9オルソログを明らかにした。これらのCas9オルソログは、ATリッチゲノム部位を標的とする手段を提供することができた。結果はまた、GCリッチゲノム部位を標的とするために適当なPAMを使用するいくつかのCas9オルソログを明らかにした。これらのCas9オルソログは、GCリッチゲノム部位におけるSpyCas9に代替の標的スキームを提供し、標的化の分解能および特異性を向上させることができた。
【0098】
実施例2:バチルス・スミスイCas9(BsmCas9)およびラクトバチルス・ラムノサスCas9(LrhCas9)を使用するゲノム修飾
図1および表A(上記)に示されるとおり、小さなBsmCas9(1095aa)(配列番号:2)およびLrhCas9(配列番号:4)は、標的DNA結合のために、それぞれ5’-NNNNCAAA-3’PAMおよび5’-NGAAA-3’PAMを使用する。これらの新規なPAMの使用は、ATリッチゲノム部位を標的とする手段を提供する。遺伝子編集を実証するために、ヒトK562細胞(1x10
6)に5μgのCas9をコードするプラスミドDNAおよび3μgのsgRNA発現プラスミドDNAをヌクレオフェクトした。標的化ゲノム部位は、ヒトチロシン-タンパク質ホスファターゼ非受容体型2(PTN2)遺伝子座、ヒトの空のスピラクル(spiracles)ホメオボックス1(EMX1)遺伝子座、ヒトプログラム細胞死1リガンド1(PD1L1)遺伝子座、ヒトAAVS1セーフハーバー遺伝子座、ヒトシトクロムp450酸化還元酵素(POR)遺伝子座、およびヒト核受容体サブファミリー1グループIメンバー3(CAR)遺伝子座を含む。ゲノムDNAをトランスフェクションの3日後にDNA抽出溶液(QuickExtract
TM)を使用して調製し、標的化ゲノム領域をそれぞれPCR増幅した(JumpStart Taq
TM ReadyMix
TM)。PCRプライマーは、表1に列挙される。
【表1】
【0099】
増幅は、以下の条件を使用して実施した:最初の変性のための98℃で2分の1サイクル;98℃で15秒、62℃で30秒、および72℃で45秒の34サイクル;72℃で5分の1サイクル;および4℃で保持。PCR産物をCel-1ヌクレアーゼで消化し、10%アクリルアミドゲルで分離した。標的化変異率を、ImageJを使用して測定し、パーセント挿入および/または欠失(%インデル)として示した。結果は、表2において要約されている。これらの結果は、両方のCas9オルソログが5’-NNNNCAAA-3’PAM(BsmCas9)または5’-NGAAA-3’PAM(LrhCas9)を使用してヒト細胞における内因性ゲノム部位を編集することができたということを証明する。
【表2】
【0100】
実施例3:クロマチン調節モチーフとの融合によるパラサテレラ・エクスクレメンティホミニスCas9(PexCas9)の改善
パラサテレラ・エクスクレメンティホミニスCas9(PexCas9-NLS)(配列番号:6)を、TGSGリンカー(配列番号:109)を使用してN末端でヒトHMGN1ペプチド(配列番号:72)とおよびLEGGGSリンカー(配列番号:108)を使用してC末端でヒトHMGB1ボックスAペプチド(PexCas9-HN1HB1融合物;配列番号:117)またはヒトヒストンH1中央球状ドメインペプチド(PexCas9-HN1H1G;配列番号:118)のいずれかとの融合によって修飾した。
【表3】
【0101】
ヒトK562細胞(1x10
6)を、モル当量(それぞれ5および5.4μg)においてPexCas9-NLS、PexCas9-HN1HB1融合物、またはPexCas9-HN1H1G融合物をコードするプラスミドDNAおよびヒトシトクロムp450酸化還元酵素(POR)遺伝子座においてゲノム部位を標的化するための3μgのsgRNAプラスミドでトランスフェクトした。ゲノムDNAをトランスフェクションの3日後にDNA抽出溶液(QuickExtract
TM)を使用して調製し、標的化ゲノム領域をフォワードプライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号:55)およびリバースプライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号:56)を使用してPCR増幅した。増幅は、以下の条件を使用して実施した:最初の変性のための98℃で2分の1サイクル;98℃で15秒、62℃で30秒、および72℃で45秒の34サイクル;72℃で5分の1サイクル;および4℃で保持。PCR産物をCel-1ヌクレアーゼで消化し、10%アクリルアミドゲルで分離した。標的化変異率を、ImageJを使用して測定し、パーセント挿入および/または欠失(%インデル)として示した。結果は、表4において要約されている。結果は、少なくとも1つのクロマチン調節モチーフとのCas9融合物がヒト細胞において内因性標的に対するその遺伝子編集効率を増強するということを証明する。
【表4】
*PAMの決定因子ヌクレオチドは下線を引かれている。
【0102】
実施例4.sgRNA修飾によるマイコプラズマ・カニスCas9(McaCas9)システムの改善
McaCas9の野生型crRNAコード配列は、リピート領域における4つの連続したチミジン残基を含み、crRNAおよびtracrRNAが共にsgRNAを形成するように結合されるとき、4つのチミジン残基のうち3つが推定tracrRNA配列において3つのアデノシン残基と対を形成することが予期される。ヒトRNAポリメラーゼ(Pol)IIIは、転写終結シグナルとしてコードRNA鎖上に4つ以上の連続したチミジン残基を使用することが知られている。ヒト細胞においてMcaCas9 sgRNAの早期の転写終結を防止するため、TからCへの変異および対応するAからGへの変異が、以下の配列を有する修飾されたsgRNAスカフォールドを形成するように、sgRNAスカフォールドに導入された:5’-GUUCUAGUGUUGUACAAUAUUUGGGUGAAAACCCAAAUAUUGUACAUCCUAGAUCAAGGCGCUUAAUUGCUGCCGUAAUUGCUGAAAGCGUAGCUUUCAGUUUUUUU-3’(配列番号:76)、ここで、変異されたヌクレオチドは下線を引かれている。この修飾はまた、sgRNAスカフォールド熱力学的安定性を増加させることが予期された。
【0103】
ヒトK562細胞(1x10
6)を、N末端上にHMGN1ペプチドおよびC末端上にヒストンH1球状ドメインペプチドを含むMcaCas9融合タンパク質をコードする5.5μgのプラスミドDNA、およびコントロールsgRNAスカフォールドまたは修飾されたsgRNAスカフォールドをコードする3μgのsgRNAプラスミドDNAでトランスフェクトされた。ゲノムDNAをトランスフェクションの3日後にDNA抽出溶液(QuickExtract
TM)を使用して調製し、標的化ゲノム領域をフォワードプライマー5’-CTCCCCTGCTTCTTGTCGTAT-3’(配列番号:55)およびリバースプライマー5’-ACAGGTCGTGGACACTCACA-3’(配列番号:56)を使用してPCR増幅した。増幅は、以下の条件を使用して実施した:最初の変性のための98℃で2分の1サイクル;98℃で15秒、62℃で30秒、および72℃で45秒の34サイクル;72℃で5分の1サイクル;および4℃で保持。PCR産物をCel-1ヌクレアーゼで消化し、10%アクリルアミドゲルで分離した。標的化変異率を、ImageJを使用して測定し、パーセント挿入および/または欠失(%インデル)として示した。結果は、表5において要約されている。結果は、哺乳動物細胞におけるCas9オルソログの活性がそのsgRNAスカフォールドを修飾することによって増強することができるということを証明する。
【表5】
*PAMの決定因子ヌクレオチドは下線を引かれている。
【0104】
実施例5.クロマチン調節モチーフとの融合によるMcaCas9、BsmCas9、PexCas9、およびLrhCas9活性の改善
McaCas9-NLS、BsmCas9-NLS、およびLrhCas9-NLSタンパク質を、アミノ末端でHMGN1(HN1)およびカルボキシル末端でHMGB1ボックスA(HB1)またはヒストンH1中央球状モチーフ(H1G)のいずれかと連結して、McaCas9-HN1HB1(配列番号:123)、McaCas9-HN1H1G(配列番号:124)、BsmCas9-HN1HB1(配列番号:119)、Bsm-HN1H1G(配列番号:120)、Lrh-HN1HB1(配列番号:121)、LrhCas9-HN1H1G(配列番号:122)を産生することによって、さらなるCas9-CMM融合タンパク質を調製した。実施例3において上記説明されたこれらの融合物およびPexCas9-CMM融合物のヌクレアーゼ活性を、実施例2および3において本質的に上記説明された対応する操作されたCas9タンパク質の活性と比較した。表6は、各Cas9ヌクレアーゼに対する特定の遺伝子座における標的部位(すなわち、下線が引かれた決定的なヌクレオチドを有する太字で示される、プロトスペーサー+PAM)を示す。
【表6】
【0105】
各条件下でのインデルのパーセントは、
図2A-Dにプロットされている。HN1HB1およびHN1H1Gの組合せの両方が、少なくとも1つの部位で4つのCas9オルソログが有意に強化された。倍率変化の大きさに基づいて、CMM融合修飾は、試験された2つの部位でその活性を少なくとも5倍増加させるMcaCas9に関して最大の増強を提供した(
図2A)。CMM融合は、PexCas9に関して2倍を超える増強を提供した(
図2B)。BsmCas9活性は、1つの部位に関して3倍以上増強されたが、第2の部位に関して20%の増加のみであり、第3の部位に関して影響がなかった(
図2C)。しかしながら、全3つのBsmCas9ヌクレアーゼが非常に効率的であった(>35%インデル)ことに留意すべきである。LrhCas9は、融合修飾なしでさえ、試験された2つの部位(22%および33%インデル)に関して非常に効率的であった(
図2D)。しかしながら、HN1H1Gの組合せもなお、活性の70%および28%増加で、両方の部位に関して有意な増強を提供した。これらの結果は、CMM融合戦略が遺伝子編集効率を増強させるということを証明する。
【0106】
実施例6.Cas9-CMM融合物のオフターゲット効果
Cas9-CMM融合物のオフターゲット活性を評価するために、それぞれの標的部位についての1から5個のトップランクの可能性のあるオフターゲット部位をSurveyor Nucleaseアッセイを使用して分析した。実施例5に上記説明されたCas9およびCas9-CMM融合データに加えて、化膿連鎖球菌Cas9(SpyCas9)、SpyCas9-CMM融合物、ストレプトコッカス・パステウリアヌス(Streptococcus pasteurianus)Cas9(SpaCas9)、Spa-CMM融合物、カンピロバクター・ジェジュニCas9(CjeCas9)、およびCjeCas9-SMM融合物からのデータもまた分析した。アッセイされた合計64の可能性のあるオフターゲット部位から、オフターゲット切断が試験された計21のガイド配列のうちの9のガイド配列によって寄与される11部位にて検出された。11のオフターゲット部位において、オフターゲット切断がコントロールSpyCas9において検出されなかったPOR Spy 1-OT1部位を除いて、コントロールCas9および融合ヌクレアーゼが同時に存在した。概して、融合ヌクレアーゼおよびコントロールCas9間の有意な差異はなかった(
図3)。例えば、全11のオフターゲット部位にわたって、HN1H1G融合組合せは平均8.0±6.0%インデルであり、コントロールCas9は平均7.5±5.1%インデルであった。同様に、HN1HB1融合組合せに関連する10のオフターゲット部位にわたって、融合組合せおよびコントロールCas9(6.9±5.7% 対 6.5±5.4%インデル)間の有意な差異はなかった。総合すれば、これらの結果は、HN1H1BおよびHN1H1G融合組合せによるオンターゲット活性増強は、一般的に、オフターゲット活性における増加をもたらさないことを示す。
【0107】
操作されたCas9システム(Engineered Cas9 Systems)
表7は、操作されたCas9/NLSタンパク質のヒトコドン最適化DNAおよびタンパク質(protein)配列(sequence)(配列番号(SEQ ID NO):1-30、ここで、NLS配列は下線が引かれている)および操作されたsgRNA(配列番号:31-45;5’末端でのN残基はプログラム可能型標的配列を示す)のDNA配列を示す。Cas9-CMM融合物(fusion)(配列番号:117-124)も示される。
【表7-1】
【表7-2】
【表7-3】
【表7-4】
【表7-5】
【表7-6】
【表7-7】
【表7-8】
【表7-9】
【表7-10】
【表7-11】
【表7-12】
【表7-13】
【表7-14】
【表7-15】
【表7-16】
【表7-17】
【表7-18】
【表7-19】
【表7-20】
【表7-21】
【表7-22】
【表7-23】
【表7-24】
【表7-25】
【表7-26】
【表7-27】
【表7-28】
【表7-29】
【表7-30】
【表7-31】
【表7-32】
【表7-33】
【表7-34】
【配列表】