(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-08
(45)【発行日】2022-09-16
(54)【発明の名称】ゲノム編集のためのシステム及び方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20220909BHJP
C12N 15/31 20060101ALI20220909BHJP
C12N 15/55 20060101ALI20220909BHJP
C12N 15/62 20060101ALI20220909BHJP
C12N 15/113 20100101ALI20220909BHJP
C12N 15/88 20060101ALI20220909BHJP
C12N 15/89 20060101ALI20220909BHJP
C12N 15/86 20060101ALI20220909BHJP
C12N 15/866 20060101ALI20220909BHJP
C12N 15/863 20060101ALI20220909BHJP
C12N 15/861 20060101ALI20220909BHJP
C12N 15/864 20060101ALI20220909BHJP
C12N 15/867 20060101ALI20220909BHJP
C12N 15/06 20060101ALI20220909BHJP
C12N 15/07 20060101ALI20220909BHJP
A61K 48/00 20060101ALI20220909BHJP
A61K 38/46 20060101ALI20220909BHJP
A61K 31/7105 20060101ALI20220909BHJP
A61K 31/7088 20060101ALI20220909BHJP
A61P 9/00 20060101ALI20220909BHJP
A61P 25/00 20060101ALI20220909BHJP
A61P 25/30 20060101ALI20220909BHJP
A61P 25/18 20060101ALI20220909BHJP
A61P 25/16 20060101ALI20220909BHJP
A61P 25/28 20060101ALI20220909BHJP
A61P 27/02 20060101ALI20220909BHJP
A61P 29/00 20060101ALI20220909BHJP
A61P 35/00 20060101ALI20220909BHJP
A61P 39/02 20060101ALI20220909BHJP
A61P 43/00 20060101ALI20220909BHJP
A61K 35/76 20150101ALI20220909BHJP
【FI】
C12N15/09 100
C12N15/31 ZNA
C12N15/55
C12N15/62 Z
C12N15/113 Z
C12N15/88 Z
C12N15/89 Z
C12N15/86 Z
C12N15/866 Z
C12N15/863 Z
C12N15/861 Z
C12N15/864 100Z
C12N15/867 Z
C12N15/06
C12N15/07
A61K48/00
A61K38/46
A61K31/7105
A61K31/7088
A61P9/00
A61P25/00
A61P25/30
A61P25/18
A61P25/16
A61P25/28
A61P27/02
A61P29/00
A61P35/00
A61P39/02
A61P43/00 111
A61P43/00 121
A61K35/76
(21)【出願番号】P 2020536029
(86)(22)【出願日】2017-12-27
(86)【国際出願番号】 CN2017118948
(87)【国際公開番号】W WO2019127087
(87)【国際公開日】2019-07-04
【審査請求日】2020-11-16
(73)【特許権者】
【識別番号】512256605
【氏名又は名称】インスティテュート オブ ズーオロジー、チャイニーズ アカデミー オブ サイエンシーズ
(74)【代理人】
【識別番号】110002572
【氏名又は名称】特許業務法人平木国際特許事務所
(72)【発明者】
【氏名】リー,ウェイ
(72)【発明者】
【氏名】ゾウ,キー
(72)【発明者】
【氏名】テン,フェイ
【審査官】中野 あい
(56)【参考文献】
【文献】国際公開第2016/205749(WO,A1)
【文献】Mol Cell, 2017 Jan 19, vol. 65, no. 2, pp. 310-322 (Epub 2016 Dec 15)
【文献】Int J Syst Evol Microbiol, 2002 Sep, vol. 52, no. Pt 5, pp. 1681-1685
【文献】植物の生長調節, 2017(20170623), vol. 52, no. 1, pp. 15-18
【文献】Nat Biotechnol, 2017 May (Epub 2017 Mar 27), vol. 35, no. 5, pp. 441-443
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
以下のi)~v):
i) C2c1タンパク質若しくはそのバリアント、及びガイドRNA;
ii) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) C2c1タンパク質若しくはそのバリアント、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
ガイドRNAは、C2c1タンパク質又はそのバリアントと複合体を形成し、C2c1タンパク質又はそのバリアントを細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらすことができ、C2c1タンパク質は、アリサイクロバチルス・アシディフィラス(Alicyclobacillus acidiphilus)に由来するAaC2c1タンパク質であ
り、
AaC2c1タンパク質が、配列番号1に示されるアミノ酸配列を含み、AaC2c1タンパク質のバリアントが、配列番号1と少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%の配列同一性を有するアミノ酸配列を含み、且つ野生型AaC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する、
システム。
【請求項2】
AaC2c1タンパク質のバリアントが、ヌクレアーゼ不活性AaC2c1とデアミナーゼの融合タンパク質であり、デアミナーゼは、例えば、基質として一本鎖DNAを受け入れることができるシトシンデアミナーゼ又は基質として一本鎖DNAを受け入れることができるアデニンデアミナーゼである、請求項1に記載のシステム。
【請求項3】
ヌクレアーゼ不活性AaC2c1中の野生型AaC2c1タンパク質の785位に対応するアミノ酸が置換されている、請求項
2に記載のシステム。
【請求項4】
ヌクレアーゼ不活性AaC2c1が、野生型AaC2c1タンパク質と比較してアミノ酸置換R785Aを含む、請求項
3に記載のシステム。
【請求項5】
ガイドRNAが、sgRNAである、請求項1~
4のいずれか一項に記載のシステム。
【請求項6】
sgRNAが、以下:
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x-3';
5'-AACTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x-3';
5'-CTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGCTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAGCTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAACTGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAGCGAGAAGTGGCAC-N
x-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTAAGCAGAAGTGGCAC-N
x-3'; 及び
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCAAGCGAAGTGGCAC-N
x-3'
(N
xは、標的配列の相補体に特異的にハイブリダイズすることができる、x個の連続するヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくは、x=20である)からなる群から選択されるヌクレオチド配列によってコードされる、請求項
5に記載のシステム。
【請求項7】
細胞が、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(Arabidopsis)などに由来する、
請求項1~6のいずれか一項に記載のシステム。
【請求項8】
前記システムが、リン酸カルシウムトランスフェクション、プロトプラスト融合、エレクトロポレーション、リポフェクション、マイクロインジェクション、ウイルス感染(例えば、バキュロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス、レンチウイルス及び他のウイルス)、遺伝子銃法、PEG媒介プロトプラスト形質転換、アグロバクテリウム媒介形質転換から選択される方法によって細胞に導入される、
請求項1~7のいずれか一項に記載のシステム。
【請求項9】
疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、請求項1~
6のいずれか一項に記載のゲノム編集システムの使用であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、使用。
【請求項10】
対象が、哺乳動物、例えばヒトである、請求項9に記載の使用。
【請求項11】
疾患が、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、及び遺伝性疾患から選択される、請求項9又は10に記載の使用。
【請求項12】
請求項1~
6のいずれか一項に記載のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、医薬組成物。
【請求項13】
対象が、哺乳動物、例えばヒトである、請求項
12に記載
の医薬組成物。
【請求項14】
疾患が、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、及び遺伝性疾患から選択される、請求項
12又は13に記載
の医薬組成物。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝子工学の分野に関する。特に、本発明は、新規なゲノム編集システム及び方法に関する。より具体的には、本発明は、細胞のゲノムを効率的に編集することができる新規なCRISPR-C2c1システム及びその使用に関する。
【背景技術】
【0002】
CRISPR(クラスター化規則的配置短回文配列リピート(Clustered regular interspaced short palindromic repeats))システムは、外来遺伝子の侵入に対して防御するために細菌の進化中に生成された免疫システムである。それらの中で、II型CRISPR-Cas9システムは、2つの小分子RNA(crRNA及びtracrRNA)又は人工的に合成された小分子RNA(sgRNA)によって媒介されるCas9タンパク質によるDNA開裂のためのシステムであり、最初に発見された3つの(I、II、III型)CRISPRシステム中で最も単純なシステムである。操作が単純で容易なため、このシステムは、2013年に首尾よく操作され、真核生物のゲノム編集を達成した。CRISPR/Cas9システムは、すぐに生命科学で最も人気のある技術になった。
【0003】
2015年に、Zhang et al.は、配列アラインメント及び組織的分析により、CRISPR-Cas9システムとは異なる新しいV-A型遺伝子編集システムであるCRISPR-Cpf1システムを発見した。このシステムは、ゲノム編集を媒介するために1つの小分子RNA(crRNA)のみを必要とする。
【0004】
2015年に、Shmakov et al.はまた、新しいゲノム編集システムであるC2c1(V-B)、C2c2(VI)及びC2c3(V-C)システムを同定した(Molecular Cell 60, 385-397, November 5, 2015)。それらの中で、アリサイクロバチルス・アシドテレストリス(Alicyclobacillus acidoterrestris)由来のAacC2c1が、DNA開裂を達成することが確認された。しかし、その活性は、例えば温度によって制限された。AacC2c1システムは、40℃未満でDNAを開裂することができなかった。そして、AacC2c1システムが、真核生物でゲノム編集を達成することができるという証拠はない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
ゲノム編集をより容易にするために、効率的なゲノム編集を可能にするシステムに対する必要性が当技術分野に依然として存在する。
【課題を解決するための手段】
【0006】
発明の簡単な説明
本発明者らは、哺乳動物細胞におけるゲノム編集のための新規なCRISPR-C2c1システムを同定した。本発明者らによって同定されたC2c1ヌクレアーゼは、in vitro実験で高温耐性並びに酸及びアルカリ耐性を示す。さらに、本発明者らは、同定されたCRISPR-C2c1システムのsgRNAを最適化して、その標的化効率に影響を与えることなく、その長さを大幅に短縮する。最後に、本発明者らはまた、C2c1タンパク質自体を操作して、それをエンドヌクレアーゼから不活性(dead)C2c1(dC2c1)に変換させ、その使用を拡張した。
【0007】
一態様では、本発明は、以下のi)~v):
i) C2c1タンパク質若しくはそのバリアント、及びガイドRNA;
ii) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) C2c1タンパク質若しくはそのバリアント、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
ガイドRNAは、C2c1タンパク質又はそのバリアントと複合体を形成し、C2c1タンパク質又はそのバリアントを細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらすことができる、システムを提供する。いくつかの実施形態では、C2c1タンパク質は、アリサイクロバチルス・アシディフィラス(Alicyclobacillus acidiphilus)又はアリサイクロバチルス・カケガウェンシス(Alicyclobacillus kakegawensis)に由来するC2c1タンパク質である。
【0008】
別の態様では、本発明は、細胞のゲノム中の標的配列を部位特異的に改変する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含む、方法を提供する。
【0009】
別の態様では、本発明は、疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の本発明のゲノム編集システムを送達して、対象において疾患に関連する遺伝子を改変するステップを含む、方法を提供する。
【0010】
別の態様では、本発明は、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、本発明のゲノム編集システムの使用であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、使用を提供する。
【0011】
別の態様では、本発明は、本発明のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、そのゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、医薬組成物を提供する。
【図面の簡単な説明】
【0012】
【
図1】AaC2c1のin vitroヌクレアーゼ活性分析結果を示す。
【
図2】AaC2c1のin vitroヌクレアーゼ活性分析結果を示す。
【
図3】哺乳動物細胞におけるAaC2c1及びAkC2c1のゲノム編集活性を示す。
【
図4-1】哺乳動物細胞におけるAaC2c1及びAkC2c1のゲノム編集活性を示す。
【
図4-2】哺乳動物細胞におけるAaC2c1及びAkC2c1のゲノム編集活性を示す。
【
図5】AaC2c1ゲノム編集を媒介するための単一ガイドRNA(sgRNA)の最適化を示す。
【
図6-1】AaC2c1ゲノム編集を媒介するための単一ガイドRNA(sgRNA)の最適化を示す。
【
図6-2】AaC2c1ゲノム編集を媒介するための単一ガイドRNA(sgRNA)の最適化を示す。
【
図6-3】AaC2c1ゲノム編集を媒介するための単一ガイドRNA(sgRNA)の最適化を示す。
【
図7】AaC2c1編集活性に対する標的配列の長さ及びミスマッチ数の影響を示す。
【
図8】AaC2c1のオフターゲット効果分析を示す。
【
図9】AaC2c1の重要な触媒残基の同定及び変異分析を示す。
【
図10】様々な種に由来するC2c1タンパク質の配列アラインメント及び構造分析を示す。
【発明を実施するための形態】
【0013】
発明の詳細な説明
本発明において、本明細書で使用される科学用語及び技術用語は、他に明記しない限り、当業者によって一般に理解される意味を有する。また、本明細書で使用されるタンパク質及び核酸化学、分子生物学、細胞及び組織培養、微生物学、免疫学関連用語、及び実験室手順は、対応する分野で広く使用されている用語及び日常的処置である。例えば、本発明で使用される標準的な組換えDNA及び分子クローニング技術は当業者に周知であり、以下の文書により完全に記載されている: Sambrook, J., Fritsch, E.F. and Maniatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989(本明細書において以降、「Sambrook」と呼ばれる)。
【0014】
一態様では、本発明は、以下のi)~v):
i) C2c1タンパク質若しくはそのバリアント、及びガイドRNA;
ii) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) C2c1タンパク質若しくはそのバリアント、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
そのガイドRNAは、C2c1タンパク質又はそのバリアントと複合体を形成し、C2c1タンパク質又はそのバリアントを細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらすことができる、システムを提供する。
【0015】
「ゲノム」は、本明細書で使用される場合、核に存在する染色体DNAだけでなく、細胞の細胞内構成要素(例えば、ミトコンドリア、色素体)に存在するオルガネラDNAも包含する。
【0016】
「C2c1ヌクレアーゼ」、「C2c1タンパク質」及び「C2c1」は、本明細書で互換的に使用され、C2c1タンパク質又はその断片を含むRNA指向性ヌクレアーゼを指す。C2c1は、ガイドRNA媒介DNA結合活性及びDNA開裂活性を有し、ガイドRNAの案内の下でDNA標的配列を標的化及び開裂しDNA二本鎖切断(DSB)を形成することができる。DSBは、細胞内の本来備わっている修復機構である非相同末端結合(NHEJ)及び相同組換え(HR)を活性化して、細胞におけるDNA損傷を修復することができる。修復プロセスの間に、特定のDNA配列が部位特異的編集を受ける。
【0017】
いくつかの実施形態では、C2c1タンパク質は、アリサイクロバチルス・アシディフィラス(AaC2c1)に由来するC2c1タンパク質である。例えば、C2c1タンパク質は、アリサイクロバチルス・アシディフィラスNBRC 100859に由来するAaC2c1タンパク質である。いくつかの実施形態では、AaC2c1タンパク質は、配列番号1に示されるアミノ酸配列を含む。
【0018】
本発明者らは、驚くべきことに、AaC2c1タンパク質が約4℃~約100℃の広い温度範囲にわたってRNA指向性DNA開裂活性を有し、約30℃~約60℃の温度で最適な活性を有することを見出した。さらに、AaC2c1タンパク質は、約pH1.0~約pH12.0の広いpH範囲にわたってRNA指向性DNA開裂活性を有し、約1.0のpH~約pH8.0で最適な活性を有する。したがって、本発明のゲノム編集システムは、様々な温度及びpH条件下で機能することができる。
【0019】
いくつかの態様では、C2c1タンパク質のバリアントは、配列番号1に示される野生型AaC2c1タンパク質と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性を有するアミノ酸配列を含み、且つ野生型AaC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する。
【0020】
いくつかの実施形態では、C2c1タンパク質のバリアントは、配列番号1と比較して1つ以上のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含み、且つ野生型AaC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する。例えば、C2c1タンパク質のバリアントは、配列番号1と比較して、1、2、3、4、5、6、7、8、9、又は10個のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含む。いくつかの実施形態では、アミノ酸置換は、保存的置換である。
【0021】
いくつかの他の実施形態では、C2c1タンパク質は、アリサイクロバチルス・カケガウェンシスに由来するC2c1タンパク質(AkC2c1)である。例えば、AkC2c1タンパク質は、アリサイクロバチルス・カケガウェンシスNBRC 103104に由来する。いくつかの実施形態では、AkC2c1タンパク質は、配列番号5に示されるアミノ酸配列を含む。
【0022】
いくつかの実施形態では、C2c1タンパク質のバリアントは、配列番号5に示される野生型AkC2c1タンパク質と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性を有するアミノ酸配列を含み、且つ野生型AkC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する。
【0023】
いくつかの実施形態では、C2c1タンパク質のバリアントは、配列番号4と比較して1つ以上のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含み、且つ野生型AkC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する。例えば、C2c1タンパク質のバリアントは、配列番号4と比較して、1、2、3、4、5、6、7、8、9、又は10個のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含む。いくつかの実施形態では、アミノ酸置換は、保存的置換である。
【0024】
「ポリペプチド」、「ペプチド」、及び「タンパク質」は、アミノ酸残基のポリマー(重合体)を指すために本発明で互換的に使用される。これらの用語は、1つ以上のアミノ酸残基が、対応する天然に存在するアミノ酸の人工化学的類似体である、アミノ酸ポリマーに、及び天然に存在するアミノ酸ポリマーに適用される。用語「ポリペプチド」、「ペプチド」、「アミノ酸配列」、及び「タンパク質」はまた、グリコシル化、脂質連結、硫酸化、グルタミン酸残基のγカルボキシル化、及びADPリボシル化を含むがこれらに限定されない修飾形態を含み得る。
【0025】
配列「同一性」は、当技術分野で認識されている意味を有し、2つの核酸又はポリペプチド分子又は領域間の配列同一性のパーセンテージは、開示されている技術を使用して計算することができる。配列同一性は、ポリヌクレオチド又はポリペプチドの全長に沿って、又は分子の一領域に沿って測定することができる(例えば、Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; 及びSequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991を参照のこと)。2つのポリヌクレオチド又はポリペプチド間の同一性を測定するための多くの方法があるが、用語「同一性」は、当業者に周知である(Carrillo, H. & Lipman, D., SIAM J Applied Math 48: 1073 (1988))。
【0026】
ペプチド又はタンパク質における適切な保存的アミノ酸置換は、当業者に公知であり、一般に、得られる分子の生物学的活性を変えることなく行うことができる。一般に、当業者は、ポリペプチドの非必須領域における単一アミノ酸置換が、生物学的活性を実質的に変化させないことを認識している(例えば、Watson et al., Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. co., p.224を参照のこと)。
【0027】
いくつかの実施形態では、C2c1タンパク質のバリアントは、ヌクレアーゼ不活性(nuclease-dead)C2c1タンパク質(dC2c1)を含む。ヌクレアーゼ不活性C2c1タンパク質は、RNA媒介DNA結合活性を保持するが、DNA開裂活性を持たないC2c1タンパク質を指す。
【0028】
いくつかの実施形態では、dC2c1において、野生型AaC2c1タンパク質の785位に対応するアミノ酸が置換されている。いくつかの具体的な実施形態では、dC2c1は、野生型AaC2c1タンパク質と比較してアミノ酸置換R785Aを含む。いくつかの具体的な実施形態では、dC2c1は、配列番号4に示されるアミノ酸配列を含む。
【0029】
いくつかの実施形態では、C2c1タンパク質のバリアントは、dC2c1とデアミナーゼの融合タンパク質である。例えば、融合タンパク質中のdC2c1及びデアミナーゼは、ペプチドリンカーなどのリンカーによって連結されてもよい。
【0030】
本明細書で使用される場合、「デアミナーゼ」は、脱アミノ化反応を触媒する酵素を指す。本発明のいくつかの実施形態では、デアミナーゼは、基質として一本鎖DNAを受け入れることができ、且つそれぞれシチジン又はデオキシシチジンのウラシル又はデオキシウラシルへの脱アミノ化を触媒することができるシトシンデアミナーゼを指す。本発明のいくつかの実施形態では、デアミナーゼは、基質として一本鎖DNAを受け入れることができ、且つアデノシン又はデオキシアデノシン(A)をイノシン(I)へと触媒することができるアデニンデアミナーゼを指す。CからTへの変換又はAからGへの変換などの、標的DNA配列中の塩基編集は、C2c1バリアントとデアミナーゼの融合タンパク質を使用することによって達成することができる。基質として一本鎖DNAを受け入れる様々な適切なシトシンデアミナーゼ又はアデニンデアミナーゼが当技術分野で公知である。
【0031】
本発明のいくつかの実施形態では、本発明におけるC2c1タンパク質又はそのバリアントは、核局在化配列(NLS)をさらに含んでもよい。一般に、C2c1タンパク質又はそのバリアント中の1つ以上のNLSは、C2c1タンパク質又はそのバリアントを、その塩基編集機能を可能にする量まで細胞核に蓄積させるのに十分な強度であるべきである。一般に、核局在化活性の強度は、C2c1タンパク質又はそのバリアント中のNLSの数、位置、使用される1つ以上の具体的なNLS、又はこれらの因子の組み合わせによって決まる。
【0032】
本発明のいくつかの実施形態では、本発明におけるC2c1タンパク質又はそのバリアントのNLSは、N末端及び/又はC末端に位置してもよい。いくつかの実施形態では、C2c1タンパク質又はそのバリアントは、約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、C2c1タンパク質又はそのバリアントは、N末端又はその近くに約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、C2c1タンパク質又はそのバリアントは、C末端又はその近くに約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、C2c1タンパク質又はそのバリアントは、これらの組み合わせを含み、例えば、N末端に1つ以上のNLS及びC末端に1つ以上のNLSを含む。2つ以上のNLSがある場合、それぞれを他のNLSから独立して選択することができる。本発明のいくつかの好ましい実施形態では、C2c1タンパク質又はそのバリアントは、2つのNLSを含み、例えば、2つのNLSは、それぞれN末端及びC末端に位置する。
【0033】
一般に、NLSは、タンパク質の表面に露出した正に帯電したリジン又はアルギニンの1つ以上の短い配列からなるが、他の種類のNLSも公知である。NLSの非限定的な例としては、KKRKV、PKKKRKV、又はSGGSPKKKRKVが挙げられる。
【0034】
さらに、編集されるべきDNAの位置に応じて、本発明におけるC2c1タンパク質又はそのバリアントはまた、他の局在化配列、例えば細胞質局在化配列、葉緑体局在化配列、ミトコンドリア局在化配列などを含んでもよい。
【0035】
本発明のいくつかの実施形態では、標的配列は、18~35ヌクレオチド長、好ましくは20ヌクレオチド長である。本発明のいくつかの実施形態では、標的配列の5'末端に隣接する配列は、5'TTTN-3'、5'ATTN-3'、5'GTTN-3'、5'CTTN-3'、5'TTC-3'、5'TTG-3'、5'TTA-3'、5'TTT-3'、5'TAN-3'、5'TGN-3'、5'TCN-3'及び5'ATC-3'から選択される(好ましくは5'TTTN-3')(Nは、A、G、C及びTから選択される)プロトスペーサー隣接モチーフ(PAM)配列である。
【0036】
本発明において、改変されるべき標的配列は、ゲノム中の任意の位置、例えば、タンパク質をコードする遺伝子などの機能的遺伝子中に位置してもよく、又は例えば、プロモーター領域若しくはエンハンサー領域などの遺伝子発現調節領域中に位置してもよく、それにより、遺伝子機能の改変又は遺伝子発現の改変を達成することができる。ゲノムの標的配列における置換、欠失及び/又は付加は、T7EI、PCR/RE又は配列決定法により検出することができる。
【0037】
「ガイドRNA」及び「gRNA」は、本明細書で互換的に使用することができ、典型的には、複合体を形成するように互いに部分的に相補的であるcrRNA及びtracrRNA分子で構成され、crRNAは、標的配列の相補体にハイブリダイズし、CRISPR複合体(C2c1+crRNA+tracrRNA)を、標的配列に配列特異的に結合するように向かわせるために標的配列と十分に同一である配列を含む。しかし、crRNA及びtracrRNAの両方の特徴を含む単一ガイドRNA(sgRNA)を設計して使用することができる。
【0038】
本発明のいくつかの実施形態では、ガイドRNAは、crRNA及びtracrRNAの部分的相補体によって形成される複合体である。いくつかの実施形態では、tracrRNAは、ヌクレオチド配列: 5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGAC-3'によってコードされる。いくつかの実施形態では、crRNAは、5'-GTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-Nx-3'(Nxは、x個の連続するヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数である)によってコードされる。好ましくは、x=20である。いくつかの実施形態では、配列Nx(スペーサー配列)は、標的配列の相補体に特異的にハイブリダイズすることができる。
【0039】
本発明のいくつかの実施形態では、ガイドRNAは、sgRNAである。いくつかの特定の実施形態では、sgRNAは、以下:
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-Nx-3';
5'-AACTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-Nx-3';
5'-CTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTATCACTGAGCGAGCGATCTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGCTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAGCTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAACTGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAGCGAGAAGTGGCAC-Nx-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTAAGCAGAAGTGGCAC-Nx-3'; 及び
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCAAGCGAAGTGGCAC-Nx-3'
(Nxは、x個の連続するヌクレオチドからなるヌクレオチド配列(スペーサー配列)を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくは、x=20である)からなる群から選択されるヌクレオチド配列によってコードされる。いくつかの実施形態では、配列Nx(スペーサー配列)は、標的配列の相補体に特異的にハイブリダイズすることができる。Nxを除くsgRNA中の配列は、sgRNAの足場配列である。
【0040】
「ポリヌクレオチド」、「核酸配列」、「ヌクレオチド配列」又は「核酸断片」は、互換的に使用され、合成、非天然、又は変更されたヌクレオチド塩基を任意選択で含有する、一本鎖又は二本鎖のRNA又はDNAポリマーである。ヌクレオチドは、次のようにそれらの一文字名によって呼ばれる: 「A」はアデノシン又はデオキシアデノシン(それぞれRNA又はDNAに対応する)であり、「C」はシチジン又はデオキシシチジンを意味し、「G」はグアノシン又はデオキシグアノシンを意味し、「U」はウリジンを表し、「T」はデオキシチミジンを意味し、「R」はプリン(A又はG)を意味し、「Y」はピリミジン(C又はT)を意味し、「K」はG又はTを意味し、「H」はA又はC又はTを意味し、「I」はイノシンを意味し、「N」は任意のヌクレオチドを意味する。
【0041】
標的細胞で効率的な発現を得るために、本発明のいくつかの実施形態では、C2c1タンパク質又はそのバリアントをコードするヌクレオチド配列は、ゲノム編集されるべき細胞が由来する生物に対してコドン最適化される。
【0042】
コドン最適化は、目的の宿主細胞での発現を増強するために、天然アミノ酸配列を維持しながら核酸配列を改変して、天然配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50個若しくはそれを超える個数、又は約1、2、3、4、5、10、15、20、25、50個若しくはそれを超える個数のそれぞれを超える個数のコドン)を、宿主細胞の遺伝子でより頻繁に又は最も頻繁に使用されるコドンによって置き換えることを指す。異なる種は、特定のアミノ酸の特定のコドンに対して特定の選好性を示す。コドン選択(生物間のコドン使用頻度の違い)は、メッセンジャーRNA(mRNA)の翻訳効率にしばしば関連し、これは翻訳されるコドンの性質及び特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられている。細胞内の選択されるtRNAの利点は、一般に、ペプチド合成に最も頻繁に使用されるコドンを反映する。したがって、遺伝子は、コドン最適化に基づいて、所与の生物で最もよく発現される遺伝子になるようにカスタマイズすることができる。コドン使用頻度表は、例えば、www.kazusa.orjp/codon/で利用可能なコドン使用頻度データベース(Codon Usage Database)で容易に得ることができ、これらの表は、様々な方法で調整することができる。Nakamura Y. et. al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000 Nucl.Acids Res, 28: 292 (2000)を参照のこと。
【0043】
本発明のいくつかの実施形態では、C2c1タンパク質及びそのバリアントをコードするヌクレオチド配列は、ヒトに対してコドン最適化される。いくつかの実施形態では、C2c1タンパク質をコードするコドン最適化されたヌクレオチド配列は、配列番号3又は7から選択される。
【0044】
本発明のいくつかの実施形態では、C2c1タンパク質及びそのバリアントをコードするヌクレオチド配列並びに/又はガイドRNAをコードするヌクレオチド配列は、プロモーターなどの発現調節エレメントに作動可能に連結される。
【0045】
本発明で使用される場合、「発現構築物」は、生物における目的のヌクレオチド配列の発現に適した組換えベクターなどのベクターを指す。「発現」は、機能的生成物の産生を指す。例えば、ヌクレオチド配列の発現は、ヌクレオチド配列の転写(例えば、mRNA又は機能的RNAを産生するための転写)、及び/又は前駆体若しくは成熟タンパク質へのRNAの翻訳を指し得る。本発明の「発現構築物」は、直鎖状核酸断片、環状プラスミド、ウイルスベクター、又はいくつかの実施形態では、翻訳可能なRNA(例えば、mRNA)であり得る。
【0046】
本発明の「発現構築物」は、異なる起源に由来する目的の調節配列及びヌクレオチド配列、又は同じ起源に由来するものであるが通常天然に生じるものとは異なる様式で配置された目的の調節配列及びヌクレオチド配列を含み得る。
【0047】
「調節配列」及び「調節エレメント」は、コード配列の上流(5'非コード配列)、中央又は下流(3'非コード配列)に位置し、関連するコード配列の転写、RNAプロセシング又は安定性又は翻訳に影響を及ぼすヌクレオチド配列を指すために互換的に使用される。調節配列としては、以下に限定されないが、プロモーター、翻訳リーダー、イントロン、及びポリアデニル化認識配列が挙げられる。
【0048】
「プロモーター」は、別の核酸断片の転写を制御することができる核酸断片を指す。本発明のいくつかの実施形態では、プロモーターは、細胞に由来するかどうかにかかわらず、その細胞における遺伝子の転写を制御することができるプロモーターである。プロモーターは、構成的プロモーター又は組織特異的プロモーター又は発生的に調節されるプロモーター又は誘導性プロモーターであってもよい。
【0049】
「構成的プロモーター」は、ほとんどの場合にほとんどの細胞型で概して遺伝子を発現させることができるプロモーターを指す。「組織特異的プロモーター」及び「組織優先的プロモーター」は、互換的に使用され、それらが、主に(必ずしもこれだけではないが)1つの組織又は器官で発現されるだけでなく、特定の細胞又は細胞型で発現されることを意味する。「発生的に調節されるプロモーター」は、発生事象によってその活性が決定されるプロモーターを指す。「誘導性プロモーター」は、内因性又は外因性の刺激(環境、ホルモン、化学シグナルなど)に応答して、作動可能に連結されたDNA配列を選択的に発現する。
【0050】
本明細書で使用される場合、用語「作動可能に連結された」は、ヌクレオチド配列の転写が転写調節エレメントによって制御及び調節されるような、調節エレメント(例えば、以下に限定されないが、プロモーター配列、転写終結配列など)の、核酸配列(例えば、コード配列又はオープンリーディングフレーム)への連結を指す。調節エレメント領域を核酸分子に作動可能に連結するための技術は、当技術分野で公知である。
【0051】
本発明で使用することができるプロモーターの例としては、以下に限定されないが、ポリメラーゼ(pol)I、pol II又はpol IIIプロモーターが挙げられる。pol Iプロモーターの例としては、ニワトリRNA pol Iプロモーターが挙げられる。pol IIプロモーターの例としては、以下に限定されないが、前初期サイトメガロウイルス(CMV)プロモーター、ラウス肉腫ウイルス長末端反復(RSV-LTR)プロモーター、及び前初期シミアンウイルス40(SV40)プロモーターが挙げられる。pol IIIプロモーターの例としては、U6及びH1プロモーターが挙げられる。メタロチオネインプロモーターなどの誘導性プロモーターを使用することができる。プロモーターの他の例としては、T7ファージプロモーター、T3ファージプロモーター、β-ガラクトシダーゼプロモーター、及びSp6ファージプロモーターなどが挙げられる。植物で使用することができるプロモーターとしては、以下に限定されないが、カリフラワーモザイクウイルス35Sプロモーター、トウモロコシUbi-1プロモーター、コムギU6プロモーター、イネU3プロモーター、トウモロコシU3プロモーター、イネアクチンプロモーターが挙げられる。
【0052】
本発明の方法によって編集することができる細胞は、好ましくは真核細胞、例えば以下に限定されないが、哺乳動物細胞、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコの細胞; 家禽、例えばニワトリ、アヒル、ガチョウの細胞; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(arabidopsis thaliana)などの細胞である。本発明のいくつかの実施形態では、細胞は、真核細胞、好ましくは哺乳動物細胞、より好ましくはヒト細胞である。
【0053】
別の態様では、本発明は、細胞のゲノム中の標的配列を改変する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、C2c1タンパク質又はそのバリアントを、細胞のゲノム中の標的配列に標的化させる、方法を提供する。いくつかの実施形態では、標的化は、標的配列中で置換、欠失及び/又は付加された1つ以上のヌクレオチドをもたらす。
【0054】
細胞への本発明の核酸分子(例えば、プラスミド、直鎖状核酸断片、RNAなど)又はタンパク質の「導入」は、核酸又はタンパク質が細胞において機能することができるように、核酸又はタンパク質を使用して細胞を形質転換することを意味する。本発明で使用される場合、「形質転換」は、安定した形質転換及び一過的な形質転換の両方を含む。「安定した形質転換」は、外来配列の安定した遺伝をもたらす、ゲノムへの外因性ヌクレオチド配列の導入を指す。安定して形質転換されると、外因性核酸配列は、その生物及びその後に続く世代のいずれのゲノムにも安定して組み込まれる。「一過的な形質転換」は、外因性配列の安定した遺伝なしに機能を果たす、細胞への核酸分子又はタンパク質の導入を指す。一過的な形質転換では、外因性核酸配列は、ゲノムに組み込まれない。
【0055】
本発明のゲノム編集システムを細胞に導入するために使用することができる方法としては、以下に限定されないが、リン酸カルシウムトランスフェクション、プロトプラスト融合、エレクトロポレーション、リポフェクション、マイクロインジェクション、ウイルス感染(例えば、バキュロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス、レンチウイルス及び他のウイルス)、遺伝子銃法、PEG媒介プロトプラスト形質転換、アグロバクテリウム媒介形質転換が挙げられる。
【0056】
いくつかの実施形態では、本発明の方法は、in vitroで実施される。例えば、細胞は、単離された細胞である。いくつかの実施形態では、細胞は、CAR-T細胞である。いくつかの実施形態では、細胞は、誘導された胚性幹細胞である。
【0057】
他の実施形態では、本発明の方法はまた、in vivoで実施してもよい。例えば、細胞は、生物内の細胞であり、本発明のシステムは、例えばウイルス媒介法によって、in vivoで細胞に導入することができる。例えば、細胞は、患者内の腫瘍細胞であってもよい。
【0058】
別の態様では、本発明は、遺伝子改変細胞を生成する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、C2c1タンパク質又はそのバリアントを、細胞のゲノム中の標的配列に標的化させ、標的配列中で置換、欠失及び/又は付加された1つ以上のヌクレオチドをもたらす、方法を提供する。
【0059】
別の態様では、本発明はまた、本発明の方法によって生成された遺伝子改変細胞又はその子孫細胞を含む、遺伝子改変生物を提供する。
【0060】
本明細書で使用される場合、「生物」は、ゲノム編集に適した任意の生物を含み、真核生物が好ましい。生物の例としては、以下に限定されないが、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ、シロイヌナズナなどが挙げられる。本発明のいくつかの実施形態では、生物は、真核生物、好ましくは哺乳動物、より好ましくはヒトである。
【0061】
「遺伝子改変生物」又は「遺伝子改変細胞」は、そのゲノム内に外因性ポリヌクレオチド又は改変された遺伝子若しくは改変された発現調節配列を含む生物又は細胞を含む。例えば、ポリヌクレオチドが後に続く世代に受け継がれるように、外因性ポリヌクレオチドは、生物又は細胞のゲノム内に安定して組み込まれる。外因性ポリヌクレオチドは、単独でゲノムに組み込まれても、又は組換えDNA構築物の一部として組み込まれてもよい。改変された遺伝子又は改変された発現調節配列は、生物又は細胞のゲノム中に、前記配列が1つ以上のヌクレオチドの置換、欠失、又は付加を含むことを意味する。配列に関して「外因性」は、外来種に由来する配列を意味するか、又は同じ種に由来する場合は意図的なヒトの介入により、その天然の形態から組成及び/又は座位の著しい変化が生じる配列を指す。
【0062】
別の態様では、本発明は、本発明のヌクレアーゼ不活性C2c1タンパク質に基づく遺伝子発現調節システムを提供する。このシステムはまた、標的遺伝子の配列を変えないが、本明細書の範囲内のゲノム編集システムと定義される。
【0063】
いくつかの実施形態では、遺伝子発現調節システムは、以下:
i) ヌクレアーゼ不活性C2c1タンパク質、若しくはヌクレアーゼ不活性C2c1タンパク質と転写リプレッサータンパク質の融合タンパク質、及びガイドRNA;
ii) ヌクレアーゼ不活性C2c1タンパク質若しくはヌクレアーゼ不活性C2c1タンパク質と転写リプレッサータンパク質の融合タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) ヌクレアーゼ不活性C2c1タンパク質若しくはヌクレアーゼ不活性C2c1タンパク質と転写リプレッサータンパク質の融合タンパク質、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) ヌクレアーゼ不活性C2c1タンパク質若しくはヌクレアーゼ不活性C2c1タンパク質と転写リプレッサータンパク質の融合タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物; 又は
v) ヌクレアーゼ不活性C2c1タンパク質若しくはヌクレアーゼ不活性C2c1タンパク質と転写リプレッサータンパク質の融合タンパク質をコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの1つを含む、遺伝子抑制又はサイレンシングシステムである。
【0064】
ヌクレアーゼ不活性C2c1タンパク質又はガイドRNAの定義は上に記載されるとおりである。転写リプレッサータンパク質の選択は、当業者の技能の範囲内である。
【0065】
本明細書で使用される場合、遺伝子抑制又はサイレンシングは、好ましくは転写レベルでの、遺伝子発現の下方制御又は除去を指す。
【0066】
しかし、本発明の遺伝子発現調節システムはまた、ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質を使用することができる。この場合、遺伝子発現調節システムは、遺伝子発現活性化システムである。例えば、本発明の遺伝子発現活性化システムは、以下:
i) ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質、及びガイドRNA;
ii) ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物; 又は
v) ヌクレアーゼ不活性C2c1タンパク質と転写アクチベータータンパク質の融合タンパク質をコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの1つを含んでもよい。
【0067】
ヌクレアーゼ不活性C2c1タンパク質又はガイドRNAの定義は上に記載されるとおりである。転写アクチベータータンパク質の選択は、当業者の技能の範囲内である。
【0068】
本明細書で使用される場合、遺伝子活性化は、好ましくは転写レベルでの、遺伝子発現レベルの上方制御を指す。
【0069】
別の態様では、本発明はまた、疾患の治療における本発明のゲノム編集システムの使用を包含する。
【0070】
本発明のゲノム編集システムにより疾患関連遺伝子を改変することによって、疾患関連遺伝子の上方制御、下方制御、不活性化、活性化、又は変異補正を達成し、それにより、疾患の予防及び/又は治療を達成することが可能である。例えば、本発明において、標的配列は、疾患関連遺伝子のタンパク質コード領域中に位置してもよく、又は、例えば、プロモーター領域若しくはエンハンサー領域などの遺伝子発現調節領域中に位置してもよく、それにより、疾患関連遺伝子の機能的改変又は疾患関連遺伝子の発現の改変が可能になる。
【0071】
「疾患関連」遺伝子は、非疾患対照の組織又は細胞と比較して、疾患の影響を受けた組織に由来する細胞において異常なレベル又は異常な形態で転写産物又は翻訳産物を産生する任意の遺伝子を指す。発現の変化が疾患の出現及び/又は進行に関連している場合、それは、異常に高いレベルで発現されている遺伝子であってもよく、又は、それは、異常に低いレベルで発現されている遺伝子であってもよい。疾患関連遺伝子はまた、疾患の直接の原因であるか、又は疾患の原因である1つ以上の遺伝子との遺伝的連鎖を有する、1つ以上の変異又は遺伝的バリエーションを有する遺伝子を指す。転写産物又は翻訳産物は、公知又は未知であってよく、正常又は異常なレベルであってもよい。
【0072】
したがって、別の態様では、本発明はまた、疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の本発明のゲノム編集システムを送達して、疾患に関連する遺伝子を改変するステップを含む、方法を提供する。
【0073】
別の態様では、本発明はまた、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、本発明のゲノム編集システムの使用であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、使用を提供する。
【0074】
別の態様では、本発明はまた、本発明のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、医薬組成物を提供する。
【0075】
いくつかの実施形態では、対象は、哺乳動物、例えばヒトである。
【0076】
そのような疾患の例としては、以下に限定されないが、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、遺伝性疾患などが挙げられる。
【0077】
別の態様では、本発明はまた、本発明のゲノム編集システム、及び説明書を含む、本発明の方法に使用するためのキットを含む。キットは、一般に、意図される使用及び/又はキットの内容物の使用方法を示すラベルを含む。ラベルという用語は、キット上若しくはキットと共に提供される又は他の方法でキットと共に提供される任意の記載された又は記録された材料を含む。
本発明は以下の態様も提供する。
[1] 以下のi)~v):
i) C2c1タンパク質若しくはそのバリアント、及びガイドRNA;
ii) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) C2c1タンパク質若しくはそのバリアント、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) C2c1タンパク質若しくはそのバリアントをコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
ガイドRNAは、C2c1タンパク質又はそのバリアントと複合体を形成し、C2c1タンパク質又はそのバリアントを細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらすことができ、C2c1タンパク質は、アリサイクロバチルス・アシディフィラス(Alicyclobacillus acidiphilus)に由来するAaC2c1タンパク質である、システム。
[2] AaC2c1タンパク質が、配列番号1に示されるアミノ酸配列を含むか、又はAaC2c1タンパク質のバリアントが、配列番号1と少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%の配列同一性を有するアミノ酸配列を含み、且つ野生型AaC2c1タンパク質のRNA媒介DNA結合活性及び/又はDNA開裂活性を有する、[1]に記載のシステム。
[3] AaC2c1タンパク質のバリアントが、ヌクレアーゼ不活性AaC2c1とデアミナーゼの融合タンパク質であり、デアミナーゼは、例えば、基質として一本鎖DNAを受け入れることができるシトシンデアミナーゼ又は基質として一本鎖DNAを受け入れることができるアデニンデアミナーゼである、[1]に記載のシステム。
[4] ヌクレアーゼ不活性AaC2c1中の野生型AaC2c1タンパク質の785位に対応するアミノ酸が置換されている、[2]又は[3]に記載のシステム。
[5] ヌクレアーゼ不活性AaC2c1が、野生型AaC2c1タンパク質と比較してアミノ酸置換R785Aを含む、[4]に記載のシステム。
[6] ガイドRNAが、sgRNAである、[1]~[5]のいずれかに記載のシステム。
[7] sgRNAが、以下:
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x
-3';
5'-AACTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x
-3';
5'-CTGTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTCTGACGTCGGATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGCTCGCTCAGTGTTATCACTGAGCGAGCGATCTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGAACGATCTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAAAGCTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAGCTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAAACTGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTCAAGCGAGAAGTGGCAC-N
x
-3';
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCTAAGCAGAAGTGGCAC-N
x
-3'; 及び
5'-GTCTAAAGGACAGAATTTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCAAGCGAAGTGGCAC-N
x
-3'
(N
x
は、標的配列の相補体に特異的にハイブリダイズすることができる、x個の連続するヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくは、x=20である)からなる群から選択されるヌクレオチド配列によってコードされる、[6]に記載のシステム。
[8] 細胞のゲノム中の標的配列を部位特異的に改変する方法であって、[1]~[7]のいずれかに記載のシステムを細胞に導入するステップを含む、方法。
[9] 細胞が、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(Arabidopsis)などに由来する、[8]に記載の方法。
[10] 前記システムが、リン酸カルシウムトランスフェクション、プロトプラスト融合、エレクトロポレーション、リポフェクション、マイクロインジェクション、ウイルス感染(例えば、バキュロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス、レンチウイルス及び他のウイルス)、遺伝子銃法、PEG媒介プロトプラスト形質転換、アグロバクテリウム媒介形質転換から選択される方法によって細胞に導入される、[8]又は[9]に記載の方法。
[11] 疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の、[1]~[7]のいずれかに記載のゲノム編集システムを送達して、対象において疾患に関連する遺伝子を改変するステップを含む、方法。
[12] 疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、[1]~[7]のいずれかに記載のゲノム編集システムの使用であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、使用。
[13] [1]~[7]のいずれかに記載のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、医薬組成物。
[14] 対象が、哺乳動物、例えばヒトである、[11]~[13]のいずれかに記載の方法、使用又は医薬組成物。
[15] 疾患が、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、及び遺伝性疾患から選択される、[14]に記載の方法、使用又は医薬組成物。
【実施例】
【0078】
材料及び方法
DNA操作
DNAの調製、消化、ライゲーション、増幅、精製、アガロースゲル電気泳動などを含むDNA操作は、Molecular Cloning: A Laboratory Manualに従って(いくつかの改変を加えて)実施した。
【0079】
簡単に述べると、p11-LacY-wtx1中の消化されたEcoRI部位とSphI部位の間にアニールしたオリゴヌクレオチド(オリゴ)(表1)を連結することによって、PAM配列決定プラスミドを構築し、様々なPAM配列を持つ対応するdsDNA断片をPCR生成した。
【0080】
アニールしたオリゴをBasI消化pUC19-U6-sgRNAベクターに連結することによって、細胞トランスフェクションアッセイのための標的化sgRNAを構築した。
【0081】
sgRNAのin vitro転写のための鋳型を、T7プロモーター配列を含有するプライマーを使用してPCR増幅した。
【0082】
de novo遺伝子合成及びプラスミド構築
PSI-BLASTプログラムによって同定された新しいV-B型CRISPR-C2c1タンパク質コード配列を、ヒト化(コドン最適化)し、全長を合成した。pCAG-2AeGFPベクター及びBPK2014-ccdBベクターを、それぞれC2c1哺乳動物細胞発現及び大腸菌(E. coli)発現に適用した。ガイドRNAを、哺乳動物細胞発現用のpUC19-U6ベクター中に構築した。
【0083】
タンパク質精製
合成C2c1コード配列を、ライゲーション依存性クローニングを使用してBPK2014-ccdB発現ベクター中に構築した。得られた融合構築物は、C末端に融合したHis10タグを含有した。CmR+LB培地中で37℃でOD600 約0.4まで増殖させ、その後0.5mM IPTGによって16℃で16時間誘導して、大腸菌株BL21(λDE3)(Transgen Biotech)中でタンパク質を発現させた。300mLの誘導細胞を、タンパク質精製のために回収し、その後の全てのステップは4℃で実施した。細胞ペレットを、1×プロテアーゼ阻害剤(Rocheコンプリート(complete)、EDTAフリー)を補充した30mLの溶解バッファー(NPI-10: 50mM NaH2PO4、300mM NaCl、10mMイミダゾール、5%グリセロール、pH8.0)中で溶解させ、その後、超音波処理により溶解させた。溶解物を、8,000rpmで4℃で10分間の遠心分離により清澄化し、上清をHis60 Ni Superflow Resin(Takara)と共にバッチで4℃で2時間インキュベートした。それぞれ20mLの洗浄バッファー1(NPI-20: 50mM NaH2PO4、300mM NaCl、20mMイミダゾール、5%グリセロール、pH8.0)、洗浄バッファー2(NPI-40: 50mM NaH2PO4、300mM NaCl、40mMイミダゾール、5%グリセロール、pH8.0)及び洗浄バッファー3(NPI-100: 50mM NaH2PO4、300mM NaCl、100mMイミダゾール、5%グリセロール、pH8.0)で樹脂を非常によく洗浄した後、発現したタンパク質を、5mLの溶出バッファー(NPI-300: 50mM NaH2PO4、300mM NaCl、300mMイミダゾール、5%グリセロール、pH8.0)で溶出した。精製されたC2c1タンパク質を、保存バッファー(Tris-HCl、pH8.0、200mM KCl、0.1mM EDTA pH8.0、1mM DTT、20%グリセロール)を用いて100kDa透析器を使用して一晩透析した。画分をプールし、100kDa遠心分離フィルターユニット(Centrifugal Filter Unit)(Millipore)で濃縮した。富化されたタンパク質の純度を、SDS-PAGE及びクマシー染色によって分析し、濃度を、BCAタンパク質アッセイキット(BCA Protein Assay Kit)(Thermo Fisher)を使用して定量した。
【0084】
in vitro RNA転写
RNAは、HiSribe(商標)T7 Quick High Yield RNA Synthesis Kit(NEB)、及びT7プロモーター配列を持つPCR増幅したDNA鋳型を使用して、in vitroで転写した。転写されたRNAは、Oligo Clean & Concentrator(商標)(ZYMO Research)を使用して精製し、NanoDrop(商標)2000(Thermo Fisher)で定量した。
【0085】
in vitro PAM配列決定
AaC2c1のPAM配列を決定するために、100nM AaC2c1タンパク質、400ngのin vitro転写されたsgRNA、及び様々なPAM配列(表1)を持つPCR生成された二本鎖DNA(dsDNA) 200ngを、開裂バッファー(50mM Tris-HCl、100mM NaCl、10mM MgCl2、pH8.0)中で37℃で1時間インキュベートした。RNase Aを添加してsgRNAを37℃で20分間消化し、続いてRNase Aを75℃で5分間不活性化することによって反応を停止し、約3%アガロースゲル電気泳動及び臭化エチジウム染色によって分離した。
【0086】
dsDNA開裂アッセイ
dsDNA開裂アッセイのため、100nM C2c1タンパク質、400ngのin vitro転写されたsgRNA、及び5'TTTN-PAM配列を含有するPCR生成された二本鎖DNA(dsDNA) 200ngを、開裂バッファー(50mM Tris-HCl、100mM NaCl、10mM MgCl2、pH8.0)中で37℃で1時間インキュベートした(指定されない場合)。
【0087】
AaC2c1の熱安定性を決定するために、開裂反応を、開裂バッファー(50mM Tris-HCl、100mM NaCl、10mM MgCl2、pH8.0)中で1時間、広範囲の温度(4℃~100℃)で実施した。
【0088】
pH耐性アッセイのため、開裂反応を、1.0~13.0の範囲のpHで、開裂バッファー(50mM Tris-HCl、100mM NaCl、10mM MgCl2)中で37℃で1時間実施した。
【0089】
Mg2+依存性アッセイでは、開裂バッファー(50mM Tris-HCl、100mM NaCl、pH8.0)に、EDTA(0mM、1mM、5mM、10mM、20mM及び40mM)又はMg2+(0mM、1mM、5mM、10mM、20mM及び40mM)を補充し、混合物を37℃で1時間インキュベートした。
【0090】
さらなる金属依存性開裂反応を、1又は5mMのCaCl2、MnCl2、SrCl2、NiCl2、FeCl2、CoCl2、ZnCl2又はCuCl2を補充した開裂バッファー(50mM Tris-HCl、100mM NaCl、10mM MgCl2、1mM EDTA、pH8.0)中で37℃で1時間実施した。RNase Aを添加してsgRNAを37℃で20分間消化し、続いてRNase Aを75℃で5分間不活性化することによって反応を停止し、約3%アガロースゲル電気泳動及び臭化エチジウム染色によって分離した。
【0091】
細胞培養、トランスフェクション及び蛍光活性化細胞選別(FACS)
ヒト胎児腎臓(HEK)細胞株HK293Tを、10%ウシ胎児血清及び1%抗生物質-抗真菌剤(Antibiotic-Antimycotic)(Gibco)を補充したダルベッコ改変イーグル培地(Dulbecco's modified Eagle's Medium、DMEM)中で37℃で5%CO2インキュベーションで維持した。マウスエピブラスト幹細胞(EpiSC)株を、アクチビンA(20ng/ml、R&D)及びFGF2(12.5ng/ml、R&D)を含むN2B27培地中でフィブロネクチン上で維持した。HK293T又はEpiSC細胞を、トランスフェクションの1日前に24ウェルプレート(Corning)に播種した。リポフェクタミン(Lipofectamine)LTX(Invitrogen)を使用して、製造業者の推奨プロトコールに従って、細胞をトランスフェクトした。24ウェルプレートの各ウェルについて、合計750ngのプラスミドを使用した。次いで、トランスフェクションの48時間後、MoFlo XDP(Beckman Coulter)を使用してGFP陽性細胞を選別した。
【0092】
ゲノム改変についてのT7エンドヌクレアーゼI(T7EI)アッセイ及び配列決定分析
プラスミドDNAを48時間トランスフェクションした後、回収又はFACS選別したGFP陽性HK293T又はEpiSC細胞を、ゲノムDNA抽出に供した。簡単に述べると、細胞を、バッファーL(Bimake)で直接溶解し、55℃で3時間、及び95℃で10分間インキュベートした。各遺伝子についてCRISPR-C2c1標的部位を取り囲むゲノム領域をPCR増幅した。200~400ngのPCR産物を、最終体積10μLまでのddH2Oと混合し、以前の方法に従ってヘテロ二重鎖形成を可能にするために再アニーリングプロセスに供した。再アニーリング後、生成物を1/10容量のNEBuffer(商標)2.1及び0.2μLのT7EI(NEB)で37℃で30分間処理し、3%アガロースゲル上で分析した。インデル(indel)を、相対バンド強度に基づいて定量した。
【0093】
T7EIアッセイで同定された変異生成物を、TAクローニングベクターpEASY(登録商標)-T1(Transgen Biotech)にクローニングし、コンピテント大腸菌株Trans1-T1(Transgen Biotech)へと形質転換した。一晩培養した後、コロニーを無作為に選び出し、配列決定した。
【0094】
オフターゲット予測及び検出
V-B型CRISPR-C2c1システムは、哺乳動物ゲノムを編集するために利用されてきていないため、オフターゲットを予測する指針はない。
図7の一次データは、シード領域が、スペーサー配列の5'末端の最初の17ヌクレオチド(nt)であり得るといういくらかの参考を提供する。なぜならば、スペーサーが18ntまでトランケート(末端切り詰め)された場合に、最小のオフターゲット開裂活性が検出されたためである。スペーサー配列の5'末端の7番目のミスマッチは、オフターゲットに耐性であるため、ヒトゲノムを、5'TTN-PAM配列を含有する5'末端の14ntシード配列で検索した。14ntシード配列の1つのミスマッチ又は2つの不連続ミスマッチがなお含まれていた。T7EIアッセイを適用して、オフターゲットが存在するかどうかを確認した。
【0095】
部位特異的C2c1遺伝子変異誘発
所望の部位特異的変異及び5'末端オーバーラップを含有する2対のプライマーを遺伝子増幅に使用した。2つのアガロースゲル精製遺伝子断片を、NEBuilder(登録商標)HiFi DNA Assembly Master Mix(NEB)を使用して、製造業者の推奨プロトコールに従って、XmaI及びNheI二重消化哺乳動物発現ベクターに構築した。そして、大腸菌発現ベクターを、消化及びライゲーションに依存した方法を使用して再構築した。
【0096】
実施例1. AaC2c1ヌクレアーゼ活性のin vitro分析
第一に、本発明のA.アシディフィラス(A. acidiphilus)由来のC2c1のPAM配列を、in vitro核酸開裂によって同定した。
図1Aは、AaC2c1、及び様々なPAMを持つ座位を標的化するsgRNAを使用した開裂を示す。図の下の記号「+」は、in vitroでの強力な開裂活性を示す。結果は、AaC2c1のPAMが、5'TTTN-、5'ATTN-、5'GTTN-、5'CTTN-、5'TTC-、5'TTG-、5'TTA-、5'TTT-、5'TAN-、5'TGN-、5'TCN-、5'ATC-であり得ることを示す。
【0097】
第二に、AaC2c1の温度及び酸-塩基耐性を試験した。
図1Bは、広い温度幅(4℃~100℃)でのAaC2c1の開裂活性を示す。
図1Cは、広範囲のpH値(pH1.0~pH13.0)でのAaC2c1開裂活性の分析を示す。結果は、AaC2c1が4℃~100℃で機能することができ、その切断効率が約30℃~60℃でより高いことを示す。AaC2c1は、pH1.0~pH12.0で機能し、pH1.0~pH8.0でより高い切断効率を有する。
【0098】
図2Aは、本出願で同定されたA.アシディフィラス由来のC2c1の細菌ゲノム座位のマップを示す。C2c1遺伝子を含有するA.アシディフィラスのゲノム座位は、配列決定された直接反復(DR)アレイを有しないため、この研究は、報告されたA.アシドテレストリス(A. acidoterrestris)由来の仮定上のcrRNAを採用する。
【0099】
図2Bは、この実施例で使用された大腸菌発現AaC2c1-His
10の段階的精製を示す。
【0100】
図2Cは、サンガー配列決定によって決定された
図1Aの開裂産物の開裂部位を示す。
【0101】
図2Dは、様々な濃度のEDTA及びMg
2+の存在下でのin vitro AaC2c1開裂アッセイを示し、これは、AaC2c1がMg
2+依存性エンドヌクレアーゼであることを示す。
【0102】
図2Eは、選択した金属であるCa
2+、Mn
2+、Sr
2+、Ni
2+、Fe
2+、Co
2+、Zn
2+、Cu
2+の存在下でAaC2c1によって行われたDNA開裂アッセイを示す。図の下の記号「+」は、in vitroでの強力な開裂活性を示す。
【0103】
【0104】
実施例2. 哺乳動物細胞におけるAaC2c1のゲノム編集活性
この実施例は、哺乳動物細胞におけるAaC2c1のゲノム編集活性を検出する。使用した標的配列を以下の表3に示す。
【0105】
図3Aは、AaC2c1 sgRNA-DNA-標的化複合体の概略図である。
【0106】
図3Bは、ヒトRNF2標的化部位で生成されたインデルのT7EI分析を示す。変異を有するレーンの下に示される数字は、インデル率を示す。三角形は、開裂断片を示す。
【0107】
図3Cは、
図3Bの開裂産物のサンガー配列決定を示す。赤い文字は、PAM配列を強調する。
【0108】
T7EIアッセイは、AaC2c1がマウスNrl座位でインデルを誘導することを示す(
図3D)。
図3Eは、
図3DのNrl遺伝子標的化部位1での開裂によって引き起こされた標的化されたアレルの配列を示す。
【0109】
したがって、AaC2c1は、哺乳動物細胞において強力なゲノム編集を媒介することができる。
図4のデータは、この結論をさらに証明する。
図4Aは、T7EI分析において、AaC2c1がマウスApob遺伝子座位でインデルを誘導したことを示す。三角形は、開裂断片を示す。
図4Bは、対応するサンガー配列決定結果を示す。
図4Cは、T7EIアッセイを使用したAaC2c1によるヒトCD34遺伝子上のゲノム標的化を示す。
図4Dは、対応するサンガー配列決定結果を示す。
図4Eは、AaC2c1によって標的化されるヒト内因性RNF2遺伝子の追加の標的を示す。
図4Fは、対応するサンガー配列決定結果を示す。
図4Gは、AaC2c1によって標的化されるヒト内因性RNF2遺伝子の追加の標的を示す。
図4Hは、対応するサンガー配列決定結果を示す。
【0110】
【0111】
【0112】
実施例3. sgRNAの最適化
この実施例は、AaC2c1をゲノム編集に向かわせる単一ガイドRNA(sgRNA)を最適化する。元のsgRNAは、AaC2c1座位中のtracrRNA及びA.アシドテレストリスの推定crRNAに基づいて構築されたsgRNA1である。
【0113】
図6Aは、sgRNA1のステムループ3で5'トランケーション(末端切り詰め)を有するsgRNA足場配列構造の様々なバージョンを示す。
図5Aは、sgRNAのステムループ3のトランケーション及び破壊が、ヒト内因性遺伝子RNF2標的化部位8に対するAaC2c1標的化活性を無効にすることを示す。
図6Bは、sgRNAのステムループ3のトランケーション及び破壊が、in vivoでのAaC2c1標的化活性を無効にすることを示す。
図6Cは、sgRNAのステムループ3のトランケーション及び破壊が、マウス内因性遺伝子Nrl標的化部位1に対するAaC2c1標的化活性を無効にすることを示す。
【0114】
図6Dは、sgRNA1のステムループ2及び1でトランケート(末端切り詰め)及び最適化されたsgRNA足場配列構造の様々なバージョンを示す。
図5Bは、sgRNAのステムループ2のトランケーションが、in vivoでAaC2c1活性を破壊するのに対し、ステムループ1のトランケーションは、AaC2c1エンドヌクレアーゼ活性を維持することを示す。
図5Cは、ステムループ1上のAaC2c1 sgRNAのさらなる最適化及びin vivoでの機能検証を示す。
図6E及びFは、対応するin vitro及びマウス実験から得られた同様の結果を示す。
【0115】
図5D及びEは、様々なオルソロガスsgRNA(
図6G)を伴うAaC2c1が、内因性ヒトRNF2遺伝子を標的化することを示す。T7EIアッセイは、AaC2c1が、A.アシディフィラス、A.カケガウェンシス(A. kakegawensis)及びA.マクロスポランギイヅス(A. macrosporangiidus)に由来するsgRNAと共にin vivoで機能を果たすことができることを示す。
図5Eの右パネルは、A.カケガウェンシスに由来するAkC2c1タンパク質も、哺乳動物細胞においてゲノム編集を可能にすることを示す。
図6J~Mは、対応するin vitro及びマウス実験から得られた結果を示す。
【0116】
図6H及び6Iは、4つの細菌株であるアリサイクロバチルス・アシディフィラス(NBRC 100859)、アリサイクロバチルス・カケガウェンシス(NBRC 103104)、アリサイクロバチルス・マクロスポランギイヅス(Alicyclobacillus macrosporangiidus)(DSM 17980株)、バチルス属種(Bacillus sp.)(NSP2.1)の、それらのsgRNA配列及びC2c1タンパク質配列に基づく進化的関係を示す。
【0117】
【0118】
実施例4. オフターゲット分析及び予測
図7Aの実験結果は、in vivoでのAaC2c1標的化活性に対するプロトスペーサー長の影響を示す。結果は、18ヌクレオチド未満のプロトスペーサー配列が効率的な開裂を達成できたことを示す。
【0119】
図7Bは、in vivoでのAaC2c1標的化活性に対するsgRNA-標的DNA単一ミスマッチの影響を示す。結果は、標的配列の5'末端から7位でのミスマッチに対する耐性を示す。
【0120】
図7Cは、in vivoでのAaC2c1標的化活性に対するsgRNA-標的DNA連続ミスマッチの影響を示す。結果は、AaC2c1が、in vivoでsgRNA-標的DNA連続ミスマッチに対して不耐性であることを示す。
【0121】
図7Dは、AaC2c1、及び可変プロトスペーサー長を持つsgRNAによって媒介される内因性ヒトRNF2遺伝子破壊の効率を示す。エラーバーは、平均値の標準誤差(s.e.m)、n=3を示す。
【0122】
図7の実験結果に基づいて、内因性オフターゲット部位予測及び分析が行われる。
図8Aは、標的部位8によって誘導されたヒト内因性RNF2遺伝子オフターゲット部位のT7EI分析を示す。三角形は、予測される開裂バンドを示す。オフターゲット部位1はRNF2偽遺伝子座位上にあり、まったく同じスペーサー及びPAM配列を有することに留意されたい。レーンの下の記号「*」は、一貫性のない開裂バンドを有するオフターゲット部位を示した。
図8Bは、オフターゲット部位1、18、26、27の代表的な配列を示す。「*」で示される開裂バンドは、PCR増幅によるものと思われる。
【0123】
【0124】
実施例5. DNA開裂に必要なAaC2c1の触媒残基
図9Aは、触媒残基変異を有するAaC2c1ドメイン構造の概略図である。触媒残基は、A.アシドテレストリスC2c1(AacC2c1)(PDB:5WQE)との配列相同性に基づいて同定された。
【0125】
図9Bは、触媒残基変異を有するAaC2c1バリアントのin vitro DNA開裂分析を示す。
図9Cは、T7EI分析によるin vivoでのDNA標的化に対するAaC2c1の触媒残基変異の影響を示す。結果は、R785A変異がin vivo及びin vitroの両方でDNA切断活性を除去することを示した。
【0126】
図9D(上図)は、部位特異的に変異したAaC2c1を使用した、Nb.BtsIでニックの入った(Nb.BtsI-nicked)dsDNA断片のin vitro開裂の概略図である。
図9D(下図)ではニックの入ったdsDNAは、AaC2c1バリアント(R785A)によってin vitroで開裂できなかった。R785Aを含むAaC2c1バリアントは、エンドヌクレアーゼ活性のないバリアントであることがわかる。このようなdC2c1バリアントは、AaC2c1の使用を著しく拡張することができる。
【0127】
図10は、AacC2c1、AaC2c1、AkC2c1、AmC2c1及びBsC2c1のタンパク質アラインメントを示す。AacC2c1、AaC2c1、AkC2c1、AmC2c1及びBsC2c1のアミノ酸配列の多重配列アラインメントは、高度に保存された残基を示す。厳密に同一の残基は赤い背景で強調され、保存された変異はアウトライン及び赤フォントで強調されている。二次構造予測は、アラインメントの上に強調表示されている。アルファ-ヘリックスはカールした記号として示され、ベータ-ストランドは矢印として示されている。厳密なアルファ-ターンはTTTと表現され、厳密なベータ-ターンはTTと表現されている。
【0128】
【配列表】