(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-04
(45)【発行日】2022-07-12
(54)【発明の名称】ゲノム編集のためのシステム及び方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20220705BHJP
C12N 15/11 20060101ALI20220705BHJP
A61K 38/54 20060101ALI20220705BHJP
A61P 35/00 20060101ALI20220705BHJP
A61P 29/00 20060101ALI20220705BHJP
A61P 25/16 20060101ALI20220705BHJP
A61P 9/00 20060101ALI20220705BHJP
A61P 25/28 20060101ALI20220705BHJP
A61P 25/36 20060101ALI20220705BHJP
A61P 25/18 20060101ALI20220705BHJP
A61P 27/02 20060101ALI20220705BHJP
A61K 31/7105 20060101ALI20220705BHJP
A61K 48/00 20060101ALI20220705BHJP
A61K 31/7088 20060101ALI20220705BHJP
A61K 35/76 20150101ALI20220705BHJP
A61K 35/74 20150101ALI20220705BHJP
C12N 15/55 20060101ALN20220705BHJP
C12N 9/16 20060101ALN20220705BHJP
【FI】
C12N15/09 110
C12N15/11 Z ZNA
A61K38/54
A61P35/00
A61P29/00
A61P25/16
A61P9/00
A61P25/28
A61P25/36
A61P25/18
A61P27/02
A61K31/7105
A61K48/00
A61K31/7088
A61K35/76
A61K35/74 D
C12N15/55
C12N9/16 Z
(21)【出願番号】P 2019555026
(86)(22)【出願日】2018-04-10
(86)【国際出願番号】 CN2018082446
(87)【国際公開番号】W WO2018188571
(87)【国際公開日】2018-10-18
【審査請求日】2019-12-18
(31)【優先権主張番号】201710228595.X
(32)【優先日】2017-04-10
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】512256605
【氏名又は名称】インスティテュート オブ ズーオロジー、チャイニーズ アカデミー オブ サイエンシーズ
(74)【代理人】
【識別番号】110002572
【氏名又は名称】特許業務法人平木国際特許事務所
(72)【発明者】
【氏名】リー,ウェイ
(72)【発明者】
【氏名】ゾウ,キー
(72)【発明者】
【氏名】テン,フェイ
【審査官】大久保 智之
(56)【参考文献】
【文献】国際公開第2016/205711(WO,A1)
【文献】国際公開第2017/004261(WO,A1)
【文献】Database GenBank, [online], Accession No.OLA16049.1, <http://www.ncbi.nlh.gov/protein/OLA16049.1>, 23-DEC-2016 uploaded, [retrieved 05-JAN-2021]
【文献】Cell, Volume 163, Issue 3, 22 October 2015, Pages 759-771
(58)【調査した分野】(Int.Cl.,DB名)
C12N
A61K
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
GenBank/EMBL/DDBJ/GeneSeq
UniProt/GeneSeq
(57)【特許請求の範囲】
【請求項1】
配列番号
30のヌクレオチド配列によってコードされるcrRNA足場配列を含むか、又はそのコード配列が配列番号
30に示される配列を含む、crRNA。
【請求項2】
crRNAが、5'-ATTTCTACTATGGTAGAT(配列番号30)-N
x-3'(N
xは、x個の連続したヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくはx=23である)
のヌクレオチド配列によってコードされる、請求項
1に記載のcrRNA。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝子工学の分野に関する。特に、本発明は、新規な真核生物ゲノム編集システム及び方法に関する。より具体的には、本発明は、真核細胞のゲノムを効率的に編集することができるCRISPR-Cpf1システム及びその使用に関する。
【背景技術】
【0002】
CRISPR(クラスター化規則的配置短回文配列リピート(Clustered regular interspaced short palindromic repeats))システムは、外来遺伝子の侵入に対して防御するために細菌の進化中に生成された免疫システムである。それらの中で、II型CRISPR-Cas9システムは、2つの小分子RNA(crRNA及びtracrRNA)又は人工的に合成された小分子RNA(sgRNA)によって媒介されるCas9タンパク質によるDNA開裂のためのシステムであり、最初に発見された3つの(I、II、III型)CRISPRシステムのうち最も単純なシステムである。操作が容易なため、このシステムは、2013年に首尾よく操作され、真核生物のゲノム編集を首尾よく達成した。CRISPR/Cas9システムは、すぐに生命科学で最も人気のある技術になった。
【0003】
2015年に、Zhang et al.は、配列アラインメント及び組織的分析により、CRISPR-Cas9システムとは異なる新しい遺伝子編集システムであるCRISPR-Cpf1システムを発見した。このシステムは、ゲノム編集を媒介するために1つの小分子RNA(crRNA)のみを必要とする。自然界には何千ものCRISPRシステムが存在するが、ごくわずかなシステムのみが、真核生物のゲノム編集を首尾よく実施することができる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
効率的な真核生物ゲノム編集を可能にするCRISPR-Cpf1システムに対する必要性が当技術分野に依然として存在する。
【課題を解決するための手段】
【0005】
発明の概要
一態様では、本発明は、以下のi)~v):
i) Cpf1タンパク質、及びガイドRNA;
ii) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) Cpf1タンパク質、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) Cpf1タンパク質をコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
Cpf1タンパク質は、配列番号1~12のアミノ酸配列又は配列番号1~12のうちの1つに対して少なくとも80%の配列同一性を有するアミノ酸配列を含み、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させることができる、システムを提供する。
【0006】
第2の態様では、本発明は、細胞のゲノム中の標的配列を改変する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらす、方法を提供する。
【0007】
第3の態様では、本発明は、疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の本発明のゲノム編集システムを送達して、疾患に関連する遺伝子を改変するステップを含む、方法を提供する。
【0008】
第4の態様では、本発明は、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、本発明のゲノム編集システムの使用であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、使用を提供する。
【0009】
第5の態様では、本発明は、本発明のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、医薬組成物を提供する。
【0010】
第6の態様では、本発明は、配列番号25~33のいずれか1つに対応するcrRNA足場配列を含むか、又はそのコード配列が配列番号25~33のいずれか1つに示される配列を含む、crRNAを提供する。
【図面の簡単な説明】
【0011】
【
図1】25個の新しいCpf1ファミリータンパク質の直列反復配列(DR)のアラインメント。DR配列を持つ21個の成熟crRNAのステム二重鎖は極めて保存されている。
【
図2】Cpf1タンパク質が核に局在したことを示す免疫蛍光法。
【
図3】Cpf1タンパク質の、ヒトDnmt1部位3を編集する能力を示す。A: T7EIアッセイは、9個の選択されたCpf1タンパク質のうち8個が293T細胞においてヒトDnmt1部位3で挿入/欠失(インデル)を達成することができたことを示す。B: 配列決定の結果は、ヒトDnmt1部位3における代表的なインデルを示す。
【
図4】Cpf1タンパク質の、ヒトDnmt1部位1を編集する能力を示す。A: T7EIアッセイは、4個のCpf1タンパク質がヒトDnmt1部位1に対して明らかに標的化されたことを示す。B: 配列決定の結果は、ヒトDnmt1部位1における代表的なインデルを示し、PsCpf1及びSaCpf1は酵素消化アッセイにおいて著しいバンドを有しなかったが、6個のCpf1タンパク質はインデルを生成することができた。
【
図5】Cpf1タンパク質の、ヒトDnmt1部位2を編集する能力を示す。A: T7EIアッセイは、4個のCpf1タンパク質がヒトDnmt1部位2に対して明らかに標的化されたことを示す。B: 配列決定の結果は、ヒトDnmt1部位2における代表的なインデルを示し、PsCpf1は酵素消化アッセイにおいて著しいバンドを有しなかったが、5個のCpf1はインデルを生成することができた。
【
図6】BsCpf1のPAM配列のin vitroアッセイ。A: BsCpf1タンパク質の大腸菌(E. coli)発現及び精製。B~E: 5'-TTN PAMを使用したBsCpf1の標的化。
【
図7】各Cpf1のPAM配列のin vitroアッセイ。「+」は、in vitro消化活性を示す。
【
図8】HkCpf1の、ヒトAAVS1遺伝子の8個の部位を編集する能力を示す。A: T7EIアッセイの結果。B: 配列決定の結果は、HkCpf1が7個の部位で変異を生成することができ、PAM配列が5'-YYNであることを示し、これは
図7の結果と一致している。
【
図9】4個のCpf1タンパク質が、EpiSC細胞においてマウスゲノムを編集したことを示す。
【
図10】4個のCpf1タンパク質が、EpiSC細胞においてマウスゲノムを編集したことを示す。
【
図11】4個のCpf1タンパク質が、EpiSC細胞においてマウスゲノムを編集したことを示す。
【
図12】マウスにおける様々な標的に対するArCpf1、BsCpf1、HkCpf1、LpCpf1、PrCpf1及びPxCpf1の編集能のさらなる検証。
【
図14A-B】crRNA足場配列の最適化を示す。
【発明を実施するための形態】
【0012】
発明の詳細な説明
1. 定義
本発明において、本明細書で使用される科学用語及び技術用語は、他に明記しない限り、当業者によって一般に理解される意味を有する。また、本明細書で使用されるタンパク質及び核酸化学、分子生物学、細胞及び組織培養、微生物学、免疫学関連用語、及び実験室手順は、対応する分野で広く使用されている用語及び日常的処置である。例えば、本発明で使用される標準的な組換えDNA及び分子クローニング技術は当業者に周知であり、以下の文書により完全に記載されている: Sambrook, J., Fritsch, E.F. and Maniatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989(本明細書において以降、「Sambrook」と呼ばれる)。一方、本発明をよりよく理解するために、関連する用語の定義及び説明を以下に提供する。
【0013】
「Cpf1ヌクレアーゼ」、「Cpf1タンパク質」及び「Cpf1」は、本明細書で互換的に使用され、Cpf1タンパク質又はその断片を含むRNA指向性ヌクレアーゼを指す。Cpf1は、CRISPR-Cpf1ゲノム編集システムの構成要素であり、CRISPR-Cpf1ゲノム編集システムは、ガイドRNA(crRNA)の案内の下でDNA標的配列を標的化及び開裂しDNA二本鎖切断(DSB)を形成する。DSBは、生細胞に本来備わっている修復機構である非相同末端結合(NHEJ)及び相同組換え(HR)を活性化して、細胞におけるDNA損傷を修復することができ、その間に特定のDNA配列に対する部位特異的編集が達成される。
【0014】
「ガイドRNA」及び「gRNA」は、本明細書で互換的に使用することができる。CRISPR-Cpf1ゲノム編集システムのガイドRNAは、典型的には、crRNA分子のみで構成され、crRNAは、標的配列の相補体にハイブリダイズし且つ複合体(Cpf1+crRNA)を標的配列に配列特異的に結合させるのに十分に標的配列と同一である配列を含む。
【0015】
「ゲノム」は、本明細書で使用される場合、核に存在する染色体DNAだけでなく、細胞の細胞内成分(例えば、ミトコンドリア、色素体)に存在するオルガネラDNAも包含する。
【0016】
本明細書で使用される場合、「生物」は、ゲノム編集に適した任意の生物を含み、真核生物が好ましい。生物の例としては、以下に限定されないが、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ、シロイヌナズナなどが挙げられる。
【0017】
「遺伝子改変生物」又は「遺伝子改変細胞」は、そのゲノム内に外因性ポリヌクレオチド又は改変された遺伝子若しくは発現調節配列を含む生物又は細胞を含む。例えば、ポリヌクレオチドが後に続く世代に受け継がれるように、外因性ポリヌクレオチドは、生物又は細胞のゲノム内に安定して組み込まれる。外因性ポリヌクレオチドは、単独でゲノムに組み込まれても、又は組換えDNA構築物の一部として組み込まれてもよい。改変された遺伝子又は発現調節配列は、生物ゲノム又は細胞ゲノム中に、前記配列が1つ以上のヌクレオチドの置換、欠失、又は付加を含むことを意味する。
【0018】
配列に関して「外因性」は、異種に由来する配列を意味するか、又は同じ種に由来する場合は意図的なヒトの介入により、その天然の形態から組成及び/又は座位の著しい変化が生じている配列を指す。
【0019】
「ポリヌクレオチド」、「核酸配列」、「ヌクレオチド配列」又は「核酸断片」は、互換的に使用され、合成、非天然、又は変更されたヌクレオチド塩基を任意選択で含有する、一本鎖又は二本鎖のRNA又はDNAポリマーである。ヌクレオチドは、次のようにそれらの一文字名によって言及される: 「A」はアデノシン又はデオキシアデノシン(それぞれRNA又はDNAに対応する)であり、「C」はシチジン又はデオキシシチジンを意味し、「G」はグアノシン又はデオキシグアノシンを意味し、「U」はウリジンを表し、「T」はデオキシチミジンを意味し、「R」はプリン(A又はG)を意味し、「Y」はピリミジン(C又はT)を意味し、「K」はG又はTを意味し、「H」はA又はC又はTを意味し、「I」はイノシンを意味し、「N」は任意のヌクレオチドを意味する。
【0020】
「ポリペプチド」、「ペプチド」、及び「タンパク質」は、アミノ酸残基のポリマーを指すために本発明で互換的に使用される。これらの用語は、1つ以上のアミノ酸残基が、対応する天然に存在するアミノ酸の人工化学的類似体である、アミノ酸ポリマーに、及び天然に存在するアミノ酸ポリマーに適用される。用語「ポリペプチド」、「ペプチド」、「アミノ酸配列」、及び「タンパク質」はまた、グリコシル化、脂質連結、硫酸化、グルタミン酸残基のγカルボキシル化、及びADPリボシル化を含むがこれらに限定されない修飾形態を含み得る。
【0021】
配列「同一性」は、当技術分野で認識されている意味を有し、2つの核酸又はポリペプチド分子又は領域間の配列同一性のパーセンテージは、開示されている技術を使用して計算することができる。配列同一性は、ポリヌクレオチド又はポリペプチドの全長に沿って、又は分子の領域に沿って測定することができる(例えば、Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; 及びSequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991を参照のこと)。2つのポリヌクレオチド又はポリペプチド間の同一性を測定するための多くの方法があるが、用語「同一性」は、当業者に周知である(Carrillo, H. & Lipman, D., SIAM J Applied Math 48: 1073 (1988))。
【0022】
ペプチド又はタンパク質における適切な保存されたアミノ酸置換は、当業者に公知であり、一般に、得られる分子の生物学的活性を変えることなく行うことができる。一般に、当業者は、ポリペプチドの非必須領域における単一アミノ酸置換が、生物学的活性を実質的に変化させないことを認識している(例えば、Watson et al., Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. co., p.224を参照のこと)。
【0023】
本発明で使用される場合、「発現構築物」は、生物における目的のヌクレオチド配列の発現に適した組換えベクターなどのベクターを指す。「発現」は、機能的生成物の産生を指す。例えば、ヌクレオチド配列の発現は、ヌクレオチド配列の転写(例えば、mRNA又は機能的RNAを産生するための転写)、及び/又は前駆体若しくは成熟タンパク質へのRNAの翻訳を指し得る。
【0024】
本発明の「発現構築物」は、直鎖状核酸断片、環状プラスミド、ウイルスベクター、又はいくつかの実施形態では、翻訳可能なRNA(例えば、mRNA)であり得る。
【0025】
本発明の「発現構築物」は、異なる起源に由来する目的の調節配列及びヌクレオチド配列、又は同じ起源に由来するものであるが通常天然に生じるものとは異なる様式で配置された目的の調節配列及びヌクレオチド配列を含み得る。
【0026】
「調節配列」及び「調節エレメント」は、コード配列の上流(5'非コード配列)、中央又は下流(3'非コード配列)に位置し、関連するコード配列の転写、RNAプロセシング又は安定性又は翻訳に影響を及ぼすヌクレオチド配列を指すために互換的に使用される。調節配列としては、以下に限定されないが、プロモーター、翻訳リーダー、イントロン、及びポリアデニル化認識配列が挙げられる。
【0027】
「プロモーター」は、別の核酸断片の転写を制御することができる核酸断片を指す。本発明のいくつかの実施形態では、プロモーターは、その細胞に由来するかどうかにかかわらず、細胞における遺伝子の転写を制御することができるプロモーターである。プロモーターは、構成的プロモーター又は組織特異的プロモーター又は発生的に調節されるプロモーター又は誘導性プロモーターであってもよい。
【0028】
「構成的プロモーター」は、ほとんどの場合にほとんどの細胞型で一般に遺伝子を発現させることができるプロモーターを指す。「組織特異的プロモーター」及び「組織優先的プロモーター」は、互換的に使用され、それらが、主に(必ずしもこれだけではないが)1つの組織又は器官で発現されることだけでなく、特定の細胞又は細胞型で発現されることをも意味する。「発生的に調節されるプロモーター」は、発生事象によってその活性が決定されるプロモーターを指す。「誘導性プロモーター」は、内因性又は外因性の刺激(環境、ホルモン、化学シグナルなど)に応答して、作動可能に連結されたDNA配列を選択的に発現する。
【0029】
本明細書で使用される場合、用語「作動可能に連結された」は、ヌクレオチド配列の転写が転写調節エレメントによって制御及び調節されるような、調節エレメント(例えば、以下に限定されないが、プロモーター配列、転写終結配列など)の、核酸配列(例えば、コード配列又はオープンリーディングフレーム)への連結を指す。調節エレメント領域を核酸分子に作動可能に連結するための技術は、当技術分野で公知である。
【0030】
生物への核酸分子(例えば、プラスミド、直鎖状核酸断片、RNAなど)又はタンパク質の「導入」は、核酸又はタンパク質が細胞において機能することができるように、核酸又はタンパク質を使用して生物細胞を形質転換することを意味する。本発明で使用される場合、「形質転換」は、安定した形質転換及び一過的な形質転換の両方を含む。
【0031】
「安定した形質転換」は、外来遺伝子の安定した遺伝をもたらす、ゲノムへの外因性ヌクレオチド配列の導入を指す。安定して形質転換されると、外因性核酸配列は、その生物及びその後に続く世代のいずれのゲノムにも安定して組み込まれる。
【0032】
「一過的な形質転換」は、外因性遺伝子の安定した遺伝なしに機能を果たす、細胞への核酸分子又はタンパク質の導入を指す。一過的な形質転換では、外因性核酸配列は、ゲノムに組み込まれない。
【0033】
2. 効率的なゲノム編集システム
一態様では、本発明は、真核生物ゲノム編集における、配列番号1~12のうちの1つに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、さらには100%の配列同一性を有するアミノ酸配列を含むCpf1タンパク質の使用を提供する。
【0034】
別の態様では、本発明は、以下のi)~v):
i) Cpf1タンパク質、及びガイドRNA;
ii) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNA;
iii) Cpf1タンパク質、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) Cpf1タンパク質をコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
Cpf1タンパク質は、配列番号1~12のアミノ酸配列又は配列番号1~12のうちの1つに対して少なくとも80%の配列同一性を有するアミノ酸配列を含み、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させることができる、システムを提供する。
【0035】
本発明の方法のいくつかの実施形態では、ガイドRNAは、crRNAである。いくつかの実施形態では、crRNAのコード配列は、配列番号25~33のいずれか1つに示されるcrRNA足場配列を含む。いくつかの好ましい実施形態では、crRNA足場配列は、配列番号30である。いくつかの実施形態では、cRNAのコード配列は、cRNA足場配列の3'に標的配列の相補体に特異的にハイブリダイズする配列(すなわち、スペーサー配列)をさらに含む。
【0036】
いくつかの実施形態では、crRNAは、以下:
i) 5'-ATTTCTACtgttGTAGAT(配列番号25)-Nx-3';
ii) 5'-ATTTCTACtattGTAGAT(配列番号26)-Nx-3';
iii) 5'-ATTTCTACtactGTAGAT(配列番号27)-Nx-3';
iv) 5'-ATTTCTACtttgGTAGAT(配列番号28)-Nx-3';
v) 5'-ATTTCTACtagttGTAGAT(配列番号29)-Nx-3';
vi) 5'-ATTTCTACTATGGTAGAT(配列番号30)-Nx-3';
vii) 5'-ATTTCTACTGTCGTAGAT(配列番号31)-Nx-3';
viii) 5'-ATTTCTACTTGTGTAGAT(配列番号32)-Nx-3'; 及び
ix) 5'-ATTTCTACTGTGGTAGAT(配列番号33)-Nx-3'
(Nxは、x個の連続したヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくはx=23である)からなる群から選択されるヌクレオチド配列によってコードされる。いくつかの実施形態では、配列Nx(スペーサー配列)は、標的配列の相補体に特異的にハイブリダイズすることができる。
【0037】
本発明の方法のいくつかの実施形態では、細胞は、真核細胞、好ましくは哺乳動物細胞である。
【0038】
本発明の方法のいくつかの実施形態では、Cpf1タンパク質は、配列番号1~12のうちの1つに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又はさらには100%の配列同一性を有するアミノ酸配列を含む。Cpf1タンパク質は、crRNAにより、細胞のゲノム中の標的配列を標的化及び/又は開裂することができる。
【0039】
本発明の方法のいくつかの実施形態では、Cpf1タンパク質は、配列番号1~12のうちの1つに対して1つ以上のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含む。例えば、Cpf1タンパク質は、配列番号1~12のうちの1つに対して1、2、3、4、5、6、7、8、9、10個のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含む。いくつかの実施形態では、アミノ酸置換は、保存的置換である。Cpf1タンパク質は、crRNAにより、細胞ゲノム中の標的配列を標的化及び/又は開裂することができる。
【0040】
本発明のCpf1タンパク質は、アガトバクター・レクタリス(Agathobacter rectalis)、ラクノスピラ・ペクチノスチザ(Lachnospira pectinoschiza)、スネアチア・アムニイ(Sneathia amnii)、ヘルココッカス・クンツィイ(Helcococcus kunzii)、アルコバクター・ブツレリ(Arcobacter butzleri)、バクテロイデス門オーラル(Bacteroidetes oral)、オリバクテリウム属種(Oribacterium sp.)、ブチリビブリオ属種(Butyrivibrio sp.)、プロテオカテラ・スフェニスシ(Proteocatella sphenisci)、カンジダツス・ドジュカバクテリア(Candidatus Dojkabacteria)、シュードブチリビブリオ・キシラニボランス(Pseudobutyrivibrio xylanivorans)、シュードブチリビブリオ・ルミニス(Pseudobutyrivibrio ruminis)から選択される種に由来してもよい。
【0041】
本発明のいくつかの好ましい実施形態では、Cpf1タンパク質は、アガトバクター・レクタリス(Agathobacter rectalis)(ArCpf1)、ブチリビブリオ属種(Butyrivibrio sp.)(BsCpf1)、ヘルココッカス・クンツィイ(Helcococcus kunzii)(HkCpf1)、ラクノスピラ・ペクチノスチザ(Lachnospira pectinoschiza)(LpCpf1)、シュードブチリビブリオ・ルミニス(Pseudobutyrivibrio ruminis)(PrCpf1)又はシュードブチリビブリオ・キシラニボランス(Pseudobutyrivibrio xylanivorans)(PxCpf1)に由来する。本発明のいくつかの好ましい実施形態では、Cpf1タンパク質は、配列番号1、配列番号2、配列番号4、配列番号8、配列番号11、配列番号12から選択されるアミノ酸配列を含む。
【0042】
本発明のいくつかの実施形態では、本発明のCpf1タンパク質は、核局在化配列(NLS)をさらに含む。一般に、Cpf1タンパク質中の1つ以上のNLSは、細胞の核におけるCpf1タンパク質を、ゲノム編集を達成する量まで蓄積させるのに十分な強度を有するべきである。一般に、核局在化活性の強度は、NLSの数、位置、Cpf1タンパク質で使用される1つ以上の具体的なNLS、又はこれらの因子の組み合わせによって決まる。
【0043】
本発明のいくつかの実施形態では、本発明のCpf1タンパク質のNLSは、N末端及び/又はC末端に位置してもよい。いくつかの実施形態では、Cpf1タンパク質は、約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、Cpf1タンパク質は、N末端又はその近くに約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、Cpf1タンパク質は、C末端又はその近くに約1、2、3、4、5、6、7、8、9、10個又はそれを超えるNLSを含む。いくつかの実施形態では、Cpf1タンパク質は、これらの組み合わせを含み、例えば、N末端に1つ以上のNLS及びC末端に1つ以上のNLSを含む。2つ以上のNLSがある場合、それぞれを他のNLSから独立して選択することができる。本発明のいくつかの好ましい実施形態では、Cpf1タンパク質は、2つのNLSを含み、例えば、2つのNLSは、それぞれN末端及びC末端に位置する。
【0044】
一般に、NLSは、タンパク質の表面に露出した正に帯電したリジン又はアルギニンの1つ以上の短い配列からなるが、他の種類のNLSも公知である。NLSの非限定的な例としては、KKRKV(ヌクレオチド配列5'-AAGAAGAGAAAGGTC-3')、PKKKRKV(ヌクレオチド配列5'-CCCAAGAAGAAGAGGAAGGTG-3'又はCCAAAGAAGAAGAGGAAGGTT)、又はSGGSPKKKRKV(ヌクレオチド配列5'-TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG-3')が挙げられる。
【0045】
さらに、編集されるべきDNAの位置に応じて、本発明のCpf1タンパク質はまた、他の局在化配列、例えば細胞質局在化配列、葉緑体局在化配列、ミトコンドリア局在化配列などを含んでもよい。
【0046】
標的細胞で効率的な発現を得るために、本発明のいくつかの実施形態では、Cpf1タンパク質をコードするヌクレオチド配列は、ゲノム編集されるべき細胞が由来する生物に対してコドン最適化される。
【0047】
コドン最適化は、目的の宿主細胞での発現を増強するために、天然アミノ酸配列を維持しながら核酸配列を改変して、天然配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50個、又は約1、2、3、4、5、10、15、20、25、50個を超えるコドン、又はそれらを超えるコドン)を、宿主細胞の遺伝子でより頻繁に又は最も頻繁に使用されるコドンによって置き換えることを指す。異なる種は、特定のアミノ酸の特定のコドンに対して特定の選択を示す。コドン選択(生物間のコドン使用頻度の違い)は、メッセンジャーRNA(mRNA)の翻訳効率に関連することが多く、これは翻訳されるコドンの性質及び特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられている。細胞内の選択されたtRNAの利点は、一般に、ペプチド合成に最も頻繁に使用されるコドンを反映する。したがって、遺伝子は、コドン最適化に基づいて、所与の生物で最もよく発現される遺伝子になるようにカスタマイズすることができる。コドン使用頻度表は、例えば、www.kazusa.orjp/codon/で利用可能なコドン使用頻度データベース(Codon Usage Database)で容易に得ることができ、これらの表は、様々な方法で調整することができる。Nakamura Y. et. al "Codon usage tabulated from the international DNA sequence databases: status for the year 2000 Nucl.Acids Res, 28: 292 (2000)を参照のこと。
【0048】
本発明の方法により編集することができる細胞が由来する生物は、好ましくは真核生物であり、例えば以下に限定されないが哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(arabidopsis thaliana)などである。
【0049】
本発明のいくつかの実施形態では、Cpf1タンパク質をコードするヌクレオチド配列は、ヒトに対してコドン最適化される。いくつかの実施形態では、Cpf1タンパク質をコードするコドン最適化されたヌクレオチド配列は、配列番号13~24から選択される。
【0050】
本発明のいくつかの実施形態では、Cpf1タンパク質をコードするヌクレオチド配列及び/又はガイドRNAをコードするヌクレオチド配列は、プロモーターなどの発現調節エレメントに作動可能に連結される。
【0051】
本発明で使用することができるプロモーターの例としては、以下に限定されないが、ポリメラーゼ(pol)I、pol II又はpol IIIプロモーターが挙げられる。pol Iプロモーターの例としては、ニワトリRNA pol Iプロモーターが挙げられる。pol IIプロモーターの例としては、以下に限定されないが、前初期サイトメガロウイルス(CMV)プロモーター、ラウス肉腫ウイルス長末端反復(RSV-LTR)プロモーター、及び前初期シミアンウイルス40(SV40)プロモーターが挙げられる。pol IIIプロモーターの例としては、U6及びH1プロモーターが挙げられる。メタロチオネインプロモーターなどの誘導性プロモーターを使用することができる。プロモーターの他の例としては、T7ファージプロモーター、T3ファージプロモーター、β-ガラクトシダーゼプロモーター、及びSp6ファージプロモーターなどが挙げられる。植物で使用することができるプロモーターとしては、以下に限定されないが、カリフラワーモザイクウイルス35Sプロモーター、トウモロコシUbi-1プロモーター、コムギU6プロモーター、イネU3プロモーター、トウモロコシU3プロモーター、イネアクチンプロモーターが挙げられる。
【0052】
別の態様では、本発明は、配列番号25~33のいずれか1つに対応するcrRNA足場配列を含む、crRNAを提供する。いくつかの実施形態では、crRNAのコード配列は、配列番号25~33のいずれか1つに示されるcrRNA足場配列を含む。いくつかの好ましい実施形態では、crRNA足場配列は、配列番号30である。いくつかの実施形態では、cRNAのコード配列は、cRNA足場配列の3'に標的配列の相補体に特異的にハイブリダイズする配列(すなわち、スペーサー配列)をさらに含む。
【0053】
いくつかの実施形態では、crRNAは、以下:
i) 5'-ATTTCTACtgttGTAGAT(配列番号25)-Nx-3';
ii) 5'-ATTTCTACtattGTAGAT(配列番号26)-Nx-3';
iii) 5'-ATTTCTACtactGTAGAT(配列番号27)-Nx-3';
iv) 5'-ATTTCTACtttgGTAGAT(配列番号28)-Nx-3';
v) 5'-ATTTCTACtagttGTAGAT(配列番号29)-Nx-3';
vi) 5'-ATTTCTACTATGGTAGAT(配列番号30)-Nx-3';
vii) 5'-ATTTCTACTGTCGTAGAT(配列番号31)-Nx-3';
viii) 5'-ATTTCTACTTGTGTAGAT(配列番号32)-Nx-3'; 及び
ix) 5'-ATTTCTACTGTGGTAGAT(配列番号33)-Nx-3'
(Nxは、x個の連続したヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくはx=23である)からなる群から選択されるヌクレオチド配列によってコードされる。いくつかの実施形態では、配列Nx(スペーサー配列)は、標的配列の相補体に特異的にハイブリダイズすることができる。
【0054】
いくつかの実施形態では、本発明のcrRNAは、ゲノム編集、特に哺乳動物などの真核生物におけるゲノム編集のために、本発明のCpf1タンパク質と組み合わせて使用するのに特に適している。
【0055】
3. 細胞のゲノム中の標的配列を改変する方法
別の態様では、本発明は、細胞のゲノム中の標的配列を改変する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらす、方法を提供する。
【0056】
別の態様では、本発明は、遺伝子改変細胞を作製する方法であって、本発明のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失及び/又は付加をもたらす、方法を提供する。
【0057】
別の態様では、本発明はまた、本発明の方法によって作製された遺伝子改変細胞又はその子孫細胞を含む、遺伝子改変生物を提供する。
【0058】
Cpf1タンパク質及びガイドRNA(すなわち、crRNA)複合体によって認識及び標的化することができる標的配列又はcrRNAコード配列の設計については、例えば、Zhang et al., Cell 163, 1-13, October 22, 2015に見出すことができる。一般に、本発明のゲノム編集システムによって標的化される標的配列の5'末端は、プロトスペーサー隣接モチーフ(PAM)5'-TTTN、5'-TTN、5'-CCN、5'-TCCN、5'-TCN又は5'-CTN(Nは、独立して、A、G、C及びTから選択される)を含む必要がある。
【0059】
例えば、本発明のいくつかの実施形態では、標的配列は、以下の構造: 5'-TYYN-NX-3'又は5'-YYN-NX-3'(Nは、独立して、A、G、C及びTから選択され、Yは、C及びTから選択され; xは、15≦x≦35の整数であり; Nxは、x個の連続したヌクレオチドを表す)を有する。
【0060】
いくつかの実施形態では、crRNAのコード配列は、配列番号25~33のいずれか1つに示されるcrRNA足場配列を含む。いくつかの好ましい実施形態では、crRNA足場配列は、配列番号30である。いくつかの実施形態では、cRNAのコード配列は、cRNA足場配列の3'に標的配列の相補体に特異的にハイブリダイズする配列(すなわち、スペーサー配列)をさらに含む。
【0061】
いくつかの実施形態では、crRNAは、以下:
i) 5'-ATTTCTACtgttGTAGAT(配列番号25)-Nx-3';
ii) 5'-ATTTCTACtattGTAGAT(配列番号26)-Nx-3';
iii) 5'-ATTTCTACtactGTAGAT(配列番号27)-Nx-3';
iv) 5'-ATTTCTACtttgGTAGAT(配列番号28)-Nx-3';
v) 5'-ATTTCTACtagttGTAGAT(配列番号29)-Nx-3';
vi) 5'-ATTTCTACTATGGTAGAT(配列番号30)-Nx-3';
vii) 5'-ATTTCTACTGTCGTAGAT(配列番号31)-Nx-3';
viii) 5'-ATTTCTACTTGTGTAGAT(配列番号32)-Nx-3'; 及び
ix) 5'-ATTTCTACTGTGGTAGAT(配列番号33)-Nx-3'
(Nxは、x個の連続したヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくはx=23である)からなる群から選択されるヌクレオチド配列によってコードされる。いくつかの実施形態では、配列Nx(スペーサー配列)は、標的配列の相補体に特異的にハイブリダイズすることができる。
【0062】
本発明において、改変されるべき標的配列は、ゲノム中の任意の位置、例えば、タンパク質をコードする遺伝子などの機能的遺伝子中に位置してもよく、又は例えば、プロモーター領域若しくはエンハンサー領域などの遺伝子発現調節領域中に位置してもよく、それにより、遺伝子機能の改変又は遺伝子発現の改変を達成することができる。
【0063】
細胞の標的配列における置換、欠失及び/又は付加は、T7EI、PCR/RE又は配列決定法により検出することができる。
【0064】
本発明の方法において、ゲノム編集システムは、当業者に周知の様々な方法により細胞に導入することができる。
【0065】
本発明のゲノム編集システムを細胞に導入するために使用することができる方法としては、以下に限定されないが、リン酸カルシウムトランスフェクション、プロトプラスト融合、エレクトロポレーション、リポフェクション、マイクロインジェクション、ウイルス感染(例えば、バキュロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス、レンチウイルス及び他のウイルス)、遺伝子銃法、PEG媒介プロトプラスト形質転換、アグロバクテリウム媒介形質転換が挙げられる。
【0066】
本発明の方法により編集される細胞は、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコの細胞; 家禽、例えばニワトリ、アヒル、ガチョウの細胞; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(Arabidopsis thaliana)などの細胞であってよい。
【0067】
いくつかの実施形態では、本発明の方法は、in vitroで実施される。例えば、細胞は、単離された細胞である。いくつかの実施形態では、細胞は、CAR-T細胞である。いくつかの実施形態では、細胞は、誘導された胚性幹細胞である。
【0068】
他の実施形態では、本発明の方法はまた、in vivoで実施してもよい。例えば、細胞は、生物内の細胞であり、本発明のシステムは、例えばウイルス媒介法によって、in vivoで細胞に導入することができる。例えば、細胞は、患者内の腫瘍細胞であってもよい。
【0069】
4. 治療適用
本発明はまた、疾患の治療における本発明のゲノム編集システムの使用を包含する。
【0070】
本発明のゲノム編集システムにより疾患関連遺伝子を改変することによって、疾患関連遺伝子の上方制御、下方制御、不活性化、活性化、又は変異補正を達成し、それにより、疾患予防及び/又は治療を達成することが可能である。例えば、本発明において、標的配列は、疾患関連遺伝子のタンパク質コード領域中に位置してもよく、又は、例えば、プロモーター領域若しくはエンハンサー領域などの遺伝子発現調節領域中に位置してもよく、それにより、疾患関連遺伝子の機能的改変又は疾患関連遺伝子の発現改変が可能になる。
【0071】
「疾患関連」遺伝子は、非疾患対照組織又は細胞と比較して、疾患の影響を受けた組織に由来する細胞において異常なレベル又は異常な形態で転写産物又は翻訳産物を産生する任意の遺伝子を指す。発現の変化が疾患の出現及び/又は進行に関連している場合、それは、異常に高いレベルで発現されている遺伝子であってもよく; 又は、それは、異常に低いレベルで発現されている遺伝子であってもよい。疾患関連遺伝子はまた、疾患の直接の原因であるか、又は疾患の原因である1つ以上の遺伝子との遺伝的連鎖を示す、1つ以上の変異又は遺伝的バリエーションを有する遺伝子を指す。転写産物又は翻訳産物は、公知又は未知であってよく、正常又は異常なレベルであってもよい。
【0072】
したがって、本発明はまた、疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の本発明のゲノム編集システムを送達して、疾患に関連する遺伝子を改変するステップを含む、方法を提供する。
【0073】
本発明はまた、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、本発明のゲノム編集システムの使用であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、使用を提供する。
【0074】
本発明はまた、本発明のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、医薬組成物を提供する。
【0075】
いくつかの実施形態では、対象は、哺乳動物、例えばヒトである。
【0076】
そのような疾患の例としては、以下に限定されないが、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、遺伝性疾患などが挙げられる。
【0077】
本発明による疾患及び対応する疾患関連遺伝子のさらなる例は、例えば、中国特許出願CN201480045703.4に見出すことができる。
【0078】
5. キット
本発明の範囲はまた、本発明のゲノム編集システム、及び説明書を含む、本発明の方法に使用するためのキットを含む。キットは、一般に、意図される使用及び/又はキットの内容物の使用方法を示すラベルを含む。ラベルという用語は、キット上若しくはキットと共に提供される又は他の方法でキットと共に提供される任意の記載された又は記録された材料を含む。
本発明は以下の態様も提供する。
[1] 以下のi)~v):
i) Cpf1タンパク質、及びガイドRNA;
ii) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNA; iii) Cpf1タンパク質、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
iv) Cpf1タンパク質をコードするヌクレオチド配列を含む発現構築物、及びガイドRNAをコードするヌクレオチド配列を含む発現構築物;
v) Cpf1タンパク質をコードするヌクレオチド配列及びガイドRNAをコードするヌクレオチド配列を含む発現構築物
のうちの少なくとも1つを含む、細胞のゲノム中の標的配列の部位特異的改変のためのゲノム編集システムであって、
Cpf1タンパク質は、配列番号1~12のアミノ酸配列又は配列番号1~12のうちの1つに対して少なくとも80%の配列同一性を有するアミノ酸配列を含み、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させることができる、システム。
[2] Cpf1タンパク質が、配列番号1~12のうちの1つに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、さらには100%の配列同一性を有するアミノ酸配列を含む、[1]に記載のシステム。
[3] Cpf1タンパク質が、配列番号1~12のうちの1つに対して1つ以上のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含み、例えば、Cpf1タンパク質が、配列番号1~12のうちの1つに対して1、2、3、4、5、6、7、8、9、又は10個のアミノ酸残基の置換、欠失又は付加を有するアミノ酸配列を含む、[1]に記載のシステム。
[4] Cpf1タンパク質が、アガトバクター・レクタリス(Agathobacter rectalis)、ラクノスピラ・ペクチノスチザ(Lachnospira pectinoschiza)、スネアチア・アムニイ(Sneathia amnii)、ヘルココッカス・クンツィイ(Helcococcus kunzii)、アルコバクター・ブツレリ(Arcobacter butzleri)、バクテロイデス門オーラル(Bacteroidetes oral)、オリバクテリウム属種(Oribacterium sp.)、ブチリビブリオ属種(Butyrivibrio sp.)、プロテオカテラ・スフェニスシ(Proteocatella sphenisci)、カンジダツス・ドジュカバクテリア(Candidatus Dojkabacteria)、シュードブチリビブリオ・キシラニボランス(Pseudobutyrivibrio xylanivorans)、シュードブチリビブリオ・ルミニス(Pseudobutyrivibrio ruminis)から選択される種に由来する、[1]に記載のシステム。
[5] Cpf1タンパク質が、配列番号1、配列番号2、配列番号4、配列番号8、配列番号11、及び配列番号12から選択されるアミノ酸配列を含む、[1]に記載のシステム。
[6] Cpf1タンパク質をコードするヌクレオチド配列が、ゲノム編集されるべき細胞が由来する生物に対してコドン最適化される、[1]に記載のシステム。
[7] Cpf1タンパク質をコードするヌクレオチド配列が、配列番号13~24から選択される、[1]に記載のシステム。
[8] ガイドRNAが、crRNAである、[1]に記載のシステム。
[9] crRNAのコード配列が、配列番号25~33のいずれか1つに示されるcrRNA足場配列を含み、好ましくは、配列番号30に示されるcrRNA足場配列を含む、[8]に記載のシステム。
[10] 標的配列が、以下の構造: 5'-TYYN-N
X
-3'又は5'-YYN-N
X
-3'(Nは、独立して、A、G、C及びTから選択され、Yは、C及びTから選択され; xは、15≦x≦35の整数であり; N
x
は、x個の連続したヌクレオチドを表す)を有する、[1]に記載のシステム。
[11] 細胞のゲノム中の標的配列を改変する方法であって、[1]~[10]のいずれかに記載のゲノム編集システムを細胞に導入するステップを含み、それにより、ガイドRNAは、Cpf1タンパク質を、細胞のゲノム中の標的配列に標的化させ、標的配列中の1つ以上のヌクレオチドの置換、欠失又は付加をもたらす、方法。
[12] 細胞が、哺乳動物、例えばヒト、マウス、ラット、サル、イヌ、ブタ、ヒツジ、ウシ、ネコ; 家禽、例えばニワトリ、アヒル、ガチョウ; 単子葉植物及び双子葉植物を含む植物、例えばイネ、トウモロコシ、コムギ、モロコシ、オオムギ、ダイズ、ピーナッツ及びシロイヌナズナ(Arabidopsis thaliana)などに由来する、[11]に記載の方法。
[13] 前記システムが、以下の方法: リン酸カルシウムトランスフェクション、プロトプラスト融合、エレクトロポレーション、リポフェクション、マイクロインジェクション、ウイルス感染(例えば、バキュロウイルス、ワクシニアウイルス、アデノウイルス、アデノ随伴ウイルス、レンチウイルス及び他のウイルス)、遺伝子銃法、PEG媒介プロトプラスト形質転換、アグロバクテリウム媒介形質転換によって細胞に導入される、[11]~[12]のいずれかに記載の方法。
[14] 疾患の治療を必要とする対象においてその疾患を治療する方法であって、対象に、有効量の、[1]~[10]のいずれかに記載のゲノム編集システムを送達して、対象において疾患に関連する遺伝子を改変するステップを含む、方法。
[15] 疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物の製造のための、[1]~[10]のいずれかに記載のゲノム編集システムの使用であって、ゲノム編集システムは、対象において疾患に関連する遺伝子を改変するためのものである、使用。
[16] [1]~[10]のいずれかに記載のゲノム編集システム及び薬学的に許容される担体を含む、疾患の治療を必要とする対象においてその疾患を治療するための医薬組成物であって、ゲノム編集システムは、疾患に関連する遺伝子を改変するためのものである、医薬組成物。
[17] 対象が、哺乳動物、例えばヒトである、[14]~[16]に記載の方法、使用又は医薬組成物。
[18] 疾患が、腫瘍、炎症、パーキンソン病、心血管疾患、アルツハイマー病、自閉症、薬物中毒、加齢黄斑変性、統合失調症、遺伝性疾患から選択される、[17]に記載の方法、使用又は医薬組成物。
[19] 配列番号25~33のいずれか1つに対応するcrRNA足場配列を含むか、又はそのコード配列が配列番号25~33のいずれか1つに示される配列を含む、crRNA。
[20] crRNAが、
i) 5'-ATTTCTACtgttGTAGAT(配列番号25)-N
x
-3';
ii) 5'-ATTTCTACtattGTAGAT(配列番号26)-N
x
-3';
iii) 5'-ATTTCTACtactGTAGAT(配列番号27)-N
x
-3';
iv) 5'-ATTTCTACtttgGTAGAT(配列番号28)-N
x
-3';
v) 5'-ATTTCTACtagttGTAGAT(配列番号29)-N
x
-3';
vi) 5'-ATTTCTACTATGGTAGAT(配列番号30)-N
x
-3';
vii) 5'-ATTTCTACTGTCGTAGAT(配列番号31)-N
x
-3';
viii) 5'-ATTTCTACTTGTGTAGAT(配列番号32)-N
x
-3'; 及び
ix) 5'-ATTTCTACTGTGGTAGAT(配列番号33)-N
x
-3'
(N
x
は、x個の連続したヌクレオチドからなるヌクレオチド配列を表し、Nは、独立して、A、G、C及びTから選択され; xは、18≦x≦35の整数であり、好ましくはx=23である)から選択されるヌクレオチド配列によってコードされる、[19]に記載のcrRNA。
【実施例】
【0079】
材料及び方法
細胞培養及びトランスフェクション
HEK293T、HeLa細胞を、10%FBS(Gibco)及び100U/mlペニシリン及び100ug/mlストレプトマイシンを補充したDMEM培地(Gibco)中で培養し、マウスEpiSC細胞を、bFGFを補充したN2B27培地中で培養した。トランスフェクションの12時間前に、細胞をウェルあたり500,000個の密度で12ウェルプレートに播種した。12時間後、細胞の密度は約60%~70%であり、次いで、リポフェクタミン(Lipofectamine)LTX及びPLUS試薬(Invitrogen)を使用して1.5ug(Cpf1:crRNA=2:1)プラスミドを細胞にトランスフェクトし、培地を、トランスフェクションの前に無血清opti-MEM培地(Gibco)に交換した。トランスフェクション後、それを、トランスフェクション8~12時間後に血清添加DMED培地に交換した。トランスフェクション48時間後に、GFP陽性細胞を、遺伝子型決定のためにFACSによって選別した。
【0080】
遺伝子型分析: T7EI分析及びDNA配列決定
GFP陽性細胞をFACSによって選別し、バッファーL+1/100VプロテアーゼK(Biotool)を用いて55℃で30分間溶解し、95℃で5分間不活性化し、PCR検出に直接使用した。適切なプライマーをCpf1標的化部位の近くに設計し、増幅産物をDNA Clean & Concentrator(商標)-5キット(ZYMO Research)を使用して精製した。200ngの精製PCR産物を、1uLのNEBuffer2(NEB)に添加し、ddH2Oで10uLに希釈した。次いで、以前に報告された方法(Li, W., et al., Simultaneous generation and germline transmission of multiple gene mutations in rat using CRISPR-Cas systems. Nat Biotechnol, 2013. 31(8): p. 684-6)に従って、再アニールさせることによって、ヘテロ二量体を形成させた。再アニールされた生成物に、0.3uLのT7EIエンドヌクレアーゼ及び1/10VのNEBuffer2(NEB)を添加し、37℃で1時間30分間消化した。遺伝子型分析を、3%TAE-ゲル電気泳動によって実施した。インデルを、以前の論文(Cong, L., et al., Multiplex genome engineering using CRISPR/Cas systems. Science, 2013. 339(6121): p. 819-23)に報告された方法に従って計算した。
【0081】
T7EI陽性サンプルに対応するPCR産物を、pEASY-T1又はpEASY-B(Transgen)ベクターに連結し、次いで、形質転換し、播種し、37℃で一晩インキュベートした。サンガー(Sanger)配列決定のために、適切な量の単一コロニーを選んだ。変異体の遺伝子型を、野生型の遺伝子型とのアラインメントによって決定した。
【0082】
免疫蛍光染色
Cpf1真核生物発現ベクターをHeLa細胞に48時間トランスフェクトし、次いで、4%PFAで室温で10分間固定し; PBST(PBS+0.3%Triton X100)で3回洗浄し、2%BSA(+0.3%Triton X100)で室温で15分間ブロッキングし、一次抗体ラット抗-HA(Roche、1:1000)と共に一晩インキュベートし、PBSTで3回洗浄し、Cy3標識蛍光二次抗体(Jackson ImmunoResearch、1:1000)と共に室温で2時間インキュベートした。核をDAPI(Sigma、1:1000)で10分間染色し、PBSTで3回洗浄した。スライドを水性封入剤(Aqueous Mounting Medium)(Abcam)でマウントし、固定した。観察にはZeiss LSM780を使用した。
【0083】
Cpf1タンパク質の原核生物発現及び精製
Cpf1をコードする遺伝子を、原核生物発現ベクターBPK2103/2104にクローニングした。C末端に融合した10×Hisタグを使用して、タンパク質を精製した。発現ベクターをBL21(DE3)大腸菌コンピテント細胞(Transgen)に形質転換した。IPTGが高発現を誘導したクローンを選択し、300mLのCmR+LB培地に接種し、OD600約0.4まで振とうしながら37℃で培養した。IPTGを1mMの最終濃度で添加し、発現を16℃で16時間誘導した。培養物を8000rpm、4℃で10分間遠心分離し、細菌ペレットを回収した。細菌を、40mL NPI-10(+1×EDTAフリープロテアーゼ阻害剤カクテル(Protease Inhibitor Cocktail)、Roche; +5%グリセロール)中で氷浴上で超音波処理破砕(合計時間15分、超音波処理2秒、休止5秒、出力100W)しながら溶解した。破砕後、遠心分離を8000rpm、4℃で10分間行い、上清を回収した。2mLのHis60 Ni Superflow Resin(Takara)を上清に添加し、4℃で1時間振とうし、ポリプロピレンカラム(Qiagen)によって精製した。重力流を使用して、融合His10タグを有しない望ましくないタンパク質を、それぞれ20mLのNPI-20、20mLのNPI-40及び10mLのNPI-100で完全に洗い流した。最後に、融合His10タグを持つCpf1タンパク質を、6×0.5mLのNPI-500でNiカラムから溶出させた。目的の溶出タンパク質を透析液(50mM Tris-HCl、300mM KCl、1mM DTT、20%グリセロール)に対して一晩透析した。透析後のタンパク質溶液を、100kDa Amicon Ultra-4、PLHK Ultracel-PL限外ろ過チューブ(Millipore)で濃縮した。タンパク質濃度を、Micro BCA(商標) Protein Assay Kit(Thermo Scientific(商標))を使用して決定した。
【0084】
RNA in vitro転写
T7プロモーターを持つin vitro転写crRNA鋳型を合成し(BGI)、プロトコールに従ってHiScribe(商標) T7 Quick High Yield RNA Synthesis Kit(NEB)を使用して、crRNAをin vitroで転写した。転写が完了した後、crRNAをOligo Clean & Concentrator(商標)(ZYMO Research)によって精製し、NanoDrop(Thermo Scientific(商標))で濃度について測定し、-80℃で保存した。
【0085】
in vitro消化分析
異なる5'PAM配列を持つ標的配列を合成し、pUC19又はp11-LacY-wtx1ベクターにクローニングし、プライマーで増幅し、精製した。200ngの精製PCR産物を、それぞれ、NEBUffer3(NEB)反応システムで400ngのcrRNA及び50nMのCpf1タンパク質と37℃で1時間反応させた。次いで、それを、12%尿素-TBE-PAGEゲル又は2.5%アガロースゲルでの電気泳動により分析した。
【0086】
標的配列
実験で使用した標的配列を以下の表1に示す:
【0087】
【0088】
実施例1. 新規Cpf1タンパク質の同定
CRISPR/Cpf1(プレボテーラ属(Prevotella)及びフランシセラ属(Francisella)由来のクラスター化規則的配置短回文配列リピート1(Clustered Regularly Interspaced Short Palindromic Repeats from Prevotella and Francisella 1))は、プレボテーラ属(Prevotella)及びフランシセラ属(Francisella)で見られる獲得免疫機構であり、DNA編集のために首尾よく操作された(Zetsche, B., et al., Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system. Cell, 2015. 163(3): p. 759-71.)。CRISPR/Cas9とは異なり、Cpf1は1つのcrRNAのみをガイドとして必要とし、tracrRNAは不要であり、Cpf1タンパク質はTリッチPAM配列を使用する。
【0089】
本発明者らは、既に報告されているAsCpf1、LbCpf1及びFnCpf1を使用してNCBIデータベースでPSI-Blast検索を行い、25個の未報告Cpf1タンパク質を選択したが、そのうち21個のCpf1タンパク質は直列反復(DR)配列を有する。
【0090】
配列アラインメントにより、異なるCpf1タンパク質由来の21個のDRの配列及びRNA二次構造が、かなり保存されていることが見出された(
図1)。保存されたcrRNAに加えて、全てのCpf1タンパク質のPAM配列も保存されていた(すなわち、全てTリッチPAM配列を使用する)という仮説に基づいて、25個のCpf1タンパク質のうち12個を候補として選択した。選択された12個の候補Cpf1タンパク質の具体的な情報を以下の表2に示す:
【0091】
【0092】
実施例2. Cpf1タンパク質の、ヒトゲノムを編集する能力の検証
コドン最適化をヒトにおける発現のために行い、12個の選択されたタンパク質コード配列を合成し(BGI)、真核生物発現ベクター(pCAG-2AeGFP-SV40及びpCAG-2AeGFP-SV40_v4)及び原核生物発現ベクター(BPK2103-ccdB及びBPK2014-ccdB)にクローニングした。
【0093】
HeLa細胞トランスフェクション実験により、本発明者らは、選択したCpf1タンパク質が、核で明らかに発現できることを見出すことができる(
図2)。
【0094】
次に、ヒトDnmt1遺伝子を標的化するcrRNAとの293T細胞への同時トランスフェクション、並びにPCR及びT7EI消化による同定によって、8個のCpf1タンパク質(Ab、Ar、Bo、Bs、Hk、Lp、Ps、Sa)が293T細胞においてDnmt1遺伝子の部位3に変異を誘導することが見出された(
図3A)。DNA配列決定は、遺伝子部位が遺伝的変異を生成したことをさらに確認した(
図3B)。
【0095】
同定されたCpf1タンパク質が哺乳動物ゲノムにおいて変異を誘導できることをさらに実証するために、Dnmt1遺伝子の部位1及び2を使用して、上記の実験を繰り返した。T7EI消化の結果は、4個のタンパク質ArCpf1、BsCpf1、HkCpf1及びLpCpf1が、両方の部位で著しいインデルを生成したことを明らかにした(
図4A及び5A)。DNA配列決定の結果は、上記の4個のタンパク質に加えて、PsCpf1及びSaCpf1も遺伝子における変異を引き起こしたことを示した(
図4B及び5B)。
【0096】
実施例3. PAM配列の同定
同定されたCpf1タンパク質のPAM配列を決定するため、最初に、詳細な研究のためにBsCpf1タンパク質を選択した。
【0097】
BsCpf1を大腸菌で発現させ、Hisタグによって精製した(
図6A)。精製されたBsCpf1タンパク質及び対応するcrRNA及びdsDNA断片(ヒトDnmt1標的部位2)を37℃で1時間インキュベートし、次いで、TBE変性PAGEゲル電気泳動に供し、これにより、BsCpf1のPAM配列が5'(T)TTN-であることが判明した(
図6B~E)。
【0098】
次いで、残りのCpf1タンパク質のPAM配列を同様の方法で同定したが、その結果を
図7に示す。実験結果は、選択したCpf1タンパク質が全てin vitro酵素活性を有することを示す。これらのCpf1タンパク質のうちの9個のPAM配列は、5'(T)TTN-である。C6Cpf1、HkCpf1及びPsCpf1のPAM配列は、5'(T)YYN-である。
【0099】
HkCpf1のin vivo編集のためのPAM配列が5'(T)YYN-であることを確認するために、HkCpf1ベクターを、それぞれ、ヒトAAVS1遺伝子上の8個の部位における標的化crRNAベクターと共に293T細胞にトランスフェクトした。実験結果(
図8)は、HkCpf1がこれらの部位のうち7個を編集して変異を生成することができたこと、PAM配列が5'(T)YYN-である(
図8Bの下線部分)ことを示す。
【0100】
実施例4. マウスにおけるゲノム編集
これらのCpf1タンパク質の適用性を拡張するために、いくつかのトランスフェクション実験をマウスEpiSC細胞株で行った。
【0101】
最初に、本発明者らは、BsCpf1ベクター、及びマウスTet1遺伝子上の8個の部位をそれぞれ標的化するcrRNAベクター(pUC19-crRNA)をEpiSC細胞にトランスフェクトした。T7EI消化及びDNA配列決定により、BsCpf1が、部位2、3及び7において遺伝子変異を引き起こしたことが確認された(
図9A)。部位7のPAM配列は5'TTA-であり、この結果は実施例3の結論と一致していた。これは、BsCpf1タンパク質が5'TTN-PAM配列を使用することを示す。
【0102】
次に、ArCpf1、BsCpf1、HkCpf1、及びPxCpf1のDNA編集能を繰り返し検証した。マウスMeCP2遺伝子上の8個の部位を標的化するcrRNAベクター(pUC19-crRNA)を使用して、同時トランスフェクションを行った。T7EI消化及びDNA配列決定を使用して、ArCpf1(
図10D、E)、BsCpf1(
図9B、C)、HkCpf1(
図10F、G)及びPxCpf1(
図11H、I)がマウスのゲノムを標的化し、編集することができることが実証された。
【0103】
さらに、ArCpf1、BsCpf1、HkCpf1、LpCpf1、PrCpf1及びPxCpf1の編集能を、マウスApobの標的部位12、マウスMeCP2の標的部位4、マウスNrlの標的部位1、及びマウスNrlの標的部位7によってさらに検証した。結果を
図12に示し、6個全てのタンパク質がゲノムを編集することができる。部位Nrl-7のPAM配列は5'TTGであり、このことは、BsCpf1及びPrCpf1のPAM配列が5'TTN-であることを示す。
【0104】
上記の実験結果は、本発明で見出された12個のCpf1タンパク質が全てDNA編集能を有し、ArCpf1(配列番号1)、BsCpf1(配列番号8)、HkCpf1(配列番号4)、PxCpf1(配列番号11)、LpCpf1(配列番号2)及びPrCpf1(配列番号12)が、効率的な哺乳動物ゲノム編集を可能にすることを実証している。
【0105】
実施例5. 編集効率を改善するためのcrRNA足場の最適化
この実施例では、各Cpf1タンパク質(表3)のゲノム編集効率を改善するために、哺乳動物ゲノム編集に使用することができる、新しく同定されたCpf1タンパク質のcRNA足場を最適化する。
【0106】
実験結果を
図13に示す。
図13Aは、各Cpf1タンパク質及び異なるcrRNAプラスミドを細胞にトランスフェクトしたことを示し、PCR及びT7EI分析によって、異なるcrRNA足場が、Cpf1タンパク質の編集効率に影響を及ぼすことが実証された。
【0107】
次いで、本発明者らは、BsCpf1又はPrCpf1によりそれぞれトランスフェクトされたcrRNA変異体のライブラリーを確立した。PCR及びT7EI分析により、Cpf1が哺乳動物ゲノムを効率的に編集することを可能にするcrRNA変異体をスクリーニングした。
【0108】
crRNA31変異体の編集効率は、当該株のゲノムに由来する野生型crRNA足場(crRNA2)の編集効率よりも著しく高かった。細胞にCpf1、crRNA31、及びcrRNA2プラスミドをトランスフェクトし、PCR及びT7EI分析によって、crRNA31が部位MeCP2-4でArCpf1、BsCpf1、HkCpf1、PrCpf1、及びPxCpf1の5個のCpf1の編集効率を2倍に増加させることができることが確認された(
図13B)。
【0109】
図14A及びBは、T7EIによる異なる標的部位の分析により、スクリーニングされたcRNA足場がBsCpf1及びPrCpf1の編集効率を改善できることが確認されることを示す。PrCpf1の場合、crRNA31足場に加えて、crRNA77、crRNA129及びcrRNA159足場も、部位Nrl-1での編集効率を有意に改善することができる。
【0110】
図14Cは、フローサイトメトリーによる細胞内GFP編集効率の分析を示す。crRNA31足場はBsCpf1及びPrCpf1の編集効率を改善することができ、crRNA77及びcrRNA159もPrCpf1の編集効率を有意に改善することができる。
【0111】
【0112】
【配列表】