(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023168564
(43)【公開日】2023-11-24
(54)【発明の名称】RNA誘導性ヒトゲノム改変
(51)【国際特許分類】
C12N 15/09 20060101AFI20231116BHJP
C12N 15/55 20060101ALN20231116BHJP
C12N 1/19 20060101ALN20231116BHJP
C12N 5/10 20060101ALN20231116BHJP
C12N 7/01 20060101ALN20231116BHJP
【FI】
C12N15/09 110
C12N15/55 ZNA
C12N1/19
C12N5/10
C12N7/01
【審査請求】有
【請求項の数】17
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023173277
(22)【出願日】2023-10-04
(62)【分割の表示】P 2021000280の分割
【原出願日】2013-12-16
(31)【優先権主張番号】61/738,355
(32)【優先日】2012-12-17
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/779,169
(32)【優先日】2013-03-13
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507044516
【氏名又は名称】プレジデント アンド フェローズ オブ ハーバード カレッジ
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(72)【発明者】
【氏名】チャーチ、 ジョージ エム.
(72)【発明者】
【氏名】マリ、 プラシャント
(72)【発明者】
【氏名】ヤン、 ルハン
(57)【要約】
【課題】真核細胞を改変する方法の提供。
【解決手段】真核細胞のゲノムDNAに相補的なRNAをコードする核酸を真核細胞にトランスフェクトすること、および前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記真核細胞にトランスフェクトすることを含み、前記細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素がゲノムDNAを部位特異的に切断する、真核細胞を改変する方法を提供する。
【選択図】なし
【特許請求の範囲】
【請求項1】
真核細胞のゲノムDNAに相補的なRNAをコードする核酸を真核細胞にトランスフェクトすること、および
前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記真核細胞にトランスフェクトすること、
を含み、
前記細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、真核細胞を改変する方法。
【請求項2】
前記酵素がCas9である、請求項1に記載の方法。
【請求項3】
前記真核細胞が、酵母細胞、植物細胞、または哺乳動物細胞である、請求項1に記載の方法。
【請求項4】
前記RNAが、約10ヌクレオチド~約250ヌクレオチドを含む、請求項1に記載の方法。
【請求項5】
前記RNAが、約20ヌクレオチド~約100ヌクレオチドを含む、請求項1に記載の方法。
【請求項6】
真核細胞のゲノムDNAに相補的なRNAをコードする核酸をヒト細胞にトランスフェクトすること、および
前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記ヒト細胞にトランスフェクトすること
を含み、
前記ヒト細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、ヒト細胞を改変する方法。
【請求項7】
前記酵素がCas9である、請求項6に記載の方法。
【請求項8】
前記RNAが、約10ヌクレオチド~約250ヌクレオチドを含む、請求項6に記載の方法。
【請求項9】
前記RNAが、約20ヌクレオチド~約100ヌクレオチドを含む、請求項6に記載の方法。
【請求項10】
真核細胞のゲノムDNA上の異なる部位に相補的なRNAをコードする複数の核酸を真核細胞にトランスフェクトすること、および
前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記真核細胞にトランスフェクトすること
を含み、
前記細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、複数のゲノムDNA部位で真核細胞を改変する方法。
【請求項11】
前記酵素がCas9である、請求項10に記載の方法。
【請求項12】
前記真核細胞が、酵母細胞、植物細胞、または哺乳動物細胞である、請求項10に記載の方法。
【請求項13】
前記RNAが、約10ヌクレオチド~約250ヌクレオチドを含む、請求項10に記載の方法。
【請求項14】
前記RNAが、約20ヌクレオチド~約100ヌクレオチドを含む、請求項10に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願データ
本願は、2013年3月13日に出願された米国特許仮出願第61/779,169号および2012年12月17日に出願された米国特許仮出願第61/738,355号に基づく優先権を主張するものであり、あらゆる目的のため、その全体が参照により本明細書に組み込まれる。
【0002】
政府利益に関する記述
本発明は、国立衛生研究所により授与されたP50HG005550の下、政府の援助により成されたものである。政府は、本発明に関して一定の権利を有する。
【背景技術】
【0003】
細菌および古細菌のCRISPRシステムは、Casタンパク質と複合体を形成したcrRNAに依存して、侵入するウイルスおよびプラスミドDNA中に存在する相補的配列を分解する(参照文献1~3)。近年、S.pyogenesのII型CRISPRシステムのインビトロ再構築により、通常はトランスにコードされるtracrRNAと融合したcrRNAが、Cas9タンパク質に該crRNAにマッチする標的DNA配列を配列特異的に切断させるのに十分であることが実証された(参照文献4)。
【発明の概要】
【課題を解決するための手段】
【0004】
本開示は文献を数字で参照し、それらは本開示の最後に列挙されている。数字に対応する文献は、完全に引用された場合と同様に、数字に対応する補足文献として参照により本明細書に組み込まれる。
【0005】
本開示のある態様によれば、ゲノムDNAに相補的なRNAおよび該RNAと相互作用する酵素を含む二成分系が真核細胞にトランスフェクトされる。RNAおよび酵素は細胞によって発現される。次いで、RNA/酵素複合体のRNAが相補的ゲノムDNAに結合する。次いで、酵素が前記ゲノムDNAの切断などの機能を果たす。RNAは、約10ヌクレオチド~約250ヌクレオチドを含む。RNAは、約20ヌクレオチド~約100ヌクレオチドを含む。ある態様によれば、酵素は、部位特異的に任意の所望の機能を果たすことができ、そのために酵素が改変されている。ある態様によれば、真核細胞は、酵母細胞、植物細胞、または哺乳動物細胞である。ある態様によれば、酵素は、RNA配列の標的とされたゲノム配列を切断し(参照文献(4~6)参照)、これによりゲノム改変された真核細胞が作り出される。
【0006】
ある態様によれば、本開示は、ゲノムDNAに相補的なRNAをコードする核酸を細胞のゲノム中に含めること、およびゲノムDNA上で所望の機能を果たす酵素をコードする核酸を細胞のゲノム中に含めることにより、ヒト細胞を遺伝子改変する方法を提供する。ある態様によれば、RNAおよび酵素が発現される。ある態様によれば、RNAは相補的ゲノムDNAとハイブリダイズする。ある態様によれば、RNAが相補的ゲノムDNAとハイブリダイズすると、酵素が活性化されて、切断などの所望の機能を部位特異的が果たされる。ある態様によれば、RNAおよび酵素は、細菌II型CRISPRシステムのコンポーネントである。
【0007】
ある態様によれば、真核細胞のゲノムDNAに相補的なRNAをコードする核酸を真核細胞にトランスフェクトすること、および前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記真核細胞にトランスフェクトすることを含み、前記細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、真核細胞を改変する方法が提供される。ある態様によれば、酵素はCas9、改変Cas9、またはCas9のホモログである。ある態様によれば、真核細胞は、酵母細胞、植物細胞、または哺乳動物細胞である。ある態様によれば、RNAは約10ヌクレオチド~約250ヌクレオチドを含む。ある態様によれば、RNAは約20ヌクレオチド~約100ヌクレオチドを含む。
【0008】
ある態様によれば、真核細胞のゲノムDNAに相補的なRNAをコードする核酸をヒト細胞にトランスフェクトすること、および前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記ヒト細胞にトランスフェクトすることを含み、前記ヒト細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、ヒト細胞を改変する方法が提供される。ある態様によれば、酵素はCas9、改変Cas9、またはCas9のホモログである。ある態様によれば、RNAは約10ヌクレオチド~約250ヌクレオチドを含む。ある態様によれば、RNAは約20ヌクレオチド~約100ヌクレオチドを含む。
【0009】
ある態様によれば、真核細胞のゲノムDNA上の異なる部位に相補的なRNAをコードする複数の核酸を真核細胞にトランスフェクトすること、および前記RNAと相互作用して前記ゲノムDNAを部位特異的に切断する酵素をコードする核酸を前記真核細胞にトランスフェクトすることを含み、前記細胞が前記RNAおよび前記酵素を発現し、前記RNAが相補的ゲノムDNAに結合し、前記酵素が前記ゲノムDNAを部位特異的に切断する、複数のゲノムDNA部位で真核細胞を改変する方法が提供される。ある態様によれば、酵素はCas9である。ある態様によれば、真核細胞は、酵母細胞、植物細胞、または哺乳動物細胞である。ある態様によれば、RNAは約10ヌクレオチド~約250ヌクレオチドを含む。ある態様によれば、RNAは約20ヌクレオチド~約100ヌクレオチドを含む。
【図面の簡単な説明】
【0010】
【
図1A】改変II型CRISPRシステムを用いたヒト細胞におけるゲノム編集を示す図である。
【
図1B】改変II型CRISPRシステムを用いたヒト細胞におけるゲノム編集を示す図である。
【
図1C-1】
図1Cは、改変II型CRISPRシステムを用いたヒト細胞におけるゲノム編集を示す図である。
【
図1C-2】
図1Cは、改変II型CRISPRシステムを用いたヒト細胞におけるゲノム編集を示す図である。
【
図2A】複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2B-1】
図2Bは、複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2B-2】
図2Bは、複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2B-3】
図2Bは、複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2C】複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2D】複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2E】複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図2F】複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集を示す図である。
【
図3A-1】
図3Aは、cas9遺伝子挿入断片の発現フォーマットおよび完全配列を示す図である。
【
図3A-2】
図3Aは、cas9遺伝子挿入断片の発現フォーマットおよび完全配列を示す図である。
【
図3B】ガイドRNAのU6プロモーターに基づく発現スキーム、およびRNA転写産物の予想二次構造を示す図である。
【
図4】修復DNAドナー、Cas9タンパク質、およびgRNAの全ての可能な組み合わせの、93TにおいてHRを成功させる能力についての試験を示す図である。
【
図5A】gRNAおよびGas9を介したゲノム編集の分析を示す図である。
【
図5B】gRNAおよびGas9を介したゲノム編集の分析を示す図である。
【
図6A】別個のGFPレポーターコンストラクトをそれぞれ有する3種の293T安定発現細胞株を示す図である。
【
図6B】別個のGFPレポーターコンストラクトをそれぞれ有する3種の293T安定発現細胞株を示す図である。
【
図7】293Tにおいて
図1Bに記載のレポーターの隣接GFP配列を標的化する2種の新たなgRNAを示す図である。
【
図8A】別個のGFPレポーターコンストラクトをそれぞれ有する2種の293T安定発現細胞株を示す図である。
【
図8B】別個のGFPレポーターコンストラクトをそれぞれ有する2種の293T安定発現細胞株を示す図である。
【
図9A】ヒトiPS細胞におけるRNA誘導性NHEJを示す図である。
【
図9B】ヒトiPS細胞におけるRNA誘導性NHEJを示す図である。
【
図9C】ヒトiPS細胞におけるRNA誘導性NHEJを示す図である。
【
図10A】K562細胞におけるRNA誘導性NHEJを示す図である。
【
図10B】K562細胞におけるRNA誘導性NHEJを示す図である。
【
図11A】293T細胞におけるRNA誘導性NHEJを示す図である。
【
図11B】293T細胞におけるRNA誘導性NHEJを示す図である。
【
図12A】dsDNAドナーまたは短鎖オリゴヌクレオチドドナーのいずれかを用いた内在性AAVS1遺伝子座におけるHRを示す図である。
【
図12B】dsDNAドナーまたは短鎖オリゴヌクレオチドドナーのいずれかを用いた内在性AAVS1遺伝子座におけるHRを示す図である。
【
図12C】dsDNAドナーまたは短鎖オリゴヌクレオチドドナーのいずれかを用いた内在性AAVS1遺伝子座におけるHRを示す図である。
【
図13A-1】
図13Aは、ヒトゲノム中の遺伝子を標的とするガイドRNAの多重合成、回収、およびU6発現ベクターのクローニングの方法を示す図である。
【
図13A-2】
図13Aは、ヒトゲノム中の遺伝子を標的とするガイドRNAの多重合成、回収、およびU6発現ベクターのクローニングの方法を示す図である。
【
図13B】ヒトゲノム中の遺伝子を標的とするガイドRNAの多重合成、回収、およびU6発現ベクターのクローニングの方法を示す図である。
【
図14A】CRISPRを介したRNA誘導性転写活性化を示す図である。
【
図14B】CRISPRを介したRNA誘導性転写活性化を示す図である。
【
図14C】CRISPRを介したRNA誘導性転写活性化を示す図である。
【
図14D】CRISPRを介したRNA誘導性転写活性化を示す図である。
【発明を実施するための形態】
【0011】
ある態様では、C末端SV40核局在化シグナルを有するヒトコドン最適化Cas9タンパク質を合成し、哺乳動物発現システムにクローニングする(
図1Aおよび
図3A)。したがって、
図1は、改変II型CRISPRシステムを用いたヒト細胞におけるゲノム編集に関する。
図1Aに示すように、ヒト細胞におけるRNA誘導性の遺伝子標的化には、C末端SV40核局在化シグナルを有するCas9タンパク質を、ヒトU6ポリメラーゼIIIプロモーターから発現される1または複数のガイドRNA(gRNA)と共発現させることを含む。gRNAが標的配列を認識すると、3′末端に正しいプロトスペーサー隣接モチーフ(PAM)が存在する場合にのみ、Cas9がDNA二本鎖を巻き戻して両鎖を切断する。原理的に、GN
20GGの形態のいずれのゲノム配列も標的にすることができる。
図1Bに示すように、終止コドンおよびAAVS1遺伝子座に由来する68bpのゲノム断片の挿入により、ゲノムに組み込まれたGFPコード配列が中断(disrupt)されている。適切なドナー配列との相同組換え(HR)によるGFP配列の回復により、FACSによる定量化が可能なGFP
+細胞が生じる。T1gRNAおよびT2gRNAは、AAVS1断片中の配列を標的にする。TALエフェクターヌクレアーゼヘテロダイマー(TALEN)のそれぞれに対する結合部位を下線で示す。
図1Cに示すように、棒グラフは、FACSにより測定された、標的部位においてT1、T2、またはTALENを介したヌクレアーゼ活性により誘導されるHR効率を示している。代表的なFACSプロットおよび標的細胞の顕微鏡画像を下に示す(スケールバーは100ミクロンである)。データは平均値±SEM(N=3)である。
【0012】
ある態様によれば、Cas9に目的配列を切断させるために、ヒトU6ポリメラーゼIIIプロモーターからcrRNA-tracrRNA融合転写産物(以下、ガイドRNA(gRNA)という)が発現される。ある態様によれば、gRNAは細胞により直接転写される。この態様により、好ましくは、細菌CRISPRシステムが用いるRNAプロセシング機構の再構築が回避される(
図1Aおよび
図3B)(参照文献(4、7~9)参照)。ある態様によれば、Gと20bpのcrRNA標的に続くPAM(プロトスペーサー隣接モチーフ)配列であるNGGとで始まるU6転写を用いてゲノムDNAを改変する方法が提供される。この態様によれば、標的ゲノム部位はGN
20GGの形態である(
図3C参照)。
【0013】
ある態様によれば、本明細書に記載のゲノム改変方法の機能性を試験するため、以前に報告されているアッセイ(参照文献(10)参照)と同様に、293T細胞におけるGFPレポーターアッセイ(
図1B)が開発された。ある態様によれば、発現されたタンパク質断片を非蛍光性にする終止コドンおよびAAVS1遺伝子座に由来する68bpのゲノム断片の挿入により破壊された、ゲノムに組み込まれたGFPコード配列を有する安定発現細胞株が確立された。適切な修復ドナー(repair donor)を用いた相同組換え(HR)により、正常なGFP配列が回復し、これにより、得られたGFP
+細胞の流動標示式細胞分取(flow activated cell sorting)(FACS)による定量化が可能になる。
【0014】
ある態様によれば、相同組換え(HR)の方法が提供される。その間に位置する(intervening)AAVS1断片を標的とする2つのgRNAであるT1およびT2を構築する(
図1b)。それらの活性を、以前に報告されている同じ領域を標的とするTALエフェクターヌクレアーゼヘテロダイマー(TALEN)(参照文献(11)参照)の活性と比較した。3種の標的化試薬を用いた場合の全てにおいてHR現象の成功が観察され、T1gRNAおよびT2gRNAを用いた遺伝子補正率はそれぞれ3%および8%に近かった(
図1C)。RNAを介したこの編集プロセスは顕著に速く、最初の検出可能なGFP
+細胞が出現したのは、AAVS1 TALENではトランスフェクションの約40時間後であったのに比べて、約20時間後であった。HRは、修復ドナー、Cas9タンパク質、およびgRNAを同時に導入した場合にのみ観察されたことから、ゲノム編集には全てのコンポーネントが必要であることが確認された(
図4)。Cas9/crRNAの発現と関連する明らかな毒性は認められなかったが、ZFNおよびTALENを用いた研究では、一方の鎖にのみニックを入れることでさらに毒性が低くなることが示されている。そこで、インビトロでニッカーゼとして機能することが知られているCas9D10A変異体を試験した結果、HRは同様であったが、非相同末端結合(NHEJ)の比率はより低かった(
図5)(参照文献(4、5)参照)。関連するCas9タンパク質がPAMの6bp上流で両鎖を切断することを示す場合(参照文献4)と一致して、NHEJデータから、ほとんどの欠失または挿入が標的配列の3′末端で起こったことが確認された(
図5B)。さらに、標的ゲノム部位の変異が、この部位におけるgRNAによるHRを妨げることが確認され、CRISPRを介したゲノム編集が配列特異的であることが実証された(
図6)。GFP遺伝子における2種のgRNA標的部位、ならびにDNAメチルトランスフェラーゼ3a(DNMT3a)遺伝子およびDNMT3b遺伝子の相同領域に由来するさらに3種のgRNA標的断片が、改変レポーター細胞株において有意なHRを配列特異的に誘導可能であることが示された(
図7、
図8)。全体として、これらの結果は、ヒト細胞におけるRNA誘導性のゲノム標的化により、複数の標的部位で強固(robust)なHRが誘導されることを裏付けている。
【0015】
ある態様によれば、もともと存在する遺伝子座(native locus)が改変された。gRNAを用いて、ほとんどの組織で広範に発現している19番染色体上のPPP1R12C遺伝子中に位置するAAVS1遺伝子座(
図2A)を、293T細胞、K562細胞、およびPGPヒトiPS細胞(参照文献(12)参照)において標的化し、標的遺伝子座の次世代シークエンシングにより結果を分析した。したがって、
図2は、複数の細胞型における、もともと存在するAAVS1遺伝子座のRNA誘導性ゲノム編集に関する。
図2Aに示すように、T1gRNA(赤)およびT2gRNA(緑色)は、19番染色体のAAVS1遺伝子座のPPP1R12C遺伝子のイントロン中の配列を標的とする。
図2Bに示すように、次世代シークエンシングにより定量化された、Cas9およびT1gRNAまたはT2gRNAの発現後の293T細胞、K562細胞、およびPGP1 iPS細胞における、NHEJにより生じる欠失の総カウントおよび位置が示される。赤色および緑色の破線は、T1gRNA標的部位およびT2gRNA標的部位の境界を示している。T1gRNAおよびT2gRNAのNHEJ頻度は、それぞれ、293T細胞で10%および25%、K562細胞で13%および38%、PGP1 iPS細胞で2%および4%であった。
図2Cに示すように、AAVS1遺伝子座でのHRに対するDNAドナーの構造、および標的化現象の成功を検出するためのシークエンシングプライマーの位置(矢印)が示される。
図2Dに示すように、トランスフェクション3日後のPCRアッセイにより、ドナー、Cas9、およびT2gRNAを発現する細胞にみがHR現象の成功を示すことが実証されている。
図2Eに示すように、ゲノム-ドナー境界およびドナー-インサート境界の両方で予想されるDNA塩基が存在することを示す、PCR増幅産物のサンガーシークエンシングによりHRの成功が確認された。
図2Fに示すように、標的化に成功した293T細胞のクローンをピューロマイシンで2週間選択した。2つの代表的GFP+クローンの顕微鏡画像を示す(スケールバーは100ミクロンである)。
【0016】
GFPレポーターアッセイの結果と一致し、3種の細胞型の全てについて、内在性の遺伝子座において多くのNHEJ現象が観察された。2種のgRNAであるT1およびT2はそれぞれ、293T細胞で10%および25%、K562細胞で13%および38%、PGP1-iPS細胞で2%および4%のNHEJ比率を達成した(
図2B)。これらの細胞型のいずれにおいても、NHEJの誘導に必要なCas9およびcrRNAの発現に由来する明白な毒性は観察されなかった(
図9)。予想された通り、T1およびT2に対するNHEJによる欠失は、標的部位の位置を中心としており、この標的化プロセスの配列特異性がさらに検証された(
図9、10、11)。T1gRNAおよびT2gRNAの両方を同時に導入することにより、その間に位置する19bpの断片が高効率で欠失し(
図10)、このアプローチを用いてゲノム座位の多重編集(multiplexed editing)が実現可能であることが実証された。
【0017】
ある態様では、HRを用いて、dsDNAドナーコンストラクト(参照文献(13)参照)またはオリゴドナーを、もともと存在するAAVS1遺伝子座に組み込む(
図2C、
図12)。HRを介した組み込みは、PCR(
図2D、
図12)およびサンガーシークエンシング(
図2E)による両方のアプローチを用いて確認した。293TクローンまたはiPSクローンは、2週間にわたるピューロマイシン選択を用いて改変細胞集団から容易に派生した(
図2F、
図12)。これらの結果は、Cas9がヒト細胞において内在性座位で外来DNAを効率的に組み込むことができることを示している。したがって、本開示のある態様には、相同組換えおよびCas9を用いて細胞のゲノム中に外来DNAを組み込む方法が含まれる。
【0018】
ある態様によれば、単にgRNA発現ベクターの配列を目的の部位中の適合配列にマッチするように改変するだけで他のゲノム部位の改変に容易に適用可能な、RNA誘導性ゲノム編集システムが提供される。この態様では、ヒトゲノム中の遺伝子の約40.5%のエキソンを標的化する、190,000種のgRNAで特異的に標的化可能な配列が作成された。これらの標的配列を、DNAアレイ上での多重合成(multiplex synthesis)に適合する200bpフォーマットに組み込んだ(参照文献(14)参照)(
図13)。この態様によれば、ヒトゲノムにおける潜在的標的部位のすぐに使えるゲノムワイドなリファレンスおよび多重gRNA合成の方法が提供される。
【0019】
ある態様によれば、本明細書に記載される1もしくは複数のまたは多数のRNA/酵素システムを用いて複数の位置で細胞のゲノムを改変することによる、細胞においてゲノム改変を多重化する方法が提供される。ある態様によれば、標的部位は、PAM配列であるNGGおよびgRNAの3′末端の8~12塩基の「シード配列」と完全にマッチする。ある態様によれば、残りの8~12塩基の完全マッチは必要ではない。ある態様によれば、Cas9は、5′末端に1個のミスマッチがあっても機能するであろう。ある態様によれば、標的部位に内在するクロマチン構造およびエピジェネティックな状態がCas9機能の効率に影響を与え得る。ある態様によれば、より高い特異性を有するCas9ホモログが有用な酵素として含まれる。当業者であれば、好適なCas9ホモログを同定および改変することができるであろう。ある態様によれば、CRISPRで標的化可能な配列には、異なるPAM条件(参照文献(9)参照)を有する配列または定向進化(directed evolution)を有する配列が含まれる。ある態様によれば、Cas9ヌクレアーゼドメインの1つを不活性化することにより、NHEJに対するHRの割合が増加し、毒性が低下する可能性があるが(
図3A、
図5)(参照文献4、5)、両方のドメインを不活性化することにより、Cas9が再標的化可能なDNA結合タンパク質として機能することが可能になり得る。本開示の実施形態は、合成生物学(参照文献(21、22)参照)、遺伝子ネットワークの直接的で多重化された撹乱(参照文献(13、23)参照)、ならびにエクスビボ標的遺伝子治療(参照文献(24~26)参照)およびインビボ標的遺伝子治療(参照文献(27)参照)において広く有用である。
【0020】
ある態様によれば、生物学的発見およびインビボスクリーニングのためのモデルシステムとして「再改変可能な生物(re-engineerable organism)」が提供される。ある態様によれば、誘導性Cas9導入遺伝子を有する「再改変可能なマウス」が提供され、複数の遺伝子または調節エレメントを標的とするgRNAのライブラリーの限局的送達(例えばアデノ随伴ウイルスを使用)により、標的組織型において腫瘍を発症させる変異をスクリーニングすることが可能になる。エフェクタードメイン(例えばアクチベーター)を有するCas9ホモログまたはヌクレアーゼ欠損(nuclease-null)変異体の使用により、インビボで遺伝子を多重的に活性化または抑制することが可能になる。この態様によれば、組織再生、分化転換などの表現型を可能にする因子のスクリーニングが可能である。ある態様によれば、(a)DNAアレイの使用により、定義済みgRNAライブラリーの多重合成が可能になり(
図13参照);(b)サイズの小さいgRNA(
図3b参照)がパッケージングされて多くの非ウイルス的送達法またはウイルス的送達法を用いて送達される。
【0021】
ある態様によれば、RNAと塩基対形成したDNA鎖にニックを入れるかその相補鎖にニックを入れるCas9ヌクレアーゼドメインの1つを不活性化することにより、ゲノム工学への応用のための「ニッカーゼ」で観察された、より低い毒性が達成される。両方のドメインを不活性化することにより、Cas9が再標的化可能なDNA結合タンパク質として機能することが可能になる。ある態様によれば、再標的化可能なDNA結合タンパク質であるCas9は、以下に結合する。
【0022】
(a)例えば、限定されるものではないが、クロマチンリモデリング、ヒストン修飾、サイレンシング、遮断、転写機構との直接的相互作用を含む、標的遺伝子の発現調節のための転写活性化ドメインまたは転写抑制ドメイン;
(b)隣接するgRNA-Cas9複合体の二量体化に伴う「高度に特異的な」ゲノム編集を可能にするためのFokIなどのヌクレアーゼドメイン;
(c)ゲノム座位および染色体動態を可視化するための蛍光タンパク質;または
(d)タンパク質または核酸が結合した有機フルオロフォア、量子ドット、分子ビーコン(molecular beacon)、およびエコープローブまたは分子ビーコン代替物などのその他の蛍光分子;
(e)ゲノムワイドな3次元構造のプログラム可能な操作を可能にする多価リガンド結合タンパク質ドメイン。
【0023】
ある態様によれば、転写活性化コンポーネントおよび転写抑制コンポーネントは、gRNAがCasのアクチベーター群またはリプレッサー群にのみ結合するように、天然または合成的に直交性の(orthogonal)CRISPRシステムを用いることができる。これにより、多くのセットのgRNAが複数の標的を調整することが可能になる。
【0024】
ある態様によれば、一つにはRNAのサイズがmRNAより小さいため(それぞれ100ヌクレオチド長対2000ヌクレオチド長)、gRNAの使用により、mRNA以上に多重化する能力がもたらされる。これは、ウイルスパッケージングの場合のように、核酸送達がサイズで制限される場合に特に有用である。これにより、切断、ニッキング、活性化、または抑制、あるいはその組み合わせの複数の例が可能になる。複数の制御標的を容易に標的とする能力により、特定の制御因子の下流のもともと存在する制御回路に制限されない、粗調整もしくは微調整(coarse-or-fine-tuning)または制御ネットワークが可能になる(例えば、線維芽細胞からIPSCへのリプログラミングには4つのmRNAが用いられる)。多重化の応用の例としては、以下が含まれる。
【0025】
1.ヒト(または動物)の組織/臓器移植のための、(主要または非主要)組織適合性アレル、ハプロタイプ、および遺伝子型の確立。この態様により、例えば、HLAホモ接合性の細胞株もしくはヒト化動物品種、またはそのようなHLAアレルをその他の点では望ましい細胞株もしくは品種に付加することができるgRNAのセットが得られる。
【0026】
2.単一細胞(または細胞のコレクション)における多重的なシス調節エレメント(CRE=転写、スプライシング、翻訳、RNAおよびタンパク質のフォールディング、分解などのためのシグナル)の変異を、正常な発達、または病理学的、合成的、もしくは薬学的シナリオで起こり得る制御的相互作用の複雑なセットの効率的な研究に用いることができる。ある態様によれば、CREは、ある程度直交性である(すなわち、クロストークが少ない)(またはそのようにされ得る)ので、例えば費用のかかる動物胚の時系列など、1つの設定で多くを試験することができる。応用例の1つは、RNA蛍光in situシークエンシング(FISSeq)を用いたものである。
【0027】
3.CRE変異および/またはCREのエピジェネティックな活性化もしくは抑制の多重的組み合わせを用いて、iPSCもしくはESCまたは他の幹細胞もしくは非幹細胞を、医薬品(小分子、タンパク質、RNA、細胞、動物細胞、植物細胞、または微生物細胞、エアロゾル、および他の送達方法)、移植戦略、パーソナル化戦略などを試験するための、organs-on-chipsまたは他の細胞および臓器培養において使用するための、任意の細胞型または細胞型の組み合わせへと改変または再プログラムすることができる。
【0028】
4.遺伝医学のための診断試験(および/またはDNAシークエンシング)に用いるための多重変異ヒト細胞の作製。染色体上の位置およびヒトゲノムアレル(またはエピジェネティックな標識)の構成が臨床的遺伝子診断の精度に影響を与え得る範囲で、アレルが、異所的(すなわちトランスジェニック)な位置または別々の合成DNA断片中にではなく、参照ゲノム中の正確な位置に存在することが重要である。ある実施形態は、各診断用ヒトSNPにつき1系統の一連の独立した細胞株、または構造的変異株である。あるいは、ある実施形態は、同一細胞におけるアレルの多重セットを含む。場合によっては、独立した試験という仮定のもとで、1つの遺伝子(または複数の遺伝子)における多重変化が望ましい。別の場合には、特定のハプロタイプのアレルの組み合わせにより、ハプロタイプ相(haplotype phase)(すなわち、個人または個々の体細胞型において遺伝子の一方または両方のコピーが影響を受けるかどうか)を正確に確立するシークエンシング(ジェノタイピング)法の試験が可能になる。
【0029】
5.微生物、植物、動物、またはヒト細胞において改変Cas+gRNAシステムを用いて反復エレメントまたは内在性ウイルスエレメントを標的化して、有害な転位を低減すること、または(ほぼ同一のコピーが問題となり得る)シークエンシングもしくは他の分析的なゲノム/トランスクリプトーム/プロテオミクス/診断用のツールを補助することができる。
【0030】
上記セクション中で数字により特定される以下の参照文献は、その全体が参照により組み込まれる。
1. B. Wiedenheft, S. H. Sternberg, J. A. Doudna, Nature 482, 331 (Feb 16, 2012).
2. D. Bhaya, M. Davison, R. Barrangou, Annual review of genetics 45, 273 (2011).
3. M. P. Terns, R. M. Terns, Current opinion in microbiology 14, 321 (Jun, 2011).
4. M. Jinek et al, Science 337, 816 (Aug 17, 2012).
5. G. Gasiunas, R. Barrangou, P. Horvath, V. Siksnys, Proceedings of the National Academy of Sciences of the United States of America 109, E2579 (Sep 25, 2012).
6. R. Sapranauskas et al, Nucleic acids research 39, 9275 (Nov, 2011).
7. T. R. Brummelkamp, R. Bernards, R. Agami, Science 296, 550 (Apr 19, 2002).
8. M. Miyagishi, K. Taira, Nature biotechnology 20, 497 (May, 2002).
9. E. Deltcheva et al, Nature 471, 602 (Mar 31, 2011).
10. J. Zou, P. Mali, X. Huang, S. N. Dowey, L. Cheng, Blood 118, 4599 (Oct 27, 2011).
11. N. E. Sanjana et al, Nature protocols 7, 171 (Jan, 2012).
12. J. H. Lee et al, PLoS Genet 5, el 000718 (Nov, 2009).
13. D. Hockemeyer et al, Nature biotechnology 27, 851 (Sep, 2009).
14. S. Kosuri et al, Nature biotechnology 28, 1295 (Dec, 2010).
15. V. Pattanayak, C. L. Ramirez, J. K. Joung, D. R. Liu, Nature methods 8, 765 (Sep, 2011).
16. N. M. King, O. Cohen-Haguenauer, Molecular therapy: the journal of the American Society of Gene Therapy 16, 432 (Mar, 2008).
17. Y. G. Kim, J. Cha, S. Chandrasegaran, Proceedings of the National Academy of Sciences of the United States of America 93, 1156 (Feb 6, 1996).
18. E. J. Rebar, C. O. Pabo, Science 263, 671 (Feb 4, 1994).
19. J. Boch et al , Science 326, 1509 (Dec 11 , 2009).
20. M. J. Moscou, A. J. Bogdanove, Science 326, 1501 (Dec 11, 2009).
21. A. S. Khalil, J. J. Collins, Nature reviews. Genetics 11, 367 (May, 2010).
22. P. E. Purnick, R. Weiss, Nature reviews. Molecular cell biology 10, 410 (Jun, 2009).
23. J. Zou et al, Cell stem cell 5, 97 (Jul 2, 2009).
24. N. Holt et al, Nature biotechnology 28, 839 (Aug, 2010).
25. F. D. Urnov et al, Nature 435, 646 (Jun 2, 2005).
26. A. Lombardo et al, Nature biotechnology 25, 1298 (Nov, 2007).
27. H. Li et al, Nature 475, 217 (Jul 14, 2011).
【実施例0031】
以下の実施例は、本開示の代表的な例として記載するものである。これらの実施例は、本開示の範囲をこれらに限定するものと解釈されるべきではなく、本開示、図面、および添付の特許請求の範囲に鑑みて、他の同等な実施形態は明らかであろう。
【0032】
実施例1
II型CRISPR-Casシステム
ある態様によれば、本開示の実施形態は、真核細胞におけるヌクレアーゼによる活性のため、外来核酸を同定するための短鎖RNAを用いる。本開示のある態様によれば、真核細胞は、1または複数の短鎖RNAと標的DNA配列への短鎖RNAの結合により活性化される1または複数のヌクレアーゼとをコードする核酸をそのゲノム内に含むように改変される。ある態様によれば、例示的な短鎖RNA/酵素システムは、例えば短鎖RNAを用いて外来核酸の分解を導く(CRISPR)/CRISPR関連(Cas)システムなど、細菌または古細菌中に同定され得る。CRISPR(「clustered regularly interspaced short palindromic repeats」)防御には、侵入ウイルスまたはプラスミドDNA由来の新規標的化「スペーサー」のCRISPR座位への獲得および組み込み、スペーサー反復単位からなる短鎖ガイドCRISPR RNA(crRNA)の発現およびプロセシング、ならびにスペーサーに相補的な核酸(最も一般的にはDNA)の切断が含まれる。
【0033】
3つのクラスのCRISPRシステムが一般に知られており、I型、II型、またはIII型と呼ばれる。ある態様によれば、dsDNAを切断するための本開示に係る特に有用な酵素は、II型に一般的な単一エフェクター酵素Cas9である(参照文献(1)参照)。細菌中で、II型エフェクターシステムは、スペーサー含有CRISPR座位から転写される長鎖pre-crRNA、多機能性Cas9タンパク質、およびgRNAプロセシングに重要なtracrRNAからなる。tracrRNAがpre-crRNAのスペーサーを隔てる反復領域にハイブリダイズすると、内在性RNaseIIIによるdsRNA切断が開始し、続いて、Cas9による各スペーサー内での第2の切断現象が起こり、tracrRNAおよびCas9に結合したままの成熟crRNAが生成される。ある態様によれば、本開示の真核細胞は、RNaseIIIの使用およびcrRNAプロセシング全般が回避されるように改変される。参照文献(2)参照。
【0034】
ある態様によれば、Cas9などの本開示の酵素は、DNA二本鎖を巻き戻し、crRNAにマッチする配列を探索して切断する。標的DNA中の「プロトスペーサー」配列とcrRNA中の残りのスペーサー配列との間の相補性を検出すると、標的認識が起こる。重要なことに、Cas9は、正確なプロトスペーサー隣接モチーフ(PAM)が3′末端にさらに存在する場合にのみ、DNAを切断する。ある態様によれば、異なるプロトスペーサー隣接モチーフが用いられ得る。例えば、S.pyogenesシステムは、NGG配列(Nは任意のヌクレオチドであり得る)を必要とする。S.thermophilusのII型システムは、それぞれNGGNG(参照文献(3)参照)およびNNAGAAW(参照文献(4)参照)を必要とし、一方、種々のS.mutansのシステムは、NGGまたはNAARを許容する(参照文献(5)参照)。バイオインフォマティクス分析により、さらなる有用なPAMの同定およびCRISPRで標的化可能な配列のセットの拡張に役立ち得る、種々の細菌におけるCRISPR座位の大規模なデータベースが作成されている(参照文献(6、7)参照)。S.thermophilusでは、Cas9は、プロトスペーサーの3′末端の3bp前に、平滑末端化された二本鎖切断部が生じ(参照文献(8)参照)、これはCas9タンパク質中の2つの触媒ドメイン、すなわち、DNAの相補鎖を切断するHNHドメインと非相補鎖を切断するRuvC様ドメインとにより媒介されるプロセスである(
図1Aおよび
図3参照)。S.pyogenesのシステムは同じ精密度で特徴付けられていないが、やはりDSBがプロトスペーサーの3′末端の近くで起こる。2つのヌクレアーゼドメインの1つが不活性化された場合、Cas9は、インビトロ(参照文献(2)参照)およびヒト細胞において(
図5参照)ニッカーゼとして機能する。
【0035】
ある態様によれば、gRNA誘導性のCas9切断の特異性は、真核細胞におけるゲノム工学機構として用いられる。ある態様によれば、gRNAのハイブリダイゼーションは、酵素がgRNA/DNAハイブリッドを認識して切断に影響を与えるためには、100%である必要はない。多少のオフターゲット活性が生じ得る。例えば、S.pyogenesのシステムは、インビトロで20bpの成熟スペーサー配列のうち最初の6塩基におけるミスマッチを許容する。ある態様によれば、gRNAに対するヒト参照ゲノム中に(最後の14bpの)NGGにマッチする潜在的オフターゲット部位が存在する場合、インビボでより高いストリンジェンシーが有益であり得る。ミスマッチおよび酵素活性の影響全般については、参照文献(9)、(2)、(10)、および(4)に記載されている。
【0036】
ある態様によれば、特異性が改善され得る。干渉がgRNA-DNAハイブリッドの融解温度の影響を受ける場合、ATリッチな標的配列は、より少ないオフターゲット部位を有し得る。ゲノム中の他の場所の少なくとも14bpにマッチする配列を有する偽性部位が回避されるように慎重に標的部位を選択することにより、特異性が改善され得る。より長いPAM配列を必要とするCas9変異体を使用することで、オフターゲット部位の頻度を減少させ得る。定向進化によりオフターゲット活性を完全に防止するのに十分なレベルまでCas9特異性が改善され得るが、理想的には、最小限のPAMを有する20bpのgRNAの完全なマッチを必要とする。したがって、Cas9タンパク質の改変は本開示の代表的実施形態である。したがって、短い時間枠で多数ラウンドの進化を可能にする(参照文献(11)参照)新規な方法が想定される。本開示において有用なCRISPRシステムは、参照文献(12、13)に記載されている。
【0037】
実施例2
プラスミド構築
Cas9遺伝子配列をヒトコドン最適化し、IDT社に注文した9種の500bpのgBlockの階層的融合PCRアセンブリ(hierachical fusion PCR assembly)により構築した。ヒト細胞のための改変II型CRISPRシステムを示す
図3Aは、cas9遺伝子挿入断片の発現フォーマットおよび完全配列を示す。RuvC様モチーフおよびHNHモチーフ、ならびにC末端SV40NLSはそれぞれ青色、茶色、および橙色で強調されている。Cas9_D10Aを同様に構築した。得られた全長産物をpcDNA3.3-TOPOベクター(Invitrogen社)にクローニングした。標的gRNA発現コンストラクトは、個別の455bpのgBlockとしてIDT社に直接注文し、pCR-BluntII-TOPOベクター(Invitrogen社)にクローニングするかPCR増幅を行った。
図3Bは、ガイドRNAのU6プロモーターに基づく発現スキームおよびRNA転写産物の予想二次構造を示している。U6プロモーターの使用により、RNA転写産物の1位が「G」に限定されるので、このアプローチを用いて、GN
20GGの形態の全ゲノム部位を標的とすることができる。
図3Cは、使用した7種のgRNAを示している。
【0038】
Addgene社製EGIPレンチベクター(プラスミド#26777)中に構築された、終止コドンと68bpのAAVS1断片(またはその変異体;
図6参照)またはDNMT3aゲノム座位およびDNMT3bゲノム座位に由来する58bpの断片(
図8参照)とを有するGFP配列の融合PCRアセンブリにより、中断されたGFPを含むHRレポーターアッセイ用ベクターを構築した。次いで、これらのレンチベクターを用いてGFPレポーター安定発現細胞株を確立した。本研究に用いたTALENは、参照文献(14)に記載のプロトコールを用いて構築した。本研究で開発された全てのDNA試薬は、Addgene社から入手可能である。
【0039】
実施例3
細胞培養
PGP1 iPS細胞は、マトリゲル(BD Biosciences社)でコーティングされたプレート上、mTeSR1(Stemcell Technologies社)中で維持した。TrypLE Express(Invitrogen社)を用いて5~7日毎に継代培養した。K562細胞は、15%FBS含有RPMI(Invitrogen社)中で培養および維持した。HEK293T細胞は、10%ウシ胎児血清(FBS、Invitrogen社)、ペニシリン/ストレプトマイシン(pen/strep、Invitrogen社)、および非必須アミノ酸(NEAA、Invitrogen社)を添加したダルベッコ変法イーグル培地(DMEM、Invitrogen社)高グルコース中で培養した。全ての細胞は、加湿したインキュベーター中、37℃、5%CO2で維持した。
【0040】
実施例4
PGP1 iPS、K562、および293Tの遺伝子標的化
PGP1 iPS細胞は、ヌクレオフェクションの2時間前にRhoキナーゼ(ROCK)阻害剤(Calbiochem社)中で培養した。TrypLE Express(Invitrogen社)を用いて細胞を回収し、2×10
6個の細胞を、1μgのCas9プラスミド、1μgのgRNA、および/または1μgのDNAドナープラスミドと共にP3試薬(Lonza社)に再懸濁し、製造業者の指示書(Lonza社)に従ってヌクレオフェクトした。続いて、細胞を、mTeSRlでコーティングされたプレート上で、ROCK阻害剤を添加したmTeSRl培地中に最初の24時間プレーティングした。K562では、2×10
6個の細胞を、1μgのCas9プラスミド、1μgのgRNA、および/または1μgのDNAドナープラスミドと共にSF試薬(Lonza社)に再懸濁し、製造業者の指示書(Lonza社)に従ってヌクレオフェクトした。293Tでは、製造業者のプロトコールに従い、Lipofectamine2000を用いて0.1×10
6個の細胞に1μgのCas9プラスミド、1μgのgRNA、および/または1μgのDNAドナープラスミドをトランスフェクトした。内在性AAVS1の標的化に用いたDNAドナーは、dsDNAドナー(
図2C)または90塩基長のオリゴヌクレオチドであった。前者は、標的化に成功した細胞を濃縮するためのSA-2A-ピューロマイシン-CaGGS-eGFPカセット、および隣接する短い相同性アームを有する。
【0041】
標的化効率を以下のように評価した。細胞をヌクレオフェクションの3日後に回収し、prepGEM(ZyGEM社)を用いて約1×106個の細胞のゲノムDNAを抽出した。PCRを行い細胞に由来するゲノムDNAを用いて標的化領域を増幅し、MiSeq Personal Sequencer(Illumina社)により、カバー度>200,000リードで増幅産物のディープシークエンシングを行った。シークエンシングデータを分析してNHEJ効率を推定した。分析した参照AAVS1配列は、以下のようである。
【0042】
CACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCACAGTGGGGCCACTAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGA
【0043】
ヒトゲノム中の標的化領域を増幅するためのPCRプライマーは以下の通りである。
AAVS1-R:
CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTacaggaggtgggggttagac
AAVS1-F.1:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTCGTGATtatattcccagggccggtta
AAVS1-F.2:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTACATCGtatattcccagggccggtta
AAVS1-F.3:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGCCTAAtatattcccagggccggtta
AAVS1-F.4:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCAtatattcccagggccggtta
AAVS1-F.5:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTCACTGTtatattcccagggccggtta
AAVS1-F.6:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTATTGGCtatattcccagggccggtta
AAVS1-F.7:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGATCTGtatattcccagggccggtta
AAVS1-F.8:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCAAGTtatattcccagggccggtta
AAVS1-F.9:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTCTGATCtatattcccagggccggtta
AAVS1-F.10:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGCTAtatattcccagggccggtta
AAVS1-F.11:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTGTAGCCtatattcccagggccggtta
AAVS 1-F.12:
ACACTCTTTCCCTACACGACGCTCTTCCGATCTTACAAGtatattcccagggccggtta
【0044】
図2C中のDNAドナーを用いたHR現象を分析するために、以下のプライマーを用いた。
HR_AAVS1-F
CTGCCGTCTCTCTCCTGAGT
HR_Puro-R
GTGGGCTTGTACTCGGTCAT
【0045】
実施例5
ヒトエキソンのCRISPR標的を計算するためのバイオインフォマティクスアプローチおよびそれらの多重合成の方法論
ヒトエキソンにおいて特異的部位を最大限に標的とするが、ゲノム中の他の部位は最小限に標的とするgRNA遺伝子配列セットは、以下のように決定した。ある態様によれば、gRNAによる最大効率の標的化は23ヌクレオチド(nt)の配列により達成され、そのうちの最も5′側の20ヌクレオチドは所望の部位に正確に相補的であり、最も3′側の3塩基はNGGの形態でなければならない。さらに、pol-III転写開始部位を確立するために、最も5′側のヌクレオチドはGでなければならない。しかし、参照文献(2)によれば、ゲノム標的に対する20bpのgRNAの最も5′側の6個のヌクレオチドの不対合は、最後の14ヌクレオチドが適切に対合する限りCas9を介した切断を抑制しないが、最も5′側の8個のヌクレオチドの不対合および最後の12ヌクレオチドの対合は切断を抑制し、最も5′側の7個のヌクレオチドの不対合および13個の3′側の対合の場合については試験されていない。オフターゲット効果に関して保存的(conservative)であるための条件の1つは、6個の場合同様に、最も5′側の7個の不対合の場合に切断が許容されることであり、したがって最も3′側の13ヌクレオチドの対合が切断には十分である。オフターゲット切断をせずに切断が可能であるヒトエキソン内のCRISPR標的部位を同定するために、5′-GBBBB BBBBB BBBBB BBBBB NGG-3′の形態(第1の形態)の23bpの配列の全てを調べた。式中、Bは、エキソン部位の塩基を表し、この配列に対して、ヒトゲノム中の他のどの部位にも5′-NNNNN NNBBB BBBBB BBBBB NGG-3′の形態(第2の形態)の配列は存在しない。具体的には、(i)UCSC Genome Browser(参照文献15~17)からGRCh37/hg19ヒトゲノムの全てのRefSeq遺伝子のコード領域部位のBEDファイルをダウンロードした。このBEDファイル中のコードエキソンの部位は、hg19ゲノムへのRefSeq mRNAアクセッションの346089個のマッピングのセットで構成されていた。しかし、いくつかのRefSeq mRNAアクセッションは複数のゲノム部位にマッピングされており(おそらく遺伝子重複)、多くのアクセッションが同一セットのエキソン部位のサブセットにマッピングされていた(同じ遺伝子の複数のアイソフォーム)。明らかに重複した遺伝子インスタンスを区別して、複数のRefSeqアイソフォームアクセッションによる同一のゲノムエキソンインスタンスへの複数の参照を統合するために、(ii)複数のゲノム部位を有した705個のRefSeqアクセッション番号に固有の数値サフィックス(numerical suffix)を付与し、(iii)BEDTools(参照文献18)(v2.16.2-zip-87e3926)のmergeBed機能を用いて、重複するエキソン部位を、マージされたエキソン領域に統合した。これらのステップにより、最初の346089個のRefSeqエキソン部位セットは、192783個の別個のゲノム領域に減少した。UCSC Table Browserを用いて、全てのマージされたエキソン領域のhg19配列をダウンロードし、各末端に20bpのパディング(padding)を付加した。(iv)カスタムperlコードを用いて、このエキソン配列内に第1の形態の1657793個のインスタンスを同定した。(v)次いで、これらの配列を、第2の形態のオフターゲットの存在についてフィルタリングした。すなわち、各々のマージされたエキソンの第1の形態の標的につき、最も3′側の13bpの特異的(B)「コア」配列を抽出し、各コアについて、16bpの配列である5′-BBB BBBBB BBBBB NGG-3′(N=A、C、G、およびT)を4種作成し、-l 16 -v 0 -k 2のパラメーターを用いたBowtie version 0.12.8(参照文献19)を用いて、これら6631172個の配列への正確なマッチについてhg19ゲノム全体をサーチした。2個以上のマッチがあった任意のエキソン標的部位は不採用とした。任意の特異的な13bpのコア配列およびそれに続く配列NGGにより15bpの特異性が付与されるのみであるため、ランダムな約3Gbの配列(両鎖)中に、拡張コア配列に対して平均約5.6個のマッチがあるはずである。そのため、最初に同定された1657793個の標的のほとんどが不採用とされたが、189864個の配列がこのフィルターをパスした。これらは、ヒトゲノム中のCRISPRで標的化可能なエキソン部位のセットを含む。この189864個の配列は、標的エキソン領域当たり約2.4部位の多重度で、78028個のマージされたエキソン領域中の部位を標的とする(全192783個のマージされたヒトエキソン領域の約40.5%)。遺伝子レベルで標的化を評価するために、マージされたエキソン領域と重複する任意の2つのRefSeqアクセッション((ii)で区別した遺伝子重複物を含む)が単一遺伝子クラスターとしてカウントされるようにRefSeq mRNAマッピングをクラスター化すると、189864個のエキソン特異的CRISPR部位が、標的遺伝子クラスター当たり約11.1の多重度で、18872個の遺伝子クラスターのうちの17104個(全遺伝子クラスターの約90.6%)を標的とする。(これらの遺伝子クラスターは、単一の転写遺伝子の複数のアイソフォームを表すRefSeq mRNAアクセッションを単一のエンティティ(entity)へと折り畳んでいる(collapse)が、これらにはさらに、重複する別個の遺伝子およびアンチセンス転写産物を有する遺伝子も折り畳まれていることに留意されたい。)オリジナルのRefSeqアクセッションレベルでは、189864個の配列が、マッピングされたRefSeqアクセッション(区別される重複遺伝子を含む)の全43726個のうちの30563個(約69.9%)において、標的とするマッピングされたRefSeqアクセッション1個当たり約6.2部位の多重度で、エキソン領域を標的とした。
【0046】
ある態様によれば、gRNAおよびゲノム標的の両方の塩基組成および二次構造(参照文献20、21)、ならびにエピジェネティックな状態に関する情報が利用可能なヒト細胞株におけるこれら標的のエピジェネティックな状態(参照文献22)などの要因と性能(performance)を関連付けることにより、データベースを洗練することができる。
【0047】
実施例6
多重合成
標的配列を、DNAアレイ上での多重合成に適合する200bpフォーマットに組み込んだ(参照文献23、24)。ある態様によれば、この方法により、DNAアレイに基づくオリゴヌクレオチドプールからの特異的なgRNA配列またはgRNA配列プールの標的化された回収、および一般的な発現ベクターへの迅速なクローニングが可能になる(
図13A)。具体的には、CustomArray Inc.社の12kのオリゴヌクレオチドプールを合成した。さらに、このライブラリーから、最適なgRNAの回収(
図13B)に成功した。合成DNA1000bp当たりの誤り率は約4変異であった。
【0048】
実施例7
RNA誘導性ゲノム編集は標的化の成功のためにCas9およびガイドRNAの両方を必要とする
図1Bに記載のGFPレポーターアッセイを用いて、修復DNAドナー、Cas9タンパク質、およびgRNAの全ての可能な組み合わせの、(293Tにおいて)HRを成功させる能力について試験した。
図4に示すように、3つのコンポーネントの全てが存在する場合にのみGFP+細胞が観察され、これにより、RNA誘導性ゲノム編集にこれらのCRISPRコンポーネントが必須であることが確認された。データは平均値±SEM(N=3)である。
【0049】
実施例8
gRNAおよびGas9を介したゲノム編集の分析
(A)
図5Aに結果が示される前述のGFPレポーターアッセイおよび(B)
図5Bに結果が示される(293Tにおける)標的部位のディープシークエンシングのいずれかを用いて、CRISPRを介したゲノム編集プロセスを調べた。比較として、以前の報告でインビトロアッセイにおいてニッカーゼとして機能することが示されているCas9のD10A変異体を試験した。
図5に示すように、Cas9およびCas9D10Aはどちらもほぼ同じ率でHRを成功させることができた。しかし、ディープシークエンシングから、Cas9は標的部位で強固なNHEJを示すが、(DNAにニックを入れるだけの推定能力から予想される通り)D10A変異体はNHEJ比率が有意に低減していることが確認される。さらに、Cas9タンパク質の既知の生化学と一致して、NHEJデータから、塩基対の欠失または挿入の大部分が標的配列の3′末端で起こっており、ピークはPAM部位の上流約3~4塩基であり、欠失頻度の中央値は約9~10bpであることが確認される。データは平均値±SEM(N=3)である。
【0050】
実施例9
RNA誘導性ゲノム編集は標的配列特異的である
図1Bに記載のGFPレポーターアッセイ同様、別個のGFPレポーターコンストラクトをそれぞれ有する3種の293T安定発現細胞株を開発した。これらは(
図6に示されるように)AAVS1断片インサートの配列によって区別される。1種の細胞株は野生型断片を有し、他の2種の細胞株は6bpが変異している(赤色で強調)。次いで、各細胞株を以下の4つの試薬、すなわち、標的配列が隣接GFP断片中にあるために全ての細胞株中に存在するので、全ての細胞型を標的化可能であるGFP-ZFNの組み合わせ;他の2種の細胞株における変異により左のTALENがそれらの部位に結合できなくなっていると考えられるので、wt-AAVS1断片のみを潜在的に標的化し得るAAVS1 TALEN;この標的部位も2種の変異細胞株中で中断されているので、やはりwt-AAVS1断片のみを潜在的に標的化可能であるT1gRNA;およびT1gRNAと異なり、標的部位が3種の細胞株で変化していないので、3種の細胞株の全てを標的化可能であると考えられるT2gRNAのいずれかで標的化した。ZFNは3種の細胞型全てを改変し、AAVS1 TALENおよびT1gRNAはwt-AAVS1細胞型のみを標的化し、T2gRNAは3種の細胞型全ての標的化に成功した。総合して、これらの結果により、ガイドRNAを介した編集が標的配列特異的であることが確認される。データは平均値±SEM(N=3)である。
【0051】
実施例10
GFP配列を標的とするガイドRNAは強固なゲノム編集を可能にする
AAVS1インサートを標的化する2種のgRNAに加えて、(293Tにおいて)
図1Bに記載のレポーターの隣接GFP配列を標的化する2種の新たなgRNAを試験した。
図7に示すように、これらのgRNAもまた、この改変された座位で強固なHRをもたらすことができた。データは平均値±SEM(N=3)である。
【0052】
実施例11
RNA誘導性ゲノム編集は標的配列特異的であり、ZFNまたはTALENと同様な標的化効率を示す
図1Bに記載のGFPレポーターアッセイ同様、別個のGFPレポーターコンストラクトをそれぞれ有する2種の293T安定発現細胞株を開発した。(
図8に示すように)これらは断片インサートの配列によって区別される。一方の細胞株はDNMT3a遺伝子由来の58bp断片を有し、もう一方の細胞株はDNMT3b遺伝子由来の相同な58bp断片を有する。配列の差は赤色で強調される。次いで、各細胞株を以下の6つの試薬、すなわち、その標的配列が隣接GFP断片中にあるために全ての細胞株中に存在するので、全ての細胞型を標的化可能であるGFP-ZFNの組み合わせ;DNMT3a断片またはDNMT3b断片を潜在的に標的化するTALENの組み合わせ;DNMT3a断片のみを潜在的に標的化可能なgRNAの組み合わせ;およびDNMT3b断片のみを潜在的に標的化すると考えられるgRNAのいずれかで標的化した。
図8に示すように、ZFNは3つの細胞型全てを改変し、TALENおよびgRNAはそれぞれの標的のみを改変した。さらに、標的化効率は6つの標的化試薬で同等であった。総合すると、これらの結果により、RNA誘導性編集が標的配列特異的であり、ZFNまたはTALENと同様な標的化効率を示すことが確認される。データは平均値±SEM(N=3)である。
【0053】
実施例12
ヒトiPS細胞におけるRNA誘導性NHEJ
ヒトiPS細胞(PGP1)に、
図9の左パネルに示すコンストラクトをヌクレオフェクトした。ヌクレオフェクションの4日後、DNA二本鎖切断部(DSB)でのゲノムの欠失率および挿入率をディープシークエンシングにより評価することによってNHEJ比率を測定した。パネル1:標的領域で検出された欠失率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。各ヌクレオチド位置での欠失の発生率を黒線にプロットし、欠失を有するリードの割合として欠失率を計算した。パネル2:標的領域で検出された挿入率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。最初の挿入接合部が検出されたゲノム位置での挿入の発生率を黒線にプロットし、挿入を有するリードの割合として挿入率を計算した。パネル3:欠失サイズの分布。全NHEJ集団間の異なるサイズの欠失の頻度をプロットした。パネル4:挿入サイズの分布。全NHEJ集団間の異なるサイズの挿入の頻度をプロットした。両方のgRNAによるiPS標的化は効率的であり(2~4%)、配列特異的であり(NHEJ欠失分布の位置のシフトにより示される)、
図4の結果を再確認するものであり、NGSに基づく分析もまた、標的座位におけるNHEJ現象にCas9タンパク質およびgRNAの両方が必須であることを示している。
【0054】
実施例13
K562細胞におけるRNA誘導性NHEJ
図10の左パネルに示すコンストラクトをK562細胞に核化(nucleated)した。ヌクレオフェクションの4日後、DSBでのゲノムの欠失率および挿入率をディープシークエンシングにより評価することによってNHEJ比率を測定した。パネル1:標的領域で検出された欠失率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。各ヌクレオチド位置での欠失の発生率を黒線にプロットし、欠失を有するリードの割合として欠失率を計算した。パネル2:標的領域で検出された挿入率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。最初の挿入接合部が検出されたゲノム位置での挿入の発生率を黒線にプロットし、挿入を有するリードの割合として挿入率を計算した。パネル3:欠失サイズの分布。全NHEJ集団間の異なるサイズの欠失の頻度をプロットした。パネル4:挿入サイズの分布。全NHEJ集団間の異なるサイズの挿入の頻度をプロットした。両方のgRNAによるK562標的化は効率的であり(13~38%)、配列特異的である(NHEJ欠失分布の位置のシフトにより示される)。重要なことに、観察された欠失サイズ頻度のヒストグラムにおけるピークからも明らかなように、T1ガイドRNAおよびT2ガイドRNAの同時導入により、その間に位置する19bp断片の高効率な欠失が生じており、このことは、このアプローチを用いてゲノム座位の多重編集も実現可能であることを示している。
【0055】
実施例14
293T細胞におけるRNA誘導性NHEJ
図11の左パネルに示すコンストラクトを293T細胞にトランスフェクトした。ヌクレオフェクションの4日後、DSBでのゲノムの欠失率および挿入率をディープシークエンシングにより評価することによってNHEJ比率を測定した。パネル1:標的領域で検出された欠失率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。各ヌクレオチド位置での欠失の発生率を黒線にプロットし、欠失を有するリードの割合として欠失率を計算した。パネル2:標的領域で検出された挿入率。赤色の破線:T1RNA標的部位の境界;緑色の破線:T2RNA標的部位の境界。最初の挿入接合部が検出されたゲノム位置での挿入の発生率を黒線にプロットし、挿入を有するリードの割合として挿入率を計算した。パネル3:欠失サイズの分布。全NHEJ集団間の異なるサイズの欠失の頻度をプロットした。パネル4:挿入サイズの分布。全NHEJ集団間の異なるサイズの挿入の頻度をプロットした。両方のgRNAによる293T標的化は効率的であり(10~24%)、配列特異的である(NHEJ欠失分布の位置のシフトにより示される)。
【0056】
実施例15
dsDNAドナーまたは短鎖オリゴヌクレオチドドナーのいずれかを用いた内在性AAVS1遺伝子座におけるHR
図12Aに示すように、PCRスクリーニング(
図2Cを参照)により、21/24のランダムに選んだ293Tクローンで標的化の成功が確認された。
図12Bに示すように、同様なPCRスクリーニングにより、3/7のランダムに選んだPGP1-iPSクローンでも標的化の成功が確認された。
図12Cに示すように、90塩基長の短鎖オリゴもまた、内在性AAVS1遺伝子座での強固な標的化が可能であった(ここではK562細胞について示す)。
【0057】
実施例16
ヒトゲノム中の遺伝子を標的とするガイドRNAの多重合成、回収、およびU6発現ベクターのクローニングの方法
ヒトゲノム中の遺伝子の全エキソンの約40.5%を標的とする約190kのバイオインフォマティクス的に計算されたユニークなgRNA部位のリソースを作成した。
図13Aに示すように、gRNA標的部位をDNAアレイ上での多重合成に適合する200bpフォーマットに組み込んだ。具体的には、このデザインにより、(i)DNAアレイオリゴヌクレオチドプールからの特異的gRNA標的またはgRNA標的のプールの(模式図に示すように、連続3ラウンドのネステッドPCRによる)標的化された回収;および(ii)AflIIを用いた直線化後にギブソン・アセンブリを介したgRNAインサート断片の取込みのレシピエントとして機能する、一般的な発現ベクターへの迅速なクローニングが可能になる。
図13Bに示すように、この方法を用いて、CustomArray社により合成された12kのオリゴヌクレオチドプールから10種のユニークなgRNAの標的化された回収が達成された。
【0058】
実施例17
CRISPRを介したRNA誘導性転写活性化
CRISPR-Casシステムは細菌の適応免疫防御システムを有し、侵入核酸を「切断する」ように機能する。ある態様によれば、CRISPR-CASシステムは、ヒト細胞において機能しゲノムDNAを「切断する」ように改変される。これは、(ヌクレアーゼ機能を有する)Cas9タンパク質をガイドRNA中のスペーサーに相補的な標的配列に導く短鎖ガイドRNAによって達成される。DNAを「切断する」能力により、ゲノム編集および標的化されたゲノム制御に関連する多くの応用が可能になる。このために、Cas9タンパク質を、(RuvC様ドメインおよびHNH様ドメインのヌクレアーゼ機能に重要であることが知られている)Mg2+へのカップリングを抑制すると予想される変異を導入することによりヌクレアーゼ欠損になるように変異させた。具体的には、D10A変異、D839A変異、H840A変異、およびN863A変異の組み合わせを導入した。(シークエンシング解析によりDNAを切断しない能力が確認された)このようにして作製されたCas9ヌクレアーゼ欠損タンパク質(以下、Cas9R-H-という)をその後、転写活性化ドメイン(ここではVP64)にカップリングして、CRISPR-casシステムがRNA誘導性転写制御因子として機能できるようにした(
図14参照)。Cas9R-H-+VP64融合体は、示されている2つのレポーターにおいてRNA誘導性転写活性化を可能にする。具体的には、FACS分析および免疫蛍光イメージングの両方により、このタンパク質が対応するレポーターのgRNA配列特異的標的化を可能にすること、およびさらに、結果として起こる転写活性化が、dTomato蛍光タンパク質の発現によりアッセイされるように、従来のTALE-VP64融合タンパク質により誘導される転写活性化と同様のレベルであったことが示される。
【0059】
実施例18
gRNA配列の柔軟性およびその応用
gRNAの5′部分、中央部分、および3′部分における種々のランダムな配列挿入を体系的にアッセイすることにより、指定配列挿入(designer sequence insertion)に対するgRNA足場配列の柔軟性を決定した。具体的には、gRNA配列において、gRNAの5′末端、中央、および3′末端に1bp、5bp、10bp、20bp、および40bpのインサートを作製した(挿入の正確な位置は
図15中で「赤色」で強調されている)。次いで、このgRNAの機能性を、(本明細書に記載されるように)GFPレポーターアッセイにおいてHRを誘導する能力により試験した。(保持されているHR誘導活性により測定されるように)5′末端および3′末端の配列挿入に対してgRNAが柔軟であることは明らかである。したがって、本開示の態様は、gRNA活性開始の引き金を引き得る小分子応答性RNAアプタマーのタグ化またはgRNAの可視化に関する。さらに、本開示の態様は、ハイブリダイゼーションによってssDNAドナーをgRNAに繋ぎ止めることに関し、これにより、ゲノム標的の切断と修復鋳型の即時の物理的局在化とのカップリングが可能になり、これにより誤りがちな非相同末端結合と比較して相同組換え率が促進される。
【0060】
実施例セクション中で数字により特定される以下の参照文献は、その全体があらゆる目的のために参照により組み込まれる。
【0061】
参照文献
1. K. S. Makarova et al, Evolution and classification of the CRISPR-Cas systems. Nature reviews. Microbiology 9, 467 (Jun, 2011).
2. M. Jinek et al., A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816 (Aug 17, 2012).
3. P. Horvath, R. Barrangou, CRISPR/Cas, the immune system of bacteria and archaea. Science 327, 167 (Jan 8, 2010).
4. H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of bacteriology 190, 1390 (Feb, 2008).
5. J. R. van der Ploeg, Analysis of CRISPR in Streptococcus mutans suggests frequent occurrence of acquired immunity against infection by M102-like bacteriophages. Microbiology 155, 1966 (Jun, 2009).
6. M. Rho, Y. W. Wu, H. Tang, T. G. Doak, Y. Ye, Diverse CRISPRs evolving in human microbiomes. PLoS genetics 8, e1002441 (2012).
7. D. T. Pride et al, Analysis of streptococcal CRISPRs from human saliva reveals substantial sequence diversity within and between subjects over time. Genome research 21, 126 (Jan, 2011).
8. G. Gasiunas, R. Barrangou, P. Horvath, V. Siksnys, Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579 (Sep 25, 2012).
9. R. Sapranauskas et al, The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275 (Nov, 2011).
10. J. E. Garneau et al, The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468, 67 (Nov 4, 2010).
11. K. M. Esvelt, J. C. Carlson, D. R. Liu, A system for the continuous directed evolution of biomolecules. Nature 472, 499 (Apr 28, 2011).
12. R. Barrangou, P. Horvath, CRISPR: new horizons in phage resistance and strain identification. Annual review of food science and technology 3, 143 (2012).
13. B. Wiedenheft, S. H. Sternberg, J. A. Doudna, RNA-guided genetic silencing systems in bacteria and archaea. Nature 482, 331 (Feb 16, 2012).
14. N. E. Sanjana et al, A transcription activator-like effector toolbox for genome engineering. Nature protocols 7, 171 (Jan, 2012).
15. W. J. Kent et al, The human genome browser at UCSC. Genome Res 12, 996 (Jun, 2002).
16. T. R. Dreszer et al., The UCSC Genome Browser database: extensions and updates 2011. Nucleic Acids Res 40, D918 (Jan, 2012).
17. D. Karolchik et ah, The UCSC Table Browser data retrieval tool. Nucleic Acids Res 32, D493 (Jan 1, 2004).
18. A. R. Quinlan, I. M. Hall, BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics 26, 841 (Mar 15, 2010).
19. B. Langmead, C. Trapnell, M. Pop, S. L. Salzberg, Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10, R25 (2009).
20. R. Lorenz et al., ViennaRNA Package 2.0. Algorithms for molecular biology : AMB 6, 26 (2011).
21. D. H. Mathews, J. Sabina, M. Zuker, D. H. Turner, Expanded sequence dependence of thermodynamic parameters improves prediction of RNA secondary structure. Journal of molecular biology 288, 911 (May 21, 1999).
22. R. E. Thurman et al., The accessible chromatin landscape of the human genome. Nature 489, 75 (Sep 6, 2012).
23. S. Kosuri et al., Scalable gene synthesis by selective amplification of DNA pools from high-fidelity microchips. Nature biotechnology 28, 1295 (Dec, 2010).
24. Q. Xu, M. R. Schlabach, G. J. Hannon, S. J. Elledge, Design of 240,000 orthogonal 25mer DNA barcode probes. Proceedings of the National Academy of Sciences of the United States of America 106, 2289 (Feb 17, 2009).