(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022176275
(43)【公開日】2022-11-25
(54)【発明の名称】RNA誘導性遺伝子制御および編集のための直交性CAS9タンパク質
(51)【国際特許分類】
C12N 15/09 20060101AFI20221117BHJP
C12N 1/19 20060101ALI20221117BHJP
C12N 5/10 20060101ALI20221117BHJP
C12N 9/16 20060101ALN20221117BHJP
【FI】
C12N15/09 110
C12N1/19
C12N5/10
C12N9/16 Z ZNA
【審査請求】未請求
【請求項の数】44
【出願形態】OL
(21)【出願番号】P 2022159833
(22)【出願日】2022-10-03
(62)【分割の表示】P 2019238875の分割
【原出願日】2014-07-08
(31)【優先権主張番号】61/844,844
(32)【優先日】2013-07-10
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507044516
【氏名又は名称】プレジデント アンド フェローズ オブ ハーバード カレッジ
(74)【代理人】
【識別番号】100079049
【弁理士】
【氏名又は名称】中島 淳
(74)【代理人】
【識別番号】100084995
【弁理士】
【氏名又は名称】加藤 和詳
(72)【発明者】
【氏名】チャーチ、 ジョージ、 エム.
(72)【発明者】
【氏名】エスベルト、 ケビン
(72)【発明者】
【氏名】マリ、 プラシャント
(57)【要約】
【課題】対応する遺伝子を同時に且つ独立して制御するため、または対応する遺伝子を同時に且つ独立して編集することを可能とする。
【解決手段】複数種類の直交性Cas9タンパク質を使用することを含む、細胞において標的核酸の発現を調節する方法を提供する。
【選択図】なし
【特許請求の範囲】
【請求項1】
細胞において外来性DNA以外のゲノムDNAまたはミトコンドリアDNAの中の2種類以上の標的核酸の発現を調節する方法(ただし、前記発現の調節がヒトの体内で行われる場合を除く)であって、
前記2種類以上の標的核酸に相補的である2種類以上のガイドRNAをコードする第1の外来核酸を細胞に導入すること、
2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損(nuclease-null)
DNA結合タンパク質をコードする第2の外来核酸を前記細胞に導入すること、および
2種類以上の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記2種類以上のガイドRNA、前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、および前記2種類以上の転写制御タンパク質またはドメインが発現し、ここで、前記2種類以上の転写制御タンパク質またはドメインは、前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質または前記2種類以上のガイドRNAに、結合またはその他の態様で(otherwise
)接続しており、
(a)ガイドRNAと、(b)直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質と、(c)転写制御タンパク質またはドメインと、(d)標的核酸との共局在複合体が2種類以上形成され、(c)転写制御タンパク質またはドメインが(d)標的核酸の発現を制御し、
前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が、異なる種に由来する、
前記方法。
【請求項2】
直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質をコードする前記第2の外来核酸が、(b)直交性II型CRISPRシステムヌクレアーゼ欠損D
NA結合タンパク質に融合した(c)転写制御タンパク質またはドメインをさらにコードする、請求項1に記載の方法。
【請求項3】
前記細胞が真核細胞であり、2種類以上のガイドRNAをコードする前記第1の外来核酸が、RNA結合ドメインの標的をさらにコードし、前記2種類以上の転写制御タンパク質またはドメインをコードする前記第3の外来核酸が、(c)転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする、請求項1に記載の方法。
【請求項4】
前記転写制御タンパク質またはドメインが転写活性化因子である、請求項1に記載の方法。
【請求項5】
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御する、請求項1に記載の方法。
【請求項6】
前記転写制御タンパク質またはドメインが転写抑制因子である、請求項1に記載の方法。
【請求項7】
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を下方制御する、請求項1に記載の方法。
【請求項8】
前記標的核酸が疾患または有害な健康状態と関連する、請求項1に記載の方法。
【請求項9】
第1の標的核酸が活性化され、第2の標的核酸が抑制される、請求項1に記載の方法。
【請求項10】
複数種類の第1の標的核酸が活性化され、複数種類の第2の標的核酸が抑制される、請求項1に記載の方法。
【請求項11】
1種類または複数種類の第1の標的核酸が活性化され、1種類または複数種類の第2の標的核酸が抑制される、請求項1に記載の方法。
【請求項12】
細胞においてゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の2種類以上の標的核酸を改変する方法(ただし、前記改変がヒトの体内で行われる場合を除く)であって、
前記2種類以上の標的核酸に相補的である2種類以上のガイドRNAをコードする第1の外来核酸を細胞に導入すること、および
2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼをコードする第2の外来核酸を前記細胞に導入すること、
を含み、
前記2種類以上のガイドRNAおよび前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼが発現し、
ガイドRNAと、直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼと、標的核酸とをそれぞれ含む共局在複合体が2種類以上形成され、前記直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼが前記標的核酸を切断または前記標的核酸にニックを入れ、
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼが、異なる種に由来する、
前記方法。
【請求項13】
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼがヌクレアーゼである、請求項12に記載の方法。
【請求項14】
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼがニッカーゼである、請求項12に記載の方法。
【請求項15】
複数の標的核酸が切断されるまたは複数の標的核酸にニックが入れられる、請求項12に記載の方法。
【請求項16】
前記直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼが、直交性Cas9タンパク質を含む、請求項12に記載の方法。
【請求項17】
各ガイドRNAが100ヌクレオチド~500ヌクレオチドである、請求項12に記載の方法。
【請求項18】
前記細胞が真核細胞である、請求項1または請求項12に記載の方法。
【請求項19】
前記細胞が、酵母細胞、植物細胞、または動物細胞である、請求項1または請求項12に記載の方法。
【請求項20】
前記2種類以上のガイドRNAがtracrRNA-crRNA融合体である、請求項1または請求項12に記載の方法。
【請求項21】
細胞においてゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の1種類または複数種類の標的核酸の発現を制御すると同時に、細胞においてゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の1種類または複数種類の標的核酸を改変する方法(ただし、前記制御および改変がヒトの体内で行われる場合を除く)であって、
少なくとも1種類のガイドRNAが前記改変される1種類または複数種類の標的核酸に相補的であり、少なくとも1種類のガイドRNAが前記制御される1種類または複数種類の標的核酸に相補的である、2種類以上のガイドRNAをコードする第1の外来核酸を前記細胞に導入すること、
(1)1つの不活性ヌクレアーゼドメインを有し、且つ前記改変される1種類または複数種類の標的核酸に相補的である前記1種類または複数種類のガイドRNAによってガイドされる、1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼ、および(2)前記制御される標的核酸に相補的である前記1種類または複数種類のガイドRNAに結合し且つガイドされる、1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、をコードする第2の外来核酸を前記細胞に導入すること、および
1種類または複数種類の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記2種類以上のガイドRNA、前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼ、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、および前記1種類または複数種類の転写制御タンパク質またはドメインが発現し、ここで、前記1種類または複数種類の転写制御タンパク質またはドメインは、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質または1種類以上のガイドRNAに、結合またはその他の態様で(otherwise)接続しており、
ガイドRNAと、直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼと、および改変される標的核酸との共局在複合体が少なくとも1種類形成され、該直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼが、該改変される標的核酸にニックを入れ、
ガイドRNAと、直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タン
パク質と、転写制御タンパク質またはドメインと、制御される標的核酸との共局在複合体が少なくとも1種類形成され、該転写制御タンパク質またはドメインが、該制御される標的核酸の発現を制御し、
前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼおよび前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が異なる種に由来する、
前記方法。
【請求項22】
細胞においてゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の1種類または複数種類の標的核酸の発現を制御すると同時に細胞においてゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の1種類または複数種類の標的核酸を改変する方法(ただし、前記制御および改変がヒトの体内で行われる場合を除く)であって、
少なくとも1種類のガイドRNAが前記改変される1種類または複数種類の標的核酸に相補的であり、少なくとも1種類のガイドRNAが前記制御される1種類または複数種類の標的核酸に相補的である、2種類以上のガイドRNAをコードする第1の外来核酸を前記細胞に導入すること、
(1)前記改変される1種類または複数種類の標的核酸に相補的である前記1種類または複数種類のガイドRNAによってガイドされる、1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ、および(2)前記制御される標的核酸に相補的である前記1種類または複数種類のガイドRNAに結合し且つガイドされる、1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、をコードする第2の外来核酸を前記細胞に導入すること、および
1種類または複数種類の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記複数種類のガイドRNA、前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、および前記1種類または複数種類の転写制御タンパク質またはドメインが発現し、ここで、前記1種類または複数種類の転写制御タンパク質またはドメインは、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質または1種類以上のガイドRNAに、結合またはその他の態様で(otherwise)接続しており、
ガイドRNAと、直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼと、および改変される標的核酸との共局在複合体が少なくとも1種類形成され、該直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼが、該改変される標的核酸を切断し、
ガイドRNAと、直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質と、転写制御タンパク質またはドメインと、制御される標的核酸との共局在複合体が少なくとも1種類形成され、該転写制御タンパク質またはドメインが、該制御される標的核酸の発現を制御し、
前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼおよび前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が異なる種に由来する、
前記方法。
【請求項23】
細胞中の外来性DNA以外のゲノムDNAまたはミトコンドリアDNAの中の2種類以上の標的核酸にそれぞれ相補的である2種類以上のガイドRNAをコードする第1の外来核酸、
2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質をコードする第2の外来核酸、および
2種類以上の転写制御タンパク質またはドメインをコードする第3の外来核酸を含み、
各ガイドRNA、直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質、および転写制御タンパク質またはドメインが、各標的核酸に対する共局在複合体の構成要素であり、ここで、前記2種類以上の転写制御タンパク質またはドメインは、前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質または前記2種類以上のガイドRNAに、結合またはその他の態様で(otherwise)接
続しており、
前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が、異なる種に由来する、
細胞。
【請求項24】
直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質をコードする前記第2の外来核酸が、該直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質に融合した前記転写制御タンパク質またはドメインをさらにコードする、請求項23に記載の細胞。
【請求項25】
前記細胞が真核細胞であり、2種類以上のガイドRNAをコードする前記第1の外来核酸が、RNA結合ドメインの標的をさらにコードし、前記転写制御タンパク質またはドメインをコードする前記外来核酸が、前記転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする、請求項23に記載の細胞。
【請求項26】
前記転写制御タンパク質またはドメインが転写活性化因子である、請求項23に記載の細胞。
【請求項27】
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御する、請求項23に記載の細胞。
【請求項28】
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御して疾患または有害な健康状態を治療する、請求項23に記載の細胞。
【請求項29】
前記標的核酸が疾患または有害な健康状態と関連する、請求項23に記載の細胞。
【請求項30】
細胞中のゲノムDNA、ミトコンドリアDNAまたはウイルスDNAの中の2種類以上の標的核酸にそれぞれ相補的である2種類以上のガイドRNAをコードする第1の外来核酸、および
2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼをコードする第2の外来核酸、ここで、前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼはそれぞれ異なる種に由来し、標的核酸中の対応するPAM配列を認識する、
を含む、培養における細胞であって、
前記細胞は、前記2種類以上のガイドRNAおよび前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼを発現するように構成され、
前記細胞は、ガイドRNA、直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼ、および標的核酸をそれぞれ含む2種類以上の共局在複合体を含む
前記細胞。
【請求項31】
複数の標的核酸が切断されるまたは複数の標的核酸にニックが入れられる、請求項30に記載の細胞。
【請求項32】
前記2種類以上のII型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼのそれぞれが、直交性Cas9ヌクレアーゼ又はニッカーゼである、請求項30に記載の細胞。
【請求項33】
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼのそれぞれが、マッチングするcrRNA配列とtracrRNA配列とを有する対応する種特異的なガイドRNAに結合する、請求項30に記載の細胞。
【請求項34】
各ガイドRNAが100ヌクレオチド~500ヌクレオチドを含む、請求項30に記載の細胞。
【請求項35】
前記細胞が真核細胞である、請求項23または請求項30に記載の細胞。
【請求項36】
前記細胞が、酵母細胞、植物細胞、または動物細胞である、請求項23または請求項30に記載の細胞。
【請求項37】
前記2種類以上のガイドRNAがtracrRNA-crRNA融合体である、請求項23または請求項30に記載の細胞。
【請求項38】
前記2種類以上のII型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が、直交性ヌクレアーゼ欠損Cas9タンパク質である、請求項1に記載の方法。
【請求項39】
前記2種類以上のII型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が、直交性ヌクレアーゼ欠損Cas9タンパク質である、請求項23に記載の細胞。
【請求項40】
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼ又はニッカーゼが、直交性Cas9ヌクレアーゼ又はニッカーゼである、請求項12に記載の方法。
【請求項41】
前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ニッカーゼが直交性Cas9ニッカーゼであり、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が直交性ヌクレアーゼ欠損Cas9タンパク質である、請求項21に記載の方法。
【請求項42】
前記1種類または複数種類の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼが直交性Cas9ヌクレアーゼであり、前記1種類または複数種類の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が直交性ヌクレアーゼ欠損Cas9タンパク質である、請求項22に記載の方法。
【請求項43】
前記2種類以上の直交性II型CRISPRシステムヌクレアーゼ欠損DNA結合タンパク質が直交性ヌクレアーゼ欠損Cas9タンパク質である、請求項23に記載の細胞。
【請求項44】
前記2種類以上の直交性II型CRISPRシステムDNA結合タンパク質ヌクレアーゼまたはニッカーゼが直交性Cas9ヌクレアーゼまたはニッカーゼである、請求項30に記載の細胞。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願データ
本願は、2013年7月10日に提出された米国仮特許出願第61/844,844号に基づく優先権を主張するものであり、あらゆる目的のため、その全体が参照により本明細書に組み込まれる。
【0002】
政府利益の説明
本発明は、米国国立衛生研究所助成金番号P50HG005550号および米国エネルギー省助成金番号DE-FG02-02ER63445の国庫助成により行われた。米国政府は本発明に関して一定の権利を有する。
【背景技術】
【0003】
細菌および古細菌のCRISPR-Casシステムは、Casタンパク質と複合体を形成した短鎖ガイドRNAに依存して、侵入する外来核酸中に存在する相補配列を分解する。Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011); Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012); Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011);およびBhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011)を参照されたい。近年、ストレプトコッカス・ピオゲネス(S. pyogenes)のII型CRISPRシステムのインビトロ再構成により、通常はトランスにコードされるtracrRNA(「トランス活性化型CRISPR RNA」)と融合したcrRNA(「CRISPR RNA」)が、そのcrRNAに一致する標的DNA配列をCas9タンパク質に配列特異的に切断させるのに十分であることが実証された。標的部位に相同なgRNAの発現により、Cas9が動員され、標的DNAが分解される。H. Deveau et al, Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008)を参照されたい。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の態様は、ガイドRNAと、DNA結合タンパク質と、二本鎖DNA標的配列との複合体に関するものである。
【課題を解決するための手段】
【0005】
ある態様によれば、本開示の範囲内のDNA結合タンパク質には、ガイドRNAとの複合体を形成するタンパク質が含まれ、このガイドRNAは、この複合体を二本鎖DNA配列にガイドし、そこでこの複合体はこのDNA配列に結合する。本開示のこの態様を、RNAとDNA結合タンパク質の二本鎖DNAへの共局在、またはRNAとDNA結合タンパク質の二本鎖DNAとの共局在とも呼ぶことができる。このようにして、DNA結合タンパク質-ガイドRNA複合体を用いて、標的DNAの発現を制御するために転写制御タンパク質またはドメインを標的DNAに局在させることができる。ある態様によれば、2種類以上または複数種類の直交性RNA誘導型DNA結合タンパク質(orthogonal RNA guided DNA binding protein)、または一組の直交性RNA誘導型DNA結合タンパク質を用いて、細胞においてDNA中の遺伝子が同時に且つ独立して制御され得る。ある態様によれば、2種類以上もしくは複数種類、または一組の直交性RNA誘導型DNA結合タンパク質を用いて、細胞においてDNA中の遺伝子が同時に且つ独立して編集され得る。DNA結合タンパク質またはRNA誘導型DNA結合タンパク質に言及する場合は、直交性DNA結合タンパク質または直交性RNA誘導型DNA結合タンパク質が含まれると理解すべきである。そのような直交性DNA結合タンパク質または直交性RNA誘導型DNA結合タンパク質は、ヌクレアーゼ活性を有していてもよく、ニッカーゼ活性を有していてもよく、ヌクレアーゼ欠損(nuclease null)であってもよい。
【0006】
ある態様によれば、
標的核酸を含むDNA(デオキシリボ核酸)に相補的である1種類または複数種類のRNA(リボ核酸)をコードする第1の外来核酸を細胞に導入すること、
前記DNAに結合し、且つ前記1種類または複数種類のRNAによってガイドされる、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする第2の外来核酸を前記細胞に導入すること、および
転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記1種類または複数種類のRNA、前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記転写制御タンパク質またはドメインが発現し、
前記1種類または複数種類のRNA、前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記転写制御タンパク質またはドメインが、前記DNAに共局在し、
前記転写制御タンパク質またはドメインが前記標的核酸の発現を制御する、
細胞において標的核酸の発現を調節する方法が提供される。
【0007】
ある態様によれば、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする外来核酸は、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質に融合した転写制御タンパク質またはドメインをさらにコードする。ある態様によれば、1種類または複数種類のRNAをコードする外来核酸は、RNA結合ドメインの標的をさらにコードし、転写制御タンパク質またはドメインをコードする外来核酸は、転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする。
【0008】
ある態様によれば、細胞は、真核細胞である。ある態様によれば、細胞は、酵母細胞、植物細胞、または動物細胞である。ある態様によれば、細胞は、哺乳動物細胞である。
【0009】
ある態様によれば、RNAは約10~約500ヌクレオチドである。ある態様によれば、RNAは約20~約100ヌクレオチドである。
【0010】
ある態様によれば、転写制御タンパク質またはドメインは、転写活性化因子である。ある態様によれば、転写制御タンパク質またはドメインは、標的核酸の発現を上方制御する。ある態様によれば、転写制御タンパク質またはドメインは、疾患または有害な健康状態(detrimental condition)を治療するために標的核酸の発現を上方制御する。ある態様によれば、標的核酸は、疾患または有害な健康状態と関連する。ある態様によれば、転写制御タンパク質またはドメインは、転写抑制因子である。ある態様によれば、転写制御タンパク質またはドメインは、標的核酸の発現を下方制御する。ある態様によれば、転写制御タンパク質またはドメインは、疾患または有害な健康状態を治療するために標的核酸の発現を下方制御する。ある態様によれば、標的核酸は、疾患または有害な健康状態と関連する。
【0011】
ある態様によれば、1種類または複数種類のRNAは、ガイドRNAである。ある態様によれば、1種類または複数種類のRNAは、tracrRNA-crRNA融合体である。
【0012】
ある態様によれば、DNAは、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである。
【0013】
ある態様によれば、
標的核酸を含むDNA(デオキシリボ核酸)に相補的である1種類または複数種類のRNA(リボ核酸)をコードする第1の外来核酸を細胞に導入すること、
前記DNAに結合し、且つ前記1種類または複数種類のRNAによってガイドされる、II型CRISPRシステムのRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする第2の外来核酸を前記細胞に導入すること、および
転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記1種類または複数種類のRNA、前記II型CRISPRシステムのRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記転写制御タンパク質またはドメインが発現し、
前記1種類または複数種類のRNA、II型CRISPRシステムの前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記転写制御タンパク質またはドメインがDNAに共局在し、
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を制御する、
細胞において標的核酸の発現を調節する方法が提供される。
【0014】
ある態様によれば、II型CRISPRシステムのRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする外来核酸は、II型CRISPRシステムのRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質に融合した転写制御タンパク質またはドメインをさらにコードする。ある態様によれば、1種類または複数種類のRNAをコードする外来核酸は、RNA結合ドメインの標的をさらにコードし、転写制御タンパク質またはドメインをコードする外来核酸は、転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする。
【0015】
ある態様によれば、細胞は、真核細胞である。ある態様によれば、細胞は、酵母細胞、植物細胞、または動物細胞である。ある態様によれば、細胞は、哺乳動物細胞である。
【0016】
ある態様によれば、RNAは約10~約500ヌクレオチドである。ある態様によれば、RNAは約20~約100ヌクレオチドである。
【0017】
ある態様によれば、転写制御タンパク質またはドメインは、転写活性化因子である。ある態様によれば、転写制御タンパク質またはドメインは標的核酸の発現を上方制御する。ある態様によれば、転写制御タンパク質またはドメインは、疾患または有害な健康状態を治療するために標的核酸の発現を上方制御する。ある態様によれば、標的核酸は、疾患または有害な健康状態と関連する。
【0018】
ある態様によれば、1種類または複数種類のRNAは、ガイドRNAである。ある態様によれば、1種類または複数種類のRNAは、tracrRNA-crRNA融合体である。
【0019】
ある態様によれば、DNAは、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである。
【0020】
ある態様によれば、
標的核酸を含むDNA(デオキシリボ核酸)に相補的である1種類または複数種類のRNA(リボ核酸)をコードする第1の外来核酸を細胞に導入すること、
前記DNAに結合し、且つ前記1種類または複数種類のRNAによってガイドされる、ヌクレアーゼ欠損Cas9タンパク質をコードする第2の外来核酸を細胞に導入すること、および
転写制御タンパク質またはドメインをコードする第3の外来核酸を細胞に導入することを含み、
前記1種類または複数種類のRNA、前記ヌクレアーゼ欠損Cas9タンパク質、および前記転写制御タンパク質またはドメインが発現し、
前記1種類または複数種類のRNA、前記ヌクレアーゼ欠損Cas9タンパク質、および前記転写制御タンパク質またはドメインがDNAに共局在し、
前記転写制御タンパク質またはドメインが前記標的核酸の発現を制御する、
細胞において標的核酸の発現を調節する方法が提供される。
【0021】
ある態様によれば、ヌクレアーゼ欠損Cas9タンパク質をコードする外来核酸は、ヌクレアーゼ欠損Cas9タンパク質に融合した転写制御タンパク質またはドメインをさらにコードする。ある態様によれば、1種類または複数種類のRNAをコードする外来核酸は、RNA結合ドメインの標的をさらにコードし、転写制御タンパク質またはドメインをコードする外来核酸は、転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする。
【0022】
ある態様によれば、細胞は、真核細胞である。ある態様によれば、細胞は、酵母細胞、植物細胞、または動物細胞である。ある態様によれば、細胞は、哺乳動物細胞である。
【0023】
ある態様によれば、RNAは約10~約500ヌクレオチドである。ある態様によれば、RNAは約20~約100ヌクレオチドである。
【0024】
ある態様によれば、転写制御タンパク質またはドメインは、転写活性化因子である。ある態様によれば、転写制御タンパク質またはドメインは、標的核酸の発現を上方制御する。ある態様によれば、転写制御タンパク質またはドメインは、疾患または有害な健康状態を治療するために標的核酸の発現を上方制御する。ある態様によれば、標的核酸は、疾患または有害な健康状態と関連する。
【0025】
ある態様によれば、1種類または複数種類のRNAは、ガイドRNAである。ある態様によれば、1種類または複数種類のRNAは、tracrRNA-crRNA融合体である。
【0026】
ある態様によれば、DNAは、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである。
【0027】
ある態様によれば、
標的核酸を含むDNAに相補的である1種類または複数種類のRNAをコードする第1の外来核酸、
RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする第2の外来核酸、および
転写制御タンパク質またはドメインをコードする第3の外来核酸を含み、
前記1種類または複数種類のRNA、前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記転写制御タンパク質またはドメインが、前記標的核酸に対する共局在複合体の構成要素である、
細胞が提供される。
【0028】
ある態様によれば、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする外来核酸は、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質に融合した転写制御タンパク質またはドメインをさらにコードする。ある態様によれば、1種類または複数種類のRNAをコードする外来核酸は、RNA結合ドメインの標的をさらにコードし、転写制御タンパク質またはドメインをコードする外来核酸は、転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする。
【0029】
ある態様によれば、細胞は、真核細胞である。ある態様によれば、細胞は、酵母細胞、植物細胞、または動物細胞である。ある態様によれば、細胞は、哺乳動物細胞である。
【0030】
ある態様によれば、RNAは約10~約500ヌクレオチドである。ある態様によれば、RNAは約20~約100ヌクレオチドである。
【0031】
ある態様によれば、転写制御タンパク質またはドメインは、転写活性化因子である。ある態様によれば、転写制御タンパク質またはドメインは、標的核酸の発現を上方制御する。ある態様によれば、転写制御タンパク質またはドメインは、疾患または有害な健康状態を治療するために標的核酸の発現を上方制御する。ある態様によれば、標的核酸は、疾患または有害な健康状態と関連する。
【0032】
ある態様によれば、1種類または複数種類のRNAは、ガイドRNAである。ある態様によれば、1種類または複数種類のRNAは、tracrRNA-crRNA融合体である。
【0033】
ある態様によれば、DNAは、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである。
【0034】
ある態様によれば、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質は、II型CRISPRシステムのRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質である。ある態様によれば、RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質はヌクレアーゼ欠損Cas9タンパク質である。
【0035】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
直交性RNA誘導型DNA結合タンパク質ニッカーゼであってもよい少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼをコードし、且つ前記2種類以上のRNAによってガイドされる、第2の外来核酸を細胞に導入することを含み、
前記2種類以上のRNAおよび前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが発現し、
前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが、前記2種類以上のRNAと共に前記DNA標的核酸に共局在し、前記DNA標的核酸にニックを入れて2つ以上の近接するニックを生じさせる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0036】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
II型CRISPRシステムの少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼをコードし、且つ2種類以上のRNAによってガイドされる、第2の外来核酸を細胞に導入することを含み、
前記2種類以上のRNAおよびII型CRISPRシステムの前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが発現し、
II型CRISPRシステムの前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが、前記2種類以上のRNAと共に前記DNA標的核酸に共局在し、前記DNA標的核酸にニックを入れて2つ以上の近接するニックを生じさせる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0037】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
1つの不活性ヌクレアーゼドメインを有し、且つ2種類以上のRNAによってガイドされる、少なくとも1種類のCas9タンパク質ニッカーゼをコードする第2の外来核酸を細胞に導入することを含み、
前記2種類以上のRNAおよび前記少なくとも1種類のCas9タンパク質ニッカーゼが発現し、
前記少なくとも1種類のCas9タンパク質ニッカーゼが、前記2種類以上のRNAと共に前記DNA標的核酸に共局在して、前記DNA標的核酸にニックを形成することにより2つ以上の近接するニックを生じさせる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0038】
DNA標的核酸を改変する方法によれば、2つ以上の近接するニックは二本鎖DNAの同じストランド上に存在する。ある態様によれば、2つ以上の近接するニックは二本鎖DNAの同じストランド上に存在して、相同組換えを引き起こす。ある態様によれば、2つ以上の近接するニックは二本鎖DNAの異なるストランド上に存在する。ある態様によれば、2つ以上の近接するニックは二本鎖DNAの異なるストランド上に存在して、二本鎖切断を生じさせる。ある態様によれば、2つ以上の近接するニックは二本鎖DNAの異なるストランド上に存在して、二本鎖切断を生じさせて非相同末端結合を引き起こす。ある態様によれば、2つ以上の近接するニックは、二本鎖DNAの異なるストランド上に存在し、且つ互いにオフセット(offset)である。ある態様によれば、2つ以上の近接するニックは、二本鎖DNAの異なるストランド上に存在し、互いにオフセットであり、且つ二本鎖DNA切断を生じさせる。ある態様によれば、2つ以上の近接するニックは、二本鎖DNAの異なるストランド上に存在し、互いにオフセットであり、且つ二本鎖切断を生じさせて非相同末端結合を引き起こす。ある態様によれば、前記方法は、ドナー核酸配列をコードする第3の外来核酸を細胞に導入することをさらに含み、2つ以上のニックにより、ドナー核酸配列と標的核酸の相同組換えが引き起こされる。
【0039】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼをコードし、且つ前記2種類以上のRNAによってガイドされる、第2の外来核酸を前記細胞に導入することを含み、
前記2種類以上のRNAおよび前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが発現し、
前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが前記2種類以上のRNAと共にDNA標的核酸に共局在し、DNA標的核酸にニックを入れて2つ以上の近接するニックを生じさせ、
2つ以上の近接するニックが、二本鎖DNAの異なるストランド上に存在し、二本鎖DNA切断を生じさせて前記標的核酸の断片化を引き起こすことによって前記標的核酸の発現を妨げる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0040】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
II型CRISPRシステムの少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼをコードし、且つ前記2種類以上のRNAによってガイドされる、第2の外来核酸を細胞に導入することを含み、
前記2種類以上のRNAおよびII型CRISPRシステムの前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが発現し、
前記II型CRISPRシステムの前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが、前記2種類以上のRNAと共に前記DNA標的核酸に共局在し、前記DNA標的核酸にニックを入れて2つ以上の近接するニックを生じさせ、
前記2つ以上の近接するニックが、二本鎖DNAの異なるストランド上に存在し、二本鎖切断を生じさせて前記標的核酸の断片化を引き起こすことによって前記標的核酸の発現を妨げる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0041】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、および
1つの不活性ヌクレアーゼドメインを有する少なくとも1種類のCas9タンパク質ニッカーゼをコードし、且つ前記2種類以上のRNAによってガイドされる、第2の外来核酸を細胞に導入することを含み、
前記2種類以上のRNAおよび前記少なくとも1種類のCas9タンパク質ニッカーゼが発現し、
前記少なくとも1種類のCas9タンパク質ニッカーゼが、前記2種類以上のRNAと共に前記DNA標的核酸に共局在し、前記DNA標的核酸にニックを入れて2つ以上の近接するニックを生じさせ、
前記2つ以上の近接するニックが、二本鎖DNAの異なるストランド上に存在し、二本鎖切断を生じさせて前記標的核酸の断片化を引き起こすことによって前記標的核酸の発現を妨げる、
細胞においてDNA標的核酸を改変する方法が提供される。
【0042】
ある態様によれば、
DNA標的核酸中の近接している部位にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸、および
少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼをコードする第2の外来核酸を含み、
前記2種類以上のRNAおよび前記少なくとも1種類のRNA誘導型DNA結合タンパク質ニッカーゼが、前記DNA標的核酸に対する共局在複合体の構成要素である、
細胞が提供される。
【0043】
ある態様によれば、RNA誘導型DNA結合タンパク質ニッカーゼは、II型CRISPRシステムのRNA誘導型DNA結合タンパク質ニッカーゼである。ある態様によれば、RNA誘導型DNA結合タンパク質ニッカーゼは、1つの不活性ヌクレアーゼドメインを有するCas9タンパク質ニッカーゼである。
【0044】
ある態様によれば、細胞は、真核細胞である。ある態様によれば、細胞は、酵母細胞、植物細胞、または動物細胞である。ある態様によれば、細胞は、哺乳動物細胞である。
【0045】
ある態様によれば、RNAは約10~約500ヌクレオチドを含む。ある態様によれば、RNAは約20~約100ヌクレオチドを含む。
【0046】
ある態様によれば、標的核酸は疾患または有害な健康状態と関連する。
【0047】
ある態様によれば、2種類以上のRNAは、ガイドRNAである。ある態様によれば、2種類以上のRNAは、tracrRNA-crRNA融合体である。
【0048】
ある態様によれば、DNA標的核酸は、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである。
【0049】
ある態様によれば、方法は、直交性RNA誘導型DNA結合タンパク質ニッカーゼ、直交性RNA誘導型DNA結合タンパク質ヌクレアーゼ、直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質の併用を含んでいてもよい。したがって、同一の細胞において、DNAのニック形成または切断および翻訳の仲介によって生じる改変がなされ得る。さらに、エレクトロポレーションなどの細胞に核酸を導入する当業者に公知の方法を用いて1種類以上または複数種類の外来性ドナー核酸を細胞に添加してもよく、相同組換えなどの組換えまたは当業者に公知のその他の機構により細胞のDNAに1種類以上または複数種類の外来性ドナー核酸を導入してもよい。したがって、本明細書に記載されている複数の直交性RNA誘導型DNA結合タンパク質の使用により、ニッキングまたは切断による単一細胞の改変、細胞中のDNAへのドナー核酸の導入、遺伝子の転写制御が可能になる。
【0050】
本発明の特定の実施形態のその他の特徴および利点は、以下の実施形態およびそれらの図面の説明において、および特許請求の範囲から、さらに十分に明らかになるであろう。
【0051】
本実施形態の上記およびその他の特徴および利点は、添付されている図面と併せて、以下の例示的な実施形態の詳細な説明から、より十分に理解されるであろう。
【図面の簡単な説明】
【0052】
【
図1C】レポーターコンストラクトのデザインである。
【
図1D】蛍光標示式細胞分取(FACS)および免疫蛍光アッセイ(IF)の両方によってアッセイした、Cas9N-VP64融合体がRNA誘導性転写活性化を示すことを表すデータを示す図である。
【
図1E】Cas9N、MS2-VP64、および適切なMS2アプタマー結合部位を有するgRNAの存在下におけるレポーターコンストラクトのgRNA配列特異的転写活性化を示すFACSおよびIFによるアッセイデータを示す図である。
【
図1F】個々のgRNAおよび複数のgRNAによる転写誘導を表すデータを示す図である。
【
図2A】Cas9-gRNA複合体およびTALEによる標的化のランドスケープを評価する方法を示す図である。
【
図2B】Cas9-gRNA複合体が平均してその標的配列中の1~3個の変異に対して許容性があることを表すデータを示す図である。
【
図2C】Cas9-gRNA複合体が、PAM配列に局在するものを除いて、点変異にほとんど感受性がないことを表すデータを示す図である。
【
図2D】2塩基のミスマッチの導入によってCas9-gRNA複合体活性が顕著に損なわれることを表すヒートプロットデータを示す図である。
【
図2E】18塩基長のTALEが平均してその標的配列中の1~2個の変異に対して許容性があることを表すデータを示す図である。
【
図2F】18塩基長のTALEが、Cas9-gRNA複合体と同様に、その標的中の1塩基のミスマッチにほとんど感受性がないことを表すデータを示す図である。
【
図2G】2塩基のミスマッチの導入によって18塩基長のTALEの活性が顕著に損なわれることを表す、ヒートプロットデータを示す図である。
【
図3B】5′オーバーハングを生じさせるオフセットニックおよび3′オーバーハングを生じさせるオフセットニックについての非相同末端結合の割合を表すデータを示す図である。
【
図3C】5′オーバーハングを生じさせるオフセットニックおよび3′オーバーハングを生じさせるオフセットニックについての標的化の割合を表すデータを示す図である。
【
図4A】PDB ID:4EP4(青)のRuvCのD7位の金属配位残基の模式図(左)、配位しているMgイオン(灰色の球)および3M7K由来のDNA(紫)を含むPDB ID:3M7K(オレンジ)およびPDB ID:4H9D(シアン)のHNHエンドヌクレアーゼドメインの模式図(中央)、および分析した変異体のリスト(右)を示す図である。
【
図4B】CAS9変異体m3およびm4、ならびにそれら変異体のそれぞれとVP64との融合体のヌクレアーゼ活性が検出不能であることを表すデータを示す図である。
【
図5A】Cas9-gRNA活性を決定するための相同組換えアッセイの模式図である。
【
図5B】ランダム配列挿入を有するガイドRNAおよび相同組換えの割合を示す図である。
【
図6A】OCT4遺伝子のガイドRNAの模式図である。
【
図6B】プロモーター・ルシフェラーゼレポーターコンストラクトでの転写活性化を示す図である。
【
図6C】転写活性化を内在性遺伝子のqPCRにより示す図である。
【
図7A】REX1遺伝子用のガイドRNAの模式図である。
【
図7B】プロモーター・ルシフェラーゼレポーターコンストラクトの転写活性化を示す図である。
【
図7C】qPCRによって内在性遺伝子の転写活性化を示す図である。
【
図8A】標準化された発現レベルを算出するための多段階特異性分析処理フローを模式的に示す図である。
【
図8B】バイアスがかけられたコンストラクトライブラリー内に生じたミスマッチの数に対する結合部位の割合の分布データを示す図である。左:理論的分布。右:実際のTALEコンストラクトライブラリーで観察された分布。
【
図8C】ミスマッチの数に対する、結合部位に集計したタグの数の割合の分布データを示す図である。左:陽性対照試料で観察された分布。右:対照でないTALEが誘導された試料で観察された分布。
【
図9A】標的配列中の1~3個の変異に許容性を示す、Cas9-gRNA複合体の標的化グランドスケープの分析のデータを示す図である。
【
図9B】PAM配列に局在しているものを除いて、点変異への感受性がないことを示すCas9-gRNA複合体の標的化ランドスケープの分析データを示す図である。
【
図9C】2塩基のミスマッチの導入により活性が顕著に損なわれることを示す、Cas9-gRNA複合体の標的化ランドスケープの分析のヒートプロットデータを示す図である。
【
図9D】ストレプトコッカス・ピオゲネス(S. pyogenes)のCas9の予想されるPAMがNGGであり、またNAGであることを確認する、ヌクレアーゼ介在性HRアッセイのデータを示す図である。
【
図10A】18塩基長のTALEがそれらの標的配列中の複数の変異に対して許容性があることを確認する、ヌクレアーゼ介在性HRアッセイのデータを示す図である。
【
図10B】3つの異なるサイズ(18塩基長、14塩基長、および10塩基長)のTALEの標的化ランドスケープの分析のデータを示す図である。
【
図10C】ほぼ1塩基ミスマッチの分解能を示す10塩基長のTALEのデータを示す図である。
【
図10D】ほぼ1塩基ミスマッチの分解能を示す10塩基長のTALEのヒートプロットデータを示す図である。
【
図11A】デザインされたガイドRNAを示す図である。
【
図11B】種々のガイドRNAの非相同末端結合のパーセンテージを示す図である。
【
図12A】推定上の直交性Cas9タンパク質の比較および特徴を示す図である。
図12A:SP、ST1、NM、およびTDの反復配列。保存度を示すように塩基が着色されている。
【
図12B】大腸菌中でのCas9タンパク質の特徴解析に用いたプラスミド。
【
図12C】スペーサーとプロトスペーサーがマッチする場合、Cas9による切断によってライブラリーから機能性PAMが除去される。
【
図12D】標的化プラスミドのスペーサーとライブラリーのプロトスペーサーがマッチしない場合、Cas9は切断しない。
【
図12E】非機能性のPAMは切断または除去されない。
【
図12F】PAMを特定するための選択スキーム。Cas9タンパク質および2つのスペーサー含有標的化プラスミドの一方を発現する細胞を、対応するプロトスペーサーを有する2つのライブラリーの一方で形質転換し、抗生物質選択を行った。生存している切断されなかったプラスミドのディープシークエンシングを行った。マッチしないプロトスペーサーライブラリーに対するマッチするプロトスペーサーライブラリー内の各配列の相対的存在量を比較することにより、Cas9によるPAM除去を定量化した。
【
図13A】Cas9タンパク質によるライブラリーからの機能性プロトスペーサー隣接モチーフ(PAM)の除去を示す図である。マッチするスペーサー・プロトスペーサー対の各位置における各塩基の対数頻度が、スペーサーとプロトスペーサーがマッチしない対照条件に対してプロットされる。結果は、2つの別個のプロトスペーサー配列(
図13D)に基づいた、NMによるライブラリーの平均除去を反映する。
【
図13B】Cas9タンパク質によるライブラリーからの機能性プロトスペーサー隣接モチーフ(PAM)の除去を示す図である。マッチするスペーサー・プロトスペーサー対の各位置における各塩基の対数頻度が、スペーサーとプロトスペーサーがマッチしない対照条件に対してプロットされる。結果は、2つの別個のプロトスペーサー配列(
図13D)に基づいた、ST1によるライブラリーの平均除去を反映する。
【
図13C】Cas9タンパク質によるライブラリーからの機能性プロトスペーサー隣接モチーフ(PAM)の除去を示す図である。マッチするスペーサー・プロトスペーサー対の各位置における各塩基の対数頻度が、スペーサーとプロトスペーサーがマッチしない対照条件に対してプロットされる。結果は、2つの別個のプロトスペーサー配列(
図13D)に基づいた、TDによるライブラリーの平均除去を反映する。
【
図13D】各Cas9タンパク質について、各プロトスペーサーに対する特異的配列の除去が独立してプロットされる。
【
図13E】各Cas9タンパク質について、各プロトスペーサーに対する特異的配列の除去が独立してプロットされる。
【
図13F】各Cas9タンパク質について、各プロトスペーサーに対する特異的配列の除去が独立してプロットされる。
【
図14A】NMによる転写抑制を示す図である。抑制を定量化するために用いるレポータープラスミド。
【
図14B】NMによる転写抑制を示す図である。マッチおよびミスマッチのスペーサー・プロトスペーサー対について標準化された細胞蛍光。エラーバーは5回反復実験の標準偏差を表す。
【
図15】大腸菌中でのcrRNAの直交認識を示す図である。Cas9およびcrRNAの全ての組合せを有する細胞を、マッチまたはミスマッチのプロトスペーサーおよび適切なPAMを有するプラスミドに曝した。マッチするスペーサーとプロトスペーサーの対からコロニーが確実に得られるように十分な細胞をプレーティングし、全コロニー数を用いて除去倍率を算出した。
【
図16A】ヒト細胞におけるCas9による遺伝子編集を示す図である。相同組換えアッセイを用いて遺伝子編集効率を定量化した。Cas9によるプロトスペーサー内のDNA二本鎖切断は、ドナー鋳型を用いて分断型GFPカセットの修復を促進し、完全な(intact)GFPを有する細胞が生じた。各Cas9についての的確なPAMを準備するために、3種類の異なる鋳型を用いた。
【
図16B】各Cas9についての的確なPAMを準備するために、3種類の異なる鋳型を用いた。蛍光細胞をフローサイトメトリーにより定量化した。それぞれについてのsgRNAと組み合わせた、NM、ST1、およびTDの細胞選別の結果。各Cas9に対するプロトスペーサーおよびPAM配列が各セットの上に示される。各プロットの右上隅に修復効率が示される。
【
図17A】ヒト細胞における転写活性化を示す図である。tdTomato誘導性(driving)ミニマルプロモーターを特徴とする転写活性化のためのレポーターコンストラクト。プロトスペーサーおよびPAM配列をミニマルプロモーターの上流に配置した。
【
図17B】プロトスペーサーへのヌクレアーゼ欠損Cas9-VP64融合タンパク質の結合により、転写が活性化し、蛍光が増大した。Cas9活性化因子およびsgRNAの全ての組合せで細胞に遺伝子導入し、tdTomatoの蛍光を可視化した。それぞれのCas9が自身のsgRNAと対になった場合にのみ転写が活性化された。
【発明を実施するための形態】
【0053】
本明細書に列挙される補足文献は上付き数字で参照されることがある。上付き文字は、特定の記載を補足するために完全に記載されている場合と同様に、参照文献を参照するものであると理解されるべきである。
【0054】
細菌および古細菌のCRISPR-Casシステムは、ウイルスDNAまたはプラスミドDNAの断片のCRISPR座位への取り込み、転写されたcrRNAを用いてヌクレアーゼをガイドして相同配列を分解することにより、獲得免疫を付与する1、2。II型CRISPRシステムでは、Cas9ヌクレアーゼとcrRNAおよびtracrRNA(トランス活性化型crRNA)との三元複合体が、crRNAスペーサーにマッチし且つ短いプロトスペーサー隣接モチーフ(PAM)を含むdsDNAプロトスペーサー配列に結合して、これを切断する3、4。crRNAとtracrRNAを融合することにより、Cas9を標的とするのに十分な単一ガイドRNA(sgRNA)が生成する4。
【0055】
Cas9は、RNA誘導型のヌクレアーゼおよびニッカーゼとして、種々の生物における標的遺伝子の編集5~9および選択10用に適応されてきた。これらの成功例はほぼ間違いなく革新的であるが、ヌクレアーゼ欠損Cas9変異体は、タンパク質およびRNAをほぼ全ての一連のdsDNA配列に局在化させる能力のため、生物学的システムの制御のための多大な汎用性を提供するので11~17、制御目的のために有用である。細菌におけるプロモーターおよび5′UTRの妨害による標的遺伝子抑制に始まり18、Cas9による制御は、ヒト細胞におけるVP6419動員による転写活性化にまで及んでいる19。ある態様によれば、直交性Cas9タンパク質などの直交性RNA誘導型DNA結合タンパク質を含む本明細書に記載のDNA結合タンパク質は、転写活性化因子、抑制因子、蛍光タンパク質標識、染色体連結(tether)、および当業者に公知の多くの他のツールと共に用いられてもよい。この態様によれば、直交性Cas9の使用により、あらゆる転写活性化因子、抑制因子、蛍光タンパク質標識、染色体連結、および当業者に公知の多くの他のツールを用いた遺伝子修飾が可能になる。したがって、本開示の態様は、多重的なRNA誘導性の転写活性化、抑制、および遺伝子編集のための直交性Cas9タンパク質の使用に関する。
【0056】
本開示の実施形態は、細菌およびヒト細胞における複数のCas9タンパク質間の直交性の特徴解析および実証に関する。そのような直交性RNA誘導型DNA結合タンパク質は、個々の細胞のDNA中の複数の遺伝子を同時に且つ独立して転写制御、標識、または編集するために、複数またはセットで使用され得る。
【0057】
ある態様によれば、CRISPRシステムの単一のファミリー内から複数の直交性Cas9タンパク質が特定される。ストレプトコッカス・ピオゲネス(S. pyogenes)、ナイセリア・メニンジティディス(N. meningitidis)、ストレプトコッカス・サーモフィラス(S. thermophilus)、およびトレポネーマ・デンティコラ(T. denticola)由来の例示的Cas9タンパク質は、明白に関係しているが、長さが3.25kb~4.6kbであり、完全に異なるPAM配列を認識する。
【0058】
本開示の実施形態は、標的核酸を制御するようにDNAに転写制御タンパク質またはドメインを共局在化させるためのDNA結合タンパク質の使用に基づく。当業者には、種々の目的のためにDNAに結合させるためのそのようなDNA結合タンパク質が容易に理解される。そのようなDNA結合タンパク質は天然のものであってよい。本開示の範囲に含まれるDNA結合タンパク質としては、本明細書中でガイドRNAと呼ぶRNAによってガイドされ得るタンパク質が挙げられる。この態様によれば、ガイドRNAおよびRNA誘導型DNA結合タンパク質は、DNAにおいて共局在複合体を形成する。ある態様によれば、DNA結合タンパク質は、ヌクレアーゼ欠損DNA結合タンパク質であってもよい。この態様によれば、ヌクレアーゼ欠損DNA結合タンパク質は、ヌクレアーゼ活性を有するDNA結合タンパク質の改変または修飾によって生じたものであってもよい。ヌクレアーゼ活性を有するそのようなDNA結合タンパク質は、当業者に公知であり、例えばII型CRISPRシステム中に存在する、Cas9タンパク質などのヌクレアーゼ活性を有する天然のDNA結合タンパク質が挙げられる。そのようなCas9タンパク質およびII型CRISPRシステムは、当該技術分野で十分に裏付けられている。その全体が参照により援用される、全ての追加情報を含む、Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477を参照されたい。
【0059】
ある態様によれば、直交性RNA誘導型DNA結合タンパク質、II型CRISPRシステムの直交性RNA誘導型DNA結合タンパク質、直交性cas9タンパク質など、それぞれがヌクレアーゼ活性型またはヌクレアーゼ欠損型であってもよい、2種類以上もしくは複数種類、または一組の直交性DNA結合タンパク質を特定する方法が提供される。ある態様によれば、2種類以上もしくは複数種類、または一組の直交性DNA結合タンパク質は、同時に且つ独立して、細胞内の遺伝子を制御または核酸を編集するために、対応するガイドRNAと共に用いられてもよい。ある態様によれば、2種類以上もしくは複数種類、または一組の直交性DNA結合タンパク質、対応するガイドRNA、および2種類以上もしくは複数種類、または一組の対応する転写制御因子またはドメインをコードする核酸を細胞に導入してもよい。このようにして、同一細胞において並行して多くの遺伝子を制御または編集の標的とすることができる。ゲノムDNAの編集方法は当業者に周知である。
【0060】
ヌクレアーゼ活性を有する例示的なDNA結合タンパク質は、二本鎖DNAにニックを形成するか、または二本鎖DNAを切断するように機能する。そのようなヌクレアーゼ活性は、ヌクレアーゼ活性を示す1つまたは複数のポリペプチド配列を有するDNA結合タンパク質から生じ得る。そのような例示的なDNA結合タンパク質は、それぞれが二本鎖DNAの特定のストランドを切断すること、またはニックを形成することに関与する、2つの別個のヌクレアーゼドメインを有していてもよい。当業者に知られているヌクレアーゼ活性を有する例示的なポリペプチド配列としては、McrA-HNHヌクレアーゼ関連ドメインおよびRuvC様ヌクレアーゼドメインが挙げられる。したがって、例示的なDNA結合タンパク質は、McrA-HNHヌクレアーゼ関連ドメインおよびRuvC様ヌクレアーゼドメインのうち1つまたは複数を含む天然タンパク質である。ある態様によれば、DNA結合タンパク質は、ヌクレアーゼ活性を不活性化するために改変または修飾される。そのような改変または修飾には、ヌクレアーゼ活性またはヌクレアーゼドメインを不活性化するために1つまたは複数のアミノ酸の改変することが含まれる。そのような修飾には、ヌクレアーゼ活性を示す単数または複数のポリペプチド配列、すなわちヌクレアーゼドメインが、DNA結合タンパク質に存在しないように、ヌクレアーゼ活性を示す単数または複数のポリペプチド配列、すなわちヌクレアーゼドメインを除去することが含まれる。ヌクレアーゼ活性を不活性化するためのその他の修飾は、本開示に基づき当業者に容易に明らかになるであろう。したがって、ヌクレアーゼ欠損DNA結合タンパク質には、ヌクレアーゼ活性を不活性化するように修飾されたポリペプチド配列、またはヌクレアーゼ活性を不活性化するために単数または複数のポリペプチド配列を除去することが含まれる。このヌクレアーゼ欠損DNA結合タンパク質は、ヌクレアーゼ活性が不活性化されていても、DNA結合能を保持している。したがって、DNA結合タンパク質は、DNA結合に必要な単数または複数のポリペプチド配列を含んでいるが、ヌクレアーゼ活性を示すヌクレアーゼ配列のうちの1つ以上または全てを欠いていてもよい。したがって、DNA結合タンパク質は、DNA結合に必要な単数または複数のポリペプチド配列を含んでいるが、不活性化されたヌクレアーゼ活性を示すヌクレアーゼ配列のうちの1つ以上または全てを有していてもよい。
【0061】
ある態様によれば、2つ以上のヌクレアーゼドメインを有するDNA結合タンパク質は、ヌクレアーゼドメインのうちの1つを除いた全てが不活性化されるように修飾または改変されてもよい。そのような修飾または改変されたDNA結合タンパク質は、DNA結合タンパク質が二本鎖DNAの一方のストランドのみを切断する、またはニックをいれるものである限り、DNA結合タンパク質ニッカーゼと呼ばれる。RNAによってDNAにガイドされる場合、DNA結合タンパク質ニッカーゼは、RNA誘導型DNA結合タンパク質ニッカーゼと呼ばれる。
【0062】
例示的なDNA結合タンパク質は、ヌクレアーゼ活性を欠いたII型CRISPRシステムのRNA誘導型DNA結合タンパク質である。例示的なDNA結合タンパク質は、ヌクレアーゼ欠損Cas9タンパク質である。例示的なDNA結合タンパク質は、Cas9タンパク質ニッカーゼである。
【0063】
ストレプトコッカス・ピオゲネス(S. pyogenes)では、Cas9は、タンパク質中の2つの触媒ドメイン、すなわちDNAの相補鎖を切断するHNHドメインおよび非相補鎖を切断するRuvC様ドメインが介在するプロセスによって、プロトスペーサー隣接モチーフ(PAM)の3bp上流に平滑末端二本鎖切断を形成する。その全体が参照により援用されるJinke et al., Science 337, 816-821 (2012)を参照されたい。Cas9タンパク質は、Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477の補足情報で確認されている以下のものを含む、多数のII型CRISPRシステム中に存在することが知られている。メタノコッカス・マリパルディス(Methanococcus maripaludis)C7株;コリネバクテリウム・ジフテリアエ(Corynebacterium diphtheriae);コリネバクテリウム・エフィシエンス(Corynebacterium efficiens)YS-314株;コリネバクテリウム・グルタニカム(Corynebacterium glutamicum)ATCC13032 Kitasato株;コリネバクテリウム・グルタニカム ATCC13032 Bielefeld株;コリネバクテリウム・グルタニカム R株;コリネバクテリウム・クロッペンステッティイ(Corynebacterium kroppenstedtii)DSM44385株;マイコバクテリウム・アブセサス(Mycobacterium abscessus)ATCC19977株;ノカルディア・ファルシニカ(Nocardia farcinica)IFM10152株;ロドコッカス・エリスロポリス(Rhodococcus erythropolis)PR4株;ロドコッカス・ジョスティイ(Rhodococcus jostii)RHA1株;ロドコッカス・オパカス(Rhodococcus opacus)B4 uid36573株;アシドサーマス・セルロリティカス(Acidothermus cellulolyticus)11B株;アルスロバクター・クロロフェノリカス(Arthrobacter chlorophenolicus)A6株;クリベラ・フラビダ(Kribbella flavida)DSM17836 uid43465株;サーモモノスポラ・カーバタ(Thermomonospora curvata)DSM43183株;ビフィドバクテリウム・デンティウム(Bifidobacterium dentium)Bd1株;ビフィドバクテリウム・ロングム(Bifidobacterium longum)DJO10A株;スラッキア・ヘリオトリニレデューセンス(Slackia heliotrinireducens)DSM20476株;パーセフォネラ・マリナ(Persephonella marina)EX H1株;バクテロイデス・フラギリス(Bacteroides fragilis)NCTC9434株;カプノサイトファガ・オクラセア(Capnocytophaga ochracea)DSM7271株;フラボバクテリウム・サイクロフィルム(Flavobacterium psychrophilum)JIP02 86株;アッカーマンシア・ムシニフィラ(Akkermansia muciniphila)ATCC BAA835株;ロゼイフレクサス・キャステンホルツィイ(Roseiflexus castenholzii)DSM13941株;ロゼイフレクサス(Roseiflexus)RS1株;シネコシスティス(Synechocystis)PCC6803株; エルシミクロビウム・ミヌトゥム(Elusimicrobium minutum)Pei191株;未培養細菌Termite group1 phylotype Rs‐D17;フィブロバクター・サクシノゲネス(Fibrobacter succinogenes)S85株;バチルス・セレウス(Bacillus cereus)ATCC10987株;リステリア・イノキュア(Listeria innocua);ラクトバチルス・カゼイ(Lactobacillus casei);ラクトバチルス・ラムノーサス(Lactobacillus rhamnosus)GG株;ラクトバチルス・サリバリウス(Lactobacillus salivarius)UCC118株;ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)A909株;ストレプトコッカス・アガラクティアエ(Streptococcus agalactiae)NEM316株;ストレプトコッカス・アガラクティアエ 2603株;ストレプトコッカス・ディスガテクティアエ亜種エクイシミリス(Streptococcus dysgalactiae equisimilis)GGS124株;ストレプトコッカス・エクイ亜種ズーエピデミカス(Streptococcus equi zooepidemicus)MGCS10565株;ストレプトコッカス・カプリナス(Streptococcus gallolyticus)UCN34 uid46061;ストレプトコッカス・ゴルドニイ(Streptococcus gordonii)Challis subst CH1株;ストレプトコッカス・ミュータンス(Streptococcus mutans)NN2025 uid46353株;ストレプトコッカス・ミュータンス;ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)M1 GAS株;ストレプトコッカス・ピオゲネス MGAS5005株;ストレプトコッカス・ピオゲネス MGAS2096株;ストレプトコッカス・ピオゲネス MGAS9429株;ストレプトコッカス・ピオゲネス MGAS10270株;ストレプトコッカス・ピオゲネス MGAS6180株;ストレプトコッカス・ピオゲネス MGAS315株;ストレプトコッカス・ピオゲネス SSI-1株;ストレプトコッカス・ピオゲネス MGAS10750株;ストレプトコッカス・ピオゲネス NZ131株;ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)CNRZ1066株;ストレプトコッカス・サーモフィラス LMD-9株;ストレプトコッカス・サーモフィラス LMG18311株;クロストリジウム・ボツリヌム(Clostridium botulinum)A3 Loch Maree株;クロストリジウム・ボツリヌム B Eklund 17B株;クロストリジウム・ボツリヌム Ba4 657株;クロストリジウム・ボツリヌム F Langeland株;クロストリジウム・セルロリティカム(Clostridium cellulolyticum)H10株;フィネゴルディア・マグナ(Finegoldia magna)ATCC29328株;ユウバクテリウム・レクターレ(Eubacterium rectale)ATCC33656株;マイコプラズマ・ガリセプティカム(Mycoplasma gallisepticum);マイコプラズマ・モービレ(Mycoplasma mobile)163K株;マイコプラズマ・ペネトランス(Mycoplasma penetrans);マイコプラズマ・シノビアエ(Mycoplasma synoviae)53株;ストレプトバチルス・モニリフォルミス(Streptobacillus moniliformis)DSM12112株;ブラジリゾビウム(Bradyrhizobium)BTAil株;ニトロバクター・ハンブルゲンシス(Nitrobacter hamburgensis)X14株;ロドシュードモナス・パルストリス(Rhodopseudomonas palustris)BisB18株;ロドシュードモナス・パルストリス BisB5株;パルビバクラム・ラバメンティボランス(Parvibaculum lavamentivorans)DS-1株;ディノロセオバクター・シバエ(Dinoroseobacter shibae)DFL12株;グルコンアセトバクター・ジアゾトロフィクス(Gluconacetobacter diazotrophicus)Pal5 FAPERJ株;グルコンアセトバクター・ジアゾトロフィクス Pal5 JGI株;アゾスピリルム(Azospirillum)510 uid46085株;ロドスピリラム・ルブラム(Rhodospirillum rubrum)ATCC11170株;ディアフォロバクター(Diaphorobacter)TPSY uid29975株;フェルミネフォロバクター・エイセニアエ(Verminephrobacter eiseniae)EF01-2株;ナイセリア・メニンジティディス(Neisseria meningitidis)053442株;ナイセリア・メニンジティディス alpha 14株;ナイセリア・メニンジティディス Z2491株;デスルホビブリオ・サレキシゲンス(Desulfovibrio salexigens)DSM2638株;キャンピロバククー・ジェジュニ亜種ドイレイ(Campylobacter jejunidoylei)269 97株;キャンピロバククー・ジェジュニ(Campylobacter jejuni)81116株;キャンピロバククー・ジェジュニ;キャンピロバクター・ラリ(Campylobacter lari)RM2100株;ヘリコバクター・ヘパティカス(Helicobacter hepaticus);ウォリネラ・サクシノゲネス(Wolinella succinogenes);トルモナス・アウエンシス(Tolumonas auensis)DSM9187株;シュードアルテロモナス・アトランティカ(Pseudoalteromonas atlantica)T6c株;シューワネラ・ペアレアナ(Shewanella pealeana)ATCC700345株;レジオネラ・ニューモフィラ(Legionella pneumophila)Paris株;アクチノバチルス・サクシノゲネス(Actinobacillus succinogenes)130Z株;パスツレラ・ムルトシダ(Pasteurella multocida);フランシセラ・ツラレンシス亜種ノビシダ(Francisella tularensis novicida)U112株;フランシセラ・ツラレンシス亜種ハラークティカ(Francisella tularensis holarctica);フランシセラ・ツラレンシス(Francisella tularensis)FSC198株;フランシセラ・ツラレンシス(Francisella tularensis tularensis);フランシセラ・ツラレンシス WY96-3418株;およびトレポネーマ・デンティコラ(Treponema denticola)ATCC35405株。したがって、本開示の態様は、本明細書に記載されるようにヌクレアーゼ欠損にされたまたはニッカーゼにされた、II型CRISPRシステム中に存在するCas9タンパク質に関する。
【0064】
Cas9タンパク質は、文献中で当業者にCsn1と呼ばれることもある。本明細書に記載される実験の対象であるストレプトコッカス・ピオゲネス(S. pyogenes)のCas9タンパク質の配列を以下に示す。その全体が参照により援用されるDeltcheva et al., Nature 471, 602-607 (2011)を参照されたい。
【0065】
【0066】
本明細書に記載されるRNA誘導性ゲノム制御方法のある態様によれば、Cas9は、ヌクレアーゼ活性を低下させるよう、実質的に低下させるよう、または除去するように改変される。そのようなCas9は、例えば2種類以上のCas9タンパク質が想定される場合は、直交性Cas9であってもよい。この文脈では、2種類以上もしくは複数種類、または一組の直交性Cas9タンパク質が、本明細書に記載の方法で使用されてもよい。ある態様によれば、RuvCヌクレアーゼドメインまたはHNHヌクレアーゼドメインを改変することによって、Cas9ヌクレアーゼ活性を低下させる、実質的に低下させる、または除去する。ある態様によれば、RuvCヌクレアーゼドメインが不活性化される。ある態様によれば、HNHヌクレアーゼドメインが不活性化される。ある態様によれば、RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインが不活性化される。別の態様によれば、RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインが不活性化されたCas9タンパク質が提供される。別の態様によれば、RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインが不活性化されている限りにおいて、ヌクレアーゼ欠損Cas9タンパク質が提供される。別の態様によれば、RuvCヌクレアーゼドメインまたはHNHヌクレアーゼドメインのいずれかが不活性化されることにより、残りのヌクレアーゼドメインのヌクレアーゼ活性が活性型のままである、Cas9ニッカーゼが提供される。これにより、二本鎖DNAの一方のストランドだけが切断されるか、またはニック形成される。
【0067】
別の態様によれば、ヌクレアーゼ欠損Cas9タンパク質をもたらす、Cas9中の1つまたは複数のアミノ酸が改変または除去された、ヌクレアーゼ欠損Cas9タンパク質が提供される。ある態様によれば、それらのアミノ酸にはD10およびH840が含まれる。Jinke et al., Science 337, 816-821 (2012)を参照されたい。別の態様によれば、それらのアミノ酸にはD839およびN863が含まれる。ある態様によれば、D10、H840、D839、およびH863のうちの1つ以上または全てが、ヌクレアーゼ活性を低下させるか、実質的に除去するか、または除去するアミノ酸で置換される。ある態様によれば、D10、H840、D839、およびH863のうちの1つもしくは複数、または全てがアラニンで置換される。ある態様によれば、D10、H840、D839、およびH863のうちの1つ以上または全てが、アラニンなど、ヌクレアーゼ活性を低下させるか、実質的に除去するか、または除去するアミノ酸で置換されたCas9タンパク質は、ヌクレアーゼ欠損Cas9またはCas9Nと呼ばれ、ヌクレアーゼ活性が低下している、または除去されているか、ヌクレアーゼ活性が検出レベル内にないか、または実質的にない。この態様によれば、Cas9Nのヌクレアーゼ活性は、公知のアッセイを用いて検出出来ないことがある、すなわち公知のアッセイの検出レベル未満であり得る。
【0068】
ある態様によれば、ヌクレアーゼ欠損Cas9タンパク質には、DNAに結合し且つRNAによってガイドされ、タンパク質の能力を保持している、そのホモログまたはオルソログが含まれる。ある態様によれば、ヌクレアーゼ欠損Cas9タンパク質としては、ストレプトコッカス・ピオゲネス(S. pyogenes)由来の天然Csa9について記載されるような、D10、H840、D839、およびH863のうちの1つもしくは複数、または全てがアラニンで置換された配列、およびその配列に対して少なくとも30%、40%、50%、60%、70%、80%、90%、95%、98%、または99%の相同性を有し、且つRNA誘導型DNA結合タンパク質などのDNA結合タンパク質である、タンパク質配列が挙げられる。
【0069】
ある態様によれば、ヌクレアーゼ欠損Cas9タンパク質は、RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインのタンパク質配列を除いたストレプトコッカス・ピオゲネス(S. pyogenes)由来の天然Cas9について記載されるような配列、およびさらにその配列に対して少なくとも30%、40%、50%、60%、70%、80%、90%、95%、98%、または99%の相同性を有し、且つRNA誘導型DNA結合タンパク質などのDNA結合タンパク質である、タンパク質配列を含む。これにより、本開示の態様は、例えばガイドRNAとの共局在およびDNAへの結合など、DNA結合に関与するタンパク質配列およびその配列に相同なタンパク質配列を含む。本開示の態様は、ヌクレアーゼ欠損Cas9タンパク質を作製するためには、RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインは不活性化されるか、または天然Cas9タンパク質のタンパク質配列から除去されるかのいずれかであり得るので、(DNA結合に必要とされない限り)これらのドメインを含む必要がない。
【0070】
本開示の目的のために、Cas9に対する相同性を有する公知のタンパク質構造中の金属配位残基を
図4Aに示す。Cas9配列中の位置に基づいて残基が表示されている。左:PDB ID:4EP4のRuvC構造(青)。Cas9配列中のD10に対応する位置D7は、Mgイオン配位位置で強調されている。中央:PDB ID:3M7K(オレンジ)およびPDB ID:4H9D(シアン)のHNHエンドヌクレアーゼドメインの構造であり、配位Mgイオン(灰色の球)および3M7KのDNA(紫)を含む。3M7K中の残基D92およびN113、ならびに4H9Dの位置D53およびN77は、Cas9アミノ酸D839およびN863に対する配列相同性を有し、棒で示されている。右:ヌクレアーゼ活性について、作製されて分析された変異体のリストである。野生型Cas9、D10をアラニンで置換したCas9
m1、D10をアラニンで置換し、H840をアラニンで置換したCas9
m2、D10をアラニンで、H840をアラニンで、およびD839をアラニンで置換したCas9
m3、ならびにD10をアラニンで、H840をアラニンで、D839をアラニンで、およびN863をアラニンで置換したCas9
m4。
【0071】
図4Bに示されるように、Cas9変異体:m3およびm4、ならびにそれらのそれぞれとVP64との融合体は、標的座位についてのディープシークエンシングにより、検出不能なヌクレアーゼ活性が示された。gRNA標的を決定する赤色の線と共に、ゲノム上の位置に対する変異頻度をプロットで示す。
図4Cは、
図4Bのデータのより高分解能の試験を示す図であり、変異ランドスケープが非改変座位と同等のプロファイルを示すことが確認される。
【0072】
ある態様によれば、ヌクレアーゼ欠損Cas9またはガイドRNAのいずれかに転写活性化ドメインを連結(tether)することによってヒト細胞におけるRNA誘導性ゲノム制御を可能にする、改変されたCas9-gRNAシステムが提供される。本開示のある態様によれば、1種類または複数種類の転写制御タンパク質またはドメイン(このような用語は互換的に使用される)が、ヌクレアーゼ欠損型Cas9または1種類または複数種類のガイドRNA(gRNA)と結合またはその他の態様で(otherwise)接続される。これらの転写制御ドメインは標的座位に対応する。したがって、本開示の態様は、転写制御ドメインをCas9NまたはgRNAのいずれかに、融合、接続、または結合することによりそのようなドメインを標的座位に局在化させるための方法および材料を含む。
【0073】
ある態様によれば、転写を活性化可能なCas9N融合タンパク質が提供される。ある態様によれば、VP64活性化ドメイン(その全体が参照により援用されるZhang et al., Nature Biotechnology 29, 149-153 (2011)を参照のこと)が、Cas9NのC末端に結合、融合、接続、またはその他の態様で(otherwise)連結される(tethered)。ある方法によれば、Cas9Nタンパク質によって、標的ゲノムDNA部位に転写制御ドメインが提供される。ある方法によれば、転写制御ドメインに融合したCas9Nが、1種類または複数種類のガイドRNAと共に細胞内に提供される。転写制御ドメインが融合したCas9Nは、標的ゲノムDNAまたはその近くに結合する。1種類または複数種類のガイドRNAは、標的ゲノムDNAまたはその近くに結合する。転写制御ドメインは、標的遺伝子の発現を制御する。特定の態様によれば、Cas9N-VP64融合体は、プロモーター近辺の配列を標的とするgRNAと組み合わされた場合に、レポーターコンストラクトの転写を活性化して、RNA誘導性転写を活性化した。
【0074】
ある態様によれば、転写活性化可能なgRNA融合タンパク質が提供される。ある態様によれば、VP64活性化ドメインが、gRNAに結合、融合、接続、またはその他の態様で(otherwise)連結される(tethered)。ある方法によれば、gRNAによって、標的ゲノムDNAの部位に転写制御ドメインが提供される。ある方法によれば、転写制御ドメインに融合したgRNAが、Cas9Nタンパク質と共に細胞内に提供される。Cas9Nは、標的ゲノムDNAまたはその近くに結合する。転写制御タンパク質またはドメインが融合した1種類または複数種類のガイドRNAが、標的ゲノムDNAまたはその近くに結合する。転写制御ドメインは、標的遺伝子の発現を制御する。特定の態様によれば、転写制御ドメインが融合したgRNAおよびCas9Nタンパク質がレポーターコンストラクトの転写を活性化して、RNA誘導型転写を活性化した。
【0075】
転写を制御可能なgRNA連結(tether)は、ランダム配列をgRNAに挿入し、Cas9機能についてアッセイすることにより、そのgRNAのどの領域が修飾を許容するかを特定することによって構築された。キメラgRNAのcrRNA部分の5′末端またはtracrRNA部分の3′末端のいずれかにランダム配列挿入を有するgRNAは機能を保持しており、一方、キメラgRNAのtracrRNAスキャフォールド部分への挿入は機能を喪失させる。ランダム塩基挿入に対するgRNAの柔軟性について要約した
図5A~5Bを参照されたい。
図5Aは、Cas9-gRNA活性を決定するための相同組換え(HR)アッセイの模式図である。
図5Bに示されるように、キメラgRNAのcrRNA部分の5′末端またはtracrRNA部分の3′末端のいずれかにランダム配列挿入を有するgRNAは機能性を保持しており、一方、キメラgRNAのtracrRNAスキャフォールド部分への挿入は機能を喪失させる。gRNA配列中の挿入の位置を赤いヌクレオチドで示す。科学的理論に拘束されることなく、5′末端でのランダム塩基挿入による活性の上昇は、gRNAが長くなって半減期が延びたことによるものと考えられる。
【0076】
VP64をgRNAに結合させるために、2コピーのMS2バクテリオファージコートタンパク質結合性RNAステムループをgRNAの3′末端に付加した。その全体が参照により援用されるFusco et al., Current Biology: CB13, 161-167 (2003)を参照されたい。これらのキメラgRNAを、Cas9NおよびMS2-VP64融合タンパク質と共発現させた。3成分全ての存在下で、レポーターコンストラクトの配列特異的転写活性化が観察された。
【0077】
図1Aは、RNA誘導性転写活性化の模式図である。
図1Aに示されるように、転写を活性化可能なCas9N融合タンパク質を作製するために、VP64活性化ドメインをCas9NのC末端に直接的に連結した(tethered)。
図1Bに示されるように、転写を活性化可能なgRNAテザーを作製するために、2コピーのMS2バクテリオファージコートタンパク質結合性RNAステムループをgRNAの3′末端に付加した。これらのキメラgRNAを、Cas9NおよびMS2-VP64融合タンパク質と共発現させた。
図1Cは、転写活性化のアッセイに用いるレポーターコンストラクトのデザインを示す。これら2種類のレポーターは、別個のgRNA標的部位を有し、且つ、対照TALE-TF標的部位を共有している。
図1Dに示されるように、蛍光標識細胞分取(FACS)および免疫蛍光アッセイ(IF)の両アッセイにより、Cas9N-VP64融合体はRNA誘導性転写活性化を示す。具体的には、対照TALE-TFは両方のレポーターを活性化したが、Cas9N-VP64融合体はgRNA配列特異的にレポーターを活性化する。
図1Eに示されるように、3つの成分全て、すなわち、Cas9N、MS2-VP64、および適切なMS2アプタマー結合部位を有するgRNAが存在する場合のみ、レポーターコンストラクトのgRNA配列特異的転写活性化がFACSおよびIFの両方によって観察された。
【0078】
ある態様によれば、Cas9N、種類または複数種類のgRNA、および転写制御タンパク質またはドメインを用いて内在性遺伝子を制御する方法が提供される。ある態様によれば、内在性遺伝子は、任意の所望の遺伝子であってもよく、この遺伝子は本明細書では標的遺伝子と呼ばれる。ある例示的な態様によれば、制御の標的となる遺伝子には、いずれも多能性の維持に関与し、厳密に制御されている遺伝子であるZFP42(REX1)およびPOU5F1(OCT4)が含まれた。
図1Fに示されるように、転写開始部位の上流の約5kb長のDNA鎖(DNase高感受性部位が緑色で強調されている)を標的とする10種類のgRNAをREX1遺伝子用にデザインした。プロモーター・ルシフェラーゼレポーターコンストラクトを用いて(その全体が参照により援用されるTakahashi et al., Cell 131 861-872 (2007)を参照のこと)、または内在性遺伝子のqPCRにより直接的に、転写活性化をアッセイした。
【0079】
図6A~
図6Dは、Cas9N-VP64を用いたRNA誘導性OCT4制御に関する。
図6Aに示されるように、転写開始部位の上流の約5kb長のDNA鎖を標的とする21種類のgRNAをOCT4遺伝子用にデザインした。DNase高感受性部位が緑色で強調されている。
図6Bは、プロモーター・ルシフェラーゼレポーターコンストラクトを用いた転写活性化を示している。
図6Cは、内在性遺伝子のqPCRにより直接的に転写活性化を示している。個々のgRNAの導入によって転写が中程度に促進されたが、複数のgRNAが相乗的に作用して堅固な数倍の転写活性化が促進された。
【0080】
図7A~
図7Cは、Cas9N、MS2-VP64、およびgRNA+2X-MS2アプタマーを用いたRNA誘導性REX1制御に関する。
図7Aに示されるように、転写開始部位の上流の約5kb長のDNA鎖を標的する10種類のgRNAをREX1遺伝子用にデザインした。DNase高感受性部位が緑色で強調されている。
図7Bは、プロモーター・ルシフェラーゼレポーターコンストラクトを用いた転写活性化を示している。
図7Cは、内在性遺伝子のqPCRにより直接的に転写活性化を示している。個々のgRNAの導入により転写が中程度に促進されたが、複数のgRNAが相乗的に作用して堅固な数倍の転写活性化が促進された。ある態様によれば、gRNA上に2X-MS2アプタマーが存在しないと、転写は活性化されない。それぞれその全体が参照により援用されるMaeder et al., Nature Methods 10, 243-245 (2013)およびPerez-Pinera et al., Nature Methods 10, 239-242 (2013)を参照されたい。
【0081】
したがって、方法は、標的遺伝子の発現を制御するための、複数種類のガイドRNAと共に、Cas9Nタンパク質、および転写制御タンパク質またはドメインを使用することに関する。
【0082】
Cas9連結(tethering)アプローチおよびgRNA連結(tethering)アプローチはいずれも効果的であり、前者が約1.5~2倍高い有効性を示した。この差はおそらく、3成分複合体の集合体とは対照的に、2成分複合体の集合体の必要条件に起因するようである。しかし、gRNA連結(tethering)アプローチは、各gRNAが異なるRNA-タンパク質相互作用対を利用する限り、別個のgRNAにより様々なエフェクタードメインを動員することを原理的に可能にする。その全体が参照により援用されるKaryer-Bibens et al., Biology of the Cell / Under the Auspices of the European Cell Biology Organization 100, 125-138 (2008)を参照されたい。本開示のある態様によれば、特異的なガイドRNAと包括的Cas9Nタンパク質、すなわち異なる標的遺伝子に対して同一または類似のCas9Nタンパク質、とを用いて異なる標的遺伝子を制御することができる。ある態様によれば、同一または類似のCas9Nを用いた多重遺伝子制御方法が提供される。
【0083】
本開示の方法はさらに、ヒト細胞の多重的な遺伝子的改変およびエピジェネティックな改変を提供するための、本明細書に記載のCas9Nのタンパク質およびガイドRNAを用いた標的遺伝子の編集に関する。Cas9-gRNAによる標的化の問題に対処するため(その全体が参照により援用されるJiang et al., Nature Biotechnology 31, 233-239 (2013)を参照のこと)、非常に多様な標的配列のバリエーションに対するCas9のアフィニティーを徹底的に調査する方法を提供する。したがって、本開示の態様は、天然のヌクレアーゼ活性型Cas9を用いた特異性試験によってもたらされるdsDNA切断毒性および突然変異原性修復による複雑な要因を回避しつつ、ヒト細胞におけるCas9標的化の直接的ハイスループット読取りを提供する。
【0084】
本開示の別の態様は、標的遺伝子の転写制御のための、DNA結合タンパク質またはDNA結合システム一般の使用に関する。当業者は、本開示に基づき、例示的なDNA結合システムを容易に特定するであろう。そのようなDNA結合システムは、天然Cas9タンパク質と同様のヌクレアーゼ活性を有する必要がない。したがって、そのようなDNA結合システムは、ヌクレアーゼ活性が不活性化されている必要がない。例示的なDNA結合システムの1つはTALEである。ある態様によれば、
図2Aに示される方法を用いてTALEの特異性を評価した。ライブラリーの各要素がdTomato蛍光タンパク質を発現するミニマルプロモーターを含むコンストラクトライブラリーを設計する。転写開始部位mの下流に24bpの(A/C/G)ランダム転写物タグ(random transcript tag)を挿入し、一方で2つのTF結合部位をプロモーターの上流に配置する。2つのTF結合部位の一方は全てのライブラリー要素に共有される一定のDNA配列であり、もう一方は「バイアスがかかった」結合部位ライブラリーを有する可変的特徴部であり、これららの結合部位はプログラム可能なDNA標的化複合体が結合するように設計された標的配列から離れて多くの変異の組合せを提示する配列の大きなコレクションに及ぶように改変されている。これは、標的配列ヌクレオチドが79%の頻度で現れ、別の各ヌクレオチドが7%の頻度で現れるようなヌクレオチド頻度を各位置で有するように改変された縮重オリゴヌクレオチドを用いて達成される。その全体が参照により援用されるPatwardhan et al., Nature Biotechnology 30, 265-270 (2012)を参照されたい。次に、レポーターライブラリーを配列決定して、24bpのdTomato転写物タグとライブラリー要素中のそれらの対応する「バイアスがかかった」標的部位との関連を明らかにする。転写物タグの大きな多様性により、異なる標的間でのタグの共有が非常に少ないことを確実にし、標的配列のバイアスがかかった構成は、ほとんど変異を有しない部位がより多くの変異を有する部位よりも多くのタグと関連することを意味する。次に、共有DNA部位に結合するように改変された対照TFまたは標的部位に結合するように改変された標的TFのいずれかによって、dTomatoレポーター遺伝子の転写が促進される。促進された細胞についてRNA配列決定を行うことにより、発現された各転写物タグの存在量を各試料において測定し、次に、予め作成した関連表を用いてそれらの対応する結合部位に転写物タグをマッピングする。対照TFは、その結合部位が全ライブラリー要素で共有されているので、全てのライブラリーの構成要素を等しく刺激すると予想され、一方、標的TFは、それが選択的に標的とする構成要素に対して、発現構成要素の分布を歪めると予想される。この仮定をステップ5で用いて、標的TFについて得られたタグ数を対照TFについて得られたタグ数で除算することにより、各結合部位について標準化された発現レベルを計算する。
【0085】
図2Bに示されるように、Cas9-gRNA複合体の標的化ランドスケープが、この複合体が平均してその標的配列中の1~3個の変異に対して許容性があることは明らかになる。
図2Cに示されるように、Cas9-gRNA複合体はさらに、PAM配列に局在する点変異を除いて、点変異にほとんど感受性がない。特に、このデータにより、NGGだけでなくNAGもストレプトコッカス・ピオゲネス(S. pyogenes)のCas9の予想PAMであることが明らかになる。
図2Dに示されるように、これらのミスマッチがgRNA標的配列の3′末端に近い8~10塩基に局在する場合にのみ、2塩基のミスマッチの導入によってCas9-gRNA複合体の活性は顕著に損なわれる(ヒートプロットでは、標的配列の位置は5′末端から1~23と表示されている)。
【0086】
本明細書に記載の転写特異性アッセイを用いて、別の広範に用いられているゲノム編集ツールであるTALEドメインの変異許容性を決定した。
図2Eに示されるように、18塩基長のTALEについてのTALEオフターゲットデータにより、このTALEが平均してその標的配列中の1~2個の変異を許容可能であり、その標的中の3塩基ミスマッチ変異体の大部分を活性化できないことが明らかになる。
図2Fに示されるように、18塩基長のTALEは、Cas9-gRNA複合体と同様に、その標的中の1塩基ミスマッチにほとんど感受性がない。
図2Gに示されるように、2塩基ミスマッチの導入により18塩基長のTALEの活性は顕著に損なわれる。TALE活性は、その標的配列の5′末端に近くなるほどミスマッチに対して感受性が高くなる(ヒートプロットでは、標的配列の位置は5′末端から1~18と表示されている)。
【0087】
種々のサイズのTALEによる標的化のランドスケープの評価に関する
図10A~
図10Dの対象である、ヌクレアーゼアッセイにおける標的実験を用いて結果を確認した。
図10Aに示されるように、18塩基長のTALEがそれらの標的配列中の複数の変異を許容することが、ヌクレアーゼ介在性HRアッセイを用いて確認された。
図10Bに示されるように、
図2Aに記載のアプローチを用いて、3つの異なるサイズ(18塩基長、14塩基長、および10塩基長)のTALEの標的化ランドスケープを分析した。TALEが短くなるほど(14塩基長および10塩基長)、標的化が次第に特異的となり、活性もほぼ一桁低下する。
図10Cおよび
図10Dに示されるように、10塩基長のTALEは、ほぼ1塩基ミスマッチの感度を示しつつ、2つのミスマッチを有する標的に対してほぼ全ての活性を失っている(ヒートプロットでは、標的配列の位置は5′末端から1~10と表示されている)。総合すると、これらのデータは、ゲノム改変用途において、より短いTALEの改変ほど、より高い特異性を得ることができ、一方、TALEヌクレアーゼの用途におけるFokI二量体化の必要性は、オフターゲット作用を避けるために必須であることを意味している。各々その全体が参照により援用されるKim et al., Proceedings of the National Academy of Sciences of the United States of America 93, 1156-1160 (1996)、およびPattanayak et al., Nature Methods 8, 765-770 (2011)を参照されたい。
【0088】
図8A~
図8Cは、実験データから例証される標準化された発現レベルの算出のための多段階特異性分析処理フローに関する。
図8Aに示されるように、レポーター遺伝子転写産物に組み込まれるランダム配列24bpタグおよび分布にバイアスがかかった結合部位配列を用いてコンストラクトライブラリーを作製した(上段)。転写されたタグは高度に縮重しているので、それらはCas9またはTALE結合配列に多対1(many-to-one)でマッピングされるはずである。コンストラクトライブラリーを配列決定して(3段目、左)、どのタグがどの結合部位と同時に現れるかを確認して、結合部位と転写されたタグの関連表を作製する(4段目、左)。ライブラリーバーコード(ここでは、水色および薄い黄色で示されている)を用いて、異なる結合部位に対して構築された複数のコンストラクトライブラリーを一度に配列決定してもよい(1~4段目、左)。次に、コンストラクトライブラリーを細胞集団に遺伝子導入し、様々な一組のCas9/gRNAまたはTALE転写因子をそれらの集団の試料中で誘導する(2段目、右)。1つの試料は、コンストラクト内の一定の結合部位配列を標的とする一定のTALE活性化因子によって常に誘導され(最上段、緑色のボックス)、この試料は陽性対照として機能する(緑色試料、+記号によっても示される)。次に、誘導した試料中のレポーターmRNA分子から生じたcDNAを配列決定および分析して、試料中の各タグのタグ数を得る(3段目および4段目、右)。コンストラクトライブラリーの配列決定と同様に、試料バーコードを付加することにより陽性対照を含む複数の試料を同時に配列決定および分析する。ここで、薄い赤色は、陽性対照(緑色)と共に配列決定および分析された1つの非対照試料を示す。各リードには転写されたタグだけが現れ、コンストラクトの結合部位は現れないので、次に、コンストラクトライブラリーの配列決定から得られた結合部位とタグの関連表を用いて、各試料中の各結合部位から発現するタグの総数を計算する(5段目)。次に、各非陽性対照試料についての総計を陽性対照試料において得られた総計で除算すことにより、各非陽性対照試料についての総計を各結合部位についての標準化された発現レベルに変換する。ミスマッチの数ごとに標準化された発現レベルのプロットの例を、2Bおよび
図2Eならびに
図9Aおよび
図10Bに示す。誤ったタグ、コンストラクトライブラリーに関連付けできないタグ、および明らかに複数の結合部位によって共有されるタグに対するフィルタリングのいくつかの段階は、この全体的処理フローに含まれていない。
図8Bは、バイアスがかかったコンストラクトライブラリー内で生じたミスマッチの数に対する、結合部位の割合の分布例を示している。左:理論的分布。右:実際のTALEコンストラクトライブラリーで観察された分布。
図8Cは、ミスマッチの数に対する、結合部位に対する集計タグ数の割合の分布例を示している。左:陽性対照試料で観察された分布。右:非対照TALEが誘導された試料で観察された分布。陽性対照TALEはコンストラクト中の一定の部位に結合するので、集計したタグ数の分布は
図8Bにおける結合部位の分布を厳密に反映しており、一方、ミスマッチが少ない部位ほど高い発現レベルを誘導するので、非対照TALE試料では、その分布が左に歪んでいる。下:標的TFについて得られたタグ数を対照TFについて得られたタグ数で除算してこれらの間の相対的濃縮度を計算することによって、標的部位中の変異数に対する平均発現レベルが明らかになる。
【0089】
これらの結果は、異なるCas9-gRNA複合体を用いて作成した特異性データによってさらに再確認された。
図9Aに示されるように、異なるCas9-gRNA複合体は、その標的配列中の1~3個の変異に対して許容性がある。
図9Bに示されるように、Cas9-gRNA複合体はさらに、PAM配列に局在する点変異を除いて、点変異にほとんど感受性がない。しかし、
図9Cに示されるように、2塩基のミスマッチの導入により活性が顕著に損なわれる(ヒートプロットでは、標的配列の位置は、5′末端から1~23と表示されている)。
図9Dに示されるように、ヌクレアーゼ介在性HRアッセイを用いて、ストレプトコッカス・ピオゲネス(S. pyogenes)のCas9の予想PAMがNGGであり、またNAGであることが確認された。
【0090】
ある態様では、本明細書に記載の方法に従って結合特異性が増加する。複数の複合体間の相乗作用がCas9N-VP64による標的遺伝子活性化の要因であり、個々のオフターゲット結合事象は最小限の影響しか与えないはずなので、Cas9Nの転写制御用途は必然的に特異性が高い。ある態様によれば、ゲノム編集方法においてオフセットニックが用いられる。大部分のニックは、NHEJ事象を引き起こすことはほとんどないので(その全体が参照により援用されるCerto et al., Nature Methods 8, 671-676 (2011)を参照のこと)、オフターゲットなニック形成の影響が最小限に抑えられる。対照的に、オフセットニックを誘導して二本鎖切断(DSB)を生じさせることは、遺伝子破壊の誘導に非常に効果的である。ある態様によれば、3′オーバーハングとは対照的に、5′オーバーハングは、より有意にNHEJ事象を引き起こす。同様に、3′オーバーハングでは、NHEJ事象よりもHR事象が多いが、HR事象の総数は5′オーバーハングが生じた場合より有意に少ない。したがって、相同組換えのためのニック、およびCas9-gRNAのオフターゲット活性の影響を最小限に抑えるために二本鎖切断を生成するためのオフセットニックを用いる方法が提供される。
【0091】
図3A~
図3Cは、多重オフセットニック形成、およびガイドRNAとのオフターゲット結合を減少させるための方法に関する。
図3Aに示されるように、traffic lightレポーターを用いて、標的化ニックまたは標的化切断の導入時のHR事象およびNHEJ事象を同時にアッセイした。HDR経路により解消されたDNA切断事象はGFP配列を回復するが、変異原性NHEJは、GFPを読み枠から外し、且つ下流のmCherry配列を読み枠に入れる、フレームシフトを引き起こす。アッセイのために、200bp長のDNA鎖を範囲とする14種類のgRNA、すなわち、センス鎖を標的とする7種類(U1~7)、アンチセンス鎖を標的とする7種類(D1~7)をデザインした。相補鎖にニックを形成するCas9D10A変異体を用い、異なる2通りのgRNAの組合せを用いて、一連のプログラムされた5′オーバーハングまたは3′オーバーハングを誘導した(14種類のgRNAのニック形成部位を示す)。
図3Bに示されるように、オフセットニックを誘導して二本鎖切断(DSB)を生成させることは、遺伝子破壊の誘導にとって非常に効果的である。特に、3′オーバーハングとは対照的に、5′オーバーハングを生じさせるオフセットニックは、より多くのNHEJ事象を引き起こす。
図3Cに示されるように、3′オーバーハングの生成は、NHEJ事象よりもHR事象の割合が高いが、HR事象の総数は5′オーバーハングを生成した場合よりも著しく少ない。
【0092】
図11A~
図11Bは、Cas9D10Aニッカーゼ介在性NHEJに関する。
図11Aに示されるように、traffic lightレポーターを用いて、標的化ニックまたは二本鎖切断の導入時のNHEJ事象をアッセイした。簡潔に述べると、DNA切断事象の導入時に切断により変異原性NHEJが誘発されると、GFPが読み枠から外れて翻訳され、且つ下流のmCherry配列が読み枠に入って赤色蛍光が生じる。200bp長のDNA鎖を範囲とする14種類のgRNA、すなわちセンス鎖を標的とする7種類(U1~7)、アンチセンス鎖を標的とする7種類(D1~7)をデザインした。
図11Bに示されるように、全ての標的についてDSBと堅固なNHEJを生じさせる野生型Cas9と異なり、(Cas9D10A変異体を用いると)大半のニックはNHEJ事象をほとんど引き起こさないことが観察された。14箇所の部位は全て、連続的な200bp長のDNA鎖の範囲内に位置し、10倍を超える標的化効率の差が観察された。
【0093】
ある態様によれば、1種類以上、2種類以上、または複数種類の外来核酸を細胞に導入することを含む、細胞において標的核酸の発現を調節する方法が本明細書に記載される。細胞に導入される外来核酸は、1種類または複数種類のガイドRNA、1種類または複数種類のヌクレアーゼ欠損Cas9タンパク質、および転写制御タンパク質またはドメインをコードする。また、ガイドRNA、ヌクレアーゼ欠損Cas9タンパク質、および転写制御タンパク質またはドメインは、これらのガイドRNA、ヌクレアーゼ欠損Cas9タンパク質、および転写制御タンパク質またはドメインがDNAに結合して標的核酸の発現を制御する限り、当業者によって理解されるように、共局在複合体と呼ばれる。別の態様によれば、細胞に導入される外来核酸は、1種類または複数種類のガイドRNAおよびCas9タンパク質ニッカーゼをコードする。また、ガイドRNAおよびCas9タンパク質ニッカーゼは、これらのガイドRNAおよびCas9タンパク質ニッカーゼがDNAに結合して標的核酸にニックを形成する限り、当業者によって理解されるように、共局在複合体と呼ばれる。
【0094】
本開示に係る細胞には、本明細書に記載されるように外来核酸を導入でき、発現させることができるあらゆる細胞が含まれる。本明細書に記載される本開示の基本的概念は細胞の種類によって限定されないと理解されるべきである。本開示に係る細胞には、真核細胞、原核細胞、動物細胞、植物細胞、真菌細胞、古細菌細胞、真正細菌細胞などが含まれる。細胞には、酵母細胞、植物細胞、および動物細胞などの真核細胞が含まれる。具体的な細胞としては、哺乳動物細胞が挙げられる。さらに、細胞には、標的核酸を制御するために有益であるか、または望ましい、任意の細胞が含まれる。そのような細胞には、疾患または有害な健康状態を引き起こす特定のタンパク質の発現が欠乏したものも含まれ得る。そのような疾患または有害な健康状態は当業者には容易に分かる。本開示によれば、本明細書に記載の方法および転写活性化因子によって特定のタンパク質の発現に関与する核酸が標的化され、その結果、標的核酸および対応する特定のタンパク質の発現が上方制御されてもよい。このようにして、本明細書に記載の方法により治療的処置が提供される。
【0095】
標的核酸としては、本明細書に記載される共局在複合体が制御またはニック形成のいずれかに有用であり得る任意の核酸配列が挙げられる。標的核酸としては遺伝子が挙げられる。本開示の目的のために、二本鎖DNAなどのDNAは標的核酸を含んでいてもよく、共局在複合体は、その共局在複合体が標的核酸に対する所望の影響を与えられ得るよう、その標的核酸において、またはその標的核酸に隣接して、またはその標的核酸の近傍で、DNAに結合、またはDNAとその他の態様で(otherwise)共局在することができる。そのような標的核酸は、内在性の(または天然の)核酸および外来性の(または外来の)核酸を含んでいてもよい。当業者は、本開示に基づき、標的核酸を含むDNAに共局在するガイドRNAおよびCas9タンパク質を容易に特定またはデザインすることができる。当業者はさらに、標的核酸を含むDNAに同様に共局在する転写制御タンパク質またはドメインを特定することができる。DNAには、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAが含まれる。
【0096】
外来核酸(すなわち、細胞の天然核酸組成物の一部でない核酸)は、当業者に公知の任意の導入方法を用いて細胞に導入されてもよい。そのような方法には、遺伝子導入法、形質導入法、ウイルス形質導入法、マイクロインジェクション法、リポフェクション法、ヌクレオフェクション法、ナノ粒子銃(nanoparticle bombardment)法、形質転換法、結合(conjugation)法などが含まれる。当業者は、容易に特定可能な文献資料を用いてそのような方法を容易に理解し、適用するであろう。
【0097】
転写活性化因子である転写制御タンパク質またはドメインには、VP16、VP64、および本開示に基づいて当業者に容易に特定可能なその他のものが含まれる。
【0098】
疾患および有害な健康状態は、特定のタンパク質の発現の異常な減少を特徴とするものである。そのような疾患または有害な健康状態は、特定のタンパク質の上方制御により治療され得る。したがって、本明細書に記載の共局在複合体が、標的核酸を含むDNAに会合またはその他の態様で(otherwise)結合し、共局在複合体の転写活性化因子が標的核酸の発現を上方制御する、疾患または有害な健康状態を治療する方法が提供される。例えば、褐色脂肪分化および代謝取込みの増加を促進するPRDM16および他の遺伝子の上方制御を用いて、メタボリックシンドロームまたは肥満を治療することができる。抗炎症遺伝子の活性化は自己免疫および循環器疾患において有用である。腫瘍抑制因子遺伝子の活性化は癌の治療において有用である。本開示に基づいて、当業者はそのような疾患および有害な健康状態を容易に特定するであろう。
【0099】
以下の実施例は本開示の代表例として記載されるものである。本開示、図面、および添付の特許請求の範囲を考慮して、これらの実施形態および他の同等の実施形態が明らかになるので、これらの実施例は本開示の範囲を限定するものと解釈されるべきではない。
【実施例0100】
実施例I
Cas9変異体
Cas9のRuvCドメインおよびHNHドメインの天然の活性を除去することができるCas9中の変異候補を特定するために、既知の構造を有するCas9と相同な配列を検索した。HHpred(ワールドワイドウェブサイト:toolkit.tuebingen.mpg.de/hhpred)を用いて、全長タンパク質データバンク(2013年1月)に対してCas9の全長配列をクエリ配列とした。この検索によって、Cas9のHNHドメインに対する有意な配列相同性を有する2つの異なるHNHエンドヌクレアーゼである、PacIおよび推定エンドヌクレアーゼ(それぞれPDB ID:3M7KおよびPDB ID:4H9D)が得られた。これらのタンパク質を調べて、マグネシウムイオンの配位に関与する残基を見出した。次に、Cas9への配列アラインメントにより対応する残基を特定した。Cas9中の同じ種類のアミノ酸とアライメントされた、各構造中の2つのMg配位側鎖を特定した。これらは3M7KのD92およびN113、ならびに4H9DのD53およびN77である。これらの残基は、Cas9のD839およびN863に対応していた。さらに、PacI残基D92およびN113のアラニンへの変異によりヌクレアーゼが触媒的に欠損した状態となることが報告された。この分析に基づいて、Cas9変異D839AおよびN863Aが作製された。さらに、HHpredにより、Cas9とサーマス・サーモフィルス(Thermus thermophilus)のRuvC(PDB ID:4EP4)のN末端との間の相同性も予測される。この配列アラインメントは、Cas9中のRuvCドメインの機能を除去する、以前に報告された変異D10Aを含む。この変異が適切な変異であることを確認するために、前述のように金属結合残基を決定した。4EP4では、D7がマグネシウムイオンの配位を補助する。この位置はCas9のD10に対応する配列相同性を有することから、この変異が金属結合の除去を補助し、結果としてCas9のRuvCドメインからの触媒活性の除去を補助することが確認される。
【0101】
実施例II
プラスミド構築
Quikchangeキット(Agilent technologies社)を用いてCas9変異体を作製した。標的gRNA発現コンストラクトは、(1)個々のgBlocksとしてIDT社に直接注文し、pCR-Bluntll-TOPOベクター(Invitrogen社)にクローニングされたか、(2)Genewiz社によってカスタム合成されたか、または(3)オリゴヌクレオチドのギブソン・アセンブリによって、gRNAクローニングベクター(プラスミド#41824)中へ構築された。終止コドンを有するGFP配列と、Addgene社のEGIPレンチベクター(プラスミド#26777)中に構築された適切な断片との融合PCRアセンブリにより、破壊されたGFPを含むHRレポーターアッセイ用ベクターを構築した。次に、これらのレンチベクターを用いてGFPレポーター安定発現株を樹立した。この実験に用いたTALENは、標準的なプロトコルを用いて構築された。その全体が参照により援用されるSanjana et al., Nature Protocols 7, 171-192 (2012)を参照されたい。標準的なPCR融合プロトコルの手法を用いて、Cas9NとMS2 VP64との融合を行った。OCT4およびREX1用のプロモータールシフェラーゼコンストラクトはAddgene社から入手した(プラスミド#17221およびプラスミド#17222)。
【0102】
実施例III
細胞培養および遺伝子導入
10%ウシ胎仔血清(FBS、Invitrogen社)、ペニシリン/ストレプトマイシン(pen/strep、Invitrogen社)、および非必須アミノ酸(NEAA、Invitrogen社)を添加した高グルコースダルベッコ変法イーグル培地(DMEM、Invitrogen社)中でHEK293T細胞を培養した。加湿恒温器中、37℃、5%CO2で細胞を維持した。
【0103】
ヌクレアーゼアッセイに関連する遺伝子導入は以下の通りであった。製造業者のプロトコルに従いLipofectamine2000を用いて、0.4×106個の細胞に2μgのCas9プラスミド、2μgのgRNA、および/または2μgのDNAドナープラスミドを遺伝子導入した。遺伝子導入の3日後に細胞を回収し、FACSで分析するか、ゲノム切断の直接的アッセイのためにDNAeasyキット(Qiagen社)を用いて約1×106個の細胞のゲノムDNAを抽出した。これらのために、PCRを行ってこれら細胞に由来するゲノムDNAを用いて標的とする領域を増幅し、増幅産物をMiSeq Personal Sequencer(Illumina社)により200,000リードを超えるカバー率(coverage)でディープシークエンシングを行った。シークエンシングデータを分析してNHEJ効率を評価した。
【0104】
転写活性化アッセイに関連する遺伝子導入では、0.4×106個の細胞に、(1)2μgのCas9N-VP64プラスミド、2μgのgRNA、および/または0.25μgのレポーターコンストラクト、または(2)2μgのCas9Nプラスミド、2μgのMS2-VP64、2μgのgRNA-2XMS2アプタマー、および/または0.25μgのレポーターコンストラクトを遺伝子導入した。遺伝子導入の24~48時間後に細胞を回収し、FACSまたは免疫蛍光法を用いてアッセイするか、またはそれらの全RNAを抽出した後、RT-PCRによりこれらを分析した。OCT4およびREX1については、Invitrogen社の標準的なtaqmanプローブを用いて、GAPDHに対して各試料を標準化した。
【0105】
Cas9-gRNA複合体およびTALEの特異性プロファイルを得るための転写活性化アッセイに関連する遺伝子導入では、0.4×106個の細胞に、(1)2μgのCas9N-VP64プラスミド、2μgのgRNA、および0.25μgのレポーターライブラリー、(2)2μgのTALE-TFプラスミドおよび0.25μgのレポーターライブラリー、または(3)2μgの対照TFプラスミドおよび0.25μgのレポーターライブラリーを遺伝子導入した。遺伝子導入の24時間後に(レポーターの刺激が飽和モードになるのを回避するため)細胞を回収した。RNAeasy-plusキット(Qiagen社)を用いて全RNAを抽出し、Superscript-III(Invitrogen社)を用いて標準的RT-pcrを行った。転写物タグの標的化pcr増幅により次世代シークエンシング用のライブラリーを作製した。
【0106】
実施例IV
Cas9-TFおよびTALE-TFレポーターの発現レベルを計算するためのコンピュータ分析および配列分析
この処理の多段階論理フローは
図8Aに示されており、その他の詳細がここに記載される。コンストラクトライブラリーの組成の詳細については
図8A(1段目)および
図8Bを参照されたい。
【0107】
配列決定:Cas9実験については、コンストラクトライブラリー(
図8A、3段目、左)およびレポーター遺伝子のcDNA配列(
図8A、3段目、右)を、Illumina MiSeq上で150bpの重複するペアエンドリードとして得、TALE実験については、対応する配列を、Illumina HiSeq上で51bpの重複しないペアエンドリードとして得た。
【0108】
コンストラクトライブラリー配列の処理:アラインメント:Cas9実験については、novoalign V2.07.17(ワールドワイドウェブサイト:novocraft.com/main/index/php)を用いて、一組の8bpライブラリーバーコードに挟まれる234bpのコンストラクトに対応する一組の250bpの参照配列に対してペアリードをアライメントした(
図8A、3段目、左参照)。novoalignに提供された参照配列では、23bpの縮重Cas9結合部位領域および24bpの縮重転写物タグ領域(
図8A、1段目参照)をNと指定し、一方、コンストラクトライブラリーのバーコードは明瞭に規定した。TALE実験については、参照配列の長さが203bpであり、縮重結合部位領域の長さが23bpに対して18bpであったこと以外は、同じ方法を用いた。
【0109】
妥当性(validity)検査:各リードペアの左のリードと右のリードがそれぞれ参照配列に対してアライメントされた構成ファイルをnovoalignでアウトプットした。両方が参照配列とユニークにアライメントされたリードペアのみが追加の妥当性条件の対象とされ、これらの条件全部に合格したリードペアのみが保持された。妥当性条件には以下が含まれた。
【0110】
(i)2つのコンストラクトライブラリーバーコードの各々が、参照配列バーコードと少なくとも4つの位置でアライメントされなければならず、それら2つのバーコードは同じコンストラクトライブラリーのバーコード対でなければならない。(ii)参照配列のN領域に対してアライメントされる全ての塩基がnovoalignによって、A、C、G、またはTと分類されなければならない。Cas9実験およびTALE実験のいずれにおいても、参照N領域中で左のリードと右のリードは重複しないので、これらのN塩基の曖昧なnovoalign分類の可能性は生じなかったことに留意されたい。(iii)同様に、novoalignに分類される挿入または欠失がこれらの領域中に現れてはならない。(iv)(これらのランダム配列はA、C、およびGのみから作製されたため)転写物タグ領域にTが現れてはならない。これらの条件のいずれか1つを満たさなかったリードペアを、不合格リードペアファイル(rejected read pair file)に収集した。これらの妥当性検査は、自作のperlスクリプトを用いて実行した。
【0111】
誘導された試料レポーター遺伝子cDNA配列の処理:アラインメント:まず、SeqPrep(ワールドワイドウェブサイト:github.com/jstjohn/SeqPrepからダウンロード)を用いて、重複するリードペアを79bpの共通セグメントまでマージし、次に、novoalign(上記バージョン)を用いて、これらの79bp共通セグメントを、ペアではない単一のリードとして、(コンストラクトライブラリー配列決定については)24bp縮重転写物タグはNと指定し、試料バーコードは明瞭に規定された、一組の参照配列とアライメントした(
図8A、3段目、右参照)。TALEおよびCas9のcDNA配列領域はいずれも、一組の8bp試料バーコード配列によって挟まれる同一の63bpcのDNA領域に対応していた。
【0112】
妥当性検査:(a)これまでにSeqPrepでリードペアをマージしているので、妥当性処理は、1つのリードペア中の両方のリードのユニークなアラインメントについてフィルタリングする必要はなく、マージしたリードのユニークなアラインメントについてのみフィルタリングする必要があること、および(b)cDNA配列リード中には転写物タグのみが現れたので、妥当性処理は参照配列のこれらのタグ領域のみに適用し、別個の結合部位領域には適用しなかったことを除き、コンストラクトライブラリーの配列決定(上記参照)と同じ条件を適用した。
【0113】
結合部位と転写物タグの関連表のアセンブリ:自作のperlを用いて、検証されたコンストラクトライブラリー配列からこれらの表を作成した(
図8A、4段目、左)。A、C、およびGの塩基から構成される24bpタグ配列は、コンストラクトライブラリーの全体にわたって基本的にユニークなはずであるが(共有確率=約2.8e-11)、結合部位とタグの関連の初期分析により、実際には無視できない割合のタグ配列が複数の結合配列に共有されていることが明らかになり、これはおそらく主に結合配列中の配列エラーの組合せ、またはコンストラクトライブラリーの作製に用いたオリゴ中のオリゴ合成エラーの組み合わせによるものである。タグの共有に加え、検証されたリードペア中の結合部位と関連することが明らかになったタグが、バーコードのミスマッチに起因して、どのコンストラクトライブラリーにそれらのタグが由来し得るのか明確でなかった場合に、コンストラクトライブラリーのリードペア不合格ファイル中にも見出される可能性があった。最後に、タグ配列自体が配列エラーを含む可能性があった。これらのエラー原因に対処するため、タグを以下の3つの属性に分類した。(i)セーフ(safe)対アンセーフ(unsafe):アンセーフは、タグがコンストラクトライブラリーの不合格リードペアファイル中に見出され得ることを意味する。共有対非共有:共有は、タグが複数の結合部位配列と関連して見出されることを意味する。2+対1のみ:2+は、検証されたコンストラクトライブラリー配列中に少なくとも2回タグが現れ、したがって配列エラーを含む可能性がより低いと推定されることを意味する。これら3つの基準を組み合わせて、各結合部位に関連する8クラスのタグが得られ、最も確実な(secure)(しかし最も少ない)クラスは、セーフ、非共有、2+タグのみを含み、最も確実でない(しかし、最も多い)クラスは、安全性、共有、または発生数に関係なく全てのタグを含む。
【0114】
標準化された発現レベルの計算:自作のperlコードを用いて、
図8Aの5~6段目に示されているステップを実行した。まず、コンストラクトライブラリーについて予め計算された結合部位と転写物タグの表を用いて、各誘導試料で得られたタグ数を各結合部位について集計した(
図8C参照)。次に、各試料について、各結合部位について集計されたタグ数を陽性対照試料について集計されたタグ数で除算して、標準化された発現レベルを得た。これらの計算と関連するその他の考慮すべき事項には以下が含まれる。
【0115】
1.各試料について、妥当性検査されたcDNA遺伝子配列の中に、結合部位と転写物タグの関連表に見られなかった「新規な」タグのサブセットが見出された。これらのタグはその後の計算では無視された。
【0116】
2.上記のタグ数の集計は、結合部位と転写物タグの関連表中の前述した8クラスのタグのそれぞれについて行った。コンストラクトライブラリー中の結合部位は、中心となる配列と類似している配列が高い頻度で生成するが、ミスマッチの数が多い配列ほど少なくなるようにバイアスがかかっていたので、ミスマッチがほとんどない結合部位では一般的に多数のタグが集計され、一方、ミスマッチが多い結合部位ほど集計は少なくなる。したがって、最も確実なタグのクラスを使用することが一般的には望ましいが、2つ以上のミスマッチを有する結合部位の評価は、結合部位あたり少数のタグに基づくことなり、タグ自体の信頼性が高い場合であっても、確実な数および割合の統計的信頼性は低くなる。そのような場合には、全てのタグを用いた。この考慮事項に対する補償は、n箇所のミスマッチ位置について、別個の集計されたタグの数は、以下のミスマッチ位置の組合せ数と共に増加し、nと共に劇的に増加するという事実から得られるものであり、したがって、種々のミスマッチ数nについての集計されたタグ数の平均(
図2B、
図2E、
図9A、
図10Bに示される)は、n≧2について統計的に非常に大きな集合の集計タグ数に基づいている。
【0117】
【0118】
3.最後に、TALEコンストラクトライブラリー中に構築された結合部位は18bpであり、タグとの関連はこれらの18bp配列に基づいて指定されたが、いくつかの実験は、18bpのコンストラクト結合部位領域内の中央の14bpまたは10bpの領域に結合するように作製されたTALEを用いて行われた。これらのTALEの発現レベルの計算では、関連表中の18bpの結合部位の対応する領域に基づいて結合部位についてタグを集計することにより、この領域の外側にある結合部位のミスマッチが無視されるようにした。
【0119】
実施例V
ベクターおよび株の構築
ストレプトコッカス・サーモフィラス(S. thermophilus)、ナイセリア・メニンジティディス(N. meningitidis)、およびトレポネーマ・デンティコラ(T. denticola)のCas9配列をNCBIから入手し、JCAT(ワールドワイドウェブサイト:jcaT.de)27を用いてヒトコドン最適化し、DNA合成および大腸菌中での発現が容易になるように改変した。階層的オーバーラップPCRおよび等温アセンブリ24によって、500bpのgBlocks(Integrated DNA Technologies社、アイオワ州、コーラルヴィル)を連結した。得られた全長産物を細菌発現ベクターおよびヒト発現ベクターにサブクローニングした。これらの鋳型から標準的な方法によりヌクレアーゼ欠損Cas9カセット(NM:D16A D587A H588A N611A、SP:D10A D839A H840A N863A、ST1:D9A D598A H599A N622A、TD:D13A D878A H879A N902A)を構築した。
【0120】
実施例VI
細菌プラスミド
中程度の強度のproC構成的プロモーターを用いてcloDF13/aadAプラスミド骨格からCas9を細菌中で発現させた。天然細菌座位に由来するプロモーターおよびターミネーターを含むtracrRNAカセットをgBlocksとして合成し、強力なtracrRNA産生のために各ベクターのCas9コード配列の下流に挿入した。tracrRNAカセットが反対方向のプロモーターをさらに含むことが予想される場合は、cas9転写への干渉を防ぐためにラムダt1ターミネーターを挿入した。細菌標的化プラスミドは、SPを用いて機能することが以前に判明している、強力なJ23100プロモーターおよびそれに続く2種類の20塩基対スペーサー配列のうちの一方(
図13D)を有するp15A/cat骨格をベースにした。スペーサー配列のすぐ後に、
図12Aに示される3種類の36塩基対の反復配列のうちの1つが続く。YFPレポーターベクターは、GFPを発現させるpRプロモーターおよびEYFPコード配列に先行するT7 g10 RBSを有するpSC101/kan骨格をベースとしており、5′UTR中の非鋳型鎖にプロトスペーサー1およびPAMであるAAAAGATTが挿入されている。細菌中での直交性試験のための基質プラスミドは、ライブラリープラスミド(以下参照)と同じであるが、以下のPAMを有する:GAAGGGTT(NM)、GGGAGGTT(SP)、GAAGAATT(ST1)、AAAAAGGG(TD)。
【0121】
実施例VII
哺乳動物ベクター
哺乳動物Cas9発現ベクターは、C末端SV40 NLSを有するpcDNA3.3-TOPOをベースにした。各Cas9に対するsgRNAは、crRNA反復配列をtracrRNAとアライメントし、Cas9相互作用25のための安定なステムが残るように5′crRNA反復配列を3′tracrRNAと融合することによりデザインした。sgRNA発現コンストラクトは、455bpのgBlocksをpCR-BluntII-TOPOベクター骨格にクローニングすることにより作製された。スペーサーは以前の研究8で使用されたものと同じであった。破壊型GFP HRレポーターアッセイ用のレンチベクターを以前に報告されているものから改変して、各Cas9に対する適切なPAM配列が含まれるようにし、GFPレポーター安定発現株の確立に用いた。
【0122】
VP64活性化因子に融合したヌクレアーゼ欠損Cas9タンパク質、およびミニマルプロモーターにより発現されるtdTomatoを有する対応するレポーターコンストラクトからなるRNA誘導型転写活性化因子を構築した。
【0123】
実施例VIII
ライブラリー構築および形質転換
プロトスペーサーライブラリーは、2種類のプロトスペーサー配列のうちの一方およびそれに続く8個のランダムな塩基をコードするプライマー(IDT社、アイオワ州、コーラルヴィル)を用いてpZE21ベクター(ExpressSys社、ドイツ、リュルツハイム)を増幅し、標準的な等温法24によりアセンブルすることによりを構築した。ライブラリーアセンブリを最初にNEBTurbo細胞(New England Biolabs社、マサチューセッツ州、イプスウィッチ)に形質転換し、希釈プレーティングでライブラリー当たり1E8個以上のクローンを得て、Midiprep(Qiagen社、カリフォルニア州、カールズバッド)で精製した。Cas9発現プラスミド(DS-NMcas、DS-ST1cas、またはDS-TDcas)および標的化プラスミド(PM-NM!sp1、PM-NM!sp2、PM-ST1!sp1、PM-ST1!sp2、PM-TD!sp1、またはPM-TD!sp2)を含むエレクトロコンピテントなNEBTurbo細胞を、200ngの各ライブラリーで形質転換し、37℃で2時間回復させた後、スペクチノマイシン(50μg/mL)、クロラムフェニコール(30μg/mL)、およびカナマイシン(50μg/mL)を含む培地で希釈した。段階希釈物をプレーティングして形質転換後のライブラリーサイズを推定した。全てのライブラリーは約1E7クローンを超えており、これは、65536個のランダムPAM配列を完全にカバーしていることを示している。
【0124】
実施例IX
ハイスループットシークエンシング
12時間の抗生物質選択後にスピンカラム(Qiagen社、カリフォルニア州、カールズバッド)でライブラリーDNAを回収した。Illumina MiSeq上で重複する25bpのペアエンドリードから得られた配列、およびバーコード化したプライマーを用いて、インタクトなPAMを増幅した。MiSeqにより、18,411,704の合計リードまたは9,205,852個のペアエンドリードが生じ、各ライブラリーについての平均品質スコアは>34であった。ペアエンドリードをマージし、お互いとの、それらのプロトスペーサーとの、およびプラスミド骨格との完全なアラインメントについてフィルタリングした。残りの7,652,454個のマージされたフィルタリング済みリードをトリミングしてプラスミド骨格およびプロトスペーサー配列を除去した後、これを用いて各PAMライブラリーについての位置特異的重み行列(position weight matrix)を作製した。各ライブラリー組合せにより、少なくとも450,000の高品質リードを得た。
【0125】
実施例X
配列処理
各候補PAMの除去倍率を計算するために、本発明者らは、2種類のスクリプトを用いてデータをフィルタリングした。patternProp(usage:python patternProp.py [PAM] file.fastq)により、指示されたPAMの各1塩基誘導体にマッチするリードの数および割合が得られる。patternProp3により、ライブラリーのリードの総数に対する各1塩基誘導体にマッチするリードの割合が得られる。計算された各PAMの除去の割合を詳細に示すスプレッドシートを用いて、全ての1塩基誘導体における最小の除去倍率を特定することによりPAMを分類した。
【0126】
実施例XI
細菌における抑制アッセイおよび直交性アッセイ
NM発現プラスミドおよびYFPレポータープラスミドを、2種類の対応する標的化プラスミドの各々で形質転換することにより、Cas9による抑制をアッセイした。マッチするまたはミスマッチのスペーサーおよびプロトスペーサーを有するコロニーを選び、96ウェルプレート中で成長させた。Synergy Neoマイクロプレートリーダー(BioTek社、バーモント州、ウィヌースキー)を用いて495/528nmの蛍光および600nmの吸収を測定した。
【0127】
Cas9と標的化プラスミドとの全ての組合せを有するエレクトロコンピテントなNEBTurbo細胞を調製し、それらを各Cas9に対する適切なPAMを有するマッチまたはミスマッチする基質プラスミドで形質転換することにより直交性試験を行った。Cas9またはcrRNAの変異による不活性化により通常生じる、正しいCas9+標的化+マッチするプロトスペーサーの組合せにおいても少なくともいくつかのコロニーが確実に現れるように、十分な細胞および希釈物をプレーティングした。コロニーを数え、それぞれについて除去倍率を計算した。
【0128】
実施例XII
細胞培養および遺伝子導入
HEK293T細胞を、10%ウシ胎仔血清(FBS、Invitrogen社)、ペニシリン/ストレプトマイシン(pen/strep、Invitrogen社)、および非必須アミノ酸(NEAA、Invitrogen社)を補充した高グルコースダルベッコ変法イーグル培地(DMEM、Invitrogen社)中で培養した。加湿恒温器中で細胞を37℃、5%CO2に維持した。
【0129】
ヌクレアーゼアッセイと関連する遺伝子導入は以下の通りであった。製造業者のプロトコルに従いLipofectamine2000を用いて、0.4×106個の細胞に、2μgのCas9プラスミド、2μgのgRNA、および/または2μgのDNAドナープラスミドを遺伝子導入した。遺伝子導入の3日後に細胞を回収し、FACSにより分析するか、またはゲノム切断の直接的アッセイのためにDNAeasyキット(Qiagen社)を用いて約1×106個の細胞のゲノムDNAを抽出した。
【0130】
転写活性化アッセイに関連する遺伝子導入については、0.4×106個の細胞に、2μgのCas9N-VP64プラスミド、2μgのgRNA、および/または0.25μgのレポーターコンストラクトを遺伝子導入した。遺伝子導入の24~48時間後に細胞を回収し、FACSまたは免疫蛍光法を用いてアッセイするか、またはそれらの全RNAを抽出した後、これらをRT-PCRにより分析した。
【0131】
実施例XIII
推定直交性Cas9タンパク質の選択
crRNA中の36塩基対の反復配列により、Cas9のRNA結合およびsgRNAの特異性をまず決定する。既知のCas9遺伝子を、それらの隣接CRISPR座位中の高度に多様性を有する反復配列について調べた。ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)およびストレプトコッカス・サーモフィラス(Streptococcus thermophilus)のCRISPR1 Cas9タンパク質(SPおよびST1)
6、22、およびその座位が互いに、且つSPおよびST1の座位と、少なくとも13ヌクレオチドが異なっている反復配列を有するナイセリア・メニンジティディス(Neisseria meningitidis)(NM)およびトレポネーマ・デンティコラ(Treponema denticola)(TD)に由来する2つの別のCas9タンパク質を選択した(
図12A)。
【0132】
実施例XIV
PAMの特徴解析
Cas9タンパク質は、目的のCas9に特異的な3′PAM配列が隣接しているdsDNA配列のみを標的とする。4つのCas9変異体のうち、SPのみが実験により特徴解析されたPAMを有しているが、ST1のPAM、およびごく最近になってNMのPAMが、バイオインフォマティクスにより推定された。SPは、NGGという短いPAMに起因して標的化が容易である10が、ST1およびNMは、PAMがそれぞれNNAGAAWおよびNNNNGATTであるので、それほど容易に標的化できない22、23。バイオインフォマティクスによるアプローチにより、スペーサー獲得ステップに起因して、エフェクター切断の実験的必要条件と比較して、より厳密なCas9活性に対するPAM必要条件が推定された。PAM配列はエスケープファージ(escape phage)中の変異の最も頻度の高い標的であるので、獲得されたPAM中の重複性(redundancy)により抵抗性が排除されるであろう。ライブラリーに基づくアプローチを採用して、ハイスループットシークエンシングを用いて細菌中のこれらの配列を網羅的に特徴解析した。
【0133】
合成断片からST1、NM、およびTDをコードする遺伝子をアセンブルし、それらの関連するtracrRNAと共に細菌発現プラスミドにクローニングした(
図12B)。6つの標的化プラスミドへの組込みのため、2つのSP機能性スペーサーを選択した。各標的化プラスミドは、2つのスペーサーのうちの1つの後にCas9タンパク質に特異的な36塩基対の反復配列が続く、構成的に発現するcrRNAをコードする(
図12B)。これら2つのプロトスペーサーのうちの1つとそれに続く全ての可能な8塩基対PAM配列とを含むプラスミドライブラリーを、PCRおよびアセンブリにより作製した
24。各ライブラリーを、Cas9タンパク質、スペーサー、およびプロトスペーサーの計12通りの組み合せについて、Cas9発現プラスミドおよび標的化プラスミドを有する大腸菌細胞にエレクトロポレーションした。生存したライブラリープラスミドをバーコードPCRにより選択的に増幅し、MiSeqで配列決定して、スペーサーとプロトスペーサーがマッチする場合にのみ除去される機能性PAM配列(
図12C~
図12D)を、除去されない非機能性PAM(
図12D~
図12E)と区別した。全位置での各ヌクレオチドの重要性をグラフで表すために、対応するミスマッチの場合と比較した、マッチしたスペーサー・プロトスペーサー対についての各塩基の対数相対的頻度をプロットした(
図13A~
図13F)。
【0134】
NMおよびST1は、過去のバイオインフォマティクスによる予想と比較して、あまり厳密ではなく、より複雑なPAMを認識し、このことは、スペーサー獲得の必要条件が、エフェクター切断に対する必要条件よりも厳密であることを示唆している。NMは主にプロトスペーサーの3′末端から5塩基目に位置する1個のGヌクレオチドを必要とし(
図13A)、一方、ST1およびTDはそれぞれ、少なくとも3個の特異的塩基を必要とする(
図5b~
図5c)。位置で結果をソートすることにより、各プロトスペーサーライブラリーからの任意のPAM配列の除去を定量化することができた(
図13D~
図13F)。3つの酵素は全て、ほぼ全てのPAMについて、プロトスペーサー1と比較して、プロトスペーサー2をより効果的に切断し、ST1が約10倍の差を示した。しかし、この相互作用にはPAM依存的ばらつきも大きかった。例えば、プロトスペーサー1およびプロトスペーサー2の後にTNNNGNNNにマッチする配列が続く場合、NMはこれらをほぼ等しく切断したが、PAMがANNNGNNNにマッチした場合、プロトスペーサー2の切断活性は10倍高かった。
【0135】
結果は、所与のCas9に対して単一の許容可能なPAMを決定することの難しさを強調している。活性レベルがプロトスペーサー配列に依存するだけでなく、主な塩基要件が満たされた場合であっても、望ましくないPAM塩基の特異的組合せにより顕著に活性が低下し得る。本発明者らは、最初に、より活性の低いプロトスペーサー1で平均して100倍超の除去を受け、且つ一定の1個の塩基を付加的に有する全ての誘導体で50倍超の除去を受けたパターンとして、PAMを特定した(表1、プレーンテキスト)。これらのレベルはおそらく細菌中での標的に対する防御には十分であるものの、有害な変異の特定の組合せにより活性が劇的に低下した。例えば、NMは、NCCAGGTNにマッチする配列を4倍しか除去しなかった。マッチする配列の500倍超の除去、且つ1塩基誘導体の200倍超の除去を要求する、より厳密な閾値を、高い親和性が要求される適用について規定した(表1、太字)。
【0136】
【0137】
実施例XV
細菌における転写制御
SPのヌクレアーゼ欠損変異体は、標的化プロトスペーサーおよびPAMの位置に依存した有効性で、細菌中の標的遺伝子を抑制することが示されている
18。NMのPAMは、SPのPAMより高い頻度で現れるので、ヌクレアーゼ欠損型が同様に標的抑制可能である。RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインの触媒残基を配列相同性によって特定し、不活性化して、推定ヌクレアーゼ欠損NMを作製した。好適なレポーターを作成するために、プロトスペーサー1を適切なPAMと共に、YFPレポータープラスミドの5′UTR内の非鋳型鎖に挿入した(
図14A)。大腸菌を、以前に用いられた2つのNM標的化プラスミドのそれぞれと共にこれらのコンストラクトで同時形質転換し、それらの相対的蛍光を測定した。マッチするスペーサーおよびプロトスペーサーを有する細胞は、対応するミスマッチの場合より、約22倍弱い蛍光を示した(
図14B)。これらの結果は、NMが標的化容易なリプレッサーとして機能して細菌中で転写を制御することができ、これにより、Cas9による抑制の対象となり得る内在性遺伝子の数が実質的に増加することを示唆している。
【0138】
実施例XVI
細菌中での直交性
Cas9タンパク質のセットを、それらとは異種のcrRNA反復配列について選択した。これらのCas9タンパク質が実際に直交性であることを検証するために、スペーサー2を含む4つの標的化プラスミドの全てと共に各Cas9発現プラスミドで同時形質転換した。これらの細胞を、プロトスペーサー1またはプロトスペーサー2のいずれかと好適なPAMとを含む基質プラスミドで形質転換した。各Cas9が自身のcrRNAと対を形成した場合にのみプラスミドの除去が観察され、このことは、4つのコンストラクト全てが実際に細菌中で直交性であることを示している(
図15)。
【0139】
実施例XVII
ヒト細胞におけるゲノム編集
次いで、これらのCas9変異体を用いてヒト細胞を改変した。2つのより小さいCas9オルソログであるNMおよびST1について、crRNAとtracrRNAの相補的領域を調べ
25、SPについて作成されたsgRNAのものと類似した種々の融合結合部でステムループを介して2つの配列を融合することにより、対応するcrRNAおよびtracrRNAから単一ガイドRNA(sgRNA)を構築した。複数連続するウラシルにより発現系でPol III終結が引き起こされた特定の場合には、複数の一塩基変異体を作製した。短縮型は有害であることが知られているので、完全な3′tracrRNA配列を常に含めた
8。以前に記載されている293細胞における相同組換えアッセイ
8を用いて、対応するCas9タンパク質と共に、全てのsgRNAの活性をアッセイした。簡潔に述べると、終止コドン、および機能性PAMを有するプロトスペーサー配列をコードする挿入物によってGFPコード配列が分断された、ゲノムに組み込まれた非蛍光GFPレポーター系統を各Cas9タンパク質について構築した。Cas9タンパク質および対応するsgRNAをコードする発現ベクターを、ヌクレアーゼ誘導性相同組換えにより蛍光を回復させることができる修復ドナーと共にレポーター系統に遺伝子導入した(
図16A)。SPによって誘導される編集に匹敵するレベルで、ST1による編集およびNMによる編集が観察された。5個の連続するウラシルを有するST1 sgRNAは効率的に機能し、このことは、活性を損なうのに十分なレベルではPol III終結が起こらなかったことを示唆している。全長crRNA-tracrRNA融合体は、全ての例で活性であり、キメラsgRNAデザインに有用である。NMおよびST1はいずれも、キメラガイドRNAを用いたヒト細胞において、効率的に遺伝子を編集することが可能である。
【0140】
実施例XVIII
哺乳動物細胞におけるCas9直交性
ヒト細胞におけるNMおよびST1の活性に非常に効果的なsgRNAが見出されたので、3つのタンパク質がいずれも、他のsgRNAによって誘導されないことを立証した。同様の相同組換えアッセイを用いて、3つのsgRNAの各々と組み合わせたNM、SP、およびST1の相対的効率を測定した。3種類のCas9タンパク質の全てが互いに完全に直交性であることが確定され、これらが同一細胞において別個の、且つ重複しない配列セットを標的化可能であることが示された(
図16B)。直交標的化におけるsgRNAおよびPAMの役割を対比するために、種々の下流のPAM配列をSPおよびST1ならびにそれらそれぞれのsgRNAと共に試験した。マッチするsgRNAおよび有効なPAMの両方が活性に必要であり、対応するCas9に対する特異的なsgRNA親和性によってほぼ完全に直交性が確認された。
【0141】
実施例XIX
ヒト細胞における転写活性化
NMおよびST1はヒト細胞において転写活性化を仲介する。SP活性化因子をモデルにして、ヌクレアーゼ欠損のNM遺伝子およびST1遺伝子のC末端にVP64活性化ドメインを融合して、推定RNA誘導型活性化因子を作製した。活性化のためのレポーターコンストラクトは、tdTomatoコード領域の上流に挿入されたプロトスペーサーおよび適切なPAMから構成された。RNA誘導型転写活性化因子、sgRNA、および適切なレポーターを発現するベクターを同時遺伝子導入し、転写活性化の程度をFACSで測定した(
図17A)。いずれの場合にも、3種類のCas9変異体の全てにおいて強力な転写活性化が観察された(
図17B)。各Cas9活性化因子は、その対応するsgRNAと対を形成した場合にのみ転写を促進した。
【0142】
実施例XX
考察
網羅的なPAM特徴解析に2種類の別個のプロトスペーサーを用いることにより、プロトスペーサーとPAMの認識を決定する複雑性を調べることが可能となった。プロトスペーサー切断効率の差により、オルソログ間で差の大きさはかなり異なってはいるが、多様なCas9タンパク質にわたって一定の傾向が示された。このパターンから、Dループの形成または安定化における配列依存的な差が、各プロトスペーサーの基本的標的化効率を決定しているが、付加的なCas9または反復配列依存的因子もまた関与していることが示唆される。同様に、多くの要因により、単一配列モチーフを用いてPAM認識を説明しようとする試みが妨げされる。主なPAM認識決定因子に隣接する個々の塩基を組み合わせることで、全体の親和性を劇的に低下し得る。実際、特定のPAMは、スペーサーまたはプロトスペーサーと非線形に相互作用して全体的な活性を決定しているようである。さらに、異種細胞間での別個の活性に対しては、異なる親和性レベルが必要とされ得る。最後に、実験により特定されたPAMには、バイオインフォマティクス分析から推定されたものよりも少ない塩基が必要であったことから、スペーサー獲得の必要条件はエフェクター切断の必要条件とは異なることが示唆される。
【0143】
この差はナイセリア・メニンジティディス(N. meningitidis)由来のCas9タンパク質について最も顕著であり、このCas9タンパク質は、バイオインフォマティクス的予測および現在一般的なストレプトコッカス・ピオゲネス(S. pyogenes)由来のCas9のいずれと比較しても、PAMの必要条件が少ない。この発見により、Cas9タンパク質で容易に標的化できる配列の数がかなり拡張される。さらに、長さが3.25kbpとSPより850bp小さく、遺伝子送達能が制限的である場合にかなりの利点である。特に注目すべきは、NMおよびST1はいずれも治療用途のAAVベクターに適合するほど十分小さく、NMは、PAMの認識または特異性を改変させるようにデザインされる、指向性進化法(directed evolution)の試みのためのより好適な出発点となり得る。
【0144】
以下の参照文献は、あらゆる目的のためにその全体を参照により援用する。
【0145】
参照文献
1. Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011).
2. Wiedenheft, B., Sternberg, S.H. & Doudna, J.A. RNA-guided genetic silencing systems in bacteria and archaea. Nature 482, 331-338 (2012).
3. Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012).
4. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
5. Cho, S.W., Kim, S., Kim, J.M. & Kim, J.S. Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nature biotechnology 31, 230-232 (2013).
6. Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819- 823 (2013).
7. Ding, Q. et al. Enhanced efficiency of human pluripotent stem cell genome editing through replacing TALENs with CRISPRs. Cell stem cell 12, 393-394 (2013).
8. Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).
9. Wang, H. et al. One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Cell 153, 910-918 (2013).
10. Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013).
11. Boch, J. et al. Breaking the code of DNA binding specificity of TAL-type III effectors. Science 326, 1509- 1512 (2009).
12. Gaj, T., Gersbach, C.A. & Barbas, C.F., 3rd ZFN, TALEN, and CRISPR/Cas-based methods for genome engineering. Trends in biotechnology (2013).
13. Hockemeyer, D. et al. Efficient targeting of expressed and silent genes in human ESCs and iPSCs using zinc-finger nucleases. Nature biotechnology 27, 851-857 (2009).
14. Kim, Y.G., Cha, J. & Chandrasegaran, S. Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proceedings of the National Academy of Sciences of the United States of America 93, 1156- 1160 (1996).
15. Moscou, M.J. & Bogdanove, A.J. A simple cipher governs DNA recognition by TAL effectors. Science 326, 1501 (2009).
16. Porteus, M.H. & Carroll, D. Gene targeting using zinc finger nucleases. Nature biotechnology 23, 967-973 (2005).
17. Urnov, F.D. et al. Highly efficient endogenous human gene correction using designed zinc-finger nucleases. Nature 435, 646-651 (2005).
18. Qi, L.S. et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173-1183 (2013).
19. Beerli, R.R., Dreier, B. & Barbas, C.F., 3rd Positive and negative regulation of endogenous genes by designed transcription factors. Proceedings of the National Academy of Sciences of the United States of America 97, 1495-1500 (2000).
20. Podgornaia, A.I. & Laub, M.T. Determinants of specificity in two-component signal transduction. Current opinion in microbiology 16, 156-162 (2013).
21. Purnick, P.E. & Weiss, R. The second wave of synthetic biology: from modules to systems. Nature reviews. Molecular cell biology 10, 410-422 (2009).
22. Horvath, P. et al. Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. Journal of bacteriology 190, 1401-1412 (2008).
23. Zhang, Y. et al. Processing-Independent CRISPR RNAs Limit Natural Transformation in Neisseria meningitidis. Molecular cell 50, 488-503 (2013).
24. Gibson, D.G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nature methods 6, 343-345 (2009).
25. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011).
26. Bondy-Denomy, J., Pawluk, A., Maxwell, K.L. & Davidson, A.R. Bacteriophage genes that inactivate the CRISPR/Cas bacterial immune system. Nature 493, 429-432 (2013).
27. Grote, A. et al. JCat: a novel tool to adapt codon usage of a target gene to its potential expression host. Nucleic acids research 33, W526-531 (2005).
本発明の実施形態は以下を含む。
<1>
2種類以上の標的核酸に相補的である2種類以上のRNAをコードする第1の外来核酸を細胞に導入すること、
前記2種類以上の標的核酸にそれぞれ結合し、且つ前記2種類以上のRNAによってそれぞれガイドされる2種類以上の直交性RNA誘導型ヌクレアーゼ欠損(nuclease-null)DNA結合タンパク質をコードする第2の外来核酸を前記細胞に導入すること、および
2種類以上の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記複数種類のRNA、前記複数種類の直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記複数種類の転写制御タンパク質またはドメインが発現し、
RNAと、直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質と、転写制御タンパク質またはドメインと、標的核酸との共局在複合体が2種類以上形成され、該転写制御タンパク質またはドメインが該標的核酸の発現を制御する、
細胞において2種類以上の標的核酸の発現を調節する方法。
<2>
直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする前記外来核酸が、該直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質に融合した前記転写制御タンパク質またはドメインをさらにコードする、<1>に記載の方法。
<3>
2種類以上のRNAをコードする前記外来核酸が、RNA結合ドメインの標的をさらにコードし、前記転写制御タンパク質またはドメインをコードする前記外来核酸が、前記転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする、<1>に記載の方法。
<4>
前記細胞が真核細胞である、<1>に記載の方法。
<5>
前記細胞が、酵母細胞、植物細胞、または動物細胞である、<1>に記載の方法。
<6>
前記RNAが約10ヌクレオチド~約500ヌクレオチドである、<1>に記載の方法。
<7>
前記RNAが約20ヌクレオチド~約100ヌクレオチドである、<1>に記載の方法。
<8>
前記転写制御タンパク質またはドメインが転写活性化因子である、<1>に記載の方法。
<9>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御する、<1>に記載の方法。
<10>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御して疾患または有害な健康状態を治療する、<1>に記載の方法。
<11>
前記転写制御タンパク質またはドメインが転写抑制因子である、<1>に記載の方法。
<12>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を下方制御する、<1>に記載の方法。
<13>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を下方制御して疾患または有害な健康状態を治療する、<1>に記載の方法。
<14>
前記標的核酸が疾患または有害な健康状態と関連する、<1>に記載の方法。
<15>
前記1種類または複数種類のRNAがガイドRNAである、<1>に記載の方法。
<16>
前記1種類または複数種類のRNAがtracrRNA-crRNA融合体である、<1>に記載の方法。
<17>
前記DNAが、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである、<1>に記載の方法。
<18>
第1の標的核酸が活性化され、第2の標的核酸が抑制される、<1>に記載の方法。
<19>
複数種類の第1の標的核酸が抑制され、複数種類の第2の標的核酸が抑制される、<1>に記載の方法。
<20>
1種類または複数種類の第1の標的核酸が活性化され、1種類または複数種類の第2の標的核酸が抑制される、<1>に記載の方法。
<21>
細胞において1種類または複数種類の標的核酸の発現を制御すると同時に、細胞において1種類または複数種類の標的核酸を改変する方法であって、
少なくとも1種類のRNAが前記改変される1種類または複数種類の標的核酸に相補的であり、少なくとも1種類のRNAが前記制御される1種類または複数種類の標的核酸に相補的である、2種類以上のRNAをコードする第1の外来核酸を前記細胞に導入すること、
(1)1つの不活性ヌクレアーゼドメインを有し、且つ前記改変される1種類または複数種類の標的核酸に相補的である前記1種類または複数種類のRNAによってガイドされる、1種類の直交性RNA誘導型タンパク質ニッカーゼ、および(2)前記制御される標的核酸に相補的である前記1種類または複数種類のRNAに結合し且つガイドされる、1種類または複数種類の直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、をコードする第2の外来核酸を前記細胞に導入すること、および
1種類または複数種類の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記複数種類のRNA、前記直交性RNA誘導型タンパク質ニッカーゼ、前記複数種類の直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記複数種類の転写制御タンパク質またはドメインが発現し、
RNAと、直交性RNA誘導型タンパク質ニッカーゼと、および改変される標的核酸との共局在複合体が少なくとも1種類形成され、該タンパク質ニッカーゼが、該改変される標的核酸にニックを入れ、
RNAと、直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質と、転写制御タンパク質またはドメインと、制御される標的核酸との共局在複合体が少なくとも1種類形成され、該転写制御タンパク質またはドメインが、該制御される標的核酸の発現を制御する、方法。
<22>
細胞において1種類または複数種類の標的核酸の発現を制御すると同時に細胞において1種類または複数種類の標的核酸を改変する方法であって、
少なくとも1種類のRNAが前記改変される1種類または複数種類の標的核酸に相補的であり、少なくとも1種類のRNAが前記制御される1種類または複数種類の標的核酸に相補的である、2種類以上のRNAをコードする第1の外来核酸を前記細胞に導入すること、
(1)前記改変される1種類または複数種類の標的核酸に相補的である前記1種類または複数種類のRNAによってガイドされる、1種類の直交性RNA誘導型タンパク質ヌクレアーゼ、および(2)前記制御される標的核酸に相補的である前記1種類または複数種類のRNAに結合し且つガイドされる、1種類または複数種類の直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、をコードする第2の外来核酸を前記細胞に導入すること、および
1種類または複数種類の転写制御タンパク質またはドメインをコードする第3の外来核酸を前記細胞に導入することを含み、
前記複数種類のRNA、前記直交性RNA誘導型タンパク質ヌクレアーゼ、前記複数種類の直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および前記複数種類の転写制御タンパク質またはドメインが発現し、
RNAと、直交性RNA誘導型タンパク質ヌクレアーゼと、および改変される標的核酸との共局在複合体が少なくとも1種類形成され、該ヌクレアーゼが、該改変される標的核酸を切断し、
RNAと、直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質と、転写制御タンパク質またはドメインと、制御される標的核酸との共局在複合体が少なくとも1種類形成され、該転写制御タンパク質またはドメインが、該制御される標的核酸の発現を制御する、方法。
<23>
2種類以上の標的核酸にそれぞれ相補的である2種類以上のRNAをコードする第1の外来核酸、
2種類以上のRNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする第2の外来核酸、および
2種類以上の転写制御タンパク質またはドメインをコードする第3の外来核酸を含み、
各RNA、直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質、および転写制御タンパク質またはドメインが、各標的核酸に対する共局在複合体の構成要素である細胞。
<24>
直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質をコードする前記外来核酸が、該直交性RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質に融合した前記転写制御タンパク質またはドメインをさらにコードする、<23>に記載の細胞。
<25>
1種類または複数種類のRNAをコードする前記外来核酸が、RNA結合ドメインの標的をさらにコードし、前記転写制御タンパク質またはドメインをコードする前記外来核酸が、前記転写制御タンパク質またはドメインに融合したRNA結合ドメインをさらにコードする、<23>に記載の細胞。
<26>
前記細胞が真核細胞である、<23>に記載の細胞。
<27>
前記細胞が、酵母細胞、植物細胞、または動物細胞である、<23>に記載の細胞。
<28>
前記RNAが約10ヌクレオチド~約500ヌクレオチドを含む、<23>に記載の細胞。
<29>
前記RNAが約20ヌクレオチド~約100ヌクレオチドを含む、<23>に記載の細胞。
<30>
前記転写制御タンパク質またはドメインが転写活性化因子である、<23>に記載の細胞。
<31>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御する、<23>に記載の細胞。
<32>
前記転写制御タンパク質またはドメインが、前記標的核酸の発現を上方制御して疾患または有害な健康状態を治療する、<23>に記載の細胞。
<33>
前記標的核酸が疾患または有害な健康状態と関連する、<23>に記載の細胞。
<34>
前記1種類または複数種類のRNAがガイドRNAである、<23>に記載の細胞。
<35>
前記1種類または複数種類のRNAがtracrRNA-crRNA融合体である、<23>に記載の細胞。
<36>
前記DNAが、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、または外来性DNAである、<23>に記載の細胞。
<37>
前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質が、II型CRISPRシステムのDNA結合タンパク質である、<1>に記載の方法。
<38>
前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質が、直交性ヌクレアーゼ欠損Cas9タンパク質である、<1>に記載の方法。
<39>
前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質が、II型CRISPRシステムのDNA結合タンパク質である、<23>に記載の細胞。
<40>
前記RNA誘導型ヌクレアーゼ欠損DNA結合タンパク質が、直交性ヌクレアーゼ欠損Cas9タンパク質である、<23>に記載の細胞。