IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ デューク ユニバーシティの特許一覧

特開2025-16579RNAガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025016579
(43)【公開日】2025-02-04
(54)【発明の名称】RNAガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
(51)【国際特許分類】
   C12N 15/113 20100101AFI20250128BHJP
   C12N 15/63 20060101ALI20250128BHJP
   C12N 1/15 20060101ALI20250128BHJP
   C12N 1/19 20060101ALI20250128BHJP
   C12N 1/21 20060101ALI20250128BHJP
   C12N 5/10 20060101ALI20250128BHJP
   C12N 15/09 20060101ALI20250128BHJP
   C12N 9/22 20060101ALI20250128BHJP
   C12N 15/62 20060101ALI20250128BHJP
【FI】
C12N15/113 Z ZNA
C12N15/63 Z
C12N1/15
C12N1/19
C12N1/21
C12N5/10
C12N15/09 110
C12N9/22
C12N15/62 Z
C12N15/113 Z
【審査請求】有
【請求項の数】8
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024188133
(22)【出願日】2024-10-25
(62)【分割の表示】P 2021102505の分割
【原出願日】2016-08-25
(31)【優先権主張番号】62/209,466
(32)【優先日】2015-08-25
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
(71)【出願人】
【識別番号】507189666
【氏名又は名称】デューク ユニバーシティ
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100119013
【弁理士】
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100111796
【弁理士】
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100137626
【弁理士】
【氏名又は名称】田代 玄
(72)【発明者】
【氏名】ジョセフス エリック
(72)【発明者】
【氏名】コチャック デヴラン
(72)【発明者】
【氏名】マルスツァレク ピョートル
(72)【発明者】
【氏名】ガーズバック チャールズ エイ
(57)【要約】
【課題】最適化されたガイドRNA(gRNA)を産生する方法の提供。
【解決手段】本明細書で開示するのは、最適化されたガイドRNA(gRNA)、ならびに、標的結合特異性の増大とオフターゲット結合の低下を有する前記最適化されたgRNAを設計および使用する方法である。
【選択図】なし
【特許請求の範囲】
【請求項1】
最適化されたガイドRNA(gRNA)を産生する方法であって、
a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;
b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;
c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;
d)第1のgRNAのポリヌクレオチド配列を産生する工程であって、前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の5’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の5’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である、工程と;
e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程であって、ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される、工程と;f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;
g)リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、前記第2のgRNAを用いてステップ(e)を繰り返す工程と;
h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;
i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程と
を含む方法。
【請求項2】
最適化されたガイドRNA(gRNA)を産生する方法であって、
a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;
b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;
c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;
d)第1のgRNAのポリヌクレオチド配列を産生する工程であって、前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の3’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の3’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である、工程と;
e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程であって、ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される、工程と;f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;
g)リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、前記第2のgRNAを用いてステップ(e)を繰り返す工程と;
h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;
i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程と
を含む方法。
【請求項3】
前記異なるgRNAのさらなる侵入のエネルギー特性が、(I)DNA-DNA塩基対合を切断すること、(II)RNA-DNA塩基対を形成すること、(III)侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される、請求項1または2に記載の方法。
【請求項4】
前記第1のgRNAの、前記プロトスペーサー配列と相補的であるDNA配列への再アニーリングのエネルギー特性が、(I)DNA-DNA塩基対合を形成すること、(II)RNA-DNA塩基対を切断すること、(III)新たに侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される、請求項3に記載の方法。
【請求項5】
(V)ミスマッチにわたる塩基対合、(VI)Cas9タンパク質との相互作用、および/または(VII)追加のヒューリスティクスであって、結合寿命、侵入の程度、侵入するガイドRNAの安定性、またはCas9切断活性に対するgRNA侵入の、他の算出される/シミュレーションされる特性に関する追加のヒューリスティクスのうちの少なくとも1つから、エネルギー的考察を決定することをさらに含む、請求項4に記載の方法。
【請求項6】
前記完全長gRNAが、約15から20個のヌクレオチドを含む、請求項1または2に記載の方法。
【請求項7】
Mが、1から20である、請求項1または2に記載の方法。
【請求項8】
Mが、4から10である、請求項7に記載の方法。
【請求項9】
前記RNAセグメントが、プロトスペーサー-ターゲティング配列を補完する2から15個のヌクレオチドを含む、請求項1または2に記載の方法。
【請求項10】
Nが、1から20である、請求項1または2に記載の方法。
【請求項11】
Nが、3から10である、請求項10に記載の方法。
【請求項12】
前記RNAセグメントおよび/またはプロトスペーサー-ターゲティング配列が、二次構造を提供する、請求項1または2に記載の方法。
【請求項13】
前記二次構造が、前記プロトスペーサー-ターゲティング配列を、前記RNAセグメントと部分的にハイブリッド形成させることによって形成される、請求項12に記載の方法。
【請求項14】
前記二次構造が、前記最適化されたgRNAによるプロトスペーサー二重鎖またはオフターゲット二重鎖の侵入を妨害することによって、Cas9によるDNA結合または切断を調節する、請求項13に記載の方法。
【請求項15】
前記二次構造が、前記RNAセグメントの全体または一部を、プロトスペーサー-ターゲティング配列もしくはセグメントの5’末端のヌクレオチド、プロトスペーサー-ターゲティング配列もしくはセグメントの中央のヌクレオチド、および/またはプロトスペーサー-ターゲティング配列もしくはセグメントの3’末端のヌクレオチドにハイブリッド形成させることによって形成される、請求項12に記載の方法。
【請求項16】
前記二次構造が、ヘアピンである、請求項12に記載の方法。
【請求項17】
前記二次構造が、室温または37℃で安定である、請求項12に記載の方法。
【請求項18】
前記二次構造の全平衡自由エネルギーが、室温または37℃で約2kcal/mol未満である、請求項12に記載の方法。
【請求項19】
前記RNAセグメントが、プロトスペーサー-ターゲティング配列またはセグメントの少なくとも2つのヌクレオチドとハイブリッド形成する、またはこれらのヌクレオチドと共に非標準塩基対を形成する、請求項12に記載の方法。
【請求項20】
前記非標準塩基対が、rU-rGである、請求項19に記載の方法。
【請求項21】
前記最適化されたgRNAが、細胞において、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と共に使用される、請求項1または2に記載の方法。
【請求項22】
前記二次構造が、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系内の最適化されたgRNAを保護して、細胞内での分解を予防する、請求項1または2に記載の方法。
【請求項23】
1~20個のヌクレオチドが、リンカー内でランダム化される、請求項1または2に記載の方法。
【請求項24】
1~20個のヌクレオチドが、RNAセグメント内でランダム化される、請求項1または2に記載の方法。
【請求項25】
ステップ(g)が、X回繰り返され、それによって、X個のgRNAが産生され、それぞれのX個のgRNAを用いてステップ(e)が繰り返され、ここで、Xは、0から20である、請求項1または2に記載の方法。
【請求項26】
前記侵入速度論および寿命が、動的モンテカルロ法またはGillespieアルゴリズムを使用して算出される、請求項1または2に記載の方法。
【請求項27】
前記侵入速度論が、前記ガイドRNAが、前記プロトスペーサー二重鎖に、前記プロトスペーサーが完全に侵入されるような完全な侵入まで侵入する速度、および/または、gRNAに結合されたプロトスペーサーDNAのセグメントが、その相補鎖から置き換えられ、そのPAM近位領域から、完全な侵入まで、ヌクレオチドごとにgRNAに結合するにつれて伸長する速度である、請求項1または2に記載の方法。
【請求項28】
前記設計基準が、特異性、結合寿命の調節、および/または推定される切断特異性を含む、請求項1または2に記載の方法。
【請求項29】
前記設計基準が、オンターゲット部位に対する完全長gRNAの結合寿命以上の結合寿命、および/または、オフターゲット部位に対する完全長gRNAの結合寿命以下の結合寿命を有する最適化されたgRNAを含む、請求項28に記載の方法。
【請求項30】
前記設計基準が、少なくとも3つのオフターゲット部位であって、最も近いオフターゲット部位であると予測される、またはオンターゲット部位に対する最も高い同一性を有すると予測されるオフターゲット部位に対する完全長gRNAの結合寿命以下の結合寿命を有する最適化されたgRNAを含む、請求項29に記載の方法。
【請求項31】
前記設計基準が、オフターゲット部位での完全長gRNAまたは切り詰め型gRNAの寿命または切断速度以下であるオフターゲット部位での寿命または切断速度、および/または、完全長gRNAまたは切り詰め型gRNAの予測されるオンターゲット活性率の10%超である、予測されるオンターゲット活性率を含む、請求項28に記載の方法。
【請求項32】
前記最適化されたgRNAが、surveyorアッセイ、次世代シーケンシング技術、またはGUIDE-Seqを使用して、ステップi)において試験される、請求項1または2に記載の方法。
【請求項33】
前記最適化されたgRNAが、オフターゲット部位での結合を最小にし、かつプロトスペーサー配列に結合させるように設計される、請求項1または2に記載の方法。
【請求項34】
前記オフターゲット部位が、公知であるまたは予測されるオフターゲット部位である、請求項1または2に記載の方法。
【請求項35】
前記完全長gRNAが、哺乳類遺伝子を標的にする、請求項1または2に記載の方法。
【請求項36】
前記標的遺伝子が、内在性標的遺伝子または導入遺伝子を含む、請求項1または2に記載の方法。
【請求項37】
前記標的遺伝子が、疾患関連遺伝子を含む、請求項1または2に記載の方法。
【請求項38】
前記標的遺伝子が、DMD、EMX1、またはVEGFA遺伝子である、請求項1または2に記載の方法。
【請求項39】
前記VEGFA遺伝子が、VEGFA1またはVEGFA3である、請求項38に記載の方法。
【請求項40】
請求項1または2に記載の方法によって産生された最適化されたgRNA。
【請求項41】
前記gRNAが、オンターゲット部位とオフターゲット部位とを、これらの部位間の最小熱力学的エネルギー差を用いて識別することができる、請求項40に記載の最適化されたgRNA。
【請求項42】
前記最適化されたgRNAが、プロトスペーサーへのストランド侵入を調節する、請求項40に記載の最適化されたgRNA。
【請求項43】
前記最適化されたgRNAが、配列番号149~315、321~323、および326~329のうちの少なくとも1つのヌクレオチド配列を含む、請求項40に記載の最適化されたgRNA。
【請求項44】
請求項40に記載の最適化されたgRNAをコードする単離されたポリヌクレオチド。
【請求項45】
請求項44に記載の単離されたポリヌクレオチドを含むベクター。
【請求項46】
請求項44に記載の単離されたポリヌクレオチドまたは請求項45に記載のベクターを含む細胞。
【請求項47】
請求項44に記載の単離されたポリヌクレオチド、請求項45に記載のベクター、または請求項46に記載の細胞を含むキット。
【請求項48】
標的細胞または対象におけるエピゲノム編集の方法であって、細胞または対象を、有効量の請求項40に記載の最適化されたgRNA分子および融合タンパク質と接触させる工程を含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【請求項49】
標的細胞または対象における部位特異的DNA切断の方法であって、細胞または対象を、有効量の請求項40に記載の最適化されたgRNA分子および融合タンパク質またはCas9タンパク質と接触させる工程を含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【請求項50】
細胞におけるゲノム編集の方法であって、前記細胞に、有効量の請求項40に記載の最適化されたgRNA分子および融合タンパク質を投与する工程を含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【請求項51】
前記ゲノム編集が、変異遺伝子を修正することまたは導入遺伝子を挿入することを含む、請求項50に記載の方法。
【請求項52】
変異遺伝子を修正することが、変異遺伝子を欠失させること、再編成させること、または置き換えることを含む、請求項51に記載の方法。
【請求項53】
変異遺伝子を修正することが、ヌクレアーゼ介在性の非相同末端結合または相同組換え修復を含む、請求項51に記載の方法。
【請求項54】
細胞における遺伝子発現を調節する方法であって、前記細胞を、有効量の請求項40に記載の最適化されたgRNA分子および融合タンパク質と接触させる工程を含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【請求項55】
少なくとも1つの標的遺伝子の遺伝子発現が、前記少なくとも1つの標的遺伝子の遺伝子発現レベルが前記少なくとも1つの標的遺伝子についての正常な遺伝子発現レベルと比較して増大または低下される場合に調節される、請求項54に記載の方法。
【請求項56】
前記融合タンパク質が、dCas9ドメインおよび転写活性化因子を含む、請求項54に記載の方法。
【請求項57】
前記融合タンパク質が、配列番号2のアミノ酸配列を含む、請求項56に記載の方法。
【請求項58】
前記融合タンパク質が、dCas9ドメインおよび転写抑制因子を含む、請求項54に記載の方法。
【請求項59】
前記融合タンパク質が、配列番号3のアミノ酸配列を含む、請求項58に記載の方法。
【請求項60】
前記融合タンパク質が、dCas9ドメインおよび部位特異的ヌクレアーゼを含む、請求項54に記載の方法。
【請求項61】
前記最適化されたgRNAが、ポリヌクレオチド配列によってコードされ、レンチウイルスベクターにパッケージングされる、請求項48~60のいずれか1項に記載の方法。
【請求項62】
前記レンチウイルスベクターが、前記gRNAをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む発現カセットを含む、請求項61に記載の方法。
【請求項63】
前記最適化されたgRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターが、誘導性である、請求項62に記載の方法。
【請求項64】
前記レンチウイルスベクターが、前記Cas9タンパク質または融合タンパク質をコードするポリヌクレオチド配列をさらに含む、請求項61に記載の方法。
【請求項65】
前記少なくとも1つの標的遺伝子が、疾患関連遺伝子である、請求項48~64のいずれか1項に記載の方法。
【請求項66】
前記標的細胞が、真核細胞である、請求項48~65のいずれか1項に記載の方法。
【請求項67】
前記標的細胞が、哺乳類細胞である、請求項48~66のいずれか1項に記載の方法。
【請求項68】
前記標的細胞が、HEK293T細胞である、請求項48~67のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、その内容全体が参照によって本明細書に組み込まれる、2015年8月25日に出願された米国仮特許出願第62/209,466号明細書に対する優先権を主張する。
【0002】
政府の権利の陳述
本発明は、アメリカ国立科学財団(National Science Foundation)によって拠出された連邦政府助成金第MCB1244297号および第CBET1151035号、ならびにアメリカ国立衛生研究所(National Institutes of Health)によって拠出された連邦政府助成金第F32GM11250201号、第R01DA036865号、および第DP2OD008586号に基づいて、政府支援の下で行われた。政府は、本発明に対する一定の権利を有する。
【0003】
本開示は、最適化されたガイドRNA(gRNA)、ならびに、標的結合特異性の増大とオフターゲット結合の低下を有する前記gRNAを設計および使用する方法を対象とする。
【背景技術】
【0004】
RNAガイド型エンドヌクレアーゼ、特にタンパク質Cas9は、これが、一本鎖「ガイドRNA」分子によって、ほとんどあらゆる配列を有するDNAを切断するように誘導することができるので、潜在的な「完璧なゲノム工学ツール」として称賛されている。この能力は、いくつかの新たに出現しつつある生物および医療用途のために近年利用され、非常に大きな興奮とその将来の使用の有望性がもたらされている。しかし、実際のゲノム工学は、オフターゲットDNAが、意図せずに損傷および変異されるようにならないように、厳密なDNA配列を選択的に標的にしてこれを切断する能力の、極めて正確な制御を必要とする。
【0005】
Cas9は、原核生物のII型CRISPR(クラスター化され、規則的に間隔が空いた、短い回文配列リピート)のエンドヌクレアーゼ-侵入する外来DNAに対するCRISPR関連の(Cas)応答である。この応答中、Cas9は、最初にCRISPR RNA(crRNA):トランス活性化crRNA(tracrRNA)二重鎖によって結合され、次いで、crRNAの可変の20bpセグメントと相補的な20塩基対(bp)の「プロトスペーサー」部位を含有するDNAを切断するように誘導される(図1A)。一本鎖-ガイドRNA(sgRNA)と結合されて、Cas9-sgRNA複合体は、プロトスペーサーの直後にプロトスペーサー隣接モチーフ(PAM、本明細書では「TGG」)が続くという条件で、標的とされるDNA内の20bpの「プロトスペーサー」配列と結合する。結合後、Cas9エンドヌクレアーゼは、プロトスペーサー内に二本鎖切断(三角形)を生じる。基本的に、Cas9が標的にすることができる配列に対する唯一の制約は、化膿レンサ球菌(S.pyogenes)Cas9の場合の「NGG」などの短いプロトスペーサー隣接モチーフ(PAM)が、外来DNA分子におけるプロトスペーサー部位のすぐ後に続かなければならないことである。結晶学的および生化学的実験の解析は、プロトスペーサー結合および切断における特異性が、最初にCas9タンパク質自体によるPAM部位の認識、続いて結合したRNA複合体によるストランド侵入、およびプロトスペーサーとの直接的ワトソン-クリック塩基対合を通して与えられることを示唆している(図1A)。
【0006】
Cas9が、ほとんどあらゆるDNA部位を標的にするために、一本鎖RNAヘアピンによってモジュール的に「プログラム」される能力は、近年、CRISPR-Cas9系がいくつかの異種生物工学用途に再び充てられた後、非常に大きな興奮をもたらしてきた。特に、crRNA:tracrRNA二重鎖の必須成分と組み合わせられて単一の機能性分子となる、一本鎖-ガイドRNA(sgRNA)ヘアピンが設計されている。このsgRNAを用いて、Cas9は、著しく容易なゲノム工学のために、様々な生物に導入されて、インビボで標的とされる二本鎖切断を生じることができる。ヌクレアーゼ-null Cas9(D10A/H840A、「dCas9」としても公知である)およびキメラdCas9誘導体はまた、プロモーター部位でまたはプロモーター部位の近くで、インビボで、標的とされる結合を介する遺伝子発現を変更するために、また、標的とされるエピジェネティック修飾を導入するために使用されている。
【0007】
実際には、Cas9によるオフターゲット結合および切断が、その潜在的使用に悪影響を及ぼす可能性があるので、問題である。Cas9/dCas9活性の特異性を改善するために、かなりの取り組みが行われている。第1に、最も幅広い取り組みは、ゲノム内に類似の他の配列を伴わない標的配列の賢明な選択によって大きく達成されるが、最近の調査では、これらの方法は、オフターゲット切断を予測する能力が不十分で実施されることが判明した。さらに、PAMまたはプロトスペーサー結合における特異性を調節または増大することが判明した点変異の導入を通して、タンパク質それ自体を直接的に操作することに対する取り組みが行われている。二本鎖DNA切断を実施するのではなくDNAの一本鎖に切れ目を入れるだけのCas9誘導体も、互いに二本鎖切断を生じるのに十分に近い複数の部位でオフターゲットに切れ目が入れられる可能性が極めて稀であるだろうという仮定の下で、一対で(「ペアードニッカーゼ」)使用される。最後に、より大きな特異性を実現することを目指して、ガイドRNAバリアントそれ自体を産生するいくつかの研究が行われている。プロトスペーサー以降のさらなるヌクレオチドを補完するためにガイドRNAへの5’-伸長部が付加される、以前の取り組みは、インビボでのCas9切断特異性の増大を示さなかった。それどころか、これは、生細胞内で消化されて、ほぼその標準の長さまで戻ってしまった(図1A)。ゲノム工学における用途について、特に治療用途については、オフターゲットDNAが損傷されない、また、不正な変異が起こらないように、遺伝子ターゲティングにおける極度の特異性が必要とされる。しかし、実際には、その潜在的使用に悪影響を及ぼす可能性がある、Cas9によるオフターゲット結合および切断のいくつかの報告が存在している。
【発明の概要】
【発明が解決しようとする課題】
【0008】
CRISPR/Cas9系を使用して、オフターゲット結合を減少させる、かつヌクレアーゼ特異性を増大させる必要性が、依然として存在する。
【課題を解決するための手段】
【0009】
本発明は、最適化されたガイドRNA(gRNA)を産生する方法を対象とする。この方法は、a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;d)第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の5’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の5’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;g)リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む。
【0010】
本発明は、最適化されたガイドRNA(gRNA)を産生する方法を対象とする。この方法は、a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;d)第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の3’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の3’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;g)リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む。
【0011】
本発明は、上に記載した方法によって産生される最適化されたgRNAを対象とする。
【0012】
本発明は、上に記載した最適化されたgRNAをコードする単離されたポリヌクレオチドを対象とする。
【0013】
本発明は、上に記載した単離されたポリヌクレオチドを含むベクターを対象とする。
【0014】
本発明は、上に記載した単離されたポリヌクレオチドまたは上に記載したベクターを含む細胞を対象とする。
【0015】
本発明は、上に記載した単離されたポリヌクレオチド、上に記載したベクター、または上に記載した細胞を含むキットを対象とする。
【0016】
本発明は、標的細胞または対象におけるエピゲノム編集の方法を対象とする。この方法は、細胞または対象を、有効量の上に記載した最適化されたgRNA分子および融合タンパク質と接触させる工程を含み、前記融合タンパク質は、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む。
【0017】
本発明は、標的細胞または対象における部位特異的DNA切断の方法を対象とする。この方法は、細胞または対象を、有効量の上に記載した最適化されたgRNA分子および融合タンパク質またはCas9タンパク質と接触させる工程を含み、前記融合タンパク質は、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む。
【0018】
本発明は、細胞におけるゲノム編集の方法を対象とする。この方法は、細胞に、有効量の上に記載した最適化されたgRNA分子および融合タンパク質を投与する工程を含み、前記融合タンパク質は、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む。
【0019】
本発明は、細胞における遺伝子発現を調節する方法を対象とする。この方法は、細胞を、有効量の上に記載した最適化されたgRNAおよび融合タンパク質と接触させる工程を含み、前記融合タンパク質は、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む。
【図面の簡単な説明】
【0020】
図1A-1D】ヒトAAVS1遺伝子座由来の単一のストレプトアビジン標識されたDNA分子内のプロトスペーサー配列で結合したdCas9-sgRNAの原子間力顕微鏡観察(AFM)像を示す(図1B)。一連の完全に相補的および部分的に相補的なプロトスペーサー配列を伴って設計された、AAVS1由来の(図1C)または遺伝子改変されたDNA基質(図1D)に沿った、Cas9/dCas9-sgRNAによって占有された結合されたDNAの割合を示す。縦軸は、それぞれの重要な特徴がそれぞれの基質上に位置する(23bp)セグメントを表す。
図2A-2B】ガイドRNAバリアントによる結合親和性および特異性の調節を示す。図2Aは、その5’末端から2ヌクレオチドが切り詰められた一本鎖ガイドRNA(tru-gRNA、紫色)に結合されたdCas9の模式図を示す。図2Bは、5’末端伸長部を伴い、そのターゲティング領域のPAM遠位結合セグメントを有するヘアピンを形成する一本鎖ガイドRNA(hp-gRNA、青色)に結合されたdCas9の模式的な提案される機構を示す。
図2C-2D】図2Cは、遺伝子改変されたDNA基質(図1D参照)に沿った、tru-gRNA(紫色、n=257)を伴うdCas9についての単一部位結合親和性(KA)を示す。破線は、比較のための、dCas9-sgRNAの単一部位親和性を示す。図2Dは、プロトスペーサーの最後の6個(hp6-gRNA、青色)または10個(hp10-gRNA、緑色)のPAM遠位ヌクレオチドと相補的なヌクレオチドとオーバーラップする5’-ヘアピンを有するガイドRNAを伴うdCas9についての単一部位結合親和性(KA)を示す。
図3A-3B】Cas9が、プロトスペーサー配列にマッチしつつある部位に結合するにつれて、進行性の立体構造遷移を受けることを示す。図3Aは、DNA基質に沿った、Cas9/dCas9によって占有された結合されたDNAの割合を示し、色は、その構造に従って(アライメント後の平均2乗差によって(本文参照))クラスター化されたCas9/dCas9の集団を表す。Cas9/Cas9構造特性の部位特異的分析のために使用されたDNA上の異なる特徴は、非特異的配列(α;「20MM」)、プロトスペーサー内に10個のPAM遠位ミスマッチを含有する部位(β、「10MM」)、プロトスペーサー内に5個のPAM遠位ミスマッチを含有する部位(γ、「5MM」)、または完全なプロトスペーサー部位(dCas9またはCas9についてそれぞれδまたはε;「0MM」)として標識した。図3Bは、各タンパク質が割り当てられるクラスターによって色分けされた、観察されたCas9/dCas9の高さに対する体積を示す。破線は、凝集体からなる可能性が高い領域(右上)またはストレプトアビジン標識を吸着した近くのDNA(左下)を線で示す。比較のために-ストレプトアビジン末端標識の平均高さ:0.92nm±0.006nm(SEM);ストレプトアビジン末端標識の平均体積:0.110χ104nm3±0.002χ104nm3(SEM);n=1941。
図3C-3D】主要なクラスターのアンサンブル平均を、図3Cに示し、これらが表すクラスター化された構造に従って色分けした。図3Dは、基質上の各特徴に結合した、sgRNA(赤丸、Cas9については赤色標識、およびdCas9については青色標識)またはtru-gRNA(紫色丸)を伴うCas9/dCas9の平均体積および高さを示す。tru-gRNAを伴うdCas9が、5MMおよび10MM部位の最初の3または8個のPAM遠位ミスマッチ(ここで、それぞれ、「3MM」および「8MM」と標識される)と相互作用すると予想されるに過ぎないことに留意されたい。平均体積および高さの標準誤差については、表2を参照のこと。sgRNAを伴うCas9/dCas9については、各特徴でのその構造特性は、統計的に異なる(δ-ε、α-ε:p<0.05;α-β:p<0.005;β-γ、γ-δ:p<<0.0005。ホテリングのT2検定)。
図4A-4C】異なるガイドRNAバリアントについての、安定的に結合されたCas9内の、Rループの安定性または侵入するガイドRNAと共にプロトスペーサー二重鎖によって形成される構造の差を明らかにする、動的モンテカルロ(Kinetic Monte Carlo)(KMC)実験を示す。図4Aは、KMC実験についてのガイドRNA(赤色)によるプロトスペーサー(緑色)のストランド侵入の模式図を示す。Rループは強調されている。侵入についての遷移速度(vf、速度について、m→m+1、ここでは、mは、ストランド侵入の程度、すなわち、同等には、Rループの長さである)、または二重鎖再アニーリング(vr、速度について、m→m-1)は、最近接DNA:DNAおよびRNA:DNAハイブリダイゼーションエネルギーの関数である。詳細については、本文および補足の方法を参照されたい。図4Bは、Rループが、KMC実験から得られるsg-RNA(赤色)またはtru-gRNA(紫色)に対して、「平衡状態で」サイズmのものである時間比を示す(シミュレーションは、それぞれm=20または18で開始した)。シミュレーションは、t≧10,000(任意単位)まで実行する。図4Cは、完全な侵入後の、sgRNA(赤色)およびtru-gRNA(紫色)についてのRループ「揺らぎ(breathing)」の動的モンテカルロ時間経過を示す(シミュレーションは、それぞれm=20または18で開始した)。アスタリスクは、シミュレーションの開始位置を強調する。(挿入図)Rループが≧16bp長である、それぞれの寿命のヒストグラム。
図4D図4Dは、AFM画像化および動的モンテカルロ(KMC)実験(本文参照)の結果に基づく、Cas9/dCas9特異性を支配している機構についての提案されるモデルを示す。Cas9/dCas9は、PAMに結合し、ガイドRNAが、PAM隣接プロトスペーサー二重鎖に侵入する。このストランド侵入中、ガイドRNAは、プロトスペーサーの相補鎖を置き換えることになる。侵入と二重鎖の再アニーリングとの競合が、動的な(「揺らぎ」)Rループ構造をもたらす。プロトスペーサー-ガイドRNA相互作用の第14~第17部位の安定性は、第19および第20部位での結合によって劇的に増大し、Cas9/dCas9の立体構造変化を促進し、Cas9におけるDNA切断が容認される。
図5A-5B】動的モンテカルロ(KMC)実験が、ガイドRNA構造に応じて、ミスマッチ(MM)を横断する、また、プロトスペーサーに侵入する能力の差を明らかにすることを示す。図5A~5Bは、KMC実験から得られる侵入中のsgRNA(図5A)またはtru-gRNA(図5B)についての、Rループ長mの、時間による占有比を示す(m=10で開始、アスタリスクによって強調)。白色のXのものは、ミスマッチの位置を示す。シミュレーションは、t≧10,000(任意単位)まで実行し、結果は、100回の試験を平均する。
図5C図5Cは、sgRNA(赤色)およびtru-gRNA(紫色)についての、m=14(矢印)での、ミスマッチ部位を有するストランド侵入(m=10で開始する)についての代表的なKMC時間経過を示す。sgRNAは、ミスマッチを迂回した後、大いに安定的に侵入されるが、tru-gRNAは、そのRループの固有の不安定性の結果として、ミスマッチの後方で繰り返し再捕捉される(図4参照)。
図6A-6B】PAM遠位領域(≧第10プロトスペーサー部位)内の単一のrG・dG、rC・dC、rA・dA、およびrU・dTミスマッチを含有する標的部位での、実験による(Hsu et al.(2013)Nature biotechnology,31,827-832)切断頻度が、動的モンテカルロ実験から決定されるRループの安定性と相関することを示す。図6Aは、部位mで開始されるストランド侵入中の、Cas9切断頻度と、部位mでのRループの安定性(ガイドRNAが、部位mでプロトスペーサーに結合したままである時間の比、本文参照)との間の相関のlog10(p値)を示す。(i)部位m=10からm=14での安定性が、ガイドRNAがミスマッチを横断する前にプロトスペーサーから剥がれ落ちることとなる確率と高度に逆相関する(図15B)のに対して、(ii)部位m=14からm=17は、切断活性を誘発する立体構造変化と関係がある(AFM画像から)。色は、相関係数に対応する。図6Bは、実験による切断頻度が、推定されるガイドRNA-プロトスペーサー平衡状態の結合自由エネルギー(ΔG°37)(左)と有意には相関しないが、ストランド侵入中の部位m=14の安定性(右)とは相関することを示す。エラーバーは、部位m=14での平均占有時間の標準誤差である。これらの動的モンテカルロ実験については、max(t)=100(任意単位)である。カラーバーは、ミスマッチ(MM)部位の位置を示すために使用される。
図7A-7C】ガイドRNAの構造がCas9/dCas9特異性に影響を与える、提案される機構の概要を示す。図7Aは、一本鎖ガイドRNA(sgRNA)については、RNA(これは、プロトスペーサーの第18~第20部位に結合する)の最初のわずか数個ヌクレオチドだけが、Rループ揺らぎおよびプロトスペーサーの第14~第17部位での結合を安定化し、切断を可能にするための活性な状態への効率的な立体構造遷移を可能にすることを示す。しかし、これらの塩基によって付与される、この安定性の増大は、ミスマッチ部位での一過性の安定化、および切断を可能にする立体構造変化を可能にする。多くの場合では、ミスマッチを横断して、Rループは、安定的に完全に侵入されたままである。図7Bは、最初のわずか数個(ここでは2個)のヌクレオチドだけが切り詰められたガイドRNA(tru-gRNA)については、Rループ(かなりの不安定性を特徴とする)の安定性の低下が、活性な立体構造を維持する確率を低下させることを示す。プロトスペーサー内にミスマッチ部位が存在する場合、Rループの不安定性によって、ミスマッチの後方で迅速にかつ繰り返し「再捕捉」されて、この部位で大きく妨害されるようになることが確実になる。図7Cは、プロトスペーサーおよびプロトスペーサー以降の隣接部位を標的にするためのガイドRNAの5’末端の「単純な」伸長部が、インビボで消化されて、ほぼsgRNAの長さまで戻ってしまうことが判明した(図7A)のに対して、「PAM遠位」ターゲティングセグメントに対して相補的な5’-ヘアピンを有するガイドRNA(hp-gRNA)は、侵入前にCas9/dCas9の構造内で保護されたままであることが予想されることを示す。hp-gRNAによるPAM部位との結合およびストランド侵入の開始後、完全なプロトスペーサーに結合されると、ヘアピンが開き、完全なストランド侵入が起こることができる。標的部位にPAM遠位ミスマッチが存在する場合、ヘアピンが閉じたままであることが、エネルギー的に、より好都合であり、ストランド侵入は妨害される。Cas9-hp-gRNAがRNAを切断する能力は、まだ確認されないままである。
図8A-8B】精製されたCas9(図8A)およびdCas9(図8B)生成物(公称分子量:160kDa)のSDSゲル中の発現されたCas9およびdCas9の純度を示す。溶離されたバンドは、生成物が約95%純粋であることを示す。
図9A-9C】DNAに結合されるCas9/dCas9の追加の画像を示す。A)AAVs1プロトスペーサー配列に対する相同性を含有しない基質に対するdCas9の結合分布(図1と比較されたい)(n=443)。重ね合わせられているのは、PAM部位の累積分布(CDF)(CDFPAM、黒色)、およびdCas9によって結合された塩基のCDF(赤色、CDFCas9)である。ストレプトアビジンタグ(DNA選択のための基準)を伴うオーバーラップによって導入される人工産物、および露出した平滑末端へのDNAの結合(非特異的結合の、予想される増大がもたらされる)を避けるために、比較は、各末端から100塩基で開始する。B)タンパク質結合のCDFと、PAM部位のCDFとの間の絶対値差分Dn。破線は、2つの分布の適合度についてのコルモゴロフ-スミルノフ(Kolmogorov-Smirnov)基準である。C)MATLABを使用して、G、A、T、およびCの確率が同じである100,000個のランダムに産生された配列からの、結合のCDFを、PAM分布のCDFと比較した。垂直な赤線は、実験によるSup(Dn)であり、実験によるdCas9結合が、実験によるPAM分布と、産生された配列の71.20%よりもぴったりとマッチしたことを示す。
図10A-10C】プロトスペーサー配列に対する相同性を含有しない「ナンセンス」基質に対する結合(>3bp)を示す。(A)dCas9単独の画像。(B)第1のピークに対してガウスフィット(Gaussian fit)を単独で用いて画像化されたdCas9の体積(左)および高さ(右)のヒストグラム(n=423)。ガウスフィットから:平均高さは、1.746nm(95%信頼度:1.689nm~1.802nm)、標準偏差0.441nmであり、平均体積は、1302nm3(95%信頼度:1266nm3-1337nm3)、標準偏差259.1nm3である(ここではdCas9は、その結合チャネル内にDNAを有しないので、その記録される体積が、AFMプローブに対する力学的抵抗性の低下が原因で、不自然に低いように見える可能性があることに留意されたい)。高さは、各タンパク質を囲む10ピクセル領域の中央値に対して相対的に測定し、体積は、局所性のバックグラウンド高さの標準偏差の2倍を超える近接する特徴として記録した。(C)一価のストレプトアビジンで一端を標識されているDNAに結合したdCas9の追加の代表的な画像。
図11A-11D】RNAに結合したdCas9-sgRNA、およびタンパク質構造特性のプロセシングの例の代表的な図を示す。図11Aは、遺伝子改変されたDNAに結合したdCas9の代表的な広視野画像を示す。図11Bは、囲み領域のクローズアップを示す。白色矢印は、一価のストレプトアビジンであり、赤色矢印は、dCas9タンパク質である。図11C-11Dは、原画像からの抽出の例(図11C)およびCas9/dCas9構造の単離(図11D)を示す。この抽出を、DNAに結合した単離されたそれぞれのタンパク質に対して繰り返し、次いで、その平均平方される形態的な差を最小にするために、平行移動、回転、および反転の繰り返しを通してして、対ごとに整列させた。これらの最小化された平均平方差から、距離行列を構成し、Laio and Rodriguez(2014)Science(New York,N.Y.),344,1492-1496の方法に従って各タンパク質をクラスター化し、次いで、DNA上のその部位に戻してクラスター化することによって、構造の集団をマッピングした(図2A図10A~10C)。
図12A】そのそれぞれの結合部位にマッピングされたCas9/dCas9-sgRNAの特性を示す。上段:すべての実験条件について、体積(左)、最大高さ(中央)、および(平均平方差によってクラスター化された、アライメント後の構造(右、本文参照)の積み上げヒストグラム。集団は、下の散布図と同様に、ビン化された体積、高さ、または構造クラスターに従って着色する。抽出したCas9/dCas9分子の結合分布(図10A-10C)は、完全なデータセットの結合分布(図1C~1D、図8A~8B)とぴったりとマッチし、これは、選択手順が不偏であり、選択されたタンパク質が、データセット全体の代表であることを示す。下段:(左)ビン化された体積によって色分けされたすべてのCas9/dCas9の最大高さ、(中央)最大高さ、および(右)構造クラスターに対する、体積の散布図。
図12B】そのそれぞれの結合部位にマッピングされたCas9/dCas9-sgRNAの特性を示す。上段:すべての実験条件について、体積(左)、最大高さ(中央)、および(平均平方差によってクラスター化された、アライメント後の構造(右、本文参照)の積み上げヒストグラム。集団は、下の散布図と同様に、ビン化された体積、高さ、または構造クラスターに従って着色する。抽出したCas9/dCas9分子の結合分布(図10A-10C)は、完全なデータセットの結合分布(図1C~1D、図8A~8B)とぴったりとマッチし、これは、選択手順が不偏であり、選択されたタンパク質が、データセット全体の代表であることを示す。下段:(左)ビン化された体積によって色分けされたすべてのCas9/dCas9の最大高さ、(中央)最大高さ、および(右)構造クラスターに対する、体積の散布図。
図13】そのそれぞれの結合部位にtru-gRNAおよびhp-gRNAを伴うCas9/dCas9の構造特性を示す。その構造に従ってクラスター化されたCas9/dCas9の集団を表す色(図3C参照)を伴う、遺伝子改変されたDNA基質に沿ってCas9/dCas9によって占有された、結合されたDNAの比率。タンパク質構造は、(アライメント後の平均2乗差によって(本文参照))それが最もよく似ているsgRNAを伴うdCas9/Cas9に従って分類した。参考のための、遺伝子改変されたDNA基質上の、完全なプロトスペーサー部位の位置:144~167bp;10MM(8MM)部位の位置:452~465bp;5MM(3MM)部位の位置:592~610bp。sgRNAを伴うdCas9/Cas9で見られるのと同様の傾向が見られた:dCas9が、ミスマッチとマッチしつつある部位に結合するにつれて、最も大きい(黄色)群を用いてクラスター化される集団の比率が増大するが、この影響は、tru-gRNAでは抑制され、完全なプロトスペーサー部位であっても、集団のかなりの比率が、より小さい(緑色および青色)集団を用いてクラスター化される。hp10-gRNAに関する影響は、特に顕著であり、オフターゲット部位に対する親和性が乏しいことが強調される。
図14A-14C】ガイドRNAによるDNAプロトスペーサーのストランド侵入およびPAM遠位ミスマッチを有するプロトスペーサーに侵入したRNAの推定される結合安定性のモデルを示す。図14Aは、ガイドRNAによるDNAプロトスペーサーのストランド侵入の模式的モデルを示す。図4Aも参照のこと。ガイドRNAは、m=1の時に解離されると想定される。図14Bは、異なる数の近接するPAM遠位ミスマッチを有するプロトスペーサーについての、最初にm=5まで侵入したガイドRNAについての解離時間の算出された確率分布を示す。これらの解離時間の長さは、その部位でのdCas9結合傾向の近似値とみなすことができる。アスタリスクは、m=5までの最初の侵入後、最初に完全には侵入できないガイドRNAの集団についての解離時間を強調する。侵入したRNAは、15個のPAM遠位ミスマッチ(15MM)を有するプロトスペーサー部位で高度に不安定であり、実験では本発明者らは、これらの部位に結合したCas9/dCas9をめったに観察することがない(図1D)。10または5個のPAM遠位ミスマッチ(10MMおよび5MM)を有するプロトスペーサー部位での(解離前の)侵入したRNAは、15MM部位でのRNAよりもかなり長く(2桁以内の差ではあるが)とどまることが推測され;本発明者らは、その結合傾向が、AFM実験における完全なプロトスペーサー部位(0MM)とほぼ等しいまたはこれよりも低いことを発見している。その確率密度関数は、m状態間の配列特異的遷移速度(vfおよびvr、補足の方法を参照のこと)を使用する、記載されている通りの(Sakmann et al.(1995)Single-channel recording,Springer;2nd ed.)Qマトリクス法を使用して算出した。図14Cは、異なる数のPAM遠位ミスマッチを有するプロトスペーサーでのRNA-プロトスペーサー結合の推定される半減期の検討が、侵入したRNAの安定性が類似であるおよそ3つの型が存在することを示唆することを示す:>11個のPAM遠位ミスマッチを有するもの(低安定性);3から11個のPAM遠位ミスマッチを有するもの(中程度の安定性);および<3個のPAM遠位ミスマッチを有するもの(高安定性)。これらの結果は、AFMを介して観察される遺伝子改変された基質上のdCas9の分布と質的に類似である(図1D)。
図15】sgRNAおよびtru-gRNAによるストランド侵入中にミスマッチ部位を横断、シミュレーションされる平均初到達時間を示す。ミスマッチ部位の異なる位置についての、sgRNA(青色)およびtru-gRNA(赤色)によるストランド侵入中にミスマッチ部位を横断、シミュレーションされる(動的モンテカルロ)平均初到達時間。エラーバーは、記録された初到達時間の標準偏差である。ボックス中のプロトスペーサーの配列(AAVS1部位)。
図16A-16B】Cas9切断頻度(Hsu et al.(2013)Nature Biotechnology,31,827-832)と、動的モンテカルロから得られるRループ安定性の測定値との間の相関を示す。図16Aは、Rループ部位の安定性(動的モンテカルロより、本文参照)と、Hsu et al.(2013)Nature Biotechnology,31,827-832による実験の切断頻度との間の相関の、統計的検出力および強度が、シミュレーション長さの増大(最大(t)=100から最大(t)=1000、任意単位)に伴って低下することを示す。この結果は、ストランド侵入の速度論が、オフターゲット切断速度の重要な予測因子であり得ることを示唆する。図16Bは、Rループがサイズmのものである時間の比と、動的モンテカルロ試験が、侵入鎖がミスマッチを横断する前に解離することとなることを予測する確率との相関を示す。部位10ないし14~15での結合は、ミスマッチを横断する前の解離の確率と、非常に強く逆相関し(約0.5~0.85)、一方で、AFM画像化実験から、本発明者らは、部位約≧16での結合が、Cas9/dCas9の立体構造変化と関係があることを発見する。
図17】オンターゲット活性を比較する、ディープシークエンシングデータの概要を示す。
図18】特異性増大を比較する、ディープシークエンシングデータの概要を示す。
図19】プロトスペーサー1、ジストロフィンを示し;レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、Tru-gRNA 19ntを示し;レーン4は、Tru-gRNA 18ntを示し;レーン5は、Tru-gRNA 17ntを示し;レーン6は、Tru-gRNA 16ntを示し;レーン7は、Hp-gRNA 4bpを示し;レーン8は、Hp-gRNA 5bpを示し;レーン9は、Hp-gRNA 6bpを示し;レーン10は、Hp-gRNA 7bpを示し;レーン11は、Hp-gRNA 8bpを示し;レーン12は、Hp-gRNA 9bp、ヘアピン1(レーン12、9nt hp)-GtgagtaggttcgCCTACTCAGACTGTTACTC(配列番号335)(ここで、tgagtaggは、ヘアピンの部分であり、下線部は、ヘアピンループである)を示す。
図20】プロトスペーサー1、ジストロフィン、内部ループを示す。
図21A】ディープシークエンシング実験(NuPackソフトウェア一式を使用)のために使用された、hp-gRNAのプロトスペーサー-ターゲティングセグメントの5’末端の、計算された二次構造を示す。色は、平衡状態の二次構造中に存在する各ヌクレオチドの確率である。
図21B】ディープシークエンシング実験(NuPackソフトウェア一式を使用)のために使用された、hp-gRNAのプロトスペーサー-ターゲティングセグメントの5’末端の、計算された二次構造を示す。色は、平衡状態の二次構造中に存在する各ヌクレオチドの確率である。
図22】ジストロフィン、インデル率、(すべての部位)を示す。
図23】ジストロフィン、オンターゲット/合計(オフターゲットs)を示す。
図24】プロトスペーサー2、EMX1を示し;レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、Tru-gRNAを示し;レーン4は、10bpのhp-gRNAを示し;レーン5は、6bpのhp-gRNA、ヘアピン1を示す。転換-Surv_OT1=DS_OT2;Surv_OT53=DS_OT3。
図25A】プロトスペーサー2、EMX1、tru-hps、内部ループを示す。
図25B】プロトスペーサー2、EMX1、tru-hps、内部ループを示す。
図26A-26B】ヘアピン構造を示す。図26Aは、6bpの5’-ヘアピンであるヘアピン1を示す。図26Bは、18nt(切り詰め型)gRNA上の5bpの5’-ヘアピンであるヘアピン2を示す。
図26C】ヘアピン構造を示す。図26Cは、3bpの5’-ヘアピンであるヘアピン3を示す。
図27】EMX1、インデル率(すべての部位)を示す。
図28】EMX1、インデル率(低率・オフターゲット)を示す。
図29】EMX1、オンターゲット/合計(オフターゲット)を示す
図30】プロトスペーサー3、VEGFA1を示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、Tru-gRNAを示し;レーン4は、10bpのhp-gRNAを示し;レーン5は、6bpのhp-gRNAを示す。
図31A】プロトスペーサー3、VEGFA1:pam近位ヘアピンを示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、hp-gRNA1を示し;レーン4は、hp-gRNA2を示し;レーン5は、hp-gRNA3を示し;レーン6は、hp-gRNA4を示し;レーン7は、hp-gRNA5を示し;レーン8は、hp-gRNA6を示す。
図31B】プロトスペーサー3、VEGFA1:pam近位ヘアピンを示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、hp-gRNA1を示し;レーン4は、hp-gRNA2を示し;レーン5は、hp-gRNA3を示し;レーン6は、hp-gRNA4を示し;レーン7は、hp-gRNA5を示し;レーン8は、hp-gRNA6を示す。
図32】プロトスペーサー3、VEGFA1:pam近位ヘアピンを示す。
図33】プロトスペーサー3、VEGF1、内部ループを示す。レーン1は、対照を示し;レーン2は、完全を示し;レーン3は、2nt hpを示し;レーン4は、3nt hp、ヘアピン5を示し;レーン5は、4nt hpを示す。
図34A-34B】ヘアピン1、2、および失敗した3についてのディープシークエンシング実験を示す。図25Aは、ヘアピン4-オンターゲット活性を維持しながらオフターゲット部位2を識別するために設計された、計算によって得られたヘアピンを示す。図25Bは、ヘアピン5-4bpの5’-ヘアピン(gRNAは通常、重要な3’二次構造を有する)を示す。
図35】VEGF1、インデル率、(すべての部位)を示す。
図36】VEGF1、インデル率、(低率・オフターゲット)を示す。
図37】VEGF1、オンターゲット/合計(オフターゲット)を示す。
図38】プロトスペーサー4、VEGFA3を示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、Tru-gRNAを示し;レーン4は、3bpのhp-gRNAを示し;レーン5は、4bpのhp-gRNAを示し;レーン6は、5bpのhp-gRNAを示し;レーン7は、6bpのhp-gRNAを示し、レーン8は、10bpのhp-gRNAを示す。
図39A】gRNA4、VEGFA3:pam近位ヘアピンを示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、hp-gRNA1を示し;レーン4は、hp-gRNA2を示し;レーン5は、hp-gRNA3を示し;レーン6は、hp-gRNA4を示し、レーン7は、hp-gRNA5を示し;レーン8は、hp-gRNA6を示す。
図39B】gRNA4、VEGFA3:pam近位ヘアピンを示す。レーン1は、GFP対照を示し;レーン2は、完全なgRNAを示し;レーン3は、hp-gRNA1を示し;レーン4は、hp-gRNA2を示し;レーン5は、hp-gRNA3を示し;レーン6は、hp-gRNA4を示し、レーン7は、hp-gRNA5を示し;レーン8は、hp-gRNA6を示す。
図40A-40B】図40Aは、ヘアピンの1~4bpヘアピンターゲティング3’-領域を示す。図40Bは、G-Uゆらぎ対を有するヘアピンの2~4bpヘアピンターゲティング3’-領域を示す。
図40C】G-Uゆらぎ対(バリアント設計)を有するヘアピンの3~4bpヘアピンターゲティング3’-領域を示す。
図41】VEGF3、インデル率(すべての部位)を示す。
図42】VEGF3、インデル率(低率・オフターゲット)を示す。
図43】VEGF3、オンターゲット/合計(オフターゲット)を示す。
図44A-44B】図44Aは、EMX1遺伝子を標的にするように設計されたヘアピンを示す。図44Bは、図44AのヘアピンのEMX1-sg1配列を示す。
図44C】特異性に対するプロトスペーサー長の低下およびヘアピン長の増大の効果を示す。
図45A】DNA/RNA配列を示す。
図45B】DNA/RNA配列を示す。
図45C】DNA/RNA配列を示す。
図45D】DNA/RNA配列を示す。
図46】Surveyorアッセイを説明する図を示す。
図47】ミスマッチまたは切り詰め型crRNAに対するAsCpf1およびLbCpf1の耐性、およびミスマッチ塩基を単独で含有するcrRNAを使用するAsCpf1およびLbCpf1による内在性遺伝子改変を示す。T7E1アッセイによって決定される活性;エラーバー、s.e.m.;n=3(Kleinstiver et al.,Nat.Biotech.34:869-875から引用)。
図48】オフターゲット活性をなくすために完全長gRNAの3’末端にヘアピンが付加される、V型CRISPR系と共に使用されたhp-gRNAについてのsurveyorアッセイ結果を示す。
【発明を実施するための形態】
【0021】
本明細書で開示するのは、部位特異的DNAターゲティングおよびエピゲノム遺伝子編集および/または転写調節、例えばDNA切断および遺伝子活性化または抑制のための組成物および方法である。本発明は、既存のバイオテクノロジー基礎構造に容易に組み込むことができ、かつ、正確なDNA配列を特異的に標的にする能力をずっと保ちつつオフターゲット活性の制御された低下をもたらす、ヘアピン構造(hpgRNA)を有する最適化されたガイドRNAを設計および使用するためのモジュール的方法を対象とする。本明細書に記載した方法は、他の利用可能な方法よりも著しく優れた方法を実施するために、最適化されたgRNAを設計することに対する新規の手法を提供し、これは、特に、高度に改善された性能についてますます向上した他のタンパク質特異的な手段と組み合わせて使用することができる。
【0022】
開示された方法および最適化されたgRNAは、RNAガイド型ゲノム工学を実施するための既に整っている現在の方法論および基礎構造に容易に適用されるという大きな利点を有する。いくつかの実施態様では、Cas9、dCas9、またはCpf1は、細胞内で最適化されたgRNAの転写物をコードするベクターと共に、ウイルスベクターを使用して細胞に送達される。本発明は、現在の標準の手法によって容易に適合させることができる、最適化されたgRNAをコードするベクターに対する数個の追加のヌクレオチドしか必要としないであろう。切り詰め型ガイドRNA(tru-gRNA)のように、最適化されたgRNAまたはhpgRNAは、特異性をさらに改善するために、例えばペアードニッカーゼ、またはエンドヌクレアーゼ自体の他の改変形と組み合わせて使用することができる。一連の実験は、インビトロで実施し、これは、本明細書に記載した方法を使用して産生した最適化されたgRNAの使用が、入手可能な最善のgRNA選択肢と比較して、DNA結合における特異性を増大させたことを示した(図2参照)。この最適化されたgRNAの使用は、RNAガイド型エンドヌクレアーゼによるオフターゲット活性が生じる部位である傾向がある、数個のミスマッチDNA配列しか含有しない標的での活性をなくすまたはかなり弱める。この最適化されたgRNAはまた、ガイドRNAに対する最善の公知の改善であってもオフターゲット活性を誘発することが公知である部位での、哺乳類細胞における切断活性の特異性を提供する。本発明は、ガイドRNAの構造設計を技術的に変化させることによって、RNAガイド型エンドヌクレアーゼ、特にCas9によるオフターゲット活性を低下させるための、一般に適用可能な方法である。
【0023】
1.定義
用語「含む」、「含まれる」、「有すること」、「有する」、「することができる」、「含有する」、およびこれらの異形は、本明細書で使用する場合、追加の作用または構造可能性を排除しない、制約のない移り変わる語句、用語、または単語であることが意図される。単数形「a」、「an」、および「the」には、文脈によって他に明確に指示しない限り、複数の指示内容が含まれる。本開示はまた、明確に説明してもしなくても、本明細書で提供される実施態様または要素を「含む」、「~からなる」、および「本質的に~からなる」、他の実施態様を意図する。
【0024】
本明細書の数値範囲の列挙については、それぞれその間にある数が、同じ程度の正確性で、明確に意図される。例えば、6~9の範囲については、6および9に加えて、数値7および8が意図され、範囲6.0~7.0については、数値6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、および7.0が、明確に意図される。
【0025】
別段の定義がない限り、本明細書で使用されるすべての技術および科学用語は、当業者によって普通に理解されるのと同じ意味を有する。矛盾する場合は、本文書が、定義を含めて、優先されることとなる。好ましい方法および材料は、以下に記載するが、本明細書に記載したものと類似または等価な方法および材料を、本明細書の実施または試験において使用することができる。本明細書に言及したすべての刊行物、特許出願、特許、および他の参考文献の全体を、参照によって本明細書に組み込む。本明細書に開示した材料、方法、および実施例は、実例に過ぎず、限定的であることを意図されない。
【0026】
本明細書で互換的に使用される「アデノ随伴ウイルス」または「AAV」は、ヒトおよびいくつかの他の霊長類の種を感染させる、パルボウイルス(Parvoviridae)科のディペンドウイルス(Dependovirus)属に属する、小さいウイルスを指す。AAVは、現在、疾患を引き起こすことが知られておらず、したがって、ウイルスは、非常に穏やかな免疫応答を引き起こす。
【0027】
本明細書で使用される「結合領域」は、Cas9などのヌクレアーゼによって認識および結合される、ヌクレアーゼ標的領域内の領域を指す。
【0028】
本明細書で使用される「クロマチン」は、ヒストンと結合した染色体DNAの組織化された複合体を指す。
【0029】
本明細書で互換的に使用される「Cis-調節エレメント」または「CRE」は、近くの遺伝子の転写を調節するノンコーディングDNAの領域を指す。CREは、それが調節する遺伝子(1または複数)の近傍に見られる。CREは、一般的に、転写因子に対する結合部位として機能することによって、遺伝子転写を調節する。CREの例としては、プロモーター、エンハンサー、スーパーエンハンサー、サイレンサー、インスレーター、および遺伝子座制御領域が挙げられる。
【0030】
本明細書で互換的に使用される「クラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats)」および「CRISPR」は、配列決定された細菌のおよそ40%および配列決定された古細菌の90%のゲノム内に見られる複数の短いダイレクトリピートを含有する遺伝子座を指す。
【0031】
本明細書で使用される「コード配列」または「コードする核酸」は、タンパク質をコードするヌクレオチド配列を含む核酸(RNAまたはDNA分子)を意味する。コード配列は、核酸が投与される個人または哺乳類の細胞における発現を誘導することが可能なプロモーターおよびポリアデニル化シグナルを含めた調節エレメントに作動可能に連結された開始および停止シグナルをさらに含むことができる。コード配列は、コドン最適化することができる。
【0032】
本明細書で使用される「相補体」または「相補的」は、核酸が、核酸分子のヌクレオチドまたはヌクレオチド類似体の間に、Watson-Crick(例えばA-T/UおよびC-G)またはフーグスティーン塩基対合を生じることができることを意味する。「相補性」は、互いに逆平行に整列させた時に各位置のヌクレオチド塩基が相補的となるような、2つの核酸配列間に共有される性質を指す。
【0033】
本明細書で使用される「修正すること」、「ゲノム編集すること」、および「修復すること」は、切り詰め型タンパク質をコードするまたはタンパク質をまったくコードしない変異遺伝子を、完全長の機能性または部分的に完全長の機能性タンパク質発現が得られるように変化させることを指す。変異遺伝子を修正することまたは修復することは、変異を有する遺伝子の領域を置き換えること、または変異遺伝子全体を、相同組換え修復(homology-directed repair)(HDR)などの修復機構を用いて、変異を有しない遺伝子のコピーと置き換えることを含むことができる。変異遺伝子を修正することまたは修復することはまた、遺伝子内の二本鎖切断をもたらし、次いでこの遺伝子を非相同末端結合(NHEJ)を使用して修復することによって、未成熟終止コドン、異所性スプライス受容部位、または異所性スプライス供与部位をもたらすフレームシフト変異を修復することを含むことができる。NHEJは、修復中に少なくとも1つの塩基対を付加または欠失させることができ、これは、適切な読み枠を修復するおよび未成熟終止コドンを除去することができる。変異遺伝子を修正することまたは修復することはまた、異所性スプライス受容部位またはスプライスドナー配列を破壊することを含むことができる。変異遺伝子を修正することまたは修復することはまた、2つのヌクレアーゼ標的部位間のDNAを除去することによって、適切な読み枠を修復するために、同じDNA鎖上での2種のヌクレアーゼの同時作用によって、非必須遺伝子セグメントを欠失させることと、NHEJによってDNA切断を修復することとを含むことができる。
【0034】
本明細書で使用される「脱メチル化酵素」は、核酸、タンパク質(特にヒストン)、および他の分子から、メチル(CH3-)基を除去する酵素を指す。脱メチル化酵素は、エピジェネティック修飾機構において重要である。脱メチル化酵素タンパク質は、DNAおよびヒストン上で生じるメチル化レベルを制御することによって、ゲノムの転写調節を変更し、次に、生物内の特定の遺伝子座でのクロマチン状態を調節する。「ヒストン脱メチル化酵素」は、ヒストンからメチル基を除去するメチル化酵素を指す。様々な基質に対して作用する、また、細胞機能において様々な役割を果たす、いくつかのファミリーのヒストン脱メチル化酵素が存在する。Fe(II)依存性リジン脱メチル化酵素は、JMJC脱メチル化酵素であり得る。JMJC脱メチル化酵素は、JumonjiC(JmjC)ドメインを含有するヒストン脱メチル化酵素である。JMJC脱メチル化酵素は、ヒストン脱メチル化酵素のKDM3、KDM4、KDM5、またはKDM6ファミリーのメンバーであり得る。
【0035】
本明細書で互換的に使用される「DNase I高感受性部位」または「DHS」は、転写因子およびクロマチンモディファイヤー(遠位標的遺伝子発現を調整するp300が含まれる)に対するドッキング部位を指す。
【0036】
本明細書で互換的に使用される「ドナーDNA」、「ドナー鋳型」、および「修復鋳型」は、対象となる遺伝子の少なくとも一部分を含むする二本鎖DNA断片または分子を指す。ドナーDNAは、完全に機能性のタンパク質または部分的に機能性のタンパク質をコードすることができる。
【0037】
本明細書で使用される「内在性遺伝子」は、生物、組織、または細胞内に起源をもつ遺伝子を指す。内在性遺伝子は、その正常なゲノムおよびクロマチン状況であり、かつその細胞に対して異種ではない細胞に固有である。こうした細胞遺伝子には、例えば、動物遺伝子、植物遺伝子、細菌遺伝子、原生動物遺伝子、真菌遺伝子、ミトコンドリア遺伝子、および葉緑体遺伝子が含まれる。本明細書で使用される「内在性標的遺伝子」は、最適化されたgRNA、およびCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系によって標的とされる内在性遺伝子を指す。
【0038】
本明細書で使用される「エンハンサー」は、複数の活性化因子およびリプレッサー結合部位を含有する、ノンコーディングDNA配列を指す。エンハンサーは、長さが50bpから1500bpの範囲であり、近位、すなわちプロモーターに対して5’上流、調節される遺伝子のいずれかのイントロン内、または遠位、すなわちその遺伝子座から離れた隣接遺伝子のイントロンまたは遺伝子間領域内、または異なる染色体上の領域であり得る。1個を超えるエンハンサーが、プロモーターと相互作用することができる。同様に、エンハンサーは、連結に制限されずに2つ以上の遺伝子を調節することができ、隣接遺伝子を「スキップ」して、より離れた遺伝子を調節することができる。転写調節は、プロモーターが存在する染色体とは異なる染色体に位置するエレメントを伴うことができる。隣接遺伝子の近位エンハンサーまたはプロモーターは、より遠位のエレメントを動員するためのプラットフォームとして働くことができる。
【0039】
本明細書で互換的に使用される「デュシェンヌ型筋ジストロフィー」または「DMD」は、筋変性および最終的に死をもたらす、劣性遺伝の致死的なX連鎖性障害を指す。DMDは、一般的な遺伝性の単一遺伝子性疾患であり、男性の3500人に1人に発症する。DMDは、ジストロフィン遺伝子のナンセンスまたはフレームシフト変異をもたらす、遺伝性変異または自然突然変異の結果である。DMDを引き起こすジストロフィン変異の大多数は、ジストロフィン遺伝子において読み枠を破壊して早期翻訳終結を引き起こす、エクソンの欠失である。DMD患者は、一般的に、小児期に自分自身の身体を支える能力を失い、10代の間に次第に筋力が低下するようになり、20代で死亡する。
【0040】
本明細書で使用される「ジストロフィン」は、筋線維の細胞骨格を細胞膜を通して周囲の細胞外基質に連結するタンパク質複合体の一部である、棒状の細胞質タンパク質を指す。ジストロフィンは、筋細胞の完全性および機能の調節を担う細胞膜のジストログリカン複合体に、構造安定性を提供する。本明細書で互換的に使用されるジストロフィン遺伝子または「DMD遺伝子」は、遺伝子座Xp21の2.2メガ塩基である。一次転写物は、約2,400kbであり、成熟したmRNAは、約14kbである。79エクソンが、3500超のアミノ酸であるタンパク質をコードする。
【0041】
本明細書で使用される「エクソン51」は、ジストロフィン遺伝子の51番目のエクソンを指す。エクソン51は、DMD患者では、フレーム破壊欠失に頻繁に隣接しており、オリゴヌクレオチドに基づくエクソンスキッピングについての臨床試験において標的とされている。エクソン51スキッピング化合物エテプリルセンについての臨床試験は、最近、ベースラインと比較して平均47%のジストロフィン陽性線維を伴う、48週にわたる有意な機能性の利益を報告した。エクソン51の変異は、NHEJに基づくゲノム編集による永続的な修正に理想的に適している。
【0042】
本明細書で互換的に使用される「フレームシフト」または「フレームシフト変異」は、1つ以上のヌクレオチドの付加または欠失がmRNA内のコドンの読み枠のずれをもたらす、遺伝子変異の種類を指す。読み枠のずれは、ミスセンス変異または未成熟終止コドンなどの、タンパク質翻訳でのアミノ酸配列の変更をもたらす可能性がある。
【0043】
本明細書で互換的に使用される「完全長gRNA」または「標準のgRNA」は、長さが一般的に20ヌクレオチドである「骨格」と、プロトスペーサー-ターゲティング配列またはセグメントとを含むgRNAを指す。
【0044】
本明細書で使用される「機能性」および「完全に機能性」は、生物活性を有するタンパク質を説明する。「機能性遺伝子」は、機能性タンパク質に翻訳されるmRNAに転写される遺伝子を指す。
【0045】
本明細書で使用される「融合タンパク質」は、元々は別のタンパク質をコードしている2つ以上の遺伝子の連結を介して作製されたキメラタンパク質を指す。融合体遺伝子の翻訳は、元のタンパク質のそれぞれに由来する機能特性をもつ単一のポリペプチドをもたらす。
【0046】
本明細書で使用される「遺伝子コンストラクト」は、タンパク質をコードするヌクレオチド配列を含むDNAまたはRNA分子を指す。コード配列には、核酸分子が投与される個人の細胞における発現を誘導することが可能なプロモーターおよびポリアデニル化シグナルを含めた調節エレメントに作動可能に連結された開始および停止シグナルが含まれる。本明細書で使用する場合、用語「発現可能な形態」は、個人の細胞内に存在する場合にコード配列が発現されることとなるような、タンパク質をコードするコード配列に、作動可能に連結された必須の調節エレメントを含有する遺伝子コンストラクトを指す。
【0047】
本明細書で使用される「遺伝性疾患」は、ゲノム内の1つ以上の異常によって、部分的にまたは完全に、直接的にまたは間接的に引き起こされる疾患、特に、生まれつき存在する状態を指す。異常は、変異、挿入、または欠失であり得る。異常は、遺伝子のコード配列またはその調節配列に影響を与える可能性がある。遺伝性疾患は、限定はされないが、DMD、血友病、嚢胞性線維症、ハンチントン舞踏病、家族性高コレステロール血症(LDL受容体欠損)、肝芽腫、ウィルソン病、先天性肝性ポルフィリン症、肝代謝の遺伝性の障害、レッシュ・ナイハン症候群、鎌状赤血球貧血、地中海貧血症、色素性乾皮症、ファンコニ貧血、網膜色素変性症、毛細血管拡張性運動失調症、ブルーム症候群、網膜芽細胞腫、およびテイ・サックス病であり得る。
【0048】
本明細書で使用される「ゲノム」は、細胞または生物内に存在する遺伝子または遺伝材料の完全なセットを指す。ゲノムには、DNA、またはRNAウイルス中のRNAが含まれる。ゲノムには、遺伝子、(コード領域)、非コードDNAの両方、およびミトコンドリアおよび葉緑体のゲノムが含まれる。
【0049】
本明細書で互換的に使用される「ガイドRNA」、「gRNA」、「一本鎖gRNA」、および「sgRNA」は、Cas9-結合またはCpf1-結合のために必須の「骨格」配列と、改変されることとなるゲノム標的を定義するユーザー定義の「スペーサー」または「ターゲティング配列」(本明細書ではプロトスペーサー-ターゲティング配列またはセグメントとも呼ばれる)からなる、短い合成RNAを指す。本明細書で互換的に使用される「hpgRNA」、「hp-gRNA」、および「最適化されたgRNA」は、プロトスペーサー-ターゲティング配列またはセグメントの全体または一部と共に二次構造を形成することができる、5’末端または3’末端のいずれかに追加のヌクレオチドを有するgRNAを指す。
【0050】
「ヒストンアセチル化酵素」または「HAT」は、本明細書で互換的に使用され、ヒストンタンパク質上の保存リジンアミノ酸を、アセチルCoAからアセチル基を転移させることによってアセチル化して、ε-N-アセチルリジンを形成する酵素を指す。DNAは、ヒストンの周囲に巻き付けられ、アセチル基をヒストンに転移させることによって、遺伝子をオンオフさせることができる。一般に、ヒストンアセチル化は、転写活性化につながり、また、ユークロマチンと関係があるので、遺伝子発現を増大させる。ヒストンアセチル化酵素はまた、核内受容体および他の転写因子などの非ヒストンタンパク質をアセチル化して、遺伝子発現を促進することもできる。
【0051】
本明細書で互換的に使用される「ヒストン脱アセチル化酵素」または「HDAC」は、ヒストン上のε-N-アセチルリジンアミノ酸からアセチル基(O=C-CH3)を除去して、ヒストンにDNAを、よりきつく巻き付けさせる、あるクラスの酵素を指す。HDACは、その標的(これには非ヒストンタンパク質も含まれる)ではなくその機能を言うために、リジン脱アセチル化酵素(KDAC)とも呼ばれる。
【0052】
本明細書で互換的に使用される「ヒストンメチルトランスフェラーゼ」または「HMT」は、1つ、2つ、または3つのメチル基の、ヒストンタンパク質のリジンおよびアルギニン残基への転移を触媒する、ヒストン修飾酵素(例えば、ヒストン-リジンN-メチルトランスフェラーゼおよびヒストン-アルギニンN-メチルトランスフェラーゼ)を指す。メチル基の付着は、ヒストンH3およびH4上の主に特定のリジンまたはアルギニン残基で起こる。
【0053】
本明細書で互換的に使用される「相同組換え修復」または「HDR」は、大抵は細胞周期のG2およびS期において、DNAの相同の断片が核内に存在する場合に、二本鎖DNA損傷を修復するための、細胞における機構を指す。HDRは、修復を誘導するためのドナーDNA鋳型を使用し、また、ゲノムに対する特定の配列変化(全遺伝子の標的とされる付加を含めて)を作り出すために使用することができる。ドナー鋳型が、部位特異的ヌクレアーゼと共に、例えばCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と共に提供される場合、細胞機構は、相同組換えによって切断を修復することとなり、これは、DNA切断の存在下で、数桁増強される。相同のDNA断片が存在しない場合、代わりに非相同末端結合が起こり得る。
【0054】
本明細書で使用される「ゲノム」は、細胞または生物内に存在する遺伝子または遺伝材料の完全なセットを指す。ゲノムには、DNA、またはRNAウイルス中のRNAが含まれる。ゲノムには、遺伝子、(コード領域)、非コードDNAの両方、およびミトコンドリアおよび葉緑体のゲノムが含まれる。
【0055】
本明細書で使用される「ゲノム編集」は、遺伝子を変化させることを指す。ゲノム編集は、変異遺伝子を修正することまたは修復することを含むことができる。ゲノム編集は、変異遺伝子または正常遺伝子などの遺伝子をノックアウトすることを含むことができる。ゲノム編集は、対象となる遺伝子を変化させることによって、疾患を治療する、または筋肉修復を増強するために使用することができる。
【0056】
2つ以上の核酸またはポリペプチド配列の状況で本明細書で使用される「同一な」または「同一性」は、これらの配列が、特定の領域にわたって同一である、特定の割合の残基を有することを意味する。その割合は、2つの配列を最適に整列させ、これらの2つの配列を特定の領域にわたって比較し、両方の配列において同一な残基が存在する位置の数を決定してマッチ位置の数を出し、マッチ位置の数を、特定の領域における位置の総数で割り、結果に100をかけて、配列同一性の割合を出すことによって算出することができる。2つの配列が異なる長さのものである、または整列によって1つ以上の粘着末端が生じて比較の特定の領域に単一の配列のみが含まれる場合、単一の配列の残基は、計算の分母に含まれるが、分子には含まれない。DNAおよびRNAを比較する場合、チミン(T)とウラシル(U)は、等しいとみなすことができる。同一性は、手作業で、またはBLASTまたはBLAST 2.0などのコンピュータ配列アルゴリズムを使用することによって実施することができる。
【0057】
本明細書で使用される「インスレーター」は、エンハンサーとプロモーターとの間の相互作用を阻止する、遺伝子境界エレメントを指す。エンハンサーとプロモーターとの間に存在することによって、インスレーターは、その後続の相互作用を阻害することができる。インスレーターは、エンハンサーが影響を与えることができる遺伝子のセットを決定することができる。インスレーターは、染色体上の2つの隣接遺伝子が非常に異なる転写パターンを有し、かつ一方の機構を誘発または抑制することが隣接遺伝子を阻害しない場合に必要とされる。インスレーターはまた、トポロジカル関連ドメイン(topological association domain)(TAD)の境界でクラスター形成することが判明しており、また、ゲノムを「染色体近傍(neighborhood)」-調節が存在するゲノム領域に分配する役割を有することができる。インスレーター活性は、主として、CTCFを含めたタンパク質によって介在されるDNAの3D構造によって生じると考えられる。インスレーターは、複数の機構を通して機能する可能性が高い。多くのエンハンサーは、転写活性化中にプロモーター領域と物理的にごく近い場所に置かれるDNAループを形成する。インスレーターは、プロモーター-エンハンサーループが形成されるのを防止するDNAループの形成を促進することができる。バリア・インスレーターは、発現抑制された遺伝子から活発に転写される遺伝子へのヘテロクロマチンの広がりを防止することができる。
【0058】
本明細書で使用される「侵入」は、プロトスペーサーに対して相補的であるDNA配列に結合するgRNAによるものなどの、標的遺伝子の標的領域内のプロトスペーサー領域でのDNA二重鎖の破壊を指す。
【0059】
本明細書で使用される「侵入速度論」は、侵入が進行する速度を指す。侵入速度論は、ガイドRNAが二重鎖に、プロトスペーサーが完全に侵入されるような「完全な侵入」まで侵入する速度、または、ガイドRNAに結合されたプロトスペーサーDNAのセグメントが、その相補鎖から置き換えられ、そのPAM近位領域から、完全な侵入まで、ヌクレオチドごとにガイドRNAに結合するにつれて伸長する速度を指すことができる。
【0060】
本明細書で使用される「寿命」は、gRNAが標的遺伝子の標的領域内の領域に侵入されたままである期間を指す。
【0061】
本明細書で使用される「遺伝子座制御領域」は、遠位クロマチン部位での連鎖遺伝子の発現を増強する、広域cis-調節エレメントを指す。これは、コピー数に依存する方式で機能し、赤血球細胞におけるβ-グロビン遺伝子の選択的発現において見られるように、組織特異的である。遺伝子の発現レベルは、LCRおよび遺伝子近位エレメント、例えば、プロモーター、エンハンサー、およびサイレンサーによって改変することができる。LCRは、クロマチン修飾、コアクチベーター、および転写複合体を動員することによって機能する。その配列は、多くの脊椎動物では保存され、特定の部位の保存は、機能における重要性を示唆する可能性がある。
【0062】
本明細書で互換的に使用される「ミスマッチの」または「MM」は、G/TまたはA/C対合を含むミスマッチ塩基を指す。ミスマッチは、通常、G2中の塩基の互変異性化が原因である。この損傷は、ミスマッチによってもたらされる変形を認識すること、鋳型および非鋳型鎖を決定すること、および間違って組み込まれた塩基を切除すること、およびこれを正しいヌクレオチドと置き換えることによって修復される。
【0063】
本明細書で使用される「調節する」は、活性のあらゆる変更、例えば、調節する、下方調節する、上方調節する、低下させる、阻害する、増大させる、減少させる、非活性化する、または活性化するなどを意味することができる。
【0064】
本明細書で互換的に使用される「変異遺伝子」または「変異した遺伝子」は、検出可能な変異を受けている遺伝子を指す。変異遺伝子は、遺伝子の正常な伝達および発現に影響を与える、遺伝材料の喪失、獲得、または交換などの変化を受けている。本明細書で使用される「破壊された遺伝子」は、未成熟終止コドンをもたらす変異を有する、変異遺伝子を指す。破壊された遺伝子産物は、完全長の破壊されていない遺伝子産物と比較すると切り詰め型である。
【0065】
本明細書で使用される「非相同末端結合(NHEJ)経路」は、相同の鋳型を必要とせずに、切断末端を直接的に連結することによって、DNA内の二本鎖切断を修復する経路を指す。NHEJによる、鋳型に依存しないDNA末端の再連結は、DNA切断点にランダムな微小挿入および微小欠失(インデル)を導入する、確率的な、誤りがちな修復プロセスである。この方法は、標的とされる遺伝子配列を意図的に破壊する、欠失させる、または読み枠を変更するために使用することができる。NHEJは、一般的に、修復を誘導するための、マイクロホモロジーと呼ばれる短い相同のDNA配列を使用する。これらのマイクロホモロジーは、しばしば、二本鎖切断の末端の単鎖オーバーハング中に存在する。このオーバーハングが完璧に適合する場合、NHEJは通常、切断を正確に修復し、一方で、ヌクレオチドの喪失をもたらす不正確な修復も起こり得るが、これは、オーバーハングが適合しない場合にははるかに一般的である。
【0066】
本明細書で使用される「正常遺伝子」は、遺伝材料の喪失、獲得、または交換などの変化を受けていない遺伝子を指す。正常遺伝子は、正常な遺伝子伝達および遺伝子発現を受ける。
【0067】
本明細書で使用される「ヌクレアーゼ介在性のNHEJ」は、cas9などのヌクレアーゼが二本鎖DNAを切断した後に開始されるNHEJを指す。
【0068】
本明細書で使用される「核酸」または「オリゴヌクレオチド」または「ポリヌクレオチド」は、共有結合によって共に連結された、少なくとも2つのヌクレオチドを意味する。単鎖の描写はまた、相補鎖の配列も定義する。したがって、核酸は、描写した単鎖の相補鎖も包含する。所与の核酸と同一の目的のために、核酸の多くのバリアントを使用することができる。したがって、核酸は実質的に同一な核酸およびその相補体も包含する。単鎖は、ストリンジェントなハイブリダイゼーション条件下で標的配列とハイブリッド形成することができるプローブを提供する。したがって、核酸は、ストリンジェントなハイブリダイゼーション条件下でハイブリッド形成するプローブも包含する。
【0069】
核酸は、一本鎖または二本鎖であり得るし、二本鎖配列と一本鎖配列の両方の部分を含有することもできる。核酸は、DNA、ゲノムDNAとcDNAの両方、RNA、またはハイブリッドであり得、ここでは、核酸は、デオキシリボヌクレオチドとリボヌクレオチドの組み合わせ、およびウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン ヒポキサンチン、イソシトシン、およびイソグアニンを含めた塩基の組み合わせを含有することができる。核酸は、化学合成方法によって、または組換え方法によって得ることができる。
【0070】
本明細書で使用される「オンターゲット部位」は、gRNAが標的とすることが意図されるゲノム内の標的領域または配列を指す。理想的には、オンターゲット部位は、標的DNA配列に対する完璧な相同性(100%の同一性または相同性)を有し、ゲノム内の他の場所には相同性は存在しない。
【0071】
本明細書で使用される「オフターゲット部位」は、オンターゲット部位またはgRNAの標的領域に対する部分的な相同性または部分的な同一性を有するが、gRNAが標的とするように意図または設計されていない、ゲノムの領域を指す。
【0072】
本明細書で使用される「作動可能に連結された」は、遺伝子の発現が、遺伝子と空間的に連結されたプロモーターの制御下であることを意味する。プロモーターは、その制御下の遺伝子の5’(上流)または3’(下流)に位置することができる。プロモーターと遺伝子との距離は、プロモーターが由来する遺伝子においてプロモーターが制御するプロモーターと遺伝子との距離とほぼ同じであり得る。当技術分野で公知であるように、この距離のバリエーションは、プロモーター機能の喪失を伴わずに適応させることができる。
【0073】
本明細書で互換的に使用される「p300タンパク質」、「EP300」、または「E1A結合タンパク質p300」は、EP300遺伝子によってコードされる、アデノウイルスE1A関連細胞p300転写コアクチベータータンパク質を指す。p300は、広範な細胞過程に関与する、高度に保存されるアセチルトランスフェラーゼである。p300は、クロマチンリモデリングを介して転写を調節するヒストンアセチル化酵素として機能し、細胞増殖および細胞分化の過程と関与する。
【0074】
本明細書で使用される「部分的に機能性」は、変異遺伝子によってコードされ、かつ、機能性タンパク質よりも低い生物活性を有するが、非機能性タンパク質よりも高い生物活性を有する、タンパク質を説明する。
【0075】
本明細書で互換的に使用される「未成熟終止コドン」または「アウトオブフレーム終止コドン」は、野生型遺伝子には通常見られない位置での終止コドンをもたらす、DNAの配列内のナンセンス変異を指す。未成熟終止コドンは、完全長型のタンパク質と比較して切断されているまたは短いタンパク質をもたらす可能性がある。
【0076】
本明細書で使用される「初代細胞」は、生きている組織(例えば生検材料)から直接的に採取した細胞を指す。初代細胞は、インビトロで、成長のために樹立することができる。これらの細胞は、集団倍加をほとんど受けておらず、したがって、継代(腫瘍または人工的に不死化させた)細胞株と比較して、これらが由来する組織の主要な機能要素を、より良く表し、したがって、インビボ状態に対する、より典型的なモデルとなる。初代細胞は、マウスまたはヒトなどの様々な種から採取することができる。
【0077】
本明細書で互換的に使用される「プロトスペーサー配列」または「プロトスペーサーセグメント」は、CRISPR細菌適応免疫系におけるCas9ヌクレアーゼまたはCpf1ヌクレアーゼによって標的とされるDNA配列を指す。CRISPR/Cas9系では、一般的に、プロトスペーサー配列の後に、プロトスペーサー隣接モチーフ(PAM)が続き;PAMは、5’末端にある。CRISPR/Cpf1系では、PAMの後に、プロトスペーサー配列が続き;PAMは、3’末端にある。
【0078】
本明細書で互換的に使用される「プロトスペーサー-ターゲティング配列」または「プロトスペーサー-ターゲティングセグメント」は、プロトスペーサー配列に対応し、かつCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の、プロトスペーサー配列へのターゲティングを容易に、gRNAのヌクレオチド配列を指す。
【0079】
本明細書で使用される「プロモーター」は、細胞における核酸の発現を付与する、活性化する、または促進することが可能である、合成または天然由来の分子を意味する。プロモーターは、発現をさらに促進するための、かつ/または、空間的発現および/または同じものの時間的発現を変更するための、1つ以上の特異的な転写調節配列を含むことができる。プロモーターはまた、転写の開始部位から数千塩基対も離れて位置することができる、またはゲノム中のいずれかの遠位エンハンサーまたはリプレッサーエレメントを含むことができる。プロモーターは、ウイルス、細菌、真菌、植物、昆虫、および動物を含めた起源から得ることができる。プロモーターは、発現が起こる細胞、組織、または器官に対して、または発現が起こる発生段階に対して、または生理的ストレス、ホルモン、毒素、薬物、原体、金属イオン、または誘発物質などの外部刺激に応答して、遺伝子成分の発現を恒常的または変動的に調節することができる。プロモーターの代表的な例としては、バクテリオファージT7プロモーター、バクテリオファージT3プロモーター、SP6プロモーター、lacオペレーター-プロモーター、tacプロモーター、SV40後期プロモーター、SV40初期プロモーター、RSV-LTRプロモーター、CMV IEプロモーター、SV40初期プロモーターまたはSV40後期プロモーター、およびCMV IEプロモーターが挙げられる。
【0080】
本明細書で使用される「プロトスペーサー隣接モチーフ」または「PAM」は、CRISPR細菌適応免疫系における、Cas9によって標的とされるDNA配列の直後の、またはCpf1ヌクレアーゼによって標的とされるDNA配列の直前のDNA配列を指す。PAMは、侵入するウイルスまたはプラスミドの成分であるが、細菌CRISPR遺伝子座の成分ではない。Cas9およびCpf1は、PAM配列が、それぞれ後続または先行しない場合には、うまく標的DNA配列と結合してこれを切断することはないであろう。PAMは、細菌自体を非自己DNAと識別し、それによって、CRISPR遺伝子座がヌクレアーゼによって標的にされて破壊されるのを防止する、(細菌ゲノムには見られない)必須のターゲティング成分である。
【0081】
細胞、または核酸、タンパク質、またはベクターに関して使用される場合の用語「組換え」は、これらの細胞、核酸、タンパク質、またはベクターが、異種核酸もしくはタンパク質の導入または天然の核酸もしくはタンパク質の変更によって改変されていること、またはこれらの細胞が、このように改変された細胞から得られることを示す。したがって、例えば、組換え細胞は、天然の(天然に存在する)型の細胞内には見られない遺伝子を発現するか、そうではなく正常もしくは異常に発現される、または低く発現されるもしくはまったく発現されない、天然の遺伝子の第2のコピーを発現する。
【0082】
本明細書で互換的に使用される「サイレンサー」または「リプレッサー」は、転写調節因子と結合し、遺伝子がタンパク質として発現されるのを防止することが可能なDNA配列を指す。サイレンサーは、その特定の遺伝子の転写に対する負の効果を誘発する、配列特異的なエレメントである。サイレンサーエレメントがDNA内で位置することができる場所はたくさんある。最も一般的な場所は、標的遺伝子の上流に見られ、ここでは、遺伝子の転写を抑制するのを助けることができる。この距離は、遺伝子のおよそ-20bp上流から-2000bp上流まで大きく変動し得る。ある種のサイレンサーは、遺伝子自体のイントロンまたはエクソン内に位置するプロモーターの下流に見られる可能性がある。サイレンサーはまた、mRNAの3’非翻訳領域(3’UTR)内にも見られている。DNA内には、典型的なサイレンサーエレメントと非典型的な負調節エレメント(NRE)である、2つの主なタイプのサイレンサーが存在する。典型的なサイレンサーにおいては、遺伝子は、大抵は基本転写因子(GTF)アセンブリーを阻害することによって、サイレンサーエレメントによって能動的に抑制される。NREは、通常、遺伝子の上流である他のエレメントを阻害することによって、遺伝子を受動的に抑制する。
【0083】
本明細書で使用される「骨格筋」は、体性神経系の制御下にあり、かつ腱として公知のコラーゲン線維の束によって骨に付着している、横紋筋の種類を指す。骨格筋は、時として口語的に「筋線維(muscle fiber)」と呼ばれる、筋細胞(myocyte)として公知の個々の成分、または「筋肉細胞(muscle cell)」で構成されている。筋細胞は、筋形成として公知のプロセスにおいて、発達性の筋芽細胞(筋肉細胞をもたらす、ある種類の胚性前駆細胞)の融合体から形成される。これらの長い円柱形の多核細胞は、筋線維(myofiber)とも呼ばれる。
【0084】
本明細書で使用される「骨格筋状態」は、筋ジストロフィー、老化、筋変性、創傷治癒、および筋力低下または筋萎縮症などの、骨格筋に関連する状態を指す。
【0085】
本明細書で互換的に使用される「対象」および「患者」は、限定はされないが、哺乳類(例えば、ウシ、ブタ、ラクダ、ラマ、ウマ、ヤギ、ウサギ、ヒツジ、ハムスター、モルモット、ネコ、イヌ、ラット、およびマウス、非ヒト霊長類(例えば、カニクイザルまたはアカゲザル、チンパンジーなどのサル)、およびヒト)を含めた、あらゆる脊椎動物を指す。いくつかの実施態様では、対象は、ヒトまたは非ヒトであり得る。対象または患者は、他の形態の治療を受けていてもよい。
【0086】
本明細書で使用される「スーパーエンハンサー」は、細胞同一性に関与する、遺伝子の転写を駆動するために一連の転写因子タンパク質によって集団で結合される複数のエンハンサーを含む、哺乳類ゲノムの領域を指す。スーパーエンハンサーは、しばしば、細胞同一性を制御および定義するために重要な近くの遺伝子と特定され、細胞同一性を調節している主要な中心点を迅速に特定するために使用することができる。エンハンサーは、ある範囲の値を有するいくつかの定量化可能な形質を有し、これらの形質は、一般に、スーパーエンハンサーで上昇する。スーパーエンハンサーは、より高いレベルの転写調節タンパク質によって結合され、より高度に発現される遺伝子と関与する。スーパーエンハンサーと関与する遺伝子の発現は、攪乱に対して特に感受性であり、これは、細胞状態遷移を容易にする、または転写を標的にする小分子に対するスーパーエンハンサー関連遺伝子の感受性を説明することができる。
【0087】
本明細書で使用される「標的エンハンサー」は、gRNAおよびCRISPR/Cas9に基づく系によって標的とされるエンハンサーを指す。標的エンハンサーは、標的領域内であり得る。
【0088】
本明細書で使用される「標的遺伝子」は、既知のまたは推定上の遺伝子産物をコードする、あらゆるヌクレオチド配列を指す。標的遺伝子は、遺伝性疾患に関与する変異した遺伝子であり得る。
【0089】
本明細書で互換的に使用される「標的領域」、「標的配列」、「プロトスペーサー」、または「プロトスペーサー配列」は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系が標的にする標的遺伝子の領域を指す。
【0090】
本明細書で使用される「転写領域」は、DNA分子からの遺伝情報のメッセンジャーRNAへの伝達をもたらす、メッセンジャーRNAとして公知である単鎖RNA分子に転写されるDNAの領域を指す。転写中、RNAポリメラーゼは、3’から5’の方向に鋳型鎖を読み取り、5’から3’にRNAを合成する。mRNA配列は、DNA鎖に対して相補的である。
【0091】
本明細書で使用される「標的調節エレメント」は、gRNAおよびCRISPR/Cas9に基づく系によって標的とされる調節エレメントを指す。標的調節エレメントは、標的領域内であり得る。
【0092】
本明細書で使用される「転写領域」は、DNA分子からの遺伝情報のメッセンジャーRNAへの伝達をもたらす、メッセンジャーRNAとして公知である単鎖RNA分子に転写されるDNAの領域を指す。転写中、RNAポリメラーゼは、3’から5’の方向に鋳型鎖を読み取り、5’から3’にRNAを合成する。mRNA配列は、DNA鎖に対して相補的である。
【0093】
本明細書で互換的に使用される「転写開始点」または「TSS」は、そこでRNAポリメラーゼがRNA転写物の合成を開始する、転写されたDNA配列の最初のヌクレオチドを指す。
【0094】
本明細書で使用される「導入遺伝子」は、ある生物から単離されており、別の生物に導入される、遺伝子配列を含有する遺伝子または遺伝材料を指す。DNAのこの非天然セグメントは、トランスジェニック生物におけるRNAまたはタンパク質を産生する能力を保持することもできるし、トランスジェニック生物の遺伝暗号の正常な機能を変えることもできる。導入遺伝子の導入は、生物の表現型を変化させる可能性を有する。
【0095】
本明細書で使用される「tru gRNA」は、その5’末端から一般的に2ヌクレオチド切り詰められたヌクレオチドを伴う完全長ガイドRNAを指す。
【0096】
本明細書で使用される「トランス調節エレメント」は、そこから転写される遺伝子から離れた遺伝子の転写を調節する、ノンコーディングDNAの領域を指す。トランス調節エレメントは、標的遺伝子と同じ又は異なる染色体上にあり得る。トランス調節エレメントの例としては、エンハンサー、スーパーエンハンサー、サイレンサー、インスレーター、および遺伝子座制御領域が挙げられる。
【0097】
核酸に関して本明細書で使用される「バリアント」は、(i)参考ヌクレオチド配列の一部もしくは断片(参考ヌクレオチド配列と比較した場合に挿入または欠失を有するヌクレオチド配列が含まれる);(ii)参考ヌクレオチド配列の相補体、もしくはその一部;(iii)参考核酸と実質的に同一である核酸、もしくはその相補体;または(iv)ストリンジェントな条件下で参考核酸とハイブリッド形成する核酸、その相補体、もしくはそれと実質的に同一な配列を意味する。
【0098】
ペプチドまたはポリペプチドに関する「バリアント」は、アミノ酸の挿入、欠失、または保存的置換によってアミノ酸配列が異なるが、少なくとも1つの生物活性を保持する。バリアントは、少なくとも1つの生物活性を保持するアミノ酸配列を有する参考タンパク質と実質的に同一であるアミノ酸配列を有するタンパク質も意味することができる。アミノ酸の保存的置換、すなわち、アミノ酸を、同様の性質(例えば、荷電領域の親水性、程度、および分布)の別のアミノ酸と置き換えることは、微小な変化を一般的に伴うものと当技術分野で認識されている。これらの微小な変化は、当技術分野で理解されている通り、アミノ酸の疎水性指標(hydropathic index)を考慮することによって、ある程度特定することができる。Kyte et al.,J.Mol.Biol.157:105-132(1982)。アミノ酸の疎水性指標は、その疎水性および電荷の考慮に基づいている。同様の疎水性指標のアミノ酸が置換されてもまだ、タンパク質機能を保持できることが、当技術分野で公知である。一態様では、±2の疎水性指標を有するアミノ酸が置換される。アミノ酸の親水性はまた、生体機能を保持するタンパク質をもたらすであろう置換を明らかにするために使用することができる。ペプチドという状況でのアミノ酸の親水性の考慮は、そのペプチドの最大の局所的平均親水性の算出を可能にする。互いに±2以内の親水性値を有するアミノ酸での置換を実施することができる。アミノ酸の疎水性指標と親水性値はどちらも、そのアミノ酸の特定の側鎖によって影響を受ける。この知見と一致して、生体機能と適合するアミノ酸置換は、疎水性、親水性、電荷、大きさ、および他の性質によって明らかにされる、アミノ酸、特にそのアミノ酸の側鎖の相対的類似性に依存することが理解されよう。
【0099】
本明細書で使用される「ベクター」は、複製開始点を含有する核酸配列を意味する。ベクターは、ウイルスベクター、バクテリオファージ、細菌人工染色体または酵母人工染色体であり得る。ベクターは、DNAまたはRNAベクターであり得る。ベクターは、自己複製する染色体外のベクターであり得、好ましくはDNAプラスミドである。例えば、ベクターは、Cas9および配列番号149~315、321~323、および326~329のいずれか1つの少なくとも1つの最適化されたgRNAヌクレオチド配列をコードすることができる。
【0100】
本明細書で別に定義されない限り、本開示に関して使用される科学および技術用語は、当業者によって普通に理解されるのと同じ意味を有するものとする。例えば、本明細書に記載した細胞および組織培養、分子生物学、免疫学、微生物学、遺伝学、ならびにタンパク質および核酸化学、ならびにハイブリダイゼーションに関して使用される、あらゆる学術用語、およびこれらの技術は、周知でありかつ当技術分野で普通に使用されるものである。用語の意味および範囲は、明確であるべきである;しかし、いずれかの潜在的あいまい性の場合には、本明細書で提供する定義が、あらゆる辞書または外部の定義よりも先行する。さらに、文脈によって他に必要とされない限り、単数の用語には、複数形が含まれるものとし、複数の用語には、単数形が含まれるものとする。
【0101】
2.CRISPR系
CRISPR系は、ある形態の獲得免疫を提供する、侵入するファージおよびプラスミドに対する防御に関与する、微生物ヌクレアーゼ系である。微生物宿主におけるCRISPR遺伝子座は、CRISPR介在性の核酸切断の特異性をプログラミングすることが可能な、CRISPR関連(Cas)遺伝子と、ノンコーディングRNAエレメントとの組み合わせを含有し得る。スペーサーと呼ばれる、外来DNAの短い部分が、ゲノムのCRISPRリピート間に組み込まれ、過去の曝露の「メモリー」として働く。Cas9は、単一のガイドRNA(「sgRNA」)の3’末端との複合体を形成し、このタンパク質-RNA対は、sgRNA配列の5’末端と、プロトスペーサーとして公知であるあらかじめ定義された20bp DNA配列との間の相補的塩基対合によって、そのゲノム上の標的を認識する。この複合体は、CRISPR RNA(「crRNA」)内のコードされた領域を介して、病原体DNAの相同遺伝子座、すなわち、病原体ゲノム内のプロトスペーサー、およびプロトスペーサー隣接モチーフ(protospacer-adjacent motif)(PAM)に誘導される。ノンコーディングCRISPRアレイは、ダイレクトリピート内で転写および切断されて、個々のスペーサー配列を含有する短いcrRNAとなり、これが、Casヌクレアーゼを標的部位(プロトスペーサー)に誘導する。発現されるキメラsgRNAの20bp認識配列を単に交換することによって、Cas9ヌクレアーゼを、ゲノム上の新しい標的に誘導することができるようになる。CRISPRスペーサーは、真核生物におけるRNAiと同様の方式で外来性遺伝因子を認識および発現停止させるために使用される。
【0102】
3つのクラスのCRISPR系(I型、II型、およびIII型エフェクター系)が公知である。II型エフェクター系は、単一のエフェクター酵素、Cas9を使用して、4つの連続的ステップで、標的DNA二本鎖破壊を行って、dsDNAを切断する。複合体として作用する複数の異なるエフェクターを必要とするI型およびIII型エフェクター系と比較して、II型エフェクター系は、真核細胞などの代替状況において機能することができる。II型エフェクター系は、長い前駆‐crRNA(これは、スペーサー含有CRISPR遺伝子座から転写される)、Cas9タンパク質、およびtracrRNA(これは、前駆‐crRNAプロセシングに関与する)からなる。tracrRNAは、前駆‐crRNAのスペーサーを隔てている反復領域とハイブリッド形成し、したがって、内在性RNase IIIによるdsRNA切断を開始する。この切断に、Cas9による各スペーサー内の第2の切断現象が続き、tracrRNAおよびCas9と結合されたままである成熟crRNAが産生され、Cas9:crRNA-tracrRNA複合体が形成される。
【0103】
化膿レンサ球菌(Streptococcus pyogenes)の遺伝子改変された形態のII型エフェクター系は、ゲノム工学のために、ヒト細胞において機能することが示された。この系では、Cas9タンパク質は、合成によって再構成された「ガイドRNA」(「gRNA」、また、本明細書ではキメラsgRNAと互換的に使用され、Cas9について、一般に、RNase III およびcrRNAプロセシングの必要性を不要にするcrRNA‐tracrRNA融合体である)によって、ゲノム上の標的部位に誘導された。
【0104】
Cas9:crRNA-tracrRNA複合体は、DNA二重鎖をほどき、crRNAとの配列マッチングを探索して切断する。標的認識は、標的DNA内の「プロトスペーサー」配列と、crRNA内の残存するスペーサー配列との間の相補性の検出時に発生する。Cas9は、正しいプロトスペーサー隣接モチーフ(PAM)もプロトスペーサーの3’末端に存在する場合に、標的DNAの切断を媒介する。プロトスペーサーターゲティングについては、配列は、プロトスペーサー隣接モチーフ(PAM)、すなわちDNA切断に必要とされるCas9ヌクレアーゼによって認識される短い配列の直後でなければならない。別のII型系は、異なるPAM要件を有する。化膿レンサ球菌(S.pyogenes)CRISPR系は、5’-NRG-3’(ここで、Rは、AまたはGのいずれかである)としての、かつ、ヒト細胞におけるこの系の特異性を特徴付ける、このCas9(SpCas9)のためのPAM配列を有することができる。CRISPR/Cas9に基づく系の独自の能力は、2つ以上のsgRNAを伴う単一のCas9タンパク質を同時発現させることによって、複数の異なるゲノム上遺伝子座を同時に標的にする、直接的な能力である。例えば、遺伝子改変された系において、化膿レンサ球菌(Streptococcus pyogenes)II型系は、本来は「NGG」配列(ここで、「N」は、いずれかのヌクレオチドであり得る)を使用することを好むが、「NAG」などの他のPAM配列も受け入れられる(Hsu et al.(2013)Nature Biotechnology,31,827-832)。同様に、髄膜炎菌(Neisseria meningitidis)由来のCas9(NmCas9)は、通常、NNNNGATTという天然のPAMを有するが、高度に縮重したNNNNGNNN PAMを含めた様々なPAMにわたって活性を有する(Esvelt et al.Nature Methods(2013)doi:10.1038/nmeth.2681)。
【0105】
3.CRISPR/Cas9に基づく系
本明細書で提供されるのは、標的遺伝子などの対象となる標的領域を特異的に切断すること、または標的遺伝子の遺伝子発現を活性化もしくは抑制することなどの、エピゲノム編集および転写調節における使用のためのDNAターゲティングの改善を可能にするヘアピンgRNA(本明細書では「hpgRNA」または「hp-gRNA」とも呼ばれる)などの最適化されたgRNAを含む、CRISPR/Cas9系である。この最適化されたgRNAは、オフターゲット位置での寿命を、オフターゲット部位でのいずれかの活性を最小にするように調節することによって、CRISPR/Cas9に基づくおよびCRISPR/Cpf1に基づく系のオフターゲット結合およびオフターゲット活性を減じつつ、標的結合特異性の増大を提供する。
【0106】
最適化されたgRNAは、第2のドメイン活性とは関係なく、これらの位置でのCas9寿命を調節する、および全体的な侵入速度論を調節することによって、Cas9-融合タンパク質活性を調節することができる。さらに、プロトスペーサー-ターゲティングセグメントの5’末端での、プロトスペーサーに対するgRNA結合はまた、Cas9切断と関与する可能性がある。オフターゲット部位に対する結合の低下は、これらのオフターゲット部位での完全な侵入/切断の可能性を制限するであろう。化膿レンサ球菌(Streptococcus pyogenes)の遺伝子改変された形態のII型エフェクター系は、ゲノム工学のために、ヒト細胞において機能することが示された。この系では、Cas9タンパク質は、合成によって再構成された「ガイドRNA」(「gRNA」、また、本明細書ではキメラ一本鎖ガイドRNA(「sgRNA」)と互換的に使用され、Cas9については、一般に、RNase III およびcrRNAプロセシングの必要性を不要にするcrRNA-tracrRNA融合体である)によって、ゲノム上の標的部位に誘導された。本明細書で提供するのは、ゲノム編集、および遺伝性疾患の治療における使用のためのCRISPR/Cas9に基づく系である。CRISPR/Cas9に基づく系は、遺伝性疾患、老化、組織再生、または創傷治癒に関与する遺伝子を含めた、あらゆる遺伝子を標的にするように設計することができる。CRISPR/Cas9に基づく系は、Cas9タンパク質またはCas9融合タンパク質と、下に記載する通りの少なくとも1つの最適化されたgRNAとを含むことができる。Cas9融合タンパク質は、例えば、トランス活性化ドメインなどの、Cas9にとって内在性であるものとは異なる活性を有するドメインを含むことができる。
【0107】
標的遺伝子は、フレームシフト変異またはナンセンス変異などの変異を有することができる。標的遺伝子が、未成熟終止コドン、異所性スプライス受容部位、または異所性スプライス供与部位をもたらす変異を有する場合、CRISPR/Cas9に基づく系は、これらの未成熟終止コドン、異所性スプライス受容部位、または異所性スプライス供与部位の上流または下流のヌクレオチド配列を認識および結合するように設計することができる。CRISPR-Cas9に基づく系はまた、スプライス受容部および供与部を標的にして、未成熟終止コドンのスキッピングを誘発するまたは破壊された読み枠を修復することによって、正常な遺伝子スプライシングを破壊するために使用することもできる。CRISPR/Cas9に基づく系は、ゲノムのタンパク質-コード領域へのオフターゲット変化を媒介する可能性もしない可能性もある。
【0108】
i.Cas9
CRISPR/Cas9に基づく系は、Cas9タンパク質またはCas9融合タンパク質を含むことができる。Cas9タンパク質は、核酸を切断するエンドヌクレアーゼであり、また、CRISPR遺伝子座によってコードされ、また、II型CRISPR系に含まれる。Cas9タンパク質は、化膿レンサ球菌(Streptococcus pyogenes)などの、あらゆる細菌または古細菌種由来であり得る。Cas9タンパク質は、ヌクレアーゼ活性が不活性化されるように変異させることができる。エンドヌクレアーゼ活性を有しない化膿レンサ球菌(Streptococcus pyogenes)由来の不活性化されたCas9タンパク質(iCas9、「dCas9」とも呼ばれる)は、最近、立体障害を介して遺伝子発現を抑制するために、gRNAによって、細菌、酵母、およびヒト細胞における遺伝子に標的化されている。本明細書で使用する場合、「iCas9」および「dCas9」はどちらも、アミノ酸置換D10AおよびH840Aを有し、かつそのヌクレアーゼ活性が不活性化された、Cas9タンパク質を指す。いくつかの実施態様では、NmCas9などの髄膜炎菌(Neisseria meningitides)由来の、不活性化されたCas9タンパク質を使用することができる。例えば、CRISPR/Cas9に基づく系は、配列番号1のiCas9を含むことができる。
【0109】
ii.Cas9融合タンパク質
CRISPR/Cas9に基づく系は、dCas9などのヌクレアーゼ活性を有しないCas9タンパク質と、第2のドメインとの融合タンパク質を含むことができる。第2のドメインは、転写活性化ドメイン、例えばVP64ドメインまたはp300ドメイン、転写抑制ドメイン、例えばKRABドメイン、ヌクレアーゼドメイン、転写終結因子ドメイン、ヒストン修飾ドメイン、核酸会合ドメイン、アセチラーゼドメイン、脱アセチル化酵素ドメイン、メチル化酵素ドメイン、例えばDNAメチル化酵素ドメイン、脱メチル化酵素ドメイン、リン酸化ドメイン、ユビキチン化ドメイン、またはSUMO化ドメインを含むことができる。第2のドメインは、DNAメチル化またはクロマチンループ形成(looping)のモディファイヤーであり得る。
【0110】
いくつかの実施態様では、前記融合タンパク質は、dCas9ドメインと転写活性化因子とを含むことができる。例えば、前記融合タンパク質は、配列番号2のアミノ酸配列を含むことができる。他の実施態様では、前記融合タンパク質は、dCas9ドメインと転写抑制因子とを含むことができる。例えば、前記融合タンパク質は、配列番号3のアミノ酸配列を含むことができる。さらなる態様では、前記融合タンパク質は、dCas9ドメインと、Cas9ヌクレアーゼ活性とは異なる部位特異的ヌクレアーゼとを含むことができる。
【0111】
前記融合タンパク質は、第1のポリペプチドドメインがCasタンパク質を含み、第2のポリペプチドドメインがヌクレアーゼ活性を有しない、2つの異種ポリペプチドドメインを含むことができる。前記融合タンパク質は、上に記載した通りに、ヌクレアーゼ活性を有する第2のポリペプチドドメインと融合された、Cas9タンパク質または変異したCas9タンパク質を含むことができる。この第2のポリペプチドドメインは、Cas9タンパク質のヌクレアーゼ活性とは異なるヌクレアーゼ活性を有することができる。ヌクレアーゼ、またはヌクレアーゼ活性を有するタンパク質は、核酸のヌクレオチドサブユニット間のホスホジエステル結合を切断することが可能な酵素である。ヌクレアーゼは通常、エンドヌクレアーゼとエキソヌクレアーゼにさらに分類されるが、いくつかの酵素は、どちらのカテゴリーにも属することができる。よく知られているヌクレアーゼは、デオキシリボヌクレアーゼおよびリボヌクレアーゼである。
【0112】
(1)CRISPR/Cas9に基づく遺伝子活性化系
CRISPR/Cas9に基づく系は、エピゲノム編集の例外的特異性を用いて調節エレメント機能を活性化することができる、CRISPR/Cas9に基づく遺伝子活性化系であり得る。CRISPR/Cas9に基づく遺伝子活性化系は、エンハンサー、インスレーター、サイレンサー、および標的遺伝子発現を増大または低下させるために標的とすることができる遺伝子座制御領域についてスクリーニングするために使用することができる。この技術は、ENCODEおよびRoadmap Epigenomicsプロジェクトなどのゲノム研究を通じて特定された推定上の調節エレメントに機能を割り当てるために使用することができる。
【0113】
CRISPR/Cas9に基づく遺伝子活性化系は、DNAメチル化を改変する、クロマチンループ形成させる、またはその標的部位でのヒストンH3リジン27のアセチル化を触媒して、プロモーターならびに近位および遠位エンハンサーからの標的遺伝子の頑強な転写活性化をもたらすことによって、遺伝子発現を活性化することができる。CRISPR/Cas9に基づく遺伝子活性化系は、高度に特異的であり、わずか1つのガイドRNAしか使用せずに、標的遺伝子に誘導することができる。CRISPR/Cas9に基づく遺伝子活性化系は、ゲノム内の離れた位置のエンハンサーを標的にするすることによって、1つの遺伝子、または遺伝子のファミリーの発現を活性化することができる。
【0114】
(a)ヒストンアセチル化酵素(HAT)タンパク質
CRISPR/Cas9に基づく遺伝子活性化系は、p300タンパク質、CREB結合タンパク質(CBP;p300の類似体)、GCN5、もしくはPCAF、またはこれらの断片などの、ヒストンアセチル化酵素タンパク質を含むことができる。プログラム可能なCRISPR/Cas9に基づく融合タンパク質を使用して、調節エレメントにおけるヒストンをアセチル化することは、標的遺伝子の発現を増大させるための有効な戦略である。ゲノム内のいずれかの部位に標的化させることができるCRISPR/Cas9に基づくヒストンアセチル化酵素は、遠位調節エレメントを活性化する独特の能力がある。ヒストンアセチル化酵素タンパク質は、ヒトp300タンパク質またはその断片を含むことができる。ヒストンアセチル化酵素タンパク質は、野生型ヒトp300タンパク質または変異ヒトp300タンパク質、またはその断片を含むことができる。ヒストンアセチル化酵素タンパク質は、ヒトp300タンパク質のコア・リジン-アセチルトランスフェラーゼドメイン、すなわち、p300 HAT Core(「p300 Core」としても公知である)を含むことができる。
【0115】
(b)CRISPR/dCas9p300 Core活性化系
p300タンパク質は、体全体にわたる組織における多くの遺伝子の活性を調節する。p300タンパク質は、細胞成長および分裂を調節する、また、細胞が成熟するのを促し、特殊化機能(分化させる)を担う、また、癌性腫瘍の成長を予防する役割を果たす。p300タンパク質は、転写因子を、細胞の核内で転写を行うタンパク質の複合体と連結させることによって、転写を活性化することができる。p300タンパク質はまた、クロマチンリモデリングを介して転写を調節するヒストンアセチル化酵素としても機能する。
【0116】
dCas9p300 Core融合タンパク質は、標的とされる内在性遺伝子座でのアセチル化を合成的に操作し、近位および遠位エンハンサーによって調節される遺伝子の調節をもたらすための、強力かつ容易にプログラム可能な手段である。p300 Coreは、ヒストンH3上のリジン27をアセチル化し(H3K27ac)、H3K27ac濃縮を提供することができる。p300の触媒コアドメインとdCas9との融合体は、頑強なタンパク質発現にもかかわらず、下流遺伝子の、完全長p300タンパク質の直接的融合体よりも実質的に高いトランス活性化をもたらす可能性がある。dCas9p300 Core融合タンパク質はまた、例えば、Nm-dCas9骨格の状況で、特に、遠位エンハンサー領域で(そこではdCas9VP64は、わずかな、あるとしても測定可能な下流転写活性しか呈さなかった)、dCas9VP64と比較して増大したトランス活性化能力を示す可能性がある。さらに、dCas9p300 Coreは、正確で確実なゲノムワイド転写特異性を呈する。dCas9p300 Coreは、エピジェネティック修飾されたエンハンサーによって標的にされるプロモーターでの強力な転写活性化およびアセチル化の同時濃縮の能力があり得る。
【0117】
dCas9p300 Coreは、プロモーターおよび/または特徴付けられたエンハンサーを標的にし、これと結合する単一のgRNAを介して、遺伝子発現を活性化することができる。この技術はまた、推定上のおよび既知の調節領域から遠位の遺伝子を人工的にトランス活性化する能力をもたらし、単一のプログラム可能なエフェクターと単一の標的部位の適用を介するトランス活性化を容易にする。これらの能力は、いくつかのプロモーターおよび/またはエンハンサーを同時に標的にするための多重化を可能にする。哺乳類起源のp300は、免疫原性の可能性を最小限にすることによって、インビボ適用について、ウイルス由来のエフェクタードメインに対する利点を提供することができる。
【0118】
dCas9p300 Coreによる遺伝子活性化は、標的遺伝子に対して高度に特異的である。いくつかの実施態様では、p300 Coreは、配列番号2のアミノ酸1048~1664(すなわち、配列番号4)を含む。いくつかの実施態様では、CRISPR/Cas9に基づく遺伝子活性化系は、配列番号2のdCas9p300 Core融合タンパク質または配列番号5のNm-dCas9p300 Core融合タンパク質を含む。
【0119】
(2)CRISPR/Cas9に基づく遺伝子抑制系
CRISPR/Cas9に基づく系は、エピゲノム編集の例外的特異性を用いて調節エレメント機能を阻害することが可能な、CRISPR/Cas9に基づく遺伝子抑制系であり得る。いくつかの実施態様では、dCas9KRABを含むものなどの、CRISPR/Cas9に基づく遺伝子抑制系は、標的とされる遺伝子座のエピジェネティック状態の高度に特異的なリモデリングによって、遠位エンハンサー活性を阻害することができる。
【0120】
(a)CRISPR/dCas9KRAB遺伝子抑制系
dCas9KRABリプレッサーは、遺伝子機能を研究するための、および薬物開発のための標的を発見するための、機能喪失スクリーニングにおいて使用することができる、高度に特異的なエピゲノム編集ツールである。dCas9KRABは、ある特定のエンハンサーを標的にし、エンハンサーの標的遺伝子のみを発現抑制し、その部位に抑制的ヘテロクロマチン環境を作り出す、例外的特異性を有する。dCas9-KRABは、近位または遠位調節エレメント、および対応する遺伝子標的を発現抑制することによって、内在性ゲノム状況内の新規の調節エレメントについてスクリーニングするために使用することができる。dCas9-KRABリプレッサーの特異性は、これを内在性遺伝子を発現抑制するためのトランスクリプトーム規模の特異性のために使用することを可能にする。標的とされる遺伝子座での破壊のためのエピジェネティック機構としてはヒストンメチル化などがある。
【0121】
KRABドメイン、すなわち天然に存在するジンクフィンガー転写因子内の典型的なヘテロクロマチン形成モチーフは、dCas9と遺伝的に関連しており、RNAガイド型の合成リプレッサー、dCas9KRABを作り出す。クルッペル関連ボックス(Kruppel-associated box)(「KRAB」)は、ヘテロクロマチン形成因子:Kap1、HP1、SETDB1、NuRDを動員する。これは、H3K0トリメチル化、ヒストン脱アセチル化を誘発する。KRABに基づく合成リプレッサーは、単一遺伝子の発現を効率的に抑制することができ、癌遺伝子を抑制する、ウイルス複製を阻害する、およびドミナントネガティブ疾患を治療するために用いられている。
【0122】
4.CRISPR/Cpf1に基づく系
開示した最適化されたgRNAは、プレボテラおよびフランシセラ1(Prevotella and Francisella 1)または(「CRISPR/Cpf1」)系由来の「クラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats)」と共に使用することができる。CRISPR/Cpf1系、すなわちCRISPR/Cas9系と類似のDNA編集技術は、プレボテラ(Prevotella)およびフランシセラ(Francisella)細菌において見られ、ウイルス由来の遺伝子損傷を防ぐ。Cpf1は、1,300アミノ酸のタンパク質を含有する、クラスII CRISPR/Cas系のRNAガイド型エンドヌクレアーゼである。Cpf1遺伝子は、ウイルスDNAを発見および切断するためにガイドRNAを使用するエンドヌクレアーゼをコードする、CRISPR遺伝子座と関係がある。機能性のCpf1は、tracrRNAを必要とせず、crRNAのみが必要とされるので、Cpf1は、Cas9よりも小さく単純なエンドヌクレアーゼであり、より小さなsgRNA分子(Cas9のヌクレオチド数のほぼ半分)を有する。最適化されたgRNAと共に使用することができるCpf1の例としては、アシダミノコッカス(Acidaminococcus)およびラクノスピラ科(Lachnospiraceae)細菌由来のCpf1が挙げられる。
【0123】
Cpf1遺伝子座は、II型系よりもIおよびIII型と類似している、Cas1、Cas2、およびCas4タンパク質をコードする。Cpf1遺伝子座は、混合型α/βドメイン、RuvC-I、それに続いてヘリックス領域、RuvC-II、およびジンクフィンガー様ドメインを含有する。Cpf1タンパク質は、Cas9のRuvCドメインと類似であるRuvC様エンドヌクレアーゼドメインを有する。Cpf1は、HNHエンドヌクレアーゼドメインを有さず、Cpf1のN末端は、Cas9のαヘリックス認識ローブを有しない。Cpf1 CRISPR-Casドメイン構造は、Cpf1が、機能的に独特であり、クラス2、V型CRISPR系に分類されることを示す。
【0124】
CRISPR/Cpf1系は、Cpf1酵素と、二重らせん上の正しい場所を発見しその場所に複合体を配置して標的DNAを切断するガイドRNAからなる。CRISPR/Cpf1系活性は、3つの段階:適合、crRNAの形成、および干渉を有する。適合段階中、Cas1およびCas2タンパク質は、DNAの小断片のCRISPRアレイへの適合を容易にする。crRNAの形成段階は、Casタンパク質を誘導するための、成熟crRNAを産生するpre-cr-RNAのプロセシングを含む。干渉段階では、Cpf1が、crRNAに結合されて、標的DNA配列を特定および切断するための二成分複合体が形成される。
【0125】
Cas9によってGリッチPAMが標的とされるのに対して、Cpf1-crRNA複合体は、プロトスペーサー隣接モチーフ5’-YTN-3’(ここで、「Y」はピリミジンであり、「N」はあらゆる核酸塩基である)または5’-TTN-3’の特定によって、標的DNAまたはRNAを切断する。Cas9によって標的とされるPAMが、ガイドRNAの3’側にあるのに対して、Cpf1によって標的とされるPAMは、ガイドRNAの5’側にある。PAMの特定後、Cas9の平滑末端切断とは対照的に、Cpf1は、4または5ヌクレオチドオーバーハングの粘着末端様DNA二本鎖切断を導入し、それによって、遺伝子挿入の効率およびNHEJまたはHDR中の特異性を増強する。ヒトゲノムは、GリッチよりもTリッチが多いので、TTN PAM部位は、ヒトゲノム工学にとって、GGN PAM部位よりも有用である。Cpf1のためのgRNAのプロトスペーサー-ターゲティングセグメントが、その3’最末端にあるのに対して、Cas9 gRNAは、その5’最末端にある。
【0126】
5.gRNA
CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、ある核酸配列を標的にする、本明細書に記載した通りの最適化されたgRNAなどの、少なくとも1種のgRNAを含むことができる。gRNAは、標的領域または遺伝子への、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の特異的なターゲティングを提供する。CRISPR/Cas9に基づく系についてはgRNAは、2種のノンコーディングRNA:crRNAおよびtracrRNAの融合体である。gRNAまたはsgRNAは、所望のDNA標的との相補的塩基対形成を介して、ターゲティング特異性を付与する20bpプロトスペーサーをコードする配列を交換することによって、任意の所望のDNA配列を標的にすることができる。gRNAは、II型エフェクター系に含まれる天然に存在するcrRNA:tracrRNA二重鎖を模倣する。この二重鎖は、例えば、42ヌクレオチドのcrRNAと75ヌクレオチドのtracrRNAを含むことができ、Cas9のためのガイドとして作用する。gRNAは、標的遺伝子の標的領域を標的にし、これと結合することができる。CRISPR/Cpf1に基づく系については、gRNAは、crRNAである。
【0127】
CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを含むことができ、ここでは、これらのgRNAは、異なるDNA配列を標的にする。これらの標的DNA配列は、オーバーラップしていることが可能である。標的配列またはプロトスペーサーの後に、プロトスペーサーの3’末端のPAM配列が続く。別のII型系は、異なるPAM要件を有する。例えば、化膿レンサ球菌(Streptococcus pyogenes)II型系は、「NGG」配列を使用し、ここでは、「N」は、あらゆるヌクレオチドであり得る。
【0128】
6.最適化されたガイドRNA(gRNA)を産生する方法
本開示は、ヘアピンgRNA(本明細書では「hpgRNA」または「hp-gRNA」とも呼ばれる)などの最適化されたgRNAを産生する方法を対象とする。最適化されたgRNAは、完全長gRNAのヌクレオチド配列、および完全長gRNAの5’末端または3’末端に付加されたヌクレオチドを含む。いくつかの実施態様では、完全長gRNAは、SgRNA designer、CRISPR MultiTargeter、またはSSFinderなどのプログラムを使用して設計することができる。完全長gRNAの、CRISPR/Cas9系については5’末端、CRISPR/Cpf1系については3’末端に付加されたヌクレオチドは、完全長gRNAのプロトスペーサー-ターゲティング配列内のヌクレオチドとハイブリッド形成するまたは部分的にハイブリッド形成することによって、二次構造を形成することができる。この二次構造は、gRNAによるDNA二重鎖の侵入を妨害することによって、DNA結合または切断を調節する。この二次構造は、相補的DNA鎖を有するgRNAの結合エネルギーではなくgRNAの侵入速度論に影響を与える。下の実施例に記載する通り、II型CRISPR-Cas系のガイドRNAは、「ストランド侵入」として公知であるCas9促進型のプロセスを通してプロトスペーサーと結合し、そこでは、Cas9タンパク質自体が、直接的相互作用を介してプロトスペーサー隣接モチーフ(PAM)にまず結合してこれを融解し、続いて、gRNAの3’末端の、PAM隣接ヌクレオチド(「シード(seed)」領域)との塩基対合が、gRNAの3’から、プロトスペーサーとの5’末端塩基対合まで、ヌクレオチドごとに進行する。CRISPR/Cpf1系でも類似の機構が使用される。
【0129】
完全長gRNAの5’末端または3’末端に付加されたヌクレオチドは、熱力学的平衡でのプロトスペーサーへの接近を阻止するために、ガイドRNA(ヘアピン)のプロトスペーサー-ターゲティングセグメントとハイブリッド形成させるために単に付加されるわけではない。実施例に記載する通り、平衡熱力学的二次構造特性(gRNA二次構造の融解温度など)は、ガイドRNAの特異性とすべて相関するわけではない。むしろ、切断の場合には、また、Cas9結合についてのその後のコンピュータ研究では(細胞におけるChIP-Seqを通して測定される通り(doi:10.1038/nbt.2916;doi:10.1038/nbt.2889を参照のこと))、これらのおよび推定されるストランド侵入速度論と、オンおよびオフターゲット部位との平衡状態での結合について熱力学的に競うように設計されたヘアピンとは必然的に異なる、プロトスペーサーへのストランド侵入を調節するガイドRNAの構造、設計、および機能との間に、有意かつ実質的な相関が存在する。例えば、平衡状態で安定であるように設計された二次構造エレメント(ステム内に内部rG-rUゆらぎ対を含有するヘアピン様構造を形成するRNAなど)は、ストランド侵入中に急速に不安定化され得る(例えば、rG-rUゆらぎ対は、ステムの末端塩基対となるので、隣接するヌクレオチドがプロトスペーサーに侵入するにつれて、RNA二次構造上の著しいエネルギー損失を被り、また、熱力学的平衡でのプロトスペーサーへの接近を単に阻止することによるものとは完全に別の機構によって、ストランド侵入および結合速度論を調節する)。平衡状態で安定であるが、ストランド侵入中に急速に不安定化される二次構造は、cis-ブロッキングまたは熱力学的競合では実質的に識別することができない、部位間の最小熱力学的エネルギー差(例えば、単一の内部ミスマッチの結果)を用いてオンターゲット部位とオフターゲット部位とを識別する方式で、本明細書に記載した方法を使用して設計することができる。オンターゲット部位の侵入が、G-Uゆらぎ対を含有するヘアピンを不安定化する場合、この部位は、侵入によって速度論的に識別される。例えば、下の実施例に記載するVEGFA1部位(標的部位がGGGTGGGGGGAGTTTGCTCCであり、オフターゲット部位2が
【化1】
である;下線部はミスマッチ)は、ストランド侵入について考慮する計算によって設計された二次構造を使用して、オフターゲット切断を、標準もしくは完全長ガイドRNAまたは切り詰め型ガイドRNAと比較して、それぞれ93%および98%低下させることができた。
【0130】
さらに、ガイドRNAによるストランド侵入の開始を増強するために、「シード」領域内のgRNAのプロトスペーサー-ターゲティングセグメント上の「天然に存在する」二次構造を破壊するために、完全長gRNAの5’末端または3’末端に、ヌクレオチドを付加することができる。したがって、DNA結合(binding)または切断を調節するために、プロトスペーサー-ターゲティング配列内のヌクレオチドと部分的にハイブリッド形成することによってストランド侵入を変更する二次構造を形成する、これらのヌクレオチドの付加は、異なるクラスのガイドRNA改変に相当する。
【0131】
最適化されたgRNAは、オフターゲット部位での結合を最小にし、かつプロトスペーサー配列に結合させるように設計される。いくつかの実施態様では、オフターゲット部位は、公知のまたは予測されるオフターゲット部位である。いくつかの実施態様では、前記方法は、対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の5’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の5’末端と、RNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む。
【0132】
いくつかの実施態様では、前記方法は、対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の3’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の3’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む。
【0133】
いくつかの実施態様では、異なるgRNAのさらなる侵入のエネルギー特性が、(I)DNA-DNA塩基対合を切断すること、(II)RNA-DNA塩基対を形成すること、(III)侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される。いくつかの実施態様では、第1のgRNAの、プロトスペーサー配列と相補的であるDNA配列への再アニーリングのエネルギー特性が、(I)DNA-DNA塩基対合を形成すること、(II)RNA-DNA塩基対を切断すること、(III)新たに侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される。いくつかの実施態様では、前記方法は、(V)ミスマッチにわたる塩基対合、(VI)Cas9タンパク質との相互作用、および/または(VII)追加のヒューリスティクス(ここで、追加のヒューリスティクスは、結合寿命、侵入の程度、侵入するガイドRNAの安定性、またはCas9切断活性に対するgRNA侵入の、他の算出される/シミュレーションされる特性に関する)のうちの少なくとも1つから、エネルギー的考察を決定することをさらに含む。
【0134】
CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、様々な配列および長さの、本明細書に記載した最適化されたgRNAなどのgRNAを使用することができる。いくつかの実施態様では、完全長gRNAは、標的DNA配列のポリヌクレオチド配列(すなわち、プロトスペーサー)に対応するプロトスペーサー-ターゲティングセグメントを含むことができる。いくつかの実施態様では、このプロトスペーサー-ターゲティングセグメントは、少なくとも10ヌクレオチド、少なくとも11ヌクレオチド、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、少なくとも22ヌクレオチド、少なくとも23ヌクレオチド、少なくとも24ヌクレオチド、少なくとも25ヌクレオチド、少なくとも30ヌクレオチド、または少なくとも35ヌクレオチドを有することができる。前記gRNAは、標的遺伝子の、プロモーター領域、エンハンサー領域、リプレッサー領域、インスレーター領域、サイレンサー領域、プロモーター領域を有するDNAループ形成に関与する領域、遺伝子スプライシング領域、または転写領域のうちの少なくとも1つを標的にすることができる。いくつかの実施態様では、前記完全長gRNAは、約15から20ヌクレオチドを有するプロトスペーサー-ターゲティングセグメントを含む。
【0135】
いくつかの実施態様では、RNAセグメントは、2から20ヌクレオチド、3から10ヌクレオチド、または5から8ヌクレオチドを含む。いくつかの実施態様では、RNAセグメントは、プロトスペーサー-ターゲティング配列を補完する、2から20ヌクレオチド、3から10ヌクレオチド、または5から8ヌクレオチドを含む。いくつかの実施態様では、Mは、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10である。例えば、Mは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20であり得る。いくつかの実施態様では、RNAセグメントは、そのうちのいくつか、またはそのうちのすべてが、プロトスペーサー-ターゲティング配列を補完する、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10ヌクレオチドを有することができる。いくつかの実施態様では、RNAセグメントは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドを有することができる。
【0136】
いくつかの実施態様では、Nは、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10である。例えば、Nは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20であり得る。いくつかの実施態様では、リンカーは、は、1から20ヌクレオチド、3から10ヌクレオチド、または5から8ヌクレオチドを含む。例えば、リンカーは、そのうちのいくつか、またはそのうちのすべてが、プロトスペーサー-ターゲティング配列を補完する、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10ヌクレオチドを有することができる。いくつかの実施態様では、リンカーは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチドを有することができる。いくつかの実施態様では、リンカーには、テトラループなどの安定化リンカーが含まれ得る。テトラループの例としては、限定はされないが、ANYA、CUYG、GNRA、UMAC、およびUNCGが挙げられる。
【0137】
いくつかの実施態様では、RNAセグメントおよび/またはプロトスペーサー-ターゲティング配列は、二次構造を提供する。いくつかの実施態様では、前記二次構造は、プロトスペーサー-ターゲティング配列を、RNAセグメントと部分的にハイブリッド形成させることによって形成される。いくつかの実施態様では、前記二次構造は、最適化されたgRNAによるプロトスペーサー二重鎖またはオフターゲット二重鎖の侵入を妨害することによって、Cas9によるDNA結合または切断を調節する。いくつかの実施態様では、前記二次構造が、gRNAの5’末端をタンパク質内に安定的に維持し、Cas9内の最適化されたgRNAを保護して分解を防止する。
【0138】
いくつかの実施態様では、前記二次構造は、RNAセグメントの全体または一部を、プロトスペーサー-ターゲティング配列もしくはセグメントの5’末端のヌクレオチド、プロトスペーサー-ターゲティング配列もしくはセグメントの中央のヌクレオチド、および/またはプロトスペーサー-ターゲティング配列もしくはセグメントの3’末端のヌクレオチドにハイブリッド形成させることによって形成される。いくつかの実施態様では、RNAセグメントの近接セグメントが、プロトスペーサー-ターゲティング配列もしくはセグメントにハイブリッド形成する。いくつかの実施態様では、RNAセグメントの非近接セグメントが、プロトスペーサー-ターゲティング配列もしくはセグメントにハイブリッド形成する。いくつかの実施態様では、前記二次構造は、ヘアピンである。
【0139】
いくつかの実施態様では、前記二次構造は、室温または37℃で安定である。いくつかの実施態様では、前記二次構造の全平衡自由エネルギーは、約4℃から約50℃の温度、例えば室温または37℃で、約2kcal/mol未満である。例えば、前記二次構造の全平衡自由エネルギーは、約4℃から約50℃、約4℃から約40℃、約4℃から約37℃、約4℃から約30℃、約4℃から約25℃、約4℃から約20℃、約4℃から約10℃、約5℃から約50℃、約5℃から約40℃、約5℃から約37℃、約5℃から約30℃、約5℃から約25℃、約5℃から約20℃、約5℃から約10℃、約10℃から約50℃、約10℃から約40℃、約10℃から約37℃、約10℃から約30℃、約10℃から約25℃、約10℃から約20℃、約20℃から約50℃、約20℃から約40℃、約20℃から約37℃、約20℃から約30℃、約25℃から約50℃、約25℃から約40℃、約25℃から約37℃、または約25℃から約30℃の温度で、約10kcal/mol未満、約5kcal/mol未満、約4kcal/mol未満、約3kcal/mol未満、約2kcal/mol未満、約1kcal/mol未満、または約0.5kcal/mol未満であり得る。いくつかの実施態様では、RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントの少なくとも2つのヌクレオチドとハイブリッド形成する、またはこれらのヌクレオチドと共に非標準塩基対を形成する。いくつかの実施態様では、非標準塩基対は、rU-rGである。
【0140】
いくつかの実施態様では、1から20ヌクレオチドが、リンカー内でランダム化される。例えば、1から20、1から15、1から10、1から9、1から8、1から7、1から6、1から5、1から4、1から3、1から2、2から20、2から15、2から10、2から9、2から8、2から7、2から6、2から5、2から4、3から20、3から15、3から10、3から9、3から8、3から7、3から6、3から5、3から4、4から20、4から15、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から15、5から10、5から9、5から8、5から7、5から6、6から20、6から15、6から10、6から9、6から8、6から7、7から20、7から15、7から10、7から9、7から8、8から20、8から15、8から10、8から9、9から20、9から15、または9から10、10から20、10から15、または15から20ヌクレオチドが、リンカー内でランダム化され得る。
【0141】
いくつかの実施態様では、1から20ヌクレオチドが、RNAセグメント内でランダム化される。例えば、1から20、1から15、1から10、1から9、1から8、1から7、1から6、1から5、1から4、1から3、1から2、2から20、2から15、2から10、2から9、2から8、2から7、2から6、2から5、2から4、3から20、3から15、3から10、3から9、3から8、3から7、3から6、3から5、3から4、4から20、4から15、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から15、5から10、5から9、5から8、5から7、5から6、6から20、6から15、6から10、6から9、6から8、6から7、7から20、7から15、7から10、7から9、7から8、8から20、8から15、8から10、8から9、9から20、9から15、または9から10、10から20、10から15、または15から20ヌクレオチドが、RNAセグメント内でランダム化され得る。
【0142】
いくつかの実施態様では、ステップ(g)は、X回繰り返され、それによって、X個のgRNAが産生され、それぞれのX個のgRNAを用いてステップ(e)が繰り返され、ここでは、Xは、0から20である。いくつかの実施態様では、Xは、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10であり得る。例えば、Xは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20であり得る。
【0143】
いくつかの実施態様では、侵入速度論および寿命は、動的モンテカルロ法またはGillespieアルゴリズムを使用して算出される。いくつかの実施態様では、侵入速度論および寿命は、当業者に公知である、ストランド侵入をモデル化する微分方程式などの「決定論的」方法を使用して決定することができる。動的モンテカルロ(KMC)法は、自然に発生する何らかのプロセスの時間発展をシミュレーションすることを目的とするモンテカルロ法コンピュータシミュレーションである。このプロセスは一般的に、状態間の既知の遷移速度を伴って起こるプロセスである。この既知の遷移速度は、KMCアルゴリズムへのインプットである。Gillespieアルゴリズム(Doob-Gillespieアルゴリズムとしても公知である)は、確率方程式の、統計的に妥当な軌跡(可能な解)をもたらす。Gillespieアルゴリズムは、ますます複雑化する系をシミュレーションするために使用することができる。このアルゴリズムは、反応物の数が概して数十分子(またはそれ以下)にもなる、細胞内の反応をシミュレーションするのに特に有用である。数学的には、これは、動的モンテカルロ方法の変形であり、動的モンテカルロ方法と類似している。Gillespieアルゴリズムは、あらゆる反応が明確にシミュレーションされるので、少数の反応物を伴う系の離散シミュレーションおよび確率的シミュレーションを可能にする。単一のGillespieシミュレーションに対応する軌跡は、マスター方程式の解である確率質量関数からの厳密な標本を表す。
【0144】
いくつかの実施態様では、設計基準は、特異性、結合寿命の調節、および/または推定される切断特異性であり得る。例えば、最適化されたgRNAは、オンターゲット部位での完全なgRNAの結合寿命以上の結合寿命、および/またはオフターゲット部位での完全なgRNAの結合寿命以下の結合寿命を有するように設計することができる。いくつかの実施態様では、最適化されたgRNAは、少なくとも3つのオフターゲット部位(ここで、これらのオフターゲット部位は、最も近いオフターゲット部位であると予測される、またはオンターゲット部位に対する最も高い同一性を有すると予測される)に対する完全長gRNAの結合寿命以下の結合寿命を有するように選択される。いくつかの実施態様では、設計基準は、オフターゲット部位での完全長gRNAまたは切り詰め型gRNAの寿命または切断速度以下であるオフターゲット部位での寿命または切断速度、および/または、完全長gRNAまたは切り詰め型gRNAの予測されるオンターゲット活性率の10%超である、予測されるオンターゲット活性率を含む。
【0145】
いくつかの実施態様では、最適化されたgRNAは、CRISPR活性を決定するためのミスマッチ感受性ヌクレアーゼを使用して、例えば、surveyorアッセイもしくはT7エンドヌクレアーゼI(T7E1)アッセイ、または次世代シーケンシング技術、例えばIllumina MiSeqもしくはGUIDE-Seqを使用して、ステップi)で試験される。いくつかの実施態様では、最適化されたgRNAは、レポーターアッセイ(ここで、Cas9-融合タンパク質活性が、GFPなどのレポータータンパク質の発現を変更させる)を使用して、ステップi)で試験される。GUIDE-Seqは、オフターゲット切断を分析するために考案されているアッセイである。
【0146】
いくつかの実施態様では、標的領域は、CRISPR design(Ran,et al.Nature Protocols(2013)8:2281-2308)およびCCTop(Stemmer,PLoS One(2015)10:e0124633)ツールなどのプログラムを使用して、PAM配列に対する配列の近さに基づいて決定することができる。いくつかの実施態様では、標的部位は、プロモーター、DNAse I高感受性部位、トランスポザーゼ接近可能(Transposase-Accessible)クロマチン部位、DNAメチル化部位、転写因子結合部位、エピジェネティックマーク、発現定量的形質遺伝子座、および/または遺伝子関連解析におけるヒトの形質もしくは表現型に関連する領域を含むことができる。標的部位は、DNase-シークエンシング(DNase-seq)、ハイスループットシークエンシングを用いるトランスポザーゼ接近可能クロマチンについての分析(Assay for Transposase-Accessible Chromatin)(ATAC-seq)、ChIP-シークエンシング、自己転写活性のある調節領域シークエンシング(self-transcribing active regulatory region sequencing)(STARR-Seq)、単一分子リアルタイムシークエンシング(single molecule real time sequencing)(SMRT)、調節エレメントのホルムアルデヒド支援単離シークエンシング(Formaldehyde-Assisted Isolation of Regulatory Elements sequencing)(FAIRE-seq)、小球菌ヌクレアーゼシークエンシング(MNase-seq)、提示低下バイサルファイトシークエンシング(reduced representation bisulfite sequencing)(RRBS-seq)、全ゲノムバイサルファイトシークエンシング(whole genome bisulfite sequencing)、メチル-結合DNA免疫沈降(MEDIP-seq)、または遺伝子関連解析によって決定することができる。いくつかの実施態様では、オフターゲット部位は、CasOT(PKU Zebrafish Functional Genomics group,Peking University)、CHOPCHOP(Harvard University)、CRISPR Design、(Massachusetts Institute of Technology)、CRISPR Design tool(The Broad Institute of Harvard and MIT)、CRISPR/Cas9 gRNA finder(University of Colorado)、CRISPRfinder(Universite Paris-Sud)、E-CRISP(DKFZ German Cancer Research Center)、CRISPR gRNA Design tool(DNA 2.0)、PROGNOS(Emory University/Georgia Institute of Technology)、ZiFiT(Massachusetts General Hospital)を使用して決定することができる。標的領域およびオフターゲット部位を決定するために使用することができるツールの例は、その内容全体が参照によって本明細書に組み込まれる、国際公開第2016109255号パンフレットに記載されている。
【0147】
7.標的遺伝子
本明細書に開示する通り、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、任意の標的遺伝子の発現を標的にし、これを切断するように設計することができる。例えば、本明細書に記載した最適化されたgRNAなどのgRNAは、標的遺伝子内の標的領域を標的にし、これと結合することができる。標的遺伝子は、細胞株における、内在性遺伝子、導入遺伝子、またはウイルス遺伝子であり得る。いくつかの実施態様では、標的遺伝子は、公知の遺伝子であり得る。いくつかの実施態様では、標的遺伝子は、未知の遺伝子である。gRNAは、あらゆる核酸配列を標的にすることができる。核酸配列標的は、DNAであり得る。DNAは、あらゆる遺伝子であり得る。例えば、gRNAは、DMD、EMX1、またはVEGFAなどの遺伝子を標的にすることができる。
【0148】
いくつかの態様では、標的遺伝子は、疾患関連遺伝子である。いくつかの実施態様では、標的細胞は、哺乳類細胞である。いくつかの実施態様では、ゲノムには、ヒトゲノムが含まれる。いくつかの実施態様では、標的遺伝子は、原核生物遺伝子または真核生物遺伝子、例えば哺乳類遺伝子であり得る。例えば、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、DMD(ジストロフィン遺伝子)、EMX1、VEGFA、IL1RN、MYOD1、OCT4、HBE、HBG、HBD、HBB、MYOCD(ミオカルディン(Myocardin))、PAX7(ペアードボックスタンパク質(Paired box protein)Pax-7)、FGF1(線維芽細胞増殖因子(fibroblast growth factor)-1)遺伝子、例えばFGF1A、FGF1B、およびFGF1Cなどの、哺乳類遺伝子を標的にすることができる。他の標的遺伝子としては、限定はされないが、Atf3、Axud1、Btg2、c-Fos、c-Jun、Cxcl1、Cxcl2、Edn1、Ereg、Fos、Gadd45b、Ier2、Ier3、Ifrd1、Il1b、Il6、Irf1、Junb、Lif、Nfkbia、Nfkbiz、Ptgs2、Slc25a25、Sqstm1、Tieg、Tnf、Tnfaip3、Zfp36、Birc2、Ccl2、Ccl20、Ccl7、Cebpd、Ch25h、CSF1、Cx3cl1、Cxcl10、Cxcl5、Gch、Icam1、Ifi47、Ifngr2、Mmp10、Nfkbie、Npal1、p21、Relb、Ripk2、Rnd1、S1pr3、Stx11、Tgtp、Tlr2、Tmem140、Tnfaip2、Tnfrsf6、Vcam1、1110004C05Rik(GenBankアクセッション番号BC010291)、Abca1、AI561871(GenBankアクセッション番号BI143915)、AI882074(GenBankアクセッション番号BB730912)、Arts1、AW049765(GenBankアクセッション番号BC026642.1)、C3、Casp4、Ccl5、Ccl9、Cdsn、Enpp2、Gbp2、H2-D1、H2-K、H2-L、Ifit1、Ii、Il13ra1、Il1rl1、Lcn2、Lhfpl2、LOC677168(GenBankアクセッション番号AK019325)、Mmp13、Mmp3、Mt2、Naf1、Ppicap、Prnd、Psmb10、Saa3、Serpina3g、Serpinf1、Sod3、Stat1、Tapbp、U90926(GenBankアクセッション番号NM_020562)、Ubd、A2AR(アデノシンA2A受容体)、B7-H3(CD276とも呼ばれる)、B7-H4(VTCN1とも呼ばれる)、BTLA(BおよびTリンパ球アテニュエータ(Lymphocyte Attenuator);CD272とも呼ばれる)、CTLA-4(細胞傷害性Tリンパ球関連タンパク質4(Cytotoxic T-Lymphocyte-Associated protein 4);CD152とも呼ばれる)、IDO(インドールアミン2,3-ジオキシゲナーゼ)KIR(キラー細胞免疫グロブリン様受容体(Killer-cell Immunoglobulin-like Receptor)、LAG3(リンパ球活性化遺伝子-3(Lymphocyte Activation Gene-3))、PD-1(プログラム死1(Programmed Death 1)(PD-1)受容体)、TIM-3(T細胞免疫グロブリンドメインおよびムチンドメイン3)、およびVISTA(T細胞活性化のVドメインIgサプレッサー(V-domain Ig suppressor of T cell activationが挙げられる。いくつかの実施態様では、標的遺伝子は、DMD(ジストロフィン)、EMX1、またはVEGFA遺伝子である。
【0149】
8.ゲノム編集のための組成物
本発明は、ゲノム編集、ゲノム変更、または標的遺伝子の遺伝子発現の変更のための組成物を対象とする。この組成物は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と共に、開示された方法によって産生された最適化されたgRNAを含む。いくつかの実施態様では、gRNAは、オンターゲット部位とオフターゲット部位とを、これらの部位間の最小熱力学的エネルギー差を用いて識別し、増大された特異性を提供することができる。いくつかの実施態様では、最適化されたgRNAは、プロトスペーサーへのストランド侵入を調節する。
【0150】
特異性の増大は、完全長または標準gRNAの5’末端または3’末端に、これが、「ヘアピン」構造を形成するように、プロトスペーサーを標的にする完全長または標準gRNAのセグメントに対して自己相補的である伸長部、例えばプロトスペーサー-ターゲティング配列を付加することによって達成される。図1Bおよび図2Bを参照のこと。ヘアピンは、プロトスペーサーのストランド侵入に対する速度論的バリアとして働くが、完全な標的部位のストランド侵入中は、ヘアピンは置き換えられ、完全な侵入が起こる可能性がある。
【0151】
図2Dに示す通り、dCas9による完全なプロトスペーサーへの結合は、優先的に起こり、これは、ヘアピンが、侵入中に実際に置き換えられることを強く示唆している。ヘアピンである開示された最適化されたgRNAは、標的と、ガイドRNAのPAM遠位ターゲティング領域との間のミスマッチが存在する場合に侵入を阻害することによって、標的とされる部位に結合する際の特異性が増大されるように設計された。この場合には、ヘアピンにとっては、閉じたままであることが、エネルギー的に、より好都合であり、ヘアピンの存在は、融解およびこれらの部位からのCas9/dCas9の脱離を促進する可能性が高い。
【0152】
5’-ヘアピンまたは3’-ヘアピンを有する最適化されたgRNA(hpgRNA)は、結合の際の特異性を、標準のガイドRNAおよび利用可能な最良のガイドRNAバリアント(実施例参照)の両方と比較して著しく増強し、ミスマッチを含有するプロトスペーサー部位での結合をなくすまたは著しく弱めた。ヘアピンの長さを増大させることは、dCas9結合の特異性を増大させた。最適化されたgRNAおよびhpgRNAは、Cas9/dCas9またはCpf1結合の親和性および特異性を調整するために使用することができる。ヘアピンのサイズおよび構造に基づいて、hpgRNAのヘアピンを、Cas9/dCas9分子のDNA結合チャネル内に適合させ、分解から保護することができた。いくつかの実施態様では、ヘアピン長、ループ長、およびループ組成を、これらの特性の、より精細な制御を可能にするために変化させることができる。いくつかの実施態様では、前記ヘアピン長は、約1から約20ヌクレオチドまたは約3から約10ヌクレオチドであり得る。例えば、前記ヘアピン長は、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10であり得る。例えば、前記ヘアピン長は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20、または約5から約8ヌクレオチドであり得る。
【0153】
いくつかの実施態様では、前記ループ長は、約1から約20ヌクレオチド、約3から約10ヌクレオチド、または約5から約8ヌクレオチドであり得る。例えば、前記ループ長は、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10であり得る。いくつかの実施態様では、前記ループ長は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20、または約5から約8ヌクレオチドであり得る。
【0154】
いくつかの実施態様では、ループ組成は、約1から約20ヌクレオチド、約3から約10ヌクレオチド、または約5から約8ヌクレオチドであり得る。例えば、前記ループ組成は、1から20、1から19、1から18、1から17、1から16、1から15、1から14、1から13、1から12、1から11、1から10、1から9、1から8、1から7、1から6、1から5、2から20、2から19、2から18、2から17、2から16、2から15、2から14、2から13、2から12、2から11、2から10、2から9、2から8、2から7、2から6、2から5、3から20、3から19、3から18、3から17、3から16、3から15、3から14、3から13、3から12、3から11、3から10、3から9、3から8、3から7、3から6、3から5、4から20、4から19、4から18、4から17、4から16、4から15、4から14、4から13、4から12、4から11、4から10、4から9、4から8、4から7、4から6、4から5、5から20、5から19、5から18、5から17、5から16、5から15、5から14、5から13、5から12、5から11、5から10、5から9、5から8、5から7、5から6、6から20、6から19、6から18、6から17、6から16、6から15、6から14、6から13、6から12、6から11、6から10、6から9、6から8、6から7、7から20、7から19、7から18、7から17、7から16、7から15、7から14、7から13、7から12、7から11、7から10、7から9、7から8、8から20、8から19、8から18、8から17、8から16、8から15、8から14、8から13、8から12、8から11、8から10、8から9、9から20、9から19、9から18、9から17、9から16、9から15、9から14、9から13、9から12、9から11、または9から10であり得る。いくつかの実施態様では、ループ組成は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20、または約5から約8ヌクレオチドであり得る。
【0155】
前記組成物は、ウイルスベクターと、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系とを含むことができる。いくつかの実施態様では、前記組成物は、改変されたAAVベクターと、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系をコードするヌクレオチド配列とを含む。前記組成物は、ドナーDNAまたは導入遺伝子をさらに含むことができる。これらの組成物は、ゲノム編集、ゲノム工学、および遺伝性疾患に関与する遺伝子の変異の影響の修正または低減において使用することができる。
【0156】
標的遺伝子は、細胞の分化に、または、遺伝子の活性化、抑制、もしくは破壊が所望される可能性がある、または欠失、フレームシフト変異、もしくはナンセンス変異などの変異を有する可能性がある、いずれかの他のプロセスに関与する可能性がある。標的遺伝子が、未成熟終止コドン、異所性スプライス受容部位、または異所性スプライス供与部位を引き起こす変異を有する場合、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、これらの未成熟終止コドン、異所性スプライス受容部位、または異所性スプライス供与部位の上流または下流のヌクレオチド配列を認識および結合するように設計することができる。本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系はまた、スプライス受容部および供与部を標的にして、未成熟終止コドンのスキッピングを誘発するまたは破壊された読み枠を修復することによって、正常な遺伝子スプライシングを破壊するために使用することもできる。本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、ゲノムのタンパク質-コード領域へのオフターゲット変化を媒介する可能性もしない可能性もある。
【0157】
いくつかの実施態様では、CRISPR/Cas9に基づく系は、標的遺伝子の遺伝子発現を、遺伝子発現の対照レベルと比較して、少なくとも約1倍、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約6倍、少なくとも約7倍、少なくとも約8倍、少なくとも約9倍、少なくとも約10倍、少なくとも15倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、少なくとも約110倍、少なくとも120倍、少なくとも130倍、少なくとも140倍、少なくとも150倍、少なくとも160倍、少なくとも170倍、少なくとも180倍、少なくとも190倍、少なくとも200倍、少なくとも約300倍、少なくとも400倍、少なくとも500倍、少なくとも600倍、少なくとも700倍、少なくとも800倍、少なくとも900倍、少なくとも1000倍、少なくとも1500倍、少なくとも2000倍、少なくとも2500倍、少なくとも3000倍、少なくとも3500倍、少なくとも4000倍、少なくとも4500倍、少なくとも5000倍、少なくとも600倍、少なくとも7000倍、少なくとも8000倍、少なくとも9000倍、少なくとも10000倍、少なくとも100000倍、誘発または抑制する。標的遺伝子の遺伝子発現の対照レベルは、いずれのCRISPR/Cas9に基づく系でも処理されていない細胞における標的遺伝子の遺伝子発現のレベルであり得る。
【0158】
a.改変されたレンチウイルスベクター
ゲノム編集、ゲノム変更、または標的遺伝子の遺伝子発現の変更のための組成物は、改変されたレンチウイルスベクターを含むことができる。この改変されたレンチウイルスベクターは、系をコードする第1のポリヌクレオチド配列と、少なくとも1種のsgRNAをコードする第2のポリヌクレオチド配列を含む。第1のポリヌクレオチド配列は、プロモーターに作動可能に連結せることができる。プロモーターは、構成的プロモーター、誘導性プロモーター、抑制性プロモーター、または調節性プロモーターであり得る。
【0159】
第2のポリヌクレオチド配列は、本明細書に記載した最適化されたgRNAなどの、少なくとも1種のgRNAをコードする。例えば、第2のポリヌクレオチド配列は、少なくとも1種のgRNA、少なくとも2種のgRNA、少なくとも3種のgRNA、少なくとも4種のgRNA、少なくとも5種のgRNA、少なくとも6種のgRNA、少なくとも7種のgRNA、少なくとも8種のgRNA、少なくとも9種のgRNA、少なくとも10種のgRNA、少なくとも11種のgRNA、少なくとも12種のgRNA、少なくとも13種のgRNA、少なくとも14種のgRNA、少なくとも15種のgRNA、少なくとも16種のgRNA、少なくとも17種のgRNA、少なくとも18種のgRNA、少なくとも19種のgRNA、少なくとも20種のgRNA、少なくとも25種のgRNA、少なくとも30種のgRNA、少なくとも35種のgRNA、少なくとも40種のgRNA、少なくとも45種のgRNA、または少なくとも50種のgRNAをコードすることができる。第2のポリヌクレオチド配列は、1種のgRNAから50種のgRNA、1種のgRNAから45種のgRNA、1種のgRNAから40種のgRNA、1種のgRNAから35種のgRNA、1種のgRNAから30種のgRNA、1種のgRNAから25種の異なるgRNA、1種のgRNAから20種のgRNA、1種のgRNAから16種のgRNA、1種のgRNAから8種の異なるgRNA、4種の異なるgRNAから50種の異なるgRNA、4種の異なるgRNAから45種の異なるgRNA、4種の異なるgRNAから40種の異なるgRNA、4種の異なるgRNAから35種の異なるgRNA、4種の異なるgRNAから30種の異なるgRNA、4種の異なるgRNAから25種の異なるgRNA、4種の異なるgRNAから20種の異なるgRNA、4種の異なるgRNAから16種の異なるgRNA、4種の異なるgRNAから8種の異なるgRNA、8種の異なるgRNAから50種の異なるgRNA、8種の異なるgRNAから45種の異なるgRNA、8種の異なるgRNAから40種の異なるgRNA、8種の異なるgRNAから35種の異なるgRNA、8種の異なるgRNAから30種の異なるgRNA、8種の異なるgRNAから25種の異なるgRNA、8種の異なるgRNAから20種の異なるgRNA、8種の異なるgRNAから16種の異なるgRNA、16種の異なるgRNAから50種の異なるgRNA、16種の異なるgRNAから45種の異なるgRNA、16種の異なるgRNAから40種の異なるgRNA、16種の異なるgRNAから35種の異なるgRNA、16種の異なるgRNAから30種の異なるgRNA、16種の異なるgRNAから25種の異なるgRNA、または16種の異なるgRNAから20種の異なるgRNAをコードすることができる。異なるgRNAをコードするポリヌクレオチド配列のそれぞれは、プロモーターに作動可能に連結され得る。異なるgRNAに作動可能に連結されるプロモーターは、同じプロモーターであり得る。異なるgRNAに作動可能に連結されるプロモーターは、異なるプロモーターであり得る。プロモーターは、構成的プロモーター、誘導性プロモーター、抑制性プロモーター、または調節性プロモーターであり得る。少なくとも1種のgRNAは、標的遺伝子または遺伝子座と結合することができる。2種以上のgRNAが包含される場合、gRNAのそれぞれが、1つの標的遺伝子座内の異なる標的領域と結合するか、gRNAのそれぞれが、異なる遺伝子座内の異なる標的領域と結合する。
【0160】
b.アデノ随伴ウイルスベクター
AAVは、様々なコンストラクト構造を使用して、前記組成物を細胞に送達するために使用することができる。例えば、AAVは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系および別のベクター上のgRNA発現カセットを送達することができる。あるいは、黄色ブドウ球菌(Staphylococcus aureus)または髄膜炎菌(Neisseria meningitidis)などの種由来の小さいCas9タンパク質が使用される場合、Cas9と最大2個までのgRNA発現カセットとの両方を、4.7kbのパッケージング制限内の単一のAAVベクター中で組み合わせることができる。
【0161】
組成物は、上に記載した通りに、改変されたアデノ随伴ウイルス(AAV)ベクターを含む。改変されたAAVベクターは、哺乳類の細胞において、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を送達および発現させることが可能であり得る。例えば、改変されたAAVベクターは、AAV-SASTGベクターであり得る(Piacentino et al.(2012)Human Gene Therapy 23:635-646)。改変されたAAVベクターは、AAV1、AAV2、AAV5、AAV6、AAV8、およびAAV9を含めた1つ以上のいくつかのカプシド型に基づくことができる。改変されたAAVベクターは、全身および局所送達によって骨格筋または心筋に効率的に形質導入する、AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、およびAAV/SASTGベクターなどの、代替の筋肉指向性のAAVカプシドを有するAAV2シュードタイプに基づくものであり得る(Seto et al.Current Gene Therapy(2012)12:139-151)。
【0162】
9.標的細胞
本明細書に開示する通り、本明細書に記載した最適化されたgRNAなどのgRNAを、任意の型の細胞を用いて、CRISPR/Cas9系と共に使用することができる。いくつかの実施態様では、細胞は、細菌細胞、真菌細胞、古細菌細胞、植物細胞、または動物細胞、例えば哺乳類細胞である。いくつかの実施態様では、これは、器官または動物微生物であり得る。いくつかの実施態様では、細胞は、限定はされないが、293-T細胞、3T3細胞、721細胞、9L細胞、A2780細胞、A2780ADR細胞、A2780cis細胞、A172細胞、A20細胞、A253細胞、A431細胞、A-549細胞、ALC細胞、B16細胞、B35細胞、BCP-1細胞、BEAS-2B細胞、bEnd.3細胞、BHK-21細胞、BR 293細胞、BxPC3細胞、C2C12細胞、C3H-10T1/2細胞、C6/36細胞、Cal-27細胞、CHO細胞、COR-L23細胞、COR-L23/CPR細胞、COR-L23/5010細胞、COR-L23/R23細胞、COS-7細胞、COV-434細胞、CML T1細胞、CMT細胞、CT26細胞、D17細胞、DH82細胞、DU145細胞、DuCaP細胞、EL4細胞、EM2細胞、EM3細胞、EMT6/AR1細胞、EMT6/AR10.0細胞、FM3細胞、H1299細胞、H69細胞、HB54細胞、HB55細胞、HCA2細胞、HEK-293細胞、HeLa細胞、Hepa1c1c7細胞、HL-60細胞、HMEC細胞、HT-29細胞、Jurkat細胞、J558L細胞、JY細胞、K562細胞、Ku812細胞、KCL22細胞、KG1細胞、KYO1細胞、LNCap細胞、Ma-MeI 1、2、3…48細胞、MC-38細胞、MCF-7細胞、MCF-10A細胞、MDA-MB-231細胞、MDA-MB-468細胞、MDA-MB-435細胞、MDCK II細胞、MDCK II細胞、MG63細胞、MOR/0.2R細胞、MONO-MAC 6細胞、MRC5細胞、MTD-1A細胞、MyEnd細胞、NCI-H69/CPR細胞、NCI-H69/LX10細胞、NCI-H69/LX20細胞、NCI-H69/LX4細胞、NIH-3T3細胞、NALM-1細胞、NW-145細胞、OPCN/OPCT細胞、Peer細胞、PNT-1A/PNT 2細胞、Raji細胞、RBL細胞、RenCa細胞、RIN-5F細胞、RMA/RMAS細胞、Saos-2細胞、Sf-9細胞、SiHa細胞、SkBr3細胞、T2細胞、T-47D細胞、T84細胞、THP1細胞、U373細胞、U87細胞、U937細胞、VCaP細胞、Vero細胞、WM39細胞、WT-49細胞、X63細胞、YAC-1細胞、YAR細胞、GM12878、K562、H1ヒト胚性幹細胞、HeLa-S3、HepG2、HUVEC、SK-N-SH、IMR90、A549、MCF7、HMECまたはLHCM、CD14+、CD20+、初代心臓または肝臓細胞、分化したH1細胞、8988T、Adult_CD4_naive、Adult_CD4_Th0、Adult_CD4_Th1、AG04449、AG04450、AG09309、AG09319、AG10803、AoAF、AoSMC、BC_Adipose_UHN00001、BC_Adrenal_Gland_H12803N、BC_Bladder_01-11002、BC_Brain_H11058N、BC_Breast_02-03015、BC_Colon_01-11002、BC_Colon_H12817N、BC_Esophagus_01-11002、BC_Esophagus_H12817N、BC_Jejunum_H12817N、BC_Kidney_01-11002、BC_Kidney_H12817N、BC_Left_Ventricle_N41、BC_Leukocyte_UHN00204、BC_Liver_01-11002、BC_Lung_01-11002、BC_Lung_H12817N、BC_Pancreas_H12817N、BC_Penis_H12817N、BC_Pericardium_H12529N、BC_Placenta_UHN00189、BC_Prostate_Gland_H12817N、BC_Rectum_N29、BC_Skeletal_Muscle_01-11002、BC_Skeletal_Muscle_H12817N、BC_Skin_01-11002、BC_Small_Intestine_01-11002、BC_Spleen_H12817N、BC_Stomach_01-11002、BC_Stomach_H12817N、BC_Testis_N30、BC_Uterus_BN0765、BE2_C、BG02ES、BG02ES-EBD、BJ、bone_marrow_HS27a、bone_marrow_HS5、bone_marrow_MSC、Breast_OC、Caco-2、CD20+_RO01778、CD20+_RO01794、CD34+_Mobilized、CD4+_Naive_Wb11970640、CD4+_Naive_Wb78495824、Cerebellum_OC、Cerebrum_frontal_OC、Chorion、CLL、CMK、Colo829、Colon_BC、Colon_OC、Cord_CD4_naive、Cord_CD4_Th0、Cord_CD4_Th1、Decidua、Dnd41、ECC-1、Endometrium_OC、Esophagus_BC、Fibrobl、Fibrobl_GM03348、FibroP、FibroP_AG08395、FibroP_AG08396、FibroP_AG20443、Frontal_cortex_OC、GC_B_細胞、Gliobla、GM04503、GM04504、GM06990、GM08714、GM10248、GM10266、GM10847、GM12801、GM12812、GM12813、GM12864、GM12865、GM12866、GM12867、GM12868、GM12869、GM12870、GM12871、GM12872、GM12873、GM12874、GM12875、GM12878-XiMat、GM12891、GM12892、GM13976、GM13977、GM15510、GM18505、GM18507、GM18526、GM18951、GM19099、GM19193、GM19238、GM19239、GM19240、GM20000、
H0287、H1-neurons、H7-hESC、H9ES、H9ES-AFP-、H9ES-AFP+、H9ES-CM、H9ES-E、H9ES-EB、H9ES-EBD、HAc、HAEpiC、HA-h、HAL、HAoAF、HAoAF_6090101.11、HAoAF_6111301.9、HAoEC、HAoEC_7071706.1、HAoEC_8061102.1、HA-sp、HBMEC、HBVP、HBVSMC、HCF、HCFaa、HCH、HCH_0011308.2P、HCH_8100808.2、HCM、HConF、HCPEpiC、HCT-116、Heart_OC、Heart_STL003、HEEpiC、HEK293、HEK293T、HEK293-T-REx、肝細胞、HFDPC、HFDPC_0100503.2、HFDPC_0102703.3、HFF、HFF-Myc、HFL11W、HFL24W、HGF、HHSEC、HIPEpiC、HL-60、HMEpC、HMEpC_6022801.3、HMF、hMNC-CB、hMNC-CB_8072802.6、hMNC-CB_9111701.6、hMNC-PB、hMNC-PB_0022330.9、hMNC-PB_0082430.9、hMSC-AT、hMSC-AT_0102604.12、hMSC-AT_9061601.12、hMSC-BM、hMSC-BM_0050602.11、hMSC-BM_0051105.11、hMSC-UC、hMSC-UC_0052501.7、hMSC-UC_0081101.7、HMVEC-dAd、HMVEC-dBl-Ad、HMVEC-dBl-Neo、HMVEC-dLy-Ad、HMVEC-dLy-Neo、HMVEC-dNeo、HMVEC-LBl、HMVEC-LLy、HNPCEpiC、HOB、HOB_0090202.1、HOB_0091301、HPAEC、HPAEpiC、HPAF、HPC-PL、HPC-PL_0032601.13、HPC-PL_0101504.13、HPDE6-E6E7、HPdLF、HPF、HPIEpC、HPIEpC_9012801.2、HPIEpC_9041503.2、HRCEpiC、HRE、HRGEC、HRPEpiC、HSaVEC、HSaVEC_0022202.16、HSaVEC_9100101.15、HSMM、HSMM_emb、HSMM_FSHD、HSMMtube、HSMMtube_emb、HSMMtube_FSHD、HT-1080、HTR8svn、Huh-7、Huh-7.5、HVMF、HVMF_6091203.3、HVMF_6100401.3、HWP、HWP_0092205、HWP_8120201.5、iPS、iPS_CWRU1、iPS_hFib2_iPS4、iPS_hFib2_iPS5、iPS_NIHi11、iPS_NIHi7、Ishikawa、Jurkat、Kidney_BC、Kidney_OC、LHCN-M2、LHSR、Liver_OC、Liver_STL004、Liver_STL011、LNCaP、Loucy、Lung_BC、Lung_OC、リンパ芽球様細胞株、M059J、MCF10A-Er-Src、MCF-7、MDA-MB-231、Medullo、Medullo_D341、Mel_2183、Melano、Monocytes-CD14+、Monocytes-CD14+_RO01746、Monocytes-CD14+_RO01826、MRT_A204、MRT_G401、MRT_TTC549、Myometr、ナイーブB細胞、NB4、NH-A、NHBE、NHBE_RA、NHDF、NHDF_0060801.3、NHDF_7071701.2、NHDF-Ad、NHDF-neo、NHEK、NHEM.f_M2、NHEM.f_M2_5071302.2、NHEM.f_M2_6022001、NHEM_M2、NHEM_M2_7011001.2、NHEM_M2_7012303、NHLF、NT2-D1、Olf_neurosphere、Osteobl、ovcar-3、PANC-1、Pancreas_OC、PanIsletD、PanIslets、PBDE、PBDEFetal、PBMC、PFSK-1、pHTE、Pons_OC、PrEC、ProgFib、Prostate、Prostate_OC、Psoas_muscle_OC、Raji、RCC_7860、RPMI-7951、RPTEC、RWPE1、SAEC、SH-SY5Y、Skeletal_Muscle_BC、SkMC、SKMC、SkMC_8121902.17、SkMC_9011302、SK-N-MC、SK-N-SH_RA、Small_intestine_OC、Spleen_OC、Stellate、Stomach_BC、T細胞CD4+、T-47D、T98G、TBEC、Th1、Th1_Wb33676984、Th1_Wb54553204、Th17、Th2、Th2_Wb33676984、Th2_Wb54553204、Treg_Wb78495824、Treg_Wb83319432、U2OS、U87、UCH-1、Urothelia、WERI-Rb-1、およびWI-38を含めた、あらゆる細胞型または細胞株であり得る。いくつかの実施態様では、標的細胞は、初代細胞、HEK293細胞、293Ts細胞、SKBR3細胞、A431細胞、K562細胞、HCT116細胞、HepG2細胞、またはK-Ras依存性およびK-Ras非依存性細胞群などの、あらゆる細胞であり得る。
【0163】
10.エピゲノム編集の方法
本開示は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を用いる、標的細胞または対象におけるエピゲノム編集の方法に関する。前記方法は、標的遺伝子を活性化または抑制するために使用することができる。前記方法は、細胞または対象を、本明細書に記載した通りの有効量の最適化されたgRNA分子、およびCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と接触させることを含む。いくつかの実施態様では、前記最適化されたgRNAは、ポリヌクレオチド配列によってコードされ、レンチウイルスベクターにパッケージングされる。いくつかの実施態様では、前記レンチウイルスベクターは、sgRNAをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む発現カセットを含む。いくつかの実施態様では、最適化されたgRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターは、誘導性である。
【0164】
11.部位特異的DNA切断の方法
本開示は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を用いる、標的細胞または対象における部位特異的DNA切断の方法に関する。前記方法は、細胞または対象を、本明細書に記載した通りの有効量の最適化されたgRNA分子、およびCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と接触させることを含む。いくつかの実施態様では、前記最適化されたgRNAは、ポリヌクレオチド配列によってコードされ、レンチウイルスベクターにパッケージングされる。いくつかの実施態様では、前記レンチウイルスベクターは、sgRNAをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む発現カセットを含む。いくつかの実施態様では、最適化されたgRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターは、誘導性である。
【0165】
細胞または試料に投与されるgRNAの数は、少なくとも1種のgRNA、少なくとも2種の異なるgRNA、少なくとも3種の異なるgRNA、少なくとも4種の異なるgRNA、少なくとも5種の異なるgRNA、少なくとも6種の異なるgRNA、少なくとも7種の異なるgRNA、少なくとも8種の異なるgRNA、少なくとも9種の異なるgRNA、少なくとも10種の異なるgRNA、少なくとも11種の異なるgRNA、少なくとも12種の異なるgRNA、少なくとも13種の異なるgRNA、少なくとも14種の異なるgRNA、少なくとも15種の異なるgRNA、少なくとも16種の異なるgRNA、少なくとも17種の異なるgRNA、少なくとも18種の異なるgRNA、少なくとも18種の異なるgRNA、少なくとも20種の異なるgRNA、少なくとも25種の異なるgRNA、少なくとも30種の異なるgRNA、少なくとも35種の異なるgRNA、少なくとも40種の異なるgRNA、少なくとも45種の異なるgRNA、または少なくとも50種の異なるgRNAであり得る。細胞に投与されるgRNAの数は、少なくとも1種のgRNAから少なくとも50種の異なるgRNA、少なくとも1種のgRNAから少なくとも45種の異なるgRNA、少なくとも1種のgRNAから少なくとも40種の異なるgRNA、少なくとも1種のgRNAから少なくとも35種の異なるgRNA、少なくとも1種のgRNAから少なくとも30種の異なるgRNA、少なくとも1種のgRNAから少なくとも25種の異なるgRNA、少なくとも1種のgRNAから少なくとも20種の異なるgRNA、少なくとも1種のgRNAから少なくとも16種の異なるgRNA、少なくとも1種のgRNAから少なくとも12種の異なるgRNA、少なくとも1種のgRNAから少なくとも8種の異なるgRNA、少なくとも1種のgRNAから少なくとも4種の異なるgRNA、少なくとも4種のgRNAから少なくとも50種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも45種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも40種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも35種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも30種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも25種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも20種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも16種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも12種の異なるgRNA、少なくとも4種の異なるgRNAから少なくとも8種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも50種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも45種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも40種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも35種の異なるgRNA、8種の異なるgRNAから少なくとも30種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも25種の異なるgRNA、8種の異なるgRNAから少なくとも20種の異なるgRNA、少なくとも8種の異なるgRNAから少なくとも16種の異なるgRNA、または8種の異なるgRNAから少なくとも12種の異なるgRNAであり得る。
【0166】
gRNAは、標的DNA配列の相補的ポリヌクレオチド配列、それに続くPAM配列を含むことができる。gRNAは、相補的ポリヌクレオチド配列の5’末端に「G」を含むことができる。gRNAは、少なくとも10塩基対、少なくとも11塩基対、少なくとも12塩基対、少なくとも13塩基対、少なくとも14塩基対、少なくとも15塩基対、少なくとも16塩基対、少なくとも17塩基対、少なくとも18塩基対、少なくとも19塩基対、少なくとも20塩基対、少なくとも21塩基対、少なくとも22塩基対、少なくとも23塩基対、少なくとも24塩基対、少なくとも25塩基対、少なくとも30塩基対、または少なくとも35塩基対の、標的DNA配列の相補的ポリヌクレオチド配列、それに続くPAM配列を含むことができる。PAM配列は、「NGG」であり得、ここでは、「N」は、あらゆるヌクレオチドであり得る。gRNAは、標的遺伝子のプロモーター領域、エンハンサー領域、または転写領域のうちの少なくとも1つを標的にすることができる。いくつかの実施態様では、gRNAは、配列番号13~148、316、317、または320のうちの少なくとも1つのポリヌクレオチド配列を有する核酸配列を標的にする。gRNAは、配列番号149~315、321~323、または326~329のうちの少なくとも1つの核酸配列を含むことができる。
【0167】
12.変異遺伝子を修正するおよび対象を治療する方法
本開示はまた、対象における変異遺伝子を修正する方法を対象とする。この方法は、上に記載した通りの組成物を、対象の細胞に投与することを含む。本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を細胞に送達するための組成物の使用は、修復鋳型またはドナーDNA(これらは、遺伝子全体、または変異を含有する領域を置き換えることができる)と共に、完全に機能性または部分的に機能性のタンパク質の発現を修復することができる。本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、標的とされるゲノム遺伝子座に部位特異的二本鎖切断を導入するために使用することができる。部位特異的二本鎖切断は、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系が、標的DNA配列に結合し、それによって標的DNAの切断が可能になる場合にもたらされる。このDNA切断は、天然のDNA修復機構を刺激し、可能性のある2つの修復経路:相同組換え修復(HDR)または非相同末端結合(NHEJ)経路のうちの1つをもたらすことができる。
【0168】
本開示は、読み枠を効率的に修正し、かつ遺伝性疾患に関与する機能性タンパク質の発現を修復することができる、修復鋳型を伴わない、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴うCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を用いるゲノム編集を対象とする。本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴う、開示されたCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、相同組換え修復またはヌクレアーゼ介在性の非相同末端結合(NHEJ)に基づく修正手法(これらは、相同組換えまたは選択に基づく遺伝子修正を適用できない可能性がある、増殖が制限された初代細胞株における効率的な修正を可能にする)を使用することを含むことができる。この戦略は、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴う、活性なCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の迅速かつ頑強なアセンブリーを、フレームシフト、未成熟終止コドン、異所性スプライス供与部位、または異所性スプライス受容部位をもたらす非必須コード領域の変異によって引き起こされる遺伝性疾患の治療のための効率的な遺伝子編集方法と統合する。
【0169】
a.ヌクレアーゼ介在性の非相同末端結合
内在性の変異した遺伝子からのタンパク質発現の修復は、鋳型なしのNHEJ介在性DNA修復によるものであり得る。標的遺伝子RNAを標的にする一過性の方法と対照的に、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを伴う、一過的に発現されたCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系による、ゲノムにおける標的遺伝子読み枠の修正は、それぞれの改変された細胞、およびすべてのその後代によって、永続的に修復された標的遺伝子発現をもたらすことができる。
【0170】
ヌクレアーゼ介在性のNHEJ遺伝子修正は、変異した標的遺伝子を修正し、HDR経路に勝る、いくつかの潜在的利点を提供することができる。例えば、NHEJは、非特異的挿入変異をもたらす可能性があるドナー鋳型を必要としない。HDRと対照的に、NHEJは、細胞周期のすべての期において効率的に作動するので、循環と、有糸分裂後の細胞(筋線維など)との両方において効率的に利用することができる。これは、オリゴヌクレオチドに基づくエクソンスキッピング、または終止コドンの薬物によって強いられるリードスルーに代わる、頑強な永続的な遺伝子修復を提供し、理論上はわずか1つの薬物治療しか必要としない可能性がある。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系、並びにメガヌクレアーゼおよびジンクフィンガーヌクレアーゼを含めた他の遺伝子改変されたヌクレアーゼを使用する、NHEJに基づく遺伝子修正は、本明細書に記載したプラスミド電気穿孔手法に加えて、細胞および遺伝子に基づく療法のための他の既存のエクスビボおよびインビボプラットフォームと組み合わせることができる。例えば、mRNAに基づく遺伝子導入による、または、精製された細胞透過性タンパク質としてのCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の送達は、挿入変異のいかなる可能性も回避するであろうDNAフリーのゲノム編集手法を可能にすることができる。
【0171】
b.相同組換え修復
内在性の変異した遺伝子からのタンパク質発現の修復は、相同組換え修復を含むことができる。上に記載した通りの方法は、細胞にドナー鋳型を投与することをさらに含む。ドナー鋳型は、完全に機能性または部分的に機能性のタンパク質をコードするヌクレオチド配列を含むことができる。例えば、ドナー鋳型は、小型化されたジストロフィンコンストラクト(ミニジストロフィン(「minidys」)と呼ばれる)、変異ジストロフィン遺伝子を修復するための完全に機能性のジストロフィンコンストラクト、または相同組換え修復後に変異ジストロフィン遺伝子の修復をもたらすジストロフィン遺伝子の断片を含むことができる。
【0172】
13.ゲノム編集の方法
本開示はまた、修復鋳型またはドナーDNA(これらは、遺伝子全体、または変異を含有する領域を置き換えることができる)を用いる、完全に機能性または部分的に機能性のタンパク質の発現を修復するための、上に記載したCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を用いるゲノム編集を対象とする。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、標的とされるゲノム遺伝子座に部位特異的二本鎖切断を導入するために使用することができる。部位特異的二本鎖切断は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系が、gRNAを使用して標的DNA配列に結合し、それによって標的DNAの切断が可能になる場合にもたらされる。CRISPR/Cas9に基づく系およびCRISPR/Cpf1に基づく系は、その高速の成功裡かつ効率的な遺伝子改変のおかげで、ゲノム編集の進歩という利点を有する。このDNA切断は、天然のDNA修復機構を刺激し、可能性のある2つの修復経路:相同組換え修復(HDR)または非相同末端結合(NHEJ)経路のうちの1つをもたらすことができる。
【0173】
本開示は、読み枠を効率的に修正し、かつ遺伝性疾患に関与する機能性タンパク質の発現を修復することができる、修復鋳型を伴わない、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を用いるゲノム編集を対象とする。開示されたCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系および方法は、相同組換え修復またはヌクレアーゼ介在性の非相同末端結合(NHEJ)に基づく修正手法(これらは、相同組換えまたは選択に基づく遺伝子修正を適用できない可能性がある、増殖が制限された初代細胞株における効率的な修正を可能にする)を使用することを含むことができる。この戦略は、活性なCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の迅速かつ頑強なアセンブリーを、フレームシフト、未成熟終止コドン、異所性スプライス供与部位、または異所性スプライス受容部位をもたらす非必須コード領域の変異によって引き起こされる遺伝性疾患の治療のための効率的な遺伝子編集方法と統合する。
【0174】
本開示は、細胞における変異遺伝子を修正し、DMDなどの遺伝性疾患を患う対象を治療する方法を提供する。この方法は、上に記載した通りに、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系、前記CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードするポリヌクレオチドまたはベクター、または前記CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の組成物を、細胞または対象に投与することを含むことができる。この方法は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を投与すること、例えば、Cas9タンパク質、Cpf1タンパク質、第2のドメインを含有するCas9融合タンパク質、前記Cas9タンパク質、Cpf1タンパク質、またはCas9融合タンパク質をコードするヌクレオチド配列、および/または少なくとも1種のgRNA(ここで、gRNAは、異なるDNA配列を標的にする)を投与することを含むことができる。これらの標的DNA配列は、オーバーラップしていることが可能である。細胞に投与されるgRNAの数は、上に記載した通りの、少なくとも1種のgRNA、少なくとも2種の異なるgRNA、少なくとも3種の異なるgRNA、少なくとも4種の異なるgRNA、少なくとも5種の異なるgRNA、少なくとも6種の異なるgRNA、少なくとも7種の異なるgRNA、少なくとも8種の異なるgRNA、少なくとも9種の異なるgRNA、少なくとも10種の異なるgRNA、少なくとも15種の異なるgRNA、少なくとも20種の異なるgRNA、少なくとも30種の異なるgRNA、または少なくとも50種の異なるgRNAであり得る。gRNAは、配列番号149~315、321~323、または326~329のうちの少なくとも1つの核酸配列を含むことができる。この方法は、相同組換え修復または非相同末端結合を含むことができる。
【0175】
14.コンストラクトおよびプラスミド
前記組成物は、上に記載した通り、本明細書に開示する通りのCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする遺伝子コンストラクトを含むことができる。プラスミドなどの遺伝子コンストラクトは、Cas9タンパク質、Cpf1タンパク質、およびCas9融合タンパク質などのCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸、および/または本明細書に記載した最適化されたgRNAのうちの少なくとも1つを含むことができる。前記組成物は、上に記載した通り、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAと共に、改変されたAAVベクターをコードする遺伝子コンストラクトと、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸配列を含むことができる。プラスミドなどの遺伝子コンストラクトは、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAと共に、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸を含むことができる。前記組成物は、上に記載した通り、本明細書に開示する通りの改変されたレンチウイルスベクターをコードする遺伝子コンストラクトを含むことができる。プラスミドなどの遺伝子コンストラクトは、Cas9-融合タンパク質をコードする核酸と、少なくとも1種のsgRNAとを含むことができる。遺伝子コンストラクトは、機能的な染色体外分子として、細胞内に存在することができる。遺伝子コンストラクトは、線状ミニ染色体(セントロメアを含めて)、テロメア、またはプラスミドもしくはコスミドであり得る。
【0176】
遺伝子コンストラクトはまた、組換えレンチウイルス、組換えアデノウイルス、および組換えアデノウイルス関連ウイルスを含めた、組換えウイルスベクターのゲノムの一部であり得る。遺伝子コンストラクトは、細胞内で生存する弱毒化した生きている微生物または組換え微生物ベクター中の遺伝材料の一部であり得る。遺伝子コンストラクトは、核酸のコード配列の遺伝子発現のための調節エレメントを含むことができる。調節エレメントは、プロモーター、エンハンサー、開始コドン、終止コドン、またはポリアデニル化シグナルであり得る。
【0177】
核酸配列は、遺伝子コンストラクト(これはベクターであり得る)を構成することができる。ベクターは、哺乳類の細胞において、Cas9-融合タンパク質などの融合タンパク質を発現する能力があり得る。ベクターは、組換えであり得る。ベクターは、Cas9-融合タンパク質をコードする異種の核酸を含むことができる。ベクターは、プラスミドであり得る。ベクターは、細胞に、Cas9-融合タンパク質をコードする核酸を導入するのに有用であり得、ここでは、形質転換された宿主細胞は、Cas9-融合タンパク質系の発現が起こる条件下で培養および維持される。
【0178】
コード配列は、安定性および高レベルの発現のために最適化することができる。ある場合では、コドンは、分子内結合が原因で形成されるものなどの、RNAの二次構造形成を低下させるように選択される。
【0179】
ベクターは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする異種の核酸を含むことができ、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列の上流であり得る開始コドン、およびCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列の下流であり得る終止コドンをさらに含むことができる。開始および停止コドンは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列と共に、フレーム内であり得る。ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列に作動可能に連結されたプロモーターを含むことができる。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列に作動可能に連結されたプロモーターは、サルウイルス40(SV40)由来のプロモーター、マウス乳房腫瘍ウイルス(MMTV)プロモーター、ヒト免疫不全ウイルス(HIV)プロモーター、例えばウシ免疫不全ウイルス(BIV)長い末端反復(LTR)プロモーター、モロニ―ウイルスプロモーター、トリ白血病ウイルス(ALV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えばCMV最初期プロモーター、エプスタイン・バーウイルス(EBV)プロモーター、またはラウス肉腫ウイルス(RSV)プロモーターであり得る。プロモーターはまた、ヒトユビキチンC(hUbC)、ヒトアクチン、ヒトミオシン、ヒトヘモグロビン、ヒト筋肉クレアチン、またはヒトメタロチオネインなどの、ヒト遺伝子由来のプロモーターであり得る。プロモーターはまた、天然または合成の、筋肉または皮膚特異的なプロモーターなどの組織特異的プロモーターであり得る。こうしたプロモーターの例は、その内容全体が本明細書に組み込まれる米国特許出願公開第20040175727号明細書に記載されている。
【0180】
ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の下流であり得るポリアデニル化シグナルを含むことができる。ポリアデニル化シグナルは、SV40ポリアデニル化シグナル、LTRポリアデニル化シグナル、ウシ成長ホルモン(bGH)ポリアデニル化シグナル、ヒト成長ホルモン(hGH)ポリアデニル化シグナル、またはヒトβ-グロビンポリアデニル化シグナルであり得る。SV40ポリアデニル化シグナルは、pCEP4ベクター(Invitrogen,San Diego,CA)由来のポリアデニル化シグナルであり得る。
【0181】
ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系、すなわち、Cas9タンパク質、Cpf1タンパク質、またはCas9融合タンパク質コード配列、または本明細書に記載した最適化されたgRNAなどのsgRNAの、上流のエンハンサーを含むことができる。エンハンサーは、DNA発現のために必須であり得る。エンハンサーは、ヒトアクチン、ヒトミオシン、ヒトヘモグロビン、ヒト筋肉クレアチン、またはウイルスエンハンサー、例えばCMV、HA、RSV、またはEBVに由来するものなどであり得る。ポリヌクレオチド機能エンハンサーは、それぞれの内容が参照によって完全に組み込まれる米国特許第5,593,972号明細書、米国特許第5,962,428号明細書、および国際公開第94/016737号パンフレットに記載されている。ベクターはまた、ベクターを染色体外に維持するために、哺乳類の複製開始点を含むことができ、細胞において、ベクターの複数のコピーを産生することができる。ベクターはまた、調節配列を含むことができ、調節配列は、ベクターが投与される哺乳類またはヒト細胞における遺伝子発現のために十分に適合させることができる。ベクターはまた、緑色蛍光タンパク質(「GFP」)などのレポーター遺伝子および/またはハイグロマイシン(「Hygro」)などの選択可能マーカーを含むことができる。
【0182】
ベクターは、常用の技術、および容易に入手可能な出発材料によってタンパク質を産生するための、発現ベクターまたは系であり得る(参照によって完全に組み込まれる、Sambrook et al.,Molecular Cloning and Laboratory Manual,Second Ed.,Cold Spring Harbor(1989))。いくつかの実施態様では、ベクターは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸配列(Cas9タンパク質、Cpf1タンパク質、またはCas9融合タンパク質をコードする核酸配列を含めて)、および配列番号149~315、321~323、または326~329のうちの少なくとも1つの核酸配列を含む少なくとも1種のgRNAをコードする核酸配列を含むことができる。
【0183】
15.医薬組成物
前記組成物は、医薬組成物中であり得る。この医薬組成物は、CRISPR/Cas9に基づく系、CRISPR/Cpf1に基づく系、またはCRISPR/Cas9に基づく系のタンパク質成分、すなわち、Cas9タンパク質、Cpf1タンパク質、またはCas9融合タンパク質をコードする、約1ngから約10mgのDNAを含むことができる。この医薬組成物は、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAと共に、改変されたAAVベクターの、約1ngから約10mgのDNA、およびCRISPR/Cas9に基づく系をコードするヌクレオチド配列を含むことができる。この医薬組成物は、改変されたレンチウイルスベクターの、約1ngから約10mgのDNAを含むことができる。本発明による医薬組成物は、使用される投与方式に従って製剤化される。医薬組成物が、注射用医薬組成物である場合、これは、無菌、パイロジェンフリー、かつ粒子状物質フリーである。等張性製剤が使用されることが好ましい。一般に、等張性のための添加剤は、塩化ナトリウム、デキストロース、マンニトール、ソルビトール、およびラクトースを含むことができる。場合によっては、リン酸緩衝生理食塩水などの等張性溶液が好ましい。安定剤としては、ゼラチンおよびアルブミンが挙げられる。いくつかの実施態様では、血管収縮剤が、製剤に添加される。
【0184】
前記組成物は、薬学的に許容し得る賦形剤をさらに含むことができる。薬学的に許容し得る賦形剤は、ビヒクル、アジュバント、担体、または希釈剤としての機能性分子であり得る。薬学的に許容し得る賦形剤は、遺伝子導入促進剤(これには界面活性剤が含まれ得る)、例えば免疫刺激複合体(ISCOMS)、フロイント不完全アジュバント、LPS類似体(モノホスホリルリピドAを含めて)、ムラミルペプチド、キノン類似体、ベシクル、例えばスクアレンおよびスクアレン、ヒアルロン酸、脂質、リポソーム、カルシウムイオン、ウイルスタンパク質、ポリアニオン、ポリカチオン、もしくはナノ粒子、または他の公知の遺伝子導入促進剤であり得る。
【0185】
遺伝子導入促進剤は、ポリアニオン、ポリカチオン(ポリ-L-グルタミン酸(LGS)を含めて)、または脂質である。遺伝子導入促進剤は、ポリ-L-グルタミン酸であり、より好ましくは、ポリ-L-グルタミン酸は、ゲノム編集のための組成物中に、6mg/ml未満の濃度で存在する。遺伝子導入促進剤はまた、界面活性剤、例えば免疫刺激複合体(ISCOMS)、フロイント不完全アジュバント、LPS類似体(モノホスホリルリピドAを含めて)、ムラミルペプチド、キノン類似体、およびベシクル、例えばスクアレンおよびスクアレンを含むことができ、また、遺伝子コンストラクトと共に、ヒアルロン酸も使用、投与することができる。いくつかの実施態様では、前記組成物をコードするDNAベクターはまた、遺伝子導入促進剤、例えば脂質、リポソーム(レシチンリポソーム、または、当技術分野で公知の他のリポソームを含めて)、DNA-リポソーム混合物としてのもの(例えば国際公開第09324640号パンフレット参照)、カルシウムイオン、ウイルスタンパク質、ポリアニオン、ポリカチオン、またはナノ粒子、または他の公知の遺伝子導入促進剤を含むことができる。好ましくは、遺伝子導入促進剤は、ポリアニオン、ポリカチオン(ポリ-L-グルタミン酸(LGS)を含めて)、または脂質である。
【0186】
16.コンストラクトおよびプラスミド
前記組成物は、上に記載した通り、本明細書に開示する通りのCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする遺伝子コンストラクトを含むことができる。プラスミドまたは発現ベクターなどの遺伝子コンストラクトは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸、および/または本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAを含むことができる。前記組成物は、上に記載した通り、改変されたレンチウイルスベクターをコードする遺伝子コンストラクトと、本明細書に開示する通りのCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸配列を含むことができる。プラスミドなどの遺伝子コンストラクトは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸を含むことができる。前記組成物は、上に記載した通り、改変されたレンチウイルスベクターをコードする遺伝子コンストラクトを含むことができる。プラスミドなどの遺伝子コンストラクトは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸と、本明細書に記載した最適化されたgRNAなどの少なくとも1種のsgRNAとを含むことができる遺伝子コンストラクトは、機能的な染色体外分子として、細胞内に存在することができる。遺伝子コンストラクトは、線状ミニ染色体(セントロメアを含めて)、テロメア、またはプラスミドもしくはコスミドであり得る。
【0187】
遺伝子コンストラクトはまた、組換えレンチウイルス、組換えアデノウイルス、および組換えアデノウイルス関連ウイルスを含めた、組換えウイルスベクターのゲノムの一部であり得る。遺伝子コンストラクトは、細胞内で生存する弱毒化した生きている微生物または組換え微生物ベクター中の遺伝材料の一部であり得る。遺伝子コンストラクトは、核酸のコード配列の遺伝子発現のための調節エレメントを含むことができる。調節エレメントは、プロモーター、エンハンサー、開始コドン、終止コドン、またはポリアデニル化シグナルであり得る。
【0188】
核酸配列は、遺伝子コンストラクト(これはベクターであり得る)を構成することができる。ベクターは、哺乳類の細胞において、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系などの融合タンパク質を発現する能力があり得る。ベクターは、組換えであり得る。ベクターは、CRISPR/Cas9に基づく系などの融合タンパク質をコードする異種の核酸を含むことができる。ベクターは、プラスミドであり得る。ベクターは、細胞に、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸を導入するのに有用であり得、ここでは、転換された宿主細胞は、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の発現が起こる条件下で培養および維持される。
【0189】
コード配列は、安定性および高レベルの発現のために最適化することができる。ある場合では、コドンは、分子内結合が原因で形成されるものなどの、RNAの二次構造形成を低下させるように選択される。
【0190】
ベクターは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする異種の核酸を含むことができ、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列の上流であり得る開始コドン、およびCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列の下流であり得る終止コドンをさらに含むことができる。開始および停止コドンは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列と共に、フレーム内であり得る。ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列に作動可能に連結されたプロモーターを含むことができる。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系は、時空間における動的な制御を可能にするために、光誘導性または化学誘導性制御下であり得る。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系コード配列に作動可能に連結されたプロモーターは、サルウイルス40(SV40)由来のプロモーター、マウス乳房腫瘍ウイルス(MMTV)プロモーター、ヒト免疫不全ウイルス(HIV)プロモーター、例えばウシ免疫不全ウイルス(BIV)長い末端反復(LTR)プロモーター、モロニ―ウイルスプロモーター、トリ白血病ウイルス(ALV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えばCMV最初期プロモーター、エプスタイン・バーウイルス(EBV)プロモーター、またはラウス肉腫ウイルス(RSV)プロモーターであり得る。プロモーターはまた、ヒトユビキチンC(hUbC)、ヒトアクチン、ヒトミオシン、ヒトヘモグロビン、ヒト筋肉クレアチン、またはヒトメタロチオネインなどの、ヒト遺伝子由来のプロモーターであり得る。プロモーターは、天然または合成の、筋肉または皮膚特異的なプロモーターなどの組織特異的プロモーターであり得る。こうしたプロモーターの例は、その内容全体が本明細書に組み込まれる米国特許出願公開第20040175727号明細書に記載されている。
【0191】
ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の下流であり得るポリアデニル化シグナルを含むことができる。ポリアデニル化シグナルは、SV40ポリアデニル化シグナル、LTRポリアデニル化シグナル、ウシ成長ホルモン(bGH)ポリアデニル化シグナル、ヒト成長ホルモン(hGH)ポリアデニル化シグナル、またはヒトβ-グロビンポリアデニル化シグナルであり得る。SV40ポリアデニル化シグナルは、pCEP4ベクター(Invitrogen,San Diego,CA)由来のポリアデニル化シグナルであり得る。
【0192】
ベクターはまた、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系、および/または本明細書に記載した最適化されたgRNAなどのsgRNAの、上流のエンハンサーを含むことができる。エンハンサーは、DNA発現のために必須であり得る。エンハンサーは、ヒトアクチン、ヒトミオシン、ヒトヘモグロビン、ヒト筋肉クレアチン、またはウイルスエンハンサー、例えばCMV、HA、RSV、またはEBVに由来するものなどであり得る。ポリヌクレオチド機能エンハンサーは、それぞれの内容が参照によって完全に組み込まれる米国特許第5,593,972号明細書、米国特許第5,962,428号明細書、および国際公開第94/016737号パンフレットに記載されている。ベクターはまた、ベクターを染色体外に維持するために、哺乳類の複製開始点を含むことができ、細胞において、ベクターの複数のコピーを産生することができる。ベクターはまた、調節配列を含むことができ、調節配列は、ベクターが投与される哺乳類またはヒト細胞における遺伝子発現のために十分に適合させることができる。ベクターはまた、緑色蛍光タンパク質(「GFP」)などのレポーター遺伝子および/またはハイグロマイシン(「Hygro」)などの選択可能マーカーを含むことができる。
【0193】
ベクターは、常用の技術、および容易に入手可能な出発材料によってタンパク質を産生するための、発現ベクターまたは系であり得る(参照によって完全に組み込まれる、Sambrook et al.,Molecular Cloning and Laboratory Manual,Second Ed.,Cold Spring Harbor(1989))。いくつかの実施態様では、ベクターは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする核酸配列、および本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAをコードする核酸配列を含むことができる。
【0194】
いくつかの実施態様では、本明細書に記載した最適化されたgRNAなどのgRNAは、ポリヌクレオチド配列によってコードされ、レンチウイルスベクターにパッケージングされる。いくつかの実施態様では、レンチウイルスベクターは、発現カセットを含む。発現カセットは、本明細書に記載した最適化されたgRNAなどの、gRNAをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含むことができる。いくつかの実施態様では、gRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターは、誘導性である。
【0195】
i.アデノ随伴ウイルスベクター
組成物は、上に記載した通りに、改変されたアデノ随伴ウイルス(AAV)ベクターを含む。改変されたAAVベクターは、増進された心筋および骨格筋組織指向性を有することができる。改変されたAAVベクターは、哺乳類の細胞において、本明細書に記載した最適化されたgRNAなどの少なくとも1種のgRNAと共に、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を送達および発現させることが可能であり得る。例えば、改変されたAAVベクターは、AAV-SASTGベクターであり得る(Piacentino et al.(2012)Human Gene Therapy 23:635-646)。改変されたAAVベクターは、ヌクレアーゼを、骨格筋および心筋にインビボで送達することができる。改変されたAAVベクターは、AAV1、AAV2、AAV5、AAV6、AAV8、およびAAV9を含めた1つ以上のいくつかのカプシド型に基づくことができる。改変されたAAVベクターは、全身および局所送達によって骨格筋または心筋に効率的に形質導入する、AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、およびAAV/SASTGベクターなどの、代替の筋肉指向性のAAVカプシドを有するAAV2シュードタイプに基づくものであり得る(Seto et al.Current Gene Therapy(2012)12:139-151)。
【0196】
17.送達の方法
本明細書で提供されるのは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の遺伝子コンストラクトおよび/またはタンパク質を提供するための、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と、本明細書に記載した最適化されたgRNAとを送達するための方法である。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と、本明細書に記載した最適化されたgRNAとの送達は、細胞において発現され、かつ細胞の表面に送達される、1つ以上の核酸分子としての、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と、本明細書に記載した最適化されたgRNAとの遺伝子導入または電気穿孔であり得る。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系タンパク質を、細胞に送達することができる。これらの核酸分子は、BioRad Gene Pulser XcellまたはAmaxa Nucleofector IIb装置または他の電気穿孔装置を使用して電気穿孔することができる。BioRad電気穿孔溶液、Sigmaリン酸緩衝生理食塩水(製品#D8537)(PBS)、Invitrogen OptiMEM I(OM)、またはAmaxa Nucleofector溶液V(N.V.)を含めた、いくつかの様々な緩衝液を使用することができる。遺伝子導入は、Lipofecamine 2000などの遺伝子導入試薬を含むことができる。
【0197】
CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系タンパク質をコードするベクターは、インビボ電気穿孔を伴うまたは伴わないDNA注入(DNAワクチン接種とも呼ばれる)、リポソーム介在、ナノ粒子促進、および/または組換えベクターによって、組織または対象中の改変された標的細胞に送達することができる。組換えベクターは、任意のウイルス型によって送達することができる。ウイルス型は、組換えレンチウイルス、組換えアデノウイルス、および/または組換えアデノ随伴ウイルスであり得る。
【0198】
標的遺伝子の遺伝子発現を誘発するために、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系タンパク質をコードするヌクレオチドを、細胞に導入することができる。例えば、標的遺伝子に誘導されるCRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系をコードする1つ以上のヌクレオチド配列を、哺乳類細胞に導入することができる。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系の細胞への送達時に、また、ベクターの哺乳類の細胞への送達時に、遺伝子導入細胞sは、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を発現することとなる。CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系を、哺乳類に投与して、哺乳類における標的遺伝子の遺伝子発現を誘発または調節することができる。哺乳類は、ヒト、非ヒト霊長類、ウシ、ブタ、ヒツジ、ヤギ、アンテロープ、バイソン、スイギュウ、ウシ科動物(bovid)、シカ、ハリネズミ、ゾウ、ラマ、アルパカ、マウス、ラット、またはニワトリ、好ましくはヒト、ウシ、ブタ、またはニワトリであり得る。
【0199】
核酸を宿主細胞に導入する方法は、当技術分野で公知であり、任意の公知の方法を使用して、核酸(例えば発現コンストラクト)を細胞に導入することができる。適切な方法としては、例えば、ウイルスまたはバクテリオファージ感染、遺伝子導入、接合、プロトプラスト融合、リポフェクション、電気穿孔、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)介在性の遺伝子導入、DEAE-デキストラン介在性の遺伝子導入、リポソーム介在性の遺伝子導入、パーティクル・ガン技術、リン酸カルシウム沈殿、直接マイクロインジェクション、ナノ粒子介在性の核酸送達などが挙げられる。いくつかの実施態様では、組成物は、mRNA送達およびリボ核タンパク質(RNP)複合体送達によって送達することができる。
【0200】
18.投与の経路
組成物は、経口的、非経口的、舌下、経皮、直腸内、経粘膜、局所的、吸入を介して、頬側投与を介して、胸膜内、静脈内、動脈内、腹腔内、皮下、筋肉内、鼻腔内、くも膜下腔内、および関節内、またはこれらの組み合わせを含めた、様々な経路によって、対象に投与することができる。獣医学的使用については、組成物は、通常の獣医学診療に従って、適切に許容される製剤として投与することができる。獣医師は、ある特定の動物にとって最も適した投薬レジメンおよび投与経路を容易に決定することができる。組成物は、従来のシリンジ、無針注射装置、「微粒子銃(microprojectile bombardment gone guns)」、または他の物理的方法、例えば電気穿孔(「EP」)、「水力学的方法」、または超音波によって投与することができる。
【0201】
組成物は、インビボ電気穿孔を伴うまたは伴わないDNA注入(DNAワクチン接種とも呼ばれる)、リポソーム介在、ナノ粒子促進、組換えベクター、例えば組換えレンチウイルス、組換えアデノウイルス、および組換えアデノウイルス関連ウイルスを含めたいくつかの技術によって、哺乳類に送達することができる。組成物は、骨格筋または心筋に注射することができる。例えば、組成物は、前脛骨筋に注射することができる。
【0202】
19.キット
本明細書で提供されるのは、部位特異的DNA結合に使用することができるキットである。キットは、上に記載した通りの組成物、および前記組成物を使用するための説明書を含む。キットに含まれる説明書は、包装材料に貼り付けることもできるし、パッケージ挿入物として含めることもできる。説明書は、一般的に、書面のまたは印刷された素材であるが、これに限定されない。こうした説明書を保管する、また、これらをエンドユーザーに伝えることが可能なあらゆる媒体が、本開示によって企図される。こうした媒体としては、限定はされないが、電子記憶媒体(例えば、磁気ディスク、テープ、カートリッジ、チップ)、光学媒体(例えばCD ROM)などが挙げられる。本明細書で使用する場合、用語「説明書」は、説明書を提供するインターネットサイトのアドレスを含むことができる。
【0203】
前記組成物は、上に記載した通りに、改変されたレンチウイルスベクターと、CRISPR/Cas9に基づく系をコードするヌクレオチド配列と、最適化されたgRNAとを含むことができる。CRISPR/Cas9に基づく系は、上に記載した通りに、調節領域の特定の調節領域と特異的に結合および標的にするためのキットに含めることができる。
【実施例0204】
20.実施例
先述のことは、例示の目的のために与えられ、かつ本発明の範囲を制限しない、次の実施例を参照することによって、より良く理解することができる。
【0205】
実施例1
材料および方法
材料。Tris-HCl(pH7.6)緩衝液は、Corning Life Sciencesから入手した。L-グルタミン酸一カリウム塩一水和物、ジチオスレイトール(DTT)、および塩化マグネシウムは、Sigma Aldrich Co.,LLCから入手した。
【0206】
Cas9、dCas9、およびsgRNA発現プラスミドのクローニング;ヒト染色体19のAAVS1遺伝子座を標的にするCas9、dCas9、およびsgRNAをコードするプラスミドを、標準の技術を使用してクローン化し、発現させ、精製した。画像化のために使用したDNA基質-(i)ヒト染色体19のAAVS1遺伝子座のセグメント由来の1198bpの基質;(ii)一連の6つの完全な、部分的な、またはミスマッチの標的部位を含有する「遺伝子改変された」989bpのDNA基質;および(iii)プロトスペーサー(>3bp)との相同性を含有しない1078bpの「ナンセンス」基質-も、標準の技術を使用して産生した。野生型Cas9およびdCas9をコードするプラスミドは、Addgeneから入手した(プラスミド39312およびプラスミド47106)。細菌におけるCas9およびdCas9の発現のためのプラスミドを、Gateway Cloning(Life Technologies)を使用してクローン化した。簡単に言うと、PCRを使用して、Cas9およびdCas9遺伝子を増幅し、隣接するattL1およびattL2部位を付加した。BP組換えを実施して、これらの遺伝子をシャトルベクターに導入し、その後、LP組換えを実施して、これらの遺伝子をpDest17に導入し、N末端ヘキサ-ヒスチジンタグ(Life Technologies)を付加した。キメラsgRNAおよびsgRNAバリアントをコードするプラスミド(下に記載する)を、以前に記載されている通りにクローン化した(Perez-Pinera et al.,(2013)Nature methods,10,973-976)。
【0207】
Cas9、dCas9の発現および精製。Cas9またはdCas9をコードするプラスミドを、標準の技術に従って、SoluBL21コンピテント細胞(Genlantis)に形質転換した(Sambrook,J.、Fritsch,E.F.、およびManiatis,T.(1989)Molecular cloning.Cold spring harbor laboratory press New York.)。単一のコロニーを使用して、25mLの発端培養物(starter culture)を播種した。25mLの発端培養物を、一晩成長させ、1L培養物を播種するために使用した。播種した1Lの培養物を、25℃で5時間成長させ、その後、温度を16℃まで下げ、0.1mM IPTGの添加によってタンパク質発現を誘発した。誘発した培養物を、16℃でさらに12時間成長させた。細胞を、4000×gの遠心分離によって収集し、長期保管のために-80℃で保管した。
【0208】
細胞ペレットを、30mLのLysis緩衝液(50mM Tris-HCl、500mM NaCl、10mM MgCl2、10%v/vグリセロール、0.2% Triton-1000、および1mM PMSF)に再懸濁した。この細胞懸濁液を、5分間の30%デューティーサイクルでの超音波処理によって溶解した。次いで、この懸濁液を、12,000×gで30分間遠心分離した。次いで、上清を取り、Ni-NTA樹脂(Qiagen)と共に、穏やかな撹拌下で30分間インキュベートした。次いで、この樹脂を、カラムに充填し、洗浄緩衝液(35mMイミジゾール(imidizole)、50mM Tris-HCl、500mM NaCl、10mM MgCl2、10%v/v グリセロール)で洗浄し、溶離緩衝液(120mMイミジゾール(imidizole)、50mM Tris-HCl、500mM NaCl、10mM MgCl2、10% v/v グリセロール)で溶離した。次いで、Ultracel-30k遠心濾過器を使用して、溶媒を保管緩衝液(50mM Tris-HCl、500mM NaCl、10mM MgCl2、10%v/vグリセロール)に交換した。次いで、試料を分割し、-80℃で凍結した。精製されたCas9およびdCas9の代表的なポリアクリルアミドSDSゲルを、図S1に示す。これは、およそ>95%純度を示している。
【0209】
sgRNAおよびガイドRNAバリアントの発現および精製。ガイドRNAは、MEGAshortscript T7 Transcription Kit(Life Technologies)を使用してインビトロで転写させた。T7プロモーターを有するDNA鋳型は、ガイドRNAプラスミドからPCRを介して産生し、反応は、製造業者の説明書に従って設定した。その5’末端から2ヌクレオチドが切り詰められたガイドRNA(tru-gRNA)、およびヘアピン(hp-gRNA)を形成する5’伸長部を伴うものに対するT7鋳型は、標準のgRNAプラスミドのPCRによって産生した。次いで、標準の技術を使用するフェノール-クロロホルム抽出を使用して、RNAを精製した(Sambrook et al.(1989)Molecular cloning.Cold spring harbor laboratory press New York)。
【0210】
DNA基質の産生。ゲノムDNAを、製造業者のプロトコルに従ってDNeasyキット(Qiagen)を使用して、HEK293T細胞株から抽出および精製した。次いで、PCRを使用して、AAVS1遺伝子座を増幅した。AAVS1由来の1198bpの基質を、Integrated DNA Technologies(IDT)からのプライマー:5’-\Bt\-CCAGGATCAGTGAAACGCAC-3’および5’-GAGCTCTACTGGCTTCTGCG-3’(ここで、\Bt\は、5’末端でのプライマーのビオチン標識を表す)を使用して、ゲノムDNAから、ダイレクトPCRを介して構築した。一連のPAMおよび完全または部分的なプロトスペーサー部位を含有する「遺伝子改変された」DNA基質を、それぞれが一端にEcoRI制限部位を含有する2つのgBlock断片として注文した。基質を、消化し、共に連結させ、次いで、プライマー(Integrated DNA Technologies,IDT):5’-\Bt\-CATGACGTGCAGCAAGC-3’および5’-CGACGATGCGCTGAATC-3’を用いるPCRを介して濃縮した。プロトスペーサーとの相同性(3bp超)を示す部位を含有しない「ナンセンス」基質を構築するために:一連の制限部位を含有する690bpのDNAコンストラクトを合成し(GeneScript,Inc.)、このコンストラクトに、ラムダDNA由来の追加の長さのDNA(New England Biolabs)をサブクローン化した;次いで、1078bpの基質を、プライマー(IDT):5’-\Bt\-GACCTGCAGGCATGCAAGCTTGG-3’および5’-CAGCGTCCCCGGTTGTGAATCT-3’を使用してPCR増幅した。すべてのDNAを、ゲル精製し、作業用緩衝液(20mM Tris-HCl(pH7.6)、100mMグルタミン酸カリウム、5mM MgCl2、および0.4mM DTT)で25nMに希釈し、40×の過剰な単量体ストレプトアビジンと共に10分間インキュベートし(Howarth et al.,(2006)Nature Methods,3,267-273)、その後Cas9/dCas9と共にインキュベートした。
【0211】
精製されたCas9およびdCas9のドデシル硫酸ナトリウム-ポリアクリルアミドゲルを、図8A~8Bに示す。これは、およそ>95%純度を示している。
【0212】
原子間力顕微鏡観察。原子間力顕微鏡観察(AFM)を、RTSEP(Bruker)プローブを用いるBruker(nee Veeco)Nanoscope V Multimodeを使用して、大気中で実施した(公称ばね定数40N/m、共振周波数300kHz)。実験の前に、タンパク質とガイドRNAを、1:1.5の比で、10分間混合した。タンパク質とDNAは、作業用緩衝液の溶液中で、室温で少なくとも10分間(最大35分)混合し、(以前に記載された通りに(24))調製された3-アミノプロピルシロキサンで処理されている新しく切断した雲母(Ted Pella,Inc.)上に8秒間沈着させ、超純水(>17MΩ)ですすぎ、風乾した。タンパク質を、簡単に遠心分離し、その後、DNAと共にインキュベートした。標準のsgRNAを使用した場合、各実験条件について少なくとも4つ、他のガイドRNAバリアントを用いる実験について少なくとも2つの調製物を画像化した。一般に、画像は、各試料について1-1.5ライン/秒で、2.75平方ミクロンの面積に対して1024×1024または5.5平方ミクロンの面積に対して2048×2048のピクセル解像度で得られた。各実験条件について、数千(約2500~6000)のDNA分子の画像を解像した。
【0213】
サブピクセル(Sub-Pixel)分解能を用いるDNA追跡および精細化。得られたAFM画像を、走査型プローブ顕微鏡のためのオープンソースの画像分析ソフトウェアGwyddion(http://gwyddion.net/)を使用して平滑化および平準化(平面的な(plane-wise)、線による、三次多項式による平準化)し、次いで、MATLAB(Mathworks,Inc.)にエクスポートした。各DNA分子を含有する151×151ピクセル(405nm×405nm)領域を、凝集または他のDNA分子との重なりがないことを確実にするために、明確に識別できるストレプトアビジン標識、少なくとも1つの結合したCas9/dCas9分子の存在、およびはっきりとした端から端までの経路について、目視によって選別した。DNAの輪郭を手でトレースし、ストレプトアビジンおよびCas9/dCas9の推定される境界に印を付けた。次いで、このトレースを、Wiggins et al.(2006)Nature nanotechnology,1,137-141に基づく方法を使用して、アルゴリズムによって精細化した。ストレプトアビジンの強調された中心(x1)から開始し、バックボーンの次のエレメントの位置(x2)を、ストレプトアビジンの推定される境界を越える手でトレースした最も近い点に向かって2.5nm進むことによって推定する。DNAの画像の2倍の線形補間に対して、x2での(x1-x2)線分に垂直に、11ピクセルの線を引く。x2を、最大組織分布的高さを有する法線上の位置に再配置し、次いで、新しい(x1-x2)線上のx1から2.5nmに調整する。x3の位置…次いで、xnを、手でトレースした最も近い点を使用して反復的に推定して、次のバックボーン位置についての最初の推測をもたらし、次いで、前述の通りに修正し、点xnが、トレースされたDNA分子の端から2.5nm未満になるまで修正プロセスを継続する。精細化したトレースが、xiでCas9/dCas9分子の推定される境界に入ったら、その代わりに、DNAの位置を、xiから2.5nmに位置する、3次エルミート(Hermite)スプライン上の点(点xi-1、xi、xj、およびxj+1を使用する。ここでは、xjは、推定されるCas9/dCas9境界を越える手描きでトレースした第1の点である)と推定する。
【0214】
トレースの完了時に、輪郭に沿ったDNAの高さ(局所的領域のピクセル高さ中央値に対して)を抽出する。ストレプトアビジンおよびCas9/dCas9の推定される境界は、これが(μd+σd)を超える近接領域に拡大するまで、元々推定されたものの周囲に反復的に拡大または縮小された。ここでは、μdおよびσdは、結合されたタンパク質の推定される位置を超える、また、推定値が収束する、トレースされたDNAの高さの平均および標準偏差である。
【0215】
DNAの見かけの長さをゆがめる可能性があるあらゆる機器ヒステリシスについて考慮するために、DNAの長さを規準化し、その予想された長さ(公知の数の塩基対と仮定、塩基対あたり0.33nm)の20%であると元々測定されたDNA分子のみ、さらなる分析のために使用した(AAVS1基質について-トレース数:804;公称長さ:1198bp、記録された平均長さ:1283bp、標準偏差:154bp;遺伝子改変された基質について-トレース数:1520、公称長さ:986bp、記録された平均長さ:1071bp、標準偏差:124bp;「ナンセンス」基質について-トレース数:616、公称長さ:1078bp、記録された平均長さ:1217bp、標準偏差:135bp)。このステップによって、本発明者らが、例えば、同一線上と思われる2つのDNA分子、断片化されている可能性があるDNA、またはCas9によって切断されている、および分離されている可能性があるDNA(これは稀であった、本文参照)を、不適切に分析することが防止される。
【0216】
図1C~1D、図2C~2D、および図9の結合ヒストグラムは、それぞれの結合されたタンパク質の、そのタンパク質によってオーバーラップされた塩基(最近隣内挿法)に対する相対的位置をマッピングし、各部位に結合したタンパク質の総数を合計することによって作成した(単一のCas9/dCas9が、複数の(k)部位と接触するものと解釈することができた場合、結合ヒストグラムにおいて、各接触領域を、1/kによって重み付けした)。結合ヒストグラムにおけるピークを、経験的ガウスexp(-((x-μ)/w)2)に適合させた(ここで、μは平均ピーク位置であり、wはピーク幅パラメータ(w=√2σ、標準偏差σを用いる)である(MATLABを使用))。
【0217】
dCas9の見かけの解離定数の決定。異なるガイドRNAバリアントを伴うdCas9の見かけの解離定数を、以前に記載されている通りに決定した(Yang et al.(2005)Nucleic Acids Res.,33,4322-4334)。簡単に言うと、dCas9-ガイドRNA([dCas9]0)およびDNA分子([DNA]0)の既知の溶液濃度で、結合されたタンパク質(タンパク質ΘdCas9によって結合されたDNAの比率)を伴うおよび伴わない「遺伝子改変された」DNA分子のそれぞれの数を計数した。結合されたタンパク質(上記参照)を伴うDNAを追跡した後、DNA分子ごとに結合したタンパク質の平均数(ndCas9)を決定した。総解離定数は、Kd,DNA=[DNA][dCas9]/[DNA・dCas9]=(1-ΘdCas9)([dCas9]0-ndCas9[DNA]0)/(ΘdCas9)として算出した。
【0218】
プロトスペーサー特異的解離定数Kd,プロトスペーサーを、部位特異的結合定数Ka,ss=Kd,ss -1(結合されたdCas9 ΘdCas9,ssを伴うDNA上の各部位の比率を使用)がそうであるように、その代わりとしてΘdCas9,プロトスペーサー、すなわちそのそれぞれの結合ヒストグラムにおけるガウスフィットの1ピーク幅(すなわち、表1参照)内に結合されたdCas9を伴うDNAの比率)を使用して、同様に算出した。
【0219】
タンパク質アライメントおよびクラスタリング。単離され、単一位置でDNAと接触するに過ぎないように見えるCas9およびdCas9タンパク質の画像を、抽出した。これらの特徴を、134nm×134nmのバウンディングボックス内に完全に収まる、(μd+2σd)を超える特徴を有するものとして選択し(ここで、μdおよびσdは、タンパク質が結合したDNA高さの平均および標準偏差である);このステップは、大きい外因性のノイズを有する画像から、集合からの凝集した/密集したCas9/dCas9ならびにそのタンパク質のほとんどを除去する効果を本質的に有していた。4倍の最近隣内挿法の後、(μd+σd)を超える組織分布的高さを有するタンパク質の特徴を、その組織分布的高さ間の平均平方される差を最小にするために、平行移動、回転、および反転の繰り返しによって、それぞれ整列した。距離行列を、これらの最小化された平均平方差から構成し、次いで、標準のsgRNAを有するタンパク質を、RodriguezおよびLaio(27)の方法を使用して、この基準に従ってクラスター化した;ガイドRNAバリアントを有するタンパク質は、標準のsgRNAを伴う最も近いCas9/dCas9構造に従ってクラスター化した。アンサンブル平均構造を、Penczek、Radermacher、およびFrank(28)の方法に従って、個々のクラスターの各メンバーにわたって、参照のないアライメントを実施することによって抽出した。DNA上での各特徴(プロトスペーサー部位など)でのCas9/dCas9集団の特性を、結合ヒストグラムに対するガウス分布フィットの1ピーク幅内に結合されたタンパク質を使用して決定した(すなわち、表1を参照のこと)。
【0220】
ガイドRNAストランド侵入およびRループ「揺らぎ」の動的モンテカルロ(KMC)。プロトスペーサー部位でのガイドRNAによるストランド侵入をシミュレートするための動的モンテカルロ(KMC)実験を、MATLABにおいて実行される、Gillespie型(連続時間、離散状態)(Gillespie(1976)Journal of computational physics,22,403-434)アルゴリズムを使用して実施した。ストランド侵入は、相対的最近傍依存性DNA:DNAおよびRNA:DNA結合自由エネルギーによって決定される位置依存性電位における1次元ランダムウォークとしてモデル化される。例えば、図4Aを参照のこと。すなわち、ガイドRNAは、プロトスペーサー部位mまで(sgRNAについては1≧m≧20、および切り詰め型sgRNA(tru-gRNA)については1≧m≧18)プロトスペーサーと塩基対形成され、最初に、フォワード速度(さらなるガイドRNA侵入の速度)vfが、exp(-(ΔG°(m+1)RNA:DNA-ΔG°(m+1)DNA:DNA)/2RT)である対称性の近似値を使用して推定される。ここでは、Rは、ボルツマン定数であり、Tは、温度であり(ここで、パラメータセットと一致する37℃を使用した)、ΔG°(m+1)RNA:DNAは、RNAと、部位m+1でのプロトスペーサーとの間の塩基対合の自由エネルギーであり、ΔG°(m+1)DNA:DNAは、プロトスペーサーと、その相補的DNA鎖との間の塩基対合の自由エネルギーである。(詳細釣り合いを満たすために、1/2という補正の語が含められる)。sgRNAまたはtru-gRNAについての状態m=20または18でのvfは、0に設定した。リバース速度(プロトスペーサーとその相補的DNA鎖との間の再ハイブリダイゼーションの速度)vrは、exp(-(ΔG°(m)DNA:DNA-ΔG°(m)RNA:DNA)/2RT)と比例するように、同様に算出され;状態m=1である場合、シミュレーションは停止される(ガイドRNA-プロトスペーサー解離を意味する)。アルゴリズムの各反復について、時間t=0(任意時間単位)で開始し、mに依存する速度が決定され、0と1の間の一様分布から、2つの乱数r1およびr2がもたらされる。tは、Δt=log(r1)/(vf+vr)によって前進させる。状態mは、r2≧vf/(vf+vr)の場合、m+1に増加させ、そうでなければm-1に減少させる。Rループ揺らぎの「平衡状態」測定については、mは、m=20(または、tru-gRNAの場合には18)で開始し、このアルゴリズムをt≧10,000まで反復した。「侵入」速度論の動力学の測定(ミスマッチ塩基対の存在下など)については、mは、m=10で開始した(t=1000まで)。
【0221】
自由エネルギーパラメータは、37℃の1M NaClでの実験による文献から得られる。配列依存性DNA:DNAハイブリダイゼーション自由エネルギーΔG°(x)DNA:DNAは、SantaLucia et al.(1996)Biochemistry,35,3555-3562から得られ;配列依存性RNA:DNAハイブリダイゼーション自由エネルギーΔG°(x)RNA:DNAは、Sugimoto et al.(1995)Biochemistry,34,11211-11216から得られ;導入された点ミスマッチrG・dG、rC・dC、rA・dA、およびrU・dTの場合のΔG°(x)RNA:DNA値は、Watkins et al.(2011)Nucleic Acids research,39,1894-1902から得られた(わずかに高濃度の塩条件下)。使用されるプロトスペーサーの配列は、「ATCCTGTCCCTAGTGGCCCC」(配列番号336)、すなわちAFM実験と同様のAAVS1標的部位であり;プロトスペーサー相補的DNAの配列は、「GGGGCCACTAGGGACAGGAT」(配列番号337)であり、ガイドRNAの配列は、sgRNAについての「GGGGCCACUAGGGACAGGAU」(配列番号338)、または切り詰め型RNAについての「GGCCACUAGGGACAGGAU」(配列番号339)である。
【0222】
KMCから得られるRループ安定性と実験によるCas9切断速度との間の相関。ガイドRNA-プロトスペーサー相互作用とインビボでのCas9切断速度との間の相関を解析するために、ガイドRNA、およびHsu et al.(2013)Nature biotechnology,31,827-832による標的とされるDNAの配列と、その実験によって決定されたCas9による切断頻度の最尤推定値(MLE)を抽出した。ガイドRNA、およびrG・dG、rC・dC、rA・dA、およびrU・dT型の単一ヌクレオチドPAM遠位(PAM部位から≧10bp以遠)ミスマッチを伴うHsu et al.(2013)Nature biotechnology,31,827-832による標的とされるDNAの配列と、その部位での実験によって決定されたCas9による切断頻度の最尤推定値(MLE)を(n=136)、KMCスクリプトにインポートした。m=10で開始されたストランド侵入のシミュレーションを、各配列について1000回繰り返して(t=100まで)、時間の比の平均m≧16を得て、経験的切断速度と相関させた。MLE切断頻度と共に、平均占有比率を、100,000回の並べ替えを介してブートストラップ処理し、次いで相関係数およびp値を再計算することによって有意性を決定した。ガイドRNA-プロトスペーサー結合自由エネルギーを、上に挙げたパラメータセットを使用して最近傍エネルギーを総和することによって推定し、-3.1kcal mol-1の開始係数で補正した。
【0223】
dCas9-sgRNA構造特性との比較のためのdCas9-tru-gRNAおよびdCas9-hp-gRNAデータ。実験を通して、タンパク質の高さおよび体積測定値を比較する場合、AFM画像化条件は、人工産物を導入しないように、概ね一貫性を保つべきである。これは、一般に、例えば、遺伝子改変されたDNA分子上の異なる部位に結合したdCas9の高さおよび体積を比較する場合には、問題を呈さないが、異なるガイドRNAまたはDNA基質を使用する場合にdCas9/Cas9の構造特性を比較する場合には、課題を呈する。対照として、追跡されるDNA分子の末端を標識するために使用されるストレプトアビジンタンパク質の高さおよび体積を使用した。これは、異なる実験のための、すべての実験条件を通して、不変のままであるべきである。sgRNAを用いる実験については、ストレプトアビジンの平均高さは、0.1nm未満だけ異なり(平均差:0.087nm;差の標準偏差:0.052nm)、その平均体積(1098nm3)は、15nm3未満だけ異なっていた(平均差:14.461nm3;差の標準偏差:10.419nm3)。しかし、tru-gRNAおよびhp-gRNAを用いる実験の平均高さおよび体積は、sgRNAを用いるものと、それぞれ最大0.14nmおよび225nm3異なっていた。これらの実験の結果を直接的に比較するために、遺伝子改変されたDNA上の、tru-gRNAおよびhp-gRNAを伴うdCas9の高さを、sgRNAを伴うものに対する、その平均高さの差によってシフトさせ、体積は、平均体積の差の割合によって調整した。
【0224】
実施例2
原子間力顕微鏡観察は、高分解能で、遺伝子改変されたDNA基質に沿って、特異的および非特異的にCas9/dCas9結合を捉える
結晶学的および生化学的実験の解析は、プロトスペーサー結合および切断における特異性が、最初にCas9自体によるPAM部位の認識、続いて結合したRNA複合体によるストランド侵入、およびプロトスペーサーとの直接的ワトソン-クリック塩基対合を通して与えられることを示唆している(図1A)が、完全な機構的実像は、まだ明らかになっていない。単一分子分解能を用いて、プロトスペーサーおよびオフターゲット部位に結合する相対的傾向を直接的に探るために、ヒト染色体19のAAVS1遺伝子座を標的にする50nM Cas9-sgRNAまたはdCas9-sgRNA複合体を、以下の3つのDNA基質のうちの1つ(2.5nM)とのインキュベーション後に、大気中でAFMによって画像化した。
【0225】
(i)PAM(ここでは「TGG」)の後に完全な標的部位を含有する、AAVS1遺伝子座の1198bpセグメント(図1C)。
【0226】
(ii)それぞれがおよそ150bpで区切られる一連の6つの完全な、部分的な、またはミスマッチの標的部位を含有する、989bpの遺伝子改変されたDNA基質(図1D)。これらの部位でのミスマッチは、プロトスペーサーの「シード」(PAM近位、およそ12bp)領域と「非シード」(PAM-遠位)領域との両方に及ぶ可能性がある。この遺伝子改変された基質におけるPAM部位だけは、これらの明確に設計された位置にあった。
【0227】
(iii)標的配列との相同性(3bp配列超)を有しない1078bpの「ナンセンス」DNA(図9A~9C)。
【0228】
図1Cは、dCas9とCas9が、AAVS1基質に対するほぼ同一の結合分布を示すことを示す(それぞれ、n=404およびn=250)。図1Dは、遺伝子改変された基質(n=536)に対して、dCas9は、ミスマッチ(MM)部位を有しない完全なプロトスペーサー(ピーク1、以後完全な部位または「0MM」部位と称する)に、また、親和性は低下するが、PAM部位に対して遠位の5個または10個のミスマッチ塩基を有する部位(それぞれ、ストレプトアビジン標識からの第3および第4の特徴、以後「5MM」または「10MM」部位と称する)に結合する傾向が最も高いことを示す。より大きな数のミスマッチを含有する部位(第2および第5の特徴)、または2つのPAM近位ミスマッチヌクレオチドを有する部位(第6の特徴)は、有意に低い割合で結合される。(以下)各基質におけるPAM(「TGG」)部位の分布。
【0229】
構造的に、化膿レンサ球菌(S.pyogenes)Cas9は、それぞれがヌクレアーゼドメインを含有する2つのローブ(lobe)様の半分におおよそ分けられる、およそ10nm×10nm×5nm(結晶構造より)の、160kDaの単量体タンパク質である。X線構造と一致して、AFMを介して画像化されたdCas9-sgRNAは、大きい卵構造のように見え(図10A~10C)、Cas9またはdCas9をDNAとインキュベーションした後に、DNAに沿って結合したこれらの構造が観察され、それぞれCas9またはdCas9に割り当てられる(図1B図10A~10C、および図11A~11D)。Cas9およびdCas9によって結合された部位の配列をはっきりと決定するために、AFM画像化の前に、ビオチン標識されたDNA分子を、一価のストレプトアビジンタグで一端を標識した。結合されたCas9またはdCas9タンパク質を伴う、観察されたDNA分子を、さらなる分析のために選択し、Wigginsら(25)のプロトコルから適合させた、改変されたプロトコルに従って、サブピクセル分解能で追跡し、Cas9/dCas9によって結合された部位を、抽出した(詳細については補足の方法を参照のこと)。
【0230】
この方法は、著しく頑強であると判明した(表1):Cas9またはdCas9によって結合されたDNA上では、隣接PAMを伴うプロトスペーサー部位の位置(予想される23bp内、図1C~D)を厳密に中心とするタンパク質の特異な濃縮が観察され、鋭いピークとして現れる。標的部位を含有しないDNA基質には、こうした明らかなピークは観察されない(図9A~9C)。ピーク幅の標準偏差は、36~60bpの範囲であり、これは、およそ1000bpのピーク幅標準偏差σをもたらす単一分子蛍光を使用する結合実験と比較すると有意な改善である。78.1bp±37.9bpをカバーするDNA上の平均の見かけのCas9/dCas9「フットプリント」;生化学的および結晶学的方法によって決定されるDNA上のCas9の約20bpフットプリントを超える、見かけのフットプリントのこの広幅化は、AFMチップの幅を用いる畳み込みを画像化した十分に確立された結果である。従来、Cas9が、シングルターンオーバーのエンドヌクレアーゼとしての推定上のDNA切断後に、延長された期間(>10分)、標的とされるDNAに結合されたままであり、かつ強力な化学処理無しでは切断鎖から外すことができないことが、インビトロで観察されていた。結合されたCas9と共に観察されるDNA分子のほとんどは、完全長のAAVS1由来の基質として現れ、切断かつ分離されている基質は、ほんの少し(約5%)の割合である。これらのDNA分子を追跡した後、Cas9は、dCas9とほぼ同一の分布で、これらの「完全長」基質に結合したことが観察された(コルモゴロフ-スミルノフ両側検定、有意水準5%)(図1C)。
【0231】
【表1】
【0232】
遺伝子改変された基質に沿った異なる位置に結合したdCas9の占有を検討することによって、dCas9の、様々なミスマッチのおよび部分的な標的部位に対する相対的な結合傾向を決定することができた(図1D、表1)。dCas9と全DNA基質との間の総解離定数は、2.70nM(±1.58nM、95%信頼度、表2)と推定された。特に、(結合ヒストグラムにおける1ピーク幅内の)基質に位置する完全な(完璧にマッチした)プロトスペーサーの部位での、dCas9解離定数は、44.67nM(±1.04nM、95%信頼度)と推定された。以前の電気泳動移動度シフト解析(EMSA)は、短いDNA分子(約50bp)上のプロトスペーサー部位に対するdCas9-sgRNA結合を、0.5nMから2nMと推定していた。観察されるプロトスペーサー部位での解離定数の増大は、遺伝子改変されたDNA基質上の複数のオフターゲット部位の存在と関連付けることができるが、AFMによって決定される解離定数は、従来のアッセイによって決定される解離定数よりも、ほぼ1桁大きいことが典型的である(26)。この差はしばしば、EMSAでは考慮されない、タンパク質と、より短いDNAの平滑末端との非特異的相互作用に起因する。
【0233】
【表2】
【0234】
遺伝子改変された基質に対しては、dCas9は、遠位ミスマッチに対して比較的に耐性であり(完全な標的部位に対して50~60%の結合傾向を示す、図1Dおよび表1)、5および10個の遠位ミスマッチ(MM)を含有する標的部位に対する同じ見かけの親和性(信頼度内)を有する。しかし、2個のPAM隣接ミスマッチしか含有しないプロトスペーサー部位に対する結合は、15またはそれどころか20個の(PAM部位単独)遠位ミスマッチを伴う部位に対するのと類似の傾向を伴って生じ(完璧な標的に対しておよそ5~10%の結合傾向、ほぼバックグラウンド結合シグナルのもの)、知見は、以前の生化学的研究と一致する。遺伝子改変された基質上には、プロトスペーサー部位に隣接する以外のPAM部位は存在しないが、AAVS1由来の基質上には、PAM部位が特に豊富である、AAVS1標的の近くの、Cas9およびdCas9結合が増強された、特異な「ショルダーピーク」が存在する。「ナンセンス」基質、および標的部位から離れたAAVS1由来の基質のセグメント上では、dCas9のわずかな濃縮が、PAM部位の分布をしっかりと反映し(コルモゴロフ-スミルノフ両側検定、有意水準5%)、「ナンセンス」基質上のdCas9分布が、同じdA、dT、dC、およびdG分布をもつ100,000個のランダムに産生された配列の71.20%よりも、実験によるPAM分布をしっかりと反映した(図9A~9C)。「ナンセンス」基質(1079bp内に879個のPAM部位を有する)に沿うdCas9結合は、PAM部位分布と、とても良く対応するので、これは、実際のdCas9-PAM相互作用の測定値と解釈された。「非特異的」基質に沿うdCas9結合についての平均の単一部位解離定数は、およそ867nM(標準偏差±209nM)と推定された。これは、プロトスペーサー相同性を有しないDNA上のdCas9結合の解離定数の推定値と理解することができる。
【0235】
実施例3
その5’末端に2ヌクレオチドの切り詰めを有するsgRNA(tru-gRNA)は、インビトロでdCas9の結合特異性を増大しない
Cas9は、sgRNAまたはcrRNAのガイド(プロトスペーサー-ターゲティング)セグメントの最大4個のヌクレオチドが、その5’末端から切り詰められた場合でも、依然として切断活性を示すことが判明し、Fuら(21)は、最近、これらの(最適には2~3個のヌクレオチドの)5’-切り詰めを有するsgRNAの使用が、実際に、インビボでのCas9切断フィデリティーの数桁の増大をもたらすことができることを示した。これらの切り詰め型sgRNA(「tru-gRNA」と呼ばれる、図2A)を使用するミスマッチ部位(MM)に対する感受性の増大が、ガイドRNAとプロトスペーサー部位との間の、その結合エネルギーの低下の結果であることが示唆された。これは、sgRNA上の追加の5’-ヌクレオチドによって付与される結合エネルギーが、あらゆるミスマッチヌクレオチドを埋め合わせ、Cas9を不正確な部位で安定化させることが可能であるのに対して、tru-gRNAは、ミスマッチが存在する場合、DNA上で比較的に安定性が低いであろうということを暗示する。
【0236】
この提案された機構の試験として、以前に使用されたsgRNAに対して2ヌクレオチドの5’-切り詰めを有するtru-gRNAを伴うdCas9を画像化した。dCas9-tru-gRNA複合体を、一連の完全なおよび部分的なプロトスペーサー部位を含有する遺伝子改変された基質と共にインキュベートした。この場合もやはり、ちょうど完全なプロトスペーサー部位での特異なピークが見られた(図2Cおよび表1)が、この部位に完全なsgRNAを伴うdCas9と比較した見かけの結合定数は、かなり低下する(すなわち、解離定数は増大する、表2参照)。しかし、完全なプロトスペーサー部位での結合に対して、PAM遠位ミスマッチを有するプロトスペーサー部位にtru-gRNAを伴うdCas9によるオフターゲット結合は、sgRNAを伴うdCas9と比較した場合に、実際に増大する(図2Cおよび表1)。sgRNAを伴うdCas9と同様、tru-gRNAを伴うdCasは、ほぼ等しい傾向を伴って、10個または5個のPAM遠位ミスマッチ部位を有するプロトスペーサーに結合する(tru-gRNAが、それぞれ、これらの部位の最初の8または3個のミスマッチと相互作用すると予想されるに過ぎないことに留意されたい)。これらの結果は、tru-gRNAを使用する切断フィデリティーの増大が、必ずしも、オフターゲット部位での結合傾向の相対的低下、またはミスマッチの存在下での相対的安定性の低下によって付与されるわけではないことを示唆する。むしろ、約4~5×106M未満の結合定数の低下が、切断活性をインビボで効率的になくす場合、いくらかの「閾値」効果が存在する可能性があるので、これらの結果および以下に与えるさらなる結果は、tru-gRNAによって示される特異性の増大が、切断機構それ自体における識別によって影響を受ける可能性があることを示唆する。さらに、これらの知見は、tru-gRNAは、活性なCas9の切断における特異性を改善することはできるが、インビボでdCas9(またはキメラ誘導体)を使用する用途について、その結合活性における特異性を改善することはできないことを示唆するであろう。
【0237】
さらに、以前の報告は、そのプロトスペーサー-ターゲティングセグメント内に(最適には2~3個のヌクレオチドの)5’-切り詰めを有するtru-gRNAが、インビボでのCas9切断フィデリティーの数桁の増大をもたらすことができることを示しており(図2A)、実施例に示されるこれらの結果は、切り詰め型gRNAが、dCas9結合における特異性を増大しないことを示す(図2C)。図2Cは、完全なプロトスペーサー(部位i)、ならびに5個および10個のPAM遠位ミスマッチを有するプロトスペーサー部位(それぞれ、部位iiおよびiii)を含有するDNA分子に対する、tru-gRNAを伴うdCas9(trugRNA、紫色線)の結合親和性と比較した、標準のgRNAを伴うdCas9(破線)の結合親和性を示す。図2Cは、標準のガイドRNAが、これらの(ミスマッチを含有する)オフターゲット部位に結合するかなりの能力を保持すること、また、trugRNAが、プロトスペーサーのPAM遠位末端に5 10ヌクレオチドのミスマッチを含有する部位での結合特異性の相対的増強を示さないことを示す。tru-gRNAを伴うdCas9の結合分布は、ちょうど、10個のPAM遠位ミスマッチおよび5個のPAM遠位ミスマッチを有するプロトスペーサー部位での、その親和性における特異なピークを示し、これは、このdCas9が、完全なsgRNAと比較して増大された結合特異性を有しないことを実証する(表1参照)。結合ヒストグラムにおける「ピーク」は、これらのオフターゲット部位での特異的な安定な結合を示すものである。事実上、dCas9-trugRNAによるオフターゲット部位での結合は、標準のガイドRNAと比較して、プロトスペーサーへの結合に対して、実際に増大する。この無差別な結合は、dCas9およびキメラdCas9誘導体に対するその有用性を制限する可能性がある。これはまた、この系について報告されるオフターゲット切断(これは、標準のガイドRNAと比較して改善されながら、いくつかのオフターゲット部位で依然として顕著であった)を反映する可能性がある。比較のために、本発明者らは、ミスマッチを有するこれらの部位でのhpgRNAの非特異的結合を見つけ出した(図2D)。hpgRNAは、プロトスペーサーに対する相同性を有しないDNAに非特異的に結合するのとほぼ同じ親和性で、これらの部位に結合し、観察されるオフターゲット結合親和性の最大値は、tru-gRNAに対して約22%低下した。さらに、Cas9結合チャネルの狭い幾何学的形状に基づいて、本発明者らは、ミスマッチプロトスペーサーでの開かれていないヘアピンの存在が、切断を実施するために必要であるCas9の立体構造変化を阻害することができることを予想する(図1B)。
【0238】
このオフターゲット活性を特徴付けるために、また、プロトスペーサー標的配列の賢明な選択;sgRNA構造の最適化、例えばsgRNA内の最初の2個の5’-ヌクレオチドの切り詰めによるもの;および「二重ニッキング(dual-nicking)」Cas9酵素の使用を通してCas9/dCas9の特異性を改善するために、かなりの取り組みが行われているが、Cas9の構造生物学に関するRNAガイド型の切断の厳密な機構の明確な理解が、医学および生物学におけるその現れつつある用途のためにフィデリティーが増大したCas9誘導体およびガイドRNAを開発するために不可欠であろう。
【0239】
この目標に従って、ここで、本発明者らは、個々の化膿レンサ球菌(S.pyogenes)Cas9およびdCas9タンパク質(これらは、様々なsgRNAバリアントとのインキュベーション後に、遺伝子改変されたDNA基質に沿う標的に結合させる)を解明するために、原子間力顕微鏡観察(AFM)を使用する。この技術により、本発明者らが、個々のCas9/dCas9タンパク質の結合部位と構造との両方を、同時に、直接的に解明し、単一分子分解能を用いて、Cas9/dCas9特異性に関する豊富な機構的情報を提供することが可能になる。従来の生化学的研究と一致して、本発明者らは、sgRNAを伴うCas9/dCas9によるかなりの結合が、標的配列内に最大10対のミスマッチ塩基対を含有する部位で起こることを見いだす。しかし、その5’末端から2ヌクレオチドが切断されたガイドRNA(tru-gRNA)の使用は、インビボでのCas9によるオフターゲット変異誘発の最大5000倍の低下をもたらすことが以前に示されているので、本発明者らは、ミスマッチ標的に結合するtru-gRNAを伴うdCas9についての、インビトロでの標準のsgRNAと類似の特異性を見いだす。ガイドRNAの標的結合領域と部分的にオーバーラップするsgRNAの5’末端へのヘアピンの付加は、DNAへの全体的な結合傾向の低下という代償を払って、dCas9特異性を増大させることが見いだされる。本発明者らの結果は、ミスマッチがPAMから10bpよりも大きく離れて位置する場合、ガイドRNA-DNA結合の全体的な安定性は、Cas9切断における特異性を必ずしも決定しないことを示す。
【0240】
実施例4
「PAM遠位」-ターゲティングセグメントに相補的な5’-ヘアピンを伴うガイドRNA(hp-gRNA)は、完全な結合傾向、およびミスマッチプロトスペーサーを有するDNAに結合したdCas9のプロフィールをインビトロで調節する
dCas9特異性は、sgRNAの5’末端を、sgRNAの「PAM遠位」ターゲティング(または「非シード」)セグメントをオーバーラップするヘアピン構造を形成するように延長することによって増大させることができる(図2B)。PAM部位が結合され、ガイドRNAによるDNAのストランド侵入が開始した後、完全なプロトスペーサーに結合されると、ヘアピンが開き、完全なストランド侵入が起こることができる。標的部位にPAM遠位ミスマッチが存在する場合、ヘアピンが閉じたままであることが、エネルギー的に、より好都合であり、ストランド侵入は妨害される。近年、ストランド侵入によって駆動される「動的DNA回路」のために、類似の空間配置が使用されている。それらの系では、ヘアピンは、侵入に対する速度論的バリアとして働き、オリゴヌクレオチド侵入速度は、ミスマッチを有する標的による侵入の試みの場合よりも数桁減速される。ここではヘアピンは、完全な標的部位の侵入中は置き換えられる可能性があるが、標的と、ガイドRNAの非シードターゲティング領域との間のミスマッチが存在した場合には、侵入を阻害することができる(図2B)。この場合には、ヘアピンにとっては、閉じたままであることが、エネルギー的に、より好都合である。プロトスペーサー以降のさらなるヌクレオチドを補完するためにsgRNAへの5’-伸長部が付加された、以前の取り組みに対して、これらのガイドRNAは、インビボでのCas9切断特異性の増大を示さなかった。それどころか、これは、生細胞内で消化されて、ほぼその標準の長さまで戻ってしまった。ヘアピンのサイズおよび構造に基づいて、ヘアピンを、Cas9/dCas9分子のDNA結合チャネル内に適合させ、分解から保護することができる。
【0241】
プロトスペーサーの最後の6個(hp6-gRNA)または10個の(hp10-gRNA)PAMdistal部位に相補的なヌクレオチドをオーバーラップする5’-ヘアピンを有するsgRNA(hp-gRNA)を産生した。遺伝子改変されたDNA基質上のdCas9-hp-gRNAの観察された結合位置をマッピングすることによって(図2D)、ちょうどプロトスペーサー部位での、鋭いピークが観察された(PAMおよびプロトスペーサーは、部位144~167に位置し、結合ピークは、dCas9-hp6-gRNAについては部位154.0(95%信頼度:153.3~154.8)に、dCas9-hp10-gRNAについては158.3(95%信頼度:157.6~158.9)に位置していた)。5個および10個の遠位ミスマッチを有する部位での特異的ピークは、有意に平滑化され、dCas9およびhp10-gRNAは、オフターゲット部位に対する実質的に低下した親和性を示す(tru-gRNAを伴うdCas9に対して22%低下)。完全なプロトスペーサー部位での親和性のピークは、ヘアピンが、完全な侵入時に確かに開くことを暗示する。hp6-gRNAについてはn=243、また、hp10-gRNAについてはn=212。hp-gRNAを伴うdCas9は、標的部位に対する親和性では、tru-gRNAを伴うものと類似の低下を示すが、tru-gRNAを伴うdCas9とは対照的に、hp-gRNAを伴うdCas9は、強い特異的結合を別の方法で示すであろう)オフターゲット部位でのいずれの鋭い結合ピークも呈さない。hp6-gRNAでは、5個または10個のミスマッチPAM遠位部位を有するプロトスペーサーの部位の周囲に、結合の濃縮が存在していた。これらは、sgRNAおよびtru-gRNAで観察された鋭い結合ピークを欠くので、これらの濃縮が、特異的な結合を示すものである可能性は低く、むしろ、dCas9が、表面への吸着時にこれらの部位から解離されたことを示す可能性がある。これは、hp6-gRNAの場合には、そのオフターゲット部位での非常に弱い結合を示すであろう。
【0242】
hp10-gRNAの場合、基質上のどこか他の場所でのこれらのミスマッチ部位への結合は、ほぼ非特異的結合のレベルであり、観察されるオフターゲット結合親和性の最大値の、tru-gRNAに対する22%の低下が示される(観察される結合定数の最大値の3.18×106Mから2.48×106Mまでの低下、図2D)。hp10-gRNAの特異性のこの増大はまた、プロトスペーサー部位に対するhp6-gRNAと同様の結合解離定数、ただし全(特異的+非特異的)遺伝子改変された基質相対物に対する総解離定数の有意な増大にも反映される(表2)。
【0243】
ちょうど完全なプロトスペーサー部位での特異な濃縮は、完全なプロトスペーサー部位の侵入時に、hp-gRNA内のヘアピンが、実際に開いていることを示唆する。何故なら、プロトスペーサーのPAM遠位部位と結合するヌクレオチドが、ヘアピン内で別に捕捉されるであろうからである。結合特異性の改善のための推定される機構は、PAM遠位ミスマッチを有するプロトスペーサー部位で開かれていない場合に、ヘアピンの存在が、これらのオフターゲット部位からのガイドRNAの融解を促進することである。これらの結果は、hp-gRNAを、Cas9/dCas9結合の親和性および特異性を調整するために使用することができ、また、ヘアピン長、ループ長、およびループ組成のさらなる操作が、これらの特性の、より精細な制御を可能にすることができることを示唆する。
【0244】
実施例5
Cas9およびdCas9は、プロトスペーサー配列にマッチしつつあるDNA部位に結合するにつれて、進行性の構造遷移を受ける
ネガティブ染色・透過型電子顕微鏡(TEM)を使用して、dCas9の構造が、sgRNAの結合時に、凝縮および回転して、その2つのローブ間の推定上のDNA結合チャネルを開くことが観察された。dCas9は、PAMおよびプロトスペーサー配列を含有するDNAとの結合後、拡大された立体構造への第2の構造的再配向を受ける。この第2の遷移の役割は、sgRNAによるストランド侵入に関連する、または、2つの分離したDNA鎖を有する2つの主なCas9ヌクレアーゼ部位を整列させることが示唆された。しかし、これらの研究は、完全にマッチしたプロトスペーサー配列を含有するDNAの有無にかかわらず実施されただけであり、部分的にマッチしたプロトスペーサー部位でのこれらの立体構造間の遷移を検討することで、オフターゲット結合および切断の機構への洞察を提供することができる。したがって、相対的結合傾向を決定することに加えて、AFM画像化を使用して、Cas9およびdCas9による(これらは、プロトスペーサーに対する様々な相補性の部位で、DNAに結合するので)これらの推定上の立体構造遷移を捉えた。本発明者らは、DNA上で孤立しているように見える、sgRNAを伴うCas9およびdCas9タンパク質(n=839)の、体積および最大組織分布的高さを抽出し、これらの値をDNA上のそのそれぞれの結合部位にマッピングした(図3図11A~11D、および図12A~12B)。この結合部位分布は、完全なデータセットの分布とほぼ同一であり、これは、この選択が不偏かつ代表的であったことを示す。これらのタンパク質のそれぞれの記録された画像を抽出し(図11C~11D)、回転、反転、および平行移動の繰り返しによって、対ごとに整列させた。タンパク質構造を、その対ごとの平均平方される形態的な差に従ってクラスター化した(図12A~12Bおよび表3)。この技術の顕著な利点は、これが、DNAと共に表面上に共に局在するあらゆる一価のストレプトアビジンまたはあらゆる凝集したCas9/dCas9タンパク質を、それぞれCas9/dCas9分子に割り当てられるものとは別に自然状態でクラスター化し、DNA上のこれらのタンパク質の構造特性の不偏性の分析を可能にすることである。推定上のストレプトアビジン分子または凝集したタンパク質のいずれかによる結合部位の分布の分析は、これらが、どちらも稀であり、DNAに沿って均一に分布しているので、結合部位分布の分析を邪魔しなかったことを明らかにする(図12A~12B)。
【0245】
「ナンセンス」DNA基質上など、標的に対する相同性を含有しない部位では、sgRNAを伴うdCas9分子は、主に小さく卵形であった(図3C(iii)、および表3)。しかし、dCas9タンパク質が、次第に相補的標的配列に結合するにつれて(図3(α~δ))、その高さおよび体積は、非特異的結合と比較して著しく増大し(図3Dおよび12A~12B、表2)、プロトスペーサー配列で最大サイズに到達する。この増大はまた、より平らな卵形の立体構造を伴ってクラスター形成している構造(図3C(ii)およびC3(iii)、青色および緑色)から、中心の大きな膨らみを有するわずかに丸みを帯びた構造を伴って次第にクラスター形成するもの(図3C(i)、黄色)への、dCas9の集団のシフト(図3A、および12A~12B、表2)に伴う。この後者の観察される立体構造は、TEMによって以前に、またサイズ排除クロマトグラフィーによって最近観察された、拡大された立体構造である可能性が高く、おそらく、活性状態(ここで、Cas9のヌクレアーゼドメインは、切断が最も効率的に起こることができるように、DNAの周囲に適切に配置される)である。
【0246】
触媒的に活性なCas9は、また、プロトスペーサー配列に結合すると、サイズの有意な増大を受ける(図3(ε));しかし、dCas9に対して、小さいが統計的に有意な、サイズの低下が存在し、完全なプロトスペーサー部位でのCas9の立体構造は、より平らな(緑色)構造を伴ってクラスター形成する傾向にある。本発明者らは、DNAが画像化の時点で切断されているかどうかを同時に観察しないので、これが、DNA切断後の別の立体構造変化を表すかどうか、またはCas9とdCas9との間の変異の差の結果であるかどうかは不明瞭である;しかし、結合およびストランド侵入は、律速段階であると、以前に決定されているので、Cas9内のDNAは、これらの測定中に切断される可能性が高い。
【0247】
【表3-1】
【表3-2】
【0248】
実施例6
ガイドRNAと、プロトスペーサー部位の第16位またはその近くの標的DNAとの間の相互作用は、Cas9/dCas9立体構造変化を安定化させる
AFM画像化により、dCas9/Cas9が、最大10個の遠位ミスマッチを有するプロトスペーサー部位と結合する有意な傾向を保持するが、プロトスペーサーに対して相補性を増しつつあるDNA部位への結合が、dCas9/Cas9タンパク質の集団の、活性な立体構造であるように見えるものへのシフトの増大を駆動することが、直接的に明らかになる。注目すべきことに、本発明者らは、オフターゲット部位と、hp-gRNAを伴うdCas9に対する完璧にマッチした部位との間にも、構造の類似のシフトを見いだす(表2および図13)。相補的PAM遠位配列の存在は、DNA上のCas9の安定性の増大と関連することが公知である。プロトスペーサーに対するPAM遠位相補性を(10~20部位に)増大させた単鎖DNAへのCas9結合が、タンパク質サイズの変化の増大をもたらすことも、最近判明した。これはまた、さらに、ニッキング挙動から完全な切断までのCas9活性の遷移と関連していた。ここでは、本発明者らは、二本鎖DNA部位に結合したCas9/dCas9の体積を直接的に決定することができる。二本鎖DNA上の個々のCas9/dCas9タンパク質の構造特性の分析により、「立体構造ゲーティング」機構と一致する、マッチしつつある標的配列を有する安定した立体構造遷移が明らかになる。ここでは、これらの遠位部位とのsgRNA塩基対合も、活性な立体構造を安定化し、その結果、効率的な切断が起こることができるが、多数の遠位ミスマッチを有する部位への結合は、平衡状態を活性な構造からシフトさせる(すなわち、図4Dを参照のこと)。
【0249】
これらの線に沿って、本発明者らは、この効果が、tru-gRNAを伴うdCas9について、その中でタンパク質がクラスター化する構造集団間でのより小さいシフトを伴って(図13)、劇的に弱められる(図3Dおよび表3)ことを見いだす。さらに、本発明者らは、非特異的に結合されるdCas9-tru-gRNAの高さ-体積特性と、完全または部分的なプロトスペーサー部位で結合されるものとの間に統計的有意差を見いだす(p<0.05;ホテリングのT2検定)ので、プロトスペーサーとマッチしつつある部位(10MM、5MM、および完全なプロトスペーサー部位)では、その構造特性は、統計的に識別可能ではない(図3Dおよび表3)。近年、プロトスペーサーの最初の10bpの侵入が、Cas9の立体構造変化を開始するのに対し、ガイドRNAによるプロトスペーサーの完全な侵入は、完全な活性状態へのさらなるシフトを駆動するのを助けることが主張された。したがって、本発明者らは、(sgRNAを伴うものに対して)tru-gRNAを伴うdCas9について、マッチしつつあるプロトスペーサー部位では、立体構造変化の観察される抑制が、PAM遠位部位でのこれらのガイドRNAの安定性の低下の結果であることを仮定した。
【0250】
これらの部位でのsgRNAおよびtru-gRNAの相対的安定性を調べるために、本発明者らは、ストランド侵入中および侵入後の、Rループの動的構造-すなわち、そのセグメントの相補的DNAの単鎖ループを露出している、近接DNAのセグメントに結合された、侵入するガイドRNAによって形成される構造(図4A)-の動的モンテカルロ(KMC)研究を実施した。さらに詳細については、補足の方法を参照されたい。簡単に言うと、Gillespie型アルゴリズムを使用して、本発明者らは、侵入の間の逐次的な、ヌクレオチドごとの競合としての、プロトスペーサー部位mまで結合したガイドRNAのストランド侵入(プロトスペーサーとその相補的DNA鎖との間の塩基対合の切断、次いで、プロトスペーサー-ガイドRNA塩基対での置き換え)、および侵入および再アニーリングの配列依存性の速度、それぞれvfおよびvrを用いる再アニーリング(リバース)をモデル化した(図4A)。最初に、本発明者らは、exp(-(ΔG°(m+1)RNA:DNA-ΔG°(m+1)DNA:DNA)/2RT)と比例する、状態mからm+1までの遷移速度vfを概算する。ここでは、ΔG°(m+1)RNA:DNAは、RNAと、部位m+1でのプロトスペーサーとの間の塩基対合の自由エネルギーであり、ΔG°(m+1)DNA:DNAは、プロトスペーサーと、m+1でのその相補的DNA鎖との間の塩基対合の自由エネルギーである(Rは、理想気体定数であり、Tは、温度であり、詳細釣り合いを満たすために、1/2という語が追加される)。vrは、exp(-(ΔG°(m)DNA:DNA-ΔG°(m)RNA:DNA)/2RT)と比例するように、同様に推定される。このタイプの遷移速度は、ヌクレオチド塩基対合および安定性のコンピュータ研究のために、以前に使用されており、ここでは、これにより、本発明者らが、配列依存性の方式で、Rループの一般的な動力学を捉えることが可能になる。
【0251】
一般に、RNA:DNA塩基対は、DNA:DNA塩基対よりもエネルギー的に強く、平衡状態で、本発明者らは、KMC軌跡から、ガイドRNAが、予想通り、プロトスペーサーに安定的に結合されることを見いだす(図4C)。しかし、sgRNAは、かなり安定であり、ほとんど完全に侵入されたままである - 95%のシミュレーションされる時間経過中、鎖は、第19までのプロトスペーサー部位に侵入されたままである(図4B) - ので、tru-gRNAは、PAM遠位部位でのプロトスペーサー再アニーリングの有意な増減を示す(図4Bおよび4C)。dCas9-sgRNAとdCas9-tru-gRNAとの間の唯一の違いが、ガイドRNAからの2個の5’-ヌクレオチドの単純な切り詰めであるので、また、本発明者らは、5個のPAM遠位ミスマッチを含有する部位でのdCas9-sgRNAによる立体構造変化の阻害を見いだすので、これらの結果は、十分に活性な状態への立体構造変化が、ガイドRNAと、プロトスペーサーの第16部位の近くのプロトスペーサーとの間の相互作用によって安定化され、これは、この領域におけるtru-gRNAの不安定性によって破壊されることを示唆する。実際、KMC実験は、完全な侵入と、第16部位まで戻るDNAの再アニーリングとの間の平均寿命は、sgRNAをtru-gRNAで置き換える場合に2桁低下することを示す(図4C挿入図)。この結果は、2または3ヌクレオチド(nt)の切り詰めを有するtru-gRNAバリアントを伴うCas9活性が、配列構成に応じて調節されたのに対して、試験されたすべての場合における切断は、4nt切り詰めによって約90%~100%劇的に低下し、5nt切り詰め後にはなくなったという以前の発見と一致する、タンパク質活性化状態への立体構造変化は、プロトスペーサーの第16位置またはその近くのこれらの相互作用によって安定化される。この発見は、第14~第17プロトスペーサー位置でのgRNA安定性(これは、以下に記載した追加のKMC実験から推定され、実験によるインビボでのオフターゲット切断(以下参照)と相関する)によって裏付けられるが、プロトスペーサー部位18~20でのガイドRNAの安定性は存在しない。
【0252】
実施例7
ガイドRNA-プロトスペーサーRループの増減は、Cas9/dCas9によるミスマッチ耐性の機構、また、tru-gRNAによる切断の特異性増大の機構を示唆する
Cas9またはdCas9が、プロトスペーサー中のミスマッチを許容することができるまたはミスマッチに対して敏感になる機構を調べるために、本発明者らは、1個または2個のPAM遠位(PAMから≧10bp以遠)ミスマッチが導入される、AAVS1プロトスペーサー部位を使用する一連のKMC実験を実施した(図5)。Cas9は、一般に、PAM近位ミスマッチよりもPAM遠位ミスマッチに耐性である。しかし、Hsu et al.(2013)Nature Biotechnology,31,827-832は、配列構成、ミスマッチの種類、およびミスマッチの部位に依存する、PAM遠位ミスマッチを含有するプロトスペーサーでの推定されるCas9切断速度の著しいかつ変動する違いを明らかにした。本発明者らは、本発明者らのAFMおよび以前のKMC実験に基づいて、切断速度の違いが、同様に、プロトスペーサーの第16部位の近くのガイドRNAの異なる安定性の結果であり得ることを仮定した。これらのシミュレーションについては、本発明者らは、そのための配列構成依存性の熱力学的データが、本発明者らのKMCモデルにとって最も完璧かつ適切である、分離したrG・dG、rC・dC、rA・dA、およびrU・dTミスマッチをもたらすであろうプロトスペーサー-ガイドRNA対を有する配列を検討しただけであった。これらのミスマッチ塩基対の効果は、sgRNAとプロトスペーサーとの間の全体の結合エネルギーを劇的に低下させると予想されていない(表4);例えば、単一のrG・dG、rC・dC、rA・dA、およびrU・dTミスマッチは、RNA:DNA融解温度を平均で1.7℃低下させる。むしろ、その効果は、ミスマッチでの鎖置換を妨害することによって、実際は熱力学的ではなく速度論的であると予想される。したがって、本発明者らは、ストランド侵入中に起こっているであろうものなどの、第10プロトスペーサー部位から進行する(最初のRループ長m=10)動的モンテカルロ実験を開始した。
【0253】
【表4-1】
【表4-2】
【表4-3】
【表4-4】
【表4-5】
【表4-6】
【0254】
次いで、PAM遠位ミスマッチの存在下でのストランド侵入の速度論を調べるために、KMC実験を実施した。すべての場合(それぞれ1000回の試験)において、ガイドRNAは、ミスマッチが存在する(すなわち、完全に融解することが観察されない)場合であっても、かなり安定的に結合されたままであり、これらの部位を素早く迂回して完全な侵入を完了することが可能であることが多い(図5Cおよび図14A~14C)が、全ストランド侵入の平均初到達時間は、ミスマッチ部位の位置に依存して、かなり変動する(図14A~14C)。sgRNAは、複数のミスマッチの存在下でも完全に侵入されたままであることが可能であることが多いので、Rループは、侵入中、かなり安定である(図5A)。これらの結果は、ミスマッチ標的上のdCas9/Cas9結合および切断の以前のインビトロ研究の結果と質的に似ている。しかし、tru-gRNA(図5B)の場合、Rループは、ミスマッチ部位の後方で、しばしば捕捉される。ミスマッチを越える平均初到達時間は、sgRNAとtru-gRNAの両方について同様である(図14A~14C)が、KMCについての時間経過を調べると、tru-gRNAについてのRループの固有の不安定性が原因で、tru-gRNAは、しばしば、ミスマッチの後方で素早く「再捕捉」されることが明らかになる(図5C)。sgRNAについては、この再捕捉は、かなり頻度が低い。したがって、AFM画像化と組み合わせると、KMC実験の結果は、tru-gRNA特異性増大の原因が、結合中の識別にあるのではなく、むしろそのRループの不安定性にあり、その結果、tru-gRNAが、ミスマッチの後方で、これを最初に迂回した後にも繰り返し捕捉されるようになり、Cas9が活性な立体構造をとる可能性が低くなることを示唆する(図4D)。sgRNAについては、ミスマッチがいったん迂回されると、比較的わずかな攪乱しか伴わずに完全に侵入されたままであることができ、これは、ミスマッチ耐性の機構を示唆する。
【0255】
実施例8
プロトスペーサーの第14~第17位置とのガイドRNA相互作用の安定性が、実験によるオフターゲットCas9切断速度と相関するのに対して、全体のガイドRNA-プロトスペーサー結合エネルギーは相関しない
プロトスペーサーの第16位置またはその近くのRループの安定性-これはCas9の立体構造変化と関連するAFM研究に含まれた-が、インビボでCas9活性と関係があるかどうかを確認するために、本発明者らは、Hsu et al.(2013)Nature Biotechnology,31,827-832によって使用される配列に関するRループ安定性の動的モンテカルロ(KMC)分析を実施した。Hsu et al.(2013)Nature Biotechnology,31,827-832のデータセットは、Cas9による切断特異性を調べるために実施された、ガイドRNAに対する、様々な点変異を含有する15個の異なるプロトスペーサー標的での切断頻度の測定で構成されていた。このデータセットは、PAM遠位領域内に、rG・dG、rC・dC、rA・dA、およびrU・dT型の単一の分離したミスマッチを有する、136個のプロトスペーサー-ガイドRNA対を含有しており(表4)、これを、本発明者らは、Rループサイズm=10で開始して侵入をシミュレーションするKMC方法を使用して調べた。このセット由来の単一のミスマッチ部位の包含は、言及した通り、その全体のガイドRNA-プロトスペーサー結合自由エネルギーの大きさを、完璧にマッチした標的に対して平均で約6%しか低下させなかったが、その由来が明らかではない、これらのガイドRNA-プロトスペーサー対について観察される広範な分布のCas9切断頻度が存在していた。
【0256】
RNAがプロトスペーサーの各部位に安定的に結合された時間の比の平均を、1000回の試験を通じて各ガイドRNAについて決定し、次いで、これを、Cas9の切断活性の最大推定値と相関させた(表4、図6、および図15)。第16プロトスペーサー位置でのガイドRNA安定性と、報告されたオフターゲット切断活性との間に、中程度(0.433)ではあるが統計的に有意な(p<1×10-6)相関が見られた。注目すべきことに、切断速度と予測されるDNA:RNA結合エネルギー単独との間には、統計的に有意な相関は見られなかった(0.0786;p=0.3631)(図6Aおよび6B)。第16位置でのRループ安定性に加えて、第17プロトスペーサー部位の安定性と、報告された切断についての、有意な相関も見られる(表5)が、これは、部位≧第18部位については当てはまらなかった(図6)。ここに示した動的モンテカルロモデルは、ストランド侵入の比較的単純なモデルに基づいているので、これらの結果は、プロトスペーサーの第16~第17部位の安定性、したがって本発明者らが観察した付随する立体構造変化が、インビボでのCas9切断活性と関係があることをさらに示唆する(図4D)。
【0257】
【表5】
【0258】
本発明者らは、tru-gRNAを伴うdCas9とsgRNAを伴うdCas9との観察される構造の違いにより、本発明者らの分析のほとんどを、プロトスペーサーの第16~第18ヌクレオチドとの相互作用に限定した。しかし、本発明者らは、第14および第15プロトスペーサー部位の切断と安定性との間の相関(図6)の、強度の増大および統計学的有意性も観察し、第14部位での相関が、最も有意性が高かった。Rループは、動的な構造であるので(図4D)、これらの部位との相互作用が、DNA切断の原因であると考えられる重要なものである可能性がある。ガイドRNAの4または5ヌクレオチドの切り詰めは、tru-gRNAが、第16~第17部位でRループを不安定化させるのとほぼ同様の様式で、第14または第15位置でRループを十分に不安定化させることによって、切断活性をなくす可能性がある。しかし、本発明者らのモデルでは、第16部位がsgRNAによって結合される時はいつも、第14および第15部位は必然的に侵入されるので、これらの位置は、さらに情報価値がある可能性が高い。何故なら、これらはまた、ミスマッチ部位を迂回する前の二重鎖からのsgRNA解離(図6Aiおよび図16B)、すなわち、切断を生じ損なうこととなる別の機構の確率と、より強く逆相関するからである。今のところ、ストランド侵入を、切断を容認すると考えられる観察される立体構造変化と直接的に関連付ける、結晶学的根拠は存在しない。しかし、ここで示すAFM実験によって提供される根拠、および動的モンテカルロシミュレーションの結果に基づいて、本発明者らは、侵入中のプロトスペーサーの第14~第17部位でのガイドgRNAの安定性が、この立体構造変化、最終的にはCas9切断の特異性にとって重要であると結論付ける。
【0259】
さらに、ストランド侵入とDNA再アニーリングとを競合させる動的な構造としてのRループは、オフターゲット切断およびミスマッチ耐性の機構を理解するのに有用であり得る。切断速度と予測されるDNA-RNA結合エネルギー単独(図6B)との間に、統計的に有意な相関は見られず、これは、オフターゲット部位でのCas9活性を決定しようとしている場合、ストランド侵入の速度論が考慮され得ることを示唆していた。ガイドRNAから4または5ヌクレオチドが切り詰められる場合、切断はなくなるが、Cas9は、依然として、最大6個までの遠位ミスマッチ部位を有するDNAを切断することが可能である。これらのPAM遠位部位での一過性の非特異的相互作用は、切断に不可欠な立体構造シフトを十分に安定化することが可能である。本発明者らは、完全なプロトスペーサー(黄色、図3C(i))での構造と類似の構造を有する、部分的なプロトスペーサー部位でのdCas9-sgRNAの少数集団を確認するので、この集団は、一過的に安定化された活性な立体構造中のCas9の分画を表すことができる。したがって、この集団は、オフターゲット切断の原因であり得る。
【0260】
Cas9/dCas9結合特異性は、PAM近位領域との相互作用によって大方決定されるが、DNA切断特異性は、活性化された構造(これは、プロトスペーサーの第14~第17bp 領域でのガイドRNA相互作用によって安定化される)への立体構造変化によって支配される可能性が高い(図4D)。動的モンテカルロ実験は、ガイドRNAのストランド侵入中に形成されたRループが、ガイドRNAが、安定的に結合されたままである場合であっても、かなりの動的構造であり得ることを明らかにしている。これは、tru-gRNAの特異性改善のための機構、およびミスマッチ部位周囲の重要な領域でのガイドRNA-プロトスペーサーの一過性の安定性を介するオフターゲット切断の起源を示唆している。Cas9/dCas9特異性に対する、sgRNAバリアントのそれぞれの影響についての提案される機構を、図7にまとめて示す。
【0261】
AFMを使用して、hp-gRNAが、相同の(homeologous)標的での特異的な結合を有意に弱めるまたはなくすことが判明した。hp-gRNAは、生物学および医学におけるその潜在的用途において、dCas9結合親和性および特異性を調節するのに有益であり得る。具体的には、Cas9結合チャネルの狭い幾何学的形状に基づいて、ミスマッチプロトスペーサーでの開かれていないヘアピンの存在が、Cas9による活性状態への立体構造変化を阻害することができる。結合時のhp-gRNAにおけるヘアピンの開口はまた、例えば、特定の部位に結合する時にのみ動的なDNA/RNA構造を形成するための、インビボでの結合依存性シグナルとしても使用することができるであろう。
【0262】
初期のガイドRNA切り詰め研究は、16ヌクレオチドのガイド配列のみが切断のために必要とされ、かつさらなるヌクレオチド(>18)がインビボでの切断特異性を改善しない場合に、天然のCas9系が、どのような理由で20bpのプロトスペーサー部位を標的にするcrRNAを用いるのかという問題を提起した。これらの結果は、第19および第20プロトスペーサー部位に結合する「特別な」5’-ヌクレオチドの存在が、プロトスペーサーの重要な第14~第17部位でのこの一過性の再アニーリングを緩衝し、活性状態への効率的な立体構造変化、およびその後の切断を起こさせることを示唆する。AFMおよびKMC実験の結果は、これらの部位でのガイドRNAの安定性が、完全な侵入時に、Cas9の平衡状態構造を活性な立体構造にシフトさせる(図4A)のに対して、「切り詰め型」ガイドRNAに対するRループの不安定性が、平衡状態を活性状態にシフトさせる力を低下させることを示唆する。tru-gRNAを伴うCas9に対するsgRNAを伴うCas9の無差別な活性はまた、侵入するファージのDNAが、切断を避けるために、Cas9によって標的とされる部位で急速な点変異を受けることから、原核生物における侵入DNAに対する適応免疫の薬剤としてのその役割における進化上の利点を保持するであろう。
【0263】
インビボでのCas9/dCas9用途のためのガイドRNA配列の設計は、ゲノム内の類似の配列を有する複数の部位を標的にすることを避けることに第一に焦点を合わせている。しかし、オフターゲット切断を探索する最近の研究では、オフターゲット活性を予測するための現在の方法が、大いに非効率であることが判明した。侵入中のRループの安定性は、ガイドRNA-プロトスペーサー結合エネルギー単独またはミスマッチの位置よりも著しく良く、オフターゲット切断速度と相関する(ガイドRNA設計において使用される別の重要な基準、表3)。侵入の開始後の、より短い時間でのRループの安定性は、KMC実験における長期安定性(図16A)よりもはるかに良く、実験による切断速度と相関し、これは、ストランド侵入の速度論が、オフターゲット活性予測における因子であることを示唆する。
【0264】
実施例9
インビボ試験
dCas9結合特異性を調べるために、最適化されたgRNA活性を、生細胞において試験した。ヒトゲノムにおける4つの標的位置(プロトスペーサー)のそれぞれに対して、いくつかのヘアピンgRNA(hp-gRNA)を設計した(図17および18)。1つは、ジストロフィン遺伝子(図19~23)内であり、もう1つは、EMX1遺伝子(図24~29および44)内であり、2つの標的は、VEGFA1(図30~37)およびVEGFA3(図38~43)と標識されたVEGFA遺伝子内であった。すべての実験は、HEK293T細胞で行った。
【0265】
Cas9のプロトスペーサーに対する結合および切断活性を調節するために、追加のヌクレオチド(nt)を、完全なガイドRNA(gRNA、全長20nt)の5’末端に付加して、5’-プロトスペーサー-ターゲティングヌクレオチド、またはプロトスペーサー-ターゲティング領域の中央または3’末端のヌクレオチドとハイブリッド形成することによってヘアピンおよび二次構造を形成するように設計した。
【0266】
VEGFA1-ターゲティングhp-gRNAの、ある二次構造を、完全なプロトスペーサーへの結合を可能にしつつ既知のオフターゲット部位での結合を妨げるように、本明細書に記載した方法を使用して、計算によって設計した(図44A~44C)。オンターゲット部位での完全なgRNAの結合寿命以上の結合寿命、および上位3つのオフターゲット部位での完全なgRNAの結合寿命以下の結合寿命を有するように、hp-gRNAを選択した。他の5’-構造を、hp-gRNAの二次構造のエネルギー特性を調節するためにdG-rUゆらぎ対を含むように設計するか、それ自体がCas9活性のより高い特異性を促進することが示されている切り詰め型gRNA(tru-gRNA、<20nt)の末端に付加した。
【0267】
細胞研究。ディープシークエンシング分析については、293T細胞に、Cas9および対象となるgRNAを発現するプラスミドを導入した。この細胞を、4日間インキュベートし、Cas9およびgRNAがその最大活性を発揮できるようにした。次いで、細胞を収集し、そのゲノムDNAを精製した。文献中で非常に良く特徴付けられている(すなわち、そのオンターゲットおよびオフターゲット部位が公知である)gRNAを使用した。
【0268】
Surveyorアッセイ。ディープシークエンシングと比較して、surveyorアッセイは、スループットが少なく、かつ感度が低い。しかし、surveyorアッセイは、データ分析が速く、またそれほど技術的ではなく、ゲル画像が提供される。したがって、surveyorは、最初の工程として行われ、最良の条件を、ディープシークエンシングを用いて3連で分析した。ディープシークエンシングとSurveyorは両方とも、Cas9+gRNAによって引き起こされる変異事象を定量化するための方法である。
【0269】
Surveyorに関する細胞研究は、上に記載したのと同じであった。ゲノムDNAを精製した後、プライマーを、標的とされる部位を増幅するように設計した。この実験では、200k細胞のプールを使用し、DNA修復が確率論的であることから、これらは1つ1つ、異なる変異を有していた。200k細胞にわたる部位を増幅して、不均一のPCR産物を産生した:各細胞の確率論的(すなわち、ランダムな、誤りがちな)Cas9切断部位の修復が原因で、あるアンプリコンは欠失を有し、あるものは挿入を有し、あるものは野生型および非改変であった。
【0270】
この不均一PCRプールを、加熱および修復させ、場合によっては、異なる鎖を互いにアニールさせた:野生型DNA鎖が、挿入を有するDNAに結合すること可能性もあるし、挿入が、欠失に結合する可能性もある。これが起こる場合、小さい「バブル」が形成され、この構造はDNAヘテロ二重鎖と呼ばれる(図46参照)。
【0271】
surveyorヌクレアーゼを使用して、これらのヘテロ二重鎖を、これらを消化および切断することによって検出した。DNA切断は、その後、Cas9の変異活性の代わりとなるものであった。PCRプールを、ゲル上で分離し、これらの消化されたバンドの強度を使用して、Cas9活性の割合を定量化した。
【0272】
ディープシークエンシング。プライマーを設計して、これらの公知の標的/オフターゲットを増幅した。このPCRには、ハイフィデリティーポリメラーゼを使用した。これらのプライマー上には、バーコード化およびIllumina Mi-Seqプラットフォームに装填できるように、Illuminaアダプターも存在していた。ヘアピンの#、標的の#、オフターゲットの#、シークエンシング被覆度などは、図面および図面の簡単な説明に記載する。分析に使用される試料を通して、優れた被覆度が得られた。リード/試料の平均数は、20,000であった。最も少ない#のリードを有するする試料は、1,700であった。非常に少数の標的は、十分に整列されたリードを産生せず、分析には含めなかった。
【0273】
得られたシークエンシングデータを、ディープシークエンシングリードを公知のオフターゲットまたはオンターゲット位置の特定の部位と整列するCRISPRessoソフトウェア(Pinello et al.Nat Biotechnol.(2016)34(7):695-697))を使用して分析した。このソフトウェアの結果を、社内のスクリプト(ここで、ディープシークエンシングリードの、ヒトゲノムとのグローバルアライメントが実施される)と比較すると、非常に良く相関していた。変異率を、CRISPRessoを使用して定量化し、得られたデータを、各標的遺伝子について、示されたヒストグラムに示した。
【0274】
設計は、標準のgRNAを使用して標的とされることが公知である標的部位およびオフターゲット部位での、HEK細胞におけるCas9およびhp-gRNA発現後のインデルについて試験するために、Surveyorアッセイを使用して最初に試験した(表6参照)。これらの部位での活性を、標準のgRNAおよび切り詰め型gRNA(tru-gRNA)と比較した。これらを、PCR処理されたゲノムDNAのSurveyorヌクレアーゼによる切断を示すゲルとして下に示す。ここでは、切断は、Cas9による変異誘発を示す。
【0275】
【表6】
【0276】
最も有望なhp-gRNA設計を、次世代シーケンシングを使用する追加の定量分析のために選択して、HEK細胞におけるオンおよびオフターゲット部位でのCas9活性を評価した。特異性は、オンターゲットヒット/合計(オフターゲットヒット)と定義された。
【0277】
Cas9活性は、一般に、hp-gRNAを使用する場合、等しいか、わずかに低下するが、ディープシークエンシング実験のために選択された各hp-gRNAは、完全なgRNAよりも増強した特異性を示し、大抵の場合、特異性に関してはtru-gRNA以上であった。
【0278】
ある場合では、hp-gRNAヘアピンターゲティングEMX1は、(gRNAに対して≒100倍の改善を有するtru-gRNAに対して)完全なgRNAに対して特異性の>6000倍の改善を示した。社内のアルゴリズムを使用する計算によって設計された二次構造を有するVEGFA1ターゲティングhp-gRNAは、特異性に関してtru-gRNA活性よりも大きく性能が優れていた(gRNAよりも3倍の改善に対して18倍)。これらのhp-gRNAを、化膿レンサ球菌(S.pyogenes)Cas9と共に試験した。図44A~44Cは、オンターゲット活性を示す、黄色ブドウ球菌(S.aureous)からのCas9を用いるEMX1-ターゲティングhp-gRNAのSurveyorアッセイを示し、かなりのオフターゲット活性を示すtru-gRNAとは対照的に、オフターゲット活性は検出可能ではなかった
【0279】
実施例10
CRISPR/Cpf1系のためのhp-gRNA
実験は、KleinstiverらのNat.Biotech.(2016)34:869-874の結果を再現するように設計した。Kleinstiverらは、完全長gRNAを使用して、異なる位置に標的部位と共にミスマッチを有するgRNAを使用することによって、ラクノスピラ科(Lachnospiraceae)Cpf1が、PAM遠位部位に加えて、8~9ヌクレオチドにミスマッチを有するオフターゲット部位での切断を受けやすいことを示した(図47)。この実施例では、V型CRISPR-Cas系CRISPR-Cpf1と共に使用されるヘアピンガイドRNAは、本発明の方法を使用して、上に記載した通りに設計および試験した。
【0280】
追加の二次構造エレメントを伴うおよび伴わないCpf1のオフターゲット活性を試験するために、DNMT1遺伝子
【化2】
を、Cpf1による切断のための標的とした。「オフターゲット活性」は、第9位にミスマッチヌクレオチドを有するガイドRNA、例えば、完全長ガイドRNA(20ヌクレオチド長)を使用する
【化3】
、または切り詰め型gRNA(17ヌクレオチド長)
【化4】
を使用することによって試験した。Cpf1ガイドRNAの3’末端に、9ヌクレオチド長の二次構造エレメントを付加し、ガイドRNA周囲のミスマッチヌクレオチドのセグメントとハイブリッド形成させた。この場合、「リンカー」エレメントは、4つの3’-ntのプロトスペーサーターゲティングセグメント、すなわち、
【化5】
および
【化6】
から構成されていた。Surveyorアッセイは、これらの追加の3’-エレメントの包含が、完全または切り詰め型gRNAによって示されるDNMT1部位でのオフターゲット活性を低下またはなくすことを示す。
【0281】
PAM遠位4ヌクレオチドがループとして働く「内部」ヘアピン設計を用いて、hp-gRNAを設計した。ヘアピンは、gRNAの3’末端に付加された。表7は、この領域を隔てる配列内のスペースを有するhp-gRNAの配列を示す。ミスマッチは、小文字で示す。
【0282】
これらのhp-gRNAのSurveyor結果を、図48に示し、これは、3’末端へのヘアピンの付加が、オフターゲット活性をなくしたことを示す。レーン1は、対照を示し;レーン2は、第9位のミスマッチヌクレオチドを含有する完全長gRNAを示し;レーン3は、第9位のミスマッチヌクレオチドと追加の3’-ヘアピン構造とを含有する完全長gRNAを示し;レーン4は、第9位のミスマッチヌクレオチドを含有する切り詰め型gRNAを示し;レーン5は、第9位のミスマッチヌクレオチドと追加の3’-ヘアピン構造とを含有する切り詰め型gRNAを示す。使用したSurveyorプライマーをまた、表7に示す。
【0283】
Cpf1は、通常のガイドRNAを使用する場合、ヌクレオチド8~10でのミスマッチを許容し、そのオフターゲット部位でDNAを切断する(図47)。図48に示す通り、Cpf1 hp-gRNAは、Kleinstiverにおいて示されるオフターゲット活性をなくすことができたのに対して、切り詰め型gRNAはできなかった。
【0284】
【表7】
【0285】
前述の詳細な説明および付随する実施例は、単に実例に過ぎず、本発明の範囲への制限と受け取るべきではなく、本発明の範囲は、添付の特許請求の範囲およびその等価物によってのみ定義されることが理解されよう。
【0286】
開示された実施態様に対する様々な変更および改変は、当業者には明らかであろう。限定はされないが、本発明の化学構造、置換基、誘導体、中間体、合成物、組成物、製剤、または使用の方法に関するものを含めた、こうした変更および改変を、その趣旨および範囲から逸脱せずに行うことができる。
【0287】
完全性の理由から、本発明の種々の態様を、次の番号付けした条項で提示する:
【0288】
第1項.最適化されたガイドRNA(gRNA)を産生する方法であって、a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;d)第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の5’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の5’末端と、RNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;g)リンカー内の0からNヌクレオチドおよび第1のgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む方法。
【0289】
第2項.最適化されたガイドRNA(gRNA)を産生する方法であって、a)対象となる標的領域を特定する工程であって、前記対象となる標的領域はプロトスペーサー配列を含む、工程と;b)対象となる標的領域を標的にする完全長gRNAのポリヌクレオチド配列を決定する工程であって、前記完全長gRNAはプロトスペーサー-ターゲティング配列またはセグメントを含む、工程と;c)完全長gRNAに対する少なくとも1つ以上のオフターゲット部位を決定する工程と;d)第1のgRNAのポリヌクレオチド配列を産生する工程と(前記第1のgRNAは完全長gRNAおよびRNAセグメントのポリヌクレオチド配列を含み、前記RNAセグメントは、プロトスペーサー-ターゲティング配列またはセグメントのヌクレオチドセグメントと相補的である、Mヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記RNAセグメントは、完全長gRNAのポリヌクレオチド配列の3’末端であり、前記第1のgRNAは、完全長gRNAのポリヌクレオチド配列の3’末端とRNAセグメントとの間のリンカーを任意選択により含み、前記リンカーは、Nヌクレオチドの長さを有するポリヌクレオチド配列を含み、前記第1のgRNAは、プロトスペーサー配列に侵入して、プロトスペーサー配列と相補的であるDNA配列と結合して、プロトスペーサー-二重鎖を形成することが可能であり、前記第1のgRNAは、オフターゲット部位に侵入して、オフターゲット部位と相補的であるDNA配列と結合して、オフターゲット二重鎖を形成することが可能である);e)侵入速度論、および第1のgRNAがプロトスペーサーおよびオフターゲット部位二重鎖内に侵入されたままである寿命を、推定値を算出するまたは計算によってシミュレートする工程と(ここで、侵入の動力学は、異なるgRNAのさらなる侵入と、プロトスペーサー配列と相補的であるDNA配列に対する第1のgRNAの再アニーリングとの間のエネルギー差を決定することによって、ヌクレオチドごとに推定される);f)第1のgRNAのプロトスペーサーおよび/またはオフターゲット部位での推定寿命を、プロトスペーサーおよび/またはオフターゲット部位での完全長gRNAまたは切り詰め型gRNA(tru-gRNA)の推定寿命と比較する工程と;g)リンカー内の0からNヌクレオチドおよびのgRNA内の0からMヌクレオチドをランダム化し、第2のgRNAを産生し、この第2のgRNAを用いてステップ(e)を繰り返す工程と;h)設計基準を満たすgRNA配列に基づいて、最適化されたgRNAを特定する工程と;i)最適化されたgRNAをインビボで試験して、結合の特異性を決定する工程とを含む方法。
【0290】
第3項.前記異なるgRNAのさらなる侵入のエネルギー特性が、(I)DNA-DNA塩基対合を切断すること、(II)RNA-DNA塩基対を形成すること、(III)侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される、第1または2項に記載の方法。
【0291】
第4項.前記第1のgRNAの、プロトスペーサー配列と相補的であるDNA配列への再アニーリングのエネルギー特性が、(I)DNA-DNA塩基対合を形成すること、(II)RNA-DNA塩基対を切断すること、(III)新たに侵入されていないガイドRNA内の異なる二次構造を破壊することまたは形成することから生じるエネルギー差、および(IV)プロトスペーサーと相補的である置き換えられたDNA鎖と、二次構造には含まれないいずれかの非対合ガイドRNAヌクレオチドとの間の相互作用を形成することまたは破壊することのうちの少なくとも1つのエネルギー特性を決定することによって決定される、第1~3項のいずれか1項に記載の方法。
【0292】
第5項.(V)ミスマッチにわたる塩基対合、(VI)Cas9タンパク質との相互作用、および/または(VII)追加のヒューリスティクス(ここで、追加のヒューリスティクスは、結合寿命、侵入の程度、侵入するガイドRNAの安定性、またはCas9切断活性に対するgRNA侵入の、他の算出される/シミュレーションされる特性に関する)のうちの少なくとも1つから、エネルギー的考察を決定することをさらに含む、第3または4項に記載の方法。
【0293】
第6項.前記完全長gRNAが、約15から20個のヌクレオチドを含む、第1~5項のいずれか1項に記載の方法。
【0294】
第7項.Mが、1から20である、第1~5項のいずれか1項に記載の方法。
【0295】
第8項.Mが、4から10である、第7項に記載の方法。
【0296】
第9項.前記RNAセグメントが、プロトスペーサー-ターゲティング配列を補完する2から15個のヌクレオチドを含む、第1~8項のいずれか1項に記載の方法。
【0297】
第10項.Nが、1から20である、第1~9項のいずれか1項に記載の方法。
【0298】
第11項.Nが、3から10である、第10項に記載の方法。
【0299】
第12項.前記RNAセグメントおよび/またはプロトスペーサー-ターゲティング配列が、二次構造を提供する、第1~11項のいずれか1項に記載の方法。
【0300】
第13項.前記二次構造が、前記プロトスペーサー-ターゲティング配列を、前記RNAセグメントと部分的にハイブリッド形成させることによって形成される、第12項に記載の方法。
【0301】
第14項.前記二次構造が、前記最適化されたgRNAによるプロトスペーサー二重鎖またはオフターゲット二重鎖の侵入を妨害することによって、Cas9によるDNA結合または切断を調節する、第13項に記載の方法。
【0302】
第15項.前記二次構造が、前記RNAセグメントの全体または一部を、プロトスペーサー-ターゲティング配列もしくはセグメントの5’末端のヌクレオチド、プロトスペーサー-ターゲティング配列もしくはセグメントの中央のヌクレオチド、および/またはプロトスペーサー-ターゲティング配列もしくはセグメントの3’末端のヌクレオチドにハイブリッド形成させることによって形成される、第12~14項のいずれか1項に記載の方法。
【0303】
第16項.前記二次構造が、ヘアピンである、第12~15項のいずれか1項に記載の方法。
【0304】
第17項.前記二次構造が、室温または37℃で安定である、第12~16項のいずれか1項に記載の方法。
【0305】
第18項.前記二次構造の全平衡自由エネルギーが、室温または37℃で約2kcal/mol未満である、第12~17項のいずれか1項に記載の方法。
【0306】
第19項.前記RNAセグメントが、プロトスペーサー-ターゲティング配列またはセグメントの少なくとも2つのヌクレオチドとハイブリッド形成する、またはこれらのヌクレオチドと共に非標準塩基対を形成する、第1~18項のいずれか1項に記載の方法。
【0307】
第20項.前記非標準塩基対が、rU-rGである、第19項に記載の方法。
【0308】
第21項.前記最適化されたgRNAが、細胞において、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と共に使用される、第1~20項のいずれか1項に記載の方法。
【0309】
第22項.前記二次構造が、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系内の最適化されたgRNAを保護して、細胞内での分解を予防する、第1~21項のいずれか1項に記載の方法。
【0310】
第23項.1~20個のヌクレオチドが、リンカー内でランダム化される、第1~22項のいずれか1項に記載の方法。
【0311】
第24項.1~20個のヌクレオチドが、RNAセグメント内でランダム化される、第1~23項のいずれか1項に記載の方法。
【0312】
第25項.ステップ(g)が、X回繰り返され、それによって、X個のgRNAが産生され、それぞれのX個のgRNAを用いてステップ(e)が繰り返される(ここで、Xは、0から20である)、第1~24項のいずれか1項に記載の方法。
【0313】
第26項.前記侵入速度論および寿命が、動的モンテカルロ法またはGillespieアルゴリズムを使用して算出される、第1~25項のいずれか1項に記載の方法。
【0314】
第27項.前記侵入速度論が、前記ガイドRNAが、前記プロトスペーサー二重鎖に、前記プロトスペーサーが完全に侵入されるような完全な侵入まで侵入する速度、および/またはgRNAに結合されたプロトスペーサーDNAのセグメントが、その相補鎖から置き換えられ、そのPAM近位領域から、完全な侵入まで、ヌクレオチドごとにgRNAに結合するにつれて伸長する速度である、第1~26項のいずれか1項に記載の方法。
【0315】
第28項.前記設計基準が、特異性、結合寿命の調節、および/または推定される切断特異性を含む、第1~27項のいずれか1項に記載の方法。
【0316】
第29項.前記設計基準が、オンターゲット部位に対する完全長gRNAの結合寿命以上の結合寿命、および/またはオフターゲット部位に対する完全長gRNAの結合寿命以下の結合寿命を有する最適化されたgRNAを含む、第28項に記載の方法。
【0317】
第30項.前記設計基準が、少なくとも3つのオフターゲット部位(ここで、これらのオフターゲット部位は、最も近いオフターゲット部位であると予測される、またはオンターゲット部位に対する最も高い同一性を有すると予測される)に対する完全長gRNAの結合寿命以下の結合寿命を有する最適化されたgRNAを含む、第29項に記載の方法。
【0318】
第31項.前記設計基準が、オフターゲット部位での完全長gRNAまたは切り詰め型gRNAの寿命または切断速度以下であるオフターゲット部位での寿命または切断速度、および/または、完全長gRNAまたは切り詰め型gRNAの予測されるオンターゲット活性率の10%超である、予測されるオンターゲット活性率を含む、第28項に記載の方法。
【0319】
第32項.前記最適化されたgRNAが、surveyorアッセイ、次世代シーケンシング技術、またはGUIDE-Seqを使用して、ステップi)において試験される、第1~31項のいずれか1項に記載の方法。
【0320】
第33項.前記最適化されたgRNAが、オフターゲット部位での結合を最小にし、かつプロトスペーサー配列に結合させるように設計される、第1~32項のいずれか1項に記載の方法。
【0321】
第34項.前記オフターゲット部位が、公知であるまたは予測されるオフターゲット部位である、第1~33項のいずれか1項に記載の方法。
【0322】
第35項.前記完全長gRNAが、哺乳類遺伝子を標的にする、第1~34項のいずれか1項に記載の方法。
【0323】
第36項.前記標的遺伝子が、内在性標的遺伝子または導入遺伝子を含む、第1~35項のいずれか1項に記載の方法。
【0324】
第37項.前記標的遺伝子が、疾患関連遺伝子を含む、第1~36項のいずれか1項に記載の方法。
【0325】
第38項.前記標的遺伝子が、DMD、EMX1、またはVEGFA遺伝子である、第1~37項のいずれか1項に記載の方法。
【0326】
第39項.前記VEGFA遺伝子が、VEGFA1またはVEGFA3である、
第38項に記載の方法。
【0327】
第40項.第1~39項のいずれか1項に記載の方法によって産生された最適化されたgRNA。
【0328】
第41項.前記gRNAが、オンターゲット部位とオフターゲット部位とを、これらの部位間の最小熱力学的エネルギー差を用いて識別することができる、第40項の最適化されたgRNA。
【0329】
第42項.前記最適化されたgRNAが、プロトスペーサーへのストランド侵入を調節する、第40または41項の最適化されたgRNA。
【0330】
第43項.前記最適化されたgRNAが、配列番号149~315、321~323、および326~329のうちの少なくとも1つのヌクレオチド配列を含む、第40~42項のいずれか1項に記載の最適化されたgRNA。
【0331】
第44項.第40~43項のいずれか1項に記載の最適化されたgRNAをコードする単離されたポリヌクレオチド。
【0332】
第45項.第44項の単離されたポリヌクレオチドを含むベクター。
【0333】
第46項.第44項の単離されたポリヌクレオチドまたは第45項のベクターを含む細胞。
【0334】
第47項.第44項の単離されたポリヌクレオチド、第45項のベクター、または第46項の細胞を含むキット。
【0335】
第48項.標的細胞または対象におけるエピゲノム編集の方法であって、細胞または対象を、有効量の第40~43項のいずれか1項に記載の最適化されたgRNA分子または第44項の単離されたポリヌクレオチドおよび融合タンパク質と接触させることを含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【0336】
第49項.標的細胞または対象における部位特異的DNA切断の方法であって、細胞または対象を、有効量の第40~43項のいずれか1項に記載の最適化されたgRNA分子または第44項の単離されたポリヌクレオチドおよび融合タンパク質またはCas9タンパク質と接触させることを含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【0337】
第50項.細胞におけるゲノム編集の方法であって、前記細胞に、有効量の第40~43項のいずれか1項に記載の最適化されたgRNA分子または第44項の単離されたポリヌクレオチドおよび融合タンパク質を投与することを含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【0338】
第51項.前記ゲノム編集が、変異遺伝子を修正することまたは導入遺伝子を挿入することを含む、第50項に記載の方法。
【0339】
第52項.変異遺伝子を修正することが、変異遺伝子を欠失させること、再編成させること、または置き換えることを含む、第51項に記載の方法。
【0340】
第53項.変異遺伝子を修正することが、ヌクレアーゼ介在性の非相同末端結合または相同組換え修復を含む、第51または52項のいずれか1項に記載の方法。
【0341】
第54項.細胞における遺伝子発現を調節する方法であって、前記細胞を、有効量の第40~43項のいずれか1項に記載の最適化されたgRNA分子または第44項の単離されたポリヌクレオチドおよび融合タンパク質と接触させることを含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む方法。
【0342】
第55項.少なくとも1つの標的遺伝子の遺伝子発現が、前記少なくとも1つの標的遺伝子の遺伝子発現レベルが前記少なくとも1つの標的遺伝子についての正常な遺伝子発現レベルと比較して増大または低下される場合に調節される、第54項に記載の方法。
【0343】
第56項.前記融合タンパク質が、dCas9ドメインおよび転写活性化因子を含む、第54または55項に記載の方法。
【0344】
第57項.前記融合タンパク質が、配列番号2のアミノ酸配列を含む、第56項に記載の方法。
【0345】
第58項.前記融合タンパク質が、dCas9ドメインおよび転写抑制因子を含む、第54または55項に記載の方法。
【0346】
第59項.前記融合タンパク質が、配列番号3のアミノ酸配列を含む、第58項に記載の方法。
【0347】
第60項.前記融合タンパク質が、dCas9ドメインおよび部位特異的ヌクレアーゼを含む、第54または55項に記載の方法。
【0348】
第61項.前記最適化されたgRNAが、ポリヌクレオチド配列によってコードされ、レンチウイルスベクターにパッケージングされる、第48~60項のいずれか1項に記載の方法。
【0349】
第62項.前記レンチウイルスベクターが、前記gRNAをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む発現カセットを含む、第61項に記載の方法。
【0350】
第63項.前記最適化されたgRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターが、誘導性である、第62項に記載の方法。
【0351】
第64項.前記レンチウイルスベクターが、前記Cas9タンパク質または融合タンパク質をコードするポリヌクレオチド配列をさらに含む、第61~63項のいずれか1項に記載の方法。
【0352】
第65項.前記少なくとも1つの標的遺伝子が、疾患関連遺伝子である、第48~64項のいずれか1項に記載の方法。
【0353】
第66項.前記標的細胞が、真核細胞である、第48~65項のいずれか1項に記載の方法。
【0354】
第67項.前記標的細胞が、哺乳類細胞である、第48~66項のいずれか1項に記載の方法。
【0355】
前記標的細胞が、HEK293T細胞である、第48~67項のいずれか1項に記載の方法。
【0356】
付表-配列
化膿レンサ球菌(Streptococcus pyogenes)Cas 9(D10A、H840Aを伴う)(配列番号1)
【化7】
dCas9p300 Core:(Addgene プラスミド61357)アミノ酸配列;3X「Flag」エピトープ、核局在配列、化膿レンサ球菌(Streptococcus pyogenes)Cas9(D10A、H840A)、p300 Coreエフェクター、「HA」エピトープ(配列番号2)
【化8】
dCas9KRAB(配列番号3)
【化9】
Nm-dCas9p300 Core:(Addgeneプラスミド61365)アミノ酸配列;髄膜炎菌(Neisseria meningitidis)Cas9(D16A、D587A、H588A、N611A)、核局在配列、p300 Core エフェクター、「HA」エピトープ(配列番号5)
【化10】
図1A-1D】
図2A-2B】
図2C-2D】
図3A-3B】
図3C-3D】
図4A-4C】
図4D
図5A-5B】
図5C
図6A-6B】
図7A-7C】
図8A-8B】
図9A-9C】
図10A-10C】
図11A-11D】
図12A
図12B
図13
図14A-14C】
図15
図16A-16B】
図17
図18
図19
図20
図21A
図21B
図22
図23
図24
図25A
図25B
図26A-26B】
図26C
図27
図28
図29
図30
図31A
図31B
図32
図33
図34A-34B】
図35
図36
図37
図38
図39A
図39B
図40A-40B】
図40C
図41
図42
図43
図44A-44B】
図44C
図45A
図45B
図45C
図45D
図46
図47
図48
【配列表】
2025016579000001.app
【手続補正書】
【提出日】2024-11-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
配列番号326~329から選択される配列によりコードされるヌクレオチド配列を含む、gRNA。
【請求項2】
前記gRNAが、細胞において、CRISPR/Cas9に基づく系またはCRISPR/Cpf1に基づく系と共に使用される、請求項1に記載のgRNA。
【請求項3】
請求項1に記載のgRNAをコードする単離されたポリヌクレオチド。
【請求項4】
請求項3に記載の単離されたポリヌクレオチドを含むベクター。
【請求項5】
請求項3に記載の単離されたポリヌクレオチドまたは請求項4に記載のベクターを含む細胞。
【請求項6】
請求項3に記載の単離されたポリヌクレオチド、請求項4に記載のベクター、または請求項5に記載の細胞を含むキット。
【請求項7】
標的細胞におけるエピゲノム編集または遺伝子発現調節のための組成物であって、有効量の請求項1に記載のgRNA分子および融合タンパク質を含み、前記融合タンパク質が、ヌクレアーゼ欠損Cas9またはCpf1を含む第1のポリペプチドドメインと、転写活性化活性、転写抑制活性、ヌクレアーゼ活性、転写終結因子活性、ヒストン修飾活性、核酸会合活性、DNAメチル化酵素活性、および直接的または間接的DNA脱メチル化酵素活性からなる群から選択される活性を有する第2のポリペプチドドメインを含む組成物。
【請求項8】
前記融合タンパク質が、dCas9ドメインおよび転写活性化因子、dCas9ドメインおよび転写抑制因子、あるいは、dCas9ドメインおよび部位特異的ヌクレアーゼを含む、請求項7に記載の組成物。
【外国語明細書】