IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イーエムベーアー−インスティテュート フュール モレクラレ バイオテクロノジー ゲゼルシャフト ミット ベシュレンクテル ハフツングの特許一覧

特表2023-519790CRISPRガイドRNAの内部標準
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-15
(54)【発明の名称】CRISPRガイドRNAの内部標準
(51)【国際特許分類】
   C12N 15/11 20060101AFI20230508BHJP
   C12N 15/09 20060101ALI20230508BHJP
   C12N 15/54 20060101ALI20230508BHJP
   C12N 1/15 20060101ALI20230508BHJP
   C12N 1/19 20060101ALI20230508BHJP
   C12N 1/21 20060101ALI20230508BHJP
   C12N 5/10 20060101ALI20230508BHJP
【FI】
C12N15/11 Z ZNA
C12N15/09 110
C12N15/54
C12N1/15
C12N1/19
C12N1/21
C12N5/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022548213
(86)(22)【出願日】2021-03-30
(85)【翻訳文提出日】2022-08-08
(86)【国際出願番号】 EP2021058255
(87)【国際公開番号】W WO2021198233
(87)【国際公開日】2021-10-07
(31)【優先権主張番号】20166567.6
(32)【優先日】2020-03-30
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】513048519
【氏名又は名称】イーエムベーアー-インスティテュート フュール モレクラレ バイオテクノロジー ゲゼルシャフト ミット ベシュレンクテル ハフツング
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】ウルリヒ エリング
(72)【発明者】
【氏名】アンニカ セル
(72)【発明者】
【氏名】エスタ セー.ホー.ウイデボール
【テーマコード(参考)】
4B065
【Fターム(参考)】
4B065AA91X
4B065AB01
4B065AC12
4B065AC20
4B065BA02
4B065CA46
(57)【要約】
本発明は、CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸と、このようなsgRNAの使用方法、トランスジェニック細胞、及びキットを提供する。sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、sgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対をさらに含み、ガイド破壊配列は、リコンビナーゼ認識部位の第2の対によってフランキングされておらず、及び第1及び第2のリコンビナーゼ認識部位によってフランキングされた配列は重複している。
【特許請求の範囲】
【請求項1】
CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸であって、sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、及びsgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対をさらに含み、ガイド破壊配列は、リコンビナーゼ認識部位の第2の対によってフランキングされておらず、及び/又はリコンビナーゼ認識部位の第2の対は、活性sgRNAを形成するために必要なsgRNAの一部をフランキングしており、そして第1及び第2のリコンビナーゼ認識部位によってフランキングされた配列は重複している、上記核酸。
【請求項2】
前記第2のリコンビナーゼ認識部位の対の1つのリコンビナーゼ認識部位が、リコンビナーゼ認識部位の第1の対の間に位置し、好ましくはガイド破壊配列の下流に位置し、及び第2のリコンビナーゼ認識部位の対の別のリコンビナーゼ認識部位が、リコンビナーゼ認識部位の第1の対の下流に位置する、請求項1に記載の核酸。
【請求項3】
前記第1のリコンビナーゼ認識部位の1つが、sgRNA配列のループ領域内に位置し、好ましくはsgRNA配列がcrRNA部分及びtracrRNA部分を含み、及び第1のリコンビナーゼ認識部位の1つが、crRNA-tracrRNAリンカーループ内に位置する、請求項1又は2に記載の核酸。
【請求項4】
前記ガイド破壊配列が転写破壊配列を含むか、又は活性sgRNA折り畳みへの折り畳みを防止するのに十分な長さを有する、請求項1~3のいずれか1項に記載の核酸。
【請求項5】
リコンビナーゼ認識部位の前記第1及び第2の対が同じリコンビナーゼ酵素によって活性化され、好ましくはこれらがlox部位から、さらに好ましくはloxP、lox511、lox5171、lox2272、M2、M3、M7、M11、lox71、lox66から独立して選択される、請求項1~4のいずれか1項に記載の核酸。
【請求項6】
好ましくはリコンビナーゼ認識部位の対の間、特に好ましくはリコンビナーゼ認識部位の第1及び第2の対の両方の間に位置する選択マーカー配列、好ましくは抗生物質選択マーカー配列をさらに含む、請求項1~5のいずれか1項に記載の核酸。
【請求項7】
リコンビナーゼ刺激時にCRISPR/CasシステムのsgRNAを発現させる方法であって、この方法は、
A)複数の細胞に請求項1~6のいずれか1項に記載の複数の核酸を提供すること、
B)第1及び第2のリコンビナーゼ認識部位の対を活性化することができる細胞内で、1種以上のリコンビナーゼを導入するか又は活性化すること、を含み、
C)ここで、第1のリコンビナーゼ認識部位の対及び第2のリコンビナーゼ認識部位の対の活性化は競合反応であり、第1のリコンビナーゼ認識部位の対の活性化は活性sgRNAの発現をもたらし、及び第2のリコンビナーゼ認識部位の対の活性化はsgRNA配列を不活性化する、上記方法。
【請求項8】
前記複数の細胞が、細胞毎に、請求項1~6に記載の核酸の単一のコピーを有する、請求項7に記載の方法。
【請求項9】
前記細胞が工程A)の後でかつ工程B)の前に増殖される請求項7又は8に記載の方法であって、好ましくは前記細胞は、請求項1~6のいずれか1項に記載の複数の核酸中の異なるsgRNA配列の数当たり少なくとも250個の細胞の数まで増殖される、上記方法。
【請求項10】
前記sgRNA配列の存在を検出するためにsgRNA配列の不活性部分を有する細胞が同定される、請求項7~9のいずれか1項に記載の方法。
【請求項11】
前記細胞が、トランスジェニック癌遺伝子をさらに発現するか、又は抑制された腫瘍抑制遺伝子を有する請求項7~10のいずれか1項に記載の方法であって、
前記方法は、工程C)における活性化のない細胞と比較して、工程C)における活性化後の腫瘍形成の差異を過剰に提供し、これにより腫瘍形成中にsgRNAが標的とする遺伝子の役割についてスクリーニングするか、又は前記細胞が候補化合物を用いてさらに処理されることをさらに含み、
前記方法は、工程C)における活性化のない細胞と比較して、工程C)における活性化後の細胞活性又は形態の差異を過剰に提供し、これにより候補化合物の影響下にあるsgRNAが標的とする遺伝子の活性についてスクリーニングすることをさらに含む、上記方法。
【請求項12】
請求項1~6のいずれか1項に記載の核酸が、固有の分子識別子(UMI)配列を含み、前記UMIは異なる細胞中の同じsgRNAを同定するために使用される、請求項7~11のいずれか1項に記載の方法。
【請求項13】
前記細胞が、リコンビナーゼ、好ましくはCreの発現のための核酸配列を含み、リコンビナーゼの発現のための前記核酸が好ましくは選択マーカーも含む、請求項7~12のいずれか1項に記載の方法。
【請求項14】
請求項1~6のいずれか1項に記載の核酸を含む細胞。
【請求項15】
i)請求項1~6のいずれか1項に記載の核酸、及び
ii)請求項1~6のいずれか1項に記載の核酸の両方のリコンビナーゼ認識部位の対を活性化することができる1種以上のリコンビナーゼの発現のための1種以上の核酸、を含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CRISPR/Casシステムとその手段を使用するDNA編集の分野に関する。
【背景技術】
【0002】
CRISPRスクリーニングは、様々なアッセイでゲノムを機能的に調べるための主要な方法になっている。ポジティブ選択スクリーンでは、細胞集団におけるsgRNAの濃縮を調べて、ノックアウト時に細胞の生存を促進する遺伝子を特定する。一方ネガティブ選択スクリーニングでは、対応する遺伝子のノックアウトにより細胞死が生じるため、特定のsgRNAは細胞集団から欠失させる(Miles et al. FEBS J. 283, 2016: 3170-3180)。これらのスクリーンは、必須遺伝子群(essentialome)スクリーンとも呼ばれる。そうするために、細菌のエンドヌクレアーゼCas9を発現する細胞株はsgRNAライブラリーを形質導入されて、遺伝子の機能変異の喪失を誘導する。sgRNAは、20bpの遺伝子特異的ストレッチとCas酵素をsgRNA配列に相補的なゲノム遺伝子座に導く3’足場とからなる短いRNAである。結合すると、Casは遺伝的又は調節的変化を引き起こす。
【0003】
遺伝子機能の優れた評価のためには、複数の独立した細胞に特定のsgRNAを形質導入して、細胞の不均一性と様々な編集結果を説明する必要がある。プールされた遺伝子スクリーンでは、独立して標的とされる細胞の数は、通常300~1,000細胞/sgRNA以上に維持される。従って、各遺伝子がゲノム全体(20,000遺伝子)のスクリーニングアプローチで5つのsgRNAを用いて標的にされる場合、これは実験全体で最小スクリーンサイズが300×5×20,000=3,000万個の細胞になる。例えば、Wang et al. (Science 343, 2014: 80-84) は、73,000のsgRNAを使用して9,000万個の標的細胞を形質導入する、すなわち1,233細胞/sgRNAの大規模なCRISPR-Casスクリーンを記載している。5~10sgRNA/遺伝子が推奨される。このようなスクリーンでは本質的に、多数の生存活性の高い不死化細胞を用いて作業する。
【発明の概要】
【発明が解決しようとする課題】
【0004】
多数の細胞というこの要件は、不均一な増殖を有する初代細胞株、限られたサイズのオルガノイド、及びインビボスクリーンなどのいくつかの実験では、対応することが難しい。従って、スクリーンにおいて必要な細胞の数を減らし、かつ細胞増殖のボトルネックを克服することができる堅牢な方法が必要である。
【課題を解決するための手段】
【0005】
本発明の要約
本発明は、CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸を提供し、sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、及びsgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対をさらに含み、ガイド破壊配列は、リコンビナーゼ認識部位の第2の対によってフランキングされておらず、及び/又はリコンビナーゼ認識部位の第2の対は、活性sgRNAを形成するために必要なsgRNAの一部をフランキングしており、そして、第1及び第2のリコンビナーゼ認識部位によってフランキングされた配列は重複している。
【0006】
これに関連して、本発明は、CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸を提供し、ここで、sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、及びsgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対をさらに含み、第2のリコンビナーゼ認識部位の対の1つのリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の間に位置し、及び任意選択的にガイド破壊配列の下流に位置し、及び第2のリコンビナーゼ認識部位の対の別のリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の下流に位置する。
【0007】
本発明はさらに、リコンビナーゼ刺激時にCRISPR/CasシステムのsgRNAを発現させる方法を提供し、この方法は、A)複数の細胞に本発明の複数のsgRNAコード核酸を提供し、B)第1及び第2のリコンビナーゼ認識部位の対を活性化することができる細胞内で、1種以上のリコンビナーゼを導入するか又は活性化すること、を含み、C)ここで、第1のリコンビナーゼ認識部位の対及び第2のリコンビナーゼ認識部位の対の活性化は競合反応であり、第1のリコンビナーゼ認識部位の対の活性化は活性sgRNAの発現をもたらし、及び第2のリコンビナーゼ認識部位の対の活性化はsgRNA配列を不活性化する。
【0008】
さらに、本発明のCRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸を含む細胞が提供される。さらに、i)sgRNAをコードする核酸と、ii)sgRNAコード核酸のリコンビナーゼ認識部位の対を活性化するリコンビナーゼの発現のための核酸とを、含むキットが提供される。
【0009】
本発明の全ての実施態様は、以下の詳細な説明に一緒に記載され、全ての好適な実施態様は、全ての実施態様、態様、核酸、方法、細胞、及びキットに同様に関連する。例えば核酸、細胞、及びキット自体の記載は、本発明の方法で使用される核酸及び手段にも適用される。本発明の方法の好適かつ詳細な説明は、本発明の核酸、細胞、キット、又は発現されたsgRNAのような生成物一般の適合性及び要件に同様に適用される。特に他に明記しない限り、全ての実施態様を互いに組み合わせることができる。
【発明を実施するための形態】
【0010】
発明の詳細な説明
高分解能のインビボCRISPR法の主な課題は、複数の独立した細胞における各sgRNAの表示である(Miles et al.、前出)。理想的には、遺伝子は複数のsgRNA、5~10のsgRNA/遺伝子によって標的化され、各sgRNAは300~1,000個の細胞に表示される。このいわゆるライブラリーの複雑さは、インビトロで不死化された細胞株では簡単に達成及び維持できる。しかし、この複雑さを初代細胞又はインビボで実現することははるかに困難であり、従ってゲノム全体のライブラリーではこれまでのところ不可能である。さらに、システムから多数の細胞を除去する選択工程などの増殖のボトルネックは、複雑さの損失を引き起こし、従ってsgRNAの表示の減少又は喪失によりスクリーン品質が低下する。表示のさらなるボトルネックには、次のものが含まれる:i)感染効率:どれだけのsgRNAが独立した細胞に正常に形質導入されるか。他の細胞よりも感染が困難な細胞がある。非効率的なsgRNA感染は、スクリーニングが開始される前に、クローンの増殖とライブラリーの多くのsgRNAの喪失につながる。ii)細胞の利用可用性:ライブラリーの複雑さを高めるために拡張できる細胞の量。一部の細胞株は増殖能力が限られているため、実際のスクリーニングの前に十分なsgRNAを表示すること、及びスクリーニング中に維持することは困難である。iii)生着:インビボで注入後に生存する形質導入された(例えば腫瘍)細胞の量は細胞注入の場所にも依存する。どの細胞が生着するかに依存して、限られた量のsgRNAのみが表示される。iv)分化:集団内の他の細胞の代わりに特定の細胞が分化する偏り。これらの要因はまとめて、生物活性とは無関係に、インビボ実験でsgRNA表示の非常に広く確率的な広がりに寄与する。従って、絶対的表示は、特定のsgRNAによって誘導される表現型の有用な予測因子ではなく、スクリーン結果の検証が不十分になる。
【0011】
これらのボトルネックに加えて、細胞の不均一性も、混乱を招き、時には矛盾するスクリーニング結果をもたらす上で極めて重要な役割を果たす。細胞集団内には、生存能力の利点を獲得した細胞がしばしば存在するが、リポーターの追加又は免疫蛍光アッセイにより、遺伝子編集後にも発生する可能性もある。
【0012】
本発明は、トランスフェクションの時点での必要な細胞の数、又はボトルネックでの生き残っている細胞の数を減らすことができるCRISPRシステムを提供する。本発明の方法は、sgRNAの確率的活性化又は不活性化に基づいており、それにより、細胞集団において活性化及び不活性化の両方のsgRNAを作成する。不活化されたsgRNAは、活性化されたsgRNAの対照として機能することができ、その逆も真である。重要なのは、活性化と不活性化の時間を制御することができ(通常はそのようなボトルネックの後に行われる)、それにより、例えば細胞数が増殖段階で回復された時のように、試験sgRNA種と同じ時点で対照の作成が可能になり、こうしてボトルネック又は細胞の不均一性の影響を回避する。
【0013】
確率的活性に基づいて、本発明の方法はまた、CRISPR-StAR(組換えによる確率的活性化)とも呼ばれる。組換えシステムを使用することにより、sgRNAを活性又は不活性状態で発現させることが可能である。リコンビナーゼ認識部位の2つの異なる対又はセットでの代替的組換えにより、活性化又は不活性化のいずれかが起こり、細胞集団内で内部対照(例えば、通常は不活性sgRNA)が生成される(図3)。
【0014】
CRISPR/Casシステムの単一ガイドRNA(sgRNA)のそのような条件付き発現のために、本発明は、sgRNA配列をコードする配列を含む、発現カセットなどの核酸を提供する。sgRNA内には、本発明の活性化又は不活性化を可能にするリコンビナーゼ認識部位が配置されている。sgRNAのリコンビナーゼ認識部位は、すでにWO2017/158153A1及びChylinski et al, Nature Communications 10, 2019: 5454に開示されており、CRISPR-スイッチと呼ばれている。両方の参考文献は、参照により本明細書に組み込まれる。本発明は、sgRNA修飾におけるリコンビナーゼ使用の基本原理を利用し、この原理をさらに数段階進めて、リコンビナーゼ認識の少なくとも2つの異なる対又はセットを使用して、条件付き活性化/不活性化システムを提供し、細胞数が少ない状況における不充分な表示の問題を克服している。
【0015】
sgRNAは、CRISPRiやCRISPRaなどのCRISPR/Cas法で、Cas1、Cas2、Cas3、Cas9、dCas9、Cas10、又はCas12aなどのCas酵素と組み合わせて使用されるRNAである。単一ガイドRNA(sgRNA)は、crRNA(CRISPR RNA)とtracrRNA(trans-活性化crRNA)の両方を単一の構築物として含む。crRNAはまた、DNAガイド配列を含むためのガイドRNAとも呼ばれる。tracrRNAとcrRNAを結合させて、単一の分子、すなわち単一ガイドRNA(sgRNA)を形成することができる。tracrRNAとcrRNAは相補的な領域でハイブリダイズする。この相補的領域は結合に使用することができ、結合とともに、本明細書ではcrRNA:tracrRNAステムループと呼ばれるステムループを形成することができる。この領域は、ほとんどの場合Casタンパク質への結合を仲介するため、Cas結合要素と呼ばれることもある。部位特異的切断は、crRNAと標的プロトスペーサーDNA間の塩基対の相補性と、標的DNAの相補領域に並置された短いモチーフ[プロトスペーサー隣接モチーフ(PAM)と呼ばれる]の両方によって決定される位置で起きる。標的DNAは、修飾が必要な任意のDNA分子にあってもよい。それは改変されるべき遺伝子であるかもしれない。CRISPR/Casシステムの典型的な使用法は、DNAに変異や修飾を導入したり、遺伝子発現を変化させたりすることである。sgRNAのデザインは、例えば次のようにレビューされているように、現在は従来型である:Ciu et al. (Interdisciplinary Sciences Computational Life Sci-ences 2018, DOI: 10.1007/s12539-018-0298-z) 又は Hwang et al. (BMC Bioinformatics 19, 2018:542)。本発明に従って使用して、目的の活性(例えば、CRISPR/Casの作用による遺伝子の活性化又は阻害)を有する、目的の遺伝子を標的とするsgRNA配列を生成することができる、多くのツールが存在する。
【0016】
本発明によれば、sgRNA配列はガイド破壊配列によって中断される。このガイド破壊配列は、Cas酵素が使用できる活性sgRNAの形成を妨害する。ガイド破壊配列は、リコンビナーゼ認識部位の第1の対によってフランキングされており、これらの部位でのリコンビナーゼ作用によってガイド破壊配列が欠失されることを可能にする。sgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対を含む。リコンビナーゼ認識部位の第1の対との違いは、2つのタイプのリコンビナーゼ認識部位間に組換え混合物又は接続が発生しないことを意味する。この効果のために異なるリコンビナーゼを使用することができるが、Creなどの一部のリコンビナーゼは、組換え中にそのような異なる部位を接続せずに多くの部位を認識するため、第1と第2の部位に同じリコンビナーゼを使用することもできる。
【0017】
注目すべきことに、第1及び第2のリコンビナーゼ認識部位は両方とも、組換え時に欠失をもたらし、すなわち、これらは同じ方向にある(配列の反転につながる反対の方向ではない)。
【0018】
第1と第2のリコンビナーゼ認識部位の主な違いは、部位の第1の対のみがガイド破壊配列をフランキングし、第2の対はガイド破壊配列をフランキングしないことである。これは、第1の対での組換えがガイド破壊配列を除去する(sgRNAを活性にする)のに対し、第2の対での組換えはこれを除去しない(sgRNAは不活性のまま)ことを意味する。本明細書において、「sgRNA配列を不活性化する」への言及は、sgRNAが不活性にされ、それにより、もはや活性sgRNAを生じさせることができず、すなわち第2のリコンビナーゼ認識部位の対で組換えが起きないことを意味する。さらに、第1の対と第2の対によりフランキングされる配列は重複し、第1の対での組換え(これによりそのフランキングされた配列が欠失される)により、第2の対の必要な必要なリコンビナーゼ認識部位が除去され、そして別の場合には、第2の対での組換え(これによりそのフランキングされた配列が欠失される)により、第1の対の必要なリコンビナーゼ認識部位が除去されるため、第1の対と第2の対の組換えは相互に排他的になる。従って、本発明のsgRNAでは、第2のリコンビナーゼ認識部位の対の1つのリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の間(及び好ましくはガイド破壊配列の下流)に位置し、第2のリコンビナーゼ認識部位の対の別のリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の下流に位置する。「下流」とは、sgRNAの配列上の5’から3’への方向を意味する。言い換えれば、本発明の核酸は、CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸として定義することもでき、ここで、sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、及びここで、sgRNA配列は、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対をさらに含み、ここで、ガイド破壊配列は、リコンビナーゼ認識の第2の対によってフランキングされておらず、及びここで、第1及び第2のリコンビナーゼ認識部位によってフランキングされた配列は重複している。リコンビナーゼ認識部位の第1の対の間に位置する言及された第2のリコンビナーゼ認識部位は、任意選択的に及び好ましくは、ガイド破壊配列の下流にもある。これは、第2のリコンビナーゼ認識部位の対によってフランキングされた領域の外側にガイド破壊配列を残し、従って、不活性化の際に、ガイド破壊配列を有効のまま残す。これにより、不活化されたsgRNAが効率的に生成される。しかし、活性sgRNAを形成するために必要なtracrRNAの一部を除去するなど、他の選択肢も存在する。このような除去はまた、sgRNAを不活性化するであろう。もちろんtracrRNAの一部のこの除去は、第2のリコンビナーゼ認識部位の対によってフランキングされた領域の外側にガイド破壊配列を配置することと組み合わせることができる。従って、「ガイド破壊配列がリコンビナーゼ認識部位の第2の対によってフランキングされていない」の代わりに、リコンビナーゼ認識部位の第2の対が、上記のように必須のtracrRNA部分などの活性sgRNAを形成するのに必要とされるsgRNAの一部をフランキングする核酸を提供することも可能である。tracrRNAのそのような必須の部分は、Cas結合要素、又は本明細書に記載されるようにtracrRNAの任意の機能のために必要とされるtracrRNAの一部であり得る。第2のリコンビナーゼ認識部位が、ガイド破壊配列及びリコンビナーゼ認識部位の第1の対の1つの下流にあるこの選択肢は、ガイドの5’から3’構造の後にtracr部分が続くsgRNAに特に適用される。一部のCas酵素は、ガイドがtracrの下流(3’側)にある場合などの、異なる順序を認識する。これらのCas酵素の場合、sgRNA内の順序が逆になり、第2のリコンビナーゼ認識部位がガイド破壊配列の上流(すなわち、3’から5’の方向)にある必要がある。従って、本発明はまた、CRISPR/Casシステムの単一ガイドRNA(sgRNA)をコードする配列を含む核酸を提供し、ここで、sgRNA配列は、リコンビナーゼ認識部位の第1の対によってフランキングされたガイド破壊配列によって中断され、及びここで、sgRNA配列はさらに、リコンビナーゼ認識部位の第1の対とは異なるリコンビナーゼ認識配列を有するリコンビナーゼ認識部位の第2の対を含み、ここで、第2のリコンビナーゼ認識部位の対の1つのリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の間(及び好ましくはガイド破壊配列の上流)に位置し、及び第2のリコンビナーゼ認識部位の対の別のリコンビナーゼ認識部位は、リコンビナーゼ認識部位の第1の対の上流に位置する。
【0019】
この配列構造に基づいて、前記第1又は第2のリコンビナーゼ認識部位の1つの対のみが組換え反応を引き起こし、リコンビナーゼ認識部位間の配列の欠失をもたらすことができる。部位の対のどちらか、すなわち第1の対と第2の対のどちらが組換え(「選択」)をもたらすかは、本質的に確率的である。他のものよりも好ましい組換え配列を選択することは可能であるが、本質的に、リコンビナーゼによる部位選択は確率的なままである。簡単に言えば、以下で他の選択肢と共により詳細に説明されるように、通常、より短いフランキング配列での組換えがより長いフランキング配列よりもリコンビナーゼ酵素にとって好適である。本発明のsgRNA配列を有する集団又は複数の細胞を使用する場合、リコンビナーゼ酵素による確率的リコンビナーゼ部位選択は、細胞の(第1の)群が第1のリコンビナーゼ認識部位組換え(sgRNAの活性化)を、及び別の細胞の(第2の)群が第2のリコンビナーゼ認識部位の組換え(sgRNAの不活性化)を有することを意味する。細胞の第1の群と細胞の第2の群の比率は、リコンビナーゼ認識部位の第1の対と第2の対の間の組換えの選択の優先度に依存する。
【0020】
これらの原理によれば、本発明は、リコンビナーゼ刺激時にCRISPR/CasシステムのsgRNAを発現する方法を提供し、この方法は、以下を含む:
A)複数の細胞に、本発明のsgRNAをコードする複数の核酸を提供すること、
B)第1及び第2のリコンビナーゼ認識部位の対を活性化することができる細胞に、1種以上のリコンビナーゼを導入又は活性化することを含み、
C)ここで、第1のリコンビナーゼ認識部位の対と第2のリコンビナーゼ認識部位の対の活性化は競合反応であり、ここで、第1のリコンビナーゼ認識部位の対の活性化は活性sgRNAの発現をもたらし、及び第2のリコンビナーゼ認識部位の対の活性化はsgRNA配列を不活性化する。
【0021】
本発明の1つの利点は、リコンビナーゼの導入又は活性化の時間を実施者が選択できることである。従って、考慮されるアッセイ又はスクリーニング方法に最適な所望の数まで、細胞を増殖させることが可能である。これにより、例えば全能性、多能性(pluripotent)、又は多能性(multipotent)(幹)細胞から開始する場合の、分化パラダイムにおける望ましい分化段階(例えば、最終分化又は終末分化)などの組換えに有益な時点を選択することが可能になる。一方、活性sgRNAと不活性sgRNAの両方が存在すると、細胞集団内の内部対照が提供されるため、細胞数が少なく最適ではない場合でも、改善が達成される。
【0022】
本発明のCRISPR-StAR法は、sgRNAの存在量を、ボトルネック前のsgRNAの存在量ではなく、内部の不活性な対照と比較することにより、確率的な表示ドリフトを回避することができる。特にsgRNA表現のボトルネックを通過するスクリーンの場合、この制御方法は、スクリーニングの前後にsgRNAを制御する従来の方法よりも堅牢である(図8~13)。CRISPR-StARは、細胞数が少ない場合でも、ノイズを低減し、必須のsgRNAと対照sgRNAの集団の分離を可能にする。
【0023】
活性sgRNAと不活性sgRNAの比較可能性を維持するには、両方が、すなわち不活性sgRNAもガイド配列の少なくとも一部(crRNAに対応、上記を参照)を維持して、不活性sgRNAが活性sgRNAに割り当てられるようにすることが不可欠である。もちろん、前記配列が両方の組換えイベントで保存され、sgRNAに固有であるため、他の遺伝子標的を有する他のsgRNA配列と混同されない場合、他の配列を使用して、両方が同じ核酸に由来する不活性及び活性のsgRNAを互いに割り当てることができる。
【0024】
本発明の好適な実施態様において、sgRNA配列の不活性部分を有する細胞は、sgRNA配列の存在を検出することが特定される。実験でsgRNAの存在を検出する手段として不活性sgRNAを使用すると、ボトルネックよる消失又はその他の欠如理由に関係なく、存在していたために実験で試験されたsgRNA(特にそのガイド配列)を特定することができる。細胞集団中に活性sgRNAが存在しない場合、その欠如がsgRNA自体の活性(例えば細胞の生存に対して有害)によって引き起こされる可能性もあるため、通常そのような結論は得られない。これは、活性sgRNAの欠如(従来技術のように)は、sgRNAが細胞の生存(従ってsgRNAの検出)を妨害するか、又はそれが実験中に失われたことを意味し得ることを意味する。本発明の不活性sgRNAが存在しないことは、おそらくこれが実験で失われたことを意味するが、sgRNAは不活性のままであるため、細胞の生存に影響を与えなかったであろうから、この理由は除外できる。これは、本発明のシステムが、結果(細胞生存)がないことの証拠を提供することを意味する。
【0025】
本発明のシステムは、大規模なスクリーニングに最初に必要とされるよりも低い表示でのスクリーニングを可能にし、従って、ボトルネックを克服するであろう。これは、インビボでの遺伝子スクリーン、特に大規模な遺伝子スクリーンに特に有益である。
【0026】
細胞生存又は増殖のボトルネックにおける低細胞数の細胞の影響を克服するために、本発明の核酸を有する細胞を望ましい数まで増殖させた後に、リコンビナーゼを(能動的に)導入又は活性化することが好ましい。例えば、本発明の好適な実施態様において、工程A)の後でかつ工程B)の前に、細胞は増殖(クローン化)され、好ましくは、ここで細胞は、実験で使用される異なるsgRNA配列の数当たり、少なくとも250、好ましくは少なくとも300、少なくとも350、又は少なくとも400個の細胞数まで増殖される。また場合によっては、より大きな数が可能かつ好適であり、本発明の異なるsgRNA配列の数当たり、少なくとも500、又は少なくとも800、例えば500~5000、又は800~2000、又はそれ以上の細胞数である。細胞の不均一性のため、CRISPR実験では多くの細胞が並行して試験される。本発明の方法及びそのための手段は、本発明の核酸を含むこれらの細胞を作成すること(トランスフェクション、移植などの細胞数を減少させる可能性のある任意の工程の後)を可能にし、次にリコンビナーゼを活性化すると、第1又は第2のリコンビナーゼ認識部位で組み換えが起き、それによりsgRNAを活性化又は不活性化する。この活性化/リコンビナーゼ作用の後、細胞又は生物におけるsgRNAの遺伝的又は生理学的効果を観察することができる。「第1及び第2のリコンビナーゼ認識部位の対を活性化することができる」という表現は、第1及び第2のリコンビナーゼ認識部位で組換えを引き起こすことができるリコンビナーゼを指す。「リコンビナーゼを活性化する」とは、リコンビナーゼが組み換えを行うことを意味する。リコンビナーゼは不活性型で存在することができ、補因子又は他の活性化因子が存在すると活性化され得る。
【0027】
好適な実施態様において、リコンビナーゼは誘導性リコンビナーゼである。これにより、リコンビナーゼが存在するトランスジェニック細胞の調製が容易になり、これは次に、上記の工程B)に記載したようにリコンビナーゼを活性化することができる。誘導性リコンビナーゼは、誘導性プロモーター又は転写エンハンサーを使用することによって誘導され得る。プロモーター又はエンハンサーを活性化すると、リコンビナーゼの発現と活性が高まる。別の例は、(タンパク質として)不活性であり、活性化因子の作用によって活性化されるリコンビナーゼである。そのようなリコンビナーゼは遺伝子操作され得る。一例は、エストロゲン受容体(ER)に、又はERの(変異した)リガンド結合ドメインに融合したCreリコンビナーゼ、CreERである。エストロゲン受容体又はドメイン(例えば、4OH-タモキシフェン又はタモキシフェン)にリガンドを提供することにより、Cre酵素が活性化される。
【0028】
さらなる方法には、Cre又はFlpリコンビナーゼのドキシサイクリン依存性又は光誘導性発現などの条件付き遺伝子発現システムが含まれる。同様に、細胞型又はステージ特異的プロモーターを使用して、特定の時間又は場所で遺伝子発現を誘導することができる。さらに別の例は、前記リコンビナーゼ活性の化学的安定化(シールド)又は不安定化(デグロン)であり得る。
【0029】
例えば、リコンビナーゼは、細胞又は細胞培養物において、又は本発明の核酸を有する細胞を含む動物において、細胞/sgRNA表示のボトルネックの後に、例えば細胞が、例えば少なくとも500又は少なくとも1,000細胞/sgRNAに回復したとき、(例えば、4OH-タモキシフェンを投与することによって)誘導又は活性化され得る。
【0030】
好ましくは、本発明の核酸は細胞内で使用され、すなわち、本発明の方法において細胞に提供されるか又は提供されてきた。細胞はまた、細胞の増殖とともに核酸を安定して増殖させることができるはずである。これは、例えば核酸又はsgRNA配列を細胞のゲノムに組み込むことによって行われる。
【0031】
好ましくは、細胞は、細胞ごとに本発明のsgRNAをコードする核酸の1つのコピーを有する。これにより、所定の細胞で1つのタイプのみのリコンビナーゼ反応(活性化又は不活性化のいずれか、両方ではない)が発生することが保証される。もちろん、異なる細胞は上記の確率的原理に従って、異なるリコンビナーゼ反応を示す可能性があり、細胞内に不活性又は活性sgRNA集団を提供する。細胞にsgRNAコピーが1つしかないことを確認するために、Wang et al.(2014、上記)に開示されているAASV1遺伝子座のような1つの特定のゲノム遺伝子座を標的にすることができるが、もちろん他のユニークな遺伝子座も可能である。細胞ごとにゲノムへの挿入は1つだけ可能である。
【0032】
本発明の核酸は、好ましくはsgRNA配列を含み、また好ましくは、sgRNA配列の発現のためにsgRNA配列に作動可能に連結されたプロモーターも含む。プロモーターは、構成性プロモーター又は誘導性プロモーターであり得る。sgRNAの活性は本発明のsgRNA配列構築物(ガイド破壊配列又は不活性化リコンビナーゼ産物)自体によって調節されるため、構成性プロモーターが特に好ましい。プロモーターの例は、特にMa et al. (Molecular Therapy-Nucleic Acids 3, 2014: e161) に開示されている。プロモーターは、RNAポリメラーゼII(Pol II)又はRNAポリメラーゼIII(Pol III)プロモーターであり得る(WO2015/099850を参照)。好ましくはそれは、U6、7SK、又はH1プロモーターなどのPolIIIプロモーターである。Pol IIIプロモーターの構造は、Ma et al. 2014に開示されている。H1プロモーターの使用は、例えばWO2015/195621(参照により本明細書に組み込まれる)に示され、この方法及び構築物の設計は、本発明の任意の態様に従って使用することができる。好ましいプロモーターはU6プロモーターである。
【0033】
Pol IIプロモーターは、レトロウイルス性ラウス肉腫ウイルス(RSV)LTRプロモーター(任意選択的にRSVエンハンサーを含む)、サイトメガロウイルス(CMV)プロモーター(任意選択的にCMVエンハンサーを含む)、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、EFlaプロモーターから、及びさらにCAG、EF1A、CAGGS、PGK、UbiC、CMV、B29、デスミン(Desmin)、エンドグリン(Endoglin)、FLT-1、GFPA、及びSYN1プロモーターの任意の1つからなる群から選択することができる。Pol IIプロモーターは、WO2015/099850に開示されているように、ガイドRNA配列をフランキングしているCsy4切断部位と又は自己切断リボザイムと、組み合わせて使用することができる。ガイド発現におけるpol IIの使用は、WO2015/153940にさらに記載されている。
【0034】
核酸はまた、好ましくは選択マーカーを含む。選択マーカーを使用して、本発明の核酸を含む細胞を同定し、好ましくは選択又は単離することができる。従って、本発明の核酸を有する細胞のそのような形質転換の成功を確認及び制御することができる。次に、選択マーカーを有する細胞、及び結果として本発明のsgRNAは、本発明の方法の工程A)などに進めることができる。
【0035】
そのような選択マーカーは、当技術分野で知られている任意のマーカーであり得る。それは、細胞生存マーカー、例えば抗生物質耐性遺伝子、又は光学マーカー、例えばGFP、BFG、若しくはRFGなどの蛍光タンパク質をコードする遺伝子であり得る。
【0036】
好ましくは、マーカーは、第1及び/又は第2のリコンビナーゼ活性によって切除される位置に配置され、すなわち、これはリコンビナーゼ認識部位の第1及び/又は第2の対によってフランキングされる。この除去は、活性sgRNAの形成における選択マーカー配列の妨害を防ぎ、又は不活性sgRNAの場合、不活性sgRNAは好ましくは配列決定によって同定されため、これはサイズを小さくするのに役立つ。配列決定サイズを小さくすると、配列決定の労力とコストが削減され、これは、多くのsgRNA配列が配列決定される大規模なスクリーンで特に重要である。第1及び第2のリコンビナーゼ認識部位の対のそれぞれの間に、すなわち重複して、選択マーカーを配置することのさらなる利点は、ここでは、これが活性化及び不活性化の両方によって除去されることであり、これにより、本発明の核酸を使用する前の時期尚早の組み換えに対する逆選択が可能になることである。従って、選択肢「及び」が最も好ましく、すなわちマーカーは、好ましくはリコンビナーゼ認識部位の第1と第2の対の両方にフランキングされ、すなわち、第1と第2のリコンビナーゼ認識部位の対の重複部分内にある。
【0037】
好ましくは本発明の核酸は、1つ以上のプライマー又はプローブ結合部位を含み、その結果、核酸プライマー又はプローブは、その非リコンビナーゼ形質転換(元の)状態又は不活性のsgRNA若しくは活性sgRNAの状態のいずれかで、本発明のsgRNAの検出のために核酸に結合し得る。プライマーを使用して、sgRNA配列を増幅又は配列決定して、その検出及び好ましくは同定も行うことができる。プローブを使用して核酸を結合することができ、さらにプローブを使用してsgRNA配列を結合させて、その配列同定をすることができる。
【0038】
好ましくは、プライマー又はプローブ結合部位は、リコンビナーゼ認識部位の第1及び第2の対の外側にあり、従ってリコンビナーゼの作用の間及びその後にも維持される。そのようなプローブ又はプライマー結合部位は、例えば、ガイド配列又はsgRNA配列全体をフランキングしてもよい。好ましくは、2つのプローブ又はプライマー結合部位が使用され、1つはガイド配列又はsgRNA配列の5’であり、1つはガイド配列又はsgRNA配列の3’である。1つ以上のプローブ又はプライマー結合部位は、好ましくはsgRNA配列の近くにあり、好ましくはsgRNA配列のいずれかの末端から20,000nt(ヌクレオチド)以内、好ましくはsgRNA配列のいずれかの末端から15,000nt以内、又は10,000nt以内、5,000nt以内、又は1,000nt以内にある。
【0039】
sgRNAの構造は、例えばJiang and Doudna (Annu. Rev. Biophys. 46, 2017:505-29), Swarts et al. (Molecular Cell 66, 2017: 221-233)、WO2015/089364、WO2014/191521、WO2015/065964、及びWO2017/158153A1に開示されている。sgRNA分子は、標的の特異性を媒介する長さが通常15~30nt、ほとんどの場合17~21ntのガイドを含むcrRNAに対応する部分を含む。crRNAは、シュードノット構造及び/又はシード領域を含み得る。このcrRNA部分は、tracrRNAに対応する部分に接続されている。sgRNAでは、crRNAとtracrRNAの部分が、通常(crRNA)リピート、ループ、及び(tracrRNA)アンチリピートを含み得るステムループ領域中で融合している。ステムには、パリンドローム配列に加えて、ミスマッチヌクレオチドも含まれ得る。tracrRNAに対応するsgRNAの部分は、さらにループ領域を有し、一般にCas酵素への結合を仲介する3D折り畳み構造を有している可能性がある。リコンビナーゼ認識部位の第2の対に対するリコンビナーゼの作用によるsgRNAの不活性化は、Cas1、Cas2、Cas3、Cas9、dCas9、Cas10、Cas12a、Cas12b、又はCas12c、好ましくはCas9、及び/又はその変種、例えばdCas9の、選択されたCas酵素への結合を妨害して、例えばCas結合に必要な折り畳み構造を妨害することにより、欠失を引き起こすことが好ましい。欠失された領域は、リコンビナーゼ認識部位の対によってフランキングされる領域である。好ましくは、欠失は、1つ以上のループ又はループの一部を欠失させる。
【0040】
活性sgRNAの場合、リコンビナーゼ認識部位の第1の対上のリコンビナーゼ作用による欠失は、活性なcrRNA-tracrRNA構造を維持し、sgRNAのCas結合能力を確立するはずである。従って、第1のリコンビナーゼ認識部位(リコンビナーゼ作用後にそのうちの1つのリコンビナーゼ認識部位が残る)は、ループなどの不活性領域に配置されることが好ましい。従って、本発明の好適な実施態様において、第1のリコンビナーゼ認識部位のうちの1つ、好ましくは2つは、sgRNA配列のループ領域内に位置する。好ましくは、sgRNA配列はcrRNA部分及びtracrRNA部分を含み、第1のリコンビナーゼ認識部位の1つは、crRNA-tracrRNAリンカーループ、すなわちcrRNAとtracrRNA部分を接続するループ内に位置する。
【0041】
好ましくはsgRNAは、1つ以上のループ、例えば1、2、3、4、又はそれ以上のループを含む。1つのループは、好ましくはcrRNA-tracrRNA部分を接続する。1つのループは、シュードノット構造などのcrRNA部分に含まれていてもよい。好ましくはtracrRNA部分は、完全にtracrRNA部分にある1、2、3、又はそれ以上のループを含む(crRNA-tracrRNAリンカーループを数えない)。通常、Cas結合には、crRNA-tracrRNAリンカーループの後の最初の2つのループが必要であり、そしてリコンビナーゼ作用でsgRNAを不活性化するために、これらの1つ、好ましくは両方が、欠失されるか又は部分的に欠失される(例えば、リコンビナーゼ認識部位をループ内に配置してステムの片方の脚を欠失させることにより)。ループは、長さが3~20ntのステムなどに接続でき、ここで、ステムの片方の脚の長さがカウントされ、すなわちステムは、塩基対をカウントするとその数の2倍になる場合があるが、もちろん塩基のミスマッチも含まれる。好ましくは、これらのループのいずれか1つのステム、特に完全にtracrRNA部分の完全なステムループは、3~20塩基対、例えば4~15又は5~10塩基対、例えば3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20塩基対、好ましくは4~7塩基対を含む。好ましくは、crRNA-tracrRNAリンカーループは、ステム内に6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20塩基対の長さを有するステムループである。
【0042】
リコンビナーゼ作用の前にsgRNA中の活性ガイドの形成を妨害するガイド破壊配列は、ポリA配列などの転写終結配列を含み得、その結果、sgRNAの残りは転写されない。これはまた、Cas酵素と相互作用して活性なCRISPR-Cas複合体を形成することができる活性ガイドRNA折り畳み又はsgRNA折り畳みを妨害する配列を含み得る。例えばこれは、Cas酵素に結合しない折り畳み要素の十分な長さ又はそれを含めることによって達成できる。ガイド破壊配列は、sgRNAのループのいずれか、特に好ましくはcrRNA-tracrRNAリンカーループのループ形成を妨害する可能性がある。そのような配列は、活性なガイドRNAの折り畳みを妨害するのに十分な長さがある場合は、例えば選択マーカー配列であり得る。特に好適な実施態様において、転写終結配列と、活性なガイドRNAの折り畳みを妨害する(長さの)配列との両方が使用される。好適な実施態様において、転写終結配列は、ループ内、特に好ましくはcrRNA-tracrRNAリンカーループ内に配置される。好ましくは、そのフランキングする第1のリコンビナーゼ認識部位の両方が同じループに配置され、その結果、そのループの一部のみが活性化リコンビナーゼ反応で欠失される。このような場合、上記で説明したように、第1及び第2のフランキング配列が重複しているため、第2のリコンビナーゼ認識部位の1つも同じループ内に配置される。第2のリコンビナーゼ認識部位の別の1つは、好ましくは下流に配置され、その結果、sgRNAの必須部分、特にそのtracrRNAは、リコンビナーゼ認識部位の第2の対上のリコンビナーゼの作用時に欠失される。好ましくは、第2のリコンビナーゼ認識部位は、全体に、tracrRNA内、又はsgRNAのtracrRNA部分の下流、例えばまたsgRNAの下流の、ループ内に配置される。これは、転写された領域又はさらに下流に、例えば転写末端の後にある可能性がある。例えば、これは、sgRNAの5’末端の10,000nt以内、好ましくはsgRNAの5’末端の5,000nt以内にあり得る。
【0043】
好適な実施態様において、リコンビナーゼ認識部位の第1及び第2の対は、同じリコンビナーゼ酵素によって活性化される。従ってリコンビナーゼは、リコンビナーゼ反応において互いに相互作用しない異なる認識部位を有し得る。そのようなリコンビナーゼは、例えばCreである。リコンビナーゼ認識部位の第1及び第2の対は、lox部位、例えばloxP、lox511、lox5171、lox2272、M2、M3、M7、M11、lox71、lox66から、独立して選択することができる。
【0044】
1つのリコンビナーゼをリコンビナーゼ認識部位の両方の対に使用することは、細胞に提供する必要があるのは1つのリコンビナーゼのみであるという利点がある。他の実施態様において、リコンビナーゼ認識部位の第1及び第2の対は、異なるリコンビナーゼ酵素によって活性化される。この場合、実験で使用される細胞の集団は、両方のリコンビナーゼ酵素を備えている必要があり、その集団の個々の細胞は、両方のリコンビナーゼ酵素の一方、好ましくは両方のリコンビナーゼ酵素を有し得る。両方の選択肢(すなわち、同じ又は異なるリコンビナーゼ)のリコンビナーゼの例は、Cre、Hin、Tre、FLPなどの部位特異的リコンビナーゼである。
【0045】
リコンビナーゼの反応性と、リコンビナーゼ認識配列の第1及び第2の対の間の選択の優先順位(従って、確率的分布-上記を参照)は、構造要素と配列によって制御することができる。リコンビナーゼ認識部位によってフランキングされるより短い配列は、リコンビナーゼ認識部位によってフランキングされるより長い配列よりも優先され、従って、そのフランキングされた領域のより多くの欠失事象をもたらすであろう。従って、リコンビナーゼ作用時の活性及び不活性sgRNAの分布又は比率は、それに応じてフランキングされる領域の長さを選択することによって操作することができる。リコンビナーゼ作用時に活性及び不活性sgRNAの分布又は比率を制御する別の選択肢は、リコンビナーゼ認識部位をさらに追加することであり、これにより、リコンビナーゼ反応を引き起こす可能性も高まる。3つ以上のリコンビナーゼ認識部位を使用すると、もしリコンビナーゼ作用が、内部のリコンビナーゼ認識配列によりフランキングされる領域を欠失させても、少なくとも2つのリコンビナーゼ認識配列が残り、これがさらなる欠失をもたらすことが、残りのリコンビナーゼ認識部位が1つになるまで続くため、最も外側のリコンビナーゼ認識部位の間の配列部分全体が欠失されると予想される。従って、同じタイプ(第1及び/又は第2の部位として)の3つ以上のリコンビナーゼ認識部位の「セット」が本発明の核酸配列において使用される場合でも、フランキングされる部分及び重複部分は、例えば最も外側のリコンビナーゼ認識部位を本明細書に記載のリコンビナーゼ認識部位の「対」と見なすことによって選択されるべきである、
【0046】
好ましくは、核酸は、活性sgRNAと不活性sgRNAの平均比率9:1~1:9、好ましくは5:1~1:5、特に好ましくは2:1~1:2を提供するように改変される。そのような比率はまた、本発明の方法で達成され得る。
【0047】
リコンビナーゼ作用は長さに依存するため、リコンビナーゼの適切な作用のために、リコンビナーゼ認識部位の対は、最大100,000nt離れ、好ましくは最大50,000nt離れ、特に好ましくは最大10,000nt離れ、又は最大5,000nt離れていることが好ましい。これは、第1及び/又は第2の対、好ましくは両方に適用される。
【0048】
好ましくは、本発明の核酸は、固有の分子識別子(UMI)又はバーコードを含む。UMI又はバーコードは、特定のsgRNA分子の識別を可能にする配列であり、同じ遺伝子標的(同じガイド配列)を標的にしている場合でも、分子ごとに異なる。UMIの例はランダム配列である。このようなUMIは、使用される全ての核酸分子を区別できる十分な長さを有する必要がある。好ましくはUMIの長さは、少なくとも6nt、好ましくは少なくとも8ntである。例えば、これは6~40nt、好ましくは8~20ntの長さでもよい。好ましくは、これはsgRNA配列の下流に配置される。また好ましくは、これは、リコンビナーゼの作用時に削除されず、活性sgRNAと不活性sgRNAの両方で保持されるように、リコンビナーゼ認識部位の第1と第2の(又は任意の)対の両方の外側に位置する。他のUMIを、第1及び第2のリコンビナーゼ認識部位の一方(他方ではない)に配置して、活性sgRNAのみ又は不活性sgRNAのみの追跡を可能にすることもできる(すなわち、これは、リコンビナーゼ作用時に保持される)。しかし、活性sgRNAと不活性sgRNAの両方に存在するUMIの使用が推奨される。UMIを使用すると、ボトルネックを通過する独立したイベントを独立した複製として分析できるため(Michlits et al., Nature Methods 14, 2017: 1191-1197)、クローンの増殖を説明できる。異なるUMIを有する細胞は、生物学的複製物として使用でき、これは、オルガノイド培養やインビボ応用などの、アッセイで不均一性の高い構成のための優れた利点である。従って本発明の方法では、UMIを使用して、異なる細胞において同じsgRNAが同定される。これは、これらの細胞が、1つの特定のsgRNAをコードする核酸分子を含むように形質転換された1つの元の細胞のクローンであることを意味する。リコンビナーゼ活性化後に生成物で検出されたUMIも、増殖のボトルネックの程度を示している可能性がある。ボトルネックの前後の細胞集団におけるガイドごとのUMIの数が少ないことは、細胞が失われたこと及びその程度を示している。
【0049】
本発明はまた、本発明のsgRNAをコードする核酸を含む細胞を提供する。これらの細胞は、本発明の方法で使用することができる。細胞は、哺乳動物細胞、好ましくはヒト又は非ヒト細胞であり得る。全能性細胞が使用される場合、これらは好ましくは非ヒトである。これらは霊長類、ネズミ、ウシ、齧歯類の細胞であり得る。細胞は、単離された細胞、又は細胞の集合体、例えば培養物、オルガノイド、又はインビボ細胞であり得る。本発明のインビボ細胞は、好ましくはヒトには存在しない。細胞は、細胞株及び/又は多能性細胞のものであり得る。しかし、細胞は、多能性を維持する必要はなく、分化してもよい。リコンビナーゼ作用(従って、確率的原理に従って、sgRNAの一部を活性化すること)は、増殖又は成長の任意の時点で行われる。本発明はまた、このような活性化されたsgRNA又は不活性化されたsgRNAを有する細胞に関する。
【0050】
細胞は、好ましくは、Creなどの1種以上のリコンビナーゼの発現のための、発現構築物のような1種以上の核酸を含む。リコンビナーゼは、上記のように、第1及び/又は第2のリコンビナーゼ認識部位を活性化するものでなければならない。発現核酸は、選択マーカーを含み得る。選択マーカーは、活性なリコンビナーゼを有する細胞を同定及び/又は単離するために使用され得る。選択マーカーは、長さマーカーなどの特定の配列であるか、バーコードを有するか、又は抗生物質耐性遺伝子などの細胞生存マーカーを含み得る。長さマーカーは、例えば、配列決定中に同定することができる。マーカーは、代替的又は追加的に、ウイルスにおけるリコンビナーゼタンパク質をコードする核酸の産生における対照として機能し得る。後でリコンビナーゼを発現する(そして本発明の方法で使用される)細胞を形質転換するために、トランスフェクション物質としてウイルスを使用することが可能である。マーカーを有する適切なウイルスを選択することができる。上記のように、リコンビナーゼの発現のための核酸、例えば発現構築物は、好ましくは、誘導性又は代替的に構成性プロモーターを含む。しかしながらリコンビナーゼは、プロモーターの選択によって、又は発現されたときに制御可能な活性化を必要とするリコンビナーゼ(例えば、上記に開示されたCreER)を使用することによって、好ましくは誘導可能である。光活性化可能なCas9も可能である(Nihongaki et al., Nature, 2015, 33(7): 755-760)。次に本発明の方法は、Casを光活性化する工程も含むであろう。場合によっては、リコンビナーゼが全ての細胞で活性であるとは限らない(「未反応」)。非リコンビナーゼ活性化sgRNAは、活性化後の不活性及び活性sgRNAとは異なる配列を有し、従って特定び検討できるため、これは通常問題ではない。細胞型特異的プロモーター(例えばCreER)下でリコンビナーゼを使用する場合、組換えは実際には細胞型特異性も選択し、追加の細胞型がsgRNAで形質導入された場合でも、目的の細胞型のみを測定することを可能にする。
【0051】
本発明の好適な実施態様において、活性/不活性/未反応sgRNAの配列は、工程B)でのリコンビナーゼの活性化/導入後、及び好ましくは、工程C)後の細胞でその効果が観察された後に、決定される。sgRNAの配列を決定するために、好ましくは本発明の核酸は、上記のようなプライマー結合部位を含む。プライマー結合部位は、sgRNA(その活性/不活性組換え産物を含む)及び存在する場合は任意のUMIの配列決定を可能にし、ここで、プライマー結合部位はsgRNA配列とUMI配列とをフランキングしている。
【0052】
細胞は、好ましくは、Cas9などのCas、又は上記のCas酵素のいずれかを発現させるための、発現構築物のような核酸を含む。また、この核酸、例えばCasの発現のための発現構築物は、誘導性又は代替的に構成性プロモーターを含み得る。Cas酵素の活性を制御できるように、誘導性プロモーターが好ましい。またCas核酸は上記のように、同様にしかし独立して選択される選択マーカーを含み得る。
【0053】
リコンビナーゼ及び/又はCas酵素、好ましくは両方が、細胞内に提供される。例えば、これらがゲノムに組み込まれている市販の細胞が利用可能である。従って、核酸の説明は細胞のゲノムにまで及ぶ。
【0054】
通常、大規模なスクリーニングなどの実験では多くの細胞が使用される。好ましくは、本発明の細胞は、本発明の少なくとも10,000個の細胞、より好ましくは少なくとも100,000個の細胞、又は少なくとも100万個の細胞集団で提供される。好ましくは、細胞は、上記のsgRNA(すなわち、異なるガイドを有するsgRNA)当たりの細胞に従い、異なるsgRNAを有する。
【0055】
細胞は、活性sgRNAのない細胞、特に不活性sgRNAを有する細胞と比較して、活性sgRNAによって変化され得るそれらの増殖形態又は活性に対するsgRNAの任意の作用について研究することができる。そのような研究された細胞は、野生型細胞であるか、又は突然変異を有し得る。そのような場合、変異の効果に対する活性化sgRNAの影響が観察されることがある。そのような突然変異は、発癌性突然変異、例えば癌遺伝子の活性化又はアップレギュレーション、あるいは腫瘍抑制遺伝子の抑制又は不活性化であり得る。
【0056】
従って、本発明の好適な実施態様において、細胞は、トランスジェニック癌遺伝子をさらに発現するか、又は抑制された腫瘍抑制遺伝子を有する。本発明の方法は、工程C)で活性化されていない細胞と比較して、工程C)で活性化された後の腫瘍形成の違いを観察する工程をさらに含み、それにより、腫瘍形成中にsgRNAによって標的とされる遺伝子の役割をスクリーニングする。腫瘍の一部は増殖し、すなわちリコンビナーゼ作用後に不活性sgRNAを含む細胞が増殖する。不活性sgRNAに対応する活性sgRNAが腫瘍内に見つからない場合、これらの不活性sgRNAの存在は、活性sgRNAが最初は活性化されて存在したが、腫瘍内で増殖できなかったことの証拠である。従って、腫瘍増殖又はその抑制のための必須の遺伝的標的が見出された。上記したように、不活性sgRNAの存在は、活性sgRNAが存在しないことの証拠を提供する。
【0057】
別の実施態様において、CRISPR-StARカセットは、動物モデルの生殖細胞系列又は細胞株に組み込まれて、まばらな遺伝子の欠失を可能にし、例えば、腫瘍抑制因子のまれな再現性のある喪失を伴う腫瘍モデルを生成する。本発明はまた、sgRNA活性化と組み合わせた候補化合物の作用を試験することを含む。従って、細胞をさらに候補化合物で処理することができ、この方法は、工程C)で活性化されていない細胞と比較して、工程C)で活性化された後の細胞活性又は形態の違いを観察することをさらに含み、それにより、候補化合物の影響下でsgRNAの標的となる遺伝子の活性についてスクリーニングされる。このような方法は、例えば、毒性スクリーンで使用することができる。候補化合物は毒素であり得、そしてsgRNAは、活性である時に毒性の改善について観察することができる。
【0058】
本発明の方法は、前述のように、細胞数が少ないというボトルネックを克服するのに特に適している。このような状況は、インビボ移植、オルガノイド、又は異種細胞培養で発生する。従って、これらは本発明の好ましい適用である。従って、好ましくは細胞は、オルガノイドなどの組織凝集体まで又はその中で増殖される。凝集体の組織(例えば、オルガノイドの組織)は、肝臓、脾臓、大脳、筋肉、心臓、腎臓、結腸直腸、膀胱、血管、卵巣、精巣、膵臓組織であり得る。また、好ましくは細胞は、好ましくは同種移植片又は異種移植片を形成するために、非ヒト動物に移される。好ましくは動物は、げっ歯類、非ヒト霊長類、ウシ、ウマ、ブタ、マウス、ハムスター、ラットなどである。リコンビナーゼの導入又は活性化は、組織凝集体、オルガノイド、又は非ヒト動物で、すなわち、移植又は生着のボトルネックが過ぎ去り、本発明の細胞が好ましくは所望の数まで増殖された後に起きる。他の実施態様において、細胞は、2D又は3D細胞培養などの細胞培養で増殖される。リコンビナーゼの活性化は、所望の細胞数に及び/又は細胞分化段階に達したときに起きる。望ましい細胞数は、特定の細胞/sgRNA比で上記に記載されている。
【0059】
本発明はさらに、核酸及び/又は細胞のような、本発明の方法で使用される任意の手段を含むキットを提供する。特にキットは、i)本発明のsgRNAをコードする核酸と、ii)sgRNAのリコンビナーゼ認識部位の対を活性化する1種以上のリコンビナーゼの発現のための核酸とを含む。キットは、好ましくはiii)Cas遺伝子をコードする核酸をさらに含む。任意のそのような核酸は、上記のようにさらに定義することができ、例えばsgRNA、リコンビナーゼ、Casタンパク質に作動可能に連結されたプロモーターを有する。遺伝子は通常、プロモーターとコード領域を含むと考えられている。
【0060】
本発明は、本発明のこれらの実施態様に限定されることなく、以下の図及び実施例によってさらに説明される。
【図面の簡単な説明】
【0061】
図1】ライブラリー内のガイドごとのバーコード数を減らした場合の、プールされたCRISPRスクリーンの前後のバーコード間のlog2倍数の変化の分布。
図2】A)ボトルネックのない2Dインビトロ遺伝子スクリーンの概略図。細胞集団の各分割で、細胞/sgRNAの表示は500~1,000細胞/sgRNAより高く維持されて、スクリーンの複雑さが維持される。B)遺伝子スクリーンにおける複雑さのボトルネックの概略図。感染効率によって引き起こされたボトルネックの後、限られた細胞、生着効率、及び/又は分化細胞は示差的に回復し、細胞/sgRNAの表示が減少する。細胞の不均一性のクローンサイズとは関係なく、単細胞由来のクローンは実験集団と対照集団に確率的に分割され、上部の緑色の二重矢印(活性sgRNA)と下部の赤色の二重矢印(不活性sgRNA)として示される。
図3】(A、B)sgRNA、ストップカセット、選択カセット、tracrRNA、及びUMIをコードするCRISPR-StARベクターの概略図。組換えにより、活性(A)sgRNA又は不活性(B)sgRNAが得られる。
図4】CRISPR-StAR構築物シリーズの概略図。StAR1は、2セットの異なるlox部位を含む。StAR1と比較して、StAR3は余分なloxP部位を含み、Lox5171部位とストップカセットの間の距離が長くなり、tracrと2番目のLox5171部位の間の距離が短くなっている。余分なloxP部位を除去すると、構築物StAR4が得られた。
図5】CRISPR StAR構築物における活性組み換えから不活性組換えへの頻度を決定するための実験概要。
図6】実証実験の概略図。
図7】CRISPR StAR分析のベンチマーク検査。従来の0日目の基準との比較。
図8-1】従来法(活性対0日目)及びCRISPR-StAR分析(活性対不活性)を使用した、複雑度の高い2つの生物学的複製物の相関。各ドットは1つのsgRNAを表す。密度プロットと積み上げヒストグラムは、各複製物のガイド分布を示している。必須物は赤で、非必須物は青で表示される。
図8-2】上記の説明に同じ。
図8-3】上記の説明に同じ。
図9-1】従来法(活性対0日目)及びCRISPR-StAR分析(活性対不活性)を使用した、複雑度の低い2つの生物学的複製物の相関。各ドットは1つのsgRNAを表す。密度プロットと積み上げヒストグラムは、各複製物のガイド分布を示している。必須物は赤で、非必須物は青で表示される。中性(青色)sgRNAの広がりが劇的に増加することに加えて、非常に低い表示で追加の完全なドロップアウトが観察される。これは、ボトルネックでsgRNAが完全に失われたという事実による。対照的に、CRISPR-StARは、不活性なコンフォメーションで検出され活性コンフォメーションで失われたsgRNAのみをスコア化する。
図9-2】上記の説明に同じ。
図9-3】上記の説明に同じ。
図10-1】ライブラリー内のガイドごとの細胞数の減少における、2つの生物学的複製物の非必須物(青)と比較した必須物(赤)の曲線下面積分析。
図10-2】上記の説明に同じ。
図10-3】上記の説明に同じ。
図10-4】上記の説明に同じ。
図11-1】ライブラリーと比較した細胞数の複雑さの減少における受信者動作特性曲線下面積(AUROC)分析。CRISPR StAR分析(活性対不活性)は緑、従来の分析(活性対0日目)は黒。
図11-2】上記の説明に同じ。
図12】ピアソン相関、ライブラリーと比較した細胞数の複雑さの減少の曲線下のデルタ面積(dAUC)分析と受信者動作特性曲線下面積(AUROC)分析。黒い点は個々の複製物の値を示し、バーは2つの複製物の平均を示す。
図13-1】オルガノイドスクリーニングの堅牢性の改良。a)UMIによって決定された2つの生物学的複製物の相関。密度プロットと積み上げヒストグラムは、各複製物のガイド分布を示す。b)ランクで分類された上位のsgRNAと相関する遺伝子(x軸)について、同じ遺伝子を標的とするガイドの平均数(y軸)。c)UMIによって決定された2つの生物学的複製物における従来法(活性対0日目)とCRISPR-StAR分析(活性対不活性)のボルケーノプロット(Volcano Plot)。上位の遺伝子は青色で表示される。他の複製物でスコア化された遺伝子は緑色で表示される。
図13-2】上記の説明に同じ。
図13-3】上記の説明に同じ。
図14】インビトロ及びインビボのCRISPR-StARスクリーニング結果の相関プロット。各ドットは1つの遺伝子の全てのsgRNAを表し、ドットサイズはインビボ試料中の遺伝子当たりのUMIの数を表す。積み上げヒストグラムは、各試料中のガイド分布を示している。インビボ試料は、2つの組み合わされた複製物である。必須遺伝子は赤で、非必須遺伝子は黒で示されている。必須遺伝子の大部分は、インビトロとインビボの両方で表示の低下を示している。
図15】CRISPR-StAR構築物を有するEF1aプロモーターの制御下にあるEGFP-P2A-FAH発現カセットを有する眠れる森の美女トランスポゾン(Sleeping beauty transposon)。(左)食塩水のみを注射し、NTBCで維持し、注射の14日後に採取したFAH-/-マウスの肝臓。(右)トランスポゾンとトランスポザーゼを注射し、注射の25日後に採取したFAH-/-マウスの肝臓。核をDAPI(青)で対比染色し、CRISPR-StAR構築物を含む増殖細胞をEGFP(緑)で視覚化した。
図16】CRISPR-StAR構築物を有するEF1aプロモーターの制御下にあるKrasG12D-P2A-FAH発現カセットを有する眠れる森の美女トランスポゾン。(左)トランスポザーゼのみを注射し、注射の50日後に採取したWTマウスの肝臓。(右)トランスポザーゼとトランスポザーゼを注射し、注射の50日後に採取したWTマウスの肝臓。核をDAPI(青)で対比染色し、CRISPR-StAR構築物を含む増殖細胞をEGFP(緑)で視覚化した。
【実施例
【0062】
実施例1:材料と方法
1.1 材料
【0063】
1.1.1 細胞株
タモキシフェン誘導性Cre-ERTマウス胚幹細胞AN3-12(ESC)
白金E細胞(Platinum-E cell)(Cell Biolabs RV-101)
Vil-CreERT2;Rosa-LSL-Cas9-2A-eGFPマウス小腸オルガノイド
【0064】
1.1.2 細胞培養培地
マウス胚幹細胞培地(ESCM):
450mlのDMEM、75mlのFCS(Sigma、025M3347)、5.5mlのペニシリン-ストレプトマイシン(Sigma)、5.5mlのNEAA(Gibco)、5.5mlのL-グルタミン(Gibco)、5.5mlのピルビン酸ナトリウム(Sigma)、0.55mlのβ-メルカプトエタノール(Merck)、7.5μlのLIF(2mg/ml)
【0065】
オルガノイド完全培地:
高度なDMEM/F12、ペニシリン/ストレプトマイシン、10mmol/Lヘペス、グルタマックス、1xN2、1xB27(全てInvitrogenから)、及び1mmol/L N-アセチルシステイン(Sigma)、組換えヒトWnt-3A、マウスEGF、マウスノギン(noggin)、ヒトR-スポンジン-1、ニコチンアミド
【0066】
1.1.3 緩衝液
ラウリルサルコシン溶解緩衝液:
10mMトリス-HCl、pH7.5(Sigma Aldrich)、10mM EDTA(Sigma Al-drich)、10mM NaCl(Sigma Aldrich)、0.5%N-ラウリルサルコシン(Sigma Aldrich)、1mg/mlプロテイナーゼK(Thermo Fisher Scientific)、0.1mg/ml RNaseA(Qiagen)
【0067】
2XSDS溶解緩衝液:
10mMトリス-HCl、pH8(Sigma Aldrich)、1%SDS(社内)、10mM EDTA(Sigma Aldrich)、100mM NaCl(Sigma Aldrich)、0.1mg/ml RNaseA(Qiagen)
【0068】
1.1.4 プライマー
FW_G_CrSc_5: AATGATACGGCGACCACCGAGATCTACACAGATAACGAGGGCCTATTTCCCATGATTCCTTC (配列番号1)
FW_G_CrSc_6: AATGATACGGCGACCACCGAGATCTACACAGCTTGCGAGGGCCTATTTCCCATGATTCCTTC (配列番号2)
FW_G_CrSc_7: AATGATACGGCGACCACCGAGATCTACACAGGACACGAGGGCCTATTTCCCATGATTCCTTC (配列番号3)
FW_G_CrSc_10: AATGATACGGCGACCACCGAGATCTACACATCACTCGAGGGCCTATTTCCCATGATTCCTTC (配列番号4)
FW_G_CrSc_12: AATGATACGGCGACCACCGAGATCTACACCAACACCGAGGGCCTATTTCCCATGATTCCTTC (配列番号5)
FW_G_CrSc_13: AATGATACGGCGACCACCGAGATCTACACCACGCCCGAGGGCCTATTTCCCATGATTCCTTC (配列番号6)
FW_G_CrSc_15: AATGATACGGCGACCACCGAGATCTACACCATTACCGAGGGCCTATTTCCCATGATTCCTTC (配列番号7)
FW_G_CrSc_19: AATGATACGGCGACCACCGAGATCTACACCCCCAACGAGGGCCTATTTCCCATGATTCCTTC (配列番号8)
FW_G_CrSc_20: AATGATACGGCGACCACCGAGATCTACACCGTCATCGAGGGCCTATTTCCCATGATTCCTTC (配列番号9)
FW_G_CrSc_21: AATGATACGGCGACCACCGAGATCTACACCTATGCCGAGGGCCTATTTCCCATGATTCCTTC (配列番号10)
FW_G_CrSc_22: AATGATACGGCGACCACCGAGATCTACACCTCCGCCGAGGGCCTATTTCCCATGATTCCTTC (配列番号11)
FW_G_CrSc_39: AATGATACGGCGACCACCGAGATCTACACTGCCGACGAGGGCCTATTTCCCATGATTCCTTC (配列番号12)
FW_G_CrSc_41: AATGATACGGCGACCACCGAGATCTACACTGTAGACGAGGGCCTATTTCCCATGATTCCTTC (配列番号13)
FW_G_CrSc_42: AATGATACGGCGACCACCGAGATCTACACTTGCCACGAGGGCCTATTTCCCATGATTCCTTC (配列番号14)
RV_G_CrSc: CAAGCAGAAGACGGCATACGAGATACCGTTGATGAGTAG (配列番号15)
NGS_U6: CGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG (配列番号16)
【0069】
1.2 方法
1.2.1 マウス胚幹細胞培養
細胞はESCMで培養され、これは毎日交換された。コンフルエントになった時、細胞をトリプシン処理し、1:10に分割した。4-ヒドロキシタモキシフェン(4OH)処理のために、培地に0.5μM 4OH(Sigma)を毎日補足した。
【0070】
1.2.2 小腸オルガノイド培養
小腸のオルガノイドはVil-CreERT2から確立された;Rosa-LSL-Cas9-2A-eGFP(ホモ接合性)マウス。オルガノイドの樹立のために、洗浄及び分離後、陰窩をマウス小腸上皮から単離した。単離された陰窩は、20μlの液滴当たり150~200の陰窩密度でマトリゲル(Corning)に再懸濁された。液滴を48ウェルプレート(Corning)に接種し、各ウェルで250μlの培地を使用した。最初の2つの継代では、Rhoキナーゼ阻害剤(Y-27632、R&D Systems)を補足した完全オルガノイド培地で細胞を培養した。オルガノイドは、機械的ピペッティングにより5~7日ごとに1:5~1:6の比率で分割された。
【0071】
1.2.3 単細胞由来クローン
ESCをトリプシン処理し、カウントした。500個の細胞を15cmディッシュ(Sigma Aldrich)に接種した。ESCMは2日ごとに交換した。コロニーを10日間増殖させた後、96Uウェルプレート(Thermo Fisher)に採取し、トリプシン処理し、96Fウェルプレート(Thermo Fisher)に分割した。細胞をコンフルエントになるまで培養し、75μlのラウリルサルコシン溶解緩衝液で37℃で一晩溶解した。増幅には、1μlの溶解物を25μlのPCR反応で使用した(95℃で3分、[95℃で20秒、65℃(-0.3℃/サイクル)で20秒、72℃で30秒]×23、[95℃で20秒、58℃で20秒、72℃で30秒]×30、72℃で3分、12℃で∞)。
【0072】
1.2.4 レトロウイルスベクターとESC感染
CRISPR-StARライブラリーを、製造業者の推奨に従って、白金E細胞にパッケージ化した。3億個のESCを、2μg/mlのポリブレンの存在下でウイルス含有上清の1:10希釈液で感染させた。感染の24時間後、それぞれ1μg/mlのブラストサイジンとピューロマイシンを用いて、感染細胞の選択を開始した。感染多重度を推定するために、10,000個の細胞を15cmの皿にプレーティングし、G418で選択した。比較のために、さらに1,000個の細胞をプレーティングし、G418選択は行なわなかった。10日目にコロニーをカウントした。
【0073】
1.2.5 細胞培養スクリーン
ESCにレトロウイルスCRISPR-StARベクターを感染させ、ブラストサイジン及びピューロマイシン耐性について3日間選択した。ボトルネックを模倣するために、細胞を完全にカウントし、ライブラリー中で1細胞/sgRNA(5870細胞)、4細胞/sgRNA、16細胞/sgRNA、64細胞/sgRNA、256細胞/sgRNA、1024細胞/sgRNAの密度で接種した。7日間にわたって、細胞を等密度まで増殖させた。組換えを誘導するために、ESCを5μMの4OHで3日間処理した。これらをさらに14日間維持した。
【0074】
1.2.6 オルガノイドスクリーン
スクリーンの調製のために、オルガノイドを10cmディッシュの形態(コーニング)で拡張した。各10cmディッシュに50~55滴を接種し、各液滴は約100個のオルガノイドを含み、そして合計10個の10cmディッシュをスクリーンに使用した。各ディッシュに10mlの完全培地を補足し、2日ごとに新しいものに交換した。ウイルス感染用のオルガノイドを調製するために、オルガノイドをまず機械的に小さな断片に分解した。遠心分離(500g×5分)して上清(古いマトリゲルを含む)を除去した後、細胞をTrypLE(Gibco)に再懸濁し、37℃で5~8細胞の凝集塊に分離させた。細胞を300gで3分間遠心分離した。上清を除去した後、細胞ペレットをウイルス含有培地に再懸濁し、48ウェルプレートに分注した。プレートをパラフィルムで密封し、37℃で1時間スピノキュレーション(spinoculation)を行った。スピノキュレーション後、パラフィルムを取り除き、プレートを37℃で6時間インキュベートした。その後、細胞をエッペンドルフチューブに移し、遠心分離した(300gx3分)。細胞ペレットをマトリゲルに再懸濁し、10cmディッシュに接種した。3日間の回復後、感染したオルガノイドを、ブラストサイジン耐性について1μg/mlで8日間選択した。続いて、オルガノイドを分離させ、完全培地を4OHで6時間置換した。その後、オルガノイドを分割することなく完全培地で12日間培養した。培地は3日ごとに新しいものに交換した。
【0075】
1.2.7 DNA採取とNGS試料調製
試料当たり6000万個の細胞を採取し、1mg/mlプロテイナーゼK及び0.1mg/ml RNAseAを含むSDS溶解緩衝液で溶解した。ゲノムDNAをフェノールとクロロフォルムで抽出し、1容量のイソプロパノールで沈殿させた。組み込まれたsgRNA構築物はPacI制限部位によりフランキングされている。試料をPacIで48時間消化し、最後の12時間BbsIで同時消化した。各試料は、1反応当たり1μgのDNAを含む96回の個別の50μlの反応でPCR増幅された(95℃で3分、[95℃で10秒、59℃で20秒、72℃で30秒]×36、72℃で3分、4℃で∞)。前進プライマーは各試料に固有であり、NGS後の逆多重化のための6bp実験インデックスを含有した(AATGATACGGCGACCACCGAGATCTACAC-NNNNNN-CGAGGGCCTATTTCCCATGATTCCTTC(配列番号17)、ここで6bpのNNNNNN配列は、NGS後に試料を逆多重化するために使用される特定の実験インデックスを表す)。逆進プライマーは各試料で同じであった。PCR産物は、アガロースゲル電気泳動によって精製及びサイズ分離された。2つの組換え産物を別々に切り出し、ミニ溶出カラムで精製し、等量で混合した。この試料は、イルミナ(Illumina)HiSeqV4 SR100二重インデックス配列決定実験で配列決定された。sgRNAは、カスタムリードプライマーを使用して配列決定された。活性ガイドと不活性ガイドを区別するために、第1のlox部位の下流の配列(活性の場合はTCAGCATAGC、不活性の場合はTTTTTTT)が選択された。
【0076】
実施例2:概念の概要
遺伝子スクリーンでは、ゲノム編集は3つの大きな効果をもたらす可能性がある:それは、特定のsgRNAを標的とする細胞に、増殖の利益をもたらすか、増殖の不利益をもたらすか、又は影響を与えない。増殖のいい点は集団内の濃縮につながる。増殖の悪い点は欠失につながる。
【0077】
プールされたCRISPRスクリーンは、通常sgRNAごとに300~1,000の個別に標的化された細胞の複雑さで維持される。これにより、十分な数の固有の編集イベントが、集団の大幅な変化を呼び出すことを可能にする。しかし、この高レベルの複雑さをいつも維持できるとは限らない。非効率的な感染又は限定された細胞数又は分化によって引き起こされるボトルネックにシステムが遭遇した場合、又は細胞が異なる速度で回復し、ライブラリー表示が減少する場合である。これを説明するために、CRISPRスクリーンの前後のバーコードの読み取り数の間のlog2倍数の変化(LFC)を計算した。バーコードの数は、異なって形質転換された細胞の数を表し、すなわちガイドごとのバーコードの数は細胞/sgRNAの数を表す。
【0078】
複雑さが減少するにつれて、存在するバーコードが少なくなり、集団の変化がより大きな影響を与えるため、LFCの分布はより広くなる。複雑さがさらに低下すると分布は二峰性になり、強いLFCを有する2番目のピークが現れる(図1)。このピークは、リード0のガイドが欠落しているためである。分析では、これらのガイドは、強い欠失表示型を引き起こすガイドと間違えられ、従ってスクリーニング結果を歪める。これは、複雑さが不十分なため、スクリーン前のガイドの読み取り数がスクリーン後の読み取り数と匹敵しなくなり、従来法の分析が失敗することを意味する。
【0079】
CRISPRスクリーンにおけるボトルネックでの不十分なライブラリー表示によって引き起こされる問題は、本発明によって克服することができる(図2に示されている)。
【0080】
実施例3:sgRNA構築物
2セットの織り混ざったlox部位により、CRISPR StARシステムが、2つの異なる組換え産物を生じさせる可能性がある:不活性sgRNA又は活性sgRNA。ベクターはsgRNA(ライブラリー)を含み、その後にtracr領域に2対のlox部位が続く。lox部位の間には、ブラストサイジン選択カセットがあり、例えばウイルスパッケージング中のCre活性又は組換えイベントによる早すぎる活性化を防ぐ。最後に、これは、固有の分子識別子(UMI)として機能する一連のランダムヌクレオチドを含む。loxP部位の組換えは活性sgRNAをもたらす(図3A)が、lox5171部位の組換えはtracrの終結と排除をもたらす。結果として、sgRNAは不活性になる(図3B)。2つの組換えイベントは相互に排他的である。
【0081】
このシステムでは、CRISPRスクリーンの最終的な集団内で、活性なガイドを不活性な内部対照と比較することができる。しかし、活性な組換えと不活性な組換えの比率がかなり類似している場合は、2つの組換え産物の読み取り数を比較することが有益である。ほとんどの場合、loxP(活性)とlox5171(不活性)組み換えの比率は、10:90~90:10の間でなければならない。
【0082】
一方のloxPと他方のloxP対間の組換え確率は、遺伝子座での距離やDNA構造(1次、2次、3次)などのいくつかの要因に依存する。従って、予測することは困難である。組換え確率の単一細胞定量により、元の構築物(StAR1)が33%の活性sgRNAと66%の不活性sgRNAの組換え比をもたらすことが明らかになった。このような比率は、理想的なダイナミックレンジを提供するため、スクリーンが不活性sgRNAよりも活性sgRNAの相対的な濃縮を追跡することを望む場合には、理想的である。しかし、必須遺伝子の分析では、活性sgRNAと不活性sgRNAの等しい比率で始めるか、又は活性sgRNAへのバイアスで始めても望ましい。従って、StAR3及びStAR4は、相対距離、1次配列の変更、及び1つの追加のloxP部位の導入によって開発された(図4)。そうすることで、様々な組換え比をもたらす一連の構築物を生成することに成功した。
活性 不活性
StAR1(配列番号18): 33% 66%
StAR3(配列番号19): 90% 10%
StAR4(配列番号20): 50% 50%
【0083】
目的の実験に応じて、理想的設定は異なる。
【0084】
lox部位のいずれかの対がいかに効率的に組み換えするかを決定するために、sgRNA感染細胞を4OHで3日間処理し、続いてクローン密度で接種した(図5)。この時点で、組換えが起こり、これらのクローンは活性又は不活性なガイドを発現した。これらを同定するために、ガイド構築物をフランキングするプライマーを使用してPCRを行った。組換え産物は、活性の場合は580bp、不活性の場合は542bpである。各バンドサイズの頻度をカウントした。最も重要なことは、組み換えられていないクローンが見つからなかったことであり、これにより、細胞株での安定したCre発現が確認される。上記の組換え頻度が分かった。StAR1の場合、288個の全クローンのうち、組換えにより97個の活性sgRNAと172個の不活性sgRNAが生成された。汚染された混合クローン又は二重感染のいずれかが原因である21の二重バンドが見つかった。これらは両方のイベントでカウントされた。
【0085】
実施例4:細胞培養
【0086】
4.1 実験計画
CRISPR-StARがボトルネックスクリーンにおけるノイズを克服することを確認するために、制御されたボトルネックを細胞培養実験で導入した。従って、Cas9発現カセットとCreERT2発現構築物を安定して組み込んだマウス胚幹細胞に、1,245個の遺伝子を標的とする5,870個のsgRNAのレトロウイルスsgRNA StAR1タイプライブラリーを感染させた(表1)。
【0087】
【表1】
【0088】
細胞の15%を感染させて、単一感染を確実にした。ウイルス組み込みについて選択後、細胞をカウント及び希釈して、制御されたボトルネックを導入した。複雑さは、1細胞/sgRNA(5,870細胞)、4細胞/sgRNA、16細胞/sgRNA、64細胞/sgRNA、256細胞/sgRNA、1,024細胞/sgRNAに低下した。細胞は、7日間で1,000細胞/sgRNAを超える等密度まで増殖された。続いて、細胞を4OHで処理してCre組換えを誘導し、細胞をさらに14日間維持した。実験は2つの独立した複製物で実施された(図6)。
【0089】
14日間後、ゲノムDNAを抽出し、構築物をフランキングする切断部位を使用してPacIで消化した。次に、各試料について実験インデックスとイルミナアダプターを含むプライマーを使用して、断片化されたゲノムからPCRを介してガイド構築物を増幅し、こうしてPCR産物の直接配列決定が可能になった。両方の組換え産物を別々にゲル抽出し、1:1の比率で混合した。次に、このプールを配列決定した。
【0090】
4.2 バイオインフォマティックパイプライン
NGSリードをマッピングした後、第1のloxP部位のすぐ下流にある10bpのストレッチを使用して、活性ガイドを不活性ガイド(活性はTCAGCATAGC、不活性はTTTTTTT)から生物情報学的に区別した。活性及び不活性の組換え産物を1:1の比率で混合した後、配列決定をし、不活性からのリードが活性ガイドからのリードよりも2倍多いことがわかり、これは、不活性な構築物の配列決定がより良好であることを示している。それにもかかわらず、この状況が分析に不利益であることはない。
【0091】
各細胞が単一のガイド構築物で感染された。すなわち、全てのUMIは1つのクローンを表し、ガイドごとのUMIの数は、ガイドごとの細胞の数に等しくなり、これは、ガイドごとの感染した細胞の数の直接的な尺度である。実証実験での細胞希釈が十分であったかどうかを確認するために、最も複雑度の低い試料(ガイドごと1つの細胞)の不活性ガイドごとのUMI数の中央値を計算した。しかし、ガイドごとに理論上の1 UMIの代わりに、はるかに大きい数が見つかった。これには2つの理由があると我々は仮定した:まず、これらのUMIのほとんどは1つ又は2つのリードしかなく、これは、配列決定における塩基置換エラーが原因である可能性がある;第2に、UMIごとのリード数の分布を計算すると、二峰性の分布が見つかった。この分布の低いリード率からsgRNA-UMIの組み合わせを見ると、異なる試料で高いリード数を有する同じsgRNA-UMIの組み合わせを見つけることができた。これは、イルミナベースの配列決定における既知の問題であるインデックスホッピングを示唆しており、ここで、隣接するクラスター間のインデックスが間違った試料に割り当てられている。より複雑性の高い試料では、ガイドごとに真のUMIが多数存在するため、これらの問題は無視でき、従って、全体としてこれらのエラーによる影響はごくわずかである。従って、これは複雑度の低い試料(sgRNA当たり1~16個の細胞)にのみ関連する。ここで、真のリードはリード数が多い明確な分布を有しているが、エラーはリードが少ない分布を有する。
【0092】
真のリードをエラーから分離するために、複雑度の低い各試料のこの二峰性のリード分布の局所的最小値を閾値として定義して、それ以下の全てのリードを破棄した。活性ガイドのUMIのリード数は表現型を表すことができるため、不活性ガイドにカットオフのみを設定し、活性ガイドのsgRNA-UMIの組み合わせをマッピングし、これにより、存在しないUMIのデータセットがさらに除去された。
【0093】
最後に、CRISPR StARの性能を従来のCRISPRスクリーン分析に対してベンチマーク検査するために、両方の方法のLFCを計算した:活性ガイド対従来の分析の0日目、及びCRISPR-StAR分析の活性ガイド対不活性ガイド(図7)。
【0094】
4.3 ベンチマーク検査
従来のスクリーニング方法と比較したCRISPR-StARの性能をベンチマーク検査するために、複製物間のピアソン係数、デルタ曲線下面積(dAUC)、及び受信者動作特性曲線下面積(AUROC)を計算した。
【0095】
4.3.1 複製物相関
我々の結果の再現性を試験するために、必須ガイドと非必須ガイドの2つの生物学的複製物間の相関係数を計算した。これを行うために、同じ細胞株で実行された2つの独立したスクリーンのデータを使用して、高い複雑性の同じライブラリーを用いて、必須遺伝子(赤)を定義した。各ガイドの欠失中央値を計算し、LFCが-3未満のガイドを必須物として定義した。一方、非必須物(青)は、同じデータセットからの最も欠失の少ないガイドの必須物と同じ数として定義した。次に、2つの独立した複製物でガイドのLFCを相関させ、必須物及び非必須物に基づいてピアソン係数を決定した。データ分布をよりよく理解するために、各複製物の必須データと残りのデータの密度と比率を計算した(図8及び9、サイド密度プロット)。最後に、各複製物に存在するsgRNAの数と、両方の複製物間の重複をカウントした。
【0096】
sgRNA当たり64~1,024細胞という高い複雑さで、従来の分析とCRISPR StAR分析の両方で、複製物間の良好な相関関係が見つかった。データの分布は、CRISPR StARを使用するよりも従来の分析を使用する方がわずかに広いが、必須物は非必須物から明確に区別できる。相関係数の範囲は、従来の分析では0.72~0.75、そしてCRISPR-StARでは0.80~0.84の範囲である(図8)。この均一なシステムでは、sgRNA当たり64細胞は、従来の分析を使用するCRISPRスクリーンには十分な複雑さのようである。
【0097】
sgRNA当たり1~16個の細胞の複雑度の低い従来の分析を使用して、必須ガイドと非必須ガイドの両方の広がりが増加していることが分かった。sgRNA試料当たり4個と1個の細胞では、データの分布は二峰性になる。これは、0日目と比較して強い欠失を引き起こす片方又は両方の複製物におけるリードが0のsgRNAが原因である。この欠失は、ガイドによって引き起こされた表現型が原因であるか、又は最終的な集団中のガイドの不在が原因であり得る。特にボトルネックに遭遇するシステムでは、ガイドが失われる可能性がある。従来の分析では、欠落しているガイドと表現型とを区別することはできない。対照的に、CRISPR StAR分析を使用すると、活性なガイドの存在量は、最終的な集団内の不活性な対照ガイドの存在量と比較される。従って、ボトルネックの影響で失われたガイドは分析から除外される。結果として得られるガイドの集団は小さくなり、LFCはガイドによって引き起こされる表現型によるものである。その結果、最も複雑度の低い試料(sgRNA当たり1個の細胞)では、従来の分析を使用すると、相関は0.16に減少するが、CRISPR StAR分析では0.83で、最も複雑な試料と同じくらい高くなる(図9)。
【0098】
結論として、従来の分析を使用して、複雑さが減少すると再現性が低いことがわかった。これは、欠落したガイドにより引き起こされたデータの拡散が広がりが原因である。CRISPR StARを使用すると、欠落しているガイドが除去され、現在のガイドのみが考慮される。従って、結果は、複雑さが低くても再現性が高くなる。
【0099】
4.3.2 dAUC
集団内で定義されたカテゴリーのdAUCを計算すると、各カテゴリーのメンバーを互いにどれだけうまく分離できるかがわかる。これを使用して、必須物と非必須物との分離について、CRISPR StARの性能を従来の分析と比較してベンチマーク検査した。このために、上記で定義したように、必須ガイドと非必須ガイドを新しいリストにサブセット化し、LFCによって、最も欠失したものから最も豊富なものへとランク付けした。次に、ランク付けされたリスト全体のカテゴリー内の各ガイドの存在の累積率を計算した。言い換えれば、必須ガイドがスコア化されると、必須カーブが上がる。非必須ガイドについても同じことが言える。ガイドが効果を発揮する場合は、必須物をリストの一番上にランク付けする必要があり、これにより、急激に増加し、次にプラトーがあり、ここで非必須物はスコア化されない。一方、非必須物はリストの最後にランク付けされ、これはプラトーとそれに続く急激な増加によって表される。理想的には、両方のカテゴリーが互いに明確に分離されていることを期待されるであろう。従って、より良い方法はより良い分離を示す。同等の尺度を得るために、非必須物のAUCから必須物のAUCを差し引いてdAUCを計算した。全ての必須要素が非必須要素から分離された場合の理想的なスコアは0.5になるであろう。ランダム試料は対角線になり、dAUCスコアは0になる。
【0100】
CRISPR-StAR分析のdAUCは、0.45~0.47の範囲で安定している。最も複雑度の低い試料でも、dAUCはそれぞれ0.46と0.45である。対照的に、従来の分析を使用すると、複雑さが低下し、必須物と非必須物を明確に分離できなくなる。上記のように、これは必須物と非必須物の両方の広範な広がりによって引き起こされる(図9)。dAUCは、最も複雑度の低い試料でそれぞれ0.14と0.09に低下する(図10)。従って、CRISPR StAR分析は、必須物を必須として明確に識別し、これらを非必須物から分離することにより、従来の分析よりも優れている。
【0101】
4.3.3 AUROC
受信者動作特性(ROC)曲線では、真陽性率が偽陽性率と比較される。それらは、方法がデータ(この場合はガイド)を必須又は非必須にどれだけうまく分類できるかを定量化する。必須を上記のように定義し、真の陽性として分類した。同様に、必須ではないものを偽陽性として分類した。真のCRISPR StARと従来の分析について、RのpROCパッケージを使用して、LFCによるガイドのランク付けされたリストでAUROCスコアを計算した。理想的なスコアは1で、ランダムなスコアは0.5であろう。
【0102】
従来の分析では、複雑さが減少するにつれて、AUROCは0.94から0.44に低下すし、これはランダムスコアと同じである(図11)。欠失している非必須物は分析に含まれていない。これによりLFCが大きくなり、これが非必須物を誤って必須物としてスコア化する。対照的に、CRISPR StAR分析では、AU-ROCは0.91~0.95の間に留まる。従って、最も複雑度が低い場合でも、真陽性は明確に偽陽性から区別することができる。
【0103】
4.4 要約
ピアソン係数、dAUC、及びAUROCを計算して、従来のCRISPRスクリーン分析に対するCRISPR StARの性能をベンチマーク検査した。3つの方法全てを使用すると、複雑さが減少するにつれて、CRISPR StARは、特に最も複雑度の低い試料で、従来の分析よりも明らかに優れていることがわかった(図12)。
【0104】
まとめると提示されたデータは、集団のスクリーニングにおけるボトルネック後の複雑度の喪失によって導入される遺伝子スクリーンのノイズを、CRISPR-StARが実際に克服することを確認している。
【0105】
実施例5:オルガノイドスクリーン
均一な細胞集団では、高分解能のCRISPRスクリーニングを支持する条件を容易に制御することができる。オルガノイドなどのより不均一なシステムでは、これは大きな問題である。モデルにおけるクローンの不均一性の影響を具体的に試験するために、腸のオルガノイドでCRISPR-StARを試験した。まず、我々のレトロウイルスライブラリーの送達は、細胞集団全体の小さなサブセットである陰窩の幹細胞にのみ感染する。従って、オルガノイドの感染は非常に非効率的であり、通常、克服する必要のある第1のボトルネックになる。第2に、クローンの増殖は非常に不均一である。
【0106】
CreERT2及びCas9トランス遺伝子を有するオルガノイドに々のsgRNAライブラリーを形質導入した。これらはブラストサイジン耐性について8日間選択され、4OH-タモキシフェンで処理されてCre組換えを誘導し、さらに12日間培養で維持された。
【0107】
感染の複雑さを推定するために、ガイドごとのUMI数の中央値を計算した。細胞培養スクリーンと同様に、インデックススワッピングによって引き起こされる二峰性のリード分布が見られた。これは、細胞培養スクリーンで行ったのと同じ方法で処理された:すなわち、真のリードをエラーから分離するために、この二峰性のリード分布の局所的最小値を閾値として定義して、それ以下の全てのリードを破棄した。活性ガイドのUMIのリード数は表現型を表すことができるため不活性ガイドにカットオフのみを設定し、活性ガイドのsgRNA-UMIの組み合わせをマッピングし、これにより、存在しないUMIのデータセットがさらに除去された。カットオフ後、sgRNA当たり30個の細胞の複雑度で感染が発生することがわかった。
【0108】
ガイド構築物上のUMIにより、個別にマークされた細胞のクローン増殖を追跡できるため、同じガイド内の全てのUMIは生物学的複製物を表す。従って、UMIの最初の文字に従ってデータセットを2つの群に分割することでデータセットを変更した:1つの群はA又はTで始まるUMIで、別の群はCとGで始まるUMI。次に、これら2つの群を生物学的複製物として使用した。
【0109】
5.1 ベンチマーク検査
従来のスクリーニング方法と比較して、オルガノイドにおけるCRISPR-StARの性能をベンチマーク検査するために、UMIに基づいて複製物間のピアソン係数を計算した。次に、ガイドの数と比較した遺伝子の数を計算することにより、ガイドのランク付けされたリスト内のガイドの再現性を分析し、UMIによって決定された2つの生物学的複製物の相関をスコア化した。最後に、同じ2つの複製物内の両方のタイプの分析でヒットリストを比較した。
【0110】
5.2 相関
CRISPR StARの再現性を従来の分析と比較するために、これらのUMIベースの生物学的複製物間のピアソン係数を計算した。従来の分析用に0日目の試料を生成するために、実証スクリーンで0日目の試料の複製物を取得し、各ガイドの平均リード数を計算した。オルガノイドの完全な必須遺伝子群がわからないため、細胞培養スクリーンと同じベンチマーク検査手順を適用できなかった(実施例2.2)。代わりに、全ての細胞タイプで欠失するはずのHart(Hart et al., Cell 163(6), 2015: 1515-1526)によって定義されたコア必須物を使用した。
【0111】
従来の分析を使用したスクリーニング結果の再現性が低いこと(R=0.27)がわかったが、同じデータセットのCRISPR-StAR分析では、より再現性の高いヒットリストが生成された(R=0.53)。全体として、従来の分析を使用すると、データの広がりが大きくなる。対照的に、ボトルネックで失われたCRISPR StAR分析から除外された557の欠落ガイドを特定した後、CRISPR StAR分析では非常に鋭い信号がある(図13a)。
【0112】
5.3 ガイドの再現性
ガイドの再現性を試験するために、MAGeCKアルゴリズムを使用して、ガイドのランク付けされたリストを作成した。このリストから、ランク別に分類されたガイドのそれぞれの群によってヒットされた全ての遺伝子について、遺伝子ごとに存在するsgRNAの平均数を計算した。例えば、上位30のsgRNA内で15の遺伝子がヒットした場合、値は2でした。ランダムデータセットの場合、値1が期待される。従来の分析ではほぼランダムな結果が得られるが、CRISPR-StARはスコア化された遺伝子の再現性が高いことを示している(図13b)。
【0113】
5.4 遺伝子の再現性
最後に、遺伝子レベルでの比較のために、両方の分析方法にMAGeCKを使用して、ガイドを組み合わせて遺伝子のランク付けされたリストを作成した。従来の分析と比較して高いp値を有する上位のヒットを呼び出すことができただけでなく、スコア化された遺伝子は複製物間でより再現性があった。さらに、CRISPR-StAR分析を使用して、両方の複製物の上位10個の欠失遺伝子のうち4個を呼び出し、これは、従来の分析を使用した1つのみの一般的な欠失遺伝子とは対照的である。これらは、オルガノイドの増殖に不可欠又は特異的であるため、私たちが見つけることを期待しているヒットである(Egfr、Itgb1、Top2a、Rpl14)。上位5つの濃縮遺伝子の下で、複製物間で共通の2つ(Nf2、Cdkn2a)が見つかったが、従来の分析では共通の遺伝子は見つからなかった(図13c)。さらに、それぞれの他の複製物でスコア化された遺伝子は、CRISPR-StAR分析では高いスコア化を示しているが、従来の分析ではかなり分布している。
【0114】
CRISPR-StARはスクリーンヒットを確実に同定できるため、従来の分析よりも優れており、腸内オルガノイドなどの不均一系でも再現性のある結果が得られると結論できる。
【0115】
実施例6:インビトロとインビボのスクリーニング
6.1 材料
【0116】
細胞株
Yumm1.7 450R黒色腫細胞(IMP, ViennaのObenauf Labから受領)。
Lenti-X(Clontech 632180)
【0117】
細胞培養培地
Yumm1.7 450R黒色腫細胞:10%FCS(Gibco)、1%L-グルタミン(Gibco)、1%ペニシリン-ストレプトマイシン(Sigma)を補足したDMEM/F12。YUMM1.7 450R(Cas9-CreERT2)の培地には、ピューロマイシン(1μg/ml、Invivogen)が追加で含まれている。
【0118】
Lenti-X細胞:10%FCS(Gibco)、1%L-グルタミン(Gibco)、1%ペニシリン-ストレプトマイシン(Sigma)、1%非必須アミノ酸(NEAA、Gibco)、1%ピルビン酸ナトリウム(Sigma)を補足したDMEM。
【0119】
緩衝液
2X SDS溶解緩衝液:
10mMトリス-HCl、pH8(Sigma Aldrich)、1%SDS(社内)、10mM EDTA(Sigma Aldrich)、100mM NaCl(Sigma Aldrich)、新たに添加した1mg/mlプロテイナーゼK(New England Biolabs)。
【0120】
プライマー
FW_G_CrSc_2: AATGATACGGCGACCACCGAGATCTACACACCGAACGAGGGCCTATTTCCCATGATTCCTTC (配列番号21)
FW_G_CrSc_15: AATGATACGGCGACCACCGAGATCTACACCATTACCGAGGGCCTATTTCCCATGATTCCTTC (配列番号22)
FW_G_CrSc_20: AATGATACGGCGACCACCGAGATCTACACCGTCATCGAGGGCCTATTTCCCATGATTCCTTC (配列番号23)
RV_G_CrSc: CAAGCAGAAGACGGCATACGAGATACCGTTGATGAGTAG (配列番号24)
NGS_U6: CGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG (配列番号25)
NGS_customNextSeq_i2_primer: GAAGGAATCATGGGAAATAGGCCCTCG (配列番号26)
【0121】
6.2.方法
6.2.1 Cas9及びCreERT2を発現する単細胞由来クローンの作成
【0122】
インビボ及びインビトロスクリーニングで、Cas9及びCreERT2を使用してYumm1.7 450R細胞を作成した。まず、細胞にPX459 pSpCas9(BB)-2A-Puro及びpMSCV-GFP-mir30-PGK-CreERT2を順次形質導入した。ピューロマイシン耐性についてバルク細胞集団を選択し、単一細胞クローンを単一蛍光活性化細胞ソーター解析(FACS)によって誘導した。続いて、GFP用のsgRNAを有するCRISPR-Switchを使用して、Cas9機能と漏出性creERT2発現についてクローンを試験した(Chylinski et al, Nature Communications 10, 2019)。
【0123】
6.2.2 プールされたライブラリーのクローニング
薬剤を加えたsgRNAライブラリープールを用いてStAR構築物を含むレンチウイルスライブラリーを作成するために、15,723個のsgRNAをPCR増幅し、ゴールデンゲート(Golden Gate)クローニングによってStARベクターにクローニングした。続いて、プラスミドを細菌(Enduraエレクトロコンピテント細胞、Lucigen)に電気穿孔した。形質転換後、細菌をLB培地で37℃で1時間回収し、アンピシリンを含むLB寒天プレートにプレーティングし、37℃で一晩インキュベートした。ライブラリー内の各sgRNAの3,000倍のカバー範囲を確認した。プラスミドDNAを単離し、レンチウイルス粒子の作成に使用した。
【0124】
6.2.3 インビトロスクリーニング
薬剤を加えたsgRNAライブラリープール(157,23個のsgRNA)を含むStAR構築物を、製造元の推奨に従ってLenti-X細胞にパッケージ化した。モノクローナルYUMM1.7450R(Cas9-CreERT2)にレンチウイルス粒子を形質導入した後、ネオマイシン選択(ゲネチシンG-418、500μg/ml、Gibco)を4日間行った。細胞は、インビトロ及びインビボスクリーニングの2群に分けられた。インビトロの細胞を培養し、creERT2組換えを4OH(0.5μM)で3日間誘導した。誘導後21日間細胞を維持した。
【0125】
6.2.4 インビボスクリーニング
50μl(PBS:マトリゲル)の1×106細胞を、6~12週齢の雌マウスの脇腹に皮下注射した。細胞の注射の7日後、30g当たり5mgのタモキシフェンを腹腔内注射することにより、creERT2組換えを誘導した。毎週、腫瘍サイズを測定し、腫瘍サイズが2cm3に達したときにマウスを殺処分した(タモキシフェン注射の6~13日後)。
【0126】
6.2.5 ゲノムDNA抽出とNGSライブラリー調製
インビトロでスクリーニングされ21日目に採取された細胞を、溶解緩衝液を用いて55℃で24時間溶解した。マウスから採取した腫瘍を15~20mlの溶解緩衝液で55℃で48~72時間溶解した。溶解した細胞と腫瘍の両方を、0.1mg/ml RNaseA(Qiagen)で37℃で1時間処理した。gDNAをフェノールとクロロホルムで抽出し、続いてイソプロパノールとEtOHで沈殿させた。DNAを断片化するために、試料をBsmBIで48時間消化し、各試料を48回の個別の50μl反応で1反応当たり1μgのDNAでPCR増幅した(95℃で3分、[95℃で20秒、59℃で20秒、72℃で40秒]×33、72℃で3分、4℃で∞)。前進プライマーは試料ごとに固有であり、NGS後の逆多重化のための6bpの実験的インデックスが含まれていた(材料中のFW_G_CrSc_2、FW_G_CrSc_15、又はFW_G_CrSc_20プライマー)。逆進プライマーは各試料で同じであった(RV_G_CrSc)。PCR産物を精製し、アガロースゲル電気泳動でサイズ分離をした。2つの組換え産物を一緒に切り出し、ミニ溶出カラムで精製した。この試料は、イルミナNextSeq2000でP2 SR100配列決定実験で配列決定された。sgRNAは、カスタムリードプライマー(リード1、NGS_U6)で配列決定された。活性sgRNA構築物と不活性sgRNA構築物は、sgRNA後の55bpベクターの配列を分析することで区別することができる。インデックスを決定するために、別のカスタムプライマーが使用された(Index2、NGS_customNextSeq_i2_primer)。
【0127】
6.3. 結果と考察
インビボスクリーンを実施する場合、大きな課題を克服する必要がある。同種移植片スクリーニングには、感染や生着効率を含むいくつかの技術的なボトルネックがある。さらに、不均一性は、細胞(系統)に依存する内因性の要因により、及び生体内の細胞の位置(例えば、血管に近いか、腫瘍の真ん中か)に依存して外因性に生じる。これらの問題は、sgRNAの表示が等しくないことにつながり、従来のスクリーニング分析を混乱させ、ここで、スクリーン分析の初日と最終日のsgRNAを比較するのは適切ではない。この1つの例は、これらのsgRNAを含む細胞がマウスに生着できなかったため、一部のsgRNAが失われたことである。もしスクリーンの初日と最終日のsgRNAを比較すると、これらのsgRNAは欠失していると識別されるため、標的遺伝子は腫瘍の増殖に不可欠であると定義され、これは偽陽性の結果である。CRISPR-StARは、スクリーンの最後に生着した細胞に存在する活性sgRNAと不活性sgRNAを比較することにより、このような課題を克服する。この例では、インビトロとインビボの条件で異なる遺伝的依存性をさらに解明することができる。
【0128】
この例では、インビボスクリーンとインビトロスクリーンの比較について説明する。Cas9とCreERT2を含むモノクローナル黒色腫細胞株YUMM1.7 450Rを使用した。薬剤を加えたsgRNAライブラリープール(15,723個のsgRNA)を含むStAR構築物によるウイルス形質導入時に、選択された細胞をインビトロ又はインビボでスクリーニングした。スクリーンの開始時にインビトロでCre組換えを誘発するために4OHを使用し、一方、細胞の注射の10日後のタモキシフェンの腹腔内注射によりインビボで組換えを誘発した。インビボで6~13日間の短いスクリーニング時間(腫瘍増殖速度に依存する)の後、腫瘍及びインビトロでスクリーニングされた細胞からDNAを抽出し、次世代配列決定に供し、そして生物情報学的に分析した。
【0129】
このインビボスクリーンから、不活性及び活性sgRNA構築物からリードを取得することができ、これは、StARベクターでインビボのCre組換えが成功したことを示している。必須遺伝子を標的とする活性sgRNAは、対応する不活性sgRNAと比較して欠失していた。同じsgRNAのUMIのリードを合計し、各UMIのLog2倍数の変化(LFC)を計算し、次に同じ遺伝子を標的とするsgRNAの合計LFCの中央値を計算することによって、インビトロ及びインビボでのsgRNAの効果が計算される(図14)。陰性対照遺伝子(黒で示されている)は、インビトロでもインビボでも効果を示さない。必須遺伝子の大部分(赤で示されている)は、インビトロ及びインビボで欠失している。ドットサイズは、インビボ試料中の遺伝子当たりのUMIの数を表す。
【0130】
実施例7:マウス肝臓におけるCRISPRスクリーン
内因性組織でインビボCRISPRスクリーニングを行うには、抗生物質を用いる細胞のインビトロ選択と同様に、インビボでライブラリー担持細胞を選択的に拡大する必要がある。この例では、肝臓の損傷後に肝細胞が増殖して肝臓を再生することができる、肝臓でのこの拡大を示す。この場合、StARライブラリーを担持している少数の細胞のみが肝臓で再増殖し、結果として、ライブラリーを取得し、活性sgRNAと不活性sgRNAの比率を比較してスクリーンを実行するのに十分な細胞が得られる。健康な肝細胞を用いるフマリルアセト酢酸ヒドロキシラーゼ(FAH)ホモ接合性ノックアウト(FAH-/-)マウスにおける肝臓の再増殖は、肝臓の再生を研究するための確立された方法である(Montini et al. (2002) Molecular Therapy, 6(6), 759-769; Wuestefeld et al. (2013) Cell, 153(2), 389-401; Zhu et al. (2019) Cell, 177(3), 608-621.e12)。FAHは、有毒なフマリルアセト酢酸(FAA)を代謝してフマル酸とアセト酢酸にする。機能的なFAH酵素を欠くマウスは肝不全で死亡する。しかし、FAH-/-マウスは、ニチシノン(NTBC)治療によって維持することができる。NTBCは、この代謝経路の上流酵素である4-ヒドロキシフェニルピルビン酸ジオキシゲナーゼ(HPD)を阻害し、FAAの蓄積を妨害する。機能的なFAH遺伝子を担持する肝細胞は、NTBCが中止されると、FAH-/-肝臓に再増殖することができる。
【0131】
図15は、CRISPR-StAR構築物を有するEF1aプロモーターの制御下にある、EGFP-P2A-FAH発現カセットを有する眠れる森の美女トランスポゾンを示す。0.9%NaCl食塩水中の25μgのトランスポゾンプラスミドと5μgの眠れる森の美女トランスポザーゼSB100XプラスミドをFAH-/-マウスに注入し、これを250mLの飲料水中の1.8mgのNTBCで維持した。総体重の10%に相当する容量を5秒で尾静脈に注射した。NTBC濃度は、注射の1日後に元の濃度の20%に減少した。注射の7日後、NTBCは飲料水から完全に除去された。StAR構築物は、FAH発現カセットを含む眠れる森の美女トランスポゾンでクローン化されている。このようにして、肝臓にStAR構築物を担持する細胞を再増殖させることができる。眠れる森の美女トランスポゾンとトランスポザーゼは、流体力学的尾静脈注射によって肝臓に送達され(Bell et al. (2007) Nature Protocols, 2(12), 3153-3165; Liu et al. (1999) Gene Therapy, 6(7), 1258-1266)、そして、StAR構築物を担持する細胞が、NTBC中止後に肝臓に再増殖することを確認した。従って、肝臓に健康なStAR含有細胞を再増殖させて、CRISPR-StARスクリーンを実施することができる。
【0132】
肝臓でStARを含む細胞を増殖させる別の例は、肝臓癌を誘発することである。ここで、StAR構築物は、よく知られている癌ドライバーであるKrasG12D発現カセットを有する眠れる森の美女トランスポゾンでクローン化されている。我々は、StARを含む細胞が健康な肝臓で増殖することを確認した。図16は、CRISPR-StAR構築物を有するEF1aプロモーターの制御下にある、KrasG12D-P2A-FAH発現カセットを有する眠れる森の美女トランスポゾンを示す。0.9%NaCl食塩水中の15μgのトランスポゾンプラスミッド及び3μgの眠れる森の美女トランスポザーゼSB100XプラスミドをWTマウスに注射した。総体重の10%に相当する容量を5秒で尾静脈に注射した。この拡大を加速するために、トランスポゾンは、p53が条件付きで欠失した肝臓(これは、p53fl/flマウスでAlb-CreERT2を活性化することによって達成される)に注入される(Ju et al. (2016) International Journal of Cancer, 138(7), 1601-1608)。
【0133】
インビボ肝臓スクリーニングは、Cas9とFAH-/-のAlb-CreERT2マウス、又はp53fl/flマウスで行われる。これらの例は、組換えを誘発してスクリーンを実行する前に、インビボでCRISPR-StARライブラリーを拡張する2つの方法を示している。
図1
図2
図3
図4
図5
図6
図7
図8-1】
図8-2】
図8-3】
図9-1】
図9-2】
図9-3】
図10-1】
図10-2】
図10-3】
図10-4】
図11-1】
図11-2】
図12
図13-1】
図13-2】
図13-3】
図14
図15
図16
【配列表】
2023519790000001.app
【国際調査報告】