(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-20
(45)【発行日】2022-09-29
(54)【発明の名称】バーコード付きガイドRNA構築体を使用する効率的な遺伝子スクリーニングのための組成物及び方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20220921BHJP
C40B 40/06 20060101ALI20220921BHJP
C12Q 1/6869 20180101ALI20220921BHJP
C12N 7/01 20060101ALN20220921BHJP
【FI】
C12N15/09 110
C40B40/06 ZNA
C12Q1/6869 Z
C12N7/01
(21)【出願番号】P 2021536251
(86)(22)【出願日】2019-12-20
(86)【国際出願番号】 CN2019127080
(87)【国際公開番号】W WO2020125762
(87)【国際公開日】2020-06-25
【審査請求日】2021-09-08
(31)【優先権主張番号】PCT/CN2018/122383
(32)【優先日】2018-12-20
(33)【優先権主張国・地域又は機関】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】507232478
【氏名又は名称】北京大学
【氏名又は名称原語表記】PEKING UNIVERSITY
【住所又は居所原語表記】No.5, Yiheyuan Road, Haidian District, Beijing 100871, China
(73)【特許権者】
【識別番号】520047082
【氏名又は名称】博雅▲緝▼因(北京)生物科技有限公司
【氏名又は名称原語表記】EDIGENE BIOTECHNOLOGY INC.
【住所又は居所原語表記】Life Science Park,Floor 2,Building 2,22 KeXueYuan Road,Changping District,Beijing 102206,China
(74)【代理人】
【識別番号】110002000
【氏名又は名称】特許業務法人栄光特許事務所
(72)【発明者】
【氏名】魏 文▲勝▼
(72)【発明者】
【氏名】朱 ▲詩▼▲優▼
(72)【発明者】
【氏名】曹 中正
(72)【発明者】
【氏名】▲劉▼ 志恒
(72)【発明者】
【氏名】何 苑
(72)【発明者】
【氏名】袁 ▲鵬▼▲飛▼
【審査官】松田 芳子
(56)【参考文献】
【文献】特表2017-530695(JP,A)
【文献】特表2018-534114(JP,A)
【文献】特表2017-534285(JP,A)
【文献】Genome Biology,2019年01月24日,20:20
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
それぞれがsgRNA
iBARを含むかまたはコードする3つ以上のsgRNA
iBAR構築体を含むsgRNA
iBAR構築体のセットであって、各sgRNA
iBARは、ガイド配列及び内部バーコード(iBAR)配列を含むsgRNA
iBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNA
iBAR構築体のガイド配列は同じであり、3つ以上のsgRNA
iBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNA
iBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能であり、
各sgRNA
iBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置し、
各sgRNA
iBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート-アンチ-リピートステムループを含み、
各sgRNA
iBAR配列のiBAR配列は、リピート-アンチ-リピートステムループのループ領域に位置して、
各iBAR配列が1~50ヌクレオチドを含む、sgRNA
iBAR構築体のセット。
【請求項2】
前記Cas蛋白質がCas9である、請求項1に記載のsgRNA
iBAR構築体のセット。
【請求項3】
各sgRNA
iBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む、請求項1または2に記載のsgRNA
iBAR構築体のセット。
【請求項4】
各ガイド配列が17~23ヌクレオチドを含む、請求項1~3のいずれか一項に記載のsgRNA
iBAR構築体のセット。
【請求項5】
各sgRNA
iBAR構築体がプラスミドである、請求項1~4のいずれか一項に記載のsgRNA
iBAR構築体のセット。
【請求項6】
請求項1~5のいずれか一項に記載のsgRNA
iBAR構築体の複数のセットを含むsgRNA
iBARライブラリーであって、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する、sgRNA
iBARライブラリー。
【請求項7】
請求項1~5のいずれか一項に記載のsgRNA
iBAR構築体の複数のセットを含むsgRNA
iBARライブラリーを調製する方法であって、sgRNA
iBAR構築体の各セットは、異なる標的ゲノム遺伝子座に相補的な複数のガイド配列の1つに対応し、前記方法は、
a)各ガイド配列に対して3つ以上のsgRNA
iBAR構築体を設計すること、及び b)各sgRNA
iBAR構築体を合成し、それによってsgRNA
iBARライブラリーを生成することを含み、
a)において、各sgRNA
iBAR構築体は、対応するガイド配列及びiBAR配列を含むsgRNA
iBAR配列を有するsgRNA
iBARを含むかまたはコードし、ここで、3つ以上のsgRNA
iBAR構築体のそれぞれに対応するiBAR配列は互いに異なり、各sgRNA
iBARは、対応する標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能である、方法。
【請求項8】
請求項1~5のいずれか一項に記載のsgRNA
iBAR構築体のセット、または請求項6に記載のsgRNA
iBARライブラリーを含む、組成物。
【請求項9】
細胞の表現型を調節するゲノム遺伝子座をスクリーニングする方法であって、
a)修飾された細胞集団を提供するようにsgRNA
iBAR構築体
およびCas成分の細胞への導入を可能にする条件下で、初期細胞集団を請求項6記載のsgRNA
iBARライブラリー
、および、Cas蛋白質、またはCas蛋白質をコードする核酸を含むCas成分と接触させること、
b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、
c)選択された細胞集団からsgRNA
iBAR配列を取得すること、
d)配列カウントに基づいてsgRNA
iBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNA
iBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及び
e)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定すること
を含む、方法。
【請求項10】
前記c)において、選択された細胞集団から取得される前記sgRNA
iBAR配列が、ゲノムシーケンシングまたはRNAシーケンシングによって得られる、請求項
9に記載の方法。
【請求項11】
各sgRNA
iBAR構築体がウイルスベクターであり、sgRNA
iBARライブラリーが2を超える感染多重度(MOI)で初期細胞集団と接触する、請求項9
または10に記載の方法。
【請求項12】
前記表現型が、細胞死、細胞増殖、細胞運動性、細胞代謝、薬剤耐性、薬剤感受性、及び刺激因子に対する応答からなる群より選択される、請求項9~
11のいずれか一項に記載の方法。
【請求項13】
前記表現型は、刺激因子に対する応答であり、前記刺激因子が、ホルモン、成長因子、炎症性サイトカイン、抗炎症性サイトカイン、薬剤、毒素、及び転写因子からなる群より選択される、請求項
12に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、内部バーコード(「iBAR」)を有するガイドRNA構築体を使用する遺伝子スクリーニングのための組成物、キット、及び方法に関する。
【背景技術】
【0002】
CRISPR/Cas9システムは、高い効率と特異性で標的ゲノム部位での編集を可能にする(非特許文献1-2)。その幅広い用途の1つは、ハイスループットプールスクリーニングと次世代シーケンシング(「NGS」)分析とを組み合わせて、コーディング遺伝子、非コーディングRNA、および調節エレメントの機能を同定することである。プールされたシングルガイドRNA(「sgRNA」)またはペアガイドRNA(「pgRNA」)ライブラリーを、Cas9を発現する細胞またはエフェクタードメインと融合した触媒的に不活性なCas9(dCas9)に導入することにより、研究者は、多様な突然変異、大きなゲノム欠失、転写活性化、または転写抑制を生成することにより、様々な遺伝子スクリーニングを実行できる。
【0003】
任意の所定のプールされたCRISPRスクリーニングにおいて高品質のgRNA細胞ライブラリーを生成するには、細胞ライブラリーの構築中に感染多重度(「MOI」)を低くして、各細胞が平均して1つ未満のsgRNAまたはpgRNAを保持してそのスクリーニングの偽陽性率(FDR)(非特許文献6,10,11)を最小限に抑える必要がある。FDRをさらに低め、データの再現性を高めるには、統計的に有意なヒット遺伝子を取得するようにgRNA及び複数の生物学的複製を深くカバーすることが必要になることが多く、結果としてワークロードが増加する。ゲノムワイドなスクリーニングを大量に実行する場合、ライブラリー構築用の細胞材料が限られている場合、または実験的な複製を取得したり、MOIを制御したりすることが困難な場合により挑戦的なスクリーニング(例えば、インビボスクリーニング)を実施する場合、さらに困難が生じる可能性がある。真核細胞における大規模な標的同定のための信頼性が高く、非常に効率的なスクリーニングストラテジーが緊急に必要とされている。
【0004】
本明細書で言及されるすべての刊行物、特許、特許出願、及び公開された特許出願の開示内容は、参照によりその全体が本明細書に取り込まれる。
【先行技術文献】
【非特許文献】
【0005】
【文献】Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
【文献】Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013).
【文献】Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).
【文献】Shalem, O. et al. Genome-scale CRISPR-Cas9 knockout screening in human cells. Science 343, 84-87 (2014).
【文献】Wang, T., Wei, J.J., Sabatini, D.M. & Lander, E.S. Genetic screens in human cells using the CRISPR-Cas9 system. Science 343, 80-84 (2014).
【文献】Koike-Yusa, H., Li, Y., Tan, E.P., Velasco-Herrera Mdel, C. & Yusa, K. Genome-wide recessive genetic screening in mammalian cells with a lentiviral CRISPR-guide RNA library. Nat Biotechnol 32, 267-273 (2014).
【文献】Zhou, Y. et al. High-throughput screening of a CRISPR/Cas9 library for functional genomics in human cells. Nature 509, 487-491 (2014).
【文献】Zhu, S. et al. Genome-scale deletion screening of human long non-coding RNAs using a paired-guide RNA CRISPR-Cas9 library. Nat Biotechnol 34, 1279-1286 (2016).
【文献】Gilbert, L.A. et al. Genome-Scale CRISPR-Mediated Control of Gene Repression and Activation. Cell 159, 647-661 (2014).
【文献】Konermann, S. et al. Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex. Nature 517, 583-588 (2015).
【文献】Peng, J., Zhou, Y., Zhu, S. & Wei, W. High-throughput screens in mammalian cells using the CRISPR-Cas9 system. FEBS J 282, 2089-2096 (2015).
【文献】Zhu, S., Zhou, Y. & Wei, W. Genome-Wide CRISPR/Cas9 Screening for High-Throughput Functional Genomics in Human Cells. Methods Mol Biol 1656, 175-181 (2017).
【文献】Michlits, G. et al. CRISPR-UMI: single-cell lineage tracing of pooled CRISPR-Cas9 screens. Nat Methods 14, 1191-1197 (2017).
【文献】Schmierer, B. et al. CRISPR/Cas9 screening using unique molecular identifiers. Molecular systems biology 13, 945 (2017).
【文献】Shechner, D.M., Hacisuleyman, E., Younger, S.T. & Rinn, J.L. Multiplexable, locus-specific targeting of long RNAs with CRISPR-Display. Nat Methods 12, 664-670 (2015).
【文献】Bradley, K.A., Mogridge, J., Mourez, M., Collier, R.J. & Young, J.A. Identification of the cellular receptor for anthrax toxin. Nature 414, 225-229 (2001).
【文献】Li, W. et al. MAGeCK enables robust identification of essential genes from genome-scale CRISPR/Cas9 knockout screens. Genome Biol 15, 554 (2014).
【文献】Lyras, D. et al. Toxin B is essential for virulence of Clostridium difficile. Nature 458, 1176-1179 (2009).
【文献】Yuan, P. et al. Chondroitin sulfate proteoglycan 4 functions as the cellular receptor for Clostridium difficile toxin B. Cell Res 25, 157-168 (2015).
【文献】Tao, L. et al. Frizzled proteins are colonic epithelial receptors for C. difficile toxin B. Nature 538, 350-355 (2016).
【文献】Tan, Y.Y., Epstein, L.B. & Armstrong, R.D. In vitro evaluation of 6-thioguanine and alpha-interferon as a therapeutic combination in HL-60 and natural killer cells. Cancer Res 49, 4431-4434 (1989).
【文献】Duan, J., Nilsson, L. & Lambert, B. Structural and functional analysis of mutations at the human hypoxanthine phosphoribosyl transferase (HPRT1) locus. Human mutation 23, 599-611 (2004).
【文献】Jackson, S.P. Sensing and repairing DNA double-strand breaks. Carcinogenesis 23, 687-696 (2002).
【文献】Meyers, R.M. et al. Computational correction of copy number effect improves specificity of CRISPR-Cas9 essentiality screens in cancer cells. Nat Genet 49, 1779-1784 (2017).
【文献】Hart, T., Brown, K.R., Sircoulomb, F., Rottapel, R. & Moffat, J. Measuring error rates in genomic perturbation screens: gold standards for human functional genomics. Molecular systems biology 10, 733 (2014).
【文献】Zhou, Y. et al. Painting a specific chromosome with CRISPR/Cas9 for live-cell imaging. Cell Res 27, 298-301 (2017).
【文献】Billon, P. et al. CRISPR-Mediated Base Editing Enables Efficient Disruption of Eukaryotic Genes through Induction of STOP Codons. Mol Cell 67, 1068-1079 e1064 (2017).
【文献】Engler, C., Gruetzner, R., Kandzia, R. & Marillonnet, S. Golden gate shuffling: a one-pot DNA shuffling method based on type IIs restriction enzymes. PLoS One 4, e5553 (2009).
【文献】Wei, W., Lu, Q., Chaudry, G.J., Leppla, S.H. & Cohen, S.N. The LDL receptor-related protein LRP6 mediates internalization and lethality of anthrax toxin. Cell 124, 1141-1154 (2006).
【文献】Qian, L. et al. Bidirectional effect of Wnt signaling antagonist DKK1 on the modulation of anthrax toxin uptake. Science China. Life sciences 57, 469-481 (2014).
【文献】Anders, S. & Huber, W. Differential expression analysis for sequence count data. Genome Biol 11, R106 (2010).
【文献】Robinson, M.D. & Smyth, G.K. Small-sample estimation of negative binomial dispersion, with applications to SAGE data. Biostatistics 9, 321-332 (2008).
【文献】Kolde, R., Laur, S., Adler, P. & Vilo, J. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics 28, 573-580 (2012).
【発明の概要】
【0006】
本願は、CRISPR-Cas遺伝子編集システムを介して遺伝子スクリーニングするガイドRNA構築体、ライブラリー、組成物およびキット、ならびに遺伝子スクリーニング方法を提供する。
【0007】
本願の一態様では、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列及び内部バーコード(「iBAR」)配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なる。さらに、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能である。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含み、例えば、約2~20ヌクレオチドまたは約3~10ヌクレオチドを含む。一部の実施形態では、各ガイド配列は約17~23ヌクレオチドを含む。
【0008】
上記sgRNAiBAR構築体のセットのいずれかによる一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。上記sgRNAiBAR構築体のセットのいずれかによる一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。
【0009】
上記sgRNAiBAR構築体のセットのいずれかによる一部の実施形態では、Cas蛋白質はCas9である。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に位置する。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に挿入される。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、ステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、ステムループ1、ステムループ2、またはステムループ3のループ領域に挿入される。
【0010】
上記sgRNAiBAR構築体のセットのいずれかによる一部の実施形態では、各sgRNAiBAR構築体がプラスミドである。一部の実施形態では、各sgRNAiBAR構築体はウイルスベクター、例えば、レンチウイルスベクターである。
【0011】
本願の一態様では、上記いずれかに記載のsgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーが提供され、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。一部の実施形態では、sgRNAiBARライブラリーは、少なくとも約1000(例えば、少なくとも約2000、5000、10000、15000、20000またはそれ以上)セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2セットのsgRNAiBAR構築体のiBAR配列が同じである。一部の実施形態では、異なるセットのgRNAiBAR構築体は、iBAR配列の異なる組み合わせを有する。
【0012】
本願の一態様では、sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーを調製する方法が提供され、各セットは、異なる標的ゲノム遺伝子座に相補的な複数のガイド配列の1つに対応し、前記方法は、a)各ガイド配列に対して3つ以上(例えば、4つ)のsgRNAiBAR構築体を設計すること、及びb)各sgRNAiBAR構築体を合成し、それによってsgRNAiBARライブラリーを生成することを含み、a)において、各sgRNAiBAR構築体は、対応するガイド配列及びiBAR配列を含むsgRNAiBAR配列を有するsgRNAiBARを含むかまたはコードし、ここで、3つ以上のsgRNAiBAR構築体のそれぞれに対応するiBAR配列は互いに異なり、各sgRNAiBARは、対応する標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能である。一部の実施形態では、その方法は、複数のガイド配列を提供することをさらに含む。
【0013】
上記いずれかに記載の調製方法による一部の実施形態では、各iBAR配列は、約1~50ヌクレオチドを含み、例えば、約2~20ヌクレオチドまたは約3~10ヌクレオチドを含む。一部の実施形態では、各ガイド配列は約17~23ヌクレオチドを含む。
【0014】
上記いずれかに記載の調製方法による一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。上記いずれかに記載の調製方法による一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。
【0015】
上記いずれかに記載の調製方法による一部の実施形態では、Cas蛋白質はCas9である。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に位置する。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に挿入される。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、ステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、各sgRNAiBAR配列のiBAR配列は、ステムループ1、ステムループ2、またはステムループ3のループ領域に挿入される。
【0016】
上記いずれかに記載の調製方法による一部の実施形態では、各sgRNAiBAR構築体がプラスミドである。一部の実施形態では、各sgRNAiBAR構築体はウイルスベクター、例えば、レンチウイルスベクターである。
【0017】
さらに、上記いずれかに記載の調製方法による方法を使用して調製されたsgRNAiBARライブラリー、及び上記いずれかに記載のsgRNAiBAR構築体のセット、または上記いずれかに記載のsgRNAiBARライブラリーを含む組成物が提供される。
【0018】
本願のもう一態様では、細胞の表現型を調節(modulate)するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体および必要に応じたCas成分の細胞への導入を可能にする条件下で、初期細胞集団をi)上記のsgRNAiBARライブラリーのいずれか1つのsgRNAiBARライブラリー、必要に応じて、ii)Cas蛋白質、またはCas蛋白質をコードする核酸を含むCas成分と接触させること、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、ランク付けは、sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、細胞が真核細胞であり、例えば、哺乳動物細胞である。一部の実施形態では、初期細胞集団がCas蛋白質を発現する。
【0019】
上記いずれかに記載のスクリーニング方法による一部の実施形態では、各sgRNAiBAR構築体がウイルスベクターであり、sgRNAiBARライブラリーが約2を超える(例えば、3、4、5、6、7、8、9、10またはそれ以上)感染多重度(MOI)で初期細胞集団と接触する。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超える(例えば、約97%、98%、99%を超えるまたはそれ以上)sgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、前記スクリーニングが、約1000倍を超える(例えば、2000倍、3000倍、5000倍またはそれ以上)カバー率で行われる。
【0020】
上記いずれかに記載のスクリーニング方法による一部の実施形態では、前記スクリーニングが陽性スクリーニングである。一部の実施形態では、前記スクリーニングが陰性スクリーニングである。
【0021】
上記のスクリーニング方法のいずれかによる一部の実施形態では、表現型は、蛋白質発現、RNA発現、蛋白質活性、またはRNA活性である。一部の実施形態では、表現型は、細胞死、細胞増殖、細胞運動性、細胞代謝、薬剤耐性、薬剤感受性、及び刺激因子に対する応答からなる群より選択される。一部の実施形態では、表現型は、刺激因子に対する応答であり、前記刺激因子が、ホルモン、成長因子、炎症性サイトカイン、抗炎症性サイトカイン、薬剤、毒素、及び転写因子からなる群より選択される。
【0022】
上記いずれかに記載のスクリーニング方法による一部の実施形態では、sgRNAiBAR配列が、ゲノムシーケンシングまたはRNAシーケンシングによって得られる。一部の実施形態では、sgRNAiBAR配列が、次世代シーケンシング(next-generation sequencing)によって得られる。
【0023】
上記のスクリーニング方法のいずれかによる一部の実施形態では、配列カウントは、中央値比の正規化とそれに続く平均分散モデリングの対象となる。一部の実施形態では、ガイド配列に対応する前記sgRNAiBAR配列中のiBAR配列間のデータ一貫性に基づいて各ガイド配列の分散を調整する。一部の実施形態では、選択された細胞集団から得られた配列カウントを、対照細胞集団から得られた対応する配列カウントと比較して、倍数変化を提供する。一部の実施形態では、ガイド配列に対応する前記sgRNAiBAR配列中のiBAR配列間のデータ一貫性は、各iBAR配列の倍数変化の方向に基づいて決定され、iBAR配列の倍数変化が互いに反対方向である場合に、前記ガイド配列の分散が増加する。
【0024】
上記いずれかに記載のスクリーニング方法による一部の実施形態では、前記方法は、同定されたゲノム遺伝子座を検証することをさらに含む。
【0025】
上記いずれかのsgRNAiBARライブラリーを含む、細胞の表現型を調節するゲノム遺伝子座をスクリーニングするためのキット及び製品が提供される。一部の実施形態では、キットまたは製品は、Cas蛋白質またはCas蛋白質をコードする核酸をさらに含む。
【図面の簡単な説明】
【0026】
【
図1】
図1A~1Eは、sgRNA
iBAR構築体を使用した、CRISPR/Casに基づいた例示的なスクリーニングを示す図である。
図1Aは、内部バーコード(iBAR)を有するsgRNA
iBARを示す概略図である。6-ntバーコード(iBAR
6)は、sgRNAスキャフォールドのテトラループ(tetraloop)に埋め込まれた。
図1Bは、単一の遺伝子を標的とするsgRNA構築体ライブラリー(ANTXR1;本明細書では「sgRNA
iBAR-ANTXR1」と称する)を使用したが、4,096個のiBAR
6配列すべてを有する、CRISPR/Casに基づいたスクリーニング実験の結果を示す図である。sgRNA構築体の対照(「sgRNA
非ターゲティング」)は、ANTXR1を標的としないガイド配列を有するが、対応するiBAR
6配列を有する。参照と毒素(PA/LFnDTA)処理群の間の倍数変化は、各sgRNA
iBAR-ANTXR1の正規化された豊富さを使用して計算された。ここで、sgRNA
iBAR-ANTXR1、バーコードが付いていないsgRNA
iBAR-ANTXR1、及び非ターゲティングsgRNAの倍数変化を示す密度プロットが示される。Pearson相関が計算される(「Corr」)。
図1Cは、sgRNAの編集効率に対するiBAR
6の各位置でのヌクレオチド同一性の影響を示す図である。
図1Dは、スクリーニング実験においてPA/LFnDTAに対する最小の細胞耐性に関連する6つのバーコードを有するsgRNA
iBAR-ANTXR1によって生成された挿入欠失(インデル、indels)を示す図である。T7E1アッセイにおける切断効率のパーセンテージは、Image Labソフトウェアを使用して測定され、データは平均±s.d.として表される(N=3)。使用したすべてのプライマーを表1に示す。
図1Eは、MTT生存率アッセイの結果を示す図である。これは、PA/LFnDTAに対する示されたsgRNA
iBAR-ANTXR1によって編集された細胞の感受性の低下を示している。
【
図2】
図2は、iBAR配列のGC含量に応じて3つのグループに分類された4,096種類のiBAR
6配列すべてを含むsgRNA
iBAR-ANTXR1のコレクションのCRISPRスクリーニングを示す図である。3つのグループのGC含量は、高(100~66%)、中(66~33%)、低(33~0%)である。2つの生物学的複製のランキングが表示されている。
【
図3】
図3A~3Dは、sgRNA活性に対するiBAR配列の影響の評価を示す図である。sgRNA1
iBAR-CSPG4(
図3A)、sgRNA2
iBAR-CSPG4(
図3B)、sgRNA2
iBAR-MLH1(
図3C)、およびsgRNA3
iBAR-MSH2(
図3D)によって生成されたインデルは、上記のスクリーニングからPA/LFnDTAへの細胞耐性を与えるのに最悪であると思われる6つのバーコード、およびU6プロモーターの終了シグナルであると思われるGTTTTTTに関連する。T7E1アッセイにおける切断効率のパーセンテージは、Image Labソフトウェアを使用して測定され、データは平均±s.d.として表される(n=3)。使用したすべてのプライマーを表1に示す。
【
図4】
図4は、sgRNA
iBARライブラリーを使用したCRISPRプールスクリーニングを示す概略図である。特定のsgRNA
iBARライブラリーについて、4つの異なるiBAR
6が各sgRNAにランダムに割り当てられた。sgRNA
iBARライブラリーは、高いMOI(つまり、~3)のレンチウイルス感染によって標的細胞に導入された。ライブラリースクリーニング後、濃縮細胞からのsgRNA及びそれに関連するiBARをNGS(次世代シーケンシング)で測定した。データ分析では、中央値比の正規化(median ratio normalization)が適用され、続いて平均分散モデリング(mean-variance modelling)が行われた。sgRNA
iBARの分散は、同じsgRNAに割り当てられたすべてのiBARの倍数変化の一貫性に基づいて決定された。各sgRNA
iBARのP値は、平均と修正された分散を使用して計算された。ヒット遺伝子を同定するために、すべての遺伝子のロバストランクアグリゲーション(Robust rank aggregation,RRA)スコアが考慮された。より低いRRAスコアは、ヒット遺伝子のより強い濃縮に対応した。
【
図5】
図5は、設計されたオリゴヌクレオチド(オリゴ)のDNA配列を示す図である。アレイ合成された85-ntDNAオリゴヌクレオチドには、sgRNAとバーコードiBAR
6のコード配列が含まれている。左アームと右アームは、増幅のためのプライマーターゲティングに使用される。BsmBI部位は、プールされたバーコード付きsgRNAを最終的な発現バックボーンにクローニングするために使用される。
【
図6】
図6A~6Fは、HeLa細胞におけるMOIが0.3、3および10である場合のTcdB毒性に関与する必須遺伝子のスクリーニング結果を示す図である。
図6Aおよび6Bは、MOIが0.3である場合のMAGeCK(
図6A)およびMAGeCK
iBAR(
図6B)によって計算された同定された遺伝子(FDR<0.15)のスクリーニングスコアを示す図である。
図6Cおよび6Dは、MOIが3である場合のMAGeCK(
図6C)およびMAGeCK
iBAR(
図6D)によって計算された同定された遺伝子(FDR<0.15)のスクリーニングスコアを示す図である。
図6E~6Fは、MOIが10である場合にMAGeCK(
図6E)およびMAGeCKB(
図6F)によって計算された同定された遺伝子(FDR<0.15)のスクリーニングスコアを示す図である。陰性対照遺伝子は、縦軸の0付近に暗い点で標記されている。MAGeCKおよびMAGeCK
iBARを介して各生物学的複製で同定された候補のランキングが表示された。
【
図7】
図7A~7Hは、CSPG4標的構築体(
図7A)、SPPL3標的構築体(
図7B)、UGP2標的構築体(
図7C)、KATNAL2標的構築体(
図7D)、HPRT1(
図7E)、RNF212B標的構築体(
図7F)、SBNO2標的構築体(
図7G)、及びERAS標的構築体(
図7H)のsgRNA
iBAR読み取りカウントを示す図である。それは、TcdBスクリーニングの前(Ctrl)及び後(Exp)で、MOI 10で、2つの複製でMAGeCKによって計算された。
【
図8】
図8A~8Cは、さまざまなサンプルにおけるsgRNAの分布とカバレッジを示す図である。
図8Aは、参照群と6-TG治療群のsgRNA
iBAR分布を示す図である。横軸はlog10の正規化されたRPMを示し、縦軸はsgRNAの数を示す。
図8Bは、参照サンプルのsgRNAカバレッジを示す図である。縦軸は、sgRNAの比率と設計の関係を示す。
図8Cは、ライブラリー内で異なる数の設計されたiBARを運ぶsgRNAの比率を示す図である。
【
図9】
図9は、MOI 3での6-TGスクリーニング後の、2つの生物学的複製間のすべての遺伝子のlog10(倍数変化)のピアソン(Pearson)相関を示す図である。
【
図10】
図10は、MAGeCK
iBAR分析を使用した分散調整後のすべてのsgRNA
iBARの平均分散モデルを示す図である。
【
図11】
図11A~11Gは、HeLa細胞における6-TGを介した細胞毒性に重要なヒト遺伝子を同定するためのCRISPR
iBARと従来のCRISPRプールスクリーンの比較を示す図である。
図11A~11Bは、MAGeCK
iBAR(
図11A)およびMAGeCK(
図11B)によって計算された上位(トップランク)の遺伝子のスクリーニングスコアを示す図である。同定された候補(FDR<0.15)にラベルが付けられ、MAGeCKiBARスクリーニングとして、上位10ヒットのみに標記された。陰性対照遺伝子は、縦軸の0付近に暗い点で標記された。
図11Cは、6-TG細胞毒性に関与する報告された遺伝子(MLH1、MSH2、MSH6、およびPMS2)の検証を示す図である。
図11Dは、MAGeCK
iBAR(左)または従来のMAGeCK分析(右)を使用した、2つの生物学的複製間の上位20の陽性選択された遺伝子のスピアマン(Spearman)相関係数を示す図である。
図11Eは、MAGeCK
iBARまたはMAGeCK分析によって単離された最上位の候補遺伝子の検証を示す図である。各遺伝子を標的とするミニプールされたsgRNAは、レンチウイルス感染を介して細胞に送達された。形質導入された細胞は、6-TG処理の前にさらに10日間培養された。データは平均±S.E.M.として表される(n=5)。P値は、スチューデントのt検定を使用して計算された(*P<0.05;**P<0.01;***P<0.001;NS、有意ではない)。検証用のsgRNA配列を表3に示す。
図11F~11Gは、2つの複製における6-TGスクリーニングの前(Ctrl)および後(Exp)のHPRT1標的構築体(
図11F)およびFGF13標的構築体(
図11G)のsgRNA
iBAR読み取りカウントを示す図である。
【
図12】
図12は、MLH1、MSH2、MSH6、およびPMS2を標的とする最初に設計されたsgRNAの効率を示す図である。T7E1アッセイにおける切断効率のパーセンテージは、Image Labソフトウェアを使用して測定され、データは平均±s.d.として表される(n=3)。使用したすべてのプライマーを表1に示す。
【
図13】
図13は、2つの実験的複製において、示された最上位の候補遺伝子(HPRT1、ITGB1、SRGAP2、およびAKTIP)を標的とする各sgRNA
iBARの倍数変化を示す図である。CtrlとExpは、それぞれ6-TG処理の前後のサンプルを表す。
【
図15】
図15A~15Fは、2つの複製の、GALR1(
図15A)、DUPD1(
図15B)、TECTA(
図15C)、OR51D1(
図15D)、Neg89(
図15E)およびNeg67(
図15F)を標的とするためのsgRNA
iBAR読み取りカウントを示す図である。CtrlとExpは、それぞれ6-TG処理の前後のサンプルを表す。
【
図16】
図16は、2つの実験的複製における従来の分析によるHPRT1、FGF13、GALR1、およびNeg67の正規化されたsgRNA読み取りカウントを示す図である。CtrlとExpは、それぞれ6-TG処理の前後のサンプルを表す。
【
図17】
図17は、(ROC曲線によって決定された)ゴールドスタンダードの必須遺伝子を使用したMAGeCK及びMAGeCK
iBAR分析によるスクリーニング性能の評価を示す図である。AUC(曲線下面積)値が示された。破線は、ランダム分類モデルの性能を示す。
【
図18】
図18は、sgRNA活性に対するさまざまな長さのiBARの影響を示す図である。Indelは、示されているようにバーコードの長さが異なるsgRNA1
CSPG4及びsgRNA1
iBAR-CSPG4によって生成された。T7E1アッセイにおける切断効率のパーセンテージは、Image Labソフトウェアを使用して測定され、データは平均±s.d.として表される(n=3)。使用したすべてのプライマーを表1に示す。
【発明を実施するための形態】
【0027】
本出願は、内部バーコード(iBAR)を有するガイドRNAセットを使用する遺伝子スクリーニングのための組成物および方法を提供する。ガイドRNAは、特定のゲノム遺伝子座を標的とし、3つ以上のiBAR配列に関連付けられている。(それぞれが異なるゲノム遺伝子座を標的とする)複数のガイドRNAセットを含むガイドRNAライブラリーをCRISPR/Casベースのスクリーニングで使用して、プールされた細胞ライブラリーの表現型を調節するゲノム遺伝子座を同定することができる。本明細書に記載のスクリーニング方法は、iBAR配列が単一の実験でガイドRNA構築体の各セットに対応する遺伝子編集された複製サンプルの分析を可能にするため、低減した誤検出率(false discovery rate)を有する。誤検出率が低いため、感染多重度(MOI)が高い細胞へのガイドRNAライブラリーのウイルス形質導入による高効率の細胞ライブラリー生成も可能になる。
【0028】
本明細書に記載の実験データは、iBAR法がハイスループットスクリーニングにおいて特に有利であることを示している。従来のCRISPR/Casスクリーニング法は、細胞ライブラリーを生成する際にレンチウイルス形質導入に低い感染多重度(MOI)を必要とし、誤検出率を最小限に抑えるために複数の生物学的複製を必要とするため、多くの場合労働集約的である。対照的に、iBAR法は、偽陽性率と偽陰性率がはるかに低いスクリーニング結果を生成し、高いMOIを使用して細胞ライブラリーを生成できる。たとえば、MOIが0.3と低い従来のCRISPR/Casスクリーニングと比較して、iBAR法は開始細胞数を20倍を超える(たとえばMOIが3)から70倍を超える(たとえば、MOIが10)倍数で減少させながら、高い効率と精度を維持できる。iBARシステムは、細胞の利用できる量が限られた細胞ベースのスクリーニング、または特定の細胞または組織へのウイルス感染を低MOIで制御することが困難なインビボスクリーニングに特に適用できる。
【0029】
本願の一態様では、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列及び内部バーコード(「iBAR」)を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能である。
【0030】
本願の一態様では、sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーが提供され、sgRNAiBAR構築体の各セットは、それぞれsgRNAiBARを含むかまたはコードする3つ以上のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能であり、sgRNAiBAR構築体の各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。
【0031】
さらに、細胞の表現型を調節(modulate)するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体および必要に応じたCas成分の細胞への導入を可能にする条件下で、初期細胞集団をi)複数セットのsgRNAiBAR構築体を含むsgRNAiBARライブラリー(sgRNAiBAR構築体の各セットは、それぞれsgRNAiBARを含むかまたはコードする3つ以上のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能であり、sgRNAiBAR構築体の各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する)、必要に応じて、ii)Cas蛋白質、またはCas蛋白質をコードする核酸を含むCas成分と接触させること、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。
【0032】
定義
本発明を、特定の実施形態を用いて特定の図面を参照して説明するが、本発明は、それに限定されない。特許請求の範囲におけるいずれの図面符号は、範囲を制限するものと解釈されるべきではない。図面では、説明のために、いくつかの要素のサイズは誇張されており、縮尺どおりに描かれていない場合がある。別途定義しない限り、本明細書で使用されるすべての技術および科学用語は、当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書(定義を含む)に準ずる。本明細書に記載されているものと同様または同等の方法および材料を本発明の実施または測定に使用することができるが、好ましい方法および材料を以下に記載する。本明細書で言及されるすべての刊行物、特許出願、特許および他の参考文献は、それらの全体が参照により組み込まれる。本明細書に開示される材料、方法、および実施例は、例示のみであり、限定することを意図するものではない。
【0033】
本明細書で使用される場合、「内部バーコード」または「iBAR」は、分子に挿入または付加されるインデックスを指し、これは、分子の特性および性能を追跡するのに使用できる。iBARは、例えば、本発明によって例示されるように、CRISPR/CasシステムのガイドRNAに挿入または付加される短いヌクレオチド配列であり得る。複数のiBARを使用して、1つの実験内の単一のガイドRNA配列の性能を追跡できるため、実験を繰り返すことなく、統計分析用の複製データを提供できる。
【0034】
「iBAR配列はループ領域に位置される」という表現は、iBAR配列が、ループ領域の任意の2つのヌクレオチドの間に挿入されるか、ループ領域の5’または3’末端に挿入されるか、またはループ領域の1つ以上のヌクレオチドを置き換えることを意味する。
【0035】
「CRISPRシステム」または「CRISPR/Casシステム」は、CRISPR関連(「Cas」)遺伝子の活性の発現および/またはガイドに関与する転写産物およびその他の要素の総称である。例えば、CRISPR/Casシステムは、Cas遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracrメイト配列(tracr-mate sequence)(例えば、内因性CRISPRシステムにおける「直接リピート」及びtracrRNA処理された部分的直接リピートを含む)、ガイド配列(内因性CRISPRシステムでは「スペーサー」とも呼ばれる)、およびCRISPR遺伝子座に由来する他の配列及び転写物を含む。
【0036】
CRISPR複合体の形成の背景において、「標的配列」とは、ガイド配列と相補性を有するように設計されている配列を指し、標的配列とガイド配列との間のハイブリダイゼーションは、CRISPR複合体の形成を促進する。ハイブリダイゼーションを引き起こし、CRISPR複合体の形成を促進するのに十分な相補性があれば、完全な相補性は必ずしも必要ではない。標的配列は、DNAまたはRNAポリヌクレオチドなどの任意のポリヌクレオチドを含んでもよい。CRISPR複合体は、標的配列にハイブリダイズし、1つまたは複数のCasタンパク質と複合体を形成したガイド配列を含んでもよい。
【0037】
「ガイド配列」という用語は、標的ポリヌクレオチドの標的配列に対して部分的または完全な相補性を有し、Casタンパク質によって促進される塩基対形成によって標的配列にハイブリダイズすることができるガイドRNA中のヌクレオチドの連続配列を指す。CRISPR/Cas9システムでは、標的配列はPAM部位に隣接している。PAM配列、およびもう一方の鎖上のその相補配列は、一緒にPAM部位を構成する。
【0038】
「シングルガイドRNA」、「合成ガイドRNA」および「sgRNA」という用語は置き換えて使用でき、ガイド配列、およびsgRNAの機能および/またはsgRNAと1つ以上のCas蛋白質と相互作用してCRISPR複合体を形成するのに必要な任意の他の配列を含むポリヌクレオチド配列を指す。一部の実施形態において、sgRNAは、tracr RNAに由来するtracr配列およびcrRNAに由来するtracrメイト配列を含む第2の配列に融合されたガイド配列を含む。tracr配列は、天然に存在するCRISPR/CasシステムのtracrRNAからの配列の全部または一部を含んでもよい。「ガイド配列」という用語は、標的部位を特定するガイドRNA内のヌクレオチド配列を指し、「ガイド」または「スペーサー」という用語と置き換えて使用できる。「tracrメイト配列」という用語は、「直接リピート」という用語と置き換えて使用できる。本明細書で使用される「sgRNAiBAR」は、iBAR配列を有するシングルガイドRNAを指す
【0039】
「Casタンパク質と協力可能」という用語は、ガイドRNAがCasタンパク質と相互作用してCRISPR複合体を形成できることを意味する。
【0040】
本明細書で使用される場合、「野生型」という用語は、当業者によって理解される当技術分野の用語であり、ミュータントまたはバリアントとは区別される、自然界に存在する生物、菌株、遺伝子または特徴の典型的な形態を意味する。
【0041】
本明細書で使用される場合、「バリアント」という用語は、自然界で発生するものから逸脱するパターンを有する品質の展示を示すものを意味すると解釈されるべきである。
【0042】
「相補性」は、従来のワトソン-クリック(Watson-Crick)塩基対形成または他の非従来型のいずれかによって、別の核酸配列と水素結合を形成する核酸の能力を指す。パーセント相補性は、第2の核酸配列と水素結合(すなわち、ワトソン-クリック(Watson-Crick)塩基対形成)を形成することができる核酸分子中の残基のパーセンテージを示す(例えば、10のうち5、6、7、8、9、10が50%、60%、70%、80%、90%、及び100%相補的である)。「完全に相補的」とは、核酸配列のすべての連続する残基が、第2の核酸配列における同じ数の連続する残基と水素結合を形成することを意味する。本明細書で使用される「実質的に相補的」とは、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50またはそれ以上のヌクレオチドの領域にわたって、少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%である相補性の程度、または2つの核酸がストリンジェントな条件下でハイブリダイズすることを指す。
【0043】
本明細書で使用される場合、ハイブリダイゼーションの「ストリンジェントな条件」とは、標的配列に対して相補性を有する核酸が主に標的配列とハイブリダイズし、実質的に非標的配列にハイブリダイズしない条件を指す。ストリンジェントな条件は一般に配列に依存し、多くの要因によって異なる。一般に、配列が長いほど、その配列がその標的配列に特異的にハイブリダイズする温度は高くなる。ストリンジェントな条件の非限定的な例は、Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology- Hybridization With Nucleic Acid Probes Part I,Second Chapter “Principles of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N,Yに詳細に記載されている。
【0044】
「ハイブリダイゼーション」とは、1つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合を介して安定化される複合体を形成する反応を指す。水素結合は、ワトソンクリック(Watson-Crick)塩基対形成、フーグスティーン(Hoogstein)結合、またはその他の配列特異的な方法で発生できる。複合体は、デュプレックス構造を形成する二本鎖、多本鎖複合体を形成する3本以上の鎖、単一の自己ハイブリダイズ鎖、またはこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、PCRの開始、または酵素によるポリヌクレオチドの切断など、より広範なプロセスのステップを構成することができる。所定の配列とハイブリダイズすることができる配列は、所定の配列の「相補配列」と呼ばれる。
【0045】
本明細書で使用される「構築体」という用語は、(例えば、DNAまたはRNA)核酸分子を指す。例えば、sgRNAとの関連で使用される場合、構築体とは、sgRNA分子を含む核酸分子またはsgRNAをコードする核酸分子を指す。タンパク質との関連で使用される場合、構築体とは、RNAに転写されるかまたはタンパク質として発現され得るヌクレオチド配列を含む核酸分子を指す。構築体は、構築体が宿主細胞に存在する場合にヌクレオチド配列の転写または発現を可能にする、ヌクレオチド配列に作動可能に連結された必要な調節エレメントを含んでもよい。
【0046】
本明細書で使用される「作動可能に連結された」とは、遺伝子の発現が、それが空間的に連結されている調節エレメント(例えば、プロモーター)の制御下にあることを意味する。調節エレメントは、その制御下にある遺伝子の5’(上流)または3’(下流)に位置することができる。調節エレメント(例えば、プロモーター)と遺伝子との間の距離は、その調節エレメント(例えば、プロモーター)と、それが自然に制御し、調節エレメントが由来する遺伝子との間の距離とほぼ同じであり得る。当技術分野で知られているように、この距離の変動は、調節エレメント(例えば、プロモーター)の機能を失うことなく適応され得る。
【0047】
「ベクター」という用語は、宿主細胞内で増殖され得るクローン化されたポリヌクレオチドまたは複数のポリヌクレオチドを含むように操作され得る核酸分子を説明するために使用される。ベクターには、一本鎖、二本鎖、または部分的に二本鎖である核酸分子;1つ以上の自由端を含み、自由端を含まない(例えば、環状)核酸分子;DNA、RNA、またはその両方を含む核酸分子;および本分野で知られている他の種類のポリヌクレオチドが含まれるが、これらに限定されない。ベクターの1つのタイプは「プラスミド」であり、これは、標準的な分子クローニング技術などによって、追加のDNAセグメントを挿入できる環状の二本鎖DNAループを指す。特定のベクターは、それらが導入された宿主細胞において自律複製することができる(例えば、細菌の複製起点を有する細菌ベクターおよびエピソーム哺乳動物ベクター)。他のベクター(例えば、非エピソマル哺乳動物ベクター)は、宿主細胞への導入後に宿主細胞のゲノムに組み込まれ、それにより、宿主ゲノムと共に複製される。さらに、特定のベクターは、それらが作動可能に連結されている遺伝子の発現を指導することができる。このようなベクターは、本明細書では「発現ベクター」と呼ばれる。組換え発現ベクターは、宿主細胞における核酸の発現に適した形態の本発明の核酸を含むことができ、これは、組換え発現ベクターが、発現のための、発現される核酸配列に作動可能に連結されている宿主細胞に基づいて選択され得る1つ以上の調節エレメントを含むことを意味する。
【0048】
「宿主細胞」とは、ベクターまたは単離されたポリヌクレオチドのレシピエントである可能性がある、またはレシピエントであった細胞を指す。宿主細胞は、原核細胞または真核細胞であってもよい。一部の実施形態において、宿主細胞は、インビトロで培養され、そして本明細書に記載される方法を使用して修飾され得る真核細胞である。「細胞」という用語は、初代被検細胞及びその継代を含む。
【0049】
「感染多重度」または「MOI」は、本明細書では置き換えて使用でき、それらの感染標的(例えば、細胞または生物)に対する製剤(例えば、ファージ、ウイルス、または細菌)の比率を指す。例えば、ウイルス粒子を接種された細胞のグループに言及する場合、感染多重度またはMOIは、ウイルス形質導入中の、ウイルス粒子(例えば、sgRNAライブラリーを含むウイルス粒子)の数と混合物中に存在する標的細胞の数との間の比率である。
【0050】
本明細書で使用される細胞の「表現型」とは、その形態、発達、生化学的または生理学的特性、生物季節学(フェノロジー)、または行動などの、細胞の観察可能な特徴または特性を指す。表現型は、細胞内の遺伝子の発現、環境要因の影響、またはこれら2つの間の相互作用から生じる可能性がある。
【0051】
「含む」という用語が本明細書および特許請求の範囲で使用される場合、それは他の要素またはステップを除外しない。
【0052】
本明細書に記載の本発明の実施形態は、「からなる」および/または「実質的にからなる」実施形態を含むことを理解されたい。
【0053】
本明細書における「約」の値またはパラメータへの言及は、その値またはパラメータ自体の変動を含む(および説明する)。たとえば、「約X」についての説明は、「X」の説明を含む。
【0054】
本明細書で使用される場合、ある値またはパラメータ「ではない」との言及は、一般に、ある値またはパラメータ「以外」のものを意味し、説明する。例えば、この方法が、X型の癌を治療するために使用されないことは、この方法が、X以外の他の種類の癌を治療するために使用されることを意味する。
【0055】
本明細書で使用される「約X~Y」という用語は、「約Xから約Y」と同じ意味を有する。
【0056】
本明細書および添付の特許請求の範囲で使用されるように、単数形「一」、「1つ」、および「この」は、文脈で明らかに他のことが説明されない限り、複数の指示対象を含む。
【0057】
本明細書におけるヌクレオチドの数値範囲を詳しく説明するために、それらの間に介在する各数が明示的に考慮されている。例えば、19~21ntの範囲では、19ntおよび21ntに加えて20ntの数値が考慮され、MOIの範囲では、整数か小数かに関係なく、それらの間にある各数値が明示的に考慮されている。
【0058】
シングルガイドRNAiBARライブラリー
本出願は、内部バーコード(iBAR)を有するガイドRNA(例えば、シングルガイドRNA)を含むガイドRNA構築体およびガイドRNAライブラリーの1つまたは複数のセットを提供する。
【0059】
一態様では、本発明は、CRISPR/CasガイドRNAおよびCRISPR/CasガイドRNAをコードする構築体に関する。各ガイドRNAは、ガイドRNAとCasヌクレアーゼとの間の相互作用を著しく妨害しないガイドRNAの領域に配置されたiBAR配列を含む。複数(例えば、2、3、4、5、6、またはそれ以上)のセットのガイドRNA構築物(ガイドRNA分子およびガイドRNA分子をコードする核酸を含む)が提供され、セット内の各ガイドRNAは、ガイド配列は同じであるが、iBAR配列は異なる。異なるiBAR配列を有するセットの異なるsgRNAiBAR構築体を単一の遺伝子編集およびスクリーニング実験で使用して、複製データを提供することができる。
【0060】
本願の一態様では、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能である。一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(レンチウイルスベクターなど)である。
【0061】
一部の実施形態において、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能である。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムのループ領域、及び/またはステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域、及び/またはステムループ1のループ領域、ステムループ2のループ領域、またはステムループ3のループ領域に挿入される。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えばレンチウイルスベクター)である。
【0062】
一部の実施形態において、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列、第2の配列及びiBAR配列を含むsgRNAiBAR配列を有し、ガイド配列は第2の配列に融合し、第2の配列は、Cas9蛋白質と相互作用するリピート‐アンチ‐リピートステムループを含み、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に位置付け(例えば、挿入)される。各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能である。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えばレンチウイルスベクター)である。
【0063】
一部の実施形態では、ゲノム遺伝子座を標的とするガイド配列と、リピート:アンチリピートデュプレックス(Repeat:Anti-Repeat Duplex)およびテトラループ(tetraloop)をコードするガイドヘアピン(guide hairpain)とを含むCRISPR/CasガイドRNA構築体が提供され、内部バーコード(iBAR)が内部複製(replicate)としてテトラループ(tetraloop)に埋め込まれる。一部の実施形態において、内部バーコード(iBAR)は、A、T、CおよびGヌクレオチドからなる、3ヌクレオチド(「nt」)~20nt(例えば、3nt~18nt、3nt~16nt、3nt~14nt、3nt~12nt、3nt~10nt、3nt~9nt、4nt~8nt、5nt~7nt;好ましくは、3nt、4nt、5nt、6nt、7nt)配列を含む。一部の実施形態において、ガイド配列は、長さが17~23、18~22、19~21ヌクレオチドであり、ヘアピン配列は、転写されると、Casヌクレアーゼに結合することができる。一部の実施形態において、CRISPR/CasガイドRNA構築体は、ステムループ1、ステムループ2および/またはステムループ3をコードする配列をさらに含む。一部の実施形態では、ガイド配列は、真核細胞のゲノム遺伝子を標的とし、好ましくは、真核細胞は哺乳動物細胞である。一部の実施形態において、CRISPR/CasガイドRNA構築体は、ウイルスベクターまたはプラスミドである。
【0064】
一部の実施形態では、本明細書に記載のsgRNAiBAR構築体の複数のセットのいずれか1つを含むsgRNAiBARライブラリーが提供され、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。一部の実施形態では、sgRNAiBARライブラリーは、少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2セットのsgRNAiBAR構築体のiBAR配列が同じである。一部の実施形態では、sgRNAiBAR構築体のすべてのセットのiBAR配列は同じである。
【0065】
一部の実施形態では、sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーが提供され、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、前記3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えばレンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーは、少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2セットのsgRNAiBAR構築体のiBAR配列が同じである。
【0066】
一部の実施形態において、sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーが提供され、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、前記3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムのループ領域、及び/またはステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域、及び/またはステムループ1のループ領域、ステムループ2のループ領域、またはステムループ3のループ領域に挿入される。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えばレンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーは、少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2セットのsgRNAiBAR構築体のiBAR配列が同じである。
【0067】
一部の実施形態において、sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーが提供され、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含むsgRNAiBAR構築体のセットが提供され、各sgRNAiBARは、ガイド配列、第2の配列及びiBAR配列を含むsgRNAiBAR配列を有し、ガイド配列は第2の配列に融合し、第2の配列は、Cas9蛋白質と相互作用するリピート‐アンチ‐リピートステムループを含み、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に位置付け(例えば、挿入)される。各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(レンチウイルスベクターなど)である。一部の実施形態では、sgRNAiBARライブラリーは、少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2セットのsgRNAiBAR構築体のiBAR配列が同じである。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。
【0068】
さらに、本明細書に記載のsgRNAiBAR構築体、sgRNAiBAR構築体のセットまたはライブラリーのいずれか1つによってコードされるsgRNA分子も提供される。また、sgRNAiBAR構築体、sgRNAiBAR分子、sgRNAiBARセットまたはライブラリーのいずれか1つを含む組成物及びキットが提供される。
【0069】
一部の実施形態では、本明細書に記載のsgRNAiBAR構築体、sgRNAiBAR分子、sgRNAiBARセットまたはライブラリーのいずれか1つを含む単離された宿主細胞が提供される。一部の実施形態では、各宿主細胞が、本明細書に記載のsgRNAiBARライブラリーからの1つ以上のsgRNAiBAR構築体を含む、宿主細胞ライブラリーは提供される。一部の実施形態では、宿主細胞は、sgRNAiBAR構築体と協力可能なCas蛋白質などの、CRISPR/Casシステムの1つ以上の成分を含むまたは発現する。一部の実施形態では、Cas蛋白質はCas9ヌクレアーゼである。
【0070】
sgRNAiBAR構築体の複数のセットを含むsgRNAiBARライブラリーを調製する方法が本明細書にも提供され、各セットは、異なる標的ゲノム遺伝子座に相補的な複数のガイド配列の1つに対応し、前記方法は、a)各ガイド配列に対して3つ以上のsgRNAiBAR構築体を設計すること、及びb)各sgRNAiBAR構築体を合成し、それによってsgRNAiBARライブラリーを生成することを含み、a)において、各sgRNAiBAR構築体は、対応するガイド配列及びiBAR配列を含むsgRNAiBAR配列を有するsgRNAiBARを含むかまたはコードし、ここで、3つ以上のsgRNAiBAR構築体のそれぞれに対応するiBAR配列は互いに異なり、各sgRNAiBARは、対応する標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能である。一部の実施形態では、その方法は、複数のガイド配列を設計することをさらに含む。
【0071】
iBAR配列
sgRNAiBAR構築体のセットは、それぞれが異なるiBAR配列を持つ3つ以上のsgRNAiBAR構築体を含む。一部の実施形態において、sgRNAiBAR構築体のセットは、それぞれが異なるiBAR配列を有する3つのsgRNAiBAR構築体を含む。一部の実施形態において、sgRNAiBAR構築体のセットは、それぞれが異なるiBAR配列を有する4つのsgRNAiBAR構築体を含む。一部の実施形態において、sgRNAiBAR構築体のセットは、それぞれが異なるiBAR配列を有する5つのsgRNAiBAR構築体を含む。一部の実施形態において、sgRNAiBAR構築体のセットは、それぞれが異なるiBAR配列を有する6つ以上のsgRNAiBAR構築体を含む。
【0072】
iBAR配列は、任意の適切な長さを有することができる。一部の実施形態において、各iBAR配列は、長さが約1~20ヌクレオチド(「nt」)、例えば、約2nt~20nt、3nt~18nt、3nt~16nt、3nt~14nt、3nt~12nt、3nt~10nt、3nt~9nt、4nt~8nt、5nt~7ntのいずれか1つである。一部の実施形態では、各iBAR配列の長さは、約3nt、4nt、5nt、6nt、または7ntである。一部の実施形態において、各sgRNAiBAR構築体中のiBAR配列は、同じ長さを有する。一部の実施形態において、異なるsgRNAiBAR構築体のiBAR配列は、異なる長さを有する。
【0073】
iBAR配列は、任意の適切な配列を持つことができる。一部の実施形態では、iBAR配列は、A、T、CおよびGヌクレオチドからなるDNA配列である。一部の実施形態において、iBAR配列は、A、U、CおよびGヌクレオチドからなるRNA配列である。一部の実施形態では、iBAR配列は、A、T/U、CおよびG以外の非従来型または修飾されたヌクレオチドを有する。一部の実施形態では、各iBAR配列は、A、T、CおよびGヌクレオチドからなる6ヌクレオチド長である。
【0074】
一部の実施形態において、ライブラリー中のsgRNAiBAR構築体の各セットに関連するiBAR配列のセットは、互いに異なる。一部の実施形態において、ライブラリー中の少なくとも2セットのsgRNAiBAR構築体のiBAR配列は同じである。一部の実施形態において、同じセットのiBAR配列が、ライブラリー内のsgRNAiBAR構築体の各セットに使用される。sgRNAiBAR構築体のセットごとに異なるiBARセットを設計する必要はない。iBARの固定セットは、ライブラリー内のsgRNAiBAR構築体のすべてのセットに使用できる。または、複数のiBAR配列を、ライブラリー内のsgRNAiBAR構築体の異なるセットにランダムに割り当てることができる。能率化された分析ツール(iBAR)を使用したiBARストラテジーにより、さまざまな環境での生物医学的発見のための大規模なCRISPR/Casスクリーニングが促進される。
【0075】
iBAR配列は、Casヌクレアーゼ(例えば、Cas9)をその標的部位に誘導する際のgRNAの効率に影響を及ぼさないガイドRNA内の任意の適切な領域に配置(挿入を含む)することができる。iBAR配列は、sgRNAの3’末端または内部に位置できる。例えば、sgRNAは、CRISPR複合体におけるCasヌクレアーゼと相互作用する様々なステムループを含み得、iBAR配列は、いずれかのステムループのループ領域内に埋め込まれ得る。一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。
【0076】
例えば、CRISPR/Cas9システムのガイドRNAは、ゲノム遺伝子座を標的とするガイド配列、およびリピート:アンチリピートデュプレックス(Repeat:Anti-Repeat Duplex)およびテトラループ(tetraloop)をコードするガイドヘアピン配列を含み得る。一部の実施形態では、内部バーコード(iBAR)は、内部複製としてテトラループに配置される(挿入されることを含む)。内因性CRISPR/Cas9システムのコンテキストでは、crRNAはトランス活性化crRNA(tracrRNA)とハイブリダイズして、crRNA:tracrRNA二重鎖を形成する。これは、Cas9にロードされ、適切なプロトスペーサー隣接モチーフ(PAM)を持つ相同DNA配列の切断を指示する。内因性crRNA配列はガイド(20nt)領域とリピート(12nt)領域に分けられるが、内因性tracrRNA配列はアンチリピート(14nt)と3つのtracrRNAステムループに分けられる。一部の実施形態において、sgRNAは、標的DNAに結合して、ガイド:標的ヘテロ二本鎖、リピート:アンチリピートデュプレックス、およびステムループ1~3を含むT字型構造を形成する。一部の実施形態では、リピートおよびアンチリピート部分はテトラループによって接続され、リピートおよびアンチリピートはリピート:アンチリピートデュプレックスを形成し、単一ヌクレオチド(A51)によってステムループ1と接続され、ステムループ1および2は、5ntの一本鎖リンカー(ヌクレオチド63~67)によって接続される。一部の実施形態では、ガイド配列(ヌクレオチド1~20)および標的DNA(ヌクレオチド10~200)は、20個のワトソン-クリック(Watson-Crick)塩基対を介してガイド:標的ヘテロデュプレックスを形成し、リピート(ヌクレオチド21~32)およびアンチリピート(ヌクレオチド37~50)は、9つのワトソン-クリック(Watson-Crick)塩基対を介してリピート:アンチリピートデュプレックス(U22:A49~A26:U45及びG29:C40~A32:U37)を形成する。一部の実施形態において、tracrRNAテール(ヌクレオチド68~81および82~96)は、4つおよび6つのワトソン-クリック塩基対を介してステムループ2および3(A69:U80~U72:A77およびG82:C96~G87:C91)を形成する。本明細書は、例示的なCRISPR/Cas9システムの結晶構造を説明し(Nishimasu H、et al.、ガイドRNAおよび標的DNAと複合体を形成したcas9の結晶構造、Cell.2014;156:935-949)、参考としてその全体が本出願に取り込まれる。
【0077】
一部の実施形態において、該iBAR配列は、sgRNAのリピート:アンチリピートステームループのテトラループまたはループ領域に位置する。一部の実施形態において、iBAR配列は、sgRNAのリピート:アンチリピートステームループのテトラループまたはループ領域に挿入される。Cas9 sgRNAスキャフォールドのテトラループは、Cas9-sgRNAリボ核タンパク質複合体の外側にあり、上流のガイド配列の活性に影響を与えることなく、さまざまな目的で変更されている(非特許文献9,12)。本出願の発明者は、sgRNAの遺伝子編集効率に影響を与えたり、オフターゲット効果を増加させたりすることなく、6-nt長のiBAR(iBAR6)を典型的なCas9 sgRNAスキャフォールドのテトラループに埋め込むことができることを証明した。
【0078】
例示的なiBAR
6は4,096のバーコードの組み合わせを生み出し、これはハイスループットスクリーニングに十分な変化を提供する(
図1A)。これらの余分なiBAR配列の挿入がgRNA活性に影響を与えるかどうかを確認するために、4,096個のiBAR
6配列のそれぞれと組み合わせて炭疽菌毒素受容体遺伝子ANTXR113を標的とする所定のsgRNAのライブラリーを構築した。このsgRNA
iBAR-ANTXR1ライブラリーは、低いMOI(0.3)でレンチウイルスによる形質導入を介してCas9を絶えずに発現するHeLa細胞に導入された(非特許文献6,7)。PA/LFnDTA毒素の処理と濃縮を3回行った後、以前に報告されたように、sgRNA及び毒素耐性細胞からのiBAR
6配列をNGS分析で測定した(非特許文献6)。バーコードのないsgRNA
iBAR-ANTXR1およびsgRNA
ANTXR1の大部分は有意に濃縮されたが、ほとんどすべての非ターゲティング対照sgRNAは耐性細胞集団に存在しなかった。重要なことに、異なるiBAR
6を有するsgRNA
iBAR-ANTXR1の濃縮レベルは、2つの生物学的複製間でランダムであるように見えた(
図1B)。iBAR
6の各位置でのヌクレオチド頻度を計算した後、どちらの複製からも配列偏差は観察されなかった(
図1C)。さらに、iBAR
6のGC含量はsgRNAの切断効率に影響を与えていないようであった(
図2)。
【0079】
ガイド配列
ガイド配列は標的配列とハイブリダイズし、CRISPR複合体の標的配列への配列特異的結合をガイドする。一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、適切なアラインメントアルゴリズムを使用して最適にアラインメントされた場合、約75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%またはそれ以上である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して決定することができ、その非限定的な例には、Smith-Watermanアルゴリズム、Needleman-Wimschアルゴリズム、Burrows-Wheeler変換に基づくアルゴリズムが含まれる。特定の実施形態において、ガイド配列の長さは、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30またはそれ以上のヌクレオチドである。CRISPR複合体の標的配列への配列特異的結合をガイドするガイド配列の能力は、任意の適切なアッセイによって評価することができる。例えば、CRISPR複合体を形成するのに十分なCRISPRシステムの成分(シーケンシングされるガイド配列を含む)は、CRISPR配列の成分をコードするベクターでのトランスフェクション、続いて標的配列内の優先的切断の評価などによって、対応する標的配列を有する宿主細胞に提供され得る。同様に、標的配列、CRISPR複合体の成分(シーケンシングされるガイド配列を含む)、及び試験されるガイド配列とは異なる対照ガイド配列を提供し、結合または切断率(試験と対照ガイド配列反応の間の標的配列で)を比較することによって、標的ポリヌクレオチド配列の切断をチューブ内で評価することができる。
【0080】
一部の実施形態では、ガイド配列は、最短で約10ヌクレオチド、最長で約30ヌクレオチドであり得る。一部の実施形態において、ガイド配列は、15、16、17、18、19、20、21、22、23または24ヌクレオチド長のいずれか1つである。合成ガイド配列は約20ヌクレオチド長であってもよいが、より長くまたはより短くなってもよい。例として、CRISPR/Cas9システムのガイド配列は、標的配列に相補的な20ヌクレオチドからなってもよい。すなわち、ガイド配列は、(DNAとRNAのA/Uの違いを除いて)PAM配列の上流の20ヌクレオチドと同一であってもよい。
【0081】
sgRNAiBAR構築体のガイド配列は、当技術分野で知られている任意の方法に従って設計することができる。ガイド配列は、エキソンまたはスプライシング部位、目的の遺伝子の5’非翻訳領域(UTR)または3’非翻訳領域(UTR)などのコード領域を標的とすることができる。例えば、遺伝子のリーディングフレームは、ガイドRNAの標的部位での二本鎖切断(DSB)によって媒介される欠失によって破壊される可能性がある。あるいは、コード配列の5’末端を標的とするガイドRNAを使用して、高効率で遺伝子ノックアウトを生成することもできる。ガイド配列は、高いオンターゲット遺伝子編集活性および低いオフターゲット効果のための特定の配列特徴に従って設計および最適化することができる。例えば、ガイド配列のGC含有量は、20%~70%の範囲にあり得、ホモポリマーセグメント(例えば、TTTT、GGGG)を含む配列は回避され得る。
【0082】
ガイド配列は、目的のゲノム遺伝子座を標的とするように設計することができる。一部の実施形態において、ガイド配列は、哺乳動物細胞などの真核細胞のゲノム遺伝子座を標的とする。一部の実施形態において、ガイド配列は、植物細胞のゲノム遺伝子座を標的とする。一部の実施形態において、ガイド配列は、細菌細胞または古細菌細胞のゲノム遺伝子座を標的とする。一部の実施形態において、ガイド配列は、タンパク質をコードする遺伝子を標的とする。一部の実施形態において、ガイド配列は、スモールRNA(例えば、microRNA、piRNA、siRNA、snoRNA、tRNA、rRNAおよびsnRNA)、リボソームRNA、または長鎖非コーディングRNA(lincRNA)などのRNAをコードする遺伝子を標的とする。一部の実施形態では、ガイド配列は、ゲノムの非コード領域を標的とする。一部の実施形態では、ガイド配列は染色体遺伝子座を標的とする。一部の実施形態において、ガイド配列は、染色体外遺伝子座を標的とする。一部の実施形態において、ガイド配列は、ミトコンドリアまたは葉緑体遺伝子を標的とする。
【0083】
一部の実施形態において、ガイド配列は、目的の任意の標的遺伝子の発現を抑制または活性化するように設計されている。標的遺伝子は、内因性遺伝子または導入遺伝子であってもよい。一部の実施形態において、標的遺伝子は、特定の表現型に関連すると考えられてもよい。一部の実施形態において、標的遺伝子は、特定の表現型に関連するとは思わない既知の遺伝子または特徴付けられていない未知の遺伝子など、特定の表現型に関与していない遺伝子である。一部の実施形態において、標的領域は、標的遺伝子として異なる染色体上に位置する。
【0084】
その他のsgRNAコンポーネント
sgRNAiBARは、Casタンパク質とのCRISPR複合体の形成を促進する追加の配列エレメントを含む。一部の実施形態において、sgRNAiBARは、リピート‐アンチ‐リピートステムループを含む第2の配列を含む。リピート‐アンチ‐リピートステムループは、ループ領域を介してtracrメイト配列に相補的であるtracr配列に融合されたtracrメイト配列を含む。
【0085】
通常、内因性CRISPR/Cas9システムの背景では、CRISPR複合体(標的配列にハイブリダイズし、1つまたは複数のCasタンパク質と複合体を形成したガイド配列を含む)の形成により、標的配列にまたはその近く(例えば、1、2、3、4、5、6、7、8、9、10、20、50、またはそれ以上の塩基対内)の1つまたは2つの鎖が切断される。野生型tracr配列の全部または一部を含むか、またはそれらからなることができる(例えば、野生型tracr配列の約20、26、32、45、48、54、63、67、85、またはそれ以上のヌクレオチド)tracr配列は、(ガイド配列に作動可能に連結されている)tracrメイト配列の全部または一部へのtracr配列の少なくとも一部のハイブリダイゼーションなどによって、CRISPR複合体の一部を形成することもできる。一部の実施形態において、tracr配列は、ハイブリダイズしてCRISPR複合体の形成に関与するように、tracrメイト配列に対して十分な相補性を有する。標的配列と同様に、機能するのに十分であれば、完全な相補性は必要ないと考えられている。一部の実施形態において、tracr配列は、最適にアラインメントされた場合、tracrメイト配列の長さに沿って少なくとも50%、60%、70%、80%、90%、95%または99%の配列相補性を有する。最適なアラインメントを決定することは、当業者の能力範囲内である。たとえば、ClustalW、Smith-Waterman in Matlab、Bowtie、Geneious、Biopython、SeqManなど(これらに限定されない)、公的および市販のアラインメントアルゴリズムとプログラムがある。一部の実施形態において、tracr配列は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、またはそれ以上のヌクレオチドの長さである。US8697359に記載されているS.pyogenes CRISPR/Cas9システムからのtracrメイト配列およびtracr配列および本明細書に記載されているものなど、天然に存在するCRISPRシステムに由来する既知のtracrメイト配列およびtracr配列のいずれか1つを使用することができる。
【0086】
一部の実施形態では、tracr配列およびtracrメイト配列は、単一の転写物内に含まれ、その結果、両者の間のハイブリダイゼーションは、「リピート‐アンチ‐リピートステムループ(repeat-anti-repeat stem loop)」と呼ばれるステムループ(ヘアピンとも呼ばれる)などの二次構造を有する転写物を生成する。
【0087】
一部の実施形態において、iBAR配列を有さないsgRNA構築体におけるステムループのループ領域は、長さが4ヌクレオチドであり、そのようなループ領域は、「テトラループ(tetraloop)」とも呼ばれる。一部の実施形態では、ループ領域は、配列GAAAを有する。しかしながら、より長いまたはより短いループ配列を使用することができ、また、ヌクレオチドトリプレット(例えば、AAA)および別のヌクレオチド(例えば、CまたはG)を含む配列などの代替配列を使用することもできる。一部の実施形態では、ループ領域の配列は、CAAAまたはAAAGである。一部の実施例では、iBARは、テトラループなどのループ領域に配置されている。一部の実施形態では、iBARは、テトラループなどのループ領域に挿入される。例えば、iBAR配列は、第1のヌクレオチドの前、第1のヌクレオチドと第2のヌクレオチドの間、第2のヌクレオチドと第3のヌクレオチドの間、第3のヌクレオチドと第4のヌクレオチドの間、またはテトラループにおいて第4のヌクレオチドの後に挿入されてもよい。一部の実施形態では、iBAR配列は、ループ領域内の1つまたは複数のヌクレオチドを置き換える。
【0088】
一部の実施形態において、sgRNAiBARは、少なくとも2つ以上のステムループを含む。一部の実施形態において、sgRNAiBARは、2つ、3つ、4つ、または5つのステムループを有する。一部の実施形態では、sgRNAiBARは、多くとも5つのヘアピンを有する。一部の実施形態において、sgRNAiBAR構築体は、ポリT配列、例えば、6つのTヌクレオチドなどの転写終止配列をさらに含む。
【0089】
Casタンパク質がCas9である一部の実施形態において、各sgRNAiBARは、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む第2の配列に融合されたガイド配列を含む。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に配置される。一部の実施形態では、iBAR配列はリピート‐アンチ‐リピートステムループのループ領域に挿入される。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域内の1つまたは複数のヌクレオチドを置き換える。一部の実施形態では、各sgRNAiBARの第2の配列は、ステムループ1、ステムループ2、および/またはステムループ3をさらに含む。一部の実施形態では、iBAR配列は、ステムループ1のループ領域に配置される。一部の実施形態では、iBAR配列はステムループ1のループ領域に挿入される。一部の実施形態では、iBAR配列は、ステムループ1のループ領域内の1つまたは複数のヌクレオチドを置き換える。一部の実施形態では、iBAR配列は、ステムループ2のループ領域に配置される。一部の実施形態では、iBAR配列はステムループ2のループ領域に挿入される。一部の実施形態では、iBAR配列は、ステムループ2のループ領域内の1つまたは複数のヌクレオチドを置き換える。一部の実施形態では、iBAR配列は、ステムループ3のループ領域に配置される。一部の実施形態では、iBAR配列はステムループ3のループ領域に挿入される。一部の実施形態では、iBAR配列は、ステムループ3のループ領域内の1つまたは複数のヌクレオチドを置き換える。
【0090】
一部の実施形態において、各sgRNAiBAR配列は、第1のステム配列および第2のステム配列を含み、第1のステム配列は、第2のステム配列とハイブリダイズして、Casタンパク質と相互作用する二本鎖RNA領域を形成し、ここで、iBAR配列は、第1のステム配列と第2のステム配列との間に配置される。一部の実施形態において、各sgRNAiBARは、5'から3'方向に第1のステム配列および第2のステム配列を含み、第1のステム配列は第2のステム配列とハイブリダイズして、Casタンパク質と相互作用する二本鎖RNA領域を形成し、ここで、iBAR配列は、第1のステム配列の3'末端と第2のステム配列の5'末端との間に配置されている。
【0091】
CRISPR/Cas9システムでは、ガイドRNAを使用して、Cas9ヌクレアーゼによるゲノムDNAの切断をガイドできる。例えば、ガイドRNAは、CRISPR/Casシステムヌクレアーゼを配列特異的な方法でゲノム位置に標的化する可変配列のヌクレオチドスペーサー(ガイド配列)から構成でき、しかもヘアピン配列(異なるガイドRNAにおいて恒常不変である)は、CasヌクレアーゼへのガイドRNAの結合を可能にする。一部の実施形態において、宿主細胞における標的ゲノム配列に相同または相補的であるCRISPR/Cas可変ガイド配列および転写されたときにCasヌクレアーゼ(例えば、Cas9)に結合可能な不変のヘアピン配列を含むCRISPR/CasガイドRNAが提供される。ここで、ヘアピン配列は、リピート:アンチリピートデュプレックスおよびテトラループをコードし、内部バーコード(iBAR)がテトラループ領域に埋め込まれている。
【0092】
CRISPR/Cas9ガイドRNAのガイド配列は、長さが約17~23、18~22、19~21ヌクレオチドであってもよい。ガイド配列は、Casヌクレアーゼを配列特異的な方法でゲノム遺伝子座に標的化することができ、当技術分野で知られている一般的な原理に従って設計することができる。不変ガイドRNAヘアピン配列は、例えば、Nishimasuらによって開示されているように(Nishimasu H,et al. Calco structure of cas9 in complex with guide RNA and target DNA. Cell. 2009;156:935-949)、当技術分野の一般的な知識に従って提供することができる。本出願はまた、不変ガイドRNAヘアピン配列の例を提供するが、本発明はそれに限定されず、転写されるとCasヌクレアーゼに結合することができる限り、他の不変ヘアピン配列を使用できることを理解されたい。
【0093】
以前の研究では、48-nt tracrRNAテールを持つsgRNA(sgRNA(+48)と呼ばれる)が最小領域であるにもかかわらず、Cas9が触媒するインビトロでのDNA切断では(Jinek et al.,2012)、延長したtracrRNAテール、sgRNA(+67)及びsgRNA(+85)は、インビボでのCas9切断活性を改善することができる(Hsu et al.,2013)。一部の実施形態において、sgRNAiBARは、ステムループ1、ステムループ2および/またはステムループ3を含む。ステムループ1、ステムループ2および/またはステムループ3領域は、CRISPR/Cas9システムにおける編集効率を高めることができる。
【0094】
Cas蛋白質
本明細書に記載のsgRNAiBAR構築体は、当技術分野で知られている天然に存在するまたは操作されたCRISPR/Casシステムのいずれか1つと協力するように設計することができる。一部の実施形態において、sgRNAiBAR構築体は、タイプI CRISPR/Casシステムと協力可能である。一部の実施形態において、sgRNAiBAR構築体は、タイプII CRISPR/Casシステムと協力可能である。一部の実施形態において、sgRNAiBAR構築体は、タイプIII CRISPR/Casシステムと協力可能である。 例示的なCRISPR/Casシステムは、国際公開第2013/176772、国際公開第2014/065596、国際公開第2014/018423、国際公開第2016/011080、米国特許第8697359号明細書、米国特許第8932814号明細書、米国特許第10113167号明細書B2に見出すことができ、それらの開示内容は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
【0095】
特定の実施形態において、sgRNAiBAR構築体は、RNAによってガイドされるポリヌクレオチド結合および/またはヌクレアーゼ活性を有する、CRISPR/CasタイプI、タイプII、またはタイプIIIシステムに由来するCasタンパク質と協力可能である。そのようなCasタンパク質の例は、例えば、国際公開第2014/144761、国際公開第2014/144592、国際公開第2013/176772、米国特許出願公開第2014/0273226号明細書、および米国特許出願公開第2014/0273233号明細書に記載されており、これらは、参照によりその全体が本明細書に組み込まれる。
【0096】
特定の実施形態では、Casタンパク質は、タイプII CRISPR-Casシステムに由来する。特定の実施形態において、Casタンパク質は、Cas9タンパク質であるか、またはCas9タンパク質に由来する。特定の実施形態において、Casタンパク質は、国際公開第2014/144761で同定されたものを含む、Cas9タンパク質であるか、または細菌のCas9タンパク質に由来する。
【0097】
一部の実施形態において、sgRNAiBAR構築体は、Cas9(Csn1およびCsx12とも呼ばれる)は、そのホモログ、またはその修飾バージョンと協力可能である。一部の実施形態において、sgRNAiBAR構築体は、2つ以上のCasタンパク質と協力可能である。一部の実施形態では、sgRNAiBAR構築体は、化膿レンサ球菌または肺炎連鎖球菌由来のCas9タンパク質と協力可能である。Cas酵素は当技術分野で既知のものである。たとえば、化膿レンサ球菌Cas9タンパク質のアミノ酸配列は、SwissProtデータベースにおいて登録番号Q99ZW2で見つけることができる。
【0098】
Casタンパク質(本明細書では「Casヌクレアーゼ」とも呼ばれる)は、標的結合、標的ニッキングまたは切断活性などの所望の活性を提供する。特定の実施形態において、所望の活性は、標的結合である。特定の実施形態では、所望の活性は、標的のニッキングまたは標的の切断である。特定の実施形態において、所望の活性はまた、Casタンパク質またはヌクレアーゼ欠損Casタンパク質に共有結合的に融合されるポリペプチドによって提供される機能を含む。そのような所望の活性の例には、転写調節活性(活性化または抑制)、後成的(エピジェネティック)修飾活性、または標的の視覚化/同定活性が含まれる。
【0099】
一部の実施形態において、sgRNAiBAR構築体は、二本鎖切断および一本鎖切断を含む標的配列を切断するCasヌクレアーゼと協力可能である。一部の実施形態では、sgRNAiBAR構築体は、触媒的に不活性なCas(「dCas」)と協力可能である。一部の実施形態において、sgRNAiBAR構築体は、CRISPR活性化(「CRISPRa」)システムのdCasと協力可能であり、ここで、dCasは、転写活性化因子に融合されている。一部の実施形態では、sgRNAiBAR構築体は、CRISPR干渉(CRISPRi)システムのdCasと協力可能である。一部の実施形態では、dCasは、KRABドメインなどのリプレッサードメインに融合されている。
【0100】
特定の実施形態において、Casタンパク質は、野生型Casタンパク質(Cas9など)またはそのフラグメントの変異体である。Cas9タンパク質は一般に少なくとも2つのヌクレアーゼ(例えば、DNase)ドメインを持っている。たとえば、Cas9タンパク質はRuvC様ヌクレアーゼドメインとHNH様ヌクレアーゼドメインを持つことができる。RuvCドメインとHNHドメインは共同作用して、標的部位における2つの鎖を切断し、標的ポリヌクレオチドに二本鎖切断を生じさせる(Jinek et al.,Science 337:816-21)。特定の実施形態において、変異体Cas9タンパク質は、1つの機能的ヌクレアーゼドメイン(RuvC様またはHNH様ヌクレアーゼドメイン)のみを含むように修飾される。例えば、特定の実施形態において、突然変異体Cas9タンパク質は、ヌクレアーゼドメインの1つが機能しないように(すなわち、ヌクレアーゼ活性が存在しないように)欠失または変異されるように修飾される。ヌクレアーゼドメインの1つが不活性である一部の実施形態において、変異体は、二本鎖ポリヌクレオチド(そのようなタンパク質は「ニッカーゼ」と呼ばれる)にニックを導入することができるが、二本鎖ポリヌクレオチドを切断することはできない。特定の実施形態において、Casタンパク質は、核酸結合親和性および/または特異性を増加させ、酵素活性を変化させ、および/またはタンパク質の別の特性を変化させるように修飾される。特定の実施形態において、Casタンパク質は、エフェクタードメインの活性を最適化するために切り詰められるかまたは修飾される。特定の実施形態において、RuvC様ヌクレアーゼドメインおよびHNH様ヌクレアーゼドメインは、変異体Cas9タンパク質が標的ポリヌクレオチドをニックまたは切断することができないように修飾または排除される。特定の実施形態において、野生型対応物と比較していくつかまたはすべてのヌクレアーゼ活性を欠くCas9タンパク質は、それにもかかわらず、多少標的認識活性を維持する。
【0101】
特定の実施形態において、Casタンパク質は、別のポリペプチドまたはエフェクタードメインに融合された天然に存在するCasまたはその変異体を含む融合タンパク質である。別のポリペプチドまたはエフェクタードメインは、例えば、切断ドメイン、転写活性化ドメイン、転写リプレッサードメイン、または後成的修飾ドメインであってもよい。特定の実施形態において、融合タンパク質は、修飾または変異されたCasタンパク質を含み、ここで、すべてのヌクレアーゼドメインが不活性化または欠失されている。特定の実施形態において、Casタンパク質のRuvCおよび/またはHNHドメインは、それらがもはやヌクレアーゼ活性を有さないように修飾または変異されている。
【0102】
特定の実施形態において、融合タンパク質のエフェクタードメインは、所望の特性を有する任意のエンドヌクレアーゼまたはエキソヌクレアーゼから得られる切断ドメインである。
【0103】
特定の実施形態において、融合タンパク質のエフェクタードメインは、転写活性化ドメインである。一般に、転写活性化ドメインは、転写制御エレメントおよび/または転写調節タンパク質(すなわち、転写因子、RNAポリメラーゼなど)と相互作用して、遺伝子の転写を増加および/または活性化する。特定の実施形態において、転写活性化ドメインは、単純ヘルペスウイルスVP16活性化ドメイン、VP64(VP16の四量体誘導体である)、NFxB p65活性化ドメイン、p53活性化ドメイン1および2、CREB(cAMP応答エレメント結合タンパク質)活性化ドメイン、E2A活性化ドメイン、またはNFAT(活性化T細胞の核因子)活性化ドメインである。特定の実施形態において、転写活性化ドメインは、Gal4、Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4、またはLeu3である。転写活性化ドメインは、元の転写活性化ドメインの野生型、もしくは修飾または短縮バージョンであってもよい。
【0104】
特定の実施形態において、融合タンパク質のエフェクタードメインは、例えば、誘導性cAMP初期リプレッサー(ICER)ドメイン、クルッペル(Kruppel)関連ボックスA(KRAB-A)リプレッサードメイン、YY1グリシンに富んだリプレッサードメイン、Sp1様リプレッサー、E(spI)リプレッサー、I.kappa.Bリプレッサー、またはMeCP2などの転写リプレッサードメインである。
【0105】
特定の実施形態において、融合タンパク質のエフェクタードメインは、ヒストンアセチルトランスフェラーゼドメイン、ヒストンデアセチラーゼドメイン、ヒストンメチルトランスフェラーゼドメイン、ヒストンデメチラーゼドメイン、DNAメチルトランスフェラーゼドメイン、またはDNAデメチラーゼドメインなどの、ヒストン構造および/または染色体構造を修飾することによって遺伝子発現を変化させるエピジェネティック修飾ドメインである。
【0106】
特定の実施形態において、Casタンパク質は、核局在化シグナル(NLS)、細胞透過性または転座ドメイン、およびマーカードメイン(例えば、蛍光タンパク質マーカー)などの少なくとも1つの別のドメインをさらに含む。
【0107】
ベクター
一部の実施形態において、sgRNAiBAR構築体は、ガイドRNA配列およびiBAR配列に作動可能に連結された1つ以上の調節エレメントを含む。例示的な調節エレメントには、プロモーター、エンハンサー、内部リボソーム進入部位(IRES)、および他の発現制御エレメント(例えば、ポリアデニル化シグナルおよびポリU配列などの転写終止シグナル)が含まれるが、これらに限定されない。そのような調節エレメントは、例えば、Goeddel、GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif(1990)に記載されている。調節エレメントには、多くの種類の宿主細胞でヌクレオチド配列の構成的発現を指示するもの、および特定の宿主細胞でのみヌクレオチド配列の発現を指示するもの(例えば、組織特異的調節配列)が含まれる。
【0108】
sgRNAiBAR構築体はベクターに存在することができる。一部の実施形態において、sgRNAiBAR構築体は、ウイルスベクターまたはプラスミドなどの発現ベクターである。発現ベクターの設計は、形質転換される宿主細胞の選択、所望の発現レベルなどのような要因によられることを当業者が理解するであろう。一部の実施形態において、sgRNAiBAR構築体は、レンチウイルスベクターである。一部の実施形態において、sgRNAiBAR構築体は、アデノウイルスまたはアデノ随伴ウイルスである。一部の実施形態において、ベクターは、選択マーカーをさらに含む。一部の実施形態において、ベクターは、Casヌクレアーゼ(例えば、Cas9)をコードするヌクレオチド配列などの、CRISPR/Casシステムの1つ以上のエレメントをコードする1つ以上のヌクレオチド配列をさらに含む。一部の実施形態において、CRISPR/Casシステムの1つ以上のエレメントをコードするヌクレオチド配列をコードする1つ以上のベクターと、本明細書に記載のsgRNAiBAR構築体のいずれか1つを含むベクターとを含むベクターシステムが提供される。ベクターは、複製起点、目的のポリペプチドの発現を調節する1つ以上の調節配列(例えば、プロモーターおよび/またはエンハンサーなど)、および/または1つ以上のより選択可能なマーカー遺伝子(例えば、抗生物質耐性遺伝子、および蛍光タンパク質をコードする遺伝子など)からなる群より選ばれる1つ以上のエレメントを含んでもよい。
【0109】
ライブラリー
本明細書に記載のsgRNAiBARライブラリーは、遺伝子スクリーニングの必要性に従って、複数のゲノム遺伝子座を標的とするように設計することができる。一部の実施形態において、sgRNAiBAR構築体の単一のセットは、各目的の遺伝子を標的とするように設計されている。一部の実施形態において、目的の単一の遺伝子を標的とする異なるガイド配列を有する複数の(例えば、少なくとも2、4、6、10、20またはそれ以上、例えば4~6)セットのsgRNAiBAR構築体を設計することができる。
【0110】
一部の実施形態において、sgRNAiBARライブラリーは、少なくとも10、20、50、100、200、500、1000、2000、5000、10000、20000、50000、100000、またはそれ以上のセットのsgRNAiBAR構築体を含む。一部の実施形態では、sgRNAiBARライブラリーは、細胞または生物中の少なくとも10、20、50、100、200、500、1000、2000、5000、10000、15000、またはそれ以上の遺伝子を標的とする。一部の実施形態において、sgRNAiBARライブラリーは、タンパク質をコードする遺伝子および/または非コードRNAのゲノムワイドなライブラリーである。一部の実施形態において、sgRNAiBARライブラリーは、シグナル伝達経路において選択された遺伝子または細胞プロセスに関連する遺伝子を標的とする標的化ライブラリーである。一部の実施形態において、sgRNAiBARライブラリーは、特定の調節された表現型に関連するゲノムワイドなスクリーニングのために使用される。一部の実施形態において、sgRNAiBARライブラリーは、特定の調節された表現型に関連する少なくとも1つの標的遺伝子を同定するためのゲノムワイドなスクリーニングのために使用される。一部の実施形態において、sgRNAiBARライブラリーは、哺乳動物ゲノムなどの真核生物ゲノムを標的とするように設計されている。対象となる例示的なゲノムには、げっ歯類(マウス、ラット、ハムスター、モルモット)、飼いならされた動物(例えば、ウシ、ヒツジ、ネコ、イヌ、ウマ、またはウサギ)、非ヒト霊長類(例えば、サル)のゲノム、魚類(例、ゼブラフィッシュ)、無脊椎動物(例、キイロショウジョウバエ(Drosophila melanogaster)および線虫(Caenorhabditis elegans))、およびヒトが含まれる。
【0111】
sgRNAiBARライブラリのガイド配列は、ユーザー定義リスト内で高度な標的特異性を持つCRISPR/Cas標的部位を同定する既知のアルゴリズムを使用して設計できる(ゲノムターゲットスキャン(GT-スキャン);O’Brien et al., Bioinformatics(2014)30:2673-2675を参照)。一部の実施形態では、100,000個のsgRNAiBAR構築体を単一のアレイ上で生成することができ、ヒトゲノム中のすべての遺伝子を包括的にスクリーニングするのに十分な範囲を提供する。このアプローチは、複数のsgRNAiBARライブラリーを並行して合成することにより、ゲノムワイドなスクリーニングを可能にするためにスケールアップすることもできる。sgRNAiBARライブラリー内のsgRNAiBAR構築体の正確な数は、スクリーニングが1)遺伝子または調節エレメントを標的にするか、2)完全なゲノムをまたはゲノム遺伝子のサブグループを標的とするかによって決められ得る。
【0112】
一部の実施形態において、sgRNAiBARライブラリーは、ゲノム内の遺伝子と重複するすべてのPAM配列を標的とするように設計されており、ここで、PAM配列は、Casタンパク質に対応する。一部の実施形態において、sgRNAiBARライブラリーは、ゲノムに見出されるPAM配列のサブセットを標的とするように設計されており、ここで、PAM配列は、Casタンパク質に対応する。
【0113】
一部の実施形態において、sgRNAiBARライブラリーは、ゲノム内のいかなるゲノム遺伝子座も標的としない1つ以上の対照sgRNAiBAR構築体を含む。一部の実施形態において、推定されたゲノム遺伝子を標的としないsgRNAiBAR構築体は、陰性対照としてsgRNAiBARライブラリーに含まれ得る。
【0114】
本明細書に記載のsgRNAiBAR構築体およびライブラリーは、当技術分野における任意の既知の核酸合成法および/または分子クローニング法を使用して調製することができる。一部の実施形態では、sgRNAiBARライブラリーは、アレイ上の電気化学的手段(例えば、CustomArray、Twist、Gen9)、DNA印刷(例えば、Agilent)、または個々のオリゴの固相合成(例えば、IDTによる)によって合成される。sgRNAiBAR構築体はPCRによって増幅され、発現ベクター(レンチウイルスベクターなど)にクローニングされる。一部の実施形態において、レンチウイルスベクターは、Casタンパク質、(例えば、Cas9)のような、CRISPR/Casベースの遺伝子編集システムの1つ以上の成分をさらにコードする。
【0115】
宿主細胞
一部の実施形態では、本明細書に記載のsgRNAiBAR構築体、分子、セット、またはライブラリーのいずれか1つを含む宿主細胞を含む組成物が提供される。
【0116】
一部の実施形態において、宿主細胞内のゲノム遺伝子座を編集する方法が提供され、これは、ゲノム遺伝子を標的とするガイド配列およびリピート:アンチリピーデュプレックス及びテトラループをコードするガイドヘアピン配列を含むガイドRNA構築体を宿主細胞に導入することを含む。ここで、内部バーコード(iBAR)が内部複製としてテトラループに埋め込まれ、宿主細胞内のゲノム遺伝子を標的とするガイドRNAを発現し、それによってCasヌクレアーゼの存在下で標的ゲノム遺伝子を編集する。
【0117】
一部の実施形態において、本明細書に記載のsgRNAiBARライブラリーのいずれか1つを複数の宿主細胞にトランスフェクトすることによって調製される細胞ライブラリーが提供され、ここで、sgRNAiBAR構築体は、ウイルスベクター(例えば、レンチウイルスベクター)に存在する。一部の実施形態において、トランスフェクション中のウイルスベクターと宿主細胞との間の感染多重度(MOI)は、少なくとも約1である。一部の実施形態において、MOIは、少なくとも約1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、またはそれ以上のもののうちのいずれか1つである。一部の実施形態では、MOIは、約1、約1.5、約2、約2.5、約3、約3.5、約4、約4.5、約5、約5.5、約6、約6.5、約7、約7.5、約8、約8.5、約9、約9.5、または約10である。一部の実施形態では、MOIは、1~10、1~3、3~5、5~10、2~9、3~8、4~6、または2~5のうちのいずれか1つである。一部の実施形態において、トランスフェクション中のウイルスベクターと宿主細胞との間のMOIは、1未満、例えば、0.8未満、0.5未満、0.3未満、またはそれ以下である。一部の実施形態では、MOIは約0.3から約1である。
【0118】
一部の実施形態において、CRISPR/Casシステムの1つ以上のエレメントの発現を駆動する1つ以上のベクターは宿主細胞に導入され、これによって、CRISPRシステムのエレメントの発現が、(1つまたは複数の標的部位で)sgRNAiBAR分子とのCRISPR複合体の形成を指示する。一部の実施形態において、宿主細胞は、Casヌクレアーゼが導入されているか、またはCRISPR/Casヌクレアーゼを安定して発現するように操作されている。
【0119】
一部の実施形態において、宿主細胞は真核細胞である。一部の実施形態では、宿主細胞は原核細胞である。一部の実施形態において、宿主細胞は、例えば、予め確立された細胞株などの細胞株である。宿主細胞および細胞株は、ヒト細胞または細胞株であり得るか、あるいはそれらは、非ヒト、哺乳動物細胞または細胞株であり得る。宿主細胞は、任意の組織または器官に由来し得る。一部の実施形態において、宿主細胞は腫瘍細胞である。一部の実施形態において、宿主細胞は、幹細胞またはiPS細胞である。一部の実施形態では、宿主細胞は神経細胞である。一部の実施形態において、宿主細胞は、B細胞またはT細胞などの免疫細胞である。一部の実施形態において、宿主細胞は、低いMOI(例えば、1、0.5、または0.3未満)のウイルスベクター(例えば、レンチウイルスベクター)でトランスフェクトすることが困難である。一部の実施形態において、宿主細胞は、低いMOI(例えば、1、0.5、または0.3未満)のCRISPR/Casシステムを使用して編集することが困難である。一部の実施形態において、宿主細胞は、限られた量で獲得できる。一部の実施形態において、宿主細胞は、腫瘍生検など、個体の生検から得られる。
【0120】
スクリーニングの方法
本出願はまた、本明細書に記載のガイドRNA構築体、ガイドRNAライブラリー、および細胞ライブラリーのいずれか1つを使用する、ハイスループットスクリーニングおよびフルゲノムスクリーニングを含む遺伝子スクリーニングの方法を提供する。
【0121】
一部の実施形態において、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体の細胞への導入を可能にする条件下で、Cas蛋白質を発現する初期細胞集団を本明細書に記載のいずれか1つのsgRNAiBARライブラリーと接触させること、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)であり、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0122】
一部の実施形態では、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体およびCas成分の細胞への導入を可能にする条件下で、初期細胞集団をi)本明細書に記載のいずれか1つのsgRNAiBARライブラリー、ii)Cas蛋白質、またはCas蛋白質をコードする核酸を含むCas成分と接触させること、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)であり、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0123】
一部の実施形態では、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体の細胞への導入を可能にする条件下で、Cas蛋白質を発現する初期細胞集団をsgRNAiBARライブラリーと接触させること(ここで、sgRNAiBARライブラリーは、複数のセットのsgRNAiBAR構築体を含み、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、前記3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する)、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、Cas蛋白質はCas9である。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムのループ領域、及び/またはステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域、及び/またはステムループ1のループ領域、ステムループ2のループ領域、またはステムループ3のループ領域に挿入される。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリーは少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2つのセットのsgRNAiBAR構築体のiBAR配列は同じである。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0124】
一部の実施形態では、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体の細胞への導入を可能にする条件下で、初期細胞集団をi)sgRNAiBARライブラリー、及びii)Cas蛋白質、またはCas蛋白質をコードする核酸を含むCas成分と接触させること(ここで、sgRNAiBARライブラリーは、複数のセットのsgRNAiBAR構築体を含み、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、前記3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体のそれぞれのiBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する)、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各sgRNAiBAR配列は、第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列と第2のステム配列との間に位置する。一部の実施形態では、各sgRNAiBAR配列は、5’から3’への方向に第1のステム配列及び第2のステム配列を含み、第1のステム配列と第2のステム配列がハイブリダイズしてCas蛋白質と相互作用する二本鎖RNA領域を形成し、iBAR配列は、第1のステム配列の3’末端と第2のステム配列の5’末端との間に位置する。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、Cas蛋白質はCas9である。一部の実施形態では、各sgRNAiBAR配列は、第2の配列に融合したガイド配列を含み、第2の配列は、Cas9と相互作用するリピート‐アンチ‐リピートステムループを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムのループ領域、及び/またはステムループ1、ステムループ2、またはステムループ3のループ領域に位置する。一部の実施形態では、iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域、及び/またはステムループ1のループ領域、ステムループ2のループ領域、またはステムループ3のループ領域に挿入される。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリーは少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2つのセットのsgRNAiBAR構築体のiBAR配列は同じである。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0125】
一部の実施形態では、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体の細胞への導入を可能にする条件下で、Cas9蛋白質を発現する初期細胞集団をsgRNAiBARライブラリーと接触させること(ここで、sgRNAiBARライブラリーは、複数のセットのsgRNAiBAR構築体を含み、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列、第2の配列、及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、Cas9蛋白質と相互作用するリピート‐アンチ‐リピートステムループを含む第2の配列に融合する。iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に配置(例えば、挿入)され、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体の各iBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する)、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリーは少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2つのセットのsgRNAiBAR構築体のiBAR配列は同じである。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0126】
一部の実施形態では、細胞(例えば、哺乳動物細胞などの真核細胞)の表現型を調節するゲノム遺伝子座をスクリーニングする方法が提供され、この方法には、a)修飾された細胞集団を提供するようにsgRNAiBAR構築体およびCas成分の細胞への導入を可能にする条件下で、初期細胞集団をi)本明細書に記載のsgRNAiBARライブラリー、及びii)Cas9蛋白質、またはCas9蛋白質をコードする核酸を含むCas成分と接触させること(ここで、sgRNAiBARライブラリーは、複数のセットのsgRNAiBAR構築体を含み、各セットは、それぞれがsgRNAiBARを含むかまたはコードする3つ以上(例えば、4つ)のsgRNAiBAR構築体を含み、各sgRNAiBARは、ガイド配列、第2の配列、及びiBAR配列を含むsgRNAiBAR配列を有し、各ガイド配列は、Cas9蛋白質と相互作用するリピート‐アンチ‐リピートステムループを含む第2の配列に融合する。iBAR配列は、リピート‐アンチ‐リピートステムループのループ領域に配置(例えば、挿入)され、各ガイド配列は、標的ゲノム遺伝子座に相補的であり、3つ以上のsgRNAiBAR構築体のガイド配列は同じであり、3つ以上のsgRNAiBAR構築体の各iBAR配列は互いに異なり、各sgRNAiBARは、標的ゲノム遺伝子座を修飾するようにCas9蛋白質と協力可能であり、各セットは、異なる標的ゲノム遺伝子座に相補的なガイド配列に対応する)、b)調節された表現型を有する細胞集団を修飾された細胞集団から選択して、選択された細胞集団を提供すること、c)選択された細胞集団からsgRNAiBAR配列を取得すること、d)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付けること(ここで、前記ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応するiBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、及びe)所定の閾値レベルより上にランク付けられたガイド配列に対するゲノム遺伝子座を同定することを含む。一部の実施形態では、各iBAR配列は約1~50ヌクレオチドを含む。一部の実施形態では、各sgRNAiBAR配列の第2の配列は、ステムループ1、ステムループ2および/またはステムループ3をさらに含む。一部の実施形態では、各sgRNAiBAR構築体はプラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)である。一部の実施形態では、sgRNAiBARライブラリーを約2を超える(例えば、少なくとも約3、5、または10)感染多重度(MOI)で初期細胞集団と接触させる。一部の実施形態では、sgRNAiBARライブラリーは少なくとも約1000セットのsgRNAiBAR構築体を含む。一部の実施形態では、少なくとも2つのセットのsgRNAiBAR構築体のiBAR配列は同じである。一部の実施形態では、sgRNAiBARライブラリー中の約95%を超えるsgRNAiBAR構築体を初期細胞集団に導入する。一部の実施形態では、スクリーニングが、約1000倍を超えるカバー率で行われる。一部の実施形態では、スクリーニングが陽性スクリーニングである。一部の実施形態では、スクリーニングが陰性スクリーニングである。
【0127】
一部の実施形態において、CRISPR/Casベースのハイスループット遺伝子スクリーニングの誤検出率(false discovery rate、FDR)を最小化するための方法が提供され、この方法には、各ガイドRNAの性能を複数回追跡するために、同じ実験内の標的細胞内のガイドRNAと内部バーコード(iBAR)ヌクレオチド配列の両方をカウントすることによって、複数のガイドRNAが埋め込まれた内部バーコードを宿主細胞に導入することを含む。好ましい実施形態において、バーコードは、A、T、CおよびGヌクレオチドからなる、2nt~20nt(より好ましくは、3nt~18nt、3nt~16nt、3nt~14nt、3nt~12nt、3nt~10nt、3nt~9nt、4nt~8nt、5nt~7nt;さらにより好ましくは、3nt、4nt、5nt、6nt、7nt)短い配列を含む。好ましい実施形態では、バーコードはガイドRNAのテトラループ領域に埋め込まれている。好ましい実施形態では、ガイドRNA構築体はウイルスベクターである。好ましい実施形態では、ウイルスベクターはレンチウイルスベクターである。好ましい実施形態において、ガイドRNA構築体は、MOI>1(例えば、MOI>1.5、MOI>2、MOI>2.5、MOI>3、MOI>3.5、MOI>4、MOI>4.5、 MOI>5、MOI>5.5、MOI>6、MOI>6.5、MOI>7;例えば、MOIは約1、MOIは約1.5、MOIは約2、MOIは約2.5、MOIは約3、MOIは約3.5、MOIは約4、MOIは約4.5、MOIは約5、MOIは約5.5、MOIは約6、MOIは約6.5、MOIは約7)で標的細胞に導入される。
【0128】
強力なゲノム編集ツールとして、クラスター化して規則的な配置の短い回文配列リピート(CRISPR)-クラスター化して規則的な配置の短い回文配列リピート関連タンパク質9(Cas9)システムは、(真核生物における)大規模な機能ベースのスクリーニングストラテジーに急速に発展した。従来のCRISPR/Casスクリーニング法と比較して、本発明は、スクリーニングの偽陽性率(FDR)が大幅に低減され、データの再現性が大幅に向上する、新規の遺伝子スクリーニング法を提供する。
【0129】
最近、2つの論文が、プールされたCRISPRスクリーニングのためにsgRNA本体の外部にランダムなバーコードを生成する方法を報告した(非特許文献13,14)。各sgRNAが目的の機能喪失(LOF)対立遺伝子と非LOF対立遺伝子を作成すると仮定すると、いずれの所定のsgRNAのすべての読み取りを計算しても、陰性スクリーニングにおけるその標的遺伝子の重要性を正確に評価することはできない。一つのUMI(ユニーク分子識別子)を各sgRNAの1つの編集結果と関連づけて単一細胞系統の追跡を可能にし、偽陰性率を下げるか、RSL(ランダムシーケンスラベル)の数の減少をカウントすることで、統計結果を大幅に改善できる(スクリーニングの質を向上させるためにsgRNAを付ける)。これらの2つの方法とは異なり、本発明は、ライブラリーサイズを縮小し、データ品質を改善するために、高いMOIでウイルス感染から得られるCRISPRライブラリーを用いたプールスクリーニングを可能にする、iBAR配列を有するsgRNAセットを使用する新規な方法を提供する。
【0130】
本明細書に記載のスクリーニング方法は、統計分析による標的同定およびデータ再現性を改善し、誤検出率(FDR)を低減するために、それぞれが内部バーコード(iBAR)を有するsgRNA構築体のセットのライブラリーを使用する。プールされたsgRNAライブラリーを使用する従来のCRISPR/Casベースのスクリーニング方法では、gRNAを発現する高品質の細胞ライブラリーが、細胞ライブラリーの構築中に低感染多重度(MOI)を使用して生成され、各細胞が平均して1つ未満のsgRNAまたはペアガイドRNA(「pgRNA」)を含むように確保される。ライブラリー内のsgRNA分子はトランスフェクトされた細胞にランダムに組み込まれるため、MOIが十分に低いと、各細胞が単一のsgRNAを発現し、スクリーニングの偽陽性率(FDR)が最小限に抑えられる。FDRをさらに低め、データの再現性を高めるには、統計的に有意なヒット遺伝子を取得するようにgRNA及び複数の生物学的複製を深くカバーすることが必要になることが多い。ゲノムワイドなスクリーニングを大量に実行する必要がある場合、ライブラリー構築用の細胞材料が限られている場合、または実験的な複製を手配したり、MOIを制御したりすることが困難な場合により挑戦的なスクリーニング(すなわち、インビボスクリーニング)を実施する場合、通常なスクリーニング法に困難が生じる。本明細書に記載のsgRNA
iBARライブラリーを使用する方法は、各sgRNAにiBAR配列を含めることによって困難を克服し、これにより、同じガイド配列であるが異なるiBAR配列を有する各sgRNAセット内の内部複製の収集が可能になる。たとえば、実施例で説明したように、各sgRNAに4つのヌクレオチドを持つiBARは、同じゲノム遺伝子座を標的とする異なるsgRNA
iBAR構築体間のデータの一貫性を評価するのに十分な内部複製を提供できる。2つの独立した実験間の高レベルの一貫性は、iBAR法を使用したCRISPR/Casスクリーニングには1つの実験複製で十分であることを示している(
図9cおよび表1)。宿主細胞のウイルス形質導入中に高いMOIでライブラリーカバー率が大幅に増加するため、実施例に記載された構築されたゲノムワイドなヒトライブラリーに示されているように、同じライブラリーカバー率に達するように、初期細胞集団の細胞数を20倍と減らすことができる(表3)。同様に、sgRNA
iBARを使用した各ゲノムワイドスクリーンのワークロードは、比例して削減できる。異なるiBAR配列を持つsgRNAを使用すると、ガイド配列と、それに対応する内部バーコード(iBAR)ヌクレオチド配列とをカウントすることにより、同じ実験内で各ガイド配列の性能を複数回追跡できるため、FDRが大幅に削減され、効率と応答が向上する。ウイルス形質導入ステップ中に高いウイルス力価を使用すると、形質導入効率とライブラリーカバー率はさらに増加でき、例えば、MOI>1(例えば、MOI>1.5、MOI>2、MOI>2.5、MOI>3、MOI>3.5、MOI>4、MOI>4.5、 MOI>5、MOI>5.5、MOI>6、MOI>6.5、MOI>7、MOI>7.5、MOI>8、MOI>8.5、MOI>9、MOI>9.5、またはMOI>10;例えば、MOIは約1、MOIは約1.5、MOIは約2、MOIは約2.5、MOIは約3、MOIは約3.5、MOIは約4、MOIは約4.5、MOIは約5、MOIは約5.5、MOIは約6、MOIは約6.5、MOIは約7、MOIは約7.5、MOIは約8、MOIは約8.5、MOIは約9、MOIは約9.5、MOIは約10)である。
【0131】
Casタンパク質は、(i)Casタンパク質、または(ii)Casタンパク質をコードするmRNA、または(iii)タンパク質をコードする線状または環状DNAとして、インビトロまたはインビボスクリーニングにおいて細胞に導入することができる。Casタンパク質またはCasタンパク質をコードする構築体は、組成物中で精製されていても、または精製されていなくてもよい。タンパク質または核酸構築体を宿主細胞に導入する方法は当技術分野で周知であり、Casタンパク質またはその構築体を細胞に導入することを必要とする本明細書に記載のすべての方法に適用可能である。特定の実施形態において、Casタンパク質は、タンパク質として宿主細胞に送達される。特定の実施形態において、Casタンパク質は、宿主細胞においてmRNAまたはDNAから構成的に発現される。特定の実施形態において、mRNAまたはDNAからのCasタンパク質の発現は、宿主細胞において誘導可能または誘導的である。特定の実施形態において、Casタンパク質は、当技術分野で知られている組換え技術を使用して、Casタンパク質:sgRNA複合体として宿主細胞に導入することができる。Casタンパク質またはその構築体を導入する例示的な方法は、例えば、参照によりその全体が本明細書に組み込まれる国際公開第2014/144761、国際公開第2014/144592、および国際公開第2013/176772に記載されている。
【0132】
一部の実施形態では、この方法は、CRISPR/Cas9システムを使用する。Cas9は、微生物のタイプII CRISPR(クラスター化して規則的な配置の短い回文配列リピート)システムのヌクレアーゼであり、シングルガイドRNA(sgRNA)とペアになるとDNAを切断することが示されている。sgRNAはCas9を標的ゲノム遺伝子の相補的領域にガイドする。これにより、細胞の非相同末端結合(NHEJ)メカニズムによってエラーが発生しやすい方法で修復できる部位特異的二本鎖切断(DSB)が生じる可能性がある。野生型Cas9は主に、gRNA配列の後にPAM配列(-NGG)が続くゲノム部位を切断する。NHEJを介したCas9誘導DSBの修復は、切断部位で開始される広範囲の変異を誘導する。これは通常、小さい(<10bp)挿入/削除(インデル)であるが、大きい(>100bp)インデルを含む場合もある。
【0133】
本明細書に記載の方法は、コーディング遺伝子、非コーディングRNA、および調節エレメントの機能を同定するために使用することができる。一部の実施形態において、sgRNAiBARライブラリーは、Cas9を発現する細胞、またはエフェクタードメインと融合された触媒的に不活性なCas9(dCas9)を発現する細胞に導入される。ハイスループットスクリーニングにより、当業者は、多様な突然変異、大きなゲノム欠失、転写活性化または転写抑制を生成することにより、多種多様な遺伝子スクリーニングを実行することができる。実施例に示されているように、iBAR配列は、Cas9またはdCas9ヌクレアーゼを誘導して標的部位を修飾する際のsgRNAの効率に影響を与えない。
【0134】
本明細書に記載のスクリーニング方法は、インビトロの細胞ベースのスクリーニングまたはインビボのスクリーニングに適用できる。一部の実施形態において、細胞は、細胞培養における細胞である。一部の実施形態では、細胞は組織または器官に存在する。一部の実施形態では、細胞は、線虫(C.elegans)、ハエ、または他のモデル生物などの生物に存在する。
【0135】
初期細胞集団には、CRISPR/CasガイドRNAライブラリー(たとえばCRISPR/CasガイドRNAライブラリーレンチウイルスプール)で形質導入することができる。一部の実施形態において、sgRNAiBARウイルスベクターライブラリーは、高い感染多重度(MOI)(例えば、少なくとも約1、2、3、4、5、6のいずれか1つのMOI)で初期細胞集団に導入される。一部の実施形態において、sgRNAiBARウイルスベクターライブラリーは、低MOI、例えば、約0.9、0.8、0.7、0.6、0.5、0.4、0.3以下またはそれより低いもののいずれか1つのMOIで、初期細胞集団に導入される。一部の実施形態において、初期細胞集団は、107、5×106、2×106、106、5×105、2×105、105、5×104、2×104、104、または103細胞以下のいずれか1つである。一部の実施形態において、sgRNAiBARライブラリーにおいて、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、またはそれより高いパーセンテージのいずれか1つのsgRNAiBAR構築体が初期細胞集団に導入される。一部の実施形態において、スクリーニングは、50倍、100倍、200倍、500倍、1000倍、2000倍、5000倍、10000倍、またはそれ以上のいずれか1つ以上のカバー率で実施される。
【0136】
sgRNAiBARライブラリーを初期細胞集団に導入した後、細胞を適切な期間でインキュベートして、遺伝子編集を可能にしてもよい。例えば、細胞は、少なくとも12時間、24時間、2日、3日、4日、6日、7日、8日、9日、10日、11日、12日、13日、14日以上インキュベートすることができる。インデル、ノックアウト、ノックイン、活性化または標的ゲノム遺伝子座または目的の遺伝子の抑制を有する修飾された細胞が得られる。一部の実施形態において、標的遺伝子の転写は、修飾された細胞におけるsgRNAiBAR構築体によって阻害または抑制される。一部の実施形態において、標的遺伝子の転写は、修飾された細胞におけるsgRNAiBAR構築体によって活性化される。一部の実施形態において、標的遺伝子は、修飾された細胞におけるsgRNAiBAR構築体によってノックアウトされる。修飾された細胞は、蛍光タンパク質マーカーや薬剤耐性マーカーなど、sgRNAiBARベクターによってコードされる選択可能なマーカーを使用して選択できる。
【0137】
一部の実施形態では、この方法は、遺伝子のスプライシング部位または接合部を標的とするように設計されたsgRNAiBARライブラリーを使用する。スプライシングターゲティング法を使用して、ゲノム内の複数(例えば、数千)の配列をスクリーニングすることができ、それにより、これらの配列の機能を解明することができる。一部の実施形態において、スプライシングターゲティング法は、生存、増殖、薬剤耐性、または他の目的の表現型に必要なゲノム遺伝子を同定するために、ハイスループットスクリーニングにおいて使用される。スプライシングターゲティング実験では、目的の遺伝子内の数万のスプライシング部位を標的とするsgRNAiBARライブラリーを、たとえばレンチウイルスベクターによってプールとして標的細胞に送達することができる。目的の表現型を選択した後、細胞内で濃縮または枯渇したsgRNAiBAR配列を同定することにより、この表現型に必要な遺伝子を体系的に同定できる。
【0138】
一部の実施形態において、修飾された細胞は、ホルモン、成長因子、炎症性サイトカイン、抗炎症性サイトカイン、薬物、毒素、および転写因子などの刺激にさらにさらされる。一部の実施形態において、修飾された細胞は、薬剤に対する細胞の感受性を増加または減少させるゲノム遺伝子座を同定するために、薬剤で処理される。
【0139】
一部の実施形態において、調節された表現型を有する細胞は、スクリーンから選択される。「調節する」とは、調整、ダウンレギュレーション、アップレギュレーション、減少、阻害、増加、減少、非活性化、または活性化などの活動の変化を指す。遺伝子発現または細胞表現型が調節された細胞は、既知の技術を使用して、例えば、蛍光活性化細胞選別(FACS)または磁気活性化細胞選別によって単離することができる。調節された表現型は、細胞内または細胞表面マーカーの検出を介して認識され得る。一部の実施形態では、細胞内または細胞表面マーカーは、免疫蛍光染色によって検出することができる。一部の実施形態では、内因性標的遺伝子は、ゲノム編集などによって、蛍光レポーターで標識することができる。他の適用可能な調節された表現型スクリーニングには、刺激因子、細胞死、細胞成長、細胞増殖、細胞生存、薬剤耐性、または薬剤感受性への応答の変化に基づいて、独特な細胞集団を単離することが含まれる。
【0140】
一部の実施形態において、調節された表現型は、少なくとも1つの標的遺伝子の遺伝子発現の変化、または細胞または生物の表現型の変化であってもよい。一部の実施形態において、表現型は、タンパク質発現、RNA発現、タンパク質活性、またはRNA活性である。一部の実施形態において、細胞表現型は、刺激因子、細胞死、細胞増殖、薬剤耐性、薬剤感受性、またはそれらの組み合わせに対する細胞応答であってもよい。刺激因子は、物理的信号、環境信号、ホルモン、成長因子、炎症性サイトカイン、抗炎症性サイトカイン、転写因子、薬剤または毒素、あるいはそれらの組み合わせであってもよい。
【0141】
一部の実施形態において、修飾された細胞は、細胞増殖または生存のために選択される。一部の実施形態において、修飾された細胞は、選択剤の存在下で培養される。選択剤は、化学療法剤、細胞毒性剤、成長因子、転写因子、または薬剤であってもよい。一部の実施形態において、対照細胞は、選択剤の存在なしに同じ条件で培養される。一部の実施形態において、選択は、例えば、モデル生物を使用して、インビボで実施されてもよい。一部の実施形態において、細胞は、遺伝子編集のためにエクスビボでsgRNAiBARライブラリーと接触され、遺伝子編集された細胞は、調節された表現型を選択するために生物(例えば、異種移植物として)に導入される。
【0142】
一部の実施形態において、修飾された細胞は、対照細胞における1つ以上の遺伝子の発現レベルと比較して、1つ以上の遺伝子の発現の変化のために選択される。一部の実施形態において、遺伝子発現の変化は、対照細胞と比較した遺伝子発現の増加または減少である。遺伝子発現の変化は、タンパク質発現、RNA発現、またはタンパク質活性の変化によって決定することができる。一部の実施形態において、遺伝子発現の変化は、化学療法剤、細胞毒性剤、成長因子、転写因子、または薬剤などの刺激因子に応答して起こる。
【0143】
一部の実施形態において、対照細胞は、sgRNAiBAR構築体を含まない細胞、または細胞内のいかなるゲノム遺伝子座も標的としないガイド配列を含む陰性対照sgRNAiBAR構築体を導入された細胞である。一部の実施形態では、対照細胞は、薬剤などの刺激因子に曝露されていない細胞である。
【0144】
調節された表現型を有する選択された細胞集団は、選択された細胞集団におけるsgRNAiBAR配列を決定することによって解析される。sgRNAiBAR配列は、ゲノムDNAのハイスループットシーケンシング、RT-PCR、qRT-PCR、RNA-seq、または当技術分野で知られている他のシーケンシング方法によって取得することができる。一部の実施形態において、sgRNAiBAR配列は、ゲノム配列決定またはRNA配列決定によって得られる。一部の実施形態において、sgRNAiBAR配列は、次世代配列決定によって得られる。
【0145】
配列決定データは、当技術分野で知られている任意の方法を使用して分析し、ゲノムにアラインメントさせることができる。一部の実施形態において、ガイドRNAの配列カウントおよび対応するiBAR配列のカウントは、統計分析によって決定される。一部の実施形態では、配列カウントは、中央値比正規化などの正規化方法を経て得られたものである。
【0146】
統計方法は、選択した細胞集団で増強または枯渇したsgRNAiBAR分子のアイデンティティを決定することに使用できる。例示的な統計方法には、線形回帰、一般化線形回帰、および階層回帰が含まれるが、これらに限定されない。一部の実施形態では、配列カウントは、中央値比の正規化に続く平均分散モデリングが行われたものである。一部の実施形態では、MAGeCK(Li, W et al.,MAGeCKは、ゲノムスケールのCRISPR/Cas9ノックアウトスクリーニングからの必須遺伝子のロバストな同定を可能にする。Genome Biol 15,554(2014))を使用してガイドRNA配列をランク付ける。
【0147】
一部の実施形態では、各ガイド配列の分散は、前記sgRNAiBAR配列中のiBAR配列間のデータ一貫性を前記ガイド配列に対応させることに基づいて調整される。本明細書で使用される「データの一貫性」は、スクリーニング実験における異なるiBAR配列に対応する同じガイド配列(例えば、配列カウント、正規化された配列カウント、ランキング、または倍数変化)の配列決定結果の一貫性を指す。スクリーニングからの真のヒットは、理論的には、同じガイド配列を持ち、iBARが異なるsgRNAiBAR構築体に対応する、相似の正規化された配列カウント、ランキング、および/または倍数変化を有するはずである。
【0148】
一部の実施形態において、選択された細胞集団から得られた配列カウントを、対照細胞集団から得られた対応する配列カウントと比較して、倍数変化を提供する。一部の実施形態では、前記sgRNAiBAR配列中の各iBAR配列間のデータ一貫性が前記ガイド配列に対応するかどうかは、各iBAR配列の倍数変化の方向に基づいて決定され、倍数変化が互いに反対方向である場合に、前記ガイド配列の分散が増加する。一部の実施形態では、データの一貫性を決定するために、ロバストランクアグリゲーションが配列カウントに適用される。
【0149】
sgRNAiBAR構築体のセットでは、ガイド配列のランク付けは、セット内のさまざまなiBAR配列の予め決定されたしきい値mの濃縮方向の一貫性に基づいて調整できる。mは1~nの整数である。たとえば、sgRNAiBARセットの少なくともm個のiBAR配列が同じ方向の倍数変化を示す場合、つまり、すべてが対照群の方向よりも大きいか小さい場合、ランク付け(または分散)は変更されない。ただし、n-mを超える異なるiBAR配列が倍数変化の一貫性のない方向を示す場合、sgRNAiBARセットは、そのランクを下げることによって(例えば、分散を増やすことによって)、ダウングレードされる。ロバストランクアグリゲーション(RRA)は、当技術分野で統計とランキングに利用できるツールの1つである。当業者は、他の利用可能なツールもこの統計およびランク付けに使用できることを理解することができる。本発明では、ロバストランクアグリゲーション(RRA)を使用して各遺伝子の最終スコアを計算し、これによって、すべての遺伝子の平均および分散に基づいて遺伝子のランク付けを取得する。このように、対応するiBAR間で倍数変化が異なる方向で示されるsgRNAは、分散の増加によってダウングレードされ、これによって、特定の遺伝子のスコアとランキングが低下する。
【0150】
一部の実施形態では、この方法は、陽性スクリーニングに使用され、すなわち、選択された細胞集団において増強されるガイド配列を同定することによって使用される。一部の実施形態において、この方法は、陰性スクリーニングに使用される(すなわち、選択された細胞集団において枯渇しているガイド配列を同定することによって使用される)。選択した細胞集団で強化されたガイド配列は、配列カウントまたは倍数変化に基づいて上位にランク付けられ、選択した細胞集団で枯渇したガイド配列は、配列カウントまたは倍数変化に基づいて下位にランク付けされる。
【0151】
一部の実施形態では、この方法は、同定されたゲノム遺伝子座を検証することをさらに含む。例えば、ゲノム遺伝子座が同定された場合、対応するsgRNAiBAR構築体を使用した実験を繰り返すか、1つまたは複数のsgRNA(iBAR配列なしで、および/または目的の異なるガイド配列が付けられる)を、同じ目的の遺伝子を標的とするように設計することができる。個々のsgRNAiBARまたはsgRNA構築体を細胞に導入して、細胞内の同じ目的の遺伝子を編集する効果を検証することができる。
【0152】
本明細書に記載のスクリーニング方法のいずれか1つからの配列決定結果を分析する方法がさらに提供される。分析の例示的な方法は、実施例部分に記載されており、例えば、MAGeCKiBARアルゴリズムを含む。
【0153】
一部の実施形態では、細胞内の表現型を調節するゲノム遺伝子座を同定するためにユーザーからの要求を受信する入力ユニットと、入力ユニットに動作可能に結合された1つまたは複数のコンピュータプロセッサとを含むコンピュータシステムが提供され、ここで、1つまたは複数のコンピュータプロセッサは、a)本明細書に記載の方法のいずれか1つを使用して、遺伝子スクリーニングから配列決定データのセットを受信する、b)配列カウントに基づいてsgRNAiBAR配列の対応するガイド配列をランク付ける(ここで、ランク付けは、前記sgRNAiBAR配列中のガイド配列に対応する各iBAR配列間のデータ一貫性に基づいて各ガイド配列のランクを調整することを含む)、c)所定の閾値レベルより上にランク付けられたガイド配列に対応するゲノム遺伝子座を同定する、d)読み取り可能な方法でデータを提示する、および/または配列決定データの分析を生成するように、個別にまたは集合的にプログラムされる。
【0154】
キットおよび製品
本願はさらに、本明細書に記載のsgRNAiBARライブラリーを使用するスクリーニング方法の任意の実施形態で使用するためのキットおよび製品を提供する。
【0155】
一部の実施形態において、本明細書に記載のsgRNAiBARライブラリーのいずれか1つを含む、細胞の表現型を調節するゲノム遺伝子座をスクリーニングするためのキットが提供される。一部の実施形態において、キットは、Casタンパク質またはCasタンパク質をコードする核酸をさらに含む。一部の実施形態において、キットは、1つ以上のsgRNAiBAR構築体の陽性および/または陰性対照セットをさらに含む。一部の実施形態では、キットは、データ分析ソフトウェアをさらに含む。一部の実施形態では、キットは、本明細書に記載のスクリーニング方法のいずれか1つを実行するための説明書を含む。
【0156】
一部の実施形態において、遺伝子スクリーニングに使用可能なsgRNAiBARライブラリーを調製するためのキットが提供され、3つ以上(例えば、4つ)の構築体を含み、各構築体は、異なるiBAR配列と、ガイド配列を挿入してsgRNAiBARの構築体を提供するためのクローニング部位とを含む。一部の実施形態において、構築体は、プラスミドまたはウイルスベクター(例えば、レンチウイルスベクター)などのベクターである。一部の実施形態では、キットは、sgRNAiBARライブラリーを調製するための、および/または本明細書に記載のスクリーニング方法のいずれか1つを実行するための説明書を含む。
【0157】
キットは、本明細書に記載のスクリーニング方法のいずれか1つの実行を容易にするために、容器、試薬、培地、プライマー、緩衝液、酵素などのような追加の成分を含んでもよい。一部の実施形態において、キットは、sgRNAiBARライブラリーおよびCasタンパク質またはCasタンパク質をコードする核酸を細胞に導入するための試薬、緩衝液およびベクターを含む。一部の実施形態では、キットは、選択された細胞から抽出されたsgRNAiBAR配列の配列決定ライブラリーを調製するためのプライマー、試薬、および酵素(例えば、ポリメラーゼ)を含む。
【0158】
本出願のキットは、適切な包装に入っている。適切な包装には、バイアル、ボトル、ジャー、可撓性包装(例えば、マイラーまたはビニール袋)などが含まれるが、これらに限定されない。キットは、オプションで、バッファーや解釈情報などの追加コンポーネントを提供する場合がある。したがって、本出願はまた、バイアル(密封されたバイアルなど)、ボトル、ジャー、可撓性包装などを含む製品を提供する。
【0159】
本出願はさらに、本明細書に記載のスクリーニング方法のいずれか1つに使用するための、sgRNAiBAR構築体、sgRNAiBAR分子、sgRNAiBARセット、細胞ライブラリー、またはそれらの組成物のいずれかを含むキットまたは製品を提供する。
【実施例】
【0160】
以下の実施例は、本出願の例示的なもののみであるため、いかなる方法でも本発明を限定すると見なされるべきではない。以下の実施例および詳細な説明は、限定としてではなく、例示として提供されている。
【0161】
方法
細胞と試薬
HeLaおよびHEK293T細胞株は、1%ペニシリン/ストレプトマイシンおよび10%ウシ胎児血清(FBS、CellMax BL102-02)を添加したDulbecco改良Eagle培地(DMEM、Gibco C11995500BT)で維持し、37℃で5%CO2で培養した。マイコプラズマ汚染があるかどうかについて、すべての細胞をチェックした。
【0162】
プラスミド構築
レンチウイルスsgRNAiBAR発現バックボーンは、Plenti-sgRNA-Lib(Addgene、#53121)のBstBI(NEB、R0519)およびXhoI(NEB、R0146)を使用してBsmBI(Thermo Scientific、ER0451)部位の位置を変更することによって構築された。sgRNAおよびsgRNAiBARを発現する配列は、BsmBIを介したGolden Gateクローニングストラテジーを使用してバックボーンにクローニングされた(非特許文献28)。
【0163】
ゲノムスケールのCRISPR sgRNAiBARライブラリーの設計
遺伝子注釈は、19,210個の遺伝子を含むUCSC hg38ゲノムから取得された。遺伝子ごとに、3つの異なるsgRNAが、新しく開発されたDeepRankアルゴリズムを使用して設計され、これらのsgRNAは、ゲノムの16-bpシード領域に少なくとも1つのミスマッチを有し、予測されるターゲティング効率が高い。次に、4つの6-bp iBAR(iBAR6)を各sgRNAにランダムに割り当てた。陰性対照として、それぞれ4つのiBAR6を備えた追加の1,000個の非ターゲティングsgRNAを設計した。
【0164】
CRISPR sgRNAiBARプラスミドライブラリーの構築
85-ntのDNAオリゴヌクレオチドが設計され、アレイ合成された。オリゴの隣接配列を標的とするプライマー(オリゴFおよびオリゴR)をPCR増幅に使用した。PCR産物は、Golden Gate法(非特許文献28)を使用して上記で構築されたレンチウイルスベクターにクローン化された。ライゲーション混合物をTrans1-T1コンピテント細胞(Transgene、CD501-03)に形質転換して、ライブラリープラスミドを得た。sgRNAiBARライブラリーのスケールで少なくとも100倍のカバレッジを確保するために、形質転換されたクローンをカウントした。ライブラリープラスミドを標準プロトコル(QIAGEN 12362)に従って抽出し、2つのレンチウイルスパッケージプラスミドpVSVGおよびpR8.74(Addgene、Inc.)を使用してHEK293T細胞にトランスフェクトし、ライブラリーウイルスを取得した。1つのANTXR1ターゲティングsgRNAの4,096個のiBAR6をすべて含むiBARライブラリは、同じプロトコルを使用して構築された。
【0165】
4,096種類のiBAR6すべてを含むsgRNAiBAR-ANTXR1ライブラリーのスクリーニング
合計2×107個の細胞を150mmペトリ皿に播種し、MOI 0.3でライブラリーレンチウイルスに感染させた。感染の72時間後、細胞を再播種し、1μg/mlのピューロマイシン(Solarbio P8230)で48時間処理した。各複製について、ゲノム抽出のために5×106個の細胞を収集した。sgRNAiBAR-ANTXR1ライブラリーのスクリーニングは、ライブラリー感染細胞を15日間培養した後、PA/LFnDTA毒素(非特許文献29,30)を使用して実施した(非特許文献7)。次に、Primer-FおよびPrimer-Rを使用してゲノムDNAにおけるiBARコード領域を持つsgRNA(TransGen、AP131-13)を増幅し、そしてNEBNext Ultra DNA Library Prep Kit(Illumina(NEB E7370L))を使用してハイスループットシーケンシング分析(Illumina HiSeq2500)を行った。
【0166】
TcdB細胞毒性に重要な遺伝子および細胞生存率に不可欠な遺伝子のための、ゲノムスケールのCRISPR/Cas9 sgRNAiBARライブラリーのスクリーニング
合計1.6×108細胞(MOI=0.3)、1.53×107細胞(MOI=3)、4.6×106細胞(MOI=10)をそれぞれ150mmペトリ皿にプレーティングし、2つの複製のsgRNAライブラリーを構築した。細胞を異なるMOIのライブラリーレンチウイルスに感染させ、感染後1μg/mlのピューロマイシンで72時間処理した。sgRNAiBARが組み込まれた細胞は、遺伝子ノックアウトを最大化するためにさらに15日間培養された。細胞を150mmペトリ皿に再播種し、TcdB(100pg/ml)で10時間処理した後、ピペッティングを繰り返して、緩く付着した丸い細胞を除去した(非特許文献19)。スクリーニングの各ラウンドで、細胞をTcdBを含まない新鮮な培地で培養し、約50%~60%のコンフルエンスに到達させた。1つの複製のすべての耐性細胞をプールし、TcdBスクリーニングの別のラウンドにかけた。その後の3ラウンドのスクリーニングでは、TcdB濃度はそれぞれ125pg/ml、150pg/ml、及び175pg/mlであった。4ラウンドの処理後、耐性細胞と未処理細胞を収集して、ゲノムDNA抽出、sgRNAの増幅、NGS分析を行った。PCR増幅には7ペアのプライマーを使用し(表1)、PCR産物を混合してNGSに使用した。0.3のMOIでの陰性スクリーニングでは、合計4.6×107(2つの複製)のsgRNAiBARが組み込まれた細胞を28日間培養した後、NGSをデコードした。
【0167】
【0168】
【0169】
6-TG細胞毒性に重要な遺伝子のための、ゲノムスケールCRISPR/Cas9 sgRNAiBARライブラリーのスクリーニング
合計5×107個の細胞を150mmペトリ皿に播種し、2つの複製を取得した。細胞をMOI 3でライブラリーレンチウイルスに感染させ、感染の72時間後に1μg/mlピューロマイシンで処理した。sgRNAiBARを組み込んだ細胞をさらに15日間培養し、合計数5×107で再播種し、200ng/ml 6-TG(Selleck)で処理した。次の2ラウンドのスクリーニングでは、6-TG濃度は250ng/mlと300ng/mlであった。選択の各ラウンドについて、薬剤を7日間維持し、細胞を6-TGを含まない新鮮な培地でさらに3日間培養した。次に、1つの複製内のすべての耐性細胞をグループ化し、別のラウンドの6-TGスクリーニングを行った。3ラウンドの処理後、耐性細胞と未処理細胞は、ゲノムDNA抽出、iBAR領域を使用したsgRNAの増幅、およびディープシーケンス分析のために収集された。
【0170】
陽性スクリーニングデータ分析
MAGeCKiBARは、MAGeCKアルゴリズム(非特許文献17)に基づくsgRNAiBARライブラリーを使用してスクリーニング用に開発された分析ストラテジーである。MAGeCKiBARは、Python、Pandas、NumPy、SciPyを充分に活用している。分析アルゴリズムには、分析の準備、統計的検定、ランクの集計(rank aggregation)という3つの主要な部分が含まれている。分析準備段階では、入力されたsgRNAsiBARの原始カウントが正規化され、全体平均と分散の係数がモデル化される。統計的検定段階では、検定を使用して、処理と対照の正規化された読み取りの差の有意性を判断する。ランク集計段階では、各遺伝子をターゲットとするすべてのsgRNAsiBARのランクを集計して、最終的な遺伝子ランキングを取得する。
【0171】
正規化と準備
最初に、配列決定データからsgRNAsiBARの原始カウントを取得した。シーケンシング深度とシーケンシングエラーはsgRNAsiBARの原始カウントに影響を与える可能性があるため、次の分析の前に正規化が必要であった。サイズ因子(size factor)は、異なるシーケンシング深度の原始カウントを正規化するために推定された。ただし、いくつかの高度に濃縮されたsgRNAは、総読み取り数に強い影響を与える可能性があるため、総読み取り数に対する比率を正規化に使用してはならない。したがって、中央値比の正規化を選択した(非特許文献31)。ライブラリーにsgRNAがn個あり、iが1からnの範囲であり、合計m回の実験(対照群と治療群)があり、jが1からmの範囲であるとする。サイズ因子は次のように表すことができる。
【0172】
【0173】
したがって、対応するサイズ因子を計算することにより、各実験でsgRNAiBARの正規化されたカウントを取得した。平均分散モデリングステップでは、NB分布を使用して、生物学的複製およびさまざまな処理にわたるすべてのsgRNAiBARの平均と分散を推定した(非特許文献32):
【0174】
【0175】
MAGeCKが採用したモデルを使用して、平均と分散の係数を計算した(非特許文献17)。平均分散モデルは、次の関係を満たす。
【0176】
【0177】
ライブラリー内のすべてのsgRNAiBARからのk係数とb係数を決定するために、関数を線形関数に変換できる。
【0178】
【0179】
治療数と対照数の平均は直接計算され、対応する分散は平均と係数から計算できた。 CRISPR-iBAR分析では、さまざまなiBARのパフォーマンスを通じてsgRNAの濃縮を評価した。内部複製として、各sgRNAに対して4つのiBARを設計した。ライブラリー構築中のMOIが高いため、真陽性ヒットに関連する偽陽性sgRNAの「フリーライダー」が存在するに違いない。ここでの「フリーライダー」は、同じ細胞に入るために(機能的なsgRNAと誤って関連付けられた)無関係な遺伝子を標的とするsgRNAを説明するために使用された。各sgRNAの異なるiBARの濃縮方向に基づいて、sgRNAiBARの分散を変更した。1つのsgRNAのすべてのiBARが同じ方向の倍数変化を示した場合、つまり、すべてが対照群の方向よりも大きいか小さい場合、分散は変化しない。ただし、異なるiBARを持つ1つのsgRNAが、倍数変化の方向に一貫性がないことを示した場合、この種のsgRNAは、その分散を増やすことによってダウングレードされる。一貫性のないsgRNAiBARの最終的な調整済み分散は、モデル推定分散にCtrlサンプルとExpサンプルから計算された実験分散を加えたものになる。
【0180】
最後に、sgRNAiBARのスコアは、対照群と比較した治療の平均および正規化された分散によって計算された。
【0181】
【0182】
ここで、tiはi番目のsgRNAの治療カウントの平均であり、ciとviはi番目のsgRNAの対照カウントの平均と分散である。分散はスコアを計算するための分母として使用されるため、一貫性のないsgRNAiBARの分散が大きくなると、スコアが低くなる。
【0183】
統計的測定とランク集計
正規分布は、治療カウントのスコアのテストに使用された。標準正規分布のスコアの両側は、大きい方のテールと小さい方のテールのP値を別々に提供した。
遺伝子ランクを取得するために、ランキングを集計するための適切な方法であるRRA(Robust rank aggregation method、ロバストランクアグリゲーション法)を使用した(非特許文献33)。MAGeCKは、濃縮されたsgRNAを制限することにより、改良されたRRA法を採用した(非特許文献17)。1つの遺伝子について、M sgRNAiBARのライブラリーに合計n個のsgRNAが異なるiBARを持つとする。各sgRNAiBARは、ライブラリーR=(R1,R2,...,Rn)内でランクを持っている。まず、sgRNAiBARのランクは、ライブラリー内のsgRNAiBARの総数で正規化する必要がある。各ri=Ri/Mについて、正規化されたランクr=(r1,r2,...,rn)を取得した。ここで、1≦i≦nである。次に、正規化されたランキングsrを計算し、sr1≦sr2≦…≦srnにした。ソートされた正規化されたランクは、0と1の間の均一分布に従う。確率βk,n(sr)(ここで、sri≦ri)がβ分布β(k,n+1-k)に従い、これによって、ρ=min(β1,n,β2,n,...,βn,n)にする。すべての遺伝子について、ρスコアはRRAによって取得でき、ボンフェローニ(Bonferroni)校正によってさらに調整できる(非特許文献33)。α-RRAを開発したMAGeCKを採用し、ランキングリストから上位のα%sgRNAを選択した。閾値(例えば0.25)より低いsgRNAのP値が選択された。1つの遺伝子の上位sgRNAのみがRRA計算で考慮されたため、ρ=min(β1,n,β2,n,...,βj,n)となり、なお、1≦j≦nである。
【0184】
陰性スクリーニングデータ分析
iBARストラテジーに基づく高MOIでの陽性スクリーニングの分析プロセス中に、対応するバーコード間で異なる倍数変化方向を持つsgRNAのモデル推定分散を修正した。しかし、陰性スクリーニングの場合、非機能的なsgRNAのほとんどは変化しない。したがって、対応するバーコードの倍数変化方向に基づく分散修正アルゴリズムは、特定のsgRNAが偽陽性の結果であるかどうかを証明するのに十分ではなくなる。したがって、バーコードを内部複製として直接扱った。iBARを考慮に入れると、一貫性のないsgRNAiBARの分散調整ではなく、陰性スクリーニングに対して2回のロバストランクアグリゲーションを実行した。ロバストランクアグリゲーションの最初のラウンドは、sgRNAiBARレベルをsgRNAレベルに集約し、2番目のラウンドはsgRNAレベルを遺伝子レベルに集約する。
【0185】
候補遺伝子の検証
各遺伝子を検証するために、ライブラリーで設計された2つのsgRNAを選択し、ピューロマイシン選択マーカーを有するレンチウイルスベクターにクローン化した。X-tremeGENE HP DNAトランスフェクション試薬(Roche)を使用して、2つのsgRNAプラスミドを混合し、2つのレンチウイルスパッケージプラスミド(pVSVGおよびpR8.74)とともにHEK293T細胞に同時トランスフェクトした。Cas9を安定して発現しているHeLa細胞をレンチウイルスに3日間感染させ、1μg/mlピューロマイシンで2日間処理した。次に、5,000個の細胞を各ウェルに加え、各群について5つの複製を取得した。24時間後、実験群を150ng/ml 6-TGで処理し、対照群を通常の培地で7日間処理した。次に、MTT(Amresco)染色と検出を標準プロトコルに従って実行した。6-TGで処理された実験ウェルは、6-TG処理されていないウェルに正規化された。
【0186】
結果
私たちは、4,096のバーコードの組み合わせを生み出した6-ntの長さのiBAR(iBAR
6)を任意に設計し、目的に十分な変化を提供した(
図1A)。これらの余分なiBAR配列の挿入がgRNA活性に影響を与えるかどうかを判断するために、4,096種類のiBAR
6すべてと組み合わせて炭疽菌毒素受容体遺伝子ANTXR116を標的とする所定のsgRNAのライブラリーを構築した。この特別なsgRNA
iBAR-ANTXR1ライブラリーは、0.3の低いMOIでレンチウイルス形質導入を介してCas9(非特許文献7,8)を絶えず発現するHeLa細胞で構築された。3ラウンドのPA/LFnDTA毒素処理と濃縮の後、sgRNAと、毒素耐性細胞からのそのiBAR
6配列とを、以前に報告されたようにNGS分析によって検出した(非特許文献7)。sgRNA
iBAR-ANTXR1とバーコードのないsgRNA
ANTXR1の大部分は有意に濃縮されていたが、ほとんどすべての非ターゲティング対照sgRNAは耐性細胞集団に存在しなかった。重要なことに、異なるiBAR
6を有するsgRNA
iBAR-ANTXR1の濃縮レベルは、2つの生物学的複製間でランダムであるように見えた(
図1B)。iBAR
6の各位置でのヌクレオチド頻度を計算した後、いずれの複製からのヌクレオチドの偏差も観察できなかった(
図1C)。さらに、iBAR
6のGC含量はsgRNAの切断効率に影響を与えていないようであった(
図2)。ただし、少数のiBAR
6に関連するsgRNA
ANTXR1がどちらのスクリーニング複製でもうまく機能しなかった。これらのiBAR
6がsgRNA活性に悪影響を及ぼした可能性を排除するために、sgRNA
iBAR-ANTXR1ランキングの最下位から6つの異なるiBARを選択してさらに研究した。バーコードのない対照sgRNA
ANTXR1と比較して、これら6つのsgRNA
iBAR-ANTXR1はすべて、標的部位でのDNA二本鎖切断(DSB)(
図1D)と毒素耐性表現型につながるANTXR1遺伝子破壊の両方を生成するのに同等の効率を示した(
図1E)。さらに、CSPG4、MLH1、MSH2のそれぞれに対する4つの異なるsgRNAによるsgRNA効率に対するiBARの影響が無視できることを確認した(
図3)。まとめると、これらの結果は、この再設計されたsgRNA
iBARがsgRNAの十分な活性を保持していることを示しており、CRISPRプールスクリーニングでこのストラテジーを一般的に適用することが可能である。
【0187】
次に、iBARストラテジーに基づいて、その使用を拡大し、高いMOIで新しいsgRNA
iBARライブラリースクリーニングを実行することに着手した。標準的な手順に従って、ライブラリー細胞を回収し、iBARコード領域でsgRNAをPCR増幅するためにゲノムDNAを抽出し、NGS分析を実行した(非特許文献7,11,12)。MAGeCKアルゴリズムは、原始カウントの正規化、負の二項分布(NB)モデルを使用した分散の推定、および均一な分布を持つヌルモデルを使用したランキングの決定を通じて、sgRNAスコアの統計的有意性を計算するために使用できる(非特許文献17)。iBARを考慮に入れて、同じ実験複製内のすべての関連するiBAR間のsgRNAカウントの変化の一貫性を評価した。このプロセスは、細胞ライブラリー構築における高いMOIでのレンチウイルス感染のために機能的なsgRNAに関連していた「フリーライダー」を効果的に排除した。具体的には、iBARシステムの場合、複数のiBARで倍数が反対方向に変化するsgRNAのみのモデル推定分散を意図的に調整し、これらの外れ値のP値を増加させた。最後に、sgRNAスコアと生物学的複製間の技術的差異に基づいてヒット遺伝子を特定した(
図4)。sgRNA
iBARライブラリースクリーニングの分析のために、オープンソースで無料でダウンロードできる、MAGeCK
iBARという名前のこの特定のMAGeCKベースのアルゴリズムを開発した。
【0188】
次に、注釈付きのすべてのヒト遺伝子をカバーするsgRNA
iBARライブラリ-を構築した。19,210のヒト遺伝子のそれぞれについて、DeepRank法を使用して3つの固有のsgRNAが設計され、それぞれに4つのiBAR
6がランダムに割り当てられた。さらに、それぞれ4つのiBAR
6を持つ1,000の非ターゲティングsgRNAが陰性対照として含まれていた。統計的比較を容易にするために、3つの独特な非ターゲティングsgRNAの各セットを人為的に陰性対照遺伝子と名付けた。85-ntのsgRNA
iBARオリゴヌクレオチドは、コンピューターを用いて設計され(
図5)、アレイ合成を使用して合成され、プールされたライブラリーとしてレンチウイルスバックボーンにクローニングされた。Cas9を発現するHeLa細胞に、3つの異なるMOI(0.3、3、および10)でsgRNA
iBARライブラリーレンチウイルスを形質導入し、sgRNAを400倍カバーして、各sgRNA
iBARが100倍カバーされた細胞ライブラリーを生成した。さまざまなMOIでのCRISPRスクリーニングに対するiBAR設計の効果を評価するために、この嫌気性菌の主要な病原性因子の1つであるクロストリジウムディフィシル毒素B(TcdB)の細胞毒性を媒介する遺伝子を特定するための陽性スクリーニングを実施した(非特許文献18)。TcdBの機能的受容体であるCSPG4(非特許文献19)の最初の同定を以前に報告した。そのコーディング遺伝子も同定され、ゲノムスケールのCRISPRライブラリースクリーニングから最上位にランク付けられた(非特許文献20)。この報告されたCRISPRスクリーニングでは、UGP2遺伝子もトップランクのヒットであり、FZD2は、宿主細胞に対するTcdBの殺傷効果を媒介する二次受容体をコードすることが確認された。注目すべきことに、FZD2の役割はCSPG4によって大幅に矮小化されたため、FZD2遺伝子は、CSPG4相互作用領域が削除されたトランケートされたTcdBを使用してのみ識別できた(非特許文献20)。TcdBのスクリーニングでは、MAGeCK
iBARとMAGeCKを使用して、それぞれiBARと従来のCRISPRスクリーニングからのデータを分析した。その結果、両方からトップランクの遺伝子(FDR<0.15)を取得した。
【0189】
0.3という低いMOIでのスクリーニングでは、CSPG4とUGP2が特定され、上位にランク付けられた(
図6A)。これは以前の報道と一致している(非特許文献20)。iBARを考慮に入れると、CSPG4とUGP2に加えてFZD2を特定した(
図6B)。FZD2は、HeLa細胞においてCSPG4よりもはるかに弱い役割を果たすTcdBの実証済みの受容体であるため(非特許文献20)、これらの結果は、低MOIで細胞ライブラリーを構築する場合にiBAR法が従来のCRISPRスクリーニングよりも優れた品質と感度を提供することを示した。さらに、CSPG4とUGP2のランキングは、2つの実験的複製間のCRISPR
iBARスクリーニングでより一貫しており、新しい方法の品質がはるかに高いことを再度示している(
図6A、6B)。高いMOI(3および10)では、CSPG4とUGP2をCRISPRとCRISPRiBARの両方のスクリーニングから分離できたが、データ品質は後者の方が大幅に高かった(
図6C-6F)。一般に、MOIが高いほど、従来の方法の信号対雑音比は悪くなる。MOIが10の場合、誤検出ヒットの数は従来の方法では大幅に増加したが、CRISPR
iBARスクリーニングでは増加しなかった(
図6E、6F)。印象深いことに、CSPG4とUGP2は、MOIが10の場合でも、データ品質はわずかに低下したが、CRISPR
iBARスクリーニングでトップランクを維持した(
図6F)。注目すべきことに、ほぼすべてのCSPG4及びUGP2を標的とするsgRNA
iBARは、TcdB処理後に有意に濃縮され(
図7)、SPPL3などの従来の方法を使用してMOI 10で同定された他の遺伝子とは著しく異なり、偽陽性の結果である可能性がある(
図7)。2つの生物学的複製を比較すると、CSPG4とUGP2は、すべてのMOI条件のCRISPR
iBARスクリーニングからの両方の生物学的複製ですべて上位にランク付けられたが(
図6b、6d、6f)、従来のCRISPRスクリーニングからはそうではない。ここで、従来のCRISPRスクリーニングでは、UGP2は、MOIが3の場合の両方の複製で60位未満にランク付けられ(
図6C)、MOIが10の場合は両方の複製で多くの偽陽性ヒットが発生した(
図6E)。これらの結果は、iBAR法が、高MOIでも従来のCRISPRスクリーニングの低MOIと同様に、データの品質を維持することを示した。さらに、2つの実験的複製の間の一貫性が高いため、CRISPR
iBARスクリーニングを使用してヒット遺伝子を特定するには1つの生物学的複製で十分である可能性がある(
図6)。結局のところ、iBARアプローチに基づいて、1つの実験内で複数の複製を実行できる。
【0190】
iBAR法の効果をさらに評価するために、DNA合成を阻害するように処理できる抗がん剤である6-TG(非特許文献21)に対する細胞の感受性を調節する遺伝子を同定するためのスクリーニングを実施した。MOIが3のゲノムスケールのsgRNA
iBARライブラリーを構築し、各sgRNA
iBARが500倍カバーされた各sgRNAのカバー率が高い(2,000倍)細胞ライブラリーを作成することにした。両方の実験的複製の全体的な読み取り分布が示され(
図8A)、両方の複製の参照細胞ライブラリーは、最初に設計されたすべてのsgRNAの97%のカバー率に達した(
図8B)。元のライブラリーのsgRNAの95%以上が3~4個のiBARを保持しており、ほとんどのsgRNAがスクリーニングとデータ分析に十分なバーコードバリアントを備えたライブラリーの品質が高いことを示している(
図8C)。すべての遺伝子の倍数変化は、2つの生物学的複製の間でよく相関していた(
図9)。2つのsgRNAライブラリー複製の同じ6-TGスクリーニングでは、MAGeCK及びMAGeCK
iBAR分析も採用した。その結果、MAGeCK
iBARの場合、すべてのsgRNA
iBARの調整された分散と平均分布が得られ、異なるiBARリピート間で濃縮に一貫性がないsgRNAの分散が高められた(
図10)。
【0191】
陽性選択された統計的に有意なsgRNAから、対応するsgRNAが異なるiBAR間で一貫して濃縮されているトップランクの遺伝子(FDR<0.15)を同定し(
図11A)、バーコードを使用せずにMAGeCKアルゴリズムを使用してこれらのトップ遺伝子も見つけた(
図11B)。以前の報告(非特許文献22)と一致して、HPRT1遺伝子を標的とするsgRNAは両方の方法でトップランクにランクされた。4つの遺伝子(MLH1、MSH2、MSH6、およびPMS2)は、6-TGを介した細胞死に関与していることが以前に報告されている(非特許文献6)。これら4つの遺伝子を標的とする主要な設計sgRNAの1つを除くすべての切断活性を調べて確認し(
図12)、これらの遺伝子が実際に使用したHeLa細胞の6-TGを介した細胞死とは無関係であることを示した(
図11C)。2つの生物学的複製を別々に分析すると、各複製の上位20遺伝子は、CRISPR
iBARスクリーニングとの高いレベルの一貫性を示した(ランキングのスピアマン相関係数=0.74)が、従来の方法を使用した場合、2つの複製の共通性ははるかに低くなった(スピアマン相関ランキングの係数=-0.09)(
図11Dおよび表2)。
【0192】
【0193】
【0194】
スクリーニング結果を検証するために、2つのsgRNAを新たに設計して組み合わせて、各候補遺伝子を標的とするミニプールを作成し、レンチウイルス感染によって各プールをHeLa細胞に導入した(表3)。
【0195】
【0196】
【0197】
6-TG処理に対する細胞生存率に対するsgRNAプールの影響は、3-(4,5-ジメチル-2-チアゾリル)-2,5-ジフェニル-2-H-テトラゾリウムブロミド(MTT)アッセイによって定量された。CRISPR
iBARおよびCRISPRスクリーンからの上位10個の遺伝子が検証のために選択された。注目すべきことに、2つの非ターゲティング対照遺伝子(non-targeting control genes)が同定され、従来のCRISPRスクリーンのトップ10候補リストにランク付けられた。細胞ライブラリーの生成に使用したMOIが高いため、これらの明らかな偽陽性の結果は予測可能である。2つの複製のCRISPR
iBARからの上位10個の候補遺伝子がすべて真陽性の結果であることを確認することに成功した。対照的に、従来の方法の上位10の候補リストから5つの遺伝子のみが真陽性であることが判明した(
図11E)。その中で、4つの遺伝子(HPRT1、ITGB1、SRGAP2、およびAKTIP)が両方の方法を使用して取得されたのに対し、6つの遺伝子(ACTR3C、PPP1R17、ACSBG1、CALM2、TCF21、およびKIFAP3)はCRISPR
iBARのみにより同定され、上位にランク付けられた。要するに、従来の方法と比較して、iBARは、高MOIスクリーン精度を向上させた(偽陽性率と偽陰性率が低い)。
【0198】
さらに、上位4つの候補遺伝子(HPRT1、ITGB1、SRGAP2、およびAKTIP)を標的とする各sgRNA
iBARの性能を評価した。濃縮されたsgRNAのすべての異なるiBARは、それらの関連sgRNAの濃縮レベルにほとんど影響を与えないようであり、特定のsgRNAに関連付けられたiBARの順序はランダムであるように見え(
図13)、iBARに関する以前の認識、すなわち、付属sgRNAの効率に影響を与えないことをさらに支持する。4つすべてのHPRT1ターゲティングsgRNA
iBARは、両方の複製で6-TG処理後に有意に濃縮された(
図11F)。他のCRISPR
iBARで同定された遺伝子のほとんどのsgRNA
iBARは、6-TG選択後に濃縮された(
図14)。対照的に、FGF13(
図11G)、GALR1、および2つの陰性対照遺伝子(
図15)を含む、従来のCRISPRスクリーニングからのいくつかのトップランク遺伝子のsgRNA
iBARのごく一部のみが濃縮され、MAGeCK
iBAR分析ではなくMAGeCK分析の偽陽性ヒットを引き起こす(
図16)。
【0199】
私たちが設計したように、各sgRNAの4つのバーコードは、データの一貫性を評価するのに十分な内部複製を提供するように見えた。2つの生物学的複製間の高レベルの一貫性は、iBAR法を使用したCRISPRスクリーニングには1つの実験的複製で十分であることを示している(
図6、
図11Dおよび表2)。ライブラリー構築のための固定数の細胞を用いた形質導入における高いMOIでライブラリーカバー率が有意に増加したため、ライブラリー構築の開始細胞を20倍(MOI=3)および70倍(MOI=10)を超える倍数で減らして、2つの生物学的複製を使用した0.3のMOIでの従来のスクリーニングの結果と一致させ、さらにはそれを上回っている(表4)。
【0200】
【0201】
複数の切断は細胞の生存率を低下させるため、高いMOIで構築されたCRISPRライブラリーは、陰性スクリーニングの異常な偽発見率を示す可能性がある(非特許文献23,24)。したがって、必須遺伝子を呼び出す際のiBAR法を評価するために、MOI 0.3でゲノムスケールの陰性スクリーニングを実施した。iBARを使用した陽性スクリーニングでは、バーコード間の倍数変化方向が異なるsgRNAのモデル推定分散を変更して分散を拡大し、誤って関連付けられたsgRNAが適切なペナルティの対象となるようにした。ただし、陰性スクリーニングの場合、非機能的なsgRNAは変化しないため、誤って関連付けられたsgRNAの枯渇は倍数変化方向の一貫性にほとんど影響しなかった。したがって、ペナルティ手順(penalty procedure)なしで、バーコードを内部複製としてのみ扱った。ゴールドスタンダードの必須遺伝子(gold-standard essential genes)(非特許文献25)を使用する従来のアプローチよりも、低いMOIでiBAR法を使用した陰性スクリーニングの真陽性率が高く、偽陽性率が低く、統計的な結果が確実的に改善された(
図17)。
【0202】
ライブラリー構築用の細胞の大幅な削減に加えて、同じ実験内でiBARによって提供される内部複製は、個別の生物学的複製(separate biological replicates)と比較して、より均一な条件とより公平な比較につながり、結果として統計スコアが向上する。複数の細胞株での大規模なCRISPRスクリーニングが必要な場合、またはスクリーニング用の細胞サンプルが不足している場合(たとえば、患者からのサンプルや初代物からのサンプル)、iBAR法の利点は大きくなる。特にレンチウイルスの形質導入率を予測することが難しく、さまざまな動物の可変的な条件がスクリーニングの結果に大きな影響を与える可能性があるインビボスクリーニングの場合、iBAR法はこれらの技術的制限を解決するための理想的なソリューションになる可能性がある。
【0203】
陰性スクリーニングの場合、iBAR法は低MOIでのウイルス感染で作られたライブラリーの統計を改善した(
図17)。「内部複製(internal replication)」と同じの利点を提供するiBAR法の技術的進歩にもかかわらず、細胞生存率の測定に基づいて陰性スクリーンで元の細胞ライブラリーを生成するために、ウイルス形質導入中のMOIに注意する必要がある。大規模な統合は細胞の適合性に影響を与えないと報告されているが(非特許文献26)、アクティブなCas9を含む細胞の高いMOIによるDNAの複数回の切断によって、細胞の生存率が低下することが示されている(非特許文献23,24)。切断を使用しないストラテジー(CRISPRi/a(非特許文献9)またはiSTOPシステム(非特許文献27)など)は、高いMOIでの陰性スクリーニングのためにiBARシステムと組み合わせるのにより適した選択肢となるかもしれない。
【0204】
iBAR
6がsgRNAの活性にほとんど影響を与えなかったことを裏付けるデータはあるが、小さな影響を避けるために、連続したT(>4)のバーコードを使用することは勧めない。最終的に、4,096種類のiBAR
6は、CRISPRライブラリーを作成するのに十分な種類を提供した。さらに、iBARの長さは6ntに制限されていない。さまざまな長さのiBARをテストしたところ、関連するsgRNAの機能に影響を与えることなく、最大50-ntの長さになることができることがわかった(
図18)。さらに、sgRNAごとに異なるバーコードセットを設計する必要はない。すべてのsgRNAに割り当てられたiBARの固定セットは、ライブラリースクリーニングでのランダムな割り当てと同様に機能するはずである。能率化された分析ツール(iBAR)を使用したiBARストラテジーにより、さまざまな環境での生物医学的発見のための大規模なCRISPR/Casスクリーニングが促進される。
【配列表】