IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ リジェネロン・ファーマシューティカルズ・インコーポレイテッドの特許一覧

<>
  • 特許-CRISPR選択のための方法 図1
  • 特許-CRISPR選択のための方法 図2
  • 特許-CRISPR選択のための方法 図3
  • 特許-CRISPR選択のための方法 図4
  • 特許-CRISPR選択のための方法 図5
  • 特許-CRISPR選択のための方法 図6
  • 特許-CRISPR選択のための方法 図7
  • 特許-CRISPR選択のための方法 図8
  • 特許-CRISPR選択のための方法 図9
  • 特許-CRISPR選択のための方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-24
(45)【発行日】2025-04-01
(54)【発明の名称】CRISPR選択のための方法
(51)【国際特許分類】
   C12N 15/09 20060101AFI20250325BHJP
   C12Q 1/6874 20180101ALI20250325BHJP
   C12M 1/00 20060101ALN20250325BHJP
【FI】
C12N15/09 110
C12Q1/6874 Z
C12M1/00 A
【請求項の数】 15
(21)【出願番号】P 2021556554
(86)(22)【出願日】2020-03-17
(65)【公表番号】
(43)【公表日】2022-05-20
(86)【国際出願番号】 US2020023152
(87)【国際公開番号】W WO2020190944
(87)【国際公開日】2020-09-24
【審査請求日】2023-03-10
(31)【優先権主張番号】62/820,106
(32)【優先日】2019-03-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】597160510
【氏名又は名称】リジェネロン・ファーマシューティカルズ・インコーポレイテッド
【氏名又は名称原語表記】REGENERON PHARMACEUTICALS, INC.
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(74)【代理人】
【識別番号】100152489
【弁理士】
【氏名又は名称】中村 美樹
(72)【発明者】
【氏名】フューリー、ウェン
(72)【発明者】
【氏名】バイ、ユー
【審査官】齋藤 光介
(56)【参考文献】
【文献】国際公開第2017/075294(WO,A1)
【文献】Wen Fury, et al.,Overlapping probabilities of top ranking gene lists, hypergeometric distribution, and stringency of gene selection criterion,2006 International Conference of the IEEE Engineering in Medicine and Biology Society,2006年,pp.5531-5534
【文献】SWEE HOE ONG; ET AL,OPTIMISED METRICS FOR CRISPR-KO SCREENS WITH SECOND-GENERATION GRNA LIBRARIES,SCIENTIFIC REPORTS,2017年08月07日,VOL:7, NR:1,PAGE(S):7384(1-10),http://dx.doi.org/10.1038/s41598-017-07827-z
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
(A)cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させることであって、前記ライブラリーが、DNAの標的領域に関連する少なくとも3つのガイドRNA(gRNA)を含む、感染させること、
前記細胞を配列決定して、前記gRNAの各々のリード数を取得すること、
DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数(n)を合計することおよび、
すべての標的領域にわたって、そのリード数が前記背景閾値を超える、gRNAの総数(N)を合計すること
(B)前記ウイルスベクターのライブラリーで、cas9陽性細胞の第二の培養物を感染させること、
前記第二の培養物の細胞を、指定された表現型を有する、または前記指定された表現型を有しないのいずれかとしてカテゴライズすること、
前記指定された表現型を有する細胞を選択し、前記選択された細胞を配列決定して前記gRNAの各々の選択後リード数を取得すること、
その選択後リード数が前記背景閾値を超える前記選択された細胞において、DNAの標的領域当たりで、gRNAのそれぞれの数(n’)を合計することおよび、
すべての標的領域にわたって、そのリード数が前記背景閾値を超える前記選択された細胞の、gRNAの総数(N’)を合計すること
(C)DNAの標的領域について、

【数1】

に従って、前記選択された細胞内の前記標的領域についてn’gRNAを偶然に観察する確率を計算することであって、式中
【数2】

はyオブジェクトからxオブジェクトを選択する方法の数を算出する、計算すること、および、遺伝子を含むDNAの標的領域について、式
【数3】

に従って、前記選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算することと、
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、前記遺伝子が前記指定された表現型と関連していると識別することと、を含む、方法。
【請求項2】
前記第一の培養物を、CRISPR技術に従って感染させる、請求項1に記載の方法。
【請求項3】
前記cas9陽性細胞が不活性化cas9を含む、請求項1または請求項2に記載の方法。
【請求項4】
前記不活性化cas9が、少なくとも一つの転写活性化ドメインに融合される、請求項3に記載の方法。
【請求項5】
前記遺伝子を含む前記DNAの標的領域が、下流遺伝子またはタンパク質を調節し、前記下流遺伝子またはタンパク質を調節することが、前記下流遺伝子またはタンパク質の活性化または阻害を含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記第二の培養物の細胞を、前記指定された表現型を有する、または前記指定された表現型を有しないのいずれかとしてカテゴライズすることが、選択機構を前記第二の培養物に適用することを含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記選択機構が、前記第二の培養物を薬剤に曝露することか、または前記第二の培養物をタンパク質活性または発現レベルを特定する物質に曝露することのうちの一つ以上を含む、請求項6に記載の方法。
【請求項8】
前記第一の培養物の前記cas9陽性細胞が、一つ以上の選択マーカーを含有するように改変され、前記一つ以上の選択マーカーが蛍光マーカーおよび/または検出可能な酵素を含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記指定された表現型を有する細胞を選択することが、前記一つ以上の選択マーカーに基づいて前記細胞をソートすることを含み、前記指定された表現型が蛍光および/または細胞生存である、請求項に記載の方法。
【請求項10】
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する前記確率に基づいて、前記標的領域が陽性的に選択されると識別することをさらに含む、請求項1~のいずれか一項に記載の方法。
【請求項11】
各gRNAについて、N/N’を評価することによって濃縮スコアを決定することをさらに含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する前記確率に基づいて、前記遺伝子を含むDNAの標的領域を第二の遺伝子の修飾因子として識別することをさらに含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する前記確率に基づいて、前記遺伝子を含むDNAの標的領域を治療標的として識別することをさらに含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する前記確率に基づいて、前記遺伝子を含むDNAの標的領域が前記指定された表現型と相関すると識別することをさらに含む、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記選択された細胞内の前記遺伝子のn’以上のgRNAを偶然に観察する前記確率に基づいて、前記遺伝子を含むDNAの標的領域が保護効果を示すと識別することをさらに含む、請求項1~14のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CRISPR選択のための方法およびシステムに関する。
関連出願の相互参照
本出願は、2019年3月18日に出願された米国仮特許出願第62/820,106号の利益を主張するものであり、その全体が参照により本明細書に援用される。
【背景技術】
【0002】
クラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Cas9技術は、ゲノム工学に大変革を起こした。このシステムでは、ガイドRNA(gRNA)が、Cas9ヌクレアーゼに標的化ゲノム領域での二重鎖切断を誘導させる。gRNAの5’末端は、標的化領域に相補的な約20ヌクレオチドのヌクレオチド配列を含む。二本鎖切断が非相同末端結合(NHEJ)によって修復される場合、挿入および欠失は高頻度で発生し、したがって標的化ゲノム遺伝子座を効率的にノックアウトする。レンチウイルス送達方法の開発により、ゲノムスケールCRISPR/Cas9ノックアウトのライブラリーの作成が可能となった。これらのライブラリーは、哺乳類細胞株上で陰性および陽性選択スクリーニングの両方が行われることを可能にする。CRISPR/Cas9ノックアウトスクリーンでは、各遺伝子はいくつかのgRNAによって標的化され、異なる遺伝子ノックアウトを運ぶ変異体プールは、高スループット配列決定によって決定され得る。CRISPR活性化(CRISPRa)はまた、活性化された遺伝子が高スループット配列決定によって決定され得るgRNAライブラリーとともに使用され得る。
【0003】
ゲノムワイドCRISPR/Cas9ノックアウトまたは遺伝子活性化技術は、有効な遺伝子摂動スクリーニング技術である。目的は、表現型に関連するgRNA、従ってそれに対応する罹患遺伝子を識別することである。しかしながら、これらのスクリーンによって生成されるデータは、コンピュータ解析にいくつかの課題を提起する。CRISPR研究は、多くの場合、複数の複製を用いて実施される。CRISPRは、各実験がスクリーニングライブラリー内で同じgRNAウイルス力価を使用しない場合があり、レンチウイルス感染速度が実験間で異なる場合があり、gRNAが実験間で同じ効率の遺伝子を標的としない場合があるという変動性に影響を受けやすい。したがって、観察されたgRNA存在量は、同じ表現型の細胞を用いても、実験間で非常に変動的である。既存の技術は、表現型に関連するgRNAを識別するためにリード数に依存しており、具体的には、正規化されたgRNAリード数の平均および分散を使用して、表現型を有するまたは有しない細胞間でgRNAの存在量が有意に異なるかどうかを試験する。
【0004】
しかしながら、こうした技術は、上述の実験間の変動性の問題には対処せず、むしろ、選択前実験と選択後実験との間で高度な均質性を想定している。これらの技術は、単一のCRISPR実験内および/またはCRISPR実験間の変動性には対処しない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
したがって、陽性および陰性選択スクリーンを介して遺伝子を識別する際に、CRISPRの変動性の問題に対処するコンピューティングテクノロジーにおける技術的改善に対するニーズがある。
【課題を解決するための手段】
【0006】
以下の概説および以下の発明を実施するための形態は両方とも、あくまで例示的かつ説明的なものであって、限定的なものではないことを理解されたい。
一実施形態では、方法は、(A)ウイルスベクターのライブラリーで、cas9陽性細胞の第一の培養物を感染させることを含み、ライブラリーは、細胞のゲノム内のDNAの標的領域を切断するための少なくとも3つのガイドRNA(gRNA)を含み、細胞を配列決定してgRNAの各々のリード数を取得し、DNAの標的領域当たりで、そのリード数が背景閾値(background threshold)を超える、gRNAのそれぞれの数を合計し(Σ)、式中Σ=nで、かつgRNAの総数を合計し(Σ)、式中Σ=Nである。方法は、(B)ウイルスベクターのライブラリーで、cas9陽性細胞の第二の培養物を感染させることと、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることと、指定された表現型を有する細胞を選択し、選択された細胞を配列決定して、gRNAの各々の選択後リード数を取得することと、DNAの標的領域当たりで、選択後リード数が背景閾値を超える選択された細胞において、gRNAのそれぞれの数を合計すること(Σ)であって、式中、Σ=n’である、合計することと、標的領域全体にわたって、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計すること(Σ)であって、式中Σ=N’である、合計することと、を含む。方法は、(C)DNAの標的領域について、式
【0007】
【数1】
【0008】
に従って、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算すること、式中
【0009】
【数2】
【0010】
はyオブジェクトからxオブジェクトを選択する方法の数を算出し、および遺伝子を含むDNAの標的領域について、式
【0011】
【数3】
【0012】
に従って、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算すること、を含む。
一実施形態では、方法は、DNAの複数の標的領域の各々に対する少なくとも3つのガイドRNA(gRNA)のライブラリーを含むベクターを用いた感染後の、第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定すること、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定すること、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定すること、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定すること、n、N、n’、およびN’に基づき、複数の標的領域の各標的領域に対して、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定すること、対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定すること、および選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されると識別すること、を含む。
【0013】
追加の利点は、その一部が下記説明に記載されているか、または実践によって知ることができるであろう。これらの利点は、添付の特許請求の範囲において特に指摘されている要素および組み合わせによって実現され、達成されるであろう。
【図面の簡単な説明】
【0014】
図1図1は、CRISPR陽性選択のための例示的な方法である。
図2図2は、別の例示的な方法を示す。
図3図3は、例示的な操作環境を示す。
図4図4は、遺伝子当たり三つ(A~CまたはD~F)または四つ(G~JまたはK~N)のgRNAのいずれかを有する、四つの仮説遺伝子に対する人工リード数を格納する例示的なデータ構造を示し、それによって各gRNAの選択前および選択後リード数がとられ、それによって閾値30を超える選択前nおよび選択後n’リード数を識別し合計する(NおよびN’)、また、確率は示される式に従って決定される。
図5図5は、N個のgRNAを最初に使用し、10日後の細胞培養でN’個のgRNAが存在する、開示された方法の人工データおよび人工結果を格納する例示的なデータ構造を示す。示されるように、標的領域1または標的領域2は、n個のgRNAを有し、10日間の培養後の細胞中に存在するn’個のgRNAの可能性が提示される(p値として提示される確率)。
図6図6は、約21,000個の遺伝子(G#)が関与する実験の結果を示し、四つの選択前および三つの選択後実験からの各gRNA(g)のリード数が示され、リード数を合計し(合計)、閾値30を超えるリード数を識別し(存在の合計(sum of presence))、合計する(合計)。
図7図7は、三日間(d03)、六日間(d06)、および十日間(d10)にわたる細胞培養のいくつかの平行実験(xp#)で使用されたサンプルgRNAライブラリー(Gecko AおよびGeck B)を示し、その後、FRET蛍光によって測定されるタウ凝集が決定された。Gecko AおよびBライブラリーの構成は、特定の遺伝子標的化gRNA、特定のマイクロRNA標的化gRNA、および非標的化gRNA、および標的当たりのgRNAのおよその数を含むとして示されている。
図8図8は、3日間、6日間、および10日間にわたる各実験(xp#)で使用されたGecko Aライブラリーからの各gRNAの正規化前のリード数を示し、それによって、gRNAを使用して標的の不活化を方向付けた。
図9図9は、図8に示す実験からのGecko Aライブラリーのリード数の正規化を示す。正規化は、リード数の中央値に基づいており、10日目は選択後である。
図10図10は、標的が、異なる数のgRNAを有してもよく、また一部のサンプルが、10日目に他のものよりも多くの「存在する」gRNAを有するため、「存在」の頻度を集計する別の方法は、遺伝子が「存在する」確率を計算することである、ということを示す。確率は、Gecko AライブラリーgRNAを使用して、10日目(選択後)にスクリーンされた五つの異なる遺伝子について計算された。
【発明を実施するための形態】
【0015】
本明細書に組み込まれ、かつ本明細書の一部をなす添付の図面は、実施形態を例証し、この説明とともに、本方法およびシステムの原理を説明する役割を果たすものである。
本方法およびシステムに関する開示および説明に先立って、本方法およびシステムが特定の方法、特定のコンポーネントまたは特定の実装形態に限定されないことを理解すべきである。本明細書中で使用されている用語は、もっぱら特定の実施形態の説明を目的としたものであって、限定することを意図するものではないこともまた、理解すべきである。
【0016】
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、文脈から他の意味に解釈されることが明白な場合を除き、複数の指示対象を含む。
【0017】
本明細書で使用される場合、用語「プローブ」および「ガイドRNA(gRNA)」および「ガイド」は互換的に使用される。一実施形態では、gRNAはまた、gRNAをコードするDNAの形態で提供されてもよい。
【0018】
本明細書で使用される場合、「Casタンパク質」は、野生型タンパク質(すなわち、自然界で生じるもの)、改変Casタンパク質(すなわち、Casタンパク質バリアント)、または野生型もしくは改変Casタンパク質の断片であり得る。Casタンパク質はまた、野生型または改変Casタンパク質の触媒活性に関して、活性バリアントまたは断片であってもよい。
【0019】
第一の態様では、本開示は、例えば、他の遺伝子または遺伝子産物の発現を調節する遺伝子または遺伝子産物を識別する方法を特徴とする。本方法は、例えば、CRISPRガイドを用いた摂動後の陽性選択を明示するのに有用である。
【0020】
一実施形態では(図1に示す)、方法は、cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させる工程110であって、ライブラリーは、細胞のゲノム内のDNAの標的領域を切断するための少なくとも3つのガイドRNAを含む、感染させる工程、細胞を配列決定してgRNAの各々のリード数を取得する工程120、DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計し(Σ)(Σ=n)、標的領域全体にわたり、そのリード数が背景閾値を超える、gRNAの総数を合計する(Σ)(Σ=N)工程130、cas9陽性細胞の第二の培養物を、ウイルスベクターのライブラリーで感染させる工程140、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズする工程150、指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得する工程160、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える選択された細胞において、gRNAのそれぞれの数を合計し(Σ)(Σ=n’)、標的領域全体にわたりそのリード数が閾値を超える選択された細胞のgRNAの総数を合計する(Σ)(Σ=N’)工程170、DNAの標的領域について、式
【0021】
【数4】
【0022】
に従って、
選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算する工程180であって、式中
【0023】
【数5】
【0024】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する、計算する工程、および遺伝子を含むDNAの標的領域について、式
【0025】
【数6】
【0026】
に従って選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算する工程190、を含む。
一実施形態では(これもまた図1に示す)、方法は、cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させる工程110であって、ライブラリーは、細胞のゲノム内のDNAの標的領域の転写を強化するための少なくとも3つのガイドRNA(gRNA)を含む、感染させる工程、細胞を配列決定してgRNAの各々のリード数を取得する工程120、DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計し(Σ)(Σ=n)、標的領域全体にわたりそのリード数が背景閾値を超える、gRNAの総数を合計する(Σ)(Σ=N)工程130、cas9陽性細胞の第二の培養物を、ウイルスベクターのライブラリーで感染させる工程140、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズする工程150、指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得する工程160、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える選択された細胞において、gRNAのそれぞれの数を合計し(Σ)(Σ=n’)、標的領域全体にわたり、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計する(Σ)(Σ=N’)工程170、DNAの標的領域について、式
【0027】
【数7】
【0028】
に従って、
選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算する工程180であって、式中
【0029】
【数8】
【0030】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する、計算する工程、および遺伝子を含むDNAの標的領域について、式
【0031】
【数9】
【0032】
に従って選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算する工程190、を含む。
一実施形態では、第一の培養物は、CRISPR技術に従って感染させることができる。一実施形態では、cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させること(例えば、図2;201)、およびcas9陽性細胞の第二の培養物をウイルスベクターのライブラリーで感染させること(例えば、図2;205)は、CRISPR gRNAライブラリーを使用することを含む。CRISPR gRNAライブラリーは、例えば、ゲノム中の各遺伝子を標的とする一つ以上のgRNA(例えば、sgRNA)を含むゲノムワイドgRNAノックアウトライブラリーを含むノックアウトライブラリーであってもよく、ここでゲノムは任意のタイプのゲノムであってよい。一部の実施形態では、gRNAライブラリーは、プールされたライブラリーを含んでもよい。プールされたライブラリーの非限定的な例は、ゲノムスケールCRISPRノックアウト(GeCKO)ライブラリーを含む。例えば、Shalem O et al.(2014)Science 343:84-7およびSanjana NE et al.(2014)Nat.Methods 11:783-4を参照のこと。ライブラリー中のgRNAは、DNA中の任意の数の標的領域(例えば、遺伝子)を標的とすることができる。例えば、gRNAは、約50個以上の遺伝子、約100個以上の遺伝子、約200個以上の遺伝子、約300個以上の遺伝子、約400個以上の遺伝子、約500個以上の遺伝子、約1000個以上の遺伝子、約2000個以上の遺伝子、約3000個以上の遺伝子、約4000個以上の遺伝子、約5000個以上の遺伝子、約10000個以上の遺伝子、または約20000個以上の遺伝子を標的とすることができる。一部のライブラリーでは、gRNAは、特定のシグナル伝達経路の遺伝子を標的とするように選択することができる。gRNAライブラリーは、広範な感染多重度(MOI)を使用して投与することができる。一部の態様では、より低いMOIを使用して、細胞当たり一つのgRNAをもたらす感染を促進することができる。
【0033】
一実施形態では、cas陽性細胞は、DNAの標的領域を切断するためのcasタンパク質、または転写を調節する(例えば、転写を増強または抑制する)ためのcasタンパク質を含み得る。DNAの標的領域を切断するためのcasタンパク質は、RNA結合ドメインおよびヌクレアーゼドメインを含み得る。転写を調節するためのcasタンパク質は、ヌクレアーゼ活性をもはや有しないように、不活性化される。不活性化Cas(例えば、dCas-9)は、転写活性化因子または転写リプレッサーに融合され得る。したがって、一実施形態では、野生型活性を有するcas-9、または不活性化cas-9を含むcas-9陽性細胞が開示される。不活性化cas-9は、例えば、少なくとも一つの転写活性化ドメインに融合され得る。一つ以上のgRNAは、対象の遺伝子の転写開始部位の上流の標的配列に結合することができ、DNAを切断する代わりに、dCas-9および転写調節因子は、対象の遺伝子の転写を活性化するか、または転写を抑制するかのいずれかで役割を果たすことができる。dCas-9が一つ以上の転写活性化因子に融合される場合、一つ以上の転写活性化因子は、対象の遺伝子の転写開始部位に転写因子を動員し、それにより転写を活性化または上方制御する。dCas-9が転写リプレッサーに融合される場合、転写は阻害、下方制御、または抑制される。
【0034】
一実施形態では、DNAの標的領域は遺伝子であってもよい。一実施形態では、DNAの標的領域は、遺伝子のプロモーター領域または調節因子領域であってもよい。一実施形態では、DNAの標的領域は、下流遺伝子またはタンパク質を調節する。一実施形態では、下流遺伝子またはタンパク質を調節することは、下流遺伝子またはタンパク質の活性化または阻害を含む。
【0035】
一部の実施形態では、細胞は、選択マーカー系を含む。例えば、本明細書の方法に開示されるように、第一の培養物のcas-9陽性細胞は、一つ以上の選択マーカーを含有するように改変され得る。選択マーカー系は、調節されているタンパク質でのみ活性化される選択マーカーに融合または連結されたマーカータンパク質に関与することができる。「マーカータンパク質」は、調節され得る任意のタンパク質であってもよく、調節されるとは、マーカータンパク質が形状を変えることか、一つ以上の他のタンパク質または核酸に結合することか、活性の変化を有することか、または発現レベルの変化を有することを意味する。マーカータンパク質は、一つ以上のgRNAによって標的化される遺伝子によって調節されてもよく、その結果、遺伝子がCas9によって切断される場合、マーカータンパク質は調節されず、選択マーカーが活性化されない。したがって、活性化された選択マーカーを有しない細胞を、細胞内の選択マーカーに融合または連結されたマーカータンパク質を調節する遺伝子を含む細胞として選択することができる。例えば、タウは、CFPと融合または連結することができる。別のタウタンパク質をYFPに融合または連結することができる。タウタンパク質の凝集に伴い、CFPに当たった光が青色光として放射され、YFPが励起され、黄色光が放射される。タウタンパク質の凝集がない場合、CFPから放射される青色光は、他のタウタンパク質のYFPを励起することができないため、黄色光は放射されない。したがって、タウを調節する遺伝子が一つ以上のgRNAによって標的化され、したがって切断される場合、黄色光は放射されない。最終的に、この遺伝子は、タウを調節する(例えば、タウ凝集を引き起こす)遺伝子として識別され得る。CRISPRaにおいて、gRNAが標的領域に結合する場合、下流遺伝子が活性化され、したがって、過剰発現または過剰量の選択マーカーを有する細胞が選択され得る。例えば、上述のタウタンパク質を使用して、gRNAを有しない細胞と比較して増加した量の黄色光が、タウを調節する遺伝子を示すことができる。既知の経路、具体的には疾患経路に存在する任意の数のタンパク質をマーカータンパク質として使用して、そのマーカータンパク質を調節し、最終的に特定の疾患に関与することが見出され得る遺伝子を識別することができる。
【0036】
一実施形態では、細胞のセットは、(例えば、表現型によって)カテゴライズされ、選択されてもよく(例えば、図2;206)、初期感染後のある程度の時間、例えば、感染後、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15日など、実施され得る。実施形態では、細胞のセット中に含有される選択マーカーを利用する、多くのタイプのスクリーン/選択機構が使用され得る。一実施形態では、選択機構は、第二の細胞集団を薬剤に曝露するか、または第二の細胞集団をタンパク質活性または発現レベルを特定する物質に曝露することのうちの一つ以上を含む。一実施形態では、指定された表現型を有する細胞を選択することは、一つ以上の選択マーカーに基づいて細胞をソートすることを含む。一実施形態では、細胞の生存率を、選択に使用することができる。
【0037】
一実施形態では、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることは、細胞における指定された表現型の存在または不在を特定することを含む。第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることは、選択機構を第二の細胞培養物に適用することを含み得る。一実施形態では、表現型が特定されると、指定された表現型を有する(または指定された表現型を有しない)細胞を選択することが実施され得る。表現型は、細胞成長、増殖、形態、酵素機能、シグナル伝達、発現パターン、下流発現パターン、レポーター遺伝子活性化、ホルモン放出、成長因子放出、神経伝達物質放出、リガンド結合、アポトーシス、および生成物形成における変化などのアッセイで測定できる任意の観察可能な特徴または機能的効果である。一実施形態では、指定された表現型は蛍光または細胞生存であり得る。
【0038】
細胞は、例えば、マーカーのゲノム統合によって、またはゲノム内に統合されていない細胞内マーカーの存在によって、直接選択することができる表現型を伝達するために改変され得る。本明細書で使用される場合、「マーカー」は最も一般的には、細胞中に存在する(例えば、発現される)場合に、そのマーカーを含有するとしてその細胞を視覚化するか、または識別する属性または表現型をもたらす生物学的特徴または形質を指す。様々なマーカータイプが一般的に使用され、そして例えば、可視マーカー、例えば発色、例えばlacZ相補(β-ガラクトシダーゼ)、または蛍光、例えば緑色蛍光タンパク質(GFP)またはGFP融合タンパク質、RFP、BFP、ルシフェラーゼ、β-ガラクトシダーゼ、強化緑色蛍光タンパク質(eGFP)、シアン蛍光タンパク質(CFP)、黄色蛍光タンパク質(YFP)、強化黄色蛍光タンパク質(eYFP)、青色蛍光タンパク質(BFP)、強化青色蛍光タンパク質(eBFP)、DsRed、ZsGreen、MmGFP、mPlum、mCherry、tdトマト、mイチゴ、J-赤、mオレンジ、mKO、mシトリン、Venus、YPet、エメラルド、CyPet、セルリアン、T-サファイア、およびアルカリホスファターゼの発現など、表現型マーカー(成長率、細胞形態、コロニーの色またはコロニーの形態、温度感受性)、栄養要求性マーカー(成長要件)、抗生物質感受性および耐性、抗原感受性により区別できる生体分子などの分子マーカー(例えば、血液型抗原および組織適合性マーカー)、細胞表面マーカー(例えば、H2KK)、酵素マーカー、ならびに核酸マーカー、例えば制限断片長多型(RFLP)、一塩基多型(SNP)、および他の様々な増幅可能な遺伝子多型、であり得る。したがって、例えば、一つ以上の選択マーカーは、β-ガラクトシダーゼまたはルシフェラーゼなどの、検出可能な酵素であり得る。
【0039】
「選択マーカー」または「スクリーニングマーカー」または「陽性選択マーカー」は、細胞中に存在するとき、選択マーカー形質を発現しない他の細胞からのそれらの細胞の選択または分離を可能にする属性または表現型をもたらすマーカーを指す。様々な遺伝子が、選択マーカーとして使用され得る、例えば、薬剤耐性または栄養要求性救済をコードする遺伝子は広く知られている。例えば、カナマイシン(ネオマイシン)耐性は、細菌性カナマイシン耐性をコードする遺伝子を担持するプラスミドを取り込んだ細菌を選択するための形質として使用することができる(例えば、酵素ネオマイシンホスホトランスフェラーゼII)。非トランスフェクト細胞は、培養物がネオマイシンまたは類似の抗生物質で処理されると最終的に死滅する。細胞のセットは、薬物スクリーンで使用され、薬剤耐性を付与する遺伝子を識別することができる。細胞は、対象の薬剤で処理されてもよく、富化されているgRNAは、変異時に薬剤耐性を付与する遺伝子と関連付けられる。ウイルスまたは細菌病原体に対する耐性のスクリーンを使用して、感染または病原体の複製を防ぐ遺伝子を識別することができる。薬剤耐性スクリーンにおいてと同様に、病原体曝露後の生存は、強力な選択を提供する。癌では、陰性選択CRISPRスクリーンは、分子標的化療法の基礎を提供することができる特定の癌サブタイプにおける「癌遺伝子依存性」を識別し得る。発生研究については、ヒトおよびマウスの多能性細胞におけるスクリーニングは、多能性または別個の細胞型への分化に必要な遺伝子を正確に示し得る。
【0040】
一実施形態では、細胞は、選択マーカー系を含む。選択マーカー系は、蛍光タンパク質FRETバイオセンサーを含み得る。例えば、タウは、CFPと融合または連結することができる。別のタウタンパク質をYFPに融合または連結することができる。タウタンパク質の凝集に伴い、CFPに当たった光が青色光として放射され、YFPが励起され、黄色光が放射される。タウタンパク質の凝集がない場合、CFPから放射される青色光は、他のタウタンパク質のYFPを励起することができないため、黄色光は放射されない。したがって、タウを調節する遺伝子が一つ以上のgRNAによって標的化され、したがって切断される場合、黄色光は放射されない。最終的に、この遺伝子は、タウを調節する(例えば、タウ凝集を引き起こす)遺伝子として識別され得る。CRISPRaにおいて、gRNAが標的領域に結合する場合、下流遺伝子が活性化され、したがって、過剰発現または過剰量の選択マーカーを有する細胞が選択され得る。例えば、上述のタウタンパク質FRETバイオセンサーを使用して、gRNAを有しない細胞と比較して増加した量の黄色光が、タウを調節する遺伝子に結合されたgRNAを示すことができる。既知の経路、具体的には疾患経路に存在する任意の数のタンパク質をマーカータンパク質として使用して、そのマーカータンパク質を調節し、最終的に特定の疾患経路に関与することが見出され得る遺伝子を識別することができる。
【0041】
一実施形態では、第一の培養物の細胞および第二の培養物の選択された細胞は配列決定されてもよい(例えば、図2;202および207)。第一の培養物の細胞および第二の培養物の選択された細胞は、感染後、異なる時点で配列決定されてもよい。第一の培養物の細胞および第二の培養物の選択された細胞は、選択前のリード数(第一の培養物の細胞)を生成し、選択後のリード数(第二の培養物の選択された細胞)を生成するために、感染後の異なる時点で配列決定されてもよい。例えば、第一の培養物の細胞は、感染の3日後に配列決定されてもよく、第二の培養物の選択された細胞は、感染の10日後に配列決定されてもよい。細胞は、NGSなどの任意の利用可能な配列決定技術を使用して配列決定することができる。細胞の核酸を配列決定して、配列データを生成することができる。配列データは、リード数を含むことができる。配列データは、ライブラリーの一つ以上のgRNAについてのリード数を含むことができる。細胞を配列決定することは、データ構造に格納され得る配列データを生成することができる。データ構造は、一つ以上の核酸配列および/またはサンプル識別子を含むことができる。
【0042】
配列決定から生じるリード数は、複製の頻繁な不在、gRNAノックアウト効率の変動性、およびリード数分布の変動性を含む、CRISPRスクリーン解析に存在する従来のバイアスを被る。これらのバイアスは、陰性二項式アプローチ、log比アプローチ(log-ratio approache)、および対のt検定アプローチに従ってリード数を解析する際に不良な結果をもたらす。こうしたアプローチは、同じ遺伝子についてのgRNA間、ならびにリピート間のある一定の均質性/一致を必要とする。これらの既存のアプローチは、例えば、異なる感染効率、異なる遺伝子編集効率、スクリーニングライブラリー内の初期ウイルス数、および同じ表現型を有する他のガイドの存在から生じ得る、同じ遺伝子についてのgRNA間およびリピート間の大きな変動を処理することができない。これらのバイアスは、CRISPR実験内、および複数のCRISPR実験の間に存在し得る。本明細書に記述された、標的領域当たりのgRNAの合計数と、すべての標的領域にわたるgRNAの総数とを決定する工程は、リード数の大きな変動に対して堅牢であるリード数処理を表す。本開示の方法の一実施形態は、各ガイドの正確なリード数の代わりに、個々の実験における遺伝子当たりのガイドの陽性発生に基づくため、既存のアプローチに対する利点を提供する。
【0043】
リード数を正規化することができる。例えば、異なるサンプルからのリード数は、ライブラリーサイズおよびリード数分布の影響を調整するために、中央値正規化され得る。実施形態では、所与のN CRISPR/Cas9ノックアウトスクリーニング実験は、MgRNAのセットで行われ、実験j中のgRNAのリード数iは、xij、1≦i≦M、1≦j≦Nである。配列決定深度(またはライブラリーサイズ)は実験間で異なる場合があるため、リード数は、全実験に比率中央値法を適用することによって調整することができる。実施形態では、調整されたリード数x’ijは、方程式:
【0044】
【数10】
【0045】
に従って計算されてもよく、式中、Sは、j=1~Mについて
【0046】
【数11】
【0047】
の中央値である。別の実施形態では、調整されたリード数x’ijは、xij/の丸めた値として計算されてもよく、式中、sは、実験jにおける寸法係数であり、個々のsgRNAリード数から計算された全ての寸法係数の中央値として算出される:
【0048】
【数12】
【0049】
式中、
【0050】
【数13】
【0051】
は、gRNAのリード数iの幾何平均である。
【0052】
【数14】
【0053】
あるいは、gRNA当たりのリード数および遺伝子当たりのリード数は、100万当たりのカウント、総数、または寸法係数正規化のいずれかを使用して正規化されてもよい。Anders,S.およびHuber,W.(2010)Differential expression analysis for sequence count data.Genome Biol.,11, R106(その全体が参照により本明細書に組み込まれる)を参照されたい。
【0054】
一実施形態では、本開示の方法は、配列データを使用して、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える選択された細胞における、gRNAのそれぞれの数(n’)の合計(Σ)を決定する(例えば、図2;203、208)。本方法はまた、全ての標的領域にわたって、そのリード数が背景閾値を超える選択された細胞の、gRNAの総数(N’)を決定することも含み得る(例えば、図2;204、209)。
【0055】
したがって、開示された方法は、選択された細胞の配列におけるライブラリーからgRNAの陽性発生を識別することができる。リード数を含む配列データを解析して、DNAの各標的領域(例えば、遺伝子)について、選択後「存在の合計」またはn’を決定することができる。各gRNAの個々のリード数を背景閾値と比較することによって、「存在の合計」、またはDNAの標的領域当たりで存在するgRNAのそれぞれの数を決定することができる。DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を決定することは、コンピューティングデバイスによって実施され得る。背景閾値は、配列データ中の背景ノイズを低減するのに十分な任意の値とすることができる。例えば、30を背景閾値として使用してもよい。したがって、リード数によって示される存在するgRNAの量と対比して、「存在の合計」は存在するgRNAの数(そのリード数が背景閾値を超える)を示す。
【0056】
一実施形態における、cas9陽性細胞の第二の培養物をウイルスベクターのライブラリーで感染させる工程と、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズする工程と、指定された表現型を有する細胞を選択し、選択された細胞を配列決定して、gRNAの各々の選択後リード数を取得する工程と、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える選択された細胞において、gRNAのそれぞれの数を合計する(Σ)工程であって、式中Σ=n’である、合計する工程と、標的領域全体にわたり、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計する工程(Σ)であって、式中Σ=N’が任意の回数リピートされ得る、合計する工程。
【0057】
一実施形態では、本開示の方法はさらに、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が陽性的に選択されると識別することを含む(例えば、図2;211)。一部の実施形態では、標的領域が陽性的に選択されると識別することは、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと決定することを含む。
【0058】
一部の実施形態では、本開示の方法はさらに、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域を第二の遺伝子の修飾因子(modifier)として識別することを含む。一部の実施形態では、本開示の方法はさらに、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域を治療標的として識別することを含む。一部の実施形態では、本開示の方法はさらに、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が指定された表現型と相関すると識別することを含む。一部の実施形態では、本開示の方法はさらに、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が保護効果を示すと識別することを含む。したがって、開示された方法は、疾患経路に関与する標的領域(例えば、遺伝子)、一つ以上の他の遺伝子/タンパク質の調節に関与する標的領域(例えば、遺伝子)、および/または表現型に関連する標的領域(例えば、遺伝子)の識別を助けることができる。候補遺伝子の遺伝子発現の調製が、選択された表現型に変化を生じさせる場合、DNAの領域(例えば、候補遺伝子)は、選択された表現型と「関連」してもよい。
【0059】
一実施形態では、開示された方法は、各gRNAについて、濃縮スコアを決定することをさらに含む。一部の実施形態では、各gRNAについて、濃縮スコアを決定することは、N/N’を評価することを含む。濃縮スコアは、閾値を超えるように決定されてもよい。閾値は、他の標的領域の他の濃縮スコアに関するものであってもよい。高濃縮スコアを有し、偶然にgRNAが存在する確率が低い標的領域を使用して、標的領域を表現型と関連すると識別してもよい。
【0060】
例示的な実施形態において、方法およびシステムは、図3に示され、以下に記載されるように、コンピュータ301上で実装され得る。同様に、方法およびシステムは、一つ以上のコンピュータを利用して、一つ以上の場所で一つ以上の機能を実施できる。図3は、方法を実施するための例示的な操作環境を示すブロック図である。この例示的な操作環境は、あくまで操作環境の一例にすぎず、操作環境アーキテクチャの使用または機能の範囲に関する何らかの制限を示唆することを意図したものではない。また、いかなる操作環境も、例示的な操作環境において図示されるコンポーネントのいずれか一つもしくは組み合わせに関連する何らかの依存性または要件を有するものとして解釈すべきではない。
【0061】
本方法およびシステムは、多数の他の汎用もしくは特殊用途向けコンピューティングシステム環境または構成で動作可能であり得る。システムおよび方法と共に使用するのに好適であり得るコンピューティングシステム、環境、および/または構成の例には、パーソナルコンピュータ、サーバーコンピュータ、ラップトップデバイス、およびマルチプロセッサシステムが含まれるが、これらに限定されるものではない。追加的な例には、セットトップボックス、プログラマブル大衆消費電子製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれかを含む分散コンピューティング環境が含まれる。
【0062】
方法およびシステムの処理は、ソフトウェアコンポーネントを介して実施できる。システムおよび方法は、一つ以上のコンピュータまたは他のデバイスを介して実行されるプログラムモジュールなどの、コンピュータ実行可能命令の一般的なコンテキストで記述できる。概して、プログラムモジュールは、コンピュータコード、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含み、それらによって特定のタスクが実行されるかまたは特定の抽象データ型が実施される。また、方法は、通信ネットワーク経由でリンクされたリモートプロセシングデバイスを介してタスクが実施されるグリッドベースおよび分散コンピューティング環境においても実践することができる。分散コンピューティング環境において、プログラムモジュールは、メモリ記憶デバイスを含むローカルおよびリモートコンピュータストレージ媒体の両方に配置できる。
【0063】
さらに、システムおよび方法は、コンピュータ301の形態のコンピューティングデバイスを介して実装され得る。コンピュータ301のコンポーネントには、限定されるものではないが、一つ以上のプロセッサ303と、システムメモリ312と、一つ以上のプロセッサ303を含む様々なシステムコンポーネントをシステムメモリ312に連結するシステムバス313と、が含まれ得る。システムは並列計算を利用できる。
【0064】
システムバス313は、多様なバスアーキテクチャのいずれかを使用した、メモリバスもしくはメモリコントローラ、周辺機器用バス、アクセラレーテッドグラフィックスポート、またはローカルバスを含む、いくつかの可能なタイプのバス構造のうちの一つ以上を表す。バス313、および本記述中に指定されている全てのバスはまた、有線または無線ネットワーク接続経由で実装することもでき、一つ以上のプロセッサ303を含む各サブシステム、大容量ストレージデバイス304、オペレーティングシステム305、ソフトウェア306、データ307、ネットワークアダプタ308、システムメモリ312、入出力インターフェース310、ディスプレイアダプタ309、ディスプレイデバイス311、およびヒトマシンインターフェース302は、この形態のバスを介して接続された物理的に別個の位置にある一つ以上のリモートコンピューティングデバイス314a、b、c内に収容され、事実上完全に分散されたシステムを実装し得る。
【0065】
コンピュータ301は、典型的には、様々なコンピュータ可読媒体を含む。例示的な可読媒体は、コンピュータ301によりアクセスできる任意の利用可能な媒体であってよく、例えば、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体の両方が挙げられるが、これらに限定されるものではない。システムメモリ312は、ランダムアクセスメモリ(RAM)などの揮発性メモリ、および/またはリードオンリメモリ(ROM)などの不揮発性メモリの形態のコンピュータ可読媒体を含む。システムメモリ312は、典型的には、データ307のようなデータ、および/または一つ以上のプロセッサ303によって直ちにアクセス可能であり、かつ/または現在操作されているオペレーティングシステム305およびソフトウェア306などのプログラムモジュールを含む。
【0066】
別の実施形態では、コンピュータ301はまた、他のリムーバブル/非リムーバブルな、揮発性/不揮発性コンピュータストレージ媒体を含むこともできる。一例として、図3は、コンピュータ301用のコンピュータコード、コンピュータ可読命令、データ構造、プログラムモジュール、および他のデータの不揮発性ストレージを提供することができる、大容量ストレージデバイス304が示されている。例えば、限定されるものではないが、大容量記憶デバイス304は、ハードディスク、リムーバブル磁気ディスク、リムーバブル光学式ディスク、磁気カセットまたは他の磁気ストレージデバイス、フラッシュメモリカード、CD-ROM、デジタル多用途ディスク(DVD)または他の光学式ストレージ、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、および/または電気的消去可能プログラマブルリードオンリメモリ(EEPROM)であり得る。
【0067】
任意選択的に、任意の数のプログラムモジュールが、オペレーティングシステム305およびソフトウェア306を例として含む大容量ストレージデバイス304に格納され得る。オペレーティングシステム305およびソフトウェア306(またはそれらのいくつかの組み合わせ)の各々には、プログラミングおよびソフトウェア306の要素を含めることができる。データ307はまた、大容量ストレージデバイス304に格納できる。データ307は、一つ以上のデータベースのいずれかに格納できる。そのようなデータベースの例には、DB2(登録商標)、MICROSOFT(登録商標)Access、MICROSOFT(登録商標)SQL Server、ORACLE(登録商標)、および/またはMYSQL(登録商標)、POSTGRESQL(登録商標)が含まれる。データベースは、集中型とすることができ、または複数のシステムにわたって分散することができる。データ307は、配列決定データを含んでもよい。配列決定データは、リードデータ(例えば、リード数)を配列決定することを含んでもよい。コンピュータ301は、例えば、図1および図2のそれぞれ工程120および202で生成される第一のリード数データを受信してもよい。コンピュータ301は、例えば、図1および図2のそれぞれ工程160および207で生成される第二のリード数データを受信してもよい。
【0068】
別の実施形態では、ユーザは、入力デバイス(図示せず)を介して、コンピュータ301内にコマンドおよび情報を入力することができる。そのような入力デバイスの例としては、以下に限定されないが、キーボード、指示デバイス(例えば、「マウス」)、マイクロホン、ジョイスティック、スキャナー、グローブなどの触覚入力デバイス、および/または他の身体被覆物が挙げられる。これらのおよび他の入力デバイスは、システムバス313に連結されているヒト機械インターフェース302を介して、一つ以上のプロセッサ303に接続することができるが、パラレル・ポート、ゲーム・ポート、IEEE 1394ポート(Firewire(登録商標)ポートとも称される)、シリアル・ポートやユニバーサル・シリアル・バス(USB)などの他のインターフェースおよびバス構造によって接続することができる。
【0069】
さらに別の実施形態では、ディスプレイデバイス311はまた、ディスプレイアダプタ309などのインターフェースを介してシステムバス313に接続できる。コンピュータ301に二つ以上のディスプレイアダプタ309を設けることができ、コンピュータ301に二つ以上のディスプレイデバイス311を設けることもできることが予期される。例えば、ディスプレイデバイスは、モニター、液晶ディスプレイ(LCD)、またはプロジェクターとすることができる。ディスプレイデバイス311に加えて、他の出力周辺デバイスには、入出力インターフェース310を介してコンピュータ301に接続できるスピーカ(図示せず)およびプリンタ(図示せず)などのコンポーネントを含めることができる。本方法の任意の工程および/または結果は、任意のフォームで出力デバイスに出力できる。そのような出力は、テキスト、グラフィカル、アニメーション、オーディオ、および/または触覚(tactile)を含むが、これらに限定されない任意のフォームの視覚的表象であり得る。ディスプレイ311およびコンピュータ301は、一つのデバイスの一部である場合もあれば、別々のデバイスである場合もある。
【0070】
コンピュータ301は、一つ以上のリモートコンピューティングデバイス314a、b、cへの論理的接続を使用してネットワーク環境で動作することができる。一例として、リモートコンピューティングデバイスは、パーソナルコンピュータ、ポータブルコンピュータ、スマートフォン、サーバー、ルーター、ネットワークコンピュータ、ピアデバイスまたは他の共通ネットワークノードなどであり得る。コンピュータ301とリモートコンピューティングデバイス314a、b、cとの間の論理的接続は、ローカルエリアネットワーク(LAN)および/または一般的なワイドエリアネットワーク(WAN)などのネットワーク315を介して行うことができる。そのようなネットワーク接続は、ネットワークアダプタ308経由であり得る。ネットワークアダプタ308は、有線および無線の両方の環境で実装できる。一実施形態では、システムメモリ312は、ネットワーク315経由で、一つ以上のリモートコンピューティングデバイス314a、b、cにアクセス可能にされた一つ以上のオブジェクトを格納できる。したがって、コンピュータ301は、クラウドベースのオブジェクトストレージとして機能できる。別の実施形態では、一つ以上のリモートコンピューティングデバイス314a、b、cのうちの一つ以上には、コンピュータ301へのアクセスを許可されたオブジェクトを一つ以上、および/または一つ以上のリモートコンピューティングデバイス314a、b、cのうちの他方へのアクセスを許可されたオブジェクトを一つ以上格納できる。したがって、一つ以上のリモートコンピューティングデバイス314a、b、cはまた、クラウドベースのオブジェクトストレージとして機能できる。
【0071】
そのようなプログラムおよびコンポーネントは、コンピューティングデバイス301の異なるストレージコンポーネント内に様々な時間に存在し、コンピュータの一つ以上のプロセッサ303を介して実行されることが認識されるが、例証の便宜上、本明細書においてアプリケーションプログラムおよびオペレーティングシステム305などの他の実行可能プログラムコンポーネントは、離散的ブロックとして示されている。一実施形態では、ソフトウェア306および/またはデータ307の少なくとも一部分は、コンピューティングデバイス301、リモートコンピューティングデバイス314a、b、c、および/またはそれらの組み合わせのうちの一つ以上の上で格納および/または実行され得る。したがって、ソフトウェア306および/またはデータ307は、ソフトウェア306および/またはデータ307へのアクセスを、ネットワーク315(例えば、インターネット)を介して実施できるクラウドコンピューティング環境内で動作できる。さらに、一実施形態では、コンピューティングデバイス301、リモートコンピューティングデバイス314a、b、c、および/またはそれらの組み合わせのうちの一つ以上にわたって、データ307を同期化できる。
【0072】
ソフトウェア306の実装形態は、何らかの形態のコンピュータ可読媒体上に格納される場合もあれば、またはそのコンピュータ可読媒体を介して伝送される場合もある。方法のいずれも、コンピュータ可読媒体上に具現化されたコンピュータ可読命令によって実施することができる。コンピュータ可読媒体は、コンピュータによってアクセス可能な任意の利用可能媒体とすることができる。例として、かつ限定を意図するものではないが、コンピュータ可読媒体は、「コンピュータストレージ媒体」および「通信媒体」を含み得る。「コンピュータストレージ媒体」は、コンピュータ可読命令、データ構造、プログラムモジュールもしくは他のデータなどの情報を記憶するための任意の方法または技術で実装される揮発性および不揮発性のリムーバブル媒体および非リムーバブル媒体を備える。例示的なコンピュータストレージ媒体は、限定されるものではないが、RAM、ROM、EEPROM、フラッシュメモリもしくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)、または他の光学式ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージデバイスもしくは他の磁気ストレージデバイス、または、所望の情報を格納する目的に使用でき、かつコンピュータがアクセスできる任意の他の媒体を具備する。
【0073】
ソフトウェア306は、本明細書に開示される方法の一部または全ての工程を実施するように構成されてもよい。一実施形態では、ソフトウェア306は、DNAの複数の標的領域の各々に対する少なくとも3つのガイドRNA(gRNA)のライブラリーを含むベクターを用いた感染後の、第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定するように、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定するように、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定するように、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたって、第二の細胞集団に存在するgRNAの総数(N’)を決定するように、n、N、n’、およびN’に基づき、複数の標的領域の各標的領域に対して、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定するように、対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定するように、および選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されることを識別するように、構成されてもよい。
【0074】
DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定することは、そのリード数が背景閾値を超える第一の細胞集団中に存在する各gRNAを数えることを含み得る。
【0075】
DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる、第二の細胞集団中に存在するgRNAの総数(N’)を決定することは、そのリード数が背景閾値を超える第二の細胞集団の選択された細胞中に存在する各gRNAを数えることを含み得る。
【0076】
複数の標的領域の各標的領域について、n、N、n’、およびN’に基づいて、選択された細胞内の標的領域についてn’ガイドを偶然に観察する確率を決定することは、
【0077】
【数15】
【0078】
を評価することを含むことができ、式中
【0079】
【数16】
【0080】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する。
対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’ガイドを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定することは、
【0081】
【数17】
【0082】
を評価することを含み得る。
選択された細胞における対象の配列のn’以上のgRNAを偶然に観察できる確率に基づいて、対象の配列が陽性的に選択されると識別することは、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすことを決定することを含み得る。
【0083】
ソフトウェア306はさらに、各gRNAについて、濃縮スコアを決定するように構成され得る。各gRNAについて、濃縮スコアを決定することは、N/N’を評価することを含み得る。
【0084】
ソフトウェア306は、データ307として存在するgRNAのリード数および数を格納するように構成されてもよい。図4は、データ307の実施形態を表す例示的なデータ構造410を示す。データ構造410は、一つ以上の表、アレイ等を備えてもよい。データ構造410は、複数の行および複数の列を含み得る。列「遺伝子#」は、DNAの固有の遺伝子または標的領域の識別子を含んでもよい。列「遺伝子当たりのgRNA」は、DNAの遺伝子または標的領域に結合し得る固有のgRNAの識別子を含む。列「gRNAリード数(選択前)」には、リード数の値が含まれる。列「n」は、列「gRNAリード数(選択前)」に由来するDNAの標的領域(例えば遺伝子)当たりで存在するgRNAの数を含む。列「gRNAリード数(選択後)」には、リード数の値が含まれる。列「n’」は、列「gRNAリード数(選択後)」に由来するDNAの標的領域(例えば遺伝子)当たりで存在するgRNAの数を含む。
【0085】
図4のデータ構造410は、図示の目的でデータ307として格納される人工値を含んで示されている。遺伝子1については、gRNA A、B、およびCはライブラリーに存在し、遺伝子1に結合してもよい。配列決定後、gRNA A、B、およびCは、それぞれ100、200、および10のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、gRNA AおよびBのみが30を超えるリード数を有するため、2(n=3)であると、ソフトウェア306によって決定されてもよい。遺伝子2については、gRNA D、E、およびFがライブラリーに存在し、遺伝子2に結合してもよい。配列決定後、gRNA D、E、およびFは、それぞれ500、300、および200のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、gRNA D、E、およびFが30を超えるリード数を有するため、3(n=3)であると、ソフトウェア306によって決定されてもよい。遺伝子3については、gRNA G、H、I、およびJがライブラリーに存在し、遺伝子3に結合してもよい。配列決定後、gRNA G、H、I、およびJは、それぞれ200、250、10、および300のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、gRNA G、H、およびJのみが30を超えるリード数を有するため、3(n=3)であると、ソフトウェア306によって決定されてもよい。遺伝子4については、gRNA K、L、M、およびNがライブラリーに存在し、遺伝子4に結合してもよい。配列決定後、gRNA K、L、M、およびNは、それぞれ100、200、200、および100のリード数で細胞中に存在した。背景閾値30は、リード数に適用されてもよく、ライブラリーからのgRNAの陽性発生数は、gRNA K、L、M、およびNが30を超えるリード数を有するため、4(n=4)であるとソフトウェア306によって決定されてもよい。
【0086】
図4のデータ構造410に示すように、gRNAの総数またはNは12である。Nは、各遺伝子についてのnの値からの2+3+3+4に由来する(n+n+n+n)。したがって、細胞集団を感染させるために使用された14個の異なるgRNA(gRNA A~N)のオリジナルライブラリーのうち、背景閾値を超える量で存在したのは12個の異なるgRNAのみであった。nおよびNの値は、データ構造に格納されてもよい。nおよびNの値に加えて、データ構造は、一つ以上の核酸配列(例えば、標的領域および/またはgRNA配列)および/または一つ以上のgRNA識別子を含み得る。
【0087】
列「遺伝子#」は、DNAの固有の遺伝子または標的領域の識別子を含む。列「遺伝子当たりのgRNA」は、DNAの遺伝子または標的領域に結合し得る固有のgRNAの識別子を含む。列「gRNAリード数(選択後)」には、リード数の値が含まれる。列「n’」は、列「gRNAリード数(選択後)」に由来するDNAの標的領域(例えば遺伝子)ごとに存在するgRNAの数を含む。図4のデータ構造410に示すように、遺伝子1については、gRNA A、B、およびCがライブラリーに存在し、遺伝子1に結合してもよい。選択後、配列決定後、gRNA A、B、およびCは、それぞれ0、50、および0のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、gRNA Bのみが30を超えるリード数を有するため、1(n’=1)であると、ソフトウェア306によって決定されてもよい。遺伝子2については、gRNA D、E、およびFがライブラリーに存在し、遺伝子2に結合してもよい。選択後、配列決定後、gRNA D、E、およびFは、それぞれ100、100、および100のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、gRNA D、E、およびFが30を超えるリード数を有するため、3(n’=3)であると、ソフトウェア306によって決定されてもよい。遺伝子3については、gRNA G、H、I、およびJがライブラリーに存在し、遺伝子3に結合してもよい。選択後、配列決定後、gRNA G、H、I、およびJは、それぞれ0、0、0、および20のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、いずれも30を超えるリード数を有しないため、0(n’=0)であると、ソフトウェア306によって決定されてもよい。遺伝子4については、gRNA K、L、M、およびNがライブラリーに存在し、遺伝子4に結合してもよい。選択後、配列決定後、gRNA K、L、M、およびNは、それぞれ0、0、0、および20のリード数で細胞内に存在した。背景閾値30は、リード数に適用されてもよく、またライブラリーからのgRNAの陽性発生数は、いずれのgRNAも30を超えるリード数を有しないため、0(n’=0)であると、ソフトウェア306によって決定されてもよい。
【0088】
そのリード数が背景閾値を超える選択された細胞内に存在する、全標的領域にわたる、gRNAの総数またはN’は、ソフトウェア306によって決定され得る。図4のデータ構造410に示すように、gRNAの総数またはN’は4である。N’は、各遺伝子についてのnの値からの1+3+0+0に由来する(n’+n’+n’+n’)。したがって、細胞集団に感染させるために使用された14個の異なるgRNA(gRNA A~N)のオリジナルライブラリーのうち、背景閾値を超える量で選択された細胞内に存在したのは4個の異なるgRNAのみであった。n’およびN’の値は、データ構造に格納されてもよい。n’およびN’の値に加えて、データ構造は、一つ以上の核酸配列(例えば、標的領域および/またはgRNA配列)および/または一つ以上のgRNA識別子を含み得る。
【0089】
実施形態では、データ307はまた、ソフトウェア306の一つ以上の結果を格納するように構成されてもよい。図5は、例えば、データ構造410を入力として使用して、ソフトウェア306によって生成される、結果データ構造510の例を示す。データ構造510は、一つ以上の表、アレイ等を備えてもよい。図5は、例示の目的での人工データおよび人工結果を示す。正式な統計p値は、ライブラリーサイズ、遺伝子当たりのガイドの数、および各実験における陽性ガイドの総数を考慮して実験リピートにわたるガイドの数を陽性的に観察するために計算されてもよい。データ構造510は、63,950gRNAの初期ライブラリー(N)を示す。データ構造510は、選択後、4,946のgRNA(N’)(gRNAの数量ではなく固有のgRNAの数)が実験1の細胞集団に、および13,606のgRNA(N’)(gRNAの量ではなく固有のgRNAの数)が実験2の細胞集団に残っていたことを示す。データ構造510に示されるように、標的領域1は、標的領域1の少なくとも一部に結合することができる三つの(3)gRNAを有する。実験1では、選択後細胞集団において、3つのgRNAのうち3つが偶然に存在する確率は、選択後に4,946のgRNAが細胞集団に残っていることを考慮すると、0.000462378である。実験2では、選択後細胞集団において、3つのgRNAのうち3つが偶然に存在する確率は、選択後に13,606のgRNAが細胞集団に残っていることを考慮すると、0.009629である。データ構造510は、3つ中2つ、3つ中1つ、および3つ中0のgRNAが、選択後細胞集団において偶然に存在する確率の結果を示す。
【0090】
データ構造510に示されるように、標的領域2は、標的領域2の少なくとも一部に結合することができる四つの(4)gRNAを有する。データ構造510は、4つ中4つ、4つ中3つ、4つ中2つ、4つ中1つ、および4つ中0のgRNAが、選択後細胞集団において偶然に存在する確率の結果を示す。データ構造510に示される結果から、確率は閾値を下回っている(例えば、十分に小さい)とソフトウェア306によって決定され得る。例えば、標的領域2、実験1については、4つのgRNAのうち4つが偶然に存在する確率は3.57411E-05であり、4つのgRNAのうち4つが、単に偶然に存在したわけではない可能性を示している。
【実施例
【0091】
A.実施例1:タウ凝集の遺伝子修飾因子を識別するためのゲノムワイドCRISPR/Cas9スクリーニングプラットフォームの開発
異常なタウタンパク質凝集のプロセスを変更する遺伝子および経路を特定するため、CRISPRヌクレアーゼ(CRISPRn)sgRNAライブラリーを用いたゲノムワイドスクリーンを実施するためのプラットフォームを開発し、タウ疾患関連タンパク質凝集体(すなわち、破壊された場合に、タウ線維化タンパク質の供給源に曝露されたときのタウ凝集体形成に対して細胞の感受性をより高くする遺伝子)によって細胞が「播種される」可能性を調節する遺伝子を識別した。スクリーンは、CFPまたはYFPのいずれかに融合される、P301S病原性変異を有するタウ微小管結合ドメイン(MBD)を含むタウ4リピートドメイン、tau_4RDを安定的に発現するHEK293T細胞からなるタウバイオセンサーヒト細胞株を採用した。すなわち、HEK293T細胞株は、蛍光タンパク質CFPまたは蛍光タンパク質YFP:タウ4RD-CFP/タウ4RD-YFP(TCY)に融合された疾患関連タンパク質バリアントを安定的に発現する二つの導入遺伝子を含有し、タウリピートドメイン(4RD)はP301S病原性変異を含む。
【0092】
これらのバイオセンサー系統では、タウ-CFP/タウ-YFPタンパク質凝集は、FRETシグナルを産生し、これはドナーCFPからアクセプターYFPへの蛍光エネルギーの伝達の結果である。タウ凝集体を含有するFRET陽性細胞は、フローサイトメトリーによりソーティングおよび単離することができる。ベースラインでは、刺激されていない細胞は、最小限のFRETシグナルで、安定した可溶性状態のレポーターを発現する。刺激(例えば、種粒子のリポソームトランスフェクション)時に、レポータータンパク質は凝集体を形成し、FRETシグナルを産生する。凝集体含有細胞は、FACSによって単離することができる。安定的に増殖する凝集体含有細胞株、Agg[+]は、Agg[-]細胞株のクローン性段階希釈(clonal serial dilution)によって単離することができる。
【0093】
遺伝子スクリーニングに有用となるように、このタウバイオセンサー細胞株にいくつかの改変を行った。まず、これらのタウバイオセンサー細胞を、レンチウイルスベクターを介してCas9発現導入遺伝子(SpCas9)を導入することによって改変した。Cas9を発現するクローン性トランスジェニック細胞株を、ブラストサイジンで選択し、クローン性段階希釈により単離して、単細胞誘導クローン(single-cell-derived clones)を得た。クローンを、qRT-PCRによるCas9発現のレベル、およびデジタルPCRによるDNA切断活性について評価した。
【0094】
具体的には、Cas9変異効率を、二つの選択された標的遺伝子に対して、gRNAをコードするレンチウイルスの形質導入の3日後および7日後にデジタルPCRにより評価した。切断効率は、より低発現のクローンでCas9レベルによって制限された。十分なレベルのCas9発現を有するクローンは、最大活性を達成するために必要であった。より低いCas9発現を有するいくつかの誘導クローンは、標的配列を効率的に切断できなかったが、より高い発現を有するクローン(スクリーニングに使用されるものを含む)は、培養物中での三日後、約80%の効率で、遺伝子PERKおよびSNCAの標的配列で変異を生成することができた。効率的な切断は、gRNA形質導入後3日ですでに観察されており、7日後ではわずかな改善のみであった。クローン7B10-C3を、後続のライブラリースクリーンに使用する高性能クローンとして選択した。
【0095】
第二に、細胞をタウ播種活性に対して感受性にするための試薬および方法を開発した。タウ細胞間増殖は、凝集体含有細胞によって分泌されるタウ凝集活性から生じる場合がある。タウ凝集の細胞増殖を試験するために、YFPに融合される、P301S病原性変異を有するタウ微小管結合ドメイン(MBD)を含む、タウリピートドメイン、タウ_4RDを安定的に発現するHEK293T細胞からなるタウYFP細胞株のサブクローンを取得した。
【0096】
凝集状態でタウ-YFPタンパク質が安定的に存在する細胞(Agg[+])を、リポフェクタミン試薬と混合された組み換え線維化タウで、これらのタウ-YFP細胞を処理して、これらの細胞によって安定的に発現されるタウ-YFPタンパク質の凝集を播種することによって取得した。次いで、単細胞誘導クローンを得るために、「播種される」細胞を段階希釈した。次いで、これらのクローンを増殖させて、経時的な増殖継代および複数継代培養で、タウYFP凝集体がすべての細胞で安定的に持続するクローン性細胞株を識別した。これらのタウ-YFP_Agg[+]クローンのうちの一つを使用して、タウ-YFP_Agg[+]細胞が四日間コンフルエントであった培地を収集して、ならし培地を産生した。次いで、ならし培地(CM)を、3:1のCM:新鮮培地の比率でナイーブバイオセンサータウ-CFP/タウ-YFP細胞に塗布し、タウ凝集をこれらのレシピエント細胞のうち少数の割合で誘導するようにした。リポフェクタミンは使用しなかった。リポフェクタミンを使用してレシピエント細胞をトリックしてタウ凝集を強制/増加させることなく、可能な限り生理学的なアッセイを有するために、リポフェクタミンは使用されなかった。凝集の尺度としてFRETシグナルを産生する細胞の割合を評価するためにフローサイトメトリーを使用することによって測定されるように、ならし培地は、細胞の約0.1%で一貫してFRETを誘導した。
【0097】
B.実施例2:タウ凝集の遺伝子的修飾因子を識別するためのゲノムワイドCRISPR/Cas9スクリーニング
FRET(+)細胞における濃縮sgRNAとしてのタウ凝集の変更遺伝子を明らかにするため、凝集体(Agg[-])なしのCas9発現タウ-CFP/タウ-YFPバイオセンサー細胞を、二つのヒトゲノムワイドCRISPR sgRNAライブラリー(GeCKO AおよびGeCKO B)(図7)で、レンチウイルス送達アプローチを用いて形質導入し、各標的遺伝子でノックアウト変異を導入した。各CRISPR sgRNAライブラリーは、1遺伝子当たり約3つのsgRNAの平均カバレッジ(二つのライブラリーを合わせて、1遺伝子当たり合計6つのgRNA)を有する機能的ノックアウト用の5’構成エクソンを標的とする。リード数分布(すなわち、ライブラリー中の各gRNAの表現)は正常であり、各ライブラリーで類似していた。sgRNAは、標的外ゲノム配列とのミスマッチが二つ以下のsgRNAを避けることによって、標的外効果を回避するように設計した。このライブラリーは、19,050のヒト遺伝子および1864 miRNAを、1000の非標的対照sgRNAでカバーする。ライブラリーを、sgRNA当たり>300個の細胞のカバレッジで、複数の感染(MOI)<0.3で形質導入した。タウバイオセンサー細胞を、ピューロマイシン選択下で増殖させて、細胞ごとに固有のsgRNAの統合および発現を有する細胞を選択した。ピューロマイシン選択は、1μg/mLで形質導入の24時間後に開始した。五つの独立したスクリーニング複製を、一次スクリーンで使用した。
【0098】
形質導入後の3日目および6日目の細胞継代時に、完全形質導入細胞集団のサンプルを採取した。6日目の継代後、細胞をならし培地中で増殖させ、それらを播種活性に対して感受性にさせた。10日目に、蛍光補助細胞ソーティング(FACS)を使用して、FRET[+]細胞の亜集団を特異的に単離した。スクリーニングは、五つの複製された実験から構成された。統合されたsgRNA構築物のDNA単離およびPCR増幅により、各時点でのsgRNAレパートリーの次世代配列決定(NGS)による特徴解析が可能となった。
【0099】
NGSデータの統計解析により、五つの実験の10日目のFRET[+]亜集団において濃縮されたsgRNAを、3日目および6日目の早期の時点でのsgRNAレパートリーと比較して、識別することが可能となった。潜在的なタウ修飾因子を識別する最初の戦略は、DNA配列決定を使用して、DESeqアルゴリズムを使用した各サンプルにおいて、sgRNAリード数を生成し、10日目対3日目で、または10日目対6日目でより豊富であるが、6日目対3日目ではそうではないsgRNAを見出すことであった(倍率変化(fc)≧1.5および陰性二項検定p<0.01)。Fc≧1.5は、(10日目カウントの平均)/(3日目または6日目カウントの平均)の比率≧1.5を意味する。P<0.01は、10日目カウントと3日目カウントとの間の統計的な差異がない、または6日目カウント<0.01である可能性を意味する。DESeqアルゴリズムは、「配列カウントデータの差次的発現の解析」のために広く使用されているアルゴリズムである。例えば、参照により本明細書に組み込まれるAnders他、(2010)、Genome Biology、11:R106を参照されたい。
【0100】
具体的には、二つの比較が各ライブラリーで使用され、有意なsgRNAが識別された:10日目対3日目、および10日目対6日目 これら四つの比較のそれぞれについて、DESeqアルゴリズムを使用し、有意であるとみなされるカットオフ閾値は、陰性二項検定p<0.01に加えて、倍率変化≧1.5であった。各ライブラリーに対するこれらの比較のそれぞれにおいて有意なガイドが識別されると、遺伝子は、以下の二つの基準のうちの一つを満たす場合、有意であるとみなされた:(1)その遺伝子に対応する少なくとも二つのsgRNAは、一つの比較において有意であるとみなされた(10日目対3日目、または10日目対6日目のいずれか)。および(2)両方の比較において少なくとも一つのsgRNAが有意であった(10日目対3日目、および10日目対6日目)。このアルゴリズムを使用して、五つの遺伝子を、第一のライブラリーから有意であると識別し、四つの遺伝子を、第二のライブラリーから識別した。表1を参照されたい。
【0101】
【表1】
【0102】
しかしながら、この第一の戦略は、各実験群内のリード数の均質性の一定のレベルが極めて厳しいことを必要とする。同じsgRNAについて、スクリーニングライブラリー中の初期ウイルス数、感染または遺伝子編集効率、および遺伝子編集後の相対成長率など、多くの因子が各実験群(3日目、6日目、または10日目サンプル)内のサンプル間でリード数の変動性を生じ得る。したがって、第二の戦略も、正確なリード数の代わりに、10日目(選択後)の各サンプルにおける遺伝子当たりのガイドの陽性発生(リード数>30)に基づいて使用した。
【0103】
選択前CRISPR実験を四回繰り返した。図6に示すように、選択前実験「Exp1」の遺伝子「G1」については、gRNA「g1」、「g2」、および「g3」は、それぞれ121、1000、および302のリード数で細胞集団中に存在した。遺伝子「G2」については、gRNA「g4」、「g5」、「g6」、および「g7」は、それぞれ443、2012、534、および150のリード数で細胞集団中に存在した。かかるリード数データは、遺伝子「G1」から遺伝子「G21,000」について生成される。各遺伝子について、「存在の合計」またはnを決定した。各gRNAの個々のリード数を背景閾値と比較することによって、DNAの標的領域当たりに存在するgRNAのそれぞれの数である「存在の合計」を決定した。この場合、30を背景閾値として使用した。したがって、リード数によって示される存在するgRNAの量と対比して、「存在の合計」は質的に存在しているgRNAの数を示す。gRNA g1、g2、およびg3のリード数が各々30の背景閾値を超えるため、遺伝子G1に対応するgRNAの存在の合計は3である。gRNA g4、g5、g6、およびg7のリード数が各々30の背景閾値を超えるため、遺伝子G2に対応するgRNAの存在の合計は4である。リード数が背景閾値を超える細胞集団中に存在する、全標的領域にわたる、gRNAの総数またはNは、59,010として示される。したがって、細胞集団に感染するために使用された約64,000の異なるgRNAのオリジナルライブラリーのうち、背景閾値を超えた量で存在したのは約59,000の異なるgRNAのみであった。
【0104】
表現型選択を伴うCRISPR実験を四回繰り返した。しかしながら、配列決定の前に、細胞集団中の細胞を、蛍光技術(例えば、FRET蛍光)を使用して表現型に従ってソートした。Cas9/CRISPRが、細胞の標的領域(例えば、遺伝子)を切断し、細胞が蛍光を発しなかった場合、遺伝子は首尾よくノックアウトされた。細胞が蛍光を発する場合、遺伝子はノックアウトされなかった。次いで蛍光細胞を配列決定することができ、非蛍光細胞は配列決定されなかった。選択された細胞は、特定の表現型/マーカーを示す細胞を表す。
【0105】
図6に示すように、選択後実験「Exp1」の遺伝子「G1」については、gRNA「g1」、「g2」、および「g3」は、それぞれ0、8、および12のリード数で細胞集団中に存在した(または存在しなかった)。遺伝子「G2」については、gRNA「g4」、「g5」、「g6」、および「g7」は、それぞれ4、25、4、および150のリード数で細胞集団中に存在した(または存在しなかった)。かかるリード数データは、遺伝子「G1」から遺伝子「G21,000」について生成される。各遺伝子について、「存在の合計」またはn’を決定した。各gRNAの個々のリード数を背景閾値と比較することによって、DNAの標的領域当たりに存在するgRNAのそれぞれの数である「存在の合計」を決定した。この場合、30を背景閾値として使用した。したがって、リード数によって示される存在するgRNAの量と対比して、「存在の合計」は存在するgRNAの数を示す。gRNA g1、g2、およびg3のリード数が各々30の背景閾値を超えないため、遺伝子G1に対応するgRNAの存在の合計は0である。gRNA g7のリード数のみが30の背景閾値を超えるため、遺伝子G2に対応するgRNAの存在の合計は1である。リード数が背景閾値を超えた細胞集団中に存在する、全標的領域にわたる、gRNAの総数またはN’は、4,320として示される。したがって、細胞集団に感染するために使用された約64,000の異なるgRNAのオリジナルライブラリーのうち、背景閾値を超える量で存在したのは約4,320の異なるgRNAのみであった。
【0106】
正式な統計p値を、ライブラリーサイズ、遺伝子当たりのガイドの数、および選択後サンプル中のポジティブガイドの総数を考慮して、選択後サンプル中のガイドの数を陽性的に観察するために計算した。リード数が考慮されると、選択された細胞(選択後)内の標的領域(例えば、遺伝子)に対するn’ガイドを偶然に観察する確率を、式
【0107】
【数18】
【0108】
に従って決定した。説明として、
【0109】
【数19】
【0110】
これはyオブジェクトからxオブジェクトを選択する方法の数を決定する。
選択された細胞(選択後)内の標的領域(例えば、遺伝子)についてn’ガイドを偶然観察する確率を決定した後、選択された細胞(選択後)内の遺伝子のn’以上のgRNAを偶然に観察する確率を、式
【0111】
【数20】
【0112】
に従って決定した。
選択された細胞(選択後)内の標的領域のn’以上のgRNAを偶然に観察する確率が決定されると、平均濃縮gRNAを標的領域レベルで決定した。選択前と比較した、選択後遺伝子のリード数の全体的な濃縮を、陽性遺伝子を識別するために追加パラメータとして使用した。平均濃縮は、濃縮スコアによって表された。濃縮スコアは、N/N’を評価することによって決定された。図6から引用すると、濃縮スコアは59010/4320、または13.66である。
【0113】
選択された細胞(選択後)内の標的領域のn’以上のgRNAを偶然に観察する確率は、標的領域が陽性的に選択されるかどうかを評価するために使用され得る。濃縮スコアは、標的領域が陽性的に選択されるかどうかを評価するためにさらに使用され得る。選択された細胞(選択後)内の標的領域のn’以上のgRNAを偶然に観察する確率より有意に低い、選択された細胞における標的領域のn’以上のgRNAを観察する確率を有する標的領域は、陽性的に選択された標的領域として識別してもよい。さらに、閾値を超える濃縮スコアを有する標的領域は、陽性的に選択された標的領域を示し得る。
【0114】
したがって、この第二の戦略は、CRISPR陽性選択のための新しい、より感度の高い解析方法を表す。CRISPR陽性選択の目的は、DNA配列決定を使用して、sgRNAによる摂動が表現型と相関する遺伝子を識別することである。ノイズ背景を低減するために、同じ遺伝子について複数のsgRNAを、実験の複製と一緒に、これらの実験で通常使用する。しかしながら、現在、同一遺伝子に対するsgRNA間、ならびに技術的反復の間にある程度の均質性/一致を必要とする、一般的に使用されている統計解析法は、うまく機能しない。これは、これらの方法は、多くの可能性のある理由(例えば、異なる感染または遺伝子編集効率、スクリーニングライブラリー内の初期ウイルス数、および同じ表現型を有する他のsgRNAの存在)のために、sgRNA間の大きな変動および同じ遺伝子に対するリピートを処理できないからである。対照的に、本実施例に示される方法は、大きな変動に対して堅牢である。これは、各sgRNAの正確なリード数ではなく、個々の実験における遺伝子当たりのガイドの陽性発生に基づく。正式な統計p値は、ライブラリーサイズ、遺伝子当たりのsgRNA数、および各実験における陽性sgRNAの総数を考慮して、実験リピートにわたるsgRNA数を陽性的に観察するために計算される。表現型選択の前後の相対的sgRNA配列リード濃縮もパラメータとして使用される。この方法は、DESeq、MAGECK、およびその他のものを含む、広く使用されている最新の方法よりも良好に機能する。具体的には、この方法には、以下の工程が含まれる。
【0115】
(1)各実験について、陽性表現型を有する細胞内の任意の存在するガイドを識別すること。
(2)遺伝子レベルで、各実験においてガイドが存在するランダムな可能性(別名p値)を計算すること。複数の実験にわたって存在する全体的な可能性は、フィッシャーの複合確率検定(Fisher’s combined probability test)(参照:Fisher, R.A.Fisher,R.A(1948)。「質問と回答#14」。The American Statistician)によって計算される。すなわち、まず、複数の実験からのp値を使用して検定統計量φを計算する:
【0116】
【数21】
【0117】
式中、pは、k番目の実験について計算されたp値であり、Kは、実験の総数である。次いで、K実験にわたるp値の組み合わせは、2*Kの自由度で、カイ二乗分布下でφの値を観察する確率と等しい。
【0118】
(3)遺伝子レベルでガイドの平均濃縮を計算すること:濃縮スコア=選択後の相対的存在量/選択前の相対的存在量。相対存在量=遺伝子についてのガイドのリード数/全ガイドのリード数。
【0119】
(4)存在しているランダムな可能性よりも有意に低く、ならびに特定の濃縮スコアを上回る遺伝子を選択すること。
C.実施例3
CRISPR/Cas9活性化および不活性化変異誘発(inactivating mutagenesis)を使用して、機能的ノックアウトのためのコードエクソンを標的化するCRISPRn sgRNAライブラリー(hGeCKO-AおよびhGeCKO-B)を使用する、タウおよびα-シヌクレイン原線維化および増殖の遺伝子修飾因子をスクリーニングした。図7は、サンプル識別子、実験番号、配列決定までの時間を示し、どのライブラリー(Gecko AまたはGecko B)が実験に使用されたかを識別する。
【0120】
Gecko Aライブラリーは、約63,950のgRNAから構成された。63,950のgRNAのうち、56,116のgRNAが18,874の遺伝子を標的とし、遺伝子の大多数が3つのgRNAによって標的とされた。63,950のgRNAのうち、6,834のgRNAが1,795のミコRNA(micoRNA)を標的とし、マイクロRNA(microRNA)の大多数が4つのgRNAによって標的とされた。
【0121】
Gecko Bライブラリーは、約56,869のgRNAから構成された。56,869のgRNAのうち、55,869のgRNAが18,834の遺伝子を標的とし、遺伝子の大多数が3つのgRNAによって標的とされた。56,869個のgRNAのうち、ミコRNAを標的としたgRNAはなかった。1,000個のgRNAのうち、標的は無かった。
【0122】
3日目および6日目には、表現型は示されなかった。10日目、サンプルは表現型陽性であった。
図8は、Gecko Aライブラリーに感染したサンプルからのDNAリード数を示す。各バーは、ウイルスに感染したサンプルを表す。各サンプルは、3日目(d03)、6日目(d06)、または10日目(d10)で配列決定され、各サンプルは、全ゲノムではなくgRNAの配列決定リードアウトを表す。
【0123】
図9は、Gecko Aライブラリーに感染したサンプルから中央値までのリード数の正規化を示す。正規化は、gRNAリード数を各サンプル中のリード数の合計で割ることによって行われ、全サンプルにわたるリード数の合計の中央値で割って掛けた。下の棒グラフは定性的で、30の閾値を超えるリード数を示し、10日目は選択後である。同様のリード数の合計を考慮すると、3日目および6日目のサンプルは、多種多様なgRNAを有し、10日目のサンプルは、はるかに少ない種類のgRNAを有した。
【0124】
図10は、ライブラリーサイズ、遺伝子当たりのgRNA数、および各実験における陽性gRNAの総数を考慮して、実験リピートにわたるgRNA数を陽性的に観察するために計算された正式な統計p値を示す。p値は、Gecko Aライブラリーに感染し、10日目に配列決定された五つのサンプルについて示される。
【0125】
実施形態
実施形態1。
(A)cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させることであって、ライブラリーが、細胞のゲノム内のDNAの標的領域を切断するための少なくとも3つのガイドRNA(gRNA)を含む、感染させること、細胞を配列決定してgRNAの各々のリード数を取得すること、
DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計すること(Σ)であって、式中Σ=nである、合計すること、および全ての標的領域にわたって、そのリード数が背景閾値を超える、gRNAの総数を合計すること(Σ)であって、式中Σ=Nである、合計すること;
(B)ウイルスベクターのライブラリーで、cas9陽性細胞の第二の培養物を感染させること、
第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすること、指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得すること、
その選択後リード数が背景閾値を超える選択された細胞において、DNAの標的領域当たりで、gRNAのそれぞれの数を合計すること(Σ)であって、式中Σ=n’である、合計すること、および、
全ての標的領域にわたって、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計すること(Σ)であって、式中Σ=N’である、合計すること;(C)DNAの標的領域について、式
【0126】
【数22】
【0127】
に従って、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算することであって、式中
【0128】
【数23】
【0129】
はyオブジェクトからxオブジェクトを選択する方法の数を算出する、計算すること、および遺伝子を含むDNAの標的領域について、式
【0130】
【数24】
【0131】
に従って、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算すること、を含む、方法。
実施形態2
(A)cas9陽性細胞の第一の培養物をウイルスベクターのライブラリーで感染させることであって、ライブラリーが、細胞のゲノム内のDNAの標的領域の転写を強化するための少なくとも3つのガイドRNA(gRNA)を含む、感染させること、
細胞を配列決定して、gRNAの各々のリード数を取得すること、
DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計(Σ)することであって、式中Σ=nである、合計すること、および、
すべての標的領域にわたって、そのリード数が背景閾値を超える、gRNAの総数を合計すること(Σ)であって、式中Σ=Nである、合計すること;
(B)ウイルスベクターのライブラリーで、cas9陽性細胞の第二の培養物を感染させること、
第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすること、
指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得すること、
DNAの標的領域当たりで、その選択後リード数が背景閾値を超える選択された細胞において、gRNAのそれぞれの数を合計すること(Σ)であって、式中Σ=n’である、合計すること、および、
すべての標的領域にわたって、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計すること(Σ)であって、式中Σ=N’である、合計すること;
(C)DNAの標的領域について、式
【0132】
【数25】
【0133】
に従って、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算することであって、式中
【0134】
【数26】
【0135】
はyオブジェクトからxオブジェクトを選択する方法の数を算出する、計算すること、および、
遺伝子を含むDNAの標的領域について、式
【0136】
【数27】
【0137】
に従って、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算すること、を含む、方法。
実施形態3 第一の培養物を、CRISPR技術に従って感染させる、実施形態1~2のいずれかに記載の方法。
【0138】
実施形態4 第一の培養物のcas-9陽性細胞が、一つ以上の選択マーカーを含有するように改変される、実施形態1~3のいずれかに記載の方法。
実施形態5 指定された表現型が蛍光である、実施形態1~4のいずれかに記載の方法。
【0139】
実施形態6 指定された表現型が細胞生存である、実施形態1~5のいずれかに記載の方法。
実施形態7 一つ以上の選択マーカーが、蛍光マーカーを含む、実施形態4に記載の方法。
【0140】
実施形態8 蛍光マーカーが、FRETバイオセンサーの一部である、実施形態7に記載の方法。
実施形態9 一つ以上の選択マーカーが、検出可能な酵素である、実施形態4に記載の方法。
【0141】
実施形態10 検出可能な酵素が、β-ガラクトシダーゼである、実施形態9に記載の方法。
実施形態11 検出可能な酵素が、ルシフェラーゼである、実施形態9に記載の方法。
【0142】
実施形態12 標的領域が、遺伝子を含む、実施形態1~11のいずれかに記載の方法。
実施形態13 第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることが、選択機構を第二の細胞培養物に適用することを含む、実施形態1~12のいずれかに記載の方法。
【0143】
実施形態14 選択機構は、第二の細胞集団を薬剤に曝露することか、または第二の細胞集団をタンパク質活性または発現レベルを特定する物質に曝露することのうちの一つ以上を含む、実施形態13に記載の方法。
【0144】
実施形態15 指定された表現型を有する細胞を選択することが、一つ以上の選択マーカーに基づいて細胞をソートすることを含む、実施形態4に記載の方法。
実施形態16 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が陽性的に選択されると識別することをさらに含む、実施形態1~15のいずれかに記載の方法。
【0145】
実施形態17 標的領域が陽性的に選択されると識別することが、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと決定することを含む、実施形態16に記載の方法。
【0146】
実施形態18 各gRNAについて、濃縮スコアを決定することをさらに含む、実施形態1~17のいずれかに記載の方法。
実施形態19 各gRNAについて、濃縮スコアを決定することが、N/N’を評価することを含む、実施形態18に記載の方法。
【0147】
実施形態20 cas-9陽性細胞が、不活性化cas-9を含む、実施形態2~19のいずれかに記載の方法。
実施形態21 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態20に記載の方法。
【0148】
実施形態22 DNAの標的領域が、下流遺伝子またはタンパク質を調節する、実施形態1~21のいずれかに記載の方法。
実施形態23 下流遺伝子またはタンパク質を調節することが、下流遺伝子またはタンパク質の活性化または阻害を含む、実施形態22に記載の方法。
【0149】
実施形態24 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域を第二の遺伝子の修飾因子として識別することをさらに含む、実施形態1~23のいずれかに記載の方法。
【0150】
実施形態25 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域を治療標的として識別することをさらに含む、実施形態1~24のいずれかに記載の方法。
【0151】
実施形態26 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が指定された表現型と相関すると識別することをさらに含む、実施形態1~25のいずれかに記載の方法。
【0152】
実施形態27 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が保護効果を示すと識別することをさらに含む、実施形態1~26のいずれかに記載の方法。
【0153】
実施形態28 方法であって、DNAの複数の標的領域の各々に対する少なくとも3つのガイドRNA(gRNA)のライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定すること;DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定すること;DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定すること;
DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団中に存在するgRNAの総数(N’)を決定すること;複数の標的領域の各標的領域について、n、N、n’、およびN’に基づいて、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定すること;対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定すること;および、選択された細胞における対象の配列のn’以上のgRNAを観察する確率に基づいて、対象の配列が陽性的に選択されると識別すること、を含む、方法。
【0154】
実施形態29 第一の細胞集団および第二の集団が、cas-9陽性細胞を含む、実施形態28に記載の方法。
実施形態30 DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定することが、ウイルスベクターのライブラリーで第一の細胞集団を感染させること、第一の細胞集団の細胞を配列決定して、gRNAの各々のリード数を取得すること、およびDNAの複数の標的領域の各々に対して、そのリード数が背景閾値を超える各gRNAを数えること、を含む、実施形態29に記載の方法。
【0155】
実施形態31 DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定することは、そのリード数が背景閾値を超える第一の細胞集団に存在する各gRNAを数えることを含む、実施形態30に記載の方法。
【0156】
実施形態32 DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定することが、第二の細胞集団の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすること、
指定された表現型を有する細胞を選択すること、選択された細胞を配列決定してgRNAの各々のリード数を取得すること、およびDNAの複数の標的領域の各々について、そのリード数が背景閾値を超える各gRNAを数えること、を含む、実施形態31に記載の方法。
【0157】
実施形態33 DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定することが、そのリード数が背景閾値を超える第二の細胞集団の選択された細胞内に存在する各gRNAを数えることを含む、実施形態28~32のいずれか一つに記載の方法。
【0158】
実施形態34 複数の標的領域の各標的領域について、n、N、n’、およびN’に基づいて、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定することが、
【0159】
【数28】
【0160】
を評価することを含み、式中
【0161】
【数29】
【0162】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する、実施形態28~33のいずれか一つに記載の方法。
実施形態35 対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定することは、
【0163】
【数30】
【0164】
を評価することを含む、実施形態28~34のいずれか一つに記載の方法。
実施形態36 選択された細胞における対象の配列のn’以上のgRNAを偶然に観察できる確率に基づいて、対象の配列が陽性的に選択されると識別することが、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと決定することを含む、実施形態28~35のいずれか一つに記載の方法。
【0165】
実施形態37 各gRNAについて、濃縮スコアを決定することをさらに含む、実施形態28~36のいずれか一つに記載の方法。
実施形態38 各gRNAについて、濃縮スコアを決定することが、N/N’を評価することを含む、実施形態37に記載の方法。
【0166】
実施形態39 cas-9陽性細胞が、不活性化cas-9を含む、実施形態28~38のいずれか一つに記載の方法。
実施形態40 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態39に記載の方法。
【0167】
実施形態41 装置であって、一つ以上のプロセッサと、プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、(A)第一のリード数データを受信させ、ここで第一のリード数データは、cas9陽性細胞の第一の培養物を、ウイルスベクターのライブラリーに感染させることであって、ライブラリーが、細胞のゲノム内のDNAの標的領域を切断するための少なくとも3つのガイドRNA(gRNA)を含む、感染させること、および細胞を配列決定してgRNAの各々のリード数を取得することによって生成され;第一のリード数データに基づいて、DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計させ(Σ)、式中Σ=nであり、および第一のリード数データに基づいて、標的領域全体にわたり、そのリード数が背景閾値を超える、gRNAの総数を合計させ(Σ)、式中Σ=Nであり;(B)第二のリード数データを受信させ、ここで第二のリード数データは、cas9陽性細胞の第二の培養物を、ウイルスベクターのライブラリーに感染させること、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすること、および指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得することによって生成され;第二のリード数データに基づいて、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える第二の細胞における、gRNAのそれぞれの数を合計させ(Σ)、式中Σ=n’であり、および第二のリード数データに基づいて、標的領域全体にわたり、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計させ(Σ)、式中Σ=N’であり;(C)DNAの標的領域について、式
【0168】
【数31】
【0169】
に従って、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算させ、式中
【0170】
【数32】
【0171】
はyオブジェクトからxオブジェクトを選択する方法の数を算出し、および遺伝子を含むDNAの標的領域について、式
【0172】
【数33】
【0173】
に従って、選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率を計算させる、プロセッサ実行可能命令、を格納するメモリと、を備える装置。
実施形態42 第一の培養物を、CRISPR技術に従って感染させる、実施形態41に記載の装置。
【0174】
実施形態43 第一の培養物のcas-9陽性細胞が、一つ以上の選択マーカーを含有するように改変される、実施形態41~42のいずれか一つに記載の装置。
実施形態44 標的領域が遺伝子を含む、実施形態41~43のいずれか一つに記載の装置。
【0175】
実施形態45 第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることが、選択機構を第二の細胞培養物に適用することを含む、実施形態41~44のいずれか一つに記載の装置。
【0176】
実施形態46 選択機構が、第二の細胞集団を薬剤に曝露することか、または第二の細胞集団をタンパク質活性または発現レベルを特定する物質に曝露することのうちの一つ以上を含む、実施形態45に記載の装置。
【0177】
実施形態47 指定された表現型を有する細胞を選択することが、一つ以上の選択マーカーに基づいて細胞をソートすることを含む、実施形態41~46のいずれか一つに記載の装置。
【0178】
実施形態48 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が陽性的に選択されると識別することをさらに含む、実施形態41~47のいずれか一つに記載の装置。
【0179】
実施形態49 標的領域が陽性的に選択されると識別することが、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと決定することを含む、実施形態48に記載の装置。
【0180】
実施形態50 各gRNAについて、濃縮スコアを決定することをさらに含む、実施形態41~49のいずれか一つに記載の装置。
実施形態51 各gRNAについて、濃縮スコアを決定することが、N/N’を評価することを含む、実施形態50に記載の装置。
【0181】
実施形態52 cas-9陽性細胞が、不活性化cas-9を含む、実施形態41~51のいずれか一つに記載の装置。
実施形態53 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態52に記載の装置。
【0182】
実施形態54 一つ以上のガイドRNA(gRNA)を偶然に観察する確率を決定するための非一時的コンピュータ可読媒体であって、プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに、(A)第一のリード数データを受信させ、ここで第一のリード数データは、cas9陽性細胞の第一の培養物を、ウイルスベクターのライブラリーに感染させることであって、ライブラリーが、細胞のゲノム内のDNAの標的領域を切断するための少なくとも3つのガイドRNA(gRNA)を含む、感染させること、および細胞を配列決定してgRNAの各々のリード数を取得することによって生成され;第一のリード数データに基づいて、DNAの標的領域当たりで、そのリード数が背景閾値を超える、gRNAのそれぞれの数を合計させ(Σ)、式中Σ=nであり、および第一のリード数データに基づいて、標的領域全体にわたり、そのリード数が背景閾値を超える、gRNAの総数を合計させ(Σ)、式中Σ=Nであり;(B)第二のリード数データを受信させ、ここで第二のリード数データは、cas9陽性細胞の第二の培養物を、ウイルスベクターのライブラリーに感染させること、第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすること、および指定された表現型を有する細胞を選択し、選択された細胞を配列決定してgRNAの各々の選択後リード数を取得することによって生成され;第二のリード数データに基づいて、DNAの標的領域当たりで、その選択後リード数が背景閾値を超える第二の細胞における、gRNAのそれぞれの数を合計させ(Σ)、式中Σ=n’であり、および第二のリード数データに基づいて、標的領域全体にわたり、そのリード数が閾値を超える選択された細胞の、gRNAの総数を合計させ(Σ)、式中Σ=N’であり;(C)DNAの標的領域について、式
【0183】
【数34】
【0184】
に従って、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を計算させ、式中
【0185】
【数35】
【0186】
はyオブジェクトからxオブジェクトを選択する方法の数を算出し、および遺伝子を含むDNAの標的領域について、式n’に従って、選択された細胞内の遺伝子の
【0187】
【数36】
【0188】
以上のgRNAを偶然に観察する確率を計算させる、プロセッサ実行可能命令、を格納する、非一時的コンピュータ可読媒体。
実施形態55 第一の培養物は、CRISPR技術に従って感染される、実施形態54に記載の非一時的コンピュータ可読媒体。
【0189】
実施形態56 第一の培養物のcas-9陽性細胞が、一つ以上の選択マーカーを含有するように改変される、実施形態54~55のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0190】
実施形態57 標的領域が遺伝子を含む、実施形態54~56のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態58 第二の培養物の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることが、選択機構を第二の細胞培養物に適用することを含む、実施形態54~57のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0191】
実施形態59 選択機構が、第二の細胞集団を薬剤に曝露することか、または第二の細胞集団をタンパク質活性または発現レベルを特定する物質に曝露することのうちの一つ以上を含む、実施形態58に記載の非一時的コンピュータ可読媒体。
【0192】
実施形態60 指定された表現型を有する細胞を選択することが、一つ以上の選択マーカーに基づいて細胞をソートすることを含む、実施形態54~59のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0193】
実施形態61 選択された細胞内の遺伝子のn’以上のgRNAを偶然に観察する確率に基づいて、標的領域が陽性的に選択されると識別することをさらに含む、実施形態54~60のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0194】
実施形態62 標的領域が陽性的に選択されると識別することが、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと決定することを含む、実施形態61に記載の非一時的コンピュータ可読媒体。
【0195】
実施形態63 各gRNAについて、濃縮スコアを決定することをさらに含む、実施形態54~62のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態64 各gRNAについて、濃縮スコアを決定することが、N/N’を評価することを含む、実施形態63に記載の非一時的コンピュータ可読媒体。
【0196】
実施形態65 cas-9陽性細胞が、不活性化cas-9を含む、実施形態54~64のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態66 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態65に記載の非一時的コンピュータ可読媒体。
【0197】
実施形態67 装置であって、一つ以上のプロセッサと、プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対する少なくとも3つのガイドRNA(gRNA)のライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定させ、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定させ、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定させ、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定させ、複数の標的領域の各標的領域について、n、N、n’、およびN’に基づき、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定させ、対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定させ、および選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されることを識別させる、プロセッサ実行可能命令、を格納するメモリと、を備える装置。
【0198】
実施形態68 第一の細胞集団および第二の集団が、cas-9陽性細胞を含む、実施形態67に記載の装置。
実施形態69 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定させる、プロセッサ実行可能命令が、装置に、ウイルスベクターのライブラリーで第一の細胞集団を感染させることと、第一の細胞集団の細胞を配列決定して、gRNAの各々のリード数を取得することと、によって生成される第一のリード数データを受信させ、および第一のリード数データに基づいて、DNAの複数の標的領域の各々について、そのリード数が背景閾値を超える各gRNAを数えさせる、実施形態67~68のいずれか一つに記載の装置。
【0199】
実施形態70 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定させる、プロセッサ実行可能命令が、装置に、そのリード数が背景閾値を超える第一の細胞集団に存在する各gRNAを数えさせる、実施形態69に記載の装置。
【0200】
実施形態71 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定させる、プロセッサ実行可能命令が、装置に、第二の細胞集団の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることと、指定された表現型を有する細胞を選択することと、選択された細胞を配列決定してgRNAの各々のリード数を取得することと、によって生成される第二のリード数データを受信させ、および第二のリード数データに基づいて、DNAの複数の標的領域の各々について、そのリード数が背景閾値を超える各gRNAを数えさせる、実施形態67~70のいずれか一つに記載の装置。
【0201】
実施形態72 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定させる、プロセッサ実行可能命令が、装置に、そのリード数が背景閾値を超える第二の細胞集団の選択された細胞に存在する各gRNAを数えさせる、実施形態67~71のいずれか一つに記載の装置。
【0202】
実施形態73 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、複数の標的領域の各標的領域について、n、N、n’、およびN’に基づいて、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定させる、プロセッサ実行可能命令が、装置に、
【0203】
【数37】
【0204】
を評価させ、式中
【0205】
【数38】
【0206】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する、実施形態67~72のいずれか一つに記載の装置。
実施形態74 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、対象の配列を含む標的領域について、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定させる、プロセッサ実行可能命令が、装置に
【0207】
【数39】
【0208】
を評価させる、実施形態67~73のいずれか一つに記載の装置。
実施形態75 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されると識別させる、プロセッサ実行可能命令が、装置に、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと評価させる決定させる、実施形態67~74のいずれか一つに記載の装置。
【0209】
実施形態76 一つ以上のプロセッサによって実行されると、装置に、各gRNAについて、濃縮スコアを決定させる、プロセッサ実行可能命令をさらに含む、実施形態67~76のいずれか一つに記載の装置。
【0210】
実施形態77 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、各gRNAについて、濃縮スコアを決定させる、プロセッサ実行可能命令が、装置にN/N’を評価させる、実施形態76に記載の装置。
【0211】
実施形態78 cas-9陽性細胞が、不活性化cas-9を含む、実施形態67~77のいずれか一つに記載の装置。
実施形態79 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態78に記載の装置。
【0212】
実施形態80 一つ以上のガイドRNA(gRNA)を偶然に観察する確率を決定するための非一時的コンピュータ可読媒体であって、プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに、DNAの複数の標的領域の各々に対する少なくとも3つのガイドRNA(gRNA)のライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定させ;DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定させ;DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定させ;DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定させ;複数の標的領域の各標的領域について、n、N、n’、およびN’に基づき、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定させ;対象の配列を含む標的領域について、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定させ、および、
選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されると識別させる、プロセッサ実行可能命令、を格納する、非一時的コンピュータ可読媒体。
【0213】
実施形態81 第一の細胞集団および第二の集団が、cas-9陽性細胞を含む、実施形態80に記載の非一時的コンピュータ可読媒体。
実施形態82 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第一の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n)を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、ウイルスベクターのライブラリーで第一の細胞集団を感染させることと、第一の細胞集団の細胞を配列決定して、gRNAの各々のリード数を取得することと、によって生成される第一のリード数データを受信させ、および第一のリード数データに基づいて、DNAの複数の標的領域の各々について、そのリード数が背景閾値を超える各gRNAを数えさせる、実施形態80~81のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0214】
実施形態83 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の全ての標的領域にわたる、第一の細胞集団に存在するgRNAの総数(N)を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、そのリード数が背景閾値を超える第一の細胞集団に存在する各gRNAを数えさせる、実施形態80~82のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0215】
実施形態84 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対する少なくとも3つのgRNAのライブラリーを含むベクターを用いた感染後の第二の細胞集団の配列決定に基づいて、そのリード数が背景閾値を超える、DNAの複数の標的領域の各々について存在するgRNAのそれぞれの数(n’)を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、第二の細胞集団の細胞を、指定された表現型を有する、または指定された表現型を有しないのいずれかとしてカテゴライズすることと、指定された表現型を有する細胞を選択することと、選択された細胞を配列決定してgRNAの各々のリード数を取得することと、によって生成される第二のリード数データを受信させ、および、第二のリード数データに基づいて、DNAの複数の標的領域の各々について、そのリード数が背景閾値を超える各gRNAを数えさせる、実施形態80~83のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0216】
実施形態85 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、DNAの複数の標的領域の各々に対するgRNAのそれぞれの数に基づいて、そのリード数が背景閾値を超えるDNAの複数の標的領域の全ての標的領域にわたる第二の細胞集団に存在するgRNAの総数(N’)を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、そのリード数が背景閾値を超える第二の細胞集団の選択された細胞に存在する各gRNAを数えさせる、実施形態80~84のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0217】
実施形態86 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、複数の標的領域の各標的領域について、n、N、n’、およびN’に基づいて、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに
【0218】
【数40】
【0219】
を評価させ、式中
【0220】
【数41】
【0221】
は、yオブジェクトからxオブジェクトを選択する方法の数を算出する、実施形態80~85のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態87 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、選択された細胞内の標的領域についてn’gRNAを偶然に観察する確率に基づいて、対象の配列を含む標的領域について、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率を決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに
【0222】
【数42】
【0223】
を評価させる、実施形態80~86のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態88 プロセッサ実行可能命令であって、一つ以上のプロセッサによって実行されると、装置に、選択された細胞における対象の配列のn以上のgRNAを偶然に観察する確率に基づいて、対象の配列が陽性的に選択されると識別させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、選択された細胞における対象の配列のn’以上のgRNAを偶然に観察する確率が閾値を満たすと評価させる決定させる、実施形態80~87のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0224】
実施形態89 一つ以上のプロセッサによって実行されると、一つ以上のプロセッサに、各gRNAについて、濃縮スコアを決定させるプロセッサ実行可能命令を、さらに含む、実施形態80~88のいずれか一つに記載の非一時的コンピュータ可読媒体。
【0225】
実施形態90 一つ以上のプロセッサによって実行されると、装置に、各gRNAについて、濃縮スコアを決定させる、プロセッサ実行可能命令が、一つ以上のプロセッサに、N/N’を評価させることを含む、実施形態89に記載の非一時的コンピュータ可読媒体。
【0226】
実施形態91 cas-9陽性細胞が、不活性化cas-9を含む、実施形態80~90のいずれか一つに記載の非一時的コンピュータ可読媒体。
実施形態92 不活性化cas-9が、少なくとも一つの転写活性化ドメインに融合される、実施形態91に記載の非一時的コンピュータ可読媒体。
【0227】
当業者は、通常の実験だけを用いることで、本明細書に記載の方法および組成物の特定の実施形態の多数の同等物を認識し、または確認できる。かかる同等物は、以下の特許請求の範囲に包含されることが意図される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10