(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-03-28
(54)【発明の名称】組み合わせ遺伝子修飾を有する操作された細胞の産生および追跡
(51)【国際特許分類】
C12N 15/09 20060101AFI20220318BHJP
C12Q 1/6869 20180101ALI20220318BHJP
C12N 1/15 20060101ALI20220318BHJP
C12N 1/19 20060101ALI20220318BHJP
C12N 1/21 20060101ALI20220318BHJP
C12N 5/10 20060101ALI20220318BHJP
【FI】
C12N15/09 100
C12Q1/6869 Z ZNA
C12N1/15
C12N1/19
C12N1/21
C12N5/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021546268
(86)(22)【出願日】2020-02-07
(85)【翻訳文提出日】2021-09-30
(86)【国際出願番号】 US2020017315
(87)【国際公開番号】W WO2020163779
(87)【国際公開日】2020-08-13
(32)【優先日】2019-02-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】503115205
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(71)【出願人】
【識別番号】514256885
【氏名又は名称】ガバメント・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ・アズ・リプリゼンテッド・バイ・ザ・セクレタリー・オブ・コマース
【氏名又は名称原語表記】GOVERNMENT OF THE UNITED STATES OF AMERICA, AS REPRESENTED BY THE SECRETARY OF COMMERCE
【住所又は居所原語表記】The National Institute of Standards and Technology, 100 Bureau Drive, Stop 2200, Gaithersburg, MD 20899-2200, U.S.A
(74)【代理人】
【識別番号】110001173
【氏名又は名称】特許業務法人川口國際特許事務所
(72)【発明者】
【氏名】サリット,マーク
(72)【発明者】
【氏名】シュタインメッツ,ラルス・エム
(72)【発明者】
【氏名】セント・オンジェ,ロバート
(72)【発明者】
【氏名】スミス,ジャステン・ディー
(72)【発明者】
【氏名】ロイ,ケビン
【テーマコード(参考)】
4B063
4B065
【Fターム(参考)】
4B063QA13
4B063QQ05
4B063QQ42
4B063QR08
4B063QR42
4B063QR55
4B063QR62
4B063QS24
4B063QX01
4B065AA01X
4B065AA57X
4B065AA72X
4B065AA87X
4B065AB01
4B065AC14
4B065BA02
4B065CA46
(57)【要約】
遺伝子バリアント(設計もしくはランダム)または構築物(遺伝子もしくはそうでなければ任意のDNA)の組み合わせを細胞の集団に導入することによって、遺伝子修飾された細胞を作製するための、およびバーコード遺伝子座と呼ばれる一般的な遺伝子座(染色体またはプラスミド)におけるバーコードのアレイを順次に構築することによって各バリアントの組み合わせを追跡するための方法が、本明細書に記載される。また、そのような方法で作製される細胞も記載される。
【特許請求の範囲】
【請求項1】
複数の遺伝子操作された細胞を産生するための方法であって、前記方法が、
(a)複数の細胞を、第1の遺伝子編集剤および第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された前記第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を含む、形成することと、
(b)前記第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤および第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された前記第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を含む、形成することと、を含み、それによって複数の遺伝子操作された細胞を産生する、方法。
【請求項2】
複数の遺伝子操作された細胞を産生するための方法であって、前記方法が、
(a)複数の細胞を、第1の遺伝子編集剤と接触させ、それによって各々が第1の固有の遺伝子修飾を含む第1の複数の遺伝子編集された細胞を産生することと、
(b)前記第1の複数の遺伝子編集された細胞に、第1の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第1の固有のポリヌクレオチドバーコード配列を含み、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された前記第1の固有のポリヌクレオチドバーコード、および前記第1の固有の遺伝子修飾を含む、形成することと、
(c)前記第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤と接触させ、それによって各々が第2の固有の遺伝子修飾を含む第2の複数の遺伝子編集された細胞を産生することと、
(d)前記第2の複数の遺伝子編集された細胞に、第2の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第2の固有のポリヌクレオチドバーコード配列を含み、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、第2の固有のポリヌクレオチドバーコードが、前記第2の複数の遺伝子編集およびバーコード化された細胞の各々バーコード遺伝子座に挿入されるようにし、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された前記第2の固有のポリヌクレオチドバーコード、および前記第2の固有の遺伝子修飾を含む、形成することと、を含み、
それによって複数の遺伝子操作された細胞を産生する、方法。
【請求項3】
ステップ(b)を1回以上繰り返すことをさらに含み、ステップ(b)の各繰り返しが、同じまたは異なる複数の組換えポリヌクレオチドを用い、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含む、請求項1に記載の方法。
【請求項4】
ステップ(c)および(d)を1回以上繰り返すことをさらに含み、ステップ(c)および(d)の各繰り返しが、同じまたは異なる複数の組換えポリヌクレオチドを用い、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含む、請求項2に記載の方法。
【請求項5】
前記第1の固有のポリヌクレオチドバーコードが、前記第1の複数の遺伝子編集およびバーコード化された細胞の各々における前記第1の固有の遺伝子修飾に関連する、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記第1の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分が、前記第1の固有のポリヌクレオチドバーコードが、データベース内の前記第1の固有の遺伝子修飾に関連するように配列決定される、請求項5に記載の方法。
【請求項7】
前記第2の固有のポリヌクレオチドバーコードが、前記第2の複数の遺伝子編集およびバーコード化された細胞の各々における前記第2の固有の遺伝子修飾に関連する、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記第2の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分が、前記第2の固有のポリヌクレオチドバーコードが、データベース内の前記第2の固有の遺伝子修飾に関連するように配列決定される、請求項7に記載の方法。
【請求項9】
前記バーコード遺伝子座を配列決定することによって、前記複数の遺伝子操作された細胞の各々における遺伝子変異を同定することをさらに含む、請求項5~8のいずれか一項に記載の方法。
【請求項10】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードに隣接して付加される、請求項1~9のいずれか一項に記載の方法。
【請求項11】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの上流に付加される、請求項1~10のいずれか一項に記載の方法。
【請求項12】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの下流に付加される、請求項1~10のいずれか一項に記載の方法。
【請求項13】
各固有のポリヌクレオチドバーコードには、組換えポリヌクレオチド上で、右相同性アームおよび/または左相同性アームが隣接している、請求項1~12のいずれか一項に記載の方法。
【請求項14】
各第1の固有のポリヌクレオチドバーコードには、前記第1の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、前記第1の右相同性アーム、第2の右相同性アーム、および左相同性アームが隣接し、前記第1の右相同性アームおよび前記左相同性アームが、前記バーコード遺伝子座の配列と相同であるようにする、請求項1~13のいずれか一項に記載の方法。
【請求項15】
各第2の固有のポリヌクレオチドバーコードには、前記第2の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、前記第2の右相同性アーム、前記左相同性アーム、および任意に第3の右相同性アームが隣接し、前記第2の右相同性アームおよび前記左相同性アームが、前記バーコード遺伝子座への前記第1の固有のポリヌクレオチドバーコードの統合後の前記バーコード遺伝子座の配列と相同であるようにする、請求項14に記載の方法。
【請求項16】
前記第1の複数のポリヌクレオチドの各組換えポリヌクレオチドが、前記左相同性アームと前記第2の右相同性アームとの間に第1のマーカーポリヌクレオチドを含む、請求項14または15に記載の方法。
【請求項17】
前記第2の複数のポリヌクレオチドの各組換えポリヌクレオチドが、前記左相同性アームと前記第3の右相同性アームとの間に第2のマーカーポリヌクレオチドを含む、請求項14~16のいずれか一項に記載の方法。
【請求項18】
前記マーカーポリヌクレオチドが、前記固有のポリヌクレオチドバーコードと共に前記バーコード遺伝子座に組み込まれる、請求項17に記載の方法。
【請求項19】
各固有のポリヌクレオチドが、相同組換えによって前記バーコード遺伝子座に挿入される、請求項1~18のいずれか一項に記載の方法。
【請求項20】
各固有のポリヌクレオチドが、非相同末端結合によって前記バーコード遺伝子座に挿入される、請求項1~18のいずれか一項に記載の方法。
【請求項21】
各固有のポリヌクレオチドが、インテグラーゼを使用して前記バーコード遺伝子座に挿入される、請求項1~18のいずれか一項に記載の方法。
【請求項22】
各組換えポリヌクレオチドが、マーカーポリヌクレオチドをさらに含む、請求項1~21のいずれか一項に記載の方法。
【請求項23】
前記マーカーポリヌクレオチドが、前記固有のポリヌクレオチドバーコードと共に前記バーコード遺伝子座に組み込まれる、請求項22に記載の方法。
【請求項24】
前記マーカーポリヌクレオチドの存在に関して細胞を選択することをさらに含む、請求項22または23に記載の方法。
【請求項25】
前記マーカーポリヌクレオチドの非存在に関して細胞を選択することをさらに含む、請求項22または23に記載の方法。
【請求項26】
前記第1の複数の組換えポリヌクレオチド中の前記マーカーポリヌクレオチドが、前記第2の複数の組換えポリヌクレオチド中の前記マーカーポリヌクレオチドとは異なる、請求項22~24のいずれか一項に記載の方法。
【請求項27】
前記第1の遺伝子編集剤が、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系、RNA誘導ヌクレアーゼ、RNA誘導ニッカーゼ、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである、請求項1~26のいずれか一項に記載の方法。
【請求項28】
前記第2の遺伝子編集剤が、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系、RNA誘導ヌクレアーゼ、RNA誘導ニッカーゼ、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである、請求項1~27のいずれか一項に記載の方法。
【請求項29】
前記第1の遺伝子編集剤および前記第2の遺伝子編集剤が同じである、請求項1~28のいずれか一項に記載の方法。
【請求項30】
前記第1の遺伝子編集剤および前記第2の遺伝子編集剤が異なる、請求項1~28のいずれか一項に記載の方法。
【請求項31】
前記第1の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することをさらに含む、請求項1~30のいずれか一項に記載の方法。
【請求項32】
前記第2の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することをさらに含む、請求項1~31のいずれか一項に記載の方法。
【請求項33】
前記バーコード遺伝子座が配列決定される、請求項31または32に記載の方法。
【請求項34】
少なくとも1つの遺伝子修飾が、配列決定によって決定される、請求項31~33のいずれか一項に記載の方法。
【請求項35】
固有のポリヌクレオチドバーコードを用いて、少なくとも1つの遺伝子修飾を同定することをさらに含む、請求項31~34のいずれか一項に記載の方法。
【請求項36】
(i)各細胞の前記バーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することであって、前記バーコード遺伝子座が、前記新しい固有のポリヌクレオチドバーコードを挿入する前に、少なくとも2つの固有のポリヌクレオチドバーコードをすでに含む、挿入することと、(ii)前記新しい固有のポリヌクレオチドバーコードが前記少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、前記バーコード遺伝子座を配列決定することとをさらに含む、請求項1~35のいずれか一項に記載の方法。
【請求項37】
(iii)各細胞の前記バーコード遺伝子座から、前記少なくとも2つの固有のポリヌクレオチドバーコードを除去することをさらに含む、請求項36に記載の方法。
【請求項38】
ステップ(a)、(b)、(c)、および/または(d)を繰り返し、それによって複数の遺伝子操作された細胞を産生することをさらに含む、請求項36または37に記載の方法。
【請求項39】
前記第1および/または第2の遺伝子編集剤が、メガヌクレアーゼである、請求項1~38のいずれか一項に記載の方法。
【請求項40】
前記メガヌクレアーゼが、I-SceI、I-CreI、またはI-Dmoである、請求項39に記載の方法。
【請求項41】
前記第1および/または第2の遺伝子編集剤が、RNA誘導ヌクレアーゼまたはRNA誘導ニッカーゼである、請求項1~40のいずれか一項に記載の方法。
【請求項42】
前記RNA誘導ヌクレアーゼまたはRNA誘導ニッカーゼが、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系のものである、請求項41に記載の方法。
【請求項43】
各組換えポリヌクレオチドが、RNA誘導ヌクレアーゼをコードする第3のポリヌクレオチドヌクレオチドをさらに含む、請求項41または42に記載の方法。
【請求項44】
各組換えポリヌクレオチドが、ドナーポリヌクレオチドをさらに含む、請求項41~43のいずれか一項に記載の方法。
【請求項45】
前記RNA誘導ヌクレアーゼまたはRNA誘導ニッカーゼが、前記細胞の前記ゲノムに統合されたベクターまたは第2の核酸配列によって提供される、請求項41~44のいずれか一項に記載の方法。
【請求項46】
各組換えポリヌクレオチドが、ベクターによって提供される、請求項1~45のいずれか一項に記載の方法。
【請求項47】
前記ベクターが、プラスミドベクターまたはウイルスベクターである、請求項46に記載の方法。
【請求項48】
前記ベクターが、高コピー数ベクターである、請求項46または47に記載の方法。
【請求項49】
前記RNA誘導ヌクレアーゼまたはRNA誘導ニッカーゼが、Casヌクレアーゼまたは操作されたRNA誘導FokIヌクレアーゼである、請求項27~48のいずれか一項に記載の方法。
【請求項50】
前記Casヌクレアーゼまたはニッカーゼが、Cas9、SpCas9、SaCas9、NmCas9、St1Cas9、FnCas9、Cas12a(例えば、FnCpf1、AsCpf1、LbCpf1)、Mad7、CasX、CasY、Cas13a、C2c1、C2c2、C2c3、LshC2c2、Cas14、dSpCas9-FokI、スプリット-SpCas9、SpCas9-ニッカーゼ、またはそれらのバリアントである、請求項49に記載の方法。
【請求項51】
前記Casヌクレアーゼまたはニッカーゼが、Cas9またはCas12aである、請求項50に記載の方法。
【請求項52】
前記細胞を、前記組換えポリヌクレオチドとハイブリダイズすることができるガイドRNAをコードする第2の核酸配列と接触させることをさらに含み、前記ガイドRNAが、各細胞内のヌクレアーゼと複合体を形成し、前記ガイドRNA-ヌクレアーゼ複合体が前記組換えポリヌクレオチドを切断するようにする、請求項1~51のいずれか一項に記載の方法。
【請求項53】
前記組換えポリヌクレオチドが、プラスミドベクターであり、前記ガイドRNA-ヌクレアーゼ複合体が、前記プラスミドベクターを線形化する、請求項52記載の方法。
【請求項54】
前記細胞を、前記組換えポリヌクレオチドとハイブリダイズすることができるガイドRNAをコードする第2の核酸配列と接触させることをさらに含み、前記ガイドRNAが、各細胞内のヌクレアーゼと複合体を形成し、前記ガイドRNA-ヌクレアーゼ複合体が前記バーコード遺伝子座を切断するようにする、請求項1~53のいずれか一項に記載の方法。
【請求項55】
前記組換えポリヌクレオチドが、前記ガイドRNAを含む、請求項52~54のいずれか一項に記載の方法。
【請求項56】
前記ガイドRNAが、前記バーコードとは異なる組換えポリヌクレオチド上にある、請求項52~54のいずれか一項に記載の方法。
【請求項57】
前記バーコード遺伝子座が、染色体バーコード遺伝子座である、請求項1~56のいずれか一項に記載の方法。
【請求項58】
前記遺伝子修飾が、設計された遺伝子修飾である、請求項1~57のいずれか一項に記載の方法。
【請求項59】
前記ベクターが、前記細胞から除去される、請求項1~58のいずれか一項に記載の方法。
【請求項60】
前記ベクターが、前記ヌクレアーゼによって切断される、請求項59に記載の方法。
【請求項61】
前記ベクターが、前記細胞から受動的に失われる、請求項59に記載の方法。
【請求項62】
請求項1~61のいずれか一項に記載の方法によって作製された、複数の遺伝子編集およびバーコード化された細胞。
【請求項63】
請求項1~58のいずれか一項に記載の方法によって作製された、遺伝子編集およびバーコード化された細胞。
【請求項64】
複数のバーコード化された細胞を産生するための方法であって、
(a)複数の細胞を、第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、第1の固有のポリヌクレオチドバーコードが、前記第1の複数の細胞の各々のバーコード遺伝子座に挿入されるようにし、それによって第1の複数のバーコード化された細胞を形成することと、
(b)前記第1の複数のバーコード化された細胞を、第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、第2の固有のポリヌクレオチドバーコードが、前記第1の複数の遺伝子編集およびバーコード化された複数の細胞の各々の前記バーコード遺伝子座に挿入されるようにし、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することと、を含み、
それによって複数のバーコード化されたた細胞を産生する、方法。
【請求項65】
ステップ(b)を1回以上繰り返すことをさらに含む、請求項64に記載の方法。
【請求項66】
各固有のポリヌクレオチドバーコードが、各細胞内の遺伝子修飾に関連している、請求項64または65に記載の方法。
【請求項67】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードに隣接して付加される、請求項64~66のいずれか一項に記載の方法。
【請求項68】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの上流に付加される、請求項64~67のいずれか一項に記載の方法。
【請求項69】
各固有のポリヌクレオチドバーコードが、前記バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの下流に付加される、請求項64~67のいずれか一項に記載の方法。
【請求項70】
各固有のポリヌクレオチドバーコードには、組換えポリヌクレオチド上で、右相同性アームおよび/または左相同性アームが隣接している、請求項64~69のいずれか一項に記載の方法。
【請求項71】
各固有のポリヌクレオチドが、相同組換えによって前記バーコード遺伝子座に挿入される、請求項64~70のいずれか一項に記載の方法。
【請求項72】
各組換えポリヌクレオチドが、マーカーポリヌクレオチドをさらに含む、請求項64~71のいずれか一項に記載の方法。
【請求項73】
前記マーカーポリヌクレオチドが、前記固有のポリヌクレオチドバーコードと共に前記バーコード遺伝子座に組み込まれる、請求項72に記載の方法。
【請求項74】
任意のステップ後の前記マーカーの存在に関して細胞を選択することをさらに含む、請求項72または73に記載の方法。
【請求項75】
前記第1の複数の組換えポリヌクレオチド中の前記マーカーが、前記第2の複数の組換えポリヌクレオチド中の前記マーカーとは異なる、請求項72~74のいずれか一項に記載の方法。
【請求項76】
(i)各細胞の前記バーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することであって、前記バーコード遺伝子座が、前記新しい固有のポリヌクレオチドバーコードを挿入する前に、少なくとも2つの固有のポリヌクレオチドバーコードをすでに含む、挿入することと、(ii)前記新しい固有のポリヌクレオチドバーコードが前記少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、前記バーコード遺伝子座を配列決定することとをさらに含む、請求項72~75のいずれか一項に記載の方法。
【請求項77】
ステップ(a)および/または(b)を繰り返し、それによって複数の順次にバーコード化された細胞を産生することをさらに含む、請求項76に記載の方法。
【請求項78】
前記バーコード遺伝子座が、染色体バーコード遺伝子座である、請求項64~77のいずれか一項に記載の方法。
【請求項79】
前記バーコード遺伝子座が、プラスミドバーコード遺伝子座である、請求項64~77のいずれか一項に記載の方法。
【請求項80】
請求項64~79のいずれか一項に記載の方法によって作製された、複数のバーコード化された細胞。
【請求項81】
請求項64~79のいずれか一項に記載の方法によって作製された、バーコード化された細胞。
【請求項82】
ポリヌクレオチド情報を細胞内の単一バーコードに圧縮するための方法であって、
(a)バーコード遺伝子座内に少なくとも2つの固有のポリヌクレオチドバーコードを含む細胞を得ることと、
(b)前記細胞の前記バーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することと、
(c)前記新しい固有のポリヌクレオチドバーコードが前記少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、前記バーコード遺伝子座を配列決定することと、を含む、方法。
【請求項83】
(d)前細胞胞の前記バーコード遺伝子座から、前記少なくとも2つの固有のポリヌクレオチドバーコードを除去することをさらに含む、請求項82に記載の方法。
【請求項84】
前記バーコード遺伝子座が、染色体バーコード遺伝子座である、請求項82または83に記載の方法。
【請求項85】
請求項82~84のいずれか一項に記載の方法によって作製された、複数のバーコード化された細胞。
【請求項86】
請求項82~84のいずれか一項に記載の方法によって作製された、バーコード化された細胞。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2019年2月8日に出願された米国仮出願第62/803,242号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
連邦政府による資金提供を受けた研究開発の記載
本発明は、国立衛生研究所によって授与された契約HG000205および米国標準技術局によって授与された契約70NANB15H268の下、政府の支援によってなされた。政府は、本発明における一定の権利を有する。
【背景技術】
【0003】
複雑な表現型の遺伝的基盤を明らかにし、所望の特性を有する生物系を操作することは、定量的遺伝学および合成生物学における中心的な課題である。これらの目標を達成するためには、多くの異なる遺伝子バリアントおよび経路の機能的出力を並行して試験することを可能にする技術が必要である。DNA合成の最近の進歩により、CRISPRガイドライブラリ、ペアガイドRNA-ドナーDNAライブラリ、および遺伝子バリアントライブラリの容易な構築が可能になり、遺伝子バリアントの大きいプールが生成されることを可能にしている。各細胞が単一の摂動を有する多重化アッセイにおけるそのような個々のバリアントを追跡するための方法は存在するが、現在、プールされた形式で遺伝子バリアントの高次の組み合わせを産生および追跡するために利用可能な、スケーラブルな方法はほとんどない。そのような技術は、バリアントがどのように相互作用して表現型を調節するかを理解するために重要である。
【0004】
したがって、単一細胞内で任意の数の遺伝的変化を誘発および追跡する、より効率的で、柔軟性があり、スケーラブルな方法が依然として必要とされている。
【発明の概要】
【0005】
本開示は、遺伝子バリアント(設計もしくはランダム)または構築物(遺伝子もしくはそうでなければ任意のDNA)の組み合わせを細胞の集団に導入するための、およびバーコード遺伝子座と呼ばれる一般的な遺伝子座(染色体またはプラスミド)におけるバーコードのアレイを順次に構築することによって各バリアントの組み合わせを追跡するための方法に関する。各バリアント、遺伝子構築物、または遺伝子修飾は、アレイ内の固有のバーコードによって表され、バーコードアレイのDNA配列決定により、配列決定ベースのカウントによって集団内の各バリアントの組み合わせの存在量を追跡することが可能になるようにする。重要なことに、本明細書に記載される方法は、CRISPRを介したゲノム編集との関連に制限されず、設計されたまたはランダムな遺伝子変化をもたらす任意の遺伝子修飾プロセス、またはDNA内の任意のデジタル情報の保存および圧縮により幅広い用途を有する。
【0006】
一態様では、本開示は、複数の遺伝子操作された細胞を作製するための方法に関する。実施形態では、方法は、(a)複数の細胞を、第1の遺伝子編集剤および第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含有し、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を有する、形成することと、(b)第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤および第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含有し、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を有する、形成することとを含み、それによって複数の遺伝子操作された細胞を産生する。実施形態では、方法は、ステップ(b)を1回以上繰り返すことを含み、ステップ(b)の各繰り返しは、バーコード遺伝子座が組換えポリヌクレオチドバーコードの固有の組み合わせを有するバーコードアレイを含むように、複数の組換えポリヌクレオチドを用いる。
【0007】
一態様では、(a)複数の細胞を、第1の遺伝子編集剤と接触させ、それによって各々が第1の固有の遺伝子修飾を有する第1の複数の遺伝子編集された細胞を産生すること、(b)第1の複数の遺伝子編集された細胞に、第1の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第1の固有のポリヌクレオチドバーコード配列を含有し、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を有する、形成すること、(c)前述の第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤と接触させ、それによって各々が第2の固有の遺伝子修飾を有する第2の複数の遺伝子編集された細胞を産生すること、ならびに(d)第2の複数の遺伝子編集された細胞に、第2の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第2の固有のポリヌクレオチドバーコード配列を含有し、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、第2の固有のポリヌクレオチドバーコードが、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座に挿入されるようにし、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を有する、形成すること、それによって複数の遺伝子操作された細胞を産生することによって、複数の遺伝子操作された細胞を産生するための方法が提供される。実施形態では、方法は、ステップ(c)および(d)を1回以上繰り返すことを含み、ステップ(c)および(d)の各繰り返しは、バーコード遺伝子座が組換えポリヌクレオチドバーコードの固有の組み合わせを含有するバーコードアレイを含むように、複数の組換えポリヌクレオチドを用いる。
【0008】
実施形態では、第1の固有のポリヌクレオチドバーコードは、前述の第1の複数の遺伝子編集およびバーコード化された細胞の各々における第1の固有の遺伝子修飾に関連する。実施形態では、前述の第1の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分は、第1の固有のポリヌクレオチドバーコードが、データベース内の第1の固有の遺伝子修飾に関連するように配列決定される。
【0009】
実施形態では、第2の固有のポリヌクレオチドバーコードは、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々における第2の固有の遺伝子修飾に関連する。実施形態では、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分は、第2の固有のポリヌクレオチドバーコードが、データベース内の第2の固有の遺伝子修飾に関連するように配列決定される。
【0010】
実施形態では、方法は、バーコード遺伝子座を配列決定することによって、複数の遺伝子操作された細胞の各々における遺伝子変異を同定することを含む。
【0011】
一態様では、複数のバーコード化された細胞を産生するための方法が提供される。実施形態では、方法は、(a)複数の細胞を、第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含有し、第1の固有のポリヌクレオチドバーコードが、前述の第1の複数の細胞の各々のバーコード遺伝子座に挿入されるようにし、それによって第1の複数のバーコード化された細胞を形成することを含む。実施形態では、(b)第1の複数のバーコード化された細胞を、第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含有し、第2の固有のポリヌクレオチドバーコードが、前述の第1の複数の遺伝子編集およびバーコード化された複数の細胞の各々のバーコード遺伝子座に挿入されるようにし、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することをさらに含む。
【0012】
一態様では、ポリヌクレオチド情報を細胞内の単一バーコードに圧縮するための方法が提供される。実施形態では、方法は、バーコード遺伝子座(バーコードアレイ)内に少なくとも2つの固有のポリヌクレオチドバーコードを有する細胞を得ることと、細胞のバーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することと、新しい固有のポリヌクレオチドバーコード(コンプレッサーバーコード)が、少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、バーコード遺伝子座を配列決定することとを含む。実施形態では、方法は、コンプレッサーバーコードがバーコード遺伝子座に残ったまま、細胞のバーコード遺伝子座から少なくとも2つの固有のポリヌクレオチドバーコードを除去することをさらに含む。このプロセスは、「バーコード圧縮」と称され得る。
【0013】
一態様では、本明細書に記載される方法によって作製された、複数の遺伝子編集およびバーコード化された細胞が提供される。
【0014】
一態様では、本明細書に記載される方法によって作製された、遺伝子編集およびバーコード化された細胞が提供される。
【0015】
実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードに隣接して付加される。実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの上流に付加される。実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの下流に付加される。
【0016】
実施形態では、各固有のポリヌクレオチドバーコードには、組換えポリヌクレオチド上で、右相同性アームおよび/または左相同性アームが隣接している。すなわち、右相同性アームは、固有のポリヌクレオチドバーコードの一方の側にあり得、左側の相同性アームは、他方の側にあり得る。例えば、
図1A~1Dを参照されたい。実施形態では、各第1の固有のポリヌクレオチドバーコードには、第1の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、第1の右相同性アーム、第2の右相同性アーム、および左相同性アームが隣接し、第1の右相同性アームおよび左相同性アームが、バーコード遺伝子座の配列と相同であるようにする。実施形態では、各第2の固有のポリヌクレオチドバーコードには、第2の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、第2の右相同性アーム、左相同性アーム、および任意に第3の右相同性アームが隣接し、第2の右相同性アームおよび左相同性アームが、バーコード遺伝子座への第1の固有のポリヌクレオチドバーコードの統合後のバーコード遺伝子座の配列と相同であるようにする。
【0017】
実施形態では、第1の複数のポリヌクレオチドの各組換えポリヌクレオチドは、左相同性アームと第2の右相同性アームとの間に第1のマーカーポリヌクレオチドを含む。実施形態では、第2の複数のポリヌクレオチドの各組換えポリヌクレオチドは、左相同性アームと第3の右相同性アームとの間に第2のマーカーポリヌクレオチドを含む。実施形態では、マーカーポリヌクレオチドは、固有のポリヌクレオチドバーコードと共にバーコード遺伝子座に組み込まれる。実施形態では、各組換えポリヌクレオチドは、マーカーポリヌクレオチドをさらに含む。実施形態では、マーカーポリヌクレオチドは、固有のポリヌクレオチドバーコードと共にバーコード遺伝子座に組み込まれる。実施形態では、方法は、バーコード遺伝子座に統合するマーカーポリヌクレオチドの存在に関して、細胞を選択することを含む。実施形態では、方法は、バーコード遺伝子座から除去されるマーカーポリヌクレオチドの非存在に関して、細胞を選択することを含む。実施形態では、第1の複数の組換えポリヌクレオチド中のマーカーポリヌクレオチドは、第2の複数の組換えポリヌクレオチド中のマーカーポリヌクレオチドとは異なる。
【0018】
実施形態では、各固有のポリヌクレオチドは、相同組換えによってバーコード遺伝子座に挿入される。実施形態では、各固有のポリヌクレオチドは、非相同末端結合によってバーコード遺伝子座に挿入される。実施形態では、各固有のポリヌクレオチドは、インテグラーゼまたはトランスポザーゼを使用してバーコード遺伝子座に挿入される。
【0019】
実施形態では、第1の遺伝子編集剤は、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、RNA誘導ヌクレアーゼ、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである。実施形態では、第2の遺伝子編集剤は、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである。実施形態では、第1および/または第2の遺伝子編集剤は、RNA誘導ヌクレアーゼである。実施形態では、第1の遺伝子編集剤は、CRISPR系である。実施形態では、第1の遺伝子編集剤は、CRISPR/Cas9系である。実施形態では、第2の遺伝子編集剤は、CRISPR系である。実施形態では、第2の遺伝子編集剤は、CRISPR/Cas9系である。実施形態では、第1の遺伝子編集剤および第2の遺伝子編集剤は同じである。実施形態では、第1の遺伝子編集剤および第2の遺伝子編集剤は異なる。
【0020】
実施形態では、方法は、第1の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することを含む。実施形態では、方法は、第2の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することを含む。実施形態では、バーコード遺伝子座は、配列決定される。実施形態では、少なくとも1つの遺伝子修飾は、配列決定によって決定される。
【0021】
実施形態では、方法は、固有のポリヌクレオチドバーコードを用いて少なくとも1つの遺伝子修飾を同定することを含む。
【0022】
実施形態では、方法は、(i)各細胞のバーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することを含み、バーコード遺伝子座は、新しい固有のポリヌクレオチドバーコードを挿入する前に、少なくとも2つの固有のポリヌクレオチドバーコードを含有する。実施形態では、方法は、(ii)新しい固有のポリヌクレオチドバーコードが少なくとも2つの以前の固有のポリヌクレオチドバーコードに関連するように、バーコード遺伝子座を配列決定することを含む。実施形態では、方法は、(iii)各細胞のバーコード遺伝子座から、少なくとも2つの以前の固有のポリヌクレオチドバーコードを除去することを含む。実施形態では、方法は、ステップ(a)、(b)、(c)、および/または(d)を繰り返し、それによって複数の遺伝子操作された細胞を産生することを含む。実施形態では、方法は、ステップ(i)、(ii)、および/または(iii)を繰り返し、それによって複数の遺伝子操作された細胞を産生することを含む。
【0023】
実施形態では、各組換えポリヌクレオチドは、RNA誘導ヌクレアーゼ(またはニッカーゼ)をコードする第3のポリヌクレオチドをさらに含む。実施形態では、各組換えポリヌクレオチドは、ドナーポリヌクレオチドをさらに含む。実施形態では、RNA誘導ヌクレアーゼは、細胞のゲノムに統合されたベクターまたは第2の核酸配列によって提供される。実施形態では、RNA誘導ヌクレアーゼは、Casヌクレアーゼまたは操作されたRNA誘導FokIヌクレアーゼである。実施形態では、Casヌクレアーゼは、Cas9またはCas12aである。実施形態では、RNA誘導ヌクレアーゼは、SpCas9、SaCas9、NmCas9、St1Cas9、FnCas9、Cas12a(例えば、FnCpf1、AsCpf1、LbCpf1)、Mad7、CasX、CasY、Cas13a、C2c1、C2c2、C2c3、LshC2c2、Cas14、dSpCas9-FokI、スプリット-SpCas9、SpCas9-ニッカーゼである。
【0024】
実施形態では、任意のまたは各組換えポリヌクレオチドは、ベクターによって提供される。実施形態では、ベクターは、プラスミドベクターまたはウイルスベクターである。実施形態では、ベクターは、高コピー数ベクターである。実施形態では、任意のまたは各組換えポリヌクレオチドは、例えば、レトロン系を介して発現および逆転写される。
【0025】
実施形態では、各組換えポリヌクレオチドは、組換えポリヌクレオチドとハイブリダイズすることができるガイドRNA(例えば、ガイドX)をコードする、第2の核酸配列をさらに含む。実施形態では、ガイドRNAは、各細胞内のヌクレアーゼと複合体を形成し、ガイドRNA-ヌクレアーゼ複合体が組換えポリヌクレオチドを切断するようにする。実施形態では、組換えポリヌクレオチドは、プラスミドベクターであり、ヌクレアーゼ複合体(例えば、ガイドRNA-ヌクレアーゼ複合体)は、プラスミドベクターを線形化する。
【0026】
実施形態では、ベクター(例えば、プラスミド)は、細胞から除去される(例えば、挿入ステップの後)。実施形態では、ベクターは、細胞内のヌクレアーゼによって切断される。実施形態では、ベクターは、例えば、ベクターの保持に関して選択しない培地中での細胞の増殖によって、細胞から受動的に失われる。
【0027】
実施形態では、各組換えポリヌクレオチドは、組換えポリヌクレオチドとハイブリダイズすることができるガイドRNA(例えば、ガイドX)をコードする、第2の核酸配列をさらに含み、ガイドRNAは、各細胞内のヌクレアーゼと複合体を形成し、ガイドRNA-ヌクレアーゼ複合体がバーコード遺伝子座を切断するようにする。実施形態では、ガイドRNAをコードする核酸配列は、ドナーDNAおよび/またはバーコードポリヌクレオチドとは異なるポリヌクレオチド上にある。実施形態では、細胞は、バーコードポリヌクレオチドを含有するポリヌクレオチドとは別のステップで、ガイドRNAをコードする核酸配列と接触させられる。
【0028】
実施形態では、バーコード遺伝子座は、染色体バーコード遺伝子座である。実施形態では、バーコード遺伝子座は、プラスミドバーコード遺伝子座である。
【0029】
実施形態では、遺伝子修飾は、設計された遺伝子修飾である。
【0030】
主題の開示のこれらおよび他の実施形態は、本明細書の開示を考慮して当業者に容易に想到されるであろう。
【図面の簡単な説明】
【0031】
【
図1A】再帰的バーコード連結の要素を示す。
図1Aは、バーコード化方法論の例示的な使用を示す。
図1B~1Dは、再帰的バーコード化の例示的な動作を示す。選択可能なマーカーによって補助されるか(左)、または選択可能なマーカーを含まないか(右)によって定義される、バーコード再帰の2つのバージョンが示される。バーコードは、左相同性(LH)および右相同性(RH)と呼ばれる2つの相同性アームを利用する、宿主細胞相同組換え(HR)によって可能になる。
【
図1B】再帰的バーコード連結の要素を示す。
図1Aは、バーコード化方法論の例示的な使用を示す。
図1B~1Dは、再帰的バーコード化の例示的な動作を示す。選択可能なマーカーによって補助されるか(左)、または選択可能なマーカーを含まないか(右)によって定義される、バーコード再帰の2つのバージョンが示される。バーコードは、左相同性(LH)および右相同性(RH)と呼ばれる2つの相同性アームを利用する、宿主細胞相同組換え(HR)によって可能になる。
【
図1C】再帰的バーコード連結の要素を示す。
図1Aは、バーコード化方法論の例示的な使用を示す。
図1B~1Dは、再帰的バーコード化の例示的な動作を示す。選択可能なマーカーによって補助されるか(左)、または選択可能なマーカーを含まないか(右)によって定義される、バーコード再帰の2つのバージョンが示される。バーコードは、左相同性(LH)および右相同性(RH)と呼ばれる2つの相同性アームを利用する、宿主細胞相同組換え(HR)によって可能になる。
【
図1D】再帰的バーコード連結の要素を示す。
図1Aは、バーコード化方法論の例示的な使用を示す。
図1B~1Dは、再帰的バーコード化の例示的な動作を示す。選択可能なマーカーによって補助されるか(左)、または選択可能なマーカーを含まないか(右)によって定義される、バーコード再帰の2つのバージョンが示される。バーコードは、左相同性(LH)および右相同性(RH)と呼ばれる2つの相同性アームを利用する、宿主細胞相同組換え(HR)によって可能になる。
【
図2A】バーコード圧縮の一例を示す。
図2Aは、複数の細胞に統合されるバーコードアレイを表し、各細胞は、バーコード遺伝子座内に多くのバーコードをすでに含有している。
図2Bは、複数のバーコード(bc4、bc3、bc2、bc1)をすでに含有しているバーコード遺伝子座への、コンプレッサーバーコード(bc
1..4)の挿入、その後に続く、bc4、bc3、bc2、およびbc1をbc
1..4に「圧縮する」ためのバーコードの配列決定を示す。
図2Cに示すように、後続の読み取りで圧縮バーコードを配列決定する必要なく、追加の再帰的バーコード連結が実行され得る。
【
図2B】バーコード圧縮の一例を示す。
図2Aは、複数の細胞に統合されるバーコードアレイを表し、各細胞は、バーコード遺伝子座内に多くのバーコードをすでに含有している。
図2Bは、複数のバーコード(bc4、bc3、bc2、bc1)をすでに含有しているバーコード遺伝子座への、コンプレッサーバーコード(bc
1..4)の挿入、その後に続く、bc4、bc3、bc2、およびbc1をbc
1..4に「圧縮する」ためのバーコードの配列決定を示す。
図2Cに示すように、後続の読み取りで圧縮バーコードを配列決定する必要なく、追加の再帰的バーコード連結が実行され得る。
【
図2C】バーコード圧縮の一例を示す。
図2Aは、複数の細胞に統合されるバーコードアレイを表し、各細胞は、バーコード遺伝子座内に多くのバーコードをすでに含有している。
図2Bは、複数のバーコード(bc4、bc3、bc2、bc1)をすでに含有しているバーコード遺伝子座への、コンプレッサーバーコード(bc
1..4)の挿入、その後に続く、bc4、bc3、bc2、およびbc1をbc
1..4に「圧縮する」ためのバーコードの配列決定を示す。
図2Cに示すように、後続の読み取りで圧縮バーコードを配列決定する必要なく、追加の再帰的バーコード連結が実行され得る。
【
図3A】バーコードの除去および挿入要素の再利用によるバーコード圧縮を示す。
図3Aは、複数のバーコード(bc4、bc3、bc2、bc1)をすでに含有しているバーコード遺伝子座への、コンプレッサーバーコード(bc
1..4)の挿入、その後に続く、bc4、bc3、bc2、およびbc1をbc
1..4に「圧縮する」ためのバーコードの配列決定を示す。
図3Bは、もはや必要とされなくなった連結されたバーコードの除去を可能にする次のバーコード化ラウンドを示す。この例では、bc5は、bc
1..4の左側に隣接して挿入され、プロセスにおいて、bc1、bc2、bc3、およびbc4、ならびにRH1、RH2、RH3、RH4、およびRH5、およびそれらに関連する切断部位を除去する。これにより、次の一連のバーコード化ラウンドでのこれらの要素の再利用が可能になる。
【
図3B】バーコードの除去および挿入要素の再利用によるバーコード圧縮を示す。
図3Aは、複数のバーコード(bc4、bc3、bc2、bc1)をすでに含有しているバーコード遺伝子座への、コンプレッサーバーコード(bc
1..4)の挿入、その後に続く、bc4、bc3、bc2、およびbc1をbc
1..4に「圧縮する」ためのバーコードの配列決定を示す。
図3Bは、もはや必要とされなくなった連結されたバーコードの除去を可能にする次のバーコード化ラウンドを示す。この例では、bc5は、bc
1..4の左側に隣接して挿入され、プロセスにおいて、bc1、bc2、bc3、およびbc4、ならびにRH1、RH2、RH3、RH4、およびRH5、およびそれらに関連する切断部位を除去する。これにより、次の一連のバーコード化ラウンドでのこれらの要素の再利用が可能になる。
【
図4A】再帰的バーコード圧縮を示す。
図4Aは、第2のバーコード圧縮ラウンドを示し、これは、第1のラウンド(例えば、
図3A~3Bに示される)と構造的に同一であり得、同じRH要素の使用を伴うが、左側へのさらなるバーコード連結および右側へのバーコード圧縮のための異なる相同性および切断部位を伴う。バーコード圧縮のこの例示的なラウンドにおいて、入ってくるバーコードbc
1..7は、連結されたバーコードbc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4の両方を圧縮する。
図4Bに示すように、左側へのバーコード連結の次のラウンドは、bc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4を除去し、次の一連のバーコード化ラウンドで、すでに使用された挿入要素の再利用を可能にする。
【
図4B】再帰的バーコード圧縮を示す。
図4Aは、第2のバーコード圧縮ラウンドを示し、これは、第1のラウンド(例えば、
図3A~3Bに示される)と構造的に同一であり得、同じRH要素の使用を伴うが、左側へのさらなるバーコード連結および右側へのバーコード圧縮のための異なる相同性および切断部位を伴う。バーコード圧縮のこの例示的なラウンドにおいて、入ってくるバーコードbc
1..7は、連結されたバーコードbc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4の両方を圧縮する。
図4Bに示すように、左側へのバーコード連結の次のラウンドは、bc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4を除去し、次の一連のバーコード化ラウンドで、すでに使用された挿入要素の再利用を可能にする。
【
図5A】再帰的バーコード連結および圧縮の例示的な動作を示す。
【
図5B】再帰的バーコード連結および圧縮の例示的な動作を示す。
【
図6】ガイド-ドナーを固有のDNAバーコードと連結するための、ライブラリクローニングの例示的な方法を示す。
【
図7】自己破壊プラスミドを介した同時の編集およびバーコード統合の例示的な方法を示す。
【
図8】バーコードの高次ガイド-ドナー編集およびバーコードの順次の連結の例示的な方法を示す。
【
図9】ガイド-ドナーバーコード圧縮の例示的な方法を示す。
【
図10】バーコード圧縮を介した超高次編集の例示的な方法を示す。
【
図11A】開始(ラウンド0)細胞の異なる選択可能なマーカーを有する、例示的なバーコード遺伝子座を示す。
【
図11B】開始(ラウンド0)細胞の異なる選択可能なマーカーを有する、例示的なバーコード遺伝子座を示す。
【
図12】ガイド-ドナー統合なしのバーコード統合のための、例示的なクローニングバーコード化ガイド-ドナーライブラリを示す。
【
図13】ガイド-ドナー統合なしのバーコード統合のための、一連のラウンドに特異的な挿入物の構築の一例を示す。
【
図14】ガイド-ドナー統合なしのバーコード統合のための、ガイド-ドナーバーコードを挿入物バーコードに関連付けるための例示的な方法を示す。
【
図15A】単一バーコードのための同時のゲノム編集、ガイド-ドナーバーコード統合、およびプラスミド自己破壊を示す。
【
図15B】単一バーコードのための同時のゲノム編集、ガイド-ドナーバーコード統合、およびプラスミド自己破壊を示す。
【
図15C】単一バーコードのための同時のゲノム編集、ガイド-ドナーバーコード統合、およびプラスミド自己破壊を示す。
【
図16A】全体的な方法論を示す。ラウンド1からの2つの異なるバーコード化株を、単一バーコード化CAN1ガイド-ドナープラスミドとの再帰的バーコード連結のラウンド2に供し、サンガーシーケンシングによってバーコード遺伝子座でのバーコード連結を確認した(
図16C)。
【
図16B】全体的な方法論を示す。ラウンド1からの2つの異なるバーコード化株を、単一バーコード化CAN1ガイド-ドナープラスミドとの再帰的バーコード連結のラウンド2に供し、サンガーシーケンシングによってバーコード遺伝子座でのバーコード連結を確認した(
図16C)。
【
図16C】全体的な方法論を示す。ラウンド1からの2つの異なるバーコード化株を、単一バーコード化CAN1ガイド-ドナープラスミドとの再帰的バーコード連結のラウンド2に供し、サンガーシーケンシングによってバーコード遺伝子座でのバーコード連結を確認した(
図16C)。
【
図17】RH近位切断部位の存在下または非存在下での、RH長さに対するバーコード化効率の依存性を示す。すべての構築物には、LH近位切断部位を有する。
【
図18】染色体統合部位に挿入するための、各々が遺伝子バリアントおよび関連するバーコードを含有するポリヌクレオチドのライブラリを構築するための例示的な方法を示す。
【
図19】バーコード遺伝子座におけるバーコード化遺伝子の同時のバーコード連結および連鎖の例示的な方法を示す。
【
図20】遺伝子ライブラリ全体をバーコード化するための例示的な方法、および任意の遺伝子座での遺伝子挿入のための経路を示す。
【
図21】同時のバーコード遺伝子座でのバーコード挿入および任意の遺伝子座での遺伝子挿入を示す。
【
図22A】ドナーに隣接するレトロン要素を有するガイド-ドナープラスミドの修飾を示す。ドナーは、RNAポリメラーゼIIプロモーターによって転写され、リボザイムは、5’キャップおよびポリ(A)テールを除去し、レトロン要素(msr/msd)は、ドナーRNAの逆転写を促進してドナーcDNAを生成する。この系の修飾では、標的バリアントの編集は、ドナーcDNAまたはプラスミドベースのドナーとの相同組換えのいずれかを通して行われ得る。
【
図22B】ドナーに隣接するレトロン要素を有するガイド-ドナープラスミドの修飾を示す。ドナーは、RNAポリメラーゼIIプロモーターによって転写され、リボザイムは、5’キャップおよびポリ(A)テールを除去し、レトロン要素(msr/msd)は、ドナーRNAの逆転写を促進してドナーcDNAを生成する。この系の修飾では、標的バリアントの編集は、ドナーcDNAまたはプラスミドベースのドナーとの相同組換えのいずれかを通して行われ得る。
【
図22C】ドナーに隣接するレトロン要素を有するガイド-ドナープラスミドの修飾を示す。ドナーは、RNAポリメラーゼIIプロモーターによって転写され、リボザイムは、5’キャップおよびポリ(A)テールを除去し、レトロン要素(msr/msd)は、ドナーRNAの逆転写を促進してドナーcDNAを生成する。この系の修飾では、標的バリアントの編集は、ドナーcDNAまたはプラスミドベースのドナーとの相同組換えのいずれかを通して行われ得る。
【
図23A】ドナープラスミドおよびバーコード遺伝子座の複数の切断部位を介してガイド-ドナープラスミドを統合するための概略図を示す。所望の遺伝子座でのガイド-ドナー統合のための複数の切断部位配列の詳細。遺伝子編集に使用されるヌクレアーゼ(この例ではCas9)以外の誘導型ヌクレアーゼ(本明細書に示されるCpf1/Cas12aおよびI-SceI)は、プラスミドのガイド-ドナー部分のゲノムへの統合、および後続のガイド-ドナープラスミド破壊を可能にする。
【
図23B】ドナープラスミドおよびバーコード遺伝子座の複数の切断部位を介してガイド-ドナープラスミドを統合するための概略図を示す。所望の遺伝子座でのガイド-ドナー統合のための複数の切断部位配列の詳細。遺伝子編集に使用されるヌクレアーゼ(この例ではCas9)以外の誘導型ヌクレアーゼ(本明細書に示されるCpf1/Cas12aおよびI-SceI)は、プラスミドのガイド-ドナー部分のゲノムへの統合、および後続のガイド-ドナープラスミド破壊を可能にする。
【
図23C】ドナープラスミドおよびバーコード遺伝子座の複数の切断部位を介してガイド-ドナープラスミドを統合するための概略図を示す。所望の遺伝子座でのガイド-ドナー統合のための複数の切断部位配列の詳細。遺伝子編集に使用されるヌクレアーゼ(この例ではCas9)以外の誘導型ヌクレアーゼ(本明細書に示されるCpf1/Cas12aおよびI-SceI)は、プラスミドのガイド-ドナー部分のゲノムへの統合、および後続のガイド-ドナープラスミド破壊を可能にする。
【
図24A】写真上に示されるバーコード化方法で、12世代にわたってガラクトースに曝露されてきた酵母をプレーティングしたペトリ皿の写真である。Cpf1/Cas12aガイドを、ガイド転写物リーダーを除去するために、ハンマーヘッドリボザイム(HHR)を用いてまたは用いずに、2つの異なるプロモーター(RPR1-TetOおよびGAL7)の下で、2つの異なるガイド配列(X1およびX2)で発現した。Cpf1/Cas12aを、左端の5つのカラムについてGal-Lプロモーターの制御下に置いた。二重核局在化シグナル(NLS)がある場合およびない場合のI-SceIヌクレアーゼを、示されたカラムについてGal-Lプロモーターの制御下に置いた。酵母の約1000個の細胞を示された培地上にプレーティングした。YPDは、すべての生細胞がコロニーを形成することを可能にし、5FC-HISは、バーコード統合およびプラスミド除去を受けた細胞を選択し、5FOAは、バーコード統合を受けた細胞を選択し、-URAは、バーコード統合を受けていない細胞を選択する。ガイドなしおよびSceIなしの対照は、ガイド切断がない場合、バーコード統合およびプラスミド除去が進行しないことを示す。
【
図24B】時間ゼロ(ガラクトース誘導なし)で酵母をプレーティングしたペトリ皿の写真であり、Cpf1/Cas12a-ガイドX系またはI-SceI系の漏れが最小限であることを示す。
【
図24C】6世代にわたってガラクトースに曝露されてきた酵母をプレーティングしたペトリ皿の写真である。酵母の約1000個の細胞を示された培地上にプレーティングした。異なる培地上での増殖は、バーコード統合およびプラスミド除去の異なる割合を示す。
【
図25】1536密度のYPD寒天培地上での増殖中の受動的なCas9プラスミドの喪失を示す酵母コロニーアレイの写真である。yKR4(URA3遺伝子が欠失した対照)、yKR267(プラスミド上のCas9/URA3/hphMX)、およびyKR649(ゲノム内のCas9/URA3/hphMX)を含むコロニーアレイを最初にYPDに貼り付け、各々のコロニー内の細胞の一部分がCas9プラスミドを失うことを可能にした(左上)。次いで、このアレイを、Cas9の選択を維持するYPD+ハイグロマイシンB(YPD+Hyg、左下)、Cas9の選択を維持する-URA(右上)、およびコロニー増殖を可能にするCas9プラスミドの喪失を必要とする5-FOAからなる寒天培地にレプリカプレーティングした。ゲノムCas9(yKR649)を有する株は、酵母ゲノムで安定して継承されるため、Cas9/URA3/hphMX構築物を失うことはできない。
【
図26】他のプラスミド構成成分と逆方向のTDH3-HDV-msr/msdレトロン配列を有する、ガイド-ドナープラスミドを示す概略図である。
【
図27】yKR649酵母をプレーティングしたペトリ皿の写真であり、一過性に発現したSceIを有するバーコード統合を示す。SceIのDNAをコードするPCR産物を、ドナープラスミドで同時形質転換した。SceIは、バーコードおよび反復部位の統合、ならびにドナープラスミド破壊のために、ゲノムおよびプラスミドの多重切断部位で切断する。プレートは、HIS3遺伝子を含有するガイド-ドナープラスミドに対して、5-FC対抗選択培地上で、yKR649酵母株でプレーティングされる。効率的なガイド-ドナーまたはバーコードの組み込みを有するプレートは、非効率的な組み込み(ゼロまたは少数のコロニー)と比較して、多数のコロニーを示す。
【
図28A】MARVELプラスミドのインビボ集合との同時編集のための戦略を提示する。
図28A:図は、ドナーに隣接して、bc0とラベル付けされたバーコード配列が付加されたプラスミド骨格にクローニングされる、ガイド-ドナーオリゴヌクレオチドを示す。
図28B:この図は、ラウンド1プラスミドが最初に酵母または細菌中で解析されて、各ガイド-ドナーが完全で等しい存在量で存在するライブラリを作成することができ、次いで、MARVELラウンド1挿入物が、インビトロSceI酵素処理によって除去され、左相同性(CYC1t)および右相同性(msd)を残すことができることを示す。
図28C:この図は、SceI切断によって生成された線形化骨格が、適切なラウンドのMARVEL挿入物と共に酵母に直接変換され得ることを示す。酵母相同組換え修復は、ガイド-ドナー骨格およびバーコード化MARVEL挿入物の両方に存在する左相同性(CYC1t)および右相同性(msd)を介して、プラスミドを集合させる。
【
図28B】MARVELプラスミドのインビボ集合との同時編集のための戦略を提示する。
図28A:図は、ドナーに隣接して、bc0とラベル付けされたバーコード配列が付加されたプラスミド骨格にクローニングされる、ガイド-ドナーオリゴヌクレオチドを示す。
図28B:この図は、ラウンド1プラスミドが最初に酵母または細菌中で解析されて、各ガイド-ドナーが完全で等しい存在量で存在するライブラリを作成することができ、次いで、MARVELラウンド1挿入物が、インビトロSceI酵素処理によって除去され、左相同性(CYC1t)および右相同性(msd)を残すことができることを示す。
図28C:この図は、SceI切断によって生成された線形化骨格が、適切なラウンドのMARVEL挿入物と共に酵母に直接変換され得ることを示す。酵母相同組換え修復は、ガイド-ドナー骨格およびバーコード化MARVEL挿入物の両方に存在する左相同性(CYC1t)および右相同性(msd)を介して、プラスミドを集合させる。
【
図28C】MARVELプラスミドのインビボ集合との同時編集のための戦略を提示する。
図28A:図は、ドナーに隣接して、bc0とラベル付けされたバーコード配列が付加されたプラスミド骨格にクローニングされる、ガイド-ドナーオリゴヌクレオチドを示す。
図28B:この図は、ラウンド1プラスミドが最初に酵母または細菌中で解析されて、各ガイド-ドナーが完全で等しい存在量で存在するライブラリを作成することができ、次いで、MARVELラウンド1挿入物が、インビトロSceI酵素処理によって除去され、左相同性(CYC1t)および右相同性(msd)を残すことができることを示す。
図28C:この図は、SceI切断によって生成された線形化骨格が、適切なラウンドのMARVEL挿入物と共に酵母に直接変換され得ることを示す。酵母相同組換え修復は、ガイド-ドナー骨格およびバーコード化MARVEL挿入物の両方に存在する左相同性(CYC1t)および右相同性(msd)を介して、プラスミドを集合させる。
【発明を実施するための形態】
【0032】
この説明を読んだ後、様々な代替の実施形態および代替の用途において本明細書に記載される技術をどのように実施するかが当業者に明らかになるであろう。しかしながら、すべての様々な実施形態は、本明細書に記載されない。本明細書に提示される実施形態は、限定ではなく、ほんの一例としてのみ提示されることが理解されるであろう。したがって、様々な代替の実施形態のこの詳細な説明は、本明細書に記載される本開示の範囲または幅を限定するものと解釈されるべきではない。
【0033】
以下に記載される態様は、特定の組成物、そのような組成物を調製する方法、またはそれらの使用に限定されず、そのようなものは、当然のことながら変化し得ることが理解されるべきである。本明細書で使用される用語は、特定の態様を説明することのみを目的としており、限定することを意図するものではないことも理解されたい。
【0034】
詳細な説明は、読者の便宜のためにのみ様々なセクションに分割されており、任意のセクションに見られる開示は、別のセクションの開示と組み合わされ得る。表題または副題は、読者の便宜のために本明細書で使用され得、本開示の範囲に影響を与えることを意図していない。
【0035】
定義
他の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書および以下の特許請求の範囲では、以下の意味を有するように定義されるべきである多くの用語が参照される。
【0036】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、限定することを意図するものではない。本明細書で使用される場合、単数形「a」、「an」、および「the」は、文脈が明らかに他のことを示さない限り、複数形も含むことを意図している。
【0037】
「任意の」または「任意に」とは、その次に記載される事象または状況が発生する可能性があるか、または発生しない可能性があり、この記載が、その事象または状況が発生する場合および発生しない場合を含むことを意味する。
【0038】
「約」という用語は、数値表示、例えば、範囲を含む温度、時間、量、濃度、およびそのような他のもの前に使用される場合、(+)または(-)10%、5%、1%、またはそれらの間の任意の部分範囲または部分値だけ変動し得る近似値を示す。好ましくは、「約」という用語は、量に関して使用される場合、その量が+/-10%変動し得ることを意味する。
【0039】
「含むこと」または「含む」とは、組成物および方法が列挙された要素を含むが、他のものを除外しないことを意味することを意図している。「から本質的になる」とは、組成物および方法を定義するために使用される場合、述べられた目的のために、組み合わせにとっていかなる本質的に重要な他の要素も除外することを意味するものとする。したがって、本明細書で定義される要素から本質的になる組成物は、特許請求の範囲の基本的および新規の特性に実質的に影響を及ぼさない他の材料またはステップを除外しない。「からなる」とは、他の成分の微量以上の要素および実質的な方法ステップを除外することを意味するものとする。これらの移行用語の各々によって定義される実施形態は、本開示の範囲内である。
【0040】
「バーコード」は、バーコードが関連する核酸または細胞を同定するために使用される1つ以上のポリヌクレオチド配列を指す。バーコードは、3~1000個以上のヌクレオチドの長さであり得る。実施形態では、長さは、好ましくは10~250個のヌクレオチドである。実施形態では、長さは、10~30個のヌクレオチドである。実施形態では、長さは、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000個のヌクレオチドである。バーコードは、例えば、核酸が由来する単一細胞、細胞の亜集団、コロニー、または試料を同定するために使用され得る。バーコードはまた、細胞アレイ内のコロニーの位置、マルチウェルプレート内のウェルの位置、またはラック内のチューブ、フラスコ、もしくは他の容器の位置など、核酸が由来する細胞、コロニー、または試料の位置(すなわち、位置バーコード)を同定するためにも使用され得る。特に、バーコードは、核酸が由来する遺伝子修飾された細胞を同定するために使用され得る。いくつかの実施形態では、バーコードは、特定のタイプのゲノム編集を同定するために使用される。例えば、ガイドRNAドナーポリヌクレオチドカセット自体をバーコードとして使用して、核酸が由来する遺伝子修飾された細胞を同定することができる。あるいは、固有のバーコードを使用して、多重ゲノム編集で使用される各ガイド-RNA-ドナーポリヌクレオチドカセットを同定することができる。さらに、複数のバーコードを組み合わせて使用して、核酸の異なる特徴を同定することができる。例えば、位置バーコード(例えば、アレイ、マルチウェルプレート、またはラック内の細胞、コロニー、培養物、または試料の位置を同定するための)は、ゲノム編集で使用されるガイド-RNA-ドナーポリヌクレオチドカセットを同定するバーコードと組み合わされ得る。いくつかの実施形態では、バーコードは、細胞の遺伝子修飾に使用されるガイド-RNAおよび/またはドナーポリヌクレオチドを同定するために、ゲノム編集の各ラウンドで核酸に(例えば、「バーコード遺伝子座」で)挿入される。
【0041】
「ポリペプチド」および「タンパク質」という用語は、アミノ酸残基のポリマーを指し、最小の長さに限定されない。したがって、ペプチド、オリゴペプチド、二量体、多量体などがこの定義内に含まれる。完全長タンパク質およびその断片の両方がこの定義によって包含される。これらの用語はまた、ポリペプチドの発現後修飾、例えば、グリコシル化、アセチル化、リン酸化、ヒドロキシル化なども含む。さらに、本開示の目的のために、「ポリペプチド」は、タンパク質が所望の活性を示す限り、天然配列への欠失、付加、および置換などの修飾を含むタンパク質を指す。これらの修飾は、部位特異的変異誘発などを通して意図的であり得るか、またはタンパク質を産生する宿主の変異もしくはPCR増幅によるエラーなどを通して、偶発的なものであり得る。
【0042】
「遺伝子修飾」という用語は、細胞のゲノム(染色体または染色体外、例えば、プラスミド、ミトコンドリア)内の任意の変化を指す。遺伝子修飾には、ポリヌクレオチド配列中の1つ以上のヌクレオチドの変異、欠失、挿入、もしくは置換、ポリヌクレオチド配列の挿入、ポリヌクレオチド配列、例えば、遺伝子もしくは遺伝子の一部の欠失、ポリヌクレオチド配列の転座または相互転座、染色体融合、および/またはポリヌクレオチド配列に対するエピジェネティック修飾が含まれ得るが、これらに限定されない。
【0043】
本明細書で使用される場合、「Cas9」という用語は、任意の種由来のII型クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系Cas9エンドヌクレアーゼを包含し、また、Cas9エンドヌクレアーゼ活性を保持する(すなわち、二本鎖切断を起こすためにDNAの部位特異的切断を触媒する)、その生物学的に活性な断片、バリアント、類似体、および誘導体も含む。Cas9エンドヌクレアーゼは、その結合したガイドRNA(gRNA)に相補的な配列を含む部位でDNAに結合し、DNAを切断する。
【0044】
Cas9ポリヌクレオチド、核酸、オリゴヌクレオチド、タンパク質、ポリペプチド、またはペプチドは、任意の供給源に由来する分子を指す。分子は、物理的に生物に由来する必要はないが、合成または組換えにより産生され得る。多くの細菌種由来のCas9配列が当技術分野でよく知られており、アメリカ国立生物工学情報センター(NCBI)データベースに列挙されている。例えば、次に由来するCas9のNCBIエントリを参照されたい。Streptococcus pyogenes(WP_002989955、WP_038434062、WP_011528583);Campylobacter jejuni(WP_022552435、YP_002344900)、Campylobacter coli(WP_060786116);Campylobacter fetus(WP_059434633);Corynebacterium ulcerans(NC_015683、NC_017317);Corynebacterium diphtheria(NC_016782、NC_016786);Enterococcus faecalis(WP_033919308);Spiroplasma syrphidicola(NC_021284);Prevotella intermedia(NC_017861);Spiroplasma taiwanense(NC_021846);Streptococcus iniae(NC_021314);Belliella baltica(NC_018010);Psychroflexus torquisI(NC_018721);Streptococcus thermophilus(YP_820832)、Streptococcus mutans(WP_061046374、WP_024786433);Listeria innocua(NP 472073);Listeria monocytogenes(WP 061665472);Legionella pneumophila(WP_062726656);Staphylococcus aureus(WP_001573634);Francisella tularensis(WP_032729892、WP_014548420)、Enterococcus faecalis(WP_033919308);Lactobacillus rhamnosus(WP_048482595、WP_032965177);およびNeisseria meningitidis(WP_061704949、YP 002342100)。これらの配列のすべて(本出願の出願日までに入力された)は、参照により本明細書に組み込まれる。これらの配列のいずれか、またはそれと少なくとも約70~100%の配列同一性(この範囲内の任意の同一性パーセント、例えば、それと70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、もしくは99%の配列同一性)を有する配列を含むそのバリアントが、本明細書に記載されるように、ゲノム編集のために使用され得、バリアントは、Cas9部位特異的エンドヌクレアーゼ活性などの生物学的活性を保持する。これらの配列のいずれかから作製されるアミノ酸配列、またはそれと少なくとも約70~100%の配列同一性(この範囲内の任意の同一性パーセント、例えば、それと70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、もしくは99%の配列同一性)を有するアミノ酸配列を含むそのバリアントが、本明細書に記載されるように、ゲノム編集のために使用され得、バリアントは、Cas9部位特異的エンドヌクレアーゼ活性などの生物学的活性を保持する。配列比較、ならびにCas9の遺伝的多様性および系統発生分析の考察について、Fonfara et al.(2014)Nucleic Acids Res.42(4):2577-90、Kapitonov et al(2015)J.Bacteriol.198(5):797-807、Shmakov et al.(2015)Mol.Cell.60(3):385-397、およびChylinski et al.(2014)Nucleic Acids Res.42(10):6091-6105も参照されたい。
【0045】
本明細書に記載されるRNA誘導ヌクレアーゼは、ニッカーゼであり得る。CRISPR/Casニッカーゼ変異体は、野生型Cas酵素によって生じた二本鎖切断の代わりに、gRNA標的一本鎖切断をDNAに導入する。
【0046】
「誘導体」とは、天然ポリペプチドの所望の生物学的活性が保持される限り、目的の天然ポリペプチド、天然ポリペプチドの断片、またはそれらのそれぞれの類似体の任意の好適な修飾、例えば、グリコシル化、リン酸化、ポリマーコンジュゲーション(ポリエチレングリコールを用いたものなど)、または外来部分の他の付加を意味する。ポリペプチド断片、類似体、および誘導体を作製するための方法は、当技術分野で一般的に利用可能である。
【0047】
「断片」とは、無傷の完全長配列および構造の一部のみからなる分子を意味する。断片は、ポリペプチドのC末端欠失、N末端欠失、および/または内部欠失を含み得る。特定のタンパク質またはポリペプチドの活性断片は、一般に、完全長分子の少なくとも約5~10個の連続するアミノ酸残基、好ましくは完全長分子の少なくとも約15~25個の連続するアミノ酸残基、最も好ましくは完全長分子の少なくとも約20~50個以上の連続するアミノ酸残基、または5個のアミノ酸と完全長配列との間の任意の整数を含み、ただし、問題の断片が、Cas9部位特異的エンドヌクレアーゼ活性などの生物学的活性を保持していることを条件とする。
【0048】
「実質的に精製された」とは、一般に、物質(化合物、ポリヌクレオチド、核酸、タンパク質、ポリペプチド、ポリペプチド組成物)が、それが存在する試料の大部分の割合を構成するような、物質の単離を指す。典型的には、試料中、実質的に精製された構成成分は、試料の50%、好ましくは80%~85%、より好ましくは90~95%を構成する。目的のポリヌクレオチドおよびポリペプチドを精製するための技術は、当技術分野で周知であり、例えば、イオン交換クロマトグラフィ、アフィニティクロマトグラフィ、および密度に応じた沈降を含む。
【0049】
「単離された」とは、ポリペプチドを指す場合、示された分子が、その分子が自然界に見られる生物全体から分離して別個であるか、または同じタイプの他の生物学的巨大分子の実質的な非存在下で存在することを意味する。ポリヌクレオチドに関する「単離された」という用語は、自然界で通常それに関連する配列を全体的もしくは部分的に欠いている核酸分子、または自然界に存在するが、それに関連して異種配列を有する配列、または染色体から解離された分子である。
【0050】
本明細書で使用される場合、「不均一な細胞集団」という語句は、少なくとも2つのタイプの細胞の混合物を指し、一方のタイプは、目的の細胞である(例えば、目的のゲノム修飾を有する)。不均一な細胞集団は、任意の生物に由来し得る。
【0051】
目的のゲノム修飾を有する細胞または細胞集団を選択する文脈において本明細書で使用される場合、「単離すること」および「単離」という用語は、正もしくは負の選択、または複雑なコロニーアレイからのクローン単離などによって、目的のゲノム修飾を有する細胞または細胞集団を、不均一な細胞集団から分離することを指す。
【0052】
「選択マーカー」または「マーカー」という用語は、正の選択(マーカーを発現する細胞の選択)または負の選択(マーカーを発現する細胞の除外)のいずれかによって、不均一な細胞集団からの細胞集団の同定または濃縮に使用され得るマーカーを指す。
【0053】
「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語は、任意の長さのヌクレオチドのポリマー形態、リボヌクレオチドまたはデオキシリボヌクレオチドのいずれかを含むために本明細書で使用される。この用語は、分子の一次構造のみを指す。したがって、この用語には、三本鎖、二本鎖、および一本鎖DNA、ならびに三本鎖、二本鎖、および一本鎖RNAが含まれる。これはまた、メチル化および/またはキャッピングなどによる修飾、ならびにポリヌクレオチドの非修飾形態も含む。より具体的には、「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語は、ポリデオキシリボヌクレオチド(2-デオキシ-D-リボースを含有する)、ポリリボヌクレオチド(D-リボースを含有する)、プリンまたはピリミジン塩基のN-またはC-グリコシドである他のタイプのポリヌクレオチド、ならびに非ヌクレオチド骨格を含有する他のポリマー、例えば、ポリアミド(例えば、ペプチド核酸(PNA))およびポリモルホリノ(Anti-virals,Inc.,Corvallis,Oreg.からNeugeneとして市販)、ならびに他の合成配列特異的核酸ポリマーを含むが、ただし、ポリマーが、DNAおよびRNAに見られるような塩基対合および塩基スタッキングを可能にする構成で核酸塩基を含有することを条件とする。「ポリヌクレオチド」、「オリゴヌクレオチド」、「核酸」、および「核酸分子」という用語間で長さの意図された区別はなく、これらの用語は互換的に使用される。したがって、これらの用語は、例えば、3’-デオキシ-2’,5’-DNA、オリゴデオキシリボヌクレオチドN3’P5’ホスホルアミデート、2’-O-アルキル置換RNA、二本鎖および一本鎖DNA、ならびに二本鎖および一本鎖RNA、マイクロRNA、DNA:RNAハイブリッド、およびPNAとDNAまたはRNAとの間のハイブリッドを含み、また、既知のタイプの修飾、例えば、当技術分野で知られている標識、メチル化、自然発生的ヌクレオチドのうちの1つ以上の類似体による「キャップ」置換(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシンC5-プロピニルシチジン、C5-プロピニルウリジン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-メチルシチジン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、および2-チオシチジン)、ヌクレオチド間修飾、例えば、非荷電連結(例えば、メチルホスホネート、ホスホトリエステル、ホスホロアミデート、カルバメートなど)を有するもの、負荷電連結(例えば、ホスホロチオエート、ホスホロジチオエートなど)を有するもの、および正荷電連結(例えば、アミノアルキルホスホロアミデート、アミノアルキルホスホトリエステル)を有するもの、ペンダント部分、例えば、タンパク質(ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなどを含む)を含有するもの、インターカレーター(例えば、アクリジン、ソラレンなど)を有するもの、キレーター(例えば、金属、放射性金属、ホウ素、酸化金属など)を含有するもの、修飾された連結を有するもの(例えば、アルファアノマー核酸など)、ならびにポリヌクレオチドまたはオリゴヌクレオチドの非修飾形態も含む。この用語はまた、ロックド核酸(例えば、2’-酸素原子と4’-炭素原子との間にメチレン架橋を有するリボヌクレオチドを含む)も含む。例えば、Kurreck et al.(2002)Nucleic Acids Res.30:1911-1918、Elayadi et al.(2001)Curr.Opinion Invest.Drugs 2:558-561、Orum et al.(2001)Curr.Opinion Mol.Ther.3:239-243、Koshkin et al.(1998)Tetrahedron 54:3607-3630、Obika et al.(1998)Tetrahedron Lett.39:5401-5404を参照されたい。
【0054】
「ハイブリダイズする」および「ハイブリダイゼーション」という用語は、ワトソン-クリック塩基対を介して複合体を形成するのに十分に相補的である、ヌクレオチド配列間の複合体の形成を指す。
【0055】
「相同領域」という用語は、別の核酸領域との相同性を有する核酸の領域を指す。したがって、「相同領域」が核酸分子内に存在するかどうかは、同じまたは異なる分子内の別の核酸領域を参照して決定される。さらに、核酸はしばしば二本鎖であるため、「相同領域」という用語は、本明細書で使用される場合、核酸分子が互いにハイブリダイズする能力を指す。例えば、一本鎖核酸分子は、互いにハイブリダイズすることができる2つの相同領域を有することができる。したがって、「相同領域」という用語は、相補的な配列を有する核酸セグメントを含む。相同領域は長さが異なり得るが、典型的には、4~500個のヌクレオチド(例えば、約4~約40、約40~約80、約80~約120、約120~約160、約160~約200、約200~約240、約240~約280、約280~約320、約320~約360、約360~約400、約400~約440など)である。
【0056】
本明細書で使用される場合、「相補的」または「相補性」という用語は、互いに塩基対を形成することができるポリヌクレオチドを指す。塩基対は、典型的には、ポリヌクレオチド鎖間の逆平行配向におけるヌクレオチド単位間の水素結合によって形成される。相補的ポリヌクレオチド鎖は、ワトソン-クリック様式(例えば、AからT、AからU、CからG)で、または二本鎖の形成を可能にする任意の他の様式で、塩基対合することができる。当業者が知っているように、DNAではなくRNAを使用する場合、チミン(T)ではなくウラシル(U)が、アデノシンに相補的であると考えられる塩基である。しかしながら、本開示の文脈においてウラシルが示される場合、特に明記しない限り、チミンを置換する能力が暗示される。「相補性」は、2つのRNA鎖の間、2つのDNA鎖の間、またはRNA鎖とDNA鎖との間に存在し得る。2つ以上のポリヌクレオチドは「相補的」であり、完全ではないかまたは100%未満の相補性を有するにもかかわらず、二本鎖を形成することができ得ることが、一般に理解されている。相補性の領域を含む各ポリヌクレオチド配列の少なくとも連続部分が、そのような領域内でミスマッチまたは遮断なしに他のポリヌクレオチドと完全に塩基対合する場合、2つの配列は、「完全に相補的」または「100%相補的」である。各ポリヌクレオチド内の相補性の連続領域が他の領域と完全にハイブリダイズすることができる限り、いずれかまたは両方のポリヌクレオチドが追加の非相補的配列を含有する場合でさえ、2つ以上の配列は、「完全に相補的」または「100%相補的」と見なされる。「完全ではない」相補性とは、そのような相補性の領域内のすべてではない連続ヌクレオチドが互いに塩基対合することができる状況を指す。2つのポリヌクレオチド配列間の相補性のパーセンテージを決定することは、当業者の問題である。Cas9標的化の目的のために、gRNAは、二本鎖を形成するのに十分な塩基対合が可能な標的配列(例えば、メジャーまたはマイナー対立遺伝子)に「相補的な」配列を含み得る(すなわち、gRNAが標的配列とハイブリダイズする)。さらに、gRNAは、PAM配列に相補的な配列を含み得、gRNAはまた、標的DNA中のPAM配列とハイブリダイズする。
【0057】
「標的部位」または「標的配列」は、ガイドRNA(gRNA)またはドナーポリヌクレオチドの相同性アームによって認識される(すなわち、ハイブリダイゼーションに対して十分に相補的である)核酸配列である。標的部位は、対立遺伝子特異的であり得る(例えば、メジャーまたはマイナー対立遺伝子)。
【0058】
「ドナーポリヌクレオチド」という用語は、HDRによって標的遺伝子座でゲノムに統合されることを意図した編集の配列を提供する、ポリヌクレオチドを指す。
【0059】
「相同性アーム」とは、細胞内で編集されるゲノム配列にドナーポリヌクレオチドを標的化することに関与するドナーポリヌクレオチドの一部分を意味する。ドナーポリヌクレオチドは、典型的には、5’ゲノム標的配列にハイブリダイズする5’相同性アームと、ゲノムDNAに対する意図した編集を含むヌクレオチド配列に隣接する3’ゲノム標的配列にハイブリダイズする3’相同性アームとを含む。相同性アームは、本明細書において、5’および3’(すなわち、上流および下流)相同性アームと称され、これは、ドナーポリヌクレオチド内の意図した編集を含むヌクレオチド配列に対する相同性アームの相対位置に関係する。5’および3’相同性アームは、修飾されるゲノムDNAの標的遺伝子座内の領域にハイブリダイズし、これらは、本明細書において、それぞれ「5’標的配列」および「3’標的配列」と称される。意図した編集を含むヌクレオチド配列は、5’および3’相同性アームによって認識される(すなわち、ハイブリダイゼーションに対して十分に相補的である)ゲノム標的遺伝子座で、HDRによってゲノムDNAに統合される。
【0060】
ドナーポリヌクレオチド、ガイドRNA、またはCas9発現系などの核酸を細胞に「投与すること」は、形質導入、トランスフェクション、エレクトロポレーション、転座、融合、貪食、シュート方法または弾丸方法など、すなわち、核酸が細胞膜を越えて輸送され得る任意の手段を含む。
【0061】
ガイドRNAに関して「選択的に結合する」とは、ガイドRNAが目的の標的配列に優先的に結合するか、または他のゲノム配列よりもその標的配列に対してより高い親和性で結合することを意味する。例えば、gRNAは、実質的に相補的な配列に結合し、無関係の配列には結合しない。特定の変異型対立遺伝子(例えば、置換、挿入、または欠失を含む対立遺伝子)などの特定の対立遺伝子に「選択的に結合する」gRNAは、特定の標的対立遺伝子に優先的に結合するが、野生型対立遺伝子または他の配列にはより低い程度で結合する。特定の標的DNA配列に選択的に結合するgRNAは、RNA誘導ヌクレアーゼ(例えば、Cas9)の結合を、無関係の配列ではなく、標的部位の実質的に相補的な配列に選択的に誘導する。
【0062】
本明細書で使用される場合、「組換え標的部位」という用語は、標的部位で結合し、標的部位でDNAの特定の配列の組換えを触媒する部位特異的リコンビナーゼによって認識される、結合部位または配列特異的モチーフを含む核酸分子の領域を意味する。部位特異的リコンビナーゼは、そのような2つの標的部位間の組換えを触媒する。標的部位の相対的な配向が組換えの結果を決定する。例えば、組換え標的部位が別々のDNA分子上にある場合、転座が生じる。
【0063】
本明細書で使用される場合、「標識」および「検出可能な標識」という用語は、放射性同位体、蛍光剤、化学発光剤、発色団、酵素、酵素基質、酵素補因子、酵素阻害剤、半導体ナノ粒子、染料、金属イオン、金属ゾル、リガンド(例えば、ビオチン、ストレプトアビジン、またはハプテン)などが挙げられるがこれらに限定されない、検出が可能な分子を指す。「蛍光剤」という用語は、検出可能な範囲の蛍光を示すことができる物質またはその一部分を指す。本開示の実施で使用され得る標識の特定の例には、SYBRグリーン、SYBRゴールド、CAL Fluor染料、例えば、CAL Fluor Gold 540、CAL Fluor Orange 560、CAL Fluor Red 590、CAL Fluor Red 610、およびCAL Fluor Red 635、Quasar染料、例えば、Quasar 570、Quasar 670、およびQuasar 705、Alexa Fluor、例えば、Alexa Fluor 350、Alexa Fluor 488、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 594、Alexa Fluor 647、およびAlexa Fluor 784、シアニン染料、例えば、Cy3、Cy3.5、Cy5、Cy5.5、およびCy7、フルオレセイン、2’,4’,5’,7’-テトラクロロ-4-7-ジクロロフルオレセイン(TET)、カルボキシフルオレセイン(FAM)、6-カルボキシ-4’,5’-ジクロロ-2’,7’-ジメトキシフルオレセイン(JOE)、ヘキサクロロフルオレセイン(HEX)、ローダミン、カルボキシ-X-ローダミン(ROX)、テトラメチルローダミン(TAMRA)、FITC、ダンシル、ウンベリフェロン、ジメチルアクリジニウムエステル(DMAE)、Texasレッド、ルミノール、NADPH、ホースラディッシュペルオキシダーゼ(HRP)、およびα-β-ガラクトシダーゼが含まれるが、これらに限定されない。
【0064】
「相同性」は、2つのポリヌクレオチド部分または2つのポリペプチド部分の間の同一性パーセントを指す。2つの核酸配列または2つのポリペプチド配列は、配列が分子の定義された長さにわたって、少なくとも約50%の配列同一性、好ましくは少なくとも約75%の配列同一性、より好ましくは少なくとも約80%~85%の配列同一性、より好ましくは少なくとも約90%の配列同一性、および最も好ましくは少なくとも約95%~98%の配列同一性を示す場合、互いに「実質的に相同」である。本明細書で使用される場合、実質的に相同であるとは、特定の配列に対して完全な同一性を示す配列も指す。
【0065】
一般に、「同一性」は、それぞれ、2つのポリヌクレオチドまたはポリペプチド配列の正確なヌクレオチド対ヌクレオチドまたはアミノ酸対アミノ酸の対応を指す。同一性パーセントは、配列をアラインし、2つのアラインした配列間の正確な一致数を数え、短い方の配列の長さで割り、結果に100を掛けることによって、2つの分子間の配列情報を直接比較することによって決定され得る。ペプチド分析のためにSmith and Waterman Advances in Appl.Math.2:482 489,1981の局所相同性アルゴリズムを採用する、ALIGN,Dayhoff,M.O.in Atlas of Protein Sequence and Structure M.O.Dayhoff ed.,5 Suppl.3:353 358,National biomedical Research Foundation,Washington,DCなど、すぐに利用可能なコンピュータープログラムを使用して、分析を補助することができる。ヌクレオチド配列同一性を決定するためのプログラムは、Wisconsin Sequence Analysis Package,Version 8(Genetics Computer Group,Madison,WIから入手可能)、例えば、BESTFIT、FASTA、およびGAPプログラムで利用可能であり、これらもスミス-ウォーターマンアルゴリズムに依存する。これらのプログラムは、製造業者によって推奨され、上記のWisconsin Sequence Analysis Packageに記載されているデフォルトパラメータを用いて簡単に利用される。例えば、参照配列に対する特定のヌクレオチド配列の同一性パーセントは、デフォルトのスコアリングテーブルおよび6ヌクレオチド位置のギャップペナルティを用いた使用したスミス-ウォーターマンの相同性アルゴリズムを使用して決定され得る。
【0066】
本開示の文脈でパーセント同一性を確立する別の方法は、University of Edinburghに著作権があり、John F.CollinsおよびShane S.Sturrokによって開発され、IntelliCorp,Inc.(Mountain View,CA)によって流通しているプログラムのMPSRCHパッケージを使用することである。このパッケージ一式から、スミス-ウォーターマンアルゴリズムが用いられ得、デフォルトパラメータがスコアリングテーブルに使用される(例えば、ギャップオープンペナルティ12、ギャップ伸長ペナルティ1、ギャップ6)。生成されたデータから、「一致」値は、「配列同一性」を反映する。配列間の同一性または類似性パーセントを計算するための他の好適なプログラムは、当技術分野で一般に知られており、例えば、別のアライメントプログラムは、デフォルトパラメータと共に使用されるBLASTである。例えば、BLASTNおよびBLASTPは、次のデフォルトパラメータを使用して使用され得る。遺伝子コード=標;フィルタ=なし;鎖=両方;カットオフ=60;予測=10;マトリックス=BLOSUM62;記述=50配列;ソート=HIGH SCORE;データベース=非冗長、GenBank+EMBL+DDBJ+PDB+GenBank CDS翻訳+Swissタンパク質+Spupdate+PIR。これらのプログラムの詳細はすぐに利用可能である。
【0067】
あるいは、相同性は、相同領域間で安定した二本鎖を形成する条件下でのポリヌクレオチドのハイブリダイゼーション、その後に続く、一本鎖特異的ヌクレアーゼによる消化、および消化された断片のサイズ決定によって決定され得る。実質的に相同であるDNA配列は、その特定の系について定義されるように、例えば、ストリンジェントな条件下でのサザンハイブリダイゼーション実験において同定され得る。適切なハイブリダイゼーション条件を定義することは、当技術分野の技術の範囲内である。例えば、Sambrook et al.(上記);DNA Cloning(上記);Nucleic Acid Hybridization(上記)を参照されたい。
【0068】
「組換え」は、核酸分子を説明するために本明細書で使用される場合、その起源または操作により、それが自然界で関連するポリヌクレオチドの全部または一部分に関連していない、ゲノム、cDNA、ウイルス、半合成、または合成起源のポリヌクレオチドを意味する。「組換え」という用語は、タンパク質またはポリペプチドに関して使用される場合、組換えポリヌクレオチドの発現によって産生されるポリペプチドを意味する。一般に、以下でさらに説明されるように、目的の遺伝子はクローニングされ、次いで形質転換された生物において発現される。宿主生物は、外来遺伝子を発現して、発現条件下でタンパク質を産生する。
【0069】
「形質転換」という用語は、挿入に使用される方法に関係なく、宿主細胞への外因性ポリヌクレオチドの挿入を指す。例えば、直接の取り込み、形質導入、および接合またはf接合による細胞間融合が含まれる。外因性ポリヌクレオチドは、非統合ベクター、例えば、プラスミドとして維持され得るか、あるいは宿主ゲノムに統合され得る。
【0070】
「組換え宿主細胞」、「宿主細胞」、「細胞」、「細胞株」、「細胞培養物」、および単細胞実体として培養された微生物または高等真核細胞株を示す他のそのような用語は、組換えベクターまたは他の導入されたDNAのレシピエントとして使用され得るか、または使用されており、形質転換された元の細胞の元の子孫を含む、細胞を指す。特定の実施形態では、遺伝子修飾される細胞は、真核細胞または原核細胞である。実施形態では、細胞は、一倍体または二倍体酵母細胞であり得る酵母細胞である。実施形態では、細胞は、哺乳類細胞、細菌細胞、真菌細胞、または植物細胞である。実施形態では、細胞は、ヒト細胞である。
【0071】
「コード配列」または選択されたポリペプチドを「コードする」配列は、適切な調節配列(または「制御要素」)の制御下に置かれたときに、インビボでポリペプチドに転写(DNAの場合)および翻訳(mRNAの場合)される核酸分子である。コード配列の境界は、5’(アミノ)末端の開始コドンおよび3’(カルボキシ)末端の翻訳終止コドンによって決定され得る。コード配列には、ウイルス、原核または真核mRNA由来のcDNA、ウイルスまたは原核DNA由来のゲノムDNA配列、さらには合成DNA配列が含まれ得るが、これらに限定されない。転写終止配列は、コード配列の3’に位置し得る。
【0072】
典型的な「制御要素」には、転写プロモーター、転写エンハンサー要素、転写終止シグナル、ポリアデニル化配列(翻訳終止コドンの3’に位置する)、翻訳開始の最適化のための配列(コード配列の5’に位置する)、イントロン(RNAの任意の場所に位置する)、および翻訳終止配列が含まれるが、これらに限定されない。
【0073】
「作動可能に連結された」とは、そのように記載される構成成分がそれらの通常の機能を実行するように構成されている要素の配置を指す。したがって、コード配列に作動可能に連結された所与のプロモーターは、適切な酵素が存在する場合、コード配列の発現をもたらすことができる。プロモーターは、その発現を誘導するように機能する限り、コード配列と連続している必要はない。したがって、例えば、介在する未翻訳であるが転写された配列は、プロモーター配列とコード配列との間に存在することができ、プロモーター配列は依然として、コード配列に「作動可能に連結されている」と見なされ得る。
【0074】
「トランスフェクション」という用語は、細胞による外来DNAの取り込みを指すために使用される。外因性DNAが細胞膜内に導入されている場合、細胞は「トランスフェクト」されている。多くのトランスフェクション技術が、当技術分野で一般的に知られている。例えば、Graham et al.(1973)Virology,52:456,Sambrook et al.(2001)Molecular Cloning,a laboratory manual,3rd edition,Cold Spring Harbor Laboratories,New York、Davis et al.(1995)Basic Methods in Molecular Biology,2nd edition,McGraw-Hill、およびChu et al.(1981)Gene 13:197を参照されたい。そのような技術を使用して、1つ以上の外因性DNA部分を好適な宿主細胞に導入することができる。この用語は、遺伝物質の安定した取り込みおよび一時的な取り込みの両方を指し、ペプチドまたは抗体に連結したDNAの取り込みを含む。
【0075】
「ベクター」は、核酸配列を標的細胞に導入することができる(例えば、ウイルスベクター、非ウイルスベクター、微粒子担体、およびリポソーム)。典型的には、「ベクター構築物」、「発現ベクター」、および「遺伝子導入ベクター」は、目的の核酸の発現を誘導することができ、核酸配列を標的細胞に導入することができる任意の核酸構築物を意味する。したがって、この用語には、クローニングおよび発現ビヒクル、ならびにプラスミドおよびウイルスベクターが含まれる。
【0076】
「バリアント」、「類似体」、および「ムテイン」という用語は、部位特異的Cas9エンドヌクレアーゼ活性などの所望の活性を保持する参照分子の生物学的に活性な誘導体を指す。一般に、「バリアント」および「類似体」という用語は、修飾が生物学的活性を破壊せず、以下に定義されるように参照分子と「実質的に相同」である限り、天然分子と比較して、1つ以上のアミノ酸の付加、置換(一般に、本質的に保存的)、および/または欠失を有する、天然ポリペプチド配列および構造を有する化合物を指す。一般に、そのような類似体のアミノ酸配列は、2つの配列がアラインされている場合、参照配列に対して高度の配列相同性、例えば、50%を超える、一般に60%~70%を超える、さらにより具体的には80%~85%以上、例えば、少なくとも90%~95%以上のアミノ酸配列相同性を有する。多くの場合、類似体は、同じ数のアミノ酸を含むが、本明細書で説明されるように置換を含む。「ムテイン」という用語は、アミノおよび/またはイミノ分子のみを含む化合物を含むがこれに限定されない、1つ以上のアミノ酸様分子を有するポリペプチド、アミノ酸の1つ以上の類似体(例えば、非天然アミノなどを含む)を含有するポリペプチド、置換された連結を有するポリペプチド、ならびに当技術分野で既知の他の修飾、天然および非天然(例えば、合成)の両方、環化、分岐の分子などをさらに含む。この用語はまた、1つ以上のN置換グリシン残基(「ペプトイド」)、および他の合成アミノ酸またはペプチドを含む分子も含む。(例えば、ペプトイドの説明について、米国特許第5,831,005号、同第5,877,278号、および同第5,977,301号、Nguyen et al.,Chem.Biol.(2000)7:463-473、ならびにSimon et al.,Proc.Natl.Acad.Sci.USA(1992)89:9367-9371を参照されたい)。ポリペプチド類似体およびムテインを作製するための方法は、当技術分野で既知であり、以下でさらに説明される。
【0077】
上で説明したように、類似体は一般に、本質的に保存的である置換、すなわち、それらの側鎖において関連しているアミノ酸のファミリー内で起こる置換を含む。具体的には、アミノ酸は一般に、4つのファミリーに分けられる。(1)酸性-アスパラギン酸およびグルタミン酸、(2)塩基性-リジン、アルギニン、ヒスチジン、(3)非極性-アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン、ならびに(4)非荷電極性-グリシン、アスパラギン、グルタミン、システイン、セリントレオニン、およびチロシン。フェニルアラニン、トリプトファン、およびチロシンは、芳香族アミノ酸として分類される場合がある。例えば、イソロイシンまたはバリンによるロイシンの、グルタミン酸によるアスパラギン酸の、セリンによるトレオニンの単離された置き換え、または構造的に関連するアミノ酸によるアミノ酸の同様の保存的置き換えは、生物学的活性に対する主な影響を有しないことが、合理的に予測可能である。例えば、目的のポリペプチドは、分子の所望の機能が損なわれないままである限り、最大約5~10個の保存的もしくは非保存的アミノ酸置換、またはさらには最大約15~25個の保存的もしくは非保存的アミノ酸置換、または5~25の間の任意の整数を含み得る。当業者は、当技術分野で周知のHopp/WoodsおよびKyte-Doolittleプロットを参照することによって、変化に耐えることができる目的の分子の領域を容易に決定することができる。
【0078】
「遺伝子導入」または「遺伝子送達」は、目的のDNAまたはRNAを宿主細胞に確実に挿入するための方法または系を指す。そのような方法は、統合されていない導入DNAの一過性発現、染色体外複製、および導入レプリコン(例えば、エピソーム)の発現、または宿主細胞のゲノムDNAへの導入遺伝物質の統合をもたらし得る。遺伝子送達発現ベクターには、細菌プラスミドベクター、ウイルスベクター、非ウイルスベクター、アデノウイルス、レトロウイルス、アルファウイルス、ポックスウイルス、およびワクシニアウイルスに由来するベクターが含まれるが、これらに限定されない。
【0079】
「に由来する」という用語は、本明細書において、分子の元の供給源を同定するために使用されるが、例えば、化学合成または組換え手段によるものであり得る、分子が作製される方法を限定することを意味するものではない。
【0080】
指定された配列「に由来する」ポリヌクレオチドは、指定されたヌクレオチド配列の領域に対応する、すなわち、それに同一または相補的である、およそ少なくとも約6個のヌクレオチド、好ましくは少なくとも約8個のヌクレオチド、より好ましくは少なくとも約10~12個のヌクレオチド、さらにより好ましくは少なくとも約15~20個のヌクレオチドの連続配列を含む、ポリヌクレオチド配列を指す。誘導されたポリヌクレオチドは、必ずしも目的のヌクレオチド配列に物理的に由来するとは限らないが、ポリヌクレオチドが由来する領域内の塩基の配列によって提供される情報に基づく、化学合成、複製、逆転写、または転写を含むがこれらに限定されない任意の様式で生成され得る。したがって、これは、元のポリヌクレオチドのセンスまたはアンチセンス配向のいずれかを表し得る。
【0081】
本明細書に記載の実施例および実施形態は例示目的のみのためであり、それを考慮した様々な修正または変更が当業者に示唆され、本出願および添付の特許請求の範囲の趣旨および範囲内に含まれるべきである。本明細書で引用されるすべての刊行物、特許、および特許出願は、すべての目的のために参照によりそれらの全体が本明細書に組み込まれる。
【0082】
本開示を詳細に説明する前に、本開示は、特定の配合またはプロセスパラメータに限定されず、そのようなものは、当然のことながら、変化し得ることを理解されたい。本明細書で使用される用語は、本開示の特定の実施形態を説明することのみを目的としており、限定することを意図するものではないことも理解されたい。
【0083】
本明細書に記載されるものと類似または同等の多くの方法および材料が、本開示の実施で使用され得るが、好ましい材料および方法が本明細書に記載される。
【0084】
方法
遺伝子バリアント(設計もしくはランダム)または構築物(遺伝子もしくはそうでなければ任意のDNA)の組み合わせを細胞の集団に導入することための、およびバーコード遺伝子座と呼ばれる一般的な遺伝子座(染色体またはプラスミド)におけるバーコードのアレイを順次に構築することによって各バリアントの組み合わせを追跡するための方法が、本明細書に記載される。各バリアント、遺伝子構築物、または遺伝子修飾は、固有のバーコードによって表され、バーコードおよびその隣接するバーコードを配列決定することにより、配列決定ベースのカウントによって細胞集団内の各バリアント並べ替えの存在量を追跡することが可能になるようにする。
【0085】
一態様では、本開示は、複数の遺伝子操作された細胞を作製するための方法に関する。実施形態では、方法は、(a)複数の細胞を、第1の遺伝子編集剤および第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を含む、形成することと、(b)第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤および第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を含む、形成することとを含み、それによって複数の遺伝子操作された細胞を産生する。実施形態では、方法は、ステップ(b)を1回以上繰り返すことを含み、ステップ(b)の各繰り返しは、同じまたは異なる複数の組換えポリヌクレオチドを用い、各組換えポリヌクレオチドは、固有のポリヌクレオチドバーコード配列を含む。
【0086】
一態様では、(a)複数の細胞を、第1の遺伝子編集剤と接触させ、それによって各々が第1の固有の遺伝子修飾を含む第1の複数の遺伝子編集された細胞を産生すること、(b)第1の複数の遺伝子編集された細胞に、第1の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第1の固有のポリヌクレオチドバーコード配列を含み、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を含む、形成することによって、複数の遺伝子操作された細胞を産生するための方法が提供される。このようにして、細胞は、未知の(例えば、ランダムな)変異または他の変化によって遺伝子修飾され得、バーコードは、細胞内で変異/変化が行われた後、その変化に関連付けられ得る。実施形態では、方法は、(c)前述の第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤と接触させ、それによって各々が第2の固有の遺伝子修飾を有する第2の複数の遺伝子編集された細胞を産生することと、(d)第2の複数の遺伝子編集された細胞に、第2の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第2の固有のポリヌクレオチドバーコード配列を含み、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、第2の固有のポリヌクレオチドバーコードが、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座に挿入されるようにし、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を含む、形成することとを含み、それによって複数の遺伝子操作された細胞を産生する。実施形態では、方法は、ステップ(c)および(d)を1回以上繰り返すことを含み、ステップ(c)および(d)の各繰り返しは、同じまたは異なる複数の組換えポリヌクレオチドを用い、各組換えポリヌクレオチドは、固有のポリヌクレオチドバーコード配列を含む。
【0087】
一実施形態では、複数の遺伝子操作された細胞は、(a)複数の細胞を、第1の遺伝子編集剤および第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、それによって第1の複数の遺伝子編集およびバーコード化された細胞を形成することであって、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第1の固有のポリヌクレオチドバーコード、および第1の固有の遺伝子修飾を含む、形成すること、ならびに(b)前述の第1の複数の遺伝子編集およびバーコード化された細胞を、第2の遺伝子編集剤と接触させ、それによって各々が第2の固有の遺伝子修飾を含む第2の複数の遺伝子編集された細胞を産生すること、ならびに(c)第2の複数の遺伝子編集された細胞に、第2の複数の組換えポリヌクレオチドをトランスフェクトし、各組換えポリヌクレオチドが、第2の固有のポリヌクレオチドバーコード配列を含み、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することであって、第2の固有のポリヌクレオチドバーコードが、前述の第2の複数の遺伝子編集およびバーコード化された細胞のバーコード遺伝子座に挿入されるようにし、各遺伝子編集およびバーコード化された細胞が、バーコード遺伝子座に挿入された第2の固有のポリヌクレオチドバーコード、および第2の固有の遺伝子修飾を含む、形成することの任意の組み合わせによって作製され得る。ステップ(a)および(b)/(c)は、任意の順序で実行され得る。実施形態では、ステップ(a)および/または(b)/(c)は、1回以上繰り返されて、複数の細胞をさらに遺伝子修飾する。
【0088】
複数の細胞は、すべて同じ細胞(例えば、同じ細胞の属/種、および/もしくは各細胞内で同じ遺伝子配列を有する)で構成され得るか、または異なる細胞であり得る(例えば、少なくともいくつかの細胞は、複数の細胞内の別の細胞(複数可)と比較して、ゲノム配列の少なくとも1つの塩基対の変化を有する)。本明細書で使用される場合、「ゲノム配列」または「ゲノム」という用語は、染色体、プラスミド、またはミトコンドリアDNAを含むがこれらに限定されない、少なくとも1つの遺伝子をコードする細胞内の任意のDNAであり得る。
【0089】
「固有のポリヌクレオチドバーコード配列」または「固有のポリヌクレオチドバーコード」という用語は、複数の細胞内の細胞の多くまたはすべてが、その中に異なるポリヌクレオチドバーコード配列を有することを示す。実施形態では、複数の組換えポリヌクレオチドは、ポリヌクレオチドのライブラリであり、各ポリヌクレオチドは、異なるバーコード配列を含む。当業者に理解されるように、ポリヌクレオチドライブラリは、所与の組換えポリヌクレオチドの複数のコピーを含み得るが、複数の組換えポリヌクレオチド内には、各々が異なる配列を有する組換えポリヌクレオチドの集団が存在する。実施形態では、各組換えポリヌクレオチドはまた、遺伝子修飾を含有する(および/または細胞内で遺伝子修飾を生じさせるために使用され得る)配列(例えば、ドナーDNA配列)も含む。そのような実施形態では、バーコードおよび遺伝子修飾は、(例えば、データベースにおいて)関連付けられ、その結果、どのバーコードがバーコード遺伝子座に存在するかを、(例えば、配列決定によって)決定することによって、細胞が遺伝子修飾を有するものと同定され得る。同様に、「固有の遺伝子修飾」は、複数の細胞内の細胞の多くまたはすべてが、その中に異なる遺伝子修飾を有することを示す。
【0090】
実施形態では、第1の固有のポリヌクレオチドバーコードは、前述の第1の複数の遺伝子編集およびバーコード化された細胞の各々における第1の固有の遺伝子修飾に関連する。この文脈における「関連する」とは、バーコードの知識(例えば、細胞が特定のバーコードを含有すること)が、その細胞が対応する遺伝子修飾を含有することを示すような、バーコードによる遺伝子修飾の対応を指す。実施形態では、前述の第1の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分は、第1の固有のポリヌクレオチドバーコードが、データベース内の第1の固有の遺伝子修飾に関連するように配列決定される。実施形態では、第2の固有のポリヌクレオチドバーコードは、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々における第2の固有の遺伝子修飾に関連する。実施形態では、前述の第2の複数の遺伝子編集およびバーコード化された細胞の各々のバーコード遺伝子座およびゲノムの少なくとも一部分は、第2の固有のポリヌクレオチドバーコードが、データベース内の第2の固有の遺伝子修飾に関連するように配列決定される。例えば、バーコード遺伝子座、および遺伝子修飾を含有するゲノムの少なくとも一部分は、特定の固有のバーコードを含有する細胞内にどの遺伝子修飾が存在するかを同定するために細胞内で配列決定され、その情報は、バーコードが遺伝子修飾に関連しているようなデータベースに入力される。これにより、将来的にバーコード遺伝子座のみを配列決定することによって、細胞が遺伝子修飾を有するものと同定されることが可能になる。
【0091】
いくつかの実施形態では、バーコードは、複数の細胞を、複数の組換えポリヌクレオチドと接触させる前に、(例えば、データベース内の)遺伝子修飾に関連付けられる。つまり、各組換えポリヌクレオチドは、固有のバーコードおよび固有の遺伝子修飾の両方(例えば、標的細胞内に修飾を含むおよび/または修飾を引き起こすドナーDNAまたは他の配列)を含有し得、固有のバーコードおよび固有の遺伝子修飾は、複数の細胞を組換えポリヌクレオチドと接触させる前に関連付けられる(例えば、組換えポリヌクレオチドの配列決定によって)。
【0092】
実施形態では、方法は、バーコード遺伝子座を配列決定することによって、複数の遺伝子操作された細胞の各々における遺伝子変異を同定することを含む。各細胞(または各細胞のクローンコロニー)内のバーコード遺伝子座の配列決定は、各細胞内に存在するバーコード配列を決定する。これを使用して、データベースをクエリし、そのバーコードに関連付けられている遺伝子修飾を決定することができる。複数のバーコードが存在する場合、データベースは、各バーコード配列についてクエリされ、これにより、単一細胞内の複数の遺伝子修飾の決定が可能になる。さらに、バーコードが存在する順序は、修飾が行われた順序を示す。
【0093】
一態様では、複数のバーコード化された細胞を産生するための方法が提供される。実施形態では、方法は、(a)複数の細胞を、第1の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、第1の固有のポリヌクレオチドバーコードが、前述の第1の複数の細胞の各々のバーコード遺伝子座に挿入されるようにし、それによって第1の複数のバーコード化された細胞を形成することを含む。実施形態では、(b)第1の複数のバーコード化された細胞を、第2の複数の組換えポリヌクレオチドと接触させ、各組換えポリヌクレオチドが、固有のポリヌクレオチドバーコード配列を含み、第2の固有のポリヌクレオチドバーコードが、前述の第1の複数の遺伝子編集およびバーコード化された複数の細胞の各々のバーコード遺伝子座に挿入されるようにし、それによって第2の複数の遺伝子編集およびバーコード化された細胞を形成することをさらに含む。そのような細胞内のバーコードは、データベース内の任意の関連情報にリンク/関連付けられ得、バーコード遺伝子座の配列決定およびデータベースのクエリが、各細胞に関する情報を提供するようにする。例えば、バーコードは、遺伝子変異、欠失、挿入、置換、転座、エピジェネティック修飾、導入遺伝子の付加、調節配列の修飾、DNA集合、人工染色体、CRISPR干渉のための機能的ガイドRNA配列構築物、または任意の他の情報に関連付けられ得る。
【0094】
一態様では、ポリヌクレオチド情報を細胞内の単一バーコードに圧縮するための方法が提供される。実施形態では、方法は、バーコード遺伝子座内に少なくとも2つの固有のポリヌクレオチドバーコードを含む細胞を得ることと、細胞のバーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することと、新しい固有のポリヌクレオチドバーコード(コンプレッサーバーコード)が、少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、バーコード遺伝子座を配列決定することとを含む。実施形態では、方法は、細胞のバーコード遺伝子座から、少なくとも2つの以前の固有のポリヌクレオチドバーコードを除去することをさらに含む。このプロセスは、「バーコード圧縮」と称され得る。
【0095】
一態様では、本明細書に記載される方法によって作製された、複数の遺伝子編集およびバーコード化された細胞が提供される。
【0096】
一態様では、本明細書に記載される方法によって作製された、遺伝子編集およびバーコード化された細胞が提供される。
【0097】
実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードに隣接して付加される。実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの上流に付加される。実施形態では、各固有のポリヌクレオチドバーコードは、バーコード遺伝子座内の以前の固有のポリヌクレオチドバーコードの下流に付加される。
【0098】
実施形態では、各固有のポリヌクレオチドバーコードには、組換えポリヌクレオチド上で、右相同性アームおよび/または左相同性アームが隣接している。実施形態では、各第1の固有のポリヌクレオチドバーコードには、第1の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、第1の右相同性アーム、第2の右相同性アーム、および左相同性アームが隣接し、第1の右相同性アームおよび左相同性アームが、バーコード遺伝子座の配列と相同であるようにする。第2の右相同性アームは、第1の右相同性アームと左相同性アームとの間に位置し、バーコード遺伝子座で第1の固有のポリヌクレオチドバーコードと統合するようにする。実施形態では、各第2の固有のポリヌクレオチドバーコードには、第2の複数のポリヌクレオチドの各組換えポリヌクレオチド上で、第2の右相同性アーム、左相同性アーム、および任意に第3の右相同性アームが隣接し、第2の右相同性アームおよび左相同性アームが、バーコード遺伝子座への第1の固有のポリヌクレオチドバーコードの統合後のバーコード遺伝子座の配列と相同であるようにする。
【0099】
実施形態では、第1の複数のポリヌクレオチドの各組換えポリヌクレオチドは、左相同性アームと第2の右相同性アームとの間に第1のマーカーポリヌクレオチドを含む。実施形態では、第2の複数のポリヌクレオチドの各組換えポリヌクレオチドは、左相同性アームと第3の右相同性アームとの間に第2のマーカーポリヌクレオチドを含む。実施形態では、マーカーポリヌクレオチドは、固有のポリヌクレオチドバーコードと共にバーコード遺伝子座に組み込まれる。実施形態では、各組換えポリヌクレオチドは、マーカーポリヌクレオチドをさらに含む。実施形態では、マーカーポリヌクレオチドは、固有のポリヌクレオチドバーコードと共にバーコード遺伝子座に組み込まれる。実施形態では、方法は、マーカーポリヌクレオチドの存在に関して、細胞を選択することを含む。実施形態では、方法は、マーカーポリヌクレオチドの非存在に関して、細胞を選択することを含む。実施形態では、第1の複数の組換えポリヌクレオチド中のマーカーポリヌクレオチドは、第2の複数の組換えポリヌクレオチド中のマーカーポリヌクレオチドとは異なる。
【0100】
ポリヌクレオチド(および任意選択で、任意の関連配列、例えば、マーカー配列、相同性アームなど)は、任意の手段によってバーコード遺伝子座に挿入され得る。実施形態では、各固有のポリヌクレオチドバーコードは、相同組換えによってバーコード遺伝子座に挿入される。実施形態では、各固有のポリヌクレオチドバーコードは、非相同末端結合によってバーコード遺伝子座に挿入される。実施形態では、各固有のポリヌクレオチドバーコードは、インテグラーゼを使用してバーコード遺伝子座に挿入される。実施形態では、各固有のポリヌクレオチドバーコードは、トランスポザーゼを使用してバーコード遺伝子座に挿入される。
【0101】
実施形態では、第1の遺伝子編集剤は、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、RNA誘導ヌクレアーゼ、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである。実施形態では、第2の遺伝子編集剤は、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである。実施形態では、第1および/または第2の遺伝子編集剤は、RNA誘導ヌクレアーゼである。実施形態では、第1の遺伝子編集剤は、CRISPR系である。実施形態では、第1の遺伝子編集剤は、CRISPR/Cas9系である。実施形態では、第1の遺伝子編集剤は、CRISPR/Cas12a系である。実施形態では、第2の遺伝子編集剤は、CRISPR系である。実施形態では、第2の遺伝子編集剤は、CRISPR/Cas9系である。実施形態では、第2の遺伝子編集剤は、CRISPR/Cas12a系である。
【0102】
実施形態では、第1の遺伝子編集剤および第2の遺伝子編集剤は同じである。実施形態では、第1の遺伝子編集剤および第2の遺伝子編集剤は異なる。
【0103】
実施形態では、方法は、第1の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することを含む。実施形態では、方法は、第2の複数の遺伝子編集およびバーコード化された細胞からの細胞の染色体の少なくとも一部分を配列決定することを含む。実施形態では、バーコード遺伝子座は、配列決定される。実施形態では、少なくとも1つの遺伝子修飾は、配列決定によって決定される。
【0104】
実施形態では、方法は、固有のポリヌクレオチドバーコードを用いて少なくとも1つの遺伝子修飾を同定することを含む。
【0105】
実施形態では、方法は、(i)各細胞のバーコード遺伝子座に新しい固有のポリヌクレオチドバーコードを挿入することを含み、バーコード遺伝子座は、新しい固有のポリヌクレオチドバーコードを挿入する前に、少なくとも2つの固有のポリヌクレオチドバーコードを含む。実施形態では、方法は、(ii)新しい固有のポリヌクレオチドバーコードが少なくとも2つの固有のポリヌクレオチドバーコードに関連するように、バーコード遺伝子座を配列決定することを含む。実施形態では、方法は、(iii)各細胞のバーコード遺伝子座から、少なくとも2つの固有のポリヌクレオチドバーコードを除去することを含む。実施形態では、方法は、遺伝子修飾/バーコード化ステップ(例えば、ステップ(a)、(b)、(c)、および/または(d))を繰り返し、それによって複数の遺伝子操作された細胞を産生することを含む。
【0106】
実施形態では、各組換えポリヌクレオチドは、ベクターによって提供される。実施形態では、ベクターは、プラスミドベクターまたはウイルスベクターである。実施形態では、ベクターは、高コピー数ベクターである。特定の実施形態では、各組換えポリヌクレオチドは、直鎖状DNAとして提供される。特定の実施形態では、直鎖状またはベクターDNA上の各組換えポリヌクレオチドは、RNAポリメラーゼプロモーターに作動可能に連結されて、宿主細胞内の転写を可能にし、かつRNA配列要素と作動可能に連結されて、組換えRNAの逆転写を可能にして、一本鎖ドナーDNAを生成する。一本鎖DNAを生成する方法は当業者に既知であり、細菌レトロン系(例えば、Ec86レトロン)、またはウイルス逆転写酵素(例えば、モロニーマウス白血病ウイルス逆転写酵素)の使用を含む。例えば、方法は、PCR産物として提供されるゲノム編集カセットを含む組換えポリヌクレオチドを増幅することをさらに含み得る。
【0107】
実施形態では、バーコード遺伝子座は、染色体バーコード遺伝子座である。
【0108】
実施形態では、遺伝子修飾は、設計された遺伝子修飾である。
【0109】
重要なことに、本明細書に記載されるバーコードは、CRISPRゲノム編集構築物との関連に制限されないが、既知または未知の遺伝子変化をもたらす任意の遺伝子修飾プロセス、またはDNA内の任意のデジタル情報の保存および圧縮により幅広い用途を有する。そのような用途の非限定的な例には、ゲノム修飾、遺伝子構築物、エピジェネティック修飾、および系統追跡が含まれる(
図1A)。
【0110】
遺伝子編集剤は、当技術分野で既知である。遺伝子編集剤は、誘導された(設計された)遺伝子修飾を引き起こす薬剤、または自発的な(ランダムな)遺伝子変異を引き起こす物理的および化学的薬剤(例えば、変異原)であり得る。実施形態では、遺伝子編集剤は、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、RNA誘導ヌクレアーゼ、熱、放射線、化学薬品、リコンビナーゼ、インテグラーゼ、またはトランスポザーゼである。
【0111】
実施形態では、遺伝子編集剤は、RNA誘導ヌクレアーゼである。実施形態では、RNA誘導ヌクレアーゼは、CRISPR系である。実施形態では、RNA誘導ヌクレアーゼは、CRISPR/Cas系である。実施形態では、RNA誘導ヌクレアーゼは、CRISPR/Cas9系である。実施形態では、RNA誘導ヌクレアーゼは、CRISPR/Cas12a系である。実施形態では、CRISPR系は、SpCas9、SaCas9、NmCas9、St1Cas9、FnCas9、Cas12a(例えば、FnCpf1、AsCpf1、LbCpf1)、Mad7、CasX、CasY、Cas13a、C2c1、C2c2、C2c3、LshC2c2、Cas14、dSpCas9-FokI、スプリット-SpCas9、SpCas9-ニッカーゼを含むがこれらに限定されない、任意のそのような系であり得る。さらなるCRISPR系は、例えば、Komor et ah,Nature(2016)533(7603):420-4に記載されるように既知であり、これは、参照によりその全体が本明細書に組み込まれる。
【0112】
実施形態では、バーコード遺伝子座でのバーコードの統合は、部位特異的リコンビナーゼ系を使用して実行される。この目的のために使用され得る例示的な部位特異的リコンビナーゼ系には、Cre-loxP部位特異的リコンビナーゼ系、Flp-FRT部位特異的リコンビナーゼ系、PhiC31-att部位特異的リコンビナーゼ系、およびDre-rox部位特異的リコンビナーゼ系が含まれる。使用され得るこれらおよび他の部位特異的リコンビナーゼ系の説明については、例えば、Wirth et al.(2007)Curr.Opin.Biotechnol.18(5):411-419、Branda et al.(2004)Dev.Cell 6(1):7-28、Birling et al.(2009)Methods Mol.Biol.561:245-263、Bucholtz et al.(2008)J.Vis.Exp.May 29(15)pii:718、Nem et al.(2011)Proc.Natl.Acad.Sci.U.S.A.108(34):14198-14203、Smith et al.(2010)Biochem.Soc.Trans.38(2):388-394、Turan et al.(2011)FASEB J.25(12):4088-4107、Garcia-Otin et al.(2006)Front.Biosci.11:1108-1136、Gaj et al.(2014)Biotechnol Bioeng.111(1):1-15、Krappmann(2014)Appl.Microbiol.Biotechnol.98(5):1971-1982、Kolb et al.(2002)Cloning Stem Cells 4(1):65-80、およびLopatniuk et al.(2015)J.Appl.Genet.56(4):547-550を参照されたく、参照によりそれらの全体が本明細書に組み込まれる。
【0113】
部位特異的組換えによる統合を可能にするために、部位特異的リコンビナーゼの組換え標的部位がバーコード遺伝子座に付加され得る。さらに、組換えポリヌクレオチドは、組換えポリヌクレオチド上の組換え標的部位とバーコード遺伝子座における組換え標的部位との間の部位特異的組換えが、バーコード遺伝子座でのゲノム編集カセットの統合をもたらすように、部位特異的リコンビナーゼの適合する組換え標的部位を有して設計され得る。
【0114】
特定の実施形態では、方法は、非相同末端結合(NHEJ)を阻害することをさらに含む。例えば、NHEJは、細胞を、ウォルトマンニンおよびScr7からなる群から選択される小分子阻害剤と接触させることによって阻害され得る。あるいは、RNA干渉またはCRISPR干渉を使用して、NHEJ経路のタンパク質構成成分の発現を阻害することができる。
【0115】
他の実施形態では、方法は、HDRエンハンサーまたは能動的ドナー動員を使用して、細胞内のHDRの頻度を増加させることをさらに含む。特定の実施形態では、非相同末端結合(NHEJ)経路の阻害剤を使用して、HDRによって遺伝子修飾された細胞の頻度をさらに増加させる。NHEJ経路の阻害剤の例には、NHEJ経路における任意のタンパク質構成成分の発現または活性のいずれかを阻害または遮断する任意の化合物(薬剤)が含まれる。NHEJ経路のタンパク質構成成分には、Ku70、Ku86、DNAプロテインキナーゼ(DNA-PK)、Rad50、MRE11、NBS1、DNAリガーゼIV、およびXRCC4が含まれまるが、これらに限定されない。例示的な阻害剤は、NHEJ経路の少なくとも1つのタンパク質構成成分(例えば、DNA-PK)を阻害するウォルトマンニンである。別の例示的な阻害剤は、DSBの結合を阻害するScr7(5,6-ビス((E)-ベンジリデンアミノ)-2-メルカプトピリミジン-4-オール)である(Maruyama et al.(2015)Nat.Biotechnol.33(5):538-542、Lin et al.(2016)Sci.Rep.6:34531)。RNA干渉またはCRISPR干渉はまた、NHEJ経路のタンパク質構成成分(例えば、DNA-PKまたはDNAリガーゼIV)の発現を遮断するためにも使用され得る。例えば、低分子干渉RNA(siRNA)、ヘアピンRNA、およびインビボで切断または解離されてsiRNAを形成することができる他のRNAまたはRNA:DNA種を使用して、RNA干渉によってNHEJ経路を阻害し得る。あるいは、NHEJ経路の遺伝子のプロモーターまたはエクソン配列に相補的な単一ガイドRNA(sgRNA)と共に、非活性化Cas9(dCas9)を、CRISPR干渉による転写抑制に使用することができる。あるいは、RS-1などのHDRエンハンサーを使用して、細胞内のHDRの頻度を増加させ得る(Song et al.(2016)Nat.Commun.7:10548)。
【0116】
ゲノム編集は、目的の単一細胞または細胞集団に対して実行され得、細菌、古細菌、真菌、原生生物、植物、および動物を含む、原核生物、真核生物、または古細菌生物に由来する任意の細胞を含む、任意のタイプの細胞に対して実行され得る。組織、臓器、および生検からの細胞、ならびに組換え細胞、遺伝子修飾された細胞、インビトロで培養された細胞株由来の細胞、および人工細胞(例えば、ナノ粒子、リポソーム、ポリマーソーム、または核酸を封入するマイクロカプセル)はすべて、本明細書に記載される方法および組成物の実施で使用され得る。本明細書に記載される方法は、核酸を含む細胞断片、細胞構成成分、または細胞小器官(例えば、動物および植物細胞内のミトコンドリア、植物細胞および藻類の色素体(例えば、葉緑体))中の核酸の編集にも適用可能である。細胞は、本明細書に記載されるようにゲノム編集を実行する前または後に、培養または増殖され得る。一実施形態では、細胞は、酵母細胞である。
【0117】
RNA誘導ヌクレアーゼ系
実施形態では、各組換えポリヌクレオチドは、RNA誘導ヌクレアーゼをコードする第3のポリヌクレオチドをさらに含む。実施形態では、各組換えポリヌクレオチドは、ドナーポリヌクレオチドをさらに含む。実施形態では、RNA誘導ヌクレアーゼは、ベクターによって提供される。実施形態では、RNA誘導ヌクレアーゼは、細胞のゲノムに統合された第2の核酸配列によって提供される。実施形態では、RNA誘導ヌクレアーゼは、Casヌクレアーゼまたは操作されたRNA誘導FokIヌクレアーゼである。実施形態では、Casヌクレアーゼは、Cas9またはCas12aである。実施形態では、RNA誘導ヌクレアーゼは、固有のバーコード配列と同じ組換えポリヌクレオチド上に提供される。実施形態では、ドナーポリヌクレオチド(例えば、ドナーDNA)および/またはガイドRNA(gRNA)をコードするポリヌクレオチドは、各細胞に組み込まれる。実施形態では、gRNAは、修飾されるゲノム標的遺伝子座でハイブリダイズすることができる。実施形態では、ドナーポリヌクレオチドは、5’ゲノム標的配列にハイブリダイズする5’相同性アームと、ゲノム標的遺伝子座に統合される意図した編集を含むヌクレオチド配列に隣接する3’ゲノム標的配列にハイブリダイズする3’相同性アームとを含む。実施形態では、各組換えポリヌクレオチドは、複数の組換えポリヌクレオチドが1つ以上のゲノム標的遺伝子座で複数の異なる意図した編集をもたらすことができるように、異なるガイドRNA-ドナーポリヌクレオチドの組み合わせを含む異なるゲノム編集カセットを含む。実施形態では、RNA誘導ヌクレアーゼは、1つ以上のゲノム標的遺伝子座で細胞のゲノムDNAに二本鎖切断を生じさせ、各細胞内に存在するドナーポリヌクレオチドは、複数の遺伝子修飾された細胞が産生されるような相同組換え修復(HDR)によって、その5’相同性および3’相同性アームによって認識されるゲノム標的遺伝子座で統合される。
【0118】
実施形態では、各組換えポリヌクレオチドは、ベクターによって提供される。実施形態では、ベクターは、プラスミドベクターまたはウイルスベクターである。実施形態では、ベクターは、高コピー数ベクターである。特定の実施形態では、各組換えポリヌクレオチドは、直鎖状DNAとして提供される。例えば、方法は、PCR産物として提供されるゲノム編集カセットを含む組換えポリヌクレオチドを増幅することをさらに含み得る。
【0119】
特定の実施形態では、RNA誘導ヌクレアーゼはまた、ベクターによって提供される。特定の実施形態では、ゲノム編集カセットおよびRNA誘導ヌクレアーゼは、単一ベクターまたは別個のベクターによって提供される。別の実施形態では、RNA誘導ヌクレアーゼをコードする組換えポリヌクレオチドは、宿主細胞のゲノムに統合される。
【0120】
ガイドRNAの転写は、一般に、ゲノム編集カセット、ベクター、またはゲノム編集カセットが挿入されているゲノム遺伝子座(例えば、バーコード遺伝子座)に含まれ得るプロモーターの存在に依存する。プロモーターは、構成的または誘導性プロモーターであり得る。特定の実施形態では、各ゲノム編集カセットは、ガイドRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターを含む。他の実施形態では、バーコード遺伝子座は、バーコード遺伝子座で統合する任意のゲノム編集カセットのガイドRNAをコードする、ポリヌクレオチドに作動可能に連結されるようになるプロモーターを含む。別の実施形態では、各組換えポリヌクレオチドは、ベクターによって提供され、ベクターは、ガイドRNAをコードするポリヌクレオチドに作動可能に連結されたプロモーターを含む。特定の実施形態では、ガイドRNAおよび/またはドナーDNAカセットは、組換えポリヌクレオチドバーコードと共にバーコード遺伝子座に統合される。他の実施形態では、ポリヌクレオチドバーコードのみがバーコード遺伝子座に統合する。
【0121】
特定の実施形態では、遺伝子編集剤(任意に、ドナーポリヌクレオチドおよび/またはガイドRNAと組み合わせて)は、単一遺伝子内の複数の部位で変異をもたらすことができる。他の実施形態では、遺伝子編集剤は、異なる遺伝子内の複数の部位またはゲノム内の任意の場所で変異をもたらすことができる。例えば、遺伝子編集剤(例えば、ドナーポリヌクレオチド)は、挿入、欠失、または置換などの異なる変異を遺伝子に導入し得る。別の実施形態では、少なくとも1つの遺伝子編集剤(例えば、ドナーポリヌクレオチド)は、遺伝子を不活性化する変異を導入する。別の実施形態では、少なくとも1つの遺伝子編集剤(例えば、ドナーポリヌクレオチド)は、遺伝子から変異を除去する。別の実施形態では、少なくとも1つの遺伝子編集剤(例えば、ドナーポリヌクレオチド)は、正確な遺伝的変化をゲノムDNAに挿入する。
【0122】
特定の実施形態では、各組換えポリヌクレオチドは、ゲノム編集カセットに隣接する一対の制限部位をさらに含む。いくつかの実施形態では、制限部位は、DNA二本鎖切断をもたらすメガヌクレアーゼ(例えば、SceI)によって認識される。メガヌクレアーゼの発現は、誘導性プロモーターによって制御され得る。
【0123】
別の実施形態では、ゲノム編集カセットは、ガイドRNAをコードするヌクレオチド配列の5’末端に、tRNA遺伝子をさらに含む。
【0124】
別の実施形態では、ゲノム編集カセットは、ガイドRNAをコードするヌクレオチド配列の5’末端に、デルタ型肝炎ウイルス(HDV)リボザイムをコードするヌクレオチド配列をさらに含む。別の実施形態では、ゲノム編集カセットは、RNAポリメラーゼIIまたはRNAポリメラーゼIIIのプロモーターに隣接するガイドRNAをコードするヌクレオチド配列の5’末端に、ハンマーヘッドリボザイム(HHR)をコードするヌクレオチド配列をさらに含む。別の実施形態では、ゲノム編集カセットは、リボザイム、例えば、CPEB3、PMAR1、またはRiboJをコードするヌクレオチド配列をさらに含む。
【0125】
別の実施形態では、RNA誘導ヌクレアーゼは、Casヌクレアーゼ(例えば、Cas9もしくはCas12a)、または操作されたRNA誘導FokIヌクレアーゼである。
【0126】
別の実施形態では、ゲノム編集カセットには、メガヌクレアーゼによって認識される制限部位が隣接している。
【0127】
実施形態では、各ゲノム編集カセットは、各ゲノム編集カセットによってコードされるガイドRNAおよびドナーポリヌクレオチドを同定するための、固有のバーコード配列をさらに含む。一実施形態では、方法は、バーコード遺伝子座で統合されたガイドRNAおよびドナーポリヌクレオチドをコードするポリヌクレオチドを欠失させる一方で、欠失した配列を表す前述のバーコード遺伝子座に固有のバーコードを保持することをさらに含む。別の実施形態では、方法は、少なくとも1つの遺伝子修飾された細胞のバーコード遺伝子座でバーコードを配列決定して、前述の細胞を遺伝子修飾する際に使用されるゲノム編集カセットを同定することをさらに含む。
【0128】
特定の実施形態では、方法は、各ゲノム編集カセットを配列決定することをさらに含む。バーコードを特定のgRNA-ドナーポリヌクレオチドの組み合わせに連結するためのゲノム編集カセットの配列決定は、例えば、ゲノム編集カセットをベクターにライゲーションする前、または細胞をトランスフェクトする前の中間クローニングステップで実行され得る。あるいはまたは加えて、バーコード遺伝子座で統合されているゲノム編集カセットの配列決定を使用して、遺伝子修飾された細胞に対して実行されるゲノム編集を決定し得る。
【0129】
RNA誘導ヌクレアーゼは、そのガイドRNA配列を改変することによって、特定のゲノム配列(すなわち、修飾されるゲノム標的配列)に標的化され得る。標的特異的ガイドRNAは、ゲノム標的配列に相補的であるヌクレオチド配列を含み、それによって標的部位でのハイブリダイゼーションによるヌクレアーゼ-gRNA複合体の結合を媒介する。例えば、gRNAは、ヌクレアーゼ-gRNA複合体を変異部位に標的化するために、マイナー対立遺伝子の配列に相補的な配列を有して設計され得る。変異は、挿入、欠失、または置換を含み得る。例えば、変異は、一塩基多様性、遺伝子融合、転座、逆位、重複、フレームシフト、ミスセンス、ナンセンス、または目的の表現型または疾患に関連する他の変異を含み得る。標的化マイナー対立遺伝子は、一般的な遺伝子バリアントまたはまれな遺伝子バリアントであり得る。特定の実施形態では、gRNAは、例えば、ヌクレアーゼ-gRNA複合体の一塩基多型(SNP)への結合を可能にするために、単一の塩基対識別でマイナー対立遺伝子に選択的に結合するように設計されている。特に、gRNAは、遺伝子から変異を除去するためのゲノム編集のために、目的の疾患関連の変異を標的化するように設計され得る。あるいは、gRNAは、欠失、または置換など、細胞のゲノムDNA内の遺伝子に変異を導入するゲノム編集の目的で、ヌクレアーゼ-gRNA複合体を対立遺伝子に標的化するために、メジャーまたは野生型対立遺伝子の配列に相補的な配列を有して設計され得る。そのような遺伝子修飾された細胞は、例えば、表現型を改変する、新しい特性を付与する、または薬物スクリーニングのための疾患モデルを作るために使用され得る。
【0130】
特定の実施形態では、ゲノム修飾に使用されるRNA誘導ヌクレアーゼは、クラスター化され規則的に間隔が空いた短い回文構造の繰り返し(CRISPR)系Casヌクレアーゼである。CRISPR系タイプI、タイプII、またはタイプIIIのCasヌクレアーゼを含む、HDR機構によるドナーポリヌクレオチドの統合を可能にするための、DNAの部位特異的切断を触媒することができる任意のRNA誘導Casヌクレアーゼが、ゲノム編集で使用され得る。Casタンパク質の例には、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1またはCsxl2)、Cas10、Cas10d、Cas12a、Mad7、CasX、CasY、Cas13a、Cas14、C2c1、C2c2、C2c3、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、およびCu1966、ならびにそれらの相同体または修飾型が含まれる。
【0131】
特定の実施形態では、タイプII CRISPR系Cas9エンドヌクレアーゼが使用される。任意の種由来のCas9ヌクレアーゼ、またはCas9エンドヌクレアーゼ活性を保持する(すなわち、DNAの部位特異的切断を触媒して二本鎖切断をもたらす)その生物学的に活性な断片、バリアント、類似体、もしくは誘導体を使用して、本明細書に記載されるゲノム修飾を実行し得る。Cas9は、物理的に生物に由来する必要はないが、合成または組換えにより産生され得る。多くの細菌種由来のCas9配列が当技術分野でよく知られており、アメリカ国立生物工学情報センター(NCBI)データベースに列挙されている。例えば、次に由来するCas9のNCBIエントリを参照されたい。Streptococcus pyogenes(WP_002989955、WP_038434062、WP_011528583);Campylobacter jejuni(WP_022552435、YP_002344900)、Campylobacter coli(WP_060786116);Campylobacter fetus(WP_059434633);Corynebacterium ulcerans(NC_015683、NC_017317);Corynebacterium diphtheria(NC_016782、NC_016786);Enterococcus faecalis(WP_033919308);Spiroplasma syrphidicola(NC_021284);Prevotella intermedia(NC_017861);Spiroplasma taiwanense(NC_021846);Streptococcus iniae(NC_021314);Belliella baltica(NC_018010);Psychroflexus torquisI(NC_018721);Streptococcus thermophilus(YP_820832)、Streptococcus mutans(WP_061046374、WP_024786433);Listeria innocua( NP_472073);Listeria monocytogenes(WP 061665472);Legionella pneumophila(WP 062726656);Staphylococcus aureus(WP_001573634);Francisella tularensis(WP_032729892、WP_014548420)、Enterococcus faecalis(WP_033919308);Lactobacillus rhamnosus(WP_048482595、WP_032965177);およびNeisseria meningitidis(WP_061704949、YP_002342100)。これらの配列のすべて(本出願の出願日までに入力された)は、参照により本明細書に組み込まれる。これらの配列のいずれか、またはそれと少なくとも約70~100%の配列同一性(この範囲内の任意の同一性パーセント、例えば、それと70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、もしくは99%の配列同一性)を有する配列を含むそのバリアントが、本明細書に記載されるように、ゲノム編集のために使用され得る。配列比較、ならびにCas9の遺伝的多様性および系統発生分析の考察について、Fonfara et al.(2014)Nucleic Acids Res.42(4):2577-90、Kapitonov et al(2015)J.Bacteriol.198(5):797-807、Shmakov et al.(2015)Mol.Cell.60(3):385-397、およびChylinski et al.(2014)Nucleic Acids Res.42(10):6091-6105も参照されたい。
【0132】
CRISPR-Cas系は、細菌および古細菌内で自然に発生し、そこで、外来DNAに対するRNA媒介適応免疫において役割を果たす。細菌クラス2タイプII CRISPR系は、エンドヌクレアーゼであるCas9を使用し、これは、相補的なゲノム標的配列に特異的にハイブリダイズするガイドRNA(gRNA)と複合体を形成し、Cas9エンドヌクレアーゼは、切断を触媒して二本鎖切断をもたらす。Cas9の標的化は、典型的には、gRNA結合部位のちょうど3’のDNA内のプロトスペーサー隣接モチーフ(PAM)の存在にさらに依存する。
【0133】
ゲノム標的部位は、典型的には、gRNAに相補的であるヌクレオチド配列を含み、プロトスペーサー隣接モチーフ(PAM)をさらに含み得る。特定の実施形態では、標的部位は、S.pyogenes由来のCas9(SpCas9)の場合、3塩基対PAMに加えて、20~30個の塩基対を含む。典型的には、PAMの第1のヌクレオチドは、任意のヌクレオチドであり得るが、他の2つのヌクレオチドは、選択された特定のSpCas9バリアントに依存する。例示的なPAM配列は、当業者に既知であり、NNG、NGN、NAG、およびNGGを含むがこれらに限定されず、ここで、Nは任意のヌクレオチドを表す。特定の実施形態では、gRNAによって標的化される対立遺伝子は、対立遺伝子内にPAMを作る変異を含み、PAMは、対立遺伝子へのCas9-gRNA複合体の結合を促進する。
【0134】
特定の実施形態では、gRNAは、長さが5~50個のヌクレオチド、10~30個のヌクレオチド、15~25個のヌクレオチド、18~22個のヌクレオチド、もしくは19~21個のヌクレオチド、または例えば、長さが10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、もしくは35個のヌクレオチドを含む、記載された範囲の間の任意の長さである。ガイドRNAは、単一RNA分子内にcrRNAおよびtracrRNA配列を含む単一ガイドRNAであり得るか、またはガイドRNAは、別個のRNA分子内に存在するcrRNAおよびtracrRNA配列を有する2つのRNA分子を含み得る。
【0135】
別の実施形態では、PrevotellaおよびFrancisella 1由来のCRISPRヌクレアーゼ(Cpf1/Cas12a)が使用され得る。Cas12aは、Cas9との類似点を有するクラス2タイプV CRISPR/Cas系RNA誘導ヌクレアーゼであり、類似的に使用され得る。Cas9とは異なり、Cas12aは、tracrRNAを必要とせず、そのガイドRNA内のcrRNAのみに依存し、これにより、Cas9よりも短いガイドRNAが、標的化のためにCas12aで使用され得るという利点が提供される。Cas12aは、DNAまたはRNAのいずれかを切断することができる。Cas12aによって認識されるPAM部位は、Cas9によって認識されるGリッチPAM部位とは対照的に、5’-YTN-3’を有する(ここで、「Y」はピリミジン、「N」は任意の核酸塩基である)、またはより一般的には5’-TTTV-3’(ここで、「V」はT以外の任意の塩基である)の配列を有する。DNAのCas12a切断は、4または5のヌクレオチドのオーバーハングを有する粘着末端を有する二本鎖切断をもたらす。Cas12aの考察については、例えば、参照により本明細書に組み込まれる、Ledford et al.(2015)Nature.526(7571):17-17、Zetsche et al.(2015)Cell.163(3):759-771、Murovec et al.(2017)Plant Biotechnol.J.15(8):917-926、Zhang et al.(2017)Front.Plant Sci.8:177、Fernandes et al.(2016)Postepy Biochem.62(3):315-326を参照されたい。
【0136】
C2c1は、使用され得る別のクラス2タイプV CRISPR/Cas系RNA誘導ヌクレアーゼである。C2c1は、Cas9と同様に、標的部位への誘導についてcrRNAおよびtracrRNAの両方に依存する。C2c1の説明については、例えば、参照により本明細書に組み込まれる、Shmakov et al.(2015)Mol Cell.60(3):385-397、Zhang et al.(2017)Front Plant Sci.8:177を参照されたい。
【0137】
さらに別の実施形態では、操作されたRNA誘導FokIヌクレアーゼが使用され得る。RNA誘導FokIヌクレアーゼは、不活性なCas9(dCas9)とFokIエンドヌクレアーゼの融合(FokI-dCas9)を含み、dCas9部分は、FokI上にガイドRNA依存性標的化を付与する。操作されたRNA誘導FokIヌクレアーゼの説明については、例えば、参照により本明細書に組み込まれる、Havlicek et al.(2017)Mol.Ther.25(2):342-355、Pan et al.(2016)Sci Rep.6:35794、Tsai et al.(2014)Nat Biotechnol.32(6):569-576を参照されたい。
【0138】
RNA誘導ヌクレアーゼは、gRNAと複合体を形成したヌクレアーゼなどのタンパク質の形態で提供され得るか、またはRNA(例えば、メッセンジャーRNA)もしくはDNA(例えば、発現ベクター)などのRNA誘導ヌクレアーゼをコードする核酸によって提供され得る。コドン使用は、特定の細胞または生物内のRNA誘導ヌクレアーゼの産生を改善するために最適化され得る。例えば、RNA誘導ヌクレアーゼをコードする核酸は、自然発生的ポリヌクレオチド配列と比較して、酵母細胞、細菌細胞、ヒト細胞、非ヒト細胞、哺乳類細胞、げっ歯類細胞、マウス細胞、ラット細胞、または任意の他の目的の宿主細胞内でより高い使用頻度を有するコドンを置換するように修飾され得る。RNA誘導ヌクレアーゼをコードする核酸が細胞に導入されると、タンパク質は、一時的に、条件付きで、または構成的に細胞内で発現され得る。
【0139】
ドナーポリヌクレオチドおよびgRNAは、標準的な技術、例えば、参照により本明細書に組み込まれる米国特許第4,458,066号および同第4,415,732号、Beaucage et al.,Tetrahedron(1992)48:2223-2311、ならびにApplied Biosystems User Bulletin No.13(1 April 1987)に開示されるようなホスホルアミダイト化学による固相合成によって容易に合成される。他の化学合成には、例えば、Narang et al.,Meth.Enzymol.(1979)68:90によって記載されるホスホトリエステル法、およびBrown et al.,Meth.Enzymol.(1979)68:109によって開示されるホスホジエステル法が含まれる。短い長さのgRNA(典型的には、長さが約20個のヌクレオチド)およびドナーポリヌクレオチド(典型的には、約100~150個のヌクレオチド)を考慮して、gRNA-ドナーポリヌクレオチドカセットは、標準的なオリゴヌクレオチド合成技術によって産生され、続いてベクターにライゲーションされ得る。さらに、数千のゲノム標的に対するgRNAドナーポリヌクレオチドカセットのライブラリは、高並列アレイベースのオリゴヌクレオチドライブラリ合成法を使用して容易に作成され得る(例えば、Cleary et al.(2004)Nature Methods 1:241-248、Svensen et al.(2011)PLoS One 6(9):e24906を参照されたい)。
【0140】
さらに、アダプター配列をオリゴヌクレオチドに付加して、ハイスループットの増幅または配列決定を容易にすることができる。例えば、アダプター配列の対をオリゴヌクレオチドの5’および3’末端に付加して、同じプライマーセットによる複数のオリゴヌクレオチドの同時の増幅または配列決定を可能にすることができる。さらに、制限部位をオリゴヌクレオチドに組み込んで、オリゴヌクレオチドのベクターへのクローニングを容易にすることができる。例えば、gRNA-ドナーポリヌクレオチドカセットを含むオリゴヌクレオチドは、ゲノム修飾ベクターへのライゲーションを容易にするために、共通の5’制限部位および共通の3’制限部位を有して設計され得る。共通の5’制限部位および共通の3’制限部位で各オリゴヌクレオチドを選択的に切断する制限消化が実行されて、ベクター(例えば、プラスミドまたはウイルスベクター)にクローニングされ得る制限断片を産生し、続いてgRNAドナーポリヌクレオチドカセットを含むベクターで、細胞を形質転換する。
【0141】
gRNA-ドナーポリヌクレオチドカセットをコードするポリヌクレオチドの増幅は、例えば、ゲノム修飾ベクターへのライゲーションの前、または配列決定の前、およびバーコード化の後に実行され得る。ポリメラーゼ連鎖反応(PCR)、等温増幅、核酸配列ベースの増幅(NASBA)、転写媒介増幅(TMA)、鎖置換増幅(SDA)、およびリガーゼ連鎖反応(LCR)が挙げられるがこれらに限定されない、オリゴヌクレオチドを増幅するための任意の方法が使用され得る。一実施形態では、ゲノム編集カセットは、ユニバーサルプライマーのセットと並行してgRNA-ドナーポリヌクレオチド配列の増幅を可能にするための、共通の5’および3’プライミング部位を含む。別の実施形態では、選択的プライマーのセットが使用されて、プールされた混合物からgRNA-ドナーポリヌクレオチドのサブセットを選択的に増幅する。
【0142】
ゲノム編集カセットを含む組換えポリヌクレオチドで形質転換される細胞は、原核細胞または真核細胞であり得、好ましくは、形質転換によるgRNA-ドナーポリヌクレオチドライブラリの高効率の組み込みのために設計され得る。核酸を宿主細胞に導入する方法は、当技術分野でよく知られている。一般的に使用される形質転換の方法には、典型的には二価の陽イオン(例えば、CaCl2)を使用する化学的に誘導された形質転換、およびエレクトロポレーションが含まれる。例えば、Sambrook et al.(2001)Molecular Cloning,a laboratory manual,3rd edition,Cold Spring Harbor Laboratories,New York、Davis et al.(1995)Basic Methods in Molecular Biology,2nd edition,McGraw-Hill、およびChu et al.(1981)Gene 13:197を参照されたく、参照によりそれらの全体が本明細書に組み込まれる。
【0143】
DNA切断への細胞内ドナーDNAのランダムな拡散は、相同的修復の律速となり得る。能動的ドナー動員を使用して、NHEJおよび細胞死の競合経路よりもHDRを優先することによって、ドナーDNAによって遺伝子修飾された細胞の頻度を増加させ得る。能動的ドナー動員のための方法は、a)核酸結合ドメインを含むポリペプチドに接続されたDNA切断に選択的に結合するタンパク質を含む融合タンパク質を、細胞に導入することと、b)i)DNA切断に隣接する配列にハイブリダイズするのに十分に相補的なヌクレオチド配列、およびii)融合タンパク質の核酸結合ドメインによって認識される結合部位を含むヌクレオチド配列を含むドナーポリヌクレオチドを、細胞に導入し、核酸結合ドメインは、ドナーポリヌクレオチド上の結合部位に選択的に結合して、ドナーポリヌクレオチドと融合タンパク質との間の複合体を産生し、それによってドナーポリヌクレオチドをDNA切断に動員し、HDRを促進することとを含む。
【0144】
DNA切断は、Casヌクレアーゼ(例えば、Cas9、Cas12a、またはC2c1)、操作されたRNA誘導FokIヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化様エフェクターヌクレアーゼ(TALEN)、制限エンドヌクレアーゼ、メガヌクレアーゼ(例えば、I-SceI、I-CreI、またはI-DmoI)、ホーミングエンドヌクレアーゼなどであるがこれらに限定されない、部位特異的ヌクレアーゼによって生じ得る。ドナーポリヌクレオチドの標的統合部位で配列を選択的に切断する任意の部位特異的ヌクレアーゼが使用され得る。
【0145】
DNA切断は、一本鎖(ニック)または二本鎖DNA切断であり得る。DNA切断が一本鎖DNA切断である場合、使用される融合タンパク質が、一本鎖DNA切断に選択的に結合するタンパク質を含む一方で、DNA切断が二本鎖DNA切断である場合、使用される融合タンパク質は、二本鎖DNA切断に選択的に結合するタンパク質を含む。
【0146】
融合において、DNA切断に選択的に結合するタンパク質は、例えば、Casヌクレアーゼ(例えば、Cas9もしくはCas12a)などのRNA誘導性ヌクレアーゼ、または操作されたRNA誘導性FokIヌクレアーゼであり得る。
【0147】
ドナーポリヌクレオチドは、一本鎖または二本鎖であり得、RNAまたはDNAで構成され得る。DNAを含むドナーポリヌクレオチドは、必要に応じて、細菌レトロン系内などの逆転写酵素を使用するか、またはウイルス逆転写酵素を用いる逆転写によって、RNAを含むドナーポリヌクレオチドから産生され得る。融合タンパク質内の核酸結合ドメインのタイプに応じて、ドナーポリヌクレオチドは、例えば、RNA結合ドメインによって認識されるRNA配列、またはDNA結合ドメインによって認識されるDNA配列を含む、対応する結合部位を含み得る。例えば、融合タンパク質は、ドナーポリヌクレオチド内の対応するLexA結合部位と適合されるように、LexA DNA結合ドメインで構築され得る。別の例では、融合タンパク質は、ドナーポリヌクレオチド内の対応するFkh1結合部位と適合されるように、Fkh1 DNA結合ドメインで構築され得る。
【0148】
別の実施形態では、融合タンパク質は、ホスホトレオニン結合ドメイン(例えば、FHA)をさらに含み得、ドナーポリヌクレオチドは、ホスホトレオニン結合ドメインがリン酸化トレオニン残基に結合するために、DNA切断に十分に近く位置するリン酸化トレオニン残基を含むタンパク質を有するDNA切断に選択的に動員される。ホスホトレオニン結合ドメインは、ドナー動員のために任意のDNA結合ドメインと組み合わされ得る(例えば、LexA-FHAを生成するためのLexAとの融合)。
【0149】
実施形態では、各組換えポリヌクレオチドは、組換えポリヌクレオチドとハイブリダイズすることができるガイドRNA(例えば、ガイドX)をコードする、第2の核酸配列をさらに含む。実施形態では、ガイドRNAは、ガイドRNA-ヌクレアーゼ複合体が組換えポリヌクレオチドを切断するように、各細胞内のヌクレアーゼと複合体を形成する。実施形態では、組換えポリヌクレオチドは、プラスミドベクターであり、ガイドRNA-ヌクレアーゼ複合体は、プラスミドベクターを線形化する。
【0150】
実施形態では、各組換えポリヌクレオチドは、組換えポリヌクレオチドとハイブリダイズすることができるガイドRNA(例えば、ガイドX)をコードする、第2の核酸配列をさらに含み、ガイドRNAは、各細胞内のヌクレアーゼと複合体を形成し、ガイドRNA-ヌクレアーゼ複合体がバーコード遺伝子座を切断するようにする。
【0151】
配列検証
特定の実施形態では、方法は、複数の遺伝子修飾された細胞の配置、続いて、アレイ内の各コロニーのバーコード遺伝子座の高並列配列検証をさらに含む。例は、米国特許公開第2016/0122748号で見られ得、これは、参照によりその全体が本明細書に組み込まれる。実施形態では、方法は、a)遺伝子修飾された細胞の増殖に適した培地上に、順序付けられたアレイで、複数の遺伝子修飾された細胞をプレーティングすることと、b)複数の遺伝子修飾された細胞を、各遺伝子修飾された細胞が順序付けられたアレイでクローンのコロニーを産生する条件下で培養することと、c)順序付けられたアレイ内のコロニーからバーコーダー細胞にゲノム修飾バーコードを導入することであって、バーコーダー細胞が、部位特異的リコンビナーゼの組換え標的部位、およびゲノム修飾バーコードが対応する順序付けられたアレイ内のコロニーの位置を同定する隣接バーコード配列を含む核酸を含む、導入することと、d)部位特異的リコンビナーゼ系を使用して、ゲノム修飾バーコードを、バーコーダー細胞のバーコード配列に隣接する位置に移動させることであって、バーコーダー細胞の組換え標的部位での部位特異的組換えは、ゲノム修飾バーコードに連結されたバーコード配列を含む核酸を生成する、移動させることと、e)ゲノム修飾バーコードに連結されたバーコーダー細胞のバーコード配列を含む核酸を配列決定して、コロニーからゲノム修飾バーコードの配列を同定することであって、バーコーダー細胞のバーコード配列が、ゲノム修飾バーコードが由来する順序付けられたアレイ内のコロニーの位置を同定するために使用される、同定することと、f)バーコーダー細胞のバーコードによって同定される順序付けられたアレイ内のコロニーから、ゲノム修飾バーコードを含むクローンを選択することとを含む。ゲノム修飾バーコードが対応するゲノム編集カセット(例えば、ガイドRNAおよびドナーポリヌクレオチド)、例えば、ゲノム修飾バーコードおよびゲノム修飾カセットが存在するベクターは、トランスフェクション前に、配列決定によって以前に決定されたゲノム編集カセット-バーコード関連のデータベースから同定され得る。実施形態では、方法は、バーコーダー細胞のバーコードによって同定される順序付けられたアレイ内のコロニーから、遺伝子修飾バーコードを含むクローンを選択することを含む。実施形態では、方法は、複数のクローンが選択および配列決定されるように並行して行われる。
【0152】
「バーコーダー細胞」という用語は、バーコード配列を含む核酸を含む細胞を指す。一実施形態では、バーコードは、バーコーダー細胞を含むコロニーの位置を同定する。
【0153】
例えば、遺伝子修飾された細胞は、一倍体酵母細胞であり得、バーコーダー細胞は、遺伝子修飾された細胞と交配することができる一倍体酵母細胞であり得、順序付けられたアレイ内の遺伝子修飾された一倍体酵母コロニーからのゲノム編集カセットバーコードを、バーコーダー一倍体酵母細胞に導入することは、コロニーからの一倍体酵母クローンをバーコーダー一倍体酵母細胞と交配させて、二倍体酵母細胞を産生することを含む。後続の部位特異的組換えは、本明細書に記載されるように、二倍体酵母細胞内のゲノム編集カセットに連結されたバーコード配列を含む核酸を生成する。遺伝子修飾された細胞は、MATα株であり得、バーコーダー酵母細胞は、MATa株であり得る。あるいは、遺伝子修飾された細胞は、MATa株であり得、バーコード酵母細胞は、MATα株であり得る。
【0154】
特定の実施形態では、バーコーダー細胞内のリコンビナーゼ系は、Cre-loxP部位特異的リコンビナーゼ系、Flp-FRT部位特異的リコンビナーゼ系、PhiC31-att部位特異的リコンビナーゼ系、またはDre-rox部位特異的リコンビナーゼ系である。一実施形態では、バーコーダー細胞の組換え標的部位は、loxP組換え部位を含む。
【0155】
別の実施形態では、バーコーダー細胞内のリコンビナーゼ系は、メガヌクレアーゼを使用してDNA二本鎖切断をもたらす。別の実施形態では、バーコーダー細胞内のメガヌクレアーゼは、ガラクトース誘導性SceIメガヌクレアーゼである。別の実施形態では、ゲノム編集カセットには、メガヌクレアーゼによって認識される制限部位が隣接している。
【0156】
別の実施形態では、方法は、部位特異的組換えに成功したクローンを選択する選択可能なマーカーを使用することをさらに含む。
【0157】
別の実施形態では、方法は、HDRによる1つ以上のゲノム標的遺伝子座でのドナーポリヌクレオチドの統合に成功したクローンを選択する選択可能なマーカーを使用することをさらに含む。
【0158】
別の実施形態では、方法は、順序付けられたアレイ内の少なくとも1つのクローンを表現型決定することをさらに含む。
【0159】
別の実施形態では、方法は、順序付けられたアレイ内の少なくとも1つのクローンの全ゲノムを配列決定することをさらに含む。
【0160】
別の実施形態では、方法は、順序付けられたアレイ内のすべてのコロニーに対して、ゲノム編集カセットバーコード(ならびにしたがって、それが対応するガイドRNAおよびドナーポリヌクレオチド)の配列を同定するために、順序付けられたアレイ内のすべてのコロニーでステップ(a)~(e)を繰り返すことをさらに含む。
【0161】
別の態様では、本明細書に記載される方法によって産生された遺伝子修飾された細胞のクローンを含むコロニーの順序付けられたアレイが提供され、コロニーは、所望のバーコードに従って再配置される。一実施形態では、アレイの元のセット上で同定された各固有のゲノム編集カセットバーコードに対して、単一コロニーが選択される。これにより、すべてのコロニーが所望のゲノム編集の固有のバーコードに対応するライブラリの統合が可能になる。さらなる実施形態では、この統合されたアレイ内のコロニーは、競合増殖長実験のために一緒にプールされ得、各バーコード化された株の開始存在量がほぼ等しいため、ライブラリバイアスがより少ないという利点がある。
【0162】
例示的な実施形態および方法
この方法論の基礎となる1つの原理は、例えば、相同組換え(HDR)による、別のバーコードに隣接する1つのバーコードの挿入であり、同じDNA分子上のバーコードの物理的連結をもたらす(
図1B~1D)。複数の個々のバーコードが効果的に組み合わされて、より大きい単一バーコードを生成し、バーコードの順序は、ゲノム編集の付加の順序を表し、バーコード(すなわち、バリアント)の並べ替えまたは組み合わせを同定およびカウントすることをできる配列決定ベースのアプローチを可能にする。本開示は、後続のバーコード化ラウンドを可能にするいくつかの新規の方法で、米国仮出願第62/559,493号(その全体が参照により本明細書に組み込まれる)に記載されるバーコード化系に基づく。
【0163】
DNAバーコードは、既知の(つまり、配列決定された)または未知のDNA構築物の同時送達によって媒介されるものを含む、細胞に対する様々な変化をコードすることができる。バーコードおよびDNA構築物は、同じベクターまたはアンプリコン上などで物理的に連結され得、ベクターの配列決定は、バーコードをDNA構築物と連結することができる。バーコードは、ランダム変異誘発または進化ベースのアプローチによって生成されるものなど、未知のDNA修飾を表すことができる。バーコードはまた、エピジェネティック修飾を示すこともでき、細胞集団の系統を追跡するために使用され得る。一般に、バーコードプールの複雑さは、バーコード化されるDNAまたは細胞集団の複雑さよりもはるかに大きく、同じバーコード配列が2つの異なる細胞またはDNA構築物に関連付けられる可能性は十分に低くなる。
【0164】
バーコード(および関連するポリヌクレオチド配列)は、任意の手段によってバーコード遺伝子座に統合され得る。実施形態では、各固有のバーコードは、相同組換えによってバーコード遺伝子座に挿入される。実施形態では、各固有のバーコードは、非相同末端結合によってバーコード遺伝子座に挿入される。実施形態では、各固有のバーコードは、インテグラーゼを使用してバーコード遺伝子座に挿入される。
【0165】
実施形態では、バーコードは、選択可能なマーカーを有するバーコード遺伝子座に統合される。実施形態では、選択可能なマーカーは使用されない。
図1A~1Dは、選択可能なマーカーを使用した場合(左側)または使用しない場合(右側)のバーコード連結再帰の例を示す。バーコードは、左相同性(LH)および右相同性(RH)と呼ばれる2つの相同性アームを利用する、宿主細胞相同組換え(HR)によって可能になり得る。RNA誘導ヌクレアーゼなどの部位特異的ヌクレアーゼによる切断を使用して、HR効率を大幅に高めることができる。あるいは、切断非依存性HRを使用して、入ってくるバーコード構築物を統合することができる。デュアル選択可能/対抗選択可能なマーカーの使用は任意であり、所望の場所でバーコードが組み込んでいない細胞の一部を除去するのに役立つ。
【0166】
選択可能なマーカーは、当技術分野でよく知られている。使用する選択可能なマーカーの選択は、例えば、細胞のタイプ(例えば、真核または原核)、細胞培養系などに依存し、当業者によって決定され得る。本明細書に記載される方法で使用され得る選択可能なマーカーには、抗生物質耐性遺伝子、除草剤耐性遺伝子、代謝拮抗物質マーカー遺伝子、およびレポーター遺伝子が含まれるが、これらに限定されない。
【0167】
実施形態では、バーコードの挿入は、さらに別のバーコードの挿入を可能にする配列要素の同時挿入を伴う。
図1Cに示すように、これらの挿入要素は、部位特異的ヌクレアーゼの切断部位2、新しい右相同性(RH2)、および任意に、新しいマーカー(マーカー
偶数)を含み得る。バーコード化のラウンドNは、ラウンドN+1が後に続くことができ、任意のマーカーが、各ラウンドの間に変化し、例えば、マーカー
奇数とマーカー
偶数との間で交互に切り替わる(
図1D)。バーコードは、右相同性アーム(RH1、RH2、RH3など)によって分離され、互いに隣接して蓄積し続ける。短いバーコードの密接な連結により、複雑なプール内のバーコードの組み合わせを追跡するための効率的かつ経済的なハイスループット配列決定アプローチが可能になる。
【0168】
実施形態では、バーコードの各ラウンドは、バーコードの片側に、修復相同性の短い(典型的には40~60bp)の伸長によって分離された、新しいバーコード(典型的には長さが20~30bp)を付加する。したがって、バーコード連鎖の連続したラウンドでは、60~90bpを付加する。3~5ラウンドを超えるバーコード化は、ハイスループット配列決定が実用的または経済的に横断するにはあまりに大きい構築物をもたらすため、バーコードアレイの長さには実際的な制限がある。この問題を回避するために、「バーコード圧縮」と呼ばれる特別なバーコード化ラウンドを使用して、複数のバーコード(例えば、4~8個のバーコード)を単一の短いバーコードにマッピングすることができる。
【0169】
DNAバーコードは、任意の情報をコードすることができる。これにより、バーコードは、バーコード遺伝子座で蓄積されたものなど、他の連結されたバーコードのアレイを表すことができる。この設定では、バーコードアレイに隣接して統合されるまで、バーコードは何にも連結されない。上で考察したように、バーコードプールの複雑さは、バーコード化される細胞集団の複雑さよりもはるかに大きいことが報告されている。
【0170】
図2A~2Cは、「コンプレッサー」バーコードのセットがどのように挿入され得るかの一例を示し、これにより、1回の長い配列決定読み取りが、連結されたバーコードのセットを1つの圧縮バーコードに「圧縮する」ことが可能になる。その後、このバーコードの組み合わせは、単純に単一バーコードを配列決定することによって同定され得る。
図2Bは、4つのバーコードの単一のbc
1..4への圧縮を示す。バーコード圧縮の後に、再帰的バーコード連結のさらなるラウンドが続くことができ、もはや必要とされなくなった(かつもはや配列決定されなくなった)バーコードが右側に蓄積する。圧縮を周期的に実行して、集団を調査するのに必要な配列決定読み取りの長さを最小限に抑えることができる。
【0171】
このアプローチの1つの欠点は、意図的ではない組換えがバーコードアレイの部分を除去する可能性があるため、右相同性(RH)要素を後続のラウンドで再び使用することができないことである。これに対処するために、専用のバーコード圧縮部位が、ユニバーサル右相同性(RH)および確保された切断部位1
*を使用して、ならびにマーカー1
*および2
*の異なるセットを任意に用いて、例えば、
図3Aに示すようにバーコード遺伝子座の右側に導入され得る。この圧縮バーコードの右側には、将来のバーコード圧縮ラウンドために確保されている挿入要素が統合される。この圧縮バーコードの左側には、RH
圧縮と呼ばれる特別な相同性およびN+1切断部位が導入される。これらにより、次のバーコード化ラウンドが、bc1、bc2、bc3、およびbc4を置き換え、バーコード遺伝子座から古いバーコードを除去することが可能になる。
図3Bに示すように、連結されたバーコードの圧縮バーコードへの配列決定および計算マッピングの後、次のバーコード化ラウンドにより、もはや必要とされなくなった連結されたバーコードの除去が可能になる。圧縮バーコードはまた、後続のバーコード連結ラウンドのために切断部位および相同性を導入し得る。この例では、bc5は、bc
1..4の左側に隣接して挿入され、プロセスにおいて、bc1、bc2、bc3、およびbc4、ならびにRH1、RH2、RH3、RH4、およびRH5、およびそれらに関連する切断部位を除去する。これにより、以前の挿入要素の再利用が可能になり、バーコード遺伝子座が継続的に増殖するのを防止する。再帰的バーコード連結と同様に、この圧縮バーコードもまた任意に、将来の圧縮ラウンドのためにマーカー、相同性、および切断部位を導入する(
図4A~4B)。
【0172】
図4A~4Bに示すように、第2のバーコード圧縮ラウンドは、第1のラウンドと構造的に同一であり得、同じRH要素の使用を伴うが、左側へのさらなるバーコード連結および右側へのバーコード圧縮のための異なる相同性および切断部位を伴う。バーコード圧縮のこの例示的なラウンドにおいて、入ってくるバーコードbc
1..7は、連結されたバーコードbc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4の両方を圧縮する。左側へのバーコード連結の次のラウンドは任意に、bc5、bc6、およびbc7、ならびにすでに圧縮されたbc
1..4を除去し、次の一連のバーコード化ラウンドで、すでに使用された挿入要素の再利用を可能にする。
【0173】
(1)左側へのバーコード連結、(2)右側での圧縮バーコード挿入、(3)次のバーコードによるバーコードアレイ除去のプロセス全体が、任意の回数繰り返され得る。このプロセスのための例示的な方法を
図5A~5Bに示す。
(1)バーコード連結操作は、遺伝子座を左側(
図5A)または右側(
図5B)に伸長させ、入ってくる各バーコードは、同じLH
ユニバーサル、ラウンド特異的(RH
x)相同性を使用し、それと共に、将来のバーコード連結ラウンドのための左側の相同性(RH
x+1)をもたらす。
(2)バーコード圧縮は、遺伝子座を右側(
図5A)または左側(
図5B)に伸長させ、任意の数の連結バーコード内に保存されたデータを単一バーコードに圧縮することを可能にする。元の遺伝子座は、任意のラウンド数のバーコード連結の後に生じ得るバーコード圧縮ラウンドのために確保される、RH
ユニバーサルおよびLH
y圧縮相同性を有する。
(3)遺伝子座収縮を伴うバーコード連結により、将来のバーコード連結および圧縮ラウンドのためのLHおよびRH要素の再利用が可能になる。圧縮バーコードには、右側に、さらにもう1回の将来の圧縮ラウンドのためのLH
y+1圧縮相同性が伴い、左側に、バーコード連結の次のラウンドが以前に連結されたバーコードを除去し、遺伝子座を収縮させることを可能にするRH
x+1(圧縮)相同性が伴う。(
図5A)および(
図5B)に示すように、操作のセット全体は対称的である。この方法により、単一バーコードまたは短いバーコードアレイのいずれかを用いて、高次の組み合わせの遺伝子修飾が構築および追跡されることが可能になる。
【0174】
ガイド-ドナーに加えて、CRISPR干渉もしくは活性化のためのガイドRNA、またはスモールヘアピンRNAカセットがバーコード化され得る。次いで、これらのバーコード化構築物は、形質転換によって細胞集団に円形または線形ベクターとして導入され得る。バーコード遺伝子座へのバーコード(および任意に、その関連する構築物)の挿入は、相同組換えを可能にするバーコードのいずれかの側の特定の相同配列によって媒介される。相同組換えは、受動的に生じ得るか、または例えば、部位特異的ヌクレアーゼ(タンパク質のみのヌクレアーゼもしくはRNA誘導ヌクレアーゼ)によって、インビトロもしくはインビボでのバーコード化構築物の線形化によって、または能動的ドナー動員によって刺激され得る。一実施形態では、バーコード間の相同配列の組換えは、インビトロで実行され得る(例えば、ギブソンアセンブリによって)。
【0175】
一実施形態では、方法は、系統追跡を可能にするために、株の多様化または株の進化の間に未知の遺伝子修飾を追跡するために使用され得る。関連する実施形態では、バーコードは、遺伝子または経路のランダムなゲノムワイド変異誘発またはエラーが発生しやすいPCRなどの誘導されていない遺伝子多様化プロセスの後に、バーコード遺伝子座に挿入され得る。この設定では、バーコードが表す遺伝子修飾は、最初は未知である。遺伝子多様化、バーコード連結、および選択の複数のラウンドは、系統樹の構築を可能にする。最終的に、所望の特性を有するクローンを配列決定すると、変化の組み合わせが最終的に目的の表現型をどのようにもたらすかについての豊富な情報が得られ得る。さらに、個々のクローンは、我々のリコンビナーゼによるインデックス化アプローチ(米国特許出願公開第2016/0122748号(参照によりその全体が本明細書に組み込まれる))によって、数千の未知のクローンの複雑なプールから迅速に単離され得る。さらに別の実施形態では、バーコードは、2ビットのDNAコード空間内の任意のデジタル情報をコードすることができる。後続のバーコード連結を使用して情報を一時的に保存することができ、バーコード圧縮によりデータ圧縮が可能になる。
【0176】
さらに別の実施形態では、遺伝子全体などの遺伝子構築物がバーコード化(合成中、PCR増幅中、またはGATEWAYクローニングなどの方法によるレシピエントベクターへのクローニング中のいずれか)および統合され得る。
図18に示すように、遺伝子バリアントライブラリは、多重化ギブソンアセンブリ(ステップ1)を含む様々なアプローチによって構築され得る。この例では、すべての遺伝子バリアントが、末端に共通の増幅配列を含有する。ロングリード技術を使用して、固有のbc1配列を遺伝子配列に関連付けることができる(ステップ2)。ステップ3に示すように、遺伝子構築物をラウンド2の右相同性(R2RH)配列から分離する制限部位により、細菌および酵母特異的マーカーを有するR2LH配列の挿入が可能になる。ラウンド2の切断部位は、マーカーに隣接している。ガイド1およびCas9の形質転換および誘導により、バーコード遺伝子座での遺伝子バリアント構築物の挿入が可能になる(ステップ4)。
【0177】
上記のガイド-ドナー設定と同様のスタイルで再帰的統合要素を含むことにより、バーコード化遺伝子構築物のアレイがバーコード遺伝子座で鎖状に繋がれることが可能になる。
図19は、第2の遺伝子バリアント(遺伝子B)が、
図18からの遺伝子Aカセットのマーカー部分の代わりに、ガイド2部位を介してバーコード遺伝子座に挿入されることを示す。その結果、遺伝子Aと遺伝子B、およびbc1とbc2が鎖状に繋がれる。このプロセスを繰り返すと、
図5A~5Bにあるように、バーコード連結、その後に続く、バーコード圧縮およびバーコード遺伝子座収縮により、任意の数の遺伝子が一緒に挿入されることが可能になる。
【0178】
この方法のバリエーションは、ゲノム全体を通して所望の位置で遺伝子を導入することができ、プラスミド上の遺伝子には、所望のゲノム領域に対する相同性が隣接し、本質的に大きいゲノム挿入を伴うドナーDNAになる(
図20および21)。特に、これらのバーコード化方法は、方法の後続のラウンドで組み合わされ得、ラウンド1がゲノム編集のライブラリを表し、ラウンド2が遺伝子全体のライブラリを表す、などができるようにし、任意のバーコードタイプ(ゲノム編集、遺伝子全体、CRISPR干渉/活性化カセット)が混合および適合され得る。
【0179】
この方法論の1つの制限には、順次的な編集およびバーコード化ステップの必要性が含まれる。別の制限は、非常に複雑なプール内の各クローンの全ゲノム配列決定によって、実際の編集または修飾をすべて確認することは実用的ではない可能性があることである。最後に、バリアントのプールが遺伝子構築物のプールと混合され、構築物が各バリアントにランダムに導入されるため、必然的に検査される組み合わせは、多対多、少対多、多対少、または少対少のアプローチなどのモダリティを伴い、全対全でなければならない。結果として、すべての所望のバリアントの組み合わせの完全な網羅を可能にするために必要とされる各形質転換のサイズは、編集およびバーコード化の各ラウンドで指数関数的に増加し、3ラウンドの編集後、1000の初期バリアントは、1000の選択3、または1000*999*998/(3*2*1)=166,167,000の可能な組み合わせの数をもたらすようになり、さらなるラウンドで激増する。開始する所望のバリアントの選択(少対多)、または付加する遺伝子構築物の縮小(多対少)により、組み合わせ空間の管理が可能になる。この問題を管理する1つの方法は、リコンビナーゼによるインデックス化(REDI)を使用して、編集後に株のアレイを作成することである。本明細書に記載される方法は、米国仮特許出願第62/559,493号(参照によりその全体が本明細書に組み込まれる)に詳述されるように、修飾株を解析するためのリコンビナーゼによるインデックス化に適合する。株をアレイ形式に解析した後、特定の株を選択して、2回目以降のラウンドのバーコード化カセットのライブラリを受け取ることができる。実験室で用いられる培養物量、およびバリアントの大集団の十分な網羅に必要とされる配列決定読み取りの数などの実際的な考慮事項によって、最終的に分析され得るバリアントの組み合わせの数が決定される。
【0180】
実施形態では、少なくとも2ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも3ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも4ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも5ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ラウンドのバーコード化が、複数の細胞に対して実行される。
【0181】
実施形態では、2~100ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~50ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~15ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~10ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~8ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~6ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~5ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、2~4ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、3~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、4~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、5~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、6~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、8~20ラウンドのバーコード化が、複数の細胞に対して実行される。実施形態では、10~20ラウンドのバーコード化が、複数の細胞に対して実行される。
【0182】
実施形態では、少なくとも2ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも3ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも4ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも5ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。
【0183】
実施形態では、2~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~15ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~10ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~8ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~6ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~5ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~4ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、3~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、4~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、5~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、6~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、8~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、10~20ラウンドのバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。
【0184】
実施形態では、少なくとも2ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも3ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも4ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも5ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。
【0185】
実施形態では、2~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~15ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~10ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~8ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~6ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~5ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、2~4ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、3~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、4~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、5~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、6~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、8~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。実施形態では、10~20ラウンドの遺伝子修飾およびバーコード化が、複数の細胞に対して実行される。
【0186】
実施形態では、少なくとも2ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも3ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも4ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも5ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、少なくとも6、少なくとも7、少なくとも8、少なくとも9、または少なくとも10ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。
【0187】
実施形態では、2~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~15ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~10ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~8ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~6ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~5ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、2~4ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、3~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、4~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、5~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、6~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、8~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。実施形態では、10~20ラウンドの遺伝子修飾およびバーコード化が、バーコード圧縮の前に複数の細胞に対して実行される。
【0188】
実施形態では、1つのプラスミドライブラリのみが、細菌内でのクローニングによって作成される。実施形態では、最初のラウンド1のライブラリは、ガイド-ドナー骨格を線形化するために、メガヌクレアーゼ(例えば、SceIメガヌクレアーゼ)を用いてインビトロで切断され得る。実施形態では、結果として生じるガイド-ドナーの単一ライブラリは、必要に応じて任意の将来の挿入ラウンドと共に、直接酵母に形質転換され得る。これにより、バーコード化/編集の各新しいラウンドに対して複数の困難なステップ2のクローニング手順の必要性を排除するだけでなく、線形断片がHDR機構を活性化するため、編集効率が大幅に高める。このアプローチは、HDRを強化するための3つの独立した直交法、ドナー動員、ドナー増幅、線形化ドナーベクターを特徴とする設定を示す。
【実施例】
【0189】
当業者は、本明細書に記載される粒子を作製および使用することの説明が、例示のみを目的とするものであり、本開示がこの例示によって限定されないことを理解するであろう。
【0190】
実施例1.最初のラウンドのバーコード統合
ガイド-ドナーをコードするオリゴヌクレオチドを高密度アレイ形式で合成し、アレイ表面から切断して複雑なプールを生成する。ガイドRNA-ドナーDNA配列(ガイド-ドナー)を含有するオリゴヌクレオチドプールを、ポリメラーゼ連鎖反応(PCR)中にバーコード化し、ベクターにクローニングする(
図6、ステップ1、2)。各オリゴは、特定のサブプールの増幅を可能にするガイド-ドナーカセットに隣接する共通の増幅配列を含有する。順方向プライマーは、その3’末端に制限部位(AscI)を有し、逆方向プライマーは、その5’末端で別個の制限部位(NotI)をコードし、その後に、不正な制限部位(NotI、AscI、およびBspQI)を除外する疑似ランダム配列(NNNVHTGNNNVHTGNNNVHTGNNNVHTGNNNまたはNNNTGVHNNNTGVHNNNTGVHNNNTGVHNNNのいずれか)をコードする縮重バーコード(bc1)が続く。縮重バーコードには、ラウンド1相同性(r1h)およびラウンド2相同性(r2h)と呼ばれる50bpの相同性配列が隣接している。NotIおよびAscI部位は、ガイドRNAプロモーターの3’末端にAscI部位を有して、多重コピーレシピエントベクターへの粘着末端クローニングを可能にする。ガイド配列およびドナー配列は、IIS型制限部位(BspQI)によって分離されており、これは、任意のオーバーハング(この場合はガイド配列のちょうど3’にあるGTTT)でのクローニングを可能にして、ガイドRNAの一定の構造構成成分内でのクローニングを可能にする。
【0191】
ガイド、ドナー、およびバーコードにわたる配列決定は、各バーコードに正確なガイド-ドナー配列を割り当てる(
図6、ステップ3)。第1のステップのクローニング産物のハイスループット配列決定(HTS)により、ガイド-BspQI-ドナー配列を固有のバーコード(bc1)に連結することが可能になる。対合末端配列決定を使用して、読み取り1と読み取り2の品質ベースの結合後に、ベースコールの信頼性を高めることができる。
【0192】
次いで、ガイドスキャフォールドおよび選択可能なマーカーを含有する挿入物を、ガイドとドナーとの間でクローニングする(
図6、ステップ4、5)。ステップ4a、酵母特異的(例えば、URA3、LYS2、またはHIS3)および細菌特異的(例えば、kanR)選択マーカーと共に、構造ガイドRNA構成成分を、5’末端でBspQI配列を有するプライマーを用いて増幅する。逆方向プライマーは、BspQI部位の最初の位置にG-A SNPを含有するように修飾された、Illumina読み取り2プライミング配列の3’に位置する追加のバーコード(bc
*、NNNNNNまたはNNNNNNHVVNHBBHBHD)を含む。ステップ4b、BspQIによる第1のステップのクローニング産物の切断、その後に続く、ホスファターゼ処理により、構造gRNA挿入物のスカーレスクローニングが可能になる。これらの第2のステップのライブラリをカナマイシンで選択して、挿入物を有するベクターの濃縮を可能にする。bc
*-ドナーおよびbc1の対合末端HTSを使用すると、バーコードを固有のガイド-ドナーの組み合わせにマッピングすることが可能になる(
図6、ステップ5)。
【0193】
第2のクローニングステップ後のガイド-ドナーベクターを酵母に形質転換し、挿入物特異的マーカー(URA3)で選択した(
図7)。各ドナーDNA/遺伝子構築物によって異なり得るガイドRNAは、二本鎖切断の特定のゲノム遺伝子座を標的化し、これは、対応するドナーDNAによって修復され、ゲノム全体にわたる所望の位置での正確なゲノム修飾をもたらす。レシピエント株を、対抗選択可能なマーカー(FCY1)を有するバーコード統合遺伝子座を有するように修飾する。ライブラリからのガイド配列に加えて、ガイド-ドナープラスミドはまた、バーコード統合を促進するためのバーコードガイド1発現ユニットも有し、バーコードガイド1切断部位は、FCY1に隣接している。形質転換後、ガイド-ドナープラスミドは、伸長により高いコピー数まで蓄積する。ガイド-ドナープラスミド上のラウンド1相同性(r1h)配列の右側には、バーコードガイド1切断部位が存在し、これにより、後のプラスミドの線形化が編集後のプラスミド損失を加速することが可能になる。
【0194】
第2のユニバーサルガイドRNAまたは部位特異的ヌクレアーゼは、バーコード遺伝子座、ならびに/またはバーコード遺伝子座でのガイド-ドナープラスミド(プラスミドの線形化をもたらす)および相同組換えを標的化する。能動的ドナー動員を用いて、または用いずに(LexA-Fkh1またはLexA-FHAによって媒介されるなど)、バーコード遺伝子座でゲノムにバーコードを挿入し、他の場所で定義されたゲノム変化を行う、ガイド-ドナー構築物によって定義されるこの態様は、米国仮出願第62/559,493号(参照によりその全体が本明細書に組み込まれる)に詳述されている。加えてまたはあるいは、バーコード遺伝子座でのバーコードの組み込みは、能動的ドナー動員によって刺激され得る(米国仮出願第62/559,493号を参照されたい)。
【0195】
Cas9の誘導は、プラスミドおよびゲノムバーコード遺伝子座を切断するバーコードガイド1、ならびにゲノムの他の場所での編集ガイド1切断をもたらす。(ステップ2a)バーコードガイド1の切断は、ガイド-ドナープラスミド上および染色体バーコード部位内の両方に存在する5’ユニバーサル左相同性(LH)配列、ならびにラウンド特異的3’相同性を介して、ガイドRNA-bc*-ドナーDNA-bc1カセット全体のゲノム統合をもたらす。(ステップ2b)編集ガイド1切断の後に、ドナーDNAによる相同組換えが続いて、編集#1を生成する。
【0196】
実施例2.再帰的バーコード統合
バーコード化された各ガイド-ドナーは、次のラウンドのために相同性および切断部位と統合する。
図8に示すように、
(1)bc1バリアントを有する株のプールを、bc2でタグ付けされたガイド-ドナープラスミドで形質転換して、第2の多重編集ラウンドを可能にし、bc1とbc2のすべての可能な組み合わせで株のプールを生成する。ラウンド2ガイド-ドナープラスミドのクローニング戦略は次のとおりである。(a)同じユニバーサル左相同性(LH)がバーコードガイド3部位に隣接して、後続の編集ラウンド(ラウンド3)を可能にする、(b)異なる酵母マーカー(LYS2)を構造ガイドRNA挿入物で使用する、(c)ラウンド2相同性(r2h)は、ガイド部位が3’末端に配置されていることを除いて、ラウンド1のガイド-ドナープラスミドに使用されるものと同じである(
図6を参照されたい)、(d)bc2の上流(US)には、ラウンド3統合のための相同性(r3h)の伸長が存在し、バーコード3ガイド部位は、r3hの5’末端にある。
(2)LHおよびr2Hを介した統合の結果として、bc1がbc2と一緒に密接に連結される。このステップでは、bc1によって表される以前のガイド-ドナーカセットは除去される。ラウンド1からの統合された酵母マーカー(URA3)の除去により、ラウンド3でのこのマーカーの再利用が可能になる。
(3)bc1配列およびbc2配列がここで一緒に密接に連結されており、対合末端HTSが株の同定およびプールされた表現型決定の二重バーコードの組み合わせを同定することが可能になる。
(4)(a)編集およびバーコード化のラウンド3は、バーコードガイド4の切断部位を有する同じLH、r4hおよびr3h配列が隣接するbc3配列(各々はそれらに隣接するそれぞれのガイド標的を有する)、ならびにバーコードガイド3発現単位を有する、ガイドドナープラスミドを利用する。酵母の内部マーカーを、ラウンド1のものに交換して戻すことができる。対抗選択可能なマーカーの使用およびガイド-ドナープラスミドの自己破壊により、以前の編集ラウンドからマーカーが削除される。ラウンド1の後、URA3の選択、その後に続く、5-FCによるFCY1の対抗選択は、URA3カセットの統合を保証する。ラウンド2の後、LYS2の選択、その後に続く、5-FOAによるURA3の対抗選択は、LYS2カセットの統合を保証する。ラウンド3の後、URA3の選択、その後に続く、α-アミノアジペートによるLYS2の対抗選択は、URA3カセットの統合を保証する、などである。(b)後続の編集ラウンド(ラウンドn)は、r(n+1)hバーコード統合配列のLHの3’末端および5’末端の(n+1)バーコードガイド部位、r(n)h3’末端の(n)バーコードガイド部位、ならびにプラスミド上の他の場所にある(n)編集ガイドのPol III発現単位を有する、ガイド-ドナーレシピエントベクターを構築することによって可能になる。各右相同配列r(n)hおよびr(n+1)hは、以前に使用された右相同配列と有意な相同性を有してはならない。これらを、G/C/A/T含有量の定義された範囲を有するランダムな50-merを生成し、BLASTを介して酵母ゲノムおよび他の正しい相同性配列との有意な相同性の欠如を確認することによって設計することができる。(n)および(n+1)バーコードガイド部位は、プロトスペーサー隣接モチーフ(PAM)を有するゲノム内の他の部位といかなる有意な相同性も有してはならず、これを、BLAST、またはRNA誘導ヌクレオチド用に調整されたオフターゲットアルゴリズムを介して確認することができる。
【0197】
実施例3.バーコード圧縮
バーコードの圧縮は、コンプレッサーランディングパッドを標的化するガイド構築物、およびコンプレッサーバーコードを含有するPCR産物を用いて達成され得る(
図9および10)。後続の編集ラウンドがより長いバーコードを構築すると、必要な読み取り長が、対合末端配列決定の場合、およそ[(バーコード長)*(バーコード数)+(ホモロジー長)*(バーコードの数-1)]を2で割ったものであるため、バーコードの組み合わせを同定するHTSの実現可能性および実用性は、制限されるようになる。
図9は、次のステップを示す。
(1)任意の数の編集ラウンド(例えば、5回)の後、1
*と呼ばれるガイドを有するプラスミド(
**は、このガイドがバーコード圧縮を可能にすることを示す)を、非常に複雑なバーコード(例えば、N
30)を有するPCRアンプリコンと共に、編集された株のプールに形質転換する。
図2A~2Cに示すように、このアンプリコンを、選択のためのマーカーに連結することもできる。バーコードには、上流圧縮ラウンド1
*相同性(US 1
**)および右相同性(RH)と呼ばれる、ガイド1
*部位でのHDRを可能にする配列が隣接している。さらなる編集およびバーコード化ラウンドを可能にするために、ラウンド6部位を、r6h配列と共にUS 1
*相同性に隣接して配置する。将来のバーコード圧縮ラウンドを可能にするために、ラウンド2
*部位を、USラウンド2
*相同性配列と共にRH相同性に隣接して操作する。バーコードを、増幅のための一定の配列(左上)が隣接する縮重配列の伸長(例えば、N
30)として合成することができる。
(2)バーコード遺伝子座全体のHTSにより、個々のbc1、bc2、bc3、bc4、およびbc5配列を固有のbc1:5圧縮バーコードに連結することが可能になる。その後、これらの株を、bc1:5のみを配列決定することによって表現型決定することができる。
【0198】
バーコードbc1~bc5のbc1:5への圧縮の後に、編集およびバーコード圧縮の反復ラウンドが続くことができる(
図7および8にあるように)。
図10は、バーコード圧縮による高次編集のためのステップを示す。
(1)次のバーコード(bc6)を圧縮バーコード(bc1:5)に隣接して挿入し、ゲノムの他の場所での編集#6を伴う(図示せず)。
(2)ガイド-ドナー-bc6カセットは、すべてのバーコードbc1、bc2、bc3、bc4、およびbc5を、それらの隣接する相同性と共に除去し、bc1:5のみを残す。これにより、バーコード遺伝子座のサイズが拡大するのを防ぎ、以前に使用したガイド1
*~5
*、およびそれらに関連する相同性r1h~r5hの、後続の編集およびバーコード化ラウンドのための再利用を可能にする。
(3)再帰的バーコード化は、
図4Bにあるように再開する。
(4)バーコードbc6~bc10をbc1:5と組み合わせて、bc1:5の右側に部位2
*を標的化する2
*ガイドを用いて、さらに圧縮することができる。PCRアンプリコンは、部位5を部位11に置き換え、部位2
*を3
**部位に置き換えることを除いて、bc1:5バーコードを生成したものと類似している。隣接する相同性US 2
*(第1のバーコード圧縮ラウンドからのDS 1
*に相当)およびバーコード圧縮のラウンド1
**中に配置されたユニバーサル右相同性(RH)配列により、標的化が可能になる。
(5)バーコード遺伝子座全体のHTSにより、個々のbc1:5、bc6、bc7、bc8、bc9、およびbc10配列を単一バーコードbc1:10に連結することが可能になる。その後、これらの株を、bc1:10を配列決定することによって検査することができる。
(6)さらなる編集およびバーコード化ラウンドをガイド11
*で開始し、3
**部位を使用してさらに圧縮して、任意の数のバーコード化編集で生成することができる。
【0199】
バーコードを有することは有利であり得るが、ゲノム統合ガイドと次のラウンドのために入っているガイドとの間の競合があり得、これが編集効率の低下をもたらす可能性があるため、ガイド-ドナー配列は統合しない(
図7および8に最初に示されるように)。さらに、ドナーを統合しないことで、編集のより簡単なWGS検証が可能になり、これは、標的部位でバリアントコールを混乱させるドナーからの読み取りについて懸念する必要がないためである。
【0200】
ガイドまたはドナーを統合することなくバーコードを統合するために、ランディングパッドを、ガイド-ドナー間に存在する挿入物のみを統合するように設計することができる(
図11A~11B)。
図11A~11Bは、ラウンド1バーコードを受け取る前の最初のランディングパッドを示す。左相同性は、任意に長くてもよく、この場合、約1kbのkanR細菌/酵母シャトルマーカーを相同性として使用する。この方法は、異なる選択可能なマーカーの順序で進行することができるため、部位1ガイド切断標的が隣接するマーカーを用いて、様々な開始株を構築することができる。右相同性は、左相同性よりも短く、Lox71部位に隣接しており、これは、リコンビナーゼによるインデックス化および他のCre-Loxを介したバーコード連結アプローチに使用され得る。開始株は、ゲノムまたはプラスミドのいずれかから発現されるトランス作用因子Cas9、TetR、およびLexA-FHAを有することができる。
【0201】
実施例4.ガイド-ドナー統合なしのバーコード統合のためのクローニングバーコード化ガイド-ドナーライブラリ
この設定のさらなる利点は、単一のステップ1ガイド-ドナープラスミドライブラリを使用して、複数のラウンドの挿入物を受け取ることができることである(
図12~14)。これを実現するために、挿入物クローニングステップ中に追加のバーコードを付加し、これを、配列決定ステップによってガイド-ドナーバーコード(bc0)に関連付ける(
図14。バーコードを含有する挿入物の一部のみが下のプラスミド図に示されていることに留意されたい)。
【0202】
このバージョンの方法では、ガイド-ドナーは統合せず、挿入物のみが統合する。クローニングのステップ1でガイド-ドナーに付加された最初のバーコードも統合しないが、ステップ2のクローニングで挿入物バーコードにマッピングされるため重要である。挿入物の統合ガイドは統合することに留意されたい。しかしながら、TetR抑制に供されるため、アンヒドロテトラサイクリン(ATc)がない場合は、入ってくるガイドと競合しない。あるいは、統合ガイドをCas12aなどの別のCRISPRヌクレアーゼと対合させることができる。
【0203】
図13は、各ラウンドのための挿入物を構築するために使用され得るステップを示す。構築されると、これらは、バーコード化されたラウンド特異的な挿入物を生成するためのPCRのテンプレートとして使用される。これらの挿入物を構築するための例示的な戦略を次のとおりである。
ステップ1)ガイド部位を含有するgBlockを骨格にクローニングする。
ステップ2)ラウンドnのための誘導性バーコード統合ガイドをクローニングする。
ステップ3)kanR酵母/細菌シャトルマーカーをクローニングする。これは、内部クローニングの背景を除去し、ユニバーサル左アーム相同性としても機能する。
ステップ4)各ラウンドについて最大3つの異なるマーカークローニングする。例えば、3回の編集ラウンドについて、3つのマーカーを用いて6つの異なる順序で進行することができる。
a)HIS3-LEU2-LYS2
b)HIS3-LYS2-LEU2
c)LEU2-LYS2-HIS3
d)LEU2-HIS3-LYS2
e)LYS2-HIS3-LEU2
e)LYS2-LEU2-HIS3
【0204】
異なるマーカー順序でこの方法を実行することにより、遺伝子相互作用が、操作されたバリアントと各ラウンドでの細胞の特定の栄養要求性との間で生じるかどうかが確認される。
【0205】
図14中、
図13からのラウンド特異的な挿入物テンプレートを、バーコード、短い右相同性(RH)、およびクローニング部位を含有する逆方向プライマーで増幅する。これらを、TypeIIS制限消化後の粘着末端ライゲーションによって、
図12からのステップ1ガイド-ドナーライブラリにクローニングする。挿入物バーコード、ドナー、およびガイド-ドナーバーコードを包含するアンプリコンにより、挿入物バーコード上でのガイド-ドナーバーコードの「マッピング」が可能になる。
【0206】
実施例5.単一バーコード統合のための同時のゲノム編集、ガイド-ドナーバーコード統合、およびプラスミド自己破壊。
バーコードの統合および編集を、誘導可能なCas9を使用して100%まで誘導することができる。WTおよびnej1ΔをGAL-Cas9およびガイド-ドナーカセットで形質転換して、ADE2遺伝子に早期終止コドン(PTC)を導入した。Cas9発現をガラクトースによって誘導し、示された世代でアリコートを採取した。ADE2遺伝子座をNGSによって分析し、WT配列、NHEJインデル、およびドナーDNAによる編集(完全な修復または不完全な修復のいずれか)の割合を計算した(方法を参照されたい)。
図15Aは、重複実験からの各世代における平均パーセンテージを示す。
【0207】
ガイド-ドナーバーコードの統合を、単一のADE2ガイド-ドナープラスミド(
図15B、上)、ならびに100,000個を超えるバーコード化ガイド-ドナープラスミドの複雑なプール(下)の染色体バーコード遺伝子座を標的化する増幅によって分析した。クロップしていないゲル画像は、バーコード遺伝子座に検出可能なNHEJインデル事象がないことを示す。ガイド-ドナープラスミドの自己破壊を、一般的な順方向プライマー、およびガイド-ドナープラスミド特異的プライマー(上のバンド)またはCas9プラスミド特異的プライマー(下のバンド)のいずれかを用いた、3プライマーPCRによって評価した。
【0208】
示された世代のガラクトース誘導の培養物を、富栄養培地(YPD)およびFCY1対抗選択培地(5-FC)上に、1プレート当たり約1000個の細胞の密度において、4連でプレーティングした(
図15C)。プレート上で生き残ったコロニーの割合を示す。すべての実験を、ガイド-ドナープラスミドの独立した形質転換から始まる3つの生物学的複製で繰り返した。
【0209】
実施例6.バーコード連結の原理証明
バーコード連結の原理証明のために、我々は、ラウンド1についてはガイド-ドナー編集ADE2を、次いで、ラウンド2についてはガイド-ドナー編集CAN1を導入した。バーコード連結がバーコード1とは独立して機能することを試験するために、異なるバーコードで2つのラウンド1株を生成し、単一のバーコード化ラウンド2プラスミドを各株に導入した(
図16A)。
図16Bは、再帰的バーコード連結のラウンド1の前(上)、ラウンド1の後(中央)、およびラウンド2の後(下)のバーコード遺伝子座を示す。この原理証明では、ラウンド1ガイド-ドナープラスミドは、ADE2遺伝子を標的化し、ラウンド2ガイド-ドナーは、CAN1遺伝子を標的化する。
【0210】
小分子アンヒドロテトラサイクリン(ATc)でバーコード化ガイドを誘導すると、45bp RH配列での組換えが成功し、バーコードを連結することができることを実証した(
図16C)。強調表示した配列は、バーコードを表す。
【0211】
実施例6.RH長およびRH近位切断部位の存在の関数としてのバーコード化効率の決定
複数の対立する要因が、RH配列の所望の長さに影響を与える。一方で、RH配列は、効率的な相同組換えを促進するのに十分な長さである必要がある。他方では、RHが短いほど、より多くのバーコードを一緒に連結して、所与の長さの読み取りに適合させることができる。さらに、バーコード連結の長さが短いほど、表現型決定プロセス中のPCR組換えは少なくなる。また、RHが逆方向プライマーに含まれている必要があるため、これは、長さに対する追加の実際的な制約である。したがって、我々は、効率的な統合を支持するRHの最小長を見つけようとし、0、20、30、40、50、および60bpを試験した(
図17A)。次いで、これらのプラスミドを、RHに直接隣接する追加の切断部位を含有するように修飾した。これらのプラスミド(ADE2ガイド-ドナーを含有する)を、Cas9/TetR/LexA-FHA発現株に導入し、-LYS-LEU培地内に保存して、早期バーコード統合を選択し、ガイド-ドナープラスミドを維持した。次いで、それらを-LEU+ATc培地に移してバーコード化を誘導し、自動液体ハンドリングシステム(TECAN Evo)を使用して3世代毎にアリコートをサンプリングした。バーコード遺伝子座に隣接するプライマーを使用したPCRは、未修飾遺伝子座(
図17B、下のバンド)の統合されたバーコード(上のバンド)に対する比率を示す。バーコード化された細胞のバーコード化されていない細胞に対する比率は、約9世代後に定常状態に達し、60bpの相同性であっても15世代以降には完了しなかった。
【0212】
驚くべきことに、統合効率は、30bpから20bpのRHに大幅に低下し、20bpのRHは、0bpと同じように機能する。バーコード化のプロセスには、Cas9::ガイド複合体がゲノム統合部位のマーカーに隣接する2つの部位、ならびにガイド-ドナープラスミド上の長い左相同性(LH)の上流で切断することを伴う。我々は、追加の切断部位をRHに直接隣接して導入した場合、短いRH配列がより効率的に認識されると仮定した。注目すべきことに、RH近位切断部位の付加は、バーコード化の動態を大幅に増加させ、わずか3世代後にほぼ完全なバーコード化をもたらしただけでなく、RH長に関係なく同等の効率で20bp RHの非常に効率的な利用をもたらした(
図17C)。これは、バーコード連結単位を30bp(10bpバーコードおよび20bp RH配列)まで小さくすることができ、圧縮ステップが必要とされる前により多くの連結ステップを可能にし、PCR組換えがバリアントカウントで問題を引き起こす可能性を大幅に軽減することを示唆している。これは、ベクターを、ベクターのバーコード化マーカー部分を統合することによって、そのマーカーの選択を必要とする条件下で線形化することができるため、自己破壊/自己統合ベクターの固有の強度を強調する。
【0213】
実施例7.遺伝子ライブラリ全体のバーコード化、および任意の遺伝子座での遺伝子挿入のための経路
図20は、遺伝子ライブラリ全体をバーコード化するための方法、および任意の遺伝子座での遺伝子挿入のための経路を示す。遺伝子バリアントライブラリのバーコード化およびクローニングを、実施例3にあるように実行する。ロングリード技術を使用して、実施例3にあるように、固有のbc1配列を遺伝子配列に関連付けることができる(
図11A~11B)。R1LH
*とR1RH
*の2つの別個の相同性を利用して、任意の遺伝子座での遺伝子バリアントの挿入を可能にする。これらの
*相同性は、遺伝子挿入ガイド1の標的部位に隣接している。bc1およびそれに付随するマーカーは、バーコード遺伝子座で統合する。
【0214】
実施例8同時のバーコード遺伝子座でのバーコード挿入および任意の遺伝子座での遺伝子挿入
図21は、同時のバーコード遺伝子座でのバーコード挿入および任意の遺伝子座での遺伝子挿入を示す。実施例4(
図12)からのバーコード化された遺伝子バリアントプラスミドライブラリを、細胞に形質転換する。遺伝子挿入ガイド1を、バーコードガイド1とは別にまたは同時に誘導する。所望の標的遺伝子座での遺伝子バリアントの挿入、およびバーコード遺伝子座でのbc1の挿入。このプロセスを繰り返すと、
図5A~5Bにあるように、バーコード遺伝子座がバーコード連結、その後に続く、バーコード圧縮およびバーコード遺伝子座収縮を受けることができる一方で、任意の数の遺伝子がゲノムにわたって予め定義された遺伝子座に挿入されることが可能になる。
【0215】
実施例9.生殖系列エディターからの非冗長ヌクレアーゼを使用したバーコード組み込みのための誘導性の自己破壊プラスミド
本実施例は、ゲノムDNAへのドナーDNAの組み込みの各ラウンド後にドナープラスミドを破壊する方法を示す。発現されると、ドナープラスミドの配列は、目的の酵母株のゲノムにすでに組み込まれている生殖系列編集ヌクレアーゼ(例えば、Cas9)とは異なる非冗長ヌクレアーゼを生成する。
図23A~23Cに示すように、ヌクレアーゼCpf1を使用することができる。Cpf1を、
図23Aに示す多重切断部位を標的化するガイドRNA配列と共に、誘導性プロモーター、この場合はGAL7プロモーターの下で発現することができる。ガラクトースの存在下で、
図23Bに示すCpf1-ドナープラスミドを含有する細胞は、Cpf1およびCpf1ガイドRNAを発現する。ゲノムDNAおよびプラスミドDNAの両方が、Cpf1によって多重切断部位で切断される。Cpf1切断によって生成されたドナープラスミド配列を、上流の相同性部位(UH)から始まり、ゲノムDNAに組み込み、この場合、ドナーDNAは、
図23Bに示すように、選択のためのHIS3遺伝子、バーコード配列を含む目的の配列、および下流の相同性部位(DH)を含有する。他の実施形態では、ドナーDNAを、後続のラウンドのためのバーコードおよび位置(例えば、相同性ドメイン)のみを組み込むように制限することができる。
【0216】
図24Aは、ガラクトースの存在下で12世代の増殖後の4つの別々の酵母増殖条件を示す(上から下へ:選択なし(YPD)、プラスミド除去/バーコード化の正の選択(5FC-HIS)、バーコード化(5FOA)、およびバーコード化なし(-URA))。ドナープラスミドの様々な構成を試験した(左から右へ:X1またはX2ガイドRNAを有するRPR1-HHR、X1またはX2ガイドRNAを有するGAL7-HHR、ガイドなし、Gal-SceI、Gal-NLS-SceI-NLS、およびSceIなし。NLS:核局在化シグナル。
【0217】
図24Bは、酵母の第1世代後(ガラクトースへの曝露前)の
図24Aと同様のプラスミド構成を有する、プラスミド除去/バーコード化(5FC-HIS)およびバーコード化なし(-URA)の条件を示し、ドナープラスミドの漏れが最小限であることを実証する。世代毎のドナープラスミドからゲノムDNAへのバーコードの組み込み率を
図24Cに示す。ガラクトースの存在下での6世代の増殖後、X2 Cpf1ガイド配列を含有するドナープラスミドは、50%超交換され(交換%=(5FC-HISコロニー/(5FC-HISコロニー+-URAコロニー))×100%)、一方、X1 Cpf1ガイドを含有するプラスミドの1%未満が交換される。SceIおよびNLS-SceI-NLSを含有するドナープラスミドは、高度に交換される(それぞれ37%および70%)。
【0218】
バーコード統合およびプラスミド破壊を、ポリメラーゼ連鎖反応によって確認した。
【0219】
実施例10.経時的な受動的ドナープラスミド喪失
経時的な受動的ドナープラスミド喪失を
図25に示す。3つの酵母株、yKR4(野生型ura3Δ、陰性対照)、yKR267(URA3およびhphMX主要薬剤耐性マーカーカセットを含むCas9プラスミドを含有する)、ならびにyKR649(URA3およびhphMX DDRMカセットを含むゲノム統合Cas9))を、様々な選択マーカー(-URA、YPD、YPD-HYG、またはハイグロマイシンB、および5-FOA)を用いて24時間増殖させた。大きいコロニーは、正の選択を示し、コロニーが非常に小さいか欠如していることは、様々な増殖培地の負の選択を示す。
【0220】
URA3遺伝子を欠く酵母株WTura3Δは、YPD(陽性対照培地)、5-FOA含有培地上で増殖し、(+)HYG培地(hthMX DDRMカセットの陽性対照)上では増殖しない。酵母株yKR267は、YPD、YPD-HYG、-URA、および5-FOA培地上で増殖し、Cas9含有プラスミドがプラスミドなしの表現型培地(5-FOA)、および陽性プラスミド選択培地(-URA)の両方で保持されていることを示す(したがって、この酵母は反対の選択で増殖する)。したがって、酵母株yKR267は、プラスミドを組み込んだ場合および組み込まない場合で増殖することができる。酵母株yKR649は、YPD、YPD-HYG、および-URA上で増殖するが、5-FOA培地上では増殖しない。したがって、yKR649酵母株は、URA3活性を保持する。
【0221】
実施例11.一過性に発現したSceIを介したドナープラスミド破壊
本実施例では、酵母株yKR649をpKR255プラスミドで形質転換する。さらに、SceIの様々な配列のPCR産物をプラスミドで同時形質転換して、小分子(例えば、ガラクトース)で誘導することなくSceIの発現を一時的に上昇させる。本実施例のSceIの配列は、完全長SceI配列、二重NLS隣接SceI配列、および600bp±二重NLS隣接SceI配列である。
図27に示すように、SceI発現、ならびに多重切断部位でのゲノムおよびプラスミドの切断、ならびにHIS3選択を使用してバーコードを統合するための相同性修復機構を可能にするのに十分な増殖時間で細胞を増殖させた。SceI PCR産物の1:100の希釈を評価し、生成された効率的なドナーDNA組み込みも評価した。
【0222】
実施例12.MARVELプラスミドのインビボ集合との同時編集のための戦略
本実施例では、
図28A~28Cは、MARVELプラスミドのインビボ集合との同時編集のための戦略を提示する。ガイド-ドナーオリゴヌクレオチドを、ドナーに隣接して、bc0とラベル付けされたバーコード配列が付加されたプラスミド骨格にクローニングする。このアプローチは、LexA-FHAによるドナー動員およびレトロンによるssDNAドナー増幅を含む、ドナーDNA強化の複数の方法に適合する。BspQI切断により、MARVELラウンド1挿入物でのクローニングが可能になり、これは、ラウンド1バーコード統合のSCEI部位、および後続のラウンド2バーコード統合を可能にするCREI部位を有する。
図28Bは、ラウンド1プラスミドを最初に酵母または細菌内で解析して、各ガイド-ドナーが完全な配列であり、等しい存在量で存在するライブラリを作成することができることを示す。SCEI部位をインビトロでメガヌクレアーゼSceIによって切断して、線形化ガイド-ドナー骨格のライブラリを作成する。このステップの主な機能は、長い相同性アームを導入することである(片側に約200bpのCYC1t配列、および反対側に約45bpのmsdレトロン配列)。
図28Cは、SceI切断によって生成された線形化骨格が、適切なラウンドのMARVEL挿入物と共に酵母に直接変換され得ることを示す。プラスミドの線形化は、細菌内の追加のステップ2クローニングの必要性を排除するだけでなく、編集効率も高める。酵母は、編集と同時にプラスミドライブラリを集合させ、ドナー-bc0配列を、酵母プールを配列決定することによって新しいバーコード上にマッピングすることができる。ガラクトース誘導は、バーコードを統合し、プラスミドを除去する。奇数ラウンドの選択は5FC-HISで、偶数ラウンドの選択は5FC-LEUで達成される。
【配列表】
【国際調査報告】