(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-08-17
(54)【発明の名称】「CTL-seq」(CRISPR Tag Linear-seq)と称するヌクレアーゼオン/オフターゲット編集位置を指定するための方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20230809BHJP
C12N 15/11 20060101ALI20230809BHJP
C12Q 1/6876 20180101ALN20230809BHJP
C12Q 1/6869 20180101ALN20230809BHJP
【FI】
C12N15/09 110
C12N15/11 Z
C12Q1/6876 Z ZNA
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023504254
(86)(22)【出願日】2021-07-22
(85)【翻訳文提出日】2023-03-01
(86)【国際出願番号】 US2021042733
(87)【国際公開番号】W WO2022020567
(87)【国際公開日】2022-01-27
(32)【優先日】2020-07-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】505092968
【氏名又は名称】インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100196243
【氏名又は名称】運 敬太
(72)【発明者】
【氏名】マクニール,マシュー
(72)【発明者】
【氏名】ターク,ロルフ
(72)【発明者】
【氏名】レティグ,ギャレット
(72)【発明者】
【氏名】ブラック,エレン
(72)【発明者】
【氏名】スン,ヨンミン
(72)【発明者】
【氏名】セーラー,クリス
(72)【発明者】
【氏名】ワン,ユー
(72)【発明者】
【氏名】ガンダーソン,キース
(72)【発明者】
【氏名】キニー,カイル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA11
4B063QQ42
4B063QR08
4B063QR14
4B063QR32
4B063QR62
4B063QR63
4B063QS25
4B063QX02
(57)【要約】
本明細書に記載されるのは、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定するための方法である。
【特許請求の範囲】
【請求項1】
精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定するための方法であって、
(a)ガイド配列RNA(sgRNA)または2部CRISPR RNA:トランス活性化crRNA(crRNA:tracrRNA)二重鎖、1つまたは複数のタグ配列、およびRNAガイドエンドヌクレアーゼを細胞に同時送達するステップと、
(b)二本鎖切断が起こるのに十分な時間、前記細胞をインキュベートするステップと、
(c)前記細胞からゲノムDNAを単離し、前記ゲノムDNAを断片化し、断片化した前記ゲノムDNAを、ユニバーサルアダプター配列を含有する固有の分子インデックスに連結するステップと、
(d)前記タグおよびユニバーサルアダプター配列を標的とするプライマーを使用して、連結した前記DNA断片を増幅して、増幅配列の第1セットを生成するステップと、
(e)Tag-pTOPまたはTag-pBOTプライマーのテールを標的とするユニバーサル配列決定プライマーを使用して増幅配列の前記第1セットを増幅し、増幅配列の第2セットを生成するステップと、
(f)プールした配列を配列決定し、配列決定データを取得するステップと、
(g)オン/オフターゲットCRISPR編集遺伝子座を特定するステップと、
を含む、前記方法。
【請求項2】
前記ユニバーサル配列決定プライマーが、前記Tag-pTOPまたはTag-pBOTプライマーのSP1またはSP2配列(配列番号7、8)テールを標的とし、増幅配列の第2セットを生成する、請求項1に記載の方法。
【請求項3】
前記ユニバーサル配列決定プライマーが、前記Tag-pTOPまたはTag-pBotプライマーの予め設計された非相同配列(配列番号269~273)テールを標的とし、増幅配列の第2セットを生成する、請求項1または2に記載の方法。
【請求項4】
前記ユニバーサル配列決定プライマーが、前記Tag-pTOPまたはTag-pBotプライマーの予め設計された13-merテールを標的とし、増幅配列の第2セットを生成する、請求項1~3のいずれか1項に記載の方法。
【請求項5】
ステップ(g)が、プロセッサで、
(i)前記配列データを参照ゲノムに整列させること、
(ii)オン/オフターゲットCRISPR編集遺伝子座を特定すること、および
(iii)配置、分析、および結果データをカスタム形式のファイル、表、または図として出力することを実行することを含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
ステップ(e)の後に、
(e1)増幅配列の前記第2セットを正規化して、濃度正規化したライブラリーを生成し、前記正規化ライブラリーをその他の試料と共にプールして、プールしたライブラリーを生成するステップをさらに含み、ステップ(f)~(i)を続行する、請求項1~5のいずれか一項に記載の方法。
【請求項7】
ステップ(d)がサプレッションPCR法を使用する、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記RNAガイドエンドヌクレアーゼが、内因的に発現したCas酵素、Cas発現ベクター、Casタンパク質、またはCasRNP複合体を含む、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記RNAガイドエンドヌクレアーゼが、内因的に発現したCas9酵素、Cas9発現ベクター、Cas9タンパク質、またはCas9RNP複合体を含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記細胞がヒトまたはマウスの細胞を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記時間が、約24時間~約96時間である、請求項1~10のいずれか一項に記載の方法。
【請求項12】
複数のタグ配列が同時送達される、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記タグ配列が、52塩基対を含む二本鎖デオキシリボオリゴヌクレオチド(dsDNA)を含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記タグ配列が、5’末端リン酸基、ならびに1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記タグ配列が、配列番号1~2または7~268の相補的な上部および下部鎖対を含む二本鎖DNAを含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
請求項1~15のいずれか一項の方法を使用して特定または指定されたオンおよびオフターゲットCRISPR編集部位。
【請求項17】
52塩基対タグ配列を設計する方法であって、プロセッサで、
(a)GC含量40~90%、最大ホモポリマー長A:2、C:3、G:2、T:2、加重ホモポリマー率<20、自己折りたたみT
m<50°C、および自己二量体T
m<50°Cの13ヌクレオチド配列を無作為に生成するステップと、
(b)特定のゲノムに完全に整列する配列、またはホモポリマーもしくはGGもしくはCCジヌクレオチドモチーフである配列を除去して、13-merのセットを取得するステップと、
(c)1つ以下のCCまたはGGジヌクレオチドモチーフを含有する前記13-mer配列のサブセットを選択するステップと、
(d)前記13-merサブセット配列の4つを繋げて、無作為な52-mer配列を形成するステップと、
(e)無作為な前記52-mer配列をゲノムに整列させるステップと、
(f)前記ゲノムと類似性を有する無作為な前記52-mer配列を除去して、52-mer配列のサブセットを生成するステップと、
(h)52-mer配列の前記サブセットを出力し、相補鎖を生成して、二本鎖の52塩基対タグ配列を生成するステップと、
を実行することを含む、前記方法。
【請求項18】
前記ゲノムがヒトまたはマウスである、請求項17に記載の方法。
【請求項19】
前記52塩基対タグ配列が、前記ゲノムに相補的ではない、請求項17または18に記載の方法。
【請求項20】
前記52塩基対タグ配列のプライマーを設計するステップをさらに含む、請求項17~19のいずれか一項に記載の方法。
【請求項21】
前記52塩基対タグ配列が、5’末端リン酸基、ならびに前記52塩基対タグ配列の1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む、請求項17~20のいずれか一項に記載の方法。
【請求項22】
前記52塩基対タグ配列、前記52塩基対タグ配列の相補体、または前記52塩基対タグ配列のプライマーを含むオリゴヌクレオチドを合成するステップをさらに含む、請求項17~21のいずれか一項に記載の方法。
【請求項23】
請求項17~22に記載の方法を使用して設計された1つまたは複数の52塩基対タグ配列。
【請求項24】
前記52塩基対タグ配列が、配列番号1~2または7~268の前記上部および下部鎖対を含む二本鎖DNAを含む、請求項23に記載の52塩基対タグ配列。
【請求項25】
請求項23に記載の52塩基対タグ配列に部分的に相補的なプライマーおよびアダプタープライマーを設計するための方法であって、プロセッサで、
(a)タグ配列の前記上部および下部鎖に部分的に相補的なタグプライマーを設計するステップと、
(b)前記アダプター配列の上部鎖に部分的に相補的なアダプタープライマーを設計するステップと、
を実行することを含み、
前記タグプライマーが、5’ユニバーサルテール配列を含み、
前記アダプタープライマーが、Tag-pTOPまたはTag-pBOTプライマーのテールに相補的な配列を含む、前記方法。
【請求項26】
前記5’ユニバーサルテール配列が、SP1またはSP2配列(配列番号7、8)、遺伝子座特異的セグメント、3’末端からのリボヌクレオチド(rN)6ヌクレオチド、3’末端ミスマッチ、3’末端ブロック(3’-C
3スペーサー)、予め設計された非相同配列(配列番号269~273)、または予め設計された13-mer配列に相補的である、請求項25に記載の方法。
【請求項27】
前記タグ配列の上部および下部鎖に部分的に相補的な前記プライマーが、前記SP1配列(配列番号7)に相補的なテール配列を含み、前記アダプタープライマーが、前記Tag-pTOPもしくはTag-pBOTプライマーの前記SP2配列(配列番号8)テールに相補的な配列を含むか、または前記タグ配列の上部および下部鎖に部分的に相補的な前記プライマーが、前記SP2配列(配列番号8)に相補的なテール配列を含み、前記アダプタープライマーが、前記Tag-pTOPまたはTag-pBOTプライマーの前記SP1配列(配列番号7)テールに相補的な配列を含む、請求項25または26に記載の方法。
【請求項28】
タグ配列の前記上部および下部鎖に相補的な前記プライマーならびに前記アダプター配列の前記上部鎖に相補的なプライマーを用いた核酸分子の増幅が、前記タグ配列の一部、sgDNA配列、および前記アダプター配列を含むPCR産物を生成する、請求項25~27のいずれか一項に記載の方法。
【請求項29】
前記フォワードおよびリバースタグプライマーならびに前記アダプタープライマーの配列を含むオリゴヌクレオチドを合成するステップをさらに含む、請求項25~28のいずれか一項に記載の方法。
【請求項30】
前記52塩基対タグ配列および前記52塩基対タグ配列に部分的に相補的なプライマーが設計され、前記プライマーが部分的に相補的である可能性が高いかどうか、プライマー二量体を形成する傾向があるかどうかを予測するアルゴリズムを使用して選択される、請求項17~21および25~29のいずれか一項に記載の方法。
【請求項31】
請求項22~25で記載した方法を使用して設計された前記52塩基対タグ配列に部分的に相補的な1つまたは複数のプライマーおよび1つまたは複数のアダプタープライマー。
【請求項32】
前記プライマーが、配列番号3、4の配列および前記アダプタープライマーを含み、前記アダプタープライマーが、配列番号5の配列を含む、請求項31に記載のプライマー。
【請求項33】
オンおよびオフターゲットCRISPR編集部位を特定するための、1つまたは複数の二本鎖52塩基対タグ配列の使用。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年7月23日に出願された米国仮特許出願第63/055,460号に対する優先権を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
配列表の参照
本出願は、米国特許法施行規則第1.821条(c)に従って、配列表のコンピュータ可読形式と共に出願される。EFSによって提出されたテキストファイル、「013670-9056-WO01_sequence_listing_19-JUL-2021_ST25.txt」は273配列を含有しており、2021年7月19日に作成され、153キロバイトのファイルサイズであり、その全体が参照により本明細書に組み込まれる。
【0003】
技術分野
本明細書に記載されるのは、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定するための方法である。
【背景技術】
【0004】
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)は、遺伝暗号への変化の簡単な導入を可能にすることによってゲノミクスに革命をもたらした。Cas9およびCas12aタンパク質などのCRISPR系は、Casタンパク質が結合したRNAオリゴヌクレオチド配列(リボヌクレオタンパク質;RNPを形成する)によって標的に誘導され、そこで酵素がDNA配列に二本鎖切断(DSB)を生成する。天然の細胞機構は、一般的に非相同末端結合(NHEJ)または相同組換え修復(HDR)分子経路を使用してDSBを修復する。オンおよびオフターゲットの位置で生じるNHEJを介して修復されたDNAは、インデル(挿入/削除)を含有していることが多く、これは突然変異を引き起こし、コードされる遺伝子の機能を変化させることがある。したがって、これらの位置を特定することは、生物学的表現型に対するオンおよびオフターゲット編集の影響を解析するために重要である。
【0005】
現在のところ、CRISPRまたはその他のヌクレアーゼのオフターゲット編集位置を特定または指定するための「絶対的基準」となる方法は存在していない。多くの方法が開発されている。これらの方法は、DSBで組み立てられた内因性修復機構の検出(Discover-Seq[1])、宿主細胞ゲノムへのDNAタグ配列の組み込み(GUIDE-Seq;米国特許第9,822,407号を参照のこと)、iGUIDE[2、3])、またはin vitroでのDNAの切断(BLISS[4]、CIRCLE-Seq[5]、SiteSeq[6])を含む様々な戦略を使用する。
【0006】
細胞または細胞ベース(in vivoと称することもある)および生化学的(in vitroと称することもある)オフターゲットアッセイの指定系には、それぞれ利点がある。DNAに結合したタンパク質およびエピジェネティックマークは、ヌクレアーゼ活性の機能を変更するので、細胞または細胞ベースの方法が実際の編集標的をより良好に特定できることが示唆されている[7]。しかし、生化学的方法は、細胞または細胞ベースの方法では特定されない部位を指定するので、生化学的方法がより包括的であり得ることが示唆されている[5、6]。それにも関わらず、これらの現在のツールは、感度が不完全な傾向がある[5、6](
図1を参照のこと)。
【0007】
必要とされているのは、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を検出および指定するための方法である。
【発明の概要】
【0008】
本明細書で記載した一実施形態は、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定するための方法であって、(a)ガイド配列RNA(sgRNA)または2部CRISPR RNA:トランス活性化crRNA(crRNA:tracrRNA)二重鎖、1つまたは複数のタグ配列、およびRNAガイドエンドヌクレアーゼを細胞に同時送達するステップと、(b)二本鎖切断が起こるのに十分な時間、細胞をインキュベートするステップと、(c)細胞からゲノムDNAを単離し、ゲノムDNAを断片化し、断片化したゲノムDNAを、ユニバーサルアダプター配列を含有する固有の分子インデックスに連結するステップと、(d)タグおよびユニバーサルアダプター配列を標的とするプライマーを使用して、連結したDNA断片を増幅して、増幅配列の第1セットを生成するステップと、(e)Tag-pTOPまたはTag-pBOTプライマーのテールを標的とするユニバーサル配列決定プライマーを使用して、増幅された配列の第1セットを増幅し、増幅配列の第2セットを生成するステップと、(f)プールした配列を配列決定し、配列決定データを取得するステップと、(g)オン/オフターゲットCRISPR編集遺伝子座を特定するステップとを含む方法である。一態様では、ユニバーサル配列決定プライマーは、Tag-pTOPまたはTag-pBOTプライマーのSP1またはSP2配列(配列番号7、8)テールを標的とし、増幅配列の第2セットを生成する。別の態様では、ユニバーサル配列決定プライマーは、Tag-pTOPまたはTag-pBotプライマーの予め設計された非相同配列(配列番号269~273)テールを標的とし、増幅配列の第2セットを生成する。別の態様では、ユニバーサル配列決定プライマーは、Tag-pTOPまたはTag-pBotプライマーの予め設計された13-merテールを標的とし、増幅配列の第2セットを生成する。別の態様では、ステップ(g)は、プロセッサで、(i)配列データを参照ゲノムに整列させること、(ii)オン/オフターゲットCRISPR編集遺伝子座を特定すること、(iii)配置、分析、および結果データをカスタム形式のファイル、表、または図として出力することを実行することを含む。別の態様では、この方法は、ステップ(e)の後に、(e1)増幅配列の第2セットを正規化して、濃度正規化したライブラリーを生成し、正規化したライブラリーをその他の試料と共にプールして、プールしたライブラリーを生成するステップをさらに含み、ステップ(f)~(i)を続行する。別の態様では、ステップ(d)はサプレッションPCR法を使用する。別の態様では、RNAガイドエンドヌクレアーゼは、内因的に発現したCas酵素、Cas発現ベクター、Casタンパク質、またはCasRNP複合体を含む。別の態様では、RNAガイドエンドヌクレアーゼは、内因的に発現したCas9酵素、Cas9発現ベクター、Cas9タンパク質、またはCas9RNP複合体を含む。別の態様では、細胞はヒトまたはマウス細胞を含む。別の態様では、時間は約24時間~約96時間である。別の態様では、複数のタグ配列が同時送達される。別の態様では、タグ配列は、52塩基対を含む二本鎖デオキシリボオリゴヌクレオチド(dsDNA)を含む。別の態様では、タグ配列は5’末端リン酸基、ならびに1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む。別の態様では、タグ配列は、配列番号1~2または7~268の相補的な上部および下部鎖対を含む二本鎖DNAを含む。
【0009】
本明細書で記載した他の実施形態は、本明細書で記載した方法を使用して特定または指定されたオンおよびオフターゲットCRISPR編集部位である。
【0010】
本明細書で記載した別の実施形態は、52塩基対タグ配列を設計するための方法であって、プロセッサで、(a)GC含量40~90%、最大ホモポリマー長A:2、C:3、G:2、T:2、加重ホモポリマー率<20、自己折りたたみTm<50°C、および自己二量体Tm<50°Cの13ヌクレオチド配列を無作為に生成するステップと、(b)特定のゲノムに完全に整列する配列、またはホモポリマーもしくはGGもしくはCCジヌクレオチドモチーフである配列を除去して、13-merのセットを取得するステップと、(c)1つ以下のCCまたはGGジヌクレオチドモチーフを含有する13-mer配列のサブセットを選択するステップと、(d)13-merサブセット配列の4つを繋げて、無作為な52-mer配列を形成するステップと、(e)無作為な52-mer配列をゲノムに整列させるステップと、(f)ゲノムと類似性を有する無作為な52-mer配列を除去して、52-mer配列のサブセットを生成するステップと、(h)52-mer配列のサブセットを出力し、相補鎖を生成して、二本鎖の52塩基対タグ配列を生成するステップとを実行することを含む方法である。一態様では、ゲノムはヒトまたはマウスである。別の態様では、52塩基対タグ配列は、ゲノムに相補的ではない。別の態様では、この方法は、52塩基対タグ配列のためのプライマーを設計するステップをさらに含む。別の態様では、52塩基対タグ配列は5’末端リン酸基、ならびに52塩基対タグ配列の1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む。別の態様では、この方法は、52塩基対タグ配列、52塩基対タグ配列の相補体、または52塩基対タグ配列のためのプライマーを含むオリゴヌクレオチドを合成するステップをさらに含む。
【0011】
本明細書で記載した他の実施形態は、本明細書で記載した方法を使用して設計された1つまたは複数の52塩基対タグ配列である。一態様では、52塩基対タグ配列は、配列番号1~2または7~268の上部および下部鎖対を含む二本鎖DNAを含む。
【0012】
本明細書で記載した別の実施形態は、請求項23に記載の52塩基対タグ配列に部分的に相補的なプライマーおよびアダプタープライマーを設計するための方法であって、プロセッサで、(a)タグ配列の上部および下部鎖に部分的に相補的なタグプライマーを設計するステップと、(b)アダプター配列の上部鎖に部分的に相補的なアダプタープライマーを設計するステップとを実行することを含み、タグプライマーが、5’ユニバーサルテール配列を含み、アダプタープライマーが、Tag-pTOPまたはTag-pBOTプライマーのテールに相補的な配列を含む方法である。一態様では、5’ユニバーサルテール配列は、SP1またはSP2配列(配列番号7、8)、遺伝子座特異的セグメント、3’末端からのリボヌクレオチド(rN)6ヌクレオチド、3’末端ミスマッチ、3’末端ブロック(3’-C3スペーサー)、予め設計された非相同配列(配列番号269~273)、または予め設計された13-mer配列に相補的である。別の態様では、タグ配列の上部および下部鎖に部分的に相補的なプライマーは、SP1配列(配列番号7)に相補的なテール配列を含み、アダプタープライマーは、Tag-pTOPもしくはTag-pBOTプライマーのSP2配列(配列番号8)テールに相補的な配列を含むか、またはタグ配列の上部および下部鎖に部分的に相補的なプライマーは、SP2配列(配列番号8)に相補的なテール配列を含み、アダプタープライマーは、Tag-pTOPまたはTag-pBOTプライマーのSP1配列(配列番号7)テールに相補的な配列を含む。別の態様では、タグ配列の上部および下部鎖に相補的なプライマーならびにアダプター配列の上部鎖に相補的なプライマーを用いた核酸分子の増幅は、タグ配列の一部、sgDNA配列、およびアダプター配列を含むPCR産物を生成する。別の態様では、この方法は、フォワードおよびリバースタグプライマーならびにアダプタープライマーの配列を含むオリゴヌクレオチドを合成するステップをさらに含む。別の態様では、52塩基対タグ配列および52塩基対タグ配列に部分的に相補的なプライマーが設計され、プライマーが部分的に相補的である可能性が高いかどうか、プライマー二量体を形成する傾向があるかどうかを予測するアルゴリズムを使用して選択される。
【0013】
本明細書で記載した他の実施形態は、本明細書で記載した方法を使用して設計された52塩基対タグ配列に部分的に相補的な1つまたは複数のプライマーおよび1つまたは複数のアダプタープライマーである。一態様では、プライマーは、配列番号3、4の配列およびアダプタープライマーを含み、アダプタープライマーは、配列番号5の配列を含む。
【0014】
本明細書で記載した別の実施形態は、オンおよびオフターゲットCRISPR編集部位を特定するための、1つまたは複数の二本鎖52塩基対タグ配列の使用である。
【図面の簡単な説明】
【0015】
【
図1】3つの生物学的複製物に共通のリードの割合を白い領域で示し、一方、2つの複製物に共通であるか、または1つの複製物に存在するリードを黒い領域で示す図である。表1は、4つの異なるgRNAのGUIDE-seq[3]に基づいた指定を96ウェル形式で3連で示す。gRNA複合体は、等モル量のAlt-R crRNA-XTとAlt-R tracrRNAとを混合することによって生成された。Nucleofector(商標)システム(Lonza)を使用して、Cas9を安定に発現するHEK293細胞にgRNA10μMおよびdsODN GUIDE-seqタグ0.5μMをトランスフェクトした。72時間後、ゲノムDNA(gDNA)を単離した。ゲノムDNAを断片化し、LotusDNAライブラリー調製キット(IDT)を使用してアダプターを連結した。ライブラリーは、挿入したタグから連結したアダプターまでの増幅によって生成された[3]。次に、ライブラリーをIllumina(登録商標)プラットフォームでペアエンド方式で配列決定した。
【
図2】GUIDE-Seqが、rhAmpSeq標的化増幅によって検証できるよりも多くのオフターゲット位置を見つけることを示す図である。提示された結果は、WT Cas9を安定に発現するHEK293細胞にgRNA配列(内部名:AR、CTNNB1、EMX1、GRHPR、HPRT38087、HPRT38285、VEGFA)を送達する場合の331個のGUIDE-Seq指定部位の集合体である。各ガイドは参照ゲノム全体が整列した1つのrhAmpSeqパネルによって設計され、標的化されたので、GUIDE-seqは、参照ゲノムに整列したリード全体の≧0.1%に割り当てられたオフターゲットを指定した。その後の実験では、gRNAが再び同じ細胞に送達され、編集がrhAmpSeqでアッセイされた。処置された状態で、≧1%で未処置対照試料以上のインデルが観察された場合、標的は「編集済み」と呼ばれた。
【
図3】GUIDE-Seqタグの組み込み率が変化することを例示する図である。図は、RAG1、RAG2、およびEMX1遺伝子を標的とするガイド配列のGUIDE-Seq指定オン/オフターゲット遺伝子座を標的とするrhAmpSeqパネルにおけるInDel編集を有する118個の固有のCas9オン/オフターゲット部位のタグ組み込みのパーセンテージ(編集%に正規化)を示す。各ガイドは、34塩基対のGUIDE-Seq、dsODNタグと共に、Cas9を安定に発現するHEK293細胞にヌクレオフェクションによって同時送達された。72時間後にDNAを抽出し、rhAmpSeqマルチプレックスPCRで増幅し、Illumina(登録商標)MiSeqで配列決定し、カスタムパイプラインによって分析した。正規化されたタグ組み込み率は、タグ配列を含有する各標的で配列決定されたリードを参照ゲノムとは異なる対立遺伝子を含有するリード全体で除したパーセンテージとして計算される(Cas9編集を示す)。
【
図4】異質な配列タグに対するrhAmpSeqプライマーの設計を示す図である。イラストは、rhAmpSeq設計パイプラインを使用した設計工程のステップを示しており、上部(1)および下部(2)鎖に対するフォワードプライマーの設計、不要なプライマーの破棄、および5’重複を有するが、3’重複配列を有さず、したがって、上部/下部鎖プライマー二量体がヘアピンになるタグ標的プライマーの選択(3)を含む。
【
図5】重複するプライマー設計を構築するために使用したrhAmpSeq設計パイプラインの概要を示す図である。パイプラインでは、公知の配列が各タグ配列の5’末端および3’末端に追加され、入力は品質管理され、アッセイ(
図4Aに示す)は各タグの上部および下部鎖に対して設計される。各タグ鎖を標的とするプライマーは、同じタグを標的とするプライマー間でRNAヌクレオチドの3’の少なくとも4ヌクレオチドが重複しないように対になっており、プライマー対はランク付けされて選択される。hg38およびmm38の頭字語は、それぞれヒトおよびマウスのゲノムの種類を表す。
【
図6】重複するプライマーがPCRアンプリコンを生成する場合のヘアピン形成を示す図である。この図は、PCR産物の3’および5’末端に相補的な5’プライマーテール末端を有する重複プライマー領域からの望ましくない短いアンプリコンの代表的な標的配列およびヘアピンPCR産物を示す。
【
図7】明示された単一タグ(配列番号9~40)または表5に記載したタグのプール(配列番号9~40、45~268)が組み込まれた標的部位の数(黒い棒)を示す図である。縞模様の棒(CTLmax)は、単一タグ(配列番号9~40)の組合せを使用した場合に理論的に見つけることができる標的部位の最大数を示す(最大32部位のうち23部位)。プールA1は単一タグ全て(配列番号9~40)を含有する。プールB1~6はそれぞれ異なる16個のタグ(配列番号45~268)を含有する。プールC1は試験したタグ全て(配列番号9~40、45~268)を含有する。組み込み現象は、社内のデータ分析ツールを使用して判定した。
【
図8】明示された単一タグ(配列番号9~40)または表5に記載したタグのプール(配列番号9~40、45~268)が組み込まれた標的部位の数(黒い棒)を示す図である。縞模様の棒(CTLmax)は、単一タグ(配列番号9~40)の組合せを使用した場合に理論的に見つけることができる標的部位の最大数を示す(最大53部位のうち47部位)。プールA1は単一タグ全て(配列番号9~40)を含有する。プールB1~6はそれぞれ異なる16個のタグ(配列番号45~268)を含有する。プールC1は試験したタグ全て(配列番号9~40、45~268)を含有する。組み込み現象は、社内のデータ分析ツールを使用して判定した。
【発明を実施するための形態】
【0016】
本明細書に記載されるのは、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を検出および指定するための方法である。細胞内状態の情報は、従来のin vivo指定方法に基づいて構築することによって維持される。固有の予め定義された配列タグのセットを同時送達することによって、感度が増大する。一態様では、予め定義された固有タグのセットの同時送達は、13~80塩基対の範囲であってもよい。別の態様では、同時送達された予め定義されたタグのセットは、13塩基対タグ配列タグ、26塩基対タグ配列タグ、39塩基対タグ配列タグ、52塩基対タグ配列タグ、65塩基対タグ配列タグ、または78塩基対タグ配列タグから構成されていてもよい。別の態様では、固有の予め定義されたタグは、52塩基対タグ配列タグのセットである(配列タグの長さが増加すると、rhPrimerが良好なプライマー着地部位を見つける能力が向上する)。この制限は、ヒトおよびマウスのゲノムとは異なる多様なタグ配列を使用することによって軽減されると考えられる。RNAaseH2(パイロコッカス アビシ(Pyrococcus abyssi))を使用して標的に正確にアニーリングしたプライマーのブロックを解除するIntegrated DNA Technologies(IDT)のrhAmp技術を構築することによって特異性が向上し、これによって偽プライミングの発生率が低くなる。5’末端に予想されるタグ配列を含有するリードを使用して標的を指定することだけで、特異性はさらに高まり得る。この方法にサプレッションPCRを組み込むことで、使い安くなる。従来のin vivo法(例えば、GUIDE-seqおよびiGUIDE)は、タグの上部および下部鎖にアニーリングして伸長することによって増幅するために、並列PCR反応(2プール増幅)を必要とする。ここでは、サプレッションPCRを使用して、問題のある二量体配列を引き起こすことなく、両方のプールを同時に増幅することができる。
【0017】
GUIDE-Seq dsDNAタグは、ヌクレオフェクションを使用して、Cas9を構成的に発現するHEK293細胞に、1つのガイドRNAと共に同時送達された。このような教示については、本明細書に参照として組み込まれた米国特許第9,822,407号を参照のこと。4つの異なるガイドRNA全てをこの様式で試験した。細胞内で、発現したCas9とガイドRNAとの間でリボ核タンパク質複合体(RNP)が形成し、二本鎖切断を導入する。修復された切断部分は、同時送達されたタグを含有することができる。送達後、細胞をインキュベートして、得られたDNAを抽出した。標的増幅は、GUIDE-Seqプロトコルに従って実施され、GUIDE-Seq分析パイプライン(github.com/aryeelab/guideseq)の修正版でアッセイされた。指定された標的を、3つの生物学的複製物(固有のガイドRNA+タグの同時送達)間で比較した。指定した標的全てが生物学的複製全てに共通しているわけではない(共通/指定した標的全体:それぞれ7/31、6/19、2/4、3/5、表1を参照のこと)。しかし、任意の標的に起因する全リードの90%超は、共通の標的に起因していた(平均、
図1を参照のこと)。
【0018】
【0019】
【0020】
さらに、指定された標的は、直交法を使用して複製したり検出したりできないことがある。GUIDE-Seq法を使用して、GUIDE-SeqDNAタグは、ヌクレオフェクションを使用して、Cas9を構成的に発現するHEK293細胞に6つのガイドそれぞれと共に同時送達された(各タグは1つのガイドRNAと共に送達される)。rhAmpSeqマルチプレックスアンプリコンパネルは、指定された標的を増幅するように設計されており、本発明者らは生物学的複製物における編集を定量化した。GUIDE-Seqによって指定された331の標的のうち、rhAmpSeqで検証できたのは41(12%)だけであった(
図2を参照のこと)。
【0021】
NHEJ修復で使用される、安定的に発現するCRISPR細胞株にガイドRNAと共に同時送達されたdsDNAタグ配列は、様々な割合で組み込まれる。ここで、GUIDE-Seq dsDNAタグは、Cas9を構成的に発現するHEK293細胞に、6つのガイドそれぞれと共に同時送達された。別の態様では、NHEJ修復で使用されるCRISPR RNPと共に同時送達されたdsDNAタグ配列は、様々な割合で組み込まれる。ここで、GUIDE-Seq dsDNAタグは、Cas9を構成的に発現するHEK293細胞に、6つのガイドそれぞれと共に同時送達された。rhAmpSeqパネルは指定された標的を増幅するために開発され、生物学的複製物において、カスタム分析パイプラインを使用してタグ組み込み率が分析された。これらの結果は、標的に応じて、編集されたゲノムコピーの0~85%でタグが組み込まれることを示す(
図3を参照のこと)。いかなる理論にも拘束されないが、この率は配列の状況によって変化すると仮定される。
【0022】
本明細書に記載されるのは、Integrated DNA TechnologyのrhAmpSeq(商標)技術、サプレッションPCR、および宿主ゲノム内のヌクレアーゼのオフターゲット編集位置を指定する新しい異質なDNA配列設計を組み合わせることによって、シグナル対ノイズ比を向上する方法である。
【0023】
この方法では、Cas9、sgRNAまたは2部CRISPR RNA:トランス活性化crRNA(crRNA:tracrRNA)二重鎖、および1つまたは複数の二本鎖DNA(dsDNA)タグ配列が細胞に送達される。複数のタグを同時送達すると、オフターゲット部位でのタグ統合を向上することができる(以下を参照のこと)。タグ配列は、宿主ゲノムとは著しく異なる(すなわち、異質な)配列内容を有する。ヌクレアーゼがDSBを導入した後、NHEJ修復がタグ配列を標的部位に挿入し、公知のプライマー着地部位を形成する。細胞が、DSBを修復し、おそらくさらに分裂する時間を経た後(72時間後など)、ゲノムDNAが単離され、断片化され(例えば、Covaris(登録商標)せん断、酵素ベースのせん断、Tn5など)、固有の分子指数(UMI)を含有するユニバーサルアダプター配列が断片化されたDNAに連結され、連結されていない物質が除去される。次に、プライマーをタグおよびユニバーサルアダプター配列に標的化することによって、DNA断片が増幅される(1回目PCR)。ユニバーサルプライマーを使用して、試料指数(PCR2)が追加され、増幅された物質は濃度正規化され、他の試料と共にプールされ、プールされた物質をIllumina(登録商標)(または同様の)機器で配列決定される。配列決定されたリードは参照ゲノムに整列され、多数のリードがマップした遺伝子座は、オン/オフターゲット位置を指定することができる。
【0024】
異質な配列は、40~90%のGC含有量、最大ホモポリマー長A:2、C:3、G:2、T:2、加重ホモポリマー率<20、自己折りたたみTm<50°C、および自己二量体Tm<50°Cを有する無作為な13-mer配列>1Mを生成することによって設計された。配列のリストから、ヒト(GRCh38.p2;hg38)もしくはマウス(GRCh38.p4;mm38)参照ゲノムに対して完全に整列した配列、または厄介なモチーフ配列(ホモポリマー、ほとんどのGGもしくはCCジヌクレオチドモチーフ)を有した配列が除去され、479配列が得られた。
【0025】
本明細書で記載した52塩基対タグ配列を設計するために、CまたはGジヌクレオチド≦1を含有する49個の13-merオリゴ配列を選択し、4つの13-mer配列の10,000個の固有の組合せを生成した。連結した各配列の長さ(例えば、ソフトウェアを使用して4つの13-mer配列を一列にして貼り付ける)は、52ヌクレオチドである。次に、各52ヌクレオチドタグ配列を、bwa-psmと呼ばれるbwaの内部修正版を使用して、ヒト(GRCh38.p2)およびマウス(GRChm38.p4)ゲノムに対して整列させた。bwa-psmの実行は、定義された閾値までの全ての可能な二次的な一致を返す。ヒトまたはマウスのゲノムと類似性がない、群として機能することを意図した一連のタグ配列(配列番号1~2)が設計された(最大シードサイズ:7、シード編集距離:2、最大編集距離:21、最大ギャップオープン:2、最大ギャップ伸長:3、ミスマッチペナルティ:1、ギャップオープンペナルティ:1、ギャップ伸長ペナルティ:1)。
【0026】
重複するrhAmpSeqV1プライマー(配列番号3~4)は、タグの上部および下部鎖、ならびにアダプター配列(配列番号6)の5’末端に相補的に設計された(
図4)。タグ特異的プライマー(配列番号3~4)は、SP1およびSP2プライマー配列(配列番号7~8)に一致する5’ユニバーサルテール配列、遺伝子座特異的セグメント、3’末端からのリボヌクレオチド(rN)6ヌクレオチド、3’末端ミスマッチ、ならびに3’末端ブロック(3’-C
3スペーサー)を含有する。アダプター特異的プライマー(配列番号5)は、5’-P5アダプター配列(配列番号6)の5’末端を標的とし、アダプター配列は固有分子指数(UMI)配列を含有する(表2)。プライマーは、このようなアニーリングされたタグのプラスおよびマイナス鎖を標的とするように設計されており、これらのプライマーが予想外に二量体を形成する場合、形成された産物がヘアピンを形成し、利用可能な反応鋳型からオリゴを除去する(例えば、サプレッションPCR)(
図6A~B)。タグを標的とするプライマー配列は、IDT(公開UIを備えたアルゴリズムの内部コピー:www.idtdna.com/site/account?ReturnURL=/site/order/designtool/index/RHAMPSEQ)によって設計および実行された独自の設計アルゴリズムに基づいて選択され、目的の鋳型配列を増幅するのに最適に実施されるプライマーペアを選択する(
図5)。プライマー配列は、他の全タグ配列ならびにヒトおよびマウスの一次ゲノムアセンブリの両方への非特異的結合について評価したところ、ユニバーサルアダプター配列およびヒトまたはマウスのゲノムDNAの存在を組み合わせた場合に、オフターゲットアンプリコンを形成する可能性が低いことが確認された。
【0027】
プライマーは、1つのタグ特異的プライマー(上部または下部鎖)がアダプター特異的プライマー(配列番号5)と対になる対で機能することが望ましかった。これによって、サプレッションPCR法を使用して増幅すると、タグ、gDNA、およびアダプター配列の一部を含有する分子の増幅が引き起こされる(
図4)。
【0028】
【0029】
本明細書で記載した一実施形態は、精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定するための方法であって、(a)ガイド配列RNA(sgRNA)または2部CRISPR RNA:トランス活性化crRNA(crRNA:tracrRNA)二重鎖および1つまたは複数のタグ配列を細胞に同時送達するステップと、(b)一定時間細胞をインキュベートするステップと、(c)細胞からゲノムDNAを単離し、ゲノムDNAを断片化し、断片化したゲノムDNAを、ユニバーサルアダプター配列を含有する固有の分子インデックスに連結するステップと、(d)タグおよびユニバーサルアダプター配列を標的とするプライマーを使用して、連結したDNA断片を増幅して、増幅配列の第1セットを生成するステップと、(e)Tag-pTOPまたはTag-pBOTプライマーのテールを標的とするユニバーサル配列決定プライマーを使用して増幅配列の第1セットを増幅し、増幅配列の第2セットを生成するステップと、(f)プールした配列を配列決定し、配列決定データを取得するステップと、(g)オン/オフターゲットCRISPR編集遺伝子座を特定するステップとを含む方法である。一実施形態では、ユニバーサル配列決定プライマーは、Tag-pTOPまたはTag-pBOTプライマーのSP1またはSP2配列(配列番号7、8)テールを標的とし、増幅配列の第2のセットを生成する。別の実施形態では、ユニバーサル配列決定プライマーは、Tag-pTOPまたはTag-pBotの予め設計された非相同配列(表6、配列番号269~273)テールを標的とし、増幅配列の第2セットを生成する。さらに別の実施形態では、ユニバーサルプライマーは、Tag-pTOPまたはTag-pBotプライマーの予め設計された13-merテールを標的とし、増幅配列の第2セットを生成する。一実施形態では、ステップ(g)は、プロセッサで、(i)配列データを参照ゲノムに整列させること、(ii)オン/オフターゲットCRISPR編集遺伝子座を特定すること、および(iii)配置、分析、および結果データを表または図として出力することを実行することを含む。別の実施形態では、この方法は、ステップ(e)の後に、(e1)増幅配列の第2セットを正規化して、濃度正規化したライブラリーを生成し、正規化したライブラリーをその他の試料と共にプールして、プールしたライブラリーを生成するステップをさらに含み、ステップ(f)~(i)を続行する。一態様では、ステップ(d)はサプレッションPCR法を使用する。別の態様では、細胞はCas酵素を構成的に発現するか、Cas発現ベクターを同時送達されるか、Casタンパク質を同時送達されるか、またはCasRNP複合体を同時送達される。別の態様では、細胞はCas9酵素を構成的に発現するか、Cas9発現ベクターを同時送達されるか、Cas9タンパク質を同時送達されるか、またはCas9RNP複合体を同時送達される。別の態様では、細胞はヒトまたはマウス細胞を含む。別の態様では、時間は約24時間~約96時間である。別の態様では、複数のタグ配列が同時送達される。別の態様では、タグ配列は、52塩基対を含む二本鎖デオキシリボオリゴヌクレオチド(dsDNA)を含む。別の態様では、タグ配列は5’末端リン酸基、ならびに1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む。別の態様では、タグ配列は、配列番号9~40または45~268の上部および下部鎖対を含む二本鎖DNAを含む。
【0030】
本明細書で記載した別の実施形態は、本明細書で記載した方法を使用して特定または指定されたオンおよびオフターゲットCRISPR編集部位である。
【0031】
本明細書で記載した別の実施形態は、52塩基対タグ配列を設計する方法であって、プロセッサで、(a)GC含量40~90%、最大ホモポリマー長A:2、C:3、G:2、T:2、加重ホモポリマー率<20、自己折りたたみTm<50°C、および自己二量体Tm<50°Cの13ヌクレオチド配列を無作為に生成するステップと、(b)特定のゲノムに完全に整列する配列、またはホモポリマーもしくはGGもしくはCCジヌクレオチドモチーフである配列を除去し、13-merのセットを取得するステップと、(c)1つ以下のCCまたはGGジヌクレオチドモチーフを含有する13-mer配列のサブセットを選択するステップと、(d)13-merサブセット配列の4つを繋げて、無作為な52-mer配列を形成するステップと、(e)無作為な52-mer配列をゲノムに整列させるステップと、(f)ゲノムと類似性を有する無作為な52-mer配列を除去して、52-mer配列のサブセットを生成するステップと、(h)52-mer配列のサブセットを出力し、相補鎖を生成して、二本鎖の52塩基対タグ配列を生成するステップとを実行することを含む方法である。一態様では、ゲノムはヒトまたはマウスである。一態様では、52塩基対タグ配列は、ゲノムに相補的ではない。別の態様では、この方法は、52塩基対タグ配列のためのプライマーを設計するステップをさらに含む。別の態様では、52塩基対タグ配列は5’末端リン酸基、ならびに52塩基対タグ配列の1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む。別の態様では、この方法は、52塩基対タグ配列、52塩基対タグ配列の相補体、または52塩基対タグ配列のためのプライマーを含むオリゴヌクレオチドを合成するステップをさらに含む。
【0032】
本明細書で記載した別の実施形態は、本明細書で記載した方法を使用して設計された1つまたは複数の52塩基対タグ配列である。一態様では、52塩基対タグ配列は、配列番号9~40または45~268の相補的上部および下部鎖対を含む二本鎖DNAを含む。
【0033】
本明細書で記載した別の実施形態は、本明細書で記載した52塩基対タグ配列に部分的に相補的なプライマーおよびアダプタープライマーを設計するための方法であって、プロセッサで、(a)タグ配列の上部および下部鎖に部分的に相補的なプライマーを設計するステップと、(b)アダプター配列の上部鎖に部分的に相補的なアダプタープライマーを設計するステップとを実行することを含み、タグプライマーが、SP1またはSP2配列(配列番号7、8)に相補的な5’ユニバーサルテール配列、遺伝子座特異的セグメント、3’末端のリボヌクレオチド(rN)6ヌクレオチド、3’末端ミスマッチ、および3’末端ブロック(3’-C3スペーサー)を含み、アダプタープライマーが、SP1またはSP2配列(配列番号7、8)に相補的な配列を含む方法である。一態様では、タグ配列の上部および下部鎖に部分的に相補的なプライマーは、SP1配列に相補的な配列を含み、アダプタープライマーは、SP2配列に相補的な配列を含むか、またはタグ配列の上部および下部鎖に部分的に相補的なプライマーは、SP2配列に相補的な配列を含み、アダプタープライマーは、SP1配列に相補的な配列を含む。別の態様では、タグ配列の上部および下部鎖に相補的なプライマーならびにアダプター配列の上部鎖に相補的なプライマーを用いた核酸分子の増幅は、タグ配列の一部、sgDNA配列、およびアダプター配列を含むPCR産物を生成する。別の態様では、この方法は、フォワードおよびリバースタグプライマーならびにアダプタープライマーの配列を含むオリゴヌクレオチドを合成するステップをさらに含む。
【0034】
本明細書で記載した別の実施形態では、52塩基対タグ配列および52塩基対タグ配列に部分的に相補的なプライマーが設計され、プライマーが部分的に相補的である可能性が高いかどうか、プライマー二量体を形成する傾向があるかどうかを予測するアルゴリズムを使用して選択される。
【0035】
本明細書で記載した別の実施形態は、本明細書で記載した方法を使用して設計された52塩基対タグ配列に部分的に相補的な1つまたは複数のプライマーおよび1つまたは複数のアダプタープライマーである。一態様では、52塩基対タグ配列に部分的に相補的なプライマーは、配列番号3、4の配列を含み、アダプタープライマーは、配列番号5の配列を含む。
【0036】
本明細書で記載した別の実施形態は、オンおよびオフターゲットCRISPR編集部位を特定するための1つまたは複数の二本鎖52塩基対タグ配列の使用である。
【0037】
本明細書で記載した組成物、製剤、方法、工程、および用途に対して、それらの任意の実施形態または態様の範囲から逸脱することなく、適切に改変および適応を行うことができることは、当業者には明らかであろう。提供した組成物および方法は例示的なものであり、特定の実施形態のいずれかの範囲を限定することを意図するものではない。本明細書で開示した様々な実施形態、態様、および選択肢は全て、任意の変形または反復で組み合わせることができる。本明細書で記載した方法および工程の範囲は、本明細書で記載した実施形態、態様、選択肢、実施例、選択の実際の、または可能な組合せ全てを含む。本明細書で記載した方法は、任意の構成要素またはステップを省略するか、本明細書で開示した任意の構成要素またはステップを置換するか、または本明細書の他の場所で開示した任意の構成要素またはステップを含むことができる。実施形態は、様々なハードウェア、ソフトウェア、および電子構成要素の組合せを含み、そうでなければそれらによって実行され得ることも理解されたい。例えば、様々な言語のソフトウェアと同様に、様々なマイクロプロセッサおよび特定用途向け集積回路(「ASIC」)を利用することができる。また、サーバーおよび様々な計算機器を使用することができ、1つまたは複数の処理ユニット、1つまたは複数のコンピュータ可読媒体、1つまたは複数の入力/出力インターフェイス、および構成要素を接続する様々な接続(例えば、システムバス)を含むことができる。参照により組み込まれる特許または出版物のいずれかの用語の意味が、本開示で使用した用語の意味と矛盾する場合、本開示の用語または語句の意味が支配的である。さらに、本明細書は単に例示的な実施形態を開示および説明するものである。本明細書で引用した特許および出版物は全て、その特定の教示について参照により本明細書に組み込まれる。
【0038】
本明細書で記載した本発明の様々な実施形態および態様は、以下の項によって要約される:
【0039】
項1.精度および感度が向上したオンおよびオフターゲットCRISPR編集部位を同定および指定する方法であって、
(a)ガイド配列RNA(sgRNA)または2部CRISPR RNA:トランス活性化crRNA(crRNA:tracrRNA)二重鎖、1つまたは複数のタグ配列、およびRNAガイドエンドヌクレアーゼを細胞に同時送達するステップと、
(b)二本鎖切断が起こるのに十分な時間、細胞をインキュベートするステップと、
(c)細胞からゲノムDNAを単離し、ゲノムDNAを断片化し、断片化したゲノムDNAを、ユニバーサルアダプター配列を含有する固有の分子インデックスに連結するステップと、
(d)タグおよびユニバーサルアダプター配列を標的とするプライマーを使用して、連結したDNA断片を増幅して、増幅配列の第1セットを生成するステップと、
(e)Tag-pTOPまたはTag-pBOTプライマーのテールを標的とするユニバーサル配列決定プライマーを使用して増幅配列の第1セットを増幅し、増幅配列の第2セットを生成するステップと、
(f)プールした配列を配列決定し、配列決定データを取得するステップと、
(g)オン/オフターゲットCRISPR編集遺伝子座を特定するステップとを含む方法。
項2.ユニバーサル配列決定プライマーが、Tag-pTOPまたはTag-pBOTプライマーのSP1またはSP2配列(配列番号7、8)テールを標的とし、増幅配列の第2セットを生成する、項1に記載の方法。
項3.ユニバーサル配列決定プライマーが、Tag-pTOPまたはTag-pBotプライマーの予め設計された非相同配列(配列番号269~273)テールを標的とし、増幅配列の第2セットを生成する、項1または2に記載の方法。
項4.ユニバーサル配列決定プライマーが、Tag-pTOPまたはTag-pBotプライマーの予め設計された13-merテールを標的とし、増幅配列の第2セットを生成する、項1~3のいずれか一項に記載の方法。
項5.ステップ(g)が、プロセッサで、
項6.配列データを参照ゲノムに整列させること、
(a)(ii)オン/オフターゲットCRISPR編集遺伝子座を特定すること、および
(b)(iii)配置、分析、および結果データをカスタム形式のファイル、表、または図として出力することを実行することを含む、項1~4のいずれか一項に記載の方法。
項7.ステップ(e)の後に、
(a)(e1)増幅配列の第2セットを指定して、濃度正規化したライブラリーを生成するステップと、正規化したライブラリーをその他の試料と共にプールして、プールしたライブラリーを生成するステップとをさらに含み、ステップ(f)~(i)を続行する、項1~5のいずれか一項に記載の方法。
項8.ステップ(d)がサプレッションPCR法を使用する、項1~6のいずれか一項に記載の方法。
項9.RNAガイドエンドヌクレアーゼが、内因的に発現したCas酵素、Cas発現ベクター、Casタンパク質、またはCasRNP複合体を含む、項1~7のいずれか一項に記載の方法。
項10.RNAガイドエンドヌクレアーゼが、内因的に発現したCas9酵素、Cas9発現ベクター、Cas9タンパク質、またはCas9RNP複合体を含む、項1~8のいずれか一項に記載の方法。
項11.細胞がヒトまたはマウスの細胞を含む、項1~9のいずれか一項に記載の方法。
項12.時間が、約24時間~約96時間である、項1~10のいずれか一項に記載の方法。
項13.複数のタグ配列が同時送達される、項1~11のいずれか一項に記載の方法。
項14.タグ配列が、52塩基対を含む二本鎖デオキシリボオリゴヌクレオチド(dsDNA)を含む、項1~12のいずれか一項に記載の方法。
項15.タグ配列が、5’末端リン酸基、ならびに1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む、項1~13のいずれか一項に記載の方法。
項16.タグ配列が、配列番号1~2または7~268の相補的な上部および下部鎖対を含む二本鎖DNAを含む、項1~14のいずれか一項に記載の方法。
項17.項1~15のいずれか一項の方法を使用して特定または指定されたオンおよびオフターゲットCRSPR編集部位。
【0040】
項18.52塩基対タグ配列を設計する方法であって、プロセッサで、
(a)GC含量40~90%、最大ホモポリマー長A:2、C:3、G:2、T:2、加重ホモポリマー率<20、自己折りたたみTm<50°C、および自己二量体Tm<50°Cの13ヌクレオチド配列を無作為に生成するステップと、
(b)特定のゲノムに完全に一致する配列、またはホモポリマーもしくはGGもしくはCCジヌクレオチドモチーフである配列を除去し、13-merのセットを取得するステップと、
(c)1つ以下のCCまたはGGジヌクレオチドモチーフを含有する13-mer配列のサブセットを選択するステップと、
(d)13-merサブセット配列の4つを繋げて、無作為な52-mer配列を形成するステップと、
(e)無作為な52-mer配列をゲノムに整列させるステップと、
(f)ゲノムと類似性を有する無作為な52-mer配列を除去して、52-mer配列のサブセットを生成するステップと、
(g)52-mer配列のサブセットを出力し、相補鎖を生成して、二本鎖52塩基対タグ配列を生成するステップとを実行することを含む方法。
項19.ゲノムがヒトまたはマウスである、項17に記載の方法。
項20.52塩基対タグ配列が、ゲノムに相補的ではない、項17または18に記載の方法。
項21.52塩基対タグ配列のプライマーを設計するステップをさらに含む、項17~19のいずれか一項に記載の方法。
項22.52塩基対タグ配列が、5’末端リン酸基、ならびに52塩基対タグ配列の1番目と2番目、2番目と3番目、50番目と51番目、および51番目と52番目のヌクレオチドの間にホスホロチオエート結合を含む、項17~20のいずれか一項に記載の方法。
項23.52塩基対タグ配列、52塩基対タグ配列の相補体、または52塩基対タグ配列のプライマーを含むオリゴヌクレオチドを合成するステップをさらに含む、項17~21のいずれか一項に記載の方法。
項24.項17~22の方法を使用して設計された1つまたは複数の52塩基対タグ配列。
項25.52塩基対タグ配列が、配列番号1~2または7~268の上部および下部鎖対を含む二本鎖DNAを含む、項23に記載の52塩基対タグ配列。
【0041】
項26.項23に記載の52塩基対タグ配列に部分的に相補的なプライマーおよびアダプタープライマーを設計するための方法であって、プロセッサで、
(a)タグ配列の上部および下部鎖に部分的に相補的なタグプライマーを設計するステップと、
(b)アダプター配列の上部鎖に部分的に相補的なアダプタープライマーを設計するステップとを実行することを含み、
(c)ここで、
(d)タグプライマーが、5’ユニバーサルテール配列を含み、
(e)アダプタープライマーが、Tag-pTOPまたはTag-pBOTプライマーのテールに相補的な配列を含む方法。
項27.5’ユニバーサルテール配列が、SP1またはSP2配列(配列番号7、8)、遺伝子座特異的セグメント、3’末端からのリボヌクレオチド(rN)6ヌクレオチド、3’末端ミスマッチ、3’末端ブロック(3’-C3スペーサー)、予め設計された非相同配列(配列番号269~273)、または予め設計された13-mer配列に相補的である、項25に記載の方法。
項28.タグ配列の上部および下部鎖に部分的に相補的なプライマーが、SP1配列(配列番号7)に相補的なテール配列を含み、アダプタープライマーが、Tag-pTOPもしくはTag-pBOTプライマーのSP2配列(配列番号8)テールに相補的な配列を含むか、またはタグ配列の上部および下部鎖に部分的に相補的なプライマーが、SP2配列(配列番号8)に相補的なテール配列を含み、アダプタープライマーが、Tag-pTOPまたはTag-pBOTプライマーのSP1配列(配列番号7)テールに相補的な配列を含む、項25または26に記載の方法。
項29.タグ配列の上部および下部鎖に相補的なプライマーならびにアダプター配列の上部鎖に相補的なプライマーを用いた核酸分子の増幅が、タグ配列の一部、sgDNA配列、およびアダプター配列を含むPCR産物を生成する、項25~27のいずれか一項に記載の方法。
項30.フォワードおよびリバースタグプライマーならびにアダプタープライマーの配列を含むオリゴヌクレオチドを合成するステップをさらに含む、項25~28のいずれか一項に記載の方法。
項31.52塩基対タグ配列および52塩基対タグ配列に部分的に相補的なプライマーが設計され、プライマーが部分的に相補的である可能性が高いかどうか、プライマー二量体を形成する傾向があるかどうかを予測するアルゴリズムを使用して選択される、項17~21および25~29のいずれか一項に記載の方法。
【0042】
項32.項22~25で記載した方法を使用して設計された52塩基対タグ配列に部分的に相補的な1つまたは複数のプライマーおよび1つまたは複数のアダプタープライマー。
項33.プライマーが、配列番号3、4の配列およびアダプタープライマーを含み、アダプタープライマーが、配列番号5の配列を含む、項32に記載のプライマー。
項34.オンおよびオフターゲットCRISPR編集部位を特定するための1つまたは複数の二本鎖52塩基対タグ配列の使用。
【0043】
参考文献
1.Wienert et al., “Unbiased detection of CRISPR off-targets in vivo using DISCOVER-seq,” Science 364(6437): 286-289 (2019).
2.Nobles et al., “IGUIDE: An improved pipeline for analyzing CRISPR cleavage specificity,” Genome Biol. 20(14): 4-9 (2019).
3.Tsai et al., “GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases,” Nature Biotechnol. 33(2): 187-197 (2015).
4.Yan et al., “BLISS is a versatile and quantitative method for genome-wide profiling of DNA double-strand breaks,” Nature Commun. 8: 15058 (2017).
5.Tsai et al., “CIRCLE-seq: a highly sensitive in vitro screen for genome-wide CRISPR-Cas9 nuclease off-targets,” Nature Methods 14(6): 607-614 (2017).
6.Cameron et al., “Mapping the genomic landscape of CRISPR-Cas9 cleavage,” Nature Methods 14(6): 600-606 (2017).
7.Char and Moosburner, “Unraveling CRISPR-Cas9 genome engineering parameters via a library- on-library approach,” Nature Methods 12(9): 823-826 (2015).
8.Rand et al., “Headloop suppression PCR and its application to selective amplification of methylated DNA sequences,” Nucleic Acids Res. 33(14): e127 (2005).
【実施例】
【0044】
実施例1
この実験は、52塩基対の長さの二本鎖DNAタグおよび様々な遺伝子配列を使用すると、タグの組み込みの効率が増加することを示す。使用した配列を表3~5に示す。二本鎖タグは、上部鎖および相補的な下部鎖のハイブリダイゼーションによって生成された(表3~4;配列番号9~40または45~268)。Cas9を構成的に発現するHEK293細胞に、EMX1遺伝子座を標的とするガイドRNAと一緒に、16個の異なるタグ設計を別々に導入した。あるいは、Cas9を構成的に発現するHEK293細胞に、EMX1遺伝子座を標的とするガイドRNAと一緒に、16個のタグのプールまたは112タグの1プールのいずれかを導入した。ガイドRNAは10μMの濃度でエレクトロポレーションされたが、単一タグまたはプールされたタグは最終濃度0.5μMで送達された。タグの組み込みレベルは、rhAmpSeqプライマー(配列番号3~4)を使用した標的化増幅によって判定され、EMX1ガイドRNAの公知のオンおよびオフターゲット部位を濃縮した。EMX1のrhAmpSeqプールは、経験的に決定されたオンおよびオフターゲット遺伝子座を表す32部位で構成されている。増幅された産物はIllumina(登録商標)MiSeqで配列決定され、タグの組み込みレベルはカスタムソフトウェアを使用して判定された。この実施例は、タグの組み込み効率が、最大32部位のうち6(CTL021)から13(CTL169、CTL079、CTL002)部位の範囲で、単一タグ構築物間で個々に異なり、したがって配列に依存することを示す(単一タグ、
図7)。単一タグの結果を数学的に結合することによって、23部位の仮想数が計算された(CTLmax、
図7)。タグのプールを組み合わせるとタグ組み込みの可能性が高まるという仮説が試験され、実証された(プールされたタグ、表、
図7)。プールA1は、単一タグ(表5を参照)で表されたタグで構成され、最大32部位のうち21のタグ組み込み現象が検出され、単一タグのいずれかによって実現されたものより高いことが実証された。同様に、プールB3は、最大32部位のうち21部位でタグの組み込みを示した。再度、プール間の変動性が示され(プールされたタグ、
図7)、タグ設計の最適化が潜在的にタグ組み込みを最大化できることを示唆している。
【0045】
【0046】
【0047】
実施例2
この実験は、52塩基対の長さの二本鎖DNAタグおよび様々な遺伝子配列を使用すると、タグ組み込みの効率が増加することを実証している。使用した配列を表3~5に示す。二本鎖タグは、上部鎖および相補的な下部鎖(配列番号9~40または45~268)のハイブリダイゼーションによって生成された。Cas9を構成的に発現するHEK293細胞に、AR遺伝子座を標的とするガイドRNAと一緒に、16個の異なるタグ設計を別々に導入した。あるいは、Cas9を構成的に発現するHEK293細胞に、AR遺伝子座を標的とするガイドRNAと一緒に、16タグのプールまたは112タグの1プールのいずれかを導入した。ガイドRNAは10μMの濃度でエレクトロポレーションされたが、単一タグまたはプールされたタグは最終濃度0.5μMで送達された。タグの組み込みレベルは、rhAmpSeqプライマー(配列番号3~4)を使用した標的化増幅によって判定され、ARガイドRNAの公知のオンおよびオフターゲット部位を濃縮した。ARのrhAmpSeqプールは、経験的に決定されたオンおよびオフのターゲット遺伝子座を表す53部位で構成されている。増幅された産物はIllumina(登録商標)MiSeqで配列決定され、タグの組み込みレベルはカスタムソフトウェアを使用して判定された。この実施例は、タグの組み込み効率が、最大53部位のうち35(CTL085、CTL134)から41(CTL002)部位の範囲で、単一タグ構築物間で個々に異なり、したがって配列に依存することを示す(単一タグ、表5、
図8)。
【0048】
単一タグの結果を数学的に結合することによって、47部位の仮想数が計算された(CTLmax、
図8)。タグのプールを組み合わせるとタグ組み込みの可能性が高まるという仮説が試験され、実証された(プールされたタグ、表5、
図8)。プールB4(表5を参照のこと)は、最大53部位のうち44のタグ組み込み現象が検出され、単一タグのいずれかによって実現されたものより高いことを実証した。再度、プール間の変動性が示され(プールされたタグ、表5、
図8)、タグ設計の最適化が潜在的にタグ組み込みを最大化できることを示唆している。
【0049】
【0050】
【0051】
【0052】
【0053】
【0054】
【0055】
【0056】
【0057】
【0058】
【0059】
【配列表】
【国際調査報告】