IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コーニンクレッカ ネーデルランセ アカデミエ ファン ベーテンシャッペンの特許一覧

特表2024-540407細胞内のタンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーを検出するための方法及びキット
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-31
(54)【発明の名称】細胞内のタンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーを検出するための方法及びキット
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20241024BHJP
   C12Q 1/6844 20180101ALI20241024BHJP
   C12Q 1/6804 20180101ALI20241024BHJP
   C12Q 1/34 20060101ALI20241024BHJP
   C12Q 1/37 20060101ALI20241024BHJP
   C12Q 1/48 20060101ALI20241024BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6844 Z
C12Q1/6804 Z
C12Q1/34
C12Q1/37
C12Q1/48
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024527128
(86)(22)【出願日】2022-11-09
(85)【翻訳文提出日】2024-06-25
(86)【国際出願番号】 NL2022050635
(87)【国際公開番号】W WO2023085928
(87)【国際公開日】2023-05-19
(31)【優先権主張番号】2029695
(32)【優先日】2021-11-09
(33)【優先権主張国・地域又は機関】NL
(81)【指定国・地域】
(71)【出願人】
【識別番号】524170201
【氏名又は名称】コーニンクレッカ ネーデルランセ アカデミエ ファン ベーテンシャッペン
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(74)【代理人】
【識別番号】100196977
【弁理士】
【氏名又は名称】上原 路子
(72)【発明者】
【氏名】ヨプ ハイコ キント
(72)【発明者】
【氏名】シルケ ヨハンナ アンナ ロッハス
(72)【発明者】
【氏名】ロビン ハルム ビレム エリック ファン デア ワイデ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ42
4B063QR08
4B063QR14
4B063QR16
4B063QR42
4B063QR48
4B063QR62
4B063QS24
4B063QS33
4B063QX01
(57)【要約】
DNAを配列決定する方法であって、ここで、単離された細胞核を含む試料を、第1DNAアダプターと共有結合体を形成する抗体に接触させ、及びここで、形成された抗体-DNA結合体は目的のタンパク質に結合し、かつ脱リン酸化されたDNA断片の末端に連結することができ、及びここで、次に前記試料を、抗体-DNA結合体の第1DNAアダプターに粘着する第2DNAアダプターと接触させて、増幅された生成物の配列決定を可能にする第2DNAアダプター-第1DNAアダプター-DNA断片生成物を得る方法。
【特許請求の範囲】
【請求項1】
以下の工程を含む、DNAの配列を決定する方法:
(a)DNAを含む1つ又はそれ以上の透過処理及び固定された細胞核を含む試料を提供する工程;
(b)(i)DNAを第1の制限エンドヌクレアーゼで消化してDNA断片を提供し、DNA断片の5’末端を脱リン酸化して脱リン酸化DNA断片を提供し;
(ii)工程i)の前、最中、又は後に、DNAを含む1つ又はそれ以上の細胞核に
(1)1つ又はそれ以上の第1抗体-DNAアダプター結合体を、及び/又は
(2)1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体(前記第1抗体は、DNAと相互作用すると疑われる目的のタンパク質に向けられている)を、接触させることにより、DNAを含む前記1つ又はそれ以上の細胞核を処理する工程であって、
ここで、前記第1抗体-DNAアダプター結合体は、第1DNAアダプター部分に結合した第1抗体部分を含み、
及びここで、状況(1)において、前記第1抗体部分は、DNAと相互作用すると疑われる目的のタンパク質に向けられ、及びここで、状況(2)において、前記第1抗体部分は第1抗体に向けられ、
及びここで、前記第1DNAアダプター部分の末端は、工程(i)で定義される脱リン酸化DNA断片の末端に対して粘着性であるか又は粘着性にされ、
及びここで、前記第1DNAアダプター部分は、第2制限エンドヌクレアーゼのための第2制限部位を含み、
及び、好ましくは、ここで、第1DNAアダプター部分は第1バーコード配列を含み、ここで、前記第1バーコード配列は、工程(i)で定義された前記脱リン酸化DNA断片の末端に対して粘着性である前記第1DNAアダプター部分の末端と、第2制限部位との間に位置し、
ここで、前記接触は、(1)前記第1抗体-DNAアダプター結合体の抗体部分、又は(2)前記第1抗体-DNAアダプター結合体の抗体と抗体部分とが、その標的と結合することを可能にする条件下で行われて、前記目的のタンパク質に結合した第1抗体-DNAアダプター結合体を提供し、
(iii)前記第1抗体-DNAアダプター結合体の第1DNAアダプター部分が、脱リン酸化されたDNA断片の末端に連結することを可能にして、第1DNAアダプターDNA断片生成物を得る、工程、
(c)(i)好ましくは、酵素がプロテイナーゼKを含むタンパク質分解酵素処理を行うことにより、及び/又は熱処理によりタンパク質を分解し、及び核を溶解し、そして
(ii)(i)の前又は後に、試料中のDNAを第2制限エンドヌクレアーゼで処理し、それにより前記第1DNAアダプター部分に含まれる第2制限部位に切断を導入することにより、工程(b)の後に得られた試料を処理する、工程、
(d)工程(c)の後に得られた試料を第2DNAアダプターとともにインキュベートする工程であって、
ここで、工程(c)(ii)の前記第1DNAアダプターの第2制限部位に作成された末端に対して、前記第2DNAアダプターの末端は粘着性であり、好ましくは、前記粘着末端は5’末端リン酸基を有し、
及びここで、前記第2DNAアダプターは、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列を含み、及び好ましくは第2バーコード配列をさらに含み、好ましくはここで、第前記2バーコード配列は、前記RNAポリメラーゼ結合配列及び/又はDNAプライマー配列と、工程(c)(ii)において前記第1DNAアダプターの第2制限部位に作成された末端に対して粘着性の末端との間に配置され、
ここで、前記接触は、前記第2DNAアダプターが、工程(c)(ii)において前記第1DNAアダプター部分の第2制限部位に作成された末端に連結することを可能にする条件下で行われて、第2DNAアダプター第1DNAアダプター-DNA断片生成物が得られる、工程、
(e)前記第2DNAアダプター-第1DNAアダプター-DNA断片生成物を増幅し、得られた増幅生成物を配列決定する工程。
【請求項2】
工程(a)の前記1つ又はそれ以上の核が以下である、請求項1に記載の方法:
- 1つの細胞核である;
- 10、20、100、又は1000個を超える細胞核を含む;
- 動物由来であり、好ましくはげっ歯類又は哺乳類由来であり、好ましくはヒト由来である;
- 単一のタイプの生物、又は単一の生物、好ましくは一人のヒトから得られる;
- 疾患組織から得られる;
- 細胞に含まれている;及び/又は
- 1つタイプの細胞由来であるか、又は異なるタイプの細胞由来である。
【請求項3】
前記第1制限エンドヌクレアーゼが以下である、請求項1~2のいずれかに記載の方法:
- 平滑末端を作成するか、オーバーハングのある端を作成する;
- 4~8塩基対の長さ、好ましくは4塩基対の長さの認識部位を認識し、好ましくは前記第1制限エンドヌクレアーゼが、MseI、MboI、DpnII、及びNlaIIIからなる群から選択される;及び/又は
- 平均して100~10,000塩基対ごとにDNAを切断する制限エンドヌクレアーゼである。
【請求項4】
請求項1~3のいずれかに記載の方法であって、状況(1)では、前記抗体-DNAアダプター結合体の前記抗体部分が、及び状況(2)では、前記抗体が、DNAに結合することが知られているタンパク質か、又はDNAに結合することが疑われるタンパク質に向けられ、好ましくは、ここで前記タンパク質が、ヒストン、ヒストン修飾を有するヒストン(好ましくは、前記修飾はメチル化、リン酸化、アセチル化、ユビキチン化、及びSUMO化からなる群から選択される1つ又はそれ以上である)、DNAポリメラーゼ、RNAポリメラーゼ、転写因子、ヌクレアーゼ、高移動度群タンパク質、ヌクレオソームリモデラー、核構造タンパク質、DNA損傷修復タンパク質、ヒストン修飾酵素、クロマチン複合体の成分、クロマチン構造タンパク質、及びヒストンシャペロンからなる群から選択される、方法。
【請求項5】
前記第1抗体-DNAアダプター結合体の第1DNAアダプター部分が、
- 50~150塩基対の長さを有する;
- 第1バーコード配列を含み、ここで好ましくは、前記第1のバーコード配列は、前記抗体-DNAアダプター結合体の抗体部分を特異的に識別している;及び/又は
- 前記第1抗体-DNAアダプター結合体の抗体部分がその標的に結合できるようになる前又はなった後に、工程(b)(i)で作成された脱リン酸化DNA断片の末端に対して粘着性にされる、請求項1~4のいずれかに記載の方法。
【請求項6】
前記第1DNAアダプター部分が脱リン酸化DNA断片の末端に連結することを可能にする条件がDNAリガーゼの使用を含む、請求項1~5のいずれかに記載の方法。
【請求項7】
工程(c)の処理が1つ又はそれ以上のプロテアーゼで処理することを含み、好ましくはここで、前記プロテアーゼがプロテイナーゼKであり、及び/又はここで、タンパク質を分解することが熱処理を含み、好ましくはここで、前記熱処理が50~70℃の温度である、請求項1~6のいずれかに記載の方法。
【請求項8】
前記第2制限エンドヌクレアーゼが、
- 平滑末端を作成するか、又はオーバーハングのある末端を作成する;
- 少なくとも4~8塩基対の長さ、好ましくは6~8塩基対の長さ、さらにより好ましくは8塩基対以上の長さの認識部位を認識する;
- NotI及びSfiIからなる群から選択され;
- 平均して20,000~2,000,000塩基対ごとにDNAを切断する制限エンドヌクレアーゼである;及び/又は
- 前記第1制限エンドヌクレアーゼによって作成される末端とは異なる末端を作成する、請求項1~7のいずれかに記載の方法。
【請求項9】
前記第2DNAアダプターが、
- 線状であり、好ましくは50~100塩基対の長さを有する;
- T7-RNAポリメラーゼ結合配列及びT3-RNAポリメラーゼ結合配列から選択されるRNAポリメラーゼ結合配列を含む;
- 試料を特異的に識別する前記第2バーコード配列を含む;及び/又は
- 好ましくはP5アダプター配列(Illumina)、P7アダプター配列(Illumina)から選択される、1つ又はそれ以上のさらなるアダプター配列を含む、請求項1~8のいずれかに記載の方法。
【請求項10】
工程(d)において、前記第2DNAアダプターが前記第1DNAアダプターの第2制限部位に作成された末端に連結することを可能にする条件が、DNAリガーゼの使用を含む、請求項1~9のいずれか1項に記載の方法。
【請求項11】
請求項1~10のいずれかに記載の方法であって、ここで:
- 2つ以上の第1制限エンドヌクレアーゼが使用される;
- 2つ以上の第1抗体-DNAアダプター結合体が使用され、ここで、前記抗体、又は前記抗体が向けられるタンパク質、第1DNAアダプター部分、第1バーコード配列、又はそれらの任意の組み合わせが、同じであっても異なっていてもよい;
- 2つ以上の第2制限エンドヌクレアーゼが使用される;及び/又は
- 2つ以上の第2DNAアダプターが使用され、ここで、前記第1DNAアダプターの第2制限部位に作成された末端、第2バーコード、RNAポリメラーゼ結合配列、又は1つ又はそれ以上のさらなるアダプタ配列、あるいはそれらの任意の組み合わせに対して粘着性である第2DNAアダプターの末端が同じであっても異なっていてもよい、方法。
【請求項12】
前記第2DNAアダプタ-第1DNAアダプタ-DNA断片生成物の増幅が線形増幅によって行われる、請求項1~11のいずれかに記載の方法。
【請求項13】
工程(b)の前、工程(b)の一部として、又は工程(c)の前に、核が分類されて、分類された試料当たり1つ又はそれ以上の、好ましくは1つの核を含む分類された試料が提供され、好ましくはここで、工程(c)の後、工程(d)の後、又は工程(e)の前に、分類された試料の1つ又はそれ以上がプールされる、請求項1~12のいずれかに記載の方法。
【請求項14】
請求項1~13のいずれかに記載の方法の使用であって、
ゲノム全体のタンパク質-DNA相互作用プロファイル、ゲノム全体のエピジェネティックプロファイルを生成するための、
細胞タイプ特異的なエピジェネティック及び/又はタンパク質-DNA相互作用プロファイルを比較するための、又は
異なる発生段階の胚間の、エピジェネティック及び/又はタンパク質-DNA相互作用プロファイルを比較するための、
異なる治療計画後、異なる遺伝子座でのタンパク質-DNA相互作用の分析後の、異なる疾患段階の腫瘍形成におけるエピジェネティック及び/又はタンパク質-DNA相互作用プロファイルを比較するための、
得られた1つ又はそれ以上の試料間のタンパク質-DNA相互作用を比較するための、
疾患組織と健康な組織間の又は生物の異なる部分間のタンパク質-DNA相互作用を比較するための、使用。
【請求項15】
請求項1~14のいずれかで定義された第1抗体-DNAアダプター結合体と、請求項1~14のいずれかで定義された対応する第2DNAアダプターとを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には、1つ又はそれ以上の細胞のDNAを配列決定する方法に関する。より具体的には、この方法は、細胞内のタンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーの検出に使用することができる。この方法により、細胞のエピジェネティックシグネチャーの識別と定量、疾患関連バイオマーカーの識別と定量、被験体の疾患の診断、及びエピジェネティックシグネチャーを修飾する可能性のある物質のスクリーニングが可能になる。本発明はさらに、本発明の方法におけるキット及びその使用に関する。
【背景技術】
【0002】
背景の説明には、本発明を理解するのに有用な可能性のある情報が含まれている。これは、ここで提供される情報のいずれかが先行技術であると、現在請求されている発明に関連していると、又は具体的若しくは暗黙的に参照されている刊行物が先行技術であると、認めるものではない。
【0003】
細胞の複雑な生物学的システムを理解することは、癌などの遺伝子活性に関連する病理を理解する上で非常に重要である。このような病理では、病理が単一細胞又は少数の細胞で発生し、急速に周囲の組織に広がることは珍しくない。細胞のエピジェネティックシグネチャーを識別及び定量化することで、細胞のアイデンティティと、細胞の複雑な生物学的システムにおける組み合わせ事象に関する詳細な洞察が得られ、その結果、遺伝子調節応答をより深く理解し、細胞運命の選択を支配するメカニズムを解明できるようになる。
【0004】
エピジェネティックプロファイルのプロファイリングを可能にする当技術分野の方法が記載されているが、多くの場合、これらの方法の設計は、同じ細胞内の複数のシグネチャー又はマークのプロファイリングを強化しないか、限られた範囲でしか強化しない。さらに、クロマチン免疫切断配列決定(ChIC配列決定)やクロマチン免疫沈降配列決定(ChIP配列決定)などの細胞のヒストン翻訳後修飾シグネチャーの定量を可能にする方法は、単一の様式のみの測定に制限されている(Ku, Wai Lim et al. Nat. Meth. vol. 16,4 (2019): 323-325.; Park, P. Nat Rev Genet 10, 669-680 (2009))。
【0005】
現在、細胞内のヒストン翻訳後修飾、調節タンパク質、クロマチン構造、及びDNA修飾を含む多数のエピジェネティック修飾を直接検出及び定量することができないため、細胞内の複数のエピジェネティック修飾を同定するためのさらなる方法を提供する必要性が説明されている。 さらに、タンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーの検出のための改良された方法に対する一般的な必要性が依然として存在する。
【発明の概要】
【発明が解決しようとする課題】
【0006】
この観点から、例えば細胞内のタンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーを検出するためのDNA配列決定の新しい方法及び使用が非常に望まれているが、まだ容易に利用可能ではない。特に、単一のアッセイを使用して、単一細胞などの細胞内のタンパク質-DNA相互作用及び/又はヒストン修飾などの1つ又はそれ以上のマークの評価、例えば同時評価を可能にする、信頼性が高く、効率的で再現性のある生成物、組成物、方法、及び使用に対する明確なニーズが当該分野に存在する。従って、本発明の根底にある技術的課題は、前述のニーズのいずれかを満たすためのそのような生成物、組成物、方法、及び使用の提供にあると考えられる。この技術的課題は、特許請求の範囲及び本明細書の以下で特徴付けされる実施態様によって解決される。
【課題を解決するための手段】
【0007】
本発明者らは、特に細胞内の、タンパク質-DNA相互作用及び/又はヒストン修飾などのタンパク質-DNAマーカーの検出に使用するための、DNAを配列決定する新しい発明方法及び/又はDNA配列情報を得る方法を提供する。当技術分野で利用可能な方法は、有用ではあるが、単一細胞で1回、多くても3回の読み取りに制限されている。これは、最先端の方法が、1)一細胞解像度で複数のパラメータをスクリーニングするため、又は2)複数の細胞で単一のパラメータをスクリーニングするために、複数のアッセイを実施することに大きく依存している。
【0008】
本発明者らは、単一のアッセイを使用して、細胞、好ましくは単一細胞内のマーク、好ましくは複数のマークの同時評価を可能にする方法を開発した。本発明者らは、単一細胞読み出しの数を最適化し、原則として、1つの細胞又は2つ以上の細胞内の遺伝子調節タンパク質とエピジェネティック修飾の無制限の組み合わせを測定できるようにする方法を開発した。
【0009】
本発明者らは、新たに開発された方法が、細胞のアイデンティティに関連する組み合わされたエピゲノムシグネチャーの同定を可能にし、細胞のアイデンティティを支配するメカニズムの詳細な洞察を得るのを初めて可能にすることを発見した。本発明者らは、驚くべきことに、本発明によるDNAの配列決定方法によって、複雑な生物学的システムからの多次元単一細胞データが得られ、細胞のアイデンティティ、細胞の発生、及び細胞病理に関連するゲノム特徴とエピゲノム特徴との間の相互関連性の同定を可能になることを発見した。
【0010】
本発明者らは、本発明の方法を癌モデル、例えばインビボでマウスモデルに使用することによって、早期エピジェネティックバイオマーカーを明らかにすることが可能となり、その後、潜在的な薬剤ターゲッティングのための1つ又はそれ以上のエピジェネティック修飾の特定が可能になると考えている。同時に、本発明の方法は、遺伝子活性の変化につながる一連の事象、例えば転写因子の最初の結合とそれに伴うエピジェネティック修飾、又はその逆を明らかにするための貴重なツールであると考えている。
【0011】
驚くべきことに、本発明者らによって発見されたこの方法のさらなる利点は、現在の方法がプルダウンアッセイに依存しないため、例えばChIP配列決定などの最先端の方法と比較して、配列決定可能な材料の大きな損失を受けないことである。
【0012】
全体として、本発明者らは、本発明の方法により、同じ細胞における複数のエピジェネティックプロファイルのプロファイリングを実現できることを発見した。この方法は、これが不可能な最先端の方法を大幅に改善する。
【0013】
本発明による方法は、広範に、抗体-DNAアダプター結合体の使用に基づいており、抗体部分は、目的の特定のタンパク質又は修飾を認識し、これは例えば細胞内に存在するゲノムDNAと相互作用すると考えられる。DNAアダプター部分により、目的のタンパク質又は修飾が(抗体-DNAアダプター結合体の抗体部分によって)検出される位置で、抗体-DNAアダプター結合体の(例えばゲノム)DNAへの連結が可能になる。本発明は、バーコード化を含んでもよく、ここで、最初に、各抗体-DNAアダプター結合体は、(そのような目的のタンパク質又は目的の修飾に向けられた抗体-DNAアダプター結合体中の抗体による)目的のタンパク質又は修飾をコード化/識別するバーコードを含む。第2に、追加のバーコードを連結して、特定の試料/細胞をコード化することができる。
【0014】
得られた分子は、目的のタンパク質及び/又は目的の修飾と相互作用した元のDNAに関する配列情報を提供するために増幅及び配列決定され、それにより、例えば、タンパク質/修飾とDNAの相互作用が起きる位置、事象が起きた細胞、及び/又はタンパク質のタイプ、及び/又はゲノム内の特定の局在で相互作用する可能性のある修飾に関する貴重な情報が提供される。/PCT
【0015】
この方法により、一細胞解像度の単一アッセイで複数のパラメータの高処理能スクリーニングが可能になる。本発明の方法は、本明細書に記載の抗体-DNAアダプター結合体を使用することで、タンパク質の位置(例えば、転写因子又はヒストンの翻訳後修飾)の近傍のゲノムを部位特異的に標識及びバーコード化し、こうして増幅及び配列決定できる核酸分子を作成することができる。
【0016】
本発明は、本明細書で、特に添付の特許請求の範囲において定義される。
【0017】
本発明は、単一の反応チューブ又は試料で、さらには同じ単一細胞内で多数の測定を可能になるだけでなく、前記単一反応試料内での単一細胞分析も可能にする。さらに、この方法は、一般的な市販の材料を使用する必要があるため、コスト効率が高く、再現性があり、ほとんどの分子生物学研究室で実施可能であるという利点がある。
【0018】
従って、本発明による方法の使用は、
ゲノム全体のタンパク質-DNA相互作用プロファイルを、ゲノム全体のエピジェネティックプロファイルを生成するための、細胞タイプ特異的なエピジェネティックプロファイル及び/又はタンパク質-DNA相互作用プロファイルを比較するための、又は異なる発生段階の胚の間のエピジェネティックプロファイル及び/又はタンパク質-DNA相互作用プロファイルを比較するための、異なる治療計画に従う異なる疾患段階での腫瘍形成におけるエピジェネティックプロファイル及び/又はタンパク質-DNA相互作用プロファイルを比較するための、異なる遺伝子座でのタンパク質-DNA相互作用を分析のための、、疾患組織と健常組織間の生物の異なる部分間のタンパク質-DNA相互作用を比較するための、本発明の方法の使用が提供される。
【図面の簡単な説明】
【0019】
図1図1:本発明の方法を実施することができる非限定的な例/実施態様のフローチャート。
【0020】
図2図2:一次抗体免疫検出(例えば「第1抗体」を使用)とそれに続く抗体-DNA結合体(例えば「第1抗体-DNAアダプター結合体」を使用)を介するその後のゲノムターゲティングを含む、本発明の方法の実施態様の概略図。ABBC=抗体バーコード;UMI=固有の分子識別子。SBC=試料バーコード。実際には、単一の抗体がいくつかのアダプターで装飾され、複数の二次抗体が各一次抗体に結合する。本発明の別の方法において、及びここで、例えば一次抗体を使用しない場合、アダプターは抗体当たり固有のABBCを含む一次抗体に直接結合されて、エピトープ間を識別する。
【0021】
図3図3:ヒトK562細胞の1000個の細胞の試料中のCTCF、H3K27me3、H3K36me3、H3K4me1、H3K4me3、H3K9me2、及びラミンB1について得られたゲノムプロファイル。プロファイルは、示された一次抗体による免疫検出、続いて抗体-DNA結合体によるインキュベーションと検出によって得られた。トラックは、第8染色体の30メガベース(Mb)上の相互作用プロファイルを示す。
【0022】
図4A図4:H3K36me3、H3K4me3、H3K4me1、H3K27me3、H3K9me2、及びラミンB1に対する一次抗体とともにインキュベートした試料における、二次抗体-DNA結合体による免疫検出によって得られた1000細胞のK562試料の、活発に転写された遺伝子(図4A)及び不活性LADドメイン(図4B)のリード数の増強。
図4B図4:H3K36me3、H3K4me3、H3K4me1、H3K27me3、H3K9me2、及びラミンB1に対する一次抗体とともにインキュベートした試料における、二次抗体-DNA結合体による免疫検出によって得られた1000細胞のK562試料の、活発に転写された遺伝子(図4A)及び不活性LADドメイン(図4B)のリード数の増強。
【0023】
図5図5:CTCF、H3K27me3、H3K36me3、H3K4me1、H3K4me3、H3K9me2、ラミンB1、及び対照試料(一次抗体とともにインキュベートされていない)に対する一次抗体とともにインキュベートした試料において、抗体-DNA結合体を用いて免疫検出を使用する本発明の方法で得られた生物学的多重測定試料の相関ヒートマップ(Correlation-heatmap)。相関はスピアマンのρである。
【0024】
図6図6:一次-DNA結合体と二次-DNA結合体で得られたゲノムプロファイルの相関ヒートマップ。相関はスピアマンのρである。
【0025】
図7A図7:H3K36me3、H3K27me3、H3K4me3、H3K4me1、ヒストンH3、H3K27me3、H3K9me2、及びラミンB1に対する一次抗体-DNA結合体を用いる免疫検出によって得られた1000細胞のK562試料の、活発に転写された遺伝子(図7A)及び不活性LADドメイン(図7B)のリード数の増強。
図7B図7:H3K36me3、H3K27me3、H3K4me3、H3K4me1、ヒストンH3、H3K27me3、H3K9me2、及びラミンB1に対する一次抗体-DNA結合体を用いる免疫検出によって得られた1000細胞のK562試料の、活発に転写された遺伝子(図7A)及び不活性LADドメイン(図7B)のリード数の増強。
【0026】
図8図8:1000細胞の多重化K562試料中のH3K36me3、H3K27me3、及びRNAポリメラーゼ2について得られたゲノムプロファイル(上のプロファイル)と、個別の試料として処理された同じ抗体について得られたプロファイル(下の鏡像)の比較。多重化プロファイルは、最初に示された一次抗体による免疫検出、続いて対応する二次抗マウス、抗ウサギ、及び抗ラット抗体-DNA結合体とのインキュベーションを用いる免疫検出によって得られる。トラックは、第8染色体上の40メガベース(Mb)上の相互作用プロファイルを示す。
【0027】
図9A図9:H3K36me3、H3K27me3、及びRNAポリメラーゼ2に対する多重染色で得られた1000細胞のK562試料について、活発に転写された遺伝子(図9A)及びポリコーム群(Polycomb-group)抑制遺伝子(図9B)に対するリード数の増強。(s)は単一試料として処理された試料、及び(m)は単一の多重化試料で得られた試料を示す。
図9B図9:H3K36me3、H3K27me3、及びRNAポリメラーゼ2に対する多重染色で得られた1000細胞のK562試料について、活発に転写された遺伝子(図9A)及びポリコーム群(Polycomb-group)抑制遺伝子(図9B)に対するリード数の増強。(s)は単一試料として処理された試料、及び(m)は単一の多重化試料で得られた試料を示す。
【0028】
図10図10:単一細胞におけるRNAポリメラーゼ2、H3K36me3、H3K27me3、及びヒストンH3の多重免疫検出を用いて得られた、単一細胞における単一読み取りカウントを示す。
【0029】
図11A図11:RNAポリメラーゼ2、H3K36me3、H3K27me3、及びヒストンH3の多重免疫検出によって得られた単一細胞試料の、活発に転写されている遺伝子(図11A)及びポリコーム群抑制遺伝子(図11B)の読み取りカウントの増強。増強は、対応するクロマチン状態の予測されるパターンと一致していることに注意されたい。
図11B図11:RNAポリメラーゼ2、H3K36me3、H3K27me3、及びヒストンH3の多重免疫検出によって得られた単一細胞試料の、活発に転写されている遺伝子(図11A)及びポリコーム群抑制遺伝子(図11B)の読み取りカウントの増強。増強は、対応するクロマチン状態の予測されるパターンと一致していることに注意されたい。
【0030】
図12AB図12:DNAアダプター設計(抗体と試料アダプターの両方)の概略図(図12A)、及びMAb-IDとChIP-seqデータセット間のピアソン相関(図12B)、及びTSS又はポリコームドメイン(Plolybomb domain)境界付近のMAb-IDとChIP-seqシグナルの分布(ChromHMM呼び出しに基づく)。ピークトップからの50%の減衰が示されている(図12C)。
図12C図12:DNAアダプター設計(抗体と試料アダプターの両方)の概略図(図12A)、及びMAb-IDとChIP-seqデータセット間のピアソン相関(図12B)、及びTSS又はポリコームドメイン(Plolybomb domain)境界付近のMAb-IDとChIP-seqシグナルの分布(ChromHMM呼び出しに基づく)。ピークトップからの50%の減衰が示されている(図12C)。
【0031】
図13図13:個々の又は組み合わせたMAb-ID試料について、異なるフィルタリング工程中に割り当てられた、MAb-ID試料あたりの固有の読み取りカウント数(図13A)と読み取りカウントのパーセント(図13B)。
【0032】
図14図14:異なるゲノム領域におけるTTAA及びGATC配列モチーフの増強(ChromHMMドメインコールに基づく)。観察/期待値は、ゲノム内のモチーフの総量に基づいて計算される。GATC-バイアスは、ゲノム内のモチーフの総量で補正された、TTAAモチーフに対するGATCの相対的な存在量を示した。
【0033】
図15図15:第13染色体のより大きな領域と第6染色体のより小さな領域に沿った、一次抗体-DNA結合体で、又は一次抗体と二次抗体-DNA結合体を組み合わせて生成したMAb-ID試料のゲノムプロファイル。ChromHMMコールは下部に示されている。MAb-IDデータは対照試料に対して正規化されている。
【0034】
図16A図16:各ウェル中の、K562細胞とマウス細胞を一緒に分類するscMAb-IDセットアップの概略図。染色は、一次抗体-DNA結合体を組み合わせて使用して行った(図16A)。細胞ごと又はエピトープごとの合計としての固有の読み取りカウント数(図16B)。第9染色体に沿った一次抗体-DNA結合体の組み合わせで生成されたK562scMAb-ID及びバルクMAb-ID試料のゲノムプロファイル。遺伝子コールは下部に示されている。MAb-IDデータは対照試料に対して正規化され、ChIP-seqは入力に対して正規化されている(図16C)。
図16BC図16:各ウェル中の、K562細胞とマウス細胞を一緒に分類するscMAb-IDセットアップの概略図。染色は、一次抗体-DNA結合体を組み合わせて使用して行った(図16A)。細胞ごと又はエピトープごとの合計としての固有の読み取りカウント数(図16B)。第9染色体に沿った一次抗体-DNA結合体の組み合わせで生成されたK562scMAb-ID及びバルクMAb-ID試料のゲノムプロファイル。遺伝子コールは下部に示されている。MAb-IDデータは対照試料に対して正規化され、ChIP-seqは入力に対して正規化されている(図16C)。
【0035】
図17図17:ナイーブクラスター又は分化クラスターに位置するmESC又はmEN細胞の数(図17A)と、異なるエピトープについてのmESC又はmEN細胞内の割り当てられた活性若しくは不活性X対立遺伝子に対する固有の読み取りカウントの比率を示すバープロット(barplot)(図17B)。
【発明を実施するための形態】
【0036】
定義
この開示の一部には、著作権保護の対象となる資料(限定されるものではないが、図表、デバイスの写真、又はいずれかの管轄区域で著作権保護が利用可能又は利用可能になる可能性があるこの提出物のその他の側面など)が含まれている。著作権所有者は、特許庁の特許ファイル又は記録に記載されている特許文書又は特許開示を誰かが複製することに異議を唱えることはできないが、それ以外のすべての著作権を保有する。
【0037】
本発明の方法、組成物、使用、及び他の側面に関連する様々な用語が、本明細書及び請求項全体にわたって使用されている。そのような用語は、他に明記されない限り、本発明が関係する分野における通常の意味が与えられるものとする。他の具体的に定義された用語は、本明細書で提供される定義と一致するように解釈されるものとする。本明細書で説明されている方法及び材料と同様又は同等の方法及び材料は、本発明の試験の実施において使用することができるが、本明細書では好ましい材料及び方法について説明されている。本発明の目的のために、以下の用語が以下に定義される。
【0038】
本明細書で使用されている単数形「a」、「an」、及び「the」は、文脈上特に他に明記しない限り、複数の指示対象を含む。例えば「細胞を提供する方法」には、複数の細胞(例えば、数十、数百、数千、数万、数十万、数百万、又はそれ以上の細胞)を提供することが含まれる。例えば「第1抗体-DNAアダプター結合体」には、そのような複数の「第1抗体-DNAアダプター結合体」を提供することが含まれる。
【0039】
「約」及び「およそ」という用語は、量、持続時間などの測定可能な値を指す場合、そのような変動は開示された方法を実施するために適切であるため、指定された値から±20%又は±10%、より好ましくは±5%、さらに好ましくは±1%、さらにより好ましくは±0.1%の変動を包含することを意味する。
【0040】
本明細書で使用される場合、用語「及び/又は」は、記載された事例のうちの1つ又はそれ以上が、単独で、又は記載された事例のうちの少なくとも1つと組み合わせて、最大で記載された事例のすべてと組合わせて、発生する可能性があることを示す。
【0041】
本明細書で使用される用語「少なくとも」特定の値という用語は、その特定の値以上を意味する。例えば、「少なくとも2」は「2又はそれ以上」と同じであると理解される。すなわち、2、3、4、5、6、7、8、9、10、11、12、13、14、15、…など。本明細書で使用される用語「最大」特定の値という用語は、その特定の値又はそれ以下を意味する。例えば、「最大5」は「5又はそれ以下」、つまり5、4、3、・・・、-10、-11などと同じであると理解される。
【0042】
本書で使用されている用語「含む(comprise)」、又はその変形である「含む(comprises)」や「含む(comprising)」などは、記載されている要素、整数、若しくは工程、又は要素、整数、若しくは工程の群を含むものと理解されるが、その他の要素、整数、若しくは工程、又は要素、整数、若しくは工程の群を除外するものではない。動詞「含む」には、「から本質的に成る」及び「から成る」という動詞が含まれる。
【0043】
本明細書で使用されている「従来の技術」又は「当業者に知られている方法」とは、本発明の方法で使用される従来の技術を実施する方法が、熟練した作業者にとって明らかである状況を指す。分子生物学、生化学、細胞培養、ゲノミクス、配列決定、医療、薬理学、免疫学、及び関連分野における従来の技術の実施は、当業者によく知られており、さまざまなハンドブックや参考文献で説明されている。
【0044】
本明細書で使用される「例示的な」又は「例えば」は、「例、実例、又は例示として役立つ」ことを意味し、本明細書に開示される構成を含む他の構成を排除するものとして解釈されるべきではない。
【0045】
本明細書で使用される用語「結合する(binds)」、又はその変形である「結合している(binding)」、「結合する(bind)」は、分子が互いに近接しており安定な結合をもたらす分子間の引力的相互作用を含むと理解されるであろう。分子間の前記引力は、共有結合、非共有結合などによるものであり得る。本明細書で使用される場合、DNA及び/又はタンパク質分子を対象とする場合、前記引力は、限定されるものではないが、ファンデルワールス力、水素結合相互作用、立体相互作用、静電荷パターン認識などであり得る。
【0046】
本明細書で使用される用語「目的のタンパク質」は、「目的のポリペプチド」又は「目的のペプチド」と互換的に使用され、例えば、限定されるものではないが、診断目的、分析目的、医療目的などの本発明の方法の科学的又は技術的目的において、特に関心あるアミノ酸残基のポリマー鎖からなる生体分子を指す。
【0047】
本明細書で使用される用語「翻訳後修飾」は、天然アミノ酸又は非天然アミノ酸の修飾を指し、典型的にはポリペプチドにおける前記アミノ酸のインビボ又はインビトロの包含の後に起きるものを指す。
【0048】
詳細な説明
本発明者らは、本発明の方法により、同一細胞における複数のエピジェネティックプロファイルのプロファイリングが実現できることを発見した。この方法は、これを実現できないか又は非常に限られた範囲でしか実現できない最先端の方法を大幅に改善する。同時に、関心のあるタンパク質とDNAとの、例えばゲノムDNAとの相互作用を研究することができ、これには、このような相互作用の操作に関する研究(例えば、関心のあるタンパク質とDNAとの相互作用、例えばDNA、例えばゲノム内の1つ又はそれ以上の定義済み位置でのDNAとの組み込みに影響を与える化合物のスクリーニングアッセイ、についての研究)が含まれる。
【0049】
本発明による方法は、抗体-DNAアダプター結合体の使用を広くベースとしており、抗体部分は、目的の特定のタンパク質又は修飾を認識し(本明細書で説明されるように、中間抗体を介して直接又は間接に)、例えば細胞内に存在するゲノムDNAと相互作用すると考えられる。DNAアダプター部分は、タンパク質(例えば翻訳後修飾により修飾されたタンパク質を含む)が存在/検出される(抗体-DNAアダプター結合体の抗体部分によって)場所で、抗体-DNAアダプター結合体を(例えばゲノム)DNAに連結することを可能にする。本発明はバーコード化を含み、ここでは、まず各抗体-DNAアダプター結合体は、目的のタンパク質又は修飾をコード化/識別するバーコードを含む(そのような目的のタンパク質又は目的の修飾に向けられた抗体-DNAアダプター結合体中の抗体によって)。第2に、追加のバーコードを連結して、特定の試料/細胞をコード化することができる。
【0050】
得られた分子は、目的のタンパク質及び/又は目的の修飾と相互作用した元のDNAに関する配列情報を提供するために増幅及び配列決定され、それによって、例えば、タンパク質/修飾とDNAとの相互作用が発生した場所、事象が発生した細胞、及び/又はゲノム内の特定の場所で相互作用できるタンパク質のタイプ及び/又は修飾に関する貴重な情報が提供される。従って、本発明は、DNAを配列決定する方法、言い換えれば、試料中に存在するDNAに関する配列情報を得る方法を提供する。従って、本発明は、タンパク質又はタンパク質複合体とDNAとの相互作用を研究する方法を提供する。従って、本発明は、複数のタンパク質(又は複合体)とDNA内の複数の場所との相互作用を研究する方法を提供する。
【0051】
従って、本発明は、以下の工程を含む、DNAの配列を決定する方法を提供する:
(a)DNAを含む1つ又はそれ以上の透過処理及び固定された細胞核を含む試料を提供する工程;
(b)(i)DNAを第1の制限エンドヌクレアーゼで消化してDNA断片を提供し、DNA断片の5’末端を脱リン酸化して脱リン酸化DNA断片を提供し;
(ii)工程i)の前、最中、又は後に、DNAを含む1つ又はそれ以上の細胞核に
(1)1つ又はそれ以上の第1抗体-DNAアダプター結合体を、及び/又は
(2)1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体(前記第1抗体は、DNAと相互作用すると疑われる目的のタンパク質に向けられている)を、接触させることにより、DNAを含む前記1つ又はそれ以上の細胞核を処理する工程であって、
ここで、前記第1抗体-DNAアダプター結合体は、第1DNAアダプター部分に結合した第1抗体部分を含み、
及びここで、状況(1)において、前記第1抗体部分は、DNAと相互作用すると疑われる目的のタンパク質に向けられ、及びここで、状況(2)において、前記第1抗体部分は第1抗体に向けられ、
及びここで、前記第1DNAアダプター部分の末端は、工程(i)で定義される脱リン酸化DNA断片の末端に対して粘着性であるか又は粘着性にされ、
及びここで、前記第1DNAアダプター部分は、第2制限エンドヌクレアーゼのための第2制限部位を含み、
及び、好ましくは、ここで、第1DNAアダプター部分は第1バーコード配列を含み、ここで、前記第1バーコード配列は、工程(i)で定義された前記脱リン酸化DNA断片の末端に対して粘着性である前記第1DNAアダプター部分の末端と、第2制限部位との間に位置し、
ここで、前記接触は、(1)前記第1抗体-DNAアダプター結合体の抗体部分、又は(2)前記第1抗体-DNAアダプター結合体の抗体と抗体部分とが、その標的と結合することを可能にする条件下で行われて、前記目的のタンパク質に結合した第1抗体-DNAアダプター結合体を提供し、
(iii)前記第1抗体-DNAアダプター結合体の第1DNAアダプター部分が、脱リン酸化されたDNA断片の末端に連結することを可能にして、第1DNAアダプターDNA断片生成物を得る、工程、
(c)(i)好ましくは、酵素がプロテイナーゼKを含むタンパク質分解酵素処理を行うことにより、及び/又は熱処理によりタンパク質を分解し、及び核を溶解し、そして
(ii)(i)の前又は後に、試料中のDNAを第2制限エンドヌクレアーゼで処理し、それにより前記第1DNAアダプター部分に含まれる第2制限部位に切断を導入することにより、工程(b)の後に得られた試料を処理する、工程、
(d)工程(c)の後に得られた試料を第2DNAアダプターとともにインキュベートする工程であって、
ここで、工程(c)(ii)の前記第1DNAアダプターの第2制限部位に作成された末端に対して、前記第2DNAアダプターの末端は粘着性であり、好ましくは、前記粘着末端は5’末端リン酸基を有し、
及びここで、前記第2DNAアダプターは、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列を含み、及び好ましくは第2バーコード配列をさらに含み、好ましくはここで、第前記2バーコード配列は、前記RNAポリメラーゼ結合配列及び/又はDNAプライマー配列と、工程(c)(ii)において前記第1DNAアダプターの第2制限部位に作成された末端に対して粘着性の末端との間に配置され、
ここで、前記接触は、前記第2DNAアダプターが、工程(c)(ii)において前記第1DNAアダプター部分の第2制限部位に作成された末端に連結することを可能にする条件下で行われて、第2DNAアダプター第1DNAアダプター-DNA断片生成物が得られる、工程、
(e)前記第2DNAアダプター-第1DNAアダプター-DNA断片生成物を増幅し、得られた増幅生成物を配列決定する工程。
【0052】
本発明の方法において、DNAを含む1つ又はそれ以上の透過処理され固定された細胞核を含む試料が提供される。細胞核を透過処理及び固定する方法は当技術分野で周知であり、当業者によって広く実施することができ、エタノール及び/又はアセトン、ツイーン20などの界面活性剤、(パラ)ホルムアルデヒド、グルタルアルデヒドを単独で又は組み合わせて透過処理及び固定することに基づく方法が含まれる。好適な実施態様において、透過処理及び固定化はまた、例えば試料中の非特異的結合の量を減少させるのに役立つBSAなどの過剰なタンパク質を含む溶液を使用してブロックする工程も含み得る。しかし、当業者は、そのようなブロッキング工程は、本明細書に開示されるように、試料を第1抗体及び/又は第1抗体部分と接触させる前であればいつでも(複数回を含む)実施できることを理解している。本発明に関連して、得られた核が元々細胞核に存在していたDNA(及びそのようなDNAと相互作用し得るタンパク質)を依然として含む限り、透過処理及び固定された細胞核を提供するための任意の方法が適切であるとみなされる。
【0053】
本明細書の他の箇所で開示されているように、細胞核は、ヒト細胞などの動物細胞を含む任意の供給源から得ることができる。細胞は、細胞培養物又は生物から得ることができる。本発明の方法のいくつかの実施態様において、本発明の方法は単一の細胞核に対して実施される。他の実施態様において、本発明の方法の工程(a)で2つ以上の核、すなわち複数の核が提供される。非限定例としては、本発明の方法の工程(a)で、10、20、100、又は1000を超える細胞核、例えば、数十、数百、数千、数万、数十万、数百万、又はそれ以上の細胞核が提供される。
【0054】
次の工程(b)において、工程(a)で提供された1つ又はそれ以上の核が処理される。
【0055】
この処理は、(i)1つ又はそれ以上の核に含まれるDNAを第1制限エンドヌクレアーゼで消化してDNA断片を提供して、DNA断片の5’末端を脱リン酸化して脱リン酸化DNA断片を提供することを含む。
【0056】
この処理はまた、(ii)1つ又はそれ以上の核に1つ又はそれ以上の第1抗体-DNAアダプター結合体を接触させることを含み、ここで第1抗体-DNAアダプター結合体(すなわち、その第1抗体部分)は目的のタンパク質に向けられ、及び/又は1つ又はそれ以上の核に1つ又はそれ以上の第1抗体と1つ又はそれ以上の第1抗体-DNAアダプター結合体とを接触させる工程を含み、ここで第1抗体は、目的のタンパク質に向けられ、すなわちDNA及び第1抗体-DNAアダプター結合体(すなわち、その第1抗体部分)と相互作用すると疑われる目的のタンパク質は、前記第1抗体に向けられる。
【0057】
1つの実施態様において、第1抗体-DNAアダプターは、1つのDNAアダプターを含む。いくつかの実施態様において、第1抗体-DNAアダプター結合体は、2つ以上、例えば2つ、3つ、4つ、5つ、6つ、又はそれ以上のDNAアダプターを含む。このような実施態様において、抗体-DNAアダプター結合体における抗体:DNAアダプターの比率は、1:1、1:2、1:3、1:4、1:5、1:6、又はそれ以上である。本発明者らは、複数のDNAアダプターを同じ第1抗体-DNAアダプター結合体に結合させると、目的の結合タンパク質ごとにゲノムDNAへの同じDNAアダプターの複数の連結事象が強化されることを見出した。本発明の実施態様において、(単一の)第1抗体-DNAアダプター結合体中の複数のDNAアダプターは同じである;すなわち、同じ第1抗体-DNAアダプター結合体中の複数の同一のDNAアダプター。いくつかの実施態様において、2つ以上のタイプのDNAアダプターが、同じ第1抗体-DNAアダプター結合体中で使用される。例えば、2つ以上のタイプのDNAアダプターは、本明細書に開示されるように、長さ、配列、又は例えばその標的に対する粘着性が異なっていてもよい。
【0058】
従って、さらなる実施態様において、同じ(単一の)第1抗体-DNAアダプター結合体は、2つ以上、例えば2つ、3つ、4つ、5つ、6つ、又はそれ以上の異なるDNAアダプターを含む。従って、そのような実施態様において、第1抗体-DNAアダプター結合体中の抗体:DNAアダプター(部分)の比率は、1:1、1:2、1:3、1:4、1:5、又は1:6であり得るが、単一の第1抗体-DNAアダプター中に含まれる異なるDNA-アダプターはすべて同一ということはなく、例えば1つ又はそれ以上が異なる(異なるタイプ)場合がある。本発明者らは、同じ第1抗体-DNAアダプター結合体への複数の異なるDNAアダプターの結合が、ゲノムDNAへの1つ又はそれ以上の異なるDNAアダプターの連結が成功する可能性が高くなることを発見した。
【0059】
処理(i)及び(ii)は、任意の順序で、連続的に又は(部分的に)同時に実施することができる。例えば(i)は、(ii)の前、最中、又は後に実施されてもよい。例えば(ii)は、(i)の前、最中、又は後に実施されてもよい。
【0060】
この処理には、第1抗体-DNAアダプター結合体の第1DNAアダプター部分を脱リン酸化DNA断片の末端に連結させて、第1DNAアダプター-DNA断片生成物を得る工程(iii)も含まれる。当業者であれば理解できるように、工程(iii)では、試料中に第1抗体-DNAアダプター結合体、及び任意選択的に第1抗体、並びに脱リン酸化DNA断片が存在することが必要である。極めて好適な実施態様において、工程(iii)は、(1)第1抗体-DNAアダプター結合体の抗体部分、又は(2)抗体、及び第1抗体-DNAアダプター結合体の抗体部分がその標的と結合した後に実施され、目的のタンパク質と結合した第1抗体-DNAアダプター結合体が得られる。
【0061】
この処理は、(i)1つ又はそれ以上の核に含まれるDNAを第1の制限エンドヌクレアーゼで消化してDNA断片を提供し、DNA断片の5’末端を脱リン酸化して脱リン酸化DNA断片を提供することを含む。当業者は、例えば本明細書に開示される方法を使用して、1つ又はそれ以上の第1制限エンドヌクレアーゼを使用して、核に含まれるDNAを消化するための方法を周知している。いくつかの実施態様において、1つの第1の制限エンドヌクレアーゼが使用されるが、本明細書の他の箇所で開示されるように、2タイプ以上の制限エンドヌクレアーゼが使用されることも企図される。脱リン酸化は、脱リン酸化されたDNA又はDNA断片を提供するためのクローニング及び配列決定プロセスにおける一般的な工程である。ホスファターゼ、例えば組換えエビアルカリホスファターゼ(rSAP)などの脱リン酸化剤を使用して、消化されたDNA断片の5’末端のリン酸を除去すると、分子内連結の発生が減少する。他の適切な脱リン酸化剤は、当業者によって選択され得る。
【0062】
例えば、工程(b)のこの工程(i)では、第1制限エンドヌクレアーゼ及び脱リン酸化剤、例えばホスファターゼが、DNAを含む1つ又はそれ以上の核に提供される。本明細書で提供されるように、前記第1の制限エンドヌクレアーゼ及び脱リン酸化剤は、連続的に又は同時に添加することができる。例えば、第1の制限エンドヌクレアーゼ及び脱リン酸化剤は、適切な緩衝液中に含まれ、及び細胞核に添加され得る。脱リン酸化は、第1制限エンドヌクレアーゼによってDNAが切断された直後に起きる可能性があり、DNAの切断及び断片化及び脱リン酸化を多かれ少なかれ同時に行われることが可能になる。
【0063】
DNAの消化により、DNAは切断又は断片化されて、DNAのより小さな断片(DNA断片)になる。また消化により、DNA中に末端も作成され、この末端を使用して、特に、第1抗体-DNAアダプター結合体が、直接又は間接的に、第1抗体の使用により、DNAと相互作用する目的のタンパク質に結合又は相互作用している場合、1つ又はそれ以上の第1抗体-DNAアダプター結合体のDNAアダプター部分と連結することができる。このようにして、第1抗体-DNAアダプター結合体のDNAアダプター(第1DNAアダプター)は、目的のタンパク質がDNAと相互作用する場所の近くにあるDNAに連結され得る。
【0064】
上で論じたように、処理は、(ii)1つ又はそれ以上の核に1つ又はそれ以上の第1抗体-DNAアダプター結合体を接触させることを含み、ここで第1抗体-DNAアダプター結合体(すなわち、その第1抗体部分)は、目的のタンパク質に向けられ(状況1とも呼ばれる)、及び/又は1つ又はそれ以上の核に1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体を接触させることを含み、ここで第1抗体は、目的のタンパク質、すなわち、DNAと相互作用することが疑われる目的のタンパク質に向けられ、及び第1抗体-DNAアダプター結合体(すなわち、その第1抗体部分)は、前記第1抗体に向けられる(状況2とも呼ばれる)。言及したように、この処理の部分(ii)は、消化及び脱リン酸化の部分(i)の前、最中、又は後に行うことができる。
【0065】
状況1において、抗体-DNA結合体の第1抗体部分が、DNAと相互作用すると疑われる目的のタンパク質に向けられていることが理解される。換言すれば、前記抗体-DNA結合体の抗体部分は、目的のタンパク質に対して一定の結合親和性を有し、すなわち、目的のタンパク質に結合又は相互作用することができる(状況2では、これは目的のタンパク質に向けられる最初の抗体である)。好ましくは、第1抗体部分として、第1DNAアダプターとの結合に適した抗体が選択され、ここで、前記1つ又はそれ以上の抗体は、目的のタンパク質などの標的、好ましくは、DNAに結合することが疑われるタンパク質である標的に結合するのに適している。DNA結合タンパク質は、一本鎖又は二本鎖DNAに結合するタンパク質であり得る。DNAに結合することが知られているタンパク質の非限定的な例は当技術分野で周知であり、例えばヒストン、翻訳後修飾を有するヒストンなどのタンパク質を含み、好ましくは、ここで修飾はメチル化、リン酸化、アセチル化、ユビキチン化、SUMO化、DNAポリメラーゼ、RNAポリメラーゼ、転写因子、ヌクレアーゼ、高移動度群タンパク質、ヌクレオソームリモデラー、核構造タンパク質、DNA損傷修復タンパク質、ヒストン修飾酵素、クロマチン複合体の構成要素、クロマチン構造タンパク質、及びヒストンシャペロンからなる群から選択される1つ又はそれ以上である。他の例には、抗体-薬物結合体などのタンパク質-薬物結合体が含まれ得る。
【0066】
従って、第1抗体-DNAアダプター結合体は、第1抗体部分と第1DNAアダプター部分とを含む。当業者は、先行技術で利用可能な周知の技術、及び例えば本明細書に記載されている技術を使用して、第1抗体部分と第1DNAアダプター部分とを含むこのような第1抗体-DNAアダプター結合体を提供する方法を知っている。本明細書で提供される抗体部分は、当技術分野で利用可能かつ一般的な方法、例えばビオチン-ストレプトアビジンを介する結合などの非共有結合、又は、例えばチオール-マレイミド化学、又はアジドとDBCO分子との間のストレイン促進アジド-アルキン環化付加(SPAAC)クリック化学を使用する共有結合などによって、DNAアダプター部分に結合することができる。生体分子の結合に適した既知の他の方法も、抗体をDNAに結合させるために熟練者によって実施することができる。
【0067】
第1抗体部分は、核酸配列、例えばDNA配列を含む第1DNAアダプター部分に連結されるか又は結合される限り、本発明の方法で適切に使用され得る任意の工程の抗体であり得、一本鎖でも、好ましくは二本鎖であってもよい。例えば、抗体は、一本鎖抗体、ナノボディ、又は全抗体(例えば、IgG抗体)であり得る。従って、第1抗体-DNAアダプター結合体の一次抗体部分であるという観点から、又は(状況2で使用されるような)一次抗体という観点から、抗体という用語は、最も広い意味で免疫グロブリン様ドメイン(例えば、IgG、IgM、IgA、IgD、又はIgE)を指すことができ、モノクローナル抗体、組換え抗体、ポリクローナル抗体、キメラ抗体、ヒト抗体、ヒト化抗体、二重特異性抗体を含む多重特異性抗体、及びヘテロ結合体抗体、単一可変ドメイン(例えば、VH、VHH、VL、ドメイン抗体(dAb))、抗原結合抗体断片、Fab、F(ab’)2、Fv、ジスルフィド結合Fv、単鎖Fv、ジスルフィド結合scFv、ダイアボディ、TANDABSなど、及び前述のいずれかの修正バージョンを含む。
【0068】
第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、核酸配列、例えばDNA配列を含み、一本鎖でも、好ましくは二本鎖であってもよく、第1抗体-DNAアダプター結合体の第1抗体部分に結合される。換言すれば、第1抗体-DNAアダプター結合体は、第1DNAアダプター部分に結合した第1抗体部分を含む。
【0069】
1つの実施態様において上述したように、第1抗体-DNAアダプターは1つのDNAアダプターを含み、例えば、ここで1つのDNAアダプター部分は1つの抗体に結合される。いくつかの他の実施態様において、第1抗体-DNAアダプター結合体は、2つ以上、例えば、2つ、3つ、4つ、5つ、6つ、又はそれ以上のDNAアダプター(DNAアダプター部分とも呼ばれる)を含む。このような好適な実施態様において、第1抗体-DNAアダプター結合体における抗体:DNAアダプター部分の比率は、1:1、1:2、1:3、1:4、1:5、1:6、又はそれ以上である。本発明の実施態様において、(単一の)第1抗体-DNAアダプター結合体中の2つ以上のDNAアダプター部分は同じであり、すなわち、同じ第1抗体-DNAアダプター結合体中の複数の同一のDNAアダプターである。いくつかの実施態様において、同じ第1抗体-DNAアダプター結合体において、2つ以上のタイプのDNAアダプターが使用される。例えば、2つ以上のタイプのDNAアダプターは、本明細書に開示されるように、長さ、配列、又は例えばその標的に対する粘着性が異なっていてもよい。
【0070】
従って、さらなる実施態様において、同じ(単一)第1抗体-DNAアダプター結合体は、2つ以上、例えば、2つ、3つ、4つ、5つ、6つ、又はそれ以上の異なるDNAアダプター(アダプター部分)を含む。このような実施態様において、第1抗体-DNAアダプター結合体中の抗体:DNAアダプター(部分)の比率は、1:1、1:2、1:3、1:4、1:5、又は1:6であり得るが、ただし、単一の第1抗体-DNAアダプターに含まれる異なるDNA-アダプターはすべて同一であるとは限らず、例えば1つ又はそれ以上が異なる(異なるタイプ)場合がある。本発明者らは、複数の異なるDNAアダプターを同じ第1抗体-DNAアダプター結合体に結合させると、ゲノムDNAへの1つ又はそれ以上の異なるDNAアダプターの連結が成功する可能性が上昇することを見出した。当業者には理解されるように、2つ以上の第1抗体-DNAアダプター結合体が使用される実施態様(例えば、異なるタンパク質標的に向けられた、又は異なるタイプの抗体を使用する、多重実験)では、異なる第1抗体-DNAアダプター結合体のそれぞれが、上で論じたように、独立して、1つ又はそれ以上のDNAアダプター部分を含み得る。
【0071】
第1抗体-DNAアダプター結合体の第1DNAアダプター部分に関して、第1DNAアダプター部分の末端は、本明細書の他の箇所で説明されているように、工程(i)で定義される脱リン酸化DNA断片の末端に対して粘着性であるか、又は粘着性にされる。当業者は、第1DNAアダプター部分の末端にこのような粘着末端を設けることを十分に認識しており、これが脱リン酸化DNA断片を提供するために用いられる1つ又はそれ以上の第1制限エンドヌクレアーゼに依存することを理解している。また、第1DNAアダプターの末端は、核(ii)と第1抗体-DNAアダプター結合体との接触前に既に粘着性にされていてもよく、又は前記接触が行われる間又は接触が行われた後に粘着性にされてもよいことも理解されたい。
【0072】
言い換えれば、DNAアダプター部分、例えば第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、他のDNA分子の末端に連結できる短い一本鎖又は二本鎖のヌクレオチド配列又は糸状のヌクレオチドを含む。第1DNAアダプター部分の末端は、本方法の工程(i)で定義される脱リン酸化DNA断片の末端に対して粘着性であることが好ましい。1つの態様において、DNAアダプターは既に粘着性であり、すなわちDNAを含む1つ又はそれ以上の細胞核と接触する前に既に粘着末端を含む。これにより、DNAアダプターは脱リン酸化DNA断片に直接連結できる。別の態様において、DNAアダプターの末端は、例えばNdeIなどの制限酵素で消化されて粘着末端を形成する。
【0073】
さらに、第1のDNAアダプタ部分は、第2制限エンドヌクレアーゼの第2制限部位を含む。当業者には理解されるように、好適な実施態様において、DNAアダプタは第1のエンドヌクレアーゼの制限部位を含まず、これは核に含まれるDNAを断片化するために使用される。
【0074】
好適な実施態様において、第1のDNAアダプタ部分は第1のバーコード配列を含み、ここで、第1のバーコード配列は、工程(i)で定義される脱リン酸化DNA断片の末端に対して粘着性である第1のDNAアダプタ部分の末端と第2制限部位との間に配置される。バーコードは、本明細書の他の箇所で説明される。
【0075】
本発明の工程(b)(ii)の状況1では、第1抗体-DNAアダプター結合体は、目的のタンパク質と直接結合又は相互作用し、本発明の好適な実施態様である。
【0076】
本発明の工程(b)(ii)の状況2では、第1抗体-DNAアダプター結合体は第1の抗体に向けられる。この状況では、第1の抗体は目的のタンパク質と直接結合し、第1抗体-DNAアダプター結合体の第1抗体部分は前記第1の抗体に向けられる。状況2もまた本発明の好適な実施態様である。状況2では、第1の抗体は、例えば、第1抗体-DNAアダプター結合体の前又はそれと同時に核と接触され得る。
【0077】
工程(b)(ii)における核の接触は、前記1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体を含む適切な培地又は緩衝液中で前記細胞核をインキュベートすることによって、又は細胞核を含む培地に前記1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体を添加することによって行うことができる。
【0078】
本明細書では、DNAを含む細胞核は、少なくとも1つの第1抗体-DNAアダプター結合体及び/又は少なくとも1つの第1抗体と接触できることが理解される。本明細書では、前記細胞核は、1、2、3、4、5、10、20、50、100、1000...などの異なる抗体-DNAアダプター結合体と、及び/又は第1抗体と接触することができる。使用される異なる第1抗体-DNAアダプター結合体及び/又は第1抗体の数は、アッセイのための目的のタンパク質の数に依存すると考えられる。
【0079】
工程i)の前、最中、又は後の、1つ又はそれ以上の第1抗体-DNAアダプター結合体を有するDNAを有する1つ又はそれ以上の細胞核、及び/又は1つ又はそれ以上の第1抗体及び1つ又はそれ以上の第1抗体-DNAアダプター結合体との接触は、(1)第1抗体-DNAアダプター結合体の抗体部分、又は(2)第1抗体-DNAアダプター結合体の抗体又は抗体部分が、その標的、例えば核に含まれるDNAと相互作用すると疑われる目的のタンパク質と結合することを、状況(2)の場合には、第1抗体-DNAアダプター結合体が第1抗体と結合することを可能にする条件下で行われる。(1)第1抗体-DNAアダプター結合体の抗体部分、又は(2)第1抗体-DNAアダプター結合体の抗体及び抗体部分が、その標的と結合することを可能にすることにより、目的のタンパク質と結合した第1抗体-DNAアダプター結合体が提供される。
【0080】
従って、目的のタンパク質に結合した第1抗体-DNAアダプター結合体は、状況1では、第1抗体-DNAアダプター結合体の第1抗体部分を介して目的のタンパク質に結合した第1抗体-DNAアダプター結合体を含む。従って、目的のタンパク質に結合した第1抗体-DNAアダプター結合体は、状況2では、目的のタンパク質に結合した第1の抗体に結合した第1抗体-DNAアダプター結合体を含む。
【0081】
前述のように、処理には、第1抗体-DNAアダプター結合体の第1DNAアダプター部分を脱リン酸化DNA断片の末端に連結させて、第1DNAアダプター-DNA断片生成物を得る工程(iii)も含まれる。当業者であれば理解できるように、工程(iii)では、試料中に、第1抗体-DNAアダプター結合体、及び任意選択的に第1の抗体、並びに脱リン酸化DNA断片が存在することが必要である。好適な実施態様において、工程(iii)は、(1)第1抗体-DNAアダプター結合体の抗体部分、又は(2)第1抗体-DNAアダプター結合体の抗体及び抗体部分がその標的と結合した後に行われて、目的のタンパク質と結合した第1抗体-DNAアダプター結合体を提供し、例えば、(1)第1抗体-DNAアダプター結合体の抗体部分、又は(2)第1抗体-DNAアダプター結合体の抗体及び抗体部分がその標的と結合と結合した後に行われて、目的のタンパク質と結合した第1抗体-DNAアダプター結合体を提供する。
【0082】
従って、第1DNAアダプター-DNA断片は、核に含まれる断片化DNAと結合(連結;結合末端を介して)された第1抗体-DNAアダプター結合体の第1のDNA部分からのDNAを含む。第1DNAアダプター-DNA断片はまた、DNA断片に結合した目的のタンパク質につながれ又は結合し、これは次に第1抗体-DNAアダプター結合体の第1抗体部分又は第1抗体のいずれかに結合すること(これは次に第1抗体-DNAアダプター結合体の第1抗体部分に結合すること)が企図される。従って、DNA断片は、目的のタンパク質と相互作用するか又はそれに結合する断片であり、これにより、第1抗体-DNAアダプター結合体及び/又は第1の抗体を介して、第1DNAアダプターをDNA断片の末端に近接させることができ、例えば結合していない第1抗体-DNAアダプター結合体を洗浄除去した後、それを用いてDNA断片の末端に連結させ、核(そこに又はその近傍で目的のタンパク質が結合又は相互作用している)に含まれるDNA内のDNA配列を同定又はタグ付けする。
【0083】
工程(b)を実施し、1つ又はそれ以上の第1DNAアダプター-DNA断片生成物を提供した後、本発明の方法は工程(c)を含む。工程(c)では、核及び/又は核を含む細胞が溶解され、同時にタンパク質が標準技術を使用して分解される。好適な実施態様において、工程(c)は、例えば核が透過処理され、(パラ)ホルムアルデヒドを使用して固定されている場合、脱架橋も含むことができる。
【0084】
当業者であれば理解できるように、工程(c)では、目的のタンパク質、第1の抗体、及び第1抗体-DNAアダプター結合体の第1抗体部分が分解され、第1DNAアダプター-DNA断片生成物のみがそのまま残る。
【0085】
従って、工程(c)は、(i)工程(b)の後に得られた試料を、タンパク質を分解することによって、好ましくはタンパク質分解酵素処理(好ましくは酵素はプロテイナーゼKを含む)を行うことによって、及び/又は熱処理によって、及び核を溶解することによって、処理することを含む。前記処理は当業者に周知であり、例えば、実施例で詳述されるものを含め、本明細書の他の箇所に記載されるものが含まれる。
【0086】
さらに、工程(c)の一部として、工程(b)の後に得られた試料は、(ii)工程(c)の(i)の前又は後に、試料中のDNAを第2制限エンドヌクレアーゼで処理され、それによって第1DNAアダプター部分に含まれる第2制限部位に切断が導入される。本明細書の他の箇所で説明されるように、第2のエンドヌクレアーゼは、第1DNAアダプター-DNA断片生成物に切断を導入し、これにより第2のDNAアダプターを連結することが可能になる(工程(d))。上述したように、第2制限エンドヌクレアーゼの制限部位は、第1抗体-DNAアダプター結合体の第1DNAアダプターに含まれる。ここでも、当業者は、例えば本明細書に開示されているように、本発明の方法の工程(c)の処理を実施する方法を知っている。
【0087】
本発明の方法の次の工程(d)では、第2DNAアダプターとともにインキュベートされた工程(c)の処理後に得られた試料は第2DNAアダプターとともにインキュベートされ、ここで第2DNAアダプターの末端は、工程(c)(ii)において第1DNAアダプターの第2制限部位が作成された末端に対して、粘着性であり、好ましくはここで、粘着末端は5’末端リン酸基を有する。当業者は、一般知識及び本明細書の他の場所で開示されている情報を使用して、そのような第2アダプタを提供する方法を知っている。
【0088】
第2のDNAアダプターは、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列を含む(後者は、例えば、インビトロ転写技術(IVT)の代わりに、ポリメラーゼ連鎖反応(PCR)及び配列決定に使用することができる)。このようなRNAポリメラーゼ結合配列及び/又はDNAプライマー配列は当業者に周知であり、これを使用して、PCR及び/又は線形(RNA)増幅などの標準的技術を用いて、第1DNAアダプターDNA断片及び/第2DNAアダプターに含まれるDNAの増幅を可能にすることができる。
【0089】
第2のDNAアダプターは、第2のバーコード配列をさらに含むことが好ましく、ここで第2のバーコード配列は、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列と、工程(c)(ii)で第1DNAアダプターの第2制限部位に作成された末端に対して粘着性の末端との間に配置される。第2バーコードは、本明細書の他の箇所でさらに説明される。
【0090】
工程(d)における接触は、第2DNAアダプター-第1DNAアダプター-DNA断片生成物を得るために、工程(c)(ii)において第1DNAアダプター部分の第2制限部位に作成された末端に第2のDNAアダプターを連結させる条件下で行われる。従ってこれは、上記のように、第2のDNAアダプター、第1DNAアダプター、及び第1DNAアダプターが連結されたDNA断片からのDNAを含む。再度、当業者は、連結を可能にし、及び第2DNAアダプター-第1DNAアダプター-DNA断片生成物の取得を可能にするような条件を提供する方法を非常によく理解している。
【0091】
本発明の方法の次の工程(e)では、得られた増幅生成物の配列情報を得るために、第2DNAアダプター-第1DNAアダプター-DNA断片生成物が増幅され、配列決定される。このような配列情報は、例えばバイオインフォマティクス技術を適用することにより、例えば、目的のタンパク質がDNAと相互作用したゲノム位置、及び目的のタンパク質の結合がどの程度起きたかを決定するために使用することができる。再度、本発明の方法には、例えば実施例を含む本明細書の他の箇所に記載されているものなどの、任意の適切なDNA増幅方法及び/又は配列決定方法を使用することができる。
【0092】
本発明の実施態様において、上記で開示された工程(a)の1つ又はそれ以上の核は:
- 1つの細胞核である;
- 10、20、100、又は1000個を超える細胞核を含む;
- 動物由来であり、好ましくはげっ歯類又は哺乳類由来であり、好ましくはヒト由来である;
- 単一のタイプの生物、又は単一の生物、好ましくは一人のヒトから得られる;
- 疾患組織から得られる;
- 細胞に含まれている;及び/又は
- 1つタイプの細胞由来であるか、又は異なるタイプの細胞由来である。
【0093】
本発明の方法は、(透過処理及び固定された)細胞核の数及び/又はそのような細胞核が得られる生物に関して特に限定されない。当業者であれば、本明細書の開示に基づいて、例えば本発明の方法の想定される使用を考慮して、適切な数の核及びそのような核が得られる生物又は細胞のタイプを選択する方法を理解するであろう。
【0094】
例えば、本発明の方法のいくつかの実施態様において、この方法は単一の細胞核に対して実施される。他の実施態様において、2つ以上の核、すなわち複数の核が本発明の方法の工程(a)で提供される。非限定的な例としては、10、20、100、又は1000を超える細胞核、例えば、数十、数百、数千、数万、数十万、数百万、又はそれ以上の細胞核が提供される。本発明者らは、驚くべきことに、本発明による方法が複数のパラメータ、例えば複数の転写後修飾を一細胞解像度で検出できることを見出した。
【0095】
いくつかの実施態様において、2つ以上の核は、同じ単一のタイプの生物(例えば、複数のヒト被験体)に、同じ単一の生物(例えば、1人の同じヒト被験体)に、同じタイプの組織(例えば結腸から)に、例えば健康な組織又は疾患組織に、及び/又はそれらの任意の組み合わせに、由来する。
【0096】
他の実施態様において、本方法の工程(a)で細胞核の混合物が提供される。例えば、異なるタイプの生物から得られた核を組み合わせることもでき(例えば、げっ歯類と霊長類から)、又は同じタイプの異なる生物から得られた核を組み合わせることもでき、又は異なるタイプの組織(例えば、結腸と肺)から得られた核を組み合わせることもできる。同様に、核は同じ細胞のタイプ由来でも、異なる細胞のタイプ由来でもよい。例えば、いくつかの実施態様において、核は、異なるタイプの細胞、例えば異なるタイプの癌細胞並びに健康な細胞を含む腫瘍から得られる。本発明の方法で使用される核を含む好ましい細胞のタイプの例としては、限定されるものではないが、上皮細胞、内皮細胞、皮膚細胞、肺細胞、結腸細胞、脳細胞、骨細胞、血液細胞、幹細胞、胚葉由来の細胞、癌細胞、細胞株、初代細胞、オルガノイド由来の細胞、球状体由来の細胞などが挙げられる。
【0097】
1つ又はそれ以上の核は、様々なタイプの生物由来でもよく、限定されるものではないが、植物、酵母、動物、哺乳類、マウスやラットなどのげっ歯類、霊長類、特にヒト由来であってもよい。好ましくは、核は動物、好ましくはげっ歯類又は哺乳類、好ましくはヒトの細胞由来である。
【0098】
1つ又はそれ以上の核は、健康な組織又は細胞、及び/又は疾患組織又は細胞由来でもよい。例えば、細胞は、健康な組織又は細胞、及び細胞の疾患組織から、例えば同じタイプの生物又は同じ生物(例えば、同じヒト被験体又は患者)から取得することができる。
【0099】
当業者は、生物から1つ又はそれ以上の細胞核を得るための方法、例えば、試料を得るために、例えば目的の組織から生検を採取するために、又は体液試料、例えば血液、唾液などを得るために、一般的に使用される方法をよく知っている。当業者は一般に、生物から試料を入手するための適切な方法を知っている。本明細書では、試料は1つ又はそれ以上の生物、例えば1つ又はそれ以上のマウス、1つ又はそれ以上のヒトから得ることができると理解される。好適な実施態様において、1つ又はそれ以上の細胞核は、単一の生物から、より好ましくは一人のヒト被験体から得られる。
【0100】
また、本明細書では、工程(a)で提供される試料中の1つ又はそれ以上の核は、細胞内に含まれる核であることが好ましい。あるいは、1つ又はそれ以上の核は、そのような細胞から単離されてもよい。核が細胞内に存在する実施態様において、核を含む細胞は、核とともに透過処理され、固定されて、透過処理及び固定された細胞核を含む透過処理及び固定された細胞が提供される。
【0101】
すでに上で説明したように、1つ又はそれ以上の核は、異なる複数のタイプの細胞から、例えば(疾患)組織、細胞培養物、オルガノイド、スフェロイド、細胞株から選択され取得される。本発明の方法では、同じ核、又は異なるタイプの生物、組織、細胞タイプなどからの核の混合物を使用することができる。
【0102】
理解されるように、いくつかの実施態様において、本発明の方法の工程(a)で提供される核の全て又は一部のみが、本発明の方法の後続の工程に供され、及び/又は工程(e)の配列決定に供される。換言すれば、いくつかの実施態様では、本発明の方法を使用して増幅されるDNAの配列が、すべての核について決定されるわけではない。
【0103】
いくつかの実施態様において、第1の制限エンドヌクレアーゼが以下である方法が提供される:
- 平滑末端を作成するか、オーバーハングのある端を作成する;
- 4~8塩基対の長さ、好ましくは4塩基対の長さの認識部位を認識し、好ましくは前記第1制限エンドヌクレアーゼが、MseI、MboI、DpnII、及びNlaIIIからなる群から選択される;及び/又は
- 平均して100~10,000塩基対ごとにDNAを切断する制限エンドヌクレアーゼである。
【0104】
本方法の工程b)の工程(i)で提供される第1の制限エンドヌクレアーゼ(制限酵素とも呼ばれることもある)は、前記1つ又はそれ以上の細胞核を含む工程(a)の試料に提供されて、前記1つ又はそれ以上の細胞核に含まれるDNAを切断及び/又は断片化する。当業者は、制限エンドヌクレアーゼを、及び本発明の方法における使用に適した制限エンドヌクレアーゼを、及び本発明に関連してこれらを使用する方法を、よく知っている。
【0105】
一般に、制限エンドヌクレアーゼは、制限部位と呼ばれる特定のDNA配列を認識し、その部位内又はその部位に隣接するDNAを切断する酵素である。従って、制限エンドヌクレアーゼは、DNA内の特定の標的配列でDNAを切断することによってDNAを断片化するために使用され得る。天然に存在する制限エンドヌクレアーゼは、一般に、標的配列及び標的配列に対するDNA切断の位置などの要因に応じて、さまざまなグループに分類され、さまざまな供給元から市販されている。
【0106】
本発明に関連して企図される一般的に使用される人工制限酵素には、天然又は工学作成DNA結合ドメイン、及びヌクレアーゼドメイン(例えば、制限酵素FokI由来のもの)、ジンクフィンガーヌクレアーゼ、及びCas9などのCRISPR/CAS酵素を含む融合タンパク質が含まれる。
【0107】
本発明の方法は、特定のタイプの制限酵素に特に限定されないが、いくつかの好適な実施態様において、第1制限エンドヌクレアーゼは、4~8塩基対の長さの、例えば4、5、6、7、又は8塩基対の長さのDNA(核に含まれる)における認識部位を認識する。好ましくは、前記第1の制限酵素の認識部位は4塩基対の長さである。ヌクレオチドの特定の配列を認識した後、制限エンドヌクレアーゼはDNA鎖内に切断を生じさせることができる。多くの場合、好適な実施態様において、含まれるDNAに制限酵素によって導入される切断は二本鎖切断であり、すなわち、二本鎖(ds)DNAの両方の鎖が第1の制限酵素によって切断される。
【0108】
いくつかの実施態様において、本方法で使用される第1の制限エンドヌクレアーゼは、核に含まれるDNAを平均して100~10,000塩基対ごとに、好ましくは100~500塩基対ごとに切断することが好ましい。言い換えれば、平均して、この方法で使用するために選択される第1制限エンドヌクレアーゼは、核に含まれるDNAの100~10,000塩基対ごとに認識部位を認識する。平均して、DNAの第1制限酵素の切断により生成される各DNA断片は、平均して約100~10,000塩基対を含む。当業者は、本発明の方法において第1制限エンドヌクレアーゼとして使用するのに適した制限エンドヌクレアーゼを選択する方法を理解している。例えば、平均して100~10,000塩基対ごとに切断する制限エンドヌクレアーゼは、例えば公的に入手可能なDNA配列情報を使用して、特定の制限エンドヌクレアーゼの制限部位の存在頻度を決定することによって選択することができる。選択される制限エンドヌクレアーゼは、例えば、本方法で使用される核が得られる生物のタイプに依存し得ることは、当業者には理解されるであろう。明らかに、目的のタンパク質は特定の配列偏りのある領域で結合する場合があるため、これは目的のタンパク質にも依存する可能性がある。
【0109】
いくつかの実施態様において、第1の制限エンドヌクレアーゼは、平滑末端、すなわち非粘着末端を作成するが、好適な実施態様において、第1制限エンドヌクレアーゼはオーバーハング(粘着性末端とも呼ばれる)を有する末端を作成する。第1制限エンドヌクレアーゼが平滑末端を作成する場合、第1抗体-DNAアダプター結合体にも平滑末端が提供され、それによって、核に含まれるDNAにおいて第1制限エンドヌクレアーゼによって導入された平滑末端に連結することができる。代替実施態様において、第1制限エンドヌクレアーゼによって作成される平滑末端は、オーバーハングを作成するためにさらに修飾されてもよい。
【0110】
核に含まれるDNA中のオーバーハング、例えば、第1制限エンドヌクレアーゼによって導入されるオーバーハングは、任意の長さであってもよく、例えば、オーバーハング(例えば、3’オーバーハング)は、1ヌクレオチド以上、例えば2、3、又は4つのヌクレオチドでもよい。本明細書で説明されるように、好適な実施態様において、第1制限エンドヌクレアーゼによって作成される末端は、本発明の方法で使用される、第1抗体-DNAアダプター結合体に存在するか又は第1抗体-DNAアダプター結合体に提供される末端に対して粘着性の末端である。
【0111】
本発明は特に特定の第1制限エンドヌクレアーゼに限定されないが、いくつかの好適な実施態様において、第1制限エンドヌクレアーゼは、MseI、MboI、DpnII、及びNlaIIIからなる群から選択される。制限エンドヌクレアーゼはさまざまな供給元から市販されており、当業者は本発明に関連してこれらを使用する方法をよく知っている。当業者は、前記制限酵素を、及び前記制限酵素を用いてDNAを含む細胞核を処理する方法に精通している。
【0112】
最後に、実施態様において、本方法において、2タイプ以上の第1制限エンドヌクレアーゼが使用されることが想定される。例えば、いくつかの実施態様において、2、3、又はそれ以上の異なる制限エンドヌクレアーゼが本発明の方法で、好ましくは同じ実験において同時に又は連続して適用される。当業者には理解されるように、本発明の方法において、2タイプ以上の第1抗体-DNAアダプター結合体が使用されることも想定され、例えば、異なるタイプの第1抗体-DNAアダプターにおける抗体が、異なる目的のタンパク質及び/又は目的の修飾に向けられ、及び/又は異なる第1抗体-DNAアダプター結合体が、核に含まれるDNAにおいて1つ又はそれ以上の異なる制限エンドヌクレアーゼによって導入される異なる末端に対して粘着性の異なる末端を含む。例えば、一例では、第1制限エンドヌクレアーゼAが使用され、及び2つ(又はそれ以上)の異なる第1抗体-DNAアダプター結合体C及びDが使用され(Cは、例えばD以外の抗体を含むことができる)、ここで、例えば、抗体-DNAアダプター結合体C及びDの両方は、第1の制限エンドヌクレアーゼAによって作成される末端に対して粘着性である。別の例において、2つの異なる第1制限エンドヌクレアーゼA及びBと2つ(又はそれ以上)の異なる第1抗体-DNAアダプター結合体C及びDが使用され、ここで、例えば第1抗体-DNAアダプター結合体Cは、第1の制限エンドヌクレアーゼAに対して粘着性であり、及びここで第1抗体-DNAアダプター結合体Dは、第1制限エンドヌクレアーゼBに対して粘着性である。
【0113】
本発明の実施態様において、状況(1)、すなわち本発明の方法の工程(b)の工程(ii)の状況(1)において、抗体-DNAアダプター結合体の抗体部分が、及び状況(2)、すなわち本発明の方法の工程(b)の工程(ii)の状況(2)において、抗体が、DNAに結合することが知られているか又はDNAに結合することが疑われるタンパク質に向けられている方法が提供される。第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況(2))は、原則として、細胞内で発現されるか又は発現され得る任意のタンパク質に向けられ得る。好適な実施態様において、第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況(2))は、DNAと相互作用することが知られているタンパク質、例えば、DNAに結合することが知られているか及び/又はDNAと相互作用することが疑われるタンパク質に向けられる。当業者は理解しているように、第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況(2))が向けられるタンパク質が、実験条件下でDNAに結合することが知られている必要はない。本発明の方法により、そのような相互作用が起きるかどうか、どの程度起きるか、及びDNA上のどこで起きるかを確立することもできる。当業者はまた、タンパク質が、核が得られる細胞内で自然に発現されるタンパク質であるか、又はこれらの細胞にとって非天然のタンパク質であるかも理解している。タンパク質はまた非天然タンパク質、例えばDNAと相互作用する目的で設計された融合タンパク質であってもよい。
【0114】
従って、「DNAに結合することが疑われるタンパク質」という用語は、タンパク質、ペプチド、融合タンパク質などを含む任意のタンパク質性分子を指す。結合することが疑われるタンパク質は、DNAと直接相互作用することもあれば、例えば、DNAに直接結合するさらなるタンパク質に結合又は相互作用することによって、又は例えばDNA結合複合体の一部であることによって、間接的に相互作用することもある。
【0115】
第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況2)は、好ましくは2つ以上のタンパク質(又はその中のエピトープ)に結合することが疑われるタンパク質に特異的であるが、2つ以上のタンパク質(又はその中のエピトープ)を認識し得る抗体でもよい。
【0116】
いくつかの実施態様において、タンパク質は、ヒストン、翻訳後ヒストン修飾を有するヒストン(好ましくは、ここで、修飾は、メチル化、リン酸化、アセチル化、ユビキチン化、及びSUMO化からなる群から選択される1つ又はそれ以上である)、DNAポリメラーゼ、RNAポリメラーゼ、転写因子、ヌクレアーゼ、高移動度群タンパク質、ヌクレオソームリモデラー、核構造タンパク質、DNA損傷修復タンパク質、ヒストン修飾酵素、クロマチン複合体の成分、クロマチン構造タンパク質、及びヒストンシャペロンからなる群から選択される。
【0117】
いくつかの実施態様において、第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況2)は、メチル化、リン酸化、アセチル化、ユビキチン化、及びSUMO化を含むタンパク質などの、翻訳後修飾を含むタンパク質に結合するか又は特異的である。好ましくは、これらの実施態様において、第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況2)は、翻訳後修飾を有するタンパク質に特異的であり、及び例えば、前記翻訳後修飾を欠いているタンパク質、及び/又は異なる翻訳後修飾(例えば、アセチル化の代わりにメチル化などの別の基によって修飾されているか、又はアセチル化による修飾がヒストンタンパク質内の別の場所(アミノ酸)にあるか、又はタンパク質が追加の修飾又はより少ない修飾を含む)を含むタンパク質を、認識も結合もしないか、又はその程度がより小さい。例えば、修飾されていないヒストンタンパク質と、翻訳後に修飾されたさまざまなヒストン(例えば、ヒストンタンパク質の特定の位置でのアセチル化又はメチル化による)を区別する抗体は広く記載されており、さまざまな供給元(例えば、Abcam)から市販されている。
【0118】
実際、ヒストン、並びにヒストン修飾、及び健康と病気におけるDNAとの相互作用におけるそれらの役割は、当業者にはよく知られている。細胞内のDNAは、基本的構成要素としてヌクレオソームから構成される動的構造であるクロマチンとしてパッケージ化されている。ヒストンはヌクレオソームサブユニットの中心成分であり、ヒトでは4つのコアヒストンタンパク質(H3、H4、H2A、H2B)を含むオクタマーを形成し、その周りに147塩基対のDNAセグメントが巻き付けられている。各ヒストンタンパク質は側鎖又はテールを有し、これは、共有結合による翻訳後修飾(PTM)の対象となり、クロマチン状態を制御する。一部のPTMは電荷密度を変え、クロマチンの組織化と基礎となる転写プロセスに影響を与えるが、これらは特定の結合タンパク質の認識シグナルとしても機能し、結合するとクロマチン構造又は機能の変化を知らせることがある(例えば、Audia et al. (2016) Cold Spring Harb Perspect Biol1;8(4))。
【0119】
従って、いくつかの実施態様において、目的のタンパク質は、ヒストン及び/又はヒストン修飾を有するヒストンであり、好ましくは、ここで修飾は、メチル化、リン酸化、アセチル化、ユビキチン化、及びSUMO化からなる群から選択される1つ又はそれ以上である。これらの実施態様において、第1抗体-DNAアダプター結合体の抗体部分(状況(1))又は抗体(状況2)
【0120】
他の実施態様において、目的のタンパク質は、DNAポリメラーゼ、RNAポリメラーゼ、転写因子、ヌクレアーゼ、高移動度グループタンパク質である(高移動度グループ又はHMGは、転写、複製、組換え、DNA修復などのDNA依存性プロセスの調節に関与する染色体タンパク質のグループである)、ヌクレオソームリモデラー(例えば、Becker et al (2013) Cold Spring Harb Perspect Biol. 5(9): a017905を参照)、核構造タンパク質、DNA損傷修復タンパク質、ヒストン修飾酵素、クロマチン複合体の成分、クロマチン構造タンパク質、及び/又はヒストンシャペロン(ヌクレオソーム構築に関与するヒストン結合タンパク質の構造的及び機能的に多様なファミリー(例えば、Burgess et al (2013) Nat Struct Mol Biol. 20(1): 14-22.を参照)。これらのタイプのタンパク質は、DNAとの相互作用におけるそれらの潜在的な役割と機能とともに、当業者に知られている。
【0121】
当業者が理解するように、本発明の方法の工程(b)の工程(ii)の状況(2)において、第1抗体-DNAアダプター結合体の第1抗体部分は、目的のタンパク質に向けられた第1の抗体に向けられている。
【0122】
本発明の実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分が、
- 50~150塩基対の長さを有する;
- 第1バーコード配列を含み、ここで好ましくは、前記第1のバーコード配列は、前記抗体-DNAアダプター結合体の抗体部分を特異的に識別している;及び/又は
- 前記第1抗体-DNAアダプター結合体の抗体部分がその標的に結合できるようになる前又はなった後に、工程(b)(i)で作成された脱リン酸化DNA断片の末端に対して粘着性にされる、方法を提供する。
【0123】
当業者が理解するように、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、核酸、例えばDNA配列を形成するA、T、C、及びGなどのヌクレオチドから構成される。第1DNAアダプター(又は本明細書に開示される任意の他のDNAアダプター)は一本鎖であってもよいが、好ましくは二本鎖である。DNAアダプターは好ましくは線状、すなわち少なくとも1つの末端を有する。本発明によって特に限定されるわけではないが、好適な実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、10塩基対超、好ましくは20塩基対超の長さを有する。好ましくは、長さは1000塩基対未満であり、例えば、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、50~150塩基対、例えば約80~85塩基対の長さを含む。
【0124】
いくつかの実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は第1のバーコード配列を含み、好ましくは、ここで第1のバーコード配列は抗体-DNAアダプター結合体試料の抗体部分を特異的に識別する(そして、本発明の方法の工程(b)の工程(ii)の状況(2)の場合、それによって、目的のタンパク質に向けられた抗体も特異的に識別する)。バーコード配列の使用は当業者に周知であり、本発明に関連して任意の適切なバーコード配列を使用することができる。バーコード配列は任意の長さ、例えば、3、4、5、6、7、8、9塩基対又はそれ以上の長さであってもよい。第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、1つ又はそれ以上、例えば、1つ、2つ、又はそれ以上のバーコード配列を含んでもよい。
【0125】
いくつかの実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、第1抗体-DNAアダプター結合体の抗体部分がその標的に結合できるようになる前又は後に、工程(b)(i)で作成された脱リン酸化されたDNA断片の末端に対して粘着性にされる。当業者であれば、第1抗体-DNAアダプター結合体の第1DNAアダプター部分が、核と接触したときに、工程(b)(i)で作成された脱リン酸化されたDNA断片の末端にすでに粘着性である可能性があるが、核に含まれるDNAが第1制限エンドヌクレアーゼで消化される前、最中、又は後に粘着性にされてもよいことを理解するであろう。例えば、いくつかの実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、制限エンドヌクレアーゼとしてNdeI又はBglIIを使用することによって粘着性にされる。DNAアダプターに粘着末端を作成するために、当業者は、他の適切な制限酵素を選択し使用することができる。
【0126】
好適な実施態様において、第1抗体-DNAアダプター結合体の第1DNAアダプター部分は、
・50~150塩基対の長さを有し;
・第1バーコード配列を含み、ここで好ましくは、第1バーコード配列は、抗体-DNAアダプター結合体の抗体部分を特異的に識別し;そして
・第1抗体-DNAアダプター結合体の抗体部分がその標的に結合できるようになる前又は後に、工程(b)(i)で作成された脱リン酸化されたDNA断片の末端に対して粘着性にされる。
【0127】
本発明の実施態様において、第1DNAアダプター部分が脱リン酸化DNA断片の末端に連結することを可能にする条件がDNAリガーゼの使用を含む方法が提供される。いくつかの実施態様において、脱リン酸化DNA断片は、例えば、当業者に知られている技術を使用して、最初に再リン酸化されてもよい。いくつかの実施態様において、これは、例えば、試料のプール後及びインビトロ転写前に、例えばT4キナーゼなどのキナーゼと、続いてリガーゼとインキュベートすることによって行われる。
【0128】
本明細書で説明されるように、(1つ又はそれ以上の異なる)第1制限エンドヌクレアーゼを用いる処理によって得られたDNA断片の5’末端は、再連結又は自己連結を低減するために、5’末端のリン酸基を除去する(すなわち、脱リン酸化する)ように処理される。当業者は、例えば市販のキット又は酵素、例えば子牛腸アルカリホスファターゼ、エビアルカリホスファターゼ、又は南極ホスファターゼ(New England Biolabs)などのホスファターゼを使用して、5’末端を脱リン酸化する方法をよく知っている。
【0129】
第1DNAアダプター部分を脱リン酸化されたDNA断片の末端に連結することを可能にするために、DNAリガーゼを使用することができる。連結は、第1DNAアダプター部分と脱リン酸化されたDNA断片の3’末端と5’末端の間のホスホジエステル共有結合の形成である。当業者は、本発明の方法のこの工程で適切に使用できるリガーゼをよく知っている。適切なDNAリガーゼは当技術分野でよく知られており、適切なDNAリガーゼの非限定的な一例は、T4 DNAリガーゼである。
【0130】
実施態様において、本発明の方法が提供され、ここで、工程(c)における試料の処理は、1つ又はそれ以上のプロテアーゼで試料を処理することを含み、好ましくは、ここでプロテアーゼはプロテイナーゼKであり、及び/又は、ここでタンパク質の分解は熱処理を含み、好ましくはここで、熱処理は50~70℃の温度で行われる。
【0131】
例えば、いくつかの実施態様において、プロテイナーゼを用いてタンパク質を消化する処理は、50~60℃の温度、例えば約56℃の温度で行われる。次に、好適な実施態様において、透過処理及び固定された細胞核に存在する架橋(例えば、ホルムアルデヒド処理によって、又は異なる架橋反応を介して達成される)は、60℃を超える温度、例えば約65℃の温度で試料を長時間加熱することによって逆転される。これにより、細胞又は核(存在する場合)も溶解される。
【0132】
プロテアーゼは当業界ではよく知られており、ペプチド中のペプチド結合を加水分解することによってタンパク質の分解を触媒するために一般的に使用されている。本方法の工程(c)では、試料は、好ましくはタンパク質分解酵素、より好ましくはプロテアーゼを前記試料に提供することによって処理される。タンパク質を分解するための適切なプロテアーゼは当業界で知られており、本発明の方法で使用するのに当業者により利用され得る。しかし、1つの好適な態様において、本発明の方法で使用されるプロテアーゼは、一般的に使用される広域スペクトルのセリンプロテアーゼであるプロテイナーゼKである。本発明の方法の工程(c)でタンパク質を分解する1つの非限定的な例は、約56度の温度でプロテイナーゼによって分解することを含む。これにより核も溶解される。1つの態様において、本発明の方法は、工程(c)の処理が1つ又はそれ以上のプロテアーゼで処理することを含む方法を提供し、好ましくはプロテアーゼはプロテイナーゼKである。
【0133】
あるいは、又はさらに、工程(c)の処理は、例えば50~70℃、好ましくは約65℃の温度である時間だけ熱処理することによってタンパク質を分解することを含む。この処理はまた、例えば、透過処理及び固定された核(及び存在する場合には細胞)内に存在する可能性のあるタンパク質間のあらゆる架橋を逆転させる。
【0134】
本発明の方法の工程(c)中に、第1抗体-DNAアダプター結合体の抗体又は抗体部分も分解されることが理解される。続いて、本明細書で提供されるDNAアダプター-DNA断片は、前記抗体から分離される。
【0135】
実施態様において、本発明の方法が提供され、ここで第2制限エンドヌクレアーゼは、
・平滑末端を作成するか、オーバーハングのある末端を作成し;
・少なくとも4~8塩基対の長さ、好ましくは6~8塩基対の長さ、さらにより好ましくは8塩基対以上の長さの認識部位を認識し;
・NotI及びSfiIからなる群から選択され;
・平均して20,000~2,000,000塩基対ごとにDNAを切断する制限エンドヌクレアーゼであり;及び/又は
・最初の制限エンドヌクレアーゼによって作成される末端とは異なる末端を作成する。
【0136】
本方法の工程(c)の工程(ii)で提供される制限酵素とも呼ばれることもある第2制限エンドヌクレアーゼは、工程(b)で核に含まれるDNAと接触させられた第1抗体-DNAアダプター結合体の第1DNAアダプター部分に含まれる第2制限部位を切断するために使用される。第2制限エンドヌクレアーゼによって導入された切断は、工程(d)の第2DNAアダプター-第1DNAアダプターDNA断片生成物を提供するために、本発明の方法の工程(d)における第2の(直鎖)DNAアダプターとのその後の連結に使用される。当業者は、制限エンドヌクレアーゼ、及び本発明の方法における使用に適した制限エンドヌクレアーゼ、及び本発明に関連してこれらをどのように使用するかをよく知っている。この方法の好適な実施態様において、第2制限エンドヌクレアーゼは第1制限エンドヌクレアーゼと同一ではない(又は同じ)。この方法の好適な実施態様において、第2制限エンドヌクレアーゼによって認識される制限部位は、第1の制限エンドヌクレアーゼによって認識される制限部位とは異なる。この方法の別の好適な実施態様において、第1DNA-アダプター-DNA断片生成物は、第2制限エンドヌクレアーゼの認識部位を1つだけ含む。他の好適な実施態様において、第2制限エンドヌクレアーゼは、第1DNA-アダプターDNA断片の第1DNAアダプター部分に切断を導入するだけである。
【0137】
本発明の方法は、特定のタイプの制限エンドヌクレアーゼに特に限定されないが、いくつかの好適な実施態様において、第2制限エンドヌクレアーゼは、長さが4~8塩基対、例えば、4、5、6、7、又は8塩基対である認識部位を認識する。好ましくは、第1の制限エンドヌクレアーゼの認識部位は、6~8塩基対の長さ、さらには8塩基対以上の長さである。ヌクレオチドの特定の配列を認識した後、制限エンドヌクレアーゼはDNA鎖に切断を生じる。多くの場合、及び好適な実施態様において、第2制限エンドヌクレアーゼによって導入される切断は二本鎖切断であり、すなわち、二本鎖(ds)DNAの両方の鎖が第2制限エンドヌクレアーゼによって切断される。
【0138】
いくつかの実施態様において、本方法で使用される第2制限エンドヌクレアーゼは、平均して20,000~2,000,000塩基対ごと、好ましくは20,000~100,000塩基対ごと、例えば40,000~80,000塩基対ごとに、核に含まれるDNAを切断することが好ましい。言い換えれば、平均して、この方法で使用するために選択された第2制限エンドヌクレアーゼは、20,000~2,000,000塩基対ごとに認識部位を認識する。当業者は、本発明の方法において第2制限エンドヌクレアーゼとして使用するのに適した制限エンドヌクレアーゼを選択する方法を理解している。選択される第2制限エンドヌクレアーゼは、例えば、本方法で使用される核が得られる生物のタイプ、又は方法で使用される第1の制限エンドヌクレアーゼのタイプに依存し得ることは、当業者には理解されよう。
【0139】
いくつかの実施態様において、第2制限エンドヌクレアーゼは平滑末端、すなわち非粘着末端を作成するが、好適な実施態様において、第2制限エンドヌクレアーゼはオーバーハングを有する末端(粘着末端とも呼ばれることもある)を作成する。第2制限エンドヌクレアーゼが平滑末端を生成する場合、本発明の方法の後続の工程で提供される第2のDNAアダプターにも平滑末端が提供され、それにより、第2制限エンドヌクレアーゼによって導入された平滑末端に連結することが可能になる。別の実施態様において、第2制限エンドヌクレアーゼによって作成された平滑末端は、オーバーハングを作成するためにさらに修飾されてもよい。
【0140】
オーバーハング、例えば第2制限エンドヌクレアーゼによって導入されるオーバーハングは、任意の長さであってもよく、例えばオーバーハング(例えば3’オーバーハング)は、1ヌクレオチド以上、例えば2、3、又は4ヌクレオチド以上であってもよい。本明細書で説明されているように、好適な実施態様において、第2制限エンドヌクレアーゼによって生成される末端は、本発明の方法で使用される第2DNAアダプターに存在するか又は提供される末端に対して粘着性である末端である。
【0141】
本発明は特に特定の第2制限エンドヌクレアーゼに限定されないが、いくつかの好適な実施態様において、第1制限エンドヌクレアーゼはNotI及びSfiIからなる群から選択される。これらの制限エンドヌクレアーゼは、さまざまな供給元から市販されており、当業者は、本発明に関連してこれらをどのように使用するかをよく知っている。当業者は、前記制限酵素及び前記制限酵素を用いてDNAを処理する方法に精通している。
【0142】
最後に、いくつかの実施態様において、2タイプ以上の第2制限エンドヌクレアーゼが本方法において使用されることが企図される。例えば、いくつかの実施態様において、2つ、3つ、又はそれ以上の異なる第2制限エンドヌクレアーゼが、好ましくは同じ実験において同時に又は連続的に、本発明の方法に適用される。例えば、2つ以上の異なるタイプの第1抗体-DNAアダプター結合体が使用され、及び例えばそれぞれが異なる第2制限部位を含む実施態様において、2つ以上の第2制限エンドヌクレアーゼを本方法で使用することができる。従って、いくつかの実施態様において、2つ以上のタイプの第1抗体-DNAアダプター結合体が使用され、及びここで、それぞれの異なるタイプの第1抗体-DNAアダプター結合体は、同じ第2制限部位を含むか、又は同じ第2制限エンドヌクレアーゼによって認識される制限部位を含む。他の実施態様において、2つ以上のタイプの第1抗体-DNAアダプター結合体が使用され、及びここで、異なるタイプの第1抗体-DNAアダプター結合体は、異なる第2制限部位を含むか、又は異なる第2制限エンドヌクレアーゼによって認識される制限部位を含む。例えば、当業者には理解されるように、本発明の方法では、2つ以上のタイプの第1抗体-DNAアダプター結合体が使用されることが企図され、例えばここで、異なるタイプの第1抗体-DNA中の抗体は、目的のさまざまなタンパク質及び/又は目的の修飾に向けられている。
【0143】
本発明の実施態様において、第2のDNAアダプターが、
- 線状であり、好ましくは50~100塩基対の長さを有する;
- T7-RNAポリメラーゼ結合配列及びT3-RNAポリメラーゼ結合配列から選択されるRNAポリメラーゼ結合配列を含む;
- DNAプライマー配列(これは、例えば、プライマーとPCRを使用するDNAの増幅を可能にし、続いて配列決定される)を含む;
- 試料を特異的に識別する前記第2バーコード配列を含む;及び/又は
- 好ましくはP5アダプター配列(Illumina)、P7アダプター配列(Illumina)から選択される、1つ又はそれ以上のさらなるアダプター配列を含む、方法が提供される。
【0144】
当業者は、本発明が本明細書に開示されるような特定の第2DNAアダプターに限定されないことを理解している。しかしながら、好適な実施態様において、第2のDNAアダプターは、工程(c)(ii)において第1DNAアダプターの第2制限部位に作成された末端に対して粘着性である。さらに好適な実施態様において、第2DNAアダプターは、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列の隣に、第2バーコード配列を含む。本発明の方法の実施態様において、第2バーコード配列は、RNAポリメラーゼ結合配列及び/又はDNAプライマー配列と、第1DNAアダプターの第2制限部位に作成された末端に対して粘着性である末端との間に、位置する。
【0145】
当業者が理解するように、第2DNAアダプターは好ましくは線状である。好適な実施態様において、第2DNAアダプターは二本鎖である。いくつかの実施態様において、第2DNAアダプターは一本鎖である。(線状の)第2DNAアダプターの長さは特に制限されないが、好ましくは、第2DNAアダプターは20~200塩基対、好ましくは50~100塩基対、例えば約70~75塩基対の長さを有する。
【0146】
本発明の実施態様において、第2DNAアダプターは、T7-RNAポリメラーゼ結合配列及びT3-RNAポリメラーゼ結合配列から選択されるRNAポリメラーゼ結合配列を含む。このようなT7-RNAポリメラーゼ結合配列及びT3-RNAポリメラーゼ結合配列は当業者によく知られている。T7 RNAポリメラーゼは、特定のプロモーターDNA配列(又はT7-RNAポリメラーゼ結合配列)に結合し、DNA二重鎖を開いた後、RNA合成を開始する。例えば、T7プロモーターは、+1の転写開始部位までの長さ18塩基対のDNA配列(5’-TAATACGACTCACTATAG-3’)であり、T7 RNAポリメラーゼによって認識される。T3プロモーター配列は5’-AATTAACCCTCACTAAA-3’である。T3RNAポリメラーゼは、プロモーター配列の下線を引いたGで転写を開始する。次にこのポリメラーゼは反対側の鎖を鋳型として使用して5’→3’に転写する。T7-RNAポリメラーゼ結合配列(例えば、プロモーター配列)、T3-RNAポリメラーゼ結合配列(例えば、プロモーター配列)、及びこれらを使用する方法は、当業者によく知られている。
【0147】
さらに好適な実施態様において、第2DNAアダプターは、試料を特異的に識別する第2バーコード配列を含む。バーコード配列の使用は、当業者には周知であり、本発明に関連して、任意の適切なバーコード配列を使用することができる。バーコード配列は、任意の長さ、例えば3、4、5、6、7、8、9、又はそれ以上の塩基対の長さであってもよい。第2DNAアダプターは、1つ又はそれ以上のバーコード、例えば1つ、2つ、又はそれ以上のバーコード配列を含むことができる。
【0148】
さらに好適な実施態様において、DNAアダプターは、追加のアダプター配列、例えばP5アダプター配列(Illumina)及び/又はP7アダプター配列(Illumina)を含み得る。このようなアダプターには、シーケンサーによる断片認識のためのプラットフォーム特異的配列が含まれる:例えば、P5及びP7アダプター配列は、ライブラリ断片がIlluminaプラットフォームのフローセルに結合することを可能にする(例えば、本発明の方法の工程(e)中)。
【0149】
さらなる実施態様において、第2DNAアダプターは、定量的測定を行うためのUMI配列(固有の分子識別子)、例えば2×3bp、すなわち合計6塩基対をさらに含み得る。UMIは当業者には周知であり、一般にPCR増幅工程の前に配列決定ライブラリに追加される複合インデックスと呼ばれ、PCR複製の正確なバイオインフォマティク識別を可能にする。UMIは定量的配列決定アプリケーションにとって貴重なツールであり、RNA-SeqやChIP-Seqなどの技術で頻繁に使用される。UMIは、増幅前に配列決定ライブラリ分子に固有の分子タグを追加することにより、PCR重複の問題を軽減する可能性がある。
【0150】
さらなる実施態様において、第2DNAアダプターは、第1DNAアダプター部分の第2制限エンドヌクレアーゼ部位に作成された末端に連結していない末端に、分岐状のオーバーハングをさらに含んでもよい。これは、第2DNAアダプターがそれ自体に(5’末端から)連結するのを防ぐためである。このような分岐オーバーハングは、例えば、各鎖の末端に1つ又はそれ以上のヌクレオチドを含めることによって提供され得、ここで、各鎖のヌクレオチドはもはや相補的ではない。例えば、分岐状オーバーハングを末端に設けることができ、これは鎖間で相補的でない6塩基対を含む。
【0151】
本発明の実施態様において、工程(d)において第1DNAアダプターの第2制限部位に作成された末端に第2のDNAアダプターを連結させる条件がDNAリガーゼの使用を含む、方法が提供される。
【0152】
第1抗体-DNAアダプター結合体の第1DNAアダプター部分と工程(b)で得られたDNA断片の末端との連結に関して本明細書の他の場所で説明したように、また第2DNAアダプターの連結に関しても、第1DNAアダプター部分の第2の制限酵素部位に作成された末端との連結は、好ましくはDNAリガーゼを使用して行われる。当業者は、本発明の方法のこの工程で適切に使用され得るリガーゼを充分知っている。適切なDNAリガーゼは当技術分野でよく知られており、適切なDNAリガーゼの非限定的な一例は、T4 DNAリガーゼである。
【0153】
本明細書で既に広範に説明されているように、本発明の実施態様において、以下の方法が提供される:
- 2つ以上の第1制限エンドヌクレアーゼが使用される;
- 2つ以上の第1抗体-DNAアダプター結合体が使用され、ここで、前記抗体、又は前記抗体が向けられるタンパク質、第1DNAアダプター部分、第1バーコード配列、又はそれらの任意の組み合わせが、同じであっても異なっていてもよい;
- 2つ以上の第2制限エンドヌクレアーゼが使用される;及び/又は
- 2つ以上の第2DNAアダプターが使用され、ここで、前記第1DNAアダプターの第2制限部位に作成された末端、第2バーコード、RNAポリメラーゼ結合配列、又は1つ又はそれ以上のさらなるアダプタ配列、あるいはそれらの任意の組み合わせに対して粘着性である第2DNAアダプターの末端が同じであっても異なっていてもよい。
【0154】
当業者には理解されるように、本方法の利点の1つは、多種多様な実験条件下で堅牢でありながら再現性があり、従って幅広い目的に使用できることである。また、当業者には、さまざまな(個別の)態様について本明細書に記載されているさまざまな変更態様、実施態様、及び優先事項は、本発明に関連して、本明細書に記載の他の個別の態様のさまざまな態様、変更態様、実施態様、及び優先事項と組み合わせることができることも理解される。このような組み合わせは、少なくとも本開示の文脈から暗黙的に示される。例えば、いくつかの実施態様において、本発明の方法は、単一のタイプの細胞から、又は異なるタイプの細胞から得られた核の使用を可能にする。いくつかの実施態様において、核は同期された細胞から得られ、他の実施態様において、細胞(増殖期)の同期は必要ない。いくつかの例では、そこから核が得られた細胞は、細胞に対するその効果を理解するために薬剤で処理されている。他の実施態様において、細胞は、例えば遺伝子修飾の効果を研究するために遺伝子修飾されている。いくつかの実施態様において、試料中の核は細胞内に含まれ、他の実施態様において、試料を提供する前に、核は細胞から単離されている。いくつかの実施態様において、1つのタイプの第1制限エンドヌクレアーゼが使用され、いくつかの実施態様において、異なる第1制限エンドヌクレアーゼの組み合わせが使用される。いくつかの実施態様において、1つのタイプの第1抗体-DNAアダプター結合体が使用され、他の実施態様において、1つ又はそれ以上のタイプの第1抗体-DNAアダプター結合体が使用される。いくつかの実施態様において、第1抗体-DNAアダプター結合体の抗体部分は目的のタンパク質に向けられ、他の実施態様において、第1抗体-DNAアダプター結合体の抗体部分は、異なる目的のタンパク質に向けられる。いくつかの実施態様において、第1抗体-DNAアダプター結合体の第1抗体部分は、目的のタンパク質の翻訳後修飾に向けられ、例えば、本明細書に記載されたものを含むヒストン修飾に向けられる。そのような実施態様において、第1抗体-DNAアダプター結合体の抗体部分は、そのような修飾を有するそのような目的のタンパク質と、同じ修飾を有しない同じ目的のタンパク質とを区別する。2つ以上の第1抗体-DNAアダプター結合体が使用される実施態様において、異なるタイプの第1抗体-DNAアダプター結合体の抗体部分は、同じ目的タンパク質に向けられ、同じタンパク質内の異なるエピトープに向けられ、同じタンパク質の異なる翻訳後修飾(例えば、同じタンパク質内の、第1修飾を認識する第1抗体、及び第2修飾を認識する第2抗体)に向けられ、及び/又は異なる目的タンパク質に向けられ得る。ある実施態様において、第1抗体-DNAアダプター結合体は同じ第2制限部位を含み、ある実施態様において、第1抗体-DNAアダプター結合体は異なる第2制限部位を含み得る。いくつかの実施態様において、第1抗体-DNAアダプター結合体は、抗体部分に関して異なるか、及び/又はDNAアダプター部分に関して異なるか、又は両方である第1抗体-DNAアダプター結合体が使用される。いくつかの実施態様において、第1抗体-DNAアダプター結合体はバーコードを含む。いくつかの実施態様において、異なる第1抗体-DNAアダプター結合体は異なるバーコードを含む。いくつかの実施態様において、及び1つ又はそれ以上の第1抗体が使用され、及び1つ又はそれ以上の第1抗体-DNAアダプター結合体(及び、これは第1抗体に結合できる)が使用される場合、異なる第1抗体は、第1抗体-DNAアダプター結合体の抗体部分について説明したように、同様に、同じ又は異なる目的のタンパク質(そのようなタンパク質に対する異なる翻訳後修飾を含む)に向けられ得る。いくつかの実施態様において、1つのタイプの第2制限エンドヌクレアーゼが使用され、他の実施態様において、本明細書で既に説明したように、2つ以上のタイプの第2制限エンドヌクレアーゼが使用される。いくつかの実施態様において、1つのタイプの第2DNAアダプターが使用される。2つ以上の第2DNAアダプターが使用されるいくつかの実施態様において、いくつかの実施態様において、2つ以上の第2DNAアダプターが使用されるいくつかの実施態様において、第1DNAアダプターの第2制限部位に作成された末端、第2バーコード、RNAポリメラーゼ結合配列、DNAプライマー配列、又は1つ又はそれ以上のさらなるアダプター配列、又はそれらの任意の組み合わせは、同じであっても異なっていてもよい。第1抗体-DNAアダプター結合体は、第1抗体-DNAアダプター結合体で標的とされる目的のタンパク質又は修飾をコード化/識別することを可能にする配列を含み得る(直接に、又は目的のタンパク質に向けられた第1の抗体が使用される場合には間接的に)。第2のDNAアダプターは、例えばプール化及びその後の配列決定の場合に、特定の試料/細胞をコード化/識別することを可能にする配列を含み得る。同時に、当業者は、本明細書に記載される実施態様に関する各選択肢を、例えば上記で記載される選択肢を、本発明の方法において組み合わせ得ることを理解している。
【0155】
本発明の方法のいくつかの実施態様において、第2DNAアダプター-第1DNAアダプター-DNA断片生成物の増幅が線形増幅による方法が提供される。本発明は、得られた第2DNAアダプター-第1DNAアダプター-DNA断片を増幅する特定の方法に特に限定されるものではないが、いくつかの実施態様において線形増幅が好ましい。線形増幅によるDNAの増幅は、その変更態様を含めて、例えば実施例に記載されているように、及び/又は例えば Liu et al (BMC Genomics 4:19(2003)) 及びその他によって記載されているように、当業者には周知の技術である。
【0156】
本発明のいくつかの実施態様において、工程(b)の前、又は工程(b)の一部として、又は工程(c)の前に、核を分類して、1つ又はそれ以上の、好ましくは1つ又はそれ以上の、好ましくは分類された試料1つにつき1つの核を含む試料を提供する方法、及び好ましくは、ここで工程(c)若しくは工程(d)の後又は工程(e)の前に、1つ又はそれ以上の分類された試料がプールされる方法が提供される。本発明による方法の可能な実施態様の概要(図1)に示されているように、必須ではないが、方法中に、分類工程が導入されてもよい。いくつかの実施態様において、分類は、工程(b)が実施される前に実施される。いくつかの実施態様において、分類は、工程(b)の一部として、例えば工程(ii)の一部として実施され、工程(ii)は、工程(i)が実施される前、実施中、又は実施後に実施される。例えば、いくつかの実施態様において、工程(b)において、工程(i)が実施される前に工程(ii)が実施される。このような実施態様において、DNAを含む細胞核は、第1抗体-DNAアダプター結合体と、又は第1の抗体及び第1抗体-DNAアダプター結合体と、及びDNAが第1の制限エンドヌクレアーゼで消化される前に、接触される。このような好適な実施態様において、分類は、第1抗体-DNAアダプター結合体との接触、又は第1抗体及び第1抗体-DNAアダプター結合体との接触後に実施することができ、及びここで、分類後、分類された試料中の核内のDNAは消化される。他の実施態様において、分類は、図1に示すように、工程(c)の前、例えば工程(b)の後に行われる(ここで、図中の「二次抗体結合体」及び「一次抗体結合体」は本明細書で使用される第1抗体-DNAアダプター結合体を指し、図中の「試料アダプター」は、本明細書で使用される第2アダプターを指す)。核の分類は、当業者が利用可能な技術、例えばFACSソーティング、及び本明細書の実施例に記載されているような技術を使用して行うことができる。細胞/核の分類は、例えば、細胞周期の期のステージに基づき、例えば細胞の細胞周期、例えばG1/S細胞周期にある細胞を得るために行うことができる。しかしながら、当業者は、1つ又はそれ以上の分類された試料中の細胞又は核の分類が、他のマーカーの検出に基づいてもよく、例えば特定のマーカーの発現レベルの存在に基づき、例えば細胞表面受容体の抗体染色に基づく(例えば、血液試料中の起源細胞を決定するために、FACSに基づいて、次に本発明の方法により)ことを理解している。他の実施態様において、細胞は、例えば MitoTracker を使用して、代謝活性を基礎となるエピジェネティックプロファイルに関連付けるために、ミトコンドリアの数について染色され得る。細胞、核は、例えば複数のウェルプレートを使用して、それぞれが例えば1つ又はそれ以上の細胞又は核、例えば10、50、100、250、500、又はそれ以上の核を含む、異なる分類試料中で分類することができる。別の実施態様において、分類された試料は、例えば1つ又はそれ以上の試料にプールすることができ、及び好適な実施態様において、工程(c)の後、工程(d)の後、又は工程(e)の前、例えば増幅及び配列決定の前にプールすることができる。
【0157】
本発明の実施態様において、多種多様な考えられる目的のための、例えば、ゲノム全体のタンパク質-DNA相互作用プロファイル、ゲノム全体のエピジェネティックプロファイルの生成、タイプ特異的なエピジェネティック及び/又はタンパク質-DNA相互作用プロファイル間の比較、又は異なる発生段階の胚間のエピジェネティック及び/又はタンパク質-DNA相互作用プロファイルの比較、例えば、異なる治療計画に従う異なる疾患段階の腫瘍形成におけるエピジェネティック及び/又はタンパク質-DNA相互作用プロファイル間の比較、異なる遺伝子座でのタンパク質-DNA相互作用の分析、得られた1つ又はそれ以上の試料間のタンパク質-DNA相互作用の比較、生物の疾患組織と健康な組織間又は異なる部分間のタンパク質-DNA相互作用の比較のための、本発明の方法の使用も提供される。
【0158】
本明細書の開示に基づいて、熟練した技術者は、上記の特定された目的に沿って実験を設定する方法、及び本発明の方法を含めてそのような実験を実施する方法を知っている。
【0159】
本発明の実施態様において、本明細書に開示される1つ又はそれ以上の第1抗体-DNAアダプター結合体と、本明細書に開示される対応する第2DNAアダプターとを含むキットも提供される。いくつかの実施態様において、キットは、1つ又はそれ以上の第1制限エンドヌクレアーゼ、1つ又はそれ以上の第2制限エンドヌクレアーゼ、及び/又は1つ又はそれ以上の第1抗体をさらに含んでもよい(例えば、本発明の方法が工程(b)(ii)(2)に従って実施される場合)。
【0160】
特定の実施態様に関する前述の説明は、本発明の一般的な性質を完全に明らかにするものであるため、他の研究者達は、当該技術分野の知識(本明細書で引用した参考文献の内容を含む)を適用することにより、過度の実験を行うことなく、本発明の一般的な概念から逸脱することなく、さまざまな用途のためにそのような特定の実施態様を容易に修飾及び/又は適用させることができる。従って、そのような適用及び修飾は、本明細書で提示された教示及びガイダンスに基づいて、開示された実施態様の同等物の意味及び範囲内にあることが意図されている。
【0161】
雑誌記事や要約、公開された特許出願、又は対応する特許出願、特許、又はその他の参考文献を含む、本明細書で引用されるすべての参考文献は、引用された参考文献に示されているすべてのデータ、表、図、及びテキストを含めて、参照により全体が本明細書に組み込まれる。さらに、本明細書で引用される参考文献内で引用される参考文献の内容全体も、参照により全体が組み込まれる。
【0162】
既知の方法の工程、従来の方法の工程、既知の方法又は従来の方法への言及は、いかなる態様においても、本発明の説明又は実施態様が、関連技術において開示、教示、又は示唆されていることを認めるものではない。
【0163】
本明細書の表現又は専門用語は、説明のためであって、限定を目的とするものではなく、従って、本明細書の専門用語又は表現は、本明細書に提示される教示及びガイダンス指針に照らして、当業者の知識と組み合わせて、当業者によって解釈されるべきものであることを理解されたい。
【0164】
本発明の実施態様の一態様に関して論じたすべての詳細、実施態様、及び優先事項は、本発明の他の態様又は実施態様にも同様に適用可能であり、従って、そのような詳細、実施態様、及び優先事項のすべてを、すべての側面について個別に詳述する必要はないことが理解されるであろう。
【0165】
本発明を一般的に説明したが、以下の実施例を参照すれば、本発明がさらに容易に理解されるであろう。これらの実施例は、説明のために提供されており、決して本発明を限定するものではない。当業者には、さらなる態様及び実施態様が明らかであろう。
【実施例
【0166】
実施例1-材料と方法
細胞培養
一倍体KBM7細胞を、10%FBS(Sigma、F7524)及び1%Pen/Strep(Gibco、15140122)を補足したイスコブ改変ダルベッコー培地(IMDM、Gibco、31980030)中で懸濁液培養した。Shield1誘導性のDam-LaminB1を含む安定したKBM7細胞株を、以前に記載されているように使用した(Kind, J. et al. Cell 163, 134-147 (2015))。細胞は2~3日ごとに継代された。K562細胞は、10%FBS及び1%Pen/Strepを補足したRoswell Park Memorial Institute 1640(RPMI1640、Gibco、61870010)中で懸濁培養した。
【0167】
抗体
抗体については表1を参照されたい。
【表1-1】
【表1-2】
【0168】
ABBC及びSCBアダプター
二本鎖ABBCアダプターを、SPAACクリック反応を介して抗体に結合した。二本鎖アダプターの上の鎖は、HPLC精製オリゴとして生成され、抗体結合を可能にするための5’アジド修飾(IDT、/5AzideN/)を有する。二本鎖アダプターの下の鎖は、標準脱塩オリゴとして生成され、MseI消化DNAへの連結を容易にするための5’リン酸化修飾(IDT、/5Phos/)と2ntのTA(5’から3’)オーバーハングを有する。設計のその他の要素は、(5’から3’へ)、55ntのリンカー、NotI認識部位、及び6ntのABBCバーコードであった。適切な上の鎖と下の鎖の配列の例を表2に示す。
【0169】
【表2】
【0170】
上部オリゴと下部オリゴを1:1の比率で、0.5mL DNA低結合チューブ(Eppendorf、0030108400)内の1×アニーリング緩衝液(10mMトリス-Cl、pH7.4、1mM EDTA、及び100mM NaCl)中で最終濃度10μMで、PCR装置で95°Cで5分間インキュベートすることによりアニーリングした後、15秒ごとに0.5°Cずつ徐々に冷却して最終温度4°Cまで下げた。
【0171】
SCBアダプターは、ABBCアダプターに連結できる分岐二本鎖DNAアダプターとして設計された。下部アダプターは5’リン酸化修飾(IDT、/5Phos/)及び4nt GGCC(5’から3’)オーバーハングを有し、NotI消化DNAへの連結を容易にする。上部及び下部オリゴの両方とも、標準脱塩オリゴとして生成された。設計の他の要素は、(5’から3’へ)6ntの非相補的フォーク、T7プロモーター、5’ Illuminaアダプター(Illumina 小RNAキットで使用されるもの)、及び分割された2x4nt SCBバーコードが挟まれた分割された2x3nt 固有の分子識別子(UMI)であった。適切な上部及び下部配列の例については、表3を参照されたい。上部及び下部のオリゴを1:1の比率で、1×アニーリング緩衝液(10mMトリス-Cl、pH7.4、1mM EDTA、及び50mM NaCl)中で最終濃度40μMで96ウェルプレート内で、PCR装置中で95°Cで5分間インキュベートし、その後15秒ごとに0.5°Cで最終4°Cまで徐々に冷却してアニーリングした。二本鎖SCBアダプターは使用前にさらに希釈した。
【0172】
【表3】
【0173】
抗体-DNA結合
二次抗体-DNA結合は、Harada, A. et al. 20192 に記載されている方法に若干の変更を加えて行った。簡単に説明すると、ヤギ抗ウサギIgG(Jackson ImmunoResearch, 111-005-114)、ロバ抗マウスIgG(Jackson ImmunoResearch, 715-005-150)、ロバ抗ラットIgG(JacksonImmunoResearch、712-005-150)、又はロバ抗ヒツジIgG(Jackson ImmunoResearch, 713-005-147)を、Zeba(商標)スピン脱塩カラム(40K MWCO、0.5mL、ThermoFisher、87767)を使用して、保存緩衝液から100mM NaHCO(pH8.3)に緩衝液交換した。続いて、0.25μLのDBCO-PEG4-NHS(ジメチルスルホキシド(DMSO)中25mMで溶解、抗体に対して10倍のモル比)を加えることにより、100μLの100mM NaHCO(pH8.3)中の100μgの抗体をジベンゾシクロオクチン(DBCO)-PEG4-NHSエステル(Sigma、764019)と結合させ、チューブローラー上で室温で1時間インキュベートした。試料をZeba(商標)スピン脱塩カラムに通して遊離DBCO-PEG4-NHSを除去し、直接PBSに緩衝液交換した。DBCO-PEG4結合抗体を、Amicon Ultra-0.5 NMWL 10kDa遠心フィルター(Merck Milipore、UFC501024)を使用して濃縮し、NanoDrop(商標)2000で測定した。DBCO-PEG4結合抗体を、PBSで1μg/μLに希釈した。75μLのDBCO-PEG4結合抗体(75μg、PBS中)と100μLの二本鎖ABBCアダプター(10μM、「ABBC及びSCBアダプター」のセクションを参照)を混合することにより、抗体とABBCアダプターを1:2のモル比で結合させた。試料を8rpmのローターで4℃で1週間インキュベートした。その後、Harada, A. et al. (Harada, A. et al. Nature Cell Biology 21, 287-296 (2019)) に記載のように、ABBC-抗体結合体のクリーンアップを行い、平均収量20~30gを得た。ABBC-抗体結合体を4°Cで保存した。
【0174】
一次抗体-DNA結合は、ここで説明した方法に若干の変更を加えて行った。一次抗体は、まず製造元の指示に従ってAbcam抗体精製キット(プロテインA)(Abcam、ab102784)を用いて精製した(8rpmのローター上のスピンカートリッジで4℃で一晩インキュベートした)。収量を最大にするために、4つの溶出相をすべて採取した。精製された抗体を、Amicon Ultra-0.5 NMWL 10-kDa 遠心フィルターを使用して濃縮し、その後350μLの100mM NaHCOを加えて再度濃縮して緩衝液を交換した。濃縮された抗体を、NanoDrop(商標)2000 で測定した。以後の工程は、「抗体結合」のセクションで、DBCO-PEG4-NHSインキュベーション以降を、記載されているように実施した。
【0175】
細胞の採取、固定、透過処理
細胞を採取し(約15x10細胞)、PBSで1回洗浄した。遠心分離工程は、200g、4°Cで4分間行った。細胞をPBS中の1%ホルムアルデヒド(Sigma、F8875)で5分間固定した後、最終濃度125mMのグリシン(Sigma、50046)で反応を停止し、細胞を氷上に置いた。その後の工程は氷上又は4℃で行った。細胞をPBSで3回洗浄した後、洗浄緩衝液1(20mMヘペス、pH7.5(Gibco、15630-056)、150mM NaCl、66.6μg/mLスペルミジン(Sigma、S2626-1G)、1× cOmplete(商標)プロテアーゼ阻害剤カクテル(Roche、11697498001)、0.05%サポニン(Sigma、47036-50G-F)、2mM EDTA)に再懸濁し、1.5mLタンパク質低結合エッペンドルフチューブ(Eppendorf、EP0030108116-100EA)に移した。細胞をチューブローラー上で4℃で30分間透過処理した。ウシ血清アルブミン(BSA、Sigma、A2153-50g)を最終濃度5mg/mLになるように添加し、チューブローラー上で4℃でさらに60分間インキュベートした。透過処理した核は、抗体のインキュベーション(標準MAb-ID手順)又はバルク消化(代替MAb-ID手順)に使用した。
【0176】
抗体のインキュベーション
遠心分離工程を、200g、4°Cで4分間行った。
【0177】
一次抗体結合体。
透過処理した核(「細胞の採取、固定、及び透過処理」のセクションを参照)をTC20(商標)自動細胞カウンター(BioRad、1450102)でカウントした。核を洗浄緩衝液1で約3x10細胞/mLに希釈し、そのうち200μL(約600,000個の核)を各一次抗体のインキュベーションに使用した。ABBCアダプターに結合した一次抗体(「抗体-DNA結合」のセクションを参照)を加え、チューブローラー上で4℃で一晩インキュベートした(使用した抗体濃度については表1を参照)。各実験では、一次抗体を含まない対照試料も使用した。翌朝、核を洗浄緩衝液2(20mMヘペス、pH7.5、150mM NaCl、66.6μg/mLスペルミジン、1× cOmplete(商標)プロテアーゼ阻害剤カクテル、0.05%サポニン)で2回洗浄し、 Hoechst 34580(Sigma、63493)を含む200μLの洗浄緩衝液2に1μg/mLで再懸濁した。核をチューブローラー上で4℃で1時間インキュベートした。最後に、核を洗浄緩衝液2で2回洗浄し、500μLの洗浄緩衝液2に再懸濁してからFACSソーティングに進めた。
【0178】
二次抗体結合体
透過処理した核(「細胞の採取、固定、及び透過処理」のセクションを参照)をTC20(商標)自動細胞カウンターでカウントした。核を洗浄緩衝液1で約3x10細胞/mLに希釈し、そのうち200μL(約600,000個の核)を各一次抗体のインキュベーションに使用する。一次抗体(非結合)を加え、核をチューブローラー上で4℃で一晩インキュベートした(抗体濃度については表1を参照)。各実験では、一次抗体を含まない対照試料も使用した。翌朝、核を洗浄緩衝液2(20mMヘペス、pH7.5、150mM NaCl、66.6μg/mLスペルミジン、1× cOmplete(商標)プロテアーゼ阻害剤カクテル、0.05%サポニン)で2回洗浄し、Hoechst 34580を含む200μLの洗浄緩衝液2に1μg/mLで再懸濁した。ABBCアダプターに結合した二次抗体(「抗体-DNA結合」のセクションを参照)を加え(2μg/mL)、チューブローラー上で4℃で1時間インキュベートした。最後に、核を洗浄緩衝液2で2回洗浄し、500μLの洗浄緩衝液2に再懸濁してからFACSソーティングに進めた。
【0179】
FACSソーティング
核を、セルストレーナースナップキャップに通して Falcon 5mL丸底ポリプロピレン試験管(Fisher Scientific、10314791)にピペットで移した直後に、BD Influx 又は BD FACsJazz セルソーターで分類した。一倍体KBM7核と二倍体K562核を、Hoechst レベルに基づいてG1/S細胞周期で分類された。1000細胞の試料の場合、核は、1ウェルあたり5μLの1× CutSmart 緩衝液(NEB、B7204S)を含むPCRチューブストリップのチューブに分類された。分類後の最終容量はチューブあたり約7.5μLであった。100個以下の細胞を含む試料の場合は、適切な数の核を、ウェルあたり200nLの1× CutSmart 緩衝液と5μLの鉱油(Sigma、M8410)を含む384ウェルPCRプレート(BioRad、HSP3831)に分類された。プレートはアルミニウムカバーで密封した。
【0180】
MAb-ID手順
MAb-ID試料の用手的調製
1000個の核を含む試料をPCRチューブストリップで処理した。インキュベーション工程の間に、試料を卓上ローターで短時間遠心分離した。2.5μLの消化1ミックス(1× CutSmart 緩衝液中のMseI(12.5U、NEB、R0525M)及び/又はMboI(12.5U、NEB、R0147M))を、チューブあたり7.5μLの分類容量を含む合計10μLに加えた。
【0181】
試料をPCR装置中で37℃で3時間インキュベートした後、4℃で維持した。5μLのrSAPミックス(1× CutSmart 緩衝液(MseI/NdeI消化用)又は1×NE緩衝液3.1(NEB、B7203S)中のrSAP(1U、NEB、M0371L)、MboI/BglIIを含むすべての消化物用))をチューブあたり総容量が15μLになるように加えた。試料を37°Cで30分間インキュベートし、次に65°Cで3分間インキュベートした後、氷に移した。5μLの消化2ミックス(1× CutSmart 緩衝液(MseI/NdeI消化用)又は1×NE緩衝液3.1(MboI/BglIIを含むすべての消化物用)中のNdeI(5U、NEB、R0111L)及び/又はBglII(5U、NEB、R0144L))を、チューブあたり総容量が20μLになるように加えた。試料を37°Cで1時間インキュベートした後、4°Cで維持した。6μLの連結1ミックス(1×リガーゼ緩衝液(Roche、10799009001)中の3.75U T4 DNAリガーゼ(Roche、10799009001)、33.3mM DTT(Invitrogen、707265)、3.33mM ATP(NEB、P0756L))をチューブあたり総容量が26μLになるように加えた。試料を16°Cで16時間インキュベートした後、4°Cで維持した。4μLの溶解ミックス(1× CutSmart 緩衝液中のプロテイナーゼK(5.05mg/mL、Roche、3115879001)、IGEPAL CA-630(5.05%、Sigma、I8896))をチューブあたり総容量が30μLになるように加えた。試料を56℃で4時間、65℃で6時間、及び80℃で20分間インキュベートした後、4℃で維持した。10μLの消化3ミックス(1× CutSmart 緩衝液中5UのNotI-HF(NEB、R3189L))を総容量が40μLになるように加えた。試料を37°Cで3時間インキュベートした後、4°Cで維持した。2.5μLの個別にバーコードを付けたSCBアダプター(550nM、「ABBC及びSCBアダプター」のセクションを参照)を加えて、連結中の最終濃度を約25nMにした。12.5μLの連結2ミックス(1×リガーゼ緩衝液中6.25UのT4 DNAリガーゼ、34mM DTT、3.4mM ATP)を各チューブに加えて、連結中の最終容量を55μLにした。試料を16°Cで12時間、そして65°Cで10分間インキュベートした後、4°Cで維持した。
【0182】
MAb-IDプレートのロボットによる調製
分類された核を含む384ウェルPCRプレートを、すべてのミックスを加えるためにNanoDrop II ロボット(BioNex)を使用して12psiの圧力で処理した。示された容量はウェルあたりの値である。処理の合間に、プレートは毎回1000g、4℃で2分間遠心分離した。200nlの消化1ミックス(1× CutSmart 緩衝液中のMseI(0.5U)及び/又はMboI(0.5U))を、ウェルあたり総容量が400nLになるように加えた。プレートはPCR装置で37℃で3時間インキュベートした後、4℃で維持した。200nLのrSAPミックス(1× CutSmart 緩衝液(MseI/NdeI消化用)又は1×NE緩衝液3.1(MboI/BglIIを含むすべての消化用)中のrSAP(0.04U))を、ウェルあたり総容量が600nLになるように加えた。プレートを37℃で30分間インキュベートし、その後65℃で3分間インキュベートした後、直接氷上に置いた。200nLの消化2ミックス(1× CutSmart 緩衝液(MseI/NdeI消化用)中のNdeI(0.2U)及び/又はBglII(0.2U)、又は1×NE緩衝液3.1(MboI/BglIIを含む消化用))を、ウェルあたり総容量が800nLになるように加えた。プレートを37℃で1時間インキュベートした後、4℃で維持する。240nLの連結1ミックス(1×リガーゼ緩衝液中の0.15U T4 DNAリガーゼ、33.3mM DTT、3.33mM ATP)をウェルあたり総量1040nLになるように加えた。プレートを16℃で16時間インキュベートした後、4℃で維持した。160nLの溶解ミックス(1× CutSmart 緩衝液中のプロテイナーゼK(5.05mg/mL)、IGEPAL CA-630(5.05%))をウェルあたり総容量が1200nLになるように加えた。プレートは56℃で4時間、65℃で6時間、及び80℃で20分間インキュベートした後、4℃で維持した。400nLの消化3ミックス(1× CutSmart 緩衝液中の0.2U NotI-HF)を、ウェルあたり総容量が1600nLになるように加えた。プレートを37℃で3時間インキュベートした後、4℃で維持した。連結中に最終濃度が約25nMになるように、Mosquito HTSロボット(TTP Labtech)を使用して、個別にバーコードが付いたSCBアダプター(110~550nM、「ABBC及びSCBアダプター」のセクションを参照)100nLを各ウェルに加えた。500nLの連結2ミックス(1×リガーゼ緩衝液の0.25UのT4 DNAリガーゼ、34mM DTT、3.4mM ATP)を加えて、連結中の最終容量を2200nLにした。プレートは16℃で12時間、及び65℃で10分間インキュベートした後、4℃で維持した。
【0183】
MAb-ID試料の代替用手的調製
核のすべての遠心分離工程は、200gで4°Cで4分間であった。核の透過処理及びブロッキング(「細胞の採取、固定、及び透過処理」のセクションを参照)後、核は1× CutSmart 緩衝液で3回洗浄した。核を50μLの1× CutSmart 緩衝液に再懸濁し、0.5mLのタンパク質-低結合エッペンドルフチューブに移した。50μLの消化バルクミックス(1× CutSmart 緩衝液中500UのMseI)を総容量が100μLになるように加えた。核を37℃オーブン中で8rpmのローターで3時間インキュベートした。次に、25μLのrSAPバルクミックス(1× CutSmart 緩衝液中20UのrSAP)を総容量が125μLになるように加えて、核を37℃オーブン中で8rpmのローターでさらに30分間インキュベートした。試料をPCR装置で65℃で3分間インキュベートしてrSAPを熱不活性化した直後、試料を氷上に置いた。核を洗浄緩衝液1で3回洗浄した後、抗体のインキュベーションを続けた(「抗体のインキュベーション」のセクションを参照)。一次又は二次抗体-結合体でインキュベートした後、核を1× CutSmart 緩衝液で3回洗浄してから、25μLの1×リガーゼ緩衝液に再懸濁した。25μLの連結バルク1ミックス(1×リガーゼ緩衝液中25UのT4 DNAリガーゼ)を最終容量50μLになるように加えて、核を16℃のインキュベーター中で8rpmのローターで最低16時間インキュベートした。インキュベーション後、核を1× CutSmart 緩衝液で1回洗浄後、Hoechst 3480(1μg/mL)を含む500μLの1× CutSmart 緩衝液に再懸濁し、チューブローラーで4℃で1時間インキュベートした。核を遠心分離し、500μLの1× CutSmart 緩衝液に再懸濁した後、PCRチューブストリップのFACSソーティングに進めた(「FACSソーティング」のセクションを参照)。2.5μLの溶解バルクミックス(1× CutSmart 緩衝液中プロテイナーゼK(2.68mg/ml)、IGEPAL CA-630(2.68%))を、チューブあたり、分類容量7.5μLを含む総容量が10μLになるように加えた。試料をPCR装置で56℃で4時間、65℃で6時間、80℃で20分間インキュベートした後、4℃で維持した。10μLの消化3ミックス(1× CutSmart 緩衝液中5単位のNotI-HF)を加えて、連結中の総容量を20μLにした。試料を37℃で3時間インキュベートした後、試料を4℃で維持した。1.5μLのバーコード付きSCBアダプター(550nM、「ABBC及びSCBアダプター」のセクションを参照)を加えて、連結中の最終濃度を約25nMにした。各チューブに12.5μLの連結バルク2ミックス(1×連結緩衝液中6.25UのT4 DNAリガーゼ、17.2mM DTT、1.72mM ATP)を加えて、連結中の総容量を34μLにした。試料を16℃で12時間、65℃で10分間インキュベートした後、4℃で維持した。
【0184】
ライブラリの調製
固有のSCBアダプターと連結された試料(2~4個の1000核試料又は384ウェルプレート全体)を、組合わせインビトロ転写(IVT)のためにプールした。バッチ作用を低減するために、対照(一次抗体のインキュベーションなしの二次抗体-結合体)を、可能な限り対応する試料と一緒にプールした。384ウェルプレートでは、試料を2000gで2分間遠心分離し、液相を清潔なチューブに移して鉱油を除去し、これを3回繰り返した。プールした後、試料を1.0容量の CleanNGS 磁気ビーズ(CleanNA, CPCR-0050)と10分間インキュベートし、ビーズ結合緩衝液(20% PEG8000、2.5M NaCl、10mMトリス-HCl、1mM EDTA、0.05% ツイーン20、pH8.0、25°C)で1:4~1:10に希釈した。ビーズ希釈率は総容量によって異なり、1000核試料の場合は1:4、384ウェルプレート全体の場合は1:10であった。試料を磁気ラック(DynaMag(商標)-2、ThermoFisher、12321D)上に置き、チューブの側面にビーズを集めた。ビーズを80%エタノールで2回洗浄し、短時間乾燥させた後8μLの水に再懸濁した。MEGAScript T7キット(Invitrogen, AM1334)の12μLのIVTミックスを加えて37℃で14時間反応させてインビトロ転写を行った後、4℃で維持した。その後、ライブラリの調製を、既に記載されている(Rooijers, K. et al. Nature Biotechnology 37, 766-772 (2019))ように、aRNAの収量に応じて、5μLのaRNAと8~11回のPCRサイクルを使用して行った。異なるIVT反応物(固有のSCBアダプターを使用)からの精製aRNAをプールした後、バッチ効果を低減するためのcDNA合成に進むことができる。ライブラリは、高出力1x75bpのIllumina NextSeq500プラットフォーム、高出力1x100bpのIllumina NextSeq2000プラットフォーム、又は高出力2x100bpのIllumina NextSeq2000プラットフォームに流した。
【0185】
実施例1-結果
二次抗体-DNA結合体を用いる異なるクロマチンタイプのマッピング
まず、さまざまなクロマチンタイプのマッピングにおけるアプローチの特異性を試験するために、K562細胞の1,000細胞試料を以下の一次抗体とともにインキュベートした:CTCF、H3K27me3、H3K36me3、H3K4me1、H3K4me3、H3K9me2、又はラミンB1。さまざまな抗体の検出は、二次抗体-DNA結合体を用いる免疫検出によって行った(図2に示すとおり)。これらの一次抗体について得られたゲノムプロファイルは独特であり、転写活性領域又は不活性領域へのクロマチンタイプの既知のゲノムセグメンテーションに対応している(図3)。これは、遺伝子(図4a)及び層関連ドメイン(LAD)(図4b)に対するシグナルの整列によってさらに確認される。LADは、核内膜の内側を覆う不活性型のクロマチンを表す。最後に、独立して生成された複製試料は相関ヒートマップでクラスター化し、類似したタイプのクロマチンを標的とする試料間で相関が最も高くなる(図5)。例えば、H3K9me2、H3K27me3、及びラミンB1(すべて不活性クロマチンが豊富であることが知られている)のシグナルは、すべての試料で高い相関スコアを示す。これは、これらの不活性クロマチンタイプとH3K36me3、H3K4me1、及びH3K4me3を特徴とする活性クロマチンタイプの間の低い相関スコアとは対照的である(図5)。これらの結果は、少ない細胞数で多くの異なるクロマチンタイプを検出するための強固なプロトコールが提供されていることを示している。
【0186】
一次抗体-DNA結合体を用いる異なるクロマチンタイプのマッピング
二次抗体-DNA結合体を使用すると、抗体を選択する柔軟性が制限される場合がある。これは、選択が、利用可能な二次抗体の種(例えば、通常はウサギ又はマウスのみ)と使用可能な一次抗体の対応物の多様性によって制限されるためである。この潜在的な制限を克服し、同じ試料で多くの抗体を多重化できるようにするために、1000細胞のK562試料でさまざまなヒストンPTM(翻訳後修飾)とラミンB1を標的とする7つの一次抗体を含む抗体-DNA結合体も生成された。得られたプロファイルは、二次抗体で得られた一致するプロファイルと良好な一致を示す(図6)。また、ゲノム特性の増強は、既知のゲノム分布と一致している(図7a~b)。これらの結果は、一次結合体を有するMAb-ID変種を使用すると、同様のエピジェネティックプロファイルが得られ、エピゲノムをプローブするのに使用できることを示している。
【0187】
二次抗体-DNA結合体を用いる単一試料内のクロマチンタイプの多重化
本発明の方法の大きな利点は、低入力試料で多重化ゲノムランドスケープを取得できることである。多重化が実際に可能であり、多重化実験が並行試料での連続実験を介して実施される測定のデータ品質と一致することを確認するために、同じ試料の4つの結合プロファイルを同時にマッピングした。このために、異なる動物で生成された4つの一次抗体を選択した。ヒストンH3(ヤギ)、RNAポリメラーゼ2(ラット)、H3K36me3(マウス)、及びH3K27me3(ウサギ)を選択し、4つの動物種すべてについて対応する二次抗体DNA結合体を生成した。この実験は1000個のK562細胞で実施され、抗体ごとに個別に免疫検出を実施した1000個の細胞試料と密接に一致するクロマチンプロファイルが得られた(図8)。また、ゲノム相互作用は、対応するクロマチンタイプについて予測される領域で発生する(図9a~b)。従って、少数細胞試料中の複数のクロマチンプロファイルを同時に検出する方法が提供される。
【0188】
二次抗体-DNA結合体を用いる単一細胞内のクロマチンタイプの多重化
これまでのところ、実験は少数細胞材料を有する試料で実施された。単一細胞から情報を得るために、蛍光活性化細胞ソーティング(FACS)を実施して、384ウェルプレートの個々のウェル内の単一細胞を捕捉した。ウェルは、個々の細胞を区別するための固有の試料バーコードを得た。これらの実験は、二次抗体-DNA結合体を介して、ヒストンH3、RNAポリメラーゼ2、H3K36me3、及びH3K27me3を同時に標的とする多重化された抗体セットを使用して実施された。これらの読み取りカウントを除けば、RNAポリメラーゼ2、H3K36me3、及びH3K27me3プロファイルは、単一細胞カウントを組み合わせた場合に、1000細胞試料について得られたパターンと一致した(図11)。これは、個々の細胞で得られた読み取り値が、一次抗体の標的となるクロマチン領域に特異的であることを示している。これらの結果は、MAb-IDとも呼ばれる、本明細書に開示される本発明の方法による有意義な多重化単一細胞測定が提供されることを示す。
【0189】
実施例2-結果
広域スペクトルのエピジェネティックマーカーのゲノムプロファイリング
各抗体は、最初に1つ又はそれ以上の二本鎖DNA-アダプター(抗体-アダプター)に共有結合される。複数の二本鎖DNA-アダプターの場合、DNA-アダプターは同一であったが、さまざまな同一でないDNA-アダプターも同様に使用できる。基本的な2工程のCu2+を含まないクリックケミストリーアプローチ(SPAAC)を使用して、DNA-アダプターを抗体に連結した(Harada , A et al., Nat. Cell Biol. 21, 287-296 (2018); Agard, N. J., Prescher, J. A. & Bertozzi, C. R., J. Am. Chem. Soc. 126, 15046-15047 (2004) 、及び van Buggenum, J. A. G. L. et al., Sci. Rep. 6, 22675 (2016))(図12A)。次に、これらの抗体は、MAb-IDとも呼ばれる本明細書に開示される本発明の方法において使用される。この方法は、好ましくは、1)細胞(例えば、約250,000個の細胞)を採取し、穏やかな固定工程中に核を単離すること、2)個別にバーコードが付けられた抗体-DNA結合体とインキュベートすること、3)チューブ又は384ウェルプレートへの蛍光活性化細胞ソーティング(FACS)、4)第1の制限酵素、好ましくはTTAA配列モチーフを認識するMseIを用いるゲノムの消化、5)ゲノム断片の自己連結を防ぐための消化されたゲノムの脱リン酸化、好ましくはその後の熱活性化、例えば穏やかな熱活性化(例えば、65℃で5分未満、例えば3分以下;ホスファターゼを不活性化するため)、6)第2の、しかし好ましくは異なる制限酵素、好ましくはNdeIによる抗体-アダプターの消化(これにより、第1制限酵素と適合性のあるオーバーハングが残る)、及び7)ゲノムへの抗体-アダプターの連結、から始まる。従って、ゲノム内の抗体-アダプターの位置は、目的のエピトープの局在化の代用となる。本明細書に開示される本発明の方法は、8)溶解及びプロテイナーゼK処理、続いて9)制限酵素による消化を継続して、試料-アダプター、好ましくはNotIのその後の連結を可能にする。試料-アダプターには、T7 RNAポリメラーゼプロモーター配列、Illumina P5 配列、及び試料バーコードが散在する個別の分子識別子(UMI)が含まれる(図12A)。これにより、既に記載されているように(Rooijers, K. et al. Nat. Biotechnol. 37, 766-772 (2019))、インビトロ転写による線形増幅及びその後の Illumina ライブラリ調製のために複数の試料をプールすることが可能になる。
【0190】
MAb-IDシグナルと当該技術分野で既知の方法との比較
均一で多様な近似と予測(uniform manifold approximation and projection:UMAP)による正規化データの視覚化は、本明細書に開示される本発明の方法(MAb-ID)で同定された試料が、それらの対応するクロマチンタイプと一緒にグループ化されることを示す。これらの結果は生物学的複製物間の良好な一致を示し、MAb-ID手順の堅牢性を示している。ゲノム全体のMAb-IDデータは、一致するヒストンPTMのChIP-seqデータ及びラミンB1の公的に入手可能なDamIDデータとよく相関する(図12B)。局所スケールでは、線状ゲノム全体にわたるMAb-IDシグナルのプロファイルは、MAb-IDとChIP-seqデータセット間の高い類似性で予測される増強パターンを示している。従って、これらの結果は、本明細書に開示される方法が既知の方法及びデータセットとよく相関することを示している。
【0191】
MAb-IDのオンターゲット特異性の調査
関連するゲノム領域、例えばChIP-seqピーク/ドメイン又は遺伝子に対するMAb-IDシグナルの増強が計算された。MAb-IDでマッピングされたすべてのクロマチンタイプは、クロマチンタイプに関係なく、一致するゲノム領域に対するシグナルの増強を示した。遺伝子本体に対する活性クロマチンタイプのシグナルの増強も、これらのタイプのクロマチンについて予測されるように、これらの遺伝子の転写活性に応じて増減される。これらの結果は、本明細書に開示された方法が、一致するゲノム領域の増強されたシグナルを示し、既知の方法及びデータセットとよく相関していることを示す。
【0192】
当該技術分野で既知の方法と比較した領域上のMAb-IDのシグナル分布の定量
最後に、MAb-IDの解像度を決定するために、転写開始部位(TSS)上のH3K4me3の、及びポリコーム群ドメイン上のH3K27me3のシグナル分布(ChromHMMコールに基づく;Ernst, J. et al., Nature 473, 43-49 (2011))、及びこれと対応するChIP-seqデータセットとの比較を定量した(図12C)。結果は、H3K4me3の場合、約3~4kbの距離でシグナルが50%減衰(TSSでの100%と比較して)し、H3K27me3の場合、この距離はドメイン境界付近の7~8kbに相当することを示す。従って、ChIP-seqと比較して、MAb-IDシグナルは通常、どちらの方向にもさらに1~2kb伸びる。要約すると、この実施例の結果は、MAb-IDがわずか1000個の細胞において、多様なクロマチンタイプ及びクロマチン関連タンパク質を正確にプロファイリングすることを示している。
【0193】
実施例3-結果
個々のデータ品質を損なうことなく、1つの試料上で4つの抗体を多重化することが可能である
MAb-IDとも呼ばれる、本明細書に開示される方法の可能性は、同じ試料中の異なる抗体を多重化し、いくつかのクロマチン状態を一緒にプロファイリングすることである。同じ試料上で異なる宿主由来の4つの抗体を組み合わせた実験を、各宿主に個別のバーコード付き二次抗体DNA-結合体を用いて実施し、好ましくは、各バーコード付き二次抗体は個別のバーコード付き二次抗体であった。、H3K27me3(ウサギ)及びRNAポリメラーゼII(CTD Ser5-リン酸化、ラット)、H3K36me3(マウス)、及びヒストンH3(ヒツジ)に対する抗体が使用された(表4)。これらの抗体の特異性が検証された。
【表4】
【0194】
単一抗体試料と複数抗体試料のデータの比較
1000個のK562核からMAb-IDデータを得た。試料を各抗体(シングル)又は4つの抗体すべてを組み合わせて(マルチ)個別に染色された。偏りのない評価をするために、標的ごとの単一の試料と組み合わせた試料のシーケンス深度は、より深く配列決定された試料を個別にダウンサンプリングすることによって均等化された(図13A)。すべての個別の及び組み合わせMAb-ID試料のUMAP視覚化は、クロマチン標的に基づくグループ化を示し、試料内で多重化された抗体の数とは無関係である。生物学的複製はここでも互いに高い一致を示し、MAb-IDリードの固有の読み取り数と一般的な統計量は、単一試料と組み合わせ試料間でよく類似している(図13A~B)。対応する標的のChIP-seqデータとのゲノム全体の相関係数は、多重化された抗体の数には通常依存せず。これは、1つの試料で複数の抗体を組み合わせてもデータ品質が低下しないことを示している。この結果は、抗体結合部位又は制限連結モチーフをめぐる抗体DNA-結合体間の競合が、このエピトープの組み合わせについて、ゲノム全体のレベルで重要な役割を果たしていないことを示唆している。
【0195】
単一抗体試料と複数抗体試料のゲノムプロファイルの比較
個別試料及び多重化試料由来のMAb-IDシグナルのローカルプロファイルは、広いゲノムスケールと狭いゲノムスケールの両方で一致するパターンを有する。同時に、対応するゲノム全体のChIP-seqピークのシグナルの増強は、単一試料と複合試料で同様であり、これは、関連のないChIP-seqピークに対するシグナルの減少にも当てはまる。まとめると、本実施例の結果は、抗体のオンターゲット特異性は、これらの抗体を同じ試料で多重化しても影響を受けず、全体的なデータ品質も低下しないことを示している。このように、MAb-IDは、多重化アッセイで4つの異なるエピトープのゲノム局在を特定することを可能にする。
【0196】
実施例4-結果
別の制限酵素対の利用
これまで、実験は典型的にはMseIとNdeIの組み合わせを使用して実施された。本明細書に開示される方法と別の制限酵素対との適合性を示すために、好ましくはMseI及びNdeIの代わりにMboI及びBglIIの組み合わせを使用した。この制限酵素の組み合わせが選択された理由は、1)架橋クロマチンを消化するMboIの効率の高さ(Belaghzal, H., Dekker, J. & Gibcus, J. H. Methods 123, 56-65 (2017) 、及び Sanborn, A. L. et al. Proc. Natl. Acad. Sci. U. S. A. 112, E6456-65 (2015))、2)TTAAモチーフと比較してGATC認識モチーフの異なるゲノム分布(図14)、MboI及びBglII消化後に残るヌクレオチドオーバーハングの適合性である。ゲノム消化工程におけるMboIによるBglII認識部位内のGATCモチーフの消化を防ぐために、抗体アダプターの下部鎖にあるモチーフのアデニンをメチル化した。ヘミメチル化されたGm6ATC配列は、MboIによって認識及び消化されなくなるが、修飾がBglII消化効率は低下させることはない。このアプローチは、目的のエピトープについて、ゲノムモチーフの予測される増強に従ってMAb-IDを適応させる可能性を提供する。さらに、このフォーマットにより、同じ反応で両方のバージョンの抗体-アダプター(NdeI-又はBglII-適合性)を使用できるようになり、理論的には試料あたりのシグナルと解像度が向上する。ゲノムモチーフの分布にわずかな違いがあるにもかかわらず、消化対の選択に関係なく、すべてのMAb-ID試料は標的ごとに予測されるクラスター化を示す。エピトープごとに両方のタイプの二次抗体-DNA結合体を使用した場合、シグナルも両方の酵素対による同時消化によっても影響を受けなかった。本実施例の結果に基づいて、目的のエピトープの予測されるゲノム位置における消化モチーフの増強に基づく抗体-アダプターのタイプを選択することができる。
【0197】
実施例5-結果
一次抗体-DNA結合体はMAb-IDの多重化の可能性を高める
MAb-IDとも呼ばれる、本明細書に開示される方法の多重化の可能性をさらに拡大するために、抗体-アダプターを直接一次抗体に結合させた。これは、費用対効果が低く、1つのエピトープに1つの抗体しか結合せず、結合操作が抗体のエピトープ特異性に影響を与える可能性があるため、二次抗体-DNA結合体を生成するよりも困難である。それにもかかわらず、これは抗体の宿主起源への依存性を克服し、一次抗体-DNA結合体の理論上の多重化可能性は無限であり、1つの試料ですべての既知のクロマチンタイプをまとめてプロファイリングすることを可能にする。さまざまなタイプのクロマチンに対して一次抗体が選択され、それぞれを個別のバーコード付き抗体-アダプターに結合させた。結合操作は、一次抗体の異なる緩衝液組成を考慮してわずかに修飾され、抗体-アダプターのタイプは、対応するクロマチンタイプにおける相対的なTTAA又はGATCモチーフの増強に基づいて選択された(図14)。個々の一次抗体-DNA結合体によるMAb-ID染色を、1000個のK562細胞の生物学的複製物で実施し、これらを二次抗体-DNA結合体で得られたMAb-IDデータ及び公的に利用可能なChIP-seqデータセットに対して検証した。ゲノムプロファイルは、二次抗体-DNA結合体を使用した対応するMAb-IDデータと高い類似性を有し、大部分がChIP-seqデータと重複している(図15)。一次抗体-DNA結合体を使用した技術的複製物は、UMAP視覚化により二次抗体-DNA結合体からのそれぞれのMAb-IDデータとクラスター化し、データセット間の全体的な一致を示している。
【0198】
個々に染色された試料のデータ品質に基づいて、一連の異なるクロマチンタイプをカバーする6つの最良の一次抗体-DNA結合体を、組み合わせMAb-ID実験用に選択した。この目的のために、K562細胞をこれらすべての一次抗体-DNA結合体と同時にインキュベートし、384ウェルプレートで100個の核試料として分類した。組合わせた試料は、以前に生成された個々の試料とともにUMAP空間でグループ化され、これは、試料タイプ間の一般的な類似性を検証している。従って、一次抗体への抗体-アダプターの直接結合は、同様のデータ品質で広範な多重化の可能性を提供し、ますます複雑になるクロマチンタイプとエピジェネティック状態のセットのプロファイリングを可能にする。
【0199】
実施例6-結果
一細胞解像度での同時エピジェネティックプロファイル
小細胞集団における複数の測定の多重化は、試料間の技術的偏りの低減に役立ち、入力材料が限られている状況では非常に価値がある。それでも、これらの測定を単一細胞で実施することにより、エピジェネティック状態と遺伝子調節プロセスの相互作用についてさらに深い洞察を得ることができる。本明細書に開示されている方法(MAb-IDとも呼ばれる)を使用して、384ウェルPCRプレートで分類し、液体処理ロボットを使用して処理能力を向上させ、試料の取り扱いを減らすことにより、一細胞解像度で同時エピジェネティックプロファイルを生成した(図では「scMAb-ID」としても参照されている)。384個の固有の試料-アダプターが設計され、384ウェルPCRプレートの各ウェルで、ヒト由来の1つの核とマウス由来の1つの核を分類した(図16A)。リードをハイブリッドゲノムに整列させることにより、リードをヒト細胞又はマウス細胞のいずれかに割り当てることができる。入力としてヒト細胞のみ又はマウス細胞のみを含む対照データセットを使用してこのアプローチを試験したところ、誤って割り当てられたリードの中央値は0.4%未満であり、これが元の細胞を割り当てるための堅牢なアプローチであることが示された。
【0200】
異なる細胞タイプにおけるエピジェネティック状態を区別するMAb-IDの能力を調べるために、マウス胚性幹細胞(mESC)を、合計6日間かけて、標準的なインビトロ分化プロトコールに従って神経系統に向けて分化させた。分化の非常に初期段階にあるにもかかわらず、それらのエピジェネティックプロファイルにおける微妙ではあるが有意な差異が予測された。これらの初期神経細胞(mEN)をmESC及びヒトK562細胞と並べて採取し、活性型及び不活性型クロマチンタイプの一連のエピトープに対する6つの異なる一次抗体-DNA結合体の組み合わせセットを使用して染色した。これら3つの細胞タイプの核を、384ウェルプレートの各ウェルで小細胞集団又は単一細胞として分類し、これらを単一細胞MAb-ID処理中に一緒にプールし、配列決定、好ましくは次世代配列決定に供した。合計1956個のK562、1424個のmESC、及び1424個のmENの単一細胞を配列決定し、そのうちそれぞれ1248個、674個、及び849個の細胞は、細胞ごと及びエピトープごとの固有カウントの最小量に基づく品質閾値を超えた。フィルタリング後の細胞あたりの固有カウントの中央値は、K562細胞で2715.5、mESC細胞で2281.5、mEN細胞で2842であり、各細胞のエピトープあたりの固有カウントの中央値は119~706.5の範囲であった(図16B)。データが比較的まばらであるにもかかわらず、これらの数値は、いくつかのヒストンPTMを同時に測定する他の最近のマルチモード的方法によって報告された数値と同様の範囲内にある(Gopalan, S et al., Simultaneous profiling of multiple chromatin proteins in the same cells. Mol. Cell 81, 4736-4746.e5 (2021))。
【0201】
すべてのK562細胞の固有のリードを組み合わせて、コンピュータで集団を生成し、これらをバルク(すなわち、非単一細胞)MAb-IDデータセットと比較した。MAb-ID及びscMAb-IDシグナルの局所ゲノムプロファイルは、互いに非常に類似しており、また対応するChIP-seqデータセットとも非常に類似している(図16C)。ゲノム全体のレベルでは、scMAb-IDシグナルは、ChIP-seqデータセットの対応するピーク及びドメインで増強されており、これはエピトープに対する特異性が一細胞解像度で維持されていることを示している。UMAPを使用する視覚化では、scMAb-ID試料がバルクMAb-ID対応物とともにクラスター化していることが示され、これらのデータセット間のゲノム全体の類似性を検証している。各単一細胞からのリードがエピジェネティックな状態を分離するのに十分な情報を保持していることを確認するために、単一のK562細胞のUMAPクラスタリングを実施した。細胞ごとのエピトープ特異的データを個別に処理し、多重化された測定のそれぞれについて各細胞を1回表示させると、細胞はエピトープに基づいて明確に分離される。クラスタリングは、細胞あたり及びエピトープあたりの総読み取り深度の両方から独立しており、情報が使用した一次抗体-DNA結合体に特異的であることを示している。まとめるとこれらの結果は、多重化構成において一細胞解像度でエピジェネティックプロファイルを区別するscMAb-IDの能力を検証している。
【0202】
実施例7-結果
単一細胞からのエピトープ特異的データセットの組み込みによりエピジェネティック状態の識別が可能になる
MAb-IDが、多重化されたエピジェネティックプロファイルに基づいて、比較的類似した細胞のタイプを識別する可能性を秘めているかどうかを調べること。すべてのmESCのコンピュータにより組合わされた集団のローカルゲノムプロファイルは、公に利用可能なデータセットのプロファイルと類似している。これは、単一細胞MAb-IDデータの品質が、ヒトとマウスの両方の種の細胞で類似していることを示している。単一細胞内のすべてのエピトープ測定を多重化することで、これらのデータセットを統合することができ、これは、細胞タイプをさらに区別するのに役立ち、互いのエピジェネティック状態を研究できるようになるであろう。この目的のために、2021年のZhuの理論的研究(Zhu, C. et al. Nat. Methods 18, 283-292 (2021))に基づいて、各細胞の組合わされたエピジェネティック情報を含む統合データセットが計算された。この結合されたデータセットを使用して細胞をクラスタリングすると、これらは確かに主にmESC又はmEN集団からの起源に基づいて分離される。興味深いことに、ライデン(Leiden)クラスタリングを使用して細胞を2つのグループのいずれかに割り当てることで、よりナイーブな細胞状態を維持してきたと思われるmEN集団の細胞を特定することができる(図17A)。同様に、ただし程度ははるかに小さいが、これらの培養条件で予測されるように、mESC集団の細胞は、より分化した細胞状態をすでに獲得しているようである(図17A)。すべてのエピトープ測定値を統合せずに細胞状態の同じ割り当てを取得できるかどうかを偏りなく評価するために、情報理論のシャノンエントロピー(Shannon Entropy)の原理を使用して、エピトープのさまざまな組み合わせでクラスタリングして情報ゲインを計算した。当然のことながら、H3K27me3とH3K4me1の測定値は、細胞のタイプと発達段階の貴重な予測因子として知られているため、未処理細胞と分化細胞の状態の割り当てに最も貢献した。
【0203】
メスのmESCは、神経系統に分化する際にそのX染色体の1つをランダムに不活性化するはずであるため、どの細胞がすでにこのプロセスを経ているかが特定された。この発生現象は細胞ごとにランダムに発生するため、どの対立遺伝子が不活性化されているかを確認するには、単一細胞の情報と2つの対立遺伝子間の独特の特徴の両方が必要である。mESCは、2つの異なる遺伝子型(Cast/EiJx129SvJae)のマウス間の雑種交配に由来し、これらの遺伝子型間の既知のSNPの頻度が高いため、細胞あたりのリードの約35~40%を父系のゲノム又は母系のゲノムのいずれかに割り当てることができる。ランダムな不活性化により、不活性X対立遺伝子(Xi)は、活性を維持する対立遺伝子(Xa)と比較して、H3K27me3レベルが全体的に大きく増加することが知られている(Okamoto, I., Otte, A. P., Allis, C. D., Reinberg, D. & Heard, E. Science 303, 644-649 (2004) 及び Rougeulle, C. et al., Mol. Cell. Biol. 24, 5475-5484 (2004))。従って、2つのX対立遺伝子間の固有のH3K27me3カウントの比を計算して、細胞がX染色体不活性化を受けたかどうか、そしてどの対立遺伝子が不活性化されていたかを確認した。この状態を、統合されたデータセットからクラスターに与えると、X染色体の1つを不活性化した細胞のほとんどが分化したクラスターに存在することが観察された。UMAP空間では、これらの細胞はナイーブ細胞から最も遠くに位置しているように見え、これは、統合されたデータセットが、単なる開始点と終了点ではなく、分化軌跡全体の進行に関する情報を維持している可能性があることを示している。
【0204】
データセットは多重測定で生成されるため、他のエピジェネティック状態について特定されたXi及びXa対立遺伝子間の固有のカウントレベルの比率も計算された。Xi対立遺伝子上のH3K27me3レベルが大幅に増加すると、H3K27acなどの活性クロマチンタイプのレベルは、低レベルではあるものの減少する(Boggs, B. A., Connors, B., Sobel, R. E., Chinault, A. C. & Allis, C. D. Chromosoma 105, 303-309 (1996))(図17B)。H3K9me3レベルは、以前に報告されたように、Xi対立遺伝子上でわずかに増加している(Boggs, B. A. et al., Nat. Genet. 30, 73+76 (2002) 及び Heard, E. et al., Cell 107, 727-738 (2001))(図17B)。これらの結果は、MAb-IDが、複数の測定を多重化することで単一細胞のエピジェネティック状態を識別できることを強調している。各細胞のエピジェネティック状態を同時にプロファイリングすることで、特にバルクアッセイでは研究が難しい異種発生プロセスについて、クロマチンタイプ間の相互作用をさらに調査することができる。
図1
図2
図3
図4A
図4B
図5
図6
図7A
図7B
図8
図9A
図9B
図10
図11A
図11B
図12A
図12B
図12C
図13A
図13B
図14
図15
図16A
図16B
図16C
図17A
図17B
【配列表】
2024540407000001.xml
【国際調査報告】