(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-21
(54)【発明の名称】クロマチン修飾のグローバルレベルまたはゲノム遺伝子座特異的レベルを評価するためのマルチプレックス法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20231214BHJP
【FI】
C12Q1/6869 Z ZNA
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023534041
(86)(22)【出願日】2021-12-02
(85)【翻訳文提出日】2023-06-22
(86)【国際出願番号】 EP2021084023
(87)【国際公開番号】W WO2022117749
(87)【国際公開日】2022-06-09
(32)【優先日】2020-12-02
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523205153
【氏名又は名称】エピゲニカ エービー
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】エルザッサー,サイモン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA18
4B063QQ03
4B063QQ08
4B063QQ42
4B063QR08
4B063QR48
4B063QR58
4B063QR62
4B063QS25
4B063QX02
(57)【要約】
本発明は、複数のサンプルにおける、複数の様々なクロマチン修飾のグローバルレベルを並行して評価するための方法を提供するものである。また、本明細書に開示される方法は、複数のサンプルにおいて、ゲノム内の複数の目的の位置における、複数の様々なクロマチン修飾のレベルを評価することに関する。該方法は、高度にマルチプレックス化され、定量的であり、かつ、クロマチン免疫沈降及びシークエンシング技法に関与するものである。
【選択図】
図4
【特許請求の範囲】
【請求項1】
複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
a. 複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の固有の分子識別子(UMI)配列を含むオリゴヌクレオチドであり、各IDタグは、異なるUMI配列及び任意選択の追加の配列を含み、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を任意選択で増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 各クロマチン修飾サブプールから、n掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きgDNA断片を集約プールにプールし、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数であり、mはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップであって、
i. 少なくとも前記第1のバーコード配列ならびに
ii. 前記UMI配列及び/または前記gDNA配列の一部
をシークエンシングし、ここで、固有のタグ付きgDNA断片は、固有のUMI及び/または固有のgDNA配列のいずれかを含む、前記測定するステップ、
k. 目的の各遺伝子座について、各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける、前記目的の遺伝子座での前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【請求項2】
複数のサンプルにおいて、1つ以上の目的の遺伝子座における複数のクロマチン修飾の局所レベルを並行して評価する方法であって、以下のステップを含む前記方法。
a. 複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 増幅のために目的の各遺伝子座に特異的な少なくとも1つのプライマーを使用する、前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 各クロマチン修飾サブプールから、100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きgDNA断片を集約プールにプールし、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数であり、mはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップ、
k. 各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【請求項3】
ステップd.は、前記プールをランダムなサブプールに分けることをさらに含み、ここで、少なくとも1つのサブプールはインプットサブプールであり、他のサブプールは試験サブプールであり、また、ステップf.は、各抗体をランダムな試験サブプールと共にインキュベートすることを含む、先行請求項のいずれか1項に記載の方法。
【請求項4】
前記ステップi.は、n掛ける100~100,000の範囲のタグ付きgDNA断片を前記インプットサブプールからランダムに選択することをさらに含み、また、ステップj.は、前記インプットサブプールから選択された前記gDNA断片をシークエンシングし、前記インプットサブプールの各バーコード配列を有する固有のgDNA断片の数を測定することをさらに含み、また、ステップk.は、各クロマチン修飾サブプールにおける各バーコード配列を含むgDNA断片の頻度を、前記インプットサブプールにおける同一のバーコードを含むgDNA断片の頻度で割ることにより、インプット正規化リードカウント(INRC)を決定することをさらに含み、ここで、バーコード配列のINRCが高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、請求項2に記載の方法。
【請求項5】
サンプルYにおけるクロマチン修飾のレベルと比較した、サンプルXにおけるクロマチン修飾のレベルが、以下の式:
【数1】
によって決定され、ここで、サンプルXの前記gDNA断片は、バーコードXを含むIDタグでタグ付けされ、サンプルYの前記gDNA断片は、バーコードYを含むIDタグでタグ付けされる、請求項2~4のいずれか1項に記載の方法。
【請求項6】
前記IDタグは、前記バーコード配列及び固有の分子識別子(UMI)配列を含み、各IDタグは、異なるUMI配列を含む、先行請求項のいずれか1項に記載の方法。
【請求項7】
固有のDNA断片の数を測定することは、固有のUMIの数を測定することによって行われる、請求項6に記載の方法。
【請求項8】
先行請求項のいずれか1項に記載の方法であって、前記gDNA断片の少なくともある画分を第2のタグでタグ付けすることをさらに含む、前記方法。
【請求項9】
先行請求項のいずれか1項に記載の方法であって、各クロマチン修飾サブプール内の前記gDNA断片の少なくともある画分を第2のタグでタグ付けすることをさらに含み、前記第2のタグは、第2のバーコード配列を含むオリゴヌクレオチドであり、1つのクロマチン修飾サブプール内のgDNA断片は、同一の第2のバーコード配列を含む第2のタグでタグ付けされ、異なる第2のバーコード配列が、各クロマチン修飾サブプールに対して使用される、前記方法。
【請求項10】
ステップj.は、少なくとも前記IDタグの前記バーコード配列及び前記第2のバーコード配列及び前記UMI配列及び/または前記gDNA配列をシークエンシングすることを含み、ここで、ステップj.は、特異的な第2のバーコード配列を含む固有のgDNA断片の総数に対する、前記IDタグの前記バーコード配列及び各前記特異的な第2のバーコード配列を含む固有のgDNA断片の頻度を計算することを含む、請求項9に記載の方法。
【請求項11】
ステップa.は、少なくとも15等(少なくとも25等)、例えば少なくとも50(少なくとも75等)、例えば15~1000の範囲(15~500の範囲等)、例えば25~1000の範囲(25~500の範囲等)のクロマチンを含む種々の試験サンプルを提供することを含む、先行請求項のいずれか1項に記載の方法。
【請求項12】
ステップa.は、少なくとも75、好ましくは少なくとも85、例えば75~1000の範囲(75~500の範囲等)、例えば85~1000の範囲(85~500の範囲等)のクロマチンを含む種々の試験サンプルを提供することを含む、先行請求項のいずれか1項に記載の方法。
【請求項13】
ステップe.は、それぞれが異なるクロマチン修飾に特異的に結合する、少なくとも5種の種々の抗体、少なくとも10種の種々の抗体等(例えば、少なくとも15種の種々の抗体)、5~100種の範囲の種々の抗体等(例えば、5~50種の範囲の種々の抗体)、10~100種の範囲の種々の抗体等(例えば、10~50種の範囲の種々の抗体)を提供することを含む、先行請求項のいずれか1項に記載の方法。
【請求項14】
1つ以上の抗体は、アミノ酸のカルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、及びグリコシル化からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行請求項のいずれか1項に記載の方法。
【請求項15】
先行請求項のいずれかに記載の方法であって、n掛ける100~100,000の範囲、例えば多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)の各クロマチン修飾サブプールのタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【請求項16】
先行請求項のいずれか1項に記載の方法であって、n掛けるm掛ける100~100,000の範囲、例えば多くともn掛けるm掛ける50,000(多くともn掛けるm掛ける20,000等)、例えばn掛けるm掛ける1000~50,000の範囲(n掛けるm掛ける5000~20,000の範囲等)の前記集約プールのタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【請求項17】
前記細胞集団は、少なくとも100の細胞、好ましくは少なくとも500の細胞、さらにより好ましくは少なくとも1000の細胞、例えば10~100,000の範囲の細胞(100~100,000の範囲の細胞等)、例えば1000~100,000の範囲の細胞を含む、先行請求項のいずれか1項に記載の方法。
【請求項18】
複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
a. 1つ以上の試験化合物を提供するステップ、
b. 前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはその組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
c. 請求項1~17のいずれか1項に記載の方法を実施するステップであって、各試験サンプルは、異なる細胞集団のクロマチンを含む、前記実施するステップ。
【請求項19】
請求項18に記載の方法であって、試験化合物と共にインキュベートされていない細胞を含む参照サンプルを用いて、請求項1~17のいずれか1項に記載の方法を実施することをさらに含む、前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ゲノムのクロマチン修飾レベルを評価する分野に関する。特に、本発明は、エピジェネティック修飾レベルを評価することに関する。前記修飾の変化は、例えば、前記ゲノムを含む細胞を種々の化合物で処理することによって引き起こされる可能性があり、したがって、本発明の方法は、クロマチン修飾レベルに対する試験化合物の効果に接近するために使用することができる。本発明は、クロマチン修飾のグローバルレベルならびに特異的な遺伝子座(例えば、特異的な遺伝子プロモーター)におけるクロマチン修飾レベルの両方を評価することに関する。
【背景技術】
【0002】
哺乳類細胞におけるエピゲノムの特徴をプロファイルするために幅広い手法が存在する。典型的には、哺乳類細胞におけるエピゲノムの特徴をプロファイルする手法は、2つのカテゴリーに分類される。しかし、これらの手法全てにはいくつかの限界がある。
【0003】
1つ目のカテゴリーの方法は、DNA及びヒストンPTMレベルをバルク(グローバル)で正確に定量化することに関与する。これには、ボトムアップまたはミドルダウン質量分析法及び抗体ベースの方法(ドットブロット、ウェスタンブロット、免疫蛍光法)が含まれる。例えば、Luminexビーズプラットフォームを用いる抗体ベースの手法においては、マルチプレックス化が実現されている。
【0004】
2つ目のカテゴリーの方法は、個々のPTMまたは他の特徴について、塩基対分解能に及んでゲノムワイドのプロファイルを取得することに関与する。かかる方法には、ChIP-Seq法の多くのバリエーション、in-situプロファイリング法(CUT&RUN、CUT&Tag)が含まれる。クロマチン免疫沈降及びシークエンス(ChIP-seq)は、ヒストン修飾をゲノムワイドにマッピングするために使用することができる方法である。それにより、細胞型特異的な機能的要素及びエピジェネティック状態を同定することが可能になる。ChIPは、酵素消化または超音波処理を用いてネイティブまたは固定されたクロマチンを断片化し、その後、特異的抗体で免疫沈降することに依拠するものである。DNA精製後は、次世代シークエンシング用のライブラリーが作成され得る(ChIP-Seq)。
【0005】
一方、in-situプロファイリング技法では、インタクトな核の免疫染色に似たプロトコルが使用される。上の全ての技法の主要な制限は、あらゆるサンプルにスパイクインリファレンスを添加しない限り、それらの技法はせいぜい定性的または半定量的であるという事実である。
【0006】
近年、定量的ワークフロー及び有効な定量的ChIP-Seq技法の必要性が認められてきている。ヒストン修飾とは対照的に、定量的手法が、DNAメチル化をプロファイルするために広く使用されている。メチル化シトシンは、化学的または酵素的塩基変換、すなわち全ゲノムバイサルファイトシークエンス(WGBS)及びEM-seqによって、塩基対分解能で検出し、正確に定量化することができる。したがって、DNAメチル化が、エピジェネティック毒性を研究するための、主な、かつほぼ独占的なリードアウトであることは、驚くべきことではない。
【0007】
ハイスループット法:
ChIP及びWGBSの自動化プロトコルは存在するが(例えば、HT-ChIPmentation)、それらは常にワークフローあたり1条件及び1抗体に制限される。ワークフローを、マルチウェルフォーマットで並列化またはマイクロ流体チップで自動化することができても、ワークフローの数は条件及び抗体によって倍増し、コスト(試薬、プラスチック製品及び操作時間)は、通常、ワークフローの数に直線的に比例して拡大する。
【0008】
マルチプレックス定量法:
エピゲノム法のスループットを向上させるために、多くのマルチプレックス法が開発されている。これに関しては、クロマチン断片に分子バーコードを付加して、それらをいくつかのサンプルからプールできるようにする。バーコードに基づき、次世代シークエンシングのリードを、解析中に非多重化することができる。かかるバーコード化ファーストの様々な方法が記述されている。原則として、プール化ワークフローは本質的に定量的ではあるが、技術的な課題により、定量的研究にバーコード化ファーストの方法を使用することが妨げられている。さらに最近のバーコード化手法には、正確な定量化に向けた固有の分子識別子に依拠する、MINUTE-ChIPが含まれる(Kumar et al.,2019)。とりわけ、MINUTE-ChIPは、広いダイナミックレンジで正確な定量比較がなされることが示されている、現在までの唯一の技法である。Kumar et al.,2019で記述されているように、MINUTE-ChIPは、非常に多数の断片をシークエンシングすることに依拠している。したがって、Kumar et al.,2019において、サンプル及び抗体あたりのシークエンシングされた断片の数は、6,065,348~32,979,288の範囲にある。さらに、Kumar et al.,2019によって記述されているMINUTE-ChIPは、少数サンプルのみの並列解析に制限される。
【0009】
薬物に応答するエピゲノムの探索:多細胞生物において、クロマチン修飾は、細胞の細胞アイデンティティ、分化状態、及び/または代謝状態に対して特有であり得る、すなわち、細胞アイデンティティ、分化状態、及び代謝状態が類似している細胞では、類似したクロマチン修飾パターンが共有されていることが多く、一方、無関係な細胞では、異なるクロマチン修飾が示されることが周知である。薬物は、我々ヒトの体内の細胞と多様な方法で相互作用する。設計上または思いがけず、多くの薬物がエピゲノムに影響を及ぼし、エピジェネティック遺伝子制御機構、細胞適応度、及び/または細胞アイデンティティに影響を与える。それぞれ個々のケースで判断されるにとどまるものの、変化が、機能的で潜在的に長期的な効果を有することになる場合、任意の薬物が、ヒストンPTMまたはDNA修飾のグローバルまたは局所レベルの一部に影響を及ぼす可能性が比較的高い。これは、一般的な薬物の(副)作用の多くが、最終的にエピゲノムを制御する経路に影響を及ぼすからである。つまり、オンまたはオフターゲットとして、薬物は、配列特異的結合によってエピゲノムランドスケープを編成するタンパク質である、転写因子に影響を及ぼすシグナル伝達経路を標的とし得る。それらは、例えば、酸化ストレスを引き起こすことにより、代謝を変化させることがある。アセチル化、リン酸化、またはメチル化等のエピゲノムPTMの基質を提供することにより、代謝経路は、質量作用を通じて多くのPTMのグローバルレベルに直接影響を与える。DNAまたはヒストン修飾酵素は、多くの薬物の標的であり、エピゲノムランドスケープにさらに直接的に影響を与える。最後に、エピジェネティックな特徴、例えば、腫瘍抑制遺伝子プロモーター上のDNAメチル化パターンは、遺伝的特徴よりも本質的に不均一性のものであると考えられている。細胞傷害性薬物は、細胞に選択的圧力をかけ、これにより、自然変異として先在している生存表現型に関係するエピジェネティック状態が、安定化及び拡大し得る。その結果、エピゲノムクローン集団は、その後の薬物治療に対してより抵抗性であり続ける可能性がある。
【0010】
エピゲノムの有効性及び毒性の研究を実施する上での問題は、エピゲノムの変化について統一的であり、簡便なリードアウトがないという事実にある。エピゲノムプロファイリングは、ハイスループットな薬物特性評価の一部として確立されておらず、この特定分野における方法が必要とされるのは明らかである。細胞ベースのアッセイにおけるエピジェネティックな副作用の検出は、プロセスの十分早期に薬物候補を選別して、エピジェネティック毒性を示す化合物の動物実験及び臨床試験を減らすために使用され得る。
【発明の概要】
【0011】
本開示は、薬物治療後の即時エピジェネティック変化と長期エピジェネティック変化の両方を測定するために適用され得る方法を提供する。
【0012】
したがって、本開示は、複数のサンプルにおける、複数の様々なクロマチン修飾のグローバルレベルを並行して評価するための方法に関する。また、本明細書に開示される方法は、複数のサンプルにおいて、ゲノム内の複数の目的の位置における、複数の様々なクロマチン修飾のレベルを評価することに関する。該方法は、高度にマルチプレックス化され、定量的であり、かつ、クロマチン免疫沈降及びシークエンシング、好ましくは大量並行シークエンシングに関与するものである。
【0013】
驚くべきことに、本発明は、高度にマルチプレックス化されたライブラリーを非常に低い深度でシークエンシングしても、クロマチン修飾のグローバルレベルを正確に決定できることを示す。したがって、特定のクロマチン修飾のグローバルレベルに関する定量的情報を取得可能にするためには、各クロマチン修飾について、初めのサンプルあたり100~100,000gDNA断片の範囲でのシークエンシングで十分である。結果としてのゲノム被覆率が極めて乏しいにもかかわらず、本発明は、試験した全ての条件下で、サブサンプルのクロマチン修飾のレベルとグローバルレベルとの間に正確な相関関係があることを示している。したがって、本発明の方法は、一般的には、複数のクロマチン修飾のレベルを定量的に評価するための方法である。故に、本発明は、ゲノムのサブセットのみを解析することにより、任意の所与の条件下で、任意のクロマチン修飾のグローバルレベルを正確に定量化することが可能になることを示す。
【0014】
したがって、本発明の一態様は、複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法を提供することであり、前記方法は以下のステップを含む。
a. 複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の固有の分子識別子(UMI)配列を含むオリゴヌクレオチドであり、各IDタグは、異なるUMI配列及び任意選択の追加の配列を含み、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識されたクロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を任意選択で増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 各クロマチン修飾サブプールから、n掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きgDNA断片を集約プールにプールし、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数であり、mはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップであって、
i. 少なくとも第1のバーコード配列ならびに
ii. 前記UMI配列及び/または前記gDNA配列の一部
をシークエンシングし、ここで、固有のタグ付きgDNA断片は、固有のUMI及び/または固有のgDNA配列のいずれかを含む、前記測定するステップ、
k. 各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【0015】
本発明はまた、複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法を提供し、前記方法は以下のステップを含む。
a. 1つ以上の試験化合物を提供するステップ、
b. 前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはその組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
c. 本発明による複数のクロマチン修飾のレベルを評価する方法を実施するステップであって、各試験サンプルは、種々の細胞集団のクロマチンを含む、前記実施するステップ。
【0016】
様々なクロマチン修飾の複数のクロマチン修飾レベルのレベルに対する試験化合物の影響は、試験化合物(複数可)の存在下で培養した後の細胞集団における前記クロマチン修飾のレベルを、対照(例えば、試験化合物(複数可)の非存在下で培養した細胞集団)と比較することにより決定され得る。
【図面の簡単な説明】
【0017】
【
図1】本明細書に開示される方法の一例の模式的概要を示している。この例では、サンプル1、2、3、4……99をそれぞれ、溶解、続くクロマチンの断片化、及び各サンプルに固有の第1のバーコード配列を含むIDタグの付加に供する。タグ付きクロマチン断片をプールし、サブプールに分ける。サブプールの1つはインプットサブプールであり、他のサブプールは、ChIP1、ChIP2、ChIP3…ChIP15.と名付けた、様々な抗体によるクロマチン免疫沈降(ChIP)に供する。ChIP後に得られたgDNA断片を、各ChIPに固有の第2のバーコード配列を含む第2のタグでタグ付けし、増幅し、別途、シークエンシングに使用する装置の特定の要件に従って、大量並行シークエンシングのために準備する。断片をプールし、断片のランダムな画分のみをシークエンシングする。第1のバーコード及び第2のバーコードの各組み合わせでタグ付けした固有の配列(「固有リード」とも呼ばれる)の数を測定し、各第2のバーコードに対する、各第1のバーコードでタグ付けした固有リードのパーセンテージを、円グラフで例示しているように決定する(1つの円グラフは、所与のChIPにおける各サンプルについての固有のカウントの頻度を表している)。同様に、各第1のバーコード配列でタグ付けした固有リードの頻度を、インプットについて決定する。各ChIP後の各第1のバーコードの頻度を、インプットにおける頻度に対して正規化する。
【
図2】種々の方法でのグローバル及び遺伝子座特異的定量化を比較する模式図。1)数千万~数億のクロマチン断片のディープシークエンシングを用いて、詳細な定量的ゲノムランドスケープを生成する方法(MINUTE-ChIPと呼ぶ)。2)ランダムに選択した1000~10,000のクロマチン断片のみをシークエンシングする本発明による方法により、同一の正確な定量化がもたらされる(hmqChIPと呼ぶ)。3)遺伝子座特異的プライマーを用いる本発明による方法では、クロマチン断片の小画分を選択し、断片を選択することにより、グローバル平均の定量化の代わりに、1つまたは多数の遺伝子座における局所レベルの定量化が得られる。
【
図3】本発明による方法の一例を原理的に示している。条件A及びBの下で培養された細胞のサンプルに由来するクロマチン断片を、それぞれIDタグA及びBを使用してタグ付けする。典型的には、各サンプルのクロマチン断片の画分のみをタグ付けする。通常、条件A及びBでは、タグ付きクロマチン断片の数は厳密に同じではない。条件A及びBのクロマチン断片をプールし、プールのアリコート(ランダムに選択した断片のサブプール)を、特定のクロマチン修飾、ここではヒストンH3リジン27トリメチル化(H3K27me3)に対する抗体を用いて、クロマチン免疫沈降(ChIP)に供する。H3K27me3修飾を有するクロマチン断片は、タグの存在またはタグの配列、すなわちクロマチン断片の由来に関係なく、同一の親和性で抗体結合部位に対し競合する。非結合分子を洗浄した後、抗体により保持されている分子は、原則として、全てH3K27me3修飾を有する。決定的なことに、どのH3K27me3修飾分子も抗体によって捕捉される確率が等しいため、クロマチン修飾サブプールにおけるクロマチン断片の選択対象は、それらがどの条件に由来するものかに関係なく、タグ付けされ、H3K27me3修飾を有するクロマチン断片の可能性の結果を代表するものである。インプットプール及びクロマチン修飾サブプールからのランダムな分子小サブセットをシークエンシングし、インプット及びクロマチン修飾サブプールにおけるA及びBバーコードの数を測定する。本実施例では、インプットプールにおいて、A及びBバーコードが1:1の比でシークエンシングされる。クロマチン修飾サブプールにおいては、A及びBバーコードが2:1の比でシークエンシングされる。その結果、条件Aが、条件Bより厳密に2倍多くH3K27me3修飾クロマチン断片を有することを推論し得る。したがって、換言すれば、条件BのH3K27me3のグローバルレベルは、条件Aのそれの50%である。
【
図4】対照条件と比較した、所与の処理後における所与のクロマチン修飾の相対量を計算する例を示している。特定の処理及び対照(例えば、試験化合物の存在下または非存在下で培養した細胞)に対して、3つの複製(R1、R2、R3)サンプルを調製する。クロマチン断片に、6種の異なる第1のバーコードを含む6種の異なるIDタグをタグ付けする。Aインプットサブプールのバーコードの表れは、インプットプールのランダムな小サブセットをシークエンシングし、固有の断片をカウントすることによって決定する。B各クロマチン修飾サブプールのバーコードの表れは、各クロマチン修飾サブプールの断片のランダムな小サブセットをシークエンシングし、固有の断片をカウントすることによって決定する。C各クロマチン修飾サブプールの各バーコードのカウントを、対応するインプットサブプールの各バーコードのカウントで割ることにより、各サンプルのインプット正規化固有リードカウント(INRC)が得られる。INRCは、クロマチン修飾サブプールの各第1のバーコードの存在量を、インプットサブプールの各第1のバーコードの存在量で補正したものを反映している。
図3に例示したように、修飾ヌクレオソームが有効な抗体結合部位に結合する確率はIDタグに依存しないため、INRCは、それぞれのサンプルにおける探索されたクロマチン修飾のグローバル強化に直線的に関連している。処理サンプルにおける探索されたクロマチン修飾の、対照と比較したグローバルレベルは、処理INRCを対照INRCで割ることによって推論することができる。
【
図5】断片の小画分のみをシークエンシングする方法(hmqChIPと呼ぶ)が、約10,000倍少ないシークエンシングリードを必要とし得るものであるけれども、hmqChIPは、大量の断片をシークエンシングする方法(MINUTE-ChIPと呼ぶ)と同等の定量性があることを示している。hmqChIPは、非常に少数の固有のリードをサンプリングすることにより、相対的なヒストンH3K27me3修飾レベルを正確に定量化することを可能にするものである。データは、ランダムに選択した少数の配列のみを使用したことを除いて、Kumar and Elsasser,2019に記載された通りに生成した。標準曲線は、H3K27me3を最大レベルで有する細胞源と、H3K27me3を枯渇させた細胞源とを、既知の比率(14サンプルに対応する、重複した7つの異なる比率)で混合し、あらかじめ設定した量のヒストンH3K27me3を有するサンプルを調製することにより作成した。クロマチン修飾サブプール及びインプットサブプールから、それぞれサンプルあたり(理論的には)およそ179、1786及び17,857の配列に相当する、2,500、25,000及び250,000の配列をランダムに選択した。クロマチン修飾サブプール及びインプットサブプールにおいて、14種のバーコードの各々を含有する固有のクロマチン断片をカウントした。インプット正規化固有リードカウントは、各第1のバーコードについて、クロマチン修飾リード対インプットリードの比を決定することにより計算した。標準曲線は、クロマチン修飾サブプールの前記250,000、25,000または2,500のリードを用いて、線形回帰分析により計算した。測定値は、あらかじめ設定した量に、直線的に相関し、比例している。量のデータがどのくらい厳密に真の量を予測しているかを指し示すR
2値は、標準曲線を作成するために、合計2,500リードしか使用しなかった場合でさえ、極めて良好(>0.98)のままである。
【
図6】断片の小画分のみをシークエンシングする方法(hmqChIPと呼ぶ)による、相対的なヒストンH3K27me3修飾レベルの正確な定量化を示している。データは、ランダムに選択した少数の配列のみを使用したことを除いて、Kumar and Elsasser,2019に記載された通りに生成した。データセットは、未処理の対照条件(「未処理」)及び細胞が2種の阻害剤で処理されている条件(「2i」)において、それぞれ生物学的に三重に存在する、マウス胚性幹細胞の比較対象を含有する。2つの解析を実施した。上部の解析では、対応する参照ゲノムへのマッピングを使用して、解析したクロマチン断片の固有性を決定した。下部の解析では、参照ゲノムへのマッピングは実施せず、代わりにUMI配列を使用して、固有のクロマチン断片のカウントを決定した。各解析では、X軸で表示されているように、データセットから規定数の配列をランダムに抽出した。Y軸には、「未処理」対照に対するH3K27me3の量を示している。エラーバーは、三重の測定の標準偏差を示す。有意差は両側t検定を用いて計算し、以下のように表示した:n.s.は非有意、*はp<0.05、**はp<0.01。Kumar and Elsasserは、数千万より多くのクロマチン断片のシークエンシングに基づき、「2i」処理により、H3K27me3が2.3倍増加したことを報告した。該解析は、6種の複製物の合計わずか1000~10,000の範囲のマッピングされたリードまたはUMIカウントで、正確(2.3倍の差)かつ確信的(統計的に有意)な定量が可能であることを示している。本実施例で示したhmqChIPの限界は、条件あたりおよそ約200の固有リードにある。
【
図7】クロマチン修飾のグローバルレベルを決定するための本発明の方法において、gDNA断片にタグを付け、PCR法で増幅し、シークエンシングする方法の例を示している。1)IDタグを、各サンプルに由来する全クロマチン断片の画分のgDNA部分にランダムに付加する。IDタグは、増幅配列、UMI及び第1のバーコード配列(BC)を含む。IDタグは、1つの非ライゲーション末端を含む。2)プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのgDNA断片を精製する。3)gDNA断片に第2のタグをライゲーションする。第2のタグは、増幅配列を含み、任意選択で第2のバーコード配列を含み得る。IDタグの非ライゲーション末端は、第2のタグが該IDタグにライゲーションされないことを保証するものである。4)IDタグの増幅配列及び第2のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたgDNA断片をPCR法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、プライマー配列によって付加し得る。5)UMI-BC-gDNA部分をシークエンシングする。
【
図8】クロマチン修飾の局所レベルを決定するための本発明の方法において、gDNA断片にタグを付け、PCR法で増幅し、シークエンシングする方法の例を示している。1)IDタグを、各サンプルに由来する全クロマチン断片の画分のgDNA部分にランダムに付加する。IDタグは、増幅配列、UMI、及び第1のバーコード配列(BC)を含む。2)プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのgDNA断片を精製する。3)IDタグ付きgDNA断片を、IDタグの増幅配列に特異的な1つのプライマー、及び1つまたは複数の目的の遺伝子座に特異的なプライマーを用いて、PCR法により増幅する。シークエンシングプラットフォーム専用のアダプターを、プライマーの一部として付加し得る。プライマーは、任意選択で、第2のバーコード配列も含み得る。4)UMI-BC-gDNA部分をシークエンシングする。
【
図9】クロマチン修飾のグローバルレベルを決定するための本発明の方法において、gDNA断片にタグを付け、リニア増幅法及びPCR法で増幅し、シークエンシングする方法の例を示している。1)IDタグを、各サンプルに由来する全クロマチン断片の画分のgDNA部分にランダムに付加する。IDタグは、増幅配列、RNAポリメラーゼプロモーター、UMI及び第1のバーコード配列(BC)を含む。IDタグは、1つの非ライゲーション末端を含む。2)プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのgDNA断片を精製する。3)IDタグ付きgDNAを、該IDタグに埋め込んだRNAポリメラーゼプロモーターを用いて転写し、増幅する。4)gDNA断片のRNAコピーに第2のタグをライゲーションする。第2のタグは、増幅配列を含み、任意選択で第2のバーコード配列を含み得る。5)RNAを第2のタグに相補的なプライマーを用いて逆転写する。6)IDタグの増幅配列及び第2のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたDNA断片をPCR法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、逆転写またはPCRプライマー配列で付加し得る。7)UMI-BC-gDNA部分をシークエンシングする。
【
図10】クロマチン修飾の局所レベルを決定するための本発明の方法において、gDNA断片にタグを付け、リニア増幅法及びPCR法で増幅し、シークエンシングする方法の例を示している。1)IDタグを、各サンプルに由来する全クロマチン断片の画分のgDNA部分にランダムに付加する。IDタグは、増幅配列、RNAポリメラーゼプロモーター、UMI、及び第1のバーコード配列(BC)を含む。2)プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのgDNA断片を精製する。3)IDタグ付きgDNAを、該IDタグに埋め込んだRNAポリメラーゼプロモーターを用いて転写し、増幅する。4)RNAを、1つまたは複数の目的の遺伝子座に相補的な配列を有するプライマーを用いて逆転写する。第2のタグをプライマー配列の一部として付加し得る。5)IDタグの増幅配列及び第2のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたDNA断片をPCR法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、逆転写またはPCRプライマー配列で付加し得る。6)UMI-BC-gDNA部分をシークエンシングする。
【
図11A】3種のヒストン修飾に対する薬物の効果を定量化するためのhmqChIP実験を示すものである。実験のスキームを示している。参照としてDMSO対照を用いるINRCを、該方法に従って計算し、修飾の相対量を反映しているグレースケール及び円サイズでヒートマップにプロットした。
【
図11B】3種のヒストン修飾に対する薬物の効果を定量化するためのhmqChIP実験を示すものである。1回目のシークエンシングの結果を示している。
【
図11C】3種のヒストン修飾に対する薬物の効果を定量化するためのhmqChIP実験を示すものである。25百万リードを使用して行った2回目のシークエンシングの結果を示している。
【
図11D】3種のヒストン修飾に対する薬物の効果を定量化するためのhmqChIP実験を示すものである。25百万のうちからランダムに選択した1百万リードを使用して行った2回目のシークエンシングの結果を示している。
【
図12】CDKN1A(p21)遺伝子座にハイブリダイズする遺伝子座特異的プライマーをライブラリー調製に用いて、単一遺伝子座の2種のヒストン修飾に対する薬物の効果を定量化するhmqChIP実験の結果を示している。2種の異なるヒストン修飾、H3K27ac及びH3K9me3に対する2種の抗体及びインプットのライブラリーを用いて、表示した通りに処理した4種の異なるサンプルの影響を定量化した。参照としてDMSO対照を用いるINRCを、該方法に従って計算し、複製データポイントをドットとして示す棒グラフにプロットした。
【発明を実施するための形態】
【0018】
定義
本明細書において、特に明記しない限り、「a」または「an」は、「1つ以上」を意味する。
【0019】
本明細書で使用する場合、数値に関して使用する際の用語「約」は、+/-5%、より好ましくは+/-1%を指す。
【0020】
本明細書で使用する場合、用語「エピジェネティック修飾」は、細胞分裂を通じて安定性かつ遺伝性である、クロマチン内の修飾を指す。
【0021】
本明細書で使用する場合、用語「グローバルレベル」は、全ゲノムにわたる所与のクロマチン修飾の平均密度または平均相対レベルを指す。
【0022】
本明細書で使用する場合、用語「局所レベル」は、ゲノム内の1000bp間隔内、または複数の目的の遺伝子座内等、ある特定の目的の遺伝子座にわたる、所与のクロマチン修飾の平均密度または平均相対レベルを指す。
【0023】
本明細書で使用する場合、用語「クロマチン」は、細胞の核で見出されるゲノムDNA(gDNA)とタンパク質の複合体を指す。クロマチンの主たるタンパク質成分は、ヒストンでできている。
【0024】
方法
本開示は、複数のサンプルにおけるクロマチン修飾レベルを並行して評価する方法について記載するものである。該方法は、複数のサンプルにおける複数のクロマチン修飾のグローバルレベルまたは局所レベルのいずれかを並行して評価するのに有用である。特に、該方法は、前記レベルを互いに比較するか、または対象と比較して決定するのに有用である。本開示は、多数の種々のサンプルにおいて、ヒストン翻訳後修飾(PTM)またはヌクレオチド修飾等、複数のクロマチン修飾の相対グローバルレベルまたは局所レベルを測定するための、高度にマルチプレックス化された定量的技法に関するものである。該方法の有用なワークフローの一例を、
図1に模式的に記述する。
【0025】
特に、本発明の方法は、対照と比較した所与のクロマチン修飾の増加または減少を、定量的に決定するのに有用である。該方法は、複数のサンプルの並行解析を可能にするものである。したがって、該方法は、種々のサンプルにおける複数の所与のクロマチン修飾の強化または減少を定量的に解析するために使用することができる。
【0026】
種々のサンプルにわたるクロマチン修飾レベルを定量的に測定可能にするためには、前記サンプルが同一の様式で処理されることが重要である。したがって、全てのサンプルが本質的に同一の様式で処理されることが好ましい。また、全てのクロマチン修飾サブプールが同一の様式で処理されることが好ましい。
【0027】
好ましい実施形態において、該方法は、1つ以上のクロマチン修飾のグローバルレベル及び/または局所レベルに対する、1つ以上の試験化合物の効果を決定するために使用することができる。かかる実施形態では、細胞を種々の試験化合物またはそれらの組み合わせと共にインキュベートし、細胞における複数のクロマチン修飾のグローバルレベル及び/または局所レベルを、本発明の方法によって決定する。そのようにして、エピゲノムに対する様々な試験化合物の効果を評価することができる。
【0028】
クロマチン修飾
本開示は、複数のクロマチン修飾のグローバルレベルを評価するための方法について記載するものである。
【0029】
本明細書で使用する場合、用語「クロマチン修飾」は、レベルを決定することが望ましい、クロマチンの任意の特定の特徴を指す。往々にして、クロマチン修飾は、エピジェネティック修飾であり得る。
【0030】
クロマチン修飾は、例えば、以下からなる群から選択され得る。
i. クロマチン断片内のgDNAに結合したタンパク質
ii. 翻訳後修飾
iii. 核酸塩基の修飾
iv. gDNA断片中の非天然核酸塩基の存在
v. 翻訳後プロセシングを通じて産生されたタンパク質断片の存在
vi. 非正規DNA構造
【0031】
該方法は、任意のクロマチン修飾であり得る、複数の様々なクロマチン修飾の同時評価を可能にする。したがって、該方法は、複数の類似のクロマチン修飾または非常に異なるクロマチン修飾の評価に関与し得る。したがって、該方法は、上記様々な種類のクロマチン修飾の混合物を評価することに関与し得る。
【0032】
該方法は、結合分子、好ましくは特定のクロマチン修飾に特異的に結合する抗体の使用に関与する。したがって、クロマチン修飾は、結合分子、好ましくは抗体が特異的に認識することができる、任意の修飾であり得る。
【0033】
本発明の方法によって評価され得るクロマチン修飾の1つ以上は、エピジェネティック修飾であり得る。本明細書で使用する場合、用語「エピジェネティック修飾」は、安定性かつ遺伝性である修飾を指す。前記修飾は、多くの場合、クロマチンの化学的マークである。エピジェネティックマークとしては、gDNAの修飾、ならびにヒストン等のgDNAに会合しているタンパク質の様々な翻訳後修飾(例えば、「翻訳後修飾」の節で後述する修飾のいずれか)を挙げることができる。
【0034】
哺乳類では、親由来の特異的遺伝子発現(母方または父方のいずれかの染色体から)がしばしば認められるが、これは通常、エピジェネティック修飾によるものである。親の生殖細胞では、エピジェネティック修飾により、安定した遺伝子サイレンシングまたは遺伝子活性化がもたらされ得る。他のエピジェネティック修飾としては、エピジェネティック状態、クロマチン構造、転写、mRNAスプライシング、転写後修飾、mRNA安定性及び/または半減期、翻訳、翻訳後修飾、タンパク質安定性及び/または半減期、及び/またはがんに関連する細胞経路の少なくとも1つの構成要素におけるタンパク質活性、における変化を挙げてもよい。
【0035】
上述のように、クロマチン修飾は、例えば、ヌクレオチドの修飾、特にgDNA内のヌクレオチドの修飾であり得る。前記修飾は、例えば、メチル化(例えば、核酸塩基のメチル化)であり得る。修飾ヌクレオチドは、例えば、5-メチル-シトシン、5-ヒドロキシメチル-シトシン、5-ホルミル化シトシン、5-カルボキシシトシン及び6-メチル-アデニンであり得る。
【0036】
上述のように、クロマチン修飾は、例えば、1つ以上の非天然核酸塩基の存在であり得る。非天然核酸塩基の非限定的な例としては、5-ブロモ-2’-デオキシウリジン及び5-エチニル-2’-デオキシウリジン塩基が挙げられる。
【0037】
上述のように、クロマチン修飾は、例えば、1つ以上の非正規DNA構造の存在であり得る。非正規DNA構造の非限定的な例としては、G4構造、一本鎖DNA、及びRNA:DNAハイブリッドが挙げられる。
【0038】
本発明の方法は、少なくとも1つ(好ましくは少なくとも2つ)、少なくとも3つ等(例えば少なくとも5つ)、少なくとも10等(例えば少なくとも15)、5~100の範囲等(例えば5~50の範囲)、10~100の範囲等(例えば10~50の範囲)のクロマチン修飾のグローバルレベル及び/または局所レベルを決定するためのものであり得る。特に、前記クロマチン修飾の少なくとも1つ(好ましくは少なくとも2つ)、少なくとも3つ等(例えば少なくとも5つ)、少なくとも10等(例えば少なくとも15)が、タンパク質(複数可)の翻訳後修飾(PTM)(例えば、以下の「翻訳後修飾(PTM)」の節で記述されているPTMのいずれか)であることが好ましい。
【0039】
翻訳後修飾(PTM)
本明細書で使用する場合、用語「翻訳後修飾」(PTM)は、タンパク質翻訳後のそのタンパク質の構造における修飾を意味する。PTMは、カルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、またはグリコシル化が挙げられるがこれらに限定されない化学基の付加を含み得る。PTMは、プロリン異性化、または非定型イソアスパルチルの形成が挙げられるがこれらに限定されない異性化を含み得る。
【0040】
PTMの例としては、リジンのモノ、ジ、トリメチル化;リジンのアセチル化、プロピオニル化、ブチリル化、クロトニル化、イソブチリル化、ユビキチン化、スモイル化、ネディル化、グルタリル化;セリンリン酸化、スレオニンリン酸化;ヒスチジンリン酸化;シトルリン;アルギニンモノメチル化または対称もしくは非対称ジメチル化が挙げられるが、これらに限定されない。
【0041】
クロマチン修飾に関して、PTMは、往々にしてヒストンの翻訳後修飾(本明細書では「ヒストン修飾」とも呼ばれる)である。前記ヒストンのPTMは、前述のPTMのいずれかであり得る。例えば、ヒストン修飾は、1つ以上のヒストンのアセチル化、メチル化、脱メチル化、リン酸化、アデニル化、ユビキチン化、またはADPリボシル化であり得る。
【0042】
前記ヒストンは、例えば、以下からなる群から選択されるヒストンであり得る。
a. ヒストンH3
b. ヒストンH3.1、H3.2、H3.3
c. ヒストンH3.X、H3.Y
d. ヒストンH4
e. ヒストンH2A
f. ヒストンH2A.X
g. ヒストンH2A.Z
h. ヒストンH2A.Z.1
i. ヒストンH2A.Z.2
j. ヒストンマクロH2A
k. ヒストンH2A.Bbd、及び
l. ヒストンH2B
【0043】
翻訳後修飾を有するヒストンの非限定的な例としては、以下のものが挙げられるが、これらに限定されない。
a. H3K4me1;
b. H3K4me2;
c. H3K4me3;
d. H3K79me3;
e. H3K9me1;
f. H3K9me2;
g. H3K9me3;
h. H3K27me1;
i. H3K27me2;
j. H3K27me3;
k. H4K20me1;
l. H4K20me2及び
m. H4K20me3。
【0044】
周知のヒストン翻訳後修飾(PTM)及びそれらの組み合わせは、エピジェネティック情報に対する、クロマチンの詳細なコーディング潜在力を強調するものである。
【0045】
異常なヒストン尾部は、マークを書き込む酵素または消す酵素だけでなく、特定のマークまたはマークの組み合わせを認識し、ゲノム遺伝子座でのその出現を遺伝子活性等の機能的結果に結びつけるリーダー/エフェクターのためのシグナル伝達プラットフォームとして働くことが十分に確立されている。ヒストンPTMの複雑さと密度は、内因性シグナル伝達、外因性ストレス、環境因子または薬物によってといい、細胞にもたらされる混乱に対する影響を精査するための課題を提供するものである。
【0046】
グローバルレベル及び局所レベル
本明細書で使用する場合、用語「グローバルレベル」は、ゲノム全体にわたる特定のクロマチン修飾の総平均レベルまたは平均密度を指す。前記レベルは、対象と比較した相対レベルとして最も頻繁に決定される。例として、クロマチン修飾がH3K4me3である場合、「グローバルレベル」は、ゲノムにおける前記修飾の平均レベルまたは密度に相当する。
【0047】
本明細書に記載の方法によって決定されたグローバルレベルは、原理的には、定量的ウェスタンブロットまたは定量的免疫蛍光顕微鏡法等の他の生化学的方法によって測定されたグローバルレベルと同等である。典型的には、グローバルレベルは、複数のサンプル間で比較される相対レベルとして提供され、好ましくは参照サンプル、より好ましくはクロマチン修飾の量が既知である参照サンプルであり得る別のサンプルに対する、あるサンプルのグローバルレベルの倍率変化を決定するものである。参照サンプルは、例えば、所与のクロマチン修飾の密度が100%であるヒストンタンパク質を有するgDNA断片調製物等の合成サンプルであり得る。本発明により提供される定量比較を用いることにより、試験サンプルにおける以前は未知であった所与のクロマチン修飾の量が、参照サンプルに対して試験サンプルで認められた倍率変化の差を考慮することで計算することができる。参照サンプルの量が既知である場合、正確なレベルを計算し得る。かかる計算は、定量的方法によって示された測定値が、サンプルの真の量に直線的に関連しているかまたは比例している場合に正確である。本明細書で詳細に説明するように、本発明の方法は、サンプルの真の量に実際に直線的に関連しているかまたは比例している。
【0048】
本明細書に開示される方法は、シークエンシングのために、サンプルあたり100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップを含む。グローバルレベルが決定される本発明の実施形態では、前記gDNA断片は、原則として、クロマチン修飾サブプール及びインプットサブプール内の全てのgDNA断片からランダムに選択され得る。往々にして、本明細書に開示される方法は、クロマチン修飾サブプール及びインプットサブプールのgDNA断片を増幅するステップを含む。本発明の実施形態では、該方法が複数のクロマチン修飾のグローバルレベルを決定するためのものである場合、前記増幅ステップは、原則として、全てのgDNA断片が同一の増幅確率を有するように設計される。これは、例えば、gDNA断片のランダムな画分に、増幅配列を含むIDタグ及び別の増幅配列を含む第2のタグを、後述のいずれかの様式でタグ付けすることにより実現され得る。次いで、増幅は、前記増幅配列を認識するプライマーにより行われ得、原理的に、gDNA断片の配列に依存しないことになる。クロマチン修飾(複数可)のグローバルレベルの評価に向けた、gDNA断片のタグ付け及び増幅の有用な方法を、
図7及び
図9に示している。当業者であれば、それらの図に開示された原理を、他の有用なタグ付け及び増幅方法に適応させることができるであろう。
【0049】
一実施形態では、サンプルのグローバルレベルは、直接測定されないが、複数の局所レベル、好ましくは、ゲノム全体の代表的なサブサンプルをまとめて提供する、100超、または1000超の遺伝子座等の多数の遺伝子座を評価することによって近似される。
【0050】
本明細書で使用する場合、用語「局所レベル」は、特定のゲノム位置(1000塩基対の間隔内等)における、所与のクロマチン修飾のレベル(または、特定のゲノムの長さ(例えば、キロベース単位)あたりの密度)を指す。したがって、典型的には、局所レベルは、所与の遺伝子座における所与のクロマチン修飾のレベルである。例として、局所レベルは、MYC遺伝子の転写開始部位周囲の1000塩基対の間隔に及んで定義される、MYC遺伝子プロモーターにおける、H3K4me3のレベルを指し得る。
【0051】
「局所レベル」は、1つの特定の遺伝子座において決定され得るが、本発明には、1つ超の遺伝子座における局所レベルを同時に決定することが含まれる。したがって、該方法は、少なくとも2つの遺伝子座、少なくとも5つの遺伝子座等(例えば少なくとも10の遺伝子座)、2~100の範囲の遺伝子座等(例えば2~50の範囲の遺伝子座)、2~25の範囲の遺伝子座等(例えば5~25の範囲の遺伝子座)で局所レベルを決定するための方法であってよい。
【0052】
局所レベルを決定する場合、該方法は、典型的には、目的の遺伝子座に特異的なプライマー(例えば、以下の「増幅」の節で詳述するような第2のプライマー)を用いてgDNA断片を増幅するステップを含む。目的の遺伝子座がより多い場合、前記増幅ステップでは、通常、目的の遺伝子座のそれぞれに特異的な、少なくとも1つの(第2の)プライマーを含む、プライマー混合物が使用される。
【0053】
本明細書に開示される方法は、シークエンシングのために、サンプルあたり100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップを含む。サンプルあたりのgDNA断片の数を正確に把握することは要件とされない。サンプルは単にランダムに選択されるため、理論的には、サンプルあたりほぼ同数のgDNAサンプルがシークエンシングされる。実際には、n掛ける100~100,000のタグ付きgDNA断片がシークエンシングされることが好ましく、ここで、nはサンプルの数である。
【0054】
いくつかの実施形態では、ステップi)で選択されるgDNA断片の数は、目的の遺伝子座の数に依存する。したがって、いくつかの実施形態では、シークエンシングのために、n掛けるp掛ける10~100,000のタグ付きgDNA断片が選択され、n掛けるp掛ける100~100,000等の配列、例えば多くともn掛けるp掛ける50,000(多くともn掛けるp掛ける20,000等)、例えばn掛けるp掛ける10~50,000の範囲(n掛けるp掛ける100~20,000の範囲等)のタグ付きgDNA断片が選択され、ここで、nはステップa.において提供されたサンプルの数であり、pは目的の遺伝子座の数である。
【0055】
局所レベルが決定される本発明の実施形態では、前記gDNA断片は、1つ以上の目的の遺伝子座にマッピングされ得る、クロマチン修飾サブプール及びインプットサブプール内のgDNA断片から選択される。往々にして、本明細書に開示される方法は、クロマチン修飾サブプール及びインプットサブプールのgDNA断片を増幅するステップを含む。本発明の実施形態では、該方法が複数のクロマチン修飾の局所レベルを決定するためのものである場合、前記増幅ステップは、原則として、前記1つ以上の目的の遺伝子座に由来するgDNA断片のみが増幅されるように設計され得る。これは、例えば、gDNA断片のランダムな画分に、増幅配列を含むIDタグを、後述のいずれかの様式でタグ付けすることにより実現され得る。次いで、増幅は、前記増幅配列を認識するプライマー及び目的の遺伝子座に特異的なプライマーまたはプライマー混合物により行われ得る。クロマチン修飾(複数可)の局所レベルの評価に向けた、gDNA断片のタグ付け及び増幅の有用な方法を、
図8及び
図10に示している。当業者であれば、それらの図に開示された原理を、他の有用なタグ付け及び増幅方法に適応させることができるであろう。
【0056】
サンプル
本発明の方法は、クロマチンを含む複数のサンプルにおいて、複数のクロマチン修飾のグローバルレベルを評価することを可能にするものである。
【0057】
前記クロマチンを含むサンプルは、好ましくは、複数の細胞を含む細胞集団から調製されるか、または該細胞集団を含むサンプルである。
【0058】
該方法は、複数のサンプルを同時に試験することを可能にするものである。したがって、該方法は、特に、複数の試験サンプル、少なくとも15等(少なくとも25等)、例えば少なくとも50(少なくとも75等)、例えば15~1000の範囲(15~500の範囲等)、例えば25~1000の範囲(25~500の範囲等)のクロマチンを含む種々の試験サンプルを提供することを含み得る。試験サンプルは、好ましくは、それらが互いに物理的に分離されているような様式で提供される。
【0059】
本発明の方法の利点の1つは、該方法により、複数の種々のサンプルにおける複数のクロマチン修飾のレベルを正確に定量化できることである。故に、多数のサンプルを並行して解析することができる。したがって、いくつかの実施形態では、少なくとも75、好ましくは少なくとも85、例えば75~1000の範囲(75~500の範囲等)、例えば85~1000の範囲(85~500の範囲等)のクロマチンを含む種々の試験サンプルが提供される。
【0060】
サンプルは通常、細胞集団を含むか、またはサンプルは細胞集団のクロマチンを精製または部分精製することによって調製され、該細胞集団は、複数の細胞を含む。該方法は、クロマチン修飾のグローバルレベルに対する、細胞の様々な処理の効果を評価するために特に有用である。
【0061】
したがって、細胞集団は、好ましくは、全て同一の様式で処理されている複数の細胞を含む。
【0062】
細胞は、任意の細胞であってよい。一実施形態では、細胞は培養細胞であるが、細胞は、単細胞生物または多細胞生物(例えば、動物)から直接得てもよい。細胞は、例えば、形質転換細胞株、患者由来細胞株等の初代細胞株、がん細胞株、iPS細胞、接着細胞、懸濁細胞、3D細胞培養物、人工組織細胞及びオルガノイド細胞からなる群から選択され得る。
【0063】
試験サンプルに含まれている、または試験サンプルの調製に使用される細胞は、任意の有用な方法により培養されていてもよい。例えば、細胞は、懸濁液中で増殖されていても、接着細胞として増殖されていても、3D培養で増殖されていても、または凝集体(例えば、オルガノイド、ガストロイド)で増殖されていてもよい。細胞培養のための有用な方法及び培地は、当業者に周知である。
【0064】
サンプルの調製に先立ち、細胞は任意選択で、例えば、ホルムアルデヒド中でのインキュベーションにより、固定され得る。しかし、細胞は天然のものであってもよい。
【0065】
一般に、クロマチン修飾レベルの正確な評価を得るためには、サンプルは、複数の細胞を含む細胞集団を含むか、または該細胞集団から調製されなければならない。特に、サンプルは、インプットサブプール及び試験サブプールの調製を可能にするのに十分な細胞から調製されることが好ましく、原則として、各クロマチン断片は、前記サブプールの各々において見受けられる。これは、単一細胞のクロマチンをサブプールに分けた場合、サブプールのそれぞれが異なるものになるため、複数の細胞が必要とされることにならうものである。したがって、クロマチン修飾レベルの正確な評価は、いくつかの理由から、単一細胞レベルでは行えないことが、当業者には理解されよう。
【0066】
したがって、一実施形態では、細胞集団は、少なくとも100の細胞、好ましくは少なくとも500の細胞、さらにより好ましくは少なくとも1000の細胞、例えば10~100,000の範囲の細胞(100~100,000の範囲の細胞等)、例えば1000~100,000の範囲の細胞を含む。
【0067】
該方法の一実施形態では、各サンプルは、10~100000の範囲の細胞(100~10000の範囲の細胞等)を含むか、または前述の数の細胞から精製/部分精製される。
【0068】
好ましい実施形態において、本発明は、複数のクロマチン修飾のグローバルレベルに対する複数の処理の効果を評価することに関する。前記処理は、例えば、種々の試験化合物またはそれらの組み合わせとのインキュベーションであり得る。かかる実施形態では、該方法は、クロマチン修飾レベルに対する様々な試験化合物の効果を評価するのに有用である。この情報は、化合物または化合物の組み合わせの毒性を評価するために使用することができる。
【0069】
したがって、本発明はまた、クロマチン修飾のグローバルレベルまたは局所レベルに対する試験化合物の影響を決定する方法を提供し、前記方法は以下のステップを含む。
a. 1つ以上の試験化合物を提供するステップ、
b. 前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはそれらの組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
c. 本発明の方法に従って、複数のサンプルにおいて、複数のクロマチン修飾のレベルを並行して評価する方法を実施するステップであって、複数の試験サンプルのそれぞれは、種々の細胞集団のクロマチンを含む、前記実施するステップ。
【0070】
細胞集団は、種々の試験化合物またはそれらの組み合わせの存在下で培養されるが、サンプルが、複製(例えば、二重または三重)で調製され得ることが、該方法に含まれ、したがって、1つ超(1~10の範囲等)の細胞集団が、同一の試験化合物または試験化合物の組み合わせの存在下で培養されていてもよいことが、本発明に含まれる。
【0071】
本発明の実施形態において、該方法がクロマチンのグローバルレベルに対する様々な処理の効果を評価するために使用される場合、該方法は、異なる種類の処理でまたは処理なしで、同一種の細胞を培養し、かかる細胞におけるクロマチン修飾のグローバルレベルを比較することに関与し得る。これにより、種々の処理の効果を評価することが可能になるであろう。
【0072】
好ましい実施形態では、前記処理は、種々の試験化合物またはそれらの組み合わせとのインキュベーションであり得る。かかる実施形態では、該方法は、クロマチン修飾レベルに対する様々な試験化合物の効果を評価するのに有用である。この情報は、化合物または化合物の組み合わせの毒性を評価するために使用することができる。
【0073】
同一の実施形態において、該方法は、クロマチン修飾の生成または除去に関与する酵素を、阻害または枯渇させる複数の処理と組み合わせて、複数のクロマチン修飾の相互依存性を評価する(ネットワーク解析)のに有用である。
【0074】
クロマチンの断片化:
該方法の1つの態様は、クロマチンの分解(断片化)に関するものである。
【0075】
サンプルがインタクトな細胞を含有する場合、該方法は、細胞膜を破壊する(例えば、溶解によって)ステップを含み得、それによって、天然のクロマチンが利用可能になる。前記クロマチンは、任意選択で、さらに精製または部分精製され得る。
【0076】
次いで、各サンプルのクロマチンは、クロマチン断片に断片化され得、ここで、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む。前記関連タンパク質は、ヒストン及び任意の他のタンパク質であり得る。
【0077】
クロマチンの断片化は、様々な方法によって達成することができる。該方法の一実施形態では、前記クロマチンは、クロマチンの断片化を触媒する1つ以上の酵素とインキュベートすることによって断片化される。前記酵素のうちの1つ以上は、小球菌ヌクレアーゼ(MNase)等のヌクレアーゼ、配列特異的制限酵素またはそれらの混合物からなる群から選択される。別の実施形態では、前記クロマチンの断片化方法は、機械的な剪断(超音波処理による剪断等、噴霧剪断等、集束音響剪断等)によるものである。
【0078】
クロマチンは、特定のクロマチン修飾の同定を可能にする最適なサイズを得るために、断片に分解され得る。1つの好ましい実施形態では、クロマチン断片のサイズは、生成した断片の大多数が、クロマチン修飾の実例を0または1つのいずれかで含有するが、2つ以上は含有しないように選択される。
【0079】
一実施形態では、クロマチン断片のサイズは、生成した断片の大多数(例えば、生成した断片の少なくとも50%(少なくとも60%等)、例えば少なくとも70%(少なくとも80%等))が、各コアヒストンの2コピーを含むヌクレオソーム単位を1つ含有するが、1つ超は含有しないように選択される。これは、評価される1つ以上のクロマチン修飾がヒストンPTMである方法に関する場合に、特にあり得る。この実施形態では、大多数の断片は、クロマチン修飾を0、1つ、または2つの実例のいずれかで含有するが、3つ以上は含有しないことが期待される。
【0080】
一実施形態では、最適なクロマチン断片サイズは、ヌクレオソームのサイズに相当する140bpと200bpとの間の範囲にある。これは、評価される1つ以上のクロマチン修飾がヒストンPTMである場合に、特にあり得る。別の実施形態では、最適なサイズは、DNA上の修飾の予想最小距離に相当する。これは、評価されるクロマチン修飾がヌクレオチド修飾である場合に、特にあり得る。実施形態において、1つ以上のクロマチン修飾が、クロマチンに結合するタンパク質の存在である場合、最適なサイズは、タンパク質結合部位の予想最小距離に相当するが、最小で、例えば、DNA上のタンパク質の予想フットプリントの長さの1~2倍である。
【0081】
一実施形態では、前記クロマチン断片は、100bp~10kbの範囲のサイズに断片化される。
【0082】
タグ付け
上記のように、本発明の方法は、クロマチンをクロマチン断片に断片化することを含む。各クロマチン断片は、gDNA断片及び任意選択の関連タンパク質を含む。本明細書に開示される方法は、1つ以上のタグでgDNA断片をタグ付けするステップをさらに含み得る。
【0083】
本明細書で使用する場合、用語「タグ付け」は、ヌクレオチドの短い配列(例えば、DNA、RNA、またはヌクレオチドアナログ)をgDNA断片に付加すること(例えば、ライゲーションによって)を指す。タグ付けは、タンパク質と複合体化したgDNAに(例えば、クロマチン断片に)、または精製したgDNAもしくは別途前処理したgDNAに実施し得る。
【0084】
タグ付けは様々な理由で行われ得る。しかし、IDタグは、主に、シークエンシングによって所与のgDNA断片を所与のサンプルに帰属させることを可能にするために付加される。したがって、タグ付けは、例えば、サンプルの由来を識別するための補助となり得る。また、タグ付けは、例えば、固有の分子を識別するための補助となり得る、及び/または、タグ付けは、例えば、クロマチン修飾のグローバルレベルのマッピング及び定量化を可能にし得る。
【0085】
タグ付けは、gDNA断片の増幅、選択、伸長、修飾を可能にするために、例えば、特定のシークエンシングプラットフォームでのシークエンシングを可能にするためにも実施され得る。
【0086】
タグには、上記の機能のいくつかを組み合わせてもよい。
【0087】
本明細書で定義される「タグ」は、典型的には、特定の配列を有するオリゴヌクレオチドである。オリゴヌクレオチドは、一本鎖もしくは二本鎖または部分的に一本鎖及び部分的に二本鎖であり得る。タグオリゴヌクレオチドは、一般にDNAであるが、他のタイプのヌクレオチドも含んでよい。
【0088】
IDタグ
各サンプルのクロマチンは、クロマチン断片に断片化され、ここで、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片(任意選択で、一本鎖のオーバーハングを有する)及び任意選択の関連タンパク質を含む。次いで、各サンプルのgDNA断片は、IDタグでタグ付けされ得る。
【0089】
IDタグは、オリゴヌクレオチド、好ましくは、二本鎖オリゴヌクレオチドであり得る。IDタグは、バーコード配列及び任意選択の追加の配列を含む。IDタグのバーコード配列は、本明細書において「第1のバーコード配列」とも呼ばれることがある。第1のバーコード配列は、各サンプルを識別する固有の配列である。換言すれば、あるサンプルのgDNA断片は、同一の第1のバーコード配列でタグ付けされ、一方、異なるサンプルのgDNA断片は、異なる第1のバーコード配列でタグ付けされる。そのようにして、IDタグを、特定のgDNA断片がどのサンプルに由来するかを識別するために使用することができる。
【0090】
サンプル内の本質的に全てのgDNA断片がタグ付けされることが可能である一方で、gDNA断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。例として、gDNA断片の1%、0.1%、0.01%またはそれ以下のみがタグ付けされ得る。gDNA断片の画分のみがIDタグでタグ付けされる場合、前記断片はランダムに選択されることが好ましい。
【0091】
バーコード配列は、4~40ヌクレオチドの範囲、例えば4~20ヌクレオチドの範囲(6~16ヌクレオチドの範囲等)であり得る。原則として、バーコード配列は、バーコード配列が各サンプルに対して異なることを条件として、任意の配列であってよい。いくつかの実施形態では、バーコード配列が、いかなる有意な程度にも二次構造を形成しないことが好ましいことがある。
【0092】
第1のバーコード配列に加えて、IDタグは追加の配列を含有し得る。例えば、IDタグは、本明細書においてUMI配列とも呼ばれる、固有の分子識別子として作用するランダムなDNA配列を含み得る。したがって、原則として、各UMI配列は異なるものである。UMIは、4~20ヌクレオチドの範囲、例えば、6~16ヌクレオチドの範囲のランダムな配列を含み得る。
【0093】
かかる実施形態では、1つのサンプル内のタグ付きgDNA断片は、同一の第1のバーコード配列でタグ付けされるが、異なるUMI配列でタグ付けされることになる。
【0094】
一実施形態では、IDタグは、第1のバーコード配列及びUMI配列に加えて、追加の配列を含み得る。前記追加配列は、タグ付けプロセスを容易にし得る、すなわち、それらは、タグをgDNA断片に付着させるのを補助し得る。例えば、追加配列は、gDNA断片上の一本鎖末端にアニールすることができる一本鎖オーバーハングであり得る。特定の配列のgDNA断片上の一本鎖末端は、例えば、該断片が制限酵素の補助によってもたらされる場合に生成し得る。したがって、追加配列は、制限酵素によってもたらされた一本鎖オーバーハングに相補的な一本鎖オーバーハングであり得る。
【0095】
IDタグは、増幅及び/またはシークエンシングに有用な追加の配列(複数可)も含み得る。本明細書において、かかる配列はそれぞれ、「増幅配列」及び「アダプター配列」とも呼ばれる。増幅配列は、プライマー結合部位として有用であるように選択され得る。したがって、増幅配列は、プライマーがアニールすることができる任意の配列を含み得るか、またはそれからなり得る。当業者であれば、プライマー結合部位として有用な配列を設計することができる。増幅配列はまた、RNAポリメラーゼプロモーター等のポリメラーゼプロモーターを含み得るか、またはそれからなり得る。
【0096】
アダプター配列は、一般に、特定の方法に使用されるシークエンシング手法に応じて選択される。
【0097】
したがって、いくつかのシークエンシング法は、増幅ステップ、例えば、以下でより詳細に記載するように、PCR、クローンPCRまたは区画PCRを含む。かかる実施形態では、IDタグは、プライマーにアニールすることができる配列を含む、アダプター配列を含み得る。
【0098】
いくつかのシークエンシング法は、典型的に1つ以上の固定されたオリゴヌクレオチドへのハイブリダイゼーションによる、gDNA断片を固定化するステップを含む。かかる実施形態では、IDタグは、一本鎖であり、前記固定されたオリゴヌクレオチドの少なくとも1つにアニールすることができる、アダプター配列を含み得る。
【0099】
本明細書に開示される方法がgDNA断片に第2のタグをライゲーションするステップを含む、本発明の実施形態では、IDタグは、それがgDNA断片にライゲーションされると、他の配列にはライゲーションできないように設計され得る。換言すれば、IDタグは、非ライゲーション末端を含み得る。
【0100】
IDタグは、1本または2本の一本鎖オーバーハング(複数可)を任意選択で含有する、2本鎖オリゴヌクレオチドであり得る。IDタグの1本の鎖は、好ましくは、多くとも100ヌクレオチド(多くとも75ヌクレオチド等)、例えば多くとも50ヌクレオチドを含有する。特に、IDタグは、6~100ヌクレオチドまたはヌクレオチド塩基対の範囲(6~75ヌクレオチドまたはヌクレオチド塩基対の範囲等)、例えば6~50ヌクレオチドまたはヌクレオチド塩基対の範囲からなるオリゴヌクレオチドからなり得る。
【0101】
第2のタグ
本明細書に記載の方法は、特定のクロマチン修飾を有するクロマチン断片が、特定の抗体への吸着によってクロマチン断片プールまたはサブプールから単離され(「免疫沈降」)、採取され、任意選択でさらに処理されるステップを含む。
【0102】
例えば、クロマチン断片またはそのgDNA断片部分は、後続のシークエンシングを可能にする様式で、精製、増幅及び/または別途調製され得る。
【0103】
かかる手順における1つのステップは、例えば、後続のステップにおける選択、増幅または識別を支援するために、クロマチン断片(典型的にはクロマチン断片のgDNA部分)に第2のタグを付けることであり得る。
【0104】
本明細書では、特異的抗体と結合する全クロマチン断片の全gDNA断片を含む組成物は、「クロマチン修飾サブプール」とも呼ばれる。したがって、「クロマチン修飾サブプール」は、原則として、特異的抗体により認識されるクロマチン修飾を含有する、かかるクロマチン断片のgDNA断片のみを含有する。所与のgDNA断片がどの「クロマチン修飾サブプール」に由来するかを識別するために、第2のタグは、バーコード配列(以降、「第2のバーコード配列」または「第2のバーコード」と呼ぶ)を含み得る。
【0105】
第2のバーコード配列は、各クロマチン修飾サブプールのgDNA断片を識別する固有の配列である。換言すれば、あるクロマチン修飾サブプールのgDNA断片は、同一の第2のバーコード配列でタグ付けされ、一方、異なるクロマチン修飾サブプールのgDNA断片は、異なる第2のバーコード配列でタグ付けされる。
【0106】
そのようにして、gDNAは、特定のgDNA断片がどのサンプルに由来するかを識別するために使用することができるIDタグ、及び特定のgDNA断片がどのクロマチン修飾プールに由来するかを識別するために使用することができる第2のタグでタグ付けされ得る。
【0107】
クロマチン修飾サブプール内の本質的に全てのgDNA断片が、第2のタグでタグ付けされることが可能である一方で、gDNA断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。したがって、gDNA断片の画分のみが、1つのIDタグ及び1つの第2タグの組み合わせでタグ付けされることも本発明に含まれる。
【0108】
第2のタグは、オリゴヌクレオチド、好ましくは、二本鎖オリゴヌクレオチドであり得る。
【0109】
第2のタグは、任意の有用な手段によってgDNA断片に付着され得る。一実施形態では、第2のタグは、例えば二本鎖オリゴヌクレオチドとして、gDNA断片にライゲーションされ得る。
【0110】
本明細書に記載の方法は、クロマチン修飾サブプールのgDNA断片を増幅するステップを含み得る。かかる実施形態では、第2のタグは、増幅プロセス中に付加され得る。例えば、第2のタグは、増幅のために使用されるプライマーの一部であってよい。
【0111】
したがって、一実施形態では、第2のタグの一部を示す一本鎖オリゴヌクレオチドが、gDNA断片にライゲーションされ得る。その後、第2のタグの相補的な部分を示すオリゴヌクレオチドが、第1の部分にハイブリダイズし、直ちに二本鎖オリゴヌクレオチドが形成し得る。
【0112】
別の実施形態では、第2のタグの一部を示す一本鎖オリゴヌクレオチドが、gDNA断片にライゲーションされ得る。第2のタグは、後続の増幅ステップ中に、DNAポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換される。
【0113】
別の実施形態では、第2のタグの一部を示す一本鎖オリゴヌクレオチドは、第2のタグにおける配列がgDNA配列に相補的であることによって、gDNA断片にハイブリダイズし得る。
【0114】
別の実施形態では、第2のタグの一部を示す一本鎖オリゴヌクレオチドは、増幅ステップにおいて、gDNA断片から転写される一本鎖RNAにライゲーションされ得る。前記増幅ステップでは、例えば、IDタグの増幅配列に結合するプライマーが使用され得る。次いで、第2のIDタグは、後続の増幅ステップ中に、DNAポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換され得る。
【0115】
別の実施形態では、第2のタグの一部を示す一本鎖オリゴヌクレオチドは、増幅ステップにおいて、gDNAから転写される一本鎖RNAにハイブリダイズし得る。第2のタグは、後続の増幅ステップ中に、DNAポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換さ得る。
【0116】
クロマチン修飾プール内の本質的に全てのgDNA断片がタグ付けされることが可能である一方で、gDNA断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。
【0117】
第2のタグは、第2のバーコード配列及びgDNA断片へのライゲーション、ハイブリダイゼーション、または増幅に有用な任意選択の追加配列を含み得る。かかる配列は、「増幅配列」とも呼ばれ得る。
【0118】
第2のバーコード配列は、4~20ヌクレオチドの範囲、例えば6~16ヌクレオチドの範囲であり得る。
【0119】
第2のバーコード配列に加えて、第2のタグは追加の配列を含有し得る。前記追加配列は、タグ付けプロセスを容易にし得る、すなわち、それらはタグをgDNA断片に付着させるのを補助し得る。例えば、追加配列は、gDNA断片上またはIDタグでタグ付けされたgDNA断片上の一本鎖末端にアニールすることができる一本鎖オーバーハングであり得る。特定の配列のgDNA断片上の一本鎖末端は、例えば、該断片が制限酵素の補助によってもたらされる場合、または第1のIDタグが一本鎖オーバーハングを含有する場合に生成し得る。したがって、追加配列は、制限酵素によってもたらされた一本鎖オーバーハングに相補的な一本鎖オーバーハングであり得る。
【0120】
いくつかの実施形態では、第2のタグは、IDタグと対照してgDNA断片の反対側の末端に付加されることが好ましい。したがって、往々にして、第2のタグがgDNA断片にライゲーションされる場合、IDタグは、それがgDNA断片にライゲーションされると、他の配列にはライゲーションできないように設計され得る。
【0121】
第2のIDタグは、増幅及び/またはシークエンシングに有用な追加の配列(複数可)も含み得る。本明細書において、かかる配列はそれぞれ、「増幅配列」及び「アダプター配列」とも呼ばれる。アダプター配列は、一般に、特定の方法に使用されるシークエンシング手法に応じて選択される。
【0122】
したがって、いくつかのシークエンシング法は、増幅ステップ、例えば、以下でより詳細に記載するように、PCR、クローンPCRまたは区画PCRを含む。かかる実施形態では、第2のタグは、プライマーにアニールすることができる配列を含む、アダプター配列を含み得る。かかる配列は、「プライマードッキング配列」とも呼ばれる。第1のIDタグと第2のIDタグの両方がプライマードッキング配列を含む場合、それらは、前記プライマードッキング配列間の配列を、前記プライマードッキング配列にアニールするプライマーペアを用いて増幅できるように選択され得る。
【0123】
いくつかのシークエンシング法は、典型的に1つ以上の固定されたオリゴヌクレオチドへのハイブリダイゼーションによる、gDNA断片を固定化するステップを含む。かかる実施形態では、第2のタグは、一本鎖であり、固定されたオリゴヌクレオチドの少なくとも1つにアニールすることができる、アダプター配列を含み得る。かかる配列は、「ハイブリダイゼーション配列」とも呼ばれる。第1のIDタグと第2のタグの両方がハイブリダイゼーション配列を含む場合、それらは同一の配列または異なる配列であり得る。それらが異なる配列である場合、それらは、異なる固定されたオリゴヌクレオチドに同時にアニールすることができ、それによってブリッジ増幅に有用なものとなる。
【0124】
第2のタグは、1本または2本の一本鎖オーバーハング(複数可)を任意選択で含有する、2本鎖オリゴヌクレオチドであり得る。第2のタグの一本鎖は、好ましくは、多くとも100ヌクレオチド(多くとも75ヌクレオチド等)、例えば多くとも50ヌクレオチドを含有する。特に、第2のIDタグは、6~100ヌクレオチドまたはヌクレオチド塩基対の範囲(6~75ヌクレオチドまたはヌクレオチド塩基対の範囲等)、例えば6~50ヌクレオチドまたはヌクレオチド塩基対の範囲からなるオリゴヌクレオチドからなり得る。
【0125】
タグ付け方法
一実施形態では、該方法は、gDNA断片に第1のIDタグ及び/または第2のタグ及び/または追加のタグをタグ付けすることを構成する。タグ付けは、典型的には、前記第1のIDタグ及び/または第2のタグをgDNA断片にライゲーションすることを含む。あるいは、タグ付けはタグメンテーションによって行われ得るか、またはタグは増幅プロセスの一部として付加され得る。タグ付けはまた、増幅プロセスの一部としてなされてもよい。例えば、タグ付けは、増幅用の3’プライマーアニーリング配列及び5’タグ配列を含むプライマーを用いて達成することができる。したがって、タグは、元のgDNA断片及び/または増幅によって作製されたgDNA断片コピーに付加され得る。簡略化のために、本明細書で使用する場合、用語「gDNA断片」は、元のgDNA断片及びそのコピーを総称し得る。
【0126】
また、タグが、例えば、上記方法の任意の組み合わせによって、複数のステップで付加されることも、本発明に含まれる。例えば、タグの一部はライゲーションによって付加され得、他方で、残りはプライマーの一部として増幅中に付加され得る。
【0127】
一実施形態では、該方法は、gDNA断片を、本明細書で上記したIDタグ及び第2のタグのいずれかであり得るIDタグ及び第2のタグでタグ付けすることを構成する。
【0128】
一実施形態では、該方法は、gDNA断片をIDタグでタグ付けすることを構成する。該方法の過程で、各タグ付きクロマチン断片のIDタグ及びgDNA配列は、RNAに転写されてもよく、各タグ付きクロマチン断片により、同一の配列を有する1つ以上のRNA分子が生じる。次いで、第2のタグが、上で明記したようなオリゴヌクレオチドとして、元のgDNA断片ではなく、タグ付きクロマチン断片のRNAコピーに、ライゲーションされ得るか、またはハイブリダイズし得る。
【0129】
タグ付けは、オリゴヌクレオチドをgDNA断片に付着させるのに有用な任意の手段によってなされ得る。往々にして、タグ付けは、例えば、T4 DNAリガーゼ、T3 DNAリガーゼ、T7リガーゼを含むがこれらに限定されないDNAリガーゼを使用するといった、DNAリガーゼを使用するアダプターライゲーションを用いたライゲーションによって実施されることになる。別の実施形態では、前記タグ付けは、Tn5トランスポザーゼ、Sleeping Beautyトランスポザーゼ、Tn7トランスポザーゼを使用するといった、トランスポゾン酵素を使用するアダプターライゲーションを用いて実施される。
【0130】
有用なタグ付け方法の例は、
図7~10に例示している。当業者であれば、これらの図に示された共通の一般的知識及び全体的なガイダンスに基づいて、使用する具体的な方法を変更することができるであろう。
【0131】
免疫沈降
本発明の方法は、特異的な抗体に結合するクロマチン断片を単離するステップを含む。前記ステップは、「免疫沈降」または「ChIP」とも呼ばれることがある。
【0132】
典型的には、免疫沈降は、各サンプルの少なくともいくつかのクロマチン断片が第1のIDタグでタグ付けされている、クロマチン断片の集約プールで実施される。したがって、該方法は、第1のIDタグでタグ付けされたクロマチン断片を組み合わせるステップを含み、それによって、種々の第1のバーコード配列を有するクロマチン断片のプールが生成し得る。上述のように、全てのクロマチン断片が第1のIDタグでタグ付けされることは必須ではなく、したがって、クロマチン断片のプールは、タグ付けされたクロマチン断片とタグ付けされていないクロマチン断片の両方を含み得る。
【0133】
一旦クロマチン断片のプールが生成すれば、前記プールは、免疫沈降に使用され得る。典型的には、クロマチン断片のプールはランダムなサブプールに分けられ、1つのサブプールはインプットサブプール(「インプット」)であり、他のサブプールは試験サブプールである。各サブプールは、全サンプルのクロマチンを代表する混合物を含有する。
【0134】
大部分が同一のクロマチン断片を含有する、複数の試験サブプール及びインプットサブプールを調製するためには、本明細書の上記「サンプル」の節で説明したように、サンプルは複数の細胞から調製されなければならないことに留意されたい。したがって、サンプルが1つの単一細胞からのみ調製された場合、免疫沈降の前にサンプルをいくつかのサブプールに分けることができない。かかるサンプルが複数のサブプールに分けられる場合、該サンプルは原則として各クロマチン断片を1つしか含有しないため、これらのサブプールの各々は、必然的に互いに異なるものにならざるを得ないはずである。したがって、サンプルは、少なくともサブプールの数に等しい細胞の数を含む細胞集団から調製されることが好ましい。換言すれば、好ましくは、サンプルは、本明細書の他の箇所で記載しているように、少なくとも提供される抗体の数プラス1に等しい細胞の数、さらにより好ましくは、少なくとも100または少なくとも500の細胞を含む細胞集団から調製される。
【0135】
各免疫沈降は、クロマチン修飾に特異的に結合する抗体を、タグ付きクロマチン断片のプールまたはそのランダムな画分を含むサブプール(「試験サブプール」とも呼ばれる)とインキュベートすることにより実施される。該方法は、複数の種々の抗体、例えば少なくとも5種の種々の抗体、少なくとも10種の種々の抗体等(例えば、少なくとも15種の種々の抗体)、5~100種の範囲の種々の抗体等(例えば、5~50種の範囲の種々の抗体)、10~100種の範囲の種々の抗体等(例えば、10~50種の範囲の種々の抗体)の使用を含む。
【0136】
上述のように、いくつかの実施形態では、クロマチン修飾のいくつかにおいては、ヒストンPTMであることが好ましい。かかる実施形態では、種々のヒストンPTMに結合する複数の抗体、例えば種々のヒストンPTMに結合する少なくとも5種の種々の抗体、種々のヒストンPTMに結合する少なくとも10種の種々の抗体等(例えば、種々のヒストンPTMに結合する少なくとも15種の種々の抗体)、種々のヒストンPTMに結合する5~100種の範囲の種々の抗体等(例えば、種々のヒストンPTMに結合する5~50種の範囲の種々の抗体)、種々のヒストンPTMに結合する10~100種の範囲の種々の抗体等(例えば、種々のヒストンPTMに結合する10~50種の範囲の種々の抗体)が提供され、免疫沈降に用いられることが好ましい。
【0137】
典型的には、各抗体は試験サブプールと共にインキュベートされる。したがって、クロマチン断片のプールは、典型的には、抗体ごとに少なくとも1つの試験サブプールがあるように、十分であるランダムなサブプールにランダムに分けられる。例えば、クロマチン断片のプールは、X+Yのランダムなサブプールにランダムに分けられてよく、ここで、Xは、免疫沈降用の種々の抗体の数であり、Yは、例えばインプットサブプールを含む、所望の追加サブプールの数である。したがって、Yは1~3(1等)であり得る。
【0138】
免疫沈降反応は、並行して実施され得る。各免疫沈降反応は、一般に、クロマチン修飾(例えば、PTM)に特異的に結合する抗体を試験サブプールとインキュベートした後、抗体及びそれに結合する任意のクロマチン断片を試験サブプールの残りから分離する手順を構成する。種々の抗体インキュベーション反応は、通常、互いに物理的に分離される。分離を容易にするために、抗体は固体支持体に固定化され得る。かかる固体支持体の例としては、ビーズ、マイクロウェル等の容器の表面、またはマイクロ流体表面が挙げられるが、これらに限定されない。
【0139】
試験プールから分離次第、特定の抗体に結合するクロマチン断片が回収され得る。これらのサブプールの各々は、原則として、免疫沈降に用いた抗体に認識される特異的なクロマチン修飾を含むクロマチン断片のgDNA断片のみを含むので、前記クロマチン断片のgDNA断片を含む任意の組成物は、「クロマチン修飾サブプール」と呼ばれる。これらのクロマチン断片の全てまたは画分は、上記のように精製、選択、第2のタグによりタグ付け及び/または増幅され得る。
【0140】
本発明のいくつかの実施形態では、クロマチン修飾サブプールは、物理的に別々に維持される。かかる実施形態では、ほぼ同一数のgDNA断片が、各クロマチン修飾サブプールからランダムに選択される。
【0141】
他の実施形態では、クロマチン修飾サブプールのいくつかまたは全てのgDNA断片は、集約プールに混合される。これは特に、gDNA断片が第2のバーコードを含む第2のタグでタグ付けされる実施形態の場合であり、該第2のタグは、所与のgDNA断片がどのクロマチン修飾サブプールに由来するかを識別するために使用することができる。
【0142】
かかる実施形態では、n掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片が、前記集約プールから選択されることが好ましい。
【0143】
クロマチン修飾に特異的に結合する莫大な数の適切な抗体が存在する。有用な抗体の例を以下に示す。
【0144】
抗体
免疫沈降に使用される抗体は、目的のクロマチン修飾に特異的に結合する任意の抗体であり得る。様々なクロマチン修飾に結合する多数の抗体が市販されている。あるいは、当業者であれば、目的のエピトープに特異的に結合する抗体を生成させる方法を認識している。
【0145】
抗体は、モノクローナル抗体、ポリクローナル抗体、免疫グロブリン、または免疫グロブリンの抗原結合断片等の任意の抗体であり得る。したがって、抗体は、クラスIgG、IgM、IgA、IgDもしくはIgEの抗体、またはFab、F(ab´)2、もしくはFd断片を含む、その断片もしくは誘導体であり得る。また、抗体は、単鎖抗体、ドメイン抗体、ダイアボディ、二重特異性抗体、二機能性抗体及びその誘導体であり得る。典型的には、抗体は、3つのCDRを含む可変領域を含むことになる。
【0146】
したがって、本発明の方法で使用されるべき各抗体は、本明細書の上記クロマチン修飾のいずれかを含む、またはそれからなるエピトープに結合し得る。特に、本発明の方法で使用されるべき抗体の1つ以上は、本明細書の上記翻訳後修飾(PTM)のいずれかを含む、またはそれからなるエピトープに結合し得る。
【0147】
増幅
本明細書に開示される方法は、往々にして、クロマチン修飾サブプールのgDNA断片を増幅するステップを含む。増幅プロセスは、元のタグ付きgDNA分子またはその一部と同一の配列を有する新規DNA分子の作製を必然的に伴う。
【0148】
各クロマチン修飾サブプールのgDNA断片は、別々に増幅され得る。あるいは、1つ以上のクロマチン修飾サブプールを増幅前に集約してもよい。後者は通常、タグ付きgDNA断片がどのクロマチン修飾サブプールに由来するかを識別可能にする第2のバーコードを含む、第2のタグで各クロマチン修飾サブプールのgDNA断片がタグ付けされている場合にのみ行われる。
【0149】
増幅生成物は通常、元のタグ付きgDNA配列の全体または一部を有する複数のDNA分子であるが、中間ステップでは、元のgDNA配列から転写されたRNA分子コピーを生成することが必要とされ得、次いで、それが逆転写されて、元のgDNA配列の全体または一部を有するDNA分子が作製される。
【0150】
増幅は、一般に、免疫沈降後に得られたクロマチン断片のタグ付きgDNA断片に対して実施される。増幅は、第2のタグによるタグ付けの前または後に実施され得る。したがって、上記のように、第2のタグは、元のgDNA断片に付加されるのではなく、代わりに、増幅を介して生成した前記gDNA断片のDNAまたはRNAコピーに付加され得る。対照として、インプットサブプール(「インプット」)のgDNA断片が、クロマチン修飾サブプールのgDNA断片と同一の様式で増幅され、別途処理され得る。一般に、増幅のいずれのステップも、全てのクロマチン修飾サブプール及びインプットサブプールに対して同一の様式で実施されることが好ましい。
【0151】
増幅は、任意の有用な手段、例えば、適切なプライマーを用いた、ポリメラーゼ連鎖反応法(PCR)、RNA中間体を介したリニア増幅法及び/または逆転写法によって実施され得る。
【0152】
プライマーは、一本鎖オリゴヌクレオチドである。上記のように、第1のIDタグ、及び/または第2のタグは、増幅に有用な増幅配列を含み得る。本明細書に開示される方法が増幅ステップを含む場合、IDタグは通常、増幅配列を含む。次いで、増幅ステップは、前記増幅配列にアニールすることができるプライマーの助けによって実施され得る。
【0153】
いくつかの実施形態において、増幅は、gDNA断片を転写するステップを含む。かかる実施形態では、IDタグは、典型的には、RNAポリメラーゼプロモーターを含む増幅配列を含む。これにより、RNAポリメラーゼがgDNA断片を転写することができることになる。かかる実施形態では、該方法は、逆転写ステップをさらに含み得る。かかる方法の例を、
図9のステップ3~5及び
図10のステップ3~4として示している。
【0154】
いくつかの実施形態において、増幅は、PCRステップを含む。かかる実施形態では、IDタグは通常、プライマーがアニールすることができる増幅配列を含む。したがって、第1のプライマーは、IDタグの増幅配列に対して同一または相補的な配列を含有し得る。加えて、第1のプライマーは、追加の配列、例えば、アダプター配列(上記の通り)を含有し得る。前記追加配列は、好ましくは、100以下、50以下等(例えば、25以下)のヌクレオチドからなる。
【0155】
増幅に使用される第2のプライマーは、第2のタグの増幅配列(またはそれに相補的な配列)にアニールするプライマーであり得る。また、増幅に使用される第2のプライマーは、縮退プライマー、ユニバーサルプライマーまたはランダムプライマーの集合体であってもよい。上述の場合、前記プライマーは、好ましくは、ゲノム中の多くの異なる位置にアニールするように設計され、全ゲノムまたは少なくともゲノムのなるべく多くを可能な限り被覆する、gDNA断片の全体的な増幅を可能にするものである。前記縮退プライマー、ユニバーサルプライマーまたはランダムプライマーは、典型的にはかなり短く、例えば、5~10ヌクレオチドの範囲(5~7ヌクレオチドの範囲等)であり、ゲノムの大部分を被覆するgDNA断片の増幅確率を高める。このことは、特に、該方法がクロマチン修飾のグローバルレベルを評価するためのものである場合の例である。
【0156】
増幅に使用される第2のプライマーは、目的の1つ以上の遺伝子座に特異的なプライマーでもあり得る。このことは、特に、該方法がクロマチン修飾の局所レベルを評価するためのものである場合の例である。
【0157】
したがって、第2のプライマーは、第2のタグの増幅配列または目的の1つ以上の遺伝子座に特異的な配列(複数可)、あるいは変性配列に対して同一または相補的な配列を含有し得る。加えて、第2のプライマーは、追加の配列、例えば、第2のタグの一部及び/またはアダプター配列(上記の通り)を含有し得る。前記追加配列は、好ましくは、100以下、50以下等(例えば、25以下)のヌクレオチドからなる。
【0158】
例えば、第1のプライマーは、以下に結合するプライマーであり得る:
- IDタグ内の増幅配列
- 第2のタグ内の増幅配列
- ゲノム配列
また、第1のプライマーは、変性配列またはランダム配列(複数可)にも結合し得る。
【0159】
同様に、第2のプライマーは、以下に結合するプライマーであり得る:
- IDタグ内の増幅配列
- 第2のタグ内の増幅配列
- ゲノム配列
また、第2のプライマーは、変性配列またはランダム配列(複数可)にも結合し得る。
【0160】
PCRによる増幅のために、第1及び第2のプライマーは、それらが共に、タグ付きgDNA断片中の相補的配列の間に位置する配列の増幅をプライミングできるように選択される。
【0161】
したがって、該方法は、gDNA断片のコピーを得るために、gDNA断片の少なくとも一部、例えば、一本鎖タグ付きまたは二本鎖タグ付きgDNA断片の少なくとも一部を増幅するステップを含み得、前記コピーは、好ましくは、下記の元のタグ付きgDNA断片の少なくとも一部を含有する。
【0162】
使用されるプライマーがタグ中の増幅配列にアニールする場合、増幅は、gDNA配列それ自体について無差別に実施され得る。
【0163】
しかしながら、一実施形態では、増幅は、gDNAに付加されたタグに存在するユニバーサル配列には依存しないが、1つ以上の特異的なゲノム配列に依存する。前記特異的なゲノム配列は、特異的なゲノム配列に相補的な配列を含む適切なプライマーを用いることによって選択され得る。それによって、前記配列を含む断片のみが増幅される。
【0164】
典型的には、増幅は、シークエンシングに先立って実施される。
【0165】
増幅は有用であり得るが、増幅が多すぎると、同一の配列が2回以上シークエンシングされるリスクが生じる。故に、同一のgDNA断片のコピーが多数ある場合、同一のgDNA断片がランダムに選択されて2回以上シークエンシングされ得る。したがって、PCR増幅が、多くとも20サイクル、5~20の範囲のサイクル等(例えば5~15の範囲のサイクル)で構成されることが好ましい。
【0166】
該方法が増幅ステップを含む場合、シークエンシングは、通常、前記増幅された断片に対して行われる。したがって、かかる実施形態では、シークエンシングされるのは、元のgDNA断片それら自体ではなく、gDNA断片のコピーである。前記コピーは、元のgDNA断片の正確なコピーではない可能性があるが、元のgDNA断片の一部を欠く、及び/またはプライマーの一部として導入された追加の配列を含有する可能性があることに留意されたい。事態を単純化するために、用語「gDNA断片」は、元のgDNA断片ならびにそのコピーの両方を指し得る。元のgDNA断片のコピーは、それらが少なくとも第1のバーコード配列ならびにUMI配列及び/または固有のものであるかどうかを確証するのに十分に長い(すなわち、少なくとも10、少なくとも15ヌクレオチド長等)gDNA配列の少なくとも一部を含有する場合にのみ、「gDNA断片」であるとみなされる。好ましくは、元のgDNA断片のコピーは、それらが少なくとも第1のバーコード配列ならびにgDNA配列を含有する場合にのみ、「gDNA断片」であるとみなされる。IDタグがUMIを含有する実施形態では、元のgDNA断片のコピーは、好ましくは、それらが少なくとも第1のバーコード配列及びUMI配列を含有する場合にのみ、より好ましくは、それらが少なくとも第1のバーコード配列、UMI配列及び固有のものであるかどうかを確証するのに十分に長い(すなわち、少なくとも10、少なくとも15ヌクレオチド長等)gDNA配列の少なくとも一部を含有する場合にのみ、「gDNA断片」であるとみなされる。第2のタグが第2のバーコードを含む実施形態では、元のgDNA断片のコピーは、好ましくは、それらが少なくとも第1のバーコード配列及び第2のバーコード、ならびにUMI配列及び固有のものであるかどうかを確証するのに十分に長い(すなわち、少なくとも10、少なくとも15ヌクレオチド長等)gDNA配列の少なくとも一部を含有する場合にのみ、「gDNA断片」であるとみなされる。
【0167】
gDNA断片のランダムな選択
上で詳細に説明したように、クロマチン修飾サブプールが準備され、ここで、各クロマチン修飾サブプールは、原則として、特定のクロマチン修飾を含むクロマチン断片のgDNA断片のみを含有する。該方法が上記のように増幅ステップを含む場合、シークエンシングのために選択される前記gDNA断片は、元のタグ付きgDNA断片であってもよいし、または元のgDNA断片のコピーもしくは両方の混合物であってもよく、前記コピーは、上の「増幅」の節に記載のgDNA断片であり得る。
【0168】
試験サブプールのgDNA断片の調製と並行して、インプットサブプールは、同一の処理(例えば、タグ付け)に供され、免疫沈降には供されないことが予期される。そのようにして、インプットサブプールを、対照または参照として使用することができる。
【0169】
一実施形態では、該方法は、各クロマチン修飾サブプール及びインプットサブプールのgDNA断片に第2のタグをタグ付けするステップを含み、1つのクロマチン修飾サブプール/インプットサブプール内のgDNA断片は、同一の第2のバーコード配列を含む第2のタグでタグ付けされ、異なる第2のバーコード配列が、各クロマチン修飾サブプールまたはインプットサブプールに対して使用される。この手順は、上でより詳細に説明している。
【0170】
かかる実施形態では、第2のバーコードを、所与のgDNA断片がどのクロマチン修飾サブプールに由来するかを識別するために使用することができる。
【0171】
いくつかの実施形態において、該方法は、1つ超のクロマチン修飾サブプール及びインプットサブプールのタグ付きgDNA断片をプールするステップを含む。該方法が上記のような増幅ステップを含む場合、前記プールは、前記増幅の前または後に実施され得る。したがって、プールされるのは、元のタグ付きgDNA断片であってもよいし、または元のタグ付きgDNA断片のコピーもしくは両方の混合物であってもよく、前記コピーは、上の「増幅」の節に記載のgDNA断片であり得る。
【0172】
好ましくは、該方法は、全てのクロマチン修飾サブプール及びインプットサブプールのgDNA断片をプールすることによって、gDNA断片のプールを生成するステップを含み得る。これは特に、各クロマチン修飾プール及びインプットサブプールのgDNA断片が、第2のIDタグでタグ付けされている本発明のかかる実施形態に関連し得る。かかる実施形態では、gDNA断片のプールは、gDNA断片がどのサンプルに由来するかを識別するために使用することができる第1のIDタグ、及びどのクロマチン修飾がgDNA断片と関連していたかを識別するために使用することができる第2のIDタグでタグ付けされたgDNA断片を含むことになる。
【0173】
次いで、該方法は、試験サンプルあたり、100~100,000の範囲(200~100,000の範囲等)、例えば多くとも50,000(多くとも20,000等)、例えば200~50,000の範囲、例えば1000~50,000の範囲(5000~20,000の範囲等)のタグ付きgDNA断片を前記プールからランダムに選択するステップを含む。したがって、n個のサンプルが本発明の方法によって解析されるならば(すなわち、ステップaにおいてn個の試験サンプルが提供されるならば)、その場合、n掛けるタグ付きgDNA断片の前述の数がランダムに選択される。各試験サンプルに対して、厳密に同じ量のタグ付きgDNA断片が提供されていることは要求されない。タグ付きgDNA断片がランダムに選択されることで十分であり、これにより、様々な試験サンプルが代表されることが確実になる。
【0174】
したがって、換言すれば、該方法は、n掛ける100~100,000の範囲(n掛ける200~100,000の範囲等)、例えば多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける200~50,000の範囲、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)のタグ付きgDNA断片を前記プールからランダムに選択するステップを含み得、ここで、nは、ステップa.において提供された試験サンプルの数である。
【0175】
厳密な数のgDNA断片がシークエンシングのために選択されることは要求されない。おおよその数のgDNA断片が選択されれば十分である。シークエンシングのためにgDNA断片をランダムに選択するための自明の手順は、予想される数の分子を含む体積を分取することである。
【0176】
いくつかの実施形態では、シークエンシングのためにランダムに選択されるタグ付きgDNA断片の数は、クロマチン修飾サブプールの数に依存する。したがって、一実施形態では、本発明の方法は、n掛けるm掛ける100~100,000の範囲、例えば多くともn掛けるm掛ける50,000(多くともn掛けるm掛ける20,000等)、例えばn掛けるm掛ける1000~50,000の範囲(n掛けるm掛ける5000~20,000の範囲等)のタグ付きgDNA断片を前記プールからランダムに選択することを含み、ここで、nは、ステップa.において提供された試験サンプルの数であり、mは、クロマチン修飾サブプールの数であり、及び/またはmは、ステップe.で提供された抗体の数である。前記選択された断片は、次いで、シークエンシングに供される。
【0177】
一実施形態では、本発明の方法は、クロマチン修飾サブプールごとの試験サンプルあたり、n掛けるm掛ける200~100,000の範囲、例えば多くともn掛けるm掛ける50,000(多くともn掛けるm掛ける20,000等)、例えばn掛けるm掛ける200~50,000の範囲、例えばn掛けるm掛ける1000~50,000の範囲(n掛けるm掛ける5000~20,000の範囲等)のタグ付きgDNA断片を前記プールからランダムに選択することを含み、ここで、nは、ステップa.において提供された試験サンプルの数であり、mは、クロマチン修飾サブプールの数であり、及び/またはmは、ステップe.で提供された抗体の数である。前記選択された断片は、次いで、シークエンシングに供される。
【0178】
したがって、n個のサンプルが本発明の方法によって解析され(すなわち、ステップaにおいてn個の試験サンプルが提供され)、m種の種々の抗体が提供されるならば、その場合、n掛けるm掛けるタグ付きgDNA断片の前述の数がランダムに選択される。
【0179】
他の実施形態では、様々なクロマチン修飾サブプールのgDNA断片は、プールに集約されない。かかる場合、前述の数のgDNA断片が、クロマチン修飾サブプールからランダムに選択される。これは、シークエンシングのために、各サブプールからほぼ同数のgDNA断片が選択されるような様式で、往々にして行われる。ほぼ同数のgDNA断片分子をランダムに選択するための自明の手順は、予想される数の分子を含む体積を分取することである。例えば、同一の体積が各クロマチン修飾サブプール及びインプットサブプールから分取され得る。しかしながら、該方法は、典型的には、各クロマチン修飾サブプールにおける各第1のバーコードの割合またはパーセンテージを決定することを含むため、同数のgDNA断片がクロマチン修飾サブプールごとにシークエンシングされることは要求されない。典型的には、少なくとも100(少なくとも200等)、例えば少なくとも1000、多くとも100,000等、例えば多くとも50,000(多くとも10,000等)のgDNA断片が、各クロマチン修飾サブプールからランダムに選択される。特に、n掛ける100~100,000、例えば多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)のタグ付きgDNA断片が、各クロマチン修飾サブプールからランダムに選択され、シークエンシングされる。ここで、nは、ステップa.において提供された試験サンプルの数である。
【0180】
例として、用語「n掛ける100~100,000」は、「n×100~n×100,000」を意味し、用語「n掛けるm掛ける100~100,000」は、「(n×m×100)~(n×m×100,000)」を意味する。
【0181】
シークエンシング
ランダムに選択されたタグ付きgDNA断片は、次いで、シークエンシングされる。ランダムに選択するステップとシークエンシングするステップが組み合わされ、同時に実施されることも本発明内に含まれる。gDNA断片全体をシークエンシングすることは要求されない。しかし、一般的には、少なくとも第1のバーコード配列は、gDNA断片が固有のgDNA断片であるかどうかを確証するのに十分な配列と共にシークエンシングされる。シークエンシングステップは、以下に説明するように、増幅ステップを含み得る。前記増幅は、シークエンシングのためにgDNA断片をランダムに選択する前に実施される、任意の増幅に加えて実施され得る。いくつかの実施形態では、タグ付きgDNA断片の一部のみが増幅され、その場合、前記増幅部分またはその断片のみがシークエンシングされる。
【0182】
シークエンシングされるべき最小限の部分は、以下で説明する。
【0183】
本発明のいくつかの実施形態において、第1のIDタグは、上記の通りのUMI配列を含む。第1のIDタグがUMI配列を含む場合、前記UMI配列は、タグ付きgDNA断片が固有のgDNA断片であるかどうかを確証するために、単独でまたはgDNA配列と組み合わせて使用され得る。かかる実施形態では、
・ 少なくとも第1のバーコード配列及びUMI配列、または
・ 少なくとも第1のバーコード配列及びUMI配列ならびにgDNA配列全体等のgDNA配列の少なくとも一部がシークエンシングされる。
【0184】
第1のIDタグがUMI配列を含まない実施形態では、第1のバーコード配列ならびにgDNA配列全体等のgDNA配列の少なくとも一部がシークエンシングされる。
【0185】
本発明のいくつかの実施形態では、gDNAは、第1のIDタグと第2のIDタグの両方でタグ付けされる。かかる実施形態では、少なくとも第1のバーコード配列及び第2のバーコード配列は、UMI配列及び/またはgDNA配列の全体等の少なくとも一部と共にシークエンシングされる。
【0186】
いくつかの実施形態では、タグ付きgDNA断片全体がシークエンシングされる。
【0187】
シークエンシングは、任意の有用な方法によって実施され得る。例えば、シークエンシングは、直接的な単一分子シークエンシング(例えば、ナノポアシークエンシング)により行われてもよい。
【0188】
好ましくは、シークエンシングは、大量並行シークエンシングを用いて行われる。大量並行シークエンシングは、次世代シークエンシング(NGS)または第2世代シークエンシングとしても知られている。大量並行シークエンシングは、空間的に分離された多数のDNA鋳型の並列シークエンシングに関与する。いくつかの実施形態では、gDNAは、上記の通りの第1のIDタグ及び第2のIDタグでタグ付けされる。かかる実施形態では、二重にタグ付けされたgDNA断片は、プールされ、大量並行シークエンシング技術を使用して、まとめてシークエンシングされ得る。
【0189】
適用される特定の大量並行シークエンシング技法に応じて、gDNA断片は、シークエンシングに先立って増幅されることがある。典型的に、増幅は、原則として、所与のgDNA断片のコピー全てが、他のgDNA断片のコピーから空間的に分離されるような、クローン的または空間的に分離される様式で実施される。これは、例えば、エマルジョンPCR、ドロップレットPCRによって、グリッドローリングサークル増幅(gridded rolling circle amplication)によって、またはブリッジ増幅によって実現することができる。特に、増幅は、本明細書における以下「増幅」の節に記載の通り実施され得る。
【0190】
次いで、鋳型がシークエンシングされる。パイロシークエンシング、可逆的終結化学作用によるシークエンシング、ライゲーションによるシークエンシング、リン酸結合蛍光ヌクレオチドを用いたシークエンシング、及び/またはリアルタイムシークエンシングを含むがこれらに限定されない、シークエンシングそれ自体についての異なる技術も利用できる。
【0191】
本発明の一実施形態では、シークエンシングは、可逆的終結化学作用を使用して行われる。かかる方法は、一般に、一本鎖gDNA断片を鋳型として使用する、相補鎖の合成を含む。用いられるdNTPは、種々のラベル(例えば、蛍光ラベル)に結合され、ここで、1種のラベルは、dNTPの各種類に対して使用される。ラベルは「ブロッキング基」として機能するように結合され、該結合は可逆的であるべきである。したがって、一度に1つのdNTPのみを添加し、ラベルを使用してdNTPの種類を決定することができる。次いで、ラベルが除去され、次のdNTPが添加される。
【0192】
有用な大量並行シークエンシングプラットフォームが市販されており、Roche 454、GS FLX Titanium、Illumina dye sequencing、Life technologies Ion proton、Complete Genomics、Helicos Biosciences HeliscopeまたはPacific Biosciences SMRTが挙げられるが、これらに限定されない。
【0193】
好ましい実施形態では、シークエンシングは、Mardis(2017)に記載されているような、Illumina dye sequencingを用いて実施される。
【0194】
興味深いことに、本発明は、gDNA断片の小規模なランダムサブセットのみをシークエンシングすることで十分であることを開示するものである。したがって、サンプルあたり、100,000未満(50,000未満等、20,000未満等)のgDNA断片をシークエンシングすることで十分である。上述のように、典型的には、100~100,000の範囲(200~100,000の範囲等)、例えば200~50,000の範囲、例えば1000~50,000の範囲(5000~20,000の範囲等)の上記gDNA断片もしくはその一部またはそのコピーがシークエンシングされる。結果としてのゲノム被覆率が極めて乏しいにもかかわらず、本発明は、データが、各サンプルのエピゲノムについての正確なサブサンプルを提供するものであることを示す。
【0195】
したがって、一般に、該方法は、シークエンシグステップであって、各サンプルに対してシークエンシグされる固有のタグ付きgDNA断片の数が、それら全体で参照ゲノム塩基の10%以下を被覆するように少数である、前記シークエンシグステップを伴う。参照ゲノムは、サンプルが由来する種と同一の種によるものであるように選択される。有用な参照ゲノムは、例えば、ヒトゲノムhg38またはマウスmm10である。
【0196】
固有のgDNA断片
gDNA断片のある画分しかシークエンシグされないとしても、それでもなお該方法は、各サンプルの各クロマチン修飾のグローバルレベルを正確に定量化することを可能にする。
【0197】
該方法は、各サンプル及びクロマチン修飾サブプールの固有のタグ付きgDNA断片の数を測定するステップを含む。特定のサンプルへのgDNA断片の割り当ては、IDタグのバーコード配列を使用して行われ得る。特定のクロマチン修飾プールへのgDNA断片の割り当ては、各クロマチン修飾プールを別々に取り扱うことによるか、または第2のバーコード配列を使用することによるかのいずれかで行われ得る。サンプルとクロマチン修飾との組み合わせの各々について、固有のタグ付きDNA断片の数がカウントされる。この数は、「カウント」とも呼ばれる。
【0198】
同様に、各サンプルについて、インプットサブプールの固有のgDNA断片の数を測定することによって、参照カウントが決定される。
【0199】
どのgDNA断片を「固有」とみなしてよいかを決定するために、異なる判断基準を使用してもよい。
【0200】
好ましい実施形態では、固有のタグ付きgDNA断片は、固有のUMI配列、及びgDNA断片配列に基づく参照ゲノムにおける固有のマッピング位置により識別される断片である。
【0201】
別の実施形態では、固有のUMI配列のみを使用して、固有のタグ付きgDNA断片の数をカウントすることが可能である。かかる実施形態では、gDNA配列は参照ゲノムにマッピングされず、代わりに、固有のタグ付きgDNA断片は、単に固有のUMI配列だけで識別される。かかる実施形態では、gDNA配列それ自体がシークエンシグされる必要はない。タグをシークエンシグすることで十分である。注目すべきことに、この実施形態では、複数のサンプルにわたる相対グローバルレベルを決定するために、研究される生物のゲノム配列情報を必要としない。
【0202】
さらに別の実施形態では、固有のタグ付きgDNA断片は、単にゲノム内の固有のマッピング位置だけで識別される断片である。かかる実施形態では、UMI配列の使用は要求されない。
【0203】
したがって、該方法は、マッピングするステップを含み得るが、これは任意選択のステップである。マッピングは、gDNA配列の参照ゲノムへのマッピングに関与する。参照ゲノムは、サンプルが由来する種と同一の種によるものであるように選択される。有用な参照ゲノムは、例えば、ヒトゲノムhg38またはマウスmm10である。参照ゲノム中の異なる位置にマッピングしているgDNA断片は、固有であるとみなされる。マッピングは、通常、各サンプル及び各抗体反応について、マッピングされた固有のタグ付きgDNA断片の数をカウントすることを含む。
【0204】
クロマチン修飾レベルの定量化
グローバルレベルは、一般的に、インプットサブプールの各サンプルに由来する固有タグ付きgDNA断片のカウントと比較した、各免疫沈降に対する各サンプルに由来する固有gDNA断片のカウントの比として計算される。比が高くなるほど、免疫沈降に使用される抗体によって特異的に認識されるクロマチン修飾のグローバルレベルが高くなることを指し示す。
【0205】
概して、本発明の方法は定量的である。したがって、該方法は、好ましくは、参照と比較した任意の所与のクロマチン修飾の特異的倍率差を提供するものである。特異的倍率差は、特に、以下に記載の通りに計算され得る。
【0206】
典型的には、比は、各クロマチン修飾サブプールの固有の配列の総カウントを測定することによって計算される。次いで、所与のクロマチン修飾サブプール内の第1のバーコード配列の各々を含有する固有の配列の頻度(しばしば、パーセンテージとして提供される)が決定される。前記頻度(パーセンテージ)は、次いで、各クロマチン修飾サブプール内で比較されて、倍率差が決定され得る。これは、特に、全てのバーコード配列が、インプットプールにおいて全く同じ頻度またはほぼ同じ頻度で含有される場合に行うことができる。例として、クロマチン修飾サブプール1で見出された固有の配列の総カウントのうち4%が、サンプル1の第1のバーコードを有し、クロマチン修飾サブプール1で見出された固有の配列の総カウントのうち2%が、サンプル2の第1のバーコードを有するならば、その場合、サンプル1は、サンプル2と比較して2倍のクロマチン修飾1のレベルを有する。
【0207】
往々にして、個々のバーコード配列は、インプットプールにおいて全く同じ頻度またはほぼ同じ頻度で含有されていない。したがって、該方法は、インプット正規化固有リードカウント(INRC)を計算するステップを含むことが、往々にして好ましい。INRCは、クロマチン修飾サブプール内の各第1のバーコード配列を含有する固有の配列の頻度を、インプットサブプールにおける同一の第1のバーコード配列を含有する固有の配列の頻度に対して正規化したものである。したがって、INRCは、クロマチン修飾サブプールにおける第1のバーコード配列の頻度を、インプットサブプールにおける同一の第1のバーコード配列の頻度で割ることにより決定することができる。例として、クロマチン修飾サブプール1で見出された固有の配列の総カウントのうち4%が、サンプル1の第1のバーコードを有し、インプットサブプールで見出された固有の配列の総カウントのうち2%が、サンプル1の第1バーコードを有するならば、その場合、クロマチン修飾1に関するサンプル1のINRCは、2である。
【0208】
次いで、あるサンプルの所与のクロマチン修飾に関するINRCを別のサンプルと比較することにより、サンプル間の倍率差が決定され得る。
【0209】
したがって、サンプルXで見出されたクロマチン修飾のサンプルYと比較した比は、以下の式を用いて計算され得る:
【数1】
ここで、サンプルXのgDNA断片は、第1のバーコードXを含むIDタグでタグ付けされ、サンプルYのgDNA断片は、第1のバーコードYを含むIDタグでタグ付けされる。
【0210】
INRC及びINRC比は、複数のサンプルにわたり、グローバルレベルを定量的に比較することを可能にする、単位がない値である。
【0211】
ランダムに選択した少数の配列のみを使用したことを除いて、Kumar and Elsasser,2019に記載された通りに生成した、極めて乏しい配列データを使用する標準曲線は、INRCが、一般的に、各サンプルにおけるエピトープの真の量に、直線的に相関するまたは比例することを実証している(実施例1、
図5を参照されたい)。したがって、2つのサンプル間の定量的な差は、2つのサンプルについて計算されたINRCの比として正確に導き出すことができる。かかる計算の例を、実施例2及び
図4に示している。さらに、
図4では、クロマチン修飾のレベルだけでなく、INRCを計算する例も記載している。当業者であれば、複数のサンプルが解析される状況に対しては、1つの処理のみが示されている
図4に示した例から推論することができるであろう。
【0212】
本明細書に記載の方法により、所与のクロマチン修飾の量全てが、所与のプール内の全てのサンプルについて互いに比較して得られる。所与のクロマチン修飾の絶対量を決定するために、前記クロマチン修飾の絶対量が既知である参照サンプルが、該方法に含まれ得る。参照サンプルにおいて所与のクロマチン修飾の絶対量が既知である場合、本明細書に開示される方法を用いて、同一プール内の他の全てのサンプルについて、所与のクロマチン修飾の絶対量を正確に計算することができる。しかし、複数のサンプルにおけるクロマチン修飾のレベルを互いに比較して正確に決定するためには、絶対量が既知の参照サンプルは必要とされない。クロマチン修飾の絶対量が既知の参照サンプルは、例えば、各gDNAが、クロマチン修飾の0または2つの実例ではなく、1つの実例と関連している、合成的に産生されたクロマチン断片で構成され得る。
【0213】
本発明は、上記の定量化手順が、100~100000の間のリード数等、非常に少量のシークエンスリードのみを使用して、クロマチン修飾のレベルを確信的かつ正確に定量化するために実施され得ることを主張するものである。実施例6は、各々が三重のサンプルに存在する、2つの条件間のクロマチン修飾の差が、サンプルあたり200~1000の範囲のわずかな固有のリードを使用して、確信的(すなわち、統計的に有意)かつ正確に決定できることを実証している。
【0214】
該方法は、特に、ゲノム全体にわたるクロマチン修飾(複数可)のグローバルレベルを決定するのに有用である。該方法が、ゲノム全体にわたるクロマチン修飾(複数可)のグローバルレベルを決定するためのものである場合、シークエンシングのためのgDNA断片は、原則として、サンプルの全てのgDNA断片から完全にランダムに選択される。クロマチン修飾のグローバルレベルを計算する方法の一例を
図4に示す。クロマチン修飾のグローバルレベルを決定するための方法に有用なタグ付け、増幅及びシークエンシングステップの例を、
図7及び9に提供する。
【0215】
しかし、いくつかの実施形態では、該方法は、クロマチン修飾の局所レベルを決定するために使用される。かかる実施形態では、目的の1つ以上の遺伝子座のgDNA断片のみが、シークエンシングのために選択される。
【0216】
一実施形態では、シークエンシングのためのgDNA断片の選択は、全てのgDNA断片からのランダムな選択を通じては実行されず、選択に使用されるプライマー配列に相補的なDNA配列の存在に基づくクロマチン断片の選択を介して実行される。1つのゲノム遺伝子座または多数の遺伝子座を選択するために、1つ以上のプライマー配列が使用され得る。次いで、該方法により、クロマチン修飾の量全てが、所与のプール内の全てのサンプルについて、全ての選択されたゲノム遺伝子座において互いに比較して得られる。特に、クロマチン修飾(複数可)の局所レベルの決定には、目的の遺伝子座のgDNA断片のみが増幅される、gDNA断片の増幅ステップが必要とされ得る。クロマチン修飾のグローバルレベルを決定するための方法に有用なタグ付け、増幅及びシークエンシングステップの例を、
図2、8及び10に提供する。
【0217】
条項
本発明は、以下の条項のいずれかによってさらに定義され得る。
1. 複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
a. クロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を任意選択で増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 前記クロマチン修飾サブプールから、ステップa.において提供されたサンプルあたり100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップ、
k. 各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【0218】
2. 複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
a. 複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の固有の分子識別子(UMI)配列を含むオリゴヌクレオチドであり、各IDタグは、異なるUMI配列及び任意選択の追加の配列を含み、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を任意選択で増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 各クロマチン修飾サブプールから、n掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きgDNA断片を集約プールにプールし、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数であり、mはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップであって、
i. 少なくとも前記第1のバーコード配列ならびに
ii. 前記UMI配列及び/または前記gDNA配列の一部
をシークエンシングし、ここで、固有のタグ付きgDNA断片は、固有のUMI及び/または固有のgDNA配列のいずれかを含む、前記測定するステップ、
k. 各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【0219】
3. 複数のサンプルにおいて、1つ以上の目的の遺伝子座における複数のクロマチン修飾の局所レベルを並行して評価する方法であって、以下のステップを含む前記方法。
a. 複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
b. 各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムDNA(gDNA)断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
c. 各サンプル内の前記gDNA断片の少なくともある画分を、IDタグでタグ付けするステップであって、前記IDタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、1サンプル内のgDNA断片は、同一のバーコード配列を含むIDタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
d. 前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
e. 各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
f. 各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
g. 各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きgDNA断片を含むサブプール(「クロマチン修飾サブプール」と呼ぶ)を得るステップ、
h. 増幅のために目的の各遺伝子座に特異的な少なくとも1つのプライマーを使用する、前記クロマチン修飾サブプール中の前記タグ付きgDNA断片の少なくともある画分を増幅するステップであって、それによりgDNA断片のコピーを得る(前記gDNA断片及びその前記コピーをまとめて「gDNA断片」と呼ぶ)、前記増幅するステップ、
i. 前記クロマチン修飾サブプールから、100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きgDNA断片を集約プールにプールし、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片をランダムに選択するステップであって、ここで、nはステップa.において提供されたサンプルの数であり、mはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
j. 前記選択されたタグ付きgDNA断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きgDNA断片の数を測定するステップ、
k. 目的の各遺伝子座について、各クロマチン修飾サブプール内の各バーコード配列を含むgDNA断片の頻度を計算するステップであって、
バーコード配列を含むgDNA断片の頻度が高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける、前記目的の遺伝子座での前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。
【0220】
4. ステップi)は、n掛けるp掛ける10~100,000のタグ付きgDNA断片、n掛けるp掛ける100~100,000等、例えば多くともn掛けるp掛ける50,000、多くともn掛けるp掛ける20,000等、例えばn掛けるp掛ける10~50,000の範囲、n掛けるp掛ける100~20,000の範囲等のタグ付きgDNA断片を選択することを含み、ここで、pは目的の遺伝子座の数である、条項3に記載の方法。
【0221】
5. ステップi)は、n掛けるm p掛ける10~100,000のタグ付きgDNA断片、n掛けるm掛けるp掛ける100~100,000等、例えば多くともn掛けるm掛けるp掛ける50,000、多くともn掛けるm掛けるp掛ける20,000等、例えばn掛けるm掛けるp掛ける10~50,000の範囲、n掛けるm掛けるp掛ける100~20,000の範囲等のタグ付きgDNA断片を選択することを含み、ここで、pは目的の遺伝子座の数である、条項3に記載の方法。
【0222】
6. ステップd.は、前記プールをランダムなサブプールに分けることをさらに含み、ここで、少なくとも1つのサブプールはインプットサブプールであり、他のサブプールは試験サブプールであり、また、ステップf.は、各抗体をランダムな試験サブプールと共にインキュベートすることを含む、先行条項のいずれか1項に記載の方法。
【0223】
7. 前記ステップi.は、n掛ける100~100,000の範囲のタグ付きgDNA断片(ここで、nは、ステップa.において提供されたサンプルの数である)を前記インプットサブプールからランダムに選択することをさらに含み、また、ステップj.は、前記インプットサブプールから選択された前記gDNA断片をシークエンシングし、前記インプットサブプールの各バーコード配列を有する固有のgDNA断片の数を測定することをさらに含み、また、ステップk.は、各クロマチン修飾サブプールにおける各バーコード配列を含むgDNA断片の頻度を、前記インプットサブプールにおける同一のバーコードを含むgDNA断片の頻度で割ることにより、インプット正規化リードカウント(INRC)を決定することをさらに含み、ここで、バーコード配列のINRCが高いほど、前記バーコード配列を含むIDタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、条項2に記載の方法。
【0224】
8. サンプルYにおけるクロマチン修飾のレベルと比較した、サンプルXにおけるクロマチン修飾のレベルが、以下の式:
【数2】
によって決定され、ここで、サンプルXの前記gDNA断片は、バーコードXを含むIDタグでタグ付けされ、サンプルYの前記gDNA断片は、バーコードYを含むIDタグでタグ付けされる、先行条項のいずれか1項に記載の方法。
【0225】
9. 前記バーコード配列は、4~20ヌクレオチドの範囲、例えば、6~16ヌクレオチドの範囲のランダムな配列を含む、先行条項のいずれか1項に記載の方法。
【0226】
10. ステップj.は、前記選択された断片の少なくとも前記バーコード配列及び少なくとも前記gDNA配列の一部をシークエンシングすることを含む、先行条項のいずれか1項に記載の方法。
【0227】
11. 前記IDタグは、前記バーコード配列及び固有の分子識別子(UMI)配列を含み、各IDタグは、異なるUMI配列を含む、先行条項のいずれか1項に記載の方法。
【0228】
12. 前記UMIは、4~20ヌクレオチドの範囲、例えば、6~16ヌクレオチドの範囲のランダムな配列を含む、条項11に記載の方法。
【0229】
13. 固有のDNA断片の数を測定することは、固有のUMIの数を測定することによって行われる、条項11~12のいずれか1項に記載の方法。
【0230】
14. ステップj.の固有のタグ付きgDNA断片の数を測定することであって、前記測定することは、
i. 参照ゲノム配列を提供することであって、前記参照ゲノムは、前記サンプルが採取される種と同一の種に由来する、前記提供することと、
ii. 各シークエンシングされたgDNA断片の配列を前記参照ゲノムにマッピングすることと、
iii. 各クロマチン修飾プールの各バーコード配列を含む固有のgDNA断片の数をカウントすることであって、固有のタグ付きgDNA分子は、前記ゲノムにおける固有のマッピング位置によって識別される、前記カウントすることと、を含む、先行条項のいずれか1項に記載の方法。
【0231】
15. 固有のタグ付きgDNA分子は、固有のUMI及び前記ゲノムにおける固有のマッピング位置の組み合わせによって識別される、条項11~14のいずれか1項に記載の方法。
【0232】
16. 前記IDタグは、前記バーコード配列、UMI配列及び追加の配列を含み、前記追加の配列は、前記IDタグのライゲーションを可能にする、1つまたは2つのライゲーション配列を含む、先行条項のいずれか1項に記載の方法。
【0233】
17. 前記IDタグは、前記バーコード配列、UMI配列及び追加の配列を含み、前記追加の配列は、前記IDタグ及び/または前記gDNA断片の増幅を可能にする、1つ以上の増幅配列を含む、先行条項のいずれか1項に記載の方法。
【0234】
18. ステップj.は、各選択されたgDNA断片の少なくとも前記バーコード配列及び前記UMI配列をシークエンシングすることを含む、条項11~17のいずれか1項に記載の方法。
【0235】
19. ステップj.は、各選択されたgDNA断片の少なくとも前記バーコード配列、前記UMI配列及び前記gDNA配列をシークエンシングすることを含む、条項11~18のいずれか1項に記載の方法。
【0236】
20. 全ての第1のIDタグは、1つ以上の共通の増幅配列を含む、先行条項のいずれか1項に記載の方法。
【0237】
21. 先行条項のいずれか1項に記載の方法であって、前記gDNA断片の少なくともある画分を第2のタグでタグ付けすることをさらに含む、前記方法。
【0238】
22. 前記第2のタグは、前記IDタグと対照して前記gDNA断片の反対側の末端に付加される、条項21に記載の方法。
【0239】
23. 先行条項のいずれか1項に記載の方法であって、各クロマチン修飾サブプール内の前記gDNA断片の少なくともある画分を第2のタグでタグ付けすることをさらに含み、前記第2のタグは、第2のバーコード配列を含むオリゴヌクレオチドであり、1つのクロマチン修飾サブプール内のgDNA断片は、同一の第2のバーコード配列を含む第2のタグでタグ付けされ、異なる第2のバーコード配列が、各クロマチン修飾サブプールに対して使用される、前記方法。
【0240】
24. 前記インプットサブプール内のgDNA断片が、前記クロマチン修飾サブプールに対して使用される前記第2のバーコード配列とは異なる、同一の第2のバーコード配列でタグ付けされる、条項21~23のいずれか1項に記載の方法。
【0241】
25. 条項21~24のいずれか1項に記載の方法であって、1つ以上のクロマチン修飾サブプール及び前記インプットサブプールの前記gDNA断片を集約プールにプールするステップをさらに含み、ステップi)は、前記集約プールからn掛けるm掛ける100~100,000の範囲のタグ付きgDNA断片を選択することを含む、前記方法。
【0242】
26. 条項21~25のいずれか1項に記載の方法であって、全てのクロマチン修飾サブプール及び前記インプットサブプールの前記gDNA断片をプールすることによってgDNA断片のプールを生成するステップをさらに含む、前記方法。
【0243】
27. ステップi.は、前記集約プールから、ステップa.において提供されたサンプルあたり100~100,000の範囲のgDNA断片をランダムに選択することを含む、条項25~26のいずれか1項に記載の方法。
【0244】
28. ステップi.は、前記集約プールから、ステップa.において提供されたサンプルあたり200~100,000の範囲のgDNA断片をランダムに選択することを含む、条項25~26のいずれか1項に記載の方法。
【0245】
29. ステップi.は、前記集約プールから、n掛けるm掛ける200~100,000の範囲のgDNA断片をランダムに選択することを含む、先行条項のいずれか1項に記載の方法。
【0246】
30. ステップi.は、ステップa.において提供された試験サンプルあたり、多くとも50,000(多くとも20,000等)、例えば1000~50,000の範囲(5000~20,000の範囲等)のgDNA断片をランダムに選択することを含む、先行条項のいずれか1項に記載の方法。
【0247】
31. ステップi.は、多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)のgDNA断片をランダムに選択することを含む、先行条項のいずれか1項に記載の方法。
【0248】
32. ステップj.は、少なくとも前記IDタグの前記バーコード配列及び前記第2のバーコード配列及び前記UMI配列及び/または前記gDNA配列をシークエンシングすることを含み、ここで、ステップj.は、特異的な第2のバーコード配列を含む固有のgDNA断片の総数に対する、前記IDタグの前記バーコード配列及び各前記特異的な第2のバーコード配列を含む固有のgDNA断片の頻度を計算することを含む、条項21~31のいずれか1項に記載の方法。
【0249】
33. 先行条項のいずれか1項に記載の方法であって、ステップh.を含む、前記方法。
【0250】
34. 前記増幅は、前記IDタグの増幅配列にアニールすることができる少なくとも1つのプライマーを用いた、ポリメラーゼ連鎖反応法(PCR)、リニア増幅法及び/または逆転写法を含む方法によって実施される、先行条項のいずれか1項に記載の方法。
【0251】
35. 前記第2のタグは、前記ステップh.の増幅の間に付加される、条項21~34のいずれか1項に記載の方法。
【0252】
36. 前記第2のタグは、プライマーがアニール可能な1つ以上の共通の増幅配列を含む、先行条項のいずれか1項に記載の方法。
【0253】
37. 増幅のための少なくとも1つの前記プライマーは、アダプタータグを含む、先行条項のいずれか1項に記載の方法。
【0254】
38. 前記増幅は、前記第2のタグの前記増幅配列にアニールすることができる1つのプライマーを用いる方法によって実施される、先行条項のいずれか1項に記載の方法。
【0255】
39. 前記ランダムに選択されたgDNA断片は、1つ以上の固体支持体に固定化され得る、先行条項のいずれか1項に記載の方法。
【0256】
40. 前記IDタグは、多くとも100ヌクレオチド(多くとも75ヌクレオチド等)、例えば多くとも50ヌクレオチドを含有する、先行条項のいずれか1項に記載の方法。
【0257】
41. 前記IDタグは、6~100ヌクレオチドの範囲(6~75ヌクレオチドの範囲等)、例えば6~50ヌクレオチドの範囲からなるオリゴヌクレオチドからなる、先行条項のいずれか1項に記載の方法。
【0258】
42. 前記クロマチンは、クロマチンの断片化を触媒する1つ以上の酵素とインキュベートすることによって断片化される、先行条項のいずれか1項に記載の方法。
【0259】
43. 前記1つ以上の酵素は、以下からなる群から選択される、条項42に記載の方法。
a. 小球菌ヌクレアーゼ(MNase)等のヌクレアーゼ
b. 配列特異的制限酵素
【0260】
44. 前記クロマチンは、超音波処理による等の機械的な剪断によって断片化される、先行条項のいずれか1項に記載の方法。
【0261】
45. 前記IDタグ及び/または前記第2のタグによる前記gDNA断片のタグ付けは、ライゲーションによって行われる、先行条項のいずれか1項に記載の方法。
【0262】
46. タグ付けは、T4 DNAリガーゼを用いる等、DNAリガーゼを用いるアダプターライゲーションを使用する、前記IDタグ及び/または第2のタグのライゲーションを含む、先行条項のいずれか1項に記載の方法。
【0263】
47. タグ付けは、Tn5を用いる等、トランスポゾン酵素を用いるアダプターライゲーションを使用する、前記IDタグ及び/または第2のタグのライゲーションを含む、先行条項のいずれか1項に記載の方法。
【0264】
48. ステップa.は、少なくとも15等(少なくとも25等)、例えば少なくとも50(少なくとも75等)、例えば15~1000の範囲(15~500の範囲等)、例えば25~1000の範囲(25~500の範囲等)のクロマチンを含む種々の試験サンプルを提供することを含む、先行条項のいずれか1項に記載の方法。
【0265】
49. ステップa.は、少なくとも75、好ましくは少なくとも85、例えば75~1000の範囲(75~500の範囲等)、例えば85~1000の範囲(85~500の範囲等)のクロマチンを含む種々の試験サンプルを提供することを含む、先行条項のいずれか1項に記載の方法。
【0266】
50. 前記試験サンプルは、細胞、例えば、以下からなる群から選択される細胞を含む、先行条項のいずれか1項に記載の方法。
a. 形質転換細胞株、
b. 患者由来細胞株等の初代細胞株、
c. がん細胞株、
d. iPS細胞、
e. 接着細胞、
f. 懸濁細胞、
g. 3D細胞培養物、
h. 人工組織細胞及び
i. オルガノイド細胞
【0267】
51. 前記細胞集団は、少なくとも100の細胞、好ましくは少なくとも500の細胞、さらにより好ましくは少なくとも1000の細胞、例えば10~100,000の範囲の細胞(100~100,000の範囲の細胞等)、例えば1000~100,000の範囲の細胞を含む、先行条項のいずれか1項に記載の方法。
【0268】
52. 各サンプルは、100~100000の範囲の細胞(1000~10000の範囲の細胞等)を含む、先行条項のいずれか1項に記載の方法。
【0269】
53. 各サンプルは、異なる処理に供された細胞を含む、先行条項のいずれか1項に記載の方法。
【0270】
54. 1つ以上のクロマチン修飾は、以下からなる群から選択される、先行条項のいずれか1項に記載の方法。
i. クロマチン断片内に存在するタンパク質
ii. 翻訳後修飾
iii. ヌクレオチド修飾
iv. 前記gDNA断片中の非天然核酸塩基の存在
v. 翻訳後プロセシングを通じて産生されたタンパク質断片の存在
vi. 非正規DNA構造
【0271】
55. 1つ以上のクロマチン修飾は、ヌクレオチドのメチル化である、先行条項のいずれか1項に記載の方法。
【0272】
56. 前記ヌクレオチドの1つ以上の修飾は、以下からなる群から選択される1つ以上の修飾ヌクレオチドの存在に通じる、先行条項のいずれか1項に記載の方法。
a. 5-メチル-シトシン
b. 5-ヒドロキシ-メチル-シトシン
c. 5-ホルミル-シトシン
d. 5-カルボキシシトシン、及び
e. 6-メチル-アデニン
【0273】
57. 1つ以上の非天然核酸塩基は、5-ブロモ-2’-デオキシウリジン及び5-エチニル-2’-デオキシウリジン塩基からなる群から選択される、条項46~48のいずれか1項に記載の方法。
【0274】
58. 1つ以上の非正規DNA構造は、G4構造、一本鎖DNA、及びRNA:DNAハイブリッドからなる群から選択される、条項46~48のいずれか1項に記載の方法。
【0275】
59. ステップe.は、それぞれが異なるクロマチン修飾に特異的に結合する、少なくとも5種の種々の抗体、少なくとも10種の種々の抗体等(例えば、少なくとも15種の種々の抗体)、5~100種の範囲の種々の抗体等(例えば、5~50種の範囲の種々の抗体)、10~100種の範囲の種々の抗体等(例えば、10~50種の範囲の種々の抗体)を提供することを含む、先行条項のいずれか1項に記載の方法。
【0276】
60. 1つ以上の抗体は、アミノ酸のカルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、及びグリコシル化からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか1項に記載の方法。
【0277】
61. 1つ以上の抗体は、異性化、例えば、プロリン異性化、または非定型イソアスパルチルの形成を含む翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか1項に記載の方法。
【0278】
62. 異なるヒストンPTMに結合する少なくとも5種の種々の抗体、異なるヒストンPTMに結合する少なくとも10種の種々の抗体等(例えば、異なるヒストンPTMに結合する少なくとも15種の種々の抗体)、異なるヒストンPTMに結合する5~100種の範囲の種々の抗体等(例えば、異なるヒストンPTMに結合する5~50種の範囲の種々の抗体)、異なるヒストンPTMに結合する10~100種の範囲の種々の抗体等(例えば、異なるヒストンPTMに結合する10~50種の範囲の種々の抗体)が提供される、先行条項のいずれか1項に記載の方法。
【0279】
63. 1つ以上の抗体は、以下からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか1項に記載の方法。
a. メチル化(モノ、ジ、トリメチル化)リジン、
b. アシル化(アセチル化、プロピオニル化、ブチリル化、イソブチル化、スクシニル化、クロトニル化、ヒドロキシイソブチリル化)リジン、
c. ユビキチン化リジン、
d. スモイル化リジン、
e. ネディル化リジン、
f. リン酸化セリン、
g. リン酸化スレオニン、
h. リン酸化ヒスチジン、
i. シトルリン、
j. メチル化アルギニン(モノ、対称性ジ、非対称性ジメチル化)
k. グルタリル化リジン、
【0280】
64. 1つ以上の抗体は、以下からなる群から選択される翻訳後のタンパク質上に、特異的かつ選択的に結合する、先行条項のいずれか1項に記載の方法。
a. ヒストンH3
b. ヒストンH3.1、H3.2、H3.3
c. ヒストンH3.X、H3.Y
d. ヒストンH4
e. ヒストンH2A
f. ヒストンH2A.X
g. ヒストンH2A.Z
h. ヒストンH2A.Z.1
i. ヒストンH2A.Z.2
j. ヒストンマクロH2A
k. ヒストンH2A.Bbd、及び
l. ヒストンH2B。
【0281】
65. 1つ以上の抗体は、以下からなる群から選択されるエピジェネティック修飾に、特異的かつ選択的に結合する、先行条項のいずれか1項に記載の方法。
a. H3K4me1、
b. H3K4me2、
c. H3K4me3、
d. H3K79me3、
e. H3K9me1、
f. H3K9me2、
g. H3K9me3、
h. H3K27me1、
i. H3K27me2、
j. H3K27me3、
k. H4K20me1、
l. H4K20me2及び
m. H4K20me3。
【0282】
66. シークエンシングは、大量並行シークエンシングによって実施される、先行条項のいずれか1項に記載の方法。
【0283】
67. シークエンシングは、Illuminaシークエンシングによって実施される、先行条項のいずれか1項に記載の方法。
【0284】
68. 先行条項のいずれか1項に記載の方法であって、試験サンプルあたり、100~100,000の範囲、例えば多くとも50,000(多くとも20,000等)、例えば1000~50,000の範囲(5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【0285】
69. 先行条項のいずれか1項に記載の方法であって、試験サンプルあたり、200~100,000の範囲、例えば多くとも50,000(多くとも20,000等)、例えば200~50,000の範囲、例えば1000~50,000の範囲(5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【0286】
70. 先行条項のいずれか1項に記載の方法であって、n掛ける100~100,000の範囲、例えば多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【0287】
71. 先行条項のいずれか1項に記載の方法であって、試験サンプルあたり、n掛ける200~100,000の範囲、例えば多くともn掛ける50,000(多くともn掛ける20,000等)、例えばn掛ける200~50,000の範囲、例えばn掛ける1000~50,000の範囲(n掛ける5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含む、前記方法。
【0288】
72. 先行条項のいずれか1項に記載の方法であって、n掛けるm掛ける100~100,000の範囲、例えば多くともn掛けるm掛ける50,000(多くともn掛けるm掛ける20,000等)、例えばn掛けるm掛ける1000~50,000の範囲(n掛けるm掛ける5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含み、ここで、nは、ステップa.において提供された試験サンプルの数であり、mは、クロマチン修飾サブプールの数である、前記方法。
【0289】
73. 先行条項のいずれか1項に記載の方法であって、n掛けるm掛ける200~100,000の範囲、例えばn掛けるm掛ける200~50,000の範囲、例えばn掛けるm掛ける1000~50,000の範囲(n掛けるm掛ける5000~20,000の範囲等)のタグ付きgDNA断片をランダムに選択し、シークエンシングすることを含み、ここで、nは、ステップa.において提供された試験サンプルの数であり、mは、クロマチン修飾サブプールの数である、前記方法。
【0290】
74. 前記INRCは、各サンプルにおけるエピトープの真の量に直線的に相関し、2つのサンプル間の定量的な差は、前記2つのサンプルについて計算された前記INRCの比に対応する、条項3~61のいずれか1項に記載の方法。
【0291】
75. 先行条項のいずれか1項に記載の方法であって、複数のクロマチン修飾のグローバルレベルを決定するためのものであり、gDNA断片は、各サンプルの全てのgDNA断片からランダムに選択される、前記方法。
【0292】
76. 先行条項のいずれか1項に記載の方法であって、複数のクロマチン修飾の局所レベルを決定するためのものであり、gDNA断片は、1つ以上の目的のゲノム遺伝子座のgDNA断片からランダムに選択される、前記方法。
【0293】
77. 先行条項のいずれか1項に記載の方法であって、複数のクロマチン修飾のレベルを定量的に評価するための方法である、前記方法。
【0294】
78. 前記定量的評価は、参照と比較した各クロマチン修飾の倍率差を提供するものである、先行条項のいずれか1項に記載の方法。
【0295】
79. 複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
a. 1つ以上の試験化合物を提供するステップ、
b. 前記試験化合物の存在下で細胞を培養するステップであって、種々の試験化合物の存在下で培養される細胞は、互いに物理的に分離されている前記培養するステップ、
c. 条項1~78のいずれか1項に記載の方法を実施するステップであって、各試験サンプルは、異なる試験化合物と共にインキュベートされる細胞を含む、前記実施するステップ。
【0296】
80. 複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
a. 1つ以上の試験化合物を提供するステップ、
b. 前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはそれらの組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
c. 条項1~78のいずれか1項に記載の方法を実施するステップであって、各試験サンプルは、異なる細胞集団のクロマチンを含む、前記実施するステップ。
【0297】
81. 条項79~80のいずれか1項に記載の方法であって、試験化合物と共にインキュベートされていない細胞を含む参照サンプルを用いて、条項1~78のいずれか1項に記載の方法を実施することをさらに含む、前記方法。
【0298】
82. 複数のクロマチン修飾のレベルに対する試験化合物(複数可)の影響は、前記参照サンプルにおける頻度と比較した、前記試験化合物(複数可)の存在下で培養された細胞集団における前記クロマチン修飾の頻度を比較することにより決定される、条項81に記載の方法。
【実施例】
【0299】
本発明は、以下の実施例によってさらに説明され得るが、しかしながら、これらは、本発明を限定するものとして解釈されるべきではない。
【0300】
実施例1:
以下に提示する実施例は、ランダムに選択した少数(N)の配列のみを使用したことを除き、Kumar and Elsasser,Cell Reports,2019に従って調製したデータセットに基づくものである。
【0301】
まず、H3K27me3が最大レベルの細胞源とH3K27me3が枯渇した細胞源とを既知の比率で混合し、較正曲線を作成した。それぞれの供給源は、マウス胚性幹細胞(mESC)を、EZH2阻害剤のEPZ-6438で処理してH3K27me3を検出可能レベル以下にするか、または脱メチル化酵素JMJD3/UTX阻害剤のGSK-J4で処理してH3K27me3を生理的レベルより多く増やして生成した。ヒストンH3K27me3の量をあらかじめ非常に多くまたは非常に少なく設定したサンプルは、これらの細胞源を7つの既知の比率(100%低、5%高/95%低、25%高/75%低、50%高/50%低、75%高、25%低、95%高、5%低、100%高)で混合することにより調製した。各比率について2つの複製を用意し、14種の異なる第1のバーコードを用いて個別にバーコード化した。溶解、クロマチン断片化及びバーコード化、クロマチン免疫沈降ならびにライブラリー調製を、Kumar and Elsasser 2019に記載のMINUTE-ChIP法に従って実施した。Kumar et.al.,では、データポイントあたり(すなわち、サンプル及びプールあたり)平均約10百万の配列に相当する、約600百万の固有配列(リードペア)が、Illuminaプラットフォームで取得された。上記の理論によれば、各H3K27me3 ChIPサンプルの配列数は、あらかじめ設定したサンプル中のH3K27me3の量に比例すべきである。H3K27me3が最も少ないサンプルでは251,861の配列が取得され、H3K27me3が最も多いサンプルでは48,715,703の配列が取得された。したがって、Kumar et.al.,では、各サンプルにおけるH3K27me3のレベルは、データポイントあたり平均約10百万の配列で正確に決定された。ランダムに選択された少数のリードで同一の定量化が達成できることを実証するために、非常に少数の配列を使用する効果を試験した。つまり、第1の解析では、250,000の配列を各ライブラリー(インプット、H3K27me3 ChIP)からランダムに選択し、これは平均17857の生の配列に相当した。これにより、データポイントあたり(すなわち、ライブラリーごとのサンプルあたり)、平均15,909(270~68,737の範囲)の固有のマッピングされた配列が得られた。別の解析では、25,000の配列をランダムに選択し、これは平均1786の生の配列に相当した。これにより、データポイントあたり(すなわち、ライブラリーごとのサンプルあたり)、平均1,633(26~6,938の範囲)の固有のマッピングされた配列が得られた。第3の解析では、2,500の配列をランダムに選択し、これは平均179の生の配列に相当した。これにより、データポイントあたり(すなわち、ライブラリーごとのサンプルあたり)、166(2~716の範囲)の固有のマッピングされた配列が得られた。INRCに基づくグローバル定量化の結果を
図5に示す。図に示したように、測定値は、あらかじめ設定した量に、直線的に相関し、比例している。量のデータがどのくらい厳密に真の量を予測しているかを指し示すR
2値は、標準曲線を作成するために、サンプルあたり平均357の配列に相当する、合計5,000リード(H3K27me3 ChIPサブプールから2,500、インプットサブプールから2,500)しか使用しなかった場合でさえ、極めて良好(>0.98)のままである。較正曲線定量化により、INRCが、広いダイナミックレンジにわたり、全体存在量に比例することが実証される。
【0302】
次の実験では、2つの条件下で増殖させた細胞を、それぞれ三重のサンプルで互いに比較し、ヒストンエピトープであるH3K27me3の相対レベルを決定した。したがって、それぞれが異なる第1のバーコード(合計6種のバーコード)でバーコード化されている、合計6つのサンプルを調査した。
【0303】
ここで調査した比較対象は、標準培地で増殖させたマウス胚性幹細胞を表す1つの「未処理」条件、標準培地で2種の特異的阻害剤、すなわちMEK阻害剤PD0325901及びGSK3阻害剤CHIR99021(「2i」)と共に増殖させたマウス胚性幹細胞を表す「2i」阻害剤処理、という2つの条件を指す。合計約1000百万の配列を用いた定量化により、「2i」処理での細胞では、H3K27me3が、統計的に有意に(t検定、p=0.0017)2.3倍増加することが実証された(Kumar and Elsasser,Cell Reports,2019)。
【0304】
H3K27me3サブプールライブラリー及びインプットサブプールライブラリーから、種々の数の配列をランダムに選択した。H3K27me3サブプールからは、インプットサブプールと比較しておよそ2倍多い配列を選択し、200~10,000,000の範囲にわたってランダムに選択した配列の総数を解析した。その結果を
図6に示す。
【0305】
ランダムに選択した合計わずか3043の配列(H3K27me3サブプールから2017、インプットサブプールから1026)の解析により、計算された倍率変化と測定値の標準偏差及び対比較の有意差との両方が、基礎となるリード情報の劇的な減少に対して堅固であることが実証された。選択した3043の配列中、個々のサンプルは、プールあたり最小で101及び最大で606の固有の配列で見受けられた。したがって、免疫沈降(ヒストン修飾サブプール)及びインプットサブプール全体にわたり合計1000~10000リードの間(サブプールごとのサンプルあたり100~1500リードに相当)という低い深度でサンプリングしても、なお、2.3倍の変化を統計的に有意に決定することが可能となった(
図6を参照されたい)。
【0306】
さらに、マッピングされた固有のリードカウントに基づく定量とUMI情報のみに基づく定量とを比較したところ、UMIカウントでは、利用可能なシークエンシング情報をより多く使用しながらも(全てのリードがUMI情報を含有するが、全てが参照ゲノムにマッピングされ得ることはないため)、同一の統計的有意差で同一の結果がもたらされたことが実証された。ランダムに選択した1484の配列(H3K27me3サブプールでは754、インプットサブプールでは730)をサンプリングしても、なお、2.3倍の変化を統計的に有意に決定することが可能となった(
図6を参照されたい)。選択した1484の配列中、個々のサンプルは、プールあたり最小で30及び最大で246の固有の配列で見受けられた。
【0307】
実施例2
グローバルレベルの定量化
本実施例は、グローバルレベルを定量化するステップに対する洞察を提供することを意図するものである。マルチプレックス化し、プール化したChIPは、本質的に競合的結合実験を意味する。本実施例では、2つの条件を与えている。条件Aでは、修飾H3K27me3が、条件Bに比べて2倍の量である。クロマチンを断片化した後、2倍多いヌクレオソーム分子がH3K27me3を有している。プールする前に、ヌクレオソームDNAを供給源(「A」または「B」)に応じてバーコード化する。インプットプールをシークエンシングする場合、バーコード「A」及び「B」が同じ頻度で認められる。ChIP反応では、ビーズに固定化された特異的抗体にプールを添加することにより、H3K27me3の結合部位が限られた数で提供される。H3K27me3は、条件Aでより豊富であるため、「A」バーコードを有するヌクレオソームは、抗体によって、より捕捉されやすい。結合したヌクレオソームをシークエンシングする。バーコード「A」は、バーコード「B」より2倍頻繁に認められることになる。バーコード分布は、結合部位に対する競争のため、インプットサンプル中のエピトープの相対的存在量に常に比例する(
図3)。
【0308】
所与のIP反応における、アッセイしたエピトープの各サンプルに存在するレベルを定量化するために、サンプルに特異的なタグ及びUMIの固有の組み合わせをカウントし、各サンプルについて合計した。サンプル特異的タグのそれぞれについて測定した、これらの合計固有リードカウントを、次いで、インプット中の同一のサンプル特異的タグの合計固有リードカウントと関連付けて、インプット正規化リードカウント(INRC)を形成した。上記の計算例によれば、INCRは、各サンプルにおけるエピトープの量に比例する。
【0309】
このバージョンの方法では、固有のバーコード分子を測定し、UMI情報のみを評価する。該方法の代替バージョンでは、リードのゲノム配列内容(特異的なアダプター分子にライゲーションしたクロマチン断片に対応する配列)をゲノムにマッピングし、固有のゲノム配列と固有のUMIとの組み合わせによって固有の分子を決定する。
【0310】
実施例3
3種のヒストン修飾に対する薬物の効果を定量化するためのhmqChIP実験
96サンプルにおける3種のヒストン修飾のグローバルレベルをプロファイリングする高度にマルチプレックス化した実験。2種の異なるがん細胞株(ヒト結腸癌HCT116、ヒト骨肉腫U2OS)を、それぞれ2種の濃度(低、高)における11種の異なる薬物、または対照としてのDMSOで処理した。合計96サンプルへの各処理は、それぞれ2回反復(rep1、rep2)して実施した。実験の概要を
図11Aに示す。U2OSについては、96ウェルあたり9000の細胞を播種した。HCT116については6000の細胞を播種した。24時間後、以下の表に明記した濃度を用いて、各ウェルに薬物を添加した。
【表1】
【0311】
さらに40時間増殖させた後、細胞数はウェルあたりおよそ50,000細胞となった。以下の通り、培養プレート内で細胞を直接溶解し、クロマチンを断片化し、同一の培養プレート内で96種の第1のバーコード(各サンプルに対して1つのバーコード)を含む96種のIDタグでバーコード化した。増殖培地を除去し、ウェルをPBSで1x洗浄した。ウェルあたり30uLの溶解バッファー(50mMトリス-HCl、pH 8.0、0.1% Triton X-100、0.05%デオキシコール酸ナトリウム(DOC)、5mM CaCl2)を添加した。プレートを氷上に15分間置いた。15U/uLのMNaseを有する20uLの溶解バッファーを添加した。プレートを37Cにて20分間インキュベートした。13uLのddH2O及び7uLの平滑末端化マスターミックス(10mM ATP、10mM dNTP、50mM DTT、15U T4 DNAポリメラーゼ、25U T4ポリヌクレオチドキナーゼ、300mM EGTA)を各ウェルに添加し、総量を70uLに増やした。プレートを室温にて1時間インキュベートした。2uLの1.25uM DNAアダプターを、各ウェルに添加した。アダプター配列(IDタグ)は、Kumar and Elsasser,2019に記載の通りのものであり、各サンプルに固有の8ntバーコード及び6ntランダムUMI配列を有する。
【0312】
18uLのライゲーション反応ミックス(5.4uL 50%w/v PEG 4000、0.45uL 100mM ATP、0.5uL T4 DNAリガーゼ(5U/uL)、11.65uL ddH2O)を、各ウェルに添加し、総量90uLにした。プレートを室温にて1時間インキュベートした。90uLのストップバッファー(100mMトリス-HCl pH 8.0、300mM NaCl、2% Triton X-100、100mM EGTA、100mM EDTA、0.2%デオキシコール酸ナトリウム)を添加することにより反応を停止させ、96ウェルプレートのウェルを単一のチューブ内にプールした。17,820uLのプールを1.5mLのアリコートに分取し、2000rpmで5分間遠心し、上清を回収した。1,5mLのサブプールを、50uLのProtein A/Gビーズに固定化した3uLの抗H3K27me3(Millipore 07-449)、抗H3K27ac(Abcam ab177178)、抗H3K9me3(Abcam ab8898)抗体と共にインキュベートした。ChIP及びインプットのDNAは、Kumar and Elsasser,2019に記載の通りに単離及び精製した。ライブラリーは、Kumar and Elsasser,2019に記載の通りに、精製したDNAの75%を用いて調製した。
【0313】
最終的なライブラリーを2回シークエンシングして、2つの異なるランダムな分子セットのシークエンシング(ゲノムをほんのわずかに被覆するのみ)がグローバルレベルの定量化に与える影響を検証した。1回目は、4つのサブプール(3つのChIP、1つのインプット)に対して、合計で約1百万リード(サブプールあたりおよそ250000リード)をシークエンシングした。これは、サンプルあたり約10,416の配列、またはデータポイントあたり(すなわち、ライブラリーごとのサンプルあたり)2604の配列のシークエンシングに相当する。2回目は、合計25百万のリードを収集し、全てのリードを解析するか、またはランダムに選択した1百万のリードサブセットのみを解析した。全てのリードを解析した場合、サンプルあたりおよそ260,416リードに相当する。参照としてDMSO対照を用いて、インプット正規化固有リードカウント(INRC)を実施例2に記載の通りに計算し、INRCを反映したグレースケール及び円サイズでヒートマップにプロットした。
【0314】
結果を
図11に示す。
図11Bは、約1百万のリードをシークエンシングした1回目のシークエンシングの結果を示し、一方、
図11Cは、25百万のランダムに選択したリードのうち1百万のみを使用して行った2回目のシークエンシングの結果を示している。これは、サンプルあたり約10,416リードを解析することに相当する。
図11Dは、25百万のリードを使用して行った2回目のシークエンシングの結果を示している。
【0315】
図11B)及びC)における、サンプルあたり10,000の配列、またはデータポイントあたり(すなわち、サブプールごとのサンプルあたり)2500の配列という、極めて低いシークエンシング深度では、
図11D)における、25倍深いシークエンシングと同一の結果がもたらされた。したがって、極めて低いシークエンシング深度でもなお、信頼性が高いグローバルな定量化が得られる。予想通り、HDAC阻害剤であるSAHA(ボリノスタット)及びサーチノールは、H3K27acのアセチル化を増加させる。SAHAは、HDAC1-HDAC10を阻害し、サーチノールはSIRT1及びSIRT2を阻害する。また、予想通り、EZH2阻害剤であるEPZ6438及びEPZ011989は、HCT116細胞においてH3K27me3を減少させる。しかし、U2OS細胞は、EZH2阻害剤の影響を受けなかった。おそらく、U2OS細胞の増殖が比較的遅いことに一致して、既存のH3K27me3がすぐに希釈または除去されないためと思われる。興味深いことに、両方のHDAC阻害剤がH3K27acを増加させているにもかかわらず、同時にサーチノールのみがU2OS細胞においてH3K27me3を減少させている。おそらく、刺激により脱メチル化が活性化したと思われる。全てのエピジェネティックマーカーに対して全ての条件を試験することにより、既知及び新規の関係が体系的に発見される。
【0316】
実施例4
クロマチン修飾の遺伝子座特異的定量化のためのhmqChIP実験
上述した実施例3の実験から、H3K9me3 ChIP、H327ac ChIP及びインプットの精製DNAの25%を、Kumar and Elsasser,2019に記載のユニバーサルフォワードプライマー及びCDKN1A(p21)プロモーター遺伝子座(+/-2.5kb)の配列に相補的にハイブリッドするリバースプライマーの混合物を使用するPCRを用いて増幅した。(agacgtgtgctcttccgatctCGGTGGGAAAGAGGTAGAG(配列番号1)、agacgtgtgctcttccgatctGTGTCCCGGACCTCCAGT(配列番号2)、agacgtgtgctcttccgatctCTCGCTAGTCCTTAGGGGA(配列番号3)、agacgtgtgctcttccgatctCAGGGACACGGACTTCAT(配列番号4)、agacgtgtgctcttccgatctCATCCCGACTCTCGTCAC(配列番号5))
続いて、Kumar and Elsasser,2019にある通りに、最終的なライブラリーPCRを実施した。
【0317】
各ライブラリーについて、Illuminaシークエンサーで約10000の配列を収集した。リードをヒトゲノムにアライメントし、CDKN1プロモーター(+/-2,5kb)にアライメントしている配列をカウントし、ChIPごとのサンプルあたり、2~500リードを得た。INRCは、実施例2に記載した通りに、CDKN1プロモーターにアライメントしている配列のみを用いて、選択した条件(DMSO、5アザ、SAHA、サーチノール)について計算し、DMSO対照を参照条件として用いて、
図12にプロットした。
【0318】
参考文献
Kumar and Elsasser,Cell Reports,2019,28(12):3274-3284.doi:10.1016/j.celrep.2019.08.046.
Mardis E.DNA sequencing technologies:2006-2016.Nat Protoc 12,213-218(2017).
https://doi.org/10.1038/nprot.2016.182
【手続補正書】
【提出日】2023-08-03
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
【国際調査報告】