特表2023-553407 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ エピゲニカエービーの特許一覧

特表2023-553407クロマチン修飾のグローバルレベルまたはゲノム遺伝子座特異的レベルを評価するためのマルチプレックス法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1-1
1-2
2
3-1
3-2
4
5
6
7-1
7-2
8-1
8-2
9-1
9-2
10-1
10-2
11A
11B
11C
11D
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-12-21

(54)【発明の名称】クロマチン修飾のグローバルレベルまたはゲノム遺伝子座特異的レベルを評価するためのマルチプレックス法

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20231214BHJP

【ＦＩ】

C12Q1/6869 Z ZNA

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023534041

(86)(22)【出願日】2021-12-02

(85)【翻訳文提出日】2023-06-22

(86)【国際出願番号】 EP2021084023

(87)【国際公開番号】W WO2022117749

(87)【国際公開日】2022-06-09

(31)【優先権主張番号】20211177.9

(32)【優先日】2020-12-02

(33)【優先権主張国・地域又は機関】EP

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＴＲＩＴＯＮ

(71)【出願人】

【識別番号】523205153

【氏名又は名称】エピゲニカエービー

(74)【代理人】

【識別番号】100114775

【弁理士】

【氏名又は名称】高岡亮一

(74)【代理人】

【識別番号】100121511

【弁理士】

【氏名又は名称】小田直

(74)【代理人】

【識別番号】100202751

【弁理士】

【氏名又は名称】岩堀明代

(74)【代理人】

【識別番号】100208580

【弁理士】

【氏名又は名称】三好玲奈

(74)【代理人】

【識別番号】100191086

【弁理士】

【氏名又は名称】高橋香元

(72)【発明者】

【氏名】エルザッサー，サイモン

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA01

4B063QA13

4B063QA18

4B063QQ03

4B063QQ08

4B063QQ42

4B063QR08

4B063QR48

4B063QR58

4B063QR62

4B063QS25

4B063QX02

(57)【要約】

本発明は、複数のサンプルにおける、複数の様々なクロマチン修飾のグローバルレベルを並行して評価するための方法を提供するものである。また、本明細書に開示される方法は、複数のサンプルにおいて、ゲノム内の複数の目的の位置における、複数の様々なクロマチン修飾のレベルを評価することに関する。該方法は、高度にマルチプレックス化され、定量的であり、かつ、クロマチン免疫沈降及びシークエンシング技法に関与するものである。
【選択図】図４

【特許請求の範囲】

【請求項1】

複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
ａ．複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の固有の分子識別子（ＵＭＩ）配列を含むオリゴヌクレオチドであり、各ＩＤタグは、異なるＵＭＩ配列及び任意選択の追加の配列を含み、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を任意選択で増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．各クロマチン修飾サブプールから、ｎ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きｇＤＮＡ断片を集約プールにプールし、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｍはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップであって、
ｉ．少なくとも前記第１のバーコード配列ならびに
ｉｉ．前記ＵＭＩ配列及び／または前記ｇＤＮＡ配列の一部
をシークエンシングし、ここで、固有のタグ付きｇＤＮＡ断片は、固有のＵＭＩ及び／または固有のｇＤＮＡ配列のいずれかを含む、前記測定するステップ、
ｋ．目的の各遺伝子座について、各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける、前記目的の遺伝子座での前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【請求項2】

複数のサンプルにおいて、１つ以上の目的の遺伝子座における複数のクロマチン修飾の局所レベルを並行して評価する方法であって、以下のステップを含む前記方法。
ａ．複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．増幅のために目的の各遺伝子座に特異的な少なくとも１つのプライマーを使用する、前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．各クロマチン修飾サブプールから、１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きｇＤＮＡ断片を集約プールにプールし、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｍはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップ、
ｋ．各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【請求項3】

ステップｄ．は、前記プールをランダムなサブプールに分けることをさらに含み、ここで、少なくとも１つのサブプールはインプットサブプールであり、他のサブプールは試験サブプールであり、また、ステップｆ．は、各抗体をランダムな試験サブプールと共にインキュベートすることを含む、先行請求項のいずれか１項に記載の方法。

【請求項4】

前記ステップｉ．は、ｎ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片を前記インプットサブプールからランダムに選択することをさらに含み、また、ステップｊ．は、前記インプットサブプールから選択された前記ｇＤＮＡ断片をシークエンシングし、前記インプットサブプールの各バーコード配列を有する固有のｇＤＮＡ断片の数を測定することをさらに含み、また、ステップｋ．は、各クロマチン修飾サブプールにおける各バーコード配列を含むｇＤＮＡ断片の頻度を、前記インプットサブプールにおける同一のバーコードを含むｇＤＮＡ断片の頻度で割ることにより、インプット正規化リードカウント（ＩＮＲＣ）を決定することをさらに含み、ここで、バーコード配列のＩＮＲＣが高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、請求項２に記載の方法。

【請求項5】

サンプルＹにおけるクロマチン修飾のレベルと比較した、サンプルＸにおけるクロマチン修飾のレベルが、以下の式：

【数1】

によって決定され、ここで、サンプルＸの前記ｇＤＮＡ断片は、バーコードＸを含むＩＤタグでタグ付けされ、サンプルＹの前記ｇＤＮＡ断片は、バーコードＹを含むＩＤタグでタグ付けされる、請求項２～４のいずれか１項に記載の方法。

【請求項6】

前記ＩＤタグは、前記バーコード配列及び固有の分子識別子（ＵＭＩ）配列を含み、各ＩＤタグは、異なるＵＭＩ配列を含む、先行請求項のいずれか１項に記載の方法。

【請求項7】

固有のＤＮＡ断片の数を測定することは、固有のＵＭＩの数を測定することによって行われる、請求項６に記載の方法。

【請求項8】

先行請求項のいずれか１項に記載の方法であって、前記ｇＤＮＡ断片の少なくともある画分を第２のタグでタグ付けすることをさらに含む、前記方法。

【請求項9】

先行請求項のいずれか１項に記載の方法であって、各クロマチン修飾サブプール内の前記ｇＤＮＡ断片の少なくともある画分を第２のタグでタグ付けすることをさらに含み、前記第２のタグは、第２のバーコード配列を含むオリゴヌクレオチドであり、１つのクロマチン修飾サブプール内のｇＤＮＡ断片は、同一の第２のバーコード配列を含む第２のタグでタグ付けされ、異なる第２のバーコード配列が、各クロマチン修飾サブプールに対して使用される、前記方法。

【請求項10】

ステップｊ．は、少なくとも前記ＩＤタグの前記バーコード配列及び前記第２のバーコード配列及び前記ＵＭＩ配列及び／または前記ｇＤＮＡ配列をシークエンシングすることを含み、ここで、ステップｊ．は、特異的な第２のバーコード配列を含む固有のｇＤＮＡ断片の総数に対する、前記ＩＤタグの前記バーコード配列及び各前記特異的な第２のバーコード配列を含む固有のｇＤＮＡ断片の頻度を計算することを含む、請求項９に記載の方法。

【請求項11】

ステップａ．は、少なくとも１５等（少なくとも２５等）、例えば少なくとも５０（少なくとも７５等）、例えば１５～１０００の範囲（１５～５００の範囲等）、例えば２５～１０００の範囲（２５～５００の範囲等）のクロマチンを含む種々の試験サンプルを提供することを含む、先行請求項のいずれか１項に記載の方法。

【請求項12】

ステップａ．は、少なくとも７５、好ましくは少なくとも８５、例えば７５～１０００の範囲（７５～５００の範囲等）、例えば８５～１０００の範囲（８５～５００の範囲等）のクロマチンを含む種々の試験サンプルを提供することを含む、先行請求項のいずれか１項に記載の方法。

【請求項13】

ステップｅ．は、それぞれが異なるクロマチン修飾に特異的に結合する、少なくとも５種の種々の抗体、少なくとも１０種の種々の抗体等（例えば、少なくとも１５種の種々の抗体）、５～１００種の範囲の種々の抗体等（例えば、５～５０種の範囲の種々の抗体）、１０～１００種の範囲の種々の抗体等（例えば、１０～５０種の範囲の種々の抗体）を提供することを含む、先行請求項のいずれか１項に記載の方法。

【請求項14】

１つ以上の抗体は、アミノ酸のカルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、及びグリコシル化からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行請求項のいずれか１項に記載の方法。

【請求項15】

先行請求項のいずれかに記載の方法であって、ｎ掛ける１００～１００，０００の範囲、例えば多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）の各クロマチン修飾サブプールのタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【請求項16】

先行請求項のいずれか１項に記載の方法であって、ｎ掛けるｍ掛ける１００～１００，０００の範囲、例えば多くともｎ掛けるｍ掛ける５０，０００（多くともｎ掛けるｍ掛ける２０，０００等）、例えばｎ掛けるｍ掛ける１０００～５０，０００の範囲（ｎ掛けるｍ掛ける５０００～２０，０００の範囲等）の前記集約プールのタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【請求項17】

前記細胞集団は、少なくとも１００の細胞、好ましくは少なくとも５００の細胞、さらにより好ましくは少なくとも１０００の細胞、例えば１０～１００，０００の範囲の細胞（１００～１００，０００の範囲の細胞等）、例えば１０００～１００，０００の範囲の細胞を含む、先行請求項のいずれか１項に記載の方法。

【請求項18】

複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
ａ．１つ以上の試験化合物を提供するステップ、
ｂ．前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはその組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
ｃ．請求項１～１７のいずれか１項に記載の方法を実施するステップであって、各試験サンプルは、異なる細胞集団のクロマチンを含む、前記実施するステップ。

【請求項19】

請求項１８に記載の方法であって、試験化合物と共にインキュベートされていない細胞を含む参照サンプルを用いて、請求項１～１７のいずれか１項に記載の方法を実施することをさらに含む、前記方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ゲノムのクロマチン修飾レベルを評価する分野に関する。特に、本発明は、エピジェネティック修飾レベルを評価することに関する。前記修飾の変化は、例えば、前記ゲノムを含む細胞を種々の化合物で処理することによって引き起こされる可能性があり、したがって、本発明の方法は、クロマチン修飾レベルに対する試験化合物の効果に接近するために使用することができる。本発明は、クロマチン修飾のグローバルレベルならびに特異的な遺伝子座（例えば、特異的な遺伝子プロモーター）におけるクロマチン修飾レベルの両方を評価することに関する。

【背景技術】

【0002】

哺乳類細胞におけるエピゲノムの特徴をプロファイルするために幅広い手法が存在する。典型的には、哺乳類細胞におけるエピゲノムの特徴をプロファイルする手法は、２つのカテゴリーに分類される。しかし、これらの手法全てにはいくつかの限界がある。

【0003】

１つ目のカテゴリーの方法は、ＤＮＡ及びヒストンＰＴＭレベルをバルク（グローバル）で正確に定量化することに関与する。これには、ボトムアップまたはミドルダウン質量分析法及び抗体ベースの方法（ドットブロット、ウェスタンブロット、免疫蛍光法）が含まれる。例えば、Ｌｕｍｉｎｅｘビーズプラットフォームを用いる抗体ベースの手法においては、マルチプレックス化が実現されている。

【0004】

２つ目のカテゴリーの方法は、個々のＰＴＭまたは他の特徴について、塩基対分解能に及んでゲノムワイドのプロファイルを取得することに関与する。かかる方法には、ＣｈＩＰ－Ｓｅｑ法の多くのバリエーション、ｉｎ－ｓｉｔｕプロファイリング法（ＣＵＴ＆ＲＵＮ、ＣＵＴ＆Ｔａｇ）が含まれる。クロマチン免疫沈降及びシークエンス（ＣｈＩＰ－ｓｅｑ）は、ヒストン修飾をゲノムワイドにマッピングするために使用することができる方法である。それにより、細胞型特異的な機能的要素及びエピジェネティック状態を同定することが可能になる。ＣｈＩＰは、酵素消化または超音波処理を用いてネイティブまたは固定されたクロマチンを断片化し、その後、特異的抗体で免疫沈降することに依拠するものである。ＤＮＡ精製後は、次世代シークエンシング用のライブラリーが作成され得る（ＣｈＩＰ－Ｓｅｑ）。

【0005】

一方、ｉｎ－ｓｉｔｕプロファイリング技法では、インタクトな核の免疫染色に似たプロトコルが使用される。上の全ての技法の主要な制限は、あらゆるサンプルにスパイクインリファレンスを添加しない限り、それらの技法はせいぜい定性的または半定量的であるという事実である。

【0006】

近年、定量的ワークフロー及び有効な定量的ＣｈＩＰ－Ｓｅｑ技法の必要性が認められてきている。ヒストン修飾とは対照的に、定量的手法が、ＤＮＡメチル化をプロファイルするために広く使用されている。メチル化シトシンは、化学的または酵素的塩基変換、すなわち全ゲノムバイサルファイトシークエンス（ＷＧＢＳ）及びＥＭ－ｓｅｑによって、塩基対分解能で検出し、正確に定量化することができる。したがって、ＤＮＡメチル化が、エピジェネティック毒性を研究するための、主な、かつほぼ独占的なリードアウトであることは、驚くべきことではない。

【0007】

ハイスループット法：
ＣｈＩＰ及びＷＧＢＳの自動化プロトコルは存在するが（例えば、ＨＴ－ＣｈＩＰｍｅｎｔａｔｉｏｎ）、それらは常にワークフローあたり１条件及び１抗体に制限される。ワークフローを、マルチウェルフォーマットで並列化またはマイクロ流体チップで自動化することができても、ワークフローの数は条件及び抗体によって倍増し、コスト（試薬、プラスチック製品及び操作時間）は、通常、ワークフローの数に直線的に比例して拡大する。

【0008】

マルチプレックス定量法：
エピゲノム法のスループットを向上させるために、多くのマルチプレックス法が開発されている。これに関しては、クロマチン断片に分子バーコードを付加して、それらをいくつかのサンプルからプールできるようにする。バーコードに基づき、次世代シークエンシングのリードを、解析中に非多重化することができる。かかるバーコード化ファーストの様々な方法が記述されている。原則として、プール化ワークフローは本質的に定量的ではあるが、技術的な課題により、定量的研究にバーコード化ファーストの方法を使用することが妨げられている。さらに最近のバーコード化手法には、正確な定量化に向けた固有の分子識別子に依拠する、ＭＩＮＵＴＥ－ＣｈＩＰが含まれる（Ｋｕｍａｒｅｔａｌ．，２０１９）。とりわけ、ＭＩＮＵＴＥ－ＣｈＩＰは、広いダイナミックレンジで正確な定量比較がなされることが示されている、現在までの唯一の技法である。Ｋｕｍａｒｅｔａｌ．，２０１９で記述されているように、ＭＩＮＵＴＥ－ＣｈＩＰは、非常に多数の断片をシークエンシングすることに依拠している。したがって、Ｋｕｍａｒｅｔａｌ．，２０１９において、サンプル及び抗体あたりのシークエンシングされた断片の数は、６，０６５，３４８～３２，９７９，２８８の範囲にある。さらに、Ｋｕｍａｒｅｔａｌ．，２０１９によって記述されているＭＩＮＵＴＥ－ＣｈＩＰは、少数サンプルのみの並列解析に制限される。

【0009】

薬物に応答するエピゲノムの探索：多細胞生物において、クロマチン修飾は、細胞の細胞アイデンティティ、分化状態、及び／または代謝状態に対して特有であり得る、すなわち、細胞アイデンティティ、分化状態、及び代謝状態が類似している細胞では、類似したクロマチン修飾パターンが共有されていることが多く、一方、無関係な細胞では、異なるクロマチン修飾が示されることが周知である。薬物は、我々ヒトの体内の細胞と多様な方法で相互作用する。設計上または思いがけず、多くの薬物がエピゲノムに影響を及ぼし、エピジェネティック遺伝子制御機構、細胞適応度、及び／または細胞アイデンティティに影響を与える。それぞれ個々のケースで判断されるにとどまるものの、変化が、機能的で潜在的に長期的な効果を有することになる場合、任意の薬物が、ヒストンＰＴＭまたはＤＮＡ修飾のグローバルまたは局所レベルの一部に影響を及ぼす可能性が比較的高い。これは、一般的な薬物の（副）作用の多くが、最終的にエピゲノムを制御する経路に影響を及ぼすからである。つまり、オンまたはオフターゲットとして、薬物は、配列特異的結合によってエピゲノムランドスケープを編成するタンパク質である、転写因子に影響を及ぼすシグナル伝達経路を標的とし得る。それらは、例えば、酸化ストレスを引き起こすことにより、代謝を変化させることがある。アセチル化、リン酸化、またはメチル化等のエピゲノムＰＴＭの基質を提供することにより、代謝経路は、質量作用を通じて多くのＰＴＭのグローバルレベルに直接影響を与える。ＤＮＡまたはヒストン修飾酵素は、多くの薬物の標的であり、エピゲノムランドスケープにさらに直接的に影響を与える。最後に、エピジェネティックな特徴、例えば、腫瘍抑制遺伝子プロモーター上のＤＮＡメチル化パターンは、遺伝的特徴よりも本質的に不均一性のものであると考えられている。細胞傷害性薬物は、細胞に選択的圧力をかけ、これにより、自然変異として先在している生存表現型に関係するエピジェネティック状態が、安定化及び拡大し得る。その結果、エピゲノムクローン集団は、その後の薬物治療に対してより抵抗性であり続ける可能性がある。

【0010】

エピゲノムの有効性及び毒性の研究を実施する上での問題は、エピゲノムの変化について統一的であり、簡便なリードアウトがないという事実にある。エピゲノムプロファイリングは、ハイスループットな薬物特性評価の一部として確立されておらず、この特定分野における方法が必要とされるのは明らかである。細胞ベースのアッセイにおけるエピジェネティックな副作用の検出は、プロセスの十分早期に薬物候補を選別して、エピジェネティック毒性を示す化合物の動物実験及び臨床試験を減らすために使用され得る。

【発明の概要】

【0011】

本開示は、薬物治療後の即時エピジェネティック変化と長期エピジェネティック変化の両方を測定するために適用され得る方法を提供する。

【0012】

したがって、本開示は、複数のサンプルにおける、複数の様々なクロマチン修飾のグローバルレベルを並行して評価するための方法に関する。また、本明細書に開示される方法は、複数のサンプルにおいて、ゲノム内の複数の目的の位置における、複数の様々なクロマチン修飾のレベルを評価することに関する。該方法は、高度にマルチプレックス化され、定量的であり、かつ、クロマチン免疫沈降及びシークエンシング、好ましくは大量並行シークエンシングに関与するものである。

【0013】

驚くべきことに、本発明は、高度にマルチプレックス化されたライブラリーを非常に低い深度でシークエンシングしても、クロマチン修飾のグローバルレベルを正確に決定できることを示す。したがって、特定のクロマチン修飾のグローバルレベルに関する定量的情報を取得可能にするためには、各クロマチン修飾について、初めのサンプルあたり１００～１００，０００ｇＤＮＡ断片の範囲でのシークエンシングで十分である。結果としてのゲノム被覆率が極めて乏しいにもかかわらず、本発明は、試験した全ての条件下で、サブサンプルのクロマチン修飾のレベルとグローバルレベルとの間に正確な相関関係があることを示している。したがって、本発明の方法は、一般的には、複数のクロマチン修飾のレベルを定量的に評価するための方法である。故に、本発明は、ゲノムのサブセットのみを解析することにより、任意の所与の条件下で、任意のクロマチン修飾のグローバルレベルを正確に定量化することが可能になることを示す。

【0014】

したがって、本発明の一態様は、複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法を提供することであり、前記方法は以下のステップを含む。
ａ．複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の固有の分子識別子（ＵＭＩ）配列を含むオリゴヌクレオチドであり、各ＩＤタグは、異なるＵＭＩ配列及び任意選択の追加の配列を含み、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識されたクロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を任意選択で増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．各クロマチン修飾サブプールから、ｎ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きｇＤＮＡ断片を集約プールにプールし、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｍはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップであって、
ｉ．少なくとも第１のバーコード配列ならびに
ｉｉ．前記ＵＭＩ配列及び／または前記ｇＤＮＡ配列の一部
をシークエンシングし、ここで、固有のタグ付きｇＤＮＡ断片は、固有のＵＭＩ及び／または固有のｇＤＮＡ配列のいずれかを含む、前記測定するステップ、
ｋ．各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【0015】

本発明はまた、複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法を提供し、前記方法は以下のステップを含む。
ａ．１つ以上の試験化合物を提供するステップ、
ｂ．前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはその組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
ｃ．本発明による複数のクロマチン修飾のレベルを評価する方法を実施するステップであって、各試験サンプルは、種々の細胞集団のクロマチンを含む、前記実施するステップ。

【0016】

様々なクロマチン修飾の複数のクロマチン修飾レベルのレベルに対する試験化合物の影響は、試験化合物（複数可）の存在下で培養した後の細胞集団における前記クロマチン修飾のレベルを、対照（例えば、試験化合物（複数可）の非存在下で培養した細胞集団）と比較することにより決定され得る。

【図面の簡単な説明】

【0017】

【図1】本明細書に開示される方法の一例の模式的概要を示している。この例では、サンプル１、２、３、４……９９をそれぞれ、溶解、続くクロマチンの断片化、及び各サンプルに固有の第１のバーコード配列を含むＩＤタグの付加に供する。タグ付きクロマチン断片をプールし、サブプールに分ける。サブプールの１つはインプットサブプールであり、他のサブプールは、ＣｈＩＰ１、ＣｈＩＰ２、ＣｈＩＰ３…ＣｈＩＰ１５．と名付けた、様々な抗体によるクロマチン免疫沈降（ＣｈＩＰ）に供する。ＣｈＩＰ後に得られたｇＤＮＡ断片を、各ＣｈＩＰに固有の第２のバーコード配列を含む第２のタグでタグ付けし、増幅し、別途、シークエンシングに使用する装置の特定の要件に従って、大量並行シークエンシングのために準備する。断片をプールし、断片のランダムな画分のみをシークエンシングする。第１のバーコード及び第２のバーコードの各組み合わせでタグ付けした固有の配列（「固有リード」とも呼ばれる）の数を測定し、各第２のバーコードに対する、各第１のバーコードでタグ付けした固有リードのパーセンテージを、円グラフで例示しているように決定する（１つの円グラフは、所与のＣｈＩＰにおける各サンプルについての固有のカウントの頻度を表している）。同様に、各第１のバーコード配列でタグ付けした固有リードの頻度を、インプットについて決定する。各ＣｈＩＰ後の各第１のバーコードの頻度を、インプットにおける頻度に対して正規化する。

【図2】種々の方法でのグローバル及び遺伝子座特異的定量化を比較する模式図。１）数千万～数億のクロマチン断片のディープシークエンシングを用いて、詳細な定量的ゲノムランドスケープを生成する方法（ＭＩＮＵＴＥ－ＣｈＩＰと呼ぶ）。２）ランダムに選択した１０００～１０，０００のクロマチン断片のみをシークエンシングする本発明による方法により、同一の正確な定量化がもたらされる（ｈｍｑＣｈＩＰと呼ぶ）。３）遺伝子座特異的プライマーを用いる本発明による方法では、クロマチン断片の小画分を選択し、断片を選択することにより、グローバル平均の定量化の代わりに、１つまたは多数の遺伝子座における局所レベルの定量化が得られる。

【図3】本発明による方法の一例を原理的に示している。条件Ａ及びＢの下で培養された細胞のサンプルに由来するクロマチン断片を、それぞれＩＤタグＡ及びＢを使用してタグ付けする。典型的には、各サンプルのクロマチン断片の画分のみをタグ付けする。通常、条件Ａ及びＢでは、タグ付きクロマチン断片の数は厳密に同じではない。条件Ａ及びＢのクロマチン断片をプールし、プールのアリコート（ランダムに選択した断片のサブプール）を、特定のクロマチン修飾、ここではヒストンＨ３リジン２７トリメチル化（Ｈ３Ｋ２７ｍｅ３）に対する抗体を用いて、クロマチン免疫沈降（ＣｈＩＰ）に供する。Ｈ３Ｋ２７ｍｅ３修飾を有するクロマチン断片は、タグの存在またはタグの配列、すなわちクロマチン断片の由来に関係なく、同一の親和性で抗体結合部位に対し競合する。非結合分子を洗浄した後、抗体により保持されている分子は、原則として、全てＨ３Ｋ２７ｍｅ３修飾を有する。決定的なことに、どのＨ３Ｋ２７ｍｅ３修飾分子も抗体によって捕捉される確率が等しいため、クロマチン修飾サブプールにおけるクロマチン断片の選択対象は、それらがどの条件に由来するものかに関係なく、タグ付けされ、Ｈ３Ｋ２７ｍｅ３修飾を有するクロマチン断片の可能性の結果を代表するものである。インプットプール及びクロマチン修飾サブプールからのランダムな分子小サブセットをシークエンシングし、インプット及びクロマチン修飾サブプールにおけるＡ及びＢバーコードの数を測定する。本実施例では、インプットプールにおいて、Ａ及びＢバーコードが１：１の比でシークエンシングされる。クロマチン修飾サブプールにおいては、Ａ及びＢバーコードが２：１の比でシークエンシングされる。その結果、条件Ａが、条件Ｂより厳密に２倍多くＨ３Ｋ２７ｍｅ３修飾クロマチン断片を有することを推論し得る。したがって、換言すれば、条件ＢのＨ３Ｋ２７ｍｅ３のグローバルレベルは、条件Ａのそれの５０％である。

【図4】対照条件と比較した、所与の処理後における所与のクロマチン修飾の相対量を計算する例を示している。特定の処理及び対照（例えば、試験化合物の存在下または非存在下で培養した細胞）に対して、３つの複製（Ｒ１、Ｒ２、Ｒ３）サンプルを調製する。クロマチン断片に、６種の異なる第１のバーコードを含む６種の異なるＩＤタグをタグ付けする。Ａインプットサブプールのバーコードの表れは、インプットプールのランダムな小サブセットをシークエンシングし、固有の断片をカウントすることによって決定する。Ｂ各クロマチン修飾サブプールのバーコードの表れは、各クロマチン修飾サブプールの断片のランダムな小サブセットをシークエンシングし、固有の断片をカウントすることによって決定する。Ｃ各クロマチン修飾サブプールの各バーコードのカウントを、対応するインプットサブプールの各バーコードのカウントで割ることにより、各サンプルのインプット正規化固有リードカウント（ＩＮＲＣ）が得られる。ＩＮＲＣは、クロマチン修飾サブプールの各第１のバーコードの存在量を、インプットサブプールの各第１のバーコードの存在量で補正したものを反映している。図３に例示したように、修飾ヌクレオソームが有効な抗体結合部位に結合する確率はＩＤタグに依存しないため、ＩＮＲＣは、それぞれのサンプルにおける探索されたクロマチン修飾のグローバル強化に直線的に関連している。処理サンプルにおける探索されたクロマチン修飾の、対照と比較したグローバルレベルは、処理ＩＮＲＣを対照ＩＮＲＣで割ることによって推論することができる。

【図5】断片の小画分のみをシークエンシングする方法（ｈｍｑＣｈＩＰと呼ぶ）が、約１０，０００倍少ないシークエンシングリードを必要とし得るものであるけれども、ｈｍｑＣｈＩＰは、大量の断片をシークエンシングする方法（ＭＩＮＵＴＥ－ＣｈＩＰと呼ぶ）と同等の定量性があることを示している。ｈｍｑＣｈＩＰは、非常に少数の固有のリードをサンプリングすることにより、相対的なヒストンＨ３Ｋ２７ｍｅ３修飾レベルを正確に定量化することを可能にするものである。データは、ランダムに選択した少数の配列のみを使用したことを除いて、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載された通りに生成した。標準曲線は、Ｈ３Ｋ２７ｍｅ３を最大レベルで有する細胞源と、Ｈ３Ｋ２７ｍｅ３を枯渇させた細胞源とを、既知の比率（１４サンプルに対応する、重複した７つの異なる比率）で混合し、あらかじめ設定した量のヒストンＨ３Ｋ２７ｍｅ３を有するサンプルを調製することにより作成した。クロマチン修飾サブプール及びインプットサブプールから、それぞれサンプルあたり（理論的には）およそ１７９、１７８６及び１７，８５７の配列に相当する、２，５００、２５，０００及び２５０，０００の配列をランダムに選択した。クロマチン修飾サブプール及びインプットサブプールにおいて、１４種のバーコードの各々を含有する固有のクロマチン断片をカウントした。インプット正規化固有リードカウントは、各第１のバーコードについて、クロマチン修飾リード対インプットリードの比を決定することにより計算した。標準曲線は、クロマチン修飾サブプールの前記２５０，０００、２５，０００または２，５００のリードを用いて、線形回帰分析により計算した。測定値は、あらかじめ設定した量に、直線的に相関し、比例している。量のデータがどのくらい厳密に真の量を予測しているかを指し示すＲ^２値は、標準曲線を作成するために、合計２，５００リードしか使用しなかった場合でさえ、極めて良好（＞０．９８）のままである。

【図6】断片の小画分のみをシークエンシングする方法（ｈｍｑＣｈＩＰと呼ぶ）による、相対的なヒストンＨ３Ｋ２７ｍｅ３修飾レベルの正確な定量化を示している。データは、ランダムに選択した少数の配列のみを使用したことを除いて、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載された通りに生成した。データセットは、未処理の対照条件（「未処理」）及び細胞が２種の阻害剤で処理されている条件（「２ｉ」）において、それぞれ生物学的に三重に存在する、マウス胚性幹細胞の比較対象を含有する。２つの解析を実施した。上部の解析では、対応する参照ゲノムへのマッピングを使用して、解析したクロマチン断片の固有性を決定した。下部の解析では、参照ゲノムへのマッピングは実施せず、代わりにＵＭＩ配列を使用して、固有のクロマチン断片のカウントを決定した。各解析では、Ｘ軸で表示されているように、データセットから規定数の配列をランダムに抽出した。Ｙ軸には、「未処理」対照に対するＨ３Ｋ２７ｍｅ３の量を示している。エラーバーは、三重の測定の標準偏差を示す。有意差は両側ｔ検定を用いて計算し、以下のように表示した：ｎ．ｓ．は非有意、＊はｐ＜０．０５、＊＊はｐ＜０．０１。ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒは、数千万より多くのクロマチン断片のシークエンシングに基づき、「２ｉ」処理により、Ｈ３Ｋ２７ｍｅ３が２．３倍増加したことを報告した。該解析は、６種の複製物の合計わずか１０００～１０，０００の範囲のマッピングされたリードまたはＵＭＩカウントで、正確（２．３倍の差）かつ確信的（統計的に有意）な定量が可能であることを示している。本実施例で示したｈｍｑＣｈＩＰの限界は、条件あたりおよそ約２００の固有リードにある。

【図7】クロマチン修飾のグローバルレベルを決定するための本発明の方法において、ｇＤＮＡ断片にタグを付け、ＰＣＲ法で増幅し、シークエンシングする方法の例を示している。１）ＩＤタグを、各サンプルに由来する全クロマチン断片の画分のｇＤＮＡ部分にランダムに付加する。ＩＤタグは、増幅配列、ＵＭＩ及び第１のバーコード配列（ＢＣ）を含む。ＩＤタグは、１つの非ライゲーション末端を含む。２）プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのｇＤＮＡ断片を精製する。３）ｇＤＮＡ断片に第２のタグをライゲーションする。第２のタグは、増幅配列を含み、任意選択で第２のバーコード配列を含み得る。ＩＤタグの非ライゲーション末端は、第２のタグが該ＩＤタグにライゲーションされないことを保証するものである。４）ＩＤタグの増幅配列及び第２のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたｇＤＮＡ断片をＰＣＲ法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、プライマー配列によって付加し得る。５）ＵＭＩ－ＢＣ－ｇＤＮＡ部分をシークエンシングする。

【図8】クロマチン修飾の局所レベルを決定するための本発明の方法において、ｇＤＮＡ断片にタグを付け、ＰＣＲ法で増幅し、シークエンシングする方法の例を示している。１）ＩＤタグを、各サンプルに由来する全クロマチン断片の画分のｇＤＮＡ部分にランダムに付加する。ＩＤタグは、増幅配列、ＵＭＩ、及び第１のバーコード配列（ＢＣ）を含む。２）プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのｇＤＮＡ断片を精製する。３）ＩＤタグ付きｇＤＮＡ断片を、ＩＤタグの増幅配列に特異的な１つのプライマー、及び１つまたは複数の目的の遺伝子座に特異的なプライマーを用いて、ＰＣＲ法により増幅する。シークエンシングプラットフォーム専用のアダプターを、プライマーの一部として付加し得る。プライマーは、任意選択で、第２のバーコード配列も含み得る。４）ＵＭＩ－ＢＣ－ｇＤＮＡ部分をシークエンシングする。

【図9】クロマチン修飾のグローバルレベルを決定するための本発明の方法において、ｇＤＮＡ断片にタグを付け、リニア増幅法及びＰＣＲ法で増幅し、シークエンシングする方法の例を示している。１）ＩＤタグを、各サンプルに由来する全クロマチン断片の画分のｇＤＮＡ部分にランダムに付加する。ＩＤタグは、増幅配列、ＲＮＡポリメラーゼプロモーター、ＵＭＩ及び第１のバーコード配列（ＢＣ）を含む。ＩＤタグは、１つの非ライゲーション末端を含む。２）プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのｇＤＮＡ断片を精製する。３）ＩＤタグ付きｇＤＮＡを、該ＩＤタグに埋め込んだＲＮＡポリメラーゼプロモーターを用いて転写し、増幅する。４）ｇＤＮＡ断片のＲＮＡコピーに第２のタグをライゲーションする。第２のタグは、増幅配列を含み、任意選択で第２のバーコード配列を含み得る。５）ＲＮＡを第２のタグに相補的なプライマーを用いて逆転写する。６）ＩＤタグの増幅配列及び第２のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたＤＮＡ断片をＰＣＲ法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、逆転写またはＰＣＲプライマー配列で付加し得る。７）ＵＭＩ－ＢＣ－ｇＤＮＡ部分をシークエンシングする。

【図10】クロマチン修飾の局所レベルを決定するための本発明の方法において、ｇＤＮＡ断片にタグを付け、リニア増幅法及びＰＣＲ法で増幅し、シークエンシングする方法の例を示している。１）ＩＤタグを、各サンプルに由来する全クロマチン断片の画分のｇＤＮＡ部分にランダムに付加する。ＩＤタグは、増幅配列、ＲＮＡポリメラーゼプロモーター、ＵＭＩ、及び第１のバーコード配列（ＢＣ）を含む。２）プール後、プールをサブプールに分け、クロマチン免疫沈降後、各クロマチン修飾サブプールのｇＤＮＡ断片を精製する。３）ＩＤタグ付きｇＤＮＡを、該ＩＤタグに埋め込んだＲＮＡポリメラーゼプロモーターを用いて転写し、増幅する。４）ＲＮＡを、１つまたは複数の目的の遺伝子座に相補的な配列を有するプライマーを用いて逆転写する。第２のタグをプライマー配列の一部として付加し得る。５）ＩＤタグの増幅配列及び第２のタグの増幅配列に特異的なプライマーを用いて、二重にタグ付けされたＤＮＡ断片をＰＣＲ法で増幅させる。シークエンシングプラットフォーム専用のアダプターを、逆転写またはＰＣＲプライマー配列で付加し得る。６）ＵＭＩ－ＢＣ－ｇＤＮＡ部分をシークエンシングする。

【図11A】３種のヒストン修飾に対する薬物の効果を定量化するためのｈｍｑＣｈＩＰ実験を示すものである。実験のスキームを示している。参照としてＤＭＳＯ対照を用いるＩＮＲＣを、該方法に従って計算し、修飾の相対量を反映しているグレースケール及び円サイズでヒートマップにプロットした。

【図11B】３種のヒストン修飾に対する薬物の効果を定量化するためのｈｍｑＣｈＩＰ実験を示すものである。１回目のシークエンシングの結果を示している。

【図11C】３種のヒストン修飾に対する薬物の効果を定量化するためのｈｍｑＣｈＩＰ実験を示すものである。２５百万リードを使用して行った２回目のシークエンシングの結果を示している。

【図11D】３種のヒストン修飾に対する薬物の効果を定量化するためのｈｍｑＣｈＩＰ実験を示すものである。２５百万のうちからランダムに選択した１百万リードを使用して行った２回目のシークエンシングの結果を示している。

【図12】ＣＤＫＮ１Ａ（ｐ２１）遺伝子座にハイブリダイズする遺伝子座特異的プライマーをライブラリー調製に用いて、単一遺伝子座の２種のヒストン修飾に対する薬物の効果を定量化するｈｍｑＣｈＩＰ実験の結果を示している。２種の異なるヒストン修飾、Ｈ３Ｋ２７ａｃ及びＨ３Ｋ９ｍｅ３に対する２種の抗体及びインプットのライブラリーを用いて、表示した通りに処理した４種の異なるサンプルの影響を定量化した。参照としてＤＭＳＯ対照を用いるＩＮＲＣを、該方法に従って計算し、複製データポイントをドットとして示す棒グラフにプロットした。

【発明を実施するための形態】

【0018】

定義
本明細書において、特に明記しない限り、「ａ」または「ａｎ」は、「１つ以上」を意味する。

【0019】

本明細書で使用する場合、数値に関して使用する際の用語「約」は、＋／－５％、より好ましくは＋／－１％を指す。

【0020】

本明細書で使用する場合、用語「エピジェネティック修飾」は、細胞分裂を通じて安定性かつ遺伝性である、クロマチン内の修飾を指す。

【0021】

本明細書で使用する場合、用語「グローバルレベル」は、全ゲノムにわたる所与のクロマチン修飾の平均密度または平均相対レベルを指す。

【0022】

本明細書で使用する場合、用語「局所レベル」は、ゲノム内の１０００ｂｐ間隔内、または複数の目的の遺伝子座内等、ある特定の目的の遺伝子座にわたる、所与のクロマチン修飾の平均密度または平均相対レベルを指す。

【0023】

本明細書で使用する場合、用語「クロマチン」は、細胞の核で見出されるゲノムＤＮＡ（ｇＤＮＡ）とタンパク質の複合体を指す。クロマチンの主たるタンパク質成分は、ヒストンでできている。

【0024】

方法
本開示は、複数のサンプルにおけるクロマチン修飾レベルを並行して評価する方法について記載するものである。該方法は、複数のサンプルにおける複数のクロマチン修飾のグローバルレベルまたは局所レベルのいずれかを並行して評価するのに有用である。特に、該方法は、前記レベルを互いに比較するか、または対象と比較して決定するのに有用である。本開示は、多数の種々のサンプルにおいて、ヒストン翻訳後修飾（ＰＴＭ）またはヌクレオチド修飾等、複数のクロマチン修飾の相対グローバルレベルまたは局所レベルを測定するための、高度にマルチプレックス化された定量的技法に関するものである。該方法の有用なワークフローの一例を、図１に模式的に記述する。

【0025】

特に、本発明の方法は、対照と比較した所与のクロマチン修飾の増加または減少を、定量的に決定するのに有用である。該方法は、複数のサンプルの並行解析を可能にするものである。したがって、該方法は、種々のサンプルにおける複数の所与のクロマチン修飾の強化または減少を定量的に解析するために使用することができる。

【0026】

種々のサンプルにわたるクロマチン修飾レベルを定量的に測定可能にするためには、前記サンプルが同一の様式で処理されることが重要である。したがって、全てのサンプルが本質的に同一の様式で処理されることが好ましい。また、全てのクロマチン修飾サブプールが同一の様式で処理されることが好ましい。

【0027】

好ましい実施形態において、該方法は、１つ以上のクロマチン修飾のグローバルレベル及び／または局所レベルに対する、１つ以上の試験化合物の効果を決定するために使用することができる。かかる実施形態では、細胞を種々の試験化合物またはそれらの組み合わせと共にインキュベートし、細胞における複数のクロマチン修飾のグローバルレベル及び／または局所レベルを、本発明の方法によって決定する。そのようにして、エピゲノムに対する様々な試験化合物の効果を評価することができる。

【0028】

クロマチン修飾
本開示は、複数のクロマチン修飾のグローバルレベルを評価するための方法について記載するものである。

【0029】

本明細書で使用する場合、用語「クロマチン修飾」は、レベルを決定することが望ましい、クロマチンの任意の特定の特徴を指す。往々にして、クロマチン修飾は、エピジェネティック修飾であり得る。

【0030】

クロマチン修飾は、例えば、以下からなる群から選択され得る。
ｉ．クロマチン断片内のｇＤＮＡに結合したタンパク質
ｉｉ．翻訳後修飾
ｉｉｉ．核酸塩基の修飾
ｉｖ．ｇＤＮＡ断片中の非天然核酸塩基の存在
ｖ．翻訳後プロセシングを通じて産生されたタンパク質断片の存在
ｖｉ．非正規ＤＮＡ構造

【0031】

該方法は、任意のクロマチン修飾であり得る、複数の様々なクロマチン修飾の同時評価を可能にする。したがって、該方法は、複数の類似のクロマチン修飾または非常に異なるクロマチン修飾の評価に関与し得る。したがって、該方法は、上記様々な種類のクロマチン修飾の混合物を評価することに関与し得る。

【0032】

該方法は、結合分子、好ましくは特定のクロマチン修飾に特異的に結合する抗体の使用に関与する。したがって、クロマチン修飾は、結合分子、好ましくは抗体が特異的に認識することができる、任意の修飾であり得る。

【0033】

本発明の方法によって評価され得るクロマチン修飾の１つ以上は、エピジェネティック修飾であり得る。本明細書で使用する場合、用語「エピジェネティック修飾」は、安定性かつ遺伝性である修飾を指す。前記修飾は、多くの場合、クロマチンの化学的マークである。エピジェネティックマークとしては、ｇＤＮＡの修飾、ならびにヒストン等のｇＤＮＡに会合しているタンパク質の様々な翻訳後修飾（例えば、「翻訳後修飾」の節で後述する修飾のいずれか）を挙げることができる。

【0034】

哺乳類では、親由来の特異的遺伝子発現（母方または父方のいずれかの染色体から）がしばしば認められるが、これは通常、エピジェネティック修飾によるものである。親の生殖細胞では、エピジェネティック修飾により、安定した遺伝子サイレンシングまたは遺伝子活性化がもたらされ得る。他のエピジェネティック修飾としては、エピジェネティック状態、クロマチン構造、転写、ｍＲＮＡスプライシング、転写後修飾、ｍＲＮＡ安定性及び／または半減期、翻訳、翻訳後修飾、タンパク質安定性及び／または半減期、及び／またはがんに関連する細胞経路の少なくとも１つの構成要素におけるタンパク質活性、における変化を挙げてもよい。

【0035】

上述のように、クロマチン修飾は、例えば、ヌクレオチドの修飾、特にｇＤＮＡ内のヌクレオチドの修飾であり得る。前記修飾は、例えば、メチル化（例えば、核酸塩基のメチル化）であり得る。修飾ヌクレオチドは、例えば、５－メチル－シトシン、５－ヒドロキシメチル－シトシン、５－ホルミル化シトシン、５－カルボキシシトシン及び６－メチル－アデニンであり得る。

【0036】

上述のように、クロマチン修飾は、例えば、１つ以上の非天然核酸塩基の存在であり得る。非天然核酸塩基の非限定的な例としては、５－ブロモ－２’－デオキシウリジン及び５－エチニル－２’－デオキシウリジン塩基が挙げられる。

【0037】

上述のように、クロマチン修飾は、例えば、１つ以上の非正規ＤＮＡ構造の存在であり得る。非正規ＤＮＡ構造の非限定的な例としては、Ｇ４構造、一本鎖ＤＮＡ、及びＲＮＡ：ＤＮＡハイブリッドが挙げられる。

【0038】

本発明の方法は、少なくとも１つ（好ましくは少なくとも２つ）、少なくとも３つ等（例えば少なくとも５つ）、少なくとも１０等（例えば少なくとも１５）、５～１００の範囲等（例えば５～５０の範囲）、１０～１００の範囲等（例えば１０～５０の範囲）のクロマチン修飾のグローバルレベル及び／または局所レベルを決定するためのものであり得る。特に、前記クロマチン修飾の少なくとも１つ（好ましくは少なくとも２つ）、少なくとも３つ等（例えば少なくとも５つ）、少なくとも１０等（例えば少なくとも１５）が、タンパク質（複数可）の翻訳後修飾（ＰＴＭ）（例えば、以下の「翻訳後修飾（ＰＴＭ）」の節で記述されているＰＴＭのいずれか）であることが好ましい。

【0039】

翻訳後修飾（ＰＴＭ）
本明細書で使用する場合、用語「翻訳後修飾」（ＰＴＭ）は、タンパク質翻訳後のそのタンパク質の構造における修飾を意味する。ＰＴＭは、カルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、またはグリコシル化が挙げられるがこれらに限定されない化学基の付加を含み得る。ＰＴＭは、プロリン異性化、または非定型イソアスパルチルの形成が挙げられるがこれらに限定されない異性化を含み得る。

【0040】

ＰＴＭの例としては、リジンのモノ、ジ、トリメチル化；リジンのアセチル化、プロピオニル化、ブチリル化、クロトニル化、イソブチリル化、ユビキチン化、スモイル化、ネディル化、グルタリル化；セリンリン酸化、スレオニンリン酸化；ヒスチジンリン酸化；シトルリン；アルギニンモノメチル化または対称もしくは非対称ジメチル化が挙げられるが、これらに限定されない。

【0041】

クロマチン修飾に関して、ＰＴＭは、往々にしてヒストンの翻訳後修飾（本明細書では「ヒストン修飾」とも呼ばれる）である。前記ヒストンのＰＴＭは、前述のＰＴＭのいずれかであり得る。例えば、ヒストン修飾は、１つ以上のヒストンのアセチル化、メチル化、脱メチル化、リン酸化、アデニル化、ユビキチン化、またはＡＤＰリボシル化であり得る。

【0042】

前記ヒストンは、例えば、以下からなる群から選択されるヒストンであり得る。
ａ．ヒストンＨ３
ｂ．ヒストンＨ３．１、Ｈ３．２、Ｈ３．３
ｃ．ヒストンＨ３．Ｘ、Ｈ３．Ｙ
ｄ．ヒストンＨ４
ｅ．ヒストンＨ２Ａ
ｆ．ヒストンＨ２Ａ．Ｘ
ｇ．ヒストンＨ２Ａ．Ｚ
ｈ．ヒストンＨ２Ａ．Ｚ．１
ｉ．ヒストンＨ２Ａ．Ｚ．２
ｊ．ヒストンマクロＨ２Ａ
ｋ．ヒストンＨ２Ａ．Ｂｂｄ、及び
ｌ．ヒストンＨ２Ｂ

【0043】

翻訳後修飾を有するヒストンの非限定的な例としては、以下のものが挙げられるが、これらに限定されない。
ａ．Ｈ３Ｋ４ｍｅ１；
ｂ．Ｈ３Ｋ４ｍｅ２；
ｃ．Ｈ３Ｋ４ｍｅ３；
ｄ．Ｈ３Ｋ７９ｍｅ３；
ｅ．Ｈ３Ｋ９ｍｅ１；
ｆ．Ｈ３Ｋ９ｍｅ２；
ｇ．Ｈ３Ｋ９ｍｅ３；
ｈ．Ｈ３Ｋ２７ｍｅ１；
ｉ．Ｈ３Ｋ２７ｍｅ２；
ｊ．Ｈ３Ｋ２７ｍｅ３；
ｋ．Ｈ４Ｋ２０ｍｅ１；
ｌ．Ｈ４Ｋ２０ｍｅ２及び
ｍ．Ｈ４Ｋ２０ｍｅ３。

【0044】

周知のヒストン翻訳後修飾（ＰＴＭ）及びそれらの組み合わせは、エピジェネティック情報に対する、クロマチンの詳細なコーディング潜在力を強調するものである。

【0045】

異常なヒストン尾部は、マークを書き込む酵素または消す酵素だけでなく、特定のマークまたはマークの組み合わせを認識し、ゲノム遺伝子座でのその出現を遺伝子活性等の機能的結果に結びつけるリーダー／エフェクターのためのシグナル伝達プラットフォームとして働くことが十分に確立されている。ヒストンＰＴＭの複雑さと密度は、内因性シグナル伝達、外因性ストレス、環境因子または薬物によってといい、細胞にもたらされる混乱に対する影響を精査するための課題を提供するものである。

【0046】

グローバルレベル及び局所レベル
本明細書で使用する場合、用語「グローバルレベル」は、ゲノム全体にわたる特定のクロマチン修飾の総平均レベルまたは平均密度を指す。前記レベルは、対象と比較した相対レベルとして最も頻繁に決定される。例として、クロマチン修飾がＨ３Ｋ４ｍｅ３である場合、「グローバルレベル」は、ゲノムにおける前記修飾の平均レベルまたは密度に相当する。

【0047】

本明細書に記載の方法によって決定されたグローバルレベルは、原理的には、定量的ウェスタンブロットまたは定量的免疫蛍光顕微鏡法等の他の生化学的方法によって測定されたグローバルレベルと同等である。典型的には、グローバルレベルは、複数のサンプル間で比較される相対レベルとして提供され、好ましくは参照サンプル、より好ましくはクロマチン修飾の量が既知である参照サンプルであり得る別のサンプルに対する、あるサンプルのグローバルレベルの倍率変化を決定するものである。参照サンプルは、例えば、所与のクロマチン修飾の密度が１００％であるヒストンタンパク質を有するｇＤＮＡ断片調製物等の合成サンプルであり得る。本発明により提供される定量比較を用いることにより、試験サンプルにおける以前は未知であった所与のクロマチン修飾の量が、参照サンプルに対して試験サンプルで認められた倍率変化の差を考慮することで計算することができる。参照サンプルの量が既知である場合、正確なレベルを計算し得る。かかる計算は、定量的方法によって示された測定値が、サンプルの真の量に直線的に関連しているかまたは比例している場合に正確である。本明細書で詳細に説明するように、本発明の方法は、サンプルの真の量に実際に直線的に関連しているかまたは比例している。

【0048】

本明細書に開示される方法は、シークエンシングのために、サンプルあたり１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップを含む。グローバルレベルが決定される本発明の実施形態では、前記ｇＤＮＡ断片は、原則として、クロマチン修飾サブプール及びインプットサブプール内の全てのｇＤＮＡ断片からランダムに選択され得る。往々にして、本明細書に開示される方法は、クロマチン修飾サブプール及びインプットサブプールのｇＤＮＡ断片を増幅するステップを含む。本発明の実施形態では、該方法が複数のクロマチン修飾のグローバルレベルを決定するためのものである場合、前記増幅ステップは、原則として、全てのｇＤＮＡ断片が同一の増幅確率を有するように設計される。これは、例えば、ｇＤＮＡ断片のランダムな画分に、増幅配列を含むＩＤタグ及び別の増幅配列を含む第２のタグを、後述のいずれかの様式でタグ付けすることにより実現され得る。次いで、増幅は、前記増幅配列を認識するプライマーにより行われ得、原理的に、ｇＤＮＡ断片の配列に依存しないことになる。クロマチン修飾（複数可）のグローバルレベルの評価に向けた、ｇＤＮＡ断片のタグ付け及び増幅の有用な方法を、図７及び図９に示している。当業者であれば、それらの図に開示された原理を、他の有用なタグ付け及び増幅方法に適応させることができるであろう。

【0049】

一実施形態では、サンプルのグローバルレベルは、直接測定されないが、複数の局所レベル、好ましくは、ゲノム全体の代表的なサブサンプルをまとめて提供する、１００超、または１０００超の遺伝子座等の多数の遺伝子座を評価することによって近似される。

【0050】

本明細書で使用する場合、用語「局所レベル」は、特定のゲノム位置（１０００塩基対の間隔内等）における、所与のクロマチン修飾のレベル（または、特定のゲノムの長さ（例えば、キロベース単位）あたりの密度）を指す。したがって、典型的には、局所レベルは、所与の遺伝子座における所与のクロマチン修飾のレベルである。例として、局所レベルは、ＭＹＣ遺伝子の転写開始部位周囲の１０００塩基対の間隔に及んで定義される、ＭＹＣ遺伝子プロモーターにおける、Ｈ３Ｋ４ｍｅ３のレベルを指し得る。

【0051】

「局所レベル」は、１つの特定の遺伝子座において決定され得るが、本発明には、１つ超の遺伝子座における局所レベルを同時に決定することが含まれる。したがって、該方法は、少なくとも２つの遺伝子座、少なくとも５つの遺伝子座等（例えば少なくとも１０の遺伝子座）、２～１００の範囲の遺伝子座等（例えば２～５０の範囲の遺伝子座）、２～２５の範囲の遺伝子座等（例えば５～２５の範囲の遺伝子座）で局所レベルを決定するための方法であってよい。

【0052】

局所レベルを決定する場合、該方法は、典型的には、目的の遺伝子座に特異的なプライマー（例えば、以下の「増幅」の節で詳述するような第２のプライマー）を用いてｇＤＮＡ断片を増幅するステップを含む。目的の遺伝子座がより多い場合、前記増幅ステップでは、通常、目的の遺伝子座のそれぞれに特異的な、少なくとも１つの（第２の）プライマーを含む、プライマー混合物が使用される。

【0053】

本明細書に開示される方法は、シークエンシングのために、サンプルあたり１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップを含む。サンプルあたりのｇＤＮＡ断片の数を正確に把握することは要件とされない。サンプルは単にランダムに選択されるため、理論的には、サンプルあたりほぼ同数のｇＤＮＡサンプルがシークエンシングされる。実際には、ｎ掛ける１００～１００，０００のタグ付きｇＤＮＡ断片がシークエンシングされることが好ましく、ここで、ｎはサンプルの数である。

【0054】

いくつかの実施形態では、ステップｉ）で選択されるｇＤＮＡ断片の数は、目的の遺伝子座の数に依存する。したがって、いくつかの実施形態では、シークエンシングのために、ｎ掛けるｐ掛ける１０～１００，０００のタグ付きｇＤＮＡ断片が選択され、ｎ掛けるｐ掛ける１００～１００，０００等の配列、例えば多くともｎ掛けるｐ掛ける５０，０００（多くともｎ掛けるｐ掛ける２０，０００等）、例えばｎ掛けるｐ掛ける１０～５０，０００の範囲（ｎ掛けるｐ掛ける１００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片が選択され、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｐは目的の遺伝子座の数である。

【0055】

局所レベルが決定される本発明の実施形態では、前記ｇＤＮＡ断片は、１つ以上の目的の遺伝子座にマッピングされ得る、クロマチン修飾サブプール及びインプットサブプール内のｇＤＮＡ断片から選択される。往々にして、本明細書に開示される方法は、クロマチン修飾サブプール及びインプットサブプールのｇＤＮＡ断片を増幅するステップを含む。本発明の実施形態では、該方法が複数のクロマチン修飾の局所レベルを決定するためのものである場合、前記増幅ステップは、原則として、前記１つ以上の目的の遺伝子座に由来するｇＤＮＡ断片のみが増幅されるように設計され得る。これは、例えば、ｇＤＮＡ断片のランダムな画分に、増幅配列を含むＩＤタグを、後述のいずれかの様式でタグ付けすることにより実現され得る。次いで、増幅は、前記増幅配列を認識するプライマー及び目的の遺伝子座に特異的なプライマーまたはプライマー混合物により行われ得る。クロマチン修飾（複数可）の局所レベルの評価に向けた、ｇＤＮＡ断片のタグ付け及び増幅の有用な方法を、図８及び図１０に示している。当業者であれば、それらの図に開示された原理を、他の有用なタグ付け及び増幅方法に適応させることができるであろう。

【0056】

サンプル
本発明の方法は、クロマチンを含む複数のサンプルにおいて、複数のクロマチン修飾のグローバルレベルを評価することを可能にするものである。

【0057】

前記クロマチンを含むサンプルは、好ましくは、複数の細胞を含む細胞集団から調製されるか、または該細胞集団を含むサンプルである。

【0058】

該方法は、複数のサンプルを同時に試験することを可能にするものである。したがって、該方法は、特に、複数の試験サンプル、少なくとも１５等（少なくとも２５等）、例えば少なくとも５０（少なくとも７５等）、例えば１５～１０００の範囲（１５～５００の範囲等）、例えば２５～１０００の範囲（２５～５００の範囲等）のクロマチンを含む種々の試験サンプルを提供することを含み得る。試験サンプルは、好ましくは、それらが互いに物理的に分離されているような様式で提供される。

【0059】

本発明の方法の利点の１つは、該方法により、複数の種々のサンプルにおける複数のクロマチン修飾のレベルを正確に定量化できることである。故に、多数のサンプルを並行して解析することができる。したがって、いくつかの実施形態では、少なくとも７５、好ましくは少なくとも８５、例えば７５～１０００の範囲（７５～５００の範囲等）、例えば８５～１０００の範囲（８５～５００の範囲等）のクロマチンを含む種々の試験サンプルが提供される。

【0060】

サンプルは通常、細胞集団を含むか、またはサンプルは細胞集団のクロマチンを精製または部分精製することによって調製され、該細胞集団は、複数の細胞を含む。該方法は、クロマチン修飾のグローバルレベルに対する、細胞の様々な処理の効果を評価するために特に有用である。

【0061】

したがって、細胞集団は、好ましくは、全て同一の様式で処理されている複数の細胞を含む。

【0062】

細胞は、任意の細胞であってよい。一実施形態では、細胞は培養細胞であるが、細胞は、単細胞生物または多細胞生物（例えば、動物）から直接得てもよい。細胞は、例えば、形質転換細胞株、患者由来細胞株等の初代細胞株、がん細胞株、ｉＰＳ細胞、接着細胞、懸濁細胞、３Ｄ細胞培養物、人工組織細胞及びオルガノイド細胞からなる群から選択され得る。

【0063】

試験サンプルに含まれている、または試験サンプルの調製に使用される細胞は、任意の有用な方法により培養されていてもよい。例えば、細胞は、懸濁液中で増殖されていても、接着細胞として増殖されていても、３Ｄ培養で増殖されていても、または凝集体（例えば、オルガノイド、ガストロイド）で増殖されていてもよい。細胞培養のための有用な方法及び培地は、当業者に周知である。

【0064】

サンプルの調製に先立ち、細胞は任意選択で、例えば、ホルムアルデヒド中でのインキュベーションにより、固定され得る。しかし、細胞は天然のものであってもよい。

【0065】

一般に、クロマチン修飾レベルの正確な評価を得るためには、サンプルは、複数の細胞を含む細胞集団を含むか、または該細胞集団から調製されなければならない。特に、サンプルは、インプットサブプール及び試験サブプールの調製を可能にするのに十分な細胞から調製されることが好ましく、原則として、各クロマチン断片は、前記サブプールの各々において見受けられる。これは、単一細胞のクロマチンをサブプールに分けた場合、サブプールのそれぞれが異なるものになるため、複数の細胞が必要とされることにならうものである。したがって、クロマチン修飾レベルの正確な評価は、いくつかの理由から、単一細胞レベルでは行えないことが、当業者には理解されよう。

【0066】

したがって、一実施形態では、細胞集団は、少なくとも１００の細胞、好ましくは少なくとも５００の細胞、さらにより好ましくは少なくとも１０００の細胞、例えば１０～１００，０００の範囲の細胞（１００～１００，０００の範囲の細胞等）、例えば１０００～１００，０００の範囲の細胞を含む。

【0067】

該方法の一実施形態では、各サンプルは、１０～１０００００の範囲の細胞（１００～１００００の範囲の細胞等）を含むか、または前述の数の細胞から精製／部分精製される。

【0068】

好ましい実施形態において、本発明は、複数のクロマチン修飾のグローバルレベルに対する複数の処理の効果を評価することに関する。前記処理は、例えば、種々の試験化合物またはそれらの組み合わせとのインキュベーションであり得る。かかる実施形態では、該方法は、クロマチン修飾レベルに対する様々な試験化合物の効果を評価するのに有用である。この情報は、化合物または化合物の組み合わせの毒性を評価するために使用することができる。

【0069】

したがって、本発明はまた、クロマチン修飾のグローバルレベルまたは局所レベルに対する試験化合物の影響を決定する方法を提供し、前記方法は以下のステップを含む。
ａ．１つ以上の試験化合物を提供するステップ、
ｂ．前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはそれらの組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
ｃ．本発明の方法に従って、複数のサンプルにおいて、複数のクロマチン修飾のレベルを並行して評価する方法を実施するステップであって、複数の試験サンプルのそれぞれは、種々の細胞集団のクロマチンを含む、前記実施するステップ。

【0070】

細胞集団は、種々の試験化合物またはそれらの組み合わせの存在下で培養されるが、サンプルが、複製（例えば、二重または三重）で調製され得ることが、該方法に含まれ、したがって、１つ超（１～１０の範囲等）の細胞集団が、同一の試験化合物または試験化合物の組み合わせの存在下で培養されていてもよいことが、本発明に含まれる。

【0071】

本発明の実施形態において、該方法がクロマチンのグローバルレベルに対する様々な処理の効果を評価するために使用される場合、該方法は、異なる種類の処理でまたは処理なしで、同一種の細胞を培養し、かかる細胞におけるクロマチン修飾のグローバルレベルを比較することに関与し得る。これにより、種々の処理の効果を評価することが可能になるであろう。

【0072】

好ましい実施形態では、前記処理は、種々の試験化合物またはそれらの組み合わせとのインキュベーションであり得る。かかる実施形態では、該方法は、クロマチン修飾レベルに対する様々な試験化合物の効果を評価するのに有用である。この情報は、化合物または化合物の組み合わせの毒性を評価するために使用することができる。

【0073】

同一の実施形態において、該方法は、クロマチン修飾の生成または除去に関与する酵素を、阻害または枯渇させる複数の処理と組み合わせて、複数のクロマチン修飾の相互依存性を評価する（ネットワーク解析）のに有用である。

【0074】

クロマチンの断片化：
該方法の１つの態様は、クロマチンの分解（断片化）に関するものである。

【0075】

サンプルがインタクトな細胞を含有する場合、該方法は、細胞膜を破壊する（例えば、溶解によって）ステップを含み得、それによって、天然のクロマチンが利用可能になる。前記クロマチンは、任意選択で、さらに精製または部分精製され得る。

【0076】

次いで、各サンプルのクロマチンは、クロマチン断片に断片化され得、ここで、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む。前記関連タンパク質は、ヒストン及び任意の他のタンパク質であり得る。

【0077】

クロマチンの断片化は、様々な方法によって達成することができる。該方法の一実施形態では、前記クロマチンは、クロマチンの断片化を触媒する１つ以上の酵素とインキュベートすることによって断片化される。前記酵素のうちの１つ以上は、小球菌ヌクレアーゼ（ＭＮａｓｅ）等のヌクレアーゼ、配列特異的制限酵素またはそれらの混合物からなる群から選択される。別の実施形態では、前記クロマチンの断片化方法は、機械的な剪断（超音波処理による剪断等、噴霧剪断等、集束音響剪断等）によるものである。

【0078】

クロマチンは、特定のクロマチン修飾の同定を可能にする最適なサイズを得るために、断片に分解され得る。１つの好ましい実施形態では、クロマチン断片のサイズは、生成した断片の大多数が、クロマチン修飾の実例を０または１つのいずれかで含有するが、２つ以上は含有しないように選択される。

【0079】

一実施形態では、クロマチン断片のサイズは、生成した断片の大多数（例えば、生成した断片の少なくとも５０％（少なくとも６０％等）、例えば少なくとも７０％（少なくとも８０％等））が、各コアヒストンの２コピーを含むヌクレオソーム単位を１つ含有するが、１つ超は含有しないように選択される。これは、評価される１つ以上のクロマチン修飾がヒストンＰＴＭである方法に関する場合に、特にあり得る。この実施形態では、大多数の断片は、クロマチン修飾を０、１つ、または２つの実例のいずれかで含有するが、３つ以上は含有しないことが期待される。

【0080】

一実施形態では、最適なクロマチン断片サイズは、ヌクレオソームのサイズに相当する１４０ｂｐと２００ｂｐとの間の範囲にある。これは、評価される１つ以上のクロマチン修飾がヒストンＰＴＭである場合に、特にあり得る。別の実施形態では、最適なサイズは、ＤＮＡ上の修飾の予想最小距離に相当する。これは、評価されるクロマチン修飾がヌクレオチド修飾である場合に、特にあり得る。実施形態において、１つ以上のクロマチン修飾が、クロマチンに結合するタンパク質の存在である場合、最適なサイズは、タンパク質結合部位の予想最小距離に相当するが、最小で、例えば、ＤＮＡ上のタンパク質の予想フットプリントの長さの１～２倍である。

【0081】

一実施形態では、前記クロマチン断片は、１００ｂｐ～１０ｋｂの範囲のサイズに断片化される。

【0082】

タグ付け
上記のように、本発明の方法は、クロマチンをクロマチン断片に断片化することを含む。各クロマチン断片は、ｇＤＮＡ断片及び任意選択の関連タンパク質を含む。本明細書に開示される方法は、１つ以上のタグでｇＤＮＡ断片をタグ付けするステップをさらに含み得る。

【0083】

本明細書で使用する場合、用語「タグ付け」は、ヌクレオチドの短い配列（例えば、ＤＮＡ、ＲＮＡ、またはヌクレオチドアナログ）をｇＤＮＡ断片に付加すること（例えば、ライゲーションによって）を指す。タグ付けは、タンパク質と複合体化したｇＤＮＡに（例えば、クロマチン断片に）、または精製したｇＤＮＡもしくは別途前処理したｇＤＮＡに実施し得る。

【0084】

タグ付けは様々な理由で行われ得る。しかし、ＩＤタグは、主に、シークエンシングによって所与のｇＤＮＡ断片を所与のサンプルに帰属させることを可能にするために付加される。したがって、タグ付けは、例えば、サンプルの由来を識別するための補助となり得る。また、タグ付けは、例えば、固有の分子を識別するための補助となり得る、及び／または、タグ付けは、例えば、クロマチン修飾のグローバルレベルのマッピング及び定量化を可能にし得る。

【0085】

タグ付けは、ｇＤＮＡ断片の増幅、選択、伸長、修飾を可能にするために、例えば、特定のシークエンシングプラットフォームでのシークエンシングを可能にするためにも実施され得る。

【0086】

タグには、上記の機能のいくつかを組み合わせてもよい。

【0087】

本明細書で定義される「タグ」は、典型的には、特定の配列を有するオリゴヌクレオチドである。オリゴヌクレオチドは、一本鎖もしくは二本鎖または部分的に一本鎖及び部分的に二本鎖であり得る。タグオリゴヌクレオチドは、一般にＤＮＡであるが、他のタイプのヌクレオチドも含んでよい。

【0088】

ＩＤタグ
各サンプルのクロマチンは、クロマチン断片に断片化され、ここで、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片（任意選択で、一本鎖のオーバーハングを有する）及び任意選択の関連タンパク質を含む。次いで、各サンプルのｇＤＮＡ断片は、ＩＤタグでタグ付けされ得る。

【0089】

ＩＤタグは、オリゴヌクレオチド、好ましくは、二本鎖オリゴヌクレオチドであり得る。ＩＤタグは、バーコード配列及び任意選択の追加の配列を含む。ＩＤタグのバーコード配列は、本明細書において「第１のバーコード配列」とも呼ばれることがある。第１のバーコード配列は、各サンプルを識別する固有の配列である。換言すれば、あるサンプルのｇＤＮＡ断片は、同一の第１のバーコード配列でタグ付けされ、一方、異なるサンプルのｇＤＮＡ断片は、異なる第１のバーコード配列でタグ付けされる。そのようにして、ＩＤタグを、特定のｇＤＮＡ断片がどのサンプルに由来するかを識別するために使用することができる。

【0090】

サンプル内の本質的に全てのｇＤＮＡ断片がタグ付けされることが可能である一方で、ｇＤＮＡ断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。例として、ｇＤＮＡ断片の１％、０．１％、０．０１％またはそれ以下のみがタグ付けされ得る。ｇＤＮＡ断片の画分のみがＩＤタグでタグ付けされる場合、前記断片はランダムに選択されることが好ましい。

【0091】

バーコード配列は、４～４０ヌクレオチドの範囲、例えば４～２０ヌクレオチドの範囲（６～１６ヌクレオチドの範囲等）であり得る。原則として、バーコード配列は、バーコード配列が各サンプルに対して異なることを条件として、任意の配列であってよい。いくつかの実施形態では、バーコード配列が、いかなる有意な程度にも二次構造を形成しないことが好ましいことがある。

【0092】

第１のバーコード配列に加えて、ＩＤタグは追加の配列を含有し得る。例えば、ＩＤタグは、本明細書においてＵＭＩ配列とも呼ばれる、固有の分子識別子として作用するランダムなＤＮＡ配列を含み得る。したがって、原則として、各ＵＭＩ配列は異なるものである。ＵＭＩは、４～２０ヌクレオチドの範囲、例えば、６～１６ヌクレオチドの範囲のランダムな配列を含み得る。

【0093】

かかる実施形態では、１つのサンプル内のタグ付きｇＤＮＡ断片は、同一の第１のバーコード配列でタグ付けされるが、異なるＵＭＩ配列でタグ付けされることになる。

【0094】

一実施形態では、ＩＤタグは、第１のバーコード配列及びＵＭＩ配列に加えて、追加の配列を含み得る。前記追加配列は、タグ付けプロセスを容易にし得る、すなわち、それらは、タグをｇＤＮＡ断片に付着させるのを補助し得る。例えば、追加配列は、ｇＤＮＡ断片上の一本鎖末端にアニールすることができる一本鎖オーバーハングであり得る。特定の配列のｇＤＮＡ断片上の一本鎖末端は、例えば、該断片が制限酵素の補助によってもたらされる場合に生成し得る。したがって、追加配列は、制限酵素によってもたらされた一本鎖オーバーハングに相補的な一本鎖オーバーハングであり得る。

【0095】

ＩＤタグは、増幅及び／またはシークエンシングに有用な追加の配列（複数可）も含み得る。本明細書において、かかる配列はそれぞれ、「増幅配列」及び「アダプター配列」とも呼ばれる。増幅配列は、プライマー結合部位として有用であるように選択され得る。したがって、増幅配列は、プライマーがアニールすることができる任意の配列を含み得るか、またはそれからなり得る。当業者であれば、プライマー結合部位として有用な配列を設計することができる。増幅配列はまた、ＲＮＡポリメラーゼプロモーター等のポリメラーゼプロモーターを含み得るか、またはそれからなり得る。

【0096】

アダプター配列は、一般に、特定の方法に使用されるシークエンシング手法に応じて選択される。

【0097】

したがって、いくつかのシークエンシング法は、増幅ステップ、例えば、以下でより詳細に記載するように、ＰＣＲ、クローンＰＣＲまたは区画ＰＣＲを含む。かかる実施形態では、ＩＤタグは、プライマーにアニールすることができる配列を含む、アダプター配列を含み得る。

【0098】

いくつかのシークエンシング法は、典型的に１つ以上の固定されたオリゴヌクレオチドへのハイブリダイゼーションによる、ｇＤＮＡ断片を固定化するステップを含む。かかる実施形態では、ＩＤタグは、一本鎖であり、前記固定されたオリゴヌクレオチドの少なくとも１つにアニールすることができる、アダプター配列を含み得る。

【0099】

本明細書に開示される方法がｇＤＮＡ断片に第２のタグをライゲーションするステップを含む、本発明の実施形態では、ＩＤタグは、それがｇＤＮＡ断片にライゲーションされると、他の配列にはライゲーションできないように設計され得る。換言すれば、ＩＤタグは、非ライゲーション末端を含み得る。

【0100】

ＩＤタグは、１本または２本の一本鎖オーバーハング（複数可）を任意選択で含有する、２本鎖オリゴヌクレオチドであり得る。ＩＤタグの１本の鎖は、好ましくは、多くとも１００ヌクレオチド（多くとも７５ヌクレオチド等）、例えば多くとも５０ヌクレオチドを含有する。特に、ＩＤタグは、６～１００ヌクレオチドまたはヌクレオチド塩基対の範囲（６～７５ヌクレオチドまたはヌクレオチド塩基対の範囲等）、例えば６～５０ヌクレオチドまたはヌクレオチド塩基対の範囲からなるオリゴヌクレオチドからなり得る。

【0101】

第２のタグ
本明細書に記載の方法は、特定のクロマチン修飾を有するクロマチン断片が、特定の抗体への吸着によってクロマチン断片プールまたはサブプールから単離され（「免疫沈降」）、採取され、任意選択でさらに処理されるステップを含む。

【0102】

例えば、クロマチン断片またはそのｇＤＮＡ断片部分は、後続のシークエンシングを可能にする様式で、精製、増幅及び／または別途調製され得る。

【0103】

かかる手順における１つのステップは、例えば、後続のステップにおける選択、増幅または識別を支援するために、クロマチン断片（典型的にはクロマチン断片のｇＤＮＡ部分）に第２のタグを付けることであり得る。

【0104】

本明細書では、特異的抗体と結合する全クロマチン断片の全ｇＤＮＡ断片を含む組成物は、「クロマチン修飾サブプール」とも呼ばれる。したがって、「クロマチン修飾サブプール」は、原則として、特異的抗体により認識されるクロマチン修飾を含有する、かかるクロマチン断片のｇＤＮＡ断片のみを含有する。所与のｇＤＮＡ断片がどの「クロマチン修飾サブプール」に由来するかを識別するために、第２のタグは、バーコード配列（以降、「第２のバーコード配列」または「第２のバーコード」と呼ぶ）を含み得る。

【0105】

第２のバーコード配列は、各クロマチン修飾サブプールのｇＤＮＡ断片を識別する固有の配列である。換言すれば、あるクロマチン修飾サブプールのｇＤＮＡ断片は、同一の第２のバーコード配列でタグ付けされ、一方、異なるクロマチン修飾サブプールのｇＤＮＡ断片は、異なる第２のバーコード配列でタグ付けされる。

【0106】

そのようにして、ｇＤＮＡは、特定のｇＤＮＡ断片がどのサンプルに由来するかを識別するために使用することができるＩＤタグ、及び特定のｇＤＮＡ断片がどのクロマチン修飾プールに由来するかを識別するために使用することができる第２のタグでタグ付けされ得る。

【0107】

クロマチン修飾サブプール内の本質的に全てのｇＤＮＡ断片が、第２のタグでタグ付けされることが可能である一方で、ｇＤＮＡ断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。したがって、ｇＤＮＡ断片の画分のみが、１つのＩＤタグ及び１つの第２タグの組み合わせでタグ付けされることも本発明に含まれる。

【0108】

第２のタグは、オリゴヌクレオチド、好ましくは、二本鎖オリゴヌクレオチドであり得る。

【0109】

第２のタグは、任意の有用な手段によってｇＤＮＡ断片に付着され得る。一実施形態では、第２のタグは、例えば二本鎖オリゴヌクレオチドとして、ｇＤＮＡ断片にライゲーションされ得る。

【0110】

本明細書に記載の方法は、クロマチン修飾サブプールのｇＤＮＡ断片を増幅するステップを含み得る。かかる実施形態では、第２のタグは、増幅プロセス中に付加され得る。例えば、第２のタグは、増幅のために使用されるプライマーの一部であってよい。

【0111】

したがって、一実施形態では、第２のタグの一部を示す一本鎖オリゴヌクレオチドが、ｇＤＮＡ断片にライゲーションされ得る。その後、第２のタグの相補的な部分を示すオリゴヌクレオチドが、第１の部分にハイブリダイズし、直ちに二本鎖オリゴヌクレオチドが形成し得る。

【0112】

別の実施形態では、第２のタグの一部を示す一本鎖オリゴヌクレオチドが、ｇＤＮＡ断片にライゲーションされ得る。第２のタグは、後続の増幅ステップ中に、ＤＮＡポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換される。

【0113】

別の実施形態では、第２のタグの一部を示す一本鎖オリゴヌクレオチドは、第２のタグにおける配列がｇＤＮＡ配列に相補的であることによって、ｇＤＮＡ断片にハイブリダイズし得る。

【0114】

別の実施形態では、第２のタグの一部を示す一本鎖オリゴヌクレオチドは、増幅ステップにおいて、ｇＤＮＡ断片から転写される一本鎖ＲＮＡにライゲーションされ得る。前記増幅ステップでは、例えば、ＩＤタグの増幅配列に結合するプライマーが使用され得る。次いで、第２のＩＤタグは、後続の増幅ステップ中に、ＤＮＡポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換され得る。

【0115】

別の実施形態では、第２のタグの一部を示す一本鎖オリゴヌクレオチドは、増幅ステップにおいて、ｇＤＮＡから転写される一本鎖ＲＮＡにハイブリダイズし得る。第２のタグは、後続の増幅ステップ中に、ＤＮＡポリメラーゼ活性が相補鎖を合成することにより、二本鎖オリゴに変換さ得る。

【0116】

クロマチン修飾プール内の本質的に全てのｇＤＮＡ断片がタグ付けされることが可能である一方で、ｇＤＮＡ断片の画分のみがタグ付けされることも本発明に含まれることに留意されたい。

【0117】

第２のタグは、第２のバーコード配列及びｇＤＮＡ断片へのライゲーション、ハイブリダイゼーション、または増幅に有用な任意選択の追加配列を含み得る。かかる配列は、「増幅配列」とも呼ばれ得る。

【0118】

第２のバーコード配列は、４～２０ヌクレオチドの範囲、例えば６～１６ヌクレオチドの範囲であり得る。

【0119】

第２のバーコード配列に加えて、第２のタグは追加の配列を含有し得る。前記追加配列は、タグ付けプロセスを容易にし得る、すなわち、それらはタグをｇＤＮＡ断片に付着させるのを補助し得る。例えば、追加配列は、ｇＤＮＡ断片上またはＩＤタグでタグ付けされたｇＤＮＡ断片上の一本鎖末端にアニールすることができる一本鎖オーバーハングであり得る。特定の配列のｇＤＮＡ断片上の一本鎖末端は、例えば、該断片が制限酵素の補助によってもたらされる場合、または第１のＩＤタグが一本鎖オーバーハングを含有する場合に生成し得る。したがって、追加配列は、制限酵素によってもたらされた一本鎖オーバーハングに相補的な一本鎖オーバーハングであり得る。

【0120】

いくつかの実施形態では、第２のタグは、ＩＤタグと対照してｇＤＮＡ断片の反対側の末端に付加されることが好ましい。したがって、往々にして、第２のタグがｇＤＮＡ断片にライゲーションされる場合、ＩＤタグは、それがｇＤＮＡ断片にライゲーションされると、他の配列にはライゲーションできないように設計され得る。

【0121】

第２のＩＤタグは、増幅及び／またはシークエンシングに有用な追加の配列（複数可）も含み得る。本明細書において、かかる配列はそれぞれ、「増幅配列」及び「アダプター配列」とも呼ばれる。アダプター配列は、一般に、特定の方法に使用されるシークエンシング手法に応じて選択される。

【0122】

したがって、いくつかのシークエンシング法は、増幅ステップ、例えば、以下でより詳細に記載するように、ＰＣＲ、クローンＰＣＲまたは区画ＰＣＲを含む。かかる実施形態では、第２のタグは、プライマーにアニールすることができる配列を含む、アダプター配列を含み得る。かかる配列は、「プライマードッキング配列」とも呼ばれる。第１のＩＤタグと第２のＩＤタグの両方がプライマードッキング配列を含む場合、それらは、前記プライマードッキング配列間の配列を、前記プライマードッキング配列にアニールするプライマーペアを用いて増幅できるように選択され得る。

【0123】

いくつかのシークエンシング法は、典型的に１つ以上の固定されたオリゴヌクレオチドへのハイブリダイゼーションによる、ｇＤＮＡ断片を固定化するステップを含む。かかる実施形態では、第２のタグは、一本鎖であり、固定されたオリゴヌクレオチドの少なくとも１つにアニールすることができる、アダプター配列を含み得る。かかる配列は、「ハイブリダイゼーション配列」とも呼ばれる。第１のＩＤタグと第２のタグの両方がハイブリダイゼーション配列を含む場合、それらは同一の配列または異なる配列であり得る。それらが異なる配列である場合、それらは、異なる固定されたオリゴヌクレオチドに同時にアニールすることができ、それによってブリッジ増幅に有用なものとなる。

【0124】

第２のタグは、１本または２本の一本鎖オーバーハング（複数可）を任意選択で含有する、２本鎖オリゴヌクレオチドであり得る。第２のタグの一本鎖は、好ましくは、多くとも１００ヌクレオチド（多くとも７５ヌクレオチド等）、例えば多くとも５０ヌクレオチドを含有する。特に、第２のＩＤタグは、６～１００ヌクレオチドまたはヌクレオチド塩基対の範囲（６～７５ヌクレオチドまたはヌクレオチド塩基対の範囲等）、例えば６～５０ヌクレオチドまたはヌクレオチド塩基対の範囲からなるオリゴヌクレオチドからなり得る。

【0125】

タグ付け方法
一実施形態では、該方法は、ｇＤＮＡ断片に第１のＩＤタグ及び／または第２のタグ及び／または追加のタグをタグ付けすることを構成する。タグ付けは、典型的には、前記第１のＩＤタグ及び／または第２のタグをｇＤＮＡ断片にライゲーションすることを含む。あるいは、タグ付けはタグメンテーションによって行われ得るか、またはタグは増幅プロセスの一部として付加され得る。タグ付けはまた、増幅プロセスの一部としてなされてもよい。例えば、タグ付けは、増幅用の３’プライマーアニーリング配列及び５’タグ配列を含むプライマーを用いて達成することができる。したがって、タグは、元のｇＤＮＡ断片及び／または増幅によって作製されたｇＤＮＡ断片コピーに付加され得る。簡略化のために、本明細書で使用する場合、用語「ｇＤＮＡ断片」は、元のｇＤＮＡ断片及びそのコピーを総称し得る。

【0126】

また、タグが、例えば、上記方法の任意の組み合わせによって、複数のステップで付加されることも、本発明に含まれる。例えば、タグの一部はライゲーションによって付加され得、他方で、残りはプライマーの一部として増幅中に付加され得る。

【0127】

一実施形態では、該方法は、ｇＤＮＡ断片を、本明細書で上記したＩＤタグ及び第２のタグのいずれかであり得るＩＤタグ及び第２のタグでタグ付けすることを構成する。

【0128】

一実施形態では、該方法は、ｇＤＮＡ断片をＩＤタグでタグ付けすることを構成する。該方法の過程で、各タグ付きクロマチン断片のＩＤタグ及びｇＤＮＡ配列は、ＲＮＡに転写されてもよく、各タグ付きクロマチン断片により、同一の配列を有する１つ以上のＲＮＡ分子が生じる。次いで、第２のタグが、上で明記したようなオリゴヌクレオチドとして、元のｇＤＮＡ断片ではなく、タグ付きクロマチン断片のＲＮＡコピーに、ライゲーションされ得るか、またはハイブリダイズし得る。

【0129】

タグ付けは、オリゴヌクレオチドをｇＤＮＡ断片に付着させるのに有用な任意の手段によってなされ得る。往々にして、タグ付けは、例えば、Ｔ４ＤＮＡリガーゼ、Ｔ３ＤＮＡリガーゼ、Ｔ７リガーゼを含むがこれらに限定されないＤＮＡリガーゼを使用するといった、ＤＮＡリガーゼを使用するアダプターライゲーションを用いたライゲーションによって実施されることになる。別の実施形態では、前記タグ付けは、Ｔｎ５トランスポザーゼ、ＳｌｅｅｐｉｎｇＢｅａｕｔｙトランスポザーゼ、Ｔｎ７トランスポザーゼを使用するといった、トランスポゾン酵素を使用するアダプターライゲーションを用いて実施される。

【0130】

有用なタグ付け方法の例は、図７～１０に例示している。当業者であれば、これらの図に示された共通の一般的知識及び全体的なガイダンスに基づいて、使用する具体的な方法を変更することができるであろう。

【0131】

免疫沈降
本発明の方法は、特異的な抗体に結合するクロマチン断片を単離するステップを含む。前記ステップは、「免疫沈降」または「ＣｈＩＰ」とも呼ばれることがある。

【0132】

典型的には、免疫沈降は、各サンプルの少なくともいくつかのクロマチン断片が第１のＩＤタグでタグ付けされている、クロマチン断片の集約プールで実施される。したがって、該方法は、第１のＩＤタグでタグ付けされたクロマチン断片を組み合わせるステップを含み、それによって、種々の第１のバーコード配列を有するクロマチン断片のプールが生成し得る。上述のように、全てのクロマチン断片が第１のＩＤタグでタグ付けされることは必須ではなく、したがって、クロマチン断片のプールは、タグ付けされたクロマチン断片とタグ付けされていないクロマチン断片の両方を含み得る。

【0133】

一旦クロマチン断片のプールが生成すれば、前記プールは、免疫沈降に使用され得る。典型的には、クロマチン断片のプールはランダムなサブプールに分けられ、１つのサブプールはインプットサブプール（「インプット」）であり、他のサブプールは試験サブプールである。各サブプールは、全サンプルのクロマチンを代表する混合物を含有する。

【0134】

大部分が同一のクロマチン断片を含有する、複数の試験サブプール及びインプットサブプールを調製するためには、本明細書の上記「サンプル」の節で説明したように、サンプルは複数の細胞から調製されなければならないことに留意されたい。したがって、サンプルが１つの単一細胞からのみ調製された場合、免疫沈降の前にサンプルをいくつかのサブプールに分けることができない。かかるサンプルが複数のサブプールに分けられる場合、該サンプルは原則として各クロマチン断片を１つしか含有しないため、これらのサブプールの各々は、必然的に互いに異なるものにならざるを得ないはずである。したがって、サンプルは、少なくともサブプールの数に等しい細胞の数を含む細胞集団から調製されることが好ましい。換言すれば、好ましくは、サンプルは、本明細書の他の箇所で記載しているように、少なくとも提供される抗体の数プラス１に等しい細胞の数、さらにより好ましくは、少なくとも１００または少なくとも５００の細胞を含む細胞集団から調製される。

【0135】

各免疫沈降は、クロマチン修飾に特異的に結合する抗体を、タグ付きクロマチン断片のプールまたはそのランダムな画分を含むサブプール（「試験サブプール」とも呼ばれる）とインキュベートすることにより実施される。該方法は、複数の種々の抗体、例えば少なくとも５種の種々の抗体、少なくとも１０種の種々の抗体等（例えば、少なくとも１５種の種々の抗体）、５～１００種の範囲の種々の抗体等（例えば、５～５０種の範囲の種々の抗体）、１０～１００種の範囲の種々の抗体等（例えば、１０～５０種の範囲の種々の抗体）の使用を含む。

【0136】

上述のように、いくつかの実施形態では、クロマチン修飾のいくつかにおいては、ヒストンＰＴＭであることが好ましい。かかる実施形態では、種々のヒストンＰＴＭに結合する複数の抗体、例えば種々のヒストンＰＴＭに結合する少なくとも５種の種々の抗体、種々のヒストンＰＴＭに結合する少なくとも１０種の種々の抗体等（例えば、種々のヒストンＰＴＭに結合する少なくとも１５種の種々の抗体）、種々のヒストンＰＴＭに結合する５～１００種の範囲の種々の抗体等（例えば、種々のヒストンＰＴＭに結合する５～５０種の範囲の種々の抗体）、種々のヒストンＰＴＭに結合する１０～１００種の範囲の種々の抗体等（例えば、種々のヒストンＰＴＭに結合する１０～５０種の範囲の種々の抗体）が提供され、免疫沈降に用いられることが好ましい。

【0137】

典型的には、各抗体は試験サブプールと共にインキュベートされる。したがって、クロマチン断片のプールは、典型的には、抗体ごとに少なくとも１つの試験サブプールがあるように、十分であるランダムなサブプールにランダムに分けられる。例えば、クロマチン断片のプールは、Ｘ＋Ｙのランダムなサブプールにランダムに分けられてよく、ここで、Ｘは、免疫沈降用の種々の抗体の数であり、Ｙは、例えばインプットサブプールを含む、所望の追加サブプールの数である。したがって、Ｙは１～３（１等）であり得る。

【0138】

免疫沈降反応は、並行して実施され得る。各免疫沈降反応は、一般に、クロマチン修飾（例えば、ＰＴＭ）に特異的に結合する抗体を試験サブプールとインキュベートした後、抗体及びそれに結合する任意のクロマチン断片を試験サブプールの残りから分離する手順を構成する。種々の抗体インキュベーション反応は、通常、互いに物理的に分離される。分離を容易にするために、抗体は固体支持体に固定化され得る。かかる固体支持体の例としては、ビーズ、マイクロウェル等の容器の表面、またはマイクロ流体表面が挙げられるが、これらに限定されない。

【0139】

試験プールから分離次第、特定の抗体に結合するクロマチン断片が回収され得る。これらのサブプールの各々は、原則として、免疫沈降に用いた抗体に認識される特異的なクロマチン修飾を含むクロマチン断片のｇＤＮＡ断片のみを含むので、前記クロマチン断片のｇＤＮＡ断片を含む任意の組成物は、「クロマチン修飾サブプール」と呼ばれる。これらのクロマチン断片の全てまたは画分は、上記のように精製、選択、第２のタグによりタグ付け及び／または増幅され得る。

【0140】

本発明のいくつかの実施形態では、クロマチン修飾サブプールは、物理的に別々に維持される。かかる実施形態では、ほぼ同一数のｇＤＮＡ断片が、各クロマチン修飾サブプールからランダムに選択される。

【0141】

他の実施形態では、クロマチン修飾サブプールのいくつかまたは全てのｇＤＮＡ断片は、集約プールに混合される。これは特に、ｇＤＮＡ断片が第２のバーコードを含む第２のタグでタグ付けされる実施形態の場合であり、該第２のタグは、所与のｇＤＮＡ断片がどのクロマチン修飾サブプールに由来するかを識別するために使用することができる。

【0142】

かかる実施形態では、ｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片が、前記集約プールから選択されることが好ましい。

【0143】

クロマチン修飾に特異的に結合する莫大な数の適切な抗体が存在する。有用な抗体の例を以下に示す。

【0144】

抗体
免疫沈降に使用される抗体は、目的のクロマチン修飾に特異的に結合する任意の抗体であり得る。様々なクロマチン修飾に結合する多数の抗体が市販されている。あるいは、当業者であれば、目的のエピトープに特異的に結合する抗体を生成させる方法を認識している。

【0145】

抗体は、モノクローナル抗体、ポリクローナル抗体、免疫グロブリン、または免疫グロブリンの抗原結合断片等の任意の抗体であり得る。したがって、抗体は、クラスＩｇＧ、ＩｇＭ、ＩｇＡ、ＩｇＤもしくはＩｇＥの抗体、またはＦａｂ、Ｆ（ａｂ´）２、もしくはＦｄ断片を含む、その断片もしくは誘導体であり得る。また、抗体は、単鎖抗体、ドメイン抗体、ダイアボディ、二重特異性抗体、二機能性抗体及びその誘導体であり得る。典型的には、抗体は、３つのＣＤＲを含む可変領域を含むことになる。

【0146】

したがって、本発明の方法で使用されるべき各抗体は、本明細書の上記クロマチン修飾のいずれかを含む、またはそれからなるエピトープに結合し得る。特に、本発明の方法で使用されるべき抗体の１つ以上は、本明細書の上記翻訳後修飾（ＰＴＭ）のいずれかを含む、またはそれからなるエピトープに結合し得る。

【0147】

増幅
本明細書に開示される方法は、往々にして、クロマチン修飾サブプールのｇＤＮＡ断片を増幅するステップを含む。増幅プロセスは、元のタグ付きｇＤＮＡ分子またはその一部と同一の配列を有する新規ＤＮＡ分子の作製を必然的に伴う。

【0148】

各クロマチン修飾サブプールのｇＤＮＡ断片は、別々に増幅され得る。あるいは、１つ以上のクロマチン修飾サブプールを増幅前に集約してもよい。後者は通常、タグ付きｇＤＮＡ断片がどのクロマチン修飾サブプールに由来するかを識別可能にする第２のバーコードを含む、第２のタグで各クロマチン修飾サブプールのｇＤＮＡ断片がタグ付けされている場合にのみ行われる。

【0149】

増幅生成物は通常、元のタグ付きｇＤＮＡ配列の全体または一部を有する複数のＤＮＡ分子であるが、中間ステップでは、元のｇＤＮＡ配列から転写されたＲＮＡ分子コピーを生成することが必要とされ得、次いで、それが逆転写されて、元のｇＤＮＡ配列の全体または一部を有するＤＮＡ分子が作製される。

【0150】

増幅は、一般に、免疫沈降後に得られたクロマチン断片のタグ付きｇＤＮＡ断片に対して実施される。増幅は、第２のタグによるタグ付けの前または後に実施され得る。したがって、上記のように、第２のタグは、元のｇＤＮＡ断片に付加されるのではなく、代わりに、増幅を介して生成した前記ｇＤＮＡ断片のＤＮＡまたはＲＮＡコピーに付加され得る。対照として、インプットサブプール（「インプット」）のｇＤＮＡ断片が、クロマチン修飾サブプールのｇＤＮＡ断片と同一の様式で増幅され、別途処理され得る。一般に、増幅のいずれのステップも、全てのクロマチン修飾サブプール及びインプットサブプールに対して同一の様式で実施されることが好ましい。

【0151】

増幅は、任意の有用な手段、例えば、適切なプライマーを用いた、ポリメラーゼ連鎖反応法（ＰＣＲ）、ＲＮＡ中間体を介したリニア増幅法及び／または逆転写法によって実施され得る。

【0152】

プライマーは、一本鎖オリゴヌクレオチドである。上記のように、第１のＩＤタグ、及び／または第２のタグは、増幅に有用な増幅配列を含み得る。本明細書に開示される方法が増幅ステップを含む場合、ＩＤタグは通常、増幅配列を含む。次いで、増幅ステップは、前記増幅配列にアニールすることができるプライマーの助けによって実施され得る。

【0153】

いくつかの実施形態において、増幅は、ｇＤＮＡ断片を転写するステップを含む。かかる実施形態では、ＩＤタグは、典型的には、ＲＮＡポリメラーゼプロモーターを含む増幅配列を含む。これにより、ＲＮＡポリメラーゼがｇＤＮＡ断片を転写することができることになる。かかる実施形態では、該方法は、逆転写ステップをさらに含み得る。かかる方法の例を、図９のステップ３～５及び図１０のステップ３～４として示している。

【0154】

いくつかの実施形態において、増幅は、ＰＣＲステップを含む。かかる実施形態では、ＩＤタグは通常、プライマーがアニールすることができる増幅配列を含む。したがって、第１のプライマーは、ＩＤタグの増幅配列に対して同一または相補的な配列を含有し得る。加えて、第１のプライマーは、追加の配列、例えば、アダプター配列（上記の通り）を含有し得る。前記追加配列は、好ましくは、１００以下、５０以下等（例えば、２５以下）のヌクレオチドからなる。

【0155】

増幅に使用される第２のプライマーは、第２のタグの増幅配列（またはそれに相補的な配列）にアニールするプライマーであり得る。また、増幅に使用される第２のプライマーは、縮退プライマー、ユニバーサルプライマーまたはランダムプライマーの集合体であってもよい。上述の場合、前記プライマーは、好ましくは、ゲノム中の多くの異なる位置にアニールするように設計され、全ゲノムまたは少なくともゲノムのなるべく多くを可能な限り被覆する、ｇＤＮＡ断片の全体的な増幅を可能にするものである。前記縮退プライマー、ユニバーサルプライマーまたはランダムプライマーは、典型的にはかなり短く、例えば、５～１０ヌクレオチドの範囲（５～７ヌクレオチドの範囲等）であり、ゲノムの大部分を被覆するｇＤＮＡ断片の増幅確率を高める。このことは、特に、該方法がクロマチン修飾のグローバルレベルを評価するためのものである場合の例である。

【0156】

増幅に使用される第２のプライマーは、目的の１つ以上の遺伝子座に特異的なプライマーでもあり得る。このことは、特に、該方法がクロマチン修飾の局所レベルを評価するためのものである場合の例である。

【0157】

したがって、第２のプライマーは、第２のタグの増幅配列または目的の１つ以上の遺伝子座に特異的な配列（複数可）、あるいは変性配列に対して同一または相補的な配列を含有し得る。加えて、第２のプライマーは、追加の配列、例えば、第２のタグの一部及び／またはアダプター配列（上記の通り）を含有し得る。前記追加配列は、好ましくは、１００以下、５０以下等（例えば、２５以下）のヌクレオチドからなる。

【0158】

例えば、第１のプライマーは、以下に結合するプライマーであり得る：
－ＩＤタグ内の増幅配列
－第２のタグ内の増幅配列
－ゲノム配列
また、第１のプライマーは、変性配列またはランダム配列（複数可）にも結合し得る。

【0159】

同様に、第２のプライマーは、以下に結合するプライマーであり得る：
－ＩＤタグ内の増幅配列
－第２のタグ内の増幅配列
－ゲノム配列
また、第２のプライマーは、変性配列またはランダム配列（複数可）にも結合し得る。

【0160】

ＰＣＲによる増幅のために、第１及び第２のプライマーは、それらが共に、タグ付きｇＤＮＡ断片中の相補的配列の間に位置する配列の増幅をプライミングできるように選択される。

【0161】

したがって、該方法は、ｇＤＮＡ断片のコピーを得るために、ｇＤＮＡ断片の少なくとも一部、例えば、一本鎖タグ付きまたは二本鎖タグ付きｇＤＮＡ断片の少なくとも一部を増幅するステップを含み得、前記コピーは、好ましくは、下記の元のタグ付きｇＤＮＡ断片の少なくとも一部を含有する。

【0162】

使用されるプライマーがタグ中の増幅配列にアニールする場合、増幅は、ｇＤＮＡ配列それ自体について無差別に実施され得る。

【0163】

しかしながら、一実施形態では、増幅は、ｇＤＮＡに付加されたタグに存在するユニバーサル配列には依存しないが、１つ以上の特異的なゲノム配列に依存する。前記特異的なゲノム配列は、特異的なゲノム配列に相補的な配列を含む適切なプライマーを用いることによって選択され得る。それによって、前記配列を含む断片のみが増幅される。

【0164】

典型的には、増幅は、シークエンシングに先立って実施される。

【0165】

増幅は有用であり得るが、増幅が多すぎると、同一の配列が２回以上シークエンシングされるリスクが生じる。故に、同一のｇＤＮＡ断片のコピーが多数ある場合、同一のｇＤＮＡ断片がランダムに選択されて２回以上シークエンシングされ得る。したがって、ＰＣＲ増幅が、多くとも２０サイクル、５～２０の範囲のサイクル等（例えば５～１５の範囲のサイクル）で構成されることが好ましい。

【0166】

該方法が増幅ステップを含む場合、シークエンシングは、通常、前記増幅された断片に対して行われる。したがって、かかる実施形態では、シークエンシングされるのは、元のｇＤＮＡ断片それら自体ではなく、ｇＤＮＡ断片のコピーである。前記コピーは、元のｇＤＮＡ断片の正確なコピーではない可能性があるが、元のｇＤＮＡ断片の一部を欠く、及び／またはプライマーの一部として導入された追加の配列を含有する可能性があることに留意されたい。事態を単純化するために、用語「ｇＤＮＡ断片」は、元のｇＤＮＡ断片ならびにそのコピーの両方を指し得る。元のｇＤＮＡ断片のコピーは、それらが少なくとも第１のバーコード配列ならびにＵＭＩ配列及び／または固有のものであるかどうかを確証するのに十分に長い（すなわち、少なくとも１０、少なくとも１５ヌクレオチド長等）ｇＤＮＡ配列の少なくとも一部を含有する場合にのみ、「ｇＤＮＡ断片」であるとみなされる。好ましくは、元のｇＤＮＡ断片のコピーは、それらが少なくとも第１のバーコード配列ならびにｇＤＮＡ配列を含有する場合にのみ、「ｇＤＮＡ断片」であるとみなされる。ＩＤタグがＵＭＩを含有する実施形態では、元のｇＤＮＡ断片のコピーは、好ましくは、それらが少なくとも第１のバーコード配列及びＵＭＩ配列を含有する場合にのみ、より好ましくは、それらが少なくとも第１のバーコード配列、ＵＭＩ配列及び固有のものであるかどうかを確証するのに十分に長い（すなわち、少なくとも１０、少なくとも１５ヌクレオチド長等）ｇＤＮＡ配列の少なくとも一部を含有する場合にのみ、「ｇＤＮＡ断片」であるとみなされる。第２のタグが第２のバーコードを含む実施形態では、元のｇＤＮＡ断片のコピーは、好ましくは、それらが少なくとも第１のバーコード配列及び第２のバーコード、ならびにＵＭＩ配列及び固有のものであるかどうかを確証するのに十分に長い（すなわち、少なくとも１０、少なくとも１５ヌクレオチド長等）ｇＤＮＡ配列の少なくとも一部を含有する場合にのみ、「ｇＤＮＡ断片」であるとみなされる。

【0167】

ｇＤＮＡ断片のランダムな選択
上で詳細に説明したように、クロマチン修飾サブプールが準備され、ここで、各クロマチン修飾サブプールは、原則として、特定のクロマチン修飾を含むクロマチン断片のｇＤＮＡ断片のみを含有する。該方法が上記のように増幅ステップを含む場合、シークエンシングのために選択される前記ｇＤＮＡ断片は、元のタグ付きｇＤＮＡ断片であってもよいし、または元のｇＤＮＡ断片のコピーもしくは両方の混合物であってもよく、前記コピーは、上の「増幅」の節に記載のｇＤＮＡ断片であり得る。

【0168】

試験サブプールのｇＤＮＡ断片の調製と並行して、インプットサブプールは、同一の処理（例えば、タグ付け）に供され、免疫沈降には供されないことが予期される。そのようにして、インプットサブプールを、対照または参照として使用することができる。

【0169】

一実施形態では、該方法は、各クロマチン修飾サブプール及びインプットサブプールのｇＤＮＡ断片に第２のタグをタグ付けするステップを含み、１つのクロマチン修飾サブプール／インプットサブプール内のｇＤＮＡ断片は、同一の第２のバーコード配列を含む第２のタグでタグ付けされ、異なる第２のバーコード配列が、各クロマチン修飾サブプールまたはインプットサブプールに対して使用される。この手順は、上でより詳細に説明している。

【0170】

かかる実施形態では、第２のバーコードを、所与のｇＤＮＡ断片がどのクロマチン修飾サブプールに由来するかを識別するために使用することができる。

【0171】

いくつかの実施形態において、該方法は、１つ超のクロマチン修飾サブプール及びインプットサブプールのタグ付きｇＤＮＡ断片をプールするステップを含む。該方法が上記のような増幅ステップを含む場合、前記プールは、前記増幅の前または後に実施され得る。したがって、プールされるのは、元のタグ付きｇＤＮＡ断片であってもよいし、または元のタグ付きｇＤＮＡ断片のコピーもしくは両方の混合物であってもよく、前記コピーは、上の「増幅」の節に記載のｇＤＮＡ断片であり得る。

【0172】

好ましくは、該方法は、全てのクロマチン修飾サブプール及びインプットサブプールのｇＤＮＡ断片をプールすることによって、ｇＤＮＡ断片のプールを生成するステップを含み得る。これは特に、各クロマチン修飾プール及びインプットサブプールのｇＤＮＡ断片が、第２のＩＤタグでタグ付けされている本発明のかかる実施形態に関連し得る。かかる実施形態では、ｇＤＮＡ断片のプールは、ｇＤＮＡ断片がどのサンプルに由来するかを識別するために使用することができる第１のＩＤタグ、及びどのクロマチン修飾がｇＤＮＡ断片と関連していたかを識別するために使用することができる第２のＩＤタグでタグ付けされたｇＤＮＡ断片を含むことになる。

【0173】

次いで、該方法は、試験サンプルあたり、１００～１００，０００の範囲（２００～１００，０００の範囲等）、例えば多くとも５０，０００（多くとも２０，０００等）、例えば２００～５０，０００の範囲、例えば１０００～５０，０００の範囲（５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片を前記プールからランダムに選択するステップを含む。したがって、ｎ個のサンプルが本発明の方法によって解析されるならば（すなわち、ステップａにおいてｎ個の試験サンプルが提供されるならば）、その場合、ｎ掛けるタグ付きｇＤＮＡ断片の前述の数がランダムに選択される。各試験サンプルに対して、厳密に同じ量のタグ付きｇＤＮＡ断片が提供されていることは要求されない。タグ付きｇＤＮＡ断片がランダムに選択されることで十分であり、これにより、様々な試験サンプルが代表されることが確実になる。

【0174】

したがって、換言すれば、該方法は、ｎ掛ける１００～１００，０００の範囲（ｎ掛ける２００～１００，０００の範囲等）、例えば多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける２００～５０，０００の範囲、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片を前記プールからランダムに選択するステップを含み得、ここで、ｎは、ステップａ．において提供された試験サンプルの数である。

【0175】

厳密な数のｇＤＮＡ断片がシークエンシングのために選択されることは要求されない。おおよその数のｇＤＮＡ断片が選択されれば十分である。シークエンシングのためにｇＤＮＡ断片をランダムに選択するための自明の手順は、予想される数の分子を含む体積を分取することである。

【0176】

いくつかの実施形態では、シークエンシングのためにランダムに選択されるタグ付きｇＤＮＡ断片の数は、クロマチン修飾サブプールの数に依存する。したがって、一実施形態では、本発明の方法は、ｎ掛けるｍ掛ける１００～１００，０００の範囲、例えば多くともｎ掛けるｍ掛ける５０，０００（多くともｎ掛けるｍ掛ける２０，０００等）、例えばｎ掛けるｍ掛ける１０００～５０，０００の範囲（ｎ掛けるｍ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片を前記プールからランダムに選択することを含み、ここで、ｎは、ステップａ．において提供された試験サンプルの数であり、ｍは、クロマチン修飾サブプールの数であり、及び／またはｍは、ステップｅ．で提供された抗体の数である。前記選択された断片は、次いで、シークエンシングに供される。

【0177】

一実施形態では、本発明の方法は、クロマチン修飾サブプールごとの試験サンプルあたり、ｎ掛けるｍ掛ける２００～１００，０００の範囲、例えば多くともｎ掛けるｍ掛ける５０，０００（多くともｎ掛けるｍ掛ける２０，０００等）、例えばｎ掛けるｍ掛ける２００～５０，０００の範囲、例えばｎ掛けるｍ掛ける１０００～５０，０００の範囲（ｎ掛けるｍ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片を前記プールからランダムに選択することを含み、ここで、ｎは、ステップａ．において提供された試験サンプルの数であり、ｍは、クロマチン修飾サブプールの数であり、及び／またはｍは、ステップｅ．で提供された抗体の数である。前記選択された断片は、次いで、シークエンシングに供される。

【0178】

したがって、ｎ個のサンプルが本発明の方法によって解析され（すなわち、ステップａにおいてｎ個の試験サンプルが提供され）、ｍ種の種々の抗体が提供されるならば、その場合、ｎ掛けるｍ掛けるタグ付きｇＤＮＡ断片の前述の数がランダムに選択される。

【0179】

他の実施形態では、様々なクロマチン修飾サブプールのｇＤＮＡ断片は、プールに集約されない。かかる場合、前述の数のｇＤＮＡ断片が、クロマチン修飾サブプールからランダムに選択される。これは、シークエンシングのために、各サブプールからほぼ同数のｇＤＮＡ断片が選択されるような様式で、往々にして行われる。ほぼ同数のｇＤＮＡ断片分子をランダムに選択するための自明の手順は、予想される数の分子を含む体積を分取することである。例えば、同一の体積が各クロマチン修飾サブプール及びインプットサブプールから分取され得る。しかしながら、該方法は、典型的には、各クロマチン修飾サブプールにおける各第１のバーコードの割合またはパーセンテージを決定することを含むため、同数のｇＤＮＡ断片がクロマチン修飾サブプールごとにシークエンシングされることは要求されない。典型的には、少なくとも１００（少なくとも２００等）、例えば少なくとも１０００、多くとも１００，０００等、例えば多くとも５０，０００（多くとも１０，０００等）のｇＤＮＡ断片が、各クロマチン修飾サブプールからランダムに選択される。特に、ｎ掛ける１００～１００，０００、例えば多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片が、各クロマチン修飾サブプールからランダムに選択され、シークエンシングされる。ここで、ｎは、ステップａ．において提供された試験サンプルの数である。

【0180】

例として、用語「ｎ掛ける１００～１００，０００」は、「ｎ×１００～ｎ×１００，０００」を意味し、用語「ｎ掛けるｍ掛ける１００～１００，０００」は、「（ｎ×ｍ×１００）～（ｎ×ｍ×１００，０００）」を意味する。

【0181】

シークエンシング
ランダムに選択されたタグ付きｇＤＮＡ断片は、次いで、シークエンシングされる。ランダムに選択するステップとシークエンシングするステップが組み合わされ、同時に実施されることも本発明内に含まれる。ｇＤＮＡ断片全体をシークエンシングすることは要求されない。しかし、一般的には、少なくとも第１のバーコード配列は、ｇＤＮＡ断片が固有のｇＤＮＡ断片であるかどうかを確証するのに十分な配列と共にシークエンシングされる。シークエンシングステップは、以下に説明するように、増幅ステップを含み得る。前記増幅は、シークエンシングのためにｇＤＮＡ断片をランダムに選択する前に実施される、任意の増幅に加えて実施され得る。いくつかの実施形態では、タグ付きｇＤＮＡ断片の一部のみが増幅され、その場合、前記増幅部分またはその断片のみがシークエンシングされる。

【0182】

シークエンシングされるべき最小限の部分は、以下で説明する。

【0183】

本発明のいくつかの実施形態において、第１のＩＤタグは、上記の通りのＵＭＩ配列を含む。第１のＩＤタグがＵＭＩ配列を含む場合、前記ＵＭＩ配列は、タグ付きｇＤＮＡ断片が固有のｇＤＮＡ断片であるかどうかを確証するために、単独でまたはｇＤＮＡ配列と組み合わせて使用され得る。かかる実施形態では、
・少なくとも第１のバーコード配列及びＵＭＩ配列、または
・少なくとも第１のバーコード配列及びＵＭＩ配列ならびにｇＤＮＡ配列全体等のｇＤＮＡ配列の少なくとも一部がシークエンシングされる。

【0184】

第１のＩＤタグがＵＭＩ配列を含まない実施形態では、第１のバーコード配列ならびにｇＤＮＡ配列全体等のｇＤＮＡ配列の少なくとも一部がシークエンシングされる。

【0185】

本発明のいくつかの実施形態では、ｇＤＮＡは、第１のＩＤタグと第２のＩＤタグの両方でタグ付けされる。かかる実施形態では、少なくとも第１のバーコード配列及び第２のバーコード配列は、ＵＭＩ配列及び／またはｇＤＮＡ配列の全体等の少なくとも一部と共にシークエンシングされる。

【0186】

いくつかの実施形態では、タグ付きｇＤＮＡ断片全体がシークエンシングされる。

【0187】

シークエンシングは、任意の有用な方法によって実施され得る。例えば、シークエンシングは、直接的な単一分子シークエンシング（例えば、ナノポアシークエンシング）により行われてもよい。

【0188】

好ましくは、シークエンシングは、大量並行シークエンシングを用いて行われる。大量並行シークエンシングは、次世代シークエンシング（ＮＧＳ）または第２世代シークエンシングとしても知られている。大量並行シークエンシングは、空間的に分離された多数のＤＮＡ鋳型の並列シークエンシングに関与する。いくつかの実施形態では、ｇＤＮＡは、上記の通りの第１のＩＤタグ及び第２のＩＤタグでタグ付けされる。かかる実施形態では、二重にタグ付けされたｇＤＮＡ断片は、プールされ、大量並行シークエンシング技術を使用して、まとめてシークエンシングされ得る。

【0189】

適用される特定の大量並行シークエンシング技法に応じて、ｇＤＮＡ断片は、シークエンシングに先立って増幅されることがある。典型的に、増幅は、原則として、所与のｇＤＮＡ断片のコピー全てが、他のｇＤＮＡ断片のコピーから空間的に分離されるような、クローン的または空間的に分離される様式で実施される。これは、例えば、エマルジョンＰＣＲ、ドロップレットＰＣＲによって、グリッドローリングサークル増幅（ｇｒｉｄｄｅｄｒｏｌｌｉｎｇｃｉｒｃｌｅａｍｐｌｉｃａｔｉｏｎ）によって、またはブリッジ増幅によって実現することができる。特に、増幅は、本明細書における以下「増幅」の節に記載の通り実施され得る。

【0190】

次いで、鋳型がシークエンシングされる。パイロシークエンシング、可逆的終結化学作用によるシークエンシング、ライゲーションによるシークエンシング、リン酸結合蛍光ヌクレオチドを用いたシークエンシング、及び／またはリアルタイムシークエンシングを含むがこれらに限定されない、シークエンシングそれ自体についての異なる技術も利用できる。

【0191】

本発明の一実施形態では、シークエンシングは、可逆的終結化学作用を使用して行われる。かかる方法は、一般に、一本鎖ｇＤＮＡ断片を鋳型として使用する、相補鎖の合成を含む。用いられるｄＮＴＰは、種々のラベル（例えば、蛍光ラベル）に結合され、ここで、１種のラベルは、ｄＮＴＰの各種類に対して使用される。ラベルは「ブロッキング基」として機能するように結合され、該結合は可逆的であるべきである。したがって、一度に１つのｄＮＴＰのみを添加し、ラベルを使用してｄＮＴＰの種類を決定することができる。次いで、ラベルが除去され、次のｄＮＴＰが添加される。

【0192】

有用な大量並行シークエンシングプラットフォームが市販されており、Ｒｏｃｈｅ４５４、ＧＳＦＬＸＴｉｔａｎｉｕｍ、Ｉｌｌｕｍｉｎａｄｙｅｓｅｑｕｅｎｃｉｎｇ、ＬｉｆｅｔｅｃｈｎｏｌｏｇｉｅｓＩｏｎｐｒｏｔｏｎ、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓ、ＨｅｌｉｃｏｓＢｉｏｓｃｉｅｎｃｅｓＨｅｌｉｓｃｏｐｅまたはＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓＳＭＲＴが挙げられるが、これらに限定されない。

【0193】

好ましい実施形態では、シークエンシングは、Ｍａｒｄｉｓ（２０１７）に記載されているような、Ｉｌｌｕｍｉｎａｄｙｅｓｅｑｕｅｎｃｉｎｇを用いて実施される。

【0194】

興味深いことに、本発明は、ｇＤＮＡ断片の小規模なランダムサブセットのみをシークエンシングすることで十分であることを開示するものである。したがって、サンプルあたり、１００，０００未満（５０，０００未満等、２０，０００未満等）のｇＤＮＡ断片をシークエンシングすることで十分である。上述のように、典型的には、１００～１００，０００の範囲（２００～１００，０００の範囲等）、例えば２００～５０，０００の範囲、例えば１０００～５０，０００の範囲（５０００～２０，０００の範囲等）の上記ｇＤＮＡ断片もしくはその一部またはそのコピーがシークエンシングされる。結果としてのゲノム被覆率が極めて乏しいにもかかわらず、本発明は、データが、各サンプルのエピゲノムについての正確なサブサンプルを提供するものであることを示す。

【0195】

したがって、一般に、該方法は、シークエンシグステップであって、各サンプルに対してシークエンシグされる固有のタグ付きｇＤＮＡ断片の数が、それら全体で参照ゲノム塩基の１０％以下を被覆するように少数である、前記シークエンシグステップを伴う。参照ゲノムは、サンプルが由来する種と同一の種によるものであるように選択される。有用な参照ゲノムは、例えば、ヒトゲノムｈｇ３８またはマウスｍｍ１０である。

【0196】

固有のｇＤＮＡ断片
ｇＤＮＡ断片のある画分しかシークエンシグされないとしても、それでもなお該方法は、各サンプルの各クロマチン修飾のグローバルレベルを正確に定量化することを可能にする。

【0197】

該方法は、各サンプル及びクロマチン修飾サブプールの固有のタグ付きｇＤＮＡ断片の数を測定するステップを含む。特定のサンプルへのｇＤＮＡ断片の割り当ては、ＩＤタグのバーコード配列を使用して行われ得る。特定のクロマチン修飾プールへのｇＤＮＡ断片の割り当ては、各クロマチン修飾プールを別々に取り扱うことによるか、または第２のバーコード配列を使用することによるかのいずれかで行われ得る。サンプルとクロマチン修飾との組み合わせの各々について、固有のタグ付きＤＮＡ断片の数がカウントされる。この数は、「カウント」とも呼ばれる。

【0198】

同様に、各サンプルについて、インプットサブプールの固有のｇＤＮＡ断片の数を測定することによって、参照カウントが決定される。

【0199】

どのｇＤＮＡ断片を「固有」とみなしてよいかを決定するために、異なる判断基準を使用してもよい。

【0200】

好ましい実施形態では、固有のタグ付きｇＤＮＡ断片は、固有のＵＭＩ配列、及びｇＤＮＡ断片配列に基づく参照ゲノムにおける固有のマッピング位置により識別される断片である。

【0201】

別の実施形態では、固有のＵＭＩ配列のみを使用して、固有のタグ付きｇＤＮＡ断片の数をカウントすることが可能である。かかる実施形態では、ｇＤＮＡ配列は参照ゲノムにマッピングされず、代わりに、固有のタグ付きｇＤＮＡ断片は、単に固有のＵＭＩ配列だけで識別される。かかる実施形態では、ｇＤＮＡ配列それ自体がシークエンシグされる必要はない。タグをシークエンシグすることで十分である。注目すべきことに、この実施形態では、複数のサンプルにわたる相対グローバルレベルを決定するために、研究される生物のゲノム配列情報を必要としない。

【0202】

さらに別の実施形態では、固有のタグ付きｇＤＮＡ断片は、単にゲノム内の固有のマッピング位置だけで識別される断片である。かかる実施形態では、ＵＭＩ配列の使用は要求されない。

【0203】

したがって、該方法は、マッピングするステップを含み得るが、これは任意選択のステップである。マッピングは、ｇＤＮＡ配列の参照ゲノムへのマッピングに関与する。参照ゲノムは、サンプルが由来する種と同一の種によるものであるように選択される。有用な参照ゲノムは、例えば、ヒトゲノムｈｇ３８またはマウスｍｍ１０である。参照ゲノム中の異なる位置にマッピングしているｇＤＮＡ断片は、固有であるとみなされる。マッピングは、通常、各サンプル及び各抗体反応について、マッピングされた固有のタグ付きｇＤＮＡ断片の数をカウントすることを含む。

【0204】

クロマチン修飾レベルの定量化
グローバルレベルは、一般的に、インプットサブプールの各サンプルに由来する固有タグ付きｇＤＮＡ断片のカウントと比較した、各免疫沈降に対する各サンプルに由来する固有ｇＤＮＡ断片のカウントの比として計算される。比が高くなるほど、免疫沈降に使用される抗体によって特異的に認識されるクロマチン修飾のグローバルレベルが高くなることを指し示す。

【0205】

概して、本発明の方法は定量的である。したがって、該方法は、好ましくは、参照と比較した任意の所与のクロマチン修飾の特異的倍率差を提供するものである。特異的倍率差は、特に、以下に記載の通りに計算され得る。

【0206】

典型的には、比は、各クロマチン修飾サブプールの固有の配列の総カウントを測定することによって計算される。次いで、所与のクロマチン修飾サブプール内の第１のバーコード配列の各々を含有する固有の配列の頻度（しばしば、パーセンテージとして提供される）が決定される。前記頻度（パーセンテージ）は、次いで、各クロマチン修飾サブプール内で比較されて、倍率差が決定され得る。これは、特に、全てのバーコード配列が、インプットプールにおいて全く同じ頻度またはほぼ同じ頻度で含有される場合に行うことができる。例として、クロマチン修飾サブプール１で見出された固有の配列の総カウントのうち４％が、サンプル１の第１のバーコードを有し、クロマチン修飾サブプール１で見出された固有の配列の総カウントのうち２％が、サンプル２の第１のバーコードを有するならば、その場合、サンプル１は、サンプル２と比較して２倍のクロマチン修飾１のレベルを有する。

【0207】

往々にして、個々のバーコード配列は、インプットプールにおいて全く同じ頻度またはほぼ同じ頻度で含有されていない。したがって、該方法は、インプット正規化固有リードカウント（ＩＮＲＣ）を計算するステップを含むことが、往々にして好ましい。ＩＮＲＣは、クロマチン修飾サブプール内の各第１のバーコード配列を含有する固有の配列の頻度を、インプットサブプールにおける同一の第１のバーコード配列を含有する固有の配列の頻度に対して正規化したものである。したがって、ＩＮＲＣは、クロマチン修飾サブプールにおける第１のバーコード配列の頻度を、インプットサブプールにおける同一の第１のバーコード配列の頻度で割ることにより決定することができる。例として、クロマチン修飾サブプール１で見出された固有の配列の総カウントのうち４％が、サンプル１の第１のバーコードを有し、インプットサブプールで見出された固有の配列の総カウントのうち２％が、サンプル１の第１バーコードを有するならば、その場合、クロマチン修飾１に関するサンプル１のＩＮＲＣは、２である。

【0208】

次いで、あるサンプルの所与のクロマチン修飾に関するＩＮＲＣを別のサンプルと比較することにより、サンプル間の倍率差が決定され得る。

【0209】

したがって、サンプルＸで見出されたクロマチン修飾のサンプルＹと比較した比は、以下の式を用いて計算され得る：

【数1】

ここで、サンプルＸのｇＤＮＡ断片は、第１のバーコードＸを含むＩＤタグでタグ付けされ、サンプルＹのｇＤＮＡ断片は、第１のバーコードＹを含むＩＤタグでタグ付けされる。

【0210】

ＩＮＲＣ及びＩＮＲＣ比は、複数のサンプルにわたり、グローバルレベルを定量的に比較することを可能にする、単位がない値である。

【0211】

ランダムに選択した少数の配列のみを使用したことを除いて、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載された通りに生成した、極めて乏しい配列データを使用する標準曲線は、ＩＮＲＣが、一般的に、各サンプルにおけるエピトープの真の量に、直線的に相関するまたは比例することを実証している（実施例１、図５を参照されたい）。したがって、２つのサンプル間の定量的な差は、２つのサンプルについて計算されたＩＮＲＣの比として正確に導き出すことができる。かかる計算の例を、実施例２及び図４に示している。さらに、図４では、クロマチン修飾のレベルだけでなく、ＩＮＲＣを計算する例も記載している。当業者であれば、複数のサンプルが解析される状況に対しては、１つの処理のみが示されている図４に示した例から推論することができるであろう。

【0212】

本明細書に記載の方法により、所与のクロマチン修飾の量全てが、所与のプール内の全てのサンプルについて互いに比較して得られる。所与のクロマチン修飾の絶対量を決定するために、前記クロマチン修飾の絶対量が既知である参照サンプルが、該方法に含まれ得る。参照サンプルにおいて所与のクロマチン修飾の絶対量が既知である場合、本明細書に開示される方法を用いて、同一プール内の他の全てのサンプルについて、所与のクロマチン修飾の絶対量を正確に計算することができる。しかし、複数のサンプルにおけるクロマチン修飾のレベルを互いに比較して正確に決定するためには、絶対量が既知の参照サンプルは必要とされない。クロマチン修飾の絶対量が既知の参照サンプルは、例えば、各ｇＤＮＡが、クロマチン修飾の０または２つの実例ではなく、１つの実例と関連している、合成的に産生されたクロマチン断片で構成され得る。

【0213】

本発明は、上記の定量化手順が、１００～１０００００の間のリード数等、非常に少量のシークエンスリードのみを使用して、クロマチン修飾のレベルを確信的かつ正確に定量化するために実施され得ることを主張するものである。実施例６は、各々が三重のサンプルに存在する、２つの条件間のクロマチン修飾の差が、サンプルあたり２００～１０００の範囲のわずかな固有のリードを使用して、確信的（すなわち、統計的に有意）かつ正確に決定できることを実証している。

【0214】

該方法は、特に、ゲノム全体にわたるクロマチン修飾（複数可）のグローバルレベルを決定するのに有用である。該方法が、ゲノム全体にわたるクロマチン修飾（複数可）のグローバルレベルを決定するためのものである場合、シークエンシングのためのｇＤＮＡ断片は、原則として、サンプルの全てのｇＤＮＡ断片から完全にランダムに選択される。クロマチン修飾のグローバルレベルを計算する方法の一例を図４に示す。クロマチン修飾のグローバルレベルを決定するための方法に有用なタグ付け、増幅及びシークエンシングステップの例を、図７及び９に提供する。

【0215】

しかし、いくつかの実施形態では、該方法は、クロマチン修飾の局所レベルを決定するために使用される。かかる実施形態では、目的の１つ以上の遺伝子座のｇＤＮＡ断片のみが、シークエンシングのために選択される。

【0216】

一実施形態では、シークエンシングのためのｇＤＮＡ断片の選択は、全てのｇＤＮＡ断片からのランダムな選択を通じては実行されず、選択に使用されるプライマー配列に相補的なＤＮＡ配列の存在に基づくクロマチン断片の選択を介して実行される。１つのゲノム遺伝子座または多数の遺伝子座を選択するために、１つ以上のプライマー配列が使用され得る。次いで、該方法により、クロマチン修飾の量全てが、所与のプール内の全てのサンプルについて、全ての選択されたゲノム遺伝子座において互いに比較して得られる。特に、クロマチン修飾（複数可）の局所レベルの決定には、目的の遺伝子座のｇＤＮＡ断片のみが増幅される、ｇＤＮＡ断片の増幅ステップが必要とされ得る。クロマチン修飾のグローバルレベルを決定するための方法に有用なタグ付け、増幅及びシークエンシングステップの例を、図２、８及び１０に提供する。

【0217】

条項
本発明は、以下の条項のいずれかによってさらに定義され得る。
１．複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
ａ．クロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を任意選択で増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．前記クロマチン修飾サブプールから、ステップａ．において提供されたサンプルあたり１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップ、
ｋ．各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【0218】

２．複数のサンプルにおける複数のクロマチン修飾のレベルを並行して評価する方法であって、以下のステップを含む前記方法。
ａ．複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の固有の分子識別子（ＵＭＩ）配列を含むオリゴヌクレオチドであり、各ＩＤタグは、異なるＵＭＩ配列及び任意選択の追加の配列を含み、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を任意選択で増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．各クロマチン修飾サブプールから、ｎ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きｇＤＮＡ断片を集約プールにプールし、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｍはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップであって、
ｉ．少なくとも前記第１のバーコード配列ならびに
ｉｉ．前記ＵＭＩ配列及び／または前記ｇＤＮＡ配列の一部
をシークエンシングし、ここで、固有のタグ付きｇＤＮＡ断片は、固有のＵＭＩ及び／または固有のｇＤＮＡ配列のいずれかを含む、前記測定するステップ、
ｋ．各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【0219】

３．複数のサンプルにおいて、１つ以上の目的の遺伝子座における複数のクロマチン修飾の局所レベルを並行して評価する方法であって、以下のステップを含む前記方法。
ａ．複数の細胞を含む細胞集団に由来するクロマチンを含む、複数の試験サンプルを提供するステップであって、前記サンプルは、互いに物理的に分離されている、前記提供するステップ、
ｂ．各サンプルのクロマチンをクロマチン断片に断片化するステップであって、各クロマチン断片は、二本鎖ゲノムＤＮＡ（ｇＤＮＡ）断片及び任意選択の関連タンパク質を含む、前記断片化するステップ、
ｃ．各サンプル内の前記ｇＤＮＡ断片の少なくともある画分を、ＩＤタグでタグ付けするステップであって、前記ＩＤタグは、バーコード配列及び任意選択の追加の配列を含むオリゴヌクレオチドであり、１サンプル内のｇＤＮＡ断片は、同一のバーコード配列を含むＩＤタグでタグ付けされ、各サンプルに対しては、異なるバーコード配列が使用される、前記タグ付けするステップ、
ｄ．前記タグ付きクロマチン断片を集約してタグ付きクロマチン断片のプールを生成するステップ、
ｅ．各々がクロマチン修飾に特異的に結合する、複数の種々の抗体を提供するステップ、
ｆ．各抗体を、前記タグ付きクロマチン断片のプールまたはそのランダムなサブプールと共にインキュベートするステップ、
ｇ．各抗体に結合しているクロマチン断片を得ることにより、前記抗体によって認識された前記クロマチン修飾を含むクロマチン断片のタグ付きｇＤＮＡ断片を含むサブプール（「クロマチン修飾サブプール」と呼ぶ）を得るステップ、
ｈ．増幅のために目的の各遺伝子座に特異的な少なくとも１つのプライマーを使用する、前記クロマチン修飾サブプール中の前記タグ付きｇＤＮＡ断片の少なくともある画分を増幅するステップであって、それによりｇＤＮＡ断片のコピーを得る（前記ｇＤＮＡ断片及びその前記コピーをまとめて「ｇＤＮＡ断片」と呼ぶ）、前記増幅するステップ、
ｉ．前記クロマチン修飾サブプールから、１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数である、前記ランダムに選択するステップ、または
全てのクロマチン修飾サブプールのタグ付きｇＤＮＡ断片を集約プールにプールし、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片をランダムに選択するステップであって、ここで、ｎはステップａ．において提供されたサンプルの数であり、ｍはクロマチン修飾サブプールの数である、前記ランダムに選択するステップ、
ｊ．前記選択されたタグ付きｇＤＮＡ断片の各々の少なくとも一部をシークエンシングし、各クロマチン修飾サブプールの各バーコード配列を含む固有のタグ付きｇＤＮＡ断片の数を測定するステップ、
ｋ．目的の各遺伝子座について、各クロマチン修飾サブプール内の各バーコード配列を含むｇＤＮＡ断片の頻度を計算するステップであって、
バーコード配列を含むｇＤＮＡ断片の頻度が高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける、前記目的の遺伝子座での前記クロマチン修飾のレベルが高いことを指し示す、前記計算するステップ。

【0220】

４．ステップｉ）は、ｎ掛けるｐ掛ける１０～１００，０００のタグ付きｇＤＮＡ断片、ｎ掛けるｐ掛ける１００～１００，０００等、例えば多くともｎ掛けるｐ掛ける５０，０００、多くともｎ掛けるｐ掛ける２０，０００等、例えばｎ掛けるｐ掛ける１０～５０，０００の範囲、ｎ掛けるｐ掛ける１００～２０，０００の範囲等のタグ付きｇＤＮＡ断片を選択することを含み、ここで、ｐは目的の遺伝子座の数である、条項３に記載の方法。

【0221】

５．ステップｉ）は、ｎ掛けるｍｐ掛ける１０～１００，０００のタグ付きｇＤＮＡ断片、ｎ掛けるｍ掛けるｐ掛ける１００～１００，０００等、例えば多くともｎ掛けるｍ掛けるｐ掛ける５０，０００、多くともｎ掛けるｍ掛けるｐ掛ける２０，０００等、例えばｎ掛けるｍ掛けるｐ掛ける１０～５０，０００の範囲、ｎ掛けるｍ掛けるｐ掛ける１００～２０，０００の範囲等のタグ付きｇＤＮＡ断片を選択することを含み、ここで、ｐは目的の遺伝子座の数である、条項３に記載の方法。

【0222】

６．ステップｄ．は、前記プールをランダムなサブプールに分けることをさらに含み、ここで、少なくとも１つのサブプールはインプットサブプールであり、他のサブプールは試験サブプールであり、また、ステップｆ．は、各抗体をランダムな試験サブプールと共にインキュベートすることを含む、先行条項のいずれか１項に記載の方法。

【0223】

７．前記ステップｉ．は、ｎ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片（ここで、ｎは、ステップａ．において提供されたサンプルの数である）を前記インプットサブプールからランダムに選択することをさらに含み、また、ステップｊ．は、前記インプットサブプールから選択された前記ｇＤＮＡ断片をシークエンシングし、前記インプットサブプールの各バーコード配列を有する固有のｇＤＮＡ断片の数を測定することをさらに含み、また、ステップｋ．は、各クロマチン修飾サブプールにおける各バーコード配列を含むｇＤＮＡ断片の頻度を、前記インプットサブプールにおける同一のバーコードを含むｇＤＮＡ断片の頻度で割ることにより、インプット正規化リードカウント（ＩＮＲＣ）を決定することをさらに含み、ここで、バーコード配列のＩＮＲＣが高いほど、前記バーコード配列を含むＩＤタグでタグ付けされた前記サンプルにおける前記クロマチン修飾のレベルが高いことを指し示す、条項２に記載の方法。

【0224】

８．サンプルＹにおけるクロマチン修飾のレベルと比較した、サンプルＸにおけるクロマチン修飾のレベルが、以下の式：

【数2】

によって決定され、ここで、サンプルＸの前記ｇＤＮＡ断片は、バーコードＸを含むＩＤタグでタグ付けされ、サンプルＹの前記ｇＤＮＡ断片は、バーコードＹを含むＩＤタグでタグ付けされる、先行条項のいずれか１項に記載の方法。

【0225】

９．前記バーコード配列は、４～２０ヌクレオチドの範囲、例えば、６～１６ヌクレオチドの範囲のランダムな配列を含む、先行条項のいずれか１項に記載の方法。

【0226】

１０．ステップｊ．は、前記選択された断片の少なくとも前記バーコード配列及び少なくとも前記ｇＤＮＡ配列の一部をシークエンシングすることを含む、先行条項のいずれか１項に記載の方法。

【0227】

１１．前記ＩＤタグは、前記バーコード配列及び固有の分子識別子（ＵＭＩ）配列を含み、各ＩＤタグは、異なるＵＭＩ配列を含む、先行条項のいずれか１項に記載の方法。

【0228】

１２．前記ＵＭＩは、４～２０ヌクレオチドの範囲、例えば、６～１６ヌクレオチドの範囲のランダムな配列を含む、条項１１に記載の方法。

【0229】

１３．固有のＤＮＡ断片の数を測定することは、固有のＵＭＩの数を測定することによって行われる、条項１１～１２のいずれか１項に記載の方法。

【0230】

１４．ステップｊ．の固有のタグ付きｇＤＮＡ断片の数を測定することであって、前記測定することは、
ｉ．参照ゲノム配列を提供することであって、前記参照ゲノムは、前記サンプルが採取される種と同一の種に由来する、前記提供することと、
ｉｉ．各シークエンシングされたｇＤＮＡ断片の配列を前記参照ゲノムにマッピングすることと、
ｉｉｉ．各クロマチン修飾プールの各バーコード配列を含む固有のｇＤＮＡ断片の数をカウントすることであって、固有のタグ付きｇＤＮＡ分子は、前記ゲノムにおける固有のマッピング位置によって識別される、前記カウントすることと、を含む、先行条項のいずれか１項に記載の方法。

【0231】

１５．固有のタグ付きｇＤＮＡ分子は、固有のＵＭＩ及び前記ゲノムにおける固有のマッピング位置の組み合わせによって識別される、条項１１～１４のいずれか１項に記載の方法。

【0232】

１６．前記ＩＤタグは、前記バーコード配列、ＵＭＩ配列及び追加の配列を含み、前記追加の配列は、前記ＩＤタグのライゲーションを可能にする、１つまたは２つのライゲーション配列を含む、先行条項のいずれか１項に記載の方法。

【0233】

１７．前記ＩＤタグは、前記バーコード配列、ＵＭＩ配列及び追加の配列を含み、前記追加の配列は、前記ＩＤタグ及び／または前記ｇＤＮＡ断片の増幅を可能にする、１つ以上の増幅配列を含む、先行条項のいずれか１項に記載の方法。

【0234】

１８．ステップｊ．は、各選択されたｇＤＮＡ断片の少なくとも前記バーコード配列及び前記ＵＭＩ配列をシークエンシングすることを含む、条項１１～１７のいずれか１項に記載の方法。

【0235】

１９．ステップｊ．は、各選択されたｇＤＮＡ断片の少なくとも前記バーコード配列、前記ＵＭＩ配列及び前記ｇＤＮＡ配列をシークエンシングすることを含む、条項１１～１８のいずれか１項に記載の方法。

【0236】

２０．全ての第１のＩＤタグは、１つ以上の共通の増幅配列を含む、先行条項のいずれか１項に記載の方法。

【0237】

２１．先行条項のいずれか１項に記載の方法であって、前記ｇＤＮＡ断片の少なくともある画分を第２のタグでタグ付けすることをさらに含む、前記方法。

【0238】

２２．前記第２のタグは、前記ＩＤタグと対照して前記ｇＤＮＡ断片の反対側の末端に付加される、条項２１に記載の方法。

【0239】

２３．先行条項のいずれか１項に記載の方法であって、各クロマチン修飾サブプール内の前記ｇＤＮＡ断片の少なくともある画分を第２のタグでタグ付けすることをさらに含み、前記第２のタグは、第２のバーコード配列を含むオリゴヌクレオチドであり、１つのクロマチン修飾サブプール内のｇＤＮＡ断片は、同一の第２のバーコード配列を含む第２のタグでタグ付けされ、異なる第２のバーコード配列が、各クロマチン修飾サブプールに対して使用される、前記方法。

【0240】

２４．前記インプットサブプール内のｇＤＮＡ断片が、前記クロマチン修飾サブプールに対して使用される前記第２のバーコード配列とは異なる、同一の第２のバーコード配列でタグ付けされる、条項２１～２３のいずれか１項に記載の方法。

【0241】

２５．条項２１～２４のいずれか１項に記載の方法であって、１つ以上のクロマチン修飾サブプール及び前記インプットサブプールの前記ｇＤＮＡ断片を集約プールにプールするステップをさらに含み、ステップｉ）は、前記集約プールからｎ掛けるｍ掛ける１００～１００，０００の範囲のタグ付きｇＤＮＡ断片を選択することを含む、前記方法。

【0242】

２６．条項２１～２５のいずれか１項に記載の方法であって、全てのクロマチン修飾サブプール及び前記インプットサブプールの前記ｇＤＮＡ断片をプールすることによってｇＤＮＡ断片のプールを生成するステップをさらに含む、前記方法。

【0243】

２７．ステップｉ．は、前記集約プールから、ステップａ．において提供されたサンプルあたり１００～１００，０００の範囲のｇＤＮＡ断片をランダムに選択することを含む、条項２５～２６のいずれか１項に記載の方法。

【0244】

２８．ステップｉ．は、前記集約プールから、ステップａ．において提供されたサンプルあたり２００～１００，０００の範囲のｇＤＮＡ断片をランダムに選択することを含む、条項２５～２６のいずれか１項に記載の方法。

【0245】

２９．ステップｉ．は、前記集約プールから、ｎ掛けるｍ掛ける２００～１００，０００の範囲のｇＤＮＡ断片をランダムに選択することを含む、先行条項のいずれか１項に記載の方法。

【0246】

３０．ステップｉ．は、ステップａ．において提供された試験サンプルあたり、多くとも５０，０００（多くとも２０，０００等）、例えば１０００～５０，０００の範囲（５０００～２０，０００の範囲等）のｇＤＮＡ断片をランダムに選択することを含む、先行条項のいずれか１項に記載の方法。

【0247】

３１．ステップｉ．は、多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）のｇＤＮＡ断片をランダムに選択することを含む、先行条項のいずれか１項に記載の方法。

【0248】

３２．ステップｊ．は、少なくとも前記ＩＤタグの前記バーコード配列及び前記第２のバーコード配列及び前記ＵＭＩ配列及び／または前記ｇＤＮＡ配列をシークエンシングすることを含み、ここで、ステップｊ．は、特異的な第２のバーコード配列を含む固有のｇＤＮＡ断片の総数に対する、前記ＩＤタグの前記バーコード配列及び各前記特異的な第２のバーコード配列を含む固有のｇＤＮＡ断片の頻度を計算することを含む、条項２１～３１のいずれか１項に記載の方法。

【0249】

３３．先行条項のいずれか１項に記載の方法であって、ステップｈ．を含む、前記方法。

【0250】

３４．前記増幅は、前記ＩＤタグの増幅配列にアニールすることができる少なくとも１つのプライマーを用いた、ポリメラーゼ連鎖反応法（ＰＣＲ）、リニア増幅法及び／または逆転写法を含む方法によって実施される、先行条項のいずれか１項に記載の方法。

【0251】

３５．前記第２のタグは、前記ステップｈ．の増幅の間に付加される、条項２１～３４のいずれか１項に記載の方法。

【0252】

３６．前記第２のタグは、プライマーがアニール可能な１つ以上の共通の増幅配列を含む、先行条項のいずれか１項に記載の方法。

【0253】

３７．増幅のための少なくとも１つの前記プライマーは、アダプタータグを含む、先行条項のいずれか１項に記載の方法。

【0254】

３８．前記増幅は、前記第２のタグの前記増幅配列にアニールすることができる１つのプライマーを用いる方法によって実施される、先行条項のいずれか１項に記載の方法。

【0255】

３９．前記ランダムに選択されたｇＤＮＡ断片は、１つ以上の固体支持体に固定化され得る、先行条項のいずれか１項に記載の方法。

【0256】

４０．前記ＩＤタグは、多くとも１００ヌクレオチド（多くとも７５ヌクレオチド等）、例えば多くとも５０ヌクレオチドを含有する、先行条項のいずれか１項に記載の方法。

【0257】

４１．前記ＩＤタグは、６～１００ヌクレオチドの範囲（６～７５ヌクレオチドの範囲等）、例えば６～５０ヌクレオチドの範囲からなるオリゴヌクレオチドからなる、先行条項のいずれか１項に記載の方法。

【0258】

４２．前記クロマチンは、クロマチンの断片化を触媒する１つ以上の酵素とインキュベートすることによって断片化される、先行条項のいずれか１項に記載の方法。

【0259】

４３．前記１つ以上の酵素は、以下からなる群から選択される、条項４２に記載の方法。
ａ．小球菌ヌクレアーゼ（ＭＮａｓｅ）等のヌクレアーゼ
ｂ．配列特異的制限酵素

【0260】

４４．前記クロマチンは、超音波処理による等の機械的な剪断によって断片化される、先行条項のいずれか１項に記載の方法。

【0261】

４５．前記ＩＤタグ及び／または前記第２のタグによる前記ｇＤＮＡ断片のタグ付けは、ライゲーションによって行われる、先行条項のいずれか１項に記載の方法。

【0262】

４６．タグ付けは、Ｔ４ＤＮＡリガーゼを用いる等、ＤＮＡリガーゼを用いるアダプターライゲーションを使用する、前記ＩＤタグ及び／または第２のタグのライゲーションを含む、先行条項のいずれか１項に記載の方法。

【0263】

４７．タグ付けは、Ｔｎ５を用いる等、トランスポゾン酵素を用いるアダプターライゲーションを使用する、前記ＩＤタグ及び／または第２のタグのライゲーションを含む、先行条項のいずれか１項に記載の方法。

【0264】

４８．ステップａ．は、少なくとも１５等（少なくとも２５等）、例えば少なくとも５０（少なくとも７５等）、例えば１５～１０００の範囲（１５～５００の範囲等）、例えば２５～１０００の範囲（２５～５００の範囲等）のクロマチンを含む種々の試験サンプルを提供することを含む、先行条項のいずれか１項に記載の方法。

【0265】

４９．ステップａ．は、少なくとも７５、好ましくは少なくとも８５、例えば７５～１０００の範囲（７５～５００の範囲等）、例えば８５～１０００の範囲（８５～５００の範囲等）のクロマチンを含む種々の試験サンプルを提供することを含む、先行条項のいずれか１項に記載の方法。

【0266】

５０．前記試験サンプルは、細胞、例えば、以下からなる群から選択される細胞を含む、先行条項のいずれか１項に記載の方法。
ａ．形質転換細胞株、
ｂ．患者由来細胞株等の初代細胞株、
ｃ．がん細胞株、
ｄ．ｉＰＳ細胞、
ｅ．接着細胞、
ｆ．懸濁細胞、
ｇ．３Ｄ細胞培養物、
ｈ．人工組織細胞及び
ｉ．オルガノイド細胞

【0267】

５１．前記細胞集団は、少なくとも１００の細胞、好ましくは少なくとも５００の細胞、さらにより好ましくは少なくとも１０００の細胞、例えば１０～１００，０００の範囲の細胞（１００～１００，０００の範囲の細胞等）、例えば１０００～１００，０００の範囲の細胞を含む、先行条項のいずれか１項に記載の方法。

【0268】

５２．各サンプルは、１００～１０００００の範囲の細胞（１０００～１００００の範囲の細胞等）を含む、先行条項のいずれか１項に記載の方法。

【0269】

５３．各サンプルは、異なる処理に供された細胞を含む、先行条項のいずれか１項に記載の方法。

【0270】

５４．１つ以上のクロマチン修飾は、以下からなる群から選択される、先行条項のいずれか１項に記載の方法。
ｉ．クロマチン断片内に存在するタンパク質
ｉｉ．翻訳後修飾
ｉｉｉ．ヌクレオチド修飾
ｉｖ．前記ｇＤＮＡ断片中の非天然核酸塩基の存在
ｖ．翻訳後プロセシングを通じて産生されたタンパク質断片の存在
ｖｉ．非正規ＤＮＡ構造

【0271】

５５．１つ以上のクロマチン修飾は、ヌクレオチドのメチル化である、先行条項のいずれか１項に記載の方法。

【0272】

５６．前記ヌクレオチドの１つ以上の修飾は、以下からなる群から選択される１つ以上の修飾ヌクレオチドの存在に通じる、先行条項のいずれか１項に記載の方法。
ａ．５－メチル－シトシン
ｂ．５－ヒドロキシ－メチル－シトシン
ｃ．５－ホルミル－シトシン
ｄ．５－カルボキシシトシン、及び
ｅ．６－メチル－アデニン

【0273】

５７．１つ以上の非天然核酸塩基は、５－ブロモ－２’－デオキシウリジン及び５－エチニル－２’－デオキシウリジン塩基からなる群から選択される、条項４６～４８のいずれか１項に記載の方法。

【0274】

５８．１つ以上の非正規ＤＮＡ構造は、Ｇ４構造、一本鎖ＤＮＡ、及びＲＮＡ：ＤＮＡハイブリッドからなる群から選択される、条項４６～４８のいずれか１項に記載の方法。

【0275】

５９．ステップｅ．は、それぞれが異なるクロマチン修飾に特異的に結合する、少なくとも５種の種々の抗体、少なくとも１０種の種々の抗体等（例えば、少なくとも１５種の種々の抗体）、５～１００種の範囲の種々の抗体等（例えば、５～５０種の範囲の種々の抗体）、１０～１００種の範囲の種々の抗体等（例えば、１０～５０種の範囲の種々の抗体）を提供することを含む、先行条項のいずれか１項に記載の方法。

【0276】

６０．１つ以上の抗体は、アミノ酸のカルボキシル化、メチル化、ヒドロキシメチル化、アセチル化、グルタミル化、シトルリン化、リン酸化、及びグリコシル化からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか１項に記載の方法。

【0277】

６１．１つ以上の抗体は、異性化、例えば、プロリン異性化、または非定型イソアスパルチルの形成を含む翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか１項に記載の方法。

【0278】

６２．異なるヒストンＰＴＭに結合する少なくとも５種の種々の抗体、異なるヒストンＰＴＭに結合する少なくとも１０種の種々の抗体等（例えば、異なるヒストンＰＴＭに結合する少なくとも１５種の種々の抗体）、異なるヒストンＰＴＭに結合する５～１００種の範囲の種々の抗体等（例えば、異なるヒストンＰＴＭに結合する５～５０種の範囲の種々の抗体）、異なるヒストンＰＴＭに結合する１０～１００種の範囲の種々の抗体等（例えば、異なるヒストンＰＴＭに結合する１０～５０種の範囲の種々の抗体）が提供される、先行条項のいずれか１項に記載の方法。

【0279】

６３．１つ以上の抗体は、以下からなる群から選択される翻訳後修飾に、特異的かつ選択的に結合する、先行条項のいずれか１項に記載の方法。
ａ．メチル化（モノ、ジ、トリメチル化）リジン、
ｂ．アシル化（アセチル化、プロピオニル化、ブチリル化、イソブチル化、スクシニル化、クロトニル化、ヒドロキシイソブチリル化）リジン、
ｃ．ユビキチン化リジン、
ｄ．スモイル化リジン、
ｅ．ネディル化リジン、
ｆ．リン酸化セリン、
ｇ．リン酸化スレオニン、
ｈ．リン酸化ヒスチジン、
ｉ．シトルリン、
ｊ．メチル化アルギニン（モノ、対称性ジ、非対称性ジメチル化）
ｋ．グルタリル化リジン、

【0280】

６４．１つ以上の抗体は、以下からなる群から選択される翻訳後のタンパク質上に、特異的かつ選択的に結合する、先行条項のいずれか１項に記載の方法。
ａ．ヒストンＨ３
ｂ．ヒストンＨ３．１、Ｈ３．２、Ｈ３．３
ｃ．ヒストンＨ３．Ｘ、Ｈ３．Ｙ
ｄ．ヒストンＨ４
ｅ．ヒストンＨ２Ａ
ｆ．ヒストンＨ２Ａ．Ｘ
ｇ．ヒストンＨ２Ａ．Ｚ
ｈ．ヒストンＨ２Ａ．Ｚ．１
ｉ．ヒストンＨ２Ａ．Ｚ．２
ｊ．ヒストンマクロＨ２Ａ
ｋ．ヒストンＨ２Ａ．Ｂｂｄ、及び
ｌ．ヒストンＨ２Ｂ。

【0281】

６５．１つ以上の抗体は、以下からなる群から選択されるエピジェネティック修飾に、特異的かつ選択的に結合する、先行条項のいずれか１項に記載の方法。
ａ．Ｈ３Ｋ４ｍｅ１、
ｂ．Ｈ３Ｋ４ｍｅ２、
ｃ．Ｈ３Ｋ４ｍｅ３、
ｄ．Ｈ３Ｋ７９ｍｅ３、
ｅ．Ｈ３Ｋ９ｍｅ１、
ｆ．Ｈ３Ｋ９ｍｅ２、
ｇ．Ｈ３Ｋ９ｍｅ３、
ｈ．Ｈ３Ｋ２７ｍｅ１、
ｉ．Ｈ３Ｋ２７ｍｅ２、
ｊ．Ｈ３Ｋ２７ｍｅ３、
ｋ．Ｈ４Ｋ２０ｍｅ１、
ｌ．Ｈ４Ｋ２０ｍｅ２及び
ｍ．Ｈ４Ｋ２０ｍｅ３。

【0282】

６６．シークエンシングは、大量並行シークエンシングによって実施される、先行条項のいずれか１項に記載の方法。

【0283】

６７．シークエンシングは、Ｉｌｌｕｍｉｎａシークエンシングによって実施される、先行条項のいずれか１項に記載の方法。

【0284】

６８．先行条項のいずれか１項に記載の方法であって、試験サンプルあたり、１００～１００，０００の範囲、例えば多くとも５０，０００（多くとも２０，０００等）、例えば１０００～５０，０００の範囲（５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【0285】

６９．先行条項のいずれか１項に記載の方法であって、試験サンプルあたり、２００～１００，０００の範囲、例えば多くとも５０，０００（多くとも２０，０００等）、例えば２００～５０，０００の範囲、例えば１０００～５０，０００の範囲（５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【0286】

７０．先行条項のいずれか１項に記載の方法であって、ｎ掛ける１００～１００，０００の範囲、例えば多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【0287】

７１．先行条項のいずれか１項に記載の方法であって、試験サンプルあたり、ｎ掛ける２００～１００，０００の範囲、例えば多くともｎ掛ける５０，０００（多くともｎ掛ける２０，０００等）、例えばｎ掛ける２００～５０，０００の範囲、例えばｎ掛ける１０００～５０，０００の範囲（ｎ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含む、前記方法。

【0288】

７２．先行条項のいずれか１項に記載の方法であって、ｎ掛けるｍ掛ける１００～１００，０００の範囲、例えば多くともｎ掛けるｍ掛ける５０，０００（多くともｎ掛けるｍ掛ける２０，０００等）、例えばｎ掛けるｍ掛ける１０００～５０，０００の範囲（ｎ掛けるｍ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含み、ここで、ｎは、ステップａ．において提供された試験サンプルの数であり、ｍは、クロマチン修飾サブプールの数である、前記方法。

【0289】

７３．先行条項のいずれか１項に記載の方法であって、ｎ掛けるｍ掛ける２００～１００，０００の範囲、例えばｎ掛けるｍ掛ける２００～５０，０００の範囲、例えばｎ掛けるｍ掛ける１０００～５０，０００の範囲（ｎ掛けるｍ掛ける５０００～２０，０００の範囲等）のタグ付きｇＤＮＡ断片をランダムに選択し、シークエンシングすることを含み、ここで、ｎは、ステップａ．において提供された試験サンプルの数であり、ｍは、クロマチン修飾サブプールの数である、前記方法。

【0290】

７４．前記ＩＮＲＣは、各サンプルにおけるエピトープの真の量に直線的に相関し、２つのサンプル間の定量的な差は、前記２つのサンプルについて計算された前記ＩＮＲＣの比に対応する、条項３～６１のいずれか１項に記載の方法。

【0291】

７５．先行条項のいずれか１項に記載の方法であって、複数のクロマチン修飾のグローバルレベルを決定するためのものであり、ｇＤＮＡ断片は、各サンプルの全てのｇＤＮＡ断片からランダムに選択される、前記方法。

【0292】

７６．先行条項のいずれか１項に記載の方法であって、複数のクロマチン修飾の局所レベルを決定するためのものであり、ｇＤＮＡ断片は、１つ以上の目的のゲノム遺伝子座のｇＤＮＡ断片からランダムに選択される、前記方法。

【0293】

７７．先行条項のいずれか１項に記載の方法であって、複数のクロマチン修飾のレベルを定量的に評価するための方法である、前記方法。

【0294】

７８．前記定量的評価は、参照と比較した各クロマチン修飾の倍率差を提供するものである、先行条項のいずれか１項に記載の方法。

【0295】

７９．複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
ａ．１つ以上の試験化合物を提供するステップ、
ｂ．前記試験化合物の存在下で細胞を培養するステップであって、種々の試験化合物の存在下で培養される細胞は、互いに物理的に分離されている前記培養するステップ、
ｃ．条項１～７８のいずれか１項に記載の方法を実施するステップであって、各試験サンプルは、異なる試験化合物と共にインキュベートされる細胞を含む、前記実施するステップ。

【0296】

８０．複数のクロマチン修飾のレベルに対する試験化合物の影響を決定する方法であって、以下のステップを含む、前記方法。
ａ．１つ以上の試験化合物を提供するステップ、
ｂ．前記試験化合物またはそれらの組み合わせの存在下で複数の細胞を培養するステップであって、種々の試験化合物またはそれらの組み合わせの存在下で培養される細胞は、互いに物理的に分離されており、所与の試験化合物またはそれらの組み合わせの存在下で培養される細胞は細胞集団である、前記培養するステップ、
ｃ．条項１～７８のいずれか１項に記載の方法を実施するステップであって、各試験サンプルは、異なる細胞集団のクロマチンを含む、前記実施するステップ。

【0297】

８１．条項７９～８０のいずれか１項に記載の方法であって、試験化合物と共にインキュベートされていない細胞を含む参照サンプルを用いて、条項１～７８のいずれか１項に記載の方法を実施することをさらに含む、前記方法。

【0298】

８２．複数のクロマチン修飾のレベルに対する試験化合物（複数可）の影響は、前記参照サンプルにおける頻度と比較した、前記試験化合物（複数可）の存在下で培養された細胞集団における前記クロマチン修飾の頻度を比較することにより決定される、条項８１に記載の方法。

【実施例】

【0299】

本発明は、以下の実施例によってさらに説明され得るが、しかしながら、これらは、本発明を限定するものとして解釈されるべきではない。

【0300】

実施例１：
以下に提示する実施例は、ランダムに選択した少数（Ｎ）の配列のみを使用したことを除き、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，ＣｅｌｌＲｅｐｏｒｔｓ，２０１９に従って調製したデータセットに基づくものである。

【0301】

まず、Ｈ３Ｋ２７ｍｅ３が最大レベルの細胞源とＨ３Ｋ２７ｍｅ３が枯渇した細胞源とを既知の比率で混合し、較正曲線を作成した。それぞれの供給源は、マウス胚性幹細胞（ｍＥＳＣ）を、ＥＺＨ２阻害剤のＥＰＺ－６４３８で処理してＨ３Ｋ２７ｍｅ３を検出可能レベル以下にするか、または脱メチル化酵素ＪＭＪＤ３／ＵＴＸ阻害剤のＧＳＫ－Ｊ４で処理してＨ３Ｋ２７ｍｅ３を生理的レベルより多く増やして生成した。ヒストンＨ３Ｋ２７ｍｅ３の量をあらかじめ非常に多くまたは非常に少なく設定したサンプルは、これらの細胞源を７つの既知の比率（１００％低、５％高／９５％低、２５％高／７５％低、５０％高／５０％低、７５％高、２５％低、９５％高、５％低、１００％高）で混合することにより調製した。各比率について２つの複製を用意し、１４種の異なる第１のバーコードを用いて個別にバーコード化した。溶解、クロマチン断片化及びバーコード化、クロマチン免疫沈降ならびにライブラリー調製を、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ２０１９に記載のＭＩＮＵＴＥ－ＣｈＩＰ法に従って実施した。Ｋｕｍａｒｅｔ．ａｌ．，では、データポイントあたり（すなわち、サンプル及びプールあたり）平均約１０百万の配列に相当する、約６００百万の固有配列（リードペア）が、Ｉｌｌｕｍｉｎａプラットフォームで取得された。上記の理論によれば、各Ｈ３Ｋ２７ｍｅ３ＣｈＩＰサンプルの配列数は、あらかじめ設定したサンプル中のＨ３Ｋ２７ｍｅ３の量に比例すべきである。Ｈ３Ｋ２７ｍｅ３が最も少ないサンプルでは２５１，８６１の配列が取得され、Ｈ３Ｋ２７ｍｅ３が最も多いサンプルでは４８，７１５，７０３の配列が取得された。したがって、Ｋｕｍａｒｅｔ．ａｌ．，では、各サンプルにおけるＨ３Ｋ２７ｍｅ３のレベルは、データポイントあたり平均約１０百万の配列で正確に決定された。ランダムに選択された少数のリードで同一の定量化が達成できることを実証するために、非常に少数の配列を使用する効果を試験した。つまり、第１の解析では、２５０，０００の配列を各ライブラリー（インプット、Ｈ３Ｋ２７ｍｅ３ＣｈＩＰ）からランダムに選択し、これは平均１７８５７の生の配列に相当した。これにより、データポイントあたり（すなわち、ライブラリーごとのサンプルあたり）、平均１５，９０９（２７０～６８，７３７の範囲）の固有のマッピングされた配列が得られた。別の解析では、２５，０００の配列をランダムに選択し、これは平均１７８６の生の配列に相当した。これにより、データポイントあたり（すなわち、ライブラリーごとのサンプルあたり）、平均１，６３３（２６～６，９３８の範囲）の固有のマッピングされた配列が得られた。第３の解析では、２，５００の配列をランダムに選択し、これは平均１７９の生の配列に相当した。これにより、データポイントあたり（すなわち、ライブラリーごとのサンプルあたり）、１６６（２～７１６の範囲）の固有のマッピングされた配列が得られた。ＩＮＲＣに基づくグローバル定量化の結果を図５に示す。図に示したように、測定値は、あらかじめ設定した量に、直線的に相関し、比例している。量のデータがどのくらい厳密に真の量を予測しているかを指し示すＲ^２値は、標準曲線を作成するために、サンプルあたり平均３５７の配列に相当する、合計５，０００リード（Ｈ３Ｋ２７ｍｅ３ＣｈＩＰサブプールから２，５００、インプットサブプールから２，５００）しか使用しなかった場合でさえ、極めて良好（＞０．９８）のままである。較正曲線定量化により、ＩＮＲＣが、広いダイナミックレンジにわたり、全体存在量に比例することが実証される。

【0302】

次の実験では、２つの条件下で増殖させた細胞を、それぞれ三重のサンプルで互いに比較し、ヒストンエピトープであるＨ３Ｋ２７ｍｅ３の相対レベルを決定した。したがって、それぞれが異なる第１のバーコード（合計６種のバーコード）でバーコード化されている、合計６つのサンプルを調査した。

【0303】

ここで調査した比較対象は、標準培地で増殖させたマウス胚性幹細胞を表す１つの「未処理」条件、標準培地で２種の特異的阻害剤、すなわちＭＥＫ阻害剤ＰＤ０３２５９０１及びＧＳＫ３阻害剤ＣＨＩＲ９９０２１（「２ｉ」）と共に増殖させたマウス胚性幹細胞を表す「２ｉ」阻害剤処理、という２つの条件を指す。合計約１０００百万の配列を用いた定量化により、「２ｉ」処理での細胞では、Ｈ３Ｋ２７ｍｅ３が、統計的に有意に（ｔ検定、ｐ＝０．００１７）２．３倍増加することが実証された（ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，ＣｅｌｌＲｅｐｏｒｔｓ，２０１９）。

【0304】

Ｈ３Ｋ２７ｍｅ３サブプールライブラリー及びインプットサブプールライブラリーから、種々の数の配列をランダムに選択した。Ｈ３Ｋ２７ｍｅ３サブプールからは、インプットサブプールと比較しておよそ２倍多い配列を選択し、２００～１０，０００，０００の範囲にわたってランダムに選択した配列の総数を解析した。その結果を図６に示す。

【0305】

ランダムに選択した合計わずか３０４３の配列（Ｈ３Ｋ２７ｍｅ３サブプールから２０１７、インプットサブプールから１０２６）の解析により、計算された倍率変化と測定値の標準偏差及び対比較の有意差との両方が、基礎となるリード情報の劇的な減少に対して堅固であることが実証された。選択した３０４３の配列中、個々のサンプルは、プールあたり最小で１０１及び最大で６０６の固有の配列で見受けられた。したがって、免疫沈降（ヒストン修飾サブプール）及びインプットサブプール全体にわたり合計１０００～１００００リードの間（サブプールごとのサンプルあたり１００～１５００リードに相当）という低い深度でサンプリングしても、なお、２．３倍の変化を統計的に有意に決定することが可能となった（図６を参照されたい）。

【0306】

さらに、マッピングされた固有のリードカウントに基づく定量とＵＭＩ情報のみに基づく定量とを比較したところ、ＵＭＩカウントでは、利用可能なシークエンシング情報をより多く使用しながらも（全てのリードがＵＭＩ情報を含有するが、全てが参照ゲノムにマッピングされ得ることはないため）、同一の統計的有意差で同一の結果がもたらされたことが実証された。ランダムに選択した１４８４の配列（Ｈ３Ｋ２７ｍｅ３サブプールでは７５４、インプットサブプールでは７３０）をサンプリングしても、なお、２．３倍の変化を統計的に有意に決定することが可能となった（図６を参照されたい）。選択した１４８４の配列中、個々のサンプルは、プールあたり最小で３０及び最大で２４６の固有の配列で見受けられた。

【0307】

実施例２
グローバルレベルの定量化
本実施例は、グローバルレベルを定量化するステップに対する洞察を提供することを意図するものである。マルチプレックス化し、プール化したＣｈＩＰは、本質的に競合的結合実験を意味する。本実施例では、２つの条件を与えている。条件Ａでは、修飾Ｈ３Ｋ２７ｍｅ３が、条件Ｂに比べて２倍の量である。クロマチンを断片化した後、２倍多いヌクレオソーム分子がＨ３Ｋ２７ｍｅ３を有している。プールする前に、ヌクレオソームＤＮＡを供給源（「Ａ」または「Ｂ」）に応じてバーコード化する。インプットプールをシークエンシングする場合、バーコード「Ａ」及び「Ｂ」が同じ頻度で認められる。ＣｈＩＰ反応では、ビーズに固定化された特異的抗体にプールを添加することにより、Ｈ３Ｋ２７ｍｅ３の結合部位が限られた数で提供される。Ｈ３Ｋ２７ｍｅ３は、条件Ａでより豊富であるため、「Ａ」バーコードを有するヌクレオソームは、抗体によって、より捕捉されやすい。結合したヌクレオソームをシークエンシングする。バーコード「Ａ」は、バーコード「Ｂ」より２倍頻繁に認められることになる。バーコード分布は、結合部位に対する競争のため、インプットサンプル中のエピトープの相対的存在量に常に比例する（図３）。

【0308】

所与のＩＰ反応における、アッセイしたエピトープの各サンプルに存在するレベルを定量化するために、サンプルに特異的なタグ及びＵＭＩの固有の組み合わせをカウントし、各サンプルについて合計した。サンプル特異的タグのそれぞれについて測定した、これらの合計固有リードカウントを、次いで、インプット中の同一のサンプル特異的タグの合計固有リードカウントと関連付けて、インプット正規化リードカウント（ＩＮＲＣ）を形成した。上記の計算例によれば、ＩＮＣＲは、各サンプルにおけるエピトープの量に比例する。

【0309】

このバージョンの方法では、固有のバーコード分子を測定し、ＵＭＩ情報のみを評価する。該方法の代替バージョンでは、リードのゲノム配列内容（特異的なアダプター分子にライゲーションしたクロマチン断片に対応する配列）をゲノムにマッピングし、固有のゲノム配列と固有のＵＭＩとの組み合わせによって固有の分子を決定する。

【0310】

実施例３
３種のヒストン修飾に対する薬物の効果を定量化するためのｈｍｑＣｈＩＰ実験
９６サンプルにおける３種のヒストン修飾のグローバルレベルをプロファイリングする高度にマルチプレックス化した実験。２種の異なるがん細胞株（ヒト結腸癌ＨＣＴ１１６、ヒト骨肉腫Ｕ２ＯＳ）を、それぞれ２種の濃度（低、高）における１１種の異なる薬物、または対照としてのＤＭＳＯで処理した。合計９６サンプルへの各処理は、それぞれ２回反復（ｒｅｐ１、ｒｅｐ２）して実施した。実験の概要を図１１Ａに示す。Ｕ２ＯＳについては、９６ウェルあたり９０００の細胞を播種した。ＨＣＴ１１６については６０００の細胞を播種した。２４時間後、以下の表に明記した濃度を用いて、各ウェルに薬物を添加した。

【表1】

【0311】

さらに４０時間増殖させた後、細胞数はウェルあたりおよそ５０，０００細胞となった。以下の通り、培養プレート内で細胞を直接溶解し、クロマチンを断片化し、同一の培養プレート内で９６種の第１のバーコード（各サンプルに対して１つのバーコード）を含む９６種のＩＤタグでバーコード化した。増殖培地を除去し、ウェルをＰＢＳで１ｘ洗浄した。ウェルあたり３０ｕＬの溶解バッファー（５０ｍＭトリス－ＨＣｌ、ｐＨ８．０、０．１％ＴｒｉｔｏｎＸ－１００、０．０５％デオキシコール酸ナトリウム（ＤＯＣ）、５ｍＭＣａＣｌ２）を添加した。プレートを氷上に１５分間置いた。１５Ｕ／ｕＬのＭＮａｓｅを有する２０ｕＬの溶解バッファーを添加した。プレートを３７Ｃにて２０分間インキュベートした。１３ｕＬのｄｄＨ２Ｏ及び７ｕＬの平滑末端化マスターミックス（１０ｍＭＡＴＰ、１０ｍＭｄＮＴＰ、５０ｍＭＤＴＴ、１５ＵＴ４ＤＮＡポリメラーゼ、２５ＵＴ４ポリヌクレオチドキナーゼ、３００ｍＭＥＧＴＡ）を各ウェルに添加し、総量を７０ｕＬに増やした。プレートを室温にて１時間インキュベートした。２ｕＬの１．２５ｕＭＤＮＡアダプターを、各ウェルに添加した。アダプター配列（ＩＤタグ）は、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載の通りのものであり、各サンプルに固有の８ｎｔバーコード及び６ｎｔランダムＵＭＩ配列を有する。

【0312】

１８ｕＬのライゲーション反応ミックス（５．４ｕＬ５０％ｗ／ｖＰＥＧ４０００、０．４５ｕＬ１００ｍＭＡＴＰ、０．５ｕＬＴ４ＤＮＡリガーゼ（５Ｕ／ｕＬ）、１１．６５ｕＬｄｄＨ２Ｏ）を、各ウェルに添加し、総量９０ｕＬにした。プレートを室温にて１時間インキュベートした。９０ｕＬのストップバッファー（１００ｍＭトリス－ＨＣｌｐＨ８．０、３００ｍＭＮａＣｌ、２％ＴｒｉｔｏｎＸ－１００、１００ｍＭＥＧＴＡ、１００ｍＭＥＤＴＡ、０．２％デオキシコール酸ナトリウム）を添加することにより反応を停止させ、９６ウェルプレートのウェルを単一のチューブ内にプールした。１７，８２０ｕＬのプールを１．５ｍＬのアリコートに分取し、２０００ｒｐｍで５分間遠心し、上清を回収した。１，５ｍＬのサブプールを、５０ｕＬのＰｒｏｔｅｉｎＡ／Ｇビーズに固定化した３ｕＬの抗Ｈ３Ｋ２７ｍｅ３（Ｍｉｌｌｉｐｏｒｅ０７－４４９）、抗Ｈ３Ｋ２７ａｃ（Ａｂｃａｍａｂ１７７１７８）、抗Ｈ３Ｋ９ｍｅ３（Ａｂｃａｍａｂ８８９８）抗体と共にインキュベートした。ＣｈＩＰ及びインプットのＤＮＡは、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載の通りに単離及び精製した。ライブラリーは、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載の通りに、精製したＤＮＡの７５％を用いて調製した。

【0313】

最終的なライブラリーを２回シークエンシングして、２つの異なるランダムな分子セットのシークエンシング（ゲノムをほんのわずかに被覆するのみ）がグローバルレベルの定量化に与える影響を検証した。１回目は、４つのサブプール（３つのＣｈＩＰ、１つのインプット）に対して、合計で約１百万リード（サブプールあたりおよそ２５００００リード）をシークエンシングした。これは、サンプルあたり約１０，４１６の配列、またはデータポイントあたり（すなわち、ライブラリーごとのサンプルあたり）２６０４の配列のシークエンシングに相当する。２回目は、合計２５百万のリードを収集し、全てのリードを解析するか、またはランダムに選択した１百万のリードサブセットのみを解析した。全てのリードを解析した場合、サンプルあたりおよそ２６０，４１６リードに相当する。参照としてＤＭＳＯ対照を用いて、インプット正規化固有リードカウント（ＩＮＲＣ）を実施例２に記載の通りに計算し、ＩＮＲＣを反映したグレースケール及び円サイズでヒートマップにプロットした。

【0314】

結果を図１１に示す。図１１Ｂは、約１百万のリードをシークエンシングした１回目のシークエンシングの結果を示し、一方、図１１Ｃは、２５百万のランダムに選択したリードのうち１百万のみを使用して行った２回目のシークエンシングの結果を示している。これは、サンプルあたり約１０，４１６リードを解析することに相当する。図１１Ｄは、２５百万のリードを使用して行った２回目のシークエンシングの結果を示している。

【0315】

図１１Ｂ）及びＣ）における、サンプルあたり１０，０００の配列、またはデータポイントあたり（すなわち、サブプールごとのサンプルあたり）２５００の配列という、極めて低いシークエンシング深度では、図１１Ｄ）における、２５倍深いシークエンシングと同一の結果がもたらされた。したがって、極めて低いシークエンシング深度でもなお、信頼性が高いグローバルな定量化が得られる。予想通り、ＨＤＡＣ阻害剤であるＳＡＨＡ（ボリノスタット）及びサーチノールは、Ｈ３Ｋ２７ａｃのアセチル化を増加させる。ＳＡＨＡは、ＨＤＡＣ１－ＨＤＡＣ１０を阻害し、サーチノールはＳＩＲＴ１及びＳＩＲＴ２を阻害する。また、予想通り、ＥＺＨ２阻害剤であるＥＰＺ６４３８及びＥＰＺ０１１９８９は、ＨＣＴ１１６細胞においてＨ３Ｋ２７ｍｅ３を減少させる。しかし、Ｕ２ＯＳ細胞は、ＥＺＨ２阻害剤の影響を受けなかった。おそらく、Ｕ２ＯＳ細胞の増殖が比較的遅いことに一致して、既存のＨ３Ｋ２７ｍｅ３がすぐに希釈または除去されないためと思われる。興味深いことに、両方のＨＤＡＣ阻害剤がＨ３Ｋ２７ａｃを増加させているにもかかわらず、同時にサーチノールのみがＵ２ＯＳ細胞においてＨ３Ｋ２７ｍｅ３を減少させている。おそらく、刺激により脱メチル化が活性化したと思われる。全てのエピジェネティックマーカーに対して全ての条件を試験することにより、既知及び新規の関係が体系的に発見される。

【0316】

実施例４
クロマチン修飾の遺伝子座特異的定量化のためのｈｍｑＣｈＩＰ実験
上述した実施例３の実験から、Ｈ３Ｋ９ｍｅ３ＣｈＩＰ、Ｈ３２７ａｃＣｈＩＰ及びインプットの精製ＤＮＡの２５％を、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９に記載のユニバーサルフォワードプライマー及びＣＤＫＮ１Ａ（ｐ２１）プロモーター遺伝子座（＋／－２．５ｋｂ）の配列に相補的にハイブリッドするリバースプライマーの混合物を使用するＰＣＲを用いて増幅した。（ａｇａｃｇｔｇｔｇｃｔｃｔｔｃｃｇａｔｃｔＣＧＧＴＧＧＧＡＡＡＧＡＧＧＴＡＧＡＧ（配列番号１）、ａｇａｃｇｔｇｔｇｃｔｃｔｔｃｃｇａｔｃｔＧＴＧＴＣＣＣＧＧＡＣＣＴＣＣＡＧＴ（配列番号２）、ａｇａｃｇｔｇｔｇｃｔｃｔｔｃｃｇａｔｃｔＣＴＣＧＣＴＡＧＴＣＣＴＴＡＧＧＧＧＡ（配列番号３）、ａｇａｃｇｔｇｔｇｃｔｃｔｔｃｃｇａｔｃｔＣＡＧＧＧＡＣＡＣＧＧＡＣＴＴＣＡＴ（配列番号４）、ａｇａｃｇｔｇｔｇｃｔｃｔｔｃｃｇａｔｃｔＣＡＴＣＣＣＧＡＣＴＣＴＣＧＴＣＡＣ（配列番号５））
続いて、ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，２０１９にある通りに、最終的なライブラリーＰＣＲを実施した。

【0317】

各ライブラリーについて、Ｉｌｌｕｍｉｎａシークエンサーで約１００００の配列を収集した。リードをヒトゲノムにアライメントし、ＣＤＫＮ１プロモーター（＋／－２，５ｋｂ）にアライメントしている配列をカウントし、ＣｈＩＰごとのサンプルあたり、２～５００リードを得た。ＩＮＲＣは、実施例２に記載した通りに、ＣＤＫＮ１プロモーターにアライメントしている配列のみを用いて、選択した条件（ＤＭＳＯ、５アザ、ＳＡＨＡ、サーチノール）について計算し、ＤＭＳＯ対照を参照条件として用いて、図１２にプロットした。

【0318】

参考文献
ＫｕｍａｒａｎｄＥｌｓａｓｓｅｒ，ＣｅｌｌＲｅｐｏｒｔｓ，２０１９，２８（１２）：３２７４－３２８４．ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｒｅｐ．２０１９．０８．０４６．

ＭａｒｄｉｓＥ．ＤＮＡｓｅｑｕｅｎｃｉｎｇｔｅｃｈｎｏｌｏｇｉｅｓ：２００６－２０１６．ＮａｔＰｒｏｔｏｃ１２，２１３－２１８（２０１７）．
ｈｔｔｐｓ：／／ｄｏｉ．ｏｒｇ／１０．１０３８／ｎｐｒｏｔ．２０１６．１８２

【図1-1】