(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022184895
(43)【公開日】2022-12-13
(54)【発明の名称】クロマチン相互作用のゲノムワイドな同定
(51)【国際特許分類】
C12Q 1/6806 20180101AFI20221206BHJP
C40B 40/06 20060101ALI20221206BHJP
C12N 15/11 20060101ALI20221206BHJP
C12Q 1/686 20180101ALI20221206BHJP
C12N 15/10 20060101ALI20221206BHJP
G01N 33/53 20060101ALI20221206BHJP
【FI】
C12Q1/6806 Z
C40B40/06 ZNA
C12N15/11 Z
C12Q1/686 Z
C12N15/10 100Z
G01N33/53 M
【審査請求】有
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2022142685
(22)【出願日】2022-09-08
(62)【分割の表示】P 2019512244の分割
【原出願日】2017-08-31
(31)【優先権主張番号】62/398,175
(32)【優先日】2016-09-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/383,112
(32)【優先日】2016-09-02
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.テフロン
2.TRITON
(71)【出願人】
【識別番号】519000261
【氏名又は名称】ルートヴィヒ インスティテュート フォー キャンサー リサーチ リミテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【弁理士】
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】レン ビン
(72)【発明者】
【氏名】ユ ミャオ
(72)【発明者】
【氏名】ファン ロンシン
(57)【要約】 (修正有)
【課題】細胞におけるクロマチン相互作用のゲノムワイドな同定のための方法およびキットを提供する。
【解決手段】以下の段階を含む、細胞におけるクロマチン相互作用のゲノムワイドな同定のための方法:
ゲノムDNAを有する一組の染色体を含有する細胞を提供する段階;
該細胞又はその核を固定剤と共にインキュベートし、タンパク質に架橋されたゲノムDNAを有する複合体を含む固定細胞を提供する段階;
該固定細胞のゲノムDNAの近接ライゲーションを行い、近接してライゲーションされたゲノムDNAを形成する段階;
該細胞から該複合体を単離し、DNAライブラリを提供する段階;および
該DNAライブラリを配列決定する段階。
【選択図】
図1-1
【特許請求の範囲】
【請求項1】
以下の段階を含む、細胞におけるクロマチン相互作用のゲノムワイドな同定のための方法:
ゲノムDNAを有する一組の染色体を含有する細胞を提供する段階;
該細胞またはその核を固定剤と共にインキュベートし、タンパク質に架橋されたゲノムDNAを有する複合体を含む固定細胞を提供する段階;
該固定細胞のゲノムDNAの近接ライゲーションを行い、近接してライゲーションされたゲノムDNAを形成する段階;
該細胞から該複合体を単離し、DNAライブラリを提供する段階;および
該DNAライブラリを配列決定する段階。
【請求項2】
単離段階の前に、近接してライゲーションされた前記ゲノムDNAをせん断する段階をさらに含む、請求項1記載の方法。
【請求項3】
せん断する段階が、超音波処理によって実施される、請求項2記載の方法。
【請求項4】
固定剤が、ホルムアルデヒド、グルタルアルデヒド、ホルマリン、またはそれらの混合物である、請求項1~3のいずれか一項記載の方法。
【請求項5】
近接ライゲーションが、以下を含むプロセスによって行われるインサイチュライゲーションである、請求項1~4のいずれか一項記載の方法:
固定細胞を透過処理する段階;
ゲノムDNAを断片化する段階;および
標識ヌクレオチドを用いて標識ヌクレオチド充填(fill-in)を行い、該ゲノムDNAをライゲーションして、近接してライゲーションされたゲノムDNAを形成する段階。
【請求項6】
近接ライゲーション段階の前に、ゲノムDNAを有する一組の染色体を含有する前記細胞またはその核が溶解される、請求項1~5のいずれか一項記載の方法。
【請求項7】
断片化する段階が、酵素を用いた制限切断によって実施される、請求項5記載の方法。
【請求項8】
前記酵素が、4塩基カッターまたは6塩基カッターである、請求項7記載の方法。
【請求項9】
前記標識ヌクレオチドがタグで標識されている、請求項5記載の方法。
【請求項10】
前記タグがビオチンである、請求項9記載の方法。
【請求項11】
単離段階の後かつ配列決定段階の前に、前記複合体からゲノムDNAをプルダウンする段階をさらに含む、請求項1~10のいずれか一項記載の方法。
【請求項12】
前記タンパク質に特異的に結合する抗体を用いた免疫沈降によって前記複合体が単離される、請求項1~11のいずれか一項記載の方法。
【請求項13】
前記タンパク質が転写因子である、請求項12記載の方法。
【請求項14】
前記細胞が、哺乳動物の細胞であるか、または組織に由来する、請求項1~13のいずれか一項記載の方法。
【請求項15】
以下から選択される1つまたは複数の試薬および生物学的サンプルを含む、請求項1、5、または6記載の方法を行うためのキット:
固定剤、制限エンドヌクレアーゼ、リガーゼ、DNA結合タンパク質、標識ヌクレオチド、捕捉剤、抗体またはその抗原結合部分、アダプターオリゴヌクレオチドおよび/またはシークエンシングプライマー、溶解バッファー、dNTP、ポリメラーゼ、ポリヌクレオチドキナーゼ、リガーゼバッファー、ならびにPCR試薬。
【請求項16】
前記捕捉剤がストレプトアビジンである、請求項15記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2016年9月2日に出願された米国特許仮出願第62/383,112号および2016年9月22日に出願された米国特許仮出願第62/398,175号に対する優先権を主張する。これらの出願の内容はその全体が参照により本明細書に組み入れられる。
【0002】
連邦政府支援の研究および開発に関する記載
本発明は、米国国立衛生研究所(NIH)により付与された助成金第1U54DK107977-01号および第U54 HG006997号の下での米国政府の支援を受けてなされた。本発明については米国政府が一定の権利を有する。
【背景技術】
【0003】
発明の背景
ロングレンジクロマチン相互作用の形成は、遠位エンハンサーによる標的遺伝子の転写活性化における重要な段階である。そのような構造的特徴をマッピングすることは、シス調節エレメントの標的遺伝子を決定し、ヒトの疾患と関連する非コード配列変異体の機能をアノテーションするために役立つ(Gorkin, D.U., et al., Cell Stem Cell 14, 762-775(2014)(非特許文献1), de Laat, W. & Duboule, D. Nature 502, 499-506(2013)(非特許文献2), Sexton, T. & Cavalli, G.T. Cell 160, 1049-1059(2015)(非特許文献3), およびBabu, D. & Fullwood, M.J. Nucleus 6, 382-393(2015)(非特許文献4) )。ロングレンジクロマチン相互作用および遺伝子制御におけるその役割についての研究は、クロマチン立体構造の捕捉(3C)に基づく技術の発展によって推進された(Dekker, J., et al., Nat.Rev.Genet. 14, 390-403(2013)(非特許文献5)およびDenker, A. & de Laat, W. Genes & development 30, 1357-1382(2016)(非特許文献6))。一般に使用されるハイスループット3Cアプローチの中でもとりわけHi-CおよびChIA-PETが挙げられる(Lieberman, E. Science 326, 289-293(2009)(非特許文献7)およびFullwood, M. J. et al., Nature 462, 58-64(2009)(非特許文献8))。Hi-Cを用いたロングレンジクロマチン相互作用の網羅的解析がキロベース解像度において成し遂げられたが、それには数十億ものシークエンシングリードが必要とされる(Rao, S.S.P. et al., Cell 159, 1665-1680(2014)(非特許文献9))。ペアエンドタグシークエンシング(ChIA-PET)によるクロマチン解析か、またはHi-Cライブラリの標的捕捉およびシークエンシングのいずれかによって、選択されたゲノム領域におけるロングレンジクロマチン相互作用の高解像度解析を費用効率良く行うことができる(Fullwood, M. J. et al., Nature 462, 58-64(2009)(非特許文献8), Mifsud, B. et al., Nat. Genet. 47,598- 606(2015)(非特許文献10), およびTang, Z. et al., Cell 163, 1611-1627(2015)(非特許文献11) )。特に、多くの細胞タイプおよび種において関心対象のタンパク質と関連するロングレンジ相互作用を高解像度で研究するためにはChIA-PETがうまく利用されてきた(Li, G. et al., BMC Genomics 15 suppl 12, S11(2014) (非特許文献12))。しかし、開始材料として何千万から何億個もの細胞が必要となることからその適用は制限されてきた。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Gorkin, D.U., et al., Cell Stem Cell 14, 762-775(2014)
【非特許文献2】de Laat, W. & Duboule, D. Nature 502, 499-506(2013)
【非特許文献3】Sexton, T. & Cavalli, G.T. Cell 160, 1049-1059(2015)
【非特許文献4】Babu, D. & Fullwood, M.J. Nucleus 6, 382-393(2015)
【非特許文献5】Dekker, J., et al., Nat.Rev.Genet. 14, 390-403(2013)
【非特許文献6】Denker, A. & de Laat, W. Genes & development 30, 1357-1382(2016)
【非特許文献7】Lieberman, E. Science 326, 289-293(2009)
【非特許文献8】Fullwood, M. J. et al., Nature 462, 58-64(2009)
【非特許文献9】Rao, S.S.P. et al., Cell 159, 1665-1680(2014)
【非特許文献10】Mifsud, B. et al., Nat. Genet. 47,598- 606(2015)
【非特許文献11】Tang, Z. et al., Cell 163, 1611-1627(2015)
【非特許文献12】Li, G. et al., BMC Genomics 15 suppl 12, S11(2014)
【発明の概要】
【0005】
ある態様において、細胞におけるクロマチン相互作用のゲノムワイドな同定の方法が提供される。
【0006】
ある態様において、方法は、ゲノムDNAを有する一組の染色体を含有する細胞を提供する段階;該細胞またはその核を固定剤と共にインキュベートし、架橋DNAを含む固定細胞を提供する段階;該固定細胞のゲノムDNAの近接ライゲーションを行う段階;該細胞からクロマチンを単離してライブラリを提供する段階;および該ライブラリを配列決定する段階を含む。近接ライゲーションは、エクスサイチュライゲーションまたはインサイチュライゲーションであってよい。
【0007】
ある態様において、細胞は真核細胞である。ある態様において、細胞は哺乳動物細胞である。ある態様において、細胞はヒト細胞である。ある態様において、固定剤はホルムアルデヒド、グルタルアルデヒド、ホルマリン、またはそれらの混合物である。ある態様において、近接ライゲーションはインサイチュ近接ライゲーションである。インサイチュ近接ライゲーションは固定細胞を透過処理する段階、制限酵素切断によってDNAを断片化する段階、その後の標識ヌクレオチド充填(fill-in)および近接ライゲーションを行う段階によって行うことができる。制限酵素切断は1つまたは複数の酵素を用いて実施することができる。酵素は4塩基カッターまたは6塩基カッターであってよい。ある態様において酵素はMboIである。標識ヌクレオチド充填は例えばクレノウのようなDNAポリメラーゼ、ならびにdCTP、dGTP、dTTP、およびdATP(これらのうち1つは標識されている)と共にインキュベートすることによって実施できる。ある態様において標識はビオチンである。近接ライゲーションはリガーゼバッファー中でガーゼと共にインキュベートすることによって実施できる。
【0008】
ある態様において、クロマチンは免疫沈降によって単離される。ある態様においては、細胞の核を溶解する段階、超音波処理によってクロマチンをせん断して可溶性クロマチン画分を提供する段階、および可溶性クロマチン画分を免疫沈降に供する段階によってクロマチンが単離される。ある態様において、免疫沈降はDNA結合タンパク質かヒストン修飾のいずれかに対する特異的な抗体を用いて行われる。ある態様においては、クロマチンの単離段階後に反転架橋を行い、ペアエンドシークエンシングの前に標識ジャンクションを濃縮させる。
【0009】
ある態様においては、本発明の方法を行うためのキットが提供される。キットは1つまたは複数の固定剤、制限酵素、アフィニティータグ充填のための1つまたは複数の試薬、近接ライゲーションのための1つまたは複数の試薬、クロマチン単離のための1つまたは複数の試薬、および配列決定のための1つまたは複数の試薬を含有し得る。クロマチン単離のための試薬の例は、本明細書において説明されるような免疫沈降およびアフィニティータグプルダウンのための試薬を含む。
[本発明1001]
以下の段階を含む、細胞におけるクロマチン相互作用のゲノムワイドな同定のための方法:
ゲノムDNAを有する一組の染色体を含有する細胞を提供する段階;
該細胞またはその核を固定剤と共にインキュベートし、タンパク質に架橋されたゲノムDNAを有する複合体を含む固定細胞を提供する段階;
該固定細胞のゲノムDNAの近接ライゲーションを行い、近接してライゲーションされたゲノムDNAを形成する段階;
該細胞から該複合体を単離し、DNAライブラリを提供する段階;および
該DNAライブラリを配列決定する段階。
[本発明1002]
単離段階の前に、近接してライゲーションされた前記ゲノムDNAをせん断する段階をさらに含む、本発明1001の方法。
[本発明1003]
せん断する段階が、超音波処理によって実施される、本発明1002の方法。
[本発明1004]
固定剤が、ホルムアルデヒド、グルタルアルデヒド、ホルマリン、またはそれらの混合物である、本発明1001~1003のいずれかの方法。
[本発明1005]
近接ライゲーションが、以下を含むプロセスによって行われるインサイチュライゲーションである、本発明1001~1004のいずれかの方法:
固定細胞を透過処理する段階;
ゲノムDNAを断片化する段階;および
標識ヌクレオチドを用いて標識ヌクレオチド充填(fill-in)を行い、該ゲノムDNAをライゲーションして、近接してライゲーションされたゲノムDNAを形成する段階。
[本発明1006]
近接ライゲーション段階の前に、ゲノムDNAを有する一組の染色体を含有する前記細胞またはその核が溶解される、本発明1001~1005のいずれかの方法。
[本発明1007]
断片化する段階が、酵素を用いた制限切断によって実施される、本発明1005の方法。
[本発明1008]
前記酵素が、4塩基カッターまたは6塩基カッターである、本発明1007の方法。
[本発明1009]
前記標識ヌクレオチドがタグで標識されている、本発明1005の方法。
[本発明1010]
前記タグがビオチンである、本発明1009の方法。
[本発明1011]
単離段階の後かつ配列決定段階の前に、前記複合体からゲノムDNAをプルダウンする段階をさらに含む、本発明1001~1010のいずれかの方法。
[本発明1012]
前記タンパク質に特異的に結合する抗体を用いた免疫沈降によって前記複合体が単離される、本発明1001~1011のいずれかの方法。
[本発明1013]
前記タンパク質が転写因子である、本発明1012の方法。
[本発明1014]
前記細胞が、哺乳動物の細胞であるか、または組織に由来する、本発明1001~1013のいずれかの方法。
[本発明1015]
以下から選択される1つまたは複数の試薬および生物学的サンプルを含む、本発明1001、1005、または1006の方法を行うためのキット:
固定剤、制限エンドヌクレアーゼ、リガーゼ、DNA結合タンパク質、標識ヌクレオチド、捕捉剤、抗体またはその抗原結合部分、アダプターオリゴヌクレオチドおよび/またはシークエンシングプライマー、溶解バッファー、dNTP、ポリメラーゼ、ポリヌクレオチドキナーゼ、リガーゼバッファー、ならびにPCR試薬。
[本発明1016]
前記捕捉剤がストレプトアビジンである、本発明1015のキット。
【図面の簡単な説明】
【0010】
【
図1-1】
図1a、1b、1c、1d、1e、1f、1g、1h、1iおよび1jは、PLAC-seq法を用いることにより決定された、哺乳動物細胞におけるクロマチン相互作用を例証するものである。(a)PLAC-seqワークフローの概観。ホルムアルデヒド固定細胞を透過処理し、4塩基カッターMboIによって切断し、その後ビオチン充填およびインサイチュ近接ライゲーションを行う。核をその後溶解し、超音波処理によってクロマチンをせん断する。可溶性クロマチン画分をその後、DNA結合タンパク質かヒストン修飾のいずれかに対する特異的抗体を用いた免疫沈降に供する。最後に反転架橋を行い、ペアエンドシークエンシングの前にビオチン標識ライゲーションジャンクションを濃縮させる。(b)Pol II PLAC-seq試験およびChIA-PET試験のシークエンシング結果の比較。
【
図1-2】
図1a、1b、1c、1d、1e、1f、1g、1h、1iおよび1jは、PLAC-seq法を用いることにより決定された、哺乳動物細胞におけるクロマチン相互作用を例証するものである。(c-d)ブラウザプロットはH3K27Ac PLAC-seqおよびPol II PLAC-seqによって明らかとなった高解像度ロングレンジ相互作用の例を示す。c、プロモーター-プロモーター相互作用;d、左図、エンハンサー-エンハンサー相互作用;d、右図、プロモーター-エンハンサー相互作用。
【
図1-3】
図1a、1b、1c、1d、1e、1f、1g、1h、1iおよび1jは、PLAC-seq法を用いることにより決定された、哺乳動物細胞におけるクロマチン相互作用を例証するものである。(e)ChIA-PET相互作用およびPLAC-seq相互作用についての生リード数の箱ひげ図。(f)Pol II PLAC-seq相互作用およびPol II ChIA-PET相互作用の間の重複。(g)インサイチュHi-C同定相互作用と比較した、PLAC-seq相互作用およびChIA-PET相互作用の感度および精度。(h)H3K27ac PLAC-seq、H3K4me3 PLAC-seq、およびインサイチュHi-Cによって同定された相互作用の重複。(i)PLAC-seqとChIA-PETの間のプロモーターおよび遠位DHSのカバレッジの比較。
【
図1-4】
図1a、1b、1c、1d、1e、1f、1g、1h、1iおよび1jは、PLAC-seq法を用いることにより決定された、哺乳動物細胞におけるクロマチン相互作用を例証するものである。(j)Mregプロモーターおよび推定上のエンハンサーにてアンカーされた4C-seq、PLAC-seq、ChIA-PETの比較(1、2、3はChIA-PETでは検出されなかった相互作用を強調する);4Cのアンカーポイントはアスタリスクで印付けられている一方、PLAC-seqおよびChIA-PETのアンカー領域は黒色四角形で印付けられている)。
【
図2A】
図2a、2b、2cおよび2dは、mESC(マウス胚性幹細胞)におけるプロモーターおよびエンハンサーの相互作用の同定を例証する。(a)対応するヒストン修飾関連ゲノム領域においてPLAC-seq相互作用が濃縮されている。
【
図2B】
図2a、2b、2cおよび2dは、mESC(マウス胚性幹細胞)におけるプロモーターおよびエンハンサーの相互作用の同定を例証する。(b)H3K27ac PLAC濃縮(PLACE)相互作用およびH3K4me3 PLACE相互作用の間の重複。
【
図2C】
図2a、2b、2cおよび2dは、mESC(マウス胚性幹細胞)におけるプロモーターおよびエンハンサーの相互作用の同定を例証する。(c)H3K27ac PLACE相互作用およびH3K4me3 PLACE相互作用についてのプロモーター-プロモーター、プロモーター-エンハンサー、エンハンサー-エンハンサーおよび他の相互作用の分布。
【
図2D】
図2a、2b、2cおよび2dは、mESC(マウス胚性幹細胞)におけるプロモーターおよびエンハンサーの相互作用の同定を例証する。(d)異なる遺伝子群の発現の箱ひげ図。H3K27ac PLACE相互作用は他の遺伝子よりも有意に、高度に発現する遺伝子と関連する(Wilcoxon検定、P<2.2e-16)。
【
図3A】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(a)PLAC-seqおよびChIA-PETに必要とされるインプット材料の比較。
【
図3B】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(b)異なるPLAC-seq試験におけるショートレンジリードの主成分の分析(PCA)によって生物学的反復の間の再現性が強調される。
【
図3C】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(c)PLAC-seqショートレンジシスペア(距離< 1 kb)を用いて計算された100万リード当たりキロベース当たりのリード(RPKM)の箱ひげ図より、ChIP-seqピークにおいては無作為に選んだ領域と比べてPLAC-seqシグナルが有意に濃縮されていることが示唆される(***Wilcoxon検定、P<2.2e-16)。
【
図3D】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(d)PLAC-seqからのショートレンジリード(< 1 kb)のシグナルはChIP-seqのものと同様であった。
【
図3E】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(e)PLAC-seqおよびインサイチュHi-Cについての、ChIP濃縮領域における100万当たりのリード(RPM)の箱ひげ図。ロングレンジ(>10 kb)シスリードだけを考慮した(***Wilcoxon検定、P<2.2e16)。
【
図3F】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(f)第3染色体についてのペアワイズ相互作用頻度の散布図。左図、PLAC-seq生物学的反復は再現性が高かった(R
2=0.90);右図、H3K27ac ChIP-seqピークの断片についてPLAC-seqの方に、インサイチュHi-Cと比べて相互作用強度が偏っていた(R
2=0.76)(楕円の点は少なくとも1つのエンドがH3K27acによって結合されている断片ペアを表す)。
【
図3G】
図3a、3b、3c、3d、3e、3fおよび3gは、PLAC-seqの検証を例証するものである。(g)インサイチュHi-Cと比較した、H3K27ac PLAC-seq、H3K4me3 PLAC-seq、およびPol II PLAC-seqにおけるロングレンジシスリード濃縮の例(Juiceboxによって可視化)。
【
図4】第3染色体についてのPLAC-seqの生物学的反復間の相互作用強度の散布図(左図)、ならびにPLAC-seqとインサイチュHi-Cの間の相互作用強度の散布図(右図)を示す(楕円の点は対応するChIP-seqピークに結合されている断片ペアを表す)。
【
図5A】
図5aおよび5bは4V-seqによってPLAC-seqデータを例証するものである。(a)H3K27ac PLAC-seqによって同定されたロングレンジ相互作用は異なる数の細胞を用いても再現性がある。
【
図5B】
図5aおよび5bは4V-seqによってPLAC-seqデータを例証するものである。(b)選択された遺伝子座についての4C、PLAC-seq、ChIA-PETの結果の比較。(4Cのアンカーポイントはアスタリスクで印付けられ、PLAC-seqおよびChIA-PETのアンカー領域は黒色四角形で印付けられる;右の四角形は、ChIA-PETによってユニークに検出されるが4C-seqでは認められないクロマチン相互作用を強調している)。
【発明を実施するための形態】
【0011】
発明の詳細な説明
本発明は少なくとも部分的には、近接ライゲーションをクロマチン免疫沈降および配列決定と組み合わせると、感度が高く費用効率が良い方法でクロマチン相互作用のゲノムワイドな同定を成し遂げられるという予期せぬ発見に基づく。本アプローチは優れた感度、精度、および容易な操作性を示す。例えば、本アプローチの真核細胞への適用によって、エンハンサー-プロモーター相互作用のマッピングが改善される。
【0012】
上で説明したように、遠位エンハンサーによる標的遺伝子の転写活性化においてロングレンジクロマチン相互作用の形成は重要な段階である。これらの相互作用のマッピングは、シス調節エレメントの標的遺伝子を決定し、様々な生理学的状態および病理学的状態と連結する非コード配列変異体の機能をアノテーションすることに役立つ。そのようなマッピングについての従来的なアプローチは一般に、多数の細胞およびディープシークエンシングを必要とする。例えば、満足なカバレッジを得るためには、数十億というシークエンシングリードがしばしば必要である。これは非常にコストがかかり、感度が低い、または正確ではない。
【0013】
本明細書においては、クロマチン相互作用のゲノムワイドな同定のための新規の方法が開示される。近接ライゲーション支援ChIP-seq(PLAC-seq)と呼ばれる本方法は、近接ライゲーションに基づいたクロマチン相互作用解析およびタンパク質特異的DNA結合を利用することにより、優れたロングレンジクロマチン相互作用マッピングを成し遂げるものである。以下にて開示されるように、本方法ではChIA-PETよりも包括的かつ正確な相互作用マップを作製することができる。本方法の実験手順の容易さ、必要とされる細胞の量の少なさ、および費用効率の良さによって、以前のアプローチよりもずっと広い範囲の一連の種、細胞タイプ、および実験設定におけるロングレンジクロマチン相互作用のマッピングが大いに推進される。
【0014】
方法は概して以下を含む:ゲノムDNAを有する一組の染色体を含有する細胞を提供する段階;細胞またはその核を固定剤と共にインキュベートし、タンパク質に架橋されたゲノムDNAを有する複合体を含む固定細胞を提供する段階;固定細胞のゲノムDNAのインサイチュ近接ライゲーションを行い、近接してライゲーションされたゲノムDNAを形成する段階;細胞から複合体を単離し、DNAライブラリを提供する段階;およびDNAライブラリを配列決定する段階。
図1Aにおいてワークフローの一部が示される。段階の幾つかについては以下にてさらに説明される。
【0015】
架橋
本明細書において開示される方法は、ロングレンジ連鎖およびフェージング(phasing)について必要とされるような、ゲノムの遠位領域の間の関係を固定し捕捉するインビトロの技術を含む。
【0016】
本技術は、核における空間的関係性を固定化するために、生きた細胞におけるクロマチンの固定を利用する。本固定においては、産物のその後の処理によって、ゲノム領域間の近接関係のマトリックスが復元され得る。さらなる解析によって、生きた核において物理的に配置されているように、染色体の三次元地図を作製するためにこれらの関係を使用することができる。そのような技術によって、生きた細胞における染色体の個別の空間的構成が説明され、染色体の遺伝子座間の機能的な相互作用の正確な概観が提供される。従来的な機能的研究を制限する1つの問題は、ほかならぬ染色体の近接に起因し得る、データ中に存在する非特異的な相互作用、関係である。本開示においては、これらの非特異的相互作用が、感度のより高い、より正確な、および費用効率のより良い方法でアセンブリについての貴重な情報を提供するために、本明細書において開示される方法によって最小化される。
【0017】
より具体的には、物理的にすぐ近接にあるゲノム領域とタンパク質の間において架橋を作製することができる。クロマチン内における(ヒストンのような)タンパク質の、例えばゲノムDNAのようなDNA分子への架橋は、本明細書において説明される、または当技術分野において公知の好適な方法に従って成し遂げることができる。ある場合においては、2つまたはそれ以上のヌクレオチド配列を1つまたは複数のヌクレオチド配列に結合したタンパク質を介して架橋することができる。化学的または物理学的(例えば光学的)架橋のような多くのアプローチを利用してポリヌクレオチドセグメントの架橋を行うこともできる。好適な化学的架橋剤は、ホルムアルデヒド、グルタルアルデヒド、ホルマリン、およびソラレン(Solomon et al., Proc.Natl. Acad. Sci. USA 82:6470-6474, 1985;Solomon et al., Cell 53:937-947, 1988)を含むが、それらに限定されない。例えば、DNA分子およびクロマチンタンパク質を含む混合物に2%ホルムアルデヒドを加えることによって架橋を行うことができる。DNAを架橋するために使用することができる他の薬剤の例は、マイトマイシンC、ナイトロジェンマスタード、メルファラン、1,3-ブタジエンジエポキシド、シス-ジアミンジクロロ白金(II)およびシクロホスファミドを含むが、それらに限定されない。好適には、架橋剤は比較的短い距離-例えば約2Å-をつなぐ架橋を形成し、それによって反転させることができる密接な相互作用が選択される。別のアプローチは、クロマチンを紫外線照射のような物理学的(例えば光学的)架橋法に曝露するものである(Gilmour et al., Proc. Nat’l. Acad. Sci. USA 81:4275-4279, 1984)。
【0018】
ゲノムDNAの断片化およびアフィニティータグ充填
本明細書において説明される方法は、クロマチンの近接ライゲーションの前にゲノムDNAを断片化する段階に関与する。DNA断片化のための多くの方法が当技術分野においては公知である。したがって断片化は例えば超音波処理、せん断および/または制限酵素のような酵素の使用を含む、クロマチンを断片化するための確立された方法を用いて成し遂げることができる。
【0019】
ある態様においては制限酵素切断が用いられる。シークエンシングリードのほとんどが制限酵素の切断部位の近く(約500 bp)に分布するため、使用される酵素の選択が結果に影響を与え得る。クロマチン相互作用の同定を最大化するため、クロマチン切断に複数の酵素を使用することができる。この目的のためには、任意の1つの6塩基カッター制限酵素でゲノムの5~10%をカバーする近接ライゲーションデータを生み出すことができるが、同じ試験においてそのような酵素を複数用いることによって、ゲノムの80%超をカバーすることができる。さらに、6塩基カッター酵素の代わりに、4塩基カッター酵素または4塩基カッター酵素のセットを用いてゲノムのカバレッジをさらに最大化することができる。
【0020】
本明細書において開示されるPLAC-seq工程は、十分なライブラリが作製される限り、任意の数の制限酵素を用いて行うことができる。カバーされ、マッピングされる塩基の数の観点で、酵素の選択の問題が確実に影響を与える。例えば、6塩基カッター酵素はゲノムにおいて約4 kbごとに切断するため、フェージングされる切断部位に十分近いところに収まるフェージングされ得る多型は比較的少数である。対照的に、4塩基カッター酵素はずっと高い頻度で、(平均)250 bpごとに切断を行う。これに関連して、よりパーセンテージの多型が酵素切断部位近くに収まり、それによりフェージングされる可能性がある。これは、まれな変異体のフェージングに関係する。
【0021】
概して、4塩基カッター酵素または異なる酵素の混合物を利用することによって、より低いシークエンシング読み取り深度で、より高いカバレッジが導かれた。ここでは1つの酵素を用いてPLAC-seqをうまく行うことができる一方、複数の酵素を用いたPLAC-seqからより均一なデータ分布を生み出すことができ、結果的により高い解像度のマップを得ることができる。制限酵素は1、2、3、4、5、6、7、または8塩基長の制限部位を有することができる。制限酵素の例は、
を含むが、それらに限定されない。結果的に生じる断片は様々なサイズであり得る。結果的に生じる断片はまた、5’末端または3’末端における単鎖の突出部分をも含み得る。
【0022】
5’末端または3’末端におけるこれらの単鎖突出部分は、1つまたは複数のアフィニティータグで標識したヌクレオチドによって埋めることができる。アフィニティータグの例はビオチン分子、ハプテン、グルタチオン-S-トランスフェラーゼ、およびマルトース結合タンパク質を含む。タグ充填を捕捉するための技術は当技術分野においては公知である。
【0023】
近接ライゲーション
図1aにおいて示されるワークフローにおいては、DNAシークエンシングライブラリの調製のために近接ライゲーションに基づく方法が用いられ、その後ハイスループットDNAシークエンシングが行われる。近接ライゲーションは(1)未処置の細胞内において(即ちインサイチュ近接ライゲーション、例えばRao, S.S.P.et al., Cell 159, 1665-1680(2014)において説明される手順と同様に)または(2)溶解細胞、溶解された核、もしくは細胞成分を用いて(即ちエクスサイチュ近接ライゲーション、例えばその全ての内容が参照により本明細書に組み入れられる、Lieberman-Aiden et al., Science 326, 289-93(2009)、Selvaraj et al., Nat Biotechnol 31, 1111-8(2013)、または国際公開公報第2015010051号において説明される手順と同様に)行うことができる。より具体的には、タンパク質-タンパク質およびDNA-タンパク質の相互作用を保存するために架橋剤を用いて細胞を架橋することができる。この段階は1~2%のホルムアルデヒドを用いて室温にて10~30分間で行い得る。その後遠心分離によって細胞を採取し、-80℃で保存することができる。低張核溶解バッファー中において細胞を溶解し、その後選択された制限酵素用の1×濃度のバッファー(例えばNew England Biolabsから得られる)で洗浄することができる。使用される酵素によって25 U~400 Uの量の酵素で1時間から一晩、細胞を分解することができる。4塩基カッター酵素はより少量の酵素による短い切断に有利である(例えば25 Uで1時間)一方、6塩基カッター酵素はより多い量の酵素でより長い切断を行うことができる。DNAの末端は、その1つ(例えばdATP)がビオチンのようなアフィニティータグに共有結合されていてもよいdNTPの存在下でクレノウポリメラーゼを用いて修復することができる。サンプルをその後、T4 DNAリガーゼの存在下において4時間ライゲーションすることができる。
【0024】
図1aにおいて示されるように、近接ライゲーションによって、DNA結合タンパク質および近接してライゲーションされたDNAペアを有する複合体が生じる。以下に説明されるように、これらの複合体はさらにせん断され、例えば免疫沈降によって単離されることが可能である。
【0025】
せん断
単離の前に、複合体はさらに加工され得る。上で言及したように、DNAをせん断するための多くの方法が当技術分野においては公知であり、ここで使用することができる。せん断は例えば超音波処理および/または制限酵素の使用を含む、クロマチン断片化のための確立された方法を用いて成し遂げることができる。ある態様においては、超音波処理技術の使用によって約100~5000ヌクレオチドの断片が得られる。
【0026】
免疫沈降
上で言及した複合体を単離するために様々な技術を使用することができる。ある態様においては、免疫沈降を使用することができる。この単離技術は、その特定のタンパク質抗原に特異的に結合する抗体を用いて、タンパク質抗原(例えばDNA結合タンパク質)、およびそれと複合化された他の分子(例えばゲノムDNA)を溶液から沈降させることを可能にする。このプロセスは何千もの異なるタンパク質を含有するサンプルから特定のタンパク質を単離して濃縮するために用いることができる。免疫沈降は手法のある時点で固体の基板に結合されている抗体を用いて実施することができる。
【0027】
本明細書において開示されるように、概して有用なタンパク質抗原はDNA結合タンパク質(転写因子、ヒストン、ポリメラーゼ、およびヌクレアーゼを含む)またはそのようなDNA結合タンパク質と関連する他のものである。上で開示したように、タンパク質はそれが結合するDNAに架橋される。そのようなDNA結合タンパク質に特異的な抗体を使用することによって、タンパク質-DNA複合体を細胞溶解物から免疫沈降することができる。架橋は、当技術分野において公知のより明確および堅実なクロスリンカー(例えばジ-tert-ブチルペルオキシドまたはDTBP)を使用することが有利な場合もが、固定剤、例えばホルムアルデヒドを細胞(または組織)に適用することによって成し遂げることができる。架橋に続き、細胞を溶解して上で説明されるような方法でDNAを小片に分解することができる。免疫沈降の結果として、タンパク質-DNA複合体が精製され、精製されたタンパク質-DNA複合体を加熱し、タンパク質とDNAの複合体のホルムアルデヒド架橋を反転させ、タンパク質からDNAを分離することが可能である。
【0028】
単離されたDNA断片の同定および定量をその後、クローニング、PCR、ハイブリダイゼーション、シークエンシング、およびDNAマイクロアレイ(例えばChIP-on-chipまたはChIP-chip)のような様々な技術によって行うことができる。
【0029】
様々なDNA結合タンパク質を本明細書において開示される方法の標的とすることができる。DNA結合タンパク質の例は以下に説明される。免疫沈降について可能性のある1つの技術的な障害は、関心対象のタンパク質を特異的に標的とする抗体を作製するのが困難なことである。この障害を避けるために、関心対象のタンパク質のC-末端またはN-末端のいずれかに1つまたは複数のタグを操作して、エピトープタグ付加組換えタンパク質を作製することができる。そのようなエピトープタグ付加組換えタンパク質を関心対象の細胞において発現させ、その後本明細書において開示されるPLAC-seqに供することができる。エピトープタグ付加の利点は、多くの異なるタンパク質に同じタグを何度も使用でき、研究者は毎度同じ抗体を使えることである。使用されるタグの例は緑色蛍光タンパク質(GFP)タグ、グルタチオン-S-トランスフェラーゼ(GST)タグ、HA タグ、6xHis、およびFLAG-タグである。
【0030】
アフィニティータグプルダウンおよびライブラリの構築
プロトコルの次の段階は、ライブラリの構築のために免疫沈降されたゲノムDNAの捕捉および分離である。これはアフィニティータグ(例えばビオチン、ハプテン、グルタチオン-S-トランスフェラーゼ、またはマルトース結合タンパク質)のプルダウンによって行うことができる。例えば、分離段階は、免疫沈降させた混合物をアフィニティータグと結合する作用物質と接触させる段階を含み得る。作用物質の例は、アビジン分子、またはハプテンもしくはその抗原結合断片と結合する抗体を含む。ある態様においては、作用物質はマイクロアレイのような支持体に付着させることができる。その場合、支持体はガラス、シリカ、金属、テフロン、および高分子材料から選択される1つまたは複数の基板材料を有する平面状の支持体を含み得る。または、支持体はそれに結合された1つもしくは複数のアフィニティータグ捕捉剤を各々有するビーズの混合物を含み得、ビーズ混合物はニトロセルロース、ガラス、シリカ、テフロン、金属、および高分子材料から選択される1つもしくは複数の基板材料を含み得る。ある態様においてアフィニティータグプルダウンは、その内容が参照により本明細書に組み入れられる、Lieberman-Aiden et al., Science 326, 289-93(2009), Nat.Biotechnol 31, 1111-8(2013)、および国際公開公報第2015010051号において説明される方法で実施することができる。
【0031】
アダプター(例えばイルミナ(Illumina) Tru-Seqアダプター)をその後、DNAにライゲーションすることができる。サンプルをその後、PCRによって増幅させ、十分な材料を得ることができる。PCR増幅ライブラリをさらに精製することができる。PLAC-seqライブラリの複雑性を最大化するために、ライブラリの増幅のためのPCRサイクルの最小限の数を公知の基準に対するqPCRで決定し、配列決定するのに十分な材料を得るために必要なサイクル数を決定することができる。ライブラリをその後、例えばイルミナシークエンスプラットフォームにおいて配列決定することができる。
【0032】
シークエンシング
サンプル中の核酸分子から配列情報を得るために、本明細書において説明される、または当技術分野において公知の様々な好適な配列決定法を使用することができる。配列決定は古典的なサンガーシークエンシング、超並列シークエンシング、次世代シークエンシング、ポロニーシークエンシング、454 パイロシークエンシング、イルミナシークエンシング、SOLEXAシークエンシング、SOLiDシークエンシング、イオン半導体シークエンシング、DNAナノボールシークエンシング、Heliscope 1分子シークエンシング、単分子リアルタイムシークエンシング、ナノポアDNAシークエンシング、トンネル電流DNAシークエンシング、ハイブリダイゼーションによるシークエンシング、質量分析を用いたシークエンシング、顕微溶液サンガーシークエンシング、顕微鏡に基づくシークエンシング、RNAポリメラーゼシークエンシング、インビトロウイルスハイスループットシークエンシング、Maxam-Giblerシークエンシング、シングルエンドシークエンシング、ペアエンドシークエンシング、ディープシークエンシング、ウルトラディープシークエンシングによって成し遂げることができる。
【0033】
シークエンシングからのリードをその後、バイオインフォマティクス解析パイプラインを用いて処理し、ロングレンジのおよび/またはゲノムワイドなクロマチン相互作用のマッピングを行うことができる。例えば、2つのエンドの各々について別々にデフォルト設定を用いたシングルエンドモードにおいて、参照ゲノム(mm9)に対してBWA-MEM(Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv:1303.3997v2(2013))を用いてペアエンド配列を最初にマッピングすることができる。次に、独立にマッピングされたエンドを対にすることができ、ペアは双方のエンドの各々がユニークにマッピングされた場合(MQAL>10)のみ維持される。本試験での染色体内解析については染色体間ペアを破棄してよい。次に、いずれかのエンドが最も近い制限部位(例えばMboI部位)から500 bpよりも離れてマッピングされた場合、リードペアをさらに破棄することができる。リードペアを次にゲノム座標に基づいてソートし、その後Picard toolsのMarkDuplicatesを用いてPCR重複の除去を行うことができる。次に、インサートサイズがデフォルト閾値10 kbの所定の距離より大きな場合、または1 kbより小さい場合の各々において、マッピングされたペアを「ロングレンジ」および「ショートレンジ」に分割することができる。
【0034】
DNA結合タンパク質
本明細書において開示される方法は、DNA結合タンパク質を単離する段階に関与し得る。DNA結合タンパク質の例は転写の過程を調節する転写因子(TF)、様々なポリメラーゼ、リガーゼ、DNA分子を分解するヌクレアーゼ、およびヒストン、高移動度(HMG)タンパク質のようなクロマチン関連タンパク質、メチラーゼ、ヘリカーゼおよび単鎖結合タンパク質、トポイソメラーゼ、リコンビナーゼ、ならびに細胞核における染色体凝縮および転写に関与するクロモドメインタンパク質を含む。例えば米国特許第20020186569号を参照のこと。
【0035】
DNA結合タンパク質は、核酸への結合を容易にする、ジンクフィンガー、ヘリックス・ループ・ヘリックス、ヘリックス・ターン・ヘリックス、およびロイシンジッパーのようなドメインを含み得る。転写活性化因子様エフェクターのような、より珍しい例もある。本明細書において開示される方法を実行するために様々なDNA結合タンパク質を使用することができ、これらのDNA結合タンパク質に関与するクロマチン相互作用を遺伝子発現制御、転写、DNAの重複、修復、およびインプリンティングのようなエピジェネティクスなどの関連生物学的事象と関連付けて同定および解析することができる。
【0036】
あるタンパク質は非配列特異的な方法でDNAに結合するが、多くのタンパク質は特異的なDNA配列に結合する。中でも最もよく研究されているものは遺伝子の転写を制御する転写因子である。各々の転写因子はある特定のDNA配列のセットに結合し、これらの配列をそのプロモーター近くに有する遺伝子の転写を活性化または抑制する。転写因子は2通りの方法でこれを行う。転写因子はまず、転写に寄与するRNAポリメラーゼに直接か、または他のメディエータータンパク質を介して結合し得る;これによりポリメラーゼがプロモーターに配置され、転写が開始される。または、転写因子はプロモーターにおいてヒストンを修飾する酵素に結合できる。これにより鋳型DNAのポリメラーゼへの接近可能性が変化する。DNAのターゲッティングはある生物におけるゲノム全体で起こる。あるタイプの転写因子の活性の変化は、何千もの遺伝子に影響を与え得る。したがってこれらの転写因子はしばしば、環境変化または細胞の分化および発達に対する反応を制御するシグナル伝達過程の標的となる。したがって本明細書において開示される方法は、これらの反応における転写因子をゲノムワイド規模で研究し評価するために使用することができる。
【0037】
標的になり得る転写因子は、前開始複合体の形成に関与する基本転写因子、例えばTFIIA、TFIIB、TFIID、TFIIE、TFIIF、およびTFIIHを含む。それらは広汎に分布し、全てのクラスII遺伝子の転写開始部位の周囲にあるコアプロモーター領域と相互作用する。さらなる例は、構成的活性化型転写因子(例えばSp1、NF1、CCAAT)、条件付活性化型転写因子、発達特異的または細胞特異的な転写因子(例えばGATA、HNF、PIT-1、MyoD、Myf5、Hox、およびウィングドヘリックス)、活性化のために外部シグナルを必要とするシグナル依存的転写因子を含む。シグナルは細胞外リガンド依存的(即ち核内受容体のような内分泌型または傍分泌型のもの)、細胞内リガンド依存的(即ちSREBP、p53、オーファン核内受容体のような自己分泌型のもの)、または細胞膜受容体依存的(例えば、CREB、AP-1、Mef2、STAT、R-SMAD、NF-κB、Notch、TUBBY、およびNFATのような、結果的に転写因子のリン酸化を生じるセカンドメッセンジャーシグナル伝達カスケードに関与するもの)であり得る。これらの転写因子は塩基性ドメイン(例えばロイシンジッパー型因子、ヘリックス・ループ・ヘリックス型因子、ヘリックス・ループ・ヘリックス/ロイシンジッパー型因子、NF-1ファミリー、RF-Xファミリー、およびbHSH)、亜鉛配位DNA結合ドメイン(例えば核内受容体型のCys4ジンクフィンガー、別種のCys4ジンクフィンガー、Cys2His2ジンクフィンガードメイン、Cys6システイン-ジンククラスター、および交互配置型ジンクフィンガー)、ヘリックス・ターン・ヘリックスドメイン(例えばホメオドメイン、ペアードボックス、フォークヘッド/ウィングドヘリックス、熱ショック因子、トリプトファンクラスター、および転写エンハンサー因子)、またはマイナーグルーブ接触を伴うβ-スカフォールド因子(例えばRHR、STAT、p53クラス、MADSボックス、β-バレルα-ヘリックス転写因子、TATA結合タンパク質、HMGボックス、ヘテロメリックCCAAT因子、grainyhead、寒冷ショックドメイン因子、およびRunt)、ならびに他のもの(例えば銅フィストタンパク質、HMGI(Y)(HMGA1)、ポケットドメイン、E1A様因子、およびAP2/EREBP関連因子)を有するものを含む、様々なスーパークラスのものであり得る。
【0038】
キット
本開示によって、本明細書において開示される方法を実施するための1つまたは複数の成分を含むキットがさらに提供される。キットは、上で説明されたものを含む、当業者に明らかな任意の適用について使用することができる。キットは例えば、複数の関連分子、アフィニティータグ、固定剤、制限エンドヌクレアーゼ、リガーゼ、および/またはそれらの組み合わせを含み得る。ある場合において、関連分子は例えば、ヒストンまたは転写因子のようなDNA結合タンパク質を含むタンパク質であり得る。ある場合において、固定剤は、ホルムアルデヒドまたは他の任意のDNA架橋剤であり得る。ある場合において、キットは複数のビーズをさらに含み得る。ビーズは常磁性であってよく、かつ/または、捕捉剤でコーティングされていてもよい。例えば、ビーズはストレプトアビジンおよび/または抗体でコーティングすることができる。ある場合において、キットはアダプターオリゴヌクレオチドおよび/またはシークエンシングプライマーを含み得る。さらに、キットはアダプターオリゴヌクレオチドおよび/またはシークエンシングプライマーを用いてリードペアを増幅できる装置を含み得る。ある場合において、キットは、溶解バッファー、ライゲーション試薬(例えばdNTP、ポリメラーゼ、ポリヌクレオチドキナーゼ、および/またはリガーゼバッファー等)、およびPCR試薬(例えばdNTP、ポリメラーゼ、および/またはPCRバッファー等)を含む他の試薬をも含み得るが、それらに限定されない。キットは、キットの成分の使用および/またはリードペアの作製についての指示書をも含み得る。
【0039】
キットは容器に入っていてよい。キットはまた、生物学的サンプルのための容器を有してもよい。例示的な場合において、キットは生物体からサンプルを得るために使用することができる。例えば、キットは、容器、サンプルを得るための手段、サンプルを保存するための試薬、および使用のための指示書を含み得る。ある場合において、生物体からサンプルを得る段階は生物体から得られたサンプルから少なくとも1つの核酸を抽出する段階を含み得る。例えばキットは、少なくとも1つの核酸を抽出するための少なくとも1つのバッファー、試薬、容器、およびサンプルの移送装置を含有し得る。ある場合において、キットはサンプル中の少なくとも1つの核酸を分析するための材料を含有し得る。例えば、材料は少なくとも1つの対照および試薬を含み得る。キットはポリヌクレオチド切断剤(例えばDNaseI等)ならびにポリヌクレオチド切断反応の実施に関連するバッファーおよび試薬を含有し得る。別の例示的な場合において、キットは核酸を同定するための材料を含有し得る。例えば、キットは本明細書において説明される方法の少なくとも1つを行うための試薬および組成物を含み得る。例えば、試薬は核酸の同定によって生じるデータを解析するためのコンピュータープログラムを含み得る。ある場合において、キットは本明細書において説明される方法および組成物を用いて提供されたデータを解析するソフトウェアを得て使用するためのソフトウェアまたはライセンスをさらに含み得る。別の例示的な場合においてキットは、生物学的サンプルを保存するため、および/または実験施設まで運搬するために使用できる試薬を含有し得る。
【0040】
使用および適用
本明細書において説明される方法およびキットは、核酸内の部位において結合するタンパク質のパターンを決定するために使用することができる。本方法およびキットは、ある核酸サンプル内、または複数の核酸サンプルに渡っての遺伝子の発現とタンパク質結合パターンを相関付けるためにさらに使用することができる。本方法およびキットは、ある核酸サンプル内、または複数の核酸サンプルに渡っての調節ネットワークを構築するために使用することができる。他の使用の例は、DNA結合部位および/または調節DNAにおける機能的変異体/突然変異の同定、転写開始部位の同定、複数の細胞タイプまたは複数の生物体における転写因子ネットワークのマッピング、転写因子ネットワークの作製、細胞タイプ特異的または細胞期特異的な転写因子の挙動のネットワーク解析、転写因子およびクロマチンの接近可能性および機能、プロモーター/エンハンサークロマチンシグネチャー、調節DNAにおける疾患および形質関連変異体、疾患関連変異体および転写調節経路、異常細胞の同定、ならびに関連スクリーニングアッセイを含む。
【0041】
本方法およびキットは、核酸サンプルの発達の状態、多能性の状態、分化および/または不死化の状態を決定するために;核酸サンプルの一時的な状態を確立するために;核酸サンプルの生理学的状態および/または病理学的状態を同定するために使用することができる。
【0042】
ある例においては、本方法およびキットは、遺伝子の活性化、転写の開始、タンパク質結合パターン、タンパク質結合部位およびクロマチン構造を評価または予測するために使用することができる。ある場合において、本方法およびキットは遺伝子発現についての一時的な情報(例えば過去、未来または現在の遺伝子発現または活性)を検出するために使用することができる。例えば、情報によって過去に生じた遺伝子活性化事象を説明することができる。ある場合においては情報によって現在の遺伝子活性化事象を説明することができる。ある場合においては、情報によって遺伝子の活性化を予測することができる。本明細書において説明される方法およびキットは、生理学的状態または病理学的状態を説明するために使用することができる。ある場合において、病理学的状態はある疾患の診断および/または予後を含み得る。
【0043】
本明細書において開示される方法を用いて、タンパク質(例えば転写因子)が核酸(例えばゲノムDNA)と結合する多数(例えば10、102、103、104、105、106、または107)の部位が同定され得る。ある場合において、転写因子の核酸への結合は調節領域内である。これらの事象は複数の転写因子の多数の個別のエレメントへの示差的な結合を表し得る。ある場合において、転写因子に会合または結合された個別のエレメントの数は、10、50、500、1000、2500、5000、7500、10000、25000、50000、または100000より多い。個別のエレメントはより長い核酸配列内の短い配列エレメントであってよい。配列エレメントへの転写因子の示差的な結合は、DNA結合タンパク質についての保存認識配列のレパートリーをコードし得るゲノム配列コンパートメントを含み得る。ゲノム配列コンパートメントは、以前から知られている部位および、本明細書において説明される方法を使用するまでまだ同定されていなかった可能性のある新規の部位を含み得る。ある場合において、方法は進化的、構造的および機能的プロファイルを有するエレメントを含有し得るシス調節レキシコンを決定するために使用することができる。
【0044】
ある場合において対立遺伝子のクロマチンの状態に影響を与え得る遺伝的変異体が同定され得る。ある場合において、遺伝的変異体はタンパク質のDNA配列への結合を変化させ得る。ある場合において、遺伝的変異体は修飾(例えばDNAメチル化)を受け得ない結合部位に位置することが可能である。
【0045】
本方法およびキットは、新規の核酸(例えばDNA)配列を認識する結合タンパク質(例えばDNA結合タンパク質)を同定するために使用することもできる。結合タンパク質および認識配列の同定は、インビボまたはインビトロのいずれかで行うことができる。ある場合において、結合タンパク質および認識配列の同定は、単一の生物体から採取されたサンプルにおいて行うことができる。ある場合において、結合タンパク質および認識配列の同定は、異なる生物体から採取されたサンプルにおいて行うことができる。ある場合において、結合タンパク質および認識配列の同定は少なくとも1つの生物体から採取されたサンプルに渡って解析することができる。例えば、解析によって、結合タンパク質および認識配列の同定から進化的、機能的シグネチャーを得られることが決定され得る。
【0046】
本方法は、新規の調節因子認識モチーフを同定するために使用することができる。ある場合において新規の調節因子認識モチーフは、ある種の中における複数の遺伝子、細胞、および/または組織タイプに渡って配列および/または機能において保存され得る。ある場合において認識モチーフは、複数の種にまたがって複数の遺伝子、細胞、および/または組織タイプに渡って、配列および/または機能において保存され得る。ある場合において新規の調節因子認識モチーフは、ある種の中における複数の遺伝子、細胞、および/または組織タイプに渡って、配列および/または機能において保存され得ない。ある場合において新規の調節因子認識モチーフは、複数の種にまたがって複数の遺伝子、細胞、および/または組織タイプに渡って、配列および/または機能において保存され得ない。新規の調節因子認識モチーフは、1つまたは2つ以上のユニークな結合タンパク質による占有の細胞選択的パターンを有し得る。新規の調節因子認識モチーフは、1つまたは2つ以上のユニークな結合タンパク質による占有の細胞選択的パターンを有し得ない。ある場合において新規の調節因子認識モチーフは、例えばモチーフ一覧表のような一覧表に整理され得る。
【0047】
ロングレンジクロマチン相互作用(例えば本明細書において開示されるPLACE相互作用)のマップをアセンブルして調節ネットワーク(例えば転写因子ネットワーク)を表すことが可能である。調節ネットワークのそのようなマップによって、調節ネットワークの回路網、ダイナミクス、および/または編成原理についての説明が提供され得る。例えばマップは、ある場合にはクロマチン相互作用部位を含有し得るポリヌクレオチド断片のライブラリから作製することができる。ある場合においてマップは、全ゲノムに渡るクロマチン相互作用を含み得る。例えば、マップは少なくとも1つのポリヌクレオチド断片のライブラリを少なくとも1つの異なるポリヌクレオチド断片のライブラリと整列させることによって作製することができる。ある場合において、ポリヌクレオチド断片を配列決定することができる。ある場合において整列化は、少なくとも1つのポリヌクレオチドの配列を少なくとも1つの異なるポリヌクレオチドの配列と整列させるものである。ある場合において整列化は、少なくとも1つのポリヌクレオチド断片の配列決定を含み得ない。例えば、整列させたライブラリは、調節ネットワークを決定するために解析できる情報を含み得る。ある場合において調節ネットワークは、数百もの配列特異的TFの間の繋がりを説明し得る。ある場合において調節ネットワークは、複数の細胞タイプおよび組織タイプに渡る、これらの繋がりのダイナミクスを解析するために使用することができる。
【0048】
細胞および組織のサンプルは幾つかのクラスの細胞タイプを含み得る。サンプルは核酸を含有し得る任意の生物学的材料を含み得る。サンプルは、様々な供給源に由来するものでよい。ある場合において供給源は、ヒト、ヒトではない哺乳動物、哺乳動物、動物、齧歯類、両生類、魚、爬虫類、微生物、細菌、植物、菌類、酵母、および/またはウイルスであってよい。例としては、限られた増殖能を有する初代培養細胞、不死化、悪性腫瘍由来もしくは多能性の培養細胞系、最終分化細胞、自己複製細胞、初代造血細胞、精製分化造血細胞、病原体(例えばウイルス)に感染した細胞、ならびに/または様々な多能性前駆細胞および多能性の細胞もしくは幹細胞が含まれる。ある場合において細胞および組織のサンプルは、受胎後の胎児組織サンプルであってよい。
【0049】
本開示において提供される核酸サンプルは、ある生物体に由来してよい。そのために、生物体の全体またはその部分を使用できる。生物体の部分は、器官、複数の組織を含む組織片、単一の組織を含む組織片、混合組織源の複数の細胞、単一の組織源の複数の細胞、単一組織源の単一の細胞、混合組織源の複数の細胞に由来する無細胞核酸、単一組織源の複数の細胞に由来する無細胞核酸、および単一の組織源の単一の細胞に由来する無細胞核酸ならびに/または体液を含み得る。ある場合においてある生物体の部分は、ミトコンドリア、核、または本明細書において説明される他のコンパートメントのようなコンパートメントである。組織は、神経堤、内胚葉、外胚葉、および/または中胚葉のような胚葉の任意のものに由来してよい。ある場合において、器官は腫瘍のような新生物を含有してよい。ある場合において、腫瘍は癌であってよい。
【0050】
サンプルは、細胞培養、組織切片、凍結切片、生検サンプル、および剖検サンプルを含み得る。サンプルは組織学的な目的のために得ることができる。サンプルは、臨床サンプル、環境試料、または研究サンプルであってよい。臨床サンプルは、鼻咽頭洗浄液、血液、血漿、無細胞血漿、軟膜、唾液、尿、糞便、痰、粘液、創傷スワブ、組織生検、乳、吸引液、スワブ(例えば鼻咽頭スワブ)、および/または組織をとりわけ含み得る。環境試料は、水、土壌、エアロゾル、および/または空気をとりわけ含み得る。サンプルは、診断目的のためにまたはモニタリングの目的のために(例えば疾患または障害の過程をモニタリングするために)採取することができる。例えば、ポリヌクレオチドのサンプルを、疾患もしくは障害を有する対象、疾患もしくは障害を有するリスクのある対象、または疾患もしくは障害を有することが疑われる対象から採取する、または得ることができる。
【0051】
本方法は、複数の供給源から採取された核酸(例えばゲノムDNA)を含有するサンプルに適用することができる。供給源は細胞挙動または細胞期のステージにある細胞であってよい。細胞挙動の例は、細胞周期、有糸分裂、減数分裂、増殖、分化、アポトーシス、ネクロシス、老化、非分裂、静止、過形成、新形成および/または多能性を含む。ある場合において、細胞は細胞の成熟または老化の時期または状態にあってよい。ある場合において細胞の成熟の時期または状態は、幹細胞から最終細胞タイプへの分化の過程における時期または状態を含み得る。
【0052】
本明細書において開示されるPLAC-seqアプローチは、各々の細胞挙動または細胞期または細胞源についての各々のPLACE(PLAC-濃縮)相互作用を得るために使用することができる。そのような相互作用の各々は、各々の細胞挙動または細胞期または細胞源に特定的な遺伝子調節シグネチャーまたはプロファイルを表し、臨床的な目的のために使用することができる。
【0053】
本明細書において説明される方法およびキットは、作用物質のライブラリから少なくとも1つの作用物質をスクリーニングし、遺伝子調節シグネチャーまたはプロファイルに対して特定の効果を誘発する可能性のある作用物質を同定するために使用することができる。作用物質は、薬剤、化学物質、化合物、小分子、バイオシミラー、模倣薬、糖、タンパク質、ポリペプチド、ポリヌクレオチド、RNA(例えばsiRNA)、または遺伝子治療剤であってよい。標的は、生物体、器官、組織、細胞、細胞小器官、細胞小器官の部分、クロマチン、タンパク質、核酸(例えばゲノムDNA)または核酸であってよい。スクリーニングは、本明細書において説明される方法および組成物と組み合わせることができるハイスループットスクリーニングおよび/またはアレイスクリーニングを含み得る。
【0054】
定義
本明細書において開示されるように、多くの値の範囲が提供される。介在する各々の値は、文脈によって特に明らかに指示されない限り、最低限の単位の10分の1まで、範囲の上限と下限の間も具体的に開示されたものであると理解される。記載された任意の値の間の各々の小範囲または記載された範囲内にある介在値および記載された範囲内にある任意の他の記載された値または介在値は、本発明の範囲内に包含される。これらの小範囲の上限および下限は範囲内に独立して含まれ得、または除外され得、いずれか、または双方の限界が小範囲に含まれる、またはいずれも含まれないような各々の範囲も本発明の範囲内に包含され、記載された範囲内における具体的に除外された任意の限界によって制限される。記載された範囲が限界の一方または双方を含む場合、含まれるそれらの限界のいずれかまたは両方を除外した範囲も本発明の範囲に含まれる。
【0055】
「約」という用語は概して、指示された数のプラスまたはマイナス10%を指す。例えば「約10%」は9%~11%の範囲を示し得、「約1」は0.9~1.1を意味し得る。「約」の他の意味は、四捨五入のように文脈から明らかになり得、例えば「約1」は0.5~1.4をも意味し得る。
【0056】
「生物学的サンプル」という用語は、生物体(例えば患者)または生物体の構成要素(例えば細胞)から得られるサンプルを指す。サンプルは、任意の生物学的組織、細胞または液体のものであってよい。サンプルは、ヒト患者のような対象に由来するサンプルである、「臨床サンプル」であってよい。そのようなサンプルは、唾液、痰、血液、血液細胞(例えば白血球)、羊水、血漿、精液、骨髄、および組織または細針生検サンプル、尿、腹水、および胸膜腔内液、またはそれらからの細胞を含むが、それらに限定されない。生物学的サンプルは、組織学的な目的のために採取された凍結切片のような組織の切片をも含み得る。生物学的サンプルは、実質的に精製または単離されたタンパク質、膜調製物、または細胞培養をも含み得る。
【0057】
「核酸」はDNA分子(例えばゲノムDNA)、RNA分子(例えばmRNA)、またはDNAもしくはRNAアナログを指す。DNAまたはRNAアナログは、ヌクレオチドアナログから合成することができる。核酸分子は単鎖または二重鎖であってよいが、好ましくは二重鎖DNAである。
【0058】
「標識ヌクレオチド」または「標識塩基」という用語は、リガンドに対する独特の親和性を有する特異的な部分を含むマーカーまたはタグを付着させたヌクレオチド塩基を指す。または、結合パートナーがマーカーもしくはタグに対する親和性を有し得る。ある例においてマーカーは、ビオチン、ヒスチジンマーカー(即ち6xHis)、またはFLAGマーカーを含むがそれらに限定されない。例えば、dATP-ビオチンは標識ヌクレオチドであると考えられる。ある例においては、断片化された核酸配列は標識ヌクレオチドを用いた末端平滑化を経て、その後平滑末端ライゲーションを行うことができる。「標識」または「検出可能な標識」という用語は、分光学的、光化学的、生化学的、免疫化学的、電気的、光学的、または化学的手法によって検出可能な任意の組成物を指すように本明細書において使用される。そのような標識は標識ストレプトアビジン結合によって染色するためのビオチン、磁気ビーズ(例えばDynabeads(商標))、蛍光色素(例えばフルオレセイン、テキサスレッド、ローダミン、緑色蛍光タンパク質等)、放射性標識(例えば3H、125I、35S、14C、または32P)、酵素(例えば西洋ワサビペルオキシダーゼ、アルカリホスファターゼ、およびELISAにおいて一般的に使用される他のもの)、およびコロイド金もしくは色ガラスのような発色標識、またはプラスチック(例えばポリスチレン、ポリプロピレン、ラテックス等)ビーズを含む。本発明において企図される標識は多くの方法によって検出または単離されることが可能である。
【0059】
本明細書における「親和性(アフィニティー)結合分子」または「特異的結合ペア」は、結合条件と呼ばれるある条件下において互いに親和性を有し結合する2つの分子を意味する。ビオチンとストレプトアビジン(またはアビジン)は「特異的結合ペア」の例であるが、本発明はこの特定の特異的結合ペアの使用には限定されない。本発明の多くの態様において、ある特定の特異的結合ペアの一員は「アフィニティータグ分子」または「アフィニティータグ」と呼ばれ、もう一方は「アフィニティータグ結合分子」と呼ばれる。アフィニティータグ分子およびアフィニティータグ結合分子の双方を含む、広範な種類の他の特異的結合ペアまたは親和性結合分子が当技術分野において知られており(例えば、米国特許第6,562,575号を参照のこと)、本発明において使用できる。例えば、抗原と該抗原に結合するモノクローナル抗体を含む抗体は特異的結合ペアである。また、抗体と黄色ブドウ球菌(Staphylococcus aureus)プロテインAのような抗体結合タンパク質を特異的結合ペアとして採用することもできる。特異的結合ペアの他の例は、レクチンが特異的に結合する糖鎖とレクチン;ホルモンと該ホルモンの受容体;および酵素と該酵素の阻害剤を含むが、それらに限定されない。
【0060】
本明細書において使用される場合、「オリゴヌクレオチド」という用語は、典型的に300ヌクレオチド長以下(例えば5~150ヌクレオチドの範囲、好ましくは10~100ヌクレオチドの範囲、より好ましくは15~50ヌクレオチドの範囲の長さ)の短いポリヌクレオチドを指す。しかし、本明細書において使用される場合、該用語はより長いまたはより短いポリヌクレオチド鎖を包含することも意図される。「オリゴヌクレオチド」は他のポリヌクレオチドにハイブリダイズすることができるため、ポリヌクレオチド検出のためのプローブ、またはポリヌクレオチド鎖伸長のためのプライマーとしての役割を担う。
【0061】
「伸長ヌクレオチド」は、増幅中に伸長産物に取り込まれることができる任意のヌクレオチド、即ちDNA、RNA、または標識を含み得るDNAもしくはRNAの誘導体を指す。
【0062】
本明細書において使用されるような「染色体」という用語は、通常タンパク質をコードする、遺伝子と呼ばれる一組の機能領域を含む、天然に存在する核酸配列を指す。他の機能領域は、ミクロRNAまたは長い非コードRNA、または他の調節エレメントを含み得る。これらのタンパク質は生物学的機能を有し得る、または、同じもしくは別の染色体(即ち例えば調節染色体)と直接相互作用する。
【0063】
「ゲノム」という用語は、それらが含有する遺伝子を含めた任意の一組の染色体を指す。例えば、ゲノムは、真核ゲノムおよび原核ゲノムを含み得るがそれらに限定されない。「ゲノム領域」または「領域」という用語は、任意の定義付けられた長さのゲノムおよび/または染色体を指す。または、ゲノム領域は完全な染色体または部分的な染色体を指し得る。さらに、ゲノム領域は染色体上の特定の核酸配列(即ち例えばオープンリーディングフレームおよび/または調節遺伝子)を指し得る。
【0064】
「断片」という用語は、それが由来する配列より短い任意の核酸配列を指す。断片は数メガベースおよび/またはキロベースからほんの数ヌクレオチド長という範囲に渡る、任意のサイズのものであってよい。制限酵素切断、超音波処理、酸性インキュベーション、塩基性インキュベーション、顕微溶液化等を含むがそれらに限定されない実験条件から、予測される断片サイズが決定され得る。
【0065】
「断片化」という用語は、化合物または組成物がより小さな単位に分離される、任意のプロセスまたは方法を指す。例えば、分離は、酵素的分解(即ち例えば、トランスポゼース仲介の断片化、核酸に対する制限酵素の作用、またはタンパク質に対するプロテアーゼ酵素の作用)、塩基加水分解、酸加水分解、または熱誘導の熱不安定化を含み得るがそれらに限定されない。
【0066】
「固定する」、「固定」、または「固定された」という用語は、任意のおよび全ての細胞プロセスを固定化する任意の方法またはプロセスを指す。したがって固定された細胞は、固定時における細胞内成分の間の空間的関係を正確に保持する。ホルムアルデヒド、ホルマリン、またはグルタルアルデヒドを含むがそれらに限定されない多くの化学物質によって固定を行うことができる。
【0067】
「架橋する」または「架橋」という用語は、一単位としてさらに加工されることが可能であるような、2つの化合物の間における安定した任意の化学的会合を指す。そのような安定性は共有結合および/または非共有結合に基づくことが可能である。例えば、核酸および/またはタンパク質は、化学物質(即ち例えば固定剤)によって、常用の実験手順(即ち例えば、抽出、洗浄、遠心分離等)の過程でその空間的関係が保持されるように架橋されてよい。
【0068】
本明細書において使用されるような「ライゲーションされた」という用語は、通常リン酸ジエステル結合を含む2つの核酸配列の任意の結合を指す。結合は通常、補助因子試薬およびエネルギー源(即ち例えば、アデノシン三リン酸(ATP))の存在下における触媒酵素(即ち例えばリガーゼ)の存在によって促進される。
【0069】
「制限酵素」という用語は、特定の塩基対配列で核酸を切断する任意のタンパク質を指す。
【0070】
本明細書において使用される場合、「ハイブリダイゼーション」という用語は、相補的な(部分的に相補的な、を含む)ポリヌクレオチド鎖の対形成を指す。ハイブリダイゼーションおよびハイブリダイゼーションの強さ(例えば、ポリヌクレオチド鎖の間の会合の強さ)は、ポリヌクレオチドの間の相補性の度合い、塩類濃度のような条件によって影響される関与条件のストリンジェンシー、形成されたハイブリッドの融解温度(Tm)、他の成分の存在、ハイブリダイズする鎖のモル濃度、およびポリヌクレオチド鎖のG:C含量を含む、当技術分野において周知の多くの要因に影響される。あるポリヌクレオチドが別のポリヌクレオチドに「ハイブリダイズする」と言われる場合、それは2つのポリヌクレオチドの間にある程度の相補性があること、または、高ストリンジェンシー条件下において2つのポリヌクレオチドがハイブリッドを形成することを意味する。あるポリヌクレオチドが別のポリヌクレオチドにハイブリダイズしないと言われる場合、それは2つのポリヌクレオチドの間に配列相補性がないこと、または高ストリンジェンシー条件下において2つのポリヌクレオチドの間でハイブリッドが形成されないことを意味する。
【0071】
ある態様において、真核細胞におけるクロマチン相互作用のゲノムワイドな同定のための、感度が高く費用効率の良い方法が提供される。近接ライゲーションとクロマチン免疫沈降および配列決定とを組み合わせることで、本方法では優れた感度、精度、および容易な操作性が示される。例えば本方法の真核細胞への適用によって、エンハンサー-プロモーター相互作用のマッピングが改良される。
【0072】
ロングレンジクロマチン相互作用マッピングのロバスト性を損なわずにインプット材料の量を減らすため、ある態様においては、ホルムアルデヒド架橋およびインサイチュ近接ライゲーションをクロマチン免疫沈降および配列決定と組み合わせる、本明細書においてProximity Ligation Assisted ChIP-seq(PLAC-seq)と呼ばれる方法が提供される(
図1a)。PLAC-seqは、100,000個だけの細胞を用いて、または公開されているChIA-PETプロトコル(Fullwood, M.J. et al., Nature 462, 58-64(2009) およびTang, Z. et al., Cell 163, 1611-1627 (2015) )よりも3桁小さい規模で、より包括的かつ正確な方法でロングレンジクロマチン相互作用を検出することができる(
図3a)。ある態様においてPLAC-seqは、マウスES細胞で、RNAポリメラーゼII(Pol II)、H3K4me3、およびH3K37acに対する抗体を用いて行われ、転写因子またはクロマチンマークと関連するゲノム位置におけるロングレンジクロマチン相互作用が決定された(表1)。
【0073】
Pol II PLAC-seqとChIA-PET試験を比べた場合、PLAC-seqから生じるシークエンシングライブラリの複雑性はChIA-PETよりもずっと高い。結果として、Pol II PLAC-seq試験からは、以前に公開されたPol II ChIA-PET試験よりも10倍多くの配列リードが得られ、440倍多くのモノクローナルロングレンジ(>10kb)シスリードペアが収集された(Zhang, Y. et al., Nature 504, 306-310(2013) )(
図1b)。さらに、PLAC-seqライブラリには染色体間ペアが実質的により少なく(48%に対して11%)含まれていた一方、ロングレンジ染色体内ペアはずっと多く(9%に対して67%)、相互作用検出のために使用可能なリードが有意に多かった(0.6%に対して25%)。したがって、PLAC-seqはChIA-PETよりもずっと費用効率が良い(
図1b)。
【0074】
【0075】
PLAC-seqデータの品質を評価するために、まずマウスES細胞について以前に収集された、対応するChIP-seqデータ(ENCODE)(Shen, Y. et al., Nature 488, 116-120(2012))と比較し、PLAC-seqリードは因子結合部位において有意に濃縮されており(P<2.2e-16)、生物学的反復間での再現性が高い(ピアソン係数 >0.90)ことが見出された(
図3b-g、
図4)。したがって以降の解析には2つの生物学的反復のデータを組み合わせた。公開されているアルゴリズム「GOTHiC」(Schoenfelder, S. et al., Genome Res. 25, 582-597(2015))を用いて各データセットのロングレンジクロマチン相互作用を同定した。250万個、50万個、および10万個の細胞を用いてH3K27ac PLAC-seqによって同定された、再現性の高い相互作用が認められた(
図5a)。さらに、インサイチュHi-Cデータにより正規化されたPLAC-seqシグナルから、100,000個の細胞でも半キロベースペア解像度における相互作用が明らかにされた(
図1c-d)。Pol II PLAC-seq試験、H3K27ac PLAC-seq試験、またはH3K4me3 PLAC-seq試験から各々、計60,718、271,381、および188,795の有意なロングレンジ相互作用が同定された。
【0076】
以前にマウスES細胞でPol IIによるChIA-PETが行われていることから、比較のための参照データセットが提供されている(Zhang, Y. et al., Nature 504, 306-310(2013) )。PLAC-seq相互作用領域からの生リード数を調べた後、各クロマチンの接触が典型的に20~60個のユニークなリードによって支持されることが見出された。対照的に、ChIA-PET解析において同定されたクロマチン相互作用は概して、10個未満のユニークなペアによって支持されていた(Zhang, Y. et al., Nature 504, 306-310(2013) )(
図1e)。次に、Pol II PLAC-seq解析ではPol II ChIA-PETよりもずっと多くの相互作用が同定され(約10,000に対して約60,000)、PLAC-seqの10%がChIA-PET 染色体内相互作用の35%と重複することが見出された(FDR<0.05およびPET数>=3)(
図1f)。各々の方法の感度および精度をさらに調べるため、同じ細胞系についてインサイチュHi-Cを行い、930億~12億個のペアエンドシークエンシングリードから3億個のユニークなロングレンジ(>10 kb)シスペアを収集した。「GOTHiC」を用い、464,690個のロングレンジクロマチン相互作用が同定された。Pol II PLAC-seqにおいて認められたクロマチン相互作用の94%がインサイチュHi-C相互作用の28%と重複する一方、ChIA-PETによって検出された接触の44%はインサイチュHi-Cによる接触の2%未満としか合致しないことが見出された(
図1g)。H3K27ac PLAC-seq相互作用およびH3K4me3 PLAC-seq相互作用についても試験され、これらの2つのマークによって同定された相互作用は共にインサイチュHi-C相互作用の68%を復元することが見出された(
図1h)。加えて、PLAC-seq相互作用が概して、プロモーターおよび遠位DNaseI高感受性部位(DHS)のような調節エレメントに対して、ChIA-PETと比べてより高いカバレッジを有することが認められた(
図1i)。まとめると、上記の開示によってPLAC-seqのChIA-PETを上回る優れた感度および特異性が支持される。
【0077】
PLAC-seqの信頼度をさらに確証するために、4個の選択された領域における4C-seq解析を行った(表2)。
【0078】
ほとんどの相互作用はChIA-PET法およびPLAC-seq法の双方によって独立して検出された(
図1j、左図、および
図5b)が、4C-seqによって決定された3つの強い相互作用(
図1jにおいて1、2、3と印付けられる)があり、これらはPLAC-seqで検出されたが、ChIA-PETでは検出されなかった。逆に、クロマチン相互作用がChIA-PETによってユニークに検出されたが、4C-seqでは認められなかったという場合があり(
図5bにおいて右の四角形によって強調される)、これはPLAC-seqのChIA-PETを上回る優れた性能を改めて支持するものである。マウスES細胞におけるプロモーターおよび活性エンハンサーの相互作用について研究するために、H3K4me3 PLAC-seqおよびH3K27ac PLAC-seqのデータセットを調べた。PLAC-seq相互作用は対応するChIP-seqピークについて、インサイチュHi-C相互作用と比べて高度に濃縮されていた(
図2a)。クロマチン免疫沈降による濃縮のおかげで、インサイチュHi-Cと比べてPLAC-seqにおいて特に濃縮された相互作用のさらなる調査が可能になった。そのような相互作用を同定することにより、特定のタンパク質またはヒストンマークに関連するクロマチンの高次構造を理解することが可能になる。これを達成するために、PLAC-seqにおいてインサイチュHi-Cに比べて有意に濃縮された相互作用を検出する、二項検定を用いた計算法が開発された。このタイプの相互作用は「PLACE」(PLAC濃縮)相互作用と名付けられた。マウスES細胞における総計28,822個および19,429個の有意なH3K4me3 PLACE相互作用またはH3K27ac PLACE相互作用(q<0.05)(
図4、5)が各々同定された。H3K27ac PLACE相互作用の26%がH3K4me3 PLACE相互作用の19%と重複し、それらが異なるセットのクロマチン相互作用を有することが示唆された(
図2b)。H3K27ac PLACE相互作用の大多数はエンハンサー関連相互作用である(74%)一方、H3K4me3 PLACE相互作用は一般にプロモーターと関連する(78%)(
図2c)。H3K27ac PLACE相互作用とH3K4me3 PLACE相互作用の間の差異から、これら2つのタイプの相互作用についてのさらなる研究が導かれた。H3K27ac PLACE相互作用およびH3K4me3 PLACE相互作用に関連する遺伝子の発現レベルを試験して、H3K27ac PLACE相互作用において関与する遺伝子はH3K4me3 PLACE相互作用に関連する遺伝子よりも有意に高い発現レベルを有することが決定され(P<2.2e-16、
図2d)、活性エンハンサーにおけるクロマチン相互作用を見出すために以前のアッセイが有用であることが示唆された。
【0079】
【実施例0080】
材料および方法
細胞培養および固定
以前にGribnau, J., et al., Genes & development 17, 759-773(2003)において説明されたF1カスタネウスマウス×S129/SvJaeマウスESC系(F123系)はRudolf Jaenisch博士の研究室から贈与された。Selvaraj, S. et al., Nat.Biotechnol. 31, 1111-1118(2013)において以前に説明されたようにF123細胞を培養した。固定前に細胞を一旦0.1%ゼラチン被覆、フィーダーフリープレート上にて継代培養した。
【0081】
細胞を固定するために、アキュターゼ処理の後に細胞を採取し、Knockout Serum Replacementを加えない培地中に1 ml当たり1×106細胞の濃度で懸濁した。メタノールを含まないホルムアルデヒド溶液を最終濃度1%(v/v)まで加え、室温にて15分間回転させた。2.5 Mグリシン溶液を最終濃度0.2 Mまで加え、室温にて5分間回転することによって反応を停止した。3,000 rpmで5分間、4℃での遠心分離によって細胞をペレット化し、冷温PBSを用いて一回洗浄した。洗浄した細胞を遠心分離によって再度ペレット化し、液体窒素で急速凍結し、-80℃で保存した。
【0082】
PLAC-seqプロトコル
PLAC-seqプロトコルは3つの部分を含む:インサイチュ近接ライゲーション、クロマチン免疫沈降またはChIP、ビオチンプルダウンに引き続くライブラリ構築および配列決定。インサイチュ近接ライゲーションおよびビオチンプルダウンの工程は、以下で説明されるような小さな変更はあるが、以前に公開されているインサイチュHi-Cプロトコル(Rao, S.S.P. et al., Cell 159, 1665-1680(2014) )と同様であった。
【0083】
1.インサイチュ近接ライゲーション。50万~500万個の架橋F123細胞を氷上で解凍し、冷温溶解バッファー(10 mM Tris、pH 8.0、10 mM NaCl、0.2% IGEPAL CA-630、プロテイナーゼ阻害剤を含む)中で15分間溶解し、その後溶解バッファーを用いて一回の洗浄を行った。細胞をその後、50μlの0.5% SDS中に再懸濁し、62℃で10分間インキュベートした。25μlの10% Triton X-281100および145μlの水を加えることによって透過処理を停止し、37℃で15分間インキュベートした。NEBuffer 2~1×および100単位のMboIを加えた後、サーモミキサーにおいて1,000 rpmで振盪しながら37℃で2時間切断を行った。62℃で20分間MboIを不活性化した後、各々15 nmolのdCTP、dGTP、dTTP、ビオチン-14-dATP(Thermo Fisher Scientific)、および40単位のクレノウを添加した後、サーモミキサーにおいて37℃で1.5時間ビオチン充填反応を行った。1×T4 リガーゼバッファー、0.1 mg/ml BSA、1% Triton X-100、および4000単位のT4リガーゼ(NEB)を含有する総容量1.2 mlにおいて、室温で低速回転しながら近接ライゲーションを行った。
【0084】
2.ChIP。近接ライゲーション後、2,500 gで5分間核を遠心沈殿し、上清を捨てた。核をその後、プロテイナーゼ阻害剤を含む130μlのRIPAバッファー(10 mM Tris、pH 8.0、140 mM NaCl、1 mM EDTA、1% Triton X-100、0.1% SDS、0.1% デオキシコール酸ナトリウム)に再懸濁した。氷上で10分間核を溶解し、その後、以下の設定を用いたCovaris M220を用いて超音波処理した:出力 75W;duty factor 10%;cycle per burst 200;時間 10分間;温度 7℃。超音波処理後、サンプルを14,000 rpmで20分間の遠心分離によって透明化し、上清を収集した。透明な細胞溶解物をプロテインGセファロースビーズ(GE Healthcare)と混合し、その後、pre-clearingのために4℃で回転させた。3時間後、上清を収集し、~5%の溶解物をインプット対照として保存した。残りの溶解物を2.5μgのH3K27Ac特異的抗体(ab4729、ABCAM)、H3K4me3特異的抗体(04-745、MILLIPORE)、または5μgのPol II特異的抗体(ab817、ABCAM)と混合し、4℃で一晩インキュベートした。翌日、0.5%のBSAブロックプロテインGセファロースビーズ(前日に調製されたもの)を加え、4℃でさらに3時間回転させた。2,000 rpmで1分間遠心分離することによってビーズを収集し、その後RIPAバッファーで3回、高塩濃度RIPAバッファー(10 mM Tris、pH 8.0、300 mM NaCl、1 mM 1 EDTA、1% Triton X-100、0.1% SDS、0.1% デオキシコール酸ナトリウム)で2回、LiClバッファー(10 mM Tris、pH 8.0、250 mM LiCl、1 mM EDTA、0.5% IGEPAL CA-630、0.1% デオキシコール酸ナトリウム)で1回、TEバッファー(10 mM Tris、pH 8.0、0.1 mM EDTA)で2回洗浄した。洗浄したビーズを最初に抽出バッファー(10 mM Tris、pH 8.0、350 mM NaCl、0.1 mM EDTA、1% SDS)中の10μg RNase Aによって37℃で1時間処理した。その後20μgのプロテイナーゼKを加え、反転架橋を65℃で一晩行った。フェノール/クロロホルム/イソアミルアルコール(25:24:1)抽出およびエタノール沈殿によって断片化DNAを精製した。
【0085】
3.ビオチンプルダウンおよびライブラリの構築。以下の変更を加えたインサイチュHi-Cプロトコルに従ってビオチンプルダウンを行った:1)サンプル当たり150μlの代わりに、サンプル当たり20μlのDynabeads MyOne Streptavidin T1ビーズを使用した;2)PLAC-seqライブラリの複雑性を最大化するために、ライブラリの増幅についての最小数のPCRサイクルがqPCRによって決定された。
【0086】
PLAC-seqおよびHi-Cリードマッピング
PLAC-seqおよびインサイチュHi-Cのデータをマッピングするためにバイオインフォマティクスパイプラインを開発した。2つの各エンドについてのデフォルト設定を別々に用いたシングルエンドモードにおいて参照ゲノム(mm9)に対してBWA-MEM(Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv:1303. 3997v2(2013))を用いてペアエンド配列を最初にマッピングした。次に、独立してマッピングしたエンドを対にして、双方のエンドの各々がユニークにマッピングされた場合のみ(MQAL>10)ペアを維持した。本研究においては染色体内解析に焦点を当てていたため、染色体間ペアは破棄した。次に、いずれかのエンドが最も近いMboI部位から500 bpより離れてマッピングされた場合は、リードペアをさらに破棄した。リードペアを次に、ゲノム座標に基づいてソートし、続いてPicard toolsのMarkDuplicatesを用いてPCR重複の除去を行った。最後に、そのインサートサイズがデフォルト閾値10 kbの所定の距離より大きな場合、または1 kbより小さな場合のそれぞれについて、マッピングされたペアを「ロングレンジ」と「ショートレンジ」に分割した。
【0087】
PLAC-seqの可視化
各々の所定のアンカーポイントについて、アンカー領域に収まる一方のエンドとその外に隣接する他方のエンドを有する相互作用リードペアを最初に抽出した。次に、アンカーポイントを囲む2 MBウィンドウを500 bpの重複しないbinのセットに分けた。隣接リードを2 kbまで伸長し、その後PLAC-seq試験およびインサイチュHi-C試験の双方からの、各々のbinについてのカバレッジを計数した。リード数は後にRPM(100万当たりのリード)に正規化され、最終正規化PLAC-seqシグナルは処理値とインプット値の間での減算となった。
【0088】
PLAC-seqおよびインサイチュHi-Cにおける相互作用の同定
「GOTHiC」(Schoenfelder, S. et al., Genome Res. 25, 582-597(2015) )を使用し、5 kb解像度でPLAC-seqおよびインサイチュHi-Cのデータセットにおいてロングレンジクロマチン相互作用を同定した。最も確証的な相互作用を同定するために、相互作用がそのFDR<1e-20でリード数>20である場合に該相互作用が有意であると考えた。マウスES細胞においてPol II PLAC-seq、H3K27ac PLAC-seq、H3K4me3 PLAC-seqから総計60,718個、271,381個、188,795個の有意なロングレンジ相互作用が同定され、インサイチュHi-Cから464,690個が同定された。
【0089】
相互作用の重複
各々の相互作用の双方のエンドが少なくとも1塩基対交わる場合、2つの別個の相互作用が重複していると定義付けられた。
【0090】
PLACE相互作用の同定
マウスES細胞におけるH3K4me3/H3K27ac/Pol2 ChIP-seqピークをENCODE(Shen, Y. et al., Nature 488, 116-120(2012) )からダウンロードした。各ピークをアンカーポイントとして5 kbまで伸長させた。バックグラウンド相互作用頻度の評価としてインサイチュHi-Cを用いた正確二項検定によってPLAC-濃縮(PLACE)相互作用を同定した。より詳細に説明すると、各々のアンカー領域iについて、PLAC-seqおよびインサイチュHi-Cについて一方のエンドのアンカー領域との重複があるリードペアの数read_total_treatiおよびread_total_inputiが最初に計数された。次に、アンカーに隣接する2 MBウィンドウに焦点を当て、刻み幅2.5 kbの重複する5 kb binのセットにこの領域が分割された。手短に言えば、リードペアがアンカー領域iとbin jの間の偽ライゲーションの結果である確率が以下のように評価され得る。
Pij=inputij/total_inputi
【0091】
その後、iとbin jの間でのPLAC-seqにおいて、treat
ijリードペアが認められる確率を二項分布によって計算することができる。
【0092】
次に、1e-5より小さい二項P値を有するbinを候補として同定した。各候補を中心として、1 kb、2 kb、3 kb、4 kbウィンドウを選択し、倍率変化を各々計算し、それから最大の倍率変化を有するピークを相互作用として定義付けた。
Fmax=max(F1K,F2K,F3K,F4K)。
【0093】
重複する相互作用は、1つの相互作用として統合され、二項P値は統合された相互作用に基づいて再計算された。次に、ボンフェローニ補正を用いて複数の仮説検定を説明するために、結果として生じたP値をq値に補正した。最後に、0.05より小さいq値を有する相互作用を有意な相互作用として報告した。
【0094】
Hi-CおよびPLAC-seqの接触マップの可視化
全てのトランスリードおよび10 kb未満に及ぶシスリードペアを除去した後、Juicebox(Durand, N.C. et al., Cell Systems 3, 99-101(2016) )を用いて、インサイチュHi-CまたはPLAC-seqの接触マップを可視化した。
【0095】
4C検証
van de Werken, H.J.G. et al., Nucleosomes, Histones & Chromatin Part B 513,89-112(Elsevier, 2012) において以前に説明されたように4C試験を行った。使用された制限酵素およびPCR増幅のためのプライマー配列は表2において挙げられる。データ解析は4C seqpipeをvan de Werken, H.J.G. et al., Nat. Methods 9, 969-972(2012) において説明される方法で用いて行われた。
【0096】
インサイチュHi-C
500万個のF123細胞を用いてRao, S.S.P. et al., Cell 159, 1665-1680(2014) において以前に説明されたように、F123インサイチュHi-Cを行った。
【0097】
前述の好ましい態様の実施例および説明は、添付の特許請求の範囲によって定義される本発明を限定するものではなく、例証するものであると考えるべきである。容易に理解されるように上で説明された特徴の数多の変更および組み合わせを、特許請求の範囲において説明される本発明から逸脱することなく利用することができる。そのような変更は本発明の範囲からの逸脱とは見なされず、全てのそのような変更が以下の特許請求の範囲に含まれるものと意図される。本明細書において引用される全ての参照はその全体が参照により本明細書に組み入れられる。
【0098】
配列情報
SEQUENCE LISTING
<110> Ludwig Institute for Cancer Research Ltd.
<120> GENOME-WIDE IDENTIFICATION OF CHROMATIN INTERACTIONS
<150> US 62/383,112
<151> 2016-09-02
<150> US 62/398,175
<151> 2016-09-22
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 43
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 1
tccctacacg acgctcttcc gatctattgc ctctgataag tac 43
<210> 2
<211> 52
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 2
gtgactggag ttcagacgtg tgctcttccg atctatgaca gccccagccc at 52
<210> 3
<211> 45
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 3
tccctacacg acgctcttcc gatctagaca agcctcagtt ggatc 45
<210> 4
<211> 54
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 4
gtgactggag ttcagacgtg tgctcttccg atctatccca aggctacatc atta 54
<210> 5
<211> 45
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 5
tccctacacg acgctcttcc gatctgggag tcatggaaac tgatc 45
<210> 6
<211> 53
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 6
gtgactggag ttcagacgtg tgctcttccg atctttgata gtaacaaggc ccc 53
<210> 7
<211> 45
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 7
tccctacacg acgctcttcc gatctattct tcttctgaaa ggatc 45
<210> 8
<211> 54
<212> DNA
<213> Artificial
<220>
<223> Synthetic
<400> 8
gtgactggag ttcagacgtg tgctcttccg atctatttta gcggaagact caca 54