IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ルドウイグ インスティテュート フォー キャンサー リサーチ エルティーディーの特許一覧

特許7539948シトシン修飾の、亜硫酸水素塩非含有、塩基分解能特定
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-16
(45)【発行日】2024-08-26
(54)【発明の名称】シトシン修飾の、亜硫酸水素塩非含有、塩基分解能特定
(51)【国際特許分類】
   C12Q 1/6806 20180101AFI20240819BHJP
   C12Q 1/6869 20180101ALI20240819BHJP
   C07H 21/02 20060101ALI20240819BHJP
   C07H 21/04 20060101ALI20240819BHJP
【FI】
C12Q1/6806 Z ZNA
C12Q1/6869 Z
C07H21/02
C07H21/04
【請求項の数】 46
(21)【出願番号】P 2022139122
(22)【出願日】2022-09-01
(62)【分割の表示】P 2020537593の分割
【原出願日】2019-01-08
(65)【公開番号】P2022174153
(43)【公開日】2022-11-22
【審査請求日】2022-09-01
(31)【優先権主張番号】62/660,523
(32)【優先日】2018-04-20
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/771,409
(32)【優先日】2018-11-26
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/614,798
(32)【優先日】2018-01-08
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】516029470
【氏名又は名称】ルドウイグ インスティテュート フォー キャンサー リサーチ エルティーディー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】チュンシャオ ソン
(72)【発明者】
【氏名】イビン リウ
【審査官】松村 真里
(56)【参考文献】
【文献】特許第7136899(JP,B2)
【文献】特表2015-514397(JP,A)
【文献】特開2017-148064(JP,A)
【文献】特表2021-513358(JP,A)
【文献】Shahnaz Begum et al.,Clin Cancer Res,2011年,Vol.17. No.13,pp.4494-4503
【文献】Peter Schuler and Aubry K. Miller,Angew. Chem. Int. Ed.,2012年,Vol.51,pp.10704-10707
【文献】An Indian Journal, 2012, Vol.6, pp.237-242
【文献】Nucleic Acids Res., 1995, Vol.23,pp.3239-3243
【文献】Biochem. Biophys. Res. Comm., 2013, Vol.436, pp.115-120
【文献】Nature Biotechnology,2019年,Vol.37,p.424-429, Methods, Reporting Summary
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
5-カルボキシルシトシン(5caC)をジヒドロウラシル(DHU)に変換するための方法であって、5caCを含む核酸試料をボラン還元剤と接触させる工程を含む、方法。
【請求項2】
前記核酸試料が5-ホルミルシトシン(5fC)を含み、前記核酸試料を前記ボラン還元剤と接触させることによって前記5fCをDHUに変換する工程をさらに含む、請求項1に記載の方法。
【請求項3】
5-ホルミルシトシン(5fC)をジヒドロウラシル(DHU)に変換するための方法であって、5fCを含む核酸試料をボラン還元剤と接触させる工程を含む、方法。
【請求項4】
前記ボラン還元剤が、2-ピコリンボラン(pic-BH3)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、およびナトリウムトリアセトキシボロヒドリドからなる群から選択される薬剤を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記ボラン還元剤が、ボランを含む、請求項1~3のいずれか一項に記載の方法。
【請求項6】
前記ボラン還元剤が、水素化ホウ素ナトリウムを含む、請求項1~3のいずれか一項に記載の方法。
【請求項7】
前記ボラン還元剤が、シアノホウ水素化ナトリウムを含む、請求項1~3のいずれか一項に記載の方法。
【請求項8】
前記ボラン還元剤が、ナトリウムトリアセトキシボロヒドリドを含む、請求項1~3のいずれか一項に記載の方法。
【請求項9】
前記ボラン還元剤が、2-ピコリンボランを含む、請求項1~3のいずれか一項に記載の方法。
【請求項10】
ボラン還元剤と接触させる工程の前に前記核酸試料を酸化剤と接触させる工程を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記酸化剤が、テンイレブントランスロケーション(TET)酵素である、請求項10に記載の方法。
【請求項12】
前記TET酵素が、ヒトTET1、ヒトTET2、ヒトTET3、マウスTET1、TET2、TET3、ネグレリアTET(NgTET)、またはウシグソヒトヨタケTET(CcTET)を含む、請求項11に記載の方法。
【請求項13】
前記酸化剤が、化学酸化剤を含む、請求項10に記載の方法。
【請求項14】
前記化学酸化剤が、過ルテニウム酸カリウム(KRuO4)またはCu(II)/TEMPOを含む、請求項13に記載の方法。
【請求項15】
前記核酸試料中の一つ以上の修飾シトシンにブロッキング基を添加する工程をさらに含む、請求項10~14のいずれか一項に記載の方法。
【請求項16】
前記ブロッキング基が、前記酸化剤と接触させる工程の前に添加される、請求項15に記載の方法。
【請求項17】
前記一つ以上の修飾シトシンが、5hmCを含む、請求項16に記載の方法。
【請求項18】
前記ブロッキング基が、糖またはウリジン二リン酸(UDP)連結糖を含む、請求項17に記載の方法。
【請求項19】
前記ブロッキング基が、前記酸化剤と接触させる工程の後かつ前記ボラン還元剤と接触させる工程の前に添加される、請求項15に記載の方法。
【請求項20】
前記一つ以上の修飾シトシンが、5caCまたは5fCを含む、請求項19に記載の方法。
【請求項21】
前記ブロッキング基が、アルデヒド反応性化合物を含む、請求項20に記載の方法。
【請求項22】
前記アルデヒド反応性化合物が、ヒドロキシルアミン化合物、ヒドラジン化合物、またはヒドラジド化合物である、請求項21に記載の方法。
【請求項23】
前記ブロッキング基を添加する工程が、前記核酸試料を(i)カップリング剤、および(ii)アミン、ヒドラジン、またはヒドロキシルアミン化合物と接触させる工程を含む、請求項20に記載の方法。
【請求項24】
前記ボラン還元剤と接触させる工程の後に前記核酸試料を配列決定して変換されたシトシン塩基を特定する工程をさらに含む、請求項1~23のいずれか一項に記載の方法。
【請求項25】
修飾シトシンをジヒドロウラシル(DHU)に変換するための方法であって、
i)5-カルボキシルシトシン(5caC)および/または5-ホルミルシトシン(5fC)を生成するために、修飾シトシンを含む核酸試料を酸化剤と接触させる工程と、
ii)5caCおよび/または5fCを含む前記核酸試料をボラン還元剤と接触させる工程と
を含む、方法。
【請求項26】
前記酸化剤が、テンイレブントランスロケーション(TET)酵素である、請求項25に記載の方法。
【請求項27】
前記TET酵素が、ヒトTET1、ヒトTET2、ヒトTET3、マウスTET1、TET2、TET3、ネグレリアTET(NgTET)、またはウシグソヒトヨタケTET(CcTET)を含む、請求項26に記載の方法。
【請求項28】
前記酸化剤が、化学酸化剤を含む、請求項25に記載の方法。
【請求項29】
前記酸化剤が、過ルテニウム酸カリウム(KRuO4)またはCu(II)/TEMPOを含む、請求項28に記載の方法。
【請求項30】
前記ボラン還元剤が、2-ピコリンボラン(pic-BH3)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、およびナトリウムトリアセトキシボロヒドリドからなる群から選択される薬剤を含む、請求項25~29のいずれか一項に記載の方法。
【請求項31】
前記ボラン還元剤が、ボランを含む、請求項25~29のいずれか一項に記載の方法。
【請求項32】
前記ボラン還元剤が、水素化ホウ素ナトリウムを含む、請求項25~29のいずれか一項に記載の方法。
【請求項33】
前記ボラン還元剤が、シアノホウ水素化ナトリウムを含む、請求項25~29のいずれか一項に記載の方法。
【請求項34】
前記ボラン還元剤が、ナトリウムトリアセトキシボロヒドリドを含む、請求項25~29のいずれか一項に記載の方法。
【請求項35】
前記ボラン還元剤が、2-ピコリンボランを含む、請求項25~29のいずれか一項に記載の方法。
【請求項36】
前記核酸試料中の一つ以上の前記修飾シトシンにブロッキング基を添加する工程をさらに含む、請求項25~35のいずれか一項に記載の方法。
【請求項37】
前記ブロッキング基が、前記酸化剤と接触させる工程の前に添加される、請求項36に記載の方法。
【請求項38】
前記一つ以上の修飾シトシンが、5hmCを含む、請求項37に記載の方法。
【請求項39】
前記ブロッキング基が、糖またはウリジン二リン酸(UDP)連結糖を含む、請求項38に記載の方法。
【請求項40】
前記ブロッキング基が、前記酸化剤と接触させる工程の後かつ前記ボラン還元剤と接触させる工程の前に添加される、請求項36に記載の方法。
【請求項41】
前記ブロッキング基が、5caCまたは5fCに添加される、請求項40に記載の方法。
【請求項42】
前記ブロッキング基が、アルデヒド反応性化合物を含む、請求項41に記載の方法。
【請求項43】
前記アルデヒド反応性化合物が、ヒドロキシルアミン化合物、ヒドラジン化合物、またはヒドラジド化合物である、請求項42に記載の方法。
【請求項44】
前記ブロッキング基を添加する工程が、前記核酸試料を(i)カップリング剤、および(ii)アミン、ヒドラジン、またはヒドロキシルアミン化合物と接触させる工程を含む、請求項41に記載の方法。
【請求項45】
前記ボラン還元剤と接触させる工程の後に前記核酸試料を配列決定して変換されたシトシン塩基を特定する工程をさらに含む、請求項24~44のいずれか一項に記載の方法。
【請求項46】
前記核酸試料が、DNAまたはRNAを含む、請求項1~45のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年1月8日に出願された米国仮特許出願第62/614,798号、2018年4月20日出願の62/660,523号、2018年11月26日に出願された62/771,409号(それぞれ参照によりその全体が本明細書に組み込まれる)の利益を主張する。
【0002】
本開示は、核酸配列における、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-カルボキシルシトシンおよび/または5-ホルミルシトシンの位置を特定するための方法を提供する。
【背景技術】
【0003】
5-メチルシトシン(5mC)および5-ヒドロキシメチルシトシン(5hmC)は、哺乳類ゲノム中に見られる二つの主なエピジェネティックマークであり、5hmCはテンイレブントランスロケーション(TET)ファミリージオキシゲナーゼによって、5mCから生成される。Tetはさらに5hmCを5-ホルミルシトシン(5fC)と5-カルボキシルシトシン(5caC)とに酸化することができ、これは5mCおよび5hmCと比較して、哺乳類ゲノム中では非常に低い存在量で存在する(5hmCの10分の1~100分の1の存在量)。5mCと5hmCとは、遺伝子制御から正常な発現まで幅広い生物学的プロセスにおいて重要な役割を果たしている。異常なDNAメチル化およびヒドロキシメチル化は、様々な疾患と関連付けられてきており、また癌の広く認められた特徴である。したがって、DNA配列における5mCと5hmCの決定は、基本的な研究にとって重要なだけではなく、診断および治療を含む臨床用途にとっても有益である。
【0004】
5fCおよび5caCは、5mCの二つの最終酸化誘導体であり、塩基除去修復経路のチミンDNAグリコシラーゼ(TDG)によって非修飾シトシンに変換されうる。したがって、5fCおよび5caCは、活性な脱メチル化プロセスにおける二つの重要な主要中間体であり、胚発生において重要な役割を果たしている。5fCおよび5caCは、これらのコンテクストにおいて見出され、5mCの完全に近い脱メチル化の指標としての役割を果たす。5fCおよび5caCはまた、特異的なタンパク質を結合したり、またRNAポリメラーゼIIの割合および特異性に影響を及ぼすなどの、さらなる機能も果たしうる。
【0005】
5mCはまた、安定し、かつ極めて豊富なtRNAおよびrRNAの両方で、およびmRNAで特定されている転写後のRNA修飾でもある。さらに、5mCは、snRNA(核内低分子RNA)、miRNA(マイクロRNA)、lncRNA(長鎖非コードRNA)およびeRNA(エンハンサーRNA)で検出されている。しかしながら、異なる生物体における特異的なRNAタイプにおける5mCの発生には差異があると思われる。例えば、5mCは、細菌からのtRNAおよびmRNAには存在しないと思われるが、真核細胞および古細菌中のtRNAおよびmRNAでは見出されている。
【0006】
5hmCもRNAで検出されている。例えば、ショウジョウバエ(Drosophila)及びマウスに由来するmRNAは、5hmCを含有することが見いだされている。DNA中の5mCを酸化する同一の酵素群は、哺乳類の総RNAにおける5hmCの形成に触媒作用を及ぼすと報告された。ハエでは、5hmC抗体を用いたメチル化RNA免疫沈降配列決定(MeRIP‐配列)を使用したトランスクリプトームワイドな研究は、多数のmRNAコード配列で5hmCの存在を検出し、特に脳内で高レベルであった。また、活性翻訳は、RNA中の高5hmCレベルと関連付けられており、RNAにおける5hmC堆積に関与するTET酵素が欠損しているハエは脳の発達が損なわれていることも報告された。
【0007】
DNAメチル化およびヒドロキシメチル化分析に対する現在の究極の基準であり最も広く使用されている方法は、亜硫酸水素塩配列決定(BS)、ならびに、Tet-補助亜硫酸水素塩配列決定(TAB-配列)および酸化的亜硫酸水素塩配列決定(oxBS)などのその誘導方法である。これらの方法のすべては、5mCおよび/または5hmCを完全なままに残しながら非メチル化シトシンをウラシルに変換するための亜硫酸水素塩処理を用いる。ウラシルをチミンとして読み取る亜硫酸水素塩処理DNAのPCR増幅により、各シトシンの修飾情報を単一塩基分解能で推測することができる(CからTへの移行が非メチル化シトシンの位置を提供する)。しかしながら、亜硫酸水素塩配列決定に対する少なくとも二つの主な欠点がある。第一に、亜硫酸水素塩処理は厳しい化学反応であり、これは必要な酸性および熱的条件下での脱プリンによりDNAの90%以上を分解する。この分解は、循環細胞遊離DNAおよび単一細胞配列決定を含む臨床試料など、その適用を低入力試料に厳しく制限する。第二に、亜硫酸水素塩配列決定は、非修飾シトシンのチミンへの完全変換に依存する。非修飾シトシンは、ヒトゲノム中の合計シトシンの約95%を占める。全てのこれらの位置をチミンに変換することで、配列の複雑さが大幅に低減され、配列決定の品質の低下、低いマッピング率、不均一なゲノムカバレッジ、および配列決定コストの増加につながる。亜硫酸水素塩配列決定方法はまた、非修飾シトシンのチミンへの変換が不完全なことにより、5mCおよび5hmCの誤検出しやすい。
【0008】
亜硫酸水素塩配列決定を使用して、RNA中のシトシンのメチル化もまた検出してきた。メチル化RNA-免疫沈降法などの、RNA中の5mC検出の他の方法とは異なり、RNA-亜硫酸水素塩配列決定(RNA-BS-配列)は、RNAにおける特定のC位置のメチル化の程度を決定することができるという利点がある。ただし、RNA-BS-配列は、DNAの亜硫酸水素塩配列決定に関して上述した同じ欠点を持っている。特に、反応条件は、RNAの実質的な分解を生じさせ得る。
【0009】
非修飾シトシンに影響を与えずに定量的に塩基分解能で修飾シトシン(5mCおよび5hmC)を検出できる軽度の反応であるDNAメチル化およびヒドロキシメチル化分析のための方法に対するニーズがある。同様に、軽度の反応条件を用いた、かつ非修飾シトシンに影響を与えずに定量的に塩基分解能で修飾シトシンを検出できる、RNAメチル化およびヒドロキシメチル化分析のための方法に対するニーズがある。
【発明の概要】
【課題を解決するための手段】
【0010】
本発明は、核酸における、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-カルボキシルシトシンおよび/または5-ホルミルシトシンのうちの一つ以上の位置を特定するための方法を提供する。本明細書に記述した方法は、非修飾シトシンに影響を及ぼすことなく、塩基分解能で定量的に修飾シトシンを検出する軽度の反応を伴うDNAまたはRNAメチル化およびヒドロキシメチル化分析を提供する。本明細書ではTAPS(TET補助ピリジンボラン配列決定(TET Assisted Pyridine borane Sequencing))と呼ばれる、ボラン誘導体(例えば、ピリジンボランおよび2-ピコリンボラン(pic-BH))によるTET酸化および還元を組み合わせることにより、5mCおよび5hmCを特定する新しい方法が本明細書に提供される(表1)。TAPSは、非修飾シトシンに影響を与えることなく、高感度および特異性で直接修飾を検出し、またその他のシトシン修飾を検出するために採用することができる。これは非破壊的であり、RNAおよびDNAを10kbsの長さまで保存する。亜硫酸水素塩配列決定と比較すると、TAPSはより高いマッピング率、より均一なカバレッジおよびより低い配列決定コストをもたらし、より高品質、より包括的かつ安価なメチローム解析を可能にする。酸化工程を用いないこの方法の変型は、本明細書に記載される5fCおよび/または5caCを特定するために使用される。
【0011】
一態様では、本発明は、標的核酸中の5-メチルシトシン(5mC)を特定するための方法を提供し、この方法は、
a. 標的核酸を含む核酸試料を提供する工程、
b. 核酸を修飾する工程であって、
i. 核酸試料中の5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加する工程と、
ii. 核酸試料中の5mCを5-カルボキシルシトシン(5caC)および/または5-ホルミルシトシン(5fC)に変換する工程と、
iii. 修飾標的核酸を含む修飾核酸試料を提供するために、5caCおよび/また
は5fCをジヒドロウラシル(DHU)に変換する工程と、を含む、修飾する工程、および
c. 修飾標的核酸の配列を検出する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5mCの位置を提供する、検出する工程を含む。
【0012】
標的核酸中の5mCを特定する方法の実施形態では、各移行位置でのTのパーセンテージは、標的核酸の各位置で5mCの定量レベルを提供する。実施形態では、核酸はDNAである。他の実施形態では、核酸はRNAである。
【0013】
別の態様では、本発明は、標的核酸中の5mC、または5hmCを特定するための方法を提供し、この方法は、
a. 標的核酸を含む核酸試料を提供する工程、
b. 核酸を修飾する工程であって、
i. 核酸試料中の5mCおよび5hmCを5-カルボキシルシトシン(5caC)および/または5fCに変換する工程と、
ii. 修飾標的核酸を含む修飾核酸試料を提供するために、5caCおよび/または5fCをDHUに変換する工程と、を含む、修飾する工程、および
c. 修飾標的核酸の配列を検出する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、検出する工程を含む。
【0014】
5mCまたは5hmCを特定する方法の実施形態では、各移行位置でのTのパーセンテージは、標的核酸の各位置で5mCまたは5hmCの定量レベルを提供する。実施形態では、核酸はDNAである。他の実施形態では、核酸はRNAである。
【0015】
別の態様では、本発明は、標的核酸中の5mCを特定するための、および5hmCを特定するための方法を提供し、この方法が、
a. 標的核酸中の5mCを特定する工程であって、この特定する工程が、
i. 標的核酸を含む第一核酸試料を提供する工程、
ii. 第一試料中の核酸を修飾する工程であって、
1. 第一核酸試料内の、5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加することと、
2. 第一核酸試料中の5mCを、5caCおよび/または5fCに変換することと、
3. 修飾標的核酸を含む修飾第一DNA試料を提供するために、5caCおよび/または5fCをDHUに変換することと、を含む、修飾する工程、
iii. 修飾標的核酸のコピー数を随意に増幅する工程、および
iv. 修飾標的核酸の配列を検出する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5mCの位置を提供する、検出する工程、を含む、特定する工程、
b. 標的核酸中の5mCまたは5hmCを特定する工程であって、この特定する工程が、
i. 標的核酸を含む第二核酸試料を提供する工程、
ii. 第二核酸試料中の核酸を修飾する工程であって、
1. 第二核酸試料中の5mCおよび5hmCを、5caCおよび/または5fCに変換することと、
2. 修飾標的核酸を含む修飾第二核酸試料を提供するために、5caCおよび/または5fCをDHUに変換することと、を含む、修飾する工程、
iii. 修飾標的核酸のコピー数を随意に増幅する工程、
iv. 第二試料から修飾標的核酸の配列を検出する工程であって、標的核酸と比較して修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、検出する工程、を含む、特定する工程、ならびに、
c. 工程(a)および(b)の結果を比較する工程であって、工程(b)で存在するが工程(a)では存在しないCからTへの移行が、標的核酸中の5hmCの位置を提供する、比較する工程、を含む。
【0016】
標的核酸中の5mCを特定し、5hmCを特定するための実施形態では、工程(a)においては、各移行位置でのTのパーセンテージは、標的核酸中の5mCの定量レベルを提供し、工程(b)においては、各移行位置でのTのパーセンテージは、標的核酸中の5mC、または5hmCの定量レベルを提供し、および工程(c)においては、工程(b)で、しかし工程(a)ではなく、特定されたCからTへの移行についてのパーセンテージの差異が標的核酸中の各位置での5hmCの定量レベルを提供する。実施形態では、核酸はDNAである。他の実施形態では、核酸はRNAである。
【0017】
本発明の実施形態では、核酸試料中の5hmCに添加されたブロッキング基は糖である。実施形態では、糖は天然起源の糖または修飾糖、例えばグルコースまたは修飾グルコースである。本発明の実施形態では、ブロッキング基は、例えば、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、およびT4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)ならびにその誘導体および類似体のような、グルコシルトランスフェラーゼ酵素の存在下での、例えば、修飾グルコースに連結するUDP-グルコース、またはUDPなどの、糖に連結するUDPに核酸試料を接触させることで5hmCに添加される。
【0018】
本発明の実施形態では、核酸試料中の5mCを5caC及び/または5fCに変換する工程、ならびに核酸試料中の5mC及び5hmCを5caC及び/または5fCに変換する工程はそれぞれ、テンイレブントランスロケーション(TET)酵素と核酸試料を接触させることを含む。さらなる実施形態では、TET酵素は、ヒトTET1、TET2、およびTET3;マウスTet1、Tet2、およびTet3;ネグレリアTET(NgTET);ウシグソヒトヨタケ(CcTET)、ならびにその誘導体または類似体のうちの一つ以上である。実施形態において、TET酵素はNgTETである。
【0019】
別の態様では、本発明は、標的核酸中の5caC、または5fCを特定するための方法を提供し、この方法は、
a. 標的核酸を含む核酸試料を提供する工程、
b. 修飾標的核酸を含む修飾核酸試料を提供するために、5caCおよび5fCをDHUに変換する工程、
c. 修飾標的核酸のコピー数を随意に増幅する工程、および
d. 修飾標的核酸の配列を検出する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5caCまたは5fCのいずれかの位置を提供する、検出する工程を含む。
【0020】
標的核酸中の5caCまたは5fCを特定する方法の実施形態では、各移行位置でのTのパーセンテージは、標的核酸の各位置で5caCまたは5fCの定量レベルを提供する。
【0021】
別の態様では、本発明は、標的核酸中の5caCを特定するための方法を提供し、この方法は、
a. 標的核酸を含む核酸試料を提供する工程、
b. 核酸試料中の5fCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、5caCをDHUに変換する工程、
d. 修飾標的核酸のコピー数を随意に増幅する工程、および
e. 修飾標的核酸の配列を決定する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5caCの位置を提供する、決定する工程、を含む。
【0022】
標的核酸中の5caCを特定する方法の実施形態では、各移行位置でのTのパーセンテージは、標的核酸の各位置で5caCの定量レベルを提供する。実施形態では、核酸はDNAである。他の実施形態では、核酸はRNAである。
【0023】
本発明の実施形態では、核酸試料の5fCにブロッキング基を添加することは、例えば、ヒドロキシルアミン誘導体(O-エチルヒドロキシルアミン)、ヒドラジン誘導体、およびヒドラジド誘導体を含むアルデヒド反応性化合物と核酸を接触させることを含む。
【0024】
別の態様では、本発明は、標的核酸中の5fCを特定するための方法を提供し、この方法は、
a. 標的核酸を含む核酸試料を提供する工程、
b. 核酸試料中の5caCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、5fCをDHUに変換する工程、
d. 修飾標的核酸のコピー数を随意に増幅する工程、
e. 修飾標的核酸の配列を検出する工程であって、標的核酸と比較した修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、標的核酸中の5fCの位置を提供する、検出する工程、を含む。
【0025】
標的核酸中の5fCを特定する方法の実施形態では、各移行位置でのTのパーセンテージは、標的核酸の各位置で5fCの定量レベルを提供する。実施形態では、核酸(試料および標的)はDNAである。他の実施形態では、核酸(試料および標的)はRNAである。
【0026】
実施形態において、核酸試料中の5caCにブロッキング基を添加する工程は、例えば、1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)および(ii)アミン(エチルアミンなど)、ヒドラジン、またはヒドロキシルアミン化合物を含む、カルボン酸誘導体化試薬に核酸試料を接触させることを含む。
【0027】
本発明の実施形態では、上記方法は修飾標的核酸のコピー数を増幅する工程をさらに含む。実施形態では、この増幅工程は、修飾標的核酸の配列を検出する工程の前に実施される。修飾標的核酸がDNAであるときにコピー数を増幅する工程は、ポリメラーゼ連鎖反応(PCR)、プライマー伸長および/またはクローニングを行うことによって達成されうる。修飾標的核酸がRNAである場合、コピー数を増幅する工程は、オリゴ(dT)プライマー(mRNAに対する)、ランダムプライマー、及び/または遺伝子特異的プライマーを使用してRT-PCRによって達成され得る。
【0028】
本発明の実施形態では、DNA試料はDNAのピコグラム量を含む。本発明の実施形態では、DNA試料は、約1pg~約900pg DNA、約1pg~約500pg DNA、約1pg~約100pg DNA、約1pg~約50pg DNA、約1~約10pg DNA、約200pg未満、約100pg未満DNA、約50pg未満DNA、約20pg未満DNA、および約5pg未満DNAを含む。本発明の他の実施形態では、DNA試料はDNAのナノグラム量を含む。本発明の実施形態では、DNA試料は、約1~約500ngのDNA、約1~約200ngのDNA、約1~約100ngのDNA、約1~約50ngのDNA、約1ng~約10ngのDNA、約1ng~約5ngのDNA、約100ng未満のDNA、約50ng未満のDNA、約5ng未満のDNA、または約2ng未満のDNAを含有する。本発明の実施形態では、DNA試料は循環細胞遊離DNA(cfDNA)を含む。本発明の実施形態では、DNA試料はDNAのマイクログラム量を含む。
【0029】
本発明の実施形態では、5caCおよび/または5fCをDHUに変換する工程は、例えば、ピリジンボラン、2-ピコリンボラン(pic-BH)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、及びナトリウムトリアセトキシボロヒドリドを含む還元剤に核酸試料を接触させることを含む。好ましい実施形態では、還元剤はpic-BHおよび/またはピリジンボランである。
【0030】
本発明の実施形態では、修飾標的核酸の配列を決定する工程は、鎖終結配列決定、マイクロアレイ、高処理量配列決定、および制限酵素分析を含む。
本発明の実施形態において、例えば以下の項目が提供される。
(項目1)
標的核酸中の5-メチルシトシン(5mC)を特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸を修飾する工程であって、前記修飾する工程が、
i. 核酸試料中の5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加する工程と、
ii. 前記核酸試料中の前記5mCを5-カルボキシルシトシン(5caC)および/または5-ホルミルシトシン(5fC)に変換する工程と、
iii. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび/
または5fCをジヒドロウラシル(DHU)に変換する工程と、を含む、修飾する工程、および
c. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCの位置を提供する、方法。
(項目2)
各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置での5mCの定量レベルを提供する、項目1に記載の方法。
(項目3)
標的核酸中の5mCまたは5hmCを特定する方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸を修飾する工程であって、前記修飾する工程が、
i. 前記核酸試料中の前記5mCおよび5hmCを5-カルボキシルシトシン(5caC)および/または5fCに変換する工程と、
ii. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロウラシル(DHU)に変換する工程と、を含む、修飾する工程、および
c. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、方法。
(項目4)
各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置での5mCまたは5hmCの定量レベルを提供する、項目3に記載の方法。
(項目5)
標的核酸中の5mCを特定するための、および5hmCを特定するための方法であって、前記方法が、
a. 前記標的核酸中の5-メチルシトシン(5mC)を特定する工程であって、前記特定する工程が、
i. 前記標的核酸を含む第一核酸試料を提供する工程、
ii. 前記第一試料中の前記核酸を修飾する工程であって、前記修飾する工程が、
(1). 前記第一核酸試料中の、5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加することと、
(2). 前記第一核酸試料中の前記5mCを、5caCおよび/または5fCに変換することと、
(3). 修飾標的核酸を含む修飾第一核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロウラシル(DHU)に変換することと、を含む、修飾する工程、
iii. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン
(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程であって、前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCの位置を提供する、検出する工程、を含む、特定する工程、
b. 前記標的核酸中の5mCまたは5hmCを特定する工程であって、前記特定する工程が、
i. 前記標的核酸を含む第二核酸試料を提供する工程、
ii. 前記第二試料中の前記核酸を修飾する工程であって、前記修飾する工程が、
(1). 前記第二核酸試料中の5mCおよび5hmCを、5caCおよび/または5fCに変換することと、
(2). 修飾標的核酸を含む修飾第二核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロラシル(DHU)に変換することと、を含む、修飾する工程、および
iii. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン
(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記第二試料から前記修飾標的核酸の配列を検出する工程であって、前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、検出する工程、を含む、特定する工程、ならびに、
c. 工程(a)および(b)の結果を比較する工程であって、工程(b)で存在するが工程(a)では存在しないCからDHUまたはCからTへの移行が、前記標的核酸中の5hmCの位置を提供する、比較する工程、を含む、方法。
(項目6)
工程(a)において、各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置で5mCの定量レベルを提供し、工程(b)において、各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置で5mC、または5hmCの定量レベルを提供し、および工程(c)において、工程(b)で、工程(a)ではなく、特定されたCからDHUまたはTへの移行についてのパーセンテージの差異が、前記標的核酸中の各位置で5hmCの定量レベルを提供する、項目5に記載の方法。
(項目7)
前記5hmCに添加される前記ブロッキング基が糖である、項目1~2または項目5~6のいずれか一項に記載の方法。
(項目8)
前記糖がグルコースまたは修飾グルコースである、項目7に記載の方法。
(項目9)
前記ブロッキング基が、グルコシルトランスフェラーゼ酵素の存在下で、糖に連結されたウリジン二リン酸(UDP)に前記核酸試料を接触させることにより、前記5hmCに添加される、項目7に記載の方法。
(項目10)
前記グルコシルトランスフェラーゼ酵素が、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、T4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、ならびにその誘導体および類似体からなる群から選択される、項目9に記載の方法。
(項目11)
前記核酸試料中の前記5mCを、5caC及び/または5fCに変換する工程、ならびに前記核酸試料中の前記5mC及び5hmCを、5caC及び/または5fCに変換する工程は、テンイレブントランスロケーション(TET)酵素と前記核酸試料を接触させることを含む、項目1~6のいずれか一項に記載の方法。
(項目12)
前記TET酵素が、ヒトTET1、TET2、及びTET3、マウスTet1、Tet2、及びTet3、ネグレリアTET(NgTET)、ウシグソヒトヨタケ(CcTET)、ならびにその誘導体または類似体からなる群から選択される、項目11に記載の方法。
(項目13)
前記TET酵素がNgTETまたはマウスTETである、項目12に記載の方法。
(項目14)
標的核酸中の5caC、または5fCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび5fCをジヒドロウラシル(DHU)に変換する工程、
c. 前記修飾標的核酸のコピー数を増幅する工程、および
d. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5caC、または5fCのいずれかの位置を提供する、方法。
(項目15)
各移行位置でのTのパーセンテージが、前記標的核酸中の各位置で、5caC、または5fCの定量レベルを提供する、項目14に記載の方法。
(項目16)
標的核酸中の5caCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸試料中の5fCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCをジヒドロウラシル(DHU)に変換する工程、および
d. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5caCの位置を提供する、方法。
(項目17)
各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸の各位置で5caCの定量レベルを提供する、項目16に記載の方法。
(項目18)
前記5fCにブロッキング基を添加する工程が、ヒドロキシルアミン誘導体、ヒドラジン誘導体、およびヒドラジド誘導体から選択されるアルデヒド反応性化合物と、前記核酸試料を接触させることを含む、項目16に記載の方法。
(項目19)
前記ヒドロキシルアミン誘導体が、O-エチルヒドロキシルアミンである、項目18に記載の方法。
(項目20)
標的核酸中の5fCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸試料中の5caCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5fCをジヒドロウラシル(DHU)に変換する工程、および
d. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン(T)に変換して前記配列における前記チミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5fCの位置を提供する、方法。
(項目21)
各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置で5fCの定量レベルを提供する、項目20に記載の方法。
(項目22)
5caCにブロッキング基を添加する前記工程が、前記核酸試料をカルボン酸誘導体化試薬、及びアミン、ヒドラジン又はヒドロキシルアミン化合物と接触させることを含む、項目20に記載の方法。
(項目23)
5caCにブロッキング基を添加する前記工程が、前記核酸試料を1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)と接触させることと、エチルアミンと接触させることと、を含む、項目22に記載の方法。
(項目24)
標的核酸中の5hmCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記試料中の前記核酸を修飾する工程であって、
i 前記核酸試料中の前記5hmCを5caCおよび/または5fCに変換する工程と
ii 前記5caCおよび/または5fCをジヒドロウラシル(DHU)に変換して修飾標的核酸を含む修飾核酸試料を提供する工程と、を含む、修飾する工程、および
c. 前記配列におけるDHUの存在を検出すること、または前記DHUをチミン(T
)に変換して前記配列におけるチミン(T)の存在を検出することを含む、前記修飾標的核酸の配列を検出する工程であって、前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のDHUへの移行またはシトシン(C)のチミン(T)への移行が、前記標的核酸中の5hmCの位置を提供する、検出する工程、を含む、方法。
(項目25)
各移行位置でのDHUまたはTのパーセンテージが、前記標的核酸中の各位置で5hmCの定量レベルを提供する、項目24に記載の方法。
(項目26)
前記5hmCを5caCおよび/または5fCに変換する工程が、前記核酸試料を酸化剤と接触させることを含む、項目24に記載の方法。
(項目27)
前記酸化剤が、過ルテニウム酸カリウムまたはCu(II)/TEMPOである、項目26に記載の方法。
(項目28)
前記方法が、前記修飾標的核酸のコピー数を増幅する前記工程をさらに含む、項目1~6、および14~27のいずれか一項に記載の方法。
(項目29)
前記修飾標的核酸のコピー数を増幅する前記工程が、ポリメラーゼ連鎖反応(PCR)、またはプライマー伸長を行うことを含む、項目28に記載の方法。
(項目30)
前記5caCおよび/または5fCをDHUへ変換する前記工程が、前記核酸試料を還元剤に接触させることを含む、項目1~6、および14~29のいずれか一項に記載の方法。
(項目31)
前記還元剤が、ピリジンボラン、2-ピコリンボラン(pic-BH)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、およびナトリウムトリアセトキシボロヒドリドからなる群から選択される、項目30に記載の方法。
(項目32)
前記還元剤が、ピリジンボラン、または2-ピコリンボランである、項目31に記載の方法。
(項目33)
前記修飾標的核酸の配列を特定する前記工程が、鎖終結配列決定、マイクロアレイ、高処理量配列決定、および制限酵素分析のうちの一つ以上を含む、項目1~6、および14~27のいずれか一項に記載の方法。
(項目34)
前記核酸がDNAである、項目1~33のいずれか一項に記載の方法。
(項目35)
前記核酸がRNAである、項目1~33のいずれか一項に記載の方法。
【図面の簡単な説明】
【0031】
図1図1。ボラン含有化合物スクリーニング。11merオリゴヌクレオチド(オリゴ)における5caCのDHUへの変換についてボラン含有化合物をスクリーニングし、変換率をMALDIで評価した。エチレンジアミンボランおよびジメチルアミンボランは30%の変換率を与えた一方で、2-ピコリンボラン(ピコボラン)、ボランピリジン、およびtert-ブチルアミンボランが5caCを完全にDHUに変換し得た。ジシクロヘキシルアミンボラン、モルホリンボラン、4-メチルモルホリンボラン、およびトリメチルアミンボランで測定された検出可能な生成物はなかった(未検出(n.d.))。水素化ホウ素ナトリウムおよび水素化トリアセトキシホウ素ナトリウムなどのその他の還元剤は、酸性媒体で急速に分解し、不完全な変換につながる。酸性状態下でシアン化水素形成の可能性があるため、シアノホウ水素化ナトリウムは使用されなかった。完全な変換、低毒性、及び高安定性の理由により、ピコボラン及びピリジンボランを選択した。
【0032】
図2図2A~B。DNAオリゴに対するピコボラン反応。(A)ピコボランで処理された5caC含有11merモデルDNAのMALDI特性解析。計算された質量(m/z)が各グラフの上に表示され、観測された質量がピークの左側に表示される。(B)dCの変換率および様々なシトシン誘導体は、HPLC-MS/MSによって定量された。三つの複製の平均±SDとして示されるデータ。
【0033】
図3-1】図3A~B。単一ヌクレオシドピコボラン反応。Hおよび13C NMR結果は、2’-デオキシ-5,6-ジヒドロウリジン(I.Aparici-Espert et al.,J.Org.Chem.81,4031-4038(2016))に従った。(A)単一ヌクレオシドピコボラン反応生成物のH NMR(MeOH-d,400MHz)チャート。δ ppm:6.28(t,1H,J=7Hz),4.30(m,1H),3.81(m,1H),3.63(m,2H),3.46(m,2H),2.65(t,2H,J=6Hz),2.20(m,1H),2.03(m,1H)。(B)単一ヌクレオシドピコボラン反応生成物の13C NMR(MeOH-d,400MHz)チャート。δ ppm:171.56(CO),153.54(CO),85.97(CH),83.86(CH),70.99(CH),61.92(CH),36.04(CH),35.46(CH),30.49(CH)。
図3-2】同上。
【0034】
図4-1】図4A~B。(A)5caCのDHUへのボラン変換、および5caCのDHUへのボラン反応のための提案メカニズム、ならびに(B)5fCのDHUへのボラン変換、および5fCのDHUへのボラン反応のための提案メカニズム、を示す図表。
図4-2】同上。
【0035】
図5図5A~B。(A)図は、TAPS方法が5mCと5hmCの両方をDHUに変換し、これは、複製時にチミンとして機能することを示す。(B)TAPS、TAPSβ、およびCAPS方法の概要。
【0036】
図6-1】図6。5fCおよび5caCをブロックすることを伴う、またはブロックしない、ピコボランで処理された5fCおよび5caC含有モデルDNAオリゴのMALDI特性解析。5fCおよび5caCは、pic-BHを用いてジヒドロウラシル(DHU)に変換される。5fCは、オキシムになり、ピコボラン変換に抵抗するであろうO-エチルヒドロキシルアミン(EtONH)などのヒドロキシルアミン誘導体によってブロックされた。5caCは、EDCコンジュゲーションを介してエチルアミンによってブロックされ、ピコボランによる変換をブロックするアミドに変換された。計算されたMS(m/z)が各グラフの上に表示され、観測されたMSがピークの左側に表示される。
図6-2】同上。
【0037】
図7-1】図7。5hmCをブロックすることを伴う、またはブロックしない、KRuOおよびピコボランで処理されたモデルDNAオリゴを含有する5mCおよび5hmCのMALDI特性解析。5hmCは、グルコースを用いてβGTによってブロックされることができ、5gmCに変換されることができる。5mC、5hmC、および5gmCは、ピコボランによって変換されることはできなかった。5hmCはKRuOによって5fCへと酸化されることができ、次にピコボランによってDHUに変換されることができた。計算されたMS(m/z)が各グラフの上に表示され、観測されたMSがピークの左側に表示される。
図7-2】同上。
【0038】
図8図8A~B。制限酵素消化は、TAPSが5mCを効果的にTに変換できることを示した。(A)TAPSによって引き起こされる配列変化を確認するための制限酵素消化アッセイの概略図。(B)TAPSによって引き起こされたCからTへの移行を確認するためのTaqαI-消化試験。TaqαI制限部位を有する、ならびに五つの完全にメチル化されたCpG部位(5mC)およびその非メチル化対照(C)を含む222bpモデルDNA上で、TAPSを行った。PCR増幅された222bpモデルDNAは、5mC、CおよびC TAPSに示すように、TaqαIで、約160bpおよび約60bp断片に切断されうる。メチル化DNA上のTAPSの後、T(mC)GA配列はTTGAに変換され、5mC-TAPSレーンに示されるようにTaqαI消化により切断されなくなる。
【0039】
図9図9A~B。222bpモデルDNAおよびmESC gDNA上のTAPS。(A)TAPSの前(5mC、C)、および後(5mC TAPS、C TAPS)の、五つの完全にメチル化されたCpG部位およびその非メチル化対照を含有する222bpモデルDNAに対するサンガー配列決定の結果。TAPS法でTに変換されるのは5mCだけである。(B)NgTET1酸化後およびピコボラン還元後のmESCs gDNA対照における相対的修飾レベルのHPLC-MS/MS定量化。三つの複製の平均±SDとして示されるデータ。
【0040】
図10-1】図10A~D。TAPSは、亜硫酸水素塩と比較して有意なDNA分解を引き起こさなかった。氷浴で冷却する前(A)、および後(B)の、222bpの非メチル化DNA、222bpメチル化DNA、およびmESC gDNAのアガロースゲル画像。TAPS後で検出可能なDNA分解は観察されなかった、およびDNAは二本鎖のままであり、冷却なし視覚化することができた。亜硫酸水素塩変換が分解を作り出し、DNAは一本鎖になり、氷で冷却された後のみ視覚化され得た。(C)氷上での冷却前(左パネル)および後(右パネル)のTAPSおよび亜硫酸水素塩で処理された様々な断片長のmESC gDNAのアガロースゲル画像。TAPSの後のDNAは二本鎖のままであり、ゲル上で直接視覚化され得た。亜硫酸水素塩処理により、試料により多くの損傷および断片化が起こり、およびDNAは一本鎖になり、氷で冷却された後のみ視覚化され得た。図15に示されるように、断片長に関わらず、すべてのgDNAに対してTAPS変換が完了した。(D)TAPS(3個の独立したリピート)の前後の222bpモデルDNAのアガロースゲル画像は、反応後に検出可能な分解を示していなかった。
図10-2】同上。
【0041】
図11図11。TAPSの前後のモデルDNA間の増幅曲線と溶融曲線との比較。qPCRアッセイでは、増幅曲線のTAPSの前後にモデルDNAの軽微な差異が示された。TAPS後により低温にシフトされたメチル化DNA(5mC)の溶融曲線は、非メチル化DNA(C)に対するシフトがない一方で、可能なTmが低減させたCからTへの移行を示唆した。
【0042】
図12図12。サンガー配列決定によって実証されるように、TAPS、TAPSβおよびCAPSの後に誘導された完全なCからTへの移行。単一メチル化および単一ヒドロキシメチル化されたCpG部位を含有するモデルDNAを本明細書に記述したように調製した。本明細書に記載されるNgTET1酸化およびピリジンボラン還元プロトコルの後にTAPS変換を行った。5hmCブロッキング、NgTET1酸化、およびピリジンボラン還元プロトコルの後にTAPS変換を行った。5hmC酸化、およびピリジンボラン還元プロトコルの後にCAPS変換を行った。変換後、1ngの変換されたDNA試料は、Taq DNAポリメラーゼによってPCR増幅され、サンガー配列決定のために処理された。TAPSが、5mCと5hmCの両方をTに選択的に変換した。TAPSβは選択的に5mCを変換したが、CAPSは選択的に5hmCを変換した。三つの方法のいずれも、非修飾シトシンおよびその他の塩基に対して変換を引き起こさなかった。
【0043】
図13-1】図13A~B。(A)TAPSは、様々なDNAおよびRNAポリメラーゼと適合性があり、サンガー配列決定により示されるように、完全なCからTへの移行を誘導する。ポリメラーゼ試験のためのメチル化CpG部位を含有するモデルDNAおよびプライマー配列が本明細書に記載されている。TAPS処理後、5mCをDHUに変換した。KAPA HiFiウラシルプラスポリメラーゼ、Taqポリメラーゼ、およびベントエキソポリメラーゼ(Vent exo-polymerase)は、DHUをTとして読み取り、したがって、PCR後に完全なCからTへの移行を誘発する。あるいは、プライマー伸長をビオチン標識プライマー、ならびにクレノウフラグメント、BstDNAポリメラーゼ、およびphi29 DNAポリメラーゼを含む等温ポリメラーゼで行った。新たに合成されたDNA鎖を、Dynabeads MyOne Streptavidin C1により分離し、次いでTaqポリメラーゼを用いてPCRにより増幅し、サンガー配列決定用に処理した。T7 RNAポリメラーゼは、DHUを効率的にバイパスし、DHU部位に対向してアデニンを挿入することができ、これはRT-PCRおよびサンガー配列決定によって証明されている。(B)特定のその他の商品化ポリメラーゼによってDNAを含有するDHUは効率的に増幅されなかった。TAPS処理後、5mCをDHUに変換した。KAPA HiFiウラシルプラスポリメラーゼ、Taqポリメラーゼは、DHUをTとして読み取り、したがって、完全なCからTへの移行を誘発する。KAPA HiFiポリメラーゼ、Pfuポリメラーゼ、フュージョンポリメラーゼ(Phusion polymerase)、およびNEB Q5ポリメラーゼ(非表示)を含む特定の他の商品化ポリメラーゼでは、低いCからTへの移行が観察されたか、または全く観察されなかった。
図13-2】同上。
【0044】
図14図14。DHUは、TおよびCと比較してPCRバイアスを示していない。一つのDHU/U/T/C修飾を含有するモデルDNAを、本明細書に記載される対応するDNAオリゴで合成した。DHU/U/T/C修飾を用いた各モデルDNAに対する標準曲線を、モデルDNA入力の1:10段階希釈でのqPCR反応に基づいてプロットした(0.1pg~1ng、各qPCR実験を三組で実行した)。ログ濃度(ng)値と平均Ct値との間の退行の勾配は、ExcelのSLOPE機能によって算出された。PCR効率は、以下の等式を使用して計算された:効率%=(10^(-1/勾配)-1)100%。増幅因子は、以下の等式を使用して計算された:増幅因子=10^(-1/勾配)。DHUまたはTまたはC修飾を有するモデルDNAに対するPCR効率はほぼ同じであり、これはDHUが正規塩基として読み取ることができ、PCRバイアスを引き起こさないことを示した。
【0045】
図15図15A~B。TAPSは、DNA断片長に関わらず、5mCを完全にTに変換した。(A)TaqαI消化アッセイのアガロースゲル画像は、DNA断片長に関わらず、全ての試料における完全な5mCのTへの変換が確認された。ラムダゲノムからの194bpモデル配列は、TAPSの後でPCR増幅され、TaqαI酵素で消化された。変換されていない試料から増幅されたPCR生成物を切断することができ、一方でTAPS処理試料上で増幅された生成物はインタクトであり、制限部位の損失を示唆し、そしてそのため完全な5mCからTへの移行を示唆した。(B)CからTへの変換パーセンテージは、ゲルバンド定量によって推定され、試験された全てのDNA断片長に対して100%示されている。
【0046】
図16図16。異なるTAPS条件についての変換および偽陽性。mTet1とピリジンボランの組み合わせは、NgTET1またはピコボランとの他の条件と比較して、メチル化Cの最高変換率(96.5%、完全CpGメチル化ラムダDNAで計算された)および非修飾Cの最低変換率(0.23%、2kb非修飾スパイクインで計算された)を達成した。バーの上に、すべての試験されたシトシン部位の変換率+/-SEが示される。
【0047】
図17図17A~B。短いスパイクインの変換率。5mCおよび5hmCを含む、(A)120mer-1および(B)120mer-2。両方の鎖からの5mCおよび5hmC部位で完全に近い変換が達成された。修飾状況を持つ実際の配列が上部および下部に表示される。
【0048】
図18-1】図18A~E。全ゲノム亜硫酸水素塩配列決定(WGBS)に対するTAPSの配列決定の品質の改善。(A)TAPS処理DNA中の5mCおよび5hmCの変換率。左:既知の位置でメチル化またはヒドロキシメチル化された合成スパイクイン(CpN)。(B)非修飾2kbスパイクインからのTAPSの偽陽性率。(C)100万回のシミュレートされた読み取りを一つのIntel Xeon CPUの1コアで処理するときの、TAPSおよびWGBSの総実行時間。(D)ゲノムにマッピングされたすべての配列決定された読み取りペア(トリミング後)の画分。(E)イルミナベーススペース(Illumina BaseSpace)によって報告されるように、すべての配列決定された読み取りペアの第一および第二の読み取りに対する1塩基当たりの配列決定品質スコア。上部:TAPS。下部:WGBS。
図18-2】同上。
【0049】
図19図19A~B。WGBSよりもさらに均一なカバレッジをもたらし、より少ないカバーされていない位置をもたらしたTAPS。両方の鎖で計算された、WGBSとTAPSとの間の(A)すべての塩基およびB)のCpG部位にわたるカバレッジの深さの比較。「TAPS(ダウンサンプリング)」の場合、すべてのマッピングされたTAPS読み取りからのランダム読み取りが、カバレッジの中央値がWGBSのカバレッジの中央値と一致するように選択された。50×を超えるカバレッジを持つ位置を最後の区間に示す。
【0050】
図20図20。全染色体にわたる修飾レベルの分布。CpGのカバレッジによって重み付けされ、ウィンドウサイズ10でガウス加重移動平均フィルターを使用して平滑化された、マウス染色体に沿った100kbウィンドウにおける平均修飾レベル。
【0051】
図21-1】図21A~E。TAPSおよびWGBSによるゲノム全体でのメチローム測定の比較。(A)全てのマウスCpG島(20ウィンドウの区間に入れられた)、および4kbpの近接領域(50の同等のサイズのウィンドウの区間に入れられた)における平均配列決定カバレッジの深さ。配列決定の深さの差異を考慮するために、すべてのマッピングされたTAPS読み取りは、ゲノム全体にわたってマッピングされたWGBS読み取りの中央値と一致するようにダウンサンプリングされた。(B)TAPSのみ、TAPSとWGBSの両方、またはWGBSのみによる、少なくとも三つの読み取りによってカバーされたCpG部位。(C)TAPSのみ、TAPSとWGBSの両方、またはWGBSのみで検出した、少なくとも三つの読み取りおよび修飾レベル>0.1によってカバーされたCpG部位の数。(D)TAPSおよびWGBSに対する修飾レベル(パーセントで)の染色体分布の例。ウィンドウサイズ10でガウス加重移動平均フィルターを使用して平滑化された、マウス染色体4に沿った100kbウィンドウ当たりの修飾CpGの平均画分。(E)各方法によって測定されるように修飾レベルによって分類された、TAPSおよびWGBSの両方における少なくとも三つの読み取りでカバーされた、CpG部位の数を表すヒートマップ。コントラストを改善するために、両方の方法で修飾されていないCpGを含む第一の区間は、色スケールから除外され、星印で示されている。
図21-2】同上。
【0052】
図22図22。CpG島の周辺の修飾レベル。CpG島(20ウィンドウの区間に入れられた)、および4kbpの近接領域(50の同等のサイズのウィンドウの区間に入れられた)における平均修飾レベル。三つの読み取り未満のカバレッジを持つ区間は無視された。
【0053】
図23図23A~B。TAPSは、WGBSよりも小さなカバレッジ修飾バイアスを示す。すべてのCpG部位はそれらのカバレッジに従った区間に入れられた、また、平均(円)および中央値(三角)の修飾値がWGBS(A)およびTAPS(B)の各区間に示されている。100超の読み取りをカバーするCpG部位が最後の区間に表示される。線は、データ点を通る線形適合を表す。
【0054】
図24図24A~C。dsDNAおよびssDNAライブラリ調製キットで調製された低入力gDNAおよび細胞遊離DNA TAPS。(A)配列決定ライブラリは、dsDNAライブラリキットNEBNextUltra IIまたはKAPA Hyperplusキットで、マウス胚性幹細胞(mESC)ゲノムDNA(gDNA)の1ngまで下げ、成功裏に構築された。ssDNAライブラリキットAccel-NGSメチル-配列キットを用いて、(B)0.01ngのmESC gDNAまたは(C)1ngの細胞遊離DNAにまで、入力DNA量をさらに下げた。
【0055】
図25図25A~B。dsDNA KAPA Hyperplusライブラリ調製キットで調製された低入力gDNAおよび細胞遊離DNA TAPSライブラリ。配列決定ライブラリは、KAPA Hyperplusキットで、わずか1ngの(A)mESC gDNA、および(B)細胞遊離DNAで構築された。細胞遊離DNAは、血漿ヌクレアーゼ分解により、160bp(ヌクレオソームサイズ)の周辺に鋭利な長さ分布を有する。ライブラリ構築の後、約300bpになり、これは、B)の鋭利なでバンドある。
【0056】
図26図26A~D。高品質の細胞遊離DNA TAPS。(A)TAPS処理cfDNA中の5mCの変換率。(B)TAPS処理cfDNAにおける偽陽性率。(C)ゲノムに一意にマッピングされたすべての配列決定された読み取りペアの画分。(D)ゲノムに一意にマッピングされた、およびPCR重複読み取りの除去後の、すべての配列決定された読み取りペアの画分。CHGとCHHとは、非CpGコンテクストである。
【0057】
図27図27。TAPSは遺伝的バリアントを検出できる。メチル化(MOD、上行)およびCからTへのSNP(下行)は、元の上の鎖(OT)/元の下の鎖(OB)、左側のカラム、に、ならびにOT(CTOT)およびOB(CTOB)に相補的な鎖、右側のカラム、に、明確な塩基分布パターンを示した。
【発明を実施するための形態】
【0058】
本発明は、本明細書において、TAPSという名称の配列で5mCおよび5hmCを検出するための亜硫酸水素塩非含有の塩基分解能方法を提供する。TAPSは、非修飾シトシンに影響を与えずに塩基分解能で直接的および定量的に5mCおよび5hmCを検出するための軽度の酵素反応および化学反応から成る。本発明はまた、非修飾シトシンに影響を与えずに、塩基分解能で5fCおよび5caCを検出する方法を提供する。したがって、本明細書に提供される方法は、5mC、5hmC、5fC、および5caCのマッピングを提供し、亜硫酸水素塩配列決定などの以前の方法の欠点を克服する。
表1。5mCおよび5hmC配列決定用のBSおよび関連する方法と、TAPS、TAPSβおよびCAPSとの比較。
【表1】
【0059】
5mCを特定する方法
【0060】
一態様では、本発明は、標的DNA中の5-メチルシトシン(5mC)を特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. DNAを修飾する工程であって、
i. DNA試料中の5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加する工程と、
ii. DNA試料中の5mCを5-カルボキシルシトシン(5caC)および/または5-ホルミルシトシン(5fC)に変換する工程と、
iii. 修飾標的DNAを含む修飾DNA試料を提供するために、5caCおよび/
または5fCをDHUに変換する工程と、を含む、修飾する工程、
c. 修飾標的DNAの配列を検出する工程であって、修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が比較した、検出する工程を含む。
【0061】
標的DNA中の5mCを特定する方法の実施形態では、方法は、標的DNA内で修飾が特定された各位置で5mCの修飾の頻度の定量的尺度を提供する。実施形態では、各移行位置でのTのパーセンテージは、標的DNAの各位置での5mCの定量レベルを提供する。
【0062】
5hmCを含まない標的DNAで5mCを特定するために、5caCおよび/または5fCへの変換を受けないように、試料中の5hmCがブロックされる。本発明の方法では、試料DNA中の5hmCは、5hmCにブロッキング基を添加することによって後続する工程に対して非反応性にされる。一実施形態では、ブロッキング基は、修飾糖、例えば、グルコースまたは6-アジド-グルコース(6-アジド-6-デオキシ-D-グルコース)を含む糖である。一つ以上のグルコシルトランスフェラーゼ酵素の存在下で、DNA試料をウリジン二リン酸(UDP)-糖と接触させることにより、糖ブロッキング基を5hmCのヒドロキシメチル基に加える。
【0063】
実施形態では、グルコシルトランスフェラーゼは、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、T4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、ならびにその誘導体および類似体である。βGTは、核酸中で、β‐D‐グルコシル(グルコース)残基が、UDP-グルコースから5-ヒドロキシメチルシトシン残基へと移送される化学反応を触媒する酵素である。
【0064】
ブロッキング基は、例えばグルコースであるということを記述することによって、これは、5hmCに加えられてグルコシル5-ヒドロキシメチルシトシンを得るグルコース部分(例えば、β-D-グルコシル残基)を指す。糖ブロッキング基は、グルコシルトランスフェラーゼ酵素の基質である任意の糖または修飾糖とすることができ、5hmCから5caCおよび/または5fCへのその後の変換をブロックする。次に、DNA試料中の5mCを5caCおよび/または5fCに変換する工程は、TET酵素を使用する酸化によるなどの本明細書に提供される方法によって達成される。そして5caCおよび/または5fCをDHUに変換することは、ボラン酸化によるなどの本明細書に提供される方法によって達成される。
【0065】
5-メチルシトシン(5mC)を特定するための方法をRNA試料上で実施して、標的RNAの5mCの位置を特定し、定量的尺度を提供することができる。
【0066】
5mCまたは5hmCを(一緒に)特定する方法
【0067】
別の態様では、本発明は、標的DNA中の5mC、または5hmCを特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. DNAを修飾する工程であって、
i. DNA試料中の5mCおよび5hmCを5-カルボキシルシトシン(5caC)および/または5fCに変換する工程と、
ii. 修飾標的DNAを含む修飾DNA試料を提供するために、5caCおよび/または5fCをDHUに変換する工程と、を含む、修飾する工程、
c. 修飾標的DNAの配列を検出する工程であって、標的DNAと比較した修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が、標的DNA中の5mCまたは5hmCのいずれかの位置を提供する、検出する工程を含む。
【0068】
標的DNA中の5mCまたは5hmCを特定する方法の実施形態では、方法は、標的DNA内で修飾が特定された各位置で5mCまたは5hmCの修飾の頻度の定量的尺度を提供する。実施形態では、各移行位置でのTのパーセンテージは、標的DNAの各位置での5mCまたは5hmCの定量レベルを提供する。
【0069】
5mCまたは5hmCを特定するためのこの方法は、5mCおよび5hmCの位置を提供するが、二つのシトシン修飾を区別しない。むしろ、5mCと5hmCの両方がDHUに変換される。DHUの存在を直接検出することができ、または修飾DNAを、DHUがTに変換される既知の方法によって複製することができる。
【0070】
5mCまたは5hmCを特定するための方法をRNA試料上で実施して、標的RNAの5mCまたは5hmCの位置を特定し、定量的尺度を提供することができる。
【0071】
5mCを特定する、および5hmCを特定する方法
【0072】
本発明は、本明細書に記載される第一のDNA試料について5mCを特定する方法を実施することと、(ii)本明細書に記載される第二のDNA試料について5mCまたは5hmCを特定する方法を実施することによって、標的DNA中の5mCを特定し、および5hmCを特定する方法を提供する。5mCの位置は、(i)によって提供される。(i)および(ii)の結果、ここにおいてCのTへの移行が(ii)では検出されるが(i)では検出されない、を比較することによって、標的DNA中の5hmCの位置を提供する。実施形態において、第一及び第二のDNA試料は、同じDNA試料に由来する。例えば、第一および第二の試料は、分析されるDNAを含む試料から取られた別個のアリコートであってもよい。
【0073】
DHUへの変換前に5mC、および5hmC(ブロックされていない)が5fCおよび5caCに変換されるため、DNA試料中の任意の既存の5fCおよび5caCは、5mCおよび/または5hmCとして検出される。しかしながら、通常の条件下でゲノムDNA中の5fCおよび5caCの極度の低レベルが考えられる場合、DNA試料中のメチル化およびヒドロキシメチル化を分析する時にこれは多くの場合許容される。5fCおよび5caCの信号は、例えば、それぞれヒドロキシルアミンコンジュゲーションおよびEDCカップリングにより、5fCおよび5caCをDHUへの変換から保護することによって除去することができる。
【0074】
上記の方法は、5mCの位置およびパーセンテージを、5mCまたは5hmC(一緒に)の位置およびパーセンテージと比較することを通して、標的DNAの5hmCの位置およびパーセンテージを特定する。あるいは、標的DNAの5hmCの修飾の位置および頻度を直接測定することができる。従って、一態様では、本発明は、標的DNA中の5hmCを特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. DNAを修飾する工程であって、
i. DNA試料中の5hmCを5fCに変換する工程と、
ii. 修飾標的DNAを含む修飾DNA試料を提供するために、5fCをDHUに変換する工程と、を含む、修飾する工程、
c. 修飾標的DNAの配列を検出する工程であって、標的DNAと比較した修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が、標的DNA中の5hmCの位置を提供する、検出する工程を含む。
【0075】
実施形態では、5hmCを5fCへと変換する工程は、例えば、過ルテニウム酸カリウム(KRuO)(本明細書に参照により本明細書に組み込まれる、Science.2012、33、934-937及びWO2013017853に記載されるように)、またはCu(II)/TEMPO(銅(II)過塩素酸塩、および2,2,6,6-テトラメチルピペリジン-1-オキシル(TEMPO))(本明細書に参照により本明細書に組み込まれる、Chem.Commun.,2017,53,5756-5759及びWO2017039002に記載されるように)にDNAを接触させることにより、5hmCを5fCへと酸化することを含む。次いで、DNA試料の5fCを、例えばボラン反応によってなどの、本明細書に開示される方法によってDHUに変換する。
【0076】
5mCを特定し、および5hmCを特定するための方法をRNA試料上で実施して、標的RNAの5mCおよび5hmCの位置を特定し、定量的尺度を提供することができる。
【0077】
5caCまたは5fCを特定する方法
【0078】
一態様では、本発明は、標的DNA中の5caCまたは5fCを特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. 修飾標的DNAを含む修飾DNA試料を提供するために、5caCおよび/または5fCをDHUに変換する工程、
c. 修飾標的DNAのコピー数を随意に増幅する工程、
d. 修飾標的DNAの配列を検出する工程であって、標的DNAと比較した修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が、標的DNA中の5caCまたは5fCの位置を提供する、検出する工程を含む。
【0079】
5fCまたは5caCを特定するためのこの方法は、5fCまたは5caCの位置を提供するが、これらの二つのシトシン修飾を区別しない。むしろ、5fCおよび5caCの両方がDHUに変換され、これは本明細書に記載の方法によって検出される。
【0080】
5caCを特定する方法
【0081】
別の態様では、本発明は、標的DNA中の5caCを特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. DNA試料中の5fCにブロッキング基を添加する工程、
c. 修飾標的DNAを含む修飾DNA試料を提供するために、5caCをDHUに変換する工程、
d. 修飾標的DNAのコピー数を随意に増幅する工程、
e. 修飾標的DNAの配列を決定する工程であって、標的DNAと比較した修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が、標的DNA中の5caCの位置を提供する、決定する工程を含む。
【0082】
標的DNA中の5caCを特定する方法の実施形態では、方法は、標的DNA内で修飾が特定された各位置で5caCの修飾の頻度の定量的尺度を提供する。実施形態では、各移行位置でのTのパーセンテージは、標的DNAの各位置での5caCの定量レベルを提供する。
【0083】
この方法では、5fCがブロックされ(そして5mCおよび5hmCはDHUに変換されない)、標的DNA内の5caCの特定を可能にする。本発明の実施形態では、DNA試料の5fCにブロッキング基を添加することは、例えば、ヒドロキシルアミン誘導体、ヒドラジン誘導体、およびヒラジド(hyrazide)誘導体を含むアルデヒド反応性化合物とDNAを接触させることを含む。ヒドロキシルアミン誘導体には、アスヒドロキシルアミン(ashydroxylamine)、ヒドロキシルアミン塩酸塩、ヒドロキシルアンモニウム硫酸塩、ヒドロキシルアミンホスファート、O-メチルヒドロキシルアミン、O-ヘキシルヒドロキシルアミン、O-ペンチルヒドロキシルアミン、O-ベンジルヒドロキシルアミン、およびとりわけ、O-エチルヒドロキシルアミン(EtONH2)、O-アルキル化、またはO-アリール化ヒドロキシルアミン、酸またはその塩が含まれる。ヒドラジン誘導体としては、N-アルキルヒドラジン、N-アリールヒドラジン、N-ベンジルヒドラジン、Ν,Ν-ジアルキルヒドラジン、N,N-ジアリールヒドラジン、N,N-ジベンジルヒドラジン、N,N-アルキルベンジルヒドラジン、N,N-アリールベンジルヒドラジン、およびΝ,Ν-アルキルアリールヒドラジンが挙げられる。ヒドラジド誘導体としては、-トルエンスルホニルヒドラジド、N-アシルヒドラジド、Ν,Ν-アルキルアシルヒドラジド、N,N-ベンジルアシルヒドラジド、N-N-アリールアシルヒドラジド、N-スルホニルヒドラジド、N,N-アルキルスルホニルヒドラジド、N,N-ベンジルスルホニルヒドラジド、及びN,N-アリールスルホニルヒドラジドが挙げられる。
【0084】
5caCを特定するための方法をRNA試料上で実施して、標的RNAの5caCの位置を特定し、定量的尺度を提供することができる。
【0085】
5fCを特定する方法
【0086】
別の態様では、本発明は、標的DNA中の5fCを特定するための方法を提供し、この方法は、
a. 標的DNAを含むDNA試料を提供する工程、
b. DNA試料中の5caCにブロッキング基を添加する工程、
c. 修飾標的DNAを含む修飾DNA試料を提供するために、5fCをDHUに変換する工程、
d. 修飾標的DNAのコピー数を随意に増幅する工程、
e. 修飾標的DNAの配列を検出する工程であって、標的DNAと比較した修飾標的DNAの配列におけるシトシン(C)のチミン(T)への移行が、標的DNA中の5fCの位置を提供する、検出する工程を含む。
【0087】
標的DNA中の5fCを特定する方法の実施形態では、方法は、標的DNA内で修飾が特定された各位置で5fCの修飾の頻度の定量的尺度を提供する。実施形態では、各移行位置でのTのパーセンテージは、標的DNAの各位置での5fCの定量レベルを提供する。
【0088】
DNA試料の5caCにブロッキング基を添加することは、(i)DNA試料を、例えば、l-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)、またはΝ,Ν’-ジシクロヘキシルカルボジイミド(DCC)などのカルボジイミド誘導体のようなカルボン酸誘導体化試薬のようなカップリング剤と接触させること、および(ii)DNA試料を、アミン、ヒドラジン、またはヒドロキシルアミン化合物と接触させることによって達成することができる。したがって、例えば5caCは、DNA試料をEDCで、次にベンジルアミン、エチルアミンまたはその他のアミンで処理することにより、ブロックされ、例えばpic-BHによって、DHUへの変換から5caCをブロックするアミドを形成することができる。EDC触媒された5caCカップリングの方法は、WO2014165770号に記載されており、参照により本明細書に組み込まれる。
【0089】
5fCを特定するための方法をRNA試料上で実施して、標的RNAの5fCの位置を特定し、定量的尺度を提供することができる。
【0090】
核酸試料/標的核酸
【0091】
本発明は、標的核酸における、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-カルボキシルシトシンおよび/または5-ホルミルシトシンのうちの一つ以上の位置を、非修飾シトシンに影響を及ぼすことなく、塩基分解能で定量的に特定するための方法を提供する。実施形態では、標的核酸はDNAである。他の実施形態では、標的核酸はRNAである。同様に、標的核酸を含む核酸試料は、DNA試料またはRNA試料であってもよい。
【0092】
標的核酸は、シトシン修飾(すなわち、5mC、5hmC、5fC、および/または5caC)を有する任意の核酸であってもよい。標的核酸は、試料中の単一核酸分子とすることができ、または試料(またはそのサブセット)中の核酸分子の集団全体であってもよい。標的核酸は、供給源(例えば、細胞、組織試料など)由来の天然核酸であってもよく、または例えば、配列決定のためのアダプターを用いた断片化、修復およびライゲーションによって、高処理量配列決定準備フォームに予め変換されてもよい。したがって、標的核酸は、個別において(例えば、個別標的の配列を決定することにより)、または群において(例えば、高処理量または次世代配列決定方法により)分析できる標的核酸配列のライブラリを生成するために本明細書に記載される方法を使用することができるように、複数の核酸配列を含むことができる。
【0093】
核酸試料は、モネラ(細菌)、原生生物、真菌類、植物界、および動物界からの生物体から得ることができる。核酸試料は、患者または対象から、環境試料から、または対象の生物体から取得されうる。実施形態において、核酸試料は、細胞または細胞の集合、体液、組織試料、器官および細胞小器官から抽出されるか、または由来する。
【0094】
RNA試料/標的RNA
【0095】
本発明は、標的RNAにおける、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-カルボキシルシトシンおよび/または5-ホルミルシトシンのうちの一つ以上の位置を、非修飾シトシンに影響を及ぼすことなく、塩基分解能で定量的に特定するための方法を提供する。実施形態では、RNAは、mRNA(メッセンジャーRNA)、tRNA(移転RNA)、rRNA(リボソームRNA)、snRNA(核内低分子RNA)、miRNA(マイクロNA)、lncRNA(長鎖非コードRNA)およびeRNA(エンハンサーRNA)のうち一つ以上である。標的RNAは、試料中の単一RNA分子とすることができ、または試料(またはそのサブセット)中のRNA分子の集団全体であってもよい。したがって、標的RNAは、個別において(例えば、個別標的の配列を決定することにより)、または群において(例えば、高処理量または次世代配列決定方法により)分析できる標的RNA配列のライブラリを生成するために本明細書に記載される方法を使用することができるように、複数のRNA配列を含むことができる。
【0096】
DNA試料/標的DNA
【0097】
本発明の方法は、亜硫酸水素塩配列決定などの方法に関連する実質的な分解を回避する軽度の酵素反応および化学反応を利用する。したがって、本発明の方法は、循環細胞遊離DNAなどの低入力試料の分析、および単一細胞分析に有用である。
【0098】
本発明の実施形態では、DNA試料はDNAのピコグラム量を含む。本発明の実施形態では、DNA試料は、約1pg~約900pg DNA、約1pg~約500pg DNA、約1pg~約100pg DNA、約1pg~約50pg DNA、約1~約10pg DNA、約200pg未満、約100pg未満DNA、約50pg未満 DNA、約20pg未満DNA、および約5pg未満DNAを含む。本発明の他の実施形態では、DNA試料はDNAのナノグラム量を含む。本発明の方法で使用するための試料DNAは、単一細胞またはバルクDNA試料からのDNAを含む任意の量でありうる。実施形態において、本発明の方法は、約1~約500ngのDNA、約1~約200ngのDNA、約1~約100ngのDNA、約1~約50ngのDNA、約1~約10ngのDNA、約2~約5ngのDNA、約100ng未満のDNA、約50ng未満のDNA約5ng未満、および約2ng未満のDNAを含む、DNA試料で行うことができる。本発明の実施形態では、DNA試料はDNAのマイクログラム量を含む。
【0099】
本明細書に記載される方法で使用されるDNA試料は、例えば、体液、組織試料、器官、細胞小器官、または単一細胞を含む任意の供給源からとなりうる。実施形態において、DNA試料は循環細胞遊離DNA(細胞遊離DNAまたはcfDNA)であり、これは血液中に存在し、細胞内に存在しないDNAである。cfDNAは、当技術分野で公知の方法を使用して血液または血漿から分離されうる。市販キットは、例えば、循環核酸キット(Qiagen)を含み、cfDNAの単離に利用できる。DNA試料は、抗体免疫沈降法、クロマチン免疫沈降法、制限酵素消化ベースの濃縮、ハイブリダイゼーションベースの濃縮、または化学的ラベリングベースの濃縮を含むがこれらに限定されない濃縮工程から生じ得る。
【0100】
標的DNAは、これに限定されないが、組織、器官、細胞、および細胞小器官から精製されたDNA断片またはゲノムDNAを含むシトシン修飾(すなわち、5mC、5hmC、5fC、および/または5caC)を有する任意のDNAであってもよい。標的DNAは、試料中の単一DNA分子とすることができ、または試料(またはそのサブセット)中のDNA分子の集団全体であってもよい。標的DNAは、供給源由来の天然DNAであってもよく、または例えば、配列決定のためのアダプターを用いた断片化、修復およびライゲーションによって、高処理量配列決定準備フォームに予め変換されてもよい。したがって、標的DNAは、個別において(例えば、個別標的の配列を決定することにより)、または群において(例えば、高処理量または次世代配列決定方法により)分析できる標的DNA配列のライブラリを生成するために本明細書に記載される方法を使用することができるように、複数のDNA配列を含むことができる。
【0101】
5mCおよび5hmCの、5caCおよび/または5fCへの変換
【0102】
本明細書に記載されるTAPS方法などの本発明の実施形態には、5mCと5hmCとを(または5hmCがブロックされている場合は5mCのみ)、5caCおよび/または5fCに変換する工程が含まれる。本発明の実施形態では、この工程は、DNAまたはRNA試料をテンイレブントランスロケーション(TET)酵素と接触させることを含む。TET酵素は、5mC上の酸素分子のN5メチル基への移送を触媒する酵素のファミリーであり、5-ヒドロキシメチルシトシン(5hmC)の形成をもたらす。TETはさらに5hmCの5fCへの酸化、および5fCの酸化を触媒して5caCを形成する(図5Aを参照)。TET酵素は、ヒトTET1、TET2、およびTET3;マウスTet1、Tet2、およびTet3;ネグレリアTET(NgTET);ウシグソヒトヨタケ(CcTET)、ならびにその誘導体または類似体のうちの一つ以上を含む本発明の方法において有用である。実施形態において、TET酵素はNgTETである。他の実施形態では、TET酵素はヒトTET1(hTET1)である。
【0103】
5caCおよび/または5fCの、DHUへの変換
【0104】
本発明の方法には、核酸試料中の5caCおよび/または5fCをDHUに変換する工程が含まれる。本発明の実施形態では、この工程は、例えば、ピリジンボラン、2-ピコリンボラン(pic-BH)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、及びナトリウムトリアセトキシボロヒドリドなどのボラン還元剤を含む還元剤にDNAまたはRNA試料を接触させることを含む。好ましい実施形態では、還元剤はピリジンボランおよび/またはpic-BHである。
【0105】
修飾標的核酸のコピー数を増幅する
【0106】
本発明の方法は、当技術分野で公知の方法によって、修飾標的核酸のコピー数を増幅する(増加する)工程を随意に含み得る。修飾標的核酸がDNAである場合、コピー数は、例えば、PCR、クローニング、及びプライマー伸長によって増加することができる。個々の標的DNAのコピー数は、特定の標的DNA配列に特異的なプライマーを使用して、PCRによって増幅することができる。あるいは、標準的な技術によるDNAベクターへのクローニングによって、複数の異なる修飾標的DNA配列を増幅することができる。本発明の実施形態では、複数の異なる修飾標的DNA配列のコピー数は、例えば、二本鎖アダプターDNAが試料DNA(または修飾試料DNA)に過去にライゲーションされており、アダプターDNAに対して相補的なプライマーを使用してPCRが実施されるような、次世代配列決定のためのライブラリを生成するため、PCRによって増加される。
【0107】
修飾標的核酸の配列の検出
【0108】
本発明の実施形態では、方法は修飾標的核酸の配列を検出する工程を含む。修飾標的DNAまたはRNAは、5mC、5hmC、5fC、および5caCのうちの一つ以上が非修飾標的DNAまたはRNAに存在した位置にDHUを含有する。DHUは、DNA複製および配列決定方法におけるTとしての役目を果たす。したがって、シトシン修飾は、当技術分野で既知のCのTへの移行を特定する任意の直接的または間接的な方法によって検出されうる。このような方法には、サンガー配列決定、マイクロアレイおよび次世代配列決定方法などの配列決定方法が含まれる。CのTへの移行はまた、制限酵素分析によって検出することもでき、ここでCのTへの移行が制限エンドヌクレアーゼ認識配列を無効にするか、または導入する。
【0109】
キット
【0110】
本発明はさらに、標的DNA中の5mCおよび5hmCの特定用キットを提供する。このようなキットは、本明細書に記載される方法による5mCおよび5hmCの特定用の試薬を含む。キットはまた、本明細書に記載の方法による、5caCの特定のためのおよび5fCの特定のための試薬を含有してもよい。実施形態において、キットは、TET酵素、ボラン還元剤および方法を実施するための指示を含む。さらなる実施形態では、TET酵素はTET1であり、ボラン還元剤は、ピリジンボラン、2-ピコリンボラン(pic-BH3)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、およびナトリウムトリアセトキシボロヒドリドからなる群のうちの一つ以上から選択される。さらなる実施形態では、TET1酵素はNgTet1またはマウスTet1であり、ボラン還元剤はピリジンボランおよび/またはpic-BHである。
【0111】
実施形態において、キットは、5hmCのブロッキング基およびグルコシルトランスフェラーゼ酵素をさらに含む。さらなる実施形態では、5hmCのブロッキング基は、ウリジン二リン酸(UDP)-糖であり、ここでこの糖はグルコースまたはグルコース誘導体であり、またグルコシルトランスフェラーゼ酵素はT4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、T4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、ならびにその誘導体および類似体である。
【0112】
実施形態では、キットは、過ルテニウム酸カリウム(KRuO4)および/またはCu(II)/TEMPO(銅(II)過塩素酸塩、および2,2,6,6-テトラメチルピペリジン-1-オキシル(TEMPO))から選択される酸化剤をさらに含む。
【0113】
実施形態において、キットは、核酸試料中の5fCをブロックするための試薬を含む。実施形態では、キットは、本明細書に記載されるように、例えば、ヒドロキシルアミン誘導体、ヒドラジン誘導体、およびヒラジド(hyrazide)誘導体を含むアルデヒド反応性化合物を含む。実施形態において、キットは、本明細書に記載されるような5caCをブロックするための試薬を含む。
【0114】
実施形態において、キットは、DNAまたはRNAを単離するための試薬を含む。実施形態では、キットは、例えば、血液、血漿、または血清からのcfDNAなどの試料から低入力DNAを単離するための試薬を含む。
【実施例
【0115】
方法
【0116】
モデルDNAの調製。
【0117】
MALDIおよびHPLC-MS/MS試験用のDNAオリゴ。C、5mCおよび5hmCを有するDNAオリゴヌクレオチド(「オリゴ」)をIntegrated DNA
Technologies社(IDT)から購入した。すべての配列および修飾が図6および7に見出され得た。5fCを有するDNAオリゴをCテーリング方法により合成した:DNAオリゴ5’-GTCGACCGGATC-3’、および5’-TTGGATCCGGTCGACTT-3’をアニールし、次にNEBuffer 2中で、5-ホルミル-2’-dCTP(Trilink Biotech)およびクレノウフラグメント3’→5’エキソ-(ニューイングランドバイオラブス(New England Biolabs))と、2時間37℃でインキュベートした。生成物をバイオスピンP-6ゲルカラム(Bio-Spin P-6 Gel Column)(バイオラド(Bio-Rad))で精製した。
【0118】
5caCを有するDNAオリゴを、標準的なホスホラミダイト(シグマ(Sigma))5-カルボキシ-dC-CEホスホラミダイト(グレンリサーチ(Glen Research))を用いたExpedite 8900核酸合成システムを使用して合成した。その後の脱保護および精製は、製造業者の指示に従ってGlen-Pakカートリッジ(グレンリサーチ)で実施された。精製オリゴヌクレオチドは、Voyager-DE MALDI-TOF(マトリックス支援レーザー脱離イオン化-飛行時間)Bioscriptmetryワークステーションにより特徴付けられた。
【0119】
変換試験用の222bpモデルDNA。五つのCpG部位を含む222bpモデルDNAを生成するために、バクテリオファージラムダDNA(サーモフィッシャー)は、Taq DNAポリメラーゼ(ニューイングランドバイオラブス)を使用してPCR増幅され、AMPure XPビーズ(ベックマン・コールター(Beckman Coulter))によって精製された。プライマー配列は以下の通りである:FW-5’-CCTGATGAAACAAGCATGTC-3’、RV-5’-CAUTACTCACUTCCCCACUT-3’。PCR生成物の逆鎖におけるウラシル塩基を、USER酵素(ニューイングランドバイオラブス)により除去した。精製されたPCR生成物100ngを次に、1xNEBuffer 2、0.64mM S-アデノシルメチオニンおよび20 U M.SssI CpGメチルトランスフェラーゼ(ニューイングランドバイオラブス)を含有する20μl溶液中で、2時間37℃でメチル化し、次に20分間65℃で、熱失活した。メチル化された222bpモデルDNAを、AMPure XPビーズによって精製した。
【0120】
サンガー配列決定を用いたTAPS、TAPSβ、およびCAPSの検証のためのモデルDNA。単一の5mCおよび単一の5hmC部位を含有する34bpのDNAオリゴを、5mMのTris-Cl(pH7.5)、5mMのMgCl、および50mMのNaClを含むアニーリング緩衝液中でその他のDNAオリゴでアニールし、次いで400UのT4リガーゼ(NEB)を含む反応において、25℃で1時間ライゲーションし、1.8X AMPure XPビーズで精製した。
【表2】
【0121】
ライゲーションの反応後にウラシルリンカーをUSER酵素により除去し、最終生成物配列(5’~3’)を得た:
【化1】

モデルDNAの増幅のためのPCRプライマーは以下の通りであった:P5:5’-AATGATACGGCGACCACCGAG-3’およびP7:5’-CAAGCAGAAGACGGCATACGAG-3’。
【0122】
ポリメラーゼ試験およびサンガー配列決定のためのモデルDNA。ポリメラーゼ試験およびサンガー配列決定のモデルDNAを、異なるDNAオリゴを使用したことを除き、上記と同一のライゲーション方法で調製した:
【表3】
【0123】
最終生成物配列(5’~3’)は以下のとおりであった:
【化2】

モデルDNAを増幅するためのPCRプライマーは、上記のP5プライマー及びP7プライマーである。プライマー伸長のためのビオチン標識プライマー配列は、P7プライマーの5’末端にビオチン連結されている。T7 RNAポリメラーゼ転写後のRT-PCRのPCRプライマーは、P5プライマーとRT:5’-TGCTAGAGGCAGAGAGAGCAAG-3’であった。
【0124】
PCRバイアス試験のモデルDNA。PCRバイアス試験のモデルDNAを、異なるDNAオリゴを使用したことを除き、上記と同一のライゲーション方法で調製した:
【表4】
【0125】
最終生成物配列(5’~3’):
【化3】

モデルDNAを増幅するためのPCRプライマーは、上記のP5およびP7プライマーである。
【0126】
メチル化バクテリオファージラムダゲノムDNAの調製
【0127】
1μgの非メチル化バクテリオファージラムダDNA(プロメガ(Promega))を、Mg2+非含有緩衝液(10mM Tris-Cl pH8.0、50mM NaCl、および10mM EDTA)中、0.64mMのSAM、及び0.8U/μlのM.SssI酵素を含有する50μL反応で、37℃で2時間メチル化した。次いで0.5μLのM.SssI酵素および1μlのSAMを加え、その反応を、さらに2時間37℃でインキュベートした。その後メチル化DNAを1倍のAmpure XPビーズで精製した。完全なメチル化を確保するために、全手順をNEB緩衝液2で繰り返した。次いで、DNAメチル化をHpaII消化アッセイで検証した。50ngのメチル化DNAと非メチル化DNAとを、カットスマート緩衝液(CutSmart buffer)(NEB)中、2UのHpaII酵素(NEB)で10μL反応において、1時間37℃で消化した。消化生成物は、消化されていないラムダDNA対照と共に1%アガロースゲル上で実行した。非メチル化ラムダDNAはアッセイ後に消化された、一方で、メチル化ラムダDNAはインタクトのままであり、成功裡にCpGメチル化を完了したことを確認した。ラムダDNAの配列は、GenBankに見出すことができる-EMBL受託番号:J02459
【0128】
2kb非修飾スパイクイン対照の調製
【0129】
2kbのスパイクイン対照(2kb-1、2、3)を、1ngのDNA鋳型、0.5μMのプライマー、1 Uのフュージョン High-Fidelity DNAポリメラーゼ(Phusion High-Fidelity DNA Polymerase)(サーモフィッシャー)を含有する反応において、pNIC28-Bsa4プラスミド(Addgene、カタログ番号26103)からPCR増幅した。PCRプライマー配列を表2に列挙する。
表2。スパイクイン用のPCRプライマーの配列。
【表5】
【0130】
PCR生成物をZymo-Spinカラムで精製した。2kbの非修飾対照配列(5’~3’):CACAGATGTCTGCCTGTTCATCCGCGTCCAGCTCGTTGAGTTTCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGGGCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTAAGGGGGATTTCTGTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCTCACGATACGGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGGTAAACAACTGGCGGTATGGATGCGGCGGGACCAGAGAAAAATCACTCAGGGTCAATGCCAGCGCTTCGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGCAGCATCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTCCGCGTTTCCAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGTTGCTCAGGTCGCAGACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGCGTATCGGTGATTCATTCTGCTAACCAGTAAGGCAACCCCGCCAGCCTAGCCGGGTCCTCAACGACAGGAGCACGATCATGCGCACCCGTGGGGCCGCCATGCCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGACCAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGCGACAGGCCGATCATCGTCGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAATGACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGACAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAGCTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGAGATCCCGGTGCCTAATGAGTGAGCTAACTTACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCCAGGGTGGTTTTTCTTTTCACCAGTGAGACGGGCAACAGCTGATTGCCCTTCACCGCCTGGCCCTGAGAGAGTTGCAGCAAGCGGTCCACGCTGGTTTGCCCCAGCAGGCGAAAATCCTGTTTGATGGTGGTTAACGGCGGGATATAACATGAGCTGTCTTCGGTATCGTCGTATCCCACTACCGAGATATCCGCACCAACGCGCAGCCCGGACTCGGTAATGGCGCGCATTGCGCCCAGCGCCATCTGATCGTTGGCAACCAGCATCGCAGTGGGAACGATGCCCTCATTCAGCATTTGCATGGTTTGTTGAAAACCGGACATGGCACTCCAGTCGCCTTCCCGTTCCGCTATCGGCTGAATTTGATTGCGAGTGAGATATTTATGCCAGCCAGCCAGACGCAGACGCGCCGAGACAGAACTTAATGGGCCCGCTAACAGCGCGATTTGCTGGTGACCCAATGCGACCAGATGCTCCACGCCCAGTCGCGTACCGTCTTCATGGGAGAAAATAATACTGTTGATGGGTGTCTGGTCAGAGACATCAAGAAATAACGCCGGAACATTAGTGCAGGCAGCTTCCACAGCAATGGCATCCTGGTCATCCAGCGGATAGTTAATGATCAGCCCACTGACGCGTTGCGCGAGAAGATTGTGCACCGCCGCTTTACAGGCTTCGACGCCGCTTCGTTCTACCATCGACACCACCACGCTGGCACCCAGTTGATCGGCGCGAGATTTAATCGCCGCGACAATTTGCGACGGCGCGTGCAGGGCCAGACTGGAGGTGGCAACGCCAATCAGCAACGACTGTTTGCCCGCCAGTTGTTGTGCCACGCGGTTGGGAATGTAATTCAGCTCCGCCATCGCCGCTTCCACTTTTTCCCGCGTTTTCGCAGAAACGTGGCTGGCCTGGTTCACCACGCGGGAAACGGTCTGATAAGAGACACCGGCATACTCTGCGACATCGTATAACGTTACTGGTTTCACATTCACCACCCT
【0131】
120merスパイクイン対照の調製
【0132】
120merのスパイクイン対照をプライマー伸長によって生成した。オリゴ配列およびプライマーを表3に列挙する。

表3。120mer対照スパイクインの調製に使用されるDNAオリゴおよびプライマーの配列。
【表6】

簡潔に述べると、120mer-1スパイクインについて、5mMのTris-Cl(pH7.5)、5mMのMgCl、50mMのNaClを含有したアニール緩衝液中、10μMのプライマーで3μMのオリゴをアニールした。120mer-2スパイクインについては、5μMのオリゴを7.5μMのプライマーでアニールした。プライマー伸長は、0.4μMのdNTPs(120mer-1:dATP/dGTP/dTTP/dhmCTP、120mer-2:dATP/dGTP/dTTP/dCTP)および5Uのクレノウポリメラーゼ(ニューイングランドバイオラブス)を用いて、NEB緩衝液2において、1時間37℃で実施された。反応後、スパイクイン対照は、Zymo-Spinカラム(Zymo Research)上で精製された。次いで120merスパイクイン対照が、NEB緩衝液2中、0.64mMのSAMおよび0.8U/μlのM.SssI酵素を含有する50μL反応において、37℃で2時間メチル化され、およびZymo-Spinカラムで精製された。使用されるすべてのスパイクイン配列は、https://figshare.com/s/80c3ab713c261262494bからダウンロードされ得る。
【0133】
N5mCNNおよびN5hmCNNでの合成スパイクインの生成
【0134】
N5mCNNおよびN5hmCNN配列を用いた合成オリゴは、アニーリングおよび伸長方法によって生成された。オリゴ配列を以下の表4に示す。
表4。
【表7】
【0135】
簡潔に述べると、10μMのN5mCNNおよびN5hmCNNオリゴ(IDT)は、5mMのTris-Cl(pH7.5)、5mMのMgCl、および50mMのNaClを含有するアニール緩衝液中で一緒にアニールされた。伸長は、0.4mMのdNTP(dATP/dGTP/dTTP/dCTP)および5Uのクレノウポリメラーゼ(NEB)を用いて、NEB緩衝液2において、1時間37℃で実施された。反応後、スパイクイン対照は、Zymo-Spinカラム(Zymo Research)上で精製された。N5mCNNおよびN5hmCNNを用いた合成スパイクイン(5’~3’):GAAGATGCAGAAGACAGGAAGGATGAAACACTCAGGCGCACGCTGGCATNmCNNGACAAACCACAAGAACAGGCTAGTGAGAATGAAGGGATATGTTTGTAAGATGGTCNNGNATCTTGGGTTGTGTGGTGGATGTTGGCGTTGGTGGGTTTCAGAGTTGG。相補鎖(5’~3’):CCAACTCTGAAACCCACCAACGCCAACATCCACCACACAACCCAAGATNhmCNNGACCATCTTACAAACATATCCCTTCATTCTCACTAGCCTGTTCTTGTGGTTTGTCNNGNATGCCAGCGTGCGCCTGAGTGTTTCATCCTTCCTGTCTTCTGCATCTTC。
【0136】
DNA消化およびHPLC-MS/MS分析
【0137】
DNA試料は、2UのヌクレアーゼP1(シグマアルドリッチ(Sigma-Aldrich))と10nMのデアミナーゼ阻害剤エリスロ-9-アミノ-β-ヘキシル-α-メチル-9H-プリン-9-エタノール塩酸塩(シグマアルドリッチ)で消化された。37℃で一晩インキュベートした後、試料を、6Uのアルカリホスファターゼ(シグマアルドリッチ)と、0.5UのホスホジエステラーゼI(シグマアルドリッチ)とで37℃で3時間にわたってさらに処理した。消化したDNA溶液は、タンパク質を除去するためにアミコンウルトラ-0.5mL 10K遠心分離フィルター(Amicon Ultra-0.5mL 10 K centrifugal filters)(メルクミリポア(Merck Millipore))で濾過され、HPLC-MS/MS分析を受けた。
【0138】
HPLC-MS/MS分析は、6495B三連四重極型質量分析計(アジレント(Agilent))と結合した1290 Infinity LC System(アジレント)を用いて実施された。ZORBAX Eclipse Plus C18カラム(2.1×150mm、1.8-ミクロン、アジレント)を使用した。カラム温度は40℃で維持され、溶媒系は10mMの酢酸アンモニウム(pH6.0、溶媒A)および水-アセトニトリル(60/40、v/v、溶媒B)を0.4mL/分の流量で含有する水であった。勾配は、0~5分;0溶媒B;5~8分;0~5.63%溶媒B;8~9分;5.63%溶媒B;9~16分;5.63~13.66%溶媒B;16~17分;13.66~100%溶媒B;17~21分;100%溶媒B;21~24.3分;100~0%溶媒B;24.3~25分;0%溶媒Bであった。MSの動的複数反応モニタリングモード(dynamic multiple reaction monitoring mode)(dMRM)が定量化に使用された。供給源依存性パラメータは、以下の通りであった:ガス温度230℃、ガス流14L/分、ネブライザー40psi、シースガス温度400℃、シースガス流11L/分、陽イオンモードにおいてキャピラリー電圧1500V、ノズル電圧0V、陽イオンモードにおいて高圧RF 110Vおよび陽イオンモードにおいて低圧RF 80V。全ての化合物についてフラグメンター電圧は380Vであり、その他の化合物依存性パラメータは表5に要約されている。
表5。ヌクレオシド定量化に使用される化合物依存性HPLC-MS/MSパラメータ。RT:保持時間、CE:衝突エネルギー、CAE:細胞促進電圧(cell accelerator voltage)。すべてのヌクレオシドが陽性モードで分析された。
【表8】
【0139】
NgTET1の発現及び精製
【0140】
Hisタグ付きNgTET1タンパク質(GG739552.1)をコードするpRSET-Aプラスミドは、インビトロゲン社(Invitrogen)から設計され、購入された。タンパク質は、一部の修飾と共に前述したように、大腸菌BL21(DE3)細菌に発現され、および精製された(J.E.Pais et al.,Biochemical characterization of a Naegleria TET-like oxygenase and its application in single molecule sequencing of 5-methylcytosine.Proc.Natl.Acad.Sci.U.S.A.112,4316-4321(2015)、参照により本明細書に組み込まれる)。簡潔に述べると、タンパク質発現については、一晩小規模培養物からの細菌をLB培地中で37℃および200rpmで、OD600が0.7~0.8であるまで増殖させた。その後、培養物を室温まで冷却し、標的タンパク質発現を0.2mMのイソプロピル-β-d-1-チオガラクトピラノシド(IPTG)で誘発した。細胞はさらに18時間、18℃および180rpmで維持された。その後、細胞を採取し、20mMのHEPES(pH7.5)、500mMのNaCl、1mMのDTT、20mMのイミダゾール、1μg/mLのロイペプチン、1μg/mLのペプスタチンAおよび1mMのPMSFを含有する緩衝液中で再懸濁した。細胞をEmulsiFlex-C5高圧ホモジナイザーで破壊し、溶解物を30,000
x gおよび4℃で1時間遠心分離することにより清澄した。収集した上清をNi-NTA樹脂に装填し、およびNgTET1タンパク質を、20mMのHEPES(pH7.5)、500mMのイミダゾール、2MのNaCl、1mMのDTTを含む緩衝液で溶出した。次いで、収集した画分をHiload 16/60 Sdx 75(20mM HEPES pH7.5、2M NaCl、1mM DTT)で精製した。次いで、NgTET1を含む画分を収集し、緩衝液を、20mM HEPES(pH7.0)、10mM
NaCl、1mM DTTを含む緩衝液に交換し、HiTrap HP SPカラムに装填した。純粋なタンパク質を塩勾配で溶出し、収集し、20mMのTris-Cl(pH8.0)、150mM NaCl、および1mM DTTを含有する最終緩衝液に緩衝液交換した。次いで、タンパク質を最大130μMまで濃縮し、グリセロール(30% v/v)と混合し、アリコートを-80℃で保存した。
【0141】
mTET1CDの発現および精製
【0142】
N末端フラグタグを有する、mTET1CD触媒ドメイン(NM_001253857.2、4371-6392)は、KpnI及びBamH1制限部位の間のpcDNA3-フラグにクローニングした。タンパク質発現のために、1mgプラスミドを、1×10細胞/mLの密度でExpi293F(ギブコ(Gibco))細胞培養物の1Lへとトランスフェクトし、および細胞を37℃、170rpmおよび5%のCOで48時間増殖させた。続いて、細胞を遠心分離によって採取し、50mM Tris-Cl pH=7.5、500mM NaCl、1X完全(cOmplete)プロテアーゼインヒビターカクテル(シグマ)、1mM PMSF、1% Triton X-100を含有する溶解緩衝液中で再懸濁し、20分間氷上でインキュベートした。細胞溶解物を次に30000 ×gおよび4℃で、30分間遠心分離によって清澄した。収集された上清は、ANTI-FLAG M2アフィニティゲル(シグマ)で精製し、純粋なタンパク質は、20mM HEPES pH=8.0、150mM NaCl、0.1mg/mL 3Xフラグペプチド(シグマ)、1X完全(cOmplete)プロテアーゼインヒビターカクテル(シグマ)、1mM PMSFを含有する緩衝液で溶出した。収集した画分を濃縮し、20mM HEPES pH=8.0、150mM NaCl、および1mM DTTを含む最終緩衝液に緩衝液交換した。濃縮されたタンパク質をグリセロール(30% v/v)と混合し、液体窒素中で凍結させ、アリコートを-80℃で保存した。組み換え型mTET1CDの活性および品質をMALDI質量分光分析によりチェックした。このアッセイに基づき、組換え型mTET1CDは完全に活性であり、5mCの5caCへの酸化を触媒することができる。タンパク質がヌクレアーゼを含まないことを確認するMALDIによって、試験されたモデルオリゴの任意の有意な消化が検出された。
【0143】
TET酸化
【0144】
NgTET1酸化。222bpモデルDNAオリゴのTet酸化については、100ngの222bp DNAを、50mM MOP緩衝液(pH6.9)、100mMアンモニウム鉄(II)硫酸、1mM a-ケトグルタル酸、2mMアスコルビン酸、1mMジチオスレイトール(DTT)、50mM NaCl、および5μM NgTETを含有する20μl溶液中で、37℃で1時間インキュベートした。その後、0.4 UのプロテイナーゼK(ニューイングランドバイオラブス)を反応混合物に加え、37℃で30分間インキュベートした。生成物は、製造業者の指示に従ってZymo-Spinカラム(Zymo Research)により精製された。
【0145】
ゲノムDNAのNgTET1酸化については、500ngのゲノムDNAを、50mM
MOP緩衝液(pH6.9)、100mMアンモニウム鉄(II)硫酸、1mM a-ケトグルタル酸、2mMアスコルビン酸、1mMジチオスレイトール、50mM NaCl、および5μM NgTET1を含有する50μl溶液中で、37℃で1時間インキュベートした。その後、4UのプロテイナーゼK(ニューイングランドバイオラブス)を反応混合物に加え、37℃で30分間インキュベートした。生成物は、製造業者の指示に従って1.8X Ampureビーズ上で洗浄された。
【0146】
mTET1酸化。100ngのゲノムDNAは、50mM HEPES緩衝液(pH8.0)、100μMアンモニウム鉄(II)硫酸、1mM a-ケトグルタル酸、2mMアスコルビン酸、1mMジチオスレイトール、100mM NaCl、1.2mM ATP、および4μM mTET1CDを含有する50μl反応において、37℃で80分間インキュベートした。その後、0.8UのプロテイナーゼK(ニューイングランドバイオラブス)を反応混合物に加え、50℃で1時間インキュベートした。生成物は、製造業者の指示に従って、バイオスピンP-30ゲルカラム(バイオラド)、および1.8X Ampure XPビーズ上で洗浄された。
【0147】
ボラン還元
【0148】
Pic-BH還元。MeOHおよび5μLの3M酢酸ナトリウム溶液(pH5.2、サーモフィッシャー)中の、25μLの5M α-ピコリン-ボラン(pic-BH、シグマアルドリッチ)を、20μLのDNA試料に加え、60Cで1時間インキュベートした。生成物は、222bpの製造業者の指示に従って、Zymo-Spinカラム(Zymo Research)によって、またはオリゴの製造業者の指示に従って、マイクロバイオスピン(Micro Bio-Spin)6カラム(バイオラド)によって精製された。
【0149】
あるいは、100mgの2-ピコリン-ボラン(ピコボラン、シグマアルドリッチ)を187μLのDMSO中に溶解して、およそ3.26Mの溶液を得た。各反応について、25μLのピコボラン溶液と5μLの3M酢酸ナトリウム溶液(pH5.2、サーモフィッシャー)を20μLのDNA試料に加え、70℃で3時間インキュベートした。生成物は、製造業者の指示に従って、ゲノムDNAのためのZymo-Spinカラムによって、または、DNAオリゴのためのマイクロバイオスピン6カラム(バイオラド)によって精製した。
【0150】
ピリジンボラン還元。35μLの水中の50~100ngの酸化DNAを、600mMの酢酸ナトリウム溶液(pH=4.3)と、1Mピリジンボランとを含有する50μL反応において、37℃および850rpmのエッペンドルフサーモミキサーで16時間、還元した。生成物をZymo-Spinカラムによって精製した。
【0151】
単一ヌクレオシドピコボラン反応。MeOHおよび500μLの3M酢酸ナトリウム溶液(pH5.2、サーモフィッシャー)中、500μLの3.26M 2-ピコリン-ボラン(ピコボラン、シグマアルドリッチ)を10mgの2’-デオキシシチジン-5-カルボン酸ナトリウム塩(ベリー・アンド・アソシエイツ(Berry&Associates))に加えた。混合物を60℃で1時間攪拌した。生成物をHPLCによって精製して、白色発泡体として純粋な化合物を得た。C14Naに対して計算された高分解能MS(Q-TOF)m/z[M+Na]+:253.0800;が以下を見出した:253.0789。
【0152】
5hmCブロッキング
【0153】
5hmCブロッキングを、50mM HEPES緩衝液(pH8)、25mM MgCl、200μMウリジンジホスホグルコース(UDP-Glc、ニューイングランドバイオラブス)、および10U βGT(サーモフィッシャー)、ならびに10μM 5hmC DNAオリゴを含有した20μl溶液中で、37℃で1時間実施した。製造業者の指示に従って、生成物をマイクロバイオスピン6カラム(バイオラド)により精製した。
【0154】
5fCブロッキング
【0155】
5fCブロッキングを、100mMのMES緩衝液(pH5.0)、10mM O-エチルヒドロキシルアミン(シグマアルドリッチ)、および10μM 5fC DNAオリゴ中で、37℃で2時間実施した。製造業者の指示に従って、生成物をマイクロバイオスピン6カラム(バイオラド)によって精製した。
【0156】
5caCブロッキング
【0157】
5caCブロッキングを、75mM MES緩衝液(pH5.0)、20mM N-ヒドロキシスクシンイミド(NHS、シグマアルドリッチ)、20mM 1-(3-ジメチルアミノプロピル)-3-エチルカルボジイミド塩酸塩(EDC、フルオロケム(Fluorochem))、および10μM 5caC DNAオリゴ中で、37℃で0.5時間実施した。次いで緩衝液を、製造業者の説明書に従って、マイクロバイオスピン6カラム(バイオラド)を使用して、100mMのリン酸ナトリウム(pH7.5)、150mM NaClに交換した。10mMのエチルアミン(シグマアルドリッチ)をオリゴに加え、37℃で1時間インキュベートした。製造業者の指示に従って、生成物をマイクロバイオスピン6カラム(バイオラド)によって精製した。
【0158】
5hmC酸化
【0159】
46μLの5hmC DNAオリゴを、2.5μLの1M NaOHで30分間37℃で、振盪インキュベーター中で変性させ、次いで50mM NaOHおよび15mM過ルテニウム酸カリウム(KRuO4、シグマアルドリッチ)を含有する溶液1.5μLで、氷上で1時間酸化した。生成物は、製造業者の指示に従って、マイクロバイオスピン6カラムによって精製された。
【0160】
TaqαIアッセイでのTAPS変換の検証
【0161】
TAPS後の5mC変換は、TaqαI制限部位(TCGA)および後続のTaqαI消化を含む標的領域のPCR増幅によって試験された。例えば、我々のTAPSライブラリの5mC変換は、CpGメチル化ラムダDNAスパイクイン対照から増幅される単一のTaqαI制限部位を含む194bpのアンプリコンに基づいて試験することができる。194bpのアンプリコンから増幅されたPCR生成物は、TaqαI制限酵素と消化生成物で消化され、2%アガロースゲルでチェックされる。非変換対照DNAで増幅されたPCR生成物は、TaqαIによって消化され、ゲル上に二つのバンドを示す。TAPSで変換された試料では、制限部位はCからTへの移行によって失われるため、194bpのアンプリコンはインタクトのままである。全体的な変換レベルは、消化されたおよび消化されていないゲルバンド定量に基づいて評価されることができ、またTAPS試料を成功させるためには95%よりも高くするべきである。
【0162】
簡潔に述べると、変換されたDNA試料は、対応するプライマーを用いたTaq DNAポリメラーゼ(ニューイングランドバイオラブス)によってPCR増幅された。PCR生成物を、1Xカットスマート緩衝液(ニューイングランドバイオラブス)中の4単位のTqaαI制限酵素(ニューイングランドバイオラブス)を用いて、65℃で30分間インキュベートし、2%アガロースゲル電気泳動によりチェックした。
【0163】
定量的ポリメラーゼ連鎖反応(qPCR)
【0164】
TAPS(図11)の前後のモデルDNA間の増幅曲線および溶融曲線の比較については、1×LightCycler 480高分解能溶融マスターミックス(High Resolution Melting Master Mix)(ロシュ・ダイアグノスティックス社(Roche Diagnostics Corporation))、250nMのプライマーFW-CCTGATGAAACAAGCATGTCおよびRV-CATTACTCACTTCCCCACTT、ならびに3mMのMgSOを含有する、19μLのPCRマスターミックス中に、DNA試料1ngを加えた。PCR増幅については、95℃で10分間、初期変性工程を実施し、次に95℃で5秒間の変性を40サイクル行い、カスタマイズされたアニーリング温度で5秒間のアニーリング、および72℃で5秒間伸長を実施した。最終工程は、95℃で1分間、70℃で1分間、および65℃~95℃の溶融曲線(0.02℃の工程増分、各獲得前に5秒保持)を含んだ。
【0165】
その他のアッセイについては、qPCRを、1× Fast SYBRグリーンマスターミックス(1× Fast SYBR Green Master Mix)(サーモフィッシャー)、200nMの前方プライマー、および逆方向プライマーを含む、19μLのPCRマスターミックスに必要量のDNA試料を添加することにより実施した。PCR増幅については、初期変性工程を95℃で20秒間実施し、次いで95℃で3秒間の変性を40サイクル、20秒のアニーリングおよび伸長を60℃で行った。
【0166】
HpaII-qPCRアッセイでのmESC gDNA中のCCGGメチル化レベルの検証。
【0167】
1μgのmESC gDNAを、50μL反応において37℃で16時間、50単位のHpaII(NEB、50単位/μL)および1Xカットスマート緩衝液でインキュベートした。対照反応については、HpaIIを添加しなかった。反応に、1μLのプロテイナーゼKを加え、40℃で30分間インキュベートし、その後95℃で10分間プロテイナーゼKで失活した。HpaII消化試料、または対照試料のCt値は、特定のCCGG位置(表9に記載)に対する対応するプライマーセットで、上記のqPCRアッセイによって測定された。
【0168】
サンガー配列決定
【0169】
PCR生成物を、エキソヌクレアーゼIおよびエビアルカリホスファターゼ(Shrimp Alkaline Phosphatase)(ニューイングランドバイオラブス)またはZymo-Spinカラムにより精製し、サンガー配列決定用に処理した。
【0170】
異なる長さの断片に対するDNA損傷試験。
【0171】
mESCゲノムDNAを0.5%CpGメチル化ラムダDNAでスパイクインし、断片化しないままにしておき、またはCovaris M220機器で超音波分解し、Ampure XP ビーズで500~1kb、または1kb~3kbにサイズ選択した。200ngのDNAはmTET1CDで単回酸化(single-oxidised)させ、上述の、または製造業者のプロトコルに従ってEpiTect亜硫酸水素塩キット(Qiagen)で変換された、ピリジンボラン複合体を使用して還元した。TAPS前後のDNAの10ngおよび亜硫酸水素塩変換が1%アガロースゲルで実行された。可視化するために、亜硫酸水素塩変換されたゲルを氷浴中の試料10分間冷却した。TAPS試料中の5mC変換は、上述の通り、TaqαI消化アッセイによって試験された。
【0172】
mESC培養およびゲノムDNAの単離
【0173】
マウスESC(mESC)E14は、15%のFBS(ギブコ)、2mMのL-グルタミン(ギブコ)、1%の非必須アミノ酸(ギブコ)、1%のペニシリン/ストレプトアビジン(ギブコ)、0.1mMのβ-メルカプトエタノール(シグマ)、1000単位/mL LIF(ミリポア)、1μM PD0325901(ステムジェント(Stemgent))、および3μM CHIR99021(ステムジェント)を添加したダルベッコ変法イーグル培地(DMEM)(インビトロジェン(Invitrogen))のゼラチンで被覆されたプレート(gelatin-coated plates)上で培養した。培養物を37℃および5%COで維持し、2日ごとに継代した。
【0174】
ゲノムDNAの単離については、1000 x g及び室温で5分間遠心分離により細胞を採取した。DNAを製造業者のプロトコルに従い、Quick-DNA Plusキット(Zymo Research)で抽出した。
【0175】
TAPSおよびWGBSに対するmESC gDNAの調製。
【0176】
全ゲノム亜硫酸水素塩配列決定(WGBS)について、mESC gDNAを、0.5%の非メチル化ラムダDNAでスパイクインした。全ゲノムTAPSについては、mESC gDNAを0.5%のメチル化ラムダDNAおよび0.025%の非修飾2kbスパイクイン対照でスパイクインした。DNA試料をCovaris M220機器によって断片化し、Ampure XPビーズ上で200~400bpにサイズ選択した。TAPS用DNAを、Ampure XP ビーズを用いたサイズ選択後にN5mCNNおよびN5hmCNN対照オリゴの0.25%で追加的にスパイクインした。
【0177】
全ゲノム亜硫酸水素塩配列決定
【0178】
全ゲノム亜硫酸水素塩配列決定(WGBS)について、0.5%の非メチル化バクテリオファージラムダDNAを伴う200 ngの断片化されたmESC gDNAスパイクインが使用された。メチル化アダプター(NextFlex)の末端修復およびAテーリング反応、ならびにライゲーションは、製造業者のプロトコルに従ってKAPA HyperPlusキット(カパ・バイオシステムズ(Kapa Biosystems))で調製された。続いて、DNAは、イルミナのプロトコルに従い、EpiTect亜硫酸水素塩キット(Qiagen)で亜硫酸水素塩変換を受けた。最終ライブラリを、KAPA
Hifiウラシルプラスポリメラーゼ(カパ・バイオシステムズ)で、6サイクルの間増幅し、1XAmpureビーズで洗浄した。WGBS配列決定ライブラリは、15%のPhiX対照ライブラリスパイクインを有するNextSeq高出力キットを使用して、NextSeq 500配列決定装置(NextSeq 500 sequencer)(イルミナ)上で配列決定されたペア末端80bpであった。
【0179】
全ゲノムTAPS
【0180】
全ゲノムTAPSについては、0.5%のメチル化ラムダDNAを伴う、100ngの断片化されたmESC gDNAスパイクイン、および0.025%の非修飾2kbスパイクイン対照が使用された。イルミナ多重化アダプター(Illumina Multiplexing adapter)の末端修復およびAテーリング反応、ならびにライゲーションは、製造業者のプロトコルに従ってKAPA HyperPlusキットで調製された。ライゲーションされたDNAをmTET1CDで2回酸化し、次いで上述のプロトコルに従ってピリジンボランで還元した。最終配列決定ライブラリを、KAPA Hifiウラシルプラスポリメラーゼで、5サイクルの間増幅し、1XAmpureビーズで洗浄した。全ゲノムTAPS配列決定ライブラリは、1%のPhiX対照ライブラリスパイクインを有する一つのNextSeq高出力キットを使用して、NextSeq 500配列決定装置(イルミナ)上で配列決定されたペア末端80bpであった。
【0181】
dsDNAライブラリ調製キットを用いた低入力全ゲノムTAPS
【0182】
全ゲノムTAPSについて上述したように調製されたmESC gDNAを、低入力全ゲノムTAPSに使用した。簡潔に述べると、100ng、10ng、および1ngのmESC gDNAを含む試料を、上述のプロトコルに従ってNgTET1で酸化した。製造業者のプロトコルに従い、NEBNext Ultra II(ニューイングランドバイオラブス)またはKAPA HyperPlusキットを用いて、末端修復およびAテーリング反応、ならびにライゲーションを行った。続いて、DNAは上述のようにピコボラン反応を受けた。変換されたライブラリを、KAPA Hifiウラシルプラスポリメラーゼで増幅し、1X Ampureビーズで洗浄した。
【0183】
ssDNAライブラリ調製キットを用いた低入力全ゲノムTAPS
【0184】
全ゲノムTAPSについて上述したように調製されたmESC gDNAを、低入力全ゲノムTAPSに使用した。簡潔に述べると、100ng、10ng、1ng、100pg、および10pgのmESC gDNAを含む試料を、上述のように、NgTET1で1回酸化し、ピコボランで還元した。配列決定ライブラリは、製造業者のプロトコルに従って、Accel-NGSメチル-配列DNAライブラリキット(Accel-NGS Methyl-Seq DNA Library Kit)(スウィフト・バイオサイエンシズ(Swift Biosciences))を用いて調製した。最終ライブラリを、6サイクル(100ng)、9サイクル(10ng)、13サイクル(1ng)、16サイクル(100pg)、および21サイクル(10pg)の間、KAPA Hifiウラシルプラスポリメラーゼで増幅し、0.85X Ampureビーズで洗浄した。
【0185】
他の実験では、全ゲノムTAPSについて上述したように調製されたmESC gDNAを、低入力全ゲノムTAPSに使用した。簡潔に述べると、100ng、10ng、および1ngのmESC gDNAを含む試料を、末端修復およびAテーリング反応に使用し、製造業者のプロトコルに従ってKAPA HyperPlusキットを用いてイルミナ多重化アダプターにライゲーションした。次に、ライゲーションされた試料をmTET1CDで1回酸化し、次いで上述のプロトコルに従ってピリジンボランで還元した。変換されたライブラリを、5サイクル(100ng)、8サイクル(10ng)、13サイクル(1ng)の間、KAPA Hifiウラシルプラスポリメラーゼで増幅し、1X Ampureビーズで洗浄した。
【0186】
細胞遊離DNA TAPS
【0187】
細胞遊離DNA TAPS試料は、10ng、および1ngの細胞遊離DNA試料から調製された。簡潔に述べると、試料をNgTET1で1回酸化し、上述のようにピコボランで還元した。配列決定ライブラリは、製造業者のプロトコルに従って、Accel-NGSメチル-配列DNAライブラリキット(スウィフト・バイオサイエンシズ)を用いて調製した。最終ライブラリを、9サイクル(10ng)、および13サイクル(1ng)の間、KAPA Hifiウラシルプラスポリメラーゼで増幅し、0.85X Ampureビーズで洗浄した。
【0188】
他の実験では、細胞遊離DNA TAPS試料を、全ゲノムTAPSについて上述したように10ng、および1ngの細胞遊離DNA試料から調製した。簡潔に述べると、細胞遊離DNA試料を、末端修復およびAテーリング反応に使用し、製造業者のプロトコルに従ってKAPA HyperPlusキットを用いてイルミナ多重化アダプターにライゲーションした。次に、ライゲーションされた試料をmTET1CDで1回酸化し、次いで上述のプロトコルに従ってピリジンボランで還元した。変換されたライブラリを、7サイクル(10ng)、および13サイクル(1ng)の間、KAPA Hifiウラシルプラスポリメラーゼで増幅し、1X Ampureビーズで洗浄した。
【0189】
WGBSデータ処理
【0190】
ペア末端の読み取りは、イルミナベーススペースからFASTQとしてダウンロードし、その後Trim Galore! v0.4.4で、品質トリミングされた(https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)。トリミング後の少なくとも一つの読み取りが35bpより短い読み取りペアが、取り除かれた。トリミングされた読み取りは、--オーバーラップオプション無し(--no_overlap option)を使用したBismark v0.19を使用して、マウスゲノムのmm9バージョン、ラムダファージおよびPhiX(イルミナiGENOMESからの配列)を組み合わせたゲノムにマッピングされた(F.Krueger,S.R.Andrews,Bismark:a flexible aligner and methylation caller for Bisulfite-Seq applications.Bioinformatics 27,1571-1572(2011)、参照により本明細書に組み込まれる)。「3-C」フィルターを使用して、過剰な非変換率で読み取りを取り除いた。Picard v1.119(http://broadinstitute.github.io/picard/)MarkDuplicatesを使用してPCR重複を呼び出した。アーティファクトをマッピングする傾向が知られている領域が、ダウンロードされ(https://sites.google.com/site/anshulkundaje/projects/blacklists)、さらなる分析から除外された(E.P.Consortium,An integrated encyclopedia of DNA elements in the human genome.Nature 489,57-74(2012)、参照により本明細書に組み込まれる)。
【0191】
TAPSデータ前処理
【0192】
ペア末端読み取りは、イルミナベーススペースからダウンロードされ、その後Trim
Galore! v0.4.4で品質トリミングされた。トリミング後の少なくとも一つの読み取りが35bpより短い読み取りペアが、取り除かれた。トリミングされた読み取りは、デフォルトのパラメータで、BWA mem v.0.7.15を使用して、スパイクイン配列、ラムダファージ、およびマウスゲノムのmm9バージョンを組み合わせるゲノムにマッピングされた(H.Li,R.Durbin,Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics 25,1754-1760(2009)、参照により本明細書に組み込まれる)。アーティファクトをマッピングする傾向が知られている領域が、ダウンロードされ(https://sites.google.com/site/anshulkundaje/projects/blacklists)、さらなる分析から除外された(E.P.Consortium,Nature 489,57-74(2012))。
【0193】
TAPS中の変換された塩基の検出
【0194】
整列された読み取りは、個別仕様のパイソン3スクリプト(python3 script)(MF-filter.py)を使用して、元の上(OT)の、および元の下(OB)の鎖に分割した。次いで、別個にOT上とOB上とでPicard MarkDuplicateを使用して、PCR重複が取り除かれた。読み取りペア中のオーバーラップしているセグメントは、重複されたマッピングされたOTおよびOB読み取り上で別個に、BamUtil clipOverlap(https://github.com/statgen/bamUtil)を使用して取り除かれた。次いで、修飾された塩基を、サムツールmpileup(samtools mpileup)および個別仕様のパイソン3スクリプト(MF-caller_MOD.py)を使用して検出した。
【0195】
TAPSおよびWGBSの配列決定品質分析
【0196】
ヌクレオチドタイプごとの品質スコア統計を、パイソン3スクリプト(MF-phredder.py)を用いてイルミナベーススペースからダウンロードしたときに、元のFASTQファイルから抽出した。
【0197】
TAPSおよびWGBSのカバレッジ分析
【0198】
塩基ごとのゲノムカバレッジファイルはBedtools v2.25 genomecovで生成された(A.R.Quinlan,I.M.Hall,BEDTools:a flexible suite of utilities for comparing genomic features.Bioinformatics 26,841-842(2010)、参照により本明細書に組み込まれる)。TAPSとWGBSの間の相対的カバレッジ分布を比較するために、TAPS読み取りは、samtoolsビュー(samtools view)の-sオプションを使用して、WGBSの対応するカバレッジ中央値にサブサンプリングされた。WGBS およびサブサンプリングTAPSのカバレッジを比較する分析では、TAPSおよびWGBSバムファイル(bam file)の両方で、クリップオーバーラップ(clipOverlap)を使用した。
【0199】
TAPS及びWGBSによって測定されたシトシン修飾の分析
【0200】
塩基ごとの修飾された読み取りの画分はそれぞれ、Bismark出力、およびMF-caller_MOD.pyの出力から算出された。Bedtoolsの交差(Bedtools intersect)を使用して交差を行い、統計解析及び図をR及びMatlabで生成した。ゲノム領域は、IGV v2.4.6を使用して視覚化された(J.T.Robinson et al.,Integrative genomics viewer.Nat.Biotechnol.29,24-26(2011)、参照により本明細書に組み込まれる)。CGIの周りのカバレッジおよび修飾レベルをプロットするために、mm9のすべてのCGI座標は、UCSCゲノムブラウザからダウンロードされ、20ウィンドウの区間に入れられ、両側に最大80bpのサイズの50ウィンドウまで伸長させた(次のCGIまでの距離の半分に達さない限り)。Bedtoolsマップを使用して、各区間における平均修飾レベル(CpGにおける)およびカバレッジ(すべての塩基、両方の鎖における)を計算した。各区間の値を再度平均し、その後Matlabにプロットした。
【0201】
データ処理時間のシミュレーション
【0202】
合成ペア末端配列決定読み取りは、ラムダファージゲノムに基づいてART42を使用してシミュレーションされた(-p-ss NS50--errfree--minQ 15-k 0-nf 0-l 75-c 1000000-m 240-s 0-ir 0-ir2 0-dr 0-dr2 0-sam-rs 10のパラメータで)。次に、全てのCpG位置の50%が修飾されたものとしてマークされ、個別仕様のパイソン3スクリプトを使用して、TAPS(変換修飾塩基)として、またはWGBS(変換非修飾塩基)としてのいずれかで、二つのライブラリが作成された。その後、本論の各方法に使用されるパイプラインに従って読み取りを処理した。処理時間はLinux(登録商標)コマンド時間で測定された。分析のすべての工程を、250GBのメモリを備えた一つのIntel Xeon CPU上でシングルスレッドモードで実行した。
【0203】
結果と考察
【0204】
pic-BHは、以前に知られていない還元脱カルボキシル化/脱アミノ化反応によって、5fCおよび5caCをDHUに簡単に変換することができるということを発見した(図4)。反応は、MALDIを使用した単一ヌクレオシドおよびオリゴヌクレオチドの両方で定量的であることが示された(図2~3、および6~7)。
【0205】
マトリクス支援レーザー脱離法/イオン化質量分光法(MALDI)によってモニターされるとき、5caCと反応する可能性のある化学物質をスクリーンするためのモデルとして11mer 5caC含有DNAオリゴを使用した。ある特定のボラン含有化合物は、5caCオリゴと効率的に反応することが見出され、結果として41Daの分子量減少が得られた(図1および2)。ピリジンボランおよびその誘導体2-ピコリンボラン(ピコボラン)を、市販されており、環境に良好な還元剤であるため、さらなる研究のために選択した。
【0206】
単一の5caCヌクレオシド上の反応が繰り返され、ピリジンボランおよびピコボランが5caCをジヒドロウラシル(DHU)に変換することを確認した(図3、4B)。興味深いことに、ピリジンボラン及びピコボランは、明らかな還元脱カルボキシル化/脱アミノ化機構を介して、5fCをDHUに変換することも見いだされた(図4Cおよび6)。両方の反応の詳細な機構がまだ定義されないままである。HPLC-MS/MSによるDNAオリゴでのボラン反応の定量的解析は、ピコボランが5caCおよび5fCをDHUに、およそ98%の効率で変換し、非メチル化シトシン、5mCまたは5hmCに対する活性を有しないことを確認する(図2B)。
【0207】
ウラシル誘導体として、DHUは、チミンとしてのDNAおよびRNAポリメラーゼの両方によって認識され得る。したがって、ボラン還元は、5caCからTへ、および5fCからTへの両方の移行を誘発するために使用することができ、また、5fCおよび5caCの塩基分解能配列決定に使用することができ、これを我々はピリジンボラン配列決定(「PS」)と称する(表6)。5fCおよび5caCのTへのボラン還元はそれぞれ、ヒドロキシルアミンコンジュゲーション(C.X.Song et al.,Genome-wide profiling of 5-formylcytosine reveals its roles in epigenetic priming.Cell 153,678-691(2013)、参照により本明細書に組み込まれる)、およびEDCカップリング(X.Lu et al.,Chemical modification-assisted bisulfite sequencing(CAB-Seq)for 5-carboxylcytosine detection in DNA.J.Am.Chem.Soc.135,9315-9317(2013)、参照により本明細書に組み込まれる)を介してブロックすることができる(図6)。このブロッキングにより、PSを、配列5fCまたは5caCに特異的に使用することができる(表6)。

表6。BSおよび関連する方法と、5fCおよび5caC配列決定のためのPSとの比較。
【表9】
【0208】
さらに、TET酵素は、5mCと5hmCとを5caCに酸化し、次いで、5caCをTET-補助ピリジンボラン配列決定(「TAPS」)と呼ばれる本明細書のプロセスにおけるボラン還元にかけることに使用することができる(図5A~B、表1)。TAPSは5mCおよび5hmCのCからTへの移行を誘発することができ、したがって5mCおよび5hmCの塩基分解能検出に使用できる。
【0209】
加えて、β-グルコシルトランスフェラーゼ(βGT)は5hmCをグルコースで標識することができ、それによって、本明細書においてTAPSβと呼称されるプロセスで、5mCのみの選択的配列決定を可能にしつつ(図5B、表1)、TET酸(M.Yu et al.,Base-resolution analysis of 5-hydroxymethylcytosine in the mammalian genome.Cell 149,1368-1380(2012))およびボラン還元からそれを保護することができる(図7)。その後、TAPS測定からのTAPSβの減算によって、5hmC部位を推定することができる。あるいは、過ルテニウム酸カリウム(KRuO)、酸化亜硫酸水素塩配列決定(oxBS)で以前に使用された試薬(M.J.Booth et al.,Quantitative Sequencing of 5-Methylcytosine and 5-Hydroxymethylcytosine at Single-Base Resolution.Science 336,934-937(2012))は、5hmCを5fCに特異的に酸化させるための化学酸化剤としてTETを置き換えることに使用することができる(図7)。本明細書において、化学補助ピリジンボラン配列決定(「CAPS」)と呼称されるこのアプローチを、5hmCを特異的に配列するために使用することができる(図5B、表1)。したがって、TAPSおよび関連する方法は、原則的に四つのシトシンのエピジェネティックな修飾すべてを配列するための包括的なスイートを提供することができる(図5B、表1、表6)。
【0210】
TAPS単独が、ゲノム内の既存の5fCおよび5caCも検出する。しかしながら、通常の条件下でゲノムDNA中の5fCおよび5caCの極度の低レベルが考えられる場合、これは許容される。特定の条件下、5fCおよび5caCの信号を完全に除去することが望まれる場合では、それは、ヒドロキシルアミンコンジュゲーションおよびEDCカップリングによってそれぞれ、5fCおよび5caCを保護することによって容易に達成でき、それによってDHUへの変換が防止される。
【0211】
TAPSの性能は、亜硫酸水素塩配列決定と比較して、5mCおよび5hmCの塩基分解能マッピングに対する現在の標準および最も広く使用されている方法であると評価された。ネグレリアTET様オキシゲナーゼ(NgTET1)およびマウスTet1(mTet1)は両方とも、インビトロで効率的に5mCを5caCに酸化することができるため、使用された。5mCからTへの移行を確認するために、完全にメチル化されたCpG部位を含有するモデルDNAにTAPSを適用し、制限酵素消化(図8A~B)、およびサンガー配列決定(図9A)によって実証されるように、それが5mCをTへ効果的に変換できることを示した。TAPSβおよびCAPSも、サンガー配列決定によって検証された(図12)。
【0212】
TAPSをマウス胚性幹細胞(mESC)からゲノムDNA(gDNA)に適用した。HPLC-MS/MS定量化では、予想されるように、5mCが、mESCs gDNA中のシトシン修飾の98.5%を占めることが示され、残りの部分は5hmC(1.5%)、および微量の5fCおよび5caCからなり、DHUはなかった(図9B)。TET酸化後、シトシン修飾の約96%を5caCへと酸化し、および3%を5fCへと酸化した(図9B)。ボラン還元後、99%を超のシトシン修飾はDHUに変換された(図9B)。これらの結果は、ゲノムDNA上で、TET酸化およびボラン還元の両方が効率的に働いていることを実証する。
【0213】
TET酸化およびボラン還元の両方は軽度の反応で、亜硫酸水素塩と比較しても顕著なDNA分解はなく(図10A~D)、またそれによって高いDNA回収を提供する。亜硫酸水素塩配列決定に関する別の顕著な利点は、TAPSが非破壊的であり、10kbsの長さまでDNAを保持できることである(図10C)。さらに、DNAはTAPS後に二本鎖を維持し(図10A~C)、変換はDNA長さとは独立している(図15A~B)。
【0214】
さらに、DHUは天然塩基に近接しているため、様々なDNAポリメラーゼおよび等温DNAまたはRNAポリメラーゼと適合性があり(図13A~B)、PCR中のT/Cと比較してバイアスは示されない(図14)。
【0215】
全ゲノム配列決定を、mESC gDNAの二つの試料で行った。一つの試料を、TAPSを用いて変換し、比較するために、もう一方の試料には標準全ゲノム亜硫酸水素塩配列決定(WGBS)を用いた。
【0216】
TAPSの正確性を評価するために、CpGメチルトランスフェラーゼ(M.SssI)またはGpCメチルトランスフェラーゼ(M.CviPI)を使用して、完全に非修飾された、インビトロでメチル化された、のいずれかであった異なる長さのスパイクインを加えた(上記の方法を使用)。5mCおよび5hmCを含む短いスパイクイン(120mer-1、および120mer-2)については、CpGおよび非CpG両コンテクストにおける、両方の鎖での両方の修飾に対して完全に近い変換が観察された(図17A~B)。
【0217】
TAPSのために100ngのgDNAを使用し、WGBSの200ngのgDNAと比較した。TAPSの正確性を評価するために、我々は三つの異なるタイプのスパイクイン対照を加えた。全てのCpGが完全にメチル化されたラムダDNAを使用して、偽陰性率(5mCの非変換率)を推定し、2kbの非修飾アンプリコンを使用して偽陽性率(非修飾Cの変換率)を推定し、その他の任意の塩基によって取り囲まれたメチル化された、およびヒドロキシメチル化されたC(それぞれ、N5mCNNおよびN5hmCNN)の両方を含有する合成オリゴスパイクインを使用して、異なる配列コンテクストで5mCおよび5hmCの変換率を比較した。mTet1とピリジンボランとの組み合わせは、最も高い5mC変換率(ラムダおよび合成スパイクインではそれぞれ、96.5%、および97.3%)および非修飾Cの最も低い変換率(0.23%)を達成した(図18A~B、および図16)。わずか0.23%の偽陽性率を伴う、2.7%~3.5%の偽陰性率は、亜硫酸水素塩配列決定に匹敵している。最近の試験では、9つの市販の亜硫酸水素塩キットが、それぞれ1.7%および0.6%の平均偽陰性率および平均偽陽性率を示した(Holmes,E.E.et al.Performance evaluation of kits for bisulfite-conversion of DNA from tissues,cell lines,FFPE tissues,aspirates,lavages,effusions,plasma,serum,and urine.PLoS One 9,e93933(2014))。合成スパイクインが、TAPSが5mCと5hmCの両方で十分に機能し、またTAPSが非CpGコンテクストで機能がわずかに悪化することを示唆する。5hmCの変換は5mCよりも8.2%低く、非CpGコンテクストの変換は、CpGコンテクストの変換よりも11.4%低い(図18A)。
【0218】
WGBSデータは、アライメントおよび修飾呼び出し(modification-calling)の工程の両方に特別なソフトウェアを必要とする。対照的に、我々の処理パイプラインは、標準的なゲノムアライナー(bwa)を使用し、その後に、我々が「asTair」と呼ぶ個別仕様の修飾呼び出しツールを使用する。シミュレートされたWGBSおよびTAPS読み取り(同じ半メチル化供給源配列に由来する)を処理するとき、TAPS/asTairは、WGBS/Bismarkよりも3倍速くなった(図18C)。
【0219】
ほぼすべてのシトシンのチミンへの変換により、WGBSライブラリは、イルミナ配列決定にマイナスの影響を及ぼす可能性がある極めて歪みのあるヌクレオチド組成物を特徴とする。結果として、WGBS読み取りはTAPSと比較して、シトシン/グアニン塩基ペアで実質的により低い配列決定品質スコアを示した(図18E)。ヌクレオチド組成物のバイアスを補正するために、少なくとも10~20%のPhiX DNA(塩基バランス対照ライブラリ)を、一般的にWGBSライブラリに添加する(例えば、HiSeq 3000/HiSeq 4000システムのイルミナ・全ゲノム亜硫酸水素塩配列決定(Illumina’s Whole-Genome Bisulfite Sequencing)を参照のこと)。したがって、我々はWGBSライブラリに15%のPhiXを補充した。これにより、BS変換された読み取りの低減された情報含有量と、亜硫酸水素塩処理の結果としてのDNA分解との組み合わせでは、TAPSと比較してWGBSのマッピング率が有意に低下した(図18Dおよび表7)。

表7。WGBSおよびTAPSの、マッピングおよび配列決定の品質統計。
【表10】
【0220】
したがって、同じ配列決定コスト(NextSeq High Output1回実施)については、TAPSの平均深さはWGBSのそれを超えた(それぞれ、21×、および13.1×、表8)。さらに、TAPSはカバーされていない領域をより少なくし、全体的に、WGBSと同じ配列決定の深さへのダウンサンプリングの後でも、より均一なカバレッジ分布を示した(四分位範囲:それぞれ9および11、図19Aおよび表8)。

表8。TAPS、WGBS、およびWGBSとほぼ同じ平均カバレッジを持つようにダウンサンプリングされたTAPSのカバレッジ統計。ここでは、ゲノム内のすべての位置における両方の鎖に対してカバレッジが計算された。
【表11】

例えば、特にCpG島(CGI)は一般的に、WGBSとTAPS間の配列決定深さの差異を制御するときであっても、TAPSによってより良好にカバーされた(図21A)、一方、この両方はCGI内部で同等の脱メチル化を示した(図22)。さらに、WGBSは、高度にカバーされたCpG部位での修飾レベルの減少のわずかなバイアスを示した(図23A)。一方で、我々の結果は、TAPSが修飾カバレッジのバイアスを非常に少なくすることを示唆している(図23B)。これらの結果は、TAPSが、配列決定コストを効果的に半減させながら、WGBSと比較して配列決定品質を劇的に改善することを実証する。
【0221】
TAPSのより高い、かつより均一のゲノムカバレッジにより、より多数のCpG部位が少なくとも三つの読み取りによってカバーされた。WGBSでの77.5%のみと比較して、このレベルでは、TAPSを用いると、マウスゲノム内のすべての43,205,316 CpG部位の88.3%がカバーされた(図21Bおよび19B)。TAPSおよびWGBSは、染色体領域にわたって高度に相関したメチル化測定をもたらした(図21Dおよび図20)。ヌクレオチドあたりの基準では、32,755,271 CpGの位置は、両方の方法で少なくとも三つの読み取りによってカバーされた(図21B)。これらの部位内では、我々は、少なくとも10%の修飾レベルを持つすべてのCpG位置として、「修飾CpG」を定義した(L.Wen et al.,Whole-genome analysis of 5-hydroxymethylcytosine and 5-methylcytosine at base resolution in
the human brain.Genome Biology 15,R49(2014))。この閾値を使用すると、CpGの95.8%は、TAPSとWGBSとの間の一致する修飾状態を示した。WGBSで、少なくとも三つの読み取りでカバーされ、修飾されたと見出された全てのCpGの98.5%は、TAPSによって修飾されるように再び呼び出され、WGBSとTAPS間の良好な合意を示した(図21C)。WGBSおよびTAPSの両方で少なくとも三つの読み取りによってカバーされた各CpG当たりの修飾レベルを比較するとき、TAPSとWGBSとの間の良好な相関が観察された(Pearson r=0.63,p<2e-16、図21E)。特に、TAPSは、WGBSによって見逃された高度に修飾されたCpG位置のサブセットを特定した(図21E、右下隅)。我々は、直交制限消化(orthogonal restriction digestion)およびリアルタイムPCRアッセイを使用して、これらのCpGの7つをさらに検証し、それらのすべてが完全にメチル化、および/またはヒドロキシメチル化されることを確認した(表9)。

表9。TAPS、WGBS、およびHpaII-qPCRアッセイにより定量化されたmESC gDNAにおけるCmCGGメチル化レベルの比較。TAPS、およびWGBSによる、カバレッジおよびメチル化レベル(C%)を鎖当たりに対して計算した。HpaII-qPCRアッセイにおける、HpaII消化試料のCt値(CtHpaII)、または対照試料(CtCtrl)は、3組の平均であった。mC%は以下の等式を用いて計算される:C%=2^(CtCtrl-CtHpaII)*100%。
【表12】

合わせて、これらの結果は、TAPSが、WGBSを直接置き換えることができること、および実際には、WGBSよりもメチロームに対するより包括的な視点を提供することを示している。
【0222】
最後に、低入力DNAを用いてTAPSを試験し、TAPSは、わずか1ngのgDNAで働くことが示され、一部の例では、10pgのgDNAまで下げ、単一細胞レベル近くまでであった。TAPSはまた、循環細胞遊離DNAを1ngまで下げても、効果的に機能する。これらの結果は、低入力DNAおよび臨床用途のためのTAPSの可能性を示す(図24A~C、図25A~B)。
【0223】
TAPSは、一つの健常試料、一つのバレット食道の(バレット)試料、及び1~2mlの血漿から得られた一つの膵臓ガン試料由来の、三つの循環細胞遊離DNA試料(cfDNA)で試験された。標準TAPSプロトコルに従い、各試料を約10xのカバレッジに配列決定した。cfDNA TAPSの結果解析により、TAPSが、高い5mC変換率(図26A)、低偽陽性率(非修飾シトシンの変換、図26B)、高マッピング率(図26C)、および低PCR重複率(図26D)を含む、バルクゲノムDNA由来と同等の、低入力cfDNA由来の高品質メチローム配列決定を提供することが示された。これらの結果は、cfDNAからの疾患診断のためのTAPSの力を示す。
【0224】
またTAPSは、CからTへの遺伝的バリアントまたは単一ヌクレオチド遺伝子多型(SNP)からのメチル化を区別することもでき、したがって遺伝的バリアントを検出することができる。メチル化およびCからTへのSNPは、TAPSにおいて異なるパターンをもたらす:メチル化は、元の上の鎖(OT)/元の下の鎖(OB)におけるT/G読み取り、ならびにOT(CTOT)およびOB(CTOB)に相補的な鎖におけるA/C読み取りをもたらし、一方で、CからTへのSNPは、OT/OB、および(CTOB/CTOT)におけるT/A読み取りをもたらす(図27)。これにより、一つの実験および配列決定の実行において、メチル化情報および遺伝的バリアントの両方を提供し、またそれゆえに突然変異を提供することにおける、TAPSの有用性がさらに増加する。本明細書に開示されるTAPS方法のこの能力により、ゲノム解析のエピジェネティクス解析との統合が提供され、標準的な全ゲノム配列決定(WGS)を実施するニーズを除去することによって、配列決定コストの著しい減少がもたらされる。
【0225】
まとめると、我々は、シトシンの上皮遺伝子修飾のための一連のPS由来の亜硫酸水素塩非含有、塩基分解能配列決定方法を開発し、全メチローム配列決定のためのTAPSの有用性を実証した。非修飾のシトシンに影響を及ぼすことなく、高い感度と特異性で、5mCおよび5hmCを塩基分解能で直接的に検出するための軽度の酵素反応および化学反応を使用することにより、TAPSは、高品質でより完全なメチロームを配列決定コストの半分で提供することにおいて、亜硫酸水素塩配列決定に優れている。このようにTAPSは、DNAメチルシトシンおよびヒドロキシメチルシトシン分析の新しい標準として亜硫酸水素塩配列決定を置き換えることができる。最近報告された亜硫酸水素塩非含有5fC配列決定方法にバルキーな修飾を導入するよりむしろ(B.Xia et al.,Bisulfite-free,base-resolution analysis of 5-formylcytosine at the genome scale.Nat.Methods 12,1047-1050(2015);C.Zhu et al.,Single-Cell 5-Formylcytosine Landscapes of Mammalian Early Embryos and ESCs at Single-Base Resolution.Cell Stem Cell 20,720-731(2017))、TAPSは、修飾シトシンをDHU、天然に近い塩基、へ変換し、これは共通のポリメラーゼによってTと「読み取り」されることができ、また潜在的にPCRフリーDNA配列決定と適合性がある。TAPSは、ピロシーケンシング、メチル化感受性PCR、制限消化、MALDI質量分光分析、マイクロアレイおよび全ゲノム配列決定を含むがこれに限定されない、様々な下流分析と適合性がある。TAPSは長いDNAを保持することができるため、SMRT配列決定およびナノ細孔配列決定などの長い読み取り配列決定技術と組み合わせると非常に貴重なものとなり、マップ領域に対する特定の困難を調査することができる。また、プルダウン方法をTAPSと組み合わせて、配列決定コストをさらに減少させ、塩基分解能情報を低分解能アフィニティベースのマップに追加することも可能である。本明細書では、コスト、複雑さ、および分析に必要な時間を減少させながら、TAPSは、日常的に使用することで、WGBSを直接的に置き換えることができると実証された。これにより、学術的研究および臨床診断におけるエピジェネティクス分析の採用がより広くなりうる。
例えば、以下の項目が提供される。
(項目1)
標的核酸中の5-メチルシトシン(5mC)を特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸を修飾する工程であって、前記修飾する工程が、
i. DNA試料中の5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加する工程と、
ii. 前記核酸試料中の前記5mCを5-カルボキシルシトシン(5caC)および/または5-ホルミルシトシン(5fC)に変換する工程と、
iii. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび/
または5fCをジヒドロウラシル(DHU)に変換する工程と、を含む、修飾する工程、および
c. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCの位置を提供する、方法。
(項目2)
各移行位置でのTのパーセンテージが、前記標的核酸中の各位置での5mCの定量レベルを提供する、項目1に記載の方法。
(項目3)
標的核酸中の5mCまたは5hmCを特定する方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸を修飾する工程であって、前記修飾する工程が、
i. 前記核酸試料中の前記5mCおよび5hmCを5-カルボキシルシトシン(5caC)および/または5fCに変換する工程と、
ii. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロウラシル(DHU)に変換する工程と、を含む、修飾する工程、および
c. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、方法。
(項目4)
各移行位置でのTのパーセンテージが、前記標的核酸中の各位置での5mCまたは5hmCの定量レベルを提供する、項目3に記載の方法。
(項目5)
標的核酸中の5mCを特定するための、および5hmCを特定するための方法であって、前記方法が、
a. 前記標的核酸中の5-メチルシトシン(5mC)を特定する工程であって、前記特定する工程が、
i. 前記標的核酸を含む第一核酸試料を提供する工程、
ii. 前記第一試料中の前記核酸を修飾する工程であって、前記修飾する工程が、
1. 前記第一核酸試料中の、5-ヒドロキシメチルシトシン(5hmC)にブロッキング基を添加することと、
2. 前記第一核酸試料中の前記5mCを、5caCおよび/または5fCに変換することと、
3. 修飾標的核酸を含む修飾第一核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロウラシル(DHU)に変換することと、を含む、修飾する工程、
iii. 前記修飾標的核酸のコピー数を随意に増幅する工程、および
iv. 前記修飾標的核酸の配列を検出する工程であって、前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCの位置を提供する、検出する工程、を含む、特定する工程、
b. 前記標的核酸中の5mCまたは5hmCを特定する工程であって、前記特定する工程が、
i. 前記標的核酸を含む第二核酸試料を提供する工程、
ii. 前記第二試料中の前記核酸を修飾する工程であって、前記修飾する工程が、
1. 前記第二核酸試料中の5mCおよび5hmCを、5caCおよび/または5fCに変換することと、
2. 修飾標的核酸を含む修飾第二核酸試料を提供するために、前記5caCおよび/または5fCをジヒドロラシル(DHU)に変換することと、を含む、修飾する工程、
iii. 前記修飾標的核酸のコピー数を随意に増幅する工程、および
iv. 前記第二試料から前記修飾標的核酸の配列を検出する工程であって、前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5mCまたは5hmCのいずれかの位置を提供する、検出する工程、を含む、特定する工程、ならびに、
c. 工程(a)および(b)の結果を比較する工程であって、工程(b)で存在するが工程(a)では存在しないCからTへの移行が、前記標的核酸中の5hmCの位置を提供する、比較する工程、を含む、方法。
(項目6)
工程(a)において、各移行位置でのTのパーセンテージが、前記標的核酸中の各位置で5mCの定量レベルを提供し、工程(b)において、各移行位置でのTのパーセンテージが、前記標的核酸中の各位置で5mC、または5hmCの定量レベルを提供し、および工程(c)において、工程(b)で、工程(a)ではなく、特定されたCからTへの移行についてのパーセンテージの差異が、前記標的核酸中の各位置で5hmCの定量レベルを提供する、項目5に記載の方法。
(項目7)
前記5hmCに添加される前記ブロッキング基が糖である、項目1~2または項目5~6のいずれか一項に記載の方法。
(項目8)
前記糖がグルコースまたは修飾グルコースである、項目7に記載の方法。
(項目9)
前記ブロッキング基が、グルコシルトランスフェラーゼ酵素の存在下で、糖に連結されたUDPに前記核酸試料を接触させることにより、前記5hmCに添加される、項目7に記載の方法。
(項目10)
前記グルコシルトランスフェラーゼ酵素が、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、T4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、ならびにその誘導体および類似体からなる群から選択される、項目9に記載の方法。
(項目11)
前記核酸試料中の前記5mCを、5caC及び/または5fCに変換する工程、ならびに前記核酸試料中の前記5mC及び5hmCを、5caC及び/または5fCに変換する工程は、テンイレブントランスロケーション(TET)酵素と前記核酸試料を接触させることを含む、項目1~6のいずれか一項に記載の方法。
(項目12)
前記TET酵素が、ヒトTET1、TET2、及びTET3、マウスTet1、Tet2、及びTet3、ネグレリアTET(NgTET)、ウシグソヒトヨタケ(CcTET)、ならびにその誘導体または類似体からなる群から選択される、項目11に記載の方法。
(項目13)
前記TET酵素がNgTETまたはマウスTETである、項目12に記載の方法。
(項目14)
標的核酸中の5caC、または5fCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCおよび5fCをジヒドロウラシル(DHU)に変換する工程、
c. 前記修飾標的核酸のコピー数を増幅する工程、および
d. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5caC、または5fCのいずれかの位置を提供する、方法。
(項目15)
各移行位置でのTのパーセンテージが、前記標的核酸中の各位置で、5caC、または5fCの定量レベルを提供する、項目14に記載の方法。
(項目16)
標的核酸中の5caCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸試料中の5fCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5caCをジヒドロウラシル(DHU)に変換する工程、
d. 前記修飾標的核酸のコピー数を随意に増幅する工程、および
e. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5caCの位置を提供する、方法。
(項目17)
各移行位置でのTのパーセンテージが、前記標的核酸の各位置で5caCの定量レベルを提供する、項目16に記載の方法。
(項目18)
前記5fCにブロッキング基を添加する工程が、ヒドロキシルアミン誘導体、ヒドラジン誘導体、およびヒドラジド誘導体から選択されるアルデヒド反応性化合物と、前記核酸試料を接触させることを含む、項目16に記載の方法。
(項目19)
前記ヒドロキシルアミン誘導体が、O-エチルヒドロキシルアミンである、項目18に記載の方法。
(項目20)
標的核酸中の5fCを特定するための方法であって、前記方法が、
a. 前記標的核酸を含む核酸試料を提供する工程、
b. 前記核酸試料中の5caCにブロッキング基を添加する工程、
c. 修飾標的核酸を含む修飾核酸試料を提供するために、前記5fCをジヒドロウラシル(DHU)に変換する工程、
d. 前記修飾標的核酸のコピー数を随意に増幅する工程、および
e. 前記修飾標的核酸の配列を検出する工程、を含み、
前記標的核酸と比較した前記修飾標的核酸の配列におけるシトシン(C)のチミン(T)への移行が、前記標的核酸中の5fCの位置を提供する、方法。
(項目21)
各移行位置でのTのパーセンテージが、前記標的核酸中の各位置で5fCの定量レベルを提供する、項目20に記載の方法。
(項目22)
5caCにブロッキング基を添加する前記工程が、前記核酸試料をカルボン酸誘導体化試薬、及びアミン、ヒドラジン又はヒドロキシルアミン化合物と接触させることを含む、項目20に記載の方法。
(項目23)
5caCにブロッキング基を添加する前記工程が、前記核酸試料を1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)と接触させることと、エチルアミンと接触させることと、を含む、項目22に記載の方法。
(項目24)
前記方法が、前記修飾標的核酸のコピー数を増幅する前記工程をさらに含む、項目1~6、および14~23のいずれか一項に記載の方法。
(項目25)
前記修飾標的核酸のコピー数を増幅する前記工程が、ポリメラーゼ連鎖反応(PCR)、またはプライマー伸長を行うことを含む、項目24に記載の方法。
(項目26)
前記5caCおよび/または5fCをDHUへ変換する前記工程が、前記核酸試料を還元剤に接触させることを含む、項目1~6、および14~23のいずれか一項に記載の方法。
(項目27)
前記還元剤が、ピリジンボラン、2-ピコリンボラン(pic-BH)、ボラン、水素化ホウ素ナトリウム、シアノホウ水素化ナトリウム、およびナトリウムトリアセトキシボロヒドリドからなる群から選択される、項目26に記載の方法。
(項目28)
前記還元剤が、ピリジンボラン、または2-ピコリンボランである、項目27に記載の方法。
(項目29)
前記修飾標的核酸の配列を特定する前記工程が、鎖終結配列決定、マイクロアレイ、高処理量配列決定、および制限酵素分析のうちの一つ以上を含む、項目1~6、および14~23のいずれか一項に記載の方法。
(項目30)
前記核酸がDNAである、項目1~29のいずれか一項に記載の方法。
(項目31)
前記核酸がRNAである、項目1~29のいずれか一項に記載の方法。
図1
図2
図3-1】
図3-2】
図4-1】
図4-2】
図5
図6-1】
図6-2】
図7-1】
図7-2】
図8
図9
図10-1】
図10-2】
図11
図12
図13-1】
図13-2】
図14
図15
図16
図17
図18-1】
図18-2】
図19
図20
図21-1】
図21-2】
図22
図23
図24
図25
図26
図27
【配列表】
0007539948000001.app