IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ニユー・イングランド・バイオレイブス・インコーポレイテツドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-19
(54)【発明の名称】二本鎖DNAデアミナーゼ
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20241112BHJP
   C12Q 1/34 20060101ALI20241112BHJP
   C12Q 1/26 20060101ALI20241112BHJP
   C12N 9/78 20060101ALI20241112BHJP
   C12N 15/62 20060101ALI20241112BHJP
   C12N 15/55 20060101ALI20241112BHJP
   C12N 15/31 20060101ALI20241112BHJP
   C12Q 1/25 20060101ALI20241112BHJP
【FI】
C12Q1/6869 Z
C12Q1/34 ZNA
C12Q1/26
C12N9/78
C12N15/62 Z
C12N15/55
C12N15/31
C12Q1/25
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024531071
(86)(22)【出願日】2022-11-22
(85)【翻訳文提出日】2024-07-22
(86)【国際出願番号】 US2022080345
(87)【国際公開番号】W WO2023097226
(87)【国際公開日】2023-06-01
(31)【優先権主張番号】63/264,513
(32)【優先日】2021-11-24
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】18/058,115
(32)【優先日】2022-11-22
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
(71)【出願人】
【識別番号】591021970
【氏名又は名称】ニユー・イングランド・バイオレイブス・インコーポレイテツド
(74)【代理人】
【識別番号】110001173
【氏名又は名称】弁理士法人川口國際特許事務所
(72)【発明者】
【氏名】バイシビラ,ロムアルダス
(72)【発明者】
【氏名】ジョンソン,ショーン・アール
(72)【発明者】
【氏名】サン,ジーイー
(72)【発明者】
【氏名】エバンス,トーマス・シー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ06
4B063QQ42
4B063QR08
4B063QR20
4B063QR42
4B063QS24
4B063QX01
(57)【要約】
とりわけ、二本鎖核酸を脱アミノ化するための方法が本明細書で提供される。一部の実施形態では、方法は、シトシンを含む二本鎖DNA基質を、配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び/又は99のいずれかに対して少なくとも80%同一であるアミノ酸配列を有する二本鎖DNAデアミナーゼに接触させて、脱アミノ化されたシトシンを含む脱アミノ化産物を作製するステップを含んでよい。方法を実施するための酵素及びキットも提供される。
【特許請求の範囲】
【請求項1】
二本鎖核酸を脱アミノ化するための方法であって、
シトシンを含む二本鎖DNA基質と
配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び99のいずれかに対して少なくとも80%同一であるアミノ酸配列を有する二本鎖DNAデアミナーゼを接触させて、
脱アミノ化したシトシンを含む脱アミノ化産物を作製するステップ
を含む方法。
【請求項2】
二本鎖DNA基質が、修飾されたシトシンをさらに含む、請求項1に記載の方法。
【請求項3】
修飾されたシトシンが、5fC、5CaC、5mC、5hmC、N4mC、5ghmC、又はピロロ-Cである、請求項1又は2のいずれかに記載の方法。
【請求項4】
脱アミノ化産物を配列決定する、又は脱アミノ化産物を増幅して増幅産物を作製する、及び増幅産物を配列決定して、それぞれの場合に、シーケンスリードを作製するステップ
をさらに含む、請求項1~3のいずれかに記載の方法。
【請求項5】
シーケンスリードを分析して二本鎖DNA基質中の修飾されたシトシンを特定するステップ
をさらに含む、請求項4に記載の方法。
【請求項6】
二本鎖DNA基質が真核生物又は細菌DNAである、請求項1~5のいずれかに記載の方法。
【請求項7】
二本鎖DNA基質がヒトcfDNAである、請求項1~6のいずれかに記載の方法。
【請求項8】
二本鎖DNAデアミナーゼが、配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び99のいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項1~7のいずれかに記載の方法。
【請求項9】
二本鎖DNA基質が、TETメチルシトシンジオキシゲナーゼ及びDNAベータ-グルコシルトランスフェラーゼで前処理されている、請求項1~8のいずれかに記載の方法。
【請求項10】
二本鎖DNAデアミナーゼが、MGYPDa829(配列番号96)、MGYPDa06(配列番号4)、CrDa01(配列番号12)、AvDa02(配列番号21)、CsDa01(配列番号9)、LbsDa01(配列番号10)、FlDa01(配列番号8)、MGYPDa26(配列番号7)、MGYPDa23(配列番号6)、キメラ_10(配列番号97)及びAncDa04(配列番号95)の配列番号のうちのいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項9に記載の方法。
【請求項11】
二本鎖DNA基質が、TETメチルシトシンジオキシゲナーゼで前処理されているが、DNAベータグルコシルトランスフェラーゼでは前処理されていない、請求項1~8のいずれかに記載の方法。
【請求項12】
二本鎖DNAデアミナーゼが、CseDa01(配列番号3)及びLbDa02(配列番号1)の配列番号のうちのいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項11に記載の方法。
【請求項13】
二本鎖DNA基質が、TETメチルシトシンジオキシゲナーゼでもDNAベータグルコシルトランスフェラーゼでも前処理されない、請求項1~8のいずれかに記載の方法。
【請求項14】
二本鎖DNA基質が、少なくとも1つのN4mCを含む、請求項1~8のいずれかに記載の方法。
【請求項15】
二本鎖DNA基質が細菌DNAである、請求項14に記載の方法。
【請求項16】
二本鎖DNAデアミナーゼが、MGYPDa20(配列番号11)、NsDa01(配列番号27)、及びAshDa01(配列番号40)の配列番号のいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項13~15のいずれかに記載の方法。
【請求項17】
二本鎖DNA基質を作製するために、
(a)ヘアピンアダプターをDNAの二本鎖断片にライゲートしてライゲーション産物を作製するステップ;
(b)ライゲーション産物中のヘアピンアダプターの二本鎖領域に遊離の3’末端を酵素的に生成するステップ;並びに
(c)鎖置換又はニック翻訳ポリメラーゼ、dGTP、dATP、dTTP及び修飾されたdCTPを含むdCTPフリー反応混合物中で遊離の3’末端を伸長させるステップをさらに含む、請求項1~8のいずれかに記載の方法。
【請求項18】
修飾されたdCTPが、5mdCTP、ピロロ-dCTP、5hmdCTP又はN4mdCTPである、請求項17に記載の方法。
【請求項19】
二本鎖DNAデアミナーゼが、MGYPDa20(配列番号11)、NsDa01(配列番号27)、AshDa01(配列番号40)の配列番号のうちのいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項17に記載の方法。
【請求項20】
天然に存在するタンパク質のC終端デアミナーゼドメインに対して少なくとも80%同一であるアミノ酸配列を含む酵素であって、
(a)二本鎖DNAデアミナーゼ活性を有し、及び
(b)天然に存在するタンパク質のN終端を含まない
酵素。
【請求項21】
300以下のアミノ酸長である、請求項20に記載の酵素。
【請求項22】
配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び99のいずれかに対して少なくとも80%同一である、請求項20又は21に記載の酵素。
【請求項23】
触媒的に不活性なCas9(dCas9)又はニッキングCas9(nCas9)又は転写活性化因子様エフェクターヌクレアーゼ(TALEN)と融合されている、請求項20~22のいずれかに記載の酵素。
【請求項24】
(a)請求項20~22のいずれかに記載の酵素;及び
(b)反応緩衝液
を含むキット。
【請求項25】
TETメチルシトシンジオキシゲナーゼ及びDNAベータグルコシルトランスフェラーゼをさらに含む;又は
TETメチルシトシンジオキシゲナーゼをさらに含み、DNAベータグルコシルトランスフェラーゼを含まない、
請求項24に記載のキット。
【請求項26】
TETメチルシトシンジオキシゲナーゼもDNAベータグルコシルトランスフェラーゼもない、請求項24に記載のキット。
【請求項27】
5mdCTP、ピロロ-dCTP、5hmdCTP及びN4mdCTPから選択される修飾されたdCTPをさらに含む、請求項24~26のいずれかに記載のキット。
【請求項28】
(a)シトシンを含む二本鎖DNA基質;並びに
(b)配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び99のいずれかに対して少なくとも80%同一であるアミノ酸配列を有する二本鎖DNAデアミナーゼ、
を含む反応混合物。
【請求項29】
二本鎖DNA基質がシトシン及び少なくとも1つの修飾されたシトシンを含む、請求項28に記載の反応混合物。
【請求項30】
修飾されたシトシンが、5fC、5caC、5mC、5hmC、N4mC又はピロロ-Cである、請求項29に記載の反応混合物。
【請求項31】
二本鎖DNA基質が、真核生物又は細菌DNAを含む、請求項28~30のいずれかに記載の反応混合物。
【請求項32】
二本鎖DNA基質がヒトcfDNAである、請求項28~31のいずれかに記載の反応混合物。
【請求項33】
デアミナーゼが、配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、及び99のいずれかに対して少なくとも90%同一であるアミノ酸配列を有する、請求項28~32のいずれかに記載の反応混合物。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2022年11月22日提出の米国特許出願第18/058,115号の利益を主張するものであり、前記出願は2021年11月24日提出の米国特許仮出願第63/264,513号の利益を主張しており、これらの出願は参照によりその全体を本明細書に組み込む。
【0002】
配列表は、2022年11月22日作成の、1.49GBのサイズを有する配列表XML、「NEB-451.xml」として本明細書と一緒に提供される。配列表XMLの内容は参照によりその全体を本明細書に組み込む。
【背景技術】
【0003】
多くの生物では、ゲノム中のシトシンは、例えば、5-メチルシトシン(5mC)又は5-ヒドロキシメチルシトシン(5hmC)に共有結合的に修飾することができる。これらのエピジェネティックな変化は、遺伝子発現を含む多種多様な現象で役割を果たしていると考えられている。DNAメチル化の全体的又は局所的変化は、がんで起こることが知られている初期イベントの1つである。ヒトでのメチル化プロファイルの特定は、疾患過程を研究するためのキーとなるステップであり、診断目的に益々使用されている。
【0004】
修飾されたシトシンを特定するための現在の方法は、シトシンをウラシルに変換し、修飾されたシトシンは脱アミノ化されないままである脱アミノ化ステップを含む。これらの脱アミノ化DNA分子中のウラシルは増幅中チミンにコピーされ、増幅産物を配列決定した後、開始配列中の修飾されたシトシンはそれぞれ、配列決定された増幅産物において「C」として容易に特定することができ、シトシンはそれぞれ配列決定された増幅産物において「T」として現れる。
【0005】
DNAは、化学的に(例えば、亜硫酸水素塩を使用して;Frommerら、PNAS 1992年 89:1827~1831頁参照)又はDNAデアミナーゼ(例えば、APOBEC3Aを使用して、例えば、Sunら、Genome Res.2021年 31:291~300頁及びVaisvilaら、Genome Res.2021年 31:1280~1289頁参照)を使用して酵素的に脱アミノ化しうる。しかし、これらのアプローチの両方が一本鎖基質を必要とする。したがって、修飾されたシトシンを分析するための現在のワークフローは、典型的には変性ステップを含む。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Frommerら、PNAS 1992年 89:1827~1831頁
【非特許文献2】Sunら、Genome Res.2021年 31:291~300頁
【非特許文献3】Vaisvilaら、Genome Res.2021年 31:1280~1289頁
【発明の概要】
【発明が解決しようとする課題】
【0007】
現在のワークフローから変性ステップをなくすことが、望ましいと考えられる。
【課題を解決するための手段】
【0008】
(発明の要旨)
本開示は、一部の実施形態では、例えば、二本鎖DNA基質に対して活性であるシトシンデアミナーゼを含む1つ以上の望ましい特性を有するデアミナーゼに関する。これらの酵素は、(例えば、DNAを変性させずに)二本鎖DNA基質中のシトシンを脱アミノ化しうる。二本鎖DNAデアミナーゼは、二本鎖DNA中のシトシンを脱アミノ化することに加えて一本鎖DNA中のシトシンを脱アミノ化しうる。グアニンに隣接するシトシン(「CG」)は、開示されたデアミナーゼにより、他の配列コンテクスト(「CH」、H=A、C、T)中のシトシンと同じ程度によく脱アミノ化される、それほどよく脱アミノ化されない、又はそれよりもよく脱アミノ化されることもある。二本鎖DNAデアミナーゼ組成物は、デアミナーゼ、及び、任意選択的に、緩衝剤、1つ以上の修飾されたシトシンの脱アミノ化感受性を変更する1つ以上の酵素(例えば、TETメチルシトシンジオキシゲナーゼ及び/又はDNAベータグルコシルトランスフェラーゼ)を含みうる。
【0009】
本開示は、一部の実施形態では、二本鎖DNA基質を脱アミノ化するための方法に関する。例えば、二本鎖DNAを脱アミノ化するステップは、例えば、基質を変性せずに二本鎖DNA基質と二本鎖DNAデアミナーゼを接触させて、二本鎖基質中のシトシンを脱アミノ化するステップ、又は他の方法で基質の鎖を解く若しくは他の方法で分離する任意の薬剤(例えば、ジャイレース又はヘリカーゼ)を使用して、脱アミノ化産物を生み出すステップを含みうる。一部の実施形態では、方法は、脱アミノ化反応の産物(本明細書では「脱アミノ化産物」と呼ばれる脱アミノ化二本鎖DNA分子である)の少なくとも1つの鎖を配列決定してシーケンスリードを生み出すステップを含んでよい。方法は、脱アミノ化産物を増幅して増幅産物を作製し、次に増幅産物を配列決定してシーケンスリードを生み出すステップを含んでよい。開示されたシトシンデアミナーゼは、DNA基質中にも存在する修飾されたシトシン(例えば、5mC、5hmC、5fC、5caC、5ghmC、N4mC)を脱アミノ化せずにシトシンを脱アミノ化してもよい又はシトシンも脱アミノ化し基質中の1つ以上の修飾されたシトシンも脱アミノ化してよい。したがって、二本鎖DNA基質中の修飾されたシトシン(例えば、5mC又は5hmC)の位置は、シーケンスリードの解析により特定することができる。二本鎖DNAデアミナーゼの一部はN4mCを脱アミノ化しないが、他の修飾されたシトシンを脱アミノ化することはでき、他のデアミナーゼは5mCと5hmCを脱アミノ化せず、5hmCを脱アミノ化しないが5mCを脱アミノ化することができるデアミナーゼもあり、5ghmCを脱アミノ化しないが5mC及び/又は5hmCを脱アミノ化することができるデアミナーゼもあり、5fcと5caCを脱アミノ化しない他のデアミナーゼはしかし5mCと5hmCを脱アミノ化することができる。したがって、1つ以上の修飾されたシトシンの位置は、基質を選択された特異性を有するデアミナーゼと接触させることにより、及び任意選択的に、基質を1つ以上の修飾されたシトシンの脱アミノ化感受性を変更する1種以上の酵素を用いて前処理することにより、二本鎖基質において決定しうる。例えば、方法は、二本鎖DNA基質を(a)TETメチルシトシンジオキシゲナーゼ及びDNAベータグルコシルトランスフェラーゼを用いて又は(b)DNAベータグルコシルトランスフェラーゼではなく、TETメチルシトシンジオキシゲナーゼを用いて前処理するステップを含んでよい。これらの酵素は、二本鎖核酸中の5mC及び/又は5hmCを修飾してそれらの残基をある特定の二本鎖DNAデアミナーゼに対して抵抗性にする。一部の実施形態では、方法は、例えば、二本鎖DNAデアミナーゼが5mC及び/又は5hmCを脱アミノ化しない場合に、二本鎖DNAデアミナーゼを、TETメチルシトシンジオキシゲナーゼともDNAベータグルコシルトランスフェラーゼとも接触させていない(以前に又は同時に)二本鎖核酸と接触させるステップを含んでよい。
【0010】
一部の実施形態では、二本鎖DNA基質は、少なくとも1つのN4mC又はピロロ-dCを含んでよい。N4mCは、原核生物及び古細菌に見出される。したがって、一部の実施形態では、二本鎖DNA基質は、原核生物でも古細菌でもよい。一部の実施形態では、二本鎖DNA基質は、ヘアピンアダプターをDNAの二本鎖断片にライゲートしてライゲーション産物を作製するステップ、ライゲーション産物中のヘアピンアダプターの二本鎖領域に遊離の3’末端を酵素的に作製するステップ、並びに鎖置換又はニック翻訳ポリメラーゼ、dGTP、dATP、dTTP及び修飾されたdCTPを含むdCTPフリー反応混合物で遊離の3’末端を伸長させるステップにより、作ってもよい。この方法では、修飾されたdCTPは新しい鎖中に組み込まれて、修飾されたCを有する二本鎖核酸を作製する。
【0011】
例えば、二本鎖DNAデアミナーゼ及び反応緩衝液を含む、方法を実施するための酵素及びキットも提供される。
【0012】
本特許のファイルは、カラーで作成される少なくとも1つの図を含む。カラー図付の本特許のコピーは、請求があり必要料金が支払われ次第、特許商標庁より提供される。
【図面の簡単な説明】
【0013】
図1図1は、同心円状に配置された説明的活動データにより取り囲まれたシトシンデアミナーゼの最大尤度系統樹のトポロジーを示し、それぞれの系統樹終端、酵素名、及び活動結果のセットが放射軸に沿って整列されている。これらの環に示される種々の基質に対する酵素的活動結果は、Illuminaショートリードシーケンシングベースの検出法を用いてインビトロスクリーニングアッセイにより測定された(実施例3)。環の全面積は全活動に対応し、色付けされた領域の相対的サイズは指示された基質に対する相対的活性を示す。最内部の環は、一本鎖DNA(赤色領域)と比べた二本鎖DNA(青色領域)での非修飾システインに対する相対的脱アミノ化活性を示す。中間の環は、二本鎖DNA中の5-メチル化シトシンに対する活性を示す。最外部の環は、二本鎖DNA中の5-ヒドロキシメチル化シトシンに対する活性を示す。酵素名は、その系統発生的ファミリーに従って色付けされている。
図2A図2A~Cは、実施例3のスクリーニング法に従ってアッセイされるシトシンデアミナーゼについての酵素活性を示す。活性は、試料中の全シトシンのうちの脱アミノ化された割合として表現される。図2Aは、二本鎖DNA対一本鎖DNAに対するデアミナーゼ例についての活性結果を示す。図2Bは、CGコンテクスト対CH(CA、CC、及びCTの組合せ)コンテクスト中の非修飾シトシンに対するデアミナーゼ例についての活性結果を示す。図2Cは、すべての配列コンテクスト中のシトシン対5-メチルシトシンに対するデアミナーゼ例についての活性結果を示す。
図2B図2A~Cは、実施例3のスクリーニング法に従ってアッセイされるシトシンデアミナーゼについての酵素活性を示す。活性は、試料中の全シトシンのうちの脱アミノ化された割合として表現される。図2Aは、二本鎖DNA対一本鎖DNAに対するデアミナーゼ例についての活性結果を示す。図2Bは、CGコンテクスト対CH(CA、CC、及びCTの組合せ)コンテクスト中の非修飾シトシンに対するデアミナーゼ例についての活性結果を示す。図2Cは、すべての配列コンテクスト中のシトシン対5-メチルシトシンに対するデアミナーゼ例についての活性結果を示す。
図2C図2A~Cは、実施例3のスクリーニング法に従ってアッセイされるシトシンデアミナーゼについての酵素活性を示す。活性は、試料中の全シトシンのうちの脱アミノ化された割合として表現される。図2Aは、二本鎖DNA対一本鎖DNAに対するデアミナーゼ例についての活性結果を示す。図2Bは、CGコンテクスト対CH(CA、CC、及びCTの組合せ)コンテクスト中の非修飾シトシンに対するデアミナーゼ例についての活性結果を示す。図2Cは、すべての配列コンテクスト中のシトシン対5-メチルシトシンに対するデアミナーゼ例についての活性結果を示す。
図3A図3A~3Dは、DNA中の修飾されたシトシンの位置を特定するためのワークフロー例を示す。図3Aは、ssDNAのAPOBEC3A脱アミノ化のワークフロー例を示し、図3B、3C、及び3Dは、APOBEC3Aが、dsDNZAを脱アミノ化するシトシンデアミナーゼにより置換されるワークフロー例を示す。図3Bは、ssDNA及びdsDNAに対して活性であるdsDNAデアミナーゼの使用によりDNA変性ステップが除かれる単一ポットワークフロー例を示す。示されるように、DNAデアミナーゼは、中間精製及び変性ステップなしでTET及びBGTとの反応に続いて反応混合物に添加し、それによってゲノムDNA上の標的メチル化部位の検出及びメチロームマッピングを増強することができる。図3Cは、BGTでの前処理を必要としない又は含むこともなく5fCも5caCも脱アミノ化しないデアミナーゼと基質を接触させるワークフロー例を示す。図3Dは、基質が単一酵素であるdsDNAデアミナーゼと接触されるメチローム分析ワークフロー例を示す。
図3B図3A~3Dは、DNA中の修飾されたシトシンの位置を特定するためのワークフロー例を示す。図3Aは、ssDNAのAPOBEC3A脱アミノ化のワークフロー例を示し、図3B、3C、及び3Dは、APOBEC3Aが、dsDNZAを脱アミノ化するシトシンデアミナーゼにより置換されるワークフロー例を示す。図3Bは、ssDNA及びdsDNAに対して活性であるdsDNAデアミナーゼの使用によりDNA変性ステップが除かれる単一ポットワークフロー例を示す。示されるように、DNAデアミナーゼは、中間精製及び変性ステップなしでTET及びBGTとの反応に続いて反応混合物に添加し、それによってゲノムDNA上の標的メチル化部位の検出及びメチロームマッピングを増強することができる。図3Cは、BGTでの前処理を必要としない又は含むこともなく5fCも5caCも脱アミノ化しないデアミナーゼと基質を接触させるワークフロー例を示す。図3Dは、基質が単一酵素であるdsDNAデアミナーゼと接触されるメチローム分析ワークフロー例を示す。
図3C図3A~3Dは、DNA中の修飾されたシトシンの位置を特定するためのワークフロー例を示す。図3Aは、ssDNAのAPOBEC3A脱アミノ化のワークフロー例を示し、図3B、3C、及び3Dは、APOBEC3Aが、dsDNZAを脱アミノ化するシトシンデアミナーゼにより置換されるワークフロー例を示す。図3Bは、ssDNA及びdsDNAに対して活性であるdsDNAデアミナーゼの使用によりDNA変性ステップが除かれる単一ポットワークフロー例を示す。示されるように、DNAデアミナーゼは、中間精製及び変性ステップなしでTET及びBGTとの反応に続いて反応混合物に添加し、それによってゲノムDNA上の標的メチル化部位の検出及びメチロームマッピングを増強することができる。図3Cは、BGTでの前処理を必要としない又は含むこともなく5fCも5caCも脱アミノ化しないデアミナーゼと基質を接触させるワークフロー例を示す。図3Dは、基質が単一酵素であるdsDNAデアミナーゼと接触されるメチローム分析ワークフロー例を示す。
図3D図3A~3Dは、DNA中の修飾されたシトシンの位置を特定するためのワークフロー例を示す。図3Aは、ssDNAのAPOBEC3A脱アミノ化のワークフロー例を示し、図3B、3C、及び3Dは、APOBEC3Aが、dsDNZAを脱アミノ化するシトシンデアミナーゼにより置換されるワークフロー例を示す。図3Bは、ssDNA及びdsDNAに対して活性であるdsDNAデアミナーゼの使用によりDNA変性ステップが除かれる単一ポットワークフロー例を示す。示されるように、DNAデアミナーゼは、中間精製及び変性ステップなしでTET及びBGTとの反応に続いて反応混合物に添加し、それによってゲノムDNA上の標的メチル化部位の検出及びメチロームマッピングを増強することができる。図3Cは、BGTでの前処理を必要としない又は含むこともなく5fCも5caCも脱アミノ化しないデアミナーゼと基質を接触させるワークフロー例を示す。図3Dは、基質が単一酵素であるdsDNAデアミナーゼと接触されるメチローム分析ワークフロー例を示す。
図4A図4A~4Cは、図3Cと同様に、BGTグリコシルトランスフェラーゼ前処理を必要としない又は含むこともなく、使用されるdsDNAデアミナーゼであるCseDa01が5caC及び5fCを脱アミノ化しない5mC及び5hmCを検出するワークフローの結果例を示す。図4Aは、CseDa01 DNAデアミナーゼが、一本鎖と二本鎖基質の両方でシトシンC、5mC、5hmC及び5ghmCを効率的に脱アミノ化することを示す。図4Bは、CseDa01 DNAデアミナーゼが、シーケンスバイアスを見せず、脱アミノ化効率が、イー・コリ(E.coli)ゲノム中のCpGとCpHコンテクストの両方についてssDNAとdsDNA基質の両方で95%よりも大きかったことを示す。図4Cは、CseDa01 DNAデアミナーゼが、5caC及び5fCを脱アミノ化せず、BGTグルコシル化ステップなしで5mC及び5hmCを検出するのに有用である可能性があることを示す。
図4B図4A~4Cは、図3Cと同様に、BGTグリコシルトランスフェラーゼ前処理を必要としない又は含むこともなく、使用されるdsDNAデアミナーゼであるCseDa01が5caC及び5fCを脱アミノ化しない5mC及び5hmCを検出するワークフローの結果例を示す。図4Aは、CseDa01 DNAデアミナーゼが、一本鎖と二本鎖基質の両方でシトシンC、5mC、5hmC及び5ghmCを効率的に脱アミノ化することを示す。図4Bは、CseDa01 DNAデアミナーゼが、シーケンスバイアスを見せず、脱アミノ化効率が、イー・コリ(E.coli)ゲノム中のCpGとCpHコンテクストの両方についてssDNAとdsDNA基質の両方で95%よりも大きかったことを示す。図4Cは、CseDa01 DNAデアミナーゼが、5caC及び5fCを脱アミノ化せず、BGTグルコシル化ステップなしで5mC及び5hmCを検出するのに有用である可能性があることを示す。
図4C図4A~4Cは、図3Cと同様に、BGTグリコシルトランスフェラーゼ前処理を必要としない又は含むこともなく、使用されるdsDNAデアミナーゼであるCseDa01が5caC及び5fCを脱アミノ化しない5mC及び5hmCを検出するワークフローの結果例を示す。図4Aは、CseDa01 DNAデアミナーゼが、一本鎖と二本鎖基質の両方でシトシンC、5mC、5hmC及び5ghmCを効率的に脱アミノ化することを示す。図4Bは、CseDa01 DNAデアミナーゼが、シーケンスバイアスを見せず、脱アミノ化効率が、イー・コリ(E.coli)ゲノム中のCpGとCpHコンテクストの両方についてssDNAとdsDNA基質の両方で95%よりも大きかったことを示す。図4Cは、CseDa01 DNAデアミナーゼが、5caC及び5fCを脱アミノ化せず、BGTグルコシル化ステップなしで5mC及び5hmCを検出するのに有用である可能性があることを示す。
図5A図5A~5Bは、CseDa01及びTET2を使用して5mCの単一チューブ酸化を実施する結果例を示す。X軸ラベルはデアミナーゼの段階希釈を示し、1×は最も濃縮された酵素であり、32×は1×と比べて32の倍数での希釈液である。図5Aは、一本鎖基質の効率的脱アミノ化を図示する結果を示す。図5Bは、二本鎖基質の効率的脱アミノ化を図示する結果を示す。
図5B図5A~5Bは、CseDa01及びTET2を使用して5mCの単一チューブ酸化を実施する結果例を示す。X軸ラベルはデアミナーゼの段階希釈を示し、1×は最も濃縮された酵素であり、32×は1×と比べて32の倍数での希釈液である。図5Aは、一本鎖基質の効率的脱アミノ化を図示する結果を示す。図5Bは、二本鎖基質の効率的脱アミノ化を図示する結果を示す。
図6A図6A~6Bは、シトシンを効率的にウラシルに脱アミノ化する修飾感受性デアミナーゼである、MGYPDa20を使用する結果例を示す。しかし、MGYPDa20は、dsDNA及びssDNA中の5-メチルシトシン及び5-ヒドロキシメチルシトシンを脱アミノ化しない。このデアミナーゼを使用して、これらの修飾された塩基を保護しなくても5mC及び5hmCを検出しうる。図6Aは、MGYPDa20 DNAデアミナーゼがシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図6Bは、MGYPDa20 DNAデアミナーゼがシーケンスバイアスを見せないことを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図6B図6A~6Bは、シトシンを効率的にウラシルに脱アミノ化する修飾感受性デアミナーゼである、MGYPDa20を使用する結果例を示す。しかし、MGYPDa20は、dsDNA及びssDNA中の5-メチルシトシン及び5-ヒドロキシメチルシトシンを脱アミノ化しない。このデアミナーゼを使用して、これらの修飾された塩基を保護しなくても5mC及び5hmCを検出しうる。図6Aは、MGYPDa20 DNAデアミナーゼがシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図6Bは、MGYPDa20 DNAデアミナーゼがシーケンスバイアスを見せないことを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図7A図7A~7Bは、別の修飾感受性dsDNAデアミナーゼである、NsDa01を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護しなくても5mC及び5hmCを検出しうる。図7Aは、NsDa01 DNAデアミナーゼが、シトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図7Bは、NsDa01 DNAデアミナーゼがシーケンスバイアスを見せないことを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図7B図7A~7Bは、別の修飾感受性dsDNAデアミナーゼである、NsDa01を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護しなくても5mC及び5hmCを検出しうる。図7Aは、NsDa01 DNAデアミナーゼが、シトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図7Bは、NsDa01 DNAデアミナーゼがシーケンスバイアスを見せないことを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図8A図8A~8Bは、CpG特異的修飾感受性dsDNAデアミナーゼである、RhDa01を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護してもしなくてもCpGコンテクストにおいて5mC及び5hmCを検出しうる。図8Aは、RhDa01 DNAデアミナーゼが、CpGコンテクストにおいてシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図8Bは、RhDa01 DNAデアミナーゼが、CpG配列特異性を見せることを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図8B図8A~8Bは、CpG特異的修飾感受性dsDNAデアミナーゼである、RhDa01を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護してもしなくてもCpGコンテクストにおいて5mC及び5hmCを検出しうる。図8Aは、RhDa01 DNAデアミナーゼが、CpGコンテクストにおいてシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図8Bは、RhDa01 DNAデアミナーゼが、CpG配列特異性を見せることを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図9A図9A~Bは、CpG特異的修飾感受性dsDNAデアミナーゼである、MmgDa02を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護してもしなくてもCpGコンテクストにおいて5mC及び5hmCを検出しうる。図9Aは、MmgDa02 DNAデアミナーゼが、CpGコンテクストにおいてシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図9Bは、MmgDa02 DNAデアミナーゼが、CpG配列特異性を見せることを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図9B図9A~Bは、CpG特異的修飾感受性dsDNAデアミナーゼである、MmgDa02を使用する結果例を示し、このデアミナーゼを使用して、修飾された塩基を保護してもしなくてもCpGコンテクストにおいて5mC及び5hmCを検出しうる。図9Aは、MmgDa02 DNAデアミナーゼが、CpGコンテクストにおいてシトシンCを効率的に脱アミノ化するが、5mCも5hmCも5ghmCも脱アミノ化しないことを示す。図9Bは、MmgDa02 DNAデアミナーゼが、CpG配列特異性を見せることを示す。シーケンスロゴは、イー・コリゲノム中で>=90%の脱アミノ化効率を有するシトシン部位を使用して作成された。
図10図10は、修飾感受性dsDNAデアミナーゼである、MGYPDa20を使用してヒトにおいて5mCを位置付けるために1-チューブ-1-酵素 EM-seq法を使用する結果例を示す。この図は、修飾感受性DNAデアミナーゼである、MGYPDa20を使用して、ヒトGM12878ゲノム中の5mC及び5hmCを正確に検出しうることを示す。これらの実験では、2種類のアダプターが使用され、Cはすべて5mC又はピロロ-dCにより置き換えられた。どちらの場合でも、ヒトGM12878ゲノム中の全体のメチル化レベルは正確に特定された。
図11A図11は、異なるメチルトランスフェラーゼ配列特異性を有する異なるゲノム、すなわち、パエニバシラス(Paenibacillus)種JDR-2(CCGG標的配列)及びサルモネラ・エンテリカ(Salmonella enterica)FDAARGOS_312(CACCGT標的配列)のN4mC含有基質由来のCseDa01デアミナーゼにより脱アミノ化されない部位のシーケンスロゴを使用する結果例を示す。APOBEC3Aの真核生物デアミナーゼファミリーは、N4mCを脱アミノ化するが、細菌デアミナーゼはN4mCを脱アミノ化せず、したがって、新たに特徴付けられた細菌デアミナーゼを使用してN4mC修飾を検出しうる。図11Aは、検出されたN4mCモチーフが、パエニバシラス種JDR-2中の予想されるCCGGメチルトランスフェラーゼモチーフに一致することを示す。図11Bは、検出されたN4mCモチーフが、サルモネラ・エンテリカFDAARGOS_312由来のCACCGTと一致することを示す。
図11B図11は、異なるメチルトランスフェラーゼ配列特異性を有する異なるゲノム、すなわち、パエニバシラス(Paenibacillus)種JDR-2(CCGG標的配列)及びサルモネラ・エンテリカ(Salmonella enterica)FDAARGOS_312(CACCGT標的配列)のN4mC含有基質由来のCseDa01デアミナーゼにより脱アミノ化されない部位のシーケンスロゴを使用する結果例を示す。APOBEC3Aの真核生物デアミナーゼファミリーは、N4mCを脱アミノ化するが、細菌デアミナーゼはN4mCを脱アミノ化せず、したがって、新たに特徴付けられた細菌デアミナーゼを使用してN4mC修飾を検出しうる。図11Aは、検出されたN4mCモチーフが、パエニバシラス種JDR-2中の予想されるCCGGメチルトランスフェラーゼモチーフに一致することを示す。図11Bは、検出されたN4mCモチーフが、サルモネラ・エンテリカFDAARGOS_312由来のCACCGTと一致することを示す。
【発明を実施するための形態】
【0014】
本開示は、二本鎖DNA(二重形態で、変性なし)を脱アミノ化するための二本鎖DNAデアミナーゼ、変異体、先祖、融合物、組成物、システム、器具、方法、及びワークフローを提供する。これらのデアミナーゼの適用は、例えば、とりわけ、EM-seq、メチル-SNP-seq、及びN4mC検出を含む。
【0015】
本開示の態様は、提供される説明、図面、配列、実施形態、セクション見出し、及び実施例に照らして理解できるが、それらのどれも決して本開示の全範囲を限定するものと解釈されるべきではない。したがって、本明細書で示される技術革新は本開示の全容及び精神に鑑みて解釈されるべきである。
【0016】
本明細書に記載され図解される個々の実施形態のそれぞれは、本教示の範囲又は精神から逸脱することなくその他いくつかの実施形態のうちのいずれかの成分及び/又は特徴から容易に分離できる又はこれらと組み合わせることができる個別の成分及び特徴を有する。いずれかの列挙された方法は、列挙されたイベントの順番に又は論理的に可能な他のいかなる順番にでも実行できる。本明細書で必要とされると別段はっきり述べられていなければ、本明細書で開示されるそれぞれの成分、特徴、及び方法ステップは任意選択的であり、本開示はそれぞれの任意の要素がはっきりと排除されうる実施形態を想定する。
【0017】
別段定義されなければ、本明細書で使用されるすべての専門及び科学用語は、本開示が属する技術分野の当業者が一般に理解しているのと同じ意味を有する。それでも、ある特定の用語は、本開示の実施形態に関連して並びに参照の明瞭さ及び容易さのために本明細書で定義される。
【0018】
一般的に理解されている用語及び記号の供給源は、Kornberg and Baker、DNA Replication、第2版(W.H.Freeman、New York、1992年);Lehninger、Biochemistry、第2版(Worth Publishers、New York、1975年);Strachan and Read、Human Molecular Genetics、第2版(Wiley-Liss、New York、1999年); Eckstein、編者、Oligonucleotides and Analogs:A Practical Approach(Oxford University Press、New York、1991年);Gait、編者、Oligonucleotide Synthesis:A Practical Approach(IRL Press、Oxford、1984年);Singletonら、Dictionary of Microbiology and Molecular biology、第2版、John Wiley and Sons、New York(1994)、及びHale&Markham、the Harper Collins Dictionary of Biology、Harper Perennial、N.Y.(1991)並びに同類のものなどの標準的専門書及び教科書を含みうる。
【0019】
本明細書で及び添付の特許請求の範囲で使用される場合、単数形の「1つ(a)」、「1つ(an)」及び「その(the)」は、文脈が別段明確に指示しなければ、複数の参照対象を含む。例えば、用語「1つのタンパク質(a protein)」とは、1つ以上のタンパク質、すなわち、単一のタンパク質及び複数のタンパク質のことである。任意の要素は、任意の要素の列挙と関連して「もっぱら(solely)」、「だけ(only)」などの排他的用語法が使用される場合、又は否定的限定が明記される場合にははっきりと排除しうる。
【0020】
数値範囲は、その範囲を定義する数を含める。すべての数が、整数の上及び下の整数の中間点を包含すると理解されるべきである、すなわち、数2は、1.5~2.5を包含する。数2.5は2.45~2.55を包含する、等々。試料数値が提供される場合、それぞれが単独で値の範囲での中間値を表してよく、明記されなければ全体で範囲の端を表しうる。
【0021】
本開示の文脈では、「緩衝液」及び「緩衝剤」とは、それ自体がpHの変化に抵抗し、溶液中に存在する場合は、そのような溶液がより高い又はより低いpHを有する化学的実体又は組成物(例えば、酸又はアルカリ)と接触した場合は、そのような溶液にpHの変化に抵抗させる化学的実体又は組成物のことである。開示された組成物、キット、及び方法において使用しうる適切な天然に存在しない緩衝剤の例は、HEPES、MES、MOPS、TAPS、トリシン、及びTrisを含む。開示された組成物、キット、及び方法において使用しうる適切な緩衝剤の追加の例は、ACES、ADA、BES、ビシン、CAPS、炭酸/重炭酸、CHES、クエン酸、DIPSO、EPPS、ヒスチジン、MOPSO、リン酸、PIPES、POPSO、TAPS、TAPSO、及びトリエタノールアミンを含む。
【0022】
本開示の文脈では、「デアミナーゼ基質」とは、任意選択的に、もっぱら二本鎖、部分的に二本鎖及び部分的に一本鎖、又はもっぱら一本鎖でもよいポリヌクレオチド(例えば、DNA)分子のことである。デアミナーゼ基質は、1つ以上のシトシン、1つ以上の修飾されたシトシン、1つ以上のアデニン、1つ以上の修飾されたアデニン、又はその組合せを含んでよい。DNA基質は、1つ以上のアダプターを含んでよい。
【0023】
本開示の文脈では、「二本鎖DNAデアミナーゼ」とは、二本鎖DNA中のシトシンをウラシルに脱アミノ化する及び/又は二本鎖DNA中のアデニンをヒポキサンチンに脱アミノ化するヒドロリアーゼのことである。二本鎖DNAデアミナーゼは、一本鎖DNA中のそれぞれシトシン及び/又はアデニンを脱アミノ化するのと同じくらいよく又はそれよりも良好に二本鎖DNA中のシトシン及び/又はアデニンを脱アミノ化しうる。例えば、二本鎖DNAデアミナーゼは、シトシン二本鎖DNAを脱アミノ化しうるが、一本鎖DNA中のシトシンは脱アミノ化しない。二本鎖DNAは修飾感受性でありうる。例えば、二本鎖DNAデアミナーゼは、二本鎖DNA中の非修飾シトシン又はアデニンを脱アミノ化しうるが、1つ以上の対応する修飾されたシトシンもアデニンも脱アミノ化しない。
【0024】
本開示の文脈では、「二重鎖」及び「二本鎖」とは、2つのポリヌクレオチド鎖(例えば、別々の分子又は単一分子の空間的に分離された部分)が互いに対合するそれぞれの鎖の相補的塩基と(例えば、ワトソン-クリック塩基対で)互いに逆平行でらせん状に配置されているポリヌクレオチドの任意の立体構造のことである。対合した塩基は、互いに対して積み重ねられて、塩基のπ電子を共有させる。
【0025】
二重鎖安定性は、部分的に、2つの鎖での相補的塩基対ミスマッチ(もしあれば)の比、二重鎖での3つの水素結合を有するペア(例えば、G:C)対2つの水素結合を有するペア(例えば、A:T、A:U)の比、並びに一般的により高い安定性と関連するより高い比及びより長い鎖を有する鎖の長さと関係していることがある。二重鎖安定性は、部分的に、例えば、温度、pH、塩分、並びに/又はいずれかの緩衝液(複数可)変性剤(複数可)(例えば、ホルムアミド)、クラウディング剤(複数可)(例えば、PEG)、洗浄剤(複数可)(例えば、SDS)、界面活性剤(複数可)、多糖(複数可)(例えば、デキストラン硫酸)、キレート剤(複数可)(例えば、EDTA)、及び核酸(複数可)(例えば、サケ精子DNA)の存在、濃度及び性質を含む周囲の状態と関係していることがある。二重鎖ポリヌクレオチドは、例えば、ミスマッチ塩基、ヘアピンループ、一本鎖(5’及び/又は3’)末端を含む、1つ以上の不対塩基を含みうる。
【0026】
二重鎖ポリヌクレオチド(例えば、二本鎖DNAデアミナーゼ基質)は、いかなる所望の長さでも持ちうる。例えば、二重鎖ポリヌクレオチドは、≦50ヌクレオチド、10~200ヌクレオチド、80~400ヌクレオチド、50~500ヌクレオチド、≦500ヌクレオチド、≦1kb、≦2kb、≦5kb又は≦10kbの長さを有しうる。二重鎖ポリヌクレオチドは、いかなる所望の数の、例えば、100ヌクレオチドにつき≦1、100ヌクレオチドにつき≦2、100ヌクレオチドにつき≦3、100ヌクレオチドにつき≦5、又は100ヌクレオチドにつき≦10のミスマッチ又は不対ヌクレオチドを有してよい。
【0027】
本開示の文脈では、「融合タンパク質」とは、その天然の状態では結合していない2つ以上のポリペプチド成分で構成されているタンパク質のことである。融合タンパク質は、2つ、3つ若しくは4つ又はそれよりも多い異なるタンパク質の組合せでもよい。例えば、融合タンパク質は、そのそれぞれの天然の状態では結合していない2つの天然に存在するポリペプチドを含みうる。融合タンパク質は、2つのポリペプチドを含み、そのうちの1つは天然に存在し、残りの1つは天然に存在しなくてよい。用語ポリペプチドは、2つの異種アミノ酸配列の融合物に限定されることを意図されていない。融合タンパク質は、タンパク質のN終端、C終端、及び/又は中間部分に付加された1つ以上の異種ドメインを有してもよい。融合タンパク質の2つの部分が「異種」である場合、その2つの部分は天然の状態では同じタンパク質の一部ではない。融合タンパク質の例は、別の酵素(例えば、エンドヌクレアーゼ)、抗体、マルトース結合ドメイン(MBP)などの固定化に適した結合ドメイン、ヒスチジンタグ(「His-タグ」)、キチン結合ドメイン、アルファメーティング因子若しくはSNAP-タグ(登録商標)(New England Biolabs、Ipswich、MA(例えば、米国特許第7,939,284号及び米国特許第7,888,090号参照))、DNA結合ドメイン、及び/又はアルブミンに融合された二本鎖DNAデアミナーゼを含むタンパク質であって、デアミナーゼが、任意選択的に、その他の成分(複数可)よりもN終端近くに又はC終端近くに置かれたタンパク質を含む。結合ペプチドを使用して、タンパク質試薬の製造中のデアミナーゼの可溶性又は収量を改善しうる。融合タンパク質の他の例は、デアミナーゼと異種ターゲティング配列、リンカー、エピトープタグ、蛍光タンパク質、β-ガラクトシダーゼ、ルシフェラーゼ及び/又は機能的に類似するペプチドなどの検出可能な融合パートナーの融合物を含む。融合タンパク質の成分は、1つ以上のペプチド結合、ジスルフィド結合、及び/又は他の共有結合により結合しうる。
【0028】
本開示の文脈では、「修飾されたシトシン」とは、天然に存在する及び天然には存在しない修飾を含むシトシンの任意の共有結合修飾のことである。修飾されたシトシンは、例えば、1-メチルシトシン(1mC)、2-O-メチルシトシン(m2C)、3-エチルシトシン(e3C)、3,N-エチレノシトシン(ethylenocytosine)(εC)、3-メチルシトシン(3mC)、4-メチルシトシン(4mC)、5-カルボキシルシトシン(5CaC)、5-ホルミルシトシン(5fC)、5-ヒドロキシメチルシトシン(5hmC)、5-メチルシトシン(5mC)、N-メチルシトシンン(N4mC)、及びピロロ-シトシン(ピロロ-C)を含む。修飾されたヌクレオチドの追加の例は、https://dnamod.hoffmanlab.org.に見出しうる。
【0029】
本開示の文脈では、「天然には存在しない」とは、自然界には存在しないポリヌクレオチド、ポリペプチド、炭水化物、脂質、又は組成物のことである。そのようなポリヌクレオチド、ポリペプチド、炭水化物、脂質、又は組成物は、1つ以上の点で天然に存在するポリヌクレオチド、ポリペプチド、炭水化物、脂質、又は組成物と異なっていてよい。例えば、ポリマー(例えば、ポリヌクレオチド、ポリペプチド、又は炭水化物)は、成分構成要素(例えば、ヌクレオチド配列、アミノ酸配列、又は糖分子)の種類及び配置が異なっていてよい。ポリマーは、それが連結されている分子(複数可)に関して天然に存在するポリマーと異なっていてよい。例えば、「天然には存在しない」タンパク質は、ポリペプチド(例えば、融合タンパク質)、脂質、炭水化物、又は任意の他の分子への化学結合(例えば、ペプチド結合、リン酸結合、ジスルフィド結合、エステル結合、及びエーテル結合などを含む共有結合)を有することにより、天然に存在するタンパク質とは、その二次、三次、又は四次構造が異なる場合がある。同様に、「天然には存在しない」ポリヌクレオチド又は核酸は、その核酸の5’末端側、3’末端側、及び/又は5’末端と3’末端の間に(例えば、メチル化)1つ以上の他の修飾(例えば、付加された標識又は他の部分)を含有してもよい。「天然には存在しない」組成物は、以下の点:(a)自然界では結合していない成分を有する;(b)自然界では見られない濃度で成分を有する;(c)さもなければ天然に存在する組成物中で見られる1つ以上の成分を除く;(d)自然界では見られない形態、例えば、乾燥した、凍結乾燥した、結晶性、水性を有する;及び(e)自然界で見られる成分を超えた1つ以上の追加の成分(例えば、緩衝剤、洗浄剤、色素、溶媒又は保存剤)を有する、のうちの1つ以上が天然に存在する組成物とは異なってもよい。
【0030】
アミノ酸に関して、「位置」とは、アミノ終端からカルボキシ終端まで番号付けされたペプチド又はポリペプチドの一次配列中でそのようなアミノ酸が占める場所のことである。例えば、アライメントアルゴリズム(例えば、デフォルトパラメータ(例えば、期待閾値0.05、ワードサイズ3、クエリ範囲での最大マッチ0、マトリックスBLOSUM62、ギャップイグジステンス11エクステンション1、及び条件付きコンポジショナルスコアマトリックス調整)又はカスタムパラメータを使用するBLAST(Journal of Molecular Biology.215(3):403~410頁))を使用して2つの一次配列が整列された場合に2つの位置が互いに向き合っているところでは1つの一次配列中の位置は、2つ目の一次配列中の位置と一致しうる。1つの配列中のアミノ酸位置は、モチーフの整列によるデータベース中の1つ以上の他の配列(複数可)内で特定することができる機能的に等価なモチーフ又は構造的モチーフ内の位置と一致しうる。これに類似して、ヌクレオチドに関して、「位置」とは5’末端から3’末端まで番号付けされたオリゴヌクレオチド又はポリヌクレオチドのヌクレオチド配列中でそのようなヌクレオチドが占める場所のことである。
【0031】
本明細書で言及されるすべての出版物、特許、及び特許出願は、あたかもそれぞれ個々の出版物、特許、又は特許出願が参照により組み込むことが明確に個々に示されているのと同じ程度に参照により本明細書に組み込む。本開示において参照される試薬は、入手可能な材料及び技法を使用して作製される、指示された供給源から入手される、並びに/又はNew England Biolabs、Inc.(Ipswich、MA)から入手されてもよい。
【0032】
二本鎖DNAデアミナーゼ
本開示は、天然に存在する及び天然に存在しない二本鎖DNAデアミナーゼに関する。天然に存在しない二本鎖DNAデアミナーゼは、天然に存在するタンパク質と関係しているが、これとは異なりうる。天然に存在するタンパク質は、デアミナーゼドメインが最もC終末端に位置するもっと大きくマルチドメイン構造の単一ドメインとしてデアミナーゼを含むことが多い。天然に存在しない二本鎖DNAデアミナーゼは、天然に存在するタンパク質の切詰め型を構成してよく、その場合、天然に存在しない二本鎖DNAデアミナーゼは、天然に存在する配列の一部に対して高度な同一性を有するが、例えば、対応する天然に存在するタンパク質の構造的及び/若しくは機能的ドメイン又はサブユニットを欠くことがある。天然に存在しない二本鎖DNAデアミナーゼは、天然に存在する酵素と比べていかなる数の挿入、欠失、又は置換を有していてもよい。例えば、天然に存在しない二本鎖DNAデアミナーゼは、天然に存在する酵素に対して100%未満の同一性、99%未満の同一性、98%未満の同一性、90%未満の同一性、85%未満の同一性、80%未満の同一性、70%未満の同一性、60%未満の同一性、50%未満の同一性、40%未満の同一性、30%未満の同一性、又は20%未満の同一性を有しうる。天然に存在しない二本鎖DNAデアミナーゼは、発現及び/又は精製タグを含みうる。本明細書に開示される天然に存在しない二本鎖DNAデアミナーゼは、天然に存在するタンパク質のC終端デアミナーゼドメインに対して少なくとも80%同一である(例えば、少なくとも90%同一である、少なくとも95%同一である、若しくは少なくとも98%同一である、又は少なくとも99%同一である)アミノ酸配列を有してよく、そこでは二本鎖DNAデアミナーゼは、二本鎖DNAデアミナーゼ活性を有するが対応する天然に存在するタンパク質のN終端(たとえあっても)を含まない。一部の実施形態では、天然に存在しない二本鎖DNAデアミナーゼは、対応する天然に存在するタンパク質のN終端アミノ酸のうちの少なくとも10、少なくとも20、少なくとも50、又は少なくとも100を欠く。一部の実施形態では、二本鎖DNAデアミナーゼは、300以下のアミノ酸長、例えば、200以下のアミノ酸長又は150以下のアミノ酸長である。
【0033】
一部の実施形態によれば、二本鎖DNAデアミナーゼは、配列番号1~152のいずれかに対して少なくとも80%、少なくとも85%、少なくとも88%、少なくとも90%、少なくとも92%、少なくとも93%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一性を有するアミノ酸配列を含みうる。一部の実施形態では、二本鎖DNAデアミナーゼは、転写され、翻訳され、及び/又はプロセシングされると、配列番号1~152のいずれかに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも93%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一性を有するアミノ酸配列を生じる核酸配列によりコードされていてよい。二本鎖DNAデアミナーゼは、配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、99のいずれかに対して少なくとも90%(例えば、少なくとも95%、少なくとも98%、少なくとも99%)同一であるアミノ酸配列を有しうる。一部の実施形態では、天然に存在しない二本鎖DNAデアミナーゼは、それに対応する天然に存在するタンパク質のN終端、例えば、N終端アミノ酸の少なくとも10、少なくとも20、少なくとも50又は少なくとも100を欠く。配列アラインメント及び構造情報を使用して変異体を設計することが可能である。一部の実施形態では、二本鎖DNAデアミナーゼは、野生型タンパク質の断片を含有してよく、断片はデアミナーゼドメインを含有するが、野生型タンパク質のうちデアミナーゼドメインのC終端側及び/又はN終端側でありうる他のドメインを欠く。天然に存在しない二本鎖DNAデアミナーゼの例は、配列番号2、3、4、5、6、7、8、9、10、11、12、14、15、16、19、24、26、27、28、33、40、49、50、63、95、96、97、99を含む。
【0034】
一部の実施形態では、二本鎖DNAデアミナーゼは融合タンパク質でもよい。例えば、二本鎖DNAデアミナーゼは、どちらかの末端に精製タグ(例えば、Hisタグ又は同類の物)を有しうる。一部の実施形態では、二本鎖DNAデアミナーゼは、融合タンパク質がゲノム中で部位特異的CからT置換に影響を及ぼすことができるように、DNA結合タンパク質(例えば、転写因子のDNA結合ドメイン)又は核酸ガイドエンドヌクレアーゼのタンパク質成分(例えば、触媒活性のないCas9(dCas9)又はCas9ニッカーゼ(nCas9)又はTALEN(転写活性化因子様エフェクターヌクレアーゼ))に融合してもよい。「塩基編集」の方法例は、例えば、出版物では特にKomorら、(Nature 533:420~424頁)に記載されている。
【0035】
二本鎖DNAデアミナーゼは、任意選択的に、シトシンを脱アミノ化するがアデニンを脱アミノ化しない(「dsDNAシトシンデアミナーゼ」)、アデニンを脱アミノ化するが、シトシンを脱アミノ化しない(「dsDNAアデニンデアミナーゼ」)、又はアデニンとシトシンの両方を脱アミノ化してよい(それ以外は等しい条件下では一方のほうがもう一方よりも良好な基質になりうることを認識して)。二本鎖DNAデアミナーゼは修飾感受性でもよい。例えば、二本鎖DNAデアミナーゼは、シトシンを脱アミノ化するが、二本鎖DNA中で1つ以上の修飾されたシトシンは脱アミノ化しないことがある。例えば、二本鎖DNAデアミナーゼは、シトシンを脱アミノ化するが、5mCもN4mCも脱アミノ化しないことがある、又は二本鎖DNAデアミナーゼは、C及び5mCを脱アミノ化するが、5hmCも5ghmCもN4mCも脱アミノ化しないことがある。
【0036】
二本鎖DNAデアミナーゼ組成物
本開示は、例えば、反応混合物を含む二本鎖DNAデアミナーゼ組成物を提供する。一部の実施形態によれば、デアミナーゼ組成物は、(a)二本鎖DNAデアミナーゼ及び(b)二本鎖DNAを含みうる。デアミナーゼ組成物は、例えば、デアミナーゼ変異体(例えば、配列番号1~152の1つ以上に対して少なくとも80%同一なアミノ酸配列を有する)を含んでよい。二本鎖DNAデアミナーゼ組成物は、1つ以上の他の触媒活性がなくてよい。例えば、二本鎖DNAデアミナーゼ組成物は、所望の試験条件(例えば、時間、温度、pH、塩分、モデル基質及び/又は他の条件)、例えば、二本鎖DNAデアミナーゼ組成物の特定の使用条件を再現することを意図した又は使用範囲についての条件を表すことを意図された条件下で、それぞれの場合に、dsDNAを切断するヌクレアーゼがない、ssDNAを切断するヌクレアーゼがない、ポリメラーゼ活性がない、DNA修飾活性がない、及び/又はプロテアーゼ活性がなくてもよい。
【0037】
一部の実施形態では、二本鎖DNAデアミナーゼ及び1つ以上の二本鎖DNAデアミナーゼを含む組成物は、例えば、液体、ゲル、フィルム、粉末、ケーキ、及び/又は任意の乾燥若しくは凍結乾燥形態を含む任意の望ましい形態を有しうる。二本鎖DNAデアミナーゼ組成物は、二本鎖DNAデアミナーゼ及び支持物又はマトリックス、例えば、磁性材料、アガロース、ポリスチレン、ポリアクリルアミド、及び/又はキチンを含む、例えば、フィルム、ゲル、ファブリック、又はビーズを含みうる。
【0038】
一部の実施形態では、反応混合物は、シトシンを含む二本鎖DNA基質及び二本鎖DNAデアミナーゼを含みうる。二本鎖DNA基質は、シトシン及び少なくとも1つの修飾されたシトシン、例えば、5fC、5CaC、5mC、5hmC、N4mC又はピロロ-Cを含みうる。二本鎖DNA基質は、真核生物DNA(例えば、植物又は動物)又は細菌性でもよい。一部の実施形態では、二本鎖DNA基質は、哺乳動物、例えば、ヒト由来でよい。一部の実施形態では、二本鎖DNA基質は、ヒトcfDNAでよい。反応混合物は、本明細書に記載されるように、TETメチルシトシンジオキシゲナーゼ(例えば、TET2)及びDNAベータ-グルコシルトランスフェラーゼ並びに/又はリガーゼ、ポリメラーゼ、プロテイナーゼK、及び/若しくは熱不安定性プロテイナーゼKのうちの1つ以上をさらに含んでよい。反応混合物は、巻き戻し剤(例えば、ジャイレース、トポイソメラーゼ、一本鎖DNA結合タンパク質、又はヘリカーゼ)がなく及び/又は変性剤がないこともある。
【0039】
二本鎖DNAデアミナーゼ方法
本開示は、デアミナーゼを使用して、例えば、DNA中の修飾されたヌクレオチドの種類及び/又は位置を特定するための方法を提供する。一部の実施形態では、方法は、任意の所望の長さの二本鎖DNA基質を提供するステップを含んでよい。例えば、二本鎖DNA基質は、≦50ヌクレオチド、10~200ヌクレオチド、80~400ヌクレオチド、50~500ヌクレオチド、≦500ヌクレオチド、≦1kb、≦2kb、≦5kb又は≦10kbの長さを有してよい。二本鎖DNA基質は、一部の実施形態では、ゲノムDNA、オルガネラDNA、cDNA、又は目的の他のDNAの断片でよく、いかなる所望の供給源(例えば、ヒト、非ヒト哺乳動物、植物、昆虫、微生物、ウイルス、又は合成DNA)であっても又はそれから生じてもよい。DNA基質は、一部の実施形態では、生体試料から(例えば、ゲノムDNA)を抽出する、及び、任意選択的に、ゲノムDNAを断片化することにより調製しうる。一部の実施形態では、DNAの断片化は、DNAを機械的に断片化するステップ(例えば、超音波処理、噴霧化、又は剪断により)又はDNAを酵素的に断片化するステップ(例えば、二本鎖DNA「dsDNA」断片化混合物を使用して)を含んでよい。断片化用の酵素の例は、とりわけ、NEBNext(登録商標) Fragmentase(登録商標)、Ultrashear、及びFSシステム(New England Biolabs、Ipswich MA)を含む。一部の実施形態では、脱アミノ化のためのDNAはすでに断片化されていてもよい(例えば、FFPE試料及び循環無細胞DNA(cfDNA)の場合のように)。
【0040】
一部の実施形態によれば、方法は、DNA末端(例えば、断片化されたDNAの末端)をポリッシュするステップを含んでよい。例えば、DNA末端は、(a)もしあれば、3’オーバーハングヌクレオチドを切り取るプルーフリーディングポリメラーゼ、(b)もしあれば、5’オーバーハングを埋めるプルーフリーディング及び/若しくは非プルーフリーディングポリメラーゼ、並びに/又は(c)もしあれば、リン酸化されていない5’末端をリン酸化するポリヌクレオチドキナーゼ(PNK)と接触させてよい。一部の実施形態では、方法は、DNA末端(例えば、平滑末端)を非プルーフリーディングポリメラーゼと接触させて、鋳型由来ではないAテール(例えば、アデニンを含む単一塩基オーバーハング)を3’末端に付加するステップを含んでよい。方法は、一部の実施形態によれば、1つ以上のアダプターをDNA末端にライゲートするステップを含んでよい。アダプターは、1つ以上の試料タグ、独特な分子識別子(UMI)、修飾されたヌクレオチド、プライマー配列(例えば、シーケンシング用の)を含んでよい。一部の実施形態では、アダプターは、使用されるデアミナーゼに対する基質ではないシトシン(又はアデニン)を含んでよい。必要であれば、ポリッシング産物及び/又はライゲーション産物は、例えば、該当する場合は、酵素、未反応ヌクレオチド及び/又はアダプターからポリッシング産物又はライゲーション産物を分離するために精製してよい。
【0041】
一部の実施形態では、方法は、(a)デアミナーゼ基質と(b)グルコシルトランスフェラーゼ(例えば、T4-BGT)及び/又は10-11転座(TET)ジオキシゲナーゼを接触させて修飾されたデアミナーゼ基質を作製するステップを含んでよい。BGTは、5hmCをグルコシル化して5ghmCを形成してもよい。TETは5mCを5caCに酸化してもよい。それに続いて亜硫酸水素ナトリウム又はアポリポタンパク質B mRNA編集酵素サブユニット3A(APOBEC3A)を用いて処理した場合、修飾されたデアミナーゼ基質中5ghmCを除くすべてのCが脱アミノ化されると考えられる。本明細書で開示されるデアミナーゼは、脱アミノ化(例えば、APOBEC3Aを用いて)に先立ってDNAを変性する必要をなくす可能性があり、メチル化感受性を提供しうる。
【0042】
方法は、シトシンを含む二本鎖DNA基質と二本鎖DNAデアミナーゼを接触させて脱アミノ化したシトシンを含む脱アミノ化産物を作製するステップを含んでよい。二本鎖DNA基質は、1つ以上の修飾されたシトシン、例えば、5fC、5CaC、5mC、5hmC、N4mC及びピロロ-C、4mC、εC、3mC、e3C、m2C、並びに1mCから選択される1つ以上の修飾されたシトシンをさらに含みうる。二本鎖DNAデアミナーゼ基質は、脱アミノ化の前又はその最中に変性される必要はない。したがって、方法は、変性ステップなしで実行することができる。一部の実施形態では、脱アミノ化法は、シトシンを含む二本鎖DNA基質と二本鎖DNAデアミナーゼを接触させて、脱アミノ化したシトシンを含む脱アミノ化産物を作製するための反応混合物を生成するステップを含んでよい。
【0043】
脱アミノ化法は、脱アミノ化産物を増幅させて増幅産物を作製し、それによって最初の鎖中の任意の脱アミノ化したCを増幅産物中のTにコピーするステップをさらに含んでよい。脱アミノ化法は、非対称(又は「Y」)アダプター、例えば、Illumina P5/P7アダプターを脱アミノ化産物上にライゲートし、アダプター中の配列に相補的なプライマーを使用して脱アミノ化産物を増幅するステップをさらに含んでよい。一部の実施形態では、方法は、脱アミノ化産物を配列決定する又は脱アミノ化産物を増幅して増幅産物を作製し増幅産物の配列を決定して、それぞれの場合に、シーケンスリードを生み出すステップを含んでよい。脱アミノ化産物及び/又は増幅産物は、Illuminaの可逆的ターミネーター法(例えば、Shendureら、Science 2005年 309:1728頁参照)を含む任意の適切なシステムを使用して配列を決定しうる。一部の実施形態では、脱アミノ化産物は、増幅せずに、例えば、ナノポア又はPacBioシーケンシングにより、直接配列を決定しうる。シーケンシングステップは、反応毎に少なくとも10,000、少なくとも100,000、少なくとも500,000、少なくとも1M、少なくとも10M、少なくとも100M、少なくとも1B又は少なくとも10Bシーケンスリードを生じうる。一部の場合、リードはペアエンドリードでもよい。方法は、シーケンスリードを分析して二本鎖DNA基質中の修飾されたシトシンを特定するステップを含んでよく、そこでは修飾されたシトシンは、デアミナーゼ抵抗性なので「C」として特定できる。
【0044】
修飾されたシトシン(例えば、5mC、5hmC、5ghmC、N4mC)により「ブロック」される又は修飾されたシトシンを脱アミノ化しない二本鎖DNAデアミナーゼは、修飾されたシトシンの分析のための様々な「EM-seq」様ワークフローにおいて使用しうる。EM-seqの現在の実施では、一本鎖基質を好むデアミナーゼを用いる。したがって、現在のEM-seqワークフローは変性ステップがある(図3A、Sunら、Genome Res. 2021年 31:291~300頁及びVaisvilaら、Genome Res.2021年 31:1280~1289頁参照)。本ワークフローでは、変性ステップは取り除くことができ、それによって、EM-seqワークフローはより速くより効率的になっている。
【0045】
脱アミノ化法例のワークフローは、図3B~Dに示されている。図3Bに図示されるように、二本鎖DNA基質は、二本鎖DNAをTETメチルシトシンジオキシゲナーゼ(例えば、TET2)及びDNAベータグルコシルトランスフェラーゼで前処理して、開始DNA中の5mC及び5hmCを二本鎖DNAデアミナーゼ、例えば、MGYPDa829、MGYPDa06、CrDa01、AvDa02、CsDa01、LbsDa01、FlDa01、MGYPDa26、MGYPDa23、キメラ_10及びAncDa04に対して抵抗性の形態に変換することにより調製しうる。図示されるワークフローで有用である二本鎖DNAデアミナーゼは、MGYPDa829(配列番号96)、MGYPDa06(配列番号4)、CrDa01(配列番号12)、AvDa02(配列番号21)、CsDa01(配列番号9)、LbsDa01(配列番号10)、FlDa01(配列番号8)、MGYPDa26(配列番号7)、MGYPDa23(配列番号6)、キメラ_10(配列番号97)及びAncDa04(配列番号95)二本鎖DNAデアミナーゼのうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。図示されるように、二本鎖DNAデアミナーゼは、いかなる精製、変性又は巻き戻し剤の添加もなしで反応に添加することができる。
【0046】
図3Cに示されるように、二本鎖DNA基質は、二本鎖DNAを、DNAベータグルコシルトランスフェラーゼは使用せずに、TETメチルシトシンジオキシゲナーゼ(例えば、TET2)で前処理して、開始DNA中の5mCを二本鎖DNAデアミナーゼ、例えば、CseDa01及びLbDa02に対して抵抗性の形態に変換することにより調製しうる。図示されるワークフローで有用である二本鎖DNAデアミナーゼは、CseDa01(配列番号3)及びLbDa02(配列番号1)二本鎖DNAデアミナーゼのうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。この実施形態では、二本鎖DNAデアミナーゼは、いかなる精製、変性又は巻き戻し剤の添加もなしで反応に添加することができる。
【0047】
図3Dに示されるように、二本鎖核酸は、TETメチルシトシンジオキシゲナーゼとでもDNAベータグルコシルトランスフェラーゼとでも(修飾されたシトシンを選択された二本鎖DNAデアミナーゼに対して抵抗性の形態に変換する他のいかなる酵素とでも)ワークフローのどの時点でも接触させなくてよい。例えば、選択された二本鎖DNAデアミナーゼは、5-ヒドロキシメチルシトシン及び5-メチルシトシンによりブロックされうる。図示されたワークフローで有用である二本鎖DNAデアミナーゼは、MGYPDa20(配列番号11)、NsDa01(配列番号27)、及びAshDa01(配列番号40)二本鎖DNAデアミナーゼのうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。
【0048】
一部の実施形態では、二本鎖DNA基質は、シトシン修飾であり一部の二本鎖DNAデアミナーゼに対して抵抗性である少なくとも1つのN4mC(N4-メチル-シトシン)を含んでよい。N4mCを検出するのに有用である二本鎖DNAデアミナーゼは、配列番号1~28のうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。例えば、N4mCを検出するのに有用である二本鎖DNAデアミナーゼは、CseDa01(配列番号3)及びLbDa01(配列番号19)二本鎖DNAデアミナーゼのうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。これらの実施形態では、二本鎖DNA基質は、原核生物又は古細菌DNAであってもよく又はこれを含んでもよい。
【0049】
一部の実施形態では、二本鎖DNAデアミナーゼは、「メチル-SNP-seq」ワークフローで使用しうる(例えば、Yanら、Genome Res.2022年;gr.277080.122参照)。例えば、方法は、2022年8月22日提出の米国特許仮出願第63/399,970号に記載されるように、二本鎖DNA基質を作製するために、(a)ヘアピンアダプターをDNAの二本鎖断片にライゲートしてライゲーション産物を作製するステップ、(b)ライゲーション産物中のヘアピンアダプターの二本鎖領域に遊離の3’末端を酵素的に生成するステップ、並びに(c)鎖置換又はニック翻訳ポリメラーゼ、dGTP、dATP、dTTP及び修飾されたdCTPを含むdCTPフリー反応混合物中で遊離3’末端を伸長させるステップを含んでよく、前記特許出願は参照により本明細書に組み込む。修飾されたdCTPの例は、5mdCTP、ピロロ-dCTP、及びN4mdCTP、とりわけ、ポリメラーゼにより組み込むことができる修飾されたdCTPを含む。デアミナーゼは、MGYPDa20(配列番号11)、NsDa01(配列番号27)、AshDa01(配列番号40)のうちのいずれかのアミノ酸配列に少なくとも90%同一であるアミノ酸配列を有しうる。
【0050】
一部の実施形態によれば、二本鎖DNAデアミナーゼ組成物は、二本鎖DNAデアミナーゼ、及び、任意選択的に、緩衝剤(例えば、貯蔵緩衝液、反応緩衝液)、賦形剤、塩(例えば、NaCl、MgCl、CaCl)、タンパク質(例えば、アルブミン、酵素)、安定化剤、洗浄剤(例えば、イオン性、非イオン性、及び/又は両性イオン洗浄剤(例えば、オクトキシノール、ポリソルベート20))、ポリヌクレオチド、細胞(例えば、無傷の、消化された、又は任意の無細胞抽出物)、生体液又は分泌物(例えば、粘液、膿)、アプタマー、クラウディング剤、糖(例えば、単糖、二糖、三糖、四糖、又はさらなる多糖)、デンプン、セルロース、ガラス形成剤(例えば、凍結乾燥用)、脂質、オイル、水性媒体、支持体(例えば、ビーズ)及び/又はその(天然には存在しない)組合せの(1つ以上を含む)うちのいずれかを含みうる。組合せは、例えば、収載された成分(例えば、塩及び緩衝液)のうちの2つ以上又は単一の収載された成分の複数(例えば、2つの異なる塩又は2つの異なる糖)を含んでよい。二本鎖DNAデアミナーゼ組成物に含まれうるタンパク質の例は、1つ以上の修飾されたシトシンの脱アミノ化感受性を変更する1つ以上の酵素(例えば、TETメチルシトシンジオキシゲナーゼ及び/又はDNAベータグルコシルトランスフェラーゼ)を含む。
【0051】
二本鎖DNAデアミナーゼキット
本開示は、一部の実施形態では、二本鎖DNAデアミナーゼを含むデアミナーゼキットに関する。キットは、本明細書に記載される成分のうちのいずれを含んでもよい。二本鎖DNAデアミナーゼ組成物又はキットは、例えば、二本鎖DNAデアミナーゼ及び、任意選択的に、貯蔵緩衝液(例えば、緩衝剤を含む及びグリセロールを含む又は欠く)及び/又は反応緩衝液を含んでよい。デアミナーゼ組成物又はデアミナーゼキット用の反応緩衝液は、濃縮した形態でよく、緩衝液は、1種以上の添加剤(例えば、グリセロール)、1種以上の塩(例えば、KCl)、1種以上の還元剤、EDTA、1種以上の洗浄剤、1種以上の非イオン性界面活性剤、1種以上のイオン性(例えば、アニオン性又は両性イオン性)界面活性剤、及び/又はクラウディング剤を含んでよい。dNTPを含むキットは、全部で4つのdATP、dTTP、dGTP及びdCTPのうちの1つ、2つ、3つを含んでよい。キットは、1種以上の修飾されたヌクレオチドをさらに含んでよい。
【0052】
キットの1種以上の成分は、単一ステップ反応用の1つの容器に含まれていてよく、又は1種以上の成分は1つの容器に含まれているが、逐次使用若しくは平行使用のために他の成分とは分離されていてもよい。例えば、キットは単一チューブに2つの成分(例えば、デアミナーゼ及び貯蔵緩衝液)を含み、他の成分はすべて別々の個別チューブに含んでよく、それぞれの場合、内容物はいずれかの所望の形態(例えば、液体、乾燥、凍結乾燥)で提供される。キット中の1つのチューブは、例えば、DNA(例えば、脱アミノ化DNA)を受け入れ増幅するためのマスターミックスを含有してよい。例えば、二本鎖DNAデアミナーゼはチューブのキャップに置かれてよく、鋳型核酸を転写するための成分はチューブの本体に置かれる。要望通りに、例えば、脱アミノ化反応が完了すると、チューブを軽く叩く、揺する、引っ繰り返す、回転させる、又は他の方法で動かして、置かれた二本鎖DNAデアミナーゼを脱アミノ化反応混合物と接触させてもよい。キットは、二本鎖DNAデアミナーゼと反応緩衝液を単一チューブに又は異なるチューブに含んでもよく、単一チューブに含まれる場合、二本鎖DNAデアミナーゼと緩衝液はチューブ中の同じ位置又は別々の位置に存在してもよい。例えば、キットは、上記の二本鎖DNAデアミナーゼ、及び反応緩衝液(例えば、5×又は10×緩衝液)を含んでよい。キットの内容物は、所望の方法又は工程で使用するために処方しうる。一部の実施形態では、キットは、(a)TETメチルシトシンジオキシゲナーゼ(例えば、TET2)及びDNAベータグルコシルトランスフェラーゼをさらに含んでよい、又は(b)TETメチルシトシンジオキシゲナーゼをさらに含み、DNAベータグルコシルトランスフェラーゼを含まなくてよい。一部の実施形態では、キットは、TETメチルシトシンジオキシゲナーゼもDNAベータグルコシルトランスフェラーゼも含まない。一部の実施形態では、キットは、5hmdCTP、5fdCTP、5cadCTP、5mdCTP、ピロロ-dCTP及びN4mdCTPから選択される修飾されたdCTP並びに/又は鎖置換若しくはニック翻訳ポリメラーゼをさらに含む。一部の実施形態では、キットは、リガーゼ、ポリメラーゼ、プロテイナーゼK、及び/又は熱不安定性プロテイナーゼKをさらに含んでよい。二本鎖DNAデアミナーゼは、凍結乾燥する又はグリセロールを含む緩衝貯蔵液中にあってもよい。
【0053】
本開示の恩恵を受ける者にとって明らかになるように、二本鎖DNAデアミナーゼは、様々なゲノム解析法、特に、1つ以上の修飾されたシトシンの位置及び/若しくは種類を特定する並びに/又はシトシンのメチル化状態を判定することを目標とする方法において使用しうる。他の実施形態では、二本鎖DNAデアミナーゼは、塩基編集、すなわち、ゲノム中で部位特異的CからT置換を生み出すための融合タンパク質の成分であることが可能である。
【0054】
実施形態
本開示は、以下のすべてを含む米国特許仮出願第63/264,513号に開示される実施形態にさらに関する。
【0055】
実施形態1.配列番号1~8のいずれかとの少なくとも90%配列同一性を含み、配列番号3に100%同一性は含まないポリペプチド。
【0056】
実施形態2.配列番号1~3のいずれかとの少なくとも90%配列同一性を含み、配列番号3に100%同一性は含まない、実施形態1に記載されるポリペプチド。
【0057】
実施形態3.配列番号1又は2のいずれかとの少なくとも90%配列同一性を含む、実施形態1に記載されるポリペプチド。
【0058】
実施形態4.二本鎖DNA(dsDNA)中のシトシンを配列バイアスなしで脱アミノ化することができる、実施形態1~3のいずれかに記載されるポリペプチド。
【0059】
実施形態5.一本鎖DNA(ssDNA)中のシトシンを配列バイアスなしで脱アミノ化することができる、実施形態1~3のいずれかに記載されるポリペプチド。
【0060】
実施形態6.融合タンパク質を含む、実施形態1~5のいずれかのポリペプチド。
【0061】
実施形態7.ポリペプチドが凍結乾燥されている、実施形態1~6のいずれかのポリペプチド。
【0062】
実施形態8.ポリペプチドが基質上に固定化される、実施形態1~7のいずれかのポリペプチド。
【0063】
実施形態9.ポリペプチドが混合物中の1種以上の試薬と組み合わされ、混合物中の1種以上の試薬が第2のポリペプチドを含む、実施形態1~8のいずれかのポリペプチド。
【0064】
実施形態10.第2のポリペプチドが、リガーゼ、ポリメラーゼ、メチルシトシン(mC)ジオキシゲナーゼ、DNAグルコシルトランスフェラーゼ、プロテイナーゼK、及び熱不安定性プロテイナーゼKからなる群から選択される、実施形態9のポリペプチド。
【0065】
実施形態11.混合物中の1種以上の試薬が、デアミナーゼの可逆的阻害剤をさらに含む、実施形態9~10のいずれかのポリペプチド。
【0066】
実施形態12.混合物がDNAをさらに含む、実施形態1~11のいずれかのポリペプチド。
【0067】
実施形態13.(a)ゲノムDNAを含有する反応混合物と配列バイアスのない二本鎖DNA(dsDNA)デアミナーゼと組み合わせるステップ;
(b)ゲノムDNA中のシトシンの少なくとも50%を、dsDNAを一本鎖DNA(ssDNA)に変換する変性ステップなしでウラシルに脱アミノ化するステップ、
を含むメチローム解析のための方法。
【0068】
実施形態14.(a)に先立って、mCをヒドロキシメチルシトシン(hmC)に変換するために、ゲノムDNAに対するメチルシトシン(mC)ジオキシゲナーゼを反応混合物に添加する、実施形態13に記載の方法。
【0069】
実施形態15.(a)に先立って、ヒドロキシメチルシトシン(hmC)修飾試薬を反応混合物に添加する、実施形態13~14のいずれかに記載の方法。
【0070】
実施形態16.(b)が、DNAデアミナーゼをプロテイナーゼK又は熱不安定性プロテイナーゼKを用いて不活化するステップをさらに含む、実施形態13~15のいずれかに記載の方法。
【0071】
実施形態17.(b)が、変換シトシンを含有するDNAを増幅するステップをさらに含む、実施形態13~16のいずれかに記載の方法。
【0072】
実施形態18.増幅されたDNAの配列を決定するステップをさらに含む、実施形態13~17のいずれかに記載の方法。
【0073】
実施形態19.ゲノムDNA中のメチルシトシン(mC)の位置を決定するステップをさらに含む、実施形態13~18のいずれかに記載の方法。
【0074】
実施形態20.二本鎖DNA(dsDNA)及び任意選択的に一本鎖DNA(ssDNA)中のシトシンを配列バイアスなしで脱アミノ化することができるデアミナーゼを含むキット。
【0075】
実施形態21.ジオキシゲナーゼとは別の容器にメチルジオキシゲナーゼをさらに含む、実施形態20に記載のキット。
【0076】
実施形態22.ヒドロキシメチルシトシン(hmC)修飾酵素をジオキシゲナーゼと同じ容器に又は異なる容器にさらに含む、実施形態20又は21に記載のキット。
【実施例
【0077】
[実施例1] DNAデアミナーゼのインビトロでの発現
候補DNAデアミナーゼ遺伝子は先ずコドン最適化され、次に、隣接配列がそれぞれの末端に、特に、5’末端にはT7プロモーターを含む配列及び3’末端にはT7ターミネーターを含む配列を付加された。これらの配列は、Integrated DNA Technologies(Coralville、IA、USA)に直鎖状gBlockとして注文された。インビトロタンパク質合成用の鋳型DNAは、鋳型及び隣接プライマーとしてgBlockを使用してPhusion(登録商標)Hot Start Flex DNAポリメラーゼを用いて作製された。PCR産物は、Monarch PCR及びDNA精製キット(New England Biolabs、Inc.Ipswich、MA、USA)を使用して精製された。DNA濃度は、NanoDrop分光光度計(Thermo Fisher Scientific、Inc.Waltham、MA、USA)を使用して定量化された。100~400ngのPCR断片を鋳型DNAとして使用し、PURExpressインビトロタンパク質合成キット(New England Biolabs、Inc.Ipswich、MA、USA)を製造業者の推奨に従って使用して分析量のDNAデアミナーゼを合成した。
【0078】
[実施例2] 一本鎖及び二本鎖基質上での脱アミノ化アッセイ
インビトロで発現されたDNAデアミナーゼの活性を試験するため、2μlアリコートのPURExpress試料を、50mMのBis-Tris pH6.0、0.1%TritonX-100を含有する緩衝液で300ngのΦX174 Virion DNA(ssDNA基質)又はΦX174 RF I DNA(dsDNA基質)と混合し、37℃で1時間インキュベートした。脱アミノ化ΦX174 DNAは、Monarch PCR及びDNA精製キット(New England Biolabs、Inc.Ipswich、MA、USA)を使用して精製した。DNA濃度は、NanoDrop分光光度計(Thermo Fisher Scientific、Inc.Waltham、MA、USA)を使用して定量化された。150ngの脱アミノ化DNAを、ヌクレオシド消化ミックス(New England Biolabs、Inc.Ipswich、MA、USA)を製造業者の推奨に従って用いてヌクレオシドまで消化した。LC-MS/MS分析は、G7117Aダイオードアレイ検出器及びポジティブエレクトロスプレイイオン化法(+ESI)で作動する6495Cトリプル四重極質量検出器を備えたAgilent 1290 Infinity II UHPLC上で消化されたDNAを注入することにより実施された。UHPLCは、メタノール及び10mMの含水酢酸アンモニウム(pH4.5)からなる勾配移動相を用いてWaters XSelect HSS T3 XPカラム(2.1×100mm、2.5μm)上で実行した。MSデータ収集は、ダイナミックマルチプルリアクションモニタリング(DMRM)法で実施された。それぞれのヌクレオシドは、その特異的MS/MSトランジションに関連する抽出クロマトグラムで特定された:dC[M+H] m/z228.1→112.1で;dU[M+H] m/z229.1→113.1で;dC[M+H] m/z242.1→126.1で;及びdT[M+H] m/z243.1→127.1で。既知の量のヌクレオシドを用いた外部検量線を使用して、分析された試料内でのその比が計算された。
【0079】
[実施例3] NGS脱アミノ化アッセイ
50ngのイー・コリC2566ゲノムDNAは対照の修飾されたDNAと組み合わされた:
【0080】
【表1】
【0081】
DNA調製
次に、DNAをCovarisマイクロTUBE(Covaris、Woburn、MA、USA)に移し、Covaris S2装置を使用して、300bpまで剪断した。50μlの剪断物質はPCRストリップチューブに移して、ライブラリー構築を開始した。末端修復、A-テーリング及びIllumina適合性アダプターを使用するアダプターライゲーションのために製造業者の説明書に従って、NEBNext DNA Ultra II試薬(New England Biolabs、Inc.Ipswich、MA、USA)を使用した。ライゲートされた試料は110μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは17μlの水中に溶出された。
【0082】
脱アミノ化
DNAは、次に、上記の通りに合成された1μlのdsDNAデアミナーゼを使用して、50mMのBis-Tris pH6.0、0.1%のTriton X-100中、37℃、インキュベーション時間1時間で脱アミノ化された。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(New England Biolabs、Inc.Ipswich、MA)を添加し、37℃でさらに30分間インキュベートした。5μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(New England Biolabs、Inc.Ipswich、MA、USA)をDNAに添加し、PCR増幅した。PCR反応試料は、50μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは15μlの水中に溶出された。ライブラリーは、Agilentバイオアナライザー2100中に挿入されたチップを使用する高感度DNA分析により分析され定量化された。全ゲノムライブラリーは、Illumina NextSeqプラットホームを使用して配列決定された。150サイクル(2×75bp)のペアエンドシーケンシングはすべてのシーケンシング実行について実施された。ベースコール(base calling)及びデマルチプレキシング(demultiplexing)は標準Illuminaパイプラインを用いて実行された。CseDa01の結果は図4A及び4Bに示されている。
【0083】
[実施例4] 1-チューブ-3-酵素 EM-seq(dsDNAデアミナーゼMGYPDa829+ TET2+ BGT)
50ngのNA12878ゲノムDNAを、0.1ngのCpGメチル化pUC19及び1ngの非メチル化ラムダ対照DNAと組み合わせ、5mMのTris pH8.0で50μlまで作製した。DNAは実施例3に従って調製し、ライブラリーは29μlの水中に溶出させた。50mMのTris HCl pH8.0、1mMのDTT、5mMのナトリウム-L-アスコルビン酸、20mMのa-KG、2mMのATP、50mMの硫酸アンモニウム鉄(II)六水和物、0.04mMのUDG-グルコース(NEB、Ipswich、MA)、16μgのmTET2、10UのT4-BGT(NEB、Ipswich、MA)を含有する50μlの反応容積中でDNAを酸化させた。反応は、Fe(II)溶液を最終反応濃度40μMまで添加することにより開始し、次に、37℃で1時間インキュベートした。その後、1μlのMGYPDa829 dsDNAデアミナーゼを使用して37℃、インキュベーション時間3時間でDNAを脱アミノ化した。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Inc.Ipswich、MA)を添加し、37℃でさらに30分間及び60℃で15分間インキュベートした。インキュベーション終了時、DNAは、70μlの再懸濁NEBNext試料精製ビーズを製造業者のプロトコルに従って使用して精製された。試料は16μlの水に溶出され、15μlは新たなチューブに移された。1μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Inc.Ipswich、MA)をDNAに添加し、PCR増幅した。ライブラリーは、Agilentバイオアナライザー2100 DNA分析装置で分析され定量化された。全ゲノムライブラリーは配列決定され、下に記載される通りに分析された。
【0084】
生のリードは先ずTrim Galoreソフトウェアにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラム(Langmead and Salzberg 2012)を使用して、ヒトゲノム(GRCh38)並びにラムダ及びpUC19対照の完全配列を含む複合参照配列に位置付けした。次に、整列されたリードは、2つのポストプロセスQCステップを受けた:1、同じ整列開始位置(5’末端)を共有するアライメントペアはPCR複写物と見なされて破棄された;2、ヒトゲノムに整列し、非CpGコンテクストに過剰のシトシン(例えば、75bpで3よりも多い)を含有したリードは、おそらく変換エラーから生じているので取り除かれた。それぞれのカバーされたシトシン位置のT(変換されメチル化されていない)及びC(変換されず修飾された)の数は、次に、Bismarkメチル化抽出子を使用して残りの良質なアライメントから計算され、メチル化レベルはCの数/(Cの数+Tの数)として計算された。図3Cはこのワークフローを図示する。
【0085】
[実施例5] CseDa01 DNAデアミナーゼは5caC及び5fCを脱アミノ化しない
1つの修飾されたシトシンを有する(5caC又は5fC)1500ngのオリゴヌクレオチド(ACACCCATCACATTTACAC(5caC)GGGAAAGAGTTGAATGTAGAGTTGG;配列番号157)又はACACCCATCACATTTACAC(5fC)GGGAAAGAGTTGAATGTAGAGTTGG;配列番号158は、50mMのBis-Tris pH6.0、0.1%Triton X-100を含有する緩衝液中で4時間、CseDa01 DNAデアミナーゼで処理され、37℃で1時間インキュベートされた。脱アミノ化されたオリゴヌクレオチドは、Monarch PCR及びDNA精製キット(New England Biolabs、Inc.Ipswich、MA、USA)を使用して精製された。DNA濃度は、NanoDrop分光光度計(Thermo Fisher Scientific、Inc.Waltham、MA、USA)を使用して定量化された。1500ngの脱アミノ化DNAを、ヌクレオシド消化ミックス(New England Biolabs、Inc.Ipswich、MA、USA)を製造業者の推奨に従って用いてヌクレオシドまで消化した。UHPLC-MS分析は、G7117Aダイオードアレイ検出器及び6135 XT MS検出器を備えたAgilent 1290 Infinity II UHPLCを使用して、メタノール及び10mMの酢酸アンモニウム緩衝液(pH4.5)からなる勾配移動相を用いてWaters XSelect HSS T3 XPカラム(2.1×100mm、2.5μm)上で実施した。それぞれのピークの種類はMSにより確かめた。それぞれのヌクレオシドの相対量は、260nmでのそれぞれのピークの積分又はそのそれぞれのUV吸収極大により決定された。結果は図4Cに示されている。
【0086】
[実施例6] dsDNAデアミナーゼCseDa01+TET2を使用する1-チューブ-2-酵素 EM-seq
50ngのNA12878ゲノムDNAを、0.1ngのCpGメチル化pUC19及び1ngの非メチル化ラムダ対照DNAと組み合わせ、5mMのTris pH8.0で50μlまで作製した。DNAは実施例3に従って調製し、ライブラリーは29μlの水中に溶出させた。50mMのTris HCl pH8.0、1mMのDTT、5mMのナトリウム-L-アスコルビン酸、20mMのa-KG、2mMのATP、50mMの硫酸アンモニウム鉄(II)六水和物、及び16μgのmTET2を含有する50μlの反応容積中でDNAを酸化させた。反応は、Fe(II)溶液を最終反応濃度40μMまで添加することにより開始し、次に、37℃で1時間インキュベートした。その後、1μlのCseDa01 dsDNAデアミナーゼを使用して37℃、インキュベーション時間3時間でDNAを脱アミノ化した。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Ipswich、MA)を添加し、37℃でさらに30分間及び60℃で15分間インキュベートした。インキュベーション終了時、DNAは、70μlの再懸濁NEBNext試料精製ビーズを製造業者のプロトコルに従って使用して精製された。試料は16μlの水に溶出され、15μlは新たなチューブに移された。1μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Ipswich、MA)をDNAに添加し、PCR増幅した。ライブラリーは、Agilentバイオアナライザー2100 DNA分析装置で分析され定量化された。全ゲノムライブラリーは配列決定され、下に記載される通りに分析された。生のリードは先ずTrim Galoreソフトウェアにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラム(Langmead and Salzberg 2012)を使用して、ヒトゲノム(GRCh38)並びにラムダ及びpUC19対照の完全配列を含む複合参照配列に位置付けした。次に、整列されたリードは、2つのポストプロセスQCステップを受けた:1、同じ整列開始位置(5’末端)を共有するアライメントペアはPCR複写物と見なされて破棄された;2、ヒトゲノムに整列し、非CpGコンテクストに過剰のシトシン(例えば、75bpで3よりも多い)を含有したリードは、おそらく変換エラーから生じているので取り除かれた。次に、それぞれのカバーされたシトシン位置のT(変換されメチル化されていない)の及びC(変換されず修飾された)の数は、Bismarkメチル化抽出子を使用して残りの良質なアライメントから計算され、メチル化レベルはCの数/(Cの数+Tの数)として計算された。図3Cはこのワークフローを図示する。
【0087】
[実施例7] DNAデアミナーゼCseDa01はTET2緩衝液中で極めて効率的に機能し、単一チューブ5mC酸化及びDNA脱アミノ化反応を行わせる
TET2緩衝液中でCseDa01 DNAデアミナーゼの活性を試験するため、2μlのPURExpress試料を、50mMのTris HCl pH8.0、1mMのDTT、5mMのナトリウム-L-アスコルビン酸、20mMのa-KG、2mMのATP、50mMの硫酸アンモニウム鉄(II)六水和物、0.04mM、を含有する緩衝液で300ngのΦX174 Virion DNA(ssDNA基質)又はΦX174 RF I DNA(dsDNA基質)と混合し、37℃で1時間インキュベートした。脱アミノ化ΦX174 DNAは、Monarch PCR及びDNA精製キット(New England Biolabs、Inc.Ipswich、MA、USA)を使用して精製した。DNA濃度は、NanoDrop分光光度計(Thermo Fisher Scientific、Inc.Waltham、MA、USA)を使用して定量化された。150ngの脱アミノ化DNAを、ヌクレオシド消化ミックス(New England Biolabs、Inc.Ipswich、MA、USA)を製造業者の推奨に従って用いてヌクレオシドまで消化した。LC-MS/MS分析は、G7117Aダイオードアレイ検出器及びポジティブエレクトロスプレイイオン化法(+ESI)で作動する6495Cトリプル四重極質量検出器を備えたAgilent 1290 Infinity II UHPLC上で消化されたDNAを注入することにより実施された。UHPLCは、メタノール及び10mMの含水酢酸アンモニウム(pH4.5)からなる勾配移動相を用いてWaters XSelect HSS T3 XPカラム(2.1×100mm、2.5μm)上で実行した。MSデータ収集は、ダイナミックマルチプルリアクションモニタリング(DMRM)法で実施された。それぞれのヌクレオシドは、その特異的MS/MSトランジションに関連する抽出クロマトグラムで特定された:dC[M+H] m/z228.1→112.1で;dU[M+H] m/z229.1→113.1で;dC[M+H] m/z242.1→126.1で;及びdT[M+H] m/z243.1→127.1で。既知の量のヌクレオシドを用いた外部検量線を使用して、分析された試料内でのその比が計算された。結果は図4A、4B、4C、5A、及び5Bに示される。
【0088】
[実施例8] 修飾感受性デアミナーゼはシトシンをウラシルに効率的に脱アミノ化するが、dsDNA及びssDNA中の5-メチルシトシン及び5-ヒドロキシメチルシトシンを脱アミノ化しない
50ngのイー・コリC2566ゲノムDNAを、2ngの非メチル化ラムダ、ファージXP12(シトシンはすべて5-メチルシトシンである)及びT4ファージDNA(シトシンはすべて5-ヒドロキシメチルシトシンである)対照DNAと組み合わせ、10mMのTris pH8.0で50μlまで作製した。次に、DNAは、剪断サイズ240~290bp及びライブラリー溶出容積15μlの水を用いた実施例3に従って調製した。その後、DNAは、上記の通りに合成された1μlの修飾感受性dsDNAデアミナーゼ(例えば、MGYPDa20又はNsDa01)を使用して、50mMのBis-Tris pH6.0、0.1%のTriton X-100中、37℃、インキュベーション時間1時間で脱アミノ化された。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Ipswich、MA)を添加し、37℃でさらに30分間インキュベートした。1μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Ipswich、MA)をDNAに添加し、PCR増幅した。PCR反応試料は50μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは15μlの水中に溶出された。ライブラリーは、Agilentバイオアナライザー2100中に挿入されたチップを使用して高感度DNA分析により分析され定量化された。全ゲノムライブラリーは、Illmina NextSeqプラットホームを使用して配列決定された。150サイクル(2×75bp)のペアエンドシーケンシングはすべてのシーケンシングランについて実施された。ベースコール及びデマルチプレキシングは標準Illuminaパイプラインを用いて実行された。生のリードは先ずTrim Galoreにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラムを使用して、イー・コリC2566ゲノム並びにラムダ、ファージXP12、及びT4対照の完全配列を含む複合参照配列に位置付けした。
【0089】
R2リードの5’末端の最初の5bpは、末端修復エラーを減らすために取り除かれ、同じアライメント開始位置(5’末端)を共有する整列リードペアはPCR複写物と見なされ破棄された。次の脱アミノ化イベント(C->T)は、Bismarkメチル化抽出子プログラムを使用して、残りの良好なアライメント配列を参照配列と比較することによりコールされた。次に、個々のゲノム由来のカバーされたすべてのシトシンの20bp隣接配列(10bp上流及び10bp下流)が抽出され、シトシン部位は、その脱アミノ化率(>=90%、>=50%、>=25%又は<=10%)に基づいて異なる群に分割された。それぞれのシトシン群の隣接配列は、脱アミノ化配列優先度を推測するために、WebLogo3を使用して配列ロゴを作成するのに使用された。結果は、MGYPDa20は図6A及び6Bに、NsDa01は図7A及び7Bに、RhDa01_extN10は図8A及び8Bに、並びにMmgDa02は図9A及び9Bに示される。
【0090】
[実施例9] 修飾感受性dsDNAデアミナーゼMGYPDa20を使用して1-チューブ-1-酵素 EM-seq法をヒトでの5mCを位置付けるのに適用させる
50ngのNA12878ゲノムDNAを、0.1ngのCpGメチル化pUC19及び1ngの非メチル化ラムダ対照DNAと組み合わせ、5mMのTris pH8.0で50μlまで作製した。DNAは実施例3に従って調製され、ライブラリーは17μlの分子グレード水に溶出された。次に、DNAは、1μlのMGYPDa20 dsDNAデアミナーゼを使用して、50mMのBis-Tris pH6.0、0.1%のTriton X-100中、37℃、インキュベーション時間3時間で脱アミノ化された。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Ipswich、MA)を添加し、37℃でさらに30分間インキュベートした。5μMのNEBNext Unique Dual Indexプライマー、20μMの脱アミノ化DNA及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Ipswich、MA)を組み合わせてPCR増幅した。PCR反応試料は50μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは15μlの水中に溶出された。ライブラリーは、Agilentバイオアナライザー2100中に挿入されたチップを使用して高感度DNA分析により分析され定量化された。全ゲノムライブラリーは、Illmina NextSeqプラットホームを使用して配列決定され、下に記載される通りに分析された。生のリードは先ずTrim Galoreソフトウェアにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラム(Langmead and Salzberg 2012)を使用して、ヒトゲノム(GRCh38)並びにラムダ及びpUC19対照の完全配列を含む複合参照配列に位置付けした。次に、整列されたリードは、2つのポストプロセスQCステップを受けた:1、同じ整列開始位置(5’末端)を共有するアライメントペアはPCR複写物と見なされて破棄された;2、ヒトゲノムに整列し、非CpGコンテクストに過剰のシトシン(例えば、75bpで3よりも多い)を含有したリードは、おそらく変換エラーから生じているので取り除かれた。次に、それぞれのカバーされたシトシン位置のT(変換されメチル化されていない)及びC(変換されず修飾された)の数は、Bismarkメチル化抽出子を使用して残りの良質なアライメントから計算され、メチル化レベルはCの数/(Cの数+Tの数)として計算された。図3Dはこのワークフローを図示する。結果は図10に示される。
【0091】
[実施例10] MGYPDa20 DNAデアミナーゼを使用するメチル-SNP-seqライブラリーの調製
全ヒトゲノムメチル-SNP-seqシーケンシングのため、脱アミノ化効率をモニターするために中にスパイクされた4mgのNA12878 gDNA及び40ngの非メチル化ラムダDNAが使用された。ゲノムDNAは、CovarisS2超音波処理器を使用する250bpの超音波処理プロトコルを使用して断片化された。2つの技術的複写物が設定された。断片化されたgDNAは末端修復され、dAテールされ(NEB Ultra II E7546モジュール)、次に、NEBリガーゼマスターミックス(NEB、M0367)を使用してカスタムヘアピンアダプターにライゲートされた。不完全ライゲーション産物(1つのアダプターだけがライゲートされている又はアダプターがライゲートされていない断片)は、2つのエキソヌクレアーゼ(NEB exoIII及びNEB exoVII)を使用して取り除かれた。UDG及びEndoVIIIで処理された後、両末端のヘアピンアダプター中のウラシル位置に2つのニック部位が作り出された。ニック部位は、dATP、dGTP、dTGP及び5-メチル-dCTPの存在下で、DNAポリメラーゼIにより3’終端に向かって翻訳された。ニックトランスレーションは、DNAポリメラーゼIが逆鎖上でもう一方のニックに遭遇すると二本鎖DNA切断を引き起こす。こうして得られた断片は、ヘアピンアダプターにライゲートされた1つの末端及びもう一方の側では平滑末端を有する。平滑末端は、dA-テールされ、メチル化Illuminaアダプターでライゲートされた。ライゲートされた産物は、二本鎖DNAデアミナーゼMGYPDa20を用いて37℃で3時間脱アミノ化された。脱アミノ化されたDNA産物はNEBNext Q5Uマスターミックス(NEB、M0597)を使用して増幅された。こうして得られた指標を付けられたライブラリーはIlluminaシーケンシング用に使用された。ヒトメチル-SNP-seqライブラリーは、100bpの対末端リードについてIllumina Novaseq 6000シーケンサーを使用して配列決定された。
【0092】
[実施例11] CseDa01 dsDNAデアミナーゼでN4mC修飾されたDNAの検出
50ngのパエニバシラス属種JDR-2(CCGG標的配列)及びサルモネラ・エンテリカFDAARGOS_312(CACCGT標的配列)DNAは0.1ngのCpGメチル化pUC19及び1ngの非メチル化ラムダ対照DNAと組み合わせ、5mMのTris pH8.0で50μlまで作製した。DNAは、剪断サイズ240~290bp及び溶出容積15μlの水を用いた実施例3に従って調製した。次に、DNAは、上記の通りに合成された1μlのCseDa01 dsDNAデアミナーゼを使用して、50mMのBis-Tris pH6.0、0.1%のTriton X-100中、37℃、インキュベーション時間1時間で脱アミノ化された。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Ipswich、MA)を添加し、37℃でさらに30分間インキュベートした。1μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Ipswich、MA)をDNAに添加し、PCR増幅した。PCR反応試料は50μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは15μlの水中に溶出された。ライブラリーは、Agilentバイオアナライザー2100中に挿入されたチップを使用して高感度DNA分析により分析され定量化された。全ゲノムライブラリーは、Illmina NextSeqプラットホームを使用して配列決定された。150サイクル(2×75bp)のペアエンドシーケンシングはすべてのシーケンシングランについて実施された。生のリードは先ずTrim Galoreにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラムを使用して、参照配列並びにラムダ及びpUC19対照の完全配列に位置付けした。R2リードの5’末端の最初の5bpは、末端修復エラーを減らすために取り除かれ、同じアライメント開始位置(5’末端)を共有する整列リードペアはPCR複写物と見なされ破棄された。次の脱アミノ化イベント(C->T)は、Bismarkメチル化抽出子プログラムを使用して、残りの良好なアライメント配列を参照配列と比較することによりコールされた。N4mC修飾された部位は、それが大部分脱アミノ化されている(C->T変換率<=20%)場合はコールされる。すべてのコールされたN4mC部位の隣接する20bp配列が抽出され、WebLogo3を使用する配列ロゴが作成された。結果は、図11A及び11Bに示される。
【0093】
[実施例12] CseDa01 dsDNAデアミナーゼ及びMGYPDa20 dsDNAデアミナーゼを用いてN4mC及び5mC修飾されたDNAの検出
50ngのNEB1569サーマス属種(Thermus species)M及びNEB394アシネトバクター種(Acinetobacter species)HゲノムDNAは、0.1ngのCpGメチル化pUC19及び1ngの非メチル化ラムダ対照DNAと組み合わせ、5mMのTris pH8.0で50μlまで作製した。次に、DNAは、剪断サイズ240~290bp及びライブラリー溶出容積15μlの水を用いた実施例3に従って調製した。次に、DNAは、上記の通りに合成された1μlのdsDNAデアミナーゼを使用して、50mMのBis-Tris pH6.0、0.1%のTriton X-100中、37℃、インキュベーション時間1時間で脱アミノ化された。脱アミノ化反応後、1μlの熱不安定性プロテイナーゼK(P8111S、New England Biolabs、Ipswich、MA)を添加し、37℃でさらに30分間インキュベートした。1μMのNEBNext Unique Dual Indexプライマー及び25μlのNEBNext Q5Uマスターミックス(M0597、New England Biolabs、Ipswich、MA)をDNAに添加し、PCR増幅した。PCR反応試料は50μlの再懸濁NEBNext試料精製ビーズと混合され、製造業者の説明書に従って精製された。ライブラリーは15μlの水中に溶出された。ライブラリーは、Agilentバイオアナライザー2100中に挿入されたチップを使用して高感度DNA分析により分析され定量化された。全ゲノムライブラリーは、Illmina NextSeqプラットホームを使用して配列決定された。150サイクル(2×75bp)のペアエンドシーケンシングはすべてのシーケンシングランについて実施された。ベースコール及びデマルチプレキシングは標準Illuminaパイプラインを用いて実行された。生のリードは先ずTrim Galoreにより整えられ、3’末端からアダプター配列及び低質の塩基を取り除いた。アダプター/クオリティートリミングに起因する不対リードもこの工程中に取り除かれた。整えられたリード配列はCからTに変換され、次に、デフォルトBowtie2設定付きのBismarkプログラムを使用して、NEB1569サーマス属種M及びNEB394アシネトバクター種Hを含む複合参照配列並びにラムダ及びpUC19対照の完全配列に位置付けした。R2リードの5’末端の最初の5bpは、末端修復エラーを減らすために取り除かれ、同じアライメント開始位置(5’末端)を共有する整列リードペアはPCR複写物と見なされ破棄された。次の脱アミノ化イベント(C->T)は、Bismarkメチル化抽出子プログラムを使用して、残りの良好なアライメント配列を参照配列と比較することによりコールされた。N4mC修飾はCseDa01デアミナーゼ処理ライブラリーからコールされる。N4mC修飾された部位は、大部分が脱アミノ化されていない場合(C->T変換率<=20%)はコールされる。5mC修飾検出では、差次的メチル化分析を、同一試料のMGYPDa20デアミナーゼ処理ライブラリー(N4mCと5mCの両方を検出する)とCseDa01デアミナーゼ処理ライブラリー(N4mCのみを検出する)の間で行って、MGYPDa20ライブラリーでのみ検出される修飾された部位(すなわち、5mC)を特定した。差次的にメチル化された部位は、Methylkitプログラムを使用して、SLIM補正Q値<=0.01及びメチル化差異>=80%を用いたロジスティック回帰法によりコールされた。メチルトランスフェラーゼ認識配列を特定するため、すべての修飾された部位の4bp上流及び4bp下流を含む9bpの隣接配列が抽出され、独特の9bp配列は、配列のそれぞれのペア間の差異に基づいて階層的リンケージ法を使用してクラスター化された。配列ロゴは、異なるメチルトランスフェラーゼ認識モチーフを表すそれぞれのクラスターについてWebLogo3を使用して作成された。
【0094】
[実施例13] 候補選択
HMMER3(Eddy、S.R.Accelerated Profile HMM Searches.PLOS Comput.Biol.7、e1002195(2011))シトシンデアミナーゼ配列プロファイルのリストが精選された。29プロファイルは、Pfam(Mistry、J.ら、Pfam:The protein families database in 2021 Nucleic Acids Res.49、D412~D419(2021))データベース(TM1506、LpxI_C、FdhD-NarQ、及びAICARFT_IMPCHasを除外する。これらはデアミナーゼをコードしない)からのCDAクラン(CL0109)に由来しており、17プロファイルは、Iyerら(Nucleic Acids Res.39、9473~9497頁、2011年)により定義されたデアミナーゼファミリーの多重配列アライメント(MSA)から築かれ、1つのプロファイルは、Zhangら、(Biol.Direct 7、18、2012年)に見られる多重配列アライメントから築かれた。
【0095】
一部の候補配列は、Iyerら、(2011)及びZhangら、(2012)に収載されるMSAから直接選択された。他の候補配列は、6つの異なるデータベース:UniProt、Mgnify、IMG/VR、IMG/M、廃水処理植物メタゲノム、及びGenBank(それぞれ、The UniProt Consortium.UniProt:the universal protein knowledgebase in 2021 Nucleic Acids Res.49、D480~D489(2021);Mitchell、A.L.ら、MGnify:the microbiome analysis resource in 2020 Nucleic Acids Res.48、D570~D578(2020);Paez-Espino、D.ら、IMG/VR:a database of cultured and uncultured DNA Viruses and retroviruses.Nucleic Acids Res.45、gkw1030(2017);Chen、I.M.A.ら、The IMG/M data management and analysis system v.6.0:new tools and advanced capabilities.Nucleic Acids Res. 49、D751~D763(2021);Singleton、C.M.ら、Connecting structure to function with the recovery of over 1000 high-quality metagenome-assembled genomes from activated sludge using long-read sequencing.Nat.Commun.12、2009(2021);及びDa、B.ら、GenBank.Nucleic Acids Res.41、(2013))に対する上記のプロファイルのhmmsearchヒットから選択された。
【0096】
試験されたデアミナーゼの大半が、さらに大きなタンパク質との融合物として、例えば、多形性毒素系の一部として見出された。デアミナーゼドメインの境界を確定するために、AlphaFold2(Jumper、J.ら、Highly accurate protein structure prediction with AlphaFold.Nature 1~11(2021)doi:10.1038/s41586-021-03819-2)構造予測が作成され可視化された。N終端切詰め部位は一般には、デアミナーゼドメインのヘリックス1前のいくつかのアミノ酸で選択された。
【0097】
便宜上、それぞれのスクリーニングされた配列は短い名前が付けられた。名前は恣意的であるが、その配列のデータベース又は起源の種にどういうわけか関係している。Da=デアミナーゼ、MGYP=Mgnifyタンパク質、Hm=ホットメタゲノム、VR=IMG/VR、WWTP=廃水処理植物、キメラ=キメラ配列、Anc=先祖配列再構築。他の接頭辞は大部分が、メタゲノムデータの供給源生物又は供給源環境の名称から得られる2文字又は3文字である。一部の配列は、形態extN#、extC#、d#、Cd#の接頭辞又は接尾辞も有しており、これは、名称が添付されていない候補と比べて、それぞれ残基の指示された数のN終端伸長、C終端伸長、N終端欠失、及びC終端欠失を示す。
【0098】
アミノ酸配列アライメントはすべてグローバルペアモードを使用するMAFFT(v7.490)(Katoh、K.&Standley、D.M.MAFFT Multiple Sequence Alignment Software Version 7:Improvements in Performance and Usability.Mol.Biol.Evol.30、772~780頁(2013))を使用して計算された。系図は、raxml-ng(v.1.1)(Kozlov、A.M.、Darriba、D.Flouri、T.Morel、B.&Stamatakis、A.RAxML-NG:a fast、scalable and user-friendly tool for maximum likelihood phylogenetic inference.Bioinformatics 35、4453~4455頁(2019))を使用して作成された。先祖配列再構築は、raxml-ng(v.1.1)を使用して系統樹から構築された。
【0099】
[実施例14] 要約表
29のデアミナーゼについてのアッセイ結果は下の表1に示されており、そこではAPOBEC3A(一本鎖DNAデアミナーゼ)は負の対照としての働きをする。表中のその他の28のデアミナーゼ(二本鎖DNAデアミナーゼ)はすべて二本鎖DNA基質に対して有意な活性を有する。
【0100】
本明細書に開示される二本鎖DNAデアミナーゼは、例えば、下の表2に示される応用を含む、数多くの方法、工程、及びワークフローで使用しうる。脱アミノ化産物は、1つ以上の修飾されたシトシンを含有することがあり、例えば、そこでは、基質dsDNAはそのような修飾されたシトシンを含んでいたのであり、作動的デアミナーゼはそのような修飾されたシトシンを脱アミノ化しない又は不十分にしか脱アミノ化しない。収載された方法/応用のそれぞれが、(a)(i)脱アミノ化産物を配列決定する、及び/又は(ii)脱アミノ化産物を増幅して(例えば、PCRにより)、増幅産物を作製し、増幅産物を配列決定して、(a)(i)及び(a)(ii)のそれぞれにおいて、シーケンスリードを作製するステップ、並びに(b)任意選択的にシーケンスリードからdsDNA基質において修飾されたシトシンの種類及び/又は位置を判定するステップをさらに含みうる。
【0101】
100を超えるデアミナーゼについてのスクリーニング結果は下の表3に示されており、そこではAPOBEC3A(一本鎖DNAデアミナーゼ)は負の対照としての働きをする。多くが、試験された条件下で二本鎖DNAデアミナーゼ活性を有することが観察された。試験された酵素の関連性は、図1に図示されており、この観点では、試験された特定の条件で限られた又は中程度の活性を示したデアミナーゼは、代替の又は最適化された条件下ではより高度な活性を有しうる。
【0102】
本明細書で開示されるある特定の二本鎖DNAデアミナーゼの名称及び配列番号は、2022年11月24日提出の米国特許仮出願第63/264,513号に含まれる対応する名称と一緒に表4に示されている。
【0103】
【表2】
【0104】
【表3】
【0105】
【表4】
【0106】
【表5】
図1
図2A
図2B
図2C
図3A
図3B
図3C
図3D
図4A
図4B
図4C
図5A
図5B
図6A
図6B
図7A
図7B
図8A
図8B
図9A
図9B
図10
図11A
図11B
【配列表】
2024543137000001.xml
【国際調査報告】