(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-08
(45)【発行日】2024-10-17
(54)【発明の名称】デュアルインデックス付きメチル-SEQライブラリーの調製方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20241009BHJP
【FI】
C12Q1/6869 Z
(21)【出願番号】P 2022517788
(86)(22)【出願日】2020-09-29
(86)【国際出願番号】 US2020053284
(87)【国際公開番号】W WO2021067275
(87)【国際公開日】2021-04-08
【審査請求日】2023-04-03
(32)【優先日】2019-09-30
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】505092968
【氏名又は名称】インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド
(74)【代理人】
【識別番号】100118902
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100196243
【氏名又は名称】運 敬太
(72)【発明者】
【氏名】ダス・チャクラバルティー,ウシャティ
(72)【発明者】
【氏名】ファン,シャオ-ユン
(72)【発明者】
【氏名】ツェン,ユー
(72)【発明者】
【氏名】ライ,ケビン
【審査官】大西 隆史
(56)【参考文献】
【文献】国際公開第2018/140695(WO,A1)
【文献】特表2019-504645(JP,A)
【文献】米国特許出願公開第2014/0329697(US,A1)
【文献】URICH, Mark A. et al.,Nature Protocols,2015年02月18日,Vol. 10,pp. 475-483,DOI: 10.1038/nprot.2014.114.
【文献】RAINE, Amanda et al.,Nucleic Acids Research,2017年04月07日,Vol. 45, Issue 6, Article No. e36,DOI: 10.1093/nar/gkw1110
【文献】SCHUMACHER, Cassie et al.,Nature Methods,2015年10月29日,Vol. 12,pp. v-vi,DOI: 10.1038/nmeth.f.386
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00- 3/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
PubMed
(57)【特許請求の範囲】
【請求項1】
二本鎖DNAのメチル化プロファイルを決定する方法であって:
a)前記
二本鎖DNAを得るステップと、
b)第1のリガーゼを用いて第1のアダプターを前記二本鎖DNAの3’末端に連結するステップであって、
前記第1のアダプターが、5’アデニル化された鎖、3’末端がブロックされた相補鎖、およびメチルデオキシシトシンを含む二本鎖アダプターである、前記ステップと、
c)第2のリガーゼを用いて第2のアダプターを前記
二本鎖DNAの5’末端に連結してアダプター-標的核酸-アダプター複合体を生成するステップであって、
前記第2のアダプターがメチルデオキシシトシンを含む、前記ステップと、
d)前記アダプター-
二本鎖DNA-アダプター複合体中の非メチル化シトシンをウラシルに変換して変換された標的を生成するステップと、
e)前記変換された標的をPCR増幅するステップと、
f)前記変換された標的をシーケンシングするステップと、
g)前記変換された標的の配列を参照配列と比較して前記
二本鎖DNAの前記メチル化プロファイルを決定するステップ、
を含み、
ステップa)からg)を順番に実施し、
ここで、前記第1のアダプターおよび/または前記第2のアダプターが固有の分子識別子(UMI)配列を含む、
前記方法。
【請求項2】
前記
二本鎖DNAが全ゲノムDNA、
細胞外DNA(cfDNA)または
ホルマリン固定パラフィン包埋DNA(FFPE DNA)である、請求項
1に記載の方法。
【請求項3】
前記第1のリガーゼがT4 DNAリガーゼである、請求項
1または2に記載の方法。
【請求項4】
前記T4 DNAリガーゼが変異体リガーゼである、請求項
3に記載の方法。
【請求項5】
前記変異体リガーゼがK159でのアミノ酸置換を含有する、請求項
4に記載の方法。
【請求項6】
前記の非メチル化シトシンをウラシルに変換するステップが、バイサルファイトでの処理を含む、請求項
1~5のいずれか1項に記載の方法。
【請求項7】
前記の非メチル化シトシンをウラシルに変換するステップが、シチジンデアミナーゼでの処理を含む、請求項
1~5のいずれか1項に記載の方法。
【請求項8】
前記アダプターがユニバーサルプライミング部位を含む、請求項
1~7のいずれか1項に記載の方法。
【請求項9】
前記アダプター-
二本鎖DNA-アダプター複合体を、ハイブリダイゼーションキャプチャーによって濃縮する、請求項
1~8のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001]本出願は、2019年9月30日出願の米国仮特許出願第62/907,778号の優先権を主張するものであり、その内容は参照によりその全体が本明細書に組み込まれる。
【0002】
[0002]本発明は、二本鎖DNA分子の配列を決定するための方法ならびに二本鎖DNA分子中のメチル化シトシンの同定およびプロファイリングのための方法に関する。本発明は、全ゲノムシーケンシング、ターゲットリシーケンシング(targeted resequencing)、シーケンシングベースのスクリーニングアッセイ、メタゲノミクス、またはNGS用のサンプル調製を必要とする他の任意の用途のための、デュプレックスコンセンサス対応(duplex consensus enabled)次世代シーケンシング(NGS)メチル-seqライブラリーを構築するための方法にも関する。
【背景技術】
【0003】
[0003]DNAメチル化は、遺伝子発現およびクロマチン構造の制御に直接関係することが示唆されているエピジェネティック修飾である。エピジェネティック修飾、たとえばDNAメチル化は、哺乳動物の発育、たとえば胚発育における役割を担い、クロマチン構造およびクロマチンの安定性に関与する。異常なDNAメチル化は、がんを含むいくつかの疾患プロセスに関係することが示唆されている。加えて、メチル化可変領域および/またはアレル特異的なメチル化の特定のパターンは、非侵襲診断用の分子マーカーとして使用され得る。重要なことに、メチル化にフォーカスした全ゲノムディープシーケンシングは、ヘミメチル化、すなわちDNAデュプレックスのうちの一方の鎖のみにおけるメチル化、を含むがんメチロームが非常に複雑であることを明らかにした。ゲノム全体、または循環する細胞外DNA全体のDNAメチル化状態の解析は興味深い可能性がある。
【0004】
[0004]DNAメチル化をプロファイリングするための方法は、バイサルファイト変換シーケンシングに依拠する。バイサルファイト処理は、非メチル化シトシン残基をウラシルに変換する。サンガーシーケンシングまたは現行のNGS法によりシーケンシングされると、ウラシル残基はチミンとして可視化される。一方、メチルシトシンはバイサルファイト処理によるウラシルへの変換から保護される。サンガーシーケンシングまたは現行のNGS法によりシーケンシングされると、メチルシトシンはシトシンとして可視化される。バイサルファイト変換または酵素変換の後に、配列を修飾されていない参照配列と比較することによって、個々のシトシン残基の変換状態を推測することができる。
【0005】
[0005]しかし、現行の方法は、多くの場合、ライブラリー調製および/またはシーケンシング中に、増幅またはシーケンシングのアーティファクトを導入する。これらのエラーは、DNAメチル化解析の結果に悪い影響を及ぼし得る。加えて、現在の方法では、使用者は、データ解析中に固有の分子識別子(UMI)を使用することができず、ヘミメチル化、フルメチル化および非メチル化イベントを区別することができない。現行の方法は、アダプターを付ける前の、非メチル化シトシンのウラシルへの変換に依拠する。変換はアダプターの付加の前に起こるため、ヘミメチル化イベントを区別することは不可能である。現行の方法は、全ゲノムメチル化プロファイリングにも、ターゲットシーケンシングメチル化プロファイリングにも対応していない。
【発明の概要】
【0006】
したがって、当分野では、メチル化が遺伝子発現にとって決定的である領域に対する網羅的なターゲットキャプチャーシステムを実現する方法が必要とされている。加えて、当分野では、一塩基分解能でのメチル化状態の正確な検出、ならびにフルメチル化およびヘミメチル化DNAの検出を可能にする方法および組成物が必要とされている。
【0007】
[0006]本明細書で開示されるのは、メチル化プロファイリングのためのデュアルインデックス核酸ライブラリーを調製するための方法および組成物である。さらに、本明細書で開示される方法および組成物は、非メチル化シトシンのバイサルファイト変換または酵素変換のいずれかに依拠し得る。種々の実施形態では、開示された方法および組成物は、標的配列中に存在する非メチル化シトシンのバイサルファイト処理または酵素変換の前に、標的核酸をUMIでタグ付けするための2段階タグ付けプロセスを使用する。タグ付けプロセスは、単一のUMIを1本の鎖に付加してもよく、またはUMIを標的核酸の各鎖に付加してもよい。タグ付け法の後に、標的核酸をバイサルファイト処理また酵素的に処理して非メチル化シトシンをウラシルに変換する。UMIは、個々のDNA分子を識別するために、および増幅またはシーケンシングにより導入されたアーティファクトを低下させ、DNAメチル化解析の正確性を向上させるために使用される。加えて、バイサルファイト処理または酵素変換の前に各鎖をUMIで個別にタグ付けすることにより、ヘミメチル化イベント、フルメチル化および非メチル化イベントを直接比較するためのエラーの修正が可能になる。
【0008】
[0007]一実施形態(
図1A)では、全ゲノムメチル-seqライブラリー構築のためのワークフローが提供される。鎖特異的な分子識別子(固有の分子識別子、UMI)が、平滑ライゲーションとその後に続くギャップ充填(gap-fill)ライゲーション反応により生物学的な鋳型に付けられる。第1のステップでは、断片化されたgDNA、FFPE DNA、またはせん断されていないcfDNAが、遊離の3’OH末端を伴う平滑化された5’リン酸化インサートを生じる末端修復反応にかけられる。末端修復後、T4 DNAリガーゼを使用して、平滑ライゲーションにより、第1のシーケンシングアダプター(たとえばIlluminaプラットフォームのP7)がインサートDNAの3’末端に付けられるが、アダプターの一方の鎖はライゲーションを容易にするために5’アデニル化されている一方で、相補鎖は、ライゲーションを防ぐためにジデオキシ-A、ジデオキシ-T、ジデオキシ-CまたはジデオキシGで3’末端においてブロックされている(
図1Aおよび1B)。アダプター中のdC塩基は、メチル-dCに変えられ、下流のバイサルファイト処理/シトシンのウラシルへの酵素変換中、その本来の同一性を保持する。次いで、アダプター分子の3’末端をインサートのリン酸化5’末端に連結するギャップ充填ライゲーション反応により、第2のシーケンシングアダプターが生物学的インサートの5’末端に付けられる。アダプター中のdC塩基の本来の同一性が、下流のバイサルファイト処理/酵素変換中に保持されるように、アダプター中のdC塩基はメチル-dCに変えられる。ギャップ充填ライゲーション中に、相補的なUMI塩基が、TaqITポリメラーゼならびにdATP、dTTP、dGTPおよびメチル-dCTPを含むdNTP混合物を使用して重合される。第2のライゲーション後、バイサルファイト処理または酵素処理により、非メチル化シトシンはウラシルに変換される。次いで、サンプルにバーコードを付加するために、新規に構築されたライブラリーの分子を、ウラシル適合型のDNAポリメラーゼ(uracil compatible DNA polymerase)を用いてPCR増幅させることができる。このステップ中に、インサート(標的ストランド)中のウラシルは、新規に合成される相補鎖上でチミンに変換される(重合される)。得られたライブラリーは、適切なシーケンシングシステム、たとえば、限定はされないが、Illuminaプラットフォーム上での全ゲノムバイサルファイトシーケンシング(WGBS)にいつでも使用することができる。
【0009】
[0008]代替の実施形態(
図1B)では、標的メチル-seqライブラリー構築のためのワークフローが提供される。鎖特異的な分子識別子(固有の分子識別子、UMI)は、平滑ライゲーションとその後に続くギャップ充填ライゲーション反応により生物学的な鋳型に付けられる。第1のステップでは、断片化されたgDNA、FFPE DNA、またはせん断されていないcfDNAが、遊離の3’OH末端を伴う平滑化された5’リン酸化インサートを生じる末端修復反応にかけられる。末端修復後、T4 DNAリガーゼを使用して、平滑ライゲーションにより、第1のシーケンシングアダプター(たとえばIlluminaプラットフォームのP7)がインサートDNAの3’末端に付けられるが、アダプターの一方の鎖はライゲーションを容易にするために5’アデニル化されている一方で、相補鎖は、ライゲーションを防ぐためにジデオキシ-A、T、CまたはGで3’末端においてブロックされている(
図1Aおよび1B)。アダプター中のdC塩基の本来の同一性が、下流のバイサルファイト処理/酵素変換中に保持されるように、アダプター中のdC塩基はメチル-dCに変えられる。次いで、アダプター分子の3’末端をインサートのリン酸化5’末端に連結するギャップ充填ライゲーション反応により、第2のシーケンシングアダプターが生物学的インサートの5’末端に付けられる。アダプター中のdC塩基の本来の同一性が、下流のバイサルファイト処理/酵素変換中に保持されるように、アダプター中のdC塩基はメチル-dCに変えられる。ギャップ充填ライゲーション中に、相補的なUMI塩基を、dATP、dTTP、dGTPおよびメチル-dCTPを含むdNTP混合物を使用して、TaqITポリメラーゼにより重合させる。ゲノム中の目的の標的領域を、ビオチン化プローブのカスタムパネルを使用して、ハイブリダイゼーションキャプチャーにより濃縮させる。標的の濃縮後に、非メチル化シトシンが、バイサルファイトまたは酵素処理によりウラシルに変換される。次いで、サンプルにバーコードを付加するために、キャプチャーライブラリー分子を、ウラシル適合型のDNAポリメラーゼを用いてPCR増幅させることができる。このステップ中に、インサート(標的ストランド)中のウラシルは、新規に合成される相補鎖上でチミンに変換される(重合される)。得られたライブラリーは、適切なシーケンシングプラットフォーム、たとえば、限定はされないが、Illuminaプラットフォーム上でのターゲットシーケンシングにいつでも使用することができる。
【図面の簡単な説明】
【0010】
【
図1A】[0009]全ゲノムメチル-seqライブラリー構築のワークフローを示す図である。
【
図1B】[0010]標的メチル-seqライブラリー構築のワークフローを示す図である。
【
図2】[0011]メチル-dCTPが、dCTPと比べた場合に類似の効率で取り込まれ得ることを実証する図である。
【
図3】[0012]
図3A、3B、3Cは、全ゲノムバイサルファイトシーケンシングによるメチル化の検出を実証する図である。
【
図4】[0013]
図4A、4B、4Cは、酵素変換法を使用して非メチル化シトシンをウラシルに変換した場合のメチル化状態の検出を実証する図である。
【
図5】[0014]
図5A、5B、5Cは、ターゲットシーケンシング法を使用するメチル化状態の検出を実証する図である。
【
図6】[0015]
図6A、6Bは、ハイブリダイゼーションキャプチャー法のためのプローブデザイン、ならびに100ngおよび250ngの投入量での対応するキャプチャーを実証する図である。
【
図7A】[0016]正確なメチル化レベルが、10ngの少量の投入サンプルからバイアスの低下を伴って同定されることを実証する図である。
【
図7B】正確なメチル化レベルが、10ngの少量の投入サンプルからバイアスの低下を伴って同定されることを実証する図である。
【
図8A】[0017]健常サンプルおよび疾患サンプルから単離された、少量の投入cfDNAを使用するWGBSを実証する図である。
【
図8B】健常サンプルおよび疾患サンプルから単離された、少量の投入cfDNAを使用するWGBSを実証する図である。
【
図8C】健常サンプルおよび疾患サンプルから単離された、少量の投入cfDNAを使用するWGBSを実証する図である。
【
図9A】[0018]標準的なタイリングまたは2×タイリングを用いたカスタムエピジェネティクスパネルを使用する標的メチル-seqを実証する図である。
【
図9B】標準的なタイリングまたは2×タイリングを用いたカスタムエピジェネティクスパネルを使用する標的メチル-seqを実証する図である。
【
図9C】標準的なタイリングまたは2×タイリングを用いたカスタムエピジェネティクスパネルを使用する標的メチル-seqを実証する図である。
【
図9D】標準的なタイリングまたは2×タイリングを用いたカスタムエピジェネティクスパネルを使用する標的メチル-seqを実証する図である。
【発明を実施するための形態】
【0011】
[0019]本明細書で開示される方法および組成物は、メチル-seq次世代シーケンシングライブラリーを調製するための組成物および方法を提供する。本明細書で開示されるのは、メチル化プロファイリングのためのインデックス付き核酸ライブラリーを調製する方法である。標的核酸の非メチル化シトシンは、バイサルファイト変換またはシチジンデアミナーゼのいずれかを用いてウラシルに変換される。種々の実施形態では、方法は標的核酸を固有の分子識別子(UMI)でタグ付けするために2段階のプロセスを使用し、そこでは第1のUMIが、標的核酸の3’末端に連結される。任意に、第2のUMIが標的核酸の5’末端に付加すなわち連結されてもよい。アダプターの標的核酸への付加後、タグ付けされた核酸は化学的または酵素的に処理されて、非メチル化シトシンがウラシルに変換される。UMIの使用およびUMI付加後の変換は、シーケンシングおよび/または増幅により誘導されるアーティファクトを低減または実質的に取り除き、メチル化解析の正確性を向上させる。加えて、アダプター付加後の非メチル化シトシンのウラシルへの変換は、フルメチル化(すなわち、標的核酸の両方の鎖におけるメチル化イベント)、ヘミメチル化(すなわち、二本鎖標的核酸のうちの一方の鎖において起こるメチル化)または非メチル化標的核酸を識別するために使用することができる。本発明のこれらおよび他の利点ならびにさらなる発明の特徴が、本明細書で提供される本発明についての記載から明らかになるであろう。
【0012】
[0020]一実施形態では、標的核酸のメチル化プロファイルを決定する方法が提供される。方法は、a)標的核酸を得るステップと、b)第1のリガーゼを用いて第1のアダプターを標的核酸の3’末端に連結するステップと、c)第2のリガーゼを用いて第2のアダプターを標的核酸の5’末端に連結してアダプター-標的核酸-アダプター複合体を生成するステップと、d)アダプター-標的核酸-アダプター複合体中の非メチル化シトシンをウラシルに変換して変換された標的を生成するステップと、e)任意で、変換された標的をPCR増幅するステップと、f)変換された標的をシーケンシングするステップと、g)変換された標的の配列を参照配列と比較して標的核酸のメチル化プロファイルを決定するステップを含む。
【0013】
[0021]さらなる実施形態では、標的核酸分子はDNAである。さらなる実施形態では、DNAは全ゲノムDNA、細胞外DNA(cfDNA)、またはホルマリン固定パラフィン包埋DNA(FFPE DNA)である。
【0014】
[0022]別の実施形態では、第1のリガーゼはT4 DNAリガーゼである。さらなる実施形態では、T4 DNAリガーゼは変異体リガーゼである。別の実施形態では、変異体リガーゼはK159でのアミノ酸置換を含有する。別の実施形態で、変異体リガーゼはアミノ酸置換を含有し、K159S変異体である。
【0015】
[0023]別の実施形態では、第1のアダプターまたは第2のアダプターは固有の分子識別子配列を含有する。別の実施形態では、第1のアダプターおよび第2のアダプターは共に固有の分子識別子配列を含有する。
【0016】
[0024]一実施形態では、非メチル化シトシンのウラシルへの変換はバイサルファイト処理で実施される。別の実施形態では、非メチル化シトシンのウラシルへの変換はシチジンデアミナーゼを用いて実施される。
【0017】
[0025]別の実施形態では、アダプターはユニバーサルプライミング部位を含む。別の実施形態では、アダプター-標的核酸-アダプター複合体を形成するためのアダプターのライゲーション後に、複合体はハイブリダイゼーションキャプチャーによって濃縮される。前記アダプター-標的核酸-アダプター複合体を、ハイブリダイゼーションキャプチャーによって濃縮する、請求項1に記載の方法。
【0018】
[0026]一実施形態では、核酸の集団におけるメチル化シトシンを識別するための方法が提供される。さらなる実施形態では、核酸はDNAであり、加えてDNAは二本鎖である。一実施形態では、本発明の方法は、全ゲノム、cfDNA、ctDNAまたはFFPE DNAのメチル化パターンをプロファイリングするために使用される。記載される実施形態における方法は、配列の忠実度を保証し、シーケンシングデータの質を向上させる。記載される実施形態における方法は、シーケンシングおよび二本鎖DNAの各鎖を識別するステップを含んでもよい。加えて、記載される実施形態における方法は、フルメチル化およびヘミメチル化標的核酸の同定を可能し、標的核酸におけるフルメチル化、ヘミメチル化および非メチル化イベント間の区別を可能にする。
【0019】
[0027]さらに、本発明は、ライブラリーの生成およびメチル化標的核酸のシーケンシングを実現し、そこで使用されるアダプターはバーコードが付けられるか、または固有の分子識別子を含有する。UMIの使用は、二本鎖の標的核酸のうちのいずれかの鎖を追跡することを可能にする、すなわち、UMIは元の標的核酸のセンス鎖またはアンチセンス鎖を追跡することを可能にする。一実施形態では、UMIはランダムである。別の実施形態では、UMIは合理的または知的にデザインされる、すなわち、UMIは、バーコードが既知の配列になるようにデザインされる。核酸の組成の違いに起因する、異なる標的の非対称な増幅(asymmetric amplification)である増幅バイアスを低下させるために、UMIを使用することができる。UMIは、ライブラリー調製中または増幅中に生じる核酸変異と、非メチル化シトシンのウラシルへのバイサルファイト変換または酵素変換によって誘導される変異を見分けるために使用することができる。いくつかの実施形態では、UMIは2、3、4、5、6、7、8、9、10、11、12、13、14、15、16,17、18、19または20ヌクレオチドよりも大きくてもよい。
【0020】
[0028]別の実施形態では、サンプルインデックスまたはサンプルIDタグがアダプターに組み込まれてもよい。サンプルインデックスは、2~18、3~18、4~18、5~18、6~18、7~18または8~18ヌクレオチド長の任意の適した長さであってもよい。サンプルIDタグは、少なくとも2、少なくとも4、少なくとも256、少なくとも1024、少なくとも4096、または少なくとも16,384またはそれより多い個々のサンプルを識別するのに必要な任意の長さであってもよい。
【0021】
[0029]別の実施形態では、ユニバーサルプライミング部位がアダプター内に組み込まれてもよい。ユニバーサルプライミング部位は、タグ付けされたサンプルの増幅を可能にする。サンプルは、UMIによって、サンプルIDによって、またはUMIもしくはサンプルIDの組み合わせによってタグ付けされてもよい。
【0022】
[0030]別の実施形態では、非メチル化シトシンのウラシルへの変換は、バイサルファイト処理または酵素処理で達成することができる。いくつかの実施形態では、酵素処理はシチジンデアミナーゼ酵素を用いてであってもよい。さらなる実施形態では、シチジンデアミナーゼはAPOBECであってもよい。いくつかの実施形態では、シチジンデアミナーゼは、活性化誘導性シチジンデアミナーゼ(AID)およびアポリポタンパク質B mRNA編集酵素触媒ポリペプチド様(APOBEC)を含む。いくつかの実施形態では、APOBEC酵素は、APOBEC-1(Apo1)、APOBEC-2(Apo2)、AID、APOBEC-3A、-3B、-3C、-3DE、-3F、-3G、-3HおよびAPOBEC-4(Apo4)からなるヒトAPOBECファミリーから選択される。いくつかの実施形態では、変換は、バイサルファイト変換によってであろうが酵素変換によってであろうが、市販のキットを使用する。一例では、キット、たとえば、EZ DNA Methylation-Gold、EX DNA Methylation-DirectまたはEZ DNA Methylation-Lighting kit(ZYmo Research Corp (Irvine, California.)より入手可能)が使用される。別の例では、キット、たとえばAPOBEC-Seq (NEBiolabs)が使用される。
【0023】
[0031]別の実施形態では、アダプターは、非メチル化シトシンのウラシルへの変換前に付加される。さらなる実施形態では、アダプターはUMIを含有する。非メチル化シトシンのウラシルへの変換前にアダプターを付加することは、個々の鎖の追跡を可能にし、フルメチル化またはヘミメチル化イベントの検出およびプロファイリングを可能にする。
【0024】
[0032]別の実施形態では、アダプターは非メチル化シトシンを含有する。さらに別の実施形態では、アダプターは非メチル化およびメチル化シトシンを含有してもよい。さらなる実施形態では、アダプターはもっぱらメチル化シトシンだけを含有してもよい。アダプター中のdC塩基は、メチル-dCに変えられ、下流のバイサルファイト処理/シトシンのウラシルへの酵素変換中、その本来の同一性を保持する。
【0025】
[0033]本発明は、二本鎖標的核酸の集団におけるメチル化シトシンを同定するための方法に関する。二本鎖標的核酸はDNAであってもよい。さらなる実施形態では、DNAはゲノムDNA、せん断されたDNA、断片化されたDNA、cfDNAまたはFFPE DNAであってもよい。いくつかの実施形態では、DNAは末端修復されてAテール化されてもよく、または末端修復されて平滑化されてもよい。いくつかの実施形態では、DNAは、疾患または障害の検出、診断またはスクリーニングのための生物学的サンプルから単離される。特定の実施形態では、生物学的サンプルは組織または腫瘍細胞であってもよい。
【0026】
[0034]
図1Aは、全ゲノムシーケンシングに適したメチル-seqライブラリーの調製についての例を例示する。ステップ1では、標的核酸は末端修復されて平滑末端が導入される。得られた末端修復され平滑末端化された分子は、遊離の3’OH末端を伴う5’リン酸化末端を有する。ステップ2では、一方の末端上でブロックされたデュプレックスアダプターを備えたアダプター1が、標的核酸の3’末端に連結される。たとえば、第1のシーケンシングアダプターはP7 Illuminaプラットフォーム配列を含有してもよい。一実施形態では、アダプター1を連結するために使用されるリガーゼは、T4 DNAリガーゼである。別の実施形態では、アダプター1を連結するために使用されるリガーゼは、変異体T4 DNAリガーゼである。特定の実施形態では、変異体T4 DNAリガーゼはK159でのアミノ酸置換を含有し、一方他の実施形態では、変異体T4 DNAリガーゼはK159Sアミノ酸置換を含有する。ステップ3では、アダプター2はギャップ充填およびライゲーションの手順により付加される。ステップ3では、アダプター分子の3’末端を標的核酸のリン酸化5’末端に連結するギャップ充填ライゲーション反応により、第2のシーケンスアダプターが標的核酸の5’末端に付けられる。ギャップ充填ライゲーション中に、dATP、dTTP、dGTPおよびメチル-dCTPを含むdNTP混合物を使用して、相補的なUMI塩基がTaqITポリメラーゼにより充填される、すなわち重合される。ステップ4では、非メチル化シトシンがウラシルに変換される。バイサルファイト処理または酵素処理が、非メチル化シトシンをウラシルに変換するために使用されてもよい。ステップ5は任意のPCRステップである。この任意のPCRステップは、加えて、ウラシル適合型のDNAポリメラーゼを使用してもよい。任意のPCRが、残りのアダプター配列、サンプルインデックスまたはNGSに必要なNGSプラットフォーム特異的な配列を付加するために使用されてもよい。いくつかの実施形態では、NGSに必要とされる完全なアダプター配列が、2段階ライゲーションプロセスにより付加される。アダプターが付加された標的核酸(adapted target nucleic acid)および任意でPCR増幅されたアダプター標的核酸またはライブラリーは、メチル化プロファイリングおよび適切なシーケンシング機器上でのシーケンシングにいつでも使用することができる。いくつかの実施形態では、NGSに必要とされる完全なアダプター配列が2段階ライゲーションプロセスにより付加され、任意のPCRは必要ない。
【0027】
[0035]
図1Bは、メチル-seqライブラリーを調製するための方法およびハイブリダイゼーションキャプチャー、すなわち特定の標的領域に対して濃縮するための濃縮を例示する。ステップ1では、標的核酸が末端修復されて核酸の末端が平滑化される。得られた末端修復され平滑末端化された分子は、遊離の3’-OH末端を伴う5’リン酸化末端を有する。ステップ2では、一方の末端上でブロックされたデュプレックスアダプターを備えたアダプター1が、標的核酸の3’末端に連結される。たとえば、第1のシーケンシングアダプターはP7 Illuminaプラットフォーム配列を含有してもよい。一実施形態では、アダプター1を連結するために使用されるリガーゼは、T4 DNAリガーゼである。別の実施形態ではアダプター1を連結するために使用されるリガーゼは変異体T4 DNAリガーゼであり、一方特定の実施形態では変異体T4 DNAリガーゼはK159Sアミノ酸置換を含有する。特定の実施形態では、変異体T4 DNAリガーゼはK159でのアミノ酸置換を含有する。ステップ3ではアダプター2は、ギャップ充填およびライゲーションの手順により付加される。ステップ3では、アダプター分子の3’末端を標的核酸のリン酸化5’末端に連結するギャップ充填ライゲーション反応により、第2のシーケンスアダプターが標的核酸の5’末端に付けられる。ギャップ充填ライゲーション中に、dATP、dTTP、dGTPおよびメチル-dCTPを含むdNTP混合物を使用して、相補的なUMI塩基がTaqITポリメラーゼにより充填される、すなわち重合される。ステップ4では、アダプターが付加された標的配列が、二本鎖DNAに対するパネルを用いたハイブリダイゼーションキャプチャーを使用して濃縮される。ステップ5では、非メチル化シトシンがウラシルに変換される。バイサルファイト処理または酵素処理が、非メチル化シトシンをウラシルに変換するために使用されてもよい。ステップ6は任意のPCRである。この任意のPCRステップは、加えて、ウラシル適合型のDNAポリメラーゼを使用してもよい。任意のPCRが、残りのアダプター配列、サンプルインデックスまたはNGSに必要なNGSプラットフォーム特異的な配列を付加するために使用されてもよい。いくつかの実施形態では、NGSに必要とされる完全なアダプター配列が、2段階ライゲーションプロセスにより付加される。アダプターが付加された標的核酸および任意でPCR増幅されたアダプター標的核酸またはライブラリーは、メチル化プロファイリングおよび適切なシーケンシング機器上でのシーケンシングにいつでも使用することができる。いくつかの実施形態では、NGSに必要とされる完全なアダプター配列が2段階ライゲーションプロセスにより付加され、任意のPCRは必要ない。
【0028】
[0036]
図2は、TaqITポリメラーゼが、dCTPまたはメチル-dCTPの取り込みに対して類似の取り込み効率を有することを実証する。UMI中のdGは、dCまたはメチル-dCが、ギャップ充填プロセス中に反対の鎖上に取り込まれることになるということを示す。250ngの117bpのgBlockが、ライゲーション効率をテストするためのインサートとして使用された。UMI配列中にdGを有するアダプター、UMI配列中にdGを有さないアダプター、UMI配列中にdGを有するメチル化アダプター、UMI配列中にdGを有さないメチル化アダプターの4タイプのアダプターが検討された。ギャップ充填/ライゲーションのステップ(
図1A、ステップ3)では、メチル-dCTP、dATP、dTTPおよびdGTPを含む緩衝液が、TaqITによるメチル-dCTPの取り込み効率をテストするために使用された。dNTPを含む緩衝液(緩衝液中のdCTPとして示される)が、対照として使用された。
【0029】
[0037]一実施形態では、標的の濃縮が実施される。特定の実施形態では、アンプリコンベースの濃縮が使用されてもよい。特定の実施形態では、ハイブリダイゼーションキャプチャー濃縮が使用されてもよい。別の実施形態では、二本鎖キャプチャーのための2×交互パネルデザイン(alternating panel design)が使用される。(
図6Aまたは9Aを参照のこと)
【実施例】
【0030】
[0038]実施例における要素および行為は、単純化のために本発明を例示することを意図しており、必ずしもいずれかの特定の順序または実施形態にしたがって示されているのではない。実施例は、発明者らが本発明を所有していたことを確立することもまた意図している。
【0031】
実施例1
[0039]全ゲノムメチル-seqライブラリーの構築
[0040]標的DNAを末端修復し、平滑ライゲーション用に調製する。5’アデニル化およびメチル化アダプターを標的インサートの3’末端に付けるために、変異体DNAリガーゼを使用する。5’アダプターの相補部分を、ライゲーションを防ぐためにブロックする。アダプター2を付けるためにギャップ充填ライゲーションを使用し、相補的なUMI塩基を、dATP、dTTP、dGTPおよびメチル-dCTPを含有するdNTP混合物を使用してTaqITにより充填する。標的核酸中の非メチル化シトシンを、バイサルファイト処理または酵素処理によってウラシルに変換する。UMIがタグ付けされた標的配列のPCR増幅を使用して、固有のデュアルインデックスを導入する。
【0032】
[0041]
図1Aは、UMIアダプターを標的核酸に付加するために使用されるワークフローの一実施例、非メチル化シトシンの変換、ならびに固有のデュアルインデックスおよび適切なNGSプラットフォーム特異的なアダプター配列を付加するためのPCR増幅を実証する。次いで、調製された標的配列を、適切なNGSプラットフォーム上でシーケンシングする。シーケンシング後に、配列を参照配列と比較してメチル化プロファイルを決定する。
【0033】
[0042]1~250ngの断片化されたDNAを、T4ポリヌクレオチドキナーゼおよびT4 DNAポリメラーゼを使用して、20℃で30分間、末端修復反応にかける。末端修復後、第1のシーケンシングアダプター(IlluminaプラットフォームのP7)を、変異体T4 DNAリガーゼK159Sを使用して、20℃で15分間の平滑ライゲーションによりインサートDNAの3’末端に付ける。次いで、変異体リガーゼを、65℃で15分間、熱失活させる。次いで、第2のシーケンシングアダプターを、65℃で30分間のギャップ充填ライゲーション反応により生物学的インサートの5’末端に付ける。ギャップ充填ライゲーション中に、dATP、dTTP、dGTPおよびメチル-dCTPを含むdNTP混合物を使用して、TaqITにより相補的なUMI塩基を重合させる(充填する)。Taqリガーゼを、インサートとTaqITで伸長させたアダプターの間のニックを連結するために使用する。第2のライゲーション後、メーカーのプロトコールを使用して、バイサルファイト反応または酵素処理により、非メチル化シトシンをウラシルに変換する。次いで、サンプルにバーコードを付加するために、新規に構築されたライブラリーの分子を、ウラシル適合型のDNAポリメラーゼを用いてPCR増幅させることができる。得られたライブラリーは、Illuminaプラットフォーム上での全ゲノムバイサルファイトシーケンシングにいつでも使用することができる。
【0034】
【0035】
[0044]表1は、せん断されたヒトゲノムDNA(NA12878)から、さまざまな標的核酸投入量(1~250ngの範囲の核酸投入物)で調製された、WGBSライブラリーを示す。非メチル化シトシンは、EZ DNA methylation-Gold kit(Zymo)(バイサルファイト変換法)またはNEBNext(登録商標)Enzymatic Methyl-seq Conversion Module(NEB)(酵素変換法)によって変換した。PCRサイクルは、Illuminaシーケンシングに十分なライブラリー収量を実現するように最適化した。表1は、十分なライブラリー収量および平均ライブラリーサイズが1ng~250ngの投入核酸量で十分であることを示す。加えて、表1は、適切なライブラリーサイズ(塩基対(bp)において測定される)が得られることを実証する。
【0036】
実施例2
[0045]標的メチル-seqライブラリーの構築
[0046]DNAを末端修復し、平滑ライゲーション用に調製する。5’アデニル化およびメチル化アダプターを標的インサートの3’末端に付けるために、変異体DNAリガーゼを使用する。5’アダプターの相補部分を、ライゲーションを防ぐためにブロックする。アダプター2を付けるためにギャップ充填ライゲーションを使用し、相補的なUMI塩基を、dATP、dTTP、dGTPおよびメチル-dCTPを含有するdNTP混合物を使用してTaqITにより充填する。標的領域を、ハイブリダイゼーションキャプチャー法によりキャプチャーし、濃縮する。ハイブリダイゼーションキャプチャーパネルには、二本鎖キャプチャーのための2×交互パネルデザインを利用する(
図6を参照のこと)。ハイブリダイゼーションキャプチャー後に、標的核酸中の非メチル化シトシンを、バイサルファイト処理または酵素処理によってウラシルに変換する。UMIがタグ付けされた標的配列のPCR増幅を使用して、固有のデュアルインデックスを導入する。
【0037】
[0047]
図1Bは、UMIアダプターを標的核酸に付加するために使用されるワークフローの一実施形態、標的領域のハイブリダイゼーションキャプチャー、非メチル化シトシンの変換、ならびに固有のデュアルインデックスおよび適切なNGSプラットフォーム特異的なアダプターを付加するためのPCR増幅を実証する。次いで、調製された標的配列を、適切なNGSプラットフォーム上でシーケンシングする。
【0038】
実施例3
[0048]非メチル化シトシンのバイサルファイト変換を使用するWGBSによるメチル化の検出。
[0049]10ngのヒトゲノムDNA(EpiScope メチル化HCT116、およびNA12878)を、5%の非メチル化ラムダDNAと混合し、Covaris S2機器を使用して150bpにせん断した。EpiScope メチル化HCT116のgDNAは、CpGメチラーゼ(TaKaRa)を使用して高度にメチル化したヒトHCT116細胞から精製されたゲノムDNAである。非メチル化ラムダDNAを使用して、バイサルファイト処理の変換効率をモニターした。非メチル化シトシンを、EZ DNA methylation-Gold kit(Zymo)により変換した。ライブラリーを、IlluminaのMiSeq(2×150塩基)上でシーケンシングした。バイサルファイトシーケンシングデータを、デフォルト設定を用いてbismarkプログラムにより解析した。
【0039】
[0050]
図3Aは、99.7%のシトシンからウラシルへの変換率および約80%の固有のマッピング効率が、両サンプルタイプから得られたことを実証する。
図3Bは、メチル化HCT116のメチル化レベルが、CpG、CHHおよびCHGコンテキストにおいて、96.3%、0.8%および0.5%であることを示す。NA12878のメチル化レベルは、CpG、CHHおよびCHGコンテキストにおいて、49.5%、0.4%および0.4%である。
図3Cは、使用された16個の合理的にデザインされたUMIおよび固定配列の分布度数を示す。マッピングされていないリードはNNNNNNNNとして測定した。UMI分布のプロットは、すべての合理的にデザインされたアダプターUMIが効率的に連結することを示す。
【0040】
実施例4
[0051]非メチル化シトシンの酵素変換を使用したメチル化の検出。
[0052]10および100ngのヒトゲノムDNA(NA12878)を、1%の非メチル化ラムダDNAと混合し、Covaris S2機器を使用して150bpにせん断した。非メチル化シトシンを、NEBNext(登録商標)Enzymatic Methyl-seq Conversion Moduleによって変換した。ライブラリーを、IlluminaのMiSeq(2×150塩基)上でシーケンシングした。酵素的メチル-seqデータ(Enzymatic methyl-seq data)を、デフォルト設定を用いてbismarkプログラムにより解析した。
【0041】
[0053]
図4Aは、99.7%のシトシンからウラシルへの変換率および約81%の固有のマッピング効率が得られたことを示す。
図4Bは、NA12878のメチル化レベルが、CpG、CHHおよびCHGコンテキストにおいて、約49%、約0.4%および約0.4%であることを実証する。
図4Cは、使用された16個の合理的にデザインされたUMIおよび固定配列の分布度数を示す。マッピングされていないリードはNNNNNNNNとして測定した。UMI分布のプロットは、すべての合理的にデザインされたアダプターUMIが効率的に連結することを示す。
【0042】
実施例5
[0054]メチル化の検出および標的濃縮
[0055]標的メチル-seqライブラリーを、前記ワークフロー(
図1B)を使用して25、50、100および250ngのせん断されたヒトgDNA(NA12878)から調製し、Integrated DNA Technologies, Inc.のxGen AML panelを使用して濃縮した。非メチル化シトシンを、EZ DNA methylation-Gold kit(Zymo)を使用してウラシルに変換した。
【0043】
[0056]
図5Aは、Agilent TapeStation上で試験された、最終的に得られたライブラリーのトレースを示す。
図5Bは、250ngのメチル化HCT116およびNA12878のgDNAから調製され、IlluminaのMiSeq(2×150塩基)上でシーケンシングされた標的メチル-seqライブラリーを示す。標的メチル-seqデータを、デフォルト設定を用いてbismarkプログラムおよびPicard toolkitにより解析した。91.7~92.9%の、標的領域上の選択された塩基、および36~188×の平均標的カバレッジが得られ、これは標的領域内で起こるメチル化イベントがより高感度に同定できることを示唆する。
図5Cは、NA12878のgDNAのメチル化レベルが、CpG、CHHおよびCHGコンテキストにおいて、約58%、約0.3%および約0.3%であることを示す。
【0044】
実施例6
[0057]ライブラリーを、10ngの、0、5、10、25、50、100%のメチル化(EpigenDx)を有するメチル化対照から、実施例1に記載の通りに生成した。非メチル化シトシンを、EZ DNA methylation-Gold kit(Zymo)により変換した。ライブラリーを、IlluminaのNextSeq(2×150塩基)上でシーケンシングした。
【0045】
[0058]Bismark(v0.22.3)およびPicard(v2.18.9)を使用してアラインメントおよびメチル化の解析を実施し、モチーフの発見のためのHomer(Hypergeometric Optimization of Motif EnRichement)を使用して、ゲノムの特徴を注釈付けした。
図7Aは、予想されたメチル化レベルと観測されたメチル化レベルの間の高い相関を示す。
図7Bは、36Mリードまでのシーケンシング後のHomerの使用による、転写調節領域を含む広範なゲノムの特徴を明らかにする。
図7Bは、Y軸上に同定されたCpG部位の数、X軸上に注釈付けされたモチーフ/領域を示す。前記図は、前記ワークフローが、バイアスを伴うことなく/ほとんど伴うことなく、種々のメチル化レベルを有する投入物に対して、種々のゲノムの特徴をカバー/同定することができることを示す。
【0046】
実施例7
[0059]健常個体および肺がんを有する個体からの10ngのcfDNAを、実施例1に記載の通りにライブラリー調製した。非メチル化シトシンを、EZ DNA methylation-Gold kit(Zymo)により変換した。ライブラリーを、IlluminaのNextSeq(2×150塩基)上でシーケンシングした。
【0047】
[0060]アラインメントおよびメチル化の解析を、デフォルト設定でbismarkプログラムを使用して実施した。
図8Aは、記載されたメチル化ワークフローを使用したライブラリーからの代表的なエレクトロフェログラムを示す。
図8Bは、前記ワークフローが、10ngのcfDNAから1μgを超えるライブラリー収量を与えることを実証する。
図8Cは、健常サンプルとがんサンプルの両方から、約80%の固有のマッピング効率が得られたことを示す。
【0048】
実施例8
[0061]ヘミメチル化解析のための、両鎖の標的メチル-seqキャプチャー(targeted methyl-seq captures both strands)における交互デザイン。
[0062]せん断された、100ngの50%メチル化対照および100%メチル化対照(EpigenDx)から、標的メチル-seqライブラリーを前記ワークフロー(
図1B)を使用して調製し、癌遺伝子内のCpGアイランド、CpGショアおよびCpGシェルフを標的化するための2種のデザインの130kbのカスタムパネルを使用して濃縮した。第1の標準的なパネルデザインでは、我々は、エンドツーエンドアルゴリズムでIDTのxGen v2パイプラインを使用した。最初に出力されるプローブデザインは、DNAの片方の鎖のみに対するものである。両DNA鎖を標的化するために、我々は、前記プローブを加え、逆相補鎖生成させて(reverse-complemented)、他方の鎖を標的化した(
図9A)。第2の2×タイリングデザインでは、我々は2×タイリングアルゴリズムでIDTのxGen v2パイプラインを使用した。両DNA鎖を標的化するために、我々は1プローブおきに標的鎖を入れ替えた(
図9A)。非メチル化シトシンを、EZ DNA methylation-Gold kit(Zymo)により変換した。ライブラリーを、IlluminaのNextSeq(2×150塩基)上でシーケンシングした。アラインメントおよびメチル化の解析を、Bismark(v0.22.3)およびPicard(v2.18.9)を使用して実施した。DNA鎖を、約70%のオンターゲット率でキャプチャーした。
図9Bは、ヘミメチル化部位がフィッシャーの正確確率検定を適用することにより同定され、次いで、すべてのp値が、0.05の偽発見誤差率(false-discovery error rate)でベンジャミニ-ホッホベルクの手順を使用して調整されたことを示す。
図9Cは、16Mリードにダウンサンプリングした後に、150~300×の平均標的カバレッジが観測されたことを示す。
図9Dは、両パネルデザインが高いキャプチャー均一性を実現することを実証する。
【0049】
[0063]公表文献、特許出願および特許を含む、本明細書で引用されるすべての参考文献は、あたかも各参考文献が参照により組み込まれることが個別にかつ具体的に示されたのと同程度に、および本明細書にその全体が明記されたのと同程度に、参照により組み込まれる。
【0050】
[0064]本発明を記載する文脈における(特に以下の特許請求の範囲の文脈にける)、「a」および「an」および「the」という用語ならびに類似の指示対象の使用は、本明細書で別様に示されない限り、または文脈によって明確に否定されない限り、単数と複数の両方を包含すると解釈されるべきである。「含む(comprising)」、「有する(having)」、「含む(including)」および「含有する(containing)」という用語は、別様に言及されない限り、オープンエンド用語(すなわち、「含むが、限定されない」を意味する)として解釈されるべきである。本明細書における値の範囲の列挙は、本明細書において別様に示されない限り、その範囲に入るそれぞれの独立した値を個別に参照する簡略な方法として機能することが単に意図されており、それぞれの独立した値は、それが本明細書で個別に列挙されるかのように本明細書中に組み込まれる。本明細書に記載のすべての方法は、本明細書において別様に示されない限り、または文脈によって明確に否定されない限り、任意の適した順番で実施され得る。本明細書で提供されるありとあらゆる例または例示的な言語(たとえば、「たとえば(such as)」)の使用は、単に本発明をよりはっきりとさせることを意図しており、別様に主張されない限り、本発明の範囲に制限を課すものではない。本明細書におけるいかなる言語も、本発明の実践に必須の何らかの特許請求されていない要素を示すとして解釈されるべきではない。
【0051】
[0065]本発明を実行するための発明者らが知る最良の形態を含む本発明の好ましい実施形態が本明細書に記載される。それらの好ましい実施形態の変形形態が、上述の記載を読めば当業者には明らかになり得る。発明者らは、当業者がそのような変形形態を適切に使用することを期待しており、発明者らは、本明細書に具体的に記載されるものとは別様に本発明が実践されることを意図している。よって、本発明は、適用法によって許可されるように、本明細書に添付された特許請求の範囲で列挙された主題のすべての改変および等価物を含む。さらに、本明細書において別様に示されない限り、または文脈によって明確に否定されない限り、それらのすべての可能な変形形態における上記の要素のあらゆる組み合わせが本発明により包含される。
【0052】
[0066]参考文献
[0067]Valouev et al. Methods of preparing dual-indexed DNA libraries for bisulfite conversion sequencing. US Patent Application: US20180044731A1
[0068]Gai, W. and K. Sun, Epigenetic Biomarkers in Cell-Free DNA and Applications in Liquid Biopsy. Genes (Basel), 2019. 10(1).
[0069]Liu, Y., et al., Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution. Nat Biotechnol, 2019. 37(4):
[0070]Moss, J., et al., Comprehensive human cell-type methylation atlas reveals origins of circulating cell-free DNA in health and disease. Nat Commun, 2018. 9(1): p. 5068.
[0071]Schutsky, E.K., et al., APOBEC3A efficiently deaminates methylated, but not TET-oxidized, cytosine bases in DNA. Nucleic Acids Res, 2017. 45(13): p. 7655-7665.