(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-25
(45)【発行日】2023-08-02
(54)【発明の名称】保存された遺伝子座に基づく、哺乳動物に関するDNAメチル化測定
(51)【国際特許分類】
C12N 15/09 20060101AFI20230726BHJP
C12Q 1/6816 20180101ALI20230726BHJP
C12Q 1/686 20180101ALI20230726BHJP
G01N 33/53 20060101ALN20230726BHJP
G01N 37/00 20060101ALN20230726BHJP
【FI】
C12N15/09 200
C12Q1/6816 Z ZNA
C12Q1/686 Z
G01N33/53 M
G01N37/00 102
(21)【出願番号】P 2021541271
(86)(22)【出願日】2020-01-20
(86)【国際出願番号】 US2020014251
(87)【国際公開番号】W WO2020150705
(87)【国際公開日】2020-07-23
【審査請求日】2021-09-08
(32)【優先日】2019-01-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】506115514
【氏名又は名称】ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア
【氏名又は名称原語表記】The Regents of the University of California
(73)【特許権者】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】ホーヴァス, ステファン
(72)【発明者】
【氏名】アーンスト, ジェイソン
(72)【発明者】
【氏名】アーネソン, エイドリアナ クリスティーナ
(72)【発明者】
【氏名】バーンズ, ブレット
【審査官】林 康子
(56)【参考文献】
【文献】Genomics 102 (2013), pp.38-46
【文献】Animal Genetics, 2014, Vol.45 (Suppl.1), pp.15-24
【文献】Cartilage, Epub 2018 Feb 19, (2019), Vol.10, No. 3, pp.335-345
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/68
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
DNAメチル化アレイを作製する方法であって
、以下の工程:
(a)ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、CpGメチル化部位を含む非ヒト哺乳動物種のゲノム内のポリヌクレオチド配列に相同である、CpGメチル化部位を含む前記ヒトゲノムにおけるポリヌクレオチド配列を同定することを含む、ポリヌクレオチド配列アラインメントを行う
ことにより、複数のポリヌクレオチドを選択する工程
であって、ここで、前記ポリヌクレオチド配列アラインメントが、ヒトゲノム配列と、少なくとも1種の非胎盤哺乳動物種を含む少なくとも5種の非ヒト哺乳動物種のゲノム配列とを比較し、前記ポリヌクレオチドは、少なくとも60ヌクレオチドを含む、工程;
(b)(a)において同定した前記ヒトゲノムにおける前記ポリヌクレオチド配列
を、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性
に従ってランク付けする工程
であって、ここで、前記複数のヒトゲノムのポリヌクレオチド配列は、前記少なくとも5種の非ヒト哺乳動物種のゲノム配列におけるポリヌクレオチド配列と3個以下の塩基対ミスマッチを有するように選択される、工程;および
(c)(b)における前記ランク付けを使用して、
前記少なくとも5種の非ヒト哺乳動物種の前記ゲノムにおける複数のポリヌクレオチド配列に交差ハイブリダイズする、前記ヒトゲノムにおける複数のポリヌクレオチドを選択する工程;および
(d)工程(c)からの選択した配列を、DNAメチル化アレイを形成するようにマトリクスに連結する工程
を包含する方
法。
【請求項2】
前記ランク付けは、非胎盤哺乳動物種、ならびにローラシア獣上目の、真主齧上目の、異節上目のおよびアフリカ獣上目の上位群における有胎盤哺乳動物種におけるゲノムポリヌクレオチド配列に対する相同性比較を含む、請求項
1に記載の方法。
【請求項3】
前記DNAメチル化アレイは、前記マトリクスに連結された少なくとも30,000の特有のポリヌクレオチドを含む、請求項1に記載の方法。
【請求項4】
前記複数の特有のポリヌクレオチドは、
60~80の間のヌクレオチド長である、請求項
3に記載の方法。
【請求項5】
前記マトリクスは、ビーズまたはチップである、請求項1に記載の方法。
【請求項6】
マトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイを作製する方法であって、ここ
で:
(a)
前記複数のポリヌクレオチドは、以下;
少なくとも60のヌクレオチド;
CpGモチーフ
;および
有袋類の哺乳動物種、単孔類の哺乳動物種、ローラシア獣上目の哺乳動物種、真主齧上目の哺乳動物種、異節上目の哺乳動物種およびアフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに対して、3個未満の塩基対ミスマッチでハイブリダイズする少なくとも2,000の特有のポリヌクレオチド配列、
を含む;ならびに
(b)
前記複数のポリヌクレオチドは、以下:
(i)ポリヌクレオチド配列アラインメントを行って、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、非ヒト哺乳動物種のゲノム内のCpGメチル化部位を含むポリヌクレオチド配列に相同である、CpGメチル化部位を含む前記ヒトゲノムにおけるポリヌクレオチド配列を同定する工程;
(ii)(a)において同定した前記ヒトゲノムにおけるポリヌクレオチド配列
を、非ヒト哺乳動物種の前記ゲノムにおけるポリヌクレオチド配列に対する配列相同性
に従ってランク付けする工程;および
(iii)(ii)における前記ランク付けを使用して、非ヒト哺乳動物種の前記ゲノムにおけるCpGメチル化部位を有する複数のポリヌクレオチド配列に3個以下の塩基対ミスマッチで交差ハイブリダイズする、CpGメチル化部位を有する複数のポリヌクレオチドを選択する工程、
によって選択される;ならびに
(
iv)工程(
iii)から
の選択
した配列を、DNAメチル化アレイを形成するようにマトリクスに連結する、
その結果、前記DNAメチル化アレイが作製される、
方法
。
【請求項7】
マトリクスに連結された複数のポリヌクレオチド配列を含むDNAメチル化アレイであって、ここで:
前記ポリヌクレオチドは、少なくとも
60ヌクレオチドおよびそれらの末端にCpGモチーフを含む;
前記ポリヌクレオチドは、ヒトゲノムに存在するポリヌクレオチド配列を含む;および
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、有袋類の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、単孔類の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、ローラシア獣上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、真主齧上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、異節上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;ならびに
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、アフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る、
DNAメチル化アレイ。
【請求項8】
前記有袋類の哺乳動物種は、ワラビー種である
;
前記単孔類の哺乳動物種は、カモノハシ種である
;
前記ローラシア獣上目の哺乳動物種は、コウモリ種である
;
前記真主齧上目の哺乳動物種は、齧歯動物種である
;
前記異節上目の哺乳動物種は、アルマジロ種である;およ
び
前記アフリカ獣上目の哺乳動物種は、テンレック種である、
請求項
7に記載のDNAメチル化アレイ。
【請求項9】
前記複数のポリヌクレオチド内の少なくとも1つのポリヌクレオチドは、
配列番号1~配列番号50のいずれか1つから選択される配列を有するポリヌクレオチドである、請求項
7または8に記載のDNAメチル化アレイ。
【請求項10】
非ヒト哺乳動物におけるメチル化プロフィールを観察する方法であって、前記方法は、
(a)ゲノムDNAを前記非ヒト哺乳動物から得る工程;
(b)前記ゲノムDNAにおける複数のCG遺伝子座のシトシンメチル化を、請求項
7~
9のいずれか1項に記載のDNAメチル化アレイを使用して観察する工程;
を包含し、その結果、前記非ヒト哺乳動物におけるメチル化プロフィールが観察される方法。
【請求項11】
(c)(b)において観察された前記CG遺伝子座メチル化と、既知の年齢を有する前記非ヒト哺乳動物種の個体に由来するゲノムDNAにおいて観察された前記CG遺伝子座メチル化とを比較する工程;および
(d)(b)において観察された前記CG遺伝子座メチル化と、前記非ヒト哺乳動物種の前記既知の年齢とを相関させる工程、
をさらに包含
する、請求項1
0に記載の方法。
【請求項12】
メチル化は、前記哺乳動物に由来する細胞の集団のゲノムDNAをバイサルファイトで処理して、前記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;
前記DNAメチル化アレイは、複数の非ヒト哺乳動物種におけるメチル化プロフィールを観察するために使用される;および/または
ゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される、
請求項1
0に記載の方法。
【請求項13】
哺乳動物細胞のゲノムメチル化関連エピジェネティック加齢に対する試験薬剤の効果を観察する方法であって、前記方法は、
(a)前記試験薬剤を哺乳動物細胞と組み合わせる工程;
(b)前記哺乳動物細胞に由来するゲノムDNAにおけるメチル化マーカーのメチル化状態を、請求項
7~
9のいずれか1項に記載のDNAメチル化アレイを使用して観察する工程;
(c)前記哺乳動物細胞におけるゲノムメチル化関連エピジェネティック加齢に対する前記試験薬剤の効果が観察されるように、(b)からの前記観察と、前記試験薬剤に曝されていないコントロール哺乳動物細胞からのゲノムDNAにおけるメチル化状態の観察とを比較する工程、
を包含する方法。
【請求項14】
複数の試験薬剤が、前記哺乳動物細胞と組み合わされる、請求項1
3に記載の方法。
【請求項15】
前記細胞は、ヒト初代ケラチノサイトである、請求項1
3に記載の方法。
【請求項16】
前記試験薬剤は、3,000g/mol、2,000g/mol、1,000g/mol、または500g/mol未満の分子量を有する化合物である、請求項1
3に記載の方法。
【請求項17】
メチル化は、前記哺乳動物に由来する細胞の集団からのゲノムDNAをバイサルファイトで処理して、前記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;および/または
ゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される、
請求項1
3に記載の方法。
【請求項18】
前記複数のポリヌクレオチド内の少なくとも1つのポリヌクレオチドは、配列番号1~配列番号50から選択されるポリヌクレオチドである、請求項1、10または13に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、米国特許法第119条(e)の下で、同時係属中のかつ共有に係る米国仮特許出願第62/794,364号(2019年1月18日出願、発明の名称「DNA METHYLATION MEASUREMENT FOR MAMMALS BASED ON CONSERVED LOCI」)の優先権を主張し、その出願は、本明細書に参考として援用される。
【0002】
政府の権利の陳述
本発明は、全米科学財団によって与えられた助成金番号1254200の下で政府の支援を得て行われた。政府は、本発明において一定の権利を有する。
【0003】
技術分野
本発明は、哺乳動物におけるゲノムDNAのメチル化を調べるための方法および材料に関する。
【背景技術】
【0004】
発明の背景
シトシンに対するメチル基の付加によるDNAメチル化は、多くの生物学的プロセスにわたって遺伝子発現を調節することにおけるその関わり合いに起因して、最も広く研究されているエピジェネティク改変のうちの1つである(1,2)。ヒトでは、DNAメチル化レベルは、個体の年齢、ならびに組織および細胞タイプにわたる年齢を正確に推測するために使用され得る(3)。
【0005】
DNAメチル化レベルを得るために2つの最も広く使用されている技術は、バイサルファイトシーケンシングおよびマイクロアレイベースのメチル化チップである。全ゲノムバイサルファイトシーケンシングは、費用のかかるアッセイであり、縮小表示バイサルファイトシーケンシング(reduced representation bisulfite sequencing)(RRBS)を一般に行われるシーケンシングアプローチにしている。RRBSは、ゲノム上のごく少数のヌクレオチドを効果的に照会するが、ゲノムワイドメチル化プロフィールもなお提供する。しかし、RRBSに関しても必要とされるシーケンシング深度は、コストをなおも上昇させ得る。これに起因して、ヒトサンプルについては、ますます多くのポリヌクレオチドプローブを含むアレイチップが、最も信頼性の高いかつ広く使用される技術であり続けている(4-6)。
最初のヒトメチル化チップ(ILLUMINA Infinium 27K)は、十年以上前に導入された。しかし、類似のチップは、他の非ヒト哺乳動物種に対しては提示されておらず、非ヒト哺乳動物用に従来のメチル化チップをデザインすることが経済的ではないという事実を反映している可能性があり、遅れている。例えば、従来の種特異的メチル化チップ/アレイの開発および使用は、測定プラットフォームが異なることから、種間比較を妨げ得る。これに照らせば、従来の種特異的メチル化チップは、種間比較に関しては最適とはいえない可能性がある。結果として、広く種々の哺乳動物種にわたって、メチル化およびメチル化と関連する現象(例えば、加齢)を観察するために有用な方法および材料が必要である。
【先行技術文献】
【非特許文献】
【0006】
【文献】Bernstein, B. E., Meissner, A. & Lander, E. S. The Mammalian Epigenome. Cell 128, 669-681 (2007).
【文献】Smith, Z. D. & Meissner, A. DNA methylation: roles in mammalian development. Nature Reviews Genetics 14, 204-220 (2013).
【文献】Horvath, S. DNA methylation age of human tissues and cell types. Genome Biol. 14, R115 (2013).
【文献】Genome-wide DNA methylation profiling using Infinium(登録商標)assay | Epigenomics. Available at: https://www.futuremedicine.com/doi/abs/10.2217/epi.09.14. (Accessed: 28th August 2018)
【文献】Evaluation of the Infinium Methylation 450K technology. - PubMed - NCBI. Available at: https://www.ncbi.nlm.nih.gov/pubmed/22126295. (Accessed: 28th August 2018)
【文献】Pidsley, R. et al. Critical evaluation of the ILLUMINA MethylationEPIC BeadChip microarray for whole-genome DNA methylation profiling. Genome Biology 17, 208 (2016).
【発明の概要】
【課題を解決するための手段】
【0007】
発明の要旨
【0008】
科学研究の代表的な中心であるもの(例えば、ヒトおよびマウス)以外の哺乳動物種におけるメチル化パターンの研究から、価値ある情報が得られ得る。しかし、このような研究における問題は、希にしか研究されない種(例えば、ハダカデバネズミおよびシャチ)におけるメチル化プロフィールを観察するためにデザインされる方法および材料を開発することが技術的に困難でありかつ費用がかかるという事実である。この文脈において、全ての哺乳動物種を研究するために有用な単一測定プラットフォームは、このような試みを遙かにより効率的かつ費用効果を高くする解決策を提供する。本明細書で開示される発明は、このプラットフォームを、広く種々の哺乳動物種においてメチル化およびメチル化と関連する現象を観察するために使用され得る方法および材料の形態において提供することである。以下で考察されるように、本発明の1つの有利な局面は、ヒトゲノムにおけるCpGメチル化部位含有DNAの高度に保存されたセグメント、すなわち、種間比較を容易にするヒトゲノムのセグメントの同定および利用である。
【0009】
本明細書で開示される発明は、多くの実施形態を有する。本発明の1つの実施形態は、「Conserved Methylation Array Probe Selector」(CMAPS)といわれるアルゴリズムである。このアルゴリズムは、ポリヌクレオチドが種間変異を許容することを可能にする様式で、ヒト内での変動を許容するために使用される従来の縮重塩基技術を再利用することによって、DNAメチル化アレイ/チップのような、本発明の実施形態において有用なDNA配列を同定するために使用される。本発明の実施形態において、CMAPSアルゴリズムは、複数配列アラインメントに基づいて、ヒトゲノムにおけるCpGのための単一プローブを使用して標的化され得る種の最大数を得るために、包括的な配列検索を行う。次いで、CMAPSアルゴリズムは、全ての配列/プローブをランク付けし、このような配列がエキソン、CpGアイランドおよび高メチル化領域対低メチル化領域の外部アノテーションに基づいて、様々なゲノム位置において多数の哺乳動物種を照会するために使用され得るように、最終セットを選択する。
【0010】
例えば、DNAメチル化アレイ(例えば、ビーズまたはチップのようなマトリクスに配置されたポリヌクレオチドのアレイ)を含む、本発明の実施形態のデザインを容易にするために、CMAPSアルゴリズムが使用され得る。本発明の1つのこのような実施形態は、マトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイであって、ここで上記複数のポリヌクレオチドは、(a)ポリヌクレオチド配列アラインメントを行って、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、CpGメチル化部位を含む非ヒト哺乳動物種のゲノム内のポリヌクレオチド配列に相同である、CpGメチル化部位を含むヒトゲノムにおけるポリヌクレオチド配列を同定する工程;(b)(a)において同定した上記ヒトゲノムにおけるポリヌクレオチド配列をランク付けする工程であって、ここで上記ランク付けの基準は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性を含む工程、および次いで(c)(b)における上記ランク付けを使用して、非ヒト哺乳動物種のゲノムにおける複数のポリヌクレオチド配列に交差ハイブリダイズする、ヒトゲノムにおける複数のポリヌクレオチドを選択する工程によって選択されるDNAメチル化アレイである。他の例証的なランク付け基準は、例えば、最大数の異なる哺乳動物種において機能するそれらCpG含有ポリヌクレオチド配列を同定する工程;および/または他のエピジェネティック生体マーカー研究(例えば、ヒト加齢研究)において重大であると特徴づけられているそれらCpG含有ポリヌクレオチド配列を同定する工程を含み得る。
【0011】
代表的には、本発明のこれらの実施形態において、上記複数のヒトゲノムポリヌクレオチド配列は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列と、3個以下の塩基対ミスマッチを有するように選択される。必要に応じて、配列アラインメントのランク付けは、ヒトゲノム配列と、少なくとも10種、20種、30種、40種もしくはこれより多くの非ヒト哺乳動物種のゲノム配列とを比較する、および/またはヒトゲノムポリヌクレオチド配列と非胎盤哺乳動物種および有胎盤哺乳動物種のような進化的に別個の種におけるゲノムポリヌクレオチド配列との比較を含む。本発明のある特定の実施形態において、上記DNAメチル化チップは、上記マトリクスに連結された少なくとも10,000、20,000または30,000の特有のポリヌクレオチドを含む。代表的には、上記ポリペプチド(the polypeptides)は、CpGメチル化部位を含む非ヒト哺乳動物ゲノムのDNAセグメントと少なくとも約95%同一である約60ヌクレオチド(例えば、40~80ヌクレオチド)を含む(例えば、ここで非ヒト哺乳動物ゲノムの60ヌクレオチドのうちの57ヌクレオチドが、ヒトゲノムの60ヌクレオチドのDNAセグメントと同一である)。本明細書で開示される発明のある特定の例証的な作業実施形態において、上記複数のポリヌクレオチド内の少なくとも1個のポリヌクレオチドは、表3に示される配列を有するポリヌクレオチドである。
【0012】
本発明の関連実施形態は、マトリクスに連結された複数のポリヌクレオチド配列を含むDNAメチル化アレイであって、ここで上記ポリヌクレオチドは、それらの末端にCpGモチーフ(またはその相補体)を含むDNAメチル化アレイである。これらのポリヌクレオチドは代表的には、ヒトゲノム配列と非ヒト哺乳動物種のゲノム配列との間で約95%相同性(例えば、60ヌクレオチドのうちの57ヌクレオチド)を示す約60ヌクレオチドの配列を含む。本発明のある特定の実施形態において、上記複数のポリヌクレオチド配列内の少なくともの2,000のポリヌクレオチドが、有袋類の哺乳動物種(例えば、ワラビー種)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および/または上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドが、単孔類の哺乳動物種(例えば、カモノハシ)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および/または上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドが、ローラシア獣上目の哺乳動物種(例えば、コウモリ種)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および/または上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドが、真主齧上目の哺乳動物種(例えば、齧歯動物種)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および/または上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、異節上目の哺乳動物種(例えば、アルマジロ種)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および/または上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、アフリカ獣上目の哺乳動物種(例えば、テンレック種)のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る。
【0013】
本発明の別の実施形態は、マトリクスに複数のポリヌクレオチドを連結する工程を包含する、DNAメチル化アレイを作製する方法である。代表的には、本発明のこのような実施形態において、上記複数のポリヌクレオチドは各々、CpGモチーフ(またはその相補体)を含み、ヒトゲノム配列と非ヒト哺乳動物種との間で約95%相同性(例えば、60ヌクレオチドのうちの57ヌクレオチド)を示す約60ヌクレオチドのポリヌクレオチド配列である。本発明の代表的な実施形態において、上記DNAメチル化アレイは、このアレイが、非胎盤哺乳動物種および有胎盤哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズする、少なくとも2,000の特有のポリヌクレオチド配列を含むようにデザインされる。代表的には、DNAメチル化アレイを作製するために使用される上記複数のポリペプチド(the plurality of polypeptides)は、(i)ポリヌクレオチド配列アラインメントを行って、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、非ヒト哺乳動物種のゲノム内のCpGメチル化部位を含むポリヌクレオチド配列に相同である、CpGメチル化部位を含むヒトゲノムにおけるポリヌクレオチド配列を同定する工程;(ii)(a)において同定した上記ヒトゲノムにおけるポリヌクレオチド配列をランク付けする工程であって、ここでランク付けの基準は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性を含む工程;および次いで(iii)(b)における上記ランク付けを使用して、非ヒト哺乳動物種のゲノムにおけるCpGメチル化部位を有する複数のポリヌクレオチド配列に、2個、3個または4個以下の塩基対ミスマッチで交差ハイブリダイズする、CpGメチル化部位を有する複数のポリヌクレオチドを選択する工程によって選択され、その結果、上記DNAメチル化アレイが作製される。
【0014】
本発明のさらに別の実施形態は、非ヒト哺乳動物におけるメチル化プロフィールを観察する方法であって、上記方法は、ゲノムDNAを上記非ヒト哺乳動物から得る工程;および次いで、上記ゲノムDNAにおける複数のCG遺伝子座のシトシンメチル化を、本明細書で開示されるDNAメチル化アレイを使用して観察する工程を包含し、その結果、上記非ヒト哺乳動物におけるメチル化プロフィールが観察される方法である。必要に応じて、この方法は、観察されるCG遺伝子座メチル化プロフィールと、既知の年齢を有する非ヒト哺乳動物種の個体に由来するゲノムDNAにおいて観察されたCG遺伝子座メチル化とを比較する工程;および次いで、観察されたCG遺伝子座メチル化と、上記非ヒト哺乳動物種の既知の年齢とを相関させる工程を包含し、その結果、上記非ヒト哺乳動物の年齢を決定するために有用な情報が得られる。本発明の代表的な実施形態において、上記DNAメチル化アレイは、複数の非ヒト哺乳動物種においてメチル化プロフィールを観察するために使用される。重要なことには、本発明の実施形態は、当業者が、1つの種(例えば、マウス)におけるDNAメチル化レベルに影響を及ぼす介入(例えば、試験薬剤への曝露)がまた、別の種(例えば、ヒト)における相当するDNAメチル化レベルに影響を及ぼすかどうかを評価することをさらに可能にする。さらに、保存された配列は、当業者が高度に保存されたCpGに基づいて、異なる哺乳動物種のエピジェネティック年齢推定量(エピジェネティッククロック)を開発することをさらに可能にする。
【0015】
以下で考察されるように、本明細書で開示される発明の作業実施形態は、「HorvathMammalMethylChip40」といわれ、相補的配列のプローブとしてマトリクスに連結されたおよそ38kの特有のヒトゲノムポリヌクレオチドを含むチップ上に配置されたDNAメチル化アレイである。その中でも、36,000のポリヌクレオチドプローブは、哺乳動物ゲノムの保存された領域におけるCpG部位を照会し、本発明のこの実施形態を、全哺乳動物種にわたる研究において有用にする。本発明のこの実施形態において、残りの2,000のプローブは、ヒトエピジェネティック生体マーカー研究においてそれが特に重要なことに起因して選択された。以下の表2に提示されるデータによって示されるように、得られたDNAメチル化チップは、全ての哺乳動物に適用可能であり、従って、規模の経済によって1チップあたりのコストを下げる。さらに、このチップ実施形態は、種間比較のため特別に作られる。
【0016】
特定の実施形態では例えば以下の項目が提供される:
(項目1)
マトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイを作製する方法であって、前記複数のポリヌクレオチドは、以下の工程:
(a)ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、CpGメチル化部位を含む非ヒト哺乳動物種のゲノム内のポリヌクレオチド配列に相同である、CpGメチル化部位を含む前記ヒトゲノムにおけるポリヌクレオチド配列を同定することを含む、ポリヌクレオチド配列アラインメントを行う工程;
(b)(a)において同定した前記ヒトゲノムにおける前記ポリヌクレオチド配列をランク付けする工程であって、ここで前記ランク付けの基準は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性を含む工程;および
(c)(b)における前記ランク付けを使用して、非ヒト哺乳動物種の前記ゲノムにおける複数のポリヌクレオチド配列に交差ハイブリダイズする、前記ヒトゲノムにおける複数のポリヌクレオチドを選択する工程;および
(d)工程(c)からの選択した配列を、DNAメチル化アレイを形成するようにマトリクスに連結する工程.
を包含する方法によって選択される方法。
(項目2)
前記複数のヒトゲノムポリヌクレオチド配列は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列と3個以下の塩基対ミスマッチを有するように選択される、項目1に記載の方法。
(項目3)
前記ランク付けは、非胎盤哺乳動物種、ならびにローラシア獣上目の、真主齧上目の、異節上目のおよびアフリカ獣上目の上位群における有胎盤哺乳動物種におけるゲノムポリヌクレオチド配列に対する相同性比較を含む、項目2に記載の方法。
(項目4)
前記配列アラインメントは、ヒトゲノム配列と少なくとも10の非ヒト哺乳動物種のゲノム配列とを比較する、項目3に記載の方法。
(項目5)
前記DNAメチル化アレイは、前記マトリクスに連結された少なくとも30,000の特有のポリヌクレオチドを含む、項目1に記載の方法。
(項目6)
前記複数の特有のポリヌクレオチドは、40~80の間のヌクレオチド長である、項目5に記載の方法。
(項目7)
前記マトリクスは、ビーズまたはチップである、項目1に記載の方法。
(項目8)
マトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイを作製する方法であって、ここで前記複数のポリヌクレオチドは:
(a)以下;
CpGモチーフ
有袋類の哺乳動物種、単孔類の哺乳動物種、ローラシア獣上目の哺乳動物種、真主齧上目の哺乳動物種、異節上目の哺乳動物種およびアフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに対して、3個未満の塩基対ミスマッチでハイブリダイズする少なくとも2,000の特有のポリヌクレオチド配列、
を含む;ならびに
(b)以下:
(i)ポリヌクレオチド配列アラインメントを行って、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、非ヒト哺乳動物種のゲノム内のCpGメチル化部位を含むポリヌクレオチド配列に相同である、CpGメチル化部位を含む前記ヒトゲノムにおけるポリヌクレオチド配列を同定する工程;
(ii)(a)において同定した前記ヒトゲノムにおけるポリヌクレオチド配列をランク付けする工程であって、ここで前記ランク付けの基準は、非ヒト哺乳動物種の前記ゲノムにおけるポリヌクレオチド配列に対する配列相同性の程度を含む、工程;および
(iii)(ii)における前記ランク付けを使用して、非ヒト哺乳動物種の前記ゲノムにおけるCpGメチル化部位を有する複数のポリヌクレオチド配列に3個以下の塩基対ミスマッチで交差ハイブリダイズする、CpGメチル化部位を有する複数のポリヌクレオチドを選択する工程、
によって選択される;ならびに
(c)工程(b)から選択された配列を、DNAメチル化アレイを形成するようにマトリクスに連結する、
その結果、前記DNAメチル化アレイが作製される、
方法
(項目9)
項目1~8のいずれか1項に記載の方法によって作製されるDNAメチル化アレイ。
(項目10)
マトリクスに連結された複数のポリヌクレオチド配列を含むDNAメチル化アレイであって、ここで:
前記ポリヌクレオチドは、少なくとも40ヌクレオチドおよびそれらの末端にCpGモチーフを含む;
前記ポリヌクレオチドは、ヒトゲノムに存在するポリヌクレオチド配列を含む;および
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、有袋類の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、単孔類の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、ローラシア獣上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、真主齧上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、異節上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;ならびに
前記複数のポリヌクレオチド配列内の少なくとも2,000ポリヌクレオチドは、アフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における40ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る、
DNAメチル化アレイ。
(項目11)
前記有袋類の哺乳動物種は、ワラビー種である;および/または
前記単孔類の哺乳動物種は、カモノハシ種である;および/または
前記ローラシア獣上目の哺乳動物種は、コウモリ種である;および/または
前記真主齧上目の哺乳動物種は、齧歯動物種である;および/または
前記異節上目の哺乳動物種は、アルマジロ種である;および/または
前記アフリカ獣上目の哺乳動物種は、テンレック種である、
項目10に記載のDNAメチル化アレイ。
(項目12)
前記複数のポリヌクレオチド内の少なくとも1つのポリヌクレオチドは、表1に示される配列を有するポリヌクレオチドである、項目9~11のいずれか1項に記載のDNAメチル化アレイ。
(項目13)
非ヒト哺乳動物におけるメチル化プロフィールを観察する方法であって、前記方法は、
(a)ゲノムDNAを前記非ヒト哺乳動物から得る工程;
(b)前記ゲノムDNAにおける複数のCG遺伝子座のシトシンメチル化を、項目9~12のいずれか1項に記載のDNAメチル化アレイを使用して観察する工程;
を包含し、その結果、前記非ヒト哺乳動物におけるメチル化プロフィールが観察される方法。
(項目14)
(c)(b)において観察された前記CG遺伝子座メチル化と、既知の年齢を有する前記非ヒト哺乳動物種の個体に由来するゲノムDNAにおいて観察された前記CG遺伝子座メチル化とを比較する工程;および
(d)(b)において観察された前記CG遺伝子座メチル化と、前記非ヒト哺乳動物種の前記既知の年齢とを相関させる工程、
をさらに包含し;
その結果、前記非ヒト哺乳動物種の前記年齢を決定するために有用な情報が得られる、項目13に記載の方法。
(項目15)
メチル化は、前記哺乳動物に由来する細胞の集団のゲノムDNAをバイサルファイトで処理して、前記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;
前記DNAメチル化アレイは、複数の非ヒト哺乳動物種におけるメチル化プロフィールを観察するために使用される;および/または
ゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される、
項目13に記載の方法。
(項目16)
哺乳動物細胞のゲノムメチル化関連エピジェネティック加齢に対する試験薬剤の効果を観察する方法であって、前記方法は、
(a)前記試験薬剤を哺乳動物細胞と組み合わせる工程;
(b)前記哺乳動物細胞に由来するゲノムDNAにおけるメチル化マーカーのメチル化状態を、項目9~12のいずれか1項に記載のDNAメチル化アレイを使用して観察する工程;
(c)前記哺乳動物細胞におけるゲノムメチル化関連エピジェネティック加齢に対する前記試験薬剤の効果が観察されるように、(b)からの前記観察と、前記試験薬剤に曝されていないコントロール哺乳動物細胞からのゲノムDNAにおけるメチル化状態の観察とを比較する工程、
を包含する方法。
(項目17)
複数の試験薬剤が、前記哺乳動物細胞と組み合わされる、項目16に記載の方法。
(項目18)
前記細胞は、ヒト初代ケラチノサイトである、項目16に記載の方法。
(項目19)
前記試験薬剤は、3,000g/mol、2,000g/mol、1,000g/mol、または500g/mol未満の分子量を有する化合物である、項目16に記載の方法。
(項目20)
メチル化は、前記哺乳動物に由来する細胞の集団からのゲノムDNAをバイサルファイトで処理して、前記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;および/または
ゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される、
項目16に記載の方法。
本発明の他の目的、特徴および利点は、以下の詳細な説明から当業者に明らかになる。しかし、詳細な説明および具体例が、本発明のいくつかの実施形態を示すと同時に、例証によって示され、限定ではないことは理解されるべきである。本発明の範囲内の多くの変更および改変は、本発明の趣旨から逸脱することなく行われ得、本発明は、全てのこのような改変を含む。
【図面の簡単な説明】
【0017】
【
図1】
図1は、Infinium Iプローブの包含に起因して、CMAPSアルゴリズム標的高密度CpGアイランドを介して同定されたCpG部位を示すグラフ化したデータを提供する。選択されたCpGの表示(青色)は、ヒトゲノムにおける全CpGの表示(赤色)に類似している。
【
図2】
図2は、高メチル化および低メチル化CpG部位の両方を標的化するCMAPSアルゴリズムを通じて同定されたCpG部位を示すグラフ化したデータを提供する。選択したプローブのメチル化のヒストグラム(赤色)は、ヒトゲノムにおける全部位のもの(青色)に類似している。
【
図3】
図3は、ヒトメチル化データからの404個の高度に保存されたCpGに基づくエピジェネティック加齢クロックを示すグラフ化したデータを提供する。左パネル:訓練データセットにおける404個のエピジェネティッククロックCpG対暦年齢の重み付け平均。赤色の曲線の変化速度は、チックレートとして解釈され得る。点は着色され、Horvath, S. DNA methylation age of human tissues and cell types. Genome Biol. 14, R115 (2013(「Horvath 2013」))に記載されるとおりのデータセットによって表示される。右パネル:試験データセットの類似の結果。試験データのみが、独立した検証に適している。
【発明を実施するための形態】
【0018】
発明の詳細な説明
実施形態の説明において、その一部を形成する添付の図面に対して言及がなされ得る。ここで本発明が実施され得る具体的実施形態が例証によって示される。他の実施形態が利用され得ること、および構造的変更が本発明の範囲から逸脱することなく行われ得ることは、理解されるべきである。本明細書で記載されるかまたは言及される技術および手順のうちの多くは、当業者によって十分に理解されかつ一般に使用される。別段定義されなければ、全ての技術用語、注釈および他の科学用語または本明細書で使用される技術は、本発明が属する分野の当業者によって一般に理解される意味を有することが意図される。いくつかの場合において、一般に理解される意味を有する用語は、明瞭さのためにおよび/または容易な参照のために、本明細書で定義され、このような定義を本明細書に含めることは、一般に当該分野で理解されていることに対する実質的な差異を示すと必ずしも解釈されるべきではない。
【0019】
本明細書で言及される全ての刊行物は、引用される刊行物に関連する局面、方法および/または材料を開示および記載するために、本明細書に参考として援用される。例えば、米国特許出願公開20150259742、Stefan Horvathによって出願された米国特許出願第15/025,185号、発明の名称「METHOD TO ESTIMATE THE AGE OF TISSUES AND CELL TYPES BASED ON EPIGENETIC MARKERS」;Eric Villainらによって出願された米国特許出願第14/119,145号、発明の名称「METHOD TO ESTIMATE AGE OF INDIVIDUAL BASED ON EPIGENETIC MARKERS IN BIOLOGICAL SAMPLE」;およびHannumら. 「Genome-Wide Methylation Profiles Reveal Quantitative Views Of Human Aging Rates.」 Molecular Cell. 2013; 49(2):359-367および特許US2015/0259742は、それらの全体において本明細書に参考として援用される。
【0020】
上記で注記されるように、本明細書で開示される発明の実施形態は、広く種々の哺乳動物種にわたってゲノムメチル化パターンを観察するために有用である、高度に保存されたメチル化プローブを同定するためのアルゴリズム(CMAPS)を含む。各プローブ配列内の特定のヌクレオチドを含むポリヌクレオチドプローブ配列情報は、指定された変動を耐えられるようにデザインされる。CMAPSアルゴリズムによって同定されたポリヌクレオチドプローブは、ILLUMINAによって販売されるもののようなポリヌクレオチドアレイを使用して、哺乳動物にわたって高度に保存されているDNAの短いストレッチにおいてシトシンメチル化レベルを測定することを可能にする。本明細書で開示される発明の実施形態は、CMAPSアルゴリズムを使用して同定された複数のヒトゲノム配列を含む遺伝子チップを含む。
【0021】
以下で考察されるように、本明細書で開示される発明の例示的作業実施形態は、本質的に全ての哺乳動物種においてシトシンDNAメチル化レベルを評価することを可能にする、35,988のポリヌクレオチドプローブのセットを含む遺伝子チップである。CMAPSアルゴリズムは、これらのおよそ38kのポリヌクレオチドプローブを含むこの特注のILLUMINA Infiniumチップ(HorvathMammalMethylChip40)にデザインの基礎をなす。それらの中で、36,000のプローブは、ヒトゲノムの保存された領域におけるCpG部位を照会し、全ての哺乳動物種において適用可能な遺伝子チップを作製する。残りの2,000のプローブは、ヒトエピジェネティック生体マーカー研究においてそれが特に重要なことに起因して選択された。このDNAメチル化チップは、全哺乳動物種においてメチル化プロフィールを観察するために有用であり、従って、種間比較のため特別に作られる。
【0022】
本発明の実施形態は、例えば、ビーズまたはチップのようなマトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイを作製する方法を包含する。代表的には、これらの方法において、複数のポリヌクレオチドは、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、CpGメチル化部位を含む非ヒト哺乳動物種のゲノム内のポリヌクレオチド配列に相同である、CpGメチル化部位を含むヒトゲノムにおけるポリヌクレオチド配列を同定することを含む、ポリヌクレオチド配列アラインメントを行う工程;上記ポリヌクレオチド配列アラインメントにおいて同定したヒトゲノムにおけるポリヌクレオチド配列をランク付けする工程であって、ここで前記ランク付けの基準は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性を含む、工程;ならびにこのランク付けを使用して、非ヒト哺乳動物種のゲノムにおける複数のポリヌクレオチド配列交差ハイブリダイズする、上記ヒトゲノムにおける複数のポリヌクレオチドを選択する工程;および次いで、選択した配列を、DNAメチル化アレイを形成するようにマトリクスに連結する工程を包含する方法によって選択される。本発明の代表的な実施形態において、上記DNAメチル化アレイは、上記マトリクスに連結された少なくとも30,000の特有のポリヌクレオチドを含む。
【0023】
DNAメチル化アレイを作製するための方法のある特定の実施形態において、上記複数のヒトゲノムポリヌクレオチド配列は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列と3個以下の塩基対ミスマッチを有するように選択される。代表的には、上記複数のポリヌクレオチドは、40~80の間のヌクレオチド長である。本発明のいくつかの実施形態において、ポリヌクレオチド配列のランク付けは、非胎盤哺乳動物種、ならびにローラシア獣上目の、真主齧上目の、異節上目のおよびアフリカ獣上目の上位群における有胎盤哺乳動物種におけるゲノムポリヌクレオチド配列に対する相同性比較の工程を含む。必要に応じて、上記配列アラインメントは、ヒトゲノム配列と少なくとも10の非ヒト哺乳動物種のゲノム配列とを比較する。
【0024】
マトリクスに連結された複数のポリヌクレオチドを含むDNAメチル化アレイを作製する方法の別の例証的実施形態において、上記複数のポリヌクレオチドは、CpGモチーフを含み、有袋類の哺乳動物種、単孔類の哺乳動物種、ローラシア獣上目の哺乳動物種、真主齧上目の哺乳動物種、異節上目の哺乳動物種、およびアフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズする少なくとも2,000のポリヌクレオチド配列を含む。代表的には、上記ポリヌクレオチド配列は、ポリヌクレオチド配列アラインメントを行って、ヒトゲノムと複数の非ヒト哺乳動物ゲノムとを比較して、CpGメチル化部位を含む非ヒト哺乳動物種のゲノム内のポリヌクレオチド配列に相同である、CpGメチル化部位を含むヒトゲノムにおけるポリヌクレオチド配列を同定する工程;(a)において同定した上記ヒトゲノムにおけるポリヌクレオチド配列をランク付けする工程であって、ここで上記ランク付けの基準は、非ヒト哺乳動物種のゲノムにおけるポリヌクレオチド配列に対する配列相同性の程度を含む工程;上記ランク付けを使用して、非ヒト哺乳動物種のゲノムにおけるCpGメチル化部位を有する複数のポリヌクレオチド配列に3個以下の塩基対ミスマッチで交差ハイブリダイズする、CpGメチル化部位を有する複数のポリヌクレオチドを選択する工程;および次いで、工程(b)からの選択した配列を、DNAメチル化アレイを形成するようにマトリクスに連結する工程によって選択され、その結果、上記DNAメチル化アレイが作製される。
【0025】
本発明の実施形態は、本明細書で開示される方法によって作製されたDNAメチル化アレイを含む。本発明のある特定の実施形態において、上記複数のポリヌクレオチド内の少なくとも1個、10個、100個またはこれより多くのポリヌクレオチドは、表3に示される配列を有するポリヌクレオチドである。例えば、本発明の実施形態は、マトリクスに連結された複数のポリヌクレオチド配列を含むDNAメチル化アレイであって、ここで上記ポリヌクレオチドは、少なくとも60ヌクレオチドおよびそれらの末端にCpGモチーフを含むDNAメチル化アレイを含む;上記ポリヌクレオチドは、ヒトゲノムに存在するポリヌクレオチド配列を含む;そして上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、有袋類の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、単孔類の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、ローラシア獣上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、真主齧上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、異節上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る;および上記複数のポリヌクレオチド配列内の少なくとも2,000のポリヌクレオチドは、アフリカ獣上目の哺乳動物種のゲノムポリヌクレオチド配列における60ヌクレオチドセグメントに、3個未満の塩基対ミスマッチでハイブリダイズし得る。ある特定の実施形態において、上記有袋類の哺乳動物種は、ワラビー種である;および/または上記単孔類の哺乳動物種は、カモノハシ種である;および/または上記ローラシア獣上目の哺乳動物種は、コウモリ種である;および/または上記真主齧上目の哺乳動物種は、齧歯動物種である;および/または上記異節上目の哺乳動物種は、アルマジロ種である;および/または上記アフリカ獣上目の哺乳動物種は、テンレック種である。
【0026】
本発明の別の実施形態は、非ヒト哺乳動物におけるメチル化プロフィールを観察する方法であって、上記方法は、ゲノムDNAを上記非ヒト哺乳動物から得る工程;上記ゲノムDNAにおける複数のCG遺伝子座のシトシンメチル化を、本明細書で開示されるDNAメチル化アレイを使用して観察する工程を包含し、その結果、上記非ヒト哺乳動物におけるメチル化プロフィールが観察される方法である。必要に応じて、これらの方法はまた、上記方法において観察されたCG遺伝子座メチル化と、既知の年齢を有する非ヒト哺乳動物種の個体に由来するゲノムDNAにおいて観察されたCG遺伝子座メチル化とを比較する工程;および次いで、(b)において観察された上記CG遺伝子座メチル化と、上記非ヒト哺乳動物種の既知の年齢とを相関させる工程を包含し、その結果、上記非ヒト哺乳動物種の年齢を決定するために有用な情報が得られる。代表的には、これらの実施形態において、メチル化は、上記哺乳動物に由来する細胞の集団のゲノムDNAをバイサルファイトで処理して、上記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;上記DNAメチル化アレイは、複数の非ヒト哺乳動物種におけるメチル化プロフィールを観察するために使用される;および/またはゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される。
【0027】
本発明のさらに別の実施形態は、哺乳動物細胞(例えば、ヒト初代ケラチノサイト)のゲノムメチル化関連エピジェネティック加齢に対する試験薬剤(3,000g/mol、2,000g/mol、1,000g/mol、または500g/mol未満の分子量を有する化合物、例えば、ラパマイシン)の効果を観察する方法である。代表的には、これらの方法は、上記試験薬剤を哺乳動物細胞と組み合わせる工程;上記哺乳動物細胞に由来するゲノムDNAにおけるメチル化マーカーのメチル化状態を、本明細書で開示されるDNAメチル化アレイを使用して観察する工程;および次いで、上記哺乳動物細胞におけるゲノムメチル化関連エピジェネティック加齢に対する上記試験薬剤の効果(例えば、上記試験薬剤が、エピジェネティック加齢と関連するゲノムメチル化パターンを減少させるか増加させるかどうか)が観察されるように、これらの観察と、上記試験薬剤に曝されていないコントロール哺乳動物細胞のゲノムDNAにおけるメチル化状態の観察とを比較する工程を包含する。必要に応じて、これらの方法において、複数の試験薬剤は、上記哺乳動物細胞と組み合わされる。これらの方法のある特定の実施形態において、ポリヌクレオチドは、マトリクスに連結され、メチル化は、上記哺乳動物に由来する細胞の集団のゲノムDNAをバイサルファイトで処理して、上記ゲノムDNAにおけるCpGジヌクレオチドの非メチル化シトシンをウラシルに変換する工程を包含するプロセスによって観察される;および/またはゲノムDNAは、ポリメラーゼ連鎖反応プロセスによって増幅される。
【0028】
本発明のさらなる局面および実施形態は、以下の節において考察される。
【0029】
本発明のさらなる例証的な局面および実施形態
DNAメチル化とは、DNA分子の化学的改変に言及する。ILLUMINA InfiniumマイクロアレイまたはDNAシーケンシングベースの方法のような技術的プラットフォームは、ヒトにおけるDNAメチル化レベルの非常に強くかつ再現可能な測定をもたらすことが見出されてきた。ヒトゲノムには、2800万個を超えるCpG遺伝子座が存在する。結果として、ある特定の遺伝子座は、ILLUMINA CpG遺伝子座データベースに掲載され、表3において使用されるもののような特有の識別子を与えられる(例えば、Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010を参照のこと)。ある特定の例証的CG遺伝子座指定識別子(CG locus designation identifier)および配列は、本明細書で使用される。このような配列は、UCSC Genome Browser(University of California, Santa Cruz(UCSC)が主催しているオンライン上の、およびダウンロード可能なゲノムブラウザ)のような、この技術において当業者に容易に利用可能であるゲノムデータベースのうちの1またはこれより多くを使用して、さらに特徴づけられ得る。
【0030】
用語「エピジェネティック」は、本明細書で使用される場合、DNA分子の化学的改変に関連するか、その化学的改変であるか、またはその化学的改変が関わることを意味する。エピジェネティック因子としては、DNAメチル化レベルの変化を生じるメチル基の付加または除去が挙げられる。
【0031】
用語「ポリヌクレオチド」とは、本明細書で使用される場合、ピリミジン塩基およびプリン塩基、それぞれ、好ましくは、シトシン、チミンおよびウラシル、ならびにアデニンおよびグアニンの任意のポリマーまたはオリゴマーを含み得る。本発明は、任意のデオキシリボヌクレオチド、リボヌクレオチドまたはペプチド核酸成分、ならびにこれらの任意の化学的バリアント(例えば、これらの塩基のメチル化、ヒドロキシメチル化またはグルコシル化形態など)を企図する。上記ポリマーまたはオリゴマーは、組成が不均質であっても均質であってもよく、天然に存在する供給源から単離されていてもよいし、人工的にもしくは合成的に生成されてもよい。さらに、上記核酸は、DNAもしくはRNA、またはこれらの混合物であってもよく、恒久的にまたは過渡的に、1本鎖もしくは2本鎖形態(ホモ二重鎖、ヘテロ二重鎖、およびハイブリッド状態が挙げられる)において存在してもよい。
【0032】
用語「メチル化マーカー」とは、本明細書で使用される場合、潜在的にメチル化されるCpG位置に言及する。メチル化は、代表的には、CpG含有核酸において起こる。そのCpG含有核酸は、例えば、遺伝子のCpGアイランド、またはCpGダブレット、プロモーター、イントロン、またはエキソンにおいて存在し得る。例えば、本明細書で提供される遺伝子領域において、潜在的メチル化部位は、示された遺伝子のプロモーター/エンハンサー領域を含む。従って、その領域は、遺伝子プロモーターの上流で始まり得、転写された領域へと下流に延び得る。
【0033】
語句「選択的に測定する(selectively measuring)」とは、本明細書で使用される場合、有限数のメチル化マーカーまたは遺伝子(メチル化マーカーを含む)のみが、ゲノム中の本質的に全ての潜在的メチル化マーカー(または遺伝子)をアッセイするよりむしろ、測定される方法に言及する。例えば、いくつかの局面において、メチル化マーカーまたはこのようなマーカーを含む遺伝子を「選択的に測定する」工程は、100個、75個、50個、25個、10個または5個以上(または以下)の異なるメチル化マーカーまたはメチル化マーカーを含む遺伝子を測定する工程に言及し得る。
【0034】
上記メチル化マーカー(またはそれに近いマーカー)のDNAメチル化は、市販のアレイプラットフォーム(例えば、ILLUMINAの)から個々の遺伝子のシーケンシングアプローチまでの範囲に及ぶ種々のアプローチを使用して測定され得る。これは、標準的な実験技術またはアレイプラットフォームを含む。メチル化状態またはパターンを検出するための種々の方法は、例えば、米国特許第6,214,556号、同第5,786,146号、同第6,017,704号、同第6,265,171号、同第6,200,756号、同第6,251,594号、同第5,912,147号、同第6,331,393号、同第6,605,432号、および同第6,300,071号、ならびに米国特許出願公開番号20030148327、同第20030148326、同第20030143606、同第20030082609、および同第20050009059(これらの各々は、本明細書に参考として援用される)に記載されている。メチル化分析の他のアレイベースの方法は、米国特許出願第11/058,566号に開示されている。いくつかのメチル化検出法の総説については、Oakeley, E. J., Pharmacology & Therapeutics 84:389-400 (1999)を参照のこと。利用可能な方法としては、逆相HPLC、薄層クロマトグラフィー、標識されたメチル基の組み込みを伴うSssIメチルトランスフェラーゼ、クロロアセトアルデヒド反応、感度が異なる制限酵素、ヒドラジンまたは過マンガン酸塩処理(m5Cは、過マンガン酸塩処理によって切断されるが、ヒドラジン処理によっては切断されない)、亜硫酸水素ナトリウム、硫酸水素塩-制限分析の併用(combined bisulphate-restriction analysis)、およびメチル化感受性単一ヌクレオチドプライマー伸長が挙げられるが、これらに限定されない。ILLUMINA法は、CpG遺伝子座に隣接する配列を利用して、dbSNPにおけるNCBI’s refSNP IDs(rs#)と類似のストラテジーで特有のCpG遺伝子座クラスターIDを生成する(例えば、Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010を参照のこと)。
【0035】
本明細書で開示されるDNAメチル化マーカーの部分セットのメチル化レベルは、(例えば、ILLUMINA DNAメチル化アレイを使用して、または関連するプライマーを含むPCRプロトコールを使用して)アッセイされる。メチル化レベルを定量するために、ILLUMINAによって記載される標準的プロトコールに従って、メチル化のβ値を計算し得る。これは、その位置におけるメチル化シトシンの割合に等しい。本発明はまた、本明細書で開示されるとおりの遺伝子に近い位置において、DNAメチル化を定量するための任意の他のアプローチに適用され得る。DNAメチル化は、多くの現在利用可能なアッセイを使用して定量され得る。
【0036】
本発明のある特定の実施形態において、ゲノムDNAは、マトリクス(例えば、マイクロアレイ内で配置されるもの)に連結されている相補的配列(例えば、合成ポリヌクレオチド配列)にハイブリダイズされる。必要に応じて、上記ゲノムDNAは、ポリメラーゼ連鎖反応プロセスによる増幅を介してその天然の状態から変換される。例えば、アレイへのハイブリダイゼーションの前またはハイブリダイゼーションと併せて、上記サンプルは、種々の機構(そのうちのいくつかは、PCRを使用し得る)によって増幅される。例えば、PCR Technology: Principles and Applications for DNA Amplification (H. A. Erlich編, Freeman Press, NY, N.Y., 1992); PCR Protocols: A Guide to Methods and Applications (Innisら編, Academic Press, San Diego, Calif., 1990); Mattilaら, Nucleic Acids Res. 19, 4967 (1991); Eckertら, PCR Methods and Applications 1, 17(1991); PCR(McPhersonら編, IRL Press, Oxford);および米国特許第4,683,202号、同第4,683,195号、同第4,800,159号、同第4,965,188号、および同第5,333,675号を参照のこと。上記サンプルは、上記アレイ上で増幅され得る。例えば、米国特許第6,300,070号(これは、本明細書に参考として援用される)を参照のこと。
【0037】
本発明の実施形態は、種々の当該分野で受容された技術的プロセスを含み得る。例えば、本発明のある特定の実施形態において、バイサルファイト変換プロセスは、ゲノムDNAにおけるシトシン残基がウラシルに変換される一方で、ゲノムDNAにおける5-メチルシトシン残基は、ウラシルに変換されないように行われる。DNAバイサルファイト改変のためのキットは、例えば、MethylEasyTM(Human Genetic SignaturesTM)およびCpGenomeTM Modification Kit(ChemiconTM)から市販されている。また、WO04096825A1(これは、バイサルファイト改変方法を記載する)およびOlekら. Nuc. Acids Res. 24:5064-6(1994)(これは、バイサルファイト処理およびその後の増幅を行う方法を開示する)を参照のこと。バイサルファイト処理は、シトシンのメチル化状態が、種々の方法によって検出されることを可能にする。例えば、SNPを検出するために使用され得る任意の方法が使用され得る。例えば、Syvanen, Nature Rev. Gen. 2:930-942 (2001)を参照のこと。一塩基伸長(SBE)のような方法が使用され得る(またはアレル特異的ハイブリダイゼーション方法に類似の配列特異的プローブのハイブリダイゼーション)。別の局面において、Molecular Inversion Probe(MIP)アッセイが、使用され得る。
【0038】
単一の種におけるDNAメチル化レベルを測定するために、多くの技術が存在する。ヒトDNAにおけるメチル化を測定するために、ヒトILLUMINA Infiniumアレイを使用して、ヒトDNAサンプルにおけるDNAメチル化レベルを測定し得る。近年の論文(Needhamsenら, BMC Bioinformatics, BMC series -2017, 18:486)は、マウスにおけるメチル化測定のためにEPICチップを使用することが可能であることを示したが、EPICチップ上の850Kのプローブのうちの約19Kが、マウスにおいて有用であるに過ぎない。ヒトからより遠い種は、有用なプローブがEPICチップ上でさらに少ない可能性があり、非ヒト哺乳動物において使用され得るプラットフォームが必要であることを指摘する。
【0039】
DNAメチル化を測定するためのチップ/アレイの代替は、バイサルファイトシーケンシングである(例えば、Meissnerら, Nucleic Acids Research, Volume 33, Issue 18, 1 January 2005, Pages 5868-5877を参照のこと)。これは、全哺乳動物種に適用するが、定量的に信頼性があることは確立されていない。アレイ技術は、加齢および発生の高度でロバストなエピジェネティック生体マーカーの開発のために特に価値がある。本発明は、プローブを選択するためのアルゴリズムおよび全哺乳動物に適用するメチル化アレイ/チップに対して使用され得る(天然でない)ヌクレオチド配列を同定するためのこのアルゴリズムの結果を提供する。本発明者らは、高度に保存された配列が、高度で正確なエピジェネティック加齢クロックを構築するために適していることを示した(例えば、米国特許出願第15/025,185号、発明の名称「METHOD TO ESTIMATE THE AGE OF TISSUES AND CELL TYPES BASED ON EPIGENETIC MARKERS」を参照のこと)。
【0040】
最初のヒトメチル化チップ(ILLUMINA Infinium 27K)は、十年以上前に導入されたが、類似のチップは、他の種に対しては供給されていない。この遅れは、非ヒト種用のメチル化チップをデザインすることが経済的ではないという事実を反映し得る。費用が障害ではないとしても、種特異的アレイの開発は、種間比較を妨げ得る。なぜなら測定プラットフォームが異なるからである。上記で注記されるように、これらの難題に対処するために、本発明者らは、アルゴリズム、Conserved Methylation Array Probe Selector(CMAPS)を開発した。このアルゴリズムは、ヒト内での変動を許容して、種間変異を許容するために使用される縮重塩基技術を再利用する。CMAPSは、複数配列アラインメントに基づいて、ヒトゲノムにおける任意のCpGのためのプローブを使用して標的化され得る種の最大数を得るために、貪欲な検索を行う。CMAPSを、 ヒトゲノムの保存された領域におけるCpG部位を照会するほぼ36,000のプローブをデザインするために使用した。これは、チップを、哺乳動物種に対して直接適用可能にし、従って、種間比較を容易にする。多数の種のためのこのような多数のプローブを得るために、CMAPSは、全プローブをランク付けし、各Infiniumアレイがエキソン、CpGアイランドおよび高メチル化領域対低メチル化領域の外部アノテーションに基づいて、多数の哺乳動物種および様々なゲノム位置を照会し得るように、最終セットを選択する。ヒト研究におけるそのチップの有用性を高めるために、本発明者らはまた、ヒト生体マーカー研究において特に重要である約2,000のプローブを追加した。以下において、本発明者らは、CMAPSアルゴリズムおよび得られたチップ(HorvathMammalMethylChip40)の特性を記載する。
【0041】
ILLUMINA Infiniumプローブ
現在、ILLUMINAが生成したメチル化アレイは、2つのタイプのプローブ:Infinium 1およびInfinium 2を含み得る。Infinium 2は、CGを照会するためにわずか1個のビーズを要求する、より新しい技術である一方で、Infinium 1は、2個のビーズを要求する。
【0042】
MammalMethyl40チップのデザインおよび開発のために、本発明者らは、これらプローブのうちの一方または両方を使用して照合され得る、一連の全ヒトCG部位を活用した。その2つのプローブの各々には、そのプローブが、逆方向ゲノム鎖に対して、順方向ゲノム鎖についてデザインされるかどうかに依存して、2つのバリアントが存在する。そのプローブは、3個までの縮重塩基を可能にし、これは、配列における変動が照合されることを許容し得る。許容される縮重塩基の数は、ILLUMINAによって算定されるプローブのデザインスコア、およびInfinium 2のプローブの場合には、基礎をなすCpGの数の関数である(表1)。
【0043】
ある特定のCpG部位を照会できるために、オリゴヌクレオチドプローブは、CpG部位の上流または下流のいずれかに60塩基対を含むアレイ上で合成されなければならない。縮重塩基技術は、個体が、合成したプローブとのミスマッチを引き起こす隣接領域におけるバリアントを偶然に有するとしても、CpG部位がプローブによって照合されることを可能にする(方法)。本発明者らは、プローブがここで変異を許容し得、他の種に由来するDNAにもハイブリダイズし得るように、各ヒトプローブのための縮重塩基をデザインするために、この技術を再利用するCMAPSアルゴリズムを開発した。CMAPSアルゴリズムを、ヒトゲノムに対する99の他の種の100通りのアラインメントに適用したところ、それは、基礎をなすアレイ技術(この特定の場合には、Infinium技術である)によって指定されたルール内で変異を拾い上げる能力を提供する。しかし、そのアルゴリズムは、一連のデザインの考慮事項とともに、入力として、任意の参照ゲノムとの任意の複数配列アラインメントを採用し得、保存されたプローブおよびその規則内での縮重塩基選択を提供し得る。
【0044】
60,000のプローブの初期セットの決定
ヒトゲノムにおける各CG部位に関して、本発明者らは、上記で記載されるアルゴリズムに基づいて、最多の種を網羅する選択肢から、Infinium 1プローブセットを選択し、Infinium 2に関しても同様にした。本発明者らは、mm10マウスゲノムを標的化した全てのInfinium 2プローブを最初に含めた。その結果、そのチップは、最も広く使用したモデル生物のうちの1つに対して有用であることが保障された。次いで、本発明者らは、Infinium 2プローブで網羅される種の数の降順にCpG部位をソートし、合計で最大53,000のプローブについて、mm10を標的としているために未だ選択されていない全プローブを追加した。次いで、本発明者らは、ILLUMINA EPICアレイ上のプローブを、それらがCMAPSアルゴリズムによって拾い上げられた縮重塩基を使用して標的化し得る種の数の降順にランク付けし、先の基準に基づいて未だ拾い上げられていなかったさらなる3,000のプローブを選択した。最後に、本発明者らは、それらが標的とし得る種の数の降順にCpG部位をソートし、未だ含まれていなかったCpG部位を標的とした上位4,000のInfinium 1プローブを拾い上げた。Infinium 1プローブを選択して、本発明者らがより高密度のCG領域を照会することを可能にした。なぜならInfinium 1プローブの基礎をなすCpG計数は、許可されたSNVの数に対して計数しないからである。これは、本発明者らに合計60,000のプローブを与えた。
【0045】
マッピング可能性に基づくプローブの取捨選択
アレイ上のプローブは、60塩基対の長さしかないことから、それらは、ゲノムにおける多数の位置へとマッピングされるリスクを冒し、これは、多数のCpG部位に由来する混乱したシグナルを生じる。この問題は、本発明者らのプローブの各々が最大2^(縮重塩基の数)のバリアントを有し得るという事実によって複雑になる可能性がある。16の上質なゲノムに関しては、本発明者らは、どのくらい多くのそのバリアントが、そのゲノムにおいて特有にマッピングされるかを、各プローブに関して算定した。次いで、本発明者らは、プローブの全バリアントが、それらが標的とするようにデザインされた種のうちの少なくとも80%において特有にマッピングされなければならない、またはそのプローブが、少なくとも40の種を標的としなければならないということを求めることによって、プローブを選別した。これは、作業プローブのセットを、35,988プローブの最終セットへと整理した。
【0046】
特注のチップの特性
HorvathMammalMethylChip40の概略は、40kより少ないプローブである(よって、末尾が「40」である)。
【0047】
38kのプローブのうちの2000を、ヒト生体マーカー研究に関するそれらの有用性に基づいて選択した。これらのCpG(これをヒトILLUMINA Infiniumアレイ(EPIC, 450K, 27K)において以前に実装した)を、年齢、血球数、または脳組織におけるニューロンの割合を予測するために、それらの関連性に起因して選択した。
【0048】
残りの35,988のプローブを、広く種々の進化的に別個の哺乳動物種におけるシトシンDNAメチル化レベルを評価するために選択した。この目的に向かって、CMAPSアルゴリズムを使用して、50の哺乳動物種: 33,493のInfinium IIプローブおよび2,496のInfinium Iプローブにわたって高度に保存されたCpGを同定した。そのアレイ上の全プローブは、全ての種に対して機能すると予測されるわけではなく、むしろ各プローブは、種の特定の部分セットを網羅するようにデザインされ、その結果、全体的に全ての種が、多数のプローブを有する。各プローブに関する種の特定の部分セットは、チップマニフェストファイルの中で提供される。観察される50の哺乳動物種のうち、その中の46種がアレイ上で10,000を超えるプローブを有し、36種が20,000を超えるプローブを有する(表2)。
【0049】
染色体の環境
これらのプローブによって標的とされるCpG部位は、ゲノムの多様な領域を表す。ヒト内では、CpG部位のうちの40%が、エキソンにおける既知の強い保存シグナルによって予測されるように、エキソン領域内にある。CpG部位の選択されたセットは、Infinium Iプローブを含めるように本発明者らが選択したことに起因して、高密度CpGアイランドを標的とし(
図1)、高メチル化および低メチル化CpG部位の両方を標的とし得る(
図2)。
【0050】
ヒトにおいて高度に保存されたCpGに基づくエピジェネティッククロック
ILLUMINA 27Kアレイ上の404の高度に保存されたCpGを使用して、本発明者らは、Horvath, S. DNA methylation age of human tissues and cell types, Genome Biol. 14, R115 (2013)において開示される汎組織エピジェネティッククロックを開発するために以前使用された同じデータを使用して、新規なエピジェネティッククロックを開発した。
【0051】
試験データにおける偏りのない検証を担保するために、本発明者らは、年齢予測因子を定義するために訓練データのみを使用した。Horvath 2013に詳述されるように、暦年齢の変換バージョンを、ペナルティー付き回帰モデル(elastic net)を使用して、CpGに回帰させた。そのelastic net回帰モデルは、共変数CpGを自動的に選択した。これらの高度に保存されたCpGは、それらの重み付け平均(回帰係数によって形成される)が、エピジェネティッククロックに及ぶことから、(エピジェネティック)クロックCpGといわれる。そのクロックは、404のCpGに基づいたのみであったが、得られたエピジェネティック年齢推定量は、驚くほど、組織および細胞タイプの広い範囲にわたって十分機能する(
図3)。
【0052】
404の高度に保存されたエピジェネティッククロックCpGの線形結合(回帰係数から生じる)は、
図3から認められ得るように、ライフコース全体(ゆりかごから墓場まで)にわたって大きく変動する。赤色の較正曲線は、成人期まで対数依存性を明らかにし、これは、人生の後半になって線形的依存性へと鈍化する。(この赤い曲線の)変化速度は、エピジェネティッククロックのチックレートとして解釈され得る。Horvath 2013の元の汎組織クロックに類似して、本発明者らは、生物成長が、高いチックレートをもたらし、成人期以降、一定のチックレート(線形依存性)に鈍化することを見出す。
【0053】
考察
CMAPSアルゴリズムは、全哺乳動物に適用する新規な哺乳動物メチル化アレイのデザインを促進した。その哺乳動物アレイは、哺乳動物にわたる種間比較のためおよび複数の種に適用する生体マーカーの開発のため特別に作られる。本発明者らの研究は、CMAPSアルゴリズムから生じる比較的少数の高度に保存されたCpG(およそ400)が、高度に正確なエピジェネティック年齢推定量(保存されたエピジェネティッククロック)を構築するために既に適していることを示す。
【0054】
全体として、本発明者らは、哺乳動物チップが哺乳動物におけるDNAメチル化ベースの生体マーカー研究に特によく適していると予測する。例えば、本発明は、1つの種(例えば、マウス)におけるDNAメチル化レベルに影響を及ぼす特定の介入(例えば、治療剤および/またはレジメン)が、別の種(例えば、ヒト)における相当するDNAメチル化レベルにも影響を及ぼすかどうかを評価することを可能にする。
【0055】
方法
保存されたメチル化アレイプローブセレクター(CMAPS)
CMAPSアルゴリズムを、99の脊椎動物と、UCSC Genome Browser(7)からダウンロードしたhg19 ヒトゲノムとのMultizアラインメントに適用した。このチップの目的に関して、このアラインメントにおける哺乳動物種のみを考慮した。ヒトゲノムにおける各CpGのデザインスコアおよび各位置におけるプローブの各可能なタイプを、ILLUMINAが提供し、CMAPSによる入力として採用した。ヒトゲノムにおける各CG部位に関して、本発明者らは、許容される変異の最大数の各可能な配置を考慮して、ヒトにおいて4種の異なる可能なプローブデザインの各々によって標的とされ得る種の最大数を算定した。各プローブ選択肢に関して、本発明者らは、潜在的なバリアントの最大数を配置するために全ての可能性を試行し、特定の位置において最多の種を網羅するバリアントを貪欲に拾い上げた。より具体的には、プローブによって網羅される種の数を選択するためのアルゴリズムは、以下の擬似コードにおける説明である:
関数 get_max_speciesは、ある特定のSNVのヌクレオチドについて、どのヌクレオチドが、その位置でアラインメントにある大多数の種に含まれていようとも、それを拾い上げることによって、貪欲な選択を行う。
Function get_max_species(SNV_pos, num_SNV, multiple_sequence_alignment):
max_species = []
for X in {A, C, T, G}
count_species = number of species with X at SNV_pos in the multiple_sequence_alignment
max_species.append(count_species, x))
sort(max_species, descending = True) # 網羅される種の数を降順にソートする
return max_species[:num_SNV][,1] # 上位のnum_SNVヌクレオチドを、それらが標的とする種の数が多い順に戻す
【0056】
以下の擬似コードでは、SNV_setは、デザインスコアおよびプローブタイプ制限を仮定して、特定のプローブにおけるSNVの全ての可能な位置に対して繰り返す。
Cur_max_species = 1
for SNV_set in all positions in probe:
alt_nucleotide_list = []
for SNV_pos in SNV_set:
alt_nucleotide_list.append(get_max_species(SNV_pos, multiple_sequence_alignment, count(SNV_pos, SNV_set)))
num_species = number of species fully matching human given SNV_set and alt_nucleotide_list
if num_species > cur_max_species:
cur_max_species = num_species
final_SNV_set = SNV_set
【0057】
get_max_species関数は、貪欲な選択を行うことから、これは、プローブに関する種の真の最大部分セットでなくてもよいが、この方法は、比較的計算上安価であり、本発明者らの目的に対して満足のいく種のカバレッジをもたらした。
【0058】
補足データ: SupplementMammalianChip36Kprobes
以下の説明は、変数を記載する。
Forward_Sequence: 順方向鎖上の配列
Genome_Build: ヒトゲノム構築
Chromosome: ヒト染色体CG部位がある
Coordinate: CG部位における「C」のヒトゲノム座標(1から始まる(1-based))
TB_Strand_OrigP: TOP/BOTTOM鎖
Top_Sequence: TOP鎖上の配列
Methyl_Probe_Sequence: Infinium 2に対して選択した配列から一つずれているメチル化プローブ配列
Allele_Fr_Strand: 順方向/逆方向鎖
Allele_TB_Strand: TOP/BOT鎖
Allele_CO_Strand: 転換/反対鎖
Underlying_CpG_Count: 各部位について基礎をなすCpG計数
UnMethyl_Probe_Sequence: Infinium 2について選択した配列から一つずれている非メチル化プローブ配列
Num_Species: 哺乳動物種プローブ の数は、機能すると予測される。
種: プローブが機能すると予測される種のカンマで区切られたゲノムアセンブリ名
Probe_Start_Coord: 1から始まるhg19順方向鎖におけるプローブ開始座標
Probe_End_Coord: 1から始まるhg19順方向鎖におけるプローブ終了座標
Reference_Probe_Sequence: 1から始まるhg19におけるプローブ順方向鎖参照配列
SNV_location: SNVが存在する塩基のhg19の1から始まるカンマ区切り座標
designed forSNV_original: 各SNVに関してhg19のカンマで区切られた参照ヌクレオチド; SNV_locationにおける座標の順序との1-1対応
SNV_change: 各SNVにつきカンマで区切られた代替設計のヌクレオチド; SNV_locationにおける座標の順序およびSNV_originalにおける参照ヌクレオチドとの1-1対応
Infinium_Type: Inf1/Inf2 Infinium プローブタイプ
Is_EPIC_site: CG部位がまた、EPIC Array上のプローブによって照会されるかどうかを示す0/1二値変数
Is_EPIC_design: EPIC Array上でこの部位を照会するプローブが、同じInfiniumタイプ (1/2)であり、同じ鎖 (順方向/逆方向および転換/反対の両方)であるかどうかを示す0/1 二値変数; Is_EPIC_siteが0であれば、常に0である
Nvariants: SNVに基づくプローブの変動の数 効果的には2^(SNVの数) マッピング可能性分析(mappability analysis)において使用される
【0059】
【0060】
【0061】
【0062】
本発明の局面において有用な方法および材料を記載する参考文献
本明細書で言及される全ての刊行物は、引用された刊行物に関連した局面、方法および/または材料を開示および記載するために、本明細書に参考として援用される。例えば、米国特許公開20150259742号、Stefan Horvathによって出願された米国特許出願第15/025,185号、発明の名称「METHOD TO ESTIMATE THE AGE OF TISSUES AND CELL TYPES BASED ON EPIGENETIC MARKERS」;Eric Villainらによって出願された米国特許出願第14/119,145号、発明の名称「METHOD TO ESTIMATE AGE OF INDIVIDUAL BASED ON EPIGENETIC MARKERS IN BIOLOGICAL SAMPLE」;およびHannumら. 「Genome-Wide Methylation Profiles Reveal Quantitative Views Of Human Aging Rates.」 Molecular Cell. 2013; 49(2):359-367および特許US2015/0259742号は、それらの全体において本明細書に参考として援用される。
【0063】
引用参考文献
1. Bernstein, B. E., Meissner, A. & Lander, E. S. The Mammalian Epigenome. Cell 128, 669-681 (2007).
2. Smith, Z. D. & Meissner, A. DNA methylation: roles in mammalian development. Nature Reviews Genetics 14, 204-220 (2013).
3. Horvath, S. DNA methylation age of human tissues and cell types. Genome Biol. 14, R115 (2013).
4. Genome-wide DNA methylation profiling using Infinium(登録商標)assay | Epigenomics. Available at: https://www.futuremedicine.com/doi/abs/10.2217/epi.09.14. (Accessed: 28th August 2018)
5. Evaluation of the Infinium Methylation 450K technology. - PubMed - NCBI. Available at: https://www.ncbi.nlm.nih.gov/pubmed/22126295. (Accessed: 28th August 2018)
6. Pidsley, R. et al. Critical evaluation of the ILLUMINA MethylationEPIC BeadChip microarray for whole-genome DNA methylation profiling. Genome Biology 17, 208 (2016).
7. Rosenbloom, K. R. et al. The UCSC Genome Browser database: 2015 update. Nucleic Acids Res. 43, D670-681 (2015).
【0064】
本発明の局面において有用な方法および材料を記載するさらなる刊行物
1. Horvath S: DNA methylation age of human tissues and cell types. Genome Biol 2013, 14:R115.
2. Hannum G, Guinney J, Zhao L, Zhang L, Hughes G, Sadda S, Klotzle B, Bibikova M, Fan JB, Gao Y, et al: Genome-wide methylation profiles reveal quantitative views of human aging rates. Mol Cell 2013, 49:359-367.
3. Bocklandt S, Lin W, Sehl ME, Sanchez FJ, Sinsheimer JS, Horvath S, Vilain E: Epigenetic predictor of age. PLoS One 2011, 6:e14821.
4. Levine ME, Lu AT, Quach A, Chen BH, Assimes TL, Bandinelli S, Hou L, Baccarelli AA, Stewart JD, Li Y, et al: An epigenetic biomarker of aging for lifespan and healthspan. Aging (Albany NY) 2018.
5. Zhang Y, Wilson R, Heiss J, Breitling LP, Saum KU, Schottker B, Holleczek B, Waldenberger M, Peters A, Brenner H: DNA methylation signatures in peripheral blood strongly predict all-cause mortality. Nat Commun 2017, 8:14617.
6. Bocklandt S, Lin W, Sehl ME, Sanchez FJ, Sinsheimer JS, Horvath S, Vilain E: Epigenetic predictor of age. PLoS One 2011, 6.
7. Weidner CI: Aging of blood can be tracked by DNA methylation changes at just three CpG sites. Genome Biol 2014, 15.
8. Hannum G: Genome-wide methylation profiles reveal quantitative views of human aging rates. Mol Cell 2013, 49.
9. Lin Q, Weidner CI, Costa IG, Marioni RE, Ferreira MRP, Deary IJ: DNA methylation levels at individual age-associated CpG sites can be indicative for life expectancy. Aging 2016, 8:394-401.
10. Marioni R, Shah S, McRae A, Chen B, Colicino E, Harris S, Gibson J, Henders A, Redmond P, Cox S, et al: DNA methylation age of blood predicts all-cause mortality in later life. Genome Biol 2015, 16:25.
11. Christiansen L, Lenart A, Tan Q, Vaupel JW, Aviv A, McGue M, Christensen K: DNA methylation age is associated with mortality in a longitudinal Danish twin study. Aging Cell 2015.
12. Perna L, Zhang Y, Mons U, Holleczek B, Saum K-U, Brenner H: Epigenetic age acceleration predicts cancer, cardiovascular, and all-cause mortality in a German case cohort. Clinical Epigenetics 2016, 8:1-7.
13. Horvath S, Pirazzini C, Bacalini MG, Gentilini D, Blasio AM, Delledonne M, Mari D, Arosio B, Monti D, Passarino G: Decreased epigenetic age of PBMCs from Italian semi-supercentenarians and their offspring. Aging (Albany NY) 2015, 7.
【0065】
結論
これは、本発明の好ましい実施形態の説明を結論づける。本発明の1またはこれより多くの実施形態の前述の説明は、例証および説明目的で示されている。網羅的であることも、本発明を開示されるその正確な形態に限定することも意図されない。多くの改変および変動は、上記の教示に照らして可能である。
【配列表】