(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024072073
(43)【公開日】2024-05-27
(54)【発明の名称】生物学的年齢の計算方法、老化状態の評価方法、CpGサイトの評価方法、プログラム、およびコンピュータ可読記憶媒体
(51)【国際特許分類】
C12Q 1/68 20180101AFI20240520BHJP
G16H 50/00 20180101ALI20240520BHJP
【FI】
C12Q1/68
G16H50/00
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022182688
(22)【出願日】2022-11-15
(11)【特許番号】
(45)【特許公報発行日】2024-03-04
(71)【出願人】
【識別番号】507148456
【氏名又は名称】学校法人 岩手医科大学
(74)【代理人】
【識別番号】110000176
【氏名又は名称】弁理士法人一色国際特許事務所
(72)【発明者】
【氏名】小巻 翔平
(72)【発明者】
【氏名】清水 厚志
(72)【発明者】
【氏名】八谷 剛史
【テーマコード(参考)】
4B063
5L099
【Fターム(参考)】
4B063QA01
4B063QA20
4B063QQ02
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR32
4B063QR35
4B063QR72
4B063QR77
4B063QR90
4B063QS39
4B063QX01
5L099AA15
(57)【要約】
【課題】本発明は、生物学的年齢の新規な計算方法を提供することを目的とする。
【解決手段】
本発明にかかる生物学的年齢の計算方法は、個人の生物学的年齢の計算方法であって、個人から得られた細胞集団のゲノムにおいて、表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、
(1)215個以上235個以下のCpGサイトを選択するか、または
(2)235個のCpGサイトに、ランダムに選択された1~3個のCpGサイトを追加することによって、
CpGサイトのプールを作る工程と、前記プールのCpGサイトのメチル化を調べ、前記プールのCpGサイトの各々におけるメチル化率を算出する工程と、下記数式を用いて、前記個人の生物学的年齢を計算する工程と、
【数1】
(ただし、t=79~85であり、DNAm
nは、表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、表1に記載のn番の染色体の位置に対する係数の50%~150%にある値を示す。)を含む、計算方法である。
【選択図】なし
【特許請求の範囲】
【請求項1】
個人の生物学的年齢の計算方法であって、
個人から得られた細胞集団のゲノムにおいて、下記表に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、
(1)215個以上235個以下のCpGサイトを選択するか、または
(2)235個のCpGサイトに、ランダムに選択された1~3個のCpGサイトを追加することによって、
CpGサイトのプールを作る工程と、
前記プールのCpGサイトのメチル化を調べ、前記プールのCpGサイトの各々におけるメチル化率を算出する工程と、
下記数式を用いて、前記個人の生物学的年齢を計算する工程と、
【数1】
(ただし、t=79~85であり、DNAm
nは、下記表に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、下記表に記載のn番の染色体の位置に対する係数の50%~150%にある値を示す。)
を含む、計算方法。
[表]
【請求項2】
t=80~84である、請求項1に記載の計算方法。
【請求項3】
t=81.946609である、請求項1に記載の計算方法。
【請求項4】
Cnは、前記表に記載のn番の染色体の位置に対する係数の80%~120%にある値を示す、請求項1に記載の計算方法。
【請求項5】
Cnは、前記表に記載のn番の染色体の位置に対する係数である、請求項1に記載の計算方法。
【請求項6】
前記表に記載の235個のCpGサイトが選択されて、CpGサイトのプールが作られる、請求項1~5のいずれか1項に記載の計算方法。
【請求項7】
前記個人がアジア人である、請求項1~6のいずれか1項に記載の計算方法。
【請求項8】
前記細胞集団が血液細胞である、請求項1~7のいずれか1項に記載の計算方法。
【請求項9】
個人の老化状態の評価方法であって、
請求項1~8のいずれか1項に記載の計算方法によって、前記個人の生物学的年齢を計算する工程と、
前記個人の前記生物学的年齢と、前記個人の暦年齢と、を比較する工程と、
を含む、評価方法。
【請求項10】
個人の生物学的年齢を計算するためのCpGサイトの評価方法であって、
ある個人から得られた細胞集団のゲノムにおいて、下記表に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、
(1)200個以上214個以下のCpGサイトを選択するか、または
(2)235個のCpGサイトに、4~6個のCpGサイトを追加することによって、
CpGサイトのプールを作る工程と、
前記プールのCpGサイトのメチル化を調べ、前記プールのCpGサイトの各々におけるメチル化率を算出する工程と、
下記数式を用いて、前記個人の生物学的年齢を計算する工程と、
【数2】
(ただし、t=79~85であり、DNAm
nは、下記表に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、下記表に記載のn番の染色体の位置に対する係数の50%~150%にある値を示す。)
を含む、評価方法。
[表]
【請求項11】
前記個人がアジア人である、請求項10に記載の評価方法。
【請求項12】
前記細胞集団が血液細胞である、請求項10または11に記載の評価方法。
【請求項13】
請求項1~8のいずれか1項に記載の計算方法、または請求項9~12のいずれか1項に記載の評価方法をコンピュータに実行させるためのプログラム。
【請求項14】
請求項13に記載のプログラムを格納するコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生物学的年齢の計算方法、老化状態の評価方法、CpGサイトの評価方法、プログラム、およびコンピュータ可読記憶媒体に関する。
【背景技術】
【0002】
人は加齢やそれに伴う老化に伴って、様々な疾患を発症したり、認知機能や身体機能の低下を示したりする。人類の平均寿命が伸びている現代社会においては、老化に伴う疾患の発症や機能の低下を呈する期間を遅延させること、すなわち健康寿命を伸ばすことの重要性が増している。そのためには個人の老化状態を評価することが不可欠であるが、老化は個人によって進行速度が異なるため、暦年齢ではなく生物学的年齢を評価できる指標が必要である。
【0003】
たとえば、従来、生物学的年齢を評価する対象としてDNAメチル化を用いるEpigenetic clockという概念が存在する。DNAメチル化状態は環境要因などによって後天的に変化し、一部のCpGは老化に伴って一定のDNAメチル化率の変化を示す。そこで幅広い暦年齢や老化状態の人に由来するDNAのメチル化情報から年齢や老化状態と関連するCpGを特定し、個人の生物学的年齢をDNAメチル化情報から計算された数値として推定することを可能にするモデルが開発されている。このモデルにおいて、DNAメチル化情報から計算された数値は、エピゲノム年齢と呼ばれる。このモデルを用いて計算された、ある個人のエピゲノム年齢と、その個人の暦年齢を比較することで、その個人の老化の進行度を評価することも可能である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、新規な生物学的年齢の計算方法、新規な老化状態の評価方法、新規なCpGサイトの評価方法、新規なプログラム、および新規なコンピュータ可読記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一実施態様は、個人の生物学的年齢の計算方法であって、個人から得られた細胞集団のゲノムにおいて、下記表1に記載の1~235番の染色体の位置(GRCh37に基づく)のDNAにあるCpGサイトのうち、(1)215個以上235個以下のCpGサイトを選択するか、または(2)235個のCpGサイトに、ランダムに選択された1~3個のCpGサイトを追加することによって、CpGサイトのプールを作る工程と、前記プールのCpGサイトのメチル化を調べ、前記プールのCpGサイトの各々におけるメチル化率を算出する工程と、下記数式を用いて、前記個人の生物学的年齢を計算する工程と、
【0006】
[数1]
(ただし、t=79~85であり、DNAm
nは、下記表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、下記表1に記載のn番の染色体の位置に対する係数の50%~150%にある値を示す。)を含む、計算方法である。t=80~84であってもよく、t=81.946609であってもよい。C
nは、下記表1に記載のn番の染色体の位置に対する係数の80%~120%にある値であってもよく、下記表1に記載のn番の染色体の位置に対する係数の値であってもよい。表1に記載の235個のCpGサイトが選択されて、CpGサイトのプールが作られてもよい。前記個人がアジア人であってもよい。前記細胞集団が血液細胞であってもよい。
【0007】
本発明の他の実施態様は、個人の老化状態の評価方法であって、上記いずれかの計算方法によって、前記個人の生物学的年齢を計算する工程と、前記個人の前記生物学的年齢と、前記個人の暦年齢と、を比較する工程と、を含む、評価方法である。
【0008】
本発明のさらなる実施態様は、個人の生物学的年齢を計算するためのCpGサイトの評価方法であって、ある個人から得られた細胞集団のゲノムにおいて、下記表1に記載の1~235番の染色体の位置(GRCh37に基づく)のDNAにあるCpGサイトのうち、(1)200個以上214個以下のCpGサイトを選択するか、または(2)235個のCpGサイトに、4~6個のCpGサイトを追加することによって、CpGサイトのプールを作る工程と、前記プールのCpGサイトのメチル化を調べ、前記プールのCpGサイトの各々におけるメチル化率を算出する工程と、下記数式を用いて、前記個人の生物学的年齢を計算する工程と、
【0009】
[数2]
(ただし、t=79~85であり、DNAm
nは、下記表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、下記表1に記載のn番の染色体の位置に対する係数の50%~150%にある値を示す。)を含む、評価方法である。前記個人がアジア人であってもよい。前記細胞集団が血液細胞であってもよい。
【0010】
本発明のさらなる実施態様は、上記いずれかの計算方法または評価方法をコンピュータに実行させるためのプログラムおよび当該プログラムを格納するコンピュータ可読記憶媒体である。
【発明の効果】
【0011】
本発明によって新規な生物学的年齢の計算方法、新規な老化状態の評価方法、新規なCpGサイトの評価方法、新規なプログラム、および新規なコンピュータ可読記憶媒体を提供することができるようになった。
【図面の簡単な説明】
【0012】
【
図1A】本発明の実施例において、表1に記載の1~50番目の染色体の位置のDNAにあるCpGサイトにおける、被検者の暦年齢(Chronological Age)(x軸)とメチル化率(%)(y軸)との関係を示したグラフである。
【
図1B】本発明の実施例において、表1に記載の51~100番目の染色体の位置のDNAにあるCpGサイトにおける、被検者の暦年齢(Chronological Age)(x軸)とメチル化率(%)(y軸)との関係を示したグラフである。
【
図1C】本発明の実施例において、表1に記載の101~150番目の染色体の位置のDNAにあるCpGサイトにおける、被検者の暦年齢(Chronological Age)(x軸)とメチル化率(%)(y軸)との関係を示したグラフである。
【
図1D】本発明の実施例において、表1に記載の151~200番目の染色体の位置のDNAにあるCpGサイトにおける、被検者の暦年齢(Chronological Age)(x軸)とメチル化率(%)(y軸)との関係を示したグラフである。
【
図1E】本発明の実施例において、表1に記載の201~235番目の染色体の位置のDNAにあるCpGサイトにおける、被検者の暦年齢(Chronological Age)(x軸)とメチル化率(%)(y軸)との関係を示したグラフである。
【
図2】(a)本発明の実施例において、エピゲノム年齢の計算式を用いて得られたエピゲノム年齢(Epigenetic Age)と暦年齢(Chronological Age)との相関を示したグラフである。(b)本発明の実施例において、血液細胞種特異的なDNAメチル化率を示すCpGサイトを用いて得られたエピゲノム年齢(Epigenetic Age)に対する老化評価度の計算式の値(Epigenetic Age Acceleration)を、暦年齢に対してプロットしたグラフである。
【
図3A】表1に記載の1~235番のCpGサイトにおいて、ランダムにCpGサイトを除外し、残ったCpGサイトでエピゲノム年齢を算出した実施例において、除外したCpGサイトの個数(x軸)に対して、エピゲノム年齢と暦年齢との差の絶対値(y軸)をプロットしたグラフである。なお、エピゲノム年齢と暦年齢との差の絶対値は、中央値(点)と四分位範囲(線分)で示した。
【
図3B】表1に記載の1~235番のCpGサイトにおいて、ランダムにCpGサイトを除外し、残ったCpGサイトでエピゲノム年齢を算出した実施例において、除外したCpGサイトの個数(x軸)に対して、エピゲノム年齢と暦年齢の相関係数(y軸)をプロットしたグラフである。なお、エピゲノム年齢と暦年齢の相関係数は、中央値(点)と四分位範囲(線分)で示した。
【
図4A】表1に記載の1~235番のCpGサイトにおいて、ランダムに選択された表1に記載のないCpGサイトを追加し、得られたCpGサイトでエピゲノム年齢を算出した実施例において、追加した個数(x軸)に対して、エピゲノム年齢と暦年齢との差の絶対値の平均(y軸)をプロットしたグラフである。なお、エピゲノム年齢と暦年齢との差の絶対値は、中央値(点)と四分位範囲(線分)で示した。
【
図4B】表1に記載の1~235番のCpGサイトにおいて、ランダムに選択された表1に記載のないCpGサイトを追加し、得られたCpGサイトでエピゲノム年齢を算出した実施例において、追加したCpGサイトの個数(x軸)に対して、エピゲノム年齢と暦年齢の相関係数(y軸)をプロットしたグラフである。なお、エピゲノム年齢と暦年齢の相関係数は、中央値(点)と四分位範囲(線分)で示した。
【
図5】実施例1で得られたエピゲノム年齢の計算式において、表1に記載の係数に対して1-x~1+x(xは0、0.50、または1.00)の間の乱数をかけて得られた係数を用いてエピゲノム年齢を算出し、エピゲノム年齢(Epigenetic Age)と暦年齢(Chronological Age)の相関を示したグラフである。
【
図6】実施例1で得られたエピゲノム年齢の計算式において、表1に記載の係数に対して1-x~1+x(xは0.00以上1.00以下で、0.01刻みの101通りの数)の間の乱数をかけて得られた係数を用いてエピゲノム年齢を算出し、x(x軸)に対して、エピゲノム年齢と暦年齢との差の絶対値(y軸)をプロットしたグラフである。なお、エピゲノム年齢と暦年齢との差の絶対値は、中央値(点)と四分位範囲(線分)で示した。
【発明を実施するための形態】
【0013】
本発明の目的、特徴、利点、およびそのアイデアは、本明細書の記載により、当業者には明らかであり、本明細書の記載から、当業者であれば、容易に本発明を再現できる。以下に記載された発明の実施の形態および具体的な実施例などは、本発明の好ましい実施態様を示すものであり、例示または説明のために示されているのであって、本発明をそれらに限定するものではない。本明細書で開示されている本発明の意図並びに範囲内で、本明細書の記載に基づき、様々な改変並びに修飾ができることは、当業者にとって明らかである。なお、本明細書で、表についての「N番」とは、表の上から数えてN番目を表すこととする。
【0014】
==生物学的年齢の計算方法==
本明細書に開示の、個人の生物学的年齢の計算方法は、個人から細胞集団を得る工程と、細胞集団からゲノムを抽出する工程と、細胞集団のゲノムにおいて、表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、
【0015】
(1)第1の個数のCpGサイトを選択するか、または
(2)235個のCpGサイトに、ランダムに選択された第2の個数のCpGサイトを追加することによって、
【0016】
CpGサイトのプールを作る工程と、作られたプールのCpGサイトのメチル化を調べ、プールのCpGサイトの各々におけるメチル化率を算出する工程と、下記数式を用いて、個人の生物学的年齢を計算する工程と、を含む。
【0017】
[数3]
(式中、tは第1の係数であり、DNAm
nは、表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、表1に記載のn番の染色体の位置に対する第2の係数を示す。)
【表1】
【0018】
なお、本明細書において、「生物学的年齢」とは、その年齢が暦年齢である人々の平均的老化度を有するエピゲノム年齢を意味する。また、本明細書において、染色体上の位置は、GRCh37上の位置によって特定される。
【0019】
個人の人種、国籍、および所属する集団は特に限定されないが、アジア人であることが好ましく、東アジア人であることがより好ましく、日本人であることがさらに好ましい。ここで、アジア人、東アジア人、および日本人とは、ゲノム情報またはミトコンドリアDNA情報に基づいた人種解析によって、それぞれ、アジア人、東アジア人、および日本人の大多数からなるクラスターの中に入る個体をいうものとする。解析方法は特に限定されず、例えばマイクロサテライトDNA多型を用いた方法など、学術的に認定されているものであればよい。
【0020】
細胞集団の細胞種(cell type)は特に限定されず、単数の細胞種から成っていても、複数の細胞種から成っていてもよい。取得しやすいという理由から血液細胞が好ましい。
【0021】
第1の係数tは、77~87であることが好ましく、79~85であることがより好ましく、80~84であることがさらに好ましく、81.946609であることがさらに好ましい。
【0022】
第2の係数Cnは、表1に記載の値に対して、50~150%の範囲にある値であることが好ましく、80~120%の範囲にある値であることがより好ましく、95~105%の範囲にある値であることがさらに好ましく、100%(すなわち、表1に記載の値)であることがさらに好ましい。
【0023】
表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、CpGサイトを選択する第1の個数は、185個以上235個以下であることが好ましく、215個以上235個以下であることがより好ましく、225個以上235個以下であることがさらに好ましく、230個以上235個以下であることがさらに好ましく、235個全てであることがさらに好ましい。
【0024】
また、表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、235個のCpGサイトに追加する、ランダムに選択されたCpGサイトの個数は、1~9個であることが好ましく、1~6個であることがさらに好ましく、1~3個であることがさらに好ましい。
【0025】
CpGサイトのメチル化を解析する方法は特に限定されず、公知の方法を使えばよい。例えば、バイサルファイト法では、DNAをバイサルファイトで処理すると、非メチル化シトシンはウラシルに変換され、メチル化シトシンはシトシンのままで変換されないため、処理後、塩基配列を決定し、処理前のDNA配列と処理後のDNA配列を比較し、処理前にはシトシンで処理後にウラシルになった塩基を非メチル化シトシンと特定し、処理前にはシトシンで処理後もシトシンである塩基をメチル化シトシンであると特定できる。
【0026】
各CpGサイトにおけるメチル化率は、CpGサイトにおけるメチル化を調べたゲノムが由来する細胞集団において、CpGサイト全体の数に対する、メチル化されているCpGサイトの割合として計算することができる。例えば、上述したバイサルファイト法では、各CpGサイトにおいて、配列決定時のシトシンとウラシルのシグナルの強さを比較することで、メチル化率を算出することができる。具体的には、シトシンのシグナルの強さとウラシルのシグナルの強さの合計に対するシトシンのシグナルの強さの割合がメチル化率である。
【0027】
実施例で示すように、この方法を用いることによって、ある個人の生物学的年齢を計算することができる。
【0028】
また、ここに記載した計算方法をコンピュータに実行させるためのプログラム、およびそのプログラムを格納するコンピュータ可読記憶媒体も、本発明の実施形態である。
【0029】
==個人の老化状態の評価方法==
本明細書に開示されている個人の老化状態の評価方法は、上述した生物学的年齢の計算方法によって、個人の生物学的年齢を計算する工程と、個人の生物学的年齢と、個人の暦年齢と、を比較する工程と、を含む。ここで、ある個人の「老化状態」とは、老化の特定の一側面をいうのではなく、年齢によって規定され、その年齢の人の標準的な身体状態をいう。具体的な評価方法として、個人の生物学的年齢を個人の暦年齢と比較し、生物学的年齢のほうが暦年齢より大きければ、その人は標準より老化が進んでおり、生物学的年齢が暦年齢と等しければ、その人は標準的に老化しており、生物学的年齢のほうが暦年齢より小さければ、その人は標準より老化が進んでいない、と評価できる。ここで、「標準」とは、その年齢の人の平均的な老化状態を意味する。
【0030】
例えば、老化評価度として、(生物学的年齢-暦年齢)と定義し、値が大きくなるほど老化度が大きいと評価し、値が小さくなるほど老化度が小さい、と判断することもできる。
【0031】
また、下記式によって老化評価度を求め、値が大きくなるほど老化度が大きいと評価し、値が小さくなるほど老化度が小さい、と判断してもよい。
【0032】
[数4]
老化評価度=p1+暦年齢×p2-エピゲノム年齢
式中、第1の定数p1は、7.5~7.8であることが好ましく、7.677139であることがより好ましい。第2の定数p2は、0.8~0.9であることが好ましく、0.8507557であることがより好ましい。
【0033】
さらに、細胞集団が血液細胞の場合、細胞種の組成を決め、血液細胞種ごとにDNAメチル化率をそれぞれ算出し、下記式によって老化評価度を求め、値が大きくなるほど老化度が大きいと評価し、値が小さくなるほど老化度が小さい、と判断してもよい。細胞種の組成の分析は、血液を各細胞で分離して行ってもよく、血液細胞種特異的なDNAメチル化率を用いて行ってもよい。
【0034】
[数5]
老化評価度=q1+暦年齢×q2+CD8×q3+CD4×q4+NK×q5+B×q6+M×q7+N×q8-エピゲノム年齢
式中、CD8、CD4、NK、B、M、およびNは、それぞれCD8+T細胞、CD4+T細胞、NK細胞、B細胞、単球、および好中球でのDNAメチル化率である。また、第1の定数q1は、64~65であることが好ましく、64.30288であることがより好ましい。第2の定数q2は、0.8~0.9であることが好ましく、0.8674881であることがより好ましい。第3の定数q3は、-40~-50であることが好ましく、-44.36649であることがより好ましい。第4の定数q4は、-70~-80であることが好ましく、-76.08973であることがより好ましい。第5の定数q5は、-45~-55であることが好ましく、-50.9861であることがより好ましい。第6の定数q6は、-47.5~-57.5であることが好ましく、-52.4978であることがより好ましい。第7の定数q7は、-77.5~-87.5であることが好ましく、-82.13944であることがより好ましい。第8の定数q8は、-50~-60であることが好ましく、-55.28485であることがより好ましい。
【0035】
さらに、このような老化評価度を導入することによって、時間の経過とともに、老化の進行が平均より速く進んでいるのか、平均より遅く進んでいるのかについても判断することができるようになる。具体的には、ある時点での老化評価度が、所定時間後に低下した場合、老化の進行が平均より遅く進んでいると判断でき、所定時間後に増加した場合、老化の進行が平均より速く進んでいると判断できる。
【0036】
==生物学的年齢を計算するためのCpGサイトの評価方法==
本明細書に開示の、生物学的年齢を計算するためのCpGサイトの評価方法は、複数の個人から細胞集団を得る工程と、細胞集団からゲノムを抽出する工程と、細胞集団のゲノムにおいて、上記表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、
【0037】
(1)第1の個数のCpGサイトを選択するか、または
(2)235個のCpGサイトに、ランダムに選択された第2の個数のCpGサイトを追加することによって、
【0038】
CpGサイトのプールを作る工程と、作られたプールのCpGサイトのメチル化を調べ、プールのCpGサイトの各々におけるメチル化率を算出する工程と、下記数式2を用いて、個人の生物学的年齢を計算する工程と、を含む。
【0039】
[数6]
(式中、tは第1の係数であり、DNAm
nは、表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C
nは、表1に記載のn番の染色体の位置に対する第2の係数を示す。)
【0040】
個人の人種、国籍、および所属する集団は特に限定されないが、アジア人であることが好ましく、日本人であることがより好ましい。
【0041】
細胞集団の細胞種(cell type)は特に限定されず、単数の細胞種から成っていても、複数の細胞種から成っていてもよい。取得しやすいという理由から血液細胞が好ましい。
【0042】
第1の係数tは、77~87であることが好ましく、79~85であることがより好ましく、80~84であることがさらに好ましく、81.946609であることがさらに好ましい。
【0043】
第2の係数Cnは、表1に記載の値に対して、50~150%の範囲にある値であることが好ましく、80~120%の範囲にある値であることがより好ましく、95~105%の範囲にある値であることがさらに好ましく、100%(すなわち、表1に記載の値)であることがさらに好ましい。
【0044】
表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、CpGサイトを選択する第1の個数は、180個以上214個以下であることが好ましく、200個以上214個以下であることがより好ましい。
【0045】
また、表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトのうち、235個のCpGサイトに追加する、ランダムに選択されたCpGサイトの個数は、4~12個であることが好ましく、4~9個であることがさらに好ましく、4~6個であることがさらに好ましい。
【0046】
この方法を用いることによって、表1に記載のCpGサイトに対し、特定のCpGサイトを加えたり、減らしたりしても、生物学的年齢を適切に計算することができるかどうか、調べることができる。しかも、ランダムなサイトで実施するより高頻度で、好適な条件を見つけることができる。
【実施例0047】
[実施例1]
20代から70代の健常な日本人男女85名の血液からDNAを抽出した。バイサルファイト変換した後、表1に記載の1~235番の染色体の位置のDNAにあるCpGサイトにおいて、シトシンのメチル化率を測定した。各位置における、各人の暦年齢とメチル化率との関係を
図1に示す。
【0048】
得られた結果を下記数式3に代入し、各人のエピゲノム年齢を算出した。
【0049】
[数7]
(式中、t’は81.946609、DNAm
nは、表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C’
nは、表1に記載のn番の染色体の位置に対する係数を示す。)
【0050】
図2aに、エピゲノム年齢と暦年齢との相関を示す。得られた結果から、男女別および全体の相関係数を計算したところ、全体の相関係数が0.964、男性のデータによる相関係数が0.961、女性のデータによる相関係数が、0.970となり、非常に高い相関性が観察され、上記のエピゲノム年齢を生物学的年齢とみなせることがわかる。
【0051】
次に、このようにして得られた各人のエピゲノム年齢を目的変数とし、暦年齢を説明変数とした単回帰分析を行った。こうして得られた回帰式を下記式に示す。
【0052】
[数8]
回帰式:7.677139+暦年齢×0.8507557-エピゲノム年齢
この回帰式を、エピゲノム年齢加速(Epigenetic age acceleration;EAA)を計算するための基準式とすることにより、各人の老化度を判定できる。
【0053】
さらに、DNAメチル化情報から血液細胞種の組成を推定するツールとして、Minfi package(Bioconductor)内のestimateCellCountsの機能を用いて、血液細胞種特異的なDNAメチル化率を示すCpGサイトから、血液細胞種の組成を推定した。そして、暦年齢と細胞種組成推定値を説明変数、エピゲノム年齢を目的変数とした重回帰分析を行った。こうして得られた回帰式を下記式に示す。
【0054】
[数9]
回帰式:64.30288+暦年齢×0.8674881+CD8×(-44.36649)+CD4×(-76.08973)+NK×(-50.9861)+B×(-52.4978)+M×(-82.13944)+N×(-55.28485)-エピゲノム年齢
式中、CD8、CD4、NK、B、M、およびNは、それぞれCD8+T細胞、CD4+T細胞、NK細胞、B細胞、単球、および好中球でのDNAメチル化率である。
【0055】
この回帰式の値をy軸に、暦年齢をx軸にしたグラフを
図2bに示す。その結果、暦年齢にかかわらず、EAAはほぼ0となるため、この回帰式を、エピゲノム年齢加速を計算するための基準式とすることにより、各人の老化度を判定できる。
【0056】
[実施例2]
本実施例では、表1に記載の1~235番のCpGサイトからランダムにCpGサイトを除外し、残ったCpGサイトを下記数式4に適用してエピゲノム年齢を算出し、暦年齢と比較した。具体的には、ランダムに1~100個のCpGサイトを100回選択し、それぞれを除去したCpGサイトの組み合わせを用いて、合計10000回、下記数式4を用いてエピゲノム年齢を算出した。同時に、235個全てを用いて、100回エピゲノム年齢を算出した。
【0057】
[数10]
(式中、t’は81.946609、DNAm
kは、表1に記載のk番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C’
kは、表1に記載のk番の染色体の位置に対する係数を示す。kは、1~235番のCpGサイトからランダムに1~100個のCpGサイトが除外され、残ったCpGサイトの番号を表す数値である。)
【0058】
各エピゲノム年齢について、暦年齢との差の絶対値を求め、x軸に除外した個数、y軸にその差の絶対値の中央値(点)と四分位範囲(線分)とをグラフにプロットし、
図3Aに示す。エピゲノム年齢と暦年齢との差が約5歳になるのは20個のCpGサイトを除外した時だった。なお、除外したCpGサイトの数それぞれに対し、エピゲノム年齢と暦年齢の相関について、Pearsonの相関係数を算出し、x軸に除外した個数、y軸にPearsonの相関係数の中央値(点)と四分位範囲(線分)とをグラフにプロットし、
図3Bに示す。結果として、相関係数が約0.96になるのは、50個のCpGサイトを除外した時だった。
【0059】
従って、235個のCpGサイトから少なくとも185個、好ましくは少なくとも215個をランダムに選択し、数式4に適用しても、暦年齢と極めて高い相関を有する生物学的年齢を求めることができる。
【0060】
[実施例3]
本実施例では、表1に記載の1~235番のCpGサイトにおいて、表1に記載のない染色体の位置のDNAにあるCpGサイトを新たにランダムに追加し、得られたCpGサイトを下記数式5に適用してエピゲノム年齢を算出し、暦年齢と比較した。具体的には、1~100個の表1以外のCpGサイトをランダムに100回選択し、それぞれを追加したCpGサイトの組み合わせを用いて、合計10000回、下記数式5を用いてエピゲノム年齢を算出した。なお、新たに追加した染色体の位置に対する係数は、表1に記載されている係数の最小値~最大値(すなわち-0.100~0.067)の範囲にある乱数をランダムに適用した。同時に、235個全てを用いて、100回エピゲノム年齢を算出した。
【0061】
[数11]
(式中、t’は81.946609、DNAm
kは、表1に記載の染色体の位置および新たに追加した染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C’
kは、表1に記載のk番の染色体の位置に対する係数及び新たに追加した染色体の位置に対する係数を示す。kは、235に新たに追加したCpGサイトの数を加えた数値である。)
【0062】
各エピゲノム年齢について、暦年齢との差の絶対値、およびエピゲノム年齢と暦年齢の相関を実施例2と同様に解析した。その結果を
図4A及び
図4Bに示す。
【0063】
図4Aに示すように、エピゲノム年齢と暦年齢との差が約5歳になるのは3個のCpGサイトを追加した時だった。
図4Bに示すように、相関係数が約0.96になるのは、9個のCpGサイトを追加した時だった。
【0064】
従って、235個のCpGサイトに対して9個好ましくは3個のCpGサイトをランダムに選択して追加し、数式5に適用しても、暦年齢と極めて高い相関を有する生物学的年齢を求めることができる。
【0065】
[実施例4]
本実施例では、表1に記載の係数に対して所定の範囲内の乱数をかけて得られた係数を下記数式6に適用してエピゲノム年齢を算出し、各エピゲノム年齢について、暦年齢との差の絶対値、およびエピゲノム年齢と暦年齢の相関を実施例2と同様に解析した。
【0066】
具体的には、表1に記載の係数に対し、1-x~1+x(xは0.00以上1.00以下で、0.01刻みの101通りの数)の間の乱数を表1に記載の係数にかけることで得られた係数を用い、下記数式6を用いてエピゲノム年齢を算出した。
【0067】
[数12]
(式中、t’は81.946609、DNAm
nは、表1に記載のn番の染色体の位置のDNAにあるCpGサイトのメチル化率を示し、C’
nは、表1に記載の係数に対し、1-x~1+x(xは0.00以上1.00以下で、0.01刻みの101通りの数)の間の乱数を表1に記載の係数にかけることで得られた係数を示す。)暦年齢(x軸)に対して、得られたエピゲノム年齢(y軸)をプロットしたグラフを
図5に示す。
【0068】
図5では、代表的な場合として、(A)x=0、(B)x=0.5、(C)x=1.0の場合を示すが、x=0.5まで係数を変化させても暦年齢とエピゲノム年齢との差はわずかであったが、x=1.0では、暦年齢とエピゲノム年齢との間にかなりのずれが見られた。
【0069】
そこで、各x(x軸)に対し、暦年齢とエピゲノム年齢との差の絶対値(y軸)をプロットしたグラフを
図6に示す。差の絶対値は、中央値(点)±四分位範囲(線分)で示す。
【0070】
図6で示されるように、xが約0.2で暦年齢とエピゲノム年齢との差が約4歳に、xが約0.5でその差が約5歳になった。
【0071】
このように、表1に記載の係数に、ある程度の幅をもたせてエピゲノム年齢を計算しても、暦年齢を推定する十分な精度を有する。