(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-26
(45)【発行日】2022-05-10
(54)【発明の名称】落屑症候群又は落屑緑内障の発症リスクの判定方法
(51)【国際特許分類】
C12Q 1/683 20180101AFI20220427BHJP
C12N 15/09 20060101ALI20220427BHJP
C12M 1/00 20060101ALI20220427BHJP
【FI】
C12Q1/683 Z
C12N15/09 Z ZNA
C12M1/00
(21)【出願番号】P 2018531766
(86)(22)【出願日】2017-06-15
(86)【国際出願番号】 JP2017022158
(87)【国際公開番号】W WO2018025521
(87)【国際公開日】2018-02-08
【審査請求日】2020-06-02
(31)【優先権主張番号】P 2016154676
(32)【優先日】2016-08-05
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】509349141
【氏名又は名称】京都府公立大学法人
(73)【特許権者】
【識別番号】390014960
【氏名又は名称】シスメックス株式会社
(73)【特許権者】
【識別番号】000177634
【氏名又は名称】参天製薬株式会社
(74)【代理人】
【識別番号】100095832
【氏名又は名称】細田 芳徳
(72)【発明者】
【氏名】田代 啓
(72)【発明者】
【氏名】木下 茂
(72)【発明者】
【氏名】森 和彦
(72)【発明者】
【氏名】池田 陽子
(72)【発明者】
【氏名】上野 盛夫
(72)【発明者】
【氏名】中野 正和
(72)【発明者】
【氏名】吉井 健悟
【審査官】松原 寛子
(56)【参考文献】
【文献】国際公開第2008/130009(WO,A1)
【文献】田代啓他,落屑症候群/落屑緑内障のゲノムワイド関連解析,第87回日本生化学会大会要旨集,2014年,2P-412,要旨全文
【文献】NAKANO Masakazu.et al.,Scientific reports,2014年06月18日,DOI: 10.1038/srep05340,p.1-6
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/68
C12N 15/00
C12M 1/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
被検者から採取した
ゲノムDNAを含む生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を含
み、
前記少なくとも30個のSNPが、表1に記載の12個のSNPからなるコアSNP群を含み、
前記情報取得工程が、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントするステップを含み、
前記情報取得工程において、前記総数が予め設定された閾値を上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが低いとの情報が取得される、
被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
【請求項2】
アレル測定工程が、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップ
を含む工程であり、
ここで、前記第1プール選抜SNP群と第2プール選抜SNP群とは非同一である、請求項1記載の方法。
【請求項3】
アレル測定工程が、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップと、
第1コアSNP群及び第2コアSNP群とは異なる1個以上のSNP(第3コアSNP群)と、プールSNP群から選ばれる複数のSNP(第3プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第3SNP群について測定を行う第3測定ステップ
を含む工程であり、
ここで、前記第1プール選抜SNP群と第2プール選抜SNP群と第3プール選抜SNP群とはいずれも非同一である、請求項1記載の方法。
【請求項4】
ゲノムDNAを含む生体試料が血球を含む生体試料である、請求項1~3いずれか記載の方法。
【請求項5】
ゲノムDNAを含む生体試料が白血球を含む生体試料である、請求項1~3いずれか記載の方法。
【請求項6】
情報提供工程が、前記アレル測定工程が複数の測定ステップを含む場合、前記情報取得工程により得られた被検者に関する各測定ステップでの結果が、各測定ステップで用いられたSNP群に基づいて予め設定された閾値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供するステップを含む工程である、請求項2~5いずれか記載の方法。
【請求項7】
情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者が落屑症候群又は落屑緑内障の発症リスクを有する確率を算出するステップを含む工程である、請求項1~5いずれか記載の方法。
【請求項8】
情報提供工程が、前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者の落屑症候群又は落屑緑内障を予め設定されたパーセント(%)以上の確率で発症リスクを有する確率を算出するステップを含む工程である、請求項1~5いずれか記載の方法。
【請求項9】
プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
被検者から採取した
ゲノムDNAを含む生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されて
おり、
前記少なくとも30個のSNPが、表1に記載の12個のSNPからなるコアSNP群を含み、
前記情報取得工程が、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントするステップを含み、
前記情報取得工程において、前記総数が予め設定された閾値を上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが低いとの情報が取得される、
落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
【請求項10】
ゲノムDNAを含む生体試料が血球を含む生体試料である、請求項9記載の検出装置。
【請求項11】
ゲノムDNAを含む生体試料が白血球を含む生体試料である、請求項9記載の検出装置。
【請求項12】
プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
被検者から採取した
ゲノムDNAを含む生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行さ
せ、
前記少なくとも30個のSNPが、表1に記載の12個のSNPからなるコアSNP群を含み、
前記情報取得工程が、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントするステップを含み、
前記情報取得工程において、前記総数が予め設定された閾値を上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが低いとの情報が取得される、
コンピュータプログラム。
【請求項13】
ゲノムDNAを含む生体試料が血球を含む生体試料である、請求項12記載のコンピュータプログラム。
【請求項14】
ゲノムDNAを含む生体試料が白血球を含む生体試料である、請求項12記載のコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、落屑症候群(exfoliation syndrome)又は落屑緑内障(exfoliation glaucoma)の発症リスクを判定する方法、落屑症候群又は落屑緑内障の発症リスク判定装置、及び該装置に実行させるためのコンピュータプログラムに関する。
【背景技術】
【0002】
緑内障は、網膜神経節細胞が障害され、不可逆的に進行し失明に至る神経変性疾患である。緑内障の病型の一つである落屑緑内障は前房内に落屑物質が観察される落屑症候群から発症する緑内障である。
【0003】
非特許文献1では落屑緑内障あるいは落屑症候群において、LOXL1遺伝子に特定のSNPsが認められることが開示されている。また、非特許文献2ではTBC1D21遺伝子とPML遺伝子において、非特許文献3ではCACNA1A遺伝子においても、落屑緑内障あるいは落屑症候群に関連するSNPsが認められることが開示されている。
【先行技術文献】
【非特許文献】
【0004】
【文献】http://science.sciencemag.org/content/sci/317/5843/1397.full.pdf
【文献】http://www.readcube.com/articles/10.1038/srep05340
【文献】http://www.nature.com/ng/journal/v47/n4/pdf/ng.3226.pdf
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の課題は、落屑症候群又は落屑緑内障の発症リスクを高精度に判定する方法、当該方法を実行する落屑症候群又は落屑緑内障の発症リスク判定装置、及び当該装置に実行させるためのコンピュータプログラムを提供することである。
【課題を解決するための手段】
【0006】
本発明者らは、前記課題を解決せんと鋭意検討した結果、本発明者らが保有する多数の落屑症候群又は落屑緑内障患者と非落屑症候群かつ非緑内障健常人の検体を用いて高密度チップにより取得したジェノタイプデータ情報に基づくゲノムワイド関連解析(genome-wide association study, GWAS)を実施することで、落屑症候群又は落屑緑内障の発症リスクマーカーSNP群を同定し、その中でも、高精度な判定に寄与する特定のSNP群を見出し、当該SNP群と残りのSNPから選択されるSNP群とを組み合わせたSNP集団に関して、サンプル中のリスクアレルの総数を測定することにより、落屑症候群又は落屑緑内障の発症リスクを高精度に判定できることを見出し、本発明を完成するに至った。
【0007】
即ち、本発明は、下記〔1〕~〔3〕に関する。
〔1〕 被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を含む、被検者の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法。
〔2〕 プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータを備え、前記メモリには、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている、落屑症候群又は落屑緑内障の発症リスクを有する被検者の検出装置。
〔3〕 プロセッサ及び前記プロセッサの制御下にあるメモリを含むコンピュータであって、
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させる、コンピュータプログラム。
【発明の効果】
【0008】
本発明の方法により、被検者由来のサンプル中に存在する本発明のSNP群について分析することにより、被検者における落屑症候群又は落屑緑内障の発症リスクの有無を判定し、さらには、リスクの高低を予測することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は適切な治療を受けることができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、被検者における落屑症候群又は落屑緑内障の発症リスク判定装置の一例を示した概略図である。
【
図2】
図2は、
図1に示される判定装置のハードウェア構成を示すブロック図である。
【
図3】
図3は、
図1に示される判定装置を用いた落屑症候群又は落屑緑内障の発症リスクの判定のフローチャートである。
【
図4】
図4は、表1記載のSNPと表2から選択されたSNPの計30個を用いて発症リスクの有無の判定を行った結果を示した図である。
【
図5】
図5は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。
【
図6】
図6は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。
【
図7】
図7は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。
【
図8】
図8は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を90個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。
【
図9】
図9は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。
【
図10】
図10は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。
【
図11】
図11は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。
【
図12】
図12は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を120個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。
【
図13】
図13は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを1回とした場合の発症リスクの有無の判定に用いるグラフの一例を示した図である。
【
図14】
図14は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を個々に判定する際に用いるグラフの一例を示した図である。
【
図15】
図15は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無を統合判定する際に用いるグラフの一例を示した図である。
【
図16】
図16は、表1記載のSNPと表2から選択されたSNPを測定対象とし、SNP数を150個、測定ステップを3回とした場合の発症リスクの有無の判定にベイズ定理を用いた結果の一例を示した図である。
【発明を実施するための形態】
【0010】
本発明は、特定の一塩基多型(以下、SNPと記載することもある)についてアレルをin vitroで検出する工程を含む、落屑症候群又は落屑緑内障の発症リスクを判定する方法であって、被検者由来のサンプルにおいて前記したアレルを測定し、当該アレルがリスクアレルである場合に、その情報を用いて落屑症候群又は落屑緑内障の発症リスクがあると判定できる情報を提供する、落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法である。即ち、本発明は、高精度なリスク判定に寄与する特定のSNP群を構成メンバーとして含む測定対象を設定し、そこで検出したリスクアレルの総数を数え、当該リスクアレルの総数が予め設定された閾値を上回る場合に落屑症候群又は落屑緑内障の発症リスクがあるとする情報を提供できることに大きな特徴を有する。これにより、落屑症候群又は落屑緑内障の発症リスクの診断を補助することが可能となる。よって、本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法とは、落屑症候群又は落屑緑内障の発症リスクに関する情報を提供する方法でもあり、また、落屑症候群又は落屑緑内障の発症リスクを判定、評価、又は検査する方法でもある。なお、本明細書において、「多型」または「バリアント」とは、ある生物種におけるゲノムの特定の位置の塩基配列や構造(挿入・欠失、逆位、コピー数)に多様性が認められることを言い、多型が存在する部位(以下、多型部位ともいう)とは一塩基多型(SNP)等のバリアントが認められるゲノム上の部位を言う。
【0011】
本発明において、「アレル」とは、ある多型部位において取りうる、互いに異なる塩基を有するそれぞれの型を言い、「リスクアレル」とは、落屑症候群又は落屑緑内障と関連するSNPの各アレルのうち、落屑症候群又は落屑緑内障ではない健常者群より、落屑症候群又は落屑緑内障の患者群において頻度が高いアレルを言い、「非リスクアレル」とは、リスクアレルではないアレルを言う。
【0012】
本発明において、「落屑症候群又は落屑緑内障の発症リスク」とは、被検者の落屑症候群又は落屑緑内障に関するリスクであり、疾患感受性によって決まる将来的な落屑症候群又は落屑緑内障の発症の可能性を言う。本発明において、リスクの予測とは、被検者の将来のリスクの有無を現時点で判定し、又は、被検者の将来のリスクの大小を現時点で決定することを言う。
【0013】
本発明の落屑症候群又は落屑緑内障の発症リスクの診断を補助する方法は、
特定のSNPについてアレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて被検者の情報を取得する情報取得工程、及び
前記情報に基づいて被検者の発症リスクを判定するための情報を提供する情報提供工程
を含む。以下に工程ごとに順を追って説明するが、先に、本発明において測定対象となる、落屑症候群又は落屑緑内障の発症に関連するSNP群を同定した方法を説明する。なお、落屑症候群又は落屑緑内障の発症に関連するSNP群のことを、本発明のSNP群と記載することもある。
【0014】
(落屑症候群又は落屑緑内障の発症に関連するSNP群の同定)
本発明において、落屑症候群又は落屑緑内障の発症に関連するSNP群は、具体的には、先ず、落屑症候群又は落屑緑内障と診断された患者、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非落屑症候群かつ非緑内障健常者(単に、非患者又は対照者と記載することもある)からゲノムDNAをそれぞれ抽出する。そして、ヒトゲノム上の公知のSNP約20万~500万個を指標として、個々のSNPにおけるアレル頻度を患者群と非患者群において比較し種々解析することにより、頻度の差が統計学的有意であると認められるマーカー候補のSNP群を見出す。次いで、この候補群から更に解析を行うことで、本発明で用いるSNP群(マーカーSNP群)を決定し、その中から、より高精度な判定結果を与える特定のSNP群(コアSNP群)と残りのSNP群(プールSNP群)を設定し、これらを組み合わせて用いることにより、落屑症候群又は落屑緑内障の発症リスクの有無の判定、及び落屑症候群又は落屑緑内障の発症リスクの大小の予測が可能となる。なお、詳細は実施例の項にて説明するが、以下のような方法により、本発明で開示された落屑症候群又は落屑緑内障に関連するSNP群を同定することができる。
【0015】
(1) マーカー候補のSNP群を見出す方法
患者群と非患者群、それぞれの血液からゲノムDNAを抽出する。血液中のゲノムDNAは公知の任意の方法によって抽出することができるが、例えば細胞を溶解して溶出させたDNAを、シリカでコーティングした磁性ビーズの表面に結合させ、磁気を利用して分離、回収することによってDNAを抽出することができる。
【0016】
抽出したDNAサンプル中のSNPにおけるアレルの同定手段は特に限定されず、当該技術において公知のSNP検出方法及びSNPタイピング方法から適宜選択すればよい。
【0017】
ここでは、ゲノムワイド関連解析(GWAS)を用いる手法について説明する。具体的には、例えば、ゲノム全領域に分布するSNPを含むDNAマイクロアレイ(アフィメトリクス社、Genome-Wide Human SNP Array 6.0)を用いて行うことができる。その際に、Quality control(以下、「QC」ともいう)を行うことで、抽出するSNPを選択してもよい。
【0018】
Quality controlにおけるSNP採否の基準となるコールレートとしては、例えば、好ましくは85%以上、より好ましくは90%以上、更に好ましくは95%以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。
【0019】
Quality controlで選択されたSNPについては、更に絞り込みを行う。具体的には、例えば、統計ソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10-3以下、より好ましくは3×10-4以下、更に好ましくは1×10-4以下を満たすSNPを選択する。
【0020】
次に、前記抽出されたSNPについては、ジェノタイピング不良SNPを除外するための2次元クラスタープロット解析、例えば、ジェノタイピングソフトウェア(アフィメトリクス社、Genotyping Console)から得られるクラスタープロット画像を目視で観察することによって、ジェノタイピング不良のSNPを除外して、マーカー候補のSNP群を決定する。
【0021】
このようにして選択されたSNPは、GenBankやdbSNPのような公知配列や公知SNPのデータベースを参照することにより、そのSNPが存在するゲノム上の位置、配列情報、SNPが存在する遺伝子又は近傍に存在する遺伝子、遺伝子上に存在する場合にはイントロン又はエキソンの区別やその機能、他の生物種における相同遺伝子などの情報を得ることができる。
【0022】
(2) マーカーSNP群を見出す方法
次に、前記で得られたマーカー候補のSNP群について、ジェノタイプデータを数値化して抽出する。
【0023】
数値化においては、ジェノタイプデータ及びリスクアレルデータベースを参照して、例えばジェノタイプデータに含まれる所定のアレルにおいて、リスクアレルがホモの場合には数値2を、リスクアレルがヘテロの場合には数値1を、非リスクアレルがホモの場合には数値0を、それぞれ付与する。そして、得られた数値を、各アレルの出現頻度の平均値と観測される頻度を用いて以下の数式により正規化を行って、選択されたSNP群における数値化したジェノタイプデータ行列を作成する。
【0024】
【0025】
なお、リスクアレルとは、患者群に高頻度に出現するアレルをいう。本発明で、リスクアレルはオッズ比に基づいて規定される。オッズ比とは、一般に患者群における危険因子を持つ人の割合と持たない人の割合の比、即ちオッズを、非患者群において同様に求めたオッズで除したものであり、本発明のようなケース・コントロール研究において用いられることが多い。本発明においてオッズ比はアレル頻度に基づいて求められ、患者群における、あるアレルの頻度と他のアレルの比を、非患者群において同様にして得られる頻度の比で除して算出することができる。なお、各アレルの出現頻度は、例えば、被検者のデータを取得するに伴って、そのデータが追加更新されて随時再算出可能なものである。
【0026】
次いで、数値化したジェノタイプデータ行列を用いて、クラスター解析を行う。具体的には、例えば、SNP間の連鎖不平衡(linkage disequilibrium, LD)を考慮し、独立性が高いと思われるSNPを主成分分析(principal component analysis, PCA)により決定する。主成分分析の方法としては、公知の方法を用いることが出来るが、例えば、前記で選択されたSNPについて、全ゲノム又は染色体のそれぞれにおいて情報縮約を行って因子負荷量(主成分と元の変数との間の相関係数に相当)を算出し、それに基づいて候補領域を決定し、当該領域内でP値が最も低いSNPを候補SNPとして選択することで、本発明のマーカーSNP群を決定する。但し、全ゲノムからの計算と染色体のそれぞれからの計算から重複したSNPは除く。
【0027】
次に、本発明のマーカーSNP群から、高精度な判定に寄与する特定のSNP群を更に選定する方法について説明する。以降、かかるSNP群のことを、コアSNP群と記載する。
【0028】
(3) コアSNP群とプールSNP群を見出す方法
コアSNP群は、前記で得られたマーカーSNP群からP値が低い順に50個程度のSNP群を選択し、選択されたSNP群について新たな集団による再現実験を行うことで決定することができる。また、プールSNP群は、マーカーSNP群からコアSNP群を除いた群とする。
【0029】
より詳しくは、前記のようにして選択されたSNP群について、マーカー候補のSNP群を同定する際に用いた患者群と非患者群とは別の集団から、採取したDNAを用いてアレルの同定を行う。ここで、別集団とは、一部に重複が生じていてもよいが、完全非同一が好ましい集団である。解析方法としては、例えば、質量分析法が好ましく、公知のMassARRAYを用いることができる。なお、Quality controlを行ってもよく、その際のコールレートとしては、例えば、好ましくは85%以上、より好ましくは90%以上、更に好ましくは95%以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。
【0030】
次いで、前記同定されたSNPについて、前記と同様にして2次元クラスタープロット解析を行って、ジェノタイピング不良SNPを除外する。
【0031】
このようにして選択されたSNPについて、例えば、ジェノタイピングソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10-3以下、より好ましくは3×10-4以下、更に好ましくは1×10-4以下を満たすSNPを選択する。
【0032】
選択されたSNP群については、2回の解析結果を統合して判断することが好ましいことから、公知のメタ解析の手法、例えば、コクラン・マンテル・ヘンツェル法によって解析結果を統合して評価することができる。そして、当該解析手法によりP値が3×10-3以下を満たすSNPを本発明におけるコアSNP群(計12個)とし、コアSNP群に該当しない残りのSNP群(計450個)をプールSNP群とする。以下に、コアSNP群におけるSNPを含むプローブ配列を表1に、プールSNP群におけるSNPを含むプローブ配列を表2(表2-1~表2-23)にそれぞれ示す。表中、各SNPの対立遺伝子(アレル)はプローブ配列における括弧内に記載し、リスクアレルを含む配列を配列番号A、非リスクアレルを含む配列を配列番号Bとする。
【0033】
【0034】
【0035】
【0036】
【0037】
【0038】
【0039】
【0040】
【0041】
【0042】
【0043】
【0044】
【0045】
【0046】
【0047】
【0048】
【0049】
【0050】
【0051】
【0052】
【0053】
【0054】
【0055】
【0056】
【0057】
かくして選択された本発明のSNP群を用いて、被検者由来のサンプルに対して以下の各工程を行う。
【0058】
〔アレル測定工程〕
アレル測定工程では、前記コアSNP群(表1)について必ず測定を行い、かつ、プールSNP群(表2)から選ばれるSNP(プール選抜SNP群)についても測定を行う。測定対象のSNP数は、コアSNP群を含めた合計が少なくとも30個であれば特に限定はなく、例えば、測定対象が30個の場合は、コアSNP 12個とプール選抜SNP 18個で構成される。測定対象が40個の場合は、コアSNP 12個とプール選抜SNP 28個で構成される。測定対象が50個の場合は、コアSNP 12個とプール選抜SNP 38個で構成される。測定対象が90個の場合は、コアSNP 12個とプール選抜SNP 78個で構成される。測定対象が120個の場合は、コアSNP 12個とプール選抜SNP 108個で構成される。測定対象が150個の場合は、コアSNP 12個とプール選抜SNP 138個で構成される。
【0059】
また、本発明では、1回の測定結果を持って次の情報取得工程に進んでもよいが、判定精度を向上させる観点から、複数回の測定ステップを行って得られた複数の結果を持って情報取得工程に進むことができる。この場合、12個のSNPからなるコアSNP群についてはいずれかの測定ステップで、重複せずに、かつ、12個全てが測定対象として用いられ得る。ステップ毎のコアSNP群の数は同一であっても、異なっていてもよい。また、ステップ毎の測定対象SNP数も同一であっても、異なっていてもよく、各ステップにおいてコアSNP群を含めた合計が少なくとも30個であれば特に限定はない。
【0060】
具体的には、例えば、アレル測定工程が2回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップ
を含む工程が例示され、ここで、前記第1プール選抜SNP群と第2プール選抜SNP群とは非同一である。各測定ステップにおける測定対象のSNP数を例示すると、例えば、第1SNP群における第1コアSNP群は6個、第1プール選抜SNP群が24個以上であり、第2SNP群における第2コアSNP群は6個、第2プール選抜SNP群が24個以上の例が挙げられる。なお、本明細書において「非同一」とは完全同一ではないことを意味し、例えば、1個のみ異なる場合であってもよく、プール選抜SNP群の構成SNPが全て異なる場合であってもよい。
【0061】
また、アレル測定工程が3回の測定ステップを含む場合は、
コアSNP群から選ばれる1個以上のSNP(第1コアSNP群)と、プールSNP群から選ばれる複数のSNP(第1プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第1SNP群について測定を行う第1測定ステップと、
第1コアSNP群とは異なる1個以上のSNP(第2コアSNP群)と、プールSNP群から選ばれる複数のSNP(第2プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第2SNP群について測定を行う第2測定ステップと、
第1コアSNP群及び第2コアSNP群とは異なる1個以上のSNP(第3コアSNP群)と、プールSNP群から選ばれる複数のSNP(第3プール選抜SNP群)とを合わせて少なくとも30個のSNPを含む第3SNP群について測定を行う第3測定ステップ
を含む工程が例示され、ここで、前記第1プール選抜SNP群と第2プール選抜SNP群と第3プール選抜SNP群とはいずれも非同一である。また、各測定ステップにおける測定対象のSNP数を例示すると、例えば、第1SNP群における第1コアSNP群は4個、第1プール選抜SNP群が26個以上であり、第2SNP群における第2コアSNP群は4個、第2プール選抜SNP群が26個以上であり、第3SNP群における第3コアSNP群は4個、第3プール選抜SNP群が26個以上である例が挙げられる。
【0062】
なお、本発明においては、必要により、4回目以降の測定を行うこともできる。
【0063】
本発明で用いられる生体試料としては、ゲノム由来のDNAを抽出可能なものであれば何でも良い。例えば、全血、全血球、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織、又は毛根等が用いられる。かかる生体試料からのDNA抽出方法としては、公知の任意の方法を採用することができる。
【0064】
測定対象のSNP群に関しては、公知の方法に従って、そのアレルを決定して測定結果を得る。具体的には、例えば、本発明のSNP群の配列情報に基づき設計した、各アレルに特異的なプローブ(表1~表2)を用いてハイブリダイズさせ、そのシグナルを検出することによりそれぞれのアレルを検出することができる。プローブを用いてハイブリダイズさせる方法の例としてはタックマン法、インベーダー(Invader(登録商標))法、ライトサイクラー法、サイクリンプローブ法、MPSS法、ビーズアレイ法、DNAチップ法、マイクロアレイ法などがある。また、プローブによるハイブリダイズを行わずにアレルを検出することも可能であり、例えば、PCR-RFLP法、SSCP法、質量分析法、次世代シークエンス法、ダイレクトシークエンス法などを用いることができる。これらの方法は公知の条件に従って行うことができる。
【0065】
かくして得られた測定結果を次の情報取得工程に供する。
【0066】
〔情報取得工程〕
情報取得工程では、測定対象のアレルに基づいて落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する。アレルの情報としては、バリアントが存在するか否かについての情報や測定されたアレルの種類についての情報であってもよく、その数を取得したものであってもよい。また、SNPと相関する値(統計値など)として算出されたものであってもよい。なかでも、本発明では、判定精度を向上する観点から、測定されたアレルがリスクアレルであるか否かを判別し、リスクアレルの総数をカウントしたものであることが好ましい。即ち、予め取得したリスクアレルデータに基づいて、測定されたアレルがリスクアレルであるか否かの判別を行って、測定対象のSNP群全体においてリスクアレルと判定されたアレルの総数(リスクアレル保有数ともいう)を数える。また、複数回の測定ステップを行う場合には、各測定においてリスクアレルの総数があらかじめ設定した予め設定された閾値を超えるかどうかで、陽性か陰性かを判定し、それらの数をカウントする。このようにして得られたリスクアレルの総数と、複数回の測定ステップを行う場合には、更に、各測定結果の陽性、陰性の個数を被検者の定量値として認定して、次の情報提供工程に進むことが好ましい。
【0067】
〔情報提供工程〕
情報提供工程では、得られた情報に基づいて被検者の発症リスクを判定するための情報を被検者に提供する。
【0068】
発症リスクを判定する方法としては、例えば、前記工程により得られる情報がリスクアレル保有数である場合、具体的には、4つの態様が挙げられる。
態様1:リスクアレル保有数の数値によって発症リスクの有無を判定する態様
態様2:複数のリスクアレル保有数が得られる場合の発症リスクの有無を統合して判定する態様
態様3:リスクアレル保有数に基づいて発症リスクを有する確率を算出する態様
態様4:リスクアレル保有数に基づいて所定の確率で発症リスクを有する確率を算出する態様
【0069】
態様1の方法としては、例えば、情報取得工程により得られた被検者に関する結果(リスクアレル保有数)が、アレル測定工程で用いられたSNPに基づいて予めROC(Receiver Operating Characteristic)分析により定められたカットオフ値を、上回る場合は前記被検者が落屑症候群又は落屑緑内障を発症するリスクが高く、下回る場合は当該リスクが低いとの情報を提供する方法が挙げられる。
【0070】
より詳しくは、先ず、被検者のリスクアレル保有数を予め設定された閾値と対比する。閾値とは患者と非患者とを識別する適切なカットオフ値のことであり、当該閾値と定量値を対比することにより、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定できる。
【0071】
閾値は以下のようにして設定することができる。被検者の定量値を取得する際に測定対象として選定されたSNP群と同じSNP群に関して、予め落屑症候群又は落屑緑内障か否かを診断された被検者から採取した生体試料を用いて、上述のようにしてリスクアレル数を測定し、「落屑症候群又は落屑緑内障の発症リスクの有無」と「リスクアレル数」を統計的に処理することにより、両データ間の相関を解析する。解析された結果から、例えば、真陽性率の高さ(感度の高さ)を重視するか、真陰性率の高さ(特異度の高さ)を重視するか、又は真陽性率と真陰性率をどの程度でバランスさせるか等の目的に応じて、閾値を設定することができる。即ち、測定対象のSNP群が異なれば、そこに存在するリスクアレルも当然異なることから、測定対象のSNP群によって閾値は変動する。ここで、真陽性率とは、落屑症候群又は落屑緑内障の発症リスクを有する者を正しく落屑症候群又は落屑緑内障の発症リスクを有する者として判定する確率のことであり、真陰性率とは、落屑症候群又は落屑緑内障の発症リスクを有しない者を正しく落屑症候群又は落屑緑内障の発症リスクを有しない者として判定する確率のことである。
【0072】
患者と非患者とを識別する適切なカットオフ値である閾値の具体的な設定方法としては、先ず、被検者の定量値を取得する際に測定対象として選択されたSNP群と同じSNP群に関して、縦軸に真陽性率(感度)、横軸に真陰性率(1-特異度)をとって作成したROC曲線を作成する(ROC分析を実施する)。次に、グラフの左上隅からの距離が最小となる点を閾値としてもよく、ROC曲線下面積(Area Under the Curve, AUC)が0.5となる斜線から最も離れた点を閾値としてもよく、任意の特異度や感度になるような点を閾値として設定してもよい。本発明では、感度が1、(1-特異度)が0に最も近い結果を与える閾値を設定することが好ましく、例えば、〔(1-感度)2+(1-特異度)2〕が最少となる値を閾値と設定することができる。
【0073】
なお、閾値は、被検者の定量値を取得する際に別途同時に取得してもよく、事前に取得しておいたものであってもよい。また、被検者の定量値と比較する際に、それまでに得られた解析結果を随時追加更新して、取得されたものであってもよい。
【0074】
また、閾値の設定においては、判定精度の向上の観点から、正規化や重み付けを行ってもよい。具体的には、例えば、正規化の方法としては、正規分布曲線と比較する方法を用いることができる。また、重み付けの方法としては、各SNPのオッズ比を考慮して重み付けを行うことができる。
【0075】
こうして予め設定された閾値と被検者の定量値とを対比することで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。
【0076】
態様2の方法としては、例えば、アレル測定工程が複数の測定ステップを含む場合、情報取得工程により得られた被検者に関する各測定ステップでの結果(各リスクアレル保有数)が、各測定ステップで用いられたSNP群に基づいて予めROC分析により定められたカットオフ値を上回るか否かを指標として、前記被検者が落屑症候群又は落屑緑内障を発症するリスクの高低についての情報を提供する方法が挙げられる。
【0077】
より詳しくは、先ず、被検者のリスクアレル保有数を、測定ステップ毎に、予め設定された閾値と対比して発症リスクの有無を判定する。閾値は態様1と同様にして設定することができる。次に、測定ステップ毎の発症リスクの有無の結果を統合する。具体的には、例えば、測定ステップを3回行って、発症リスクがある場合を「+」、ない場合を「-」として表示する場合、1回目の判定結果が「+」、2回目の判定結果が「+」、3回目の判定結果が「+」の統合結果は「+++」であり、1回目の判定結果が「+」、2回目の判定結果が「+」、3回目の判定結果が「-」の統合結果は「++-」であり、1回目の判定結果が「+」、2回目の判定結果が「-」、3回目の判定結果が「+」の統合結果は「+-+」に分類される。よって、3回の判定において1回陰性であるという確率としては同じであっても、「++-」と「+-+」は異なる分類に該当することになる。そして、得られた統合結果を用いて、予め判明している発症リスクを有する群・発症リスクを有さない群のグラフ上において同じ分類に該当する傾向に基づいて落屑症候群又は落屑緑内障の発症リスクが高いか低いかを判定する。
【0078】
発症リスクを有する群・発症リスクを有さない群のグラフは以下のようにして作成することができる。例えば、予め診断された被検者について統合結果を得て、「+++」、「++-」、「+-+」等のパターン毎に、落屑症候群又は落屑緑内障の発症リスクを有するか否かの人数を集積することで作成することができる。
【0079】
こうして予め作成された発症リスクを有する群・発症リスクを有さない群のグラフにおいて、被検者の統合結果から該当する区分の情報を得ることで、被検者が落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定することができる。
【0080】
なお、態様2において、後述するベイズ定理を当てはめて、落屑症候群又は落屑緑内障の発症リスクを有する確率を算出してもよい。
【0081】
態様3の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。一般に、臨床現場においては、検査対象者がその疾患の発症リスクを有するか否かは不明であり、検査結果から疾患の発症リスクの有無を推定することになるので、検査方法の陽性的中率(PPV)や陰性的中率(NPV)が高いことも望まれている。ここで、陽性的中率とは、検査結果が陽性の場合に疾患を有する者の割合であり、陰性的中率とは、検査結果が陰性の場合に発症リスクを有していない者の割合である。落屑症候群又は落屑緑内障の発症リスクを有する確率として提示することで当該確率が高いほど、落屑症候群又は落屑緑内障を発症するリスクの高い群に分類されることがより容易に理解されることになる。
【0082】
具体的な発症リスクを有する確率を算出する方法としては、情報取得工程で得られた結果(リスクアレル保有数)を態様1と同様にして閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクの有無を判断し、その結果にベイズ定理の方法を当てはめて発症リスクを有する確率を算出する。ベイズ定理の方法においては、事前確率(有病率)に、前述した感度と特異度を組み合わせて事後確率(陽性的中率、陰性的中率)を求めることができることから、本発明においては、落屑症候群又は落屑緑内障の発症リスクの確率が事後確率として表される。言い換えると、ベイズ定理の方法を用いない場合は、発症リスクを有する確率は有病率と同じであるけれども、ベイズ定理の方法を用いることにより、検査により陽性結果が出た場合は、その被検者の発症リスクの確率は陽性的中率により表すことができることを意味する。具体的には、陽性的中率=有病率×感度/〔有病率×感度+(1-有病率)×(1-特異度)〕、陰性的中率=特異度×(1-有病率)/〔特異度×(1-有病率)+有病率×(1-感度)〕により求めることができ、例えば、有病率が0.8%であって、検査の感度が70%、特異度が70%の場合、陽性的中率は1.8%、陰性的中率は99.7%と算出される。よって、陽性結果が出た被検者の発症リスクは1.8%であることから、有病率よりも高く、更なる診察を受けるように助言することができる。また、前記検査を3回組み合わせて行った場合には、陽性的中率は9.3%、陰性的中率は99.9%と算出されることから、3回目の検査においてリスクアレル数がカットオフ値を超えた検査対象者は、落屑症候群又は落屑緑内障の発症リスクがより高いと判定することができる。
【0083】
こうして被検者の全体バックグラウンドとして、有病率の影響も含めた判定が行なえることで、被検者の落屑症候群又は落屑緑内障の発症リスクの確率として提示することが可能となる。
【0084】
態様4の方法としては、例えば、情報取得工程で得られた結果にベイズ定理を当てはめて、リスクアレル保有数に基づく発症リスクを有する確率(平均発症リスク、95%信用区間)を算出し、更に予め設定されたパーセント(%)以上の確率で落屑症候群又は落屑緑内障を発症するリスクを有する確率を算出する方法が挙げられる。ここで、設定されるパーセントとしては、例えば、70%、80%、90%等の任意の数値を設定することができ、値が大きい程、高精度で判定を行うことができる。
【0085】
より詳しくは、例えば、態様2で用いた予め診断された被検者から得られた統合結果「+++」、「++-」、「+-+」等のパターン毎に、ベイズ定理により落屑症候群又は落屑緑内障の発症リスクを有する確率密度関数を算出する。例えば70%以上の確率を算出する場合、確率密度関数から連続確率変数である発症リスクを有する確率が70以上となる密度を範囲とする面積が発症リスクを有する確率となる。
【0086】
かくして、本発明においては、被検者の落屑症候群又は落屑緑内障の発症リスクを、リスクアレル数の合計数を閾値と対比することで、落屑症候群又は落屑緑内障の発症リスクを有するか否かを判定するだけでなく、その確率を算出することによって、被検者の落屑症候群又は落屑緑内障の発症リスクに関する情報をより詳細に提供することができる。
【0087】
本発明はまた、落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する装置を提供する。
【0088】
本発明の装置としては、プロセッサおよび前記プロセッサの制御下にあるメモリを備えたコンピュータを含み、前記メモリには、下記の工程:
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を前記コンピュータに実行させるためのコンピュータプログラムが記録されている。
【0089】
また、本発明には、被検者における落屑症候群又は落屑緑内障の発症リスクの判定をコンピュータに実行させるためのコンピュータプログラムも含まれる。そのようなコンピュータプログラムとしては、例えば、次のとおりである。
【0090】
コンピュータに読み取り可能な媒体に記録されているコンピュータプログラムであって、下記の工程:
被検者から採取した生体試料における一塩基多型(SNP)のアレル情報に基づいて、表1に記載の12個のSNPからなるコアSNP群と、表2に記載の450個のSNPからなるプールSNP群から選ばれるSNP(プール選抜SNP群)とを合わせて少なくとも30個のSNPについて、アレルを測定するアレル測定工程、
前記アレルの測定結果に基づいて、前記被検者における落屑症候群又は落屑緑内障の発症リスクに関する情報を取得する情報取得工程、及び
前記で得られた情報に基づいて、前記被検者の落屑症候群又は落屑緑内障の発症リスクを判定するための情報を提供する情報提供工程
を実行させて、被検者における落屑症候群又は落屑緑内障の発症リスクの判定を行わせる。
【0091】
上記の媒体は、上記のコンピュータプログラムが非一時的に記録され、且つコンピュータに読取可能な媒体であってもよい。
【0092】
以下に、本発明の方法を実施するのに好適な装置の一例を、図面を参照して説明する。しかし、本実施形態は、この例のみに限定されるものではない。
図1は、被検者における落屑症候群又は落屑緑内障の発症リスクの判定装置の一例を示した概略図である。
図1に示された判定装置10は、測定装置20と、該測定装置20と接続されたコンピュータシステム30とを含んでいる。
【0093】
本実施形態において、測定装置20は、マイクロアレイ上のプローブと結合したDNAに基づくシグナルを検出するスキャナーもしくは質量分析機器である。本実施形態において、シグナルは、蛍光シグナルなどの光学的情報もしくは質量分析結果である。測定用試料と接触させたマイクロアレイを測定装置20にセットすると、測定装置20は、マイクロアレイ上のプローブに結合した、被検者の生体試料由来の核酸に基づく光学的情報もしくは質量分析結果を取得し、得られた光学的情報もしくは質量分析結果をコンピュータシステム30に送信する。
【0094】
スキャナーは、マイクロアレイ上のプローブに結合したDNAに基づくシグナルの検出が可能であれば特に限定されない。シグナルは、被検者の生体試料由来のDNAの標識に用いられた標識物質によって異なることから、スキャナーは、標識物質の種類に応じて適宜選択することができる。例えば、標識物質が蛍光物質である場合、測定装置20として、当該蛍光物質から生じる蛍光を検出可能なマイクロアレイスキャナーが用いられる。
【0095】
なお、SNPを次世代シークエンス法やダイレクトシークエンス法により検出する場合、測定装置20は、DNA増幅装置及びシークエンス解析装置からなる装置であってもよい。この場合、測定用試料、DNA増幅用の酵素及びプライマーなどを含む反応液を測定装置20にセットし、DNA増幅法によって反応液中のDNAを増幅させる。そして、測定装置20は、増幅産物の塩基配列を解析して配列情報を取得し、得られた配列情報をコンピュータシステム30に送信する。
【0096】
コンピュータシステム30は、コンピュータ本体300と、入力部301と、検体情報や判定結果などを表示する表示部302とを含む。コンピュータシステム30は、測定装置20から光学的情報もしくは質量分析結果もしくは配列情報を受信する。そして、コンピュータシステム30のプロセッサは、光学的情報もしくは質量分析結果もしくは配列情報に基づいて、被検者における落屑症候群又は落屑緑内障の発症リスクを判定するプログラムを実行する。なお、コンピュータシステム30は、
図1に示されるように測定装置20とは別個の機器であってもよいし、測定装置20を内包する機器であってもよい。後者の場合、コンピュータシステム30は、それ自体で判定装置10となってもよい。
【0097】
コンピュータ本体300は、
図2に示されるように、CPU(Central Processing Unit)310と、ROM(Read Only Memory)311と、RAM(Random Access Memory)312と、ハードディスク313と、入出力インターフェイス314と、読出装置315と、通信インターフェイス316と、画像出力インターフェイス317とを備えている。CPU310、ROM311、RAM312、ハードディスク313、入出力インターフェイス314、読出装置315、通信インターフェイス316及び画像出力インターフェイス317は、バス318によってデータ通信可能に接続されている。また、測定装置20は、通信インターフェイス316により、コンピュータシステム30と通信可能に接続されている。
【0098】
CPU310は、ROM311に記憶されているプログラム及びRAM312にロードされたプログラムを実行することが可能である。CPU310は、有効性予測値を算出し、ROM311に格納されている判別式を読み出し、有効性を判定する。CPU310は、判定結果を出力して表示部302に表示させる。
【0099】
ROM311は、マスクROM、PROM、EPROM、EEPROMなどによって構成されている。ROM311には、前述のようにCPU310によって実行されるプログラム及びこれに用いるデータが記録されている。ROM311には、予め設定された閾値などが記録されていてもよい。
【0100】
RAM312は、SRAM、DRAMなどによって構成されている。RAM312は、ROM311及びハードディスク313に記録されているプログラムの読み出しに用いられる。RAM312はまた、これらのプログラムを実行するときに、CPU310の作業領域として利用される。
【0101】
ハードディスク313は、CPU310に実行させるためのオペレーティングシステム、アプリケーションプログラム(落屑症候群又は落屑緑内障の発症リスクの判定のためのコンピュータプログラム)などのコンピュータプログラム及び当該コンピュータプログラムの実行に用いるデータがインストールされている。ハードディスク313には、予め設定された閾値などが記録されていてもよい。
【0102】
読出装置315は、フラッシュメモリ、フレキシブルディスクドライブ、CD-ROMドライブ、DVDROMドライブなどによって構成されている。読出装置315は、可搬型記録媒体40に記録されたプログラム又はデータを読み出すことができる。読取装置と記載することもある。
【0103】
入出力インターフェイス314は、例えば、USB、IEEE1394、RS-232Cなどのシリアルインターフェイスと、SCSI、IDE、IEEE1284などのパラレルインターフェイスと、D/A変換器、A/D変換器などからなるアナログインターフェイスとから構成されている。入出力インターフェイス314には、キーボード、マウスなどの入力部301が接続されている。操作者は、当該入力部301により、コンピュータ本体300に各種の指令を入力することが可能である。
【0104】
通信インターフェイス316は、例えば、Ethernet(登録商標)インターフェイスなどである。コンピュータ本体300は、通信インターフェイス316により、プリンタなどへの印刷データの送信も可能である。
【0105】
画像出力インターフェイス317は、LCD、CRTなどで構成される表示部302に接続されている。これにより、表示部302は、CPU310から与えられた画像データに応じた映像信号を出力できる。表示部302は、入力された映像信号にしたがって画像(画面)を表示する。
【0106】
次に、判定装置10による、落屑症候群又は落屑緑内障の発症リスクの高低を判定する処理手順を説明する。ここでは、マイクロアレイ上のプローブに結合した、被検者の生体試料由来のDNAに基づく蛍光情報からリスクアレル情報を取得し、得られた測定値を用いて判定を行なう場合を例として説明する。しかし、本実施形態は、この例のみに限定されるものではない。
【0107】
図3を参照して、ステップS101において、判定装置10のCPU310は、測定装置20から蛍光情報を取得する。次に、ステップS102において、CPU310は、取得した蛍光情報から蛍光強度を算出し、RAM312に記憶する。そして、ステップS103において、CPU310は、RAM312に記憶された前記蛍光強度から各バリアントの有無及びその種類を決定し、ROM311又はハードディスク313に記憶されたアレルデータにしたがって、リスクアレル総数を算出する。
【0108】
その後、ステップS104において、CPU310は、算出された有効性予測値と、ROM311又はハードディスク313に記憶された予め設定された閾値とを用いて、被検者における落屑症候群又は落屑緑内障の発症リスクの高低を判定する。ここで、リスクアレル総数が予め設定された閾値よりも小さいとき、処理は、ステップS105に進行し、CPU310は、被検者における落屑症候群又は落屑緑内障の発症リスクが低いことを示す判定結果をRAM312に記憶する。一方、リスクアレル総数が予め設定された閾値よりも低くないとき(すなわち、リスクアレル総数がカットオフ値以上であるとき)、処理は、ステップS106に進行し、CPU310は、被検者における落屑症候群又は落屑緑内障の発症リスクが高いことを示す判定結果をRAM312に記憶する。
【0109】
そして、ステップS107において、CPU310は、判定結果を出力し、表示部302に表示させたり、プリンタに印刷させたりする。これにより、被検者における落屑症候群又は落屑緑内障の発症リスクが高いか否かの判定を補助する情報を医師などに提供することができる。
【実施例】
【0110】
以下、実施例を示して本発明を具体的に説明する。この実施例は、単なる本発明の例示であり、何ら限定を意味するものではない。なお、以下の実施例では、特に詳細な説明がない一般的に用いられる分子生物学的手法については、モレキュラークローニング (Joseph Sambrook et al., Molecular Cloning - A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, 2001)などの成書に記載された方法及び条件が用いられる。
【0111】
試験例1 マーカーSNP(コアSNP+プールSNP)の選択
落屑症候群又は落屑緑内障と診断された患者(落屑症候群又は落屑緑内障の患者群)201例、及び、落屑症候群又は落屑緑内障ではないと診断され、かつ、問診によって緑内障家族歴を有さないと判断された非患者697例、それぞれの血液から、市販の自動核酸抽出機を使用して、ゲノムDNAを抽出した。ゲノムDNAの抽出は機器及びキットの取扱説明書に従い実施した。本方法により、血液検体350μLから約5μgのゲノムDNAを得た。
【0112】
SNPの分析は、ヒトゲノム上の公知のSNP約100万個の分析が可能な市販のマイクロアレイ型のSNP分析キットDNAマイクロアレイ(Genome-Wide Human SNP Array 6.0)を用いて906,600個のSNPのジェノタイプデータを取得し、QCフィルター (Call Rate, ≧0.95; MAF, ≧0.01; HWE, ≧0.001) を用いて652,792個の高精度なSNPデータを選択した。さらに、以下の過程により697個のSNPマーカー候補群を抽出した。
(1) ゲノムワイド関連解析(アレルデータによるχ2検定)でP<0.001を抽出条件とした。
(2) 抽出された全SNPについて、アフィメトリクス社のジェノタイピングソフトウェア (Genotyping Console) から得られる2Dクラスタープロット画像に基づき、3人の検者の目視による判定によってクラスター不良のSNPを除外した。
【0113】
マーカーSNPはSNPマーカー候補群から以下の手順により462個を選択した。なお、マーカーSNPはコアSNP 12個とプールSNP 450個から構成される。
(1) ジェノタイプデータを、以下の手順でコード化(数値変換)および正規化を行った。
(a) Risk Allele Homo: 2、Risk Allele Hetero: 1、Other Allele Homo: 0とした。
(b) 数値変換は落屑症候群又は落屑緑内障の患者群および非患者群の各群で、平均値および観測アレル頻度を用いて、前述の数式に従って数値の正規化を行った。
(2) 連鎖不平衡(linkage disequilibrium, LD)を考慮したSNPマーカー候補群の組合せを主成分分析(principle component analysis, PCA)を用いたクラスター解析により算出した。
(a) SNPマーカー候補群を用いて、患者群および非患者群の全検体をPCAに供し、検体で情報縮約(Cluster SNP)することで得られる因子負荷量(主成分と元の変数との間の相関係数に相当)を算出した。次に、各SNPの最も高い因子負荷量の絶対値を示す主成分を基準とするクラスターにより候補領域を決定し、各候補領域内で最小のP値を得たSNPをマーカーSNPの候補とした。
(b) 「各染色体」でのSNPマーカー候補群を用いて、(a) と同様に各染色体で候補領域を決定し、マーカーSNPの候補とした。
(c) (a) と (b) のマーカーSNP候補を組み合わせて、重複を除いた。
【0114】
コアSNPの取得
マーカーSNPの上位67個を用いて、別集団の患者254例と非患者1,052例を用いてマスアレイによる再現実験を実施した。QCフィルター (Call Rate, ≧0.9; MAF, ≧0.01; HWE, ≧0.001)を通過したSNP群を用いて関連解析(アレルデータによるχ2検定)を実施した。ゲノムワイド関連解析とマスアレイによる再現実験の再現性について、コクラン・マンテル・ヘンツェル検定結果(P<0.0008)を基準とした12個のSNPをコアSNPとした。
【0115】
プールSNPの取得
マーカーSNPからコアSNPを除いた群をプールSNPとした。
【0116】
実施例1
患者群200例と非患者群200例について、試験例1と同様にして血液を採取してゲノムDNAを抽出し、実施例1(表3)についてそれぞれ示すプローブを用いて、ハイブリダイゼーションでアレルデータを取得し、リスクアレルの総数をカウントした。なお、実施例1で用いたプローブは、表1に記載の12個のプローブ及び表2から選択された18個のプローブである。
【0117】
【0118】
リスクアレルの総数を横軸にした度数分布図を作成し、ROC分析を行った結果を
図4に示す。
図4より、実施例1では感度72.5%、特異度80.0%であるカットオフ値が31個の場合にAUCが0.846であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0119】
実施例2
実施例1と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表4に示すプローブを用いた。
【0120】
【0121】
(態様1)
上記表4に示す90個のプローブ(コアSNP群12個、プールSNP群78個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。リスクアレルの総数を横軸にした度数分布図を作成し、ROC分析を行った結果を
図5に示す。
図5より、感度90.5%、特異度85.5%であるカットオフ値が67個の場合にAUCが0.961であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0122】
(態様2)
次に、前記態様1で用いたプローブを30個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
【0123】
得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図6に示す。
図6より、第1測定での結果が感度79.0%、特異度77.0%でのカットオフ値が20個であり、第2測定での結果が感度81.5%、特異度73.0%でのカットオフ値が22個であり、第3測定での結果が感度77.5%、特異度72.5%でのカットオフ値が25個であり、それぞれの測定における判定結果が得られることが分かった。
【0124】
また、
図7に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0125】
(態様3及び4)
態様2と同様にして、個々のグループでの判定結果を得た上で、ベイズ定理を用いてリスクアレル保有数に基づく発症リスクを有する数確率(平均発症リスク、95%信用区間)を算出した。また、ベイズ定理を用いた確率密度関数の発症リスクを有する確率が70以上となる密度を範囲とする面積を算出し、70%以上の確率で発症するリスクの確率を示した。結果を
図8に示す。
【0126】
なお、ベイズ定理を用いた解析は、以下の手順に従って行った。
(a) 事前分布π(θ)は一様分布(無情報事前分布)とした。事前分布は、ベータ分布を採用した。
(b) 尤度は患者群および非患者群の全検体からランダムに、患者群200例と非患者群200例を選び、各リスクアレル保有数でのデータ数(観察数)と患者数(陽性数)から算出した。分布は二項分布を採用した。
(c) 事後分布は、ベイズの定理(事後分布π(θ|D)∝事前分布×尤度)より算出した。
(d) 事後分布から、平均発症リスク(%)、95%信用区間(%)、発症リスクを有する確率(%)を算出した。
【0127】
実施例3
実施例1及び2と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表5に示すプローブを用いた。
【0128】
【0129】
【0130】
(態様1)
上記表5に示す120個のプローブ(コアSNP群12個、プールSNP群108個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を
図9に示す。
図9より、感度92.5%、特異度84.5%であるカットオフ値が93個の場合にAUCが0.959であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0131】
(態様2)
次に、前記態様1で用いたプローブを40個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
【0132】
得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図10に示す。
図10より、第1測定での結果が感度76.5%、特異度79.5%でのカットオフ値が27個であり、第2測定での結果が感度70.0%、特異度86.5%でのカットオフ値が34個であり、第3測定での結果が感度73.0%、特異度80.0%でのカットオフ値が36個であり、それぞれの測定における判定結果が得られることが分かった。
【0133】
また、
図11に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0134】
(態様3及び4)
態様2と同様にして、個々のグループでの判定結果を得た上で、実施例2と同様にして、平均発症リスク(%)、95%信用区間(%)、70%以上の確率で発症するリスクの確率(%)を算出した。結果を
図12に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0135】
実施例4
実施例1及び2及び3と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表6に示すプローブを用いた。
【0136】
【0137】
【0138】
(態様1)
上記表6に示す150個のプローブ(コアSNP群12個、プールSNP群138個)全てを一度に用いて測定を行い、リスクアレルの総数をカウントした。実施例1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を
図13に示す。
図13より、感度90.0%、特異度91.5%であるカットオフ値が120個の場合にAUCが0.971であり、度数分布図からも発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0139】
(態様2)
次に、前記態様1で用いたプローブを40個ずつに分けて、測定ステップを測定ステップ1、測定ステップ2、測定ステップ3の3グループに分けて行い、リスクアレルの総数をカウントした。
【0140】
得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図14に示す。
図14より、第1測定での結果が感度80.0%、特異度80.5%でのカットオフ値が38個であり、第2測定での結果が感度78.5%、特異度81.5%でのカットオフ値が40個であり、第3測定での結果が感度76.5%、特異度75.5%でのカットオフ値が43個であり、それぞれの測定における判定結果が得られることが分かった。
【0141】
また、
図15に、前記3測定の判定結果を統合した結果を示す。即ち、発症リスクを有する群・発症リスクを有さない群毎に、前記3測定の判定結果を分類した結果を示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0142】
(態様3及び4)
態様2と同様にして、個々のグループでの判定結果を得た上で、実施例2と同様にして、平均発症リスク(%)、95%信用区間(%)、70%以上の確率で発症するリスクの確率(%)を算出した。結果を
図16に示す。これより、発症リスクを有する群と発症リスクを有さない群で区別がつくことが分かる。
【0143】
実施例5 ベイズ流アプローチによるマーカーSNPフィードバック改善ループ
実施例2又は実施例3又は実施例4の判定後の追跡研究により、落屑症候群又は落屑緑内障の発症および陰性の結果を得ることで、データの蓄積と更新(追加学習)を行う。追加学習は、追跡研究によって新たに得られた分類結果を用いてベイズの事前分布π(θ)を更新する。
・追跡研究により新たに得られたジェノタイプデータを従来の結果に加えた関連解析(アレルデータによるχ2検定)を実施し、プールSNPの入れ替えを実施する。また、入れ替えを実施する場合は、「情報取得工程」の各測定のROC分析の再計算によるカットオフ値の再設定を行い、「情報提供工程」におけるベイズの事前分布を忘却し、一様分布(無情報事前分布)として再計算する。
・データの蓄積と更新により、ジェノタイプデータを用いてアレルデータによるχ2検定の結果が変化した場合、マーカー候補SNPの入れ替えを実施する。
【産業上の利用可能性】
【0144】
本発明の方法により、被検者由来のDNA上の本発明のSNPのアレルを分析することにより、被検者の落屑症候群又は落屑緑内障の発症リスクの高低を判定することができる。このリスクに基づき被検者は落屑症候群又は落屑緑内障の予防措置を講じ、又は先制医療を含む適切な治療を受けることができる。また、本発明のSNPを用いて、落屑症候群又は落屑緑内障の発症リスクが高い者を選択して緑内障治療薬の臨床試験を行うことにより、緑内障治療薬の臨床試験の期間を短縮できるため、有用である。
【符号の説明】
【0145】
10 判定装置
20 測定装置
30 コンピュータシステム
40 記録媒体
300 コンピュータ本体
301 入力部
302 表示部
310 CPU
311 ROM
312 RAM
313 ハードディスク
314 入出力インターフェイス
315 読出装置(読取装置)
316 通信インターフェイス
317 画像出力インターフェイス
318 バス
【配列表】