(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023038111
(43)【公開日】2023-03-16
(54)【発明の名称】広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230309BHJP
G01N 33/53 20060101ALI20230309BHJP
G16B 30/00 20190101ALI20230309BHJP
C12Q 1/6827 20180101ALI20230309BHJP
C12N 15/09 20060101ALN20230309BHJP
【FI】
C12Q1/6869 Z
G01N33/53 M
G16B30/00
C12Q1/6827 Z
C12N15/09 Z ZNA
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2021145036
(22)【出願日】2021-09-06
(71)【出願人】
【識別番号】509349141
【氏名又は名称】京都府公立大学法人
(71)【出願人】
【識別番号】390014960
【氏名又は名称】シスメックス株式会社
(71)【出願人】
【識別番号】000177634
【氏名又は名称】参天製薬株式会社
(74)【代理人】
【識別番号】100095832
【弁理士】
【氏名又は名称】細田 芳徳
(74)【代理人】
【識別番号】100187850
【弁理士】
【氏名又は名称】細田 芳弘
(72)【発明者】
【氏名】田代 啓
(72)【発明者】
【氏名】木下 茂
(72)【発明者】
【氏名】森 和彦
(72)【発明者】
【氏名】池田 陽子
(72)【発明者】
【氏名】上野 盛夫
(72)【発明者】
【氏名】中野 正和
(72)【発明者】
【氏名】吉井 健悟
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ03
4B063QQ42
4B063QR32
4B063QR55
4B063QR62
4B063QS25
4B063QS34
(57)【要約】
【課題】広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法を提供すること。
【解決手段】本発明は、被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程、及び前記アレルの測定結果に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する情報取得工程、を含む、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法を提供する。
【選択図】
図2A
【特許請求の範囲】
【請求項1】
被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程、及び
前記アレルの測定結果に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する情報取得工程、
を含む、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法。
【請求項2】
前記情報取得工程が、
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記リスクアレルの総数を算出する工程、及び
前記リスクアレルの総数に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程
を含む、請求項1に記載の方法。
【請求項3】
前記情報取得工程が、
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記リスクアレルの総数を算出する工程、及び
前記リスクアレルの総数が所定のカットオフ値以上の場合、前記被検者の広義原発開放隅角緑内障の重症化リスクが高いという情報を取得し、前記リスクアレルの総数が所定のカットオフ値未満の場合、前記被検者の広義原発開放隅角緑内障の重症化リスクが低いという情報を取得する工程
を含む、請求項1又は2に記載の方法。
【請求項4】
前記アレル測定工程が、
表1に記載のSNP IDで特定されるSNPから選択される少なくとも60個のSNPについて、アレルを測定する工程を含み、
前記情報取得工程が、
前記少なくとも60個のSNPのうち少なくとも20個のSNPを含む第一SNP群のアレルの測定結果と、前記少なくとも60個のSNPのうち前記第一SNP群と異なる少なくとも20個のSNPを含む第二SNP群のアレルの測定結果と、前記少なくとも60個のSNPのうち前記第一SNP群及び前記第二SNP群と異なる少なくとも20個のSNPを含む第三SNP群のアレルの測定結果とに基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程を含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記情報取得工程が、
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記第一SNP群のリスクアレルの総数を算出する第一算出工程、
前記第二SNP群のリスクアレルの総数を算出する第二算出工程、
前記第三SNP群のリスクアレルの総数を算出する第三算出工程、
前記第一算出工程で得られた総数と、第一のカットオフ値とを比較する第一比較工程、
前記第二算出工程で得られた総数と、第二のカットオフ値とを比較する第二比較工程、
前記第三算出工程で得られた総数と、第三のカットオフ値とを比較する第三比較工程、及び
前記第一比較工程、前記第二比較工程及び前記第三比較工程における比較結果に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程、
を含む、請求項4に記載の方法。
【請求項6】
前記情報取得工程において、
前記第一算出工程で得られた総数が第一のカットオフ値以上であり、前記第二算出工程で得られた総数が第二のカットオフ値以上であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値以上である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが高いという情報が取得され、
前記第一算出工程で得られた総数が第一のカットオフ値未満であり、前記第二算出工程で得られた総数が第二のカットオフ値未満であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値未満である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが低いという情報が取得される、
請求項5に記載の方法。
【請求項7】
前記アレルの測定結果にベイズ定理を当てはめて、前記被検者の広義原発開放隅角緑内障が重症化する確率を算出する工程をさらに含む、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記情報取得工程で得られた結果にベイズ定理を当てはめて、前記被検者の広義原発開放隅角緑内障が予め設定されたパーセント(%)以上の確率で重症化する確率を算出する工程をさらに含む、請求項1~6のいずれか1項に記載の方法。
【請求項9】
前記生体試料が、全血、白血球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織及び毛根からなる群より選択される1種以上である、請求項1~8のいずれか1項に記載の方法。
【請求項10】
被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程を含み、前記アレルの測定結果が、前記被検者における広義原発開放隅角緑内障の重症化リスクの指標となる、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法。
【請求項11】
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記リスクアレルの総数を算出する工程、及び
前記リスクアレルの総数に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程
をさらに含む、請求項10に記載の方法。
【請求項12】
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記リスクアレルの総数を算出する工程、及び
前記リスクアレルの総数が所定のカットオフ値以上の場合、前記被検者の広義原発開放隅角緑内障の重症化リスクが高いという情報を取得し、前記リスクアレルの総数が所定のカットオフ値未満の場合、前記被検者の広義原発開放隅角緑内障の重症化リスクが低いという情報を取得する工程
をさらに含む、請求項10又は11に記載の方法。
【請求項13】
前記アレル測定工程が、
表1に記載のSNP IDで特定されるSNPから選択される少なくとも60個のSNPについて、アレルを測定する工程を含み、
前記少なくとも60個のSNPのうち少なくとも20個のSNPを含む第一SNP群のアレルの測定結果と、前記少なくとも60個のSNPのうち前記第一SNP群と異なる少なくとも20個のSNPを含む第二SNP群のアレルの測定結果と、前記少なくとも60個のSNPのうち前記第一SNP群及び前記第二SNP群と異なる少なくとも20個のSNPを含む第三SNP群のアレルの測定結果とに基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程
をさらに含む、請求項10~12のいずれか1項に記載の方法。
【請求項14】
測定されたアレルがリスクアレルであるか否かを判別する工程、
前記第一SNP群のリスクアレルの総数を算出する第一算出工程、
前記第二SNP群のリスクアレルの総数を算出する第二算出工程、
前記第三SNP群のリスクアレルの総数を算出する第三算出工程、
前記第一算出工程で得られた総数と第一のカットオフ値とを比較する第一比較工程、
前記第二算出工程で得られた総数と第二のカットオフ値とを比較する第二比較工程、
前記第三算出工程で得られた総数と第三のカットオフ値とを比較する第三比較工程、及び
前記第一比較工程、前記第二比較工程及び前記第三比較工程における比較結果に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程、
をさらに含む、請求項13に記載の方法。
【請求項15】
前記第一算出工程で得られた総数が第一のカットオフ値以上であり、前記第二算出工程で得られた総数が第二のカットオフ値以上であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値以上である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが高いという情報が取得され、
前記第一算出工程で得られた総数が第一のカットオフ値未満であり、前記第二算出工程で得られた総数が第二のカットオフ値未満であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値未満である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが低いという情報が取得される、
請求項14に記載の方法。
【請求項16】
前記アレルの測定結果にベイズ定理を当てはめて、前記被検者の広義原発開放隅角緑内障が重症化する確率を算出する工程をさらに含む、請求項10~15のいずれか1項に記載の方法。
【請求項17】
前記アレルの測定結果にベイズ定理を当てはめて、前記被検者の広義原発開放隅角緑内障が予め設定されたパーセント(%)以上の確率で重症化する確率を算出する工程をさらに含む、請求項10~15のいずれか1項に記載の方法。
【請求項18】
前記生体試料が、全血、白血球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織及び毛根からなる群より選択される1種以上である、請求項10~17のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法に関する。
【背景技術】
【0002】
広義原発開放隅角緑内障は、網膜視神経細胞が障害され、長時間をかけてゆっくりと不可逆的に進行する疾患である。患者の中には症状が安定する者もいれば、重症化する者もいることが経験的に知られている。
【0003】
特許文献1は、緑内障患者の遺伝的要因として一塩基多型(SNP)を評価することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1は発症リスクや進行リスクを評価するものであって、重症化を評価していない。本発明の課題は広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法を提供することである。
【課題を解決するための手段】
【0006】
本発明は、下記〔1〕~〔2〕に関する。
〔1〕 被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程、及び
前記アレルの測定結果に基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する情報取得工程、
を含む、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法。
〔2〕 被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程を含み、前記アレルの測定結果が、前記被検者における広義原発開放隅角緑内障の重症化リスクの指標となる、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法。
【発明の効果】
【0007】
本発明により、被検者における広義原発開放隅角緑内障の重症化リスクを精度よく判定することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、アレル測定に用いられるDNAマイクロアレイの模式図である。
【
図2A】
図2Aは、検体群Aを用い、カットオフ値を学習するために表1から選択されたSNPを測定対象とし、SNP数を60個、解析数を1回とした場合の重症化リスクの判定に用いるグラフの一例を示した図である。なお、以下の図中の棒グラフの白抜きのバーは軽症群を示し、黒塗りのバーは重症群を示す。
【
図2B】
図2Bは、前記学習で得られたカットオフ値による、検体群Bでの検証例を示した図である。
【
図3】
図3は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を60個、解析数を3回とした場合の重症化リスクを個々に判定する際に用いるグラフの一例を示した図である。
【
図4】
図4は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を60個、解析数を3回とした場合の重症化リスクを統合判定する際に用いるグラフの一例を示した図である。
【
図5A】
図5Aは、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を60個、解析数を3回とした場合の重症化リスクの判定にベイズ定理を用いた結果の一例を示した図である。
【
図5B】
図5Bは、検体群Bを用いた検証例を示した図である。
【
図6A】
図6Aは、検体群Aを用い、カットオフ値を学習するために表1から選択されたSNPを測定対象とし、SNP数を90個、解析数を1回とした場合の重症化リスクの判定に用いるグラフの一例を示した図である。
【
図6B】
図6Bは、前記学習で得られたカットオフ値による、検体群Bでの検証例を示した図である。
【
図7】
図7は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を90個、解析数を3回とした場合の重症化リスクを個々に判定する際に用いるグラフの一例を示した図である。
【
図8】
図8は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を90個、解析数を3回とした場合の重症化リスクを統合判定する際に用いるグラフの一例を示した図である。
【
図9A】
図9Aは、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を90個、解析数を3回とした場合の重症化リスクの判定にベイズ定理を用いた結果の一例を示した図である。
【
図9B】
図9Bは、検体群Bを用いた検証例を示した図である。
【
図10A】
図10Aは、検体群Aを用い、カットオフ値を学習するために表1から選択されたSNPを測定対象とし、SNP数を120個、解析数を1回とした場合の重症化リスクの判定に用いるグラフの一例を示した図である。
【
図10B】
図10Bは、前記学習で得られたカットオフ値による、検体群Bでの検証例を示した図である。
【
図11】
図11は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を120個、解析数を3回とした場合の重症化リスクを個々に判定する際に用いるグラフの一例を示した図である。
【
図12】
図12は、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を120個、解析数を3回とした場合の重症化リスクを統合判定する際に用いるグラフの一例を示した図である。
【
図13A】
図13Aは、検体群Aを用い、表1から選択されたSNPを測定対象とし、SNP数を120個、解析数を3回とした場合の重症化リスクの判定にベイズ定理を用いた結果の一例を示した図である。
【発明を実施するための形態】
【0009】
本明細書において、「広義POAG」とは、広義原発開放隅角緑内障(広義primary open-angle glaucoma, 広義POAG;狭義原発開放隅角緑内障と正常眼圧緑内障,日眼会誌116巻1号15頁から18頁)のことである。
【0010】
本明細書において、「リスクアレル」とは、広義POAGと関連するアレルのうち、視野障害軽度群より視野障害高度群において頻度が高いアレルを言う。「非リスクアレル」とは、リスクアレルではないアレルを言う。
【0011】
本明細書において、広義POAGの視野障害高度群(「高度群」と略記することがある。)とは、Aulhorn分類Greve変法のグレードが5若しくは6又は湖崎分類が5a若しくは5bの基準値を検査において2回連続で満たした検体である。一方、広義POAGの視野障害軽度群(「軽度群」と略記することがある。)とは、Aulhorn分類Greve変法のグレードが0、0-1若しくは1又は湖崎分類が1a若しくは1bの基準値を検査において2回連続で満たした検体である。いずれも、両眼の場合は、状態の悪いほうの眼を採用する。
【0012】
本明細書において、「広義POAGの重症群」とは、視野障害高度群に分類される広義POAGの患者群を意味する。以下、単に「重症群」と称することがある。「広義POAGの軽症群」とは、視野障害軽度群に分類される広義POAGの患者群を意味する。以下、単に「軽症群」と称することがある。
【0013】
本明細書において、「広義POAGの重症化」とは、POAG患者の視野障害が高度化することを意味する。「広義POAGの重症化リスク」とは、被検者の広義POAGが重症化するリスクを意味する。
【0014】
〔マーカーSNP及び選択SNPを見出す方法〕
アレル測定工程で用いられる、表1に記載のSNP IDで特定されるSNP(本明細書において「マーカーSNP」と略記する。)や、マーカーSNPから選択された特定のSNP(本明細書において「選択SNP」と略記する。)は、次のようにして見出すことができる。
【0015】
(1) マーカー候補のSNPを見出す方法
高度群と軽度群、それぞれの血液からゲノムDNAを抽出する。血液中のゲノムDNAは公知の任意の方法によって抽出することができる。例えば細胞を溶解して溶出させたDNAを、シリカでコーティングした磁性ビーズの表面に結合させ、磁気を利用して分離、回収することによってDNAを抽出することができる。
【0016】
抽出したDNAサンプル中のSNPにおけるアレルの同定手段は特に限定されず、当該技術において公知のSNP検出方法から適宜選択すればよい。
【0017】
ここでは、ゲノムワイド関連解析(GWAS)を用いる手法について説明する。具体的には、ゲノム全領域に分布するSNPを含むDNAマイクロアレイ(たとえば、アフィメトリクス社、Genome-Wide Human SNP Array 6.0)を用いて行うことができる。その際に、Quality controlを行うことで、抽出するSNPを選択してもよい。
【0018】
Quality controlにおけるSNP採否の基準となるコールレートとしては、例えば、85%以上、90%以上、95%以上のコールレートを示すSNPを採用することが望ましい。また、その他に、マイナーアレル頻度(MAF)が0.01未満のSNP、及び遺伝子型の分布がハーディー・ワインバーグ平衡(HWE)から有意に(false discovery rateが0.001未満)逸脱したSNPについては、候補から除外することが望ましい。
【0019】
Quality controlで選択されたSNPについては、更に絞り込みを行うことができる。例えば、統計ソフトウェアを用いてカイ二乗検定を行うことで、P値が好ましくは1×10-3以下、より好ましくは3×10-4以下、更に好ましくは1×10-4以下を満たすSNPを選択する。
【0020】
次に、前記抽出されたSNPについては、ジェノタイピング不良SNPを除外するための2次元クラスタープロット解析、例えば、ジェノタイピングソフトウェア(例えば、アフィメトリクス社、Genotyping Console)から得られるクラスタープロット画像を目視で観察することによって、ジェノタイピング不良のSNPを除外して、マーカー候補のSNPを決定することができる。
【0021】
このようにして選択されたSNPは、GenBankやdbSNPのような公知配列や公知SNPのデータベースを参照することにより、そのSNPが存在するゲノム上の位置、配列情報、SNPが存在する遺伝子又は近傍に存在する遺伝子、遺伝子上に存在する場合にはイントロン又はエキソンの区別やその機能、他の生物種における相同遺伝子などの情報を得ることができる。
【0022】
(2) マーカーSNPを見出す方法
次に、前記で得られたマーカー候補のSNPから、マーカーSNPが抽出され得る。具体的には、マーカー候補のSNPのジェノタイプデータを数値化して、マーカーSNPを抽出することができる。
【0023】
数値化においては、たとえば、ジェノタイプデータ及びリスクアレルデータベースを参照して、例えばジェノタイプデータに含まれる所定のアレルにおいて、リスクアレルがホモの場合には数値2を、リスクアレルがヘテロの場合には数値1を、非リスクアレルがホモの場合には数値0を、それぞれ付与する。そして、得られた数値を、各アレルの出現頻度の平均値と観測される頻度とを用いて以下の数式により正規化し、選択されたSNPにおける数値化したジェノタイプデータ行列を作成することができる。
【0024】
【0025】
なお、リスクアレルとは、高度群に高頻度に出現するアレルをいう。本明細書では、リスクアレルはオッズ比に基づいて規定される。オッズ比とは、一般に高度群における危険因子を持つ人の割合と持たない人の割合の比、即ちオッズを、軽度群において同様に求めたオッズで除したものであり、本発明のようなケース・コントロール研究において用いられることが多い。本明細書においてオッズ比はアレル頻度に基づいて求められ、高度群における、あるアレルの出現頻度と他のアレルの出現頻度の比を、軽度群において同様にして得られる出現頻度の比で除して算出することができる。なお、各アレルの出現頻度は、例えば、被検者のデータを取得するに伴って、そのデータが追加更新されて随時再算出可能なものである。
【0026】
次いで、数値化したジェノタイプデータ行列を用いて、クラスター解析を行うことができる。例えば、SNP間の連鎖不平衡(linkage disequilibrium, LD)を考慮し、独立性が高いと思われるSNPを主成分分析(principal component analysis, PCA)により決定する。主成分分析の方法としては、公知の方法を用いることができる。例えば、前記で選択されたSNPについて、全ゲノム又は染色体のそれぞれにおいて情報縮約を行って因子負荷量(主成分と元の変数との間の相関係数に相当)を算出する。次いで、それに基づいて候補領域を決定し、当該領域内でP値が最も低いSNPを候補SNPとして選択する。以上により、本発明におけるマーカーSNPを決定することができる。但し、全ゲノムからの計算と染色体のそれぞれからの計算から重複したSNPは除く。以下の表1(本明細書において、表1-1~表1-33を併せて「表1」という)に、抽出されたマーカーSNP及びその関連情報を示す。マーカーSNPは、表1の「SNP ID」の列に記載された番号によって特定される。これらのSNPのゲノム上の位置は、表中「染色体」の列及び「位置」の列に記載される。表中、各SNPのアレルを検出するためのプローブ配列は、表中「プローブ配列」の列に記載される。プローブ配列のうち、リスクアレルと非リスクアレルは、角括弧内に記載される。リスクアレルを含む配列の配列番号は配列番号Aの列に記載され、非リスクアレルを含む配列の配列番号は配列番号Bの列に記載される。
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】
【0033】
【0034】
【0035】
【0036】
【0037】
【0038】
【0039】
【0040】
【0041】
【0042】
【0043】
【0044】
【0045】
【0046】
【0047】
【0048】
【0049】
【0050】
【0051】
【0052】
【0053】
【0054】
【0055】
【0056】
【0057】
【0058】
【0059】
【0060】
次に、本明細書におけるマーカーSNPから、特定のSNPを更に選択する方法について説明する。
【0061】
(3) 選択SNPを見出す方法
選択SNPは、前記で得られたマーカーSNPから適宜少なくとも20個程度のSNPを選択することで決定することができる。解析を複数回行う場合、例えば、染色体番号とアレルのχ2検定の結果を基準とする。例えば、3回解析を行う場合、第一解析は染色体番号1、4、7、10、13、16、19、22に位置するSNP、第二解析は染色体番号2、5、8、11、14、17、20に位置するSNP、第三解析は染色体番号3、6、9、12、15、18、21に位置するSNPから、χ2検定のP値の低いものに対して順に行うことで、選択SNPを決定することができる。
なお、後述の実施例において、選択SNPの具体例を示す。
【0062】
〔アレル測定工程〕
アレル測定工程では、被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNP(即ち、マーカーSNP)から選択される少なくとも20個のSNPについて、アレルを測定する。アレル測定工程で用いられるSNP数は、少なくとも20個であればよく、30個以上、40個以上、50個以上、または60個以上であり得る。
【0063】
本発明で用いられる生体試料としては、ゲノム由来のDNAを抽出可能なものであれば何でも良い。例えば、全血、白血球、リンパ球、血漿、血清、リンパ液、涙液、唾液、鼻汁、脳脊髄液、骨髄液、精液、汗、粘膜組織、皮膚組織及び毛根からなる群より選択される1種以上が用いられる。かかる生体試料からのDNA抽出方法としては、公知の任意の方法を採用することができる。
【0064】
測定対象のSNPに関しては、公知の方法に従って、そのアレルを決定して測定結果を得ることができる。具体的には、例えば、選択SNPの配列情報に基づき設計した、各アレルに特異的なプローブ(表2、表3又は表4(本明細書において、表4-1および表4-2を併せて「表4」という))を用いて、前記生体試料からのDNAにハイブリダイズさせ、そのシグナルを検出することによりそれぞれのアレルを検出することができる。プローブを用いてハイブリダイズさせる方法の例としてはタックマン法、インベーダー(Invader(登録商標))法、ライトサイクラー法、サイクリンプローブ法、MPSS法、ビーズアレイ法、DNAチップ法、マイクロアレイ法などがある。また、プローブによるハイブリダイズを行わずにアレルを検出することも可能である。例えば、PCR-RFLP法、SSCP法、質量分析法、次世代シークエンス法、ダイレクトシークエンス法などを用いることができる。これらの方法は公知の条件に従って行うことができる。
【0065】
図1は、アレル測定に用いられるDNAマイクロアレイの一例の模式図である。DNAマイクロアレイ1は、前述の表1に記載のプローブが固定化されており、表1に記載の各SNPのアレル測定を行うことができるよう設計されている。本発明の一実施形態は、被検者における広義POAGの重症化リスクに関する情報を生成するための、当該マイクロアレイの使用である。
【0066】
かくして得られた測定結果を次の情報取得工程に供する。また、該測定結果は、下記情報取得工程の項に示す基準に従って、被検者における広義POAGの重症化リスクの指標となり得る。
【0067】
〔情報取得工程〕
情報取得工程では、アレルの測定結果に基づいて、被検者における広義POAGの重症化リスクに関する情報を取得する。本明細書において、広義POAGの重症化リスクに関する情報は、例えば、重症化リスクの情報である。ここで、重症化リスクは重症化する確率により示してもよい。また、重症化リスクは、高リスク、低リスクなどの複数の段階で示してもよい。情報取得工程は、重症化リスクを判定する工程を含んでいてもよい。
【0068】
情報取得工程は、判定精度を向上する観点から、測定されたアレルがリスクアレルであるか否かを判別する工程と、リスクアレルの総数を算出する工程と、リスクアレルの総数に基づいて、広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程を含むことが好ましい。表1の「リスクアレル」の情報に基づいて、測定されたアレルがリスクアレルであるか否かの判別を行い、リスクアレルの総数(リスクアレル保有数ともいう)を算出することができる。
【0069】
リスクアレルの総数に基づいて、広義原発開放隅角緑内障の重症化リスクに関する情報を取得する場合、リスクアレルの総数に対応する所定のカットオフ値を用いることが好ましい。たとえば、リスクアレルの総数と、所定のカットオフ値とを比較し、リスクアレルの総数が所定のカットオフ値以上の場合、被検者の広義原発開放隅角緑内障の重症化リスクが高いという情報を取得し、リスクアレルの総数が所定のカットオフ値未満の場合、被検者の広義原発開放隅角緑内障の重症化リスクが低いという情報を取得してもよい。
【0070】
例えば、情報取得工程において得られた被検者に関する結果(リスクアレル保有数)が、アレル測定工程で用いられた選択SNPに基づいて予めROC(Receiver Operating Characteristic)分析により定められたカットオフ値を指標として、カットオフ値以上の場合は前記被検者の広義POAGの重症化リスクが高く、カットオフ値未満の場合は当該リスクが低いとの情報を提供する方法が挙げられる。
より詳しくは、例えば、先ず、被検者のリスクアレル保有数を予め設定されたカットオフ値と対比する。本明細書におけるカットオフ値とは高度群の患者と軽度群の患者とを識別する適切な値のことである。当該カットオフ値と被検者の定量値を対比することにより、被検者の広義POAGの重症化リスクを判定できる。
【0071】
(1)カットオフ値の設定
カットオフ値は以下のようにして設定することができる。例えば、被検者の定量値を取得する際に測定対象として選択された選択SNPと同じSNPに関して、予め広義POAGの重症化リスクが高いか否かを診断された被検者から採取した生体試料を用いて、上述のようにしてリスクアレル数を測定し、「広義POAGの重症化リスク」と「リスクアレル数」を統計的に処理することにより、両データ間の相関を解析する。解析された結果から、例えば、真陽性率の高さ(感度の高さ)を重視するか、真陰性率の高さ(特異度の高さ)を重視するか、又は真陽性率と真陰性率をどの程度でバランスさせるか等の目的に応じて、カットオフ値を設定することができる。例えば、測定対象の選択SNPが異なれば、そこに存在するリスクアレルも当然異なることから、測定対象の選択SNPによってカットオフ値は変動する。ここで、真陽性率とは、広義POAGの重症化リスクが高い者を正しく広義POAGの重症化リスクが高い者として判定する確率のことであり、真陰性率とは、広義POAGの重症化リスクが低い者を正しく広義POAGの重症化リスクが低い者として判定する確率のことである。
【0072】
具体的なカットオフ値の設定方法としては、例えば、先ず、被検者の定量値を取得する際に測定対象として選択された選択SNPと同じSNPに関して、縦軸に真陽性率(感度)、横軸に真陰性率(1-特異度)をとって作成したROC曲線を作成する(ROC分析を実施する)。次に、グラフの左上隅からの距離が最小となる点をカットオフ値としてもよく、ROC曲線下面積(Area Under the Curve, AUC)が0.5となる斜線から最も離れた点をカットオフ値としてもよく、任意の特異度や感度になるような点をカットオフ値として設定してもよい。本発明では、感度が1、(1-特異度)が0に最も近い結果を与えるカットオフ値を設定することが好ましく、例えば、〔(1-感度)2+(1-特異度)2〕が最少となる値をカットオフ値と設定することができる。
【0073】
なお、カットオフ値は、被検者の定量値を取得する際に別途同時に取得してもよく、事前に取得しておいたものであってもよい。また、被検者の定量値と比較する際に、それまでに得られた解析結果を随時追加更新して、取得されたものであってもよい。
【0074】
また、カットオフ値の設定においては、判定精度の向上の観点から、正規化や重み付けを行ってもよい。例えば、正規化の方法としては、正規分布曲線と比較する方法を用いることができる。また、重み付けの方法としては、各SNPのオッズ比を考慮して重み付けを行うことができる。
【0075】
こうして予め設定されたカットオフ値と被検者の定量値とを対比することで、被検者が広義POAGの重症化リスクが高いか否かを判定することができる。
【0076】
(2)複数回の解析
アレル測定工程において、表1に記載のマーカーSNPから選択される少なくとも60個のSNPについてアレルを測定した場合、情報取得工程では、例えば少なくとも60個のSNPを複数の群に分けて、アレルの測定結果を解析することができる。アレルの測定結果を複数回に分けて解析することにより、複数の判別結果を組み合わせることで、事前確率の更新が実現され、陽性的中率及び陰性的中率の向上が期待できるという利点があるため、好ましい。
【0077】
たとえば、60個のSNPのうちX個のSNPを含む第一SNP群のアレルの測定結果と、60個のSNPのうち第一SNP群と異なるY個のSNPを含む第二SNP群のアレルの測定結果と、60個のSNPのうち第一SNP群及び前記第二SNP群と異なるZ個のSNPを含む第三SNP群のアレルの測定結果とに基づいて、前記被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程を含む。X、YおよびZは、それぞれ独立して、少なくとも20以上の整数であり得る。
【0078】
上記のようにSNP群を第一SNP群、第二SNP群および第三SNP群に分けて解析する場合、たとえば情報取得工程は下記の各工程を含む。
測定されたアレルがリスクアレルであるか否かを判別する工程、
第一SNP群のリスクアレルの総数を算出する第一算出工程、
第二SNP群のリスクアレルの総数を算出する第二算出工程、
第三SNP群のリスクアレルの総数を算出する第三算出工程、
第一算出工程で得られたリスクアレルの総数と第一のカットオフ値とを比較する第一比較工程、
第二算出工程で得られたリスクアレルの総数と第二のカットオフ値とを比較する第二比較工程、
第三算出工程で得られたリスクアレルの総数と第三のカットオフ値とを比較する第三比較工程、及び
第一比較工程、前記第二比較工程及び前記第三比較工程における比較結果に基づいて、被検者における広義原発開放隅角緑内障の重症化リスクに関する情報を取得する工程。
【0079】
各算出工程においてカットオフ値を利用する場合、例えば、前記第一算出工程で得られた総数が第一のカットオフ値以上であり、前記第二算出工程で得られた総数が第二のカットオフ値以上であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値以上である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが高いという情報が取得される。第一算出工程で得られた総数が第一のカットオフ値未満であり、前記第二算出工程で得られた総数が第二のカットオフ値未満であり、且つ前記第三算出工程で得られた総数が第三のカットオフ値未満である場合、前記被検者における広義原発開放隅角緑内障の重症化リスクが低いという情報が取得される。
【0080】
SNPを複数の群に分けて解析する場合、個々の群を構成するSNPの数は同一であっても、異なっていてもよい。また、各群における選択SNPは重複してもよく、重複しなくてもよい。精度を向上させる観点から、重複するSNPの個数は少ない方が好ましい。具体的には、重複するSNPの個数は、10個以下が好ましく、5個以下がより好ましく、4個以下が更に好ましく、3個以下が更に好ましく、2個以下が更に好ましく、1個が更に好ましく、0個が最も好ましい。
【0081】
SNPを複数の群に分けて解析する場合、各群においてリスクアレルの総数があらかじめ設定した所定のカットオフ値を超えるかどうかで、陽性か陰性かを判定し、それらの数を算出することができる。
SNPを複数の群に分けて解析する場合、二群に分けてもよく、三群に分けてもよく、四群以上に分けてもよい。
【0082】
選択SNPから構成される群を複数個用いる場合、情報取得工程における被検者に関する各群での解析結果(各リスクアレル保有数)が、各群での解析で用いられた選択SNPに基づいて予めROC分析により定められたカットオフ値を指標として、前記被検者の広義POAGの重症化リスクについての情報を提供する工程を含む方法が挙げられる。
【0083】
より詳しくは、例えば、先ず、被検者のリスクアレル保有数を、各群での解析毎に、予め設定されたカットオフ値と対比して重症化リスクを判定する。カットオフ値は上述の説明と同様にして設定することができる。次に、各群での解析毎の重症化リスクの結果を統合することができる。
【0084】
例えば、解析を3回行って、各解析ごとの重症化リスクが高い場合を「+」、低い場合を「-」として表示する場合、第一解析での判定結果が「+」、第二解析での判定結果が「+」、第三解析での判定結果が「+」の統合結果は「+++」であり、第一解析での判定結果が「+」、第二解析での判定結果が「+」、第三解析での判定結果が「-」の統合結果は「++-」であり、第一解析での判定結果が「+」、第二解析での判定結果が「-」、第三解析での判定結果が「+」の統合結果は「+-+」に分類される。具体的な判定として、判定結果が「+++」の場合、重症化リスクが高く、判定結果が「---」の場合、重症化リスクが低いと判定し、それ以外の判定結果の場合、重症化リスクが中程度であると判定することができる。別の実施形態では、判定結果「+」が2以上の場合重症化リスクが高く、判定結果「-」が2回以上の場合、重症化リスクが「低い」と判定することができる。
【0085】
重症化リスクが高い群・重症化リスクが低い群のグラフは以下のようにして作成することができる。例えば、予め診断された被検者について統合結果を得て、「+++」、「++-」、「+-+」等のパターン毎に、広義POAGの重症化リスクが高いか否かの人数を集積することで作成することができる。
【0086】
こうして予め作成された重症化リスクが高い群・重症化リスクが低い群のグラフにおいて、被検者の統合結果から該当する区分の情報を得ることで、被検者が広義POAGの重症化リスクが高いか否かを判定することができる。
【0087】
(3)広義POAGが重症化する確率を算出する工程
なお、前記アレルの測定結果に、後述するベイズ定理を当てはめて、広義POAGが重症化する確率を算出してもよい。本明細書においては、かかる確率を算出する工程を更に有していてもよい。
【0088】
具体的な広義POAGが重症化する確率を算出する方法としては、例えば、リスクアレル保有数を上述の説明と同様にしてカットオフ値と対比することで、広義POAGの重症化リスクを判断する。そして、得られたアレルの測定結果にベイズ定理の方法を当てはめて重症化する確率を算出する。ベイズ定理の方法においては、事前確率(有病率)に、前述した感度と特異度を組み合わせて事後確率(陽性的中率、陰性的中率)を求めることができることから、本明細書においては、広義POAGが重症化する確率が事後確率として表される。言い換えると、ベイズ定理の方法を用いない場合は、重症化する確率は有病率と同じであるけれども、ベイズ定理の方法を用いることにより、本発明の方法を利用した検査により陽性結果が出た場合は、その検査対象者が重症化する確率は陽性的中率により表すことができることを意味する。
【0089】
具体的には、陽性的中率=有病率×感度/〔有病率×感度+(1-有病率)×(1-特異度)〕、陰性的中率=特異度×(1-有病率)/〔特異度×(1-有病率)+有病率×(1-感度)〕により求めることができる。例えば、有病率が10%であって、本発明の方法を利用した検査の感度が70%、特異度が70%の場合、陽性的中率は21%、陰性的中率は95%と算出される。よって、陽性結果が出た検査対象者の重症化リスクは21%であることから、有病率よりも高く、更なる診察を受けるように助言することができる。また、例えば前記検査を3回組み合わせて行った場合には、陽性的中率は62%、陰性的中率は99%と算出される。従って、3回目の検査においてリスクアレル数がカットオフ値を超えた検査対象者は、広義POAGの重症化リスクがより高いと判定することができる。
こうして検査対象者の全体バックグラウンドとして、有病率の影響も含めた判定が行えることで、被検者の広義POAGが重症化する確率として提示することが可能となる。
【0090】
あるいは、アレルの測定結果にベイズ定理を当てはめて、リスクアレル保有数に基づいた重症化する確率(平均重症化リスク、95%信用区間)を算出し、更に予め設定されたパーセント(%)以上の確率で広義POAGが重症化する確率を算出する工程も挙げられる。ここで、設定されるパーセントとしては、例えば、70%、80%、90%等の任意の数値を設定することができ、値が大きい程、高精度で判定を行うことができる。
【0091】
より詳しくは、例えば、上述の予め診断された被検者から得られた統合結果「+++」、「++-」、「+-+」等のパターン毎に、ベイズ定理により広義POAGが重症化する確率密度関数を算出する。例えば70%以上の確率を算出する場合、確率密度関数から連続確率変数である重症化する確率が70%以上となる密度を範囲とする面積が重症化する確率となる。
【0092】
かくして、本明細書においては、被検者の広義POAGの重症化リスクを、リスクアレル数の合計数をカットオフ値と対比することで、広義POAGの重症化リスクが高いか否かを判定するだけでなく、その確率を算出することによって、被検者の広義POAGの重症化リスクに関する情報をより詳細に提供することができる。
【0093】
本発明の方法を利用して得られた判定結果の追跡研究により、広義POAGが重症化したか否かの結果を得ることができる。かかる追跡研究に基づいて、データの蓄積と更新(追加学習)を行い、マーカーSNPの入れ替えを実施することができる。
追加学習は、追跡研究によって新たに得られた判定結果を用いてベイズの事前分布π(θ)を更新する。
追跡研究により新たに得られたジェノタイプデータを従来の結果に加えた関連解析(アレルデータによるχ2検定)を実施し、マーカーSNPの入れ替えを実施することができる。また、入れ替えを実施する場合は、「情報取得工程」の各解析のROC分析の再計算によるカットオフ値の再設定を行い、「情報取得工程」におけるベイズの事前分布を忘却し、一様分布(無情報事前分布)として再計算してもよい。
データの蓄積と更新により、ジェノタイプデータを用いてアレルデータによるχ2検定の結果が変化した場合、マーカーSNPの入れ替えを実施することができる。
【0094】
本情報取得工程における好ましい態様に係る工程は、被検者から採取した生体試料を用いて、表1に記載のSNP IDで特定されるSNPから選択される少なくとも20個のSNPについて、アレルを測定するアレル測定工程を含み、前記アレルの測定結果が、前記被検者における広義原発開放隅角緑内障の重症化リスクの指標となる、広義原発開放隅角緑内障の重症化リスクに関する情報の取得方法に含まれ得る。
【0095】
〔情報提供工程〕
本実施形態の方法は、上記の情報取得工程で得られた情報を提供する工程をさらに含んでいてもよい。情報提供工程では、前述の情報取得工程で得られた情報を、被検者の広義POAGの重症化リスクの判定を補助する情報として、例えば、被検者、医師又はコメディカルに提供する。提供の態様としては、例えば、モバイルデバイスを含むコンピュータの画面への出力や印刷等が挙げられる。
【実施例0096】
以下、実施例を示して本発明を具体的に説明する。この実施例は、単なる本発明の例示であり、何ら限定を意味するものではない。なお、以下の実施例では、特に詳細な説明がない一般的に用いられる分子生物学的手法については、モレキュラークローニング (Joseph Sambrook et al., Molecular Cloning - A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, 2001)などの成書に記載された方法及び条件が参照される。
【0097】
試験例1 マーカーSNPの選択
広義POAGと診断された患者群を、視野障害軽度群と視野障害高度群(手術例を含む)とに分類した。なお、手術例は、いずれも高度群であった。患者群から血液検体を採取し、検体群Aおよび検体群Bとした。検体群Aは、軽度群であると判断された患者81例、高度群であると判断された患者372例(うち手術例は247例)を含む。検体群Bは、軽度群であると判断された患者157例、高度群であると判断された患者388例(うち、手術例は210例)を含む。これらの血液検体から市販の自動核酸抽出機を使用して、ゲノムDNAを抽出した。ゲノムDNAの抽出は機器及びキットの取扱説明書に従い実施した。本方法により、血液検体350μLから約5μgのゲノムDNAを得た。
【0098】
SNPの分析は、ヒトゲノム上の公知のSNP約100万個の分析が可能な市販のマイクロアレイ型のSNP分析キットDNAマイクロアレイ(Genome-Wide Human SNP Array 6.0(アフィメトリクス社)又はAsian Screening Array-24 v1.0 BeadChip(イルミナ社))を用いてジェノタイプデータを取得し、QCフィルター (Call Rate≧0.95; MAF≧0.01; HWE≧0.001) を用いて高精度なSNPデータを選択した。
【0099】
さらに、以下の条件により420個のマーカーSNP(表1)を抽出した。
(1) ゲノムワイド関連解析(アレルデータによるχ2検定)を用いた場合、検体群A及び検体群Bで共に、P<0.05であり、MAF≧0.05のもの(下記の(4)~(6)を行った結果、157SNPを抽出できた。)。
(2) ゲノムワイド関連解析(アレルデータによるχ2検定)を用いた場合、検体群Aで、P<0.001(ただし(1)以外)であり、検体群Bで見出されたSNPでありかつ該SNPとリスクアレルが一致しており、かつMAF≧0.1のもの(下記の(4)~(6)を行った結果、75SNPを抽出できた。)。
(3) ゲノムワイド関連解析(アレルデータによるχ2検定)を用いた場合、検体群Bで、P<0.001(ただし(1)以外)であり、かつMAF≧0.1のもの(下記の(4)~(6)を行った結果、188SNPを抽出できた。)。
【0100】
(4) 抽出された全SNPについて、アフィメトリクス社のジェノタイピングソフトウェア (Genotyping Console) から得られる2Dクラスタープロット画像に基づき、3人の検者の目視による判定によってクラスター不良のSNPを除外した。また、イルミナ社のジェノタイピングソフトウェア(GenomeStudio)から得られる2Dクラスタープロット画像を3人の検者の目視による判定によってクラスター不良を手動で修正した。
(5) ジェノタイピングデータを、以下の手順でコード化(数値変換)及び正規化を行った。
(a) Risk Allele Homo: 2、Risk Allele Hetero: 1、Other Allele Homo: 0とした。
(b) 数値変換は高度群及び軽度群の各群で、平均値及び観測アレル頻度を用いて、前述の数式に従って数値の正規化を行った。
【0101】
(6) 連鎖不平衡(linkage disequilibrium, LD)を考慮したマーカーSNP候補の組合せを主成分分析(principle component analysis, PCA)を用いたクラスター解析により算出した。
(a) (5)で得たマーカーSNP候補を用いて、高度群及び軽度群の全検体をPCAに供し、検体で情報縮約(Cluster SNP)することで得られる因子負荷量(主成分と元の変数との間の相関係数に相当)を算出した。次に、各SNPの最も高い因子負荷量の絶対値を示す主成分を基準とするクラスターにより候補領域を決定し、各候補領域内で最小のP値を得たSNPをマーカーSNPの候補とした。
(b) 「各染色体」における、(5)で得た候補を用いて、(a)と同様に各染色体で候補領域を決定し、マーカーSNPの候補とした。
(c) (a)と(b)のマーカーSNPの候補を組み合わせて、重複を除いた。
【0102】
実施例1
検体群Aの軽度群80例と高度群(手術例含む。以下、単に「高度群」と記載する)80例について、試験例1と同様にして血液を採取してゲノムDNAを抽出し、実施例1(表2)に示すプローブを以下に示すように用いて、ハイブリダイゼーションでアレルデータを取得し、リスクアレルの総数を算出した(リスクアレルホモ=2、リスクアレルヘテロ=1とした)。
【0103】
【0104】
(態様1)
上記表2に示す60個のプローブ全てを一度に用いて測定を行い、リスクアレルの総数を算出した。リスクアレルの総数を横軸にした度数分布図を作成し、ROC分析を行った結果を
図2Aに示す。
図2Aより、感度85.0%、特異度93.8%であるカットオフ値が68個の場合にAUCが0.948であり、度数分布図からも重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。
【0105】
次いで、上記区別の性能を検証するために、検体群Bの軽度群140例と高度群140例について、検体群Aと同様に試験した。
【0106】
その結果を
図2Bに示す。
図2Bに示されるように、カットオフ値が68個の場合、感度85.0%、特異度73.6%であり、判別率が79.3%であった。従って、態様1の方法は、検体群Bを用いた検証において高い判別率であったことが理解できる。尚、判別率は、
【0107】
【0108】
(態様2)
次に、前記態様1で用いたプローブを20個ずつに分けて、検体群Aに対するアレル測定結果の解析工程を、第一解析、第二解析及び第三解析の3グループに分けて実施し、リスクアレルの総数を算出した。
【0109】
得られた結果について、前記態様1と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図3に示す。
図3より、第一解析での結果が感度76.2%、特異度82.5%での第一のカットオフ値が24個であり、第二解析での結果が感度80.0%、特異度68.8%での第二のカットオフ値が19個であり、第三解析での結果が感度93.8%、特異度62.5%での第三のカットオフ値が24個であり、それぞれの解析における判定結果が得られることが分かった。
【0110】
また、
図4に、前記3解析の判定結果を統合した結果を示す。即ち、重症化リスクが高い群・重症化リスクが低い群毎に、前記3解析の判定結果を分類した結果を示す。例えば、
図4の一番左のグラフは、「---」の統合結果、即ち、第一解析での判定結果が「-」、第二解析での判定結果が「-」、第三解析での判定結果が「-」である統合結果に対応する。
図4より、重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。判別結果「+」が2回以上の重症化リスクが高い群と判定された場合を重症化リスクが「高い」と規定し、判定結果「-」が2回以上の重症化リスクが低い群と判定された場合を重症化リスクが「低い」と規定した場合、軽症群と重症群とを精度よく分類できることが分かった
【0111】
(態様3及び態様4)
態様2と同様にして、検体群Aについて個々のグループでの判定結果を得た上で、ベイズ定理を用いてリスクアレル保有数に基づき、重症化する確率(平均重症化リスク、95%信用区間)を算出した(態様3)。また、ベイズ定理を用いた確率密度関数の重症化する確率が70%以上となる密度を範囲とする面積を算出し、70%以上の確率で重症化する確率を算出した(態様4)。結果を
図5Aに示す。
【0112】
なお、ベイズ定理を用いた解析は、以下の手順に従って行った。
(a) 事前分布π(θ)は一様分布(無情報事前分布)とした。事前分布は、ベータ分布を採用した。
(b) 尤度は軽度群及び高度群の全検体からランダムに、軽度群80例と高度群80例を選び、各リスクアレル保有数でのデータ数(観察数)と重症化数(陽性数)から算出した。分布は二項分布を採用した。
(c) 事後分布は、ベイズの定理(事後分布π(θ|D)∝事前分布×尤度)より算出した。
(d) 事後分布から、平均重症化リスク(%)、95%信用区間(%)、70%以上の確率で重症化する確率(%)を算出した。
【0113】
(態様5)
次いで、上記の性能を検証するために、検体群Bの軽度群140例と高度群140例について、検体群Aと同様に3回の解析を実施して、
【0114】
【0115】
の式を用いて重症化リスクに関する判別率を算出した。結果を
図5Bに示す。結果は、高い重症化リスクの判別率は、判定結果「+」が3回で80.2%、「+」が2回で、58.8%、57.9%、65.3%、低い重症化リスクの判別率は、判定結果「-」が3回で100.0%、「-」が2回で、81.0%、85.7%、89.5%であったことを示す。これより、態様1と態様2に加えて、実用的な重症化リスクの診断を補助するための情報の提供につながる結果であったことが分かる。
【0116】
実施例2
実施例1と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表3に示すプローブを用いた。
【0117】
【0118】
(態様1)
上記表3に示す90個のプローブ全てを一度に用いて測定を行い、リスクアレルの総数を算出した。実施例1の態様1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を
図6Aに示す。
図6Aより、感度91.2%、特異度90.0%であるカットオフ値が98個の場合にAUCが0.971であり、度数分布図からも重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。
【0119】
次いで、上記区別の性能を検証するために、検体群Bの軽度群140例と高度群140例について、検体群Aと同様に試験した。
【0120】
その結果を
図6Bに示す。
図6Bに示されるように、カットオフ値が98個の場合、感度98.6%、特異度64.3%であり、判別率が81.4%であった。従って、態様1の方法は、検体群Bを用いた検証において高い判別率を示し、SNP数が60個と比較し高い感度と判別率であることが理解できる。尚、判別率は、実施例1の態様1と同様にして算出した。
【0121】
(態様2)
次に、前記態様1で用いたプローブを30個ずつに分けて、検体群Aに対するアレル測定結果の解析工程を、第一解析、第二解析及び第三解析の3グループに分けて実施し、リスクアレルの総数を算出した。
【0122】
得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図7に示す。
図7より、第一解析での結果が感度87.5%、特異度80.0%での第一のカットオフ値が33個であり、第二解析での結果が感度85.0%、特異度73.8%での第二のカットオフ値が32個であり、第三解析での結果が感度77.5%、特異度77.5%での第三のカットオフ値が34個であり、それぞれの解析における判定結果が得られることが分かった。
【0123】
また、
図8に、前記3解析の判定結果を統合した結果を示す。即ち、重症化リスクが高い群・重症化リスクが低い群毎に、前記3解析の判定結果を分類した結果を示す。これより、重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。
【0124】
(態様3及び態様4)
態様2と同様にして、検体群Aについて個々のグループでの判定結果を得た上で、実施例1の態様3及び態様4と同様にして、平均重症化リスク(%)、95%信用区間(%)、70%以上の確率で重症化する確率(%)を算出した。結果を
図9Aに示す。これより、判定結果「+」が3回で100%、判定結果「+」が2回で85.1%、99.0%、64.5%であり、判定結果「-」が3回で0.0%、判定結果「-」が2回で0.7%、0.2%、0.0%であることが分かる。
【0125】
(態様5)
次いで、上記の性能を検証するために、検体群Bの軽度群140例と高度群140例について、実施例1の態様5と同様にして、重症化リスクに関する判別率を算出した。結果を
図9Bに示す。結果は、高い重症化リスクの判別率は、判定結果「+」が3回で81.7%、「+」が2回で68.6%、62.5%、50.0%、低い重症化リスクの判別率は、判定結果「-」が3回で100.0%、「-」が2回で、89.7%、90.9%、87.0%である。これより、態様1と態様2に加えて、実用的な重症化リスクの診断を補助するための情報の提供につながる結果であることが分かった。
【0126】
実施例3
実施例1及び2と用いるプローブが異なる以外は、実施例1と同様にしてデータ取得を行った。具体的には、下記表4に示すプローブを用いた。
【0127】
【0128】
【0129】
(態様1)
上記表4に示す120個のプローブ全てを一度に用いて測定を行い、リスクアレルの総数を算出した。実施例1の態様1と同様にして、リスクアレルの度数分布図とROC分析を行った結果を
図10Aに示す。
図10Aより、感度92.5%、特異度93.8%であるカットオフ値が128個の場合にAUCが0.980であり、度数分布図からも重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。
【0130】
次いで、上記区別の性能を検証するために、検体群Bの軽度群140例と高度群140例について、検体群Aと同様に試験した。
【0131】
その結果を
図10Bに示す。
図10Bに示されるように、カットオフ値が128個の場合、感度92.9%、特異度70.0%であり、判別率が81.4%であった。従って、態様1の方法は、検体群Bを用いた検証において高い判別率を示し、SNP数が60個と比較し高い感度と判定率、また90個と比較し高い特異度であることが理解できる。尚、判別率は、実施例1の態様1と同様にして算出した。
【0132】
(態様2)
次に、前記態様1で用いたプローブを40個ずつに分けて、検体群Aに対するアレル測定結果の解析工程を、第一解析、第二解析及び第三解析の3グループに分けて実施し、リスクアレルの総数を算出した。
【0133】
得られた結果について、前記と同様にして、リスクアレルの度数分布図とROC曲線を取得した。結果を
図11に示す。
図11より、第一解析での結果が感度87.5%、特異度83.8%での第一のカットオフ値が41個であり、第二解析での結果が感度76.2%、特異度83.8%での第二のカットオフ値が42個であり、第三解析での結果が感度90.0%、特異度78.8%での第三のカットオフ値が45個であり、それぞれの解析における判定結果が得られることが分かった。
【0134】
また、
図12に、前記3解析の判定結果を統合した結果を示す。即ち、重症化リスクが高い群・重症化リスクが低い群毎に、前記3解析の判定結果を分類した結果を示す。これより、重症化リスクが高い群と重症化リスクが低い群で区別がつくことが分かる。
【0135】
(態様3及び態様4)
態様2と同様にして、検体群Aについて個々のグループでの判定結果を得た上で、実施例1の態様3及び態様4と同様にして、平均重症化リスク(%)、95%信用区間(%)、70%以上の確率で重症化する確率(%)を算出した。結果を
図13Aに示す。これより、判定結果「+」が3回で100%、判定結果「+」が2回で70.3%、97.2%、98.0%であり、判定結果「-」が3回で、0.0%、判定結果「-」が2回で1.1%、0.0%、0.0%であることが分かる。
【0136】
(態様5)
次いで、上記の性能を検証するために、検体群Bの軽度群140例と高度群140例について、実施例1の態様5と同様にして、重症化リスクに関する判別率を算出した。結果を
図13Bに示す。結果は、高い重症化リスクの判別率は、判定結果「+」が3回で87.4%、「+」が2回で73.3%、58.1%、68.4%、低い重症化リスクの判別率は、判定結果「-」が3回で100.0%、「-」が2回で88.2%、82.6%、91.2%であったことを示す。これより、態様1と態様2に加えて、実用的な重症化リスクの診断を補助するための情報の提供につながる結果であったことが分かる。