【実施例】
【0044】
以下、本発明を実施例によりさらに具体的に説明する。但し、本発明はこれらの実施例に限定されない。
【0045】
1.実験方法
<オンライン方法>
対象となる後縦靭帯骨化症の患者は、脊柱のエックス線撮影検査に基づいて、参加病院の経験を積んだ脊椎外科医によって診断された。患者の頸椎における後縦靭帯の異所的骨形成が調べられた。2つよりも多くの脊椎分節の後縦靭帯骨化を有する日本人の患者(総計1,660人)が、本試験に含まれた。対照用に、バイオバンク・ジャパンプロジェク
ト(Nakamura, Y. The BioBank Japan Project. Clin Adv Hematol Oncol 5, 696-697 (2007))における後縦靭帯骨化症と無関係の疾患を有する対象に由来するゲノムワイドスクリーニングデータを使用した。全ての個体が本試験に参加する書面によるインフォームド・コンセントを提出した。この研究プロジェクトは理化学研究所(RIKEN)横浜研究所の倫理委員会によって承認された。
【0046】
<遺伝子型解析および精度管理>
ゲノムDNAは、常法にて末梢血白血球から抽出された。GWASは、イルミナ・ヒト・オムニエクスプレス・エクソーム・ビーズチップ(Illumina HumanOmniExpressExome BeadChip)を使用して、症例試料の遺伝子型を解析した。対照試料の遺伝子型は、イルミナ・ヒト・オムニエクスプレス・ビーズチップ(Illumina HumanOmniExpress BeadChip)とイルミナ・ヒト・エクソーム・ビーズチップ(Illumina HumanExome BeadChip)を使用して解析した。
【0047】
0.99未満のコールレートを有するSNPs、ハーディー・ワインベルグ平衡より逸脱するSNPs(対照においてP<1x10
−6)、X染色体上のSNPs、および非多型性SNPsを排除する標準的なSNP精度管理の後に、総計で616,496個のSNPsを、さらなる解析のために使用した。試料精度管理については、アイデンティティ・バイ・ステート法を用いて、各試料について潜在的関連性を評価し、少なくとも第二級の関連性を除去した。
【0048】
本試験の集団階層化を検討するために、基準としてのHapMapデータに由来する、ヨーロッパ人(CEU)、アフリカ人(YRI)、日本人(JPT)、および中国漢族(CHB)を含む4つの基準集団を用いる主成分分析(PCA;Price, A.L. et al. Nat Genet 38, 904-909 (2006))を実施した。
【0049】
JPT/CHBクラスターに属さない外れ値を有する人を特定するために、上位2つの関連主成分(固有ベクトル)を用いて散布図をプロットした。その後、集団の下位構造をさらに評価するために、症例被検者と対照被検者の遺伝子型の情報のみを使用するPCA分析を実施した。
【0050】
予想されたP値に対する観察されたP値、および試験対象の潜在的な集団階層化を評価するために、計算された拡張係数値(λ値)を用いて、分位数‐分位数(Q‐Q)プロットを構築した。
【0051】
PCAの実施後、以降の解析は、主要な日本人(本土)クラスター内の1,112人の症例被検者と6,810人の対照を選択して行った。
【0052】
再現解析では、多重PCRベース・インベーダーアッセイ(Third Wave Technologies)を用いて、548人の後縦靭帯骨化症の患者の遺伝子型を解析した。また、再現解析における対照として、バイオバンク・ジャパンに登録された後縦靭帯骨化症を有しない6,469人を動員した。
【0053】
<統計解析>
GWASおよび再現解析では、自由度1のコクラン・アーミテージの傾向検定を用いて各SNPの関連を評価した。2×2アレル頻度表から、オッズ比とそれらの信頼区間を計算した。マンテル・ヘンツェル法により、GWASと再現解析のデータを結合し、そして、ブレスロウ・デイ検定(Breslow, N.E. & Day, N.E. IARC Sci Publ, 1-406 (1987))を用いて、試験間の不均一性を調べた。局所的関連プロットはローカスズーム(LocusZoom;Pruim, R.J. et al. Bioinformatics 26, 2336-2337 (2010))を用いて作成された。
【0054】
<インピュテーション(imputation)>
minimacを用いてGWAS内での遺伝子型のインピュテーションを実施した。基準集団として1000人ゲノムプロジェクト(ハプロタイプの相を特定したJPT、CHBおよび中国南部漢族(CHS)のデータ、2012年、3月;1000 Genomes Project Consortium et al. Nature 467, 1061-1073 (2010))に由来する個体を使用した。1%未満のマイナーアレル頻度および低精度のインピュテーション(RSQ<0.9)を有するSNPsは、排除された。関連解析は、mach2datによって遺伝子量について実施した。
【0055】
2.GWAS
後縦靭帯骨化症感受性遺伝子を同定するために、1,130人の後縦靭帯骨化症の個体と、7,135人の対照からなる日本人の集団において、オンライン方法によりGWASを実施した。
【0056】
SNP遺伝子型解析データ(オンライン方法)の精度管理フィルター処理の後に、616,496個の常染色体性SNPsを、コクラン・アーミテージの傾向検定によって関連について調査した。主成分分析(PCA)による集団階層化解析によって、本試験における全ての個体が東アジア人であることが示された。
【0057】
しかし、本試験における後縦靭帯骨化症の症例被検者と対照についての遺伝子型情報のみを用いてPCA分析を実施すると、主要な日本人クラスター(本土クラスター;Yamaguchi-Kabata, Y. et al. Am J Hum Genet 83, 445-456 (2008))から分離される小集団の試料が存在した。
【0058】
そのため、当該分離される小集団を除く、1,112人の後縦靭帯骨化症の症例被検者と6,810人の対照からなる主要な日本人クラスターに由来する試料を使用して、分位数‐分位数(Q‐Q)プロットを作成し、ゲノム拡張係数(genomic inflation factor)(λGC)が1.01であることを見出した。このことは、集団の階層化により、偽陽性関連が生じる可能性が低かったことを示している。
【0059】
8p11.21、8q23.1、8q23.3、12p12.2、12p11.22、および20p12.3の6か所の染色体領域内の26個のSNPsが、P<5×10
−8というゲノムワイド有意性閾値に達した(
図1)。さらに、後縦靭帯骨化症との示唆的な関連(P<5×10
−7)を示す追加の2か所の遺伝子座(6p21.2および18q23)を発見した(
図1)。
【0060】
さらなる感受性遺伝子座を調査するため、インピュテーション処理されたSNPsに対する全ゲノム関連の結果を得た。上述した後縦靭帯骨化症との関連が示された計8か所の遺伝子座における895個のSNPsが、P<5×10
−7で関連することを見出した。他の遺伝子座を発見することはなかった。
【0061】
3.再現解析
後縦靭帯骨化症との関連が示された上記8か所の遺伝子座における関連を確定するために、各遺伝子座で最小のP値を有するSNPsを、再現解析のために選択した。548人の日本人の後縦靭帯骨化症患者および6,469人の日本人の対照からなる独立した集団の遺伝子型を解析した。その結果、ボンフェローニ補正の後でも、8個のSNPsのうちの5個について、P<6.25×10
−3(0.05/8)で有意な関連を見出した(表1)。
【0062】
【表1】
【0063】
GWASと再現解析の結果をまとめると、6個のSNPsがP<5×10
−8というゲノムワイド有意性閾値に達した(表1)。これらの6個のSNPsのブレスロウ・デイ検定により、試験間の有意な不均一性の不在(P>0.05)が証明された。
【0064】
次に、GWASデータを用いて、これらの6か所の遺伝子座にある関連性が高いSNPsを調整する条件的分析(conditional analysis)を実施した。それらの6か所の遺伝子座には独立したシグナルは存在しなかった。
【0065】
GWASと再現解析のデータを結合したメタ解析において、最も関連性が高いSNPであるrs2423294(P
複合=1.1×10
−13)は、20p12.3上のHAO1の3’隣接領域に位置する(
図2a)。HAO1は主に肝臓と膵臓において発現し、そして、ヒドロキシ酸オキシダーゼをコードし、その酵素は2‐ヒドロキシ酸を酸化する。この領域は、我々が以前に報告した後縦靭帯骨化症の示唆的な連鎖ピーク(非特許文献5)に含まれている。この領域内に、関連についてゲノムワイド有意性閾値(P<5×10
−8)に達する80個のインピュテーション処理されたSNPsを同定した。71個の関連性が高いSNPs(P<1×10
−9)は、HAO1の3’隣接領域に位置した(
図2a)。
【0066】
8q23.1における疾患関連領域は、3個の遺伝子、RSPO2、EIF3EおよびEMC2を含む(
図2b)。これらの3個の遺伝子の機能に関して現在入手できる情報から、RSPO2は後縦靭帯骨化症の発病における最も可能性が高い候補である。RSPO2(R‐スポンジン2)は、古典的Wnt/β‐カテニンシグナル伝達を介したβ‐カテニン活性化に関わるR‐スポンジンファミリー(Kim, K.A. et al. Cell Cycle 5, 23-26
(2006))の分泌タンパク質のメンバーをコードし、そのシグナル伝達は骨芽細胞形成に不可欠である(Monroe, D.G., McGee-Lawrence, M.E., Oursler, M.J. & Westendorf, J.J. Gene 492, 1-18(2012))。RSPO2の発現の低下が骨関節炎骨芽細胞で報告されており、そして、骨芽細胞のWnt依存性石灰化がRSPO2によって促進される(参照文献14)。
【0067】
EIF3Eは、真核生物翻訳開始因子3(eIF‐3)複合体の構成要素をコードし、その複合体はタンパク質合成の開始におけるいくつかのステップで必要とされる。eIF‐3複合体は、43S前開始複合体へのmRNAの動員、およびAUG認識のためのmRNAの走査を促進する(Chaudhuri, J., Chowdhury, D. & Maitra, U. J Biol Chem 274,
17975-17980 (1999))。
【0068】
EMC2は、ER膜タンパク質複合体の構成要素をコードする(Christianson, J.C. et al. Nat Cell Biol 14, 93-105 (2012))。しかし、その細胞機能は不明である。
【0069】
染色体12p11.22領域は、CCDC91を含み(
図2c)、CCDC91はトランスゴルジネットワークに関与するタンパク質をコードする。特に、その疾患関連領域は、PTHLH遺伝子に隣接して位置し、PTHLH遺伝子は副甲状腺ホルモン(PTH)ファミリーのメンバーをコードする。PTHは、その受容体であるPTH1Rを介して軟骨の骨化を調節し、その軟骨の骨化は後縦靭帯骨化症の進行と関連が有る(Sato, R. et al. J Neurosurg Spine 7, 174-183 (2007))。
【0070】
12p12.2遺伝子座における関連SNPsは、LOC100506393内に存在し(
図2d)、それは巨大遺伝子間非コードRNA(lincRNA)であると予測されている。LOC100506393は3つのエクソンからなり、そして、既知のオルソロガスな転写物に対する類似性を持たない推定上の新規遺伝子である。
【0071】
8q23.3における疾患関連領域は、LINC00536とEIF3Hの間にある遺伝子砂漠領域に位置する(
図2e)。LINC00536はlincRNAに属する。EIF3HもeIF‐3複合体の構成要素をコードする。
【0072】
6つの後縦靭帯骨化症遺伝子座のうちの2つがeIF‐3複合体中のタンパク質をコードする遺伝子を有するという事実より、この経路の異常が、後縦靭帯骨化症の発病にとって重要であり得ると示唆される。
【0073】
6p21.1における疾患関連領域も、CDC5L、MIR4642とSUPT3Hの
間にある遺伝子砂漠に位置する(
図2f)。CDC5L遺伝子がコードする細胞分裂周期5様(cell division cycle 5-like)タンパク質は、細胞周期のG2/M進行の正の調節因子である(Zhang, N., Kaur, R., Akhter, S. & Legerski, R.J. EMBO Rep 10, 1029-1035(2009))。CDC5Lは推定上のE3ユビキチンリガーゼ複合体の中核構成要素としても見いだされた。この複合体は酵母からヒトまでメッセンジャーRNA前駆体のスプライシングに役割を有することが示されている(Ajuh, P. et al. EMBO J 19, 6569-6581(2000))。
【0074】
CDC5L遺伝子のイントロン14内に位置するMIR4642は、その標的遺伝子と機能が未知であるマイクロRNAをコードする。SUPT3Hは、RNAポリメラーゼIIによって転写される多数の遺伝子の転写に必要とされる出芽酵母の転写因子であるSpt3のヒトホモログをコードする(Yu, J., Madison, J.M., Mundlos, S., Winston, F. & Olsen, B.R. Genomics 53, 90-96 (1998))。特に、その疾患関連領域は、骨芽細胞の分化と骨格の形態形成に必須である転写因子をコードするRUNX2(Ziros, P.G. et al. J Biol Chem 277, 23934-23941(2002))の約760kb上流に位置する。Runx2は、骨芽細胞に対するPTHの抗アポトーシス作用を仲介する。その作用が骨芽細胞の数を増加させ、そして、強力に骨を形成させることになる(Bellido, T. et al. J Biol Chem 278, 50259-50272 (2003))。
【0075】
後縦靭帯骨化症遺伝子座の機能の基礎を理解するために、リンパ芽球様細胞株の解析から得られた公開されて利用可能な全ての発現量的形質遺伝子座データ(Genevar;Yang, T.P. et al. Bioinformatics 26,2474-2476 (2010))を調査した。しかし、遺伝子型と遺伝子発現の間に有意な関連の証拠はなかった(複数の試験に対する調整の後でP>0.05)。
【0076】
後縦靭帯骨化症関連遺伝子座における遺伝子間の関係を調査するために、GRAIL(Raychaudhuri, S. et al. PLoS Genet 5, e1000534 (2009))を用いることによって、経路分析を行った。有意なゲノムワイド関連が有る6か所の領域をクエリー領域として使用し、それにより12個のユニークな遺伝子を分析することになった。分析の結果、翻訳開始のメンバーについて、EIF3E(rs374810;P=0.020)とEIF3H(rs13279799;P=0.021)の関連(P<0.05)を発見した。
【0077】
まとめると、日本人集団におけるGWASおよび再現解析により、脊椎靭帯骨化症に対する6つの感受性遺伝子座を同定した。これら6つの感受性遺伝子座に存在するSNPsは、脊椎靭帯骨化症の検査に有用である。また、この結果は、脊椎靭帯骨化症の基礎を成すいくつかの経路の存在を示唆する。これらの経路は、骨芽細胞形成(RSPO2、PTHLHおよびRUNX2)、ならびにmRNAの転写、スプライシングおよび翻訳の制御(EIF3E、EIF3H、CDC5LおよびSUPT3H)を含み得る。