【実施例】
【0138】
実施例を通して、所定の刊行物への言及は、実施例のセクションの終わりに完全な書誌的情報を示す番号によって示す。
【0139】
実施例1
新規なSLEリスク遺伝子座の同定
方法及び被検体
被検体
SLE症例の選別及び遺伝子タイピング、全ゲノム連関スキャン(GWAS)に使用される試料並びにニューヨークヘルスプロジェクト(NYHP)コレクション(Mitchell等, J Urban Health 81(2):301-10 (2004))からのコントロールは先に記載された(Hom等, N Engl J Med 358(9):900-9 (2008))。以下に詳述するように、SLE症例は、3つの症例シリーズから構成された:a) NIH/NIAMSが資金供給した管理機関である自己免疫性バイオマーカー協力ネットワーク(ABCoN:Autoimmune Biomarkers Collaborative Network)(Bauer等, PLoS medicine 3(12):e491 (2006))から338の症例、及び複数自己免疫性疾患遺伝子共同体(MADGC:Multiple Autoimmune Disease Genetics Consortium)(Criswell等, Am J Hum Genet 76(4):561-71 (2005))から141の症例;b) カリフォルニアサンフランシスコ大学(UCSF)ループス遺伝子プロジェクト(Seligman等, Arthritis Rheum 44(3):618-25 (2001);Remmers等, N Engl J Med 357(10):977-86 (2007))から613の症例、及び;c) ピッツバーグメディカルセンター大学(UPMC)(Demirci等, Ann Hum Genet 71(Pt 3):308-11 (2007))から335の症例とファインスタインメディカルリサーチ研究所で集められた8の症例。コントロールは1861のNYHPコレクションからの試料、公的に利用できるiControlDBデータベース(Illumina Inc.から入手可能)からの1722の試料、及び公的に利用できる国際癌研究所癌遺伝子マーカーの感受性(CGEMS)National Cancer Institute Cancer Genetic Markers of Susceptibility プロジェクト(URL:cgems.cancer.govで入手可能)からの4564の試料であった。
【0140】
1310のSLE症例及び7859のコントロールの全ゲノムデータセット
我々は過去にSLE症例試料の選択と遺伝子タイピングを記載した(Hom等, N Engl J Med 358(9):900-9 (2008))。全SLE症例は自己報告に加え遺伝子タイピングによって確かめられたヨーロッパ系の北アメリカ人であった。SLEの診断(米国リウマチ学会(ACR)規定の判定基準 [Hochberg等, Arthritis Rheum 40(9):1725[1997]の4以上の達成)は、医療記録検査(94%)又は治療するリウマチ専門医(6%)による文書での判定基準によって全症例において確認された。これらの症例のための臨床データは他に提示した(Seligman等, Arthritis Rheum 44(3):618-25 (2001);Criswell等, Am J Hum Genet 76(4):561-71 (2005);Bauer等, PLoS medicine 3(12):e491 (2006);Demirci等, Ann Hum Genet 71(Pt 3):308-11 (2007);Remmers等, N Engl J Med 357(10):977-86 (2007))。NYHP試料の遺伝子タイピング及び選別は前述した(Hom等, N Engl J Med 358(9):900-9 (2008))。表1には、場所により組織化された提供された試料の数が記載されている。
【0141】
試料及びSNPフィルタリングは以下に記載されるソフトフェアプログラムPLINK及びEIGENSTRAT内の解析モジュールを使用して実施した(またPurcell等, Am J Hum Genet 81(3):559-75 (2007);Price等, Nat Genet 38(8):904-09 (2006)を参照)。この研究では、症例及びコントロールの密接なマッチングを容易にするために、また確認され疑われたSLE遺伝子座における遺伝子型を提供するために、全ゲノムSNPデータを使用した。
【0142】
a記載された全ゲノム連関スキャンからの試料 (Hom, G等, N Engl J Med 358:900-9 (2008))。
bプロファイルSLEコンソーシアム(PROFILE SLE consortium)、カリフォルニア・サンフランシスコ大学(UCSF)(Thorburn, C.M等, Genes Immun 8:279-87 (2007)) 、ピッツバーグ・メディカルセンター大学(UPMC)、ミネソタ大学(UMN)、及びジョンズホプキンス大学(JHU)から引き出された合衆国コホートからの独立したSLE症例。ニューヨークヘルスプロジェクト(Gregersen等)からの合衆国コントロール、及びピッツバーグ大学及びNCRADからのアルツハイマー症例及びコントロール。
cストックホルム、カロリンスカ、ソルナ、ウプサラ、ランド及びウーメオ、スウェーデンからのSLE症例及びコントロール。
dストックホルムからの823のコントロールを、イルミナ(Illumina)317Kアレイを使用して遺伝子タイピングした。これらの試料におけるSNPを、本方法に記載したようにして帰属させ、分析した。
【0143】
カスタムSNPアレイ
以下に記載された品質管理基準をパスした10848のSNPでカスタムアレイを設計した。完全なアレイは12864のSNPを有していたが、2016のSNPが品質管理基準を通らず、10848のSNPが分析に進んだ。カスタムアレイは、SLE全ゲノム連関スキャンにおける名目上P<0.05に基づいて選択された3188のSNPと、25の過去に報告されたSLEリスク遺伝子座からの505のSNPと、他の自己免疫疾患から確認されたリスク対立遺伝子について文献探索後に選択された42のSNPと、人口部分構造の確認及びコントロールに使用される7113のSNPから構成された。後者のグループは、大陸の人口差を定めるために使用されたSNP(Kosoy, R等, Hum. Mutat. 30:69-78 (2009))及びヨーロッパ人口部分構造に対してリッチ化されたSNP(Tian, C等, PLoS Genet 4, e4 (2008))を含んでいた。カスタムアレイは、そのiSelect Custom BeadChip及び以下に記載される品質管理フィルターをパスしたSNPに対して与えたrs同定数を使用してイルミナ社(Illumina, Inc.)により製造された。
【0144】
品質管理及びインピュテーション
合衆国のデータでは、全体で1464の合衆国症例と3078の合衆国コントロールを、カスタム12Kチップともここでは呼ばれる上述のカスタムイルミナチップで遺伝子タイピングした。我々は、ストリンジェントな品質管理(QC)条件を使用し、高品質データが、最終分析に確実に含まれるようにした。すなわち、我々は、>5%の欠けているデータを有する116の個体を除外し、b)潜在的連関性に基づいた279の個体、及び州毎の同一性(IBS)状態(PI Hat>0.15)に基づく複製試料を除外した。我々は、a)<5%の欠けているデータ、b)ハーディー・ワインベルグ平衡(HWE)p値>1×10
−6、c)微量の対立遺伝子頻度(MAF)>0.01%、及びd)症例とコントロールとの間の差次的欠損に対する検定において、p値>1×10
−5を有するSNPのみを含めた。また、SNPをバッチ効果について検査した。上記フィルターの適用後、1144の症例と3003のコントロール、及び11024のSNPの最終セットを分析に利用することができた。PLINKを使用して全てのQC検定を実施した(Purcell等, Am J Hum Genet 81(3):559-75 (2007))。
【0145】
スウェーデンのデータでは、カスタム12Kチップで遺伝子タイピングされた888の症例と527のコントロールを分析に使用できた。また、イルミナ社の317KヒトHapMapビーズアレイ(ここでは317Kアレイとも称される)で遺伝子タイピングされた1115のスウェーデンコントロールの別のセットも、分析に導入した。我々は次の工程に従って二つのデータセットを組み合わせた。第1に、12K及び317Kデータの間の6789SNPの重複データセットを作成した。我々はこのデータセットを使用し、潜在的連関性と複製試料についてスウェーデンの複製コホートを調べた。その結果、313の試料を除外した(PI Hat>0.15)。品質管理チェックの後、我々は、カスタム12Kチップにおいて遺伝子タイピングされた863の症例と523のコントロール、及び317Lイルミナチップで遺伝子タイピングされた831のコントロールを分析に進めた。第2に、我々は、317Kアレイを用いて遺伝子タイピングされた831のスウェーデンコントロールをインピュテートし(以下参照)、重複SNPのより大きなセットを作成した。残ったSNPから、我々は、インピュテーションにより4605のSNPを捕捉した。11394の重複SNPの最終セットを分析に進めた。我々は、上述したものと同じ閾値を使用してこのデータセットにおいてSNPをフィルターにかけた。インピュテーションにより捕捉されなかった残りの1250のSNPを、12Kチップで遺伝子タイピングされたスウェーデン試料の最初のセットにおいてのみ分析した。
【0146】
317Kアレイで遺伝子タイピングされた831のスウェーデンコントロールを、参照として第II相HapMap CEU試料を使用するMACH(URL sph.umich.edu/csg/abecasis/MACHで利用されるハプロタイピングソフトウェアプログラムをベースにしたマルコフ鎖)を用いてインピュートした。第II相HapMap CEUは、「第II相」データリリースからの北及び西ヨーロッパ(CEU)の祖先を有するUtahレジデントとして知られているヒトハプロタイププロジェクトからの試料に言及する(またLi等. Am J Hum Genet S79 at 2290 (2006)を参照)。インピュテーションの前、我々は、317KのSNPにストリンジェントな品質管理チェックを適用した。次の基準(1)MAF>1%、(2)欠損率<5%、及び(3)HWE p値>1×10
−6を通過した293242のマーカーのサブセットをインピュテーションに含めた。インピュテーション後、低いインピュテーション品質、すなわちMACHにより報告されたR−二乗_Hat(RSQR_HAT)<0.40のSNPを廃棄した。11394のマーカーの重複セットを分析に利用できた。インピュテーションにおける不確実性を考慮に入れるために、遺伝子型判定よりもむしろ確率スコアを分析において使用した。
【0147】
全ゲノム連関研究試料のインピュテーションでは、メタアナリシスで使用された遺伝子型データは、イルミナ550K全ゲノムSNPプラットフォームを用いて遺伝子タイピングされた1310のSLE症例からであった(Hom, G等, N Engl J Med 358:900-9 (2008)参照)。SLE症例の試料の選択及び遺伝子タイピングは先に記載された(Hom, G等, N Engl J Med 358:900-9 (2008))。先に記載された3583のコントロール(Hom, G等, N Engl J Med 358:900-9 (2008))に加えて、公的に利用できる癌遺伝子感受性マーカー(Cancer Genetic Markers of Susceptibility)(CGEMS)プロジェクトからの4564のコントロール試料を、承認を得た後に含めた(URL:cgems.cancer.govで入手可能)。7859のコントロールの全試料を、先に記載したデータ品質管理フィルターを使用して検査した(Hom, G等, N Engl J Med 358:900-9 (2008))。我々は次にIMPUTEバージョン1を使用し ( URL www.stats.ox.ac..uk/~marchini/software/gwas/impute.htmlで入手可能)、参照としてHapMap第II相CEU試料を使用して遺伝子タイピングを推察した(Marchini, J等, Nat. Genet. 39:906-913 (2007))。我々はSNPTEST(URL www.stats.ox.ac.uk/~marchini/software/gwas/snptest_v1.1.4.htmlで入手可能)を使用し、連関統計を作成した(Marchini, J等, Nat. Genet. 39:906-913 (2007))。特に、連関統計は付加的なモデル(−SNPTESTにおけるFrequentist1オプション)を使用して作成し、インピュートされた遺伝子型の不確実性に対して調節した(−SNPTESTにおける適切なオプション)。連関統計の順位リストを使用し、記載されたように複製に対する領域を選択した。
【0148】
複製試料における集団層別化
各複製コホートについて、我々は、祖先情報マーカを使用して可能な集団層別化を修正した。ストリンジェントな品質管理基準をパスした5486の相関していない祖先情報マーカーのサブセットを使用し、ソフトウェアEIGENSTRATを用いて、遺伝的変異の上位10の主成分を推察した(Price等, Nat Genet 38(8):904-09 (2006))。各試料セットから外れ値を除去した(σ>6として定義)。すなわち、我々は合衆国コホートから27の遺伝的外れ値を、スウェーデンコホートから45の外れ値をそれぞれ除去した。第1の2の固有ベクトルに沿って、合衆国及びスウェーデンの複製コレクションの双方に、ある程度の集団層別化が観察された。症例−コントロール層別化に対して修正するために、我々は、次の方法の一つを使用した:(1)我々は、遺伝子型データが利用可能であれば、合衆国の複製データセット及びスウェーデンのデータセットに、EIGENSTRATに導入されたコクラン-アーミテージ検定統計量の修正を適用した;(2)我々はインピュートされたスウェーデンデータの分析に、ロジスティック回帰モデルにおける共変数として主成分を使用した。
【0149】
連関分析
合衆国データについて、検定統計量におけるいくつかのインフレーションが、連関性に対して未修正1-自由度の対立遺伝子検定を実施した後に観察された(PLINK [Purcell, S等. Am J Hum Genet 81:559-75 (2007)])。合衆国試料における集団層別化について修正するために、5486の相関していない祖先情報マーカーを使用する主成分分析(EIGENSTRAT)を実施した。第1に、我々は遺伝的外れ値を除去した(σ>6として定義)。第2に、コクラン-アーミテージ傾向のカイ二乗検定統計量を、1129の症例及び2991のコントロールにおいて、遺伝子タイピングされたSNPについて算出し、第1の4つの固有ベクトルを使用してEIGENSTRATにおいて、各SNPの検定統計値を調節した。各SNPについての検定統計量をベースにした両側p値を算出した。集団層別化の修正後、合衆国試料におけるλ
gcは1.05であった。
【0150】
スウェーデンデータについて、我々は、12K試料並びに付加的なイルミナ317Kコントロールにおいて遺伝子タイピングされた5486の祖先情報マーカーを使用し、スウェーデンコホートの隠し集団層別化を試験した。遺伝的外れ値を除去した後、我々は、カスタム12Kチップにおいて遺伝子タイピングされた834の症例及び515のコントロール、及びイルミナ317Kチップにおいて遺伝子タイピングされた832のコントロールを有していた。我々は、2つのイルミナアレイの間の6789のSNPの重複セットにおいて、EIGENSTRATにて実行される検定統計の修正を使用した。EIGENSTRATは、インピュートされた遺伝子タイピングデータを用いて使用されることを意図していないために、12K試料において遺伝子タイピングされた4605のSNPのセットで層別化を修正し、イルミナ317K試料にインピュートするため、我々は、SNPTESTにて実行されるロジスティック回帰モデルにおける共変数として、上で決定された第1の4つの固有ベクトルを使用した。イルミナ317Kにインピュートすることにより捕捉されない1250のマーカーの小さなセットを、カスタム12Kチップにおいて遺伝子タイピングされた834の症例及び515のコントロールでのみ分析した。集団層別化について修正した後、スウェーデン試料におけるλ
gcは1.10であった。
【0151】
メタアナリシス
我々は加重zスコア法を使用してメタアナリシスを実施した。異なるコホートにわたる結果を組合せるために、ヒトゲノムの対立遺伝子を、C/G及びA/T SNPに関連した曖昧さを回避するために、国立生物工学情報センター(NCBI)の36参照配列の順方向ストランドに配向させた。ヒトゲノムのNCBI参照配列は、URL www.ncbi.nlm.nih.govから入手可能である。また、Pruitt等, Nucl. Acids Res. 35 (データーベース号):D61-D65 (2007)を参照。各コホートに対するP値を、任意の参照対立遺伝子に対して効果の方向を考慮してzスコアに転換させた。加重したzスコアの合計を、各コホートの試料サイズの平方根により、各zスコアを加重し、ついで、全試料サイズの平方根で合計を割ることにより算出した。スウェーデン及び合衆国の複製コホートに対する組合せzスコアを、片側p値に転換させた。メタアナリシスzスコアを両側p値に転換させ、連関性の証拠を評価した。我々は、5×10
−8の閾値を通過したSNPが、SLEと圧倒的に関連していると考えた。全ゲノム有意性をパスしなかった1×10
−5未満の組合せp値を有する遺伝子座は、強力な候補であると考えた。自由に入手可能なMETALソフトウェアパッケージ(URL www.sph.umich.edu/csg/abecasis/Metalで入手可能)を使用し、メタアナリシス法を実施した。プールされたオッズ比を算出するために、我々は、METALソフトウェアにより実行されるコクラン-マントル-ヘンチェル(CMH)法を使用した.オッズ比を、各SNPに対するリスク対立遺伝子に対して算出した。また、コントロールにおける加重平均対立遺伝子頻度を、各SNPのリスク対立遺伝子に対して算出した。
【0152】
説明された分散パーセント(Percent Variance Explained)
我々の複製研究において1×10
−5未満のメタp値を有するSNPと、SLEに以前から関連しているSNPについて、我々は、説明された分散パーセントを算出した。SLEが、平均0及び分散1で正規分布している基礎的傾向スコアを有すると仮定する傾向閾値モデルを使用した。我々は、母集団においてSLEの有病率は0.1%と仮定した。各遺伝子型の閾値を算出するために、我々は、コントロールにおける対立遺伝子頻度と、我々の分析からのオッズ比(OR)に対応する効果量(エフェクトサイズ)を使用した。
【0153】
交互作用分析(Interaction Analysis)
トップシグナル間のエピスタシス効果を探すために、我々は表2、4及び6の全てのSNPのリストをコンパイルし、PLINKにおいて実行されるエピスタシスオプションを使用し、各複製コホートにおいて交互作用分析を実施した。より大きな統計的検出力を達成するために、我々は症例のみの分析(case-only analysis)を実施した。検定の数を修正した後、いずれのSNP-SNP交互作用も、p<0.05のレベルでの有意性は見出されなかった。
【0154】
条件付き分析(Conditional Analysis)
SLEとの強い連関性を示す各ゲノム領域において、我々は最も強いシグナルを示すSNPを選択した。我々はこのSNPにおける条件に対してPLINKを使用し、SLEとの強い連関性を示す他のSNPを探した。
【0155】
全身性エリテマトーデスの新規リスク遺伝子座としての、TNIP1、PRDM1、JAZF1、UHRF1BP1、及びIL10を同定する大規模複製研究
近年の全ゲノム関連(GWA)及び候補遺伝子研究にて、全ゲノム有意性(P<5×10
−8)を達成する、少なくとも15の共通リスク対立遺伝子を同定する。これらには、自己抗体の適応免疫及び生成にとって重要な遺伝子(HLAクラスII対立遺伝子、BLK、PTPN22、及びBANK1)、及び先天免疫及びインターフェロンシグナル伝達における役割を担っている遺伝子(ITGAM、TNFAIP3、STAT4、及びIRF5) (Cunninghame Graham, D.S等, Nat. Genet. 40:83-89 (2008);Graham, R.R等, Nat. Genet. 40(9):1059-61 (2008);Graham, R.R等, J Intern Med 265:680-88 (2009);Harley, J.B等, Nat. Genet. 40:204-10 (2008);Hom, G等, N Engl J Med 358:900-9 (2008);Kozyrev, S.V等, Nat. Genet. 40:211-6 (2008);Sawalha, A.H等, PLoS ONE 3:e1727 (2008);Sigurdsson, S等, Am J Hum Genet 76:528-37 (2005))が含まれる。付加的なリスク遺伝子座の同定を、我々は、1310の症例及び7859のコントロールの最新GWAS75において、名目上P値<0.05を示す2466の遺伝子座からのSNPの標的複製研究にて実施した。また我々は、25の過去に報告されたSLEリスク遺伝子座からのSNP、他の自己免疫疾患に関連している35の遺伝子座からの42のSNP、及び7000超の祖先情報マーカーを遺伝子タイピングした。実験の設計の概説を
図1に示す。上述したSNPをイルミナカスタムSNPアレイに導入した。合衆国及びスウェーデンからの独立した症例及びコントロールにおいて、アレイを遺伝子タイピングした。823のスウェーデンコントロールをイルミナ310K SNPアレイを使用して遺伝子タイピングし、上の方法で記載されたようにして変異体を分析した。
【0156】
特に、上述したように、我々は>12000の変異体からなるカスタムSNPアレイを設計し、アメリカ合衆国(1129のSLE症例、及び2991のコントロール)及びスウェーデン(834のSLE症例及び1338のコントロール)からの、2つの独立したSLE症例及びコントロール集団を遺伝子タイピングした。合衆国コントロールは、2215のアルツハイマー病の症例/コントロール試料を含み、SLE及びアルツハイマーの遺伝的部分構造が独立していることが予期されるため、コントロールとして許容可能であると思われる。次に、データ品質フィルターを適用し、実施性に乏しい試料及びSNPの人口外れ値、及び複製/血縁にある個体を除去した(上の方法を参照)。これらの品質管理基準に従って、10848のSNPの最終セットを、
図1に示したようにして試験した。3735の変異体についての連関統計を算出し、7113の祖先情報マーカーを使用して集団層別化に対して修正した(上の方法を参照)。
【0157】
最初に、我々は、SLEと関連することが過去に報告されている25の変異体(23の遺伝子座から)を試験した(表2を参照)。さらに我々は、現在の組合せデータセットにおいて全ゲノム有意性(P<5×10
−8)に達した9の遺伝子座を含む21の変異体(P<0.05)についての連関性の証拠を見出した。全ゲノム有意性の結果は、HLAクラスII DR3(DRB1
*0301)、IRF5、TNFAIP3、BLK、STAT4、ITGAM、PTPN22、PHRF1(KIAA1542)、及びTNFSF4(OX40L)であった。分析により、9の遺伝子座からの変異体についての付加的な証拠が提供され、そこでは単一の以前の研究で、全ゲノムの有意性レベルが報告されている:HLA
*DR2、TNFAIP3(rs6920220)、BANK1、ATG5、PTTG1、PXK、FCGR2A、UBE2L3、及びIRAK1/MECP2)。
【0158】
初期の候補遺伝子研究では、SLEについての可能性のあるリスク対立遺伝子として、MECP2が同定された(Sawalha, A.H等, PLoS ONE 3:e1727 (2008))。しかしながら、現在のデータセットでは、IRAK1近傍のSNP、MECP2周囲の連鎖不均衡の同定領域内に位置し、シグナル伝達する、トール様レセプター7及び9についての重要遺伝子が、連関性の最も強い証拠を示した。同様の発見が最近報告されており(Jacob, C.O等, Proc. Natl. Acad. Sci. USA (2009))、IRAK1/MECP2遺伝子座における関連した対立遺伝子を決定するためのさらなる研究が必要となるであろう。さらに我々は、3つの遺伝子座 - TYK2、ICA1及びNMNAT2−全ゲノムレベルで連関性の証拠はないが、以前から有意性が示されている−についての連関性の証拠を見出した(Harley, J.B等, Nat. Genet. 40:204-10 (2008);Sigurdsson, S等, Am J Hum Genet 76:528-37 (2005))。4つの以前より関連していた変異体−LYN、SCUBE1、TLR5及びLY9−は、組合せデータセットにおいて、連関性についての何の証拠も観察されていない。
【0159】
新規なSLEリスク遺伝子座を同定するために、我々は、1310のSLE症例及び7859のコントロールの拡張セットにおいて遺伝子タイピングされた502033のSNPを含んでいた我々の全ゲノムデータセット(Hom, G等, N Engl J Med 358, 900-9 (2008))において、SLEに対して連関性の証拠が示した2446の異なる遺伝子座から計3188のSNPを調べた。このデータセットを使用し、我々は、参照として第II相HapMap CEU試料を使用し、変異体を>2.1にインピュートし(上の方法を参照)、連関統計の順位リストを作成した。P<0.05の変異体をカスタム複製アレイへの可能な含有のために選択した。効果的な遺伝子タイピングのために、我々は相関する変異体の群を同定し (r
2>0.2)、ついで、各群から少なくとも2のSNPを選択し、ここで最も低いP値は<0.001であった。残った群について、群中の最も低いP値を有するSNPを含めた。複製試料において、我々は連関統計(本方法を参照)を算出し、予期されるヌル分布に対する複製結果の有意なリッチ化を観察した。過去に報告されたSLEリスク対立遺伝子を除外すると、P<0.05(予想64、P=2×10
−15)を有する134の遺伝子座、及びP<0.001(予想1、P=1×10
−9)を有する12の遺伝子座が存在し、真のポジティブの存在が示唆された。
【0160】
図2A−2Eのそれぞれには、TNIP1(
図2A)、PRDM1(
図2B)、JAZF1(
図2C)、UHRF1BP1(
図2D)、及びIL−10(
図2E)で定まる遺伝子座を囲む500kb領域内のx軸上のゲノム位置に対してy軸上にプロットされた全ゲノム連関性スキャンからの連関性結果が示されている。最も連関性のあるマーカーについてのメタアナリシスP値は、
図2A−2Eのそれぞれにおいて塗り潰された四角により示される。
図2A−2Fの各々について、ゲノムスキャンからのP値は、全ゲノム関連変異体に対するLDを示すようにマークされている:点描の円はr
2>0.8;破線の円はr2>0.5;縞状の円はr
2>0.2;白抜きの円はr
2<0.2を示す。
図2A−2Eの底部に沿って、CEU HapMapからの組換え率(黒の実線)及び既知のヒト遺伝子を各プロットの下に示した。
図2B(PRDM1)では、ATG5遺伝子近傍の過去に報告され、独立したSLEリスク遺伝子座(rs2245214)を黒い実線の円で示した。
図2Fは、1963の症例及び4329のコントロール複製試料における1256の独立したSNP(アレイ中の任意の他のSNPに対してr
2<0.1)のP値のヒストグラムを示す。ヌル分布下、結果の予期された密度は
図2Fに破線で示される。
図2Fに示されるように、P<0.05未満の結果の有意なリッチ化が観察された。
【0161】
従って、複製研究では、有意性(P<5×10
−8)について全ゲノム閾値を越えた組合せP値を有する5つの新規SLEリスク遺伝子座:TNIP1、PRDM1、JAZF1、UHRF1BP1、及びIL10が同定された。これらと他の遺伝子座に対する詳細の統計的連関性を以下の表4に示す。
【0162】
TNF-アルファ誘導性タンパク質3(TNFAIP3)交互作用タンパク質1(TNIP1)のイントロン内に存在する5q33.1上の変異体rs7708392は、3つ全てのコホートにおいてSLEと有意に連関しており、組合せP=3.8×10
−13(
図2A)を有していた。TNIP1近傍の変異体は、近年、乾癬のリスクの原因であることが見出されているが(Nair, R.P等, Nat Genet 41:199-204 (2009))、SLE及び乾癬変異体は21Kbだけ離れており、異なる遺伝的シグナルであると思われる(r
2=0.001)。TNIP1及びTNFAIP3は交互作用するタンパク質であるが(Heyninck, K.等, FEBS Lett 536:135-40 (2003))、TNFAIP3の調節におけるTNIP1の正確な役割は知られていない。SLE(Graham, R.R等, Nat. Genet. 40(9):1059-61 (2008), Musone, S.L等, Nat. Genet. 40(9):1062-64 (2008))、関節リウマチ(Plenge, R.M等, Nat Genet 39:1477-82 (2007))、乾癬(Nair, R.P等, Nat Genet 41:199-204 (2009))及びI型糖尿病 (Fung, E.Y等, Genes Immun 10:188-91 (2009))とのTNFAIP3近傍の複数の区別される変異体の連関は、この経路が自己免疫疾患の調節において重要な役割を有することを示唆している。
【0163】
第2の確認されたリスク変異体(rs6568431、P=7.12×10
−10)は、ZNFドメイン(PRDM1、BLIMP1としても知られている)及びAPG5オートファジー5-様(ATG5)と、PRドメイン含有1との間の遺伝子間領域に同定された。rs6568431でのシグナルは、rs6568431がrs2245214と共にr
2<0.1を有し、rs2245214が、rs6568431が導入された条件付きロジスティック回帰後、SLE(P<1×10
−5)との有意な相関性を保持しているため、ATG5、rs2245214(Harley, J.B等, Nat Genet 40:204-10 (2008))(表4を参照)内の過去に報告されているSLEリスク対立遺伝子とは異なると思われる(
図2B)。
【0164】
他のジンクフィンガー遺伝子1との並置体(JAZF1)のプロモーター領域は、第3の新規に確認されたSLE遺伝子座(rs849142、P=1.54×10
−9)(
図2C)である。興味あることに、この同じ変異体は2型糖尿病(Zeggini, E等, Nat Genet 40:638-45 (2008))のリスクと、高さの差異(Johansson, A等, Hum Mol Genet 18:373-80 (2009))に以前から関連していた。JAZF1近傍の別の前立腺癌対立遺伝子rs10486567(Thomas, G等, Nat Genet 40:310-5 (2008))は現在の研究では連関性の証拠を示さなかった。
【0165】
SLEにおける第4の新規リスク遺伝子座は、ICBP90結合タンパク質1(UHRFBP1、rs11755393、P=2.22×10
−8)の非同義対立遺伝子(R454Q)により定まる(
図2D)。この対立遺伝子は、複数の経路に関連した転写及びメチル化因子である、UHRF1の推定結合パートナーにおける非保存的アミノ酸変化である(Arita, K.等, Nature 455:818-21 (2008))。UHRFBP1リスク対立遺伝子は、伸長した連鎖不均衡の領域内にあり、SLE自己抗体によってしばしば標的とされるRNAプロセシング複合体の一部である小核リボヌクレオタンパク質ポリペプチドC(SNPRC)を含む複数の遺伝子を包含する。
【0166】
同定された第5の新規のSLE遺伝子座はインターロイキン-10(IL10;rs3024505、P=3.95×10
−8)(
図2E)である。IL10は、免疫応答をダウンレギュレートするように機能する重要な免疫調節サイトカインであり(Diveu, C等, Curr Opin Immunol 20:663-8 (2008))、IL10の変異はSLEに関連していることが報告されている(Nath, S.K等, Hum Genet 118:225-34 (2005))。SLEに関連した変異体は潰瘍性大腸炎(Franke, A等, Nat Genet 40:1319-23 (2008))及びI型糖尿病(Barrett, J.C等. , Nature Genetics 41:703 - 707 (2009))に対するリスクの原因として最近同定されているSNPと同一であり、これらの疾患におけるIL10経路での共有病態生理学の可能性が示唆される。
【0167】
組合せた複製試料におけるP<1×10
−5の有意な閾値を使用し、我々は、21の付加的なSLE候補リスク遺伝子座を同定した(表4)。P<1×10
−5を有する1未満の遺伝子座(0.01)がメタアナリシスのヌル分布(P=8×10
−77)下で予想され、これらの遺伝子座のいくつかが真のポジティブ遺伝子座である可能性があることが示唆される。このリストにおける関心ある候補遺伝子は:a)先のGWASに関係し、そのファミリーメンバーIRF5及びIRF7が確認されたSLEリスク遺伝子座内にあるインターフェロン調節因子8(IRF8)(Graham, R.R等, Nat. Genet. 40(9):1059-61 (2008));b)TAOキナーゼ3(TAOK3)、つまりリンパ球で発現するキナーゼのミスセンス対立遺伝子(rs428073、N47S);c)リソソーム輸送レギュレーター(LYST)、つまりヒトにおけるチェディアック-東症候群、リンパ増殖性疾患により特徴付けられる複合疾患の原因となる変異、;及びd)インターロイキン12レセプター、ベータ2(IL12RB2)、IL23R及びSERPBP1を含む遺伝子座であるが、自己免疫疾患、炎症性腸疾患、乾癬及び強直性脊椎炎で報告されているIL23R変異体とは異なると思われるものを含む(Duerr, R.H等, Science 314:1461-3 (2006))。
【0168】
最近のGWA研究の顕著な特徴は、異なった複合疾患間で共有される多数の重複遺伝子座である(Zhernakova, A等, Nat Rev Genet 10:43-55 (2009))。我々は、SLEと連関する自己免疫疾患リスク対立遺伝子として過去に報告されている35の遺伝子座からの42の変異体を試験した(表6及び7)。単一の遺伝子座は未調節のP値<5×10
−8を有していないが、我々は、連関対立遺伝子のリッチ化を見出した。検定した35の遺伝子座から(42の全変異体)、未調節のP<0.0004(偶然予期された1未満の結果、P=4.4×10
−12)、及び35の前もって特定された遺伝子座に対するボンフェローニ補正後、P<0.05を有する5つの対立遺伝子が存在した。5つの変異体のそれぞれについて、SLE関連対立遺伝子は過去に報告された対立遺伝子にマッチし、同じ方向の効果を有している(表6)。我々はI型糖尿病及びグレーブス病(Smyth, D.J等, Nat Genet 38:617-9 (2006);Sutherland, A等, J Clin Endocrinol Metab 92:3338-41 (2007))と過去に関連していたIFIH1(rs1990760、P=3.3×10
−7)のミスセンス対立遺伝子の高度に有意な連関性を観察した。また、我々は、HLAクラスIII領域に存在し、加齢黄斑変性の検証されたリスク対立遺伝子である補体因子B(CFB、rs641153)のミスセンス対立遺伝子(R32Q)との連関性も観察した(Gold, B等, Nat Genet 38:458-62 (2006))。SLEリスク対立遺伝子は、SLEに関連した他のHLA領域変異体(DR2/DR3)と有意な連鎖不均衡(LD)ではなく、DR2及びDR3を導入した条件付きロジスティック回帰分析後に有意なままであった。HLAは複合遺伝的領域であるが、SNP rs641153の対立遺伝子が、報告されたAMDリスク対立遺伝子とほぼ同一の保護効果を有していることは印象的である(Gold, B等, Nat Genet 38:458-62 (2006))。5つの候補疾患対立遺伝子のさらなる研究が示される。
【0169】
また、表7は、他の自己免疫疾患で同定されている42の変異体について詳細な要約統計値を提供する。関心あることに、他の自己免疫疾患で有意な危険因子であるCTLA4、IL23R、NOD2及びCD40からの変異体はSLEに対する連関性の証拠を示さないようである。
【0170】
26のSLEリスク対立遺伝子(表2の過去に報告された21の遺伝子座と、上述した5つの新規のSLE遺伝子座)を使用し、いくつかの付加的な分析を実施した。確認された遺伝子座を用いたペアワイズ交互作用分析を実施し、SLE(Harley, J.B等, Nat Genet 40:204-10 (2008))及び他の複合疾患(Barrett, J.C等, Nat Genet 40:955-62 (2008))から、先の文献と一致し、非付加的交互作用についての証拠は観察されなかった。条件付きロジスティック回帰分析を使用しても、我々は、個々のリスク遺伝子座の任意でのリスクの原因となる複数の独立した対立遺伝子について、何の証拠も観察しなかった。次に我々は、Barrett等(Barrett, J.C等, Nat Genet 40:955-62 (2008))により記載された方法を使用し、確認されたSLEリスク対立遺伝子の各々により説明されるパーセント分散を推定した。HLA−DR3、IRF5及びSTAT4はそれぞれ>1%の遺伝的分散を占めると推定され、残りの遺伝子座はそれぞれ1%未満の分散を占めた。併せると、26のSLEリスク遺伝子座がSLEに対する推定8%の全遺伝的感受性を説明する。
【0171】
GWAS結果の標的複製は、付加的なリスク遺伝子座を確認するための効果的な研究設計である(Hirschhorn, J.N等, Nat Rev Genet 6:95-108 (2005))。しかしながら、全ゲノム有意性についての許容されるP値基準に不十分な結果を複製する確率に関して、入手可能なデータはほとんどない。現在の研究では、最初のGWAS研究からP<0.05の全ての変異体を複製に含めた。
図3に示されるように、GWAS研究においてP値が低ければ低いほど、複製メタアナリシスにおいて候補又は確認された状態に達する確率は高くなる。関心あることに、何の候補又は確認された結果も、複製において検定された全ての変異体の〜50%を占めるにもかかわらず、0.05と0.01の間のGWAS Pを有する変異体の群から、現在の研究では得られなかった。これらの結果は、将来の標的研究設計の指針に有用でありうるが、確かに最初のGWAS集団のサイズ、複製試料のサイズ、疾患構造、及び候補変異体のエフェクトサイズを、複製試作のプランニングにおいて注意深く考慮する必要がある。
【0172】
これらのデータは、免疫系の適応及び自然アームの機能に重要な遺伝子における共通の変異が、SLE発症のリスクを確立するのに重要であるというさらなる証拠を提供する。同定された対立遺伝子の各々は、全体的な遺伝的リスクの一部のみを説明するが、これらの及び他の継続している研究は、ループスの病因への新規な見識を提供し、薬剤の発見及び開発のための新規な標的及び経路を示唆している。
【0173】
臨界領域は、HapMap CEU集団でr
2>0.4の変異体を含む最小領域として定められ、HG18座標(Mb)で報告される。P値は示された症例/コントロール集団から算出され(GWAS:1310の症例及び7859のコントロール、合衆国:1129の症例及び2991のコントロール、スウェーデン:834の症例及び1338のコントロール、組合せ:3273の症例及び12188のコントロール試料)、組合せP値は本方法に記載のようにして算出した。リスク対立遺伝子は+参照ストランドに対して報告される。リスク対立遺伝子頻度はコントロール染色体における頻度である。オッズ比は上の方法に記載した組合せオッズ比である。
aはGWAS試料において、方法に記載されたようにインピュートされ、複製試料において直接遺伝子タイピングされたマーカーを示す。
b rs3135394はHLA*DR3(DRB1*0301)対立遺伝子に対してr
2=0.87を有する。c rs9271366はHLA*DR2(DRB1*1501)対立遺伝子に対してr
2=0.97を有する。拡張した要約統計に対しては表3を参照。N.A.=利用不可;QC基準にパスしなかったため(TYK2、FCGR2A、及びIRAK1/MECP2)、又は特定の変異体が全ゲノムアレイに存在しないため(TLR5及びIRF5)。しかしながら、rs2070197(IRF5領域)は、ゲノムスキャンでP=2×10
−11を有していたrs10488631と強い連鎖不均衡(LD)にある。
【0174】
ここでの臨界領域はHapMap CEU集団でr
2>0.4の変異体を含む最小領域として定められ、HG18座標(Mb)で報告される。対立遺伝子頻度は示された症例/コントロール集団から算出された(GWAS:1310の症例及び7859のコントロール、合衆国:1129の症例及び2991のコントロール、スウェーデン:834の症例及び1338のコントロール、組合せ:3273の症例及び12188のコントロール試料)。対立遺伝子は+参照ストランドに対して報告され、全データは対立遺伝子1(A1)に言及する。各集団に対するオッズ比(OD)を列挙する。
【0175】
試料、臨界領域、P値、リスク対立遺伝子、及びオッズ比は、表2の凡例に記載された通りである。
aはGWAS試料から上の方法で記載されたようにインピュートされ、複製試料において直接遺伝子タイピングされたマーカーを示す。拡張した要約統計に対しては表5を参照。
【0176】
ここでの臨界領域はHapMap CEU集団でr
2>0.4の変異体を含む最小領域として定義され、HG18座標で報告される。対立遺伝子頻度は示された症例/コントロール集団から算出された(GWAS:1310の症例及び7859のコントロール、合衆国:1129の症例及び2991のコントロール、スウェーデン:834の症例及び1338のコントロール、組合せ:3273の症例及び12188のコントロール試料)。対立遺伝子は+参照ストランドに対して報告され、全データは対立遺伝子1(A1)に言及する。各集団に対するオッズ比(OD)を列挙する。
【0177】
表中の全対立遺伝子は、報告されている変異体と同一であるか又は報告されている変異体に対してr2>0.8を有し、同じ方向の効果を持つ同じリスク対立遺伝子である。位置(塩基対)はHG18座標で報告される。試料、個体及び組合せP値、リスク対立遺伝子頻度及びORは表2の凡例に記載された通りである。組合せ補正P値は、過去に報告された35のリスク遺伝子座に対するボンフェローニ補正P値である。他の自己免疫連関:T1D=I型糖尿病、AMD=加齢黄斑変性、MS=多発性硬化症、IBD=炎症性腸疾患及びPS=乾癬。拡張された要約統計及び検定された変異体の完全なリストについては表7を参照。aはGWAS試料から方法に記載されたようにしてインピュートされ、複製試料において直接遺伝子タイピングされたマーカーを示す。
【0178】
【0179】
位置(塩基対)はHG18座標で報告される。P値は示した症例/コントロール集団から算出し(GWAS:1310の症例及び7859のコントロール、合衆国:1129の症例及び2991のコントロール、スウェーデン:834の症例及び1338のコントロール、組合せ:3273の症例及び12188のコントロール試料)、組合せたP値は上記方法に記載したようにして算出した。複製P値は、合衆国及びスウェーデンの組合せた試料に対するメタP値を意味する。対立遺伝子は+参照ストランドに対して報告され、全データは対立遺伝子1(A1)に言及する。各集団に対するオッズ比(OD)を列挙する。
【0180】
実施例2
BLKに対する原因対立遺伝子の再配列化及び同定
上で検討したように、BLKは全ゲノム有意性(P<5×10
−8)を達成するSLEに関連したリスク遺伝子座として同定された。この連関性の遺伝学的基礎をさらに特徴付け、原因対立遺伝子を同定するために、我々は以下に記載するような、BLK遺伝子座の再配列化研究及びレポーター遺伝子発現アッセイを実施した。
【0181】
再配列化研究では、自己免疫性バイオマーカー協力ネットワーク(ABCoN)(Bauer等, PLoS medicine 3(12):e491 (2006))において192人の患者、NIH/NIAMS資金提供リポジトリ、及びニューヨーク癌プロジェクト(NYCP)(Mitchell等, J. Urban Health 81:301-10 (2004))の96人のコントロール個体から単離されたDNAのBLK遺伝子座の2.5kb上流のプロモーター配列、及び13エクソンの全てを再配列化した。配列化の前に、ゲノムDNAを製造者のプロトコルに従い、全ゲノムで増幅させた(Qiagen, Valencia, CA., Cat. No. 150045)。
【0182】
再配列化の結果は、17の変異(10の非同義、7の同義)がBLK遺伝子のコード化領域で見出されることを示した(表8)。これらの変異はいずれも、コントロールより症例において有意に高い頻度を示さなかった。非同義変異の全体的な頻度は、コントロール(7/96)よりも症例(14/191)において有意に高くはなかった。
【0183】
さらに、複数の共通のバリエーションが、BLKの非コード化領域で同定された(表9に示す)。これらのSNP(rs4840568、rs1382568[三重対立遺伝子SNP(A/C/G);C対立遺伝子はリスク対立遺伝子として予め同定されていた]、及びrs922483(配列番号:13))は、r
2>0.5を有するGWAS(Hom等, N Engl J Med 358:900-09 (2008))(rs13277113、オッズ比、1.39、P=1×10
−10)から予め同定されていた遺伝子座と連関していることが示された。
図4は、ハプロビュー(URL www.broadinstitute.org/haploview/haploviewで自由に入手可能なソフトウェア;Barrett J.C等, Bioinformatics 21:263-65 (2005)を参照)を使用して作成されたBLKのプロモーター領域内の連鎖不均衡(LD)ブロック(r
2で示す)を示す。図の上部は、同定されたSNPの相対位置を有するBLKのプロモーター領域の概略ダイアグラムを示す。列挙したSNP間のr
2値は、ボックス内に示す。2つのSNP間のLDの強度を、各ボックスに提供されるr
2値で示す。GWASから同定された遺伝子座(rs13277113)及び再配列化から同定された3つのSNP(rs4840568、rs1382568、及びrs922483(配列番号:13))を、図の上部の黒い境界で示す。
【0184】
この再配列化研究では、BLKのコード化領域における任意の共通変異は明らかにならなかった。しかしながら、プロモーター領域での3つの共通変異(rs4840568、rs1382568、及びrs922483(配列番号:13))が、SLEの増加するリスクと関連して、BLKの生物学的効果の潜在的な原因対立遺伝子として同定された。これらの各バリエーションを、連関性をさらに特徴付けるために以下に詳述するルシフェラーゼレポーターアッセイにおいて用いた。
【0185】
【0186】
【0187】
ルシフェラーゼレポーター遺伝子アッセイを、BLK媒介性遺伝子発現に対する3つのSNP、rs4840568、rs1382568、及びrs922483(配列番号:13)の効果を調査するために実施した。BLKの上流配列(−2256〜+55bp)を、リスク又は非リスクハプロタイプを有する個体から、ゲノムDNAを使用して増幅させた。各PCR産物をpCR2.1−TOPOベクター(Invitrogen, Carlsbad, CA; Cat. No. K4500-01)にクローニングし、ついでpGL4ルシフェラーゼレポーターベクター(Promega, Madison, WI; Cat. No. E6651)にサブクローニングした。非リスクハプロタイプを有するコンストラクトを、変異誘発に対する鋳型として使用し(Stratagene, La Jolla, CA; Cat. No. 10519-5)、様々なハプロタイプを作製した。
【0188】
PCR増幅に使用されるプライマーは以下の通りであった:
順方向:CCACCTCTCTTCCGCCTTTCTCAT(配列番号:1);
逆方向:TTTCATGGCTTGTGGCTTTCTGCC(配列番号:2)。変異誘発に使用されたプライマーを以下の表10に列挙する。
【0189】
【0190】
ウミシイタケルシフェラーゼコントロールレポーターベクターpRL−TK(Promega, Madison, WI;カタログ番号E2241)を正規化に使用した。細胞株BJAB(エプスタイン・バーウイルスゲノムを欠き、3つのヒトリンパ腫から誘導された、B細胞(骨髄由来)の特徴を有する連続したリンパ球細胞株;Klein等, Proc. Natl. Acad. Sci. USA 71:3283-86 (1974))、又はダウディ細胞株 (アメリカン・タイプ・カルチャー・コレクション(ATCC)カタログ番号CCL-213)を形質移入に使用した。各形質移入では、Amaxa(登録商標)Nucleofector(登録商標)装置(Lonza, Walkersville Inc., Walkersville, MD (Lonza Group Ltd., Switzerland);カタログ番号AAD-1001)を使用し、各ベクターのDNA5μgを用いて、5×10
6細胞を形質移入させた。細胞株Nucleofector(登録商標)キットL(Lonza, カタログ番号VCA-1005)を、Nucleofector(登録商標)装置プログラムA-030と共にダウディ細胞に使用した。細胞株Nucleofector(登録商標)キットV(Lonza, Cat. No. VCA-1005)を、Nucleofector(登録商標)装置プログラムT-020と共にBJAB細胞に使用した。全ての形質移入を2回又は3回実施した。形質移入後、細胞を37℃で16時間インキュベートした。そのインキュベーション後、細胞を収集し、製造者の使用説明書に従い、デュアル−ルシフェラーゼ(登録商標)レポーターアッセイシステム (Promega, Madison, WI;カタログ番号E1960)を使用し、ルシフェラーゼ活性を測定した。
【0191】
上述したルシフェラーゼレポーターアッセイ系において測定されたBLK媒介性遺伝子発現に対する各SNP rs4840568、rs1382568、及びrs922483(配列番号:13)の効果を
図5に示す。変異誘発により作製された種々のハプロタイプを、非リスク(野生型)ハプロタイプ22−GAC(各
図5A−Fの白抜きバー)及びリスクハプロタイプ22−ACT(各
図5A−Fのハッチングのバー)と比較した。
【0192】
図5A及び5Bは、SNP rs922483(C>T)(配列番号:13)が、BJAB(
図5A)及びダウディ細胞(
図5B)の双方においてBLK媒介性遺伝子発現に対する有意な効果を生じることを示している。非リスクハプロタイプ22−GAC(オープンバー)と比較して、ハプロタイプ22−GATは、双方の細胞株でほぼ50%まで転写活性を低下させることが示された。T対立遺伝子を有するハプロタイプは、C対立遺伝子を有するものよりも、一致して低い活性を示した。5つの独立した実験がBJAB細胞で実施され、6つの独立した実験がダウディ細胞で実施された。示されたデータは3回のアッセイにおける平均+/−平均の標準誤差(s.e.m.)を表す;*p<0.05、**p<0.01、***p<0.001(t検定)。
【0193】
図5C及び5Dは、SNP rs1382568(A>C/G>C)が、いずれかの細胞株においてBLK媒介性発現に対して如何なる有意な効果も生じなかったことを示している。ハプロタイプ22−GCC及び22−GGC(スポットバー)の双方が、非リスクハプロタイプ22−GAC(白抜きバー)と比較して、同様のレベルのルシフェラーゼ活性を示した。5つの独立した実験がBJAB細胞で実施され、6つの独立した実験がダウディ細胞で実施された。示されたデータは3回のアッセイにおける平均+/−s.e.m.を表す;*p<0.05、**p<0.01、***p<0.001、ns=有意でない(t検定)。
【0194】
図5E及び5Fは、SNP rs4840568(G>A)が、BJAB細胞又はダウディ細胞においてBLK媒介性遺伝子発現に対して有意な効果を生じなかったことを示している。ハプロタイプ22−AAC(スポットバー)と非リスクハプロタイプ22−GAC(白抜きバー)との差異は、BJAB細胞では統計的に有意ではなかったが(
図5E)、ダウディ細胞では統計的に有意であった(
図5F)。ハプロタイプ22−ACC(スポットバー)が、非リスクハプロタイプ−GAC(白抜きバー)と比較して、ルシフェラーゼ活性に如何なる欠陥も示さなかったという事実を考慮すると、A対立遺伝子が原因対立遺伝子である可能性は大きく低下する(
図5F)。示されたデータは3回のアッセイにおける平均+/−s.e.m.を表す;*p<0.05、**p<0.01、***p<0.001、ns=有意でない(t検定)。
【0195】
BLKプロモーターの上流の領域での(GT)反復が、BLK遺伝子発現のエンハンサーとして機能しうることは、以前に示されている(Lin等, J Biol Chem 270: 25968 (1995))。よって、我々は、(GT)反復の長さが、BLKプロモーターの転写活性に影響を及ぼすかどうか試験した。これらの実験を実施するため、18の(GT)反復(配列番号:14)又は22の(GT)反復(配列番号:15)の双方を有する個体からのゲノムDNA試料を、上述した方策を使用して、クローニングのために選択した。最終ベクターを配列化し、それらが正確な長さの(GT)反復を含んでいることを確認した。
図6に示されるように、18の(GT)反復(配列番号:14)を有するハプロタイプは、ルシフェラーゼレポーターアッセイにおいて、22の(GT)反復(配列番号:15)を有するものと比較して、同様のレベルの転写活性を示した。示されたデータは2回のアッセイにおける平均+/−s.e.m.を表し、ns=有意でない(t検定)。
【0196】
要約すると、BLK再配列化試作のこれらの結果及びルシフェラーゼレポーター遺伝子アッセイの結果は、SNP rs922483(C>T)(
図7、配列番号:13)が、SLEのリスク増加に関連した生物学的効果である、BLKの転写を低減させる原因対立遺伝子であることを示している。加えて、該結果は、rs922483(配列番号:13)のT対立遺伝子が、BLK媒介性遺伝子発現のレベルを50%低下させたことを示している。
【0197】
BLKの第1エクソンの進化的に保存された領域及び可能なヒト転写開始部位内にrs922483(配列番号:13)が存在していることに留意することは興味深い。ヒトInrモチーフのコンセンサス配列は、YYANWYY(IUPACヌクレオチドコード)として同定されている。Juven-Gershon等 Dev. Biol. 339:225-229 (2010)。SNP rs922483(配列番号:13)において、Inr領域中の第2の塩基は、コンセンサスモチーフに対して改変されている。従って、「野生型」ハプロタイプInr配列はCCACCTCであるが、SLEリスクハプロタイプInr配列はCTACCTCである。我々は、保存されたInrモチーフにおける第2の塩基の修飾が、TFIID転写複合体の親和性を変化させ、上述の転写の観察された差異が生じることを示唆する。