【実施例】
【0103】
実施例1−3において引用した(数によって示す)文献についての書誌的情報は実施例3の後に示す。実施例4−6において引用した(数によって示す)文献についての書誌的情報は実施例6の後に示す。
【0104】
実施例1 全身性エリテマトーデスにおける全ゲノム相関スキャンの材料と方法
この実施例は、1311のSLE症例および3340のコントロールを含む多くの試料においてSLEについての全ゲノムスキャンを実行するために用いた材料と方法を記述する。ヒトゲノムの約85%にわたって共通のバリエーションをキャプチャした500000の変異に対して、24を遺伝子タイピングし、SLEとの相関について試験した。
【0105】
被検体
SLE症例試料は以下の集団から遺伝子タイピングを行った。a) NIH/NIAMSが資金供給した管理機関である自己免疫性バイオマーカー協力ネットワーク(ABCoN:Autoimmune Biomarkers Collaborative Network)
25から338被検体、b) 複数自己免疫性疾患遺伝子共同体(MADGC:Multiple Autoimmune Disease Genetics Consortium)
26から141被検体、c) カリフォルニアサンフランシスコ大学(UCSF)狼瘡遺伝子プロジェクト
10, 27から613被検体、及びd) ピッツバーグメディカルセンター大学(UPMC)
28から335被検体とファインスタインメディカルリサーチ研究所で集められた8試料。すべてのSLE症例は自称白人であった。SLEの診断(米国リウマチ学会(ACR)規定の判定基準
29の4以上の達成)は、医療記録検査(94%)又は治療するリウマチ専門医(6%)による文書による判定基準よってすべての症例で確認された。臨床データを検討し、各々の機関で表にした。
図4は、SLEの各11のACR分類判定基準のための計数およびパーセンテージを示す
29。
合計3583のコントロール試料を相関分析で試験した。このプロジェクトの一部として、自称の民族性、性別および年齢に基づいて、1861のコントロール試料を選別し、次いでニューヨーク癌プロジェクト(NYCP)収集
30から遺伝子タイピングを行った。加えて、1722の自称の白色人種コントロール試料からの遺伝子型データは、公的に利用できるiControlDBデータベース<www.illumina.com/pages.ilmn?ID=231>から入手した。
複製のために、793人のスウェーデンのSLE患者(このすべての患者はACRによって定められるSLEの分類判定基準のうちの4以上を満たした)および857の健康なスウェーデンのコントロール個体の独立した集団からのDNA試料を遺伝子タイピングした。患者は、ルンド、ウプサラ、カロリンスカ(Solna)およびウーメオ大学病院
7のリウマチ専門病棟にいた。すべての共同している機関の施設内倫理委員会がこれらの試験を承認し、すべての参加者はインフォームドコンセントを受けた。
【0106】
遺伝子タイピング
NYCPからのコントロール試料(N=1861)は、ファインスタイン研究所のIllumina HumanHap550遺伝子タイピングビーズチップ
31にて遺伝子タイピングされた。1465の試料(464症例、1001コントロール)はHumanHap550v1チップにて遺伝子タイピングされ、1875の試料(1015症例、860コントロール)はHumanHap550v3チップにて遺伝子タイピングされた。これら1452のコントロール試料の遺伝子型データは、iControlDBに提出され、公開前に公的に利用できるようになった。HumanHap550ビーズチップを用いて遺伝子タイピングされた1722の白色人種の試料の更なる、独立した一群は、iControlDB<www.illumina.com/pages.ilmn?ID=231>の試験66および67から入手した。症例試料は、一連のフェーズでファインスタイン研究所で遺伝子タイピングされた。系列1はABCoNおよびMADGCからの479症例からなり、系列2はUCSFからの613症例を含み、系列3はUPMCおよびファインスタイン研究所からの387症例を含む。両方のHumanHap550バージョンに存在する545080の単一ヌクレオチド多型性(SNP)は分析を進めた。チップに対して80%未満の平均コールレートを有する症例およびコントロール試料は再度遺伝子タイピングされた。
スウェーデンの複製集団では、Perkin-Elmerの試薬とUppsala <www.genotyping.se>のSNPテクノロジープラットフォームでの蛍光偏光検出による均質な単一塩基プライマー伸展アッセイを用いて、SNP rs11574637およびrs13277113が遺伝子タイピングされた
32。試料の遺伝子型コールレートは96%であり、再現性は4.6%の遺伝子型の二重アッセイによると100%であった。20人の三世代CEPH家系はこの試験試料と並行して遺伝子タイピングされ、いずれのSNPに関してもメンデル遺伝からの偏差は観察されなかった。
【0107】
データ品質フィルター
95%以下平均コールレートを有する(N=42)か又は個々の報告された性別が観察された性別と一致しない試料(N=21)を分析から除いた。ゲノム全体の状態による識別(IBS)を各々の試料について推定し、曖昧な相関については試料を調べた。重複していると推定される組合せ又は1世代−3世代の血縁関係(1st-3rd degree relatives)から1試料を除いた(Pi_hat>0.10及びZ1≧0.15、N=161)。3つのこれら組合せは症例とコントロールとを含んでいたので、コントロールを除いた。コントロール中HWE P≦1×10
−6(N=2819)又は1%未満の症例の頻度(N=21644)を有するSNPを分析から除いた。5%より大きい欠測率(missingness)を有するSNP(N=6074)は除いた。SNPは、症例とコントロールとの間の欠測率における有意差について試験された。P≦1×10
−5を有するSNP(N=7646)を取り除いた。また、SNPは、例えばABCoN試料と他のすべての症例との間のバッチ効果についても試験した。P<1×10
−9を有するSNP(N=13)を除いた。
集団の外れ値をEIGENSTRAT
33を用いて検出した。上位10のいずれかの主成分に従って平均から6の標準偏差を超える試料を分析から除いた(N=141)。3340の残りのコントロール試料からのデータを、各々のSLE症例系列に比例してランダムに割り当てたところ、2.5以下のコントロール:症例比率となった(表1)。
系列1は411の症例および1047のコントロールからなり、系列2は595の症例および1516のコントロールを含み、系列3は305の症例および777のコントロールを含んだ。全体的に見て、93%の症例は女性であり、62%のコントロールは女性であった。男性と女性との間で、対立遺伝子頻度の有意な違いは認められなかった。
少なくとも一系列において2%より大きい欠測データであり、その欠測データが症例とコントロールとの間で不均一である(欠測差異、P<1×10
−3)SNPを除いた(N=3323)。X染色体の偽常染色体領域内のSNPは有意な相関を示さず(N=13)、更なる分析に用いなかった。試料およびマーカーフィルタリングは、ソフトウエアプログラムPLINK
34内の分析的モジュールを用いて実施された。各々の系列について、合計502033のSNPを以降の分析に進めた。
【0108】
データ分析
SLE罹患率に対するすべてのSNPの相関は、2×2分割表を用いて算出した。次いで、各試料系列についてゲノムコントロールインフレーション因子(λ
gc)を算出した。ゲノムコントロールインフレーション因子は、大部分の分布が帰無仮説(λ
gc=1.0)に一致するか否かを反映するカイ二乗中央値に基づく測定基準である。λ
gc値>1は、体系的な技術上の不自然な結果又は集団層別化の存在による平均カイ二乗相関統計値の上昇を示す。技術上の不自然な結果を最小限にするために質の低いデータを除いた後、各系列についてインフレーションの証拠を示した。系列1、2および3についてそれぞれ1.14、1.18および1.11。集団層別化の存在を修正するために、各系列の主成分は、EIGENSTRATにおいてSNPのサブセットを用いて算出した。SNPは第6染色体(24−36Mb)、第8染色体(8−12Mb)、第11染色体(42−58Mb)、及び第17染色体(40−43Mb)上の構造的な変化のために異常なLDパターンの領域にあるので、症例MAF<2%(5011)、コントロールHWE P≦1×10
−4(1792)又は欠測データ>1%(50414)のSNPを除去した。残りの440202のSNPを用いて主成分を算出した。各々の系列において、初めの4つの主成分を用いて、すべての502033のSNPのための相関統計値を調節した。集団層別化の調節の後、各々の系列のλ
gcは1.0に近づいた(表1を参照)。各々の系列の修正相関統計値は、λ
gcを組み込んでいるZ値の加重結合と組み合わせた(
図12)。上位50の遺伝子座を
図5に示す。さらに、各系列のQCフィルターを通過させたすべてのSNPの統計値と組み合わせた相関統計値を表にまとめた(示していない)。
最も相関する変異についての3つの症例−コントロール研究間の不均一性を試験するために、PLINKに組み入れられるBreslow−Day試験を各々3つの領域において最も相関が良いSNP:HLA DRB、STAT4、IRF5、BLKおよびITGAM/ITGAXについて行った。有意な不均一性は検出されなかった(それぞれP>0.2)。
Mantel-Haenszel不均一性試験とStata 9.2 (www.stata.com/)に組み入れた結合オッズ比を用いて、個々のSNPとサブ表現型との相関を結合データセットのために算出した(
図9)。ACR判定基準は相関していることがわかっており、α=0.05/11=0.0045の単純ボンフェローニ補正が非常に保存されているようであるので、算出したP値は多重試験で調節しなかった。
【0109】
遺伝子発現分析
公的に利用できるデータセット(GENEVARプロジェクト、www.sanger.ac.uk/humgen/genevar/)からの210の関係のない、健康なHapMap個体からのエプスタインバーウイルス形質転換B細胞株の遺伝子発現測定値を、SLEと有意に相関しているバリエーションに対する相関性について調べた
36。具体的には、北欧及び西欧起源の米国住民(CEU)60、ヨルバ族(YRI)60、北京の中国漢民族(CHB)45、及び東京の日本人(JPT)45からの、BLK(GI_33469981−S)、C8orf13 (GI_32698772−S)、ITGAM(GI_6006013−S)、ITGAX (GI_34452172−S)、ACTB (βアクチン、GI_5016088−S)、及びGAPDH (GI_7669491−S)のプローブからの4測定値の平均蛍光強度を調べた。BLK、C8orf13、GAPDHおよびACTBの発現データはrs13277113遺伝子型(HapMap (www.hapmap.org)から入手)によって階層化され、差次的発現の有意性は、等しい分散量を呈する両側t検定によって測定された。同様に、ITGAM、ITGAX、GAPDHおよびACTBの発現データは、rs11574637での遺伝子型によって階層化され、t検定を用いて有意性について試験された。GENEVARプロジェクトによって示されるように、HapMap集団に対してログスケールで正規化した発現データは、平均蛍光強度と類似の結果となった。
400のEBV−形質転換B細胞の独立した一群におけるシス遺伝子バリエーションに対するBLKおよびC8orf13発現の相関は、近年公開された試験(www.sph.umich.edu/csg/liang/asthma/ )の調査とデータ検索によって入手した
37。具体的には、Dixon et al.によって記載されるように、BLK(プローブ206255_at)およびC8orf13(プローブ226614_s_at)の発現レベルに対するrs13277113(rs4840568)のプロキシの相関を測定した
37。
【0110】
実施例2 新規の罹患遺伝子座としてのC8orf13/BLK及びITGAM/ITGAXの同定
全ゲノム相関分析
イルミナ(Illumina)チップ上の合計502033の多型SNPは品質管理フィルター(quality control filter)を通過し、3つの症例−コントロール系列を用いた段階的な様式でSLEに対する相関について試験された(表1)。結合相関統計値は、EIGENSTRAT修正カイ二乗検定統計値から変換したZスコアを加算して算出され、系列サイズについて加重され、各々の系列の残留λ
gcで調節した(方法を参照)。
ヌル分布のP値と比較したときの観察されたメタ分析P値の比較を
図1に示す。分布の後部でヌル分布からの有意な偏差が観察され(
図1A中の黒菱形)、これは陽性の相関があることを示唆する。3つの認められたリスク遺伝子座についてSLEとの強い相関が見られた。HLA クラスII領域では、rs2187668はDRB1
*0301対立遺伝子
38のほぼ完全な予測因子であり、組合せ分析において最も強くSLEと相関した変異であった(P=3×10
−21)。更なる157のHLA領域SNP(これらの多くはDRBl
*0301対立遺伝子と相関している)は5×10
−7未満の観察P値を有していた(
図1B)。インターフェロン調節因子5(IRF5)の十分に確認されたリスクハプロタイプに連鎖した変異と強い相関が観察された(例えば、rs10488631、P=2×10
−11)
7-9。加えて、STAT4との相関も観察された(rs7574865、P=9×10
−14)。SLEおよび関節リウマチとのSTAT4相関が近年報告された
10。ここでのSLEデータセットは従来の報告のものと重複しており
10、先の分析に含まれなかった更なる341の症例と2905のコントロールを含む。さらに、ここで報告される上位のSTAT4 SNPのP値は、集団層別化に対して修正された。
カイ予測対観察分析からHLA、IRF5及びSTAT4のバリエーションを除いた後、ヌル分布からのP値の偏差は除去できなかったことから(
図1A、丸)、更なるSLE遺伝子座の存在が示唆される。
図1Bに示すように、Bリンパ系チロシンキナーゼ(BLK)遺伝子の近く、そしてインテグリンαM(ITGAM)およびインテグリンαX(ITGAX)遺伝子を含む領域にある複数のSNPは、組合せ分析においてSLEと非常に相関していた。これらの遺伝子又は領域はいずれも、SLE罹患率に事前に関係していなかった。
【0111】
BLK/C8orf13
第8染色体の短腕(8p23.1)上のいくつかの変異はSLEと相関した(
図2、表2、
図8)。rs13277113の「A」対立遺伝子は、コントロールと比べて米国SLE症例において非常に多かった(P=8×10
−8、組合せOR=1.39、95%C.I.=1.26−1.54)。この初めの観察を確認するために、スウェーデンからの793のSLE症例と857の一致コントロールの独立集団をrs13277113についてタイピングし、SLEに対する少数の「A」対立遺伝子の信憑性のある相関も観察された(P=3.6×10
−4、OR=1.33、95%C.I.=1.13−1.55;表2)。米国及びスウェーデンの試料を用いたrs13277113のメタ分析ではP=1.4×10
−10が示され、これは相関P<5×10
−8の正確な全ゲノム有意閾値を上回るものである
39。
rs13277113は、反対方向で転写される2つの遺伝子、B細胞レセプターの下流のシグナルを伝達するsrcファミリーチロシンキナーゼであるBLKと、未知の機能の普遍的に発現される遺伝子であるC8orf13との間にマップされる(
図2)。rs13277113を有する連鎖不平衡(LD)にあるBLK又はC8orf13のコード領域変異は知られていない。
共通の遺伝子バリエーションは、シス遺伝子発現のレベルと相関することが示されている
8, 36, 37, 40。関連のプロモーターSNPがBLKおよび/またはC8orf13のmRNA発現に影響するか否かを決定するために、210の関係のないHapMap試料からのエプスタイン-バーウイルス形質転換Bリンパ球細胞株から生成される遺伝子発現データセットを対象とした
36。rs13277113の「A」対立遺伝子はBLKのmRNA発現のレベル低減と著しく相関した(
図2B)。A対立遺伝子のホモ接合体は、G対立遺伝子のホモ接合体より50%以下の低減した発現を示し、A/Gヘテロ接合体は中間のレベルであった。興味深いことに、C8orf13遺伝子の発現もリスクハプロタイプと相関していたが、逆方向であった。rs13277113のA対立遺伝子は形質転換細胞株のC8orf13の発現の上昇と相関していたのに対して、G対立遺伝子は発現の低減と有意に相関していた(
図2C)。また、A/Gヘテロ接合体は中間の発現レベルを示した。多くのコントロールmRNA(例えばβアクチン、GAPDH)の発現は、rs13277113の遺伝子型に応じて細胞株において変化しておらず(
図6)、すべてのHapMap集団においてBLK発現の一致した対立遺伝的な差異が観察された(
図7)。これらの結果は、400のHapMapでない形質転換B細胞株における全ゲノムSNPと遺伝子発現の独立したデータセットを分析することによって確認された
37。このデータセットでは、rs13277113(rs4840568、r
2=0.77)に相関したマーカーは、BLKの発現減少(P=8.9×10
−27、プローブ206255_at)とC8orf13の発現増加(P=4.6×10
−35、プローブ226614_s_at)の両方と相関した。
IRF1、PPARGおよびインターフェロン刺激応答成分のモチーフを含む、複数の保存された転写因子結合部位はBLKおよびC8orf13の5'領域に位置する。しかしながら、rs13277113及び相関した変異(r
2>0.5)はいずれも公知の転写因子結合部位や公知の機能的な核酸モチーフを変更しなかった。発明者等は、rs13277113又はrs13277113と強く相関したバリエーションがBLK及びC8orf13のmRNA発現のレベルを変更すると結論づけた。
【0112】
ITGAM/ITGAX
また、第16染色体上のインテグリンα鎖遺伝子のクラスター内の変異はSLEと有意に相関していた(
図3、表2)。3つのSLE系列全体にわたって、rs11574637の「C」対立遺伝子の再現可能な相関が観察された(P=5×10
−7、OR=1.30、95%C.I.=1.17−1.45)。重要なことに、rs11574637の「C」対立遺伝子はスウェーデンの複製系列において同様に強く濃縮されており(P=4×10
−7、OR=1.59、95%C.I.=1.33−1.91;表2)、メタ分析は組合せP=3×10
−11を示した。発明者等は、rs11574637に連鎖したバリエーションが確認されたSLEリスク対立遺伝子を示すこと、そして、ITGAM/ITGAX遺伝子座がSLE病因に寄与することを結論づけた。
rs11574637は、ITGAM及びITGAXの5'部位を含むいくつかの遺伝子をコードする150kb以下をカバーする相関したSNPの大きな塊の一部である(
図3A)。ITGAM及びITGAXはEBV形質転換B細胞内で検出可能なレベルで発現されるが、rs11574637はいずれかの遺伝子のmRNA発現レベルと有意に相関していなかった(データは示さない)。潜在的な興味として、SNP rs11574637はITGAMの2つの非同義性変異と相関している。コントロール群では、Pro1146Ser変異(rs1143678、P=2.5×10
−5)は、疾患関連のrs11574637変異に、0.85のr
2で相関した。rs1143678の「C」対立遺伝子と1146Ser対立遺伝子は、18.2%のコントロール染色体にてハプロタイプを形成し、「C」対立遺伝子は、1146Ser対立遺伝子を欠いている異なる2%のハプロタイプも存在している。二つ目の非同義性対立遺伝子(rs1143683、Ala858Val)は現在の試験では直接遺伝子タイピングされなかったが、Pro1146Serと高い相関がある(HapMap CEUではr
2=0.85)。ITGAM非同義性変異又は更なる対立遺伝子(一又は複数)がITGAM/ITGAX領域内の相関の基礎となっているか否かを決定するためには更なる試験が必要であろう。
【0113】
SLE臨床形質との相関
最後に、組合せ症例系列1−3を用いて(
図9、方法の項を参照)、上位2つのSNP、つまりrs11574637(BLK)及びrs13277113(ITGAM)と、個々のACR判定基準の存在との間の相関を調べた。最も強い相関は、rs11574637少数対立遺伝子と関節炎の存在との逆相関であった、OR=0.73(95%CI=0.59−0.91、P=0.0045)。両方の変異は、血液学的な判定基準と僅かに相関していた。rs11574637、OR=1.21(95%CI=1.00−1.47、P=0.04)及びrs13277113、OR=1.23(95%CI=1.03−1.46、P=0.02)。他の有意な相関は観察されなかった。
【0114】
考察
ここでは、SLEに実施した包括的な全ゲノム相関試験の結果を記載する。1311もの多くのSLE症例群と、3340ものさらに多くのコントロール群を試験することによって、SLEリスクに寄与する主な対立遺伝子を検出した。HLA領域、IRF5およびSTAT4において観察された強力なシグナルは、実験のためのポジティブコントロールとして役立ち、これらの遺伝子座がこの疾患の最も重要な遺伝学的因子の一つであることが確認される。
srcファミリーチロシンキナーゼBLKはSLEの興味深い新規な候補遺伝子である。BLKの発現は、Bリンパ球系に非常に限局している
41。マウスのBIk発現は、周期の後期の(cycling late)プロB細胞において初めに観察され、B細胞の発達中には存続し、その後プラズマB細胞において下方制御される
42。Blkのノックアウトマウスは全体の表現型を示さず
43、ヒトB細胞での機能的な試験は行われていない。理論に縛られるものではないが、BLKはB細胞レセプターの下流のシグナルを伝達するチロシンキナーゼの一つであり、ノックアウトにおいて表現型を欠くのであれば、おそらくBLKはマウスにおいて重複した役割を有するであろう。B細胞レセプター結合キナーゼの役割において重要な種相違の先例がある。例えば、ヒトのブラットンチロシンキナーゼ(BTK)欠損は、X連鎖の無ガンマグロブリン血症とびB細胞の完全な欠失を引き起こす
44。しかしながら、マウスのBtkの欠損は軽度の表現型と相関しており、機能的に傷害している成熟B細胞が産生される
45。
B細胞レセプターによるシグナル伝達は、B細胞発達の間に変更するレセプター、欠失及びアネルギーの誘導による、B細胞レパートリーの確率に重要である
46, 47。ここで示されるように、BLKのリスク対立遺伝子は形質転換B細胞株のBLK mRNAの発現低減と相関している。理論に縛られるものではないが、BLKのタンパク質レベルが変更するとB細胞の耐性メカニズムが影響を受け、これが個体の全身性自己免疫状態の素因になるかもしれない。近年、狼瘡のNZM2410モデルマウスの主要な遺伝子座の一つであるLy108について類似のメカニズムが示された
48。したがって、本発明の一実施態様では、当業者は、本明細書中に示す情報を用いて、普遍的に発現される遺伝子C8orf13の発現に対するリスクハプロタイプの影響を評価することができる。
このスキャンにおいて同定された二つ目の遺伝子座はITGAM/ITGAXである。ITGAXはITGAXの5'部位に拡がる領域内の相関の強いLDに基づいて検討しないが、データから、ITGAMは領域内の関連遺伝子でありうることが示唆される。ITGAM(CD11b、Mac−1、補体レセプタータイプ3としても知られる)は、樹状細胞、マクロファージ、単球および好中球を含む様々な骨髄細胞型によって発現される、非常に特徴的なインテグリンα鎖分子である
49-51。ITGAMは、ITGB2(CD18)とヘテロダイマーと形成し、免疫系の細胞種間の接着、および内皮への骨髄性細胞の接着を媒介する
52。ITGAMを欠損しているマウスは、狼瘡を含む自己免疫
53-55の様々なモデルにおいて疾患の進行と炎症の亢進を示し、近年のデータから、ITGAMは通常、自己免疫の誘導と連鎖している経路であるTh17分化
56を抑制するように機能しうることが示唆される。興味深いことに、活動性SLE患者の好中球ではCD11bの発現が亢進されることが報告されている
57。2つの高く相関した非同義性対立遺伝子を有するITGAMのリスク対立遺伝子は、タンパク質の機能及び/又はタンパク質の発現の調節を変更し、それによって全身性自己免疫に寄与しやすくしうる。
まとめるとと、現在のデータにより、SLEについての2つの新規な罹患遺伝子座、つまり第8染色体上のBLK/C8orf13と第16染色体上のITGAM/ITGAXが同定される。これら2つの遺伝子座内の最も可能性のある候補遺伝子はBLKおよびITGAMである。これら遺伝子の同定により、SLEの遺伝学的基準に重要な新規な見解が示され、更に治療のための潜在的な新規な標的が示唆される。
【0115】
実施例3 全身性エリテマトーデス(SLE)における全ゲノム相関スキャンとSLEと相関する新規の遺伝子座の同定
この実施例では、最初のデータセットは、イルミナHumanHap550v1チップとイルミナHumanHap550v3チップからの遺伝子型とともに、実施例1および2に記載の全ゲノム相関試験からの症例とコントロールからなる。イルミナHumanHap550v1チップからのデータセットは、464の症例および1962のコントロールの各々において555352個のSNPからなる。イルミナHumanHap550v3チップからのデータセットは、971の症例および1621のコントロールの各々において561466個のSNPからなる。各々のデータセットについて、品質管理フィルターを実施例1および2に記載の様式と同様に適応した。HumanHap550v1チップからの結果のデータセットは、422の症例および1881のコントロールの各々において534523個のSNPからなる。HumanHap550v3チップからの結果として生じるデータセットは、929の症例および1558のコントロールの各々において549273個のSNPからなる。
イルミナHumanHap550v1チップからの上記データセットを、イルミナHumanHap550v3チップからの上記データセットと混合(merge)した。結果として生じたデータセットは、1351の症例および3439のコントロールの各々において564307個のSNPからなる。このデータセットは、コントロールとして用いた、CGEMSの胸部及び前立腺の癌研究からの遺伝子型(4527の試料の各々における553820個のSNP)と混合(merge)した。結果として生じたデータセットは、1351の症例および7966のコントロールの各々において570099個のSNPからなる。品質管理フィルターを実施例1および2に記載の様式と同様に適応した。結果として生じたデータセットは、1351の症例および7966のコントロールの各々において446856個のSNPからなる。
上記のデータセットを用いて、プログラムIMPUTE(www, stats .ox . ac.uk/~marchini/software/gwas/impute .html)による、第二相HapMapにおける各多型のCEU SNPについての遺伝子型確率帰属させた。推奨される有効個体数(−Ne11418)を用いた。
SLE状態と各々の帰属させたSNPとの間の相関は、プログラムSNPTEST (www.stats.ox.ac.uk/~marchini/software/gwas/snptest.html)によって算出した。集団外れ値は除いた。集団外れ値は、実施例1および2に記載のものと同様な様式で、プログラムEIGENSTRATによって決定した。相加的及び一般的な頻度論的モデルを試験した。
【0116】
文献
1. Hochberg MC. The epidemiology of systemic lupus erythematosus. In: Wallace DJ, Hahn BH, eds. Dubois' Lupus Erythematosus. 5th ed. Baltimore: Williams and Wilkins; 1997.
2. Wakeland EK, Liu K, Graham RR, Behrens TW. Delineating the genetic basis of systemic lupus erythematosus. Immunity 2001;15(3):397-408.
3. Nath SK, Kilpatrick J, Harley JB. Genetics of human systemic lupus erythematosus: the emerging picture. Curr Opin Immunol 2004;16(6):794-800.
4. Goldberg MA, Arnett FC, Bias WB, Shulman LE. Histocompatibility antigens in systemic lupus erythematosus. Arthritis Rheum 1976; 19(2): 129-32.
5. Graham RR, Ortmann WA, Langefeld CD, et al. Visualizing human leukocyte antigen class II risk haplotypes in human systemic lupus erythematosus. Am J Hum Genet 2002;71(3):543-53.
6. Graham RR, Ortmann W, Rodine P, et al. Specific combinations of HLA-DR2 and DR3 class II haplotypes contribute graded risk for disease susceptibility and autoantibodies in human SLE. Eur J Hum Genet 2007;15(8):823-30.
7. Sigurdsson S, Nordmark G, Goring HH, et al. Polymorphisms in the tyrosine kinase 2 and interferon regulatory factor 5 genes are associated with systemic lupus erythematosus. Am J Hum Genet 2005;76(3):528-37.
8. Graham RR, Kozyrev SV, Baechler EC, et al. A common haplotype of interferon regulatory factor 5 (IRF5) regulates splicing and expression and is associated with increased risk of systemic lupus erythematosus. Nat Genet 2006;38(5):550-55.
9. Graham RR, Kyogoku C, Sigurdsson S, et al. Three functional variants of IFN regulatory factor 5 (IRF5) define risk and protective haplotypes for human lupus. Proc Natl Acad Sci U S A 2007;104(16):6758-63.
10. Remmers EF, Plenge RM, Lee AT, et al. STAT4 and the risk of rheumatoid arthritis and systemic lupus erythematosus. N Engl J Med 2007;357(10):977-86.
11. Ronnblom L, Aim GV. A pivotal role for the natural interferon alpha-producing cells (plasmacytoid dendritic cells) in the pathogenesis of lupus. J Exp Med 2001;194(12):F59-63.
12. Baechler EC, Gregersen PK, Behrens TW. The emerging role of interferon in human systemic lupus erythematosus. Curr Opin Immunol 2004; 16(6): 801-07.
13. Banchereau J, Pascual V. Type I interferon in systemic lupus erythematosus and other autoimmune diseases. Immunity 2006;25(3):383-92.
14. Miyagi T, Gil MP, Wang X, Louten J, Chu WM, Biron CA. High basal STAT4 balanced by STATl induction to control type 1 interferon effects in natural killer cells. J Exp Med 2007;Epublication; Sept 10.
15. A haplotype map of the human genome. Nature 2005;437(7063): 1299-320.
16. Dewan A, Liu M, Hartman S, et al. HTRAl promoter polymorphism in wet age-related macular degeneration. Science 2006;314(5801):989-92.
17. Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature 2007;447(7145):661-78.
18. Matarin M, Brown WM, Scholz S, et al. A genome- wide genotyping study in patients with ischaemic stroke: initial analysis and data release. Lancet neurology 2007;6(5):414- 20.
19. Moffatt MF, Kabesch M, Liang L, et al. Genetic variants regulating ORMDL3 expression contribute to the risk of childhood asthma. Nature 2007;448(7152):470-73.
20. Plenge RM, Seielstad M, Padyukov L, et al. TRAFl -C5 as a Risk Locus for Rheumatoid
Arthritis - A Genomewide Study. N Engl J Med 2007.
21. Saxena R, Voight BF, Lyssenko V, et al. Genome-wide association analysis identifies loci for type 2 diabetes and triglyceride levels. Science 2007;316(5829): 1331-36.
22. Scott LJ, Mohlke KL, Bonnycastle LL, et al. A genome-wide association study of type 2 diabetes in Finns detects multiple susceptibility variants. Science 2007;316(5829):1341- 45.
23. Scuteri A, Sanna S, Chen WM, et al. Genome- Wide Association Scan Shows Genetic Variants in the FTO Gene Are Associated with Obesity-Related Traits. PLoS Genet 2007;3(7):el l5.
24. Pe'er I, de Bakker PI, Mailer J, Yelensky R, Altshuler D, Daly MJ. Evaluating and improving power in whole-genome association studies using fixed marker sets. Nat Genet 2006;38(6):663-67.
25. Bauer JW, Baechler EC, Petri M, et al. Elevated serum levels of interferon-regulated chemokines are biomarkers for active human systemic lupus erythematosus. PLoS medicine 2006;3(12):e491.
26. Criswell LA, Pfeiffer KA, Lum RF, et al. Analysis of families in the multiple autoimmune disease genetics consortium (MADGC) collection: the PTPN22 620W allele associates with multiple autoimmune phenotypes. Am J Hum Genet 2005;76(4):561-71.
27. Seligman VA, Suarez C, Lum R, et al. The Fcgamma receptor IIIA-158F allele is a major risk factor for the development of lupus nephritis among Caucasians but not non- Caucasians. Arthritis Rheum 2001 ;44(3):618-25.
28. Demirci FY, Manzi S, Ramsey-Goldman R, et al. Association of a common interferon regulatory factor 5 (IRF5) variant with increased risk of systemic lupus erythematosus (SLE). Ann Hum Genet 2007;71(Pt 3):308-l 1.
29. Hochberg MC. Updating the American College of Rheumatology revised criteria for the classification of systemic lupus erythematosus. Arthritis Rheum 1997;40(9):1725.
30. Mitchell MK, Gregersen PK, Johnson S, Parsons R, Vlahov D. The New York Cancer Project: rationale, organization, design, and baseline characteristics. J Urban Health 2004;81(2):301-10.
31. Gunderson KL, Steemers FJ, Ren H, et al. Whole-genome genotyping. Methods Enzymol 2006;410:359-76.
32. Hsu TM, Chen X, Duan S, Miller RD, Kwok PY. Universal SNP genotyping assay with fluorescence polarization detection. Biotechniques 2001;31(3):560.
33. Price AL, Patterson NJ, Plenge RM, Weinblatt ME, Shadick NA, Reich D. Principal components analysis corrects for stratification in genome-wide association studies. Nat Genet 2006;38(8):904-09.
34. Purcell S, Neale B, Todd-Brown K, et al. PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet 2007;81(3):559-75.
35. Devlin B, Roeder K, Wasserman L. Genomic control for association studies: a semiparametric test to detect excess-haplotype sharing. Biostatistics 2000;l(4):369-87.
36. Stranger BE, Nica AC, Forrest MS, et al. Population genomics of human gene expression. Nat Genet 2007;39(10):1217-24.
37. Dixon AL, Liang L, Moffatt MF, et al. A genome-wide association study of global gene expression. Nat Genet 2007;39(10):1202-7.
38. de Bakker PI, McVean G, Sabeti PC, et al. A high-resolution HLA and SNP haplotype map for disease association studies in the extended human MHC. Nat Genet 2006;38(10):l 166-72.
39. Hirschhorn JN, Daly MJ. Genome-wide association studies for common diseases and complex traits. Nature reviews 2005;6(2):95-108.
40. Cheung VG, Spielman RS, Ewens KG, Weber TM, Morley M, Burdick JT. Mapping determinants of human gene expression by regional and genome- wide association. Nature 2005;437(7063): 1365-69.
41. Dymecki SM, Zwollo P, Zeller K, Kuhajda FP, Desiderio SV. Structure and developmental regulation of the B-lymphoid tyrosine kinase gene blk. J Biol Chem 1992;267(7):4815-23.
42. Wasserman R, Li YS, Hardy RR. Differential expression of the blk and ret tyrosine kinases during B lineage development is dependent on Ig rearrangement. J Immunol 1995;155(2):644-51.
43. Texido G, Su IH, Mecklenbrauker I, et al. The B-cell-specific Src-family kinase Blk is dispensable for B-cell development and activation. MoI Cell Biol 2000;20(4): 1227-33.
44. Tsukada S, Saffran DC, Rawlings DJ, et al. Deficient expression of a B cell cytoplasmic tyrosine kinase in human X-linked agammaglobulinemia. Cell 1993;72(2):279-90.
45. Khan WN, Alt FW, Gerstein RM, et al. Defective B cell development and function in Btk-deficient mice. Immunity 1995;3(3):283-99.
46. Cornall RJ, Goodnow CC. B cell antigen receptor signalling in the balance of tolerance and immunity. Novartis Foundation symposium 1998;215:21-30.
47. Nemazee D, Weigert M. Revising B cell receptors. J Exp Med 2000;191(l l):1813-7.
48. Kumar KR, Li L, Yan M, et al. Regulation of B cell tolerance by the lupus susceptibility gene LylO8. Science 2006;312(5780): 1665-9.
49. Abbas AR, Baldwin D, Ma Y, et al. Immune response in silico (IRIS): immune-specific genes identified from a compendium of microarray expression data. Genes Immun 2005;6(4):319-31.
50. Hynes RO. Integrins: versatility, modulation, and signaling in cell adhesion. Cell 1992;69(l):l l-25.
51. Lu H, Smith CW, Perrard J, et al. LFA-I is sufficient in mediating neutrophil emigration in Mac- 1 -deficient mice. J Clin Invest 1997;99(6):1340-50.
52. Dunne JL, Collins RG, Beaudet AL, Ballantyne CM, Ley K. Mac-1, but not LFA-I, uses intercellular adhesion molecule- 1 to mediate slow leukocyte rolling in TNF-alpha- induced inflammation. J Immunol 2003;171(l l):6105-10 and Tables 1-6.
53. Hammerberg C, Katiyar SK, Carroll MC, Cooper KD. Activated complement component 3 (C3) is required for ultraviolet induction of immunosuppression and antigenic tolerance. J Exp Med 1998; 187(7): 1133-38.
54. Sohn JH, Bora PS, Suk HJ, Molina H, Kaplan HJ, Bora NS. Tolerance is dependent on complement C3 fragment iC3b binding to antigen-presenting cells. Nat Med 2003;9(2):206-12.
55. Watts GM, Beurskens FJ, Martin-Padura I, et al. Manifestations of inflammatory arthritis are critically dependent on LFA-I. J Immunol 2005;174(6):3668-75.
56. Ehirchiou D, Xiong Y, Xu G, Chen W, Shi Y, Zhang L. CDl Ib facilitates the development of peripheral tolerance by suppressing Th 17 differentiation. J Exp Med 2007;204(7):1519-24.
57. Buyon JP, Shadick N, Berkman R, et al. Surface expression of Gp 165/95, the complement receptor CR3, as a marker of disease activity in systemic Lupus erythematosus. Clin Immunol Immunopathol 1988;46(l):141-49.
58. Giglio S, Broman KW, Matsumoto N, et al. Olfactory receptor-gene clusters, genomic- inversion polymorphisms, and common chromosome rearrangements. Am J Hum Genet 2001;68(4):874-83.
59. Sugawara H, Harada N, Ida T, et al. Complex low-copy repeats associated with a common polymorphic inversion at human chromosome 8p23. Genomics 2003;82(2):238-44.
【0117】
実施例4 1310のSLE症例および7859のコントロールにおける全ゲノム相関スキャン
方法:SLE症例とコントロールでの試料情報と遺伝子タイピング
SLE症例試料の選別と遺伝子タイピングは先に記載された(1)。簡単にいうと、a) NIH/NIAMSが資金供給した管理機関である自己免疫性バイオマーカー協力ネットワーク(ABCoN:Autoimmune Biomarkers Collaborative Network)(2)の338被検体、b) 複数自己免疫性疾患遺伝子共同体(MADGC:Multiple Autoimmune Disease Genetics Consortium)(3)の141被検体(ABCON+MADGC=症例系列1)、c) カリフォルニアサンフランシスコ大学(UCSF)狼瘡遺伝子プロジェクト(4, 5)の613被検体(症例系列2)、及びd) ピッツバーグメディカルセンター大学(UPMC)(6)の335被検体とファインスタインメディカルリサーチ研究所で集められた8試料(症例系列3)、からのDNA試料をイルミナ550Kアレイを用いて遺伝子タイピングした。AU SLE症例は自己報告による欧州起源の北米人である。SLEの診断(米国リウマチ学会(ACR)規定の判定基準(7)の4以上の達成)は、医療記録検査(94%)又は治療するリウマチ専門医(6%)による文書による判定基準よってすべての症例で確認された。これらの症例系列の臨床データは至る所で発表されていた(4, 3, 2, 6, 5)。
イルミナ550Kアレイを用いて遺伝子タイピングした合計8147のコントロール試料を相関分析において調べた。3つの起源をコントロールに用いた(すべて欧州起源の北米人)。ニューヨーク健康プロジェクト(NYHP:New York Health Project)集団からの1861試料(8)、公的に利用できるiControlDBデータベース(www.illumina.com/pages.ilmn?ID=231)からの1722試料、及び、公的に利用できる罹患率の癌遺伝学的マーカー(CGEMS:Cancer Genetics Markers of Susceptibility)プロジェクト(http://cgems.cancer.gov/)からの4564試料。NYHP試料の遺伝子タイピングは先に記載された(1)。
【0118】
遺伝子型データ品質フィルター
試料とSNPフィルタリングは、後述するように、ソフトウェアプログラムPLINK(9)およびEIGENSTRAT(10)内の分析的モジュールを用いて実行した。
a) SLE症例、NYCP試料及びiControlDB試料
記載されるように、イルミナ550K SNPアレイ、バージョン1(HH550v1)を用いて464の症例および1962のコントロールを遺伝子タイピングし、イルミナ550K SNPアレイ、バージョン3(HH550v3)を用いて971の症例および1621のコントロールを遺伝子タイピングした(1)。報告された性別が観察された性別と一致しなかった試料(HH550v1:10、HH550v3:11)、および5%より大きな欠測(missing)遺伝子型を有する試料(HH550v1:25、HH550v3:21)を分析から除外した。SLE症例とコントロールとの間の曖昧な相関は、すべての起こりうるペアワイズ試料組合せについてゲノム全体の状態による識別(IBS)を推定して決定した。重複又は1世代−3世代の血縁関係(1st-3rd degree relatives)であると推定される各組の試料は除いた(Pi_hat≧0.10およびZ1≧0.15;HH550v1:88、HH550v3:73)。コントロール中HWE P≦1×10
−6を有するSNP(HH550v1 : 3176、HH550v3: 2240)又は5%より大きな欠測データを有するSNP(HH550v1 : 12605、HH550v3: 7137)は除いた。症例とコントロールとの間の欠測データの頻度における有意差についてSNPを試験し、PLINKに用いた差次的欠測率においてP≦1×10
−5を有するSNPを除いた(HH550v1:5027、HH550v3:2804)。また、SNPは、性別間での有意な対立遺伝子頻度差異についても試験した。すべてのSNPはコントロールではP≧1×10
−9を有した。データは、(例えばABCoN試料と他のすべての症例との間の)バッチ効果の存在について試験し、P<1×10
−9の対立遺伝子頻度差異を有するSNP(N=13)を除いた(HH550v1: 18、HH550v3: 10)。ヘテロ接合のハプロイド遺伝子型を有する変異は欠測(missing)に対して設定した(HH550v1:2305、HH550v3:875)。さらに、少数の対立遺伝子頻度<0.0001を有する変異を除いた(HH550v1:97、HH550v3:57)。
【0119】
b) CGEMS試料
2277の前立腺癌試料と、別に、2287の乳癌試料について、ヘテロ接合のハプロイド遺伝子型は欠測(missing)に対して設定した(前立腺:2717、胸部:0)。報告された性別が観察された性別と一致しなかった試料(前立腺:1、乳:2)、および5%より大きな欠測(missing)データを有する試料(前立腺:15、乳:1)を分析から除外した。上記の通り、曖昧な相関については試料を試験し、重複又は1世代−3世代の血縁関係(1st-3rd degree relatives)であると推定される各組から一つの試料を除いた(Pi_hat≧0.10およびZ1≧0.15;前立腺:12、胸部:7)。MAF<0.0001を有するSNP(前立腺:3254、胸部:2166)を除いた。
【0120】
c) すべての試料
すべてのSLE症例およびコントロールからなる混合(merge)したデータセットに更なるデータ品質フィルターを適用した。5%より大きい欠測データを有するSNP(N=65421)及び5%より大きい欠測データを有する試料(N=0)を除いた。二重の試料に対する試験はMAF≧0.45を有する957個の独立したSNPを用いて行い、二重の試料は見られなかった。コントロール中HWE P≦1×10
−6を有するSNP(N2174)及び2%より大きな欠測データを有するSNP(N=5522)は除いた。発明者等は、症例とコントロールとの間の欠測データの割合における有意差についてSNPを試験し、過剰な欠測データ差を有するSNPを除いた(P≦1×10
−5、N=16080)。SNPを性別間の有意差について試験し、すべてのSNPはコントロール中P≧1×10
−9を有した。また、SNPは、特に、CGEMS乳癌試料と他の全てのコントロールとの間、そして、CGEMS前立腺癌試料と他の全てのコントロールとの間のバッチ効果の存在について調べ、P<1×10
−9を有するSNP(N=73)を除いた。上記の品質フィルターの適用の後、480831個のSNPが残った。
症例およびコントロールは、EIGENSTRATを用いて集団外れ値の存在について試験した。症例中MAF<2%(N=16068)、コントロール中HWE P≦1×10
−4(N=977)、又は1%より大きな欠測データ(N=17029)を有するSNP、第6染色体(24−36Mb)、第8染色体(8−12Mb)、第11染色体(42−58Mb)および第17染色体(40−43Mb)上の構造的バリエーションによる異常なLDパターンの領域内のSNP、及び、染色体Xの偽常染色体領域内のSNP(N=12)は、集団外れ値を検出するためのバリエーションの主成分(EIGENSTRAT)を決定するために除いた。上位10のいずれかの主成分に従って平均から6の標準偏差を超える試料を分析から除いた(N=148)。
最終的なデータセットは、1310の症例、7859のコントロールおよび480831個のSNPを有し、ゲノムコントロールインフレーション因子(λ
gc)(11)は上記のデータ品質フィルターの適用の後には1.06であった。
【0121】
観察されない遺伝子型の帰属(Imputing)
ヒトゲノムに多くの連鎖不平衡が存在することにより、特定の状態のタイピングされないバリエーションが、高い信頼性をもって推測される。IMPUTE(一連の公知のハプロタイプ(HapMap第II相ハプロタイプ、www.hapmap.org)に基づく全ゲノム症例−コントロール研究において観察されない遺伝子型を帰するためのプログラム)を分析に用いた(www.stats.ox.ac.uk/~marchini/software/gwas/impute.html)。
【0122】
GNE症例およびNYCP、iDBおよびCGEMSのコントロールの帰属(Imputing)
品質管理フィルターの後、1310のGNE症例、3344のNYCPおよびiDBのコントロール、4515のCGEMSコントロールおよび446856個のSNPとなった。プログラムIMPUTE(v0.3.1)は、含まれたCEUハプロタイプ、凡例、およびNCBI Build 35に整列配置されるマップファイルを用いて実行した。有効集団サイズは11418の推奨された値にセットした。ストランドファイル(strand file)は用いず、IMPUTEにおいて調べるストランドアラインメント(strand alignment)を用いた。症例、NYCPおよびiDBコントロールおよびCGEMSコントロール別々に帰属させ、各染色体を全体として別々に帰属させた。2562708個のSNPを帰属させた。
SNPTEST(v1.1.3)を用いて、実際の遺伝子型及び帰属の遺伝子型の両方について相関試験を行った。すでに遺伝子タイピングされたSNPについては、実際の遺伝子型を用いた。相関試験は、遺伝子型の不確定性を十分に考慮するための「-proper」オプションを有する、相加的遺伝子効果についてのコクラン−アーミテッジ検定とした。0.50を超える情報スコア(すなわちfrequentist_add_proper_info>0.50)を有するSNPのみを残した(2481907のSNP[97%])。
【0123】
結果。1310の症例および7859のコントロールの分析におけるSLEと相関する(P<1×10
−5)SLE遺伝子座の重複しないリストを表1に示す。上記の2300000個のSNPの分析から、±100kb間隔で最も低いP値を有する単一の変異を表すことによって、一覧(rank ordered list)を生成した。
表1:1310の症例および7859のコントロールの分析におけるSLEと相関する遺伝子座(P≦1×10
−5)。上記の2300000個のSNPの分析から、±100kb間隔で最も低いP値を有する単一の変異を表すことによって、一覧(rank ordered list)を生成した。SNP(dbSNP id)、染色体、位置(build 35のヒトゲノム内の塩基対位置)、SLE症例およびコントロールにおける少数の対立遺伝子頻度、SNPTESTからのP値(相加的モデル(additive model)条件下、帰属精度について修正)、帰属情報スコア(帰属精度の推定)およびオッズ比(95%の信頼区間)を示す。
【0124】
実施例5 GNE相関スキャンにおける報告されたSLEリスク遺伝子のメタ分析
方法
確認されたSLE遺伝子座についてのSLE文献と判定基準の調査
確認されたSLEリスク遺伝子座について、合計16の対立遺伝子が下記の判定基準の一つを満たした(表2)。
1) P≦1×10
−5の少なくとも2つの独立した報告を有するSLEリスク遺伝子座。
P≦1×10
−5を有する重複しないSLEコホートにおいて2つの独立した報告を有する遺伝子座について文献を調べた。文献検索は2008年4月前の刊行物を表す。同じ方向の効果を有するSLEに相関を示す同一の変異(又はr
2>0.3を有する代わりのもの)を必要とした。HLA−DRBl
*0301(HLA−DR3、(18, 19))、HLA−DRBl
*1501(HLA−DR2、(18, 19))、タンパク質チロシンホスファターゼ非レセプタータイプ22(PTPN22、(20, 21))、インターフェロン制御因子5(IRF5、(22, 23))、シグナル伝達性転写因子4(STAT4、(5, 21))、Bリンパ球チロシンキナーゼ(BLK、(21, 1))及びインテグリンαM(ITGAM、(1, 24))を含む合計7つの対立遺伝子が要件を満たした。ここに記載される1310のSLE症例および7859のコントロールの全ゲノム相関スキャンにおける同一対立遺伝子又は最も良好な代替物(r
2>0.85)について分析を進めた(表2)。
【0125】
2) P≦1×10
−5の1つの報告を有するSLEリスク遺伝子座。
2008年4月現在のある一つの刊行物において報告されたPがP≦1×10
−5であるSLEリスク遺伝子座について文献検索を実行し、合計18の遺伝子座が同定された。
13の遺伝子座では、上記の1310のSLE症例及び7859のコントロールの全ゲノムスキャンにおいて、同一変異又はほぼ完全な代替物(r
2>0.9)を遺伝子タイピングした(表4)。後述する方法を用いたメタ分析を13の遺伝子座について実行し、このうちの8つの遺伝子座はP≦5×10
−8に達した。全ゲノム有意性を達成している遺伝子座(遺伝子座内の単一遺伝子によって標識される)には以下が含まれる。下垂体腫瘍−形質転換タンパク質1(PTTG1)、APG5自己貪食5様(ATG5)、CTD-結合SR様タンパク質rA9(KIAA1542)、ユビキチンコンジュゲート酵素E2L3(UBE2L3)、セリン/スレオニンキナーゼを含有しているPXドメイン(PXK)、IgGのFc断片、低親和性IIa、レセプター(FCGR2A)、腫瘍壊死因子(リガンド)スーパーファミリー4(TNFSF4)、およびアンキリンリピート1を有するB細胞骨格タンパク質(BANK1)。メタ分析の全ゲノム有意性を達成している変異について分析を進めた(表5、表2)。残りの5つの遺伝子座では、1310のSLE症例及び7859のコントロールのSLE全ゲノム相関スキャンにおいて、報告された変異又はほぼ完全な代替物(r
2>0.9)の遺伝子タイピングを行わなかった(表2)。しかしながら、インターロイキン1レセプター結合キナーゼ1(IRAK1)における変異は観察P≦1×10
−4を有しており、分析を進めた(表1)。
【0126】
メタ分析
各々の系列についての修正相関統計値を、コホートサイズについて加重したZスコアの加算によって結合した。
【0127】
表2 このGWASの1310のSLE症例および7859のコントロールにおける16の確認されたSLEリスク対立遺伝子の相関統計値。対立遺伝子はP値の順に並べる。
【0128】
表3 P≦1×10
−5を有する同じSNP(またはr2>0.3を有する代替物)による少なくとも2の独立した報告を有するSLEリスク遺伝子座。
【0129】
表4 メタ分析が可能であったP≦1×10
−5を有する、一度だけ報告されたSLEリスク遺伝子座。8の遺伝子座はメタP≦5×10
−8を有した。
【0130】
表5 メタ分析が可能でなかったP≦1×10
−5を有する、一度だけ報告されたSLEリスク遺伝子座。IRAK1のみは、発明者等のGNE GWASにおいてP≦1×10
−5であるSNPを有した。
【0131】
実施例6 概要
SLEリスク遺伝子座の概要
SLEリスク遺伝子座は、a) 1310のSLE症例および7859のコントロールの分析、及びb) 既に報告されたSLEリスク遺伝子座によるメタ分析、の2つの主な方法を用いて同定した。
SLEリスクに対して強い相関がある変異(P<1×10
−6)の重複しない一覧を表6に示す。
【0132】
SLEリスクおよび治療に対する応答を評価するためのアルゴリズム
表現型と相関する変異は、相加的な対立遺伝的用量に依存した様式で相互作用することが知られている(38, 39)。ある例示的な実施態様では、以下のアルゴリズムを用いて、狼瘡へのリスク、重症度および治療への応答を評価することができる。狼瘡症例は、保持するリスク対立遺伝子の数に基づいて群内で階層化されてもよい。この例示的な実施態様では、リスク対立遺伝子は、その遺伝子座からのコントロールと比較して狼瘡症例において濃縮された対立遺伝子として定義される。例えば表6では、18の遺伝子座から合計19の対立遺伝子があり、リスク対立遺伝子の最大可能な数は38となる。リスク対立遺伝子の数および結果として生じる分布の三分位数によって階層化される狼瘡症例を決定してもよい。次いで、狼瘡症例の三分位数は、重症度、リスク及び治療への応答における差異について調べてもよい。
【0133】
表6:狼瘡リスク遺伝子座
【0134】
文献
1. G. Horn et al, N EnglJ Med 358, 900 (2008).
2. J. W. Bauer et al , PLoS Med 3, e491 (2006).
3. L. A. Criswell et al , Am J Hum Genet 76, 561 (2005).
4. V. A. Seligman et al. , Arthritis Rheum 44, 618 (2001).
5. E. F. Remmers et al. , N Engl J Med 357, 977 (2007).
6. F. Y. Demirci et al. , Ann Hum Genet 71, 308 (2007).
7. M. C. Hochberg, Arthritis Rheum 40, 1725 (1997).
8. M. K. Mitchell, P. K. Gregersen, S. Johnson, R. Parsons, D. Vlahov, J Urban Health 81, 301 (2004).
9. S. Purcell et al. , Am J Hum Genet 81, 559 (2007).
10. A. L. Price et al. , Nat Genet 38, 904 (2006).
11. B. Devlin, K. Roeder, L. Wasserman, Biostatistics 1, 369 (2000).
12. R. R. Graham et al. , Arthritis research 3, 299 (2001 ).
13. M. C. Hochberg, Arthritis and Rheumatism 40, 1725 (1997).
14. C. Wellcome Trust Case Control, Nature 447, 661 (2007).
15. S. Purcell.
16. S. Purcell et al, American Journal of Human Genetics 81, 559 (2007).
17. A. L. Price et al. , Nat Genet 38, 904 (2006).
18. K. Hartung, Baur, M.P., Coldewey, R., Fricke, M., Kalden, J.R., Lakomek, H.J., Peter, H.H., Schendel, D., Schneider, P.M., Seuchter, S.A., Stangel, W., Deicher, H.R.G., J. Clin. Invest. 90, 1346 (1992).
19. Z. Yao et al, Eur J Immunogenet 20, 259 (1993).
20. Y. H. Lee et al , Rheumatology (Oxford) 46, 49 (2007).
21. J. B. Harley et al. , Nat Genet 40, 204 (2008).
22. S. Sigurdsson et al, Am J Hum Genet 76, 528 (2005).
23. R. R. Graham et al , Nat Genet 38, 550 (2006).
24. S. K. Nath et al, Nat Genet 40, 152 (2008).
25. C. Kyogoku et al , Am J Hum Genet 75, 504 (2004).
26. J. B. Harley, K. L. Moser, P. M. Gaffney, T. W. Behrens, Curr Opin Immunol 10, 690 (1998).
27. M. M. Fernando et al , PLoS Genet 3, el 92 (2007).
28. R. R. Graham et al, Proc Natl Acad Sci USA 104, 6758 (2007).
29. D. S. Cunninghame Graham et al , Nature Genetics 40, 83 (2008).
30. S. V. Kozyrev et al, Nat Genet 40, 211 (2008).
31. T. Oishi et al. , J Hum Genet 53, 151 (2008).
32. C. O. Jacob et al, Arthritis Rheum 56, 4164 (2007).
33. J. C. Edberg et al , Hum MoI Genet 17, 1147 (2008).
34. L. Prokunina et al. , Nat Genet 32, 666 (2002).
35. S. Paabo, Nature 421, 409 (2003).
36. K. A. Frazer et al , Nature 449, 851 (2007).
37. P. I. de Bakker et al., Nat Genet 37, 1217 (2005).
38. J. Mailer et al, Nat Genet 38, 1055 (2006).
39. G. Lettre et al , Nat Genet 40, 584 (2008).
【0135】
実施例7 配列決定概要
方法
192人のSLE患者および96人の健常対照者からのゲノムDNAを、再配列決定の前に全ゲノム増幅した。ゲノムDNAは、Bリンパ系キナーゼ(BLK)、インテグリンαM(ITGAM)およびインテグリンαX(ITGAX)のすべてのエキソンと選択した非コード領域(エキソン1のプロモーター領域-上流の2.5kb)の再配列決定を行った。
最初の対立遺伝子コーリングは、「Polymorphic」によって提供されるソフトウェアによって実行した。すべてのコード多型性並びに共通の非コード対立遺伝子は手動で検証して対立遺伝子コールを確認し、遺伝子タイピングファイルを作成して、相関およびハプロタイプ分析に用いた。
ITGAM/ITGAXの変異は、表7および9および表8および10に示す。表7および9の変異は、データベースdbSNP buildl29に存在しない。表8および10の変異は、ITGAM/ITGAXおよびBLKの配列決定によって発見した。
【0136】
表7:ITGAMおよびITGAXエキソンおよびプロモーター領域の変異。
【0137】
表8:ITGAMおよびITGAXエキソンおよびプロモーター領域の変異。
【0138】
表9:BLKエキソンおよびプロモーター領域の変異。
【0139】
表10:BLKエキソンおよびプロモーター領域の変異。
【0140】
実施例8
被検体及び研究計画
SLEについての全ゲノム相関試験を行った。1079のSLE症例および1411のコントロールについて、イルミナHumanHap550遺伝子タイピングビーズチップにより遺伝子タイピングを行った(555352SNP)。SLE症例は3つの異なるコホートから得た。コントロール試料は、市販のHLAタイピング、民族性、性別および年齢に基づいて選択した。HLA DR2およびDR3ハプロタイプの頻度がSLEに見られるのと一致するように、ほとんどのコントロール(277を除く)を選択した。
イルミナHumanHap550には3つのバージョンがある。バージョン1とバージョン3に共有するSNPの数は545080であり、これらのSNPのみを分析した。バージョン1は、すべてのコホート1およびコホート2の試料と1001のコントロール試料に用いた。バージョン3は、すべてのコホート3の試料と410のコントロール試料に用いた。
平均コールレート(call rate)が80%未満のチップは再試行した。すべての再試行が完了した後、90%未満のコールレートを有する試料を除いた。
初めに、試料を分析のために2つの群に分けた。第一群(グループ1)は、すべてのコホート1およびコホート2の試料(466症例)と724のコントロール試料からなる。第二群(グループ2)は、すべてのコホート3試料(613症例)と残りの687のコントロール試料からなる。
【0141】
グループ1のフィルタリング
遺伝子型により決定される性別と臨床記録との間の一致について試料を調べた。10の試料(3症例、7コントロール)において不一致があったので、これらを更なる分析に用いなかった。
次いで、プログラムSTRUCTUREを用いてインターコンチネンタル混合(intercontinental admixture)について試料を試験した(オンラインリンクは頭に「.html」を付けて「pritch.bsd.uchicago.edu/structure」を入力するとアクセス可能である)(基本的にPritchard et al., Genetics (2000), 155:945-959;Falush et al., Genetics (2003), 164:1567-1587;Falush et al., Molecular Ecology Notes (2007)、doi: 10.1111/j.l471-8286.2007.01758.xに記載される)。HumanHap550には、HapMapプロジェクトのCEU、YRIおよびCHB+JPT集団に対するパーセント−起源を決定するための仮想である、276個のSNPの「DNAテストパネル」が含まれる。(これらのSNPを用いてはCHBおよびJPTを判別できない)。DNAテストパネルの276個のSNPのうちの274個は、すべてのHapMap集団において遺伝子タイピングされた。残りのグループ1(463症例、717コントロール)と、HapMapプロジェクトの各々の血統(すなわち、ユタからのCEPH試料(CEU)20、ヨルバ族試料(YRI)30、漢民族試料(CHB)45および日本試料(JPT)44)からの1の試料とからなるセットにおいてこれら274個のSNPについての遺伝子タイピングによりSTRUCTUREを行った。HapMap試料はポジティブコントロールとして含め、クラスター化アルゴリズムの補助に用いた。3つの集団とすれば、30000のバーンイン工程の後に100000のMarkov−Chainモンテカルロ工程により、事前の集団情報がない混合起源モデルと相関対立遺伝子頻度モデルを用いて、同じパラメータによりSTRUCTUREを別々に3回行った。3回の実行は、各試料について起源(ancestry)の係数が非常に類似しており、各HapMap試料はその地理的起源に対して93.0%より大きな起源であった。各CEU試料は 97.0%より大きなCEU起源であった。3回の実行のいずれかにおいて90.0%より小さなCEU起源であった試料(28症例、24コントロール)は更なる分析に用いなかった。
残りの試料(435症例、693コントロール)について、95%未満のコールレートを有するSNP(23275個のSNP(4%))は更なる分析に用いなかった。次いで、コントロールにおいて0.001以下のハーディワインベルグ確率を有するSNP(15622個のSNP(3%))は更なる分析に用いなかった。
【0142】
グループ2のフィルタリング
遺伝子型により決定される性別と臨床記録との間の一致について試料を明確に調べなかった。
95%未満のコールレートを有するSNP(34998個のSNP(6%))は更なる分析に用いなかった。
上記の通り、次いで、STRUCTUREを用いてインターコンチネンタル混合(intercontinental admixture)について試料を試験した。3回の実行のいずれかにおいて90.0%より小さなCEU起源であった試料(21症例、24コントロール)は更なる分析に用いなかった。
残りの試料(592症例、663コントロール)について、コントロールにおいて0.001以下のハーディワインベルグ確率を有するSNP(22202個のSNP(4%))は更なる分析に用いなかった。
【0143】
グループ1および2の統合
グループ1および2は最終的な分析のために統合した。
グループ1の残りの試料(435症例、693コントロール)をグループ2の残りの試料(592症例、663コントロール)と統合して、最終グループ(1027症例、1356コントロール)とした。グループ1およびグループ2に残っているSNP(496458個のSNP)のみをさらに分析した。
性別が矛盾しないすべての試料(1076症例、1404コントロール)を調べ、重複しているか又は同族(related)であるか否かをみた。まず最初に、試料のすべての対を、ゲノム全体に広がる800個のSNP全体と比較した。次いで、重複及び同族の候補を540000+SNP全体にわたって調べた。3群の外れ値を検出した。第一群(20対)は各対の間で95%より大きな同一性があり、重複と思われた。第二群(17対)は、各対間で67〜77%の同一性があり、同族と思われた。第三群(5対)は、各対間で58〜63%の同一性があり、同族と思われた。(試料間の平均同一性は51〜55%であった)。 最終的に、39の試料(29症例、10コントロール)が最終グループから除かれた。
ミトコンドリアDNAのSNP(19個のSNP)更なる分析に用いなかった。
結果として生じたメイングループ(998症例、1346コントロール、496439個のSNP)が以降の分析に用いられた。
また、メイングループの特定のサブセットについて同じ分析を行った。
サブセット1:女性のみ(907症例、967コントロール)、およびサブセット2:ループス腎炎を有する症例、とすべてのコントロール(286症例、1346コントロール)を有する症例。
【0144】
分析と結果
メイングループのAU SNPは、基本的にPrice et al., Nature Genetics (2006), 38:904 - 909に記載されるプログラムであって、集団層別化を修正するEIGENSTRATを用いて分析した(オンラインリンクは頭に「.htm」を付して「genepath.med.harvard.edu/~reich/EIGENSTRAT」を入力するとアクセス可能である)。上位10の主成分を用いて、5ラウンドの外れ値を除き、その後層別化を修正した。次いで、EIGENSTRATカイ二乗統計値を算出し、χ2分布の片側確率は自由度(degree of freedom)を1としたマイクロソフトエクセルのCHIDIST機能によって算出した。
一番の候補領域を決定するために、初めに、発明者等は、P値閾値を用いて候補SNPの数を減らした。サブセット1(女性)およびサブセット2(腎炎)では、P>2.0×10
−5を有するSNPは更なる分析に用いず、メイングループ(998症例、1346コントロール)では、P>7.0×10
−5を有するSNPは更なる分析に用いなかった。女性サブセットでは、19個のSNPが残った。腎炎サブセットでは、35個のSNPが残った。メイングループでは、47個のSNPが残った。次いで、各SNPを含む連鎖不平衡(LD)領域は、HelixTreeプログラム(オンラインリンクは頭に「.html」を付して「www.goldenhelix.com/pharmhelixtreefeatures」を入力することによってアクセス可能である) (Golden Helix, Montana, USA)を用いてLDプロットを調べることによって決定した。EMアルゴリズムを用いて、症例とコントロールの遺伝子型のみを用いてD'とr
2を算出した。D'≧0.9以下を境界として、領域を目視により描写した。
各領域を描写した後、各領域内の遺伝子は人為的な(art-established)ゲノムブラウザにより調べた(例えば、UCSCゲノムブラウザ、基本的にKuhn et al., Nucleic Acids Res. (2007), 35(database issue): D668-73に記載される;オンラインリンクは頭に「.edu」を付して「genome.ucsc」を入力することによってアクセス可能である、2006年3月アセンブリ)。IRIS研究(Abbas et al., Genes and Immunity (2005), 6:319-331、このオンライン副教材を含む)にて決定される免疫特異的な遺伝子発現を調べた。一番の候補領域は、例えば、領域内の免疫特異的な遺伝子の存在によって識別した。腎炎サブセットでは、20個の候補SNPを含む11の領域が、SLEの少なくとも一のリスク対立遺伝子を含む可能性があるものとして選択された(
図12)。女性サブセットでは、9個の候補SNPを含む6の更なる領域が選択された(
図13)。メイングループでは、8個の候補SNPを含む6の更なる領域が選択された(
図14)。37個の候補SNPを含む合計23の領域が選択された。SNPについて最も強力な結果を得た試験グループの下にSNPを挙げたので、試験グループ間の重複ヒット(duplicate hit)が示されない点に留意する必要がある。加えて、MHC領域内のヒットは含まれなかった。
図12−14のデータに基づいて正確に描かれたLD領域が決定され、それぞれ
図15−17にまとめた。