【実施例】
【0022】
図1は、本実施例に係る質的表現型の推定についての説明である。
図1では、説明を簡明にするため、単独座位が疾患の発症に影響する場合を例に説明を行い、複数座位が影響する場合については後述する。
【0023】
まず、疾患の発症に影響する座位の2つのアレルをA,aとする。また、2つのアレルのうち、aを注目するアレルとする。この場合、遺伝型AA,Aa,aaの中に含まれるアレルaの数は、それぞれ0,1,2となる。
【0024】
本実施例に係る表現型推定システムは、対象の疾患についての遺伝型Aaの遺伝型AAに対するオッズ比r
1と、遺伝型aaの遺伝型Aaに対するオッズ比r
2と、aアレル頻度pと、リスク(疾患発症リスク)の母平均mとを入力として用いる。
【0025】
リスクの母平均mは、対象の疾患の有病率や罹患率などから推定する。このリスクの母平均mを一意に特定することは困難なことも多いが、疫学調査やメタ解析により、例えば95%信頼区間など、区間推定値として得ることは比較的容易である。そこで、表現型推定システムは、区間として推定されたリスクの母平均mを用いる。
【0026】
表現型推定システムは、r
1、r
2、p、mを用い、各遺伝型のリスクを求める。遺伝型リスクd
1は、遺伝型AAである場合のリスク、すなわち発症確率である。同様に、遺伝型リスクd
2は、遺伝型Aaである場合の発症確率であり、遺伝型リスクd
3は、遺伝型aaである場合の発症確率である。なお、d
1〜d
3の算定処理については追って詳述する。
【0027】
さらに、表現型推定システムは、推定の対象とする個人の遺伝型について入力を受け付ける。そして、個人の遺伝型に対応する遺伝型リスクの母平均mに対する比率を相対リスク(疾患発症という表現型の発現率)として算定する。
【0028】
表現型推定システムは、相対リスクを母平均mの区間の範囲内においてそれぞれ算定し、相対リスクの母平均mに対する分布を示すグラフを生成する。
図1に示したグラフは、横軸が母平均mの区間であり、縦軸が相対リスクである。
【0029】
表現型推定システムは、母平均mの区間内において、常に相対リスクが1以下であれば、個人のリスクは平均よりも低いとの推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、個人のリスクは平均よりも高いとの推定結果を出力する。
【0030】
しかしながら、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、表現型推定システムは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。
このように相対リスクが1をまたぐことがあることは知られていなかった。しかし、発明者は、プログラムを作成し、シミュレーションを繰り返すことにより相対リスクを計算するという実験を鋭意重ねた結果、複数座位の場合、相対リスクが1をまたぐことが稀に有ることを発見した。
【0031】
母平均mの区間は、その範囲内に母平均mの実際の値が含まれる可能性が高いことを示すものであり、換言するならば、母平均mの実際の値は区間内のどこに位置するかを特定できない。従って、区間内において相対リスクが1をまたぐ場合には、母平均mの実際の値によって相対リスクが高いか低いか定まり、いずれであるかを識別できないのである。
【0032】
なお、相対リスクが1となる母平均mの値は特定可能であるので、「母平均mの実際の値がこの範囲であれば個人のリスクは平均よりも低く、この範囲であれば個人のリスクは平均よりも高い」との推定結果を出力することは可能である。
【0033】
このように、本実施例に係る表現型推定システムは、リスクの母平均mの区間推定値を用い、区間内における個人の相対リスクの分布を評価し、その結果に応じて確実に相対リスクの高低が判別できることを条件に相対リスクの高低を推定結果として出力する。そして、相対リスクの高低が不正確となる場合には、その旨を推定結果として出力するので、個人の相対リスクを精度よく推定し、信頼性を向上することができる。
【0034】
次に、表現型推定システムのシステム構成について説明する。
図2は、表現型推定システムのシステム構成を示す図である。
図2に示すように、表現型推定システムは、表現型推定装置20にデータベース10(記憶手段)及び遺伝型分析装置30を接続した構成を有する。表現型推定装置20とデータベース10との間や、表現型推定装置20と遺伝型分析装置30との間には、所定のネットワークを介してもよい。
【0035】
データベース10は、表現型基礎データ11及び遺伝型データ12を蓄積している。表現型基礎データ11は、各種表現型について、表現型の種別、母比率や母平均、関連座位などを示すデータである。表現型の種別とは、例えば、疾患の名称などであり、表現型を特定するとともに、質的表現型であるか量的表現型であるか、アレルの効果に相加性があるか否かを示す。質的表現型の母比率については区間推定値、量的表現型の母平均については母集団における期待値を用いる。なお、質的表現型の確率、例えば疾患の発症のリスクについては母平均を用いる。この場合の母平均は、発症している状態を「1」、発症していない状態を「0」とした母比率に一致する。関連座位は、表現型に影響を与える座位である。関連座位は、表現型によって単独である場合と複数である場合がある。
【0036】
遺伝型データ12は、複数の表現型基礎データ11のうち、少なくともいずれか1つで関連座位として示された座位の遺伝型についてのデータである。遺伝型データ12は、座位を特定するデータに加え、注目アレルとその頻度、影響を与える表現型についてのオッズ比など表現型の推定に用いる各種データを含む。なお、複数の質的表現型に影響を与える場合には、それぞれの質的表現型についてのオッズ比を遺伝型データ12に含めておく。
【0037】
遺伝型分析装置30は、被験者となる個人から提出されたサンプルを用い、被験者の遺伝型を分析する装置である。分析の対象となるのは、表現型の推定に使用する1又は複数の座位である。遺伝型分析装置30は、分析により得られた遺伝型を表現型推定装置20に送信する。複数の座位について分析を行った場合には、複数の遺伝型の組合せが表現型推定装置20に送信されることになる。また、遺伝型分析装置30は、表現型推定装置20から表現型の推定結果を受信し、被験者に対して出力する。遺伝型分析装置30は必ずしも本システムに含まれている必要はなく、外部の信頼できる遺伝型分析装置により得られた遺伝型を入力、あるいは送信する場合もある。
【0038】
表現型推定装置20は、遺伝型から表現型を推定する装置であり、質的表現型推定部21及び量的表現型推定部22を有する。質的表現型推定部21は、質的表現型の推定を行う処理部であり、遺伝型リスク算定部21a、相対リスク算定部21b及びリスク評価部21cを有する。
【0039】
遺伝型リスク算定部21aは、対象となる質的表現型に影響を与える座位について、r
1、r
2、p、mを用い、各遺伝型の遺伝型リスクd
1〜d
3を算定する処理を行う。r
1、r
2、p、mは、データベース10から取得する。
【0040】
相対リスク算定部21bは、遺伝型分析装置30から受信した遺伝型と、遺伝型リスク算定部21aが算定した遺伝型リスクd
1〜d
3とを用い、個人の遺伝型によって定まるリスクの母平均mに対する比率を相対リスクとして算定する。
【0041】
リスク評価部21cは、相対リスクの母平均mに対する分布を評価し、質的表現型の発現傾向を推定する処理部である。具体的には、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であれば、「個人のリスクは平均よりも低い」との推定結果を出力する。また、母平均mの区間内において、常に相対リスクが1以上であれば、「個人のリスクは平均よりも高い」との推定結果を出力する。低い、高いだけではなく平均に比較した相対的なリスクを出力してもよい。そして、母平均mの区間内において、相対リスクが1をまたぐ、すなわち、母平均mの区間内で相対リスクと母平均との大小関係が反転するならば、リスク評価部21cは、「個人のリスクの判別が適切に行えない」との推定結果を出力する。あるいは相対リスクが1をまたぐ母平均mの値を出力してもよい。リスク評価部21cは、推定結果を遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。
【0042】
量的表現型推定部22は、量的表現型の推定を行う処理部であり、量的表現型分類部22a、相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dを有する。
【0043】
量的表現型分類部22aは、対象となる量的表現型を関連座位の数とアレルの効果の相加性の有無とに基づいて分類する処理部である。具体的には、量的表現型分類部22aは、「関連座位が単独で相加性がある」、「関連座位が複数で相加性がある」、「相加性がない」のいずれかに量的表現型を分類する。
【0044】
量的表現型の分類結果が「関連座位が単独で相加性がある」であるならば、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定する。量的表現型の分類結果が「関連座位が複数で相加性がある」であるならば、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定する。そして、量的表現型の分類結果が「相加性がない」であるならば、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定する。
【0045】
相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、演算の手法はそれぞれ個別であるが、遺伝型分析装置30から受信した遺伝型を含む場合の量的表現型の推定値の分布の標準偏差を計算し、表現型の母平均からの偏位を求め、個人の表現型の推定値と母平均とを比較して大小傾向を判定する。
【0046】
相加性単独座位パターン変量評価部22b、相加性複数座位パターン変量評価部22c及び非相加性パターン変量評価部22dは、判定した大小傾向を推定結果として遺伝型分析装置30に送信し、遺伝型分析装置30から被験者に出力させる。
【0047】
次に、質的表現型推定部21の処理手順について説明する。
図3は、質的表現型推定部21の処理手順を示すフローチャートである。
【0048】
まず、遺伝型リスク算定部21aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。遺伝型リスク算定部21aは、読み出した表現型基礎データ11の関連座位の数をnとし、母平均mの区間を100の部分区間に分割する。部分区間は区間番号j(1≦j≦100)により識別する。また、n個の関連座位については、座位番号i(1≦i≦n)により識別する。
【0049】
遺伝型リスク算定部21aは、母平均の区間番号jを「1」に初期化し(ステップS101)、関連座位の座位番号iを「1」に初期化する(ステップS102)。その後、遺伝型リスク算定部21aは、座位番号iの遺伝型について遺伝型データ12をデータベース10から読み出し、注目アレルの頻度pと遺伝型のオッズ比r
1,r
2を特定する。そして、遺伝型リスク算定部21aは、r
1、r
2、p、mから、区間番号jにおける座位番号iの遺伝型リスクd
1,d
2,d
3を算定する(ステップS103)。なお、ここで使用するmは、母平均の区間推定値のうち、区間番号jの部分区間に対応する値である。例えば、区間番号jの部分区間における最大の値を用いればよい。
【0050】
ステップS103の後、遺伝型リスク算定部21aは、座位番号i=nであるか否かを判定する(ステップS104)。座位番号iがn未満であるならば(ステップS104;No)、遺伝型リスク算定部21aは、座位番号iをインクリメントし(ステップS105)、ステップS103に移行する。
【0051】
座位番号i=nであるならば(ステップS104;Yes)、相対リスク算定部21bは、区間番号jにおける座位番号1〜nの遺伝型リスクを用い、区間番号jにおける相対リスクを算定し(ステップS106)、算定した相対リスクを記憶する(ステップS107)。
【0052】
ステップS107の後、相対リスク算定部21bは、区間番号j=100であるか否かを判定する(ステップS108)。区間番号jが100未満であるならば(ステップS108;No)、相対リスク算定部21bは、区間番号jをインクリメントし(ステップS109)、ステップS102に移行する。
【0053】
区間番号j=100であるならば(ステップS108;Yes)、リスク評価部21cは、区間番号1〜100の相対リスクをプロットし、グラフを生成する(ステップS110)。そして、リスク評価部21cは、母平均mの区間推定値に対する相対リスクの分布を評価し、質的表現型の発現傾向を推定するリスク評価処理を行い(ステップS111)、処理を終了する。
【0054】
次に、
図3のステップS103に示した遺伝型リスクの算定について詳細に説明する。遺伝型AA,Aa,aaに対応した遺伝型リスクをd
1,d
2,d
3とすれば、オッズ比r
1,r
2は次のような関係にある。
【数1】
【数2】
また、Hardy-Weinberg平衡を満たすとすれば、次の関係が成立する。
【数3】
【0055】
これらの関係から、d
1,d
3を消去してまとめると、d
2についての3次式になり、カルダノ法を用いてd
2を求めることができる。
【0056】
具体的には、遺伝型リスク算定部21aは、あらかじめ次の値を計算する。
【数4】
【数5】
【数6】
【数7】
【0057】
2つのオッズ比 r
1 、r
2 がともに1であるときは、遺伝型リスク算定部21aは、
【数8】
の値を結果とする。
【0058】
r
1=1かつr
2≠1であれば、遺伝型リスク算定部21aは、
【数9】
を計算し、遺伝型リスク(d
1,d
2,d
3)を次の値とする。
【数10】
【0059】
r
1≠1かつr
2=1であれば、遺伝型リスク算定部21aは、
【数11】
を計算し、遺伝型リスク(d
1,d
2,d
3)を次の値とする。
【数12】
【0060】
残るr
1≠1かつr
2≠1の場合には、遺伝型リスク算定部21aは、まずd
2に関する3次方程式の係数C
2、C
3、C
4を使い、3次方程式
【数13】
の根を、カルダノ法を用いて計算する。3次方程式を解いた場合、3重根の場合を除いて、解は次の3つのケースが考えられる。
(1)2つの実数根でそのうち1つは重根
(2)1つの実数根と2つの複素数根
(3)3つの異なる実数根
【0061】
しかし、上述したオッズ比r
1,r
2の関係と、Hardy-Weinberg平衡に基づく関係とを用いてd
2に関する3次方程式を求め、係数C
2、C
3、C
4を定めると、 (1)(2)(3)のどのケースでも少なくとも1つ開区間(0,1)内の根が存在する。その値をd
2とする。
【0062】
カルダノ法で計算された開区間(0,1)の値d
2を用い、
【数14】
【数15】
から遺伝型リスク(d
1,d
2,d
3)が得られる。
【0063】
次に、
図3のステップS106に示した相対リスクの算定について詳細に説明する。相対リスク算定部21bは、ステップS106において、区間番号jにおける相対リスクP
s/mを算定する。ここで、P
sは個人のリスクであり、関連座位が複数あるならば、各関連座位の遺伝型リスクを統合したリスクとなる。
【0064】
相対リスク算定部21bは、座位番号iの遺伝型リスク(d
1,d
2,d
3)の値を用い、個人のリスクをP
i=d
kとする。d
kは、個人の遺伝型(AA,Aa,aa)に応じて遺伝型リスク(d
1,d
2,d
3)から定まる値である。
【0065】
座位番号i=1,2,…,nを統合した個人リスクP
sについては、次のような関係式が得られる。
【数16】
この式から、個人リスクのオッズ値は
【数17】
の関係が成り立ち、個人リスクP
sは、
【数18】
により得られる。相対リスク算定部21bは、このP
sを区間番号jにおける母平均mの値で除算し、相対リスクとして出力する。
【0066】
次に、
図3のステップS111に示したリスク評価処理について詳細に説明する。
図4は、
図3に示したリスク評価処理の処理手順を示すフローチャートである。リスク評価部21cは、まず、母平均mの区間内(1≦j≦100)において、相対リスクが1をまたぐ部分があるか否かを判定する(ステップS201)。
【0067】
母平均mの区間内で、相対リスクが1をまたぐ部分があるならば(ステップS201;Yes)、リスク評価部21cは、相対リスクが1をまたぐときの母平均mの値を二分法で計算して示すが、リスク判別不適と判定し、「個人のリスクの判別が適切に行えない」との推定結果を出力して(ステップS205)、リスク評価処理を終了する。
【0068】
母平均mの区間内で、相対リスクが1をまたぐ部分がなければ(ステップS201;No)、リスク評価部21cは、母平均mの区間内において、常に相対リスクが1以下であるか否かを判定する(ステップS202)。
【0069】
母平均mの区間内において、常に相対リスクが1以下であるならば(ステップS202;Yes)、リスク評価部21cはリスク低と判定し、「被験者の個人のリスクは平均よりも低い」との推定結果を出力して(ステップS204)、リスク評価処理を終了する。
【0070】
母平均mの区間内において、常に相対リスクが1以上であるならば(ステップS202;No)、リスク評価部21cはリスク高と判定し、「被験者の個人のリスクは平均よりも高い」との推定結果を出力して(ステップS203)、リスク評価処理を終了する。
【0071】
次に、量的表現型推定部22の処理手順について説明する。
図5は、量的表現型推定部22の処理手順を示すフローチャートである。まず、量的表現型分類部22aは、対象となる表現型について表現型基礎データ11をデータベース10から読み出す。
【0072】
量的表現型分類部22aは、対象となる表現型の種別を特定し(ステップS301)、アレルの効果に相加性があるか否かを判定する(ステップS302)。アレルの効果に相加性がなければ(ステップS302;No)、量的表現型分類部22aは、対象の表現型を「相加性がない」に分類し、ステップS306に移行する。
【0073】
ステップS306では、非相加性パターン変量評価部22dが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。
【0074】
アレルの効果に相加性があるならば(ステップS302;Yes)、量的表現型分類部22aは、対象の表現型の関連座位が単独であるか否かを判定する(ステップS303)。関連座位の数が単独であるならば(ステップS303;Yes)、量的表現型分類部22aは、対象の表現型を「関連座位が単独で相加性がある」に分類し、ステップS304に移行する。一方、関連座位の数が複数であるならば(ステップS303;No)、量的表現型分類部22aは、対象の表現型を「関連座位が複数でアレルに相加性がある」に分類し、ステップS305に移行する。
【0075】
ステップS304では、相加性単独座位パターン変量評価部22bが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。そして、ステップS305では、相加性複数座位パターン変量評価部22cが量的表現型の発現傾向を推定し、推定結果を出力して処理を終了する。
【0076】
次に、量的表現型の発現傾向の推定について、詳細に説明する。まず、相加性単独座位パターン変量評価部22bによる推定について説明する。相加性単独座位パターン変量評価部22bは、線形モデルの一つの係数β
1、aアレル頻度p、単独座位の遺伝型により変化する値Xを用いる。Xは、相加性がある場合には遺伝型(AA,Aa,aa)におけるアレルaの数となり、0,1,2のいずれかをとる。この単独座位によるQへの効果β
1Xを座位の効果と呼ぶ。
【0077】
Xが観察された時のQを変数Q
1とする。
【0078】
Q
1の期待値をE(Q
1)とする。相加性単独座位パターン変量評価部22bは、E(Q
1)と母集団の平均値(母平均)E(Q)との差E(Q
1)−E(Q)を計算する。これは観察された座位の効果の平均からの偏位を表す変数である。
【0079】
この差(偏位)E(Q
1)−E(Q)はこの座位の遺伝型によって異なる。
x=0であれば、
E(Q
1)−E(Q)=−2pβ
1
x=1であれば、
E(Q
1)−E(Q)=β
1(1−2p)
x=2であれば、
E(Q
1)−E(Q)=2β
1(1−p)
で偏位が計算される。
【0080】
この偏位をE(Q
1)−E(Q)の分散2β
12p(1-p)の平方根(即ち標準偏差)で割った値を、標準化された偏位という。
【数19】
この値によって、個人の遺伝型から推定された個人の表現型が母平均より大きいか小さいか、およびその程度はどのくらいかを評価することができる。相加性単独座位パターン変量評価部22bは、この評価の結果を推定結果として出力する。
【0081】
次に、相加性複数座位パターン変量評価部22cによる推定について説明する。複数座位の遺伝型による効果が相加的に量的表現型Qに影響すると仮定し、多変量線形モデル
Q=β
0+β
1X
1+β
2X
2+・・・+β
nX
n+ε
を仮定する。εの平均は0とする。そして、その期待値は
【数20】
で、これを母平均とする。また、座位番号iのX
iが観察値x
iの時の表現型をQ
iとし、
【数21】
がQ
iの期待値になる。なお、x
iは座位番号iのX
iの観察値である。
【0082】
座位番号iでのQ
iの期待値の母平均からの偏位は、次のような式で計算できる。ここで、p
iは座位番号iのaアレル頻度である。
E(Q
i)−E(Q)=β
i(x
i−2p
i)
【0083】
全ての座位についてこの偏位を合計した値が、全座位の効果の和の期待値E(Q
s)の母平均からの偏位である。すなわち、
【数22】
となる。
【0084】
全座位の効果の和に定数項β
0を加えた変数Q
eの分散V(Q
e)(全座位の効果の分散に等しい)は
【数23】
となる。そこで、標準化された、個人の量的表現型推定値と母平均との偏位は次のように計算できる。
【数24】
相加性複数座位パターン変量評価部22cは、この値を評価に用い、母平均より大きいか小さいか、またはそれに加え、その程度はどのくらいかを推定結果として出力する。
【0085】
次に、アレルの効果についての非相加性パターン変量評価部22dによる推定について説明する。非相加性パターン変量評価部22dは、量的表現型Qの多変量線形モデル
Q=β
0+β
1X
1+β
2X
2+・・・+β
nX
n+ε
を用いる。相加性複数座位パターンの場合と同様にi座位の遺伝型を観察した上での量的表現型を変数Q
iとし、推定値E(Q
i)を、座位番号iの遺伝型(AA,Aa,aa)毎に次の記号で表すこととする。
E(Q
i|AA)=μ
AA
E(Q
i|Aa)=μ
Aa
E(Q
i|aa)=μ
aa
ただし、μ
AA, μ
Aa, μ
aaは座位により異なるが、ここでは座位を示すiは省略した。相加性がない場合、遺伝型AAの場合、X
iは、相加性がある場合と同様に0とする。また、相加性がない場合、遺伝型aaのX
iは、相加性がある場合と同様に2とする。しかし、相加性がない場合、遺伝型Aaの遺伝型値X
iは、
【数25】
の値をとる。ここで座位を示すiは省略してある。
【0086】
非相加性パターン変量評価部22d、まず、各座位(座位番号i)の遺伝型を観察した場合の表現型Q
iの期待値の母集団の平均からの偏位
E(Q
i)−E(Q)
を計算するが、座位番号iの遺伝型によって、計算法が異なる。
【0087】
遺伝型AAであれば、
E(Q
i)−E(Q)=−2D
1p
i−(D
1+D
2−2D
1)p
i2
遺伝型Aaであれば、
E(Q
i)−E(Q)=D
1−2D
1p
i−(D
1+D
2−2D
1)p
i2
遺伝型aaであれば、
E(Q
i)−E(Q)=D
1+D
2−2D
1p
i−(D
1+D
2−2D
1)p
i2
となる。この時のp
iはi座位におけるaアレル頻度、D
1,D
2は次の値である。
D
1=μ
Aa−μ
AA
D
2=μ
aa−μ
Aa
ただし、μ
AA, μ
Aa, μ
aaは座位により異なるが、ここでは座位を示すiは省略した。即ち、E(Q
i)はi座位の遺伝型によって変化するが、その期待値は
N
i=2 p
i (1-p
i) D
1+p
i2 D
2である。
【0088】
この偏位をすべての座位iについて合計すると次のように、すべての座位の遺伝型を観察した場合の表現型の推定値の母平均からの偏位E(Q
s)−E(Q)が求まる。
【数26】
【0089】
E(Q
i)は元々変数ではなく値である。しかし、i座位の観察された遺伝型によって決まるx
iが変化することにより異なった値を取る。従って、E(Q
i)をX
iの変数として見ることが可能である。このようにE(Q
i)をX
iの変数として見た場の分散は偏位E(Q
i)−E(Q)の分散と同じなので、全座位についてこの分散を加えると、
【数27】
となる。ここでD1
i、D2
iはi座位におけるD
1, D
2である。そして、
【数28】
が標準化された個人の量的表現型推定値と母平均の偏位として得られる。非相加性パターン変量評価部22dは、この偏位を評価に用い、母平均より大きいか小さいか、およびその程度はどのくらいかを推定結果として出力する。
【0090】
次に、「関連座位が単独で相加性がある」場合を例に、アレル頻度pと座位による効果の母平均からの偏位の関係を説明する。
図6は、アレル頻度pと座位による効果の母平均からの偏位の関係についての説明図である。
【0091】
図6の横軸はアレルaの頻度pである。図のQ
iは、ここでは単独座位の場合を考えるのでi=1とする。座位による効果の、母平均からの偏位E(Q
1)−E(Q)は3つの遺伝型について、次の式で与えられる。
【数29】
Xへの係数β
1=1とすると、遺伝型AA,Aa,aaの場合、それぞれ−2p,1−2p,2(1−p)である。座位の効果の和に定数項β
0を加えた変数Q
eの分散はV(Q
e)=2β
12p(1−p)の式より2p(1−p)が得られる。縦軸の0,1,2より傾き−2で右に伸びた3つの直線は、β
1=1のときそれぞれ遺伝型AA,Aa,aaの場合の偏位E(Q
1)−E(Q)を示す。内側の楕円は1SD(推定量の標準偏差の1倍)を、外側の楕円は2SD(標準偏差の2倍)を示している。この図から、特定のpの時の各遺伝型の場合の偏位と標準偏差との関連が変化することがわかる。例えば、p=0.3の時を図に示すが、AA,Aaの遺伝型値の母平均からの偏位は −1SD,+1SDの間に収まり、 aaでは+2SDを超える。
以上の分析により単一座位であっても量的表現型の母平均からの偏位を考えることは有意義であることが示された。
【0092】
これまでの説明では、表現型推定システムを例示して説明を行ったが、本発明は表現型推定プログラムとして実施することも可能である。
図7は、表現型推定プログラムの実施例である。
図7に示したコンピュータ40は、CPU41、メモリ42、HDD(Hard Disk Drive)43、インタフェースボード44を有する。
【0093】
HDD43は、磁気ディスクに質的表現型推定プログラム、量的表現型推定プログラム、表現型基礎データ及び遺伝型データを保持する。コンピュータ40が質的表現型推定プログラムや量的表現型推定プログラムをメモリ42に展開して実行すると、質的表現型推定プロセス42aや量的表現型推定プロセス42bが実行されることとなる。質的表現型推定プロセス42a及び量的表現型推定プロセス42bは、
図2に示した質的表現型推定部21及び量的表現型推定部22にそれぞれ対応する処理を行なう。
【0094】
このように、コンピュータ40は、質的表現型推定プログラムや量的表現型推定プログラムを読み出して実行することで、表現型推定装置として動作することができる。なお、各プロセスが使用するデータはインタフェースボード44を介して外部から取得することができ、また、各プロセスが出力するデータはインタフェースボード44を介して外部に出力することができる。インタフェースボード44には、ディスプレイ、キーボード、カメラなどの各種インタフェースデバイスが接続される。なお、
図7ではHDDにプログラムを格納する場合を例に説明したが、CD(Compact Disc)など任意の記録媒体をプログラムの格納先として用いることができる。
【0095】
上述してきたように、本実施例に係る表現型推定システムは、所定の質的表現型に影響を与える座位における各アレルまたは各遺伝型の比率と、質的表現型の母比率の区間推定値とを用い、遺伝型の各々について質的表現型の発現率を算定し、対象となる遺伝型について母比率の区間における質的表現型の発現率の分布を評価することで質的表現型の発現傾向を推定し、推定結果を出力する。このため、遺伝型に基づいて質的表現型を精度よく推定することができる。
【0096】
また、本実施例に係る表現型推定システムは、量的表現型に影響を与える座位の数とアレルの効果の相加性の有無とに基づいて量的表現型を分類し、分類結果を用いて対象となる遺伝型を含む場合の量的表現型の推定値の分布を評価し、該推定値の分布を母平均と比較して量的表現型の発現傾向を推定し、推定結果を出力するする。このため、遺伝型に基づいて量的表現型を精度よく推定することができる。
【0097】
なお、本実施例は発明を限定するものではなく、適宜変形して実施することができる。例えば、データベース10、表現型推定装置20及び遺伝型分析装置30の機能を備えた単一の装置として実施してもよい。
【0098】
また、疾患のリスクに限らず、各種形質の発現について本発明を適用することができる。さらに、人の遺伝型に限らず、動植物など任意の生体の遺伝型から表現型を推定することができる。