特許7141039 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社ＮＴＴドコモの特許一覧 ▶ 国立大学法人東北大学の特許一覧

特許7141039ＤＮＡ変異絞込装置、ＤＮＡ変異絞込システム、ＤＮＡ変異絞込方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-09-13

(45)【発行日】2022-09-22

(54)【発明の名称】ＤＮＡ変異絞込装置、ＤＮＡ変異絞込システム、ＤＮＡ変異絞込方法、及びプログラム

(51)【国際特許分類】

G16B 20/00 20190101AFI20220914BHJP

【ＦＩ】

G16B20/00

【請求項の数】 10

(21)【出願番号】P 2018164050

(22)【出願日】2018-08-31

(65)【公開番号】P2020038413

(43)【公開日】2020-03-12

【審査請求日】2021-02-08

(73)【特許権者】

【識別番号】392026693

【氏名又は名称】株式会社ＮＴＴドコモ

(73)【特許権者】

【識別番号】504157024

【氏名又は名称】国立大学法人東北大学

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100124844

【弁理士】

【氏名又は名称】石原隆治

(72)【発明者】

【氏名】恒元淑希

(72)【発明者】

【氏名】山内隆史

(72)【発明者】

【氏名】越智大介

(72)【発明者】

【氏名】檜山聡

(72)【発明者】

【氏名】長▲崎▼ 正朗

(72)【発明者】

【氏名】菅原準一

(72)【発明者】

【氏名】峯岸直子

【審査官】岡北有平

(56)【参考文献】

【文献】特開２００８－１９１７１６（ＪＰ，Ａ）

【文献】特開２０１６－０５９７５９（ＪＰ，Ａ）

【文献】Paula J. Williams, et al.，The genetics of pre-eclampsia and other hypertensive disorders of pregnancy，Best Practice & Research Clinical Obstetrics and Gynaecology [online]，2011年08月25日，Volume 25, Issue 4，Pages 405-417，[検索日：2022年7月19日], <URL:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3145161/>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１６Ｂ５／００－９９／００

(57)【特許請求の範囲】

【請求項1】

所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出部と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する取得部と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出部と、
を有し、
前記解析部は、前記特徴量を目的変数、前記ＤＮＡ変異を説明変数として関連解析を行い、前記特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
ＤＮＡ変異絞込装置。

【請求項2】

所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出部と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する取得部と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出部と、
を有し、
前記解析部は、
前記特徴量抽出部が抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、
前記取得部が取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
ＤＮＡ変異絞込装置。

【請求項3】

前記ＤＮＡ変異は、一塩基多型を含み、
前記統計的指標は、有意確率を表すｐ値を含み、
前記ＤＮＡ変異抽出部は、前記ｐ値が、予め定められた有意水準より小さい前記一塩基多型を抽出する、請求項１又は２に記載のＤＮＡ変異絞込装置。

【請求項4】

前記所定の疾患は、妊娠高血圧症候群を含み、
前記所定の疾患に関連する量的形質の連続的な計測値は、所定の時間間隔で計測した血圧の計測値を含む、請求項１乃至３のいずれか一項に記載のＤＮＡ変異絞込装置。

【請求項5】

【請求項6】

所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出部と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する取得部と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析部と、
前記解析部の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出部と、
を有し、
前記解析部は、
前記特徴量抽出部が抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、
前記取得部が取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
ＤＮＡ変異絞込システム。

【請求項7】

コンピュータが、
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する処理と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する処理と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析処理と、
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出処理と、
を実行し、
前記解析処理は、前記特徴量を目的変数、前記ＤＮＡ変異を説明変数として関連解析を行い、前記特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
ＤＮＡ変異絞込方法。

【請求項8】

コンピュータが、
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出処理と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する取得処理と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析処理と、
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出処理と、
を実行し、
前記解析処理は、
前記特徴量抽出処理で抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、
前記取得処理で取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
ＤＮＡ変異絞込方法。

【請求項9】

コンピュータに、
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する処理と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する処理と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析処理と、
前記解析する処理の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出処理と、
を実行させ、
前記解析処理は、前記特徴量を目的変数、前記ＤＮＡ変異を説明変数として関連解析を行い、前記特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
プログラム。

【請求項10】

コンピュータに、
所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとに特徴量を抽出する特徴量抽出処理と、
前記複数の被験者におけるＤＮＡ変異の情報を取得する取得処理と、
前記特徴量と前記ＤＮＡ変異との関連を解析する解析処理と、
前記解析処理の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出処理と、
を実行させ、
前記解析処理は、
前記特徴量抽出処理で抽出した特徴量を、予め定めた基準値を用いて前記所定の疾患の罹患群と非罹患群とにラベル付けし、
前記取得処理で取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異に対して、前記罹患群、及び前記非罹患群における保有数に差があるかを示す統計的指標の値を算出し、
前記ＤＮＡ変異抽出処理は、前記解析処理で算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する、
プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ＤＮＡ変異絞込装置、ＤＮＡ変異絞込システム、ＤＮＡ変異絞込方法、及びプログラムに関する。

【背景技術】

【0002】

複数の被験者のＤＮＡ（DeoxyriboNucleic Acid）変異データを用いて、ＤＮＡ変異と特定の病気や量的形質との関連を調べる技術が知られている（例えば、特許文献１参照）。

【0003】

また、具体的な研究の例として、日本人約１６万人のＤＮＡ情報を用いて全ゲノム関連解析を実施し、さらに欧米人３２万人で行われたメタ解析を行うことにより、体重に影響すると考えられる１９３のゲノム領域を同定した例がある（例えば、非特許文献１参照）。

【0004】

さらに、妊娠高血圧症候群（以下HDP: Hypertensive Disorders of Pregnancy）に罹患した５０名の遺伝子情報と、罹患していない５０名の遺伝子情報とを用いてエキソーム解析を行ったところ、両群の遺伝子の発現量に差は見られたものの、有意差がでなかった例がある（例えば、非特許文献２参照）。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２０１８－４９４７２号公報

【非特許文献】

【0006】

【文献】Akiyama M, et.al, "Genome-wide association study identifies 112 loci for body mass index in the Japanese population.", Nature genetics, doi: 10.1038/ng.3951

【文献】Hansen, Anette Tarp, et al. "The Genetic Component of Preeclampsia: A Whole-Exome Sequencing Study.", Plos One, vol. 13, no. 5, 2018, doi:10.1371

【発明の概要】

【発明が解決しようとする課題】

【0007】

例えば、非特許文献１のように、全ゲノム関連解析を行う際には、約３０億の塩基対の中から、所定の疾患に関連するＤＮＡ変異を特定するため、膨大な数（例えば、数千～数十万単位）のＤＮＡサンプルが必要となる。

【0008】

しかし、研究機関の資金不足や、所定の疾患の罹患率が低い等の理由により、十分な数のサンプルが得られないことも多く、このような場合には、例えば、非特許文献２に示すように、所定の疾患に関連するバイオマーカーを十分に絞り込めない場合がある。

【0009】

また、疾患によっては、罹患群と非罹患群の定義が曖昧な場合がある。例えば、ＨＤＰには診断のガイドラインが設定されているが、実際には、ＨＤＰに分類されていなくてもＨＤＰのような血圧値が現れる場合がある。このような場合には罹患群、非罹患群の遺伝的背景に十分な差がない可能性があり、所定の疾患に関連するＤＮＡ変異を十分に絞り込めない場合がある。

【0010】

こういった課題を解決する方法として、罹患群と非罹患群のＤＮＡ配列の違いに関し関連解析を行う方法に加え、体重、ＢＭＩ、血圧、体温などの所定の疾患に関わる量的形質を用いて、量的形質の大小にＤＮＡ配列が及ぼす影響を評価する量的形質を用いた関連解析が考えられる。しかし、例えば来院時に測定した量的形質を用いて関連解析を行う場合、患者によって来院時期が異なっている等の理由から、罹患群、非罹患群で量的形質の比較を行う際、量的形質に及ぼす来院時期の影響を取り除くことができず、所定の疾患に関連するＤＮＡ変異を十分に絞り込めない場合が想定できる。

【0011】

このように、従来の技術では、例えば、検体のＤＮＡサンプルが少ない場合や、疾患の定義が曖昧である場合には、所定の疾患に関連するＤＮＡ変異を絞り込むことには困難を伴っていた。さらに量的形質を用いて関連解析を行う場合でも所定の疾患に関連するＤＮＡ変異を絞り込むことが困難であることが想定できる。

【0012】

本発明の実施形態は、上記の問題点に鑑みてなされたものであって、所定の疾患に関わる量的形質を用いて関連解析を行う場合に、所定の疾患に関連するＤＮＡ変異を容易に絞り込むことができるＤＮＡ変異絞込装置を提供する。

【課題を解決するための手段】

【0013】

上記の課題を解決するため、本発明の一実施形態に係るＤＮＡ変異絞込装置は、所定の疾患に罹患している被験者を含む複数の被験者から収集した、前記所定の疾患に関連する量的形質の連続的な計測値に対して所定の多項式にフィッティングを行い、前記多項式の係数、前記多項式の切片、又は前記多項式の係数と切片を用いて、前記被験者ごとにから特徴量を抽出する特徴量抽出部と、前記複数の被験者におけるＤＮＡ変異の情報を取得する取得部と、前記特徴量と前記ＤＮＡ変異との関連を解析する解析部と、前記解析部の解析結果に基づいて、前記所定の疾患に関連するＤＮＡ変異を抽出するＤＮＡ変異抽出部と、を有し、前記解析部は、前記特徴量を目的変数、前記ＤＮＡ変異を説明変数として関連解析を行い、前記特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出し、前記ＤＮＡ変異抽出部は、前記解析部が算出した前記統計的指標の値が、予め定められた基準値以上、又は基準値以下となるＤＮＡ変異を抽出する。

【0014】

ここで、所定の疾患に関連する量的形質には、例えば、被験者の血圧、体重、ＢＭＩ（Body Mass Index）、脈拍、心拍数、体脂肪率、活動量、消費カロリー、睡眠時間、体温等の連続的かつ量的に変化する形質が含まれる。量的形質の連続的な計測値は、これらの量的形質を所定の期間連続的に測定し記録した値である。

【0015】

このように、疾患に関わる連続的な量的形質を用いることで、罹患、非罹患という２値の情報を使う場合よりも当該疾患に関する情報を増やすことを可能とする。

【発明の効果】

【0016】

本発明の一実施形態によれば、所定の疾患に関わる量的形質を用いて関連解析を行う場合に、所定の疾患に関連するＤＮＡ変異を容易に絞り込むことができるＤＮＡ変異絞込装置を提供することができる。

【図面の簡単な説明】

【0017】

【図1】一実施形態に係るＤＮＡ変異絞込装置の構成例を示す図（１）である。

【図2】一実施形態に係るＤＮＡ変異絞込装置の構成例を示す図（２）である。

【図3】一実施形態に係るＤＮＡ変異絞込装置のハードウェア構成の例を示す図である。

【図4】一実施形態に係るＤＮＡ変異の絞込処理の概要を示すフローチャートである。

【図5】一実施形態に係る特徴量の抽出処理の例を示すフローチャートである。

【図6】一実施形態に係る特徴量の一例について説明するための図である。

【図7】一実施形態に係る第１の具体例のＤＮＡ変異の絞込処理の例を示すフローチャートである。

【図8】一実施形態に係る第１の具体例のＤＮＡ変異の絞込処理の応用例を示すフローチャートである。

【図9】一実施形態に係る第２の具体例のＤＮＡ変異の絞込処理の例を示すフローチャートである。

【図10】一実施形態に係る第２の具体例の罹患群、非罹患群のラベル付け処理の例を示すフローチャートである。

【発明を実施するための形態】

【0018】

以下、図面を参照して本発明の実施の形態を説明する。なお、以下で説明する実施の形態は一例であり、本発明が適用される実施の形態は、以下の実施の形態に限られない。

【0019】

＜ＤＮＡ変異絞込装置の構成＞
図１～３を用いて、一実施形態に係るＤＮＡ（DeoxyriboNucleic Acid）変異絞込装置の構成について説明する。ＤＮＡ変異絞込装置１１０は、コンピュータの構成を有する情報処理装置、又は複数の情報処理装置を含むシステム（ＤＮＡ変異絞込システム１００）である。ＤＮＡ変異絞込装置１１０は、例えば、図３に示すようなハードウェア構成を備えている。

【0020】

ＤＮＡ変異絞込装置１１０は、例えば、入力された複数の被験者のＤＮＡ変異データと、連続した量的形質のデータとに基づいて関連解析（検定）を行いＤＮＡ変異データが連続した量的形質の変化に及ぼす影響を算出し所定の疾患に関連するＤＮＡ変異の絞込を行い、絞込結果（例えば、候補リスト等）を出力する。

【0021】

ここで、関連解析（検定）には、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、ｔ検定等を用いることができるが、これに限定されない。

【0022】

なお、ＤＮＡ変異絞込装置１１０は、例えば、所定の疾患に関連する一塩基多型等のＤＮＡ変異の候補を絞り込むものであれば良く、必ずしも、所定の疾患の罹患／非罹患や進行度等を直接示すＤＮＡ変異を特定するものでなくても良い。

【0023】

図１は、一実施形態に係るＤＮＡ変異絞込装置１１０の構成例を示す図（１）である。ＤＮＡ変異絞込装置１１０は、図３のプロセッサ３０１で所定のプログラムを実行することにより、図１に示す入力受付部１１１、特徴量抽出部１１２、ＤＮＡ変異情報取得部１１３、関連解析部１１４、ＤＮＡ変異抽出部１１５、記憶部１１６、及び結果出力部１１７等を実現している。なお、入力受付部１１１、特徴量抽出部１１２、ＤＮＡ変異情報取得部１１３、関連解析部１１４、ＤＮＡ変異抽出部１１５、記憶部１１６、及び結果出力部１１７のうち、少なくとも一部は、ハードウェアによって実現されるものであっても良い。

【0024】

入力受付部１１１は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現され、図３の入力装置３０４、通信装置３０６等から入力される入力データや入力操作等を受け付ける。例えば、入力受付部１１１は、所定の疾患に罹患している被験者を含む複数の被験者から収集した、所定の疾患に関連する量的形質の連続的な計測値の入力を受け付ける。

【0025】

また、入力受付部１１１は、所定の疾患に罹患している被験者を含む複数の被験者から収集したＤＮＡ配列情報（以下、ＤＮＡ情報と呼ぶ）や、ＤＮＡ変異の情報等の入力を受け付けることもできる。

【0026】

ＤＮＡは、遺伝情報を記録している物質（デオキシリボ核酸）であり、約３０億対の塩基から構成されている。ＤＮＡには、遺伝情報を含む特定の領域（塩基配列）である遺伝子が含まれる。本実施形態では、遺伝子以外の領域に存在するＤＮＡ変異も絞込の対象とすることができる。

【0027】

ＤＮＡ変異は、ＤＮＡにおける構造（塩基配列）の変異であり、例えば、一塩基多型（SNP: Single Nucleotide Polymorphism）、コピー数多型（CNV: Copy Number Variation）、ＤＮＡの欠失、挿入等が含まれ得る。

【0028】

特徴量抽出部１１２は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現され、入力受付部１１１が受け付けた、所定の疾患に関連する量的形質の連続的な計測値から特徴量を抽出（決定）する。

【0029】

ここで特徴量は、例えば、所定の疾患に関連する量的形質の連続的な計測値を、所定の多項式にフィッティングし得られた、多項式の係数、多項式の切片、又は多項式の係数と切片等である。なお、特徴量抽出部１１２による特徴量の抽出方法の具体的な一例については、後述する。

【0030】

ＤＮＡ変異情報取得部（取得部）１１３は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現され、所定の疾患に罹患している被験者を含む複数の被験者におけるＤＮＡ変異の情報を取得する。

【0031】

例えば、ＤＮＡ変異情報取得部１１３は、入力受付部１１１が受け付けたＤＮＡ情報を解析して、ＤＮＡ変異の情報を抽出する。

【0032】

或いは、ＤＮＡ変異情報取得部１１３は、図２に示すように、ＤＮＡ情報からＤＮＡ変異の情報を取得する外部装置であるＤＮＡ変異情報取得装置２１０から、複数の被験者におけるＤＮＡ変異の情報を取得するものであっても良い。さらに、ＤＮＡ変異情報取得部１１３は、図２に示すように、予め取得したＤＮＡ変異の情報を格納するＤＮＡ変異情報ＤＢ（Database）２２０から、複数の被験者に対応するＤＮＡ変異の情報を取得するものであっても良い。

【0033】

好ましくは、ＤＮＡ変異情報取得部１１３が取得するＤＮＡ変異の情報には、複数の被験者のＤＮＡ情報（ＤＮＡ配列情報）から抽出された、ＤＮＡ配列中の全ての一塩基多型（ＳＮＰ）の情報が含まれる。

【0034】

関連解析部（解析部）１１４は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現され、特徴量抽出部１１２が抽出した特徴量と、ＤＮＡ変異情報取得部１１３が取得したＤＮＡ変異の情報に含まれるＤＮＡ変異との関連を解析する。例えば、関連解析部１１４は、特徴量を目的変数、ＤＮＡ変異を説明変数として関連解析（検定）を行い、ＤＮＡ変異が特徴量にどの程度の影響を与えているかを表す、特徴量とＤＮＡ変異との関連度を示す統計的指標の値を算出する。

【0035】

ここで、特徴量とＤＮＡ変異との関連度を示す統計的指標の値には、特徴量抽出部１１２が抽出した特徴量と、ＤＮＡ変異情報取得部１１３が取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異との有意差を示す数値（例えば、ｐ値、ｆ値、オッズ比等）が含まれる。

【0036】

また、関連解析（検定）には、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、ｔ検定等を用いることができるが、これに限定されない。

【0037】

なお、関連解析部１１４は、特徴量抽出部１１２が抽出した特徴量を、予め定めた基準値を用いて所定の疾患の罹患群と非罹患群とにラベル付けし、各ＤＮＡ変異の有意性を示す統計的指標の値を算出するものであっても良い。

【0038】

ＤＮＡ変異抽出部１１５は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現され、関連解析部１１４の解析結果に基づいて、所定の疾患に関連するＤＮＡ変異を抽出する。例えば、ＤＮＡ変異抽出部１１５は、関連解析部１１４が算出した統計的指標の値を基準として、所定の疾患に関するＤＮＡ変異を抽出する。

【0039】

記憶部１１６は、例えば、図３のプロセッサ３０１で実行されるプログラム、及びストレージ３０３、メモリ３０２等によって実現され、入力受付部１１１が受け付けた情報や、ＤＮＡ変異情報取得部１１３が取得した情報等を記憶する。

【0040】

結果出力部１１７は、例えば、図３のプロセッサ３０１で実行されるプログラムによって実現される。結果出力部１１７は、ＤＮＡ変異抽出部１１５が抽出した、所定の疾患に関連するＤＮＡ変異の情報（例えば、ＤＮＡ変異の候補リスト等）を、本実施形態のハードウェア構成の例を示す図３の出力装置３０５等を用いて出力する。

【0041】

（具体的な構成の一例）
ＤＮＡ変異絞込装置１１０の具体的な構成の一例として、図１で示す入力受付部１１１は、所定の疾患に罹患している被験者を含む複数の被験者から、所定の時間間隔（例えば、毎日、同じ時間帯等）で測定した、連続した血圧の計測値の情報を受け付ける。

【0042】

特徴量抽出部１１２は、入力受付部１１１が受け付けた、連続した血圧の計測値を多項式（例えば、一次式）にフィッティングして、多項式の傾き、切片等を算出する。一例として、特徴量抽出部１１２は、多項式の傾きを特徴量として用いることができる。

【0043】

ＤＮＡ変異情報取得部１１３は、例えば、所定の疾患に罹患している被験者を含む複数の被験者のＤＮＡ情報から抽出した、全ての被験者の各々の一塩基多型（ＤＮＡ変異の一例）の情報を取得する。

【0044】

関連解析部１１４は、特徴量抽出部１１２が抽出した特徴量（多項式の傾き）を目的変数、ＤＮＡ変異情報取得部１１３が取得した一塩基多型の情報に含まれる全ての一塩基多型を説明変数として、関連解析（検定）を行う。例えば、関連解析部１１４は、線形回帰による検定を行い、抽出した特徴量と、一塩基多型の情報に含まれる全ての一塩基多型との有意確率を表すｐ値（統計的指標の値の一例）を算出する。

【0045】

ＤＮＡ変異抽出部１１５は、塩基多型の情報に含まれる全ての一塩基多型のうち、ｐ値が、予め定められた有意水準（例えば、５×１０^-８）以下（又は未満）となる一塩基多型を抽出する。

【0046】

ここで、有意水準は、ｐ値が統計的に有意とみなすことができる水準を示す値であり、一般的な解析では０．０５（５％）が用いられる。しかし、ゲノム解析においては数千～数万のパラメータを一度に検定するため、検定回数が増え、偶然に有意差が生じる可能性が増すため有意水準を補正するのが一般的である。補正後のｐ値の水準には５×１０^-８（０．０００００５％）が多く用いられるが、必要に応じて他の値（例えば、５×１０^-１０、５×１０^-１２等）を用いても良い。

【0047】

記憶部１１６は、所定の疾患に罹患している被験者を含む複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶する。

【0048】

結果出力部１１７は、ＤＮＡ変異抽出部１１５が抽出した一塩基多型の情報を、所定の疾患に関連する一塩基多型として、例えば、候補リスト等として出力する。

【0049】

図２は、一実施形態に係るＤＮＡ変異絞込装置の構成例を示す図（２）である。図２に示すように、ＤＮＡ変異絞込装置１１０は、ＤＮＡ変異情報取得装置２１０や、ＤＮＡ変異情報ＤＢ２２０等の外部装置と連携して、各機能を実現するものであっても良い。また、ＤＮＡ変異絞込装置１１０は、前述したように、複数の情報処理装置で構成されるＤＮＡ変異絞込システム１００であっても良い。

【0050】

（ハードウェア構成）
図３は、図１、図２に記載の一実施形態に係るＤＮＡ変異絞込装置１１０のハードウェア構成の例を示す図である。ＤＮＡ変異絞込装置１１０は、物理的には、プロセッサ３０１、メモリ３０２、ストレージ３０３、入力装置３０４、出力装置３０５、通信装置３０６、及びバス３０７等を含むコンピュータ装置として構成されても良い。なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニット等に読み替えることができる。

【0051】

プロセッサ３０１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ３０１は、周辺装置とのインタフェース、制御装置、演算装置、レジスタ等を含む中央処理装置（ＣＰＵ：Central Processing Unit）で構成されても良い。

【0052】

また、プロセッサ３０１は、プログラム（プログラムコード）、ソフトウェアモジュールやデータを、ストレージ３０３及び／又は通信装置３０６からメモリ３０２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、ＤＮＡ変異絞込装置１１０の動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。ＤＮＡ変異絞込装置１１０において実行される各種処理は、１つのプロセッサ３０１で実行されても良いし、２以上のプロセッサ３０１により同時又は逐次に実行されても良い。プロセッサ３０１は、１以上のチップで実装されても良い。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

【0053】

メモリ３０２は、コンピュータ読み取り可能な記憶媒体であり、例えば、ＲＯＭ（Read Only Memory）、ＥＰＲＯＭ（Erasable Programmable ＲＯＭ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable ＲＯＭ）、ＲＡＭ（Random Access Memory）等の少なくとも１つで構成されても良い。メモリ３０２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）等と呼ばれても良い。メモリ３０２は、本発明の一実施の形態に係るＤＮＡ変異絞込方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュール等を保存することができる。

【0054】

ストレージ３０３は、コンピュータ読み取り可能な記憶媒体であり、例えば、ＣＤ－ＲＯＭ（Compact Disc ＲＯＭ）等の光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク（例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク）、スマートカード、フラッシュメモリ（例えば、カード、スティック、キードライブ）、フロッピー（登録商標）ディスク、磁気ストリップ等の少なくとも１つで構成されても良い。ストレージ３０３は、補助記憶装置と呼ばれても良い。上述の記憶媒体は、例えば、メモリ３０２及び／又はストレージ３０３を含むデータベース、サーバその他の適切な媒体であっても良い。

【0055】

入力装置３０４は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサ等）である。出力装置３０５は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカ、ＬＥＤランプ等）である。なお、入力装置３０４及び出力装置３０５は、一体となった構成（例えば、タッチパネルディスプレイ）であっても良い。

【0056】

通信装置３０６は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等ともいう。また、通信装置３０６は、近距離無線通信により、外部装置と直接通信を行う機能を有していても良い。

【0057】

上記のプロセッサ３０１やメモリ３０２等の各装置は、情報を通信するためのバス３０７で接続される。バス３０７は、単一のバスで構成されても良いし、装置間で異なるバスで構成されても良い。

【0058】

＜処理の流れ＞
続いて、本実施形態に係るＤＮＡ変異絞込方法の処理の流れについて図４～６を用いて説明する。

【0059】

図４は、一実施形態に係るＤＮＡ変異絞込処理の概要を示すフローチャートである。ここでは、後述する第１の具体例、及び第２の具体例に共通する処理を中心に説明を行う。

【0060】

ステップＳ４０１において、ＤＮＡ変異絞込装置１１０の入力受付部１１１は、所定の疾患に罹患している被験者を含む複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部１１６等に記憶する。

【0061】

ステップＳ４０２において、ＤＮＡ変異絞込装置１１０の特徴量抽出部１１２は、記憶部１１６に記憶された、量的形質の経時的な変化から、所定の疾患に関連する特徴量を抽出する。例えば、特徴量抽出部１１２は、図５に示すような特徴量の抽出処理を実行する。

【0062】

図５は、一実施形態に係る特徴量の抽出処理の例を示すフローチャートである。この処理は、例えば、図４のステップＳ４０２で実行される特徴量の抽出処理の例を示している。

【0063】

ステップＳ５０１において、特徴量抽出部１１２は、入力受付部１１１が取得した連続的な量的形質の計測値を、例えば、図６に示すように、多項式にフィッティングする。

【0064】

図６は、一実施形態に係る特徴量の一例について説明するための図である。ここでは、具体的な一例として、連続的な量的形質が、所定の時間間隔（例えば、毎日、同じ時間帯等）に測定した妊婦（被験者の一例）の血圧の計測値であり、多項式が１次式であるものとする。

【0065】

図６において、特徴量抽出部１１２は、妊婦Ａの血圧の計測値６０１を、例えば、線形回帰により、１次式「ｙ＝ａｘ＋ｂ」にフィッティングする。なお、１次式「ｙ＝ａｘ＋ｂ」は所定の多項式の一例である。

【0066】

ステップＳ５０２において、特徴量抽出部１１２は、フィッティングした多項式の係数、及び切片を算出する。例えば、特徴量抽出部１１２は、１次式で表される直線の傾きａ１、及び切片ｂ１を算出する。

【0067】

ステップＳ５０３において、特徴量抽出部１１２は、算出した係数、切片、又は係数と切片を特徴量として抽出する。

【0068】

例えば、他の妊婦Ｂの計測値を用いて、１次式「ｙ＝ａｘ＋ｂ」にフィッティングを行い、傾きａ２、及び切片ｂ２を、さらに算出したものとする。この場合、一例として、１次式の傾きａ１、ａ２を、特徴量として利用することができる。

【0069】

例えば、図６に示すように、時間（妊娠経過）とともに血圧が増加するものとする。各妊婦が各々のタイミングで血圧を測定している場合、例えば、図６の通り、ｔ１時点での妊婦Ａの血圧の計測値６０１は存在するが、妊婦Ｂの血圧の計測値６０３は存在しない。異なる時点の血圧を妊婦ＡとＢで比較した場合、その差には、測定時点差の影響が含まれることから、妊婦ＡとＢの血圧値の差を真に比較することは困難である。

【0070】

一方、図６に示すように、例えば、妊婦Ａと妊婦Ｂの血圧の計測値を1次式にフィッティングし、妊娠Ａの血圧値に対する回帰線６０２と妊婦Ｂの血圧の計測値に対する回帰線６０４を算出したとする。回帰線６０２や６０４も用いることで、両者の傾きから妊娠ＡとＢの血圧推移の差を比較することができる。また、所定の時間（ｔ）において血圧の予測値を用いることで、測定時点差の影響を排除した比較が可能となる。

【0071】

また、別の一例として、図６において、時間ｔ０が妊婦の妊娠の初日であるものとする。また、ある疾患の発症の有無が、妊娠の初日の血圧値に関連があるものとする。この場合、妊婦Ａ、妊婦Ｂ、妊婦Ｃのように妊娠初日の血圧値の記録がない場合でも、各妊婦の血圧値を１次式にフィッティングすることで、１次式の切片ｂ１と、切片ｂ２、切片３を得ることができ、特徴量として用いることができる。

【0072】

同様にして、例えば、妊娠の初日から所定の日数を経過した時点における各妊婦の血圧を、フィッティングした１次式を用いて算出し、特徴量として利用することができる。

【0073】

このように、特徴量抽出部１１２は、複数の被験者から収集した、量的形質の経時的な変化から、所定の疾患に関連する特徴量を抽出する。

【0074】

なお、上記の傾きａ１、ａ２、a３及び切片ｂ１、ｂ２、ｂ３は、特徴量抽出部１１２が抽出する特徴量の一例である。また、図６に示す１次式は、所定の多項式の一例であり、所定の多項式は、２次以上の多項式であっても良い。

【0075】

ここで、図４に戻り、ＤＮＡ変異の絞込処理の例を示すフローチャートの説明を続ける。

【0076】

ステップＳ４０３において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異情報取得部１１３は、例えば、ステップＳ４０１、Ｓ４０２の処理と並行して、所定の疾患に罹患している被験者を含む複数の被験者におけるＤＮＡ変異の情報を取得する。

【0077】

一例として、ＤＮＡ変異情報取得部１１３は、入力受付部１１１が受け付けた、所定の疾患に罹患している被験者を含む複数の被験者のＤＮＡ情報を用いて、ＤＮＡ配列中の所定のＤＮＡ変異情報（例えば、全ての一塩基多型等）を抽出（取得）する。

【0078】

また、別の一例として、ＤＮＡ変異情報取得部１１３は、図２に示すＤＮＡ変異情報取得装置２１０から、ＤＮＡ変異情報取得装置２１０が抽出した、所定の疾患に罹患している被験者を含む複数の被験者のＤＮＡ変異情報を取得するものであっても良い。さらに、ＤＮＡ変異情報取得部１１３は、所定の疾患に罹患している被験者を含む複数の被験者のＤＮＡ変異情報が、図２に示す予め登録されたＤＮＡ変異情報ＤＢ２２０から、所定の疾患に罹患している被験者を含む複数の被験者のＤＮＡ変異情報を取得するものであっても良い。

【0079】

なお、ステップＳ４０１において、連続的な量的形質の計測値を取得する複数の被験者と、ステップＳ４０３において、一塩基多型の情報を取得する複数の被験者は、同じ被験者である。

【0080】

ステップＳ４０４において、ＤＮＡ変異絞込装置１１０の関連解析部１１４は、ステップＳ４０２で抽出した特徴量と、ステップＳ４０３で取得したＤＮＡ変異の情報に含まれるＤＮＡ変異との関連を解析する。

【0081】

一例として、関連解析部１１４は、特徴量を目的変数、ＤＮＡ変異を説明変数として関連解析（検定）を行い、特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出する（第１の具体例）。例えば、関連解析部１１４は、特徴量を目的変数、ＤＮＡ変異を説明変数とした回帰式において、各ＤＮＡ変異の係数のＷａｌｄ統計量から算出されるｐ値を、統計的指標の値とすることができる。

【0082】

別の一例として、関連解析部１１４は、特徴量を、予め定めた基準値を用いて、罹患群と非罹患群とラベル付けし、各ＤＮＡ変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する（第２の具体例）。例えば、関連解析部１１４は、フィッシャーの正確検定や、カイ二乗検定を行い、有意確率を表すｐ値を、統計的指標の値とすることができる。

【0083】

なお、関連解析部１１４が、統計的指標の値を算出する際の検定（関連解析）には、例えば、線形回帰、ロジスティック回帰、フィッシャーの正確検定、カイ二乗検定、コクラン・アミテージ検定、ｔ検定等が用いられるが、これに限定されない。また、関連解析部１１４が算出する統計的指標の値には、例えば、ｐ値、ｆ値、又はオッズ比等が用いられるが、これに限定されない。

【0084】

また、関連解析部１１４は、優性遺伝子作用、劣性遺伝子作用、遺伝子型等をさらに考慮して統計的指標の値を算出しても良いし、共編量として年齢、体重、ＢＭＩ等の情報を用いるものであっても良い。

【0085】

ステップＳ４０５において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異抽出部１１５は、関連解析部１１４の解析結果に基づいて、所定の疾患に関連するＤＮＡ変異を抽出する。例えば、ＤＮＡ変異抽出部１１５は、ステップＳ４０３で取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異の中から、ステップＳ４０４で算出した統計的指標の値を基準値として、所定の疾患に関連するＤＮＡ変異を抽出する。例えば、ＤＮＡ変異抽出部１１５は、統計的指標の値が、基準値以上、又は基準値以下のＤＮＡ変異を抽出する。

【0086】

なお、上記の処理で抽出されたＤＮＡ変異の情報は、ＤＮＡ変異絞込装置１１０の結果出力部１１７によって、例えば、所定の疾患に関連するＤＮＡ変異の候補として、出力装置３０５、又はストレージ３０３等に出力される。

【0087】

続いて、第１の具体例、及び第２の具体例におけるＤＮＡ変異絞込方法の処理の流れについて説明する。

【0088】

［第１の具体例］
第１の具体例では、ＤＮＡ変異絞込装置１１０の関連解析部１１４が、特徴量を目的変数、ＤＮＡ変異を説明変数として関連解析を行い、特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値（例えば、ｐ値等）を算出する場合の処理の例について説明する。

【0089】

図７は、一実施形態に係る第１の具体例に係るＤＮＡ変異の絞込処理の例を示すフローチャートである。

【0090】

ステップＳ７０１において、ＤＮＡ変異絞込装置１１０の入力受付部１１１は、複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部１１６等に保存（記憶）する。

【0091】

ステップＳ７０２において、ＤＮＡ変異絞込装置１１０の特徴量抽出部１１２は、記憶部１１６に記憶された、量的形質の経時的な変化から、所定の表現型に関連する特徴量を抽出する。例えば、特徴量抽出部１１２は、図５に示すような特徴量の抽出処理を実行する。

【0092】

なお、表現型とは、例えば、ヒトの遺伝子型が形質として表現されたものであり、例えば身長の高さや目や肌、髪の色、肥満になりやすい体質であるか否か、等の個人の体質や、高血圧、糖尿病、妊娠高血圧症候群、冠動脈疾患等の所定の疾患を含む。本実施形態は、所定の疾患に限られず、所定の表現型に関連する遺伝子変異を絞り込む用途にも適用することができる。

【0093】

ステップＳ７０３、Ｓ７０４において、ＤＮＡ変異絞込装置１１０は、例えば、ステップＳ７０１、Ｓ７０２の処理と並行して、複数の被験者におけるＤＮＡ変異の情報を取得する。例えば、ステップＳ７０３において、ＤＮＡ変異絞込装置１１０の入力受付部１１１は、複数の被験者のＤＮＡ情報を取得し、記憶部１１６に記憶する。また、ステップ７０４において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異情報取得部１１３は、記憶部１１６に記憶した複数の被験者のＤＮＡ情報を解析して、ＤＮＡ変異の情報を抽出する。

【0094】

なお、ステップＳ７０３、Ｓ７０４において、ＤＮＡ変異情報取得部１１３は、図２に示すＤＮＡ変異情報取得装置２１０や、ＤＮＡ変異情報ＤＢ２２０等から、複数の被験者におけるＤＮＡ変異の情報を取得するものであっても良い。

【0095】

ステップＳ７０５において、ＤＮＡ変異絞込装置１１０の関連解析部１１４は、特徴量を目的変数、ＤＮＡ変異を説明変数として関連解析（検定）を行い、特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値を算出する。例えば、関連解析部１１４は、特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値として、ｐ値、ｆ値、オッズ比等を算出する。

【0096】

ステップＳ７０６において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異抽出部１１５は、ステップＳ７０５で算出した統計的指標の値が、基準値以上、又は基準値以下となるＤＮＡ変異を抽出する。

【0097】

上記の処理により、ＤＮＡ変異絞込装置１１０は、ステップＳ７０３、Ｓ７０４で取得したＤＮＡ変異の中から、所定の表現型に関連するＤＮＡ変異を抽出することができる。

【0098】

（応用例）
図８は、一実施形態に係る第１の具体例のＤＮＡ変異の絞込処理の応用例を示すフローチャートである。

【0099】

ここでは、上記の処理を用いて、ＤＮＡ情報のサンプルが少ない場合や、所定の疾患の定義が曖昧である場合であっても、所定の疾患に関連するＤＮＡ変異を容易に絞り込むことができるＤＮＡ変異絞込方法について説明する。

【0100】

ここでは、具体的な一例として、所定の疾患が、妊娠高血圧症候群（以下HDP: Hypertensive Disorders of Pregnancy）であるものとして、以下の説明を行う。

【0101】

ＨＤＰには、診断のガイドラインが設定されているが、実際には、ＨＤＰに分類されていなくてもＨＤＰのような血圧値が現れる場合がある。このような場合には、罹患群、非罹患群の遺伝的背景に十分な差がなく、所定の疾患に関連するＤＮＡ変異を十分に絞り込めない場合がある。なお、ＨＤＰは、罹患群と非罹患群の定義が曖昧な疾患の一例である。

【0102】

また、ここでは、図６に示すように、血圧の計測値の変化率を示す傾きが、ＨＤＰの罹患と関連しており、例えば、ＨＤＰに罹患している妊婦における血圧の計測値の傾きは、ＨＤＰに罹患していない妊婦における血圧の計測値の傾きより大きい傾向があるものとする。なお、妊婦の血圧の計測値は、所定の疾患に関連する量的形質の連続的な計測値の一例である。また、血圧の計測値の傾きは、正規化された特徴量の一例である。

【0103】

ステップＳ８０１において、ＤＮＡ変異絞込装置１１０の入力受付部１１１は、ＨＤＰに罹患している被験者を含む、複数の被験者における血圧の計測値を含む連続的な量的形質の計測値を取得し、記憶部１１６に記憶する。

【0104】

ステップＳ８０２において、ＤＮＡ変異絞込装置１１０の特徴量抽出部１１２は、量的形質の経時的な変化から、ＨＤＰに関連する特徴量を抽出する。例えば、特徴量抽出部１１２は、図６に示すように、妊婦の血圧の計測値６０１を１次式「ｙ＝ａｘ＋ｂ」にフィッティングし、一次式の傾きａを特徴量として抽出する。

【0105】

ステップＳ８０３において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異情報取得部１１３は、ＨＤＰに罹患している被験者を含む複数の被験者のＤＮＡ情報から抽出された一塩基多型の情報を取得する。例えば、図２のＤＮＡ変異情報取得装置２１０は、ＨＤＰに罹患している被験者を含む複数の被験者のＤＮＡ情報を用いて、ＤＮＡ配列中における全ての一塩基多型の情報を抽出する。また、ＤＮＡ変異情報取得部１１３は、ＤＮＡ変異情報取得装置２１０から、抽出された一塩基多型の情報を取得する。なお、一塩基多型の情報は、ＤＮＡ変異の情報の一例である。

【0106】

ステップＳ８０４において、ＤＮＡ変異絞込装置１１０の関連解析部１１４は、ステップＳ８０２で抽出した特徴量を目的変数、ステップＳ８０３で取得した一塩基多型の情報に含まれる一塩基多型を説明変数として関連解析（検定）を行う。例えば、関連解析部１１４は、特徴量を目的変数、一塩基多型を説明変数とした回帰式において、各一塩基多型の係数のＷａｌｄ統計量から、有意確率を表すｐ値を算出する。

【0107】

ステップＳ８０５において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異抽出部１１５は、ステップＳ８０３で取得した一塩基多型の情報に含まれる一塩基多型の中から、ｐ値が、予め定められた有意水準（例えば、５×１０^-８）より小さい一塩基多型を抽出する。

【0108】

これにより、図６に示すような、血圧の計測値の傾きａに関連する一塩基多型の情報、例えば、ＨＤＰに関連する一塩基多型の情報を抽出することができる。

【0109】

本実施形態によれば、例えば、ＨＤＰのように疾患の症状と血圧等の量的形質が関わっている疾患において、量的形質を用いた関連解析を行う際に、多時点の情報を扱うことで、関連解析（検定）の精度を高め、所定の疾患に関連する一塩基多型を容易に抽出（絞込）することができる。

【0110】

また、本実施形態では、例えば、図６に示すように、量的形質の連続的な計測値から抽出した、特徴量を用いて関連解析を行う。これにより、互いに異なる期間に計測された複数の被験者の計測値を、同様に処理することができる。また、計測期間とは異なる時点における量的形質の計測値を推定して、関連解析を行うこと（例えば、妊娠１０週～１５週の血圧の計測値に基づいて、妊娠初日の血圧値を推定して、関連解析を行う等）もできる。

【0111】

以上、本実施形態によれば、量的形質を用いた関連解析を行う際に、所定の疾患に関連するＤＮＡ変異を容易に絞り込むことができるＤＮＡ変異絞込装置、ＤＮＡ変異絞込システム、及びＤＮＡ変異絞込方法を提供することができる。

【0112】

［第２の具体例］
第１の具体例では、関連解析部１１４が、特徴量を目的変数、ＤＮＡ変異を説明変数として関連解析を行い、特徴量と各ＤＮＡ変異との関連度を示す統計的指標の値（例えば、ｐ値等）を算出する場合の処理の例について説明した。

【0113】

第２の具体例では、関連解析部１１４が、特徴量を、予め定めた基準値を用いて、罹患群と非罹患群とラベル付けし、各ＤＮＡ変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する場合の処理の例について説明する。

【0114】

図９は、一実施形態に係る第２の具体例のＤＮＡ変異の絞込処理の例を示すフローチャートである。なお、ここでは、第１の具体例と同様の処理に対する詳細な説明は省略する。

【0115】

ステップＳ９０１において、ＤＮＡ変異絞込装置１１０の入力受付部１１１は、複数の被験者の連続的な量的形質の計測値を取得し、取得した連続的な量的形質の計測値を記憶部１１６に保存（記憶）する。

【0116】

ステップＳ９０２において、ＤＮＡ変異絞込装置１１０は、量的形質の経時的な変化から所定の表現型に関連する特徴量を抽出し、抽出した特徴量を予め定めた基準値を用いて罹患群と非罹患群とにラベル付けを行う。例えば、ＤＮＡ変異絞込装置１１０は、図１０に示すような罹患群、非罹患群のラベル付け処理を実行する。

【0117】

図１０は、一実施形態に係る第２の具体例の罹患群、非罹患群のラベル付け処理の例を示すフローチャートである。この処理は、図９のステップＳ９０２において、ＤＮＡ変異絞込装置１１０が実行する罹患群、非罹患群のラベル付け処理の一例を示している。

【0118】

ステップＳ１００１において、ＤＮＡ変異絞込装置１１０の特徴量抽出部１１２は、入力受付部１１１が取得した連続的な量的形質の計測値を、多項式にフィッティングする。

【0119】

ステップＳ１００２において、特徴量抽出部１１２は、フィッティングした多項式の係数、切片等を算出する。

【0120】

ステップＳ１００３において、特徴量抽出部１１２は、算出した係数、切片、又は係数と切片を用いて、正規化された特徴量を抽出する。

【0121】

具体的な一例として、所定の表現型が、ＨＤＰである場合、特徴量抽出部１１２は、図６で前述したように、連続的な血圧（量的形質の一例）の計測値を１次式にフィッティングし、１次式の傾きを特徴量として抽出する。

【0122】

ステップＳ１００４において、ＤＮＡ変異絞込装置１１０の関連解析部１１４は、特徴量抽出部１１２が抽出した特徴量を、予め定めた基準値を用いて罹患群と非罹患群とに分類（ラベル付け）する。

【0123】

例えば、前述したように、ＨＤＰに罹患している妊婦における血圧の計測値の傾きは、ＨＤＰに罹患していない妊婦における血圧の計測値の傾きより大きい傾向があることから、予め定められた傾き（基準値）を用いて、罹患群と非罹患群とを分類することができる。具体的な一例として、関連解析部１１４は、予め定められた傾きより大きい特徴量を罹患群としてラベル付けし、予め定められた傾き以下の特徴量を非罹患群としてラベル付けすることができる。

【0124】

ここで、図９に戻り、ＤＮＡ変異の絞込処理の例を示すフローチャートの説明を続ける。

【0125】

ステップＳ９０３、Ｓ９０４において、ＤＮＡ変異絞込装置１１０は、例えば、ステップＳ９０１、Ｓ９０２の処理と並行して、複数の被験者におけるＤＮＡ変異の情報を取得する。

【0126】

ステップＳ９０５において、ＤＮＡ変異絞込装置１１０の関連解析部１１４は、ＤＮＡ変異情報取得部１１３が取得したＤＮＡ変異の情報に含まれる各ＤＮＡ変異に対して、罹患群、及び非罹患群における保有数に差があるかを示す統計的指標の値を算出する。

【0127】

具体的な一例として、関連解析部１１４は、フィッシャーの正確検定、又はカイ二乗検定を行い、ｐ値を算出する。

【0128】

ステップＳ９０６において、ＤＮＡ変異絞込装置１１０のＤＮＡ変異抽出部１１５は、関連解析部１１４が算出した統計的指標の値が、基準値以上、又は基準値以下となるＤＮＡ変異を抽出する。

【0129】

具体的な一例として、ＤＮＡ変異抽出部１１５は、ｐ値が、予め定められた基準値（例えば、０．０５等）以下となるＤＮＡ変異を抽出する。

【0130】

上記の処理において、例えば、所定の表現型をＨＤＰ、量的形質の計測値を妊婦の血圧の計測値、血圧の計測値の傾きを特徴量とすることにより、第１の具体例と同様に、ＨＤＰに関連するＤＮＡ変異（一塩基多型）を抽出することができる。

【0131】

また、第２の具体例においても、検体のサンプルが少ない場合や、疾患の定義が曖昧である場合であっても、所定の疾患に関連するＤＮＡ変異を容易に絞り込むことができるＤＮＡ変異絞込装置、ＤＮＡ変異絞込システム、及びＤＮＡ変異絞込方法を提供することができる。

【0132】

以上、本発明の実施形態によれば、サンプルが少ない場合や、疾患の定義が曖昧であり、通常のゲノムワイド関連解析で有効な結果が得られないようなケースでも、有意なＤＮＡ変異を絞込できることができる。これにより、従来の技術では特定できなかった疾患に関連するＤＮＡ変異を特定し、疾患の早期発見や予防に活用することが期待できる。

【0133】

＜補足＞
なお、図１、２の構成図は、機能単位のブロックを示している。これらの機能ブロックは、ハードウェア及び／又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び／又は論理的に結合した１つの装置により実現されても良いし、物理的及び／又は論理的に分離した２つ以上の装置を直接的及び／又は間接的に（例えば、有線及び／又は無線）で接続し、これら複数の装置により実現されても良い。

【0134】

また、図３に示すＤＮＡ変異絞込装置１１０のハードウェア構成は、図に示した各装置を１つ又は複数含むように構成されても良いし、一部の装置を含まずに構成されても良い。また、ＤＮＡ変異絞込装置１１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを含んで構成されても良く、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されても良い。例えば、プロセッサ３０１は、これらのハードウェアの少なくとも１つで実装されても良い。

【0135】

本明細書で説明した各態様／実施形態の処理手順、シーケンス、フローチャート等は、矛盾のない限り、順序を入れ替えても良い。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

【0136】

入出力された情報等は特定の場所（例えば、メモリ）に保存されても良いし、管理テーブルで管理しても良い。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されても良い。入力された情報等は他の装置へ送信されても良い。

【0137】

判定は、１ビットで表される値（０か１か）によって行われても良いし、真偽値（Boolean：true又はfalse）によって行われても良いし、数値の比較（例えば、所定の値との比較）によって行われても良い。

【0138】

本明細書で説明した各態様／実施形態は単独で用いても良いし、組み合わせて用いても良いし、実行に伴って切り替えて用いても良い。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われても良い。

【0139】

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

【0140】

また、ソフトウェア、命令などは、伝送媒体を介して送受信されても良い。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線（ＤＳＬ）などの有線技術及び／又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

【0141】

本明細書で説明した情報、信号等は、様々な異なる技術のいずれかを使用して表されても良い。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されても良い。

【0142】

なお、本明細書で説明した用語及び／又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えても良い。

【0143】

また、本明細書で説明した情報、パラメータなどは、絶対値で表されても良いし、所定の値からの相対値で表されても良いし、対応する別の情報で表されてもよい。例えば、無線リソースはインデックスで指示されるものであっても良い。

【0144】

本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

【0145】

「含む(ｉｎｃｌｕｄｉｎｇ)」、「含んでいる（ｃｏｍｐｒｉｓｉｎｇ）」、及びそれらの変形が、本明細書、或いは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書、或いは特許請求の範囲において使用されている用語「または（or）」は、排他的論理和ではないことが意図される。

【0146】

本開示の全体において、例えば、英語でのa, an, 及びtheのように、翻訳により冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数のものを含むものとする。

【0147】

以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。従って、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。

【符号の説明】

【0148】

１００ＤＮＡ変異絞込システム
１１０ＤＮＡ変異絞込装置
１１２特徴量抽出部
１１３ＤＮＡ変異情報取得部（取得部）
１１４関連解析部（解析部）
１１５ＤＮＡ変異抽出部

【図1】