(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024035014
(43)【公開日】2024-03-13
(54)【発明の名称】2種以上の検査を実施可能な遺伝学的解析方法
(51)【国際特許分類】
C12Q 1/68 20180101AFI20240306BHJP
【FI】
C12Q1/68 100Z
【審査請求】有
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022205502
(22)【出願日】2022-12-22
(11)【特許番号】
(45)【特許公報発行日】2023-08-23
(31)【優先権主張番号】P 2022137059
(32)【優先日】2022-08-30
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】520496501
【氏名又は名称】株式会社seeDNA
(74)【代理人】
【識別番号】100137338
【弁理士】
【氏名又は名称】辻田 朋子
(74)【代理人】
【識別番号】100196313
【弁理士】
【氏名又は名称】村松 大輔
(72)【発明者】
【氏名】金 起範
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA17
4B063QQ08
4B063QQ42
4B063QR55
4B063QR62
4B063QX01
(57)【要約】 (修正有)
【課題】本発明は親子鑑定、表現型解析及び染色体数異常の診断から選ばれる2以上の検査を実施可能とする新規の技術を提供することを課題とする。
【解決手段】本発明は以下の(i)~(iii)の2以上の条件を満たす解析対象群について解析を行い、表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程の2種以上を含む遺伝学的解析方法である。
(i)表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上
(ii)マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上
(iii)13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の一塩基多型座位からなる解析対象群を解析する遺伝学的解析方法であって、
前記解析対象群は、以下の(i)~(iii)から選ばれる2以上の条件を満たし、;
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。;
子の遺伝情報を含む核酸を含有する子核酸サンプルと、
父の遺伝情報を含む核酸を含有する父核酸サンプル及び/又は母の遺伝情報を含む核酸を含有する母核酸サンプルと、
を分析して、
それぞれのサンプルに含まれる核酸における、前記解析対象群に含まれる複数の一塩基多型座位におけるアレルの配列情報と、前記一塩基多型座位を含む領域及び/又は当該アレルの相対的又は絶対的な存在量を反映した数値と、を含むデータを取得し、
前記データに基づき、ジェノタイピングを行うジェノタイピング工程を含み、
さらに、以下の表現型解析工程、親子鑑定工程、及び染色体数異常評価のための指標算出工程から選ばれる2種以上を含み、
前記表現型解析工程を含む場合には、前記解析対象群は前記(i)の条件を満たし、
前記親子鑑定を含む場合には、前記解析対象群は前記(ii)の条件を満たし、
前記染色体数異常評価のための指標算出工程を含む場合には、前記解析対象群は前記(iii)の条件を満たすことを特徴とする、遺伝学的解析方法。
<表現型解析工程>
前記ジェノタイピング工程の結果に基づいて、前記子、前記父及び前記母から選ばれる1人又は2人以上において、前記一塩基多型座位におけるマイナーアレルに関与する前記表現型が発現する可能性を解析する工程。
<親子鑑定工程>
前記ジェノタイピング工程の結果に基づき、前記複数の一塩基多型座位のそれぞれについて父性指数(Paternity Index,PI)を求めて前記父と前記子との親子関係の存否を鑑定するか、あるいは
前記ジェノタイピング工程の結果に基づき、前記複数の一塩基多型座位のそれぞれについて母性指数(Maternity Index,MI)を求めて前記母と前記子との親子関係の存否を鑑定する工程であって、
前記子が出生前の胎児であり父子鑑定を行うケースと、前記子が出生後であり父子鑑定を行うケースと、前記子が出生後であり母子鑑定を行うケースのそれぞれについて、以下の通りPI又はMIを算出する工程。
子が出生前の胎児であり父子鑑定を行うケース:
前記子核酸サンプルが、前記子を妊娠中の母親から採取された循環無細胞核酸サンプルであり、
前記循環無細胞核酸サンプルと前記父核酸サンプルの2種のサンプルの分析により、前記父と前記胎児のジェノタイピングを行う場合には、表1又は表2に従ってPIを算出し、
前記循環無細胞核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記胎児のジェノタイピングを行う場合には、表3又は表4に従ってPIを計算する。
子が出生後であり父子鑑定を行うケース:
前記子核酸サンプルと前記父核酸サンプルの2種のサンプルの分析により、前記父と前記子のジェノタイピングを行う場合には、表5に従ってPIを算出し、
前記子核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記子のジェノタイピングを行う場合には、表6に従ってPIを算出する。
子が出生後であり母子鑑定を行うケース:
前記子核酸サンプルと前記母核酸サンプルの2種のサンプルの分析により、前記母と前記子のジェノタイピングを行う場合には、表7に従ってMIを算出し、
前記子核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記子のジェノタイピングを行う場合には、表8に従ってMIを算出する。
【表1】
【表2】
【表3】
【表4】
【表5】
【表6】
【表7】
【表8】
(表1~4においては、循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記している。
表1及び表2中のk
0は偽陰性率(false negative rate)であり、kbは擬陽性率(False positive rate)であり、aはAの出現頻度であり、bはBの出現頻度である。
表5~8中、μは突然変異率であり、a及びbはそれぞれアレルAとアレルBの出願頻度であり、αはアレルAの平均除外力であり、βはアレルBの平均除外力である。)
<染色体数異常評価のための指標算出工程>
前記データに含まれる前記数値に基づき、前記子、前記父及び前記母から選ばれる1人又は2人以上における、13番染色体、18番染色体、21番染色体、X染色体及びY染色体の数的変異の有無を評価するための指標として、Zスコア又はNCV(Normalized Chromosome Value)を算出する工程であって、
N番染色体についてのZスコア(Z
chrN)は以下の式(1)に基づいて求め、参照とするM番染色体に対するN番染色体に関するNCV(NCV
chrN by chrM)は以下の式(2)で求める工程。
【数2】
・・・式(1)
(式(1)においてNは13、18、21、X又はYであり、
「proportion of chr N」は、前記子核酸サンプルを分析したときの全染色体(但し13、18、21番、X及びY染色体を除く)の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合である。
「mean of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の平均である。
「SD of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の標準偏差である。)
【数3】
・・・式(2)
( 式(2)において、「Normalized proportion of chr N by chr M」は、前記子核酸サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の平均である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の標準偏差である。)
【請求項2】
前記親子鑑定工程、前記染色体数異常評価のための指標算出工程、及び前記表現型解析工程を全て含む、請求項1に記載の遺伝学的解析方法。
【請求項3】
前記解析対象群が(i)~(iii)の全ての条件を満たし、
表現型との関連性を有することが既知であり、マイナーアレルの出現頻度が1%~50%であり、染色体上において20kb以上の距離をもって互いに離れており、かつ、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の、解析対象群を構成する一塩基多型座位の総数に対して占める割合が10%以上である、請求項1に記載の遺伝学的解析方法。
【請求項4】
前記子が母の胎内にいる胎児であり、前記子核酸サンプルが前記母より採取した循環無細胞核酸サンプルである、請求項1に記載の遺伝学的解析方法。
【請求項5】
前記親子鑑定工程と前記表現型解析工程を備え、
前記親子鑑定工程の結果、前記子と前記父との生物学的親子関係が確定された場合に、
前記表現型解析工程において、以下の基準にしたがって、胎児がリスクアレルを保有している確率をP2であると評価する、請求項4に記載の遺伝学的解析方法。
(基準)
1)片側の親がリスクアレルをホモ接合として保有している場合:
P2=100%
2)片側の親がリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.5)
3)両親がそれぞれリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.75)
(P1は、循環無細胞核酸サンプルの分析によって胎児由来のリスクアレルの存在を示唆する信号が得られた場合に推測できる、胎児がリスクアレルを保有している確率である。
また、2)及び3)の式の右辺が100%を超える場合、P2は100%であるとみなす。)
【請求項6】
前記子が出生後の子である、請求項1に記載の遺伝学的解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は次世代シーケンサー等を用いた核酸解析方法の技術分野に属する。
【背景技術】
【0002】
ヒトゲノム・遺伝子解析研究の進展により、多くの単一遺伝子疾患の責任遺伝子の同定がなされるだけではなく、多因子疾患の遺伝要因の解明も急速に進められている。ゲノムワイド関連解析(GWAS)は遺伝的変異を特定するための有効な方法である。これにより、疾患リスクおよびヒトの量的形質(肥満度指数や代謝物の血中濃度など)に関連する遺伝子を特定することができる。GWASによって特定された変異と表現型との関連性はP値によって表現される。
【0003】
このような技術の発展に伴い、個々人の遺伝的背景に基づいて最適な医療を提供する個別化医療の実施も現実のものとなろうとしている。このような技術革新に伴い、遺伝子解析が消費者に非常に身近になってきている。直接消費者に提供される遺伝学的検査は、消費者直結型遺伝学的検査(Direct-to-Consumer Genetic Testing,DTC遺伝学的検査)と呼ばれ、消費者に対して行動の改善を促すような疾病罹患リスクや体質、はたまた性格に関する情報を提供し、その外延として、ダイエットプログラムの提供や化粧品・サプリメント等の販売といった2次的サービスと組み合わせて行われることもある(例えば非特許文献1などを参照)。
【0004】
また、親子関係の存在・不存在が不明瞭であることは法律的、家族関係などに大きな影響を及ぼす。妊娠している女性の胎内にいる胎児の生物学的父が誰であるのか確信が持てない場合、正しい生物学的父を決定するいくつかの方法がある。
1つの方法としては、出産まで待ち、子と擬父のゲノムDNAを解析し既存の親子鑑定で用いられるFragment analysisによるSTR解析ができる。
しかし、子の出生前にその生物学的父を知りたいというニーズは多い。出生前に親子関係を鑑別する方法としては、絨毛診断や羊水穿刺によって回収した遺伝物質を解析する方法が挙げられるが、これらは侵襲性であり、流産リスクがあるという問題がある。
【0005】
上述した侵襲性の診断方法の問題に鑑み、血液に混入した循環無細胞DNA(cell-free DNA,cfDNA)を解析する方法を親子鑑定に応用することが行われている。母親の血液循環に混入した胎児由来の遺伝物質である胎児循環無細胞DNA(Cell-free fetal DNA,cffDNA)の分析を行うことにより、非侵襲的出生前親子鑑定(Non-Invasive Prenatal Paternity Test,NIPPT)を実施することが可能となる。
この場合、既存のSTR解析では断片化されたcffDNAの解析が難しいため、複数のSNV GenotypingによるMPS(massive parallelsequencing)方法が用いられる。
【0006】
例えば特許文献1には、最尤推定値又は最大事後確率法を使用して、擬父が胎児の生物学的父である確率をコンピュータにて決定し、決定された確率に基づき、単一仮説棄却検定、最尤推定、又は最大事後確率法を使用して、擬父が胎児の生物学的父であるか否かを確証するNIPPTの方法が開示されている。
非特許文献2には、母体-胎児の遺伝子型予測におけるベイズベースのアルゴリズムを利用する方法が開示されている。
非特許文献3には、有効なSNVの数がマイナーアレル頻度(MAF)および総SNVの数と有意な関係があること、並びに、シーケンス深度がNIPPTの精度に影響を与えることが記載されている。
【0007】
胎児循環無細胞DNAの解析技術の応用分野として非侵襲的出生前遺伝学的検査(Non-Invasive Prenatal Genetic Testing,NIPT)による胎児の染色体数異常(Chromosome Copy Number Variants)の検出も挙げられる。染色体数異常は染色体の数的異常であり、21トリソミー(ダウン症候群)、18トリソミー(エドワード症候群)、13トリソミー(パトウ症候群)、Xモノソミー(ターナー症候群)などが知られている。染色体数異常の主なスクリーニング法として、妊娠第1期に行われる項部浮腫(NT)を測定するための超音波検査に加え、第1期と第2期に一連の母体血清マーカーテストが行われてきた。しかし、近年、胎児循環無細胞DNAに基づくNIPTが可能となっている。
【0008】
胎児循環無細胞DNAに基づくNIPTとしてはDNA量比較法またはカウント法(Massively-Parallel Sequencing法,MPS法)と呼ばれる方法が知られている。MPS法においては,母体由来と胎児由来を区別せずに染色体ごとのDNA断片の数をカウントする。仮に胎児が21トリソミー(ダウン症候群)であれば、21番染色体由来のDNA断片が正常群とくらべてわずかに多くなることになる。MPS法は、そのDNA断片数の差を解析し,胎児の染色体の数の異常を統計学的に予測する方法である。
MPS法の他、一塩基多型(SNV)を特定的に増幅してそのパターンを解析する方法や(例えば特許文献2)、マイクロアレイを用いる方法などが知られている。
【0009】
NIPTにおいてはカウントないしシグナル強度を分析し、正常群(中央値)からの逸脱を数値化して評価する方法がとられる。数値化の方法としては、同じMPS法でも染色体全体を参照染色体としたZスコアを用いる方法や、21番、18番、13番染色体など染色体ごとの参照染色体に対するnormalized chromosome value(NCV)を用いる方法などが知られている(例えば特許文献3などを参照)。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特表2014-502845号公報
【特許文献2】特表2022-519159号公報
【特許文献3】特開2019-153332号公報
【非特許文献】
【0011】
【非特許文献1】Nutrients.2020 Feb;12(2):566.Published online 2020 Feb 21.
【非特許文献2】Prenatal Diagnosis, Volume40,Issue4,March 2020,Pages 497-506.
【非特許文献3】PLoS One. 2016 Sep 15;11(9):e0159385.
【非特許文献4】PLoS One. 2019 Sep 12;14(9):e0222535.
【非特許文献5】PLoS One. 2019 Apr 12;14(4):e0215368.
【非特許文献6】Clin Chem. 2011 Jul;57(7):1042-9.
【発明の概要】
【発明が解決しようとする課題】
【0012】
DTC遺伝学的検査や単一遺伝子疾患検査などの表現型解析、親子鑑定及びNIPTはこれまで別個の技術、サービスとして認識されてきており、これらを1回の検査で同時に解析するという発想は無かった。このような発想がなかったため、これら検査を同時に実施する場合にどのようなパネルを構築すべきかといった検討が一切されてこなかった。
【0013】
このような問題に鑑み、本発明は、親子鑑定、表現型解析及び染色体数異常の診断から選ばれる2以上の検査を実施可能とする新規の技術を提供することを課題とする。
【課題を解決するための手段】
【0014】
上記課題を解決する本発明は以下のとおりである。
【0015】
[1] 複数の一塩基多型座位からなる解析対象群を解析する遺伝学的解析方法であって、
前記解析対象群は、以下の(i)~(iii)から選ばれる2以上の条件を満たし;
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。;
子の遺伝情報を含む核酸を含有する子核酸サンプルと、
父の遺伝情報を含む核酸を含有する父核酸サンプル及び/又は母の遺伝情報を含む核酸を含有する母核酸サンプルと、
を分析して、
それぞれのサンプルに含まれる核酸における、前記解析対象群に含まれる複数の一塩基多型座位におけるアレルの配列情報と、前記一塩基多型座位を含む領域及び/又は当該アレルの相対的又は絶対的な存在量を反映した数値と、を含むデータを取得し、
前記データに基づき、ジェノタイピングを行うジェノタイピング工程を含み、
さらに、以下の表現型解析工程、親子鑑定工程、及び染色体数異常評価のための指標算出工程から選ばれる2種以上を含み、
前記表現型解析工程を含む場合には、前記解析対象群は前記(i)の条件を満たし、
前記親子鑑定を含む場合には、前記解析対象群は前記(ii)の条件を満たし、
前記染色体数異常評価のための指標算出工程を含む場合には、前記解析対象群は前記(iii)の条件を満たすことを特徴とする、遺伝学的解析方法。
【0016】
<表現型解析工程>
前記ジェノタイピング工程の結果に基づいて、前記子、前記父及び前記母から選ばれる1人又は2人以上において、前記一塩基多型座位におけるマイナーアレルに関与する前記表現型が発現する可能性を解析する工程。
【0017】
<親子鑑定工程>
前記ジェノタイピング工程の結果に基づき、前記複数の一塩基多型座位のそれぞれについて父性指数(Paternity Index,PI)を求めて前記父と前記子との親子関係の存否を鑑定するか、あるいは
前記ジェノタイピング工程の結果に基づき、前記複数の一塩基多型座位のそれぞれについて母性指数(Maternity Index,MI)を求めて前記母と前記子との親子関係の存否を鑑定する工程であって、
前記子が出生前の胎児であり父子鑑定を行うケースと、前記子が出生後であり父子鑑定を行うケースと、前記子が出生後であり母子鑑定を行うケースのそれぞれについて、以下の通りPI又はMIを算出する工程。
【0018】
子が出生前の胎児であり父子鑑定を行うケース:
前記子核酸サンプルが、前記子を妊娠中の母親から採取された循環無細胞核酸サンプルであり、
前記循環無細胞核酸サンプルと前記父核酸サンプルの2種のサンプルの分析により、前記父と前記胎児のジェノタイピングを行う場合には、表1又は表2に従ってPIを算出し、
前記循環無細胞核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記胎児のジェノタイピングを行う場合には、表3又は表4に従ってPIを計算する。
【0019】
子が出生後であり父子鑑定を行うケース:
前記子核酸サンプルと前記父核酸サンプルの2種のサンプルの分析により、前記父と前記子のジェノタイピングを行う場合には、表5に従ってPIを算出し、
前記子核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記子のジェノタイピングを行う場合には、表6に従ってPIを算出する。
【0020】
子が出生後であり母子鑑定を行うケース:
前記子核酸サンプルと前記母核酸サンプルの2種のサンプルの分析により、前記母と前記子のジェノタイピングを行う場合には、表7に従ってMIを算出し、
前記子核酸サンプル、前記父核酸サンプル及び前記母核酸サンプルの3種のサンプルの分析により、前記父と前記母と前記子のジェノタイピングを行う場合には、表8に従ってMIを算出する。
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
表1~4においては、循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記している。
表1及び表2中のk0は偽陰性率(false negative rate)であり、kbは擬陽性率(False positive rate)であり、aはAの出現頻度であり、bはBの出現頻度である。
表5~8中、μは突然変異率であり、a及びbはそれぞれアレルAとアレルBの出願頻度であり、αはアレルAの平均除外力であり、βはアレルBの平均除外力である。
【0030】
<染色体数異常評価のための指標算出工程>
前記データに含まれる前記数値に基づき、前記子、前記父及び前記母から選ばれる1人又は2人以上における、13番染色体、18番染色体、21番染色体、X染色体及びY染色体の数的変異の有無を評価するための指標として、Zスコア又はNCV(Normalized Chromosome Value)を算出する工程であって、
N番染色体についてのZスコア(Z
chrN)は以下の式(1)に基づいて求め、参照とするM番染色体に対するN番染色体に関するNCV(NCV
chrN by chrM)は以下の式(2)で求める工程。
【数2】
・・・式(1)
(式(1)においてNは13、18、21、X又はYであり、
「proportion of chr N」は、前記子核酸サンプルを分析したときの全染色体(但し13、18、21番、X及びY染色体を除く)の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合である。
「mean of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の平均である。
「SD of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の標準偏差である。)
【0031】
【数3】
・・・式(2)
( 式(2)において、「Normalized proportion of chr N by chr M」は、前記子核酸サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の平均である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体の存在量を反映した数値に対する、N番染色体の存在量を反映した数値の割合の標準偏差である。)
【0032】
[2] 前記親子鑑定工程、前記染色体数異常評価のための指標算出工程、及び前記表現型解析工程を全て含む、[1]に記載の遺伝学的解析方法。
【0033】
[3] 前記解析対象群が(i)~(iii)の全ての条件を満たし、
表現型との関連性を有することが既知であり、マイナーアレルの出現頻度が1%~50%であり、染色体上において20kb以上の距離をもって互いに離れており、かつ、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の、解析対象群を構成する一塩基多型座位の総数に対して占める割合が10%以上である、[1]又は[2]に記載の遺伝学的解析方法。
【0034】
[4] 前記子が母の胎内にいる胎児であり、前記子核酸サンプルが前記母より採取した循環無細胞核酸サンプルである、[1]~[3]の何れかに記載の遺伝学的解析方法。
【0035】
[5]
前記親子鑑定工程と前記表現型解析工程を備え、
前記親子鑑定工程の結果、前記子と前記父との生物学的親子関係が確定された場合に、
前記表現型解析工程において、以下の基準にしたがって、胎児がリスクアレルを保有している確率をP2であると評価する、[4]に記載の遺伝学的解析方法。
【0036】
(基準)
1)片側の親がリスクアレルをホモ接合として保有している場合:
P2=100%
2)片側の親がリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.5)
3)両親がそれぞれリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.75)
【0037】
P1は、循環無細胞核酸サンプルの分析によって胎児由来のリスクアレルの存在を示唆する信号が得られた場合に推測できる、胎児がリスクアレルを保有している確率である。
また、2)及び3)の式の右辺が100%を超える場合、P2は100%であるとみなす。
【0038】
[6] 前記子が出生後の子である、[1]~[3]の何れかに記載の遺伝学的解析方法。
【発明の効果】
【0039】
上記(i)~(iii)から選ばれる2種以上の条件を満たす解析対象群の一塩基多型座位について分析を行うことで、親子鑑定、染色体数異常の診断及び表現型解析から選ばれる2種以上の遺伝学的検査が可能となる。
【図面の簡単な説明】
【0040】
【
図1】試験例1のシミュレーション結果を表すグラフである。マイナーアレルの出現頻度aが大きくなるにしたがって、SNVの数に応じたCPIの値が大きくなる。
【
図2】試験例2のシミュレーション結果を表すグラフである。マイナーアレルの出現頻度aが大きくなるにしたがって、SNVの数に応じたCPIの値が大きくなる。
【発明を実施するための形態】
【0041】
以下、本発明の実施形態について説明する。「<1>解析対象群の一塩基多型座位についてのジェノタイピング」において本発明の解析対象群及びこれを用いたジェノタイピングに関して説明し、「<2>出生前」の項目、「<3>出生後」の項目において、それぞれ出生前、出生後の子に関する検査の実施形態について説明する。
【0042】
<1>解析対象群の一塩基多型座位についてのジェノタイピング
従来、親子鑑定に用いられるSNVパネルは個人識別が可能なSNV座位により構成されており、パネルの構築において表現型との関連性や、染色体数異常の検出は考慮されていない。そのため、親子鑑定に用いられるSNVパネルによる解析では、被験者の疾病罹患可能性や体質などの表現型の予測を目的とするDTC遺伝学的検査又は単一遺伝子疾患検査、並びに13番染色体、18番染色体、21番染色体、X染色体及びY染色体などの数的異常の評価を同時に行うことはできない(特許文献1、非特許文献2,3)。
【0043】
また、従来、DTC遺伝学的検査などを行う際には、表現型との関連性が高い(P値が低い)多型座位を含むパネルを用意する。また、単一遺伝子疾患検査においては疾患を直接引き起こす単一遺伝子の変異の有無が分析される。DTC遺伝学的検査及び単一遺伝子疾患検査の目的においては、マイナーアレルの出現頻度に制限は無く、かつ、遺伝的連関性(染色体上における一塩基多型座位の距離)も考慮されていないため、同パネルには著しく出現頻度が低いマイナーアレルに関する多型座位や、染色体上において近接している(遺伝的連関性のある)多型座位が含まれる。その結果、仮に同パネルの分析によりPI(Patenity Index)を算出しても、その総乗として算出されるCPI(Combined Patenity Index)が親子鑑定の判断指標として有効な値を示さないため、親子鑑定を実施することはできない(非特許文献1)。また、DTC遺伝学的検査及び単一遺伝子疾患検査の目的で構築されたパネルは、染色体数異常の評価を目的に設計されていないため、13番染色体、18番染色体、21番染色体、X染色体及びY染色体などの染色体数異常の検出はできない。
【0044】
また、染色体の数的異常をSNVの解析により実施することは知られているが、ここで用いられるSNVパネルは、親子鑑定やDTC遺伝学的検査を目的に構築されていないため、染色体数異常検査と同時に親子鑑定やDTC遺伝学的検査若しくは単一遺伝子疾患検査は実施できない(非特許文献3,5)。
【0045】
このように従来の親子鑑定、DTC遺伝学的検査若しくは単一遺伝子疾患検査及び染色体数異常検査で用いられるパネルは各々の検査の目的に応じて設計されているため、ある検査の目的で取得されたSNVに関するデータを他の検査の目的のために転用することができない。
また、一度の分析により得られたデータに基づき2種以上の検査を行うという発想が無かった。
【0046】
本発明はこのような問題に鑑みて解析の対象とする一塩基多型座位の集合(解析対象群)を設定している。本発明は、以下の(i)~(iii)から選ばれる2種以上の条件を満たす解析対象群について解析を行う。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0047】
なお、本発明は解析対象群の一塩基多型座位について解析を行うが、これには予め設定したパネルに含まれる一塩基多型座位のみに絞ってデータを取得して解析を行うことの他、ゲノムワイドな分析を行い、得られたデータの中から特定の一塩基多型座位の解析を行うことも含まれる。
【0048】
「(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である」という条件を満たす解析対象群についての分析により得られるデータに基づけば、後述する表現型解析工程の実施が可能となる。後述の表現型解析工程を実施する場合には、解析対象群は(i)の条件を満たすことが必要となる。
【0049】
ここで、「表現型との関連性を有することが既知である一塩基多型座位」とは、統計学的、医学的、分子生物学的、その他科学的根拠に基づき、表現型との関連性が知られている一塩基多型座位のことをいう。
【0050】
これまでに見出された一塩基多型座位については、関連する表現型、アレルの出現頻度、マッピング情報などと紐づけられて各種データベースに収録されている。これらデータベースを検索すれば、表現型と関連することが既知である一塩基多型座位とそのアレルの出現頻度などを容易に把握することができる。当該データベースとしては以下のものが例示できる。
dbSNP:https://www.ncbi.nlm.nih.gov/snp/
SNPedia:https://www.snpedia.com/
【0051】
表現型との関連性を定量的に示す統計値としてP値が知られている。P値とは、GWASによって特定された変異と表現型との関連性を示す統計値であり、数値が低いほど関連性が強いことを示す。P値は、特定のアレルを持つ個人の表現型のオッズと同じアレルを持たない個人の表現型のオッズのオッズ比に対してx2検定を適用することで算出することができる。各種データベースにおいて、多くの一塩基多型座位はP値と紐づけられて登録されている。
【0052】
上記(i)の条件を満たす一塩基多型座位として、P値が0.001以下であるものを選択することができる。また、条件(i)を満たす解析対象群に追加する一塩基多型座位のP値は、好ましくは1×10-4以下、より好ましくは1×10-5以下、さらに好ましくは1×10-6以下、さらに好ましくは1×10-7以下、さらに好ましくは1×10-8以下に設定しても構わない。
【0053】
また、比較的に表現型との関連性が低い(P値が高い)、同一の表現型に関与する複数の一塩基多型座位を分析し、後述の表現型解析工程においてポリジェニックリスクスコア(Polygenic risk score)として同時に評価することもできる。
【0054】
なおP値が示されておらずとも、学術論文などの報告により表現型との関連性を示すことが知られている一塩基多型座位も、上記(i)の条件を満たす一塩基多型座位として選択することができる。
【0055】
表現型解析工程を実施しようとする場合、解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合は、10%以上、より好ましくは14%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0056】
「(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である」という条件を満たす解析対象群の分析により得られるデータに基づけば、後述する親子鑑定工程の実施が可能となる。後述の親子鑑定工程を実施する場合には、解析対象群は(ii)の条件を満たすことが必要となる。
【0057】
(ii)の条件においては、一塩基多型座位のマイナーアレルの出現頻度は1%~50%である。必要に応じて上記(ii)の条件を満たす解析対象群に含まれる一塩基多型座位のマイナーアレルの出現頻度は、好ましくは5%以上、より好ましくは10%以上、さらに好ましくは20%以上、さらに好ましくは30%以上に設定しても構わない。解析対象群に含まれる一塩基多型座位のマイナーアレルの出現頻度を高く設定するほど、親子鑑定のために有効なCPI又はCMIを得るために必要な一塩基多型の数を減らすことができる。
【0058】
同一の染色体上において互いに座位が近い複数の一塩基多型座位におけるアレルは、減数分裂における相同組み換え時に一組のセット(ハプロタイプ)として配偶子に受け継がれる可能性が高い。PI計算に基づく親子鑑定工程の精度を向上させる観点から、解析対象群に含まれる一塩基多型座位は互いに遺伝的連関を示さないことが好ましい。
そのため(ii)の条件は、マイナーアレルの出現頻度が1%~50%であることに加え、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位を一定数含むことを求めている。
【0059】
解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合は、好ましくは10%以上、より好ましくは14%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0060】
「(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である」という条件を満たす解析対象群を用いた分析により得られるデータに基づけば、後述する染色体数異常評価のための指標算出工程の実施が可能となる。後述の染色体数異常評価のための指標算出工程を実施する場合には、解析対象群は(iii)の条件を満たすことが必要となる。
【0061】
解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合は、好ましくは10%以上、より好ましくは14%以上、さらに好ましくは14.7%以上である。
上に挙げた染色体以外の染色体の数的異常は重篤な発生異常を引き起こし、胎生致死をもたらす。13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の割合が一定数以上になるように解析対象群を設計することで、21トリソミー(ダウン症候群)、18トリソミー(エドワード症候群)、13トリソミー(パトウ症候群)などの常染色体のトリソミー、XXY(クラインフェルター症候群)、XYY(ヤコブ症候群)などの性染色体の数的異常を効果的に検査することが可能となる。
【0062】
解析対象群が満たす条件ごとに可能となる実施形態を以下にまとめる。
(i)~(iii)の全ての条件を満たす解析対象群を解析する場合
表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程を実施する実施形態I
(i)及び(ii)の条件を満たす解析対象群を解析する場合
・表現型解析工程と親子鑑定工程を実施する実施形態II
(i)及び(iii)の条件を満たす解析対象群を解析する場合
・表現型解析工程と染色体数異常評価のための指標算出工程を実施する実施形態III
(ii)及び(iii)の条件を満たす解析対象群を解析する場合
・親子鑑定工程と染色体数異常評価のための指標算出工程を実施する実施形態IV
【0063】
実施形態Iは後述の実施例1及び実施例5を包括する。
実施形態IIは後述の実施例2及び実施例6を包括する。
実施形態IIIは後述の実施例3及び実施例7を包括する。
実施形態IVは後述の実施例4及び実施例8を包括する。
【0064】
実施形態Iを採用する場合、解析対象群は、上記(i)~上記(iii)の条件を全て満たす。さらに好ましい実施形態では、解析対象群は、表現型との関連性を有することが既知であり、マイナーアレルの出現頻度が1%~50%であり、染色体上において20kb以上の距離をもって互いに離れており、かつ、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位を含んでいてもよい。
解析対象群を構成する一塩基多型座位の総数に対する、これら条件を満たす一塩基多型座位の占める割合は、好ましくは10%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0065】
実施形態IIを採用する場合、解析対象群は、上記(i)及び(ii)の条件を満たす。さらに好ましい実施形態では、解析対象群は、表現型との関連性を有することが既知であり、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位を含んでいてもよい。
解析対象群を構成する一塩基多型座位の総数に対する、これら条件を満たす一塩基多型座位の占める割合は、好ましくは10%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0066】
実施形態IIIを採用する場合、解析対象群は、上記(i)及び(iii)の条件を満たす。さらに好ましい実施形態では、解析対象群は、表現型との関連性を有することが既知であり、かつ、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位を含んでいてもよい。
解析対象群を構成する一塩基多型座位の総数に対する、これら条件を満たす一塩基多型座位の占める割合は、好ましくは10%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0067】
実施形態IVを採用する場合、解析対象群は、上記(ii)及び(iii)の条件を満たす。さらに好ましい実施形態では、解析対象群は、マイナーアレルの出現頻度が1%~50%であり、染色体上において20kb以上の距離をもって互いに離れており、かつ、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位を含んでいてもよい。
解析対象群を構成する一塩基多型座位の総数に対する、これら条件を満たす一塩基多型座位の占める割合は、好ましくは10%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である。
【0068】
表現型との関連性を有することが既知であり、かつ、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の一覧を本明細書の文末の表9-1~表9-6に例示する。表9-1~表9-6に例示した一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合は10%以上(71.2%)である。ただし、本発明は表9-1~表9-6に例示する一塩基多型座位を含む解析対象群を利用する形態に限定されない。
なお、表9-1~表9-6の「P-VALUE」の項目に「-」と記載されている一塩基多型座位は、表現型との関連性が既知であるもののデータベース上にP値が記載されていないものである。
【0069】
本発明の一実施形態では、表9-1~表9-6に記載された361個の一塩基多型座位から選ばれる一塩基多型座位の占める割合が、好ましくは10%以上、より好ましくは20%以上、より好ましくは30%以上、より好ましくは40%以上、より好ましくは50%以上、より好ましくは60%以上、さらに好ましくは70%以上、さらに好ましくは80%以上、さらに好ましくは90%以上、さらに好ましくは95%以上、さらに好ましくは100%である解析対象群を用意して使用する。ただし、本発明はかかる実施形態に限定されない。
【0070】
本発明は上述した解析対象群の分析により得られたデータに基づきジェノタイピングを行うジェノタイピング工程を含む。具体的には、子の遺伝情報を含む核酸を含有する子核酸サンプルと、父の遺伝情報を含む核酸を含有する父核酸サンプル及び/又は母の遺伝情報を含む核酸を含有する母核酸サンプルを分析する。この分析によって、それぞれのサンプルに含まれる核酸における、解析対象群に含まれる複数の一塩基多型座位におけるアレルの配列情報と、前記一塩基多型座位を含む領域及び/又は当該アレルの相対的又は絶対的な存在量を反映した数値を含むデータを取得し、このデータに基づきジェノタイピングを行う。
【0071】
本明細書において「ジェノタイピング」には、対象の遺伝型を特定する全ての手段が含まれる。「ジェノタイピング」には、対象のゲノムDNAを直接分析する方法の他、対象より取得した循環無細胞核酸サンプルを解析することで、間接的に対象の遺伝型を特定する方法も含まれる。
【0072】
ジェノタイピング工程においては、子核酸サンプルの分析を行う。これに加えて父核酸サンプル及び/又は母核酸サンプル(子の遺伝情報を含む核酸を含有しない)の分析を行ってもよい。
【0073】
「父核酸サンプル」としては、父親の口腔内から採取した口腔内粘膜細胞サンプルなど遺伝子検査において通常使用されるサンプルを制限無く採用できる。
母の遺伝情報を含む核酸を含有し、子の遺伝情報を含む核酸を含有しない「母核酸サンプル」も同様に、母親の口腔内から採取した口腔内粘膜細胞サンプルなど遺伝子検査において通常使用されるサンプルを制限無く採用できる。
【0074】
「子核酸サンプル」については、出生前の子の場合と、出生後の子の場合とでその具体的態様が異なる。
出生前の子の遺伝情報を含む子核酸サンプルとしては、妊娠中の母体血から採取した循環無細胞核酸サンプルが好適に例示できる。循環無細胞核酸サンプルは、母親の遺伝情報を含む核酸とその母親の胎内にいる胎児の遺伝情報を含む核酸が混在したサンプルである。
出生後の子の遺伝情報を含む子核酸サンプルとしては、上述の「父核酸サンプル」、「母核酸サンプル」と同じく、子の口腔内から採取した口腔内粘膜細胞サンプルなど、遺伝子検査において通常使用されるサンプルを制限無く採用できる。
【0075】
核酸サンプルの分析手段としては、多型座位における一塩基置換(SNVs)を区別して検出できる分析方法を制限なく用いることができる。具体的には、塩基配列解析、質量分析、デジタルPCR、SNVマイクロアレイ、リアルタイムPCRなどが挙げられる。
【0076】
塩基配列解析の具体的な手段としては次世代シーケンサー(NGS)が挙げられる。次世代シーケンサーは、クローン的に増幅された分子及び単一核酸分子の大量の並列配列決定を可能にする配列決定方法である。本発明においては、何れのNGSシステムを採用しても構わない。例えばパイロシーケンシング(GS Junior(Roche社)など)、可逆的色素ターミネーターを使用する合成によるシーケンシング(MiSeq(Illumina社)など)、ライゲーションによるシーケンシング(SeqStudio Genetic Analyzer(Thermo Fisher SCIENTIFI
C社)など)、イオン半導体シーケンシング(Ion Proton System(Thermo Fisher SCIENTIFIC社)など)、CMOS(相補型金属酸化膜半導体)チップによるシーケンシング(iSeq 100 System(Illumina社)など)などが挙げられる。
【0077】
既知のリファレンス配列にアライメントされるシーケンスしたリード数を深度(depth)という(カバレッジ(Coverage)ともいう)。カバレッジに関するデータは後述するように染色体数異常の評価のために用いることができる。
また、アンプリコン解析の場合には、アンプリコンの量に関するデータや、一定のゲノム領域のアンプリコンに基づきシーケンスされたリード数の総数などのデータも、染色体数異常の評価のために用いることができる。
これらデータは何れも「一塩基多型座位を含む領域及び/又はアレルの相対的又は絶対的な存在量を反映した数値」に該当する。
【0078】
また、次世代シーケンサーによって読み込んだ配列データを解析し、多型座位における特定の配列(特定のSNVs)を有するアレルのリード数を、当該アレルの存在を示す信号として解釈することができる。
また、次世代シーケンサーに供するライブラリーの調製段階において、核酸分子を個別に識別可能にするバーコード配列(Unique Molecular Identifiers(UMI),Unique Molecular Tag(UMT))を解析対象の核酸断片に連結させた場合、多型座位における特定の配列(特定のSNVs)を有するアレルであることを特定するUMTのカウント数を当該アレルの存在を示す信号として解釈することができる。
【0079】
本発明においては次世代シーケンサーによる分析が好適である。本発明における分析手段として次世代シーケンサーを採用する場合、あらかじめ既知である多型座位を特異的に増幅するターゲットシーケンス法の他、Exon sequenceやGWASなどノンターゲットシーケンスによるDNA塩基配列の解読も採用できる。
ターゲットシーケンスの場合は、ハイブリダイゼーション法とアンプリコンシーケンスによりライブラリーの作成ができる。
ノンターゲットシーケンスを採用する場合、解読した塩基配列から、本発明所定のプロファイルを有する一塩基多型座位を選定し、当該一塩基多型座位に関する質的ないし量的データを取得することができる。
【0080】
デジタルPCRは、1ウェルあたりに核酸分子が1分子入るか、入らないかという程度となるように多数のウェルへサンプルを分配して個別にPCRを行う方法である。ターゲット配列を含むウェルではPCR増幅が進んで蛍光シグナルが検出されるが、ターゲット配列を含まないウェルではPCR増幅が進まず、蛍光シグナルは検出されない。PCR後、各ウェルでシグナル増幅の「ある(+)/なし(-)」を判別し、シグナルの「ある(+)」ウェル数をターゲットのコピー数として算出する。
デジタルPCRにSNVsなどの変異を精度よく判別可能なプローブ(TaqManRプローブやサイクリングプローブなど)を組み合わせれば、特定の配列(特定のSNVs)を有するアレルが増幅されたウェルのみで蛍光が観察される。アレルごとに異なる発光波長を有する蛍光標識プローブを設計すれば、一つの多型座位に存在する異なるアレルを蛍光色によってそれぞれ区別して検出することができる。特定のアレルに対応する蛍光シグナルの「ある(+)」ウェル数を当該アレルの存在を示す信号として解釈することができる。
【0081】
マイクロアレイは、既知の配列を有するDNA、DNA断片、cDNA、オリゴヌクレオチド、RNAまたはRNA断片などの核酸をプローブとして、数百個~数十万個まで配列して固相化させ、プローブに相補的な配列を有する核酸がハイブリダイズした際に、これを蛍光標識により検出する方法である。SNVsタイピングを行うマイクロアレイを特にSNVアレイともいう。一つの座位に複数のアレルが想定される場合、各アレルを別個に固相化することで、これらを区別して検出することが可能となる。特定のアレルが固相化されたポイントにおける蛍光強度を当該アレルの存在を示す信号として解釈することができる。
【0082】
リアルタイムPCRは、PCRによる核酸の増幅量に応じて生じる蛍光を分光蛍光光度計によりリアルタイムでモニターし解析する方法である。リアルタイムPCRにSNVsなどの変異を精度よく判別可能なプローブ(TaqManRプローブやサイクリングプローブなど)を組み合わせることが好ましい。アレルごとに異なる発光波長を有する蛍光標識プローブを設計すれば、一つの多型座位に存在する異なるアレルを蛍光色によってそれぞれ区別して検出することができる。
リアルタイムPCRによりデータセットを得ようとする場合、測定効率を向上させる観点からマルチプレックスPCRを採用することが好ましい。マルチプレックスPCRは、複数組のプライマーを使用し、複数のターゲット配列を一つの反応系中で一度に増幅する方法である。
リアルタイムPCRにおいては、特定のアレルに対応する蛍光シグナルの強度を当該アレルの存在を示す信号として解釈することができる。
【0083】
質量分析は、分子をイオン化し、その質量荷電比(m/z)を測定することによってイオンや分子の質量を測定する分析法である。本来は分子の質量を測定する方法であるが、特定の条件(特定のプライマーを使用してPCRを実施した場合や、特定の制限酵素で核酸分子を切断した場合など)で調製した核酸分子の質量が計測できれば、その質量をデータベースと照合することで、検出された核酸分子の塩基配列を同定することができる。このことから、質量分析はジェノタイピングに広く応用されている。
質量分析においては、特定のアレルを含む塩基配列に特有のm/zにおけるイオン強度を当該アレルの存在を示す信号として解釈することができる。
【0084】
ジェノタイピング工程では、前記解析対象群に含まれるそれぞれの一塩基多型座位におけるアレルの配列情報と、前記一塩基多型座位を含む領域及び/又は当該アレルの相対的又は絶対的な存在量を反映した数値を含むデータを取得する。
ここでいう「アレルの配列情報」は後述する親子鑑定工程及び表現型解析工程にて使用される。
一方の「一塩基多型座位を含む領域及び/又は当該アレルの相対的又は絶対的な存在量を反映した数値」は、核酸サンプル中における一塩基多型座位を含む塩基配列領域を有する核酸又はアレルの相対的又は絶対的な量を反映した数値である。既知のリファレンス配列にアライメントされるシーケンスしたリード数や、アンプリコン解析の場合には、アンプリコンの量に関するデータや、一定のゲノム領域のアンプリコンに基づきシーケンスされたリード数の総数などのデータも、当該数値に包含される。当該数値は後述する染色体数異常評価のための指標算出工程で使用される。
【0085】
本発明のジェノタイピング工程は、以下の具体的な実施形態を包含する。
(a)父核酸サンプルに基づく父親のジェノタイピング
(b)母核酸サンプルに基づく母親のジェノタイピング
(c)出生後の子より採取した子核酸サンプルに基づく子のジェノタイピング
(d)妊娠中の母親より採取した循環無細胞核酸サンプルに基づく、その母親の胎内にいる胎児のジェノタイピング
(e)妊娠中の母親より採取した循環無細胞核酸サンプルに基づく、間接的な母親のジェノタイピング
【0086】
(a)~(c)のジェノタイピングは常法によって適宜なし得る。
なお、子が出生前の場合における「子核酸サンプルに基づくジェノタイピング」には、循環無細胞サンプルに基づく上述の(d)~(f)のジェノタイピングが包含される。以下、それぞれについて説明を加える。
【0087】
(d)妊娠中の母親より採取した循環無細胞核酸サンプルに基づく、その母親の胎内にいる胎児のジェノタイピング
循環無細胞核酸サンプルの分析により得られるデータは、母親由来の主要核酸と胎児由来の副次核酸に起因する信号が混在しているため、そのままでは胎児の遺伝型を特定することができない。したがって、循環無細胞核酸サンプルに基づき胎児のジェノタイピングを行う場合には、まず母親のジェノタイピングにより母親の遺伝型を特定する。そして、循環無細胞核酸サンプルの分析により得られるデータから、母親の遺伝子型の情報を引き算で除外することで、胎児のジェノタイピングを行うことができる。
【0088】
特定の多型座位における互いに異なる2つのアレルのうち、循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記して説明する。胎児のジェノタイピングは、特定の多型座位のアレルに起因する信号強度総和に対する、Bの存在を示す信号の強度の割合(Freq.B)を指標にして、以下の基準で行うことができる。
AAのホモ接合:Freq.B≦規定値1
ABのヘテロ接合:規定値2≦Freq.B≦規定値3
ここで、規定値1~3は、以下の式を満たす範囲内で適宜設定が可能である。
0%≦規定値1≦規定値2≦規定値3≦45%
【0089】
(e)妊娠中の母親より採取した循環無細胞核酸サンプルに基づく、間接的な母親のジェノタイピング
母親の間接的なジェノタイピングは、上述のFreq.Bを指標にして、以下の基準で行うことができる。
AAのホモ接合:Freq.B≦規定値4
ABのヘテロ接合:規定値5≦Freq.B≦50%
ここで、規定値4及び5は、以下の式を満たす範囲内で適宜設定が可能である。
0%≦規定値4≦規定値5<50%
【0090】
なお、母親の間接的なジェノタイピング方法は上述の方法に限定されない。通常、循環無細胞核酸サンプル中には胎児由来の核酸よりも、母親由来の核酸の存在比率が大きいことを利用して、母親の間接的なジェノタイピングを行う方法であれば、すべて本発明の範囲内に含まれる。
【0091】
<2>出生前
以下、子が出生前における本発明の実施形態について詳しく説明する。
子が出生前の場合には、ジェノタイピング工程の後においては、上述の(a)、(b)、(d)、(e)のジェノタイピングを行い得る。なお、特段の言及が無い場合には、「母親のジェノタイピング」には、(b)の直接的な母親のジェノタイピングと(e)の間接的な母親のジェノタイピングを包含するものとする。
【0092】
なお、子が出生前の場合には、循環無細胞核酸サンプルの分析に基づくジェノタイピングを行うことになるが、分析により得られる信号強度及び/又は割合に閾値を設け、その閾値を超えた信号のみを有効なものとして扱うこともできる。
【0093】
特定の多型座位における互いに異なる2つのアレルのうち、循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記して説明する。
この場合、Bの信号強度が予め定めた閾値以上であった場合にのみ、有効な信号であると扱ってもよい。例えば、分析手段が次世代シーケンサーであった場合には、その閾値として、好ましくは5アンプリコン以上、より好ましくは15アンプリコン以上、さらに好ましくは25アンプリコン以上を設定することができる。
【0094】
また、特定の多型座位のアレルに起因する信号強度総和に対する、Bの存在を示す信号の強度の割合に閾値を設け、前記割合が閾値以上であった場合にのみ、有効な信号であると扱ってもよい。この割合の閾値は、例えば0.1%以上、好ましくは0.5%以上、より好ましくは1%以上に設定することができる。
【0095】
子が出生前の場合、ジェノタイピング工程後に取り得る工程は、表現型解析工程、親子鑑定工程、染色体数異常評価のための指標算出工程である。
まず、これらの工程を個別に説明した後、さらに具体的な実施形態について説明する。
【0096】
<2-1>表現型解析工程(出生前)
出生前における表現型解析工程は、ジェノタイピング工程の結果に基づいて、胎児、父及び母から選ばれる1人又は2人以上において、前記一塩基多型座位におけるマイナーアレルに関与する表現型が発現する可能性を解析する工程である。いわゆるDTC検査において実施される遺伝型に基づく表現型の発現可能性解析や、単一遺伝子疾患の検査が、本発明の表現型解析工程に該当する。
表現型解析工程を実施する場合には、上記(i)の条件を満たす解析対象群に含まれる一塩基多型座位を解析する。
【0097】
GWASによって蓄積された遺伝型と表現型の関連性は、GWASカタログ(https:// www.ebi.ac.uk/gwas/home)などのデータベースに収録されている。ジェノタイピング工程において分析した一塩基多型座位においてマイナーアレルが検出された場合、データベースにその一塩基多型のIDを入力することで、これと関連する表現型を検索することができる。
【0098】
マイナーアレルに関与する表現型が発現する可能性は、分析によって検出された当該マイナーアレルのP値、同一の表現型に関連するマイナーアレルの数量、連鎖不均衡などを考慮して、評価することができる。
【0099】
また、父又は母がリスクアレルを保有し、かつ、当該リスクアレルに関連する表現型が発現しており、当該リスクアレルが胎児にも受け継がれている場合には、当該胎児においても当該リスクアレルに関連する表現型が発現する可能性がより高いものと推測することができる。
なお、父が生物学的父か不明である場合には、親子鑑定工程によって擬父と胎児の親子関係を確定した後に、表現型解析工程を実施することで、上述の有利な効果を得ることができる。
【0100】
表現型解析工程における解析対象は、子、父及び母から選ばれる1人又は2人以上である。好ましい実施形態では、子と父及び/又は母の2人以上の解析を行う。
【0101】
<2-2>親子鑑定工程(出生前)
出生前の親子鑑定工程は、父と母親の胎内にいる胎児との親子関係を判定する工程である。親子鑑定工程を実施する場合には、上記(ii)の条件を満たす解析対象群に含まれる一塩基多型座位を解析する。以下、親子鑑定の説明において、鑑定当事者である父を特に「擬父」と呼ぶことがある。
【0102】
親子鑑定にあたっては、擬父と胎児のジェノタイピング結果に基づいて各一塩基多型座位について父性指数(Patenity Index,PI)を求める。
より具体的には、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位について、それぞれPIを求める。
【0103】
父性指数の求め方は特に限定されず、いかなる方法を採用してもよい。
NIPPTの方法としては、例えば特許文献1に記載の方法、非特許文献2に記載の方法、非特許文献3に記載の方法など、公知の何れの方法を採用してもよい。
公知の方法以外にも例えば以下に説明する方法を採用してもよい。
【0104】
まず、擬父と胎児のジェノタイピング結果に基づいてPIを計算する方法について説明する。本実施形態においては、母親のジェノタイピングは不要であり、擬父と胎児のジェノタイピング結果に基づく親子鑑定を行う。
本実施形態の場合、例えば、以下の表1又は表2に従ってPIを求めることができる。
【0105】
【0106】
【0107】
表1及び表2では循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記している。
表1及び表2中のk0は偽陰性率(false negative rate)であり、kbは擬陽性率(False positive rate)であり、aはAの出現頻度であり、bはBの出現頻度である。
【0108】
偽陰性率は、真の遺伝型がABのヘテロ接合であるにも関わらず、有効なアレルBの信号が検出されなかったことでAAのホモであると判定される確率である。偽陰性率は、分析手法の種類・測定条件によって変動する値であり、事前に検定によって特定することができる。特定次世代シーケンサーの場合、各プラットフォームにおいて0.002~0.13程度の偽陰性率が報告されている(非特許文献4)。
【0109】
偽陽性率は、真の遺伝型がAAのホモ接合であるにも関わらず、アレルBの信号が誤って検出されたことでABのヘテロであると判定される確率である。偽陽性率は、分析手法の種類・測定条件によって変動する値であり、事前に検定によって特定することができる。
【0110】
次に母親、擬父及び胎児のジェノタイピング結果に基づいてPIを計算する方法について説明する。本実施形態は、母親のジェノタイピング結果を考慮するため、より精度の高い鑑定が可能となる。
本実施形態の場合、例えば、以下の表3又は表4に従ってPIを求めることができる。
【0111】
【0112】
【0113】
表3及び表4でも循環無細胞核酸サンプルの分析において相対的に信号強度が大きいアレルをA、相対的に信号強度が小さいアレルをBと表記している。
表3及び表4中のk0は偽陰性率(false negative rate)であり、kbは擬陽性率(False positive rate)であり、aはAの出現頻度であり、bはBの出現頻度である。
【0114】
なお、母親のジェノタイピングは、(b)の直接的な母親のジェノタイピングと(e)の間接的な母親のジェノタイピングのどちらでもよい。精度向上の観点から(b)を採用することが好ましい。
【0115】
なお、表1~表4においてはAとBの2つのアレルに基づきPIの計算を行っているが、一塩基多型座位はバイアレリック(bi-allelic)な座位に限定されず、トリアレリック(tri-allelic)、テトラアレリック(tetra-allelic)な座位であってもよい。なお、判定を簡素にするために、バイアレリック(bi-allelic)な座位のみをPI算出のために選定しても構わない。
【0116】
上述の何れかの方法で各一塩基多型座位についてPIを求めた後、総合父性指数(Combined Patenity Index,CPI)を求めてもよい。CPIはPIの総乗として求められる。CPIが基準値を超えた場合に胎児と擬父の親子関係を肯定する実施形態とすることができる。
親子関係を肯定するCPIの基準値としては、好ましくは100以上、より好ましくは1,000以上、より好ましくは5,000以上、さらに好ましくは10,000以上である。
【0117】
なお、マイナーアレルの出現頻度が極端に低い一塩基多型座位の解析対象群について解析しても、各PIが軒並み低い値を示すこととなる。そのため、親子鑑定に有効といえる十分なCPIを得ることができない。また、遺伝的連関性(染色体上における一塩基多型座位の距離)を有し、染色体上において近接している多型座位のPIを算出しても、親子鑑定の判断指標として有効な値を示さないため、親子鑑定を実施することはできない。上記(ii)の条件を満たす解析対象群に含まれる一塩基多型座位は、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れているため、有効なCPIを得るのに適している。
【0118】
CPIを算出した後、父権肯定確率(Probaility of Patenity,POP)を求めてもよい。POPは以下の計算式により算出することができる。
【数1】
【0119】
<2-3>染色体数異常評価のための指標算出工程(出生前)
出生前における染色体数異常評価のための指標算出工程は、循環無細胞核酸サンプルの分析によって得られたデータに含まれる、一塩基多型座位を含む領域及び/又はアレルの相対的又は絶対的な存在量を反映した数値に基づき、対象者における、13番染色体、18番染色体、21番染色体、X染色体及びY染色体の数的異常の有無を評価する工程である。本工程では、染色体の数的異常の有無を評価することができる。具体的には、21トリソミー(ダウン症候群)、18トリソミー(エドワード症候群)、13トリソミー(パトウ症候群)などのトリソミー、クラインフェルター症候群(47,XXY)、ヤコブ症候群(XYY症候群)や、非常に稀であるがテトラソミーの有無を評価することができる。
【0120】
染色体数異常評価のための指標算出工程を実施する場合には、上記(iii)の条件を満たす解析対象群について解析する。
【0121】
本工程における評価対象者は、胎児、父及び母から選ばれる1人又は2人以上である。
胎児を評価対象とする場合には、循環無細胞核酸サンプルが被験対象サンプルとなる。父を評価対象とする場合には父核酸サンプル、母を評価対象とする場合には母核酸サンプルが被験対象サンプルとなる。
【0122】
染色体数異常評価のための指標算出工程は一塩基多型座位を含む領域及び/又はアレルの相対的又は絶対的な存在量を反映した数値を用いて常法により実施することができる。
次世代シーケンサーにより分析を行う場合には、当該数値として、リード数(シーケンス深度)、アンプリコンの量に関するデータ、一定のゲノム領域のアンプリコンに基づきシーケンスされたリード数の総数などのデータを利用することができる。
以下、染色体数の異常を定量的に評価するための指標算出方法を2通り例示する。なお、説明の簡略化のため「一塩基多型座位を含む領域及び/又はアレルの相対的又は絶対的な存在量を反映した数値」は「本件数値」と呼ぶ。
【0123】
まず、染色体全体に対する対象の染色体の本件数値の割合に基づきZスコアを算出する方法について説明する(詳細は非特許文献5を参照)。本方法においては、以下の式(1)に基づき対象となるN番染色体についてのZスコア(Z
chrN)を算出する。
【数2】
・・・式(1)
【0124】
式(1)において「proportion of chr N」は、被験対象である核酸サンプルを分析したときの全染色体(但し13、18及び21番染色体を除く)の本件数値に対する、N番染色体の本件数値の割合である。
「mean of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体に対するN番染色体の本件数値の割合の平均である。
「SD of proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときの全染色体に対するN番染色体の本件数値の割合の標準偏差である。
【0125】
被験対象である核酸サンプルにおける対象染色体に関するZスコアが、正常な染色体数(ダイソミー)を含む標準サンプルを分析したときの対象染色体に関するZスコアと乖離しているときに、染色体数異常があると判断することができる。
【0126】
次に21番、18番、13番、X、Y染色体など染色体ごとの参照染色体に対するnormalized chromosome value(NCV)を求める方法について説明する(詳細は非特許文献6を参照)。参照とするM番染色体に対する対象のN番染色体に関するNCV(NCV
chrN by chrM)は以下の式(2)で求めることができる。
【数3】
・・・式(2)
【0127】
式(2)において、「Normalized proportion of chr N by chr M」は、被験対象である核酸サンプルを分析した際のM番染色体に関する本件数値に対する、N番染色体に関する本件数値の割合である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体に対するN番染色体の本件数値の割合の平均である。
「mean normalized proportion of chr N in reference disomic population」は、正常な染色体数(ダイソミー)を含む複数の標準サンプルを分析したときのM番染色体に対するN番染色体の本件数値の割合の標準偏差である。
【0128】
実際の試験において、対象とするN番染色体のNCVを算出するために、M番染色体として具体的にいずれの染色体を参照するかについては、予備試験を行うことで決定する。すなわち、正常な染色体数(ダイソミー)を含む標準サンプルと、N番染色体の数的異常のある標準サンプルを分析して、M番染色体として1番染色体から22番染色体を選択したときのNCVchrN by chrMをそれぞれ算出する。このときダイソミーの標準サンプルと数的異常のある標準サンプルとの間で、最もNCVスコアの差が大きかったNとMの組み合わせに係るNCVchrN
by chrMの式を試験のために採用する。
【0129】
子が出生前の場合に取り得る本発明の実施形態として以下のものが挙げられる。
(i)~(iii)の条件を満たす解析対象群を解析する形態
・表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程を実施する実施形態(実施例1)
(i)及び(ii)の条件を満たす解析対象群を解析する形態
・表現型解析工程と親子鑑定工程を実施する実施形態(実施例2)
(i)及び(iii)の条件を満たす解析対象群を解析する形態
・表現型解析工程と染色体数異常評価のための指標算出工程を実施する実施形態(実施例3)
(ii)及び(iii)の条件を満たす解析対象群を解析する形態
・親子鑑定工程と染色体数異常評価のための指標算出工程を実施する実施形態(実施例4)
以下、子が出生前の場合に採りうる実施例1~4について詳しく説明する。
【0130】
<2-4>実施例1(出生前における表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程の組み合わせ)
実施例1は、ジェノタイピング工程に加え、親子鑑定工程、染色体数異常評価のための指標算出工程及び表現型解析工程の3種の検査工程を備える実施形態である。
【0131】
実施例1においては、以下の(i)~(iii)の条件を全て満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0132】
(i)~(iii)の条件を全て満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程の3種の検査工程のいずれにも利用できるデータを取得することができる。
【0133】
次いで、この解析対象群に含まれるそれぞれの一塩基多型座位について、少なくとも、擬父の遺伝情報を含む核酸を含有する父核酸サンプルと循環無細胞核酸サンプルを分析するジェノタイピング工程を実施する。
【0134】
ジェノタイピング工程においては、擬父のジェノタイピング(上述の(a)のジェノタイピング)と、胎児のジェノタイピングを行う(上述の(d)のジェノタイピング)。実施例1においては、さらに母親のジェノタイピング(上述の(b)及び/又は(e)のジェノタイピング)を行っても良い。
【0135】
ジェノタイピング工程において、父核酸サンプルと循環無細胞核酸サンプルのみの分析に基づいて、(a)の擬父のジェノタイピングと、(d)胎児のジェノタイピングのみを行い、母親のジェノタイピングを行わない実施形態とすることができる。かかる実施形態は、簡便に親子鑑定工程を実施できる点で優れる。
【0136】
ジェノタイピング工程において、父核酸サンプル、母核酸サンプル及び循環無細胞核酸サンプルの分析に基づく、(a)の擬父のジェノタイピングと、(d)胎児のジェノタイピングと、(b)の母親のジェノタイピングを行う実施形態とすることができる。かかる実施形態は、母親のジェノタイピングを行うことによる親子鑑定工程の精度向上が望める。
【0137】
実施例1においては、ジェノタイピング工程の結果に基づき、擬父と胎児の親子関係の存否を鑑定する親子鑑定工程と表現型解析工程を実施する。また、核酸サンプルの分析によって得られたデータに基づき、染色体数異常評価のための指標算出工程を実施する。
【0138】
なお、特段の説明がない限り、本明細書において「親子関係」とは生物学的な親子関係のことをいう。
【0139】
<2-5>実施例2(出生前における表現型解析工程と親子鑑定工程の組み合わせ)
実施例2は、表現型解析工程と親子鑑定工程を備える実施形態である。親子鑑定を実施することで、表現型解析工程の精度向上効果を得ることができる。
【0140】
実施例2においては、以下の(i)及び(ii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
【0141】
上記条件を満たす解析対象群に対して行われるジェノタイピングの実施態様については、実施例1の説明をそのまま適用することができる。
【0142】
実施例2における解析対象群は、(i)及び(ii)の条件を満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程及び親子鑑定工程の2種の検査工程のいずれにも利用できるデータを取得することができる。
【0143】
実施例2においては、ジェノタイピング工程の結果に基づき、擬父と胎児の親子関係の存否を鑑定する親子鑑定工程と表現型解析工程を実施する。
【0144】
なお、実施例1と実施例2では、親子鑑定工程において、擬父と胎児の親子関係が肯定された場合に表現型解析工程を実施し、親子関係が否定された場合には表現型解析工程を実施しない形態としてもよい。
もちろん親子鑑定工程の結果に関わらず表現型解析工程の実施は可能である。
【0145】
本実施形態においては、一度のサンプル分析によって得られたデータに基づき、非侵襲的出生前親子鑑定と表現型解析を行うことができる。本実施形態においては、親子鑑定工程で胎児と父の親子関係を確定させることによって、表現型解析工程において父と母の何れに由来するマイナーアレルが胎児に引き継がれているのか判別することが可能となる。
これにより、父又は母がリスクアレルを保有し、当該リスクアレルが胎児にも受け継がれている場合には、当該胎児においても当該リスクアレルに関連する表現型が発現する可能性がより高いものと推測することができる。
【0146】
また、父又は母がリスクアレルを保有し、かつ、当該リスクアレルに関連する表現型が発現しており、当該リスクアレルが胎児にも受け継がれている場合には、当該胎児においても当該リスクアレルに関連する表現型が発現する可能性がより高いものと推測することができる。
親子鑑定工程によって擬父と胎児の親子関係を確認し、表現型解析工程を実施することで、上述の有利な効果を得ることができる。
【0147】
出生前の胎児の遺伝型は、微量の胎児由来核酸を含む循環無細胞核酸に基づき決定されるため、ジェノタイピング工程にて胎児がリスクアレルを有すると判定されたとしても、その判定は不確定要素を含むものといえる。
実施例1と実施例2は親子鑑定工程を備えることから、この問題を解消し、表現型解析工程の精度を向上させることができる。
【0148】
具体的には、実施例1と実施例2においては、親子鑑定工程によって親子関係が確定できた場合、以下のような判断基準で胎児がリスクアレルを保有している可能性をより正確に判定することができ、表現型解析工程の精度を向上させることができる。
【0149】
(基準)
1)片側の親がリスクアレルをホモ接合として保有している場合:胎児は100%リスクアレルを保有するものと判断する。
2)片側の親がリスクアレルをヘテロ接合として保有している場合:胎児がリスクアレルを保有する可能性がより高いものと判断する。
3)両親がそれぞれリスクアレルをヘテロ接合として保有している場合:胎児がリスクアレルを保有する可能性が、前記2)よりも高いものと判断する。
【0150】
より具体的な適用ケースについて説明する。循環無細胞核酸サンプルの分析によって胎児由来のリスクアレルの存在を示唆する信号が得られた場合に推測できる、胎児がリスクアレルを保有している確率をP1(%)と仮定する。そして、以下の基準に当てはまる場合にP1(%)を修正して、胎児がリスクアレルを保有している確率はP2(%)であると評価する。
【0151】
(基準)
1)片側の親がリスクアレルをホモ接合として保有している場合:
P2=100%
2)片側の親がリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.5)
(P2はP1に対して1.5倍増)
3)両親がそれぞれリスクアレルをヘテロ接合として保有している場合:
P2=P1+(P1×0.75)
(P2はP1に対して1.75倍増)
ただし、2)及び3)の式の右辺が100%を超える場合、P2は100%であるとみなす。
【0152】
なお、P1の算出方法は特に限定されない。
例えば、胎児におけるリスクアレルの存在を示唆する信号の信頼性値を特許7121440号に係る方法で算出し、これをP1とみなしても構わない。
また、胎児におけるリスクアレルの存在を示唆する信号が検出された場合に、予め定められた一定の確率をP1として一律に付与する形態としても構わない。
【0153】
<2-6>実施例3(出生前における染色体数異常評価のための指標算出工程と表現型解析工程の組み合わせ)
実施例3は、ジェノタイピング工程に加え、染色体数異常評価のための指標算出工程と表現型解析工程の両方を備える実施形態である。実施例3によれば一度のサンプル分析によって得られたデータに基づき、染色体数異常評価のための指標算出工程と表現型解析工程の2種の検査工程を一度に実施できるという有利な効果を奏する。
【0154】
実施例3においては、以下の(i)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0155】
(i)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程及び染色体数異常評価のための指標算出工程のいずれにも利用できるデータを取得することができる。これにより、実施例3は、染色体数異常評価のための指標算出工程と表現型解析工程の両方を実行することを可能とする。
【0156】
実施例3では、検査対象者のゲノムDNA又は循環無細胞核酸(cfDNA)を用いて検査対象者のジェノタイピングを行い、表現型解析を行う。
【0157】
染色体数異常評価のための指標算出工程及び表現型解析工程の2つの工程を両方実行することにより、マイナーアレルに関連する表現型の発現可能性を染色体の数的異常を考慮して、より精度よく判別することができる。
【0158】
ある座位における正常なアレルAとリスクアレルBを想定する。リスクアレルBが機能阻害変異や優性阻害変異に該当する場合、正常に1対の染色体を備え、かつ、(A,B)のヘテロ接合であるときに比べて、染色体の数的異常(トリソミー)を有し、かつ、(A,B,B)の組み合わせでアレルを保有するとき、リスクアレルBによりもたらされる疾患の重篤度が高まる可能性が考えられる。
染色体数異常評価のための指標算出工程及び表現型解析工程の2つの工程を両方実行することにより、上述したような可能性の評価が可能となる。
【0159】
なお、実施例3における染色体数異常評価のための指標算出工程と表現型解析工程の具体的実施形態は上の説明をそのまま適用することができる。
【0160】
<2-7>実施例4(出生前における親子鑑定工程と染色体数異常評価のための指標算出工程の組み合わせ)
実施例4は、ジェノタイピング工程に加え、親子鑑定工程及び染色体数異常評価のための指標算出工程を備える実施形態である。実施例4によれば一度のサンプル分析によって得られたデータに基づき、親子鑑定と染色体数異常の評価が可能となる。
【0161】
実施例4においては、以下の(ii)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0162】
当該解析対象群についての分析によって、親子鑑定工程及び染色体数異常評価のための指標算出工程の何れにも利用できるデータを取得することができる。これにより、実施例4は、親子鑑定工程と染色体数異常評価のための指標算出工程の両方を実行することを可能とする。
【0163】
なお、親子鑑定工程を実施した結果、親子関係が確定した場合には、染色体数異常評価のための指標算出工程による評価の精度向上が図れる。
例えば、ある一塩基多型座位において、父親と母親のそれぞれにおいて互いに異型のアレルを保有している場合を想定する(母親AA、父親BB)。胎児と父親の生物学的な親子関係が確定した場合、当該一塩基多型座位における胎児の遺伝型はABのヘテロであることが確定する。つまり、循環無細胞核酸サンプルを分析したときに得られる、アレルBの存在を示唆する信号により胎児核酸を特定することができ、胎児核酸の含有量を正確に評価することが可能となる。これにより、染色体数異常評価の精度を向上することができる。
かかる効果は、実施例4だけでなく実施例1を採用する場合にも得られる。
【0164】
実施例4におけるジェノタイピング工程の実施形態は、実施例1の説明をそのまま準用することができる。また、実施例4における親子鑑定工程と染色体数異常評価のための指標算出工程の具体的実施形態は上の説明をそのまま適用することができる。
【0165】
<3>出生後
以下、子の出生後における本発明の実施形態について詳しく説明する。
子が出生後の場合には、ジェノタイピング工程においては、上述の(a)~(c)のジェノタイピングを行い得る。
【0166】
子が出生後の場合も、ジェノタイピング工程後に取り得る工程は、親子鑑定工程、染色体数異常評価のための指標算出工程、表現型解析工程である。
まず、これらの工程を個別に説明した後、さらに具体的な実施形態について説明する。
【0167】
<3-1>表現型解析工程(出生後)
子の出生後の表現型解析工程について説明する。表現型解析工程は、ジェノタイピング工程の結果に基づいて、出生後の子、父及び母から選ばれる1人又は2人以上において、前記一塩基多型座位におけるマイナーアレルに関与する前記表現型が発現する可能性を評価する工程である。
表現型解析工程を実施する場合には、上記(i)の条件を満たす解析対象群を解析する。
【0168】
ジェノタイピング工程において分析した一塩基多型座位においてマイナーアレルが検出された場合、GWASのデータが蓄積されているデータベースにその一塩基多型のIDを入力することで、これと関連する表現型を検索する。マイナーアレルに関与する表現型が発現する可能性は、分析によって検出された当該マイナーアレルのP値、同一の表現型に関連するマイナーアレルの数量、連鎖不均衡などを考慮して、評価することができる。
【0169】
<3-2>親子鑑定工程(出生後)
出生後の親子鑑定工程は、ジェノタイピング工程の結果に基づき擬父と子の親子関係の存否及び/又は擬母と子の親子関係の存否を鑑定する工程である。親子鑑定工程を実施する場合には、上記(ii)の条件を満たす解析対象群を解析する。
より具体的には、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位について、それぞれPI又はMIを求める。
【0170】
親子鑑定工程の具体的な実施形態は特に限定されない。公知のいずれの鑑定方法をも採用し得る。以下、父子鑑定を行う形態と、母子鑑定を行う形態について説明する。
【0171】
まず、父子鑑定を行う形態のうち、擬父と子のジェノタイピングの結果に基づき親子鑑定を行う形態について説明する。本実施形態においては、母親のジェノタイピングは不要であり、擬父と子のジェノタイピング結果に基づく親子鑑定を行う。
本実施形態の場合、例えば、以下の表5に従ってPIを求めることができる。
【0172】
【0173】
表5中、μは突然変異率であり、a及びbはそれぞれアレルAとアレルBの出願頻度を示す。また、βはアレルBの平均除外力(Mean Power of Exclusion値)である。
【0174】
次に父子鑑定を行う形態のうち、母親と擬父と子のジェノタイピングの結果に基づき親子鑑定を行う形態について説明する。本実施形態の場合、例えば、以下の表6に従ってPIを求めることができる。
【0175】
【0176】
表6中、μは突然変異率であり、a及びbはそれぞれアレルAとアレルBの出願頻度を示す。また、αはアレルAの平均除外力であり、βはアレルBの平均除外力である。
【0177】
なお、表5及び表6においてはAとBの2つのアレルに基づきPIの計算を行っているが、一塩基多型座位はバイアレリック(bi-allelic)な座位に限定されず、トリアレリック(tri-allelic)、テトラアレリック(tetra-allelic)な座位であってもよい。なお、判定を簡素にするために、バイアレリック(bi-allelic)な座位のみをPI算出のために選定しても構わない。
【0178】
上述の何れかの方法で各一塩基多型座位についてPIを求めた後、総合父性指数(Combined Patenity Index,CPI)を求めてもよい。CPIはPIの総乗として求められる。CPIが基準値を超えた場合に胎児と擬父の親子関係を肯定する実施形態とすることができる。
親子関係を肯定するCPIの基準値としては、好ましくは100以上、より好ましくは1,000以上、より好ましくは5,000以上、さらに好ましくは10,000以上である。
【0179】
擬父と子のジェノタイピングに基づき表5の計算式でPIを算出し、これによってCPIを求める実施形態とする場合には、分析の基礎とする解析対象群に含まれる前記所定の一塩基多型座位の数は、好ましくは20以上、より好ましくは30以上、さらに好ましくは40以上、さらに好ましくは50以上、さらに好ましくは60以上である。
解析対象群に含まれる前記所定の一塩基多型座位の数を上述の範囲とすることによって、親子鑑定を肯定するのに十分なCPIを得ることができる。
また、より確実に親子鑑定を肯定するのに十分なCPIを得る観点では、分析の基礎とする解析対象群に含まれる前記所定の一塩基多型座位の数は、好ましくは200以上、より好ましくは250以上、さらに好ましくは550以上としてもよい。
【0180】
母親と擬父と子のジェノタイピングに基づき表6の計算式でPIを算出し、これによってCPIを求める実施形態とする場合には、分析の基礎とする解析対象群に含まれる前記所定の一塩基多型座位の数は、好ましくは20以上、より好ましくは30以上、さらに好ましくは40以上、さらに好ましくは50以上である。
解析対象群に含まれる前記所定の一塩基多型座位の数を上述の範囲とすることによって、親子鑑定を肯定するのに十分なCPIを得ることができる。
また、より確実に親子鑑定を肯定するのに十分なCPIを得る観点では、分析の基礎とする解析対象群に含まれる前記所定の一塩基多型座位の数は、好ましくは60以上、より好ましくは100以上、さらに好ましくは200以上としてもよい。
【0181】
なお、マイナーアレルの出現頻度が極端に低い一塩基多型座位の集合を解析しても、各PIが軒並み低い値を示すこととなる。そのため、親子鑑定に有効といえる十分なCPIを得ることができない。本発明で用いる解析対象群に含まれる一塩基多型座位は、マイナーアレルの出現頻度が1%~50%であり、有効なCPIを得るのに適している。
【0182】
CPIを算出した後、父権肯定確率(Probaility of Patenity,POP)を求めてもよい。POPは以下の計算式により算出することができる。
【数1】
【0183】
次に母子鑑定を実行する実施形態について説明する。まず、擬母と子のジェノタイピングの結果に基づき母子鑑定を行う形態について説明する。
本実施形態の場合、例えば、上述の表5に示したPIの計算式に準じて、以下の表7のとおり母性指数(Maternity Index,MI)を計算することができる。
【0184】
【0185】
また、MIを総乗することで母子関係の総合母性指数(Combined Maternity Index,CMI)を計算することができる。さらには、上記のPOP計算式に準じて、母権肯定確率(Probaility of Matenity,POM)を求めることができる。
【0186】
次に父と擬母と子のジェノタイピングの結果に基づき母子鑑定を行う形態について説明する。この場合、父は子の生物学的父であると仮定して、母子鑑定を行う。
この場合のMI計算は、上述の表6の「擬父」を「擬母」に読み替え、かつ、「母」を「父」に読み替えて準用することができる。具体的には表8のとおり計算することができる。
【0187】
【0188】
<3-3>染色体数異常評価のための指標算出工程(出生後)
出生後における染色体異常評価のための指標算出工程は、出生後の子、父及び母から選ばれる1人又は2人以上における、13番染色体、18番染色体、21番染色体、X染色体及びY染色体の数的異常の有無を評価するための指標を算出する工程である。染色体数異常評価のための指標算出工程を実施する場合には、上記(iii)の条件を満たす解析対象群を解析する。
その具体的な実施態様は、基本的に出生前に関する上記「<2-2>」での説明をそのまま適用できる。相違点は、子の染色体数異常の分析に用いるサンプルが、出生前は循環無細胞核酸サンプルであったところ、出生後は子から採取した子核酸サンプルを用いる点である。
【0189】
出生後の子の核酸サンプルを使用して評価するため、仮に子において染色体数異常がある場合には、循環無細胞核酸サンプルを用いる場合に比べて、算出されるZスコア又はNCVに非常にはっきりとした差が生じる。
【0190】
以下、子が出生後の場合に採り得る本発明の実施形態として以下のものが挙げられる。
(i)~(iii)の全ての条件を満たす解析対象群を解析する形態
・表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程を実施する実施形態(実施例5)
(i)及び(ii)の条件を満たす解析対象群を解析する形態
・表現型解析工程と親子鑑定工程を実施する実施形態(実施例6)
(i)及び(iii)の条件を満たす解析対象群を解析する形態
・表現型解析工程と染色体数異常評価のための指標算出工程を実施する実施形態(実施例7)
(ii)及び(iii)の条件を満たす解析対象群を解析する形態
・親子鑑定工程と染色体数異常評価のための指標算出工程を実施する実施形態(実施例8)
以下、子が出生後の場合に採りうる実施例5~8について詳しく説明する。
【0191】
<3-4>実施例5(出生後における表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程の組み合わせ)
実施例5は、ジェノタイピング工程に加え、親子鑑定工程、染色体数異常評価のための指標算出工程及び表現型解析工程の3種の検査工程を備える実施形態である。
【0192】
実施例5においては、以下の(i)~(iii)の条件の全てを満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0193】
(i)~(iii)の条件を全て満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程、親子鑑定工程及び染色体数異常評価のための指標算出工程の3種の検査工程のいずれにも利用できるデータを取得することができる。
【0194】
次いで、この解析対象群に含まれるそれぞれの一塩基多型座位について、少なくとも、擬父の遺伝情報を含む核酸を含有する父核酸サンプルと子核酸サンプルを分析するジェノタイピング工程を実施する。
【0195】
ジェノタイピング工程では上述の(a)~(c)のジェノタイピングを行う得る。具体的な実施形態とその説明は以下のとおりである。
・(a)擬父と(c)子のジェノタイピングを行う形態:親子鑑定工程において表5に基づくPI計算を行うことができる。
・(a)擬父と(b)母と(c)子のジェノタイピングを行う形態:親子鑑定工程において表6に基づくPI計算を行うことができる。
・(b)擬母と(c)子のジェノタイピングを行う形態:親子鑑定工程において表7に基づくMI計算を行うことができる。
・(b)擬母と(a)父と(c)子のジェノタイピングを行う形態:親子鑑定工程において表8に基づくMI計算を行うことができる。
【0196】
実施例5においては、ジェノタイピング工程の結果に基づき、擬父と子の親子関係の存否又は擬母と子の親子関係の存否を鑑定する親子鑑定工程と、表現型解析工程を実施する。また、核酸サンプルの分析によって得られたデータに基づき、染色体数異常評価のための指標算出工程を実施する。
【0197】
<3-5>実施例6(出生後における親子鑑定工程と表現型解析工程の組み合わせ)
実施例6は、親子鑑定工程と表現型解析工程を備える実施形態である。親子鑑定を実施することで、マイナーアレルが父と母の何れに由来するものであるのか確認できるという効果を得ることができる。
【0198】
実施例6においては、以下の(i)及び(ii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
【0199】
上記条件を満たす解析対象群に対して行われるジェノタイピングの実施態様については、実施例5の説明をそのまま適用することができる。
【0200】
実施例6において解析する解析対象群は、(i)及び(ii)の条件を満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程及び親子鑑定工程の2種の検査工程のいずれにも利用できるデータを取得することができる。
【0201】
実施例6においては、ジェノタイピング工程の結果に基づき、擬父と子の親子関係の存否又は擬母と子の親子関係の存否を鑑定する親子鑑定工程と、表現型解析工程を実施する。
【0202】
なお、実施例5と実施例6では、親子鑑定工程において、擬父と子の親子関係の存否又は擬母と子の親子関係が肯定された場合に、表現型解析工程を実施し、親子関係が否定された場合には表現型解析工程を実施しない形態としてもよい。
もちろん親子鑑定工程の結果に関わらず表現型解析工程の実施は可能である。
【0203】
実施例5と実施例6においては、一度のサンプル分析によって得られたデータに基づき、親子鑑定と表現型解析を行うことができる。本実施形態においては、親子鑑定工程によって擬父と子又は擬母と子の親子関係を確定させることによって、表現型解析工程において父と母の何れに由来するリスクアレルが子に引き継がれているのか判別することが可能となる。
【0204】
<3-6>実施例7(出生後における表現型解析工程と染色体数異常評価のための指標算出工程の組み合わせ)
実施例7は、ジェノタイピング工程に加え、染色体数異常評価のための指標算出工程と表現型解析工程の両方を備える実施形態である。実施例7によれば一度のサンプル分析によって得られたデータに基づき、染色体数異常評価のための指標算出工程と表現型解析工程の2種の検査工程を一度に実施できるという有利な効果を奏する。
【0205】
実施例7においては、以下の(i)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(i)解析対象群に含まれる一塩基多型座位の総数に占める、表現型との関連性を有することが既知である一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0206】
(i)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析することで、表現型解析工程及び染色体数異常評価のための指標算出工程のいずれにも利用できるデータを取得することができる。これにより、実施例7は、染色体数異常評価のための指標算出工程と表現型解析工程の両方を実行することを可能とする。
【0207】
実施例7では、検査対象者のゲノムDNAを用いてジェノタイピングを行い、表現型解析を行う。
【0208】
なお、実施例7における染色体数異常評価のための指標算出工程と表現型解析工程の具体的実施形態は上の説明をそのまま適用することができる。
【0209】
<3-7>実施例8(出生後における親子鑑定工程と染色体数異常評価のための指標算出工程の組み合わせ)
実施例8は、ジェノタイピング工程に加え、親子鑑定工程及び染色体数異常評価のための指標算出工程を備える実施形態である。実施例8によれば一度のサンプル分析によって得られたデータに基づき、親子鑑定と染色体数異常の評価が可能となる。
【0210】
実施例8においては、以下の(ii)及び(iii)の条件を満たす一塩基多型座位を含む解析対象群を解析する。
(ii)解析対象群に含まれる一塩基多型座位の総数に占める、マイナーアレルの出現頻度が1%~50%であり、かつ、染色体上において20kb以上の距離をもって互いに離れている一塩基多型座位の数の割合が10%以上である。
(iii)解析対象群に含まれる一塩基多型座位の総数に占める、13番染色体、18番染色体、21番染色体、X染色体及びY染色体に存在する一塩基多型座位の数の割合が10%以上である。
【0211】
当該解析対象群の分析によって、親子鑑定工程及び染色体数異常評価のための指標算出工程の何れにも利用できるデータを取得することができる。これにより、実施例8は、親子鑑定工程と染色体数異常評価のための指標算出工程の両方を実行することを可能とする。
【0212】
実施例8におけるジェノタイピング工程の実施形態は、実施例5の説明をそのまま準用することができる。また、実施例8における親子鑑定工程と染色体数異常評価のための指標算出工程の具体的実施形態は上の説明をそのまま適用することができる。
【実施例0213】
<試験例1>CPIのシミュレーション
親子鑑定に用いるSNVの集合である解析対象群を構成するSNVにおける、マイナーアレルの出現頻度が、CPIに与える影響についてシミュレーションを行った。本試験例では、擬父と子のみのジェノタイピングの結果に基づいて親子鑑定を行う場合を想定する。
【0214】
マイナーアレルの出現頻度が、0.05~0.5の何れかの単一の値をとるSNVにより構成された解析対象群を用いてジェノタイピングを行い、解析対象群に含まれる全てのSNVにおいて、擬父が子の生物学的父親であるとしたときに矛盾の無い遺伝型が観察された場合を想定し、このとき計算されるCPIの値を縦軸、解析対象群に含まれるSNVの数を横軸にプロットした(
図1)
【0215】
図1に示すように、マイナーアレルの出現頻度が0.05であるSNVのみにより構成された解析対象群を用いた場合、解析対象群に含まれるSNVの数が1,000個を超えてもなお、親子関係を肯定し得るのに有効なCPIは算出されなかった(
図1)。
一方、マイナーアレルの出現頻度が0.1以上の単一のSNVのみにより構成された解析対象群を用いた場合、親子関係を肯定するのに十分な値のCPIを算出することができる。そして、マイナーアレルの出現頻度が高くなるにつれて、より少ないSNVの個数でCPIが10,000に達することが実証できた。
【0216】
<試験例2>CPIのシミュレーション
試験例1と同じく親子鑑定に用いる解析対象群を構成するSNVにおける、マイナーアレルの出現頻度が、CPIに与える影響についてシミュレーションを行った。本試験例では、母親と擬父と子のジェノタイピングの結果に基づいて親子鑑定を行う場合を想定する。
【0217】
マイナーアレルの出現頻度が、0.05~0.5の何れかの単一の値をとるSNVにより構成された解析対象群を用いてジェノタイピングを行い、解析対象群に含まれる全てのSNVにおいて、擬父が子の生物学的父親であるとしたときに矛盾の無い遺伝型が観察された場合を想定し、このとき計算されるCPIの値を縦軸、解析対象群に含まれるSNVの数を横軸にプロットした(
図2)
【0218】
図2に示すように、マイナーアレルの出現頻度が0.05であるSNVのみにより構成された解析対象群を用いた場合であっても、親子関係を肯定し得るのに有効なCPIを算出することができた(
図2)。また、マイナーアレルの出現頻度が高くなるにつれて、より少ないSNVの個数でCPIが10,000に達することが実証できた(
図2)。