IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ▲蘇▼州▲貝▼康医▲療▼▲器▼械有限公司の特許一覧

特許7429072核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用
<>
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図1
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図2
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図3
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図4
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図5
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図6
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図7
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図8
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図9
  • 特許-核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-30
(45)【発行日】2024-02-07
(54)【発明の名称】核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用
(51)【国際特許分類】
   C40B 40/06 20060101AFI20240131BHJP
   C12Q 1/6806 20180101ALI20240131BHJP
   C12Q 1/6869 20180101ALI20240131BHJP
   C12N 15/09 20060101ALN20240131BHJP
【FI】
C40B40/06
C12Q1/6806 Z ZNA
C12Q1/6869 Z
C12N15/09 Z
【請求項の数】 8
(21)【出願番号】P 2022564692
(86)(22)【出願日】2021-04-15
(65)【公表番号】
(43)【公表日】2023-03-03
(86)【国際出願番号】 CN2021087503
(87)【国際公開番号】W WO2022077885
(87)【国際公開日】2022-04-21
【審査請求日】2022-06-28
(31)【優先権主張番号】202011094180.6
(32)【優先日】2020-10-14
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】522259348
【氏名又は名称】▲蘇▼州▲貝▼康医▲療▼▲器▼械有限公司
【氏名又は名称原語表記】SUZHOU BASECARE MEDICAL DEVICE CO., LTD.
【住所又は居所原語表記】Unit 101, Building A3, Bio Bay, No. 218 Xinghu Street, Suzhou Industrial Park, Suzhou, Jiangsu, China
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】▲趙▼丁丁
(72)【発明者】
【氏名】▲冒▼燕
(72)【発明者】
【氏名】孔令印
(72)【発明者】
【氏名】梁波
【審査官】馬場 亮人
(56)【参考文献】
【文献】米国特許出願公開第2003/0190634(US,A1)
【文献】BMC Genomics,2013年,14:11,P.1-12
(58)【調査した分野】(Int.Cl.,DB名)
C40B 40/06
C12Q 1/6806
C12Q 1/6869
C12N 15/09
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
標的となるヒトに由来するサンプルからゲノムDNAを取得するステップと、
第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて前記ゲノムDNAを切断して高密度酵素切断産物を得るステップであって、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を生成し、酵素切断断片の両端に2~5ntの付着末端を生成することができ、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIであるステップと、
前記酵素の切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、前記第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含み、前記第1のリンカーの配列は、配列番号1および配列番号2に示され、前記第2のリンカーの配列は、配列番号3および配列番号4に示されているステップと、
前記連結産物から200bp~400bpの断片を選別して取得するステップと、
最後に、前記第1のリンカーと相補可能な上流プライマーと、前記第2のリンカーと相補可能であり、且つbarcode配列を有する下流プライマーとを含むハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得るステップと
を含む、ことを特徴とする核酸ライブラリーの構築方法。
【請求項2】
前記上流プライマーの配列は、配列番号5に示され、前記下流プライマーの配列は、配列番号6に示されている、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
【請求項3】
前記切断するステップにおいて、前記第1のエンドヌクレアーゼと前記第2のエンドヌクレアーゼの体積比が1:(0.8~1.2)である、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
【請求項4】
磁気ビーズ分取の方法を用いて前記連結産物から200bp~400bpの断片を選別して取得する、ことを特徴とする請求項1~3のいずれか一項に記載の核酸ライブラリーの構築方法。
【請求項5】
前記ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAを全ゲノム増幅するステップを含む、ことを特徴とする請求項1~3のいずれか一項に記載の核酸ライブラリーの構築方法。
【請求項6】
前記シーケンシングライブラリーの濃度を測定するステップをさらに含む、ことを特徴とする請求項1~3のいずれか一項に記載の核酸ライブラリーの構築方法。
【請求項7】
請求項1~6のいずれか一項に記載の核酸ライブラリーの構築方法を用いて、胚サンプルおよび前記胚サンプルのうちの少なくとも1種の親のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて前記胚サンプルの染色体を分析するステップを含む、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法。
【請求項8】
前記分析するステップは、具体的に、染色体構造異常の分析、および染色体異数性異常の分析を含む、ことを特徴とする請求項7に記載の移植前胚染色体構造異常分析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学の分野に関し、特に、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用に関する。
【背景技術】
【0002】
簡略化ゲノムシーケンシングとは、種の全ゲノムシーケンシング手法を十分に示すように、制限エンドヌクレアーゼでゲノムDNAを切断し、指定の部分に対してハイスループットシーケンシングを用いて、大量の遺伝多型タグ配列を得る方法である。当該方法は、ゲノムの複雑度を低減させ、実施過程がシンプルで、コストを節約することができるとともに、参照ゲノムに依存することなく、全ゲノムにおける遺伝多型タグを取得することができるため、分子標記の開発、遺伝マップの構築、遺伝子/QTLマッピング、全ゲノム関連分析、集団遺伝分析および分子育種分野に広く適用されている。しかし、既存の簡略化ゲノムシーケンシングは、捕捉可能なSNP数が少ない(一般的に、20万個よりも少ない)と共に、そのライブラリー構築手順が比較的複雑であり、末端修復やdAテール追加などの煩雑なライブラリー構築手順が必要であるか、或いはPippinまたはゲル回収などによりフラグメント分取を行う必要がある。また、そのライブラリー構築方法は、兼用性が低く、ある1つのシーケンシングプラットホームのみに対して展開することができないので、複数種のハイスループットシーケンシングプラットホームを柔軟に兼用することができない。上記原因を総合すると、簡略化ゲノムシーケンシングが生殖補助分野に適用・普及されることは、少ない。
【0003】
胚移植前遺伝学的検査(Preimplantation Genetic Testing、PGT)とは、体外受精した胚を移植する前に、胚の遺伝物質を取り出して分析し、異常があるか否かを判断し、健康な胚を選定して移植することにより、遺伝病の遺伝を防止する方法を指す。現在、PGTの過程において、よく用いられる技術的手段には、蛍光インサイチュハイブリダイゼーション(FISH:Fluorescence In - Situ Hybridization)、SNP全ゲノムマイクロアレイチップ(SNP-array)およびハイスループットシーケンシング(NGS)などが含まれる。ハイスループットシーケンシング技術に基づく検出方法は、体外受精した胚が3~5日発育した際に、8細胞期における卵割球細胞または胚盤胞期(blastocyst)における栄養層細胞を取り出し、単細胞全ゲノム増幅を行ってゲノムDNAを得た後、シーケンシングライブラリーを構築してシーケンシングを行い、シーケンシング結果に基づいて後続の分析を行うものである。
【0004】
しかしながら、胚が遺伝病を保有する情況を取得するために、通常、ライブラリーを構築する際に、遺伝病遺伝子の上流・下流に緊密に連鎖したSNPサイトに対してマルチプライマーを設計して増幅を行う。有効SNPサイトおよびそのシーケンシング深さを確保するためには、多くのデータを取得する必要があるので、検出に時間がかかり、コストが高い。そして、異なる遺伝病に対して、毎回、独立してマルチSNPサイト増幅プライマーを再設計する必要がある。そして、マルチプライマーに対して検証試験および最適化を行う必要がある。実際に胚を検出する前に、家族(夫、妻、および発端者を含む)の事前試験を行う必要があり、事前試験結果に基づいて十分な有効SNPサイトを取得することができる場合のみ、胚サンプルの検出を展開することができる。このような従来方法は、検出周期全体が長すぎ、失敗のリスクが高く、臨床適用および普及に不利である。それと同時に、遺伝病遺伝子の上流・下流における少量のSNPサイトのみを捕獲してシーケンシングすることができることに起因して、相同組み換えによる分析エラーが極めて発生しやすい。
【発明の概要】
【0005】
従って、全ゲノムシーケンシングに必要なデータ量を減少させることができ、SNPに対してマルチプライマーを設計する必要がない核酸ライブラリーの構築方法を提供する必要がある。
【0006】
核酸ライブラリーの構築方法であって、
ターゲットヒトサンプルのゲノムDNAを取得するステップと、
第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて前記ゲノムDNAを切断して高密度酵素切断産物を得るステップであって、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、且つヒトゲノムの消化断片の両端に2~5ntの付着末端を生成することができるものであるステップと、
前記酵素切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、前記第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含むステップと、
前記連結産物から200bp~400bpの断片を選別して取得するステップと、
最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得るステップと
を含む、核酸ライブラリーの構築方法。
【0007】
そのうちの一実施形態において、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIである。
【0008】
そのうちの一実施形態において、前記第1のリンカーの配列は、配列番号1および配列番号2に示され、前記第2のリンカーの配列は、配列番号3および配列番号4に示されている。
【0009】
そのうちの一実施形態において、前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第1のリンカーと相補ペアリング可能な上流プライマーと、前記第2のリンカーと相補ペアリング可能であり、且つbarcode配列を有する下流プライマーと、を含む。
【0010】
そのうちの一実施形態において、前記上流プライマーの配列は、配列番号5に示され、前記下流プライマーの配列は、配列番号6に示されている。
【0011】
そのうちの一実施形態において、前記切断ステップにおいて、前記第1のエンドヌクレアーゼと前記第2のエンドヌクレアーゼの体積比が1:(0.8~1.2)である。
【0012】
そのうちの一実施形態において、磁気ビーズ分取の方法を用いて前記ライゲーション生成物から選別して200bp~400bpの断片を取得する。
【0013】
そのうちの一実施形態において、前記ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAを全ゲノム増幅するステップを含む。
【0014】
そのうちの一実施形態において、前記シーケンシングライブラリーの濃度を測定するステップをさらに含む。
【0015】
本発明は、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法をさらに提供する。当該方法は、上記核酸ライブラリーの構築方法を用いて、胚サンプルおよび当該胚サンプルの親の少なくとも一人のシーケンシングライブラリーを構築し、次にシーケンシングを行い、シーケンシング結果に基づいて当該胚サンプルの染色体を分析するステップを含む。
【0016】
そのうちの一実施形態において、前記分析ステップは、具体的に、染色体構造変異の分析、および染色体異数性変異の分析を含む。
【0017】
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断し、そうすることで、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムの平均1Mbセグメント当たり2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布は均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片は主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端が生成される。ランダム法による酵素切断と異なる点は、断片化だけでなく、指向的に捕捉するために、我々は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムにおける所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの捕捉した断片を取得してシーケンシングを行う。こうすることで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法は、データ量(20M、40M、80M)の低い第2世代シーケンシングにより、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超のSNPサイトが50万個以上である。本発明は、簡略化ゲノムシーケンシング技術を基に、優位なエンドヌクレアーゼの組合せを選別して全ゲノムタイピングのための十分な有効SNPサイトを取得しながら、特定のシーケンシングリンカーおよび磁気ビーズ法分取手法を用いてライブラリー構築手順を簡略化し、マルチプライマーを設計して捕捉したSNPに対して胚移植前遺伝学分析を行う必要がない技術体系を確立し、全ゲノムシーケンシングに必要なデータ量を低下させ、一回の試験において染色体構造異常の分析と、染色体異数性異常の分析を同時に行うことができる。
【図面の簡単な説明】
【0018】
図1】本発明の一実施形態における核酸ライブラリーの構築方法の原理の模式図である。
図2】本発明の一実施形態におけるシーケンシングリンカーの構造の模式図である。
図3】実施例1における5481101E胚の検出結果の散布図(正倍数体)である。
図4】実施例1における5481102E胚の検出結果の散布図(正倍数体)である。
図5】実施例1における5481103E胚の検出結果の散布図(正倍数体)である。
図6】実施例1における5481104E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。
図7】実施例1における5481105E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。
図8】実施例1における各胚の8番染色体均衡型転座の分析結果である。
図9】実施例1における各胚の14番染色体均衡型転座の分析結果である。
図10】実施例2における細胞株の検出結果の散布図(del(8)-5.2M)である。
【発明を実施するための形態】
【0019】
以下、本発明を理解しやすくするために、本発明についてより詳細に説明し、本発明のより好ましい実施例を示す。しかしながら、本発明は、多くの異なる形態で実現することができ、本明細書に記載される実施例に制限されない。逆に、これらの実施例は、本発明に開示される内容に対する理解がより徹底的且つ包括的になるように提供される。
【0020】
別途定義されない限り、本明細書に用いられる全ての技術用語及び科学用語は、本発明の技術分野に属する当業者が通常理解できるものと同じ意味を有する。本明細書の開示において使用する用語は、単に具体的な実施形態を説明するためのものに過ぎず、本発明を限定するものではない。本明細書に用いられる用語「および/または」は、1つまたは複数の関連する挙げられた項目のいずれか一項、およびあらゆる組合せを含む。
【0021】
用語についての解釈
染色体とは、細胞核を構成する基本的な物質であり、遺伝子の担体である。染色体構造異常とは、染色体または染色分体が断裂-再交換または互換メカニズムによって染色体異常(chromosome aberration)および染色分体異常(chromatid aberration)を発生することを指す。染色体相互転座は、最もよく見られる染色体構造異常であり、主に非相同染色体同士が互いに染色体断片を交換することを指す。
【0022】
均衡型転座とは、2本の非相同染色体がそれぞれ断裂およびスプライシング異常を発生して構造上で再転座した染色体を2本形成することを指し、相互転座およびロシュ転座を含む。染色体均衡型転座に既存の遺伝子の総数が保留されるので、均衡型転座保有者個体には、明らかな病気表現型がないが、生殖障害が多く存在する。主に、均衡型転座の保有者が減数分裂時に不均衡配偶子を発生する可能性があるため、ある1つの遺伝物質が低減または増加して遺伝物質のバランスを破壊することを引き起こし、最終に、奇形胎児または不妊不稔を引き起こす。理論的には、2本の染色体均衡型転座の保有者は減数分裂においてテトラッドを形成することができ、その分離形態に応じて生成可能な配偶子のタイプは多様であり、一般的に2:2分離および1:3分離によって少なくとも18種の異なる配偶子を生成することができ、また、4:0分離によって10種の配偶子を生成することができることが認められる。研究によれば、4:0の確率はいずれも小さく、よく見られる分離形態は2:2分離であることが示される。非相同染色体のロシュ転座保有者による6種の配偶子のうち、1/6が正常な配偶子であり、1/6が携帯型であり、4/6が異常な配偶子である。均衡型転座患者が正常な人と繁殖する場合、配偶子の分離タイプによれば、胚において染色体正倍数体、不均衡型転座によるモノソミーまたはトリソミー、均衡型転座保有者などの出願を生じる。染色体異数性は、原因不明の流産、奇形胎児、不妊不稔および死胎を引き起こす要因である。
【0023】
FISH技術とは、蛍光標識プローブによってインサイチュで検体サンプルの核酸配列のハイブリダイゼーションを行い、蛍光顕微鏡によるDNA観察によって染色体の構造および数の分析を行う方法である。胚細胞の特定の染色体に対してFISHプローブハイブリダイゼーション検出を行うことにより、蛍光顕微鏡下で検出する染色体に転座およびコピー数多型が発生するか否かを観察することができる。FISH技術は、迅速で高感度といった利点を有するが、その限界は、スループットが低いことにある。蛍光顕微鏡は、現在、5種の異なる染色体プローブの蛍光信号のみを同時に観察することができるので、より多くの数の染色体を分析するためには、2回以上のハイブリダイゼーションが必要である。単細胞に対して複数回のハイブリダイゼーションを行うことは、エラー率を増加させる場合があるので、FISHは、有限な染色体のみに対して検出を行うことができ、すべての染色体異数性を検出することはできない。
【0024】
SNPアレイ(SNP array)は、大量のSNPサイトを含有する高密度マイクロアレイチップであり、大多数のSNPチップは、60万以上のSNPを検出することができる。アレルヘテロ接合体の信号強度割合を分析することにより、染色体全体のコピー数多型を検出することができるだけでなく、家族全ゲノム範囲内のSNP連鎖分析により、均衡型転座携帯胚および正常な胚を区別することができる。SNPアレイに基づく検出技術は、正常な胚と均衡型転座保有胚とを区別するための使用実績がある。しかし、当該技術には既知変異の固定されたプローブが用いられ、変更可能性および柔軟性が低く、ある複雑な領域においてはハイブリダイゼーション後のサイトが少なく、ハイブリダイゼーション後のバックグラウンドの干渉がタイピングに失敗するリスクをもたらす。胚サンプルの検出において、CNVは低い感度で検出され、10M以下のCNVを検出することはできず、キメラに対する検出効果が良くない。
【0025】
一ヌクレオチド多型(single nucleotide polymorphism、SNP)とは、主にゲノムレベルでの単一ヌクレオチドの変異によるDNA配列多型を指す。ハプロタイプ(Haplotype)とは、1本の染色体の特定の領域における、互いに関連し、全体として後代に遺伝する傾向にある複数の一ヌクレオチド多型の組合せを指し、一倍体型または単位型とも呼ばれている。シーケンシング深さとは、たとえば一実施形態において、シーケンシング深さが1000Xであれば、特定のPCR増幅産物が1000回シーケンシングされることを表す。
【0026】
PGT-SRは、胚染色体に逆転、均衡型転座およびロシュ転座が存在するか否かの検出を標的とするものであり、元のPGDのうちの一部に相当する。そのうち、SRとは、「chromosomal structural rearrangements(染色体構造異常)」を指す。PGT-Aは、胚染色体に異数性が存在するか否かを検出する技術であり、元のPGSに相当する。そのうち、Aとは、「aneuploidy(異数性)」を指す。PGT-Mは、ある単一遺伝子病を引き起こし得る突然変異遺伝子を胚が保有するか否かの検出を標的とするものであり、元のPGDの一部に相当する。そのうち、Mとは、「monogenic/single gene defects(単一遺伝子病または欠陥)」を指す。
【0027】
本発明の一実施形態における核酸ライブラリーの構築方法は、以下のステップS1~S5を含む。
【0028】
S1:標的ヒトサンプルのゲノムDNAを取得する。
【0029】
S2:第1のエンドヌクレアーゼおよび第2のエンドヌクレアーゼの組合せを用いてゲノムDNAを切断して高密度酵素切断産物を得る。当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、その酵素切断断片の両端に2~5ntの付着末端を生成する。
【0030】
S3:酵素切断産物とシーケンシングリンカーとを連結して、連結産物を得る。シーケンシングリンカーは、第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含む
【0031】
S4:連結産物から200bp~400bpの断片を選別して取得する。
【0032】
S5:ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得る。
【0033】
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断する。そのうち、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムにおいて平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布が均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片が主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端を生成することができる。我々は断片化だけでなく、標的化した捕捉のために、ランダム法酵素切断ではなく、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムの所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの断片を捕捉してシーケンシングを行うことで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法により、データ量(20M、40M、80M)の低い第2世代シーケンシングを用いて、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超えのSNPサイトが50万個以上である。
【0034】
そのため、本発明に係る核酸ライブラリーの構築方法は、ゲノムの平均シーケンシング深さが3×以上である場合、全ゲノム範囲内にSNP分析を行い、家族サンプル連鎖分析によって胚均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効SNPサイトおよびその深さを確保し、ハプロタイプに利用可能なSNPサイトの数を向上させて、低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分なSNPおよびindelsを取得し、SNPに対してマルチPCRプライマーを設計する必要がなく、必要なデータ量および検出コストを低下させることができる。それと同時に、CNVおよびキメラに対する検出能力が明らかに向上し、5M以上のCNVおよび30%以上のキメラ異常を検出することができる。
【0035】
1つの具体的な例示において、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIであるが、これらに限定されない。
【0036】
1つの具体的な例示において、表1に示すように、第1のリンカーの配列は、配列番号1および配列番号2に示され、第2のリンカーの配列は、配列番号3および配列番号4に示されている。ここで、華大のシーケンシングプラットホームの2つのリンカーにおいてそれぞれCATGおよびGATCの付着末端が追加されることで、NspIおよびMboI酵素切断による付着末端と相補可能である。改良用の従来のリンカー配列は、サーモフィッシャー、Illumina、華大のなどのシーケンシングプラットホームにおけるリンカー配列を含むがこれらに限定されず、追加した付着末端配列は、異なるエンドヌクレアーゼに応じて調整可能であることを理解すべきである。
【0037】
【表1】
【0038】
1つの具体的な例示において、ハイスループットシーケンシングプラットホーム汎用プライマーは、第1のリンカーと相補ペアリング可能な上流プライマーと、第2のリンカーと相補ペアリング可能であり、barcode配列を有する下流プライマーとを含む。このように、PCRライブラリー増幅の過程で、特定のbarcode情報を導入することができる。検体のDNA分子が複数の試験サンプルに由来する場合、シーケンシング過程においてサンプルを区別するために、各サンプルに異なるタグ配列(barcode)が追加されてもよいので、複数のサンプルに対してシーケンシングを同時に行うことを実現する。
【0039】
1つの具体的な例示において、表2に示すように、上流プライマーの配列は、配列番号5に示され、下流プライマーの配列は、配列番号6に示されている。それは、上記華大のシーケンシングプラットホームにおける2つのリンカーに対する汎用プライマーである。異なるシーケンシングリンカーを用いる場合、汎用プライマーの配列は必要に応じて調節可能であることを理解すべきである。
【0040】
【表2】
【0041】
好ましくは、切断ステップにおいて、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの体積比は、1:(0.8~1.2)である。
【0042】
1つの具体的な例示において、磁気ビーズ分取方法により、連結産物から200bp~400bpの断片を選別して取得する。磁気ビーズは、AMPure XP磁気ビーズであることが好ましい。
【0043】
1つの具体的な例示において、ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAに対して全ゲノム増幅を行うステップを含む。
【0044】
1つの具体的な例示において、核酸ライブラリーの構築方法は、シーケンシングライブラリーの濃度を測定するステップを含む。
【0045】
本発明の一実施形態における簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法は、上記核酸ライブラリーの構築方法により胚サンプルおよび当該胚サンプルの少なくとも1方の親(たとえば父親サンプルおよび母親サンプル)のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて胚サンプルの染色体を分析するステップを含む。
【0046】
当該検出方法は、検出対象が生きている人体または動物体を対象とするのではなく、子宮に移植されていない胚であり、その検出結果が両親の病気診断結果にも関係しないので、病気の診断および治療方法に属しないことを理解すべきである。また、当該方法は、死亡した胚サンプルを検出するなどの病気診断および治療を目的としない使用に用いられてもよい。
【0047】
好ましくは、両親のサンプルは、末梢血ゲノムDNA、精液DNA、口腔粘膜細胞DNAおよび細胞全ゲノム増幅産物から選ばれる1種または複数種である。各サンプルにおけるDNA含有量は、500ngよりも大きいことが好ましい。
【0048】
1つの具体的な例示において、分析ステップは、具体的に、分析染色体構造変異、分析染色体異数性変異、分析単一遺伝子遺伝病および/または分析コピー数多型などを含む。
【0049】
1つの具体的な例示において、家族遺伝歴がある均衡型転座家族に対して、上記核酸ライブラリーの構築方法を用いて、均衡型転座保有者夫婦、転座保有者の親族の少なくとも1人、および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの転座保有者においてヘテロ接合であり、他方においてホモ接合であり、且つ、転座保有者の親族においてホモ接合であるSNPサイトを有効SNPサイトとして選定する。すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築することで、転座保有者の異常な染色分体を確定する。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、胚に異常の染色分体が携帯されるか否かを判断することで、胚に均衡型転座が携帯されるか否かを確定する。
【0050】
シーケンシングデータに対して全ゲノムCNV分析を行うこともできる。分析方法は、単細胞を増幅した後、DNAシーケンシングによって得た塩基配列とヒトゲノム標準配列hg19をBWAソフトウェアによって比較し、シーケンシングによって得た各塩基配列の染色体における正確な座位を確定する。品質が低く、染色体に多重マッチングされるか、染色体に完全にマッチングしていない塩基配列を除去し、シーケンシングデータの精度および各塩基配列の位置決めの一意性を確保する。染色体全体を100kb断片サイズの非重複領域に区画して、100kbウィンドウ当たりに得た一意のマッチング配列の数を算出する。GC含有量のズレの校正を行い、ウィンドウを合併し、ウィンドウデータを均一化する。参照データと比較することにより、log2RRを算出し、CBSによって断裂サイトを算出し、コピー数を算出し、アノテーションによって最終結果を作製する。
【0051】
1つの具体的な例示において、新たに発病した均衡型転座保有者家族に対して、上記核酸ライブラリーの構築方法により、均衡型転座保有者夫婦および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行う。まず、胚に対して全ゲノムCNV分析を行い、分析方法は、上述した通りである。均衡型転座により染色体コピー数多型を引き起こした胚E1を選別して、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの一方である転座保有者においてヘテロ接合であり、他方においてホモ接合であるSNPサイトを有効SNPサイトとして選定し、すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築する。分離定律に基づき、E1胚は、必然的に親から異常の染色分体を遺伝するため、転座保有者の異常の染色分体を確定することができる。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、他の胚が異常な染色分体を保有するか否かを判断することで、胚が均衡型転座を保有するか否かを確定する。
【0052】
本発明に係る移植前胚染色体分析方法は、異なる病気に対してマルチPCRプライマーを設計する必要がなく、全ゲノムから十分なSNPサイトおよびindelサイトを取得することができ、23対の染色体の異数性の選別を同時に完成することができる。ターゲット遺伝子が位置する染色体全体がカバーされることにより、相同組み換えの分析に対する影響を低減させ、家族分析によって胚染色体構造異常を効果的に分析する成功率が高く、指定のロシュ転座および相互転座家族のうちの正常な胚および保有者胚に適用することができる。
【0053】
以下は、具体的な実施例である。
【実施例
【0054】
実施例1 均衡型転座遺伝家族胚の検出
染色体均衡型転座保有者のいる家族(チップ検出結果により確認されたもの)を1組動員し、当該家族は補助生殖を受けた。家族情報を表3に示す。均衡型転座保有者、妻、および保有者へと均衡型転座が遺伝した親の末梢血サンプル(合計3つの血液サンプル)をそれぞれ5mL回収し、EDTA抗凝固採血チューブに保存した。同時に、当該夫婦の5つの胚生検サンプルの全ゲノム増幅後の生成物を取得した。家族ゲノムDNAは、全血抽出キットで抽出した。本発明に係る方法により、胚移植前染色体均衡型転座分析を行った。
【0055】
【表3】
【0056】
原理は、図1に示される。まず、1グループのエンドヌクレアーゼを用いてゲノムにおける特定の酵素切断部位を識別し、ゲノムDNAに対してゲノム切断を行い、ゲノムDNAを一定の配列の断片に断裂させ、断裂した断片の両端には、エンドヌクレアーゼによる切断によって付着末端構造を形成した。2種のエンドヌクレアーゼの切断による付着末端と相補性のシーケンシングリンカーを設計し、リンカーと切断されたゲノム配列とを連結し、PCR増幅によりシーケンシングライブラリーを形成する。構築したシーケンシングライブラリーに対して特定長さの断片の富化を行った後、シーケンサーでシーケンシングを行った。各サンプルに必要なシーケンシングデータは、8Gb以上である。シーケンシングリンカー構造は、図2に示すように、酵素切断断片付着末端と相補な配列、および異なるシーケンシングプラットホームの最初のシーケンシングリンカー配列を含む。
【0057】
1.酵素切断
胚サンプルに対してQIAGEN REPLI-g Single Cell KitまたはTaKaRa PicoPLEX Single Cell WGA kitで全ゲノム増幅を行った。500ngのDNAを用意して水を17μLまで添加した。表4に応じて酵素切断混合液Mix1を調製し、3μLの酵素切断混合液Mix1をサンプル添加し、ガンで均一に通気して混合し、短時間の遠心分離に付した。
【0058】
【表4】
【0059】
遠心分離したDNAをPCR装置に設置した。PCR装置の設定プログラムは、表5に示される。
【0060】
【表5】
【0061】
2.リンカー連結
本実施例は、華大のシーケンシングプラットホームの2つのリンカーを採用した。
リンカー1:5’-GAACGACATGGCTACGATCCGACTTCATG-3’および5’-AAGTCGGATCGTAGCCATGTCGTTC-3’
リンカー2:5’-GATCAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA-3’および5’-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’
【0062】
表6に応じてリンカー混合液Mix2を調製した。5μLのリンカー混合液Mix2を酵素切断されたDNAに添加して、ガンで均一に通気して混合し、短時間の遠心分離に付した。
【0063】
【表6】
【0064】
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表7に示される。
【0065】
【表7】
【0066】
表8に応じて、リガーゼ混合液Mix3を調製した。5μLのリガーゼ混合液Mix3を上記リンカーDNAに添加し、(ボルテックスによる混合なしで)ガンで均一に通気して混合し、短時間の遠心分離に付した。
【0067】
【表8】
【0068】
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表9に示される。
【0069】
【表9】
【0070】
3.断片の選別
水を100μLまで添加した後、AMPure XP磁気ビーズを60μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを新たなEPチューブに移し、AMPure XP磁気ビーズを20μL添加した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールで洗浄した。室温で乾燥させた後、22μLのLow TEで溶出した。
【0071】
4.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
【0072】
5.PCR増幅
10ngの選別した断片に対してPCR増幅を行い、ライブラリーを得た。表10に応じてPCR反応混合液Mix4を調製した。
PCRプライマー:F: 5’-GAACGACATGGCTACGA-3’
R: 5’-TGTGAGCCAAGGAGTTG(barcode) TTGTCTTCCTAAGACCGC-3’
【0073】
【表10】
【0074】
断片を選別したサンプルの20μLをPCRチューブに添加した。28.75μLのPCR反応混合液Mix4を添加した後、barcode含有特異性プライマーを1.25μL添加し、混合して短時間の遠心分離に付した。PCR装置において、そのプログラム設定は、表11に示される。
【0075】
【表11】
【0076】
6.ライブラリーの精製
反応が完了した後、短時間の遠心分離に付した。AMPure XP磁気ビーズを50μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールによる洗浄を1回繰り返し、室温で磁気ビーズを乾燥させ、40μLのLow TEで磁気ビーズを再懸濁し、DNAを溶出した。
【0077】
7.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
【0078】
8.シーケンサーによるシーケンシング
次世代シーケンシングのために、リンカーのタイプに応じてプラットホームを選択した。本実施例では、華大のシーケンシングプラットホームでシーケンシングを行った。
【0079】
9.データ分析
シーケンシングによるシーケンシングデータのデータ分析を行い、参照ゲノムとの比較を行った。バリエーションの同定を通じてデータからSNPサイトを得た。遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判断して、均衡型転座保有者胚または正常な胚を区別する。
【0080】
10.検出の性能
5M以上の欠失を検出することができると共に、指定の均衡型転座家族のうちの(ロシュ転座と相互転座)胚の遺伝の情況を検出することができる。
【0081】
11.検出結果
図3~7は、それぞれ5個の胚サンプルのPGT-A検出結果である。図8は、各胚の8番染色体の均衡型転座分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。図9は、各胚の14番染色体上の均衡型転座の分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。
【0082】
被験者である男性が転座保有者であり、転座に関連する染色体は、8番および14番染色体である、すなわち、男性は1本の正常な8番染色分体、1本の正常な14番染色分体および2本の転座した染色分体(8p23および14q24転座)を含む。男性の母親の検出結果に基づき、母親から2本の転座した染色分体が男性に遺伝し、父親から正常な1本の8番染色分体および1本の14番染色分体が遺伝したと推定した。男性の母親の8番および14番染色分体の色は、男性と同じ異常を示す色(青色)であり、逆に、男性の他の1本の染色分体の色は正常な色(赤色)である。胚染色体コピー数多型検出結果から分かるように、5481101E番胚が均衡型転座保有者であり、5481102E番胚が均衡型転座保有者であり、5481103E番胚が均衡型転座保有者であり、5481104E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚であり、5481105E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚である。
【0083】
実施例2
染色体異数性を有する細胞株サンプル(5細胞)の詳細を表12に示した。MDA法による全ゲノム増幅を行った。
【0084】
【表12】
【0085】
実施例1における方法に基づいて検出した。細胞株のPGT-Aデータ分析結果を図10に示す。検出結果から分かるように、当該方法は5Mの異常欠失を検出することができる。
【0086】
比較例1
本比較例1では、SNP-アレイチップ(Karyomapping遺伝子チップ)技術を用いて実施例1の胚サンプルを検出した。
【0087】
実施例1および比較例1における各染色体の有効データを比較した。下記表13に、5481105E番の胚を例として、各染色体の有効座位を比較した。表からは、実施例1における有効座位のデータ(胚サンプル)がチップからのデータよりも多いことが示される。
【0088】
【表13】
【0089】
実施例3
本実施例における方法は、エンドヌクレアーゼの組合せがそれぞれBfaIとTaqI、またはMboIとMspIであること以外は、実施例1と基本的に同様である。同様にデータ量が低い場合に十分なSNPサイトおよびindelサイトを取得することができ、遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判定して、均衡型転座保有者胚であるか、または正常な胚であるかを区別する。
【0090】
比較例2
本比較例2は、NspIとTaqIの組合せを用いてゲノムDNAに対して酵素切断を行う以外、他のステップは実施例1と同様である。
【0091】
実施例1および比較例2における各染色体の有効データを比較した。下記表14に、5481105E番の胚を例として、各染色体の有効座位を比較した。表は、比較例2におけるエンドヌクレアーゼの組合せに対する有効座位のデータ(胚サンプル)が、実施例1におけるエンドヌクレアーゼの組合せに対するそれよりも明らかに低いことが示され、本発明におけるエンドヌクレアーゼの組合せが任意選択可能ではないことが示されている。
【0092】
【表14】
【0093】
上記実施形態の各技術的特徴は、任意に組み合わせることができる。説明を簡単にするために、上記実施形態における各技術的特徴の全ての組合可能な形態については記載されていないが、これら技術的特徴の組み合わせに矛盾がない限り、本明細書に記載の範囲とみなされるべきである。
【0094】
以上、前記実施例は、本発明のいくつかの実施形態の例示にすぎず、その説明は、具体的且つ詳細であるが、本発明の範囲を限定するものではないと理解すべきである。当業者であれば、本発明の思想から逸脱しない前提で、いくつかの変形及び改良を行うことができ、これらはすべて本発明の保護範囲に属することを指摘すべきである。したがって、本発明の保護範囲は、請求の範囲により決定されるべきである。
【配列表フリーテキスト】
【0095】
配列番号1: リンカー
配列番号2: リンカー
配列番号3: リンカー
配列番号4: リンカー
配列番号5: プライマー
配列番号6: プライマー
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
【配列表】
0007429072000001.app