IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ラピッド ゲノミクス エルエルシーの特許一覧

特表2022-535029標的遺伝子領域の柔軟かつハイスループット配列決定
<>
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図1
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図2
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図3
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図4
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図5
  • 特表-標的遺伝子領域の柔軟かつハイスループット配列決定 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-08-04
(54)【発明の名称】標的遺伝子領域の柔軟かつハイスループット配列決定
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20220728BHJP
   C12Q 1/6806 20180101ALI20220728BHJP
   C12N 15/10 20060101ALI20220728BHJP
   C12Q 1/686 20180101ALI20220728BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6806 Z
C12N15/10 Z
C12Q1/686 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021571458
(86)(22)【出願日】2020-05-29
(85)【翻訳文提出日】2022-01-31
(86)【国際出願番号】 US2020035365
(87)【国際公開番号】W WO2020243597
(87)【国際公開日】2020-12-03
(31)【優先権主張番号】62/854,458
(32)【優先日】2019-05-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521521219
【氏名又は名称】ラピッド ゲノミクス エルエルシー
(74)【代理人】
【識別番号】110003339
【氏名又は名称】特許業務法人南青山国際特許事務所
(72)【発明者】
【氏名】ネヴェス,レアンドロ ゴミデ
(72)【発明者】
【氏名】ペイトン,アダム
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA17
4B063QQ28
4B063QQ34
4B063QQ40
4B063QQ42
4B063QQ52
4B063QQ53
4B063QR14
4B063QR32
4B063QR55
4B063QR62
4B063QS25
4B063QS34
4B063QS36
4B063QS38
4B063QX02
(57)【要約】
本開示は、標的ゲノム領域を捕捉するための材料及び方法に関わり、伸長プローブ及びライゲーションプローブを、標的ゲノム領域に隣接する標的配列にハイブリダイズし、伸長プローブの3'末端がライゲーションプローブの5'末端に近接するまで伸長プローブの3'末端を伸長し、伸長した伸長プローブの3'末端をライゲーションプローブの5'末端とライゲーションさせて、ライゲーションプローブを生成することを含む。本発明の特定の実施形態はまた、二本鎖ゲノムDNAにおける標的ゲノム領域の両方の鎖を捕捉及び分析するのに適した二本鎖プローブを生成する方法も提供する。本発明はまた、本明細書に開示された方法を実施するためのキットも提供する。
【特許請求の範囲】
【請求項1】
一方の末端の両方の鎖上に任意で修飾を有する二本鎖オリゴヌクレオチドプローブを生成する方法であって、
a)5'末端から3'末端に向かって、第1の尾部、第1の制限酵素のための第1の制限部位、標的結合配列、第2の制限酵素のための第2の制限部位、第2の尾部を含む、一本鎖又は二本鎖プレプローブを提供し、前記二本鎖プレプローブは、前記一本鎖プレプローブをコピーするのに適切なプライマーを用いてPCRにおいて任意で生成される工程と、
b)新たな所望の配列の少なくとも一部を含むように遺伝的に修飾された永久尾部を一時的な第1又は第2の尾部で置き換える尾部交換反応を任意で行う、工程であって、
i)前記二本鎖プレプローブを、前記第1の制限酵素で消化して、前記第1のプレ尾部又はその一部を除去して、オーバーハングを生成し、
ii)前記第1の制限酵素で消化された前記二本鎖プローブに前記永久尾部をライゲーションすることを含み、前記永久尾部分子は、遺伝的修飾と、前記消化された二本鎖プレプローブのオーバーハングに相補的であるオーバーハングを含む前記永久尾部の少なくとも一部とを含む、工程と、
c)任意で、前記永久尾部にライゲーションされた前記消化された二本鎖プレプローブを精製する工程と、
d)前記第2の制限酵素で前記二本鎖プレプローブを消化することにより、二本鎖プローブを生成して、前記第2の尾部を除去し、平滑末端又は粘着末端を、前記標的結合配列内に生成する工程と、
e)任意で、前記二本鎖プローブを精製する工程とを含む、方法。
【請求項2】
前記一本鎖プレプローブは、前記第1の制限部位と前記標的結合配列との間、及び/又は前記標的結合配列と第2の制限部位との間にバーコードを含む、請求項1に記載の方法。
【請求項3】
前記第1及び第2の制限酵素は、二本鎖DNA認識部位から離れた二本鎖DNAを切断するIIS型制限酵素である、請求項1に記載の方法。
【請求項4】
前記IIS型制限酵素は、BsaI及びMlyIである、請求項3に記載の方法。
【請求項5】
前記永久尾部の前記遺伝的修飾は、エキソヌクレアーゼ保護を与え、検出可能なヌクレオチド又は修飾ヌクレオチドを組み込む、請求項1に記載の方法。
【請求項6】
前記プレプローブは、20~200のヌクレオチドを含む、請求項1に記載の方法。
【請求項7】
前記第1の尾部は、10~30のヌクレオチドであり、前記標的結合配列は、10~60のヌクレオチドであり、前記第2の尾部は、10~30のヌクレオチドである、請求項6に記載の方法。
【請求項8】
前記二本鎖プローブを一本鎖プローブに変換することをさらに含む、請求項1に記載の方法。
【請求項9】
a)5'末端から3'末端まで、第1の尾部、第1の制限酵素のための第1の制限部位、標的結合配列、第2の制限酵素のための第2の制限部位、第2の尾部を含む、一本鎖又は二本鎖プレプローブを提供し、前記二本鎖プレプローブは、前記一本鎖プレプローブをコピーするのに適切なプライマーを用いてPCRにおいて任意で生成される工程と、
b)新たな所望の配列の少なくとも一部を含むように遺伝的に修飾された永久尾部を一時的な第1又は第2の尾部で置き換える尾部交換反応を行う工程であって、
i)前記二本鎖プレプローブを、前記第1の制限酵素で消化して、前記第1のプレ尾部又はその一部を除去して、オーバーハングを生成し、
ii)前記第1の制限酵素で消化された前記二本鎖プローブに前記永久尾部をライゲーションすることを含み、永久尾部分子は、遺伝的修飾と、前記消化された二本鎖プレプローブの前記オーバーハングに相補的であるオーバーハングを含む前記永久尾部の少なくとも一部とを含む、工程と、
c)前記永久尾部にライゲーション消化二本鎖プレプローブを精製する工程と、
d)前記第2の制限酵素で前記二本鎖プレプローブを消化することにより、二本鎖プローブを生成して、前記第2の尾部を除去し、平滑末端又は粘着末端を、前記標的結合配列内に生成する工程と、
e)前記二本鎖プローブを精製する工程とを含む、請求項1に記載の方法。
【請求項10】
二本鎖標的遺伝物質から標的ゲノム領域を捕捉する方法であって、
a)二本鎖上流プローブ及び二本鎖下流プローブを提供する工程であって、
前記二本鎖上流プローブは、
i)3'末端に向かって第1の標的結合配列を、5'末端に向かって第1のプライマー結合配列を含む第1の伸長プローブと、
ii)5'末端に向かって第1の標的結合配列を、3'末端に向かって第1のプライマー結合配列を含む第2のライゲーションプローブとを含み、
前記二本鎖下流プローブは、
i)5'末端に向かって第2の標的結合配列を、3'末端に向かって第2のプライマー結合配列を含む第1のライゲーションプローブと、
ii)3'末端に向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第2の伸長プローブとを含む、工程と、
b)前記二本鎖標的ゲノム領域を、前記二本鎖上流プローブ及び前記二本鎖下流プローブと接触させる工程であって、前記接触を、
i)前記二本鎖上流プローブ及び前記二本鎖下流プローブの、前記第1の伸長プローブ、前記第2のライゲーションプローブ、前記第1のライゲーションプローブ及び前記第2の伸長プローブへの変性、及び
ii)前記第1の伸長プローブ及び前記第1のライゲーションプローブの、前記標的ゲノム領域における第1のDNA鎖へのハイブリダイゼーション、及び前記第2の伸長プローブ及び前記第2のライゲーションプローブの、前記標的ゲノム領域における第2のDNA鎖へのハイブリダイゼーション
を可能にする条件下で行う、工程と、
c)増幅された第1の伸長プローブの3'末端が前記第1のライゲーションプローブの5'末端に近接するまで、前記第1の伸長プローブの3'末端を増幅し、増幅された第2の伸長プローブの3'末端が第2のライゲーションプローブの5'末端に近接するまで、前記第2の伸長プローブの3'末端を増幅する工程と、
d)前記標的ゲノム領域を二本鎖標的遺伝物質から捕捉する工程であって、
i)増幅された第1の伸長プローブの3'末端を、前記第1のライゲーションプローブの5'末端とライゲーションして、5'末端から3'末端まで、前記第1のプライマー結合配列、前記第1の標的結合配列、前記増幅された標的ゲノム領域、前記第2の標的結合配列、及び前記第2のプライマー結合配列を含む前記第1のライゲーションプローブを生成し、
ii)前記増幅された第2の伸長プローブの3'末端を、前記第2のライゲーションプローブの5'末端とライゲーションして、5'末端から3'末端まで、前記第2のプライマー結合配列、前記第2の標的結合配列、前記増幅された標的ゲノム領域、前記第1の標的結合配列、及び前記第1のプライマー結合配列を含む前記第2のライゲーションプローブを生成することによって、捕捉する工程と
を含む、方法。
【請求項11】
前記二本鎖上流プローブは、前記第1の伸長プローブの5'末端にエキソヌクレアーゼ保護と、前記第2のライゲーションプローブの3'末端にエキソヌクレアーゼ保護とを含み、前記二本鎖下流プローブは、前記第1のライゲーションプローブの3'末端にエキソヌクレアーゼ保護と、前記第2の伸長プローブの5'末端にエキソヌクレアーゼ保護とを含む、請求項10に記載の方法。
【請求項12】
前記エキソヌクレアーゼ保護は、ヌクレオチド間にチオホスフェート結合を導入し、2つ以上のホスホラミダイト、ホスホロモノチオエート及び/又はホスホロジチオエート結合を組み込み、ホルムアセタール/ケタール結合による近接ヌクレオチド間の1つ以上のホスホジエステル結合を交換し、ホスホリル又はアセチル基により3'末端ヒドロキシル基をブロックし、3'末端ホスホロアミデートを導入し、ペプチド核酸(PNA)又はロックされた核酸(LNA)を導入し、1つ以上のチオホスフェート基を導入し、又はオリゴヌクレオチド骨格中の2‐O‐メチルリボース糖基を導入することの1つ以上を含む、請求項11に記載の方法。
【請求項13】
前記第1及び第2のライゲーションプローブを前記反応混合物から単離することを含む、請求項10に記載の方法。
【請求項14】
前記第1及び第2のライゲーションプローブを単離することは、前記反応混合物を、5'-3'エキソヌクレアーゼ活性及び3'-5'エキソヌクレアーゼ活性を有する1つ以上のエキソヌクレアーゼで処理することを含む、請求項11に記載の方法。
【請求項15】
前記標的ゲノム領域は、約10bpから約100bpの間、約100bpから約300bpの間、約300bpから約1,000bpの間、又は約1,000bpから約20,000bpの間である、請求項10に記載の方法。
【請求項16】
増幅プライマー対を使用するポリメラーゼ連鎖反応(PCR)において、前記第1及び/又は第2のライゲーションプローブを増幅して、二本鎖形態の前記第1及び/又は第2のライゲーションプローブのコピーを生成することをさらに含み、
前記第1のライゲーションプローブ増幅プライマー対は、
i)5'末端から3'末端まで、第1の配列決定プライマー結合配列、第1の識別配列、第1のプライマー配列のうちの1つ以上を含む第1の伸長プローブ増幅プライマーと、
ii)5'末端から3'末端まで、第2の配列決定プライマー結合配列、第2の識別子配列、及び第2のプライマー配列のうちの1つ以上を含む第1のライゲーションプローブ増幅プライマーとを含み、
前記第2のライゲーションプローブ増幅プライマー対は、
i)5'末端から3'末端まで、第3の配列決定プライマー結合配列、第3の識別子配列、及び第2のプライマー配列のうちの1つ以上を含む第2の伸長プローブ増幅プライマーと、
ii)5'末端から3'末端まで、第4の配列決定プライマー結合配列、第4の識別子配列、及び第1のプライマー配列のうちの1つ以上を含む第2のライゲーションプローブ増幅プライマーとを含む、請求項10に記載の方法。
【請求項17】
PCR増幅第1のライゲーションプローブ及び/又はPCR増幅第2のライゲーションプローブの配列決定することをさらに含む、請求項16に記載の方法。
【請求項18】
前記配列決定は、ナノポア配列決定、可逆的色素終端配列決定、単一分子リアルタイム(SMRT)配列決定、又はペアエンド配列決定を含む、請求項17に記載の方法。
【請求項19】
二本鎖プローブの1つ以上の対を含むキットであって、二本鎖プローブの各対は、二本鎖上流プローブ及び二本鎖下流プローブを含み、
前記二本鎖上流プローブは、
i)3'末端に向かって第1の標的結合配列を、5'末端に向かって第1のプライマー結合配列を含む第1の伸長プローブと、
ii)5'末端に向かって第1の標的結合配列を、3'末端に向かって第1のプライマー結合配列を含む第2のライゲーションプローブとを含み、
前記二本鎖下流プローブは、
i)5'末端に向かって第2の標的結合配列を、3'末端に向かって第2のプライマー結合配列を含む第1のライゲーションプローブと、
ii)3'末端向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第2の伸長プローブとを含む、キット。
【請求項20】
前記二本鎖伸長プローブは、前記第1の伸長プローブの5'末端にエキソヌクレアーゼ保護と、前記第2のライゲーションプローブの3'末端にエキソヌクレアーゼ保護とを含み、前記二本鎖ライゲーションプローブは、前記第1のライゲーションプローブの3'末端にエキソヌクレアーゼ保護と、前記第2の伸長プローブの5'末端にエキソヌクレアーゼ保護とを含む、請求項19に記載のキット。
【請求項21】
前記エキソヌクレアーゼ保護は、ヌクレオチド間のチオホスフェート結合、2つ以上のホスホラミダイト及びホスホロモノチオエート及び/又はホスホロジチオエート結合、ホルムアセタール/ケタール結合による近接ヌクレオチド間の1つ以上のホスホジエステル結合、ホスホリル又はアセチル基によりブロックされた3'末端ヒドロキシル基、3'末端ホスホロアミデート、ペプチド核酸(PNA)又はロックされた核酸(LNA)、1つ以上のチオホスフェート基、又はオリゴヌクレオチド骨格中の2‐O‐メチルリボース糖基のうちの1つ以上を含む、請求項20に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願を相互参照
本出願は、2019年5月30日出願の米国仮出願第62/854,458号の優先権を主張するものであり、図表、核酸配列、アミノ酸配列を含む内容を参照することにより援用される。
【0002】
本出願の配列表は、2020年5月15日に作成され、2KBである「Seq-List.txt」とラベル付けされたものである。配列表の全内容は、その全体が参照により本明細書に援用される。
【背景技術】
【0003】
標的配列決定は、より堅牢で手頃な配列決定技術が利用可能になるにつれて、重要度が増している。ゲノムの標的領域を分析するための従来の方法の大部分には、標的ハイブリダイゼーション及び捕捉(Gnirkeら、2009)、多重PCR(Campbellら、2015)や分子反転プローブ(Shenら、2011)が含まれる。これらの方法は、高価であり、最適化するのが困難であり、高データレート変動性を有し、異なる長さの標的を配列決定するための柔軟性を欠く。従って、標的ゲノム領域の検出及び配列決定、特に、遺伝子多型を含むか又は含むと予想される標的ゲノム領域の検出及び配列決定について改良された方法が望まれている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第8,808,991号明細書
【特許文献2】米国特許第8,460,866号明細書
【特許文献3】国際公開第2005/118847号
【特許文献4】国際公開第2009/079488号
【特許文献5】米国特許第U8,795,968号明細書
【特許文献6】米国特許出願公開第U2008/0026393号明細書
【特許文献7】米国特許第4,656,127号明細書
【非特許文献】
【0005】
【非特許文献1】Campbell, N. R., Harmon, S. A., and Narum, S. R. (2015). Genotyping-in-Thousands by sequencing (GT-seq): A cost effective SNP genotyping method based on custom amplicon sequencing. Mol. Ecol. Resour. 15, 855-867. doi:10.1111/1755-0998.12357.
【非特許文献2】Gnirke, A., Melnikov, A., Maguire, J., Rogov, P., LeProust, E. M., Brockman, W., et al. (2009). Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat Biotechnol 27, 182-189. doi:nbt.1523 [pii]10.1038/nbt.1523.
【非特許文献3】Shen, P., Wang, W., Krishnakumar, S., Palm, C., Chi, A.-K., Enns, G. M., et al. (2011). High-quality DNA sequence capture of 524 disease candidate genes. Proc. Natl. Acad. Sci. U. S. A. 108, 6549-54. doi:10.1073/pnas.1018981108.
【非特許文献4】Krishnakumar, S., Zheng, J., Wilhelmy, J., Faham, M., Mindrinos, M., and Davis, R., PNAS (2008) 105(27): 9296-9301.
【非特許文献5】El-Sagheerら(2011), PNAS; 108(28)11338-11343
【非特許文献6】Shawら1991, Nucleic Acids Research, 19, 747-750.
【非特許文献7】Raneyら1998, Peptide Nucleic Acids (Nielsen, P. E., and Egholm, M., Eds.) Horizon Scientific Press, Wymondham, U.K.
【非特許文献8】SimeonovらNucl. Acids Res. 2002, Vol. 30, e31.
【非特許文献9】JacobsenらInt. Biot. Lab, Feb 2001, 18.
【発明の概要】
【課題を解決するための手段】
【0006】
本明細書に開示される特定の実施形態は、標的ゲノム領域を捕捉し、任意で、検出及び/又は配列決定によって標的ゲノム領域をさらに分析するための材料及び方法を提供する。好ましくは、標的ゲノム領域は、遺伝的多型を含むか、又は含むことが予想される。
【0007】
特定の実施形態において、標的遺伝物質から標的ゲノム領域を捕捉するための本明細書に開示された方法は、伸長プローブ及びライゲーションプローブを、標的ゲノム領域に隣接する第1の標的配列及び第2の標的配列にハイブリダイズし、伸長プローブの3'末端がライゲーションプローブの5'末端に近接するまで伸長プローブの3'末端を伸長し、伸長しれた伸長プローブの3'末端をライゲーションプローブの5'末端とライゲーションして、標的ゲノム領域を含むライゲーションプローブを生成することによって、標的ゲノム領域を捕捉することを含む。
【0008】
ライゲーションプローブは、反応混合物から任意で精製し、増幅プライマー対でPCR増幅して、さらなる検出及び/又は配列決定に適したライゲーションプローブの二本鎖コピーを生成する。配列決定は、ナノポア配列決定、可逆的色素終端配列決定、単一分子リアルタイム(SMRT)配列決定、又はペアエンド配列決定等の次世代配列決定技術を用いて行うことができる。
【0009】
本発明のさらなる実施形態は、伸長プローブ及びライゲーションプローブを二本鎖形態で生成する方法を提供する。二本鎖形態のプローブを使用すると、二本鎖標的ゲノム領域の両方の鎖を捕捉することが可能となる。
【0010】
特定の実施形態において、遺伝物質中の複数の標的ゲノム領域が、複数のプローブ対を使用して捕捉され、各プローブ対は、伸長プローブ及びライゲーションプローブを含み、伸長プローブを増幅して、対応する標的配列にハイブリダイズし、増幅された伸長プローブを、対応するライゲーションプローブとライゲーションして、複数の標的ゲノム領域を捕捉する。ライゲーションプローブは、反応混合物から任意で精製され、増幅プライマー対でPCR増幅して、さらなる検出及び配列決定に適した標的ゲノム領域の二本鎖コピーを生成する。複数のサンプルからの複数のライゲーションプローブを、多重配列決定反応において配列決定するためにプールすることができる。増幅プライマーは、増幅された標的ゲノム領域の供給源を識別するための固有の識別配列を含む。配列決定工程の後、サンプル特定固有識別子を用いて、サンプルに配列を割り当て、捕捉された標的ゲノム領域の配列を既知のデータベースと比較して、サンプル中の標的ゲノム領域に配列を割り当てる。配列決定は、ナノポア配列決定、可逆的色素終端配列決定、単一分子リアルタイム(SMRT)配列決定、又はペアエンド配列決定等の次世代配列決定技術を用いて行うことができる。
【0011】
本発明のさらなる実施形態は、本明細書に開示された方法を実施するためのキットを提供する。キットは、一対以上の伸長プローブ及びライゲーションプローブ、例えば、DNAリガーゼ、DNAポリメラーゼ等の酵素、一対以上の増幅プライマー、配列決定のための試薬、及びアッセイを行うための使用説明書のうちの1つ以上を含む。
【0012】
本特許出願書類は、色彩を付して作成された少なくとも1の図面を含む。本特許出願又は公報の写しで、色彩図面を付したものは、要求し、かつ、必要な手数料を納付したときに特許庁が提供する。
【図面の簡単な説明】
【0013】
図1】本明細書に開示された方法による標的ゲノム領域の捕捉及び配列決定の一例の概要を示す。
図2】本明細書中に開示された方法による長い標的ゲノム領域を捕捉及び配列決定の一例の概要を示す。
図3】修飾のための尾部交換のない二本鎖形態でプローブを生成する一例の概要を示す。
図4】望ましい修飾を組み込むために尾部交換を有する二本鎖形態のプローブを調製する一例の概要を示す。
図5】二本鎖形態の上流又は下流プローブを生成する方法の概要を示す。
図6】標的ゲノム領域の両方の鎖を分析するために二本鎖上流及び下流プローブを使用する方法の一例の概要を示す。二本鎖上流及び下流プローブ(例えば、それぞれ図3又は4に例示される方法によって生成)は、標的ゲノム領域の両方の鎖を分析するために使用される。
【発明を実施するための形態】
【0014】
本明細書で使用される単数形「1つ」及び「その」は、断りのない限り、複数形も含むことが意図される。「有する」、「持つ」、「備える」又はそれらの変形の用語が、詳細な説明及び/又は特許請求の範囲のいずれかで使用される限り、そのような用語は、「含む」と同様に包括的であることが意図される。「含む」、「から実質的に成る」、「からなる」、という移行句(及びそれらの任意の文法的変形)が使われる。
【0015】
「から実質的になる」という語句は、記載された実施形態が特定の材料又は工程を含む実施形態、及び記載された実施形態の基本的かつ新規な特性に実質的に影響を及ぼさない実施形態を包含することを示す。
【0016】
「約」という用語は、当業者によって決定されるような特定の値についての許容可能な誤差範囲内を意味し、これは値がどのように測定又は決定されるか、すなわち、測定方式の限界に部分的に依存する。「約」という用語が使用されるポリヌクレオチドの長さについて、これらのポリヌクレオチドは値(X±10%)付近で0~10%の変動を有する、記載された数の塩基又は塩基対を含む。
【0017】
本開示において、範囲は簡潔に記載され、その範囲内の各値及び全ての値を詳細に設定及び記述しないようにしてある。範囲内の任意の適切な値は、適切な場合、範囲の上限値、下限値、又は末端として選択される。例えば、0.1~1.0の範囲は、0.1及び1.0の末端値、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9の中間値、同じく、0.2~0.5、0.2~0.8、0.7~1.0等の0.1~1.0内に包含されるすべての中間範囲を表す。範囲内に少なくとも2つの有効数字を有する値が想定され、例えば、5~10の範囲は、5.0~10.0の間、終端値を含む5.00~10.00の間の全ての値を示す。ポリヌクレオチドのサイズ等の範囲が本明細書で使用される場合、範囲及びその特定の実施形態の組み合わせ及び下位組み合わせ(例えば、開示された範囲内の下位範囲)が、明示的に含まれる。
【0018】
本明細書で使用される「生物」という用語は、ウイルス、細菌、真菌、植物及び動物を含む。生物のさらなる例は当業者に公知であり、そしてこのような実施形態は、本明細書中に開示される材料及び方法の範囲内である。本明細書中に記載されるアッセイは、任意の生物から得られる任意の遺伝物質を分析する際に有用である。
【0019】
本明細書で使用される「ゲノム」、「遺伝物質」又はその他の文法的に変化した用語は、任意の生物由来の遺伝物質を指す。遺伝物質は、ウイルスのゲノムDNAもしくはRNA、ゲノムDNAのような核遺伝物質、又はミトコンドリアDNAもしくは葉緑体DNAのような細胞小器官に存在する遺伝物質である。それはまた、天然もしくは人工の混合物、又はいくつかの生物由来の遺伝物質の混合物に由来する遺伝物質を表す。
【0020】
本明細書中で使用される「標的ゲノム領域」は、生物の遺伝物質における当該領域である。
【0021】
2つの配列に関して使用される場合、「ハイブリダイズする」という用語は、2つの配列が2つの配列間のヌクレオチド塩基対形成を可能にするために、互いに十分に相補的であることを示す。互いにハイブリダイズする配列は、完全に相補的であるが、ある程度までミスマッチを有する。従って、本明細書中に記載される伸長プローブ及びライゲーションプローブの5'末端及び3'末端の配列は、伸長プローブ及びライゲーションプローブが標的配列とハイブリダイズして標的ゲノム領域の捕捉を容易にする限り、標的ゲノム領域の5'末端及び3'末端の対応する標的配列と僅かなミスマッチを有していてもよい。ハイブリダイゼーションのストリンジェンシーに応じて、2つの相補的配列間の約5%~20%までのミスマッチであれば、2つの配列間のハイブリダイゼーションは可能である。典型的には、高ストリンジェンシー条件は、高温及び低塩濃度を有し、低ストリンジェンシー条件は、低温及び高塩濃度を有する。ハイブリダイゼーションには高ストリンジェンシー条件が好ましいため、伸長プローブ及びライゲーションプローブの3'末端及び5'末端の配列は、標的ゲノム領域の3'末端及び5'末端の対応する標的配列に完全に相補的であることが好ましい。
【0022】
本明細書で使用される「識別子」という用語は、4~100のヌクレオチド、好ましくは、10~20のヌクレオチド、さらにより好ましくは、約8又は16のヌクレオチドの既知のヌクレオチド配列を指す。識別子配列の適切な長さは、使用される配列決定技術による。増幅標的ゲノム領域に組み込まれると、識別子配列は、例えば、正しい配列を正しい標的ゲノム領域に割り当てることを可能にする固有の識別部位が提供されることによって、標的ゲノム領域の配列決定及び識別が容易になる。
【0023】
本明細書中で使用される「ペアエンド配列決定」という用語は、二本鎖ポリヌクレオチドの両端部が、二本鎖ポリヌクレオチドの各末端に存在するプライマー結合部位を使用して配列決定される配列決定技術をいう。ペアエンド配列決定は、2つのプライマー結合部位に隣接するポリヌクレオチドの配列を生成するためにコンピューターソフトウェアプログラムを使用して整列される、高品質の配列決定データを生成する。分子の一方の末端のみからの配列決定では、長い配列決定読み取りが行われるにつれて、配列決定の質を低下させるので、二本鎖分子の両端部からの配列決定だと、二本鎖分子の両端部からの高品質データが可能になる。
【0024】
ペアエンド配列決定において、本明細書中に開示された方法のPCR増幅工程の末端で生成される二本鎖の増幅されたライゲーションプローブは、二本鎖のライゲーションプローブの2つの末端に結合する特定のプライマーを使用して配列決定される。ペアエンド配列決定の概要及び原理は、Illumina Sequencing Technology、Illumina、Publication No. 770-2007-002に提供されており、その内容全体が参照により本明細書に援用される。
【0025】
ペアエンド配列決定技術としては、Illumina MiSeq(商標)、Illumina MiSeqDx(商標)、及びIllumina MiSeqFGx(商標)により提供されるものが挙げられるが、これらに限られるものではない。本明細書中に開示されるアッセイにおいて使用できるペアエンド配列決定技術のさらなる例は、当該分野において公知であり、そしてこのような実施形態は、本発明の範囲内である。
【0026】
本明細書中で使用される「ヘアピンアダプター」という語句は、二本鎖ステム及び一本鎖ヘアピンループを含むポリヌクレオチドをいう。ヘアピンアダプターの一本鎖ヘアピンループ領域は、配列決定のためのプライマー結合部位を提供する。このように、ヘアピンアダプターが標的ゲノム配列の両粘着末端とハイブリダイズすると、両末端がヘアピンループでキャップされた二本鎖領域に標的ゲノム領域を含む二本鎖DNAテンプレートが生成される。このようなテンプレートは、単一分子リアルタイム(SMRT)配列決定(PacBio(商標))を介して標的ゲノム領域を配列決定するために使用される。SMRT配列決定の説明及び原理は、Pacific Biosciences(2018)、Publication NoBR108-100318に提供されており、その内容は、その全体が参照により本明細書に援用される。
【0027】
ナノポア技術は、標的ゲノム領域を配列決定するために、本明細書中に開示された方法で使用される。特定のこのような実施形態において、標的ゲノム領域のコピーは、例えば、Nanopore Technology Brochure、Oxford Nanopore Technologies(2019)、及びNanopore Product Brochure、Oxford Nanopore Technologies(2018)に記載されるように、標的ゲノム領域を配列決定するために処理される。これら両方のパンフレットの内容は、その全体が参照により本明細書に援用される。
【0028】
本開示全体を通して、異なる配列は、特定の呼称、例えば、プライマー結合配列、プライマー配列、識別子配列、配列決定プライマー結合配列及び配列決定プライマー配列によって記載される。このような呼称が使用される場合、識別された配列は、対応する配列の少なくとも一部と実質的に同一であるか、又は実質的に逆相補的であると考えられる。例えば、「プライマー配列」は、プライマー配列の少なくとも一部と実質的に同一であるか、又はプライマー配列の少なくとも一部と実質的に逆相補的である配列を記載する。これは捕捉された標的ゲノム領域がプライマー結合配列を含む二本鎖形態に変換される場合、二本鎖標的ゲノム領域は、プライマー結合配列の少なくとも一部と実質的に同一又は実質的に逆相補的な配列を有するプライマーを使用して配列決定されるからである。このように、本明細書では本明細書で開示された方法で使用される異なるポリヌクレオチド及びポリヌクレオチドの一部の説明を単純化するために呼称が使用されるが、当業者であれば、対応する配列の少なくとも一部と適切な実質的に同一又は実質的に逆相補的な配列を使用して、本明細書で開示された方法を実施することができることを認識できるはずである。
【0029】
また、互いに対応する2つの配列、例えば、プライマー結合配列とプライマー配列又は配列決定プライマー結合配列と配列決定プライマー配列は、配列の少なくとも90%の配列同一性、好ましくは、少なくとも95%の配列同一性、さらにより好ましくは、少なくとも97%の配列同一性、最も好ましくは、少なくとも99%の配列同一性を有し、少なくとも70%、好ましくは、少なくとも80%、さらにより好ましくは、少なくとも90%、最も好ましくは、少なくとも95%を超える配列同一性を有する。あるいは、互いに対応し、互いに相補的である2つの配列は、逆相補的であり、逆相補配列において、少なくとも90%の完全一致、好ましくは、少なくとも95%の完全一致、さらに好ましくは、少なくとも97%の完全一致、及び最も好ましくは、少なくとも99%の完全一致であり、配列の少なくとも70%、好ましくは、少なくとも80%、さらに好ましくは、少なくとも90%、及び最も好ましくは、少なくとも95%以上である。このように、互いに対応する2つの配列は、配列の少なくとも70%、好ましくは、少なくとも80%、さらにより好ましくは、少なくとも90%、最も好ましくは、少なくとも95%を超えて、互いにハイブリダイズするか、又は共通の基準配列とハイブリダイズする。好ましくは、互いに対応する2つの配列は、2つの配列の全長にわたって100%同一であるか、又は2つの配列の全長にわたって100%反転相補的である。
【0030】
本開示は、標的ゲノム領域を分析するための従来の方法に関連する課題を解決する材料及び方法を提供する。特に、本開示は、標的ゲノム領域、特に、遺伝的多型を有するか又は有すると考えられる標的ゲノム領域を分析するための材料及び方法を提供する。
【0031】
本明細書に開示された方法は、標的遺伝物質から標的ゲノム領域を捕捉することを提供する。本方法は、
a)伸長プローブ及びライゲーションプローブを、標的ゲノム領域に隣接する第1の標的配列及び第2の標的配列にハイブリダイズする工程であって、
i)伸長プローブは、3'末端に向けて、第1の標的結合配列を含み、5'末端に向けて、第1のプライマー結合配列を含み、
ii)ライゲーションプローブは、5'末端に向けて、第2の標的結合配列を含み、3'末端に向けて、第2のプライマー結合配列を含む工程と、
b)増幅された伸長プローブの3'末端がライゲーションプローブの5'末端に近接するまで、伸長プローブの3'末端を増幅する工程と、
c)増幅された伸長プローブの3'末端をライゲーションプローブの5'末端とライゲーションして、ライゲーションプローブを生成する工程であって、ライゲーションプローブは、5'末端から3'末端まで、第1のプライマー結合配列、第1の標的結合配列、増幅された標的ゲノム領域、第2の標的結合配列、及び第2のプライマー結合配列を含む工程とを含む。
【0032】
伸長プローブは、3'末端に向かって、第1の標的配列とハイブリダイズする配列を含む。伸長プローブ上のこのような配列は、本明細書中では第1の標的結合配列と参照される。伸長プローブは、5'末端に向かって第1のプライマー結合配列を含む。第1の標的結合配列及び第1のプライマー結合配列は、識別子配列等の追加の機能性を提供することができる介在配列を有していてもよい。
【0033】
ライゲーションプローブは、5'末端に向かって、第2の標的配列とハイブリダイズする配列を含む。ライゲーションプローブ上のこのような配列は、本明細書において、第2の標的結合配列と参照される。ライゲーションプローブは、3'末端に向かって第2のプライマー結合配列を含む。第2の標的結合配列及び第2のプライマー結合配列は、識別子配列等の追加の機能性を提供することができる介在配列を有していてもよい。ライゲーションプローブの5'末端はリン酸基を有し、これは、増幅された伸長プローブの3'末端とライゲーションプローブのライゲーションを容易にする。
【0034】
このように、本明細書中に開示された方法は、標的遺伝物質中の特定の標的配列に対する、一対の特別に設計されたオリゴヌクレオチドプローブのハイブリダイゼーションの工程を含む。標的配列は標的ゲノム領域に隣接する。図1は、SNP及びそのSNPに近接しないでハイブリダイズするプローブを含む標的ゲノム領域を示す。第1のプローブ(図1の左側に示される)は、本明細書において「伸長プローブ」と参照され、第2のプローブ(図1の右側に示される)は、本明細書において「ライゲーションプローブ」と参照される。伸長プローブの3'末端の配列は、遺伝物質上の対応する標的配列にハイブリダイズし、ライゲーションプローブの5'末端の配列は、遺伝物質上の対応する標的配列にハイブリダイズする。このように、伸長プローブ及びライゲーションプローブは、対応する標的配列に結合し、これらの標的配列は、標的ゲノム領域に隣接する。
【0035】
伸長プローブ及びライゲーションプローブの各々は、最低約20~約60のヌクレオチドを含有する。特に、伸長プローブの第1の標的結合配列部分は、少なくとも約10~約30のヌクレオチドである。伸長プローブの第1のプライマー結合配列はまた、少なくとも約10~約30のヌクレオチドである。同様に、ライゲーションプローブの第2の標的配列は、少なくとも約10~約30のヌクレオチドであり、ライゲーションプローブの第2のプライマー結合配列は、少なくとも約10~約30のヌクレオチドである。標的結合部位に対するプローブの特異性は、第1及び第2の標的結合配列の長さによって制御することができる。特に、第1及び第2の標的結合配列のより長い長さは、高結合特異性を提供し、第1及び第2の標的結合配列のより短い長さは、低特異性を提供する。当業者であれば、標的ゲノム領域の配列及び特定の生物について利用可能なゲノム配列に基づいて、例えば、ゲノム配列データベースから、第1及び第2の標的結合配列についての適切な配列を決定することができる。
【0036】
標的ゲノム領域の長さ、すなわち、2つのプローブの標的配列間の距離は、解析の目的、標的ゲノム領域の特性、及び実施される場合、解析に使用される配列決定方法に依存する。例えば、目的が標的ゲノム領域における多型を発見することである場合、例えば、SNP、indel、欠失、又は挿入において、約100~約300の塩基対(bp)の標的ゲノム領域が分析される。また、Illumina(商標)の2×150bp配列決定法を使用する場合、約300bpの標的ゲノム領域を分析する。ペアエンド又はナノポアベースの配列決定技術が使用される場合、約1,000bp~約20,000bpの標的ゲノム領域が分析される。あるいは、目的がSNPの遺伝子型を決定することである場合、標的ゲノム領域は、非常に短く、例えば、約10bp~約100bpである。本明細書に開示された方法において、標的ゲノム領域は、少なくとも2~50のヌクレオチドを含む。従って、2つのプローブは、標的遺伝物質上で近接せずにハイブリダイズする。
【0037】
ハイブリダイゼーション工程の終わりに、伸長プローブは第1の標的結合配列を介して第1の標的配列にハイブリダイズし、ライゲーションプローブは第2の標的結合配列を介して第2の標的配列にハイブリダイズする。第1及び第2の標的結合配列は、標的ゲノム領域に隣接している。
【0038】
本明細書中に開示された方法の次の工程は伸長反応を含み、伸長プローブを伸長させる、すなわち、伸長プローブをライゲーションプローブに向けて伸長させる。伸長プローブの伸長は、第1の標的配列と第2の標的配列との間の隙間を満たすように設計される、すなわち、伸長反応は、伸長プローブに標的ゲノム領域の配列を付加する。
【0039】
伸長プローブの伸長は、鎖置換能を欠くDNAポリメラーゼを用いて行うことができる。鎖置換能力を欠くDNAポリメラーゼは、それが第1及び第2の標的配列間の隙間を完全に満たす場合に解離し、従って、それがライゲーションプローブの5'末端に到達する場合に解離する。
【0040】
次の工程において、ライゲーションプローブの5'末端は、例えば、リガーゼ媒介反応において、伸長した伸長プローブの3'末端にライゲーションされる。
【0041】
本開示の目的のために、及び2つのプローブの結合部位に関して、「近接せず」や「近接せずに」という用語は、2つのプローブがそれぞれの標的配列にハイブリダイズする場合、伸長プローブの3'末端が、ライゲーションプローブの5'末端とホスホジエステル結合を形成することができないことを示す。逆に、2つのプローブの結合部位に関して、「近接」という用語は、2つのプローブがそれらのそれぞれの標的配列にハイブリダイズする場合、伸長プローブの3'末端が、ライゲーションプローブの5'末端とホスホジエステル結合を形成できることを示す。
【0042】
本明細書中に開示された方法は、伸長工程において2つのプローブ間の隙間(gap)を充填することを含むので、標的配列が標的ゲノム領域に隣接する限り、プローブは、標的領域の周りの任意の場所で標的配列に結合するように設計される。このように、増幅工程は、プローブ設計の柔軟性を提供し、標的ゲノム領域から多型を識別する機会を増加させる。さらに、隙間を充填する工程のために、プローブは多型を有さないか又は有さないと予想される配列に基づいて設計され、これにより、1つの多型、例えば、単一ヌクレオチド多型(SNP)を識別するために、複数のプローブを設計することが回避される。さらに、伸長領域は、複数の多型を捕捉することができ、1つの標的ゲノム領域を分析することは、一対のプローブの標的配列が隣接する領域に存在する複数の多型についての情報を提供することができる。
【0043】
伸長反応の終わりに、伸長プローブを追加の配列で伸長させ、伸長した伸長プローブの3'末端をライゲーションプローブの5'末端に近接させる。従って、伸長反応の終わりにおいて、伸長した伸長プローブ及びライゲーションプローブは、ライゲーション反応のための基質である。
【0044】
従って、本明細書中に開示された方法の次工程は、伸長した伸長プローブの3'末端をライゲーションプローブの5'末端とライゲーションすることを含む。ライゲーション反応は、伸長した伸長プローブの3'-OH基とライゲーションプローブの5'-リン酸基との間にホスホジエステル結合を形成することを含む。このようにして、2つのプローブは一緒に結合される。特定の実施形態において、ライゲーション反応のための5'-リン酸基を提供するために、ライゲーションプローブは、5'-リン酸基を有するように設計される。
【0045】
従って、ライゲーション工程の特定の実施形態において、伸長した伸長プローブの3'末端をライゲーションプローブの5'末端と共有結合するリガーゼが提供される。好ましい態様において、リガーゼはDNAリガーゼである。DNAリガーゼは、相補鎖上の近接部位に結合した2つのポリヌクレオチド鎖(の末端)間のホスホジエステル結合の形成を触媒することができる酵素である。DNAリガーゼは、通常、二本鎖DNAのニックを封鎖するための補因子としてATP(EC6.5.1.1)又はNAD(EC6.5.1.2)を必要とする。ライゲーション工程において使用されるDNAリガーゼには、T4DNAリガーゼ、E. coliDNAリガーゼ、Thermus aquaticus(Taq)リガーゼ、Thermus thermophilusDNAリガーゼ、又はPyrococcusDNAリガーゼが含まれる。本明細書中に開示された方法における使用に適切なさらなるリガーゼは当該分野において公知であり、そしてこのような実施形態は、本発明の範囲内である。
【0046】
伸長した伸長プローブ及びライゲーションプローブのライゲーションはまた、伸長プローブ及びライゲーションプローブの3'-OH基と5'-リン酸基との間のホスホジエステル結合以外の結合によって媒介されることもできる。特定のこのようなライゲーションは、非特許文献5に記載されている。ライゲーション及び伸長プローブを結合するために使用される人工ライゲーションのさらなる実施形態は当技術分野で公知であり、そのような実施形態は、本発明の範囲内である。
【0047】
本明細書中に開示された方法の特定の実施形態において、ライゲーション工程は、取り込まれていないプローブ、ライゲーションされていない伸長生成物、例えば、プローブ結合オフ標的から生じる伸長プローブ、及び標的ゲノムDNA等の、反応混合物から望ましくない材料を除去するように設計された工程に続くこともできる。この工程は任意であるが、実施した場合、反応の特異性がかなり改善される。
【0048】
特定の実施形態において、不要な物質の除去が、エキソヌクレアーゼを用いて行われる。このような除去のためにエキソヌクレアーゼを使用する場合、伸長プローブ及びライゲーションプローブの一方又は両方を修飾して、ライゲーションプローブをエキソヌクレアーゼ媒介消化から保護する。
【0049】
エキソヌクレアーゼは、一本鎖及び二本鎖核酸に対して、5'‐3'エキソヌクレアーゼ活性、3'‐5'エキソヌクレアーゼ活性、又は5'‐3'及び3'‐5'エキソヌクレアーゼ活性の両方を有する。本明細書中に開示された方法において使用されるエキソヌクレアーゼとしては、エキソヌクレアーゼI、エキソヌクレアーゼIII、エキソヌクレアーゼV、エキソヌクレアーゼIV、エキソヌクレアーゼT、ラムダエキソヌクレアーゼ、T7エキソヌクレアーゼ、ストラナーゼエキソヌクレアーゼ、及び3'-5'エキソホスホジエステラーゼが挙げられるがこれらに限られるものではない。適切なエキソヌクレアーゼ及び伸長プローブ及び/又はライゲーションプローブの対応する保護は、当業者であれば選択できる。
【0050】
例えば、3'-5'エキソヌクレアーゼが使用される場合、ライゲーションプローブは、3'末端に向かって修飾される。好ましくは、このような修飾は、3'末端のヌクレオチド上にあるが、3'-5'エキソヌクレアーゼが3'末端からヌクレオチドのいくつかを切断し、修飾されたヌクレオチドでブロックされて、ライゲーションプローブ全体を切断しないように、3'末端ではなく、3'末端の遠位のヌクレオチドに対してもまた、修飾することができる。
【0051】
あるいは、5'-3'エキソヌクレアーゼが使用される場合、伸長プローブは5'末端に向かって修飾される。好ましくは、このような修飾が、5'末端のヌクレオチド上にあるが、5'-3'エキソヌクレアーゼが5'末端からヌクレオチドのいくつかを切断し、修飾されたヌクレオチドでブロックされて、ライゲーションプローブ全体を切断しないように、5'末端ではなく、5'末端の遠位のヌクレオチドに対してもまた、修飾することができる。
【0052】
特定の実施形態において、5'-3'及び3'-5'エキソヌクレアーゼの両方を有するエキソヌクレアーゼが使用されるか、又は5'-3'エキソヌクレアーゼ及び3'-5'エキソヌクレアーゼの組み合わせが使用される。このような実施形態において、伸長プローブは、5'末端に向かって修飾され、ライゲーションプローブは、3'末端に向かって修飾される。好ましくは、伸長プローブのこのような修飾が、5'末端のヌクレオチド上にあるが、5'-3'エキソヌクレアーゼが5'末端からヌクレオチドのいくつかを切断し、修飾されたヌクレオチドでブロックされて、ライゲーションプローブ全体を切断できないように、5'末端ではなく、5'末端の遠位のヌクレオチドに対してもまた、修飾することができる。同様に、このようなライゲーションプローブの修飾が、3'末端のヌクレオチド上にあるが、3'末端ではなく、3'末端から遠位のヌクレオチドに対しても行うことができ、その結果、3'-5'エキソヌクレアーゼは3'末端からヌクレオチドのいくつかを切断することができるが、修飾されたヌクレオチドではブロックされて、ライゲーションプローブ全体を切断することはできない。
【0053】
当業者であれば、3'末端及び/又は5'末端に対する適切な修飾を判断することができる。このような修飾には、ヌクレオチド間にチオホスフェート結合を導入すること、オリゴヌクレオチドの5'及び/又は3'末端に向かって2つ以上のホスホロアミダイト及びホスホロモノチオエート及び/又はホスホロジチオエート結合を組み込むこと、近接するヌクレオチド間の1つ以上のホスホジエステル結合をホルムアセタール/ケタール型結合で置換すること、3'末端ヒドロキシル基をホスホリル又はアセチル基でブロックすること、3'末端ホスホロアミデート修飾を導入すること、ペプチド核酸(PNA)又はロックド核酸(LNA)を導入すること、1つ以上のチオホスフェート基を導入すること、又はオリゴヌクレオチド骨格に2‐O‐チルリボース糖基を導入することが含まれる。
【0054】
本明細書中に開示された方法において有用な修飾の例は、特許文献7、非特許文献6、非特許文献7、非特許文献8及び非特許文献9に開示されているが、これらに限られるものではない。これらの参考文献の各々、その全体が本明細書中に参照により援用される。
【0055】
特定の実施形態において、不要な遺伝物質の除去及びライゲーションプローブの分離は、ライゲーションプローブ及び伸長プローブの一方又は両方にコンジュゲートする部分に特異的に結合し、ライゲーションプローブ中に存在する結合剤を使用して行うことができる。例えば、伸長プローブの5'末端をビオチンに結合して、ライゲーションプローブをストレプトアビジンへのライゲーションプローブの特異的結合を用いて単離することができる。同様に、ライゲーションプローブの3'末端をビオチンにコンジュゲートすることができ、ライゲーションプローブをストレプトアビジンへのライゲーションプローブの特異的結合を用いて単離することができる。
【0056】
5'末端もしくは3'末端に、又はライゲーションプローブ及び/又は伸長プローブ内にコンジュゲートされるさらなる部分、そしてライゲーションプローブの分離のために使用される対応する結合剤は当該分野で公知であり、そしてこのような実施形態は、本発明の範囲内である。
【0057】
特定の実施形態において、ライゲーション工程の終わりに、そして望ましくない物質の任意の除去によって、5'末端から3'末端まで、第1のプライマー結合配列、第1の標的結合配列、増幅された標的ゲノム領域、第2の標的結合配列、及び第2のプライマー結合配列を含むライゲーションプローブが生成される。ライゲーションプローブの形成及び任意の精製は、標的ゲノム領域の捕捉を意味している。
【0058】
ライゲーションプローブを処理して、さらなる分析のためにライゲーションプローブを生成する。このような処理は、3つの主要な目的、すなわち、例えば、PCRを介した、検出可能なレベルへのライゲーションプローブの増幅、サンプル特異的識別子(インデックス、バーコード、郵便番号、アダプター等としても当該分野で参照される)の組み込み、及びライゲーションプローブの配列、すなわち、標的ゲノム領域の配列を容易にする特定の配列のライゲーションプローブへの組み込み、に役立つように設計される。
【0059】
従って、いくつかの実施形態において、伸長した伸長プローブの形態で捕捉された標的ゲノム領域を含むライゲーションプローブは増幅されて、ライゲーションプローブのコピーを生成する。このような増幅には、PCRにおいて、増幅プライマー対を使用して、二本鎖形態のライゲーションプローブのコピーを生成することが含まれる。増幅プライマー対は、得られる二本鎖ライゲーションプローブが、標的ゲノム領域と第1及び第2のプライマー結合配列に加えて、第1の配列決定プライマー結合配列、第1の識別子配列、第2の配列決定プライマー結合配列及び第2の識別子配列のうちの1つ以上をさらに含むように設計することができる。
【0060】
特定の実施形態において、増幅プライマー対は、
i)5'末端から3'末端に、第1の配列決定プライマー結合配列、第1の識別子配列及び第1のプライマー配列のうち1つ以上を含む、伸長プローブ増幅プライマーと、
ii)5'末端から3'末端に、第2の配列決定プライマー結合配列、第2の識別子配列及び第2のプライマー配列のうちの1つ以上を含むライゲーションプローブ増幅と
を含む。
【0061】
好ましい実施形態において、増幅プライマー対は、
i)5'末端から3'末端に、第1の配列決定プライマー結合配列、第1の識別子配列及び第1のプライマー配列を含む伸長プローブ増幅プライマーと、
ii)5'末端から3'末端に、第2の配列決定プライマー結合配列、第2の識別子配列及び第2のプライマー配列を含むライゲーションプローブ増幅プライマーと
を含む。
【0062】
この工程において、PCRを用いて、伸長プローブ増幅プライマー及びライゲーションプローブ増幅プライマーを含む増幅プライマー対を使用して、ライゲーションプローブを増幅する。ライゲーションプローブ増幅プライマーは、ライゲーションプローブの3'末端、すなわち、ライゲーションプローブのライゲーションプローブ側に結合する。伸長プローブ増幅プライマーは、ライゲーションプローブの5'末端の補体に、すなわち、ライゲーションプローブの伸長プローブ側に結合する。
【0063】
伸長プローブ増幅プライマーは、5'末端から3'末端に、第1の配列決定プライマー結合配列、任意で、第1の識別子配列及び第1のプライマー配列を含む。第1のプライマー配列は、ライゲーションプローブの5'末端に向かって存在する第1のプライマー結合配列の補体とハイブリダイズする。第1のプライマー結合配列は、伸長プローブの一部としてライゲーションプローブに導入される。
【0064】
ライゲーションプローブ増幅プライマーは、5'末端から3'末端に、第2の配列決定プライマー結合配列、任意で、第2の識別子配列及び第2のプライマー配列を含む。第2のプライマー配列は、ライゲーションプローブの3'末端に向かって存在する第2のプライマー結合配列とハイブリダイズする。第2のプライマー結合配列は、ライゲーションプローブの一部としてライゲーションプローブに導入される。
【0065】
特定の実施形態において、増幅プライマー対の一方又は両方のプライマーは、増幅工程の終わりに生成される二本鎖標的ゲノム領域の下流配列決定を容易する追加の配列を含む。配列決定を容易にする追加の配列は、例えば、Illumina(商標プラットフォーム上で配列決定、例えば、ペアエンド又はシングルリード配列決定を開始するために、フローセル結合及び配列決定プライマー結合に必要な配列の少なくとも一部、PacBio配列決定のようなヘアピンアダプターベースの配列決定に必要なヘアピンアダプターの少なくとも一部、又はナノポア技術ベースのシーケンサーを通して分子を適切に誘導するのに必要な配列の少なくとも一部を含むことができる。得られた分子が、配列決定に必要な配列の一部のみを含む場合、残部は、アダプターライゲーションのような当該分野で公知の任意の他の様式によって導入される。
【0066】
ライゲーションプローブと増幅プライマー対の混合物をPCRにかける。
【0067】
ライゲーションプローブ及び増幅プライマー対に加えて、PCR反応混合物は、DNAポリメラーゼと、デオキシリボヌクレオチド(dNTP)、金属イオン(例えば、Mg2+及びMn2+)及びバッファのようなPCRのための他の試薬とを含む。PCR反応において使用される追加の試薬は当業者に周知であり、そしてこのような実施形態は、本発明の範囲内である。
【0068】
典型的に、PCRは、25~40サイクルであり、各サイクルに、異なる温度での変性、アニーリング、及び伸長の工程が含まれる。最終伸長の工程は、PCRの最後のサイクルの終わりに行うことができる。サイクル数、サイクル内の様々な工程の持続時間及び温度をはじめとするPCRの様々な態様を設計することは、当業者には明らかであり、そのような実施形態は本発明の範囲内である。
【0069】
ライゲーションプローブ増幅プライマーが、ライゲーションプローブとハイブリダイズする場合、図1の工程4に提供される構造が生成される。このように、PCRの最初のサイクルの間、ライゲーションプローブの相補的コピーは、増幅プライマーの全ての成分を用いて生成される。PCRの第2の周期において、伸長プローブ増幅プライマーは、ライゲーションプローブの相補的コピーに結合する。
【0070】
PCRの終わりに、標的ゲノム領域を含む二本鎖形態のライゲーションプローブの複数のコピーが生成され、これは、検出や配列決定といったさらなる分析に好適である。このような二本鎖DNAの例は、図1の工程5にある。この二本鎖DNAは、一端から他端まで、第1の配列プライマー結合配列、第1の識別子配列、第1のプライマー配列、第1の標的配列、標的ゲノム領域、第2の標的配列、第2のプライマー配列、第2の識別子、第2の配列プライマー結合配列、及び標的ゲノム領域を含む二本鎖DNAの配列を容易にする任意の追加の配列のうちの1つ以上に対応する配列、を含む。
【0071】
増幅された標的ゲノム領域は、当該分野で公知の技術を使用して、例えば、標的ゲノム領域内の配列に相補的な標識プローブを使用して検出することができる。例えば、増幅された標的ゲノム領域は、反応の濁度、蛍光検出、又は標識された分子ビーコンに基づいて検出することができる。
【0072】
「標識」という用語は、分光学的、光化学的、生化学的、免疫化学的、化学的、又は他の物理的手段によって検出可能な分子をいう。例えば、有用なラベルには、蛍光色素(フルオロフォア)、蛍光消光剤、発光剤、高電子密度試薬、ビオチン、ジゴキシゲニン、32P及び他の同位体、又は例えばオリゴヌクレオチドに組み込むことによって検出可能にされる他の分子が含まれる。この用語には、標識剤の組み合わせ、例えば、各々が例えば、特定の波長又は波長の組み合わせにおいて、固有の検出可能な署名を提供する蛍光体の組み合わせが含まれる。
【0073】
蛍光体としては、Alexa色素(例えば、Alexa350、Alexa488等)、AMCA、BODIPY630/650、BODIPY650/665、BODIPY-FL、BODIPY-R6G、BODIPY-TMR、BODIPY-TRX、カスケードブルー、Cy2、Cy3、Cy5、Cy5.5、Cy7、Cy7.5、Dylight色素(Dylight405、Dylight488、Dylight549、Dylight550、Dylight649、Dylight680、Dylight750、Dylight800)、6-FAM、フルオレセイン、FITC、HEX、6-JOE、オレゴングリーン488、オレゴングリーン500、オレゴングリーン514、パシフィックブルー、ローダミングリーン、ローダミンレッド、ROX、R-フィコエリトリン(R-PE)、スターブライトブルー色素(例えば、スターブライトブルー520、スターブライトブルー700)、TAMRA、TET、テトラメチルローダミン、テキサスレッド、及びTRITCが挙げられるが、これらに限られるものではない。
【0074】
増幅された標的ゲノム領域はまた、当該分野で公知の技術、例えば、ナノポア配列決定(Oxford Nanopore Technologies(商標))、可逆的色素ターミネーター配列決定(Illumina(商標))及び単一分子リアルタイム(SMRT)配列決定(PacBio(商標)))を使用して配列決定することができる。様々な配列決定装置、例えば、携帯型Nanopore Minion(商標)又はベンチトップマシーン、Nanopore Promethion(商標)、PacBio Sequel(商標)又はIllumina HiSeq(商標)を用いて、配列決定することができる。配列決定工程はまた、いくつかの標的の多重検出及び/又は多型検出のために使用することもできる。好ましくは、増幅された標的ゲノム領域の配列決定は、Illumina、PacBio又はNanopore装置のようなハイスループット配列決定装置で行われる。
【0075】
当業者であれば、標的ゲノム領域又は標的ゲノム領域の長さを配列決定するために使用される技術のようなアッセイの特定の態様によって、増幅工程中に上記の配列の全てを導入する必要はないことが分かっているはずである。例えば、増幅プライマー対は、識別子配列の一方又は両方が存在しない場合に設計される。1つの標的ゲノム領域のみが調べられる場合、識別子配列は必要ではない場合がある。また、標的ゲノム領域が短い、例えば、約500bp未満である場合、両方の識別配列は必要ではない場合がある。
【0076】
さらに、増幅プライマー対は、配列決定プライマー結合配列の一方又は両方が存在しない場合に設計される。例えば、標的ゲノム領域が短い、例えば、約500bp未満である場合、又は単一の配列決定プライマーが配列決定に必要である場合(例えば、PacBio)、配列決定プライマー結合配列のうちの1つのみで、配列決定目的には十分である。場合によっては、ライゲーションプローブ及び伸長プローブは、配列決定プライマー結合配列等の、配列決定に必要な配列の少なくとも一部を既に含んでいることがある。標的ゲノム領域を含む二本鎖DNAの配列決定を促す追加の任意のさらなる配列を、増幅プライマー対の一方又は両方のプライマーを介して導入することもできる。また、配列決定プライマー結合配列の両方が存在しなくてもよく、二本鎖増幅ライゲーションプローブのさらなる処理及びその後の配列決定を促す代わりの配列を導入することができる。このような配列には、制限酵素部位、特に、低頻度切断制限酵素部位が含まれる。
【0077】
低頻度切断制限エンドヌクレアーゼの非限定的な例は、特許文献4に記載されており、これは、その全体、特に表1が参照により本明細書に援用される。
【0078】
本明細書中で使用される「低頻度切断制限エンドヌクレアーゼ」は、その制限部位が遺伝物質中でまれにしか生じないエンドヌクレアーゼである。例えば、ヒトゲノムでは、低頻度切断制限エンドヌクレアーゼは、エンドヌクレアーゼであり、その制限部位は平均50~100kbごと、好ましくは100~200kbごと、より好ましくは200~400kbごと、さらにより好ましくは400~600kbごとに生じる。ヒトゲノムの低頻度切断制限エンドヌクレアーゼ及びその制限部位の例を以下の表1に示す。
【0079】
【表1】
【0080】
さらなる低頻度切断エンドヌクレアーゼは、例えば、制限エンドヌクレアーゼ((Nucleic Acids and Molecular Biology)by Pingoud(Editor)、Springer; 1 ed(2004))に記載されている。例えば、New England BioLabs(Beverly、MA)から、ホーミングクラスのエンドヌクレアーゼ等、多くの低頻度切断エンドヌクレアーゼも市販されている。低頻度切断エンドヌクレアーゼのさらに別の例は当技術分野で公知であり、そのような実施形態は、本発明の範囲内である。
【0081】
低頻度切断制限酵素部位を、対応の制限酵素で処理し、粘着末端を有する二本鎖増幅ライゲーションプローブを生成することができる。増幅された標的ゲノム領域の切断されたコピーの粘着末端を用いて、標的ゲノム領域をヘアピンアダプターとコンジュゲートさせることができる。例えば、増幅プライマー対を介して増幅標的ゲノム領域に導入された制限部位に相補的なオーバーハングを含むヘアピンアダプターを、制限酵素で処理された増幅標的ゲノム領域のコピーと混合して、他の配列の中でもヘアピンアダプターに隣接する標的ゲノム領域を含む二本鎖標的ゲノム領域を生成することができる。
【0082】
IIS型制限酵素に対応する追加の制限エンドヌクレアーゼ部位を用いて、尾部交換(swapping)に用いることを含め、二本鎖増幅ライゲーションプローブを生成することができる。好ましい実施形態において、BsaI及びMlyI制限エンドヌクレアーゼ部位が用いられる。MlyIは平滑末端を、BsaIはオーバーハングを提供する。IIS型制限エンドヌクレアーゼ、認識部位、及び制限酵素を使用した消化後のヌクレオチドオーバーハングの量(ある場合)を以下の表2に示す。
【0083】
【表2】
【0084】
特定の実施形態において、複数の標的ゲノム領域が捕捉され、任意で、検出又は配列決定等、さらに分析される。複数の標的ゲノム領域について、複数の一対の伸長プローブ及びライゲーションプローブが使用される。伸長プローブ及びライゲーションプローブの各対は、標的ゲノム領域に隣接する配列に応じて、固有の第1及び第2の標的結合配列を含む。しかしながら、伸長プローブ及びライゲーションプローブの複数の一対の各々は、同じ第1のプライマー結合配列及び同じ第2のプライマー結合配列を有することができる。
【0085】
従って、本明細書に開示される材料及び方法の特定の実施形態は、遺伝物質から複数の標的ゲノム領域を捕捉することを提供する。本方法は、
a)複数の一対のプローブを複数の一対の標的配列にハイブリダイズする工程であって、各対の標的配列は、複数の標的ゲノム領域から1つの標的ゲノム領域に隣接していて、各対のプローブは、伸長プローブ及びライゲーションプローブを含み、各対のプローブについて、
i)伸長プローブは、3'末端に向かって第1の標的結合配列を含み、5'末端に向かって第1のプライマー結合配列を含み、
ii)ライゲーションプローブは、5'末端に向かって第2の標的結合配列を含み、3'末端に向かって第2のプライマー結合配列を含み、第1の標的結合配列及び第2の標的結合配列は、標的ゲノム領域に隣接する第1の標的配列及び第2の標的配列にそれぞれ結合している工程と、
b)増幅された伸長プローブの3'末端が、対応するライゲーションプローブの5'末端に近接するまで、伸長プローブの3'末端を伸長する工程と、
c)増幅された伸長プローブの3'末端を、対応するライゲーションプローブの5'末端とライゲーションして、複数のライゲーションプローブを生成する工程であって、各ライゲーションプローブは、5'末端から3'末端まで、第1のプライマー結合配列、第1の標的結合配列、増幅された標的ゲノム領域、第2の標的結合配列、及び第2のプライマー結合配列を含む工程と
を含む。
【0086】
特定の実施形態において、組み込まれていないプローブ、ライゲーションされていない伸長生成物、及び標的遺伝物質のうちの1つ以上を含むライゲーションプローブ以外の成分を除去することができる。
【0087】
標的ゲノム領域を捕捉する、例えば、伸長プローブ及びライゲーションプローブ、標的ゲノム領域の長さ、第1及び第2のプライマー結合配列を設計する、上記の態様はまた、複数の標的ゲノム領域を捕捉する本方法にも適用可能である。
【0088】
特定の実施形態において、本明細書に開示された方法は、増幅プライマー対を使用してPCRにおいて複数のライゲーションプローブを増幅して、第1の配列決定プライマー結合配列、第1の識別子配列、第2の配列決定プライマー結合配列、及び第2の識別子配列のうちの1つ以上をさらに含む複数の二本鎖ライゲーションプローブを生成することを含み、増幅プライマー対は、
i)5'末端から3'末端に、第1の配列決定プライマー結合配列、第1の識別子配列、及び第1のプライマー配列のうち1つ以上を含む伸長プローブ増幅プライマーと、
ii)5'末端から3'末端に、第2の配列決定プライマー結合配列、第2の識別子配列、及び第2のプライマー配列のうちの1つ以上を含むライゲーションプローブ増幅プライマーとを含む。
【0089】
好ましくは、増幅プライマー対は、
i)5'から3'末端に、第1の配列決定プライマー結合配列、第1の識別子配列、及び第1のプライマー配列を含む伸長プローブ増幅プライマーと、
ii)5'から3'末端に、第2の配列決定プライマー結合配列、第2の識別子配列、及び第2のプライマー配列を含むライゲーションプローブ増幅プライマーと
を含む。
【0090】
特定の実施形態において、増幅プライマー対の一方又は両方のプライマーは、増幅工程の終わりに生成される二本鎖標的ゲノム領域の下流配列決定を容易する追加の配列を含む。配列決定を容易にする追加の配列は、例えば、Illumina(商標)プラットフォーム上で配列決定、例えば、ペアエンド又はシングルリード配列決定を開始するために、フローセル結合及び配列決定プライマー結合に必要な配列の少なくとも一部、PacBio配列決定のようなヘアピンアダプターベースの配列決定に必要なヘアピンアダプターの少なくとも一部、又はナノポア技術ベースのシーケンサーを通して分子を適切に誘導するのに必要な配列の少なくとも一部を含むことができる。得られた分子が、配列決定に必要な配列の一部のみを含む場合、残部は、アダプターライゲーションのような当該分野で公知の任意の他の様式によって導入される。
【0091】
遺伝物質から複数の標的ゲノム領域を捕捉するために、プローブ対は、同じ第1及び第2のプライマー結合配列を含むように設計される。従って、1つのサンプルから複数の捕捉された標的ゲノム領域を増幅するために、増幅プライマー1対のみを使用することができる。また、同じ第1及び第2の配列決定プライマーを、その後の配列決定反応(実施される場合)において使用して、複数の捕捉された標的ゲノム領域を配列決定することができる。従って、増幅プライマー対の一方のプライマーは、第1の配列決定プライマー結合配列、第1の識別子配列及び第1のプライマー配列のうちの1つ以上を含み、一方、増幅プライマー対の他方のプライマーは、第2の配列決定プライマー結合配列、第2の識別子配列及び第2のプライマー配列のうちの1つ以上を含む。第1及び第2の識別子配列は、互いに同一であってもよく、第1及び第2のプライマー配列は互いに同一であってもよい。
【0092】
このように、複数の標的ゲノム領域を捕捉するための方法の増幅工程の終わりに、複数の増幅されたゲノム領域のコピーが生成され、各コピーは、第1の配列決定プライマー結合配列、第1の識別子配列、第1のプライマー配列、複数の標的ゲノム領域のうちの1つ、第2のプライマー配列、第2の識別子配列、及び第2の配列決定プライマー配列を含む。
【0093】
特定の実施形態において、複数の標的ゲノム領域はさらに分析され、例えば、検出又は配列決定される。増幅された標的ゲノム領域は、当該分野で公知の技術を使用して、例えば、標的ゲノム領域内の配列に相補的な複数の標識プローブを使用して検出される。例えば、増幅された標的ゲノム領域は、反応の濁度、蛍光検出、又は標識された分子ビーコンに基づいて検出される。標的ゲノム領域を検出する上述した態様はまた、複数のゲノム領域を検出するのにも適用可能である。
【0094】
複数の増幅された標的ゲノム領域はまた、当該分野で公知の技術を使用して配列決定される。標的ゲノム領域を検出する上述した態様はまた、複数のゲノム領域を検出するのにも適用可能である。
【0095】
特に、特定の実施形態において、複数のサンプルからの複数の標的ゲノム領域をプールし、配列決定する。このような実施形態において、複数のサンプルから複数の標的ゲノム領域に対応する複数の配列読み取りが得られる。特定の読み取りのために、固有の第1及び/又は第2の識別子配列を使用して、読み取りを対応するサンプルに割り当て、読み取り中の捕捉された標的ゲノム領域の配列を、既知のデータベースと比較して、配列をサンプル中の標的ゲノム領域に割り当てる。このように、1つの反応混合物中の多くの標的ゲノム領域を配列決定するために、僅か1つか2つの配列決定プライマーが使用されるが、配列決定読み取りの各々は、適切な供給源サンプル及び適切な標的ゲノム領域に系統的かつ正確に起因するものである。
【0096】
特定の実施形態において、複数のサンプルからのサンプル中の複数の標的ゲノム領域は、2つの配列識別子の固有の組み合わせを含む増幅プライマー対を使用して増幅される。従って、複数のサンプルからの2つのサンプルは、第1及び第2の識別子の同じ組み合わせを有さない。例えば、12個の固有の第1の識別子と8個の固有の第2の識別子を使用して、第1の識別子と第2の識別子の96個の固有の組み合わせを生成することができる。このように、僅か20個の識別子の異なる組み合わせを使用して、96個のサンプルを一意に識別することができる。
【0097】
そのような実施形態において、特定の読み取りについて、固有の第1の識別子配列及び第2の識別子配列を使用して、読み取りを対応するサンプルに割り当て、読み取り中の捕捉された標的ゲノム領域の配列を、既知のデータベースと比較して、配列をサンプル中の標的ゲノム領域に割り当てる。このように、1つの反応混合物中の多くの標的ゲノム領域を配列決定するために、僅か1つか2つの配列決定プライマーが使用されるが、配列決定読み取りの各々は、適切な供給源サンプル及び適切な標的ゲノム領域に系統的かつ正確に起因するものである。
【0098】
単一の標的ゲノム領域の検出又は配列決定と同様に、当業者であれは、増幅プライマー対がどのように設計されるかによって、増幅プライマー対中の配列のいくつかが存在しないことが分かるはずである。例えば、特に、分析される標的ゲノム領域が、約500bp未満のように短い場合、又は単一の配列決定プライマーが配列決定に必要とされる場合(例えば、PacBio)、1つのみの識別子配列のみが存在する、又は1つのみの配列決定プライマー結合配列が存在する。場合によっては、ライゲーションプローブ及び伸長プローブは、配列決定プライマー結合配列等の、配列決定に必要な配列の少なくとも一部を既に含んでいる。標的ゲノム領域を含む二本鎖DNAの配列決定を容易するさらなる配列をまた、増幅プライマー対の一方又は両方のプライマーを介して導入することもできる。また、配列決定プライマー結合配列の両方が存在しなくてもよく、代わりに、二本鎖増幅標的ゲノム領域のさらなる処理及びその後の配列決定を容易にする配列を導入することができる。このような配列には、制限酵素部位、特に、低頻度切断制限酵素部位が含まれる。上述した低頻度切断制限酵素もまた、本発明のこれらの実施形態において使用される。
【0099】
本明細書中に開示された方法を実施するためのキットもまた想定される。特定のこのようなキットは、1つ以上の標的ゲノム領域を捕捉するように設計された特定の伸長プローブ及びライゲーションプローブ、伸長プローブ増幅プライマー、1つ以上の捕捉された標的ゲノム領域を増幅するためのライゲーションプローブ増幅プライマー、DNAリガーゼ、ポリメラーゼ及びPCRのための他の試薬、配列決定試薬、アッセイから得られた配列決定データを処理するように設計されたコンピュータソフトウェアプログラム、任意で、アッセイを実施するための使用説明書を提供する材料を含む。
【0100】
特定の実施形態において、キットは、1つ以上の特定の標的ゲノム領域についてカスタマイズされる。例えば、ユーザが1つ以上の標的ゲノム領域の配列を提供すると、1つ以上の標的配列を分析するために、本明細書中に開示されるアッセイを実行するキットが生成される。
【0101】
本明細書中に開示された方法において使用される伸長プローブ及びライゲーションプローブの合成は、典型的には、特に、プローブが修飾を含み、例えば、5'リン酸及び/又は修飾オリゴヌクレオチドを含む場合、高価である。このようなプローブを合成するための従来の方法には、例えば、商業的ベンダーによる、ホスホロアミダイトアプローチが含まれる。このアプローチは、一度に1つのオリゴヌクレオチドを合成及び精製し、最終的に、一群の一本鎖オリゴヌクレオチドを生じることを含む。
【0102】
標的ゲノム領域を分析する本明細書に開示された方法は、ライゲーションプローブ及び伸長プローブが、標的ゲノム領域に隣接する配列に結合するため、各標的領域について2つのオリゴヌクレオチドを必要とする。従来の技術は、対立遺伝子特異的オリゴヌクレオチドを使用するため、二対立遺伝子標的ゲノム領域当たり3つのオリゴヌクレオチドを必要とする。本明細書中に開示された方法は、これらの方法が標的ゲノム領域あたり僅か2つのオリゴヌクレオチドしか必要でないため、従来の方法を改善するものである。
【0103】
標的ゲノム領域あたり3つのオリゴヌクレオチドと比較して、標的ゲノム領域あたり2つのオリゴヌクレオチドを合成するコストが低減されたとしても、一対のライゲーションプローブ及び伸長プローブを合成するコストのさらなる低減が望ましい。本発明の方法が複数の標的ゲノム領域を同時に分析するのに使用できることを考慮すると、一対のライゲーションプローブ及び伸長プローブを合成するコストの低減は、数千の標的ゲノム領域を分析するために設計されたアッセイのための総コスト節約に指数関数的に反映する。
【0104】
そのため、本発明の特定の実施形態は、本明細書中に開示された方法において使用するための二本鎖形態のライゲーションプローブ及び/又は伸長プローブを生成する方法を提供する。これらの方法はスケーラブルであり、オリゴヌクレオチドを合成するコストを、典型的には、少なくとも10倍、そして潜在的には100~1,000倍も低減する。
【0105】
本発明の特定の実施形態は、一本鎖オリゴヌクレオチドから二本鎖プローブを生成する方法を提供する。このアプローチは、染色体の両方の鎖を標的とし、それぞれ各鎖に対して伸長プローブ及びライゲーションプローブを構成する二本鎖プローブを生成するために設計される。このような一本鎖オリゴヌクレオチドは、本明細書では「一本鎖プレプローブ」と呼ばれる。配列決定プライマー結合配列等の、配列決定に必要な配列の少なくとも一部の修飾の付加及び包含を可能にするために、2つ以上のプローブ群を生成することができる。Illuminaプラットフォーム上での配列決定の例として、本明細書中で上流及び下流プローブとして定義される、プローブの2つのグループが構築され、これらは、それぞれ、i5及びi7Illuminaアダプター配列の少なくとも一部に対応する配列を含む。特定の実施形態において、上流二本鎖プローブは、標的領域の左側をハイブリダイズし、一方、下流二本鎖プローブは、標的領域の右側を標的とする。二本鎖ライゲーション及び伸長上流プローブを生成する方法は、
a)5'末端から3'末端に向かって、第1の尾部、第1の制限酵素のための第1の制限部位、標的結合配列、第2の制限酵素のための第2の制限部位、及び第2の尾部を含む一本鎖又は二本鎖プレプローブを提供する工程であって、二本鎖プレプローブは、一本鎖プレプローブをコピーするために適切なプライマーを使用するPCRにおいて任意に生成される工程と、
b)新たな所望の配列の少なくとも一部を含むように遺伝的に修飾された永久尾部を一時的な第1又は第2の尾部で置き換える尾部交換反応を、任意で、行う工程であって、
i)二本鎖プレ上流プローブを、第1の制限酵素で消化して、第1のプレ上流尾部又はその一部を除去して、オーバーハングを生成し、
ii)第1の制限酵素で消化された二本鎖プレ上流プローブを永久尾部にライゲーションすることを含み、永久尾部分子は、遺伝的修飾と、消化された二本鎖プレ上流プローブのオーバーハングに相補的なオーバーハングを含む上流永久尾部の少なくとも一部とを含む、工程と、
c)永久尾部にライゲーション二本鎖プレ上流プローブを、任意で、精製する工程と、
d)第1の尾部又は第1の尾部の代わりに第2の制限酵素で交換された永久尾部を含む二本鎖プレ上流プローブを消化して、第2の尾部を除去し、第1の標的結合配列内に粘着末端又は、好ましくは、平滑末端を生成することによって、二本鎖上流プローブを生成する工程と、
e)二本鎖上流プローブを、任意で、精製する工程と
を含む。いくつかの実施形態において、二本鎖プローブは、当該分野で公知の方法、例えば、二本鎖プローブの変性によって、又は鎖の1つを選択的に分解することによって、一本鎖プローブに変換される。
【0106】
好ましい実施形態において、第1の制限酵素は、二本鎖DNAを消化してその認識部位から離れた粘着末端を生成するIIS型であり、第2の制限酵素は、その認識部位から離れた二本鎖DNAを消化してDNAに平滑末端切断を生成する別のIIS型である。さらに好ましい実施形態において、第1の制限酵素はBsaIであり、第2の制限酵素はMlyIである。特定の実施形態において、オーバーハングは、少なくとも1、2、3、4、5又はそれ以上のヌクレオチドである。好ましい実施形態において、オーバーハングは、1~5のヌクレオチド、より好ましくは、1~3のヌクレオチド、最も好ましくは、1~2のヌクレオチドである。
【0107】
特定の実施形態において、バーコードを、第1の制限部位と標的結合配列及び/又は標的結合配列と第2の制限部位との間に配置する。
【0108】
特定の実施形態において、プローブ構築は、二本鎖プレ上流プローブから直接開始されるため、第1のPCR工程をスキップして一本鎖を二本鎖分子に変換する、又は単にPCRを実施してプレ上流プローブの量を増幅することができる。
【0109】
第1の制限酵素で消化する工程及び第2の制限酵素で消化する工程の順序は、変えることができ、又は同時に行うことができる。特に、好ましい平滑末端を生成する第2の制限酵素による消化を最初に行い、続いて第1の制限酵素による消化を行って、オーバーハングを生成し、第1の交換されたアダプターとライゲーションすることができる。消化の順序にかかわらず、同じ二本鎖上流プローブが、消化及びライゲーションの両方の末端で生成される。
【0110】
図3に示されるように、プローブは、尾部交換工程なしで構築することができる。尾部交換工程なしで、制限酵素消化を行って、不必要な尾部を除去し、ハイブリダイゼーションのためにプローブを活性化する。単一の消化反応は、少なくとも1、2、3、4、又はそれ以上の制限酵素を用いて行うことができる。あるいは、以下の制限酵素が添加される前に、1つの制限酵素を除去するか又は不活性化する消化反応は、連続して実施することができる。消化反応から生じるDNAは、平滑末端を有する。平滑末端を形成するために、DNAポリメラーゼIのクレノウ断片の使用等、当業者に周知のプロトコルを使用して、反応によって生成された任意の一本鎖オーバーハングを除去する、又は凹部鎖を充填することができる。
【0111】
図4に示すように、上流プローブは、二本鎖フォーマットで生成される。5'末端に修飾を有する上部鎖は、本開示において上述した伸長プローブに対応する。3'末端に修飾を有する他の鎖は、本開示において上述したライゲーションプローブに対応する。このように、本明細書中に開示された方法に従って生成される二本鎖上流プローブにおいて、一方の鎖は、標的ゲノム領域の鎖の一方を分析するのに適切な伸長プローブであり、他方の鎖は、標的ゲノム領域の他方の鎖を分析するのに適切なライゲーションプローブである。
【0112】
本発明のさらなる実施形態は、標的領域の右側を標的とするように設計された一本鎖オリゴヌクレオチドから二本鎖下流プローブを生成する方法を提供する。このような一本鎖オリゴヌクレオチドは、本明細書中では「一本鎖プレ下流プローブ」と呼ばれる。二本鎖下流プローブを生成する方法は、
a)5'末端から3'末端に向かって、第1の尾部、第1の制限酵素のための第1の制限部位、標的結合配列、第2の制限酵素のための第2の制限部位、及び第2の尾部を含む一本鎖又は二本鎖プレプローブを提供する工程であって、二本鎖プレプローブは、一本鎖プレプローブをコピーするために適切なプライマーを使用してPCRにおいて任意で生成される工程と、
b)新たな所望の配列の少なくとも一部を含むように遺伝的に修飾された永久尾部を一時的な第1又は第2の尾部で置き換える、尾部交換反応を、任意で行う工程であって、
i)二本鎖プレ下流プローブを、第2の制限酵素で消化して、第2のプレ下流尾部、又はその一部を除去して、オーバーハングを生成し、
ii)第2の制限酵素で消化された二本鎖プレ下流プローブを永久尾部にライゲーションすることを含み、永久尾部分子は、遺伝的修飾と、消化された二本鎖プレ下流プローブのオーバーハングに相補的なオーバーハングを含む下流永久尾部の少なくとも一部とを含む、工程と、
c)永久尾部にライゲーション二本鎖プレ下流プローブを、任意で、精製する工程と、
d)第2の尾部又は第2の尾部の代わりに第1の制限酵素で交換された永久尾部で二本鎖プレ下流プローブを消化して、第1の下流尾部を除去し、第2の標的結合配列内に粘着末端又は、好ましくは、平滑末端を生成することによって、二本鎖下流プローブを生成する工程と、
e)二本鎖下流プローブを、任意で、精製する工程と
を含む。いくつかの実施形態において、二本鎖プローブは、当該分野で公知の方法、例えば、二本鎖プローブの変性によって、又は鎖の1つを選択的に分解することによって、一本鎖プローブに変換される。
【0113】
好ましい実施形態において、第2の制限酵素は、二本鎖DNAを消化してその認識部位から離れた粘着末端を生成するIIS型であり、第1の制限酵素は、その認識部位から離れた二本鎖DNAを消化してDNAに平滑末端切断を生成する別のIIS型である。さらに好ましい実施形態において、第2の制限酵素はBsaIであり、第1の制限酵素はMlyIである。
【0114】
特定の実施形態において、バーコードを、第1の制限部位と標的結合配列及び/又は標的結合配列と第2の制限部位との間に配置する。
【0115】
特定の実施形態において、プローブ構築は、二本鎖プレ上流プローブから直接開始されるため、第1のPCR工程をスキップして一本鎖を二本鎖分子に変換する、又は単にPCRを実施してプレ上流プローブの量を増幅することができる。
【0116】
第2の制限酵素で消化する工程及び第1の制限酵素で消化する工程の順序は、変えることができ、又は同時に行うことができる。特に、好ましくは、平滑末端を生成する第1の制限酵素による消化を最初に行い、続いて、オーバーハングを生成する第2の制限酵素による消化及び第2のエキソヌクレアーゼ保護アダプターによるライゲーションを行うことができる。特定の実施形態において、オーバーハングは、少なくとも1、2、3、4、5又はそれ以上のヌクレオチドである。好ましい実施形態において、オーバーハングは、1~5のヌクレオチド、より好ましくは1~3のヌクレオチド、最も好ましくは1~2のヌクレオチドである。消化の順序にかかわらず、同じ二本鎖ライゲーションプローブが、消化及びライゲーションの両方の末端で生成される。
【0117】
図4に示されるように、ライゲーションプローブは、二本鎖フォーマットで生成される。5'末端に修飾を有する上部鎖は、本開示において上述した伸長プローブに対応する。3'末端に修飾を有する他の鎖は、本開示において上述したライゲーションプローブに対応する。このように、本明細書中に開示された方法に従って生成される二本鎖上流プローブにおいて、一方の鎖は、標的ゲノム領域の鎖の一方を分析するのに適切なライゲーションプローブであり、他方の鎖は、標的ゲノム領域の他方の鎖を分析するのに適切な伸長プローブである。
【0118】
図5は、二本鎖上流及び下流プローブを生成する一般的なスキームを記載する。当業者であれば、上記の方法に従って生成された二本鎖上流プローブにおいて、5'末端に修飾を含む鎖を伸長プローブとして使用することができ、3'末端に修飾を含む鎖をライゲーションプローブとして使用することができるが分かるはずである。逆に、上記の方法に従って生成された二本鎖下流プローブにおいて、3'末端に修飾を含む鎖をリゲーションプローブとして使用することができ、5'末端にエキソヌクレアーゼ保護を含む鎖を伸長プローブとして使用することができる。
【0119】
従って、本発明の実施形態は、一方の末端の両方の鎖上に遺伝子修飾を有する二本鎖オリゴヌクレオチドプローブを生成する方法であって、
a)5'末端から3'末端に向かって、第1の尾部、第1の制限酵素のための第1の制限部位、標的結合配列、第2の制限酵素のための第2の制限部位、第2の尾部を含む、一本鎖又は二本鎖プレプローブを提供し、二本鎖プレプローブは、一本鎖プレプローブをコピーするのに適切なプライマーを用いてPCRにおいて任意で生成される、工程と、
b)新たな所望の配列の少なくとも一部を含むように遺伝的に修飾された永久尾部を一時的な第1又は第2の尾部で置き換える尾部交換反応を任意で行う工程であって、
i)二本鎖プレプローブを、制限酵素の1つで消化して、一方の尾部又はその一部を除去して、オーバーハングを生成し、
ii)制限酵素で消化された二本鎖プローブに永久尾部をライゲーションすることを含み、永久尾部分子は、遺伝的修飾と、消化された二本鎖プローブのオーバーハングに相補的であるオーバーハングを含む永久尾部の少なくとも一部とを含む、工程であって、
c)任意で、永久尾部にライゲーション二本鎖プレプローブを精製する工程と、
d)一方の尾部で、又は、一方の尾部の代わりに、1つの制限酵素でライゲーション永久尾部により、二本鎖プレプローブを消化することにより二本鎖プローブを生成する工程であって、一方の尾部か、一方の尾部が交換されている場合には、他方の尾部のいずれかを除去して、粘着末端、又は好ましくは、平滑末端を標的結合配列内に生成する工程と、
e)二本鎖プローブを任意で精製する工程を含む。いくつかの実施形態において、二本鎖プローブは、当技術分野で公知の方法、例えば、二本鎖プローブの変性によって、又は鎖の1つを選択的に分解することによって、一本鎖プローブに変換することができる。
【0120】
好ましい実施形態において、一方の制限酵素は、二本鎖DNAを消化してその認識部位から離れた粘着末端を生成するIIS型であり、他方の制限酵素は、その認識部位から離れた二本鎖DNAを消化して、好ましくはDNAに平滑末端切断を生成する別のIIS型である。さらに好ましい実施形態において、制限酵素の1つはBsaIであり、他の制限酵素はMlyIである。
【0121】
特定の実施形態において、バーコードは、第1の制限部位と標的結合配列及び/又は標的結合配列と第2の制限部位との間に配置される。
【0122】
特定の実施形態において、プローブ構築は、二本鎖プレ上流プローブから直接開始されるため、第1のPCR工程をスキップして一本鎖を二本鎖分子に変換することができる。
【0123】
第2の制限酵素で消化する工程及び第1の制限酵素で消化する工程の順序は、変えることができ、又は同時に行うことができる。特に、好ましくは、平滑末端を生成する制限酵素による消化を最初に行い、続いて、オーバーハングを生成する制限酵素による消化及び交換されたアダプターによるライゲーションを行うことができる。特定の実施形態において、オーバーハングは、少なくとも1、2、3、4、5又はそれ以上のヌクレオチドである。好ましい実施形態において、オーバーハングは、1~5のヌクレオチド、より好ましくは1~3のヌクレオチド、最も好ましくは1~2のヌクレオチドである。消化の順序にかかわらず、同じ二本鎖ライゲーションプローブが、消化及びライゲーションの両方の末端で生成される。
【0124】
二本鎖プローブは、二本鎖ゲノムの標的ゲノム領域の両方の鎖を捕捉及び分析するために使用される。従って、本発明の特定の実施形態は、二本鎖標的遺伝物質から標的ゲノム領域を捕捉する方法を提供する。この方法は、
a)各二本鎖プローブの各鎖が、それぞれライゲーション及び伸長プローブに対応する一対の二本鎖プローブを提供する工程であって、
標的の上流の二本鎖プローブは、
i)3'末端に向かって第1の標的結合配列を、5'末端に向かって第1のプライマー結合配列を含む第1の伸長プローブと、
ii)5'末端に向かって第1の標的結合配列と、3'末端に向かって第1のプライマー結合配列を含む第2のライゲーションプローブとを含み、
標的の下流の二本鎖プローブは、
i)5'末端に向かって第2の標的結合配列と、3'末端に向かって第2のプライマー結合配列を含む第1のライゲーションプローブと、
ii)3'末端に向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第2の伸長プローブとを含む、工程と、
b)二本鎖標的ゲノム領域を、二本鎖伸長プローブ及び二本鎖ライゲーションプローブと接触させる工程であって、接触を、
i)二本鎖上流プローブ及び二本鎖下流プローブの、第1の伸長プローブ、第2のライゲーションプローブ、第1のライゲーションプローブ及び第2の伸長プローブへの変性、及び
ii)第1の伸長プローブ及び第1のライゲーションプローブの、標的ゲノム領域における第1のDNA鎖へのハイブリダイゼーション、及び第2の伸長プローブ及び第2のライゲーションプローブの、標的ゲノム領域における第2のDNA鎖へのハイブリダイゼーション
を可能にする条件下で行う、工程と、
c)増幅された第1の伸長プローブの3'末端が第1のライゲーションプローブの5'末端に近接するまで、第1の伸長プローブの3'末端を増幅し、増幅された第2の伸長プローブの3'末端が第2のライゲーションプローブの5'末端に近接するまで、第2の伸長プローブの3'末端を増幅する工程と、
d)標的ゲノム領域を二本鎖標的遺伝物質から捕捉する工程であって、
i)増幅された第1の伸長プローブの3'末端を、第1のライゲーションプローブの5'末端とライゲーションして、5'末端から3'末端まで、第1のプライマー結合配列、第1の標的結合配列、増幅された標的ゲノム領域、第2の標的結合配列、及び第2のプライマー結合配列を含む第1のライゲーションプローブを生成し、
ii)増幅された第2の伸長プローブの3'末端を、第2のライゲーションプローブの5'末端とライゲーションして、5'末端から3'末端まで、第2のプライマー結合配列、第2の標的結合配列、増幅された標的ゲノム領域、第1の標的結合配列、及び第1のプライマー結合配列を含む第2のライゲーションプローブを生成することによって、捕捉する工程とを含む。
【0125】
当業者であれば、一対の二本鎖上流プローブ及び二本鎖下流プローブにおいて、上流プローブ及び下流プローブ中の標的結合配列は、それらが標的ゲノム領域に隣接するように設計されることが分かるはずである。
【0126】
また、二本鎖上流及び下流プローブを合成するための上記の方法を用いて、標的ゲノム領域の両方の鎖を捕捉するために本明細書に開示された方法で使用される二本鎖プローブを生成することができる。従って、特定の実施形態において、上流プローブは、第1の伸長プローブの5'末端にエキソヌクレアーゼ保護を、第2のライゲーションプローブの3'末端にエキソヌクレアーゼ保護を含む。同様に、下流プローブは、第1のライゲーションプローブの3'末端にエキソヌクレアーゼ保護を、第2の伸長プローブの5'末端にエキソヌクレアーゼ保護を含む。
【0127】
伸長プローブ及び/又はライゲーションプローブの末端におけるエキソヌクレアーゼ保護は、ヌクレオチド間にチオホスフェート結合を導入すること、2つ以上のホスホラミダイト及びホスホロモノチオエート及び/又はホスホロジチオエート結合を組み込むこと、隣接するヌクレオチド間の1つ以上のホスホジエステル結合をホルムアセタール/ケタール結合によって置換すること、3'末端ヒドロキシル基をホスホリル又はアセチル基によってブロックすること、3'末端ホスホロアミデートを導入すること、ペプチド核酸(PNA)又はロックド核酸(LNA)を導入すること、1つ以上のチオホスフェート基を導入すること、又はオリゴヌクレオチド骨格に2‐O‐メチルリボース糖基を導入することのうちの1つ以上を含む。
【0128】
第1及び第2のライゲーションプローブが生成された後、それらを反応混合物から単離することができる。このような単離は、5'‐3'エキソヌクレアーゼ活性及び3'-5'エキソヌクレアーゼ活性を有する1つ以上のエキソヌクレアーゼで反応混合物を処理することによって、取り込まれていないプローブ又は標的ゲノムDNA等の反応混合物の望ましくない部分を消化することを含む。第1及び第2のライゲーションプローブの両方が5'及び3'末端の両方で保護を有するので、5'‐3'エキソヌクレアーゼ活性及び3'‐5'エキソヌクレアーゼ活性の両方を提供するエキソヌクレアーゼ又はエキソヌクレアーゼの組み合わせを使用することができる。
【0129】
標的ゲノム領域は、約10bpから約100bpの間、約100bpから約300bpの間、約300bpから約1,000bpの間、又は約1,000bpから約20,000bpの間である。
【0130】
ひとたび単離されると、第1及び第2のライゲーションプローブは、特定のプライマー対を使用して増幅することができる。このように、捕捉された標的ゲノム領域を分析するさらなる工程は、増幅プライマー対を使用するポリメラーゼ連鎖反応(PCR)において、第1及び/又は第2のライゲーションプローブを増幅して、二本鎖形態の第1及び/又は第2のライゲーションプローブのコピーを生成することを含み、第1のライゲーションプローブ増幅プライマー対は、
i)5'末端から3'末端まで、第1の配列決定プライマー結合配列、第1の識別配列、及び第1のプライマー配列のうちの1つ以上を含む第1の伸長プローブ増幅プライマーと、
ii)5'末端から3'末端まで、第2の配列決定プライマー結合配列、第2の識別子配列、及び第2のプライマー配列のうちの1つ以上を含む第1のライゲーションプローブ増幅プライマーとを含み、
第2のライゲーションプローブ増幅プライマー対は、
i)5'末端から3'末端まで、第3の配列決定プライマー結合配列、第3の識別子配列、及び第2のプライマー配列のうちの1つ以上を含む第2の伸長プローブ増幅プライマーと、
ii)5'末端から3'末端まで、第4の配列決定プライマー結合配列、第4の識別子配列、及び第1のプライマー配列のうちの1つ以上を含む第2のライゲーションプローブ増幅プライマーとを含む。
【0131】
当業者であれば、第1及び第2のプライマー結合配列のための適切な配列を設計することができ、それらは同じであっても異なっていてもよい。また、第1、第2、第3及び第4の配列決定プライマーは、同一又は異なる配列を有することもできる。好ましくは、第1、第2、第3及び第4の識別子は、異なる配列を有する。
【0132】
ひとたび増幅されると、二本鎖ライゲーションプローブは、標的ゲノム領域の一本鎖を捕捉する方法に関連して、本開示において前述したように配列決定される。
【0133】
一本鎖プローブの設計と同様に、標的配列は標的ゲノム領域に隣接する。また、第1及び第2の伸長プローブの3'末端の配列は、遺伝物質上の対応する標的配列にハイブリダイズし、第1及び第2のライゲーションプローブの5'末端の配列は、遺伝物質上の対応する標的配列にハイブリダイズする。このように、伸長プローブ及びライゲーションプローブは、対応する標的配列に結合し、これらの標的配列は、標的ゲノム領域に隣接する。また、特定の実施形態において、伸長プローブ及びライゲーションプローブの各々は、第1及び第2の標的配列が標的ゲノム領域に隣接するように、近接せずにハイブリダイズする。また、二本鎖伸長プローブ及びライゲーションプローブ上の第1及び第2のプライマー結合配列は、同じであっても異なっていてもよい。
【0134】
ここで使用されるそれぞれの二本鎖プローブの一方の鎖を配位プローブとして、他方の鎖を伸長プローブとして使用することができるので、当業者であれば、二本鎖プローブの各々は、「二本鎖上流プローブ」又は「二本鎖下流プローブ」と呼ぶことができることが分かるはずである。従って、本明細書で使用される説明は、参照しやすいよう、一方のプローブを「二本鎖下流プローブ」と呼び、他方のプローブを「二本鎖上流プローブ」と呼ぶ。「二本鎖下流プローブ」と「二本鎖上流プローブ」との組み合わせの例は、図4の下方に示される。
【0135】
同様に、第1の伸長プローブ中に存在する第1の標的結合配列は、第2のライゲーションプローブ中に存在する第1の標的結合配列と逆相補的である。また、第1のライゲーションプローブ中に存在する第2の標的結合配列は、第2の伸長プローブ中に存在する第2の標的結合配列と逆相補的である。従って、「第1の標的結合配列」及び「第2の標的結合配列」の本明細書で使用される説明は、参照を容易にするためのものである。これらの配列間の関係は、二本鎖伸長プローブと、図4の下方に示される二本鎖ライゲーションプローブとの組み合わせから明らかである。従って、第1及び第2のライゲーションプローブが生成される場合、2つのライゲーションプローブは、標的ゲノム領域の逆相補的コピーを含む。このようにして、標的ゲノム領域の両方の鎖が捕捉される。
【0136】
二本鎖上流プローブ及び二本鎖下流プローブの各々は、最低約20~約200のヌクレオチドを含む。特に、第1の標的結合配列は、少なくとも約10~約60のヌクレオチドである。第1のプライマー結合配列はまた、少なくとも約10~約30のヌクレオチドである。同様に、第2の標的配列は、少なくとも約10~約60のヌクレオチドであり、第2のプライマー結合配列は少なくとも約10~約30のヌクレオチドである。標的結合部位に対するプローブの特異性は、第1及び第2の標的結合配列の長さによって制御することができる。特に、第1及び第2の標的結合配列が長いと、結合特異性は高くなり、第1及び第2の標的結合配列が短いと、特異性は低くなる。当業者であれは、標的ゲノム領域の配列及び特定の生物について利用可能なゲノム配列に基づいて、例えば、ゲノム配列データベースから、第1及び第2の標的結合配列について適切な配列を決定することができる。
【0137】
ハイブリダイゼーション、伸長、ライゲーション、不要物質の除去、ライゲーションプローブの増幅、プローブのエキソヌクレアーゼ保護、サンプル特異的識別子の組み込み(インデックス、バーコード、ジップコード、アダプター等としても当技術分野で参照される)、一本鎖伸長プローブ及びライゲーションプローブに関して上述した標的ゲノム領域の配列決定の詳細を示す。これらの詳細はまた、本明細書中で使用される二本鎖プローブを使用する方法に適用可能である。
【0138】
特定の実施形態において、複数の標的ゲノム領域が捕捉され、任意で、検出又は配列決定等、さらに分析される。複数の標的ゲノム領域について、上流及び下流の二本鎖プローブの複数の一対が使用される。二本鎖上流及び下流プローブの各対は、標的ゲノム領域に隣接する配列によって、固有の第1及び第2の標的結合配列を含む。しかしながら、上流及び下流プローブの複数の一対の各々は、同じ第1のプライマー結合配列及び/又は同じ第2のプライマー結合配列を有することができる。
【0139】
従って、本明細書に開示される材料及び方法の特定の実施形態は、遺伝物質から複数の標的ゲノム領域を捕捉することを提供する。本方法は、
a)複数対の二本鎖プローブを複数対の標的配列にハイブリダイズする工程であって、標的配列の各対は複数の標的ゲノム領域から1つの標的ゲノム領域に隣接し、プローブの各対は二本鎖上流プローブ及び二本鎖下流プローブを含み、二本鎖プローブの各対は、
i)3'末端に向かって第1の標的結合配列を、5'末端に向かって第1のプライマー結合配列を含む第1の伸長プローブと、
ii)5'末端に向かって第1の標的結合配列を、3'末端に向かって第1のプライマー結合配列を含む第2のライゲーションプローブとを
含む二本鎖上流プローブ、及び
i)3'末端に向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第1のライゲーションプローブと、
ii)3'末端に向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第2の伸長プローブと
含む二本鎖下流プローブを含み、
第1の標的結合配列及び第2の標的結合配列は、それぞれ、標的ゲノム領域に隣接する第1の標的配列及び第2の標的配列に結合している、工程と、
b)増幅された第1の伸長プローブの3'末端が第1のライゲーションプローブの5'末端に隣接するまで第1の伸長プローブの3'末端を増幅し、増幅された第2の伸長プローブの3'末端が第2のライゲーションプローブの5'末端に隣接するまで第2の伸長プローブの3'末端を増幅する工程と、
c)二本鎖標的遺伝物質から複数の標的ゲノム領域を捕捉する工程であって、
i)増幅された第1の伸長プローブの3'末端を、第1のライゲーションプローブの5'末端とライゲーションして、複数の第1のライゲーションプローブを生成することを含み、第1のライゲーションプローブの各々は、5'末端から3'末端まで、第1のプライマー結合配列、第1の標的結合配列、増幅された標的ゲノム領域、第2の標的結合配列、及び第2のプライマー結合配列を含み、
ii)増幅された第2の伸長プローブの3'末端を、第2のライゲーションプローブの5'末端とライゲーションして、複数の第2のライゲーションプローブを生成することを含み、各第2のライゲーションプローブは、5'末端から3'末端まで、第2のプライマー結合配列、第2の標的結合配列、増幅された標的ゲノム領域、第1の標的結合配列、及び第1のプライマー結合配列を含む、工程と
を含む。
【0140】
標的ゲノム領域を捕捉する、例えば、二本鎖上流及び下流プローブ、標的ゲノム領域の長さ、第1及び第2のプライマー結合配列を設計する上述の態様は、複数の二本鎖上流及び下流プローブを使用して、複数の標的ゲノム領域を捕捉する本方法にも適用可能である。
【0141】
特定の実施形態において、複数の捕捉された標的ゲノム領域の各々は、ライゲーションプローブの増幅及び配列決定を含む方法において配列決定される。これらの工程に関して上述した詳細はまた、複数の二本鎖標的ゲノム領域を捕捉及び分析する方法にも適用可能である。
【0142】
本発明のさらなる実施形態はまた、二本鎖プローブの1つ以上の対を含むキットも提供する。二本鎖プローブの各対は、二本鎖上流プローブ及び二本鎖下流プローブを含み、
二本鎖上流プローブは、
i)3'末端に向かって第1の標的結合配列を、5'末端に向かって第1のプライマー結合配列を含む第1の伸長プローブと、
ii)5'末端に向かって第1の標的結合配列を、3'末端に向かって第1のプライマー結合配列を含む第2のライゲーションプローブとを含み、
二本鎖下流プローブは、
i)5'末端に向かって第2の標的結合配列を、3'末端に向かって第2のプライマー結合配列を含む第1のライゲーションプローブと、
ii)3'末端向かって第2の標的結合配列を、5'末端に向かって第2のプライマー結合配列を含む第2の伸長プローブとを含む。
【0143】
二本鎖上流プローブは、第1の伸長プローブの5'末端にエキソヌクレアーゼ保護を、第2のライゲーションプローブの3'末端にエキソヌクレアーゼ保護を含み、二本鎖下流プローブは、第1のライゲーションプローブの3'末端にエキソヌクレアーゼ保護を、第2の伸長プローブの5'末端にエキソヌクレアーゼ保護を含む。エキソヌクレアーゼ保護は、ヌクレオチド間のチオホスフェート結合、2つ以上のホスホラミダイト及びホスホロモノチオエート及び/又はホスホロジチオエート結合、ホルムアセタール/ケタール結合による近接ヌクレオチド間の1つ以上のホスホジエステル結合、ホスホリル又はアセチル基によりブロックされた3'末端ヒドロキシル基、3'末端ホスホロアミデート、ペプチド核酸(PNA)又はロックされた核酸(LNA)、1つ以上のチオホスフェート基、又はオリゴヌクレオチド骨格中の2‐O-メチルリボース糖基のうちの1つ以上を含むことができる。
【0144】
以下の実施例は、本発明を実施するための手順の実施形態を示す。これらの実施例は限定するものではない。
【0145】
実施例1-二本鎖上流及び下流プローブ対の生成
標的領域の周りのDNAの両方の鎖にハイブリダイズする2組の二本鎖プローブが生成される。図6は、標的ゲノム領域の両方の鎖にハイブリダイズする二本鎖プローブを利用する反応の概要を示す。
【0146】
標的ゲノム領域について、一対のプローブは、それが標的領域の下流及び上流でハイブリダイズするように設計される。上流プローブは、本明細書では、左プローブ又はi5プローブと参照され、一方、下流プローブは、本明細書では、右プローブ又はi7プローブと参照される。標的にハイブリダイズするプローブの領域は、遺伝子座特異的配列(LSS)と呼ばれ、配列相補性に基づいて標的ゲノム領域に隣接する配列に基づいて設計することができる。一本鎖プレ伸長プローブ及びプレライゲーションプローブを形成するために、4つのユニバーサル尾部が、それぞれの3'末端及び5'末端でLSSに付加される。4つの尾部は互いに異なるが、全ての標的にわたって同じである。従って、プレプローブの順序は以下のとおりである。
プレ上流プローブ:5'尾部1-LSS1-尾部2:
プレ下流プローブ:5'尾部3-LSS2-尾部4:
LSS1及びLSS2は、少なくとも10塩基、好ましくは、10~60塩基を有する。
【0147】
尾部は、いずれかの側に制限酵素のための認識配列及びPCRプライマーのための結合領域を含む。プローブ構築は、一本鎖形態のプレプローブオリゴヌクレオチドを合成することによって開始される。これらは、個々に合成され、従来のアプローチを介してプールされるか、又は並行して合成される。ひとたび、プレプローブのプールが合成されると、溶液中で、PCRの第1の工程が行われて、二本鎖プレプローブが生成される。PCRは、2つの独立した反応において、適切なプライマーを使用して行われ、一方のプライマー対は下流のプレプローブを増幅し、他方のプライマー対は上流のプレプローブを増幅する。
【0148】
【表3】
【0149】
上流PCRの生成物は処理されて、酵素での消化により尾部2を除去して、好ましくは、平滑末端が生成され、酵素反応の組み合わせにより、修飾オリゴヌクレオチドを含有するアダプターで尾部1を交換する。同様に、下流PCRの生成物は処理されて、酵素での消化により尾部3を除去して、好ましくは、平滑末端が生成され、修飾オリゴヌクレオチドを含有する別のアダプターで尾部4を交換する。
【0150】
図6に示すように、これらのプローブは二本鎖で、互いに完全に相補的であり、従って、ハイブリダイズし、二本鎖形態のままである傾向がある。しかしながら、適切な反応条件、例えば、変性工程の下で、二本鎖プローブは一本鎖形態に変換され、標的ゲノム領域上の対応する配列にハイブリダイズする。二本鎖プローブは、当技術分野で公知の様々な手段、例えば、変性によって、又は鎖の1つを選択的に分解することによって、一本鎖プローブに変換することができる。二本鎖プローブの使用によって、標的ゲノム領域の両方の鎖を捕捉することが可能になり、一本鎖プローブとの反応と比較して、効率、均一性及び収率が増大する。効率の増大が達成されるのは、1つの理由として、各鎖を捕捉するプローブが異なる最適なハイブリダイゼーション条件を有するので、標的領域を捕捉する機会が2倍になるため、そして、ライゲーションプローブ及び伸長プローブ対の一方がハイブリダイズしない場合、他方の対はなお標的に結合し、標的を捕捉するためである。均一性の増大が部分的に達成されるのは、1つの理由として、2つの鎖間のベース組成物及びハイブリダイゼーション速度論の特定の条件が、異なる標的ゲノム遺伝子座にわたって異なる変動内で最適であるためである。最後に、収率が増大するのは、1つの理由として、一本鎖プローブを使用する反応と比較して、捕捉された標的ゲノム領域の量が2倍になるためでる。
【0151】
本明細書で参照又は引用した特許、特許出願、仮出願、及び刊行物は全て、それらが本明細書の明白な教示と矛盾しない限り、その図面及び表を含む全体が参照により本明細書に援用される。
【0152】
本明細書に記載の実施形態は、例示のためのみであり、様々な修正や変更は、当業者に示唆され、それらも本出願の趣旨及び範囲、そして添付の請求の範囲の範囲に含まれるものと理解される。さらに、本明細書に開示された任意の発明又はその実施形態の任意の要素又は限定は、本明細書に開示された任意の及び/又は全ての他の要素又は限定(個別に又は任意の組み合わせにおいて)又は他の発明又はその実施形態と組み合わせることができ、全てのそのような組み合わせは、それに限定されることなく本発明の範囲と考えられる。
図1
図2
図3
図4
図5
図6
【配列表】
2022535029000001.app
【国際調査報告】