(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】核酸ライブラリを生成する方法ならびにそれを実施するための組成物およびキット
(51)【国際特許分類】
C12Q 1/6806 20180101AFI20240814BHJP
C40B 40/06 20060101ALI20240814BHJP
C40B 50/06 20060101ALI20240814BHJP
C12Q 1/6869 20180101ALI20240814BHJP
C12Q 1/686 20180101ALI20240814BHJP
【FI】
C12Q1/6806 Z ZNA
C40B40/06
C40B50/06
C12Q1/6869 Z
C12Q1/686 Z
(21)【出願番号】P 2020567787
(86)(22)【出願日】2019-06-05
(86)【国際出願番号】 US2019035617
(87)【国際公開番号】W WO2019236726
(87)【国際公開日】2019-12-12
【審査請求日】2022-06-01
(32)【優先日】2018-06-06
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】506115514
【氏名又は名称】ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア
【氏名又は名称原語表記】The Regents of the University of California
(74)【代理人】
【識別番号】100083806
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100095500
【氏名又は名称】伊藤 正和
(74)【代理人】
【識別番号】100111235
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】グリーン、 リチャード
(72)【発明者】
【氏名】カップ、 ジョシュア
【審査官】市島 洋介
(56)【参考文献】
【文献】国際公開第2016/058517(WO,A1)
【文献】国際公開第2016/156529(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
核酸ライブラリを生成する方法であって、
一本鎖核酸(ssNA)を一本鎖核酸結合タンパク質(SSB)と接触させて、SSB結合ssNAを生成することと、
前記SSB結合ssNA、
第1のアダプターオリゴヌクレオチド、
SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第1のスプリントオリゴヌクレオチド
第2のアダプターオリゴヌクレオチド、ならびに
SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第2のスプリントオリゴヌクレオチド
を組み合わせることと、
を含んで、
前記SSB結合ssNAハイブリダイゼーション領域を介して前記SSB結合ssNAの末端領域にハイブリダイズされた前記第1のスプリントオリゴヌクレオチドと、前記第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第1のアダプターオリゴヌクレオチドにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドと、
前記SSB結合ssNAのうち前記第1のスプリントオリゴヌクレオチドにハイブリダイズされた前記末端領域とは反対側の末端領域に、前記SSB結合ssNAハイブリダイゼーション領域を介してハイブリダイズされた前記第2のスプリントオリゴヌクレオチドと、前記第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第2のアダプターオリゴヌクレオチドにハイブリダイズされた前記第2のスプリントオリゴヌクレオチドと
を含む複合体を形成し、これにより、前記第1のアダプターオリゴヌクレオチドの末端が前記SSB結合ssNAの前記末端領域の末端に隣接し、前記第2のアダプターオリゴヌクレオチドの末端が、前記SSB結合ssNAのうち前記第1のアダプターオリゴヌクレオチドに隣接する前記末端とは反対側の末端に隣接
し、
前記第1のアダプターオリゴヌクレオチドおよびSSB結合ssNAの前記隣接する末端をライゲーションすること、および前記第2のアダプターオリゴヌクレオチドおよびSSB結合ssNAの前記隣接する末端をライゲーションすることを含む、
方法。
【請求項2】
前記接触、組み合わせること、および
ライゲーションするステップの合計持続時間が、3時間以下である、請求項
1に記載の方法。
【請求項3】
前記ssNAが、分解された核酸試料および/または法医学核酸試料からのものである、請求項1
または2に記載の方法。
【請求項4】
前記ssNAが、一本鎖DNA(ssDNA)であり、前記ssDNAは二本鎖DNA(dsDNA)に由来するものであり、前記方法は、前記ssDNAをSSBと接触させる前に、前記dsDNAを変性させることによって前記ssDNAを生成することをさらに含む、請求項1~
3のいずれか一項に記載の方法。
【請求項5】
前記組み合わせることが、
前記第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第1のアダプターオリゴヌクレオチドにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドを含む複合体と、
前記第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第2のアダプターオリゴヌクレオチドにハイブリダイズされた前記第2のスプリントオリゴヌクレオチドを含む複合体と、
前記SSB結合ssNAと
を組み合わせることを含む、請求項1~
4のいずれか一項に記載の方法。
【請求項6】
前記組み合わせることが、
前記SSB結合ssNAハイブリダイゼーション領域を介して前記SSB結合ssNAにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドを含む複合体と、
前記SSB結合ssNAハイブリダイゼーション領域を介して前記SSB結合ssNAにハイブリダイズされた前記第2のスプリントオリゴヌクレオチドを含む複合体と、
前記第1のアダプターオリゴヌクレオチドと
前記第2のアダプターオリゴヌクレオチドと
を組み合わせることを含む、請求項1~
4のいずれか一項に記載の方法。
【請求項7】
前記ライゲーションが、酵素ライゲーションによって行われる、請求項
1~6のいずれか一項に記載の方法。
【請求項8】
前記ライゲーションが、化学ライゲーションによって行われる、請求項1~6のいずれか一項に記載の方法。
【請求項9】
アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端が、ブロッキング修飾を含む、請求項1~
8のいずれか一項に記載の方法。
【請求項10】
前記ブロッキング修飾が、ライゲーションをブロックする修飾である、請求項
9に記載の方法。
【請求項11】
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端における3’OHの不在、および、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHからなる群から選択される、請求項
9または請求項
10に記載の方法。
【請求項12】
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHであり、前記ブロッキング修飾が、アミノ修飾因子、スペーサー、ジデオキシ塩基、反転ジデオキシ塩基、および3’ホスフェートからなる群から選択される、請求項
11に記載の方法。
【請求項13】
前記SSB結合ssNAハイブリダイゼーション領域が、ランダム配列を含む、請求項1~
12のいずれか一項に記載の方法。
【請求項14】
前記SSB結合ssNAハイブリダイゼーション領域が、ユニバーサル塩基を含む、請求項1~
13のいずれか一項に記載の方法。
【請求項15】
前記アダプターオリゴヌクレオチドが、
PCR増幅のためのアダプターまたはその相補体を含み、および/または
部分的もしくは完全な配列決定アダプターまたはその相補体を含む、
請求項1~
14のいずれか一項に記載の方法。
【請求項16】
前記ssNAまたはその
増幅体の少なくとも一部分を配列決定することをさらに含む、請求項1~
15のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年6月6日に出願された米国仮特許出願第62/681,524号の利益を主張し、その出願はその全体において参照により本明細書に組み込まれる。
【背景技術】
【0002】
核酸配列決定は、診断および他の用途での使用により、ますます重要な遺伝子研究の分野となっている。一般に、核酸配列決定は、RNAまたはDNAの断片などの核酸のヌクレオチドの順序を決定することからなる。相対的に短い配列が典型的に分析され、得られた配列情報は、断片が誘導されたはるかにより広範な長さの遺伝子材料の配列を確実に決定するために、断片を参照配列に対して整列させるか、または断片を論理的に一緒に適合させるために、様々なバイオインフォマティクス方法において使用され得る。特徴的断片の自動コンピュータベースの検査が開発され、ゲノムマッピング、個体間の遺伝的変異の分析、遺伝子およびそれらの機能の識別などに最近より使用されている。
【0003】
高スループットDNA配列決定に用いられるいくつかの方法は、ユニバーサル増幅反応に依存し、それによって、DNA試料はランダムに断片化され、次いで、異なる断片の末端がすべて同じDNA配列を含むように処理される。ユニバーサル末端を有する断片は、単一の増幅プライマー対を有する単一の反応において増幅され得る。PCRによって増幅される標的の末端へのユニバーサルプライミング配列の付加は、様々な方法によって達成され得る。例えば、その5’末端にユニバーサル配列およびその3’末端に縮重配列を有するユニバーサルプライマーを使用して、複雑な標的配列または標的配列の複雑な混合物からランダムに断片を増幅することができる。プライマーの3’縮重部分は、DNA上のランダムな位置でアニーリングし、伸長して、その5’末端にユニバーサル配列を有する標的のコピーを生成することができる。
【0004】
あるいは、ユニバーサルプライミング配列を含むアダプターを標的配列の末端にライゲーションすることができる。1つ以上のアダプターが、標的配列とのライゲーション反応において使用され得る。ユニバーサル増幅のための1つ以上のアダプター配列のライゲーションを介して核酸配列決定ライブラリを調製するための現在の方法に関連する欠点は、かかる方法によって必要とされる時間および費用である。
【発明の概要】
【0005】
核酸ライブラリを生成する方法が提供される。方法は、一本鎖核酸結合タンパク質に結合した一本鎖核酸(SSB結合ssNA)、アダプターオリゴヌクレオチド、およびスプリント(splint:添え木)オリゴヌクレオチドを組み合わせて、SSB結合ssNAの末端領域とアダプターオリゴヌクレオチドとにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体を形成することを含む。第1のアダプターオリゴヌクレオチドの末端(end)は、SSB結合ssNAの第1の末端領域(terminal region)の末端に隣接しており、方法は、隣接する末端を共有結合させることをさらに含み得る。例えば本開示の方法の実施において用途を見出す、組成物およびキットも提供される。
【図面の簡単な説明】
【0006】
【
図1】本開示の一実施形態による核酸ライブラリを生成する方法の概略図。
【
図2】分解DNA(上部パネル)および現代DNA(下部パネル)についての、他の方法と本開示の例示的な方法の比較。
【
図3】毛髪DNA長さ分布。左のパネルは、現代の毛髪DNAからSanta Cruz法(SRL3)によって生成されたテンプレート分子の観察された長さを示す。毛髪軸中のDNAについて予想されるように、インタクトな分子の長さは概して短い。同様の長さ分布が右パネルに示される(SRL4)。
【
図4】SRL3およびSRL4における推定ライブラリ複雑度(固有の分子の数)。
【
図5】ライブラリの複雑度比較。配列決定ライブラリは、本開示の例示的な方法、SS2.0、BEST、およびフォーク型アダプターライゲーションを使用して作製した。ライブラリの複雑度(ライブラリ中の固有の分子の数)は、3つ組の実験において、Preseq(左)を用いて、またはqPCR(右)を介して、数百万のリードから推定した。本開示の例示的な方法は、次の最良のプロトコルであるSS2.0よりも2~3倍多くの抽出DNAを配列決定ライブラリに変換する。
【発明を実施するための形態】
【0007】
核酸ライブラリを生成する方法が提供される。方法は、一本鎖核酸結合タンパク質に結合した一本鎖核酸(SSB結合ssNA)、アダプターオリゴヌクレオチド、およびスプリントオリゴヌクレオチドを組み合わせて、SSB結合ssNAの末端領域とアダプターオリゴヌクレオチドとにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体を形成することを含む。第1のアダプターオリゴヌクレオチドの末端は、SSB結合ssNAの第1の末端領域の末端に隣接しており、方法は、隣接する末端を共有結合させることをさらに含み得る。例えば本開示の方法の実施において用途を見出す、組成物およびキットも提供される。
【0008】
本開示の方法、組成物、およびキットをより詳細に記載する前に、当該方法、組成物、およびキットは、記載される特定の実施形態に限定されず、当然のことながら変更され得ることが理解されるべきである。当該方法、組成物、およびキットの範囲は添付の特許請求の範囲のみによって限定されるため、本明細書で使用される用語は、特定の実施形態を説明する目的のためのものに過ぎず、限定的であることは意図していないこともまた理解されたい。
【0009】
値の範囲が提供される場合、その範囲の上限と下限との間の、文脈上他に明確な指示のない限り下限の単位の10分の1までの、各介在値、およびいずれかの他の記載された値またはその記載された範囲内の介在値が、方法、組成物、およびキットに包含されることを理解されたい。これらのより小さい範囲の上限および下限は、独立してより小さい範囲に含まれ得、記載された範囲内のいずれかの特に除外された限界を除き、それらも方法、組成物、およびキット内に包含される。記載された範囲が一方または両方の限界を含む場合、それらの含まれる限界のうちの一方または両方を除外する範囲もまた、方法、組成物、およびキットに含まれる。
【0010】
特定の範囲は、数値の前に「約」という用語が付されて本明細書で提示される。本明細書に使用される「約」という用語は、それが先行する正確な数、ならびにその用語が先行する数に近いかまたはほぼ等しい数のための文言的サポートを提供する。ある数が特定の明記された数に近いかあるいはほぼ等しいかを決定するにあたり、近いかあるいはほぼ等しいが明記はされていない数は、それが提示されている文脈において具体的に明記された数と実質的に等価な数であり得る。
【0011】
別段定義されない限り、本明細書で使用されるすべての技術および科学用語は、当該方法、組成物、およびキットが属する当該技術分野における当業者に一般的に理解されるものと同じ意味を有する。本明細書に記載のものと類似または同等のいかなる方法、組成物、およびキットもまた、当該方法、組成物、およびキットの実施または試験に使用することができるが、代表的な例示的方法、組成物、およびキットについてここで記載する。
【0012】
本明細書に引用されるすべての刊行物および特許は、それぞれ個々の刊行物または特許が参照により組み込まれるように具体的かつ個別に示されているかのように、参照により本明細書に組み込まれ、その刊行物が引用されたところの関連する方法および/または材料を開示かつ記載するために、参照により本明細書に組み込まれる。あらゆる刊行物の引用は、出願日前のその開示についてであり、提供される刊行日は独立して確認する必要があり得る実際の刊行日とは異なる可能性があるため、本方法、組成物、およびキットが、このような刊行物に先行する権利がないと認めるものと解釈されるべきではない。
【0013】
本明細書および添付の特許請求の範囲で使用される場合、単数形「a」、「an」、および「the」は、文脈上他に明確に指示されない限り、複数の指示対象を含むことに留意されたい。請求項は任意の要素を排除するように作成されてもよいことにさらに留意されたい。したがって、この記述は、請求項の要素の列挙に関連して「専ら」、「のみ」などのような排他的な用語の使用または「負の」限定の使用のための文言的根拠としての役割を果たすことを意図している。
【0014】
明瞭さのために、別々の実施形態の文脈で記載される、方法、組成物、およびキットの特定の特徴はまた、単一の実施形態において組み合わせて提供され得ることが理解される。逆に、簡潔さのために、単一の実施形態の文脈で記載される、方法、組成物、およびキットの様々な特徴はまた、別々に、またはいずれかの適切な部分的組み合わせで提供され得る。実施形態のすべての組み合わせは、本開示によって具体的に包含され、本明細書において、このような組み合わせは、実施可能なプロセスおよび/または組成物を内包する限り、まさに各々およびすべての組み合わせが個別かつ明示的に開示されているかのように開示されている。加えて、こうした変形を記載する実施形態において列挙されるすべての部分的組み合わせも、本方法、組成物、およびキットによって具体的に包含され、本明細書において、まさに各々およびすべてのこのような部分的組み合わせが本明細書に個別かつ明示的に開示されているかのように開示されている。
【0015】
本開示を読むと当業者には明らかであるように、本明細書に説明され例証された個々の実施形態のそれぞれは、本方法の範囲または趣旨から逸脱することなく、他のいくつかの実施形態のいずれかの特徴から容易に分離され得る、または組み合わせられ得る個別の要素および特徴を有する。任意の記載された方法は、列挙された事象の順序で、または論理的に可能な他の順序で実施することができる。
【0016】
方法
上に要約されるように、本開示は、核酸ライブラリを生成する方法を提供する。方法は、一本鎖核酸(ssNA)を一本鎖核酸結合タンパク質(SSB)と接触させて、SSB結合ssNAを生成することを含む。方法は、SSB結合ssNAと、第1のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む第1のスプリントオリゴヌクレオチドとを組み合わせることをさらに含む。組み合わせることは、SSB結合ssNAハイブリダイゼーション領域を介してSSB結合ssNAの末端領域にハイブリダイズされた第1のスプリントオリゴヌクレオチドと、第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して第1のアダプターオリゴヌクレオチドにハイブリダイズされたその第1のスプリントオリゴヌクレオチドを含む複合体の形成をもたらし、これにより、第1のアダプターオリゴヌクレオチドの末端がSSB結合ssNAの第1の末端領域の末端に隣接する。いくつかの実施形態では、組み合わせることは、SSB結合ssNAと、第2のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む第2のスプリントオリゴヌクレオチドとを組み合わせることをさらに含み、形成された複合体は、第1のスプリントオリゴヌクレオチドにハイブリダイズされた末端領域の反対側のSSB結合ssNAの末端領域に、SSB結合ssNAハイブリダイゼーション領域を介してハイブリダイズされた第2のスプリントオリゴヌクレオチドと、第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して第2のアダプターオリゴヌクレオチドにハイブリダイズされたその第2のスプリントオリゴヌクレオチドをさらに含み、これにより、第2のアダプターオリゴヌクレオチドの末端が、第1のアダプターオリゴヌクレオチドに隣接する末端の反対側のSSB結合ssNAの末端に隣接する。
【0017】
第2のアダプターオリゴヌクレオチドおよび第2のスプリントオリゴヌクレオチドを用いる例示的な一実施形態を、
図1に概略的に示す。この実施例では、ssNAは、dsNAを変性させることによってdsNAから生成される(例えば、dsDNAから生成されるssDNA)。
図1の上部に示されるのは、dsNA 102である。DsNA 102が変性した際に、得られたssNAを一本鎖核酸結合タンパク質(SSB)と接触させて、SSB結合ssNAを生成する。
図1に示されるのは、dsNA 102の鎖に由来するSSB結合ssNA 104である。この実施例では、ssNA 104は、第1のスプリントオリゴヌクレオチド108にハイブリダイズされた第1のアダプターオリゴヌクレオチド106、および第2のスプリントオリゴヌクレオチド112にハイブリダイズされた第2のアダプターオリゴヌクレオチド110と組み合わされる。第1のスプリントオリゴヌクレオチド108の、第1のアダプターオリゴヌクレオチド106へのハイブリダイゼーションは、第1のスプリントオリゴヌクレオチド108の第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域114を介する。第2のスプリントオリゴヌクレオチド112の、第2のアダプターオリゴヌクレオチド110へのハイブリダイゼーションは、第2のスプリントオリゴヌクレオチド112の第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域116を介する。第1のスプリントオリゴヌクレオチド108および第2のスプリントオリゴヌクレオチド112の、SSB結合NA 104、第1のアダプター領域106、および第2のアダプター領域110とのハイブリダイゼーションは、複合体122を形成する。第1のスプリントオリゴヌクレオチド108の、SSB結合ssNA 104の5’末端領域へのハイブリダイゼーションは、第1のスプリントオリゴヌクレオチド108の第1のSSB結合ssNAハイブリダイゼーション領域118を介する。第2のスプリントオリゴヌクレオチド112の、SSB結合ssNA 104の3’末端領域へのハイブリダイゼーションは、第2のスプリントオリゴヌクレオチド112の第2のSSB結合ssNAハイブリダイゼーション領域120を介する。スプリントオリゴヌクレオチドは、スプリントオリゴヌクレオチドのSSB結合ssNAハイブリダイゼーション領域がSSB結合ssNAのそれらの対応する末端領域にハイブリダイズされるとき、アダプターオリゴヌクレオチドの末端がSSB結合ssNAの末端に隣接するように設計される。隣接する末端の位置はアスタリスクで示されている。これらの隣接する末端は、共有結合して(例えば、酵素的ライゲーションによって)、アダプター付ssNA(例えば、
図1に示されるアダプター付ssNA 124)を生成することができ、次いで、アダプター付ssNAのアダプター部分における1つ以上の配列によって促進される目的の下流アプリケーション(例えば、PCR増幅、次世代配列決定、および/または同等物)で使用され得る。
図1に示されるように、隣接する末端の共有結合の際に、任意のクリーンアップステップを実行して、アダプター付ssNAを、形成された複合体の1つ以上の試薬または構成成分、例えば、共有結合に使用される酵素、スプリントオリゴヌクレオチド、SSB、および/または同等物から分離し得る。かかるクリーンアップステップのための好適なアプローチとしては、これらに限定されないが、固相可逆的固定化(SPRI-例えば、磁気ビーズを使用する)および核酸カラム精製が挙げられる。
図1に示される例では、ブロッキング修飾(blocking modification)が、スプリントオリゴヌクレオチドの各末端に存在し(黒色の長方形)、ブロッキング修飾は、各アダプターオリゴヌクレオチドの、SSB結合ssNAに隣接しない側の末端にさらに存在する(黒色の長方形)。ブロッキング修飾は、オリゴヌクレオチドおよびssNAのそれらの末端へのライゲーションを防止する。
【0018】
上に要約されるように、1つ以上のアダプター配列のライゲーションを介して核酸配列決定ライブラリを調製するための現在の方法に関連する欠点は、かかる方法によって必要とされる時間および費用を含む。本開示の方法は、Gansauge et al.(2017)Nucleic Acids Research 45(10):e79によって記載されるアプローチ(「ssDNA2.0」と指定される)などの、一本鎖ライブラリ調製に対する現在の最先端のアプローチの改善を構成し、本方法は、驚くべきことに、より効率的であり、より少ない時間を必要とし、コストを低減することが見出された。本開示の方法の態様は、ここでさらに詳細に説明される。
【0019】
主題の方法は、一本鎖核酸(ssNA)を一本鎖核酸結合タンパク質(SSB)と接触させて、SSB結合ssNAを生成することを含む。「一本鎖核酸」または「ssNA」とは、それらの長さの70%以上にわたって一本鎖である(すなわち、分子間または分子内でハイブリダイズされていない)ポリヌクレオチドの集合を意味する。いくつかの実施形態では、ssNAは、ポリヌクレオチドの長さの75%以上、80%以上、85%以上、90%以上、95%以上、または99%以上にわたり一本鎖である。ある特定の態様では、ssNAは、ポリヌクレオチドの全長にわたり一本鎖である。
【0020】
ssNAは、これらに限定されないが、単一の細胞、複数の細胞(例えば、培養細胞)、組織、器官、または生物(例えば、細菌、酵母など)から単離された核酸試料を含む、目的の任意の核酸試料であり得る(またはそれから調製され得る)。例示的な試料タイプとしては、これらに限定されないが、血液、血清、唾液、痰、尿、排泄物、嘔吐物、粘液、毛髪、爪(例えば、指の爪、足の爪)、スワブ(例えば、頬スワブ、咽頭スワブ、膣スワブ)、生検組織(例えば、パンチ生検、細針生検、細針吸引生検)、細胞培養、環境試料(例えば、水、土壌、空気、表面、タッチDNA)、およびメタゲノム試料が挙げられる。ある特定の態様では、核酸試料は、動物の単一の細胞、細胞の集合、組織、器官、および/または同等物から単離される。いくつかの場合では、核酸試料は、これらに限定されないが、胎児無細胞核酸(例えば、無細胞胎児DNA(cffDNA))または循環腫瘍核酸(例えば、循環腫瘍DNA(ctDNA))などの無細胞核酸(例えば、無細胞DNA(cfDNA))を含む。いくつかの実施形態では、動物は、哺乳動物(例えば、ヒト属からの哺乳動物、げっ歯類(例えば、マウスまたはラット)、イヌ、ネコ、ウマ、ウシ、または目的の任意の他の哺乳動物)である。他の態様では、核酸試料は、細菌、酵母、昆虫(例えば、ショウジョウバエ)、両生類(例えば、カエル(例えば、アフリカツメガエル))、ウイルス、植物、または任意の他の非哺乳動物の核酸試料源などの、哺乳動物以外の供給源から単離される/得られる。
【0021】
いくつかの実施形態では、ssNAは、分解核酸試料からのものである。本明細書で使用される場合、「分解核酸試料」は、酵素的、物理的、化学的、または他のプロセスによって断片化されたDNAの試料である。分解核酸試料の例は、骨残留物から回収されたDNA断片、毛髪、血漿からの無細胞DNA、または土壌もしくは水から回収された環境DNAである。ある特定の態様では、ssNAが、分解核酸試料からのものであるとき、ssNAは、古代核酸試料からのものである。「古代核酸試料」とは、生物学的残留物から回収された核酸断片を意味する。目的の古代核酸試料の非限定的な例は、絶滅した生物または動物、例えば、絶滅した哺乳動物から得られる(例えば、単離される)核酸試料である。ある特定の態様では、絶滅した哺乳動物は、ヒト属からのものである。いくつかの実施形態では、ssNAは、法医学核酸試料からのものである。本明細書で使用される場合、「法医学核酸試料」は、犯罪の調査に関連する(例えば、その過程で得られた)核酸試料である。
【0022】
ある特定の態様では、ssNAは、腫瘍核酸試料(すなわち、腫瘍から単離された核酸試料)からのものである。本明細書で使用される場合、「腫瘍」は、悪性または良性にかかわらず、すべての新生物細胞の成長および増殖、ならびにすべての前癌性および癌性の細胞および組織を指す。「癌」および「癌性」という用語は、典型的には無秩序な細胞増殖/増殖を特徴とする哺乳動物における生理学的状態を指すかまたは記述する。癌の例としては、癌腫、リンパ腫、芽細胞腫、肉腫、および白血病が挙げられるが、これらに限定されない。そのような癌のより具体的な例としては、扁平上皮癌、小細胞肺癌、非小細胞肺癌、肺腺癌、肺扁平上皮癌、腹膜癌、肝細胞癌、胃腸癌、膵臓癌、膠芽腫、子宮頸癌、卵巣癌、肝臓癌、膀胱癌、肝癌、乳癌、大腸癌、結腸大腸癌、子宮内膜癌もしくは子宮癌、唾液腺癌、腎臓癌、肝臓癌、前立腺癌、外陰癌、甲状腺癌、肝臓癌、様々な種類の頭頸部癌などが挙げられる。
【0023】
いくつかの実施形態では、ssNAは、無細胞核酸試料、例えば、無細胞DNA、無細胞RNA、またはその両方からのものである。ある特定の態様では、無細胞核酸は、全血、血漿、血清、羊水、唾液、尿、胸水、気管支洗浄液、気管支吸引液、母乳、初乳、涙液、精液、腹水、胸水、および大便からなる群から選択される、体液試料から得られる。いくつかの実施形態では、無細胞核酸は、無細胞胎児DNAである。ある特定の態様では、無細胞核酸は、循環腫瘍DNAである。いくつかの実施形態では、無細胞核酸は、感染性因子DNAを含む。ある特定の態様では、無細胞核酸は、移植片からのDNAを含む。
【0024】
ある特定の態様では、ssNAは、一本鎖デオキシリボ核酸(ssDNA)である。目的のssDNAは、二本鎖DNA(dsDNA)に由来するssDNAを含むが、これらに限定されない。例えば、ssDNAは、ssDNAを生成するために変性(例えば、熱変性および/または化学変性)された二本鎖DNAに由来し得る。いくつかの実施形態では、方法は、ssDNAをSSBと接触させる前に、dsDNAを変性させることによってssDNAを生成することを含む。
【0025】
ssNAがdsDNA試料に由来するssDNAである場合、方法は、複合体の形成後、ssDNA(この時点で、一方または両方の末端に1つ以上のアダプター(例えば、配列決定アダプター)を含む)を再ハイブリダイズしてdsDNAを生成することをさらに含み得る。所望である場合、生成されたdsDNAは、配列決定され得る。いくつかの実施形態では、再ハイブリダイズは、ssDNAが由来した元のdsDNAに類似するdsDNAを生成するのに十分にストリンジェントなハイブリダイゼーション条件下で実施される。十分にストリンジェントなハイブリダイゼーション条件は、選択されたハイブリダイゼーション温度、選択された塩濃度、および/またはssDNAが由来した元のdsDNAに類似するdsDNAを生成するように選択された任意の他の好都合なハイブリダイゼーションパラメータを含み得る。かかる生成されたdsDNAの少なくともサブセットの一方または両方の末端は、元のdsDNAの末端(例えば、オーバーハング)の類似物/複製物になるであろう。本開示の方法を使用して(例えば、配列決定によって)末端/オーバーハング含量を決定することは、ssDNAが由来した核酸試料に関する様々な有用な情報を提供し得る。例えば、オーバーハング含量を知ることは、例えば血漿または別の好適な供給源からの無細胞DNA(cfDNA)を分析するのに価値がある。cfDNAは、血液細胞、妊婦の胎児細胞、癌を有する個体の腫瘍細胞、臓器移植レシピエントの移植臓器組織などを含む様々な供給源に由来することが示されている。本開示の方法の実施形態によって提供されるオーバーハング含量は、例えば診断目的のために起源によって配列決定リードを分類するために使用され得る。
【0026】
さらに、末端/オーバーハング含量は、法医学試料からの混合DNAを分析するために使用され得る。例えば、精液、血液、または別の目的供給源からのDNAは、その供給源について診断的となる末端特徴を有し得、DNA配列は、この情報に基づいて分割され得る。
【0027】
さらに、古代DNA試料(例えば、絶滅した生物、植物、または動物からの試料)中のオーバーハング含量を決定することは、そのような試料およびその試料が由来する生物、植物、動物などを特徴付けるのに有用な情報を提供する。例えば、古代DNA試料(例えば、絶滅した哺乳動物からのDNA試料)は、しばしば、混入DNA(例えば、混入細菌DNAなど)を含む。そのような場合、そのようなタイプのオーバーハングが特定のDNA源に関連するとき、目的のDNA配列が、検出されたオーバーハングのタイプに基づいて混入DNA配列から分割され得る。
【0028】
ある特定の実施形態では、本開示の方法は、オーバーハングの長さおよびタイプの関数として、DNA抽出物(例えば、古代DNA抽出物)中の塩基損傷の速度および位置を決定する際に用途を見出す。
【0029】
したがって、いくつかの実施形態では、SSB結合dsDNA由来のssDNAをアダプターおよびスプリントオリゴヌクレオチドと組み合わせて、本明細書に記載されるアダプターおよびスプリントオリゴヌクレオチドにハイブリダイズされたSSB結合dsDNA由来ssDNAを含む複合体を形成することと、複合体形成の後に、ssDNAを再ハイブリダイズして、ssDNAが由来した元のdsDNAに類似するdsDNA(すなわち、一方または両方の末端に1つ以上のアダプター(例えば、配列決定アダプター)を含む「アダプター付」dsDNA)を生成することと、を含む方法が提供される。かかる方法は、アダプター付dsDNAを配列決定することをさらに含み得る。ある特定の態様では、配列決定は、ssDNAが由来したdsDNAの末端/オーバーハング含量を決定するためのものである。配列決定を含む本開示の方法の任意の実施形態では、方法は、配列決定中の複雑度を低減するために、アダプター付ssNAのサブサンプル(subsample)を配列決定することを含み得る。
【0030】
いくつかの実施形態では、ssNAは、一本鎖リボ核酸(ssRNA)である。目的のRNAとしては、これらに限定されないが、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、トランスアクティング低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、小核小体RNA(snoRNA)、小核RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファーメッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(プレmRNA)、低分子カハール体特異的RNA(scaRNA)、piwiと相互作用するRNA(piRNA)、エンドリボヌクレアーゼ調製siRNA(esiRNA)、低分子テンポラルRNA(stRNA)、シグナル認識RNA、テロメアRNA、リボザイム、またはかかるRNAタイプもしくはサブタイプの任意の組み合わせが挙げられる。いくつかの実施形態では、ssNAがssRNAである場合、ssRNAは、mRNAである。
【0031】
目的の供給源からDNAおよびRNAを単離、精製、および/または濃縮するためのアプローチ、試薬、およびキットは、当該技術分野において既知であり、市販されている。例えば、目的の供給源からDNAを単離するためのキットには、Qiagen,Inc.(Germantown,Md)によるDNeasy(登録商標)、RNeasy(登録商標)、QIAamp(登録商標)、QIAprep(登録商標)、およびQIAquick(登録商標)核酸単離/精製キット;Life Technologies,Inc.(Carlsbad,CA)によるDNAzol(登録商標)、ChargeSwitch(登録商標)、Purelink(登録商標)、GeneCatcher(登録商標)核酸単離/精製キット;Clontech Laboratories,Inc.(Mountain View,CA)によるNucleoMag(登録商標)、NucleoSpin(登録商標)、およびNucleoBond(登録商標)核酸単離/精製キットが含まれる。ある特定の態様では、核酸は、固定された生物学的試料、例えば、ホルマリン固定パラフィン包埋(FFPE)組織から単離される。FFPE組織からのゲノムDNAは、Qiagen,Inc.(Germantown,Md)によるAllPrep(登録商標)DNA/RNA FFPEキット、Life Technologies,Inc.(Carlsbad,CA)によるFFPE用のRecoverAll(登録商標)全核酸単離キット、およびClontech Laboratories,Inc.(Mountain View,CA)によるNucleoSpin(登録商標)FFPEキットなどの市販のキットを用いて単離され得る。
【0032】
核酸試料が得られる(例えば、単離される)生物、植物、動物などが絶滅している場合、かかる核酸を回収するための好適な戦略は、既知であり、例えば、Green et al.(2010)Science 328(5979):710-722、Poinar et al.(2006)Science 311(5759):392-394、Stiller et al.(2006)Proc.Natl.Acad.Sci.103(37):13578-13584、Miller et al.(2008)Nature 456(7220):387-90、Rasmussen et al.(2010)Nature 463(7282):757-762、および他の箇所に記載されているものを含む。
【0033】
上に要約されるように、主題の方法は、ssNAを一本鎖核酸結合タンパク質(SSB)と接触させてSSB結合ssNAを生成することを含む。SSBは、ssNAに協調的な様式で結合し、二本鎖核酸(dsNA)にはうまく結合しない。ssDNAに結合すると、SSBは螺旋二本鎖を不安定にする。主題の方法を実施する際に用いられ得るSSBとしては、原核SSB(例えば、細菌または古細菌SSB)および真核SSBが挙げられる。主題の方法を実施する際に用いられ得るSSBの非限定的な例としては、E.coli SSB、E.coli RecA、極限熱安定性一本鎖DNA結合タンパク質(ET SSB)、Thermus thermophilus(Tth)RecA、T4遺伝子32タンパク質、複製プロテインA(RPA-真核SSB)などが挙げられる。ET SSB、Tth RecA、E.coli RecA、T4遺伝子32タンパク質、ならびにかかるSSBを使用してSSB結合ssNAを調製するための緩衝液および詳細なプロトコルは、例えば、New England Biolabs,Inc.(Ipswich,MA)から入手可能である。本発明者らは、インプットが等モル濃度だとすると、より大きい平均断片長を有するssNAにとって、SSBのより大きなインプットが有益になると判定した。SSB結合ssNAを生成するためにssNAをSSBと接触させるための例となるアプローチに関する詳細なガイダンスは、下記の実験セクションに提供される。
【0034】
上に要約されるように、主題の方法は、SSB結合ssNAと、アダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域およびアダプターオリゴヌクレオチドハイブリダイゼーション領域を含むスプリントオリゴヌクレオチドとを組み合わせて複合体を形成することを含む。本明細書で使用される場合、「オリゴヌクレオチド」は、5~500ヌクレオチド、例えば、5~100ヌクレオチドの一本鎖マルチマーである。オリゴヌクレオチドは、合成されてもよく、または酵素的に作製されてもよく、いくつかの実施形態では、5~50ヌクレオチド長である。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチドまたは「RNAオリゴヌクレオチド」であり得る)、デオキシリボヌクレオチドモノマー(すなわち、オリゴデオキシリボヌクレオチドまたは「DNAオリゴヌクレオチド」であり得る)、またはそれらの組み合わせを含み得る。オリゴヌクレオチドは、例えば、10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、または150~200、または最大500ヌクレオチド長であり得る。
【0035】
本開示の「アダプターオリゴヌクレオチド」は、アダプターまたはその一部を含むオリゴヌクレオチドである。「アダプター」とは、1つ以上の下流用途(例えば、アダプター付ssNAもしくはその誘導体のPCR増幅、アダプター付ssNAもしくはその誘導体の配列決定、および/または同等物)に有用なヌクレオチド配列を意味する。ある特定の態様では、アダプターオリゴヌクレオチド中に存在するアダプターまたはその一部は、配列決定アダプターである。「配列決定アダプター」とは、Illumina(登録商標)によって提供される配列決定プラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)、および/またはGenome Analyzer(商標)配列決定システム)、Oxford Nanopore(商標)Technologies(例えば、MinION(商標)配列決定システム)、Ion Torrent(商標)(例えば、Ion PGM(商標)および/またはIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、SequelまたはPacBio RS II配列決定システム)、Life Technologies(商標)(例えば、SOLiD(商標)配列決定システム)、Roche(例えば、454 GS FLX+および/またはGS Junior配列決定システム)、または目的の任意の他の配列決定プラットフォームなどの、目的の配列決定プラットフォームによって利用されるヌクレオチド配列(またはその相補体)の少なくとも一部を含む1つ以上の核酸ドメインを意味する。
【0036】
ある特定の態様では、配列決定アダプターは、表面結合配列決定プラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)配列決定システムにおいてフローセルの表面に結合したP5またはP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「捕捉部位」または「捕捉配列」)、配列決定プライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのリード1またリード2プライマーが結合し得るドメイン)、固有の識別子(例えば、オリゴヌクレオチドプローブ、プローブ相補鎖オリゴヌクレオチド、もしくはその両方の3’領域を一意に識別する、および/または特異的なバーコードもしくは「タグ」を用いて所与の試料からすべての分子をマークすることによって試料多重化を可能にするように配列決定化rRNAの試料供給源を一意に識別する、バーコードもしくは他のドメイン)、バーコード配列決定プライマー結合ドメイン(バーコードの配列決定に使用されるプライマーが結合するドメイン)、例えば固有のタグが配列決定される事象の数に基づいて発現レベルを決定するために、目的の分子を一意にマークするための分子識別ドメイン(例えば、4、6、または他の数のヌクレオチドのランダム化タグなどの分子インデックスタグ)、任意のかかるドメインの相補体、またはそれらの任意の組み合わせから選択される核酸ドメインであるか、あるいはそれを含む。ある特定の態様では、バーコードドメイン(例えば、試料インデックスタグ)および分子の識別ドメイン(例えば、分子インデックスタグ)は、同じ核酸に含まれてもよい。
【0037】
アダプターオリゴヌクレオチドが、配列決定アダプターの1つまたは一部を含むとき、1つ以上のさらなる配列決定アダプターおよび/または配列決定アダプターの残りの部分が、様々なアプローチを用いて付加され得る。例えば、配列決定アダプターのさらなる部分および/または残りの部分は、ライゲーション、逆転写、PCR増幅、および/または同等物によって付加され得る。PCRの場合、3’ハイブリダイゼーション領域(例えば、アダプターオリゴヌクレオチドのアダプター領域にハイブリダイズするための)、ならびに配列決定アダプターのさらなる部分および/または残りの部分を含む5’領域を含む第1の増幅プライマーと、3’ハイブリダイゼーション領域(例えば、ssNA分子の反対側の末端に付加される第2のアダプターオリゴヌクレオチドのアダプター領域にハイブリダイズするための)、ならびに任意に配列決定アダプターのさらなる部分および/または残りの部分を含む5’領域を含む第2の増幅プライマーと、を含む増幅プライマー対を用いることができる。
【0038】
本開示の「スプリントオリゴヌクレオチド」は、SSB結合ssNAハイブリダイゼーション領域およびアダプターオリゴヌクレオチドハイブリダイゼーション領域を含むオリゴヌクレオチドである。SSB結合ssNAハイブリダイゼーション領域は、SSB結合ssNAの末端領域にハイブリダイズする領域(ヌクレオチド配列)である。アダプターオリゴヌクレオチドハイブリダイゼーション領域は、アダプターオリゴヌクレオチドのすべてまたは一部にハイブリダイズする領域(ヌクレオチド配列)である。スプリントオリゴヌクレオチドは、複合体形成時に、アダプターオリゴヌクレオチドの末端がSSB結合ssNAの末端領域の末端に隣接するように、SSB結合ssNAおよびアダプターオリゴヌクレオチドへの同時ハイブリダイゼーションのために設計される。
【0039】
スプリントオリゴヌクレオチドのSSB結合ssNAハイブリダイゼーション領域は、任意の好適な長さおよび配列を有し得る。いくつかの実施形態では、SSB結合ssNAハイブリダイゼーション領域の長さは、10ヌクレオチド以下である。ある特定の態様では、SSB結合ssNAハイブリダイゼーション領域は、4~20ヌクレオチド長、例えば、5~15、5~10、5~9、5~8、または5~7(例えば、6または7)ヌクレオチド長である。いくつかの実施形態では、SSB結合ssNAハイブリダイゼーション領域は、ランダムヌクレオチド配列を含み(例えば、それからなり)、従って様々なランダムSSB結合ssNAハイブリダイゼーション領域を有する複数の不均一なスプリントオリゴヌクレオチドが用いられる場合、その集合が、SSB結合ssNAの末端領域の配列にかかわらず、SSB結合ssNAの不均一集団のためのスプリントオリゴヌクレオチドとして機能することができる。
【0040】
したがって、ある特定の態様では、方法は、SSB結合ssNAと、アダプターオリゴヌクレオチドと、未定の配列の末端領域を有するSSB結合ssNAの非均一集団のためのスプリントオリゴヌクレオチドとして機能することができる様々なランダムSSB結合ssNAハイブリダイゼーション領域を有する複数の非均一スプリントオリゴヌクレオチドとを組み合わせることによって複合体を形成することを含む。
【0041】
いくつかの実施形態では、SSB結合ssNAハイブリダイゼーション領域は、既知の配列のSSB結合ssNA末端領域にハイブリダイズするように設計された既知の配列を含む。ある特定の態様では、既知の配列のそれぞれのSSB結合ssNA末端領域にハイブリダイズするように設計された既知の配列の異なるSSB結合ssNAハイブリダイゼーション領域を有する2つ以上の不均一スプリントオリゴヌクレオチドが用いられる。SSB結合ssNAハイブリダイゼーション領域が既知の配列を有する実施形態は、例えば、既知の配列の末端領域を有するSSB結合ssNAのサブセットのみから核酸ライブラリを生成することが望ましい場合、用途を見出す。したがって、ある特定の態様では、方法は、SSB結合ssNAと、アダプターオリゴヌクレオチドと、既知の配列の1つ以上の末端領域を有する1つ以上のSSB結合ssNAのためのスプリントオリゴヌクレオチドとして機能することができる既知の配列の1つ以上の異なるSSB結合ssNAハイブリダイゼーション領域を有する1つ以上の不均一スプリントオリゴヌクレオチドとを組み合わせることによって複合体を形成することを含む。
【0042】
ある特定の態様では、SSB結合ssNAハイブリダイゼーション領域は、1つ以上のユニバーサル塩基を含む。本明細書で使用される場合、「ユニバーサル塩基」は、4つの標準ヌクレオチド塩基:A、C、G、およびTの各々と無差別に塩基対合することができる塩基である。SSB結合ssNAハイブリダイゼーション領域に組み込まれ得るユニバーサル塩基としては、これらに限定されないが、2’-デオキシイノシン(dI、dInosine)および5-ニトロインドールが挙げられる。
【0043】
SSB結合ssNA、アダプターオリゴヌクレオチド、およびスプリントオリゴヌクレオチドを組み合わせる方法は、変化し得る。いくつかの実施形態では、組み合わせることは、アダプターオリゴヌクレオチドハイブリダイゼーション領域を介してアダプターオリゴヌクレオチドにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体と、SSB結合ssNAとを組み合わせることを含む。他の態様では、組み合わせることは、SSB結合ssNAハイブリダイゼーション領域を介してSSB結合ssNAにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体と、アダプターオリゴヌクレオチドとを組み合わせることを含む。さらに他の態様では、組み合わせることは、SSB結合ssNA、アダプターオリゴヌクレオチド、およびスプリントオリゴヌクレオチドを組み合わせることを含み、3つの構成成分のいずれも、組み合わせる前に別の構成成分と予め複合体化(すなわち、ハイブリダイズ)されていない。
【0044】
組み合わせることは、複合体が、SSB結合ssNAハイブリダイゼーション領域を介してSSB結合ssNAの末端領域にハイブリダイズされたスプリントオリゴヌクレオチドと、アダプターオリゴヌクレオチドハイブリダイゼーション領域を介してアダプターオリゴヌクレオチドにハイブリダイズされたスプリントオリゴヌクレオチドとを含むように、ハイブリダイゼーション条件下で実施される。特異的なハイブリダイゼーションが起こるかどうかは、スプリントオリゴヌクレオチドの関連する(すなわちハイブリダイゼーションする)領域と、SSB結合ssNAの末端領域と、アダプターオリゴヌクレオチドとの間の相補性の程度、ならびにそれらの長さ、塩濃度、およびハイブリダイゼーションが起こる温度(関連する領域の融解温度(TM)によって通知され得る)のような要因によって決定される。融解温度は、関連する領域の半分がハイブリダイズされたままであり、関連する領域の半分が一本鎖に解離する温度を指す。二本鎖のTmは、以下の式Tm=81.5+16.6(log10[Na+])+0.41(G+C割合)-(60/N)を使用して実験的に決定または予測することができ、式中、Nは鎖長であり、[Na+]は1M未満である。Sambrook and Russell(2001;Molecular Cloning:A Laboratory Manual,3rd ed.,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,Ch.10)を参照されたい。様々なパラメータに依存する他のより先進的なモデルも、様々なハイブリダイゼーション条件に応じて、関連する領域のTmを予測するために使用することができる。特異的核酸ハイブリダイゼーションを達成するためのアプローチは、例えば、Tijssen,Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,part I,chapter 2,“Overview of principles of hybridization and the strategy of nucleic acid probe assays,”Elsevier(1993)に見出され得る。
【0045】
本明細書で使用される「相補的」または「相補性」という用語は、標的核酸の領域への非共有結合によって塩基対合するヌクレオチド配列、例えば、SSB結合ssNAの末端領域にハイブリダイズするSSB結合ssNAハイブリダイゼーション領域のヌクレオチド配列、およびプローブ相補的オリゴヌクレオチドにハイブリダイズするアダプターオリゴヌクレオチドハイブリダイゼーション領域のヌクレオチド配列を指す。正準ワトソン-クリック型塩基対において、DNAでグアニン(G)がシトシン(C)と塩基対を形成するように、アデニン(A)はチミン(T)と塩基対合する。RNAでは、チミンは、ウラシル(U)で置き換えられる。したがって、Aは、Tに相補的であり、Gは、Cに相補的である。RNAでは、Aは、Uに相補的であり、その逆もまた同様である。典型的には、「相補的」または「相補性」とは、少なくとも部分的に相補的なヌクレオチド配列を指す。これらの用語はまた、一方の鎖のすべてのヌクレオチドが対応する位置の他方の鎖のすべてのヌクレオチドに相補的であるように完全に相補的な二本鎖も包含し得る。場合によっては、ヌクレオチド配列は、標的に部分的に相補的であり得、その場合、すべての対応する位置において、すべてのヌクレオチドが標的核酸中のすべてのヌクレオチドに相補的であるとは限らない。例えば、SSB結合ssNAハイブリダイゼーション領域は、SSB結合ssNAの末端領域に完全に(すなわち、100%)相補的であり得るか、またはSSB結合ssNAハイブリダイゼーション領域は、完全ではないある程度の(例えば、70%、75%、85%、90%、95%、99%の)相補性を共有し得る。2つのヌクレオチド配列の同一性パーセントは、最適な比較目的のために配列を整列させることによって決定することができる(例えば、最適な整列のために第1の配列の配列にギャップを導入することができる)。次いで、対応する位置のヌクレオチドを比較し、2つの配列間の同一性パーセントは、その配列によって共有される同一位置の数の関数である(すなわち、同一性%=同一位置の数/位置の総数×100)。一方の配列中の位置が他方の配列中の対応する位置と同じヌクレオチドによって占められているとき、それらの分子は、その位置で同一である。そのような数学的アルゴリズムの非限定的な例はKarlin et al.,Proc.Natl.Acad.Sci.USA 90:5873-5877(1993)に記載されている。そのようなアルゴリズムは、Altschul et al.,Nucleic Acids Res.25:389-3402(1997)に記載されているように、NBLASTおよびXBLASTプログラム(バージョン2.0)に組み込まれている。BLASTおよびGapped BLASTプログラムを利用するとき、それぞれのプログラム(例えば、NBLAST)のデフォルトパラメータを使用することができる。一態様では、配列比較のためのパラメータは、スコア=100、ワード長=12に設定することができ、または変更することができる(例えば、ワード長=5またはワード長=20)。
【0046】
複合体は、アダプターオリゴヌクレオチドの末端がSSB結合ssNAの末端領域の末端に隣接するように形成される。「に隣接する」とは、アダプターオリゴヌクレオチドの末端の末端ヌクレオチド、およびSSB結合ssNAの末端領域の末端ヌクレオチド末端が互いに十分に近接しており、それらの末端ヌクレオチドが、例えば、化学ライゲーション、酵素的ライゲーションなどによって共有結合し得ることを意味する。いくつかの実施形態では、それらの末端は、アダプターオリゴヌクレオチドの末端にある末端ヌクレオチドと、SSB結合ssNAの末端領域の末端ヌクレオチド末端とが、スプリントオリゴヌクレオチドの隣接するヌクレオチドにハイブリダイズすることにより互いに隣接する。スプリントオリゴヌクレオチドは、アダプターオリゴヌクレオチドの末端がSSB結合ssNAの末端領域の末端に隣接することを確実にするように設計され得る。かかるスプリントオリゴヌクレオチドの非限定的な例は、本明細書の実験セクションに提供されている。
【0047】
本明細書に記載される方法のうちのいずれかは、アダプターオリゴヌクレオチドとSSB結合ssNAとの隣接する末端を共有結合させることをさらに含み得る。共有結合は、隣接する末端をライゲーションすることを含み得る。隣接する末端のライゲーションは、任意の好適なアプローチを使用して実施され得る。ある特定の態様では、ライゲーションは、化学ライゲーションによるものである。他の態様では、ライゲーションは、酵素的ライゲーションによるものである。酵素的ライゲーション反応を行うための好適な試薬(例えば、リガーゼおよび対応する緩衝液など)およびキットは、既知であり、例えば、New England Biolabs(Ipswich,MA)から入手可能なInstant Sticky-end Ligase Master Mixが利用可能である。用いられ得るリガーゼとしては、例えば、T4 DNAリガーゼ(例えば、低濃度または高濃度)、T4 DNAリガーゼ、T7 DNAリガーゼ、E.coli DNAリガーゼ、Electro Ligase(登録商標)などが挙げられる。ライゲーション反応を行うのに好適な条件は、使用されるリガーゼの種類に応じて変化するであろう。かかる条件に関する情報は、容易に利用可能である。必要な場合、例えば、T4ポリヌクレオチドキナーゼ(PNK)などの好適なキナーゼを使用して、アダプターオリゴヌクレオチドまたはSSB結合ssNAの5’末端にリン酸基が付加され得る。かかるキナーゼおよびかかるキナーゼを使用して5’末端をリン酸化するためのガイダンスは、例えば、New England BioLabs,Inc.(Ipswich,MA)から利用可能である。
【0048】
いくつかの実施形態では、スプリントオリゴヌクレオチド、アダプターオリゴヌクレオチド、またはその両方は、ブロッキング修飾を含む。例えば、スプリントオリゴヌクレオチドの一方または両方の末端がブロッキング修飾を含み得、かつ/または、SSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端がブロッキング修飾を含み得る。「ブロッキング修飾」とは、アダプターオリゴヌクレオチドおよびSSB結合ssNAの隣接する末端を共有結合させるために利用されるアプローチを使用して、当該末端が他のオリゴヌクレオチド成分の末端に連結される能力がないことを意味する。ある特定の態様では、ブロッキング修飾は、ライゲーションをブロックする修飾である。スプリントオリゴヌクレオチドの一方もしくは両方の末端、および/または、アダプターオリゴヌクレオチドのうちSSB結合ssNAに隣接しない側の末端に含まれ得るブロッキング修飾の例としては、SSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端での3’OHの不在、およびSSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端でアクセス不可能な3’OHが挙げられる。末端がアクセス不可能な3’OHを有するブロッキング修飾の非限定的な例としては、アミノ修飾因子、スペーサー、ジデオキシ塩基、反転ジデオキシ塩基、3’ホスフェートなどが挙げられる。
【0049】
ある特定の態様では、スプリントオリゴヌクレオチド、アダプターオリゴヌクレオチド、またはその両方は、1つ以上の非天然ヌクレオチド(ヌクレオチドアナログとも称され得る)を含む。スプリントオリゴヌクレオチド、アダプターオリゴヌクレオチド、またはその両方に含まれ得る非天然ヌクレオチドの非限定的な例は、LNA(ロックド核酸)、PNA(ペプチド核酸)、FANA(2’-デオキシ-2’-フルオロアラビノヌクレオチド)、GNA(グリコール核酸)、TNA(トレオース核酸)、2’-O-Me RNA、2’-フルオロRNA、モルホリノヌクレオチド、およびそれらの任意の組み合わせである。
【0050】
アダプターオリゴヌクレオチドとSSB結合ssNAとの隣接する末端を共有結合させることにより、アダプター付(adapted)ssNAが生成され、ここで「アダプター付」とは、ssNAが1つ以上のアダプター配列またはそのサブ領域を含むことを意味する。アダプター付ssNAは、目的の下流アプリケーションにおいてインプットとして使用される前に精製され得る。例えば、複合体は、アダプター付ssNAをスプリントオリゴヌクレオチドから分離するために変性(例えば、熱変性)されてもよく、アダプター付ssNAは、SSB、および/または、(例えば固相可逆固定化(SPRI)、カラム精製、および/または同等物による)接触および/または組み合わせステップ中に存在する任意の他の構成成分から、またはそれらの組み合わせから、精製されてもよい。
【0051】
いくつかの実施形態では、1つ以上のアダプター配列またはそのサブ領域は、1つ以上の配列決定アダプターまたはそのサブ領域であり、方法は、アダプター付ssNAまたはその誘導体(例えば、アダプター付ssNAをテンプレートとして使用してPCR増幅によって生成される増幅体)の少なくとも一部を配列決定することをさらに含む。配列決定は、ハイスループット配列決定(HTS)(または「次世代配列決定(NGS)」)プラットフォームなどを含む任意の好適な配列決定プラットフォーム上で実施され得る。目的のHTS/NGS配列決定プラットフォームとしては、これらに限定されないが、Illumina(登録商標)によって提供される配列決定プラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)、および/またはGenome Analyzer(商標)配列決定システム)、Oxford Nanopore(商標)Technologies(例えば、MinION(商標)、GridIONx5(商標)、PromethION(商標)、またはSmidgION(商標)ナノポアベースの配列決定システム)、Ion Torrent(商標)(例えば、Ion PGM(商標)および/またはIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、SequelまたはPacBio RS II配列決定システム)、Life Technologies(商標)(例えば、SOLiD配列決定システム)、Roche(例えば、454 GS FLX+および/またはGS Junior配列決定システム)その他の配列決定プラットフォームが挙げられる。直接配列決定すること(例えば、ナノポアベースの配列決定によって)または特定のプラットフォームで配列決定するために適合可能な核酸分子を調製すること(例えば、増幅によって、例えば、固相増幅など)、適合可能な分子を配列決定すること、および配列決定データを分析することのための詳細なプロトコルは、目的の配列決定プラットフォームの製造業者から入手可能である。
【0052】
上に要約されるように、本開示の方法は、Gansauge et al.(2017)Nucleic Acids Research 45(10):e79によって記載されるアプローチ(「ssDNA2.0」と称される)などの、一本鎖ライブラリ調製に対する現在の最先端のアプローチの改善を構成し、本方法は、驚くべきことに、より効率的であり、より少ない時間を必要とし、コストを低減することが見出された。いくつかの実施形態では、方法が、アダプターオリゴヌクレオチドとSSB結合ssNAとの隣接する末端を共有結合させることを含む場合、組み合わせおよび共有結合ステップの合計時間は、4時間以下、3時間以下、2時間以下、または1時間以下である。ある特定の態様では、方法が、アダプターオリゴヌクレオチドとSSB結合ssNAとの隣接する末端を共有結合させることを含む場合、接触、組み合わせ、および共有結合ステップの合計時間は、4時間以下、3時間以下、2時間以下、または1時間以下である。いくつかの実施形態では、方法の効率は、接触ステップ中にSSBと接触されたssNAの70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、または99%以上から複合体が形成されるようになるものである。
【0053】
組成物
上に要約されるように、本開示はまた、組成物を提供する。組成物は、例えば、本開示の方法の部分において上に記載されるステップのうちのいずれかの1つ以上を実施することを含め、本開示の方法のうちのいずれかを実施することを含む、様々な用途において使用を見出す。したがって、組成物は、本開示の方法の部分において上に記載されるオリゴヌクレオチド(非均一オリゴヌクレオチドの複数/集合を含む)、ssNA、SSB、他の試薬などのうちのいずれかを、任意の組み合わせにおいて含み得る。
【0054】
ある特定の態様では、SSB結合ssNAと、第1のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む第1のスプリントオリゴヌクレオチドとを含む組成物が提供される。かかる組成物は、第2のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む第2のスプリントオリゴヌクレオチドとをさらに含み得る。
【0055】
ある特定の態様では、ハイブリダイズされた複合体として存在する(例えば、SSB結合ssNAの不在下で)、アダプターオリゴヌクレオチドハイブリダイゼーション領域を介してアダプターオリゴヌクレオチドにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体を含む組成物が提供される。他の態様では、ハイブリダイズされた複合体として存在する、SSB結合ssNAハイブリダイゼーション領域を介してSSB結合ssNAにハイブリダイズされたスプリントオリゴヌクレオチドを含む複合体を含む組成物が提供される。
【0056】
ssNAは、ssDNAであり得る。ssNAがssDNAである場合、ssDNAはdsDNAに由来し得る。いくつかの実施形態では、ssNAは、ssRNAである。いくつかの実施形態では、ssNAは、分解された核酸試料からのものである。ある特定の態様では、ssNAが分解核酸試料からのものであるとき、そのssNAは、絶滅した生物または動物、例えば、絶滅した哺乳動物から得られる(例えば、単離される)核酸試料などの、古代核酸試料からのものである。ある特定の態様では、絶滅した哺乳動物は、ヒト属からのものである。いくつかの実施形態では、ssNAは、法医学核酸試料からのものである。
【0057】
本開示の組成物は、アダプターオリゴヌクレオチド末端をSSB結合ssNAの末端に共有結合させるための試薬をさらに含み得る。いくつかの実施形態では、試薬は、化学ライゲーション試薬または酵素的ライゲーション試薬、例えば、リガーゼである。
【0058】
本開示の組成物は、容器内に存在する1つ以上の構成成分を含み得る。好適な容器としては、これらに限定されないが、チューブ、バイアル、およびプレート(例えば、96ウェルプレートまたは他のウェルプレート)が挙げられる。
【0059】
ある特定の態様では、組成物は、液体媒体中の1つ以上の構成成分を含む。液体媒体は、水、緩衝溶液などの水性液体媒体であってもよい。1つ以上の添加剤、例えば、塩(例えば、NaCl、MgCl2、KCl、MgSO4)、緩衝剤(トリス緩衝液、N-(2-ヒドロキシエチル)ピペラジン-N’-(2-エタンスルホン酸)(HEPES)、2-(N-モルホリノ)エタンスルホン酸(MES)、2-(N-モルホリノ)エタンスルホン酸ナトリウム塩(MES)、3-(N-モルホリノ)プロパンスルホン酸(MOPS)、N-トリス[ヒドロキシメチル]メチル-3-アミノプロパンスルホン酸(TAPS)など)、溶解剤、洗浄剤(例えば、Tween-20などの非イオン性洗浄剤)、ヌクレアーゼ阻害剤、グリセロール、キレート剤などが、かかる組成物中に存在し得る。
【0060】
キット
上記に要約したように、本開示は、キットを提供する。キットは、例えば、本開示の方法の部分において上に記載されるステップのうちのいずれかの1つ以上を実施することを含め、本開示の方法のうちのいずれかを実施することを含む、様々な用途において使用を見出す。したがって、キットは、本開示の方法の部分において上に記載されるオリゴヌクレオチド(非均一オリゴヌクレオチドの複数/集合を含む)、ssNA、SSB、他の試薬などのうちのいずれかを、任意の組み合わせにおいて含み得る。
【0061】
いくつかの実施形態では、本開示のキットは、一本鎖核酸結合タンパク質(SSB、例えば、一本鎖DNA結合タンパク質、一本鎖RNA結合タンパク質、またはその両方)と、第1のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む第1のスプリントオリゴヌクレオチドと、SSB、第1のアダプターオリゴヌクレオチド、および第1のスプリントオリゴヌクレオチドを使用して核酸ライブラリを生成するための指示とを含む。ある特定の態様では、かかるキットは、第2のアダプターオリゴヌクレオチドと、SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドを含む第2のスプリントオリゴヌクレオチドとをさらに含み、この場合の指示は、SSB、第1のアダプターオリゴヌクレオチド、第1のスプリントオリゴヌクレオチド、第2のアダプターオリゴヌクレオチド、および第2のスプリントオリゴヌクレオチドを使用して核酸ライブラリを生成するためのものである。
【0062】
本開示のキットは、アダプターオリゴヌクレオチド末端をSSB結合ssNAの末端に共有結合させるための試薬をさらに含み得る。いくつかの実施形態では、試薬は、化学ライゲーション試薬または酵素的ライゲーション試薬、例えば、リガーゼである。
【0063】
いくつかの実施形態では、スプリントオリゴヌクレオチド、アダプターオリゴヌクレオチド、またはその両方は、ブロッキング修飾を含む。例えば、スプリントオリゴヌクレオチドの一方または両方の末端がブロッキング修飾を含み得、かつ/または、SSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端がブロッキング修飾を含み得る。ある特定の態様では、ブロッキング修飾は、ライゲーションをブロックする修飾である。スプリントオリゴヌクレオチドの一方もしくは両方の末端、および/またはSSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端に含まれ得るブロッキング修飾の例としては、SSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端での3’OHの不在、およびSSB結合ssNAに隣接しない側のアダプターオリゴヌクレオチドの末端でアクセス不可能な3’OHが挙げられる。末端がアクセス不可能な3’OHを有することになるブロッキング修飾の非限定的な例としては、アミノ修飾因子、スペーサー、ジデオキシ塩基、反転ジデオキシ塩基、3’ホスフェートなどが挙げられる。
【0064】
いくつかの実施形態では、本開示のキットにおいて提供される1つ以上のスプリントオリゴヌクレオチドは、ランダムヌクレオチド配列を含む(例えば、それからなる)SSB結合ssNAハイブリダイゼーション領域を含み、従ってキットが様々なランダムSSB結合ssNAハイブリダイゼーション領域を有する複数の不均一なスプリントオリゴヌクレオチドを含む場合において、その集合が、目的のSSB結合ssNAの末端領域の配列にかかわらず、SSB結合ssNAの不均一集団のためのスプリントオリゴヌクレオチドとして機能することができる。
【0065】
ある特定の態様では、本開示のキットで提供されるスプリントオリゴヌクレオチドは、1つ以上のユニバーサル塩基を含むSSB結合ssNAハイブリダイゼーション領域を含む。SSB結合のssNAハイブリダイゼーション領域に組み込まれ得るユニバーサル塩基としては、これらに限定されないが、2’-デオキシイノシン(dI、dInosine)および5-ニトロインドールが挙げられる。
【0066】
いくつかの実施形態では、本開示のキットにおいて提供されるスプリントオリゴヌクレオチドのSSB結合ssNAハイブリダイゼーション領域の長さは、10ヌクレオチド以下である。ある特定の態様では、SSB結合ssNAハイブリダイゼーション領域は、4~20ヌクレオチド長、例えば、5~15、5~10、5~9、5~8、または5~7(例えば、6または7)ヌクレオチド長である。
【0067】
主題のキットの構成成分は、別々の容器に存在してもよく、または複数の構成成分が単一の容器に存在してもよい。好適な容器には、単一チューブ(例えば、バイアル)、1つ以上のウェルのプレート(例えば、96ウェルプレート、384ウェルプレートなど)などが含まれる。
【0068】
SSB、1つ以上のアダプターオリゴヌクレオチド、および1つ以上のスプリントオリゴヌクレオチドを使用して核酸ライブラリを生成するための指示は、好適な記録媒体に記録され得る。例えば、指示は、紙またはプラスチックなどの基材上に印刷することができる。そのようにして、指示は、添付文書としてキット内に、キットの容器またはその構成成分のラベルなどに(すなわち、包装または副包装に付随して)存在し得る。他の実施形態では、指示は、ポータブルフラッシュドライブ、DVD、CD-ROM、ディスケットなどの好適なコンピュータ可読記憶媒体上に存在する電子記憶データファイルとして存在する。さらに他の実施形態では、実際の指示はキット内には存在しないが、例えば、インターネットを介してリモートソースから指示を取得するための手段が提供される。この実施形態の一例は、指示を閲覧することができかつ/または指示をダウンロードできるウェブアドレスを含むキットである。指示と同様に、指示を得るための手段は、適切な基材上に記録される。
【0069】
本開示は以下の実施形態を含む。
実施形態1
核酸ライブラリを生成する方法であって、
一本鎖核酸(ssNA)を一本鎖核酸結合タンパク質(SSB)と接触させて、SSB結合ssNAを生成することと、
前記SSB結合ssNA、
第1のアダプターオリゴヌクレオチド、ならびに
SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第1のスプリントオリゴヌクレオチド
を組み合わせることと、
を含み、
前記SSB結合ssNAハイブリダイゼーション領域を介して前記SSB結合ssNAの末端領域にハイブリダイズされた前記第1のスプリントオリゴヌクレオチドと、前記第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第1のアダプターオリゴヌクレオチドにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドを含む複合体を形成し、これにより、前記第1のアダプターオリゴヌクレオチドの末端が前記SSB結合ssNAの前記末端領域の末端に隣接する、方法。
実施形態2
前記第1のアダプターオリゴヌクレオチドおよびSSB結合ssNAの前記隣接する末端を共有結合させることをさらに含む、実施形態1に記載の方法。
実施形態3
前記接触、組み合わせること、および共有結合のステップの合計持続時間が、3時間以下である、実施形態2に記載の方法。
実施形態4
前記複合体が、前記SSBと接触された前記ssNAの80%以上から形成される、実施形態1~3のいずれか一項に記載の方法。
実施形態5
前記ssNAが、分解された核酸試料からのものである、実施形態1~4のいずれか一項に記載の方法。
実施形態6
前記ssNAが、古代核酸試料からのものである、実施形態5に記載の方法。
実施形態7
前記ssNAが、法医学核酸試料からのものである、実施形態1~6のいずれか一項に記載の方法。
実施形態8
前記ssNAが、一本鎖DNA(ssDNA)である、実施形態1~7のいずれか一項に記載の方法。
実施形態9
前記ssDNAは二本鎖DNA(dsDNA)に由来するものである、実施形態8に記載の方法。
実施形態10
前記ssDNAをSSBと接触させる前に、前記dsDNAを変性させることによって前記ssDNAを生成することをさらに含む、実施形態9に記載の方法。
実施形態11
前記複合体の形成後、前記ssDNAを再ハイブリダイズさせて、dsDNAを生成することをさらに含む、実施形態9または実施形態10に記載の方法。
実施形態12
前記生成されたdsDNAを配列決定することをさらに含む、実施形態11に記載の方法。
実施形態13
前記生成されたdsDNAのサブサンプルが配列決定される、実施形態12に記載の方法。
実施形態14
前記ssNAが、一本鎖RNA(ssRNA)である、実施形態1~6のいずれか一項に記載の方法。
実施形態15
前記組み合わせることが、
前記第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第1のアダプターオリゴヌクレオチドにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドを含む複合体と、
前記SSB結合ssNAと
を組み合わせることを含む、実施形態1~14のいずれか一項に記載の方法。
実施形態16
前記組み合わせることが、
前記SSB結合ssNAハイブリダイゼーション領域を介して前記SSB結合ssNAにハイブリダイズされた前記第1のスプリントオリゴヌクレオチドを含む複合体と、
前記第1のアダプターオリゴヌクレオチドと
を組み合わせることを含む、実施形態1~14のいずれか一項に記載の方法。
実施形態17
前記組み合わせることが、
前記SSB結合ssNAと、
第2のアダプターオリゴヌクレオチドと、
SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第2のスプリントオリゴヌクレオチドと
を組み合わせることをさらに含み、
前記形成された複合体が、前記SSB結合ssNAのうち前記第1のスプリントオリゴヌクレオチドにハイブリダイズされた前記末端領域とは反対側の末端領域に、前記SSB結合ssNAハイブリダイゼーション領域を介してハイブリダイズされた前記第2のスプリントオリゴヌクレオチドと、前記第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を介して前記第2のアダプターオリゴヌクレオチドにハイブリダイズされた前記第2のスプリントオリゴヌクレオチドをさらに含み、これにより、前記第2のアダプターオリゴヌクレオチドの末端が、前記SSB結合ssNAのうち前記第1のアダプターオリゴヌクレオチドに隣接する前記末端とは反対側の末端に隣接する、実施形態1~16のいずれか一項に記載の方法。
実施形態18
前記第2のアダプターオリゴヌクレオチドおよびSSB結合ssNAの前記隣接する末端を共有結合させることをさらに含む、実施形態17に記載の方法。
実施形態19
前記共有結合させることが、前記隣接する末端をライゲーションすることを含む、実施形態1~18のいずれか一項に記載の方法。
実施形態20
前記ライゲーションが、酵素ライゲーションによって行われる、実施形態19に記載の方法。
実施形態21
アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端が、ブロッキング修飾を含む、実施形態1~20のいずれか一項に記載の方法。
実施形態22
前記ブロッキング修飾が、ライゲーションをブロックする修飾である、実施形態21に記載の方法。
実施形態23
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端における3’OHの不在、および、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHからなる群から選択される、実施形態21または実施形態22に記載の方法。
実施形態24
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHであり、前記ブロッキング修飾が、アミノ修飾因子、スペーサー、ジデオキシ塩基、反転ジデオキシ塩基、および3’ホスフェートからなる群から選択される、実施形態23に記載の方法。
実施形態25
前記SSB結合ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態1~24のいずれか一項に記載の方法。
実施形態26
前記SSB結合ssNAハイブリダイゼーション領域が、ユニバーサル塩基を含む、実施形態1~25のいずれか一項に記載の方法。
実施形態27
前記SSB結合ssNAハイブリダイゼーション領域の長さが、10ヌクレオチド以下である、実施形態1~26のいずれか一項に記載の方法。
実施形態28
前記アダプターオリゴヌクレオチドが、PCR増幅のためのアダプターまたはその相補体を含む、実施形態1~27のいずれか一項に記載の方法。
実施形態29
前記アダプターオリゴヌクレオチドが、部分的もしくは完全な配列決定アダプターまたはその相補体を含む、実施形態1~28のいずれか一項に記載の方法。
実施形態30
前記ssNAまたはその誘導体の少なくとも一部分を配列決定することをさらに含む、実施形態1~29のいずれか一項に記載の方法。
実施形態31
一本鎖核酸結合タンパク質に結合した一本鎖核酸(SSB結合ssNA)と、
第1のアダプターオリゴヌクレオチドと、
SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第1のスプリントオリゴヌクレオチドと
を含む、組成物。
実施形態32
第2のアダプターオリゴヌクレオチドと、
SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第2のスプリントオリゴヌクレオチドと
をさらに含む、実施形態31に記載の組成物。
実施形態33
前記ssNAが、分解された核酸試料からのものである、実施形態31または実施形態32に記載の組成物。
実施形態34
前記ssNAが、古代核酸試料からのものである、実施形態33に記載の組成物。
実施形態35
前記ssNAが、法医学核酸試料からのものである、実施形態31~33のいずれか一項に記載の組成物。
実施形態36
前記ssNAが、一本鎖DNA(ssDNA)である、実施形態31~35のいずれか一項に記載の組成物。
実施形態37
前記ssDNAが二本鎖DNA(dsDNA)に由来するものである、実施形態36に記載の組成物。
実施形態38
前記ssNAが、一本鎖RNA(ssRNA)である、実施形態31~35のいずれか一項に記載の組成物。
実施形態39
アダプターオリゴヌクレオチド末端を、前記SSB結合ssNAの末端に共有結合させるための試薬をさらに含む、実施形態31~38のいずれか一項に記載の組成物。
実施形態40
前記試薬が、リガーゼである、実施形態39に記載の組成物。
実施形態41
一本鎖核酸結合タンパク質(SSB)と、
第1のアダプターオリゴヌクレオチドと、
SSB結合ssNAハイブリダイゼーション領域および第1のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第1のスプリントオリゴヌクレオチドと、
前記SSB、第1のアダプターオリゴヌクレオチド、および第1のスプリントオリゴヌクレオチドを使用して核酸ライブラリを生成するための指示と
を含む、キット。
実施形態42
第2のアダプターオリゴヌクレオチドと、
SSB結合ssNAハイブリダイゼーション領域および第2のアダプターオリゴヌクレオチドハイブリダイゼーション領域を含む、第2のスプリントオリゴヌクレオチドと
をさらに含み、
前記指示が、前記SSB、第1のアダプターオリゴヌクレオチド、第1のスプリントオリゴヌクレオチド、第2のアダプターオリゴヌクレオチド、および第2のスプリントオリゴヌクレオチドを使用して核酸ライブラリを生成するためのものである、実施形態41に記載のキット。
実施形態43
前記SSBが、一本鎖DNA結合タンパク質である、実施形態41または42に記載のキット。
実施形態44
前記SSBが、一本鎖RNA結合タンパク質である、実施形態41または42に記載のキット。
実施形態45
アダプターオリゴヌクレオチドの末端を、一本鎖核酸結合タンパク質に結合した一本鎖核酸(SSB結合ssNA)の末端に連結するための試薬をさらに含む、実施形態41~44のいずれか一項に記載のキット。
実施形態46
前記試薬が、リガーゼである、実施形態45に記載のキット。
実施形態47
アダプターオリゴヌクレオチドの末端が、ブロッキング修飾を含む、実施形態41~46のいずれか一項に記載のキット。
実施形態48
前記ブロッキング修飾が、ライゲーションをブロックする修飾である、実施形態47に記載のキット。
実施形態49
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端における3’OHの不在、および、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHからなる群から選択される、実施形態47または実施形態48に記載のキット。
実施形態50
前記ブロッキング修飾が、前記アダプターオリゴヌクレオチドのうち前記SSB結合ssNAに隣接しない側の末端におけるアクセス不可能な3’OHであり、前記ブロッキング修飾が、アミノ修飾因子、スペーサー、ジデオキシ塩基、反転ジデオキシ塩基、および3’ホスフェートからなる群から選択される、実施形態47または実施形態48に記載のキット。
実施形態51
前記SSB結合ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態41~50に記載のキット。
実施形態52
前記SSB結合ssNAハイブリダイゼーション領域が、ユニバーサル塩基を含む、実施形態41~51に記載のキット。
実施形態53
前記SSB結合ssNAハイブリダイゼーション領域の長さが、10ヌクレオチド以下である、実施形態41~52に記載のキット。
以下の実施例は例示のために提供され、限定するものではない。
【実施例】
【0070】
実験
実施例1
1つの反応における一本鎖DNAへの迅速で効率的で標的化されたアダプターのライゲーションのためのアプローチがここに開示される。以下の実施例では、Illumina P7またはP5アダプター配列を含む配列決定アダプターオリゴヌクレオチドが、P7スプリントについては一連の3プライムNおよびP5スプリントについては一連の5プライムNを含むスプリントオリゴヌクレオチドにハイブリダイズされる。スプリントは、二本鎖ライゲーションのみ高効率で行うことができるリガーゼに、アダプターを標的一本鎖DNAにライゲーションさせるための機会を作り出す。ライゲーションに関与することが必要とされないすべてのオリゴヌクレオチドDNA末端は、ライゲーションを防止するオリゴヌクレオチド修飾(例えばアミノ修飾)によってブロックされる。
【0071】
アッセイへの一本鎖結合タンパク質(SSB)の添加は、反応の効率を増加させる。標的DNAの濃度および長さを使用して、最適なライゲーション効率を達成するために適切なSSBの量を計算する。SSBは、二次構造を防止しながら、一本鎖DNAの再アニーリングを防止し得る。
【0072】
この方法は、SS2.0として知られている、Gansauge et al.(2017)Nucleic Acids Research 45(10):e79によって記載されている一本鎖ライブラリ調製に比べて勝るとも劣らない。SS2.0と比較して、本方法は、有意に少ない時間を要し、配列決定され得る適切なアダプターライゲーションDNA分子へのDNAの変換の著しく増加した効率を呈する。加えて、本アプローチは、SS2.0と比較して試薬コストを削減する。
【0073】
アダプターおよびスプリントオリゴヌクレオチドは、適切なアダプターライゲーションには関与するべきでないすべての末端に、ライゲーションをブロックする修飾を担持するように操作される。これには、P5アダプターの5プライム末端、P7アダプターの3プライム末端、およびスプリントのすべての末端をブロックすることが含まれる。これらのライゲーションブロッキング修飾は、アミノ修飾因子、炭素スペーサー、ジデオキシ塩基、または、3プライム末端の3プライムヒドロキシル基もしくは5プライム末端の5プライムホスフェートへのリガーゼのアクセスを防止する任意の他の好適な修飾であり得る。オリゴヌクレオチドは、例えば、Integrated DNA Technologies(IDT)によって合成され得る。例のオリゴヌクレオチドを以下の表1に示す。
【表1】
【0074】
この実施例で用いられるプロトコルでは、テンプレートDNAをSSBと組み合わせ、熱変性させた。変性後、反応物を氷上または4℃におけるPCR冷却器上に置いた。冷却後、各反応物にアダプターを添加した。次いで、反応マスター混合物を添加し、続いて混合する。37℃でのインキュベーションで直ちにライゲーションが開始し、45分間までにほとんどのライゲーションが起こる。反応物は、確立された方法でクリーンアップすることができ、増幅および配列決定などの下流アプリケーションは変わらない。
【0075】
アダプターを調製するために、最終濃度10uMのP5アダプター、および最終濃度20μMのP5スプリントオリゴヌクレオチドを、1倍の最終濃度のT4 RNAリガーゼ緩衝液(カタログ番号B0216L)と組み合わせた。P7アダプターおよびP7スプリントオリゴヌクレオチドを使用して、類似の別個の混合物を調製した。95℃に10秒間加熱し、次いで0.1℃/秒の速度で10℃までランプダウンすることによってアダプターをハイブリダイズさせた。
【0076】
例のプロトコルの例を以下に提供する。
1.試料インプット(36uL)
a.剪断DNAおよびET SSB(カタログ番号M2401S)を36uLの体積に組み合わせる
i.1uLのET SSBは、試験したほとんどの試料タイプに対して阻害することなくライゲーションを促進する
ii.緩衝液EBT(10mMのトリス-HCl、pH8.0、および0.05%のTween 20)で残りの体積を充填する
2.試料変性
a.95℃に予熱した蓋を有するサーモサイクラー中で試料を3分間インキュベートする
b.直ちに変性試料を氷またはPCR冷却器上に30秒間置く。
3.2uLのプールされたアダプター混合物(等しい体積のP5およびP7アダプター)を添加する
a.アダプターインプットは、インプットのモル濃度に依存する。6~10対1のモル比のアダプター対テンプレートが好ましい。
4.反応マスター混合物を添加し、ピペッティングにより十分に混合する
a.8uLのT4 DNAリガーゼ緩衝液(カタログ番号M0202M)
b.32uLの50%PEG 8000(カタログ番号B0216L)
c.1uLのT4ポリヌクレオチドキナーゼ-10,000U/mL(カタログ番号M0201L)
d.1uLのT4 DNAリガーゼ-2,000,000U/mL(カタログ番号M0202M)
5.37℃で最大60分間インキュベートする
a.ほとんどのライゲーションは最初の15分で生じるが、プラトーは約45分まで達成されない。
6.反応物をクリーンアップする
a.カラムクリーンアップ(例えば、分解DNA用)またはSPRI(例えば、現代試料用)。
【0077】
比較および最適化アッセイ
クリーンアップ後、予め増幅したライブラリの希釈物に対してqPCRを行い、ライゲーション効率を決定した。より低いCT値は、より高いCT値を有する同じ試験の別の試料と比較して、より高いライゲーション効率を示す。1の差は、ライブラリ効率の2倍の差にほぼ等しい。予め増幅したライブラリのアリコートを、インデックスPCR反応でも増幅した。インデックス化後、ライブラリをSPRIでクリーニングし、Agilent TapeStation 2200システム上で可視化して、各ライブラリ内のアダプタアーティファクトの割合を推定した。
【0078】
一本鎖結合タンパク質
NEBによって供給されるET SSBタンパク質などの一本鎖結合タンパク質(SSB)は、一本鎖ライゲーションのライゲーション効率を向上させることが観察された。インプットのモル濃度が等しいとすると、より高い平均断片長を有する試料は、ピークライゲーションを達成するためにSSBのより大きなインプットを必要とした。反応物中のDNAのモル濃度も、必要とされるSSBの量に影響する。ET SSBは過剰が膨大であればライゲーションを阻害する潜在能力を有する。
【0079】
プロトコル比較
本プロトコルの効率を、NEB Ultra 2キット(dsDNA)、SS2.0(Gansauge et al.(2017)Nucleic Acids Research 45(10):e79)、ならびにCaroe et al.(2017)Methods in Ecology and Evolution 9(2):410-419およびMak et al.(2017)GigaScience 6:1-13に記載されている平滑末端単一チューブ(BEST)法と比較した。平均断片長が約350bpの現代ヒトDNAと、平均断片長が約35~40bpで分解が激しい古代バイソン試料とを使用して比較結果を得た。
【0080】
NEB Ultra 2キットは、現代試料のための非常に効率的なライブラリ調製方法として認識されており、一方で、SS2.0は、分解された試料のための非常に効率的なライブラリ調製方法として認識されている。BESTプロトコルは、T4 DNAポリメラーゼおよびT4 PNKを使用して、DNAを平滑末端化し(尾部なし)5’末端をリン酸化する、平滑末端修復が関わるものである。次に、T4 DNAリガーゼを使用してその平滑末端に平滑末端dsDNAアダプターをライゲーションし、続いて、Bst 2.0 Warmstartポリメラーゼを使用して充填反応させ、SPRIビーズまたはカラムを使用してクリーンアップする。
【0081】
比較結果を
図2に提供する。上部パネルの左から右に、この実施例で説明されている方法(アスタリスク)、ss2.0、およびBESTである。下部パネルの左から右に、この実施例で説明されている方法(アスタリスク)、NEB Ultra 2キット、ss2.0、およびBESTである。この実施例に記載される方法は、ss2.0と比較して、古代試料についてはるかに高いライゲーション効率を呈する。現代試料については、この実施例に記載される方法は、NEB Ultra 2キットより0.3~0.5qPCRサイクル遅れる。
【0082】
実施例2-毛髪DNA
標準的なプロテイナーゼK処理を使用して、高温で毛髪からDNAを収集した。ライブラリを作製するためのテンプレートとして6ナノグラムのDNAを使用した。上に記載されるようにプロトコルに従った。アダプターライゲーション生成物から2つの配列決定ライブラリを生成した。1つは、50μLの全ライゲーション生成物のうちの1μLを使用した(SRL3)。もう1つはこの生成物を2.5μL使用した(SRL4)。両方のライブラリをIllumina MiSeq配列決定プラットフォーム上で配列決定して、ライブラリの特徴および複雑度(固有のライブラリ分子の数)を評価した。
【0083】
2×75のペア・エンド配列決定後、SeqPrepプログラムを使用して、互いに重複するフォワードリードおよびリバースリードの対を組み合わせた。これは、元のDNAテンプレートが十分に短いためにフォワードリードとリバースリードとがいくらかの同じ配列(本明細書では「マージされたリード」と称される)をカバーする場合に生じる。マージ後、マージされたリードおよびマージされていないリードを参照ヒトゲノム配列にマッピングした。
図3に示されるのは、SRL3およびSRL4ライブラリの両方について、マージされかつマッピングされた、マージされたがマッピングされない、ならびにマージされたがマッピングされないリードの、観察された元のテンプレート長の分布である。なお、マージされずかつマッピングされない場合では、テンプレートDNAの長さを推測することは不可能である。
【0084】
Preseqソフトウェアプログラムを使用して、両方のライブラリにおける固有のライブラリ分子の数を推定した。このプログラムは、ここで生成されたような、観察されたリードの大きなサンプルからの核酸ライブラリの複雑度をモデル化するために、観察された重複分子の数をカウントする。このプログラムは、ライブラリ配列決定の様々な深度において、固有であると予測される観察されたリードの画分についての推定値を示す。
図4に示されるように、両方のライブラリが、250,000,000超の固有分子の複雑度を有すると予測される。2.5μLのアダプターライゲーションテンプレートから作製されたSRL4は、SRL3よりも多くの固有分子を有している。
【0085】
実施例3-バイソン骨由来の古代DNA
古代バイソン骨から抽出したDNAを用いて、テンプレートDNA分子から配列決定ライブラリへの変換効率を比較した。上に記載されるプロトコルを含む4つの異なるプロトコルを用いて、同じ抽出物からの同じ量のDNAからライブラリを生成した。
【0086】
アダプターライゲーション生成物のqPCRおよび直接配列決定という2つのアプローチを使用して、ライブラリの複雑度を測定した。qPCR推定は、3つ組で行った。
図5に示される両方のアプローチは、DNAを配列決定ライブラリに変換することにおいて、本明細書に記載されるアプローチの方が効率的であることを示している。
【0087】
このように、上記は単に本開示の原理を説明しているにすぎない。当業者であれば、たとえ本明細書に明示的に記載または図示されていなくても、本発明の原理を具現化しその趣旨および範囲内に含まれる、様々な構成を工夫できることが理解されよう。さらに、本明細書に記載されたすべての例および条件語句は、本発明の原理および発明者らにより当該技術分野の促進のために寄与される概念を理解する上で読者を助けることを主として意図しており、このような具体的に記載された例および条件への限定ではないと解釈されるべきである。また、本発明の原理、態様、および実施形態、ならびにその具体的な例を記載する本明細書におけるすべての記述は、その構造的および機能的等価物の両方を包含することを意図している。加えて、そのような等価物は、現在知られている等価物および将来開発される等価物の両方、すなわち、構造にかかわらず同じ機能を果たすいかなる開発要素も含むことが意図される。したがって、本発明の範囲は、本明細書に図示および記載された例示的な実施形態に限定されることを意図していない。
【配列表】