(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-25
(54)【発明の名称】核酸を解析するための方法および組成物
(51)【国際特許分類】
C12N 15/09 20060101AFI20230718BHJP
C40B 40/06 20060101ALI20230718BHJP
C12N 15/11 20060101ALI20230718BHJP
C12Q 1/6876 20180101ALI20230718BHJP
C12M 1/00 20060101ALI20230718BHJP
C12M 1/34 20060101ALI20230718BHJP
C12N 15/10 20060101ALN20230718BHJP
C12Q 1/6806 20180101ALN20230718BHJP
【FI】
C12N15/09 200
C40B40/06 ZNA
C12N15/11 Z
C12Q1/6876 Z
C12M1/00 A
C12M1/34 Z
C12N15/10 110Z
C12Q1/6806 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022579952
(86)(22)【出願日】2021-06-23
(85)【翻訳文提出日】2023-02-22
(86)【国際出願番号】 US2021038609
(87)【国際公開番号】W WO2021262805
(87)【国際公開日】2021-12-30
(32)【優先日】2020-10-01
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-10
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-06-01
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-06-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】520253487
【氏名又は名称】クラレット バイオサイエンス, エルエルシー
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】トロル, クリストファー ジェイ.
(72)【発明者】
【氏名】ラオ, ヴァーシャ
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029AA23
4B029BB20
4B029CC01
4B029FA15
4B029GA08
4B029GB06
4B029GB10
4B063QA13
4B063QQ28
4B063QQ42
4B063QQ52
4B063QQ62
4B063QR08
4B063QR32
4B063QR35
4B063QR42
4B063QR62
4B063QR66
4B063QS03
4B063QS25
4B063QS34
4B063QS36
4B063QS39
4B063QX02
(57)【要約】
本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、一本鎖核酸断片から核酸ライブラリーを調製するための方法および組成物に関する。生命体(例えば、動物、植物および微生物)および遺伝情報を複製する他の形態(例えば、ウイルス)の遺伝情報は、核酸(すなわち、デオキシリボ核酸(DNA)またはリボ核酸(RNA))にコードされている。遺伝情報は、化学的核酸または仮説的核酸の一次構造に相当するひと続きのヌクレオチドまたは修飾ヌクレオチドである。
【特許請求の範囲】
【請求項1】
核酸ライブラリーを生成する方法であって、
(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)複数の第1のオリゴヌクレオチド種と、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、
(a)前記複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(b)前記複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を含み;
(c)前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)前記第1の隣接領域に相補的なポリヌクレオチド、および(ii)前記第2の隣接領域に相補的なポリヌクレオチドを含み;
(d)前記核酸組成物、前記複数の第1のオリゴヌクレオチド種、および前記複数の第1の足場ポリヌクレオチド種が、前記第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)前記第1のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、前記第1のオリゴヌクレオチドの前記分子の末端が前記第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法。
【請求項2】
前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)前記第1のUMIに対応する領域を含む、請求項1に記載の方法。
【請求項3】
前記第1のオリゴヌクレオチド種の各々についての前記第1の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、請求項1または2に記載の方法。
【請求項4】
前記第1のオリゴヌクレオチド種の各々についての前記第2の隣接領域が、(1)非ランダム配列、(2)第1のプライマー結合ドメイン、(3)第1のシーケンシングアダプター、またはその一部、および(4)インデックスから選択される1つまたは複数の特徴を含む、
請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記核酸組成物と(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(e)前記複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(f)前記核酸組成物、前記第2のオリゴヌクレオチド、および前記複数の第2の足場ポリヌクレオチド種が、前記第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)前記第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、前記第2のオリゴヌクレオチドの前記分子の末端が前記第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記核酸組成物と(iv)複数の第2のオリゴヌクレオチド種、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(e)前記複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(f)前記複数の第2のオリゴヌクレオチド種における各オリゴヌクレオチドが、第3の隣接領域および第4の隣接領域と隣接している第2の固有分子識別子(UMI)を含み;
(g)前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、(i)前記第3の隣接領域に相補的なポリヌクレオチド、および(ii)前記第4の隣接領域に相補的なポリヌクレオチドを含み;
(h)前記核酸組成物、前記複数の第2のオリゴヌクレオチド種、および前記複数の第2の足場ポリヌクレオチド種が、前記第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)前記第2のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、前記第2のオリゴヌクレオチドの前記分子の末端が前記第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
請求項1から4のいずれか一項に記載の方法。
【請求項7】
前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)前記第2のUMIに対応する領域を含む、請求項6に記載の方法。
【請求項8】
前記第2のオリゴヌクレオチド種の各々についての前記第3の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、請求項6または7に記載の方法。
【請求項9】
前記第2のオリゴヌクレオチド種の各々についての前記第4の隣接領域が、(1)非ランダム配列、(2)第2のプライマー結合ドメイン、(3)第2のシーケンシングアダプター、またはその一部、および(4)インデックスから選択される1つまたは複数の特徴を含む、請求項6から8のいずれか一項に記載の方法。
【請求項10】
前記ssNAが、前記結合させるステップの前に修飾されない、および/または前記ssNAが前記複数の第1のオリゴヌクレオチド種および前記複数の第1の足場ポリヌクレオチド種と結合される場合、前記ssNAの一方または両方のネイティブ末端が存在する、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記ssNAが、無細胞核酸からのものである、請求項1から10のいずれか一項に記載の方法。
【請求項12】
第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を各々が含む、複数の第1のオリゴヌクレオチド種と、
ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と
を含む、組成物であって、前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)前記第1の隣接領域に相補的なポリヌクレオチド、および(ii)前記第2の隣接領域に相補的なポリヌクレオチドを含む、組成物。
【請求項13】
前記第1のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)前記第1のUMIに対応する領域を含む、請求項12に記載の組成物。
【請求項14】
前記第1のオリゴヌクレオチド種の各々についての前記第1の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、請求項12または13に記載の組成物。
【請求項15】
前記第1のオリゴヌクレオチド種の各々についての前記第2の隣接領域が、(1)非ランダム配列、(2)第1のプライマー結合ドメイン、(3)第1のシーケンシングアダプター、またはその一部、および(4)インデックスから選択される1つまたは複数の特徴を含む、請求項12から14のいずれか一項に記載の組成物。
【請求項16】
第2のオリゴヌクレオチドと;
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含む、請求項12から15のいずれか一項に記載の組成物。
【請求項17】
第3の隣接領域および第4の隣接領域と隣接している第2の固有分子識別子(UMI)を各々が含む、複数の第2のオリゴヌクレオチド種と;
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含み、前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、(i)前記第3の隣接領域に相補的なポリヌクレオチド、および(ii)前記第4の隣接領域に相補的なポリヌクレオチドを含む、
請求項12から15のいずれか一項に記載の組成物。
【請求項18】
前記第2のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)前記第2のUMIに対応する領域を含む、請求項17に記載の組成物。
【請求項19】
前記第2のオリゴヌクレオチド種の各々についての前記第3の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、請求項17または18に記載の組成物。
【請求項20】
前記第2のオリゴヌクレオチド種の各々についての前記第4の隣接領域が、(1)非ランダム配列、(2)第2のプライマー結合ドメイン、(3)第2のシーケンシングアダプター、またはその一部、および(4)インデックスから選択される1つまたは複数の特徴を含む、請求項17から19のいずれか一項に記載の組成物。
【請求項21】
請求項12から20のいずれか一項に記載の組成物と使用説明書とを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連特許出願
本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてChristopher J.Trollを記名し、代理人整理番号CBS-2004-PVにより指定される、2020年6月24日に出願した米国仮特許出願第63/043,688号の利益を主張するものである。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてChristopher J.Trollらを記名し、代理人整理番号CBS-2004-PV2により指定される、2020年10月1に出願した米国特許仮出願第63/086,208号の利益を主張するものでもある。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてChristopher J.Trollらを記名し、代理人整理番号CBS-2004-PV3により指定される、2021年3月10に出願した米国特許仮出願第63/159,174号の利益を主張するものでもある。本特許出願は、発明の名称がMETHODS AND COMPOSITIONS FOR ANALYZING NUCLEIC ACIDであり、発明者としてChristopher J.Trollらを記名し、代理人整理番号CBS-2004-PV4により指定される、2021年6月1日に出願した米国仮特許出願第63/195,352号の利益を主張するものでもある。上述の特許出願の全内容は、本文、表および図面すべてを含めて、あらゆる目的で参照により本明細書に組み込まれる。
【0002】
分野
本技術は、一部は、核酸を解析するための方法および組成物に関する。一部の態様では、本技術は、一本鎖核酸断片からの核酸ライブラリーを調製するための方法および組成物に関する。
【背景技術】
【0003】
背景
生命体(例えば、動物、植物および微生物)および遺伝情報を複製する他の形態(例えば、ウイルス)の遺伝情報は、核酸(すなわち、デオキシリボ核酸(DNA)またはリボ核酸(RNA))にコードされている。遺伝情報は、化学的核酸または仮説的核酸の一次構造に相当するひと続きのヌクレオチドまたは修飾ヌクレオチドである。
【0004】
様々なハイスループットシーケンシングプラットフォームが、核酸を解析するために使用される。例えば、ILLUMINAプラットフォームは、アダプターがライゲーションされたDNA断片のクローン増幅を含む。別のプラットフォームは、核酸分子または個々のヌクレオチドが小さいチャネルを通って移行することに依拠する、ナノポアに基づくシーケンシングである。ある特定のシーケンシングプラットフォームのライブラリー調製は、DNAの断片化、断片末端の修飾、およびアダプターのライゲーションを含むことが多く、核酸断片の増幅(例えば、PCR増幅)を含むことがある。
【0005】
特定のタイプの核酸解析のための適切なシーケンシングプラットフォームの選択は、誤りの原因、誤り率、ならびにシーケンシングの速度およびコストを含む、利用可能な技術についての詳細な理解を必要とする。シーケンシングコストは低下してきたが、ライブラリー調製のスループットおよびコストは、制限要因であり得る。ライブラリー調製の一態様は、核酸断片の末端を、それらが特定のシーケンシングプラットフォームに好適であるように、修飾することを含む。核酸末端は、有用な情報を含有し得る。したがって、核酸末端に含有されている情報を保存しつつ、核酸末端を(例えば、ライブラリー調製のために)修飾する方法は、核酸の処理および解析に有用であると予想される。
【0006】
ライブラリー調製の別の態様は、一本鎖核酸断片を捕捉することを含む。ある特定の事例では、一本鎖ライブラリー調製方法は、旧来の二本鎖DNA(dsDNA)調製方法と比較してより良好でより複雑なライブラリーを生成することができる。一本鎖DNA(ssDNA)ライブラリーの生成の欠点としては、労力集約的で費用がかかり、かつ時間がかかるプロトコール、および新奇のまたは特別注文の試薬の要件が挙げられる。したがって、労力集約的で費用がかかり、かつ時間がかかるプロトコールおよび/または新奇のもしくは特別注文の試薬を必要とすることなく、一本鎖核酸を(例えば、ライブラリー調製のために)捕捉する方法は、核酸(例えば、一本鎖核酸、変性された二本鎖核酸、または一本鎖核酸を含有する混合物)の処理および解析に有用であると予想される。
【発明の概要】
【課題を解決するための手段】
【0007】
概要
ある特定の態様では、核酸ライブラリーを生成する方法であって、(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)複数の第1のオリゴヌクレオチド種と、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;(b)複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を含み;(c)第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第1の隣接領域に相補的なポリヌクレオチド、および(ii)第2の隣接領域に相補的なポリヌクレオチドを含み;(d)核酸組成物、複数の第1のオリゴヌクレオチド種、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)第1のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法が提供される。
【0008】
第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を各々が含む、複数の第1のオリゴヌクレオチド種と、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種とを含む、組成物であって、第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第1の隣接領域に相補的なポリヌクレオチド、および(ii)第2の隣接領域に相補的なポリヌクレオチドを含む、組成物も提供される。
【0009】
核酸ライブラリーを生成する方法であって、(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAと、プライマーオリゴヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、プライマーオリゴヌクレオチドが、RNA特異的タグを含み、cDNAが、RNA特異的タグを含み、dsDNAが、RNA特異的タグを含まない、ステップ;(b)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;(c)核酸組成物と第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;(ii)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNAおよび(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップを含む方法も、提供される。
【0010】
一本鎖相補デオキシリボ核酸(sscDNA)および一本鎖デオキシリボ核酸(ssDNA)を含み、sscDNAがRNA特異的タグを含む、核酸組成物と;第1のオリゴヌクレオチドと;sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種とを含む、組成物も提供される。
【0011】
核酸ライブラリーを生成する方法であって、(i)一本鎖リボ核酸(ssRNA)および一本鎖デオキシリボ核酸(ssDNA)を含む核酸組成物、(ii)第1のオリゴヌクレオチド、(iii)複数の第1の足場ポリヌクレオチド種、(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種を結合させるステップを含み、(a)第1のオリゴヌクレオチドが、RNA特異的タグを含み;(b)第2のオリゴヌクレオチドが、DNA特異的タグを含み;(c)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;(d)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;(e)核酸組成物、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssRNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssRNA末端領域の末端に隣接している第1セットハイブリダイゼーション産物が形成される条件;および第2の足場ポリヌクレオチド種の分子が(i)第1のssDNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第2のオリゴヌクレオチドの分子の末端が第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物の第2のセットが形成される条件下で結合される、方法も提供される。
【0012】
RNA特異的タグを含む第1のオリゴヌクレオチドと;DNA特異的タグを含む第2のオリゴヌクレオチドと;ssRNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;ssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種とを含む、組成物も提供される。
【0013】
核酸ライブラリーを生成する方法であって、(a)伸長条件下で、標的核酸を含む第1の核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖核酸(dsNA)を含み、(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを含む、ステップ;(b)伸長標的核酸から一本鎖核酸(ssNA)を生成するステップであって、それによって、ssNAを含む第2の核酸組成物が生成されるステップ;および(c)第2の核酸組成物と第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、(ii)第2の核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のssNA末端領域および(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップを含む方法も提供される。
【0014】
核酸ライブラリーを生成する方法であって、(a)伸長条件下で、標的核酸を含む核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖デオキシリボ核酸(dsDNA)を含み、(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを__に含む、ステップ;および(b)アダプターポリヌクレオチドを伸長標的核酸に結合させるステップであって、アダプターポリヌクレオチドが、一本鎖ループと二本鎖領域とを有するヘアピン構造を形成することができる1本の鎖を含み、それによって、一本鎖ループと二本鎖領域とを含む連続鎖伸長標的核酸が生成されるステップを含む方法も提供される。
【0015】
核酸ライブラリーを生成する方法であって、(a)伸長条件下で、標的核酸を含む核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖デオキシリボ核酸(dsDNA)を含み、(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを__に含む、ステップ;および(b)伸長標的核酸のコンカテマーを生成するステップであって、それによって、コンカテマー化された伸長標的核酸が生成されるステップを含む方法も提供される。
【0016】
核酸ライブラリーを生成する方法であって、(a)(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のssNA末端領域および(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ;および(b)ssNA中の1つまたは複数の非メチル化シトシン残基を脱アミノ化するステップであって、それによって、1つまたは複数の非メチル化シトシン残基がウラシルに変換されるステップを含む方法も提供される。
【0017】
核酸ライブラリーを生成する方法であって、(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAと、プライミングポリヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、(i)プライミングポリヌクレオチドが、プライマー、RNA特異的タグ、および第1のオリゴヌクレオチドを含み、(ii)cDNAが、RNA特異的タグおよび第1のオリゴヌクレオチドを含み、(iii)dsDNAが、RNA特異的タグも第1のオリゴヌクレオチドも含まない、ステップ;(b)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;および(c)sscDNAおよびssDNAを含む核酸組成物と、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップであって、(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み、(ii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を含み、(iii)sscDNAとssDNAとを含む核酸組成物、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件、および第2の足場ポリヌクレオチド種の分子が(1)第2のssDNA末端領域および(2)第3のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第3のオリゴヌクレオチドの分子の末端が第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件下で結合される、ステップを含む方法も、提供される。
【0018】
核酸を供給源に従って差次的に増幅する方法であって、(I)本明細書に記載される方法に従って核酸ライブラリーを生成するステップ;(II)ライブラリーの核酸分子を増幅するステップを含み、増幅するステップが、増幅条件下でライブラリーの核酸分子と第1の増幅プライマーおよび第2の増幅プライマーとを接触させることを含み、第1の供給源からの核酸および第2の供給源からの核酸が差次的に増幅され、それによって、差次的に増幅された産物が生成される、方法も提供される。
【0019】
一本鎖相補デオキシリボ核酸(sscDNA)および一本鎖デオキシリボ核酸(ssDNA)を含み、sscDNAがRNA特異的タグおよび第1のオリゴヌクレオチドを含む、核酸組成物と;第2のオリゴヌクレオチドと;sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;第3のオリゴヌクレオチドと;ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種とを含む、組成物も提供される。
【0020】
プライマー、RNA特異的タグ、および第1のオリゴヌクレオチドを含む、プライミングポリヌクレオチドと;第2のオリゴヌクレオチドと;sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;第3のオリゴヌクレオチドと;ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と;使用説明書とを含む、キットも提供される。
【0021】
核酸ライブラリーを生成する方法であって、(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAを第1のオリゴヌクレオチドに共有結合で連結させるステップであって、それによって、共有結合で連結されたssRNA産物が生成されるステップ;(b)共有結合で連結されたssRNA産物と、プライマーオリゴヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、プライマーオリゴヌクレオチドが第1のオリゴヌクレオチドハイブリダイゼーション領域を含む、ステップ;(c)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;(d)sscDNAおよびssDNAを含む核酸組成物と、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップであって、(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み、(ii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を含み、(iii)sscDNAとssDNAとを含む核酸組成物、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件、および第2の足場ポリヌクレオチド種の分子が(1)第2のssDNA末端領域および(2)第3のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第3のオリゴヌクレオチドの分子の末端が第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件下で結合される、ステップを含む方法も、提供される。
【0022】
第1のオリゴヌクレオチドと;第1のオリゴヌクレオチドハイブリダイゼーション領域を含むプライマーオリゴヌクレオチドと;第2のオリゴヌクレオチドと;sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;第3のオリゴヌクレオチドと;ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と;使用説明書とを含む、キットも提供される。
【0023】
ある特定のインプリメンテーションが、以下の説明、実施例および特許請求の範囲において、ならびに図面においてさらに説明される。
【0024】
図面は、本技術のある特定のインプリメンテーションの説明に役立つものであり、限定するものではない。説明を明確かつ容易にするために、図面は、正確な縮尺で作成されたものではなく、一部の事例では、様々な態様が、特定のインプリメンテーションの理解を助長するために、誇張または拡大して示されることがある。
【図面の簡単な説明】
【0025】
【
図1】
図1は、非ランダム配列(すなわち、非ランダムアンカー配列およびP7アダプター配列)が隣接しているインラインランダムUMIを含む足場アダプター構成の例を示す。
【
図2】
図2は、UMI複雑性を増加させるために異なるアンカー配列および/または様々なUMI長を使用する、非ランダム配列(すなわち、非ランダムアンカー配列およびP7アダプター配列)が隣接しているインラインランダムUMIを含む足場アダプター構成の例を示す。
【
図3】
図3は、既存のアダプターと比較して本明細書に記載されるインラインランダムUMI足場アダプターを使用する最終ライブラリー構築物構成を示す。
【
図4A】
図4Aおよび4Bは、標準的な足場アダプターライブラリー(非UMI;「SOP」)を用いて生成したライブラリーと、インラインUMI足場アダプターを用いて生成したライブラリーとの分子性能の比較を示す。サイズおよび断片長分布が電気泳動(
図4A)およびトレース(
図4B;Tapestation 4200)によって示されている。
【
図4B】
図4Aおよび4Bは、標準的な足場アダプターライブラリー(非UMI;「SOP」)を用いて生成したライブラリーと、インラインUMI足場アダプターを用いて生成したライブラリーとの分子性能の比較を示す。サイズおよび断片長分布が電気泳動(
図4A)およびトレース(
図4B;Tapestation 4200)によって示されている。
【
図5】
図5は、データトリミングスキームの例を示す。
【
図6】
図6は、非ランダム配列(すなわち、GCアンカー配列およびP7アダプター配列)が隣接しているインライン非ランダムUMIを含む足場アダプター構成の例を示す。
【
図7】
図7は、最初の第1鎖合成を伴う、DNAとRNAの混合物を含む試料を処理するためのワークフローの例を示す。
【
図8】
図8は、最初のライゲーションステップを伴う、DNAとRNAの混合物を含む試料を処理するためのワークフローの例を示す。
【
図9A】
図9Aおよび9Bは、最初の第1鎖合成を伴う、RNAを処理するための方法の例を示す。
【
図9B】
図9Aおよび9Bは、最初の第1鎖合成を伴う、RNAを処理するための方法の例を示す。
【
図10A】
図10Aおよび10Bは、最初のライゲーションステップを伴う、RNAを処理するための方法の例を示す。
【
図10B】
図10Aおよび10Bは、最初のライゲーションステップを伴う、RNAを処理するための方法の例を示す。
【
図11】
図11は、実施例2で説明する実験で使用したアダプターの概略図を示す。
【
図12】
図12は、実施例2で説明する実験の結果の要旨を提供する。
【
図13】
図13は、実施例2で説明する実験の結果の一般的メトリクスを提供する。具体的には、表は、各試料についてのシーケンシングされたリードペアの数、メチル化されたCGジヌクレオチドの量、メチル化された他の(非ヒトエピジェネティック)モチーフの量、重複したリードのパーセント、アライメントしたリードのパーセント、挿入物サイズ代表値、アダプターを含有したリードの量(トリミングした)、およびリードのGC含有量を示す。
【
図14】
図14は、ライブラリーを生成した、実施例2で説明する4つの実験条件についての、挿入サイズをリードの分率に対して示す。各トレースに左から右へ1~4と表示されている:1)足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION LIGHTNING Kit(バイサルファイト処理);2)NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする;3)NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする;および4)足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit。150bpにおける一時的な急上昇は、この実験(2×151)についてのシーケンシングリード長のアーチファクトである。
【
図15】
図15は、ライブラリーを生成した、実施例2で説明する4つの実験条件についての、PreSeq複雑性(全分子対固有分子)を示す。各トレースに左から右へ1~4と表示されている:1)足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION LIGHTNING Kit(バイサルファイト処理);2)NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする;3)足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit;および4)NEB Enzymatic Methylation Kitの前にメチル保護されたdsDNAアダプターをDNAにライゲーションする。
【
図16】
図16は、ライブラリーを生成した、実施例2で説明する4つの実験条件についての、GC分布(GC含有量対リードの分率)を示す。各トレースに1~4と表示されている:1)NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする;2)NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする;3)足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION LIGHTNING Kit(バイサルファイト処理);および4)足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit。
【
図17】
図17は、ワークフローの例を示す。RNase Hに基づくrRNA枯渇の下流で、タグ付き差次的P5ランダムヘキサマーを用いてcDNAを生成する。熱変成後、足場アダプターをミックスに添加してDNA特異的リードにタグ付けし、P7アダプターをcDNA分子とDNA分子の両方に結合させる。インデックスPCRによって、ライブラリー分子が仕上がり、P5アダプター配列に基づく差次的増幅が可能になる。
【
図18】
図18A~18Cは、同時DNA:RNAライブラリーについての性能メトリクスを示す。
図18Aは、マッピングメトリクスを示し、
図18Bは、挿入物サイズを示し、
図18Cは、Gene bodyカバレッジを示す。
【
図19】
図19は、最初のライゲーションステップを伴う、RNAを処理するための方法の例を示す。
【発明を実施するための形態】
【0026】
詳細な説明
核酸の解析に有用な方法および組成物が、本明細書で提供される。核酸ライブラリーの生成に有用な方法および組成物も、本明細書で提供される。一本鎖核酸断片の解析に有用な方法および組成物も、本明細書で提供される。ある特定の態様では、方法は、一本鎖核酸断片を含む試料核酸と指定アダプターとを結合させるステップを含む。一部の実施形態では、指定アダプターは、固有分子識別子(UMI)を含む。一部の実施形態では、指定アダプターは、一本鎖核酸の末端とハイブリダイズすることができる足場ポリヌクレオチドを含む。そのようなハイブリダイゼーションの産物は、例えば、核酸ライブラリーの生成に、および/またはさらに解析もしくは処理に、有用であり得る。
【0027】
足場アダプター
本明細書におけるある特定の方法は、一本鎖核酸(ssNA)と足場アダプターまたはその成分とを結合させるステップを含む。足場アダプターは、一般に、足場ポリヌクレオチド、およびオリゴヌクレオチドを含む。したがって、足場アダプターの「成分」は、足場ポリヌクレオチド、および/もしくはオリゴヌクレオチド、またはその小成分もしくは領域を指すことがある。オリゴヌクレオチドおよび/または足場ポリヌクレオチドは、ピリミジン(C、T、U)および/またはプリン(A、G)ヌクレオチドで構成され得る。さらなる成分または小成分としては、インデックスポリヌクレオチド、固有分子識別子(UMI)、固有分子識別子(UMI)に隣接する1つもしくは複数の領域、プライマー結合部位(例えば、シーケンシングプライマー結合部位、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域などのうちの1つまたは複数、ならびにそれらの相補体を挙げることができる。P5プライマー結合部位を含む足場アダプターは、P5アダプターまたはP5足場アダプターと呼ばれることがある。P7プライマー結合部位を含む足場アダプターは、P7アダプターまたはP7足場アダプターと呼ばれることがある。
【0028】
足場ポリヌクレオチドは、足場アダプターの一本鎖成分である。本明細書におけるポリヌクレオチドは、一般に、5~500ヌクレオチド、例えば5~100ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを指す。ポリヌクレオチドは、合成のものであることもあり、または酵素的に作製されることもあり、一部の実施形態では、長さ約5~50ヌクレオチドである。ポリヌクレオチドは、リボヌクレオチドモノマー(すなわち、ポリリボヌクレオチドまたは「RNAポリヌクレオチド」であり得る)、デオキシリボヌクレオチドモノマー(すなわち、ポリデオキシリボヌクレオチドまたは「DNAポリヌクレオチド」であり得る)、またはこれらの組合せを含有することがある。ポリヌクレオチドは、例えば、長さ10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200ヌクレオチド、または500ヌクレオチド以下であり得る。用語ポリヌクレオチドをおよびオリゴヌクレオチドは、本明細書では同義で使用され得る。
【0029】
足場ポリヌクレオチドは、ssNAハイブリダイゼーション領域(足場、足場領域、一本鎖足場、一本鎖足場領域とも呼ばれる)およびオリゴヌクレオチドハイブリダイゼーション領域を含み得る。ssNAハイブリダイゼーション領域およびオリゴヌクレオチドハイブリダイゼーション領域は、足場ポリヌクレオチドの小成分と呼ばれることがある。ssNAハイブリダイゼーション領域は、通常は、ssNA末端領域にハイブリダイズする、またはハイブリダイズすることができる、ポリヌクレオチドを含む。オリゴヌクレオチドハイブリダイゼーション領域は、足場アダプターのオリゴヌクレオチド成分のすべてまたは一部分にハイブリダイズする、またはハイブリダイズすることができる、ポリヌクレオチドを通常は含む。
【0030】
足場ポリヌクレオチドのssNAハイブリダイゼーション領域は、ssNA末端領域(例えば、ssDNA末端領域、sscDNA末端領域、ssRNA末端領域)に相補的または実質的に相補的である、ポリヌクレオチドを含み得る。一部の実施形態では、ssNAハイブリダイゼーション領域は、ssDNAハイブリダイゼーション領域、sscDNAハイブリダイゼーション領域、またはssRNAハイブリダイゼーション領域である。一部の実施形態では、足場ポリヌクレオチドのsscDNAハイブリダイゼーション領域は、RNA特異的タグ(例えば、本明細書に記載されるRNA特異的タグ)に相補的または実質的に相補的である、ポリヌクレオチドまたは小成分を含む。一部の実施形態では、足場ポリヌクレオチドのssRNAハイブリダイゼーション領域は、RNA特異的タグ(例えば、本明細書に記載されるRNA特異的タグ)に相補的または実質的に相補的である、ポリヌクレオチドまたは小成分を含む。一部の実施形態では、足場ポリヌクレオチドのssDNAハイブリダイゼーション領域は、DNA特異的タグ(例えば、本明細書に記載されるDNA特異的タグ)に相補的または実質的に相補的である、ポリヌクレオチドまたは小成分を含む。一部の実施形態では、ssNAハイブリダイゼーション領域は、ランダム配列を含む。一部の実施形態では、ssNAハイブリダイゼーション領域は、目的のssNA末端領域配列(例えば、標的配列)に相補的な配列を含む。ある特定の実施形態では、ssNAハイブリダイゼーション領域は、1つまたは複数のヌクレオチドを含み、これらのすべてが、ssNA中の塩基との非特異的塩基対合が可能である。非特異的塩基対合が可能であるヌクレオチドは、ユニバーサル塩基と呼ばれることがある。ユニバーサル塩基は、4つの標準ヌクレオチド塩基:A、C、GおよびTの各々と無差別に塩基対合することができる塩基である。ssNAハイブリダイゼーション領域に組み込むことができるユニバーサル塩基としては、イノシン、デオキシイノシン、2’-デオキシイノシン(dI、dInosine)、ニトロインドール、5-ニトロインドール、および3-ニトロピロールが挙げられるが、これらに限定されない。ある特定の実施形態では、ssNAハイブリダイゼーション領域は、4つの典型的な塩基のうちの2つまたは3つ(しかしすべてではない)(例えば、非天然塩基PおよびK)を置き換えることができる1つまたは複数の縮重/ゆらぎ塩基を含む。
【0031】
足場ポリヌクレオチドのssNAハイブリダイゼーション領域は、任意の好適な長さおよび配列を有し得る。一部の実施形態では、ssNAハイブリダイゼーション領域の長さは、10ヌクレオチドまたはそれ未満である。ある特定の態様では、ssNAハイブリダイゼーション領域は、長さ4~100ヌクレオチド、例えば、長さ約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95または100ヌクレオチドである。ある特定の態様では、ssNAハイブリダイゼーション領域は、長さ4~20ヌクレオチド、例えば、長さ5~15、5~10、5~9、5~8、または5~7(例えば、6または7)ヌクレオチドである。一部の実施形態では、ssNAハイブリダイゼーション領域は、長さ7ヌクレオチドである。一部の実施形態では、ssNAハイブリダイゼーション領域は、ランダムヌクレオチド配列を含むか、またはそれからなり、したがって、様々なランダムssNAハイブリダイゼーション領域を有する複数の不均一足場ポリヌクレオチドが用いられる場合、その一群が、ssNAの末端領域の配列に関係なくssNAの不均一集団のための足場ポリヌクレオチドとして作用することができる。固有のssNAハイブリダイゼーション領域配列を有する各足場ポリヌクレオチドは、足場ポリヌクレオチド種と呼ばれることがあり、複数の足場ポリヌクレオチド種の一群は、複数の足場ポリヌクレオチド種と呼ばれることがある(例えば、ssNAハイブリダイゼーション領域内に7つのランダム塩基を有するように設計された足場ポリヌクレオチドの場合、複数の足場ポリヌクレオチド種は、47の固有のssNAハイブリダイゼーション領域配列を含むことになる)。したがって、固有の足場ポリヌクレオチドを有する(すなわち、固有のssNAハイブリダイゼーション領域配列を含む)各足場アダプターは、足場アダプター種と呼ばれることもあり、複数の足場アダプター種の一群は、複数の足場アダプター種と呼ばれることがある。足場ポリヌクレオチドの種は、他の足場ポリヌクレオチド種に対して固有である特徴を一般に有する。例えば、足場ポリヌクレオチド種は、固有の配列特徴を有することができる。固有の配列特徴としては、固有の配列長、固有のヌクレオチド配列(例えば、固有のランダム配列、固有の標的配列)、または固有の配列長とヌクレオチド配列の組合せを挙げることができる。
【0032】
足場ポリヌクレオチドは、インデックスポリヌクレオチド、固有分子識別子(UMI)、固有分子識別子(UMI)に隣接する1つもしくは複数の領域、プライマー結合部位(例えば、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域など、またはそれらの相補ポリヌクレオチドを含む、1つもしくは複数のさらなる小成分を含み得る。足場ポリヌクレオチドは、プライマー結合部位(またはプライマー結合部位に相補的なポリヌクレオチド)を含み得る。P5プライマー結合部位を含む足場ポリヌクレオチド(またはその相補体)は、P5足場またはP5足場ポリヌクレオチドと呼ばれることがある。P7プライマー結合部位を含む足場ポリヌクレオチド(またはその相補体)は、P7足場またはP7足場ポリヌクレオチドと呼ばれることがある。
【0033】
オリゴヌクレオチドは、足場アダプターのさらなる一本鎖成分であり得る。本明細書におけるオリゴヌクレオチドは、一般に、5~500ヌクレオチド、例えば5~100ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを指す。オリゴヌクレオチドは、合成のものであることもあり、または酵素的に作製されることもあり、一部の実施形態では、長さ5~50ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチドもしくは「RNAオリゴヌクレオチド」であり得る)、デオキシリボヌクレオチドモノマー(すなわち、オリゴデオキシリボヌクレオチドもしくは「DNAオリゴヌクレオチド」であり得る)、またはこれらの組合せを含有することがある。オリゴヌクレオチドは、例えば、長さ10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200ヌクレオチド、または500ヌクレオチド以下であり得る。用語オリゴヌクレオチドおよびポリヌクレオチドは、本明細書では同義で使用され得る。
【0034】
足場アダプターのオリゴヌクレオチド成分は、一般に、足場ポリヌクレオチドのオリゴヌクレオチドハイブリダイゼーション領域に相補的または実質的に相補的である核酸配列を含む。足場アダプターのオリゴヌクレオチド成分は、例えば、ssNA断片またはその誘導体のPCR増幅、ssNAまたはその誘導体のシーケンシングなどのような、1つまたは複数の下流の応用に有用な、1つまたは複数の小成分を含み得る。一部の実施形態では、オリゴヌクレオチドの小成分は、シーケンシングアダプターである。シーケンシングアダプターは、目的のシーケンシングプラットフォーム、例えば、Illumina(登録商標)により提供されているシーケンシングプラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)および/もしくはGenome Analyzer(商標)シーケンシングシステム);Oxford Nanopore(商標)Technologiesにより提供されているシーケンシングプラットフォーム(例えば、MinION(商標)シーケンシングシステム);Ion Torrent(商標)により提供されているシーケンシングプラットフォーム(例えば、Ion PGM(商標)および/もしくはIon Proton(商標)シーケンシングシステム);Pacific Biosciencesにより提供されているシーケンシングプラットフォーム(例えば、SequelもしくはPACBIO RS IIシーケンシングシステム);Life Technologies(商標)により提供されているシーケンシングプラットフォーム(例えば、SOLiD(商標)シーケンシングシステム);Rocheにより提供されているシーケンシングプラットフォーム(例えば、454 GS FLX+および/もしくはGS Juniorシーケンシングシステム);Genapsysにより提供されているシーケンシングプラットフォーム;BGIにより提供されているシーケンシングプラットフォーム;または目的の任意のシーケンシングプラットフォームによって用いられる、ヌクレオチド配列(またはその相補体)の少なくとも一部分を含む、1つまたは複数の核酸ドメインを一般に指す。
【0035】
一部の実施形態では、足場アダプターのオリゴヌクレオチド成分は、表面結合シーケンシングプラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)シーケンシングシステム内のフローセルの表面に結合されたP5もしくはP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「キャプチャー部位」もしくは「キャプチャー配列」);シーケンシングプライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのRead 1もしくはRead 2プライマーが結合し得るドメイン);固有識別子もしくはインデックス(例えば、特異的バーコードもしくは「タグ」で所与の試料からのあらゆる分子にマークを付けることにより試料多重化を可能にするためにシーケンシングされることになるssNAの試料源を一意的に識別する、バーコードもしくは他のドメイン);バーコードシーケンシングプライマー結合ドメイン(バーコードをシーケンシングするために使用されるプライマーが結合するドメイン);目的の分子に、例えば、シーケンシングされる固有のタグのインスタンスの数に基づいて発現レベルを決定するために、一意的にマークを付けるための、分子識別ドメインもしくは固有分子識別子(UMI)(例えば、4、6、もしくは他のヌクレオチド数のランダム化されたタグなどの、分子インデックスタグ);任意のそのようなドメインの相補体;またはこれらの任意の組合せから選択される、核酸ドメインであるか、またはそれを含む。一部の実施形態では、オリゴヌクレオチドは、固有分子識別子(UMI)に隣接する1つまたは複数の領域を含む。一部の実施形態では、バーコードドメイン(例えば、試料インデックスタグ)および分子識別ドメイン(例えば、分子インデックスタグ;UMI)を同じ核酸に含めることができる。シーケンシングプラットフォームオリゴヌクレオチド、シーケンシングプライマー、およびそれらの対応する結合ドメインを、本明細書で論じられるものを含むがそれらに限定されない様々な利用可能なシーケンシングプラットフォームおよび技術に適合するように設計することができる。
【0036】
足場アダプターのオリゴヌクレオチド成分が、シーケンシングアダプターの1つまたは一部分を含む場合、様々なアプローチを使用して1つもしくは複数のさらなるシーケンシングアダプターおよび/またはそのシーケンシングアダプターの残存部分を付加させることができる。例えば、さらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を、ライゲーション、逆転写、PCR増幅などのうちのいずれか1つにより付加させることができる。PCRの場合、3’ハイブリダイゼーション領域(例えば、オリゴヌクレオチドのアダプター領域とハイブリダイズするための)とさらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を含む5’領域とを含む第1の増幅プライマー、ならびに3’ハイブリダイゼーション領域(例えば、ssNA分子の反対側の末端に付加された第2のオリゴヌクレオチドのアダプター領域とハイブリダイズするための)と、必要に応じて、さらなるシーケンシングアダプターおよび/またはシーケンシングアダプターの残存部分を含む5’領域とを含む第2の増幅プライマーを含む、増幅プライマー対を利用することができる。
【0037】
足場アダプターのオリゴヌクレオチド成分は、RNA特異的タグまたはDNA特異的タグをはじめとする1つまたは複数のさらなる小成分を含み得る。RNA特異的タグは、試料(例えば、RNA断片とDNA断片の混合物を含む試料)中のRNA断片にマークを付けることができる。DNA特異的タグは、試料(例えば、RNA断片とDNA断片の混合物を含む試料)中のDNA断片にマークを付けることができる。通常は、RNA特異的タグおよびDNA特異的タグが同じライブラリー調製において使用される場合、RNA特異的タグをDNA特異的タグと区別できる。例えば、RNA特異的タグおよびDNA特異的タグは、異なる配列を含み得るか、RNA特異的タグおよびDNA特異的タグは、異なる長さを有し得るか、RNA特異的タグおよびDNA特異的タグは、異なる検出可能なマーカーを含み得るか、またはこれらの任意の組合せであり得る。RNA特異的タグおよびDNA特異的タグは、約5~約15ヌクレオチドを含み得る。一部の実施形態では、RNA特異的タグは、9ヌクレオチドを含み得る。一部の実施形態では、DNA特異的タグは、9ヌクレオチドを含み得る。一部の実施形態では、RNA特異的タグまたはDNA特異的タグは、足場アダプターのオリゴヌクレオチド成分の末端に位置する。一部の実施形態では、RNA特異的タグまたはDNA特異的タグは、足場アダプターのオリゴヌクレオチド成分の5’末端に位置する。一部の実施形態では、RNA特異的タグまたはDNA特異的タグは、足場アダプターのオリゴヌクレオチド成分の3’末端に位置する。一部の実施形態では、RNA特異的タグまたはDNA特異的タグは、足場アダプターがssRNAまたはssDNAとハイブリダイズされた場合にRNA特異的タグまたはDNA特異的タグがssRNA末端領域の末端またはssDNA末端領域の末端に隣接するように、足場アダプターのオリゴヌクレオチド成分の末端に位置する。
【0038】
足場アダプターのオリゴヌクレオチド成分は、インデックスポリヌクレオチド、固有分子識別子(UMI)、固有分子識別子(UMI)に隣接する1つもしくは複数の領域、プライマー結合部位(例えば、P5プライマー結合部位、P7プライマー結合部位)、フローセル結合領域もしくはシーケンシングアダプターなど、またはそれらの相補ポリヌクレオチドを含む、1つもしくは複数のさらなる小成分を含み得る。オリゴヌクレオチドは、プライマー結合部位(またはプライマー結合部位に相補的なポリヌクレオチド)を含み得る。P5プライマー結合部位を含むオリゴヌクレオチド(またはその相補体)は、P5オリゴまたはP5オリゴヌクレオチドと呼ばれることがある。P7プライマー結合部位を含むオリゴヌクレオチド(またはその相補体)は、P7オリゴまたはP7オリゴヌクレオチドと呼ばれることがある。
【0039】
足場アダプターのオリゴヌクレオチド成分は、グアニンおよびシトシン(GC)リッチ領域を含み得る。GCリッチ領域は、少なくとも約50%グアニンおよびシトシンヌクレオチドを含み得る。例えば、GCリッチ領域は、約60%グアニンおよびシトシンヌクレオチド、約70%グアニンおよびシトシンヌクレオチド、約80%グアニンおよびシトシンヌクレオチド、約90%グアニンおよびシトシンヌクレオチド、または100%グアニンおよびシトシンヌクレオチドを含み得る。一部の実施形態では、GCリッチ領域は、約70%グアニンおよびシトシンヌクレオチドを含む。足場アダプターのオリゴヌクレオチド成分は、一方の末端に(例えば、3’末端に、または5’末端に)グアニンおよびシトシン(GC)リッチ領域を含み得る。一部の実施形態では、足場アダプターのオリゴヌクレオチド成分は、ssNA断片に結合されているオリゴヌクレオチドの末端に(すなわち、オリゴヌクレオチド-ssNA接合部または「ライゲーション末端」に)グアニンおよびシトシン(GC)リッチ領域を含む。足場ポリヌクレオチドは、オリゴヌクレオチド中のGCリッチ領域に相補的である対応する領域を含み得る。
【0040】
足場ポリヌクレオチドをオリゴヌクレオチドとハイブリダイズさせて、足場アダプター内に二重鎖を形成することができる。したがって、足場アダプターは、足場二重鎖、二重鎖アダプター、二重鎖オリゴヌクレオチド、または二重鎖ポリヌクレオチドと呼ばれることがある。固有の足場ポリヌクレオチドを有する(すなわち、固有のssNAハイブリダイゼーション領域配列を含む)各足場二重鎖は、足場二重鎖種と呼ばれることがあり、複数の足場二重鎖種の一群は、複数の足場二重鎖種と呼ばれることがある。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、別々のDNA鎖上にある。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、単一のDNA鎖(例えば、ヘアピン構造を形成することができる単一のDNA鎖)上にある。
【0041】
足場アダプターは、DNA、RNA、またはこれらの組合せを含み得る。足場アダプターは、DNA足場ポリヌクレオチドとDNAオリゴヌクレオチド、DNA足場ポリヌクレオチドとRNAオリゴヌクレオチド、RNA足場ポリヌクレオチドとDNAオリゴヌクレオチド、またはRNA足場ポリヌクレオチドとRNAオリゴヌクレオチドを含み得る。構成の一例では、足場アダプターは、RNA試料核酸との結合のためのDNA足場ポリヌクレオチドおよびDNAオリゴヌクレオチドを含み、そのようなアダプター/試料構成とともに使用するためのリガーゼの例としては、T4 RNAリガーゼ2、T4 DNAリガーゼ、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼが挙げられる。アダプター構成の別の例では、足場アダプターは、RNA試料核酸との結合のためのDNA足場ポリヌクレオチドおよびRNAオリゴヌクレオチドを含み、そのようなアダプター/試料構成とともに使用するためのリガーゼの例としては、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼが挙げられる。アダプター構成の別の例では、足場アダプターは、RNA試料核酸との結合のためのRNA足場ポリヌクレオチドおよびRNAオリゴヌクレオチドを含み、そのようなアダプター/試料構成とともに使用するためのリガーゼの例としては、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼが挙げられる。一部の事例では、アダプターヌクレオチド組成物は、試料核酸と足場アダプター核酸間の均一性が得られるように(例えば、少なくともオリゴヌクレオチドが試料核酸と均一であるように)選択される。一部の事例では、アダプターヌクレオチド組成物は、オリゴヌクレオチドと試料核酸間の均一性、および足場ポリヌクレオチドと試料核酸間の不均一性が得られるように選択される。
【0042】
固有分子識別子(UMI)
一部の実施形態では、足場アダプターは、固有分子識別子(UMI)を含む。一部の実施形態では、オリゴヌクレオチド(例えば、足場アダプターのオリゴヌクレオチド成分)は、固有分子識別子(UMI)を含む。分子バーコード、バーコード、分子識別ドメイン、分子インデックスタグ、配列タグ、および/またはタグとも呼ばれることがある、固有分子識別子(UMI)は、一般に、投入核酸分子を識別するためにまたはそれにマークを付けるために核酸ライブラリー調製中に核酸断片に付加され得る短い配列(例えば、長さ約3~約10ヌクレオチド)である。ある特定の応用では、UMIは、例えば、シーケンシングされる固有のタグのインスタンスの数に基づいて発現レベルを決定するために、目的の分子に一意的にマークを付けるのに有用であり得る。UMIは、通常は、増幅ステップ(例えば、PCR増幅)の前に付加され、例えば、増幅により導入される誤りおよび量の偏りの低減に有用であり得る。本明細書に記載のUMIを含む足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分は、「インライン」UMIを含むと言われることがある。インラインUMIは、足場アダプターのオリゴヌクレオチド成分にライゲーションされたssNA断片のシーケンシングにより生成される配列リードの一部になる、本明細書に記載される足場アダプターおよび/またはオリゴヌクレオチドの成分であるUMI配列を一般に指す。足場アダプターがインラインUMIを含む場合、ライブラリー生成は、さらなる処理ステップ(例えば、鎖置換ポリメラーゼを使用する伸長ステップによるアダプターへのUMIの付加)を必要とし得ない。
【0043】
一部の実施形態では、UMIは、ランダム配列を含む。一部の実施形態では、UMIは、非ランダム配列を含む。一部の実施形態では、UMIは、1つまたは複数のユニバーサル塩基を含む。一部の実施形態では、UMIは、ランダム配列からなる。一部の実施形態では、UMIは、非ランダム配列からなる。一部の実施形態では、UMIは、ユニバーサル塩基からなる。UMIは、任意の好適な長さのものであり得る。一部の実施形態では、UMIは、3~10の間のヌクレオチドを含む。例えば、UMIは、3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、6ヌクレオチド、7ヌクレオチド、8ヌクレオチド、9ヌクレオチド、または10ヌクレオチドを含み得る。一部の実施形態では、UMIは、5ヌクレオチドを含む。一部の実施形態では、UMIは、5つのランダムヌクレオチドを含む。一部の実施形態では、UMIは、5つの非ランダムヌクレオチドを含む。一部の実施形態では、UMIは、5つのユニバーサル塩基を含む。
【0044】
一部の実施形態では、オリゴヌクレオチド(例えば、足場アダプターのオリゴヌクレオチド成分)は、1つまたは2つの隣接領域と隣接している固有分子識別子(UMI)を含む。隣接領域と隣接しているUMIは、通常は隣接領域に隣接している。2つの隣接領域と隣接しているUMIは、通常は、各隣接領域に隣接しており、UMIは2つの隣接領域の間に位置する。アンカー配列とも呼ばれる隣接領域は、複合体が形成された場合にssNA末端に隣接している(すなわち、オリゴヌクレオチド-ssNA接合部または「ライゲーション末端」に隣接している)オリゴヌクレオチド末端に位置し得る。隣接領域は、一般に、非ランダム配列を含む。一部の実施形態では、隣接領域は、非ランダム配列種のプールからの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、2つまたはそれより多くの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、3つまたはそれより多くの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、4つまたはそれより多くの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、5つまたはそれより多くの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、6つのまたはそれより多くの非ランダム配列種を含む。一部の実施形態では、非ランダム配列種のプールは、4つの非ランダム配列種を含む。隣接領域は、任意の好適な長さのものであり得る。一部の実施形態では、隣接領域は、8~15の間のヌクレオチドを含む。例えば、隣接領域は、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、11ヌクレオチド、12ヌクレオチド、13ヌクレオチド、14ヌクレオチド、15ヌクレオチド、16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、または20ヌクレオチドを含み得る。一部の実施形態では、隣接領域は、10ヌクレオチドを含む。UMI配列(例えば、5つのランダム塩基)と特定の隣接配列種(例えば、4つの可能な隣接配列種のプールからの10の非ランダム塩基)の組合せは、分子識別子としての機能を果たすことができ、「UMI」と見なされ得る。
【0045】
隣接領域は、好適な融解温度(Tm)を有するように設計され得る。本明細書に記載される場合、融解温度は、隣接領域/[隣接領域に相補的なポリヌクレオチド]の半分がハイブリダイズした状態のままであり、隣接領域/[隣接領域に相補的なポリヌクレオチド]の半分が解離して一本鎖になる、温度を一般に指す。好適な融解温度は、ライゲーション反応(例えば、本明細書に記載されるライゲーション反応)が行われる温度より高い温度であり得る。例えば、ライゲーション反応が37℃で行われる場合には、隣接領域に好適な融解温度は、37℃より高い温度である。ライゲーション反応が16℃で行われる場合には、好適な融解温度は、16℃より高い温度である。一部の実施形態では、好適な融解温度は、約37℃に等しいか、またはそれより高い。例えば、好適な融解温度は、約38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、または50℃に等しいことがあり、またはそれより高いことがある。一部の実施形態では、好適な融解温度は、約38℃に等しいか、またはそれより高い。一部の実施形態では、好適な融解温度は、約45℃に等しいか、またはそれより高い。
【0046】
ある特定の構成では、隣接領域は、十分なグアニンおよびシトシン含有量の有するのに十分な長さのものであるように、ならびに/または好適な融解温度(Tm)を有するために1つもしくは複数の修飾ヌクレオチド(例えば、ロックド核酸(LNA)塩基)を含むように、設計され得る。一般に、隣接領域長を増加させることで、より少ないGC含有量に対する補償を行うことができ、GC含有量を増加させることで、より短い隣接領域に対する補償を行う(すなわち、好適なTmを有する隣接領域を得る)ことができる。例えば、隣接領域は、10ヌクレオチドを含むことがあり、この場合、45℃より高いTmのためにこれらのヌクレオチドの70%はグアニンまたはシトシンである。別の例では、隣接領域は、18ヌクレオチドを含むことがあり、この場合、45℃より高いTmのためにこれらのヌクレオチドの50%はグアニンまたはシトシンである。上記の例では、Tmを上昇させる1つもしくは複数の修飾ヌクレオチド(例えば、LNA塩基)が隣接部に含まれている場合、隣接領域は、より短くてもよく、および/またはより低いGC含有量を有してもよい。
【0047】
隣接領域は、グアニンおよびシトシン(GC)リッチであり得る。GCリッチ隣接領域は、少なくとも約50%グアニンおよびシトシンヌクレオチドを含み得る。例えば、GCリッチ隣接領域は、約60%グアニンおよびシトシンヌクレオチド、約70%グアニンおよびシトシンヌクレオチド、約80%グアニンおよびシトシンヌクレオチド、約90%グアニンおよびシトシンヌクレオチド、または100%グアニンおよびシトシンヌクレオチドを含み得る。一部の実施形態では、GCリッチ隣接領域は、約70%グアニンおよびシトシンヌクレオチドを含む。一部の実施形態では、隣接領域は、約90%グアニンおよびシトシンヌクレオチドを含む。一部の実施形態では、隣接領域は、約90%グアニンおよびシトシンヌクレオチドを含み、約38℃のTmを有する。一部の実施形態では、隣接領域は、次のポリヌクレオチド配列を含む:GGCCCGACGG。
【0048】
オリゴヌクレオチドは、さらなる隣接領域を含み得る。さらなる隣接領域は、複合体が形成された場合にssNA末端に隣接するオリゴヌクレオチド末端より遠位にある(すなわち、オリゴヌクレオチド-ssNA接合部または「ライゲーション末端」より遠位にある)位置にあり得る。さらなる隣接領域は、一般に、非ランダム配列を含む。さらなる隣接領域は、本明細書に記載される隣接領域またはアンカー配列の特徴のいずれかを含み得る。一部の構成では、さらなる隣接領域は、足場アダプターのオリゴヌクレオチド成分の1つまたは複数のさらなる小成分を含む。例えば、さらなる隣接領域は、プライマー結合ドメイン、シーケンシングアダプター、またはその一部、およびインデックス(例えば、試料識別インデックス)のうちの1つまたは複数を含み得る。
【0049】
一部の実施形態では、オリゴヌクレオチドは、オリゴヌクレオチド-ssNA接合末端から出発して順番に、隣接領域、続いてUMI、続いてさらなる隣接領域を含む。一部の実施形態では、オリゴヌクレオチドは、オリゴヌクレオチド-ssNA接合末端から出発して順番に、非ランダム隣接領域、続いてランダムUMI、続いてさらなる非ランダム隣接領域を含む。一部の実施形態では、オリゴヌクレオチドは、オリゴヌクレオチド-ssNA接合末端から出発して順番に、非ランダム隣接領域、続いて非ランダムUMI、続いてさらなる非ランダム隣接領域を含む。
【0050】
一部の実施形態では、足場ポリヌクレオチドは、オリゴヌクレオチド中の隣接領域に相補的なポリヌクレオチドを含むオリゴヌクレオチドハイブリダイゼーション領域を含む。一部の実施形態では、足場ポリヌクレオチドは、オリゴヌクレオチド中の隣接領域に相補的なポリヌクレオチドとオリゴヌクレオチド中のさらなる隣接領域に相補的なポリヌクレオチドとを含むオリゴヌクレオチドハイブリダイゼーション領域を含む。一部の実施形態では、足場ポリヌクレオチドは、オリゴヌクレオチド中のUMIに対応する領域を含むオリゴヌクレオチドハイブリダイゼーション領域を含む。オリゴヌクレオチド中のUMIに対応する領域は、UMIに相補的である配列を含むこともあり、またはUMIに相補的でない配列を含むこともある。オリゴヌクレオチドがランダムUMI配列を含む場合、UMIに対応する領域もランダム配列を含むことがあり、したがって、UMIと、UMIに対応する領域は、一般に、相補的でない。ランダムUMI配列、およびUMIに対応する領域は、同数のヌクレオチドを含有することもあり、または異なる数のヌクレオチドを含有することもある。オリゴヌクレオチドが非ランダムUMI配列を含む場合、UMIに対応する領域も非ランダム配列を含むことがあり、UMIと、UMIに対応する領域は、相補性であるように設計される。オリゴヌクレオチドが、ユニバーサル塩基を含むUMIを含む場合、UMIに対応する領域もユニバーサル塩基を含むことがある。一部の実施形態では、足場ポリヌクレオチドは、オリゴヌクレオチド中の隣接領域に相補的なポリヌクレオチドとおよびオリゴヌクレオチド中のさらなる隣接領域に相補的なポリヌクレオチドと隣接している、オリゴヌクレオチド中のUMIに対応する領域を含む。
【0051】
固有のUMI構成を有する(すなわち、固有のUMI配列、および/または特定の隣接配列種と結合された固有のUMI配列を含む)各オリゴヌクレオチドは、オリゴヌクレオチド種と呼ばれることがあり、複数のオリゴヌクレオチド種の一群は、複数のオリゴヌクレオチド種と呼ばれることがある(例えば、5つのランダム塩基UMIを有するように設計されたオリゴヌクレオチドの場合、複数のオリゴヌクレオチド種は、45の固有のUMI配列を含み得る)。したがって、固有のオリゴヌクレオチドを有する(すなわち、固有のUMI配列、および/または特定の隣接配列種と結合された固有のUMI配列を含む)および/または固有の足場ポリヌクレオチドを有する(すなわち、固有のssNAハイブリダイゼーション領域配列を含む)各足場アダプターは、足場アダプター種と呼ばれることがあり、複数の足場アダプター種の一群は、複数の足場アダプター種と呼ばれることがある。オリゴヌクレオチドの種は、他のオリゴヌクレオチド種に対して固有である特徴を一般に有する。例えば、オリゴヌクレオチド種は、固有の配列特徴を有し得る。固有の配列特徴としては、固有の配列長、固有のヌクレオチド配列(例えば、固有のランダム配列)、または固有の配列長とヌクレオチド配列の組合せを挙げることができる。
【0052】
足場アダプターまたはその成分とssNAとの結合
本明細書における方法は、1つもしくは複数の足場アダプターまたはその成分と、一本鎖核酸(ssNA)を含む組成物とを結合させて、1つまたは複数の複合体を形成するステップを含み得る。足場ポリヌクレオチドは、複合体形成時にオリゴヌクレオチド成分の末端がssNA断片の末端領域の末端に隣接しているような、ssNA断片およびオリゴヌクレオチド成分との同時ハイブリダイゼーションのために、設計される。通常は、複合体形成時にオリゴヌクレオチド成分の5’末端は、ssNAの末端領域の3’末端に隣接しているか、またはオリゴヌクレオチド成分の5’末端は、ssNAの末端領域の3’末端に隣接している。複合体形成時に足場アダプターがssNA断片の両方の末端に結合される事例では、1つのオリゴヌクレオチド成分の5’末端は、ssNAの1つの末端領域の3’末端に隣接しており、第2のオリゴヌクレオチド成分の5’末端は、ssNAの第2の末端領域の3’末端に隣接している。
【0053】
一部の実施形態では、方法は、ssNA組成物と、オリゴヌクレオチドと、不確定配列の末端領域を有するssNAの不均一集団のための足場として作用することができる様々なランダムssNAハイブリダイゼーション領域を有する複数の不均一足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。一部の実施形態では、方法は、ssNA組成物と、様々なUMI構成を有する複数の不均一オリゴヌクレオチドと、不確定配列の末端領域を有するssNAの不均一集団のための足場として作用することができる様々なランダムssNAハイブリダイゼーション領域を有する複数の不均一足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。一部の実施形態では、方法は、ssNA組成物と、オリゴヌクレオチド、または様々なUMI構成を有する複数の不均一オリゴヌクレオチドと、複数の不均一足場ポリヌクレオチドであって、オリゴヌクレオチドの量を超える量で提供される足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、少なくとも1.1対1(足場ポリヌクレオチド対オリゴヌクレオチド)の比で提供される。例えば、足場ポリヌクレオチドおよびオリゴヌクレオチドは、少なくとも1.2対1、1.3対1、1.4対1、1.5対1、1.6対1、1.7対1、1.8対1、1.9対1、または2対1の比で提供され得る。一部の実施形態では、足場ポリヌクレオチドおよびオリゴヌクレオチドは、1.4対1(足場ポリヌクレオチド対オリゴヌクレオチド)の比で提供される。例えば、方法は、ssNA組成物と14μMの足場ポリヌクレオチドおよび10μMのオリゴヌクレオチドとを結合させるステップを含み得る。
【0054】
一部の実施形態では、ssNAハイブリダイゼーション領域は、既知配列のssNA末端領域とハイブリダイズするように設計された既知配列を含む。一部の実施形態では、既知配列の異なるssNAハイブリダイゼーション領域を有する2つまたはそれより多くの不均一足場ポリヌクレオチドは、既知配列のそれぞれのssNA末端領域とハイブリダイズするように設計される。ssNAハイブリダイゼーション領域が既知配列を有する実施形態は、例えば、既知配列の末端領域を有するssNAのサブセットからの核酸ライブラリーの生成に、有用であり得る。したがって、ある特定の実施形態では、本明細書における方法は、ssNA組成物と、オリゴヌクレオチドと、既知配列の1つまたは複数の末端領域を有する1つまたは複数のssNAのための足場として作用することができる既知配列の1つまたは複数の異なるssNAハイブリダイゼーション領域を有する1つまたは複数の不均一足場ポリヌクレオチドとを結合させることにより、複合体を形成するステップを含む。
【0055】
ssNA断片、オリゴヌクレオチドおよび足場ポリヌクレオチドを、様々な方法で結合させることができる。一部の構成では、結合させることは、1)オリゴヌクレオチドハイブリダイゼーション領域によってオリゴヌクレオチド成分にハイブリダイズされた足場ポリヌクレオチドを含む複合体と、2)ssNA断片とを結合させることを含む。別の構成では、結合させることは、1)ssNAハイブリダイゼーション領域によってssNA断片にハイブリダイズされた足場ポリヌクレオチドを含む複合体と、2)オリゴヌクレオチド成分とを結合させることを含む。別の構成では、結合させることは、1)ssNA断片と、2)オリゴヌクレオチドと、3)足場ポリヌクレオチドとを結合させることを含み、この場合、3成分のいずれも、結合させる前に別の成分と、事前に複合体を形成されず、ハイブリダイズもされない。
【0056】
結合させることは、ssNAハイブリダイゼーション領域によってssNA断片の末端領域とハイブリダイズされた足場ポリヌクレオチドと、オリゴヌクレオチドハイブリダイゼーション領域によってオリゴヌクレオチド成分とハイブリダイズされた足場ポリヌクレオチドとを含む複合体が形成されるようなハイブリダイゼーション条件下で、行うことができる。特異的ハイブリダイゼーションが起こるかどうかは、足場ポリヌクレオチド、ssNA断片の末端領域およびオリゴヌクレオチド成分の、ハイブリダイゼーション領域間の相補性度、ならびにそれらの長さ、塩濃度、GC含有量、およびハイブリダイゼーションが起こる温度などの要因によって判定することができ、ハイブリダイゼーションが起こる温度は、関連領域の融解温度(Tm)から情報を得るこができる。
【0057】
複合体を、オリゴヌクレオチド成分の末端がssNA断片の末端領域の末端に隣接しているように形成することができる。~に隣接しているとは、オリゴヌクレオチドの末端の末端ヌクレオチドと、ssNA断片の末端領域の末端ヌクレオチド末端とが、これらの末端ヌクレオチドを、例えば、化学的ライゲーション、酵素的ライゲーションなどにより、共有結合で連結することができるほど十分に、互いに近接していることを指す。一部の実施形態では、末端は、オリゴヌクレオチドの末端の末端ヌクレオチドとssNAの末端領域の末端ヌクレオチド末端が足場ポリヌクレオチドの隣接ヌクレオチドにハイブリダイズされていることによって、互いに隣接している。足場ポリヌクレオチドを、オリゴヌクレオチドの末端がssNA断片の末端領域の末端に確実に隣接しているように設計することができる。
【0058】
一部の実施形態では、複合体を、オリゴヌクレオチド成分中のRNA特異的タグの末端がssRNA断片の末端領域の末端に隣接しているように形成することができる。~に隣接しているとは、RNA特異的タグの末端の末端ヌクレオチドと、ssRNA断片の末端領域の末端ヌクレオチド末端とが、これらの末端ヌクレオチドを、例えば、化学的ライゲーション、酵素的ライゲーションなどにより、共有結合で連結することができるほど十分に、互いに近位にあることを指す。一部の実施形態では、末端は、RNA特異的タグの末端の末端ヌクレオチドとssRNAの末端領域の末端ヌクレオチド末端が足場ポリヌクレオチドの隣接ヌクレオチドとハイブリダイズされていることによって、互いに隣接している。足場ポリヌクレオチドを、RNA特異的タグの末端がssRNA断片の末端領域の末端に確実に隣接しているように設計することができる。
【0059】
一部の実施形態では、複合体を、オリゴヌクレオチド成分中のDNA特異的タグの末端がssDNA断片の末端領域の末端に隣接しているように形成することができる。~に隣接しているとは、DNA特異的タグの末端の末端ヌクレオチドと、ssDNA断片の末端領域の末端ヌクレオチド末端とが、これらの末端ヌクレオチドを、例えば、化学的ライゲーション、酵素的ライゲーションなどにより、共有結合で連結することができるほど十分に、互いに近位にあることを指す。一部の実施形態では、末端は、DNA特異的タグの末端の末端ヌクレオチドとssDNAの末端領域の末端ヌクレオチド末端が足場ポリヌクレオチドの隣接ヌクレオチドとハイブリダイズされていることによって、互いに隣接している。足場ポリヌクレオチドを、DNA特異的タグの末端がssDNA断片の末端領域の末端に確実に隣接しているように設計することができる。
【0060】
足場ポリヌクレオチドを、チミンの代わりに1つまたは複数のウラシル塩基を用いて設計することができる。一部の実施形態では、足場アダプター二重鎖における鎖の一方を、例えばウラシル-DNAグリコシラーゼおよびエンドヌクレアーゼを使用することによって、ウラシル塩基の位置に複数の切断部位を生成することにより、分解することができる。
【0061】
本明細書に記載されるインラインUMI設計を含む足場アダプターは、ssNA断片の一方または両方の末端に接続されるように構成され得る。一部の構成では、足場アダプターは、ssNAの5’末端に接続されるアダプター種が本明細書に記載されるインラインUMI設計を含むように設計される。一部の構成では、足場アダプターは、ssNAの3’末端に接続されるアダプター種が本明細書に記載されるインラインUMI設計を含むように設計される。一部の構成では、足場アダプターは、ssNAの5’末端に接続されるアダプター種が本明細書に記載されるインラインUMI設計を含むように、およびssNAの3’末端に接続されるアダプター種がインラインUMIを含まないように、設計される。一部の構成では、足場アダプターは、ssNAの3’末端に接続されるアダプター種が本明細書に記載されるインラインUMI設計を含むように、およびssNAの5’末端に接続されるアダプター種がインラインUMIを含まないように、設計される。一部の構成では、足場アダプターは、ssNAの5’末端に接続されるアダプター種が本明細書に記載されるインラインUMI設計を含むように、およびssNAの3’末端に接続されるアダプター種も本明細書に記載されるインラインUMI設計を含むように、設計される。
【0062】
足場アダプター、オリゴヌクレオチド成分、および足場ポリヌクレオチドは、本明細書では、第1の足場アダプター(もしくは第1の足場二重鎖)、第1のオリゴヌクレオチド成分(もしくは第1のオリゴヌクレオチド)、第1の固有分子識別子(UMI)、および第1の足場ポリヌクレオチド;または第2の足場アダプター(もしくは第2の足場二重鎖)、第2のオリゴヌクレオチド成分(もしくは第2のオリゴヌクレオチド)、第2の固有分子識別子(UMI)、および第2の足場ポリヌクレオチドと、呼ばれることがある。第1のおよび第2のという用語は、ssNA断片末端の第1の末端および第2の末端(すなわち、5’末端および3’末端)とハイブリダイズしている、ならびに/またはこれらに共有結合で連結されている、足場アダプターまたはその成分を、一般に指す。第1の末端および第2の末端という用語は、ssNA断片の特定の方向性を必ずしも指すとは限らない。したがって、ssNA末端の第1の末端は、5’末端であることもあり、または3’末端であることもあり、ssNA末端の第2の末端は、5’末端であることもあり、または3’末端であることもある。第1の足場アダプター、またはその成分は、P5アダプター、もしくはその成分、またはP7アダプター、もしくはその成分を指すことがある。第2の足場アダプター、またはその成分は、P5アダプター、もしくはその成分、またはP7アダプター、もしくはその成分を指すことがある。
【0063】
一部の事例では、足場アダプター、オリゴヌクレオチド成分、および足場ポリヌクレオチドは、本明細書では、(i)第1の足場アダプター(もしくは第1の足場二重鎖)、第1のオリゴヌクレオチド成分(もしくは第1のオリゴヌクレオチド)、および第1の足場ポリヌクレオチド;(ii)第2の足場アダプター(もしくは第2の足場二重鎖)、第2のオリゴヌクレオチド成分(もしくは第2のオリゴヌクレオチド)、および第2の足場ポリヌクレオチド;(iii)第3の足場アダプター(もしくは第3の足場二重鎖)、第3のオリゴヌクレオチド成分(もしくは第3のオリゴヌクレオチド)、および第3の足場ポリヌクレオチド;または(iv)第4の足場アダプター(もしくは第4の足場二重鎖)、第4のオリゴヌクレオチド成分(もしくは第4のオリゴヌクレオチド)、および第4の足場ポリヌクレオチドと呼ばれることがある。そのような事例では(例えば、足場アダプターまたはその成分が、ssRNAとssDNAの混合物と結合される場合)、第1のおよび第2のという用語は、ssRNA断片末端の第1の末端(すなわち、5’末端および3’末端)およびssDNA断片末端の第1の末端(すなわち、5’末端および3’末端)とそれぞれハイブリダイズしている、ならびに/またはこれらにそれぞれ共有結合で連結されている、足場アダプターまたはその成分を、一般に指す。第3のおよび第4のという用語は、ssRNA断片末端の第2の末端(すなわち、5’末端および3’末端)およびssDNA断片末端の第2の末端(すなわち、5’末端および3’末端)とそれぞれハイブリダイズしている、ならびに/またはこれらにそれぞれ共有結合で連結されている、足場アダプターまたはその成分を、一般に指す。
【0064】
第1の固有分子識別子(UMI)に隣接する領域は、第1の隣接領域および第2の隣接領域と呼ばれることがある。第1の隣接領域は、複合体が形成された場合にssNA末端に隣接している(すなわち、オリゴヌクレオチド-ssNA接合部または「ライゲーション末端」に隣接している)オリゴヌクレオチド末端の近位にある第1のオリゴヌクレオチド中の領域を一般に指す。第2の隣接領域は、複合体が形成された場合にssNA末端に隣接しているオリゴヌクレオチド末端より遠位にある第1のオリゴヌクレオチド中の領域を一般に指す。第2の固有分子識別子(UMI)に隣接する領域は、第3の隣接領域および第4の隣接領域と呼ばれることがある。第3の隣接領域は、複合体が形成された場合にssNA末端に隣接している(すなわち、オリゴヌクレオチド-ssNA接合部または「ライゲーション末端」に隣接している)オリゴヌクレオチド末端の近位にある第2のオリゴヌクレオチド中の領域を一般に指す。第4の隣接領域は、複合体が形成された場合にssNA末端に隣接しているオリゴヌクレオチド末端より遠位にある第2のオリゴヌクレオチド中の領域を一般に指す。第1の隣接領域、第2の隣接領域、第3の隣接領域、および第4の隣接領域という用語は、オリゴヌクレオチド中の成分の特定の方向性を必ずしも指すとは限らない。第1の隣接領域および第3の隣接領域は、本明細書では隣接領域またはアンカー配列と呼ばれることがある。第2の隣接領域および第4の隣接領域は、本明細書ではさらなる隣接領域と呼ばれることがある。
【0065】
一部の事例では、足場アダプターまたはその成分と、ssNAを含む核酸試料とを結合させる前に、核酸試料をヌクレアーゼで処理して望ましくない核酸を除去することができる。例えば、本明細書で開示されるように、二本鎖特異的ヌクレアーゼ(例えば、T7ヌクレアーゼ)を使用して一部のまたはすべての二本鎖DNAを消化することができ、次いで、足場用アダプターを使用して残存核酸のシーケンシングライブラリーを調製することができる。ある例では、二本鎖特異的ヌクレアーゼは、試料中の二本鎖核酸を消化するために使用され、宿主生物および/または細菌からの二本鎖DNAを消化するが、一本鎖DNAウイルス、一本鎖RNAウイルスおよび一本鎖DNA(例えば、損傷したDNA)からのものなどの無傷一本鎖核酸を残す。
【0066】
足場アダプターまたはその成分とssRNAおよび/またはsscDNAとの結合
本明細書における方法は、1つまたは複数の複合体を形成するために、1つもしくは複数の足場アダプターまたはその成分と、一本鎖リボ核酸(ssRNA)および/または一本鎖相補デオキシリボ核酸(sscDNA)を含む組成物とを結合させるステップを含み得る。足場ポリヌクレオチドは、ssNAについて上記で説明されたように、複合体形成時にオリゴヌクレオチド成分の末端がssRNAまたはsscDNA断片の末端領域の末端に隣接しているような、ssRNAまたはsscDNA断片およびオリゴヌクレオチド成分との同時ハイブリダイゼーションのために、設計される。
【0067】
一部の実施形態では、核酸組成物は、sscDNAを含む。一部の実施形態では、方法は、結合させるステップの前に、sscDNAを一本鎖リボ核酸(ssRNA)から生成するステップを含む。通常は、核酸組成物がsscDNAを含む場合、本明細書における方法は、第1鎖cDNAを使用し、第2鎖cDNAの生成を必要としない。したがって、一部の実施形態では、核酸組成物は、第1鎖sscDNAを含む。一部の実施形態では、核酸組成物は、第1鎖sscDNAから本質的になる。第1鎖sscDNA「から本質的になる」核酸組成物は、一般に、第1鎖sscDNAを含み、さらなるタンパク質も核酸成分も含まない。第1鎖sscDNAから本質的になる核酸組成物は、一般に、第2鎖sscDNAを含まない。加えて、例えば、第1鎖sscDNA「から本質的になる」核酸組成物は、二本鎖cDNA(dscDNA)を含まないこともあり、または低いパーセンテージのdscDNA(例えば、10%未満のdscDNA、5%未満のdscDNA、1%未満のdscDNA)を含むこともある。第1鎖sscDNA「から本質的になる」核酸組成物は、タンパク質を含まないこともある。例えば、第1鎖sscDNA「から本質的になる」核酸組成物は、一本鎖結合タンパク質(SSB)も、第1鎖sscDNAの安定化に有用な他のタンパク質も含まないことがある。第1鎖sscDNA「から本質的になる」核酸組成物は、核酸組成物中に通常は存在する化学成分、例えば、緩衝剤、塩、アルコール、クラウディング剤(例えば、PEG)などを含むことがあり、核酸源(例えば、試料)からの、核酸抽出からの、またはcDNA合成からの残留成分(例えば、核酸(例えば、残留RNA)、タンパク質、細胞膜成分)を含むこともある。第1鎖sscDNA「から本質的になる」核酸組成物は、1つまたは複数のリン酸(例えば、末端リン酸、5’末端リン酸)を有する第1鎖sscDNA断片を含むことがある。第1鎖sscDNA「から本質的になる」核酸組成物は、1つまたは複数の修飾ヌクレオチドを含む第1鎖sscDNA断片を含むこともある。
【0068】
一部の実施形態では、sscDNAを生成するステップは、ssRNAと、プライマー、および逆転写酵素活性を有する薬剤とを接触させることを含み、それによって、DNA-RNA二重鎖が生成される。一部の実施形態では、sscDNAを生成するステップは、DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることを含むことがあり、それによって、RNAが消化され、sscDNA産物が生成され得る。一部の実施形態では、逆転写酵素活性を有する薬剤は、逆転写酵素またはRNA依存性DNAポリメラーゼ(すなわち、逆転写によりRNA鋳型から相補DNA(cDNA)を生成するために使用される酵素)である。逆転写酵素の例としては、HIV-1逆転写酵素、M-MLV逆転写酵素、およびAMV逆転写酵素が挙げられる。一部の実施形態では、逆転写酵素活性を有する薬剤は、RNAse活性も有する。したがって、一部の実施形態では、逆転写およびRNAse消化は、1ステップに組み合わせられる。一部の実施形態では、逆転写酵素活性およびRNAse活性を有する薬剤は、M-MuLV逆転写酵素(M-MLV逆転写酵素とも呼ばれる)である。
【0069】
プライマー(単数または複数)は、プライマーオリゴヌクレオチドと呼ばれることがあり、逆転写酵素とともに使用するのに好適な任意のプライマー(単数または複数)であり得る。プライマー(単数または複数)は、ランダムプライマー(例えば、ランダムn-mer、ランダムヘキサマープライマー、ランダムオクタマープライマー)、およびポリ(T)プライマーのうちの1つまたは複数から選択することができる。sscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。一部の実施形態では、プライマーオリゴヌクレオチドは、プライミング領域およびRNA特異的タグを含む。一部の実施形態では、プライマーは、プライミングポリヌクレオチドと呼ばれることがある。プライミングポリヌクレオチドは、プライマー、RNA特異的タグ、およびオリゴヌクレオチド(例えば、シーケンシングアダプターまたはその一部分;増幅プライミング部位)を含み得る。RNA特異的タグは、約5~約15ヌクレオチドを含み得る。一部の実施形態では、RNA特異的タグは、9ヌクレオチドを含む。一部の実施形態では、RNA特異的タグは、プライマーオリゴヌクレオチドの末端に位置する。一部の実施形態では、RNA特異的タグは、プライマーオリゴヌクレオチドの5’末端に位置する。プライマーオリゴヌクレオチド中のプライミング領域は、RNA断片とハイブリダイズする配列を含み得る。プライマーオリゴヌクレオチド中のプライミング領域は、RNA断片末端領域とハイブリダイズする配列を含み得る。プライマーオリゴヌクレオチド中のプライミング領域は、RNA断片の3’末端領域とハイブリダイズする配列を含み得る。プライミング領域は、ランダムプライマー(例えば、ランダムn-mer、ランダムヘキサマープライマー、ランダムオクタマープライマー)を含み得る。一部の実施形態では、プライミング領域は、RNA断片とハイブリダイズし、RNA特異的タグは、RNA断片とハイブリダイズしない。したがって、一部の実施形態では、本明細書における方法は、RNA断片におよびRNA特異的タグを含むさらなる配列に相補的である配列を含む一本鎖cDNA(sscDNA)を生成するステップを含む。一部の実施形態では、RNA特異的タグは、sscDNAの末端に位置する。一部の実施形態では、RNA特異的タグは、sscDNAの5’末端に位置する。ssRNAとdsDNAの混合物を含む核酸組成物の場合、RNA特異的タグは、ssRNAに由来するcDNAに付加されていることもあり、dsDNAのいずれの末端にも付加されていないこともある。cDNAとdsDNAの混合物を含む核酸組成物の場合、cDNAは、RNA特異的タグを含むことがあり、dsDNAは、RNA特異的タグを含まないことがある。sscDNAとssDNAの混合物を含む核酸組成物の場合、sscDNAは、RNA特異的タグを含むことがあり、ssDNAは、RNA特異的タグを含まないことがある。
【0070】
一部の実施形態では、核酸組成物は、一本鎖相補デオキシリボ核酸(sscDNA)と一本鎖デオキシリボ核酸(ssDNA)の混合物を含む。一部の実施形態では、sscDNAは、cDNA-RNA二重鎖に由来する(例えば、上記で説明されたように逆転写により生成された)sscDNAを含むが、これに限定されない。例えば、sscDNAは、sscDNAを生成するように変性される(例えば、熱変性される、および/もしくは化学的に変性される)またはRNAse処理に付される、cDNA-RNA二重鎖から得ることができる。一部の実施形態では、ssDNAは、二本鎖DNA(dsDNA)に由来するssDNAを含むが、これに限定されない。例えば、ssDNAは、ssDNAを生成するように変性される(例えば、熱変性される、および/または化学的に変性される)二本鎖DNAから得ることができる。一部の実施形態では、本明細書における方法は、sscDNAおよびssDNAと、本明細書に記載される足場アダプター、またはその成分とを結合させるステップの前に、cDNA-RNA二重鎖からsscDNAを生成するステップおよびdsDNAからssDNAを生成するステップを含む。一部の実施形態では、sscDNAおよびssDNAは、cDNA-RNA二重鎖およびdsDNAを変性させることにより生成され得る。
【0071】
一部の実施形態では、核酸組成物は、ssRNAを含む。そのような実施形態では、足場アダプターをssRNA断片と直接ハイブリダイズすることができ、オリゴヌクレオチド成分は、ssRNA末端の1つまたは複数の末端に共有結合で連結され、それによって、1つまたは複数の足場アダプターとssRNA断片とを含有するハイブリダイゼーション産物が形成される。一部の実施形態では、方法は、ハイブリダイゼーション産物から一本鎖ライゲーション産物を(例えば、ハイブリダイゼーション産物を変性させることにより)生成するステップをさらに含む。そのような実施形態では、一本鎖ライゲーション産物は、1つまたは複数のオリゴヌクレオチド成分に共有結合で連結されたssRNA断片を含む。一部の実施形態では、方法は、一本鎖ライゲーション産物と、プライマー、および逆転写酵素活性を有する薬剤とを接触させるステップをさらに含み、それによって、DNA-RNA二重鎖が生成される。一部の実施形態では、方法は、DNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させるステップをさらに含み、それによって、RNAが消化され、一本鎖cDNA(sscDNA)産物が生成される。一部の実施形態では、逆転写酵素活性を有する薬剤は、RNAse活性も有する。したがって、一部の実施形態では、逆転写およびRNAse消化は、1ステップに組み合わせられる。一部の実施形態では、逆転写酵素活性およびRNAse活性を有する薬剤は、M-MuLV逆転写酵素(M-MLV逆転写酵素とも呼ばれる)である。プライマーは、逆転写酵素とともに使用するのに好適な任意のプライマーであり得る。一部の実施形態では、プライマーは、オリゴヌクレオチド成分(すなわち、ssRNA断片に共有結合で連結されたオリゴヌクレオチド成分)中の配列に相補的なヌクレオチド配列を含む。sscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。
【0072】
一部の実施形態では、オリゴヌクレオチドをssRNAに(足場アダプターへの事前のハイブリダイゼーションなしに)共有結合で連結させることができる。共有結合で連結されたssRNA産物を、本明細書に記載されるようにプライマーオリゴヌクレオチド、および逆転写酵素活性を有する薬剤と接触させて、cDNAを生成することができる。プライマーオリゴヌクレオチドは、通常は、オリゴヌクレオチドハイブリダイゼーション領域を含む。オリゴヌクレオチドは、RNAを含むこともあり、またはオリゴヌクレオチドは、RNAからなることもある。一部の実施形態では、オリゴヌクレオチドは、RNA特異的タグを含む。一部の実施形態では、オリゴヌクレオチドは、シーケンシングアダプター、もしくはその一部分、またはプライマー結合部位を含む。一部の実施形態では、オリゴヌクレオチドは、ssRNAおよびオリゴヌクレオチドと、リガーゼ活性を有する1つまたは複数の薬剤とを、ssRNA末端領域の末端がオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることにより、ssRNAに共有結合で連結される。リガーゼ活性を有する1つまたは複数の薬剤は、例えば、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼから選択され得る。
【0073】
一部の実施形態では、sscDNA産物は、増幅される。sscDNA産物を、好適な増幅方法、例えば、本明細書に記載される増幅方法により、増幅することができる。一部の実施形態では、sscDNA産物を増幅させるステップを、DNA-RNA二重鎖を生成するステップおよび/またはsscDNA産物を生成するステップと同時に行なう(例えば、単一のステップ、反応、容器および/または体積で同時に行なう)ことができる。したがって、DNA-RNA二重鎖を生成するための試薬(例えば、逆転写酵素活性を有する1つまたは複数の薬剤)、sscDNA産物を生成するための試薬(例えば、RNAse活性を有する1つまたは複数の薬剤)およびsscDNA産物を増幅させるための試薬(例えば、プライマー、ポリメラーゼ活性を有する薬剤)を単一のステップ、反応、容器および/または体積で使用するために組み合わせることができる。一部の実施形態では、sscDNA産物を増幅させるための試薬は、本明細書に記載される足場アダプターの成分(例えば、第1のオリゴヌクレオチド)とハイブリダイズする増幅プライマーを含む。増幅プライマーは、ポリメラーゼとともに使用するのに好適な任意のプライマーであり得る。一部の実施形態では、各プライマーは、オリゴヌクレオチド成分(すなわち、ssRNA断片に共有結合で連結されたオリゴヌクレオチド成分)に対応するsscDNA産物中の配列に相補的なヌクレオチド配列を含む。増幅されたsscDNA産物を、好適な精製または洗浄方法、例えば、本明細書に記載される精製または洗浄方法により、精製することができる。
【0074】
一部の実施形態では、本明細書における方法は、ssRNAと足場アダプターもしくはその成分を結合させるステップの前に、またはsscDNAを生成するステップの前に、ssRNAを断片化するステップを含み、それによって、ssRNA断片が生成される。例えば、本明細書に記載される断片方法などの、任意の好適な断片化方法を使用することができる。一部の実施形態では、本明細書における方法は、ssRNAと足場アダプターもしくはその成分とを結合させるステップの前に、またはsscDNAを生成するステップの前に、リボソームRNA(rRNA)を枯渇させるステップおよび/またはメッセンジャーRNA(mRNA)を濃縮するステップを含む。例えば、本明細書に記載されるrRNA枯渇方法および/またはmRNA濃縮方法などの、任意の好適なrRNA枯渇方法および/またはmRNA濃縮方法を使用することができる。
【0075】
本明細書における方法は、1つまたは複数の複合体を形成するために、1つもしくは複数の足場アダプターまたはその成分と、一本鎖リボ核酸(ssRNA)および一本鎖相補デオキシリボ核酸(ssDNA)の混合物、または一本鎖相補DNA(sscDNA)およびssDNAの混合物を含む組成物とを結合させるステップを含み得る。足場ポリヌクレオチドは、ssNAについて上記で説明されたように、複合体形成時にオリゴヌクレオチド成分の末端がssRNA、sscDNAまたはssDNA断片の末端領域の末端に隣接しているような、ssRNA、sscDNAまたはssDNA断片、およびオリゴヌクレオチド成分との同時ハイブリダイゼーションのために、設計される。
【0076】
図7は、DNAとRNAの混合物を含む試料を処理するためのワークフローの例を示す。先ず、RNAを第1鎖cDNA合成(ここで、cDNAは、本明細書に記載されるようにタグ付けされる)に付すことができ、その一方で、二本鎖DNAは、不変のままであるか、または例えばバーコードで、タグ付けされる。次いで、足場アダプターを核酸と結合させ、核酸にライゲーションすることができる。次に、アダプターがライゲーションされた核酸を、例えばインデックスPCRで、増幅させることができる。次いで、核酸を、必要に応じて、濃縮(例えば、目的の標的について)および/またはシーケンシングすることができ、DNAおよびRNA配列をデコンボリューションすることができる。
【0077】
図9Aおよび9Bは、最初の第1鎖合成を伴うRNAの処理のための(例えば、
図7に示されているワークフローにおけるような)方法の例を示す。DNAとRNAを共に有する断片化された試料を、例えば、タグとランダムn-mer(例えば、ランダムヘキサマー)配列とを含むプライマーを使用して、先ず、逆転写およびRNAタグ付け(RNAバーコーティングと呼ばれることもある)に付す。次いで、DNAを変性させる。変性されたDNAを、例えば、一本鎖結合タンパク質(SSB)などの一本鎖エンハンサーの使用により、一本鎖形態で安定化することができる。次に、足場アダプターを核酸(元の試料DNAおよびcDNAを含む)と接触させ、ライゲーションする。インデックスPCRなどの増幅を行う。対象(例えば、ヒト)ゲノムともトランスクリプトームともハイブリダイズしないタグを選択することができる。ワークフローの他の箇所で使用されることになるプロモーター(例えば、T7プロモーター)を使用しないタグを選択することができる。シーケンシング後、RNA特異的タグを使用してRNA配列を同定またはデコンボリューションすることができる。
【0078】
図8は、DNAとRNAの混合物を含む試料を処理するためのワークフローの別の例を示す。先ず、試料中のRNAおよびDNA両方を、タグ(RNA特異的タグおよびDNA特異的タグ)を含む足場アダプターと結合させ、ライゲーションすることができる。次いで、1ステップPCRを行う。次いで、核酸を、必要に応じて、濃縮(例えば、目的の標的について)および/またはシーケンシングすることができ、DNAおよびRNA配列をデコンボリューションすることができる。
【0079】
図10Aおよび10Bは、最初のライゲーションステップを伴うRNAの処理のための(例えば、
図8に示されているワークフローにおけるような)方法の例を示す。DNAとRNAを共に有する断片化された試料を、先ず、DNA変性に付す。変性されたDNAを、例えば、一本鎖結合タンパク質(SSB)などの一本鎖エンハンサーの使用により、一本鎖形態で安定化することができる。次に、足場アダプター(RNA特異的タグを含むものもあり、DNA特異的タグを含むものもある)を核酸(DNAおよびRNA)と接触させ、ライゲーションする。ssRNAおよびssDNAにそれぞれ結合するRNAおよびDNAアダプターの特異性は、アダプターもしくはその成分、および/または使用される酵素(例えば、ライゲーション酵素)の選択によりもたらされ得る。一部の実施形態では、RNA断片にライゲーションする足場アダプターのオリゴヌクレオチド成分は、RNAで作られている。一部の実施形態では、RNA断片にライゲーションする足場アダプターのオリゴヌクレオチド成分は、RNAで作られており、足場ポリヌクレオチドは、RNAまたはDNAで作られている。一部の実施形態では、DNA断片にライゲーションする足場アダプターのオリゴヌクレオチド成分は、DNAで作られている。一部の実施形態では、DNA断片にライゲーションする足場アダプターのオリゴヌクレオチド成分は、DNAで作られており、足場ポリヌクレオチドは、DNAで作られている。少なくとも標的核酸の5’末端に対する、RNAまたはDNA特異性を有する酵素(例えば、RNAについてはT4 RNAリガーゼ2、DNAについてはT4 DNAリガーゼ)を使用することができる。これらの酵素は、5’末端上に「間違った」種類の核酸をライゲーションしない。標的核酸の3’末端へのライゲーションは、一部の実施形態では、標的核酸の3’末端とハイブリダイズするアダプターがRNAまたはDNA断片について同じであり得るので、より自由度の高いものであり得る。ライゲーション後、1ステップPCRを行い、その結果、RNAからcDNAが生成され、変性されたDNAの2本の鎖が合成される。シーケンシング後、DNAおよびRNA配列を、RNA特異的タグおよびDNA特異的タグを使用してデコンボリューションすることができる。
【0080】
これらの方法の応用例としては、cfDNAの解析、単一細胞解析、およびヒト試料の解析が挙げられる。
【0081】
ハイブリダイゼーションおよびライゲーション
核酸断片(例えば、ssNA断片)を足場アダプターまたはその成分と結合させることによって結合産物を生成する。ssNA断片と足場アダプターまたはその成分とを結合させることは、ハイブリダイゼーションおよび/またはライゲーション(例えば、ハイブリダイゼーション産物のライゲーション)含み得る。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)ssNA断片を含み得る。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分とハイブリダイズされたssNA断片を含むことがあり、この断片は、ハイブリダイゼーション産物と呼ばれることがある。結合産物は、ssNA断片の一方または両方の末端で足場アダプターまたはその成分にライゲーションされたssNA断片を含むことがあり、この断片は、ライゲーション産物と呼ばれることがある。一部の実施形態では、切断ステップからの産物(すなわち、切断産物)を足場アダプターまたはその成分と結合させることによって結合産物を生成することができる。本明細書におけるある特定の方法は、結合産物のセット(例えば、結合産物の第1のセットおよび結合産物の第2のセット)を生成するステップを含む。一部の実施形態では、結合産物の第1のセットは、足場アダプター、またはその成分の第1のセットからの足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)ssNAを含む。一部の実施形態では、結合産物の第2のセットは、足場アダプター、またはその成分の第2のセットからの足場アダプターまたはその成分に接続された(例えば、それとハイブリダイズされた、および/またはそれにライゲーションされた)結合産物の第1のセットを含む。
【0082】
ssNAを足場アダプターまたはその成分とハイブリダイゼーション条件下で結合させることによってハイブリダイゼーション産物を生成することができる。一部の実施形態では、足場アダプターは、事前にハイブリダイズされた産物として提供され、ハイブリダイゼーションステップは、足場アダプターをssNAとハイブリダイズさせることを含む。一部の実施形態では、足場アダプター成分(すなわち、オリゴヌクレオチドおよび足場ポリヌクレオチド)は、個々の成分として提供され、ハイブリダイゼーションステップは、足場アダプター成分を1)互いに、および2)ssNAと、ハイブリダイズさせることを含む。一部の実施形態では、足場アダプター成分(すなわち、オリゴヌクレオチドおよび足場ポリヌクレオチド)は、個々の成分として逐次的に提供され、ハイブリダイゼーションステップは、1)足場ポリヌクレオチドをssNAとハイブリダイズさせること、次いで、2)オリゴヌクレオチドを足場ポリヌクレオチドのオリゴヌクレオチドハイブリダイゼーション領域とハイブリダイズさせることを含む。結合させるステップ中の条件は、足場アダプター、またはその成分(例えば、一本鎖足場領域)が、一本鎖足場領域に対して配列が相補的である末端領域(単数または複数)を有するssNAと、特異的にハイブリダイズする条件である。結合させるステップ中の条件は、足場アダプターの成分(例えば、オリゴヌクレオチド、および足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域)が互いに特異的にハイブリダイズするまたはハイブリダイズした状態のままである条件も含み得る。
【0083】
特異的ハイブリダイゼーションは、一本鎖足場領域とssNA末端領域とのまたはオリゴヌクレオチドとオリゴヌクレオチドハイブリダイゼーション領域との相補性度、それらの長さ、およびハイブリダイゼーションが起こる温度などの要因による影響を被るまたは影響を受ける可能性があり、ハイブリダイゼーションが起こる温度は、一本鎖足場領域の融解温度(Tm)から情報を得ることができる。融解温度は、一本鎖足場領域/ssNA末端領域の半分がハイブリダイズした状態のままであり、一本鎖足場領域/ssNA末端領域の半分が解離して一本鎖になる、温度を一般に指す。二重鎖のTmは、実験により決定することができ、または式Tm=81.5+16.6(log10[Na+])+0.41(分率G+C)-(60/N)(式中、Nは、鎖長であり、[Na+]は、1M未満である)を使用して予測することができる。様々なパラメーターに依存するさらなるモデルを使用して、様々なハイブリダイゼーション条件に依存する関連領域のTmを予測することができる。具体的な核酸ハイブリダイゼーションを達成するためのアプローチは、例えば、Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, part I, chapter 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," Elsevier (1993)に記載されている。
【0084】
一部の実施形態では、本明細書における方法は、ssNAの末端が、それがハイブリダイズされる足場アダプターの末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含む。詳細には、本明細書における方法は、ssNAの末端が、それがハイブリダイズされる足場アダプターのオリゴヌクレオチド成分の末端に結合される条件に、ハイブリダイゼーション産物を曝露するステップを含み得る。結合は、ssNAの、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分への共有結合を可能にする、任意の好適なアプローチにより果たすことができる。ssNAの一方の末端が、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分の末端に結合される場合、通常は、次の2つの結合事象の一方が行なわれる:1)足場アダプターのオリゴヌクレオチド成分の5’末端へのssNAの3’末端の結合事象、または2)足場アダプターのオリゴヌクレオチド成分の3’末端へのssNAの5’末端の結合事象。ssNAの両方の末端が、それがハイブリダイズされる足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分の末端に各々結合される場合、通常は、次の2つの結合事象が行なわれる:1)第1の足場アダプターのオリゴヌクレオチド成分の5’末端へのssNAの3’末端の結合事象、および2)第2の足場アダプターのオリゴヌクレオチド成分の3’末端へのssNAの5’末端の結合事象。
【0085】
一部の実施形態では、本明細書における方法は、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、ssNAの末端が、標的核酸(ssNA)がハイブリダイズされる足場アダプターの末端および/または足場アダプターのオリゴヌクレオチド成分の末端に共有結合で連結される条件下で、接触させるステップを含む。リガーゼ活性は、例えば、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、付着末端リガーゼ活性、DNAリガーゼ活性、RNAリガーゼ活性、一本鎖リガーゼ活性、および二本鎖リガーゼ活性を含み得る。リガーゼ活性は、1つのポリヌクレオチドの5’リン酸化末端を別のポリヌクレオチドの3’OH末端に(5’Pを3’OHに)ライゲーションすることを含み得る。リガーゼ活性は、1つのポリヌクレオチドの3’リン酸化末端を別のポリヌクレオチドの5’OH末端に(3’Pを5’OHに)ライゲーションすることを含み得る。リガーゼ活性は、ssNAの5’末端を、それとハイブリダイズされる足場アダプターの3’末端に、および/またはその足場アダプターのオリゴヌクレオチド成分の3’末端に、ライゲーション反応でライゲーションすることを含み得る。リガーゼ活性は、ssNAの3’末端を、それとハイブリダイズされる足場アダプターの5’末端に、および/またはその足場アダプターのオリゴヌクレオチド成分の5’末端に、ライゲーション反応でライゲーションすることを含み得る。ライゲーション反応を行うための好適な試薬(例えば、リガーゼ)およびキットは、公知であり、入手可能である。例えば、New England Biolabs(Ipswich、MA)から入手可能なInstant Sticky-end Ligase Master Mixを使用することができる。使用することができるリガーゼとしては、例えば、T3リガーゼ、T4 DNAリガーゼ(例えば、低または高濃度で)、T7 DNAリガーゼ、E.coli DNAリガーゼ、Electro Ligase(登録商標)、RNAリガーゼ、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、熱安定性5’App DNA/RNAリガーゼ、SplintR(登録商標)リガーゼ、RtcBリガーゼ、Taqリガーゼなど、およびこれらの組合せが挙げられるが、それらに限定されない。必要とされる場合、例えばT4ポリヌクレオチドキナーゼ(PNK)などの、好適なキナーゼを使用して、リン酸基をオリゴヌクレオチド成分のまたはssNA断片の5’末端に付加させることができる。そのようなキナーゼ、および5’末端をリン酸化するためにそのようなキナーゼを使用するためのガイダンスは、例えば、New England BioLabs,Inc.(Ipswich、MA)から入手可能である。
【0086】
一部の実施形態では、方法は、オリゴヌクレオチド成分およびssNA末端領域の隣接している末端を共有結合で連結させるステップを含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される。一部の実施形態では、共有結合で連結させるステップは、ハイブリダイゼーション産物(例えば、本明細書における少なくとも1つの足場アダプターとハイブリダイズされたssNA断片)と、リガーゼ活性を有する薬剤とを、ssNA末端領域の末端がオリゴヌクレオチド成分の末端に共有結合で連結される条件下で接触させることを含む。一部の実施形態では、方法は、第1のオリゴヌクレオチド成分および第1のssNA末端領域の隣接している末端を共有結合で連結させるステップと、第2のオリゴヌクレオチド成分および第2のssNA末端領域の隣接している末端を共有結合で連結させるステップとを含み、それによって共有結合で連結されたハイブリダイゼーション産物が生成される。一部の実施形態では、共有結合で連結させるステップは、ハイブリダイゼーション産物(例えば、本明細書における2つの足場アダプターと各々がハイブリダイズするssNA断片)と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチド成分の末端に共有結合で連結され、第2のssNA末端領域の末端が第2のオリゴヌクレオチド成分の末端に共有結合で連結される条件下で、接触させることを含む。一部の実施形態では、リガーゼ活性を有する薬剤は、T4 DNAリガーセである。一部の実施形態では、T4 DNAリガーゼは、約1単位/μl~約50単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約5単位/μl~約30単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約5単位/μl~約15単位/μlの間の量で使用される。一部の実施形態では、T4 DNAリガーゼは、約10単位/μlで使用される。一部の実施形態では、T4 DNAリガーゼは、25単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、20単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、15単位/μl未満の量で使用される。一部の実施形態では、T4 DNAリガーゼは、10単位/μl未満の量で使用される。
【0087】
一部の実施形態では、ハイブリダイゼーション産物は、第1のリガーゼ活性を有する第1の薬剤、および第1のリガーゼ活性とは異なる第2のリガーゼ活性を有する第2の薬剤と接触される。例えば、第1のリガーゼ活性および第2のリガーゼ活性は、平滑末端リガーゼ活性、ニックシーリングリガーゼ活性、突出末端リガーゼ活性、環状化リガーゼ活性、および付着末端リガーゼ活性、二本鎖リガーゼ活性、一本鎖リガーゼ活性、5’Pの3’OHに対するリガーゼ活性、および3’Pの5’OHに対するリガーゼ活性から独立して選択することができる。
【0088】
一部の実施形態では、本明細書における方法は、ssNAを、足場アダプターおよび/または足場アダプターのオリゴヌクレオチド成分に、生体適合性結合によって結合させるステップを含む。方法は、例えば、生体分子を結合させるのに有用な生体適合性反応を含む、クリックケミストリーまたはタグ付けを含み得る。一部の実施形態では、オリゴヌクレオチド成分の各々についての末端は、第1の化学反応性部分を含み、ssNAの各々についての末端は、第2の化学反応性部分を含む。そのような実施形態では、第1の化学反応性部分は、通常は、第2の化学反応性部分と反応することができ、足場アダプターのオリゴヌクレオチド成分と、足場アダプターがハイブリダイズされるssNAとの間に、共有結合を形成することができる。一部の実施形態では、本明細書における方法は、ssNAと、1つまたは複数の化学剤とを、第2の化学反応性部分がssNA断片の各々についての末端に組み込まれる条件下で、接触させるステップを含む。一部の実施形態では、本明細書における方法は、第1の化学反応性部分が第2の化学反応性部分と反応して、オリゴヌクレオチド成分と足場アダプターがハイブリダイズされるssNAとの間に共有結合を形成する条件に、ハイブリダイゼーション産物を曝露するステップを含む。一部の実施形態では、第1の化学反応性部分は、第2の化学反応性部分と反応して、オリゴヌクレオチド成分と、足場アダプターがハイブリダイズされるssNAとの間に1,2,3-トリアゾールを形成することができる。一部の実施形態では、第1の化学反応性部分は、銅を含む条件下で、第2の化学反応性部分と反応することができる。第1および第2の化学反応性部分は、任意の好適な対合を含み得る。例えば、第1の化学反応性部分は、アジド含有部分および5-オクタジイニルデオキシウラシルから選択することができ、第2の化学反応性部分は、独立して、アジド含有部分、ヘキシニルおよび5-オクタジイニルデオキシウラシルから選択することができる。一部の実施形態では、アジド含有部分は、N-ヒドロキシスクシンイミド(NHS)エステル-アジドである。
【0089】
オリゴヌクレオチドおよびssNA断片の隣接している末端を共有結合で連結させると、共有結合で連結された産物が生成され、この産物は、ライゲーション産物と呼ばれることがある。足場ポリヌクレオチドとハイブリダイズした状態のままである、オリゴヌクレオチド成分に共有結合で連結されたssNA断片を含む、共有結合で連結された産物は、共有結合で連結されたハイブリダイゼーション産物と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物を変性させて(例えば、熱変性させて)、足場ポリヌクレオチドからのオリゴヌクレオチド成分に共有結合で連結されたssNA断片を分離することができる。足場ポリヌクレオチドともはやハイブリダイズしていない(変性後の)、オリゴヌクレオチド成分に共有結合で連結されたssNA断片を含む、共有結合で連結された産物は、一本鎖ライゲーション産物と呼ばれることがある。一部の事例では、足場ポリヌクレオチドの部分を、例えば、足場ポリヌクレオチド中の1つまたは複数のウラシル塩基に対してウラシル-DNAグリコシラーゼまたはエンドヌクレアーゼを使用することにより、切断することおよび/または変性させることができる。
【0090】
共有結合で連結されたハイブリダイゼーション産物および/または一本鎖ライゲーション産物を、目的の下流の応用(例えば、増幅;シーケンシング)で投入物として使用する前に精製することができる。例えば、共有結合で連結されたハイブリダイゼーション産物および/または一本鎖ライゲーション産物を、結合させるステップ、ハイブリダイゼーションステップおよび/または共有結合で連結させる(ライゲーション)ステップ中に存在するある特定の成分から(例えば、固相可逆的固定法(SPRI)、カラム精製、および/またはこれらに類することにより)精製することができる。
【0091】
一部の実施形態では、本明細書における方法が、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップを含む場合、結合させるステップおよび共有結合で連結させるステップの全継続時間は、4時間もしくはそれ未満、3時間もしくはそれ未満、2時間もしくはそれ未満、または1時間もしくはそれ未満であり得る。一部の実施形態では、結合させるステップおよび共有結合で連結させるステップの全継続時間は、1時間未満である。
【0092】
一部の実施形態では、本明細書における方法は、マイクロ流体デバイスを含むがこれに限定されない、単一容器、単一チャンバおよび/または単一体積(すなわち、連続体積)で行なわれる。一部の実施形態では、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップは、マイクロ流体デバイスを含むがこれに限定されない、単一容器、単一チャンバおよび/または単一体積(すなわち、連続体積)で行なわれる。一部の実施形態では、本明細書における方法は、マイクロ流体デバイスを含むがこれに限定されない、一連のウェル、液滴、エマルジョン、区画または他の反応体積で行なわれる。一部の実施形態では、ssNA組成物と本明細書における足場アダプターまたはその成分とを結合させるステップ、ならびにオリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるステップは、マイクロ流体デバイスを含むがこれに限定されない、一連のウェル、液滴、エマルジョン、区画または他の反応体積で行なわれる。一部の事例では、一連の反応体積は、反応体積の大部分またはすべてが、多くても1つのssNAしか含まないように、調製される。一部の事例では、一連の反応体積は、反応体積の大部分またはすべてが、多くても2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000またはそれより多くのssNAしか含まないように、調製される。反応体積への1つまたは限られた数のssNAの分配は、試料核酸の希少種のライブラリー変換を増加させることなどの、好ましい反応動態をもたらすことができる。
【0093】
エピジェネティクス解析のためのアダプター
本明細書に記載されるアダプターをエピジェネティクス(またはエピゲノム)解析に使用することができる。例えば、本明細書に記載されるアダプターをメチル化解析(例えば、メチローム解析)において使用することができる。DNAメチル化は、ある特定の発生過程に影響を及ぼし得るエピジェネティック修飾の一種である。メチル化異常、例えば、シトシン-グアニン(CpG)ジヌクレオチドの低メチル化または高メチル化は、例えば、がん、糖尿病、心血管疾患および炎症性疾患などの、様々な精神障害または疾患の発生につながり得る問題、例えば、ゲノム不安定性および/または転写サイレンシングの原因となり得る。
【0094】
メチル化解析は、メチル化シーケンシング(メチル-Seq)を含み得る。メチル化シーケンシングは、通常は、試料核酸中のシトシンを脱アミノ化するための処理を含む。脱アミノ化は、分子からのアミノ基の除去を指す。このような処理は、シトシンのメチル化状態に基づいて、1)非メチル化シトシン残基がウラシルに変換される、および2)メチル化シトシン(5’メチルシトシン、5-mC、5-hmC)残基が処理により未修飾状態のままであるという、2つの異なる結果を生じさせる。一部のアッセイでは、遺伝子特異的解析または全ゲノム解析においてシトシン残基のメチル化状態を明らかにするために、脱アミノ化処理に続いて核酸増幅(例えば、PCR)および/または核酸シーケンシング(例えば、大規模並列シーケンシング)が行われ得る。ウラシルに変換される非メチル化シトシン残基は、通常は、後続の増幅反応においてチミン残基として増幅されるが、メチル化シトシン残基は、シトシン残基として増幅される。参照ゲノムと脱アミノ化処理された核酸との配列情報の比較により、シトシンメチル化パターンについての情報を得ることができる。
【0095】
脱アミノ化処理は、化学物質に基づく処理および/または酵素に基づく処理を含み得る。化学物質に基づく処理は、バイサルファイト変換(例えば、ZYMOのEZ METHYLATION-LIGHTNING Kit)とも呼ばれる、亜硫酸水素ナトリウム処理を含み得る。酵素に基づく処理は、デアミナーゼ酵素(例えば、シトシンデアミナーゼ;NEBNext(登録商標)Enzymatic Methyl-seq(EM-seq(商標))(NEB #E7120))の使用を含み得る。デアミナーゼ酵素は、シトシンデアミナーゼファミリーであるAPOBEC(アポリポタンパク質B mRNA編集酵素、触媒ポリペプチド様)を含み得る。バイサルファイト処理は、一般に、激しいと考えられ、多くの場合、試料核酸の変性、せん断および/または喪失をもたらすが、酵素に基づく処理は、バイサルファイト処理と比べて穏やかと考えられ、試料核酸の損傷を最小限に抑えることができる。理論により限定されるものではないが、バイサルファイト処理は、短い核酸断片(例えば、約250bp未満の断片)を含む試料核酸に好適であり得、ある特定の事例では、この処理によって、せん断および/または喪失がほとんど生じない。
【0096】
核酸ライブラリーを生成するための方法であって、(a)一本鎖核酸(ssNA)を含む核酸組成物と、本明細書に記載される複数の足場アダプター、またはその成分とを結合させるステップ、および(b)ssNA中の1つまたは複数の非メチル化シトシン残基を脱アミノ化するステップであって、それによって、1つまたは複数の非メチル化シトシン残基がウラシルに変換されるステップを含む方法が、本明細書で提供される。一部の実施形態では、足場アダプターは、本明細書に記載のインラインUMIを含む。一部の実施形態では、足場アダプターは、インラインUMIを含まない。一部の実施形態では、(b)の脱アミノ化するステップは、(a)の結合させるステップの前に行われる。一部の実施形態では、(b)の脱アミノ化するステップは、(a)の結合させるステップの後に行われる。一部の実施形態では、足場アダプター、またはその1つもしくは複数の成分は、1つまたは複数のメチル化シトシン残基を含む。そのような事例では、足場アダプター、またはその1つもしくは複数の成分は、本明細書では、メチル化アダプター、またはメチル化成分と呼ばれることがある。一部の実施形態では、足場アダプターのオリゴヌクレオチド成分は、1つまたは複数のメチル化シトシン残基を含む(メチル化オリゴヌクレオチド)。一部の実施形態では、足場アダプターの足場ポリヌクレオチド成分は、1つまたは複数のメチル化シトシン残基を含む(メチル化足場ポリヌクレオチド)。一部の実施形態では、脱アミノ化するステップは、亜硫酸水素ナトリウムの使用を含む。一部の実施形態では、脱アミノ化するステップは、デアミナーゼの使用を含む。
【0097】
ライブラリーを、本明細書におけるメチル化シーケンシングのための方法に従って調製することができる。一部の実施形態では、ライブラリーは、ゲノム核酸(例えば、gDNA)を含む核酸組成物についてのメチル化シーケンシングのために調製される。一部の実施形態では、ライブラリーは、無細胞核酸(例えば、cfDNA)を含む核酸組成物についてのメチル化シーケンシングのために調製される。一部の実施形態では、ライブラリーは、古代核酸(aDNA)を含む核酸組成物についてのメチル化シーケンシングのために調製される。一部の実施形態では、ライブラリーは、法医学試料からの核酸を含む核酸組成物についてのメチル化シーケンシングのために調製される。一部の実施形態では、ライブラリーは、合成核酸(例えば、合成オリゴヌクレオチド)を含む核酸組成物についてのメチル化シーケンシングのために調製される。
【0098】
一部の実施形態では、ライブラリーは、特定の閾値またはカットオフ長未満の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む核酸組成物についてのメチル化シーケンシングのために調製される。一部の実施形態では、ライブラリーは、特定の閾値またはカットオフ長未満の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む核酸組成物についてのメチル化シーケンシングのために調製され、この場合、核酸は、亜硫酸水素ナトリウムで処理される。一部の実施形態では、ライブラリーは、特定の閾値またはカットオフ長未満の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む核酸組成物についてのメチル化シーケンシングのために調製され、この場合、核酸は、本明細書における足場アダプター、またはその成分(例えば、メチル化アダプター、またはそのメチル化成分)との結合後に、亜硫酸水素ナトリウムで処理される。一部の実施形態では、核酸組成物は、約250bp未満の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む。例えば、核酸組成物は、約250bp、200bp、150bp、100bpまたは50bp未満の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含み得る。一部の実施形態では、核酸組成物は、約30bp~約250bpの間の長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む。例えば、核酸組成物は、約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、約130bp、約140bp、約150bp、約160bp、約170bp、約180bp、約190bp、または約200bpの長さの代表値、平均値、中央値または最頻値を有する核酸断片を含み得る。一部の実施形態では、核酸組成物は、約75bpの長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む。一部の実施形態では、核酸組成物は、約75bpの長さの最頻値を有する核酸断片を含む。一部の実施形態では、核酸組成物は、約167bpの長さの代表値、平均値、中央値または最頻値を有する核酸断片を含む。一部の実施形態では、核酸組成物は、約167bpの長さの最頻値を有する核酸断片を含む。
【0099】
アダプターダイマー
一部の実施形態では、本明細書における方法は、アダプターダイマーを防止する、低減させるまたは消失させるための1または複数の修飾および/またはさらなるステップを含む。アダプターダイマーは、本明細書に記載される方法中に意図せず形成されることがある。アダプターダイマーは、互いとハイブリダイズするかまたはハイブリダイズしてライゲーションする2つもしくはそれより多くの足場アダプター、それらの成分、またはそれらの部分を、一般に指す。
【0100】
ある特定の実施形態では、足場アダプター、またはその成分は、アダプターダイマー形成を防止するように修飾される。足場アダプターの修飾の例としては、足場アダプター、オリゴヌクレオチド成分または足場ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子(例えば、別の足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチド)への、共有結合性連結を遮断することができる修飾ヌクレオチドが、挙げられる。修飾ヌクレオチドの例は、下で説明される。足場アダプターの他の/さらなる修飾は、Y構成またはヘアピン構成などの構成を含み、これらの構成は、下でさらに詳細に説明される。一部の実施形態では、足場アダプター、オリゴヌクレオチド成分は、および/または足場ポリヌクレオチドは、ホスホロチオエート骨格修飾(例えば、鎖上の最後の2ヌクレオチド間のホスホロチオエート結合)を含むことがある。
【0101】
一部の実施形態では、方法は、アダプターダイマー形成を防止または低減させるための脱リン酸化ステップを含む。一部の実施形態では、方法は、足場アダプターまたはその成分をssNAと結合させるステップの前に、足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチドと、ホスファターゼ活性を有する薬剤とを、足場アダプター、オリゴヌクレオチド成分および/または足場ポリヌクレオチドが脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された足場アダプター、脱リン酸化されたオリゴヌクレオチド成分、および/または脱リン酸化された足場ポリヌクレオチドが生成される。
【0102】
一部の実施形態では、方法は、アダプターダイマー形成を防止または低減させるための1つまたは複数の段階的なライゲーションアプローチを含む。一部の実施形態では、方法は、ホスホリル転移活性を有する薬剤の付加を(例えば、ハイブリダイゼーション産物が形成し終えるまで)遅延させること、および/または第2の足場アダプターもしくはその成分の付加を遅延させることを含む、段階的なライゲーションを含む。例えば、方法は、ハイブリダイゼーション産物を形成するステップの後、かつオリゴヌクレオチド成分をssNA末端領域に共有結合で連結させるステップの前に、オリゴヌクレオチド成分と、ホスホリル転移活性を有する薬剤とを、5’リン酸がオリゴヌクレオチド成分の5’末端に付加される条件下で接触させるステップを含み得る。別の例では、方法は、足場アダプターの第1のセットとssNAとを結合させるステップを含み得る。足場アダプターの第1のセットは、3’OHを有するオリゴヌクレオチド成分を含み得る。足場アダプターの第1のセットは、ssNAとハイブリダイズされ、オリゴヌクレオチド成分の3’OHは、ssNA末端領域の5’末端(例えば、5’リン酸化末端)に共有結合で連結される。ハイブリダイゼーションおよび共有結合性連結のこのような第1のラウンドの産物は、共有結合で連結されたハイブリダイゼーション産物中間体と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物中間体は、次いで、足場アダプターの第2のセットと結合される。足場アダプターの第2のセットは、本明細書に記載されるようにリン酸化され得る5’末端を有するオリゴヌクレオチド成分を含み得る。足場アダプターの第2のセットは、共有結合で連結されたハイブリダイゼーション産物中間体とハイブリダイズされ、オリゴヌクレオチド成分の5’リン酸化末端は、ssNA末端領域の3’末端に共有結合で連結される。
【0103】
一部の実施形態では、方法は、アデニル化修飾を有する足場アダプターまたはその成分の使用を含む、段階的なライゲーションを含む。例えば、足場アダプターの第1のセットは、オリゴヌクレオチド成分の5’末端のアデニル化修飾(5’App)を含み得る。足場アダプターの第1のセットは、ssNAとハイブリダイズされ、オリゴヌクレオチド成分の5’Appは、ssNA末端領域の3’末端に共有結合で連結される。共有結合性連結は、ATPの非存在下で行われることもある。ハイブリダイゼーションおよび共有結合性連結のこのような第1のラウンドの産物は、共有結合で連結されたハイブリダイゼーション産物中間体と呼ばれることがある。共有結合で連結されたハイブリダイゼーション産物中間体は、次いで、足場アダプターの第2のセットと結合される。足場アダプターの第2のセットは、3’OH末端を有するオリゴヌクレオチド成分を含み得る。足場アダプターの第2のセットは、共有結合で連結されたハイブリダイゼーション産物中間体とハイブリダイズされ、オリゴヌクレオチド成分の3’OH末端は、ssNA末端領域の5’末端(例えば、5’リン酸化末端)に(ATPの付加によって)共有結合で連結される。1つの変形形態では、足場アダプターの第1のセットおよび足場アダプターの第2のセットは、ATPの非存在下で同時にssNAと結合される。足場アダプターの第1のセットのライゲーションは、ATPの非存在下で進行することができ、足場アダプターの第2のセットのライゲーションは、ATPが付加されるまでしか進行することができない。
【0104】
一部の実施形態では、方法は、3’リン酸化末端を有するオリゴヌクレオチド(すなわち、一本鎖オリゴヌクレオチド)の使用を含む、段階的なライゲーションを含む。3’リン酸化末端を有するオリゴヌクレオチドは、足場アダプターのオリゴヌクレオチド成分についての本明細書に記載される小成分(例えば、プライマー結合部位、インデックス、UMI、フローセルアダプターなど)のいずれかを含み得る。3’リン酸化末端を有するオリゴヌクレオチドは、一般に、一本鎖状であり、足場ポリヌクレオチドとハイブリダイズされていない。一例では、方法は、足場アダプターまたはその成分とssNAとを結合させるステップの前に、ssNAと、3’末端にリン酸を含むオリゴヌクレオチドとを結合させるステップ、およびオリゴヌクレオチドの3’リン酸化末端をssNA末端領域の5’末端(例えば、5’非リン酸化末端)に共有結合で連結させるステップを含み得る。一部の実施形態では、オリゴヌクレオチドをssNAに共有結合で連結させるステップの前に、ssNAは、ホスファターゼ活性を有する薬剤と、ssNAが脱リン酸化される条件下で接触され、それによって脱リン酸化されたssNAが生成される。一部の実施形態では、オリゴヌクレオチドをssNAに共有結合で連結させるステップは、ssNAおよびオリゴヌクレオチドと、一本鎖リガーゼ活性を有する薬剤とを、ssNAの5’末端がオリゴヌクレオチドの3’末端に共有結合で連結される条件下で接触させることを含む。一部の実施形態では、リガーゼ活性を有する薬剤は、RtcBリガーセである。そのような共有結合で連結させるステップの産物は、共有結合で連結された産物中間体と呼ばれることがある。共有結合で連結された産物中間体は、次いで、足場アダプターのセットと結合される。足場アダプターのセットは、5’リン酸化末端を有するオリゴヌクレオチド成分を含み得る。足場アダプターのセットは、共有結合で連結された産物中間体とハイブリダイズされ、オリゴヌクレオチド成分の5’リン酸化末端は、ssNA末端領域の3’末端に共有結合で連結される。
【0105】
一部の実施形態では、方法は、アダプターダイマーを低減または消失させるための、オリゴヌクレオチドダイマー産物とハイブリダイズすることができるオリゴヌクレオチドの使用を含む。オリゴヌクレオチドダイマー産物は、足場アダプターダイマーの成分であり得、第2の足場アダプターからのオリゴヌクレオチド成分に共有結合で連結された第1の足場アダプターからのオリゴヌクレオチド成分を含有し得る。本明細書における方法は、足場アダプターダイマーからオリゴヌクレオチドダイマー産物を放出させることができる変性ステップを含み得る。オリゴヌクレオチドダイマー産物は、オリゴヌクレオチドダイマー産物にまたはその一部に相補的な配列を有するオリゴヌクレオチドとハイブリダイズすることができ、それによってオリゴヌクレオチドダイマーハイブリダイゼーション産物が形成される。一部の実施形態では、オリゴヌクレオチドダイマーハイブリダイゼーション産物は、切断部位を含む。一部の実施形態では、切断部位は、制限酵素認識部位である。一部の実施形態では、本明細書における方法は、オリゴヌクレオチドダイマーハイブリダイゼーション産物と切断剤(例えば、制限酵素、レアカッター制限酵素)とを接触させるステップをさらに含む。
【0106】
一部の実施形態では、方法は、アダプターダイマーを低減または消失させるためにライブラリー調製の様々な段階で核酸産物を精製または洗浄するステップを含む。一部の事例では、核酸産物を精製または洗浄するステップは、アダプターダイマーを低減または消失させることができる。例えば、共有結合で連結されたハイブリダイゼーション産物(すなわち、足場アダプターとハイブリダイズされ、オリゴヌクレオチド成分に共有結合で連結された、ssNA)、一本鎖ライゲーション産物(すなわち、変性された、共有結合で連結された、ハイブリダイゼーション産物;オリゴヌクレオチド成分に共有結合で連結されており、もはや足場ポリヌクレオチドとハイブリダイズすることができない、ssNA)、またはこれらの増幅産物を、任意の好適な精製または洗浄方法により精製または洗浄することができる。一部の実施形態では、精製または洗浄するステップは、固相可逆的固定法(SPRI)の使用を含む。例えば、約2.5M~約5M NaCl、約0.1mM~約1M EDTA、約10mM Tris、約0.01%~約0.05%TWEEN(登録商標)-20、および約8%~約38%の間のPEG-8000を含有する、DNA結合緩衝液に、SPRIビーズを懸濁させることができる。例えば、1mlのSPRIビーズ懸濁液を、2.5M NaCl、10mM Tris、1mM EDTA、0.05%Tween-20および20%PEG-8000と併せることができる。一部の実施形態では、SPRIは、連続的SPRI(連続して行なわれる洗浄)およびまたは逐次的SPRI(逐次的なSPRIビーズの添加およびインキュベーションを含む洗浄)を含む。連続的SPRIは、2、3、4、5、6、7、8、9、10回またはそれより多くの連続的洗浄を含み得る、複数の連続的(連続した)洗浄を含み得る。逐次的SPRIは、2、3、4、5、6、7、8、9、10回またはそれより多くのSPRIビーズの逐次的添加を含み得る、SPRIビーズの複数の逐次的添加(インキュベーションが介在する)を含み得る。一部の実施形態では、SPRI精製に使用されるSPRIビーズの量は、0.1×~3×SPRIビーズの間の量を含み得る(×は、ビーズの核酸に対する(例えば、ビーズ体積の反応体積に対する)比である)。例えば、SPRI精製において使用されるSPRIビーズの量は、約0.1×、0.2×、0.3×、0.4×、0.5×、0.6×、0.7×、0.8×、0.9×、1.0×、1.1×、1.2×、1.3×、1.4×、1.5×、1.6×、1.7×、1.8×、1.9×、2.0×、2.1×、2.2×、2.3×、2.4×、2.5×、2.6×、2.7×、2.8×、2.9×、または3.0×SPRIビーズを含み得る。一部の実施形態では、SPRI精製において使用されるSPRIビーズの量は、1.2×である。一部の実施形態では、SPRI精製において使用されるSPRIビーズの量は、1.5×である。一部の実施形態では、精製または洗浄するステップは、カラム精製(例えば、カラムクロマトグラフィー)を含む。一部の実施形態では、精製または洗浄するステップは、カラム精製(例えば、カラムクロマトグラフィー)を含まない。一部の実施形態では、共有結合で連結されたハイブリダイゼーション産物、一本鎖ライゲーション産物、および/またはそれらの増幅産物は、精製も洗浄もされない。
【0107】
SPRI精製は、通常は、緩衝液の存在下で行なわれる。任意の好適な緩衝液、例えば、Tris緩衝液、同様のpHのものである水などを、使用することができる。SPRI精製ビーズを、試料溶液(例えば、共有結合で連結されたハイブリダイゼーション産物(ライゲーション産物)またはそれらの増幅された産物を含有する、試料溶液)に直接添加することができる。ある特定の事例では、緩衝液を添加して反応の体積を増加させることができ、したがってさらなるビーズを添加することができる。一部の実施形態では、SPRIビーズ溶液は、水、NaCl、TrisおよびEDTAに溶解されたPEG 8000に添加された、カルボキシル化磁気ビーズで構成されている。通常は、PEGの量によってSPRIビーズ溶液のPEGパーセンテージが決まる。例えば、50ml SPRIビーズ溶液中9gのPEG 8000の添加は、「18%SPRI」と呼ばれることがある。別の例では、50ml SPRI溶液中19gのPEG 8000の添加は、「38%SPRI」と呼ばれることがある。一般に、PEGの比率が高いほど、保持されるDNA断片のサイズは小さい。
【0108】
一部の実施形態では、精製プロセスは、共有結合で連結されたハイブリダイゼーション産物(ライゲーション産物)と、固相可逆的固定法(SPRI)ビーズおよび緩衝液とを接触させるステップを含む。一部の実施形態では、一部またはすべてのSPRI緩衝液がイソプロパノールで置き換えられる。一部の実施形態では、SPRI緩衝液は、イソプロパノールを含む。一部の実施形態では、SPRI緩衝液は、イソプロパノールで完全に置き換えられる。一部の実施形態では、SPRI緩衝液は、約5%体積/体積(v/v)イソプロパノール~約50% v/vイソプロパノールを含む。一部の実施形態では、SPRI緩衝液は、約10% v/v イソプロパノール~約40% v/v イソプロパノールを含む。例えば、SPRI緩衝液は、約10% v/vイソプロパノール、15% v/vイソプロパノール、20% v/vイソプロパノール、25% v/vイソプロパノール、30% v/vイソプロパノール、35% v/vイソプロパノール、または40% v/vイソプロパノールを含み得る。一部の実施形態では、SPRI緩衝液は、約20% v/v イソプロパノールを含む。
【0109】
一部の実施形態では、精製または洗浄するステップは、特定の長さまたは長さの範囲を有する核酸断片またはそれらの増幅産物を濃縮することができる。一部の実施形態では、SPRI精製は、特定の長さまたは長さの範囲を有する核酸断片またはそれらの増幅産物を濃縮することができる。一部の実施形態では、SPRI精製において使用されるSPRIビーズ溶液中のPEG 8000の量は、濃縮される断片の長さまたは長さの範囲に影響を与え得る。例えば、1.5× v/v比でのSPRI精製は、<100塩基の範囲において1.2×でのSPRI精製より多くの断片を回収することができる。なぜなら、PEG 8000の最終濃度が1.2×でよりも1.5×でのほうが高いからである。一部の実施形態では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI比を調整するステップを含む。一部の実施形態では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップを含む。一部の実施形態では、本明細書における方法は、望ましくないアーチファクト(例えば、アダプターダイマー)の量を最小限に抑えつつ所望の断片長または長さの範囲を濃縮するように、SPRI精製におけるイソプロパノールの量を調整するステップを含む。例えば、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップであって、回収されるアダプターダイマーの量が、回収される全核酸の約10%未満である、ステップを含む。別の例では、本明細書における方法は、所望の断片長または長さの範囲を濃縮するようにSPRI精製におけるイソプロパノールの量を調整するステップであって、回収されるアダプターダイマーの量が、回収される全核酸の約5%未満である、ステップを含む。
【0110】
一部の実施形態では、本明細書における方法(例えば、ssNAと足場アダプターまたはその成分とを結合させるステップ、ハイブリダイゼーション、および共有結合で連結させステップ)を、好適な反応体積で、ならびに/またはssNAの好適な量および/もしくはssNAの足場アダプター(もしくはその成分)に対する好適な比を用いて、行なうことができる。好適な反応体積、および/またはssNAの好適な量、および/またはssNAの足場アダプター(もしくはその成分)に対する好適な比は、アダプターダイマー形成を低減させるまたは防止する反応体積、ssNAの量、および/またはssNAと足場アダプターの比を含み得る。一部の実施形態では、ssNAの好適な量は、ssNA約250pg~約5ngの範囲であり得る。例えば、ssNAの好適な量は、約250pg、500pg、750pg、1ng、1.5ng、2ng、2.5ng、3ng、3.5ng、4ng、4.5ng、または5ngであり得る。一部の実施形態では、ssNAの好適な量は、ssNA約1ngであり得る。一部の実施形態では、25μlの最終反応体積の場合は、1ngのssNAを、約1.0~2.0ピコモルの間の各足場アダプター(すなわち、ssNA末端領域の5’末端とハイブリダイズする約1.0~2.0ピコモルの足場アダプター(複数の足場アダプター種を含有する足場アダプターのプール)、およびssNA末端領域の3’末端とハイブリダイズする約1.0~2.0ピコモルの足場アダプター(複数の足場アダプター種を含有する足場アダプターのプール))と結合させることができる。例えば、25μlの最終反応体積の場合は、1ngのssNAを、約1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、または2.0ピコモルの各足場アダプターと結合させることができる。一部の実施形態では、25μlの最終反応体積の場合は、1ngのssNAは、約1.6ピコモルの各足場アダプター(すなわち、ssNA末端領域の5’末端とハイブリダイズする約1.6ピコモルの足場アダプター、およびssNA末端領域の3’末端とハイブリダイズする約1.6ピコモルの足場アダプター)と結合される。より大きい反応体積の場合、ssNAおよび足場アダプターの量を、相対量が保存されることを条件に、規模拡大することができる。より小さい反応体積の場合、ssNAおよび足場アダプターの量を、相対量が保存されることを条件に、規模縮小することができる。一部の実施形態では、本明細書における足場アダプターは、ssNAと、約5:1(足場アダプター対ssNA)~約50:1(足場アダプター対ssNA)の間のモル比で結合される。例えば、足場アダプターを、ssNAと、約5:1(足場アダプター対ssNA)、約10:1(足場アダプター対ssNA)、約15:1(足場アダプター対ssNA)、約20:1(足場アダプター対ssNA)、約25:1(足場アダプター対ssNA)、約30:1(足場アダプター対ssNA)、約35:1(足場アダプター対ssNA)、約40:1(足場アダプター対ssNA)、約45:1(足場アダプター対ssNA)、または約50:1(足場アダプター対ssNA)のモル比で結合させることができる。一部の実施形態では、足場アダプターは、ssNAと、約15:1(足場アダプター対ssNA)のモル比で結合される。一部の実施形態では、足場アダプターは、ssNAと、約30:1(足場アダプター対ssNA)のモル比で結合される。
【0111】
一部の実施形態では、本明細書における方法は、クラウディング剤の使用を含む。好適な量のクラウディング剤を使用してアダプターダイマー形成を低減させることまたは防止することができる。クラウディング剤としては、例えば、フィコール70、デキストラン70、ポリエチレングリコール(PEG)2000、およびポリエチレングリコール(PEG)8000を挙げることができる。一部の実施形態では、本明細書における方法は、ポリエチレングリコール(PEG)8000の使用を含む。PEGを、例えば、約15%~約20%の間の量で使用することができ、このパーセンテージは、ライゲーション反応におけるPEGの最終濃度を指す。例えば、PEGを、約15%、15.5%、16%、16.5%、17%、17.5%、18%、18.5%、19%、19.5%または20%で使用することができる。一部の実施形態では、18.5%PEGが使用される。一部の実施形態では、18%PEGが使用される。
【0112】
精製中にSPRIビーズ溶液を試料溶液に添加することができ、多くの場合、v/v比についての指示がある。例えば、1.2×18%SPRIは、50μl試料を入れる場合に60μl(50×1.2)の18%SPRIビーズを添加することを意味する。このv/v比は、試料溶液中にPEGがないことを仮定すると、9.8%のPEGの最終濃度に至る。しかし、多くの場合、ライゲーション後に、試料溶液(すなわち、ライゲーション産物)中に存在するPEGの既存量がある。したがって、ユーザーは、添加するSPRIビーズの量を、所望の最終PEG濃度に達するように調整することができる。所望の最終PEG濃度は、約5%最終PEG~約15%最終PEGの範囲であり得る。例えば、所望の最終PEG濃度は、約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%または15%であり得る。一部の実施形態では、所望の最終PEG濃度は、約10%(例えば、毛髪試料およびcfDNA試料について)である。一部の実施形態では、所望の最終PEG濃度は、約12%(例えば、ホルマリン固定パラフィン包埋(FFPE)試料、および大きい鋳型断片を有する試料について)である。
【0113】
Yアダプター
一部の実施形態では、本明細書に記載される足場アダプターは、2本の鎖を含み、第1の末端に一本鎖足場領域があり、第2の末端に2本の非相補鎖がある。そのような足場アダプターは、Y足場アダプター、Yアダプター、Y形足場アダプター、Y形アダプター、Y二重鎖、Y形二重鎖、Y足場二重鎖、Y形足場二重鎖などと呼ばれることがある。Y形構造を有する足場アダプターは、一般に、二本鎖二重鎖領域を含み、一方の末端に2つの一本鎖「アーム」を、および他方の末端に一本鎖足場領域を含む。
【0114】
Y足場アダプターは、複数の核酸成分および小成分を含み得る。一部の実施形態では、Y足場アダプターは、第1の核酸鎖および第2の核酸鎖を含む。一部の実施形態では、第1の核酸鎖は、第2の核酸鎖に相補的である。一部の実施形態では、第1の核酸鎖の一部分は、第2の核酸鎖の一部分に相補的である。一部の実施形態では、第1の核酸鎖は、第2の核酸鎖中の第1の領域に相補的である第1の領域を含み、第1のポリヌクレオチドは、第2のポリヌクレオチド中の第2の領域に相補的でない第2の領域を含む。相補的な領域は、Y足場アダプターの二重鎖領域を形成することが多く、非相補的な領域は、Y足場アダプターのアームまたはそれらの部分を形成することが多い。第1および第2の核酸鎖は、小成分(例えば、足場ポリヌクレオチドの小成分、オリゴヌクレオチドの小成分、ならびに本明細書に記載されるシーケンシングアダプターの小成分、例えば、UMI、UMI隣接領域、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)など)を含み得る。一部の実施形態では、第1および第2の核酸鎖は、本明細書に記載されるシーケンシングアダプターのある特定の小成分、例えば、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)などを含まない。
【0115】
一部の実施形態では、Y足場アダプターは、一本鎖足場領域(ssNAハイブリダイゼーション領域)を含む。Y足場アダプターの一本鎖足場領域は、二本鎖二重鎖部分に隣接して、非相補鎖(または「アーム」)部分の反対側の末端に、通常は位置する。Y足場アダプターの一本鎖足場領域は、通常は、標的核酸の末端領域(例えば、一本鎖核酸の末端領域)に相補的である。
【0116】
ヘアピン
一部の実施形態では、足場アダプターは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖を含む。一部の実施形態では、足場アダプターは、一本鎖ループを有するヘアピン構造を形成することができる1本の鎖からなる。ヘアピン構造を有する足場アダプターは、一般に、二本鎖「ステム」領域および一本鎖「ループ」領域を含む。一部の実施形態では、足場アダプターは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)を含む。一部の実施形態では、足場アダプターは、ヘアピン構造をとることができる1本の鎖(すなわち、1本の連続鎖)から本質的になる。1本の鎖から本質的になるとは、足場アダプターが、連続鎖の一部でない、核酸の(例えば、足場アダプターとハイブリダイズされたるさらなる鎖を一切含まないことを意味する。したがって、ここでの「から本質的になる」は、足場アダプター中の鎖の数を指し、足場アダプターは、鎖の数に不可欠でない他の特徴を含むことができる(例えば、検出可能な標識を含むことができる;他の領域を含むことができる)。ヘアピン構造を形成することができる1本の鎖を含むまたはそのような1本の鎖から本質的になる足場アダプターは、本明細書では、ヘアピン、ヘアピン足場アダプター、またはヘアピンアダプターと呼ばれることがある。
【0117】
ヘアピン足場アダプターは、1本の鎖の中に複数の核酸成分および小成分を含み得る。一部の実施形態では、ヘアピン足場アダプターは、オリゴヌクレオチドおよび足場ポリヌクレオチドを含む。一部の実施形態では、オリゴヌクレオチドは、足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域に相補的である。一部の実施形態では、オリゴヌクレオチドの一部分は、足場ポリヌクレオチド中のオリゴヌクレオチドハイブリダイゼーション領域の一部分に相補的である。一部の実施形態では、ヘアピン足場アダプターは、相補領域および非相補領域を含む。相補領域は、ヘアピンアダプターのステムを形成することが多く、非相補領域は、ヘアピン足場アダプターのループまたはその一部を形成することが多い。オリゴヌクレオチドおよび足場ポリヌクレオチドは、小成分(例えば、足場ポリヌクレオチドの小成分、オリゴヌクレオチドの小成分、ならびに本明細書に記載されるシーケンシングアダプターの小成分、例えば、UMI、UMI隣接領域、増幅プライミング部位および/または個別のシーケンシングアダプター(例えば、P5、P7アダプター)など)を含み得る。一部の実施形態では、オリゴヌクレオチドおよび足場ポリヌクレオチドは、本明細書に記載されるシーケンシングアダプターのある特定の小成分、例えば、増幅プライミング部位および個別のシーケンシングアダプター(例えば、P5、P7アダプター)などを含まない。
【0118】
ヘアピン足場アダプターは、切断条件下で切断され得る1つまたは複数の切断部位を含むことがある。一部の実施形態では、切断部位は、オリゴヌクレオチドと足場ポリヌクレオチドの間に位置する。切断部位での切断は、ヘアピン足場アダプターから2本の別々の鎖を生成することが多い。一部の実施形態では、切断部位での切断は、「Y」構造を形成する2つの不対合鎖を有する部分的に二本鎖の足場アダプターを生成する。切断部位は、例えば、本明細書に記載される切断部位などの、任意の好適な切断部位を含み得る。一部の実施形態では、切断部位は、RNAヌクレオチドを含み、例えばRNAseを使用して切断され得る。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含み、例えば、DNAグリコシラーゼ、エンドヌクレアーゼ、RNAseなど、およびこれらの組合せを使用して切断され得る。一部の実施形態では、切断部位は、ウラシルおよび/またはデオキシウリジンを含まない。一部の実施形態では、本明細書における方法は、ヘアピン足場アダプターと一本鎖核酸とを結合させるステップの後、1つまたは複数の切断部位を切断条件に曝露するステップを含み、それによって足場アダプターが切断される。
【0119】
一部の実施形態では、ヘアピン足場アダプターは、一本鎖足場領域(ssNAハイブリダイゼーション領域)を含む。ヘアピン足場アダプターの一本鎖足場領域は、通常は、二本鎖ステム部分に隣接して、ループ部分の反対側の末端に位置する。ヘアピン足場アダプターの一本鎖足場領域は、通常は、標的核酸の末端領域(例えば、一本鎖核酸の末端領域)に相補的である。
【0120】
一部の実施形態では、ヘアピン足場アダプターは、5’から3’の方向に、オリゴヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドハイブリダイゼーション領域と足場領域(ssNAハイブリダイゼーション領域)とを含む足場ポリヌクレオチドを含む。一部の実施形態では、ヘアピンオリゴヌクレオチドは、5’から3’の方向に、足場領域(ssNAハイブリダイゼーション領域)とオリゴヌクレオチドハイブリダイゼーション領域とを含む足場ポリヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドを含む。一部の実施形態では、複数のヘアピン足場アダプター、またはヘアピン足場アダプターのプールは、1)5’から3’の方向に、オリゴヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドハイブリダイゼーション領域と足場領域(ssNAハイブリダイゼーション領域)とを含む足場ポリヌクレオチドを含む、ヘアピン足場アダプターと、2)5’から3’の方向に、足場領域(ssNAハイブリダイゼーション領域)とオリゴヌクレオチドハイブリダイゼーション領域とを含む足場ポリヌクレオチド;1つまたは複数の切断部位;およびオリゴヌクレオチドを含む、ヘアピン足場アダプターとの、混合物を含む。
【0121】
修飾ヌクレオチド
一部の実施形態では、足場アダプターまたはその成分は、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、UMI、および/またはUMIに隣接している隣接領域は、1つまたは複数の修飾ヌクレオチドを含む。修飾ヌクレオチドは、修飾塩基または非標準塩基と呼ばれることがあり、例えば、結合対のメンバーにコンジュゲートされたヌクレオチド、遮断されたヌクレオチド、非天然ヌクレオチド、ヌクレオチド類似体、ペプチド核酸(PNA)ヌクレオチド、モルホリノヌクレオチド、ロックド核酸(LNA)ヌクレオチド、架橋核酸(BNA)ヌクレオチド、グリコール核酸(GNA)ヌクレオチド、トレオース核酸(TNA)ヌクレオチドなど、およびこれらの組合せを含み得る。ある特定の構成では、足場アダプター、またはその成分(例えば、UMI、および/もしくはUMIに隣接している隣接領域)は、アミノ修飾因子、ビオチン化、チオール、アルキン、2’-O-メトキシ-エチル塩基(2’-MOE)、RNA、フルオロ塩基、イソ(イソ-dG、イソ-DC)、逆方向のもの、メチル、ニトロ、phosなどのうちの1つまたは複数から選択される修飾を有する、1つまたは複数のヌクレオチドを含む。
【0122】
一部の実施形態では、足場アダプター、またはその成分(例えば、UMI、および/もしくはUMIに隣接している隣接領域)は、二重鎖領域内に、足場領域内に、足場アダプターまたはその成分の、一方の末端に、または両方の末端に、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、足場アダプターまたはその成分は、1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、足場アダプターまたはその成分は、アダプターの一方の末端に1つまたは複数の不対合修飾ヌクレオチドを含む。一部の実施形態では、足場アダプターまたはその成分は、標的核酸とハイブリダイズする末端(例えば、一本鎖足場領域を含む末端)の反対側のアダプターの末端に、1つまたは複数の不対合修飾ヌクレオチドを含む。修飾ヌクレオチドは、3’末端を有する鎖の末端に存在することもあり、または5’末端を有する鎖の末端に存在することもある。
【0123】
一部の実施形態では、オリゴヌクレオチド成分は、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子へのオリゴヌクレオチド成分の共有結合性連結を遮断することができる。一部の実施形態では、オリゴヌクレオチド成分は、ssNAに隣接していない末端に1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、足場ポリヌクレオチドは、1つまたは複数の修飾ヌクレオチドを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への足場ポリヌクレオチドの共有結合性連結を遮断することができる。足場ポリヌクレオチドは、ポリヌクレオチドの一方または両方の末端に1つまたは複数の修飾ヌクレオチドを含むことがある。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ライゲーションを遮断する修飾を含む。
【0124】
一部の実施形態では、足場アダプターまたはその成分は、1つまたは複数の遮断されたヌクレオチドを含む。一例では、足場アダプターまたはその成分は、別の足場アダプターまたはその成分中のヌクレオチドとのハイブリダイゼーションを遮断することができる1つまたは複数の修飾ヌクレオチドを含み得る。一部の事例では、1つまたは複数の修飾ヌクレオチドは、別の足場アダプターまたはその成分中のヌクレオチドへのライゲーションを遮断することができる。別の例では、足場アダプターまたはその成分は、標的核酸(例えば、ssNA)中のヌクレオチドとのハイブリダイゼーションを遮断することができる1つまたは複数の修飾ヌクレオチドを含み得る。一部の事例では、1つまたは複数の修飾ヌクレオチドは、標的核酸中のヌクレオチドへのライゲーションを遮断することができる。一部の実施形態では、足場ポリヌクレオチドの一方または両方の末端は、遮断する修飾を含み、および/またはssNA断片に隣接していないオリゴヌクレオチド成分の末端が、遮断する修飾を含むこともある。遮断する修飾は、オリゴヌクレオチド成分およびssNA断片の隣接している末端を共有結合で連結させるために用いられるアプローチを使用して別の核酸成分の末端に連結させることができない、修飾された末端を指す。ある特定の実施形態では、遮断する修飾は、ライゲーションを遮断する修飾である。足場ポリヌクレオチドの一方もしくは両方の末端および/またはssNAに隣接していないオリゴヌクレオチド成分の末端に含まれることがある、遮断する修飾の例としては、3’OHの非存在、および接近不可能な3’OHが挙げられる。末端が接近不可能な3’OHを有する、遮断する修飾の非限定的な例としては、アミノ修飾因子、アミノリンカー、スペーサー、イソデオキシ塩基、ジデオキシ塩基、逆方向ジデオキシ塩基、3’リン酸などが挙げられる。一部の実施形態では、足場アダプターまたはその成分は、天然ヌクレオチドに結合することができない1つまたは複数の修飾ヌクレオチドを含む。
【0125】
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-グアニン(イソ-dG)を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、イソデオキシ-シトシン(イソ-dC)を含む。イソ-dCおよびイソ-dGは、それぞれ、シトシンおよびグアニンの化学的バリアントである。イソ-dCは、イソ-dGと水素結合することができるが、未修飾グアニン(天然グアニン)とはできない。イソ-dGは、イソ-dCと塩基対合することができるが、未修飾シトシン(天然シトシン)とはできない。イソ-dCを含有する骨格アダプターまたはその成分を、イソ-dGを含有する相補的オリゴとハイブリダイズするが、天然に存在するいずれの核酸配列ともハイブリダイズすることができないように、設計することができる。
【0126】
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、メチル化、ヒドロキシメチル化およびカルボキシル化を含むがこれらに限定されない、エピジェネティクス関連修飾を含む。エピジェネティクス関連修飾の例としては、カルボキシシトシン、5-メチルシトシン(5mC)およびその酸化誘導体(例えば、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)、および5-カルボニルシトシン(arboxylcytosine)(5caC))、N(6)-メチルアデニン(6mA)、N4-メチルシトシン(4mC)、N(6)-メチルアデノシン(m(6)A)、プソイドウリジン(Ψ)、5-メチルシチジン(m(5)C)、ヒドロキシメチルウラシル、3’末端の2’-O-メチル化、tRNA修飾、miRNA修飾、およびsnRNA修飾が、挙げられる。
【0127】
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、ジデオキシ-シトシンを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ-塩基を含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、逆方向ジデオキシ-チミンを含む。例えば、配列の5’末端に位置する逆方向ジデオキシ-チミンは、望ましくない5’ライゲーションを防止することができる。
【0128】
一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、スペーサーを含む。一部の実施形態では、1つまたは複数の修飾ヌクレオチドは、C3スペーサーを含む。C3スペーサーホスホロアミダイトをオリゴヌクレオチドの内部にまたは5’末端に組み込むことができる。複数のC3スペーサーを骨格アダプターまたはその成分のどちらかの末端に付加させて、長い親水性スペーサーアームを(例えば、フルオロフォアまたは他のペンダント基の結合のために)導入することができる。他のスペーサーとしては、例えば、光切断性(PC)スペーサー、ヘキサンジオール、スペーサー9、スペーサー18、1’,2’-ジデオキシリボース(dSpacer)などが挙げられる。
【0129】
一部の実施形態では、修飾ヌクレオチドは、アミノリンカーまたはアミノ遮断剤を含む。一部の実施形態では、修飾ヌクレオチドは、アミノリンカーC6(例えば、5’アミノリンカーC6または3’アミノリンカーC6)を含む。一例では、アミノリンカーC6を使用して、活性一級アミノ基をオリゴヌクレオチドの5’末端に組み込むことができる。次いで、これをリガンドにコンジュゲートすることができる。すると、アミノ基は、5’末端リガンドに内在化される。アミノ基は、アミノ基とオリゴとの立体相互作用を低減させるように6炭素スペーサーアームによって5’末端ヌクレオチド塩基から離隔される。一部の実施形態では、修飾ヌクレオチドは、アミノリンカーC12(例えば、5’アミノリンカーC12または3’アミノリンカーC12)を含む。一例では、アミノリンカーC12を使用して、活性一級アミノ基をオリゴヌクレオチドの5’末端に組み込むことができる。アミノ基は、アミノ基とオリゴとの立体相互作用を最小にするように12炭素スペーサーアームによって5’末端ヌクレオチド塩基から離隔される。
【0130】
一部の実施形態では、修飾ヌクレオチドは、結合対のメンバーを含む。結合対は、例えば、抗体/抗原、抗体/抗体、抗体/抗体断片、抗体/抗体受容体、抗体/プロテインAもしくはプロテインG、ハプテン/抗ハプテン、ビオチン/アビジン、ビオチン/ストレプトアビジン、葉酸/葉酸結合タンパク質、ビタミンB12/内因子、化学反応性基/相補的化学反応性基、ジゴキシゲニン部分/抗ジゴキシゲニン抗体、フルオレセイン部分/抗フルオレセイン抗体、ステロイド/ステロイド結合タンパク質、オペレーター/リプレッサー、ヌクレアーゼ/ヌクレオチド、レクチン/多糖、活性化合物/活性化合物受容体、ホルモン/ホルモン受容体、酵素/基質、オリゴヌクレオチドもしくはポリヌクレオチド/その対応する補体など、またはこれらの組合せを含み得る。一部の実施形態では、修飾ヌクレオチドは、ビオチンを含む。
【0131】
一部の実施形態では、修飾ヌクレオチドは、結合対の第1のメンバー(例えば、ビオチン)を含み、結合対の第2のメンバー(例えば、ストレプトアビジン)は、固体支持体または基板にコンジュゲートされている。固体支持体または基板は、マイクロアレイおよびウェルにより提供される表面、ならびに粒子、例えば、ビーズ(例えば、常磁性ビーズ、磁気ビーズ、マイクロビーズ、ナノビーズ)、微小粒子およびナノ粒子を含むがこれらに限定されない、結合対のメンバーを直接または間接的に結合することができる任意の物理的に分離可能な固体であり得る。固体支持体は、例えば、チップ、カラム、光ファイバー、拭き取り繊維、フィルター(例えば、平面フィルター)、1つもしくは複数のキャピラリー、ガラスおよび改質もしくは機能化ガラス(例えば、細孔制御ガラス(CPG))、石英、雲母、ジアゾ化膜(紙もしくはナイロン)、ポリホルムアルデヒド、セルロース、酢酸セルロース、紙、セラミックス、金属、半金属、半導体材料、量子ドット、被覆ビーズもしくは粒子、他のクロマトグラフ材料、磁気粒子;プラスチック(アクリル樹脂、ポリスチレン、スチレンもしくは他の材料のコポリマー、ポリブチレン、ポリウレタン、TEFLON(登録商標)、ポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、ポリフッ化ビニリデン(PVDF)などを含む)、多糖、ナイロンもしくはニトロセルロース、樹脂、シリカ、もしくはシリコン、シリカゲルおよび変性シリコンを含む、シリカに基づく材料、Sephadex(登録商標)、Sepharose(登録商標)、炭素、金属(例えば、鋼、金、銀、アルミニウム、ケイ素および銅)、無機ガラス、導電性ポリマー(ポリピロールおよびポリインドールなどのポリマーを含む);マイクロもしくはナノ構造化表面、例えば、核酸タイリングアレイ、ナノチューブ、ナノワイヤ、もしくはナノ粒子装飾表面;または多孔質表面、またはゲル、例えば、メタクリレート、アクリルアミド、糖ポリマー、セルロース、シリケート、または他の繊維状もしくは鎖状ポリマーも含み得る。一部の実施形態では、固体支持体または基板は、デキストラン、アクリルアミド、ゼラチンまたはアガロースなどの、ポリマーを含む、任意の数の材料を用いた不動態または化学的誘導体化コーティングを使用して、被覆することができる。ビーズおよび/または粒子は、ばらばらの状態であることもあり、または互いにつながっている(例えば、焼結されている)こともある。一部の実施形態では、固体支持体は、粒子の集合体であることができる。一部の実施形態では、粒子は、シリカを含むことができ、シリカは、二酸化ケイ素を含み得る。一部の実施形態では、シリカは、多孔質であることができ、ある特定の実施形態では、シリカは、無孔質であることができる。一部の実施形態では、粒子は、粒子に常磁性特性を付与する薬剤をさらに含む。ある特定の実施形態では、薬剤は、金属を含み、ある特定の実施形態では、薬剤は、酸化鉄(例えば、鉄または酸化鉄、ここでの酸化鉄は、Fe2+とFe3+の混合物を含有する)である。結合対のメンバーを共有結合によりまたは非共有結合性相互作用により固体支持体に連結させることができ、直接または間接的に(例えば、スペーサー分子もしくはビオチンなどの仲介物質によって)固体支持体に連結させることができる。
【0132】
一部の実施形態では、足場ポリヌクレオチド、オリゴヌクレオチド成分(例えば、UMI、および/またはUMIに隣接している隣接領域)、または両方は、ヌクレオチドアナログとも呼ばれる、1つまたは複数の非天然ヌクレオチドを含む。足場ポリヌクレオチド、オリゴヌクレオチド成分、または両方に含まれることがある、非天然ヌクレオチドの非限定的な例としては、LNA(ロックド核酸)、PNA(ペプチド核酸)、FANA(2’-デオキシ-2’-フルオロアラビノヌクレオチド)、GNA(グリコール核酸)、TNA(トレオース核酸)、2’-O-Me RNA、2’-フルオロRNA、モルホリノヌクレオチド、およびこれらの任意の組合せが挙げられる。
【0133】
末端処理
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、末端処理活性を有する薬剤とを、一本鎖核酸(ssNA)分子が処理される条件下で接触させるステップを含み、それによって、末端処理されたssNA組成物が生成される。末端処理は、リン酸化、脱リン酸化、メチル化、脱メチル化、酸化、脱酸化、塩基修飾、伸長、重合、およびこれらの組合せを含み得るが、それらに限定されない。末端処理は、酵素を用いて行なうことができ、そのような酵素としては、リガーゼ、ポリヌクレオチドキナーゼ(PNK)、ターミナルトランスフェラーゼ、メチルトランスフェラーゼ、メチラーゼ(例えば、3’メチラーゼ、5’メチラーゼ)、ポリメラーゼ(例えば、ポリAポリメラーゼ)、オキシダーゼ、およびこれらの組合せが挙げられるが、それらに限定されない。
【0134】
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、ホスファターゼ活性を有する薬剤とを、一本鎖核酸(ssNA)分子が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化されたssNA組成物が生成される。一部の実施形態では、本明細書における方法は、足場アダプターまたはその成分と、ホスファターゼ活性を有する薬剤とを、足場アダプターまたはその成分が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された足場アダプターまたはその成分(例えば、脱リン酸化されたオリゴヌクレオチド;脱リン酸化された足場ポリヌクレオチド)が生成される。一般に、ssNA組成物、および/または足場アダプターもしくはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)脱リン酸化される。ssNAは、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでその後にリン酸化されることがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、次いでリン酸化されないことがある。足場アダプター、またはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)、脱リン酸化され、リン酸化されず、次いで、結合させるステップの後(すなわち、ハイブリダイゼーションの後)かつライゲーションステップの前またはライゲーションステップ中にリン酸化されることがある。核酸の脱リン酸化を行うための試薬およびキットは、公知であり、入手可能である。例えば、標的核酸(例えば、ssNA)および/または足場アダプターもしくはそれらの成分を、ホスファターゼ(すなわち、水を使用してリン酸モノエステルを切断してリン酸イオンとアルコールにする酵素)で処理することができる。
【0135】
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化されたssNA組成物と、ホスホリル転移活性を有する薬剤とを、5’リン酸がssNAの5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、足場アダプターまたはその成分と、リン酸転移活性を有する薬剤とを、5’リン酸が足場アダプターまたはその成分の5’末端に付加される条件下で接触させるステップを含む。一部の実施形態では、本明細書における方法は、脱リン酸化された足場アダプターまたはその成分と、ホスホリル酸転移活性を有する薬剤とを、5’リン酸が足場アダプターまたはその成分の5’末端に付加される条件下で接触させるステップを含む。ある特定の事例では、ssNA組成物、および/または足場アダプターもしくはそれらの成分は、結合させるステップの前に(すなわち、ハイブリダイゼーションの前に)リン酸化される。核酸の5’リン酸化を様々な手法で行うことができる。例えば、ATPのγ位からポリヌクレオチド(二本鎖および一本鎖DNAおよびRNA)の5’-ヒドロキシル末端およびヌクレオシド3’一リン酸へのPiの転移および交換を触媒するポリヌクレオチドキナーゼ(PNK)(例えば、T4 PNK)で、ssNA組成物、および/または足場アダプターもしくはそれらの成分を処理することができる。好適な反応条件としては、例えば、核酸と、PNKの、1×PNK反応緩衝剤(例えば、70mM Tris-HCl、10mM MgCl2、5mM DTT、25℃でpH7.6)中、30分間、37℃でのインキュベーション;および核酸と、PNKの、T4 DNAリガーゼ緩衝剤(例えば、50mM Tris-HCl、10mM MgCl2、1mM ATP、10mM DTT、25℃でpH7.5)中、30分間、37℃でのインキュベーションが挙げられる。必要に応じて、リン酸化反応後に、PNKを、例えば65℃で20分間、熱不活性化してもよい。
【0136】
一部の実施形態では、本明細書における方法は、ホスホリル転移活性を有する薬剤の使用を含まない。一部の実施形態では、方法は、核酸試料からのssNAの5’末端をリン酸化することにより5’リン酸化されたssNAを生成するステップを含まない。ある特定の事例は、核酸試料は、自然にリン酸化された5’末端を有するssNAを含む。一部の実施形態では、方法は、足場アダプターまたはそれらの成分の5’末端をリン酸化することにより5’リン酸化された足場アダプターまたはそれらの成分を生成するステップを含まない。
【0137】
切断
一部の実施形態では、ssNA、足場アダプター、および/またはハイブリダイゼーション産物(例えば、ssNAとハイブリダイズされた足場アダプター)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、ssNA、足場アダプター、および/またはハイブリダイゼーション産物は、切断部位で切断またはせん断される。一部の実施形態では、足場アダプターおよび/またはハイブリダイゼーション産物は、ヘアピンループ内の切断部位で切断またはせん断される。一部の実施形態では、足場アダプターおよび/またはハイブリダイゼーション産物は、足場アダプターの内部位置の(例えば、足場アダプターの二重鎖領域内の)切断部位で切断またはせん断される。一部の実施形態では、足場アダプターは、足場ポリヌクレオチド上にしか存在せず相補的オリゴヌクレオチド成分上には存在しない内部位置にある切断部位(例えば、ウラシル)で切断される。したがって、一部の実施形態では、足場ポリヌクレオチドは、1つまたは複数ウラシル塩基を含み、オリゴヌクレオチド成分は、ウラシル塩基を含まない。一部の実施形態では、環状ハイブリダイゼーション産物は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。一部の実施形態では、核酸、例えば、環状核酸および/または大きい断片(例えば、長さが500塩基対より長い)は、本明細書に記載される方法の前に、間に、または後に切断またはせん断される。大きい断片は、高分子量(HMW)核酸、HMW DNAまたはHMW RNAと呼ばれることがある。HMW核酸断片は、約500bp、約600bp、約700bp、約800bp、約900bp、約1000bp、約2000bp、約3000bp、約4000bp、約5000bp、約10,000bpより長い、またはそれより長い断片を含み得る。用語「せん断すること」または「切断」は、核酸分子を2つの(またはそれより多くの)より小さい核酸分子に分断することができる手順または条件を一般に指す。そのようなせん断または切断は、配列特異的、塩基特異的、または非特異的であり得、例えば、化学的、酵素的、および物理的(例えば、物理的断片化)を含む、様々な方法、試薬または条件により果たすことができる。せん断または切断された核酸は、約5~約10,000塩基対、約100~約1,000塩基対、約100~約500塩基対、または約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000もしくは9000塩基対の長さの名目値、代表値または平均値を有し得る。
【0138】
せん断または切断された核酸を好適な方法により生成することができ、そのような方法の非限定的な例としては、物理的方法(例えば、せん断、例えば、音波処理、超音波処理、フレンチプレス、熱、UV照射など)、酵素的プロセス(例えば、酵素的切断作用因子(例えば、好適なヌクレアーゼ、好適な制限酵素)、化学的方法(例えば、アルキル化、DMS、ピペリジン、酸加水分解、塩基加水分解、熱など、もしくはこれらの組合せ)、紫外(UV)線(例えば、光切断性部位(例えば、光切断性スペーサーを含む))など、またはこれらの組合せが挙げられる。結果として得られる核酸断片の長さ代表値、平均値または名目値は、適切な断片生成方法を選択することにより制御することができる。
【0139】
用語「切断剤」は、一般に、核酸を1つまたは複数の特異的または非特異的部位で切断することができる薬剤、ときには、化学物質または酵素を指す。多くの場合、特異的切断剤は、特定のヌクレオチド配列に従って、切断部位と呼ばれることがある特定の部位で、特異的に切断する。切断剤は、酵素的切断剤、化学的切断剤、および光(例えば、紫外(UV)線)を含み得る。
【0140】
酵素的切断作用因子の例としては、限定ではないが、エンドヌクレアーゼ;デオキシリボヌクレアーゼ(DNase;例えば、DNase I、II);リボヌクレアーゼ(RNase;例えば、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse V);エンドヌクレアーゼVIII;CLEAVASE酵素;TAQ DNAポリメラーゼ;E.coli DNAポリメラーゼI;真核生物の構造特異的エンドヌクレアーゼ;マウスFEN-1エンドヌクレアーゼ;ニッキング酵素;I、IIまたはIII型制限エンドヌクレアーゼ(すなわち、制限酵素)、例えば、Acc I、AciI、Afl III、Alu I、Alw44 I、Apa I、Asn I、Ava I、Ava II、BamH I、Ban II、Bcl I、Bgl I. Bgl II、Bln I、Bsm I、BssH II、BstE II、BstUI、Cfo I、CIa I、Dde I、Dpn I、Dra I、EcIX I、EcoR I、EcoR I、EcoR II、EcoR V、Hae II、Hae II、HhaI、Hind II、Hind III、Hpa I、Hpa II、Kpn I、Ksp I、MaeII、McrBC、Mlu I、MIuN I、Msp I、Nci I、Nco I、Nde I、Nde II、Nhe I、Not I、Nru I、Nsi I、Pst I、Pvu I、Pvu II、Rsa I、Sac I、Sal I、Sau3A I、Sca I、ScrF I、Sfi I、Sma I、Spe I、Sph I、Ssp I、Stu I、Sty I、Swa I、Taq I、Xba I、Xho I;グリコシラーゼ(例えば、ウラシル-DNAグリコシラーゼ(UDG)、3-メチルアデニンDNAグリコシラーゼ、3-メチルアデニンDNAグリコシラーゼII、ピリミジンヒドレート-DNAグリコシラーゼ、FaPy-DNAグリコシラーゼ、チミンミスマッチ-DNAグリコシラーゼ(例えば、ヒポキサンチン-DNAグリコシラーゼ、ウラシルDNAグリコシラーゼ(UDG)、5-ヒドロキシメチルウラシルDNAグリコシラーゼ(HmUDG)、5-ヒドロキシメチルシトシンDNAグリコシラーゼ、または1,N6-エテノ-アデニンDNAグリコシラーゼ);エキソヌクレアーゼ(例えば、エキソヌクレアーゼI、エキソヌクレアーゼII、エキソヌクレアーゼIII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII);5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII);3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI);ポリ(A)特異的3’→5’エキソヌクレアーゼ;リボザイム;DNAザイム;など、およびこれらの組合せが挙げられる。
【0141】
一部の実施形態では、切断部位は、制限酵素認識部位を含む。一部の実施形態では、切断作用因子は、制限酵素を含む。一部の実施形態では、切断部位は、レアカッター制限酵素認識部位(例えば、NotI認識配列)を含む。一部の実施形態では、切断作用因子は、レアカッター酵素(例えば、レアカッター制限酵素)を含む。レアカッター酵素は、ゲノム(例えば、ヒトゲノム)に極めてまれに存在する認識配列を有する制限酵素を一般に指す。一例は、5’-GCGGCCGC-3’配列の最初のGCの後で切断するNotIである。7および8塩基対認識配列を有する制限酵素は、多くの場合、レアカッター酵素と考えられる。
【0142】
DNAを特異的部位で切断するための切断方法および制限酵素を選択するための手順は、当業者に周知である。例えば、New England BioLabs、Pro-Mega Biochems、Boehringer-Mannheimなどを含む、多くの制限酵素供給業者は、特異的制限酵素により切断されるDNA配列の条件およびタイプに関する情報を提供している。酵素は、約95%~100%の効率で、好ましくは約98%~100%の効率で、DNAの切断を可能にすることになる条件下で使用されることが多い。
【0143】
一部の実施形態では、切断部位は、1つまたは複数のリボ核酸(RNA)ヌクレオチドを含む。一部の実施形態では、切断部位は、1つまたは複数のRNAヌクレオチドを含む一本鎖部分を含む。一部の実施形態では、一本鎖部分は、二重鎖部分と隣接している。一部の実施形態では、一本鎖部分は、ヘアピンループである。一部の実施形態では、切断部位は、1つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、2つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、3つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、4つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、5つより多くのRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)から選択される1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、ウラシル(U)を含まない。一部の実施形態では、切断部位は、グアニン(G)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、グアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)を含む1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、を、アデニン(A)およびシトシン(C)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、アデニン(A)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断部位は、シトシン(C)およびグアニン(G)からなる1つまたは複数のRNAヌクレオチドを含む。一部の実施形態では、切断作用因子は、リボヌクレアーゼ(RNAse)を含む。一部の実施形態では、RNAseは、エンドリボヌクレアーゼである。RNAseは、RNAse A、RNAse E、RNAse F、RNAse H、RNAse III、RNAse L、RNAse P、RNAse PhyM、RNAse T1、RNAse T2、RNAse U2、およびRNAse Vのうちの1つまたは複数から選択することができる。
【0144】
一部の実施形態では、切断部位は、光切断性スペーサーまたは光切断性修飾を含む。光切断性修飾は、例えば、特異的波長(例えば、300~350nm)の紫外(UV)線により切断可能である光解離性官能基を含み得る。光切断性スペーサーの例(Integrated DNA Technologiesから入手可能;製品番号1707)は、適切なスペクトル範囲内のUV線に曝露された場合にのみ切断され得る、10原子リンカーアームである。光切断性スペーサーを含むオリゴヌクレオチドは、後のリガーゼ反応に利用可能である5’リン酸基を有することができる。光切断性スペーサーを、DNA塩基間に配置することができ、またはオリゴと末端修飾(例えばフルオロフォア)の間に配置することができる。そのような実施形態では、紫外(UV)線を切断作用因子と考えることができる。
【0145】
一部の実施形態では、切断部位は、ジオールを含む。例えば、切断部位は、5’と5’の連結で組み込まれた隣接ジオールを含むことがある。ジオールを含む切断部位は、例えば過ヨウ素酸塩を使用して、化学的に切断することができる。一部の実施形態では、切断部位は、平滑末端制限酵素認識部位を含む。平滑末端制限酵素認識部位を含む切断部位は、平滑末端制限酵素により切断することができる。
【0146】
ニックシールおよびフィルイン
一部の実施形態では、本明細書における方法は、ニックシール反応を行うステップ(例えば、DNAリガーゼまたは他の好適な酵素、およびある特定の事例では、核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK)を使用する)を含む。一部の実施形態では、本明細書における方法は、フィルイン反応を行うステップを含む。例えば、足場アダプターが二重鎖として存在する場合、二重鎖の一部またはすべては、ssNAとハイブリダイズする末端の反対側のその二重鎖の末端にオーバーハングを含み得る。そのような二重鎖オーバーハングが存在する場合、本明細書における方法は、結合させるステップの後に、二重鎖により形成されたオーバーハングをフィルインするステップをさらに含み得る。一部の実施形態では、フィルイン反応は、平滑末端化ハイブリダイゼーション産物を生成するために行われる。フィルイン反応を行うために任意の好適な試薬を使用することができる。フィルイン反応を行うために好適なポリメラーゼとしては、例えば、DNAポリメラーゼI、DNAポリメラーゼIの大きい(クレノウ)断片、T4 DNAポリメラーゼ、Bacillus stearothermophilus(Bst)DNAポリメラーゼ、熱安定性DNAポリメラーゼ(例えば、超高熱性海洋性古細菌からのもの)、9°N(商標)DNAポリメラーゼ(GENBANK受託番号AAA88769.1)、THERMINATORポリメラーゼ(突然変異:D141A、E143A、A485Lを有する、9°N(商標)DNAポリメラーゼ)などが挙げられる。一部の実施形態では、鎖置換ポリメラーゼが使用される(例えば、Bst DNAポリメラーゼ)。
【0147】
エキソヌクレアーゼ処理
一部の実施形態では、核酸(例えば、RNA-DNA二重鎖、ハイブリダイゼーション産物、環状化ハイブリダイゼーション産物)は、エキソヌクレアーゼで処理される。一部の実施形態では、RNA-DNA二重鎖(例えば、第1鎖cDNA合成により生成されたRNA-DNA二重鎖)中のRNAは、エキソヌクレアーゼで処理される。エキソヌクレアーゼは、3’または5’末端のどちらかにおけるホスホジエステル結合を切断する加水分解反応によってポリヌクレオチド鎖の末端から1つずつヌクレオチドを切断することにより作用する酵素である。エキソヌクレアーゼは、例えば、DNAse、RNAse(例えば、RNAseH)、5’→3’エキソヌクレアーゼ(例えば、エキソヌクレアーゼII)、3’→5’エキソヌクレアーゼ(例えば、エキソヌクレアーゼI)、およびポリ(A)特異的3’→5’エキソヌクレアーゼを含む。一部の実施形態では、エキソヌクレアーゼ活性は、逆転写酵素により提供される(例えば、完全機能性RNAseHドメインを有するM-MLV逆転写酵素により提供されるRNAse活性)。一部の実施形態では、ハイブリダイゼーション産物は、例えば、一本鎖オリゴヌクレオチド、核酸断片、またはRNA-DNA二重鎖からのRNAなどの、夾雑核酸を除去するために、エキソヌクレアーゼで処理される。一部の実施形態では、環状化ハイブリダイゼーション産物は、一切の非環状化ハイブリダイゼーション産物、ハイブリダイズされていないオリゴヌクレオチド、ハイブリダイズされていない標的核酸、オリゴヌクレオチドダイマーなど、およびこれらの組合せを除去するために、エキソヌクレアーゼで処理される。
【0148】
試料
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。本明細書に記載される方法および組成物において利用される核酸または核酸混合物は、対象(例えば、被検対象)から得た試料から単離することができる。対象は、ヒト、非ヒト動物、植物、細菌、真菌、原生生物または病原体を含むがこれらに限定されない、任意の生命体または非生命体であり得る。任意のヒトまたは非ヒト動物を選択することができ、任意のヒトまたは非ヒト動物としては、例えば、哺乳動物、爬虫類、鳥類、両生類、魚類、有蹄動物、反芻動物、ウシ亜科の動物(例えば、ウシ)、ウマ科の動物(例えば、ウマ)、ヤギ亜科の動物およびヒツジ属の動物(例えば、ヒツジ、ヤギ)、イノシシ属の動物(例えば、ブタ)、ラクダ科の動物(例えば、ラクダ、ラマ、アルパカ)、サル、類人猿(例えば、ゴリラ、チンパンジー)、クマ科の蹠行性肉食動物(例えば、クマ)、家禽、イヌ、ネコ、マウス、ラット、魚類、イルカ、クジラおよびサメを挙げることができる。対象は、雄であってもよく、または雌(例えば、女性、もしくは妊婦)であってもよい。対象は、いかなる年齢(例えば、胚、胎児、乳幼児、小児、成人)であってもよい。対象は、がん患者、がんの罹患が疑われる患者、寛解期の患者、がんの家族歴を有する患者、および/またはがんスクリーニングを受ける対象であり得る。対象は、感染症もしくは感染性疾患に罹患しているまたは病原体(例えば、細菌、ウイルス、真菌、原生動物など)に感染した患者、感染症もしくは感染性疾患の罹患または病原体による感染が疑われる患者、感染症、感染性疾患または病原体感染から回復した患者、感染症歴、感染性疾患歴、病原体感染歴がある患者、および/あるいは感染性疾患または病原体スクリーニングを受ける対象であり得る。対象は、移植レシピエントであり得る。対象は、マイクロバイオーム解析を受けている患者であり得る。一部の実施形態では、被検対象は、雌である。一部の実施形態では、被検対象は、ヒト雌である。一部の実施形態では、被検対象は、雄である。一部の実施形態では、被検対象は、ヒト雄である。
【0149】
核酸試料を、任意のタイプの好適な生物検体または試料(例えば、被検試料)から単離することまたは得ることができる。核酸試料を、単一細胞、複数の細胞(例えば、培養細胞)、細胞培養培地、馴化培地、組織、臓器、または生物(例えば、細菌、酵母など)から単離することまたは得ることができる。一部の実施形態では、核酸試料は、動物(例えば、動物対象)の細胞、組織、臓器および/またはこれらに類するものから単離されるかまたは得られる。一部の実施形態では、核酸試料は、細菌、酵母、昆虫(例えば、ショウジョウバエ)、哺乳動物、両生類(例えば、カエル(例えば、ツメガエル))、ウイルス、植物、または任意の他の哺乳動物もしくは非哺乳動物の核酸試料源などの、供給源から単離されるかまたは得られる。
【0150】
核酸試料を、現存生物または動物から単離することまたは得ることができる。一部の事例では、核酸試料を、絶滅した(または「古代」)生物または動物(例えば、絶滅した哺乳動物;ヒト属からの絶滅した哺乳動物)から単離することまたは得ることができる。一部の事例では、核酸試料を、診断分析の一部として得ることができる。
【0151】
一部の事例では、核酸試料を、法医学分析の一部として得ることができる。一部の実施形態では、本明細書に記載される一本鎖核酸ライブラリー調製(ssPrep)方法は、法医学試料または検体に適用される。法医学試料または検体は、核酸を含有するあらゆる生物学的物質を含み得る。例えば、法医学試料または検体は、血液、精液、毛髪、皮膚、汗、唾液、分解された組織、骨、指の爪の擦過物、舐められた切手/封筒、剥離物、タッチDNA、カミソリ残留物などを含み得る。
【0152】
試料または被検試料は、対象またはその一部(例えば、ヒト対象、妊娠している雌、がん患者、感染症または感染性疾患に罹患している患者、移植レシピエント、胎児、腫瘍、感染臓器または組織、移植臓器または組織、マイクロバイオーム)から単離されるまたは得られ任意の検体であり得る。試料は、任意の妊娠期(例えば、ヒト対象については妊娠初期、妊娠中期または妊娠後期)の胎児を宿している妊娠している雌対象からのものであることもあり、出産後の対象からのものであることもある。試料は、すべての染色体が正倍数性である胎児を宿している妊娠している対象からのものであることもあり、染色体異数性(例えば、染色体の1、3(すなわち、トリソミー(例えば、T21、T18、T13))もしくは4つのコピー)または他の遺伝的変異を有する胎児を宿している妊娠している対象からのものであることもある。検体の非限定的な例としては、血液もしくは血液製剤(例えば、血清、血漿など)、臍帯血、絨毛膜絨毛、羊水、脳脊髄液、脊髄液、洗浄液(例えば、気管支肺胞、胃、腹膜、管、耳、関節鏡視下)、生検試料(例えば、着床前胚;がん生検からのもの)、体腔穿刺試料、細胞(血液細胞、胎盤細胞、胚もしくは胎児細胞、胎児有核細胞もしくは胎児細胞遺残物、正常細胞、異常細胞(例えば、がん細胞))またはそれらの部分(例えば、ミトコンドリアのもの、核、抽出物など)、雌生殖管の洗液、尿、糞便、痰、唾液、鼻粘膜、前立腺液、洗浄、精液、リンパ液、胆汁、涙、汗、母乳、乳汁など、またはそれらの組合せを限定ではないが含む、対象からの体液または組織が挙げられる。一部の実施形態では、生体試料は、対象からの子宮頸部スワブである。核酸が抽出される体液または組織試料は、無細胞性(例えば、無細胞)であることがある。一部の実施形態では、体液または組織試料は、細胞要素または細胞遺残物を含有することがある。一部の実施形態では、胎児細胞またはがん細胞が試料に含まれていることがある。
【0153】
試料は、液体試料であることがある。液体試料は、細胞外核酸(例えば、循環無細胞DNA)を含むことがある。液体試料の例としては、血液もしくは血液製剤(例えば、血清、血漿など)、尿、脳脊髄液、唾液、痰、生検試料(例えば、がんの検出のための液体生検)、上記の液体試料など、またはこれの組合せが挙げられるがこれらに限定されない。ある特定の実施形態では、試料は、液体生検であり、液体生検は、疾患の存在、非存在、悪化または寛解についての対象からの液体試料の評定を一般に指す。液体生検を、固体生検(例えば、腫瘍生検)とともに、または固体生検(例えば、腫瘍生検)の代替法として、使用することができる。ある特定の事例では、細胞外核酸は、液体生検で解析される。
【0154】
一部の実施形態では、生体試料は、血液、血漿または血清であることがある。用語「血液」は、従来どおりの定義の、全血、血液製剤、または血液の任意の画分、例えば、血清、血漿、バフィーコートなどを包含する。血液またはその画分は、ヌクレオソームを含むことが多い。ヌクレオソームは、核酸を含み、無細胞であることもあり、または細胞内にあることもある。血液は、バフィーコートも含む。バフィーコートは、フィコール勾配を利用することにより単離されることもある。バフィーコートは、白血球(例えば、白血球細胞、T細胞、B細胞、血小板など)を含むことができる。血漿は、抗凝固薬で処理された血液の遠心分離の結果として得られる、全血の画分を指す。血清は、血液試料が凝固した後に残存する流体の水様部分を指す。体液または組織試料は、病院または診療所が一般に準拠する標準プロトコールに従って採取されることが多い。血液の場合、末梢血の適切な量(例えば、3~40ミリリットルの間、5~50ミリリットルの間)が採取されることが多く、調製前または後に標準的な手順に従って保管され得る。
【0155】
対象の血液中で見つかった核酸の解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、母体血中で見つかった胎児DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった腫瘍またはがんDNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、患者の血液中で見つかった病原体DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。例えば、移植レシピエントの血液中で見つかった移植DNAの解析を、例えば、全血、血清または血漿を使用して、行うことができる。対象(例えば、母体対象;患者;がん患者)から得た血液から血清または血漿を調製する方法は、公知である。例えば、対象の血液(例えば、妊婦の血液;患者の血液;がん患者の血液)を、EDTAを含有するチューブまたは専用市販製品、例えば、Cell-Free DNA BCT(Streck,Omaha,NE)またはVacutainer SST(Becton Dickinson、Franklin Lakes、N.J.)に入れて、血液凝固を防止することができ、次いで、血漿を全血から遠心分離によって得ることができる。血清は、血液凝固後の遠心分離を行ってまたは行わずに得ることができる。遠心分離が使用される場合には、遠心分離は、排他的にではないが、通常は、適切な速度、例えば、1,500~3,000回gで行われる。血漿または血清は、核酸抽出のために未使用のチューブに移す前に追加の遠心分離ステップに付されることがある。全血の無細胞性部分に加えて、細胞画分から、対象からの全血試料の遠心分離および血漿の除去後に得ることができるバフィーコート部分に多く含まれている核酸を回収することもできる。
【0156】
試料は、腫瘍核酸試料(すなわち、腫瘍から単離された核酸試料)であることがある。用語「腫瘍」は、悪性であるか良性であるかを問わず、新生物細胞成長および増殖を一般に指し、前がん性およびがん性細胞および組織を含み得る。用語「がん」および「がん性(の)」は、非調節細胞成長/増殖によって通常は特徴付けられる哺乳動物の生理的状態を一般に指す。がんの例としては、癌腫、リンパ腫、芽腫、肉腫、白血病、扁平上皮がん、小細胞肺がん、非小細胞肺がん、肺腺癌、肺扁平上皮癌、腹膜がん、肝細胞がん、消化管がん、膵臓がん、神経膠芽腫、子宮頸がん、卵巣がん、肝臓がん、膀胱がん、ヘパトーマ、乳がん、結腸がん、結腸直腸がん、子宮内膜または子宮癌、唾液腺癌、腎臓がん、肝臓がん、前立腺がん、外陰がん、甲状腺がん、肝癌、様々なタイプの頭頸部がんなどが挙げられるが、これらに限定されない。
【0157】
試料は、不均一であることがある。例えば、試料は、1つより多くの細胞型および/または1つもしくは複数の核酸種を含むことがある。一部の事例では、試料は、(i)胎児細胞と母体細胞、(ii)がん細胞と非がん細胞、および/または(iii)病原性細胞と宿主細胞を含むことがある。一部の事例では、試料は、(i)がん核酸と非がん核酸、(ii)病原体核酸と宿主核酸、(iii)胎児由来核酸と母体由来核酸、および/またはより一般的には、(iv)突然変異した核酸と野生型核酸を含むことがある。一部の事例では、試料は、下でさらに詳細に説明されるような、少数派核酸種と多数派核酸種を含むことがある。一部の事例では、試料は、単一の対象からの細胞および/もしくは核酸を含むこともあり、または複数の対象からの細胞および/もしくは核酸を含むこともある。
【0158】
核酸
核酸を処理および/または解析するための方法および組成物が、本明細書で提供される。核酸、核酸分子、核酸断片、標的核酸、核酸鋳型、鋳型核酸、核酸標的、標的核酸、ポリヌクレオチド、ポリヌクレオチド断片、標的ポリヌクレオチド、ポリヌクレオチド標的などの用語は、本開示を通して同義で使用され得る。これらの用語は、DNA(例えば、相補的DNA(cDNA;目的の任意のRNAまたはDNAから合成されたもの)、ゲノムDNA(gDNA)、ゲノムDNA断片、ミトコンドリアDNA(mtDNA)、組換えDNA(例えば、プラスミドDNA)など)、RNA(例えば、メッセンジャーRNA(mRNA)、短鎖抑制性RNA(siRNA)、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA、トランス作用性低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー・メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre-mRNA)、低分子カハール体特異的RNA(scaRNA)、piwi結合RNA(piRNA)、エンドリボヌクレアーゼ調製siRNA(esiRNA)、小分子RNA(stRNA)、シグナル認識RNA、テロメアRNA、胎児または胎盤により高度に発現されるRNAなど)、および/またはDNAもしくはRNAアナログ(例えば、塩基アナログ、糖アナログおよび/または非ネイティブ骨格などを含む)、RNA/DNAハイブリッドならびにポリアミド核酸(PNA)であって、すべてが、一本鎖または二本鎖形態であることがあり、別段の限定がない限り、天然に存在するヌクレオチドと同様に機能することができる天然ヌクレオチドの公知のアナログを包含し得る、これらのものなどからの、任意の組成の核酸を指す。核酸は、プラスミド、ファージ、ウイルス、細菌、自己複製配列(ARS)、ミトコンドリア、セントロメア、人工染色体、染色体であってもよく、またはこれらからのものであってもよく、あるいはある特定の実施形態ではin vitroでまたは宿主細胞、細胞、細胞の細胞核もしくは細胞質で複製し得るもしくは複製され得る他の核酸であってもよく、またはそのような他の核酸からのものであってもよい。一部の実施形態での鋳型核酸は、単一の染色体からのものであり得る(例えば、核酸試料は、二倍体生物から得られた試料の1つの染色体からのものであることがある)。特に制限がない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様に代謝される、天然ヌクレオチドの公知アナログを含む、核酸を包含する。別段の指示がない限り、特定の核酸配列は、明確に示される配列ばかりでなく、その保存的に修飾されたバリアント(例えば、縮重コドン置換)、対立遺伝子、オルソログ、一塩基多型(SNP)および相補配列も暗に包含する。具体的には、縮重コドン置換は、1つまたは複数の選択された(またはすべての)コドンの第3の位置が混合塩基および/またはデオキシイノシン残基で置換されている配列を生じさせることにより果たすことができる。核酸という用語は、遺伝子座、遺伝子、遺伝子によりコードされているcDNAおよびmRNAと同義で使用される。この用語は、ヌクレオチドアナログ、一本鎖(「センス」または「アンチセンス」、「プラス」鎖または「マイナス」鎖、「フォワード」リーディングフレームまたは「リバース」リーディングフレーム)および二本鎖ポリヌクレオチドから合成されたRNAまたはDNAの誘導体、バリアントおよびアナログも、同意義のものとして含み得る。用語「遺伝子」は、ポリペプチド鎖の産生に関与するDNAの一区画を指し;遺伝子産物の転写/翻訳におよび転写/翻訳の調節に関与するコード領域(リーダーおよびトレーラー)に先行するおよび続く領域、ならびに個々のコード領域(エクソン)間の介在配列(イントロン)を一般に含む。ヌクレオチドまたは塩基は、核酸のプリンおよびピリミジン分子単位(例えば、アデニン(A)、チミン(T)、グアニン(G)およびシトシン(C))を一般に指す。RNAについては、塩基チミンが、ウラシルに置き換えられる。核酸長またはサイズを、塩基の数で表すことができる。
【0159】
標的核酸は、目的の任意の核酸であり得る。核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せで構成されている任意の長さの、例えば、10塩基のまたはそれより長い、20塩基のまたはそれより長い、50塩基のまたはそれより長い、100塩基のまたはそれより長い、200塩基のまたはそれより長い、300塩基のまたはそれより長い、400塩基のまたはそれより長い、500塩基のまたはそれより長い、1000塩基のまたはそれより長い、2000塩基のまたはそれより長い、3000塩基のまたはそれより長い、4000塩基のまたはそれより長い、5000塩基のまたはそれより長いポリマーであり得る。ある特定の態様では、核酸は、デオキシリボヌクレオチド(すなわち、DNA塩基)、リボヌクレオチド(すなわち、RNA塩基)、またはこれらの組合せ、例えば、10塩基もしくはそれ未満、20塩基もしくはそれ未満、50塩基もしくはそれ未満、100塩基もしくはそれ未満、200塩基もしくはそれ未満、300塩基もしくはそれ未満、400塩基もしくはそれ未満、500塩基もしくはそれ未満、1000塩基もしくはそれ未満、2000塩基もしくはそれ未満、3000塩基もしくはそれ未満、4000塩基もしくはそれ未満、または5000塩基もしくはそれ未満で構成されている、ポリマーである。
【0160】
核酸は、一本鎖状であってもよく、または二本鎖状であってもよい。例えば、一本鎖DNA(ssDNA)は、例えば、加熱によりまたはアルカリでの処理により二本鎖DNAを変性させることによって生成することができる。したがって、一部の実施形態では、ssDNAは、二本鎖DNA(dsDNA)に由来する。一部の実施形態では、本明細書における方法は、dsDNAを含む核酸組成物と、本明細書における足場アダプターまたはその成分とを結合させるステップの前に、dsDNAを変性させるステップを含み、それによってssDNAが生成される。
【0161】
ある特定の実施形態では、核酸は、オリゴヌクレオチドまたはDNA様分子、例えばペプチド核酸(PNA)、による二重鎖DNA分子に対する鎖侵入によって形成される、D-ループ構造で存在する。例えば、当技術分野において公知の方法を使用する、E.Coli RecAタンパク質の付加によりおよび/または塩濃度の変更により、Dループ形成を助長することができる。
【0162】
核酸(例えば、核酸標的、一本鎖核酸(ssNA)、オリゴヌクレオチド、オーバーハング、足場ポリヌクレオチドおよびそれらのハイブリダイゼーション領域(例えば、ssNAハイブリダイゼーション領域、オリゴヌクレオチドハイブリダイゼーション領域))は、別の核酸に相補的であると、相補性領域を有すると、別の核酸とハイブリダイズすることができると、またはハイブリダイゼーション領域を有すると、本明細書に記載されることがある。用語「相補的」または「相補性」または「ハイブリダイゼーション」は、核酸の領域への非共有結合により塩基対合するヌクレオチド配列(例えば、ssNA断片の末端領域とハイブリダイズするssNAハイブリダイゼーション領域のヌクレオチド配列、および足場アダプターのオリゴヌクレオチド成分とハイブリダイズするオリゴヌクレオチドハイブリダイゼーション領域のヌクレオチド配列)を、一般に指す。標準ワトソン・クリック塩基対合では、DNAの場合、アデニン(A)は、チミン(T)と塩基対合を形成し、グアニン(G)は、シトシン(C)と対合する。RNAの場合、チミン(T)は、ウラシル(U)により置き換えられる。しかるが故に、Aは、Tに相補的であり、Gは、Cに相補的である。RNAの場合、Aは、Uに相補的であり、逆もまた同様である。DNA-RNA二重鎖の場合、A(DNA鎖中の)は、U(RNA鎖中の)に相補的である。一部の実施形態では、1つまたは複数のチミン(T)塩基は、足場アダプターまたはその成分中のウラシル(U)により置き換えられ、アデニン(A)に相補的である。通常は、「相補的」または「相補性」または「ハイブリダイズすることができる」は、少なくとも部分的に相補的であるヌクレオチド配列を指す。これらの用語は、完全に相補的であり、したがって、一方の鎖内のあらゆるヌクレオチドが、他方の鎖の対応する位置のあらゆるヌクレオチドと相補的であるかまたはハイブリダイズする、二重鎖も包含し得る。
【0163】
ある特定の事例では、ヌクレオチド配列は、標的に部分的に相補的であることがあり、この場合、すべてのヌクレオチドが、標的核酸中のすべての対応する位置のあらゆるヌクレオチドと相補的であるとは限らない。例えば、ssNAハイブリダイゼーション領域は、標的ssNA末端領域に完璧に(すなわち、100%)相補的であることもあり、またはssNAハイブリダイゼーション領域は、完璧とまではいかない(例えば、70%、75%、85%、90%、95%、99%である)ある程度の相補性を共有することもある。別の例では、オリゴヌクレオチドハイブリダイゼーション領域は、オリゴヌクレオチドに完璧に(すなわち、100%)相補的であることもあり、またはオリゴヌクレオチドハイブリダイゼーション領域は、完璧とまではいかない(例えば、70%、75%、85%、90%、95%、99%である)ある程度の相補性を共有することもある。
【0164】
2つのヌクレオチド配列の同一性パーセントは、最適な比較を目的として配列をアライメントすることにより決定することができる(例えば、最適なアライメントのために第1の配列の配列にギャップを導入することができる)。その場合、対応する位置のヌクレオチドが比較され、2配列間の同一性パーセントは、それらの配列により共有される同一の位置の数の関数である(すなわち、同一性%=同一の位置の数/位置の総数×100)。1つの配列内の位置が、他の配列内の対応する位置と同じヌクレオチドにより占有されている場合には、それらの分子は、その位置で同一である。
【0165】
一部の実施形態では、核酸の混合物中の核酸が解析される。核酸の混合物は、同じもしくは異なるヌクレオチド配列、異なる長さ、異なる起源(例えば、ゲノム起源、胎児対母体起源、細胞もしくは組織起源、がん対非がん起源、腫瘍対非腫瘍起源、宿主対病原体、宿主対移植片、宿主対マイクロバイオーム、試料起源、対象起源など)、異なるオーバーハング長、異なるオーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、オーバーハングなし)、またはこれらの組合せを有する、2つまたはそれより多くの核酸種を含むことができる。一部の実施形態では、核酸の混合物は、一本鎖核酸および二本鎖核酸を含む。一部の実施形態では、核酸の混合物は、DNAおよびRNAを含む。一部の実施形態では、核酸の混合物は、リボソームRNA(rRNA)およびメッセンジャーRNA(mRNA)を含む。本明細書に記載されるプロセスに供される核酸は、1つの試料からの、または2つもしくはそれより多くの試料からの(例えば、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、11もしくはそれより多くの、12もしくはそれより多くの、13もしくはそれより多くの、14もしくはそれより多くの、15もしくはそれより多くの、16もしくはそれより多くの、17もしくはそれより多くの、18もしくはそれより多くの、19もしくはそれより多くの、または20もしくはそれより多くの試料からの)核酸を含有することがある。
【0166】
一部の実施形態では、標的核酸(例えば、ssNA)は、分解されたDNAを含む。分解されたDNAは、低品質DNAまたは高度に分解されたDNAと呼ばれることがある。分解されたDNAは、高度に断片化されていることがあり、損傷部をミスコードしやすいおよび/または分子間架橋しやすい塩基アナログおよび脱塩基部位などの損傷を含むことがある。例えば、シトシン残基の脱アミノ化の結果として生じるシーケンシングの誤りは、分解されたDNAから得られるある特定の配列中に存在することがある(例えば、CをTとおよびGをAとミスコードすること)。一部の実施形態では、標的核酸(例えば、ssNA)は、ニックの入った二本鎖核酸断片に由来する。ニックの入った二本鎖核酸断片を変性(例えば、熱変性)させてssNA断片を生成することができる。
【0167】
核酸を当技術分野において公知の方法により1つまたは複数の供給源(例えば、生体試料、血液、細胞、血清、血漿、バフィーコート、尿、リンパ液、皮膚、毛髪、土壌など)から得ることができる。任意の好適な方法を、生体試料から(例えば、血液または血液製剤から)のDNAの単離、抽出および/または精製に使用することができ、この方法の非限定的な例としては、DNA調製方法(例えば、Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed., 2001に記載されている)、様々な市販の試薬もしくはキット、例えば、Qiagen,Inc.(Germantown、Md)によるDNeasy(登録商標)、RNeasy(登録商標)、QIAprep(登録商標)、QIAquick(登録商標)およびQIAamp(登録商標)(例えば、QIAamp(登録商標)Circulating Nucleic Acid Kit、QiaAmp(登録商標)DNA Mini KitまたはQiaAmp(登録商標)DNA Blood Mini Kit)核酸単離/精製キット;GenomicPrep(商標)Blood DNA Isolation Kit(Promega、Madison、Wis.);GFX(商標)Genomic Blood DNA Purification Kit(Amersham、Piscataway、N.J.);Life Technologies,Inc.(Carlsbad、CA)によるDNAzol(登録商標)、ChargeSwitch(登録商標)、Purelink(登録商標)、GeneCatcher(登録商標)核酸単離/精製キット;Clontech Laboratories,Inc.(Mountain View、CA)によるNucleoMag(登録商標)、NucleoSpin(登録商標)およびNucleoBond(登録商標)核酸単離/精製キット;など、またはこれらの組合せが挙げられる。ある特定の態様では、核酸は、固定された生体試料、例えば、ホルマリン固定、パラフィン包埋(FFPE)組織から、単離される。FFPE組織からのゲノムDNAは、市販のキット-例えば、Qiagen,Inc.(Germantown、Md)によるAllPrep(登録商標)DNA/RNA FFPEキット、Life Technologies,Inc.(Carlsbad、CA)によるFFPE用RecoverAll(登録商標)Total Nucleic Acid Isolationキット、およびClontech Laboratories,Inc.(Mountain View、CA)によるNucleoSpin(登録商標)FFPEキット-を使用して単離することができる。
【0168】
一部の実施形態では、核酸は、細胞溶解手順を使用して細胞から抽出される。細胞溶解手順および試薬は、当技術分野において公知であり、一般に、化学的方法(例えば、界面活性剤、低張溶液、酵素的手順など、もしくはこれらの組合せ)、物理的方法(例えば、フレンチプレス、音波処理など)、または電解溶解法により行われ得る。任意の好適な溶解手順を利用することができる。例えば、化学的方法は、一般に、溶解剤を利用して細胞を破壊し、細胞から核酸を抽出し、その後、カオトロピック塩で処理する。物理的方法、例えば、凍結/解凍、続いての粉砕、細胞プレスの使用なども、有用である。一部の事例では、高塩および/またはアルカリ溶解手順が利用されることがある。一部の事例では、溶解手順は、EDTA/プロテイナーゼKでの溶解ステップ、大量の塩(例えば、グアニジン塩酸塩(GuHCl)、酢酸ナトリウム)およびイソプロパノールを用いる結合緩衝ステップ、およびこの溶液中のDNAをシリカに基づくカラムに結合させるステップを含み得る。一部の事例では、溶解プロトコールは、Dabney et al., Proceedings of the National Academy of Sciences 110, no. 39 (2013): 15758-15763に記載されている、ある特定の手順を含む。
【0169】
核酸は、ある特定の実施形態では細胞外核酸を含むことができる。用語「細胞外核酸」は、本明細書で使用される場合、実質的に細胞を有さない供給源から単離された核酸を指すことができ、「無細胞」核酸(無細胞DNA、無細胞RNA、または両方)、「循環無細胞核酸」(例えば、CCF断片、ccfDNA)および/または「無細胞循環胞核酸」とも呼ばれる。細胞外核酸は、血液中に存在することができ、細胞外核酸を血液から(例えば、ヒト対象の血液から)得ることができる。細胞外核酸は、多くの場合、検出可能な細胞を含まず、細胞要素または細胞遺残物を含有し得る。細胞外核酸の無細胞性供給源の非限定的な例は、血液、血漿、血清および尿である。ある特定の態様では、無細胞核酸は、全血、血漿、血清、羊水、唾液、尿、胸膜滲出液、気管支洗浄、気管支吸引物、母乳、初乳、涙、精液、腹水、胸膜滲出液、および便から選択される体液試料から得られる。本明細書で使用される場合、用語「無細胞循環試料核酸を得る」は、試料を直接得ること(例えば、試料、例えば被検試料、を採取すること)、または試料を採取した別の者から試料を得ることを含む。細胞外核酸は、細胞の分泌および/または核酸放出(例えば、DNA放出)の産物であることがある。細胞外核酸は、例えば、任意の形態の死細胞の産物であることがある。一部の事例では、細胞外核酸は、有糸分裂性、膨化性、毒性、虚血性のものなど、およびこれらの組合せを含む、任意の形態のI型またはII型細胞死の産物である。理論により制限されるものではないが、細胞外核酸は、細胞アポトーシスおよび細胞破壊の産物であることがあり、これは、スペクトル(例えば「ラダー」)にわたって一連の長さを有することが多い細胞外核酸の基礎を提供する。一部の事例では、細胞外核酸は、細胞壊死、ネクロプトーシス(necropoptosis)、膨化死、エントーシス、ピロトーシス(pyrotosis)など、およびこれらの組合せの産物である。一部の実施形態では、被検対象からの試料核酸は、循環無細胞核酸である。一部の実施形態では、循環無細胞核酸は、被検対象からの血漿または血清からのものである。一部の態様では、無細胞核酸は、分解されている。一部の実施形態では、無細胞核酸は、無細胞胎児核酸(例えば、無細胞胎児DNA)を含む。ある特定の態様では、無細胞核酸は、循環がん核酸(例えば、がんDNA)を含む。ある特定の態様では、無細胞核酸は、循環腫瘍核酸(例えば、腫瘍DNA)を含む。一部の実施形態では、無細胞核酸は、感染性因子核酸(例えば、病原体DNA)を含む。一部の実施形態では、無細胞核酸は、移植片からの核酸(例えば、DNA)を含む。一部の実施形態では、無細胞核酸は、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)からの核酸(例えば、DNA)を含む。
【0170】
無細胞DNA(cfDNA)は、分解された供給源に由来することがあり、多くの場合、抽出された場合にわずかな量のDNAしか提供しない。一本鎖DNA(ssDNA)ライブラリーを生成するための本明細書に記載される方法は、cfDNAから大量の短いDNA断片を捕捉することができる。例えば、がん試料からのcfDNAは、短い断片のより高度な集団を有する傾向がある。ある特定の事例では、cfDNA中の短い断片を、ヌクレオソームではなく転写因子によって生じる断片について濃縮することができる。
【0171】
細胞外核酸は、異なる核酸種を含むことがあり、したがって、ある一定の実施形態では「不均一」と本明細書では呼ばれる。例えば、腫瘍またはがんに罹患している人物からの血清または血漿は、腫瘍細胞またはがん細胞(例えば、新生物)からの核酸と、非腫瘍細胞または非がん細胞からの核酸とを含み得る。別の例では、妊娠している雌からの血清または血漿は、母体核酸と胎児核酸を含み得る。別の例では、感染症または感染性疾患に罹患している患者からの血清または血漿は、宿主核酸と感染因子または病原体核酸とを含み得る。別の例では、移植を受けたことがある対象からの試料は、宿主核酸とドナー臓器または組織からの核酸とを含み得る。一部の事例では、がん核酸、腫瘍核酸、胎児核酸、病原体核酸、または移植片核酸は、全核酸の約5%~約50%であることもある(例えば、全核酸の約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48または49%が、がん、腫瘍、胎児、病原体、移植片またはマイクロバイオーム核酸である)。別の例では、不均一核酸は、2またはそれより多くの対象(例えば、犯行現場からの試料)からの核酸を含み得る。
【0172】
少なくとも2つの異なる核酸種が、細胞外核酸中に異なる量で存在することがあり、これらの核酸種は、少数派種および多数派種と呼ばれることがある。ある特定の事例では、核酸の少数派種は、罹患細胞型(例えば、がん細胞、消耗細胞、免疫系による攻撃を受けた細胞)からのものである。ある特定の実施形態では、遺伝的変異または遺伝的変更(例えば、コピー数変更、コピー数変異、一塩基変更、一塩基変異、染色体変更、および/または転座)が、少数派核酸種について判定される。ある特定の実施形態では、遺伝的変異または遺伝的変更が、多数派核酸種について判定される。一般に、用語「少数派」または「多数派」は、いかなる点についても厳格に定義されることを意図したものでない。一態様では、例えば、「少数派」と考えられる核酸は、試料中の全核酸の少なくとも約0.1%から試料中の全核酸の50%未満までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約1%から試料中の全核酸の約40%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約2%から試料中の全核酸の約30%までの存在量を有することができる。一部の実施形態では、少数派核酸は、試料中の全核酸の少なくとも約3%から試料中の全核酸の約25%までの存在量を有することができる。例えば、少数派核酸は、試料中の全核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%または30%の存在量を有することができる。一部の事例では、細胞外核酸の少数派種は、全核酸の約1%~約40%であることもある(例えば、核酸の約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%または40%が、少数派種核酸である)。一部の実施形態では、少数派核酸は、細胞外DNAである。一部の実施形態では、少数派核酸は、アポトーシス組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞がアポトーシスを遂げた組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、壊死組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、内部の一部の細胞が壊死を遂げた組織からの細胞外DNAである。壊死は、ある特定の事例では、細胞死の後の死後プロセスを指すことがある。一部の実施形態では、少数派核酸は、細胞増殖性障害(例えば、がん)に罹患した組織からの細胞外DNAである。一部の実施形態では、少数派核酸は、腫瘍細胞からの細胞外DNAである。一部の実施形態では、少数派核酸は、細胞外胎児DNAである。一部の実施形態では、少数派核酸は、病原体からの細胞外DNAである。一部の実施形態では、少数派核酸は、移植片からの細胞外DNAである。一部の実施形態では、少数派核酸は、マイクロバイオームからの細胞外DNAである。
【0173】
別の態様では、例えば、「多数派」と考えられる核酸は、試料中の全核酸の50%を超える存在量から試料中の全核酸の約99.9%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約60%から試料中の全核酸の約99%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約70%から試料中の全核酸の約98%までの存在量を有することができる。一部の実施形態では、多数派核酸は、試料中の全核酸の少なくとも約75%から試料中の全核酸の約97%までの存在量を有することができる。例えば、多数派核酸は、試料中の全核酸の少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の存在量を有することができる。一部の実施形態では、多数派核酸は、細胞外DNAである。一部の実施形態では、多数派核酸は、細胞外母体DNAである。一部の実施形態では、多数派核酸は、健康な組織からのDNAである。一部の実施形態では、多数派核酸は、非腫瘍細胞からのDNAである。一部の実施形態では、多数派核酸は、宿主細胞からのDNAである。
【0174】
一部の実施形態では、細胞外核酸の少数派種は、約500塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約500塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約300塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約300塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約250塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約250塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約200塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約200塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約150塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約150塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約100塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約100塩基対またはそれ未満の長さのものである)。一部の実施形態では、細胞外核酸の少数派種は、約50塩基対またはそれ未満の長さのものである(例えば、少数派種核酸の約80、85、90、91、92、93、94、95、96、97、98、99または100%は、約50塩基対またはそれ未満の長さのものである)。
【0175】
核酸は、核酸を含有する試料の処理の有無にかかわらず、本明細書に記載される方法の実施に供することができる。一部の実施形態では、核酸は、核酸を含有する試料の処理後に、本明細書に記載される方法の実施に供される。例えば、核酸を試料から抽出、単離、精製、部分的に精製、または増幅することができる。用語「単離された」は、本明細書で使用される場合、その元の環境(例えば、それが天然に存在する場合には天然環境、または外因的に発現される場合には宿主細胞)から除去された核酸を指し、したがって、その元の環境からヒトの介入により(例えば、「人間の手により」)変更されている。用語「単離された核酸」は、本明細書で使用される場合、対象(例えば、ヒト対象)から除去された核酸を指すことができる。供給源試料に存在する成分の量より少ない非核酸成分(例えば、タンパク質、脂質)を有する、単離された核酸を提供することができる。単離された核酸を含む組成物は、約50%~99%を超える非核酸成分不含であり得る。単離された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸を精製手順に付す前に存在する非核酸成分の量より少ない非核酸成分(例えば、タンパク質、脂質、炭水化物)を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える他の非核酸成分不含であり得る。用語「精製された」は、本明細書で使用される場合、核酸が由来する試料源中より少ない核酸種を含有する、提供される核酸を指すことができる。精製された核酸を含む組成物は、約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99%を超える他の核酸種不含であり得る。例えば、胎児核酸を、母体核酸と胎児核酸とを含む混合物から精製することができる。ある特定の例では、核酸の小さい断片(例えば、30~500bp断片)を、異なる長さの核酸断片を含む混合物から精製または部分的に精製することができる。ある特定の例では、核酸のより小さい断片を含むヌクレオソームを、核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、核酸のより大きい断片を含むより大きいヌクレオソーム複合体を、核酸のより小さい断片を含むヌクレオソームから精製することができる。ある特定の例では、胎児核酸の小さい断片(例えば、30~500bp断片)を、胎児核酸断片と母体核酸断片の両方を含む混合物から精製または部分的に精製することができる。ある特定の例では、胎児核酸のより小さい断片を含むヌクレオソームを、母体核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。ある特定の例では、がん細胞核酸を、がん細胞核酸と非がん細胞核酸とを含む混合物から精製することができる。ある特定の例では、がん細胞核酸のより小さい断片を含むヌクレオソームを、非がん核酸のより大きい断片を含むより大きいヌクレオソーム複合体の混合物から精製することができる。一部の実施形態では、核酸は、核酸を含有する試料の事前の処理なしで、本明細書に記載される方法の実施に供される。例えば、事前の抽出、精製、部分的精製、および/または増幅なしで、試料から直接核酸を解析することができる。
【0176】
核酸を増幅条件下で増幅することができる。用語「増幅される」または「増幅」または「増幅条件」は、本明細書で使用される場合、標的核酸(例えば、ssNA)またはその一部と同じまたは実質的に同じヌクレオチド配列を有するアンプリコン核酸を直線的にまたは指数関数的に生成するプロセスに試料中の標的核酸(例えば、ssNA)または本明細書中の方法により生成された核酸産物を付すことを指す。ある特定の実施形態では、用語「増幅される」または「増幅」または「増幅条件」は、ポリメラーゼ連鎖反応(PCR)を含む方法を指す。ある特定の事例では、増幅産物は、核酸鋳型配列の増幅ヌクレオチド領域より1つまたは複数多いヌクレオチドを含有することができる(例えば、プライマーは、核酸鋳型遺伝子分子に相補的なヌクレオチドに加えて転写開始配列などの「余分な」ヌクレオチドを含有することができ、その結果、増幅産物は、核酸鋳型遺伝子分子の増幅ヌクレオチド領域に対応しない「余分な」ヌクレオチドまたはヌクレオチドを含有することになる)。
【0177】
核酸は、本明細書に記載される方法に核酸を供する前に、核酸中のある特定のヌクレオチドを修飾するプロセスに曝露され得る。例えば、内部のヌクレオチドのメチル化状態に基づいて核酸を選択的に修飾するプロセスを核酸に適用することができる。加えて、高温、紫外線照射、X線照射などの条件は、核酸分子の配列の変化を誘導することができる。核酸を、配列解析を行うのに有用な任意の好適な形態で提供することができる。
【0178】
一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、修飾されない。一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸の長さも組成も修飾することなく、足場アダプターまたはそれらの成分と結合されることを意味する。例えば、標的核酸(例えば、ssNA)は、短縮されないこともあり(例えば、それらは、制限酵素とも、ヌクレアーゼとも、長さを低減させる物理的条件(例えば、せん断条件、切断条件)とも接触されない)、長さが1つまたは複数のヌクレオチドだけ増加されないこともある(例えば、末端は、オーバーハング位置でフィルインされない;ヌクレオチドが末端に付加されない)。標的核酸(例えば、ssNA)の一方または両方の末端へのリン酸基または化学反応性基の付加は、一般に、核酸の修飾とも、核酸の長さの修飾とも見なされない。ssNA断片を生成するための二本鎖核酸(dsNA)断片の変性は、一般に、核酸の修飾とも、核酸の長さの修飾とも見なされない。
【0179】
一部の実施形態では、標的核酸(例えば、ssNA)の一方または両方のネイティブ末端は、ssNAが本明細書における足場アダプターまたはそれらの成分と結合される場合に存在する。ネイティブ末端は、一般に、核酸断片の未修飾断片を指す。一部の実施形態では、標的核酸(例えば、ssNA)のネイティブ末端は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、長さに関して修飾されない。この文脈での「修飾されない」は、標的核酸が試料から単離され、次いで、標的核酸のネイティブ末端の長さを修飾せずに足場アダプターまたはそれらの成分と結合されることを意味する。例えば、標的核酸(例えば、ssNA)は、長さが1ヌクレオチドも複数ヌクレオチドも短縮されず(例えば、それらは、非ネイティブ末端を生成するために、制限酵素とも、ヌクレアーゼとも、長さを低減する物理的条件(例えば、せん断条件、切断条件)とも接触されず)かつ増加されない(例えば、ネイティブ末端は、オーバーハングでフィルインされない;ヌクレオチドがネイティブ末端に付加されない)。標的核酸のネイティブ末端の一方または両方へのリン酸基または化学反応性基の付加は、一般に、核酸の長さの修飾と見なされない。
【0180】
一部の実施形態では、標的核酸(例えば、ssNA)は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、切断剤(例えば、エンドヌクレアーゼ、エキソヌクレアーゼ、制限酵素)および/またはポリメラーゼと接触していない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に、機械的せん断(例えば、超音波処理(例えば、CovarisによるAdaptive Focused Acoustics(商標)(AFA)プロセス))に付されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にエキソヌクレアーゼ(例えば、DNAse)と接触していない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に増幅されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に固体支持体に結合されない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に別の分子にコンジュゲートされない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にベクターにクローニングされない。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前に脱リン酸化に付されることがある。一部の実施形態では、標的核酸は、本明細書における足場アダプターまたはそれらの成分と結合させるステップの前にリン酸化に付されることがある。
【0181】
一部の実施形態では、標的核酸(例えば、ssNA)と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、および単離された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、本明細書における足場アダプターまたはそれらの成分を脱リン酸化すること、および単離された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることを含む。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、足場アダプターまたはそれらの成分を脱リン酸化すること、およびリン酸化された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることを含む。
【0182】
一部の実施形態では、標的核酸(例えば、ssNA)と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、および単離された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、足場アダプターまたはそれらの成分を脱リン酸化すること、および単離された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、およびリン酸化された標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させることからなる。一部の実施形態では、標的核酸と本明細書における足場アダプターまたはそれらの成分とを結合させるステップは、標的核酸を単離すること、単離された標的核酸を脱リン酸化すること、脱リン酸化された標的核酸をリン酸化すること、足場アダプターまたはそれらの成分を脱リン酸化すること、およびリン酸化された標的核酸と脱リン酸化された本明細書における足場アダプターまたはそれらの脱リン酸化された成分とを結合させることからなる。
【0183】
オーバーハング
標的核酸は、1つのオーバーハングを(例えば、核酸断片の末端に)含むこともあり、2つのオーバーハングを(例えば、核酸断片の両方の末端に)含むこともある。核酸オーバーハングは、異なるオーバーハング長、および/または異なるオーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、オーバーハングなし)を含むことができる。標的核酸は、2つのオーバーハング、1つのオーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含むことがある。標的核酸は、2つの3’オーバーハング、2つの5’オーバーハング、1つの3’オーバーハングと1つの5’オーバーハング、1つの3’オーバーハングと1つの平滑末端、1つの5’オーバーハングと1つの平滑末端、2つの平滑末端、またはこれらの組合せを含むことがある。一部の場合には、二本鎖核酸中のオーバーハングを、さらなる処理の前に(例えば、変性させるステップの前に)、伸長する(すなわち、フィルインする)ことができる。
【0184】
一部の実施形態では、標的核酸中のオーバーハングは、ネイティブオーバーハングである。一部の実施形態では、伸長の前の標的核酸中のオーバーハングは、ネイティブオーバーハングである。一部の実施形態では、標的核酸末端は、ネイティブ平滑末端である。ネイティブオーバーハングおよびネイティブ平滑末端は、伸長前の、変性前の、および/または本明細書に記載される足場アダプターもしくはその成分と結合させるステップの前の、修飾されていない(例えば、伸長されていない、フィルインされていない、切断も消化も(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)されていない、付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。多くの場合、ネイティブオーバーハングおよびネイティブ平滑末端は、伸長前の、変性前の、および/または本明細書に記載される足場アダプターもしくはその成分と結合させるステップの前の、ex vivoで修飾されていない(例えば、ex vivoで伸長されていない、ex vivoでフィルインされていない、ex vivoで切断も消化も(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)されていない、ex vivoで付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。ある特定の事例では、ネイティブオーバーハングおよびネイティブ平滑末端は、伸長前の、変性前の、および/または本明細書に記載される足場アダプターもしくはその成分と結合させるステップの前の、対象または供給源から収集後に修飾されていない(例えば、対象または供給源からの収集後に伸長されていない、対象または供給源からの収集後にフィルインされていない、対象または供給源からの収集後に(例えば、エンドヌクレアーゼまたはエキソヌクレアーゼにより)切断も消化もされていない、対象または供給源からの収集後に付加されても、付加してもいない)、オーバーハングおよび平滑末端を一般に指す。ネイティブオーバーハングおよびネイティブ平滑末端は、単離された試料と切断剤(例えば、エンドヌクレアーゼ、エキソヌクレアーゼ、制限酵素)および/またはポリメラーゼとを接触させることにより作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、機械的せん断(例えば、超音波(例えば、CovarisによるAdaptive Focused Acoustics(商標)(AFA)プロセス))により作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、単離された試料とエキソヌクレアーゼ(例えば、DNAse)とを接触させることにより作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、増幅(例えば、ポリメラーゼ連鎖反応)により作出されたオーバーハング/末端を、一般に含まない。ネイティブオーバーハングおよびネイティブ平滑末端は、固体支持体に結合された、別の分子のコンジュゲートされた、またはベクターにクローニングされたオーバーハング/末端を、一般に含まない。一部の実施形態では、ネイティブオーバーハングおよびネイティブ平滑末端は、脱リン酸化に付されることがあり、脱リン酸化されたネイティブオーバーハングおよび脱リン酸化されたネイティブ平滑末端と呼ばれることがある。一部の実施形態では、ネイティブオーバーハングおよびネイティブ平滑末端は、リン酸化に付されることがあり、リン酸化されたネイティブオーバーハングおよびリン酸化されたネイティブ平滑末端と呼ばれることがある。
【0185】
一部の実施形態では、本明細書における方法は、伸長条件下で、標的核酸を含む核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップを含む。伸長条件は、核酸を伸長するために好適な酵素、緩衝剤、試薬および温度を含む。伸長活性を有する薬剤は、ポリメラーゼ(例えば、DNAポリメラーゼI、DNAポリメラーゼIの大きい(クレノウ)断片、T4 DNAポリメラーゼ、Bacillus stearothermophilus(Bst)DNAポリメラーゼ、熱安定性DNAポリメラーゼ(例えば、超高熱性海洋性古細菌からのもの)、9°N(商標)DNAポリメラーゼ(GENBANK受託番号AAA88769.1)、THERMINATORポリメラーゼ(突然変異:D141A、E143A、A485Lを有する、9°N(商標)DNAポリメラーゼ)など)であり得る。一部の実施形態では、伸長活性を有する薬剤は、THERMINATORポリメラーゼである。一部の実施形態では、伸長活性を有する薬剤は、ヌクレアーゼ活性を有さないポリメラーゼである。一部の実施形態では、伸長活性を有する薬剤は、3’→5’エキソヌクレアーゼ活性を有さないポリメラーゼである。したがって、一部の実施形態では、エキソヌクレアーゼ活性を有さないポリメラーゼは、標的核酸中のいずれの一本鎖部分も消化することなく標的核酸オーバーハングをフィルインするために選択される。
【0186】
一部またはすべての標的核酸は、オーバーハングを含む二本鎖核酸(dsNA)を含み得る。一部またはすべての標的核酸は、オーバーハングを含む二本鎖DNA(dsDNA)を含み得る。オーバーハングを含む標的核酸は、二重鎖領域および一本鎖オーバーハングを含み得る。少なくとも1つのオーバーハングを有する標的核酸は、オーバーハングがフィルインされ、平滑末端が生成されるように、伸長され得る。伸長された標的核酸は、オーバーハング(すなわち、伸長前の標的核酸中に存在するオーバーハング)に相補的な伸長領域を含み得る。一部の実施形態では、伸長領域は、1つまたは複数の特徴的なヌクレオチドを含む。
【0187】
オーバーハングを、特徴的なヌクレオチドを使用してフィルインすることができる。特徴的なヌクレオチド(特徴的な塩基とも呼ばれる)は、一般に、標的核酸中のヌクレオチドと区別することができる任意の好適なヌクレオチドを指す。特徴的なヌクレオチドの非限定的な例としては、ユニバーサル塩基(例えば、イノシン、デオキシイノシン、2’-デオキシイノシン(dI、dInosine)、ニトロインドール、5-ニトロインドール、および3-ニトロインドール)、修飾塩基(例えば、本明細書に記載される修飾ヌクレオチド)、メチル化塩基(例えば、メチルシトシン)、核酸アナログもしくは人工核酸(例えば、キセノ核酸(XNA)、ペプチド核酸(PNA)、モルホリノ、ロックド核酸(LNA)、グリコール核酸(GNA)、トレオース核酸(TNA))、または別様に検出可能に標識された塩基が挙げられる。特徴的なヌクレオチドの使用は、フィルインされた領域についてのその後の同定を可能にすることができ、それによって、オーバーハング領域(例えば、ネイティブオーバーハング)の検出が可能になる。例えば、特徴的なヌクレオチドをシーケンシング中に(例えば、ナノポアシーケンシングによって)検出することができる。適切なポリメラーゼ酵素(例えば、THERMINATORポリメラーゼ酵素)を用いて、特徴的なヌクレオチドを組み込むことができる。
【0188】
一部の実施形態では、伸長領域は、1つまたは複数の特徴的なヌクレオチドを含む。一部の実施形態では、伸長領域は、特徴的なヌクレオチドからなる。そのような実施形態では、オーバーハングは、すべての特徴的なヌクレオチドでフィルインされる。一部の実施形態では、伸長領域は、すべての特徴的なヌクレオチドではないが、1つまたは複数の特徴的なヌクレオチドを含む。そのような実施形態では、塩基のすべての種ではないが、1つまたは複数の種が、特徴的なヌクレオチドで(例えば、シトシンのみ、例えばメチルシトシンで)フィルインされる。すべての特徴的な塩基の使用は、ある特定の実施形態では、オーバーハング領域の正確な一塩基分解同定を可能にし得る。すべての特徴的なヌクレオチドではないが、1つまたは複数の特徴的なヌクレオチドの使用は、ある特定の実施形態では、特徴的な最近接塩基への空間的分解によってオーバーハング領域の同定を可能にし得る。
【0189】
フィルインされたオーバーハングを有する核酸を、例えば、本明細書で論じられる方法により、シーケンシングのためにさらに処理および調製することができる。一部の場合には、フィルインされたオーバーハングを有する核酸を、ナノポアシーケンシングのために調製することができる。ナノポアシーケンシング調製は、シーケンシングのために複数の核酸をコンカテマー化してより長い核酸にすることを含む。コンカテマー化は、異なる試料核酸を表示または強調するアダプターまたはスペーサーの使用を含み得る。あるいは、コンカテマー化は、試料核酸を直接接続することができ、同じコンカテマー中の異なる試料核酸をオーバーハングの検出により(例えば、特徴的な塩基の検出により)または他のインフォマティクス手段によりデコンボリューションすることができる。ナノポアシーケンシング調製は、ヘアピンアダプターなどのナノポアシーケンシングアダプターを結合させることを含み得る。ヘアピンアダプターの使用は、両方の鎖を接続することができ、その結果、2本の単鎖配列の容易な関連付けが可能になる - 例えば、ユニバーサル塩基(例えば、イノシン)を特徴的な塩基として使用した場合、2本の鎖を接続することによって、オーバーハング配列を対応する相補配列から決定することが可能になり得る。相補鎖配列を、シーケンシング後に、例えば、配列および/または長さのマッチに基づいて、インフォマティクス的に関連付けることもできる。
【0190】
一本鎖核酸
専用アダプター(例えば、シーケンシングライブラリーを生成するための)を使用して一本鎖核酸(ssNA)を捕捉するための方法および組成物が、本明細書で提供される。一本鎖核酸またはssNAは、それらの長さの70%またはそれより高い%にわたって一本鎖状態である(すなわち、分子間ハイブリダイゼーションも分子内ハイブリダイゼーションもしていない)ポリヌクレオチドの一群を一般に指す。一部の実施形態では、ssNAは、ポリヌクレオチドの長さの75%もしくはそれより高い%、80%もしくはそれより高い%、85%もしくはそれより高い%、90%もしくはそれより高い%、95%もしくはそれより高い%、または99%もしくはそれより高い%にわたって一本鎖状態である。ある特定の態様では、ssNAは、ポリヌクレオチドの全長にわたって一本鎖状体である。一本鎖核酸は、本明細書では標的核酸と呼ばれることがある。
【0191】
ssNAは、一本鎖デオキシリボ核酸(ssDNA)を含み得る。一部の実施形態では、ssDNAは、二本鎖DNA(dsDNA)に由来するssDNAを含むが、これに限定されない。例えば、ssDNAは、ssDNAを生成するように変性される(例えば、熱変成される、および/または化学的に変性される)二本鎖DNAから得られる。一部の実施形態では、本明細書における方法は、ssDNAと本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップの前に、dsDNAを変性させることによりssDNAを生成するステップを含む。
【0192】
一部の実施形態では、ssNAは、一本鎖リボ核酸(ssRNA)を含む。RNAは、例えば、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、トランス作用性低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、リボソームRNA(rRNA)、転移RNA(tRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー・メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre-mRNA)、低分子カハール体特異的RNA(scaRNA)、piwi結合RNA(piRNA)、エンドリボヌクレアーゼ調製(endoribonucleaseprepared)siRNA(esiRNA)、小分子RNA(stRNA)、シグナル認識RNA、テロメアRNA、リボザイム、またはこれらの組合せを含み得る。一部の実施形態では、ssNAが、ssRNAである場合、ssRNAは、mRNAである。一部の実施形態では、ssNAは、一本鎖相補DNA(cDNA)を含む。
【0193】
一部の実施形態では、本明細書における方法は、ssNAと一本鎖核酸結合剤とを接触させるステップを含む。一部の実施形態では、本明細書における方法は、ssNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssNAを生成するステップを含む。一部の実施形態では、本明細書における方法は、sscDNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合sscDNAを生成するステップを含む。一部の実施形態では、本明細書における方法は、ssDNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssDNAを生成するステップを含む。一部の実施形態では、本明細書における方法は、ssRNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssRNAを生成するステップを含む。SSBは、一般に、共同的にssNAに結合し、通常は二本鎖核酸(dsNA)にはあまり結合しない。ssDNAに結合すると、SSBは、ヘリックス二重鎖を不安定化する。SSBは、原核生物SSB(例えば、細菌もしくは古細菌SSB)であることもあり、または真核生物SSBであることもある。SSBの例としては、E.coli SSB、E.coli RecA、高度熱安定性一本鎖DNA結合タンパク質(ET SSB)、Thermus thermophilus(Tth)RecA、T4遺伝子32タンパク質、複製プロテインA(RPA-真核生物SSB)などを挙げることができる。ET SSB、Tth RecA、E.coli RecA、T4遺伝子32タンパク質、さらに、そのようなSSBを使用してSSB結合ssNAを調製するための緩衝剤および詳細なプロトコールは、市販されている(New England Biolabs,Inc.(Ipswich、MA))。
【0194】
一部の実施形態では、本明細書における方法は、ssNAと一本鎖核酸結合タンパク質(SSB)とを接触させてSSB結合ssNAを生成するステップを含まない。したがって、本明細書における方法は、SSB結合ssNAを生成するステップを省略することができる。例えば、本明細書における方法は、ssNAとSSBとを接触させることなく、ssNAと、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含むことがある。そのような事例では、本明細書における方法は、核酸ライブラリーを生成するための「SSB不使用の」方法と呼ばれることがある。本明細書に記載されるある特定のSSB不使用の方法は、図面に示され、実施例で論じられるように、SSBを使用して調製されるライブラリーのパラメーターと同様のパラメーターを有するライブラリーを生成することができる。一部の実施形態では、本明細書における方法は、ssNAと、SSB以外の一本鎖核酸結合剤とを接触させるステップを含む。そのような一本鎖核酸結合剤は、一本鎖核酸に安定的に結合することができ、核酸二重鎖の形成を防止することまたは低減させることができ、結合された核酸のライゲーションまたは別の方法での末端修飾をなお可能にすることができ、熱安定性であることができる。一本鎖核酸結合剤の例としては、トポイソメラーゼ、ヘリカーゼ、これらのドメイン、およびこれらのドメインを含む融合タンパク質が挙げられるが、それらに限定されない。
【0195】
一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)を含む核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)からなる核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一部の実施形態では、本明細書における方法は、一本鎖核酸(ssNA)から本質的になる核酸組成物と、本明細書に記載される足場アダプターまたはそれらの成分とを結合させるステップを含む。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、一般に、ssNAを含み、さらなるタンパク質も核酸成分も含まない。例えば、一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、二本鎖核酸(dsNA)を含まないこともあり、または低いパーセンテージのdsNA(例えば、10%未満のdsNA、5%未満のdsNA、1%未満のdsNA)を含むこともある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、タンパク質を含まないことがある。例えば、一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、一本鎖結合タンパク質(SSB)も、ssNAの安定化に有用な他のタンパク質も含まないことがある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、核酸組成物中に通常は存在する化学成分、例えば、緩衝剤、塩、アルコール、クラウディング剤(例えば、PEG)などを含むことがあり、核酸源(例えば、試料)または核酸抽出からの残留成分(例えば、核酸、タンパク質、細胞膜成分)を含むこともある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、1つまたは複数のリン酸(例えば、末端リン酸、5’末端リン酸)を有するssNA断片を含むことがある。一本鎖核酸(ssNA)「から本質的になる」核酸組成物は、1つまたは複数の修飾ヌクレオチドを含むssNA断片を含むこともある。
【0196】
核酸の濃縮
一部の実施形態では、核酸(例えば、細胞外核酸)は、核酸の部分集団または種について濃縮または相対的に濃縮される。核酸部分集団は、例えば、胎児核酸、母体核酸、がん核酸、腫瘍核酸、患者核酸、宿主核酸、病原体核酸、移植片核酸、マイクロバイオーム核酸、特定の長さもしくは長さの範囲の断片を含む核酸、または特定のゲノム領域(例えば、単一の染色体、染色体のセット、および/もしくはある特定の染色体領域)からの核酸を含むことができる。そのような濃縮された試料を、本明細書で提供される方法とともに使用することができる。したがって、ある特定の実施形態では、本技術の方法は、試料中の核酸の部分集団について濃縮するさらなるステップを含む。ある特定の実施形態では、正常組織(例えば、非がん細胞、宿主細胞)からの核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、母体核酸は、試料から選択的に(部分的に、実質的に、ほぼ完全に、または完全に)除去される。ある特定の実施形態では、特定の低コピー数種核酸(例えば、がん、腫瘍、胎児、病原体、移植片、マイクロバイオーム核酸)についての濃縮は、定量感度を改善することができる。試料を核酸の特定の種について濃縮する方法は、例えば、米国特許第6,927,028号、国際特許出願公開番号WO2007/140417、国際特許出願公開番号WO2007/147063、国際特許出願公開番号WO2009/032779、国際特許出願公開番号WO2009/032781、国際特許出願公開番号WO2010/033639、国際特許出願公開番号WO2011/034631、国際特許出願公開番号WO2006/056480、および国際特許出願公開番号WO2011/143659に記載されており、各々の全内容は、本文、表、式および図面すべてを含めて、参照により本明細書に組み込まれる。
【0197】
一部の実施形態では、核酸は、ある特定の標的断片種および/または参照断片種について濃縮される。ある特定の実施形態では、核酸は、下で説明される、1つまたは複数の長さに基づく分離方法を使用して、特異的核酸断片長または断片長範囲について濃縮される。ある特定の実施形態では、核酸は、本明細書に記載されるおよび/または当技術分野において公知の、1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。
【0198】
試料中の核酸部分集団について濃縮する方法の非限定的な例としては、核酸種間のエピジェネティックな差を利用する方法(例えば、参照により本明細書に組み込まれる米国特許出願公開第2010/0105049号に記載されている、メチル化に基づく胎児核酸濃縮方法);制限エンドヌクレアーゼにより多型配列を増強するアプローチ(例えば、参照により本明細書に組み込まれる米国特許出願公開第2009/0317818号に記載されている方法など);選択的酵素的消化アプローチ;大規模並列シグネチャーシーケンシング(MPSS)アプローチ;増幅(例えば、PCR)に基づくアプローチ(例えば、遺伝子座特異的増幅法、マルチプレックスSNP対立遺伝子PCRアプローチ;ユニバーサル増幅法);プルダウンアプローチ(例えば、ビオチン化ウルトラマープルダウン法);伸長およびライゲーションに基づく方法(例えば、分子反転プローブ(MIP)伸長およびライゲーション);およびこれらの組合せが挙げられる。
【0199】
一部の実施形態では、修飾された核酸を濃縮することができる。核酸修飾としては、カルボキシシトシン、5-メチルシトシン(5mC)およびその酸化誘導体(例えば、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)、および5-カルボキシルシトシン(arboxylcytosine)(5caC))、N(6)-メチルアデニン(6mA)、N4-メチルシトシン(4mC)、N(6)-メチルアデノシン(m(6)A)、プソイドウリジン(Ψ)、5-メチルシチジン(m(5)C)、ヒドロキシメチルウラシル、3’末端の2’-O-メチル化、tRNA修飾、miRNA修飾、およびsnRNA修飾が挙げられるが、これらに限定されない。1つまたは複数の修飾を含む核酸を、抗体に基づくプルダウンを含むがこれに限定されない様々な方法により、濃縮することができる。修飾された核酸の濃縮をdsDNAの変性の前または後に行うことができる。変性前の濃縮は、修飾を欠いていることがある相補鎖の濃縮ももたらすこともあるが、変性後の濃縮は、修飾を欠いている相補鎖を濃縮しない。
【0200】
一部の実施形態では、核酸は、本明細書に記載される1つまたは複数の配列に基づく分離方法を使用して、選択ゲノム領域(例えば、染色体)からの断片について濃縮される。配列に基づく分離は、目的の断片(例えば、標的および/または参照断片)に存在するが、試料の他の断片には実質的に存在しないかまたは他の断片のごくわずかな量(例えば、5%またはそれ未満)に存在する、ヌクレオチド配列に一般に基づく。一部の実施形態では、配列に基づく分離は、分離された標的断片および/または分離された参照断片を生じさせることができる。分離された標的断片および/または分離された参照断片は、核酸試料中に残存する断片から単離されることが多い。ある特定の実施形態では、分離された標的断片および分離された参照断片はまた、互いから単離される(例えば、別々のアッセイ区画で単離される)。ある特定の実施形態では、分離された標的断片および分離された参照断片は、一緒に単離される(例えば、同じアッセイ区画で単離される)。一部の実施形態では、未結合断片を別個に除去または分解または消化することができる。
【0201】
一部の実施形態では、足場アダプターは、標的核酸を濃縮するために使用される。例えば、足場アダプターを、ssNAハイブリダイゼーション領域内の塩基の一部またはすべてが定義されたまたは既知の塩基であるように、設計することができる。これらの足場アダプターは、足場アダプターssNAハイブリダイゼーション領域の定義されたまたは既知の塩基に相補的な配列を有する標的核酸と優先的にハイブリダイズすることができ、それによって、得られるライブラリー内の標的核酸が濃縮される。例えば、ssNAハイブリダイゼーション領域へのGCジヌクレオチドの組み入れを使用して、末端CG(CpGとも呼ばれる)ジヌクレオチドを有する標的核酸を濃縮することができる。足場アダプターssNAハイブリダイゼーション領域の長さの一部またはすべてを使用して、ヌクレアーゼ切断部位、遺伝子プロモーター領域、病原体配列、腫瘍関連配列および他のモチーフを含むがこれらに限定されない、任意の他の定義された配列を、同様に標的とすることができる。ある例では、ライブラリーは、非濃縮性の足場アダプターおよびCGジヌクレオチド濃縮性の足場アダプターを使用して調製された。濃縮を用いずに調製されたライブラリーの場合、リードの1.7%がCGで開始し、リードの1.1%がCGで終了した。濃縮を用いて調製されたライブラリーの場合、リードの5.2%がCGで開始し、リードの19.6%がCGで終了した。別の例では、RNA(例えば、宿主および病原体RNA)を含む試料は、目的の病原体RNAに特異的なプライマーを用いて逆転写されてcDNAを生成し、次いで、cDNAは、精製され、そして標準的な足場アダプター、または逆転写プライマーにより濃縮された領域に標的化されたssNAハイブリダイゼーション領域を有する足場アダプターの、どちらかを用い、本明細書で論じられるような一本鎖ライブラリー調製方法を用いて調製される。病原体DNAを同様に濃縮することができる。
【0202】
一部の事例では、5’または3’核酸末端における標的核酸配列は、定義されるかまたは既知である。他の事例では、足場アダプターを使用して、5’または3’核酸末端における目的の新規標的を識別することができる。目的の核酸配列またはパターンを、濃縮を用いてまたは用いずに足場アダプターライブラリー出力から特徴付けることができる。一部の事例では、5’、3’または両方の核酸末端における特異的配列または配列パターンを、特定の状態と関連付けることができる。そのような状態としては、病状、メチル化状態、および発現状態が挙げられるが、これらに限定されない。足場アダプターを使用して、試料と対照の間、例えば、がん患者からの無細胞DNAと健康な対照の間の、核酸末端における既知または新規標的配列の存在または相対存在量を定量化することができる。これらのデータを使用して、DNA末端における配列情報と所与の状態との間の関係を学習することができる。患者試料および健康な試料の十分に特徴付けられたデータセットを用いて訓練することにより、一例では、解析方法またはアルゴリズムを使用して、状態、または状態による移行を予測することができる。例えば、本発明者らは、急性骨髄性白血病(AML)を有する患者からのcfDNAに、非AML患者試料と比較して、5’および3’DNA末端におけるATジヌクレオチドの増加およびCpGジヌクレオチドの低減を認めた。この例では、分析ツールをcfDNA末端配列情報に関して使用して、AMLを発症する患者のリスクを予測することができる。
【0203】
一部の実施形態では、標的および/または参照断片を核酸試料から分離するために、選択的核酸捕捉プロセスが使用される。市販の核酸捕捉システムとしては、例えば、Nimblegen配列捕捉システム(Roche NimbleGen、Madison、WI);ILLUMINA BEADARRAYプラットフォーム(Illumina、San Diego、CA);Affymetrix GENECHIPプラットフォーム(Affymetrix、Santa Clara、CA);Agilent SureSelect Target Enrichment System(Agilent Technologies、Santa Clara、CA);および関連プラットフォームが挙げられる。そのような方法は、キャプチャーオリゴヌクレオチドと標的または参照断片のヌクレオチド配列の一部またはすべてとのハイブリダイゼーションを通常は含み、固相(例えば、固相アレイ)および/または溶液に基づくプラットフォームの使用を含み得る。キャプチャーオリゴヌクレオチド(「ベイト」と呼ばれることもある)を、それらが、選択されたゲノム領域もしくは遺伝子座からの核酸断片と、または核酸標的中の特定の配列と、優先的にハイブリダイズするように、選択または設計することができる。ある特定の実施形態では、ハイブリダイゼーションに基づく方法(例えば、オリゴヌクレオチドアレイを使用するもの)を使用して、ある特定の核酸配列を含有する断片について濃縮することができる。したがって、一部の実施形態では、核酸試料は、例えば、試料核酸中の選択された配列に相補的なキャプチャーオリゴヌクレオチドを使用して断片のサブセットを捕捉することにより、必要に応じて濃縮される。ある特定の事例では、捕捉された断片が増幅される。例えば、アダプターを含有する捕捉された断片を、アダプター配列に相補的なプライマーを使用して増幅して、アダプター配列に従ってインデックスが付加された、増幅された断片の一群を形成することができる。一部の実施形態では、核酸は、目的の領域を含有する断片の配列またはそれらの部分に相補的なオリゴヌクレオチド(例えば、PCRプライマ-)を使用する目的の1つまたは複数の領域の増幅により、選択ゲノム領域(例えば、染色体、遺伝子)からの断片について濃縮される。
【0204】
一部の実施形態では、核酸は、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮される。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法とともに行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。ある特定の事例では、長さに基づく分離アプローチは、例えば、選択的配列タグ付けアプローチ、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG)沈殿)、質量分析および/またはサイズ特異的核酸増幅を含み得る。
【0205】
一部の実施形態では、核酸は、1つまたは複数の核酸結合タンパク質に関連する断片が濃縮される。濃縮方法の例としては、クロマチン免疫沈降(ChIP)、架橋ChIP(XCHIP)、ネイティブChIP(NChIP)、ビーズ不使用のChIP、キャリアChIP(CChIP)、高速ChIP(qChIP)、迅速かつ定量的ChIP(Q2ChIP)、マイクロチップ(μChIP)、マトリックスChIP、病原体-ChIP(PAT-ChIP)、ChIP-エキソ、ChIP・オン・チップ、RIP-ChIP、HiChIP、ChIA-PET、およびHiChIRPが挙げられるが、これらに限定されない。
【0206】
一部の実施形態では、本明細書における方法は、RNA種の混合物中のRNA種を濃縮するステップを含む。例えば、本明細書における方法は、mRNAとリボソームRNA(rRNA)の混合物中に存在するメッセンジャーRNA(mRNA)を濃縮するステップを含み得る。任意の好適なmRNA濃縮方法を使用することができ、そのような方法としては、rRNA枯渇および/またはmRNA濃縮方法、例えば、磁気ビーズでのrRNA枯渇(例えば、試料からrRNAを枯渇させる、したがってmRNAを濃縮する、ために磁気ビーズと組み合わせてrRNA枯渇プローブを使用する、Ribo-zero(商標)、Ribominus(商標)およびMICROBExpress(商標))、オリゴ(dT)に基づくポリ(A)濃縮(例えば、BioMag(登録商標)Oligo(dT)20)、ヌクレアーゼに基づくrRNA枯渇(例えば、Terminator(商標)5’-リン酸依存性エキソヌクレアーゼの消化)ならびにこれらの組合せが挙げられる。
【0207】
濃縮戦略は、標的核酸の相対存在量を(例えば、シーケンシングリードのパーセントにより評定して)少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1100%、1200%、1300%、1400%、1500%、1600%、1700%、1800%、1900%、2000%、3000%、4000%、5000%、6000%、7000%、8000%、9000%、10000%、またはそれより大きく増加させることができる。
【0208】
長さに基づく分離
一部の実施形態では、本明細書における方法は、断片長に従って標的核酸(例えば、ssNA)を分離するステップを含む。例えば、標的核酸(例えば、ssNA)を、1つまたは複数の長さに基づく分離方法を使用して、特定の閾値またはカットオフ未満のまたはそれを超える、特定の核酸断片長(単数)、長さの範囲、または長さ(複数)について濃縮することができる。核酸断片長は、通常は、断片中のヌクレオチドの数を指す。核酸断片長はまた、核酸断片サイズと呼ばれることもある。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを測定せずに行われる。一部の実施形態では、長さに基づく分離方法は、個々の断片の長さを決定する方法と併せて行われる。一部の実施形態では、長さに基づく分離は、分画されたプールのすべてまたは一部を単離(例えば、保持)および/または解析することができる、サイズ分画手順を指す。サイズ分画手順は、当技術分野において公知である(例えば、アレイでの分離、モレキュラーシーブによる分離、ゲル電気泳動による分離、カラムクロマトグラフィー(例えば、サイズ排除カラム)による分離、およびマイクロフルイディクスに基づくアプローチ)。一部の実施形態では、長さに基づく分離アプローチは、例えば、断片環状化、化学的処理(例えば、ホルムアルデヒド、ポリエチレングリコール(PEG))、質量分析および/またはサイズ特異的核酸増幅を含み得る。一部の実施形態では、長さに基づく分離は、固相可逆的固定法(SPRI)ビーズを使用して行われる。
【0209】
一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の核酸断片が、試料から分離される。一部の実施形態では、特定の閾値またはカットオフ(例えば、500bp、400bp、300bp、200bp、150bp、100bp)未満の長さを有する断片は、「短い」断片と呼ばれ、特定の閾値またはカットオフ(例えば、500bp、600bp、700bp、800bp、900bp、1000bp)を超える長さを有する断片は、「長い」断片、大きい断片、および/または高分子量(HMW)断片と呼ばれる。一部の実施形態では、特定の閾値またはカットオフ未満のまたはそれを超える、ある特定の長さ(単数)、長さ範囲、または長さ(複数)の断片は、解析のために保持され、その一方で、閾値またはカットオフを超えるまたはそれ未満の、異なる長さ(単数)、または長さ範囲、または長さ(複数)の断片は、解析のために保持されない。一部の実施形態では、約500bp未満である断片は、保持される。一部の実施形態では、約400bp未満である断片は、保持される。一部の実施形態では、約300bp未満である断片は、保持される。一部の実施形態では、約200bp未満である断片は、保持される。一部の実施形態では、約150bp未満である断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、110bpまたは100bp未満である断片は、保持される。一部の実施形態では、約100bp~約200bpである断片は、保持される。例えば、約190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、または110bpである断片は、保持される。一部の実施形態では、約100bp~約200bpの範囲内である断片は、保持される。例えば、約110bp~約190bp、130bp~約180bp、140bp~約170bp、140bp~約150bp、150bp~約160bp、または145bp~約155bpの範囲内である断片は、保持される。
【0210】
一部の実施形態では、約1000bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約500bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約400bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約300bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約200bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約100bp未満の断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。
【0211】
一部の実施形態では、約100bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約200bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約300bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約400bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約500bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。一部の実施形態では、約1000bpのまたはそれより大きい断片長を有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。
【0212】
一部の実施形態では、任意の断片長または断片長の組合せを有する標的核酸(例えば、ssNA)は、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と結合される。例えば、500bp未満の断片長および500bpのまたはそれより長い断片長を有する標的核酸(例えば、ssNA)を、本明細書に記載される、複数の足場アダプター種、または足場アダプター種のプール、または足場アダプター種の成分と、結合させることができる。
【0213】
本明細書に記載される方法とともに使用することができる、長さに基づくある特定の分離方法は、例えば、選択的配列タグ付けアプローチを利用する。そのような方法では、長い核酸と短い核酸とを含む試料中の核酸の断片サイズ種(例えば、短い断片)に、選択的にタグ付けすることができる。そのような方法は、内部プライマーと外部プライマーとを含む1セットのネステッドプライマーを使用して核酸増幅反応を行うステップを通常は含む。一部の実施形態では、内部のものの一方または両方にタグ付けして、それによって標的増幅産物上にタグを導入することができる。外部プライマーは、(内部)標的配列を有する短い断片に一般にアニールしない。内部プライマーは、短い断片にアニールし、タグと標的配列とを有する増幅産物を生成することができる。通常は、長い断片のタグ付けは、例えば、外部プライマーの事前のアニーリングおよび伸長による内部プライマーの伸長遮断を含む、機構の組合せによって阻害される。タグ付き断片の濃縮は、例えば、一本鎖核酸のエキソヌクレアーゼ消化、および少なくとも1つのタグに特異的な増幅プライマーを使用するタグ付き断片の増幅を含む、様々な方法のいずれかにより果たすことができる。
【0214】
本明細書に記載される方法とともに使用することができる、長さに基づく別の分離方法は、核酸試料をポリエチレングリコール(PEG)沈殿に付すステップを含む。方法の例としては、国際特許出願公開番号WO2007/140417およびWO2010/115016に記載されているものが挙げられる。この方法は、小さい(例えば、300ヌクレオチド未満の)核酸を実質的に沈殿させずに大きい核酸を実質的に沈殿させるのに十分な条件下、1つまたは複数の一価の塩の存在下で、核酸試料とPEGを接触させるステップを一般に必要とする。
【0215】
本明細書に記載される方法とともに使用することができる、長さに基づく別の濃縮方法は、例えばcircligaseを使用する、ライゲーションによる環状化を含む。通常は、短い核酸断片を長い断片より高い効率で環状化することができる。環状化されていない配列を環状化された配列から分離することができ、濃縮された短い断片をさらなる解析に使用することができる。
【0216】
核酸ライブラリー
本明細書における方法は、核酸ライブラリーを調製するステップ、および/または核酸ライブラリーために核酸を修飾するステップを含み得る。一部の実施形態では、核酸断片の末端は、断片またはそれらの増幅産物を核酸ライブラリーに組み込むことができるように修飾される。一般に、核酸ライブラリーは、その非限定的な例が、固相(例えば、固体支持体、フローセル、ビーズ)上への固定化、濃縮、増幅、クローニング、検出を含む、特異的プロセスのために、および/または核酸シーケンシングのために、調製される、組み立てられる、および/または修飾される、複数のポリヌクレオチド分子(例えば、核酸の試料)を指す。ある特定の実施形態では、核酸ライブラリーは、シーケンシングプロセスの前にまたはシーケンシングプロセス中に調製される。核酸ライブラリー(例えば、シーケンシングライブラリー)は、当技術分野において公知であるような好適な方法により調製することができる。核酸ライブラリーは、標的化または非標的化調製プロセスにより調製することができる。
【0217】
一部の実施形態では、核酸のライブラリーは、固体支持体への核酸の固定化のために構成される化学的部分(例えば、官能基)を含むように修飾される。一部の実施形態では、核酸ライブラリーは、固体支持体へのライブラリーの固定化のために構成される、生体分子(例えば、官能基)および/または結合対のメンバーを含むように修飾され、生体分子および結合対の非限定的な例としては、チロキシン結合グロブリン、ステロイド結合タンパク質、抗体、抗原、ハプテン、酵素、レクチン、核酸、リプレッサー、プロテインA、プロテインG、アビジン、ストレプトアビジン、ビオチン、補体成分C1q、核酸結合タンパク質、受容体、炭水化物、オリゴヌクレオチド、ポリヌクレオチド、相補的核酸配列など、およびこれらの組合せが挙げられる。特異的結合対の一部の例としては、限定ではないが、アビジン部分とビオチン部分;抗原エピトープと抗体またはその免疫反応性断片;抗体とハプテン;ジゴキシゲニン部分と抗ジゴキシゲニン抗体;フルオレセイン部分と抗フルオレセイン抗体;オペレーターとリプレッサー;ヌクレアーゼとヌクレオチド;レクチンと多糖;ステロイドとステロイド結合タンパク質;活性化合物と活性化合物受容体;ホルモンとホルモン受容体;酵素と基質;免疫グロブリンとプロテインA;オリゴヌクレオチドまたはポリヌクレオチドとその対応する補体;など、またはこれらの組合せが挙げられる。
【0218】
一部の実施形態では、核酸のライブラリーは、既知組成の1つまたは複数のポリヌクレオチドを含むように修飾され、ポリヌクレオチドの非限定的な例としては、識別子(例えば、タグ、インデックス付加用タグ)、キャプチャー配列、標識、アダプター、制限酵素部位、プロモーター、エンハンサー、複製起点、ステムループ、相補配列(例えば、プライマー結合部位、アニーリング部位)、好適な組み込み部位(例えば、トランスポゾン、ウイルス組み込み部位)、修飾ヌクレオチド、本明細書に記載される固有分子識別子(UMI)、本明細書に記載されるパリンドローム配列など、またはこれらの組合せが挙げられる。既知配列のポリヌクレオチドを、好適な位置に、例えば、5’末端、3’末端にまたは核酸配列内に、付加させることができる。既知配列のポリヌクレオチドは、同じ配列であることもあり、または異なる配列であることもある。一部の実施形態では、既知配列のポリヌクレオチドは、表面(例えば、フローセルの表面)に固定化された1つまたは複数のオリゴヌクレオチドとハイブリダイズするように構成される。例えば、5’既知配列を含む核酸分子は、第1の複数のオリゴヌクレオチドとハイブリダイズすることができ、その一方で、3’既知配列は、第2の複数のオリゴヌクレオチドとハイブリダイズすることができる。一部の実施形態では、核酸のライブラリーは、染色体特異的タグ、キャプチャー配列、標識および/またはアダプター(例えば、本明細書に記載されるオリゴヌクレオチドアダプター)を含み得る。一部の実施形態では、核酸のライブラリーは、1つまたは複数の検出可能な標識を含む。一部の実施形態では、1つまたは複数の検出可能な標識を、核酸ライブラリーの5’末端に、3’末端に、および/またはライブラリー内の核酸内の任意のヌクレオチド位置に組み込むことができる。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドを含む。ある特定の実施形態では、ハイブリダイズしたオリゴヌクレオチドは、標識されたプローブである。一部の実施形態では、核酸のライブラリーは、ハイブリダイズしたオリゴヌクレオチドプローブを固相への固定化の前に含む。
【0219】
一部の実施形態では、既知配列のポリヌクレオチドは、ユニバーサル配列を含む。ユニバーサル配列は、2つもしくはそれより多くの核酸分子にまたは核酸分子の2つもしくはそれより多くのサブセットに組み込まれる特異的ヌクレオチド配列であり、ユニバーサル配列は、それが組み込まれるすべての分子または分子のサブセットについて同じである。ユニバーサル配列は、ユニバーサル配列に相補的である単一のユニバーサルプライマーを使用して、複数の異なる配列とハイブリダイズするように、および/または複数の異なる配列を増幅するように、設計されることが多い。一部の実施形態では、2つ(例えば、一対)またはそれより多くのユニバーサル配列および/またはユニバーサルプライマーが使用される。ユニバーサルプライマーは、ユニバーサル配列を含むことが多い。一部の実施形態では、アダプター(例えば、ユニバーサルアダプター)は、ユニバーサル配列を含む。一部の実施形態では、1つまたは複数のユニバーサル配列が、核酸の複数の種またはサブセットを捕捉、識別および/または検出するために使用される。
【0220】
核酸ライブラリーの調製についてのある特定の実施形態では、(例えば、ある特定の一塩基合成法手順では)、核酸は、数百塩基対またはそれ未満の長さに(例えば、ライブラリー生成のための調製において)サイズ選択および/または断片化される。一部の実施形態では、ライブラリー調製は、断片化なしで行われる(例えば、無細胞DNAを使用する場合)。
【0221】
ある特定の実施形態では、ライゲーションに基づくライブラリー調製方法が使用される(例えば、ILLUMINA TRUSEQ、Illumina、San Diego、CA)。ライゲーションに基づくライブラリー調製方法は、インデックス配列(例えば、核酸配列についての試料起源を識別するための試料インデックス配列)を最初のライゲーションステップで組み込むことができ、多くの場合、シングルリードシーケンシング、ペアエンドシーケンシングおよび多重化シーケンシングのための試料の調製に使用され得る、アダプター(例えば、メチル化アダプター)設計を使用することが多い。例えば、核酸(例えば、断片化された核酸または無細胞DNA)を、フィルイン反応、エキソヌクレアーゼ反応またはこれらの組合せにより、末端修復することができる。一部の実施形態では、次いで、結果として生じた平滑末端修復核酸を、アダプター/プライマーの3’末端の単一のヌクレオチドオーバーハングと相補的である単一のヌクレオチドにより伸長することができる。任意のヌクレオチドを伸長/オーバーハングヌクレオチドに使用することができる。一部の実施形態では、末端修復が省略され、骨格アダプター(例えば、本明細書に記載される骨格アダプター)は、核酸(例えば、一本鎖核酸、断片化された核酸および/または無細胞DNA)のネイティブ末端に直接ライゲーションされる。
【0222】
一部の実施形態では、核酸ライブラリー調製は、本明細書に記載される足場アダプターなどの、足場アダプターまたはその成分を(例えば、試料核酸に、試料核酸断片に、鋳型核酸に、標的核酸に、ssNAに)ライゲーションするステップを含む。足場アダプター、またはそれらの成分は、フローセルアンカーに相補的である配列を含むことができ、例えばフローセルの内部表面などの、固体支持体に核酸ライブラリーを固定化するために利用されることもある。一部の実施形態では、足場アダプター、またはその成分は、識別子、1つもしくは複数シーケンシングプライマーハイブリダイゼーション部位(例えば、ユニバーサルシーケンシングプライマー、シングルエンドシーケンシングプライマー、ペアエンドシーケンシングプライマー、多重化シーケンシングプライマーなどに相補的な配列)、またはこれらの組合せ(例えば、アダプター/シーケンシング、アダプター/識別子、アダプター/識別子/シーケンシング)を含む。一部の実施形態では、足場アダプター、またはその成分は、本明細書ではプライミング配列またはプライマー結合ドメインとも呼ばれる、プライマーアニーリングポリヌクレオチド(例えば、フローセル結合オリゴヌクレオチドへの、および/または遊離増幅プライマーへの、アニーリングのためのもの)、インデックスポリヌクレオチド(例えば、異なる試料からの核酸を追跡するための試料インデックス配列;試料IDとも呼ばれる)、バーコードポリヌクレオチド(例えば、シーケンシングの前に増幅される試料核酸の個々の分子を追跡するための単一分子バーコード(SMB);分子バーコードまたは固有分子識別子(UMI)とも呼ばれる)のうちの1つまたは複数を含む。一部の実施形態では、足場アダプターまたはその成分の、プライマーアニーリング成分(またはプライミング配列またはプライマー結合ドメイン)は、1つまたは複数のユニバーサル配列(例えば、1つまたは複数の増幅プライマーに相補的な配列)を含む。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、足場アダプターまたはその成分の、成分である。一部の実施形態では、インデックスポリヌクレオチド(例えば、試料インデックス;試料ID)は、ユニバーサル増幅プライマー配列の成分である。
【0223】
一部の実施形態では、足場アダプターまたはその成分は、増幅プライマー(例えば、ユニバーサル増幅プライマー)と組み合わせて使用される場合、ユニバーサル配列、分子バーコード(UMI)、UMI隣接配列、試料ID配列、スペーサー配列、および試料核酸配列(例えば、ssNA配列)のうちの1つまたは複数を含むライブラリー構築物を生成するように設計される。一部の実施形態では、足場アダプターまたはその成分は、ユニバーサル増幅プライマーと組み合わせて使用される場合、ユニバーサル配列、分子バーコード(UMI)、試料ID配列、スペーサー配列、および試料核酸配列(例えば、ssNA配列)のうちの1つまたは複数の順序付けられた組合せを含むライブラリー構築物を生成するように設計される。例えば、ライブラリー構築物は、第1のユニバーサル配列、続いて第2のユニバーサル配列、続いて第1の分子バーコード(UMI)、続いてスペーサー配列、続いて鋳型配列(例えば、試料核酸配列;ssNA配列)、続いてスペーサー配列、続いて第2の分子バーコード(UMI)、続いて第3のユニバーサル配列、続いて試料ID、続いて第4のユニバーサルを含み得る。一部の実施形態では、足場アダプター、またはその成分は、増幅プライマー(例えば、ユニバーサル増幅プライマー)と組み合わせて使用される場合、鋳型分子(例えば、試料核酸分子;ssNA分子)の鎖ごとにライブラリー構築物を生成するように設計される。一部の実施形態では、足場アダプターは、二重鎖アダプターである。
【0224】
識別子は、識別子を含む核酸の検出および/または識別を可能にする、核酸(例えば、ポリヌクレオチド)に組み込まれたまたは結合された好適な検出可能な標識であり得る。一部の実施形態では、識別子は、シーケンシング方法の間に(例えば、ポリメラーゼにより)核酸に組み込まれるかまたは結合される。一部の実施形態では、識別子は、シーケンシング方法の前に(例えば、伸長反応により、増幅反応により、ライゲーション反応により)核酸に組み込まれるかまたは結合される。識別子の非限定的な例としては、核酸タグ、核酸インデックスもしくはバーコード、放射標識(例えば、同位体)、金属標識、蛍光標識、化学発光標識、リン光標識、フルオロフォアクエンチャー、色素、タンパク質(例えば、酵素、抗体もしくはその一部、リンカー、結合対のメンバー)など、またはこれらの組合せが挙げられる。一部の実施形態では、識別子(例えば、核酸インデックスまたはバーコード)は、ヌクレオチドまたはヌクレオチド類似体の固有の、既知のおよび/または識別可能な配列である。一部の実施形態では、識別子は、連続する6またはそれを超えるヌクレオチドである。様々な異なる励起および発光スペクトルを有する多数のフルオロフォアが、利用可能である。任意の好適なタイプおよび/または数のフルオロフォアを、識別子として使用することができる。一部の実施形態では、1つもしくは複数、2つもしくはそれより多くの、3つもしくはそれより多くの、4つもしくはそれより多くの、5つもしくはそれより多くの、6つもしくはそれより多くの、7つもしくはそれより多くの、8つもしくはそれより多くの、9つもしくはそれより多くの、10もしくはそれより多くの、20もしくはそれより多くの、30もしくはそれより多くの、または50もしくはそれより多くの異なる識別子が、本明細書に記載される方法(例えば、核酸検出および/またはシーケンシング方法)において利用される。一部の実施形態では、1つまたは2つのタイプの識別子(例えば、蛍光標識)が、ライブラリー内の各核酸に連結される。識別子の検出および/または定量化は、好適な方法、装置または機械により行うことができ、そのような方法、装置または機械の非限定的な例としては、フローサイトメトリー、定量的ポリメラーゼ連鎖反応(qPCR)、ゲル電気泳動、ルミノメーター、蛍光光度計、分光光度計、好適な遺伝子チップまたはマイクロアレイ解析、ウエスタンブロット、質量分析、クロマトグラフィー、細胞蛍光分析、蛍光顕微鏡法、好適な蛍光またはデジタルイメージング法、共焦点レーザー走査顕微鏡法、レーザー走査型サイトメトリー、親和性クロマトグラフィー、マニュアルバッチモード分離、電界懸架、好適な核酸シーケンシング方法および/または核酸シーケンシング装置など、ならびにこれらの組合せが挙げられる。
【0225】
一部の実施形態では、識別子、シーケンシング特異的インデックス/バーコード、およびシーケンサー特異的フローセル結合プライマー部位は、単一プライマー伸長により(例えば、鎖置換ポリメラーゼにより)核酸ライブラリーに組み込まれる。
【0226】
一部の実施形態では、核酸ライブラリーまたはその一部は、増幅条件下で増幅される(例えば、PCRに基づく方法により増幅される)。一部の実施形態では、シーケンシング方法は、核酸ライブラリーの増幅を含む。核酸ライブラリーを、固体支持体(例えば、フローセル内の固体支持体)への固定化の前または後に増幅することができる。核酸増幅は、(例えば、核酸ライブラリー内に)存在する核酸鋳型のおよび/またはその補体の数を、鋳型および/またはその補体の1つまたは複数のコピーを生成することにより、増幅するまたは増加させるプロセスを含む。増幅は、好適な方法により行うことができる。核酸ライブラリーを、サーモサイクリング法によりまたは等温増幅法により増幅することができる。一部の実施形態では、ローリングサークル増幅法が使用される。一部の実施形態では、増幅は、核酸ライブラリーまたはその一部分が固定化されている固体支持体(例えば、フローセル内のもの)上で行われる。ある特定のシーケンシング方法では、核酸ライブラリーは、フローセルに添加され、好適な条件下でのアンカーへのハイブリダイゼーションにより固定化される。このタイプの核酸増幅は、固相増幅と呼ばれることが多い。固相増幅の一部の実施形態では、増幅産物のすべてまたは一部分は、固定化されたプライマーから開始する伸長により合成される。固相増幅反応は、増幅オリゴヌクレオチド(例えば、プライマー)の少なくとも1つが固体支持体に固定化されることを除き、標準的な液相増幅に類似している。一部の実施形態では、修飾核酸(例えば、アダプターの付加により修飾された核酸)が増幅される。
【0227】
一部の実施形態では、固相増幅は、表面に固定化されたオリゴヌクレオチドプライマーの1つの種のみを含む核酸増幅反応を含む。ある特定の実施形態では、固相増幅は、複数の異なる固定化されたオリゴヌクレオチドプライマー種を含む。一部の実施形態では、固相増幅は、固体表面に固定化されたオリゴヌクレオチドプライマーの1つの種と溶液中の第2の異なるオリゴヌクレオチドプライマー種とを含む核酸増幅反応を含み得る。固定化されたプライマーまたは溶液系プライマーの複数の異なる種を使用することができる。固相核酸増幅反応の非限定的な例としては、界面増幅、架橋増幅、エマルジョンPCR、WildFire増幅(例えば、米国特許出願公開第2013/0012399号)などまたはこれらの組合せが挙げられる。
【0228】
一部の実施形態では、核酸は、差次的に増幅される。差次的に増幅とは、一般に、第1の核酸種を第2の核酸種より大きく増幅することを指す。例えば、第1の核酸種は、第2の核酸の増幅と比較して少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、またはそれより大きく増幅され得る。一部の実施形態では、第1の核酸種は、指数関数的に増幅され、第2の核酸種は、線形に増幅される。核酸種は、核酸の供給源または起源を指すことがある。例えば、供給源は、RNA(例えば、一本鎖RNA)またはDNA(例えば、二本鎖DNA)であることがある。一部の実施形態では、第1の種または供給源は、RNAである。一部の実施形態では、第1の種または供給源は、DNAである。一部の実施形態では、第2の種または供給源は、RNAである。一部の実施形態では、第2の種または供給源は、DNAである。一部の実施形態では、第1の種または供給源はRNAであり、第2の種または供給源は、DNAである。したがって、一部の実施形態では、本明細書における方法は、RNA源に由来する核酸およびDNA源に由来する核酸を差次的に増幅することができ、RNA源に由来する核酸は、DNA源に由来する核酸と比較して大きく増幅される。一部の実施形態では、本明細書に記載される方法により生成されるライブラリー中の核酸は、差次的に増幅される。一部の実施形態では、
図17に示されている方法により生成されるライブラリー中の核酸は、差次的に増幅される。一部の実施形態では、核酸ライブラリーは、RNA源に由来する核酸およびDNA源に由来する核酸を含み、両方のタイプの核酸分子が、共通のプライミング部位を一方の末端に、および異なるプライミング部位を他方の末端に含む。例えば、両方のタイプの核酸分子がプライミング部位Aを一方の末端に有することがあり、RNA源に由来する核酸がプライミング部位Bを反対側の末端に有することがあり、DNA源に由来する核酸がプライミング部位Cを反対側の末端に有することがある。AおよびBに結合するプライマーを含み、Cに結合するプライマーを含まない、増幅反応は、RNA源に由来する核酸の指数関数的増幅、およびDNA源に由来する核酸の線形増幅をもたらすことになる。
【0229】
核酸シーケンシング
一部の実施形態では、核酸(例えば、核酸断片、試料核酸、無細胞核酸、一本鎖核酸、一本鎖DNA、一本鎖RNA)は、シーケンシングされる。一部の実施形態では、本明細書で提供される足場アダプターとハイブリダイズされたssNA(「ハイブリダイゼーション産物」)は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、本明細書で提供されるオリゴヌクレオチド成分とハイブリダイズされたssNA(「一本鎖ライゲーション産物」)は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、増幅プロセスにより増幅され、増幅産物は、シーケンシングプロセスによりシーケンシングされる。一部の実施形態では、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、増幅プロセスにより増幅されず、ハイブリダイゼーション産物および/または一本鎖ライゲーション産物は、事前の増幅なしにシーケンシングプロセスによりシーケンシングされる。一部の実施形態では、シーケンシングプロセスは、配列リード(またはシーケンシングリード)を生成する。一部の実施形態では、本明細書における方法は、配列リードに基づいて一本鎖核酸分子の配列を決定するステップを含む。
【0230】
ある特定のシーケンシングプラットフォーム(例えば、ペアエンドシーケンシング)の場合、配列リードを生成するステップは、フォワード配列リードを生成すること、およびリバース配列リードを生成することを含み得る。例えば、ある特定のペアエンドシーケンシングプラットフォームを使用するシーケンシングは、各核酸断片を両方の方向からシーケンシングし、一般に、その結果、フォワード方向の第1のリード(フォワードリード)および逆相補的方向の第2のリード(リバースリード)を含む2つのリードが、核酸断片ごとに得られる。ある特定のプラットフォームの場合、フォワードリードは、シーケンシングアダプター内の特定のプライマー(例えば、ILLUMINAアダプター、P5プライマー)から生成され、リバースリードは、シーケンシングアダプター内の異なるプライマー(例えば、ILLUMINAアダプター、P7プライマー)から生成される。
【0231】
核酸は、サンガーシーケンシングプラットフォーム、ハイスループットもしくは大規模並列シーケンシング(次世代シーケンシング(NGS))プラットフォームなど、例えば、Illumina(登録商標)により提供されているシーケンシングプラットフォーム(例えば、HiSeq(商標)、MiSeq(商標)および/もしくはGenome Analyzer(商標)シーケンシングシステム)、Oxford Nanopore(商標)Technologiesにより提供されているシーケンシングプラットフォーム(例えば、MinIONシーケンシングシステム)、Ion Torrent(商標)により提供されているシーケンシングプラットフォーム(例えば、Ion PGM(商標)および/もしくはIon Proton(商標)シーケンシングシステム)、Pacific Biosciencesにより提供されているシーケンシングプラットフォーム(例えば、PACBIO RS IIシーケンシングシステム)、Life Technologies(商標)により提供されているシーケンシングプラットフォーム(例えば、SOLiDシーケンシングシステム)、Rocheにより提供されるシーケンシングプラットフォーム(例えば、454 GS FLX+および/もしくはGS Juniorシーケンシングシステム)、または任意の他の好適なシーケンシングプラットフォームなどを含む、任意の好適なシーケンシングプラットフォームを使用してシーケンシングすることができる。一部の実施形態では、シーケンシングプロセスは、高多重化シーケンシングプロセスである。ある特定の事例では、完全または実質的に完全な配列が得られ、部分的配列が得られることもある。核酸シーケンシングは、一般に、配列リードの一群を生成する。本明細書で使用される場合、「リード」(複数)(例えば、「リード」(単数)、「配列リード」(単数))は、本明細書に記載されるまたは当技術分野において公知の任意のシーケンシングプロセスにより生成されたオリゴヌクレオチドの短い配列である。リードは、核酸断片の一方の末端から生成され得(シングルエンドリード)、核酸断片の両方の末端から生成されることもある(例えば、ペアエンドリード、ダブルエンドリード)。一部の実施形態では、シーケンシングプロセスは、短いシーケンシングリードまたは「短いリード」を生成する。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから、連続する約250またはそれを超えるヌクレオチドまでであることもある。一部の実施形態では、短いリードの長さの名目値、代表値、平均値または絶対値は、連続する約50ヌクレオチドから、連続する約150またはそれを超えるヌクレオチドまでである。
【0232】
配列リードの長さは、利用される特定のシーケンシング技術に関連することが多い。例えば、ハイスループット法は、サイズに数十から数百塩基対(bp)までの幅があり得る、配列リードを生じさせる。例えば、ナノポアシーケンシングは、サイズに数十から数百そして数千塩基対までの幅があり得る、配列リードを生じさせ得る。一部の実施形態では、配列リードは、約15bp~約900bp長の長さ平均値、中央値、代表値または絶対値を有する。ある特定の実施形態では、配列リードは、約1000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約1500、2000、2500、3000、3500、4000、4500もしくは5000bpのまたはそれを超える、長さ平均値、中央値、代表値または絶対値を有する。一部の実施形態では、配列リードは、約100bp~約200bpの長さ平均値、中央値、代表値または絶対値を有する。
【0233】
一部の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約250またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約200またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約150またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約125またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約100またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約75またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約60またはそれを超えるヌクレオチドまで、連続する15ヌクレオチドから連続する約50またはそれを超えるヌクレオチドまで、連続する約15ヌクレオチドから連続する約40またはそれを超えるヌクレオチドまでであることもあり、連続する約15ヌクレオチド、または連続する約36もしくはそれを超えるヌクレオチドであることもある。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20~約30塩基、または約24~約28塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、21、22、23、24、25、26、27、28または約29塩基もしくはそれを超える。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約20~約200塩基、約100~約200塩基、または約140~約160塩基である。ある特定の実施形態では、シングルエンドリードの長さの名目値、代表値、平均値または絶対値は、長さ約30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、または約200塩基もしくはそれを超える。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約10ヌクレオチドから連続する約25ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24もしくは25ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約15ヌクレオチドから連続する約20ヌクレオチドまたはそれを超えるヌクレオチド数までであることもあり、連続する約17ヌクレオチドまたは連続する約18ヌクレオチドであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約25ヌクレオチドから連続する約400ヌクレオチドまたはそれを超えるヌクレオチド数まで(例えば、長さ約25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390もしくは400ヌクレオチド、またはそれを超えるヌクレオチド数)、連続する約50ヌクレオチドから連続する約350ヌクレオチドまたはそれを超えるヌクレオチド数まで、連続する約100ヌクレオチドから連続する約325ヌクレオチドまで、連続する約150ヌクレオチドから連続する約325ヌクレオチドまで、連続する約200ヌクレオチドから連続する約325ヌクレオチドまで、連続する約275ヌクレオチドから連続する約310ヌクレオチドまで、連続する約100ヌクレオチドから連続する約200ヌクレオチドまで、連続する約100ヌクレオチドから連続する約175ヌクレオチドまで、連続する約125ヌクレオチドから連続する約175ヌクレオチドまでであることもあり、連続する約140ヌクレオチドから連続する約160ヌクレオチドまでであることもある。ある特定の実施形態では、ペアエンドリードの長さの名目値、代表値、平均値または絶対値は、連続する約150ヌクレオチドであり、連続する150ヌクレオチドであることもある。
【0234】
リードは、一般に、物理的核酸中のヌクレオチド配列の表現である。例えば、配列のATGC描写を含有するリードの場合、物理的核酸中の、「A」は、アデニンヌクレオチドを表し、「T」は、チミンヌクレオチドを表し、「G」は、グアニンヌクレオチドを表し、「C」は、シトシンヌクレオチドを表す。対象からの試料から得られる配列リードは、少数派核酸と多数派核酸の混合物からのリードであることがある。例えば、がん患者の血液から得られる配列リードは、がん核酸と非がん核酸の混合物からのリードであることがある。別の例では、妊娠している雌の血液から得られる配列リードは、胎児核酸と母体核酸の混合物からのリードであることがある。別の例では、感染症または感染性疾患に罹患している患者の血液から得られる配列リードは、宿主核酸と病原体核酸の混合物からのリードであることがある。別の例では、移植レシピエントの血液から得られる配列リードは、宿主核酸と移植片核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、対象のマイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸の混合物からのリードであることがある。別の例では、試料から得られる配列リードは、マイクロバイオーム(例えば、腸のマイクロバイオーム、血液のマイクロバイオーム、口腔のマイクロバイオーム、脊髄液のマイクロバイオーム、糞便のマイクロバイオーム)を集団で構成する微生物からの核酸と宿主対象からの核酸との混合物からのリードであることがある。比較的短いリードの混合物を、本明細書に記載されるプロセスにより、対象内に存在するゲノム核酸の表現に、および/または腫瘍、胎児、病原体、移植片もしくはマイクロバイオームに存在するゲノム核酸の表現に、変換することができる。
【0235】
ある特定の実施形態では、対象から試料の核酸配列リードを「得ること」、および/または1名もしくは複数名の参照人物から生物検体の核酸配列リードを「得ること」は、配列情報を得るために核酸を直接シーケンシングすることを含むことができる。一部の実施形態では、「得ること」は、別の者により核酸から直接得られた配列情報を受け取ることを含むことができる。
【0236】
一部の実施形態では、試料中の一部またはすべての核酸は、シーケンシング前または中に(例えば、非特異的に、例えば、PCRに基づく方法により)濃縮および/または増幅される。ある特定の実施形態では、試料中の特異的核酸種またはサブセットは、シーケンシング前または中に濃縮および/または増幅される。一部の実施形態では、核酸のあらかじめ選択されたプールの種またはサブセットは、ランダムにシーケンシングされる。一部の実施形態では、試料中の核酸は、シーケンシング前または中に濃縮および/または増幅されない。
【0237】
一部の実施形態では、ゲノムの代表的画分は、シーケンシングされ、「カバレッジ」または「カバレッジ倍数」と呼ばれることもある。例えば、1倍のカバレッジは、ゲノムのヌクレオチド配列のおよそ100%がリードにより表されることを示す。一部の事例では、カバレッジ倍数は、「シーケンシング深度」と呼ばれる(およびそれに正比例する)。一部の実施形態では、「カバレッジ倍数」は、参照として以前のシーケンシング実験を参照する相対的用語である。例えば、第2のシーケンシング実験は、第1のシーケンシング実験の2分の1のカバレッジを有することがある。一部の実施形態では、ゲノムは、ゲノムの所与の領域が、2つもしくはそれより多くのリードまたはオーバーラップしているリードによりカバーされ得る(例えば、1を超える「カバレッジ倍数」、例えば、2倍のカバレッジ)冗長性で、シーケンシングされる。一部の実施形態では、ゲノム(例えば、全ゲノム)は、約0.01倍~約100倍のカバレッジ、約0.1倍~約20倍のカバレッジ、または約0.1倍~約1倍のカバレッジ(例えば、約0.015倍、0.02倍、0.03倍、0.04倍、0.05倍、0.06倍、0.07倍、0.08倍、0.09倍、0.1倍、0.2倍、0.3倍、0.4倍、0.5倍、0.6倍、0.7倍、0.8倍、0.9倍、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍またはそれを超えるカバレッジ)で、シーケンシングされる。一部の実施形態では、ゲノムの特異的部分(例えば、標的化された方法からのゲノム部分)がシーケンシングされ、カバレッジ倍数値は、シーケンシングされる特異的ゲノム部分の画分を一般に指す(すなわち、カバレッジ倍数値は、全ゲノムを指さない)。一部の事例では、特異的ゲノム部分は、1000倍のカバレッジまたはそれを超えるカバレッジでシーケンシングされる。例えば、特異的ゲノム部分を、2000倍、5,000倍、10,000倍、20,000倍、30,000倍、40,000倍または50,000倍のカバレッジでシーケンシングすることができる。一部の実施形態では、シーケンシングは、約1,000倍~約100,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約10,000倍~約70,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約20,000倍~約60,000倍のカバレッジでのものである。一部の実施形態では、シーケンシングは、約30,000倍~約50,000倍のカバレッジでのものである。
【0238】
一部の実施形態では、1個体からの1つの核酸試料がシーケンシングされる。ある特定の実施形態では、2つまたはそれより多くの試料であって、1個体からのものであるかまたは異なる個体からのものである試料の各々からの核酸が、シーケンシングされる。ある特定の実施形態では、各生体試料が1個体または2もしくはそれより多くの個体からのものである、2つまたはそれより多くの生体試料からの核酸試料が、プールされ、そのプールがシーケンシングされる。後者の実施形態では、各生体試料からの核酸試料は、1つまたは複数の固有識別子により識別されることが多い。
【0239】
一部の実施形態では、シーケンシング方法は、シーケンシングプロセスにおいて配列反応の多重化を可能にする識別を利用する。固有識別子の数が多いほど、例えば、シーケンシングプロセスで多重化することができる、検出用の試料および/または染色体の数が多い。シーケンシングプロセスは、任意の好適な数(例えば、4、8、12、24、48、96またはそれより多く)の固有識別子を使用して、行うことができる。
【0240】
シーケンシングプロセスは、固相を使用することもあり、固相は、ライブラリーからの核酸を結合させることができるフローセスであって、試薬を流動させ、結合した核酸と接触させることができるフローセルを、含むこともある。フローセルは、フローセルレーンを含むこともあり、識別子の使用は、各レーンでのいくつかの試料の解析を容易にすることができる。フローセルは、結合された分析物を保持し、および/またはその上を試薬溶液が順序だって通過することを可能にするように、構成することができる固体支持体であることが多い。フローセルは、多くの場合、平面形状であり、光学的に透明であり、一般に、ミリメートルまたはミリメートル未満の規模であり、分析物/試薬相互作用が起こるチャネルまたはレーンを有することが多い。一部の実施形態では、所与のフローセルレーンで解析される試料の数は、ライブラリー調製および/またはプローブ設計中に利用される固有識別子の数に依存する。例えば、12の識別子を使用する多重化により、8レーンフローセルで(例えば、96ウェルマイクロウェルプレートにおけるウェルの数に等しい)96の試料の同時解析が可能になる。同様に、例えば48の識別子を使用する多重化により、8レーンフローセルで(例えば、384ウェルマイクロウェルプレートにおけるウェルの数に等しい)384の試料の同時解析が可能になる。市販のマルチプレックスシーケンシングキットの非限定的な例としては、Illuminaのmultiplexing sample preparation oligonucleotide kitおよびmultiplexing sequencing primers and PhiX control kit(例えば、それぞれ、Illuminaのカタログ番号PE-400-1001およびPE-400-1002)が挙げられる。
【0241】
任意の好適な核酸シーケンシング方法を使用することができ、そのような方法の非限定的な例としては、マクサム・ギルバート法(Maxim & Gilbert)、連鎖停止法、一塩基合成法、ライゲーションによるシーケンシング、質量分析によるシーケンシング、顕微鏡法に基づく手法など、またはこれらの組合せが挙げられる。一部の実施形態では、例えば、マイクロ流体サンガーシーケンシングを含む、自動化サンガーシーケンシング法を含むサンガーシーケンシング法などの、第1世代技術を、本明細書で提供される方法において使用することができる。一部の実施形態では、核酸イメージング技術(例えば、透過型電子顕微鏡法(TEM)および原子間力顕微鏡法(AFM))の使用を含むシーケンシング技術を使用することができる。一部の実施形態では、ハイスループットシーケンシング法が使用される。ハイスループットシーケンシング法は、大規模並列方式で、ときにはフローセル内で、シーケンシングされる、クローン増幅されたDNA鋳型または単一のDNA分子を一般に含む。大規模並列方式でDNAをシーケンシングすることができる次世代(例えば、第2および第3世代)シーケンシング手法を本明細書に記載される方法に使用することができ、そのような手法は、本明細書では「大規模並列シーケンシング」(MPS)と総称される。一部の実施形態では、MPSシーケンシング法は、目的の特異的染色体、遺伝子または領域がシーケンシングされる、標的化アプローチを利用する。ある特定の実施形態では、試料中の大半のまたはすべての核酸がランダムにシーケンシング、増幅および/または捕捉される、非標的化アプローチが、使用される。
【0242】
一部の実施形態では、標的化された濃縮、増幅および/またはシーケンシングアプローチが使用される。標的化アプローチは、配列特異的オリゴヌクレオチドの使用によるさらなる処理のために試料中の核酸のサブセットを単離、選択および/または濃縮することが多い。一部の実施形態では、配列特異的オリゴヌクレオチドのライブラリーは、試料中の核酸の1つまたは複数のセットを標的とする(例えば、そのようなセットとハイブリダイズする)ために利用される。配列特異的オリゴヌクレオチドおよび/またはプライマーは、目的の1つまたは複数の染色体、遺伝子、エクソン、イントロンおよび/または調節領域に存在する特定の配列(例えば、固有核酸配列)に対して選択的であることが多い。任意の好適な方法または方法の組合せを、標的核酸の1つまたは複数のサブセットの濃縮、増幅および/またはシーケンシングに使用することができる。一部の実施形態では、標的配列は、1つまたは複数の配列特異的アンカーを使用する固相(例えば、フローセル、ビーズ)への捕捉により単離および/または濃縮される。一部の実施形態では、標的配列は、配列特異的プライマーおよび/またはプライマーセットを使用するポリメラーゼに基づく方法(例えば、任意の好適なポリメラーゼに基づく伸長による、PCRに基づく方法)により濃縮および/または増幅される。配列特異的アンカーを、多くの場合、配列特異的プライマーとして使用することができる。
【0243】
MPSシーケンシングは、一塩基合成法およびある特定のイメージングプロセスを使用することもある。本明細書に記載される方法において使用することができる核酸シーケンシング技術は、一塩基合成法および可逆的ターミネーターに基づくシーケンシング(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ 2500(Illumina、San Diego CA))である。この技術を用いて、何百万もの核酸(例えば、DNA)断片を並行してシーケンシングすることができる。このタイプのシーケンシング技術の一例では、光学的に透明なスライドであって、その表面の8つの個別のレーンにオリゴヌクレオチドアンカー(例えば、アダプタープライマー)が結合されている、スライドを含有する、フローセルが使用される。
【0244】
一塩基合成法は、一般に、鋳型により方向付けられる様式でプライマーまたは既存の核酸鎖にヌクレオチドを(共有結合性付加により)反復的に付加させることにより行われる。ヌクレオチドの反復的付加各々が検出され、核酸鎖の配列が得られるまでこのプロセスが何度も繰り返される。得られる配列の長さは、一部には、行われる付加および検出ステップの数に依存する。一塩基合成法の一部の実施形態では、ヌクレオチド付加の1ラウンドで、同じタイプの1つ、2つ、3つまたはそれより多くのヌクレオチド(例えば、A、G、CまたはT)が、付加され、検出される。ヌクレオチドを任意の好適な方法により(例えば、酵素的にまたは化学的に)付加させることができる。例えば、一部の実施形態では、ポリメラーゼまたはリガーゼは、ヌクレオチドをプライマーに、または既存の核酸鎖に、鋳型により方向付けられる様式で付加させる。一塩基合成法の一部の実施形態では、異なるタイプのヌクレオチド、ヌクレオチド類似体および/または識別子が使用される。一部の実施形態では、可逆的ターミネーターおよび/または除去可能な(例えば、切断可能な)識別子が使用される。一部の実施形態では、蛍光標識されたヌクレオチドおよび/またはヌクレオチド類似体が使用される。ある特定の実施形態では、一塩基合成法は、切断(例えば、識別子の切断および除去)および/または洗浄ステップを含む。一部の実施形態では、1つまたは複数のヌクレオチドの付加は、本明細書に記載されるまたは当技術分野において公知の好適な方法により検出され、そのような方法の非限定的な例としては、任意の好適なイメージング装置、好適なカメラ、デジタルカメラ、CCD(電荷結合素子)に基づくイメージング装置(例えば、CCDカメラ)、CMOS(相補型金属酸化物シリコン)に基づくイメージング装置(例えば、CMOSカメラ)、光ダイオード(例えば、光電子増倍チューブ)、電子顕微鏡法、電界効果トランジスタ(例えば、DNA電界効果トランジスタ)、ISFETイオンセンサー(例えば、CHEMFETセンサー)など、またはこれらの組合せが挙げられる。
【0245】
本明細書に記載される方法を行うための任意の好適なMPS法、システムまたは技術プラットフォームを使用して、核酸配列リードを得ることができる。MPSプラットフォームの非限定的な例としては、ILLUMINA/SOLEX/HISEQ(例えば、IlluminaのGenome Analyzer;Genome Analyzer II;HISEQ 2000;HISEQ)、SOLiD、Roche/454、PACBIOおよび/もしくはSMRT、Helicos True Single Molecule Sequencing、Ion TorrentおよびIon半導体に基づくシーケンシング(例えば、Life Technologiesにより開発されたようなもの)、WildFire、5500、5500xl Wおよび/もしくは5500xl W Genetic Analyzerに基づく技術(例えば、Life Technologiesにより開発され、販売されているようなもの;米国特許出願公開第2013/0012399号);Polonyシーケンシング、パイロシーケンシング、大規模並列シグネチャーシーケンシング(MPSS)、RNAポリメラーゼ(RNAP)シーケンシング、LaserGenシステムおよび方法、ナノポアに基づくプラットフォーム、化学物質感受性電界効果トランジスタ(CHEMFET)アレイ、電子顕微鏡法に基づくシーケンシング(例えば、ZS Genetics、Halcyon Molecularにより開発されたようなもの)、ナノボールシーケンシングなど、またはこれらの組合せが挙げられる。本明細書における方法を行うために使用することができる他のシーケンシング方法としては、デジタルPCR、ハイブリダイゼーションによるシーケンシング、ナノポアシーケンシング、染色体特異的シーケンシング(例えば、DANSR(選択された領域のデジタル解析))技術が挙げられる。
【0246】
一部の実施形態では、核酸は、シーケンシングされ、シーケンシング産物(例えば、配列リードの一群)は、シーケンシングされた核酸の解析前にまたは解析と同時に処理される。例えば、配列リードは、アライメント、マッピング、フィルタリング、計数、正規化、重み付け、プロファイルの生成などのうちの1つまたは複数、およびこれらの組合せに従って、処理され得る。ある特定の処理ステップをいずれの順序で行ってもよく、ある特定の処理ステップを繰り返してもよい。
【0247】
本開示の方法を使用して、シーケンシング誤り率を低下させることができる。一部の実施形態では、最初の変性させるステップの前に、二本鎖分子をバーコードで標識することができ、その結果、後続の変性、一本鎖ライブラリー調製、およびシーケンシング後に、元々互いに対合していた核酸分子からの配列を関連付けることができる。一部の実施形態では、足場アダプターの最初のライゲーション後、インデックスプライマーのプールが、インデックスPCRを行なうために使用され、その結果、元の試料核酸分子と最初のPCR第1鎖合成からの核酸の両方のコピーが生成され、これらの両方が、同じバーコードまたはUMI(またはその相補体)を含む。元々ハイブリダイズされていた(それ故、相補配列を有する)鎖を関連付けるこれらのまたは他の手段により、両方の鎖についてのシーケンシングリード情報を比較することができ、それらの情報を使用してシーケンシング誤り率を低下させることができる。
【0248】
リードのマッピング
配列リードをマッピングすることができ、指定核酸領域(例えば、染色体またはその一部分)にマッピングするリードの数は、カウントと呼ばれる。任意の好適なマッピング方法(例えば、プロセス、アルゴリズム、プログラム、ソフトウェア、モジュールなど、またはこれらの組合せ)を使用することができる。マッピングプロセスのある特定の態様が、以下に説明される。
【0249】
ヌクレオチド配列リード(すなわち、物理的なゲノム位置が不明である断片からの配列情報)のマッピングは、いくつかの方法で行うことができ、多くの場合、得られた配列リードと参照ゲノム内のマッチする配列とのアライメントを含む。そのようなアライメントでは、配列リードは、一般に、参照配列とアライメントされ、アライメントしているものは、「マッピングされている」と、「マッピングされた配列リード」と、または「マッピングされたリード」と言われる。ある特定の実施形態では、マッピングされた配列リードは、「ヒット」または「カウント」と呼ばれる。一部の実施形態では、マッピングされた配列リードは、様々なパラメーターに従ってまとめられ、下でさらに詳細に論じられる特定のゲノム部分に割り当てられる。
【0250】
用語「アライメントされた」、「アライメント」または「アライメントすること」は、マッチ(例えば、同一性100%)または部分的マッチとして識別され得る、2つまたはそれより多くの核酸配列を一般に指す。アライメントを手作業で行うことができ、またはコンピュータ(例えば、ソフトウェア、プログラム、モジュールもしくはアルゴリズム)により行うことができ、この非限定的な例としては、ILLUMINA Genomics Analysis pipelineの一部として配給されているEfficient Local Alignment of Nucleotide Data(ELAND)コンピュータプログラムが挙げられる。配列リードのアライメントは、100%配列マッチであり得る。一部の事例でには、アライメントは、100%未満の配列マッチ(すなわち、非完璧マッチ、部分的マッチ、部分的アライメント)である。一部の実施形態では、アライメントは、約99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%または75%マッチである。一部の実施形態では、アライメントは、ミスマッチを含む。一部の実施形態では、アライメントは、1、2、3、4または5つのミスマッチを含む。2つまたはそれより多くの配列を、どちらかの鎖(例えば、センスまたはアンチセンス鎖)を使用してアライメントすることができる。ある特定の実施形態では、核酸配列は、別の核酸配列の逆相補鎖とアライメントされる。
【0251】
様々な計算論的方法を使用して、各配列リードを一部分にマッピングすることができる。配列をアライメントするために使用することができるコンピュータアルゴリズムの非限定的な例としては、限定ではないが、BLAST、BLITZ、FASTA、BOWTIE 1、BOWTIE 2、ELAND、MAQ、PROBEMATCH、SOAP、BWAもしくはSEQMAP、またはその変形形態、またはそれらの組合せが挙げられる。一部の実施形態では、配列リードを参照ゲノム内の配列とアライメントすることができる。一部の実施形態では、配列リードを、例えば、GenBank、dbEST、dbSTS、EMBL(European Molecular Biology Laboratory)およびDDBJ(日本DNAデータバンク)を含む、当技術分野において公知の核酸データベースにおいて見つけることができ、および/またはそのようなデータベース内の配列とアライメントすることができる。BLASTまたは類似のツールを使用して、識別された配列を配列データベースに対して検索することができる。次いで、検索ヒットを使用して、例えば、識別された配列を適切な部分にソートすることができる(以下に説明される)。
【0252】
一部の実施形態では、リードは、参照ゲノム内の部分に一意的にマッピングすることもあり、または非一意的にマッピングすることもある。リードは、それが参照ゲノム内の単一の配列とアライメントした場合、「一意的にマッピングされた」と考えられる。リードは、それが参照ゲノム内の2つまたはそれより多くの配列とアライメントした場合、「非一意的にマッピングされた」と考えられる。一部の実施形態では、非一意的にマッピングされたリードは、さらなる解析(例えば、定量化)から除外される。ある特定の実施形態では、参照ゲノムとマッピングされた個々の試料からのリードとの間に存在し得る一塩基多型を考慮するために、ある特定の少しのミスマッチ(0~1)が許可され得る。一部の実施形態では、いかなる程度のミスマッチも、参照配列へのリードのマッピングに許可されない。
【0253】
本明細書で使用される場合、用語「参照ゲノム」は、対象からの識別された配列を参照するために使用することができる任意の生物またはウイルスについての任意の特定の既知のシーケンシングまたは特徴付けされたゲノムを指し、これは、部分的なものか完全なものかを問わない。例えば、ヒト対象にはもちろん多くの他の生物にも使用される参照ゲノムは、ワールドワイドウェブURL ncbi.nlm.nih.govのNational Center for Biotechnology Informationで見つけることができる。「ゲノム」は、核酸配列で表される、生物またはウイルスの完全遺伝情報を指す。本明細書で使用される場合、参照配列または参照ゲノムは、多くの場合、1個体または複数の個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、1名または複数名のヒト個体からの組み立てられたまたは部分的に組み立てられたゲノム配列である。一部の実施形態では、参照ゲノムは、染色体に割り当てられた配列を含む。
【0254】
ある特定の実施形態では、マッピング能力は、ゲノム領域(例えば、部分、ゲノム部分)について評定される。マッピング能力は、ヌクレオチド配列リードを参照ゲノムの一部分と明確にアライメントする能力であり、通常は、例えば0、1、2またはそれより多くのミスマッチを含む、指定数までのミスマッチである。所与のゲノム領域についての予想マッピング能力は、あらかじめ設定されたリード長についてスライディングウインドウアプローチを使用すること、および結果として得られるリードレベルのマッピング能力の値を平均することにより、推定することができる。固有ヌクレオチド配列の伸長部を含むゲノム領域が高いマッピング能力値を有することもある。
【0255】
ペアエンドシーケンシングの場合、好適なマッピングおよび/またはアライメントプログラムまたはアルゴリズムの使用によりリードを参照ゲノムにマッピングすることができ、そのようなプログラムの非限定的な例としては、BWA(Li H. and Durbin R. (2009)Bioinformatics 25, 1754-60)、Novoalign[Novocraft (2010)]、Bowtie(Langmead B, et al., (2009) Genome Biol. 10:R25)、SOAP2(Li R, et al., (2009) Bioinformatics 25, 1966-67)、BFAST(Homer N, et al., (2009) PLoS ONE 4, e7767)、GASSST(Rizk, G. and Lavenier, D. (2010) Bioinformatics 26, 2534-2540)、およびMPscan(Rivals E., et al. (2009) Lecture Notes in Computer Science 5724, 246-260)などが挙げられる。好適なトリミングおよび/またはマージングプログラムまたはアルゴリズムを使用することによりリードをトリミングおよび/またはマージすることができ、そのようなプログラムまたはアルゴリズムの非限定的な例としては、Cutadapt、trimmomatic、SeqPrep、およびusearchが挙げられる。シーケンシングリード長より短い核酸鋳型からのものなどの一部の対合末端リードは、フォワードリードとリバースリードの両方によりシーケンシングされた部分を有することができ、そのような事例では、フォワードリードとリバースリード間のオーバーラップを使用してフォワードリードとリバースリードを単一のリードにマージすることができる。オーバーラップしていないリード、または十分にオーバーラップしていないリードは、マージしていない状態のままであることもあり、対合リードとしてマッピングされることもある。ペアエンドリードは、好適なショートリードアライメントプログラムまたはアルゴリズムを使用して、マッピングおよび/またはアライメントすることができる。ショートリードアライメントプログラムの非限定的な例としては、BarraCUDA、BFAST、BLASTN、BLAT、Bowtie、BWA、CASHX、CUDA-EC、CUSHAW、CUSHAW2、drFAST、ELAND、ERNE、GNUMAP、GEM、GensearchNGS、GMAP、Geneious Assembler、iSAAC、LAST、MAQ、mrFAST、mrsFAST、MOSAIK、MPscan、Novoalign、NovoalignCS、Novocraft、NextGENe、Omixon、PALMapper、Partek、PASS、PerM、QPalma、RazerS、REAL、cREAL、RMAP、rNA、RTG、Segemehl、SeqMap、Shrec、SHRiMP、SLIDER、SOAP、SOAP2、SOAP3、SOCS、SSAHA、SSAHA2、Stampy、SToRM、Subread、Subjunc、Taipan、UGENE、VelociMapper、TimeLogic、XpressAlign、ZOOMなど、またはこれらの組合せが挙げられる。ペアエンドリードは、参照ゲノムに従って、同じポリヌクレオチド断片の反対側の末端にマッピングされることが多い。一部の実施形態では、リードメイトが独立してマッピングされる。一部の実施形態では、両方の配列リードからの(すなわち、各末端からの)情報は、マッピングプロセスで因数分解される。参照ゲノムは、ペアエンドリードメイト間に位置する核酸の配列を決定および/または推測するために使用されることが多い。用語「不一致リードペア」は、本明細書で使用される場合、リードメイトの一方または両方が、一つには、連続するヌクレオチドのセグメントにより定義される、参照ゲノムの同じ領域に明確にマッピングすることができないリードメイトのペアを含む、ペアエンドリードを指す。一部の実施形態では、不一致リードペアは、参照ゲノムの予想外の位置にマッピングする、ペアエンドリードメイトである。参照ゲノムの予想外の位置の非限定的な例としては、(i)2つの異なる染色体、(ii)所定の断片サイズより大きい(例えば、300bpより大きい、500bpより大きい、1000bpより大きい、5000bpより大きい、もしくは10,000bpより大きい)断片サイズによって隔てられている位置、(iii)参照配列と合致しない方向(すなわち、反対方向)など、またはこれらの組合せが挙げられる。一部の実施形態では、不一致リードメイトは、試料中の鋳型ポリヌクレオチド断片の長さ(例えば、長さ代表値、所定の断片サイズ)または予想長に従って識別される。例えば、試料中のポリヌクレオチド断片の長さ代表値または予想長を超える長さによって隔てられている位置にマッピングするリードメイトは、不一致リードペアとして識別されることもある。反対方向にマッピングするリードペアは、リードのうちの一方の逆相補鎖を使うこと、および参照配列の同じ鎖を使用して両方のリードのアライメントを比較することにより、決定されることもある。不一致リードペアは、当技術分野において公知のまたは本明細書に記載される任意の好適な方法および/またはアルゴリズム(例えば、SVDetect、Lumpy、BreakDancer、BreakDancerMax、CREST、DELLYなど、またはこれらの組合せ)により識別することができる。
【0256】
配列リード定量化
選択された特徴または変数に基づいてマッピングまたは分割される配列リードを定量化して、1つまたは複数の部分(例えば、参照ゲノムの部分)にマッピングされるリードの量または数を決定することができる。ある特定の実施形態では、部分またはセグメントにマッピングされる配列リードの量は、カウントまたはリード密度と呼ばれる。
【0257】
カウントは、多くの場合、ゲノム部分と関連付けられる。一部の実施形態では、カウントは、部分にマッピングされた(すなわち、部分と関連付けられた)配列リードの一部またはすべてから決定される。ある特定の実施形態では、カウントは、部分の群(例えば、セグメントまたは領域内の部分)にマッピングされた配列リードの一部またはすべてから決定される。
【0258】
カウントは、好適な方法、操作または数学的プロセスにより決定することができる。カウントは、セグメントに対応するゲノム部分もしくはゲノム部分の群にマッピングされた、ゲノムの小領域(例えば、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域)に対応する部分の群にマッピングされた、および/または、ときには、ゲノムに対応する部分の群にマッピングされた、すべての配列リードの直和であることもある。リード定量化は、比であることもあり、領域a内の部分についての定量化の領域b内の部分についての定量化に対する比であることもある。領域aは、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域および/または性染色体領域であることもある。領域bは、独立して、1つの部分、セグメント領域、コピー数変異領域、コピー数変更領域、コピー数重複領域、コピー数欠失領域、微細重複領域、微細欠失領域、染色体領域、常染色体領域、性染色体領域、すべての常染色体を含む領域、性染色体を含む領域、および/またはすべての染色体を含む領域であることもある。
【0259】
一部の実施形態では、カウントは、生配列リードおよび/またはフィルタリングされた配列リードから導出される。ある特定の実施形態では、カウントは、ゲノム部分にまたはゲノム部分の群(例えば、領域内のゲノム部分)にマッピングされた配列リードの代表値、平均値または合計である。一部の実施形態では、カウントは、不確定値に関連付けられる。カウントは、調整されることもある。カウントは、重み付けされた、除去された、フィルタリングされた、正規化された、調整された、平均された、平均値として導出された、中央値として導出された、加算された、またはこれらの組合せが施された、ゲノム部分または部分の群に関連付けられた配列リードに従って、調整することができる。
【0260】
配列リード定量化は、リード密度であることもある。リード密度を、ゲノムの1つまたは複数のセグメントについて決定および/または生成することができる。ある特定の事例では、リード密度を、1つまたは複数の染色体について決定および/または生成することができる。一部の実施形態では、リード密度は、参照ゲノムのセグメントまたは一部分にマッピングされた配列リードのカウントの定量的測度を含む。リード密度を、好適なプロセスにより決定することができる。一部の実施形態では、リード密度は、好適な分布および/または好適な分布関数により決定される。分布関数の非限定的な例としては、確率関数、確率分布関数、確率密度関数(PDF)、カーネル密度関数(カーネル密度推定)、累積分布関数、確率質量関数、離散確率分布、絶対連続単変量分布など、任意の好適な分布、またはこれらの組合せが挙げられる。リード密度は、好適な確率密度関数から導出される密度推定であり得る。密度推定は、基礎をなす確率密度関数の推定値を実測データに基づいて構築することである。一部の実施形態では、リード密度は、密度推定(例えば、確率密度推定、カーネル密度推定)を含む。各々の部分が配列リードのカウントを構成する、ゲノムの1つまたは複数の部分の各々についての密度推定を生成することを含むプロセスに従って、リード密度を生成することができる。部分またはセグメントにマッピングされた、正規化および/または重み付けされたカウントについて、リード密度を生成することができる。一部の事例では、部分またはセグメントにマッピングされた各リードは、リード密度に寄与することができ、値(例えば、カウント)は、本明細書に記載される正規化プロセスから得られるその重みに等しくなる。一部の実施形態では、1つまたは複数の部分またはセグメントについてのリード密度が調整される。リード密度を、好適な方法により調整することができる。例えば、1つまたは複数の部分についてのリード密度に重み付けすることができ、および/またはリード密度を正規化することができる。
【0261】
所与の部分またはセグメントについて定量化されたリードは、1つの供給源からのものであることもあり、または異なる供給源からのものであることもある。一例では、がんに罹患しているまたはがんの罹患が疑われる対象からの核酸から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、健康な細胞(すなわち、非がん細胞)とがん細胞(例えば、腫瘍細胞)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、がん細胞核酸からのものであり、同じ部分にマッピングされたリードの一部は、非がん細胞核酸からのものである。別の例では、胎児を宿している妊娠している雌からの核酸試料から、リードを得ることができる。そのような状況では、1つまたは複数の部分にマッピングされたリードは、胎児と胎児の母(例えば、妊娠している雌対象)の両方を代表するリードであることが多い。ある特定の実施形態では、ある部分にマッピングされたリードの一部は、胎児ゲノムからのものであり、同じ部分にマッピングされたリードの一部は、母体ゲノムからのものである。
【0262】
分類およびそれらの使用
本明細書に記載される方法は、上記の試料または供給源の1つまたは複数の特性を示すアウトカムを提供することができる。本明細書に記載される方法は、被検試料(例えば、医学的状態の存在もしくは非存在および/または表現型を決定するアウトカムを提供するもの)についての表現型および/または医学的状態の存在もしくは非存在を示すアウトカムを提供することもある。アウトカムは、分類プロセスの一部であることが多く、分類(例えば、試料もしくは供給源の1つもしくは複数の特性、ならびに/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の分類)は、アウトカムに基づくこともあり、および/またはアウトカムを含むこともある。アウトカムおよび/または分類は、分類プロセス(例えば、統計値)において試料および/もしくは供給源の1つもしくは複数の特性ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在の判定を容易にする、被検試料についてのデータ処理の結果に基づくこともあり、および/またはそのような結果を含むこともある。アウトカムおよび/または分類は、試料もしくは供給源の1つもしくは複数の特性、ならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を決定するスコアをあるいはそのような特性ならびに/または存在もしくは非存在のコールを含むこともあり、またはそのようなスコアもしくはコールに基づくこともある。ある特定の実施形態では、アウトカムおよび/または分類は、分類プロセスにおいて試料もしくは供給源の1つもしくは複数の特性をならびに/または遺伝子型、表現型、遺伝的変異、遺伝的変更および/もしくは医学的状態の存在もしくは非存在を予測および/または判定する、結論を含む。
【0263】
アウトカムおよび/または分類の任意の好適な表現を提供することができる。アウトカムおよび/または分類は、確率の1つまたは複数の考察に関連して本明細書に記載される処理方法を使用して生成された1つまたは複数の数値に基づくこともあり、および/またはそのような数値を含むこともある。利用することができる値の非限定的な例としては、感度、特異度、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、倍数性値、適合した少数派種の分率、面積比、中央値レベルなど、またはこれらの組合せが挙げられる。一部の実施形態では、アウトカムおよび/または分類は、リード密度、リード密度プロファイルおよび/またはプロット(例えば、プロファイルプロット)を含む。ある特定の実施形態では、複数の値が、ときにはそのような値についてのプロファイル(例えば、zスコアプロファイル、p値プロファイル、カイ値プロファイル、パイ値プロファイル、t検定の結果、値のプロファイルなど、またはこれらの組合せ)に関して、一緒に解析される。確率の考察は、試料または供給源の1つもしくは複数の特性の判定、ならびに/または対象が、遺伝子型、表現型、遺伝的変異および/もしくは医学的状態を有するリスクがあるか、もしくは有しているかの判定を容易にすることができ、前述のことを決定するアウトカムおよび/または分類が、そのような考察を含むこともある。
【0264】
ある特定の実施形態では、アウトカムおよび/または分類は、被検試料について遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在のリスクもしくは確率を予測および/または判定する結論に基づく、ならびに/またはそのような結論を含む。結論は、本明細書に記載されるデータ解析方法から決定された値(例えば、確率、確実性および/または不確実性を示す統計値(例えば、標準偏差、中央絶対偏差(MAD)、確実性の測度、信頼度の測度、被検試料について得られた値が特定の値範囲内または外にある確実性または信頼度の測度、不確実性の測度、被検試料について得られた値が特定の値範囲内または外にある不確実性の測度、変動係数(CV)、信頼レベル、信頼区間(例えば、約95%信頼区間)、標準スコア(例えば、zスコア)、カイ値、パイ値、t検定の結果、p値、感度、特異度など、またはこれらの組合せ)に基づくこともある。アウトカムおよび/または分類は、特定の被検試料についての検査室検査レポートに、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関連する確率(例えば、オッズ比、p値)、尤度またはリスク因子として表示されることもある。被検試料についてのアウトカムおよび/または分類は、特定の遺伝子型、表現型、遺伝的変異および/または医学的状態に関して「陽性」または「陰性」として提供されることもある。例えば、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在が判定された場合、検査室検査レポートに「陽性」と表示されることもあり、ときには、アウトカムおよび/または分類は、特定の被検試料について、遺伝子型、表現型、遺伝的変異および/または医学的状態の非存在が判定された場合、検査室検査レポートに「陽性」と表示される。アウトカムおよび/または分類は、データ処理で判定されることもあり、データ処理で使用される仮説を含むこともある。
【0265】
分類プロセスで生成される分類について、真陽性、偽陽性、真陰性および偽陰性という4つのタイプが概して存在する。用語「真陽性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「偽陽性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の存在を指す。用語「真陰性」は、本明細書で使用される場合、被検試料について正しく判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。用語「偽陰性」は、本明細書で使用される場合、被検試料について誤って判定された遺伝子型、表現型、遺伝的変異、または医学的状態の非存在を指す。分類プロセスについて性能の次の2つの測度:(i)一般に、陽性であると正しく識別される予測陽性の分率である、感度値;および(ii)一般に、陰性であると正しく識別される予測陽性の分率である、特異度値を、これらの存在比に基づいて算出することができる。
【0266】
ある特定の実施形態では、分類プロセスについて生成される検査室検査レポートは、検査性能の測度(例えば、感度および/または特異度)、および/または信頼度の測度(例えば、信頼レベル、信頼区間)を含む。検査性能および/または信頼度の測度は、被検試料についての検査室検査を行う前に行われる臨床検証研究から得られることもある。ある特定の実施形態では、感度、特異度および/または信頼度のうちの1つまたは複数は、パーセンテージとして表される。一部の実施形態では、感度、特異度または信頼レベルの各々について独立して表されるパーセンテージは、約90%より高い(例えば、約90、91、92、93、94、95、96、97、98または99%であるか、または99%より高い(例えば、約99.5%であるかそれより高い、約99.9%であるかそれより高い、約99.95%であるかそれより高い、約99.99%であるかそれより高い))。特定の信頼レベル(例えば、約90%~約99.9%(例えば約95%)の信頼レベル)について表される信頼区間を値の範囲として表すことができ、そのような信頼区間は、特定の信頼レベルについての感度および/または特異度の範囲として表されることもある。一部の実施形態での変動係数(CV)は、パーセンテージとして表され、パーセンテージは、約10%またはそれ未満(例えば、約10、9、8、7、6、5、4、3、2もしくは1%、または1%未満(例えば、約0.5%もしくはそれ未満、約0.1%もしくはそれ未満、約0.05%もしくはそれ未満、約0.01%もしくはそれ未満))であることもある。ある特定の実施形態での(例えば、特定のアウトカムおよび/または分類が偶然によるものでない)確率は、標準スコア(例えば、zスコア)、p値、またはt検定の結果として表される。一部の実施形態では、アウトカムおよび/または分類についての測定分散、信頼レベル、信頼区間、感度、特異度など(例えば、信頼度パラメーターと総称される)は、本明細書に記載される1つまたは複数のデータ処理操作を使用して生成することができる。
【0267】
被検試料についてのアウトカムおよび/または分類は、医療専門家または他の有資格者(例えば、医師もしくは助手)により発注されることが多く、彼らに提供されることが多く、彼らが、アウトカムおよび/または分類を、被検試料が採取される対象に伝送する。ある特定の実施形態では、アウトカムおよび/または分類は、好適な視覚媒体(例えば、機械の周辺機器またはコンポーネント、例えば、プリンターまたはディスプレイ)を使用して提供される。分類および/またはアウトカムは、医療専門家または有資格者にレポートの形態で提供されることが多い。レポートは、アウトカムおよび/または分類(例えば、値、試料もしくは供給源の1つもしくは複数の特性、または遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在の評定もしくは確率)の表示を通常は含み、関連信頼度パラメーターを含むこともあり、アウトカムおよび/または分類を生成するために使用された検査についての性能の測度を含むこともある。レポートは、追跡調査手順(例えば、アウトカムまたは分類を確認する手順)の助言を含むこともある。レポートは、染色体またはその一部分の視覚表示(例えば、染色体イディオグラムまたはカリオグラム)を含むこともあり、被検試料について識別された染色体の重複および/または欠失領域の視覚化(例えば、染色体欠失または重複についての全染色体の視覚化;欠失し領域または重複領域が示されている全染色体の視覚化;重複または欠失した染色体の部分の視覚化;染色体の部分の欠失イベントにおいて残存する染色体の部分の視覚化)を示すこともある。
【0268】
レポートを、医療従事者または他の有資格者による遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在の判定を容易にする好適な形式で表示することができる。レポートの作成に使用するために好適な形式の非限定的な例としては、デジタルデータ、グラフ、2Dグラフ、3Dグラフおよび4Dグラフ、画像(例えば、jpg、ビットマップ(例えば、bmp)、pdf、tiff、gif、raw、pngなど、もしくは好適な形式)、統計図表、チャート、表、棒グラフ、円グラフ、図、フローチャート、散布図、マップ、ヒストグラム、密度チャート、関数グラフ、回路図、ブロック図、バブルマップ、信号空間ダイヤグラム、コンター図、統計地図、クモの巣グラフ、ベン図、計算図表など、または前述のものの組合せが挙げられる。
【0269】
レポートを、コンピュータにより、および/またはヒトによるデータ入力により、作成してもよく、好適な電子媒体を使用して(例えば、インターネット経由で、コンピュータ経由で、ファクシミリ経由で、同じもしくは異なる物理的位置で1つのネットワークの場所から別の場所に)、またはデータを送信もしくは受信する別の方法(例えば、メールサービス、クーリエサービスなど)により、伝送および通信することができる。レポートを伝送するための通信媒体の非限定的な例としては、聴覚ファイル、コンピュータ可読ファイル(例えば、pdfファイル)、紙のファイル、検査室ファイル、診療記録ファイル、または前の段落に記載の任意の他の媒体が挙げられる。検査室ファイルまたは診療記録ファイルは、ある実施形態では、有形形態であってもよく、または電子形態(例えば、コンピュータ可読形態)であってもよい。レポートが作成され、伝送された後、アウトカムおよび/または分類を含む書面による表示および/またはグラフィック表示を好適な通信媒体経由で得ることによりレポートを受け取ることができ、これを見直すことによって、医療専門家または他の有資格者は、試料または供給源の1つもしくは複数の特性、または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在について判定することができる。
【0270】
アウトカムおよび/または分類は、検査室により提供されることがあり、検査室から得られる(例えば、検査室ファイルから得られる)ことがある。検査室ファイルは、試料もしくは供給源の1つもしくは複数の特性および/または被検試料についての遺伝子型、表現型、遺伝的変異および/もしくは医学的状態の存在もしくは非存在を判定するための1つまたは複数の検査を行う検査室により、作成され得る。検査室職員(例えば、主席研究員)は、アウトカムおよび/または分類の根拠となる被検試料に関連する情報(例えば、検査プロファイル、参照プロファイル、検査値、参照値、逸脱レベル、患者情報)を解析することができる。近いまたは疑わしい遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在に関するコールについては、検査室職員は、被検対象からの同じ(例えば、同じ試料のアリコート)または異なる被検試料を使用して同じ手順を再実行することができる。検査室は、検査室ファイルからの遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を評定する職員と同じ場所にあってもよく、または異なる場所(例えば、別の国)にあってもよい。例えば、検査室ファイルをある場所で作成し、別の場所に伝送することができ、そこで、そのファイル内の被検試料についての情報が、医療専門家または他の有資格者により評定され、必要に応じて、被検試料が採取された対象に伝送される。検査室が、被検試料についてのゲノム不安定性、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートを作成および/または伝送することもある。検査室検査レポートを作成する検査室は、認定された検査室であることもあり、臨床検査室改善法(CLIA)のもとで認定された検査室であることもある。
【0271】
アウトカムおよび/または分類は、対象の診断の構成要素であることもあり、ときには、アウトカムおよび/または分類は、被検試料についての診断を下すことの一部として利用および/または評定される。例えば、医療専門家または他の有資格者は、アウトカムおよび/または分類を解析し、そのアウトカムおよび/もしくは分類に基づいて、または一部は基づいて、診断を下すことができる。一部の実施形態では、医学的状態、疾患、症状または異常の判定、検出または診断は、遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を決定するアウトカムおよび/または分類の使用を含む。したがって、本明細書に記載される方法により生成されたアウトカムまたは分類に従って、ならびに必要に応じて、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在についての分類を含む検査室レポートの作成および伝送に従って、被検試料についての遺伝子型、表現型、遺伝的変異および/または医学的状態の存在または非存在を診断する方法が、本明細書で提供される。
【0272】
機械、ソフトウェアおよびインターフェース
本明細書に記載されるある特定のプロセスおよび方法(例えば、配列リードのサブセットを選択するプロセスおよび方法、配列リードプロファイルを生成するプロセスおよび方法、配列リードデータを処理するプロセスおよび方法、配列リード定量化を処理するプロセスおよび方法、配列リードデータまたは配列リードプロファイルに基づいて試料の1つまたは複数の特性を判定するプロセスおよび方法)は、多くの場合、頭の中で行なうには複雑すぎ、コンピュータ、マイクロプロセッサー、ソフトウェア、モジュールまたは他の機械なしでは遂行することができない。本明細書に記載される方法は、コンピュータ実装方法であり得、方法の1つまたは複数の部分は、1つまたは複数のプロセッサー(例えば、マイクロプロセッサー)、コンピュータ、システム、装置または機械(例えば、マイクロプロセッサー制御型機械)により遂行されることもある。
【0273】
使用に好適なコンピュータ、システム、装置、機械およびコンピュータプログラム製品は、多くの場合、コンピュータ可読記憶媒体を含み、またはコンピュータ可読記憶媒体とともに利用される。コンピュータ可読記憶媒体の非限定的な例としては、メモリー、ハードディスク、CD-ROM、フラッシュメモリーデバイスなどが挙げられる。コンピュータ可読記憶媒体は、一般に、コンピュータハードウェアであり、多くの場合、非一過性コンピュータ可読記憶媒体である。コンピュータ可読記憶媒体は、コンピュータ可読伝送媒体ではなく、後者のコンピュータ可読伝送媒体は、それ自体が伝送信号である。
【0274】
実行可能プログラムが記憶されているコンピュータ可読記憶媒体であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、コンピュータ可読記憶媒体が、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、コンピュータ可読記憶媒体も、提供される。実行可能プログラムが記憶されているコンピュータ可読記憶媒体を含む、システム、機械、装置およびコンピュータプログラム製品であって、プログラムが、マイクロプロセッサーに、本明細書に記載される方法を遂行するように命令する、システム、機械、装置およびコンピュータプログラム製品も、本明細書で提供される。実行可能プログラムモジュールが記憶されているコンピュータ可読記憶媒体を含む、システム、機械および装置であって、プログラムモジュールが、マイクロプロセッサーに、本明細書に記載される方法の一部を遂行するように命令する、システム、機械および装置も、提供される。
【0275】
コンピュータプログラム製品も提供される。コンピュータプログラム製品は、内部で実施されるコンピュータ可読プログラムコードを含む、コンピュータ使用可能媒体であって、コンピュータ可読プログラムコードが、本明細書に記載される方法または方法の一部を実行するための命令を受けるように構成されている、コンピュータ使用可能媒体を、多くの場合、含む。コンピュータ使用可能媒体および可読プログラムコードは、伝送媒体(すなわち、それ自体が伝送信号)ではない。コンピュータ可読プログラムコードは、プロセッサー、コンピュータ、システム、装置または機械により実行されるように構成されている。
【0276】
一部の実施形態では、本明細書に記載される方法(例えば、配列リードのサブセットを選択する方法、配列リードプロファイルを生成する方法、配列リードデータを処理する方法、配列リード定量化を処理する方法、配列リードデータまたは配列リードプロファイルに基づいて試料の1つまたは複数の特性を判定する方法)は、自動化法により遂行される。一部の実施形態では、本明細書に記載される方法の1つまたは複数のステップは、マイクロプロセッサーおよび/もしくはコンピュータにより行われ、ならびに/またはメモリーと連動して行われる。一部の実施形態では、自動化法は、本明細書に記載される方法を遂行する、ソフトウェア、モジュール、マイクロプロセッサー、同様のものを含む周辺機器、および/または機械で、実施される。本明細書で使用される場合、ソフトウェアは、マイクロプロセッサーにより実行された場合に本明細書に記載のコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。
【0277】
機械、ソフトウェアおよびインターフェースを使用して、本明細書に記載される方法を行うことができる。機械、ソフトウェアおよびインターフェースを使用して、ユーザーは、特定の情報、プログラムまたはプロセスを使用する(例えば、配列リードデータを処理する、配列リード定量化を処理する、および/またはアウトカムを提供する)ための選択肢の入力、リクエスト、クエリまたは決定を行うことができ、これは、例えば、統計解析アルゴリズム、統計的有意性アルゴリズム、統計アルゴリズム、反復ステップ、検証アルゴリズム、およびグラフィック表示の実行を伴い得る。一部の実施形態では、データセットは、ユーザーにより入力情報として入力されることがあり、ユーザーは、好適なハードウェア媒体(例えば、フラッシュドライブ)により1つもしくは複数のデータセットをダウンロードすることができ、ならびに/またはユーザーは、アウトカムのその後の処理および/もしくは提供のためにデータセットをあるシステムから別のシステムに送信する(例えば、配列リード処理のためにシーケンサーからコンピュータシステムに配列リードデータを送信する;処理された配列リードデータを、アウトカムおよび/もしくはレポートをさらに処理するおよび/もしくは生じさせるために、コンピュータシステムに送信する)ことができる。
【0278】
システムは、通常は、1つまたは複数の機械を含む。各機械は、メモリー、1つまたは複数のマイクロプロセッサー、および命令のうちの1つまたは複数を含む。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、同じ場所に位置してもよく、機械の一部もしくはすべてが、異なる場所に位置してもよく、機械のすべてが、一カ所に位置してもよく、および/または機械のすべてが、異なる場所に位置してもよい。システムが、2つまたはそれより多くの機械を含む場合、機械の一部もしくはすべてが、ユーザーと同じ場所に位置してもよく、機械の一部もしくはすべてが、ユーザーとは異なる場所に位置してもよく、機械のすべてが、ユーザーと同じ場所に位置してもよく、および/または機械のすべてが、ユーザーとは異なる1つもしくは複数の場所に位置してもよい。
【0279】
システムは、計算機と、シーケンシング装置またはシーケンシング機とを含むことがあり、この場合、シーケンシング装置またはシーケンシング機は、物理的核酸を受け取り、配列リードを生成するように構成されており、計算装置は、シーケンシング装置またはシーケンシング機からのリードを処理するように構成されている。計算機は、配列リードからアウトカム(例えば、試料の特性)を判定するように構成されていることもある。
【0280】
ユーザーは、例えば、ソフトウェアに対してクエリを行うことができ、その結果、インターネットアクセス経由でデータセットを獲得することができ、ある特定の実施形態では、プログラム可能マイクロプロセッサーを、所与のパラメーターに基づいて好適なデータセットを獲得するように促すことができる。プログラム可能マイクロプロセッサーにより、ユーザーが、所与のパラメーターに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促されることもある。プログラム可能マイクロプロセッサーは、ユーザーに、インターネット経由で見つかった情報、他の内部または外部情報などに基づいてマイクロプロセッサーにより選択された1つまたは複数のデータセット選択肢を選択するように促すことができる。選択肢は、方法、機械、装置、コンピュータプログラム、または実行可能プログラムが記憶されている非一過性コンピュータ可読記憶媒体の、1つまたは複数のデータ特徴選択、1つまたは複数の統計アルゴリズム、1つまたは複数の統計解析アルゴリズム、1つまたは複数の統計的有意性アルゴリズム、反復ステップ、1つまたは複数の検証アルゴリズム、および1つまたは複数のグラフィック表示を選択するために、選択され得る。
【0281】
本明細書で取り扱われるシステムは、例えば、ネットワークサービス、ラップトップシステム、デスクトップシステム、携帯型システム、携帯情報端末、コンピューティングキオスクなどのような、コンピュータシステムの一般的コンポーネントを含み得る。コンピュータシステムは、ユーザーによるシステムへのデータの入力を可能にする、キーボード、タッチスクリーン、マウス、音声認識または他の手段などの、1つまたは複数の入力手段を含み得る。システムは、ディスプレイスクリーン(例えば、CRTもしくはLCD)、スピーカー、FAX機、プリンター(例えば、レーザー、インクジェット、インパクト、白黒もしくはカラープリンター)、または情報(例えば、アウトカムおよび/もしくはレポート)の視覚的、聴覚的および/もしくはハードコピー出力の提供に有用な他の出力要素を含むがこれらに限定されない、1つまたは複数の出力要素をさらに含み得る。
【0282】
システム内で、入力および出力コンポーネントを中央処理ユニットに接続することができ、この中央処理ユニットは、数あるコンポーネントの中でも特に、プログラム命令を実行するためのマイクロプロセッサーと、プログラムコードおよびデータを記憶するためのメモリーとを含み得る。一部の実施形態では、プロセスを、単一の地理的位置に位置するシングルユーザーシステムとして実行することができる。ある特定の実施形態では、プロセスを、マルチユーザーシステムとして実行することができる。マルチユーザーインプリメンテーションの場合、複数の中央処理ユニットをネットワークによって接続することができる。ネットワークは、建物の一カ所にある単一の部署を包含する、ローカルなものであることもあり、建物全体であることもあり、複数の建物にわたることもあり、地域にわたることもあり、国全体にわたることもあり、または世界中であることもある。ネットワークは、プロバイダーにより所有され、制御される、プライベートなものであることもあり、またはユーザーがウェブページにアクセスして入り、情報を取り出す、インターネットに基づくサービスとして実行されることもある。したがって、ある特定の実施形態では、システムは、ユーザーを基準にしてローカルであることもあり、または遠隔であることもある、1つまたは複数の機械を含む。1つの場所または複数の場所の1つより多くの機械にユーザーはアクセスすることができ、順次および/または並行してデータをマッピングおよび/または処理することができる。したがって、複数の機械を、例えば、ローカルネットワーク、遠隔ネットワーク、および/または「クラウド」コンピュータプラットフォームで使用して、データをマッピングおよび/または処理するために、好適な構成および制御を利用することができる。
【0283】
システムは、一部の実施形態では、通信用インターフェースを含むことができる。通信用インターフェースは、コンピュータシステムと1つまたは複数の外部デバイスとの間のソフトウェアおよびデータの転送を可能にする。通信用インターフェースの非限定的な例としては、モデム、ネットワークインターフェース(例えば、イーサネット(登録商標)カード)、通信ポート、PCMCIAスロットおよびカードなどが挙げられる。通信用インターフェース経由で転送されるソフトウェアおよびデータは、一般に、通信用インターフェースによって受信され得る電子、電磁、光および/または他の信号であり得る、信号の形態である。信号は、チャネルを介して通信用インターフェースに提供されることが多い。チャネルは、多くの場合、信号を伝達し、ワイヤもしくはケーブル、光ファイバー、電話線、携帯電話リンク、RFリンクおよび/または他の通信チャネルを使用して、チャネルを実装することができる。したがって、一例では、通信用インターフェースを使用して、信号検出モジュールにより検出され得る信号情報を受信することができる。
【0284】
データは、手動入力デバイスまたは直接データ入力デバイス(DDE)を含むがこれらに限定されない、好適なデバイスおよび/または方法により、入力することができる。手動デバイスの非限定的な例としては、キーボード、コンセプトキーボード、タッチ式スクリーン、ライトペン、マウス、トラッカーボール、ジョイスティック、グラフィックタブレット、スキャナー、デジタルカメラ、ビデオデジタイザーおよび音声認識デバイスが挙げられる。DDEの非限定的な例としては、バーコードリーダー、磁気ストライプコード、スマートカード、磁気インク文字認識、光学式文字認識、光学式マーク認識、およびターンアラウンドドキュメントが、挙げられる。
【0285】
一部の実施形態では、シーケンシング装置またはシーケンシング機からの出力は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、配列リード情報は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、マッピングされた配列リードは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)は、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、核酸断片サイズ(例えば、長さ)と核酸捕捉プロセスからの出力(例えば、ゲノム領域由来のデータ)との組合せは、入力デバイスによって入力することができるデータとして役立ち得る。ある特定の実施形態では、模擬データは、in silicoプロセスにより生成され、模擬データは、入力デバイスによって入力することができるデータとして役立ち得る。用語「in silico」は、コンピュータを使用して遂行される研究および実験を指す。in silicoプロセスとしては、本明細書に記載されるプロセスに従って配列リードをマッピングすることおよびマッピングされた配列リードを処理することが挙げられるが、これらに限定されない。
【0286】
システムは、本明細書に記載されるプロセスまたはプロセスの一部の遂行に有用なソフトウェアを含むことがあり、ソフトウェアは、そのようなプロセスを遂行するための1つまたは複数のモジュール(例えば、シーケンシングモジュール、論理処理モジュール、データ表示構成モジュール)を含むことができる。用語「ソフトウェア」は、コンピュータにより実行された場合にコンピュータ操作を遂行する、コンピュータ可読プログラム命令を指す。1つまたは複数のマイクロプロセッサーにより実行可能な命令が、実行コードとして提供されることもあり、実行コードは、実行された場合、本明細書に記載される方法を1つまたは複数のマイクロプロセッサーに実行させることができる。本明細書に記載されるモジュールは、ソフトウェアとして存在することができ、ソフトウェアで実施される命令(例えば、プロセス、ルーチン、サブルーチン)がマイクロプロセッサーにより実行または遂行され得る。例えば、モジュール(例えば、ソフトウェアモジュール)は、特定のプロセスまたはタスクを遂行するプログラムの一部であり得る。用語「モジュール」は、より大型の機械またはソフトウェアシステムで使用され得る自己完結型機能ユニットを指す。モジュールは、モジュールの機能を行うための一連の命令を含むことができる。モジュールは、データおよび/または情報を変換することができる。データおよび/または情報は、適切な形態であり得る。例えば、データおよび/または情報は、デジタルまたはアナログであり得る。ある特定の実施形態では、データおよび/または情報は、ときにはパケット、バイト、文字またはビットであり得る。一部の実施形態では、データおよび/または情報は、任意の収集された、整理された、または使用可能なデータまたは情報であり得る。データおよび/または情報の非限定的な例としては、好適な媒体、画像、ビデオ、音(例えば、周波数、可聴のまたは非可聴の)、数、定数、値、オブジェクト、時間、関数、命令、マップ、参照、配列、リード、マッピングされたリード、レベル、範囲、閾値、シグナル、これらの表示、表現または変形が挙げられる。モジュールは、データおよび/または情報を受け入れ、または受信し、データおよび/または情報を二次形態に変換し、二次形態を機械、周辺機器、コンポーネントまたは別のモジュールに提供または転送することができる。マイクロプロセッサーは、ある特定の実施形態では、モジュールで命令を実行することができる。一部の実施形態では、1つまたは複数のマイクロプロセッサーは、モジュールまたはモジュール群で命令を実行するために必要とされる。モジュールは、データおよび/または情報を別のモジュール、機械または供給源に提供することができ、データおよび/または情報を別のモジュール、機械または供給源から受信することができる。
【0287】
コンピュータプログラム製品は、有形コンピュータ可読媒体で実施されることもあり、非一過性コンピュータ可読媒体で明白に実施されることもある。モジュールは、コンピュータ可読媒体(例えば、ディスク、ドライブ)に記憶されていることもあり、またはメモリー(例えば、ランダムアクセスメモリー)に記憶されていることもある。モジュール、およびモジュールからの命令を実行することができるマイクロプロセッサーは、機械内または異なる機械内に位置することができる。モジュール、および/またはモジュールの命令を実行することができるマイクロプロセッサーは、ユーザーと同じ場所に位置することができ(例えば、ローカルネットワーク)、またはユーザーとは異なる場所に位置することができる(例えば、遠隔ネットワーク、クラウドシステム)。方法が2つまたはそれより多くのモジュールと連動して行われる実施形態では、モジュールは、同じ機械内に位置することができ、1つまたは複数のモジュールは、同じ物理的な場所の異なる機械内に位置することができ、1つまたは複数のモジュールは、異なる物理的な場所の異なる機械内に位置することができる。
【0288】
機械は、一部の実施形態では、モジュールで命令を行うための少なくとも1つのマイクロプロセッサーを含む。配列リード定量化(例えば、カウント)は、本明細書に記載される方法を行うように構成された命令を実行するマイクロプロセッサーによりアクセスされることもある。マイクロプロセッサーによりアクセスされる配列リード定量化は、システムのメモリー内にあることができ、配列リードカウントにアクセスし、それらを得た後、それらをシステムのメモリーに入れることができる。一部の実施形態では、機械は、マイクロプロセッサー(例えば、1つまたは複数のマイクロプロセッサー)を含み、このマイクロプロセッサーは、モジュールからの1つまたは複数の命令(例えば、プロセス、ルーチンおよび/またはサブルーチン)を遂行および/または実行することができる。一部の実施形態では、機械は、複数のマイクロプロセッサー、例えば、連係しており、並行して働くマイクロプロセッサーを含む。一部の実施形態では、機械は、1つまたは複数の外部マイクロプロセッサー(例えば、内部または外部ネットワーク、サーバー、記憶デバイスおよび/または記憶ネットワーク(例えば、クラウド))で動作する。一部の実施形態では、機械は、モジュール(例えば、1つまたは複数のモジュール)を含む。モジュールを含む機械は、多くの場合、他のモジュールへ、および他のモジュールから、データおよび/または情報の1つまたは複数を受信および転送することができる。
【0289】
ある特定の実施形態では、機械は、周辺機器および/またはコンポーネントを含む。ある特定の実施形態では、機械は、他のモジュール、周辺機器および/またはコンポーネントへ、ならびに他のモジュール、周辺機器および/またはコンポーネントから、データおよび/または情報を転送することができる、1つまたは複数の周辺機器またはコンポーネントを含むことができる。ある特定の実施形態では、機械は、データおよび/または情報を提供する周辺機器および/またはコンポーネントと交信する。ある特定の実施形態では、周辺機器およびコンポーネントは、機械による機能の実行またはモジュールとの直接交信を支援する。周辺機器および/またはコンポーネントの非限定的な例としては、スキャナー、プリンター、ディスプレイ(例えば、モニター、LED、LCTもしくはCRT)、カメラ、マイクロホン、パッド(例えば、ipad(登録商標)、タブレット)、タッチスクリーン、スマートフォン、携帯電話、USB I/Oデバイス、USB大容量記憶デバイス、キーボード、コンピュータマウス、デジタルペン、モデム、ハードドライブ、ジャンプドライブ、フラッシュドライブ、マイクロプロセッサー、サーバー、CD、DVD、グラフィックカード、専用I/Oデバイス(例えば、シーケンサー、光電池、光電子増倍チューブ、光学式読み取り装置、センサーなど)、1つまたは複数のフローセル、流体操作コンポーネント、ネットワークインターフェスコントローラー、ROM、RAM、ワイヤレス転送法およびデバイス(ブルートゥース(登録商標)、WiFiなど)、ワールドワイドウェブ(www)、インターネット、コンピュータおよび/または他のモジュールを含むがこれらに限定されない、好適なコンピュータ周辺機器、I/Oまたは記憶方法またはデバイスが挙げられる。
【0290】
ソフトウェアは、コンピュータ可読媒体に記録されたプログラム命令を含むプログラム製品で提供されることが多く、コンピュータ可読媒体としては、フロッピー(登録商標)ディスク、ハードディスクおよび磁気テープを含む、磁気媒体;ならびにCD-ROMディスク、DVDディスクを含む、光媒体;光磁気ディスク、フラッシュメモリ-デバイス(例えば、フラッシュドライブ)、RAM、フロッピー(登録商標)ディスクなど、ならびにプログラム命令を記録することができる他のそのような媒体が挙げられるが、これらに限定されない。オンラインインプリメンテーションの場合、団体により維持されているサーバーおよびウェブサイトは、遠隔ユーザーにソフトウェアダウンロードを提供するように構成されていることがあり、または遠隔ユーザーは、団体により維持されている遠隔システムにアクセスして、ソフトウェアに遠隔アクセスすることができる。ソフトウェアは、入力情報を得るまたは受信することができる。ソフトウェアは、データを特異的に得るまたは受信するモジュール(例えば、配列リードデータおよび/またはマッピングされたリードデータを受信するデータ受信モジュール)を含むことができ、データを特異的に処理するモジュール(例えば、受信したデータを処理する(例えば、アウトカムおよび/またはレポートをフィルタリングする、正規化する、提供する)処理モジュール)を含むことができる。入力情報を「得ること」および「受信すること」という用語は、データ(例えば、配列リード、マッピングされたリード)を、ローカルもしくは遠隔サイトからコンピュータ通信手段により、人間によるデータ入力により、または任意の他のデータ受信方法により、受信することを指す。入力情報を、それを受信する場所と同じ場所で作成することができ、またはそれを異なる場所で作成し、受信場所に伝送することができる。一部の実施形態では、入力情報は、処理される前に修正される(例えば、処理に適用可能な形式にされる(例えば、表形式にされる))。
【0291】
ソフトウェアは、ある特定の実施形態では、1つまたは複数のアルゴリズムを含むことができる。アルゴリズムは、命令の有限数列に従ってデータを処理するおよび/またはアウトカムもしくはレポートを提供するために、使用され得る。アルゴリズムは、多くの場合、タスクを完了するための定義済み命令のリストである。初期状態から開始して、命令は、定義された一連の連続状態を経て最終的に最終終了状態で終了する計算を記述することができる。ある状態から次の状態への移行は、必ずしも確定的ではない(例えば、一部のアルゴリズムは、乱数性を取り入れている)。例として、限定ではなく、アルゴリズムは、検索アルゴリズム、ソートアルゴリズム、マージアルゴリズム、数値アルゴリズム、グラフアルゴリズム、文字列アルゴリズム、モデリングアルゴリズム、計算幾何アルゴリズム、組合せアルゴリズム、機械学習アルゴリズム、暗号学アルゴリズム、データ圧縮アルゴリズム、構文解析アルゴリズムなどであり得る。アルゴリズムは、1つのアルゴリズム、または組合せで働く2つもしくはそれより多くのアルゴリズムを含み得る。アルゴリズムは、任意の好適な複雑性クラスおよび/またはパラメーター化された複雑性のものであり得る。アルゴリズムは、演算および/またはデータ処理に使用することができ、一部の実施形態では、決定論的または確率論的/予測アプローチで使用することができる。アルゴリズムを好適なプログラミング言語の使用によりコンピュータ環境で実行することができ、そのようなプログラミング言語の非限定的な例は、C、C++、Java(登録商標)、Perl、Python、Fortranなどである。一部の実施形態では、アルゴリズムを、許容誤差、統計解析、統計的有意性、および/または他の情報もしくはデータセットとの比較(例えば、ニューラルネットもしくはクラスタリングアルゴリズムを使用する場合に適用可能)を含むように、構成または修正することができる。
【0292】
ある特定の実施形態では、いくつかのアルゴリズムをソフトウェアでの使用のために実装することができる。これらのアルゴリズムを、一部の実施形態では、生データで訓練することができる。新たな生データ試料ごとに、訓練されたアルゴリズムが、代表処理データセットまたはアウトカムを生成し得る。処理データセットは、処理された親データセットと比較して複雑性が低下したものであることもある。処理セットに基づいて訓練されたアルゴリズムの性能を、一部の実施形態では、感度および特異度に基づいて評定することができる。ある特定の実施形態では、感度および/または特異度が最も高いアルゴリズムを識別し、利用することができる。
【0293】
ある特定の実施形態では、模擬(またはシミュレーション)データは、例えば、アルゴリズムを訓練することまたはアルゴリズムを検査することにより、データ処理を補助することができる。一部の実施形態では、模擬データは、配列リードの異なるグループ分けについての仮定的な様々な抽出試料を含む。模擬データは、現実の集団から予想され得るものに基づくこともあり、またはアルゴリズムを検査するおよび/もしくは正しい分類を割り当てるための偏ったものであることもある。模擬データは、本明細書では「仮想」データとも呼ばれる。ある特定の実施形態では、コンピュータプログラムによりシミュレーションを行うことができる。模擬データセットを使用する場合の可能性のある1つのステップは、識別された結果の信頼度、例えば、ランダム抽出試料が、どれ程、元データとよくマッチするか、または元データを最良に表すのかを、評価することである。1つのアプローチは、選択された試料より良好なスコアを有するランダム試料の確率を推定する、確率値(p値)を算出することである。一部の実施形態では、少なくとも1つの試料が参照試料と(分解変動の有無にかかわらず)マッチすることが仮定される、経験的モデルを評定することができる。一部の実施形態では、例えばポアソン分布などの、別の分布を使用して、確率分布を定義することができる。
【0294】
システムは、ある特定の実施形態では、1つまたは複数のマイクロプロセッサーを含むことがある。マイクロプロセッサーを通信バスに接続することができる。コンピュータシステムは、メインメモリー、多くの場合、ランダムアクセスメモリー(RAM)を含むことがあり、二次メモリーを含むこともできる。一部の実施形態でのメモリーは、非一過性コンピュータ可読記憶媒体を含む。二次メモリーは、例えば、ハードディスクドライブおよび/またはリムーバブル記憶ドライブを含むことができ、リムーバブル記憶ドライブは、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、光ディスクドライブ、メモリーカードなどを意味する。リムーバブル記憶ドライブは、多くの場合、リムーバブル記憶ユニットから読み取る、および/またはリムーバブル記憶ユニットに書き込む。リムーバブル記憶ユニットの非限定的な例としては、例えば、リムーバブル記憶ドライブによって読み取られ得る、かつリムーバブル記憶ドライブに書き込まれ得る、フロッピー(登録商標)ディスク、磁気テープ、光ディスクなどが挙げられる。リムーバブル記憶ユニットは、コンピュータソフトウェアおよび/またはデータが内部に記憶されているコンピュータ使用可能記憶媒体を含むことができる。
【0295】
マイクロプロセッサーは、システム内のソフトウェアを実行することができる。一部の実施形態では、マイクロプロセッサーを、ユーザーが行うことができる本明細書に記載されるタスクを自動的に遂行するようにプログラムすることができる。したがって、マイクロプロセッサー、またはそのようなマイクロプロセッサーにより実行されるアルゴリズムは、ユーザーによる監視も入力も殆どないしは全く必要とするはずがない(例えば、ソフトウェアを、自動的に機能を実行するようにプログラムすることができる)。一部の実施形態では、プロセスの複雑性が非常に高いので、1名の人物、または人物群が、試料の1つまたは複数の特性を判定するのに十分短い時間枠ではプロセスを遂行することができない。
【0296】
一部の実施形態では、二次メモリーは、コンピュータシステムへのコンピュータプログラムまたは他の命令のローディングを可能にするための他の同様の手段を含むことがある。例えば、システムは、リムーバブル記憶ユニットおよびインターフェースデバイスを含むことができる。そのようなシステムの非限定的な例としては、プログラムカートリッジおよびカートリッジインターフェース(例えば、ビデオゲームデバイスに見られるもの)、リムーバブルメモリーチップ(例えば、EPROMまたはPROM)および付随するソケット、ならびにソフトウェアおよびでデータをリムーバブル記憶ユニットからコンピュータシステムに転送することを可能にする他のリムーバブル記憶ユニットおよびインターフェースが、挙げられる。
【0297】
核酸を解析するための方法
核酸を解析するための方法が、本明細書で提供される。
【0298】
核酸の純度および/または品質を評定するための方法が、本明細書で提供される。本明細書に記載される一本鎖ライブラリー調製方法を使用して、核酸の純度および/または品質を評定することができる。
【0299】
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖核酸(ssNA)の純度および/または品質を評定することができる。ssNAは、単一ssNA種(例えば、同じ配列および長さを有するssNA)を含むこともあり、またはssNA種のプール(例えば、異なる配列および/または長さを有するssNA)を含むこともある。一部の実施形態では、ssNAは、一本鎖オリゴヌクレオチドを含む。一部の実施形態では、一本鎖オリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖オリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、ssNAは、一本鎖プローブを含む。一部の実施形態では、一本鎖プローブは、商業生産される。一部の実施形態では、一本鎖プローブは、ユーザーにより生成される。
【0300】
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖リボ核酸(ssRNA)の純度および/または品質を評定することができる。ssRNAは、単一ssRNA種(例えば、同じ配列および長さを有するssRNA)を含むこともあり、またはssRNA種のプール(例えば、異なる配列および/または長さを有するssRNA)を含むこともある。一部の実施形態では、ssRNAは、一本鎖RNAオリゴヌクレオチドを含む。一部の実施形態では、一本鎖RNAオリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖RNAオリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、ssRNAは、一本鎖RNAプローブを含む。一部の実施形態では、一本鎖RNAプローブは、商業生産される。一部の実施形態では、一本鎖RNAプローブは、ユーザーにより生成される。
【0301】
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、一本鎖相補デオキシリボ核酸(sscDNA)の純度および/または品質を評定することができる。sscDNAは、単一sscDNA種(例えば、同じ配列および長さを有するsscDNA)を含むこともあり、またはsscDNA種のプール(例えば、異なる配列および/または長さを有するsscDNA)を含むこともある。一部の実施形態では、sscDNAは、一本鎖cDNAオリゴヌクレオチドを含む。一部の実施形態では、一本鎖cDNAオリゴヌクレオチドは、商業生産される。一部の実施形態では、一本鎖cDNAオリゴヌクレオチドは、ユーザーにより生成される。一部の実施形態では、sscDNAは、一本鎖cDNAプローブを含む。一部の実施形態では、一本鎖cDNAプローブは、商業生産される。一部の実施形態では、一本鎖cDNAプローブは、ユーザーにより生成される。
【0302】
ssNA、ssRNAおよび/またはsscDNAの純度および/または品質を、断片長の評定に従って評定することができる。断片長を決定するための任意の好適な方法を使用して、断片長を決定することができる。一部の実施形態では、断片長は、シングルエンドシーケンシングリードの長さ(例えば、このリード長は、断片全体の長さをカバーする)に従って決定される。一部の実施形態では、断片長は、ペアエンドシーケンシングリードのマッピングされた位置に従って決定される。一部の実施形態では、ssNA、ssRNAおよび/またはsscDNAの純度および/または品質は、断片長プロファイルに従って評定される。断片長プロファイルは、特定の長さを有する断片の定量化を含み得る。一部の実施形態では、ssNA、ssRNAおよび/またはsscDNAの純度および/または品質は、断片長プロファイルにおける主要なssNA、ssRNAおよび/またはsscDNA種の量ならびに副次的なssNA、ssRNAおよび/またはsscDNA種の量に従って評定される。主要な種は、一般に、試料中の最も存在量が多い断片長を指す。主要な種は、評定されることになるssNA、ssRNAおよび/またはsscDNAの所期または予想断片長を指すこともある。例えば、正確に50ヌクレオチドを含むように設計されたオリゴヌクレオチドの場合、そのオリゴヌクレオチドの純度および/または品質の評定により、50ヌクレオチドという主要な種の長さを得ることができる。副次的な種は、一般に、主要な種ではない残りの断片長を指す。副次的な種は、評定されることになるssNA、ssRNAおよび/またはsscDNAの意図せぬまたは予想外の断片長を指すこともある。例えば、正確に50ヌクレオチドを含むように設計されたオリゴヌクレオチドの場合、そのオリゴヌクレオチドの純度および/または品質の評定により、50ヌクレオチドを超える、および/または50ヌクレオチド未満の、しかし正確に50ヌクレオチドではない長さを有する、副次的な種を得ることができる。ssNA、ssRNAおよび/またはsscDNAの純度および/または品質を、比またはパーセンテージとして表すことができる。例えば、試料中のオリゴヌクレオチドの90%が主要な種の断片長のものであり、試料中のオリゴヌクレオチドの(集合的に)10%が副次的な種の断片長のものであった場合、オリゴヌクレオチドを主要な種について純度90%と見なすことができる。
【0303】
試料中のニックの入ったDNAの量を推定または測定することができる。例えば、シーケンシングライブラリーを、ニック修復の前および後の試料から調製することができる。2つのライブラリーについてのシーケンシング結果を比較することができ、ニックの入ったDNAの量を推定または測定することができる。ニックの入ったDNAは、例えば、アポトーシスを遂げ、その後、血流中にある細胞内のゲノムDNAに対するエンドおよびエキソヌクレアーゼ活性に起因して生成される、cfDNAであり得る。初期ヌクレアーゼ活性は、ヌクレオソーム間のエンドヌクレアーゼ活性、またはヌクレオソームに対するDNaseIのニッキング活性を含み得る。ニッキングされやすい核酸領域を理解することにより、ヌクレオソーム占有率の情報を得ることができる。ニックの入ったDNAの他の供給源としては、FFPE試料、毛髪、分解された試料、およびニッカーゼ酵素のin vitro試験が挙げられるが、これらに限定されない。一本鎖ライブラリー調製方法、例えば本開示のものは、ニックの入った断片を捕捉することができる。加えて、本開示の方法は、ニッキングから生じた末端を保持する。ニックの入った分子を直接用いて本開示の方法を行うと、異なる長さの3本の鎖-1つの長い分子および2つのより短い分子-が生成されることになる。ニックシーリング酵素(例えば、HiFi Taqリガーゼ)での処理は、ニックの入った2本の鎖をライゲーションすることになり、その後、これらのシールされたdsDNAを用いて本開示の方法を行うことにより、ニックで生じる末端の可視性がなくても同様の長さの2本の鎖が得られることになる。2つのライブラリーから得られる配列(および断片末端)の比較は、ニックがシールされたライブラリーでのほうが、短い断片が少なく、ニックの入った領域に隣接する配列を有するリードが少ないことを示すことになる。
【0304】
ある例では、5’GAGTCNNNN^N3’でニックを生成するN.BstNBIを使用して、gDNAに既知ニックを生じさせた。ニックの入ったgDNA試料の一部分は、HiFi Taqリガーゼでニックをシールし、一部分はしなかった。両方を用いて本明細書での論述の通り一本鎖ライブラリー調製を行い、ライブラリーをシーケンシングし、比較した。全くニックが入っていない対照gDNAは、配列リードの0.07%がGAGTCNNNNで終わることを示し、シールされなかったニックの入ったDNAは、配列リードの15.74%がGAGTCNNNNで終わることを示し、ニックが入り、ニックがシールされたDNAは、配列リードの10.67%が、GAGTCNNNNで終わることを示した。
【0305】
核酸(例えば、アプタマー、siRNA、オリゴヌクレオチドプローブ)のプールを、核酸が、それらの特性に影響を与え得るプライマー結合部位などのある特定のタイプの隣接領域を含む必要なく、シーケンシングすることができる。本開示の一本鎖ライブラリー調製方法によって、所与の目的のための核酸のプールを生成し、所望の特性についての1または複数ラウンドの選択に付し、シーケンシングすることができる。例えば、アプタマーまたはsiRNAのランダムプールを生成し、1または複数ラウンドの正および/または負の選択(例えば、所望の標的への結合についての正の選択、オフターゲット結合についての負の選択)に付すことができ、成功した候補を、ランダムアプタマーまたはsiRNAがシーケンシングのために隣接領域を含む必要なく、本開示の方法によってシーケンシングすることができる。そのような隣接領域の存在は、アプタマーまたはsiRNA性能に影響を及ぼす可能性がある。
【0306】
ある例では、化学合成または合成されたDNAからの転写によって、核酸のランダムプールが合成される(例えば、アプタマー、siRNA、オリゴヌクレオチドプローブ)。次いで、ランダムプールは、1もしくは複数ラウンドの正の選択および/または1もしくは複数ラウンドの負の選択に付される。正の選択は、次第にストリンジェントになる結合条件下での所望の結合標的とのインキュベーションを含み得る。負の選択は、次第に有利になる結合条件下でのオフターゲット結合基質とのインキュベーションを含み得る。結合条件は、温度、塩濃度、pH、磁場、クラウディング剤、競合結合剤、阻害剤、および他の条件を含み得るが、これらに限定されない。プールおよびその変化についてのバイオインフォマティック解析を可能にするために、本開示の方法によるシーケンシングを、選択の前に、選択ラウンド間に、および/または選択が完了した後に行うことができる。UMIまたは他のバーコードを使用して、プール内の核酸種の相対量の数値または絶対カウントを得ることができる。例えば、各々の結合されたプールを用いてシーケンシングを行って、結合された配列プールが異なる選択ストリンジェンシーに伴ってどのように変化するのかを別々にモニターしながら、所望の結合標的の存在下で、正の選択をnラウンド行うことができる。核酸配列の異なるクラスターを、異なる選択ラウンド中に見つけることができる。一部の事例では、各々の正の選択ラウンドからの結合された核酸は、核酸配列の異なるクラスターを異なる選択ラウンド中に見つけることができるので、結合された核酸プールが異なる選択ストリンジェンシーに伴ってどのように変化するのかを別々にモニターするために残りの選択およびライブラリー調製プロセスを経ることもある。
【0307】
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製を使用して、核酸配列リードの供給源を同定することができる。例えば、ライブラリーをRNA(例えば、ssRNA)とDNA(例えば、dsDNA)の混合物から生成することができ、得られた配列リードを供給源(例えば、最初の混合物からのRNAまたはDNA)に割り当てることができる。したがって、一部の実施形態では、供給源を核酸配列リードに割り当てるステップを含む、本明細書における方法。供給源は、RNAまたはDNAであり得る。一部の実施形態では、供給源は、最初の混合物(例えば、ssRNAとdsDNAを含む試料)からのssRNAまたはdsDNAである。供給源を割り当てるステップは、本明細書に記載されるRNA特異的タグまたはDNA特異的タグを含む配列リードを同定することを含み得る。一部の実施形態では、RNA特異的タグを含む配列リードは、RNA源(例えば、ssRNA)に割り当てられ、RNA特異的タグを含まない配列リードは、DNA源(例えば、dsDNA)に割り当てられる。一部の実施形態では、RNA特異的タグを含む配列リードは、RNA源(例えば、ssRNA)に割り当てられ、DNA特異的タグを含む配列リードは、DNA源(例えば、dsDNA、ssDNA)に割り当てられる。
【0308】
一部の実施形態では、本明細書に記載される一本鎖ライブラリー調製方法を使用して、オーバーハング(例えば、ネイティブオーバーハング)を解析することができる。例えば、ライブラリーを、特徴的なヌクレオチド(例えば、本明細書に記載される特徴的なヌクレオチド)を用いて伸長(例えば、フィルイン)されたオーバーハングを含む標的核酸から、生成することができ、得られた配列リードを解析することができる。一部の実施形態では、本明細書における方法は、標的核酸中のオーバーハングを、配列リード、および伸長領域(例えば、本明細書に記載される伸長領域)内の1つまたは複数の特徴的なヌクレオチドに基づいて、解析するステップを含む。一部の実施形態では、解析するステップは、オーバーハングの配列を決定することを含む。一部の実施形態では、解析するステップは、オーバーハングの長を決定することを含む。一部の実施形態では、解析するステップは、特定のオーバーハングの量を定量化することを含み、それによって、オーバーハング定量化が生じる。オーバーハング定量化は、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)特定の長さ、または(v)(i)、(ii)、(iii)および(iv)のうちの2つ、3つもしくは4つについての組合せとして特徴付けられる、オーバーハングの定量化であり得る。一部の実施形態では、オーバーハング定量化は、(i)5’オーバーハングまたは3’オーバーハングおよび(ii)特定の長さとして特徴付けられる、オーバーハングの定量化である。一部の実施形態では、本明細書における方法は、標的核酸組成物が得られた核酸試料中の標的核酸の供給源をオーバーハング定量化に基づいて同定するステップを含む。一部の実施形態では、オーバーハング解析は、法医学分析のために行われる。一部の実施形態では、オーバーハング解析は、診断分析のために行われる。
【0309】
本開示の手法を使用して、様々なアッセイを行うことができる。一部の場合には、試料を、試料核酸中に存在するオーバーハングの一部、多数またはすべてについてアッセイすることができる。この情報を使用して、存在するオーバーハングの数または出現頻度を示す試料の全般的オーバーハングプロファイルを生成することができる。一部の場合には、試料を、試料中に存在する1つまたは複数の特定のオーバーハングについてアッセイすることができる。一部の場合には、試料を、試料中に存在するオーバーハングの1つまたは複数の特徴についてアッセイすることができる。一部の場合には、試料を、平滑末端化断片(例えば、片側が平滑末端化されている、または両側が平滑末端化されている、標的核酸(例えばDNA))についてアッセイすることができる。
【0310】
試料のオーバーハングプロファイルは、試料中に存在するオーバーハングのある特定の特徴を解析および/または定量化することにより生成することができる。ある特定の事例では、プロファイルは、さらにまたは代替的に、標的/鋳型核酸自体の特徴を(例えば、オーバーハング情報とともに、またはなしで)含み得る。ある特定の事例では、オーバーハングプロファイルは、標的/鋳型核酸の特徴を含まない。したがって、ある特定の実施形態では、オーバーハングプロファイルは、オーバーハング特徴からなる。オーバーハング/鋳型特徴を、回帰(例えば、ロジスティック回帰、線形回帰、多変量回帰、最小二乗回帰)、階層的クラスタリング(例えば、ウォードの階層的クラスタリング)、教師あり学習アルゴリズム(例えば、サポートベクターマシン(SVM))、多変量モデル(例えば、主成分分析(PCA))、線形判別分析、二次判別分析、バギング、ニューラルネットワーク、サポートベクターマシンモデル、ランダムフォレスト、分類木モデル、K近傍法などを含むがこれらに限定されない、任意の好適な定量化方法、クラスタリング方法、統計的アルゴリズム、分類器もしくはモデル、ならびに/または任意の好適な数学的および/もしくは統計的操作を使用して、解析または定量化することができる。
【0311】
解析または定量化され得るオーバーハング/鋳型特徴としては、ジヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のジヌクレオチドの存在/非存在(例えば、特定のジヌクレオチドを有する試料中のオーバーハングの数、特定のジヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のジヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のジヌクレオチドのインスタンスのカウント);トリヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のトリヌクレオチドの存在/非存在(例えば、特定のトリヌクレオチドを有する試料中のオーバーハングの数、特定のトリヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のトリヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のトリヌクレオチドのインスタンスのカウント);テトラヌクレオチドカウント(例えば、オーバーハングもしくはリード中の特定のテトラヌクレオチドの存在/非存在(例えば、特定のテトラヌクレオチドを有する試料中のオーバーハングの数、特定のテトラヌクレオチドを有する試料中の鋳型+オーバーハングの数、もしくは特定のテトラヌクレオチドを有する試料中のオーバーハングなしの鋳型の数)および/またはオーバーハングもしくはリード内の特定のテトラヌクレオチドのインスタンスのカウント);ジヌクレオチドパーセント(例えば、特定のジヌクレオチドを有する試料中のオーバーハングのパーセント、特定のジヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のジヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のジヌクレオチドの数;その特定のオーバーハングのものであるジヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);トリヌクレオチドパーセント(例えば、特定のトリヌクレオチドを有する試料中のオーバーハングのパーセント、特定のトリヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のトリヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のトリヌクレオチドの数;その特定のオーバーハングのものであるトリヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);テトラヌクレオチドパーセント(例えば、特定のテトラヌクレオチドを有する試料中のオーバーハングのパーセント、特定のテトラヌクレオチドを有する試料中の鋳型+オーバーハングのパーセント、または特定のテトラヌクレオチドを有する試料中のオーバーハングなしの鋳型のパーセント;オーバーハング長により正規化されたオーバーハング中のテトラヌクレオチドの数;その特定のオーバーハングのものであるテトラヌクレオチドの比率;長さを問わず全オーバーハングにわたっての比較);鋳型の完全長;長さのカテゴリー(例えば、cfDNAの場合:サブヌクレオソーム、モノヌクレオソーム、マルチヌクレオソーム);オーバーハング長(例えば、1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、またはそれを超える塩基数);オーバーハングタイプ(例えば、5’オーバーハング、3’オーバーハング、平滑形);GC含有量(例えば、オーバーハングのGC含有量、鋳型+オーバーハングのGC含有量、またはオーバーハングなしの鋳型のGC含有量);メチル化ステータス;オーバーハングパーセント(例えば、オーバーハング配列/全オーバーハングのlog2パーセント);オーバーハングカウント(例えば、特定のオーバーハング配列のカウント);長さパーセント(例えば、オーバーハングの長さ/鋳型の完全長);鋳型分子の全配列に対するオーバーハングにおけるジヌクレオチドカウント;鋳型分子の全配列に対するオーバーハングにおけるトリヌクレオチドカウント;鋳型分子の全配列に対するオーバーハングにおけるテトラヌクレオチドカウント;オーバーハングが、特定の領域(例えば、コード領域、CpGアイランド、転写因子結合部位(例えば、CCCTC結合因子(CTCF)結合部位)、DNAse高感受性部位、オープンクロマチンを示す配列(例えば、ATAC-seqピーク);プロモーター領域、エンハンサー領域、高メチル化領域、目的の他の領域など)とオーバーラップするか、特定の領域に含有されるか、および/または特定の領域内で開始するかもしくは終了するかを含み得る、ブール変数;ゲノム座標;所与のオーバーハングタイプおよびオーバーハング長を有する分子の断片長または分布の平均値;所与のオーバーハング配列を有する分子の断片長または分布の平均値;ライブラリー間の差(例えば、変数間のデータの相関関係の識別(例えば、特徴Xと特徴Y間の相関関係、例えば、断片長分布の平均値の変数Xに対する(例えば、所与のオーバーハング配列を有する断片長または分布の平均値のそのXに対する)相関関係(ここで、X=上記の任意の特徴/変数)を検出する));オーバーハングまたは鋳型分子中のある特定のモチーフ(例えば、ある特定のヌクレオチド、ジヌクレオチド、トリヌクレオチド、テトラヌクレオチド、または他の配列)の存在または非存在(相対的または絶対的観点での);鋳型またはオーバーハングの、特定の末端(例えば、3’末端もしくは5’末端)における、または末端もしくは特定の末端から特定の距離内の、ある特定のモチーフの存在または非存在(相対的または絶対的観点での);など、ならびにこれらの組合せが挙げられるが、それらに限定されない。ジヌクレオチドの例としては、AA、AT、AC、AG、TT、TA、TC、TG、CC、CG、CA、CT、GG、GA、GC、およびGTが挙げられる。トリヌクレオチドは、可能な43のヌクレオチド組合せを含み、テトラヌクレオチドは、可能な44のヌクレオチド組合せを含む。一部の実施形態では、試料中のオーバーハング中のジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のCGジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のGGジヌクレオチドの存在が解析される。一部の実施形態では、試料中のオーバーハング中のGCジヌクレオチドの存在が解析される。
【0312】
一部の場合には、特徴(例えば、ある特定のモチーフの存在または非存在)をその鋳型分子自体の配列情報から検出することができる。一部の場合には、特徴を鋳型分子のゲノムコンテキストから検出することができる。例えば、特定のシグナルは、オーバーハング領域内のある特定のモチーフの存在を含むことができ、そのようなシグナルを、鋳型分子の一部としてオーバーハング領域をシーケンシングすること、または特定の鋳型のオーバーハングの配列をゲノム参照との比較により決定することの、どちらかによって検出して、どの配列が鋳型分子に隣接して存在していたのかを突き止めることができる。別の例では、特定のシグナルは、分子の特定の末端から特定の距離内の、ある特定のモチーフの存在を含むことができ、そのようなシグナルを、分子のその末端からその距離内にある鋳型分子の部分、または鋳型分子を生じさせたゲノム切断の反対側にあるゲノムの部分の、どちらかにおいて検出することができる。一部の場合には、特徴を鋳型分子またはオーバーハングの3’末端において検出することができる。従来の解析方法は、鋳型分子の3’末端をチューバックするためそのような特徴を見逃すことがある。
【0313】
特徴を、オーバーハング、鋳型または試料中のそれらの絶対レベルにより解析することができる。特徴を、異なる試料タイプにおける特徴レベルと比較した(例えば、健康の疾患に対する)それらの相対レベルにより解析することができる。
【0314】
全般的オーバーハングまたは鋳型プロファイルを含むオーバーハングまたは鋳型プロファイル、オーバーハングまたは鋳型パネル、およびオーバーハングまたは鋳型特徴は、試料の、または試料が採取された供給源(例えば、生物)の、様々な特性を示すことができる。これらの特性としては、ヌクレアーゼ活性および/または含有量、トポイソメラーゼ活性および/または含有量、疾患(例えば、がん型、がん病期、感染症、臓器疾患または不全、神経変性疾患、虚血、脳卒中、心血管疾患)、細胞死(例えば、全身性の細胞死率の上昇または低下、特定の臓器または細胞型における細胞死率の上昇または低下、細胞死の特定の様式(例えば、アポトーシス、オートファジー、壊死、分裂期細胞死、アノイキス、角質化、興奮毒性、フェロトーシス、ウォラー変性、活性化誘導細胞死(AICD)、虚血性細胞死、膨化死、免疫原性細胞死またはアポトーシス、パイロトーシス)の率の上昇または低下、アポトーシスまたは他の細胞死様式の調節異常)、マイクロバイオームプロファイル(例えば、腸マイクロバイオーム、血液マイクロバイオーム、口腔マイクロバイオーム、皮膚マイクロバイオーム、環境マイクロバイオーム(例えば、土壌マイクロバイオーム、水マイクロバイオーム))、ならびに放射線曝露のタイプおよび/または量(例えば、紫外線(AおよびB)、電離放射線(例えば、宇宙線、アルファ粒子、ベータ粒子、ガンマ線、X線)、中性子線)を挙げることができるが、これらに限定されない。一部の実施形態では、全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングパネル、およびオーバーハング特徴は、がんを示す。一部の実施形態では、全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングパネル、およびオーバーハング特徴は、消化管がんを示す。
【0315】
全般的オーバーハングプロファイルを含むオーバーハングプロファイル、オーバーハングパネル、およびオーバーハング特徴は、ヌクレアーゼ(例えば、DNase)活性、例えば、内因性ヌクレアーゼ活性を示すことができる。ヌクレアーゼ(例えば、DNase)活性は、がんを含むがこれに限定されない、本明細書で論じられる試料または供給源の様々な特性を示すことができる。一部の場合には、試料中の天然に存在する核酸のオーバーハングをアッセイすることができる。一部の場合には、核酸(例えば、合成された核酸)を試料に導入することができ、するとそこでそれらの核酸は、試料中に存在するヌクレアーゼによる作用を受け得る。既知核酸集団の使用は、異なる試料からのものと比較される、オーバーハングプロファイルを生じさせることができる。既知核酸上に生成された異なるオーバーハングから、試料のヌクレアーゼプロファイルの情報を得ることができる。組織特異的ヌクレアーゼ活性をin vitroでアッセイすることができる。例えば、異なる臓器、組織または細胞型からの細胞系を培養することができ、細胞死を誘導することができ、その後、オーバーハングプロファイルのアッセイを行うことができる。オーバーハングプロファイルを特定の酵素(ヌクレアーゼ)または酵素の群についてアッセイすることもできる。特定の酵素または酵素の群を使用して、核酸の集団を消化することができ、結果として生じたオーバーハングプロファイルをアッセイすることができる。例えば、CRISPR/Cas系タンパク質または他の核酸誘導ヌクレアーゼをアッセイして、それらが生じさせる末端のタイプ(例えば、平滑末端、1bp付着端、他のオーバーハング)を判定することができる。一部の応用では、オーバーハングプロファイルアッセイを使用して、DNAse活性の活性を変更することを目的とする特定の処置および標的療法(例えば、ビタミンCおよびK3;抗がん治療に使用されるトポイソメラーゼ阻害剤など)の有効性をモニターすることができる。
【0316】
一部の場合には、対象におけるまたは試料中のヌクレアーゼを阻害して、特定のオーバーハングプロファイルを保存することができる。例えば、細胞プロセスは、1つのオーバーハングプロファイルを(例えば、溶解、細胞死、および/または死後細胞内プロセスから)生じさせ得るが、細胞外に(例えば、血液などの体液中に)存在するヌクレアーゼは、細胞のその第1のオーバーハングプロファイルをさらに変更し得る。細胞外のものなどのヌクレアーゼを(例えば、一時的に)阻害または不活性化して、最初のオーバーハングプロファイルをアッセイするために保存することができる。ヌクレアーゼ活性を試料採取より前に(例えば、アクチンで)阻害することができる。ある例では、オーバーハングの2つの集団、罹患細胞からのもの(D)と健康な細胞からのもの(H)、がアッセイされる。細胞からのDNAの放出後、血液中のヌクレアーゼがオーバーハングをさらに変更し、その結果、修飾されたオーバーハング集団D’およびH’が生じることになることがある。血液中に存在するヌクレアーゼ(例えば、DNase)の阻害は、修飾されていないまたはあまり修飾されていないオーバーハング集団(例えば、DおよびH、または阻害なしで観察されるであろうDおよびHにより近いもの)のアッセイを可能することができる。オーバーハングプロファイルに影響を与える他の酵素も阻害することができる。例えば、トポイソメラーゼ切除は、核酸を切断することができ、その結果として特定のオーバーハングプロファイルを得ることができる。これらのプロファイルのアッセイを可能にするために、トポイソメラーゼ阻害剤を導入してこれらのオーバーハングを(例えば、再ライゲーションを防止することにより)保存することができる。
【0317】
オーバーハングプロファイルを、様々な手法によりアッセイすることができる。オーバーハングを核酸シーケンシングによりアッセイすることができ、これは、本明細書で開示されるようにアッセイすることを含む。オーバーハングを、結合またはハイブリダイゼーションによりアッセイすることができる。例えば、オーバーハングを、特定のオーバーハングと特異的にハイブリダイズする結合剤に結合させることができる。結合剤は、アレイまたはビーズなどの基板上に位置することもある。結合事象を検出することができ(例えば、蛍光または他の光シグナル、電気シグナル)、オーバーハングプロファイルを判定することができる。アッセイの前に、またはアッセイの一部として、核酸の特定の種(例えば、特定のオーバーハングを有するもの、またはオーバーハングパネルからの1つもしくは複数のオーバーハングを有するもの)を濃縮することができ、これは、本明細書で開示されるように濃縮することを含む。
【0318】
キット
ある特定の実施形態では、キットが提供される。キットは、本明細書に記載される方法のいずれかを行うために有用な、本明細書に記載される任意の成分および組成物(例えば、足場アダプターおよびそれらの成分/小成分、オリゴヌクレオチド、オリゴヌクレオチド成分/領域、足場ポリヌクレオチド、足場ポリヌクレオチド成分/領域、核酸、一本鎖核酸、プライマー、一本鎖結合タンパク質、酵素)を、任意の好適な組合せで含み得る。キットは、本明細書に記載される方法のいずれかを行うのに有用な任意の試薬、緩衝剤または他の成分をさらに含み得る。例えば、キットは、複数の足場アダプター種、複数のオリゴヌクレオチド種、および/または複数の足場ポリヌクレオチド種、核酸を5’リン酸化するように構成されたキナーゼ(例えば、ポリヌクレオチドキナーゼ(PNK))、DNAリガーゼ、ならびにこれらの任意の組合せのうちの1つまたは複数を含み得る。一部の実施形態では、キットは、逆転写酵素、ポリメラーゼ、一本鎖結合タンパク質(SSB)、プライマーオリゴヌクレオチド(例えば、RNA特異的タグを含むプライマーオリゴヌクレオチド)、プライミングポリヌクレオチド(例えば、プライマー、RNA特異的タグ、およびオリゴヌクレオチドを含む)、RNAオリゴヌクレオチド(例えば、RNA特異的タグを含む)、RNAse、RNA特異的タグを含むオリゴヌクレオチド、DNA特異的タグを含むオリゴヌクレオチド、リガーゼ(例えば、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、熱安定性5’App DNA/RNAリガーゼ、T4 DNAリガーゼ)、1つまたは複数の特徴的なヌクレオチド、ヘアピンアダプターなどのうちの1つまたは複数をさらに含む。一部の実施形態では、キットは、脱アミノ化剤(例えば、亜硫酸水素ナトリウム、デアミナーゼ)をさらに含む。
【0319】
キットは、一本鎖DNAおよび/または一本鎖RNAを捕捉するための成分を含むことができる。一本鎖DNAを捕捉するためのキットを、ユーザーが二本鎖または一本鎖DNAを生じさせるように構成することができる。一本鎖RNAを捕捉するためのキットを、ユーザーがcDNA(一本鎖もしくは二本鎖のどちらか)を生じさせるように、またはRNA(例えば、全RNAもしくはrRNA枯渇RNA)を生じさせるように構成することができる。一本鎖RNAを捕捉するためのキットは、rRNA枯渇試薬、mRNA濃縮試薬、断片化試薬、cDNA合成試薬、および/またはRNA消化試薬を含むことができる。
【0320】
キットの成分は、別々の容器内に存在することもあり、または複数の成分が、単一の容器内に存在することもある。好適な容器としては、単一のチューブ(例えば、バイアル)、プレート(例えば、96ウェルプレート、384ウェルプレートなど)の1つまたは複数ウェルなどが挙げられる。
【0321】
キットは、本明細書に記載される1つもしくは複数の方法を行うための使用説明書、および/または本明細書に記載される1つもしくは複数の成分の説明書きも含むことがある。例えば、キットは、一本鎖核酸断片を捕捉するために、および/または核酸ライブラリーを生成するために、本明細書に記載される骨格アダプターまたはその成分を使用するための使用説明書を含むことがある。使用説明書および/または説明書きは、印刷された形態であることもあり、キット添付文書に含まれることもある。一部の実施形態では、使用説明書および/または説明書きは、好適なコンピュータ可読記憶媒体、例えば、携帯フラッシュドライブ、DVD、CD-ROM、ディスケットなど、に存在する電子記憶データファイルとして提供される。キットは、そのような使用説明書または説明書きを提供するインターネットの場所についての書面での説明書きを含むこともある。
【0322】
ある特定のインプリメンテーション
以下は、本技術のある特定のインプリメンテーションの非限定的な例である。
【0323】
A1.核酸ライブラリーを生成する方法であって、
(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)複数の第1のオリゴヌクレオチド種と、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップを含み、
(a)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(b)複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を含み;
(c)第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第1の隣接領域に相補的なポリヌクレオチド、および(ii)第2の隣接領域に相補的なポリヌクレオチドを含み;
(d)核酸組成物、複数の第1のオリゴヌクレオチド種、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(i)第1のssNA末端領域および(ii)第1のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、方法。
A1.1 第1のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)第1のUMIに対応する領域を含む、実施形態A1の方法。
A1.2 第1のUMIに対応する領域が、第1のUMIに相補的なポリヌクレオチドを含む、実施形態A1.1の方法。
A1.3 第1のUMIに対応する領域が、第1のUMIに相補的でないポリヌクレオチドを含む、実施形態A1.1の方法。
A2.第1のオリゴヌクレオチド種の各々についての第1のUMIが、ランダムヌクレオチド配列を含む、実施形態A1~A1.3のいずれか1つの方法。
A2.1 第1のオリゴヌクレオチド種の各々についての第1のUMIが、非ランダムヌクレオチド配列を含む、実施形態A1~A1.3のいずれか1つの方法。
A3.第1のUMIが、3~10の間のヌクレオチドを含む、実施形態A1~A2.1のいずれか1つの方法。
A4.第1のUMIが、5ヌクレオチドを含む、実施形態A3の方法。
A5.第1のオリゴヌクレオチド種の各々についての第1の隣接領域が、非ランダム配列を含む、実施形態A1~A4のいずれか1つの方法。
A6.第1のオリゴヌクレオチド種の各々についての第1の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、実施形態A1~A5のいずれか1つの方法。
A7.非ランダム配列種のプールが、2つまたはそれより多くの非ランダム配列種を含む、実施形態A6の方法。
A8.非ランダム配列種のプールが、3つまたはそれより多くの非ランダム配列種を含む、実施形態A6の方法。
A9.非ランダム配列種のプールが、4つまたはそれより多くの非ランダム配列種を含む、実施形態A6の方法。
A10.非ランダム配列種のプールが、5つまたはそれより多くの非ランダム配列種を含む、実施形態A6の方法。
A11.非ランダム配列種のプールが、6つまたはそれより多くの非ランダム配列種を含む、実施形態A6の方法。
A12.非ランダム配列種のプールが、4つの非ランダム配列種を含む、実施形態A6の方法。
A13.第1の隣接領域が、8~15の間のヌクレオチドを含む、実施形態A1~A12のいずれか1つの方法。
A14.第1の隣接領域が、10ヌクレオチドを含む、実施形態A13の方法。
A15.第1の隣接領域が、約70%グアニンおよびシトシンヌクレオチドを含む、実施形態A1~A14のいずれか1つの方法。
A15.1 第1の隣接領域が、約90%グアニンおよびシトシンヌクレオチドを含む、実施形態A1~A14のいずれか1つの方法。
A15.2 第1の隣接領域が、約38℃に等しいかまたはそれより高い融解温度を有する、実施形態A1~A15.1のいずれか1つの方法。
A15.3 第1の隣接領域が、約45℃に等しいかまたはそれより高い融解温度を有する、実施形態A1~A15.1のいずれか1つの方法。
A16.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、非ランダム配列を含む、実施形態A1~A15.3のいずれか1つの方法。
A17.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、第1のプライマー結合ドメインを含む、実施形態A1~A16のいずれか1つの方法。
A18.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、第1のシーケンシングアダプター、またはその一部を含む、実施形態A1~A17のいずれか1つの方法。
A19.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、インデックスを含む、実施形態A1~A18のいずれか1つの方法。
A20.結合させるステップの前に、複数の第1のオリゴヌクレオチド種および/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチド種および/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態A1~A19のいずれか1つの方法。
A20.1 結合させるステップの前に、複数の第1のオリゴヌクレオチド種および/または複数の第1の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触されない、実施形態A1~A19のいずれか1つの方法。
A21.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチド種とハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態A1~A20.1のいずれか1つの方法。
A22.第1のオリゴヌクレオチド種および第1のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態A1~A21のいずれか1つの方法。
A23.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチド種の末端に共有結合で連結される条件下で接触させることを含む、実施形態A22の方法。
A24.核酸組成物と(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(e)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(f)核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
実施形態A1~A23のいずれか1つの方法。
A24.1 第2のオリゴヌクレオチドが、第2のssNA末端領域の末端に隣接している末端に少なくとも約70%グアニンおよびシトシンヌクレオチドを含む領域を含む、実施形態A24の方法。
A24.2 第2のオリゴヌクレオチドが、第2のssNA末端領域の末端に隣接している末端に少なくとも約90%グアニンおよびシトシンヌクレオチドを含む領域を含む、実施形態A24の方法。
A25.核酸組成物と(iv)複数の第2のオリゴヌクレオチド種、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(e)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(f)複数の第2のオリゴヌクレオチド種における各オリゴヌクレオチドが、第3の隣接領域および第4の隣接領域と隣接している第2の固有分子識別子(UMI)を含み;
(g)第2のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第3の隣接領域に相補的なポリヌクレオチド、および(ii)第4の隣接領域に相補的なポリヌクレオチドを含み;
(h)核酸組成物、複数の第2のオリゴヌクレオチド種、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(i)第2のssNA末端領域および(ii)第2のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
実施形態A1~A23のいずれか1つの方法。
A25.1 第2のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)第2のUMIに対応する領域を含む、実施形態A25の方法。
A25.2 第2のUMIに対応する領域が、第2のUMIに相補的なポリヌクレオチドを含む、実施形態A25.1の方法。
A25.3 第2のUMIに対応する領域が、第2のUMIに相補的でないポリヌクレオチドを含む、実施形態A25.1の方法。
A26.第2のオリゴヌクレオチド種の各々についての第2のUMIが、ランダムヌクレオチド配列を含む、実施形態A25~A25.3のいずれか1つの方法。
A26.1 第2のオリゴヌクレオチド種の各々についての第2のUMIが、非ランダムヌクレオチド配列を含む、実施形態A25~A25.3のいずれか1つの方法。
A27.第2のUMIが、3~10の間のヌクレオチドを含む、実施形態A25~A26.1のいずれか1つの方法。
A28.第2のUMIが、5ヌクレオチドを含む、実施形態A27の方法。
A29.第2のオリゴヌクレオチド種の各々についての第3の隣接領域が、非ランダム配列を含む、実施形態A25~A28のいずれか1つの方法。
A30.第2のオリゴヌクレオチド種の各々についての第3の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、実施形態A25~A29のいずれか1つの方法。
A31.非ランダム配列種のプールが、2つまたはそれより多くの非ランダム配列種を含む、実施形態A30の方法。
A32.非ランダム配列種のプールが、3つまたはそれより多くの非ランダム配列種を含む、実施形態A30の方法。
A33.非ランダム配列種のプールが、4つまたはそれより多くの非ランダム配列種を含む、実施形態A30の方法。
A34.非ランダム配列種のプールが、5またはそれより多くの非ランダム配列種を含む、実施形態A30の方法。
A35.非ランダム配列種のプールが、6つまたはそれより多くの非ランダム配列種を含む、実施形態A30の方法。
A36.非ランダム配列種のプールが、4つの非ランダム配列種を含む、実施形態A30の方法。
A37.第3の隣接領域が、8~15の間のヌクレオチドを含む、実施形態A25~A36のいずれか1つの方法。
A38.第3の隣接領域が、10ヌクレオチドを含む、実施形態A37の方法。
A39.第3の隣接領域が、約70%グアニンおよびシトシンヌクレオチドを含む、実施形態A25~A38のいずれか1つの方法。
A39.1 第3の隣接領域が、約90%グアニンおよびシトシンヌクレオチドを含む、実施形態A25~A38のいずれか1つの方法。
A39.2 第3の隣接領域が、約38℃に等しいかまたはそれより高い融解温度を有する、実施形態A25~A39.1のいずれか1つの方法。
A39.3 第3の隣接領域が、約45℃に等しいかまたはそれより高い融解温度を有する、実施形態A25~A39.1のいずれか1つの方法。
A40.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、非ランダム配列を含む、実施形態A25~A39.3のいずれか1つの方法。
A41.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、第2のプライマー結合ドメインを含む、実施形態A25~A40のいずれか1つの方法。
A42.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、第2のシーケンシングアダプター、またはその一部を含む、実施形態A25~A41のいずれか1つの方法。
A43.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、インデックスを含む、実施形態A25~A42のいずれか1つの方法。
A44.結合させるステップの前に、複数の第2のオリゴヌクレオチド種および/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、複数の第2のオリゴヌクレオチド種および/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第2のオリゴヌクレオチド種および/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態A25~A43のいずれか1つの方法。
A44.1 結合させるステップの前に、複数の第2のオリゴヌクレオチド種および/または複数の第2の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と、複数の第2のオリゴヌクレオチド種および/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触されない、実施形態A25~A43のいずれか1つの方法。
A45.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチド種とハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態A25~A44のいずれか1つの方法。
A46.第1のオリゴヌクレオチド種および第1のssNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに第2のオリゴヌクレオチド種および第2のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態A25~A45のいずれか1つの方法。
A47.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチド種の末端に共有結合で連結される条件および第2のssNA末端領域の末端が第2のオリゴヌクレオチド種の末端に共有結合で連結される条件下で接触させることを含む、実施形態A46の方法。
A48.第1のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態A1~A47のいずれか1つの方法。
A49.第2のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態A25~A48のいずれか1つの方法。
A50.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態A1~A49のいずれか1つの方法。
A51.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態A22~A50のいずれか1つの方法。
A52.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態A51の方法。
A53.増幅ライゲーション産物をシーケンシングするステップをさらに含む、実施形態A52の方法。
A54.一本鎖ライゲーション産物が、増幅されない、実施形態A51の方法。
A55.一本鎖ライゲーション産物をシーケンシングするステップをさらに含む、実施形態A54の方法。
A56.核酸組成物が、一本鎖DNA(ssDNA)を含む、実施形態A1~A55のいずれか1つの方法。
A57.ssDNAが、二本鎖DNA(dsDNA)に由来する、実施形態A56の方法。
A57.1 ssDNAが、ニックの入った二本鎖DNA(dsDNA)を含む、dsDNAに由来する、実施形態A57の方法。
A58.結合させるステップの前に、dsDNAを変性させるステップを含み、それによって、ssDNAが生成される、実施形態A57またはA57.1の方法。
A59.核酸組成物が、一本鎖RNA(ssRNA)を含む、実施形態A1~A55のいずれか1つの方法。
A60.ssNAが、結合させるステップの前に修飾されない、実施形態A1~A59のいずれか1つの方法。
A61.ssNAが複数の第1のオリゴヌクレオチド種および複数の第1の足場ポリヌクレオチド種と結合される場合、ssNAの一方または両方のネイティブ末端が存在する、実施形態A1~A60のいずれか1つの方法。
A62.ssNAが、無細胞核酸からのものである、実施形態A1~A61のいずれか1つの方法。
A63.ssNA中の1つまたは複数の非メチル化シトシン残基を脱アミノ化するステップをさらに含み、それによって、1つまたは複数の非メチル化シトシン残基がウラシルに変換される、実施形態A1~A61のいずれか1つの方法。
A64.脱アミノ化するステップが、(i)ssNAを含む核酸組成物、(ii)複数の第1のオリゴヌクレオチド種、および(iii)複数の第1の足場ポリヌクレオチド種を結合させるステップの前に行われる、実施形態A63の方法。
A65.脱アミノ化するステップが、核酸組成物と、(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップの前に行われる、実施形態A64の方法。
A66.脱アミノ化するステップが、(i)ssNAを含む核酸組成物、(ii)複数の第1のオリゴヌクレオチド種、および(iii)複数の第1の足場ポリヌクレオチド種を結合させるステップの後に行われる、実施形態A63の方法。
A67.脱アミノ化するステップが、核酸組成物と、(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種とを結合させるステップの後に行われる、実施形態A66の方法。
A68.複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態A66またはA67の方法。
A69.複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態A66~A68のいずれか1つの方法。
A70.第2のオリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態A67~A69のいずれか1つの方法。
A71.複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態A67~A70のいずれか1つの方法。
A72.脱アミノ化するステップが、亜硫酸水素ナトリウムの使用を含む、実施形態A63~A71のいずれか1つの方法。
A73.脱アミノ化するステップが、デアミナーゼの使用を含む、実施形態A63~A71のいずれか1つの方法。
【0324】
B1.第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を各々が含む、複数の第1のオリゴヌクレオチド種と、
ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と
を含む組成物であって、第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第1の隣接領域に相補的なポリヌクレオチド、および(ii)第2の隣接領域に相補的なポリヌクレオチドを含む、組成物。
B1.1 第1のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)第1のUMIに対応する領域を含む、実施形態B1の組成物。
B1.2 第1のUMIに対応する領域が、第1のUMIに相補的なポリヌクレオチドを含む、実施形態B1.1の組成物。
B1.3 第1のUMIに対応する領域が、第1のUMIに相補的でないポリヌクレオチドを含む、実施形態B1.1の組成物。
B2.第1のオリゴヌクレオチド種の各々についての第1のUMIが、ランダムヌクレオチド配列を含む、実施形態B1~B1.3のいずれか1つの組成物。
B2.1 第1のオリゴヌクレオチド種の各々についての第1のUMIが、非ランダムヌクレオチド配列を含む、実施形態B1~B1.3のいずれか1つの組成物。
B3.第1のUMIが、3~10の間のヌクレオチドを含む、実施形態B1~B2.1のいずれか1つの組成物。
B4.第1のUMIが、5ヌクレオチドを含む、実施形態B3の組成物。
B5.第1のオリゴヌクレオチド種の各々についての第1の隣接領域が、非ランダム配列を含む、実施形態B1~B4のいずれか1つの組成物。
B6.第1のオリゴヌクレオチド種の各々についての第1の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、実施形態B1~B5のいずれか1つの組成物。
B7.非ランダム配列種のプールが、2つまたはそれより多くの非ランダム配列種を含む、実施形態B6の組成物。
B8.非ランダム配列種のプールが、3つまたはそれより多くの非ランダム配列種を含む、実施形態B6の組成物。
B9.非ランダム配列種のプールが、4つまたはそれより多くの非ランダム配列種を含む、実施形態B6の組成物。
B10.非ランダム配列種のプールが、5つまたはそれより多くの非ランダム配列種を含む、実施形態B6の組成物。
B11.非ランダム配列種のプールが、6つまたはそれより多くの非ランダム配列種を含む、実施形態B6の組成物。
B12.非ランダム配列種のプールが、4つの非ランダム配列種を含む、実施形態B6の組成物。
B13.第1の隣接領域が、8~15の間のヌクレオチドを含む、実施形態B1~B12のいずれか1つの組成物。
B14.第1の隣接領域が、10ヌクレオチドを含む、実施形態B13の組成物。
B15.第1の隣接領域が、約70%グアニンおよびシトシンヌクレオチドを含む、実施形態B1~B14のいずれか1つの組成物。
B15.1 第1の隣接領域が、約90%グアニンおよびシトシンヌクレオチドを含む、実施形態B1~B14のいずれか1つの組成物。
B15.2 第1の隣接領域が、約38℃に等しいかまたはそれより高い融解温度を有する、実施形態B1~B15.1のいずれか1つの組成物。
B15.3 第1の隣接領域が、約45℃に等しいかまたはそれより高い融解温度を有する、実施形態B1~B15.1のいずれか1つの組成物。
B16.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、非ランダム配列を含む、実施形態B1~B15.3のいずれか1つの組成物。
B17.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、第1のプライマー結合ドメインを含む、実施形態B1~B16のいずれか1つの組成物。
B18.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、第1のシーケンシングアダプター、またはその一部を含む、実施形態B1~B17のいずれか1つの組成物。
B19.第1のオリゴヌクレオチド種の各々についての第2の隣接領域が、インデックスを含む、実施形態B1~B18のいずれか1つの組成物。
B20.第2のオリゴヌクレオチドと、
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含む、実施形態B1~B19のいずれか1つの組成物。
B20.1 第2のオリゴヌクレオチドが、末端に少なくとも約70%グアニンおよびシトシンヌクレオチドを含む領域を含む、実施形態B20の組成物。
B20.2 第2のオリゴヌクレオチドが、末端に少なくとも約90%グアニンおよびシトシンヌクレオチドを含む領域を含む、実施形態B20の組成物。
B21.第3の隣接領域および第4の隣接領域と隣接している第2の固有分子識別子(UMI)を各々が含む、複数の第2のオリゴヌクレオチド種と;
ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含み、第2のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第3の隣接領域に相補的なポリヌクレオチド、および(ii)第4の隣接領域に相補的なポリヌクレオチドを含む、実施形態B1~B19のいずれか1つの組成物。
B21.1 第2のオリゴヌクレオチドハイブリダイゼーション領域が、(iii)第2のUMIに対応する領域を含む、実施形態B21の組成物。
B21.2 第2のUMIに対応する領域が、第2のUMIに相補的なポリヌクレオチドを含む、実施形態B21.1の組成物。
B21.3 第2のUMIに対応する領域が、第2のUMIに相補的でないポリヌクレオチドを含む、実施形態B21.1の組成物。
B22.第2のオリゴヌクレオチド種の各々についての第2のUMIが、ランダムヌクレオチド配列を含む、実施形態B21~B21.3のいずれか1つの組成物。
B22.1 第2のオリゴヌクレオチド種の各々についての第2のUMIが、非ランダムヌクレオチド配列を含む、実施形態B21~B21.3のいずれか1つの組成物。
B23.第2のUMIが、3~10の間のヌクレオチドを含む、実施形態B21~B22.1のいずれか1つの組成物。
B24.第2のUMIが、5ヌクレオチドを含む、実施形態B23の組成物。
B25.第2のオリゴヌクレオチド種の各々についての第3の隣接領域が、非ランダム配列を含む、実施形態B21~B24のいずれか1つの組成物。
B26.第2のオリゴヌクレオチド種の各々についての第3の隣接領域が、非ランダム配列種のプールからの非ランダム配列種を含む、実施形態B21~B25のいずれか1つの組成物。
B27.非ランダム配列種のプールが、2つまたはそれより多くの非ランダム配列種を含む、実施形態B26の組成物。
B28.非ランダム配列種のプールが、3つまたはそれより多くの非ランダム配列種を含む、実施形態B26の組成物。
B29.非ランダム配列種のプールが、4つまたはそれより多くの非ランダム配列種を含む、実施形態B26の組成物。
B30.非ランダム配列種のプールが、5つまたはそれより多くの非ランダム配列種を含む、実施形態B26の組成物。
B31.非ランダム配列種のプールが、6つまたはそれより多くの非ランダム配列種を含む、実施形態B26の組成物。
B32.非ランダム配列種のプールが、4つの非ランダム配列種を含む、実施形態B26の組成物。
B33.第3の隣接領域が、8~15の間のヌクレオチドを含む、実施形態B21~B32のいずれか1つの組成物。
B34.第3の隣接領域が、10ヌクレオチドを含む、実施形態B33の組成物。
B35.第3の隣接領域が、約70%グアニンおよびシトシンヌクレオチドを含む、実施形態B21~B34のいずれか1つの組成物。
B35.1 第3の隣接領域が、約90%グアニンおよびシトシンヌクレオチドを含む、実施形態B21~B34のいずれか1つの組成物。
B35.2 第3の隣接領域が、約38℃に等しいかまたはそれより高い融解温度を有する、実施形態B21~B35.1のいずれか1つの組成物。
B35.3 第3の隣接領域が、約45℃に等しいかまたはそれより高い融解温度を有する、実施形態B21~B35.1のいずれか1つの組成物。
B36.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、非ランダム配列を含む、実施形態B21~B35.3のいずれか1つの組成物。
B37.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、第2のプライマー結合ドメインを含む、実施形態B21~B36のいずれか1つの組成物。
B38.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、第2のシーケンシングアダプター、またはその一部を含む、実施形態B21~B37のいずれか1つの組成物。
B39.第2のオリゴヌクレオチド種の各々についての第4の隣接領域が、インデックスを含む、実施形態B21~B38のいずれか1つの組成物。
B40.第1のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態B1~B39のいずれか1つの組成物。
B41.第2のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態B21~B40のいずれか1つの組成物。
B42.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態B1~B41のいずれか1つの組成物。
B43.複数の第1のオリゴヌクレオチド種および/または複数の第1の足場ポリヌクレオチド種が、脱リン酸化されている、実施形態B1~B42のいずれか1つの組成物。
B44.複数の第2のオリゴヌクレオチド種および/または複数の第2の足場ポリヌクレオチド種が、脱リン酸化されている、実施形態B21~B43のいずれか1つの組成物。
B45.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチド種にハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態B1~B44のいずれか1つの組成物。
B46.複数の第1の足場二重鎖種が脱リン酸化されている、実施形態B45の組成物。
B47.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチド種にハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態B21~B46のいずれか1つの組成物。
B48.複数の第2の足場二重鎖種が脱リン酸化されている、実施形態B47の組成物。
B49.オリゴヌクレオチドの末端をssNA末端領域の末端に共有結合で連結させるための薬剤をさらに含む、実施形態B1~B48のいずれか1つの組成物。
B50.薬剤がリガーゼである、実施形態B49の組成物。
B51.一本鎖核酸(ssNA)をさらに含む、実施形態B1~B50のいずれか1つの組成物。
B52.ssNAが、一本鎖DNA(ssDNA)を含む、実施形態B51の組成物。
B53.ssDNAが、二本鎖DNA(dsDNA)に由来する、実施形態B52の組成物。
B53.1 ssDNAが、ニックの入った二本鎖DNA(dsDNA)を含む、dsDNAに由来する、実施形態B53の組成物。
B54.ssNAが、一本鎖RNA(ssRNA)を含む、実施形態B51の組成物。
B55.ssNAが、未修飾ssNAを含む、実施形態B51~B54のいずれか1つの組成物。
B56.ssNAが、一方の末端または両方の末端にネイティブ末端を含む、実施形態B51~B55のいずれか1つの組成物。
B57.ssNAが、無細胞核酸からのものである、実施形態B51~B56のいずれか1つの組成物。
B58.複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態B1~B57のいずれか1つの組成物。
B59.複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態B1~B58のいずれか1つの組成物。
B60.第2のオリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態B20~B59のいずれか1つの組成物。
B61.複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態B20~B60のいずれか1つの組成物。
B62.実施形態B1~B61のいずれか1つの組成物と使用説明書とを含むキット。
B63.亜硫酸水素ナトリウムをさらに含む、実施形態B62のキット。
B64.デアミナーゼをさらに含む、実施形態B63のキット。
【0325】
C1.核酸ライブラリーを生成する方法であって、
(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAと、プライマーオリゴヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、プライマーオリゴヌクレオチドが、RNA特異的タグを含み、cDNAが、RNA特異的タグを含み、dsDNAが、RNA特異的タグを含まない、ステップ;
(b)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;および
(c)核酸組成物と第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、
(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(ii)核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNA末端領域および(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ
を含む、方法。
C2.プライマーオリゴヌクレオチドが、ランダムヘキサマーを含む、実施形態C1の方法。
C3.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態C1またはC2の方法。
C4.(b)が、cDNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることを含み、それによって、RNAが消化され、sscDNA産物が生成される、実施形態C1~C3のいずれか1つの方法。
C5.(b)が、cDNA-RNA二重鎖および/またはdsDNAを変性させることを含み、それによって、sscDNAおよび/またはssDNAが生成される、実施形態C1~C4のいずれか1つの方法。
C6.(b)が、sscDNAおよびssDNAと一本鎖核酸結合剤とを接触させることをさらに含む、実施形態C1~C5のいずれか1つの方法。
C7.(b)が、sscDNAおよびssDNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合sscDNAおよびSSB結合ssDNAを生成することをさらに含む、実施形態C1~C6のいずれか1つの方法。
C8.(c)の前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態C1~C7のいずれか1つの方法。
C9.(c)の前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態C1~C7のいずれか1つの方法。
C10.(c)の前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態C1~C9のいずれか1つの方法。
C11.第1のオリゴヌクレオチドおよび第1のsscDNA末端領域または第1のssDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態C1~C10のいずれか1つの方法。
C12.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のsscDNA末端領域または第1のssDNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態C11の方法。
C13.核酸組成物と、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(iii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(iv)核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(1)第2のsscDNA末端領域または第2のssDNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のsscDNA末端領域または第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ
を含む、実施形態C1~C12のいずれか1つの方法。
C14.(c)の前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態C13の方法。
C15.(c)の前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態C13の方法。
C16.(c)の前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態C13~C15のいずれか1つの方法。
C17.第1のオリゴヌクレオチドおよび第1のsscDNA末端領域または第1のssDNA末端領域の隣接している末端を共有結合で連結させるステップ、および第2のオリゴヌクレオチドおよび第2のsscDNA末端領域または第2のssDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態C13~C15のいずれか1つの方法。
C18.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のsscDNA末端領域または第1のssDNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件および第2のsscDNA末端領域または第2のssDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態C17の方法。
C19.第1のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態C1~C18のいずれか1つの方法。
C29.第2のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態C13~C18のいずれか1つの方法。
C30.sscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態C1~C29のいずれか1つの方法。
C31.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態C11~C30のいずれか1つの方法。
C32.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態C31の方法。
C33.増幅ライゲーション産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態C32の方法。
C34.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態C33の方法。
C35.供給源が、第1の混合物中のssRNA、または第1の混合物中のdsDNAである、実施形態C34の方法。
C36.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定することを含む、実施形態C34またはC35の方法。
C37.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、RNA特異的タグを含まない配列リードが、dsDNAに割り当てられる、実施形態C36の方法。
【0326】
D1.一本鎖相補デオキシリボ核酸(sscDNA)および一本鎖デオキシリボ核酸(ssDNA)を含み、sscDNAがRNA特異的タグを含む、核酸組成物と;
第1のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と
を含む、組成物。
D2.第2のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含む、実施形態D1の組成物。
D3.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態D1またはD2の組成物。
D4.sscDNAが、SSB結合sscDNAを含み、ssDNAが、SSB結合ssDNAを含む、実施形態D1~D3のいずれか1つの組成物。
D5.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態D1~D4のいずれか1つの組成物。
D6.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態D2~D5のいずれか1つの組成物。
D7.リガーゼ活性を有する薬剤をさらに含む、実施形態D1~D6のいずれか1つの組成物。
D8.第1のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態D1~D7のいずれか1つの組成物。
D9.第2のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態D2~D8のいずれか1つの組成物。
D10.sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態D1~D9のいずれか1つの組成物。
D11.実施形態D1~D10のいずれか1つの組成物と使用説明書とを含むキット。
D12.RNA特異的タグを含むプライマーオリゴヌクレオチドと;
第1のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;
使用説明書と
を含む、キット。
D13.第2のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
をさらに含む、実施形態D12のキット。
D14.プライマーオリゴヌクレオチドが、ランダムヘキサマーを含む、実施形態D12またはD13のキット。
D15.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態D12~D14のいずれか1つのキット。
D16.一本鎖核酸結合剤をさらに含む、実施形態D12~D15のいずれか1つのキット。
D17.一本鎖核酸結合剤が、一本鎖核酸結合タンパク質(SSB)である、実施形態D16のキット。
D18.逆転写酵素活性を有する薬剤をさらに含む、実施形態D12~D17のいずれか1つのキット。
D19.RNAse活性を有する薬剤をさらに含む、実施形態D12~D18のいずれか1つのキット。
D20.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態D12~D19のいずれか1つのキット。
D21.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態D13~D20のいずれか1つのキット。
D22.リガーゼ活性を有する薬剤をさらに含む、実施形態D12~D21のいずれか1つのキット。
D23.第1のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態D12~D22のいずれか1つのキット。
D24.第2のポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態D13~D23のいずれか1つのキット。
D25.sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態D12~D24のいずれか1つのキット。
【0327】
E1.核酸ライブラリーを生成する方法であって、
(i)一本鎖リボ核酸(ssRNA)および一本鎖デオキシリボ核酸(ssDNA)を含む核酸組成物、(ii)第1のオリゴヌクレオチド、(iii)複数の第1の足場ポリヌクレオチド種、(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種を結合させるステップを含み、
(a)第1のオリゴヌクレオチドが、RNA特異的タグを含み;
(b)第2のオリゴヌクレオチドが、DNA特異的タグを含み;
(c)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(d)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(e)核酸組成物、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、
第1の足場ポリヌクレオチド種の分子が(i)第1のssRNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssRNA末端領域の末端に隣接している第1セットハイブリダイゼーション産物が形成される条件;および
第2の足場ポリヌクレオチド種の分子が(i)第1のssDNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第2のオリゴヌクレオチドの分子の末端が第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物の第2のセットが形成される条件下で結合される、方法。
E2.第1の足場ポリヌクレオチド種の分子が、(i)第1のssRNA末端領域および(ii)第1のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第1のオリゴヌクレオチド中のRNA特異的タグの末端が第1のssRNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、実施形態E1の方法。
E3.第2の足場ポリヌクレオチド種の分子が、(i)第1のssDNA末端領域および(ii)第2のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第2のオリゴヌクレオチド中のDNA特異的タグの末端が第1のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、実施形態E1またはE2の方法。
E4.第1のオリゴヌクレオチドがRNAを含み、第2のオリゴヌクレオチドがDNAを含む、実施形態E1~E3のいずれか1つの方法。
E4.1 第1のオリゴヌクレオチドがRNAからなり、第2のオリゴヌクレオチドがDNAからなる、実施形態E1~E3のいずれか1つの方法。
E5.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態E1~E4.1のいずれか1つの方法。
E6.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態E1~E5のいずれか1つの方法。
E7.RNA特異的タグおよびDNA特異的タグが、異なる配列を含む、実施形態E1~E6のいずれか1つの方法。
E8.RNA特異的タグおよびDNA特異的タグが、異なる長さを有する、実施形態E1~E7のいずれか1つの方法。
E9.RNA特異的タグおよびDNA特異的タグが、異なる検出可能なマーカーを含む、実施形態E1~E8のいずれか1つの方法。
E10.結合させるステップの前に、dsDNAを変性させるステップを含み、それによって、ssDNAが生成される、実施形態E1~E9のいずれか1つの方法。
E11.変性させるステップの後、かつ接触させるステップの前に、ssRNAおよびssDNAと一本鎖核酸結合剤とを接触させるステップを含む、実施形態E10の方法。
E12.変性させるステップの後、かつ接触させるステップの前に、ssRNAおよびssDNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合ssRNAおよびSSB結合ssDNAを生成するステップをさらに含む、実施形態E10またはE11の方法。
E13.結合させるステップの前に、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチド、脱リン酸化された第1の足場ポリヌクレオチド種、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態E1~E12のいずれか1つの方法。
E14.結合させるステップの前に、第1のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第2のオリゴヌクレオチド、および/または複数の第2の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態E1~E12のいずれか1つの方法。
E15.結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、および/または第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態E1~E14のいずれか1つの方法。
E16.第1のオリゴヌクレオチドおよび第1のssRNA末端領域の隣接している末端を共有結合で連結させるステップであって、それによって、共有結合で連結されたハイブリダイゼーション産物の第1のセットが生成されるステップ、および第2のオリゴヌクレオチドおよび第1のssDNA末端領域の隣接している末端を共有結合で連結させるステップであって、それによって、共有結合で連結されたハイブリダイゼーション産物の第2のセットが生成されるステップをさらに含む、実施形態E1~E15のいずれか1つの方法。
E17.共有結合で連結させるステップが、ハイブリダイゼーション産物の第1のセットおよびハイブリダイゼーション産物の第2のセットと、リガーゼ活性を有する1つまたは複数の薬剤とを、第1のssRNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件および第1のssDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態E16の方法。
E17.1 リガーゼ活性を有する1つまたは複数の薬剤が、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、熱安定性5’App DNA/RNAリガーゼ、およびT4 DNAリガーゼから選択される、実施形態E17の方法。
E18.核酸組成物と、(vi)第3のオリゴヌクレオチド、(vii)複数の第3の足場ポリヌクレオチド種、(viii)第4のオリゴヌクレオチド、および(ix)複数の第4の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(f)複数の第3の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssRNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(g)複数の第4の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第4のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(h)核酸組成物、第3のオリゴヌクレオチド、複数の第3の足場ポリヌクレオチド種、第4のオリゴヌクレオチド、および複数の第4の足場ポリヌクレオチド種が、
第3の足場ポリヌクレオチド種の分子が(i)第2のssRNA末端領域および(ii)第3のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第3のオリゴヌクレオチドの分子の末端が第2のssRNA末端領域の末端に隣接しているハイブリダイゼーション産物の第3のセットが形成される条件;および
第4の足場ポリヌクレオチド種の分子が(i)第2のssDNA末端領域および(ii)第4のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第4のオリゴヌクレオチドの分子の末端が第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物の第4のセットが形成される条件下で結合される、
実施形態E1~E17.1のいずれか1つの方法。
E19.結合させるステップの前に、第3のオリゴヌクレオチド、複数の第3の足場ポリヌクレオチド種、第4のオリゴヌクレオチド、および/または複数の第4の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第3のオリゴヌクレオチド、複数の第3の足場ポリヌクレオチド種、第4のオリゴヌクレオチド、および/または複数の第4の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第3のオリゴヌクレオチド、脱リン酸化された第3の足場ポリヌクレオチド種、脱リン酸化された第4のオリゴヌクレオチド、および/または脱リン酸化された第4の足場ポリヌクレオチド種が生成される、実施形態E18の方法。
E20.結合させるステップの前に、第3のオリゴヌクレオチド、複数の第3の足場ポリヌクレオチド種、第4のオリゴヌクレオチド、および/または複数の第4の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態E18の方法。
E21.結合させるステップの前に、第3の足場ポリヌクレオチド種の各々が、第3のオリゴヌクレオチドとハイブリダイズされて複数の第3の足場二重鎖種を形成する、および/または第4の足場ポリヌクレオチド種の各々が、第4のオリゴヌクレオチドとハイブリダイズされて複数の第4の足場二重鎖種を形成する、実施形態E18~E20のいずれか1つの方法。
E22.第1のオリゴヌクレオチドおよび第1のssRNA末端領域の隣接している末端を共有結合で連結させ、第3のオリゴヌクレオチドおよび第2のssRNA末端領域の隣接している末端を共有結合で連結させるステップであって、それによって、共有結合で連結されたハイブリダイゼーション産物の第3のセットが生成されるステップ、および第2のオリゴヌクレオチドおよび第1のssDNA末端領域の隣接している末端を共有結合で連結させ、第4のオリゴヌクレオチドおよび第2のssDNA末端領域の隣接している末端を共有結合で連結させるステップであって、それによって、共有結合で連結されたハイブリダイゼーション産物の第4のセットが生成されるステップをさらに含む、実施形態E18~E21のいずれか1つの方法。
E23.共有結合で連結させるステップが、ハイブリダイゼーション産物の第3のセットと、リガーゼ活性を有する薬剤とを、第1のssRNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結され、第2のssRNA末端領域の末端が第3のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させること;およびハイブリダイゼーション産物の第4のセットと、リガーゼ活性を有する薬剤とを、第1のssDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結され、第2のssDNA末端領域の末端が第4のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態E22の方法。
E24.第1のポリヌクレオチド種の各々についてのssRNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssRNAハイブリダイゼーション領域とは異なる、実施形態E1~E23のいずれか1つの方法。
E25.第2のポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態E1~E24のいずれか1つの方法。
E24.第3のポリヌクレオチド種の各々についてのssRNAハイブリダイゼーション領域が、複数の第3のポリヌクレオチド種の中の他の第3のポリヌクレオチド種におけるssRNAハイブリダイゼーション領域とは異なる、実施形態E18~E25のいずれか1つの方法。
E25.第4のポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第4のポリヌクレオチド種の中の他の第4のポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態E18~E26のいずれか1つの方法。
E26.第1および/もしくは第3の足場ポリヌクレオチド種におけるssRNAハイブリダイゼーション領域が、ランダム配列を含み、ならびに/または第2および/もしくは第4の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態E1~E25のいずれか1つの方法。
E27.第3のオリゴヌクレオチドがDNAを含み、第4のオリゴヌクレオチドがDNAを含む、実施形態E1~26のいずれか1つの方法。
E28.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態E22~E27のいずれか1つの方法。
E29.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態E28の方法。
E30.増幅ライゲーション産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態E29の方法。
E31.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態E30の方法。
E32.供給源が、RNAまたはDNAである、実施形態E31の方法。
E33.供給源を割り当てるステップが、RNA特異的タグまたはDNA特異的タグを含む配列リードを同定することを含む、実施形態E31またはE32の方法。
E34.RNA特異的タグを含む配列リードが、RNA源に割り当てられ、DNA特異的タグを含む配列リードが、DNAに割り当てられる、実施形態E33の方法。
【0328】
F1.RNA特異的タグを含む第1のオリゴヌクレオチドと;
DNA特異的タグを含む第2のオリゴヌクレオチドと;
ssRNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;
ssDNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
を含む、組成物。
F2.第3のオリゴヌクレオチド;
第4のオリゴヌクレオチド;
ssRNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第3の足場ポリヌクレオチド種と;
ssDNAハイブリダイゼーション領域および第4のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第4の足場ポリヌクレオチド種と
をさらに含む、実施形態F1の組成物。
F3.一本鎖リボ核酸(ssRNA)および一本鎖デオキシリボ核酸(ssDNA)を含む核酸組成物をさらに含む、実施形態F1またはF2の組成物。
F4.第1のオリゴヌクレオチドがRNAを含み、第2のオリゴヌクレオチドがDNAを含む、実施形態F1~F3のいずれか1つの組成物。
F4.1 第1のオリゴヌクレオチドがRNAからなり、第2のオリゴヌクレオチドがDNAからなる、実施形態F1~F3のいずれか1つの組成物。
F5.第3のオリゴヌクレオチドがDNAを含み、第4のオリゴヌクレオチドがDNAを含む、実施形態F2~F4.1のいずれか1つの組成物。
F6.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態F1~F5のいずれか1つの組成物。
F7.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態F1~F6のいずれか1つの組成物。
F8.RNA特異的タグおよびDNA特異的タグが、異なる配列を含む、実施形態F1~F7のいずれか1つの組成物。
F9.RNA特異的タグおよびDNA特異的タグが、異なる長さを有する、実施形態F1~F8のいずれか1つの組成物。
F10.RNA特異的タグおよびDNA特異的タグが、異なる検出可能なマーカーを含む、実施形態F1~F9のいずれか1つの組成物。
F11.ssRNAが、SSB結合ssRNAを含み、ssDNAが、SSB結合ssDNAを含む、実施形態F3~F10のいずれか1つの組成物。
F12.第1の足場ポリヌクレオチド種の各々が第1のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態F1~F11のいずれか1つの組成物。
F13.第2の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態F1~F12のいずれか1つの組成物。
F14.第3の足場ポリヌクレオチド種の各々が第3のオリゴヌクレオチドにハイブリダイズされている、複数の第3の足場二重鎖種を含む、実施形態F2~F13のいずれか1つの組成物。
F15.第4の足場ポリヌクレオチド種の各々が第4のオリゴヌクレオチドにハイブリダイズされている、複数の第4の足場二重鎖種を含む、実施形態F2~F14のいずれか1つの組成物。
F16.リガーゼ活性を有する1つまたは複数の薬剤をさらに含む、実施形態F1~F15のいずれか1つの組成物。
F16.1 リガーゼ活性を有する1つまたは複数の薬剤が、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、熱安定性5’App DNA/RNAリガーゼ、およびT4 DNAリガーゼから選択される、実施形態F16の組成物。
F17.第1のポリヌクレオチド種の各々についてのssRNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssRNAハイブリダイゼーション領域とは異なる、実施形態F1~F16.1のいずれか1つの組成物。
F18.第2のポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態F1~F17のいずれか1つの組成物。
F19.第3のポリヌクレオチド種の各々についてのssRNAハイブリダイゼーション領域が、複数の第3のポリヌクレオチド種の中の他の第3のポリヌクレオチド種におけるssRNAハイブリダイゼーション領域とは異なる、実施形態F2~F18のいずれか1つの組成物。
F20.第4のポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第4のポリヌクレオチド種の中の他の第4のポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態F2~F19のいずれか1つの組成物。
F21.第1および/もしくは第3の足場ポリヌクレオチド種におけるssRNAハイブリダイゼーション領域が、ランダム配列を含み、ならびに/または第2および/もしくは第4の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態F2~F20のいずれか1つの組成物。
F22.実施形態F1~F21のいずれか1つの組成物と使用説明書とを含むキット。
【0329】
G1.核酸ライブラリーを生成する方法であって、
(a)伸長条件下で、標的核酸を含む第1の核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、
(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖核酸(dsNA)を含み、
(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、
(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを含む、ステップ;
(b)伸長標的核酸から一本鎖核酸(ssNA)を生成するステップであって、それによって、ssNAを含む第2の核酸組成物が生成されるステップ;および
(c)第2の核酸組成物と第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、
(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(ii)第2の核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のssNA末端領域および(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ
を含む方法。
G2.標的核酸の一部またはすべてが、二本鎖デオキシリボ核酸(dsDNA)を含む、実施形態G1の方法。
G3.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態G1またはG2の方法。
G4.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態G1~G3のいずれか1つの方法。
G5.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態G1~G4のいずれか1つの方法。
G6.伸長前の標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態G1~G5のいずれか1つの方法。
G7.伸長前の標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態G1~G6のいずれか1つの方法。
G8.伸長活性を有する薬剤が、ポリメラーゼである、実施形態G1~G7のいずれか1つの方法。
G9.ポリメラーゼが、DNAポリメラーゼI、DNAポリメラーゼIの大きい(クレノウ)断片、T4 DNAポリメラーゼ、Bacillus stearothermophilus(Bst)DNAポリメラーゼ、9°N(商標)DNAポリメラーゼ、およびTHERMINATORポリメラーゼから選択される、実施形態G8の方法。
G10.伸長活性を有する薬剤が、3’→5’エキソヌクレアーゼ活性を有さないポリメラーゼである、実施形態G1~G7のいずれか1つの方法。
G11.ポリメラーゼが、THERMINATORポリメラーゼである、実施形態G8~G10のいずれか1つの方法。
G12.1つまたは複数の特徴的なヌクレオチドが、ユニバーサル塩基、修飾塩基、メチル化塩基、核酸アナログ、人工核酸、および検出可能に標識された塩基から選択される1つまたは複数の塩基を含む、実施形態G1~G11のいずれか1つの方法。
G13.1つまたは複数の特徴的なヌクレオチドが、イノシン、メチルシトシン、キセノ核酸(XNA)、ペプチド核酸(PNA)、モルホリノ、ロックド核酸(LNA)、グリコール核酸(GNA)、およびトレオース核酸(TNA)から選択される1つまたは複数の塩基を含む、実施形態G12の方法。
G14.伸長領域が、特徴的なヌクレオチドからなる、実施形態G1~G13のいずれか1つの方法。
G15.(b)の伸長標的核酸から一本鎖核酸(ssNA)を生成するステップが、伸長標的核酸を変性させることを含む、実施形態G1~G14のいずれか1つの方法。
G16.(c)の前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態G1~G15のいずれか1つの方法。
G17.(c)の前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態G1~G15のいずれか1つの方法。
G18.(c)の前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態G1~G17のいずれか1つの方法。
G19.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態G1~G18のいずれか1つの方法。
G20.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態G19の方法。
G21.第2の核酸組成物と、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップをさらに含み、
(iii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
(iv)第2の核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(1)第2のssNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、実施形態G1~G20のいずれか1つの方法。
G22.(c)の前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態G21の方法。
G23.(c)の前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と接触されない、実施形態G21の方法。
G24.(c)の前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態G21~G23のいずれか1つの方法。
G25.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに第2のオリゴヌクレオチドおよび第2のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態G21~G24のいずれか1つの方法。
G26.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件および第2のssNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態G25の方法。
G27.第1のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態G1~G26のいずれか1つの方法。
G28.第2のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態G21~G27のいずれか1つの方法。
G29.sscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態G1~G28のいずれか1つの方法。
G30.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態G19~G29のいずれか1つの方法。
G31.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態G30の方法。
G32.増幅ライゲーション産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態G31の方法。
G33.標的核酸中のオーバーハングを、配列リードおよび伸長領域内の1つまたは複数の特徴的なヌクレオチドに基づいて解析するステップをさらに含む、実施形態G32の方法。
G34.解析するステップが、オーバーハングの配列を決定することを含む、実施形態G33の方法。
G35.解析するステップが、オーバーハングの長を決定することを含む、実施形態G33またはG34の方法。
G36.解析するステップが、特定のオーバーハングの量を定量化することを含み、それによって、オーバーハング定量化が生じる、実施形態G33~G35のいずれか1つの方法。
G37.オーバーハング定量化が、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)特定の長さ、または(v)(i)、(ii)、(iii)および(iv)のうちの2つ、3つもしくは4つについての組合せとして特徴付けられる、オーバーハングの定量化である、実施形態G36の方法。
G38.オーバーハング定量化が、(i)5’オーバーハングまたは3’オーバーハングおよび(ii)特定の長さとして特徴付けられる、オーバーハングの定量化である、実施形態G36またはG37の方法。
G39.標的核酸組成物が得られた核酸試料中の標的核酸の供給源をオーバーハング定量化に基づいて同定するステップを含む、実施形態G36~G38のいずれか1つの方法。
G40.解析するステップが、法医学分析のために行われる、実施形態G33~G39のいずれか1つの方法。
G41.解析するステップが、診断分析のために行われる、実施形態G33~G39のいずれか1つの方法。
【0330】
H1.核酸ライブラリーを生成する方法であって、
(a)伸長条件下で、標的核酸を含む核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、
(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖デオキシリボ核酸(dsDNA)を含み、
(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、
(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを__に含む、ステップ;および
(b)アダプターポリヌクレオチドを伸長標的核酸に結合させるステップであって、アダプターポリヌクレオチドが、一本鎖ループと二本鎖領域とを有するヘアピン構造を形成することができる1本の鎖を含み、それによって、一本鎖ループと二本鎖領域とを含む連続鎖伸長標的核酸が生成されるステップ
を含む方法。
H1.1 核酸ライブラリーを生成する方法であって、
(a)伸長条件下で、標的核酸を含む核酸組成物と、1つまたは複数の特徴的なヌクレオチド、および伸長活性を有する薬剤とを接触させるステップであって、それによって、伸長標的核酸が生成され、
(i)標的核酸の一部またはすべてが、オーバーハングを含む二本鎖デオキシリボ核酸(dsDNA)を含み、
(ii)伸長標的核酸が、各々、オーバーハングに相補的な伸長領域を含み、
(iii)伸長領域が1つまたは複数の特徴的なヌクレオチドを__に含む、ステップ;および
(b)伸長標的核酸のコンカテマーを生成するステップであって、それによって、コンカテマー化された伸長標的核酸が生成されるステップ
を含む方法。
H2.標的核酸の一部またはすべてが、二本鎖デオキシリボ核酸(dsDNA)を含む、実施形態H1またはH1.1の方法。
H3.オーバーハングを含む標的核酸が、二重鎖領域および一本鎖オーバーハングを含む、実施形態H1、H1.1、またはH2の方法。
H4.オーバーハングを含む各標的核酸が、一方の末端にオーバーハングを含むか、または両方の末端にオーバーハングを含む、実施形態H1~H3のいずれか1つの方法。
H5.オーバーハングを含む各標的核酸の末端または両方の末端が、5’オーバーハングまたは3’オーバーハングを独立して含む、実施形態H1~H4のいずれか1つの方法。
H6.伸長前の標的核酸中のオーバーハングが、ネイティブオーバーハングである、実施形態H1~H5のいずれか1つの方法。
H7.伸長前の標的核酸中のオーバーハングが、非修飾オーバーハングである、実施形態H1~H6のいずれか1つの方法。
H8.伸長活性を有する薬剤が、ポリメラーゼである、実施形態H1~H7のいずれか1つの方法。
H9.ポリメラーゼが、DNAポリメラーゼI、DNAポリメラーゼIの大きい(クレノウ)断片、T4 DNAポリメラーゼ、Bacillus stearothermophilus(Bst)DNAポリメラーゼ、9°N(商標)DNAポリメラーゼ、およびTHERMINATORポリメラーゼから選択される、実施形態H8の方法。
H10.伸長活性を有する薬剤が、3’→5’エキソヌクレアーゼ活性を有さないポリメラーゼである、実施形態H1~H7のいずれか1つの方法。
H11.ポリメラーゼが、THERMINATORポリメラーゼである、実施形態H8~H10のいずれか1つの方法。
H12.1つまたは複数の特徴的なヌクレオチドが、ユニバーサル塩基、修飾塩基、メチル化塩基、核酸アナログ、人工核酸、および検出可能に標識された塩基から選択される1つまたは複数の塩基を含む、実施形態H1~H11のいずれか1つの方法。
H13.1つまたは複数の特徴的なヌクレオチドが、イノシン、メチルシトシン、キセノ核酸(XNA)、ペプチド核酸(PNA)、モルホリノ、ロックド核酸(LNA)、グリコール核酸(GNA)、およびトレオース核酸(TNA)から選択される1つまたは複数の塩基を含む、実施形態H12の方法。
H14.伸長領域が、特徴的なヌクレオチドからなる、実施形態H1~H13のいずれか1つの方法。
H15.連続鎖伸長標的核酸から連続鎖一本鎖DNA(ssDNA)を生成するステップをさらに含む、実施形態H1およびH2~H14のいずれか1つの方法。
H16.連続鎖伸長標的核酸から連続鎖ssDNAを生成するステップが、連続鎖伸長標的核酸を変性させることを含む、実施形態H15の方法。
H17.連続鎖ssDNAをシーケンシングプロセスによりシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態H15またはH16の方法。
H18.コンカテマー化された伸長標的核酸をシーケンシングプロセスによりシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態H1.1~H14のいずれか1つの方法。
H19.シーケンシングステップが、ナノポアシーケンシングを含む、実施形態H17またはH18の方法。
H20.標的核酸中のオーバーハングを、配列リードおよび伸長領域内の1つまたは複数の特徴的なヌクレオチドに基づいて解析するステップをさらに含む、実施形態H17~H19のいずれか1つの方法。
H21.解析するステップが、オーバーハングの配列を決定することを含む、実施形態H20の方法。
H22.解析するステップが、オーバーハングの長を決定することを含む、実施形態H20またはH21の方法。
H23.解析するステップが、特定のオーバーハングの量を定量化することを含み、それによって、オーバーハング定量化が生じる、実施形態H20~H22のいずれか1つの方法。
H24.オーバーハング定量化が、(i)5’オーバーハング、(ii)3’オーバーハング、(iii)特定の配列、(iv)特定の長さ、または(v)(i)、(ii)、(iii)および(iv)のうちの2つ、3つもしくは4つについての組合せとして特徴付けられる、オーバーハングの定量化である、実施形態H23の方法。
H25.オーバーハング定量化が、(i)5’オーバーハングまたは3’オーバーハングおよび(ii)特定の長さとして特徴付けられる、オーバーハングの定量化である、実施形態H23またはH24の方法。
H26.標的核酸組成物が得られた核酸試料中の標的核酸の供給源をオーバーハング定量化に基づいて同定するステップを含む、実施形態H23~H25のいずれか1つの方法。
H27.解析するステップが、法医学分析のために行われる、実施形態H20~H26のいずれか1つの方法。
H28.解析するステップが、診断分析のために行われる、実施形態H20~H26のいずれか1つの方法。
【0331】
I1.核酸ライブラリーを生成する方法であって、
(a)(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)第1のオリゴヌクレオチドと、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、
複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、
核酸組成物、第1のオリゴヌクレオチド、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のssNA末端領域および(2)第1のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ;および
(b)ssNA中の1つまたは複数の非メチル化シトシン残基を脱アミノ化するステップであって、それによって、1つまたは複数非メチル化シトシン残基がウラシルに変換されるステップ
を含む方法。
I2.核酸ライブラリーを生成する方法であって、
(a)(i)一本鎖核酸(ssNA)を含む核酸組成物と、(ii)複数の第1のオリゴヌクレオチド種と、(iii)複数の第1の足場ポリヌクレオチド種とを結合させるステップであって、
複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第1のオリゴヌクレオチドハイブリダイゼーション領域を含み、
核酸組成物、複数の第1のオリゴヌクレオチド種、および複数の第1の足場ポリヌクレオチド種が、第1の足場ポリヌクレオチド種の分子が(1)第1のssNA末端領域および(2)第1のオリゴヌクレオチド種の分子とハイブリダイズされる条件下で結合され、それによって、第1のオリゴヌクレオチドの分子の末端が第1のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成されるステップ;および
(b)ssNA中の1つまたは複数の非メチル化シトシン残基を脱アミノ化するステップであって、それによって、1つまたは複数非メチル化シトシン残基がウラシルに変換されるステップ
を含む方法。
I3.複数の第1のオリゴヌクレオチド種における各オリゴヌクレオチドが、第1の隣接領域および第2の隣接領域と隣接している第1の固有分子識別子(UMI)を含む、実施形態I2の方法。
I4.第1のオリゴヌクレオチドハイブリダイゼーション領域が、(i)第1の隣接領域に相補的なポリヌクレオチド、および(ii)第2の隣接領域に相補的なポリヌクレオチドを含む、実施形態I3の方法。
I5.実施形態A1.1~A73のいずれか1つについての1つまたは複数の特徴を含む、実施形態I2~I4のいずれか1つの方法。
I6.(b)の脱アミノ化するステップが、(a)の結合させるステップの前に行われる、実施形態I1~I5のいずれか1つの方法。
I7.(b)の脱アミノ化するステップが、(a)の結合させるステップの後に行われる、実施形態I1~I5のいずれか1つの方法。
I8.複数の第1のオリゴヌクレオチド種における第1のオリゴヌクレオチドまたは各オリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態I7の方法。
I9.複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態I7またはI8の方法。
I10.脱アミノ化するステップが、亜硫酸水素ナトリウムの使用を含む、実施形態I1~I9のいずれか1つの方法。
I11.脱アミノ化するステップが、デアミナーゼの使用を含む、実施形態I1~I9のいずれか1つの方法。
I12.(a)の結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第1のオリゴヌクレオチドおよび/または脱リン酸化された第1の足場ポリヌクレオチド種が生成される、実施形態I1~I11のいずれか1つの方法。
I13.(a)の結合させるステップの前に、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と、第1のオリゴヌクレオチドおよび/または複数の第1の足場ポリヌクレオチド種が脱リン酸化される条件下で接触されない、実施形態I1~I11のいずれか1つの方法。
I14.(a)の結合させるステップの前に、第1の足場ポリヌクレオチド種の各々が、第1のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、実施形態I1~I13のいずれか1つの方法。
I15.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態I1~I14のいずれか1つの方法。
I16.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態I15の方法。
I17.(a)が、核酸組成物と(iv)第2のオリゴヌクレオチド、および(v)複数の第2の足場ポリヌクレオチド種とを結合させることをさらに含み、
複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssNAハイブリダイゼーション領域および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み;
核酸組成物、第2のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、第2の足場ポリヌクレオチド種の分子が(1)第2のssNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされる条件下で結合され、それによって、第2のオリゴヌクレオチドの分子の末端が第2のssNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される、
実施形態I1~I16のいずれか1つの方法。
I18.第2のオリゴヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態I17の方法。
I19.複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数のメチル化シトシン残基を含む、実施形態I17またはI18の方法。
I20.結合させるステップの前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種と、ホスファターゼ活性を有する薬剤とを、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触させるステップを含み、それによって、脱リン酸化された第2のオリゴヌクレオチドおよび/または脱リン酸化された第2の足場ポリヌクレオチド種が生成される、実施形態I17~I19のいずれか1つの方法。
I21.結合させるステップの前に、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が、ホスファターゼ活性を有する薬剤と、第2のオリゴヌクレオチドおよび/または複数の第2の足場ポリヌクレオチド種が脱リン酸化される条件下で接触されない、実施形態I17~I19のいずれか1つの方法。
122.結合させるステップの前に、第2の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態I17~I21のいずれか1つの方法。
I23.第1のオリゴヌクレオチドおよび第1のssNA末端領域の隣接している末端を共有結合で連結させるステップ、ならびに第2のオリゴヌクレオチドおよび第2のssNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態I17~I22のいずれか1つの方法。
I24.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のssNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件および第2のssNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態I23の方法。
I25.第1のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第1のポリヌクレオチド種の中の他の第1のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態I1~I24のいずれか1つの方法。
I26.第2のポリヌクレオチド種の各々についてのssNAハイブリダイゼーション領域が、複数の第2のポリヌクレオチド種の中の他の第2のポリヌクレオチド種におけるssNAハイブリダイゼーション領域とは異なる、実施形態I17~I25のいずれか1つの方法。
I27.ssNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態I1~I26のいずれか1つの方法。
I28.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態I15~I27のいずれか1つの方法。
I29.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態I28の方法。
I30.増幅ライゲーション産物をシーケンシングするステップをさらに含む、実施形態I29の方法。
I31.一本鎖ライゲーション産物が、増幅されない、実施形態I28の方法。
I32.一本鎖ライゲーション産物をシーケンシングするステップをさらに含む、実施形態I31の方法。
I33.核酸組成物が、一本鎖DNA(ssDNA)を含む、実施形態I1~I32のいずれか1つの方法。
I34.ssDNAが、二本鎖DNA(dsDNA)に由来する、実施形態I33の方法。
I35.ssDNAが、ニックの入った二本鎖DNA(dsDNA)を含む、dsDNAに由来する、実施形態I34の方法。
I36.結合させるステップの前に、dsDNAを変性させるステップを含み、それによって、ssDNAが生成される、実施形態I34またはI35の方法。
I37.核酸組成物が、一本鎖RNA(ssRNA)を含む、実施形態I1~I32のいずれか1つの方法。
I38.ssNAが、結合させるステップの前に修飾されない、実施形態I1~I37のいずれか1つの方法。
I39.ssNAが第1のオリゴヌクレオチドおよび複数の第1の足場ポリヌクレオチド種と結合される場合、ssNAの一方または両方のネイティブ末端が存在する、実施形態I1~I38のいずれか1つの方法。
I40.ssNAが、無細胞核酸からのものである、実施形態I1~I39のいずれか1つの方法。
【0332】
J1.核酸ライブラリーを生成する方法であって、
(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAと、プライミングポリヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、
(i)プライミングポリヌクレオチドが、プライマー、RNA特異的タグ、および第1のオリゴヌクレオチドを含み、
(ii)cDNAが、RNA特異的タグおよび第1のオリゴヌクレオチドを含み、
(iii)dsDNAが、RNA特異的タグも第1のオリゴヌクレオチドも含まない、ステップ;
(b)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;および
(c)sscDNAおよびssDNAを含む核酸組成物と、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップであって、
(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(ii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(iii)sscDNAとssDNAとを含む核酸組成物、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、
第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第2のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領の末端に隣接しているハイブリダイゼーション産物が形成される条件、および
第2の足場ポリヌクレオチド種の分子が(1)第2のssDNA末端領域および(2)第3のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第3のオリゴヌクレオチドの分子の末端が第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件下で結合される、ステップ
を含む方法。
J2.プライマーが、ランダムヘキサマーを含む、実施形態J1の方法。
J3.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態J1またはJ2の方法。
J4.第1のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態J1~J3のいずれか1つの方法。
J5.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態J1~J4のいずれか1つの方法。
J6.1つまたは複数の修飾ヌクレオチドが、第1のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態J5の組成物。
J7.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態J5またはJ6の方法。
J8.第1のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態J5~J7のいずれか1つの方法。
J9.プライミングポリヌクレオチドが、5’末端および3’末端を含み、5’末端から3’末端へ順番に、第1のオリゴヌクレオチド、RNA特異的タグ、およびプライマーを含む、実施形態J1~J8のいずれか1つの方法。
J10.(b)が、cDNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることを含み、それによって、RNAが消化され、sscDNA産物が生成される、実施形態J1~J9のいずれか1つの方法。
J11.(b)が、cDNA-RNA二重鎖および/またはdsDNAを変性させることを含み、それによって、sscDNAおよび/またはssDNAが生成される、実施形態J1~J10のいずれか1つの方法。
J12.(b)が、sscDNAおよびssDNAと一本鎖核酸結合剤とを接触させることをさらに含む、実施形態J1~J11のいずれか1つの方法。
J13.(b)が、sscDNAおよびssDNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合sscDNAおよびSSB結合ssDNAを生成することをさらに含む、実施形態J1~J12のいずれか1つの方法。
J14.(c)の前に、第1の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、および第2の足場ポリヌクレオチド種の各々が、第3のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態J1~J13のいずれか1つの方法。
J15.第2のオリゴヌクレオチドおよび第1のsscDNA末端領域または第1のssDNA末端領域の隣接している末端を共有結合で連結させるステップ、および第3のオリゴヌクレオチドおよび第2のssDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態J1~J14のいずれか1つの方法。
J16.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のsscDNA末端領域または第1のssDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件および第2のssDNA末端領域の末端が第3のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態J15の方法。
J17.第1の足場ポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態J1~J16のいずれか1つの方法。
J18.第2の足場ポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態J1~J17のいずれか1つの方法。
J19.複数の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態J1~J18のいずれか1つの方法。
J20.複数の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態J1~J19のいずれか1つの方法。
J21.第2のオリゴヌクレオチドが、第2のシーケンシングアダプター、またはその一部を含む、実施形態J1~J20のいずれか1つの方法。
J22.第3のオリゴヌクレオチドが、第3のシーケンシングアダプター、またはその一部を含む、実施形態J1~J21のいずれか1つの方法。
J23.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態J1~J22のいずれか1つの方法。
J24.1つまたは複数の修飾ヌクレオチドが、第2のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態J23の方法。
J25.第2のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態J23またはJ24の方法。
J26.第2のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態J25の方法。
J27.第3のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態J1~J26のいずれか1つの方法。
J28.1つまたは複数の修飾ヌクレオチドが、第3のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態J27の方法。
J29.第3のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態J27またはJ28の方法。
J30.第3のオリゴヌクレオチドが、3’末端を含み、この3’末端が修飾ヌクレオチドを含まない、実施形態J29の方法。
J31.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態J1~J30のいずれか1つの方法。
J32.1つまたは複数の修飾ヌクレオチドが、複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態J31の方法。
J33.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、5’末端および3’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に、3’末端に、または5’末端および3’末端に位置する、実施形態J31またはJ32の方法。
J34.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態J23~J33のいずれか1つの方法。
J35.第3のオリゴヌクレオチドが、DNA特異的タグを含む、実施形態J1~J34のいずれか1つの方法。
J36.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態J35の方法。
J37.第3のオリゴヌクレオチドが、3’末端を含み、DNA特異的タグが、3’末端に位置する、実施形態J35またはJ36の方法。
J38.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態J15~J37のいずれか1つの方法。
J39.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態J38の方法。
J40.増幅ライゲーション産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態J39の方法。
J41.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態J40の方法。
J42.供給源が、第1の混合物中のssRNA、または第1の混合物中のdsDNAである、実施形態J41の方法。
J43.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定することを含む、実施形態J41またはJ42の方法。
J44.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、RNA特異的タグを含まない配列リードが、dsDNAに割り当てられる、実施形態J43の方法。
J45.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定すること、およびDNA特異的タグを含む配列リードを同定することを含む、実施形態J41またはJ42の方法。
J46.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、DNA特異的タグを含む配列リードが、dsDNAに割り当てられる、実施形態J45の方法。
【0333】
K1.核酸を供給源に従って差次的に増幅する方法であって、
(I)実施形態J1~J38のいずれか1つに従って核酸ライブラリーを生成するステップ;
(II)ライブラリーの核酸分子を増幅するステップ
を含み、増幅するステップが、増幅条件下でライブラリーの核酸分子と第1の増幅プライマーおよび第2の増幅プライマーとを接触させることを含み、第1の供給源からの核酸および第2の供給源からの核酸が差次的に増幅され、それによって、差次的に増幅された産物が生成される、方法。
K1.1 第1の供給源からの核酸が、指数関数的に増幅され、第2の供給源からの核酸が、線形に増幅される、実施形態K1の方法。
K2.第1の供給源が、RNAまたはDNAを含む、実施形態K1またはK1.1の方法。
K3.第2の供給源が、RNAまたはDNAを含む、実施形態K1、K1.1またはK2の方法。
K4.第1の供給源がRNAを含み、第2の供給源がDNAを含む、実施形態K1~K1.1の方法。
K5.第1の増幅プライマーが、第1のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態K1~K4のいずれか1つの方法。
K6.第2の増幅プライマーが、第2のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態K1~K5のいずれか1つの方法。
K7.差次的に増幅された産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態K1~K6のいずれか1つの方法。
K8.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態K7の方法。
K9.供給源が、第1の混合物中のssRNA、または第1の混合物中のdsDNAである、実施形態K8の方法。
K10.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定することを含む、実施形態K8またはK9の方法。
K11.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、RNA特異的タグを含まない配列リードが、dsDNAに割り当てられる、実施形態K10の方法。
K12.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定すること、およびDNA特異的タグを含む配列リードを同定することを含む、実施形態K8またはK9の方法。
K13.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、DNA特異的タグを含む配列リードが、dsDNAに割り当てられる、実施形態K12の方法。
【0334】
L1.一本鎖相補デオキシリボ核酸(sscDNA)および一本鎖デオキシリボ核酸(ssDNA)を含み、sscDNAがRNA特異的タグおよび第1のオリゴヌクレオチドを含む、核酸組成物と;
第2のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;
第3のオリゴヌクレオチドと;
ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と
を含む、組成物。
L2.保留。
L3.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態L1の組成物。
L4.第1のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態L1~L3のいずれか1つの組成物。
L5.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L1~L4のいずれか1つの組成物。
L6.1つまたは複数の修飾ヌクレオチドが、第1のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L5の組成物。
L7.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態L5またはL6の組成物。
L8.第1のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態L5~L7のいずれか1つの組成物。
L9.sscDNAが、SSB結合sscDNAを含み、ssDNAが、SSB結合ssDNAを含む、実施形態L1~L8のいずれか1つの組成物。
L10.第1の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態L1~L9のいずれか1つの組成物。
L11.第2の足場ポリヌクレオチド種の各々が第3のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態L1~L10のいずれか1つの組成物。
L12.リガーゼ活性を有する薬剤をさらに含む、実施形態L1~L11のいずれか1つの組成物。
L13.第1の足場ポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態L1~L12のいずれか1つの組成物。
L14.第2の足場ポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態L1~L13のいずれか1つの組成物。
L15.複数の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態L1~L14のいずれか1つの組成物。
L16.複数の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態L1~L15のいずれか1つの組成物。
L17.第2のオリゴヌクレオチドが、第2のシーケンシングアダプター、またはその一部を含む、実施形態L1~L16のいずれか1つの組成物。
L18.第3のオリゴヌクレオチドが、第3のシーケンシングアダプター、またはその一部を含む、実施形態L1~L17のいずれか1つの組成物。
L19.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L1~L18のいずれか1つの組成物。
L20.1つまたは複数の修飾ヌクレオチドが、第2のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L19の組成物。
L21.第2のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態L19またはL20の組成物。
L22.第2のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態L21の組成物。
L23.第3のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L1~L22のいずれか1つの組成物。
L24.1つまたは複数の修飾ヌクレオチドが、第3のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L23の組成物。
L25.第3のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態L23またはL24の組成物。
L26.第3のオリゴヌクレオチドが、3’末端を含み、この3’末端が修飾ヌクレオチドを含まない、実施形態L25の組成物。
L27.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L1~L26のいずれか1つの組成物。
L28.1つまたは複数の修飾ヌクレオチドが、複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L27の組成物。
L29.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、5’末端および3’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に、3’末端に、または5’末端および3’末端に位置する、実施形態L27またはL28の組成物。
L30.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態L19~L29のいずれか1つの組成物。
L31.第3のオリゴヌクレオチドが、DNA特異的タグを含む、実施形態L1~L30のいずれか1つの組成物。
L32.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態L31の組成物。
L33.第3のオリゴヌクレオチドが、3’末端を含み、DNA特異的タグが、3’末端に位置する、実施形態L31またはL32の組成物。
L34.実施形態L1~L33のいずれか1つの組成物と使用説明書とを含むキット。
L35.プライマー、RNA特異的タグ、および第1のオリゴヌクレオチドを含む、プライミングポリヌクレオチドと;
第2のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;
第3のオリゴヌクレオチドと;
ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と;
使用説明書と
を含む、キット。
L36.プライマーが、ランダムヘキサマーを含む、実施形態L35のキット。
L37.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態L35またはL36のキット。
L38.第1のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態L35~L37のいずれか1つのキット。
L39.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L35~L38のいずれか1つのキット。
L40.1つまたは複数の修飾ヌクレオチドが、第1のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L39のキット。
L41.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態L39またはL40のキット。
L42.第1のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態L39~L41のいずれか1つのキット。
L43.プライミングポリヌクレオチドが、5’末端および3’末端を含み、5’末端から3’末端へ順番に、第1のオリゴヌクレオチド、RNA特異的タグ、およびプライマーを含む、実施形態L35~L42のいずれか1つのキット。
L44.一本鎖核酸結合剤をさらに含む、実施形態L35~L43のいずれか1つのキット。
L45.一本鎖核酸結合剤が、一本鎖核酸結合タンパク質(SSB)である、実施形態L44のキット。
L46.逆転写酵素活性を有する薬剤をさらに含む、実施形態L35~L45のいずれか1つのキット。
L47.RNAse活性を有する薬剤をさらに含む、実施形態L35~L46のいずれか1つのキット。
L48.第1の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態L35~L47のいずれか1つのキット。
L49.第2の足場ポリヌクレオチド種の各々が第3のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態L35~L48のいずれか1つのキット。
L50.リガーゼ活性を有する薬剤をさらに含む、実施形態L35~L49のいずれか1つのキット。
L51.第1の足場ポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態L35~L50のいずれか1つのキット。
L52.第2の足場ポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態L35~L51のいずれか1つのキット。
L53.複数の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態L35~L52のいずれか1つのキット。
L54.複数の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態L35~L53のいずれか1つのキット。
L55.第2のオリゴヌクレオチドが、第2のシーケンシングアダプター、またはその一部を含む、実施形態L35~L54のいずれか1つのキット。
L56.第3のオリゴヌクレオチドが、第3のシーケンシングアダプター、またはその一部を含む、実施形態L35~L55のいずれか1つのキット。
L57.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L35~L56のいずれか1つのキット。
L58.1つまたは複数の修飾ヌクレオチドが、第2のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L57のキット。
L59.第2のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態L57またはL58のキット。
L60.第2のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態L59のキット。
L61.第3のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L35~L60のいずれか1つのキット。
L62.1つまたは複数の修飾ヌクレオチドが、第3のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L61のキット。
L63.第3のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態L61またはL62のキット。
L64.第3のオリゴヌクレオチドが、3’末端を含み、この3’末端が修飾ヌクレオチドを含まない、実施形態L63のキット。
L65.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態L35~L64のいずれか1つのキット。
L66.1つまたは複数の修飾ヌクレオチドが、複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態L65のキット。
L67.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、5’末端および3’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に、3’末端に、または5’末端および3’末端に位置する、実施形態L65またはL66のキット。
L68.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態L57~L67のいずれか1つのキット。
L69.第3のオリゴヌクレオチドが、DNA特異的タグを含む、実施形態L35~L68のいずれか1つのキット。
L70.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態L69のキット。
L71.第3のオリゴヌクレオチドが、3’末端を含み、DNA特異的タグが、3’末端に位置する、実施形態L69またはL70のキット。
L72.第1の増幅プライマーおよび第2の増幅プライマーをさらに含む、実施形態L35~L71のいずれか1つのキット。
L73.第1の増幅プライマーが、第1のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態L72のキット。
L74.第2の増幅プライマーが、第2のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態L72またはL73のキット。
L75.第3の増幅プライマーをさらに含む、実施形態L72~L74のいずれか1つのキット。
L76.第3の増幅プライマーが、第3のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態L75のキット。
【0335】
M1.核酸ライブラリーを生成する方法であって、
(a)一本鎖リボ核酸(ssRNA)および二本鎖デオキシリボ核酸(dsDNA)を含む第1の混合物中のssRNAを第1のオリゴヌクレオチドに共有結合で連結させるステップであって、それによって、共有結合で連結されたssRNA産物が生成されるステップ;
(b)共有結合で連結されたssRNA産物と、プライマーオリゴヌクレオチド、および逆転写酵素活性を有する薬剤とを接触させるステップであって、それによって、相補デオキシリボ核酸(cDNA)-RNA二重鎖およびdsDNAを含む第2の混合物が生成され、プライマーオリゴヌクレオチドが第1のオリゴヌクレオチドハイブリダイゼーション領域を含む、ステップ;
(c)cDNA-RNA二重鎖およびdsDNAから、一本鎖cDNA(sscDNA)および一本鎖DNA(ssDNA)を生成するステップであって、それによって、sscDNAおよびssDNAを含む核酸組成物が生成されるステップ;
(d)sscDNAおよびssDNAを含む核酸組成物と、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種とを結合させるステップであって、
(i)複数の第1の足場ポリヌクレオチド種における各ポリヌクレオチドが、sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(ii)複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を含み、
(iii)sscDNAとssDNAとを含む核酸組成物、第2のオリゴヌクレオチド、複数の第1の足場ポリヌクレオチド種、第3のオリゴヌクレオチド、および複数の第2の足場ポリヌクレオチド種が、
第1の足場ポリヌクレオチド種の分子が(1)第1のsscDNA末端領域または第1のssDNA末端領域および(2)第2のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第2のオリゴヌクレオチドの分子の末端が第1のsscDNA末端領域または第1のssDNA末端領の末端に隣接しているハイブリダイゼーション産物が形成される条件、および
第2の足場ポリヌクレオチド種の分子が(1)第2のssDNA末端領域および(2)第3のオリゴヌクレオチドの分子とハイブリダイズされ、それによって、第3のオリゴヌクレオチドの分子の末端が第2のssDNA末端領域の末端に隣接しているハイブリダイゼーション産物が形成される条件下で結合される、ステップ
を含む方法。
M2.第1のオリゴヌクレオチドが、RNAを含む、実施形態M1の方法。
M2.1 第1のオリゴヌクレオチドが、RNAからなる、実施形態M1の方法。
M2.2 第1のオリゴヌクレオチドが、RNA特異的タグを含む、実施形態M1、M1.1、またはM1.2の方法。
M3.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態M2.2の方法。
M4.第1のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態M1~M3のいずれか1つの方法。
M5.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態M1~M4のいずれか1つの方法。
M6.1つまたは複数の修飾ヌクレオチドが、第1のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態M5の組成物。
M7.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態M5またはM6の方法。
M8.第1のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態M5~M7のいずれか1つの方法。
M8.1 第1のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態M8の方法。
M9.第1のオリゴヌクレオチドが、5’末端および3’末端を含み、5’末端から3’末端へ順番に、RNA特異的タグ、および第1のシーケンシングアダプターまたはその一部を含む、実施形態M4~M8.1のいずれか1つの方法。
M10.(a)の共有結合で連結させるステップが、ssRNAおよび第1のオリゴヌクレオチドと、リガーゼ活性を有する1つまたは複数の薬剤とを、ssRNA末端領域の末端が第1のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態M1~M9のいずれか1つの方法。
M11.リガーゼ活性を有する1つまたは複数の薬剤が、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼから選択される、実施形態M10の方法。
M12.プライマーオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態M1~M11のいずれか1つの方法。
M13.1つまたは複数の修飾ヌクレオチドが、プライマーオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態M12の方法。
M14.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態M12またはM13の方法。
M15.プライマーオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態M12~M14のいずれか1つの方法。
M16.(c)が、cDNA-RNA二重鎖と、RNAse活性を有する薬剤とを接触させることを含み、それによって、RNAが消化され、sscDNA産物が生成される、実施形態M1~M15のいずれか1つの方法。
M17.(c)が、cDNA-RNA二重鎖および/またはdsDNAを変性させることを含み、それによって、sscDNAおよび/またはssDNAが生成される、実施形態M1~M16のいずれか1つの方法。
M18.(c)が、sscDNAおよびssDNAと一本鎖核酸結合剤とを接触させることをさらに含む、実施形態M1~M17のいずれか1つの方法。
M19.(c)が、sscDNAおよびssDNAと一本鎖核酸結合タンパク質(SSB)とを接触させて、SSB結合sscDNAおよびSSB結合ssDNAを生成することをさらに含む、実施形態M1~M18のいずれか1つの方法。
M20.(d)の前に、第1の足場ポリヌクレオチド種の各々が、第2のオリゴヌクレオチドとハイブリダイズされて複数の第1の足場二重鎖種を形成する、および第2の足場ポリヌクレオチド種の各々が、第3のオリゴヌクレオチドとハイブリダイズされて複数の第2の足場二重鎖種を形成する、実施形態M1~M19のいずれか1つの方法。
M21.第2のオリゴヌクレオチドおよび第1のsscDNA末端領域または第1のssDNA末端領域の隣接している末端を共有結合で連結させるステップ、および第3のオリゴヌクレオチドおよび第2のssDNA末端領域の隣接している末端を共有結合で連結させるステップをさらに含み、それによって、共有結合で連結されたハイブリダイゼーション産物が生成される、実施形態M1~M20のいずれか1つの方法。
M22.共有結合で連結させるステップが、ハイブリダイゼーション産物と、リガーゼ活性を有する薬剤とを、第1のsscDNA末端領域または第1のssDNA末端領域の末端が第2のオリゴヌクレオチドの末端に共有結合で連結される条件および第2のssDNA末端領域の末端が第3のオリゴヌクレオチドの末端に共有結合で連結される条件下で接触させることを含む、実施形態M21の方法。
M23.第1の足場ポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態M1~M22のいずれか1つの方法。
M24.第2の足場ポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態M1~M23のいずれか1つの方法。
M25.複数の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態M1~M24のいずれか1つの方法。
M26.複数の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態M1~M25のいずれか1つの方法。
M27.第2のオリゴヌクレオチドが、第2のシーケンシングアダプター、またはその一部を含む、実施形態M1~M26のいずれか1つの方法。
M28.第3のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態M1~M27のいずれか1つの方法。
M29.第3のオリゴヌクレオチドが、第3のシーケンシングアダプター、またはその一部を含む、実施形態M1~M27のいずれか1つの方法。
M30.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態M1~M29のいずれか1つの方法。
M31.1つまたは複数の修飾ヌクレオチドが、第2のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態M30の方法。
M32.第2のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態M30またはM31の方法。
M33.第2のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態M32の方法。
M34.第3のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態M1~M33のいずれか1つの方法。
M35.1つまたは複数の修飾ヌクレオチドが、第3のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態M34の方法。
M36.第3のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態M34またはM35の方法。
M37.第3のオリゴヌクレオチドが、3’末端を含み、この3’末端が修飾ヌクレオチドを含まない、実施形態M36の方法。
M38.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態M1~M37のいずれか1つの方法。
M39.1つまたは複数の修飾ヌクレオチドが、複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態M38の方法。
M40.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、5’末端および3’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に、3’末端に、または5’末端および3’末端に位置する、実施形態M38またはM39の方法。
M41.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態M30~M40のいずれか1つの方法。
M42.第3のオリゴヌクレオチドが、DNA特異的タグを含む、実施形態M1~M41のいずれか1つの方法。
M43.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態M42の方法。
M44.第3のオリゴヌクレオチドが、3’末端を含み、DNA特異的タグが、3’末端に位置する、実施形態M42またはM43の方法。
M45.共有結合で連結されたハイブリダイゼーション産物を変性させるステップをさらに含み、それによって、一本鎖ライゲーション産物が生成される、実施形態M21~M44のいずれか1つの方法。
M46.一本鎖ライゲーション産物を増幅させるステップをさらに含み、それによって、増幅ライゲーション産物が生成される、実施形態M45の方法。
M47.増幅ライゲーション産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態M46の方法。
M48.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態M47の方法。
M49.供給源が、第1の混合物中のssRNA、または第1の混合物中のdsDNAである、実施形態M48の方法。
M50.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定することを含む、実施形態M48またはM49の方法。
M51.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、RNA特異的タグを含まない配列リードが、dsDNAに割り当てられる、実施形態M50の方法。
M52.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定すること、およびDNA特異的タグを含む配列リードを同定することを含む、実施形態M48またはM49の方法。
M53.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、DNA特異的タグを含む配列リードが、dsDNAに割り当てられる、実施形態M52の方法。
【0336】
N1.核酸を供給源に従って差次的に増幅する方法であって、
(I)実施形態M1~M45のいずれか1つに従って核酸ライブラリーを生成するステップ;
(II)ライブラリーの核酸分子を増幅するステップ
を含み、増幅するステップが、増幅条件下でライブラリーの核酸分子と第1の増幅プライマーおよび第2の増幅プライマーとを接触させることを含み、第1の供給源からの核酸および第2の供給源からの核酸が差次的に増幅され、それによって、差次的に増幅された産物が生成される、方法。
N1.1 第1の供給源からの核酸が、指数関数的に増幅され、第2の供給源からの核酸が、線形に増幅される、実施形態N1の方法。
N2.第1の供給源が、RNAまたはDNAを含む、実施形態N1またはN1.1の方法。
N3.第2の供給源が、RNAまたはDNAを含む、実施形態N1、N1.1、またはN2の方法。
N4.第1の供給源がRNAを含み、第2の供給源がDNAを含む、実施形態N1またはN1.1の方法。
N5.第1の増幅プライマーが、M1(b)におけるプライマーオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態N1~N4のいずれか1つの方法。
N6.第2の増幅プライマーが、第2のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態N1~N5のいずれか1つの方法。
N7.差次的に増幅された産物をシーケンシングするステップをさらに含み、それによって、核酸配列リードが生成される、実施形態N1~N6のいずれか1つの方法。
N8.供給源を核酸配列リードに割り当てるステップをさらに含む、実施形態N7の方法。
N9.供給源が、第1の混合物中のssRNA、または第1の混合物中のdsDNAである、実施形態N8の方法。
N10.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定することを含む、実施形態N8またはN9の方法。
N11.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、RNA特異的タグを含まない配列リードが、dsDNAに割り当てられる、実施形態K10の方法。
N12.供給源を割り当てるステップが、RNA特異的タグを含む配列リードを同定すること、およびDNA特異的タグを含む配列リードを同定することを含む、実施形態N8またはN9の方法。
N13.RNA特異的タグを含む配列リードが、ssRNAに割り当てられ、DNA特異的タグを含む配列リードが、dsDNAに割り当てられる、実施形態N12の方法。
【0337】
O1.第1のオリゴヌクレオチドと;
第1のオリゴヌクレオチドハイブリダイゼーション領域を含むプライマーオリゴヌクレオチドと;
第2のオリゴヌクレオチドと;
sscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域、および第2のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第1の足場ポリヌクレオチド種と;
第3のオリゴヌクレオチドと;
ssDNAハイブリダイゼーション領域および第3のオリゴヌクレオチドハイブリダイゼーション領域を各々が含む、複数の第2の足場ポリヌクレオチド種と;
使用説明書と
を含む、キット。
O2.第1のオリゴヌクレオチドが、RNAを含む、実施形態O1のキット。
O3.第1のオリゴヌクレオチドが、RNAからなる、実施形態O1のキット。
O4.第1のオリゴヌクレオチドが、RNA特異的タグを含む、実施形態O1、O2、またはO3のキット。
O5.RNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態O4のキット。
O6.第1のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態O1~O5のいずれか1つのキット。
O7.第1のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態O1~O6のいずれか1つのキット。
O8.1つまたは複数の修飾ヌクレオチドが、第1のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態O7のキット。
O9.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態O7またはO8のキット。
O10.第1のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態O7~O9のいずれか1つのキット。
O11.第1のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態O10のキット。
O12.第1のオリゴヌクレオチドが、5’末端および3’末端を含み、5’末端から3’末端へ順番に、RNA特異的タグ、および第1のシーケンシングアダプターまたはその一部を含む、実施形態O6~O11のいずれか1つのキット。
O13.RNAリガーゼ活性を有する1つまたは複数の薬剤をさらに含む、実施形態O1~O12のいずれか1つのキット。
O14.リガーゼ活性を有する1つまたは複数の薬剤が、T4 RNAリガーゼ1、T4 RNAリガーゼ2、短縮化T4 RNAリガーゼ2、および熱安定性5’App DNA/RNAリガーゼから選択される、実施形態O13のキット。
O15.プライマーオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態O1~O14のいずれか1つのキット。
O16.1つまたは複数の修飾ヌクレオチドが、プライマーオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態O15のキット。
O17.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態O15またはO16のキット。
O18.プライマーオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態O15~O17のいずれか1つのキット。
O19.一本鎖核酸結合剤をさらに含む、実施形態O1~O18のいずれか1つのキット。
O20.一本鎖核酸結合剤が、一本鎖核酸結合タンパク質(SSB)である、実施形態O19のキット。
O21.逆転写酵素活性を有する薬剤をさらに含む、実施形態O1~O20のいずれか1つのキット。
O22.RNAse活性を有する薬剤をさらに含む、実施形態O1~O21のいずれか1つのキット。
O23.第1の足場ポリヌクレオチド種の各々が第2のオリゴヌクレオチドにハイブリダイズされている、複数の第1の足場二重鎖種を含む、実施形態O1~O22のいずれか1つのキット。
O24.第2の足場ポリヌクレオチド種の各々が第3のオリゴヌクレオチドにハイブリダイズされている、複数の第2の足場二重鎖種を含む、実施形態O1~O23のいずれか1つのキット。
O25.DNAリガーゼ活性を有する薬剤をさらに含む、実施形態O1~O24のいずれか1つのキット。
O26.第1の足場ポリヌクレオチド種の各々についてのsscDNAハイブリダイゼーション領域またはssDNAハイブリダイゼーション領域が、複数の第1の足場ポリヌクレオチド種の中の他の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域ともssDNAハイブリダイゼーション領域とも異なる、実施形態O1~O25のいずれか1つのキット。
O27.第2の足場ポリヌクレオチド種の各々についてのssDNAハイブリダイゼーション領域が、複数の第2の足場ポリヌクレオチド種の中の他の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域とは異なる、実施形態O1~O26のいずれか1つのキット。
O28.複数の第1の足場ポリヌクレオチド種におけるsscDNAハイブリダイゼーション領域および/またはssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態O1~O27のいずれか1つのキット。
O29.複数の第2の足場ポリヌクレオチド種におけるssDNAハイブリダイゼーション領域が、ランダム配列を含む、実施形態O1~O28のいずれか1つのキット。
O30.第2のオリゴヌクレオチドが、第2のシーケンシングアダプター、またはその一部を含む、実施形態O1~O29のいずれか1つのキット。
O31.第3のオリゴヌクレオチドが、第1のシーケンシングアダプター、またはその一部を含む、実施形態O1~O30のいずれか1つのキット。
O32.第3のオリゴヌクレオチドが、第3のシーケンシングアダプター、またはその一部を含む、実施形態O1~O30のいずれか1つのキット。
O33.第2のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態O1~O32のいずれか1つのキット。
O34.1つまたは複数の修飾ヌクレオチドが、第2のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態O33のキット。
O35.第2のオリゴヌクレオチドが、3’末端を含み、1つまたは複数の修飾ヌクレオチドが、3’末端に位置する、実施形態O33またはO34のキット。
O36.第2のオリゴヌクレオチドが、5’末端を含み、この5’末端が修飾ヌクレオチドを含まない、実施形態O35のキット。
O37.第3のオリゴヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態O1~O36のいずれか1つのキット。
O38.1つまたは複数の修飾ヌクレオチドが、第3のオリゴヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態O37のキット。
O39.第3のオリゴヌクレオチドが、5’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に位置する、実施形態O37またはO38のキット。
O40.第3のオリゴヌクレオチドが、3’末端を含み、この3’末端が修飾ヌクレオチドを含まない、実施形態O39のキット。
O41.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、1つまたは複数の修飾ヌクレオチドを含む、実施形態O1~O40のいずれか1つのキット。
O42.1つまたは複数の修飾ヌクレオチドが、複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドの、別のオリゴヌクレオチド、ポリヌクレオチドまたは核酸分子への共有結合性連結を遮断することができる、実施形態O41のキット。
O43.複数の第1の足場ポリヌクレオチド種および複数の第2の足場ポリヌクレオチド種における各ポリヌクレオチドが、5’末端および3’末端を含み、1つまたは複数の修飾ヌクレオチドが、5’末端に、3’末端に、または5’末端および3’末端に位置する、実施形態O41またはO42のキット。
O44.1つまたは複数の修飾ヌクレオチドが、ライゲーションを遮断する修飾を含む、実施形態O33~O43のいずれか1つのキット。
O45.第3のオリゴヌクレオチドが、DNA特異的タグを含む、実施形態O1~O44のいずれか1つのキット。
O46.DNA特異的タグが、約5~約15ヌクレオチドを含む、実施形態O45のキット。
O47.第3のオリゴヌクレオチドが、3’末端を含み、DNA特異的タグが、3’末端に位置する、実施形態O45またはO46のキット。
O48.第1の増幅プライマーおよび第2の増幅プライマーをさらに含む、実施形態O1~O47のいずれか1つのキット。
O49.第1の増幅プライマーが、プライマーオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態O48のキット。
O50.第2の増幅プライマーが、第2のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列を含む、実施形態O48またはO49のキット。
O51.第3の増幅プライマーをさらに含む、実施形態O48~O50のいずれか1つのキット。
O52.第3の増幅プライマーが、第3のオリゴヌクレオチドまたはその一部分に相補的である、ヌクレオチド配列含む、実施形態O51のキット。
【実施例】
【0338】
下記の実施例は、ある特定のインプリメンテーションを説明するものであり、本技術を限定するものではない。
【0339】
(実施例1)
インライン固有分子識別子(UMI)を有する足場アダプター
この実施例は、インライン固有分子識別子(UMI)を有する足場アダプター構成を説明する。インラインUMIは、本明細書に記載される足場アダプターの成分であるUMI配列であって、足場アダプターのオリゴヌクレオチド成分にライゲーションされたssNA断片のシーケンシングにより生成される配列リードの一部になるUMI配列を指す。鋳型ssNAに隣接しているランダム/ユニバーサル塩基を使用する以前のインラインUMI構成(すなわち、ssNA断片に結合された場合にssNA末端に直接隣接する、オリゴヌクレオチドの末端に位置するランダム/ユニバーサル塩基UMI)は、対照と比較して不良な収量および高度なアダプターダイマー形成を生じさせる結果となった。理論により限定されるものではないが、不良な収量は、足場ポリヌクレオチド中の対応するNへのオリゴヌクレオチド中のNの不適切なアニーリングに起因すると推測された。オリゴヌクレオチド中のUMI Nがランダムであり、足場ポリヌクレオチド中の対応するNがランダムである場合、これらの成分は、必ずしも互いに相補的ではない。
【0340】
アニーリングを改善するための1つの代替案は、足場ポリヌクレオチド中の対応する非ランダム相補配列を有するオリゴヌクレオチドにおける非ランダムUMI配列の使用であるが、本明細書に記載の足場アダプター構成のコンテキストでの非ランダムUMI配列の使用には、通常は法外な費用がかかる(すなわち、適切なUMI複雑性を確保するために、多数のオリゴヌクレオチドおよび足場ポリヌクレオチドを製造し、アニーリングし、プールすることが必要となるため)。別の代替案は、UMIがインデックスに隣接している位置にあって鎖置換ポリメラーゼによってアダプター分子に付加される構成であるが、この構成は、少なくとも1時間プロトコールを長引かせ、より多くの試薬(例えば、UMI含有鎖を作出するための鎖置換ポリメラーゼ)を追加する。
【0341】
したがって、成分がインラインランダムUMI配列を含む場合のアダプター成分のアニーリングを改善するために、新しいアダプター構成を開発した。本明細書に記載のインラインUMI構成は、ランダムNの組合せを既知の相補配列に加えてを含む。例えば、ランダムNの「バブル」が、2つの相補的な既知の「アンカー」ヌクレオチド配列セットと隣接している。1つの構成では、P7アダプターは、ランダムN(例えば、約5のランダム塩基)の下流(すなわち、ssNA-オリゴヌクレオチド接合部より遠位)に位置する。ランダムNの上流(すなわち、ssNA-オリゴヌクレオチド接合部の近位)に、UMIの一部となる既知の配列(例えば、約10の非ランダム塩基)がある。ランダムNは、十分な複雑性を生じさせるので、これらの成分の製造および生成の対費用効果は高い。アンカーヌクレオチドのバランスのとれたシーケンシングスペクトルを生じさせるために、約2~4アダプター種のプールを、異なる「アンカー」配列を用いて生成することができる。この構成では、リバースリードのシーケンシングは、リードが15bpのUMI(5のランダム塩基および10の既知塩基)で出発することになってしまう。これらをトリミングし、移動させて、fastqファイルでUMIタグを生成し、ネイティブssNA末端のマッピングを可能にすることができる。一例では、シーケンシングプロトコールのインフォマティクスコンポーネントは、ユニークリードを逆多重化し、インラインUMIを考慮に入れて、リード1を近似的にトリミングし、リード2のUMIをトリミングし、fastqヘッダーに追加するためのコマンドラインツールを伴い、それを遂行してbamにすることができる。データトリミングスキームの例を
図5に示す。シーケンシングインデックスの付近にではなく鋳型とインラインでUMIを付加させることにより、ユーザーは、シーケンサー設定の修正を回避することが可能になる。本明細書に記載のインラインUMI構成を、どちらかのアダプター(すなわち、本明細書に記載の第1のアダプターもしくは第2のアダプター)に適用することができ、または両方のアダプターに適用することができる。
【0342】
インラインランダムUMIを有する足場アダプター構成の例を
図1に示す。ある特定の構成では、アンカー配列は、37℃のライゲーション温度の間、相補性を維持するのに十分な長さである。ある特定の構成では、アンカー配列は、45℃より高い融解温度を有するために70%GC含有量である。アンカー配列の例は、GGCCCGACGGであり、Tm=47.7℃を有する。1つのアンカー種と5ntランダムUMIとを有する1つの構成には、4
5=1024の固有のタグがある。複雑性を増加させる(すなわち、固有のタグの数を増加させる)ために、複数のアンカー種を使用することができ、ランダムUMIの長さを増加させることができ、インラインUMIアダプター構成を両方のアダプター(例えば、ssNA断片の各末端についてのP7およびP5アダプター)に使用することができ、ならびに/またはプールpfアダプター内のアンカーの長さおよび/もしくはランダムUMIの長さを変えることができる。複数のアンカー種を付加させることおよび/またはランダムUMI長を変えることにより複雑性を増加させるための構成の例を
図2に示す。
【0343】
インラインUMIが非ランダム配列を含む、足場アダプター構成の別の例を、
図6に示す。ランダムUMI中のNがアダプター中のそれらの対応する配列にアニーリングすることができないため、上記のアダプター構成にはアンカー配列が含まれている。1つの代替案は、すべての可能な非ランダム5merのプールを使用することであり、これにより、ランダムNの使用が避けられ、より短い隣接領域が可能になる。一部の構成では、上および下の鎖において4
5の組合せすべてを使用して、1024の反応で、2048のアダプター種を製造し、アニーリングする。一部の構成では、GC含有量が多い非ランダム隣接部をライゲーション末端において使用する。
【0344】
一部の構成では、高GC隣接部を非UMIアダプターに付加させてライゲーション効率を上昇させることができる。高GC隣接部を非UMIアダプターに付加させ、本明細書に記載の任意のインラインUMIアダプター(例えば、ランダムまたは非ランダムUMI)と組み合わせて使用することができる。理論により限定されるものではないが、より高い融解温度、したがってライゲーション位置でのより高い安定性を有することは、ライゲーション効率を向上させることができる。
【0345】
(実施例2)
Methyl-Seqのための足場アダプター
Methyl-Seqは、非メチル化シトシン残基をウラシル残基に変換し、その後、チミジン残基に最終的に(増幅後に)変換する方法である。メチル化シトシン残基は、変換プロセスから保護される。メチル変換の主な目的は、エピジェネティックデコンボリューションのためである。Methyl-Seqは、特に、次世代シーケンシング(NGS)の過程で使用されるメチル変換を指し、それが、全ゲノムシーケンシング(WGS)であるか、プローブによる標的シーケンシングであるか、アンプリコン濃縮であるかなどを問わない。
【0346】
メチル変換は、DNAに対して激しいものであり得る。例えば、メチル変換は、DNAを一本鎖DNA(ssDNA)に変性させることができ、様々なニックおよび切断点を生じさせることができる。Methyl-Seqライブラリーを作出する場合に現在使用されているある特定の方法は、ライゲーションに基づくNGSライブラリー調製方法(例えば、メチル化変換前または後のアダプターライゲーション)を利用すると、不利であることが多い。例えば、ある特定のメチル変換前の方法は、短いライブラリー分子に偏っていることがある。メチル変換(例えば、バイサルファイト処理を使用する)は、DNAをニッキングし、断片化するので、アダプターライゲーション後にDNAが切断する(例えば、P5がP7アダプターから分断する)いずれの分子も最終ライブラリーに含まれない。これは、ssDNA調製とdsDNA調製両方のメチル変換前アダプターライゲーションアプローチについて起こり得る。ある特定のメチル変換後アダプターライゲーション方法は、ssDNAを生成し、dsDNAアダプターのメチル変換DNAへのライゲーションのために第2鎖の合成(付加反応およびクリーンアップステップ)を必要とする。
【0347】
方法
この実施例では、本明細書に記載の足場アダプターがMethyl-Seqのコンテキストでどれほど効果を発揮するのかを示すために一連の実験を行った。下記は、せん断されたgDNAを使用して行った実験の説明である。
【0348】
足場アダプターライゲーションを2つのコンテキストで行った:
1.メチル保護された足場アダプターをメチル変換の前にライゲーションする
2.通常の(メチル保護されていない)足場アダプターをメチル変換の後にライゲーションする
【0349】
2つの異なる形態のメチル変換戦略を試験した:
1.ZYMOのEZ METHYLATION-LIGHTNING Kit(すなわち、バイサルファイト変換)
2.NEBの酵素的メチル化キット。
【0350】
足場アダプターがMethyl-Seqのコンテキストでいかによく効果を発揮するのかについての相対比較を行うために、足場アダプターを、メチル保護されたシトシン残基を有するおよび有さないdsDNAアダプター(すなわち、標準YアダプターおよびNEB酵素的Methyl-Seq(EM)アダプター)と、上に列挙した両方の条件で比較した。
図11は、この実験で使用したアダプターの例を示す。
【0351】
試験したすべてのシナリオで、10ngのせん断NA12878 gDNAを投入物として使用した。アダプターライゲーションおよびメチル変換(必ずしもこの順番ではない)後、インデックスPCRを、Q5ウラシル+インデックスPCRポリメラーゼおよび8インデックスPCRサイクルを使用して行った。反応ステップ間のすべての精製は、DNA精製ビーズを製造業者の使用説明書に従って使用して行った。
【0352】
結果
結果の全体像を
図12に提供する。
図12の縦列1は、DNAを、足場アダプターライゲーションの前に、ZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)に付した場合、高品質のシーケンシングライブラリーが作出されたことを示す。
図12の縦列1はまた、DNAを、足場アダプターライゲーションの前に、NEB Enzymatic Methylation Kitに付した場合、高品質のシーケンシングライブラリーが作出されたことを示す。
図12の縦列2は、DNAを、dsDNAアダプター(標準Yアダプター)ライゲーションの前に、ZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)またはNEB Enzymatic Methylation Kitのどちらかに付した場合、シーケンシングライブラリーが作出されなかったことを示す。DNAが処理後に一本鎖であったのでこのアウトカムを予想し、アダプターライゲーションステップの前に第2鎖合成を行わなかった。
図12の縦列3は、メチル保護された足場アダプターをZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)の前にDNAにライゲーションした場合、シーケンシングライブラリーが作出されなかったことを示す。理論により限定されるものではないが、これは、アダプターの大部分を互いに分離する(激しいバイサルファイト処理からの)DNA鎖切断に起因して不成功に終わった可能性がある。
図12の縦列3はまた、メチル保護された足場アダプターをNEB Enzymatic Methylation Kitによるシーケンシングの前にDNAにライゲーションした場合、高品質のライブラリーが作出されたことを示す。理論により限定されるものではないが、この処理は成功した可能性があり、バイサルファイトによる対応する処理は、処理の総体的な激しさに起因して不成功に終わった可能性がある。酵素的処理は、DNAに対してバイサルファイト処理より激しくないので、より多くの分子が無傷のままであり、シーケンシングライブラリーが作出された。ある特定の事例では(例えば、cfDNAを投入物として使用した場合)、酵素的メチル化処理とメチル保護された足場アダプターのライゲーションとを併用する方法は、ネイティブ末端を保持することができる。
図12の縦列4は、メチル保護されたdsDNAアダプターをZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)の前にDNAにライゲーションした場合、シーケンシングライブラリーが作出されなかったことを示す。理論により限定されるものではないが、これは、アダプターの大部分を互いに分離する(激しいバイサルファイト処理からの)DNA鎖切断に起因して不成功に終わった可能性がある。
図12の縦列4は、メチル保護されたdsDNAアダプターをNEB Enzymatic Methylation Kitによるシーケンシングの前にDNAにライゲーションした場合、高品質のシーケンシングライブラリーが作出されたことを示す。理論により限定されるものではないが、この処理は成功した可能性があり、バイサルファイトによる対応する処理は、処理の総体的な激しさに起因して不成功に終わった可能性がある。酵素的処理は、DNAに対してバイサルファイト処理より激しくないので、より多くの分子が無傷のままであり、シーケンシングライブラリーが作出された。
【0353】
一般的メトリクス
シーケンシングライブラリーを生成した4つの実験条件は、以下のものであった:
1.足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)
2.足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit
3.NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする
4.NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする
【0354】
試験したすべての条件のためのライブラリーを二重反復で作出した。最初のシーケンシングQC後、これらの条件の各々についての1つの複製ライブラリーをより深いシーケンシング(試料当たり10Mリードペアの標的)に送った。次いで、シーケンシングデータをBismark Methyl-Seqパイプラインおよび解析用のMultiQCに流した。
【0355】
図13の表は、各試料についてのシーケンシングされたリードペアの数、メチル化されたCGジヌクレオチドの量、メチル化された他の(非ヒトエピジェネティック)モチーフの量、重複したリードのパーセント、アライメントしたリードのパーセント、挿入物サイズ代表値、アダプターを含有したリードの量(トリミングした)、およびリードのGC含有量を示す。トリミングしたパーセント、および挿入物サイズ代表値は、完全に相関する(より短い挿入物は、より多くのアダプター含有量を有し、トリミングを必要とする)。挿入物サイズは、一般に、DNAに対するメチル変換処理の激しさの程度の良好なメトリクスである(挿入物サイズ代表値が短い値であるほど、処理が激しい)。全体として、足場アダプターに基づく試料は、1つのdsDNAアダプターライゲーション試料より多くのマッピングを有し、最高総合メトリクスを有する試料は、足場アダプターライゲーションの前にNEB Enzymatic Methylation Kitというプロトコールであった。
【0356】
挿入物サイズ
図14は、以下の4つの条件下で生成されたライブラリー(グラフ中に左から右へ1~4と表示されている;およそ150bpにおける一時的な急上昇は、この実験(2×151)についてのシーケンシングリード長のアーチファクトである)についての挿入物サイズを示す:
1.足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)
2.NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする
3.NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする
4.足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit
【0357】
PreSeq複雑性
図15は、以下の条件下での最高の複雑性から最低の複雑性までのPreSeqライブラリー複雑性推定値を示す:
1.足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION-LIGHTNING Kit(バイサルファイト処理)
2.NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする
3.足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit
4.NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする
【0358】
試料1および2の複雑性は、これらの試料が最短の断片サイズを有したため、人工的に高い可能性がある。しかし、試料3が試料4より高い複雑性推定値を有することから、試料3が試料4と比較して長い挿入物サイズを有する場合、それは、Methyl-Seqでの足場アダプターの複雑性が、dsDNA法と同等であるか、またはそれより若干良好であることを示す。
【0359】
GC分布:
図16は、以下の4つの条件下で生成されたライブラリー(グラフ中に1~4と表示されている)についてのGC分布を示す:
1.NEB Enzymatic Methylation Kitの前に、メチル保護された足場アダプターをDNAにライゲーションする
2.NEB Enzymatic Methylation Kitの前に、メチル保護されたdsDNAアダプターをDNAにライゲーションする
3.足場アダプターライゲーション(メチル保護されていないアダプター)の前にZYMO EZ DNA METHYLATION-LIGHTNING KIT(バイサルファイト処理)
4.足場アダプターライゲーション(メチル保護されていないアダプター)の前にNEB Enzymatic Methylation Kit
【0360】
すべての試料が同様であった。
【0361】
結論
シーケンシングライブラリーを生成したプロトコールのすべては、メトリクスが互いにかなり似ている品質シーケンシングライブラリーを生成した。足場アダプター(および他のssDNAライゲーションに基づく調製)は、ユーザーがメチル変換の下流でアダプターをライゲーションすること可能にすることによりMethyl-Seqの多用途性をもたらした。これは、第2鎖をアダプターライゲーションの前に合成しなければならないこの方法のdsDNAアプローチより、時間を節約し、分子複雑性を保ち、かつ安価である。
【0362】
メチル保護されたアダプターをメチル変換前にライゲーションする場合の、DNAがメチル変換される物質である方法。より長い鋳型分子での結果は、より穏やかなメチル変換処理によってライブラリーが作出されることを示唆する。より短い鋳型分子(例えば、cfDNAまたは古代DNA(aDNA))を投入物として使用した場合、投入(鋳型)DNAが既に極めて短いため、激しいバイサルファイト処理の上流でメチル保護されたアダプターライゲーションによってシーケンシングライブラリーが生成される可能性がある。
【0363】
(実施例3)
DNAとRNAの混合物のための足場アダプター
ハイスループット、多検体プロファイリングは、医学的表現型についての生体分子の統合~オミック解析を可能にした。専用分子アッセイは、生体試料からプロテオミクスプロファイル、代謝プロファイル、ゲノムプロファイルおよびトランスクリプトームプロファイルを捕捉する。これらの独立したデータを組み合わせて、研究している生物学的状態のより深い理解をもたらすことができる。特に、DNAおよびRNAの解析は、次世代シーケンシング(NGS)および下流の解析パイプラインの進歩から恩恵を受けてきた。DNAのNGS解析は、一般に、ゲノムの遺伝的置換および体細胞置換のカタログを提供し、RNA-seqは、通常は、ゲノムからの遺伝子発現により作り出されるものをアッセイするために使用される。両方のタイプのデータは、例えば、遺伝性疾患、がんおよび感染性疾患の病因を検出し、理解するために使用されている。
【0364】
DNAおよびRNA-seqデータの組合せによって、補完データおよび一部の場合には相乗データを得ることができる。ヒトメタゲノム試料の統合核酸解析は、代謝性疾患におけるマイクロバイオームの役割を理解するのに有用であり得る。感染性疾患への応用の場合、組み合わせたDNAおよびRNA解析は、基礎疾患を引き起こす病原体を単一のアッセイで同定するのに役立ち得る。単一細胞核酸のNGS解析は、転移性および発癌性細胞の小群のゲノムプロファイルおよびトランスクリプトームプロファイルの微妙な違いを明らかにすることができる。統合無細胞核酸(cfNA)NGS解析は、循環腫瘍ゲノムおよび/またはトランスクリプトーム断片の包括的シグナルを捕捉することができ、それによって、そのようなアッセイの診断力が改善される。無細胞DNAと無細胞RNAの両方が病状バイオマーカーとして有用であり得る。
【0365】
DNAおよびRNAの旧来の全ゲノム/トランスクリプトーム(非標的化)NGSライブラリー調製は、通常は、2つの明確に異なる方法として行われるが、多くの場合、いくつかのオーバーラップしている分子ステップを有する。例えば、シーケンシングアダプターライゲーション、ライブラリー増幅およびインデックス付加ステップは、多くの場合、両方の調製に含まれる。加えて、後続のシーケンシングおよび解析は、多くの場合、同じシーケンシングプラットフォームで行われる。これらの類似性にもかかわらず、全ゲノム/トランスクリプトームライブラリーの同時調製のための既存のパイプラインの途切れのない統合にはいくつかの制限がある。現行のアプローチは、通常は、二本鎖DNA(dsDNA)への変換を必要とするか、または全く別のRNA特異的ライゲーション反応、続いての変換を必要とし、これは、方向性の偏りを生じさせ、全プロトコール時間を増加させ、より多くの精製ステップを導入し、その結果、全収量が低減する。
【0366】
例えばFFPEなどの、他の自然に分解される試料タイプからのcfNAおよび核酸を特に対象とする、全核酸の偏りのない全ゲノム/トランスクリプトーム解析のための同時DNA:RNAライブラリー調製方法を、この実施例で説明する。この概念は、本明細書に記載の一本鎖DNAライブラリー調製技術に基づく。このプロトコールは、シーケンシング対応DNAおよび定方向RNAライブラリーを迅速に(例えば、4.5時間以内に)提供することができる。アッセイは、DNAおよびRNA分子を特異的にバーコード化し、かくてゲノムおよびトランスクリプトームリードのデコンボリューションを可能にし、ならびにアッセイによって、必要に応じて、DNAまたはRNAのどちらかの差次的増幅が可能になる。
【0367】
ssPrep
ハイスループットシーケンシングは、cfNAまたはFFPE試料に見られるもののような分解された核酸の主要な特性の多くを明らかにした。分解された核酸は、一般に短く、多くの場合、例えば、ニッキング、酸化、脱アミノ化によって、損傷している。通常は、分解されたDNAの長さは、試料タイプに関係なく、1つもしくは少数のヌクレオソームの長さであるか、またはそれより短い。分解したDNAは、多くの場合、DNA骨格がニックによって損傷しており、旧来の二本鎖DNAライブラリー調製プロトコールによって失われるか、またはそのプロトコールを妨げる。分解されたRNA転写物も同様に短く、断片化している。有意なタンパク質保護がなければ、それらは、通常は、長さが100ヌクレオチドより短く、断片化されており、したがって、ポリA捕捉により全転写物が捕捉される可能性は低い。したがって、短い断片をライブラリー分子に変換することができるライブラリープロトコールは、断片化された核酸に有用である。
【0368】
この実施例では、本明細書に記載の一本鎖ライブラリー調製(ssPrep)方法を、RNAとDNAの混合試料をシーケンシング対応ライブラリー分子に同時に変換するために使用する。ssPrep方法は、アダプターライゲーションの前に鋳型分子の熱変性により効果を発揮して、すべての投入DNA一本鎖を作製する。ライゲーション中、分子は、一本鎖DNA結合タンパク質の付加によって安定化された状態を保つ。足場アダプターは、局在dsDNAニックライゲーション事象を助長し、それによって、一本鎖ライブラリーのライゲーション効率が高められる。最終にどうなるかというと、ニックの入った(損傷した)短い分子のほうが効率的にシーケンシングライブラリー分子に変換されるので旧来のdsDNAライブラリー調製より高い分率の投入分子を捕捉するライブラリーとなる。DNA:RNAを組み合わせた方法では、選択的第1鎖cDNA合成が、ssPrepの上流、かつRNase Hに基づくrRNA枯渇の下流に組み込まれる(
図17)。RNase H rRNA枯渇プロトコールを使用する。なぜなら、併せたRNA/DNA混合物中のリボソームRNAを除去し、リボソームコードDNAを除去しない、その選択性のためである。RNase Hは、rRNAのみを除去する。なぜなら、rRNAとハイブリダイズするDNAが提供され、RNase HがDNA/RNAハイブリッドのみを切断し、一本鎖RNAを切断しないからである。併用DNA:RNAプロトコールについてのある特定の機能的態様およびステップを下に列挙し、各々の利益を詳細に取り上げる:
【0369】
1.第1鎖cDNA合成は、RNAをバーコード化し、示差P5アダプターを結合させる。足場アダプターライゲーションが行われ得る前に、RNAを第1鎖cDNAに変換する。これは、DNAの存在下で行われるが、逆転写酵素(RT)の特性、およびRTがDNA鋳型から伸長するのを防止するアクチノマイシンDの付加のため、DNAに影響を与えない。ヘキサマープライマー(例えば、ランダムヘキサマー)を第1鎖合成に使用する。ヘキサマープライマーは、8ヌクレオチド分子バーコードも含み、このバーコードは、その後、各シーケンシングリードの出発点に存在し、このバーコードを使用してシーケンシングデータ中のRNAに由来する各リードを同定することができる。プライマーは、特別注文のP5 Illuminaアダプターも含み、このアダプターによって、インデックスPCR中の調製の後半のRNAまたはDNAどちらかの差次的増幅が可能になる。ヘキサマープライマーの5’末端は、末端を遮断する修飾を含む。この修飾によって、足場アダプターライゲーション中にDNA特異的P5アダプターがRNA(またはcDNA)分子に付加されないことが保証される。
【0370】
2.足場アダプターライゲーションは、バーコード化P5アダプターをDNA分子に供給し、P7アダプターをDNA分子とcDNA分子の両方に供給する。アダプターライゲーション中に、足場アダプターを反応に加える。アダプター中の足場領域は、6つのランダム塩基を含有し、これらの塩基が一本鎖鋳型各々の末端とハイブリダイズする。第1鎖cDNA合成中に伸長したキャッピングされたバーコード化プライマーは、確実に真のDNA由来分子のみがDNA特異的P5プラマーを受け取るようにする。DNA特異的P5アダプターは、8ヌクレオチド分子のバーコードを含有し、このバーコードによってリードはDNA分子として識別される。DNA特異的P5アダプターは、RNA特異的のものとは明確に異なり、インデックスPCRステップ中の調製の後半のRNAまたはDNAのどちらかの差次的増幅を可能にする。RNA分子とDNA分子両方が、アダプターライゲーションプロセスによって同じP7アダプターを受け取る。
【0371】
3.定方向ライブラリーを生成する。アダプターライゲーションプロセスおよびアダプター配列の一本鎖性は、捕捉されたすべての分子を確実に定方向のものにする。RNA特異的リードの場合、転写物の鎖の起源解析を交絡させ得る第2鎖を生成する必要がない。
【0372】
4.インデックスPCRを、DNAまたはRNAどちらかの差次的増幅に使用することができる。RNAおよびDNA分子にそれぞれ付加された異なるP5アダプターは、インデックスPCR中のDNAまたはRNAどちらかの差次的増幅を可能にする。RNA特異的P5プライマーのみの付加は、必須フローセル結合配列を結合させなくてもRNA分子を指数関数的に増幅させ、DNA分子を線形に増幅する。DNA特異的P5プライマーに関しては、真逆のことが言える。インデックスPCR中にRNA P5プライマーとDNA P5プライマー両方を等モル量で含めることによって、DNA分子とRNA分子の両方が指数関数的に増幅される。ライブラリーのアリコートと、RNA P5アダプターおよびDNA P5アダプターにそれぞれ特異的なqPCRプライマーとを使用して、各分子タイプの定量化をインデックスPCRの前に行う。
【0373】
データ
DNAについて、本明細書に記載のssPrepプロトコールをいくつかの市販のプロトコールと比較した。この比較のための投入材料は、STRECK Cell-Free DNA BCT(登録商標)チューブに収集した血漿から抽出してQiagen QIAAMP MINELUTE ccfDNA Kitを使用して精製した1ngの同じcfDNA投入物であった。ライブラリーを製造業者の推奨事項に従って作製し、総使用時間を各プロトコールについて記録した。本明細書に記載のssPrepプロトコールは、高複雑度ライブラリー、すなわち、他のプロトコールと比較して低いPCR重複率のライブラリー、を生成した。ssPrep配列データは、他のプロトコールにより生成された配列データと同等の、しかしそれよりわずかに高い率で、ヒトゲノムにマッピングした。さらに、ssPrepプロトコールによって、モノヌクレオソームより短い断片を含むDNA鋳型長のより完全な範囲が一貫して回収された。cfDNAの場合、これらのより短い断片は、ニックの入ったより長い分子、転写因子結合分子(<100bp)、循環腫瘍DNA、および/または細菌/ウイルスに由来し得る。
【0374】
RNA(cDNA)については、ある特定のプロトコール最適化後、本明細書に記載のssPrepプロトコールを、NEBNEXT Ultra II Directional RNA-Seqキットのものと比較した。ERCCスパイクイン対照とともに10ngのポリA濃縮mRNAからライブラリーを生成した。ssPrep用の投入RNAを、先ず、NEBNEXT First-strand synthesis moduleを使用して第1鎖cDNAに変換した。DNAライブラリーと同様に、RNA-Seqライブラリーを製造業者の推奨事項に従って作製し、各プロトコールについての総使用時間を記録した。全NEBNEXT調製は、cDNA合成後の第2鎖の作出、末端ポリッシング、および方向性を保持するための第2鎖のその後の分解を必要とするため、NEBNEXT調製には約7時間かかるが、本明細書に記載のssPrep方法は、4.5時間未満で定方向ライブラリーを生成した。全NEBNEXT調製と比較して、ssPrepは、同等のマッピングメトリクスおよび複雑性を達成し、3’偏りを低減した。
【0375】
本明細書に記載のssPrep方法を統合されたDNAとRNAのライブラリー調製に使用することができるという上記事項を試験するために、5ngのせん断ヒトgDNA(NA12878)および5ngのマウス全RNAを含有する考案DNA:RNA混合物を使用して実験を行った。cDNA生成中に使用した特別なバーコード化ヘキサマーcDNAプライマーはなかった。NEBNEXT First-strand synthesis moduleおよび標準的なランダムヘキサマーを使用して、第1鎖cDNAを生成した。異なる生物の使用は、DNA由来のリードとRNA由来のリードのデコンボリューションを可能にした。DNAのみの対照ssPrepライブラリーは、質のよいDNA-Seq特異的マッピングメトリクスを示した。同様に、RNAのみのライブラリーは、高品質のRNA-Seq特異的マッピングメトリクスを示した。併用DNA:RNA ssPrepライブラリーは、併用投入物に基づいて予想されたDNA-SeqおよびRNA-Seqメトリクスを示した(
図18A)。長さ分布プロファイルは、第1鎖cDNA合成ステップがDNAの断片長に影響を与えなかったことを示す(
図18B)。
図18Cによって、RNA-Seq対照ライブラリーおよびDNA:RNA併用ライブラリーは高品質RNA-Seq情報を含有したが、DNA-Seq対照ライブラリーはしなかったことが確証される。
【0376】
結論
この実施例で説明したssPrepは、分解試料からの同時DNA:RNAライブラリー調製に関連するある特定の技術的課題に対処する。例えば、RNAおよびDNAは、多くの場合、異なる試料中に様々な濃度で存在し、それ故、有意義なデータを生成するために差次的増幅を必要とし得る。RNAとDNAの両方がゲノムにマッピングし、それ故、リードデータのデコンボリューションは有用である。RNAおよびDNA分子の長さは、多くの場合、短く、損傷しており、それ故、効率的調製は、ライブラリー複雑性の最大化に有用である。
【0377】
この実施例で説明したアプローチは、差次的に増幅させることができる分子タグを付けたRNAおよびDNA分子を生成するために改良型ssPrepプロトコールの上流に第1鎖cDNA合成ステップを兼備する。このアプローチは、約4.5時間またはそれ未満で完了することができる、合理化されたRNA-Seqプロトコールである。上で説明した実験は、このアプローチがRNA分子とDNA分子の両方を等しい効率で捕捉することを示す。
* * *
【0378】
本明細書で参照される各特許、特許出願、公報および文献の全体が、参照により組み込まれる。特許、特許出願、公報および文献の引用は、前述のもののいずれかが関連先行技術であることの承認ではなく、これらの公報および文献の内容または日付についてのいかなる承認にも相当しない。それらの引用は、関連する開示の検索の指示ではない。これらの文献の日付または内容に関するすべての記載は、入手可能な情報に基づくものであり、それらの正確さについて承認するものでも、それらの正当性について承認するものでもない。
【0379】
本技術を特定のインプリメンテーションを参照して説明した。本技術を説明するために本明細書で用いた用語および表現は、説明的なものであり、必ずしも限定的なものではない。開示するインプリメンテーションに加えられるある特定の変更を、本技術の範囲内で考えることができる。開示するインプリメンテーションのある特定の態様を、本明細書で具体的に開示していないある特定の要素の存在または非存在下で好適に実行することができる。
【0380】
用語「含む」、「から本質的になる」、および「からなる」の各々を他の2つの用語のどちらかで置き換えることができる。用語「a」または「an」は、この用語が修飾する要素の1つまたは複数の要素を、要素の1つが記載されているのか、要素の1つより多くが記載されているのかが、文脈上明白である場合を除き、指すことができる(例えば、「試薬(a reagent)」は、1つまたは複数の試薬を意味することができる)。用語「約」は、本明細書で使用される場合、基礎をなすパラメーターの10%以内の値を指す(すなわち、プラスまたはマイナス10%;例えば、「約100グラム」の重量は、90グラム~110グラムの間の重量を含み得る)。値のリストの始めに用語「約」を使用することにより、値の各々が修飾される(例えば、「約1、2および3」は、「約1、約2および約3」を指す)。値のリストが記載されている場合、リストは、それらのすべての中間値およびすべての分数値を含む(例えば、値「80%、85%または90%」のリストは、中間値86%および分数値86.4%を含む)。値のリストに用語「またはそれより高い(またはそれより多くの、またはそれより長い、またはそれを超える)」が続く場合、用語「またはそれより高い(またはそれより多くの、またはそれより長い、またはそれを超える)」は、列挙されている値の各々に適用される(例えば、「80%、90%、95%、またはそれより高い」または「80%、90%、95%またはそれより高い」または「80%、90%、または95%またはそれより高い」のリストは、「80%もしくはそれより高い、90%もしくはそれより高い、または95%もしくはそれより高い」を指す)。値のリストが記載されている場合、リストは、列挙されている値のうちのいずれか2つの間のすべての範囲を含む(例えば、「80%、90%または95%」のリストは、「80%~90%」、「80%~95%」および「90%~95%」の範囲を含む)。
【0381】
本技術のある特定のインプリメンテーションを後続の特許請求の範囲で示す。
【配列表】
【国際調査報告】