IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ レクソジェン・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-02-03
(54)【発明の名称】核酸増幅及び識別方法
(51)【国際特許分類】
   C12N 15/10 20060101AFI20220127BHJP
   C12Q 1/6876 20180101ALI20220127BHJP
   C12Q 1/6855 20180101ALN20220127BHJP
【FI】
C12N15/10 Z ZNA
C12Q1/6876 Z
C12Q1/6855 Z
【審査請求】未請求
【予備審査請求】有
(21)【出願番号】P 2021533570
(86)(22)【出願日】2019-12-13
(85)【翻訳文提出日】2021-08-03
(86)【国際出願番号】 EP2019085095
(87)【国際公開番号】W WO2020120747
(87)【国際公開日】2020-06-18
(31)【優先権主張番号】18212743.1
(32)【優先日】2018-12-14
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】508160196
【氏名又は名称】レクソジェン・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツング
【氏名又は名称原語表記】LEXOGEN GmbH
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】イボンネ ゲーペル
(72)【発明者】
【氏名】パメラ モル
(72)【発明者】
【氏名】トルステン レダ
(72)【発明者】
【氏名】アレクサンダー ザイツ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA08
4B063QA13
4B063QQ42
4B063QQ52
4B063QR08
4B063QR20
4B063QR32
4B063QR35
4B063QR62
4B063QS34
4B063QX01
(57)【要約】
本発明は、核酸テンプレートの標識化した増幅断片を産生するための方法であって、前記テンプレート核酸を提供すること、少なくとも1つのオリゴヌクレオチドプライマーを前記テンプレート核酸にアニーリングすること、テンプレート特異的な方法において少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成し、ここで前記伸長する反応が、前記伸長産物が前記テンプレート核酸の5’末端又は前記伸長産物の下流の前記テンプレート核酸にアニールされる核酸伸長ストッパーに到達する場合に停止すること、識別配列をその5’末端上に含むアダプター核酸を提供し、ここで前記識別配列がそれに対して接触する場合に、前記伸長ストッパーにハイブリダイズしないこと、前記アダプター核酸をその5’末端で前記伸長産物の3’末端に連結し、それによって標識化した増幅断片を産生することの工程を含む方法を提供する。
【特許請求の範囲】
【請求項1】
核酸テンプレートの標識化した増幅断片を産生するための方法であって、
前記テンプレート核酸を提供すること、
前記テンプレート核酸に少なくとも1つのオリゴヌクレオチドプライマーをアニーリングすること、
テンプレート特異的な方法において、前記少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成することであって、ここで前記伸長産物が前記テンプレート核酸の5’末端に又は前記伸長産物の前記テンプレート核酸の下流へアニールされる核酸伸長ストッパーに到達する際に、前記伸長反応が停止し、
識別配列をその5’末端上に含むアダプター核酸を提供し、ここで前記識別配列は前記伸長ストッパー又は前記テンプレートにハイブリダイズせず、
前記アダプター核酸をその5’末端で前記伸長産物の3’末端に連結し、それによって標識化した増幅断片を産生すること
のステップを含む方法。
【請求項2】
前記伸長産物が前記テンプレート核酸の5’末端に到達する場合において、ヌクレオチドポリメラーゼが前記伸長産物にテンプレートでないヌクレオチドを、好ましくは前記ポリメラーゼの末端トランスフェラーゼ活性により、付加することを可能にし、かつ/又は好ましくは、ここで1から15のテンプレートでないヌクレオチドを少なくとも70%の前記伸長産物に付加する、請求項1に記載の方法。
【請求項3】
複数のアダプター核酸が前記ライゲーションステップにおいて提供されかつ使用され、ここで前記複数のアダプターが異なる識別配列を有し、好ましくはここで少なくとも10の、より好ましくは少なくとも50の、異なる識別配列を有するアダプター核酸がライゲーションステップにおいて提供されかつ使用される、請求項1又は2に記載の方法。
【請求項4】
前記識別配列がランダム配列である、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記伸長ストッパーがプライマー活性を有し、かつまた前記伸長工程の間に伸長され、好ましくは、ここで少なくとも9の、より好ましくは少なくとも49の、前記テンプレートにアニーリングするための異なるアニーリング配列を有し、かつそれによって前記テンプレート核酸の異なる位置にアニールする可能性のある、伸長ストッパーが用いられる、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記アニーリング配列がランダム配列である、請求項5に記載の方法。
【請求項7】
前記アダプター核酸が前記伸長ストッパーに結合され、ハイブリダイズされ、又は結合されず、又はハイブリダイズされず、好ましくは、前記アダプター核酸が前記伸長ストッパーに結合される又はハイブリダイズされる場合に、続いて、前記識別配列が前記伸長ストッパーを前記テンプレートへアニーリングするための前記伸長ストッパーのアニーリング配列と無関係である、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記テンプレートがRNAであり、好ましくはここで逆転写酵素が伸長のために使用される、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記オリゴヌクレオチドプライマー及び好ましくはまた前記伸長ストッパーがユニバーサル増幅配列を含み、かつ/又は前記アダプター核酸がユニバーサルアダプター増幅配列を含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記オリゴヌクレオチドプライマーが前記テンプレートにアニーリングするためのアニーリング配列を含み、それは前記テンプレート内のオリゴ(A)配列にアニーリングするためのオリゴ(T)配列を含み、好ましくはここで前記オリゴ(T)配列がオリゴ(T)配列から異なる一以上の3’アンカーヌクレオチドを含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記ライゲーション反応がクラウディング剤、好ましくは、ポリマー又はポリアルキルグリコールのような化合物を含むポリマー、好ましくはPEG、オクトキシノール若しくはトリトンX、又はポリソルベート、好ましくはツイーンの存在下で起こり;かつ/又はここで、前記伸長ストッパー及びまた好ましくは前記オリゴヌクレオチドプライマーは前記テンプレートへアニーリングするためのアニーリング配列の融解温度を高める一以上の修飾したヌクレオチドを含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
少なくとも1つの、好ましくは少なくとも9つの、伸長ストッパーはプライマー活性を有し、かつまた前記伸長工程時に伸長され、かつ少なくとも2つの、好ましくは10の、異なる識別配列を含むアダプター核酸が使用され、それによって、少なくとも2つの、好ましくは少なくとも10の、異なる標識化した増幅断片が産生され、任意に前記標識化した増幅断片を増幅し、さらに固有である増幅断片の前記配列をアセンブリすることを含み、ここで前記標識は固有の増幅断片を同定するために使用される、請求項1から11のいずれか一項に記載の方法。
【請求項13】
テンプレート核酸にハイブリダイズすること及びその3’末端上の伸長反応をプライミングすることができる少なくとも1つのオリゴヌクレオチドプライマー、
テンプレート核酸とハイブリダイズすることができる、好ましくはその3’末端上の伸長反応をプライミングすることができる、一以上の伸長ストッパー、
識別配列をその5’末端上に含む一以上のアダプター核酸であって、ここで前記識別配列が前記伸長ストッパーとハイブリダイズせず、好ましくはここで前記アダプター核酸が伸長ストッパーに結合され、ハイブリダイズされ、又は結合されず、又はハイブリダイズされない一以上のアダプター核酸、
逆転写酵素、及びオリゴヌクレオチドリガーゼを含む、
請求項1から12のいずれか一項に記載の方法を実施するためのキット。
【請求項14】
少なくとも10の、より好ましくは少なくとも50の、異なる識別配列を有するアダプター核酸を含む、請求項13に記載のキット。
【請求項15】
少なくとも1つのオリゴヌクレオチドプライマーが前記テンプレートにアニーリングするためのアニーリング配列を含み、それは前記テンプレート内のオリゴ(A)配列にアニーリングするためのオリゴ(T)配列を含み、好ましくはここで、前記オリゴ(T)配列が前記オリゴ(T)配列から異なる一以上の3’アンカーヌクレオチドを含む、請求項13又は14に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸分析及び増幅の分野に関する。
【背景技術】
【0002】
米国2010/0273219 A1では、標的の核酸にバーコードを付けるための、マルチプライマー増幅のための方法を記載している。
【0003】
WO2012/134884 A1では、マルチプレックス増幅反応におけるテンプレート核酸にバーコードを付けることを記載している。
【0004】
WO2013/038010 A2では、オリゴヌクレオチドプライマー及びストッパーを用いて、シークエンシングのための核酸部分を産生するために用いられるポリメラーゼにより鎖置換及び読み過ごしを防止する、テンプレート核酸の増幅した核酸部分を産生するための方法を記載している。この方法は、核酸増幅時の偏りを除去するだろう。
【0005】
WO2014/071361 A1では、バーコードを付したアダプター核酸を用いて二重のバーコードを付した核酸を作製する方法を記載している。
【0006】
米国2014/0274729 A1では、鎖置換活性を有するDNAポリメラーゼを用いてcDNAライブラリーを産生するための方法を記載している。
【0007】
EP 3 119 886 B1では、テンプレートRNAから核酸産物を産生する定量的な方法を記載している。
【0008】
米国2018/163201 A1では、C末尾をcDNA鎖の3’末端に付加する逆転写方法に関する。
【0009】
WO2016/138500 A1では、シークエンシングのための核酸にバーコードを付けるための方法を記載している。確率的な、すなわち、ランダムな、バーコードを分子ラベルとして用いる。
【0010】
また分子バーコードとも呼ばれる、分子ラベル、又は固有分子識別子(UMIs)は、開発され、PCR duplicateを同定し、配列特異的なPCRの偏りを減らし、かつまれな変異を検出する。シーケンシングライブラリー調製の任意のPCR増幅の前に、RNA分子に固有分子識別子を取り付けることは、各インプット分子について別々の固有性を確立する。これは、連続したPCR増幅の偏りの影響を排除することを可能にし、それは、多くのPCRサイクルが必要とされる場合に、例えば、単一の細胞の研究におけるような低いテンプレートインプット量からシークエンシングライブラリーを作成する場合に、特に重要である。PCR後、同じ配列及びまた同じUMIを共有する分子は、同じインプット分子から由来した同一のコピーであると考えられる(Sena et al.,Scientific Reports(2018)8:13121)。
【発明の概要】
【0011】
本発明の目的は、テンプレート核酸の配列断片を産生することの改善した方法を提供することであり、そのテンプレート核酸のその配列と対応する連結される配列への前記配列断片の配置及びアセンブリを容易にする。また、所望される改善は、断片産生時の配列の偏りを減らし、かつそのテンプレートの全長にわたり配列断片のカバレッジを増やし、作成した連結した配列における信頼性を増やすだろう。
【0012】
従って、本発明は前記テンプレート核酸を提供する、少なくとも1つのオリゴヌクレオチドプライマーを前記テンプレート核酸にアニーリングすること、テンプレート特異的な方法において少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成し、ここで前記伸長する反応が、その伸長産物がそのテンプレート核酸の5’末端又はその伸長産物の下流のそのテンプレート核酸にアニールされる核酸伸長ストッパーに到達する際に停止すること、識別配列をその5’末端上に含むアダプター核酸を提供し、ここで前記識別配列がそこへ(伸長ストッパーへ)接触し、好ましくはまたそのテンプレートには接触しない場合には、その伸長ストッパーにハイブリダイズしないこと、そのアダプター核酸をその5’末端でその伸長産物の3’末端に連結し、それによって標識化した増幅断片を産生することの工程を含む核酸テンプレートの標識化した増幅断片を産生するための方法を提供する。
【0013】
また、本発明は前記テンプレート核酸を提供すること、少なくとも1つのオリゴヌクレオチドプライマーを前記テンプレート核酸へアニーリングすること、テンプレート特異的な方法において少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成すること、識別配列を含むアダプター核酸を提供し、ここで前記識別配列がそのテンプレートにハイブリダイズしないこと、そのアダプター核酸が好ましくはその5’末端でその伸長産物のその3’末端に連結し、それによって標識化した増幅断片を産生することの工程を含む核酸テンプレートの標識化した増幅断片を産生するための方法を提供する。
【0014】
本発明はさらに本方法を実施するための適当なキットを提供する。本発明のキットは、テンプレート核酸にハイブリダイズすること及びその3’末端上で伸長反応をプライミングすることができる少なくとも1つのオリゴヌクレオチドプライマー、テンプレート核酸にハイブリダイズすることができる、好ましくはその3’末端上に伸長反応をプライミングすることができる一以上の伸長ストッパー、その5’末端上に識別配列を含む一以上のアダプター核酸であって、ここで前記識別配列がその伸長ストッパーにハイブリダイズしない、好ましくはここでそのアダプター核酸が伸長ストッパーに結合され、ハイブリダイズされ、又は結合されないアダプター核酸、逆転写酵素、及びオリゴヌクレオチドリガーゼを含みうる。そのキットの異なる成分は、バイアルのような異なる容器において提供されうる。
【0015】
以下の詳細な開示は、方法及びキットを含む、全ての側面、並びに本発明の態様を読み取れる。すなわち、方法の記載はそのキットに適当でありうる。本方法に記載される任意の成分は、そのキットの部分でありうる。そのキットの成分は本発明の方法において使用されうる。
【発明を実施するための形態】
【0016】
本発明は、核酸テンプレートの標識化した増幅断片を産生するための方法を提供し、ここで識別配列は、これらの断片を増幅する前にラベルとして導入される。テンプレート核酸は、多数のコピーにおいて存在しうる。本発明に従い、断片化はたいてい増幅時に、すなわち、与えられた長さのテンプレートから生じる工程であり、一以上(たいていより多くの)断片が、そのテンプレート部分の増幅時に産生される。産生した断片の配列は、これらの相補的な核酸断片を合成するための断片及びプライマーが異なるテンプレートのコピー上の異なる部位でアニールすると同時にテンプレートのコピーが発生した場合に重複しうる。本発明の構想はテンプレートごとの単一の断片に作用するが、好ましくは、多くの断片が一つのテンプレート分子から、たいてい、そのテンプレートへ異なる場所で結合する多数のプライマーを用いることによって、産生される。
【0017】
本発明は産生した断片に識別配列を結合することにより先行の方法を改善する。識別配列はプライマー又は伸長後の相補的な核酸断片の合成によって導入されうる。続いて、その識別配列は、アダプター核酸による伸長産物のライゲーションによって導入される。驚くべきことに、そのライゲーション反応は、一本鎖の識別配列によって生じ、すなわち、ハイブリダイズされない(又は「自由な」)5’末端を有する識別配列の部分が伸長した産物の3‘末端に連結しうる。そのライゲーション反応は、たいてい、好ましくは識別配列の5’末端上に提供されるリン酸残基を含む。驚くべきことに、ハイブリダイゼーションによって支持される、テンプレート又はストッパー配列に依存せず、伸長産物の3’末端へのアダプター核酸の近接が(実施例に示されるように)必要とされる。そのような近接は、(また、本明細書では伸長ストッパー又は単にストッパーと称され、またそれは、テンプレートごとに1より多い断片が産生される場合においてさらなるプライマーである)テンプレートに結合されるオリゴヌクレオチドによるハイブリダイゼーションのための相補的な配列部分(下流、すなわち、識別配列の3’方向)を有するアダプター核酸を提供することによって支持されることができ、有向の近接は必要とされず、かつ所望される単純な拡散工程の結果でありうる。特に、そのアダプター核酸がそのテンプレート核酸の5’末端に到達する伸長産物と連結されうることが示されており、そしてここでさらなる下流の伸長ストッパーは存在しない。そのようなライゲーション反応は、その伸長産物のこの末端に直接的に又はポリメラーゼが添加された後の、いくつかのポリメラーゼが有するその末端トランスフェラーゼ活性に基づく、一以上のテンプレートでないヌクレオチドに生じうる。テンプレートの5’末端に対応する伸長産物へのこのライゲーションは、いくつかの驚くべき有益な利点を有する:それはテンプレートの5’末端で断片の発生を増加し、そしてそれゆえ先行技術の方法では失われている、その配列カバレッジは基本的に増加する。以前の方法において、その断片開始部位の分布は一定であり、(テンプレートコピーの数、平均の断片の大きさ、及びシークエンシングリード長の結果である)その3’及び5’末端でゼロに近い、より低いカバレッジを有するテンプレートの中央の断片による高いカバレッジ分布に繋がる。5’末端上のこの効果は本発明の方法によって緩和される。さらに、また本発明はそのテンプレートの3’末端上のカバレッジを増加する態様も提供する。
【0018】
(伸長反応ごとに一つの断片分子として産生される)増幅断片は、たいていさらに増幅され、すなわちコピーされる。これは、連結した識別配列が増幅されることを意味し、従って同様にコピーされることを意味する。たいてい、その識別配列はとても多種多様であるので、ランダム選択プロセスは、同じ配列を有するが、一つのテンプレートの異なるコピーに起因する単一の断片を固有に同定することを可能にする。本発明の全ての態様において、その識別配列は、それらが異なる識別配列を有するので、シークエンシング後の断片コピーがそのテンプレートの異なるコピーに由来するかどうか、又はそれらが同じテンプレート分子から由来し、かつ前記さらなる増幅の間に作製される単なるコピーであるかどうかを決定することに役立つ。
【0019】
前記テンプレート核酸を提供する工程を含む、核酸テンプレートの標識化した増幅断片を産生することを提供するさらなる方法は、少なくとも1つのオリゴヌクレオチドプライマーを前記テンプレート核酸にアニーリングすること、テンプレート特異的な方法において少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成すること、識別配列を含むアダプター核酸を提供し、ここで前記識別配列がそのテンプレートにハイブリダイズしないこと、アダプター核酸を好ましくはその5’でその伸長産物の3’に連結し、それによって標識化した増幅断片を産生することの工程を含む。この方法は上記と本質的に同じであり、ストッパーを用いないことを除いて、本明細書に記載される全ての好ましい態様が適用される。ストッパー機能を有しえない、多数のプライマーが用いられうる。アダプター核酸は、拡散プロセス後にさらに伸長産物に連結されうる。ライゲーションのために、その伸長産物は、そのテンプレートに又は一本鎖としてさらにハイブリダイズされうる。しかしながら、好ましくはストッパーを用いる。
【0020】
本発明の方法は前記テンプレート核酸を提供する工程から開始する。そのテンプレート分子は本発明の方法における使用について当業者に利用可能に作製される。たいてい、そのテンプレートは、核酸分子の試料において提供される。そのようなテンプレート核酸は細胞、例えば、原核又は真核細胞から単離されうる。特定の態様において、そのテンプレートはRNAである。総RNA又はRNAの断片、例えば細胞のmRNA又はrRNAを除去したRNAが提供されうる。操作が容易なRNA量は例えば、0.1pgから500ng、1pgから200ng、10pgから100ng、又は0.1ngから100ngのrRNA除去したRNA又は0.1ngから1000ngの総RNAである。ある態様において、総RNA量は例えば、10pgであり、そしてrRNAのないRNA量は1pg未満でありうる。プライマー、ストッパー及びアダプターは好ましくはDNAである。
【0021】
本方法はさらに少なくとも1つのオリゴヌクレオチドプライマーを前記テンプレート核酸にアニーリングすることを含む。オリゴヌクレオチドプライマーはオリゴヌクレオチド分子であり、好ましくはそのテンプレートにアニールするDNAであり、当該分野において標準的な慣例であるように伸長反応をプライミングすることが可能である。そのオリゴヌクレオチドプライマー(又は単に「プライマー」)は好ましくは、例えば4ヌクレオチドから30ヌクレオチド(nt)長のその長さの少なくとも一部におけるテンプレートにアニールする。そのプライマーはそのテンプレートにアニールしない部分を有しうる。そのようなさらなる部分は、増幅断片がさらに増幅されそのコピーを産生する場合に、他のオリゴヌクレオチドにアニールするために用いることができ、かつ/又は上述のさらなる増幅のために使用されうる。そのようなさらなる部分又は部位はそれゆえ他のプライマーがこの増幅/コピー反応のために結合する配列を有する。また、そのような部分は第一のリンカー配列として称される。第一のリンカー配列は好ましくは4ntから30nt長を有する。
【0022】
主要な発明方法に戻り、少なくとも1つのヌクレオチドプライマーはテンプレート特異的な方法において伸長され、それによって伸長産物(相補的な配列)を作成する。そのような反応は当該分野で標準であり、そしてたいていポリメラーゼを使用する。そのテンプレートがRNAである場合に、続いてRNA依存的なポリメラーゼ、例えば逆転写酵素が用いられる。そのテンプレートがDNAである場合に、続いて、DNA依存的なポリメラーゼが用いられる。その伸長する反応は、それが伸長産物の下流のテンプレート核酸にアニールされる核酸伸長ストッパーに到達する際に、又はその伸長産物がテンプレート核酸の5’末端に到達する際に、停止する。明らかに、その伸長反応がそのテンプレートの5’末端に到達し、そしてそれゆえテンプレートを使い果たす際に、それは停止する。いくつかのポリメラーゼでは、この時点で伸長産物に一以上のテンプレートでないヌクレオチドを加えうる。それは、産生した標識化した増幅した断片の配列分析において、5’カバレッジ産物について選択する場合に、許容可能であり、又は有利でさえある。しかしながら、テンプレートでないヌクレオチドのこの追加は、必要でない。また、伸長反応は、
その伸長反応が、その伸長産物の下流のテンプレート核酸にアニールされる核酸伸長ストッパーに到達する際に停止する。そのような停止される反応は(参照によって本明細書に取り込まれる)WO2013/038010 A2の長さで記載されている。このWO-文書において、その伸長ストッパーは「オリゴヌクレオチドストッパー」又は「さらなるオリゴヌクレオチドプライマー」として称される。本発明に従い、一つの用語、すなわち、核酸伸長ストッパー又は単に「伸長ストッパー」又は単に「ストッパー」が用いられる。また、本発明のストッパーはプライマーであり、それから、WO2013/038010 A2の「さらなるオリゴヌクレオチドプライマー」と対応しうる。本質的に、そのようなストッパーは、テンプレートの障壁を提示することによって、上流の伸長反応の伸長反応を停止する(従って、そのストッパーは伸長産物の下流にある)。そのストッパーはテンプレートにアニール又はハイブリダイズされ、かつその伸長反応は、そのストッパーに置き換わらず、そしてそれゆえ停止する。読み過ごし、すなわちストッパーの置換は、副反応であると考えられる。ストッパーの置換を防止する方策は、WO2013/038010 A2に長さで記載され、これらは本発明に従って使用されうる。簡潔に、(鎖置換活性のために)そのストッパーの置換を妨げる好ましい方法及び意味は、そのテンプレートにアニーリングするためのアニーリング配列における融解温度を高める一以上の修飾したヌクレオチドを含む伸長ストッパー(テンプレートにアニールする/ハイブリダイズする一部のストッパー)を用いることである。融解温度の増加は、未修飾の、天然の核酸、例えばDNA又はRNAに関する。そのような修飾は、例えば、LNA(ロック核酸)、ZNA(zip核酸)、2’フルオロヌクレオシド/2’フルオロヌクレオチド又はPNA(ペプチド性又はペプチド核酸)である。他の方法は、鎖置換活性を有しないポリメラーゼを用いるか、又はインターカレーターを用いる。好ましくは、1、2、3、4、5又は6ヌクレオチドが修飾される。好ましくは、その修飾した核酸は、テンプレートにハイブリダイズするそのストッパーの配列部分の5’側にある。ハイブリダイズしない5’向きのストッパーのさらなる部分がありうる-例えば、さらなる増殖反応における増幅/コピーのための上記のオリゴヌクレオチドプライマーについての記載と同様に働く増殖配列(「プライマーリンカー配列」)-実際に、そのようなさらなる部分がそのアダプター核酸に結合する/ハイブリダイズすることについて好ましい-以下参照。そのアダプターは「第一のリンカー配列」に、又はオリゴヌクレオチドストッパーの別の部分に結合/ハイブリダイズしうる。好ましい態様において、その伸長ストッパー及びまた好ましくは、そのオリゴヌクレオチドプライマーは、テンプレートにアニーリングするためのアニーリング配列(リンカー)における融解温度を増やす一以上の修飾したヌクレオチドを含む。
【0023】
伸長反応後、好ましくは、テンプレートに結合しないプライマー及びストッパーは精製工程において除去される。すなわち、テンプレートにハイブリダイズされる伸長産物は、精製され、そしてさらなる加工のために保持される。本発明の他の態様は、精製なく単一の容量において行われる。そのような精製は、当業者に既知の方法、例えば、テンプレート又は伸長産物の固相(例えばビーズ)への固定化、そして任意の未結合のプライマー及びストッパーを除去するために洗浄することにより行いうる。例示の方法は固相可逆固定(SPRI;DeAngelis et al.,Nucleic Acids Research,1995,23(22):4742-4743)である。
【0024】
本発明の方法は、その5’末端上に識別配列を含むアダプター核酸を提供する工程を含む。また、さらに、配列タグ、例えば増幅のための配列(増幅配列)は、アダプター核酸の一部でありうる。その5’末端は、その識別配列により、後者の標識をするための伸長産物の3’末端への連結を意図される末端である。その識別配列は伸長ストッパー又はテンプレートにハイブリダイズしてはならない。それゆえ、それは、たいてい一本鎖であり、そしてハイブリダイズしない。本明細書において、「識別配列」という用語は、たとえ識別配列の一部だけが後に識別のために用いられるとしても、ハイブリダイズしない又はアニーリングしないアダプター核酸の5’末端部分について用いられる。また、そのアダプター核酸は、相補的なプライマー配列を含み、それは、(アダプターリンカー配列と呼ばれる)上述のような標識化した増幅断片のさらなる増幅反応のための標的である。その識別配列は、伸長ストッパーに相補体を有しない識別配列について配列を選択することによってその伸長ストッパーへの又はそのテンプレートへのハイブリダイゼーションから保護されうる。また、そのテンプレート上に相補体を有しないので、識別配列を選択できる可能性がある。これは、そのテンプレートが既知である場合に、容易に行われうる。それが未知であるが、生物学的な原料由来である場合に、続いてその識別配列は、生物学的な核酸内にない又はまれに生じる配列から選択されうる。そのような配列は、「スパイク-イン」核酸、例えば、ERCC(外部RNA標準コンソーシアム)の配列又はSIRV(スパイク-インRNA変異体)配列(例えば、ERCC、BMC Genomics 2005 6:150;Jiang et al.,Genome Res.2011,21(9):1543-1551;WO 2016/005524 A1、全てが参照によって本明細書に取り込まれる)から既知である。その識別配列が副反応においてそのテンプレートにアニールする場合に、続いてこの状況は、たいてい次工程におけるライゲーションを防止し、それゆえ、標識化した断片へと繋がらず、そして従って結果として見られない。そのような副反応は許容されうるが、好ましくはない。そのテンプレートへのその識別配列(及び好ましくは、その全体のアダプター核酸)のアニーリングを防止する最も容易かつ最も好ましい方法は、その伸長反応後にアダプター核酸を単に提供することによる。伸長反応後に、そのテンプレートは、伸長産物(及びプライマー及びストッパー)との二本鎖の形態である。この形態において、そのテンプレートが既にハイブリダイゼーションパートナーによって既に覆われているので、そのアダプター核酸は任意のさらなるテンプレートに結合できない。この好ましい方法において、その識別配列は、そのテンプレートへの相補体である配列さえ有することができ、かつそのテンプレートにハイブリダイズすることができるが、方法工程の継続により、そのように妨げられる。つまり、テンプレート配列は本態様において、必要とされるとは考えられない。
【0025】
ストッパーへのその識別配列のアニーリングを防止する最も好ましい選択は、ストッパーの一部及びアダプターの一部がお互いに相補的な配列を有することである。ストッパーへのアダプターの近接により、その相補配列は第一にハイブリダイズし、そしてその識別配列は一本鎖のままである。
【0026】
本発明の方法はさらに、アダプター核酸をその5’末端をその伸長産物の3’末端に連結し、それによって、標識化した増幅断片を産生することを含む。ライゲーションはたいていリガーゼ酵素を用いて実施される。リガーゼの型は、連結されるオリゴヌクレオチドの性質に依存し、当業者によって選択されうる。例示的なリガーゼはDNAリガーゼ又はRNAリガーゼを含む。また、そのリガーゼはRNAリガーゼ、特にDNAリガーゼ活性を有するRNAリガーゼ、例えばT4 RNAリガーゼ2でありうる。さらなるリガーゼは、T4 DNAリガーゼ、T4 RNAリガーゼ1、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIV、E.coli DNAリガーゼ、ampligase DNAリガーゼ、切り取られたRn12(truncated Rn12)、切り取られたR12 K227Q(Rn12 truncated K227Q)、Thermus scotoductusリガーゼ、メタン生成細菌のRNAリガーゼ、熱安定性(thermostable)Appリガーゼ(NEB)、クロレラウイルスDNAリガーゼ又はSplintRリガーゼである。そのリガーゼは、一本鎖又は二本鎖リガーゼでありうる。また、ありうるものは、並行に実施される、例えば、異なる伸長産物及び/又はアダプター核酸分子が存在し、同時に連結されなければならない場合の、一反応容量における異なる反応のためのリガーゼの組み合わせである。好ましい組み合わせは、DNAリガーゼ及びRNAリガーゼ又は一本鎖リガーゼ及び二本鎖リガーゼである。そのリガーゼ反応は、アダプター核酸のその識別配列の5’末端上に好ましくは提供されるリン酸残基をたいてい含む。また、他の5’部位はライゲーション、例えばアデニル化した末端のライゲーションのために用いられうる。そのようなものは、切断した(truncated)リガーゼ又はApp-リガーゼによって連結されうる。
【0027】
産生したラベル化した増幅断片は:プライマー配列-伸長産物配列-伸長産物配列に隣接する識別配列を有するアダプター配列のライゲーション後に5’から3’までの構造を有するだろう。そのプライマー配列は、「プライマーリンカー配列」を有し、かつ/又はそのアダプター配列が「アダプターリンカー配列」を有しうる。本発明の方法の産物、すなわち、産生したラベル化した増幅断片は、好ましくはさらに増幅される。そのようなさらなる増幅は、当業者に既知の方法、例えばPCR(ポリメラーゼ連鎖反応)又は線形増幅によって産生したラベル化した増幅断片のコピーを産生する。そのようなさらなる増幅は、好ましくはリンカー配列、特に断片末端上に位置されるリンカー配列上に、すなわちプライマー配列及びアダプター配列の部分内に、特に好ましくは、プライマー配列の5’末端及びアダプター配列の3’末端上に、ラベル化した増幅断片に結合するさらなるプライマーの使用をたいてい含む。これらのプライマー及びアダプターに関して上述されるように、それらはさらなる増幅のそのようなプライマーに結合する既知配列の領域(「プライマーリンカー配列」及び「アダプターリンカー配列」)を有しうる。これらの領域(又は「一部」)は非常に長く、特異的でありうるのでテンプレートに結合しない;それらはユニバーサルプライマー結合部位でありうる。すなわち、好ましくは固有である、識別配列と対照的に、異なるアダプター/プライマー間で選択的でない。
【0028】
識別配列は増幅断片のための固有の標識を提供し、またそれゆえ本明細書で固有分子識別子(UMI)として称される。その識別配列は、さらなる増幅の複製(例えば、PCR)を同定し、かつ配列依存的な増幅の偏りの影響の減少しうる。好ましい態様において、その識別配列は、さらなる増幅前の、伸長産物(断片)に連結されるそれぞれの位置で、主に、ランダムなヌクレオチドの分布を有するオリゴヌクレオチドである。識別配列が均等に分布され、かつそれらの値が同一の伸長産物の数よりもかなり大きい場合に、続いて同じ識別配列が二つの同一の伸長産物(異なるコピー)に連結されることはありそうにない。この場合において、さらなる増幅後の別々の異なる識別配列の数は、さらなる増幅前の数と同じである。また、本発明の識別配列は、Sena et al.(Scientific Reports(2018)8:13121)内のUMIsについて記載されるように用いられうる。標識した断片の全体の配列又は全体の配列の一部は、次世代シークエンシング法及びさらなる配列解析において「リード」として考えられうる。一以上のリードはデータ分析の間に組み立てられ、そのテンプレートの連結した配列を得る。続いて、また、データ分析は、テンプレート分子及び断片の定量的な分析になり、それは、例えばヒントがRNAスプライシングバリアントの異なる発現率である、特定のテンプレートコピーが重複している又は提示不足の場合に、見識を提供しうる。好ましい態様において、本発明は、さらに固有である増幅断片の配列をアセンブリングし、ここでその標識が固有の増幅断片を同定するために用いられる工程を含む。増幅した標識した増幅断片における異なる識別配列は、固有の増幅断片を識別する。その識別配列は、アセンブリ又は任意の他のデータ分析工程において、重複及び複製の識別及び除去を可能にする。
【0029】
好ましい態様において、その識別配列は、3nt(ヌクレオチド)長以上、好ましくは3ntから20nt、特に好ましくは4ntから15nt又は5ntから10nt、例えば、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt長以上である。そのような長さは容易な操作及び効率的なライゲーション反応のために十分に小さいが、単一の増幅産物の所望される識別を提供する、好ましくはそこへの固有のラベルを提供する、それらのヌクレオチドのヌクレオチド置換のために、十分に多量の異なる識別配列をさらに提供する。
【0030】
好ましい態様において、伸長産物がテンプレート核酸の5’末端に到達する場合において、ヌクレオチドポリメラーゼは、伸長産物にテンプレートでないヌクレオチドを、好ましくはポリメラーゼの末端トランスフェラーゼ活性によって、付加することを可能にし、かつ/又は好ましくは1から15のテンプレートでないヌクレオチドを伸長産物の少なくとも70%において付加する。上述のように、そのようなテンプレートでない核酸の付加は、いくつかのポリメラーゼの特性である(Chen et al.Biotechniques 2001,30(3):574-582参照)。この活性は、逆転写酵素において、たとえば、M-MLV(マウス白血病ウイルス)逆転写酵素又はAMV(アルファルファモザイクウイルス)逆転写酵素において、もっとも顕著である。これらのテンプレートでないヌクレオチドは、たいてい任意のヌクレオチド型(A、T(U)、G、C)であり、そしてランダムのように思われる。これは、異なるテンプレートの5’末端の伸長産物が5’末端に対応する同じ配列を共有できるが、続いてそのようなテンプレートでない追加の産物である、異なる、一見したところランダムのさらなるヌクレオチドによって継続されうる。これらの異なる追加はテンプレート化した繰り返し配列とテンプレートでないランダムの追加との間の転移で、テンプレート配列の5’末端の正確な位置を識別するために用いられうる。テンプレートでないヌクレオチドの付加後、その標識化した断片は識別配列によって継続し、これらは、上記のように用いられうる。(また)識別配列がランダムである場合において、テンプレートでないランダムヌクレオチドはその識別配列の一部のように扱われる。定まった部分のアダプター配列に関連する識別配列の位置は、明確に識別配列を同定する。
【0031】
特に好ましい態様において、複数のアダプター核酸をライゲーションステップにおいて提供し、用いる。これらの複数のアダプターは異なる識別配列を有しうる。これは、アダプターの固有の識別とその産生した断片とを連結することを可能にする。好ましくは、少なくとも10、より好ましくは少なくとも50、又はさらに100以上又は200以上の、異なる識別配列を有するアダプター核酸がライゲーション工程において提供され、使用される。特定の態様において、同じ配列を有する異なる産生される断片が予想されるのと同じだけ異なる識別配列を有するアダプター、又は好ましくは異なる識別配列を有するより多くのアダプターが用いられる。多数のテンプレートコピーの予想は、試料の型、例えば、全細胞RNA、全細胞mRNA(トランスクリプトーム)、RNA量、及び試料の複雑さ(トランスクリプトーム全体を対象にする場合と遺伝子パネルの場合のように選択した遺伝子又は転写物のみを標的にする場合がありうるが、何種類の異なる転写変異体が標的にされるか)等に基づきうる。
【0032】
特定の態様において、その識別配列はランダム配列である。「ランダム配列」は少なくとも一部の識別配列のランダム合成のために高い変異性を有する異なる配列の混合物として理解されうる。ランダム配列は、4つの天然に生じるヌクレオチド(A、T(U)、G、C)における前記配列について潜在的にその全体の結合力のある領域を覆う。そのランダム配列はA、G、C又はT(U)よりランダムに選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15以上のヌクレオチドを覆いうる。ヌクレオチドT及びUの配列のハイブリダイズする可能性という用語は、本明細書において交換可能に用いられる。ランダム配列部分について全体の結合可能性領域はmであり、ここでmは用いられるヌクレオチド型(好ましくはA、G,C、T(U)の4つ全て)の数であり、かつnはランダムヌクレオチドの数である。それゆえ、ここでそれぞれのありうる配列が示され、ランダムヘキサマーは4=4096の異なる配列からなる。その識別配列はテンプレートに結合してはならない。全ての場合、特にランダム識別配列において、伸長反応後にアダプター核酸を加えることが好ましい。伸長産物がストッパー(又はそのテンプレートの末端)に到達し、そして本質的にその全体のテンプレートが続いて伸長産物を有する二本鎖の形態である場合に、続いて、そのアダプター核酸はテンプレートと結合することから妨げられる。
【0033】
本発明のさらなる態様において、プライマー及びストッパーが選択され(伸長産物に対して下流にあるストッパーを有する)テンプレート核酸において関心のある一以上の標的配列に結合し、特定のテンプレート部分の伸長配列が得られる。特定の領域のそのような標的化は好ましくは、テンプレートとしての転写物(RNA)又は遺伝子(gDNA)のために用いられる。識別配列は遺伝子パネルにおいて用いられる場合に特に役立つ。例えばテンプレートの異なる種の配列変異体の分析について、例えば、スプライシングバリアント又はテンプレート配列を変化する他のものである。
【0034】
全てのその態様及び側面について本発明の特定の好ましい態様において、また伸長ストッパーはプライマー活性を有し、かつまた伸長工程時に伸長される。これは、1より多いプライマーが用いられること、かつほとんどのプライマーがストッパー機能を有することを意味する(すなわち、置換を防止する-上記参照)。いくつかのプライマーを用いることは、テンプレートが多くの産生される断片をもたらすことを意味し、すなわち、カバレッジを改善する。プライマーはテンプレートに結合するが、それらは、異なるプライマーがテンプレート上の異なる位置に結合する場合に包括的なカバレッジを提供するだろう。(また、好ましくはストッパーである)多数のプライマーを用いる本発明方法は、上流の伸長産物がちょうど停止した場合に、テンプレート上の位置で新たな伸長産物が伸長を開始するので、カバレッジを増やすだろう。これは、全体のテンプレートを覆う多くの断片をもたらす。さらに、また、テンプレート分子の異なる部分に結合する(同義語として用いられる本態様において)ストッパー/プライマーが用いられることを意味する。一般的に、テンプレート分子に結合することは、プライマー及びストッパーのアニーリング配列によって決定される。この配列は、そのテンプレートとハイブリダイズし、そしてテンプレート上の異なる位置に結合するために変化しうる。好ましくは、少なくとも9、少なくとも10、より好ましくは少なくとも49、少なくとも50、例えば、100以上又は200以上のテンプレートへアニーリングするための異なるアニーリング配列を有する伸長ストッパーが用いられる。それによって、それらはテンプレート核酸上の潜在的に異なる位置にアニールするだろう。好ましくは、そのアニーリング配列はランダム配列である。ランダム配列は、プライマー、ストッパー及び同様のプライマー機能を有するストッパーの識別配列に関連して上記に記載される。好ましくは、アニーリング配列のランダム配列は、A、G、C又はT(U)からランダムに選択される1、2、3、4、5、6、7、8、9、10、11、12、13、14、15以上のヌクレオチドをカバーしうる。
【0035】
好ましくは、そのアダプター核酸は伸長ストッパーに結合され、ハイブリダイズされ、又は結合されない。例えば、化学反応、複合体形成又はハイブリダイゼーションにより、そのような結合反応は、上流の伸長産物の3’末端に近いアダプター核酸のそれ自身がストッパー又はテンプレートにハイブリダイズしないその識別配列への配置を促進し、そして、それは驚くべきことに、ライゲーション反応が作用するために必要とされない。好ましくは、そのアダプター核酸が伸長ストッパーに結合又はハイブリダイズされる場合に、続いて、その識別配列は、テンプレートへの伸長ストッパーをアニーリングするための伸長ストッパーのアニーリング配列とは無関係に選択される。アニーリング配列とその識別配列の両方は、ランダム配列であり、好ましくはお互い無関係に選択される。これは、たいていストッパー及びアダプターの核酸部分がユニバーサル配列である場合に、すなわち、任意のアダプターは(好ましくは本発明の全ての態様について)任意のストッパーに結合し、そしてさらにアダプター核酸は、例えば、アダプターが伸長反応後のみに提供される場合に、ストッパーに結合されることを提供されないことを保証される。他の態様又は本反応の他の部分において、それらは結合せず、例えばその伸長反応がそのテンプレートの5’末端に到達する際に、そのストッパーはそのテンプレート上に少なくとも最小のアニーリング配列を必要とし、それは、最も下流の停止位置を5’末端から、いくつかのヌクレオチド上流に移動するので、たいてい、ストッパーはハイブリダイズされない。また、そのアダプターは伸長ストッパーに結合又はハイブリダイゼーションせずに、その伸長産物に連結できる。しかしながら、そのアダプター核酸がその伸長産物に連結される場合に、前記伸長ストッパー及び/又はその伸長産物が、特に好ましくはその3’末端において、さらに、そのテンプレートへハイブリダイズされる全ての態様において好ましい。また、特に好ましくは、伸長反応及び/又は特定の態様において、特に好ましくは、ライゲーション後に、そのアダプター核酸が伸長ストッパーにハイブリダイズされることが好ましい。
【0036】
本発明の方法及びキットの好ましい場合において、そのオリゴヌクレオチドプライマーそしてまた好ましくは必ずしも伸長ストッパーではないが、ユニバーサル増幅配列(「プライマーリンカー配列」、上記参照)を含み、かつ/又はここで、そのアダプター核酸はユニバーサルアダプター増幅配列(「アダプターリンカー配列」上記参照)を含む。そのような増幅配列又は「リンカー」を、用いることができ、既に上述されるようにプライマーを結合し、さらに増幅する。ユニバーサル配列は、全てのプライマー、ストッパー、又はアダプターについて、それぞれ同じであることを意味する。これは、これらのオリゴヌクレオチドに同じプライマー型が結合することを可能にする。また、特に好ましい態様において、そのユニバーサル増幅配列(リンカー配列)は、プライマー、ストッパー及びアダプターについて同じであり、すなわち、さらなる増幅プライマーはオリゴヌクレオチドプライマー、伸長ストッパー、及びアダプター核酸等に結合しうる。プライマーの一つの型のみがさらなるの増幅について必要であるので、これは容易な操作を促す。他の態様において、そのプライマー、ストッパー及びアダプターは、異なるユニバーサル増幅配列(リンカー配列)を有し、すなわち、さらなる増幅プライマーはオリゴヌクレオチドプライマーのみに結合でき、別のさらなる増幅プライマーはアダプター核酸にのみ結合しうる。これらのグループにおいて、そのプライマーは、好ましくはユニバーサルである。これは、容易な操作を可能にするが、標識した断片の両末端についてプライマーが異なり、そして特異的に選択されうるので、より良い制御を可能にする。
【0037】
好ましい態様において、特別なオリゴヌクレオチドが、好ましくはテンプレートの3’末端上の、テンプレートの選択される配列を選択し、かつアニールするために用いられる。オリゴ(A)末尾を含むmRNA、又はRNAの任意の他の型の場合において、そのような3’末端が相補的なオリゴヌクレオチドプライマー、例えば、前記オリゴ(A)末尾に相補的であるオリゴ(dT)アニーリング配列を含むものとアニールされうる。好ましくは、少なくとも1つのオリゴヌクレオチドプライマーは、そのテンプレートの選択される配列にアニーリングするためのアニーリング配列を含む。好ましくは、前記オリゴ(dT)配列はオリゴ(dT)配列から異なる一以上の3’アンカーヌクレオチドを含む。これは、適当な配置及びオリゴ(A)テンプレート配列の5’末端に結合することを可能にする。そのアンカーヌクレオチドは、オリゴ(A)部分の次のテンプレート上の次のAでないもの(例えばT、G、C)にアニールするだろう。次のAでないヌクレオチドが未知である場合に、異なるアンカープライマー、例えば(テンプレート上の次のAでない(例えば、T、G、C)に相補的な)それぞれTでない(例えば、A、G,C)ヌクレオチドを有する3つのオリゴヌクレオチドプライマーを用いることを有するオリゴヌクレオチドプライマーの混合物を使用できうる。好ましい態様において、二つのアンカーヌクレオチドが用いられる。前記Tでないヌクレオチドの隣のアンカーヌクレオチドは、オリゴ(T)に隣接しないので、任意のヌクレオチド型(A、T(U)、G、C)より選択されうる。前記特別なオリゴヌクレオチドプライマーは、その特別なオリゴヌクレオチドプライマーがテンプレートの3’末端に又は近くにアニールする場合には、これらは必要ないので、ストッパーでなく、アダプターへハイブリダイゼーションするための配列を含みえない。これは、上流の伸長産物がその位置に到達しないことを意味する。もちろん、プライマー/ストッパーの製造においての容易さ又は統一性について、そのような配列及び/又はストッパー機能は存在しうる。
【0038】
好ましくは、そのライゲーション反応はクラウディング剤の存在下である。Zimmerma et al.,Proc Natl Acad Sci USA.1983;80(19):5852-6に参照されるように、クラウディング剤は効果的な反応量を減らすことによってお互いに相互作用するアダプター及び伸長産物の可能性を増やす。さらなるクラウディング剤は、例えば米国第5,554,730号、米国第8,017,339号及びWO2013/038010 A2において開示される。好ましくは、そのクラウディング剤は、巨大分子、ポリマー又はポリアルキルグリコールのような化合物を含むポリマー、好ましくはPEG、オクトキシノール、又はトリトンX、又はポリソルベート、好ましくはツイーンである。好ましい態様において、そのクラウディング剤は、5体積%から35体積%、特に好ましくは10体積%から25体積%の濃度において用いられる。好ましくは、そのクラウディング剤は、200から35000g/モル、好ましくは1000から10000g/モルの分子量を有する。特に、好ましいものは、特に前記分子量を有する、PEGのようなポリアルキルグリコールである。クラウディング剤は好ましくは本発明のキットにおいて、好ましくはライゲーションバッファーにおいて提供される。
【0039】
任意の成分において、キットについて他の成分は、バッファー、塩、酵素学的な補助因子及び金属、例えばポリメラーゼ及びリガーゼのためのMn2+及びMg2+、溶媒、容器である。
【0040】
本発明は本発明の方法を実施するためのキットを提供する。そのようなキットは今までに記載される任意の化合物及び意味を含みうる。好ましくはそのキットは、
(i)テンプレート核酸へハイブリダイズすること及びその3’末端上の伸長反応をプライミングすることを可能にする少なくとも1つのオリゴヌクレオチドプライマー、(ii)テンプレート核酸にハイブリダイズすることを可能にする、好ましくはその3’末端上の伸長反応をプライミングすることを可能にする一以上の伸長ストッパー、(iii)識別配列をその5’末端上に含む一以上のアダプター核酸であって、ここで前記識別配列がその伸長ストッパーにハイブリダイズされない、好ましくは、ここでそのアダプター核酸が伸長ストッパーに結合され、ハイブリダイズされ、又は結合されないもの、(iv)逆転写酵素、及び(v)オリゴヌクレオチドリガーゼを含み、(iv)及び(v)は、本発明とは無関係に多くの実験室で利用できる可能性があるので、任意でありうる。その重要な部分はアダプター/ストッパーの設計であり、特にアダプター上の識別配列である。好ましくは異なる識別配列を有する複数のアダプターは、上記のようにキットにおいて提供される。そのキットの全てのこれらの成分は、上述され、そしてまた、その任意の好ましい態様はそのキットを同様に適用する。好ましくは、そのキットは少なくとも10、より好ましくは少なくとも50の異なる識別配列を有するアダプター核酸を含む。そのような好ましい態様の理由は上記に与えられている。好ましくは、そのオリゴヌクレオチドプライマーはそのテンプレートにアニーリングするためのアニーリング配列を含み、それはテンプレート内のオリゴ(A)配列にアニーリングするためのオリゴ(dT)配列を含み、好ましくは、ここで前記オリゴ(dT)配列はオリゴ(dT)配列から異なる一以上の3’アンカーヌクレオチドを含む。また、そのキットは精製のための固相、例えば、ビーズ、好ましくは磁性ビーズ(上記の詳細な方法を参照、また、キットの成分の適合性及び態様について読み取れるもの)を含む。
【0041】
上記のような全ての好ましい態様は組み合わされうる。また、そのような方法では、(「「鎖置換停止プライマー」とも呼ばれる」)ストッパーである(リンカー配列を有する)ランダムプライマーを使用する。伸長反応後に、好ましくは(テンプレートへハイブリダイズした)伸長産物の精製は、未結合のプライマー及びストッパーを除去するために行われる。続いて、それらのリンカー及び識別配列を有するアダプターは、その伸長産物に連結する。その識別配列は好ましくは4から12ntの間の長さを有するランダム配列を有する。リガーゼが最後及び最後から2番目におけるある5’に位置したヌクレオチドに都合がよいことによりライゲーションの偏りを課す傾向があるので、一つの好ましい選択は、別に長い識別配列の混合物を使用することである。そのような偏りがリードの質に影響しうるので、そのような混合物は、ライゲーションジャンクションの領域にわたってシークエンシングする場合に、ヌクレオチド置換を均質化する。しかしながら、可変の識別配列は、任意の他の定義される配列のように、さらにより不偏のライゲーションを提供し、そしてまた同時にUMI(固有分子識別子)として寄与する。UMIのような、識別配列は、同一配列を有する、又はマイナーなシークエンスエラーを説明する参照の注釈において同一の位置に位置付ける、シークエンシングリードが、異なるテンプレート分子又は一つテンプレート分子から由来するか、そして単にさらなる増幅の結果物(PCR複製)であるか決定することを可能にする。そのアダプターは存在する場合に、プライマーにハイブリダイズされる。
【0042】
また、UMIsのような、識別配列は、個人間における本当のSNPs(一塩基多型)と、逆転写時又は早期PCRサイクル内において導入されるエラー(変異)であって後に増幅されるものとの間を区別しうる。それらのランダムに生じ増幅されるエラーの全ては、同じ識別子であり、ゆえに試料中の「本物のSNPs」は様々な異なる識別子を有する。又は、取り込みミス及びそれゆえRT時のエラーに繋がる塩基の修飾を導入するRNA編集では、より高い信頼性で定量化されると考えられる。
【0043】
また、遺伝性疾患の原因となる集団、分子マーカー及び変異におけるアレル頻度を確実に決定し、定量化するためにUMIsのような、識別配列が用いられうる。好ましくは、DNAテンプレートはこの態様のために用いられる。
【0044】
さらに好ましい組み合わせは、少なくとも1つ、好ましくは少なくとも9つの、伸長ストッパーがプライマー活性を有し、かつまたその伸長工程の間で伸長され、かつ少なくとも2つ、好ましくは10の異なる識別配列を含むアダプター核酸が用いられ、ここで、少なくとも2つ、好ましくは少なくとも10の、異なる標識化した断片を産生し、任意にその標識化した断片を増幅し、さらに固有である増幅断片の配列をアセンブリすることを含み、ここでその標識は固有の増幅断片を同定するために用いられる、本発明の方法である。増幅した標識化した断片における異なるラベルは、固有の増幅断片を識別するために用いられうる。
【0045】
さらなる好ましい方法は、プライマー機能を有するストッパーを使用する。好ましくは、複数のそのようなプライマーが用いられる。そのような方法において、ストッパーとプライマーとの間を区別することなく、本発明の態様は、以下のように定義されうる:前記テンプレート核酸を提供すること、前記テンプレート核酸へ複数のオリゴヌクレオチドプライマーをアニーリングすること、テンプレート特異的な方法においてオリゴヌクレオチドプライマーを伸長し、それによって複数の伸長産物を作り、ここで前記伸長する反応がその伸長産物がそのテンプレートの5’末端又はそのような伸長産物の下流のテンプレート核酸にアニールされるオリゴヌクレオチドプライマーに到達する際に停止すること、識別配列をそれらの5’末端上に含む複数のアダプター核酸を提供し、ここで前記識別配列がオリゴヌクレオチドプライマー又はそのテンプレートにハイブリダイズしないこと、それらのそれぞれの5’末端で複数のアダプター核酸をその伸長産物の3’末端に連結し、それによって、複数の標識化した増幅断片を産生することの工程を含むテンプレート核酸の標識化した増幅断片を産生するための方法。これは、特許請求の範囲及び上記の任意に特定の記載した側面と組み合わされうる好ましい態様である。ストッパーについて上記の全ては、これらのプライマーがプライマー機能を有するストッパーであるので、本態様のプライマーを提供する。「複数」という用語は、オリゴヌクレオチドプライマー、(プライマーの伸長の結果物である)伸長産物、アダプター核酸及び(伸長及びアダプターライゲーションの結果物である)標識化した増幅断片について用いられる。示されるように、これらの複数のいくつかの量は本方法の結果である。オリゴヌクレオチドプライマー及びアダプター核酸の量は、上記のように、選択されうる。それらの量を、独立して選択できるが、好ましくは与えられる伸長産物にペアで関係するためにほぼ同じである。好ましくは、その複数は、例えば、10以上、50以上、100以上、200以上等である。多くの異なるオリゴヌクレオチドプライマー及びアダプター核酸が:そのオリゴヌクレオチドプライマーがそのテンプレート上の多数の異なる位置に結合するために、異なる識別配列を有するアダプター核酸、好ましくは、標識した増幅断片の固有の識別配列のために、用いられうる。本態様において、プライマー及びストッパーは同じであるが、またストッパー機能を必要としない(しかし有しうる)特殊なプライマー、例えば、上記のようなオリゴ(A)標的プライマーのような5’末端特異的なプライマーを加えられうる。
【0046】
本発明は、本発明のこれらの態様に制限されることなく、さらに以下の図及び実施例において記載される。
【図面の簡単な説明】
【0047】
図1】SDS特性を有するプライマーを用いるUMI-リンカー標識化した短いcDNAライブラリー及びRNAのボディー内に部分的に相補的なUMI-含有リンカーオリゴを作ることの略図 a)一般的な鎖置換停止プライマーPnはRNA転写物にハイブリダイズされ、そしてプライマーPn+1はテンプレートRNAのプライマーPnよりもより上流(5’)の位置にハイブリダイズされる。逆転写酵素の場合に、伸長するPnがプライマーPn+1に到達すると、そのポリメラーゼ反応は、WO2013/038010 A2において記載されている鎖置換停止技術により停止されるだろう。L1に相補的なL2を含むUMI-含有リンカーオリゴは、プライマーPn及びPn+1にハイブリダイズされる。b)ライゲーションの際に、その伸長産物は、すぐにそのリンカーのL2鎖に先行するUMIに連結される。再度この様式において、その末端に存在する二つのリンカー配列(L1、L2)を有し、かつ固有分子識別子を含むcDNAライブラリーは作成される。c)最終的に、PCRを実施し、これらのライブラリーを増幅する。
【0048】
図2a】UMI-含有ライブラリーの産生 図2a)はSDS+ライゲーション手法によって産生されるライブラリーを示す。 UMIを含む部分的に相補的なL2アダプターのライゲーション(図1参照)は、一本鎖リガーゼ又は二本鎖リガーゼ(レーン2、3)のいずれかを用いて実施されうる。リガーゼが省かれる場合に、ライブラリーは産生しない(レーン1)。ライゲーション後、L1及びL2リンカーを含むcDNA断片はPCRにより増幅され分析される。示されたものは、Bioanalyzer(Agilent Technologies,Inc.)上で運用されるHS DNAアッセイからのゲル画像である。b)ハイブリダイズしないスターター及びアダプターオリゴによるSDS+ライゲーション手法を用いるUMIを含むライブラリーの産生の略図。この場合において、そのアダプターオリゴL2’は、伸長スターターPnに相補的な配列を含まない。c)複製ライブラリーのゲル画像及び電気泳動図はハイブリダイズしない伸長スターター及びUMIを含むアダプターオリゴ(SEQ ID NO.10)を用いて産生される。画像は、Bioanalyzer(Agilent Technologies,Inc)上で運用されるHS DNAアッセイから得られる。
【0049】
図2b-c】UMI-含有ライブラリーの産生 図2a)はSDS+ライゲーション手法によって産生されるライブラリーを示す。 UMIを含む部分的に相補的なL2アダプターのライゲーション(図1参照)は、一本鎖リガーゼ又は二本鎖リガーゼ(レーン2、3)のいずれかを用いて実施されうる。リガーゼが省かれる場合に、ライブラリーは産生しない(レーン1)。ライゲーション後、L1及びL2リンカーを含むcDNA断片はPCRにより増幅され分析される。示されたものは、Bioanalyzer(Agilent Technologies,Inc.)上で運用されるHS DNAアッセイからのゲル画像である。b)ハイブリダイズしないスターター及びアダプターオリゴによるSDS+ライゲーション手法を用いるUMIを含むライブラリーの産生の略図。この場合において、そのアダプターオリゴL2’は、伸長スターターPnに相補的な配列を含まない。c)複製ライブラリーのゲル画像及び電気泳動図はハイブリダイズしない伸長スターター及びUMIを含むアダプターオリゴ(SEQ ID NO.10)を用いて産生される。画像は、Bioanalyzer(Agilent Technologies,Inc)上で運用されるHS DNAアッセイから得られる。
【0050】
図3】転写物の改善した5’末端のカバレッジは、RNAテンプレートの5’末端でcDNAへのL2リンカーのライゲーションによってもたらされうる。 a)転写物の5’末端でのRT反応の略図。下流のプライマーPn+1によってSDSなしに、そのRTのその末端のデオキシヌクレオチドトランスフェラーゼ活性(TdT)は、突出を産生するcDNAの3‘末端にテンプレートでないヌクレオチドを付加する。b)テンプレートでないntsは、プライマーPn+1を含むL1についてハイブリダイゼーション部位のいずれかに寄与しうる。部分的にL2とハイブリダイズされることと併せて、UMI-L2リンカーのライゲーションは二本鎖において起こりうる。c)一方で、UMI-L2リンカーをプライミングしなければ、一本鎖として連結されうる。d)図3a)-c)に体系的に示されるように産生されるライブラリーを、Illumina NextSeq 500(シングルリード、75bp)においてシークエンシングした。示されるものは、(SIRV set 3,Lexogen Catalog #051.0Nに示されるように)ERCC-0130の5’末端にマッピングするリードである。リードは、追加の及び不適合の塩基のトリミングなしに分析される。ERCC-0130の注釈に対応する灰色においてマークしたヌクレオチド、及び黒色において示したヌクレオチドは、そのRTのTdT活性によってテンプレートでないものの付加から由来される。ERCC-0130の5’末端について得られるリードの30の代表的な配列は、以下に示される。リード配列は上から下へ、SEQ ID NO:12~42である。e)慣習のプロトコルと比較されるSDS/ライゲーション手法の改善した5’末端のカバレッジ。ライブラリーを慣習のプロトコル(NEBNext(登録商標)Ultra(商標)II directional RNA Library Prep Kit for Illumina(登録商標)、New England Biolabs,Catalog #E7760S)、又はそのSDS/ライゲーション手法を用いて調製し、そしてIllumina NextSeq 500(ペアエンドリード、150bp)によりシークエンシングした。ERCC-0130へのリードマッピングを上書きし、そして長方形として示される期待されるカバレッジと比較した。左側:慣習のRNAライブラリー調製プロトコル、右側:新規SDS/ライゲーション技術によって得られるカバレッジ。
【0051】
図4】SDS/ライゲーション手法並びに一般的な(Pn)及びオリゴ-dTプライマー(PdT)の組み合わせによって3’末端のカバレッジを改善するために用いられる反応の略図。 a)一般的なプライマーPnをそのRNAボディー内のRNAテンプレートにハイブリダイズする。加えて、本オリゴ-dTプライマー(PdT)を、ポリアデニル化した転写物の3’末端のポリ(A)尾部にハイブリダイズする。下流のプライマーPnが到達し、鎖置換を停止するまで、RTはPdTを伸長するだろう。b)ライゲーションの際に、UMI-含有L2リンカーは3’末端、産生するL1とL2との連結、転写物の3’末端を覆うUMI-含有cDNAライブラリーに及ぶcDNA断片に連結される。c)全体のトランスクリプトームにわたる転写物の3’末端の増強したカバレッジを示すgene body coverage plot。ライブラリーを、ランダムプライミングの混合物、及び実施例3に記載されるオリゴ-dTの第一鎖合成プライマーを用いてSDS+ライゲーションのプロトコルを用いて調製した。ライブラリーはNextSeq500機器によりシークエンシングされ、トランスクリプトームにわたるgene body coverageは、以前に記載したSDS+ライゲーションプロトコルと比較してプロットされた。d)慣習のライブラリー調製方法(上図)及び改善した3’末端カバレッジをもたらすオリゴ-dTタイトレーションによるSDS+ライゲーションプロトコル(下図)について内在的なハウスキーピング遺伝子(HSP90)にわたる例示的なカバレッジ。
【0052】
図5a】転写物の5’及び3’のカバレッジの全体の改善。転写開始部位すなわち転写物の本当の5’末端、及び転写終結部位すなわち転写物の本当の3’末端は、SDS+ライゲーションプロトコルを用いて分解されるが、二つの例示的な慣習のライブラリー調製方法を用いる場合には分解されない。図3a-c)に体系的に示されるSDS+ライゲーションプロトコルを用いて産生されるライブラリーを、Illumina NextSeq 500によりシークエンシングする(ペアエンド、150bp)。慣習のライブラリーを、TruSeq Stranded Total RNA Library Prep Human/Mouse/Rat、Illumina Catalog#20020596又は20020597(=慣習1)又はNEBNext(登録商標)Ultra(商標)II directional RNA Library Prep Kit for Illumina(登録商標)、New England Biolabs,Catalog#E7760S(=慣習2)のいずれかを用いてメーカーの指示に従って調製する。a)示されるものは、(SIRV set3、Lexogen Catalog#051.0Nにおいて存在するように、)検出したERCCsの本当の5’及び3’末端へのリードマッピングである。リードを既知の配列によってRNAsにおけるERCCスパイクに位置付けた。全ての検出したERCCsについて集積したマップ化したリードの標準化したカバレッジを、点線によりマークした転写開始(TSS)及び転写終結部位(TES)に対応する絶対ヌクレオチ位置においてプロットした。b)伸長した5’カバレッジは、本当のTSSを明らかにする。上図:上記のようにSDS+ライゲーションプロトコル又は慣習のライブラリー調製を用いて産生されるように凝集したイントロンの可視化によるgapdhについてのカバレッジの特性。リード配列は、上から下にSEQ IDs No.43からNo,67である。gapdhの注釈に対応する黒色でマークしたヌクレオチド、及び不適合又はRTのTdT活性によるテンプレートでない追加に由来される灰色において示される。転写物の5’末端でリードの積み重ねにより産生される開始部位クラスターは、再注釈のTSSに用いられうる。その注釈され手動で決定したTSSは、太字で示した注釈したコンセンサス配列で矢印により示される。
【0053】
図5b】転写物の5’及び3’のカバレッジの全体の改善。転写開始部位すなわち転写物の本当の5’末端、及び転写終結部位すなわち転写物の本当の3’末端は、SDS+ライゲーションプロトコルを用いて分解されるが、二つの例示的な慣習のライブラリー調製方法を用いる場合には分解されない。図3a-c)に体系的に示されるSDS+ライゲーションプロトコルを用いて産生されるライブラリーを、Illumina NextSeq 500によりシークエンシングする(ペアエンド、150bp)。慣習のライブラリーを、TruSeq Stranded Total RNA Library Prep Human/Mouse/Rat、Illumina Catalog#20020596又は20020597(=慣習1)又はNEBNext(登録商標)Ultra(商標)II directional RNA Library Prep Kit for Illumina(登録商標)、New England Biolabs,Catalog#E7760S(=慣習2)のいずれかを用いてメーカーの指示に従って調製する。a)示されるものは、(SIRV set3、Lexogen Catalog#051.0Nにおいて存在するように、)検出したERCCsの本当の5’及び3’末端へのリードマッピングである。リードを既知の配列によってRNAsにおけるERCCスパイクに位置付けた。全ての検出したERCCsについて集積したマップ化したリードの標準化したカバレッジを、点線によりマークした転写開始(TSS)及び転写終結部位(TES)に対応する絶対ヌクレオチ位置においてプロットした。b)伸長した5’カバレッジは、本当のTSSを明らかにする。上図:上記のようにSDS+ライゲーションプロトコル又は慣習のライブラリー調製を用いて産生されるように凝集したイントロンの可視化によるgapdhについてのカバレッジの特性。リード配列は、上から下にSEQ IDs No.43からNo,67である。gapdhの注釈に対応する黒色でマークしたヌクレオチド、及び不適合又はRTのTdT活性によるテンプレートでない追加に由来される灰色において示される。転写物の5’末端でリードの積み重ねにより産生される開始部位クラスターは、再注釈のTSSに用いられうる。その注釈され手動で決定したTSSは、太字で示した注釈したコンセンサス配列で矢印により示される。
【実施例
【0054】
実施例1:第一鎖のcDNA断片への固有分子識別子(UMI)のライゲーション
【0055】
ライブラリーをメーカーの指示に従いコントロールミックス(Lexogen,Catalog#051.0N)におけるSIRV Set 3 spikeを含むユニバーサルヒト参照RNA(Agilent Technologies,Catalog#740000)から調製した。
【0056】
cDNA合成後、2から24ヌクレオチドの、好ましくは6から12ヌクレオチドの間の長さの固有分子識別子を含む下流のプライマー(Pn+1(L2))を、テンプレートRNAとのハイブリッドにおいて、新たに転写されるcDNA鎖に連結しうる。逆転写をオリゴ、テンプレート、及びWO2013/038010A2に記載されるような条件を用いて実施した。様々なリガーゼ及びそれらの組み合わせを以下のようなオリゴと連結するために用いうる:
SEQ ID No:1:(Phos)(5’-NNNNNNAGATCGGAAGAGCA-3’(3InvdT))、
SEQ ID No:2:(Phos)(5’-NNNNNNNNNNAGATCGGAAGAGCACACGTCTGAA-3’(3InvdT))、
SEQ ID No:3:(Phos)(5’-NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG-3’(3InvdT))、
SEQ ID No:4:(Phos)(5’-NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3’(3InvdT))、
SEQ ID No:5:(Phos)(5’-NNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG-3’(3InvdT))、
SEQ ID No:6:(Phos)(5’-NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTG-3’(3InvdT))、
SEQ ID No:7:(Phos)(5’-NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3’(3InvdT))、
SEQ ID No:8:(Phos)(5’-+NNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3’(3InvdT))、
SEQ ID No:9:(Phos)(5’-+NNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGG-3’(3InvdT))。
逆転写(RT)後、その試料をメーカーの指示に従い、磁性精製ビーズ(AMPure Beads;Agentcourt)を有する固相可逆固定(SPRI)によって精製した。そのcDNA:RNAハイブリッドを、20μLの水又は10mM Tris,pH8.0において溶出し、17μLの上清を新しいPCRプレート内に移した。続いて、ライゲーション反応を20% PEG-8000、50 mM Tris-HCl(pH7.5、25℃)、10 mM MgCl、5 mM DTT、0.4 mM ATP、0.01% トリトン-X100、50 μg/mL BSA及び一本鎖特異的なリガーゼ及び/又は二本鎖特異的なリガーゼのいずれかでありうる20ユニットのリガーゼを有する60μLにおいて実施した。連結されない小断片及び残存するオリゴをSPRI精製により除去した。全ての残存する第一のcDNAライブラリーを、高い忠実性のポリメラーゼを用いてPCR反応において、そして以下のプログラムで増幅した:98℃で30秒に続き、98℃で10秒の10~25PCRサイクル、65℃で20秒、そして72℃で30秒。最終の伸長を72℃で60秒間実施した。図1b)は、鎖置換停止プライマー(L1)に相補的な配列を有するUMI-含有リンカーオリゴ(L2)への基本的な伸長したcDNAのライゲーションの一般原理を示す。
【0057】
図2における例示は、様々なリガーゼがオリゴヌクレオチドを含むUMIのライゲーション反応を実施しうることを示し、そしてそれゆえ、PCR(図2a、レーン2-3)により両方のPCRリンカーを含みPCRにより増幅可能であるcDNA断片を産生する。対照的に、任意のリガーゼを省いているコントロール試験では、反応の特異性を強調することを増幅されうるライブラリーがないことを示す(図2a),レーン1)。
【0058】
実施例2:ハイブリダイズしない伸長スターター及びアダプターオリゴヌクレオチドを用いるライブラリー産生。
【0059】
メーカーの指示に従い、コントロールミックス(Lexogen,Catalog#051.0N)にSIRV Set 3 spikeを含むユニバーサルヒト参照RNA(Aglient Technologies,Catalog#740000)からライブラリーを調製した。
【0060】
逆転写(RT)を実施例1において記載されるように実施した。RTに続き、その試料をメーカーの指示に従い、磁性精製ビーズ(AMPure Beads;Agentcourt)を有する固相可逆固定(SPRI)により精製し、そしてその精製したcDNA:RNAハイブリッドを20μL、10mM Tris、pH8.0において溶出し、17μLの上清を新しいPCRプレート内に移した。ライゲーションを実施例1に記載の条件を用いて実施したが、逆転写反応をプライミングするために用いられる伸長スターターに相補的な配列を含まないアダプターオリゴヌクレオチドを提供している。従って、そのオリゴヌクレオチドアダプターは、ハイブリダイズできず、そして補充により新たに生じた伸長産物の3’末端の近傍にもたらされない(図2b))。SEQ ID No.10:(Phos)(5’-NNNNNNNNNNNNTGGAATTCTCGGGTGCCAAG-3’(3SpcC3)のようなオリゴは、伸長スターターに相補的な配列を有しない。両方のリンカー配列を含む断片を、実施例1に記載されるように除去した後に増幅した。図2c)は、ハイブリダイズしない伸長スターター及びアダプターオリゴによって生じた二つの複製SDS+ライゲーションライブラリーについてライブラリートレースのゲル画像及び電気泳動図を示す。
【0061】
実施例3:末端トランスフェラーゼ活性及び第一鎖cDNA断片へのUMI-リンカーのss-ライゲーションの結果としての改善した5’末端のカバレッジ。
【0062】
ライブラリーを、メーカーの指示に従い、コントロールミックス(Lexogen,Catalog#051.0N)内のSIRV Set3 spikeを含むユニバーサルヒト参照RNA(Agilent Technologies,Catalog#740000)から調製した。
【0063】
第一鎖cDNA合成を、テンプレートRNA分子の5’末端で停止する。逆転写酵素の末端トランスフェラーゼ活性は、そのcDNA鎖の3’末端でテンプレートでないヌクレオチドの付加を触媒する(図3a)。
【0064】
逆転写反応後、UMI-リンカーオリゴ(例えば、SEQ ID 1-9)のライゲーションは、二本鎖形成(図3b)及び突出一本鎖(図3c)において起こりうる。SPRI精製及びPCR増幅後、ライブラリーをNextSeq500上で、一本鎖読み取り又は対の末端様式のいずれかでシークエンシングした。ERCC-0130の5’末端へのリードマッピングを不適合なヌクレオチドの事前のクリッピングなく分析した。ERCC-0130の5’末端を覆うリードを図3dに例示的に示す。末端のヌクレオチドの付加及び伸長した一本鎖でのUMIライゲーションは改善した5’カバレッジをもたらす。共通のRNA-配列ライブラリー調製と本発明とのカバレッジの特性の比較を図3eに示す。カバレッジは全ての配列したリード(灰色において示されたトレース)と長方形として示される期待される均一のカバレッジと比較した。一方で、慣習のプロトコルから由来した配列データにおいて、5’及び3’末端はいずれかの末端へ勾配において明らかに低い効率でカバーされ、新規プロトコルは、転写の極端な5’末端へのさらなるリードマッピングを作成する(図3e,右)。
【0065】
実施例4:オリゴdT第一鎖合成プライマーのタイトレーションによる3’末端カバレッジの改善
【0066】
転写3’末端のカバレッジは、ランダムプライマーSDSオリゴの混合物に加えられる第一鎖プライマー(L1を含むPn)オリゴ-dTを用いることによって修飾され、好ましくは増加されうる。それらは、ランダムヌクレオチドの通常の分布に従って、既にT-豊富な及びT-のみのプライミング配列(例えば、SEQ ID No:11 5’-GTGACTG-GAGTTCAGACGTGTGCTCTTCCGATCT+TTT TTT TTT TTT TTT TTT+V-3’)を含み、3’末端でカバレッジを高める。ランダムプライマーとポリdT L1プライマーとの間の選択される比率に依存して、3’末端部位での配列の深度の変化が目立ちうる(図4)。ランダムSDSプライマー及び特定のオリゴdTプライマー、並びにプライマーの長さ及びLNA含有量は様々であり、3’末端の過剰発現の量を決定するだろう。
【0067】
ライブラリーをランダムプライミング置換停止プライマーのみ又は様々な量のオリゴdT第一鎖プライマー(SEQ ID No:11)との混合物を用いて、SDS+ライゲーションにより調製した。その結果のライブラリーをNextSeq500上のシークエンシングにかけ、データを分析し、そして全体のトランスクリプトームにわたるgene body coverage plotをrseqcから利用可能なgeneBody_coverage pythonスクリプトを用いて位置づけられるリードから作成した(図4c)。3’末端のカバレッジは、逆転写の際にオリゴ-DTプライマーの付加により有意に増加しうる。
【0068】
さらに、遺伝子カバレッジをカスタムスクリプトを用いて模範的に可視化し、個々の遺伝子状のカバレッジを評価した。図4dでは、5’及び3’末端が過小発現されることで有名な、慣習のRNAライブラリー調製プロトコル(上図)により入手されるハウスキーピング遺伝子HSP90のカバレッジを示す。対照的に、オリゴdTタイトレーションによるSDS-ライゲーションプロトコルは改善した5’及び3’カバレッジを示す(下図)。
【0069】
実施例5:5’及び3’カバレッジの改善は、真の転写開始及び終結部位の決定を手助けする。
【0070】
SDS+ライゲーションライブラリーを、実施例3及び4に記載されるように、コントロールミックス(Lexogen,Catalog#051.0N)内のSIRV Set 3 spikeを含むリボ欠失ユニバーサルヒト参照RNA(Agilent Technologies,Catalog#740000)により調製した。リボソームRNAの除去は、メーカーの指示に従い、RiboCop(Lexogen、Catalog#037.96)を用いることによってもたらされうる。比較として、二つの慣習のライブラリー調製方法を同じリボ欠失ユニバーサルヒト参照RNA:TruSeq Stranded Total RNA Library Prep Human/Mouse/Rat、Illumina Catalog#20020596若しくは20020597(=慣習1)又はNEBNext(登録商標)Ultra(商標)II directional RNA Library Prep Kit for Illumina(tourokushouhyou ),New England Biolabs,Catalog#E7760S(=慣習2)を,メーカーの指示に従い用いた。その結果のライブラリーをNextSeq500上のシークエンシングにかけ、そしてそのデータを分析した。gene body coverage plotをSIRV Set3において存在する全ての検出したERCCsについて、作成した。図5a)では、既知の転写開始(TSS)及び転写終結部位(TES)、点線により示される両方に対応している絶対ヌクレオチド位置について集積した配置したリードの標準化したカバレッジを示す。3’末端の減少したカバレッジ及び正確な5’末端の欠失分解を示す、両方の慣習のライブラリー調製と比較して、5’及び3’末端でのカバレッジは、SDS+ライゲーションライブラリーから由来した試料について有意に増加した。
【0071】
さらに、遺伝子カバレッジを、カスタムスクリプトを用いて内在ハウスキーピング遺伝子、gapthについて模範的に可視化し、個々の遺伝子のカバレッジを評価した。図5b)は、凝集したイントロンの可視化によりgapthについてのカバレッジの特性を示す。gapth(SEQ IDs No.43karaNo.67)へのリードマッピングを追加及び不適合の塩基のトリミングなしに分析した。コンセンサス配列(一番上の行)に適合するヌクレオチドを黒色でマークし、そして注釈したコンセンサス配列から逸脱している又はテンプレートでない付加から由来したヌクレオチドを灰色においてマークした。SDS+ライゲーションライブラリー調製物から由来した試料について見られるリードの積み重ねに基づき、真正の転写開始部位を関心のある転写物について、決定し、再注釈しうる。図5b)において示される実施例において、(注釈した+1の位置に関して)TSSを手動で-15の位置に調節した。同様に、高スループットNGS試験のための真正のTSSで一本鎖ヌクレオチドの分解を含む完全な転写物の総合的な分析を可能にする、真正の転写開始及び末端部位を関心のある完全な転写物について再評価しうる。これは、規格化されそしてより複雑なアプローチ、例えば5’キャプチャーシークエンシング技術(CAGE-Seq)又は低スループットの方法論、例えば5’RACE(cDNA末端の迅速増幅)とは対照的に、単にSDS+ライゲーションライブラリー調製方法を用いることによってもたらされうる。
図1
図2a
図2b-c】
図3
図4
図5a
図5b
【配列表】
2022512414000001.app
【手続補正書】
【提出日】2021-01-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
核酸テンプレートの標識化した増幅断片を産生するための方法であって、
前記テンプレート核酸を提供すること、
前記テンプレート核酸に少なくとも1つのオリゴヌクレオチドプライマーをアニーリングすること、
テンプレート特異的な方法において、前記少なくとも1つのオリゴヌクレオチドプライマーを伸長し、それによって伸長産物を作成することであって、ここで前記伸長産物が(a)前記テンプレート核酸の5’末端に又は(b)前記伸長産物の前記テンプレート核酸の下流へアニールされる核酸伸長ストッパーに到達する際に、前記伸長反応が停止し、
識別配列をその5’末端上に含むアダプター核酸を提供し、ここで前記識別配列は前記伸長ストッパー又は前記テンプレートにハイブリダイズせず、
前記アダプター核酸をその5’末端で前記伸長産物の3’末端に連結し、ここでライゲーションのために前記伸長産物が前記テンプレートにハイブリダイズされ、それによって標識化した増幅断片を産生すること
のステップを含む方法。
【請求項2】
前記伸長産物が前記テンプレート核酸の5’末端に到達する場合において、ヌクレオチドポリメラーゼが前記伸長産物にテンプレートでないヌクレオチドを、好ましくは前記ポリメラーゼの末端トランスフェラーゼ活性により、付加することを可能にし、かつ/又は好ましくは、ここで1から15のテンプレートでないヌクレオチドを少なくとも70%の前記伸長産物に付加する、請求項1に記載の方法。
【請求項3】
複数のアダプター核酸が前記ライゲーションステップにおいて提供されかつ使用され、ここで前記複数のアダプターが異なる識別配列を有し、好ましくはここで少なくとも10の、より好ましくは少なくとも50の、異なる識別配列を有するアダプター核酸がライゲーションステップにおいて提供されかつ使用される、請求項1又は2に記載の方法。
【請求項4】
前記識別配列がランダム配列である、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記伸長ストッパーがプライマー活性を有し、かつまた前記伸長工程の間に伸長され、好ましくは、ここで少なくとも9の、より好ましくは少なくとも49の、前記テンプレートにアニーリングするための異なるアニーリング配列を有し、かつそれによって前記テンプレート核酸の異なる位置にアニールする可能性のある、伸長ストッパーが用いられる、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記アニーリング配列がランダム配列である、請求項5に記載の方法。
【請求項7】
前記アダプター核酸が前記伸長ストッパーに結合され、ハイブリダイズされ、又は結合されず、又はハイブリダイズされず、好ましくは、前記アダプター核酸が前記伸長ストッパーに結合される又はハイブリダイズされる場合に、続いて、前記識別配列が前記伸長ストッパーを前記テンプレートへアニーリングするための前記伸長ストッパーのアニーリング配列と無関係である、請求項1から6のいずれか一項に記載の方法。
【請求項8】
前記テンプレートがRNAであり、好ましくはここで逆転写酵素が伸長のために使用される、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記オリゴヌクレオチドプライマー及び好ましくはまた前記伸長ストッパーがユニバーサル増幅配列を含み、かつ/又は前記アダプター核酸がユニバーサルアダプター増幅配列を含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記オリゴヌクレオチドプライマーが前記テンプレートにアニーリングするためのアニーリング配列を含み、それは前記テンプレート内のオリゴ(A)配列にアニーリングするためのオリゴ(T)配列を含み、好ましくはここで前記オリゴ(T)配列がオリゴ(T)配列から異なる一以上の3’アンカーヌクレオチドを含む、請求項1から9のいずれか一項に記載の方法。
【請求項11】
前記ライゲーション反応がクラウディング剤、好ましくは、ポリマー又はポリアルキルグリコールのような化合物を含むポリマー、好ましくはPEG、オクトキシノール若しくはトリトンX、又はポリソルベート、好ましくはツイーンの存在下で起こり;かつ/又はここで、前記伸長ストッパー及びまた好ましくは前記オリゴヌクレオチドプライマーは前記テンプレートへアニーリングするためのアニーリング配列の融解温度を高める一以上の修飾したヌクレオチドを含む、請求項1から10のいずれか一項に記載の方法。
【請求項12】
少なくとも1つの、好ましくは少なくとも9つの、伸長ストッパーはプライマー活性を有し、かつまた前記伸長工程時に伸長され、かつ少なくとも2つの、好ましくは10の、異なる識別配列を含むアダプター核酸が使用され、それによって、少なくとも2つの、好ましくは少なくとも10の、異なる標識化した増幅断片が産生され、任意に前記標識化した増幅断片を増幅し、さらに固有である増幅断片の前記配列をアセンブリすることを含み、ここで前記標識は固有の増幅断片を同定するために使用される、請求項1から11のいずれか一項に記載の方法。
【請求項13】
少なくとも2つのオリゴヌクレオチドプライマーが前記テンプレート核酸にアニールされ、前記少なくとも2つのオリゴヌクレオチドプライマーをテンプレート特異的な方法において伸長し、それによって少なくとも2つの伸長産物を作成し、ここで前記伸長反応は前記伸長産物が(a)前記テンプレート核酸の5’末端、及び(b)前記伸長産物の下流のテンプレート核酸にアニーリングする核酸伸長ストッパーとしてのオリゴヌクレオチドプライマーに到達する際に停止する、請求項1~12のいずれか一項に記載の方法。
【請求項14】
テンプレート核酸にハイブリダイズすること及びその3’末端上の伸長反応をプライミングすることができる少なくとも1つのオリゴヌクレオチドプライマー、
テンプレート核酸とハイブリダイズすることができる、好ましくはその3’末端上の伸長反応をプライミングすることができる、一以上の伸長ストッパー、
識別配列をその5’末端上に含む一以上のアダプター核酸であって、ここで前記識別配列が前記伸長ストッパーとハイブリダイズせず、好ましくはここで前記アダプター核酸が伸長ストッパーに結合され、ハイブリダイズされ、又は結合されず、又はハイブリダイズされない一以上のアダプター核酸、
逆転写酵素、及びオリゴヌクレオチドリガーゼを含む、
請求項1から13のいずれか一項に記載の方法を実施するためのキット。
【請求項15】
少なくとも10の、より好ましくは少なくとも50の、異なる識別配列を有するアダプター核酸を含む、請求項14に記載のキット。
【請求項16】
少なくとも1つのオリゴヌクレオチドプライマーが前記テンプレートにアニーリングするためのアニーリング配列を含み、それは前記テンプレート内のオリゴ(A)配列にアニーリングするためのオリゴ(T)配列を含み、好ましくはここで、前記オリゴ(T)配列が前記オリゴ(T)配列から異なる一以上の3’アンカーヌクレオチドを含む、請求項14又は15に記載のキット。
【国際調査報告】