(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024028962
(43)【公開日】2024-03-05
(54)【発明の名称】不連続な複数の鋳型から相補的DNA(cDNA)を順序だてて連続的に合成するための組成物およびその方法
(51)【国際特許分類】
C12P 19/34 20060101AFI20240227BHJP
C12N 9/12 20060101ALN20240227BHJP
【FI】
C12P19/34 A
C12N9/12 ZNA
【審査請求】有
【請求項の数】36
【出願形態】OL
(21)【出願番号】P 2023210150
(22)【出願日】2023-12-13
(62)【分割の表示】P 2021506693の分割
【原出願日】2019-08-08
(31)【優先権主張番号】62/716,159
(32)【優先日】2018-08-08
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】504256408
【氏名又は名称】ザ リージェンツ オブ ザ ユニヴァーシティ オブ カリフォルニア
【氏名又は名称原語表記】THE REGENTS OF THE UNIVERSITY OF CALIFORNIA
【住所又は居所原語表記】1111 Franklin Street,12th Floor,Oakland,California 94607 U.S.A.
(74)【代理人】
【識別番号】100077012
【弁理士】
【氏名又は名称】岩谷 龍
(72)【発明者】
【氏名】コリンズ,キャスリーン
(72)【発明者】
【氏名】アプトン,ヘザー イー.
(57)【要約】 (修正有)
【課題】不連続な複数の鋳型から相補的DNA(cDNA)を順序だてて連続的に合成することを含む、核酸合成用の組成物及び核酸合成方法を提供する。
【解決手段】相補的DNA(cDNA)分子を調製する方法であって、ピリミジンヌクレオチドが1塩基突出した末端を3’末端に含むプライマー鎖と非伸長鎖とを含む二本鎖プライマーを提供する工程;3’末端にプリンヌクレオチドを含むRNA鋳型を提供する工程;ならびに前記RNA鋳型に実質的に相補的なcDNA分子の作製に効果的な条件下において、マグネシウムイオンと1種以上のデオキシリボヌクレオシド三リン酸(dNTP)またはその類似体とを含むバッファー中で、前記二本鎖プライマーおよび前記RNA鋳型を逆転写酵素(RT)と接触させる工程を含む方法とする。
【選択図】なし
【特許請求の範囲】
【請求項1】
相補的DNA(cDNA)分子を調製する方法であって、
ピリミジンヌクレオチドが1塩基突出した末端を3’末端に含むプライマー鎖と非伸長鎖とを含む二本鎖プライマーを提供する工程;
3’末端にプリンヌクレオチドを含むRNA鋳型を提供する工程;ならびに
前記RNA鋳型に実質的に相補的なcDNA分子の作製に効果的な条件下において、マグネシウムイオンと1種以上のデオキシリボヌクレオシド三リン酸(dNTP)またはその類似体とを含むバッファー中で、前記二本鎖プライマーおよび前記RNA鋳型を逆転写酵素(RT)と接触させる工程
を含む方法。
【請求項2】
前記プライマー鎖が、DNAプライマー鎖である、請求項1に記載の方法。
【請求項3】
前記プライマー鎖が、5’突出末端を含む、請求項1または2に記載の方法。
【請求項4】
前記プライマー鎖が、その5’末端または内部部位に修飾を含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記修飾により、前記プライマー鎖または前記二本鎖プライマーの固相化または精製が可能になっている、請求項4に記載の方法。
【請求項6】
前記修飾が、ビオチンへの結合である、請求項5に記載の方法。
【請求項7】
前記プライマー鎖が、5’アダプター配列である、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記非伸長鎖が、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記非伸長鎖が、その3’末端に修飾を含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記修飾によって3’末端の伸長がブロックされる、請求項9に記載の方法。
【請求項11】
前記修飾が、3’末端のC3スペーサーまたは3’末端のモノリン酸である、請求項10に記載の方法。
【請求項12】
前記RNA鋳型が、一本鎖核酸または部分的に一本鎖の核酸の3’末端を少なくとも1塩基伸長させる方法により調製されたものであり、前記伸長させる方法が、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、一本鎖核酸または部分的に一本鎖の核酸を接触させる工程を含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
前記二本鎖プライマーが、A型二本鎖核酸の3’末端を少なくとも1塩基伸長させる方法によって調製されたものであり、前記伸長させる方法が、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、A型二本鎖核酸を接触させる工程を含む、請求項1~11のいずれか1項に記載の方法。
【請求項14】
前記RTが、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質である、請求項1~13のいずれか1項に記載の方法。
【請求項15】
前記真核生物由来の非LTR RTタンパク質が、R2レトロエレメント逆転写酵素(R2 RT)タンパク質である、請求項14に記載の方法。
【請求項16】
前記R2 RTタンパク質が、カイコガのR2 RTタンパク質である、請求項15に記載の方法。
【請求項17】
前記真核生物由来の非LTR RTタンパク質が、切断型N末端領域と、RNA結合ドメインと、逆転写酵素(RT)ドメインと、エンドヌクレアーゼドメインとを含み、前記エンドヌクレアーゼドメインが、エンドヌクレアーゼ機能を欠失させる変異を含む、請求項14に記載の方法。
【請求項18】
前記RNA鋳型が、その3’末端に、プリン塩基を含むdNTP、NTPもしくはddNTPまたはそれらのヌクレオチド類似体を含む、請求項1~17のいずれか1項に記載の方法。
【請求項19】
前記RNA鋳型が、その5’末端に修飾を含む、請求項1~18のいずれか1項に記載の方法。
【請求項20】
前記修飾が不可逆的修飾である、請求項19に記載の方法。
【請求項21】
前記不可逆的修飾が、5’末端のC6スペーサーまたはビオチンである、請求項20に記載の方法。
【請求項22】
前記修飾が可逆的修飾である、請求項19に記載の方法。
【請求項23】
前記可逆的修飾が、5’末端のアデニリル化である、請求項22に記載の方法。
【請求項24】
前記接触が、3’末端にピリミジンヌクレオチドを含む第2の鋳型の存在下で行われる、請求項14~23のいずれか1項に記載の方法。
【請求項25】
第2の鋳型が、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む、請求項24に記載の方法。
【請求項26】
第2の鋳型が、その3’末端にピリミジンリボヌクレオチドを含む、請求項25に記載の方法。
【請求項27】
第2の鋳型が、3’アダプター配列の相補鎖である、請求項24~26のいずれか1項に記載の方法。
【請求項28】
前記接触が、前記5’アダプター配列、前記RNA鋳型に実質的に相補的な配列および前記3’アダプター配列を含むcDNA分子の作製に効果的な条件下で行われる、請求項27に記載の方法。
【請求項29】
第2の鋳型が、その5’末端に修飾を含む、請求項24~28のいずれか1項に記載の方法。
【請求項30】
前記修飾が不可逆的修飾である、請求項29に記載の方法。
【請求項31】
前記不可逆的修飾が、5’末端のC6スペーサーまたはビオチンである、請求項30に記載の方法。
【請求項32】
前記修飾が可逆的修飾である、請求項29に記載の方法。
【請求項33】
前記可逆的修飾が、5’末端のアデニリル化である、請求項32に記載の方法。
【請求項34】
前記接触が、約4℃~約50℃で行われる、請求項1~33のいずれか1項に記載の方法。
【請求項35】
前記接触が、約37℃で行われる、請求項34に記載の方法。
【請求項36】
単一の容器内で実施される、請求項1~35のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
配列表
本願は、ASCIIフォーマットの電子形式で提出された配列表を含み、この配列表は引用によりその全体が本明細書に援用される。このASCII形式の配列表は、51429-002WO2_Sequence_Listing_08.07.2019_ST25のファイル名で2019年8月7日に作成された132,350バイトのサイズのファイルである。
【0002】
本発明は、不連続な複数の鋳型から相補的DNA(cDNA)を順序だてて連続的に合成することを含む、制御下での核酸合成用の組成物および制御下で核酸を合成する方法に関する。
【背景技術】
【0003】
RNAは、特定の機能を発揮するDNA遺伝子コードまたはウイルスのゲノムコードである。RNAは、あらゆる状態に関する解読困難なDNAの百科事典ではなく、現在の状態に関する比較的合理化された説明書であり、かつ現在の状態の結果を示すものである。しかし、RNAからcDNAへと変換する方法では、情報に富んだRNAからバイアスも変化も加えずに配列を回収することは難しい。cDNAを基質として利用しているものとして、(たとえばHIVやその他のウイルスの有無の検出に使用される)PCRベースの配列検出、(たとえば非コードRNAの分析に使用される)ハイブリダイゼーションを用いたマイクロアレイによるプロファイリング、(たとえば単一の細胞のmRNAまたはバルクmRNAのトランスクリプトームのプロファイリングに使用される)ハイスループットシーケンシング、およびその他の読み取り方法などがある。
【0004】
したがって、核酸ハイブリダイゼーション、PCR、様々なプラットフォームを利用した次世代シーケンシング(NGS)などの研究用途および臨床用途に使用され、既知のヌクレオチドまたは未知のヌクレオチドを含むインタクトなRNAおよび/もしくはDNAまたは断片化されたRNAおよび/もしくはDNAを分析するための、個別にかつ集合的に様々に変更可能な技術がいまだに必要とされている。
【発明の概要】
【課題を解決するための手段】
【0005】
本発明は、特に、不連続な複数の鋳型からの順序だった連続的な相補的DNA(cDNA)の合成と、レトロウイルス由来ではない逆転写酵素(RT)タンパク質の非天然ターミナルトランスフェラーゼ活性を含む、制御下での核酸合成用の組成物および制御下で核酸を合成する方法に関する。
【0006】
一態様において、本発明は、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質であって、切断型N末端領域と、RNA結合ドメインと、逆転写酵素(RT)ドメインと、エンドヌクレアーゼ機能を欠失させる変異を含むエンドヌクレアーゼドメインとを含む、非LTR RTタンパク質を特徴とする。いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、R2レトロエレメント逆転写酵素(R2 RT)タンパク質である。いくつかの態様において、前記非LTR RTタンパク質は、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、N末端の69~303個のアミノ酸が欠失している。いくつかの態様において、前記非LTR RTタンパク質は、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、N末端の69~274個のアミノ酸が欠失している。いくつかの態様において、前記非LTR RTタンパク質は、N末端領域が切断されていることにより、配列特異的DNA結合ドメインの全体またはその一部が欠失している。いくつかの態様において、前記非LTR RTタンパク質は、N末端領域が切断されていることにより、配列特異的DNA結合ドメインの全体が欠失している。いくつかの態様において、前記非LTR RTタンパク質は、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、N末端の274~303個のアミノ酸が欠失している。いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、配列特異的DNA結合ドメインを含んでいない。いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、節足動物に由来するものである。いくつかの態様において、前記節足動物はカイコガ(Bombyx mori)である。
【0007】
いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、カイコガのR2 RTタンパク質である。
【0008】
いくつかの態様において、エンドヌクレアーゼ機能を欠失させる前記変異は、カイコガのR2 RTタンパク質の全長(配列番号1)のアミノ酸残基D996、D1009またはK1026における置換変異である。いくつかの態様において、前記置換変異は、アミノ酸残基D996における置換変異である。いくつかの態様において、前記アミノ酸残基D996は、グルタミン酸(E)以外のアミノ酸で置換されている。いくつかの態様において、前記置換変異はD996A変異である。いくつかの態様において、前記置換変異は、アミノ酸残基D1009における置換変異である。いくつかの態様において、前記アミノ酸残基D1009は、グルタミン酸(E)以外のアミノ酸で置換されている。いくつかの態様において、前記置換変異は、D1009A変異である。いくつかの態様において、前記置換変異は、アミノ酸残基K1026における置換変異である。いくつかの態様において、前記置換変異は、K1026A変異、K1026D変異またはK1026E変異である。いくつかの態様において、前記置換変異は、K1026A変異である。
【0009】
いくつかの態様において、エンドヌクレアーゼ機能を欠失させる前記変異は、アミノ酸残基K1026およびK1029における置換変異である。いくつかの態様において、前記置換変異は、K1026A変異およびK1029A変異である。
【0010】
いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、安定化タンパク質を含む。いくつかの態様において、前記安定化タンパク質は、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に連結されている。いくつかの態様において、前記安定化タンパク質は、リンカーペプチドを介して前記真核生物由来非LTR RTタンパク質に連結されている。いくつかの態様において、安定化タンパク質は、マルトース結合タンパク質(MBP)またはそのバリアントである。いくつかの態様において、前記安定化タンパク質は、前記真核生物由来非LTR RTタンパク質のN末端に連結されている。
【0011】
いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、精製タグを含む。いくつかの態様において、前記精製タグは、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に連結されている。いくつかの態様において、前記精製タグは、リンカーペプチドを介して前記真核生物由来非LTR RTタンパク質に連結されている。いくつかの態様において、前記精製タグは、ヒスチジンタグ、プロテインAタグまたはFLAGペプチドタグである。いくつかの態様において、前記ヒスチジンタグは、6×ヒスチジンタグである。いくつかの態様において、前記プロテインAタグは、タンデム型のプロテインAタグである。いくつかの態様において、前記FLAGペプチドタグは、3×FLAGペプチドタグである。いくつかの態様において、前記精製タグは、前記真核生物由来非LTR RTタンパク質のC末端に連結されている。いくつかの態様において、前記リンカーペプチドは、切断可能なリンカーである。
【0012】
別の一態様において、本発明は、配列番号2のアミノ酸配列を含む、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質を特徴とする。
【0013】
別の一態様において、本発明は、配列番号3のアミノ酸配列を含む、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質を特徴とする。
【0014】
いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、核酸不純物を実質的に含んでいない。
【0015】
別の一態様において、本発明は、一本鎖核酸または部分的に一本鎖の核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、一本鎖核酸または部分的に一本鎖の核酸を接触させる工程を含む方法を特徴とする。前記マンガンイオンは、通常、前記ポリメラーゼ活性の補助に十分な規定の濃度および/または所定の濃度であり、通常、0.1~10mMの範囲または0.5~5mMの範囲である。いくつかの態様において、前記一本鎖核酸または部分的に一本鎖の核酸はDNAである。いくつかの態様において、前記接触は、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)、レトロウイルス由来の逆転写酵素(RT)タンパク質またはその他の非RTタンパク質の非存在下で行われる。いくつかの態様において、前記一本鎖核酸または部分的に一本鎖の核酸はRNAである。いくつかの態様において、前記接触は、RNAリガーゼ、ポリアデノシンRNAポリメラーゼ、ポリウリジンRNAポリメラーゼまたはその他の非RTタンパク質の非存在下で行われる。
【0016】
別の一態様において、本発明は、A型二本鎖核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、A型二本鎖核酸を接触させる工程を含む方法を特徴とする。いくつかの態様において、前記A型二本鎖核酸は、RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態である。いくつかの態様において、前記RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端は、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む。いくつかの態様において、前記A型二本鎖核酸は、RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態である。いくつかの態様において、前記RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端は、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む。
【0017】
いくつかの態様において、前記非レトロウイルス由来RTタンパク質は、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である。いくつかの態様において、前記非レトロウイルス由来RTタンパク質は、真核生物由来の非LTR RTタンパク質である。いくつかの態様において、前記非レトロウイルス由来のRTタンパク質は、本明細書に記載の一態様による真核生物由来非LTR RTタンパク質である。いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、R2 RTタンパク質である。いくつかの態様において、前記R2 RTタンパク質は、カイコガのR2 RTタンパク質である。いくつかの態様において、前記非レトロウイルス由来RTタンパク質は、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である。いくつかの態様において、前記原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質は、Eubacterium rectaleのグループIIイントロンRTタンパク質である。
【0018】
いくつかの態様において、前記バッファーは、リボヌクレオシド三リン酸(NTP)、デオキシリボヌクレオシド三リン酸(dNTP)、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらのヌクレオチド類似体のうちの1種以上を含む。いくつかの態様において、前記接触は、約4℃~約50℃で行われる。いくつかの態様において、前記接触は、約37℃で行われる。
【0019】
別の一態様において、本発明は、相補的DNA(cDNA)分子を調製する方法であって、
(a)ピリミジンヌクレオチドが1塩基突出した末端を3’末端に含むプライマー鎖と非伸長鎖とを含む二本鎖プライマーを提供する工程;
(b)3’末端にプリンヌクレオチドを含むRNA鋳型を提供する工程;ならびに
(c)前記RNA鋳型に実質的に相補的なcDNA分子の作製に効果的な条件下において、マグネシウムイオンを含むバッファー中で、前記二本鎖プライマーおよび前記RNA鋳型を逆転写酵素(RT)と接触させる工程
を含む方法を特徴とする。
いくつかの態様において、前記バッファーは、1種以上のdNTPまたはそれらの類似体を含む。いくつかの態様において、前記プライマー鎖は、DNAプライマー鎖である。いくつかの態様において、前記プライマー鎖は、5’突出末端を含む。いくつかの態様において、前記プライマー鎖は、その5’末端または内部部位に修飾を含む。いくつかの態様において、前記修飾により、前記プライマー鎖または前記二本鎖プライマーの固相化または精製が可能になっている。いくつかの態様において、前記修飾はビオチンへの結合である。いくつかの態様において、前記プライマー鎖は5’アダプター配列である。いくつかの態様において、前記非伸長鎖は、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む。いくつかの態様において、前記非伸長鎖は、その3’末端に修飾を含む。いくつかの態様において、前記修飾によって3’末端の伸長がブロックされる。いくつかの態様において、前記修飾は、3’末端のC3スペーサーまたは3’末端のモノリン酸である。いくつかの態様において、前記RNA鋳型は、本明細書に記載の一態様による方法によって調製されたものである。いくつかの態様において、前記二本鎖プライマーは、本明細書に記載の一態様による方法によって調製されたものである。いくつかの態様において、前記RTは、真核生物由来非LTR RTタンパク質である。いくつかの態様において、前記真核生物由来非LTR RTタンパク質は、R2 RTタンパク質である。いくつかの態様において、前記R2 RTタンパク質は、カイコガのR2 RTタンパク質である。いくつかの態様において、前記真核生物由来の非LTR RTタンパク質は、本明細書に記載の一態様による真核生物由来非LTR RTタンパク質である。いくつかの態様において、前記RNA鋳型は、その3’末端に、プリン塩基を含むdNTP、NTPもしくはddNTPまたはそれらのヌクレオチド類似体を含む。いくつかの態様において、前記RNA鋳型は、その5’末端に修飾を含む。いくつかの態様において、前記修飾は不可逆的修飾である。いくつかの態様において、前記不可逆的修飾は、5’末端のC6スペーサーまたはビオチンである。いくつかの態様において、前記修飾は可逆的修飾である。いくつかの態様において、前記可逆的修飾は、5’末端のアデニリル化である。いくつかの態様において、前記接触は、3’末端にピリミジンヌクレオチドを含む第2の鋳型の存在下で行われる。いくつかの態様において、第2の鋳型は、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む。いくつかの態様において、第2の鋳型は、その3’末端にピリミジンリボヌクレオチドを含む。いくつかの態様において、第2の鋳型は、3’アダプター配列の相補鎖である。いくつかの態様において、前記接触は、前記5’アダプター配列、前記RNA鋳型に実質的に相補的な配列および前記3’アダプター配列を含むcDNA分子の作製に効果的な条件下で行われる。いくつかの態様において、第2の鋳型は、その5’末端に修飾を含む。いくつかの態様において、前記修飾は不可逆的修飾である。いくつかの態様において、前記不可逆的修飾は、5’末端のC6スペーサーまたはビオチンである。いくつかの態様において、前記修飾は可逆的修飾である。いくつかの態様において、前記可逆的修飾は、5’末端のアデニリル化である。いくつかの態様において、前記接触は、約4℃~約50℃で行われる。いくつかの態様において、前記接触は、約37℃で行われる。いくつかの態様において、前記方法は、単一の容器内で実施される。
【0020】
本明細書に記載の様々な実施形態による1つの特性、いくつかの特性またはすべての特性を組み合わせることによって、本発明による別の実施形態を構成してもよい。当業者であれば、本発明のこれらの態様およびその他の態様を容易に理解することができる。以下の詳細な説明により、本発明のこれらの態様およびその他の態様をさらに説明する。
【図面の簡単な説明】
【0021】
【
図1A】様々な逆転写酵素(RT)タンパク質の高収率な作製を示す。各線の長さは、各組換えRTタンパク質間におけるR2 RTのアミノ酸配列の相対的な長さを示す。各線上に、全長タンパク質における配列特異的DNA結合ドメイン、RNA結合領域、RT領域およびエンドヌクレアーゼドメインを、左側(N末端)から右側(C末端)の方向に示す。
【0022】
【
図1B】本明細書で述べる活性アッセイに使用するための、MBPタグおよび6×ヒスチジンタグを付加した精製RTタンパク質が、タンパク質不純物を含まない適切なものであることがSDS-PAGEおよびクマシー染色により示された。
【0023】
【
図1C】3種のカラムを使用して各タンパク質を精製した際の、回収した細菌の体積あたりの精製収率の代表的な結果を示す。各プロジェクトは別の反復実験を示す。アスタリスクは、バッチ精製法を用いてゲルに結合させた初回工程での収率を示し、これ以降の精製工程はすべて、充填済みの市販カラムを使用して行った。空隙容量(Void volume)画分における280nmと260nmの吸光度比が、最終精製用のゲル濾過カラムで得たモノマーピークをプールしたタンパク質の吸光度比よりも高い場合、核酸の汚染の指標となる。
【0024】
【
図2】MBPタグおよび6×ヒスチジンタグを付加した精製RTタンパク質のプライマー伸長アッセイの結果を示す。精製したRNA鋳型の相補領域にDNAプライマーをアニールし、図に示した酵素と4種のdNTPとともにインキュベートした。各RTタンパク質はいずれも同じモル濃度で使用した。各レーンの「+」および「-」は、変性PAGEおよびSYBR Gold染色を実施する前の、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。鋳型の5’末端まで完全に伸長されたことから、予想されたcDNA産物が得られたことが示され、そのサイズは、鋳型と対になったcDNAの3’末端に、鋳型に依存せずにヌクレオチド(nt)が付加された長さとなった。
【0025】
【
図3】精製RTタンパク質によるプロセッシブかつ連続的な鋳型の複製を分析した結果を示す。使用したプライマーは、チミン(T)が1塩基突出した3’末端を有するDNAプライマーであった。使用した鋳型は、図の上部に示すように、24ntのRNAもしくはDNAまたはRNA-DNA複合体であった(鋳型5’-3’)。使用したRTタンパク質は、図に示すように、EureまたはBomoC(ed)であった(スペースの都合上、BomoC(ed)ではなくBomoCで示す)。図に示すように、0.4μMまたは4μMの2種の濃度で鋳型を使用した。各レーンの「+」および「-」は、変性PAGEおよびSYBR Gold染色を実施する前の、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。RNase Aにより、二本鎖プライマーの非伸長鎖と鋳型を除去する。除去した非伸長鎖と鋳型は、写真に示したDNAプライマーおよび伸長産物の下方のゲル領域に泳動される。「No enz」は、酵素なしのコントロールである。「cDNA」は、単一の鋳型の複製によるプライマー伸長産物を示し、「Concat」は、連続的な鋳型の複製によるプライマー伸長産物を示す。
【0026】
【
図4A】マンガンイオンの存在下における一本鎖RNAの3’末端の伸長を、変性PAGEおよびSYBR Gold染色で分析した結果を示す。各レーンの「+」および「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。「No enz」で示したレーンは、インプットとしてのRNAオリゴヌクレオチドのみを使用した反応である。破線の左側の各ゲルレーンは、エンドヌクレアーゼ活性を不活性化したRTタンパク質であるBomoC(ed)を用いた反応を示し、破線の右側の各ゲルレーンは、エンドヌクレアーゼ活性を不活化する変異を持たないNBomoCを用いた反応を示す。BomoC(ed)を用いた反応では、Mn
2+を含む3’テーリングバッファーを使用した条件下において、NbomoCで一貫して観察された全般的な核酸分解活性は認められず、グアニン四重鎖構造に折りたたまれたグアニンの3’テールを有する産物においても核酸分解活性はそれほど顕著ではなかった。NBoMoCを用いた反応で見られた分解産物は、エンドヌクレアーゼを不活性化する変異を有するNBoMoC(ed)を用いた反応では認められなかった。
【0027】
【
図4B】BomoC(ed)は、Mg
2+の存在下でも非存在下でも、Mn
2+を含む反応においてddATPを利用してRNAの3’末端を伸長することができることを示す。MnCl
2の滴定濃度は、いずれの反応でも0.5mM、1mM、2mMおよび5mMとした。
【0028】
【
図5】Mn
2+の存在下において、鋳型に依存せずにEure RTで一本鎖RNAを伸長し、変性PAGEおよびSYBR Gold染色で分析した画像である。図に示したddNTPを添加した条件または添加しない条件で、様々な種類のヌクレオチド三リン酸の組み合わせ(高濃度(500μM)のdATPまたはdTTPとdCTPの組み合わせを含む)とMn
2+の存在下において、RNAオリゴヌクレオチドを伸長させた。
【0029】
【
図6A】鋳型に依存せずに二本鎖核酸の3’末端を伸長し、変性PAGEおよびSYBR Gold染色で分析した結果を示す。このアッセイではBomoC(ed)酵素を使用した。「No enz」レーンは、インプットとしての二本鎖核酸のみを使用した反応である。各レーンの「+」および「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。Mn
2+を加えた反応において、図に示したヌクレオチドを各500μMの濃度で使用して、平滑末端を有する二本鎖RNA(dsRNA)または二本鎖DNA(dsDNA)を伸長した。dsRNAを使用したレーンのうち、「dTTP」レーンに見られる高分子量産物は、アーチファクトであり、再現性は見られなかった。
【0030】
【
図6B】図に示すように、Mg
2+またはMn
2+を含むバッファー中で、各500μMの4種のdNTPまたはdATPのみを加えて、平滑末端を有する二本鎖RNA(dsRNA)を伸長したことを示す。
【0031】
【
図7A】鋳型に依存せずにBomoC(ed)で一本鎖DNAを伸長し、変性PAGEおよびSYBR Gold染色で分析した結果を示す。「No enz」レーンは、インプットとしてのDNAのみを使用した反応である。(A)図に示すように、Mg
2+またはMn
2+を含むバッファー中で、各500μMの4種のdNTPまたはdATPのみを加えて、DNAオリゴヌクレオチドを伸長したことを示す。
【0032】
【
図7B】図に示すように、Mn
2+および様々なヌクレオチドの存在下でDNAオリゴヌクレオチドを伸長したことを示す。
【0033】
【
図8】鋳型に依存せずにEure RTで一本鎖DNAを伸長したこと示す画像である。図に示すように、Mg
2+またはMn
2+を含むバッファー中で、各500μMの4種のdNTPまたはdATPのみを加えてDNAオリゴヌクレオチドを伸長したことを示す。「No enz」レーンは、インプットとしてのDNAのみを使用した反応である。4種のdNTPを加えたMg
2+含有バッファー中において検出された伸長産物の大部分は、オリゴヌクレオチドが別のオリゴヌクレオチドの3’末端にプライミングしたことによる非特異的なcDNA合成を示している。
【0034】
【
図9】BomoC(ed)を使用した連続的な鋳型の複製によるcDNAのコンカテマー化を、変性PAGEおよびSYBR Gold染色で分析した結果を示す。この反応は、二本鎖プライマー、高濃度の1種のdNTP、およびこの高濃度dNTPに相補的な3’末端を有する鋳型を含んでいた。同じdNTP濃度での反応に使用した鋳型は、3’末端にCを有するものであった。「単一の鋳型のcDNA」は、単一の鋳型の複製により伸長されたプライマーであり、「コンカテマー」は、複数の鋳型分子の複製産物である。鋳型に依存せずに2~4個のヌクレオチドが付加されることによってプライマーが伸長されると、プライマーのプライミングによるcDNA合成が不活性化されるため、40ntのマーカーの直下に、この伸長産物が泳動される。「+」で示したレーンは、伸長産物の変性後にRNase Aを添加したレーンを示し、RNase Aの添加により、二本鎖プライマーの非伸長鎖および鋳型を除去した。
【0035】
【
図10】Mg
2+を含むがMn
2+を含まないcDNA合成反応における二本鎖プライマーのDNAプライマー鎖への3’末端テーリングを、変性PAGEおよびSYBR Gold染色で分析した結果を示す。この反応は、平滑末端を有する二本鎖プライマー(左側)またはチミン(T)が1塩基突出した末端を有する二本鎖プライマー(右側)と、図に示した濃度の各dNTPを含んでいた。各反応は、250μMまたは2.5μMの4種のdNTPの混合物を含み、一部の反応では500μMの各dNTPをさらに添加した。また、各反応は、BomoC(ed)(スペースの都合上、BoMoで示す)またはEure RTを含んでいた。「No enz」レーンでは、1本のDNA鎖と1本のRNA鎖からなる二本鎖プライマーをインプットとして使用し、このRNA鎖は、3’末端の伸長がブロックされている。各レーンの「+」および「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。特に、BomoC(ed)では、4種のdNTPを用いた反応において、プライマー鎖上のチミン(T)が1塩基突出した(より一般的にはピリミジンが1塩基突出した)末端によって、鋳型に依存しないヌクレオチドの付加が抑制されている。これは、破線で囲んだ枠内の伸長産物を、それぞれに対応する「No enz」+RNase反応(インプットとしてのプライマー鎖のみの泳動を示すマーカー)と比較することによって確認することができる。平滑末端を有するプライマーには、数個のヌクレオチドが付加されているが、チミン(T)が1塩基突出した末端を有するプライマーではほとんど変化は見られない。インプットとしての各種プライマーを示した欄の下の、破線で囲んだ枠の下部にこの結果を図示する。
【0036】
【
図11】1回目の鋳型の受け渡しにおけるユニークな特異性の発揮を示す。4種のdNTPの存在下において、チミン(T)が1塩基突出した末端を有する二本鎖プライマーと、3’末端にAまたはGを有する鋳型を使用して、BomoC(ed)を分析した。変性PAGEおよびSYBR Gold染色で伸長産物を分析した。左側のマーカーレーンのすぐ隣のレーンは、酵素を添加していないレーンである。各レーンの「+」および「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示し、RNase Aの添加により、二本鎖プライマーの非伸長鎖および鋳型を除去した。3’末端にAを有する鋳型のみをcDNAの合成に使用した。
【0037】
【
図12】順序だった鋳型の受け渡しによるcDNAの複製後、cDNA 3’アダプター付き鋳型に対して5’ブロック基を使用することにより合成を停止させたことを示す。チミン(T)が1塩基突出した末端を有する35ntの二本鎖プライマー400nM、3’末端にアデニン(A)リボヌクレオチドまたはddAを有する27ntのRNAオリゴヌクレオチド鋳型200nM、3’末端にシトシン(C)を有する23ntのcDNA 3’アダプター付き鋳型、4種のdNTP(各250μM)およびBomoC(ed)を含む反応から得た伸長産物を、変性PAGEおよびSYBR Gold染色で分析した。cDNAの合成を停止させるための5’ブロック基(amino modifier C6、IDT社)の有無においてのみ異なる2種の3’アダプター付き鋳型配列を試験した。いずれの3’アダプター付き鋳型も2種の濃度で使用した(1倍の濃度として400nMおよび5倍の濃度として2000nM)。「No enz」レーンは、3’末端の伸長がブロックされた非伸長RNA鎖を有する二本鎖プライマー鎖の泳動を示す。各レーンの「+」および「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合をそれぞれ示す。RNase Aにより、二本鎖プライマーの非伸長鎖と鋳型を除去し、除去した非伸長鎖と鋳型は、写真に示したDNAプライマーおよび伸長産物の下方のゲル領域に泳動される。3’Aまたは3’ddAが付加された単一の鋳型からのプライマー伸長産物は「cDNA」で示した位置に泳動され、3’アダプターが付加された単一の鋳型からのcDNA伸長産物は「cDNA+RNAアダプター」の位置に泳動され、さらに長い伸長産物は3’アダプター付き鋳型から合成されたタンデムリピートを有する。
【0038】
【
図13A-13B】ほぼ無作為な鋳型のジャンピングと、順序だった鋳型の受け渡しを区別して示した、特異性の原理と結果を示す一連の概略図である。
図13Bにおいて、順序だった鋳型の受け渡しの第1の工程では、鋳型プールの鋳型分子に対してcDNAの合成が開始される(1つの鋳型の受け渡し=cDNAeasi)。次に、第2の工程では、cDNAの3’末端をプライマーとして使用して、3’アダプターが付加された鋳型分子が複製される(2つの鋳型の受け渡し=cDNAdeca)。
【0039】
【
図14A】イルミナ社の次世代シーケンシング(NGS)アダプター配列を使用した、順序だった鋳型の受け渡しによるcDNAの合成を示す。BomoC(ed)、チミン(T)が1塩基突出した3’末端を有するプライマー、および鋳型の受け渡しによる合成を停止させるための5’末端のブロック基と3’末端のシトシン(C)を有するアダプター付き鋳型を含む反応から得られた伸長産物を、変性PAGEおよびSYBR Gold染色で分析した。使用した鋳型は、3’ddAが付加されたユニークな配列のRNAオリゴヌクレオチドであった。各レーンの「-」および「+」は、伸長産物の変性後にRNase Aを添加しなかった場合とRNase Aを添加した場合をそれぞれ示し、RNase Aの添加により、二本鎖プライマーの非伸長鎖および鋳型を除去した。「No enz」は、酵素なしのコントロールである。「鋳型の末端」は、反応で使用したcDNA 3’アダプター付き鋳型を示し、「--」は、アダプターを付加していない鋳型を示し、「最適化」は、ランダムな配列を示し、「汎用」は、イルミナ社のリード1を含む約35ntのプライマーを示し、「全長」は、P5とバーコードi5とリード1から構成されたイルミナ社の約70ntのNGSアダプターの全長を示す。約35ntの汎用cDNA 5’アダプター付きプライマー(リード2の相補鎖を含む)を使用して、順序だった鋳型の受け渡しによるcDNAの合成が実証された。
【0040】
【
図14B】約70ntのcDNA 5’アダプター付きプライマー(P7とバーコードi7とリード2の相補鎖を含む)を使用して、順序だった鋳型の受け渡しによるcDNAの合成が実証されたことを示す。単一の鋳型からのプライマー伸長産物は「cDNA」で示した位置に泳動され、3’アダプターが付加された単一の鋳型からのcDNA伸長産物は「cDNA+終止アダプター」の位置に泳動される。
【0041】
【
図15A】順序だった鋳型の受け渡しにより合成し、PCRを行っていないcDNAライブラリーを示す。このライブラリーは、チミン(T)が1塩基突出した末端を有し、約70ntのcDNA 5’アダプター付きプライマーと、3’末端のCと5’末端のcDNA合成ブロック基を有し、約70ntのcDNA 3’アダプター付き鋳型を使用して作製されたものである。この概略図は、部分的に二本鎖構造をとったプライマー(プライマー鎖は、イルミナ社のNGSアダプターP7(i7)R2の相補鎖である)とアダプター付き鋳型(イルミナ社のNGSアダプターP5(i5)R2センス鎖)のそれぞれに含まれる各オリゴヌクレオチドを示す。順序だった鋳型の受け渡しのワークフローにおいて、鋳型RNAプールに3’ddAテール(アスタリスク(*)で示す)が付加された。
【0042】
【
図15B】963種のmiRNA配列の等モル混合物(miRXplore)を鋳型RNAプールとして使用した反応産物を、変性PAGEおよびSYBR Gold染色で分析した結果を示す。全長cDNAライブラリー(標識cDNA+アダプター付き鋳型)と、miRNA鋳型のみから複製されたcDNA産物(標識cDNA)が反応産物の大半を占めている。過剰であったアダプター付きプライマーおよびアダプター付き鋳型の染色も認められる。「No enz」は、酵素なしのコントロールである。各レーンの「+」または「-」は、伸長産物の変性後にRNase Aを添加した場合と添加しなかった場合を示し、RNase Aの添加により、二本鎖プライマーの非伸長鎖を除去し、約70ntの3’アダプター付き鋳型を切断した。このライブラリーをシーケンシングし、少ないサイクル数でPCRを行ったライブラリーと比較し、その結果を
図16Bに示した。
【0043】
【
図16A】順序だった鋳型の受け渡しにより合成した後、少ないサイクル数でPCRを行ったcDNAライブラリーを示す。この概略図は、チミン(T)が1塩基突出した約35ntのcDNA 5’アダプター付きプライマー(cR2で示すプライマー=イルミナ社のリード2の相補鎖)と、3’末端のCと5’末端のcDNA合成ブロック基を有する約35ntのcDNA 3’アダプター付き鋳型(R1で示すアダプター付き鋳型=イルミナ社のリード1;5’末端ブロック基=黒丸)を使用したことを示す。鋳型プールを細い線で示す。この鋳型には、アスタリスクで示す3’ddAが付加されている。矢尻はcDNAの5’末端から3’末端の方向を示す(上の鎖)。これに続くPCR工程では、インデックス用の(i)バーコードとP5配列およびP7配列が組み込まれる。
【0044】
【
図16B】963種のmiRNA配列の等モル混合物(miRXplore標準品)の各リードカウントを示す。少ないサイクル数でPCRを行ったPCRライブラリー(dsDNA、Y軸;8サイクルでのPCR)と、PCRを行っていないライブラリー(ssDNA、X軸)をシーケンシングし、得られた相対的リードカウントのlog2値からこれらのライブラリーを比較した。黒色のドットは各miRNAを示す。PCRを行っていないライブラリーのlog2値において、見かけ上ゼロを示したmiRNA値が1つ観察されるが、これは正確にはゼロではない。両方法における結果が一致した場合、実際のデータにフィットさせた直線上にドットがプロットされる。
【発明を実施するための形態】
【0045】
序論
本発明は、不連続な複数の鋳型からの順序だった連続的な相補的DNA(cDNA)の合成と、レトロウイルス由来ではない逆転写酵素(RT)タンパク質の非天然ターミナルトランスフェラーゼ活性を含む、制御下での核酸合成用の組成物および制御下で核酸を合成する方法を特徴とする。本発明の方法は、分割工程や固相化工程を必要とすることなく、単一の容器内で行うことができることは重要である。
【0046】
用語の定義
本発明について詳細に説明する前に述べておくが、本発明は特定の組成物や生物系には限定されず、当然のことながら、本発明の組成物または生物系は様々な態様を取りうる。さらに、本明細書中で使用される用語は、特定の実施形態を説明する目的で使用されるにとどまり、これらの用語は、本発明を何ら限定するものではない。
【0047】
本明細書および添付の請求項において使用されているように、単数形の「a」、「an」および「the」は、別段の明確な記載がない限り、複数のものを含む。したがって、たとえば、「分子」について言及する場合、この分子は、2つ以上の分子の組み合わせなどを含んでいてもよい。
【0048】
本明細書において、「約」は、当業者であれば容易に理解できるように、各数値に通常付随する誤差範囲を指す。本明細書において、「約」という用語が付加された数値またはパラメータは、その数値自体またはそのパラメータ自体に関する実施形態を含む(さらに、このような実施形態について述べるものである)。
【0049】
本明細書において、「A型」は、通常の細胞条件および生理学的バッファー条件下ではB型構造を取るDNAのみで構成された核酸二本鎖の構造と区別可能な、RNAの特性を少なくともある程度含む核酸二本鎖構造(通常、RNA-RNA二本鎖またはRNA-DNA二本鎖)を指す。DNA-DNA二本鎖は、ある特定の環境下や特定のタンパク質が結合した場合にA型の構造を取ることがあるが、RNA鎖を含む二本鎖では、リボース糖にヒドロキシル基が余分に含まれていることによる妨害によりB型の構造を取ることはない。
【0050】
本明細書において、「増幅」は、概して、所望の配列の複数のコピーを作製するプロセスを指す。「複数のコピー」とは、少なくとも2つのコピーを意味する。「コピー」は、必ずしも、鋳型配列との完全な配列相補性や完全な同一性を意味するわけではない。たとえば、コピーは、デオキシイノシンなどのヌクレオチド類似体、人為的な配列の変化(鋳型とハイブリダイズ可能であるが相補的ではない配列を含むプライマーによって導入された配列の変化など)、および/または増幅中に生じる配列エラーを含みうる。
【0051】
本明細書および請求項を通して、「含む(comprise)」という用語ならびにこの変化形である「含む(comprises)」および「含んでいる(comprising)」という用語は、記載の要素または工程を包含するが、記載されているもの以外の要素または工程を除外するものではない。
【0052】
本明細書において、「コグネイト」は、核酸二本鎖の標準的な形状と一致する塩基対を形成することができる塩基が存在することを示す。
【0053】
「容器」は、頂部、底部および側面を備えた成形物を意味し、その頂部には、液体試料、気体試料および/または固体試料(たとえば反応混合物)を収容可能な内部にアクセスするための開口を備える。いくつかの実施形態において、容器は、開けることが可能な上面(たとえば、蓋、カバーまたはキャップ)を有していてもよい。いくつかの実施形態において、容器は、試験管(たとえば、ポリプロピレン製の試験管)である。
【0054】
本明細書において、「酵素」は、生化学的反応を触媒することが可能な、細胞により産生されるタンパク質を含む。さらに、本明細書において、「酵素」は、別段の記載がない限り、元の酵素の触媒活性を保持するタンパク質断片を含み、元の酵素の触媒活性を保持するように合成された人工酵素を含んでいてもよい。
【0055】
本明細書において開示される様々な逆転写酵素(RT)タンパク質またはその断片について述べる際に使用される「単離された」という用語は、タンパク質が発現された細胞または細胞培養から同定、分離かつ/または回収されたタンパク質を意味する。発現環境からの不純物(たとえば核酸不純物)は、単離されたタンパク質中に残存する物質であり、一般に、単離されたタンパク質の使用を妨害する可能性がある。いくつかの態様において、このようなタンパク質は、たとえば、少なくとも1つの精製工程により、実質的に均質となるまで精製される。
【0056】
本明細書において、「連結した」または「連結」は、第1のタンパク質と第2のタンパク質の間または第1のポリペプチドと第2のポリペプチドの間のペプチド結合による直接結合を意味するか、あるいは、第1のタンパク質と第2のタンパク質の間または第1のポリペプチドと第2のポリペプチドの間に位置し、これらのタンパク質またはポリペプチドを連結する第3のアミノ酸配列を含む結合を意味する。たとえば、アミノ酸は、特定のタンパク質またはポリペプチドのC末端と、別のタンパク質またはポリペプチドのN末端とを連結してもよい。
【0057】
本明細書において、「リンカー」は、2アミノ酸長以上の長さのアミノ酸配列を意味する。リンカーは、中性アミノ酸、極性アミノ酸、非極性アミノ酸のいずれからなっていてもよい。リンカーは、たとえば2~100アミノ酸長であってもよく、たとえば2~50アミノ酸長であってもよく、たとえば3アミノ酸長、5アミノ酸長、10アミノ酸長、15アミノ酸長、20アミノ酸長、25アミノ酸長、30アミノ酸長、35アミノ酸長、40アミノ酸長、45アミノ酸長または50アミノ酸長であってもよい。リンカーは、たとえば、物理的に別の薬剤またはリンカー自体による酵素的切断または化学的切断を介して「切断可能」であってもよい。アミノ酸配列中の切断部位、ならびにこのような切断部位で切断する酵素および化学物質は、当技術分野でよく知られており、本明細書にも記載されている。いくつかの態様において、リンカーは、ペプチド結合を介して特定の分子と別の分子を共有結合する。いくつかの態様において、リンカーは、Smyth et al. Protein Science. 12: 1313-1322, 2003で述べられているように、隣接するタンパク質またはポリペプチドの折り畳みを促進する領域である。
【0058】
「添付文書」は、キットなどの製品の商品用包装に通常含まれている説明書を指し、このような製品の使用法に関する情報を含んでいる。
【0059】
本明細書において、「逆転写酵素」すなわち「RT」は、変異を加えていないインタクトな状態で、RNA鋳型とコグネイトなデオキシヌクレオシド三リン酸(dNTP)の重合を触媒することができるポリメラーゼタンパク質を指す。様々なRTが、DNAを鋳型として使用することができる。いくつかの種類のRTは、進化の過程で不活性な形態に退化しているが、活性なRTと区別可能な系統発生関係を有する。RTは、RNAを鋳型として使用した相補的DNA(cDNA)の合成などに使用され、得られたcDNAは、別の工程でベクターにクローニングしてさらなる操作を行ったり、あるいはポリメラーゼ連鎖反応(PCR)、等温増幅(たとえばnucleic acid sequence-based amplification(NASBA))、transcription-mediated amplification(TMA)、self-sustained sequence replication(3SR)などの様々な増幅方法において使用される。RTによるcDNAの合成は、様々なプライマー伸長反応プロトコル、rapid amplification of cDNA ends(RACE)、化学修飾の検出、ならびにRNA鋳型および/または時としてDNA鋳型からのcDNAの読み取りが有益なその他の技術に利用される。
【0060】
本明細書において、「イントロンRTタンパク質」または「細菌由来イントロンRTタンパク質」は、イントロン内にコードされている天然のRTタンパク質(iRT)を指し、このRTタンパク質は、通常、原核細胞または真核細胞の細胞小器官に見出され、特定の細菌の種類に限定されないが、細菌類において最もよく特徴付けられている。
【0061】
本明細書において、「長い末端反復配列を持たない逆転写酵素タンパク質」または「非LTR RTタンパク質」は、真核生物由来非LTRレトロトランスポゾンによってコードされ、DNAポリメラーゼ活性を有する天然タンパク質およびそのポリペプチド断片を指し、さらに、RT活性(たとえば特異的な活性)および/または精製収率が保持または増強される1つ以上のアミノ酸の置換、付加または欠失を含む、前記タンパク質またはポリペプチド断片に由来するポリペプチドバリアントを指す。好ましい非LTR RTタンパク質としては、R2タンパク質、R2関連タンパク質、R2様タンパク質、レトロエレメントRT(R2 RT)タンパク質が挙げられる。したがって、本明細書において、「R2 RTタンパク質」または「R2 RTポリペプチド」は、R2エレメントによってコードされる天然のタンパク質、またはインタクトなRTタンパク質の特性のうちのいくつかを有するそのポリペプチド断片を指し、さらに、望ましい特性または活性(たとえば特異的な活性)および/または精製収率が保持または増強される1つ以上のアミノ酸の置換、付加または欠失を含む、前記タンパク質またはポリペプチド断片に由来するポリペプチドバリアントを指す。R2 RTタンパク質のバリアントは、たとえば、RT活性および/またはターミナルトランスフェラーゼ活性が保持または増強される1つ以上のアミノ酸の置換、付加または欠失を含んでいてもよい。いくつかの態様において、R2 RTタンパク質は、節足動物由来のR2 RTタンパク質であり、たとえば、カイコガ(Bombyx mori)のR2 RTタンパク質(たとえばカイコガのR2 RTタンパク質の全長(配列番号1)と比較して、カイコガR2 RTタンパク質のN末端の70~303個のアミノ酸が欠失(たとえば70~274個のアミノ酸が欠失、かつ/または274~303個のアミノ酸が欠失)したことによって、N末端領域が切断されたカイコガのR2 RTタンパク質)、RNA結合ドメイン、RTドメイン、およびエンドヌクレアーゼドメインが挙げられ、該エンドヌクレアーゼドメインは、エンドヌクレアーゼ機能を欠失させる変異(たとえば、カイコガのR2 RTの全長(配列番号1)のアミノ酸残基D996、D1009、またはK1026とK1029における置換変異(たとえばD996A変異))を含む。
【0062】
本明細書において、「非レトロウイルス由来逆転写酵素タンパク質」または「非レトロウイルス由来RTタンパク質」は、細胞ゲノム内で進化したRTタンパク質およびRT関連タンパク質を含み、該RTタンパク質およびRT関連タンパク質は、非LTR RTタンパク質、および細菌または細胞小器官のイントロンRT(iRT)タンパク質を含むが、レトロウイルスゲノムにおいて進化したRTは含まない。通常のレトロウイルス由来RTとは異なり、細胞内RTのいくつかは、合成の開始に、プライマーと鋳型の広範な塩基対形成を必要としない。非レトロウイルス由来RTタンパク質の例としては、非LTR RTタンパク質、テロメラーゼ、およびグループIIの自己スプライシングイントロンiRTが挙げられる。さらに、細菌由来RTタンパク質は、Simon and Zimmerly. Nucleic Acids Res. 36(22):7219-7229, 2008およびKojima and Kanehisa. Mol Biol Evol. 25:1395-1404, 2008において報告されており、これらの文献では、非レトロウイルス由来逆転写酵素には、前記以外にも様々な種類のもの(すなわち、レトロンのRTおよび多様性を生じるレトロエレメントのRTなど)があることが記載されている。
【0063】
本明細書において、「ポリメラーゼ連鎖反応」すなわち「PCR」技術は、たとえば、米国特許第4683195号に記載されているように、一般に、微量の核酸(RNAおよび/またはDNA)の特定の部位を増幅する操作を指す。一般に、オリゴヌクレオチドプライマーを設計できるように、目的の領域の両末端またはそれ以上の配列情報が利用可能である必要があり、これらのプライマーは、増幅される鋳型の逆鎖と配列が同一または類似の配列を有する。2つのプライマーの5’末端ヌクレオチドは、増幅された材料の末端と一致してもよい。PCRを使用して、特定のRNA配列、ゲノムDNA全体から得た特定のDNA配列、および細胞内RNA、バクテリオファージまたはプラスミド配列から転写されたcDNAなどを増幅することができる。概要については、Mullis et al., Cold Spring Harbor Symp. Quant. Biol. 51:263 (1987)およびErlich, ed., PCR Technology, (Stockton Press, NY, 1989)を参照されたい。本明細書において、PCRは、核酸からなる試験試料を増幅するための核酸ポリメラーゼ反応法の単に一例であると考えられ、公知の核酸(DNAまたはRNA)をプライマーとして使用し、核酸ポリメラーゼを利用して、核酸の特定の部位を増幅または形成したり、特定の核酸に相補的な核酸の特定の部位を増幅または形成するものである。
【0064】
「ポリヌクレオチド」および「核酸」という用語は、本明細書において同じ意味で使用され、任意の長さのヌクレオチドポリマー(たとえば、少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、50個、100個、150個、200個、250個、500個、1000個またはそれ以上の個数のヌクレオチドからなるヌクレオチドポリマー)を指し、DNAおよびRNA、またはそれらの断片もしくは類似体を含む。ヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチド、修飾ヌクレオチドもしくは塩基、および/またはそれらの類似体であってもよく、あるいはDNAポリメラーゼもしくはRNAポリメラーゼ、もしくは機能的に活性なポリメラーゼドメイン、または合成反応により、ポリマーに組み込むことができる任意の基質であってもよい。ポリヌクレオチドの例として、遺伝子または遺伝子断片のコード領域または非コード領域、連鎖解析により決定された遺伝子座、エキソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、トランスファーメッセンジャーRNA、リボソームRNA、アンチセンスRNA、核内低分子RNA(snRNA)、核小体低分子RNA(snoRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、リボザイム、cDNA、組換えポリヌクレオチド、オープンリーディングフレーム(ORF)、分岐ポリヌクレオチド、プラスミド、ベクター、単離された任意の配列のDNA、単離された任意の配列のRNA、核酸プローブおよびプライマーが挙げられるが、これらに限定されない。
【0065】
前述のように、ポリヌクレオチドは、メチル化ヌクレオチドやヌクレオチド類似体などの修飾ヌクレオチドを含んでいてもよい。ポリヌクレオチドに修飾を加える場合、ヌクレオチドポリマーの構築前またはその後に、ヌクレオチド構造に修飾を加えてもよい。また、ヌクレオチド配列にヌクレオチド以外の成分を挿入してもよい。ポリヌクレオチドの合成/重合後に、標識を結合させることなどによってポリヌクレオチドをさらに修飾してもよい。その他の種類の修飾として、たとえば、類似体による1つ以上の天然のヌクレオチドの置換である「キャップ」;たとえば、自然界には見出されない結合などによるヌクレオチド間の修飾(たとえば、メチルホスホネート、ホスホトリエステル、ホスホアミデート、カルバメート、ホスホロチオエート、ホスホロジチオエートなど);たとえば、ポリペプチド(たとえば、ヌクレアーゼ、毒素、抗体、シグナルペプチド、ポリ-L-リジンなど)からなる部分をぶら下げたヌクレオチド;インターカレーター(たとえば、アクリジンやソラレンなど)を有するヌクレオチド;および非修飾形態のポリヌクレオチドが挙げられる。さらに、糖部分に通常存在するヒドロキシル基のいずれかを、たとえばホスホン酸基またはリン酸基で置換したり、標準的な保護基で保護したり、活性化することにより別のヌクレオチドに別の結合を付加したり、固体支持体または半固体支持体に結合させたりすることができる。5’末端および3’末端のOH基は、リン酸化することができ、あるいはアミンまたは1~20個もしくはそれ以上の炭素数の有機キャッピング基部分で置換することができる。また、その他のヒドロキシル基も、標準的な保護基で誘導体化してもよい。さらに、ポリヌクレオチドは、当技術分野で一般に知られている、リボース糖またはデオキシリボース糖の類似体を含んでいてもよく、このようなリボース糖またはデオキシリボース糖の類似体として、たとえば、2’-O-メチル-、2’-O-アリル、2’-フルオロ-または2’-アジド-リボース;炭素環式糖類似体;αアノマー糖;アラビノース、キシロース、ピラノース糖、フラノース糖などのエピマー糖;および非環式類似体が挙げられる。
【0066】
本明細書に記載の核酸は、ホスホジエステル結合を含んでいてもよいが、「核酸」という用語は、その他の種類の結合または骨格を有する核酸類似体(たとえば、ホスホルアミド、ホスホロチオエート、ホスホロジチオエート、O-メチルホスホロアミデート、モルホリノ、ロックド核酸(LNA)、グリセロール核酸(GNA)、トレオース核酸(TNA)、およびペプチド核酸(PNA)を含む結合または骨格などを有する核酸類似体)も包含する。いくつかの実施形態において、前記核酸は、DNA(たとえば、ゲノムDNA、ミトコンドリアDNA、cDNA、セルフリーDNA(cfDNA)、古代DNA、ホルムアルデヒド固定パラフィン包埋(FFPE)組織試料またはFFPE細胞から得た損傷DNA、このようなDNAの断片など)、RNA(たとえば、mRNA、rRNA、tRNA、miRNA、セルフリーRNA(cfRNA)、およびFFPE組織試料またはFFPE細胞から得たRNA、このようなRNAの断片など)またはハイブリッド(「キメラ」とも呼ぶ)であってもよく、これらの核酸は、デオキシリボヌクレオチドとリボヌクレオチドの任意の組み合わせを含み、ウラシル、アデニン、チミン、シトシン、グアニン、イノシン、修飾塩基または非標準塩基(たとえば、ヒポキサンチン、キサンチン、7-メチルグアニン、5,6-ジヒドロウラシル、5-メチルシトシン、5-ヒドロキシメチルシトシンなど)などの塩基の任意の組み合わせを含む。ポリヌクレオチドは、単一の核酸および複数の核酸を包含する。ポリヌクレオチドは、ポリリボヌクレオチドで構成されていてもよく、ポリデオキシリボヌクレオチドで構成されていてもよく、これらのポリリボヌクレオチドおよびポリデオキシリボヌクレオチドは、非修飾RNA、非修飾DNA、修飾RNAおよび修飾DNAのいずれであってもよい。たとえば、ポリヌクレオチドは、一本鎖DNA;二本鎖DNA;一本鎖領域と二本鎖領域の混合物であるDNA;一本鎖RNA;二本鎖RNA;一本鎖領域と二本鎖領域の混合物であるRNA;または一本鎖、より典型的には二本鎖、もしくは一本鎖領域と二本鎖領域の混合物であってもよいDNAおよびRNAを含むハイブリッド分子で構成されていてもよい。前述の説明は、本明細書で述べるすべてのポリヌクレオチド(RNAおよびDNAを含む)に適用される。
【0067】
「ポリペプチド」または「タンパク質」は、少なくとも2アミノ酸長(たとえば、5アミノ酸長、10アミノ酸長、20アミノ酸長、30アミノ酸長、40アミノ酸長、50アミノ酸長、60アミノ酸長、70アミノ酸長、80アミノ酸長、90アミノ酸長、100アミノ酸長、125アミノ酸長、150アミノ酸長、175アミノ酸長、200アミノ酸長、225アミノ酸長、250アミノ酸長、275アミノ酸長、300アミノ酸長、325アミノ酸長、350アミノ酸長、375アミノ酸長、400アミノ酸長、425アミノ酸長、450アミノ酸長、475アミノ酸長、500アミノ酸長、525アミノ酸長、550アミノ酸長、575アミノ酸長、600アミノ酸長、700アミノ酸長、800アミノ酸長またはそれ以上)のアミノ酸からなる天然アミノ酸鎖または合成アミノ酸鎖を意味し、酵素または化学物質による天然の修飾または誘導された修飾(たとえばグリコシル化やリン酸化など)を有するものを含む。
【0068】
「一部」または「断片」は、全体の一部を意味する。一部は、ポリヌクレオチドの全長またはポリペプチド配列領域の全長の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%を含んでいてもよい。ポリヌクレオチドの場合、その一部は、たとえば、参照ポリヌクレオチド分子の、少なくとも5個、6個、7個、8個、9個、10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、200個、300個、400個、500個、600個、700個、800個、900個、1000個、2000個、またはそれ以上の個数の連続するヌクレオチドを含んでいてもよい。ポリペプチドの場合、その一部は、たとえば、参照ポリペプチド分子の、少なくとも3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、25個、50個、75個、90個、100個、125個、150個、175個、200個、225個、250個、275個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、またはそれ以上の個数の連続するアミノ酸を含んでいてもよい。所定のタンパク質の切断型バリアント(たとえば切断型領域を有する非LTR RTタンパク質)に関して、当該タンパク質のN末端および/またはC末端が切断されていてもよく、これにより、同じタンパク質の全長(たとえば非LTR RTタンパク質の全長)と比較して、対応する一方の末端または両末端の1つ以上の連続するアミノ酸が欠失している。たとえば、N末端が切断されていることにより、前記タンパク質の全長から1~4個、1~10個、1~200個、1~250個または1~500個のアミノ酸が欠失しているか、これらの中間の個数のアミノ酸が欠失しているか、これらよりも多くの個数のアミノ酸が欠失している。
【0069】
「配列同一性」または「配列相同性」は、2つ以上のアミノ酸配列または2つ以上のヌクレオチド配列の間における同一性または相同性が、これらの配列間の同一性または相同性として表されることを意味する。配列同一性は、「同一性の割合(%)」として測定することができ、このパーセンテージが高いほど、配列間での同一性がより高いことを意味する。配列相同性は、(保存的アミノ酸置換を考慮に入れた)相同性の割合(%)として測定することができ、このパーセンテージが高いほど、配列間での相同性がより高いことを意味する。核酸配列またはアミノ酸配列のホモログまたはオーソログは、標準的な方法を使用してアラインした場合に、比較的高い配列同一性/相同性を有する。配列間のアラインメントは、当業者に公知の様々な方法で最適化することができ、たとえば、Smith Watermanアラインメント用アルゴリズム(Smith et al. J. Mol. Biol. 147:195-7, 1981)およびBLAST(Basic Local Alignment Search Tool; Altschul et al. J. Mol. Biol. 215: 403-10, 1990)を使用して行うことができる。このようなアライメント用アルゴリズムおよびその他のアルゴリズムは、公的に入手可能なコンピュータソフトウェアを使用して利用することができ、このようなソフトウェアとして、たとえば、GENEMATCHER PLUS(商標)(Schwarz and Dayhof, Atlas of Protein Sequence and Structure, Dayhoff, M.O., Ed pp 353-358, 1979)に組み込まれた「Best Fit」(Smith and Waterman, Advances in Applied Mathematics, 482-489, 1981)や、BLAST、BLAST-2、BLAST-P、BLAST-N、BLAST-X、WU-BLAST-2、ALIGN、ALIGN-2、CLUSTALまたはMegalign(DNASTAR社)が挙げられる。さらに、当業者であれば、アラインメントの測定に適切なパラメータを決定することができ、このようなパラメータとして、比較する複数の配列の全長に対するアラインメントの最適化に必要なアルゴリズムなどが挙げられる。ポリペプチドの場合、比較する配列の長さは、通常、少なくとも5アミノ酸長であってもよく、好ましくは、10アミノ酸長、20アミノ酸長、30アミノ酸長、40アミノ酸長、50アミノ酸長、60アミノ酸長、70アミノ酸長、80アミノ酸長、90アミノ酸長、100アミノ酸長、125アミノ酸長、150アミノ酸長、175アミノ酸長、200アミノ酸長、250アミノ酸長、300アミノ酸長、400アミノ酸長、500アミノ酸長、600アミノ酸長、700アミノ酸長、800アミノ酸長またはそれ以上であり、最大でポリペプチドの全長である。核酸の場合、比較する配列の長さは、通常、少なくとも10ヌクレオチド長、20ヌクレオチド長、30ヌクレオチド長、40ヌクレオチド長、50ヌクレオチド長、60ヌクレオチド長、70ヌクレオチド長、80ヌクレオチド長、90ヌクレオチド長、100ヌクレオチド長、125ヌクレオチド長、150ヌクレオチド長、175ヌクレオチド長、200ヌクレオチド長、250ヌクレオチド長、300ヌクレオチド長、400ヌクレオチド長、500ヌクレオチド長、600ヌクレオチド長、700ヌクレオチド長、800ヌクレオチド長、900ヌクレオチド長、1000ヌクレオチド長、1100ヌクレオチド長、1200ヌクレオチド長、1300ヌクレオチド長、1400ヌクレオチド長、1500ヌクレオチド長、1600ヌクレオチド長、1700ヌクレオチド長、1800ヌクレオチド長、1900ヌクレオチド長、2000ヌクレオチド長、2100ヌクレオチド長、2200ヌクレオチド長、2300ヌクレオチド長、2400ヌクレオチド長もしくはそれ以上であってもよく、または最大で核酸分子の全長であってもよい。配列同一性を決定する目的でDNA配列とRNA配列を比較する場合、チミジンヌクレオチド(T)はウリジンヌクレオチド(U)と同一であると解釈する。その他の天然のヌクレオチドとして、アデノシン(A)、シチジン(C)、グアノシン(G)およびイノシン(I)が挙げられるが、これらに限定されない。さらに、相同性および相同性は、PHYRE2(Kelly et al. Nat. Protocols. 10: 845-858, 2015)やMfold(Zuker. Nucleic Acids Res. 31(13): 3406-3415, 2003)などのモデル化プログラムを使用して、同じ折り畳み構造(二次構造および/または三次構造)を持つ傾向を元に比較することもできる。
【0070】
本明細書で定義される「安定化ポリペプチド」または「安定化タンパク質」は、たとえば、融合タンパク質の一部を形成するタンパク質であって、該融合タンパク質に含まれる別のタンパク質の全体的な安定性を向上させることによって、該融合タンパク質の全体的な安定性を向上させるように機能するタンパク質である。安定性には、タンパク質がそのコンフォメーションおよび活性を保持する能力が含まれる。さらに、安定化タンパク質によって、融合タンパク質または該融合タンパク質に含まれる別のタンパク質の溶解性が向上してもよい。安定化タンパク質を使用することによって、タンパク質の発現の増加、タンパク質の折り畳みの改善、特異的な活性を保持しながらの短期または長期にわたる保存性などのその他の利点を得ることもできる。安定化タンパク質と非LTR RTタンパク質の間にリンカーペプチドを含めることによって、このような利点をさらに高めることができる。いくつかの態様において、細菌細胞において融合タンパク質を発現させるため、本発明の真核生物由来非LTR RTタンパク質に安定化タンパク質が連結される。いくつかの態様において、安定化タンパク質は、マルトース結合タンパク質(MBP)である。
【0071】
本発明の改変RTタンパク質は、通常、実質的に均質になるまで精製される。「実質的に均質な」、「実質的に均質な形態」および「実質的な均質性」という語句は、得られた産物(すなわち単離されたRTタンパク質)が、密接に関連する核酸、関連するタンパク質および/またはその他の異種不純物などの、前記産物が発現される際に付随する不純物が実質的に取り除かれていることを示す際に使用される。たとえば、改変RTタンパク質は、同じ精製プロトコルまたはほぼ同じ精製プロトコルに従って得られた改変されていない類似のRTタンパク質と比較して、該改変RTタンパク質が発現される際に付随する不純物が、95%以上(たとえば、96%、97%、98%、99%、99.5%またはそれ以上)減少していてもよい。
【0072】
本明細書において、「バリアント」、「改変された」、「非天然の」および「変異体」という用語は同義語であり、たとえば、部位突然変異などの組換えDNA技術を使用して作製された、1個以上のアミノ酸またはヌクレオチドの挿入、欠失、変異、置換、修飾または融合の点で、具体的に記載されたポリペプチドまたは核酸とは異なるポリペプチドまたは核酸を指す。目的とする活性を欠失させることなく、どの残基を置換、付加または欠失してもよいのかを決定する際の指針は、特定のポリペプチドの配列を相同なポリペプチドの配列(たとえば系統発生的に関連する配列)と比較し、相同性の高い領域(保存領域)における変異の数が最も少なくなるようにするか、コンセンサス配列で置換することによって見出すことができる。いくつかの実施形態において、「誘導体」、「バリアント」、「改変された」、「非天然の」および「変異体」という用語は、同じ意味で使用される。
【0073】
真核生物由来の、長い末端反復配列を持たない改変された逆転写酵素(非LTR RT)タンパク質
本明細書において、本開示の方法および組成物において使用するための、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質を提供する。本発明の単離された真核生物由来非LTR RTタンパク質は、ロバストな発現を示し、核酸を含まない高収率な精製を達成し、レトロウイルス逆転写酵素(RT)アッセイなどにおいて使用されるアニールしたプライマー-鋳型基質に対してcDNA合成活性を示し、物理的に離れた複数の鋳型をプロセッシブ(連続的)に複製できることから、共有結合により連続した単一のcDNAを形成できる鋳型「ジャンピング」活性を示す。このような単離された真核生物由来非LTR RTタンパク質は、切断型N末端領域と、RNA結合ドメインと、逆転写酵素(RT)ドメインと、エンドヌクレアーゼ機能を欠失させる変異を含むエンドヌクレアーゼドメインとを含む。
【0074】
場合によっては、前記真核生物由来非LTR RTタンパク質は、R2様レトロエレメントRT(R2様RT)タンパク質(たとえば、R2様RTタンパク質)である。R2様タンパク質は、タンパク質構造の一般原則に従ったものであり、該タンパク質のN末端からC末端の方向に順に、イントロンRTにもレトロウイルスRTにも存在しない1つ以上の配列特異的DNA結合ドメイン;イントロンRTには存在するが、レトロウイルスRTには存在しないRNA結合領域;RT活性部位のインタクトなシグネチャーモチーフまたは縮重したシグネチャーモチーフを有する共通RTドメイン、および制限酵素様エンドヌクレアーゼ(RLE)ファミリーのC末端エンドヌクレアーゼドメインを含む。R2様RTではないその他の非レトロウイルス由来RTは、エンドヌクレアーゼドメインを持たないか、別の構造ファミリーのエンドヌクレアーゼドメインを有する。場合によっては、前記真核生物由来非LTR RTタンパク質は、R2レトロエレメントRT(R2 RT)タンパク質である。場合によっては、前記真核生物由来非LTR RTタンパク質は、節足動物に由来するものである。場合によっては、前記節足動物はカイコガであり、前記タンパク質は、カイコガのR2 RTタンパク質である。
【0075】
場合によっては、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の69個(すなわち1~69番目のアミノ酸)~303個(すなわち1~303番目のアミノ酸)のアミノ酸が欠失している。たとえば、N末端領域が切断されていることにより、非切断型の非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の69個のアミノ酸(すなわち1~69番目のアミノ酸)が欠失されていてもよい。したがって、場合によっては、N末端領域が切断されていることにより、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の69個のアミノ酸(すなわち1~69番目のアミノ酸)が欠失されていてもよい。したがって、一例において、N末端領域が切断されていることにより、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の69個のアミノ酸(すなわち1~69番目のアミノ酸)が欠失している真核生物由来非LTR RTタンパク質は、配列番号9のアミノ酸配列を含んでいてもよい。配列番号9のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質は、たとえば、本開示において詳細に説明されているΔN69 R2 RTタンパク質である。
【0076】
あるいは、切断型N末端領域を有する前記非LTR RTタンパク質は、配列番号9と少なくとも90%の配列同一性(たとえば、少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%の配列同一性)を有するアミノ酸配列を有する配列番号9のバリアントであってもよい。配列番号9のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質の別の例として、配列番号6のアミノ酸配列を有し、N末端MBPタグおよびC末端6×Hisタグを有するΔN69 R2 RTタンパク質が挙げられる。
【0077】
N末端領域が切断されていることから、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の69個のアミノ酸が欠失している真核生物由来非LTR RTタンパク質の別の例として、配列番号14のアミノ酸配列を有するΔN69(ed) R2 RTタンパク質が挙げられる。あるいは、切断型N末端領域を有する前記非LTR RTタンパク質は、配列番号14と少なくとも90%の配列同一性(たとえば、少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%の配列同一性)を有するアミノ酸配列を有し、カイコガR2 RTタンパク質の全長(配列番号1)のアミノ酸残基D996にD996A置換変異を含む、配列番号14のバリアントであってもよい。配列番号14のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質の別の例として、配列番号13のアミノ酸配列を有し、N末端MBPタグおよびC末端6×Hisタグを有するΔN69(ed) R2 RTタンパク質が挙げられる。
【0078】
別の一例において、N末端領域が切断されていることにより、非切断型の非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の303個のアミノ酸(すなわち1~303番目のアミノ酸)が欠失されていてもよい。したがって、場合によっては、N末端領域が切断されていることにより、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の303個のアミノ酸(すなわち1~303番目のアミノ酸)が欠失されていてもよい。したがって、一例において、N末端領域が切断されていることにより、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の303個のアミノ酸(すなわち1~303番目のアミノ酸)が欠失している真核生物由来非LTR RTタンパク質は、配列番号11のアミノ酸配列を含んでいてもよい。配列番号11のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質は、たとえば、本開示において説明されているBomoMin(ed)タンパク質である。
【0079】
あるいは、切断型N末端領域を有する前記非LTR RTタンパク質は、配列番号11と少なくとも90%の配列同一性(たとえば、少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%の配列同一性)を有するアミノ酸配列を有し、カイコガR2 RTタンパク質の全長(配列番号1)のアミノ酸残基D996にD996A置換変異を含む、配列番号11のバリアントであってもよい。配列番号11のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質は、たとえば、本開示において詳細に説明されているBomoMin(ed) R2 RTタンパク質である。配列番号11のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質の別の例として、配列番号12のアミノ酸配列を有し、N末端MBPタグおよびC末端6×Hisタグを有するBomoMin(ed) R2 RTタンパク質が挙げられる。
【0080】
場合によっては、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の69個(すなわち1~69番目のアミノ酸)~274個(すなわち1~274番目のアミノ酸)のアミノ酸が欠失している。たとえば、N末端領域が切断されていることにより、非切断型の非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の274個のアミノ酸(すなわち1~274番目のアミノ酸)が欠失されていてもよい。したがって、場合によっては、N末端領域が切断されていることにより、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の274個のアミノ酸(すなわち1~274番目のアミノ酸)が欠失されていてもよい。したがって、一例において、N末端領域が切断されていることから、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の274個のアミノ酸(すなわち1~274番目のアミノ酸)が欠失している真核生物由来非LTR RTタンパク質は、配列番号10のアミノ酸配列を含んでいてもよい。配列番号10のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質は、たとえば、本開示において詳細に説明されているBomoC R2 RTタンパク質である。
【0081】
あるいは、切断型N末端領域を有する前記非LTR RTタンパク質は、配列番号10と少なくとも90%の配列同一性(たとえば、少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%の配列同一性)を有するアミノ酸配列を有する配列番号10のバリアントであってもよい。配列番号10のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質の別の例として、配列番号7のアミノ酸配列を有し、N末端MBPタグおよびC末端6×Hisタグを有するBomoC R2 RTタンパク質が挙げられる。
【0082】
N末端領域が切断されていることから、配列番号1のアミノ酸配列を有する非切断型のカイコガR2 RTタンパク質の全長と比較して、カイコガR2 RTタンパク質のN末端の274個のアミノ酸(すなわち1~274番目のアミノ酸)が欠失している真核生物由来非LTR RTタンパク質の別の例として、配列番号2のアミノ酸配列を有するBomoC(ed) R2 RTタンパク質が挙げられる。あるいは、切断型N末端領域を有する前記非LTR RTタンパク質は、配列番号2と少なくとも90%の配列同一性(たとえば、少なくとも91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%の配列同一性)を有するアミノ酸配列を有し、カイコガR2 RTタンパク質の全長(配列番号1)のアミノ酸残基D996にD996A置換変異を含む、配列番号2のバリアントであってもよい。配列番号2のアミノ酸配列を含む単離された真核生物由来非LTR RTタンパク質の別の例として、配列番号3のアミノ酸配列を有し、N末端MBPタグおよびC末端6×Hisタグを有するBomoC(ed) R2 RTタンパク質が挙げられる。
【0083】
場合によっては、N末端領域が切断されていることにより、非LTR RTタンパク質の全長と比較して、前記非LTR RTタンパク質のN末端の274個(すなわち1~274番目のアミノ酸)~303個(すなわち1~303番目のアミノ酸)のアミノ酸が欠失している。
【0084】
場合によっては、単離された真核生物由来N末端切断型非LTR RTタンパク質バリアントであって、エンドヌクレアーゼ機能を欠失させる変異と、配列番号2、3および6~14のいずれかと比較して1つ以上のアミノ酸置換を有するN末端切断型非LTR RTタンパク質バリアントを提供する。以下の表1において、「好ましい置換」の見出しの下に、保存的置換を示す。さらに実質的な変化は、以下の表1の「例示的な置換」の見出しの下に示し、アミノ酸側鎖の種類については、表1の下に示す。
【0085】
【0086】
アミノ酸は、一般的な側鎖特性に従って以下のように群分けしてもよい。
疎水性:ノルロイシン、Met、Ala、Val、Leu、Ile;
親水性中性:Cys、Ser、Thr、Asn、Gln;
酸性:Asp、Glu;
塩基性:His、Lys、Arg;
側鎖の配向に影響を与える残基:Gly、Pro;
芳香族:Trp、Tyr、Phe
【0087】
非保存的置換によって、これらの種類のいずれかのメンバーが別の種類に交換される。
【0088】
場合によっては、N末端領域が切断されていることにより、1つ以上(たとえば1つ、2つ、3つ、4つまたはそれ以上)の配列特異的DNA結合ドメインの全体またはその一部が欠失している。場合によっては、N末端ドメインが切断されていることにより、1つ以上(たとえば1つ、2つ、3つ、4つまたはそれ以上)の配列特異的DNA結合ドメインの全体が欠失している。場合によっては、前記真核生物由来非LTR RTタンパク質は、配列特異的DNA結合ドメインを含んでいない。場合によっては、前記真核生物由来非LTR RTタンパク質は、自律型配列特異的DNA結合ドメインを含んでいない。
【0089】
場合によっては、前記単離された真核生物由来非LTR RTタンパク質は、実質的に均質となるまで精製される。したがって、場合によっては、前記真核生物由来非LTR RTタンパク質は、核酸不純物を実質的に含んでいない。
【0090】
エンドヌクレアーゼを不活化させる変異
前述のように、単離された真核生物由来非LTR RTタンパク質は、エンドヌクレアーゼ機能を欠失させる1つ以上の変異を有するエンドヌクレアーゼドメインを含む。このような変異には、置換変異、欠失変異(切断型変異を含む)または挿入変異が含まれていてもよい。たとえば、1つ以上の置換変異(たとえば、1個以上のアミノ酸を1個以上の別のアミノ酸で置換する変異)を利用して、本開示で使用するための、不活化されたエンドヌクレアーゼドメインを有する改変された真核生物由来非LTR RTタンパク質を構築してもよい。エンドヌクレアーゼドメインファミリーは、広範に特性評価が行われており、特に、制限エンドヌクレアーゼの多くと共通点を有するR2様RTタンパク質のエンドヌクレアーゼドメインについても特性が評価されている(Pingoud et al. Cell Mol Life Sci. 62(6):685-707 2005)。様々なタンパク質の高分解能構造解析および変異誘発実験から、このエンドヌクレアーゼドメイン活性の原理およびそのアミノ酸要件が明らかになっている。
【0091】
前記真核生物由来非LTR RTタンパク質がカイコガのR2 RTタンパク質である場合、エンドヌクレアーゼ機能を欠失させる前記変異は、配列番号1のアミノ酸配列を有するカイコガのR2 RTタンパク質の全長のアミノ酸残基D996、D1009またはK1026における置換変異であってもよい。場合によっては、前記置換変異は、アミノ酸残基D996における置換変異である。場合によっては、前記アミノ酸残基D996は、グルタミン酸(E)以外のアミノ酸で置換されている。したがって、場合によっては、アミノ酸残基D996は、Ala(A)、Ile(I)、Leu(L)、Met(M)、Phe(F)、Val(V)、Pro(P)、Gly(G)、Arg(R)、Lys(K)、Gln(Q)、Asn(N)、His(H)、Ser(S)、Thr(T)、Tyr(Y)、Cys(C)、Trp(W)またはTyr(Y)で置換されている。場合によっては、前記置換変異はD996A変異である。場合によっては、前記置換変異は、アミノ酸残基D1009における置換変異である。場合によっては、アミノ酸残基D1009は、グルタミン酸(E)以外のアミノ酸で置換されている。場合によっては、アミノ酸残基D1009は、Ala(A)、Ile(I)、Leu(L)、Met(M)、Phe(F)、Val(V)、Pro(P)、Gly(G)、Arg(R)、Lys(K)、Gln(Q)、Asn(N)、His(H)、Ser(S)、Thr(T)、Tyr(Y)、Cys(C)、Trp(W)またはTyr(Y)で置換されている。場合によっては、前記置換変異はD1009A変異である。場合によっては、前記置換変異は、アミノ酸残基K1026における置換変異である。場合によっては、前記置換変異は、K1026A変異、K1026D変異またはK1026E変異である。場合によっては、前記置換変異はK1026A変異である。場合によっては、エンドヌクレアーゼ機能を欠失させる変異は、アミノ酸残基K1026およびK1029における置換変異である。場合によっては、前記置換変異は、K1026A変異およびK1029A変異である。
【0092】
安定化タンパク質
単離された真核生物由来非LTR RTタンパク質は、1種以上の安定化タンパク質を含んでいてもよい。非LTR RTタンパク質の一部を構成する安定化タンパク質は、改変された非LTR RTタンパク質の全体的な安定性を向上させ、かつ/または適切な構造を向上させるように機能する。安定性には、タンパク質がそのコンフォメーションおよび活性を保持する能力が含まれる。
【0093】
前記真核生物由来非LTR RTタンパク質に安定化タンパク質を付加することによって、1つ以上の利点を得ることができる。安定化タンパク質を含む改変された真核生物由来非LTR RTタンパク質は、たとえば、高温での安定性が向上していてもよく、溶解性が向上していてもよく、タンパク質の発現が増加してもよく、タンパク質の折り畳みが改善していてもよく、かつ/または特異的な活性を保持しながらの短期もしくは長期にわたる保存性を有していてもよい。場合によっては、安定化タンパク質を含む改変された本発明の真核生物由来非LTR RTタンパク質は、前述の特性のうちの1つ以上を有していてもよい。たとえば、改変された真核生物由来非LTR RTタンパク質は、熱安定性が向上していてもよく、かつ/または溶解性が向上していてもよい。別の一例では、改変された真核生物由来非LTR RTタンパク質は、タンパク質の発現が増加していてもよく、かつタンパク質の折り畳みが改善されていてもよい。
【0094】
安定化タンパク質と前記真核生物由来非LTR RTタンパク質の間にリンカーペプチドを含めることによって、このような利点をさらに高めることができる。あるいは、前記真核生物由来非LTR RTタンパク質と安定化タンパク質を直接融合させることもでき、リンカーを使用するのであれば、その長さを最小限にしてもよい。したがって、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に安定化タンパク質を配置することができる。
【0095】
場合によっては、細菌細胞において融合タンパク質を発現させるため、本発明の真核生物由来非LTR RTタンパク質に安定化タンパク質が連結される。場合によっては、安定化タンパク質は、マルトース結合タンパク質(MBP)またはそのバリアントである。安定化タンパク質のその他の例としては、低分子ユビキチン様修飾因子(SUMO)もしくはプロテインAドメインまたはこれらのバリアントが挙げられる。
【0096】
前記単離された真核生物由来非LTR RTタンパク質が1つ以上の安定化タンパク質を含む前述の例のいずれかにおいて、改善/向上したタンパク質の全体的な安定性は、細胞において発現された組換えタンパク質の溶解性の向上、精製収率の増加、タンパク質画分において単一の種類のタンパク質が占める割合の増加、生化学反応における酵素の半減期の延長、ならびに/または室温もしくは4℃、-20℃および/もしくは-80℃で保存時の活性の保持の向上により反映される。
【0097】
精製タグ
前記単離された真核生物由来非LTR RTタンパク質は、1つ以上の安定化タンパク質に加えて、1つ以上の精製タグを含んでいてもよい。
【0098】
前記真核生物由来非LTR RTタンパク質と精製タグの間にリンカーペプチドを含めることが望ましい場合がある。あるいは、前記真核生物由来非LTR RTタンパク質と精製タグを直接融合させることもできる。したがって、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に精製タグを配置することができる。
【0099】
場合によっては、細菌細胞において融合タンパク質を発現させ、次いで精製するために、本発明の真核生物由来非LTR RTタンパク質に精製タグが連結される。場合によっては、特に細菌細胞からの精製を目的とした精製タグとして、6×Hisタグなどのヒスチジンタグが使用される。場合によっては、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のC末端にヒスチジンタグ(たとえば6×Hisタグ)が配置される。場合によっては、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のC末端にヒスチジンタグ(たとえば6×Hisタグ)が配置され、かつ、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、該真核生物由来非LTR RTタンパク質のN末端に安定化タンパク質(たとえばMBP)が配置される。場合によっては、リンカーペプチドを介して前記真核生物由来非LTR RTタンパク質のC末端にヒスチジンタグ(たとえば6×Hisタグ)が配置され、かつ、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、該真核生物由来非LTR RTタンパク質のN末端に安定化タンパク質(たとえばMBP)が配置される。
【0100】
場合によっては、真核細胞において融合タンパク質を発現させ、次いで精製するために、本発明の真核生物由来非LTR RTタンパク質に精製タグが連結される。場合によっては、特に真核細胞からの精製を目的とした精製タグとして、プロテインAタグまたはFLAGペプチドタグが使用される。場合によっては、前記精製タグは、タンデム型のプロテインAタグである。場合によっては、前記精製タグは、3×FLAGペプチドタグである。場合によっては、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のC末端に精製タグ(たとえば、プロテインAまたはFLAGペプチドタグ)が配置され、該真核生物由来非LTR RTタンパク質は別の安定化タンパク質を含まない。別の場合では、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のN末端に精製タグ(たとえば、プロテインAまたはFLAGペプチドタグ)が配置され、該真核生物由来非LTR RTタンパク質は別の安定化タンパク質を含まない。場合によっては、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のC末端に精製タグ(たとえば、プロテインAまたはFLAGペプチドタグ)が配置され、該真核生物由来非LTR RTタンパク質は別の安定化タンパク質を含む。別の場合では、リンカーペプチドを介して、あるいはリンカーペプチドを介さずに、前記真核生物由来非LTR RTタンパク質のN末端に精製タグ(たとえば、プロテインAまたはFLAGペプチドタグ)が配置され、該真核生物由来非LTR RTタンパク質は別の安定化タンパク質を含む。
【0101】
その他の精製タグの例として、Twin-Strepタグ、mycペプチドタグ、アシル担体タンパク質タグ、これらのバリアントなどが挙げられる。
【0102】
リンカーペプチド
リンカーペプチドを使用して安定化タンパク質および/または精製タグを前記真核生物由来非LTR RTタンパク質に連結する場合、該リンカーは2アミノ酸長以上であってもよい。前記リンカーは、中性アミノ酸、極性アミノ酸、非極性アミノ酸のいずれからなっていてもよい。前記リンカーは、たとえば2~100アミノ酸長であってもよく、たとえば2~50アミノ酸長であってもよく、たとえば3アミノ酸長、5アミノ酸長、10アミノ酸長、15アミノ酸長、20アミノ酸長、25アミノ酸長、30アミノ酸長、35アミノ酸長、40アミノ酸長、45アミノ酸長または50アミノ酸長であってもよい。場合によっては、リンカーは、Smyth et al. Protein Science. 12: 1313-1322, 2003で述べられているように、隣接するタンパク質またはポリペプチドの折り畳みを促進する領域である。
【0103】
リンカーは、たとえば、物理的に別の薬剤またはリンカー自体による酵素的切断または化学的切断を介して「切断可能」であってもよい。アミノ酸配列中の切断部位、ならびにこのような切断部位で切断する酵素および化学物質はよく知られている。たとえば、リンカーの酵素的切断に使用される酵素として、たとえば、フーリン(furin)、ウロキナーゼ、Lys-C、Asp-N、Arg-C、V8、Glu-C、キモトリプシン、トリプシン、ペプシン、パパイン、トロンビン、組織プラスミノーゲン活性化因子(tPa)、genenase、第Xa因子、TEV(タバコエッチ病ウイルス)システインプロテアーゼ、SUMOプロテアーゼ(Ulp1)、エンテロキナーゼ、HRV C3(ヒトライノウイルスC3プロテアーゼ)、キニノゲナーゼなどのエンドペプチダーゼ;ならびにスブチリシン様プロプロテイン変換酵素(たとえば、フーリン(furin)(PC1)、PC2もしくはPC3)またはN-arginine dibasic convertaseを使用してもよい。
【0104】
化学的切断は、還元剤または自己切断タンパク質モチーフにより切断可能なジスルフィド結合を含んでいてもよい。
【0105】
鋳型の複製に依存せずにポリヌクレオチドの3’末端を伸長する方法
鋳型の複製に依存せずにヌクレオチドを付加することによるポリヌクレオチドの3’末端の伸長(ポリヌクレオチドへのテーリングとも呼ぶ)は、分子タグを共有結合するのに有用な方法として広く使用されている。ヌクレオチドトランスフェラーゼ活性を有する酵素として、ほぼ無作為に選択されたデオキシヌクレオチドを一本鎖DNA基質の末端に付加することに特化したターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)、および主にAまたはUからなるホモポリマーテールを一本鎖RNA基質に付加することに特化したRNAポリメラーゼが挙げられる。非レトロウイルス由来RT酵素のターミナルトランスフェラーゼ活性は、Mn2+の存在によって刺激されることが見出されたことから、NTP、dNTPまたはその他のヌクレオチド類似体基質を使用して、一本鎖または二本鎖のRNAまたはDNAにテールを付加することが可能になり、この結果、ポリヌクレオチドの3’末端に分子タグを共有結合させる能力が大いに向上した。
【0106】
本明細書において、一本鎖核酸または部分的に一本鎖の核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、一本鎖核酸または部分的に一本鎖の核酸を接触させる工程を含む方法を提供する。場合によっては、前記一本鎖核酸または部分的に一本鎖の核酸はDNAである。場合によっては、前記接触は、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)、レトロウイルス由来の逆転写酵素(RT)タンパク質またはその他の非RTタンパク質の非存在下で行われる。場合によっては、前記一本鎖核酸または部分的に一本鎖の核酸はRNAである。場合によっては、前記接触は、RNAリガーゼ、ポリアデノシンRNAポリメラーゼ、ポリウリジンRNAポリメラーゼまたはその他の非RTタンパク質の非存在下で行われる。
【0107】
さらに、A型二本鎖核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、A型二本鎖核酸を接触させる工程を含む方法を提供する。場合によっては、前記A型二本鎖核酸は、RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態である。場合によっては、前記RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端は、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む。場合によっては、前記A型二本鎖核酸は、RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態である。場合によっては、前記RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端は、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む。
【0108】
場合によっては、前記非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、リガンド、表面またはその他の分子への結合または共有結合に利用されるシグナルを含む部分をタグとして核酸分子に付加することができる。この方法により、精製樹脂、マイクロアレイプレートまたはフローセルなど(ただしこれらに限定されない)に特異的に結合させることが可能になる。さらに、この方法によって、付加された部分を認識する酵素および非共有結合により局所濃度が増加するその他の核酸を認識する酵素など(ただしこれらに限定されない)に特異的に結合させることが可能になる。
【0109】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、マイクロアレイでのプロファイリングまたは核酸定量方法に利用されるハイブリダイゼーションプローブの形成など(ただしこれらに限定されない)に使用される検出シグナルをタグとして核酸分子に付加することができる。場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、ポリヌクレオチドの3’末端の特性を変化させることができる。たとえば、ポリヌクレオチドの3’末端を、エキソヌクレアーゼによる認識から遮断したり、鋳型依存性合成用のプライマーとして作用することを防いだり、または化学的コンカテマー化もしくは酵素的ライゲーションを目的として活性化したりすることができる。また、ポリヌクレオチドの3’末端の特性を変えることによって、ポリヌクレオチドの溶解性、安定性または透過性を好ましいものにしてもよい(これによって、たとえば、血漿中の半減期を延長したり、細胞透過性を増加したり、細胞表面受容体分子に対する指向性を持たせたりすることができる)。
【0110】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性をオリゴヌクレオチド合成に使用して、可逆的に伸長鎖を終止させるヌクレオチド類似体を付加するサイクル、およびこのヌクレオチド類似体によるブロックを取り除くサイクルを実施することができる。場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、ポリヌクレオチドプールの各分子に区別可能なユニークな分子識別子(unique molecular identifier:UMI)配列を付加したり、ポリヌクレオチドプールを分離するために区別可能なバーコードを付加することができる。場合によっては、3’末端へのテーリング反応により、テールが付加されたポリヌクレオチド配列をコンカテマー化後に最終的に分離するためのスペーサーを形成することができる。場合によっては、3’末端に付加したテールが、鋳型に依存しない伸長または鋳型に依存した伸長による3’末端伸長に対する可逆的なブロックとして機能する。場合によっては、たとえば空間的トランスクリプトーム解析などを行うために、この可逆的なブロックを利用して、コンビナトリアルな様々なバーコード法を連続して行うことができる(Moor et al. Curr Opin Biotechnol. 46:126-133, 2017)。場合によっては、非レトロウイルス由来RTタンパク質を使用して、iso-dGまたはiso-dCなどの非天然ヌクレオチドを付加することにより、その他の特定の非天然ヌクレオチドと塩基対を形成可能な3’末端を作製させる。このようにして、iso-dGなどのテールが付加された鋳型分子は、天然塩基以外のコグネイトな1塩基突出と対形成することができると考えられる(たとえば、iso-dGはiso-dCと対形成するが、A、C、G、T、Uのいずれとも対形成しない)。
【0111】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、合成オリゴヌクレオチドなどの比較的均質な分子集団を伸長することができる。場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、リキッドバイオプシーにより患者から得られたセルフリー核酸試料などの混合分子集団を伸長することができる。
【0112】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性によりポリヌクレオチドのテーリングを行う前に、該ポリヌクレオチドを修飾することができる。たとえば、3’末端基がOHでない場合、T4ポリヌクレオチドキナーゼ(PNK)などの修復酵素を使用して、3’モノリン酸または2’3’環状モノリン酸から3’末端OH基を形成することができる。ポリヌクレオチドは、二次構造を除去するために変性してもよく、変性しなくてもよく、また、特定の核酸またはその他の成分の除去または濃縮を行ってもよく、このような操作を行わなくてもよい。
【0113】
場合によっては、シーケンシング用試料を作製する工程として、前記非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、核酸へのテーリングを行うことができる。場合によっては、前記非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、一本鎖RNAもしくは一本鎖DNAまたはこれらの混合物へのテーリングを行い、イルミナ社のプラットフォームを使用したシーケンシング用の試料として使用することができる。場合によっては、前記非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用して、RNAもしくはDNAまたはこれらの混合物へのテーリングを行い、Pacific Biosciencesプラットフォームなどを使用したシーケンシング用の試料として使用することができる。
【0114】
場合によっては、前記非レトロウイルス由来RTタンパク質は、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である。場合によっては、前記非レトロウイルス由来RTタンパク質は、真核生物由来の非LTR RTタンパク質である。場合によっては、前記非レトロウイルス由来RTタンパク質は、本明細書に記載の本発明の態様による真核生物由来の非LTR RTタンパク質である。場合によっては、前記真核生物由来非LTR RTタンパク質は、R2 RTタンパク質である。場合によっては、前記R2 RTタンパク質は、カイコガのR2 RTタンパク質である。場合によっては、前記非レトロウイルス由来のRTタンパク質は、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である。場合によっては、前記原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質は、Eubacterium rectaleのグループIIイントロンRTタンパク質である。
【0115】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性は、様々に改変されたRTタンパク質により実施することができる。たとえば、前記酵素に変異を導入することによって、ヌクレオチド基質またはヌクレオチド様基質の範囲および二価金属イオンに関する特定の要件の範囲を広げたり、狭めたりすることができる。また、前記酵素への変異の導入は、ポリヌクレオチド基質の範囲を広げたり、狭めたりすることができる。さらに、非レトロウイルス由来RTタンパク質は、所望のポリヌクレオチド基質に結合することができるように、別のタンパク質またはその他のモジュールに共有結合または共有結合以外の結合を介して融合させることができる。さらに、エラー発生率、処理能力、合成速度、活性な温度範囲、反応混合物中に存在するその他の化合物との適合性、安定性、溶解性、または使用時に関連するその他の特性が増強されたり、低減されたりするように、非レトロウイルス由来RTタンパク質を組換えたり、選択することができる。
【0116】
場合によっては、非レトロウイルス由来RTを使用したMn2+を含む反応を使用して、鋳型依存性のcDNA合成の特異性を変化させたり、鋳型に依存しない合成を可能にすることができ、たとえば、一本鎖RNA鋳型への無制御な一本鎖RNAのプライミングをなくすことができる(Luan, Eickbush Mol Cell Biol. 1996 16(9): 4726-34)。
【0117】
場合によっては、前記バッファーは、リボヌクレオシド三リン酸(NTP)、デオキシリボヌクレオシド三リン酸(dNTP)、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらのヌクレオチド類似体のうちの1種以上を含む。場合によっては、前記接触は、約4℃~約50℃で行われる。場合によっては、前記接触は、約37℃で行われる。
【0118】
本明細書で述べるような、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性は、先行技術から予測できなかったものであり、真核生物由来の非レトロウイルス性逆転写酵素と原核生物由来の非レトロウイルス性逆転写酵素に共通する特徴であることから、その他の種類の非レトロウイルス由来逆転写酵素でも、このような活性が示される可能性があると予想され、本明細書に記載の用途に使用する逆転写酵素の代替として使用できる可能性がある。非レトロウイルス由来RTは、細菌、古細菌ならびに真核生物の細胞小器官および核ゲノムにおいて幅広い多様性を示すことから、ターミナルトランスフェラーゼの特異性でも、機能的な多様性が認められ、これは、本明細書で述べるように、原核生物由来イントロンRTタンパク質と真核生物由来非LTRレトロエレメントRTタンパク質の間での様々な相違点および類似性から判断することができる。
【0119】
順序だった鋳型の受け渡し(ordered template relay(OTR))の原理により不連続な複数の鋳型から連続的にcDNAを合成する方法
cDNAライブラリーの最も効率的な合成では、単一の試験管、単一の反応、簡便な反応温度、および保存安定性が保証されている成分を使用して、5’アダプターおよび3’アダプター、ならびに様々な目的の達成に必要とされるその他の試料調製物を加えて合成が行われ、達成される目的としては、
(i)インプットするライブラリーに使用されるプラットフォーム(たとえば、イルミナ、Pacific Biosciences、Nanopore、BGIなど)の要件に従った、分子の定量、増幅、環状化および/またはタグ付加;
(ii)様々なライブラリーを組み合わせてシーケンシングを実行する場合、たとえばバーコードなどを使用した各ライブラリーへのインデックスの付加(使用するプラットフォーム技術に含まれている場合);
(iii)使用するプラットフォームの要件に従った、インプットしたライブラリーの変性;ならびに
(iv)合成によりシーケンシングを開始することが可能な、プライマー用の塩基対形成部位の提供(使用するプラットフォーム技術に含まれている場合)
が挙げられる。
市場を独占しているイルミナ社のプラットフォームにおいて通常使用されるライブラリーの調製では、cDNA配列は、たとえば、3つのコンポーネントからなるセグメントを有する2つのアダプター、すなわち、5’-P5-インデックス(i5)-リード(R1)-3’と5’-P7-i7-R2-3’で挟まれていなければならない。これらの2種の複合アダプター配列は、cDNAの両端に配置しなければならない。さらに、通常、インデックス(すなわち、P5配列モジュールおよびP7配列モジュール)の付加はPCRを使用して行われるため、フローセルに導入する前にライブラリーを変性させて、変性したライブラリーを中和するために約100倍に希釈しなければならず、この結果、フローセルへの導入量が制限されてしまい、通常、作製したライブラリーの約80~90%が失われることとなる。また、NGSに使用されるアダプター配列は、技術革新に伴って進歩したものであることから、モジュール配列の変更に応じて容易に変更可能なライブラリー作製方法が、汎用性の実現には不可欠である。本明細書で述べる方法は、このような問題に関するあらゆる改良を提供するものである。
【0120】
場合によっては、鋳型の受け渡しは、プライマーと鋳型配列の特定の組み合わせや、その他の特性によって特異性が制限されることがある。プライマーと鋳型配列の組み合わせによっては、目的とするcDNAライブラリー産物の作製の精度または効率が向上し、かつ/もしくはcDNAライブラリー産物の作製量が減少したり、または反応において無差別なプライミングや無差別な鋳型の複製などが起こることによって、所望でない副反応物の特性が変わったりすることがある。「鋳型のジャンピング」が起こると、cDNA合成のための配列混合物中の鋳型がほぼ包括的あるいは比較的偏りなく使用されるが、連続的に鋳型が複製される条件では、様々な数の鋳型を元にcDNAコンカテマーが形成される。本明細書で述べる方法では、選択的な鋳型の複製とcDNA産物中において複製される鋳型の数の制御に関する改良を提供する。
【0121】
一態様において、本発明は、相補的DNA(cDNA)分子を調製する方法であって、
(a)ピリミジンヌクレオチドが1塩基突出した末端を3’末端に含むプライマー鎖と非伸長鎖とを含む二本鎖プライマーを提供する工程;
(b)3’末端にプリンヌクレオチドを含むRNA鋳型を提供する工程;ならびに
(c)前記RNA鋳型に実質的に相補的なcDNA分子の作製に効果的な条件下において、マグネシウムイオンと1種以上のデオキシリボヌクレオシド三リン酸(dNTP)またはその類似体とを含むバッファー中で、前記二本鎖プライマーおよび前記RNA鋳型を逆転写酵素(RT)と接触させる工程
を含む方法を提供する。
【0122】
したがって、場合によっては、チミン(T)1塩基および/またはシトシン(C)1塩基が突出した3’突出末端を有するプライマーを、コグネイトな3’プリン塩基を含む鋳型と組み合わせる。コグネイトな3’プリン塩基としては、例えば、様々なOH基を有していてもよいヌクレオチド糖部分に結合したアデニン(A)および/またはグアニン(G)が挙げられる。
【0123】
場合によっては、前記プライマー鎖は、DNAプライマー鎖である。場合によっては、前記プライマー鎖は、5’突出末端を含む。場合によっては、前記プライマー鎖は、その5’末端または内部部位に修飾を含む。場合によっては、前記修飾により、前記プライマー鎖または前記二本鎖プライマーの固相化または精製が可能になっている。場合によっては、前記修飾は、ビオチンへの結合である。場合によっては、前記プライマー鎖は、5’アダプター配列である。場合によっては、前記非伸長鎖は、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む。場合によっては、前記非伸長鎖は、その3’末端に修飾を含む。場合によっては、前記修飾によって3’末端の伸長がブロックされる。場合によっては、前記修飾は、3’末端のC3スペーサーまたは3’末端のモノリン酸である。場合によっては、前記RNA鋳型は、前述の第IV節に記載の方法によって調製される。前記RNA鋳型は、その3’末端に、プリン塩基を含むdNTP、NTPもしくはddNTPまたはそれらのヌクレオチド類似体を含んでいてもよい。同様に、場合によっては、前記二本鎖プライマーは、前述の第IV節に記載の方法によって調製される。場合によっては、前記RNA鋳型は、その5’末端に修飾を含む。場合によっては、前記修飾は不可逆的修飾である。場合によっては、前記不可逆的修飾は、5’末端のC6スペーサーまたはビオチンである。場合によっては、前記修飾は可逆的修飾である。場合によっては、前記可逆的修飾は、5’末端のアデニリル化である。
【0124】
場合によっては、前記接触は、3’末端にピリミジンヌクレオチドを含む第2の鋳型の存在下で行われる。3’末端にプリン塩基を有する鋳型に対するcDNA合成を行った後にのみ、3’末端にピリミジン塩基を有する第2の鋳型が鋳型として好まれる。場合によっては、前記プライマーは、ピリミジンが1塩基突出した修飾末端(iso-dCなど)を有し、第1の鋳型プールは、3’末端にiso-dGを有する。場合によっては、鋳型に依存しない第1の鋳型のcDNAの伸長に使用されるプリンヌクレオチド類似体と、該プリンヌクレオチド類似体と塩基対を形成できる3’末端プリンを有する第2の鋳型を前記反応に添加する。
【0125】
場合によっては、第2の鋳型は、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む。場合によっては、第2の鋳型は、その3’末端にピリミジンリボヌクレオチドを含む。場合によっては、第2の鋳型は、3’アダプター配列の相補鎖である。場合によっては、前記接触は、前記5’アダプター配列、前記RNA鋳型に実質的に相補的な配列および前記3’アダプター配列を含むcDNA分子の作製に効果的な条件下で行われる。場合によっては、第2の鋳型は、その5’末端に修飾を含む。場合によっては、前記修飾は不可逆的修飾である。場合によっては、前記不可逆的修飾は、5’末端のC6スペーサーまたはビオチンである。場合によっては、前記修飾は可逆的修飾である。場合によっては、前記可逆的修飾は、5’末端のアデニリル化である。
【0126】
本明細書で述べる方法によれば、順序だった鋳型の受け渡しを利用するによって、たとえば1本の試験管などにおいて、5’アダプター、cDNAの鋳型および3’アダプター付き鋳型を組み合わせて、好ましいイオンおよびdNTPおよびその他のバッファー成分を添加し、不連続な複数の鋳型からの連続的なcDNAの合成が可能な非レトロウイルス由来RTタンパク質に導入することが可能になる。
【0127】
場合によっては、第1のプライマーおよび第2の鋳型は、アダプター配列で構成される。場合によっては、これらのアダプター配列は、次世代シーケンシング(NGS)のモジュールとして必要とされる。場合によっては、これらのNGSアダプター配列は、イルミナ社のNGSプラットフォームに使用されるNGSアダプター配列である。場合によっては、cDNA 5’アダプターとして、5’-P5-インデックス(i5)-リード(R1)-3’で構成されるモジュールが使用され、第2の鋳型として、5’-P7-i7-R2-3’モジュールが使用される。場合によっては、これらのモジュールを入れ替えて使用する。場合によっては、前記NGSアダプター配列は、Pacific Biosciencesプラットフォームまたはその他のプラットフォームに使用されるNGSアダプター配列である。場合によっては、前記アダプター配列は、PCRに使用されるcDNAアダプター配列である。場合によっては、前記アダプター配列は、マイクロアレイハイブリダイゼーションまたはその他のハイブリダイゼーション法に使用されるcDNAアダプター配列である。場合によっては、前記アダプター配列は、cDNAライブラリーへの結合、またはマトリックス、表面、分子もしくはその他の化合物への結合を可能にする部分を含む。場合によっては、前記アダプター配列は、T7ポリメラーゼまたはその他のRNAポリメラーゼによるcDNAの増幅を可能にする。
【0128】
場合によっては、前記アダプター配列は、cDNAライブラリーへの結合、またはマトリックス、表面、分子もしくはその他の化合物への結合を可能にする部分を含む。場合によっては、前記アダプター配列は、cDNAライブラリーの5’末端の特性を変化させる部分を含む。たとえば、cDNAライブラリーの5’末端を、エキソヌクレアーゼによる認識から遮断したり、リン酸化もしくは脱リン酸化から遮断したり、または化学的コンカテマー化もしくは酵素的ライゲーションを目的として活性化したりすることができる。また、cDNAライブラリーの5’末端の特性を変えることによって、ポリヌクレオチドの溶解性、安定性または透過性を好ましいものにしてもよく、これによって、たとえば、血漿中の半減期を延長したり、細胞透過性を増加したり、細胞表面受容体分子に対する指向性を持たせたりすることができる。一例として、そのままシーケンシングに利用可能なライブラリーが約2~3時間以内に調製される。現在支持されているプロトコルと比較して調製時間が短くなることから、疾患診断用または非侵襲的出生前診断(NIPT)用に試料が採取されてから、得られた配列を治療、手術および/またはその他の用途に使用するまでに要するタイムラグが短くなる。一例では、別の容器に移すことを必要とせずに単一の容器を使用し、かつ/または伸長産物分子の分画用のマトリックスやその他の表面の導入により試料を分割する必要もなく、より再現性高く、技術的手技を必要とすることもなく、そのままシーケンシングに利用可能なライブラリーを調製することができる。さらに、たとえばPCRでのバイアスにより結果が歪曲することを防ぐために、PCRを使用せずにライブラリーの作製が可能であったり、あるいは、インプット量の低減またはインデックスの付加を考慮してPCRが必要であれば、PCRを実施してライブラリーを作製することが可能であれば、理想的であると考えられる。本明細書で述べる方法は、このような問題に関するあらゆる改良を提供するものである。
【0129】
場合によっては、前記非レトロウイルス由来RTは、連続的な鋳型の受け渡しが可能な活性を有する非LTR RTタンパク質である。場合によっては、前記非レトロウイルス由来RTは、R2様RTタンパク質である。場合によっては、前記非レトロウイルス由来RTタンパク質は、カイコガ(Bombxy mori)由来の改変R2 RTタンパク質であり、たとえば、本明細書の前記第III節に記載のカイコガ由来R2 RTタンパク質である。場合によっては、連続的な鋳型の受け渡しを可能とする活性を有することが見出された別の非レトロウイルス由来RTタンパク質、またはこのような活性を備えるように組換えられた別の非レトロウイルス由来RTタンパク質を、R2 RTタンパク質の代わりに鋳型の受け渡し反応に使用してもよい。
【0130】
場合によっては、順序立った鋳型の受け渡しは、様々に改変された非レトロウイルス由来RTタンパク質により行われる。たとえば、前記酵素に変異を導入することによって、ヌクレオチド基質またはヌクレオチド様基質の範囲を広げたり、狭めたりすることができる。また、前記酵素への変異の導入は、ポリヌクレオチド基質の範囲を広げたり、狭めたりすることができる。さらに、前記非レトロウイルス由来RTタンパク質は、所望のポリヌクレオチド基質に結合することができるように、別のタンパク質またはその他のモジュールに共有結合または共有結合以外の結合を介して融合させることができる。さらに、エラー発生率、処理能力、合成速度、活性な温度範囲、反応混合物中に存在するその他の化合物との適合性、安定性、溶解性、または使用時に関連するその他の特性が増強されたり、低減されたりするように、前記非レトロウイルス由来RTタンパク質を組換えたり、選択することができる。
【0131】
本明細書で述べるような、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性は、先行技術から予測できなかったものであり、真核生物由来の非レトロウイルス性逆転写酵素と原核生物由来の非レトロウイルス性逆転写酵素に共通する特徴であることから、その他の種類の非レトロウイルス由来逆転写酵素でも、このような活性が示される可能性があると予想され、本明細書に記載の用途に使用する逆転写酵素の代替として使用できる可能性がある。非レトロウイルス由来RTは、細菌、古細菌ならびに真核生物の細胞小器官および核ゲノムにおいて幅広い多様性を示すことから、ターミナルトランスフェラーゼの特異性でも、機能的な多様性が認められ、これは、本明細書で述べるように、原核生物由来イントロンRTと真核生物由来非LTRレトロエレメントRTの間での様々な相違点および類似性から判断することができる。場合によっては、非レトロウイルス由来RT酵素を別のタンパク質または化合物と融合させることによって、たとえば、プライマー群および/または鋳型分子の結合の促進などを介して、結合の親和性および特異性ならびに反応特性を調整することができる。場合によっては、cDNAライブラリー調製の様々な段階において、様々な非レトロウイルス由来RTタンパク質を互いに組み合わせたり、それぞれを別個に使用したりすることができる。
【0132】
場合によっては、鋳型の受け渡しに使用する前に、ポリヌクレオチドを修飾することができる。たとえば、3’末端がOH基でない場合、T4ポリヌクレオチドキナーゼ(PNK)などの修復酵素を使用して、3’モノリン酸または2’3’環状モノリン酸から3’末端OH基を形成することができる。ポリヌクレオチドは、二次構造を除去するために変性してもよく、変性しなくてもよく、また、特定の核酸またはその他の成分の除去または濃縮を行ってもよく、このような操作を行わなくてもよい。ポリヌクレオチドは、同じ反応容器内または別々の反応容器内で、断片化またはライゲーションしてもよい。
【0133】
場合によっては、ポリヌクレオチドは、細胞を含まない患者試料、組織生検試料、マイクロバイオームからの採取試料、新鮮な塩水試料もしくは水試料、法医学材料、単一の生細胞もしくは固定された細胞、血漿もしくは濃縮したエキソソーム、断片化されたゲノムDNA、古代DNAまたはその他の生物学的材料から得てもよい。場合によっては、cDNAライブラリーの調製プロセスを自動化して行う。
【0134】
場合によっては、鋳型の受け渡しにおける特異性は、合成を妨げるcDNA中間体へのテーリングによる抑制の影響を受け、これは、たとえばdNTPの濃度変化やdNTP類似体などによって起こる。さらに、鋳型の受け渡しの第2の工程の効率は、第1の鋳型の複製で得られたcDNA中間体産物よりも第2の鋳型の局所濃度を増加させることによって、上昇させることができる。場合によっては、この局所濃度の上昇は、表面への固相化や液滴技術などによって行ってもよい。
【0135】
場合によっては、前記接触は、約4℃~約50℃で行われる。場合によっては、前記接触は、約37℃で行われる。
【0136】
場合によっては、前述したように、前記方法は、単一の容器または単一のベッセル内で実施される。
【0137】
製品またはキット
本発明の別の一態様は、単離された、真核生物由来の、長い末端反復配列を持たない1つ以上の逆転写酵素(非LTR RT)タンパク質と、核酸の検出、定量またはシーケンシングの実施に有用な材料とを含む製品であり、核酸の検出、定量またはシーケンシングの実施に有用な前記材料は、具体的には、不連続な複数の鋳型からの順序だった連続的な相補的DNA(cDNA)の合成、および/またはレトロウイルス由来ではない逆転写酵素(RT)タンパク質の非天然ターミナルトランスフェラーゼ活性の達成に有用な材料である。
【0138】
核酸の検出、定量またはシーケンシングの実施は、複雑な技術を要するため、当業者による実施を必要とすることが多い。分子診断学の精度を、病原体、健康状態ならびにがんの検出および治療に使用可能な最先端レベルまで押し上げるためには、再現性良く、手動での操作を大幅に省いて、バイオマーカーのプロファイルを得る必要がある。核酸の内容物を、できるだけ偏りなく包括的に読み取ることができれば、分子診断学の精度を大幅に向上させることができる。本明細書で述べる発明により、標準作業手順(SOP)プロトコルに従って、再現性よく、核酸情報を読み取ることを目的とした研究用途および臨床用途が可能となる。いくつかの態様において、このような研究用途および臨床用途の実現は、キットの形態で提供される。
【0139】
本発明の製品には、容器、容器に貼付もしくは添付されるラベル、または容器に貼付もしくは添付される添付文書が含まれていてもよい。適切な容器として、たとえば、ボトル、バイアル、シリンジなどが挙げられる。容器は、ガラスやプラスチックなどの様々な材料で形成されていてもよい。場合によっては、前記容器には組成物が収容されていてもよく、たとえば、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用した核酸標識方法および/または非レトロウイルス由来RTを使用した順序だった鋳型の受け渡しによる核酸シーケンシング方法の実施に有用あるいは必要な、1種以上の単離された真核生物由来非LTR RTタンパク質が収容されていてもよい。
【0140】
場合によっては、非レトロウイルス由来RTのターミナルトランスフェラーゼ活性を使用した核酸標識により、病原体または変異体を検出するためのプローブを得ることができる。場合によっては、このようなプローブを使用することによって、セルフリー核酸を含むリキッドバイオプシー、固定液で固定されていてもよい腫瘍生検試料、感染した組織、環境試料、乾燥した血液痕、マイクロバイオーム材料または血漿において、目的のシグナルを検出することができる。場合によっては、このような用途に使用されるプローブは、キットの形態で提供される。
【0141】
場合によっては、非レトロウイルス由来RTを使用した順序だった鋳型の受け渡しによる核酸シーケンシングを実施することによって、細胞の状態または目的とする正常分子もしくは異常分子の有無についての有益な情報を得ることが可能な核酸プロファイルを得ることができる。場合によっては、核酸シーケンシングによって、単一の細胞を解析することができる。いくつかの態様において、このような核酸シーケンシングは、キットの形態で提供される。
【0142】
本発明の製品は、商業的観点および使用者の観点から考えられるその他の材料をさらに含んでいてもよく、たとえば、核酸の検出および/または核酸の標識に有用または必要な、その他のバッファー、希釈剤およびその他の試薬が含まれていてもよい。
【0143】
様々な目的(たとえば、核酸の検出、定量またはシーケンシングの実施)に有用な1種以上の単離された真核生物由来非LTR RTタンパク質またはその他の試薬(たとえばプライマー)を含むキットも提供される。本発明の製品と同様に、本発明のキットは、容器、容器に貼付もしくは添付されるラベル、または容器に貼付もしくは添付される添付文書を含む。前記容器には組成物が収容されていてもよく、該組成物は、本発明の少なくとも1種の真核生物由来非LTR RTタンパク質、または様々な目的(たとえば、核酸の検出、定量またはシーケンシングの実施)に有用な少なくとも1種の試薬を含む。別の容器に、たとえば希釈剤やバッファーなどが収容されていてもよい。前記ラベルまたは添付文書は、組成物に関する説明、ならびにインビトロまたは診断用途での使用のための指示を提供するものであってもよい。
【0144】
本明細書は、当業者が本発明を実施するのに十分な程度で記載されている。また、本明細書で示したものおよび記載したもの以外の、本発明の様々な変更も、本明細書の前述の説明から当業者には明らかであり、このような様々な変更は、添付の請求項の範囲内に含まれる。
【実施例0145】
以下の実施例を参照することにより、本発明の理解をより深めることができる。しかし、以下の実施例は、本発明の範囲を何ら限定するものではない。本明細書に記載の実施例および実施形態は、説明のみを目的としたものである。このことから、これらの実施例および実施形態を様々に修正したり変更したりできることが当業者に示唆されており、これらの修正および変更は、本願の要旨および範囲ならびに添付の請求項の範囲に含まれる。
【0146】
実施例1:プロセッシブ(連続的)な鋳型の受け渡しが可能な、高度に精製された逆転写酵素(RT)の高収率な製造
レトロウイルスの逆転写酵素(RT)は、RNAを鋳型とするDNA合成酵素として約50年前に発見され、その後数十年にわたり、RT-PCRやRNA-seqなどの分子生物学的用途における有用性が絶えず精力的に改善されてきた(Coffin JM, Fan H Annu Rev Virol. 2016 3(1):29-51)。レトロウイルスの逆転写酵素は、比較的最近になって動物宿主の細胞内逆転写酵素から進化したものであり、進化の過程において、元となった逆転写酵素の核酸結合性の多くが失われている。特に、レトロウイルスの逆転写酵素は、プライマーと鋳型からなる二本鎖への結合により鋳型を認識するが、真核生物細胞のレトロエレメントの逆転写酵素は、通常、鋳型と、これとは物理的に離れた2本のプライマーとの間の相同性に関係なくcDNA合成を開始する(Eickbush TH, Jamburuthugoda VK Virus Res. 2008 134(1-2):221-34)。このように、真核生物のレトロエレメントの逆転写酵素は、転移型の自己スプライシングイントロンによってコードされる典型的な原核生物由来の逆転写酵素や細胞小器官由来の逆転写酵素とは異なる。原核生物由来の逆転写酵素や細胞小器官由来の逆転写酵素は、逆スプライシングにより自身の鋳型をDNAに挿入した後、その鋳型を複製する(Lambowitz AM, Zimmerly S Cold Spring Harb Perspect Biol. 2011 3(8):a003616)。一方、真核生物のレトロエレメントの逆転写酵素は、関連する核酸を取り除いて精製することが難しく、「精製された」レトロエレメント逆転写酵素の活性は、結合したRNAが取り除かれたRTタンパク質自体の活性ではなく、RNPの活性を反映するものであることが多かった(Christensen SM, Ye J, Eickbush TH Proc Natl Acad Sci USA. 2006 103(47):17602-7)。このような状況下ではあるが、真核生物のレトロエレメントの逆転写酵素を、不純物が取り除かれた保存に安定な形態で高収率に製造することができれば、レトロエレメント逆転写酵素が有する生物学的活性および生化学的活性を、研究用途および臨床用途の開発において、他に類のない有用なツールとして利用できると考えられる。
【0147】
本実施例では、原核細胞のゲノムまたは真核細胞のゲノムによりコードされる複数の逆転写酵素(RT)をスクリーニングすることにより、(a)ロバストな発現を示し、(b)核酸を含まない高収率な精製を達成し、(c)レトロウイルス逆転写酵素(RT)アッセイなどにおいて使用されるアニールしたプライマー-鋳型基質に対してcDNA合成活性を示し、かつ(d)物理的に離れた複数の鋳型をプロセッシブ(連続的)に複製できることから、共有結合により連続した単一のcDNAを形成できる鋳型「ジャンピング」活性を示す逆転写酵素(RT)を探索した。
【0148】
方法
逆転写酵素(RT)ポリペプチドを、MBP配列バリアントを含むN末端マルトース結合タンパク質(MBP)タグ(Smyth et al. Protein Sci. 12(7):1313-22, 2003)およびC末端6×ヒスチジンタグとともに発現させた。本明細書において発現させたタグ付加RTポリペプチドの例として、カイコガ(Bombyx mori)由来のタグ付加R2 RTの全長(配列番号5)、カイコガ由来のタグ付加ΔN69 R2 RT(配列番号6;NBomoCとも呼ぶ)、カイコガ由来のタグ付加ΔN274 R2 RT(配列番号7;BomoCとも呼ぶ)、C末端を切断してエンドヌクレアーゼドメインを除去したカイコガ由来のタグ付加ΔN274 R2 RT(配列番号12;Bomoとも呼ぶ)、エンドヌクレアーゼ機能を欠失させるD996A変異を有するカイコガ由来のタグ付加ΔN274 R2 RT(配列番号3;BomoC(ed)とも呼ぶ)、エンドヌクレアーゼ機能を欠失させるD996A変異を有するカイコガ由来のタグ付加ΔN69 R2 RT(配列番号13;NBomoC(ed)とも呼ぶ)、およびEubacterium rectale細菌由来のタグ付加RTの全長(配列番号8;EureまたはEuReとも呼ぶ)が挙げられる。
【0149】
本実施例で詳述する酵素精製法は、2Lの細菌培養にスケールアップしたものである。Rosetta2(DE3)pLysS細胞を2Lの2YT培地中で増殖させ、OD600=0.9に達した時点でタンパク質の発現を誘導する。0.5mM IPTGを加え、振盪しながら16℃で一晩培養する。細胞ペレットを回収し、20mM Tris-HCl pH 7.4、1M NaCl、10%グリセロール、1mM MgCl2、DNase I(ロシュ社、04716728001、5μg/mL)、RNase A(シグマ社、R6513、5μg/mL)およびプロテアーゼ阻害剤からなるバッファー中に再懸濁する。超音波処理を3.5分間行う(氷上において超音波オン10秒間とオフ10秒間を繰り返す)ことにより細胞を溶解する。遠心分離(Sorval SS34ローター、15,000rpm、4℃で30分間)を行い、不溶性物質を除去する。
【0150】
5mlのHisTrap FF Crudeカラムを使用して、自動プログラムによりニッケルアフィニティークロマトグラフィーを行う。まず、5mlのHisTrap FF CrudeカラムをバッファーAで平衡化し、試料を導入し、5カラム容量(CV)の洗浄バッファーで洗浄し、5CVの溶出バッファーで溶出する。
バッファーA:20mM Tris-HCl pH 7.4、1M NaCl、10%グリセロール、1mM β-メルカプトエタノール
洗浄バッファー:20mM Tris-HCl pH 7.4、1M KCl、20mMイミダゾール、10%グリセロール、1mM β-メルカプトエタノール
溶出バッファー:20mM Tris-HCl pH 7.4、1M KCl、400mMイミダゾール、10%グリセロール、1mM β-メルカプトエタノール
【0151】
得られた吸光度に応じて溶出液をプールし、FLPC HiPrep 26/10カラムを使用して400mM KClで脱塩し、5mlのHiTrap Heparin HPカラムにアプライする。カラムを平衡化し、試料を導入し、20%ヘパリンバッファーBで洗浄する。ヘパリンカラムを用いた1回目の精製では、100%ヘパリンバッファーBで段階的に溶出した。ピークが見られた溶出液をプールし、希釈して、KClの濃度を約400mMに戻した(約2倍希釈)。2回目の精製では、バッファーBに20%~100%の濃度勾配をかけ、タンパク質が溶出するまで15カラム容量(CV)を通液して溶出したこと以外は、1回目の精製と同様にして行った。
ヘパリンバッファーA:25mM HEPES-KOH pH 7.5、10%グリセロール、1mM DTT
ヘパリンバッファーB:25mM HEPES-KOH pH 7.5、2M KCl、10%グリセロール、1mM DTT
【0152】
HiPrep 16/60 Sephacryl S-200HRカラムを使用して自動プログラムによりサイズ排除クロマトグラフィーを実施して、プールしたヘパリンカラム溶出液をさらに分離した。
サイズ排除カラムバッファー:25mM HEPES-KOH pH 7.5、0.8M KCl、10%グリセロール、1mM DTT
タンパク質モノマーのピークが見られた溶出液をプールし(典型的な濃度:7~8 mg/mL)、2~5mMのDTTを添加してから小分けし、液体窒素で凍結後-80℃で保存したところ、少なくとも1年間にわたって明らかな活性の喪失は認められなかった。グリセロールの濃度が50%になるように調整した同じバッファーを使用して使用溶液を希釈し、1.25mg/mL(=約10μM)の濃度で-20℃にて保存する。試験した最長保存期間(約4~6ヶ月)にわたり明らかな活性の喪失は認められなかった。
【0153】
逆転写酵素(RT)のプライマー伸長活性を分析するための典型的なアッセイでは、T7 RNAポリメラーゼで転写後に精製して得られたRNA鋳型に化学合成DNAプライマーをアニールしたものを使用した。この鋳型とプライマーにより、5’突出末端を有するプライマー伸長用鋳型基質を形成させた。反応条件は、通常、20mM Tris-HCl pH 7.5、150 mM KCl、2mM MgCl2および10%グリセロール中において、室温または37℃でインキュベートするものとした。核酸の最終濃度は、通常、20~200nMとした。逆転写酵素(RT)タンパク質は、通常、約0.1~1.0μMの濃度で加えた。ヌクレオチドの濃度は様々に変えた(2.5~500μM)。通常、変性PAGEを実施後、SYBR Gold染色を行い、Typhoon Trioを用いて画像化することによって伸長産物を検出した。
【0154】
複数の鋳型分子のプロセッシブな利用(すなわち連続的な鋳型の複製)による典型的なcDNA合成アッセイでは、DNAプライマーを第2の鎖(通常はRNA)と完全または部分的にアニールさせて、プライマーの3’末端を平滑末端二本鎖または所定の配列の短い3’突出末端の形態とした。鋳型は、化学的に合成されたRNAオリゴヌクレオチドもしくはDNAオリゴヌクレオチド、および/またはT7 RNAポリメラーゼで転写した精製RNAを含んでいた。様々な生物材料から単離した鋳型も使用した。反応条件は、通常、20mM Tris-HCl pH 7.5、150 mM KCl、2mM MgCl2および10%グリセロール中において、室温または37℃でインキュベートするものとした。各核酸の最終濃度としては、通常、アニール前の二本鎖プライマーは20~90nMとし、鋳型は20~200nMとし、必要に応じて使用される第2のcDNA 3’アダプター付き鋳型は20~90nMとした。逆転写酵素(RT)タンパク質は、通常、約0.1~1.0μMの濃度で加えた。
【0155】
結果
タグを付加した真核生物由来RTタンパク質の全長(配列番号5)およびΔN69Bomo RTタンパク質(配列番号6)は、不純物を含まずに高収率で精製することはできなかった。これに対して、R2レトロエレメント逆転写酵素(R2 RT)配列よりも前の、配列特異的DNA結合ドメインを含む配列を欠失させたタグ付加N末端切断型BomoC(配列番号3および配列番号7)(
図1A)は、イントロンRTよりも高い収率で得ることができた。MBPタグおよび6×ヒスチジンタグを付加した精製タンパク質は、予測されたモノマー分子量でゲル濾過カラムから溶出され(
図1B)、260nmと280nmの吸光度比から、核酸不純物のない純粋なタンパク質であることが示され(
図1C)、この結果は核酸の検出によっても確認された。
【0156】
精製したRTタンパク質を使用して、鋳型にアニールしたDNAプライマーの伸長を触媒することができた(これは、レトロウイルス由来RTを使用した典型的なアッセイである)(
図2)。本明細書に記載のRTタンパク質を用いた用途に必須のMg
2+バッファーやMn
2+バッファーなどの様々なバッファー条件において、一本鎖構造に対しても二本鎖構造に対しても、野生型のR2 RT配列が有するRNAヌクレアーゼ活性やDNAヌクレアーゼ活性を上回る活性は検出されなかった。同じ発現条件および精製プロトコルを使用することにより、様々なN末端切断型R2 RTおよび様々なイントロンRT精製物が、再現性良く発現および精製されており、これには、エンドヌクレアーゼ機能を欠失させるD996A変異を有するカイコガ由来のタグ付加ΔN303 R2 RTバリアント(配列番号12;BomoMin(ed))とも呼ぶ)も含まれ、このR2 RTバリアントは、BomoC(ed)と同程度の収率および活性で精製されている。
【0157】
スクリーニングした酵素のうち、最も合成活性が高かった真核生物由来RTは、最も合成活性が高かったイントロンRTよりも、大幅に高い効率で連続的に鋳型を複製することができた(
図3)。なお、このイントロンRTは、タグを付加していない配列番号4の配列の全長を有するものであり、長い鋳型からの合成においてプロセッシブ(連続的)な合成活性が最も高いイントロンRTとして過去に報告されているものである(Zhao C, Liu F, Pyle AM RNA. 2018 24(2):183-195)。R2 RTのC末端エンドヌクレアーゼドメインの活性部位は、非特異的な一本鎖核酸の分解を触媒し、この分解は、Mn
2+含有バッファー中で特に顕著であり(
図4A)、さらに、このC末端エンドヌクレアーゼドメインは、高収率なタンパク質の製造、溶液の安定性および精製タンパク質の活性に大きく寄与するものであったことから(
図1および
図2)、前述のエンドヌクレアーゼドメイン活性部位の変異と同様に(エンドヌクレアーゼの触媒活性の欠失を意味する略語として「(ed)」と呼ぶ)、N末端切断型R2 RTバリアントをさらに改変してヌクレアーゼ活性を欠失させた。
【0158】
実施例2:非レトロウイルス由来逆転写酵素(RT)のターミナルトランスフェラーゼ活性をMn
2+
で刺激することによる一本鎖RNAおよび/または二本鎖RNAの3’末端の伸長
DNAの3’末端へのデオキシヌクレオチドの付加を触媒する酵素であるターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)を使用することによって、様々な分子生物学的用途が大幅に可能となった。TdTは、4種のdNTPのいずれか、またはその他の様々な非修飾ヌクレオチドもしくは修飾ヌクレオチドを利用して、TdTが好適とする一本鎖DNA基質の3’末端OH基を伸長することができる(Sarac and Hollenstein Chembiochem. 20(7):860-871, 2019)。TdTの活性を利用することによって、アダプター配列の塩基対形成用プラットフォームを使用して、様々なDNA末端(たとえば一本鎖cDNAの末端)のプールにテールを付加することができるため、TdTは、様々な研究プロトコルや臨床プロトコルにおいて中心的な役割を果たしている。また、TdTは、検出シグナルまたは精製シグナル(蛍光、放射線、ビオチンなど)が結合されたヌクレオチド類似体を利用することもできる。近年では、可逆的に伸長鎖を終止させるヌクレオチド類似体を用いた新規なオリゴヌクレオチドの合成にも使用されている。
【0159】
しかし、残念ながら、一本鎖RNAの3’末端の伸長に利用可能な、天然のTdTバリアントや組換えTdTはいまだに作製されていない。その代わりに、RNAポリ(A)ポリメラーゼなどの、特定のヌクレオチドを付加するポリメラーゼによって一本鎖RNAを伸長することができる(Eckmann et al. Wiley Interdiscip Rev RNA. 2(3):348-61, 2011)。TdTがデオキシヌクレオチドを分配しながら付加していくのに対して、市販のRNAポリ(A)ポリメラーゼは、通常、高い処理能力でリボヌクレオチドを付加することから、同じ反応において、一部の基質には長いポリ(A)テールが付加されるが、その他の基質は伸長されないといったことが起こる。さらに、1つの反応で各分子に異なるテール配列を(たとえばユニークな分子識別子(unique molecular identifier)として)付加することは不可能であり、別々の反応において、様々な分子プールに様々なテール配列を(たとえばバーコードとして)付加して、後の工程で組み合わせることも不可能である。さらに、前述のRNAポリメラーゼは二本鎖RNAの3’末端を伸長することはできず、このことから、RNAポリメラーゼの有用性は限定的なものとなっている。本明細書では、dNTP、NTPおよび/またはddNTPを利用した一本鎖RNAの3’末端の伸長(3’末端へのテーリングとも呼ぶ)が可能な、広範なヌクレオチド基質に対するTdT様ターミナルトランスフェラーゼ活性を開示する。本明細書で開示するこのTdT様ターミナルトランスフェラーゼ活性は、本願に記載の新規なRNA-seq法などの、幅広い分野での現行の研究および将来的な研究ならびに臨床用途に使用することができる。
【0160】
方法
所望のpHの適切なバッファー(通常、pH6~pH9の範囲、たとえば20mM Tris-HCl pH7.5)中において、修飾の対象となる核酸基質をMnCl2(通常、0.5~5mMの範囲、たとえば2mM)と混合する。前記基質の3’末端のOH基の伸長に利用されるNTP、dNTP、ddNTPおよび/または三リン酸型ヌクレオチド類似体(たとえば、dTTP+dCTP+dGTP+dATP+ddATP)を加える。非レトロウイルス由来RT酵素(たとえば、R2 RTまたはイントロンRT、通常、最終濃度0.2~1μM、たとえば0.5μM)を加える。EDTAなどのMn2+のキレート剤以外の、その他のバッファー添加剤を反応に加えてもよく、かつ/またはこれにより反応を刺激する。所望の割合の基質が伸長され、かつ/または3’末端へのテーリングが所望の長さになるまで反応を進めるのに必要な時間にわたり、簡便な温度(通常4℃~50℃、たとえば室温または37℃)において、構築した反応をインキュベートする。EDTAなどのキレート剤の添加、RTの熱不活性化(たとえば、65℃で5分間)、または使用されていないヌクレオチド基質の加水分解(たとえば、エビアルカリホスファターゼ(NEB社)の使用)により反応を停止してもよい。得られた伸長産物は、3’末端に付加されたテールから生成されるシグナル(たとえばインターカレート色素、吸光度またはFRET)を直接検出してもよく、組み込まれたシグナルを検出するために(たとえばフィルターへの結合や沈殿により)精製してもよく、後続の反応(たとえばアレイハイブリダイゼーションやRNA-seq)に使用してもよく、(たとえばPAGEやクロマトグラフィーにより)分離してもよく、その他の処理を行ってもよい。
【0161】
RNAは、インタクトなものであってもよく、断片化されたものであってもよく、DNAまたはその他の非RNAを含んだキメラRNAであってもよく、部分的に二本鎖のRNAであってもよく、二本鎖RNAであってもよく、DNAを含んだ部分的に二本鎖のRNAであってもよく、RNAとDNAの二本鎖であってもよい。前記プロトコルは、3’末端にOH基を有するRNAに使用され、RNAが3’末端にOH基以外の基を有する場合、3’末端へのテーリングを行う前に修復酵素を使用して3’末端OH基を作製することができる。たとえば、様々な市販のホスファターゼ酵素(たとえばT4 PNK)を使用して、3’モノリン酸または2’3’環状モノリン酸を3’末端OH基に変換する。鋳型は、二次構造を除去するために変性されたものであってもよく、変性されていなくてもよい。RNAの3’末端が酵素活性部位にアクセスしやすくするための核酸結合タンパク質またはその他の化合物を反応に添加してもよい。処理能力を調整するために、反応条件を調節してもよい。さらに、たとえば、Mn2+に対する活性依存性を別の二価カチオンに変更するため、あるいは所望のヌクレオチド類似体の使用を可能にするために、酵素活性部位に変異を加えて、反応をさらに柔軟なものとし、その適用範囲を広げることもできる。
【0162】
結果
R2 RTおよびイントロンRTはいずれも、Mn
2+による刺激下において、RNA基質を伸長することが可能なターミナルトランスフェラーゼ活性を示す(
図4~
図6)。R2 RTのC末端エンドヌクレアーゼドメインの活性部位は、非特異的な一本鎖核酸の分解を触媒し、この分解は、Mn
2+含有バッファー中で特に顕著であり(
図4A)、さらに、このC末端エンドヌクレアーゼドメインは、高収率なタンパク質の製造、溶液の安定性および精製タンパク質の活性に大きく寄与するものであったことから(
図1および
図2)、エンドヌクレアーゼドメイン活性部位に変異を加えることによって、N末端切断型R2 RTバリアントをさらに改変してヌクレアーゼ活性を欠失させた(配列番号3、配列番号12および配列番号13を参照されたい)。
【0163】
特定のオリゴヌクレオチド基質およびヌクレオチド基質に対する改変R2 RTの選択性とイントロンRTの選択性は異なる。これらの酵素や、ターミナルトランスフェラーゼ活性がさらに調整されるように組換えた別の酵素バリアントによって、配列付加に関する様々な特異性の幅を広げることができる。R2 RTおよびイントロンRTのいずれにおいても、dNTPもしくはNTPまたはヌクレオチドの組み合わせを様々に変えることによって、様々な効率で様々な長さの3’末端伸長を行うことができる。たとえば、R2 RTまたはイントロンRTによる長い突出末端の形成に適したヌクレオチドはdATPであるが、短い突出末端の形成にはdTTPがより適していると考えられる(BomoC(ed)については
図4Aを参照し、Eureの反応については
図5を参照されたい)。また、単一のddNTPの付加による標識は、1mM未満のMgCl
2の存在下または非存在下において1~2mMのMnCl
2を使用した反応で効率的である(
図4B)。また、dATPを利用したR2 RTで二本鎖RNAの末端を標識することによって、長い3’突出末端を形成することができるが、短い突出末端の合成にはdGTPまたはdCTPが理想的だと考えられる(
図6A)。さらに、二本鎖RNAの3’末端へのテーリングは、Mg
2+を含むバッファー中では限定的にしか起こらないが、Mn
2+を含むバッファー中では非常に効率的に起こる(
図6B)。Mn
2+を含む反応は、相同性がほとんどないか、相同性が全くない一本鎖RNA鋳型に対するcDNAの合成において、一本鎖RNAプライマーの無制御なプライミングがないことを特徴とするが、Mg
2+のみを使用したR2 RT反応では、鋳型の全長で「自己プライミング」活性が起こることが過去に報告されており(Luan, Eickbush Mol Cell Biol. 1996 16(9): 4726-34)、この結果、異常な伸長産物分子が形成され、インタクトな鋳型分子が枯渇してしまうという問題がある。Mg
2+含有バッファー中において一本鎖RNA、4種のdNTPおよびR2 RTを反応させると、最初に非特異的なプライミングが起こり、それに続いて連続的な鋳型の複製が複数回起こることによって、cDNAの3’末端が伸長して伸長産物のラダーバンドが形成されることがあるが、得られる伸長産物の特性は、Mn
2+で誘導した非レトロウイルス由来RTのターミナルトランスフェラーゼ活性により得られる伸長産物とは顕著に異なる。
【0164】
非レトロウイルス由来RTがRNA分子の3’末端を伸長する能力は、複雑な混合物中のすべてのRNA分子の3’末端にヌクレオチドを均一に付加するという用途に有用であり、これによって、RNAの3’末端に結合する酵素(ポリメラーゼ、リガーゼ、ヌクレアーゼなど)が様々な分子を等しく利用することが可能となる。このような用途で利用することによって、連続的な鋳型の複製によるcDNAのコンカテマー化を向上させることができ(実施例4参照)、さらに、ほぼ無作為な順序での鋳型のジャンピングではなく、順序だった鋳型の受け渡しが促されることにより、5’アダプターおよび3’アダプターが付加された均一な配列を含むcDNAライブラリーを作製することができる(実施例6~9参照)。別の有用な用途としては、インプットとしてのRNAプールにシグナル標識ヌクレオチドを添加することにより、たとえば、マイクロアレイによる配列混合物の特性評価などに有用なハイブリダイゼーション用プローブを作製することができる。
【0165】
本明細書で述べるような、RNA基質に対して発揮される非レトロウイルス由来逆転写酵素(RT)のターミナルトランスフェラーゼ活性は、先行技術から予測できなかったものであり、真核生物由来の逆転写酵素と原核生物由来の逆転写酵素に共通する特徴であることから、その他の種類の非レトロウイルス由来逆転写酵素でも、このような活性が示される可能性があると予想され、本明細書に記載の用途に使用される逆転写酵素の代替として使用できる可能性がある。また、酵素を別の成分と融合することによって、基質に対する別の結合親和性を付与することができ、たとえば、一本鎖もしくは二本鎖の核酸結合ドメイン、二次構造を除去する作用を有する酵素、またはその他の成分に逆転写酵素を共有結合またはそれ以外の方法で結合させて、基質に対する別の結合親和性を付与することができる。
【0166】
実施例3:真核生物由来非LTR RTおよび細菌由来非LTR RTをMn
2+
で刺激した際のターミナルトランスフェラーゼ活性による一本鎖DNAおよび/または二本鎖DNAの3’末端の伸長
ターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)は、一本鎖DNAの3’末端へのテーリングに現在最も適した酵素である。しかしながら、その汎用性には偏りがある。たとえば、TdTの組み込み活性は、dATPの組み込みよりも、dGTP、dCTPおよびdTTPの組み込みにおいて大幅に高い(Berdis et al. Chembiochem. 8(12):1399-408, 2007)。また、血漿中や、古代試料由来の古代DNAおよびその他の材料中に一本鎖DNAが存在するということが認識され始めてから、このようなDNAの修飾およびシーケンシングに使用するための新たなツールの開発がさらに重要視されている。本発明は、ターミナルトランスフェラーゼ活性を示すTdTやその他の非RTタンパク質ポリメラーゼとは異なる特異性で、DNAの3’末端を伸長することができるターミナルトランスフェラーゼを提供することによって、前述のようなニーズに応えようとするものである。
【0167】
方法
所望のpHの適切なバッファー(通常、pH6~pH9の範囲、たとえば20mM Tris-HCl pH7.5)中において、修飾の対象となる核酸基質をMnCl2(通常、0.5~5mMの範囲、たとえば2mM)と混合する。前記基質の3’末端のOH基の伸長に利用されるNTP、dNTP、ddNTPおよび/またはヌクレオチド類似体(たとえば、dTTP+dCTP+dGTP+dATP+ddATP)を加える。非レトロウイルス由来RT酵素(たとえば、R2 RTまたはイントロンRT、通常、最終濃度0.2~1μM、たとえば0.5μM)を加える。EDTAなどのMn2+のキレート剤以外の、その他のバッファー添加剤を反応に加えてもよく、かつ/またはこれにより反応を刺激する。所望の割合の基質が伸長され、かつ/または3’末端へのテーリングが所望の長さになるまで反応を進めるのに必要な時間にわたり、簡便な温度(通常4℃~50℃、たとえば室温または37℃)において、構築した反応をインキュベートする。EDTAなどのキレート剤の添加、RTの熱不活性化(たとえば、65℃で5分間)、または使用されていないヌクレオチド基質の加水分解(たとえば、エビアルカリホスファターゼ(NEB社)の使用)により反応を停止してもよい。得られた伸長産物は、3’末端に付加されたテールから生成されるシグナル(たとえばインターカレート色素、吸光度またはFRET)を直接検出してもよく、組み込まれたシグナルを検出するために(たとえばフィルターへの結合や沈殿により)精製してもよく、後続の反応(たとえばアレイハイブリダイゼーションやRNA-seq)に使用してもよく、(たとえばPAGEやクロマトグラフィーにより)分離してもよく、その他の処理を行ってもよい。
【0168】
DNAは、インタクトなものであってもよく、断片化されたものであってもよく、RNAまたはその他の非DNAを含んだキメラDNAであってもよく、部分的に二本鎖のDNAであってもよく、二本鎖DNAであってもよく、RNAを含んだ部分的に二本鎖のDNAであってもよく、DNAとRNAの二本鎖であってもよい。前記プロトコルは、3’末端にOH基を有するDNAに使用され、DNAが3’末端にOH基以外の基を有する場合、修復酵素を使用して、3’末端へのテーリングを行う前に3’末端OH基を作製することができる。たとえば、3’モノリン酸または2’3’環状モノリン酸を、様々な市販のホスファターゼ酵素(たとえばT4 PNK)で3’末端OH基に変換する。鋳型は、二次構造を除去するために変性されたものであってもよく、変性されていなくてもよい。DNAの3’末端が酵素活性部位にアクセスしやすくするための核酸結合タンパク質またはその他の化合物を反応に添加してもよい。処理能力を調整するために、反応条件を調節してもよい。さらに、たとえば、Mn2+に対する活性依存性を別の二価カチオンに変更するため、あるいは、所望のヌクレオチド類似体の使用を可能にするために、酵素活性部位に変異を加えて、反応をさらに柔軟なものとし、その適用範囲を広げることもできる。
【0169】
結果
非レトロウイルス由来RTのプロセッシブ(連続的)なターミナルトランスフェラーゼ活性は、Mn
2+を含むバッファー中で認められるが、Mg
2+を含むバッファーではこのような活性は見られない(BomoC(ed) RTの活性については
図7Aを参照し、Eure RTの活性については
図8を参照されたい)。Mg
2+の存在下において、イントロンRTは、一本鎖DNAの3’末端に1~3個のdATPを付加することができるが(
図8)、このような活性はR2 RTでは検出されなかった(
図7A)。一本鎖DNA、4種のdNTPおよびR2 RTまたはイントロンRTを反応させると、反応中にDNAの3’末端とDNA中の別の分子との間で塩基対形成が限定的に起こることによってDNA合成産物が形成されることがあるが、これらは非レトロウイルス由来RTのターミナルトランスフェラーゼ活性により得られる伸長産物とは異なる。また、特定のオリゴヌクレオチド基質およびヌクレオチド基質に対する改変R2 RTの選択性とイントロンRTの選択性は異なる。これらの酵素や、ターミナルトランスフェラーゼ活性がさらに調整されるように組換えた別の酵素バリアントによって、配列付加に関する様々な特異性の幅を広げることができる。たとえば、二本鎖DNAへのプロセッシブ(連続的)な3’末端テーリングに適したヌクレオチドは、dATPである(
図6A)。また、dATPは、一本鎖DNAにおける長い突出末端の形成にも適しているが、短い突出末端の形成にはdTTPがより適していると考えられる(
図7B)。
【0170】
非レトロウイルス由来RTがDNA分子の3’末端を伸長する能力は、複雑な混合物中のすべてのDNA分子の3’末端にヌクレオチドを均一に付加するという用途に有用であり、これによって、DNAの3’末端に結合する酵素(ポリメラーゼ、リガーゼ、ヌクレアーゼなど)が、様々な分子を等しく利用することが可能となる。このような用途で利用することによって、連続的な鋳型の複製によるcDNAのコンカテマー化を向上させることができ(実施例4参照)、さらに、ほぼ無作為な順序での鋳型のジャンピングではなく、順序だった鋳型の受け渡しが促されることにより、5’アダプターおよび3’アダプターが付加された均一な配列を含むcDNAライブラリーを作製することができる(実施例6~9)。別の有用な用途としては、インプットとしてのDNAプールにシグナル標識ヌクレオチドを添加することにより、たとえば、マイクロアレイによる配列混合物の特性評価などに有用なハイブリダイゼーション用プローブを作製することができる。
【0171】
本明細書で述べるような、非レトロウイルス由来逆転写酵素(RT)の効率的なターミナルトランスフェラーゼ活性は、真核生物由来の逆転写酵素と原核生物由来の逆転写酵素に共通する特徴であることから、その他の種類の非レトロウイルス由来逆転写酵素でも、このような活性が示される可能性があると予想され、本明細書に記載の用途に使用される逆転写酵素の代替として使用できる可能性がある。また、酵素を別の成分と融合することによって、基質に対する別の結合親和性を付与することができ、たとえば、一本鎖もしくは二本鎖の核酸結合ドメイン、二次構造を除去する作用を有する酵素、またはその他の成分に逆転写酵素を共有結合またはそれ以外の方法で結合させて、基質に対する別の結合親和性を付与することができる。
【0172】
実施例4:均質な鋳型または鋳型混合物からの、鋳型に相補的なcDNAコンカテマーの合成
タンデムに連結された配列アレイは、特に、DNAナノテクノロジーやゲノムエンジニアリングにおいて利用される(Endo et al. Current Protoc. Nucleic Acid Chem. 2011 Chapter 12: Unit12.8; Zhang et al. Plant J. 70(2): 357-365, 2012)。細胞中において、タンデムに連結された配列アレイをプラスミド上または染色体上で構築および維持しようとすると、組換えおよび修復を介した欠失および変異による制限を受ける。精製されたDNAリガーゼを使用してタンデムに連結された配列アレイを作製する場合、通常、DNAの二本鎖セグメントが必要とされ、PCRによるタンデムに連結された配列アレイの作製には配列の重複が必要となる。より安価で配列の制約も少ない合成方法では、配列の重複がない一本鎖オリゴヌクレオチドDNAからなる鋳型が使用される。また、DNAに加えて、RNAも鋳型として適切である場合、使用可能な鋳型の範囲が広くなり、たとえば、生物学的なRNA材料またはRNAポリメラーゼによる増幅を使用して鋳型を作製することが可能になる。鋳型を繰り返し複製することにより配列をコンカテマー化することによって、同じアダプターに挟まれたcDNA産物中に数多くの分子の配列を捕捉することができ、これをPCRやシーケンシング(たとえば、Pacific BiosciencesもしくはNanopore)などの用途に利用することができる。本明細書では、これら技術の改良やその適用範囲の拡大などのための機構を提供する。
【0173】
方法
配列アレイ作製開始用の二本鎖プライマーを、所望のpHの適切なバッファー(通常、pH6~pH9の範囲、たとえば20mM Tris-HCl pH7.5)で希釈する。反応条件を調節して、二本鎖プライマーと鋳型の比率を所望のものとし(たとえば、それぞれ45~1000nMの範囲)、所望の量のコンカテマー化が刺激されるように、一価イオンの濃度(たとえば150~450mMのKCl)、MgCl2の濃度(たとえば2mM)、酵素安定化グリセロールの濃度(たとえば10%)、DTTの濃度(たとえば1~2mM)をそれぞれ調整する。NTP、dNTPおよび/または三リン酸型ヌクレオチド類似体(たとえば、dTTP+dCTP+dGTP+dATP+アミノアリルdUTPの混合物)を加える。非LTR RT酵素(たとえば、R2 RT、通常、最終濃度0.1~1μM、たとえば0.5μM)を加える。EDTAなどの二価イオンキレート剤以外の、その他のバッファー添加剤を反応に加えてもよく、かつ/またはこれにより反応を刺激する。所望の割合の基質が伸長され、かつ/または所望の長さのcDNAが合成されるまで反応を進めるのに必要な時間にわたり、簡便な温度(通常4℃~50℃、たとえば室温または37℃)で、構築した反応をインキュベートする。EDTAなどのキレート剤の添加、RTの熱不活性化(たとえば、65℃で5分間)、または使用されていないヌクレオチド基質の加水分解(たとえば、エビアルカリホスファターゼ(NEB社)の使用)により反応を停止してもよい。得られた伸長産物は、3’末端に付加されたテールから生成されるシグナル(たとえばインターカレート色素、吸光度またはFRET)を直接検出してもよく、組み込まれたシグナルを検出するために(たとえばフィルターへの結合や沈殿により)精製してもよく、後続の反応(たとえばアレイハイブリダイゼーションやRNA-seq)に使用してもよく、(たとえばPAGEやクロマトグラフィーにより)分離してもよく、その他の処理を行ってもよい。
【0174】
配列アレイ作製開始用の二本鎖プライマーは改変することができ、たとえば、鋳型に相補的な配列となるように改変することができる。また、cDNAの合成前に、(たとえば、R2 RTのターミナルトランスフェラーゼ活性を利用して)配列不明の鋳型に、1つまたは数個のヌクレオチドからなる3’テールを付加する場合、この3’末端へのテーリング反応により、cDNA配列モジュール同士を隔てるスペーサーが形成される。
【0175】
結果
R2 RTによるcDNAのコンカテマー化の効率は、cDNA合成反応のdNTPの濃度によって様々に変動する(
図9)。dNTPの濃度がcDNAのコンカテマー化の効率に及ぼす影響は、平滑末端を有するプライマーまたはcDNA産物の3’末端に、鋳型に依存せずに付加されたdNTPの量により、少なくとも部分的に測定することができる(
図10:この反応には、チミン(T)が1塩基突出した3’末端または平滑末端を有する二本鎖プライマー、BomoC(ed)およびdNTPのみが含まれる;反応産物は、鋳型に依存することなくプライマーの3’末端に付加されたヌクレオチドを反映する)。プライマーに付加された1塩基の突出末端またはcDNA産物の3’末端は、相補的な鋳型の3’末端に対して選択的に作用するが、非相補的な3’末端を有する鋳型に対しては抑制的に作用する(
図11)。2塩基の突出末端は、通常、cDNAの合成を低下させ、3塩基以上の突出末端は、cDNAの合成を強く抑制する。R2 RTは、鋳型に依存することなく、数個のdATPを利用して、DNAの平滑末端を選択的に伸長するため、ポリメラーゼ反応において通常使用されるdATPの濃度(たとえば250~500μM)では、100分の1の濃度でdATPを使用した反応と比較して、R2 RTによるcDNAのコンカテマー化が抑制される(
図9:250μMのdATPを使用したレーン2のcDNA産物、500μMのdATPを使用したレーン3のcDNA産物、ならびに2.5μMのdATPを使用したレーン3およびレーン5~7を比較されたい)。R2 RTによるcDNAのコンカテマー化の効率は、dNTPの濃度以外にも、複製される鋳型の3’末端のヌクレオチドにも依存する。順序だった鋳型の受け渡しによりR2 RTでcDNAライブラリーを合成したハイスループットシーケンシングの結果から、鋳型の5’末端のヌクレオチドは、鋳型に依存しない最初のdNTPの付加にも影響を及ぼすことがあると考えられる。さらに、cDNAのコンカテマー化は、RNAおよび/またはDNAとしての鋳型の特性による影響も受ける。つまり、R2 RTは、RNAからなる鋳型、DNAからなる鋳型、DNA-RNAハイブリッドからなる鋳型のいずれもであっても、同程度の効率でこれらを利用することができるが、イントロンRTは、3’末端にDNAを有する鋳型では複製効率が低くなる(
図3)。
【0176】
効率的なコンカテマー化を実施するため、実験において鋳型の3’末端を選択する際の柔軟性に応じて、鋳型に依存しない付加制御方法を様々に組み合わせることができる。2.5μMのdNTPと500μMの1種のdNTPとを加える反応条件下での、単一の鋳型を使用したcDNAのコンカテマー化反応では、鋳型の3’末端がC、AまたはGの場合、C>A>Gの順で、dGTP、dTTPまたはdCTPをそれぞれ利用したcDNAのコンカテマー化の効率が増加した(
図9)。この反応における選択性は、塩などの各反応成分による影響を受けるが、全体的な設計原理としては、一般的なRT反応で使用されるdATP濃度(たとえば最大で100μM)よりも低い濃度でdATPを添加することを含む。
【0177】
実施例5:不可逆的または可逆的なcDNA合成の停止
RNA-seq解析およびその他の用途に使用されるcDNAライブラリーには、明確に区別可能な5’アダプター配列と3’アダプター配列が必要とされるが、このようなアダプター配列は、様々な鋳型が混在し無作為なジャンピングが起こりうるcDNA合成反応では使用されない。さらに、アダプター配列間に2つ以上の鋳型cDNAが挿入されると、がんの原因となる染色体の転座切断点の位置などに関しての重要な結論を得ることが難しくなる。このような融合遺伝子の偽陽性判定は、レトロウイルス由来RTを使用した現在のRNA-seq法の主なアーチファクトとなっている(Panagopoulos et al. Int J Biochem Cell Biol. 53:462-5, 2014)。鋳型の使用順序と複製されてタンデムに連結される鋳型の数を制御するためには、cDNAライブラリーの3’アダプター配列を複製した後に、cDNAの合成を停止することが望ましいと考えられる。本実施例では、このような問題点の改良方法について述べる。
【0178】
方法1
鋳型を除去せずにcDNAの合成を不可逆的に停止させる方法として、鋳型の完全な複製を可能にするが、別の鋳型分子が結合して伸長することを防ぐ5’骨格修飾または5’骨格伸長を有するcDNA 3’アダプター付き鋳型を使用する方法が挙げられる。このcDNA 3’アダプター付き鋳型の合成は、かさ高い修飾もしくは骨格の伸長などを停止させるその他の修飾(たとえば、5’末端へのビオチン、Cy3、Cy5またはその他の大きな基の付加)、ホスホジエステル結合以外の結合からなる十分な長さの骨格修飾もしくは骨格伸長(たとえばLNAもしくはPNA)、または塩基を含まない連続したホスホジエステル骨格もしくはホスホジエステル様骨格(塩基を含まない部位がタンデムに数個並んだ骨格)を導入することにより行われる。このような共有結合により付加される修飾に加えて、緊密に結合されたタンパク質による障壁やその他の妨害方法などの、共有結合に依らない修飾でも別の鋳型分子の結合を防ぐことができる。
【0179】
方法2
複数の鋳型の連続的な結合は、非酵素的切断により条件的に除去可能な5’骨格伸長によってもブロックすることができ、たとえば、300~350nmの紫外線を照射することにより切断可能なスペーサーをビオチン基とオリゴヌクレオチドの間に導入するPC Biotin(IDT社)を使用することができる。あるいは、酵素による5’末端のアデニリル化(AMPの付加)(Lama et al. RNA. 22(1):155-61, 2016)によっても、鋳型のタンデムな連結を極めて効率的にブロックすることができ、この修飾は、オリゴヌクレオチドに対してピロホスファターゼ活性を発揮する酵素(RppHなど)により除去することができる。
【0180】
結果
いくつかのブロック基候補は、鋳型のタンデムな連結を抑制するが、その他のブロック基候補は、鋳型のタンデムな連結を停止することができる(
図12)。5’末端のアデニリル化などの一部のブロック基は、生物学的鋳型に付加することができ、アダプター付き合成鋳型に付加することもできる。容易に解除可能な合成停止方法では、鋳型の付加と過剰な鋳型の除去を組み合わせて、DNAの伸長を連続して複数回行うことができ、このようなコンビナトリアルなバーコード法を繰り返すことによって、様々な分子が混合されたプールからのさらに多重化された合成が可能になり、空間的トランスクリプトーム解析において高い分解能を達成することができると考えられる(Moor et al. Curr Opin Biotechnol. 46:126-133, 2017)。
【0181】
実施例6:順序だった鋳型の受け渡しによる単一の反応での2つのアダプタータグを付加したcDNAの合成
様々な用途において、cDNAライブラリーの最も効率的な合成法として、使用者による反応中間体の精製やその他の処理を必要とすることなく、同じ反応において、逆転写された鋳型の相補配列に5’アダプターと3’アダプターを付加する方法がある。さらに、反応プール中の鋳型を区別することなく、ほぼ無作為な順序でこれらのアダプターを交換可能に付加する方法の代わりに(
図13A)、cDNAの両末端に5’アダプターと3’アダプターを配置し、cDNAのどちらの末端が、鋳型の5’末端または3’末端に対応するのかという情報を保持しながら、鋳型を順序だてて使用すると有利であると考えられる(
図13B)。本実施例では、このような改良がなされた方法を開示し(
図13B)、この方法は、その他の用途でも利用することができる。
【0182】
方法
cDNAへの5’アダプターと3’アダプターの融合に使用される鋳型の受け渡しの第1の工程と第2の工程において明確な特異性を付与するため、第1の工程で使用するプライマーおよび鋳型の3’末端の識別子と、第2の工程で使用するプライマーおよび鋳型の3’末端の識別子は異なるものとする(
図13B)。この方法では、鋳型に相補的なcDNA産物の3’末端がRTにより認識されることを抑制した方法と同様にして、5’アダプター付きプライマーの3’末端がRTにより認識されることを抑制する戦略が必要となる。幸いにも、R2 RTを使用する場合、イントロンRTを使用した場合とは異なり、ピリミジンが1塩基突出したプライマーを使用することによって、3~4塩基の突出が追加されてしまうような3’末端の伸長は抑制される(
図10)。このような特徴により、複製を開始するプライマーの3’末端と、cDNA産物の3’末端とを区別することが可能となり、cDNA産物の3’末端は、鋳型に依存することなく、平滑末端を有するプライマーの3’末端によりdNTPが付加される。ピリミジンヌクレオチド(たとえばチミン(T))1塩基が突出したcDNA 5’アダプター付きプライマーとコグネイトなプリンヌクレオチド(たとえばアデニン(A))を3’末端に有する鋳型は、チミン(T)1塩基が突出したプライマーにコグネイトな3’末端に持たないその他のあらゆる鋳型分子よりも選択的に複製される(
図13B)。一方、鋳型に依存しないヌクレオチドの付加は、プリンヌクレオチドの組み込みに非常に選択的であることから(
図9および
図10)、前記鋳型に相補的なcDNAの3’末端は、3’末端にプリンヌクレオチドを有する鋳型プールの別の分子と会合することはない(
図13B)。その代わり、3’末端にピリミジンヌクレオチド(たとえばC)を有するcDNA 3’アダプター付き鋳型が依然として反応に存在する場合、鋳型の受け渡しの第2の工程に使用される(
図13B)。
【0183】
鋳型の受け渡しの第2の工程の効率は、cDNA産物の作製に寄与しないcDNA中間体の3’末端へのテーリングを抑制することにより調節することができ、これは、たとえば、dNTPの濃度を変えたり、dNTPの類似体を使用したりすることによって行うことができる。また、鋳型の受け渡しの第2の工程の効率は、アダプター付き鋳型の局所濃度を上昇させることによっても調節することができ、これは、たとえば、液滴技術または表面への固相化により行うことができる。さらに、鋳型の受け渡しの第1の工程の特異性と第2の工程の特異性を区別するための別の原理として、たとえば、dNTP類似体を使用することもできる。たとえば、高濃度のiso-dGを用いた鋳型に依存しない付加反応を利用して、鋳型プールの3’末端を伸長することができる。このiso-dGは、鋳型にコグネイトなdNTPの存在下ではcDNAに組み込まれないが、鋳型に依存しないcDNAの3’突出末端へのヌクレオチドの付加反応には利用することができる。iso-dGはiso-dCと選択的に対形成し、このiso-dCは、3’アダプター付き鋳型の3’末端のみに配置してもよい。このような非古典的なヌクレオチドは、ミスマッチに寛容なポリメラーゼ(R2 RTなど)と古典的なdNTPのみによる反応で使用した場合、鋳型を正確に複製することはできないが、これは配列分析により容易に対応することができる。
【0184】
結果
順序だった鋳型の受け渡しによって、cDNAの合成に所望の特異性を付与することができる。3’末端にピリミジンを有するcDNA 3’アダプター付き鋳型は、ピリミジンが1塩基突出したcDNA 5’アダプター付きプライマーとは会合しないため、アダプターダイマーの形成が最小限に抑えられ、これは、特に、ヌクレオチドが1塩基突出したプライマーとコグネイトな3’末端ヌクレオチドを含む鋳型プールの存在下において効果を発揮する(
図12:アダプター付き鋳型を含まない反応における伸長産物(レーン4および9)と、アダプター付き鋳型を含む反応における伸長産物(レーン5~8および10~13)を比較されたい)。また、3’アダプター付き鋳型上の5’末端ブロック基を使用することによって、cDNA 3’アダプター付きの単一の配列が付加された後の連続的な鋳型の複製が停止された(
図12:アダプター付き鋳型をブロックしなかった反応における伸長産物(レーン5~6および10~11)と、アダプター付き鋳型の5’末端をブロックした反応における伸長産物(レーン7~8および12~13)を比較されたい)。
【0185】
実施例7:鋳型の3’末端修飾による、鋳型の喪失とcDNA合成反応副産物の抑制
R2 RT調製物は、RNAプライマーや鋳型との相補性がなくても、一本鎖RNAをcDNA合成用のプライマーとして利用することができる(Luan et al. Mol. Cell Biol. 16(9): 4726-4734, 1996; Bibillo et al. J. Mol. Biol. 316(3): 459-479, 2002)。この結果、大量の鋳型が別の鋳型分子を複製するためのプライマーとして使用され、センス鋳型とアンチセンス鋳型の融合物などの望ましくない二本鎖反応産物が形成され、かつ/またはRTにより鋳型として認識される鋳型の3’末端が枯渇してしまう。理想的には、使用者が鋳型として使用することを意図した鋳型プールの3’末端を修飾することによって、鋳型がプライマーとして使用されてcDNAの合成が阻害されることを防ぎ、それと同時に、鋳型として認識される分子が、使用者が意図する二本鎖プライマーまたはDNA産物の3’末端からcDNAを合成する能力を保持することが望ましい。本実施例では、RNA鋳型およびDNA鋳型に関するこのような問題点の改良を提供する。
【0186】
方法1:R2 RTまたはイントロンRTによりddNTPを付加することによる鋳型の3’末端の伸長
所望のpHの適切なバッファー(通常、pH6~pH9の範囲、たとえば20mM Tris-HCl pH7.5)中において、修飾の対象となる核酸基質をMnCl2(通常、0.5~5mMの範囲、たとえば2mM)と混合する。前記基質の3’末端のOH基の伸長に利用される単一もしくは複数種のddNTPおよび/または単一もしくは複数種のdNTPを加える(たとえば、dTTP+dCTP+dGTP+dATP+ddATP、またはddATPのみ、またはddGTPのみ)。非レトロウイルス由来RT酵素(たとえば、R2 RTまたはイントロンRT、通常、最終濃度0.2~1μM、たとえば0.5μM)を加える。EDTAなどのMn2+のキレート剤以外の、その他のバッファー添加剤を反応に加えてもよく、かつ/またはこれにより反応を刺激する。3’末端にOH基ではなくH基を有する基質が所望の割合に達するまで反応を進めるのに必要な時間にわたり、簡便な温度(通常4℃~50℃、たとえば室温または37℃)で、構築した反応をインキュベートする。EDTAなどのキレート剤の添加、RTの熱不活性化(たとえば、65℃で5分間)、または使用されていないヌクレオチド基質の加水分解(たとえば、エビアルカリホスファターゼ(NEB社)の使用)により反応を停止してもよい。
【0187】
方法2:TdTによりddNTPを付加することによるDNA鋳型の3’末端の伸長
所望のpHの適切なバッファー(通常、pH6~pH9の範囲、たとえば20mM Tris-HCl pH7.5)中において、修飾の対象となる核酸基質を、適切な二価カチオンであるMgCl2および/またはMnCl2(通常1~5mMの範囲、たとえば2 mM)と混合する。前記基質の3’末端のOH基の伸長に利用するための単一もしくは複数種のddNTPおよび/または単一もしくは複数種のdNTPもしくはNTPを加える(たとえば、ddATPおよび/もしくはdATP、ddGTPおよび/もしくはdGTP、ATP+ddATP、またはその他の組み合わせ;TdTは、限られた数のリボヌクレオチドしか組み込めない)。メーカーの推奨に従った希釈倍率でTdTを加える。3’末端にOH基ではなくH基を有する基質を得るのに必要な時間にわたり、簡便な温度(通常、約37℃)で反応をインキュベートする。EDTAなどのキレート剤の添加、TdTの熱不活性化(たとえば、75℃で20分間)、または使用されていないヌクレオチド基質の加水分解(たとえば、エビアルカリホスファターゼ(NEB社)の使用)により反応を停止してもよい。
【0188】
結果
3’末端にジデオキシヌクレオチドを有する鋳型は、効率的に認識されて、鋳型として合成に受け渡される。この鋳型は伸長可能な3’末端OH基を欠くため、R2 RTによる反応産物を変性PAGEに供し、SYBR Gold染色で直接検出したところ(
図14Aおよび
図14B)、非特異的な反応産物はそれほど多くは認められなかった。このような非特異的な反応産物は、通常であれば、数十塩基対長を超える長さの鋳型を含む反応の大半を占める。また、アダプター配列を付加したオリゴヌクレオチドを用いた場合、このような非特異的な反応産物は、PCRによる間接的な分析反応ではほとんど検出できない。PCRによる反応産物の検出ではなく、反応産物を分離して直接検出した場合にのみ、3’ジデオキシヌクレオチドからなるテールを付加した鋳型をcDNAの合成に使用することによる改善の程度が明らかとなった。具体的には、cDNA 5’アダプター付きプライマーが、イルミナ社のリード2配列に対する約35ntの相補鎖のみで構成されている場合(
図14A)、またはP7とバーコードi7とリード2に対する相補鎖で構成された約70ntのイルミナ社のNGSアダプターの全長である場合に(
図14B)、ddA付き鋳型が効率的に利用された。これらの5’アダプター付きプライマーのいずれを使用した場合でも、数個の3’アダプター付き鋳型(ランダムな配列(「最適化」)、イルミナ社のリード1を含む約35ntの3’アダプター付き汎用鋳型、またはP5とバーコードi5とリード1で構成された約70ntのイルミナ社のNGSアダプターの全長のいずれか)を使用した鋳型の受け渡しの第2の工程により、ddA付き鋳型が全長cDNAライブラリーに変換された(
図14Aおよび
図14B)。アダプターダイマーを含む副産物の形成は最小限に抑えられていた(
図14Aおよび
図14B)。
【0189】
実施例8:単一の容器において分割工程も固相化工程も必要としない、PCRフリーの次世代シーケンシング(NGS)用のcDNAライブラリーの作製
市場を独占しているイルミナ社のプラットフォームなどを使用したNGSシーケンシング用のcDNAライブラリーの最も効率的な合成では、使用者による中間産物の精製やその他の処理を必要とすることなく、同じ反応において、逆転写された配列に5’アダプターと3’アダプターを付加する。さらに、試料の処理、経過時間、操作時間、非定量的な結果、およびPCR工程の要件により課せられるその他の問題点を伴わずにライブラリーの作製が可能な方法を使用することが理想的である。本実施例では、このような問題点の改良方法と、その他の用途を提供する。cDNA合成用途のいくつかでは、初回のcDNA合成と最初に得られるcDNA相補鎖からの第2の鎖合成により得られた二本鎖DNA産物を使用すると有利である。たとえば、二本鎖産物は、鋳型のセンス鎖とアンチセンス鎖の両方に対するハイブリダイゼーションの標的として使用することができる。別の例として、二本鎖産物は、T4 DNAリガーゼやその他の一般的な方法を使用して、プラスミドベクターにクローニングすることができる。本実施例では、このような技術の改良方法について述べる。
【0190】
方法
cDNAの合成
インプットとしての鋳型を滅菌水で希釈する。二本鎖のDNAまたはRNAの場合は、熱変性させて、3’末端一本鎖領域を作製する必要がある。以下のプロトコルは最終量20μLのスケールであり、3’末端のインプット量は通常約1pmolである。鋳型が3’末端PO4基を有する場合は、工程1から開始する。37℃としている反応温度は一例としての温度であり、広範な温度範囲(通常4℃~50℃)で実施することができる。
【0191】
工程1(3’末端OH基の作製):
試料7.5μLにインプット希釈用バッファー(4×)3μLを加える。バッファーA1(12×)1μLとT4 PNK 0.5μL(NEB社、水と酵素ストック液を3:1の体積比であらかじめ希釈したもの)を加える。37℃で約10分間インキュベートする。65℃で約20分間インキュベートする。
【0192】
工程1を省く場合:
インプットとしての試料を12μLに希釈する。バッファーB2a(10×)1.4μLとバッファーB1b(20×)0.7μLを加える。バッファーBを添加後、工程2に続く。
【0193】
工程2(3’テール鋳型):
バッファーB1a(20×)0.7μLを加える。バッファーB1b(20×)0.7μLを加える。改変型R2 RT 1μLを加える。37℃で約20分間インキュベートする。65℃で約5分間インキュベートする。バッファーC(16×)1μLとrSAP 0.5μLを加える。37℃で約15分間インキュベートする。バッファーD 1μL(次の工程のため20×)を加える。65℃で約5分間インキュベートする。
【0194】
工程3(cDNAの合成):
cDNAプレップミックス(20×)1μLを加える。cDNAスタートミックス(20×)1μLを加える。改変型R2 RT 1μLを加える。37℃で約20分間インキュベートする。65℃で約5分間インキュベートする。
【0195】
試薬の一覧(いずれも-20℃で保存):
インプット希釈用バッファー(4×):80mM Bis-Tris(pH6.0)
バッファーA1(12×):120mM Bis-Tris(pH 6.0)、12mM MgCl2、12mM DTT
バッファーB1a(20×):0.4M Tris-HCl(pH 7.5)、0.4M KOH、3M KCl
バッファーB1b(20×):40mM MnCl2、10mM ddATP
バッファーB2a(10×):0.2 M Tris-HCl(pH 7.5)、1.5M KCl、10mM DTT
バッファーC(16×):80mM MgCl2
バッファーD(20×):100mM EGTA
cDNAプレップミックス(20×):10mM MgCl2、900mM KCl、40% PEG-6000
cDNAスタートミックス:40×「cDNAスタートミックス」ヌクレオチド(dGTP/dTTP/dCTP各20mMとdATP 4mM)と、40×「cDNAスタートミックス」オリゴヌクレオチドプールとを等量で混合して、20×スタートミックスを調製する。
【0196】
オリゴヌクレオチドの調製(たとえば、IDT社から購入した以下の試薬から合成):
PCRを使用しないワークフローにおいて、約70ntのアダプター付きプライマーと約70ntのアダプター付き鋳型を、それぞれに相補的な約30ntの鎖にそれぞれアニールする。部分的に二本鎖構造をとったこれらの鎖の最終濃度は90nMである。インデックスに下線を引いて示す。これらは可変バーコードである。
【0197】
部分的に二本鎖構造をとったアダプター付きプライマーは、
c5p(FL):5'-CAAGCAGAAGACGGCATACGAGATGACGAGAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(配列番号15)、
c5pt:5'rGrArUrCrGrGrArArGrArGrCrArCrArCrGrUrCrUrGrArArCrUrCrCrArGrU/3SpC3/-3'(配列番号16)
を含む。
【0198】
部分的に二本鎖構造をとったアダプター付き鋳型は、
c3t(FL):5'-/5AmMC6/AArUrGrArUACGGCGACrCrArCrCGAGATCTArCrArCrCGCAGACGArCrArCrUCTTTCCCTrArCrArCGACGCTCTrUrCrCrGrArUrCrUrC-3'(配列番号17)、
c3t_comp:5'/c/rGrUrGrUrArGrArUrCrUrCrGrGrUrGrGrUrCrGrCrCrGrUrArUrCrArUrU/3SpC3/-3'(配列番号18)
を含む。
【0199】
(ii)二本鎖cDNAに対するcDNAの合成の任意の継続
方法1
両末端にcDNAアダプターを付加した反応産物に、少なくともRNase H2(本願では、単一のリボヌクレオチドの5’末端を切断し、DNAの3’末端OH基を残す)を加え、さらにRNase H1(本願では、4残基のリボヌクレオチドの1番目と2番目の残基の間を切断し、RNAの3’末端OH基を残す)を添加してもよく、ここに、R2 RTまたは別のDNAポリメラーゼまたはRTを添加する。この方法では、cDNA 3’アダプター付き鋳型の5’末端は、RNase Hでの処理後にcDNA産物と会合した状態を維持するために、DNAである必要がある。cDNAの鋳型および/または5’アダプター付きプライマーの相補鎖のその他の領域もしくは3’アダプター付き鋳型が除去されない場合(たとえば、これらがDNAである場合)、添加されるDNAポリメラーゼまたはRTは、鎖置換活性を有する必要がある。
【0200】
方法2
両末端にcDNAアダプターを付加した反応産物に、ヌクレアーゼを添加するか、あるいはcDNA 3’アダプター付き鋳型の少なくとも5’末端において(たとえば加熱などにより)鋳型とcDNA鎖を解離させる。2回目の鎖合成用のプライマーとDNAポリメラーゼまたはRTを加える。cDNAの鋳型および/または5’アダプター付きプライマーの相補鎖領域もしくは3’アダプター付き鋳型が除去されない場合、添加するDNAポリメラーゼまたはRTは、鎖置換活性を有する必要がある。
【0201】
(iii)さらなる別の方法および合成法の継続
用途に応じて、ワークフローの一部のみを実施してもよい。試料は、ワークフローの途中でプールまたは分割することができる。この方法を実施する前に、同じ容器または別々の容器内でRNAまたはDNAを断片化してもよい。鋳型は、二次構造を除去するために変性されたものであってもよく、変性されていなくてもよい。鋳型が酵素活性部位に結合しやすくしたり、鋳型の3’末端が酵素活性部位にアクセスしやすくするための核酸結合タンパク質またはその他の化合物を反応に添加してもよい。処理能力を調整するために、反応条件を調節してもよい。鋳型の3’末端の伸長工程では、改変したR2 RTに、別の非レトロウイルス由来RTを添加して、鋳型の伸長効率を向上させることができる。また、酵素を別の成分と融合することによって、基質に対する別の結合親和性を付与することができ、たとえば、一本鎖もしくは二本鎖の核酸結合ドメイン、二次構造を除去する作用を有する酵素などに逆転写酵素を共有結合またはそれ以外の方法で結合させることにより、基質に対する別の結合親和性を付与することができる。cDNA産物は、PCRまたはその他の技術により増幅させ、cDNA産物の量を増加させることができ、あるいは、たとえば、オリゴヌクレオチドにおいてビオチンおよび/またはその他のアフィニティーリガンドを使用してcDNA産物を固相化したりアフィニティー精製するために、配列の付加、欠失または修飾を行うことができる。
【0202】
結果
前述の方法により、フローセル内においてP5付きオリゴヌクレオチドに結合する一本鎖cDNAライブラリーを作製することができる(
図15A)。963種のmiRNAが混合された一般に使用されている市販標準品(miRXplore)のシーケンシングを行うことによりベンチマークテストを実施したところ、単一の試験管内で反応を実施するワークフローにより、そのままシーケンシングに利用可能なcDNAライブラリーを2時間未満で作製することができ、次いで、その他のmiRNAライブラリー作製プロトコルで生成されるような望ましくない副産物を除去するための除去やサイズ選択を行う必要や、PCRを行う必要もなく、イルミナ社のNGSフローセルに導入できることが示された。変性PAGEおよびSYBR Gold染色により反応産物を分析したところ(
図15B)、反応産物の大半を占めるcDNAライブラリー(「cDNA+アダプター付き鋳型」で示す)およびmiRNA鋳型のみが複製されたcDNA産物(「cDNA」で示す)と比べて、アダプターダイマーなどの副産物の生成はほとんど検出されないことが示された。963種の各miRNAあたりのリードカウントを定量したところ、マッピングされた100万リード未満において963種のmiRNAのインベントリ全体が捕捉されたことが示された(
図16B;X軸の値は、マッピングされた100万リード未満から得られたPCRなしのライブラリーにおけるlog2スケールでのリードカウントであり、見かけのゼロ値は正確にはゼロ値ではない)。
【0203】
cDNA産物が一本鎖であるとその特性を有益に利用できる用途では、鋳型鎖として使用した核酸を、たとえば、熱変性、塩基の加水分解、またはヌクレアーゼによる分解により遊離または除去することができる。一部の用途では、たとえばRNase Hおよび/またはRNase Aを使用して、遊離のRNAおよび/またはcDNAに結合したRNAからcDNAを精製する。また、一部の用途では、たとえば、沈殿、核酸を結合させた支持体、電気泳動またはその他の方法を使用して、その他の反応成分からcDNAを精製する。また、一部の用途では、cDNAを二本鎖DNAに変換する。さらに、一部の用途では、たとえば、示差沈殿、支持体への結合、支持体上での分割、電気泳動またはその他の方法により精製して、特定のサイズのcDNAを濃縮する。
【0204】
順序だった鋳型の受け渡しにより作製された一本鎖cDNAは、試料の最小限の処理または最小限の処理時間で、二本鎖産物に変換することができる。3’アダプター付き鋳型を順序だてて受け渡すことによる合成は、その組成を柔軟に設計できることから、第2の鎖を合成する際に様々なアプローチを試みることが可能である。
【0205】
実施例9:単一の容器において分割工程も固相化工程も必要としない、NGS cDNAライブラリーへのPCRインデックスの付加
市場を独占しているイルミナ社のプラットフォームなどを使用したNGSシーケンシング用のcDNAライブラリーの最も効率的な合成では、使用者による中間産物の精製やその他の処理を必要とすることなく、同じ反応において、逆転写された鋳型相補鎖配列に5’アダプターと3’アダプターを付加する。短いアダプターで鋳型を挟んでcDNAライブラリーを作製し、次に、インデックスを付加したPCRプライマーを使用することにより、同時シーケンシングを行う前にcDNAプール中の配列を区別する方法は一般的に使用されている(Park YS, Kim S, Park DG, Kim DH, Yoon KW, Shin W, and Han K. Genes Genomics. Epub, Jul 26 2019)。この方法では、必要とされる各合成オリゴヌクレオチドの最大長が少なく済む。本発明では、RT反応後にPCR反応を行うことによりcDNAライブラリーを構築するという戦略のための方法を提供する。
【0206】
方法
別のオリゴヌクレオチドを使用し、最終のPCR工程を追加すること以外は、前記実施例8に記載のプロトコルと同様に行う。PCRにインデックスを付加するためのワークフローでは、約35ntのオリゴヌクレオチドをRT反応に使用することが最も適している。各オリゴヌクレオチドの最終濃度は180nMである。インデックスに下線を引いて示す。これらは可変バーコードである。
【0207】
アダプター付き二本鎖プライマーは、
c5p(uni):5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCC-3'(配列番号19)、
c5pt:5'rGrArUrCrGrGrArArGrArGrCrArCrArCrGrUrCrUrGrArArCrUrCrCrArGrU/3SpC3/-3'(配列番号20)
を含む。
【0208】
アダプター付き鋳型は、
c3t(uni):5'-/5Phos/ACACTCTTTCCCTACACGACGCTCTTCCrGrArUrCrUrC-3'(配列番号21)
である。
【0209】
PCR工程は、イルミナ社の標準的なライブラリー作製用PCR反応と並行して行う。cDNAライブラリーを鋳型として使用して、熱安定性DNAポリメラーゼ(たとえばQ5)によりPCR(たとえば、98℃20秒/65℃20秒/72℃5秒を4~8サイクル)を行い、以下のプライマーによりP5アダプターおよびP7アダプターを付加する。
P7:5’- CAAGCAGAAGACGGCATACGAGATTCGATCCAGTGACTGGAGTTCAGACGTG -3'(配列番号22)
P5:5'- AATGATACGGCGACCACCGAGATCTACACCGCAGACGACACTCTTTCCCTACACGAC -3'(配列番号23)
【0210】
結果
この方法により、二本鎖cDNAライブラリーを作製することができる(
図16A)。963種のmiRNAが混合された一般に使用されている市販標準品(miRXplore)のシーケンシングを行うことによりベンチマークテストを実施したところ、そのままシーケンシングに利用可能なcDNAライブラリーが2~3時間で作製できることが示された。また、PCRを行っていないライブラリー(X軸の値、一本鎖ライブラリー)と少ないサイクル数でPCRを行ったライブラリー(Y軸の値、二本鎖ライブラリー)とにおける963種の各miRNAのリードカウントを比較したところ、いずれの方法でも、マッピングされた100万リード未満において963種のmiRNAのインベントリ全体が捕捉されたという同等の性能が示された(
図16B)。両方法における結果が一致した場合、実際のデータにフィットさせた直線上にドットがプロットされる。少ないサイクル数でPCRを行ったライブラリーとPCRを行っていないライブラリーの間の結果の一致の程度は(
図16B)、少ないサイクル数でPCRを行ったライブラリーの2回の反復実験間の結果の一致の程度と同程度であったが、PCRを行っていないライブラリーの2回の反復実験間の結果の一致の程度よりも低かった。交差比較試験から得た配列リードを並行分析したところ、順序だった鋳型の受け渡しによりライブラリーを合成し、次いでPCRを省くか、あるいは少ないサイクル数でPCRを実施するプロトコルは、4種のmiRNA用の市販シーケンシングキットまたは小型RNA用の市販シーケンシングキットのいずれよりも、同定されたmiRNAの数が同等以上であり、シーケンシングされたmiRNAのリードカウントの変動係数も低かった(Coenen-Stass et al. RNA Biology 15(8) 1133-45 2018)。
【0211】
一部の用途では、PCRを行う前にcDNAを濃縮する。この濃縮は、鋳型からのDNAの分離、dNTPおよびオリゴヌクレオチドの除去、濃縮、サイズ分画など含んでいてもよい。また、一部の用途では、たとえば、沈殿、核酸を結合させた支持体、電気泳動またはその他の方法を使用して、その他の反応成分からDNAを精製する。さらに、一部の用途では、たとえば、示差沈殿、支持体への結合、支持体上での分割、電気泳動またはその他の方法により精製して、特定のサイズのDNAを濃縮する。
【0212】
その他の実施形態
本発明の理解を深めることを目的として、実例および実施例により本発明を詳細に述べてきたが、前述の説明および実施例は本発明の範囲を限定するものではない。本明細書において引用されたすべての特許文献および科学文献は、いずれも引用によりその全体が明示的に本明細書に援用される。
【0213】
本発明は、以下の発明を含む。
[1]単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質であって、切断型N末端領域と、RNA結合ドメインと、逆転写酵素(RT)ドメインと、エンドヌクレアーゼ機能を欠失させる変異を含むエンドヌクレアーゼドメインとを含む、非LTR RTタンパク質。
[2]R2レトロエレメント逆転写酵素(R2 RT)タンパク質である、前記[1]に記載の真核生物由来非LTR RTタンパク質。
[3]N末端領域が切断されていることにより、同じ非LTR RTタンパク質の全長と比較して、N末端の69~303個のアミノ酸が欠失している、前記[1]または[2]に記載の真核生物由来非LTR RTタンパク質。
[4]N末端領域が切断されていることにより、同じ非LTR RTタンパク質の全長と比較して、N末端の69~274個のアミノ酸が欠失している、前記[3]に記載の真核生物由来非LTR RTタンパク質。
[5]N末端領域が切断されていることにより、配列特異的DNA結合ドメインの全体またはその一部が欠失している、前記[1]または[2]に記載の真核生物由来非LTR RTタンパク質。
[6]N末端領域が切断されていることにより、配列特異的DNA結合ドメインの全体が欠失している、前記[1]~[5]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[7]N末端領域が切断されていることにより、同じ非LTR RTタンパク質の全長と比較して、N末端の274~303個のアミノ酸が欠失している、前記[6]に記載の真核生物由来非LTR RTタンパク質。
[8]配列特異的DNA結合ドメインを含んでいない、前記[5]~[7]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[9]節足動物に由来するものである、前記[1]~[8]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[10]前記節足動物がカイコガである、前記[9]に記載の真核生物由来非LTR RTタンパク質。
[11]カイコガのR2 RTタンパク質である、前記[10]に記載の真核生物由来非LTR RTタンパク質。
[12]エンドヌクレアーゼ機能を欠失させる前記変異が、カイコガのR2 RTタンパク質の全長(配列番号1)のアミノ酸残基D996、D1009またはK1026における置換変異である、前記[11]に記載の真核生物由来非LTR RTタンパク質。
[13]前記置換変異が、アミノ酸残基D996における置換変異である、前記[12]に記載の真核生物由来非LTR RTタンパク質。
[14]前記アミノ酸残基D996が、グルタミン酸(E)以外のアミノ酸で置換されている、前記[13]に記載の真核生物由来非LTR RTタンパク質。
[15]前記置換変異が、D996A変異である、前記[14]に記載の真核生物由来非LTR RTタンパク質。
[16]前記置換変異が、アミノ酸残基D1009における置換変異である、前記[12]に記載の真核生物由来非LTR RTタンパク質。
[17]前記アミノ酸残基D1009が、グルタミン酸(E)以外のアミノ酸で置換されている、前記[16]に記載の真核生物由来非LTR RTタンパク質。
[18]前記置換変異が、D1009A変異である、前記[17]に記載の真核生物由来非LTR RTタンパク質。
[19]前記置換変異が、アミノ酸残基K1026における置換変異である、前記[12]に記載の真核生物由来非LTR RTタンパク質。
[20]前記置換変異が、K1026A変異、K1026D変異またはK1026E変異である、前記[19]に記載の真核生物由来非LTR RTタンパク質。
[21]前記置換変異がK1026A変異である、前記[20]に記載の真核生物由来非LTR RTタンパク質。
[22]エンドヌクレアーゼ機能を欠失させる前記変異が、アミノ酸残基K1026およびK1029における置換変異である、前記[11]に記載の真核生物由来非LTR RTタンパク質。
[23]前記置換変異が、K1026A変異およびK1029A変異である、前記[22]に記載の真核生物由来非LTR RTタンパク質。
[24]安定化タンパク質をさらに含む、前記[1]~[23]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[25]前記安定化タンパク質が、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に連結されている、前記[24]に記載の真核生物由来非LTR RTタンパク質。
[26]前記安定化タンパク質が、リンカーペプチドを介して前記真核生物由来非LTR RTタンパク質に連結されている、前記[24]または[25]に記載の真核生物由来非LTR RTタンパク質。
[27]前記安定化タンパク質が、マルトース結合タンパク質(MBP)またはそのバリアントである、前記[24]~[26]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[28]前記安定化タンパク質が、前記真核生物由来非LTR RTタンパク質のN末端に連結されている、前記[24]~[27]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[29]精製タグをさらに含む、前記[1]~[28]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[30]前記精製タグが、前記真核生物由来非LTR RTタンパク質のN末端またはC末端に連結されている、前記[29]に記載の真核生物由来非LTR RTタンパク質。
[31]前記精製タグが、リンカーペプチドを介して前記真核生物由来非LTR RTタンパク質に連結されている、前記[30]に記載の真核生物由来非LTR RTタンパク質。
[32]前記精製タグが、ヒスチジンタグ、プロテインAタグまたはFLAGペプチドタグである、前記[29]~[31]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[33]前記ヒスチジンタグが、6×ヒスチジンタグである、前記[32]に記載の真核生物由来非LTR RTタンパク質。
[34]前記プロテインAタグが、タンデム型のプロテインAタグである、前記[32]に記載の真核生物由来非LTR RTタンパク質。
[35]前記FLAGペプチドタグが、3×FLAGペプチドタグである、前記[32]に記載の真核生物由来非LTR RTタンパク質。
[36]前記精製タグが、前記真核生物由来非LTR RTタンパク質のC末端に連結されている、前記[31]~[35]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[37]前記リンカーペプチドが、切断可能なリンカーである、前記[28]~[36]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[38]配列番号2のアミノ酸配列を含む、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質。
[39]配列番号3のアミノ酸配列を含む、単離された、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質。
[40]核酸不純物を実質的に含んでいない、前記[1]~[39]のいずれか1つに記載の真核生物由来非LTR RTタンパク質。
[41]一本鎖核酸または部分的に一本鎖の核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、一本鎖核酸または部分的に一本鎖の核酸を接触させる工程を含む方法。
[42]前記一本鎖核酸または部分的に一本鎖の核酸がDNAである、前記[41]に記載の方法。
[43]前記接触が、ターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)、レトロウイルス由来の逆転写酵素(RT)タンパク質またはその他の非RTタンパク質の非存在下で行われる、前記[42]に記載の方法。
[44]前記一本鎖核酸または部分的に一本鎖の核酸がRNAである、前記[41]に記載の方法。
[45]前記接触が、RNAリガーゼ、ポリアデノシンRNAポリメラーゼ、ポリウリジンRNAポリメラーゼまたはその他の非RTタンパク質の非存在下で行われる、前記[44]に記載の方法。
[46]A型二本鎖核酸の3’末端を少なくとも1塩基伸長させる方法であって、マンガンイオンを含むバッファー中において、ヌクレオチドポリメラーゼ活性を有する非レトロウイルス由来逆転写酵素(RT)タンパク質に、A型二本鎖核酸を接触させる工程を含む方法。
[47]前記A型二本鎖核酸が、RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態である、前記[46]に記載の方法。
[48]前記RNA-RNA二本鎖核酸、部分的にRNA-RNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端が、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む、前記[47]に記載の方法。
[49]前記A型二本鎖核酸が、RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態である、前記[46]に記載の方法。
[50]前記RNA-DNA二本鎖核酸、部分的にRNA-DNA二本鎖構造をとった核酸またはそれらの修飾形態の一端または両端が、平滑末端であるか、1塩基の3’突出末端またはそれ以外の長さの短い3’突出末端を含む、前記[49]に記載の方法。
[51]前記非レトロウイルス由来RTタンパク質が、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である、前記[41]~[50]のいずれか1つに記載の方法。
[52]前記非レトロウイルス由来RTタンパク質が、真核生物由来の非LTR RTタンパク質である、前記[51]に記載の方法。
[53]前記非レトロウイルス由来RTタンパク質が、前記[1]~[40]のいずれか1つに記載の真核生物由来非LTR RTタンパク質である、前記[52]に記載の方法。
[54]前記真核生物由来の非LTR RTタンパク質が、R2レトロエレメント逆転写酵素(R2 RT)タンパク質である、前記[52]に記載の方法。
[55]前記R2 RTタンパク質が、カイコガのR2 RTタンパク質である、前記[54]に記載の方法。
[56]前記非レトロウイルス由来のRTタンパク質が、原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質である、前記[51]に記載の方法。
[57]前記原核生物由来のイントロンRTタンパク質または細胞小器官のイントロンRTタンパク質が、Eubacterium rectaleのグループIIイントロンRTタンパク質である、前記[56]に記載の方法。
[58]前記バッファーが、リボヌクレオシド三リン酸(NTP)、デオキシリボヌクレオシド三リン酸(dNTP)、ジデオキシリボヌクレオシド三リン酸(ddNTP)およびそれらのヌクレオチド類似体のうちの1種以上を含む、前記[41]~[57]のいずれか1つに記載の方法。
[59]前記接触が、約4℃~約50℃で行われる、前記[41]~[58]のいずれか1つに記載の方法。
[60]相補的DNA(cDNA)分子を調製する方法であって、ピリミジンヌクレオチドが1塩基突出した末端を3’末端に含むプライマー鎖と非伸長鎖とを含む二本鎖プライマーを提供する工程;3’末端にプリンヌクレオチドを含むRNA鋳型を提供する工程;ならびに前記RNA鋳型に実質的に相補的なcDNA分子の作製に効果的な条件下において、マグネシウムイオンと1種以上のデオキシリボヌクレオシド三リン酸(dNTP)またはその類似体とを含むバッファー中で、前記二本鎖プライマーおよび前記RNA鋳型を逆転写酵素(RT)と接触させる工程
を含む方法。
[61]前記プライマー鎖が、DNAプライマー鎖である、前記[60]に記載の方法。
[62]前記プライマー鎖が、5’突出末端を含む、前記[60]または[61]に記載の方法。
[63]前記プライマー鎖が、その5’末端または内部部位に修飾を含む、前記[60]~[62]のいずれか1つに記載の方法。
[64]前記修飾により、前記プライマー鎖または前記二本鎖プライマーの固相化または精製が可能になっている、前記[63]に記載の方法。
[65]前記修飾が、ビオチンへの結合である、前記[64]に記載の方法。
[66]前記プライマー鎖が、5’アダプター配列である、前記[60]~[65]のいずれか1つに記載の方法。
[67]前記非伸長鎖が、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む、前記[60]~[66]のいずれか1つに記載の方法。
[68]前記非伸長鎖が、その3’末端に修飾を含む、前記[60]~[67]のいずれか1つに記載の方法。
[69]前記修飾によって3’末端の伸長がブロックされる、前記[68]に記載の方法。
[70]前記修飾が、3’末端のC3スペーサーまたは3’末端のモノリン酸である、前記[69]に記載の方法。
[71]前記RNA鋳型が、前記[41]、[44]および[45]のいずれか1つに記載の方法により調製されたものである、前記[60]~[70]のいずれか1つに記載の方法。
[72]前記二本鎖プライマーが、前記[46]~[59]のいずれか1つに記載の方法によって調製されたものである、前記[60]~[71]のいずれか1つに記載の方法。
[73]前記RTが、真核生物由来の、長い末端反復配列を持たない逆転写酵素(非LTR RT)タンパク質である、前記[60]~[74]のいずれか1つに記載の方法。
[74]前記真核生物由来の非LTR RTタンパク質が、R2レトロエレメント逆転写酵素(R2 RT)タンパク質である、前記[73]に記載の方法。
[75]前記R2 RTタンパク質が、カイコガのR2 RTタンパク質である、前記[74]に記載の方法。
[76]前記真核生物由来の非LTR RTタンパク質が、前記[1]~[40]のいずれか1つに記載の真核生物由来非LTR RTタンパク質である、前記[73]に記載の方法。
[77]前記RNA鋳型が、その3’末端に、プリン塩基を含むdNTP、NTPもしくはddNTPまたはそれらのヌクレオチド類似体を含む、前記[60]~[76]のいずれか1つに記載の方法。
[78]前記RNA鋳型が、その5’末端に修飾を含む、前記[60]~[77]のいずれか1つに記載の方法。
[79]前記修飾が不可逆的修飾である、前記[78]に記載の方法。
[80]前記不可逆的修飾が、5’末端のC6スペーサーまたはビオチンである、前記[79]に記載の方法。
[81]前記修飾が可逆的修飾である、前記[78]に記載の方法。
[82]前記可逆的修飾が、5’末端のアデニリル化である、前記[81]に記載の方法。
[83]前記接触が、3’末端にピリミジンヌクレオチドを含む第2の鋳型の存在下で行われる、前記[73]~[82]のいずれか1つに記載の方法。
[84]第2の鋳型が、DNA、RNA、DNA-RNAハイブリッドまたはそれらの修飾形態を含む、前記[83]に記載の方法。
[85]第2の鋳型が、その3’末端にピリミジンリボヌクレオチドを含む、前記[84]に記載の方法。
[86]第2の鋳型が、3’アダプター配列の相補鎖である、前記[83]~[85]のいずれか1つに記載の方法。
[87]前記接触が、前記5’アダプター配列、前記RNA鋳型に実質的に相補的な配列および前記3’アダプター配列を含むcDNA分子の作製に効果的な条件下で行われる、前記[86]に記載の方法。
[88]第2の鋳型が、その5’末端に修飾を含む、前記[83]~[87]のいずれか1つに記載の方法。
[89]前記修飾が不可逆的修飾である、[88]に記載の方法。
[90]前記不可逆的修飾が、5’末端のC6スペーサーまたはビオチンである、前記[89]に記載の方法。
[91]前記修飾が可逆的修飾である、前記[88]に記載の方法。
[92]前記可逆的修飾が、5’末端のアデニリル化である、前記[91]に記載の方法。
[93]前記接触が、約4℃~約50℃で行われる、前記[60]~[92]のいずれか1つに記載の方法。
[94]前記接触が、約37℃で行われる、前記[93]に記載の方法。
[95]単一の容器内で実施される、前記[60]~[94]のいずれか1つに記載の方法。