【文献】
ISLAM, S. et al.,Highly multiplexed and strand-specific single-cell RNA 5' end sequencing,NATURE PROTOCOLS,2012年 4月 5日,Vol.7, No.5,pp.813-828
【文献】
ISLAM, S. et al.,Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq,Genome Research,2011年 5月 4日,Vol.21,pp.1160-1167
【文献】
HARISMENDY, O. and FRAZER, K. A.,Method for improving sequence coverage uniformity of targeted genomic intervals amplified by LR-PCR using Illumina GA sequencing by-synthesis technology,Bio Techniques,2009年 3月,Vol.46,pp.229-231
(58)【調査した分野】(Int.Cl.,DB名)
ステップ(iii)(a)の後に、デオキシヌクレオチジルトランスフェラーゼ酵素を使用することによってDNA鎖の3’末端に末端アデニンを付加することを含むステップ(iii)(b)であって、前記アダプターが3’末端チミンを含み、それがステップ(iv)において3’末端アデニンを含む前記DNA鎖とライゲーションする、ステップ(iii)(b)を行う、請求項2に記載の方法。
前記2つのアダプターが末端チミンを含み、そのそれぞれが、シークエンサーの表面にそれぞれ結合した増幅プライマーと相補的である、請求項4から6までのいずれか一項に記載のキット。
前記逆転写酵素が、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼまたはTaq DNAポリメラーゼのうちの任意の1つから選択される、請求項1から3までのいずれか一項に記載の方法。
前記逆転写酵素が、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼまたはTaq DNAポリメラーゼのうちの任意の1つから選択される、請求項4から7までのいずれか一項に記載のキット。
(i)において前記ランダムオリゴヌクレオチドの前記5’末端ヌクレオチドの5’OH基または5’リン酸基が、ライゲーションを遮断する部分と共有結合している、請求項10に記載の方法。
(i)において前記ランダムオリゴヌクレオチドの前記5’末端ヌクレオチドの5’OH基または5’リン酸基が、ライゲーションを遮断する部分と共有結合している、請求項12に記載のキット。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’リン酸基がエステル化されている、請求項10に記載の方法。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの5’末端ヌクレオチドの5’OH基がエステル化またはエーテル化されている、請求項11に記載の方法。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’リン酸基がエステル化されている、請求項12に記載のキット。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの5’末端ヌクレオチドの5’OH基がエステル化またはエーテル化されている、請求項13に記載のキット。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの前記5’リン酸基は、アルキルアルコールまたはアリールアルコールによってエステル化されている、請求項10または14に記載の方法。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの前記5’OH基は、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、またはボロン酸によってエステル化されている、請求項11または15に記載の方法。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの前記5’リン酸基は、アルキルアルコールまたはアリールアルコールによってエステル化されている、請求項12または16に記載のキット。
ライゲーションを遮断する前記ランダムオリゴヌクレオチドプライマーの前記5’OH基は、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、またはボロン酸によってエステル化されている、請求項13または17に記載のキット。
前記アルキルアルコールまたはアリールアルコールが、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む、請求項18に記載の方法。
前記モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルもしくはジアルキルホスホチオネート、またはボロン酸が、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む、請求項19に記載の方法。
前記アルキルアルコールまたはアリールアルコールが、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む、請求項20に記載のキット。
前記モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルもしくはジアルキルホスホチオネート、またはボロン酸が、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む、請求項21に記載のキット。
非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる、請求項10または11に記載の方法。
非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる、請求項12または13に記載のキット。
5’末端におけるライゲーションを遮断する共有結合した部分を含む、前記生成された第1のDNA鎖が、その3’末端に、前記3’末端におけるライゲーションを遮断するものであり、前記第1のDNA鎖の生成後に導入される修飾をさらに含む、請求項1から3まで、8、10、11、14、15、18、19、22、23、26、27および30のいずれか一項に記載の方法。
【発明の概要】
【課題を解決するための手段】
【0007】
したがって、当技術分野において、RNA配列解析のための、より単純かつより特異的な方法が必要とされている。
【0008】
発明の要旨
RNAが転写される元の正確な鎖に関する情報は、アンチセンスおよび非コードRNA種の発見およびそれらの機能の試験において有用である。センス転写物を重複するアンチセンス転写物から区別できることにより、RNA定量の正確度がさらに改善され得る。これに関連して、本発明者らは、1本鎖鋳型ならびに多数のそのような鎖の増幅に対して高度に特異的であり、また、上記の現在最も広く使用されているRNAシークエンシング方法とは対照的に、単一のシークエンシング鋳型の増幅を実現するために追加的な酵素的ステップを伴わずに高度に特異的である、新しいRNAシークエンシング方法を開発した。
【0009】
具体的には、本発明は、RNAシークエンシングの方法であって、
(i)RNAを提供するステップ、
(ii)逆転写酵素、第1のセットのオリゴヌクレオチドプライマー、およびステップ(i)のRNAを使用することにより上記RNAを逆転写に供することによって上記RNAと相補的な1本鎖の第1のDNA鎖(単数または複数)(cDNA)を生成するステップ、ならびに
(iii)DNAポリメラーゼ、第2のセットのオリゴヌクレオチドプライマー、および(ii)の1本鎖cDNAを使用することによって第2のDNA鎖を生成するステップ、
を含み、
a)上記第1のセットのオリゴヌクレオチドプライマーが、その5’末端ヌクレオチドに、生成された第1のDNA鎖の5’末端におけるライゲーションを遮断する共有結合した部分を含むか、または
b)第2のセットのオリゴヌクレオチドプライマーが、その5’末端ヌクレオチドに、生成された第2のDNA鎖の5’末端におけるライゲーションを遮断する共有結合した部分を含む、
方法に言及する。
【0010】
一部の実施形態では、上記方法は、その後の、
(iv)任意選択で、末端修復されたDNA鎖を得るために、ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素を使用して、2本鎖DNA鎖を末端修復するステップ、
(v)任意選択で、デオキシヌクレオチジルトランスフェラーゼ酵素を使用して上記DNA鎖の3’末端に末端アデニンを付加するステップ、および
(vi)末端チミンを任意選択で含むアダプターを、3’末端アデニンを任意選択で含むDNA鎖にライゲーションするステップ
をさらに含む。
【0011】
前記方法は、生成されたDNAの配列解析をさらに含み得る。
【0012】
一部の実施形態では、上記方法は、
(i)RNAを提供するステップ、
(ii)逆転写酵素、第1のセットのオリゴヌクレオチドプライマー、およびステップ(i)のRNAを使用することにより上記RNAを逆転写に供することによって上記RNAと相補的な1本鎖の第1のDNA鎖(単数または複数)(cDNA)を生成するステップ、
(iii)DNAポリメラーゼ、第2のセットのオリゴヌクレオチドプライマー、および(ii)の1本鎖cDNAを使用することによって第2のDNA鎖を生成するステップ、
(iv)ステップ(iii)の2本鎖DNAにアダプターをライゲーションするステップ、ならびに
(v)生成されたDNAのシークエンシングを行うステップ
を含み、
a)第1のセットのオリゴヌクレオチドプライマーが、その5’末端ヌクレオチドに、生成された第1のDNA鎖の5’末端におけるライゲーションを遮断する共有結合している部分を含むか;または
b)第2のセットのオリゴヌクレオチドプライマーが、その5’末端ヌクレオチドに、生成された第2のDNA鎖の5’末端におけるライゲーションを遮断する共有結合した部分を含む。
【0013】
第2のDNA鎖を生成するステップにより、2本鎖DNAが生成される。
【0014】
上記の方法の一部の実施形態では、ステップ(iv)の前に、上記方法は、
(iii)(a)末端修復されたDNA鎖を得るために、ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素を使用して、2本鎖DNA鎖を末端修復するステップを含む。
【0015】
一部の実施形態では、ステップ(iii)(a)の後に、デオキシヌクレオチジルトランスフェラーゼ酵素を使用することによってDNA鎖の3’末端に末端アデニンを付加することを含むステップ(iii)(b)であって、アダプターが3’末端チミンを含み、それがステップ(iv)において3’末端アデニンを含むDNA鎖とライゲーションする、ステップ(iii)(b)を行う。
【0016】
一部の実施形態では、遮断性部分と共有結合しているオリゴヌクレオチドプライマー、および/または非修飾オリゴヌクレオチドプライマーは、ランダムオリゴヌクレオチドプライマーである。
【0017】
一部の実施形態では、上記方法は、目的のRNAを抽出し、任意選択で富化する最初のステップを含む。一部の実施形態では、抽出されたRNAを平均サイズ19〜510bpに断片化する。
【0018】
上記の方法の一部の実施形態では、ペアエンドシークエンシングのために上記分子を固体支持体に付着させることができる。
【0019】
本発明の別の態様は、キットであって
(i)DNAとシークエンシングアダプターのライゲーションを遮断する、5’末端ヌクレオチドに共有結合した部分を含むオリゴヌクレオチドプライマー;
(ii)非修飾オリゴヌクレオチドプライマー;
(iii)逆転写酵素;および
(iv)任意選択で、DNAポリメラーゼ
を含む、キットをいう。
【0020】
一部の実施形態では、上記キットは、
(i)DNAとシークエンシングアダプターのライゲーションを遮断する、5’末端ヌクレオチドに共有結合した部分を含むオリゴヌクレオチドプライマー;
(ii)非修飾オリゴヌクレオチドプライマー;
(iii)逆転写酵素;
(iv)任意選択で、DNAポリメラーゼ;
(v)ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素;
(vi)任意選択で、デオキシヌクレオチジルトランスフェラーゼ酵素;
(vii)末端チミンを任意選択で含み、それぞれが、表面にそれぞれ結合した増幅プライマーと相補的である、2つのアダプター、ならびに
(viii)リガーゼ
を含む。
【0021】
上記のキットの一部の実施形態では、遮断性部分と共有結合しているオリゴヌクレオチドプライマーまたは非修飾オリゴヌクレオチドプライマーは、ランダムオリゴヌクレオチドプライマーである。
【0022】
上記の方法またはキットの一部の実施形態では、逆転写酵素は、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(avian myeoloblastosis virus)(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼ、Taq DNAポリメラーゼ、Tne DNAポリメラーゼ、Tma DNAポリメラーゼ、ならびに、それらの酵素的に活性な突然変異体、断片、バリアントおよび/または誘導体のうちの任意の1つから選択される。
【0023】
一部の実施形態では、「ライゲーションを遮断する部分」、または「遮断性部分」とは、修飾されたプライマーオリゴヌクレオチドの5’ヌクレオチドに共有結合した、1つ超の原子である大きな分子の特定の一部分、本明細書では修飾オリゴヌクレオチドの一部分を指す。上記部分は、その部分が位置する部位、好ましくはオリゴヌクレオチドの5’末端の5’末端ヌクレオチドにおけるあらゆるライゲーションを遮断するものであることが好ましい。
【0024】
上記の方法またはキットの一部の実施形態では、遮断性部分を含むオリゴヌクレオチドプライマーは、
(i)オリゴヌクレオチドが、5’末端ヌクレオチドに、遊離していない5’リン酸を含み、任意選択で、5’末端ヌクレオチドの5’OH基または5’リン酸基が、ライゲーションを遮断する部分と共有結合していること;
(ii)5’末端ヌクレオチドの塩基が、チミン、アデニン、シトシン、グアニンおよびウラシルのいずれでもないこと;
(iii)5’末端ヌクレオチドのデオキシリボースの2’水素の一方または両方が別の原子または遮断性部分で置き換えられていること;ならびに/または
(iv)オリゴヌクレオチドが、RNAまたはDNAにおけるリボースまたはデオキシリボースの立体コンフォメーションではない立体コンフォメーションのペントースを有する5’末端ヌクレオチドを含む
ことを特徴とする。
【0025】
RNAまたはDNAにおけるリボースまたはデオキシリボースコンフォメーションは、β−D−リボフラノースまたはβ−D−デオキシリボフラノースの立体化学的コンフォメーションを含むか、またはそれからなる。
【0026】
一部の実施形態では、遊離していないリン酸において、リン酸の1つまたは複数のOH基が、リン酸基がさらなるモノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドとのライゲーション反応を受けることができないように修飾されている。
【0027】
上記の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、ライゲーション遮断性質を付与する部分と共有結合する前に5’末端ヌクレオチドにおいて5’OHまたは遊離の5’リン酸基を含む。
【0028】
上記の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’リン酸基は、エステル化されているか、または、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’末端ヌクレオチドの5’OH基は、エステル化もしくはエーテル化されている。
【0029】
上記の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’リン酸基は、アルキルアルコールまたはアリールアルコールによってエステル化されているか、または、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’OH基は、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、もしくはボロン酸によってエステル化されている。
【0030】
上記の方法またはキットの一部の実施形態では、アルキルアルコールまたはアリールアルコールは、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンもしくはヒドロキシル基、もしくはモノアルキルホスフェート、ジアルキルホスフェート、モノアルキルもしくはジアルキルホスホチオネートから選択される少なくとも1つの追加的な官能基を含むか、またはボロン酸は、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンもしくはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む。
【0031】
上記の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’OH基は、5’スペーサー18、5’スペーサー9、5’C3−スペーサー、5’C6−スペーサー、5’脱塩基残基(dスペーサー、rスペーサー)、5’−5’反転ヌクレオチド(inverted nucleotide)などの5’−スペーサー、ならびにDADE−リンカー、5’C6−アミノ−リンカー、5’C12−アミノ−リンカー、および5’−ビオチン化5’C6または5’C12−アミノ−リンカーなどの5’リンカーから選択される分子によってエステル化されている。
【0032】
5’OH基への共有結合のための作用剤/部分のサブセットは
図5に開示されている。
【0033】
上記の方法またはキットの一部の実施形態では、非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる。
【0034】
上記の方法またはキットの一部の実施形態では、5’末端においてライゲーションを遮断する部分を含む、生成された第1のDNA鎖は、その3’末端に、前記3’末端におけるライゲーションを遮断するものであり、第1のDNA鎖の生成後に導入される、共有結合した部分をさらに含む。
【0035】
一部の実施形態では、第1のDNA鎖の3’末端の3’OH基は遊離しておらず、前記3’OH基は、ライゲーションを遮断する部分と共有結合していることが好ましい。前記ライゲーションを遮断する部分との共有結合は、第1のDNA鎖の3’末端の3’OH基のエステル化またはエーテル化であることがなおより好ましい。
【0036】
上記の方法またはキットの一部の実施形態では、アダプターを2つの異なる表面に結合した増幅プライマーとハイブリダイズさせる。
特定の実施形態では、例えば以下の項目が提供される。
(項目1)
RNAシークエンシングの方法であって、
(i)RNAを提供するステップ;
(ii)逆転写酵素、第1のセットのオリゴヌクレオチドプライマー、およびステップ(i)の前記RNAを使用することにより前記RNAを逆転写に供することによって前記RNAと相補的な1本鎖の第1のDNA鎖(単数または複数)(cDNA)を生成するステップ;
(iii)DNAポリメラーゼ、第2のセットのオリゴヌクレオチドプライマー、および(ii)の前記1本鎖cDNAを使用することによって第2のDNA鎖を生成するステップ;
(iv)ステップ(iii)の前記2本鎖DNAにアダプターをライゲーションするステップ;ならびに
(v)前記生成されたDNAのシークエンシングを行うステップ
を含み、
a)前記第1のセットのオリゴヌクレオチドプライマーが、その/それらの5’末端ヌクレオチドに、前記生成された第1のDNA鎖の5’末端におけるライゲーションを遮断する部分を含むか;または
b)前記第2のセットのオリゴヌクレオチドプライマーが、その/それらの5’末端ヌクレオチドに、前記生成された第2のDNA鎖の5’末端におけるライゲーションを遮断する部分を含む、方法。
(項目2)
ステップ(iv)の前に、
(iii)(a)末端修復されたDNA鎖を得るために、ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素を使用して、前記2本鎖DNA鎖を末端修復するステップ
を含む、項目1に記載の方法。
(項目3)
ステップ(iii)(a)の後に、デオキシヌクレオチジルトランスフェラーゼ酵素を使用することによってDNA鎖の3’末端に末端アデニンを付加することを含むステップ(iii)(b)であって、前記アダプターが3’末端チミンを含み、それがステップ(iv)において3’末端アデニンを含む前記DNA鎖とライゲーションする、ステップ(iii)(b)を行う、項目2に記載の方法。
(項目4)
(i)DNAとシークエンシングアダプターのライゲーションを遮断する、5’末端ヌクレオチドに共有結合した部分を含むオリゴヌクレオチドプライマー;
(ii)非修飾オリゴヌクレオチドプライマー;
(iii)逆転写酵素;
(iv)任意選択で、DNAポリメラーゼ;
(v)ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素;
(vi)任意選択で、デオキシヌクレオチジルトランスフェラーゼ酵素;
(vii)末端チミンを任意選択で含み、それぞれが、表面にそれぞれ結合した増幅プライマーと相補的である、2つのアダプター、ならびに
(viii)リガーゼ
を含む、キット。
(項目5)
ライゲーションを遮断する部分を含む前記オリゴヌクレオチドプライマー、および/または非修飾オリゴヌクレオチドプライマーが、ランダムオリゴヌクレオチドプライマーである、項目1から3までのいずれか一項に記載の方法または項目4に記載のキット。
(項目6)
前記逆転写酵素が、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼまたはTaq DNAポリメラーゼのうちの任意の1つから選択される、項目1から3までもしくは項目5に記載の方法または項目4もしくは5に記載のキット。
(項目7)
遮断性部分を含む前記オリゴヌクレオチドが、
(i)前記オリゴヌクレオチドが、5’末端ヌクレオチドに、遊離していない5’リン酸を含み、任意選択で、5’末端ヌクレオチドの5’OH基または5’リン酸基が、ライゲーションを遮断する部分と共有結合していること;
(ii)前記5’末端ヌクレオチドの塩基が、チミン、アデニン、シトシン、グアニンおよびウラシルのいずれでもないこと;
(iii)前記5’末端ヌクレオチドのデオキシリボースの2’水素の一方または両方が別の原子または遮断性部分で置き換えられていること;ならびに/または
(iv)前記オリゴヌクレオチドが、RNAまたはDNAにおけるリボースまたはデオキシリボースの立体コンフォメーションではない立体コンフォメーションのペントースを有する5’末端ヌクレオチドを含むこと
を特徴とする、項目1から3までおよび項目5から6までのいずれか一項に記載の方法または項目4から6までのいずれか一項に記載のキット。
(項目8)
ライゲーションを遮断する前記オリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’リン酸基がエステル化されているか、またはライゲーションを遮断する前記オリゴヌクレオチドの5’末端ヌクレオチドプライマーの5’OH基がエステル化またはエーテル化されている、項目7に記載の方法またはキット。
(項目9)
ライゲーションを遮断する前記オリゴヌクレオチドプライマーの前記5’リン酸基は、アルキルアルコールまたはアリールアルコールによってエステル化されているか、または、ライゲーションを遮断する前記オリゴヌクレオチドプライマーの前記5’OH基は、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、もしくはボロン酸によってエステル化されている、項目7または8に記載の方法またはキット。
(項目10)
前記アルキルアルコールもしくはアリールアルコールが、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンもしくはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含むか、または、前記モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルもしくはジアルキルホスホチオネート、もしくはボロン酸が、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンもしくはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含む、項目9に記載の方法またはキット。
(項目11)
ライゲーションを遮断する前記オリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’OH基は、5’スペーサー18、5’スペーサー9、5’C3−スペーサー、5’C6−スペーサー、5’脱塩基残基(dスペーサー、rスペーサー)、5’−5’反転ヌクレオチド(inverted nucleotide)などの5’−スペーサー、ならびにDADE−リンカー、5’C6−アミノ−リンカー、5’C12−アミノ−リンカー、および5’−ビオチン化5’C6または5’C12−アミノ−リンカーなどの5’リンカーから選択される分子によってエステル化されている、項目7〜10のいずれか一項に記載の方法またはキット。
(項目12)
非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる、項目7に記載の方法またはキット。
(項目13)
5’末端におけるライゲーションを遮断する共有結合した部分を含む、前記生成された第1のDNA鎖が、その3’末端に、前記3’末端におけるライゲーションを遮断するものであり、前記第1のDNA鎖の生成後に導入される修飾をさらに含む、項目1から3までおよび項目5から12までのいずれか一項に記載の方法。
【発明を実施するための形態】
【0042】
発明の詳細な説明
定義
別段の定義のない限り、本明細書において使用される全ての科学技術用語は、当業者(例えば、細胞培養、分子遺伝学的、核酸化学、ハイブリダイゼーション技法および生化学における)に共通して理解されるものと同じ意味を有する。
【0043】
本発明の実行では、分子生物学、微生物学、および組換えDNAにおける多くの従来の技法を使用することができる。これらの技法は周知であり、例えば、Current Protocols in Molecular Biology、I巻、II巻、およびIII巻、1997年(F. M. Ausubel編);Sambrookら、1989年、Molecular Cloning: A Laboratory Manual、第2版、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.;DNA Cloning:A Practical Approach、I巻およびII巻、1985年(D. N. Glover編);Oligonucleotide Synthesis、1984年(M. L. Gait編);Nucleic Acid Hybridization、1985年、(HamesおよびHiggins);Transcription and Translation、1984年(HamesおよびHiggins編);Animal Cell Culture、1986年(R. I. Freshney編);Immobilized Cells and Enzymes、1986年(IRL Press);Perbal、1984年、A Practical Guide to Molecular Cloning;the series、Methods In Enzymology(Academic Press, Inc.);Gene Transfer Vectors for Mammalian Cells、1987年(J. H. MillerおよびM. P. Calos編、Cold Spring Harbor Laboratory);およびMethods in Enzymology、154巻および155巻(それぞれWuおよびGrossman編、ならびにWu編)に説明されている。
【0044】
「ライブラリー」という用語は、多数の核酸断片、本明細書では、RNAから生成される、配列決定解析のためのDNA断片のコレクションを指す。本明細書で言及されるライブラリーは、分析される試料の断片化、逆転写およびdsDNAの生成、任意選択の末端修復、任意選択の末端アデニンの付加、ならびに遮断性部分と共有結合したランダムオリゴヌクレオチドによってライゲーションが阻害されない場合に断片およびアダプターから生成された鎖のライゲーションによって生成される。任意選択で、精製されたDNA断片を、シークエンシング前に増幅し、かつ/または富化する。
【0045】
本明細書で使用される場合、「約」という用語は、数値と共に使用される場合(例えば、温度または時間の詳記)、その値から20%、好ましくは10%、より好ましくは5%、なおより好ましくは2%、および最も好ましくは1%の偏差を包含することが意図されている。それと同時に、数値と共に使用される場合、まさにその数値は本発明による好ましい実施形態として個別に開示されていると理解されるべきである。
【0046】
本明細書で使用される場合、「含む(comprising)」という用語は、「含む(including)」と「からなる(consisting of)」のどちらも包含すると解釈されるべきであり、どちらの意味も明確に意図されており、したがって、本発明に従って個別に開示される実施形態である。
【0047】
「RNA」とは、単一のRNA鎖と多数のRNA鎖のどちらも指す。したがって、「DNA」とは、1本鎖DNAまたは2本鎖DNA鎖のどちらも指し、また、多数のそのようなDNA鎖も指す。
【0048】
「nt」は、「ヌクレオチド」の略語である。
【0049】
「bp」は、「塩基対」の略語である。
【0050】
「鋳型」という用語は、本明細書で使用される場合、第1の(1本鎖)DNA鎖(cDNA)または第2のDNA鎖の生成、それにより、増幅、コピーまたはシークエンシングされる2本鎖DNAの生成に使用される2本鎖または1本鎖核酸分子を指す。核酸鋳型、好ましくはRNA分子の一部と相補的なオリゴヌクレオチドプライマーを適切な条件下でハイブリダイズさせ、次いで、本発明の逆転写酵素により、前記鋳型またはその一部と相補的なDNA分子を合成することができる。
【0051】
さらに、核酸鋳型、好ましくは第1のcDNA鎖の一部と相補的なオリゴヌクレオチドプライマーを適切な条件下でハイブリダイズさせ、次いで、本発明のDNAポリメラーゼIにより、前記鋳型またはその一部と相補的なDNA分子を合成することができる。適切な条件は、高ストリンジェンシー条件であることが好ましい。
【0052】
そのようなランダムオリゴヌクレオチドプライマーを鋳型RNAまたはDNAと高ストリンジェンシー条件下でハイブリダイズさせることが好ましく、ランダムオリゴヌクレオチドプライマーは、鋳型DNAまたはRNAと相補的であることがなおより好ましい。そのようなオリゴヌクレオチドは6〜10ヌクレオチド、好ましくは6ヌクレオチドの長さを有する。
【0053】
「高ストリンジェンシー」(例えば:高温および/または低塩濃度)の下では、正確にマッチする塩基のみがアニーリングし、一緒になったままになる。本明細書に記載されている増幅技法、例えばPCRにおける高ストリンジェンシーを実現するために、プライマー/プローブのアニーリング温度は、通常、それらの所望の標的鎖のみが生成または増幅されることが確実になる、融解温度未満の約5℃である。
【0054】
「オリゴヌクレオチド」とは、1つのヌクレオチドのペントースの3’位と隣接するヌクレオチドのペントースの5’位との間のリン酸ジエステル結合によって接合した2ヌクレオチド〜およそ20ヌクレオチドの範囲の共有結合により連結したヌクレオチドの配列を含む合成分子または天然分子を指す。ペントースはデオキシリボースであることが好ましい。
【0055】
ランダムオリゴヌクレオチドとは、DNA配列上の多くのランダムな点でアニーリングする潜在性を有し、第1鎖cDNAおよび/または第2鎖DNA合成を開始させるためのプライマー(単数または複数)としての機能を果たす多数の範囲の配列を生じるように完全にランダムに合成されるオリゴヌクレオチド(単数または複数)を指す。
【0056】
「非修飾オリゴヌクレオチド」とは、本明細書で使用される場合、RNA鋳型を逆転写に供する場合にDNAの増幅目的またはcDNAの生成のために生成することができる任意のオリゴヌクレオチドを指す。RNAシークエンシング目的で適用される非修飾オリゴヌクレオチドをそれらの5’末端ヌクレオチドにおいて5’リン酸化することが好ましい。そのようなオリゴヌクレオチドは、さらなるモノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドとのライゲーションを遮断する部分を含まない。
【0057】
「ポリヌクレオチド」とは、1つのヌクレオチドのペントースの3’位と隣接するヌクレオチドのペントースの5’位との間のリン酸ジエステル結合によって接合したおよそ20またはそれ超のヌクレオチドの範囲の共有結合により連結したヌクレオチドの配列を含む合成分子または天然分子を指す。ペントースはデオキシリボースであることが好ましい。
【0058】
「T4ポリヌクレオチドキナーゼ」とは、ATPのγ位からポリヌクレオチド(2本鎖および1本鎖DNAおよびRNA)ならびにヌクレオシド3’−一リン酸の5’−ヒドロキシル末端へのP
iの転移および交換を触媒する酵素を指す。
【0059】
「T4 DNAポリメラーゼ」は、5’→3’方向でのDNAの合成を触媒する、鋳型およびプライマーの存在を必要とする酵素を指す。この酵素は、DNAポリメラーゼI(E.coli)において見いだされるものよりもはるかに活性が高い3’→5’エキソヌクレアーゼ活性を有する。T4 DNAポリメラーゼは、5’→3’エキソヌクレアーゼ活性を示さない。
【0060】
「クレノウ断片エキソ」または「クレノウ断片(3’→5’エキソ)」とは、ポリメラーゼ活性は保持するが、5’→3’エキソヌクレアーゼ活性および3’→5’エキソヌクレアーゼ活性が欠失したDNAポリメラーゼIのN末端短縮型を指す。
【0061】
「T4 DNAリガーゼ」とは、2本鎖DNAまたはRNAにおける並んだ5’リン酸と3’ヒドロキシル末端との間のリン酸ジエステル結合の形成を触媒する酵素を指す。この酵素は、平滑末端と付着(粘着)末端のどちらも接合する。
【0062】
「T3 DNAリガーゼ」とは、バクテリオファージT3に由来するATP依存性dsDNAリガーゼを指す。それは、2重鎖DNAの隣接する5’リン酸と3’ヒドロキシル基との間のリン酸ジエステル結合の形成を触媒する。この酵素は、付着(粘着の)末端と平滑末端のどちらも接合する。
【0063】
「T7 DNAリガーゼ」は、バクテリオファージT7に由来するATP依存性リガーゼである。この酵素は、付着(粘着)末端を接合し、ニックシーリングに適している。T7リガーゼの存在下では平滑末端ライゲーションは起こらない。
【0064】
「T4 RNAリガーゼ」は、ATPがAMPおよびPP
iに加水分解される、3’→5’リン酸ジエステル結合の形成による5’ホスホリル末端の核酸ドナーと3’ヒドロキシル末端の核酸アクセプターのライゲーションを触媒するATP依存性酵素である。基質として、1本鎖RNAおよびDNAならびにジヌクレオシドピロホスフェートが挙げられる。
【0065】
「RNA」という用語は、本発明では、ウイルスRNA、原核生物RNA、古細菌RNA、または真核生物RNAのうちの任意の1つに関する。cDNAは、ウイルスRNAならびに原核生物、古細菌、および真核生物に由来するRNAのうちの任意の1つから、逆転写酵素を使用して逆転写を行うことにより相補DNA(cDNA)を生成することによって得ることができる。2本鎖DNAは、1本鎖cDNA鎖と相補的な第2鎖を生成することによって得ることができる。
【0066】
本発明の方法および/またはキットにおける酵素としては、逆転写酵素活性を有する任意の酵素が挙げられる。そのような酵素としては、これだけに限定されないが、HIV、SIV、またはHTLVなどのレトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎ウイルス逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼ、Taq DNAポリメラーゼ(Saiki, R. K.ら、Science、239巻:487〜491頁(1988年);米国特許第4,889,818号および同第4,965,188号)、Tne DNAポリメラーゼ(WO96/10640)、Tma DNAポリメラーゼ(米国特許第5,374,553号)およびその突然変異体、断片、バリアントまたは誘導体(例えば、米国特許第5,948,614号および6,015,668号を参照されたい)が挙げられる。修飾された逆転写酵素は、常套的であり、当技術分野で周知の組換えまたは遺伝子工学の技法によって得ることができる。突然変異体逆転写酵素は、例えば、目的の逆転写酵素をコードする遺伝子(単数または複数)を部位特異的またはランダム突然変異誘発によって突然変異させることによって得ることができる。そのような突然変異としては、点突然変異、欠失突然変異および挿入突然変異を挙げることができる。
【0067】
「遮断性部分と共有結合したオリゴヌクレオチド」または「(ライゲーション)遮断性オリゴヌクレオチド」とは、本明細書で使用される場合、アダプターと1本鎖または2本鎖DNA、好ましくは本発明に記載のdsDNAのライゲーションを阻害または遮断する任意のオリゴヌクレオチドを指す。詳細には、このオリゴヌクレオチドは、5’オリゴヌクレオチドプライマーの5’末端ヌクレオチドにおいてライゲーションを遮断する部分を含む。
【0068】
具体的には、遮断性部分を5’末端ペントースの5’OH基と共有結合させる。他の実施形態では、遮断性部分を5’末端ペントースの5’リン酸基と共有結合させる。
【0069】
遮断性部分内のデオキシリボースは、5’リン酸が遊離していない、すなわち、この部分内のリン酸基のOH基の1つまたは複数が、さらなるモノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドとのライゲーション反応を受けることができないように、化学的に修飾することができる;部分内のデオキシヌクレオチドは、5’末端ヌクレオチドの塩基が、チミン、アデニン、シトシン、グアニンおよびウラシルのいずれでもないように、化学的に修飾することができる;遮断性部分内のデオキシヌクレオチドは、5’末端ヌクレオチドのデオキシリボースの2’水素(単数または複数)の一方または両方が別の原子または遮断性部分で置き換えられるように、修飾することができる;かつ/または、オリゴヌクレオチドは、非修飾RNAまたはDNAにおけるリボースまたはデオキシリボースの立体コンフォメーション以外の立体コンフォメーションにおいてペントースを有する5’末端ヌクレオチドを含む。非修飾RNAまたはDNAにおけるリボースまたはデオキシリボースコンフォメーションは、β−D−リボフラノースまたはβ−D−デオキシリボフラノース立体化学的コンフォメーションを含むか、またはそれからなる。
【0070】
「修飾(modification)」または「修飾された(modified)」という用語は、それぞれの生成されるDNA鎖をライゲーションできないものにする、モノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドの任意の変化を指す。
【0071】
「部分」という用語は、1つ超の原子である大きな分子の特定の一部分、本明細書では、ライゲーション遮断性プライマーオリゴヌクレオチドの5’ヌクレオチドと共有結合する、ライゲーション遮断性オリゴヌクレオチドの一部分を指す。前記部分は、部分が位置する部位における、好ましくはオリゴヌクレオチドの5’末端の5’末端ヌクレオチドにおける、あらゆるライゲーションを遮断するものであることが好ましい。
【0072】
遮断性部分は、5’末端ヌクレオチドの5’リン酸または5’OH基と結合する共有結合した分子であってよく、したがって、前記結合は、どちらの場合でも、エステル結合、好ましくはジエステル結合によって実現することができる。5’OH基遮断性部分のサブセットが
図5に開示されている。好ましくは、そのような遮断性部分として、これだけに限られないが、以下の5’スペーサー18、5’スペーサー9、5’C3−スペーサー、5’C6−スペーサー、5’脱塩基残基(dスペーサー、rスペーサー)、5’−5’反転ヌクレオチドなどの5’−スペーサー、および、DADE−リンカー、5’C6−アミノ−リンカー、5’C12−アミノ−リンカー、または5’−ビオチン化5’C6または5’C12−アミノ−リンカーなどの5’リンカー、または任意のその機能的類似体のうちの任意の1つが挙げられる。
【0073】
「遊離の」5’リン酸とは、遊離の5’リン酸を有するオリゴヌクレオチドプライマーを使用することによって生成された、5’ヌクレオチドの5’ペントースの5’OH基のみ、好ましくは、末端モノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチド、好ましくはオリゴヌクレオチドまたはDNA鎖のデオキシリボースとエステル化されたリン酸基を指す。前記リン酸化された5’ペントースは、モノエステルであり、2つの「遊離の」OH基、すなわち、少なくとも1つの第一級または第二級OH基を含む1つまたは2つの化合物とのエステル化に供することができるリン酸基内のOH基を含む。そのような遊離の5’リン酸を含む(プライマー)オリゴヌクレオチドは、本明細書では、非修飾オリゴヌクレオチドと称される。とりわけ、さらなるモノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドとライゲーションすることによって、または本発明の遮断性部分によって、さらなるエステル化を行うことができる。
【0074】
遊離していない5’末端ヌクレオチドのリン酸は、遮断性部分のアルコール基とエステル化されたリン酸を指す。例えば、アルコール(OH)基は、5’ペントース、好ましくは、その5’末端がさらにエステル化される、モノヌクレオチド、オリゴヌクレオチド、またはポリヌクレオチドなどのさらなるDNA分子の末端ヌクレオチドのデオキシリボースの5’OH基であってよい。そのような「ライゲーション遮断性部分を含むオリゴヌクレオチド」は、DNA鎖を生成するためにプライマーとして使用することができ、これは、結果として、遊離していないリン酸基も含む。
【0075】
オリゴヌクレオチド鎖の3’末端の3’OH基に部分として共有結合させることができる作用剤のサブセットが
図5に開示されている。そのような作用剤分子としては、これだけに限られないが、以下の3’スペーサー18、3’スペーサー9、3’C3−スペーサー、3’C6−スペーサー、3’脱塩基残基(dスペーサー、rスペーサー)、3’C6−アミノ−リンカー、および3’C12−アミノ−リンカーおよび任意のその機能的類似体のうちの任意の1つが挙げられる。
【0076】
「機能的類似体」または「類似体」という用語は、別の化合物または分子の構造と同様の構造を有するが、他の化合物または分子とはある特定の構成成分が異なる化合物または分子を指す。「機能的類似体」または「類似体」は、1つまたは複数の原子、官能基、または下部構造が異なり得、これらが、他の原子、基、または下部構造で置き換えられている。さらに、そのような類似体は、同様の物理的性質、化学的性質、および/または生化学的性質を有する。
【0077】
「官能基」という用語は、分子内の、それらの分子の特有の化学反応に関与し得る原子または結合の特定の基(部分)を指す。本明細書に記載の官能基は、これだけに制限されないが、モノエーテルまたはポリエーテル、モノエステルまたはポリエステル、カルボン酸、第一級アミン、F、Cl、Br、もしくはIなどのハロゲン、またはヒドロキシル基のうちの任意の1つから選択される。
【0078】
「ボロン酸」という用語は、炭素−ホウ素結合を含有し、有機ボランのより大きなクラスに属する、アルキル置換またはアリール置換されたホウ酸を指す。ボロン酸は、例えば、糖、アミノ酸またはヒドロキサム酸と、オリゴヌクレオチドの5’ヌクレオチドの5’OH基とのエステル結合などの、共有結合性の複合体を形成することができる。
【0079】
「チオリン酸」という用語は、リン酸基の代わりにPS
4−xO
x3−(x=0、1、2、または3)を含む化合物を指す。化学的性質および化学修飾、エステル化による結合などに関して本明細書で言及されるリン酸の特徴がチオホスフェートに類似して適用される。
【0080】
「スペーサー」という用語は、長い人工的なアームをオリゴヌクレオチドに組み入れ、それにより、例えば、ハイブリダイゼーションプローブの固相固定化、および得られたdsDNAと、シークエンシングアダプターなどの他のDNAのライゲーションの阻害を可能にするために使用される部分を指す。そのようなスペーサー部分としては、これに限定されないが、リボヌクレオチド、デオキシリボヌクレオチド、または化学的に修飾することができる任意のその類似体が挙げられる。
【0081】
「断片」という用語は、ウイルス、原核生物、真核生物、または古細菌から単離され、加熱などの当業者に公知の手段による断片化によって生成された任意のRNA配列を指す。RNAシークエンシング用の断片は、19〜510bp、好ましくは、60〜450bp、より好ましくは70〜420bp、なおより好ましくは100〜350bp、および最も好ましくは100〜200bpの長さを有することが好ましい。
【0082】
「RNA」という用語は、少なくとも200ntの長さの「長いRNA分子」または200nt未満の長さの「短いRNA分子」を指す。長いRNA分子としては、mRNA分子、rRNA分子、および高分子遺伝子間RNA(large intergenic RNA)(lincRNA)分子などの長い非コードRNA分子が挙げられる。短いRNA分子としては、tRNA分子、および本明細書では一般に「低分子RNA」と称される種々の低分子非コード調節RNA、すなわち、短鎖干渉RNA(siRNA)、マイクロRNA(miRNA)、とても小さい(tiny)非コードRNA(tncRNA)および低分子調節RNA(smRNA)が挙げられる。
【0083】
本明細書で使用される場合、「アダプター」という用語は、DNAまたはRNAをライゲーションすることができるオリゴヌクレオチドを指す。アダプターは、例えば、RNAアダプター、DNAアダプターであってよい、または、リボヌクレオチドおよびデオキシリボヌクレオチド、またはその類似体のいずれで構成されるものであってもよい。アダプターは標識されていても標識されていなくてもよい。アダプター配列は、約30〜80塩基、好ましくは約30〜70塩基、なおより好ましくは、60〜70塩基または30〜40塩基の長さを有する。一部のさらに好ましい実施形態では、アダプターの長さは、約62塩基または30〜40塩基である。アダプターは、平滑末端になっていてもよく、粘着末端を有してもよい。アダプターは、付着末端を有し、3’チミンを含むことが好ましい。
方法
【0084】
本発明の1つの態様は、特にRNAライブラリーの生成に関してRNAシークエンシングのための方法に言及し、それにより方法を以下により詳細に考察する。
【0085】
本明細書に記載の方法の一部の実施形態は、インタクトな長いRNAおよびインタクトな短いRNAを含有する最初のRNAの試料を断片化し、断片化されたRNA試料を得ることを伴う。最初の試料中の長いRNAは、少なくとも200ヌクレオチドであり、例えば、細胞mRNA、長い非コードRNA(例えば、lincRNAなど)および/またはrRNAが挙げられる。mRNAおよびrRNAを定義する特性は周知である。lincRNAは、最近発見され、多種多様なプロセス、例えば、胚性幹細胞多能性、細胞増殖、がんおよびクロマチン構造の調節に関与すると考えられている。Tingeras(Nature Biotechnology、2009年、27巻:346〜347頁)を参照されたい。最初の試料中の短いRNAは、200ヌクレオチド未満の長さであり、それらとして、tRNA、および本明細書では一般に「低分子RNA」と称される種々の低分子非コード調節RNA、すなわち、短鎖干渉RNA、マイクロRNA、とても小さい非コードRNAおよび低分子調節RNAが挙げられる。低分子RNAは、配列を規定する、18〜29ヌクレオチド(nt)の範囲の長さの非コード調節RNAの群である。多くの低分子RNAは、およそ19〜25bpの長さである。
【0086】
Novinaら(Nature、2004年、430巻:161〜164頁)は、低分子RNAを少なくとも4つの群:a)短鎖干渉RNA(siRNA)、b)マイクロRNA(miRNA)、c)とても小さい非コードRNA(tncRNA)およびd)低分子モジュレーターRNA(smRNA)に分類している。siRNAは、2本鎖RNAから生成される、およそ21〜22ntの長さの2本鎖RNAのクラスである。siRNAは、mRNAの切断を促進することによって遺伝子発現をサイレンシングすると考えられている。他方では、miRNAは、およそ19〜25ntの長さの1本鎖RNAのクラスである。miRNAは進化的に保存されていると思われ、また、翻訳を阻害することによって遺伝子発現をサイレンシングすると考えられている。tncRNAは、約20〜22ヌクレオチドのRNAのクラスである。tncRNAは、発生的に調節されると思われるが、それらの機能は分かっていない。smRNAは、成体ニューロンにおける神経特異的遺伝子発現の調節に関与する2本鎖RNAである。
【0087】
最初のRNA試料は、例えば、rRNAおよび/またはtRNA、mRNA、低分子RNA、長い非コードRNA、および低分子RNAなどの1つまたは複数の型のRNAを富化または枯渇させた、全細胞RNAまたはRNAを含有し得る。
【0088】
例えばシークエンシング目的でRNAを断片化するための方法としては、化学的断片化方法、酵素的断片化方法または熱的断片化方法が挙げられ、それに関するプロトコールは公知である(例えば、Chandlerら、Appl. Environ. Microbiol.、2003年、69巻:2950〜2958頁、Guschinら、Appl. Environ. Microbiol.、1997年、63巻:2397〜2402頁;Kellyら、Anal. Biochem.、2002年、311巻:103〜118頁、Liuら、Environ. Microbiol.、2001年、3巻:619〜629頁、Mehlmannら、Anal. Biochem.、2005年、347巻:316〜323頁、Nguyen、Nucleic Acids Res.、2000年、28巻:3904〜3909頁、Proudnikov、Nucleic Acids Res.、2006年、24巻:4535〜4542頁、Smallら、Appl. Environ. Microbiol.、2001年、67巻:4708〜4716頁を参照されたい)。
【0089】
一部の実施形態では、インタクトなRNAを、塩基性条件、例えば、Liuら(Applied and Environmental Microbiology、2007年、73巻:73〜82頁)に記載の通り、NaOH(例えば、50mMのNaOH)中、高温度(例えば、55℃)で、ある期間(例えば、10〜30分)にわたるインキュベーションを使用して断片化することができる。他の実施形態では、断片化は、インタクトなRNAを、例えばBrownら(J. Am. Chem. Soc.、2002年、124巻:7950〜7962頁)に記載の通り、金属イオン、例えば、ランタニド系列のイオンまたは二価金属イオン、例えばMg
2+またはZn
2+など(例えば、5mM〜200mMの濃度であってよい)と一緒に、高温(例えば、50℃〜95℃の範囲)で、ある期間、例えば、1分〜1時間にわたってインキュベートすることができるという点で、金属イオンにより触媒されるものであり得る。例えば、RNAは、Liu、上記参照に記載されている通り、10mMの硫酸亜鉛(ZnSO
4)または亜鉛塩化物(ZnCl
2)と一緒に、25mMのトリス−HCl(pH7.4)中、60℃で30分にわたってインキュベートすることによって断片化することができる。
【0090】
一部の実施形態では、RNAを、10mMのZnCl
2と一緒に、10mMのトリス−HCl、pH7中、70℃で15分にわたってインキュベートして、60〜200塩基の長さの断片を生じさせることができる。一部の実施形態では、RNAを、40mMのトリス−酢酸塩、pH8.1、100mMのKOAcおよび30mMのMgOAc中に、75℃で20〜30分にわたって置く。Mehlmannら(Analytical Biochemistry、2005年、347巻:316〜323頁)に記載されている通り、一般に、38塩基から150塩基の間の長さの断片が得られる。
【0091】
上記のインキュベーション期間は全て、得られる断片の長さを所望の通り増減させるために変更することができる。RNAシークエンシングのための断片サイズは、約19〜510bp、好ましくは約60〜450bp、より好ましくは約70〜420bp、なおより好ましくは約100〜350bp、および最も好ましくは約100〜200bpである。
【0092】
上記の方法を使用した断片化は、RNA全体を通してほぼランダムな位置で非特異的に起こるので、断片化は平均して、分子当たりでより長いRNAに対して起こり、これは、より長いRNA分子は断片化が起こる潜在性のある部位をより多く含有することに起因する。例えば、RNAを60〜200塩基の長さの断片に断片化する断片化条件では、平均して、およそ18〜30ヌクレオチドの長さの低分子RNAの断片化を伴わずに、およそ15〜50部位において、3kbの長さのRNA分子が断片化されるはずである。したがって、長いRNA分子と短いRNA分子とを含有するRNA試料の断片化により、a)長いRNA分子の断片、および、b)ほとんどインタクトな短いRNA分子を含有する、断片化された試料がもたらされる。したがって、断片化は、断片化プロセスの間に断片化されないのに十分な短いオリゴヌクレオチドの存在下で行うことができる。
【0093】
一部の実施形態では、第1の(1本鎖)DNA鎖(cDNA)を、RNAまたは断片化されたRNAを鋳型(単数または複数)として使用することを含む、逆転写酵素(RT)の使用によって、およびRNAとハイブリダイズするオリゴヌクレオチドプライマーの使用によって生成する。一部の実施形態では、これらの、ランダムであることが好ましいオリゴヌクレオチドは遮断性部分と共有結合している。相補DNA(cDNA)鎖を生成するための逆転写酵素は、当業者に公知の任意の逆転写酵素または任意のその機能性誘導体を含み、それらとして、これだけに制限されないが、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼ、Taq DNAポリメラーゼ、Tne DNAポリメラーゼ、Tma DNAポリメラーゼまたは酵素的に活性なその突然変異体、断片、バリアントまたは誘導体が挙げられる。
【0094】
一部の実施形態では、逆転写酵素は、qScript逆転写酵素(Quanta BioSciences)である。好ましい実施形態では、逆転写酵素反応を25℃で約10分にわたって行い、その後、42℃で約50分にわたってインキュベートする。逆転写酵素の不活化を70℃で約15分にわたって行う。
【0095】
一部の実施形態では、逆転写反応の後、cDNAを、2本鎖DNAが生成される第2のDNA鎖の合成に供する前に、精製ステップを行う。そのような精製は、例えば、QIAquick Nucleotide Removal Kit(QIAGEN)を使用することによって行う。そのようなキットを適用することにより、取り込まれなかったヌクレオチド、塩、および他の夾雑物を除去し、オリゴヌクレオチド(>17nt)および40bpから10kbまでにわたるDNA断片を、単純かつ高速な結合−洗浄−溶出手順および約30〜200μlの溶出液体積を使用して精製する。
【0096】
一部の実施形態では、第2のDNA鎖を、配列生成のために第1のcDNA鎖とハイブリダイズさせるオリゴヌクレオチドをプライマーとして適用することにより、DNAポリメラーゼIを使用することによって生成する。一部の実施形態では、これらのランダムであることが好ましいオリゴヌクレオチドは遮断性部分と共有結合している。そのような第2鎖(単数または複数)を生成するために好ましい条件は、25℃で約30分である。
【0097】
一部の実施形態では、第2のDNA鎖の生成が完了した後に、断片化されたRNAから生成されたDNAを末端修復するその後のステップを行うことができる。他の実施形態では、末端修復ステップを第2鎖の生成と同時に行う。末端修復ステップには、少なくとも2つの酵素:(a)ポリヌクレオチドキナーゼ、好ましくは2本鎖DNA断片の5’末端をリン酸化するT4ポリヌクレオチドキナーゼ(PNK);および(b)フィルイン反応またはトリミング反応のいずれかによってDNA断片の末端を平滑にする、ポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素(単数または複数)、例えば、T4 DNAポリメラーゼなどが必要である。DNAポリメラーゼI、ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素は、全て、約70℃で約10分にわたって不活化することが好ましい。
【0098】
一部の実施形態では、第1の1本鎖DNA鎖(cDNA)の生成に使用するオリゴヌクレオチドは、遮断性部分が共有結合したオリゴヌクレオチド、好ましくはランダムな修飾オリゴヌクレオチドである。他の実施形態では、第2のDNA鎖の生成ステップにおけるオリゴヌクレオチドは、遮断性部分が共有結合したオリゴヌクレオチド、好ましくはランダムな修飾オリゴヌクレオチドである。第2のDNA鎖の生成により、第2のDNA鎖が、オリゴヌクレオチドと結合していることが好ましい遮断性部分を含む、2本鎖DNAがもたらされる。遮断性部分を含むオリゴヌクレオチドとしては、これだけに限られないが、6mer〜10merのランダムオリゴヌクレオチド、好ましくは、ランダムな6merオリゴヌクレオチドが挙げられる。これらのオリゴヌクレオチドは、5’末端ヌクレオチドにおけるライゲーション反応が遮断されるように部分と共有結合していることが好ましい。その後のシークエンシングアダプターとのライゲーション反応が遮断されることがより好ましい。より詳細には、これらのオリゴヌクレオチドは、5’末端に遊離の5’リン酸基を有さない、5’末端オリゴヌクレオチドの塩基が、チミン、アデニン、シトシン、グアニンおよびウラシルのいずれでもない;5’末端ヌクレオチドのデオキシリボースの2’水素の一方または両方が別の原子または遮断性部分で置き換えられている、かつ/または、オリゴヌクレオチドは、RNAまたはDNAにおけるリボースまたはデオキシリボースの立体コンフォメーション以外の立体コンフォメーションのペントースを有する5’末端ヌクレオチドを含む。好ましくは、そのようなペントース分子として、これだけに制限されないが、アラビノースが挙げられる。
【0099】
好ましい実施形態では、本明細書で言及される非修飾オリゴヌクレオチドプライマーは、5’末端においてリン酸化されている。
【0100】
一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、遮断性部分と共有結合する前の、5’末端ヌクレオチドの5’OHまたは遊離の5’リン酸基を含む。
【0101】
一部の実施形態では、遮断性部分が共有結合したオリゴヌクレオチドまたは非修飾オリゴヌクレオチドは、高ストリンジェンシー条件下でハイブリダイズする。オリゴヌクレオチドは、鋳型DNAまたはRNAと相補的であることがより好ましい。
【0102】
好ましい実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、その5’末端ヌクレオチドの5’OHが遮断性部分と共有結合している。他の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、その5’末端ヌクレオチドの5’リン酸基が遮断性部分と共有結合している。
【0103】
一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’ヌクレオチドの5’リン酸基は、ペントース、好ましくはオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースのリン酸基と、少なくとも1つのOH基を含む炭化水素、好ましくは、少なくとも1つのOH基を含むアリールもしくはアルキルアルコール、より好ましくは第一級もしくは第二級アルキルアルコールのヒドロキシル(OH)基または5’5’反転ヌクレオチドのOH基との間のジエステル結合によってエステル化されている。他の実施形態では、ライゲーションを遮断する部分を含むオリゴヌクレオチドプライマーの5’OH基は、好ましくは、酸性基によって、より好ましくは、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、もしくはボロン酸によってエステル化もしくはエーテル化されている。
【0104】
アルキルアルコールまたはアリールアルコール、好ましくは第一級または第二級アルキルアルコールは、少なくとも1つの追加的な官能基をさらに含んでよい。そのような官能基は、これだけに制限されないが、モノエーテルまたはポリエーテル、モノエステルまたはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択されることが好ましい。アルキルアルコールまたはアリールアルコールは、2−メチル−テトラヒドロフランおよびその誘導体などの環状エーテルを含んでよい。一部の実施形態では、モノアルキルアルコールまたはアリールアルコール、好ましくは第一級または第二級アルコールは、ビオチニル基を含む。
【0105】
一部の実施形態では、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルまたはジアルキルホスホチオネートまたはボロン酸は、以下のうちの任意の1つから選択される少なくとも1つの追加的な官能基を含む:モノエーテルまたはポリエーテル、モノエステルまたはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基。好ましい実施形態では、5’ヌクレオチドの5’OH基は、これだけに限定されないが、5’スペーサー18、5’スペーサー9、5’C3−スペーサー、5’C6−スペーサー、5’脱塩基残基(dスペーサー、rスペーサー)、5’−5’反転ヌクレオチドなどの5’−スペーサー、およびDADE−リンカー、5’C6−アミノ−リンカー、5’C12−アミノ−リンカー、またはビオチン化5’C6−アミノ−リンカー、5’C12−アミノ−リンカーなどの5’リンカー、または任意のその機能的類似体を含めた分子によってエステル化されている。
【0106】
一部の実施形態では、5’末端ヌクレオチドの5’末端にライゲーションを遮断する部分(鎖に共有結合した遮断性部分)を含む、生成された第1の1本鎖DNA鎖は、3’末端に、ライゲーションを遮断する別の部分(鎖に共有結合した遮断性部分)をさらに含んでよい。前記遮断性部分の共有結合は、第1のDNA鎖の生成後に導入される。第1のDNA鎖の3’末端の3’OH基は遊離していないことが好ましく、前記3’OH基が遮断性部分と共有結合していることが好ましい。
【0107】
一部の実施形態では、非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる。
【0108】
一部の実施形態では、オリゴヌクレオチドの5’末端の5’ヌクレオチドの2’水素(単数または複数)の一方または両方が、これだけに制限されないが、ハロゲン原子、好ましくはF、Cl、BrもしくはI、または、1つまたは複数の追加的な官能基を含んでも含まなくてもよいC1〜C5アルキル基もしくはC1〜C5アルコキシ基、好ましくはC1〜C3アルキル基もしくはC1〜C3アルコキシ基から選択される原子または遮断性部分で置き換えられている。
【0109】
一部の実施形態では、オリゴヌクレオチドの3’末端(end)/末端(terminus)の3’OH基には、遮断性部分が共有結合している。一部の実施形態では、修飾は、ジデオキシヌクレオチド、または3’末端ジデオキシヌクレオチドを含むオリゴヌクレオチドからなる。
【0110】
一部の実施形態では、3’末端ヌクレオチドのペントース、好ましくは生成された第1鎖の3’末端ヌクレオチドのデオキシリボースの3’OH基は、モノアルキルまたはジアルキルホスフェートでさらにエステル化されている。他の実施形態では、ペントース、好ましくは生成された第1鎖の3’末端ヌクレオチドのデオキシリボースの3’OH基は、ホスホチオネートによってエステル化されていてよい。さらに他の実施形態では、ペントース、好ましくはオリゴヌクレオチドの3’末端ヌクレオチドのデオキシリボースの3’OH基は、ボロン酸によってエステル化されている。モノアルキルホスフェートもしくはジアルキルホスフェート、アルキルホスホチオネート、またはボロン酸は、少なくとも1つの追加的な官能基を含むことが好ましい。好ましくはそのような官能基は、これだけに制限されないが、モノエーテルもしくはポリエーテル、モノエステルもしくはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される。モノアルキルホスフェートは、2−メチル−テトラヒドロフランおよびその誘導体などの環状エーテルを含んでよい。
【0111】
3’ヌクレオチドの3’OH基は、好ましくはジエステルによって、エステル化されていることが好ましい。3’ヌクレオチドの3’OH基は、以下の3’スペーサー18、3’スペーサー9、3’C3−スペーサー、3’C6−スペーサー、3’脱塩基残基(dスペーサー、rスペーサー)、3’C6−アミノ−リンカー、3’C12−アミノ−リンカー、および任意のその機能的類似体を含めた分子のうちの任意の1つのOH基によってエステル化されている。
【0112】
一部の実施形態では、上記の遮断性部分は、好ましくはT4 RNAリガーゼを使用することによって、オリゴヌクレオチドが1本鎖cDNAとライゲーションするように、導入することができ、それによって、前記オリゴヌクレオチドは、3’末端、好ましくは3’末端3’OH基に、ライゲーションを遮断する上記の遮断性部分のいずれかを含有する。
【0113】
任意選択の末端修復ステップおよび第2鎖の生成後、チミジンヌクレオチドによって形成された突出部、すなわち、T−突出部を有し得るアダプターをシークエンシングするためのドッキング部位としての末端アデニンを生成する、いわゆるA付加ステップを行うことができる。
【0114】
一部の実施形態では、末端修復されたRNAとシークエンシングアダプターのドッキングは、RNAおよびアダプター分子がどちらも平滑末端を有する、平滑末端クローニングによって実現することができる。シークエンシングアダプターは、表面に共有結合していることが好ましい。
【0115】
A−突出部をPCR産物の3’末端に付加し、それを、例えば、5’→3’ポリメラーゼ活性は有するが、3’→5’エキソヌクレアーゼ活性と5’→3’エキソヌクレアーゼ活性の両方を欠く、DNAポリメラーゼIの大きな断片であるクレノウ断片エキソ−によって末端修復することができる。クレノウ断片エキソ−を使用することによるA付加ステップは、37℃で約30分にわたって行うことが好ましい。酵素の不活化を75℃で約10分にわたって行う。
【0116】
あるいは、A付加ステップは、Taqポリメラーゼなどの、末端ヌクレオチドトランスフェラーゼ活性を有する酵素を用いて容易にすることができる。
【0117】
任意選択のA付加ステップの後、シークエンシングアダプターとDNAをT4 DNAリガーゼ、T3 DNAリガーゼ、またはT7 DNAリガーゼなどのリガーゼ、好ましくはT4 DNAリガーゼによってライゲーションすることができる。平滑末端ライゲーションはT4 DNAリガーゼまたはT3 DNAリガーゼ、好ましくはT4 DNAリガーゼを用いて行うことができる。ライゲーションは、第1鎖(cDNA)配列の構成物として遮断性部分を含む5’末端ランダムオリゴヌクレオチドを含まない鎖に対してのみ有効である。したがって、逆転写酵素を用いた1本鎖cDNA生成または第2のDNA鎖の生成のいずれを、遮断性部分を含むオリゴヌクレオチドの存在下で行うかに応じて、5’末端および3’末端におけるTA−ライゲーションによって第2鎖または第1鎖のみをアダプターに付着させることができる。一部の実施形態では、第1のDNA鎖の5’末端および3’末端の両方がライゲーション阻害性部分(遮断性部分)と結合している場合、アダプターは、第2のDNA鎖のみに付着させることができる。
【0118】
第1のDNA鎖または第2のDNA鎖を3’末端および5’末端に付着させるアダプターは、同じでないことが好ましい。
【0119】
好ましい実施形態では、シークエンシングアダプターとのライゲーションを、GeneRead Library Prep Kit(QIAGEN)を製造者の説明書に従って適用することによって行う。ライゲーション産物を、GeneRead Size Selection Kit(QIAGEN)を用いて精製し、GeneRead Library Amplification Kit(QIAGEN)を使用することにより、10回またはそれ超のサイクルにわたってPCR増幅することが好ましい。
【0120】
一部の実施形態では、上記の方法は、RT反応物を精製するための精製ステップをさらに含む。前記精製反応は、QIAquick Nucleotide Removal Kit(QIAGEN)を用いて行うことが好ましい。前記方法は、第2のDNA鎖の生成および任意選択の末端修復反応後に使用される、PCR精製ステップをさらに含み得る。前記方法は、アダプター−ライゲーションステップ後、シークエンシングおよび配列解析を行う前に適用される、さらなる精製ステップを含み得る。そのような精製ステップのためにGeneRead size Selection kitを選択することが好ましい。
【0121】
一部の実施形態では、シークエンシングは、ペアエンドシークエンシングを適用することによって行うことができる。そのようなシークエンシングにより、dsDNA末端の両側から開始する配列解析が可能になる。好ましい実施形態では、断片から生成されたアダプターとライゲーションした鎖を、固体表面、例えばIllumina(登録商標)(Solexa)シークエンサー、より好ましくはMiSeqシークエンサーなどに適用することができる。2つのアダプター配列のそれぞれが、フローセル上のそれぞれの表面に結合した増幅プライマーと相補的である。
キット
【0122】
本発明の別の態様はキットを指し、係るキットは、
(i)DNAとシークエンシングアダプターのライゲーションを遮断する、5’末端ヌクレオチドに共有結合した部分を含むオリゴヌクレオチドプライマー;
(ii)非修飾オリゴヌクレオチドプライマー;
(iii)逆転写酵素;ならびに
(iv)任意選択で、DNAポリメラーゼ;
を含む。
【0123】
一部の実施形態では、キットは、逆転写酵素の有効な逆転写活性を可能にする緩衝液をさらに含む。そのような緩衝液は、7.5.〜9.0の範囲、好ましくは8.0〜8.5、より好ましくは約8.3のpHを有する。適切な緩衝液は、トリス−HCl(約50mM、25℃で)、40〜75mMのKCl、3〜10mMのMgCl
2、より好ましくは7mM MgCl
2、および約1〜10mMのDTTを含む。
【0124】
一部の実施形態では、本明細書で言及されるキットは、
(v)ポリヌクレオチドキナーゼ、およびポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素;
(vi)任意選択で、デオキシヌクレオチジルトランスフェラーゼ酵素;
(vii)末端修復されたDNA鎖とのライゲーションのための末端チミンを任意選択で含み、それぞれが、表面にそれぞれ結合した増幅プライマーと相補的である、2つのアダプター;ならびに
(viii)リガーゼ
をさらに含む。
【0125】
一部の実施形態では、ライゲーションを遮断する部分と共有結合したオリゴヌクレオチドプライマーまたは非修飾オリゴヌクレオチドプライマーは、ランダムオリゴヌクレオチドプライマーである。
【0126】
上記のキットの一部の実施形態では、逆転写酵素は、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、B型肝炎逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、マウス白血病ウイルス逆転写酵素、トリ骨髄芽球症ウイルス(AMV)、細菌逆転写酵素、Tth DNAポリメラーゼ、またはTaq DNAポリメラーゼのうちの任意の1つから選択される。
【0127】
一部の実施形態では、DNAポリメラーゼはDNAポリメラーゼIであり、ポリヌクレオチドキナーゼはT4ポリヌクレオチドキナーゼであり、ポリメラーゼ活性とエキソヌクレアーゼ活性とを有する酵素はT4 DNAポリメラーゼであり、デオキシヌクレオチジルトランスフェラーゼ酵素はクレノウ断片エキソ−である。
【0128】
一部の実施形態では、第2鎖の生成および末端修復を同時に行うための、キット中の適切な緩衝液条件は、10〜30mMのトリス−HCl、8〜15mMの(NH
4)
2SO
4、2〜10mMのMgCl
2、0.1〜0.2のβ−NAD、それぞれpH7.4、25℃を含む、またはそれからなる。緩衝液条件は、約20mMのトリス−HCl、約12mMの(NH
4)
2SO
4、約5mMのMgCl
2、約0.16のβ−NAD、それぞれ約pH7.0〜7.6、好ましくは7.4、25℃を含む、またはそれからなることが好ましい。
【0129】
一部の実施形態では、キットは、約50mMのトリス−HCl、約10mMのMgCl
2、約1mMのATP、および約10mMのDTT、それぞれ約pH7.5、25℃を含む、またはそれからなる、リガーゼの有効な酵素活性のための緩衝液をさらに含み得る。
【0130】
上記のキットの好ましい実施形態では、オリゴヌクレオチドは、5’末端ヌクレオチドにおけるライゲーション反応が遮断されるように、より詳細には、5’末端ヌクレオチドの5’リン酸において遮断性部分と共有結合している。その後のシークエンシングのためのアダプターとのライゲーションが遮断されることがより好ましい。
【0131】
より詳細には、遮断性部分と共有結合したこれらのオリゴヌクレオチドは、5’末端に遊離の5’リン酸基を有さず、5’末端オリゴヌクレオチドの塩基が、チミン、アデニン、シトシン、グアニンおよびウラシルのいずれでもなく;5’末端ヌクレオチドのデオキシリボースの2’水素の一方または両方が別の原子または遮断性部分で置き換えられている、かつ/または、オリゴヌクレオチドは、RNAまたはDNAにおけるリボースまたはデオキシリボースの立体コンフォメーション以外の立体コンフォメーションのペントースを有する5’末端ヌクレオチドを含む。好ましくは、そのようなペントース分子として、これだけに制限されないが、アラビノースが挙げられる。
【0132】
一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、遮断性部分と共有結合する前の、5’末端ヌクレオチドの5’OHまたは遊離の5’リン酸基を含む。
【0133】
一部の実施形態では、非修飾オリゴヌクレオチドプライマーは、5’末端においてリン酸化されており、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーは、その5’末端ヌクレオチドの5’OHまたは遊離の5’リン酸基が部分と共有結合している。
【0134】
上記の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースの5’リン酸基は、エステル化されている、またはライゲーションを遮断するオリゴヌクレオチドプライマーの5’末端ヌクレオチドの5’OH基は、エステル化またはエーテル化されている。
【0135】
上述の方法またはキットの一部の実施形態では、ライゲーションを遮断する共有結合した部分を含むオリゴヌクレオチドプライマーの5’リン酸基は、アルキルアルコールまたはアリールアルコールによってエステル化されているか、または、ライゲーションを遮断するオリゴヌクレオチドプライマーの5’OH基は、モノアルキルホスフェート、ジアルキルホスフェート、モノアルキルホスホチオネートもしくはジアルキルホスホチオネート(phosphothionate)によって、もしくはボロン酸によってエステル化されている。
【0136】
一部の実施形態では、5’ヌクレオチドの5’リン酸基は、ペントース、好ましくはオリゴヌクレオチドプライマーの5’末端ヌクレオチドのデオキシリボースのリン酸基と、少なくとも1つのOH基を含む炭化水素、好ましくは、少なくとも1つのOH基を含むアリールまたはアルキルアルコール、より好ましくは第一級または第二級アルキルアルコールのヒドロキシル基との間のジエステル結合によってエステル化されている。他の実施形態では、OH基は、5’5’反転ヌクレオチドのOH基である。アルキルアルコールまたはアリールアルコール、好ましくは第一級または第二級アルキルアルコールは、少なくとも1つの追加的な官能基をさらに含んでよい。そのような官能基は、これだけに制限されないが、モノエーテルまたはポリエーテル、モノエステルまたはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択されることが好ましい。アルキルアルコールまたはアリールアルコールは、2−メチル−テトラヒドロフランおよびその誘導体などの環状エーテルを含んでよい。一部の実施形態では、モノアルキルアルコールまたはアリールアルコール、好ましくは第一級または第二級アルコールは、ビオチニル基を含む。
【0137】
一部の実施形態では、5’ヌクレオチドの5’OH基に共有結合した遮断性部分は、以下のいずれかから選択される: 5’スペーサー18、5’スペーサー9、5’C3−スペーサー、5’C6−スペーサー、5’脱塩基残基(dスペーサー、rスペーサー)、5’−5’反転ヌクレオチドなどの5’−スペーサー、ならびにDADE−リンカー、5’C6−アミノ−リンカー、および5’C12−アミノ−リンカー、および5’−ビオチン化C6、C12−アミノ−リンカーなどの5’リンカー、ならびに任意のその機能的類似体。
【0138】
一部の実施形態では、非修飾5’末端ヌクレオチドを、フルダラビン、アザチオプリン、メルカプトプリン、ペントスタチン、クラドリビン、フロクスウリジン、ゲムシタビン、シタラビン、ゲムシタビン、カペシタビン、およびテガフールのうちの任意の1つと共有結合させる。
【0139】
一部の実施形態では、オリゴヌクレオチドの5’末端の5’ヌクレオチドの2’水素(単数または複数)の一方または両方が、これだけに制限されないが、ハロゲン原子、好ましくはF、Cl、Br、もしくはI、または、1つまたは複数の追加的な官能基を含んでも含まなくてもよいC1〜C5アルキルもしくはC1〜C5アルコキシ基、好ましくはC1〜C3アルキルもしくはC1〜C3アルコキシ基から選択される原子または部分で置き換えられている。
【0140】
上記のキットの一部の実施形態では、ペントース、好ましくは生成された第1のDNA鎖の3’末端ヌクレオチドのデオキシリボースの3’OH基は、ライゲーションを遮断する部分と共有結合していてよい。3’ヌクレオチドの3’OH基は、より好ましくはジエステルによって、エステル化されていることが好ましい。
【0141】
キットの一部の実施形態では、3’末端の3’OH基における遮断性部分の共有結合は、炭化水素ホスフェート、好ましくはアルキルホスフェートまたはアリールホスフェート、より好ましくはモノアルキルホスフェートまたはジアルキルホスフェートからなる。他の実施形態では、遮断性部分の共有結合は、炭化水素ホスホチオネート、好ましくはアリールホスホチオネートまたはアルキルホスホチオネート、より好ましくはモノアルキルホスホチオネートまたはジアルキルホスホチオネートからなる。さらに他の実施形態では、遮断性部分の共有結合は、ボロン酸からなる。さらに他の実施形態では、修飾は、アリールホスホボロネート(phosphoboronate)またはアルキルホスホボロネート、より好ましくはモノアルキルホスホボロネートまたはジアルキルホスホボロネートである。
【0142】
アルキルホスフェート、アルキルホスホチオネート、またはボロン酸は、モノエーテルまたはポリエーテル、モノエステルまたはポリエステル、カルボン酸、第一級アミンまたはヒドロキシル基から選択される少なくとも1つの追加的な官能基を含むことが好ましい。モノアルキルまたはジアルキルホスフェートは、2−メチル−テトラヒドロフランおよびその誘導体などの環状エーテルも含んでよい。3’ヌクレオチドの3’OH基は、好ましくはジエステルによって、エステル化されていることが好ましい。3’ヌクレオチドの3’OH基は、以下の3’スペーサー18、3’スペーサー9、3’C3−スペーサー、3’C6−スペーサー、3’脱塩基残基(dスペーサー、rスペーサー)、3’C6−アミノ−リンカー、3’C12−アミノ−リンカー、および任意のその機能的類似体を含めた分子のうちの任意の1つのOH基によってエステル化されている。
【0143】
一部の実施形態では、上記の遮断性部分は、好ましくはT4 RNAリガーゼを使用することによって、オリゴヌクレオチドが1本鎖cDNAとライゲーションするように導入することができ、それによって、前記オリゴヌクレオチドは、3’末端、好ましくは3’末端3’OH基に、ライゲーションを遮断する上記の遮断性部分のいずれかを含有する。
【0144】
上記のキットの一部の実施形態では、キットは、RT反応セットアップを精製するための精製キットをさらに含み得る。前記精製キットはQIAquick Nucleotide Removal Kit(QIAGEN)であることが好ましい。前記キットは、第2のDNA鎖の生成および末端修復反応の後に使用するPCR精製キットをさらに含み得る。精製はMinElute PCR Purification Kit(QIAGEN)を適用することによって行うことが好ましい。前記キットは、アダプター−ライゲーションステップの後に適用する、さらなる精製ステップを含み得る。そのような精製ステップのためにGeneRead Size Selection kitを選択することが好ましい。
【実施例】
【0145】
HeLa細胞由来のRNAを、RNeasy kit(QIAGEN)を用いて抽出し、PolyA+mRNAを、GeneRead Pure mRNA Kit(QIAGEN)を用いて富化する。次いで、PolyA+mRNA86ngを以下のプロトコールに従って各RNA−Seq Library Prep反応に使用する:
【0146】
mRNA32μl(総量:86ng)をqScript Flex Reaction Mix(5×)(Quanta Biosciences)8μl、ランダムな8merオリゴ2μl(200μM、IDT)と混合した。ランダムなオリゴは、ネイティブなオリゴ(「対照」)、または、得られるcDNAとシークエンシングアダプターのライゲーションを遮断するC3スペーサーを5’に有するオリゴ(「Mod」、/5SpC3/NNN NNN NN、IDT))のいずれかである。
【0147】
mRNA/ランダムなオリゴ混合物を94℃で15分間加熱して、RNAを平均サイズ約100〜200bpに断片化する。熱媒介性断片化の後、混合物を氷上で冷却する。
【0148】
その後、逆転写(RT)構成成分:RNAse阻害剤(4U/μl、QIAGEN)2μl、dNTP(各10mM、QIAGEN)2μl、DTT(0.1M)4μl、およびqScript Reverse Transcriptase(Quanta BioSciences)2μlを添加する。以下の温度プロファイルをRT反応に使用する:25℃で10分間、42℃で50分間、および酵素を不活化するために70℃で15分間。
【0149】
RT反応が完了したら、第1鎖cDNA合成反応液を、QIAquick Nucleotide Removal Kit(QIAGEN)を用いて精製した後、cDNAを、精製された第1鎖cDNA(溶出液40μl中)、10×NEB Second Strand Synthesis Reaction Buffer(New England Biolabs)8μl、E.coli DNAリガーゼ(10U/μl、New England Biolabs)10μl、DNAポリメラーゼI(5U/μl、New England Biolabs)4.8μl、RNase H(5U/μl、New England Biolabs)4μl、T4ポリヌクレオチドキナーゼ(10U/μl、New England Biolabs)4μl、T4 DNAポリメラーゼ(3U/μl、New England Biolabs)およびRNaseを含まない水(QIAGEN)5.2μlを含有する、総反応体積を80μlにした、第2鎖合成に供する。
【0150】
2本鎖cDNAの末端修復を容易にし、シークエンシングアダプターとのライゲーションをすぐに行えるようにするために、T4ポリヌクレオチドキナーゼおよびT4 DNAポリメラーゼを添加する。第2鎖cDNA合成反応液を25℃で30分にわたって実施し、次いで、70℃で10分にわたって熱不活化を行う。
【0151】
反応混合物を、MinElute PCR Purification Kit(QIAGEN)を用いて精製し、水25μl中に溶出させる。クレノウ(エキソ−)3μlおよび10×A付加緩衝液3μl(どちらもGeneRead Library Prep Kit、QIAGEN)を溶出液25μlに添加し、A付加反応を37℃で30分にわたって実施し、75℃で10分にわたって不活化を行う。
【0152】
次いで、アダプターライゲーション反応を、GeneRead Library Adapters for Illumina Sequencers(QIAGEN)、GeneRead Library Prep kit(QIAGEN)からのライゲーション緩衝液およびリガーゼを製造者の説明書に従って用いて行う。上記プロセスのワークフローを
図1に示す。
【0153】
ライゲーションされたシークエンシングライブラリーを、GeneRead Size Selection kit(QIAGEN)を用いて精製し、10サイクルにわたってPCR増幅する(GeneRead Library Amplification kit、QIAGEN)。
【0154】
次いで、両方のライブラリーのシークエンシングを、miSeq計器においてMiSeq Reagent Kit V2(300 nt)を用い、ペアエンドシークエンシングを適用することによって行う。CLC Genomics Workbench(QIAGEN)を用いてシークエンシングデータを解析する。
【0155】
図2に示されている通り、どちらのライブラリーも、ヒトゲノム参照hg19にマッピングされた高いリードの百分率(97.31%および97.32%)、ならびにユニークなリードの百分率(76.93%および79.06%)を有し、これにより、ライブラリーの品質が良好であることが実証される。
【0156】
両方のライブラリーの鎖特異性を調査する。
図3に示されている通り、遮断性部分と共有結合したランダムなオリゴを用いて生成したライブラリーの第1のリード(MOD、R1)は、主に参照のフォワード鎖にマッピングされ、一方、第2のリード(MOD、R2)は、主にリバース鎖にマッピングされる。対照的に、対照ライブラリーでは、R1またはR2のいずれのマッピングも、フォワード鎖とリバース鎖とで比較的バランスがとれている。
【0157】
RPKM(マッピングされたリード100万当たりの転写物1キロベース当たりのリード(Reads Per Kilobase of transcript per Million reads mapped))の比較により、2つのライブラリーが高い程度で一致することが実証され(97.89%のR
2、
図4、対照ライブラリーからのRPKM:X軸;鎖RNA−SeqライブラリーからのRPKM:MOD)、これにより、鎖RNA−Seqライブラリーの遺伝子発現プロファイリング結果が対照である標準のRNA−seqライブラリーと比較して変化しないことが示唆される。
【0158】
まとめると、新規方法では、標準のRNA−Seqライブラリー調製プロトコール手順からの偏差は最小であり、しかしワークフローに追加的な酵素反応ステップを導入せずに、鎖特異的RNA−Seqライブラリーを生成することができることが示される。