(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2015-516814(P2015-516814A)
(43)【公表日】2015年6月18日
(54)【発明の名称】標的化されたDNAの濃縮および配列決定
(51)【国際特許分類】
C12Q 1/68 20060101AFI20150522BHJP
C12N 15/09 20060101ALI20150522BHJP
【FI】
C12Q1/68 Z
C12N15/00 A
【審査請求】未請求
【予備審査請求】未請求
【全頁数】28
(21)【出願番号】特願2015-509409(P2015-509409)
(86)(22)【出願日】2013年4月29日
(85)【翻訳文提出日】2014年12月12日
(86)【国際出願番号】EP2013058934
(87)【国際公開番号】WO2013164319
(87)【国際公開日】20131107
(31)【優先権主張番号】12166190.4
(32)【優先日】2012年4月30日
(33)【優先権主張国】EP
(81)【指定国】
AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IS,JP,KE,KG,KM,KN,KP,KR,KZ,LA,LC,LK,LR,LS,LT,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT,TZ,UA,UG,US,UZ,VC
(71)【出願人】
【識別番号】507214038
【氏名又は名称】キアゲン ゲーエムベーハー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】ヴェドラー, ホルガー
(72)【発明者】
【氏名】ヴェドラー, エリカ
(72)【発明者】
【氏名】ローファート, ディルク
(72)【発明者】
【氏名】オニール, ドミニク
【テーマコード(参考)】
4B024
4B063
【Fターム(参考)】
4B024AA11
4B024AA20
4B024CA01
4B024CA09
4B024HA11
4B024HA19
4B024HA20
4B063QA13
4B063QQ42
4B063QR35
4B063QR48
4B063QR51
4B063QR55
4B063QS15
4B063QS34
(57)【要約】
本発明は、組成物中のデオキシリボ核酸(DNA)の1つ以上の標的配列を濃縮するための方法であって、1つ以上のデオキシリボ核酸(DNA)分子を含む組成物を提供する工程、前記1つ以上のDNA分子に1つ以上の標的特異的リボ核酸(RNA)ハイブリダイゼーションプローブをハイブリダイズさせ、それによって1つ以上のRNA/DNAハイブリッドを形成させる工程、RNA/DNAハイブリッドを、かかるRNA/DNAハイブリッドに特異的である1つ以上の抗体で捕捉し、それによって1つ以上のRNA/DNA/抗体ハイブリッドを形成させる工程、1つ以上のRNA/DNA/抗体ハイブリッドを単離する工程、1つ以上のRNA/DNA/抗体ハイブリッドの1つ以上のDNA分子を必要に応じて増幅する工程、および場合により、1つ以上のRNA/DNA/抗体ハイブリッドの1つ以上のDNA分子または増幅産物を配列決定する工程などを含む。
【特許請求の範囲】
【請求項1】
組成物中のデオキシリボ核酸(DNA)の1つ以上の標的配列を濃縮するための方法であって、前記方法は:
(a)1つ以上のデオキシリボ核酸(DNA)分子を含む組成物を提供する工程、
(b)前記1つ以上のDNA分子に1つ以上の標的特異的リボ核酸(RNA)ハイブリダイゼーションプローブをハイブリダイズさせ、それによって1つ以上のRNA/DNAハイブリッドを形成させる工程、
(c)前記RNA/DNAハイブリッドを、かかるRNA/DNAハイブリッドに特異的である1つ以上の抗体で捕捉し、それによって1つ以上のRNA/DNA/抗体ハイブリッドを形成させる工程、
(d)前記1つ以上のRNA/DNA/抗体ハイブリッドを単離する工程、
(e)前記1つ以上のRNA/DNA/抗体ハイブリッドのうちの前記1つ以上のDNA分子を必要に応じて増幅する工程、および
(f)前記RNA/DNA/抗体ハイブリッドの前記DNA分子または増幅産物を配列決定する工程
を含み、前記配列決定する工程が、好ましくは次世代配列決定によって行われるものである、方法。
【請求項2】
前記標的配列が、コード領域(エクソン)の群から選択される、請求項1に記載の方法。
【請求項3】
前記コード領域が、代謝遺伝子、調節遺伝子および癌遺伝子の群から選択される、請求項2に記載の方法。
【請求項4】
前記組成物中の前記DNA分子が、次世代配列決定用のDNA断片ライブラリであり、場合により、前記ライブラリ中のDNA断片が、末端ユニバーサルアダプター配列を含む、請求項1〜3のいずれかに記載の方法。
【請求項5】
前記DNA分子が、DNA断片ライブラリから成り、
(a)前記ライブラリ中の前記DNAが、断片化され、サイズ選択され、続いて必要に応じて、二本鎖平滑末端断片を生じさせるようにまたはA−オーバーハングを有する末端を生じさせるようにそれぞれ末端修復されており、かつ
(b)前記断片が、同一の隣接配列を有する断片ライブラリを生じさせるように二本鎖または部分的に二本鎖のアダプターオリゴヌクレオチドにライゲートされている、
請求項1〜4のいずれかに記載の方法。
【請求項6】
RNAプローブが、未修飾かつ未標識である、請求項1〜5のいずれかに記載の方法。
【請求項7】
前記RNAプローブが、合成されたRNAプローブ、転写されたDNAプローブであるか、または生物学的試料から単離され、精製される、請求項1〜6のいずれかに記載の方法。
【請求項8】
前記抗体が固体表面に、好ましくは磁性粒子に結合される、請求項1〜7のいずれかに記載の方法。
【請求項9】
前記抗体が磁性粒子に結合される場合、前記単離する工程が、磁場を用いて行われ、そして単離された前記RNA/DNA/抗体ハイブリッドを洗浄することを場合により含む、請求項1〜8のいずれかに記載の方法。
【請求項10】
前記DNA分子が、単離された前記RNA/DNA/抗体ハイブリッド上で直接増幅される、請求項1〜9のいずれかに記載の方法。
【請求項11】
前記増幅する工程が、前記ユニバーサルアダプター配列を結合するプライマーを用いて行われる、請求項1〜10のいずれかに記載の方法。
【請求項12】
RNAが、配列決定前に酵素的に消化される、請求項1〜11のいずれかに記載の方法。
【請求項13】
DNA/RNAハイブリッド分子に特異的である抗体、およびさらに1つ以上の標的特異的RNAハイブリダイゼーションプローブを含む、キットであって、前記抗体は、場合により磁性粒子に結合される、キット。
【請求項14】
前記RNAハイブリダイゼーションプローブが、コード領域(エクソン)の群から選択される標的配列に特異的である、請求項13に記載のキット。
【請求項15】
前記コード領域が、代謝遺伝子、調節遺伝子および癌遺伝子の群から選択される、請求項14に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学、核酸配列決定ならびに特にDNA配列の濃縮および配列決定の分野にある。
【背景技術】
【0002】
長年をかけて、ゲノム解析分野における研究は、ほんの数個のヌクレオチドの配列決定から全ゲノムの配列決定へと進歩してきた。
【0003】
ハイ・スループット・シークエンサは、「次世代」(「next−gen」もしくは「ngs」)シークエンサともよばれ、または(第三世代に対して)「第二世代」シークエンサとよばれることもあり、何百万もの塩基またはGbpを網羅する10
5から数10
6のDNAリードを送達する技術である。それは、ゲノムの(再)配列決定、タンパク質のDNA結合部位の決定(ChIP−seq)、トランスクリプトームの配列決定(RNA−seq)のために使用されている(最終段落を参照されたし)。
【0004】
製造業者および技術としては、36または150bpの600ギガ塩基(Gb)までのリードを生成するSolexa/Illumina、400〜1000bpの700Mbpまでのリードを生成するRoche/454、35〜75bpの1日当たり20Gb超のリードを生成するABI/SOLiD、25〜45bpの21〜35Gbのリードを生成するHelicos、およびComplete Genomics(サービス会社)である。
【0005】
これらの技術は、配列情報の解析を別のレベルに至らせる。実験の再考は、非常に重要である。
【0006】
例えば、すべての公知癌遺伝子の解析を望む場合(癌に関するおおよそ3000の遺伝子が公知である[M.E.Higginsら、CancerGenes:a gene selection resource for cancer genome projects.Nature Methods.2007 35(1).Pp.D721−D726])、少量の関連配列情報のために莫大な量のDNAを配列決定しなければならないだろう。
【0007】
生成される大量のデータのため、最初に有用な配列情報が生成されるように実験を計画することが非常に重要になる。
【先行技術文献】
【非特許文献】
【0008】
【非特許文献1】M.E.Higginsら、CancerGenes:a gene selection resource for cancer genome projects.Nature Methods.(2007)35(1).Pp.D721〜D726
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって、本発明の目的は、対象となるDNA配列(標的配列)のみを濃縮するための方法を提供することである。さらに、本発明の目的は、(複合)試料中に存在するすべてのDNAを配列決定する必要なく標的配列の配列を特異的に決定するための方法を提供することである。
【課題を解決するための手段】
【0010】
定義
本明細書における「組成物」は、少なくとも1つ以上のデオキシリボ核酸分子(DNA分子)を含む水溶液である。好ましくは、組成物は、複合溶液、すなわち、対象となるDNA配列(標的配列)と対象とならないさらなるDNA配列(望ましくない配列)とを含む溶液である。当業者には明らかであるように、望ましくない配列は、通常、標的配列よりはるかに豊富であり、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15桁以上の差がある。
【0011】
本明細書における「リボ核酸」は、1’から5’までの番号が付与された炭素を有するリボース糖を各ヌクレオチド中に含有する。塩基、一般に、アデニン(A)、シトシン(C)、グアニン(G)またはウラシル(U)が、1’位に結合している。アデニンおよびグアニンは、プリン、シトシンであり、ウラシルは、ピリミジンである。リン酸基は、1つのリボースの3’位および次のリボースの5’位に結合している。リン酸基は、生理的pHで各々負電荷を有し、それがRNAを荷電分子(ポリアニオン)にする。これらの塩基は、シトシンとグアニン間、アデニンとウラシル間、およびグアニンとウラシル間で水素結合を形成し得る。しかし、他の相互作用、例えば、バルジの中で互いに結合しているアデニン塩基の群、またはグアニン−アデニン塩基対を有するGNRAテトラループも可能である。RNAをDNAと区別するRNAの重要な構造的特徴は、リボース糖の2’位におけるヒドロキシル基の存在である。この官能基の存在により、らせんは、DNAにおいて最も一般的に観察されるB型ではなくA型幾何形状をとることになる。これは、結果として非常に深く狭い主溝と、浅く広い副溝をもたらす。2’−ヒドロキシル基の存在の第二の帰結は、RNA分子のコンフォメーション的に柔軟である(すなわち、二重らせんの形成に関与しない)領域内で、それが隣接ホスホジエステル結合を化学的に攻撃して主鎖を切断できることである。
【0012】
他の天然に存在する修飾ヌクレオシドは100近くあり、それらのうち、プソイドウリジンと2’−O−メチルリボースを有するヌクレオシドとが最も一般的である。
【0013】
本明細書において、「RNA/DNA」ハイブリッド分子は、RNA鎖が逆相補的な様式でDNA鎖とハイブリダイズする場合である;
図11を参照されたし。
【0014】
かかるRNA/DNAハイブリッド分子に特異的である抗体は、抗RNA/DNA(ハイブリッド)抗体ともよばれる。かかる抗体がRNA/DNAハイブリッドに結合すると、結果として生じたハイブリッドは、RNA/DNA/抗体ハイブリッドとよばれる。
【0015】
発明の詳細な説明
本明細書に記載する方法は、非標識RNAプローブを使用して対象となるゲノム領域(標的領域)を選択的に濃縮する点がこれまでの方法と異なる。かかる標的化濃縮は、後続の配列決定工程に特に有用である。なぜなら、標的配列のみが解析に付され、それによってDNAバラストの数桁の有意な低減が助長されるからである。
【0016】
本明細書に記載する方法は、実施例のセクションにおいて説明するSureSelect Target Enrichment Systemの強化であるが、高価な標識RNAプローブ(RNAベイト)を使用しないで済む。さらに、本発明の方法は、Digene特許、米国特許第6,228,578号B1明細書に記載されているDNA/RNAハイブリッド捕捉技術の用途を、標的配列のみを配列決定などのために特異的に濃縮する必要がある複雑な生物体のゲノムDNAへと拡大する。したがって、本発明は、対象となる任意のDNA領域の選択的濃縮および/または配列決定に適している。これらは、任意の遺伝子パネル、例えば、代謝または調節遺伝子および癌遺伝子からのコード領域(エクソン)であり得る。
【0017】
類似の方法が国際公開第2011/097528号に開示されており、この方法は、DNA/RNAハイブリッドが相補鎖から形成されるようにRNA試料をDNAプローブと接触させること、ハイブリッドを試料から分離すること、およびハイブリッド中のDNAプローブを検出し、それによって相補的RNAを間接的に検出することを含む。DNAプローブは、増幅のための隣接シグネチャー配列(プライマー結合部位)、および検出のためのバーコード配列を含む。
【0018】
国際公開第2011/097528号の方法には、本方法と比較して幾つかの欠点がある。公知の方法では、RNAがDNAプローブによって間接的に検出される。この場合のアッセイの信頼性は、RNAを直接決定する方法に比べて低い。さらに、DNAプローブは、かなり複雑であり、検出されることとなるRNAに相補的な小さな配列部分と、相当長い隣接配列とを含む。したがって、これらのプローブは、設計が面倒であるばかりでなく、長い隣接配列によりRNAに意図せずに結合することもあり、その結果、偽陽性シグナルが生成されることもある。
【0019】
本発明は、組成物中のデオキシリボ核酸(DNA)の1つ以上の標的配列を濃縮および/または配列決定するための方法であって、(a)1つ以上のデオキシリボ核酸(DNA)分子を含む組成物を提供する工程、(b)前記1つ以上のDNA分子に1つ以上の標的特異的リボ核酸(RNA)ハイブリダイゼーションプローブをハイブリダイズさせ、それによって1つ以上のRNA/DNAハイブリッドを形成させる工程、(c)RNA/DNAハイブリッドを、かかるRNA/DNAハイブリッドに特異的である1つ以上の抗体で捕捉し、それによって1つ以上のRNA/DNA/抗体ハイブリッドを形成させる工程、(d)1つ以上のRNA/DNA/抗体ハイブリッドを単離する工程、(e)RNA/DNA/抗体ハイブリッドのDNA分子を必要に応じて増幅する工程、および(f)場合により、RNA/DNA/抗体ハイブリッドのDNA分子または増幅産物を配列決定する工程を含む方法に関する。配列決定は、好ましくは次世代配列決定によって行われる。
【0020】
要するに、試料中に存在する対象となる1つ以上のDNA分子に特異的であるRNAプローブ(すなわち、標的特異的RNAプローブ)をDNAにハイブリダイズさせる(
図11を参照されたし)。RNAプローブをDNA分子に効率的にハイブリダイズさせるために、DNA分子を変性させて一本鎖DNAを生じさせる必要があり得る。RNA/DNAハイブリッドに特異的に結合し、それによって前記ハイブリッドを捕捉する、抗RNA/DNAハイブリッド抗体を提供する。RNA/DNAハイブリッドを含む抗体は、その後、適当な手段、例えば、プロテインAを使用する遊離抗体のFc結合により、または固体表面に結合した抗体を使用することによって単離することができる。この方法は、場合により抗体に結合した単離RNA/DNAハイブリッド(RNA/DNA/抗体ハイブリッド)を洗浄することを含み得る。その後、RNA/DNA/抗体ハイブリッドのDNA分子を増幅および/または配列決定することができる。その方法は、以下で詳述する。
【0021】
上で概説したように、標的配列は、好ましくはコード領域(エクソン)の群から選択される。さらに、コード領域は、代謝遺伝子、調節遺伝子および癌遺伝子の群から選択されることが好ましい。
【0022】
好ましくは、組成物中のDNA分子は、次世代配列決定用のDNA断片ライブラリであり、場合により、前記ライブラリ中のDNA断片は、末端ユニバーサルアダプター配列を含む。
【0023】
DNA断片ライブラリを全DNAから作成してもよいし、またはゲノムDNAから作成してもよい。DNAを単離し、断片化し、サイズ選択する。必要に応じて、3’および/または5’オーバーハングを修復して、平滑末端、またはA−オーバーハングを好ましくは3’末端に有する断片を生じさせる。ライブラリ内のすべてのDNA断片を同じ配列モチーフで隣接させて、ユニバーサル末端アダプター配列をもたらすように、DNA断片の各末端にアダプター配列をライゲーションする。好ましくは、DNA断片には、2つの異なるユニバーサル末端アダプター配列が隣接する。そうすると、末端アダプター配列を使用してDNA断片ライブラリを増幅することができる。
【0024】
したがって、DNA分子は、DNA断片ライブラリであって、(a)ライブラリ中のDNAが、断片化され、サイズ選択され、続いて必要に応じて、二本鎖平滑末端断片またはA−オーバーハングを有する末端を生じさせるようにそれぞれ末端修復されており、および(b)断片が、同一の隣接配列を有する断片ライブラリを生じさせるように二本鎖アダプターオリゴヌクレオチドにライゲーションされている、DNA断片ライブラリから成ることが好ましい。
【0025】
本方法は、標的特異的RNAプローブを使用する。現行法には、それが標識RNAプローブ、例えばビオチン化RNAベイトを必要とする、および/または非特異的RNAプローブを使用するという欠点がある。標識プローブは、高価であり、生産が煩雑である。対照的に、本明細書に記載する方法では使用するRNAプローブを修飾する必要も、標識する必要もない。結果として、このRNAプローブは、生産が容易であり、費用効率が高い。それ故、RNAプローブは、未修飾かつ非標識であるほうが好ましい。非特異的RNAプローブは、望ましくないDNA配列の濃縮、すなわち、配列決定工程などの後続の工程に対してバラスト増加をもたらす。
【0026】
1つの態様において、RNAプローブは、合成されたRNAプローブであってよい。別の態様では、RNAプローブを生物学的試料から単離し、精製してもよい。好ましくは、先ずRNAプローブを、一方の末端にRNAポリメラーゼプロモーター配列を含有するDNAオリゴヌクレオチドとして合成し、その後、in ivtro転写を行う(すなわち、転写されたDNAプローブ)。
【0027】
DNA/RNAハイブリッド捕捉技術は、Digene特許、米国特許第6,228,578号B1明細書に記載されている。本明細書において、抗RNA/DNAハイブリッド抗体は、好ましくはモノクローナルまたはポリクローナル抗体の群から選択される。抗体はモノクローナルであることが特に好ましい。
【0028】
DNA/RNA特異的抗体は、好ましくは単純な分離のために固相(例えば、磁性ビーズ)にカップリングされるか、または溶解状態であってもよく、IgG抗体を結合する固相にカップリングされたプロテインGに結合させることによって分離される。すなわち、本明細書に記載する方法で使用する抗RNA/DNAハイブリッド抗体を好ましくは固体表面に結合させる。当業者には理解されるように、抗体の配向は、RNA/DNAハイブリッドを効率的に結合するのに重要である。抗体を固体表面に共有結合でカップリングさせることができる。固体表面は、球の形状、例えば、円形または楕円形であってもよい。円形または楕円形固体表面の直径は、0.05μm〜100μm、好ましくは0.2μm〜20μm、さらに好ましくは1μm〜10μmであり得る。抗体を粒子、好ましくは磁性粒子に結合させることが特に好ましい。
【0029】
抗体を粒子に結合させる場合、単離工程は、好ましくは遠心分離によって、または磁場を使用してそれぞれ行われる。
【0030】
本明細書に開示する方法は、DNA分子の増幅が後続の方法工程、例えば、解析、定量、検出および/または配列決定に必要であるかどうかに依存して、RNA/DNA/抗体ハイブリッドのDNA分子を増幅する工程を含み得る。なぜなら、例えば、DNA分子の濃度が低すぎるからである。
【0031】
様々な増幅法が公知である。好ましい実施形態において、増幅法は、ポリメラーゼ連鎖反応(PCR)、リアルタイムPCR(rtPCR)、ヘリカーゼ依存性増幅(HDA)およびリコンビナーゼ−ポリメラーゼ増幅(RPA)の群から選択される。
【0032】
増幅法は、非等温法であるか、または等温法である。非等温増幅法は、ポリメラーゼ連鎖反応(PCR)(Saikiら(1985)Science 230:1350)の群から選択することができる。等温増幅法は、ヘリカーゼ依存性増幅(HDA)(Vincentら(2004)EMBO rep 5(8):795−800)、熱安定性HDA(tHDA)(Anら(2005)J Biol Chem 280(32):28952−28958)、リコンビナーゼ・ポリメラーゼ増幅(RPA)(Piepenburgら(2006)PloS Biol 4(7):1115−1120)の群から選択することができる。
【0033】
本発明の文脈において「等温増幅反応」とは、温度が反応中に有意に変化しないことを意味する。好ましい実施形態において、等温増幅反応の温度は、増幅が起こる主要酵素的反応工程中に10℃より大きく逸脱せず、好ましくは5℃以下、さらにいっそう好ましくは2℃以下しか逸脱しない。
【0034】
核酸の等温増幅法に依存して、異なる酵素が増幅反応に必要とされる。核酸の公知等温増幅法は、上述のものであり、この場合、等温条件下で核酸を増幅するための少なくとも1つの中温性酵素は、ヘリカーゼ、中温性ポリメラーゼ、鎖置換活性を有する中温性ポリメラーゼ、組換えタンパク質から成る群より選択される。
【0035】
「ヘリカーゼ」は、当業者には公知である。それは、核酸ホスホジエステル主鎖に沿った方向に移動して、NTPまたはdNTPの加水分解に由来するエネルギーを使用して2本のアニールされた核酸鎖(例えば、DNA、RNA、またはRNA−DNAハイブリッド)を分離するタンパク質である。定義されたヘリカーゼモチーフの存在に基づき、ヘリカーゼ活性を所与のタンパク質のものであると考えることが可能である。当業者は、ヘリカーゼ活性を有する適当な酵素を、本発明による方法において使用するために選択することができる。好ましい実施形態において、ヘリカーゼは、異なるファミリーからのヘリカーゼ:スーパーファミリーIヘリカーゼ(例えば、dda、pcrA、F−プラスミドtralタンパク質ヘリカーゼ、uvrD)、スーパーファミリーIIヘリカーゼ(例えば、recQ、NS3−ヘリカーゼ)、スーパーファミリーIIIヘリカーゼ(例えば、AAV repヘリカーゼ)、DnaB様スーパーファミリーからのヘリカーゼ(例えば、T7ファージヘリカーゼ)またはRho様スーパーファミリーからのヘリカーゼを含む群から選択される。
【0036】
増幅法は、必要な酵素に加えてバッファー、dNTPまたはNTPを含むことになる。
【0037】
本明細書において用いる場合、用語「dNTP」は、デオキシリボヌクレオシド三リン酸を指す。かかるdNTPの非限定的な例としては、dATP、dGTP、dCTP、dTTP、dUTPであり、これらは、例えば蛍光標識、放射性標識、ビオチン標識を含む、標識された誘導体の形態で存在することもある。修飾ヌクレオチド塩基を有するdNTPも包含され、この場合ヌクレオチド塩基は、例えば、ヒポキサンチン、キサンチン、7−メチルグアニン、イノシン、キサンチノシン(xanthinosine)、7−メチルグアノシン、5,6−ジヒドロウラシル、5−メチルシトシン、プソイドウリジン、ジヒドロウリジン、5−メチルシチジンである。
【0038】
本明細書において用いる場合、用語「NTP」は、リボヌクレオシド三リン酸を指す。かかるNTPの非限定的な例は、ATP、GTP、CTP、TTP、UTPであり、これらは、例えば蛍光標識、放射性標識、ビオチン標識を含む、標識された誘導体の形態で存在することもある。
【0039】
好ましくは、増幅法は、ポリメラーゼ連鎖反応(PCR)法である。
【0040】
PCR反応は、DNA分子の10〜100「サイクル」の変性および合成から成り得る。好ましい実施形態において、サーモサイクリング増幅反応で変性を行う温度は、約90℃〜95℃より高く、さらに好ましくは92℃〜94℃である。好ましいサーモサイクリング増幅法としては、約10〜約100サイクル、さらに好ましくは約25〜約50サイクル、および約90℃〜95℃より高く、さらに好ましくは92℃〜94℃のピーク温度を含むポリメラーゼ連鎖反応が挙げられる。好ましい実施形態では、(a)標的配列の末端について、それにハイブリダイズすることになるオリゴヌクレオチドプライマーを合成することができる十分な詳細が分かっている、および(b)少量の標的配列が連鎖反応を開始させるために利用可能であるとすれば、通常は好熱性原核生物に由来するDNAポリメラーゼを使用してPCR反応を行って、関与する反応工程の数に対して指数関数的量で、少なくとも1つの標的核酸配列を生産する。ここで、ポリメラーゼは、好ましくは、プルーフリーディング活性を有するポリメラーゼである。酵素は、好ましくは熱安定性である。
【0041】
増幅用のプライマーは、例えばホスホトリエステルおよびホスホジエステル法またはそれらの自動化実施形態などの、任意の適切な方法を用いて調製することができる。1つのかかる自動化実施形態では、ジエチルホスホロアミダイト(diethylophosphoramidites)を出発材料として使用し、Beaucageら、Tetrahedron Letters、22:1859−1862(1981)によって記載されているようにそれを合成することができる。修飾固体支持体上でオリゴヌクレオチドを合成する1つの方法は、米国特許第4,458,006号明細書に記載されており、それは参照により本明細書中に援用されている。生物学的供給源(例えば、制限エンドヌクレアーゼ消化物)から単離されたプライマーを使用することも可能である。
【0042】
好ましいプライマーは、約15〜100、さらに好ましくは約20〜50、最も好ましくは約20〜40塩基の長さを有する。
【0043】
本方法のさらなる利点は、DNA分子をRNA/DNA/抗体ハイブリッドから事前に単離することなく増幅工程を行うことができる点である。抗体および固体表面は、両方とも、増幅工程に干渉しなかった。したがって、DNAを増幅する前にDNA分子を放出するためにハイブリッドを変性する必要がない。すなわち、単離されたRNA/DNA/抗体ハイブリッド上でDNA分子を直接増幅することができる。
【0044】
増幅工程は、好ましくは、ユニバーサルアダプター配列を結合するプライマーを用いて行われる。プライマーを調製するための手順は、上に概説されている。
【0045】
本発明は、好ましくは、1つ以上のRNA/DNA/抗体ハイブリッドの1つ以上のDNA分子、または所望もしくは必要に応じて、増幅産物の配列決定工程を含む。現行法には、特定の配列決定法に限定されないという利点がある。しかし、次世代配列決定法が好ましい。
【0046】
DNA配列決定技術は、基礎研究から臨床診断にわたる多種多様な分野において大きな重要性をもつ。かかる技術から入手できる結果は、様々な程度の特異性の情報を含むことができる。例えば、有用な情報は、特定のポリヌクレオチドが配列の点で参照ポリヌクレオチドと異なるかどうかの決定、試料中の特定のポリヌクレオチド配列の存在の確認、部分配列情報、例えばポリヌクレオチド内の1つ以上のヌクレオチドの正体の決定、ポリヌクレオチド内のヌクレオチドの正体および順序の決定などから成り得る。
【0047】
配列決定工程は、好ましくは次世代配列決定によって行われる。製造業者および技術としては、36または150bpの600ギガ塩基(Gb)までを生成するSolexa/Illumina、400〜1000bpの700Mbpまでのリードを生成するRoche/454、35〜75bpの1日当たり20Gb超のリードを生成するABI/SOLiD(商標)、25〜45bpの21〜35Gbのリードを生成するHelicos、およびComplete Genomics(サービス会社)である。他の製造業者としては、PacBio RSを商品化しているPacific Bioscienceが挙げられる。
【0048】
合成技術によるSolexa/Illumina配列決定は、可逆的ダイターミネーターに基づく。DNA分子を先ずスライド上のプライマーに結合させ、そして局所クローンコロニーが形成されるように増幅する(ブリッジ増幅)。4タイプの可逆的ターミネーター塩基(RT−塩基)を付加させ、組み込まれていないヌクレオチドを洗い流す。パイロシークエンシングとは異なり、DNAを1度に1ヌクレオチドしか伸長することができない。蛍光標識ヌクレオチドの画像をカメラで撮影し、その後、末端3’ブロッカーと共に色素をDNAから化学的に除去し、次のサイクルが可能になる(Brennerら、Nature Biotechnol.2000.18(6):630−634)。
【0049】
SOLiD(商標)(「オリゴヌクレオチドライゲーションによる配列決定および検出(Sequencing by Oligonucleotide Ligation and Detection)」)法(Life Technologies;国際公開第06/084132号A2)は、ユニバーサルアダプター配列によるテンプレート核酸のPCR増幅断片の磁性ビーズへの結合、そしてアダプター配列にハイブリダイズしたプライマーへの標識プローブのライゲーションによる断片配列のその後の検出に基づく。読み出しのために、1組の4種の蛍光標識2塩基プローブを使用する。読み出し後、プローブ部分を切断し、ライゲーション、検出および切断の新たなサイクルを行う。2塩基プローブを使用するため、各テンプレート配列につき2ラウンドの配列決定を行わなければならない。
【0050】
PacBio RSは、ゼロモード導波管の特性に基づく一分子リアルタイム配列決定(SMRT)プラットホームである。単一DNAポリメラーゼ酵素を、テンプレートとしての単一DNA分子と共に、ZMWの底部に固着させる。ZMWは、DNAポリメラーゼによって組み込まれるDNAの1つのヌクレオチドだけを観察するのに足る小さい照明観察体積を作り出す構造である。4つのDNAヌクレオチド各々を4つの異なる蛍光色素のうちの1つに結合させる。ヌクレオチドがDNAポリメラーゼによって組み込まれると、蛍光タグは切断され、ZMWの観察エリア外に拡散し、そこでは、その蛍光はもはや観察不能である。検出器がヌクレオチド組み込みの蛍光シグナルを検出し、色素の対応する蛍光に従って塩基コール(base call)がなされる。
【0051】
現行法には、特定の配列決定法に限定されないという利点がある。配列決定工程を次世代配列決定によって行う場合、適用する方法を、上で説明したものの群から選択することが好ましい。
【0052】
増幅産物を配列決定工程前にさらに検出および/または定量してもよい。
【0053】
増幅産物を検出可能なプローブ、例えば蛍光標識プローブを組み込むことによって検出工程を行ってもよい。本発明によるプローブは、特異的核酸配列に実質的に相補的である、オリゴヌクレオチド、核酸またはそれらの断片である。適当なハイブリダイゼーションプローブとしては、LightCyclerプローブ(Roche)、TaqManプローブ(Life Technologies)、分子ビーコンプローブ、Scorpionプライマー、Sunriseプライマー、LUXプライマーおよびAmplifluorプライマーが挙げられる。
【0054】
あるいは、リアルタイムPCRにおいてレポーターとして二本鎖DNA結合色素(例えば、SYBR Green)を使用することによって検出工程を行ってもよい。DNA結合色素は、PCRにおけるすべての二本鎖DNAに結合し、色素の蛍光を生じさせる。したがって、PCR中のDNA産物の増加は、蛍光強度の増加をもたらし、またDNA産物の増加をサイクルごとに測定するので、DNA濃度を定量することができる。
【0055】
定量工程は、前に説明した技法を用いる定量的リアルタイムPCRに基づいてもよい。
【0056】
本発明は、DNA/RNAハイブリッド分子に特異的である抗体(該抗体は、場合により磁性粒子に結合している)を含み、かつ1つ以上の標的特異的RNAハイブリダイゼーションプローブをさらに含むキットにも関する。
【0057】
キットの構成要素は、上に開示した方法のためのものと同じである。例えば、RNAハイブリダイゼーションプローブは、好ましくは、コード領域(エクソン)の群から選択される標的配列に対して特異的である。コード領域は、好ましくは、代謝遺伝子、調節遺伝子および癌遺伝子の群から選択される。RNAプローブは、合成されたRNAプローブであってもよい。あるいは、RNAプローブを生物学的試料から単離し、精製してもよい。好ましくは、RNAプローブを先ず一方の末端にRNAポリメラーゼプロモーター配列を含有するDNAオリゴヌクレオチドとして合成し、その後、in ivtro転写を行う。例えば、本明細書において用いる抗RNA/DNAハイブリッド抗体を好ましくは固体表面に結合させる。当業者には理解されるように、抗体の配向は、RNA/DNAハイブリッドを効率的に結合するのに重要である。抗体を固体表面に共有結合でカップリングさせることができる。固体表面は、球の形状、例えば、円形または楕円形であってもよい。円形または楕円形固体表面の直径は、0.05μm〜100μm、好ましくは0.2μm〜20μm、さらに好ましくは1μm〜10μmであり得る。抗体を磁性粒子に結合させることが特に好ましい。
【図面の簡単な説明】
【0058】
【
図1】
図1は、次世代配列決定のための標的濃縮技術の系統的概要である。
【
図2】
図2は、一本鎖のアダプターをライゲーションしたDNA断片とRNAプローブとのハイブリダイゼーションを示す。DNA/RNAハイブリッド分子は、磁性粒子に結合し、その後、磁気分離によって単離される。分離されたDNA断片を配列決定前にPCRによって濃縮することができる。A.標的化DNA断片とビオチン化RNAベイトのハイブリダイゼーション、およびストレプトアビジンで被覆された磁性ビーズでの精製。B.標的化DNA断片と非標識かつ未修飾のRNAプローブとのハイブリダイゼーション、および抗体で被覆された磁性ビーズでの標的化ハイブリッド分子の単離。
【
図3】
図3は、ヒトゲノム(h19)へのマッピング前およびその後の配列リードの百分率を示す。百分率は、品質評価前に成功リード数に正規化される。
【
図4】
図4は、対象領域(ROI)および設計領域(ROD)の説明である。ROIは、濃縮のための標的化領域(例えば、エクソン−イントロン境界を含むエクソン配列E1〜E5)を表す。RODは、プローブによって網羅される領域(a〜e)を表す。したがって、RODは、配列データが期待される領域を記載する。適当なプローブで網羅され得なかった対象領域内のギャップを、fおよびgとラベルする。
【
図5】
図5は、濃縮技術の感度を示す。少なくとも1つの配列によって網羅されるROIおよびRODの百分率。百分率は、ROIおよびRODのサイズにそれぞれ関係づけられる。
【
図6】
図6は、濃縮技術の特異性を示す。RODおよびROIにマッチする配列決定された塩基の百分率。百分率は、ヒトゲノムにマッピングした配列決定された塩基の数に関係づけられる。
【
図7】
図7は、配列データによって網羅されないRODおよびROIの百分率を示す。
【
図8】
図8は、ROI内の配列網羅率(sequence coverage)のボックスプロットである。中央値は、調査した4ライブラリすべてについて2402〜2867である。上位四分位数(q3)および下位四分位数(q1)間の差を下方レーンに示す。
【
図9】
図9は、ROIの累積配列網羅率を示す。4曲線すべてが同様の形を有する。ROIのおおよそ93%が、少なくとも1倍で(=感度)網羅される。100倍の網羅率ではライブラリに依存してROIの87%〜90%(Q7:90.47%、Q8:88.13%、Q9:88.33%、Q10:86.97%)、および1000倍の網羅率ではROIの少なくとも60%が、配列データによって網羅される。
【
図10】
図10は、ORIの正規化された配列網羅率を示す。これは、ROI中の配列網羅率についての均一性または配列の偏りを記載し、予想配列網羅率に関して実験設計の重要な情報を提供する。Q9についての計算例:標的領域の少なくとも85%を少なくとも30倍で網羅すべきである場合(x値=0.1;y値=85%)、標的領域を平均で300倍より高く網羅しなければならず(x値=1=平均配列網羅率)、または標的領域の65%を少なくとも150倍で網羅しなければならない(x値=0.5)。さらに、これらの曲線により、様々な読み取り数での配列決定実行の比較、ならびに異なる試料調製物の比較も可能になる。y軸との高い交点および曲線の滑らかな傾きは、効率的な試料調製物を示す。
【発明を実施するための形態】
【0059】
次世代配列決定技術により、大規模並列配列決定により莫大な量の配列情報の生成が可能となる。しかし、殆どの配列決定プラットホームは、ヒトのような複雑なゲノムを単回の試行で費用効率よく配列決定する能力をまだ持っていない。一方、多くのタスクには、1つ以上の試料の標的化領域の配列決定がかなり必要である。
【0060】
このために、幾つかの標的DNA濃縮プロトコルが次世代配列決定(
図1)の前に開発された。
【0061】
いわゆる「SureSlect」プロトコルは、RNAベイトであって、各ベイト配列上に親和性タグ(すなわち、ビオチンまたはハプテン)をハイブリダイゼーションのためにおよびその親和性タグに結合する分子または粒子(例えば、ハプテンまたはその抗原結合断片に結合するストレプトアビジン、アビジンまたは抗体で被覆された磁性ビーズ)のその後の分離のために有するRNAベイトを必要とするが、本明細書に開示する方法は、親和性タグを用いないDNAライブラリ断片の未修飾一本鎖RNAプローブへの液相(in−solution)ハイブリダイゼーション、続いてのDNA/RNA特異的抗体による標的化DNA断片の単離に基づく。DNA/RNA特異的抗体を単純な分離のために固相(例えば、磁性ビーズ)にカップリングさせるか、またはDNA/RNA特異的抗体は溶解状態であってもよく、固相にカップリングされたプロテインG特異的二次抗体に結合させることによって分離される。
【0063】
最初に、断片ライブラリを構築する。DNAを断片化し、サイズ選択し、続いて、二本鎖平滑末端断片を生じさせるように、または「A」オーバーハングを有する末端を生じさせるようにそれぞれ末端修復する。かかる断片を二本鎖アダプターオリゴヌクレオチドにライゲーションして、同一の隣接配列を有する断片ライブラリを生成する。任意で、PCRにより、標的化DNA濃縮後と同様に濃縮前にもアダプター末端にマッチするプライマーを使用してライブラリを増幅することが可能である。
【0064】
本発明の性能の評価のために、AgilentからのeArrayインターネットポータル(https://earray.chem.agilent.com/erray/)を使用して60遺伝子(表1)のエクソン濃縮のためのRNAプローブを設計し、合成した。
【0065】
ゲノム内の標的化領域の91.83%を網羅する、各々が120のヌクレオチドを有する合計5942のRNAベイトを合成した。
【0066】
「SureSelect」プロトコルを使用する標的化DNA濃縮と抗体捕捉に基づく本発明のプロトコルでの標的化DNA濃縮とを比較するために、ビオチン化RNAベイトを使用した。ビオチン化は、「SureSelect」プロトコルで使用するストレプトアビジンビーズへの結合に必要であったが、本発明で使用するDNA/RNA抗体またはビーズに干渉しない。
【0067】
本発明の濃縮プロトコルは、次の工程を含む:(i)DNA断片ライブラリの変性、(ii)RNAベイトを用いる液相ハイブリダイゼーション、(iii)DNA/RNAハイブリッドの抗体で被覆された磁性ビーズへの結合、(iv)標的化DNA断片の磁気分離、(v)非特異的に結合したDNAを除去するための反復洗浄工程、(vi)濃縮DNAの増幅のためのPCR、配列特異的リンカー配列の導入、および任意選択のライブラリのバーコード化。
【0068】
PCR前に、DNA/RNAハイブリッドの変性および抗体で被覆されたビーズの除去の必要はない。ビーズも抗体もPCRを阻害しない。
【0069】
以下で、「SureSelect」プロトコルによる濃縮後に2反復DNAライブラリ(ライブラリQ7およびQ8)から生じた配列決定結果を、本発明の抗体ベースハイブリッド捕捉プロトコルによる2反復濃縮ライブラリ(ライブラリQ9およびQ10)から得たデータと比較する。配列決定のために、それらのライブラリを配列決定前に異なる指標コードで標識し、IlluminaからのHiSeq 2000シークエンサの1レーンにローディングした。配列決定を、対にした末端配列決定(paired end sequencing)として2×100bpの所望の読み取り長で行った。ソフトウェアパッケージ「Galaxy」を使用して配列を解析した。配列データをプログラムBWAでヒトゲノムrelease GRCh37.p5(hg19)にマッピングした。
【0070】
表3は、HiSeq 2000で生成された4ライブラリの生データの要約である。4ライブラリすべてについて、同等の質を有する同様の量の生データを得た(トリミング後の平均リード長およびトリミング後の平均PHREDクオリティを参照されたし)。
【0072】
品質トリミング後、対になった読み取りをヒトゲノム(GRCh37.p5(GCA_000001405.6)=hg19)にマッピングし、その後、設計領域(ROD)と対象領域(ROI)両方の中のそれらの位置について解析した(
図4)。
【0073】
以下のパラメータを調査した:感度(標的化領域の何個のヌクレオチドが配列データで網羅されたか?)(
図5);特異性(何個の読み取りまたはヌクレオチドが標的化領域にマッチしたか?)(
図6);残存ギャップの数およびサイズ(
図7);配列網羅率の均一性(
図8)。
【0074】
図9および10中のプロットは、4ライブラリすべてについての感度および配列網羅率の要約である。示されているデータから、両方の濃縮技術、AgilentからのSureSelectと本発明のハイブリッド捕捉技術が、感度、特異性、ギャップの数およびサイズ、ならびに配列網羅率の均一性の点で非常に類似して動作するという結論に至った。したがって、本発明の抗体ベースハイブリッド捕捉技術は、ビオチン−ストレプトアビジンベースRNA/DNA捕捉と比較される適当な代替技術であるが、高価な標識RNAベイトを生じさせる必要がない。
【0075】
表1.エクソン濃縮のための標的遺伝子。合計で1009の標的化領域をプローブ設計のために画定した。対象領域の合計サイズは、398908bpである。
【0077】
表2.RNAプローブの概要。初めにゲノムリピート領域にオーバーラップする最大20の塩基を有するプローブを設計した。適当なプローブのない領域については、隣接するリピート領域へのオーバーラップを可能にする40の塩基を用いて2回目の設計を行った。その後、プローブを、プローブの中で、60%までのGC含有率を有する「正常」プローブと、増加されたGC含有率(60%超)を有するプローブと、単一プローブによって網羅される領域(オーファン)とで分けた。「正常」プローブは、2倍の網羅率で対象領域を網羅し、「高」GC含有率プローブとオーファンの両方は、対象領域を4倍で網羅した。
【国際調査報告】