特許第6374964号(P6374964)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ.ホフマン−ラ ロシュ アーゲーの特許一覧

特許6374964特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法
<>
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000012
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000013
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000014
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000015
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000016
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000017
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000018
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000019
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000020
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000021
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000022
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000023
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000024
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000025
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000026
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000027
  • 特許6374964-特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法 図000028
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6374964
(24)【登録日】2018年7月27日
(45)【発行日】2018年8月15日
(54)【発明の名称】特別なキャプチャープローブ(HEATSEQ)を使用したシークエンスキャプチャー法
(51)【国際特許分類】
   C12Q 1/6806 20180101AFI20180806BHJP
   C12Q 1/6816 20180101ALI20180806BHJP
   C12N 15/10 20060101ALI20180806BHJP
【FI】
   C12Q1/6806 Z
   C12Q1/6816 Z
   C12N15/10 ZZNA
【請求項の数】6
【全頁数】27
(21)【出願番号】特願2016-530538(P2016-530538)
(86)(22)【出願日】2014年7月31日
(65)【公表番号】特表2016-525363(P2016-525363A)
(43)【公表日】2016年8月25日
(86)【国際出願番号】EP2014066539
(87)【国際公開番号】WO2015014962
(87)【国際公開日】20150205
【審査請求日】2016年3月17日
(31)【優先権主張番号】61/861,695
(32)【優先日】2013年8月2日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】591003013
【氏名又は名称】エフ.ホフマン−ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100140109
【弁理士】
【氏名又は名称】小野 新次郎
(74)【代理人】
【識別番号】100075270
【弁理士】
【氏名又は名称】小林 泰
(74)【代理人】
【識別番号】100101373
【弁理士】
【氏名又は名称】竹内 茂雄
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(72)【発明者】
【氏名】アルバート,トーマス
(72)【発明者】
【氏名】ノートン,ジェイソン
(72)【発明者】
【氏名】パテル,ジガー
(72)【発明者】
【氏名】バージェス,ダニエル
(72)【発明者】
【氏名】リアミチェフ,ヴィクター
(72)【発明者】
【氏名】ブロックマン,マイケル
【審査官】 柴原 直司
(56)【参考文献】
【文献】 米国特許出願公開第2013/0072390(US,A1)
【文献】 特表2012−525147(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12Q 1/68
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
MIPプローブを調製する方法であって、下記を含む前記方法:
a)アレイ上でMIP前駆体を合成することであって、ここでMIP前駆体は;
i)5’及び3’末端に2つのプライマー結合部位を含み;
ii)前記プライマー結合部位の内側の一方の末端付近に第1末端ターゲット配列、および反対側の末端付近に第2末端ターゲット配列を含み;
iii)前記第1末端ターゲット配列、および前記第2末端ターゲット配列の間にリンカー領域を含み;
iv)MIPプローブ鎖上の5’末端側のターゲット配列の5’末端にニッキングのための酵素が認識する部位を有し;ならびに、
v)MIPプローブ鎖上の3’末端側のターゲット配列の3’末端にニッキングのための酵素が認識する部位を有する;
b)前記2つのプライマー結合部位に結合するプライマーを用いて、MIP前駆体を溶液中で増幅すること;
c)溶液を採集すること;
d)増幅した前駆体を1種類以上のニッキングのための酵素を使用して消化して、MIPプローブを形成すること、ここで前記酵素はMIP前駆体中の前記ニッキングのための酵素が認識する部位を認識するものである
e)前記MIPプローブを、一本鎖のMIPプローブのリンカー領域に相補的なブロッキングオリゴヌクレオチドとハイブリダイズさせること。
【請求項2】
MIP前駆体のリンカー領域が固有識別子(UID)配列を含む、請求項に記載の方法。
【請求項3】
アレイ合成がマスクレス・アレイ合成を使用して実施される、請求項1又は2に記載の方法。
【請求項4】
第1末端ターゲット配列および/または第2末端ターゲット配列の配列長さを、これら2種類のターゲット配列の融解温度を近接させるために変更する、請求項1〜3のいずれか1項に記載の方法。
【請求項5】
ターゲット配列の一部を同定する方法であって、下記を含む前記方法:
)請求項1〜4のいずれか1項に記載の方法でMIPプローブを調製すること
g)MIPプローブを核酸試料にハイブリダイズさせること;
)核酸試料の一部が複製されて環化MIPプローブに組み込まれるように、MIPプローブをポリメラーゼで環化すること;
)エキソヌクレアーゼを使用して線状核酸を実質的に消化すること;および、
)MIPプローブの配列を決定すること。
【請求項6】
さらに、MIPプローブが固有識別子(UID)配列を含む場合に、MIPプローブの配列を評価し、いずれかのUID配列が予想結果と比較して過剰提示または過小提示されているかを判定することを含む、請求項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ゲノムまたは複合DNA試料のターゲテッド領域をキャプチャーして、ターゲテッド領域(単数または複数)内にみられる遺伝子多型の効率的な検査および/または検出を可能にするための方法の分野に関する。
【背景技術】
【0002】
ゲノムのターゲテッド領域を効率的にキャプチャーする方法は、疾患または他の形質に関連する遺伝子多型を迅速シークエンシング仲介により検知および検出するのを可能にすることができる。二本鎖のアダプターライゲートしたシークエンシングライブラリーをターゲットキャプチャーのための材料として利用する現在のハイブリダイゼーションベースの手法は時間がかかり、資源集約的である。ターゲットキャプチャーのための伝統的な分子反転プローブ(molecular inversion probe)(MIP)ベースの方法はシークエンシング前のワークフロー時間を短縮できるが、遺伝子座増幅/提示(representation)バイアス、対立遺伝子バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトのため制限される。
【発明の概要】
【0003】
本発明は、改良されたMIPを大量に並行製造するための新規プロトコルである。このMIPに対する分子改良は、プローブの作製、ワークフロー、試料特異性を伴なう固有配列エレメントおよび初期試料集団中に存在する特異的分子を独自に識別する配列タグの付加をカバーする。最後に、本発明を遺伝子座提示バイアスと対立遺伝子バイアスの両方の問題を克服する経験的最適化戦略とも組み合わせる。この改良された手法は規模拡大が可能であり、単一遺伝子座のアンプリコンから構成されるターゲットの増幅から100万以上の遺伝子座のターゲティングまで利用できる。
【図面の簡単な説明】
【0004】
下記の本発明の態様の記載を添付の図面と合わせて参照することによって、本発明の特徴およびそれらを達成する方法がより明らかになり、本発明自体がより良く理解されるであろう。
図1図1は、MIP前駆体、増幅されるMIP前駆体、および増幅生成物の制限消化を記載した模式図である。
図2図2は、酵素消化生成物のアガロースゲル精製である。
図3図3は、ゲノムDNAのターゲテッド鎖にハイブリダイズしている70−mer MIPプローブ、およびMIPプローブの伸長/ライゲーションを表わす。
図4図4は、伸長/ライゲーション後のMIPプローブ(すなわち、“キャプチャーした”生成物を含むもの)のゲル精製である。
図5図5は、20−merターゲット領域をもつプローブの融点範囲および可変長ターゲット領域をもつプローブの融点範囲(Tm平衡化したもの)を示すグラフである。
図6図6は、固定長プローブ(挿入図)およびTm平衡化した可変長プローブ(主グラフ)のシークエンスカバレージ(sequence coverage)を示すグラフである。
図7図7は、UIDを含むMIP前駆体、MIP前駆体の増幅、増幅生成物のニッキング、およびシークエンスキャプチャーに際して用いたブロッキングオリゴヌクレオチドを記載した模式図である。
図8図8は、DNAターゲットへのUID配列を含むMIPプローブのハイブリダイゼーション、およびMIPプローブの環化を表わす。
図9図9は、伸長/ライゲーション後のMIPプローブのゲル精製を示す。
図10図10は、UID配列の使用を表わす。
図11図11は、MIPプローブの合成を表わす模式図である。
図12A図12(12Aおよび12B)は、MIPプローブを使用したワークフローを表わす図である。
図12B図12(12Aおよび12B)は、MIPプローブを使用したワークフローを表わす図である。
図13図13は、試料源を同定するための試料インデックス(MID)の使用を表わす。
図14図14は、事象カウンティングのためのUID配列の使用を表わす。
図15図15は、1プローブからのUIDタグの分布を示す。
図16図16は、プローブ再平衡化の結果を示す。
【0005】
これらの図面は本発明の態様を示すが、これらの図面は必ずしも正確な縮尺率ではなく、本発明をより良く図示および説明するために特定の特徴が誇張されている場合がある。ここに述べる代表例は本発明の代表的態様を1形態で図示したものであり、それらの代表例が何らかの形で本発明の範囲を限定するものと解釈すべきではない。
【発明を実施するための形態】
【0006】
伝統的に、分子反転プローブ(MIP)は、それらの末端またはその付近に一本鎖ターゲットヌクレオチド配列の2つの離れた部分に対して特異的に相補性である領域をもつ一本鎖核酸プローブであった。末端にあるそれらのターゲット特異的部分がターゲット配列に適正にアラインして相補するために本質的に環状構造をとるのでそれらのプローブは“反転”し、あるいは逆にターゲット領域とターゲット特異的部分の間での同じ相互作用を可能にするためにターゲットが“反転”する。本発明は、データ解析のために有用な配列、そのようなMIPを作製するための改良された合成方法、およびMIPプローブプールを最適化するために有用な方法を提供することにより、MIPの改良を提供する。
【0007】
本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含み、セットの各プローブは下記のものを含む:複合試料中に存在する第1ターゲット配列に特異的にハイブリダイズする第1末端配列;複合試料中に存在する第2ターゲット配列に特異的にハイブリダイズする第2末端配列;ここで、第1ターゲット配列と第2ターゲット配列は両方とも同一ターゲット鎖上に位置する;ならびに第1末端配列と第2末端配列を連結するリンカー配列であって、固有識別子(UID)配列を含むリンカー配列;ここで、UIDは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについてランダムヌクレオチド合成により生成したランダム生成タグ配列である。
【0008】
本発明は、対立遺伝子バイアス、遺伝子座増幅/提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトを判定するための改良された特徴を備えた、MIPプローブを含む。さらに、本発明は、MIPプローブを作製するための鋳型としてアレイを用いてそのような改良されたMIPプローブを作製する特定の方法をも含む。ある態様において、MIPプローブはMIPプローブのための鋳型としてアレイを用いて作製される。特定の態様において、本発明は、マスクレス・アレイ合成(Maskless Array Synthesis)(MAS)(参照:Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999, 本明細書に援用する)でMIPプローブを作製することを含む。
【0009】
ある態様において、MIPプローブはプローブデザインを最適化するように設計される。特定の態様において、プローブプールはプローブ再分布を用いて設計される。プローブ再分布は、アレイの表面全体にわたって同一プローブの多重複製物を合成することにより合成に際して個々のプローブの相対濃度を低下または増大させることによって実施される。ある態様において、プローブプール中のプローブはプローブ長さ最適化を用いて設計される。ある態様において、プローブはプローブ動態最適化を用いて、たとえば最適プローブデザインを決定するためのTm(融解温度)を用いて設計される。
【0010】
ある態様において、MIPプローブは分子IDタグ(Molecular ID tag)(MID)を含む。そのようなMIDは、本質的に、キャプチャーされた核酸が由来する試料を同定する目的に用いられる“バーコード”核酸配列である。したがって、MID配列は試料特異的識別子の使用により元の試料の同定を可能にし、ここで、特定の試料からキャプチャーされた各配列は共通のバーコード配列を共有する。MID配列は多種多様な方法で試料に付加することができ、それにはMID配列を含むアダプター配列とのライゲーション、またはMID配列を含むプライマーを用いる増幅によるものが含まれる。
【0011】
特定の態様において、MIDバーコードはMIPプローブ中に存在せず、プライマー部位およびMIDバーコードを含む別の部位を含むプライマーを用いてプローブが複製および伸長された後に初めて存在する。ある態様において、MIPプローブをターゲット配列と接触させた後に初めて、MIDバーコードが付加される。この態様の一例は、MIPプローブ(MIDバーコードを含まないもの)がそれのターゲット配列と接触して特異的にハイブリダイズした時点で行なわれる。伸長およびライゲーションによりMIPプローブは環化し、次いでこの環化したMIPプローブは付加されたMIDバーコードを含むプライマーを用いて複製/増幅される。
【0012】
本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含む。プローブは、複合試料中に存在する第1ターゲット配列に特異的にハイブリダイズする第1末端配列、および複合試料中に存在する第2ターゲット配列に特異的にハイブリダイズする第2末端配列を含む。この態様において、第1ターゲット配列と第2ターゲット配列は両方とも同一ターゲット鎖上に位置する。プローブは、第1末端配列と第2末端配列を連結するリンカー配列をも含み、このリンカー配列は固有識別子(UID)配列を含む。UIDは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについて化学的に誘導したランダムヌクレオチド合成により生成したランダム生成タグ配列である。
【0013】
特定の態様において、プローブはさらにMIDバーコードを含み、ここで、特定の核酸試料に使用するプローブはすべて同一のMIDバーコード配列を含む。この方法で、特定の試料からのすべての結果をトラッキングすることができる。
【0014】
本発明の特定の態様は、下記を含む方法をも伴なう:a)アレイ上でMIP前駆体を合成することであって、その際、前駆体は1以上のプライマー、1以上の制限部位、ならびにMIP前駆体の一方の末端付近に第1末端ターゲット配列および反対側の末端付近に第2末端ターゲット配列を含む;b)MIP前駆体を溶液中へ増幅すること;c)溶液を採集すること;およびd)増幅した前駆体を1種類以上の制限酵素を使用して消化して、MIPプローブを形成すること。特定の態様において、MIP前駆体はさらに固有識別子(UID)配列を含む。
【0015】
本発明の特定の態様は、第1末端ターゲット配列および/または第2末端ターゲット配列の融解温度を近接または一致させるために、これら2種類のターゲット配列の配列長さを変更する方法をも伴なう。この融点温度の一致によって、MIPプローブプールについてのシークエンスカバレージが増大する。
【0016】
1態様において、MIPプローブがMIP前駆体のエレメントまたはその増幅生成物に再ハイブリダイズするのを阻止するように設計されたブロッキングオリゴヌクレオチドの存在下で、ハイブリダイゼーション工程を実施する。
【0017】
MIP前駆体からニッキング酵素(またはこの方法に有用な他の酵素、たとえば鎖を破断できる酵素、たとえばUDG/UNG)を用いて作製したMIPプローブを、領域XおよびYにより規定される領域のターゲテッドキャプチャーのために使用する。MIPはニッキングされたけれども二本鎖であり、したがってハイブリダイゼーション工程で変性した際にこの二本鎖MIPから有効な一本鎖MIPが放出されるであろう。この一本鎖の有効MIPがそれの相補体に再ハイブリダイズして元の二本鎖MIPを形成するのを阻止するために、30−merのブロッキングオリゴ(300−24−1)を添加する。このオリゴ(300−24−1)は高いモル過剰で添加されるので、二本鎖MIPカセットに優先的にハイブリダイズして、先に放出された有効な一本鎖MIPがデュプレックスを形成するのを阻止するであろう。有効な一本鎖MIPはこうして後続の伸長+ライゲーション反応においてターゲテッドキャプチャーに利用できる状態になり、それにより環状MIPが得られるであろう。
【0018】
本発明は、ターゲット配列の一部を同定するために下記によりMIPプローブを使用する態様をも含む:a)MIPプローブを核酸試料にハイブリダイズさせること;b)核酸試料の一部が複製されて環化MIPプローブに組み込まれるように、MIPプローブをポリメラーゼで環化すること;c)エキソヌクレアーゼを使用して線状核酸を実質的に消化すること;およびd)MIPプローブの配列を決定すること。配列が決定されると、いずれかのUID配列(特定の態様において使用した場合)が予想結果と比較して過剰提示または過小提示されているかを判定するためにUID配列を使用できる。
【0019】
本発明方法の1態様において、アレイ合成はマスクレス・アレイ合成を使用して実施される。MASは核酸合成のための経済的で高フレキシブルなプラットフォームであるという利点をもち、したがってMASの使用は他の合成法より有利になることができる。
【0020】
本発明の特定の態様において、プローブ選択は、たとえばターゲティングするエキソンが小さい(通常は150塩基未満)場合、単一エキソンをカバーするために1つのプローブを必要とするにすぎない可能性がある。他の態様において、プローブ選択は、より大きなターゲット、たとえばより大きなエキソンをカバーするために多数のプローブを必要とし、シークエンシング工程を用いてターゲテッドオーバーラップを決定し、そしてターゲット配列をアセンブリングする。ある態様において、大きな領域と小さな領域の両方をターゲティングし、両方法を合わせたものが必要となる。
【0021】
本発明の開示に際して、特定の用語は以下の節に記載する意味をもつ。
用語“a”、“an”および“the”は、一般に、そうではないことが内容から明らかに示されない限り複数表記を含む。
【0022】
用語“増幅(amplification)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するためにプライマー類がターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準PCR、ロングPCR(long PCR)、ホットスタートPCR(hot start PCR)、qPCR、RT−PCRおよび等温増幅(Isothermal Amplification)により実施できるが、これらに限定されない。本明細書中で用いる用語“増幅する(amplifying)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するために少なくとも1つのプライマーがターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準PCR、ロングPCR、ホットスタートPCR、qPCR、RT−PCRおよび等温増幅により実施できるが、これらに限定されない。他の増幅反応には、特にリガーゼ連鎖反応、ポリメラーゼリガーゼ連鎖反応、Gap−LCR、修復連鎖反応(Repair Chain Reaction)、3SR、NASBA、鎖置換増幅(Strand Displacement Amplification)(SDA)、転写仲介増幅(Transcription Mediated Amplification)(TMA)、およびQb増幅が含まれる。
【0023】
用語“相補性”は、一般に、2つのヌクレオチドの塩基間で適切な温度およびイオン性緩衝液の条件下において好ましい熱力学的安定性および特異的対合を形成する能力を表わす。この対合は各ヌクレオチドの水素結合特性に依存する。これの最も基本的な例は、チミン/アデニン塩基およびシトシン/グアニン塩基間の水素結合対である。本発明において、ターゲット核酸の増幅のためのプライマーは両方ともそれらの長さ全体にわたってターゲット核酸分子と完全に相補的であってもよく、あるいは“準相補的”であってもよく、この場合、プライマーはターゲット核酸に最小限にハイブリダイズできるかまたはハイブリダイズできない追加の非相補配列を含む。
【0024】
本明細書中で用いる用語“検出する”は、一般に、試料中のターゲット核酸分子の存在または非存在の査定を目的とした定性試験に関係する。
本明細書中で用いる用語“エンリッチした”は、一般に、ターゲット核酸を含む試料を処理するいずれかの方法であって、ターゲット核酸を試料中に存在する他の材料の少なくとも一部から分離できる方法に関係する。したがって、“エンリッチメント”は他の材料より多量のターゲット核酸の生成であると解釈される。
【0025】
用語“過剰”は、一般に、特定の試薬または試薬類が他のものと比較してより多量またはより高濃度であることを表わす。
用語“ハイブリダイズ”は、一般に、それらのヌクレオチド配列が調和する異なる核酸分子間の塩基対合を表わす。用語“ハイブリダイズ”と“アニール”は互換性をもって使用できる。
【0026】
用語“核酸”または“ポリヌクレオチド”は互換性をもって使用でき、リボース核酸(RNA)もしくはデオキシリボース核酸(DNA)のポリマーに該当するポリマー、またはそのアナログを表わす。これには、ヌクレオチドのポリマー、たとえばRNAおよびDNA、ならびに合成形態、その修飾された(たとえば、化学的または生化学的に修飾された)形態、および混合ポリマー(たとえば、RNAとDNAの両方のサブユニットを含むもの)が含まれる。代表的な修飾には、メチル化、アナログによる1以上の天然ヌクレオチドの置換、ヌクレオチド間修飾、たとえば非荷電結合(たとえば、メチルホスホネート、ホスホトリエステル、ホスホアミデート、カルバメートなど)、ペンデント(pendent)部分(たとえば、ポリペプチド)、インターカレーター(たとえば、アクリジン、プソラレン(psoralen)など)、キレーター、アルキレーター(alkylator)、および修飾された結合(たとえば、アルファアノマー核酸など)が含まれる。指定配列に水素結合その他の化学的相互作用により結合するそれらの能力においてポリヌクレオチドを模倣した合成分子も含まれる。一般に、ヌクレオチドモノマーはホスホジエステル結合により連結するが、合成形態の核酸は他の結合を含むことができる(たとえば、Nielsen et al. (Science 254:1497-1500, 1991に記載されるペプチド核酸)。核酸は、たとえば染色体または染色体セグメント、ベクター(たとえば、発現ベクター)、発現カセット、裸のDNAまたはRNAポリマー、ポリメラーゼ連鎖反応(PCR)の生成物、オリゴヌクレオチド、プローブ、およびプライマーであるか、あるいはそれらを含むことができる。核酸は、たとえば一本鎖、二本鎖、または三本鎖であってもよく、いずれか特定の長さに限定されない。別途指示しない限り、個々の核酸配列は明示したいずれかの配列のほかに相補配列を含むかまたはコードする。
【0027】
用語“ヌクレオチド”は、天然のリボヌクレオチドまたはデオキシリボヌクレオチドのモノマーのほかに、本明細書中ではその関連構造バリアントを表わすと解釈すべきであり、状況からそうではないことが明示されない限り、それにはヌクレオチドが使用される特定の状況(たとえば、相補的塩基へのハイブリダイゼーション)に関して機能均等である誘導体およびアナログが含まれる。
【0028】
用語“オリゴヌクレオチド”は、少なくとも2つの核酸モノマー単位(たとえば、ヌクレオチド)を含む核酸を表わす。オリゴヌクレオチドは一般的には約6から約175までの核酸モノマー単位、より一般的には約8から約100までの核酸モノマー単位、よりさらに一般的には約10から約50までの核酸モノマー単位(たとえば、約15、約20、約25、約30、約35、またはより多数の核酸モノマー単位)を含む。オリゴヌクレオチドの厳密なサイズは、そのオリゴヌクレオチドの最終的な機能または用途を含めた多数の要因に依存するであろう。オリゴヌクレオチドは所望によりいずれか適切な方法によって調製され、それには既存配列または天然配列の単離、DNAの複製または増幅、逆転写、適切な配列のクローニングおよび制限消化、あるいは下記の方法による直接化学合成が含まれるが、それらに限定されない:たとえば、Narang et al.(Meth. Enzymol. 68:90-99, 1979)のホスホトリエステル法;Brown et al.(Meth. Enzymol. 68:109-151, 1979)のホスホジエステル法;Beaucage et al. (Tetrahedron Lett. 22:1859-1862, 1981)のジエチルホスホルアミダイト法;Matteucci et al. (J. Am. Chem. Soc. 103:3185-3191, 1981)のトリエステル法;自動合成法;Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999に記載されるマスクレス・アレイ合成、もしくはU.S. Pat. No. 4,458,066の固体支持体法、または当業者に既知の他の方法。
【0029】
用語“プライマー”は、ポリヌクレオチド伸長が開始する条件下(たとえば、適切な緩衝液中で、適切な温度または温度サイクル(単数または複数)における、必要なヌクレオシド三リン酸(コピーされる鋳型により指示されるもの)およびポリメラーゼの存在を含む条件下(たとえば、ポリメラーゼ連鎖反応の場合のように))に置かれた際に、鋳型指向性核酸合成(template-directed nucleic acid synthesis)の開始点として作用することができるポリヌクレオチドを表わす。さらに説明すると、プライマーは他の多様なオリゴヌクレオチド仲介合成法にも使用でき、それには de novo RNA合成および in vitro 転写関連方法(たとえば、核酸配列ベースの増幅(nucleic acid sequence-based amplification)(NASBA)、転写仲介増幅(transcription mediated amplification)(TMA)など)のイニシエーターとしての使用が含まれる。プライマーは、一般に一本鎖オリゴヌクレオチド(たとえば、オリゴデオキシリボヌクレオチド)である。プライマーの適切な長さはそのプライマーの目的用途に依存するが、一般的に6から40までのヌクレオチド、より一般的には15から35までのヌクレオチドの範囲である。短いプライマー分子は、一般に鋳型との十分に安定なハイブリッド複合体を形成するために必要な温度がより低い。プライマーは必ずしも鋳型の厳密な配列を反映する必要はないが、プライマー伸長が起きるためには鋳型とハイブリダイズするのに十分なほど相補的でなければならない。特定の態様において、用語“プライマー対”は、増幅すべき核酸配列の5’末端の相補体とハイブリダイズする5’センスプライマー(時には“フォワード”と呼ばれる)および増幅すべき核酸配列の3’末端の相補体とハイブリダイズする3’アンチセンスプライマー(時には“リバース”と呼ばれる)を含むプライマーのセットを意味する(たとえば、ターゲット配列がRNAとして発現するか、あるいはRNAであれば)。プライマーは、所望により、分光、光化学、生化学、免疫化学または化学的な手段により検出できる標識を取り込ませることによって標識できる。たとえば、有用な標識には、32P、蛍光色素、高電子密度試薬、酵素(ELISAアッセイにおいて一般に用いられるもの)、ビオチン、またはハプテンおよびタンパク質であってそれに対する抗血清もしくはモノクローナル抗体が得られるものが含まれる。
【0030】
本発明の意味において、核酸の“精製”、“単離”または“抽出”は、下記に関係する:核酸をたとえば増幅による診断アッセイで分析する前に、それらを一般に種々の成分の複合混合物を含有する生物試料から精製、単離または抽出しなければならない。第1工程として、核酸のエンリッチメントを可能にする方法を使用できる。そのようなエンリッチメントの方法は本明細書に記載されている。
【0031】
本明細書中で用いる用語“定量する”は、試料中に存在するターゲット核酸の量または濃度の決定に関係する。
“ターゲット核酸”は、本明細書中で試料中の分析すべき核酸、すなわち試料中のその存在、非存在、核酸配列および/または量を決定すべき核酸を表わすために用いられる。ターゲット核酸はゲノム配列、たとえば特定の遺伝子の一部、RNA、cDNA、または他のいずれの形態の核酸配列であってもよい。ある態様において、ターゲット核酸はウイルス性または微生物性のものであってもよい。
【0032】
用語“ターゲット核酸”と“ターゲット分子”は互換性をもって使用でき、増幅反応の対象である核酸分子を表わし、所望によりそれの配列情報を得るためにシークエンシング反応によりそれを調べることができる。
【0033】
用語“ターゲット特異的領域”または“対象領域”は互換性をもって使用でき、特定の核酸分子の科学的対象である領域を表わす。これらの領域は、対象領域(単数または複数)を囲む増幅反応用プライマーを設計し、それによりこれらの対象領域を含むターゲット核酸アンプリコンを回収するために、一般に少なくとも部分的に既知の配列をもつ。
【0034】
用語“熱安定性ポリメラーゼ”は、熱に対して安定であり、耐熱性であり、二本鎖核酸を変性させるのに必要な時間、高められた温度を付与した際に、後続のポリヌクレオチド伸長反応を行なうのに十分な活性を保持し、不可逆的に変性(不活性化)することのない酵素を表わす。核酸変性に必要な加熱条件は当技術分野で周知であり、たとえばU.S. Patent No. 4,683,202、4,683,195、および4,965,188に例示されている。本発明に用いる熱安定性ポリメラーゼは、温度サイクリング反応、たとえばポリメラーゼ連鎖反応“PCR”に使用するのに適している。本発明の目的について、不可逆的変性は永続的かつ完全な酵素活性喪失を表わす。熱安定性ポリメラーゼについて、酵素活性は、ヌクレオチドを適正に結合させて鋳型核酸鎖に対して相補的なポリヌクレオチド伸長生成物を形成する触媒作用を表わす。好熱性細菌からの熱安定性DNAポリメラーゼには、たとえばテルモトガ・マリチマ(Thermotoga maritima)、テルムス・アクアティカス(Thermus aquaticus)、テルムス・テルモフィルス(Thermus thermophilus)、テルムス・フラブス(Thermus flavus)、テルムス・フィリホルミス(Thermus filiformis)、テルムス属種Sps17、テルムス属種Z05、テルムス・カルドフィルス(Thermus caldophilus)、バチルス・カルドテナックス(Bacillus caldotenax)、テルモトガ・ネオポリタナ(Thermotoga neopolitana)、テルモシフォ・アフリカヌス(Thermosipho africanus)からのDNAポリメラーゼが含まれる。
【0035】
用語“マスクレス・アレイ合成(Maskless Array Synthesis)”(MAS)は、アレイとしての基体の表面における物理的マスクの非存在下でのオリゴヌクレオチドの光指向合成(light-directed synthesis)を表わす;たとえば、Singh-Gasson et al., Nature Biotech, 17: 974-978 (Oct. 1999)により記載された方法;それの教示内容を本明細書に援用する。簡単に述べると、MAS法は、一般に、バーチャルマスクを形成するマイクロミラーからなるデジタルマイクロアレイミラーデバイス(digital microarray mirror device)(DMD)を使用する。これらのミラーは個々にアドレス指定でき、いずれか特定のパターンまたはイメージを作成するために広域波長で使用できる。DMDは基体の表面にイメージを形成し、ここで、基体は光によって活性化される化合物部分を含む。次いで指定ヌクレオチドを含有する溶液を基体の表面に流し、活性化された領域に結合させる。溶液に含有されるヌクレオチドは感光性保護基で光保護されている。合成の第2ラウンドで、DMDは基体の選択された領域上に第2イメージを形成し、これによりそれらの領域の基体を選択的に活性化し、そして第2の指定ヌクレオチド(これも光保護されている)を基体上に流す。この第2ヌクレオチドは、第2ラウンドの照射に際して活性化された領域に結合する。こうして選択したヌクレオチドを選択した領域に付加することができ、マスクの非存在下での光指向合成によりオリゴヌクレオチドのアレイを合成することが可能になる。オリゴヌクレオチド配列を1モノマーずつ構築するためには、このプロセスを多数回反復する。
【0036】
アレイを構築する他の方法、たとえばクロムマスクの使用、またはアレイ上へのオリゴヌクレオチドのスポッティングも、本発明に使用できる。MASは本発明に使用した場合に改良されたフレキシビリティーおよび簡潔性を提供するが、他のアレイ形成法も有用である。本発明に使用できるMAS以外の合成方式の例は、Affymetrix、Oxford Gene Technologies、およびAgilentが採用している周知の方法である。
【0037】
本発明は、MIP前駆体分子をアレイ表面で合成し、次いでそれらのMIP前駆体を溶液中へ増幅することを伴ない、次いでそこで他の製造工程を実施することができる。特定の態様において、MIP前駆体をPCRなどの増幅方式により増幅する。そのような態様において、MIP前駆体は一般にそれらがそのような後続の増幅工程に有用なプライマー部位を含むように合成される。
【0038】
本発明の特定の観点において、プローブがUID領域を含むようにそれらをアレイ上で製造する。UID領域は個々のプローブに固有のプローブセグメントであり、存在する特定のUID配列に基づいてそのプローブを同定できる。UID配列は幾つかの異なる方法で設計でき、それにはプローブに使用すべき特定のUID配列の予備計画、コンピューターその他の手段によるランダムUID配列作製、続いてUID配列をプローブに組み込むためのプローブ合成、または化学的に誘導したランダム合成によるものが含まれる。“化学的に誘導したランダム合成(chemically-derived random synthesis)”は、予備計画なしに、または予めランダム配列決定せずに、プローブ合成に際して数種類のヌクレオチドを混合して同時に合成表面に施し、ランダムに配列に形成させることを意味する。1態様において、光指向合成(たとえば、マスク下アレイ合成またはマスクレス・アレイ合成)に有用な4種類の一般的なヌクレオチド(A、C、T、G)すべてを混合し、数回の連続反復合成に際して添加し、アレイ表面の光活性化された部分にランダムに結合させる。この態様において、A、C、TまたはGの順序は配列の予備計画なしにランダムであろう。化学的に誘導したランダム合成は、配列を予備計画するための工程がワークフローに追加されないという点で、プローブ製造方法の効率化という利点をもたらす。
【実施例】
【0039】
実施例1:MIPプローブプールの調製および精製
MIP−前駆体からMIPへの変換のためのプロトコルを図1に詳述する。図1AはMIP−前駆体分子に関する一例を示す。この例では、MIP前駆体はアレイ表面に前駆体が形成されるようにMASユニット上での合成により形成された。この例におけるMIP前駆体分子は2つの15merプライマー部位を5’および3’末端に含む。末端プライマー部位に隣接して、ターゲット特異的領域である2つの20mer部位、X20およびY20があり、それらは試料中の特定のターゲット領域の境界をなす特定部位に対して相補的である。X20とY20の間にリンカー領域(この場合は30mer配列)があり、それはこれら2つのターゲット特異的配列を互いに連結している。
【0040】
次いで2つのプライマーを用いてMIP前駆体を増幅処理する;この例ではプライマーを図1Bに示す。フォワードとリバースの両プライマーがあった。図1Bに示すように、フォワードプライマーはMIP前駆体分子の5’末端セクションにあるものと同一の配列を含み、一方、リバースプライマーはMIP前駆体分子の3’末端にある配列に対して相補的な配列を含む。したがって、第1増幅工程で、リバースプライマーはMIP前駆体にハイブリダイズし、伸長して相補配列を生成し、それにその後の増幅工程でフォワードプライマーが結合できる。この例では、入口と出口をもつチャンバー(Grace Bio−Lab,パーツ05876702001または05871158001)をMIP−前駆体アレイに付着させて、そこでMIP−前駆体分子を増幅鋳型として用いた増幅が行なわれるチャンバーを形成した。増幅はサーマルサイクラー内でSlide Griddle Adaptor(BioRad,SGP0196)を用いて実施された。下記のものを含有する in situ PCRマスターミックスを調製した。
【0041】
【表1】
【0042】
マスターミックスを入れたチューブを95℃の加熱ブロック内に5分間置いて脱ガスした。HotStartTaq酵素(11uL[5U/ul])をミックスに添加して増幅プロトコルを開始した。この例において、用いたプロトコルは下記の工程を伴なっていた:1)アレイを97℃に15分間加熱し、その時間の終了付近で1mLのPCRミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第2口をシールする;2)チャンバーを、100℃/1分;48℃/1.5分;78℃/1分の加熱工程で30回サイクリングする;3)チャンバーを72℃に15分間保持する;そして4)最終工程としてチャンバーを4℃に冷却する。
【0043】
増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、Qiaquick PCR精製キット(Qiagen)を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製MIP−前駆体の濃度を測定した。プロセスのこの時点で、MIP前駆体は図1Cに示すように増幅しており、二本鎖形態である。
【0044】
MIP前駆体のさらなる処理を実施した。具体的には、さらに2種類のニッキング酵素を用いて二本鎖前駆体分子を消化した。具体的には、5μg(21.3μl)のPCR生成物を100μlの1×NeB2中5μlのNt.Alw1(10U/μl,New England Biolabs)により、37℃で3時間消化した。生成物を2%アガロース臭化エチジウムゲルで分析した。この最初の消化の後、生成物をさらに5μlのNb.BsrD1(10U/μl,New England Biolabs)により65℃で6時間、続いて80℃で20分間、消化した。インキュベーション時間は、使用する酵素、濃度、反応条件などに応じてほぼ確実に変動する可能性がある。消化反応が終了した後、試料をQiagenヌクレオチド分離キットで精製した。30μlの標準溶離緩衝液を用いて溶離を実施した。DNA濃度を測定し(106ng/μl)、図2に示すように試料を4%アガロース臭化エチジウムゲルで分析した。
【0045】
図2に示すゲルのレーン1は0.5μlの25塩基対ラダー分子量基準を含む。レーン2では、0.7μlの235ng/μl PCR生成物(すなわち、増幅後の、ただし制限酵素消化前の生成物)を分析した。レーン3は3μlの2酵素消化物を分析した際のゲル生成物を示す。したがって、列3は試料へのハイブリダイゼーションに用いた最終MIPプローブプールを含む。
【0046】
実施例2:ターゲテッド領域のキャプチャーのためのMIPプローブプールの使用
前記の実施例1からのプロトコルにより、ゲノムDNAへのハイブリダイゼーションに有用な70−mer MIPが得られる。これらの例の目的について、このプールをMIP480ミックスと表示した。そのようなMIPを、cDNA、RNAなどを含めた他の形態の核酸ターゲットについて使用するために調製できることも容易に認識される。MIPプローブをゲノムDNAに接触させるハイブリダイゼーション工程および伸長工程を図3に示す。
【0047】
この例では、約750ngのhgDNAまたは2.25×105コピーのhgDNAを用いた。MIP:ゲノムの当量比を約100:1に維持しながら、1pgの各プローブ(500pg=0.5ngのMIP480ミックス)を用いた。これらのMIP計算は、70ヌクレオチドのMIPフラグメントのみが存在すると仮定する。ハイブリダイゼーション反応のために、下記の試薬を用いた。
【0048】
【表2】
【0049】
対照として、gDNAをHOで置き換える。95℃で10分間変性し、60℃で36時間インキュベートする。
キャプチャーされたDNA配列(この場合はエキソン)を次いで環化した。リガーゼおよびポリメラーゼ酵素のミックス10μlを調製し、それぞれ25μlのキャプチャー反応に添加した。このリガーゼ/ポリメラーゼミックスは下記の試薬を含む。
【0050】
【表3】
【0051】
合計10μlを25μlのキャプチャー反応液に添加し、60℃で24時間インキュベートする。伸長/環化工程を図3に示す。
下記の試薬(すべてNew England Biosciencesから)を用いてエキソヌクレアーゼの混合物を調製した。
【0052】
【表4】
【0053】
線状DNAを除去するために、2ulのエキソヌクレアーゼミックスをそれぞれ35ulのampligase反応に添加した。試料を37℃で1時間、80℃で10分間、そして95℃で5分間、インキュベートした。
【0054】
線状DNAを除去した後、残りの生成物を25ulの反応でPCR増幅し、精製した。このPCR増幅(インバースPCR)のために、下記の試薬を用いた。
【0055】
【表5】
【0056】
この反応において、マルチプレックスプライマー(multiplex primer)は試料同定のためのMID配列を含む。PCR増幅のために、反応を98℃に30分間保持し、次いで30回サイクリングし(98℃で10分/60℃で30分/72℃で1分)、次いで72℃に2分間保持する。PCR生成物を4%アガロースゲルで分析した(図4)。図4において、レーン1は5ulのgDNA MIPキャプチャーPCR生成物を20ulのTE中に含有し、レーン2は対照(gDNAを水で置き換えたもの)を含有し、レーン3は0.5ulの25塩基対ラダーを含有する。レーン1からのDNA濃度は23.5ng/ulまたは130nMと測定された。この増幅および精製した生成物を、次いでたとえばIllumina TruSeqシークエンシングを用いるシークエンシングに使用できる。
【0057】
実施例3:XおよびYについて可変長(20〜30nt)をもつ融解温度(Tm)平衡化した474 MIPを使用したエキソンキャプチャーのためのMIPプロトコル
この例では、使用したMIPプローブは20〜30ヌクレオチドの可変XおよびY領域長さをもつ。この態様において、TmはXとYの融解温度がほぼ等しくなるように標準式を用いて計算される。
【0058】
先の例において、固定長20−ntのターゲット特異的領域をもつ、下記のように表わされるMIPプローブが作製された:
5’−(X20)AGATCGGAAGAGCACATCCGACGGTAGTGT(Y20),XおよびYは2つの20ヌクレオチド長さのターゲット特異的領域を表わす。本発明の態様においては、MIPプローブは可変領域をもち、下記のように表わすことができる:
5’−(X20〜30)AGATCGGAAGAGCACATCCGACGGTAGTGT(Y20〜30),ここで、X領域とY領域は必ずしも同一長さをもつ必要はない。固定長20−ntのプローブおよびTm平衡化した20〜30−ntプローブのTm分布を図5に示す。図5において、X−軸はプローブの融解温度を示し、一方、Y軸はプローブ数を示す。これから分かるように、プローブのTmを変化させると、集団はXおよびY領域の長さを固定した場合より狭い融点範囲に集中する。下記の表は図5に用いたデータを含む。
【0059】
【表6】
【0060】
20−nt固定MIPプローブプールを用いて示されたシークエンスカバレージを20〜30−nt可変MIPプローブプールと対比して判定するために実験を行なった。これらの実験の結果を図6に示す。図6は、固定Tmで設計したMIPプローブ(挿入図)をTm平衡化設計と比較したシークエンスカバレージの頻度分布(リード(read)の数)を示す。挿入図は45%のMIPが何らカバレージをもたないこと(カバレージ0)を示し、これに対しTm平衡化設計ではカバレージをもたないMIPの数が3%に低下し、474 MIPにより提示されるターゲテッド領域について約15倍の改善を示す。Tm平衡化設計の大部分のMIPについてシークエンスカバレージは相対的に高く、あるMIPについては数百万に及ぶリードが検出された。図6において、X−軸はシークエンスカバレージを表わし、それはIllumina HiSeqでのこの特定のランについて各MIPにつき検出されたリード数の尺度である。カバレージをビンに区分した(binned)頻度分布として表わす。
【0061】
その図(挿入図を参照)において、固定長MIPプローブプールはシークエンスカバレージを効率的に示さない大きな部分のプール集団を示した。事実、215/474のプローブ(45%)はターゲット配列を効率的にカバーしなかった。対照的に、このグラフの主部分はTmを平衡化した場合のシークエンスカバレージを示す。容易に分かるように、シークエンスカバレージを示さないプローブの数は15/474(3%)にまで劇的に減少した。したがって、XおよびYターゲット領域のTmがほぼ同等である態様は、XおよびY領域が設定された長さのものである他の態様を上回る改良に寄与する。
【0062】
実施例4:XおよびY領域について20〜30ヌクレオチドの可変長をもち、平衡化TmおよびN6 UIDをもつ474 MIPを使用したエキソンキャプチャー用のMIPプロトコル
UID配列を含むMIP前駆体についての一般的フォーマットを図7Aに表わす。この例では、MIPプローブは、NNNNNN(N6)として表記されるUID領域を含むリンカーで連結された可変長ターゲット領域XおよびYをもつ。UID領域はもちろん6ヌクレオチド以外の鎖長で合成でき、個々の実験または用途に必要なランダム性を誘導するのに十分な長さでありさえすればよい。このセグメントは、各プローブにおいて合成されるランダム生成配列である(すなわち、各プローブがそれ自体のランダムUID配列をもつ)。この配列は、シークエンシングワークフローの終了付近で、いずれか特定のプローブターゲットが増幅バイアス、遺伝子座増幅/提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトによって過剰提示されているかを判定するために使用できる。前記と同様なワークフローで、MIPプローブを合成し、次いでプライマーを用いて増幅し(図7Bを参照)、次いで制限酵素でニッキングし、一本鎖MIPプールとして放出させる(図7Cを参照)。
【0063】
一本鎖MIPはDNA(たとえばゲノムDNA,ただし、いかなる核酸分子も使用できる)にハイブリダイズする。一本鎖MIPに対する相補鎖をブロッキングオリゴヌクレオチドによりブロックする;その一例を図7Dに表わす。
【0064】
この態様において、MIP前駆体鋳型はマスクレス・アレイ合成(MAS)を用いてアレイ上に合成された。前記の実施例の場合のように、MIP前駆体アレイをGrace Biolabチャンバーに付着させ、in situ PCRマスターミックスを調製した。このin situ PCRマスターミックスは実質的に前記の実施例1の場合と同一であり、ただしdNTP濃度を10mMに低下させ、より多い体積(13.75μl)をマスターミックスに用いた。dNTP試薬の体積の増加は、用いたフォワードおよびリバースプライマーの体積の減少(20μlから18μlに)ならびに水の体積の減少によって相殺された。
【0065】
マスターミックスを入れたチューブを95℃の加熱ブロック内に5分間置いて脱ガスした。HotStartTaq酵素(11uL[5U/ul])をミックスに添加して増幅プロトコルを開始した。この例で用いたプロトコルは下記の工程を伴なっていた:1)アレイを97℃に15分間加熱し、その時間の終了付近で1mLのPCRミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第2口をシールする;2)チャンバーを、100℃/1分;48℃/1.5分;78℃/1分の加熱工程で15〜18回サイクリングした;3)チャンバーを72℃に15分間保持する;そして4)最終工程としてチャンバーを4℃に冷却する。
【0066】
増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、Qiaquick PCR精製キット(Qiagen)を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製MIP−前駆体の濃度を測定した。1スライド上で15回の増幅サイクルを用いて0.3μgのMIP−前駆体が得られ、一方、他のスライド上で18回の増幅サイクルを用いて2.3μgが得られた。低い増幅量の試料の追加増幅を1mlのPCRで実施した:5×HF緩衝液(200μl)、50μMのプライマー300−20−1(10μl)、50μMのプライマー300−22−2(10μl)、10mMのdNTP(20μl)、MIP前駆体5ng/μl(5μl)、水(750μl)、Phusionポリメラーゼ(5μl)。試料を98℃に加熱し、次いで10回サイクリングした(98℃で20分,60℃で1分,72℃で1分)。PCR生成物を50μlのH0中で精製した(Qiagen)。この追加増幅の後、DNA濃度は117ng/μlと測定された。
【0067】
増幅の後、MIP前駆体を制限酵素で処理した:2.5μgのPCR生成物を5μlのNt.AlwI(10u/μl,NEB)により、100μlの1×NEB2中、37℃で3時間消化した。5μlのNb.BsrDI(10u/μl,NEB)を添加した。65℃で3時間、続いて80℃で20分間、インキュベートした。消化反応物をQiagenヌクレオチド分離キットで精製し、30μlの溶離緩衝液中に溶離した。DNA濃度は47ng/μlと測定され、86ntのTm平衡化したN6 MIPの濃度は47*86/(126+86)=19ng/μlであった。
【0068】
酵素処理の後、MIPプローブを図8に示すようにゲノムDNAにハイブリダイズさせる。明確にするために、環化した構造のMIPを表わした先の図とは異なり、図8は環化した形のゲノムDNAを表わしていることを留意すべきである。概念的にいずれのアレンジメントも適正に機能し、視覚化するための個々の好みによっていずれかの構造が選択されるにすぎないことは、当業者に容易に認識される。
【0069】
この例では、下記の試薬を用いてプローブをゲノムDNAにハイブリダイズさせた。
【0070】
【表7】
【0071】
対照として、gDNAを水で置き換えた。試料を95℃で10分間変性し、61℃で36時間インキュベートした。
この態様において、ゲノムDNAにハイブリダイズしたMIPは、Phusionポリメラーゼでギャップ充填した後にAmpligaseにより環化された。リガーゼ/ポリメラーゼミックスは下記の試薬を用いて調製された。
【0072】
【表8】
【0073】
合計10μlのリガーゼ/ポリメラーゼミックスをそれぞれ25μlのキャプチャー反応に添加し、60℃で24時間インキュベートした。
線状DNAを消化するために、下記の試薬からなるエキソヌクレアーゼミックスで試料を処理した。
【0074】
【表9】
【0075】
線状DNAを消化するために、2μlのエキソヌクレアーゼミックスをそれぞれ35μlのPhusion/ampligase反応液に添加した。試料を37℃で1時間、80℃で10分間、95℃で5分間インキュベートした。
【0076】
キャプチャー後の試料を次いで50μlの反応で増幅および精製する。
【0077】
【表10】
【0078】
試料を次いでサーマルサイクリングで増幅した:98Cで30分、次いで28回のサーマルサイクル(98Cで10分/60Cで30分/72Cで1分)。増幅の後、5μlのPCR生成物を4%アガロースゲルで30分間、分析した。結果を図9に示す。レーン1は25−bpのラダーを示し、レーン2はPCR生成物を示す。
【0079】
増幅した試料を次いでIlluminaシークエンサーでシークエンシングした。
実施例5:エキソーム(Exome)キャプチャーのためのMIP設計
この例では、前記の実施例4に記載したものと同じプロトコルを用い、ただし474 MIPプローブのプールを合成する代わりに、個々のプローブ上にXおよびYターゲット領域について20〜30ヌクレオチドの可変長をもち、平衡化TmおよびN6 UID配列をもつ437,202のMIPプローブを含むようにプールを増加した(“437Kプール”)。
【0080】
437Kプールを用いてシークエンシング分析を実施して、キャプチャー成功率を判定した。437Kプールは約82%のキャプチャー成功率をもつと判定された(すなわち、プール中のプローブの82%がターゲテッド配列のキャプチャーに成功した)。
【0081】
実施例6:UIDの使用
UIDはシークエンシング結果における特定のプローブの過剰提示または過小提示を判定するために使用でき、個々のプローブに関係する特定のリードのトラッキングがデータ解析のために重要である他の目的にも有用である。1態様において、UIDは、図10に示すように増幅により導入された潜在的な対立遺伝子バイアスの存在下で接合状態(zygosity)を判定するために用いられる。各MIPプローブについて、シークエンシングリードはそのプローブについて合成されたUID配列(リード1、リード2、または両方に現われる可能性がある)を示し、かつ目的とするキャプチャー配列を含むであろう(図10Aを参照)。
【0082】
図10BはMIPがプライマーベースのプローブであり、したがって目的ターゲット上にアラインした配列の‘積み重なり(stack)’を生成することを示す。プローブ特異的UIDは分子キャプチャー事象を区別するために用いられる。1つのUIDが増幅によって多数のシークエンシングリードペア(read pair)をもつ可能性がある。バリアントを見出だす目的で、同一UIDを含むリードペアの各セットから代表的リードペアまたはコンセンサス配列を選択する。あるキャプチャー事象が優先的に増幅されていれば、そのUIDも運ばれているであろう。このUIDベースの複製物リードペア削減は潜在的な増幅バイアスを排除する(図10Cを参照)。
【0083】
図11は、本発明のMIPプローブの作製法の態様を例示する。マスクレス・アレイ合成を用いて、アレイ(この例では2.1Mフィーチャーのマイクロアレイ)上で1モノマーずつ前駆体分子を合成する。前駆体分子を3’末端でアレイの表面に固定することができる。合成されると、アレイを in situ PCR処理して、可溶化、増幅し、1個のウラシルを1つのプローブ鎖に取り込ませる。増幅の後、前駆体は溶液中の二本鎖分子であり、1個のウラシル塩基を含む。増幅の後、この例では、ウラシル−DNAグリコシラーゼ(UDG)およびエンドヌクレアーゼVIIIを用いて二本鎖分子を消化処理し、Nb.DSRDIがプローブ鎖上にのみニックを形成して、厳密に両方の in situ プライマーアダプターを離脱させる。変性PAGEゲル電気泳動はプローブの形成を立証し、プローブの相補体をも示す。
【0084】
図12Aおよび12Bは、MIPプローブに関するワークフローの1態様を例示する。図12A1では、一本鎖MIPプローブをターゲットDNAと適切な比率で混合する。MIPプローブとターゲットを適切な期間ハイブリダイズさせる(図12A2);時間はプローブおよびターゲットの複雑性および比率に依存する。ハイブリダイゼーションの後、MIPプローブを伸長およびライゲートさせて、ターゲット配列をコピーし、プローブ/ターゲット配列を環化する(図12A3)。伸長およびライゲーションはDNAポリメラーゼおよびDNAリガーゼの混合物を用いて達成される。
【0085】
伸長/ライゲーションの後、一本鎖鋳型およびプローブを消化する(図12B1)。ある態様において、エキソヌクレアーゼ、たとえばExoIおよびExoIIIの混合物を一本鎖分子の消化のために使用する。一本鎖分子が消化された時点で、プローブ/ターゲットを増幅する。特定の態様において、シークエンシングアダプターおよび試料インデックスバーコード(MID)配列(図12B2に“N”と表記する)を組み込む。MIDコードはそれぞれの検査試料について異なる配列を使用し、試料をそれらのMIDコードにより同定できるのでシークエンシング前の増幅後プーリングを可能にする。図12B3は、増幅後の二本鎖生成物の構造を表わし、この時点でそれはシークエンシングに使用できる状態である。
【0086】
図13は、本発明を用いる試料トラッキングの態様を例示する。試料トラッキングの目的は、多数の実験(それぞれ異なるゲノムDNA試料をアッセイしたもの)からキャプチャーされた増幅DNA配列を、シークエンシング前にプールできるようにすることである。これによって、いずれか個々の試料についてキャプチャーされた配列の分析のために、典型的な第2世代機器でのシークエンシングのラン毎に得られた多量のシークエンシングデータを、通常はそれよりはるかに少ない配列データ要求に対して、より効率的にマッチングさせることができ、それによってコストが低減し、効率が向上し、より高い試料スループットを得ることができる。
【0087】
試料トラッキングは、環化MIPプローブを増幅するために用いられるPCRプライマーの1つに試料トラッキングインデックス(通常は6〜14ヌクレオチドの配列)を含有させることにより達成される。同一のDNA試料に由来するキャプチャーされた生成物のアンプリコンは、そのDNAのゲノム内の多種多様な領域をターゲティングするけれども、それらはすべて同一のトラッキングインデックスをもつであろう。プールしたキャプチャーされた生成物のシークエンシング後、付随するインデックス配列を解読することにより、それぞれのリードペアの由来を解明することができる。
【0088】
図14は、MIPプローブに組み込まれたUID配列を用いた事象計数(event-counting)の態様からの模擬データを例示する。事象計数の目的は、増幅バイアスまたは他のエラーの影響を排除した後のバリアント呼出に固有のキャプチャー事象を同定することである。UIDは各プローブに(PCRプライマー自体にではなく)組み込まれたランダム配列であり、増幅に際してコピーされる。各プローブ分子は、他のプローブ分子のように同一試料中の同一のエキソンを厳密にターゲティングするために用いられるとしても、異なるUID配列をもつべきである。シークエンシングの後、1つ(最高のシークエンスクオリティースコアをもつもの)を除いて、同一のUID配列をもつすべてのリードペアがPCR複製物と同様に廃棄される。残されたデータはすべて同等の情報価値をもち、試料の真の複雑性を表わすと仮定される。この能力は、変異事象、たとえば試料における体細胞変異、または混合集団におけるいずれかのバリアントの真の頻度を決定するために有用である。図14には、UID補正付きおよび補正なしの単一エキソンからの模擬データを表示する。UID補正なしのデータでは、バイアスがかかった変異対立遺伝子増幅のため、変異(X)は試料DNAにおいて50%の頻度で不正確に測定されるであろう。UID補正付きでは、試料DNAにおける実際の変異頻度は17%であることが明らかになる。
【0089】
図15は、比較的大きなMIPプローブデザイン内の単一プローブターゲット(PTEN エキソン4)に対応する23,517のリードペアの解析を示す。この解析により729の個別の6−mer UIDタグが明らかになった。あるタグの高い(>300)頻度によって強い増幅バイアスの可能性が立証され、一方、UIDは重複情報を表わすリードの96.4%の排除を可能にした。
【0090】
図16は、プローブ再平衡化の結果を示す。EGFR遺伝子の4つのエキソンを6種類のHEAT−Seqプローブ(IDTから入手)でターゲティングした。50pMのプローブを500ngのgDNAにアニールさせ、4時間かけて環化し、次いで増幅した。プローブ/ターゲット構築体を次いでシークエンシングした。マッピングしたリードの99%がターゲティングしたエキソンに最大約100,000Xの可変カバレージ深度でアラインした(UID重複排除(deduplification)の前)。このEGFR実験で得られた高変動性のシークエンスカバレージ深度は、大部分の高度に多重化した増幅ベースのターゲテッドシークエンシング法に固有の重大な非効率性を例示する。プローブ比の再調整(rebalancing)(右)はターゲット間の配列分布を変化させることができるが、予測できない様式においてである。経験と反復によるプローブ設計方法が現在最も有効な解決策である(対照=210,634のリード;MIP条件1=429,202のリード;MIP条件2=313,346のリード)。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12A
図12B
図13
図14
図15
図16
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]