特許第5986572号(P5986572)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティーの特許一覧

特許5986572固定化プライマーを使用した標的DNAの直接的な捕捉、増幅、および配列決定
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5986572
(24)【登録日】2016年8月12日
(45)【発行日】2016年9月6日
(54)【発明の名称】固定化プライマーを使用した標的DNAの直接的な捕捉、増幅、および配列決定
(51)【国際特許分類】
   C12N 15/09 20060101AFI20160823BHJP
   C12Q 1/68 20060101ALI20160823BHJP
   C12M 1/00 20060101ALI20160823BHJP
   C12M 1/34 20060101ALI20160823BHJP
【FI】
   C12N15/00 AZNA
   C12Q1/68 A
   C12M1/00 A
   C12M1/34 Z
【請求項の数】17
【全頁数】41
(21)【出願番号】特願2013-530291(P2013-530291)
(86)(22)【出願日】2011年9月21日
(65)【公表番号】特表2013-544498(P2013-544498A)
(43)【公表日】2013年12月19日
(86)【国際出願番号】US2011052645
(87)【国際公開番号】WO2012040387
(87)【国際公開日】20120329
【審査請求日】2013年9月27日
(31)【優先権主張番号】61/485,062
(32)【優先日】2011年5月11日
(33)【優先権主張国】US
(31)【優先権主張番号】61/386,390
(32)【優先日】2010年9月24日
(33)【優先権主張国】US
【前置審査】
(73)【特許権者】
【識別番号】503115205
【氏名又は名称】ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー
(74)【代理人】
【識別番号】100149294
【弁理士】
【氏名又は名称】内田 直人
(72)【発明者】
【氏名】ミュッリュカンガス,サミュエル
(72)【発明者】
【氏名】ブエンロストロ,ジェーソン
(72)【発明者】
【氏名】チ,ハンリー ピー.
【審査官】 坂崎 恵美子
(56)【参考文献】
【文献】 特表2002−503954(JP,A)
【文献】 特表2003−501071(JP,A)
【文献】 特開2010−041985(JP,A)
【文献】 米国特許出願公開第2009/0117621(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/09
C12Q 1/68
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/WPIDS/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
選択された配列を捕捉および増幅する方法であって、
a)i)表面結合オリゴヌクレオチドの第1の集団およびii)表面結合オリゴヌクレオチドの第2の集団を含む叢を含む基質を得ることであって、前記表面結合オリゴヌクレオチドの第1および第2の集団のメンバーは基質の表面全体にランダムに分布され、前記基質は空間的にまたは光学的にアドレス指定された単一ヌクレオチドの集団を含まないものであることと、
b)前記表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを、前記第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含む合成選択オリゴヌクレオチドとハイブリダイズさせることと、
c)前記表面結合オリゴヌクレオチドの第1の集団の前記第1のメンバーを伸長させて、前記ゲノム配列に相補的な配列を含む支持体結合選択プライマーを生成することと、
d)前記支持体結合選択プライマーを、前記ゲノム配列を含む核酸断片を含む断片化されたゲノムとハイブリダイズさせることであって、前記核酸断片が5’末端にアダプターを含むものであることと、
e)前記支持体結合選択プライマーを伸長させて、ゲノム内の前記ゲノム配列に隣接する隣接配列を含有する伸長産物を生成することであって、前記伸長産物が、d)工程のアダプターに相補的な配列を3’末端に含むものであることと、
f)前記表面結合オリゴヌクレオチドの第1および第2の集団の伸長されていないメンバーを使用して、前記基質上で前記伸長産物をブリッジPCRによって増幅して、前記隣接配列を含むPCR産物を生成することであって、前記表面結合オリゴヌクレオチドの第2の集団のメンバーが、e)工程の伸長産物の3’末端のアダプターに相補的な配列とハイブリダイズし、前記隣接配列を含むPCR産物を生成すること
を含む方法。
【請求項2】
d)工程の前記5’末端アダプターは、前記断片化されたゲノムにライゲートされた末端に配列決定プライマーのための結合部位を含む、請求項に記載の方法。
【請求項3】
前記表面結合オリゴヌクレオチドの第2の集団は、
i.表面結合オリゴヌクレオチドの最初の第2の集団のメンバーを、前記表面結合オリゴヌクレオチドの第2の集団の前記メンバーとハイブリダイズする領域および前記核酸断片の配列に相補的な領域を含むオリゴヌクレオチドとハイブリダイズさせることと、
ii.前記表面結合オリゴヌクレオチドの最初の第2の集団の前記メンバーを伸長させて、前記表面結合オリゴヌクレオチドの第2の集団を生成することと、によって作製される、請求項1に記載の方法。
【請求項4】
前記選択オリゴヌクレオチドは、前記第1のメンバーとハイブリダイズする前記領域と前記ゲノム配列を含有する前記領域との間に配列決定プライマーのための結合部位を含む、請求項1に記載の方法。
【請求項5】
f)工程の前記PCR産物の第1の鎖を配列決定して、前記ゲノム配列に隣接する前記配列のヌクレオチド配列の少なくとも一部を得ることをさらに含む、請求項1に記載の方法。
【請求項6】
f)工程の前記PCR産物の第2の鎖を配列決定して、前記ゲノム配列に隣接する前記配列のヌクレオチド配列の少なくとも一部を得ることをさらに含む、請求項1に記載の方法。
【請求項7】
断片化されたゲノムを生成するために哺乳動物のゲノムを断片化することと、記断片化されたゲノムにアダプターを付加することと、前記基質に前記断片化されたゲノムを適用することと、を含む、請求項1に記載の方法。
【請求項8】
前記断片化は、物理的に、化学的に、または制限酵素を使用して行われる、請求項に記載の方法。
【請求項9】
前記断片化は、超音波処理または剪断によって行われる、請求項に記載の方法。
【請求項10】
前記ハイブリッド形成は、複数の異なる個体からの複数の断片化されたゲノムを調製することと、プールを生成するために前記複数の断片化されたゲノムをプールすることと、前記断片化されたゲノムのプールを前記基質に適用することと、前記異なる個体の前記ゲノム配列に隣接する配列を含むPCR産物を得ることと、によって行われる、請求項に記載の方法。
【請求項11】
前記PCR産物の少なくとも前記第1の鎖を配列決定して、前記異なる個体の前記ゲノム配列に隣接する前記配列のヌクレオチド配列の少なくとも一部を得ることをさらに含む、請求項10に記載の方法。
【請求項12】
プールすることの前に、異なるアダプターが、前記異なる個体からの前記断片化されたゲノムにライゲートされ、前記アダプターは、前記PCR産物が配列決定された後に、前記アダプターをライゲートしたゲノム断片の源が同定されることを可能にするバーコード配列を含む、請求項10に記載の方法。
【請求項13】
第1のバーコード配列を含む第1のアダプターを使用して、第1の対象からの断片化されたゲノムDNAにアダプターをライゲートして、第1の産物を生成することと、
第2のバーコード配列を含む第2のアダプターを使用して、第2の対象からの断片化されたゲノムDNAにアダプターをライゲートして、第2の産物を生成することと、
前記第1および第2の産物を組み合わせて、混合鋳型を生成することと、
前記混合鋳型を使用して請求項1の方法を行って、各々が前記バーコード配列を含有する第1および第2のPCR産物を提供することと、を含む、請求項12に記載の方法。
【請求項14】
前記混合された鋳型は、少なくとも1,000の対象からの断片化されたゲノムDNAを含む、請求項13に記載の方法。
【請求項15】
i.前記核酸断片を、配列決定プライマーのための部位および前記第2の表面結合オリゴヌクレオチドと同じヌクレオチド配列を含有するアダプターにライゲートすることと、
ii.前記アダプターをライゲートした断片を、前記表面結合オリゴヌクレオチドの第1の集団の第1のメンバーとハイブリダイズさせることと、
iii.前記アダプターをライゲートした断片がハイブリダイズされた前記表面結合オリゴヌクレオチドの第1の集団の前記第1のメンバーを伸長させることと、
iv.前記伸長産物の前記アダプターを含有する末端を、第2の支持体結合ポリヌクレオチドとハイブリダイズさせ、それによってブリッジを生成し、ブリッジPCRを促進することと、を含む、請求項1に記載の方法。
【請求項16】
前記表面結合オリゴヌクレオチドの第2の集団は、前記核酸断片の配列に相補的な領域を含むオリゴヌクレオチドを表面結合オリゴヌクレオチドの最初の第2の集団にライゲートして、前記表面結合オリゴヌクレオチドの第2の集団を生成することによって作製される、請求項1に記載の方法。
【請求項17】
前記核酸断片は、ゲノム断片またはcDNAである、請求項1に記載の方法。
【発明の詳細な説明】
【背景技術】
【0001】
相互参照
本出願は、2010年9月24日に出願された米国仮特許出願第61/386,390号、および2011年5月11日に出願された第61/485,062号の利益を主張するものであり、それらの出願は、それらの全体が本明細書に組み込まれる。
【0002】
政府の権利
本発明は、国立衛生研究所(National Institutes of Health)によって授与された契約第HG000205号の下、政府の支援を受けてなされた。政府は、本発明において特定の権利を有する。
【0003】
背景技術
多くの配列決定法、特に再配列決定法(すなわち、遺伝子座が再配列決定される方法)では、最初に標的が捕捉され、次いで配列決定される。いくつかの標的捕捉方法が開発され、ハイスループットな配列決定システムと統合されてきた。具体的には、標的DNAを捕捉するために、ビーズまたはマイクロアレイを使用したハイブリダイゼーションに基づくアッセイ、および分子反転プローブまたはゲノム環状化オリゴヌクレオチドを使用した溶液中の技法を適用することができる。次いで、捕捉されたDNAは、配列決定のために調製される。濃縮されたDNAサンプルを調製するために複雑な分子生物学プロトコルが用いられることが多く、場合によっては、配列決定用ライブラリーの生成は、多くの酵素反応、精製ステップ、およびゲル電気泳動によるサイズ選択を伴う。標的捕捉DNA配列のためのサンプル調製プロセスは、労働集約的であり得、その後のサンプル操作は、DNA含有量の偏りを引き起こし、配列決定の誤差率を増加させる可能性がある。
【発明の概要】
【0004】
核酸断片、例えば、RNAから作られたゲノム断片またはcDNAを捕捉および増幅するための方法を本明細書に提供する。本方法を実践するためのキットも提供される。特定の実施形態において、本方法は、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質を得ることであって、表面結合オリゴヌクレオチドの第1および第2の集団のメンバーは、基質上で空間的にアドレス指定されていないものであることと、b)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを、第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含む選択オリゴヌクレオチドとハイブリダイズさせることと、c)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させて、ゲノム配列に相補的な配列を含む支持体結合選択プライマーを生成することと、d)支持体結合選択プライマーを、ゲノム配列を含む核酸断片(例えば、ゲノム断片またはcDNA)とハイブリダイズさせることと、e)支持体結合選択プライマーを伸長させて、例えば、ゲノム内のゲノム配列に隣接する配列を含有する伸長産物を生成することと、f)例えば、表面結合オリゴヌクレオチドの第1および第2の集団の伸長されていないメンバーを使用したブリッジPCRによって、基質上で伸長産物を増幅して、PCR産物を生成することと、を含む。
【0005】
特定の実施形態において、本方法は、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質を得ることであって、表面結合オリゴヌクレオチドの第1および第2の集団は、基質上で空間的にアドレス指定されていないものであることと、b)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを、第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含む選択オリゴヌクレオチドとハイブリダイズさせることと、c)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させて、ゲノム配列に相補的な配列を含む支持体結合選択プライマーを生成することと、d)支持体結合選択プライマーを、ゲノム配列を含む核酸断片とハイブリダイズさせることと、e)支持体結合選択プライマーを伸長させて、例えば、ゲノム内のゲノム配列に隣接する配列を含有する伸長産物を生成することと、f)例えば、基質上でブリッジPCRを使用して伸長産物を増幅して、PCR産物を生成することと、を含む。
【0006】
本方法がどのように実行されるかに依存して、アダプターは、ハイブリダイゼーションの前にゲノム断片にライゲートされてもよいか、または支持体結合選択プライマーが伸長された後で伸長産物にライゲートされてもよい。遠位のアダプターは、表面結合オリゴヌクレオチド(それ自体が、表面結合オリゴヌクレオチドの第2の集団の鋳型伸長によって生成される伸長産物であってもよい)にハイブリダイズすることができ、それによってブリッジPCRを生じさせることができる。また、選択プライマーは、PCR産物を配列決定するために用いることができる配列決定プライマー結合部位を含有してもよい。
【0007】
前述の方法は、一般的に、基準遺伝子座の配列が使用可能であり、同じ遺伝子座が複数の試験サンプルにおいて再配列決定される、再配列決定法において使用される。この有用性において、選択オリゴヌクレオチドは、基質上のオリゴヌクレオチドおよび再配列決定される遺伝子座に隣接する領域とハイブリダイズするように設計される。遺伝子座は、基質上で捕捉され、次いで、配列決定の前に増幅される。例えば、単一の遺伝子座または複数の異なる遺伝子座(例えば、10、50、100、200、もしくは1,000まで、またはそれ以上の遺伝子座)が、1つの個体または複数の個体(例えば、10、50、100、200、もしくは1,000までまたはそれ以上の個体)からなるサンプルから捕捉されてもよい。
【0008】
特定の実施形態において、本方法は、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質を得ることであって、表面結合オリゴヌクレオチドの第1および第2の集団は、基質上にランダムに散在し、空間的にアドレス指定されていないものであることと、b)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを、第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含む選択オリゴヌクレオチドとハイブリダイズさせることと、c)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させて、ゲノム配列に相補的な配列を含む支持体結合選択プライマーを生成することと、d)支持体結合選択プライマーを、ゲノム配列を含むアダプターをライゲートした断片(例えば、アダプターをライゲートしたゲノム断片)とハイブリダイズさせることと、e)支持体結合選択プライマーを伸長させて、(例えば、ゲノム内の)ゲノム配列に隣接する配列と、アダプターをライゲートしたゲノム断片のアダプターの配列とを含有する産物を生成することと、f)ブリッジPCRを使用して産物を増幅して、PCR産物を生成することと、を含む。
【0009】
代替の実施形態において、本方法は、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質を得ることであって、表面結合オリゴヌクレオチドの第1および第2の集団は、基質上にランダムに散在し、空間的にアドレス指定されていないものであることと、b)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを、第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含む選択オリゴヌクレオチドとハイブリダイズさせることと、c)表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させて、ゲノム配列に相補的な配列を含む支持体結合選択プライマーを生成することと、e)支持体結合選択プライマーを伸長させて、ゲノム配列に隣接する配列を含有する産物を生成することと、f)産物上に二本鎖アダプターをライゲートして、アダプターで修飾された産物を生成することと、g)ブリッジPCRを使用してアダプターで修飾された産物を増幅して、PCR産物を生成することと、を含み得る。
【0010】
特定の場合において、本方法は、i.ゲノム断片を、配列決定プライマーのための部位および第2の表面結合オリゴヌクレオチドと同じヌクレオチド配列を含有するアダプターにライゲートすることと、ii.アダプターをライゲートしたゲノム断片を、表面結合オリゴヌクレオチドの第1の集団の第1のメンバーとハイブリダイズさせることと、ii.アダプターをライゲートした断片がハイブリダイズされた表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させることと、iv.伸長産物のアダプターを含有する末端を第2の支持体結合ポリヌクレオチドとハイブリダイズさせ、それによってブリッジを生成し、ブリッジPCRを促進することと、をさらに含んでもよい。
【図面の簡単な説明】
【0011】
以下の詳細な説明の特定の態様は、添付の図面とともに読むことで最良に理解される。一般的な実践において、図面の様々な特徴は、原寸に比例しないことが強調される。一方、様々な特徴の大きさは、明確にするために、任意に拡大または縮小される。図面に含まれるのは、以下の図である。
図1A-D】「OS−Seq」と称される主題の方法の一実施形態の全体図である。(a)OS−Seqは、Illumina社のNGSプラットフォームとシームレスに統合された標的再配列決定方法である。この方法には、標的特異的オリゴヌクレオチド、配列決定用ライブラリー、およびIllumina社のクラスター作製キットが必要である。標的の捕捉、処理、および配列決定は、NGSシステム上で行われる。各プライマー・プローブに由来するデータが標的化され、鎖特異的である。OS−Seq−366のカバレッジプロファイルの中央値をここに示す。(b)OS−Seqの処理は、ハイブリダイゼーション、DNAポリメラーゼ媒介による伸長、およびDNA変性の3つのステップを伴う。ステップ1:標的特異的オリゴヌクレオチドを使用してプライマー・プローブに対するフローセルプライマーを修飾する。Illumina社の配列決定システムでは、2種類のプライマー(CおよびDと称される)がペアエンドフローセル上に固定化される。OS−Seqでは、オリゴヌクレオチドの複雑なライブラリーを使用して、Dプライマーのサブセットがプライマー・プローブに対して修飾される。オリゴヌクレオチドは、D型フローセルプライマーとハイブリダイズする配列を有する。次いで、ハイブリダイズしたオリゴヌクレオチドをDNAポリメラーゼのための鋳型として使用してDプライマーを伸長させる。変性後、標的特異的プライマー・プローブをフローセル上でランダムに固定化する。ステップ2:プライマー・プローブを使用して、単一アダプターライブラリー内のゲノム標的を捕捉する。Illumina社の配列決定のためのサンプル調製は、ゲノムDNA断片への特異的DNAアダプターの付加を伴う。これらのアダプターには、配列決定プライマーおよび固定化フローセルプライマーのための部位が組み込まれている。OS−Seqでは、修飾されたアダプターを使用して、ゲノムDNAから単一アダプターライブラリーを調製する。単一アダプターライブラリー内の標的は、それらの相補的プライマー・プローブとの高温ハイブリダイゼーションの間に捕捉される。捕捉された単一アダプターライブラリー断片をDNAポリメラーゼのための鋳型として使用してプライマー・プローブを伸長させる。変性により、固定化された標的から鋳型DNAが放出される。ステップ3: 固定化された標的にIllumina社の配列決定法との互換性を持たせる。Illumina社の配列決定法では、CおよびDプライマーを使用した固定化された配列決定用ライブラリー断片の固相増幅が要求される。OS−Seqでは、低温ハイブリダイゼーションの間に、固定化された標的の単一アダプターのテールがフローセル表面上のC型プライマーとハイブリダイズし、ブリッジ構造を安定化させる。DNAポリメラーゼを使用して、固定化された標的の3’末端およびCプライマーを伸長させる。変性後には、完全なCおよびDプライミング部位を含有し、固相増幅との互換性を持つ、2つの相補的な固定化配列決定用ライブラリー断片が形成される。OS−Seqの3つのステップの後、固定化された標的は、Illumina社の標準ペアエンドライブラリーと構造的に同一であり、Illumina社の標準的なキットおよびプロトコルを使用して増幅および処理される。この方法の原則は、他の配列決定用プラットフォームにも利用できる。(c)OS−Seq−366アッセイからのKRAS遺伝子に沿ったカバレッジプロファイルを示す。エクソン1の開始点に対する塩基位置をX軸上に表し、KRASエクソンを示している。(d)カラム合成およびアレイ合成オリゴヌクレオチドのプライマー・プローブ収量の均一性評価。カラム合成オリゴヌクレオチド(青、n=366)とアレイ合成(赤、n=11,742)オリゴヌクレオチドとの間で捕捉の均一性を比較した。X軸上には、オリゴヌクレオチドが配列捕捉収量によってソートされ、Y軸上は正規化したプライマー・プローブ収量を示す。正規化した収量を算出するためには、各オリゴヌクレオチドの収量を全てのオリゴヌクレオチドからの収量中央値で除す。
図2】OS−Seqのための配列決定用ライブラリーの調製。ゲノムDNA断片化の一般的なスキームである、末端修復、A−テーリング、アダプターライゲーション、およびPCRをOS−Seqライブラリーの調製に用いた。
図3A-B】OS−Seqのための設計ストラテジー。(a)プライマー・プローブは、エクソンから10塩基目に配置したか、または(b)大きなエクソン内の500塩基ごとにタイリングした。
図4】OS−Seq オリゴヌクレオチドの作製。カラム合成により、直ちにアッセイに使用できる大量の成熟101−mer OS−Seqオリゴヌクレオチドを生じさせた。マイクロアレイ合成を適用して高含量オリゴヌクレオチドプールを作製した。オリゴヌクレオチド内に追加配列を組み込んだプライマーを使用して前駆体オリゴヌクレオチドを増幅した。ウラシル除去を適用してOS−seqオリゴヌクレオチドのコード鎖から増幅プライマー部位を切断した。
図5A-C】OS−Seqにおけるオリゴヌクレオチド構成要素の構造。(a) 成熟101−mer OS−Seqオリゴヌクレオチドは、標的特異的部位、ならびに配列決定プライマー 2およびフローセルプライマー「D」をコードする配列を含有していた。(b)OS−Seqオリゴヌクレオチドの5’末端にウラシルが組み込まれ、かつ配列決定のためのさらなる活性部位が組み込まれたプライマーを使用して、マイクロアレイ合成を行ったオリゴヌクレオチドを増幅した。(c)OS−Seqのためのアダプターは、A−テールを有するゲノム断片への粘着末端ライゲーションのためにT−オーバーハングを含有していた。さらに、dsDNAアダプター内にはインデックス配列、およびフローセルプライマー「C」部位が存在した。
図6】OS−Seqデータ内で見られるインサートサイズ分布の説明。ゲノムDNAの断片化により、200〜2kbの断片が生成される。配列決定用ライブラリーの調製により、断片の末端に共通のアダプターが付加される。PCR増幅により、断片サイズ分布がさらに歪められる。標的部位は、単一アダプターライブラリー断片内にランダムに分布する。ライブラリー断片をフローセル上で固定化し、プライマー・プローブとアダプターの間の距離によってゲノムDNAインサートのサイズを特定する。ブリッジPCRを適用して、固定化された標的DNAを増幅する(概して、固相PCRは、より短い断片を優先的に増幅する)。クラスターの増幅および処理後に、2つの部位を使用して固定化された断片を配列決定する。リード1はゲノムDNAから生じ、リード2は合成プライマー・プローブに由来する。リード1を使用してOS−SeqデータからゲノムDNA配列を評価する。
図7A-B】OS−Seqの再現性。(a)OS−Seqの技術的再現性。OS−Seqを使用して2つの同一ライブラリーを分析した。個々のプライマー・プローブの配列決定収量を技術的複製間で比較した。(b)OS−Seqの生物学的再現性。インデックスアダプターを使用して2つの異なるゲノムDNAライブラリーを調製した。同じOS−Seq実験においてライブラリーを分析した。図中、2つの独立した生物学的複製間でプライマー・プローブの特異的捕捉収量を比較している。
図8A-B】GC含量が標的収量に与える影響。プライマー・プローブの効率におけるGC含量の影響を分析するために、各標的特異的プライマー・プローブ配列のGC含量を決定した。不良(0個の標的を補足した)プライマー・プローブを分類した。不良プライマー・プローブの比率を異なるCG含量パーセントのカテゴリー間で比較した。X軸は、ソートしたCGカテゴリーのパーセンテージを表し、Y軸は、各GC含有カテゴリー内の不良プライマー・プローブの比率である。
図9A-B】OS−Seqの処理ワークフローとショットガンライブラリー作成方法の比較。
【発明を実施するための形態】
【0012】
定義
本明細書で特に定義されない限り、本明細書に使用される全ての技術および科学的用語は、本発明が属する技術の当業者に一般に理解されるのと同様の意味を持つ。本明細書に説明されるものと類似、または同等のあらゆる方法および材料は、本発明の実践または試験において使用され得るが、好ましい方法および材料を説明する。
【0013】
本明細書において言及される全ての特許および刊行物(そのような特許および刊行物に開示される全ての配列を含む)は、参照により本明細書に明示的に組み込まれる。
【0014】
数値範囲は、範囲を定義する数値を含む。別途指定のない限り、それぞれ、核酸は、左から右に5’から3’方向に記載され、アミノ酸配列は、左から右にアミノからカルボキシ方向に記載される。
【0015】
本明細書に提供される見出しは、本発明の種々の態様または実施形態を限定するものではない。したがって、下記に定義される用語は、本明細書を全体として参照することによってより完全に定義される。
【0016】
別途定義されない限り、本明細書において使用される全ての技術用語および科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有するものとする。Singleton,et al.,DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York(1994)、およびHale&Markham,THE HARPER COLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)は、本明細書において使用される用語の多くの一般的な意味を当業者に提供する。さらに、明確性のため、および参照しやすいように、特定の用語を以下に定義する。
【0017】
本明細書で使用される場合の「サンプル」という用語は、必ずしもというわけではないが典型的には液体形態の、1つ以上の対象となる分析物を含有する材料または材料の混合物に関連する。本明細書において使用される核酸サンプルは、それらが配列を含有する複数の異なる分子を含有するという点において複雑であり得る。哺乳動物(例えば、マウスまたはヒト)由来のmRNAから作製される断片化されたゲノムDNAおよびcDNAは、複雑なサンプルの種類である。複雑なサンプルは、10、10、10、または10より多くの異なる核酸分子を有し得る。DNA標的は、ゲノムDNA、cDNA(RNA由来)、または人工DNA構築物等の任意の源から生じてもよい。核酸を含有する任意のサンプル、例えば、組織培養細胞から作製されたゲノムDNA、組織のサンプル、またはFPETサンプルが、本明細書において用いられ得る。
【0018】
「ヌクレオチド」という用語は、既知のプリン塩基およびピリジン塩基のみならず、修飾された他の複素環塩基も含有する部分を含むことが企図される。そのような修飾は、メチル化されたプリンまたはピリミジン、アシル化されたプリンまたはピリミジン、アルキル化されたリボースまたは他の複素環を含む。さらに、「ヌクレオチド」という用語は、ハプテンまたは蛍光標識を含有し、従来のリボース糖およびデオキシリボース糖だけでなく他の糖類も同様に含有し得る部分を含む。修飾ヌクレオシドまたは修飾ヌクレオチドは、例えば、ヒドロキシル基の1つ以上がハロゲン原子または脂肪族基で置換され、エーテル、アミン等として官能基化される、糖部分上の修飾も含む。
【0019】
「核酸」および「ポリヌクレオチド」という用語は、ヌクレオチド、例えば、デオキシリボヌクレオチドまたはリボヌクレオチドからなる、任意の長さ、例えば約2塩基超、約10塩基超、約100塩基超、約500塩基超、1000塩基超、約10,000塩基まで、またはそれ以上の長さのポリマーについて説明するために本明細書において交換可能に使用され、酵素的にまたは合成的に生成することができ(例えば、米国特許第5,948,902号およびその中で引用される参考文献に記載されるようなPNA)、2つの天然に発生する核酸のハイブリダイゼーションと同様の配列特異的な様式で天然に発生する核酸とハイブリダイズすることができ、例えば、ワトソン・クリック塩基対形成相互作用に関与することができる。天然に発生するヌクレオチドは、グアニン、シトシン、アデニン、およびチミン(それぞれ、G、C、A、およびT)を含む。
【0020】
「核酸サンプル」という用語は、本明細書で使用される場合、核酸を含有するサンプルを表す。
【0021】
「標的ポリヌクレオチド」という用語は、本明細書で使用される場合、研究中の対象となるポリヌクレオチドを指す。特定の実施形態において、標的ポリヌクレオチドは、対象となり、かつ研究中である1つ以上の配列を含有する。
【0022】
本明細書で使用される場合の「オリゴヌクレオチド」という用語は、約2〜200ヌクレオチド長、500ヌクレオチド長までのヌクレオチドの一本鎖多量体を表す。オリゴヌクレオチドは、合成によるものであってもよいか、または酵素的に作製されてもよく、いくつかの実施形態において、30〜150ヌクレオチド長である。オリゴヌクレオチドは、リボヌクレオチド単量体(すなわち、オリゴリボヌクレオチドであってもよい)またはデオキシリボヌクレオチド単量体を含有してもよい。オリゴヌクレオチドは、例えば、10〜20、11〜30、31〜40、41〜50、51−60、61〜70、71〜80、80〜100、100〜150、または150〜200ヌクレオチド長であってもよい。
【0023】
「ハイブリダイゼーション」という用語は、当該技術分野で既知であるように、核酸の鎖が塩基対合によって相補鎖に結合するプロセスを指す。2つの配列が、中程度から高いストリンジェンシーのハイブリダイゼーション条件および洗浄条件下で互いに特異的にハイブリダイズする場合、核酸は、参照核酸配列に対して「選択的にハイブリダイズ可能」であると考えられる。中程度から高いストリンジェンシーのハイブリダイゼーション条件は、既知である(例えば、Ausubel,et al.,Short Protocols in Molecular Biology,3rd ed.,Wiley &Sons 1995およびSambrook et al.,Molecular Cloning:A Laboratory Manual,Third Edition,2001 Cold Spring Harbor,N.Y.を参照のこと)。高ストリンジェンシー条件の一例は、50%ホルムアミド、5×SSC、5×デンハルト溶液、0.5%SDS、および100ug/ml変性キャリアDNA中、約42℃でのハイブリダイゼーション、それに続く2×SSCおよび0.5%SDS中、室温での2回の洗浄、ならびに0.1×SSCおよび0.5%SDS中、42℃でのさらなる2回の洗浄を含む。
【0024】
「二重鎖」または「二重鎖の」という用語は、本明細書で使用される場合、塩基対合した、すなわち、一緒にハイブリダイズした、2つの相補的なポリヌクレオチドを説明する。
【0025】
本明細書で使用される場合の「増幅する」という用語は、標的核酸を鋳型として使用して標的核酸の1つ以上のコピーを作製することを指す。
【0026】
「決定する」、「測定する」、「評価する(evaluating)」、「評価する(assessing)」、「アッセイする」、および「分析する」という用語は、任意の形態の測定を指して本明細書において交換可能に使用され、ある要素が存在するかどうかを決定することを含む。これらの用語は、定量的決定および/または定性的決定の両方を含む。評価は、相対的または絶対的であってもよい。「〜の存在を評価する」は、存在する何かの量を決定すること、およびそれが存在するかしないかを決定することを含む。
【0027】
「使用する」という用語は、その従来の意味を有し、そのため、目的を達成するために方法または組成物を用いること、例えば、使用可能にすることを意味する。例えば、ファイルを作成するためにプログラムが使用される場合、ファイルを作成するためにプログラムが実行され、該ファイルは、通常、プログラムの出力である。別の例において、コンピュータファイルが使用される場合、目的を達成するために、コンピュータファイルがアクセスされ、読み取られ、ファイルに格納された情報が利用される。同様に、特有の識別子、例えば、バーコードが使用される場合、例えば、特有の識別子と関連付けられたオブジェクトまたはファイルを特定するために特有の識別子が読み取られる。
【0028】
本明細書で使用される場合、「T」という用語は、二重鎖の半分がハイブリダイズされた状態に留まり、二重鎖の半分が一本鎖へと解離する、オリゴヌクレオチド二重鎖の溶融温度を指す。オリゴヌクレオチド二重鎖のTは、経験的に決定されてもよいか、または以下の式を用いて予測されてもよい:T=81.5+16.6(log10[Na])+0.41(画分G+C)?(60/N)、式中、Nは鎖の長さであり、[Na]は1M未満である。Sambrook and Russell(2001;Molecular Cloning:A Laboratory Manual,3rd ed.,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,ch.10)を参照のこと。オリゴヌクレオチド二重鎖のTを予測するための他の式が存在し、ある式は、所与の条件または条件のセットに大体適切であり得る。
【0029】
「溶液中に遊離する」という用語は、本明細書で使用される場合、別の分子に結合または係留されていないポリヌクレオチド等の分子を説明する。
【0030】
「変性させる」という用語は、本明細書で使用される場合、核酸二重鎖が2つの一本鎖に分離することを指す。
【0031】
「ゲノム配列」という用語は、本明細書で使用される場合、ゲノム中に生じる配列を指す。RNAはゲノムから転写されるため、この用語は、生物の核ゲノム中に存在する配列、およびそのようなゲノムから転写されたRNA(例えば、mRNA)のcDNAコピーに存在する配列も包含する。
【0032】
「ゲノム断片」という用語は、本明細書で使用される場合、例えば、ヒト、サル、ラット、魚もしくは昆虫、または植物のゲノム等の、動物または植物のゲノムの領域を指す。ゲノム断片は、アダプターがライゲートされていてもまたはいなくてもよい。ゲノム断片は、アダプターがライゲートされていてもよいか(その場合、分子の少なくとも5’末端に、断片の一末端または両末端にライゲートされたアダプターを有する)、またはアダプターがライゲートされていなくてもよい。
【0033】
特定の場合において、本明細書に記載される方法において使用されるオリゴヌクレオチドは、参照ゲノム領域、すなわち、既知のヌクレオチド配列のゲノム領域、例えばNCBIのGenbankデータベースまたは他のデータベースなどにその配列が登録されている染色体領域を使用して設計されてもよい。そのようなオリゴヌクレオチドは、試験ゲノムを含有するサンプルを使用するアッセイに用いられてもよく、テストゲノムは、オリゴヌクレオチドのための結合部位を含有する。
【0034】
「ライゲートする」という用語は、本明細書で使用される場合、第1のDNA分子の5’末端の末端ヌクレオチドが、第2のDNA分子の3’末端の末端ヌクレオチドに酵素的に触媒されて結合することを指す。
【0035】
「アダプター」という用語は、二本鎖および一本鎖の分子を指す。
【0036】
「複数」は、少なくとも2つのメンバーを含む。特定の場合において、複数は、少なくとも10、少なくとも100、少なくとも100、少なくとも10,000、少なくとも100,000、少なくとも10、少なくとも10、少なくとも10、または少なくとも10、またはそれ以上のメンバーを有してもよい。
【0037】
2つの核酸が「相補的」である場合、核酸のうちの一方の各塩基が他方の核酸中の対応するヌクレオチドと塩基対合する。「相補的」および「完全に相補的」という用語は、本明細書において同義的に使用される。
【0038】
「プライマー結合部位」は、プライマーが、オリゴヌクレオチドまたはその相補鎖中でハイブリダイズする部位を指す。
【0039】
「分離する」という用語は、本明細書で使用される場合、2つの要素の物理的分離(例えば、サイズまたは親和性による等)、および一方の要素が分解され、他方が未変化のまま残ることを指す。
【0040】
「配列決定」という用語は、本明細書で使用される場合、ポリヌクレオチドの少なくとも10個の連続するヌクレオチドの同一性(例えば、少なくとも20個、少なくとも50個、少なくとも100個、もしくは少なくとも200個、またはそれ以上の連続するヌクレオチドの同一性)が得られる方法を指す。
【0041】
空間的にアドレス指定されていないオリゴヌクレオチドの表面結合集団を含有する基質の文脈において、「空間的にアドレス指定されていない」という用語は、互いに特定の順序または位置にない、すなわち、互いにランダムな位置にあるかまたはランダムに散在する異なるオリゴヌクレオチド分子を含有する表面を含む基質を指す。そのような基質は、平面状である必要はなく、特定の場合においてビーズの形態であってもよい。空間的にまたは光学的にアドレス指定された単一オリゴヌクレオチドの集団を含有する基質(例えば、マイクロアレイおよびコードされたビーズ等)は、この定義によって除外される。表面結合オリゴヌクレオチドの第1および第2の集団が空間的にアドレス指定されていない、表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質は、基質全体にランダムに分布された異なるオリゴヌクレオチドの少なくとも2つの集団を含有する基質を指す。基質は、例えば、平面状またはビーズの形態であってもよい。
【0042】
「アダプターをライゲートした」という用語は、本明細書で使用される場合、アダプターにライゲートされた核酸を指す。アダプターは、核酸分子の5’末端または3’末端にライゲートすることができる。
【0043】
「伸長する」という用語は、本明細書で使用される場合、ポリメラーゼを使用したヌクレオチドの付加によるプライマーの伸長を指す。核酸にアニールされたプライマーが伸長されると、核酸が伸長反応のための鋳型としての役割を果たす。
【0044】
「ブリッジPCR」という用語は、固相ポリメラーゼ連鎖反応を指し、反応中に伸長されるプライマーがそれらの5’末端によって基質に係留される。増幅中、係留されたプライマー間に増幅産物がブリッジを形成する。ブリッジPCR(また「クラスターPCR」と称されてもよい)は、Illumina社のSolexaプラットフォームにおいて使用される。ブリッジPCRおよびIllumina社のSolexaプラットフォームは、様々な刊行物、例えば、Gudmundsson et al(Nat.Genet.2009 41:1122−6)、Out et al(Hum.Mutat.2009 30:1703−12)、およびTurner(Nat.Methods 2009 6:315−6)、米国特許第7,115,400号、ならびに出願公開番号US20080160580号およびUS20080286795号に一般的に記載される。
【0045】
「バーコード配列」という用語は、本明細書で使用される場合、反応におけるポリヌクレオチドの源を同定および/または追跡するために使用される特有のヌクレオチドの配列を指す。バーコード配列は、オリゴヌクレオチドの5′末端または3’末端にあり得る。バーコード配列は、サイズおよび組成において大きく異なってもよく、以下の参考文献は、特定の実施形態に適切なバーコード配列のセットを選択するための目安を提供する:Brenner,米国特許第5,635,400号、Brenner et al,Proc.Natl.Acad.Sci.,97:1665−1670(2000)、Shoemaker et al,Nature Genetics,14:450−456(1996)、Morris et al,欧州特許公開第0799897A1号、Wallace,米国特許第5,981,179号等。特定の実施形態において、バーコード配列は、4〜36ヌクレオチド、または6〜30ヌクレオチド、または8〜20ヌクレオチドの範囲の長さを有し得る。
【0046】
本明細書を通して他の用語の定義が記載される可能性がある。
【0047】
本発明の例示的実施形態の詳細な説明
主題の方法の特定の特徴を、断片の基質へのハイブリダイゼーション前にアダプターが断片にライゲートされる実施形態を例示する図1を参照して説明する。代替の実施形態において、アダプターは、プロトコルの後半に加えられてもよい。本方法は、概して、互いに空間的に散在する異なる配列の少なくとも2つの表面結合オリゴヌクレオチドを含有する基質を得ることを含む。そのような基質は、現在のところIllumina社のSolexa配列決定技術に用いられており、様々な参考文献、例えば、米国特許第7,115,400号、ならびに公開番号第US20080160580号および第US20080286795号に記載される(これらは、そのような開示のために、参照により組み込まれる)。以下に記載する実施形態のうちのいくつかは、ゲノムの断片を単離するための方法の使用について説明し得る。これらの実施形態は、他の種類の配列、例えば、cDNAまたは合成DNAに、容易に適合させることができる。
【0048】
特定の実施形態において、表面結合オリゴヌクレオチドの第1の集団の第1のメンバーが、a)配列決定プライマー部位を第1のメンバーおよび領域とハイブリダイズする領域、ならびにb)標的ゲノム配列を含有する領域を含有する選択オリゴヌクレオチドとハイブリダイズされる。第1の集団の十分な数のオリゴヌクレオチドが選択オリゴヌクレオチドとハイブリダイズされていない状態を保ち、プロトコルの後半で行われるブリッジPCRステップに使用されるべく利用可能であるように、このステップで使用される選択オリゴヌクレオチドの量を最適化することができる。表面結合オリゴヌクレオチドの第1の集団の第1のメンバーは、標的ゲノム配列に相補的な配列を含有する支持体結合選択プライマーを含有する二重鎖を生成するために伸長される。伸長された支持体結合選択プライマーを残すために、選択オリゴヌクレオチドが変性によって除去される。次いで、伸長された支持体結合選択プライマーを、標的ゲノム配列、標的ゲノム配列に隣接する配列、および鎖の一方または両方の5’末端にアダプター配列を含有する、アダプターをライゲートしたゲノム断片(化学的に、物理的に、または酵素を使用してゲノムDNAを断片化し、次いで、得られた断片の末端にアダプターをライゲートすることによって作製することができる)とハイブリダイズさせる。ゲノム内のゲノム配列に隣接する配列と、アダプターをライゲートしたゲノム断片のアダプターの配列とを含有する産物を生成するために、支持体結合選択プライマーを伸長させる。
【0049】
いくつかの実施形態において、アダプターをライゲートしたゲノム断片のアダプターを、表面結合オリゴヌクレオチドの第2の集団とハイブリダイズさせてもよい。しかしながら、特定の場合において、増幅前に、表面結合オリゴヌクレオチドの第2の集団が、a)第2のメンバーとハイブリダイズする領域およびアダプター配列を含有する含有する領域を含有する修飾オリゴヌクレオチドにハイブリダイズされてもよい。このステップで使用される修飾オリゴヌクレオチドの量は、十分な数の産物分子がハイブリダイズするように最適化することができる。表面結合オリゴヌクレオチドの第2の集団の第2のメンバーは、アダプター配列に相補的な配列を含有する支持体結合アダプタープライマーを含有する二重鎖を生成するために伸長されてもよい。支持体結合アダプタープライマーを残すために、修飾オリゴヌクレオチドが変性によって除去される。次いで、ブリッジPCRによって産物を増幅することができる。
【0050】
図1bに例示するように、PCR産物を生成するために、第1の伸長されていない表面結合オリゴヌクレオチドおよび第2の表面結合オリゴヌクレオチドによって産物を増幅する。特定の場合において、ゲノム断片は、5’末端アダプターを含むアダプターをライゲートしたゲノム断片である。これらの場合、表面結合オリゴヌクレオチドの第2の集団のメンバーが、アダプターの補体とハイブリダイズする。代替の実施形態において、アダプターが伸長産物上にライゲートされてもよく、それによって表面結合オリゴヌクレオチドの第2の集団とハイブリダイズするアダプターを伸長産物の3’末端上に配置する。他の実施形態において、a)表面結合オリゴヌクレオチドの第1の集団の伸長されていないメンバーと、b)i.表面結合オリゴヌクレオチドの第2の集団のメンバーを、表面結合オリゴヌクレオチドの第2の集団のメンバーとハイブリダイズする領域およびアダプターに相補的な領域を含むオリゴヌクレオチドとハイブリダイズさせること、ならびにii.伸長産物の5’末端とハイブリダイズする支持体結合プライマーを生成するために、表面結合オリゴヌクレオチドの第2の集団のメンバーを伸長させることによって作製される支持体結合プライマーと、を使用して増幅が行われる。
【0051】
いくつかの実施形態において、ゲノム断片は、5’末端アダプターを含むアダプターをライゲートしたゲノム断片であり、伸長することによって、その3’末端上に、アダプターに相補的な配列を含む伸長産物を生成し、表面結合オリゴヌクレオチドの第2の集団のメンバーは、ブリッジPCRの間にアダプターに相補的な配列とハイブリダイズする。この実施形態において、5’末端アダプターは、ゲノム断片にライゲートされた末端に配列決定プライマーのための結合部位を含む。
【0052】
他の実施形態において、本方法は、ステップe)とf)の間に、伸長産物の3’末端上にアダプターをライゲートすることを含み、表面結合オリゴヌクレオチドの第2の集団のメンバーは、ブリッジPCRの間にアダプターとハイブリダイズする。これらの実施形態において、アダプターは、ゲノム断片にライゲートされた末端に配列決定プライマーのための結合部位を含む。
【0053】
いくつかの実施形態において、表面結合オリゴヌクレオチドの第2の集団は、i.表面結合オリゴヌクレオチドの最初の第2の集団のメンバーを、表面結合オリゴヌクレオチドの第2の集団のメンバーとハイブリダイズする領域およびゲノム断片の配列に相補的な領域を含むオリゴヌクレオチドとハイブリダイズさせることと、ii.表面結合オリゴヌクレオチドの第2の集団を生成するために、表面結合オリゴヌクレオチドの最初の第2の集団のメンバーを伸長させることによって作製される。
【0054】
いくつかの実施形態において、前記表面結合オリゴヌクレオチドの第2の集団を生成するために、表面結合オリゴヌクレオチドの第2の集団が、前記核酸断片の配列に相補的な領域を含むオリゴヌクレオチドを、表面結合オリゴヌクレオチドの最初の第2の集団にライゲートすることによって作製されてもよい。このライゲーションは、ライゲートされた2つのオリゴヌクレオチド間にブリッジを形成するスプリントオリゴヌクレオチドによって促進され得る。換言すると、修飾オリゴヌクレオチドは、支持体結合アダプタープライマーを作製するために、ブリッジを形成するオリゴヌクレオチドを使用して元となる固体支持体オリゴヌクレオチドの修飾を誘導する、ライゲーションに基づくプロセスによって導入されてもよい。同様に、支持体結合アダプタープライマーは、標的修飾に必要なプライマー伸長を作製するための同様のブリッジを形成するオリゴヌクレオチドを使用して作製することができる。
【0055】
いくつかの場合において、選択オリゴヌクレオチドは、前記第1のメンバーとハイブリダイズする前記領域と前記ゲノム配列を含有する前記領域との間に、配列決定プライマーのための結合部位を含む。
【0056】
いくつかの実施形態において、本方法は、ゲノム配列に隣接する配列のヌクレオチド配列の少なくとも一部を得るために、PCR産物の第1の鎖を配列決定することをさらに含んでもよい。この方法は、ゲノム配列に隣接する配列のヌクレオチド配列の少なくとも一部を得るために、PCR産物の第2の鎖を配列決定することをさらに含んでもよい。
【0057】
特定の実施形態において、本発明は、断片化されたゲノムを生成するために哺乳動物のゲノムを断片化することと、任意で、断片化されたゲノムにアダプターを付加すること、および断片化されたゲノムを基質に適用することとを含んでもよい。断片化は、物理的に、化学的に、または制限酵素を使用して行われる。断片化は、例えば、超音波処理または剪断によって行われる。
【0058】
特定の場合において、複数の異なる個体から複数の断片化されたゲノムを調製し、複数の断片化されたゲノムをプールしてプールを生成し、断片化されたゲノムのプールを基質に適用し、異なる個体のゲノム配列に隣接する配列を含むPCR産物を得ることによって、ハイブリッド形成が行われてもよい。これらの実施形態は、異なる個体のゲノム配列に隣接する配列のヌクレオチド配列の少なくとも一部を得るために、PCR産物の少なくとも第1の鎖を配列決定することをさらに含んでもよい。特定の場合において、プールする前に、異なるアダプターが、異なる個体からの断片化されたゲノムにライゲートされ、アダプターは、PCR産物が配列決定された後に、アダプターをライゲートしたゲノム断片の源が同定されることを可能にするバーコード配列を含む。
【0059】
いくつかの実施形態において、本方法は、第1の産物を生成するために、第1のバーコード配列を含む第1のアダプターを使用して、第1の対象からの断片化されたゲノムDNAにアダプターをライゲートすることと、第2の産物を生成するために、第2のバーコード配列を含む第2のアダプターを使用して、第2の対象からの断片化されたゲノムDNAにアダプターをライゲートすることと、混合鋳型を生成するために第1および第2の産物を組み合わせることと、各々がバーコード配列を含有する第1および第2のPCR産物を提供するために、混合鋳型を使用して請求項1に記載の方法を行うこととを含む。混合鋳型は、いくつかの場合において、少なくとも1,000の対象からの断片化されたゲノムDNAを含んでもよい。
【0060】
いくつかの実施形態において、本方法は、i.ゲノム断片を、配列決定プライマーのための部位および第2の表面結合オリゴヌクレオチドと同じヌクレオチド配列を含有するアダプターにライゲートすることと、ii.アダプターをライゲートしたゲノム断片を、表面結合オリゴヌクレオチドの第1の集団の第1のメンバーとハイブリダイズさせることと、iii.アダプターをライゲートした断片がハイブリダイズされた表面結合オリゴヌクレオチドの第1の集団の第1のメンバーを伸長させることと、iv.伸長産物のアダプターを含有する末端を第2の支持体結合ポリヌクレオチドとハイブリダイズさせ、それによってブリッジを生成し、ブリッジPCRを促進することと、を含んでもよい。
【0061】
また、システムも提供される。特定の場合において、システムは、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質であって、表面結合オリゴヌクレオチドの第1および第2の集団は、基質上で空間的にアドレス指定されていない、基質と、b)第1の集団の第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含有する選択オリゴヌクレオチドと、c)アダプターと、e)請求項1に記載に記載の方法を行うための指示と、を備えてもよい。標的ゲノム配列に隣接する配列のヌクレオチド配列の少なくとも一部を得るために、例えば、Illumina社のSolexaプラットフォーム、または別の固相配列決定法を使用して、PCR産物を配列決定してもよい。
【0062】
特定の実施形態において、本方法は、標的ゲノム配列に隣接する配列の源を可能にするバーコード配列を用いることができる。これらの実施形態において、アダプターをライゲートしたゲノム断片のアダプターは、PCR産物が配列決定された後に、アダプターをライゲートしたゲノム断片の源が同定されることを可能にするバーコード配列を含有してもよい。特定の実施形態において、この方法は、第1の産物を生成するために、第1のバーコード配列を含む第1のアダプターを使用して、第1の対象(対象は、第1の対象のプールに含まれてもよい)からの断片化されたゲノムDNAにアダプターをライゲートすることと、第2の産物を生成するために、第2のバーコード配列を含む第2のアダプターを使用して、第2の対象(対象は、第2の対象のプールに含まれてもよい)からの断片化されたゲノムDNAにアダプターをライゲートすることと、混合鋳型を生成するために第1および第2の産物を組み合わせることと、各々がバーコード配列を含有する第1および第2のPCR産物を提供するために、混合鋳型を使用して前述の方法を行うこととを含む。上記方法において、使用されるアダプターは、同じ配列を有し、かつ表面結合オリゴヌクレオチドとハイブリダイズする部分と、バーコード配列を含有する異なるヌクレオチド配列を有する部分とを有する。
【0063】
選択された配列を増幅する第2の方法が提供される。この方法の原則は、前述の方法の原則と同様であるが、但し、a)支持体結合選択プライマーとハイブリダイズされるゲノム断片はアダプターにライゲートされておらず、b)アダプターは、支持体結合選択プライマーが伸長された後である。アダプターライゲーション、産物は、前述のようにブリッジPCR反応に用いられてもよい。前述の代替の実施形態におけるように、a)表面結合オリゴヌクレオチドの第1の集団の伸長されていないメンバーと、b)i.表面結合オリゴヌクレオチドの第2の集団のメンバーを、表面結合オリゴヌクレオチドの第2の集団のメンバーとハイブリダイズする領域およびアダプターの配列に相補的な領域を含むオリゴヌクレオチドとハイブリダイズさせること、ならびにii.支持体結合プライマーを生成するために表面結合オリゴヌクレオチドの第2の集団のメンバーを伸長させることによって作製される支持体結合プライマーと、を使用して増幅が行われる。前述の方法と同様に、ゲノム配列に隣接する配列のヌクレオチド配列の少なくとも一部を得るために、PCR産物が配列決定されてもよい。
【0064】
代替の実施形態において、ゲノム断片は、配列決定プライマー結合部位だけではなく、表面結合オリゴヌクレオチドの第2の集団と同じ配列も含有するアダプターにライゲートされてもよい。示されるように、伸長された表面結合オリゴヌクレオチドの第1の集団(通常、高温で、すなわち、少なくとも90℃で行われる)を、アダプターをライゲートした断片とハイブリダイズさせて伸長させると、伸長産物は、表面結合オリゴヌクレオチドの第2の集団(通常、低温で、例えば、60℃未満、例えば、55℃未満で行われる)とハイブリダイズする配列を含有し、それによって第1および第2の表面結合オリゴヌクレオチドを使用してゲノム断片の増幅を促進する。この方法を図14に例示する。
【0065】
特定の実施形態において、第1の集団のオリゴヌクレオチドは、基質に適用される選択オリゴヌクレオチドの量に対して少なくとも5X、10X、20X、50X、または100X、500X、1,000X、2000X、10,000X、50,000Xモル過剰で存在する。一実施形態において、モル過剰は、5X〜50,000Xモル過剰、例えば、100X〜5,000Xモル過剰の範囲内であってもよい。
【0066】
特定の実施形態において、基質は、各々が、表面結合オリゴヌクレオチドの第1の集団のメンバーとハイブリダイズする領域(領域は、異なる選択オリゴヌクレオチドにおいて同じヌクレオチド配列を有する)およびゲノム配列を含有する領域を含む、複数の異なる選択オリゴヌクレオチドと接触してもよい。選択オリゴヌクレオチドの各々のゲノム配列が異なるため、基質上でいくつかのゲノム領域を捕捉、増幅、および配列決定することができる。
【0067】
キット
前述のように主題の方法を実践するためのキットも本開示によって提供される。特定の実施形態において、主題のキットは、a)表面結合オリゴヌクレオチドの第1の集団および表面結合オリゴヌクレオチドの第2の集団を含む基質であって、表面結合オリゴヌクレオチドの第1および第2の集団は、基質上で空間的にアドレス指定されていない、基質と、b)第1の集団の第1のメンバーとハイブリダイズする領域およびゲノム配列を含有する領域を含有する選択オリゴヌクレオチドと、を備えてもよい。またキットは、本方法において用いられてもよい前述および後述の他の試薬、例えば、アダプター、リガーゼ、ハイブリダイゼーションバッファー等を含んでもよい。
【0068】
前述の構成要素に加えて、標題のキットは、典型的には、主題の方法を実践するためにキットの構成要素を使用するための指示をさらに含む。主題の方法を実践するための指示は、通常、好適な記録媒体上に記録される。例えば、指示は、紙またはプラスチック等の基板上に印刷されてもよい。そのため、指示は、キットの容器またはその構成要素等の表示内に添付文書として(すなわち、パッケージングまたはサブパッケージングに関連付けられて)キット内に存在してもよい。他の実施形態において、指示は、例えば、CD−ROM、ディスケット等の好適なコンピュータ可読記憶媒体上に存在する電子記憶データファイルとして存在する。さらに他の実施形態において、実際の指示はキット内に存在せず、例えば、インターネットを介して、遠隔ソースから指示を得るための手段が提供される。この実施例の一例は、指示を閲覧することができるおよび/またはそこから指示をダウンロードすることができるウェブアドレスを含むキットである。指示と同様に、この指示を得るための手段が、好適な基板上に記録される。他の必要な構成要素は、シーケンサー上に既に実装された従来のプログラムに対する変更を実施するための関連するコンピュータプログラムおよび/またはコンピュータスクリプトを含む。
【0069】
指示に加えて、キットは、1つ以上の対照分析物混合物、例えば、キットをテストする際に使用するための2つ以上の対照分析物も含むことができる。
【0070】
本発明をさらに例示するために、以下の特定の例が、本発明を例示するために提供されるのであって、決してその範囲を限定するものであると見なされるべきではないという理解とともに提供される。
【0071】
全ての図、例、詳細な説明、およびオリゴヌクレオチド配列を含む、2010年9月24日に出願された米国仮特許出願第61/386,390号および2011年5月11日に出願された第61/485,062号の開示は、それらの全体が本明細書に組み込まれる。
【実施例】
【0072】
標的DNAの配列決定を行うための新規アプローチを以下に提示する。本方法は、標的DNA捕捉デバイスとしての役割を果たすように、固相支持体上で汎用プライマー叢(lawn)(すなわち、ランダムに分布された少なくとも2つのプライマーを含有する)を修飾し、サンプルを大幅に操作することなく、捕捉されたDNAの直接的な配列決定を可能にすることに基づく。本方法は、関連する流体プラットフォームを用いて、標的DNAの捕捉と配列決定実験のシームレスな統合を可能にする。このアプローチは、その配列決定の可能性を維持しながら、固相支持体上でDNA捕捉基質としての役割を果たす普遍的プライマーを使用する。本方法は、配列決定のための鋳型として未処理の天然DNAを使用することができる。この方法を使用した配列決定は、必ずしも研究施設に依存するわけではない。さらに、サンプル処理の間に導入されるあらゆるバイアスが回避され、他の方法と比較してより少ない時間および低コストで実質的により小さなサンプルを分析することができる。本方法は、一本鎖および二本鎖の鋳型を分析するために使用することができる。一本鎖DNA鋳型を分析する能力は、病理学アーカイブからのホルマリン固定パラフィン包埋サンプルを使用するいくつかの配列決定用途にとって重要であり得る。同様に、一本鎖DNA鋳型による配列決定を可能にすることにより、本方法は、複雑な核酸抽出ステップ、およびDNAの二本鎖編成を保存するように設計された高価な断片化機器を必要としない。むしろ、廉価かつ効率的な溶解および加熱による断片化によってサンプルを調製することができる。単純な捕捉・配列決定アッセイは、ヒトゲノムDNAに限定されず、細菌およびウイルスのDNAおよびRNA等の他の核酸基質も分析することができる。トランスクリプトーム、非翻訳領域、およびmiRNAも、捕捉および配列決定することができる。また、ヌクレオチド配列の捕捉および配列決定、他の遺伝子特性およびエピジェネティックな特性(DNAメチル化、大きなゲノムの再編成、および遺伝子発現等)も調べることができる。本方法は、集団から合成DNAを選択するためにも用いることができる。
【0073】
一般的に、配列決定は、DNAサンプルが、配列決定システム上での分析を促進するように構造的に修飾されるプロセスとして見なされてきた。以下に記載する方法は、配列決定システムを修飾するため、サンプルを修飾して大規模に調製する必要がない。合成DNAを使用して汎用プライマーを官能基化することにより、未処理サンプルの標的遺伝子のオリゴヌクレオチドライブラリーを直接的にアッセイすることができる。非特異的捕捉を減少させるために、ブリッジ構造の形成において用いられる配列を提供する特異的DNA構成要素を経時的に導入すると、プライマー自体が修飾される。あらゆる種類のシーケンサーのための配列決定用ライブラリーの調製は、特異的二本鎖アダプター配列をDNA鋳型に付加することに依存する。捕捉オリゴヌクレオチドが固体支持体上に固定化されたアダプターとしての役割を果たしたため、アッセイのためのライブラリーの調製は、単一アダプターの付加を必要とするだけであった。これによって、サンプル処理が実質的に短縮され、クローン増幅またはゲル電気泳動に基づくサイズ分別が不要となる。特定の場合において、固体支持体上で捕捉された鋳型に第2のアダプターが付加されてもよい。本方法の特定の実施形態は、配列決定用の鋳型としての粗DNAの使用を可能にする。
【0074】
ハイスループットな再配列決定を行うためのいくつかの現在の方法は、標的DNAを捕捉することおよび配列決定することを別個の方法として含む。これは、特定の場合において、以下を含む複数の問題を引き起こす可能性がある:i)大幅な労働集約的および時間集約的なDNA材料の操作、ii)複雑な実験プロトコルに伴う誤差、iii)選択および分子増幅プロセスによって生じるバイアス、ならびにiv)大量の出発材料の必要性。以下に記載する方法は、事前のサンプル操作をほとんどまたは全く伴わず、完全に自動化可能であり、拡張性が高いため、これらの問題のうちの多くの源を排除すると考えられる。
【0075】
概念実証として、アッセイは再現性があり、ゲノムの特異的領域を捕捉および配列決定するために使用することができることを示すために、ヒトゲノム中の10個の癌遺伝子の全てのエクソンが配列決定された。このアッセイ技術は、Illumina社のGenome Analyzerを用いて証明したが、このアプローチは、固相支持体を使用するいずれのシーケンサーにも広く適用可能であることに留意されたい。
【0076】
以下に記載する方法(それらの原則のうちのいくつかを図1に例示する)は、任意の標的DNA配列を効率的に捕捉するために使用することができ、捕捉されたゲノム断片の直接的な配列決定を可能にする。単純な加熱による断片化ステップによってゲノムDNAサンプルを配列決定のために調製することができ、アッセイ全体を完全に自動化して固体支持体上で行うことが可能である。捕捉およびその後の反応は、流体システムによって媒介することができる。
【0077】
追加の実施形態は、断片化DNAを鋳型として使用すること、および流体システムを使用して、捕捉されたDNA断片に配列決定アダプターを付加することにより、固体支持体上での配列決定のためにDNA断片の調製を可能にする方法を提供する。概念実証として、Illumina社の次世代DNAシーケンサーを使用してこれらのアプローチを開発した。プライマーの修飾およびヒトゲノム中の366ヶ所の標的部位を使用した、統合された捕捉および配列決定調製反応の結果を提示する。25分間の加熱による断片化を除いて、全てのステップをIllumina社のフローセルの固相支持体上で行うことができる。
【0078】
以下に記載するデータは、アッセイのロバスト性、ならびに捕捉基質としての普遍的プライマーおよび流体システムの適用性を証明するものである。本方法がロバストに作用することを可能にする、プライマーの修飾の特有のパラメータを同定した。複雑な真核生物のゲノムに加えて、本方法は、真菌および他の微生物のゲノム、ウイルスのDNAおよびRNA、異なる源のトランスクリプトーム、ならびに合成DNAを捕捉するためにも適用できる。さらに、流体システムの固体支持体上に固定化された未変性のプライマーを「プログラミング」して、特異的な用途を実行するという概念を導入して立証した。
【0079】
材料および方法
ゲノムDNAサンプル Coriell InstituteからNA18507のゲノムDNAを得た。結腸直腸癌患者から新鮮な冷凍組織サンプルを得た。Stanford Cancer Centerからインフォームドコンセントとともに患者材料を得、試験はStanford University School of Medicineの治験審査委員会(IRB)によって承認された。冷凍組織片を調製し、ヘマトキシリン・エオシン染色を行い、病理学的検査により各サンプルの腫瘍組成を決定した。細胞組成がそれぞれ90%腫瘍であるかまたは純粋に正常である領域から腫瘍組織および正常組織を代表するサンプルを切除した。E.Z.N.A SQ DNA/RNA Protein Kit(Omega Bio−Tek、Norcross,GA)を使用してゲノムDNAを抽出した。SNP6.0アレイ(Affymetrix、Santa Clara,CA)を使用してサンプルを分析するために、DNAの調製、アレイハイブリダイゼーション、および走査のための標準プロトコルを使用した。Genotyping ConsoleソフトウェアおよびBirdseed V2アルゴリズム(Affymetrix)を使用してデータ分析を行った。SNPコールの品質を評価するために、試験サンプルと合わせて13個の追加のマイクロアレイデータセットを分析した。P値の閾値0.01を用いてSNP6.0アレイデータをフィルタリングした。
【0080】
標的選択およびコンピュータによるOS−Seqオリゴヌクレオチドの設計 CCDS Build Release 20090902、NCBIのヒトゲノムBuild37hg19、およびdbSNP Build ID131を多型参照データセットとして使用した。遺伝子選択のために、GeneRankerアノテーションデータベースを使用して、重要性によって優先順位をつけた344個の癌遺伝子を選択した。オリゴヌクレオチドの標的特異的配列を検索するために、候補遺伝子のためのエクソンの定義をCCDSから採択した。標的エクソン(500bp未満)のほとんどにおいて、40−mer標的特異的配列が、エクソン境界の5’末端の10塩基外側にあった(図3a)。個々のプライマー・プローブを使用してエクソンの両方の鎖を標的とした。OS−Seq−366は、エクソンの隣接領域のみを覆っていた。OS−Seq−11kアッセイにおいて、エクソン領域全体が覆われるまで標的特異的配列をタイリングすることにより、500bpよりも大きいエクソンを処理した(図3b)。OS−Seq−11kのオンターゲット特異性を向上させるために、Repbaseを使用して反復性の高い配列を標的とするオリゴヌクレオチド配列を同定し、排除した。
【0081】
オリゴヌクレオチドの合成 オリゴヌクレオチドの合成には2つのストラテジーを適用した。OS−Seq−366の場合、366個の101−merオリゴヌクレオチドを設計し(図5a)、次いでカラム合成を行った(Stanford Genome Technology Center、Stanford,CA)(図4a)。オリゴヌクレオチドを定量化し、等モル濃度でプールした。OS−Seq−11kの場合、インサイツのマイクロアレイ合成(LC Sciences、Houston)アプローチを使用して、11,742個の前駆体オリゴヌクレオチドを合成した(図5b)。標的特異的オリゴヌクレオチドの配列を下の表2に示す。
【0082】
マイクロアレイ合成を行ったオリゴヌクレオチドの増幅 前駆体80−merオリゴヌクレオチドの3つの25μlサブプールを使用した(587、638、および415nM)(図5b)。PCRアプローチを用いて前駆体である低濃度オリゴヌクレオチドを増幅した(図4b)。アレイ合成オリゴヌクレオチドのサブプールを10fM/オリゴに希釈し、PCR増幅のための鋳型として使用した。標準的な反応条件でTaq DNAポリメラーゼ(NEB)およびdNTP(1mM dATP、1mM dCTP、1mM cGTP、500nM dTTP、および500nM dUTP)を使用してPCRを行った。95℃で30分間変性させた後、20回の増幅サイクル(95℃で30秒、55℃で30秒、68℃で30秒)を行った。増幅プライマー1は、3’末端にウラシルを含有し、増幅プライマー2には追加の機能配列を組み込んだ(図5b)。増幅したオリゴヌクレオチドを精製して余分なプライマーを除去し(Fermentas)、次いで、0.1U/μlのUracil−DNA Excision Mix(Epicentre、Madison,WI)を使用して37℃で45分間処理して普遍的増幅プライマー部位を剥離し、オリゴヌクレオチドの成熟101−merコード鎖を切断した。プライマー・プローブ固定化の間に標的特異的部位を正確に伸長させるために、オリゴヌクレオチドの5’末端は、機能的であり、かつ遊離していなければならない。熱ショックによる酵素の不活性化(65℃、10分)の後、オリゴヌクレオチド調製物を精製した(Fermentas)。最後に、3つのオリゴヌクレオチドのサブプールを定量化し、各サブプールが等モル濃度の単一プールを作製した。
【0083】
フローセルプライマーの修飾によるOS−Seqプライマー・プローブの合成 Illumina社のGenome Analyzer IIx(Illumina、San Diego)システムにおいて、固相支持体(すなわち、フローセル)は、ポリアクリルアミド層上に極めて高密度でランダムに固定化された2つのプライマー(「C」および「D」)を有する。OS−Seq実験のために、Illumina社のCluster Stationを使用して「D」プライマーのサブセットを特異的に修飾した。NGSプライマー修飾の前に、133nMオリゴヌクレオチドのプールを95℃で5分間熱変性させた。熱ショック(95℃で5分間)を用いてOS−Seqオリゴヌクレオチドのコード鎖を遊離させた。第2の鎖はフローセル上で不活性であり、ハイブリダイゼーション後に洗浄されたため、さらなる鎖の精製は必要なかった。変性オリゴヌクレオチドを4xハイブリダイゼーションバッファー(20xSSC、0.2%Tween−20)で希釈した。得られた100nMオリゴヌクレオチドをフローセル修飾実験に使用した。30μlのオリゴヌクレオチド混合物をフローセルの各レーンに分注した。温度勾配(18分間で96℃から40℃)の間に、オリゴヌクレオチドは、固定化プライマー「D」に特異的にアニールした。次いで、アニールしたオリゴヌクレオチドを鋳型として「D」プライマーを伸長させるためにDNAポリメラーゼを使用した。伸長後、元のオリゴヌクレオチド鋳型を伸長させた「D」プライマーから変性させ、固相支持体から洗浄した。伸長、洗浄、および変性ステップには標準的なIllumina社のv4試薬を使用した。プライマー「D」の修飾によって、プライマー・プローブの固定化がもたらされた。
【0084】
配列決定用ライブラリーの調製 OS−Seq配列決定用ライブラリーの調製において用いられるゲノムDNA断片化、末端修復、A−テーリング、アダプターライゲーション、およびPCRの概略的スキームを図2に要約する。NA18507からのゲノムDNA1μgおよび瞬間冷凍した直腸結腸癌サンプルを出発材料として使用した。Covaris E210R(Covaris、Woburn,MA)を使用してゲノムDNAを断片化し、平均断片サイズ500bpを得た(デューティサイクル5%、強度3、200サイクル/バースト、および80秒)。0.25UのKlenow Large Fragment(New England Biolabs、Ipswich,MA)、7.5UのT4 DNAポリメラーゼ(NEB)、400μMの各dNTP(NEB)、25UのT4ポリヌクレオチドキナーゼ(NEB)、およびATP(NEB)を含むT4 DNAリガーゼバッファーを50μlの反応体積で45分間室温で使用して、ランダムに断片化したDNAを末端修復した。末端修復後、3.2UのTaq DNAポリメラーゼ(NEB)、100μM dATP(Invitrogen)、および1.5mM MgCl2を含むTaqバッファーを80ulの反応で15分間72℃で使用して、鋳型DNAの3’末端にアデニンを付加した。アダプターライゲーションの前に、PCR Purification Kit(Fermentas)を使用して反応物を精製した。
【0085】
OS−Seqのためのインデックスシステムを開発した。配列決定用ライブラリーアダプターは、任意選択的な6塩基インデックス配列、配列決定プライマー1部位、およびプライマー「C」のハイブリダイゼーションのための12−mer配列を含有する(上の表2、図5c)。設計した16個のインデックスアダプターを設計した。Stanford Genome Technology Centerでアダプターオリゴヌクレオチドを合成した。ライゲーションの前に、温度勾配が下降する間にアダプターオリゴヌクレオチドをアニールした。NA18507の標的再配列決定のために、「AACCTG」タグを有するシングルプレックス用アダプターおよびマルチプレックス用アダプターの両方を使用した。マッチする正常・腫瘍サンプルをインデックスするために、正常組織には「TGCTAA」バーコードを使用し、腫瘍サンプルは「AGGTCA」でタグ化した。2,000UのT4 DNAリガーゼ(NEB)およびT4 DNAリガーゼバッファーを室温で1時間使用して、T−オーバーハングを有する二本鎖DNAアダプターをA−テーリングした鋳型にライゲートした。アダプターライゲーションの後、PCR Purification Kit(Fermentas)を使用して反応物を精製し、PCRを使用してライブラリーを増幅した。1UのPhusion Hot Start DNA Polymerase(Finnzymes、Finland)、1μMライブラリー増幅プライマー(付録の表1)、Phusion HFバッファー、および200μMの各dNTP(NEB)の50ulの反応物を調製した。反応物を98℃で30秒間変性させた。その後、22回のPCRサイクルを行い(98℃で10秒、65℃で30秒、および72℃で30秒)、続いて、72℃で7分および4℃で行った。その後、PCR Purification Kit(Fermentas)を使用してPCR反応物を精製し、定量化した。マルチプレックス化したライブラリーを等しい濃度でプールした。
【0086】
プライマー・プローブを使用した標的の捕捉 OS−Seqプライマー・プローブを使用してフローセル上で標的を捕捉した(図1bおよび下のオリゴヌクレオチド配列)。30ulのゲノム配列決定用ライブラリー(30〜42ng/ul)をフローセルに注入した。配列決定用ライブラリーをフローセル内で65℃で20時間インキュベートすることによって、標的DNAをプライマー・プローブとハイブリダイズさせた。ゲノムDNAライブラリーのハイブリダイゼーションおよびその後の伸長の間、フローセルを65℃で一定に保った。Illumina社のCluster Stationを使用してプライマー・プローブのハイブリダイゼーションおよび伸長ステップを実行した。プライマー・プローブへのハイブリダイゼーションの前に、22.5μlの配列決定用ライブラリー(40〜56.6ng/μl)を95℃で5分間変性させた。熱ショックの後、4xハイブリダイゼーションバッファーを使用してゲノムDNAライブラリーを合計体積30μlに希釈した。配列決定用ライブラリーの最終DNA濃度は、30〜41.7ng/μlの範囲であった。配列決定用ライブラリーの濃度が高いことに起因して、ハイブリダイゼーション体積は最小限に保たれた。したがって、再現性のある低体積のハイブリダイゼーションを可能にするために、専用のCluster Stationプログラムを開発した。Illumina社のv4試薬を使用して以下の伸長、洗浄、および変性ステップを行った。
【0087】
フローセル処理および配列決定 標的の捕捉後、フローセルの温度を30分間40℃まで下げ、捕捉されたゲノムDNAライブラリー断片の3’末端にある12塩基をプライマー「C」とハイブリダイズさせた(図1bおよび下のオリゴヌクレオチド配列)。ブリッジ形成において、DNAポリメラーゼを使用してライブラリー断片およびプライマー「C」を伸長させ、捕捉されたDNA断片を完成させ、複製した。その後、ブリッジPCRを実行し、クローン的に増幅された配列決定用クラスターを作製した。標準版の4つの配列決定試薬およびレシピ(Illumina)を使用して、Illumina社のGenome Analyzer IIx上で40×40(OS−Seq−366)または60×60(OS−Seq−11k)のペアエンドサイクルを用いてサンプルを配列決定した。SCS2.8およびRTA2.8ソフトウェア(Illumina)を使用して画像解析およびベースコールを行った。
【0088】
配列解析およびバリアントの検出 Burrows−Wheeler Aligner(BWA)19を使用して、配列リードをヒトゲノム版のNCBIのHuman Genome Build 37−hg19とアラインした。アライメント後、オンターゲットのリード(リード1)は、プライマー・プローブの5’末端の1kb以内にあると定義された。オフターゲットのリードは、プライマー・プローブの5’末端の1kb外側にアライメントするとして、または関連付けられたプライマー・プローブの位置から異なる染色体上のマッピングとして定義される。インデックスしたレーンの逆多重化のために、perlスクリプトを使用して、ベースコールファイルを使用する7塩基タグのインデックスを作成した。このインデックスファイルおよび別のperlスクリプトを使用して、組み合わせたベースコールファイル(更なる処理のための別個のfastqファイルを作成できるように)またはアラインされたファイルのいずれかを逆多重化した。
【0089】
バリアントコールのためのあらゆる合成プライマー・プローブ配列を排除するために、メートペア上のインサートのサイズによるフィルタリングを適用した。インサートのサイズは、対になった配列リードのアライメントを比較することによって決定した。バリアントコールために、抽出された配列は、[40+リード1の長さ]よりも大きなインサートサイズを有する必要があった。インサートのサイズによるフィルタリング後、SAMtoolsおよびBCFtoolsを使用してバリアントコールを行った。マッピング品質閾値50でSAMtools mpileupを使用して、ヒトゲノム(hg19)に対する配列のpileupを行った。BCFtools viewを使用して塩基位置の遺伝子型を決定し、SAMtoolsパッケージ内に提供されるバリアントフィルタperlスクリプトvcfutils.plを使用してデータをフィルタリングした。vcfutils varFilterの条件は、i)10以上のカバレッジ、ii)鎖バイアスフィルタの除去(OS−Seqは、鎖特異的捕捉法であるため)、iii)スクリプトに基準位置および非基準位置の両方を出力するよう強制することである。基準コールおよび非基準コールをAffymetrix SNP6.0アレイデータとの比較に用いた。遺伝子型を決定した位置をフィルタリングし、50を超えるPhred様品質スコアを得た。BEDtools intersectBedを使用して、各プライマー・プローブの標的領域、およびプローブがそれらの標的内で重複する組み合わせを定義した。
【0090】
バリアントの比較 抽出したバリアントの品質評価のために、NA18507データのバリアントコールを、完全ゲノム配列解析から同定されたバリアントのコールおよびHapmap遺伝子型決定データ(www.hapmap.org)と比較した。perlスクリプトを使用してOS−SeqデータとAffymetrix SNP 6.0アレイデータの比較を行った。SNPのアノテーションにはdbSNP131を使用した。

さらなるオリゴヌクレオチド配列
0) オリゴヌクレオチド
OS−Seqオリゴヌクレオチド:
5’−NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAGACCGATCTCGTATGCCGTCTTCTGCTTG−3’(汎用捕捉オリゴヌクレオチド、N=特有の40−mer配列、配列番号37)
Ad_top_FC_capture_A_tail:
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’(配列番号38)
Ad_bot_FC_capture_A_tail:
5’−GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(配列番号39)
フローセルプライマー「C」:
5’−PS−TTTTTTTTTTAATGATACGGCGACCACCGAGAUCTACAC−3’(U=2−デオキシウリジン)(配列番号40)
フローセルプライマー「D」:
5’−PS−TTTTTTTTTTCAAGCAGAAGACGGCATACGAGoxoAT−3’, (Goxo=8−オキソグアニン) (配列番号41)
配列決定プライマー1:
5’−ACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’(配列番号42)
配列決定プライマー2:
5’−CGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT−3’(配列番号43)

1) フローセルの修飾
アニール
3’ −GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−5’(OS−Seqオリゴヌクレオチド)(配列番号44)
FC−CAAGCAGAAGACGGCATACGAGAT−3’(フローセルプライマー「D」)(配列番号45)
伸長
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−5’(OS−Seqオリゴヌクレオチド)(配列番号46)
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’(プライマー・プローブ)(配列番号47)
変性
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’(プライマー・プローブ)(配列番号48)

2)ライブラリーの調製
断片化、末端修復
5’−NNNNNNNNNNNNNNNNNNNNNN−3’(ゲノムDNA)
3’−NNNNNNNNNNNNNNNNNNNNNN−5’(ゲノムDNA)
A−テーリング
5’−NNNNNNNNNNNNNNNNNNNNNNA−3’(A−テーリング後のゲノムDNA)
3’−ANNNNNNNNNNNNNNNNNNNNNN−5’(A−テーリング後のゲノムDNA)
アダプターライゲーション
OS−Seq dsアダプター
5’−GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (Ad_bot_FC_capture_A_tail) (配列番号49)
3’−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (Ad_top_FC_capture_A_tail) (配列番号50)
OS−Seq dsAdライブラリー(これはOS−Seq−アダプターライブラリーの構造である, N=断片化によって定義されるランダムなゲノムDNA配列)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(配列番号51)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(配列番号52)

ライブラリーPCR
OS−Seqアダプターライブラリー増幅(Ad_top_FC_capture_A_tail、単一プライマーPCRを使用してアダプターライブラリーを増幅する)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’
(Ad_top_FC_capture_A_tail) (配列番号53)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (OS−Seqライブラリー断片)(配列番号54)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (OS−Seqライブラリー断片)(配列番号55)
3’−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (Ad_top_FC_capture_A_tail) (配列番号56)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(増幅したOS−Seqライブラリー断片) (配列番号57)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号58)

3)捕捉
アニール
OS−Seqアダプターライブラリーのアニーリング(N=40−mer特異的捕捉部位)
3’− GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAgenomicdna (配列番号59)
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号60)
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’ (プライマー・プローブ)(配列番号61)
伸長
OS−Seq捕捉
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAgenomicdna (配列番号62)
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号63)
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(捕捉されたDNA) (配列番号64)
変性
OS−Seqライブラリー
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(捕捉されたDNA) (配列番号65)

4)アダプターの完成
40Cでのハイブリダイゼーション
OS−Seq_ライブラリー(OS−SeqアダプターとOligo−Cの間には12−merの相同性が存在する)
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (捕捉されたDNA)(配列番号66)
3’ −CACATCTAGAGCCACCAGCGGCATAGTAA−FC (オリゴ「C」)(配列番号67)
伸長
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(完成したDNA) (配列番号68)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号69)
変性
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(完成したDNA) (配列番号70)
3’ −GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号71)

5) クラスターの作製
アニール
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’ (完成したDNA) (配列番号72)
3’−CACATCTAGAGCCACCAGCGGCATAGTAA−FC (オリゴ「C」)(配列番号73)
FC−CAAGCAGAAGACGGCATACGAGAT−3’ (配列番号74)
(オリゴ「D」)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号75)
伸長
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’ (完成したDNA) (配列番号76)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC(完成したDNA) (配列番号77)
変性
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(クラスター化されたDNA)(配列番号78)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC(クラスター化されたDNA)(配列番号79)

6)配列決定
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(クラスター化されたDNA)(配列番号80)
3’− <−−−−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACA−5’(配列決定プライマー1)(配列番号81)
5’− CGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT−−−−> (配列決定プライマー 2) (配列番号82)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (クラスター化されたDNA) (配列番号83)
【0091】
結果
この項では、標的再配列決定アプローチに見られる限界の多くを解決する、オリゴヌクレオチド選択的配列決定(OS−Seq)と称される標的再配列決定のための新規アプローチについて記載する。他の方法とは概念的に異なり、OS−Seqは、ゲノム標的の捕捉と配列決定の両方がIllumina社のフローセル等の(図1a)NGS固相支持体上で行われる統合化アプローチである。OS−Seqの調製のために、ゲノムDNAから単一アダプター配列決定用ライブラリーを調製し、標的特異的オリゴヌクレオチドを合成してフローセル上のプライマー・プローブを構築するために使用する。次いで、フローセル上の固定化プライマー・プローブを使用して、単一アダプターゲノムDNAライブラリーから単一分子標的を捕捉する。
【0092】
OS−Seqの処理は3つのステップを伴う:Illumina社の配列決定システムを、標的特異的プライマー・プローブを含むように修飾し、単一アダプターライブラリーから標的を捕捉し、固定化された断片を配列決定のために完成させる(図1b)。捕捉基質を調製するために、既存のプライマーのサブセットを標的特異的プライマー・プローブになるように修飾することにより、Illumina社のフローセルを分子的に再設計する。これらのプライマー・プローブを作製するために、オリゴヌクレオチドの複雑なプールの3’普遍的配列をフローセル上でその補体とハイブリダイズさせ、DNAポリメラーゼ伸長反応を使用して固定化プライマーを伸長させる。ランダムに配置された標的特異的プライマー・プローブのセットが得られ、フローセル表面上に固定される。65℃の高温インキュベーションの間に、プライマー・プローブは、単一アダプターゲノムDNAライブラリー内の標的相補的配列に特異的にハイブリダイズする:ハイブリダイゼーション後、次いで、プライマー・プローブは、別のDNAポリメラーゼ伸長反応のためのプライマーとして機能する。伸長ステップは、標的配列を効率的に捕捉する。伸長後、変性ステップを行い、次いで、40℃の低温ハイブリダイゼーションにより配列決定用ライブラリーアダプターをフローセル上でその補体に安定化させ、ブリッジ構造を作製する。第3のDNAポリメラーゼ伸長反応により、3’末端に追加の配列を組み込み、固相増幅が可能な2つの分子を作製する。OS−Seqに特異的な3つのステップの後、捕捉された分子をブリッジ増幅し、処理し、Illumina社のNGSシステムからの標準的な配列決定プロトコルを使用して配列決定する。OS−Seqにおける分子生物学的ステップの詳細な説明は、上記に示され、Illumina社のOS−Seq用Cluster Stationプログラムはそれに応じて変更される。
【0093】
原理の実証の証拠として、2つの捕捉アッセイを開発した。最初に、10個の癌遺伝子のエクソンに隣接する366個のOS−Seqプライマー・プローブ(OS−Seq−366)を設計した(図3)。このアッセイは、OS−Seqの方法をテストすることを企図するものであって、決定的なエクソンカバレッジをテストすることを企図するものではなかった。カラムに基づく方法を使用してOS−Seq−366オリゴヌクレオチドを合成した。次に、拡張性を証明するために、344個の癌遺伝子のエクソンを捕捉するための11,742個のプライマー・プローブを設計および合成した(OS−Seq−11k)。これらのプライマー・プローブは、エクソンカバレッジの向上のために、反復を避けて大きなエクソンにわたってタイリングした。OS−Seq−11kのハイスループットな産生のために、プログラム可能なマイクロアレイ上でオリゴヌクレオチドを合成した。これらのアレイ合成オリゴヌクレオチドは、処理のためおよびOS−Seqに十分な材料を得るために増幅を必要とする(図4)。処理後、OS−Seqオリゴヌクレオチドは、標的領域の5’末端に相補的な標的特異的40−merを含有する(図5)。また、これらのオリゴヌクレオチドは、ペアエンド配列決定プライマーのアニーリングおよびフローセル上の固定化プライマーへのハイブリダイゼーションに必要な配列を含有する。
【0094】
OS−Seq−366およびOS−Seq11kアッセイの捕捉性能を評価するために、以前に配列決定されたヨルバ人の個体由来のDNAを調製した(NA18507)。全ての標的アッセイに対してペアエンド配列決定を行った。第1のリード(リード1)は標的ゲノムDNAに由来し、第2のリード(リード2)は合成標的特異的プライマー・プローブに由来する(図1a)。GAIIxでの実行において、単一レーン上でOS−Seq−366を実行した。我々のインデックススキームに基づいて、OS−Seq−11kの各サンプルを1.3レーンの均等物上で実行した。サンプルをタグ化するために、特有のバーコード配列(図5c)を有するアダプターを使用してインデックススキームを開発した。バーコードは、リード1の最初の7個の塩基に由来する。全体で、適切なバーコードを含有するOS−Seq−366リードの87.6%およびOS−Seq−11kリードの91.3%をヒトゲノム基準にマッピングした(表1)。それと比較して、以前に報告されたハイブリッド選択方法を使用して得られたリードの58%をヒトゲノム基準にマッピングすることができた。
【表1】
【0095】
各プライマー・プローブの全体的なカバレッジを評価するために、プライマー・プローブの3’末端から1kb以内に属するリード1のデータに由来するリードの数を決定した。OS−Seqプライマー・プローブは、鎖特異的であり、DNA標的の5’末端のみを捕捉する(図6)。一例として、OS−Seq−366における全てのプライマー・プローブのカバレッジプロファイルの中央値(図1a)は、プライマー・プローブから1kb下流までどのように配列が捕捉されるかを例示している。概して、より小さいインサートのサイズに向かってバイアスが検出され、OS−Seq−366では、標的リードの50%がプライマー・プローブから283塩基以内にマッピングされた。両方のアッセイにおいて、1kb間隔を超えるリードおよび1.7kbまで離れた追加のリードを同定した。1kbを超える配列リードは、任意の所与のプライマー・プローブからの捕捉分布の末端を表し、OS−Seq−366およびOS−Seq−11kの両方とも全体の配列データの0.15%未満であった。また、カバレッジ分布の特徴は、ライブラリー作製の間に導入された断片サイズと相関しており、ブリッジ形成および固相PCRに固有のサイズの制約によるものであることも観察された(図6)。また、より高いモル濃度の単一アダプターライブラリーを導入すること、追加のレーンを配列決定すること、またはより長いリードを使用することにより、標的に沿ったカバレッジを増加させることができる。
【0096】
オンターゲットのリードは、プライマー・プローブの1kb以内にマッピングするリード1配列であると定義された。これらのオンターゲットカバレッジ基準を用いると、OS−Seq−366内の40塩基リードの86.9%およびOS−Seq−11k内の53塩基リードの93.3%がオンターゲットであった(表1)。コンピュータによるプライマー・プローブの設計を改良しようとする試みを考慮すると、OS−Seq−11kは特異性の向上を示した。具体的には、OS−Seq−11kのコンピュータによるプライマー・プローブ選択には、反復マスキングフィルタが使用され、より少ないオフターゲットのリードをもたらす結果となった。比較すると、公開されたハイブリッド選択方法において、76塩基リードの89%および36塩基リードの50%がプローブの近位にマッピングされ、方法間での同様のオンターゲット特異性が示唆され、より長いリードに向かって移動するようにそれを傾斜させることにより、OS−Seqのオンターゲット特異性を向上させることができる。OS−Seqのエクソン上での特異性も、公開されたハイブリッド選択方法と同様であった。OS−Seq−11Kを使用して、リードの42.7%がエクソン内にマッピングされたことが観察され(表1)、ハイブリッド選択捕捉技術では、エクソンにマッピングされたのはリードの42%であると報告された。
【0097】
典型的な遺伝子カバレッジプロファイルの一例として、KRAS遺伝子に関する捕捉配列データを図1cに示す。エクソン標的は、オフターゲット隣接領域と比較して高い倍数のカバレッジで配列決定される。以前に述べたように、OS−Seq−366は、エクソンに隣接するように設計されており、より大きな領域にわたってタイリングされていない。エクソンの平均倍数カバレッジを表1に、カバレッジクラスの詳細な内訳(すなわち、10X、20X)を表2に示す。全体として、OS−Seq−366内のエクソン塩基の83.9%が少なくとも1つのリードでカバーされており、残りの部分は、このパイロットアッセイでは意図的に標的としなかった。同様に、OS−Seq−11kで分析した3つのサンプル間では、エクソン塩基の94〜95.6%が少なくとも1つのリードでカバーされた。OS−Seq−366の設計に優るプライマー・プローブの設計の改善により、具体的には、OS−Seq−11kの設計は、500塩基よりも大きなエクソンにわたってプライマー・プローブをタイリングしたことにより、OS−Seq−366と比較して、OS−Seq−11kアッセイは、エクソン上での配列カバレッジの増加を示した
【0098】
リード1のデータをその関連付けられたプライマー・プローブによりビニングし、その標的とアラインするリードを数えることによって、アッセイの標的選択均一性についても評価した。観察された捕捉収率に基づいてOS−Seqプライマー・プローブをソートし、OS−Seq−366およびOS−Seq−11k内の分布を図1dにオーバーレイ方式で表した。OS−Seq−366では、プライマー・プローブの100%が1つの配列リードの最少収量を有し、プライマー・プローブの89.6%の収量が10倍の範囲内であったことが観察された観察された。同様に、OS−Seq−11kの場合、プライマー・プローブの95.7%が1つの配列リードの最少収量を有し、プライマー・プローブの54%が10倍の範囲内に収率を有していた。OS−Seq−366オリゴヌクレオチドをカラム合成し、プーリング前に別々に定量化することで、プライマー・プローブ構築ステップにおいて各標的特異的配列が確実に等モル濃度になるようにした。OS−Seq−11kのプライマー・プローブ収量におけるより高い分散は、プライマー・プローブ作製のために使用されたマイクロアレイ合成オリゴヌクレオチドのPCRの間に導入された増幅バイアスによる可能性が最も高い。
【0099】
OS−Seq−11kアッセイからの個々のプライマー・プローブの配列収量を比較することにより、OS−Seqの技術的再現性を評価した(図7)。マルチプレックスライブラリー(NA18507、正常および腫瘍)をプールし、2つの独立したIllumina社のGAIIxのレーン上で捕捉および配列決定を行った。各個々のプライマー・プローブの配列収量を技術的複製間で比較し、相関係数を算出した:R=0.986。生物学的再現性の評価では、2つの異なるマルチプレックス配列決定用ライブラリーを同じレーン内で実行した。生物学的複製の相関係数は、R=0.90であった。OS−Seqの高い再現性は、NGSシステムを使用した固有の自動化、単一の反応体積で捕捉および配列決定ステップを行う能力、ならびに捕捉後にPCRを適用しなくてもよいことに関連する可能性が高い。
【0100】
OS−Seq−366およびOS−Seq−11kアッセイのバリアントコーリング性能を評価するために、完全ゲノム配列決定分析を受けたヨルバ人の個体NA18507について標的配列決定分析を行った。いずれかのOS−Seqアッセイを用いたSNVコーリングのために、遺伝子型品質スコアが50を超え、最低10Xカバレッジのオンターゲット位置のみを分析した(表1)。OS−Seq−366およびOS−Seq−11kデータでは、合計でそれぞれ191kbおよび1,541kbがこれらの基準を満たした。これらの高品質な標的位置から、OS−Seq−336から105個のSNV、OS−Seq−11kから985個のSNVをコールした(表1)。公開されたNA18507のSNV、およびこれらの同じ高品質領域で生じることが報告された他のSNPを抽出した。比較すると、OS−Seq−366の97%およびOS−Seq−11kの95.7%が、以前に報告されていた(表1)。OS−Seq−366およびOS−Seq−11kについて、バリアント検出の感度は、報告されたSNPに基づいて、それぞれ0.97および0.95であった(下の表3)。
【表3】
【0101】
OS−Seq−11kの分析を、マッチする正常‐直腸結腸癌ペアに由来するゲノムDNAにも適用した。NA18507の分析と同じ品質基準およびカバレッジ基準を用いて、正常サンプルから同定された871個のSNVを同定し、腫瘍から727個を同定した(表4)。比較のために、Affymetrix SNP 6.0アレイを用いて2つのサンプルの遺伝子型を決定した。以前の分析によれば、Affymetrix SNP 6.0アレイおよびBirdseedアルゴリズムを使用した遺伝子型決定の正確性は高く、SNPの良好な平均コール率は99.47%であり、コールされたSNPは、他のプラットフォームからのHapMap遺伝子型と99.74%の一致を有する。OS−Seq SNVをAffymetrix SNPと比較すると、正常サンプルで99.8%、腫瘍サンプルで99.5%の高い一致が観察された。正常組織バリアントをフィルタリングし、カバレッジが40よりも大きい新規癌特異的バリアントを考慮することにより、SMAD4(S144*)の明らかな病原性ナンセンス変位を同定および確認した。この遺伝子は、直腸結腸癌において頻繁に突然変異することが多い、大腸癌ドライバー遺伝子である。
【表4】
【0102】
OS−Seq−366およびOS−Seq−11kアッセイにおける個々のプライマー・プローブの捕捉効率を調べ、各プライマー・プローブの性能を評価した。OS−Seqの特有の特徴は、ペアエンドを用いて配列決定した場合に、捕捉されたゲノム配列をそれらのプライマー・プローブとマッチさせることができることである。リード1は、捕捉された標的の3’末端に由来し、リード2はOS−Seqプライマー・プローブ合成配列から始まる。よって、リード1は、常に捕捉されたゲノムDNA配列を表し、リード2は、個別のプライマー・プローブのための分子バーコードとして機能的役割を果たす。これにより、標的化を媒介した正確なOS−Seqプライマー・プローブの同定が可能となり、個別のプライマー・プローブの性能の評価を促進する。例えば、プライマー・プローブのGC含量と標的配列の収量との間に強い関係が観察された(データは図示せず)。極度に低いGC含量(20%未満)または高いGC含量(>70%)は、プライマー・プローブのその標的配列捕捉の不良の増加と関連していた(図8)。捕捉性能を直接的に評価する能力は、有用なプライマー・プローブの品質管理手段であると考えられる。
【0103】
OS−Seq技術は、合理的かつ拡張性の高い標的再配列決定のために開発された。配列決定前に標的を濃縮する従来の捕捉方法から離れ、OS−Seqは、NGSシステムの固相支持体上のハイブリダイゼーションおよび選択を介して、標的DNAの捕捉および配列決定を統合する。原理の実証試験は、OS−Seqアッセイが、良好な均一性および高い特異性を伴って、効率的かつ再現性よく標的ゲノム領域を捕捉することを示している。NA18507参照ゲノムのバリアント解析によって、SNVの決定のための高い特異性および低い偽発見率が証明された。マッチする結腸直腸腫瘍サンプルと正常サンプルの標的再配列決定により、癌ゲノムのハイスループットな遺伝子解析に対するOS−Seqの適応性が証明された。
【0104】
OS−Seq技術により、専用の標的再配列決定アッセイを作製することができる。プライマー・プローブオリゴヌクレオチドの設計および生成は、比較的単純であり、標的領域は、平衡の取れたGCおよび非反復配列を使用して単純に選択することができる。専用の複雑なオリゴヌクレオチドライブラリーをまとめて作製するために、プログラム可能なマイクロアレイ合成源を使用することができる。同様に、より小さな標的遺伝子セットのための専用アッセイを作製するために、従来のオリゴヌクレオチド合成方法が使用されてもよい。我々の最も大規模な標的アッセイは、344個の遺伝子のエクソンおよび隣接する配列を網羅したが、OS−Seqは、より多くの標的含量まで大幅にスケールアップすることができると考える。OS−Seq−366データから、フローセル内のハイブリダイゼーション混合物の標的断片と比較して、2,000倍を超える過剰なプライマー・プローブが存在すると推定した。20時間のハイブリダイゼーションの間に、ライブラリー内の全ての潜在的な標的の4.9%が配列決定のために捕捉されたことが推定される。クラスター形成を犠牲にすることなく、オリゴヌクレオチドの濃度を少なくとも10倍増加させることができ、配列決定用ライブラリーの濃度を5倍増加させることができること(データは図示せず)も調べた。
【0105】
OS−Seqサンプルの調製は単純である:1日で完了可能であり、容易に自動化される(図9)。労働に関しては、OS−Seqを使用することは、ショットガン配列決定実験を実行することに好ましく匹敵する。捕捉中は、残存するアダプターがフローセルとハイブリダイズしていないため、OS−Seqライブラリーは、物理的分離方法による限定されたサイズの精製の必要性なく、様々なサイズのDNA断片を用いることができる。ゲノムDNA断片の5’末端に単一アダプターを付加するだけでよい。単一アダプターの設計も、分子バーコードの導入を伴うインデックスに容易に役立つ。この特徴は、配列決定アッセイの単純なサンプル多重化を可能にし、多くの潜在的用途を有する。例えば、マッチする正常・腫瘍分析は、バイアスを減少させることができる同じ捕捉反応において行われる。
【0106】
「個別化医療」における関心の増加を考慮すると、ヒトゲノム再配列決定の迅速かつ単純なアプローチを開発する明らかな必要性がある。これには、癌ゲノムに見られる生殖系列バリアントおよび体細胞突然変異の分析が含まれる。候補遺伝子のハイスループットな分析、および臨床的に使用可能な標的領域の同定を可能にすることにより、OS−Seqは、標的再配列決定のための実践的かつ効率的なアプローチとして、翻訳試験および臨床診断に特に有用である。
【0107】
上記方法にはIllumina社のGenome Analyzerを使用した。しかしながら、このシステムは、いずれの平行配列決定プラットフォームにも広く適用可能であると考えられる。
図1A
図1B
図1C-D】
図2
図3A-B】
図4
図5A-C】
図6
図7A-B】
図8A-B】
図9A-B】
【配列表】
[この文献には参照ファイルがあります.J-PlatPatにて入手可能です(IP Forceでは現在のところ参照ファイルは掲載していません)]