IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ボリアル ジェノミクス, インコーポレイテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-02
(45)【発行日】2024-08-13
(54)【発明の名称】連結された二重鎖標的捕捉
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240805BHJP
   C12Q 1/686 20180101ALI20240805BHJP
   C12Q 1/6853 20180101ALI20240805BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/686 Z
C12Q1/6853 Z
【請求項の数】 10
(21)【出願番号】P 2022090756
(22)【出願日】2022-06-03
(62)【分割の表示】P 2018552001の分割
【原出願日】2017-03-28
(65)【公開番号】P2022119967
(43)【公開日】2022-08-17
【審査請求日】2022-07-04
(31)【優先権主張番号】62/313,974
(32)【優先日】2016-03-28
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/359,468
(32)【優先日】2016-07-07
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/409,633
(32)【優先日】2016-10-18
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518344597
【氏名又は名称】エヌキャン ジェノミクス, インコーポレイテッド
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】マルツィアリ, アンドレア
(72)【発明者】
【氏名】ペル, ジョエル
【審査官】北村 悠美子
(56)【参考文献】
【文献】特表2015-522292(JP,A)
【文献】米国特許出願公開第2016/0122814(US,A1)
【文献】特表2015-521853(JP,A)
【文献】The Journal of Molecular Diagnostics,2014年,Vol.16, No.2, p.163-173
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
関心領域を配列決定するための方法であって、前記方法は:
二本鎖ステム部分を含むYアダプターを提供するステップであって、前記ステム部分はユニバーサルプライミング部位及びその相補鎖を含む、ステップ;
前記Yアダプターを複数の二本鎖核酸断片にライゲートするステップであって、前記複数の二本鎖核酸断片はセンス鎖、アンチセンス鎖、及び前記センス鎖及び/又は前記アンチセンス鎖内の少なくとも1つの関心のゲノム領域を含む、ステップ;
前記複数のライゲートされた二本鎖核酸断片を変性して、各々が前記ユニバーサルプライミング部位又はその相補鎖の1つを含む一本鎖核酸断片を作成するステップ;
各々が前記ユニバーサルプライミング部位又はその相補鎖の1つを含むユニバーサルプライマーを用いて前記一本鎖核酸断片を増幅して、前記センス鎖及びアンチセンス鎖のコピーを含む複数の増幅された断片を生成するステップであって、前記ユニバーサルプライマーは、前記関心領域の少なくとも一部又はその相補鎖に対して相補的な標的化プローブに物理的に連結されており、前記ユニバーサルプライマーの5’末端は、前記標的化プローブの5’末端に連結されており、増幅は、前記ユニバーサルプライマーの前記ユニバーサルプライミング部位との結合を許容するために、前記標的化プローブの前記関心領域又はその相補鎖に対する結合を必要とする条件下で、鎖置換型ポリメラーゼを用いて起こり、そして、前記標的化プローブの伸長は遮断される、ステップ;及び
前記複数の増幅されたコピーを配列決定して、前記関心領域の配列を決定するステップ、
を含む、方法。
【請求項2】
前記変性ステップ及び増幅ステップはエマルジョン滴において行われる、請求項1に記載の方法。
【請求項3】
前記Yアダプターはバーコードを更に含む、請求項1に記載の方法。
【請求項4】
前記バーコードは固有分子識別子を含む、請求項に記載の方法。
【請求項5】
前記増幅ステップは鎖置換型酵素を用いて前記ユニバーサルプライマーを伸長することを含む、請求項1に記載の方法。
【請求項6】
関心領域を配列決定するための方法であって、前記方法は:
ユニバーサルプライミング部位を複数の二本鎖核酸断片にライゲートするステップであって、前記複数の二本鎖核酸断片はセンス鎖、アンチセンス鎖、及び前記センス鎖及び/又は前記アンチセンス鎖内の少なくとも1つの関心のゲノム領域を含む、ステップ;
前記複数のライゲートされた二本鎖核酸断片を変性して、各々が前記ユニバーサルプライミング部位又はその相補鎖の1つを含む一本鎖核酸断片を作成するステップ;
前記関心領域の一部又はその相補鎖に対して相補的な標的化プローブと、前記ユニバーサルプライミング部位又はその相補鎖に対して相補的なユニバーサルプライマーと、を含む連結標的捕捉プローブを結合させるステップであって、前記標的化プローブの5’末端は、連結分子を介して前記ユニバーサルプライマーの5’末端に連結されており、その条件は、前記ユニバーサルプライマーの前記ユニバーサルプライミング部位との結合を許容するために、前記標的化プローブが前記関心領域又はその相補鎖と結合しなければならない条件である、ステップ;
標的に結合したユニバーサルプライマーを、鎖置換型ポリメラーゼを用いて伸長するステップであって、前記標的化プローブの伸長は遮断され、伸長が前記標的に結合したユニバーサルプライマーよってのみ起こるようにする、ステップ;
前記一本鎖核酸断片を増幅して、前記センス鎖及びアンチセンス鎖のコピーを含む複数の増幅された断片を生成するステップ;及び
前記複数の増幅されたコピーを配列決定して、前記関心領域の配列を決定するステップ、
を含む、方法。
【請求項7】
前記変性ステップ及び増幅ステップはエマルジョン滴において行われる、請求項に記載の方法。
【請求項8】
前記ユニバーサルプライミング部位はYアダプターを含む、請求項に記載の方法。
【請求項9】
前記ユニバーサルプライミング部位はバーコードを更に含む、請求項に記載の方法。
【請求項10】
前記バーコードは固有分子識別子を含む、請求項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本願は、2016年3月28日に出願された米国仮出願番号第62/313,974号、2016年7月7日に出願された米国仮出願番号第62/359,468号、2016年10月18日に出願された米国仮出願番号第62/409,633号に基づく優先権および利益を主張しており、これら仮出願の各々の内容は参考として援用される。
【0002】
発明の分野
本発明は、概して、核酸の捕捉、増幅およびシーケンシングに関する。
【背景技術】
【0003】
背景
ハイスループットゲノムシーケンシングプラットフォームは、大量のデータを手頃な価格で生じるが、それらは十分に正確ではない。最良のシーケンシング技法であってもエラー率が約1パーセントである。これは単一のヒトゲノムの配列における何十万ものエラーに変換される。不正確な塩基呼び出し(base calling)により、配列の誤アラインメントおよび突然変異の誤同定が導かれる。塩基呼び出しおよびアラインメントアルゴリズムが利用可能であるが、増幅およびシーケンシングのエラーによって品質が負の影響を受ける。
【0004】
増幅およびシーケンシング技法は進歩してきたが、塩基呼び出しおよびアラインメントは依然としてエラーだらけである。例えば、現在の主要なシーケンシングプラットフォームでは、DNA断片をチャネル壁などの固体支持体に付着させる。断片が固体支持体に付着したら、断片を増幅し、増幅産物をシーディング断片に近接する固体支持体に付着させる。このプロセスを、シーディング断片と同一であるべきである増幅産物のクラスターが形成されるまで繰り返す。しかし、クラスターにはただ1つの断片をシードする。エラーがシーディング断片に存在するまたはクラスターの増幅においてエラーが生じた場合、エラーはクラスターの全部または一部で繰り返される。このエラーにより、塩基の誤同定が導かれ、シーケンシングアラインメントが複雑になる。
【0005】
これらの型のエラーを捉えるために、標準のバーコードシーケンシング方法では、数十~数百コピーの同じ鋳型、または十~数百のクラスターを使用して比較用の試料プールを創出する。コピーまたはクラスターの数を大幅に増加させることにより、エラーを決定することができる。しかし、この戦略は費用がかかるものであり、また、シーケンシングのバンド幅を消耗する。
【発明の概要】
【課題を解決するための手段】
【0006】
要旨
本発明は、同じ出発鋳型に由来する2つまたはそれよりも多くの断片を連結することによって塩基呼び出しの正確度を増大させるための方法を提供する。断片は、二重鎖DNA分子のセンス鎖およびアンチセンス鎖であってよい。例えば二重鎖分子の両方の鎖を含めた多数の鋳型を連結して単一の読み取りにすることにより、情報密度が増大し、エラー率が低下する。二重鎖の実施形態では、二重鎖データから、真のバリアントと増幅またはシーケンシングにおいて導入されるエラーとの即時の区別が可能になる(例えば、ポリメラーゼにより一方のセンスにおいてなされ得るエラーは両方の鎖で繰り返される可能性は低いが、真のバリアントは両方の鎖で繰り返される可能性がある)。センス特異的バーコー
ドを使用して、クラスター内のセンスおよびアンチセンス鋳型コピー両方の存在を確認することができる。専用のセンスおよびアンチセンスシーケンシング読み取りを使用して、導入されたエラーと真のバリアントとを区別することができる。
【0007】
ある特定の実施形態では、本発明は、二重鎖DNA分子に対する連結標的捕捉方法を提供する。溶液に基づく標的捕捉方法ならびにドロップレットに基づく標的捕捉方法が提供される。溶液に基づく方法およびドロップレットに基づく方法では、ユニバーサルプローブおよび標的特異的プローブを含む連結標的捕捉用プローブを使用し、反応は、ユニバーサルプローブの結合を可能にするために標的特異的プローブが結合することが必要になる条件下でなされる。多数の結合および伸長ステップが伴うので、従来の単一結合標的捕捉と比べて特異性が改善される。次いで、結合したユニバーサルプローブを、鎖置換型ポリメラーゼを使用して伸長させて標的鎖のコピーを生じさせ、次いでそれを、ユニバーサルプライマーを用いたPCRを使用して増幅することができる。本発明の方法では、PCR-捕捉-PCRワークフローを単一のPCRおよび捕捉ステップで置き換える。より高い特異性および二重鎖情報が必要な場合は、連結捕捉用プローブをDNAのセンスの一方または両方で使用することができる。以下に考察する通り、多数のリンカー型が可能である。本発明の溶液に基づく標的捕捉方法と同様に、使用者が、ドロップレット中での多重化PCRに制限されるのではなく、ドロップレット中での標的捕捉を実現することを可能にする、ドロップレットに基づく方法を提供する。捕捉方法を本明細書に記載の連結プライマーと組み合わせて、連結二重鎖分子をドロップレットから創出することができる。ある特定の実施形態では、標的捕捉用プローブならびにユニバーサルプライマーを含むナノ粒子を使用して、5’連結分子のプールから標的化された領域を捕捉し、標的化された分子のみを、クラスターをシーケンシングするための二重鎖シードに変換することができる。
【0008】
本発明の方法は、試料調製およびシーケンシングに適用される。試料調製方法では、本発明により、同一の断片または核酸のセンス鎖およびアンチセンス鎖を表す断片を一緒に接合することが可能になる。連結用分子により断片を接合し、複合体を創出する。複合体は、同一の断片または二重鎖断片に加えて、アダプター、プライマー、および結合性分子を含んでよい。さらに、一部の実施形態では、複合体は、一緒に連結した複数の同一断片を含んでよい。出生前試料などの、標的DNA含有量が低い試料では、複数の断片を一緒に連結することにより、シーケンシングおよび増幅エラーの即時同定で正確度を増大させて断片を増幅し、シーケンシングすることができる。
【0009】
連結断片は、連結増幅プライマーを用いて核酸断片を増幅することによって創出することができる。ある特定の実施形態では、ユニバーサルプライミング部位を標的断片上にライゲートして鋳型分子を創出することができる。方法は、ドロップレットおよび非ドロップレットワークフローを含んでよく、両方の鎖を表す連結分子がおよそ少なくとも50%の率で生じる。ドロップレット増幅方法では、鋳型分子を多重増幅プライマーおよび連結ユニバーサルプライマーと一緒にドロップレットに添加することができる。プライマーは、多重化遺伝子特異的フォワードおよびリバース増幅プライマーであってよい。次いで、ドロップレットをエマルジョンPCR増幅またはデジタルPCR増幅に供すことができる。増幅産物は、用途に依存して元の核酸断片または元の核酸断片のセンス鎖およびアンチセンス鎖の連結コピーであるはずである。2つまたはそれよりも多くのプライマーまたは核酸断片をポリエチレングリコール誘導体、オリゴ糖、脂質、炭化水素、ポリマーまたはタンパク質によって連結することができる。ある特定の実施形態では、4つまたはそれよりも多くのビオチン化プライマーまたは核酸断片を、ストレプトアビジン分子または官能性をもたせたナノ粒子を用いて連結することができる。本発明の連結プライマーはまた、全てのクラスター読み取りが同じ連結鋳型分子を起源とすることを確実にするために固有のクラスター識別子配列を含んでよい。
【0010】
本発明の方法では、増幅技法に組み入れられたとき塩基呼び出しが改善される。従来の増幅方法では、アンプリコンは単一の鋳型から創出される。断片にエラーが存在する場合、増幅産物を通じてエラーが伝播する。単一の鋳型を使用する代わりに、複数の同一の鋳型または二重鎖DNA分子のセンス鎖およびアンチセンス鎖を含む鋳型を使用して増幅産物を創出する。鋳型鎖の1つにエラーが生じた場合、複数の鋳型の使用では、単一の鋳型とは対照的に、シーケンシングステップにおいてそのようなエラーを同定することが可能になる。二重鎖DNA断片の両方の鎖を鋳型として使用する場合、エラーを、両方の鎖において見いだされるはずである真のバリアントと区別することができる。
【0011】
本発明のある特定の技法では、複数の鋳型をシードすることにより、エラーを、塩基が同じではない位置における単一の読み取りにおいてシーケンシングの質が低下することを通じて真のバリアントと区別することができる(真のバリアントは全ての読み取り上に存在することになり、それにより、強力なシグナルがもたらされる)。複数の実施形態では、センス鎖およびアンチセンス鎖でクラスターをシードすることにより、第1のセンス読み取りの結果を第2のアンチセンス読み取りの結果と比較して両方の鋳型鎖におけるバリアントの存在を確認することによって真のバリアントおよびエラーを同定することができる。
【0012】
本発明の方法は、単一の出発分子から、連結核酸断片を創出することを含む。単一の核酸断片から連結クラスターシーディング複合体を調製することにより(例えば、本明細書に記載のエマルジョンPCR方法を使用して)、2つの異なる核酸断片に由来するハイブリッド複合体が創出されるリスクが排除される。
【0013】
追加的な方法は、高密度シーケンシングの実行におけるクラスター間のクロストークを減少させることに関する。方法は、2種またはそれよりも多くの異なるアダプターを異なるプライマー配列にライゲートして、異なるアダプタープライマー配列に対応する異なるシーケンシングプライマーの使用によってクラスターの区別を可能にすることを含んでよい。
【0014】
本発明の方法は、ドロップレットにより形成された連結二重鎖分子についての二重鎖同定戦略を含む。記載の通り、本発明のドロップレットに基づく方法は、連結二重鎖断片の形成(DNA二重鎖の各側からの表示を含有する連結分子)を少なくとも50%の率でもたらすことができ、したがって、非二重鎖産物からのデータを省き二重鎖産物の利点を増大させる正確度を得るために、これらの産物の同定が重要になる。二重鎖同定方法としては、例えば、アニーリング温度が異なる2セットのプライマーを使用した二段階PCR手法を挙げることができ、この手法では、最初の何回かのサイクルを低温で遺伝子特異的バーコーディングプライマーを用いて実施して二重鎖の各センスを増幅および同定しながら、その後のサイクルにユニバーサル尾部を添加する。二重鎖の各センスが複数のバーコードで標識されることを防ぐために、バーコーディングサイクルの数を限定する。次いで、その後のサイクルを高温で、これらの条件下ではバーコーディングプライマーは結合することができないのでユニバーサルプライマーによって、実施することができる。次いで、二重鎖産物を、シーケンシング解析の間にそれらのセンス特異的バーコードが存在することによって同定し、非二重鎖クラスターと区別することができる。したがって、二重鎖クラスターのシードによってもたらされるより高い忠実度が評価され得る。
【0015】
非ドロップレット実施形態では、単一の増幅サイクルを使用して、元の断片の両方のセンス鎖およびアンチセンス鎖を有する連結二重鎖分子を創出することができる。次いで、連結二重鎖分子をシーケンシング用のフローセル中に直接ローディングし、それにより、増幅により誘導される配列または長さの偏り(例えば、全ゲノムシーケンシングにおいて)を回避し、かつ、増幅により導入されるエラーおよびローディング効率の悪さによる核
酸の喪失を回避することができる。例えば、シーケンサーのローディング効率を、(アウトプット読み取りの数)/(読み取りを形成することが可能なインプット分子の数)と定義することができる場合、Illumina MiSeqについてのローディング効率は<0.1%であり、他のIllumina計器についても同様である。これは、600uLより多くの試料がシーケンサーにローディングされる一方で、約7uLしか結合のためにフローセルの内部に保持されず、その結果、出発材料が大きく喪失するので、流体の喪失に大きく起因する。本明細書に記載の非ドロップレット、直接ローディング方法では、これらの非効率性が改善される。
【0016】
直接ローディングの実施形態に加えてフローセルローディングの収率および標的捕捉収率が重要である他の適用に関しては、喪失を最小限にするために、フローセルローディングと標的化シーケンシングを組み合わせることが有益であり得る。そのような組合せでは、さらに、余分のステップが排除されることによってワークフローが単純化される。フローセル上の標的を捕捉するための方法が存在するが、それらには少なくとも2つの欠点がある。第1に、それらは、フローセル上に捕捉された領域をシーケンシングすることができない。無細胞DNAなどの短い断片に関してはこれがシグナルの大きな喪失の原因になり得る。第2に、それらは、本発明に記載されている連結二重鎖分子をシーケンシングのために捕捉することができない。したがって、本発明の方法は、二重鎖分子のフローセルに基づく標的捕捉を含む。本発明の方法によると、フローセルは、標的領域を有するオリゴの一方のセンスを含有し、一方、他方のセンスはヘアピン状になっており、すぐには結合に利用可能でない。連結分子の一方のセンスをフローセル上に捕捉した後、他方のフローセルオリゴを活性化して、連結断片の他方のセンスを捕捉する(例えば、ウラシル消化、酵素消化、または光を使用する)。次いで、鋳型を伸長させることができ、クラスター生成を通常通り続けることができる。
【0017】
本発明の方法により、Illuminaプラットフォーム(Illumina,Inc.San Diego、CA)またはIon Torrentプラットフォーム(Thermo Fisher Scientific Inc.、Waltham、MA)などの固体支持体上での増幅が改善される。Illumina技法では、ブリッジ増幅を使用してアンプリコンのクラスターを形成する。断片中にエラーが存在する場合、クラスター内でエラーが繰り返される。しかし、本発明を用いると、連結断片を固体支持体に接触させる。同一のものまたは二重鎖DNA分子の各鎖を表すものであり得る断片がクラスターにシードされ、その結果、断片のそれぞれに由来する全アンプリコンの画分がもたらされる。この技法は、エラーをシーケンシングステップにおいて容易に決定することを可能にするものであり、また、真のバリアントを呼び出すことおよびそれらをシーケンシングまたは増幅(例えば、PCR)エラーと区別することに役立ち得る。
【0018】
本発明の方法により、多重化増幅プロセスが改善される。本発明の一部の実施形態では、連結断片をその後の増幅のためにドロップレット中で形成すること、またはドロップレット中に導入することができる。断片の一部にエラーが存在する場合、エラーは、未加工のシーケンシングデータを用いて決定可能である。一部の実施形態では、連結断片をマイクロスフェアに結合させ、次いで、増幅を伴い、断片は、アンプリコンでマイクロスフェアをシードすることができる。本発明では、同じ断片の複数のコピーを使用して複数のアンプリコンを形成するという利点を提供することにより、種々の適用における塩基呼び出しを改善する。
【0019】
本発明の方法は、複数のシーケンシングプラットフォームに組み入れることができる。例えば、従来の合成によるシーケンシングでは、各塩基を逐次的に決定することができる。エラーは、バイオインフォマティクス技法を使用してデータを解析するまで決定されない。しかし、本発明では、シーケンシング方法体系の間に核酸の複数の断片を連結するこ
とが可能になる。複数の断片を同時に解析することにより、塩基間の一致により正確度が示され、その一方、塩基間の不一致はシグナルエラーになる。本発明を用いると、バイオインフォマティクスを適用することなく、未加工のシーケンシングデータからエラーを決定できる。この技法では、より少数のコピーまたはクラスターが使用され、シーケンシングスループットが増加し、また、費用が減少する。
【図面の簡単な説明】
【0020】
図1-1】図1A~1Eは、連結断片を形成するプロセスを示す図である。
図1-2】図1A~1Eは、連結断片を形成するプロセスを示す図である。
【0021】
図2図2は、固体支持体に付着した連結鋳型を示す図である。
【0022】
図3図3は、連結断片の例を示す図である。
【0023】
図4-1】図4A~4Cは、連結断片の伸長および増幅を示す図である。
図4-2】図4A~4Cは、連結断片の伸長および増幅を示す図である。
図4-3】図4A~4Cは、連結断片の伸長および増幅を示す図である。
【0024】
図5図5A~5Cは、連結断片におけるエラー決定を示す図である。
【0025】
図6図6は、アダプターおよびプライマーを示す図である。
【0026】
図7図7は、エマルジョンPCRによる連結核酸断片の創出のプロセスを示す図である。
【0027】
図8図8は、エマルジョンPCRにおける4連結断片の創出およびシーケンシングクラスターをシードするための4連結断片のフローセルハイブリダイゼーションを示す図である。
【0028】
図9-1】図9は、本発明のある特定の実施形態によるライゲーションアダプターを示す図である。
図9-2】図9は、本発明のある特定の実施形態によるライゲーションアダプターを示す図である。
【0029】
図10図10は、本発明のある特定の実施形態によるデジタルPCRプライマーを示す図である。
【0030】
図11図11は、エマルジョンPCRによるビーズ上での連結核酸断片の創出のプロセスを示す図である。
【0031】
図12図12は、本発明の実施形態による連結核酸ビーズのIon Torrentシーケンシングを示す図である。
【0032】
図13図13は、異なるアダプターおよびシーケンシングプライマー部位を用いた連結核酸断片の創出のプロセスを示す図である。
【0033】
図14図14は、クロストークを低減するために異なるシーケンシングプライマー部位を有するクラスターのシーケンシングのプロセスを示す図である。
【0034】
図15図15は、シーケンシングクラスターにわたるクロストークを例示する図である。
【0035】
図16図16は、連結二重鎖核酸を創出するための本発明のドロップレットに基づく方法を例示する図である。
【0036】
図17図17は、例証的な連結プライマーおよびフォワードおよびリバース遺伝子特異的プライマーおよび本発明の1つの方法に従ったそれらの使用を示す図である。
【0037】
図18図18は、例証的な連結プライマーおよびフォワードおよびリバース遺伝子特異的プライマーおよび本発明の1つの方法に従ったそれらの使用を示す図である。
【0038】
図19図19は、本発明の遺伝子特異的プライマーを示す図である。
【0039】
図20図20は、図17に示されている生成物方法を用いた本発明のシーケンシング方法を示す図である。
【0040】
図21図21は、図18に示されている生成物方法を用いた本発明のシーケンシング方法を示す図である。
【0041】
図22-1】図22Aおよび22Bは、1つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
図22-2】図22Aおよび22Bは、1つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【0042】
図23-1】図23Aおよび23Bは、2つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
図23-2】図23Aおよび23Bは、2つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【0043】
図24-1】図24Aおよび24Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する図である。
図24-2】図24Aおよび24Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する図である。
【0044】
図25図25は、フローセル結合方法の例証的なステップを示す図である。
【0045】
図26図26は、例証的なオフラインフローセル調製プロトコールを示す図である。
【0046】
図27図27は、二重鎖分子に対するフローセルに基づく標的捕捉方法を例示する図である。
【0047】
図28-1】図28A~28Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
図28-2】図28A~28Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
図28-3】図28A~28Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
図28-4】図28A~28Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
図28-5】図28A~28Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【0048】
図29-1】図29A~29Dは、ある特定の実施形態による二重鎖同定方法を例示する図である。
図29-2】図29A~29Dは、ある特定の実施形態による二重鎖同定方法を例示する図である。
図29-3】図29A~29Dは、ある特定の実施形態による二重鎖同定方法を例示する図である。
図29-4】図29A~29Dは、ある特定の実施形態による二重鎖同定方法を例示する図である。
【0049】
図30図30は、KRASアンプリコンとアラインメントされた、単独でシードされたクラスターを使用したシーケンシングのエラー率を示すグラフである。
【0050】
図31図31は、図30に示されている結果を生じさせるのに使用した、シーケンシング方法のために単独でシードされたクラスター、および、図43に示されている結果を生じさせるのに使用した、シーケンシング方法のために二重にシードされたクラスターを示す図である。
【0051】
図32図32は、単一のシーケンシング読み取りおよびシグナルの質に基づく本発明の塩基呼び出し方法を例示する図である。
【0052】
図33図33は、センスおよびアンチセンスシーケンシング読み取りの比較に基づく塩基呼び出し方法を示す図である。
【0053】
図34図34は、二重鎖核酸の連結標的捕捉の例証的な方法を例示する図である。
【0054】
図35図35は、連結された標的捕捉核酸の増幅方法を例示する図である。
【0055】
図36図36は、ドロップレットに基づく標的捕捉および連結二重鎖核酸生成の方法を示す図である。
【0056】
図37-1】図37AおよびBは、本発明のドロップレットに基づく標的捕捉方法のステップを示す図である。
図37-2】図37AおよびBは、本発明のドロップレットに基づく標的捕捉方法のステップを示す図である。
【0057】
図38図38は、ユニバーサルプライマーおよび捕捉されるべき連結分子の捕捉領域に相補的な標的領域を含む鎖を有するナノ粒子を示す。
【0058】
図39図39は、捕捉領域と標的領域の結合を例示する図である。
【0059】
図40図40は、ユニバーサルプライマーと連結分子上のユニバーサルプライマー部位の結合を示す図である。
【0060】
図41図41は、元の連結分子の両方の鎖を含む標的分子のナノ粒子連結コピーを生成するための、鎖置換型ポリメラーゼによるユニバーサルプライマー伸長を示す図である。
【0061】
図42図42は、本出願の他の箇所に記載されているフローセルシーケンサーにクラスターをシードするために使用することができる二重にシードされたナノ粒子を示す図である。
【0062】
図43図43は、KRASアンプリコンとアラインメントされた二重にシードされたクラスターを使用したシーケンシングのエラー率を示すグラフである。
【発明を実施するための形態】
【0063】
詳細な説明
本発明は、一般には、2つの核酸断片を接合することによって核酸を増幅しシーケンシングするための方法に関する。これらの断片は、単一の断片の2つの同一のコピーであってもよく、二重鎖核酸の両方の鎖であってもよい。2つの断片を使用することにより、エラー率が低下し、アラインメントの効率が上昇し、また、シーケンシングの費用が低減する。
【0064】
核酸は、一般に、試料または対象から得られる。本発明の方法に従って標識および/または検出するための標的分子としては、これだけに限定されないが、DNA、ゲノムDNA、RNA、発現したRNAおよび/または染色体(単数または複数)などの遺伝子材料およびプロテオミクス材料が挙げられる。本発明の方法は、全細胞由来のDNAまたは1つもしくは複数の細胞から得られた遺伝子材料もしくはプロテオミクス材料の部分に適用可能である。本発明の方法により、ウイルスなどの非細胞供給源からDNAまたはRNAを得ることが可能になる。対象に関しては、試料は、任意の臨床的に許容される様式で得ることができ、核酸鋳型は当技術分野で公知の方法によって試料から抽出される。一般に、核酸は、その内容全体が参照により本明細書に組み込まれるManiatisら、(Molecular Cloning: A Laboratory Manual、Cold Spring Harbor、N.Y.、280~281頁、1982年)に記載されているものなどの様々な技法によって生体試料から抽出することができる。
【0065】
核酸鋳型は、デオキシリボ核酸(DNA)および/またはリボ核酸(RNA)を含む。核酸鋳型は、合成されたものであってもよく、天然に存在する供給源に由来するものであってもよい。核酸は、生物学的なものであるか、環境的なものであるか、身体的なものであるかまたは合成されたものであるかにかかわらず、任意の供給源または試料から得ることができる。一実施形態では、核酸鋳型は、タンパク質、脂質および非鋳型核酸などの種々の他の構成成分を含有する試料から単離される。核酸鋳型は、任意の細胞性材料から得ることもでき、動物、植物、細菌、真菌、または任意の他の細胞性生物体から得ることもできる。本発明において使用するための試料は、ウイルス、ウイルス粒子または調製物を含む。核酸はまた、細菌または真菌などの微生物から、環境試料などの試料から得ることもできる。
【0066】
本発明では、標的材料は、試料中に含有されるDNA、RNA、cDNA、PNA、LNAおよびその他を含めた任意の核酸である。核酸分子は、デオキシリボ核酸(DNA)および/またはリボ核酸(RNA)を含む。核酸分子は、合成されたものであってもよく、天然に存在する供給源に由来するものであってもよい。一実施形態では、核酸分子は、タンパク質、脂質および非鋳型核酸などの種々の他の構成成分を含有する生体試料から単離される。核酸鋳型分子は、任意の細胞性材料から得ることもでき、動物、植物、細菌、真菌、または任意の他の細胞性生物体から得ることもできる。ある特定の実施形態では、核酸分子を単一細胞から得る。本発明において使用するための生体試料は、ウイルス粒子または調製物を含む。核酸分子は、生物体から直接得ることもでき、生物体から、例えば、血液、尿、脳脊髄液、精液、唾液、痰、便および組織から得た生体試料から得ることも
できる。任意の組織または体液検体は、本発明における使用のための核酸の供給源として使用することができる。核酸分子は、初代細胞の培養物または細胞株などの培養細胞から単離することもできる。鋳型核酸を得る細胞または組織にウイルスまたは他の細胞内病原体を感染させることができる。さらに、核酸は、ウイルス試料、または環境試料などの非細胞または非組織試料から得ることができる。
【0067】
試料は、生物検体、cDNAライブラリー、ウイルスDNA、またはゲノムDNAから抽出された全RNAであってもよい。ある特定の実施形態では、核酸分子は、タンパク質、酵素、基質、抗体、結合剤、ビーズ、小分子、ペプチド、または任意の他の分子などの他の標的分子に結合しており、標的分子の数量化および/または検出の代理として機能する。一般に、核酸は、SambrookおよびRussell、Molecular Cloning: A Laboratory Manual、第3版、Cold Spring Harbor、N.Y.(2001年)に記載されているものなどの様々な技法によって生体試料から抽出することができる。核酸分子は、一本鎖、二本鎖、または一本鎖領域(例えば、ステム構造およびループ構造)を有する二本鎖であってよい。抗体またはアプタマーなどの高親和性結合性部分に結合することができるタンパク質またはタンパク質の一部(アミノ酸ポリマー)は、例えば、ドロップレットにおけるオリゴヌクレオチド標識の標的分子である。
【0068】
核酸鋳型は、生物体から直接、または生物体から得た生体試料から、例えば、血液、尿、脳脊髄液、精液、唾液、痰、便および組織から得ることができる。特定の実施形態では、核酸を新鮮凍結血漿(FFP)から得る。特定の実施形態では、核酸をホルマリン固定パラフィン包埋(FFPE)組織から得る。任意の組織または体液検体を本発明における使用のための核酸の供給源として使用することができる。核酸鋳型はまた、初代細胞培養物などの培養細胞または細胞株から単離することもできる。鋳型核酸を得る細胞または組織をウイルスまたは他の細胞内病原体に感染させることができる。試料は、生物検体、cDNAライブラリー、ウイルスDNA、またはゲノムDNAから抽出された全RNAであってもよい。
【0069】
生体試料を界面活性剤または界面活性物質の存在下でホモジナイズまたは分画することができる。緩衝液中の界面活性剤の濃度は約0.05%~約10.0%であってよい。界面活性剤の濃度は、最大で界面活性剤が溶液中で可溶性のままになる量であってよい。好ましい実施形態では、界面活性剤の濃度は、0.1%~約2%である。界面活性剤、特に非変性の穏やかなものは、試料が可溶化されるように作用する。界面活性剤は、イオン性であっても非イオン性であってもよい。非イオン性界面活性剤の例としては、Triton Xシリーズ(Triton X-100 t-Oct-C6H4-(OCH2-CH2)xOH、x=9~10、Triton X-100R、Triton X-114、x=7~8)などのトリトン、オクチルグルコシド、ポリオキシエチレン(9)ドデシルエーテル、ジギトニン、IGEPAL CA630オクチルフェニルポリエチレングリコール、n-オクチル-ベータ-D-グルコピラノシド(ベータOG)、n-ドデシル-ベータ、Tween 20ポリエチレングリコールソルビタンモノラウレート、Tween
80ポリエチレングリコールソルビタンモノオレエート、ポリドカノール、n-ドデシルベータ-D-マルトシド(DDM)、NP-40ノニルフェニルポリエチレングリコール、C12E8(オクタエチレングリコールn-ドデシルモノエーテル)、ヘキサエチレングリコールモノ-n-テトラデシルエーテル(C14EO6)、オクチル-ベータ-チオグルコピラノシド(オクチルチオグルコシド、OTG)、Emulgen、およびポリオキシエチレン10ラウリルエーテル(C12E10)が挙げられる。イオン性界面活性剤(陰イオン性または陽イオン性)の例としては、デオキシコール酸、ドデシル硫酸ナトリウム(SDS)、N-ラウロイルザルコシン、および臭化セチルトリメチルアンモニウム(CTAB)が挙げられる。Chaps、双性イオン性3-14、および3-[(3-
コラミドプロピル)ジメチルアンモニオ]-1-プロパンスルフォネートなどの双性イオン性試薬も本発明の精製スキームにおいて使用することができる。尿素を別の界面活性剤または界面活性物質を伴ってまたは伴わずに添加することができることも企図されている。
【0070】
溶解またはホモジナイゼーション溶液は、還元剤などの他の薬剤をさらに含有してよい。そのような還元剤の例としては、ジチオスレイトール(DTT)、ベータ-メルカプトエタノール、DTE、GSH、システイン、システアミン、トリカルボキシエチルホスフィン(TCEP)、または亜硫酸の塩が挙げられる。
【0071】
核酸が得られたら、当技術分野で公知の任意の方法によって変性させて一本鎖核酸鋳型を生成し、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドにより鋳型上の標的領域が挟まれるように、第1のオリゴヌクレオチドと第2のオリゴヌクレオチドの対を一本鎖核酸鋳型とハイブリダイズさせる。
【0072】
一部の実施形態では、核酸を断片化または分解してより小さな核酸断片にすることができる。ゲノム核酸を含めた核酸は、機械的断片化、化学的断片化、および酵素的断片化などの種々の方法のいずれかを使用して断片化することができる。核酸の断片化の方法は、当技術分野で公知であり、それらとしては、これだけに限定されないが、DNase消化、超音波処理(sonication)、機械的せん断などが挙げられる(J. Sambrookら、「Molecular Cloning: A Laboratory Manual」、1989年、第2版、Cold Spring Harbour Laboratory Press: New York、N.Y.;P. Tijssen、「Hybridization with Nucleic Acid Probes--Laboratory Techniques in Biochemistry and Molecular Biology(Parts IおよびII)」、1993年、Elsevier;C. P. Ordahlら、Nucleic Acids Res.、1976年、3巻:2985~2999頁;P. J. Oefnerら、Nucleic Acids Res.、1996年、24巻:3879~3889頁;Y. R. Thorstensonら、Genome Res.、1998年、8巻:848~855頁)。米国特許公開第2005/0112590号は、当技術分野で公知の種々の断片化方法の概要を提供する。
【0073】
ゲノム核酸は、均一な断片に断片化することもでき、ランダムに断片化することもできる。ある特定の態様では、核酸を断片化して、約5キロベースまたは100キロベースの断片長を有する断片を形成させる。好ましい実施形態では、ゲノム核酸断片は、1キロベースから20キロベースまでにわたってよい。好ましい断片はサイズが変動し得、平均断片長が約10キロベースである。しかし、捕捉される核酸標的の型に応じて所望の断片長および断片長の範囲を調整することができる。特定の断片化の方法を選択して、所望の断片長を実現する。いくつかの非限定的な例を下に提示する。
【0074】
ゲノム核酸の化学的断片化は、いくつかの異なる方法を使用して実現することができる。例えば、塩基加水分解および酸加水分解を含めた加水分解反応が核酸を断片化するための一般的な技法である。加水分解は、所望の加水分解の程度に応じて、温度を上昇させることによって容易になる。断片化は、下記の通り温度およびpHを変更することによって実現することができる。せん断に関してpHに基づく加水分解の利点は、一本鎖産物をもたらすことができることである。さらに、温度をある特定の緩衝系(例えばTris)と共に使用して、加水分解を実現するためにpHを中性から上下に一時的にシフトさせ、次いで、長期保管のためなどで、中性に戻すことができる。異なる量のせん断(したがって、様々な長さの分布)をもたらすために、pHおよび温度の両方を調節することができる
【0075】
核酸の加水分解による断片化の他の方法としては、アルカリ加水分解、ホルマリン固定、金属錯体(例えば、ポルフィリン)による加水分解、および/またはヒドロキシルラジカルによる加水分解が挙げられる。RNAはアルカリ性条件下でせん断されるが(例えば、Nordhoffら、Nucl. Acid. Res.、21巻(15号):3347~57頁(2003年)を参照されたい)、DNAは、強酸の存在下でせん断することができる。
【0076】
ゲノム核酸断片を生成するための例証的な酸/塩基加水分解プロトコールは、Sargentら(1988年)、Methods Enzymol.、152巻:432頁に記載されている。簡単に述べると、精製DNA1gを0.1NのNaOH50mL中に溶解させる。濃縮HCl1.5mLを添加し、溶液を直ちに混合する。DNAはすぐに沈殿し、大きな凝集体の形成を防ぐために、数秒よりも長く撹拌すべきでない。試料を室温で20分インキュベートしてDNAを部分的に脱プリン化する。その後、10NのNaOH(OH--0.1Nまで濃縮)2mLを添加し、試料をDNAが完全に再溶解するまで撹拌する。次いで、DNAを加水分解させるために試料を65℃で30分インキュベートする。得られる断片は一般には約250~1000ヌクレオチドにわたるが、加水分解の条件に応じてより長くまたはより短く変動し得る。
【0077】
一実施形態では、ゲノム核酸を精製した後、それを、7.5から8.0の間のpHのTrisベースの緩衝液、例えばQiagenのDNA水和溶液などに再懸濁させる。次いで、再懸濁させたゲノム核酸を65℃まで加熱し、終夜インキュベートする。加熱により緩衝液のpHが低~中間の6の範囲にシフトし、それにより、酸加水分解が導かれる。経時的に、酸加水分解により、ゲノム核酸の一本鎖産物および/または二本鎖産物への断片化が引き起こされる。
【0078】
化学的切断は特異的なものであってもよい。例えば、選択された核酸分子、特に、ホスホロチオエート修飾された核酸分子をアルキル化によって切断することができる(例えば、K. A. Browne、「Metal ion-catalyzed nucleic Acid alkylation and fragmentation」、J.
Am. Chem. Soc. 124巻(27号):7950~7962頁(2002年)を参照されたい)。ホスホロチオエート修飾でのアルキル化により、核酸分子がその修飾部位で切断されやすくなる。I. G. GutおよびS. Beck、「A procedure for selective DNA alkylation and detection by mass spectrometry」、Nucl. Acids Res. 23巻(8号):1367~1373頁(1995年)を参照されたい。
【0079】
本発明の方法はまた、Maxam-Gilbert Sequencing Method(Chemical or Cleavage Method)、Proc. Natl. Acad. Sci. USA.、74巻:560~564頁に開示されている技法を使用して核酸を化学的にせん断することも企図している。そのプロトコールでは、例えば、グアニンにおける、アデニンにおける、シトシンおよびチミンにおける、ならびにシトシンのみにおける優先的切断など、核酸が特定の塩基において断片化されるように設計された化学物質に曝露させることによって、ゲノム核酸を化学的に切断することができる。
【0080】
核酸の断片への機械的せん断は、当技術分野で公知の任意の方法を使用して行うことができる。例えば、核酸の断片化は、水力せん断(hydroshearing)、針を通
した粉砕、および超音波処理によって実現することができる。例えば、Quailら、(2010年11月)、DNA: Mechanical Breakage. In: eLS. John Wiley & Sons、Chichester. doi: 10.1002/9780470015902.a0005 333.pub2を参照されたい。
【0081】
核酸は、噴霧によってせん断することもできる。(Roe、BA、Crabtree.
JSおよびKhan、AS、1996年);Sambrook & Russell、Cold Spring Harb Protoc、2006年を参照されたい。噴霧は、核酸溶液を噴霧器の小さな穴に強制的に通すことによって創出されたミストから、断片化されたDNAを収集することを伴う。噴霧によって得られる断片のサイズは、DNA溶液が穴を通過するスピード、噴霧器を通じて噴出されるガスの圧力の変更、溶液の粘度、および温度によって主に決定される。得られるDNA断片は、狭いサイズ範囲(700~1330bp)に分布する。核酸のせん断は、得られた核酸を狭い毛細管またはオリフィスに通すことによって実現することができる(Oefnerら、Nucleic Acids Res.、1996年;Thorstensonら、Genome Res.、1995年)。この技法は、核酸試料をシリンジポンプによって強制的に小さな穴に通した結果として起こる点でのポイントシンク流体力学に基づく。
【0082】
水力せん断(Genomic Solutions、Ann Arbor、Mich.、USA)では、溶液中のDNAを、急激に収縮するチューブに通す。収縮に近づくにつれ、流体が加速されて収縮したより小さな面積を通る体積流量が維持される。この加速中、抗力によりDNAがぷっつり切れるまで伸ばされる。DNAは小片がせん断力による化学結合の破壊には小さすぎるものになるまで断片化される。流体の流速および収縮のサイズにより最終的なDNA断片のサイズが決定される。
【0083】
超音波処理も、核酸を短時間の超音波処理、すなわち超音波エネルギーに供することによって核酸を断片化するために使用される。超音波処理(sonification)によって核酸をせん断して断片にする方法は、米国特許公開第2009/0233814号に記載されている。本方法では、得られた精製核酸は、粒子が配置された懸濁液中に入れられる。次いで、試料および粒子の懸濁液を超音波処理して核酸断片にする。
【0084】
DNAを断片化するために使用することができる音波に基づく系は、米国特許第6,719,449号、および同第6,948,843号に記載されており、Covaris Inc.により製造された。米国特許第6,235,501号には、閉じた容器中、液体媒体の存在下で、急速に振動する相反的な機械的エネルギーを適用することによって高分子量のDNA断片を生成する、機械的に焦点を合わせる超音波処理(acoustic sonication)方法が記載されており、これを、DNAを機械的に断片化するために使用することができる。
【0085】
核酸をせん断して断片にする別の方法では、例えば、DiagonnodeのBioRuptor(Diagenode,Inc.により市販されている電気せん断デバイス)を用いたせん断など、超音波エネルギーを使用して液体における気体性キャビテーションを生じさせる。キャビテーションは、液体中の圧力の変化に起因してする、溶解した気体または蒸気の小さな泡の形成である。これらの泡は、共鳴振動し、活発な渦巻きまたはマイクロストリーミングを生じさせることができる。結果生じる機械的ストレスにより、核酸の断片へのせん断が導かれ得る。
【0086】
酵素的断片化は、酵素的切断としても公知であり、エンドヌクレアーゼ、エキソヌクレアーゼ、リボザイム、およびDNAザイムなどの酵素を使用して核酸を切断して断片にす
るものである。そのような酵素は、広範に知られており、商業的に入手可能である。Sambrook、J. Molecular Cloning: A Laboratory Manual、第3版(2001年)およびRoberts RJ(1980年1月)、「Restriction and modification enzymes and their recognition sequences」、Nucleic
Acids Res.、8巻(1号):r63~r80を参照されたい。様々な酵素的断片化技法が当技術分野で周知であり、そのような技法がシーケンシングのために核酸を断片化するために頻繁に使用される。例えば、Alazardら、2002年;Bentzleyら、1998年;Bentzleyら、1996年;Faulstichら、1997年;Gloverら、1995年;Kirpekarら、1994年;Owensら、1998年;Pielesら、1993年;Schuetteら、1995年;Smirnovら、1996年;Wu & Aboleneen、2001年;Wuら、1998年a。
【0087】
核酸を断片化するために使用される最も一般的な酵素は、エンドヌクレアーゼである。エンドヌクレアーゼは、二本鎖核酸分子または一本鎖核酸分子のいずれに特異的なものであってもよい。核酸分子の切断を核酸分子内でランダムに行うこともでき、核酸分子の特定の配列において切断することもできる。核酸分子の特異的断片化は、1種または複数種の酵素を逐次的な反応でまたは同時に使用して実現することができる。
【0088】
制限エンドヌクレアーゼは、二本鎖核酸内の特異的な配列を認識し、一般に、核酸を断片化するために、両方の鎖を認識部位内またはその付近のいずれかで切断する。天然に存在する制限エンドヌクレアーゼは、それらの組成および酵素補因子の必要性、それらの標的配列の性質、および、それらのDNA切断部位の標的配列に対する位置に基づいて4つの群(I型、II型、III型、およびIV型)にカテゴリー化される。Bickle TA、Kruger DH(1993年6月)、「Biology of DNA restriction」、Microbiol. Rev.、57巻(2号):434~50頁;Boyer HW(1971年)。「DNA restriction and modification mechanisms in bacteria」、Annu. Rev. Microbiol.、25巻:153~76頁;Yuan R(1981年)。「Structure and mechanism of multifunctional restriction endonucleases」、Annu. Rev. Biochem.、50巻:285~319頁。全ての型の酵素が特定の短いDNA配列を認識し、DNAのエンドヌクレアーゼ的切断を行って、末端5’リン酸を有する特定の断片をもたらす。これらの酵素は、それらの認識配列、サブユニットの組成、切断位置、および補因子の必要性が異なる。Williams RJ(2003年)、「Restriction endonucleases: classification, properties, and applications」、Mol. Biotechnol.、23巻(3号):225~43頁。
【0089】
制限エンドヌクレアーゼにより二本鎖核酸における特異的シーケンシングを認識し、一般に両方の鎖を切断する場合、ニッキングエンドヌクレアーゼにより、核酸の鎖の一方のみを切断して断片にすることが可能である。核酸を断片化するために使用されるニッキング酵素は、天然に存在するものであっても制限酵素から遺伝子操作されたものであってもよい。Chanら、Nucl. Acids Res.、(2011年)、39巻(1号):1~18頁を参照されたい。
【0090】
一部の実施形態では、DNAを生物体または生物学的培地において生物学的プロセスでせん断する。そのようなDNAまたは無細胞DNAは血流中を自由に循環する。例えば、無細胞胎児DNA(cffDNA)は、母体の血流中を自由に循環する胎児DNAである
。無細胞腫瘍DNA(ctDNA)は、血流中を自由に循環する腫瘍DNAである。一部の実施形態では、断片化されたまたはせん断されたDNAを使用するが、DNAは、断片化された形態で得られる。
【0091】
本発明の好ましい実施形態では、核酸断片を接合して複合体にする。例えば、同一の断片に関しては図3を、および二重鎖核酸の2つの鎖に関しては図16を参照されたい。任意の連結用分子を使用して分子を接合することができる。本発明において使用されるリンカーは、合成することもでき、種々の会社、例えば、Integrated DNA Technologies,Inc.、Gene Link,Inc.、およびTriLink Biotechnologies,Incから商業的に入手することもできる。リンカーは、2種のプライマーまたは2つの核酸断片を接合するための任意の分子であってよい。連結用分子により複数の断片を接合することもできる。任意の数の断片を複合体に組み入れることができる。
【0092】
ある特定の実施形態では、連結用分子はストレプトアビジン分子であってよく、連結される断片はビオチン化核酸を含んでよい。増幅によって連結核酸断片を創出するために連結プライマーを使用する実施形態では、プライマーをビオチン化し、ストレプトアビジン分子上に接合することができる。例えば、4つの断片を四量体ストレプトアビジン上に接合することができる。例えばコンカテマーを形成することにより、4つよりも多くの分子を接合することができる。本発明のある特定の方法では、2つまたはそれよりも多くの核酸断片をクリック化学反応によって連結することができる。参照により本明細書に組み込まれるKolbら、Click Chemistry: Diverse Chemical Function from a Few Good Reactions、Angew Chem Int Ed Engl.、2001年6月1日;40巻(11号):2004~2021頁を参照されたい。
【0093】
例としておよびいくつかの公知のナノ粒子のうちの連結用分子は、単一の連結分子内の何百ものまたは何千もの断片を含めた多数の断片を連結することができる。連結ナノ粒子の1つの例は、チオールでキャップされた合成DNA配列で表面が修飾されたコロイド金を含む多価DNA金ナノ粒子であり得る。参照により本明細書に組み込まれるMirkinら、1996年、A DNA-based method for rationally assembling nanoparticles into macroscopic materials、Nature、382巻:607~609頁を参照されたい。表面DNA配列は、所望の鋳型分子配列に相補的であってもよく、ユニバーサルプライマーを含んでもよい。
【0094】
連結用分子は、核酸断片の分離にも役立ち得る。好ましい実施形態では、断片を、それらの間での結合が防止されるように方向付ける。空間的な分離および断片の方向の制御を生じさせるリンカーを用いると、崩壊または断片間の結合を回避および防止することができる。
【0095】
一部の実施形態では、リンカーは、ポリエチレングリコール(PEG)または修飾PEGであってよい。DBCO-PEG、またはPEG-11などの修飾PEGを使用して2つのアダプターまたは核酸を接合することができる。別の実施例では、N-ヒドロキシスクシンイミド(NHS)で修飾PEGを使用して2つのアダプターを接合する。Schlingmanら、Colloids and Surfaces B: Biointerfaces、83巻(2011年)、91~95頁を参照されたい。任意のオリゴヌクレオチドまたは他の分子を使用してアダプターまたは核酸を接合することができる。
【0096】
一部の実施形態では、アプタマーを使用して2つのアダプターまたは核酸を結合する。
アプタマーは、プライマーまたは核酸などの種々の分子標的に結合するように設計することができる。アプタマーは、SELEX法(指数関数的富化によるリガンドの系統的進化)によって設計または選択することができる。アプタマーは、標的分子に特異的に結合する核酸巨大分子である。全ての核酸と同様に、特定の核酸リガンド、すなわち、アプタマーも、一般には15~40ヌクレオチド長のヌクレオチド(A、U、T、CおよびG)の直鎖配列によって記載することができる。一部の好ましい実施形態では、アプタマーは、反転塩基または修飾塩基を含んでよい。一部の実施形態では、アプタマーまたは修飾アプタマーは、少なくとも1つの反転塩基または修飾塩基を含む。
【0097】
リンカーは、反転塩基(inverted bases)で構成されてもよく、少なくとも1つの反転塩基を含んでもよいことが理解されるべきである。反転塩基または修飾塩基は、任意の商業的実体から取得することができる。反転塩基または修飾塩基は、開発されており、市販されている。反転塩基または修飾塩基は、他の分子に組み入れることができる。例えば、2-アミノプリンをオリゴヌクレオチドに置換することができる。2-アミノプリンは、DNAの構造および動力学をモニタリングするためのプローブとして有用な蛍光塩基である。2,6-ジアミノプリン(2-アミノ-dA)は、塩基をdTと対合させると3つの水素結合を形成することができ、また、短いオリゴのTmを上昇させることができる修飾塩基である。5-ブロモ-デオキシウリジンは、オリゴヌクレオチドに組み入れて、UV光への曝露でDNA、RNAまたはタンパク質と架橋結合させることができる光反応性ハロゲン化塩基である。反転塩基または修飾塩基の他の例としては、デオキシウリジン(dU)、反転dT、ジデオキシシチジン(ddC)、5-メチルデオキシシチジン、または2’-デオキシイノシン(dI)が挙げられる。任意の反転塩基または修飾塩基を鋳型核酸の連結に使用することができることが理解されるべきである。
【0098】
好ましい実施形態では、リンカーは、2種のプライマーまたは2つの核酸断片を接合するための分子を含む。リンカーは、単一分子であってもよく、複数の分子であってもよい。リンカーは、数個の反転塩基または修飾塩基を含んでもよく、または全体が反転塩基または修飾塩基であってもよい。リンカーは、ワトソン・クリック塩基と反転塩基または修飾塩基の両方を含んでよい。
【0099】
任意のスペーサー分子または連結用分子を本発明において使用することができることが理解されるべきである。一部の実施形態では、リンカーまたはスペーサー分子は、脂質もしくはオリゴ糖、またはオリゴ糖および脂質であってよい。米国特許第5,122,450号を参照されたい。本実施例では、分子は、脂質分子であることが好ましく、少なくとも2つの疎水性ポリアルキレン鎖を有するグリセリドまたはホスファチドであることがより好ましい。
【0100】
リンカーは、任意の数のアダプター、プライマー、および断片のコピーで構成されてよい。リンカーは、2つの同一のアームを含んでよく、各アームが結合性分子、増幅プライマー、シーケンシングプライマー、アダプター、および断片で構成される。リンカーは、任意の数のアーム、例えば、3つまたは4つのアームを連結することができる。本発明の一部の態様では、核酸鋳型がスペーサー分子によって連結されることが理解されるべきである。本発明におけるリンカーは、2つの断片またはプライマーを接合するための任意の分子または方法であってよい。一部の実施形態では、ポリエチレングリコールまたはDBCO-PEGもしくはPEG-11などの修飾PEGを使用する。一部の実施形態では、リンカーは、脂質または炭化水素である。一部の実施形態では、タンパク質によりアダプターまたは核酸を接合することができる。一部の実施形態では、オリゴ糖によりプライマーまたは核酸を連結する。一部の実施形態では、アプタマーによりプライマーまたは核酸を連結する。断片を連結する場合、コピーは、それらの間での結合が防止されるように同相になるように方向付けられる。
【0101】
ある特定の実施形態では、リンカーは、抗体であってよい。抗体は、単量体、二量体または五量体であってよい。2種のプライマーまたは核酸を接合するための任意の抗体を使用することができることが理解されるべきである。例えば、ヌクレオシドを、タンパク質とカップリングすることによって免疫原性にすることができることは当技術分野で公知である。Void、BS(1979年)、Nucl Acids Res、7巻、193~204頁を参照されたい。さらに、抗体を、修飾核酸に結合するように調製することができる。Biochemical Education、12巻、3号を参照されたい。
【0102】
リンカーは、増幅の間、複合体に付着したままであってよい。一部の実施形態では、リンカーを増幅前に除去する。一部の実施形態では、リンカーを結合性分子に付着させ、次いで、結合性分子を増幅プライマーに付着させる。リンカーを除去すると、結合性分子または結合性プライマーが露出する。露出した結合性分子が固体支持体にも付着し、アーチが形成される。リンカーは、溶媒での洗浄、熱の適用、pHの変更、界面活性剤または界面活性物質での洗浄などを含めた、当技術分野における任意の公知の方法によって除去することができる。
【0103】
本発明の方法は、リンカー分子を用いて連結する核酸を提供する。遺伝子材料が少ない試料では、同一の断片または二重鎖核酸の両方の鎖を含む断片が同時にまたは逐次的に増幅されることを確実にするために、核酸を連結することができる。出生前試料などの試料は、遺伝子含有量が低く、本発明による連結断片を増幅することにより、検出可能な含有量が増加する。この方法では、シグナルノイズ比が低下し、標的配列の検出が改善される。
【0104】
本発明の方法では、断片などの標的核酸を検出可能なレベルまで増幅するために、増幅を利用する。任意の公知の増幅技法を本発明において使用することができることが理解されるべきである。さらに、増幅プロセスによって創出される増幅したセグメントは、それ自体がその後の増幅のための効率的な鋳型になり得る。
【0105】
増幅とは、核酸配列の追加的なコピーの生成を指し、一般に、ポリメラーゼ連鎖反応または当技術分野で周知の他の技術を使用して実施される(例えば、DieffenbachおよびDveksler、PCR Primer, a Laboratory Manual、Cold Spring Harbor Press、Plainview、N.Y.[1995年])。増幅反応は、ポリメラーゼ連鎖反応、ネステッドポリメラーゼ連鎖反応、リガーゼ連鎖反応(Barany F.(1991年)PNAS、88巻:189~193頁;Barany F.(1991年)PCR Methods and
Applications、1巻:5~16頁)、リガーゼ検出反応(Barany F.(1991年)PNAS、88巻:189~193頁)、転写に基づく増幅系、核酸配列に基づく増幅、ローリングサークル増幅、および超分枝ローリングサークル増幅などの、核酸分子を増幅する当技術分野で公知の任意の増幅反応であってよい。
【0106】
一部の実施形態では、PCRに基づくものではないDNA増幅技法である多重置換増幅(MDA)により、微量のDNA試料をゲノム解析のために迅速に増幅する。反応はランダムな六量体プライマーを鋳型とアニーリングすることによって開始される。DNA合成を忠実度の高い酵素によって一定の温度で行う。しかし、任意の増幅方法を本発明と共に使用することができることが理解されるべきである。
【0107】
本発明のある特定の実施形態では、増幅反応は、ポリメラーゼ連鎖反応である。ポリメラーゼ連鎖反応(PCR)とは、ゲノムDNAの混合物中の標的配列のセグメントの濃度を、クローニングまたは精製を伴わずに上昇させるための、K. B. Mullisに
よる方法(米国特許第4,683,195号および同第4,683,202号、これによって参照により組み込まれる)を指す。標的配列を増幅するためのプロセスは、所望の標的配列を含有するDNA混合物に過剰なオリゴヌクレオチドプライマーを導入し、その後、DNAポリメラーゼの存在下で的確な熱サイクルを連続させる。プライマーはそれらの二本鎖標的配列のそれぞれの鎖に相補的である。
本発明の一部の態様では、PCRプライマーをリンカー分子により接合し、PCRプロセスを通じて、同一の断片のコピーまたは二重鎖断片の両方の鎖とプライマーを連結する。他の実施形態では、アダプターをプライマーまたは断片のコピーに付加する。得られる複合体は、一般に、連結用分子によって直接または間接的に接合した、2つの同一の断片のコピーまたは二重鎖核酸のセンス鎖およびアンチセンス鎖を含む。連結断片または鎖の一方または両方がエラーを含み得ることが理解されるべきである。しかし、それぞれが正確に同じ塩基においてマッチするエラーを有する確率は低い。塩基における2つの断片間の不一致は、真のバリアントとは対照的に、エラーを示す。次いで、塩基を、単に未加工のシーケンシングデータから不明のものと同定することができる。
【0108】
プライマーは、これだけに限定されないが、適切な配列のクローニングおよび当技術分野で周知の方法を使用した直接化学合成を含めた種々の方法によって調製することができる(Narangら、Methods Enzymol.、68巻:90頁(1979年);Brownら、Methods Enzymol.、68巻:109頁(1979年))。プライマーは、Operon Technologies、Amersham Pharmacia Biotech、Sigma、およびLife Technologiesなどの商業的な供給源から入手することもできる。プライマーは、同一の融解温度を有するものであってよい。プライマーの長さを5’末端または3’末端において伸長または短縮して、所望の融解温度を有するプライマーを生成することができる。また、各プライマー対のアニーリング位置を、プライマー対の配列および長さにより所望の融解温度がもたらされるように設計することができる。25塩基対よりも小さなプライマーの融解温度を決定するための最も単純な方程式は、Wallace則(Td=2(A+T)+4(G+C))である。これだけに限定されないが、Array Designer Software(Arrayit Inc.)、Oligonucleotide Probe Sequence Design Software for Genetic Analysis(Olympus Optical Co.)、NetPrimer、およびHitachi Software EngineeringからのDNAsisを含めたコンピュータプログラムをプライマーの設計に使用することもできる。各プライマーのTM(融解またはアニーリング温度)は、Invitrogen Corpから入手可能なOligo Designなどのソフトウェアプログラムを使用して算出される。
【0109】
一部の実施形態では、増幅をもたらすために、混合物を変性させ、次いで、プライマーを標的分子内のそれらの相補配列とアニーリングさせる。アニーリング後、新しい相補鎖の対を形成するために、ポリメラーゼを用いてプライマーを伸長させる。所望の標的配列の増幅したセグメントを高濃度で得るために、変性、プライマーアニーリングおよびポリメラーゼ伸長のステップを何度も繰り返すことができる(すなわち、変性、アニーリングおよび伸長が1サイクルを構成し、多数のサイクルを行うことができる)。所望の標的配列の増幅したセグメントの長さは、プライマーの互いとの相対的な位置によって決定され、したがって、この長さは制御可能なパラメーターである。
【0110】
一部の実施形態では、本発明の複合体を創出するために、プライマーを連結用分子またはスペーサー分子によって連結して、2つの連結断片のコピーを創出する。他の実施形態では、2つの断片を少なくとも1つのPCRステップの後に連結する。PCRは、断片を連結用分子によって接合する前、またはその後に断片に適用することができることが理解
されるべきである。一部の実施形態では、断片を接合する場合、接合した断片に対してPCRを実行することができる。一部の実施形態では、連結コピーに増幅を行う。増幅ステップは、連結プライマーを含む。結果は、PCRのサイクル後、断片のコピーを含む連結複合体が生成するというものである。
【0111】
PCRを用いると、ゲノムDNA内の特定の標的配列の単一コピーを、いくつかの異なる方法体系(例えば、染色、標識したプローブとのハイブリダイゼーション;ビオチン化プライマーの組み入れ、その後のアビジン-酵素コンジュゲートによる検出;32P標識した、dCTPまたはdATPなどのデオキシヌクレオチド三リン酸の増幅したセグメントへの組み入れ)によって検出することができるレベルまで増幅することが可能である。ゲノムDNAに加えて、任意のオリゴヌクレオチド配列を適切なプライマー分子のセットを用いて増幅することができる。特に、PCRプロセスによって創出される増幅したセグメント自体が、その後のPCR増幅のための効率的な鋳型である。増幅された標的配列を使用して、組換えベクターに挿入するためのDNA(例えば、遺伝子)のセグメントを得ることができる。
【0112】
他の増幅方法および戦略も本発明において利用することができる。例えば、別の手法は、PCRとリガーゼ連鎖反応(LCR)を組み合わせることである。PCRではLCRよりも速く増幅がなされ、開始に必要な標的DNAのコピーがより少ないので、PCRを第1のステップとして使用し、その後にLCRを行うことができる。次いで、増幅産物をLCRまたはリガーゼ検出反応(LDR)において、突然変異が存在するかどうかを示すものであるアレル特異的に使用することができる。別の手法は、LCRまたはLDRを増幅およびアレル特異的識別の両方に使用することである。後者の反応は、線形増幅がもたらされるという点で有利である。したがって、増幅産物の量は、元の検体における標的DNAの量を反映するものであり、したがって、定量化を可能にするものである。
【0113】
LCRでは、標的配列の全長と相補的な近接するオリゴヌクレオチドの対を利用する(Barany F.(1991年)PNAS、88巻:189~193頁;Barany
F.(1991年)PCR Methods and Applications、1巻:5~16頁)。標的配列がこれらの配列の接合部においてプライマーと完全に相補的である場合、DNAリガーゼが近接する3’および5’末端ヌクレオチドに連結し、それにより複合配列が形成される。熱サイクルで熱安定性DNAリガーゼを使用すると、複合配列が逐次的に増幅される。オリゴヌクレオチドの接合部における一塩基ミスマッチにより、ライゲーションおよび増幅が妨げられる。したがって、プロセスは、アレル特異的である。突然変異体に特異的な3’ヌクレオチドを有するオリゴヌクレオチドの別のセットを別の反応において使用して、突然変異アレルを同定する。一連の標準の条件を使用して、任意の既知の部位における全ての可能性のある突然変異を検出することができる。LCRでは、一般には、ゲノムDNAの両方の鎖を4種のプライマーとのオリゴヌクレオチドハイブリダイゼーションの標的として利用し、産物を、熱サイクルを繰り返すことによって指数関数的に増加させる。
【0114】
増幅またはシーケンシングアダプターまたはバーコード、またはこれらの組合せを、断片化された核酸に付着させることができる。そのような分子は、例えばIntegrated DNA Technologies(Coralville、IA)からなど、商業的に得ることができる。ある特定の実施形態では、そのような配列を鋳型核酸分子にリガーゼなどの酵素を用いて付着させる。適切なリガーゼとしては、New England Biolabs(Ipswich、MA)から市販されているT4 DNAリガーゼおよびT4 RNAリガーゼが挙げられる。ライゲーションは、平滑末端によるものであってもよく、相補的な突出末端の使用を介するものであってもよい。
ある特定の実施形態では、断片化後、平滑末端を形成するために、断片の末端を修復し
、余分を切り取る(例えばエキソヌクレアーゼを使用して)、または埋める(例えば、ポリメラーゼおよびdNTPを使用して)。一部の実施形態では、Epicentre Biotechnologies(Madison、WI)から入手可能なものなどの市販のキットを使用して末端修復を実施して、平滑末端5’リン酸化核酸末端を生じさせる。平滑末端が生じたら、末端をポリメラーゼおよびdATPで処理して、断片の3’末端および5’末端への付加と独立した鋳型を形成させ、したがって、単一のA突出部を生成する。この単一のAが、T-Aクローニングと称される方法における断片と5’末端由来の単一のT突出部とのライゲーションのガイドになり得る。あるいは、制限酵素によって残される突出部の可能性のある組合せは制限酵素消化後に分かるので、末端をそのまま、すなわち、不揃いの末端のままにすることもできる。ある特定の実施形態では、相補的な突出末端を有する二本鎖オリゴヌクレオチドを使用する。
【0115】
ある特定の実施形態では、1つまたは複数のバーコードを、それぞれの、任意の、または全ての断片に付着させる。バーコード配列は、一般に、配列をシーケンシング反応において有用なものにするある特定の特徴を含む。バーコード配列は、各配列が核酸の特定の部分と相関し、それにより、配列読み取りが、それらが由来する部分とまた相関することが可能になるように設計される。バーコード配列のセットを設計する方法は、例えば、その内容全体が参照により本明細書に組み込まれる米国特許第6,235,475号に示されている。ある特定の実施形態では、バーコード配列を鋳型核酸分子に、例えば酵素を用いて付着させる。酵素は、上記のリガーゼまたはポリメラーゼであってよい。バーコード配列の核酸鋳型への付着は、それぞれの内容全体が参照により本明細書に組み込まれる米国特許公開第2008/0081330号および米国特許公開第2011/0301042号に示されている。バーコード配列のセットを設計するための方法およびバーコード配列を付着させるための他の方法は、それぞれの内容全体が参照により本明細書に組み込まれる米国特許第7,537,897号;同第6,138,077号;同第6,352,828号;同第5,636,400号;同第6,172,214号;および同第5,863,722号に示されている。任意の処理ステップ(例えば、入手、単離、断片化、増幅、またはバーコーディング)の後に、核酸をシーケンシングすることができる。
【0116】
例証的なバーコード配列のセットを設計するための方法およびバーコード配列を付着させるための他の方法は、それぞれの内容全体が参照により本明細書に組み込まれる、米国特許第6,138,077号;同第6,352,828号;同第5,636,400号;同第6,172,214号;同第6235,475号;同第7,393,665号;同第7,544,473号;同第5,846,719号;同第5,695,934号;同第5,604,097号;同第6,150,516号;同第RE39,793号;同第7,537,897号;同第6172,218号;および同第5,863,722号に示されている。
【0117】
バーコード配列は、一般に、配列をシーケンシング反応において有用なものにするある特定の特徴を有する。例えば、バーコード配列は、最小のホモポリマー領域を有するまたはホモポリマー領域を有さない、すなわち、バーコード配列内で、例えばAAまたはCCCなど、一列に同じ塩基を2つまたはそれよりも多くを有さないように設計することができる。バーコード配列はまた、シーケンシングされる標的領域と重複しない、または標的と同一の配列を含有しないように設計することもできる。
【0118】
第1のバーコード配列および第2のバーコード配列を、配列の各対が特定の試料と相関し、それにより、試料を区別し、検証することが可能になるように設計する。バーコード配列のセットを設計する方法は、例えば、その内容全体が参照により本明細書に組み込まれるBrennerら(米国特許第6,235,475号)に示されている。ある特定の実施形態では、バーコード配列は、約2ヌクレオチドから約50ヌクレオチドまで、好ま
しくは約4ヌクレオチドから約20ヌクレオチドまでにわたる。バーコード配列は、鋳型核酸と一緒にシーケンシングされる、または別個の読み取りでシーケンシングすることもできるので、オリゴヌクレオチド長は、付着した鋳型核酸からの最長の読み取りを可能にするための最小の長さであるべきである。一般に、バーコード配列は、鋳型核酸分子から少なくとも1塩基の間隔を空ける。
【0119】
本発明の方法は、バーコード配列を鋳型核酸に付着させることを伴う。鋳型核酸は、種々の機械的方法、化学的方法および/または酵素的方法を使用して、所望の長さ、例えば、一般に、100塩基から500塩基までまたはそれより長くまで断片化またはせん断することができる。DNAは、超音波処理によってランダムにせん断すること、DNaseまたは1種もしくは複数種の制限酵素、トランスポザーゼ、またはニッキング酵素に曝露させることができる。RNAは、RNase、熱とそれに加えてマグネシウムに簡単に曝露させることによって、またはせん断によって断片化することができる。RNAは、断片化の前またはその後にcDNAに変換することができる。
【0120】
バーコード配列を、当技術分野で公知の方法を使用して鋳型に組み込む。バーコード配列を、例えば、リガーゼ、ポリメラーゼ、Topoクローニング(例えば、Invitrogenのトポイソメラーゼ酵素を使用したトポイソメラーゼベクタークローニングシステム)、または化学的ライゲーションもしくはコンジュゲーションを使用して鋳型に組み込む。リガーゼは、オリゴヌクレオチド(RNAまたはDNA)と鋳型核酸分子をライゲートすることができる任意の酵素であってよい。適切なリガーゼとしては、T4 DNAリガーゼおよびT4 RNAリガーゼが挙げられる(そのようなリガーゼはNew England Biolabsから商業的に入手可能である)。リガーゼを使用する方法は当技術分野で周知である。ポリメラーゼは、鋳型核酸分子の3’末端および5’末端にヌクレオチドを付加することができる任意の酵素であってよい。バーコード配列は、PCR反応によってPCRプライマーの一部として組み入れることができる。分子バーコードの組み入れまたはバーコードが組み入れられる場合にはその位置にかかわらず、シーケンシングアダプターは、核酸産物に二方向性に付着させることができ、したがって、同じシーケンシングの実行において、標的配列の5’末端および3’末端のどちらに由来するシーケンシング読み取りも存在することになる。一部の場合では、読み取りの方向を示すために標的配列の5’末端または3’末端におけるバーコードの位置を使用することが有利である。シーケンシングアダプターを、PCRまたはライゲーションなどの技法を使用してどのように付着させるかは当業者には周知である。
【0121】
図6は、可能性のあるアダプターおよびプライマーの立体配置の例を示す。602に示されている通り、P7プライマーがRead2プライマー部位に付着しており、Read2プライマー部位は相補領域に付着している。603では、連結PCRプライミング領域が固有の分子識別子に付着している。604に示されている通り、P5プライマーがインデックス読み取りプライマー部位、およびシーディング制御部位に付着している。
【0122】
一部の実施形態では、断片の多数のコピーを接合する。2つ、3つ、4つなどいずれにせよ任意の数の断片を接合することができることが理解されるべきである。接合したコピーは、単位と称することができる。次いで、いくつかの単位を連結用分子を用いて接合することができる。任意の数の単位を連結用分子によって接合することができることが理解されるべきである。これにより、複合体内の情報密度が増大する。複合体を固体支持体に付着させたら、複合体を増幅する。増幅産物を固体支持体に付着させることができる。断片の複数のコピーを接合して複合体にし、次いで複合体を増幅することにより、固体支持体上の情報密度が増大する。
【0123】
ある特定の実施形態では、核酸を2つまたはそれよりも多くの接合したプライマーによ
って増幅することができる。任意の公知の増幅方法を連結プライマーと併せて使用することができる。ある特定の実施形態では、デジタルPCRまたはエマルジョンPCRを使用して、シーケンシングクラスターにシードするためまたは他のシーケンシング方法において使用するための2つまたはそれよりも多くの連結核酸断片を創出することができる。好ましい実施形態では、アダプターをシーケンシングされる目的の核酸断片とライゲートすることによって鋳型核酸を創出することができる。アダプターは、任意選択で、ユニバーサルプライミング部位、1つまたは複数のシーケンシングプライマー部位、および所与のクラスター内の全てのシーケンシング読み取りが同じ出発鋳型を起源とすることを確実にするための固有のクラスター識別子を含んでよい。図9は、本発明のある特定の実施形態に従って設計された例証的なライゲーションアダプターを示す。例えば、アダプターは、y1:CCTACTCGCTAC(配列番号1)、y2:ATGCGAGCCTCT(配列番号2)、y3:GCACCTCATCCA(配列番号3)、およびy4:TGCAGGATGGTG(配列番号4)などの様々なステム領域と共に使用することができる。アダプター配列は、シーケンシングフローセル上の隣接するクラスターを区別するために、一連のランダムな塩基(例えば、2つ、3つ、4つ、5つ、またはそれよりも多く)を含んでよい固有のクラスター識別子(UCI)を含んでよい。アダプター配列は、T突出部を除去し、ライゲーション効率を低下させる可能性がある3’エキソヌクレアーゼ消化を低減するために、ホスホロチオエート連結したTを含んでよい。3’リン酸ブロッカーは任意選択であり、本発明のデジタルPCR方法に必須なものではない。
【0124】
シーケンシングされる核酸断片にアダプターをライゲートしたら、エマルジョンまたはドロップレットを創出することができる。ドロップレットは、不混和性担体流体で囲まれた水性ドロップレットであってよい。そのようなドロップレットを形成させ、ドロップレットを用いたPCR増幅を行う方法は、例えば、Linkら(米国特許出願第2008/0014589号、同第2008/0003142号、および同第2010/0137163号)、Stoneら(米国特許第7,708,949号および米国特許出願第2010/0172803号)、ならびにAndersonら(米国特許第7,041,481号、RE41,780として再発行)に示されている。
【0125】
好ましい実施形態では、最終的なクラスターにただ1つの鋳型分子がシードされることを確実にするため、および異なる核酸断片を含有するハイブリッド連結核酸複合体の形成を防止するために、単一の鋳型核酸分子をドロップレットに添加する。遺伝子特異的であってよい種々のマルチプレックスプライマーも、連結プライマーと一緒にドロップレットに添加することができる。連結プライマーは、本明細書に記載の方法のいずれかに従って連結された2つまたはそれよりも多くのプライマーであってよい。連結プライマーは、例えば、ライゲートされたアダプターにおけるユニバーサルプライミング部位に対応するユニバーサルプライミング部位ならびにシーケンシングプライマー部位(例えば、1つよりも多くの分子がクラスターにシードされている時に同定するための異なるインデックスプライミング部位)を含んでよい。ある特定の実施形態では、連結プライマーは、シーケンシングされる特定の関心領域を標的とする遺伝子特異的プライマーを含んでよく、したがって、最初のライゲートするステップを回避することができ、また、連結プライマーデジタルPCR増幅のために非修飾核酸断片を直接ドロップレットに添加することができる。図10は、ある特定の本発明の方法によるプライマーおよびライゲートされた鋳型核酸断片を例示し、ここで、ライゲートされた鋳型は連結ユニバーサルプライマーのプライミング部位に対応するプライミング部位を含み、また、標的核酸の連結コピーを創出するために遺伝子特異的マルチプレックスプライマーを使用する。
【0126】
図7は、本発明の例証的な連結プライマーエマルジョンPCR方法を例示する。関心領域724を有する無細胞DNAなどの試料核酸断片701をアダプター725とライゲーション703して、鋳型分子730を形成させる。次いで、ドロップレット726中で、
単一の鋳型分子730、連結プライマー722、およびマルチプレックス遺伝子特異的プライマー723を含むエマルジョンを創出705する。次いで、公知のエマルジョンPCR方法を使用して鋳型をドロップレット中で増幅して、シーケンシングプライマー部位、核酸の関心領域724および本明細書に記載の他の任意選択の配列のいずれかを含む鋳型分子730の連結コピーを創出する。次いで、エマルジョンを任意の公知の方法に従って破壊707して、鋳型分子の連結コピーを放出させる。PCR増幅により連結鋳型分子にPCRエラー721が導入される可能性があるが、二重コピークラスターシーディングを伴う開示されている方法の性質は、そのようなエラーを同定し、クラスターにシードする連結コピーの両方に存在することになる真のバリアント720と区別することができるものであることに留意するべきである。次いで、連結鋳型分子730を、クラスターシーディングをシーケンシングするために、任意選択で、スクリーニング、精製、または酵素的選択709することができる。次いで、連結鋳型730をフローセルとハイブリダイズさせるか、またはそうでなければ他で記載されている通りシーケンシング711する。
【0127】
前に記載した通り、連結鋳型分子は、2つまたはそれよりも多くの核酸断片のコピーを含んでよい。図8は、4つの断片コピーを含む連結鋳型分子または複合体を形成するために使用するドロップレット726を例示する。ドロップレット726は、2つの交互プライマーの2つのコピーを有する4つの連結プライマーの複合体722を含む。そのような連結プライマーの複合体は、例えば、上記のストレプトアビジン/ビオチン四量体を使用して形成させることができる。ドロップレット726は、遺伝子特異的マルチプレックスプライマー723、および、好ましくは、シーケンシングされる核酸断片鋳型分子730の単一コピーをさらに含んでよい。そうでなければ、ドロップレットを図7に関して記載されているのと同じ様式でPCR増幅に供することができ、シーケンシングのためにクラスターにシードし、また、希な場合正真正銘のバリアント720とPCRエラー721または他の偽陽性の同定および区別を補助する、4つの鋳型分子の連結コピーが生成するという代替的な結果が伴う。
【0128】
ある特定の実施形態では、本発明の方法は、高密度シーケンシングの実行において近くのクラスター間のクロストークを減少させることに関する。図15は、シーケンシング読み取り中に隣接するクラスターからのマッチする塩基により単一のクラスター内の真の混合塩基が遮蔽される可能性があるクロストークによって提示される問題を例示する。このクロストークを減少させるために、異なるシーケンシングプライマー部位を有する第2のアダプターをライゲーション中に添加することができ、対応するシーケンシングプライマーを使用して、クラスター内での塩基の一致と隣接するクラスター間での塩基の一致の区別を補助する。これらの方法は任意の標準のシーケンシング技法において使用することができるが、図13および14は、連結プライマーエマルジョンPCRおよび連結断片クラスターシーディングに適用される方法を例示する。図13は、それぞれ関心領域724および736を有する無細胞DNAなどの複数の試料核酸断片701および735を示し、これらを2つの異なるアダプター725および734とライゲーション703して、異なる関心領域724および736を特徴付けされるバリアント720と一緒に含む第1の鋳型分子730および第2の鋳型分子733を形成させる。次いで、2つのエマルジョンを創出705し、これらのエマルジョンはそれぞれ、鋳型分子730または733のうちの一方、各アダプターに対応する連結プライマー722、およびマルチプレックス遺伝子特異的プライマー723をドロップレット726中に含む。次いで、公知のエマルジョンPCR方法を使用して鋳型をドロップレット中で増幅して、2つの異なるアダプター725および734によって導入された異なるシーケンシングプライマー部位を含む鋳型分子730および733の連結コピーを創出する。次いで、エマルジョンを任意の公知の方法に従って破壊707して、鋳型分子730および733の連結コピーを放出させる。PCR増幅により連結鋳型分子にPCRエラー721が導入される可能性があるが、二重コピークラスターシーディングを伴う開示されている方法の性質は、そのようなエラーをそのよ
うに同定し、クラスターにシードする連結コピーの両方に存在することになるバリアント720と区別することができるというものであることに留意するべきである。次いで、連結鋳型分子730および733を、クラスターシーディングをシーケンシングするために、任意選択で、スクリーニング、精製、または酵素的選択709することができる。次いで、連結鋳型730をフローセルとハイブリダイズさせるまたはそうでなければ他で記載されている通りシーケンシング711する。
【0129】
図14に示されている通り、クラスターに2つの鋳型アダプター725または734のうちの一方をシードする。シーケンシング方法の例証的なステップは、次いで、クラスターの全ての一方のセンスにわたって共通するシーケンシングプライミング部位を使用して短い読み取りを行うこと;クラスターの全ての他方のセンスにわたって共通するインデックス読み取りを行って、複数の鋳型による可能性のあるクラスターシーディングを同定すること;第2のアダプター734のシーケンシングプライミング部位に対応するプライマーを用いて標的クラスターに対する読み取りを行うこと;および、次いで、第1のアダプター725のシーケンシングプライミング部位に対応するプライマーを用いて隣接するクラスターに対する長いインデックス読み取りを行うことを含む。隣接するクラスターが第1のアダプター725のシーケンシングプライミング部位を含有する確率は50%であり、上記の技法を使用することにより、隣接するクラスターの読み取りを同定し、単一のクラスター内の混合塩基を遮蔽するクロストークのリスクを減少させることができる。本発明の方法によってもたらされるクロストークの減少で、バリアント720の同定およびPCRエラー721との区別をより確実に実現することができる。
【0130】
図1Aに示されている通り、リンカー103は、濃度駆動Tmを有する2つの短いプライマー105を含む。リンカー103またはプライマー105は、ユニバーサルアダプターにも付着させることができる(示されていない)。上記のエマルジョンPCR技法の代替として、連結プライマー増幅を、複数のリニアPCRステップを使用して実現することができる。リニアPCRの間、ゲノム鋳型の2つのコピー107を調製する。図1Bに示されている通り、複合体109は、リンカー103、プライマー105および核酸鋳型の同一のコピー107を含む。図1Cに示されている通り、異なるリンカー116およびアダプター118を使用した第2のリニアPCRステップを使用して、核酸鋳型107に対して逆のセンス114を創出する。複合体109および119にユニバーサルPCRなどの増幅の追加的なステップを行って、両方のセンス(センスおよびアンチセンス)の複数のアンプリコンを創出する。図1Dおよび1Eを参照されたい。
【0131】
複合体の例が図3に示されている。図3に示されている通り、複合体301は、2種のプライマー303に付着したリンカー301を含有する。複合体はまた、配列読み取りプライマー305および標的核酸309に連結するためのアダプター307も含む。複合体はまた、相補的なアダプター311およびプライマー313も含む。好ましい実施形態では、プライマー313はP7プライマーであり、プライマー303はP5プライマーである。アダプター、プライマー、および標的核酸の任意の組合せ、方向または立体配置を組織化することができることが理解されるべきである。複合体はバーコードを含んでよいことも理解されるべきである。図3は例であり、実施形態を限定するものではない。
【0132】
本発明の複合体は、マイクロビーズ、ビーズ、チャネル壁、マイクロチップなどの種々の固体支持体に付着させることができる。
【0133】
接合した断片のシーケンシングは、当技術分野で公知の任意の方法によるものであってよい。本発明は、Roche/454 Life Sciencesからのゲノムシーケンサー(Marguliesら(2005年)Nature、437巻:376~380頁;米国特許第6,274,320号;同第6,258,568号;同第6,210,8
91号)、Life Technologies Applied Biosystems(Grand Island、NY)からのSOLiDシステム、Helicos Biosciences(Cambridge、MA)からのHELISCOPEシステム(例えば、米国特許公開第2007/0070349号を参照されたい)、およびLife Technologies Ion Torrent、Ion Torrent Systems,Inc.(Guilford、CT)からのIonシーケンサーを含めた種々のシーケンシングプラットフォームに適用される。
【0134】
好ましい実施形態では、シーケンシングは、各塩基を逐次的に決定することができる方法による。DNAシーケンシング技法としては、標識したターミネーターまたはプライマーおよび平板または毛細管におけるゲル分離を使用する古典的なジデオキシシーケンシング反応(Sanger法)、可逆的に終結させた標識したヌクレオチドを使用する合成によるシーケンシング、パイロシーケンシング、454シーケンシング、標識したオリゴヌクレオチドプローブのライブラリーとのアレル特異的ハイブリダイゼーション、標識したクローンのライブラリーとのアレル特異的ハイブリダイゼーションを使用し、その後、ライゲーション、重合ステップ中の標識したヌクレオチドの組み入れのリアルタイムモニタリングを行う、合成によるシーケンシング、polonyシーケンシング、およびSOLiDシーケンシングが挙げられる。分離した分子のシーケンシングがつい最近、ポリメラーゼまたはリガーゼを使用する逐次的なまたは単一の伸長反応によって、ならびにプローブのライブラリーとの単一のまたは逐次的な示差的ハイブリダイゼーションによって実証された。
【0135】
リンカーをアダプター、プライマー、または結合性分子に付着させることもできることが理解されるべきである。リンカーは、これらの種に、任意の方向または配置で付着させることができる。連結用分子をアダプターまたはプライマーに直接付着させ、核酸断片に間接的に連結することができる。本発明の一部の態様では、連結用分子を増幅の前、またはその後に除去することができる。一部の実施形態では、連結用分子を複合体に残存させる。一部の実施形態では、連結用分子をシーケンシングの前に除去し、他の実施形態では、連結用分子をシーケンシングの間、複合体に残存させる。
【0136】
提供される発明の方法において使用することができるシーケンシング技法としては、例えば、Helicos True Single Molecule Sequencing(tSMS)(Harris T. D.ら(2008年)Science、320巻:106~109頁)が挙げられる。tSMS技法では、DNA試料を切断しておよそ100~200ヌクレオチドの鎖にし、ポリA配列を各DNA鎖の3’末端に付加する。蛍光標識したアデノシンヌクレオチドを付加することによって各鎖を標識する。次いで、DNA鎖を、数百万のオリゴ-T捕捉部位が表面に固定化されたフローセルとハイブリダイズさせる。鋳型の密度は、1cm当たり約1億個の鋳型であってよい。次いで、フローセルを計器、例えば、HeliScopeシーケンサーにローディングし、フローセルの表面にレーザーを照明し、それにより、各鋳型の位置を明らかにする。CCDカメラにより、フローセル表面上の鋳型の位置をマッピングすることができる。次いで、鋳型蛍光標識を切断し、洗い流す。DNAポリメラーゼおよび蛍光標識したヌクレオチドを導入することによってシーケンシング反応を開始させる。オリゴ-T核酸がプライマーとしての機能を果たす。ポリメラーゼにより標識したヌクレオチドがプライマーに鋳型指向的に組み入れられる。ポリメラーゼおよび組み入れられなかったヌクレオチドを除去する。蛍光標識したヌクレオチドの組み入れを指向させた鋳型をフローセル表面のイメージングによって検出する。イメージング後、切断ステップにより蛍光標識を除去し、他の蛍光標識したヌクレオチドを用いて、所望の読み取り長が実現されるまでプロセスを繰り返す。各ヌクレオチド付加ステップで配列情報を収集する。本発明を用いると、連結断片を縦列で同定することができる。tSMSについてのさらなる記載は、例えば、Lapidusら(
米国特許第7,169,560号)、Lapidusら(米国特許出願第2009/0191565号)、Quakeら(米国特許第6,818,395号)、Harris(米国特許第7,282,337号)、Quakeら(米国特許出願第2002/0164629号)、およびBraslavskyら、PNAS(USA)、100巻:3960~3964頁(2003年)に示されており、これらの参考文献のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。
【0137】
提供される発明の方法において使用することができるDNAシーケンシング技法の別の例は、454シーケンシングである(Roche)(Margulies, Mら、2005年、Nature、437巻、376~380頁)。454シーケンシングは、二段階を伴う。第1のステップでは、DNAをせん断しておよそ300~800塩基対の断片にし、断片を平滑末端化する。次いで、オリゴヌクレオチドアダプターを断片の末端にライゲートする。アダプターは断片の増幅およびシーケンシングのためのプライマーとして働く。断片を、DNA捕捉用ビーズ、例えば、ストレプトアビジンをコーティングしたビーズに、例えば、5’-ビオチンタグを含有するアダプターBを使用して付着させることができる。本発明の方法を使用して、上記の通り接合させた断片をビーズ上に捕捉する。ビーズに付着した接合した断片を油-水エマルジョンのドロップレット中でPCR増幅する。結果は、各ビーズ上でクローン的に増幅されたDNA断片の複数のコピーである。第2のステップでは、ビーズをウェル(ピコリットルサイズ)中に捕捉する。各DNA断片に対して並行してパイロシーケンシングを実施する。1つまたは複数のヌクレオチドの付加により光シグナルが生じ、それがシーケンシング計器のCCDカメラによって記録される。シグナル強度は組み入れられたヌクレオチドの数に比例する。パイロシーケンシングでは、ヌクレオチド付加の際に放出されるピロリン酸(PPi)を使用する。PPiはアデノシン5’-ホスホ硫酸の存在下でATPスルフリラーゼによってATPに変換される。ルシフェラーゼはルシフェリンをオキシルシフェリンに変換するためにATPを使用し、この反応により光が生じ、それを検出し、分析する。
【0138】
提供される発明の方法において使用することができるDNAシーケンシング技法の別の例は、Ion Torrentシーケンシングである(米国特許出願第2009/0026082号、同第2009/0127589号、同第2010/0035252号、同第2010/0137143号、同第2010/0188073号、同第2010/0197507号、同第2010/0282617号、同第2010/0300559号、同第2010/0300895号、同第2010/0301398号、および同第2010/0304982号)、それぞれの内容全体が参照により本明細書に組み込まれる。Ion
Torrentシーケンシングでは、DNAをせん断しておよそ300~800塩基対の断片にし、断片を平滑末端化する。次いで、オリゴヌクレオチドアダプターを断片の末端にライゲートする。アダプターは断片の増幅およびシーケンシングのためのプライマーとして働く。断片を表面に付着させることができ、断片が個別に分解可能になるような分解能で付着させる。本発明の方法を使用して、接合した断片を表面に付着させる。1つまたは複数のヌクレオチドの付加によりプロトン(H+)が放出され、そのシグナルがシーケンシング計器において検出され、記録される。シグナル強度は組み入れられたヌクレオチドの数に比例する。
【0139】
図11は、本発明のエマルジョンPCR方法を使用するIon Torrentシーケンシングのためのビーズの調製を例示する。上記の連結鋳型の調製方法と同様に、関心領域724を有する無細胞DNAなどの試料核酸断片701を、一方の末端にリニアPCRプライマー727を含み、他方の末端にユニバーサルPCRプライマー728を含むアダプターとライゲーション703して、鋳型分子730を形成する。次いで、ドロップレット726中に、単一の鋳型分子730、マルチプレックス遺伝子特異的プライマー723、およびビーズ729上に接合した複数の連結プライマーを含むエマルジョンを創出71
3する。次いで、ドロップレット中で公知のPCR方法を使用して鋳型を増幅715して、鋳型分子730の多数のコピーを有するビーズを創出し、ビーズは、PCRにより導入されたエラー721を有する可能性がある。次いで、エマルジョンを破壊し、ビーズに連結した断片731をIon Torrentシーケンシングのためにフローセルシーケンシングウェル732にローディング717する。ビーズの大部分はフローセルローディングの間に失われ、断片を含有するビーズ731のごく一部のみがフローセルウェル732に入る。
【0140】
図12は、本発明の方法に従って単一の鋳型分子からシードされたビーズを使用したIon Torrentシーケンシングのエラー同定の利点を例示し、単一のウェルからの読み取りにおける混合塩基によりPCRエラーが示され、一方、他のウェルまたは参照ゲノムと異なり得るコンセンサス読み取りにより、試料核酸における真のバリアントが示される。
【0141】
本発明は、固相増幅によって生産された増幅された核酸をシーケンシングする方法も包含する。したがって、本発明は、固相増幅を使用して核酸鋳型のプールを増幅するステップ、および、核酸シーケンシング反応を行って、固相増幅反応において生成された少なくとも1つの増幅された核酸鎖の全部または一部の配列を決定するステップを含む、核酸シーケンシングの方法を提供する。シーケンシング反応の開始点は、シーケンシングプライマーを固相増幅反応の産物とアニーリングさせることによってもたらすことができる。これに関連して、鋳型ライブラリーの形成の間に付加されたアダプターの一方または両方は、シーケンシングプライマーと鋳型ライブラリーの全ゲノムまたは固相増幅によって引き出された増幅産物とのアニーリングを可能にするヌクレオチド配列を含んでよい。
【0142】
フォワードおよびリバース増幅プライマーの両方を固体表面上に共有結合により固定化する固相増幅反応の産物は、固定化されたポリヌクレオチド鎖と固定化された相補鎖の対のアニーリングによって形成される、いわゆる架橋構造であり、両方の鎖が5’末端で固体支持体に付着している。そのような架橋構造で構成されるアレイでは、ハイブリダイゼーションのための標準の条件下では、従来のシーケンシングプライマーと固定化された鎖の一方とのハイブリダイゼーションはこの鎖とその固定化された相補鎖のアニーリングと比較して有利でないので、典型的な核酸シーケンシング技法のために非効率的な鋳型が提供される。
【0143】
核酸シーケンシングのためにより適切な鋳型をもたらすためには、少なくとも部分的に一本鎖である鋳型を生じさせるために、架橋構造における固定化された鎖の一方の実質的に全てまたは少なくとも一部分を除去するまたは置き換えることが有利であり得る。したがって、一本鎖である鋳型の一部がシーケンシングプライマーとのハイブリダイゼーションのために利用可能になる。「架橋した」二本鎖核酸構造内の1つの固定化した鎖の全部または一部を除去するプロセスを本明細書では直線化と称することができ、これは、その内容全体が参照により本明細書に組み込まれる米国特許公開第2009/0118128号においてさらに詳細に記載されている。
【0144】
架橋した鋳型構造は、一方または両方の鎖を制限エンドヌクレアーゼで切断することによってまたは一方の鎖をニッキングエンドヌクレアーゼで切断することによって直線化することができる。とりわけ、化学的切断(例えば、過ヨウ素酸を用いたジオール連結の切断)、エンドヌクレアーゼを用いた切断による脱塩基部位の切断(例えば、NEBから供給される「USER」、部品番号M55055)、または熱もしくはアルカリへの曝露によるもの、そうでなければデオキシリボヌクレオチドで構成される増幅産物に組み入れられたリボヌクレオチドの切断、光化学的切断またはペプチドリンカーの切断を含めた他の切断方法を制限酵素またはニッキング酵素の代替として使用することができる。
【0145】
切断ステップ後、切断のために使用される方法にかかわらず、切断反応の産物を、固体支持体に付着していない切断された鎖(単数または複数)の一部分(単数または複数)を除去するために、変性条件に供することができる。適切な変性条件、例えば、水酸化ナトリウム溶液、ホルムアミド溶液または熱は、標準の分子生物学プロトコール(Sambrookら、上記;Ausubelら、上記)を参照することで当業者には明らかになろう。変性により、部分的にまたは実質的に一本鎖のシーケンシング鋳型の生成がもたらされる。次いで、シーケンシングプライマーと鋳型の一本鎖部分のハイブリダイゼーションによってシーケンシング反応を開始させることができる。
【0146】
したがって、本発明は、核酸シーケンシング反応が、シーケンシングプライマーと直線化された増幅産物の一本鎖領域をハイブリダイズさせること、増幅されたシーケンシングされる鋳型鎖の領域と相補的なポリヌクレオチド鎖に1つまたは複数のヌクレオチドを逐次的に組み入れること、組み入れられたヌクレオチドの1つまたは複数に存在する塩基を同定すること、および、それにより鋳型鎖の領域の配列を決定することを含む方法を包含する。
【0147】
提供される発明の方法において使用することができるシーケンシング技術の別の例は、Illuminaシーケンシングである。Illuminaシーケンシングワークフローは、3つのステップに基づく:ライブラリーを事実上あらゆる核酸試料から調製し、増幅してクローンクラスターを生成し、大規模並列処理合成を使用してシーケンシングする。Illuminaシーケンシングは、フォールドバックPCRおよび固定されたプライマーを使用した固体表面上でのDNAの増幅に基づく。ゲノムDNAを断片化し、アダプターを断片の5’末端および3’末端に付加する。フローセルチャネルの表面に付着したDNA断片を伸長させ、ブリッジ増幅する。本発明の方法を使用して、接合した断片をフローセルチャネルに付着させ、伸長させ、ブリッジ増幅する。一部の実施形態では、リンカーをブリッジ増幅の前に除去する。一部の実施形態では、リンカーを増幅の間断片に付着したままにする。断片は二本鎖になり、その二本鎖分子を変性させる。固相増幅の複数のサイクル、その後の変性により、フローセルの各チャネルにおいて同じ鋳型の一本鎖DNA分子のおよそ1,000コピーのクラスターを数百万創出することができる。プライマー、DNAポリメラーゼ、およびフルオロフォアで標識した可逆的終結ヌクレオチド4種を使用して逐次的なシーケンシングを実施する。ヌクレオチドの組み込み後、レーザーを使用してフルオロフォアを励起させ、画像を捕捉し、第1の塩基の同一性を記録する。組み入れられた塩基それぞれから3’ターミネーターおよびフルオロフォアを除去し、組み入れ、検出および同定ステップを繰り返す。この技術に従ったシーケンシングは、それぞれの全体が参照により組み込まれる、米国特許第7,960,120号;米国特許第7,835,871号;米国特許第7,232,656号;米国特許第7,598,035号;米国特許第6,911,345号;米国特許第6,833,246号;米国特許第6,828,100号;米国特許第6,306,597号;米国特許第6,210,891号;米国特許公開第2011/0009278号;米国特許公開第2007/0114362号;米国特許公開第2006/0292611号;および米国特許公開第2006/0024681号に記載されている。
【0148】
本発明の方法をIlluminaシーケンシングプラットフォーム(Illumnia,Inc、San Diego、CAから市販されている)に組み入れることができる。本発明を使用して、2つの同一の断片のコピーまたは二重鎖断片の両方の鎖を含む連結複合体のライブラリーを調製し、次いで、固体支持体に付着させる。複合体を増幅してクローンクラスターを生成し、次いで、大規模並列処理合成を使用してシーケンシングする。この方法では、各クラスターに1つの断片がシードされる。本発明を用いると、クラスターにシードするために2つの同一の断片または二重鎖断片の両方の鎖を使用する。シーケ
ンシングの間、アンプリコン間で特定の塩基における一致がなければ、エラーが検出される。
【0149】
好ましい実施形態では、接合した断片をフローセルチャネル壁に付着させる。図2に示されている通り、複合体109および119をフローセルチャネル壁などの固体支持体202に付着させる。複合体109はセンスを含んでよく、複合体119はアンチセンスを含んでよい。各複合体をクラスターにシードする。図2に示されている通り、複合体109をクラスター1(205)にシードし、複合体119をクラスター2(207)にシードする。
【0150】
図4Aは、複合体401の例を示す。複合体401は、リンカー406および核酸鋳型の同一のコピーを含む。しかし、核酸鋳型の1つのコピーは、エラー410を含む。複合体401を固体支持体402に結合性部位405を介して付着させる。一部の実施例では、結合性部位405は、フローセル表面に共有結合した相補的なオリゴヌクレオチド(複合体上のオリゴヌクレオチドと相補的)である。図4Bに示されている通り、複合体401を伸長させ、ブリッジ増幅してコピー418を創出する。このプロセスを繰り返し、図4Cに示されている通り、固体支持体402上にクラスター450を形成させる。このプロセスから、クラスターは、複合体の各半分に由来するオリゴヌクレオチドの混合物である。オリゴヌクレオチドの約半分がエラーを含有し、あとの半分はエラーを含有しない。
【0151】
図5Aは、2つの複合体502および503を示し、複合体502はエラー510を含有する。次いで、プライマー、DNAポリメラーゼおよびフルオロフォアで標識した可逆的終結ヌクレオチド4種を導入して逐次的なシーケンシングを行う。ヌクレオチドの組み込み後、レーザーを使用してフルオロフォアを励起させ、画像を捕捉し、第1の塩基の同一性を記録する。第1の塩基にはエラーが存在しないので、両方の塩基が同じ蛍光を発する。組み入れられた塩基それぞれから3’ターミネーターおよびフルオロフォアを除去し、組み入れ、検出および同定ステップを繰り返す。これらのステップを、エラーを含有する塩基に到達するまで繰り返す。この塩基では、塩基は同じ蛍光を発しない。塩基は違うように蛍光を発する。図5Bに示されている通り、混合蛍光は、塩基がマッチしないことを示すものになる。混合蛍光はエラーを示すものになり、塩基は不明またはNとして報告される。図5Cを参照されたい。
【0152】
図16は、核酸断片のセンス鎖およびアンチセンス鎖から連結二重鎖核酸を創出するための本発明のドロップレットに基づく方法を例示する。示されているように、両方の鎖上に表される稀なバリアントを有する二本鎖無細胞DNA(cfDNA)を得ることができる。次いで、二本鎖鋳型を、エマルジョンに、1つまたは複数の遺伝子特異的フォワードプライマー(例えば、エマルジョンは、1つよりも多くの遺伝子または遺伝子の一部に特異的な多重化フォワードプライマーおよびリバースプライマーを含有してよい)、1つまたは複数の遺伝子特異的リバースプライマー、ユニバーサル連結プライマーと共に添加することができる。エマルジョンをエマルジョンPCRに供して、連結二重鎖産物を創出することができる。次いで、エマルジョンを破壊し、非連結鋳型を消化する。次いで、残りの連結二重鎖産物をシーケンシングすることができる。二本鎖産物はドロップレットにフォワードおよびリバース遺伝子特異的プライマーと共に進入するので、二重鎖配列情報を得ることができる。エマルジョンPCRの連結産物は、少なくとも約50%の時間で両方の鋳型センスを含有し、これにより、平均エラー率が低下する。図16に示されている通り、エマルジョンPCRの間にPCRエラーが二重鎖産物に導入されるが、PCRエラーは一方の鎖上にのみに存在し、真のバリアントは両方の鎖上に存在するので、この2つはシーケンシングの間に互いと容易に区別することができる。
【0153】
図17および18は、例証的なユニバーサル連結プライマーおよびフォワードおよびリ
バース遺伝子特異的プライマーならびに連結二重鎖産物を創出するためのPCR増幅におけるそれらの使用方法を示す。
【0154】
アンプリコン長は、感度を改善するために短く保持されることが好ましい。複数の実施例では、プライマー間の標的領域は約86bpである。追加的な遺伝子特異的プライマーは図19に示されている。
【0155】
図20および21は、それぞれ図17および18からの産物を使用した本発明のシーケンシング方法を例示する。連結プライマーは、2つまたはそれよりも多くの部位を含有してよく、PEG、ビオチン化DNAと結合したTraptavidin、DNAをコーティングしたビーズ、DNAをコーティングしたナノ粒子、ゲルに基づくビーズ(例えば、アクリルアミド)に連結したDNAで構成されてよい。ビーズは、ポリスチレン、ラテックス、磁気、シリカ、強磁性または類似した材料であってよい。付着は、従来の方法によるものであってよく、アミノ基とカルボキシル基の組合せによるものであることが好ましい。
【0156】
本発明の方法は、ドロップレットにより形成された連結二重鎖分子についての二重鎖同定戦略を含み得る。記載の通り、本発明のドロップレットに基づく方法は、連結二重鎖断片の形成(DNA二重鎖の各側面からの表示を含有する連結分子)を少なくとも50%の率でもたらすことができ、したがって、非二重鎖産物からのデータを省き二重鎖産物の利点を増大させる正確度を得るために、これらの産物の同定が重要になる。二重鎖同定方法としては、例えば、アニーリング温度が異なる2セットのプライマーを使用した二段階PCR手法を挙げることができ、この手法では、最初の何回かのサイクルを低温で遺伝子特異的バーコーディングプライマーを用いて実施して二重鎖の各センスを増幅および同定しながら、その後のサイクルにユニバーサル尾部を添加する。二重鎖の各センスが複数のバーコードで標識されることを防ぐために、バーコーディングサイクルの数を限定する。次いで、その後のサイクルを高温で、これらの条件下ではバーコーディングプライマーは結合することができないのでユニバーサルプライマーによって、実施することができる。次いで、二重鎖産物を、シーケンシング解析の間にそれらのセンス特異的バーコードが存在することによって同定することができる。
【0157】
図29A~Dは、本発明のある特定の実施形態による二重鎖同定方法を例示する。例示された実施例では、以下をドロップレットに添加することができる:連結プライマー;それぞれが高Tmを有する(TmはLNAを使用して上昇させることができる)ユニバーサルフォワードプライマーおよびユニバーサルリバースプライマー;それぞれがユニバーサルフォワードプライマーよりも低いTmを有し、それよりも濃度が低い、バーコーディングされたフォワード遺伝子特異的プライマーおよびバーコーディングされたリバース遺伝子特異的プライマー;および二重鎖鋳型。次いで、エマルジョンPCRを、バーコーディングされたプライマーが鋳型に結合するのを可能にする低アニーリング温度を有する第1のサイクル、その後、図29Bに示されている産物を生成するための第2の低アニーリング温度サイクルで実行することができる。第3の低アニーリング温度サイクルにより、ユニバーサルプライマー結合の第1のサイクルが可能になる。このサイクルでは、バーコーディングされたプライマーをなお結合させて[A+B]より多くのCおよびD産物を形成させ、また、CおよびD産物に結合させてより多くのEおよびF産物を形成させることもできる。
【0158】
第3のサイクル後、図29Cに示されている産物は、エマルジョン中に存在してよく、次いで、これを、第4の低アニーリング温度サイクルに供してユニバーサルプライマー結合の第2のサイクルを可能にすることができる。図29Cに示されている通り、サイクル4の最後に完全なフォワードおよびリバースユニバーサル尾部を有する分子を得ることが
できる。その後のサイクルについてアニーリング温度を上昇させることができる。異なるバーコードを有するいくつかのI型産物およびJ型産物が存在し得る(例えば、フォワード側またはリバース側のいずれかに完全なユニバーサル尾部を有する)。これらは、より高いアニーリング温度においてのみ直線的に増幅することができる。
【0159】
図29Dに示されている通り、その後のPCRサイクル(5+)は、ユニバーサルプライマーの完全なユニバーサル尾部を有するアンプリコンへの結合のみが可能になる、上昇したアニーリング温度を有してよい。最後の数回のサイクルは、増幅された鎖がフォワードユニバーサル尾部の一部を介して連結することが可能になるように低アニーリング温度におけるものであってよい。あるいは、より長い連結プライマーを完全なフォワードユニバーサル尾部と共に使用することができ、それにより、より高いアニーリング温度で連結することが可能になるが、合成は難しく、また、連結の効率はより低くなり得る。上のセンスまたは下のセンスの連結はランダムに起こり、したがって、この連結プライマーを使用する連結分子の50%はそれぞれのうちの1つを有するはずである(二重鎖情報)。ナノ粒子上に2つよりも多くの部位、例えば、100部位を有する連結プライマーは、平均して、ほぼ100%の時間で二重鎖情報を含有する。
【0160】
ある特定の実施形態では、連結二重鎖分子は、エマルジョンPCRを使用せずに創出することができる。非ドロップレット実施形態では、単一の増幅サイクルを使用して、元の断片の両方のセンス鎖およびアンチセンス鎖を有する連結二重鎖分子を創出することができる。次いで、連結二重鎖分子をシーケンシング用のフローセル中に直接ローディングし、それにより、増幅により誘導される配列または長さの偏り(例えば、全ゲノムシーケンシングにおいて)を回避する、ならびに、増幅により導入されるエラーおよびローディング効率の悪さによる核酸の喪失を回避することができる。例えば、シーケンサーのローディング効率を(アウトプット読み取りの数)/(読み取りを形成することが可能なインプット分子の数)と定義することができる場合、Illumina MiSeqについてのローディング効率は<0.1%であり、他のIllumina計器についても同様である。これは、600uLより多くの試料がシーケンサーにローディングされる一方で、約7uLしか結合のためにフローセルの内部に保持されず、その結果、出発材料が大きく喪失するので、流体喪失に大きく起因する。本明細書に記載の非ドロップレット、直接ローディング方法では、これらの非効率性が改善される。本発明の方法は、1サイクルのPCRで二重鎖分子を創出する簡易化されたワークフローを含み得る。次いで、二重鎖分子を使用して単一のクラスターにシードし、正確度の高いシーケンシング読み取りをもたらすことができる。フローセルに直接ローディングし、次いでシーケンシングすることにより、ローディングによるDNAの喪失が最小化される。
【0161】
本発明の直接ローディング、非ドロップレット方法には、例えば、組織生検、針吸引、または小さな体積の採血など、存在するDNAの質量は小さいが高い正確度が望まれる場合の全ゲノムシーケンシングを含めた適用がある。追加的な適用としては、例えば、ホルマリン固定パラフィン包埋(FFPE)試料においてなど、DNAが分解されるまたは損傷を受ける場合が挙げられる。
【0162】
図22A、22B、23A、および23Bは、本発明のある特定の実施形態による非ドロップレット連結二重鎖形成方法を示す。1つ(図22)または2つ(図23)の連結アダプターを二本鎖ゲノム鋳型にライゲートし、次いで、鎖置換型ポリメラーゼを使用して伸長させて連結二重鎖分子を創出する。次いで、シーケンシングのために連結二重鎖をフローセルに直接ローディングする。図23に例示されているものなどの2つの連結アダプターの適用では、連結断片を2つの方向に形成することができる(すなわち、リンカーを一方の末端に有する連結断片およびリンカーを逆の末端に有する連結断片)。図22Bおよび22Bに示されている通り、ライゲーションの結果、約50%の所望の連結二重鎖産
物が生じ、他の望ましくない産物はクラスターを形成しない。
【0163】
図24Aおよび24Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する。図24Aおよび24Bの例証的な方法では、フローセルを、試薬を用いて初期化する。次いで、少量の連結ライブラリーを変性させ、全体積を初期化されたフローセルにローディングする。次いで、フローセルポートを密閉し、図22および23に例示されている方法で創出されるものなどの鋳型をフローセルに結合させる。フローセル上のDNAを伸長させ、次いで、フローセルをフローセルシーケンシング計器にローディングする。例証的なフローセル結合は図25に例示されており、フローセル捕捉、伸長、連結鋳型の洗浄、ブリッジ増幅、およびシーケンシングのステップを含む。連結二重鎖鋳型の他方のセンス鎖への結合は、図25に例示されているものと類似したものである。
【0164】
図26は、例証的なオフラインシーディングプロトコールをデフォルトのプロトコールと比較して例示する。ある特定の実施形態では、オフラインシーディングプロトコールのステップは、以下のステップをベンチにおいて室温で実施することを含んでよい:LDRを5回流すステップ、PR2を5回流すステップ、HT1を流すステップ、TMPをローディングするステップ、およびポートをPCRテープで密閉するステップ。ここで、流すとは、フローセルを指定の試薬で満たし、約10秒間待ち、次いで、フローセルを空にすることを意味する。ポートをPCRテープで密閉した後、フローセルをビーズバス中、摂氏75度で10分インキュベートし、その後、摂氏40度で10分インキュベートする。フローセルを室温のベンチに戻し、密閉を解き、フローセルに摂氏40度、PR2を5回流し、AMS1を2回流し、摂氏40度で2分のインキュベーションを3回伴ってAMS1を流し、AMS1を満たし、シーケンシングのためにMiSeq計器(Illumnia,Inc、San Diego、CAから市販されている)に移す。調製プロトコールにおける追加的なステップは、フローセルをそのプラスチック収納から出し、ポートを密閉するためのPCRテープを予め切り取り、フローセルを、両側にPCRテープまたはスコッチテープを用いてビーズバスにより擦り傷から保護することを含んでよい。
【0165】
直接ローディングの実施形態に加えてフローセルローディングの収率および標的捕捉収率が重要である他の適用に関しては、喪失を最小限にするために、フローセルローディングと標的化シーケンシングを組み合わせることが有益であり得る。そのような組合せでは、さらに、余分のステップが排除されることによってワークフローが単純化される。フローセル上の標的を捕捉するための方法が存在するが、それらには少なくとも2つの欠点がある。第1に、本方法では、フローセル上に捕捉された領域をシーケンシングすることができない。無細胞DNAなどの短い断片に関してはこれがシグナルの大きな喪失の原因になり得る。第2に、本方法では、本発明に記載されている連結二重鎖分子をシーケンシングのために捕捉することができない。したがって、本発明の方法は、二重鎖分子のフローセルに基づく標的捕捉を含む。本発明の方法によると、フローセルは、標的領域を有するオリゴヌクレオチド(オリゴ)の一方のセンスを含有し、一方、他方のセンスはヘアピン状になっており、すぐには結合に利用可能でない。図27を参照されたい。連結分子の一方のセンスをフローセル上に捕捉した後、他方のフローセルオリゴを活性化して、連結断片の他方のセンスを捕捉する(例えば、ウラシル消化物、酵素消化、または光を使用する)。次いで、鋳型を伸長させることができ、クラスター生産を通常通り続けることができる。ある特定の実施形態では、1つのオリゴのセットは二重鎖核酸のセンス鎖またはアンチセンス鎖に相補的であってよく、別のセットは両方のセンス鎖およびアンチセンス鎖に付着したユニバーサルアダプターと相補的であってよく、ユニバーサルアダプターオリゴは最初の曝露ステップにおける結合を防止するためにヘアピン状であってよい。
【0166】
図28A~Eは、二重鎖分子のフローセルに基づく標的捕捉のための例証的な方法のス
テップを例示する。図28Aは、例証的な標的捕捉ステップを示し、連結分子は、直接または従来の方法によってのいずれかでフローセルにローディングされる。図28Bは、鋳型のフローセルへの結合の例証的なステップを示し、連結分子は、相補的な捕捉領域に結合し、フローセルオリゴの他方のセンスは放出されて連結断片の両方の遊離末端に結合する。図28Cは、例証的な鎖置換ステップを示し、二重にシードされたクラスターを創出するために、鎖置換型ポリメラーゼを使用して両方の断片を伸長させる。次いで、図28Dに示されている通り、連結鋳型を変性させ、フローセルから除去する。次いで、図28Eに示されている通り、ブリッジ増幅を通常通りであるが、クラスターにシードする2つの分子を用いて、行うことができる。
【0167】
本発明の直接ローディング技法は、全ゲノムシーケンシング適用において、1つまたは2つの連結アダプターを用いたフローセル標的捕捉ステップを伴わずに使用することができる。標的化シーケンシング適用では、1つまたは2つの連結アダプターを用いたライゲーション後、収率について最適化された(例えば、オフターゲット棄却は不十分であるが収率が高い)チューブに基づく標的捕捉技法を使用することができる。次いで、上記の通り、図28A~Eに記載されている標的捕捉ステップを伴ってまたは伴わずに連結二重鎖鋳型をフローセルに直接ローディングすることができる。ある特定の実施形態では、中間のチューブに基づく標的捕捉ステップを省くことができる。
【0168】
Illumina Genome Analyzer(検出器、Illuminaから市販されている)は、可逆的ターミネーター化学を使用して反復してシーケンシングされた数百万の固定化配列の並行した蛍光に基づく読み取りに基づく。一実施例では、最大8つのDNAライブラリーを8レーンのフローセルにハイブリダイズさせる。レーンのそれぞれにおいて、一本鎖のライブラリー分子をフローセル表面に共有結合した相補的なオリゴヌクレオチドにハイブリダイズさせる。各ライブラリー分子のリバース鎖を合成し、次いで、今共有結合している分子をブリッジ増幅と称されるプロセスでさらに増幅する。これにより、それぞれが出発分子の1,000よりも多くのコピーを含有するクラスターが生じる。次いで、一方の鎖を選択的に除去し、その後、遊離末端をブロックし、シーケンシングプライマーをクラスター分子のアダプター配列にアニーリングする。
【0169】
蛍光イメージングシステムは単一の鋳型分子からシグナルを検出するには感度が十分ではないが、検出器は、各クラスターからシグナルを検出するには感度がよい。本発明の本実施例では、多数のクラスターからのシグナルを解析する。各クラスターがある値、例えば、4種の塩基のうちの1つに近い値の蛍光を発することが予想される。クラスターが4種の塩基のうちの1つに近い値の蛍光を発しない場合には、その遺伝子座にエラーが存在することが決定される。
【0170】
シーケンシング後、各クラスターについて画像を解析し、強度を抽出する。Illuminaの塩基呼び出し器であるBustardでは、各サイクルおよびクラスターについて抽出される4つの強度値の2つの影響に対処しなければならない:第1に、フルオロフォアの発光スペクトルが同様であることおよび使用されるフィルターによる分離が限定されることに起因するAとCの強度の強力な相関ならびにGとTの強度の強力な相関;ならびに、第2に、それぞれフェージングおよびプレフェージングとして公知の、特定のサイクルについてのシグナルが前後のサイクルのシグナルに左右されること。フェージングおよびプレフェージングは、3’ターミネーターおよびフルオロフォアの不完全な除去、組み入れサイクルが不首尾のクラスター内の配列、ならびに有効な3’ターミネーターを有さないヌクレオチドの組み入れによって引き起こされる。フェージングおよびプレフェージングにより、特定のサイクルについて抽出される強度が、現在のサイクルのシグナルならびに前のサイクルおよび後ろのサイクルからのノイズからなるものになる。
【0171】
提供される発明の方法において使用することができるシーケンシング技術の別の例としては、Pacific Biosciencesの単一分子、リアルタイム(SMRT)技術が挙げられる。SMRTでは、4種のDNA塩基のそれぞれに4つの異なる蛍光色素のうちの1つを付着させる。これらの色素はリン酸基によって連結される。単一のDNAポリメラーゼをゼロモード導波管(ZMW)の底部で鋳型一本鎖DNAの単一分子に固定化する。ZMWは、ZMWの外部に急速に拡散する(マイクロ秒で)蛍光ヌクレオチドのバックグラウンドに対してDNAポリメラーゼによる単一のヌクレオチドの組み入れの観察を可能にする閉じ込め構造である。成長中の鎖へのヌクレオチドの組み入れには数ミリ秒かかる。この時間の間に、蛍光標識が励起され、蛍光シグナルが生じ、蛍光タグが切断される。色素の対応する蛍光の検出により、どの塩基が組み入れられたかが示される。プロセスを繰り返す。本発明の方法を使用すると、プロセスは、分析される断片を2つ用いて縦列で繰り返される。
【0172】
提供される発明の方法において使用することができるシーケンシング技法の別の例は、ナノポアシーケンシング(Soni G VおよびMeller A.(2007年)Clin Chem、53巻:1996~2001頁)である。ナノポアは、直径1ナノメートルほどの小さな穴である。ナノポアを導電性流体に浸漬し、それにわたって電位を印加することにより、ナノポアを通じたイオンの伝導に起因してわずかな電流が生じる。流れる電流の量はナノポアのサイズに感受性である。DNA分子がナノポアを通過するにつれ、DNA分子上の各ヌクレオチドによりナノポアが異なる程度にふさがれる。したがって、DNA分子がナノポアを通過するときのナノポアを通過する電流の変化は、DNA配列の読み取りを表す。本発明の方法を使用すると、2つの断片が同時にまたは逐次的に分析され、それにより、エラーの確率が低減する。
【0173】
本発明は、合成による単一分子のナノポアに基づくシーケンシング(Nano-SBS)などのナノポア技術と共に使用することができる。この戦略では、5’リン酸修飾されたヌクレオチドから放出される4つの異なるサイズのタグを検出することによって4種の塩基を区別することができる。ポリメラーゼ反応の間に各ヌクレオチドが成長中のDNA鎖に組み入れられるにつれ、そのタグが放出され、放出された順にナノポアに進入する。これにより、タグの別個の化学構造に起因する固有のイオン電流遮断サインが生じ、それにより、DNA配列が電子的に一塩基分解能の単一分子レベルで決定される。本発明の方法を使用すると、2つの同一の断片または二重鎖断片の両方の鎖を同時にまたは逐次的に分析することができる。Kumarら、Scientific Reports、論文番号、684、doi: 10.1038/srep00684を参照されたい。
【0174】
配列読み取り解析またはアセンブリなどの上記の機能は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらのいずれかの組合せを含む本発明のシステムを使用して実行することができる。
【0175】
本発明に従って使用することができるシーケンシング方法の1つは、例えば、その内容全体が参照により本明細書に組み込まれるWO04018497、US2007/0166705A1および米国特許第7,057,026号に記載されている通り、除去可能な3’ブロックを有する修飾ヌクレオチドの使用に依拠する。シーケンシングされる鋳型の領域に相補的な成長中のポリヌクレオチド鎖に修飾ヌクレオチドが組み入れられたら、さらなる配列伸長を導くために利用可能な遊離の3’OH基がなくなり、したがって、ポリメラーゼはさらなるヌクレオチドを付加することができない。成長中の鎖に組み入れられた塩基の性質が決定されたら、3’ブロックを除去して次の連続的なヌクレオチドの付加を可能にする。これらの修飾ヌクレオチドを使用して引き出される産物の順序により、DNA鋳型のDNA配列を推定することが可能である。そのような反応は、各組み入れステップの間に付加される塩基間の識別を容易にするために、修飾ヌクレオチドのそれぞれに、特定の塩基に対応することが公知の異なる標識を付着させれば、単一の実験で行うことができる。あるいは、修飾ヌクレオチドのそれぞれを別々に含有する別々の反応を行うことができる。
【0176】
図32および33は、本発明のシステムおよび方法を使用する代替物シーケンシング方法を例示する。図32に示されている通り、クラスターに複数の鋳型コピーをシードし、増幅した後、エラーを、塩基が同じではない位置における単一の読み取りにおいてシーケンシングの質が低下することを通じて真のバリアントと区別することができる。クラスター内の全ての増幅された鎖は同時点、同方向での全ての読み取りであるので、シグナルの質の低下が、クラスター内の混合塩基呼び出しを決定するための唯一のやり方である。両方のセンス鎖およびアンチセンス鎖または異なるシーケンシングプライマー部位を有する鋳型をクラスターにシードする実施形態では、2つの異なるシーケンシング読み取り(例えば、各センスからの読み取りまたは2つの異なるシーケンシングプライマーを使用し読み取り)の結果を比較することによって真のバリアントとエラーを同定することができる。図33は、2つの別々のシーケンシング読み取りを使用してセンスおよびアンチセンス読み取りからの塩基呼び出しを比較する本発明の方法を例示する。シーケンシングまたは他の導入されたエラーは、読み取りのうちの一方のみに見られるはずであるが、真のバリアントは、両方の読み取りにおいて観察されるはずである。
【0177】
連結標的捕捉方法は、標的化DNAシーケンシングのためのゲノムの関心領域の溶液に基づく捕捉を含んでよい。図34および35は、溶液に基づく標的捕捉の例証的な方法を例示する。ユニバーサルプローブおよび任意選択のバーコード(センス特異的なものであってよい)を抽出されたDNAにライゲートする。次いで、ライゲートされたDNA産物を変性させ、ユニバーサルプライミング部位および標的特異的プローブと連結したユニバーサルプローブを含む連結標的捕捉用プローブと結合させる。標的捕捉を、ユニバーサルプローブが、標的化プローブの結合に起因して局所濃度が高くならなければ単独では結合することができない温度で実施する。次いで、鎖置換型ポリメラーゼ(例えば、BST、phi29、またはSD)を使用して標的に結合した連結プローブを伸長させる。図34および35の黒色のダイヤモンド形によって示される通り、標的化プローブは伸長からブロックされ、したがって、伸長は結合したユニバーサルプローブに沿ってのみ起こり、標的化プローブに連結したままの結合した標的核酸鎖がコピーされる。次いで、いくつかの連結PCR伸長サイクルを使用して標的配列を増幅することができる。次いで、標的核酸の一方または両方の鎖を増幅するために、連結標的捕捉用プローブからのユニバーサルプライミング部位に対応するユニバーサルプライマーを使用してPCRを実施することができる。このPCRステップは、同じ反応で、清浄化ステップを必要とせずに実施することができる。次いで、増幅された標的配列を上記の通りシーケンシングすることができる。逆の方向に使用する場合には連結捕捉用プローブ間にギャップは必要ないが、ギャップがあってもよい。捕捉用プローブは、ユニバーサル5’リンカーを使用して、ユニバーサルリンカーを予め作製した捕捉用プローブと接合することによって生成することができる。捕捉用プローブをストレプトアビジン/ビオチンまたは上記の他の手段によって接合することができ、捕捉用プローブを鋳型として使用してユニバーサルリンカーを伸長させることができる。
【0178】
本発明の方法は、二重鎖分子を捕捉するための、任意選択で、ユニバーサル連結プライマーを使用する、ドロップレットに基づく標的捕捉を含む。図36に示されているドロップレットに基づく方法は、図16に例示されているものと同様であるが、上記および図34~35に示されている連結標的捕捉用プローブを使用する。ユニバーサルプローブおよび任意選択のバーコード(センス特異的なものであってよい)を抽出されたDNA(例えば、無細胞DNA)にライゲートする。エマルジョンを上記の通り二重鎖鋳型分子ならびにユニバーサルプライミング部位および標的特異的プローブと連結したユニバーサルプロ
ーブを含む標的捕捉用プローブを使用して創出する。上記の通り、標的捕捉を、ユニバーサルプローブが、標的化プローブの結合に起因して局所濃度が高くならなければ単独では結合することができない温度で実施し、また、捕捉用プローブは、それ自体の伸長はブロックされるが、ユニバーサルプライミング部位を含み、したがって、エマルジョンに含まれるユニバーサルプライマーおよび連結ユニバーサルプライマーを使用して標的核酸を増幅して、標的核酸の両方のセンス鎖およびアンチセンス鎖を含む連結二重鎖分子を生成することができる。標的捕捉を単独で実施するためにユニバーサルリンカーを省くことができる。次いで、エマルジョンを破壊し、非連結鋳型を酵素的に消化して連結二重鎖分子のみを残すことができ、次いで、クラスターにシードするまたはそうでなければ上記の通りシーケンシングすることができる。
【0179】
図37AおよびBは、本発明のドロップレットに基づく標的捕捉方法の追加的な詳細を提示する。図37Aのステップ0は、連結およびユニバーサルプライマーおよび標的捕捉用プローブと共にドロップレット中にローディングされるユニバーサルプローブおよびそれとライゲートした任意選択のバーコードを有する二重鎖鋳型分子を示す。鋳型DNAをドロップレット中で変性させ、次いで、標的捕捉用プローブを、変性させた鋳型鎖に、ユニバーサルプローブが標的化プローブも結合していなければ単独では結合しない温度で結合させる。次いで、ユニバーサルプライマーのみを捕捉された標的に結合させる。次いで、鎖置換型ポリメラーゼを用いた伸長が捕捉された標的に対してのみ起こる。図37Bに移り、次いで、連結標的捕捉用プローブおよびプライマーが使い尽くされるまで伸長サイクルを実行する(例えば、4~6回のサイクル)。次いで、得られた伸長産物をユニバーサル連結プライマーを使用して増幅して、鎖特異的バーコードを有する連結二重鎖分子を生成させる。溶液に基づく方法と同様に、逆の方向である場合には連結捕捉用プローブ間にギャップは必要ない。標的捕捉を単独で実施するためにユニバーサルリンカーを省く場合には連結捕捉用プローブを一方の方向または両方の方向に使用することができる。方法の種々の伸長および増幅ステップを行うために従来のポリメラーゼをドロップレット中で鎖置換型ポリメラーゼと混合することができる。
【0180】
本発明のある特定の方法は、連結分子の標的捕捉に関する。上記の方法を使用して創出されるものなどの分子の連結コピーを標的化し、捕捉し、シーケンシングのために連結分子に変換することができる。図38~42は、連結分子のナノ粒子標的捕捉の例証的な方法を例示する。図38は、ユニバーサルプライマーおよび捕捉される連結分子の捕捉領域に相補的な標的領域を含む鎖を有するナノ粒子を示す。図39は、捕捉領域と標的領域の結合を例示する。このステップは、標的/捕捉領域は結合するがユニバーサルプライマーは結合しない温度で起こる。結合していない鋳型をこのステップで洗い流すことができる。次いで、反応の温度を低下させて、ユニバーサルプライマーの結合を可能にすることができる。図40は、ユニバーサルプライマーと連結分子上のユニバーサルプライマー部位の結合を示す。図41は、元の連結分子の両方の鎖を含む標的分子のナノ粒子連結コピーを生成するための、鎖置換型ポリメラーゼによるユニバーサルプライマー伸長を示す。図42は、本出願の他の箇所に記載されているフローセルシーケンサーにクラスターをシードするために使用することができる二重にシードされたナノ粒子を示す。
【0181】
本発明の実施形態では、修飾ヌクレオチドを組み入れることができる。修飾ヌクレオチドは、検出のために標識(例えば、蛍光標識)することができる。したがって、例えば、その内容全体が参照により本明細書に組み込まれる米国特許公開第2010/0009353号に記載されている通り、各ヌクレオチド型が異なる蛍光標識を有してよい。しかし、検出可能な標識は蛍光標識である必要はない。組み入れられたヌクレオチドの検出を可能にする任意の標識を使用することができる。蛍光標識したヌクレオチドを検出するための1つの方法は、標識したヌクレオチドに特異的な波長のレーザー光の使用、または他の適切な照明の供給源の使用を含む。ヌクレオチド上の標識からの蛍光は、CCDカメラま
たは他の適切な検出手段によって検出することができる。クラスター化されたアレイの画像を記録するための適切な計器使用は、その内容全体が参照により本明細書に組み込まれるW007123744および米国特許公開第2010/0111768号に記載されている。
【実施例
【0182】
(実施例1)
二重にシードされたクラスターを使用したKRASアンプリコンのシーケンシングのエラーの減少
フローセルクラスターに単一の鋳型分子をシードした。単一の鋳型コピーは、図31に示されている通り、連結鋳型分子を1つのみフローセルに結合させた連結鋳型のライブラリーに由来するものであった。次いで、KRASアンプリコンにアラインメントされた最初の3000の単独でシードされたクラスターを、35よりも大きいという質の閾値を適用することでシーケンシングのエラーについて分析した。図30に示されている通り、単独でシードされたクラスターでは、約3000の平均深度で0.13%の平均エラーが生じた。単独でシードされたフローセルでは連結鋳型ライブラリーを使用したので、結果は、非連結鋳型分子を用いた標準の単一のシーディング方法を使用して生じるものよりも低いエラー率を表す可能性がある。
【0183】
次いで、フローセルクラスターに、連結鋳型分子を二重にシードし、ここで、連結分子の両方をクラスターにシードするためにフローセルに結合させた。次いで、chr12アンプリコンにアラインメントされた最初の3000の二重にシードされたクラスターを、同じく35よりも大きい質の閾値、および0.8またはそれよりも大きい蛍光純度フィルターを適用してシーケンシングのエラーについて分析した。二重にシードされたクラスターでは、シーケンシングのエラーが7分の1に減少し、分析された塩基の喪失は単独でシードされたクラスターに対して3%未満であった。二重にシードされたクラスターについての平均エラー率は、図43に示されている通り、約2920の平均深度で0.02%であった。
参照による組み込み
【0184】
特許、特許出願、特許公報、学術誌、書籍、論文、ウェブコンテンツなどの他の文書の参照および引用が本開示全体を通してなされている。そのような文書は全て、あらゆる目的に関してそれらの全体がこれにより参照により本明細書に組み込まれる。
等価物
【0185】
本発明は、その趣旨または本質的な特性から逸脱することなく他の特定の形態に具体化することができる。したがって、前述の実施形態は、あらゆる点で、本明細書に記載の発明に対する限定ではなく、例示的なものであると理解されるべきである。
【0186】
本発明は、例えば以下を提供する。
(項目1)
二重鎖核酸の標的化捕捉のための方法であって、
それぞれが捕捉領域およびプライマー部位を含む2つの5’連結標的核酸を提供するステップと、
前記2つの5’連結標的核酸を、前記捕捉領域に相補的な標的領域および複数のプライマーを含む分子に、前記標的領域と前記捕捉領域の結合は可能にするが前記プライマーと前記プライミング部位の結合は阻害する条件下で曝露させ、その結果、前記標的領域で、前記2つの5’連結標的核酸のうちの少なくとも一方を前記分子に結合させるステップと、
前記条件を、前記プライミング部位と前記プライマーの結合が可能になるように変更し、その結果、前記分子のプライマーを前記2つの5’連結標的核酸の両方の前記プライミング部位と結合させるステップと、
鎖置換型ポリメラーゼを使用して前記プライマーを伸長させて、前記5’連結標的核酸のそれぞれの分子結合コピーを生じさせるステップと
を含む方法。
(項目2)
前記プライマー部位がユニバーサルプライマー部位であり、前記プライマーがユニバーサルプライマーである、項目1に記載の方法。
(項目3)
前記5’連結標的核酸のそれぞれの前記分子結合コピーがシードされたクラスターをさらに創出する、項目1に記載の方法。
(項目4)
前記クラスターをシーケンシングするステップをさらに含む、項目3に記載の方法。
(項目5)
標的化DNAシーケンシングのためにゲノムの関心領域を捕捉するための方法であって、
ユニバーサルプローブ部位を複数の二重鎖核酸断片上にライゲートするステップであり、前記複数の二重鎖核酸断片はゲノムの関心領域を少なくとも1つ含む、ステップと、
前記複数のライゲートした二重鎖核酸断片を変性させて、ユニバーサルプローブ部位を含む一本鎖核酸断片を創出するステップと、
前記一本鎖核酸断片を、前記ゲノムの関心領域の少なくとも一部分と相補的な標的化プローブを含む複数の連結捕捉用プローブに曝露させるステップであり、前記標的化プローブは、ユニバーサルプローブおよびユニバーサルプライミング部位と連結しており、前記曝露は、前記ユニバーサルプローブと前記ユニバーサルプローブ部位の結合を可能にするために前記標的化プローブと前記標的核酸配列の結合が必要である条件下でなされ、前記標的化プローブの伸長はブロックされている、ステップと、
鎖置換型ポリメラーゼを使用して前記ユニバーサルプローブを伸長させて、前記ゲノムの関心領域のコピーを生じさせるステップと、
PCR増幅および前記ユニバーサルプライミング部位と相補的なユニバーサルプライマーを使用して前記ゲノムの関心領域を増幅するステップと、
前記ゲノムの関心領域をシーケンシングするステップと
を含む方法。
(項目6)
前記変性、曝露、伸長、および増幅ステップがエマルジョンドロップレット中でなされる、項目5に記載の方法。
(項目7)
前記増幅ステップにより前記ゲノムの関心領域の連結コピーが生じるように、前記ユニバーサルプライマーが連結である、項目6に記載の方法。
(項目8)
前記増幅ステップにより前記ゲノムの関心領域のセンス鎖およびアンチセンス鎖の連結コピーが生じるように、前記連結ユニバーサルプライマーがセンス特異的である、項目7に記載の方法。
(項目9)
前記ライゲートするステップが、前記複数の二重鎖核酸断片上に固有のバーコードをライゲートすることをさらに含む、項目5に記載の方法。
(項目10)
前記固有のバーコードが、センス特異的である、項目9に記載の方法。
図1-1】
図1-2】
図2
図3
図4-1】
図4-2】
図4-3】
図5
図6
図7
図8
図9-1】
図9-2】
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22-1】
図22-2】
図23-1】
図23-2】
図24-1】
図24-2】
図25
図26
図27
図28-1】
図28-2】
図28-3】
図28-4】
図28-5】
図29-1】
図29-2】
図29-3】
図29-4】
図30
図31
図32
図33
図34
図35
図36
図37-1】
図37-2】
図38
図39
図40
図41
図42
図43
【配列表】
0007532444000001.app