(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-28
(45)【発行日】2022-04-05
(54)【発明の名称】連結型ライゲーション
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20220329BHJP
C12Q 1/686 20180101ALI20220329BHJP
C12N 15/09 20060101ALN20220329BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/686 Z
C12N15/09 Z
(21)【出願番号】P 2019531129
(86)(22)【出願日】2017-12-07
(86)【国際出願番号】 IB2017057732
(87)【国際公開番号】W WO2018104908
(87)【国際公開日】2018-06-14
【審査請求日】2020-12-04
(32)【優先日】2016-12-09
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-10-09
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518344597
【氏名又は名称】ボリアル ジェノミクス, インコーポレイテッド
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】マルツィアリ, アンドレア
(72)【発明者】
【氏名】ペル, ジョエル
【審査官】山本 匡子
(56)【参考文献】
【文献】米国特許出願公開第2016/0122814(US,A1)
【文献】特表2016-500257(JP,A)
【文献】国際公開第2016/093838(WO,A1)
【文献】特表2016-515384(JP,A)
【文献】特表2015-500012(JP,A)
【文献】特表2015-522292(JP,A)
【文献】特表平09-512161(JP,A)
【文献】米国特許出願公開第2016/0090581(US,A1)
【文献】CLAUDIO VALSANGIACOMO et al.,Use of Amplified Fragment Length Polymorphism in Molecular Typing of Legionella pneumophila and Application to Epidemiological Studies,JOURNAL OF CLINICAL MICROBIOLOGY,1995年,Vol.33 No.7,1716-1719
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-90
C12M 1/00-3/10
C12Q
MEDLINE/BIOSIS/REGISTRY/CAPLUS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
標的核酸にアダプターを選択的にライゲートする方法であって、
標的核酸の第1の部分に相補的なプローブを含む第1の連結型ライゲーションアダプターを提供するステップであって、前記プローブは、第1のユニバーサルプライミング部位を含む第1のアダプターに連結されている、ステップと、
前記標的核酸を含む試料を、前記第1の連結型ライゲーションアダプターに曝露するステップと、
前記第1の連結型アダプターに前記標的核酸をライゲートするステップと、
前記第1のユニバーサルプライミング部位に相補的な第1のユニバーサルプライマーを使用するPCRによって、ライゲートされた標的核酸を増幅するステップと
を含む、方法。
【請求項2】
前記標的核酸をシーケンシングすることをさらに含み、前記アダプターが、シーケンシングアダプターをさらに含む、請求項1に記載の方法。
【請求項3】
前記標的核酸の第2の部分に相補的なプローブを含む第2の連結型ライゲーションアダプターを提供するステップであって、前記プローブは、第2のユニバーサルプライミング部位を含む第2のアダプターに連結されている、ステップと、
前記試料を、前記第2の連結型ライゲーションアダプターに曝露するステップと、
前記第2の連結型アダプターに前記標的核酸をライゲートするステップと
をさらに含み、
ライゲートされた標的核酸は、前記第1のユニバーサルプライマーおよび前記第2のユニバーサルプライミング部位に相補的な第2のユニバーサルプライマーを使用して増幅される、請求項1に記載の方法。
【請求項4】
前記試料が、前記第1および第2の連結型ライゲーションアダプターに同時に曝露される、請求項3に記載の方法。
【請求項5】
前記標的核酸の前記第1および前記第2の部分が同一である、請求項3に記載の方法。
【請求項6】
前記試料が、前記第1の連結型ライゲーションアダプターに曝露された後に、前記第2の連結型ライゲーションアダプターに曝露される、請求項5に記載の方法。
【請求項7】
前記標的核酸が融合核酸である、請求項1に記載の方法。
【請求項8】
前記融合核酸の一部のみが公知である、請求項7に記載の方法。
【請求項9】
前記標的核酸の第2の部分に相補的なプローブを含む第2の連結型ライゲーションアダプターを提供するステップであって、前記プローブは、第2のユニバーサルプライミング部位を含む第2のアダプターに連結されている、ステップと、
前記試料を、前記第2の連結型ライゲーションアダプターに曝露するステップと、
前記第2の連結型アダプターに前記標的核酸をライゲートするステップと
をさらに含み、
前記試料は、前記第1のユニバーサルプライマーおよび前記第2のユニバーサルプライミング部位に相補的な第2のユニバーサルプライマーを使用して増幅される、請求項
1に記載の方法。
【請求項10】
前記標的核酸の前記第1の部分に相補的な前記プローブが、ポリエチレングリコール誘導体、オリゴ糖、脂質、炭化水素、ポリマー、反転塩基およびタンパク質からなる群から選択されるリンカーによって前記第1のアダプターに連結されている、請求項1に記載の方法。
【請求項11】
前記リンカーが切断可能である、請求項
10に記載の方法。
【請求項12】
前記標的核酸が、二本鎖DNA(dsDNA)であり、
前記第1の連結型ライゲーションアダプターが、前記プローブと複合体化したリコンビナーゼをさらに含み、前記第1のアダプターが、二本鎖アダプターであり、
前記標的核酸を含む前記試料が、一本鎖結合タンパク質の存在下で前記第1の連結型ライゲーションアダプターに曝露される、請求項1に記載の方法。
【請求項13】
前記アダプターが、ランダムヌクレオチドの配列を含む、請求項1に記載の方法。
【請求項14】
前記標的核酸がDNAまたはRNAである、請求項1に記載の方法。
【請求項15】
前記曝露、ライゲーションおよび増幅ステップが、ドロップレット中で実施される、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2016年12月9日に出願された米国仮出願62/432,277号および2017年10月9日に出願された米国仮出願62/569,824号の利益およびこれらの仮出願に対する優先権を主張し、両仮出願は本明細書に参照により援用される。
【0002】
発明の分野
本発明は、概して、核酸の捕捉、増幅およびシーケンシングに関する。
【背景技術】
【0003】
背景
ハイスループットゲノムシーケンシングプラットフォームは、大量のデータを手頃な価格で生じるが、それらは十分に正確ではない。最良のシーケンシング技法であってもエラー率が約1パーセントである。これは単一のヒトゲノムの配列における何十万ものエラーに変換される。不正確な塩基呼び出し(base calling)により、配列の誤アラインメントおよび突然変異の誤識別が導かれる。塩基呼び出しおよびアラインメントアルゴリズムが利用可能であるが、増幅およびシーケンシングのエラーによって品質が負の影響を受ける。
【0004】
シーケンシングのために試料から標的核酸を単離する現在の方法は複雑であり、正確性の増大から恩恵を受けることができる。さらに、ひとたび標的核酸を捕捉し、シーケンシングすると、塩基呼び出し(base calling)およびアラインメントは、依然としてエラーばかりである。例えば、現在の主要なシーケンシングプラットフォームでは、DNA断片をチャネル壁などの固体支持体に付着させる。断片が固体支持体に付着したら、断片を増幅し、増幅産物をシーディング断片に近接する固体支持体に付着させる。このプロセスを、シーディング断片と同一であるべきである増幅産物のクラスターが形成されるまで繰り返す。しかし、クラスターにはただ1つの断片をシードする。エラーがシーディング断片に存在するまたはクラスターの増幅においてエラーが生じた場合、エラーはクラスターの全部または一部で繰り返される。このエラーにより、塩基の誤識別が導かれ、シーケンシングアラインメントが複雑になる。
【0005】
これらの型のエラーを捉えるために、標準のバーコードシーケンシング方法では、数十~数百コピーの同じ鋳型、または十~数百のクラスターを使用して比較用の試料プールを創出する。コピーまたはクラスターの数を大幅に増加させることにより、エラーを決定することができる。しかし、この戦略は費用がかかるものであり、また、シーケンシングのバンド幅を消耗する。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明は、連結型ライゲーションアダプターならびにライゲーション収率の増大および多数の捕捉およびシーケンシング技法において簡易化されたワークフローを可能にする方法を提供する。シーケンシングまたはユニバーサルプライミング部位アダプターを、配列特異的プローブに連結することによって、標的配列選択および捕捉を、アダプターライゲーションと組み合わせて、ステップを低減し、標的選択性を増大することができる。標的特異的プローブは、それに連結されたアダプターを標的配列に近接近させ、その時点で、連結型アダプターが標的配列にライゲートされ得る。アダプターは標的配列に選択的にライゲートされるので、ライゲートされたアダプター中の部位に相補的なユニバーサルプライマーを用いるその後の増幅は、標的配列のみを増幅し、シーケンシングの準備のできた標的化されたライブラリーを調製する。連結型ライゲーション技法を使用して、切断点の片側のみが公知である核酸融合物を捕捉することができる。アダプターを、融合物の公知の部分に相補的な配列特異的プローブに連結することによって、方法をさらに使用して、アダプターと選択的にライゲートし、シーケンシングのために標的融合核酸のみを増幅することができる。ある特定の実施形態では、連結型ライゲーションアダプターおよびプローブ分子の一方をフローセルに結合してもよく、その結果、同時にアダプターライゲーションによって、フローセル増幅またはシーケンシングのために標的核酸が捕捉され、調製され、既存のワークフローを単純化する。
【0007】
本発明の方法は、二本鎖連結型ライゲーションを企図している。等温リコンビナーゼおよび一本鎖結合タンパク質を使用して、ライゲーションプローブ(リコンビナーゼポリメラーゼ増幅(RPA)と同様)を用いて二本鎖DNA(dsDNA)のストランド侵入を生成することによって、方法は、dsDNAでのアダプターの標的化されたライゲーションを提供する。
【0008】
本発明は、連結型ライゲーションアダプターならびに単一DNA鋳型との2種の異なるアダプターのライゲーションおよびライゲーション収率の増大を可能にする方法を提供する。ライゲーションに先立って2種の異なるアダプターを連結することによって、反応速度論は、ひとたび1種のアダプターがライゲートされると、第2の異なる(連結型)アダプターが、その後のライゲーションのためにDNAのライゲートされていない末端に近接近されるようなものである。連結型アダプターライゲーションは、確実に2種の異なるアダプターが各鋳型にライゲートされることが望まれる適用において、一本鎖DNAで使用されても、二本鎖DNAで使用されてもよい。
【0009】
本発明は、一本鎖または二重鎖DNA分子に対する連結標的捕捉方法を提供する。溶液に基づく標的捕捉方法ならびにドロップレットに基づく標的捕捉方法が提供される。溶液に基づく方法およびドロップレットに基づく方法では、ユニバーサルプローブおよび標的特異的プローブを含む連結標的捕捉用プローブを使用し、反応は、ユニバーサルプローブの結合を可能にするために標的特異的プローブが結合することが必要になる条件下でなされる。多数の結合および伸長ステップが伴うので、従来の単一結合標的捕捉と比べて特異性が改善される。次いで、結合したユニバーサルプローブを、鎖置換型ポリメラーゼを使用して伸長させて標的鎖のコピーを生じさせ、次いでそれを、ユニバーサルプライマーを用いたPCRを使用して増幅することができる。本発明の方法では、PCR-捕捉-PCRワークフローを単一のPCRおよび捕捉ステップで置き換える。より高い特異性および二重鎖情報が必要な場合は、連結捕捉用プローブをDNAのセンスの一方または両方で使用することができる。以下に考察する通り、多数のリンカー型が可能である。本発明の溶液に基づく標的捕捉方法と同様に、使用者が、ドロップレット中での多重化PCRに制限されるのではなく、ドロップレット中での標的捕捉を実現することを可能にする、ドロップレットに基づく方法を提供する。捕捉方法を本明細書に記載の連結プライマーと組み合わせて、連結二重鎖分子をドロップレットから創出することができる。ある特定の実施形態では、標的捕捉用プローブならびにユニバーサルプライマーを含むナノ粒子を使用して、5’連結分子のプールから標的化された領域を捕捉し、標的化された分子のみを、クラスターをシーケンシングするための二重鎖シードに変換することができる。
【0010】
本発明は、二重鎖DNA分子のセンス鎖およびアンチセンス鎖の両方を表す断片を物理的に連結することによって塩基呼び出しの正確度を増大させるための方法も提供する。二重鎖データから、真のバリアントと増幅またはシーケンシングにおいて導入されるエラーとの即時の区別が可能になる(例えば、ポリメラーゼにより一方のセンスにおいてなされ得るエラーは両方の鎖で繰り返される可能性は低いが、真のバリアントは両方の鎖で繰り返される可能性がある)ため、両方の鎖を連結して単一の読み取りにすることにより、情報密度が増大し、エラー率が低下する。センス特異的バーコードを使用して、クラスター内のセンスおよびアンチセンス鋳型コピー両方の存在を確認することができる。専用のセンスおよびアンチセンスシーケンシング読み取りを使用して、導入されたエラーと真のバリアントとを区別することができる。
【0011】
本発明の方法は、試料調製およびシーケンシングに適用される。試料調製方法では、本発明により、二重鎖核酸のセンス鎖およびアンチセンス鎖の両方の断片を一緒に接合することが可能になる。連結用分子により断片を接合し、複合体を創出する。複合体は、少なくとも2つの差に加えて、アダプター、プライマー、および結合性分子を含んでよい。がん試料などの、標的DNA含有量が低い試料では、両方の鎖を一緒に連結することにより、シーケンシングおよび増幅エラーの即時識別で正確度を増大させて断片を増幅し、シーケンシングすることができる。
【0012】
連結断片は、連結増幅プライマーを用いて核酸断片を増幅することによって創出することができる。ある特定の実施形態では、ユニバーサルプライミング部位を標的断片上にライゲートして鋳型分子を創出することができる。方法は、ドロップレットおよび非ドロップレットワークフローを含んでよく、両方の鎖を表す連結分子がおよそ少なくとも50%の率で生じる。ドロップレット増幅方法では、鋳型分子を多重化遺伝子特異的フォワードおよびリバース増幅プライマーおよび連結ユニバーサルプライマーと一緒にドロップレットに添加することができる。次いで、ドロップレットをエマルジョンPCR増幅またはデジタルPCR増幅に供すことができる。増幅産物は、元の断片のセンス鎖およびアンチセンス鎖の連結コピーであるはずである。2つまたはそれよりも多くのプライマーまたは核酸断片をポリエチレングリコール誘導体、オリゴ糖、脂質、炭化水素、ポリマーまたはタンパク質によって連結することができる。ある特定の実施形態では、4つまたはそれよりも多くのビオチン化プライマーまたは核酸断片を、ストレプトアビジン分子または官能性をもたせたナノ粒子を用いて連結することができる。本発明の連結プライマーはまた、全てのクラスター読み取りが同じ鋳型分子を起源とすることを確実にするために固有のクラスター識別子配列を含んでよい。
【0013】
本発明の方法は、ドロップレットにより形成された連結二重鎖分子についての二重鎖識別戦略を含む。記載の通り、本発明のドロップレットに基づく方法は、連結二重鎖断片の形成(DNA二重鎖の各側からの表示を含有する連結分子)を少なくとも50%の率でもたらすことができ、したがって、非二重鎖産物からのデータを省き二重鎖産物の利点を増大させる正確度を得るために、これらの産物の識別が重要になる。二重鎖識別方法としては、例えば、アニーリング温度が異なる2セットのプライマーを使用した二段階PCR手法を挙げることができ、この手法では、最初の何回かのサイクルを低温で遺伝子特異的バーコーディングプライマーを用いて実施して二重鎖の各センスを増幅および識別しながら、その後のサイクルにユニバーサル尾部を添加する。二重鎖の各センスが複数のバーコードで標識されることを防ぐために、バーコーディングサイクルの数を限定する。
【0014】
次いで、その後のサイクルを高温で、これらの条件下ではバーコーディングプライマーは結合することができないのでユニバーサルプライマーによって、実施することができる。次いで、二重鎖産物を、シーケンシング解析の間にそれらのセンス特異的バーコードが存在することによって識別し、非二重鎖クラスターと区別することができる。したがって、二重鎖クラスターのシードのより高い忠実度が評価され得る。
【0015】
非ドロップレット実施形態では、単一の増幅サイクルを使用して、元の断片の両方のセンス鎖およびアンチセンス鎖を有する連結二重鎖分子を創出することができる。次いで、連結二重鎖分子をシーケンシング用のフローセル中に直接ローディングし、それにより、増幅により誘導される配列または長さの偏り(例えば、全ゲノムシーケンシングにおいて)を回避し、かつ、増幅により導入されるエラーおよびローディング効率の悪さによる核酸の喪失を回避することができる。例えば、シーケンサーのローディング効率を、(アウトプット読み取りの数)/(読み取りを形成することが可能なインプット分子の数)と定義することができる場合、Illumina MiSeqについてのローディング効率は<0.1%であり、他のIllumina計器についても同様である。これは、600uLより多くの試料がシーケンサーにローディングされる一方で、約7uLしか結合のためにフローセルの内部に保持されず、その結果、出発材料が大きく喪失するので、流体の喪失に大きく起因する。本明細書に記載の非ドロップレット、直接ローディング方法では、これらの非効率性が改善される。
【0016】
連結型二重鎖分子形成は、連結性アダプターを鋳型分子とライゲートすることおよびシーケンシングアダプターを有する連結型二重鎖鋳型を創出するための鎖置換ポリメラーゼを用いる伸長によって創出することができる。種々の実施形態では、連結性アダプターを、鋳型のもう一方の末端にライゲートされる予定のアダプターに連結して、確実に、2種の異なるアダプターが各分子にライゲートされ、2つの同一アダプターがライゲートされた分子をほぼ排除するのを補助してもよい。連結型アダプターは、単一の連結性アダプターを含む場合もあり、または2つの連結された連結性アダプターで構成されている場合もある。連結型ライゲーション技法を、Y-アダプターおよびヘアピンアダプターに同様に適用してもよい。一方のアダプターの結合が、第2の連結型アダプターが鋳型分子のもう一方の末端に結合する可能性を高めるので、ライゲーション効率は改善される。リンカーは、PEG、ヌクレオチド、反転ヌクレオチドまたは当技術分野で公知の種々の分子スペーサーおよびリンカーのいずれかを含み得る。リンカーは、切断可能であり得る(例えば、UV曝露、ウラシルまたはその他の消化によって)、またはライゲーション後の連結の解除を可能にする選択温度(Tm)での変性のための結合親和性を有する相補的配列を介して一緒に結合されてもよい。
【0017】
直接ローディングの実施形態に加えてフローセルローディングの収率および標的捕捉収率が重要である他の適用に関しては、喪失を最小限にするために、フローセルローディングと標的化シーケンシングを組み合わせることが有益であり得る。そのような組合せでは、さらに、余分のステップが排除されることによってワークフローが単純化される。フローセル上の標的を捕捉するための方法が存在するが、それらには少なくとも2つの欠点がある。第1に、それらは、フローセル上に捕捉された領域をシーケンシングすることができない。無細胞DNAなどの短い断片に関してはこれがシグナルの大きな喪失の原因になり得る。第2に、それらは、本発明に記載されている連結二重鎖分子をシーケンシングのために捕捉することができない。したがって、本発明の方法は、二重鎖分子のフローセルに基づく標的捕捉を含む。本発明の方法によると、フローセルは、標的領域を有するオリゴの一方のセンスを含有し、一方、他方のセンスはヘアピン状になっており、すぐには結合に利用可能でない。連結分子の一方のセンスをフローセル上に捕捉した後、他方のフローセルオリゴを活性化して、連結断片の他方のセンスを捕捉する(例えば、ウラシル消化、酵素消化、または光を使用する)。次いで、鋳型を伸長させることができ、クラスター生成を通常通り続けることができる。
【0018】
本発明の方法では、増幅技法に組み入れられたとき塩基呼び出しが改善される。従来の増幅方法では、アンプリコンは単一の鋳型から創出される。断片にエラーが存在する場合、増幅産物を通じてエラーが伝播する。単一の鋳型を使用する代わりに、複数の鋳型(二重鎖核酸断片の各センスを表す)を使用して増幅産物を創出する。鎖の1つに生じたエラーが存在する場合、両方の鎖の使用では、単一の場合とは対照的に、シーケンシングステップにおいてそのようなエラーを識別し、両方の鎖において見いだされる可能性の高い真のバリアントと区別することが可能になる。本発明のある特定の技法では、複数の鋳型をシードすることにより、エラーを、塩基が同じではない位置における単一の読み取りにおいてシーケンシングの質が低下することを通じて真のバリアントと区別することができる(真のバリアントは全ての読み取り上に存在することになり、それにより、強力なシグナルがもたらされる)。複数の実施形態では、センス鎖およびアンチセンス鎖でクラスターをシードすることにより、第1のセンス読み取りの結果を第2のアンチセンス読み取りの結果と比較して両方の鋳型鎖におけるバリアントの存在を確認することによって真のバリアントおよびエラーを識別することができる。
【0019】
本発明の方法により、Illuminaプラットフォーム(Illumina,Inc.San Diego、CA)またはIon Torrentプラットフォーム(Thermo Fisher Scientific Inc.、Waltham、MA)などの固体支持体上での増幅が改善される。Illumina技法では、ブリッジ増幅を使用してアンプリコンのクラスターを形成する。断片中にエラーが存在する場合、クラスター内でエラーが繰り返される。しかし、本発明を用いると、連結二重鎖断片を固体支持体に接触させる。元の二重鎖分子のセンス鎖およびアンチセンス鎖の両方を表す断片がクラスターにシードされ、その結果、鎖断片のそれぞれに由来する全アンプリコンの画分がもたらされる。この技法は、エラーをシーケンシングステップにおいて容易に決定すること、また、真のバリアントを呼び出すことおよびそれらをシーケンシングまたは増幅(例えば、PCR)エラーと区別することに役立つことを可能にする。
【0020】
本発明の方法により、多重化増幅プロセスが改善される。本発明の一部の実施形態では、連結断片をその後の増幅のためにドロップレット中で形成すること、またはドロップレット中に導入することができる。断片の一部にエラーが存在する場合、エラーは、未加工のシーケンシングデータを用いて決定可能である。一部の実施形態では、連結断片をマイクロスフェアに結合させ、次いで、増幅を伴い、断片は、アンプリコンでマイクロスフェアをシードすることができる。本発明では、同じ断片の複数のコピーを使用して複数のアンプリコンを形成するという利点を提供することにより、種々の適用における塩基呼び出しを改善する。
【0021】
本発明の方法は、複数のシーケンシングプラットフォームに組み入れることができる。例えば、従来の合成によるシーケンシングでは、各塩基を逐次的に決定することができる。エラーは、バイオインフォマティクス技法を使用してデータを解析するまで決定されない。しかし、本発明では、シーケンシング方法体系の間に核酸の二重鎖断片を連結することが可能になる。複数の断片を同時に解析することにより、塩基間の一致により正確度が示され、その一方、塩基間の不一致はシグナルエラーになる。本発明を用いると、バイオインフォマティクスを適用することなく、未加工のシーケンシングデータからエラーを決定できる。この技法では、より少数のコピーまたはクラスターが使用され、シーケンシングスループットが増加し、また、費用が減少する。
【図面の簡単な説明】
【0022】
【
図1】
図1は、連結型二重鎖核酸を創出するための本発明のドロップレットに基づく方法を例示する図である。
【0023】
【
図2】
図2は、例証的な連結プライマーおよびフォワードおよびリバース遺伝子特異的プライマーおよび本発明の1つの方法に従ったそれらの使用を示す図である。
【0024】
【
図3】
図3は、例証的な連結プライマーおよびフォワードおよびリバース遺伝子特異的プライマーおよび本発明の1つの方法に従ったそれらの使用を示す図である。
【0025】
【
図4】
図4は、本発明の遺伝子特異的プライマーを示す図である。
【0026】
【
図5】
図5は、
図2に示されている生成物方法を用いた本発明のシーケンシング方法を示す図である。
【0027】
【
図6】
図6は、
図3に示されている生成物方法を用いた本発明のシーケンシング方法を示す図である。
【0028】
【
図7A】
図7Aおよび7Bは、1つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【
図7B】
図7Aおよび7Bは、1つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【0029】
【
図8A】
図8Aおよび8Bは、2つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【
図8B】
図8Aおよび8Bは、2つの連結アダプターを使用した非ドロップレット連結二重鎖形成法を示す図である。
【0030】
【
図9A】
図9Aおよび9Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する図である。
【
図9B】
図9Aおよび9Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する図である。
【0031】
【
図10】
図10は、フローセル結合方法の例証的なステップを示す図である。
【0032】
【
図11】
図11は、例証的なオフラインフローセル調製プロトコールを示す図である。
【0033】
【
図12】
図12は、二重鎖分子に対するフローセルに基づく標的捕捉方法を例示する図である。
【0034】
【
図13A】
図13A~13Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【
図13B】
図13A~13Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【
図13C】
図13A~13Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【
図13D】
図13A~13Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【
図13E】
図13A~13Eは、例証的な、二重鎖分子についてのフローセルに基づく標的捕捉およびシーケンシング方法のステップを示す図である。
【0035】
【
図14A】
図14A~14Dは、ある特定の実施形態による二重鎖識別方法を例示する図である。
【
図14B】
図14A~14Dは、ある特定の実施形態による二重鎖識別方法を例示する図である。
【
図14C】
図14A~14Dは、ある特定の実施形態による二重鎖識別方法を例示する図である。
【
図14D】
図14A~14Dは、ある特定の実施形態による二重鎖識別方法を例示する図である。
【0036】
【
図15】
図15は、アダプターおよびプライマーの可能性ある立体配置の例を示す図である。
【0037】
【
図16】
図16は、KRASアンプリコンとアラインメントされた、単独でシードされたクラスターを使用したシーケンシングのエラー率を示すグラフである。
【0038】
【
図17】
図17は、
図16の結果を生じさせるのに使用した、シーケンシング方法の単独でシードされたクラスター、および、
図29で使用した、シーケンシング方法の二重にシードされたクラスターを示す図である。
【0039】
【
図18】
図18は、単一のシーケンシング読み取りおよびシグナルの質に基づく本発明の塩基呼び出し方法を例示する図である。
【0040】
【
図19】
図19は、センスおよびアンチセンスシーケンシング読み取りの比較に基づく塩基呼び出し方法を示す図である。
【0041】
【
図20】
図20は、二重鎖核酸の連結標的捕捉の例証的な方法を例示する図である。
【0042】
【
図21】
図21は、連結された標的捕捉核酸の増幅方法を例示する図である。
【0043】
【
図22】
図22は、ドロップレットに基づく標的捕捉および連結二重鎖核酸生成の方法を示す図である。
【0044】
【
図23A】
図23AおよびBは、本発明のドロップレットに基づく標的捕捉方法のステップを示す図である。
【
図23B】
図23AおよびBは、本発明のドロップレットに基づく標的捕捉方法のステップを示す図である。
【0045】
【
図24】
図24は、ユニバーサルプライマーおよび捕捉されるべき連結分子の捕捉領域に相補的な標的領域を含む鎖を有するナノ粒子を示す。
【0046】
【
図25】
図25は、捕捉領域と標的領域の結合を例示する図である。
【0047】
【
図26】
図26は、ユニバーサルプライマーと連結分子上のユニバーサルプライマー部位の結合を示す図である。
【0048】
【
図27】
図27は、元の連結分子の両方の鎖を含む標的分子のナノ粒子連結コピーを生成するための、鎖置換型ポリメラーゼによるユニバーサルプライマー伸長を示す図である。
【0049】
【
図28】
図28は、本出願の他の箇所に記載されているフローセルシーケンサーにクラスターをシードするために使用することができる二重にシードされたナノ粒子を示す図である。
【0050】
【
図29】
図29は、KRASアンプリコンとアラインメントされた二重にシードされたクラスターを使用したシーケンシングのエラー率を示すグラフである。
【0051】
【
図30】
図30は、溶液に基づく連結型ライゲーションの例証的ステップを示す図である。
【0052】
【
図31】
図31は、融合核酸とのアダプターの連結型ライゲーションを示す図である。
【0053】
【
図32A】
図32Aおよび32Bは、ある特定の実施形態に従う連結型ライゲーション表面捕捉技法を例示する図である。
【
図32B】
図32Aおよび32Bは、ある特定の実施形態に従う連結型ライゲーション表面捕捉技法を例示する図である。
【0054】
【
図33A】
図33A~33Cは、ある特定の実施形態に従う連結型アダプターライゲーションを例示する図である。
【
図33B】
図33A~33Cは、ある特定の実施形態に従う連結型アダプターライゲーションを例示する図である。
【
図33C】
図33A~33Cは、ある特定の実施形態に従う連結型アダプターライゲーションを例示する図である。
【0055】
【
図34】
図34は、1つの連結性アダプターを含む連結型アダプターの例証的な立体配置を示す図である。
【0056】
【
図35】
図35は、2つの連結性アダプターを含む連結型アダプターの1つの例証的な立体配置を示す図である。
【0057】
【
図36】
図36は、2つの連結性アダプターを含む連結型アダプターの別の例証的な立体配置を示す図である。
【0058】
【
図37】
図37は、連結型Y-アダプターの例証的な立体配置を示す図である。
【0059】
【
図38A】
図38A~Dは、二本鎖連結型ライゲーションの例証的な方法を示す図である。
図38Aは、ライゲーション複合体および一本鎖結合タンパク質を使用するゲノム鋳型のストランド侵入のライゲーション複合体生成の創出を示す。
図38Bは、ゲノム鋳型とのライゲーションアダプターのその後の標的化された二本鎖ライゲーションを示す。
図38Cは、ゲノム鋳型の反対の末端で実施された種々の第2のライゲーションの結果を示す。
図38Dは、アダプター特異的プライマーを使用するライゲートされたゲノム鋳型で実施されたPCR増幅を示す。
【
図38B】
図38A~Dは、二本鎖連結型ライゲーションの例証的な方法を示す図である。
図38Aは、ライゲーション複合体および一本鎖結合タンパク質を使用するゲノム鋳型のストランド侵入のライゲーション複合体生成の創出を示す。
図38Bは、ゲノム鋳型とのライゲーションアダプターのその後の標的化された二本鎖ライゲーションを示す。
図38Cは、ゲノム鋳型の反対の末端で実施された種々の第2のライゲーションの結果を示す。
図38Dは、アダプター特異的プライマーを使用するライゲートされたゲノム鋳型で実施されたPCR増幅を示す。
【
図38C】
図38A~Dは、二本鎖連結型ライゲーションの例証的な方法を示す図である。
図38Aは、ライゲーション複合体および一本鎖結合タンパク質を使用するゲノム鋳型のストランド侵入のライゲーション複合体生成の創出を示す。
図38Bは、ゲノム鋳型とのライゲーションアダプターのその後の標的化された二本鎖ライゲーションを示す。
図38Cは、ゲノム鋳型の反対の末端で実施された種々の第2のライゲーションの結果を示す。
図38Dは、アダプター特異的プライマーを使用するライゲートされたゲノム鋳型で実施されたPCR増幅を示す。
【
図38D】
図38A~Dは、二本鎖連結型ライゲーションの例証的な方法を示す図である。
図38Aは、ライゲーション複合体および一本鎖結合タンパク質を使用するゲノム鋳型のストランド侵入のライゲーション複合体生成の創出を示す。
図38Bは、ゲノム鋳型とのライゲーションアダプターのその後の標的化された二本鎖ライゲーションを示す。
図38Cは、ゲノム鋳型の反対の末端で実施された種々の第2のライゲーションの結果を示す。
図38Dは、アダプター特異的プライマーを使用するライゲートされたゲノム鋳型で実施されたPCR増幅を示す。
【発明を実施するための形態】
【0060】
本発明の方法および組成物は、シーケンシングワークフローを単純化しながら、ライゲーション効率および標的配列捕捉を改善するための連結型アダプターライゲーションを含む。ある特定の実施形態では、本発明は、二重鎖核酸断片の両方の鎖を接合することによって核酸を増幅およびシーケンシングする方法に関する。両方の鎖を使用することにより、エラー率が低下し、アラインメントの効率が上昇し、また、シーケンシングの費用が低減する。
【0061】
核酸は、一般に、試料または対象から得られる。本発明の方法に従って標識および/または検出するための標的分子としては、これだけに限定されないが、DNA、ゲノムDNA、RNA、発現したRNAおよび/または染色体(単数または複数)などの遺伝子材料およびプロテオミクス材料が挙げられる。本発明の方法は、全細胞由来のDNAまたは1つもしくは複数の細胞から得られた遺伝子材料もしくはプロテオミクス材料の部分に適用可能である。本発明の方法により、ウイルスなどの非細胞供給源からDNAまたはRNAを得ることが可能になる。対象に関しては、試料は、任意の臨床的に許容される様式で得ることができ、核酸鋳型は当技術分野で公知の方法によって試料から抽出される。一般に、核酸は、その内容全体が参照により本明細書に組み込まれるManiatisら、(Molecular Cloning: A Laboratory Manual、Cold Spring Harbor、N.Y.、280~281頁、1982年)に記載されているものなどの様々な技法によって生体試料から抽出することができる。
【0062】
核酸鋳型は、デオキシリボ核酸(DNA)および/またはリボ核酸(RNA)を含む。核酸鋳型は、合成されたものであってもよく、天然に存在する供給源に由来するものであってもよい。核酸は、生物学的なものであるか、環境的なものであるか、身体的なものであるかまたは合成されたものであるかにかかわらず、任意の供給源または試料から得ることができる。一実施形態では、核酸鋳型は、タンパク質、脂質および非鋳型核酸などの種々の他の構成成分を含有する試料から単離される。核酸鋳型は、任意の細胞性材料から得ることもでき、動物、植物、細菌、真菌、または任意の他の細胞性生物体から得ることもできる。本発明において使用するための試料は、ウイルス、ウイルス粒子または調製物を含む。核酸はまた、細菌または真菌などの微生物から、環境試料などの試料から得ることもできる。
【0063】
本発明では、標的材料は、試料中に含有されるDNA、RNA、cDNA、PNA、LNAおよびその他を含めた任意の核酸である。核酸分子は、デオキシリボ核酸(DNA)および/またはリボ核酸(RNA)を含む。核酸分子は、合成されたものであってもよく、天然に存在する供給源に由来するものであってもよい。一実施形態では、核酸分子は、タンパク質、脂質および非鋳型核酸などの種々の他の構成成分を含有する生体試料から単離される。核酸鋳型分子は、任意の細胞性材料から得ることもでき、動物、植物、細菌、真菌、または任意の他の細胞性生物体から得ることもできる。ある特定の実施形態では、核酸分子を単一細胞から得る。本発明において使用するための生体試料は、ウイルス粒子または調製物を含む。核酸分子は、生物体から直接得ることもでき、生物体から、例えば、血液、尿、脳脊髄液、精液、唾液、痰、便および組織から得た生体試料から得ることもできる。任意の組織または体液検体は、本発明における使用のための核酸の供給源として使用することができる。核酸分子は、初代細胞の培養物または細胞株などの培養細胞から単離することもできる。鋳型核酸を得る細胞または組織にウイルスまたは他の細胞内病原体を感染させることができる。さらに、核酸は、ウイルス試料、または環境試料などの非細胞または非組織試料から得ることができる。
【0064】
試料は、生物検体から抽出された全RNA、cDNAライブラリー、ウイルスDNA、またはゲノムDNAであってもよい。ある特定の実施形態では、核酸分子は、タンパク質、酵素、基質、抗体、結合剤、ビーズ、小分子、ペプチド、または任意の他の分子などの他の標的分子に結合しており、標的分子の数量化および/または検出の代理として機能する。一般に、核酸は、SambrookおよびRussell、Molecular Cloning: A Laboratory Manual、第3版、Cold Spring Harbor、N.Y.(2001年)に記載されているものなどの様々な技法によって生体試料から抽出することができる。核酸分子は、一本鎖、二本鎖、または一本鎖領域(例えば、ステム構造およびループ構造)を有する二本鎖であってよい。抗体またはアプタマーなどの高親和性結合性部分に結合することができるタンパク質またはタンパク質の一部(アミノ酸ポリマー)は、例えば、ドロップレットにおけるオリゴヌクレオチド標識の標的分子である。
【0065】
核酸鋳型は、生物体から直接、または生物体から得た生体試料から、例えば、血液、尿、脳脊髄液、精液、唾液、痰、便および組織から得ることができる。特定の実施形態では、核酸を新鮮凍結血漿(FFP)から得る。特定の実施形態では、核酸をホルマリン固定パラフィン包埋(FFPE)組織から得る。任意の組織または体液検体を本発明における使用のための核酸の供給源として使用することができる。核酸鋳型はまた、初代細胞培養物などの培養細胞または細胞株から単離することもできる。鋳型核酸を得る細胞または組織をウイルスまたは他の細胞内病原体に感染させることができる。試料は、生物検体から抽出された全RNA、cDNAライブラリー、ウイルスDNA、またはゲノムDNAであってもよい。
【0066】
生体試料を界面活性剤または界面活性物質の存在下でホモジナイズまたは分画することができる。緩衝液中の界面活性剤の濃度は約0.05%~約10.0%であってよい。界面活性剤の濃度は、最大で界面活性剤が溶液中で可溶性のままになる量であってよい。好ましい実施形態では、界面活性剤の濃度は、0.1%~約2%である。界面活性剤、特に非変性の穏やかなものは、試料が可溶化されるように作用する。界面活性剤は、イオン性であっても非イオン性であってもよい。非イオン性界面活性剤の例としては、Triton Xシリーズ(Triton X-100 t-Oct-C6H4-(OCH2-CH2)xOH、x=9~10、Triton X-100R、Triton X-114、x=7~8)などのトリトン、オクチルグルコシド、ポリオキシエチレン(9)ドデシルエーテル、ジギトニン、IGEPAL CA630オクチルフェニルポリエチレングリコール、n-オクチル-ベータ-D-グルコピラノシド(ベータOG)、n-ドデシル-ベータ、Tween 20ポリエチレングリコールソルビタンモノラウレート、Tween 80ポリエチレングリコールソルビタンモノオレエート、ポリドカノール、n-ドデシルベータ-D-マルトシド(DDM)、NP-40ノニルフェニルポリエチレングリコール、C12E8(オクタエチレングリコールn-ドデシルモノエーテル)、ヘキサエチレングリコールモノ-n-テトラデシルエーテル(C14EO6)、オクチル-ベータ-チオグルコピラノシド(オクチルチオグルコシド、OTG)、Emulgen、およびポリオキシエチレン10ラウリルエーテル(C12E10)が挙げられる。イオン性界面活性剤(陰イオン性または陽イオン性)の例としては、デオキシコール酸、ドデシル硫酸ナトリウム(SDS)、N-ラウロイルザルコシン、および臭化セチルトリメチルアンモニウム(CTAB)が挙げられる。Chaps、双性イオン性3-14、および3-[(3-コラミドプロピル)ジメチルアンモニオ]-1-プロパンスルフォネートなどの双性イオン性試薬も本発明の精製スキームにおいて使用することができる。尿素を別の界面活性剤または界面活性物質を伴ってまたは伴わずに添加することができることも企図されている。
【0067】
溶解またはホモジナイゼーション溶液は、還元剤などの他の薬剤をさらに含有してよい。そのような還元剤の例としては、ジチオスレイトール(DTT)、ベータ-メルカプトエタノール、DTE、GSH、システイン、システアミン、トリカルボキシエチルホスフィン(TCEP)、または亜硫酸の塩が挙げられる。
【0068】
核酸が得られたら、当技術分野で公知の任意の方法によって変性させて一本鎖核酸鋳型を生成し、第1のオリゴヌクレオチドおよび第2のオリゴヌクレオチドにより鋳型上の標的領域が挟まれるように、第1のオリゴヌクレオチドと第2のオリゴヌクレオチドの対を一本鎖核酸鋳型とハイブリダイズさせる。
【0069】
一部の実施形態では、核酸を断片化または分解してより小さな核酸断片にすることができる。ゲノム核酸を含めた核酸は、機械的断片化、化学的断片化、および酵素的断片化などの種々の方法のいずれかを使用して断片化することができる。核酸の断片化の方法は、当技術分野で公知であり、それらとしては、これだけに限定されないが、DNase消化、超音波処理(sonication)、機械的せん断などが挙げられる(J. Sambrookら、「Molecular Cloning: A Laboratory Manual」、1989年、第2版、Cold Spring Harbour Laboratory Press: New York、N.Y.;P. Tijssen、「Hybridization with Nucleic Acid Probes--Laboratory Techniques in Biochemistry and Molecular Biology(Parts IおよびII)」、1993年、Elsevier;C. P. Ordahlら、Nucleic Acids Res.、1976年、3巻:2985~2999頁;P. J. Oefnerら、Nucleic Acids Res.、1996年、24巻:3879~3889頁;Y. R. Thorstensonら、Genome Res.、1998年、8巻:848~855頁)。米国特許公開第2005/0112590号は、当技術分野で公知の種々の断片化方法の概要を提供する。
【0070】
ゲノム核酸は、均一な断片に断片化することもでき、ランダムに断片化することもできる。ある特定の態様では、核酸を断片化して、約5キロベースまたは100キロベースの断片長を有する断片を形成させる。好ましい実施形態では、ゲノム核酸断片は、1キロベースから20キロベースまでにわたってよい。好ましい断片はサイズが変動し得、平均断片長が約10キロベースである。しかし、捕捉される核酸標的の型に応じて所望の断片長および断片長の範囲を調整することができる。特定の断片化の方法を選択して、所望の断片長を実現する。いくつかの非限定的な例を下に提示する。
【0071】
ゲノム核酸の化学的断片化は、いくつかの異なる方法を使用して実現することができる。例えば、塩基加水分解および酸加水分解を含めた加水分解反応が核酸を断片化するための一般的な技法である。加水分解は、所望の加水分解の程度に応じて、温度を上昇させることによって容易になる。断片化は、下記の通り温度およびpHを変更することによって実現することができる。せん断に関してpHに基づく加水分解の利点は、一本鎖産物をもたらすことができることである。さらに、温度をある特定の緩衝系(例えばTris)と共に使用して、加水分解を実現するためにpHを中性から上下に一時的にシフトさせ、次いで、長期保管のためなどで、中性に戻すことができる。異なる量のせん断(したがって、様々な長さの分布)をもたらすために、pHおよび温度の両方を調節することができる。
【0072】
核酸の加水分解による断片化の他の方法としては、アルカリ加水分解、ホルマリン固定、金属錯体(例えば、ポルフィリン)による加水分解、および/またはヒドロキシルラジカルによる加水分解が挙げられる。RNAはアルカリ性条件下でせん断されるが(例えば、Nordhoffら、Nucl. Acid. Res.、21巻(15号):3347~57頁(2003年)を参照されたい)、DNAは、強酸の存在下でせん断することができる。
【0073】
ゲノム核酸断片を生成するための例証的な酸/塩基加水分解プロトコールは、Sargentら(1988年)、Methods Enzymol.、152巻:432頁に記載されている。簡単に述べると、精製DNA1gを0.1NのNaOH50mL中に溶解させる。濃縮HCl1.5mLを添加し、溶液を直ちに混合する。DNAはすぐに沈殿し、大きな凝集体の形成を防ぐために、数秒よりも長く撹拌すべきでない。試料を室温で20分インキュベートしてDNAを部分的に脱プリン化する。その後、10NのNaOH(OH--0.1Nまで濃縮)2mLを添加し、試料をDNAが完全に再溶解するまで撹拌する。次いで、DNAを加水分解させるために試料を65℃で30分インキュベートする。得られる断片は一般には約250~1000ヌクレオチドにわたるが、加水分解の条件に応じてより長くまたはより短く変動し得る。
【0074】
一実施形態では、ゲノム核酸を精製した後、それを、7.5から8.0の間のpHのTrisベースの緩衝液、例えばQiagenのDNA水和溶液などに再懸濁させる。次いで、再懸濁させたゲノム核酸を65℃まで加熱し、終夜インキュベートする。加熱により緩衝液のpHが低~中間の6の範囲にシフトし、それにより、酸加水分解が導かれる。経時的に、酸加水分解により、ゲノム核酸の一本鎖産物および/または二本鎖産物への断片化が引き起こされる。
【0075】
化学的切断は特異的なものであってもよい。例えば、選択された核酸分子、特に、ホスホロチオエート修飾された核酸分子をアルキル化によって切断することができる(例えば、K. A. Browne、「Metal ion-catalyzed nucleic Acid alkylation and fragmentation」、J. Am. Chem. Soc. 124巻(27号):7950~7962頁(2002年)を参照されたい)。ホスホロチオエート修飾でのアルキル化により、核酸分子がその修飾部位で切断されやすくなる。I. G. GutおよびS. Beck、「A procedure for selective DNA alkylation and detection by mass spectrometry」、Nucl. Acids Res. 23巻(8号):1367~1373頁(1995年)を参照されたい。
【0076】
本発明の方法はまた、Maxam-Gilbert Sequencing Method(Chemical or Cleavage Method)、Proc. Natl. Acad. Sci. USA.、74巻:560~564頁に開示されている技法を使用して核酸を化学的にせん断することも企図している。そのプロトコールでは、例えば、グアニンにおける、アデニンにおける、シトシンおよびチミンにおける、ならびにシトシンのみにおける優先的切断など、核酸が特定の塩基において断片化されるように設計された化学物質に曝露させることによって、ゲノム核酸を化学的に切断することができる。
【0077】
核酸の断片への機械的せん断は、当技術分野で公知の任意の方法を使用して行うことができる。例えば、核酸の断片化は、水力せん断(hydroshearing)、針を通した粉砕、および超音波処理によって実現することができる。例えば、Quailら、(2010年11月)、DNA: Mechanical Breakage. In: eLS. John Wiley & Sons、Chichester. doi: 10.1002/9780470015902.a0005 333.pub2を参照されたい。
【0078】
核酸は、噴霧によってせん断することもできる。(Roe、BA、Crabtree. JSおよびKhan、AS、1996年);Sambrook & Russell、Cold Spring Harb Protoc、2006年を参照されたい。噴霧は、核酸溶液を噴霧器の小さな穴に強制的に通すことによって創出されたミストから、断片化されたDNAを収集することを伴う。噴霧によって得られる断片のサイズは、DNA溶液が穴を通過するスピード、噴霧器を通じて噴出されるガスの圧力の変更、溶液の粘度、および温度によって主に決定される。得られるDNA断片は、狭いサイズ範囲(700~1330bp)に分布する。核酸のせん断は、得られた核酸を狭い毛細管またはオリフィスに通すことによって実現することができる(Oefnerら、Nucleic Acids Res.、1996年;Thorstensonら、Genome Res.、1995年)。この技法は、核酸試料をシリンジポンプによって強制的に小さな穴に通した結果として起こる点でのポイントシンク流体力学に基づく。
【0079】
水力せん断(Genomic Solutions、Ann Arbor、Mich.、USA)では、溶液中のDNAを、急激に収縮するチューブに通す。収縮に近づくにつれ、流体が加速されて収縮したより小さな面積を通る体積流量が維持される。この加速中、抗力によりDNAがぷっつり切れるまで伸ばされる。DNAは小片がせん断力による化学結合の破壊には小さすぎるものになるまで断片化される。流体の流速および収縮のサイズにより最終的なDNA断片のサイズが決定される。
【0080】
超音波処理も、核酸を短時間の超音波処理、すなわち超音波エネルギーに供することによって核酸を断片化するために使用される。超音波処理によって核酸をせん断して断片にする方法は、米国特許公開第2009/0233814号に記載されている。本方法では、得られた精製核酸は、粒子が配置された懸濁液中に入れられる。次いで、試料および粒子の懸濁液を超音波処理して核酸断片にする。
【0081】
DNAを断片化するために使用することができる音波に基づく系は、米国特許第6,719,449号、および同第6,948,843号に記載されており、Covaris Inc.により製造された。米国特許第6,235,501号には、閉じた容器中、液体媒体の存在下で、急速に振動する相反的な機械的エネルギーを適用することによって高分子量のDNA断片を生成する、機械的に焦点を合わせる超音波処理(acoustic sonication)方法が記載されており、これを、DNAを機械的に断片化するために使用することができる。
【0082】
核酸をせん断して断片にする別の方法では、例えば、DiagonnodeのBioRuptor(Diagenode,Inc.により市販されている電気せん断デバイス)を用いたせん断など、超音波エネルギーを使用して液体における気体性キャビテーションを生じさせる。キャビテーションは、液体中の圧力の変化に起因してする、溶解した気体または蒸気の小さな泡の形成である。これらの泡は、共鳴振動し、活発な渦巻きまたはマイクロストリーミングを生じさせることができる。結果生じる機械的ストレスにより、核酸の断片へのせん断が導かれ得る。
【0083】
酵素的断片化は、酵素的切断としても公知であり、エンドヌクレアーゼ、エキソヌクレアーゼ、リボザイム、およびDNAザイムなどの酵素を使用して核酸を切断して断片にするものである。そのような酵素は、広範に知られており、商業的に入手可能である。Sambrook、J. Molecular Cloning: A Laboratory Manual、第3版(2001年)およびRoberts RJ(1980年1月)、「Restriction and modification enzymes and their recognition sequences」、Nucleic Acids Res.、8巻(1号):r63~r80を参照されたい。様々な酵素的断片化技法が当技術分野で周知であり、そのような技法がシーケンシングのために核酸を断片化するために頻繁に使用される。例えば、Alazardら、2002年;Bentzleyら、1998年;Bentzleyら、1996年;Faulstichら、1997年;Gloverら、1995年;Kirpekarら、1994年;Owensら、1998年;Pielesら、1993年;Schuetteら、1995年;Smirnovら、1996年;Wu & Aboleneen、2001年;Wuら、1998年a。
【0084】
核酸を断片化するために使用される最も一般的な酵素は、エンドヌクレアーゼである。エンドヌクレアーゼは、二本鎖核酸分子または一本鎖核酸分子のいずれに特異的なものであってもよい。核酸分子の切断を核酸分子内でランダムに行うこともでき、核酸分子の特定の配列において切断することもできる。核酸分子の特異的断片化は、1種または複数種の酵素を逐次的な反応でまたは同時に使用して実現することができる。
【0085】
制限エンドヌクレアーゼは、二本鎖核酸内の特異的な配列を認識し、一般に、核酸を断片化するために、両方の鎖を認識部位内またはその付近のいずれかで切断する。天然に存在する制限エンドヌクレアーゼは、それらの組成および酵素補因子の必要性、それらの標的配列の性質、および、それらのDNA切断部位の標的配列に対する位置に基づいて4つの群(I型、II型、III型、およびIV型)にカテゴリー化される。Bickle TA、Kruger DH(1993年6月)、「Biology of DNA restriction」、Microbiol. Rev.、57巻(2号):434~50頁;Boyer HW(1971年)。「DNA restriction and modification mechanisms in bacteria」、Annu. Rev. Microbiol.、25巻:153~76頁;Yuan R(1981年)。「Structure and mechanism of multifunctional restriction endonucleases」、Annu. Rev. Biochem.、50巻:285~319頁。全ての型の酵素が特定の短いDNA配列を認識し、DNAのエンドヌクレアーゼ的切断を行って、末端5’リン酸を有する特定の断片をもたらす。これらの酵素は、それらの認識配列、サブユニットの組成、切断位置、および補因子の必要性が異なる。Williams RJ(2003年)、「Restriction endonucleases: classification, properties, and applications」、Mol. Biotechnol.、23巻(3号):225~43頁。
【0086】
制限エンドヌクレアーゼにより二本鎖核酸における特異的シーケンシングを認識し、一般に両方の鎖を切断する場合、ニッキングエンドヌクレアーゼにより、核酸の鎖の一方のみを切断して断片にすることが可能である。核酸を断片化するために使用されるニッキング酵素は、天然に存在するものであっても制限酵素から遺伝子操作されたものであってもよい。Chanら、Nucl. Acids Res.、(2011年)、39巻(1号):1~18頁を参照されたい。
【0087】
一部の実施形態では、DNAを生物体または生物学的培地において生物学的プロセスでせん断する。そのようなDNAまたは無細胞DNAは血流中を自由に循環する。例えば、無細胞腫瘍DNA(ctDNA)は、血流中を自由に循環する腫瘍DNAである。一部の実施形態では、断片化されたまたはせん断されたDNAを使用するが、DNAは、断片化された形態で得られる。
【0088】
本発明の好ましい実施形態では、二重鎖核酸断片の鎖を接合して複合体にする。例えば、同一の断片に関しては
図1を参照されたい。任意の連結用分子を使用して分子を接合することができる。本発明において使用されるリンカーは、合成することもでき、種々の会社、例えば、Integrated DNA Technologies,Inc.、Gene Link,Inc.、およびTriLink Biotechnologies,Incから商業的に入手することもできる。リンカーは、2種のプライマーまたは2つの核酸断片を接合するための任意の分子であってよい。連結用分子により複数の断片を接合することもできる。任意の数の断片を複合体に組み入れることができる。
【0089】
図1は、核酸断片のセンスおよびアンチセンス鎖から連結型二重鎖核酸を創出するための本発明のドロップレットに基づく方法を例示する。示されているように、両方の鎖上に表される稀なバリアントを有する二本鎖無細胞DNA(cfDNA)を得ることができる。次いで、二本鎖鋳型を、エマルジョンに、1つまたは複数の遺伝子特異的フォワードプライマー(例えば、エマルジョンは、1つよりも多くの遺伝子または遺伝子の一部に特異的な多重化フォワードプライマーおよびリバースプライマーを含有してよい)、1つまたは複数の遺伝子特異的リバースプライマー、ユニバーサル連結プライマーと共に添加することができる。エマルジョンをエマルジョンPCRに供して、連結二重鎖産物を創出することができる。次いで、エマルジョンを破壊し、非連結鋳型を消化する。次いで、残りの連結二重鎖産物をシーケンシングすることができる。二本鎖産物はドロップレットにフォワードおよびリバース遺伝子特異的プライマーと共に進入するので、二重鎖配列情報を得ることができる。エマルジョンPCRの連結産物は、少なくとも約50%の時間で両方の鋳型センスを含有し、これにより、平均エラー率が低下する。
図1に示されている通り、エマルジョンPCRの間にPCRエラーが二重鎖産物に導入されるが、PCRエラーは一方の鎖上にのみに存在し、真のバリアントは両方の鎖上に存在するので、この2つはシーケンシングの間に互いと容易に区別することができる。
【0090】
図2および3は、例証的なユニバーサル連結プライマーおよびフォワードおよびリバース遺伝子特異的プライマーならびに連結二重鎖産物を創出するためのPCR増幅におけるそれらの使用方法を示す。
【0091】
アンプリコン長は、感度を改善するために短く保持されることが好ましい。複数の実施例では、プライマー間の標的領域は約86bpである。追加的な遺伝子特異的プライマーは
図4に示されている。
【0092】
図5および6は、それぞれ
図2および3からの産物を使用した本発明のシーケンシング方法を例示する。連結プライマーは、2つまたはそれよりも多くの部位を含有してよく、PEG、ビオチン化DNAと結合したTraptavidin、DNAをコーティングしたビーズ、DNAをコーティングしたナノ粒子、ゲルに基づくビーズ(例えば、アクリルアミド)に連結したDNAで構成されてよい。ビーズは、ポリスチレン、ラテックス、磁気、シリカ、強磁性または類似した材料であってよい。付着は、従来の方法によるものであってよく、アミノ基とカルボキシル基の組合せによるものであることが好ましい。
【0093】
本発明の方法は、ドロップレットにより形成された連結二重鎖分子についての二重鎖識別戦略を含み得る。記載の通り、本発明のドロップレットに基づく方法は、連結二重鎖断片の形成(DNA二重鎖の各側面からの表示を含有する連結分子)を少なくとも50%の率でもたらすことができ、したがって、非二重鎖産物からのデータを省き二重鎖産物の利点を増大させる正確度を得るために、これらの産物の識別が重要になる。二重鎖識別方法としては、例えば、アニーリング温度が異なる2セットのプライマーを使用した二段階PCR手法を挙げることができ、この手法では、最初の何回かのサイクルを低温で遺伝子特異的バーコーディングプライマーを用いて実施して二重鎖の各センスを増幅および識別しながら、その後のサイクルにユニバーサル尾部を添加する。二重鎖の各センスが複数のバーコードで標識されることを防ぐために、バーコーディングサイクルの数を限定する。
【0094】
次いで、その後のサイクルを高温で、これらの条件下ではバーコーディングプライマーは結合することができないのでユニバーサルプライマーによって、実施することができる。次いで、二重鎖産物を、シーケンシング解析の間にそれらのセンス特異的バーコードが存在することによって識別することができる。
【0095】
図14A~Dは、本発明のある特定の実施形態による二重鎖識別方法を例示する。例示された実施例では、以下をドロップレットに添加することができる:連結プライマー;それぞれが高Tmを有する(TmはLNAを使用して上昇させることができる)ユニバーサルフォワードプライマーおよびユニバーサルリバースプライマー;それぞれがユニバーサルフォワードプライマーよりも低いTmを有し、それよりも濃度が低い、バーコーディングされたフォワード遺伝子特異的プライマーおよびバーコーディングされたリバース遺伝子特異的プライマー;および二重鎖鋳型。次いで、エマルジョンPCRを、バーコーディングされたプライマーが鋳型に結合するのを可能にする低アニーリング温度を有する第1のサイクル、その後、
図14Bに示されている産物を生成するための第2の低アニーリング温度サイクルで実行することができる。第3の低アニーリング温度サイクルにより、ユニバーサルプライマー結合の第1のサイクルが可能になる。このサイクルでは、バーコーディングされたプライマーをなお結合させて[A+B]より多くのCおよびD産物を形成させ、また、CおよびD産物に結合させてより多くのEおよびF産物を形成させることもできる。
【0096】
第3のサイクル後、
図14Cに示されている産物は、エマルジョン中に存在してよく、次いで、これを、第4の低アニーリング温度サイクルに供してユニバーサルプライマー結合の第2のサイクルを可能にすることができる。
図14Cに示されている通り、サイクル4の最後に完全なフォワードおよびリバースユニバーサル尾部を有する分子を得ることができる。その後のサイクルについてアニーリング温度を上昇させることができる。異なるバーコードを有するいくつかのI型産物およびJ型産物が存在し得る(例えば、フォワード側またはリバース側のいずれかに完全なユニバーサル尾部を有する)。これらは、より高いアニーリング温度においてのみ直線的に増幅することができる。
【0097】
図14Dに示されている通り、その後のPCRサイクル(5+)は、ユニバーサルプライマーの完全なユニバーサル尾部を有するアンプリコンへの結合のみが可能になる、上昇したアニーリング温度を有してよい。最後の数回のサイクルは、増幅された鎖がフォワードユニバーサル尾部の一部を介して連結することが可能になるように低アニーリング温度におけるものであってよい。あるいは、より長い連結プライマーを完全なフォワードユニバーサル尾部と共に使用することができ、それにより、より高いアニーリング温度で連結することが可能になるが、合成は難しく、また、連結の効率はより低くなり得る。上のセンスまたは下のセンスの連結はランダムに起こり、したがって、この連結プライマーを使用する連結分子の50%はそれぞれのうちの1つを有するはずである(二重鎖情報)。ナノ粒子上に2つよりも多くの部位、例えば、100部位を有する連結プライマーは、平均して、ほぼ100%の時間で二重鎖情報を含有する。
【0098】
ある特定の実施形態では、連結二重鎖分子は、エマルジョンPCRを使用せずに創出することができる。非ドロップレット実施形態では、単一の増幅サイクルを使用して、元の断片の両方のセンス鎖およびアンチセンス鎖を有する連結二重鎖分子を創出することができる。次いで、連結二重鎖分子をシーケンシング用のフローセル中に直接ローディングし、それにより、増幅により誘導される配列または長さの偏り(例えば、全ゲノムシーケンシングにおいて)を回避する、ならびに、増幅により導入されるエラーおよびローディング効率の悪さによる核酸の喪失を回避することができる。例えば、シーケンサーのローディング効率を(アウトプット読み取りの数)/(読み取りを形成することが可能なインプット分子の数)と定義することができる場合、Illumina MiSeqについてのローディング効率は<0.1%であり、他のIllumina計器についても同様である。これは、600uLより多くの試料がシーケンサーにローディングされる一方で、約7uLしか結合のためにフローセルの内部に保持されず、その結果、出発材料が大きく喪失するので、流体喪失に大きく起因する。本明細書に記載の非ドロップレット、直接ローディング方法では、これらの非効率性が改善される。本発明の方法は、1サイクルのPCRで二重鎖分子を創出する簡易化されたワークフローを含み得る。次いで、二重鎖分子を使用して単一のクラスターにシードし、正確度の高いシーケンシング読み取りをもたらすことができる。フローセルに直接ローディングし、次いでシーケンシングすることにより、ローディングによるDNAの喪失が最小化される。
【0099】
本発明の直接ローディング、非ドロップレット方法には、例えば、組織生検、針吸引、または小さな体積の採血など、存在するDNAの質量は小さいが高い正確度が望まれる場合の全ゲノムシーケンシングを含めた適用がある。追加的な適用としては、例えば、ホルマリン固定パラフィン包埋(FFPE)試料においてなど、DNAが分解されるまたは損傷を受ける場合が挙げられる。
【0100】
図7A、7B、8A、および8Bは、本発明のある特定の実施形態による非ドロップレット連結二重鎖形成方法を示す。1つ(
図7)または2つ(
図8)の連結アダプターを二本鎖ゲノム鋳型にライゲートし、次いで、鎖置換型ポリメラーゼを使用して伸長させて連結二重鎖分子を創出する。次いで、シーケンシングのために連結二重鎖をフローセルに直接ローディングする。
図8に例示されているものなどの2つの連結アダプターの適用では、連結断片を2つの方向に形成することができる(すなわち、リンカーを一方の末端に有する連結断片およびリンカーを逆の末端に有する連結断片)。
図7Bおよび8Bに示されている通り、ライゲーションの結果、約50%の所望の連結二重鎖産物が生じ、他の望ましくない産物はクラスターを形成しない。
【0101】
種々の実施形態では、本明細書に記載の連結型アダプターライゲーション技法を、
図7Aおよび8Aに示されるように二本鎖アダプターに適用して、確実に2種の異なるアダプターが単一DNA分子とライゲートすることを補助してもよく、ここで、ゲノム鋳型の一方の末端との第1のアダプターのライゲーションは、第2のアダプターを近接近させ、鋳型のもう一方の末端での第2のアダプターライゲーションの確率を増大する。
【0102】
図34は、鋳型にライゲートされた連結型二本鎖アダプターを例示し、ここで、二本鎖アダプターの1つは、鎖置換によって連結型鋳型分子を創出するために
図7Aにおいて使用されるような連結型のアダプターである。
図35および36は、鎖置換によって2つの連結型鋳型分子を創出するために
図8Aおよび8Bに示されるような2つの連結性アダプターを含む連結型二本鎖アダプターを示す。
図35および36は、2つの二本鎖アダプターをリンカー接続するための代替接続点を示す。
【0103】
連結型アダプターライゲーション法を使用して、伝統的なライゲーション法を上回ってライゲーション効率を高めることができる。
図37は、鋳型DNAにライゲートされた連結型Y-アダプターを表す。2つの同一Y-アダプターのライゲーション時でさえ、一方の側の結合が、第2のアダプターを鋳型のもう一方の側と近接近させるので、鋳型の両端は、Y-アダプターと結合する可能性が高い。連結型アダプターライゲーションはまた、一本鎖DNAで使用することもできる。
【0104】
図9Aおよび9Bは、連結二重鎖分子を使用した直接ローディングシーケンシング方法のステップを例示する。
図9Aおよび9Bの例証的な方法では、フローセルを、試薬を用いて初期化する。次いで、少量の連結ライブラリーを変性させ、全体積を初期化されたフローセルにローディングする。次いで、フローセルポートを密閉し、
図7および8に例示されている方法で創出されるものなどの鋳型をフローセルに結合させる。フローセル上のDNAを伸長させ、次いで、フローセルをフローセルシーケンシング計器にローディングする。例証的なフローセル結合は
図10に例示されており、フローセル捕捉、伸長、連結鋳型の洗浄、ブリッジ増幅、およびシーケンシングのステップを含む。連結二重鎖鋳型の他方のセンス鎖への結合は、
図10に例示されているものと類似したものである。
【0105】
図11は、例証的なオフラインシーディングプロトコールをデフォルトのプロトコールと比較して例示する。ある特定の実施形態では、オフラインシーディングプロトコールのステップは、以下のステップをベンチにおいて室温で実施することを含んでよい:LDRを5回流すステップ、PR2を5回流すステップ、HT1を流すステップ、TMPをローディングするステップ、およびポートをPCRテープで密閉するステップ。ここで、流すとは、フローセルを指定の試薬で満たし、約10秒間待ち、次いで、フローセルを空にすることを意味する。ポートをPCRテープで密閉した後、フローセルをビーズバス中、摂氏75度で10分インキュベートし、その後、摂氏40度で10分インキュベートする。フローセルを室温のベンチに戻し、密閉を解き、フローセルに摂氏40度、PR2を5回流し、AMS1を2回流し、摂氏40度で2分のインキュベーションを3回伴ってAMS1を流し、AMS1を満たし、シーケンシングのためにMiSeq計器(Illumnia,Inc、San Diego、CAから市販されている)に移す。調製プロトコールにおける追加的なステップは、フローセルをそのプラスチック収納から出し、ポートを密閉するためのPCRテープを予め切り取り、フローセルを、両側にPCRテープまたはスコッチテープを用いてビーズバスにより擦り傷から保護することを含んでよい。
【0106】
本発明の連結型ライゲーションアダプターを、標的捕捉および標的鋳型の選択的増幅のために使用してもよい。連結型ライゲーションアダプターを、一本鎖DNA(ssDNA)とともに使用してもよく、またはある特定の実施形態では、二本鎖DNA(dsDNA)とともに使用してもよい。
図30は、本発明の連結型ライゲーションアダプターの例証的な使用を示す。連結型ライゲーションアダプターは、シーケンシングアダプターであり得る、またはユニバーサルプライミング部位を含み、標的配列特異的プローブに連結されているアダプターを含む。プローブは、標的鋳型ssDNAの少なくとも一部に相補的である。プローブは、鋳型ssDNA鎖と結合し、その連結型アダプターを鋳型に近接近させ、ssDNA鋳型の両端とのアダプターのライゲーションを可能にする。次いで、ライゲートされたアダプター中のユニバーサルプライミング部位によって、標的でない(off target)核酸を増幅することのない、ユニバーサルPCRを使用する標的鋳型のPCR増幅が可能となる。この結果、シーケンシングアダプターを含み、シーケンシングの準備のできた標的化されたライブラリーが得られる。
【0107】
図38A~Dは、二本鎖連結型ライゲーションの例証的な方法を示す。二本鎖連結型ライゲーションは、等温リコンビナーゼおよび一本鎖結合タンパク質を利用して、dsDNAのストランド侵入を生成し、これによって、プライマーまたはプローブが、一本鎖結合タンパク質を用いて、dsDNA中の相補配列と対を形成することが可能となり、次いで、置換されたDNA鎖と結合して、プライマーまたはプローブが置換されることを防ぐ。このプロセスは、参照により本明細書に組み込まれるPiepenburg, O.ら、2006年、DNA Detection Using Recombination Proteins、PLoS Biol 4巻(7号):e204に記載されるようなリコンビナーゼポリメラーゼ増幅(RPA)において使用されたものと同様である。方法は、認識配列に基づく特異的DNA標的のライゲーションを可能にする。標的捕捉をライゲーションステップに直接統合してもよく、簡単な標的化された次世代シーケンシングワークフローを作り出す。本明細書に記載のdsDNA法は、DNAの所望の末端とのライゲーションを対象とし、異なるアダプターが各末端に付加されることを可能にする。方法は、単一鋳型との2つの異なるアダプターのライゲーションを高効率で可能にする。例えば、yアダプターおよびヘアピンをライゲートしてもよく(
図38Cに示される1つの選択肢)、その結果、二重鎖情報を、すべてのシーケンシング読み取りと統合してもよい(
図38Dに示されるように)。
【0108】
図38Aに示されるように、ライゲーションアダプターを、ライゲーションプローブおよびリコンビナーゼとともにインキュベートして、ライゲーション複合体を創出してもよい。ライゲーション複合体を、別の部分として作製し、次いで、一緒に連結してもよい。例えば、ライゲーションプローブを、ライゲーションアダプターと連結し、その後リコンビナーゼとともにインキュベートしてもよい。リンカーは、例えば、PEG、通常のDNA塩基、修飾されたDNA塩基または反転DNA塩基を含み得る。リンカーは、ライゲーションプローブの伸長を防ぐために伸長不可能であってもよい。ライゲーションプローブを遮断して伸長を防いでもよい。連結は、クリック化学、ビオチン/ストレプトアビジン結合またはその他のDNA連結化学を介して起こり得る。
【0109】
ライゲーション複合体を、一本鎖結合タンパク質と、ライゲーションプローブに相補的な標的配列を含むdsDNAゲノム鋳型とともにインキュベートする場合には、ライゲーション複合体は、
図38Bに示されるように、dsDNAの変性を必要とせずに標的配列と結合し得る。結合されたライゲーション複合体の連結型ライゲーションアダプターが、dsDNA鋳型にライゲートされる前に、未結合ライゲーション複合体を必要に応じて除去してもよい。次いで、ライゲートされたアダプターを有するdsDNA鋳型を清浄化してもよく、
図38Cに示されるようにさらなるライゲーションを実施してもよい。配列特異的結合部位は高効率でライゲートされるはずであり、ライゲーションはライゲートされていない末端でのみ生じるので、さらなるライゲーションは、配列特異的または標準であってもよい。第2のライゲーションアダプターは、第1のものと同一であっても異なっていてもよい。さらに、標的の各末端とのアダプターのライゲーションはまた、単一ステップで起こり得る。ライゲーションはまた、所望の標的領域を網羅するように多重化されてもよい。標的特異性の増大が望まれる場合には、ライゲーション後に連結型標的捕捉などの標的捕捉を実施してもよい。
【0110】
標的dsDNAとのアダプターライゲーション後、アダプター中の配列に対応するプライマー(例えば、ユニバーサルプライマー)を使用して、PCR増幅を使用してNGSのために標的配列を増幅してもよい。dsDNAの一方の末端でヘアピンアダプターがライゲートされる場合には、
図38Dに示されるように、二重鎖情報が各シーケンシング読み取りとともに得られる。高質量の試料では、PCRが必要とされないことがあり、PCR不含標的化ライゲーションが可能となる。
【0111】
連結型アダプターによって、二本鎖または一本鎖DNA標的の配列認識に基づくライゲーションが可能となる。それらは、同時にDNAの単一センスの標的化をさらに可能にする。本明細書に記載の連結型アダプターは、ライゲーションがDNAの所望の末端に向けられることを可能にする。連結型アダプターは、単純な標的化されたシーケンシングおよびバーコード付けワークフロー、融合検出、標的化されたPCR不含ライブラリー調製およびドロップレットライゲーションおよび増幅において適用を見出すことができる。
【0112】
図31は、融合検出のための融合核酸を選択的に捕捉し、増幅するための連結型アダプターの適用を示す。融合遺伝子は、欠失、増幅および転位置などのゲノム再編成に起因する。このような再編成はまた、がんにおいても頻繁に観察されることがあり、がん発生の駆動事象と仮定されている。したがって、これらの融合遺伝子を特徴付けることは、個別化されたがん診断および治療のための重要な情報を提供し得る。
【0113】
図31に示されるように、アダプターを、公知である融合核酸(ssDNAまたはRNA)の一部に相補的な配列特異的プローブに連結させる。プローブは、標的配列と結合し、これによって、アダプターが、標的配列の末端とライゲートすることが可能になる。リンカーは、例えば、ウラシル消化を使用して切断可能であってもよく、この段階で切断してもよい。次いで、融合核酸の公知の部分の同一または異なる一部に相補的なプローブに連結された第2のアダプターを導入してもよく、これによって、プローブが標的核酸と結合し、連結型アダプターを近接近させて、配列が未知であっても融合物のもう一方の末端でライゲートすることが可能となる。次いで、アダプターをライゲートされた鋳型を、ユニバーサルプライマーおよびPCRを使用して増幅して、シーケンシングのためのライブラリーを創出してもよい。これは、おそらく切断点の片側のみが公知である融合物の識別および特徴付けにおいて有用である。記載された方法は、伝統的な標的捕捉よりも迅速で、安価であり、RNAを用いる場合には、より良好に働く。
【0114】
連結型ライゲーション技法を、同様にシーケンシング解析のためのフローセルを調製するための表面捕捉のために使用してもよい。これらの技法によって、配列に基づく標的分子の捕捉と、それに続く、フローセルまたはその他の固体支持体の表面とのライゲーションが可能となる。
図32Aおよび32Bは、このような方法を例示する。連結された標的特異的プローブに近接近してその表面にアダプターが結合されたおよび/または標的鋳型配列の一部に相補的な、表面に結合されたフローセルを提供する。さらなる浮遊する連結型アダプター/プローブ分子を、標的DNAの鎖を含む試料とともにフローセルに添加する。標的化されたDNAが、フローセル上の捕捉プローブおよび浮遊する連結型アダプター/プローブ分子と結合する。次いで、未結合DNAおよび夾雑物を、フローセルから洗い流し、標的または標的化されたDNAのみを残すことができる。次いで、ssDNAリガーゼを添加し、表面に結合されたアダプターと浮遊するプローブが連結されたアダプターの近接近のために、2つのアダプターが標的DNAの末端にライゲートして、シーケンシングアダプターを有するフローセル表面に結合された標的DNAを残すことができ、これは、プローブを変性させ、洗浄した後にフローセルシーケンシングの準備が整う。ライゲーション、標的捕捉およびフローセル結合ステップを1つに組み合わせることによって、ワークフローを単純化する。捕捉プローブは、シーケンシングを遮断しないので、全断片をシーケンシングできる。これらの方法を、Direct Genomics(Shenzhen、China)またはNanoString technologies(Seattle、Washington)から入手可能なものなどの単一分子シーケンサーとともに使用できる。
【0115】
ある特定の実施形態では、ライゲーション効率を高めるため、また確実に2種の異なるアダプターが単一DNA分子にライゲートされること(2つの同一アダプターがライゲートされるDNA分子とは対照的に)を補助するために、2つのアダプターを一緒に連結する。
図33A~33Cは、DNA分子に連結型アダプターをライゲートする方法を例示する。二本鎖ゲノム鋳型を提供し、例えば、PEG、核酸またはその他の手段によって一緒に連結された2種の二本鎖アダプターに曝露させる。リンカーは、必要に応じて切断可能であり得る。アダプターを、ライゲーションの間アダプターが連結されたままであるが、ライゲーション後に変性させて、連結を分離できるように十分に高い融点(T
m)を有する相補的配列と結合して接合してもよい。
図33Bに示されるように、ひとたび1つのアダプターがゲノム鋳型とライゲートすると、鋳型のもう一方の末端と結合する第2の連結型アダプターの可能性は、その近接近のために極めて高い。
図33Cに示されるように、第2のアダプターがライゲートされ、確実に、2種の異なるアダプターが同一二本鎖DNA分子とライゲートする。例えば、ライゲートされたアダプター中に含まれるプライマー部位に対応するユニバーサルプライマーを使用するその後のPCR増幅のために、ライゲーションリンカーを必要に応じてこの時点で切断してもよい。
【0116】
直接ローディングの実施形態に加えてフローセルローディングの収率および標的捕捉収率が重要である他の適用に関しては、喪失を最小限にするために、フローセルローディングと標的化シーケンシングを組み合わせることが有益であり得る。そのような組合せでは、さらに、余分のステップが排除されることによってワークフローが単純化される。フローセル上の標的を捕捉するための方法が存在するが、それらには少なくとも2つの欠点がある。第1に、本方法では、フローセル上に捕捉された領域をシーケンシングすることができない。無細胞DNAなどの短い断片に関してはこれがシグナルの大きな喪失の原因になり得る。第2に、本方法では、本発明に記載されている連結二重鎖分子をシーケンシングのために捕捉することができない。したがって、本発明の方法は、二重鎖分子のフローセルに基づく標的捕捉を含む。本発明の方法によると、フローセルは、標的領域を有するオリゴヌクレオチド(オリゴ)の一方のセンスを含有し、一方、他方のセンスはヘアピン状になっており、すぐには結合に利用可能でない。
図12を参照されたい。連結分子の一方のセンスをフローセル上に捕捉した後、他方のフローセルオリゴを活性化して、連結断片の他方のセンスを捕捉する(例えば、ウラシル消化物、酵素消化、または光を使用する)。次いで、鋳型を伸長させることができ、クラスター生産を通常通り続けることができる。ある特定の実施形態では、1つのオリゴのセットは二重鎖核酸のセンス鎖またはアンチセンス鎖に相補的であってよく、別のセットは両方のセンス鎖およびアンチセンス鎖に付着したユニバーサルアダプターと相補的であってよく、ユニバーサルアダプターオリゴは最初の曝露ステップにおける結合を防止するためにヘアピン状であってよい。
【0117】
図13A~Eは、二重鎖分子のフローセルに基づく標的捕捉のための例証的な方法のステップを例示する。
図13Aは、例証的な標的捕捉ステップを示し、連結分子は、直接または従来の方法によってのいずれかでフローセルにローディングされる。
図13Bは、鋳型のフローセルへの結合の例証的なステップを示し、連結分子は、相補的な捕捉領域に結合し、フローセルオリゴの他方のセンスは放出されて連結断片の両方の遊離末端に結合する。
図13Cは、例証的な鎖置換ステップを示し、二重にシードされたクラスターを創出するために、鎖置換型ポリメラーゼを使用して両方の断片を伸長させる。次いで、
図13Dに示されている通り、連結鋳型を変性させ、フローセルから除去する。次いで、
図13Eに示されている通り、ブリッジ増幅を通常通りであるが、クラスターにシードする2つの分子を用いて、行うことができる。
【0118】
本発明の直接ローディング技法は、全ゲノムシーケンシング適用において、1つまたは2つの連結アダプターを用いたフローセル標的捕捉ステップを伴わずに使用することができる。標的化シーケンシング適用では、1つまたは2つの連結アダプターを用いたライゲーション後、収率について最適化された(例えば、オフターゲット棄却は不十分であるが収率が高い)チューブに基づく標的捕捉技法を使用することができる。次いで、上記の通り、
図13A~Eに記載されている標的捕捉ステップを伴ってまたは伴わずに連結二重鎖鋳型をフローセルに直接ローディングすることができる。ある特定の実施形態では、中間のチューブに基づく標的捕捉ステップを省くことができる。
【0119】
ある特定の実施形態では、連結性分子は、ストレプトアビジン分子であってもよく、連結される予定の断片は、ビオチン化核酸を含んでもよい。増幅によって連結型核酸断片を創出するために連結型プライマーが使用される実施形態では、プライマーをビオチン化し、ストレプトアビジン分子上に一緒に接合してもよい。例えば、4つの断片を四量体ストレプトアビジン上に接合することができる。例えばコンカテマーを形成することにより、4つよりも多くの分子を接合することができる。本発明のある特定の方法では、2つまたはそれよりも多くの核酸断片をクリック化学反応によって連結することができる。参照により本明細書に組み込まれるKolbら、Click Chemistry: Diverse Chemical Function from a Few Good Reactions、Angew Chem Int Ed Engl.、2001年6月1日;40巻(11号):2004~2021頁を参照されたい。
【0120】
例としておよびいくつかの公知のナノ粒子のうちの連結用分子は、単一の連結分子内の何百ものまたは何千もの断片を含めた多数の断片を連結することができる。連結ナノ粒子の1つの例は、チオールでキャップされた合成DNA配列で表面が修飾されたコロイド金を含む多価DNA金ナノ粒子であり得る。参照により本明細書に組み込まれるMirkinら、1996年、A DNA-based method for rationally assembling nanoparticles into macroscopic materials、Nature、382巻:607~609頁を参照されたい。表面DNA配列は、所望の鋳型分子配列に相補的であってもよく、ユニバーサルプライマーを含んでもよい。
【0121】
連結用分子は、核酸断片の分離にも役立ち得る。好ましい実施形態では、断片を、それらの間での結合が防止されるように方向付ける。空間的な分離および断片の方向の制御を生じさせるリンカーを用いると、崩壊または断片間の結合を回避および防止することができる。
【0122】
一部の実施形態では、リンカーは、ポリエチレングリコール(PEG)または修飾PEGであってよい。DBCO-PEG4、またはPEG-11などの修飾PEGを使用して2つのアダプターまたは核酸を接合することができる。別の実施例では、N-ヒドロキシスクシンイミド(NHS)で修飾PEGを使用して2つのアダプターを接合する。Schlingmanら、Colloids and Surfaces B: Biointerfaces、83巻(2011年)、91~95頁を参照されたい。任意のオリゴヌクレオチドまたは他の分子を使用してアダプターまたは核酸を接合することができる。
【0123】
一部の実施形態では、アプタマーを使用して2つのアダプターまたは核酸を結合する。アプタマーは、プライマーまたは核酸などの種々の分子標的に結合するように設計することができる。アプタマーは、SELEX法(指数関数的富化によるリガンドの系統的進化)によって設計または選択することができる。アプタマーは、標的分子に特異的に結合する核酸巨大分子である。全ての核酸と同様に、特定の核酸リガンド、すなわち、アプタマーも、一般には15~40ヌクレオチド長のヌクレオチド(A、U、T、CおよびG)の直鎖配列によって記載することができる。一部の好ましい実施形態では、アプタマーは、反転塩基または修飾塩基を含んでよい。一部の実施形態では、アプタマーまたは修飾アプタマーは、少なくとも1つの反転塩基または修飾塩基を含む。
【0124】
リンカーは、反転塩基(inverted bases)で構成されてもよく、少なくとも1つの反転塩基を含んでもよいことが理解されるべきである。反転塩基または修飾塩基は、任意の商業的実体から取得することができる。反転塩基または修飾塩基は、開発されており、市販されている。反転塩基または修飾塩基は、他の分子に組み入れることができる。例えば、2-アミノプリンをオリゴヌクレオチドに置換することができる。2-アミノプリンは、DNAの構造および動力学をモニタリングするためのプローブとして有用な蛍光塩基である。2,6-ジアミノプリン(2-アミノ-dA)は、塩基をdTと対合させると3つの水素結合を形成することができ、また、短いオリゴのTmを上昇させることができる修飾塩基である。5-ブロモ-デオキシウリジンは、オリゴヌクレオチドに組み入れて、UV光への曝露でDNA、RNAまたはタンパク質と架橋結合させることができる光反応性ハロゲン化塩基である。反転塩基または修飾塩基の他の例としては、デオキシウリジン(dU)、反転dT、ジデオキシシチジン(ddC)、5-メチルデオキシシチジン、または2’-デオキシイノシン(dI)が挙げられる。任意の反転塩基または修飾塩基を鋳型核酸の連結に使用することができることが理解されるべきである。
【0125】
好ましい実施形態では、リンカーは、2種のプライマーまたは2つの核酸断片を接合するための分子を含む。リンカーは、単一分子であってもよく、複数の分子であってもよい。リンカーは、数個の反転塩基または修飾塩基を含んでもよく、または全体が反転塩基または修飾塩基であってもよい。リンカーは、ワトソン・クリック塩基と反転塩基または修飾塩基の両方を含んでよい。
【0126】
任意のスペーサー分子または連結用分子を本発明において使用することができることが理解されるべきである。一部の実施形態では、リンカーまたはスペーサー分子は、脂質もしくはオリゴ糖、またはオリゴ糖および脂質であってよい。米国特許第5,122,450号を参照されたい。本実施例では、分子は、脂質分子であることが好ましく、少なくとも2つの疎水性ポリアルキレン鎖を有するグリセリドまたはホスファチドであることがより好ましい。
【0127】
リンカーは、任意の数のアダプター、プライマー、および断片のコピーで構成されてよい。リンカーは、2つの同一のアームを含んでよく、各アームが結合性分子、増幅プライマー、シーケンシングプライマー、アダプター、および断片で構成される。リンカーは、任意の数のアーム、例えば、3つまたは4つのアームを連結することができる。本発明の一部の態様では、核酸鋳型がスペーサー分子によって連結されることが理解されるべきである。本発明におけるリンカーは、2つの断片またはプライマーを接合するための任意の分子または方法であってよい。一部の実施形態では、ポリエチレングリコールまたはDBCO-PEG4もしくはPEG-11などの修飾PEGを使用する。一部の実施形態では、リンカーは、脂質または炭化水素である。一部の実施形態では、タンパク質によりアダプターまたは核酸を接合することができる。一部の実施形態では、オリゴ糖によりプライマーまたは核酸を連結する。一部の実施形態では、アプタマーによりプライマーまたは核酸を連結する。断片を連結する場合、コピーは、それらの間での結合が防止されるように同相になるように方向付けられる。
【0128】
ある特定の実施形態では、リンカーは、抗体であってよい。抗体は、単量体、二量体または五量体であってよい。2種のプライマーまたは核酸を接合するための任意の抗体を使用することができることが理解されるべきである。例えば、ヌクレオシドを、タンパク質とカップリングすることによって免疫原性にすることができることは当技術分野で公知である。Void、BS(1979年)、Nucl Acids Res、7巻、193~204頁を参照されたい。さらに、抗体を、修飾核酸に結合するように調製することができる。Biochemical Education、12巻、3号を参照されたい。
【0129】
リンカーは、増幅の間、複合体に付着したままであってよい。一部の実施形態では、リンカーを増幅前に除去する。一部の実施形態では、リンカーを結合性分子に付着させ、次いで、結合性分子を増幅プライマーに付着させる。リンカーを除去すると、結合性分子または結合性プライマーが露出する。露出した結合性分子が固体支持体にも付着し、アーチが形成される。リンカーは、溶媒での洗浄、熱の適用、pHの変更、界面活性剤または界面活性物質での洗浄などを含めた、当技術分野における任意の公知の方法によって除去することができる。
【0130】
本発明の方法は、リンカー分子を用いて連結する核酸を提供する。遺伝子材料が少ない試料では、二重鎖断片が同時にまたは逐次的に増幅されることを確実にするために、核酸を連結することができる。出生前試料などの試料は、遺伝子含有量が低く、二重鎖断片を増幅することにより、検出可能な含有量が増加する。この方法では、シグナルノイズ比が低下し、標的配列の検出が改善される。
【0131】
本発明の方法では、断片などの標的核酸を検出可能なレベルまで増幅するために、増幅を利用する。任意の公知の増幅技法を本発明において使用することができることが理解されるべきである。さらに、増幅プロセスによって創出される増幅したセグメントは、それ自体がその後の増幅のための効率的な鋳型になり得る。
【0132】
増幅とは、核酸配列の追加的なコピーの生成を指し、一般に、ポリメラーゼ連鎖反応または当技術分野で周知の他の技術を使用して実施される(例えば、DieffenbachおよびDveksler、PCR Primer, a Laboratory Manual、Cold Spring Harbor Press、Plainview、N.Y.[1995年])。増幅反応は、ポリメラーゼ連鎖反応、ネステッドポリメラーゼ連鎖反応、リガーゼ連鎖反応(Barany F.(1991年)PNAS、88巻:189~193頁;Barany F.(1991年)PCR Methods and Applications、1巻:5~16頁)、リガーゼ検出反応(Barany F.(1991年)PNAS、88巻:189~193頁)、転写に基づく増幅系、核酸配列に基づく増幅、ローリングサークル増幅、および超分枝ローリングサークル増幅などの、核酸分子を増幅する当技術分野で公知の任意の増幅反応であってよい。
【0133】
一部の実施形態では、PCRに基づくものではないDNA増幅技法である多重置換増幅(MDA)により、微量のDNA試料をゲノム解析のために迅速に増幅する。反応はランダムな六量体プライマーを鋳型とアニーリングすることによって開始される。DNA合成を忠実度の高い酵素によって一定の温度で行う。しかし、任意の増幅方法を本発明と共に使用することができることが理解されるべきである。
【0134】
本発明のある特定の実施形態では、増幅反応は、ポリメラーゼ連鎖反応である。ポリメラーゼ連鎖反応(PCR)とは、ゲノムDNAの混合物中の標的配列のセグメントの濃度を、クローニングまたは精製を伴わずに上昇させるための、K. B. Mullisによる方法(米国特許第4,683,195号および同第4,683,202号、これによって参照により組み込まれる)を指す。標的配列を増幅するためのプロセスは、所望の標的配列を含有するDNA混合物に過剰なオリゴヌクレオチドプライマーを導入し、その後、DNAポリメラーゼの存在下で的確な熱サイクルを連続させる。プライマーはそれらの二本鎖標的配列のそれぞれの鎖に相補的である。
【0135】
本発明の一部の態様では、PCRプライマーをリンカー分子により接合し、PCRプロセスを通じて、二重鎖断片の両方の鎖のコピーとプライマーを連結する。他の実施形態では、アダプターをプライマーまたは断片のコピーに付加する。得られる複合体は、一般に、連結用分子によって直接または間接的に接合した、二重鎖断片の1つのセンス鎖および1つのアンチセンス鎖を含む。連結鎖コピーの一方または両方がエラーを含み得ることが理解されるべきである。しかし、それぞれの断片が正確に同じ塩基においてマッチするエラーを有する確率は低い。塩基における2つの断片間の不一致は、真のバリアントとは対照的に、エラーを示す。次いで、塩基を、単に未加工のシーケンシングデータから不明のものと識別することができる。
【0136】
プライマーは、これだけに限定されないが、適切な配列のクローニングおよび当技術分野で周知の方法を使用した直接化学合成を含めた種々の方法によって調製することができる(Narangら、Methods Enzymol.、68巻:90頁(1979年);Brownら、Methods Enzymol.、68巻:109頁(1979年))。プライマーは、Operon Technologies、Amersham Pharmacia Biotech、Sigma、およびLife Technologiesなどの商業的な供給源から入手することもできる。プライマーは、同一の融解温度を有するものであってよい。プライマーの長さを5’末端または3’末端において伸長または短縮して、所望の融解温度を有するプライマーを生成することができる。また、各プライマー対のアニーリング位置を、プライマー対の配列および長さにより所望の融解温度がもたらされるように設計することができる。25塩基対よりも小さなプライマーの融解温度を決定するための最も単純な方程式は、Wallace則(Td=2(A+T)+4(G+C))である。これだけに限定されないが、Array Designer Software(Arrayit Inc.)、Oligonucleotide Probe Sequence Design Software for Genetic Analysis(Olympus Optical Co.)、NetPrimer、およびHitachi Software EngineeringからのDNAsisを含めたコンピュータプログラムをプライマーの設計に使用することもできる。各プライマーのTM(融解またはアニーリング温度)は、Invitrogen Corpから入手可能なOligo Designなどのソフトウェアプログラムを使用して算出される。
【0137】
一部の実施形態では、増幅をもたらすために、混合物を変性させ、次いで、プライマーを標的分子内のそれらの相補配列とアニーリングさせる。アニーリング後、新しい相補鎖の対を形成するために、ポリメラーゼを用いてプライマーを伸長させる。所望の標的配列の増幅したセグメントを高濃度で得るために、変性、プライマーアニーリングおよびポリメラーゼ伸長のステップを何度も繰り返すことができる(すなわち、変性、アニーリングおよび伸長が1サイクルを構成し、多数のサイクルを行うことができる)。所望の標的配列の増幅したセグメントの長さは、プライマーの互いとの相対的な位置によって決定され、したがって、この長さは制御可能なパラメーターである。
【0138】
一部の実施形態では、本発明の複合体を創出するために、プライマーを連結用分子またはスペーサー分子によって連結して、2つの連結断片のコピーを創出する。他の実施形態では、2つの断片を少なくとも1つのPCRステップの後に連結する。PCRは、断片を連結用分子によって接合する前、またはその後に断片に適用することができることが理解されるべきである。一部の実施形態では、断片を接合する場合、接合した断片に対してPCRを実行することができる。一部の実施形態では、連結コピーに増幅を行う。増幅ステップは、連結プライマーを含む。結果は、PCRのサイクル後、断片のコピーを含む連結複合体が生成するというものである。
【0139】
PCRを用いると、ゲノムDNA内の特定の標的配列の単一コピーを、いくつかの異なる方法体系(例えば、染色、標識したプローブとのハイブリダイゼーション;ビオチン化プライマーの組み入れ、その後のアビジン-酵素コンジュゲートによる検出;32P標識した、dCTPまたはdATPなどのデオキシヌクレオチド三リン酸の増幅したセグメントへの組み入れ)によって検出することができるレベルまで増幅することが可能である。ゲノムDNAに加えて、任意のオリゴヌクレオチド配列を適切なプライマー分子のセットを用いて増幅することができる。特に、PCRプロセスによって創出される増幅したセグメント自体が、その後のPCR増幅のための効率的な鋳型である。増幅された標的配列を使用して、組換えベクターに挿入するためのDNA(例えば、遺伝子)のセグメントを得ることができる。
【0140】
他の増幅方法および戦略も本発明において利用することができる。例えば、別の手法は、PCRとリガーゼ連鎖反応(LCR)を組み合わせることである。PCRではLCRよりも速く増幅がなされ、開始に必要な標的DNAのコピーがより少ないので、PCRを第1のステップとして使用し、その後にLCRを行うことができる。次いで、増幅産物をLCRまたはリガーゼ検出反応(LDR)において、突然変異が存在するかどうかを示すものであるアレル特異的に使用することができる。別の手法は、LCRまたはLDRを増幅およびアレル特異的識別の両方に使用することである。後者の反応は、線形増幅がもたらされるという点で有利である。したがって、増幅産物の量は、元の検体における標的DNAの量を反映するものであり、したがって、定量化を可能にするものである。
【0141】
LCRでは、標的配列の全長と相補的な近接するオリゴヌクレオチドの対を利用する(Barany F.(1991年)PNAS、88巻:189~193頁;Barany F.(1991年)PCR Methods and Applications、1巻:5~16頁)。標的配列がこれらの配列の接合部においてプライマーと完全に相補的である場合、DNAリガーゼが近接する3’および5’末端ヌクレオチドに連結し、それにより複合配列が形成される。熱サイクルで熱安定性DNAリガーゼを使用すると、複合配列が逐次的に増幅される。オリゴヌクレオチドの接合部における一塩基ミスマッチにより、ライゲーションおよび増幅が妨げられる。したがって、プロセスは、アレル特異的である。突然変異体に特異的な3’ヌクレオチドを有するオリゴヌクレオチドの別のセットを別の反応において使用して、突然変異アレルを識別する。一連の標準の条件を使用して、任意の既知の部位における全ての可能性のある突然変異を検出することができる。LCRでは、一般には、ゲノムDNAの両方の鎖を4種のプライマーとのオリゴヌクレオチドハイブリダイゼーションの標的として利用し、産物を、熱サイクルを繰り返すことによって指数関数的に増加させる。
【0142】
増幅またはシーケンシングアダプターまたはバーコード、またはこれらの組合せを、断片化された核酸に付着させることができる。そのような分子は、例えばIntegrated DNA Technologies(Coralville、IA)からなど、商業的に得ることができる。ある特定の実施形態では、そのような配列を鋳型核酸分子にリガーゼなどの酵素を用いて付着させる。適切なリガーゼとしては、New England Biolabs(Ipswich、MA)から市販されているT4 DNAリガーゼおよびT4 RNAリガーゼが挙げられる。ライゲーションは、平滑末端によるものであってもよく、相補的な突出末端の使用を介するものであってもよい。
【0143】
ある特定の実施形態では、断片化後、平滑末端を形成するために、断片の末端を修復し、余分を切り取る(例えばエキソヌクレアーゼを使用して)、または埋める(例えば、ポリメラーゼおよびdNTPを使用して)。一部の実施形態では、Epicentre Biotechnologies(Madison、WI)から入手可能なものなどの市販のキットを使用して末端修復を実施して、平滑末端5’リン酸化核酸末端を生じさせる。平滑末端が生じたら、末端をポリメラーゼおよびdATPで処理して、断片の3’末端および5’末端への付加と独立した鋳型を形成させ、したがって、単一のA突出部を生成する。この単一のAが、T-Aクローニングと称される方法における断片と5’末端由来の単一のT突出部とのライゲーションのガイドになり得る。あるいは、制限酵素によって残される突出部の可能性のある組合せは制限酵素消化後に分かるので、末端をそのまま、すなわち、不揃いの末端のままにすることもできる。ある特定の実施形態では、相補的な突出末端を有する二本鎖オリゴヌクレオチドを使用する。
【0144】
ある特定の実施形態では、1つまたは複数のバーコードを、それぞれの、任意の、または全ての断片に付着させる。バーコード配列は、一般に、配列をシーケンシング反応において有用なものにするある特定の特徴を含む。バーコード配列は、各配列が核酸の特定の部分と相関し、それにより、配列読み取りが、それらが由来する部分とまた相関することが可能になるように設計される。バーコード配列のセットを設計する方法は、例えば、その内容全体が参照により本明細書に組み込まれる米国特許第6,235,475号に示されている。ある特定の実施形態では、バーコード配列を鋳型核酸分子に、例えば酵素を用いて付着させる。酵素は、上記のリガーゼまたはポリメラーゼであってよい。バーコード配列の核酸鋳型への付着は、それぞれの内容全体が参照により本明細書に組み込まれる米国特許公開第2008/0081330号および米国特許公開第2011/0301042号に示されている。バーコード配列のセットを設計するための方法およびバーコード配列を付着させるための他の方法は、それぞれの内容全体が参照により本明細書に組み込まれる米国特許第7,537,897号;同第6,138,077号;同第6,352,828号;同第5,636,400号;同第6,172,214号;および同第5,863,722号に示されている。任意の処理ステップ(例えば、入手、単離、断片化、増幅、またはバーコーディング)の後に、核酸をシーケンシングすることができる。
【0145】
例証的なバーコード配列のセットを設計するための方法およびバーコード配列を付着させるための他の方法は、それぞれの内容全体が参照により本明細書に組み込まれる、米国特許第6,138,077号;同第6,352,828号;同第5,636,400号;同第6,172,214号;同第6235,475号;同第7,393,665号;同第7,544,473号;同第5,846,719号;同第5,695,934号;同第5,604,097号;同第6,150,516号;同第RE39,793号;同第7,537,897号;同第6172,218号;および同第5,863,722号に示されている。
【0146】
バーコード配列は、一般に、配列をシーケンシング反応において有用なものにするある特定の特徴を有する。例えば、バーコード配列は、最小のホモポリマー領域を有するまたはホモポリマー領域を有さない、すなわち、バーコード配列内で、例えばAAまたはCCCなど、一列に同じ塩基を2つまたはそれよりも多くを有さないように設計することができる。バーコード配列はまた、シーケンシングされる標的領域と重複しない、または標的と同一の配列を含有しないように設計することもできる。
【0147】
第1のバーコード配列および第2のバーコード配列を、配列の各対が特定の試料と相関し、それにより、試料を区別し、検証することが可能になるように設計する。バーコード配列のセットを設計する方法は、例えば、その内容全体が参照により本明細書に組み込まれるBrennerら(米国特許第6,235,475号)に示されている。ある特定の実施形態では、バーコード配列は、約2ヌクレオチドから約50ヌクレオチドまで、好ましくは約4ヌクレオチドから約20ヌクレオチドまでにわたる。バーコード配列は、鋳型核酸と一緒にシーケンシングされる、または別個の読み取りでシーケンシングすることもできるので、オリゴヌクレオチド長は、付着した鋳型核酸からの最長の読み取りを可能にするための最小の長さであるべきである。一般に、バーコード配列は、鋳型核酸分子から少なくとも1塩基の間隔を空ける。
【0148】
本発明の方法は、バーコード配列を鋳型核酸に付着させることを伴う。鋳型核酸は、種々の機械的方法、化学的方法および/または酵素的方法を使用して、所望の長さ、例えば、一般に、100塩基から500塩基までまたはそれより長くまで断片化またはせん断することができる。DNAは、超音波処理によってランダムにせん断すること、DNaseまたは1種もしくは複数種の制限酵素、トランスポザーゼ、またはニッキング酵素に曝露させることができる。RNAは、RNase、熱とそれに加えてマグネシウムに簡単に曝露させることによって、またはせん断によって断片化することができる。RNAは、断片化の前またはその後にcDNAに変換することができる。
【0149】
バーコード配列を、当技術分野で公知の方法を使用して鋳型に組み込む。バーコード配列を、例えば、リガーゼ、ポリメラーゼ、Topoクローニング(例えば、Invitrogenのトポイソメラーゼ酵素を使用したトポイソメラーゼベクタークローニングシステム)、または化学的ライゲーションもしくはコンジュゲーションを使用して鋳型に組み込む。リガーゼは、オリゴヌクレオチド(RNAまたはDNA)と鋳型核酸分子をライゲートすることができる任意の酵素であってよい。適切なリガーゼとしては、T4 DNAリガーゼおよびT4 RNAリガーゼが挙げられる(そのようなリガーゼはNew England Biolabsから商業的に入手可能である)。リガーゼを使用する方法は当技術分野で周知である。ポリメラーゼは、鋳型核酸分子の3’末端および5’末端にヌクレオチドを付加することができる任意の酵素であってよい。バーコード配列は、PCR反応によってPCRプライマーの一部として組み入れることができる。分子バーコードの組み入れまたはバーコードが組み入れられる場合にはその位置にかかわらず、シーケンシングアダプターは、核酸産物に二方向性に付着させることができ、したがって、同じシーケンシングの実行において、標的配列の5’末端および3’末端のどちらに由来するシーケンシング読み取りも存在することになる。一部の場合では、読み取りの方向を示すために標的配列の5’末端または3’末端におけるバーコードの位置を使用することが有利である。シーケンシングアダプターを、PCRまたはライゲーションなどの技法を使用してどのように付着させるかは当業者には周知である。
【0150】
図15は、可能性のあるアダプターおよびプライマーの立体配置の例を示す。602に示されている通り、P7プライマーがRead2プライマー部位に付着しており、Read2プライマー部位は相補領域に付着している。603では、連結PCRプライミング領域が固有の分子識別子に付着している。604に示されている通り、P5プライマーがインデックス読み取りプライマー部位、およびシーディング制御部位に付着している。
【0151】
一部の実施形態では、断片の多数のコピーを接合する。2つ、3つ、4つなどいずれにせよ任意の数の断片を接合することができることが理解されるべきである。接合したコピーは、単位と称することができる。次いで、いくつかの単位を連結用分子を用いて接合することができる。任意の数の単位を連結用分子によって接合することができることが理解されるべきである。これにより、複合体内の情報密度が増大する。複合体を固体支持体に付着させたら、複合体を増幅する。増幅産物を固体支持体に付着させることができる。断片の複数のコピーを接合して複合体にし、次いで複合体を増幅することにより、固体支持体上の情報密度が増大する。
【0152】
ある特定の実施形態では、核酸を2つまたはそれよりも多くの接合したプライマーによって増幅することができる。任意の公知の増幅方法を連結プライマーと併せて使用することができる。ある特定の実施形態では、デジタルPCRまたはエマルジョンPCRを使用して、シーケンシングクラスターにシードするためまたは他のシーケンシング方法において使用するための2つまたはそれよりも多くの連結核酸断片を創出することができる。好ましい実施形態では、アダプターをシーケンシングされる目的の核酸断片とライゲートすることによって鋳型核酸を創出することができる。アダプターは、必要に応じて、ユニバーサルプライミング部位、1つまたは複数のシーケンシングプライマー部位、および所与のクラスター内の全てのシーケンシング読み取りが同じ出発鋳型を起源とすることを確実にするための固有のクラスター識別子を含んでよい。例えば、アダプターは、y1:CCTACTCGCTAC(配列番号1)、y2:ATGCGAGCCTCT(配列番号2)、y3:GCACCTCATCCA(配列番号3)、およびy4:TGCAGGATGGTG(配列番号4)などの様々なステム領域と共に使用することができる。アダプター配列は、シーケンシングフローセル上の隣接するクラスターを区別するために、一連のランダムな塩基(例えば、2つ、3つ、4つ、5つ、またはそれよりも多く)を含んでよい固有のクラスター識別子(UCI)を含んでよい。アダプター配列は、T突出部を除去し、ライゲーション効率を低下させる可能性がある3’エキソヌクレアーゼ消化を低減するために、ホスホロチオエート連結したTを含んでよい。3’リン酸ブロッカーは任意選択であり、本発明のデジタルPCR方法に必須なものではない。
【0153】
シーケンシングされる核酸断片にアダプターをライゲートしたら、エマルジョンまたはドロップレットを創出することができる。ドロップレットは、不混和性担体流体で囲まれた水性ドロップレットであってよい。そのようなドロップレットを形成させ、ドロップレットを用いたPCR増幅を行う方法は、例えば、Linkら(米国特許出願第2008/0014589号、同第2008/0003142号、および同第2010/0137163号)、Stoneら(米国特許第7,708,949号および米国特許出願第2010/0172803号)、ならびにAndersonら(米国特許第7,041,481号、RE41,780として再発行)に示されている。
【0154】
好ましい実施形態では、最終的なクラスターにただ1つの鋳型分子がシードされることを確実にするため、および異なる核酸断片を含有するハイブリッド連結核酸複合体の形成を防止するために、単一の鋳型核酸分子をドロップレットに添加する。遺伝子特異的であってよい種々のマルチプレックスプライマーも、連結プライマーと一緒にドロップレットに添加することができる。連結プライマーは、本明細書に記載の方法のいずれかに従って連結された2つまたはそれよりも多くのプライマーであってよい。連結プライマーは、例えば、ライゲートされたアダプターにおけるユニバーサルプライミング部位に対応するユニバーサルプライミング部位ならびにシーケンシングプライマー部位(例えば、1つよりも多くの分子がクラスターにシードされている時に識別するための異なるインデックスプライミング部位)を含んでよい。ある特定の実施形態では、連結プライマーは、シーケンシングされる特定の関心領域を標的とする遺伝子特異的プライマーを含んでよく、したがって、最初のライゲートするステップを回避することができ、また、連結プライマーデジタルPCR増幅のために非修飾核酸断片を直接ドロップレットに添加することができる。ある特定の本発明の方法によると、ライゲートされた鋳型は連結ユニバーサルプライマーのプライミング部位に対応するプライミング部位を含み得、また、標的核酸の連結コピーを創出するために遺伝子特異的マルチプレックスプライマーを使用する。
【0155】
本発明の複合体は、マイクロビーズ、ビーズ、チャネル壁、マイクロチップなどの種々の固体支持体に付着させることができる。
【0156】
接合した断片のシーケンシングは、当技術分野で公知の任意の方法によるものであってよい。本発明は、Roche/454 Life Sciencesからのゲノムシーケンサー(Marguliesら(2005年)Nature、437巻:376~380頁;米国特許第6,274,320号;同第6,258,568号;同第6,210,891号)、Life Technologies Applied Biosystems(Grand Island、NY)からのSOLiDシステム、Helicos Biosciences(Cambridge、MA)からのHELISCOPEシステム(例えば、米国特許公開第2007/0070349号を参照されたい)、およびLife Technologies Ion Torrent、Ion Torrent Systems,Inc.(Guilford、CT)からのIonシーケンサーを含めた種々のシーケンシングプラットフォームに適用される。
【0157】
好ましい実施形態では、シーケンシングは、各塩基を逐次的に決定することができる方法による。DNAシーケンシング技法としては、標識したターミネーターまたはプライマーおよび平板または毛細管におけるゲル分離を使用する古典的なジデオキシシーケンシング反応(Sanger法)、可逆的に終結させた標識したヌクレオチドを使用する合成によるシーケンシング、パイロシーケンシング、454シーケンシング、標識したオリゴヌクレオチドプローブのライブラリーとのアレル特異的ハイブリダイゼーション、標識したクローンのライブラリーとのアレル特異的ハイブリダイゼーションを使用し、その後、ライゲーション、重合ステップ中の標識したヌクレオチドの組み入れのリアルタイムモニタリングを行う、合成によるシーケンシング、polonyシーケンシング、およびSOLiDシーケンシングが挙げられる。分離した分子のシーケンシングがつい最近、ポリメラーゼまたはリガーゼを使用する逐次的なまたは単一の伸長反応によって、ならびにプローブのライブラリーとの単一のまたは逐次的な示差的ハイブリダイゼーションによって実証された。
【0158】
リンカーをアダプター、プライマー、または結合性分子に付着させることもできることが理解されるべきである。リンカーは、これらの種に、任意の方向または配置で付着させることができる。連結用分子をアダプターまたはプライマーに直接付着させ、核酸断片に間接的に連結することができる。本発明の一部の態様では、連結用分子を増幅の前、またはその後に除去することができる。一部の実施形態では、連結用分子を複合体に残存させる。一部の実施形態では、連結用分子をシーケンシングの前に除去し、他の実施形態では、連結用分子をシーケンシングの間、複合体に残存させる。
【0159】
提供される発明の方法において使用することができるシーケンシング技法としては、例えば、Helicos True Single Molecule Sequencing(tSMS)(Harris T. D.ら(2008年)Science、320巻:106~109頁)が挙げられる。tSMS技法では、DNA試料を切断しておよそ100~200ヌクレオチドの鎖にし、ポリA配列を各DNA鎖の3’末端に付加する。蛍光標識したアデノシンヌクレオチドを付加することによって各鎖を標識する。次いで、DNA鎖を、数百万のオリゴ-T捕捉部位が表面に固定化されたフローセルとハイブリダイズさせる。鋳型の密度は、1cm2当たり約1億個の鋳型であってよい。次いで、フローセルを計器、例えば、HeliScopeシーケンサーにローディングし、フローセルの表面にレーザーを照明し、それにより、各鋳型の位置を明らかにする。CCDカメラにより、フローセル表面上の鋳型の位置をマッピングすることができる。次いで、鋳型蛍光標識を切断し、洗い流す。DNAポリメラーゼおよび蛍光標識したヌクレオチドを導入することによってシーケンシング反応を開始させる。オリゴ-T核酸がプライマーとしての機能を果たす。ポリメラーゼにより標識したヌクレオチドがプライマーに鋳型指向的に組み入れられる。ポリメラーゼおよび組み入れられなかったヌクレオチドを除去する。蛍光標識したヌクレオチドの組み入れを指向させた鋳型をフローセル表面のイメージングによって検出する。イメージング後、切断ステップにより蛍光標識を除去し、他の蛍光標識したヌクレオチドを用いて、所望の読み取り長が実現されるまでプロセスを繰り返す。各ヌクレオチド付加ステップで配列情報を収集する。本発明を用いると、連結断片を縦列で識別することができる。tSMSについてのさらなる記載は、例えば、Lapidusら(米国特許第7,169,560号)、Lapidusら(米国特許出願第2009/0191565号)、Quakeら(米国特許第6,818,395号)、Harris(米国特許第7,282,337号)、Quakeら(米国特許出願第2002/0164629号)、およびBraslavskyら、PNAS(USA)、100巻:3960~3964頁(2003年)に示されており、これらの参考文献のそれぞれの内容は、その全体が参照により本明細書に組み込まれる。
【0160】
提供される発明の方法において使用することができるDNAシーケンシング技法の別の例は、454シーケンシングである(Roche)(Margulies, Mら、2005年、Nature、437巻、376~380頁)。454シーケンシングは、二段階を伴う。第1のステップでは、DNAをせん断しておよそ300~800塩基対の断片にし、断片を平滑末端化する。次いで、オリゴヌクレオチドアダプターを断片の末端にライゲートする。アダプターは断片の増幅およびシーケンシングのためのプライマーとして働く。断片を、DNA捕捉用ビーズ、例えば、ストレプトアビジンをコーティングしたビーズに、例えば、5’-ビオチンタグを含有するアダプターBを使用して付着させることができる。本発明の方法を使用して、上記の通り接合させた断片をビーズ上に捕捉する。ビーズに付着した接合した断片を油-水エマルジョンのドロップレット中でPCR増幅する。結果は、各ビーズ上でクローン的に増幅されたDNA断片の複数のコピーである。第2のステップでは、ビーズをウェル(ピコリットルサイズ)中に捕捉する。各DNA断片に対して並行してパイロシーケンシングを実施する。1つまたは複数のヌクレオチドの付加により光シグナルが生じ、それがシーケンシング計器のCCDカメラによって記録される。シグナル強度は組み入れられたヌクレオチドの数に比例する。パイロシーケンシングでは、ヌクレオチド付加の際に放出されるピロリン酸(PPi)を使用する。PPiはアデノシン5’-ホスホ硫酸の存在下でATPスルフリラーゼによってATPに変換される。ルシフェラーゼはルシフェリンをオキシルシフェリンに変換するためにATPを使用し、この反応により光が生じ、それを検出し、分析する。
【0161】
提供される発明の方法において使用することができるDNAシーケンシング技法の別の例は、Ion Torrentシーケンシングである(米国特許出願第2009/0026082号、同第2009/0127589号、同第2010/0035252号、同第2010/0137143号、同第2010/0188073号、同第2010/0197507号、同第2010/0282617号、同第2010/0300559号、同第2010/0300895号、同第2010/0301398号、および同第2010/0304982号)、それぞれの内容全体が参照により本明細書に組み込まれる。Ion Torrentシーケンシングでは、DNAをせん断しておよそ300~800塩基対の断片にし、断片を平滑末端化する。次いで、オリゴヌクレオチドアダプターを断片の末端にライゲートする。アダプターは断片の増幅およびシーケンシングのためのプライマーとして働く。断片を表面に付着させることができ、断片が個別に分解可能になるような分解能で付着させる。本発明の方法を使用して、接合した断片を表面に付着させる。1つまたは複数のヌクレオチドの付加によりプロトン(H+)が放出され、そのシグナルがシーケンシング計器において検出され、記録される。シグナル強度は組み入れられたヌクレオチドの数に比例する。
【0162】
本発明は、固相増幅によって生産された増幅された核酸をシーケンシングする方法も包含する。したがって、本発明は、固相増幅を使用して核酸鋳型のプールを増幅するステップ、および、核酸シーケンシング反応を行って、固相増幅反応において生成された少なくとも1つの増幅された核酸鎖の全部または一部の配列を決定するステップを含む、核酸シーケンシングの方法を提供する。シーケンシング反応の開始点は、シーケンシングプライマーを固相増幅反応の産物とアニーリングさせることによってもたらすことができる。これに関連して、鋳型ライブラリーの形成の間に付加されたアダプターの一方または両方は、シーケンシングプライマーと鋳型ライブラリーの全ゲノムまたは固相増幅によって引き出された増幅産物とのアニーリングを可能にするヌクレオチド配列を含んでよい。
【0163】
フォワードおよびリバース増幅プライマーの両方を固体表面上に共有結合により固定化する固相増幅反応の産物は、固定化されたポリヌクレオチド鎖と固定化された相補鎖の対のアニーリングによって形成される、いわゆる架橋構造であり、両方の鎖が5’末端で固体支持体に付着している。そのような架橋構造で構成されるアレイでは、ハイブリダイゼーションのための標準の条件下では、従来のシーケンシングプライマーと固定化された鎖の一方とのハイブリダイゼーションはこの鎖とその固定化された相補鎖のアニーリングと比較して有利でないので、典型的な核酸シーケンシング技法のために非効率的な鋳型が提供される。
【0164】
核酸シーケンシングのためにより適切な鋳型をもたらすためには、少なくとも部分的に一本鎖である鋳型を生じさせるために、架橋構造における固定化された鎖の一方の実質的に全てまたは少なくとも一部分を除去するまたは置き換えることが有利であり得る。したがって、一本鎖である鋳型の一部がシーケンシングプライマーとのハイブリダイゼーションのために利用可能になる。「架橋した」二本鎖核酸構造内の1つの固定化した鎖の全部または一部を除去するプロセスを本明細書では直線化と称することができ、これは、その内容全体が参照により本明細書に組み込まれる米国特許公開第2009/0118128号においてさらに詳細に記載されている。
【0165】
架橋した鋳型構造は、一方または両方の鎖を制限エンドヌクレアーゼで切断することによってまたは一方の鎖をニッキングエンドヌクレアーゼで切断することによって直線化することができる。とりわけ、化学的切断(例えば、過ヨウ素酸を用いたジオール連結の切断)、エンドヌクレアーゼを用いた切断による脱塩基部位の切断(例えば、NEBから供給される「USER」、部品番号M55055)、または熱もしくはアルカリへの曝露によるもの、そうでなければデオキシリボヌクレオチドで構成される増幅産物に組み入れられたリボヌクレオチドの切断、光化学的切断またはペプチドリンカーの切断を含めた他の切断方法を制限酵素またはニッキング酵素の代替として使用することができる。
【0166】
切断ステップ後、切断のために使用される方法にかかわらず、切断反応の産物を、固体支持体に付着していない切断された鎖(単数または複数)の一部分(単数または複数)を除去するために、変性条件に供することができる。適切な変性条件、例えば、水酸化ナトリウム溶液、ホルムアミド溶液または熱は、標準の分子生物学プロトコール(Sambrookら、上記;Ausubelら、上記)を参照することで当業者には明らかになろう。変性により、部分的にまたは実質的に一本鎖のシーケンシング鋳型の生成がもたらされる。次いで、シーケンシングプライマーと鋳型の一本鎖部分のハイブリダイゼーションによってシーケンシング反応を開始させることができる。
【0167】
したがって、本発明は、核酸シーケンシング反応が、シーケンシングプライマーと直線化された増幅産物の一本鎖領域をハイブリダイズさせること、増幅されたシーケンシングされる鋳型鎖の領域と相補的なポリヌクレオチド鎖に1つまたは複数のヌクレオチドを逐次的に組み入れること、組み入れられたヌクレオチドの1つまたは複数に存在する塩基を識別すること、および、それにより鋳型鎖の領域の配列を決定することを含む方法を包含する。
【0168】
提供される発明の方法において使用することができるシーケンシング技術の別の例は、Illuminaシーケンシングである。Illuminaシーケンシングワークフローは、3つのステップに基づく:ライブラリーを事実上あらゆる核酸試料から調製し、増幅してクローンクラスターを生成し、大規模並列処理合成を使用してシーケンシングする。Illuminaシーケンシングは、フォールドバックPCRおよび固定されたプライマーを使用した固体表面上でのDNAの増幅に基づく。ゲノムDNAを断片化し、アダプターを断片の5’末端および3’末端に付加する。フローセルチャネルの表面に付着したDNA断片を伸長させ、ブリッジ増幅する。本発明の方法を使用して、接合した断片をフローセルチャネルに付着させ、伸長させ、ブリッジ増幅する。一部の実施形態では、リンカーをブリッジ増幅の前に除去する。一部の実施形態では、リンカーを増幅の間断片に付着したままにする。断片は二本鎖になり、その二本鎖分子を変性させる。固相増幅の複数のサイクル、その後の変性により、フローセルの各チャネルにおいて同じ鋳型の一本鎖DNA分子のおよそ1,000コピーのクラスターを数百万創出することができる。プライマー、DNAポリメラーゼ、およびフルオロフォアで標識した可逆的終結ヌクレオチド4種を使用して逐次的なシーケンシングを実施する。ヌクレオチドの組み込み後、レーザーを使用してフルオロフォアを励起させ、画像を捕捉し、第1の塩基の同一性を記録する。組み入れられた塩基それぞれから3’ターミネーターおよびフルオロフォアを除去し、組み入れ、検出および識別ステップを繰り返す。この技術に従ったシーケンシングは、それぞれの全体が参照により組み込まれる、米国特許第7,960,120号;米国特許第7,835,871号;米国特許第7,232,656号;米国特許第7,598,035号;米国特許第6,911,345号;米国特許第6,833,246号;米国特許第6,828,100号;米国特許第6,306,597号;米国特許第6,210,891号;米国特許公開第2011/0009278号;米国特許公開第2007/0114362号;米国特許公開第2006/0292611号;および米国特許公開第2006/0024681号に記載されている。
【0169】
本発明の方法をIlluminaシーケンシングプラットフォーム(Illumina,Inc、San Diego、CAから市販されている)に組み入れることができる。本発明を使用して、二重鎖断片の両方の鎖のコピーを含む連結複合体のライブラリーを調製し、次いで、固体支持体に付着させる。複合体を増幅してクローンクラスターを生成し、次いで、大規模並列処理合成を使用してシーケンシングする。この方法では、各クラスターに1つの断片がシードされる。本発明を用いると、二重鎖断片の両方の鎖をクラスターにシードする。シーケンシングの間、アンプリコン間で特定の塩基における一致がなければ、エラーが検出される。
【0170】
Illumina Genome Analyzer(検出器、Illuminaから市販されている)は、可逆的ターミネーター化学を使用して反復してシーケンシングされた数百万の固定化配列の並行した蛍光に基づく読み取りに基づく。一実施例では、最大8つのDNAライブラリーを8レーンのフローセルにハイブリダイズさせる。レーンのそれぞれにおいて、一本鎖のライブラリー分子をフローセル表面に共有結合した相補的なオリゴヌクレオチドにハイブリダイズさせる。各ライブラリー分子のリバース鎖を合成し、次いで、今共有結合している分子をブリッジ増幅と称されるプロセスでさらに増幅する。これにより、それぞれが出発分子の1,000よりも多くのコピーを含有するクラスターが生じる。次いで、一方の鎖を選択的に除去し、その後、遊離末端をブロックし、シーケンシングプライマーをクラスター分子のアダプター配列にアニーリングする。
【0171】
蛍光イメージングシステムは単一の鋳型分子からシグナルを検出するには感度が十分ではないが、検出器は、各クラスターからシグナルを検出するには感度がよい。本発明の本実施例では、多数のクラスターからのシグナルを解析する。各クラスターがある値、例えば、4種の塩基のうちの1つに近い値の蛍光を発することが予想される。クラスターが4種の塩基のうちの1つに近い値の蛍光を発しない場合には、その遺伝子座にエラーが存在することが決定される。
【0172】
シーケンシング後、各クラスターについて画像を解析し、強度を抽出する。Illuminaの塩基呼び出し器であるBustardでは、各サイクルおよびクラスターについて抽出される4つの強度値の2つの影響に対処しなければならない:第1に、フルオロフォアの発光スペクトルが同様であることおよび使用されるフィルターによる分離が限定されることに起因するAとCの強度の強力な相関ならびにGとTの強度の強力な相関;ならびに、第2に、それぞれフェージングおよびプレフェージングとして公知の、特定のサイクルについてのシグナルが前後のサイクルのシグナルに左右されること。フェージングおよびプレフェージングは、3’ターミネーターおよびフルオロフォアの不完全な除去、組み入れサイクルが不首尾のクラスター内の配列、ならびに有効な3’ターミネーターを有さないヌクレオチドの組み入れによって引き起こされる。フェージングおよびプレフェージングにより、特定のサイクルについて抽出される強度が、現在のサイクルのシグナルならびに前のサイクルおよび後ろのサイクルからのノイズからなるものになる。
【0173】
提供される発明の方法において使用することができるシーケンシング技術の別の例としては、Pacific Biosciencesの単一分子、リアルタイム(SMRT)技術が挙げられる。SMRTでは、4種のDNA塩基のそれぞれに4つの異なる蛍光色素のうちの1つを付着させる。これらの色素はリン酸基によって連結される。単一のDNAポリメラーゼをゼロモード導波管(ZMW)の底部で鋳型一本鎖DNAの単一分子に固定化する。ZMWは、ZMWの外部に急速に拡散する(マイクロ秒で)蛍光ヌクレオチドのバックグラウンドに対してDNAポリメラーゼによる単一のヌクレオチドの組み入れの観察を可能にする閉じ込め構造である。成長中の鎖へのヌクレオチドの組み入れには数ミリ秒かかる。この時間の間に、蛍光標識が励起され、蛍光シグナルが生じ、蛍光タグが切断される。色素の対応する蛍光の検出により、どの塩基が組み入れられたかが示される。プロセスを繰り返す。本発明の方法を使用すると、プロセスは、分析される断片を2つ用いて縦列で繰り返される。
【0174】
提供される発明の方法において使用することができるシーケンシング技法の別の例は、ナノポアシーケンシング(Soni G VおよびMeller A.(2007年)Clin Chem、53巻:1996~2001頁)である。ナノポアは、直径1ナノメートルほどの小さな穴である。ナノポアを導電性流体に浸漬し、それにわたって電位を印加することにより、ナノポアを通じたイオンの伝導に起因してわずかな電流が生じる。流れる電流の量はナノポアのサイズに感受性である。DNA分子がナノポアを通過するにつれ、DNA分子上の各ヌクレオチドによりナノポアが異なる程度にふさがれる。したがって、DNA分子がナノポアを通過するときのナノポアを通過する電流の変化は、DNA配列の読み取りを表す。本発明の方法を使用すると、2つの断片が同時にまたは逐次的に分析され、それにより、エラーの確率が低減する。
【0175】
本発明は、合成による単一分子のナノポアに基づくシーケンシング(Nano-SBS)などのナノポア技術と共に使用することができる。この戦略では、5’リン酸修飾されたヌクレオチドから放出される4つの異なるサイズのタグを検出することによって4種の塩基を区別することができる。ポリメラーゼ反応の間に各ヌクレオチドが成長中のDNA鎖に組み入れられるにつれ、そのタグが放出され、放出された順にナノポアに進入する。これにより、タグの別個の化学構造に起因する固有のイオン電流遮断サインが生じ、それにより、DNA配列が電子的に一塩基分解能の単一分子レベルで決定される。本発明の方法を使用すると、二重鎖断片の両方の鎖を同時にまたは逐次的に分析することができる。Kumarら、Scientific Reports、論文番号、684、doi: 10.1038/srep00684を参照されたい。
【0176】
配列読み取り解析またはアセンブリなどの上記の機能は、ソフトウェア、ハードウェア、ファームウェア、ハード配線、またはこれらのいずれかの組合せを含む本発明のシステムを使用して実行することができる。
【0177】
本発明に従って使用することができるシーケンシング方法の1つは、例えば、その内容全体が参照により本明細書に組み込まれるWO04018497、US2007/0166705A1および米国特許第7,057,026号に記載されている通り、除去可能な3’ブロックを有する修飾ヌクレオチドの使用に依拠する。シーケンシングされる鋳型の領域に相補的な成長中のポリヌクレオチド鎖に修飾ヌクレオチドが組み入れられたら、さらなる配列伸長を導くために利用可能な遊離の3’OH基がなくなり、したがって、ポリメラーゼはさらなるヌクレオチドを付加することができない。成長中の鎖に組み入れられた塩基の性質が決定されたら、3’ブロックを除去して次の連続的なヌクレオチドの付加を可能にする。これらの修飾ヌクレオチドを使用して引き出される産物の順序により、DNA鋳型のDNA配列を推定することが可能である。そのような反応は、各組み入れステップの間に付加される塩基間の識別を容易にするために、修飾ヌクレオチドのそれぞれに、特定の塩基に対応することが公知の異なる標識を付着させれば、単一の実験で行うことができる。あるいは、修飾ヌクレオチドのそれぞれを別々に含有する別々の反応を行うことができる。
【0178】
本発明の実施形態では、修飾ヌクレオチドを組み入れることができる。修飾ヌクレオチドは、検出のために標識(例えば、蛍光標識)することができる。したがって、例えば、その内容全体が参照により本明細書に組み込まれる米国特許公開第2010/0009353号に記載されている通り、各ヌクレオチド型が異なる蛍光標識を有してよい。しかし、検出可能な標識は蛍光標識である必要はない。組み入れられたヌクレオチドの検出を可能にする任意の標識を使用することができる。蛍光標識したヌクレオチドを検出するための1つの方法は、標識したヌクレオチドに特異的な波長のレーザー光の使用、または他の適切な照明の供給源の使用を含む。ヌクレオチド上の標識からの蛍光は、CCDカメラまたは他の適切な検出手段によって検出することができる。クラスター化されたアレイの画像を記録するための適切な計器使用は、その内容全体が参照により本明細書に組み込まれるW007123744および米国特許公開第2010/0111768号に記載されている。
【0179】
図18および19は、本発明のシステムおよび方法を使用する代替物シーケンシング方法を例示する。
図18に示されている通り、クラスターに複数の鋳型コピーをシードし、増幅した後、エラーを、塩基が同じではない位置における単一の読み取りにおいてシーケンシングの質が低下することを通じて真のバリアントと区別することができる。クラスター内の全ての増幅された鎖は同時点、同方向での全ての読み取りであるので、シグナルの質の低下が、クラスター内の混合塩基呼び出しを決定するための唯一のやり方である。複数の断片、例えば、両方のセンス鎖およびアンチセンス鎖または異なるシーケンシングプライマー部位を有する鋳型をクラスターにシードする実施形態では、2つの異なるシーケンシング読み取り(例えば、各センスからの読み取りまたは2つの異なるシーケンシングプライマーを使用し読み取り)の結果を比較することによって真のバリアントとエラーを識別することができる。
図19は、2つの別々のシーケンシング読み取りを使用してセンスおよびアンチセンス読み取りからの塩基呼び出しを比較する本発明の方法を例示する。シーケンシングまたは他の導入されたエラーは、読み取りのうちの一方のみに見られるはずであるが、真のバリアントは、両方の読み取りにおいて観察されるはずである。
【0180】
連結標的捕捉方法は、標的化DNAシーケンシングのためのゲノムの関心領域の溶液に基づく捕捉を含んでよい。
図20および21は、溶液に基づく標的捕捉の例証的な方法を例示する。ユニバーサルプローブおよび必要に応じてバーコード(センス特異的なものであってよい)を抽出されたDNAにライゲートする。次いで、ライゲートされたDNA産物を変性させ、ユニバーサルプライミング部位および標的特異的プローブと連結したユニバーサルプローブを含む連結標的捕捉用プローブと結合させる。標的捕捉を、ユニバーサルプローブが、標的化プローブの結合に起因して局所濃度が高くならなければ単独では結合することができない温度で実施する。次いで、鎖置換型ポリメラーゼ(例えば、BST、phi29、またはSD)を使用して標的に結合した連結プローブを伸長させる。
図20および21の黒色のダイヤモンド形によって示される通り、標的化プローブは伸長からブロックされ、したがって、伸長は結合したユニバーサルプローブに沿ってのみ起こり、標的化プローブに連結したままの結合した標的核酸鎖がコピーされる。次いで、いくつかの連結PCR伸長サイクルを使用して標的配列を増幅することができる。次いで、標的核酸の一方または両方の鎖を増幅するために、連結標的捕捉用プローブからのユニバーサルプライミング部位に対応するユニバーサルプライマーを使用してPCRを実施することができる。このPCRステップは、同じ反応で、清浄化ステップを必要とせずに実施することができる。次いで、増幅された標的配列を上記の通りシーケンシングすることができる。逆の方向に使用する場合には連結捕捉用プローブ間にギャップは必要ないが、ギャップがあってもよい。捕捉用プローブは、ユニバーサル5’リンカーを使用して、ユニバーサルリンカーを予め作製した捕捉用プローブと接合することによって生成することができる。捕捉用プローブをストレプトアビジン/ビオチンまたは上記の他の手段によって接合することができ、捕捉用プローブを鋳型として使用してユニバーサルリンカーを伸長させることができる。
【0181】
本発明の方法は、二重鎖分子を捕捉するための、必要に応じて、ユニバーサル連結プライマーを使用する、ドロップレットに基づく標的捕捉を含む。
図22に示されているドロップレットに基づく方法は、
図1に例示されているものと同様であるが、上記および
図20~21に示されている連結標的捕捉用プローブを使用する。ユニバーサルプローブおよび必要に応じたバーコード(センス特異的なものであってよい)を抽出されたDNA(例えば、無細胞DNA)にライゲートする。エマルジョンを上記の通り二重鎖鋳型分子ならびにユニバーサルプライミング部位および標的特異的プローブと連結したユニバーサルプローブを含む標的捕捉用プローブを使用して創出する。上記の通り、標的捕捉を、ユニバーサルプローブが、標的化プローブの結合に起因して局所濃度が高くならなければ単独では結合することができない温度で実施し、また、捕捉用プローブは、それ自体の伸長はブロックされるが、ユニバーサルプライミング部位を含み、したがって、エマルジョンに含まれるユニバーサルプライマーおよび連結ユニバーサルプライマーを使用して標的核酸を増幅して、標的核酸の両方のセンス鎖およびアンチセンス鎖を含む連結二重鎖分子を生成することができる。標的捕捉を単独で実施するためにユニバーサルリンカーを省くことができる。次いで、エマルジョンを破壊し、非連結鋳型を酵素的に消化して連結二重鎖分子のみを残すことができ、次いで、クラスターにシードするまたはそうでなければ上記の通りシーケンシングすることができる。
【0182】
図23AおよびBは、本発明のドロップレットに基づく標的捕捉方法の追加的な詳細を提示する。
図23Aのステップ0は、連結およびユニバーサルプライマーおよび標的捕捉用プローブと共にドロップレット中にローディングされるユニバーサルプローブおよびそれとライゲートした必要に応じてバーコードを有する二重鎖鋳型分子を示す。鋳型DNAをドロップレット中で変性させ、次いで、標的捕捉用プローブを、変性させた鋳型鎖に、ユニバーサルプローブが標的化プローブも結合していなければ単独では結合しない温度で結合させる。次いで、ユニバーサルプライマーのみを捕捉された標的に結合させる。次いで、鎖置換型ポリメラーゼを用いた伸長が捕捉された標的に対してのみ起こる。
図23Bに移り、次いで、連結標的捕捉用プローブおよびプライマーが使い尽くされるまで伸長サイクルを実行する(例えば、4~6回のサイクル)。次いで、得られた伸長産物をユニバーサル連結プライマーを使用して増幅して、鎖特異的バーコードを有する連結二重鎖分子を生成させる。溶液に基づく方法と同様に、逆の方向である場合には連結捕捉用プローブ間にギャップは必要ない。標的捕捉を単独で実施するためにユニバーサルリンカーを省く場合には連結捕捉用プローブを一方の方向または両方の方向に使用することができる。方法の種々の伸長および増幅ステップを行うために従来のポリメラーゼをドロップレット中で鎖置換型ポリメラーゼと混合することができる。
【0183】
本発明のある特定の方法は、連結分子の標的捕捉に関する。上記の方法を使用して創出されるものなどの分子の連結コピーを標的化し、捕捉し、シーケンシングのために連結分子に変換することができる。
図24~28は、連結分子のナノ粒子標的捕捉の例証的な方法を例示する。
図24は、ユニバーサルプライマーおよび捕捉される連結分子の捕捉領域に相補的な標的領域を含む鎖を有するナノ粒子を示す。
図25は、捕捉領域と標的領域の結合を例示する。このステップは、標的/捕捉領域は結合するがユニバーサルプライマーは結合しない温度で起こる。捕捉領域が結合されていない限り、結合していない鋳型をこのステップで洗い流すことができる。次いで、反応の温度を低下させて、ユニバーサルプライマーの結合を促進することができる。
図26は、ユニバーサルプライマーと連結分子上のユニバーサルプライマー部位の結合を示す。
図27は、元の連結分子の両方の鎖を含む標的分子のナノ粒子連結コピーを生成するための、鎖置換型ポリメラーゼによるユニバーサルプライマー伸長を示す。
図28は、本出願の他の箇所に記載されているフローセルシーケンサーにクラスターをシードするために使用することができる二重にシードされたナノ粒子を示す。
【実施例】
【0184】
(実施例1)
二重にシードされたクラスターを使用したKRASアンプリコンのシーケンシングのエラーの減少
フローセルクラスターに単一の鋳型分子をシードした。単一の鋳型コピーは、
図17に示されている通り、連結鋳型分子を1つのみフローセルに結合させた連結鋳型のライブラリーに由来するものであった。次いで、KRASアンプリコンにアラインメントされた最初の3000の単独でシードされたクラスターを、35よりも大きいという質の閾値を適用することでシーケンシングのエラーについて分析した。
図16に示されている通り、単独でシードされたクラスターでは、約3000の平均深度で0.13%の平均エラーが生じた。単独でシードされたフローセルでは連結鋳型ライブラリーを使用したので、結果は、非連結鋳型分子を用いた標準の単一のシーディング方法を使用して生じるものよりも低いエラー率を表す可能性がある。
【0185】
次いで、フローセルクラスターに、連結鋳型分子を二重にシードし、ここで、連結分子の両方をクラスターにシードするためにフローセルに結合させた。次いで、chr12アンプリコンにアラインメントされた最初の3000の二重にシードされたクラスターを、同じく35よりも大きい質の閾値、および0.8またはそれよりも大きい蛍光純度フィルターを適用してシーケンシングのエラーについて分析した。二重にシードされたクラスターでは、シーケンシングのエラーが7分の1に減少し、分析された塩基の喪失は単独でシードされたクラスターに対して3%未満であった。二重にシードされたクラスターについての平均エラー率は、
図29に示されている通り、約2920の平均深度で0.02%であった。
参照による組み込み
【0186】
特許、特許出願、特許公報、学術誌、書籍、論文、ウェブコンテンツなどの他の文書の参照および引用が本開示全体を通してなされている。そのような文書は全て、あらゆる目的に関してそれらの全体がこれにより参照により本明細書に組み込まれる。
等価物
【0187】
本発明は、その趣旨または本質的な特性から逸脱することなく他の特定の形態に具体化することができる。したがって、前述の実施形態は、あらゆる点で、本明細書に記載の発明に対する限定ではなく、例示的なものであると理解されるべきである。
【配列表】