特許7569404 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ナノストリング　テクノロジーズ，インコーポレイティドの特許一覧

特許7569404酵素不要及び増幅不要の配列決定

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
6C
6D
7
8A
8B
8C
8D
8E
9A
9B
9C
9D
9E
9F
9G
10
11
12
13
14
15
16
17
18
19
20A
20B
20C
21A
21B
22A
22B
23
24
25
26
27

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-08

(45)【発行日】2024-10-17

(54)【発明の名称】酵素不要及び増幅不要の配列決定

(51)【国際特許分類】

C12Q 1/6876 20180101AFI20241009BHJP

C12Q 1/6874 20180101ALI20241009BHJP

C12Q 1/6837 20180101ALN20241009BHJP

【ＦＩ】

C12Q1/6876 Z ZNA

C12Q1/6874 Z

C12Q1/6837 Z

【請求項の数】 21

(21)【出願番号】P 2023036774

(22)【出願日】2023-03-09

(62)【分割の表示】P 2021164668の分割

【原出願日】2015-11-19

(65)【公開番号】P2023071981

(43)【公開日】2023-05-23

【審査請求日】2023-03-20

(31)【優先権主張番号】62/082,883

(32)【優先日】2014-11-21

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】513322707

【氏名又は名称】ナノストリングテクノロジーズ，インコーポレイティド

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100087871

【弁理士】

【氏名又は名称】福本積

(74)【代理人】

【識別番号】100087413

【弁理士】

【氏名又は名称】古賀哲次

(74)【代理人】

【識別番号】100117019

【弁理士】

【氏名又は名称】渡辺陽一

(74)【代理人】

【識別番号】100150810

【弁理士】

【氏名又は名称】武居良太郎

(74)【代理人】

【識別番号】100134784

【弁理士】

【氏名又は名称】中村和美

(72)【発明者】

【氏名】ジョーセフエム．ビーチェム

(72)【発明者】

【氏名】ルステムハフィゾフ

【審査官】福間信子

(56)【参考文献】

【文献】国際公開第２０１３／０５５９９５（ＷＯ，Ａ２）

【文献】特表２００８－５１２１２９（ＪＰ，Ａ）

【文献】特開２００４－２９８０８２（ＪＰ，Ａ）

【文献】特開２００６－１２９８６６（ＪＰ，Ａ）

【文献】国際公開第２０１３／１０２１０８（ＷＯ，Ａ２）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｑ

Ｃ１２Ｎ

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

標的結合ドメインとバーコードドメインとを含む配列決定プローブであって、
前記標的結合ドメインは、少なくとも１２個のヌクレオチドを含み、かつ標的核酸に結合することができ、
前記バーコードドメインは合成主鎖を含み、前記バーコードドメインは少なくとも２つの付着位置を含み、各付着位置は、少なくとも１つの付着領域を含み、かつ前記付着領域は、前記付着領域に対する相補的核酸分子が結合することができる少なくとも１つの核酸配列を含み、
前記少なくとも２つの付着位置は、標的結合ドメインの配列に相当し、前記少なくとも２つの付着位置の各々は、異なった核酸配列を有し、
前記少なくとも２つの付着位置の各位置の前記核酸配列は、前記標的結合ドメインにより結合される前記標的核酸の配列を決定する、配列決定プローブ。

【請求項2】

前記合成主鎖が１本鎖ＤＮＡを含む、請求項１に記載の配列決定プローブ。

【請求項3】

各付着位置が、８ヌクレオチド～２０ヌクレオチドを含む、請求項１または２に記載の配列決定プローブ。

【請求項4】

各付着位置が１４ヌクレオチドを含む、請求項３に記載の配列決定プローブ。

【請求項5】

前記バーコードドメインの各付着位置が同じ数の付着領域を有する、請求項１～４のいずれか１項に記載の配列決定プローブ。

【請求項6】

前記バーコードドメインの各位置が１つの付着領域を有する、請求項１～４のいずれか１項に記載の配列決定プローブ。

【請求項7】

前記バーコードドメインの各位置が２つ以上の付着領域を有する、請求項１～５のいずれか１項に記載の配列決定プローブ。

【請求項8】

前記バーコードドメインが少なくとも３つの付着位置を含む、請求項１～７のいずれか１項に記載の配列決定プローブ。

【請求項9】

前記バーコードドメインの第１の付着位置の第１の付着領域にハイブリダイズされた相補的核酸分子を更に含む、請求項１～８のいずれか１項に記載の配列決定プローブ。

【請求項10】

前記相補的核酸分子が少なくとも１つの検出可能標識物を含む、請求項９に記載の配列決定プローブ。

【請求項11】

前記相補的核酸分子がレポーター複合体の相補的核酸分子である、請求項９に記載の配列決定プローブ。

【請求項12】

前記相補的核酸分子が、１次核酸分子に直接または間接に連結されている、請求項１１に記載の配列決定プローブ。

【請求項13】

前記１次核酸分子が、少なくとも１つ、２つ、３つ、４つまたは５つの２次核酸分子にハイブリダイズされている、請求項１２に記載の配列決定プローブ。

【請求項14】

各２次核酸分子が、少なくとも１つの検出可能標識物を含む、請求項１３に記載の配列決定プローブ。

【請求項15】

各２次核酸分子が、少なくとも１つの検出可能標識物を含む、少なくとも１つ、２つ、３つ、４つ、５つ、６つまたは７つの３次核酸分子にハイブリダイズされている、請求項１３または１４に記載の配列決定プローブ。

【請求項16】

請求項１～８のいずれか１項に記載の複数の配列決定プローブを含む配列決定プローブ集団。

【請求項17】

（１）請求項１～７のいずれか１項に記載の少なくとも１つの配列決定プローブを、標的核酸にハイブリダイズさせるステップ、
（２）検出可能標識物を含む第１の相補的核酸分子、または検出可能標識物を含む第１のレポーター複合体の第１の相補的核酸分子を、少なくとも２つの付着位置の第１の付着位置に結合させるステップ、
（３）前記結合された第１の相補的核酸分子の検出可能標識物、または前記第１のレポーター複合体の前記結合された第１の相補的核酸分子の検出可能標識物を検出するステップ、
（４）前記第１の相補的核酸分子または前記第１のレポーター複合体の検出可能標識物を、前記第１の付着位置から結合をはずすステップ、
（５）検出可能標識物を含む第２の相補的核酸分子、または検出可能標識物を含む第２のレポーター複合体の第２の相補的核酸分子を、少なくとも２つの付着位置の第２の付着位置に結合させるステップ、
（６）前記結合された第２の相補的核酸分子の検出可能標識物、または前記結合された第２のレポーター複合体の検出可能標識物を検出するステップ、それによって、検出された検出可能標識物に基づいて、少なくとも１つの配列決定プローブの標的結合ドメインによってハイブリダイズされた標的核酸の配列を同定する、
を含む、方法。

【請求項18】

（１）請求項８に記載の少なくとも１つの配列決定プローブを、標的核酸にハイブリダイズさせるステップ、
（２）検出可能標識物を含む第１の相補的核酸分子、または検出可能標識物を含む第１のレポーター複合体の第１の相補的核酸分子を、少なくとも３つの付着位置の第１の付着位置に結合させるステップ、
（３）前記結合された第１の相補的核酸分子の検出可能標識物、または前記第１のレポーター複合体の前記結合された第１の相補的核酸分子の検出可能標識物を検出するステップ、
（４）前記第１の相補的核酸分子または前記第１のレポーター複合体の検出可能標識物を、前記第１の付着位置から結合をはずすステップ、
（５）検出可能標識物を含む第２の相補的核酸分子、または検出可能標識物を含む第２のレポーター複合体の第２の相補的核酸分子を、少なくとも３つの付着位置の第２の付着位置に結合させるステップ、
（６）前記結合された第２の相補的核酸分子の検出可能標識物、または前記結合された第２のレポーター複合体の検出可能標識物を検出するステップ、
（７）前記少なくとも３つの付着位置の各付着位置が、検出可能標識物を含む相補的核酸分子、または検出可能標識物を含むレポーター複合体の相補的核酸分子によって結合され、前記結合された相補的核酸分子の検出可能標識物、または前記結合されたレポーター複合体の検出可能標識物が検出され、それによって、検出された検出可能標識物に基づいて、少なくとも１つの配列決定プローブの前記標的結合ドメインによってハイブリダイズされた標的核酸の配列を同定するまで、ステップ（４）～（６）を繰り返す工程
を含む、方法。

【請求項19】

ステップ（４）および（５）が連続してまたは同時に行われる、請求項１７または１８に記載の方法。

【請求項20】

検出可能な標識物を含む第１のレポーター複合体の第１の相補的核酸分子が、１次核酸分子に直接または間接に連結される、請求項１７～１９のいずれか１項に記載の方法。

【請求項21】

前記１次核酸分子が、少なくとも１つ、２つ、３つ、４つまたは５つの２次核酸分子にハイブリダイズされ、各２次核酸分子が、少なくとも１つの検出可能標識物を含む、少なくとも１つ、２つ、３つ、４つ、５つ、６つまたは７つの３次核酸分子にハイブリダイズされている、請求項２０に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願への相互参照）
本出願は、２０１４年１１月２１日に出願された米国仮特許出願第第６２／０８２，８８３号の利益を主張する。前記特許出願の内容は、参照によりその全体が本明細書に組み込まれる。

【0002】

（配列リスト）
本出願は、ＥＦＳ－Ｗｅｂを介してＡＳＣＩＩフォーマットで提出された配列リストを含み、その全体は参照により本明細書に組み込まれる。２０１５年１１月１９日に作成されたこのＡＳＣＩＩコピーは、ＮＡＴＥ－０２５＿ＳＴ２５．ｔｘｔという名前で、サイズは２０，８６０バイトである。

【背景技術】

【0003】

（発明の背景）
現在、核酸配列決定のための様々な方法、すなわち核酸分子内のヌクレオチドの正確な順序を決定する方法が存在する。現在の方法は、酵素的、例えばＰＣＲ及び／又はクローニングにより、核酸を増幅することを必要とする。光検出手段により検出可能な信号を生成するためには、さらなる酵素的重合が必要である。このような増幅及び重合工程は、費用及び／又は時間がかかる。従って当該技術分野では、増幅不要でかつ酵素不要の核酸配列決定の方法が必要とされている。本発明は、これらのニーズに取り組む。

【発明の概要】

【発明が解決しようとする課題】

【0004】

（発明の要約）
本発明は、長い読み取り長さ及び低いエラー率を有する、酵素不要で、増幅不要で、及びライブラリー不要の核酸配列決定法を提供する、配列決定プローブ、方法、キット、及び装置を提供する。更に、本方法、キット、及び装置は、試料から結果への迅速な能力を有する。これらの特徴は、臨床環境での配列決定に特に有用である。

【課題を解決するための手段】

【0005】

本明細書において、標的結合ドメインとバーコードドメインとを含む配列決定プローブが提供される。標的結合ドメイン及びバーコードドメインは、機能的に連結されてもよく、例えば共有結合されていてもよい。配列決定プローブは場合により、標的結合ドメインとバーコードドメインとの間にスペーサーを含む。スペーサーは、適切な機械的特性を有する任意のポリマー、例えば１本鎖又は２本鎖ＤＮＡスペーサー（１～１００ヌクレオチド、例えば２～５０ヌクレオチドの）でもよい。２本鎖ＤＮＡスペーサーの非限定例には、配列番号２５～配列番号２９により包含される配列が含まれる。

【0006】

標的結合ドメインは、少なくとも４つ（例えば、４、５、６、７、８、９、１０、１１、１２、又はそれ以上）のヌクレオチドを含み、標的核酸（例えばＤＮＡ、ＲＮＡ、及びＰＮＡ）に結合することができる。バーコードドメインは合成主鎖を含み、バーコードドメインは、１つ以上の付着領域を含む少なくとも第１の位置を有する。バーコードドメインは、１、２、３、４、５、６、７、８、９、１０、１１、１２、又はそれ以上の位置を有し、各位置は１つ以上（例えば１～５０）の付着領域を有し、各付着領域は、相補的核酸分子（ＲＮＡ又はＤＮＡ）に可逆的に結合可能な少なくとも１つのコピー（すなわち、１～５０、例えば１０から３０コピー）の核酸配列を含む。バーコードドメイン内のある位置が、他の位置よりも多くの付着領域を有することがあり、あるいはバーコードドメイン内の各位置は、同じ数の付着領域を有する。第１付着領域の核酸配列は、標的結合ドメインの第１ヌクレオチドにより結合される標的核酸中の第１ヌクレオチドの位置及び本体を決定し、一方、第２付着領域の核酸配列は、標的結合ドメインの第２ヌクレオチドにより結合される標的核酸中の第２ヌクレオチドの位置及び本体を決定する。同様に、第６付着領域の核酸配列は、標的結合ドメインの第６ヌクレオチドにより結合される標的核酸中の第６ヌクレオチドの位置及び本体を決定する。実施態様では合成主鎖は、多糖、ポリヌクレオチド（例えば、１本鎖又は２本鎖ＤＮＡ又はＲＮＡ）、ペプチド、ペプチド核酸、又はポリペプチドを含む。標的結合ドメイン中のヌクレオチドの数は、バーコードドメイン中の位置の数に等しいか又はそれより多い（例えば、１、２、３、４、又はそれ以上）。バーコードドメインの特定の位置にある各付着領域は、同じ核酸配列の１つのコピー及び／又は同じ核酸配列の複数のコピーを含むことができる。しかしながら付着領域は、たとえ両方の付着領域が同じタイプのヌクレオチド（例えばアデニン、チミン、シトシン、グアニン、ウラシル、及びそれらの類似体）を特定する場合でさえ、付着領域とは異なる核酸配列を、バーコードドメインの異なる位置に含むであろう。付着領域は、合成主鎖中の修飾されたモノマー、例えば修飾されたヌクレオチドに連結されることができ、こうして、主鎖に対して分岐を形成する。付着領域は、合成主鎖のポリヌクレオチド配列の一部であってもよい。１つ以上の付着領域が、少なくとも１つのフランキング１本鎖ポリヌクレオチドに隣接していてもよく、すなわち、付着領域は、５’フランキング１本鎖ポリヌクレオチド及び／又は３’フランキング１本鎖ポリヌクレオチドに機能的に連結され得る。１つ又は２つのフランキング１本鎖ポリヌクレオチドを伴うか又は伴わない付着領域は、検出可能標識物を欠くハイブリダイズ性核酸分子にハイブリダイズされ得る。検出可能標識物を欠くハイブリダイズ性核酸分子は、長さが約４～約２０ヌクレオチド、例えば１２ヌクレオチド又はそれ以上でもよい。

【0007】

付着領域は、検出可能標識物を含む相補的核酸により結合されていてもよい。各相補的核酸は、検出可能標識物を含み得る。

【0008】

あるいは付着領域は、レポーター複合体の一部である相補的核酸（検出可能標識物を含む）により結合されてもよい。（検出可能標識物を含むか、又はレポーター複合体の）相補的核酸は、長さが約４～約２０ヌクレオチド、例えば約８、１０、１２、及び１４ヌクレオチド、又はそれ以上であり得る。レポーター複合体において、相補的核酸は、１次核酸分子に（直接的又は間接的に）連結される。相補的核酸は、１本鎖又は２本鎖の核酸リンカー（例えば、１～１００個のヌクレオチドを含むポリヌクレオチド）を介して、１次核酸分子に間接的に連結され得る。１次核酸は、１つ以上の（例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上の）２次核酸にハイブリダイズされる。各２次核酸は、１つ以上の（例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上の）３次核酸にハイブリダイズされ；３次核酸は１つ以上の検出可能標識物を含む。１つの又は各２次核酸は、１次核酸分子にハイブリダイズせず、かつ３次核酸分子にハイブリダイズしない領域（「追加のハンドル」）を含み得る。この領域は、長さが４以上（例えば、約６～約４０、例えば約８、１０、１２、及び１４）のヌクレオチドであってもよい。１次核酸分子にハイブリダイズせず、かつ３次核酸分子にハイブリダイズしない領域は、１次核酸分子に連結された相補的核酸分子のヌクレオチド配列を含み得る。この領域は、１次核酸にハイブリダイズするその末端に対して遠位である２次核酸の末端近くに位置し得る。相補的核酸のヌクレオチド配列を含む「追加のハンドル」を有することにより、レポーター複合体が配列決定プローブに結合する可能性及び速度が大幅に増加する。本発明の任意の実施態様又は態様において、レポーター複合体が「追加のハンドル」を含む場合、レポーター複合体は、レポーター複合体の相補的核酸を介して又は「追加のハンドル」を介して、配列決定プローブにハイブリダイズすることができる。例えば、「第１付着領域・・・第１のレポーター複合体の第１の相補的核酸分子への結合」」という語句は、その明白な意味に従って理解され、「第１付着領域・・・第１のレポーター複合施設の『追加のハンドル』への結合」」を意味するとも理解されるであろう。

【0009】

実施態様において、用語「バーコードドメイン」及び「合成主鎖」は同義語である。

【0010】

本明細書において、本発明の配列決定プローブを用いて核酸配列を決定する方法が提供される。この方法は、（１）本発明の少なくとも１つの配列決定プローブを、基板に固定化された（例えば、１、２、３、４、５、６、７、８、９、１０以上の位置で）標的核酸にハイブリダイズさせる工程と；（２）第１付着領域に、検出可能標識物（例えば蛍光標識物）を有する第１の相補的核酸分子（ＲＮＡ又はＤＮＡ）を、又は検出可能標識物（例えば蛍光標識物）を含む第１のレポーター複合体の第１の相補的核酸分子を結合させる工程と；（３）検出可能標識物を検出する工程、及び（４）固定化された標的核酸中の第１ヌクレオチドの位置及び本体を特定する工程を含む。場合により、固定化された標的核酸は、プローブにより結合される前に伸長される。この方法は、更に（５）第１付着領域（１つ又は２つのフランキング１本鎖ポリヌクレオチドを含むか又は含まない）に、検出可能標識物を欠く第１のハイブリダイズ性核酸分子を接触させ、こうして、検出可能標識物を有する第１の相補的核酸分子、又は検出可能標識物を含む第１のレポーター複合体の第１の相補的核酸分子の結合をはずし、そして、少なくとも、第１付着領域に、検出可能標識物を欠く第１のハイブリダイズ性核酸を結合させる工程と；（６）第２付着領域に、検出可能標識物を有する第２の相補的核酸分子、又は検出可能標識物を含む第２のレポーター複合体の相補的核酸分子を結合させる工程と；（７）検出可能標識物を検出する工程と；（８）固定化された標的核酸中の、第２ヌクレオチドの位置及び本体を特定する工程とを含む。固定化された標的核酸中に有り、標的結合ドメインに対応する各ヌクレオチドが特定されるまで、工程（５）～（８）が繰り返される。工程（５）及び（６）は、同時に又は連続して行うことができる。各（例えば、第１、第２、第３、第４、第５、第６、第７、第８、第９、第１０、又はそれ以上の）相補的核酸分子（検出可能標識物を有する、又はレポーター複合体の一部である）は、検出可能標識物を欠くその対応する（すなわち、第１、第２、第３、第４、第５、第６、第７、第８、第９、第１０、又はそれ以上の）ハイブリダイズ性核酸分子と同じ核酸配列を有する。標的核酸は、標的核酸の第１の位置及び／又は第２の位置を、第１及び／又は第２の捕捉プローブと結合させることにより、基板に固定化される。各捕捉プローブは、基板に選択的に結合する親和性タグを含む。第１及び／又は第２の位置は、標的核酸の末端又はその近傍であってもよい。基板は、当技術分野で公知の任意の固体支持体、例えば被覆スライド及びマイクロ流体デバイス（例えば、ストレプトアビジンで被覆されたもの）であり得る。標的核酸の末端から離れている他の位置は、基板に選択的に結合され得る。核酸は、標的核酸を伸長させるのに十分な力（例えば、重力、流体力、電磁力、流れ伸長力、後退メニスカス技術、及びそれらの組み合わせ）を加えることにより伸長され得る。

【0011】

本明細書では、本発明のプローブの１つの集団又は本発明の複数の集団を用いて、核酸配列を決定する方法が提供される。この方法は、（１）（本発明の）配列決定プローブの第１集団を、基板に固定化された標的核酸にハイブリダイズさせる（第１集団の各配列決定プローブは、ほぼ同じ条件下で、例えばカオトロピック剤、温度、塩濃度、ｐＨ、及び流体力学的な力のレベルで、固定化標的核酸から脱ハイブリダイズされる）工程と；（２）各々が検出可能標識物を有する複数の第１の相補的核酸分子を、又は各複合体が検出可能標識物を含む複数の第１のレポーター複合体の複数の第１の相補的核酸分子を、第１集団中の各配列決定プローブ中の第１付着領域に結合させる工程と；（３）検出可能標識物を検出する工程と；（４）第１集団中の配列決定プローブによりハイブリダイズされた固定化標的核酸中の、複数の第１ヌクレオチドの位置及び本体を特定する工程と；（５）第１集団の各配列決定プローブの各第１付着領域に、検出可能標識物を欠く複数の第１のハイブリダイズ性核酸分子を接触させ、こうして、検出可能標識物を有するか又はレポーター複合体の第１の相補的核酸分子の結合をはずし、そして各第１付着領域に、検出可能標識物を欠く第１のハイブリダイズ性核酸分子を結合させる工程と；（６）各々が検出可能標識物を有する複数の第２の相補的核酸分子を、又は各複合体が検出可能標識物を含む複数の第２のレポーター複合体の複数の第２の相補的核酸分子を、第１集団中の各配列決定プローブ中の第２付着領域に結合させる工程と；（７）検出可能標識物を検出する工程と；（８）第１集団中の配列決定プローブによりハイブリダイズされる固定化された標的核酸中の複数の第２ヌクレオチドの位置及び本体を特定する工程とを含む。工程（９）では、固定化された標的核酸中に有り、第１集団中の各配列決定プローブの標的結合ドメインに対応する、各ヌクレオチドが特定されるまで、工程（５）～（８）が繰り返される。工程（５）及び（６）は、同時に又は連続して行うことができる。こうして、配列決定プローブの第１集団中の配列決定プローブの標的結合ドメインによりハイブリダイズされた固定化された標的核酸の領域について、ヌクレオチドの直線的順序が特定される。

【0012】

実施態様において、プローブの複数の集団（すなわち２つ以上の集団）が使用される場合、この方法は更に、（１０）核酸から、第１集団の各配列決定プローブを脱ハイブリダイズする工程と；（１１）第１集団の各脱ハイブリダイズした配列決定プローブを除去する工程と；（１２）本発明の配列決定プローブの少なくとも第２集団をハイブリダイズする工程とを含み、ここで、第２集団中の各配列決定プローブは、固定化された標的核酸から、ほぼ同じ条件下で脱ハイブリダイズし、固定化された標的核酸から、第１集団中の配列決定プローブとは異なる条件下で脱ハイブリダイズする工程と；（１３）各々が検出可能標識物を有する複数の第１の相補的核酸分子を、又は各複合体が検出可能標識物を含む複数の第１のレポーター複合体の複数の第１の相補的核酸分子を、第２集団の各配列決定プローブ中の第１付着領域に結合させる工程と；（１４）検出可能標識物を検出する工程と；（１５）第２集団中の配列決定プローブによりハイブリダイズされた固定化標的核酸中の、複数の第１ヌクレオチドの位置及び本体を特定する工程と；（１６）第２集団の各配列決定プローブの各第１付着領域に、検出可能標識物を欠く複数の第１のハイブリダイズ性核酸分子を接触させ、こうして第１の相補的核酸分子の結合をはずし（検出可能標識物を有するか、又はレポーター複合体から）、そして各第１付着領域に、検出可能標識物を欠く第１のハイブリダイズ性核酸分子を結合させる工程と；（１７）各々が検出可能標識物を有する複数の第２の相補的核酸分子を、又は各複合体が検出可能標識物を含む複数の第２のレポーター複合体の複数の第２の相補的核酸分子を、第２集団の各配列決定プローブ中の第２付着領域に結合させる工程と；（１８）検出可能標識物を検出する工程と；（１９）第２集団中の配列決定プローブによりハイブリダイズされた固定化された標的核酸中の、複数の第２ヌクレオチドの位置及び本体を特定する工程と；及び（２０）配列決定プローブの第２集団中の配列決定プローブの標的結合ドメインによりハイブリダイズされた固定化された標的核酸の領域について、ヌクレオチドの直線的順序が特定されるまで、工程（１６）～（１９）を繰り返す工程とを含む。工程（１６）と（１７）は、同時に又は連続して行うことができる。

【0013】

第２集団中の各配列決定プローブは、第１集団中の配列決定プローブが標的核酸から脱ハイブリダイズする平均条件とは異なる条件（例えば、より高い温度、より高いレベルのカオトロピック剤、より高い塩濃度、より速い流速、及び異なるｐＨ）で、固定化された標的核酸から脱ハイブリダイズし得る。

【0014】

しかし、３つ以上のプローブ集団が使用される場合、２つの連続した集団中のプローブは異なる条件で脱ハイブリダイズし、非連続集団のプローブが同様の条件で脱ハイブリダイズし得る。一例として、第１集団と第３集団中のプローブが、同様の条件下で脱ハイブリダイズし得る。ある実施態様において、プローブの連続集団は、より厳しくなる条件（例えば、より高いレベルのカオトロピック剤、塩濃度、及び温度）で脱ハイブリダイズした。温度を例として使用すると、マイクロ流体デバイスでは、プローブの第１集団は第１の温度ではハイブリダイズしたままであり得るが、第１の温度よりも高い第２の温度では脱ハイブリダイズし得る。プローブの第２集団は第２の温度ではハイブリダイズしたままであり得るが、第２の温度よりも高い第３の温度では脱ハイブリダイズし得る。この例では、最初のプローブ集団のための標的核酸上を流れる溶液（本方法により必要とされる試薬を含む）は、後のプローブ集団のための標的核酸上を流れる溶液よりも低い温度である。

【0015】

ある実施態様において、プローブの集団が使用された後、そのプローブの集団は標的核酸から脱ハイブリダイズされ、同一のプローブ集団の新しいアリコートが使用される。例えば、プローブの第１集団がハイブリダイズされ、検出され、そして脱ハイブリダイズされた後、プローブの第１集団の次のアリコートがハイブリダイズされる。あるいは、一例として、プローブの第１集団は脱ハイブリダイズされ、プローブの第２の集団で置き換えることができる。第２の集団が検出されて脱ハイブリダイズされると、プローブの第１集団の次のアリコートが標的核酸にハイブリダイズされる。従って、次の集団のプローブは、以前に配列決定された標的核酸の領域にハイブリダイズし得る（こうして複製及び／又は確認配列情報を得る）か、又は次の集団のプローブは、以前に配列決定されていなかった標的核酸の領域にハイブリダイズし得る（こうして新しい配列情報を得る）。従って、先読みが（何らかの理由で）不十分であった場合に、及び／又は配列決定読取りから生じる整列の精度を改善する場合に、プローブの集団を再アリコートすることができる。

【0016】

同様の条件下でハイブリダイズ及び脱ハイブリダイズするプローブは、同様の長さのそれらの標的結合ドメイン、ＧＣ含量、又は反復塩基の頻度、及びそれらの組み合わせを有し得る。オリゴヌクレオチドのＴｍと長さとの関係は、例えば、Sugimoto et al., Biochemistry, 34, 11211-6 に教示されている。

【0017】

３つ以上のプローブ集団が使用される場合、配列決定プローブの第１及び第２の集団について記載されたような工程が、さらなるプローブ集団（例えば、１０～１００～１０００集団）について繰り返される。使用されるプローブの集団の数は、特に限定されないが、標的核酸のサイズ、各集団中のユニークなプローブの数、所望の配列決定プローブ間の重複の程度、及び関心領域へのプローブの濃縮を含む種々の要因に依存する。

【0018】

プローブの集団は、標的核酸の特定の関心領域、例えば突然変異（例えば点突然変異）又はＳＮＰ対立遺伝子を含む領域、に向けられた追加の配列決定プローブを含むことができる。プローブの集団は、標的核酸中の関心の小さい特定の領域に向けられたより少ない配列決定プローブを含むことができる。

【0019】

配列決定プローブの集団は、配列決定プローブの個別のより小さいプールに区画化することができる。区画化は、配列決定プローブ中の標的結合ドメインの予測される融解温度、及び／又は配列決定プローブ中の標的結合ドメインの配列モチーフに基づくことができる。区画化は、経験則から導かれたルールに基づいてもよい。配列決定プローブの異なるプールは、例えば温度、塩濃度、及び／又は緩衝液含有量などの異なる反応条件を用いて、標的核酸と反応させることができる。区画化は、均一な適用範囲で標的核酸をカバーするために実行し得る。区画化は、既知の適用範囲プロファイルを有する標的核酸をカバーするために実行し得る。

【0020】

配列決定プローブの集団中の標的結合ドメインの長さを短縮させて、標的核酸の特定の領域中のプローブの適用範囲を増加させることができる。配列決定プローブの集団中の標的結合ドメインの長さを延長させて、例えば配列決定装置の分解能限界を超えるように、標的核酸の特定の領域中のプローブの適用範囲を減少させることができる。

【0021】

代替的又は追加的に、集団中の配列決定プローブの濃度を高めて、標的核酸の特定の領域におけるプローブの適用範囲を増加させることができる。例えば配列決定装置の分解能限界を超えるように、配列決定プローブの濃度を低下させて、標的核酸の特定の領域中におけるプローブの適用範囲を減少させることができる。

【0022】

核酸配列を決定するための方法は、固定化された標的核酸の各領域についてヌクレオチドの各特定された直線的順序を組み立てる工程を更に含み、こうして、固定化された標的核酸の配列を特定することができる。組立工程は、識別された各ヌクレオチドの線状順序を整列させるようにマイクロプロセッサに指示する、実行可能なプログラムが記憶された非一時的コンピュータ可読記憶媒体を使用し、こうして、核酸の配列が得られる。組み立ては「リアルタイム」で、すなわち全てのデータが収集された後ではなく、配列決定プローブからデータが収集されている間に行われる。

【0023】

標的核酸、すなわち配列決定される標的核酸は、約４～１，０００，０００ヌクレオチドの長さであり得る。標的は、いずれの長さも１，０００，０００ヌクレオチドを超える、完全な無傷の染色体又はその断片を含み得る。

【0024】

本明細書では、本発明の方法を実施するための装置が提供される。

【0025】

本明細書において、本発明の配列決定プローブを含むキット、及び本発明の方法を実施するためのキットが提供される。実施態様においてキットは、捕捉プローブを介して核酸を固定化することができる基板、本発明の複数の配列決定プローブ、少なくとも１つの捕捉プローブ、検出可能標識物を有する少なくとも１つの相補的核酸分子、検出可能標識物を欠く少なくとも１つの相補的核酸分子、及び使用説明書を含む。実施態様においてキットは、約又は少なくとも４０９６のユニークな配列決定プローブを含む。４０９６は、可能性のある各六量体の組み合わせ（すなわち、バーコードドメイン中にそれぞれ６つの付着領域を有するプローブについて）を含めるために必要な、ユニークなプローブの最小数である。ここでは、６つの位置について４つのヌクレオチド選択肢（４⁶）があるため、「４０９６」が達成される．バーコードドメイン内に４つの付着領域を有する１組のプローブについて、２５６（すなわち４⁴）のユニークなプローブが必要になる。標的結合ドメイン中に８個のヌクレオチドを有するプローブのセットについては、４⁸（すなわち６５，５３６）のユニークなプローブが必要となる。標的結合ドメイン中に１０個のヌクレオチドを有するプローブのセットについては、４¹⁰（すなわち１，０４８，５７６）のユニークなプローブが必要となる。

【0026】

実施態様において、キットは、検出可能標識物を有する約又は少なくとも２４の別個の相補的核酸分子、及び検出可能標識物を欠く約又は少なくとも２４の異なるハイブリダイズ性核酸分子を含む。相補的核酸は、非限定的な例として、配列番号１～２４のうちの１つの配列を有する付着領域に結合することができる。バーコードドメインに含まれ得るさらなる例示的配列は、配列番号４２～配列番号８１に列記される。実際、ヌクレオチド配列は限定されず、好ましくは、これは既知のヌクレオチド配列との実質的な相同性（例えば５０％～９９．９％）を欠く。これは、相補的核酸と標的核酸の望ましくないハイブリダイゼーションを回避するのに役立つ。

【0027】

上記態様及び実施態様のいずれも、任意の他の態様又は実施態様と組み合わせることができる。

【0028】

他に定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者により一般的に理解されるのと同じ意味を有する。本明細書では、文脈が明確に別に指示しない限り、単数形は複数形も含む。例として、用語「ａ」、「ａｎ」、及び「ｔｈｅ」は単数又は複数であると理解され、用語「又は」は包括的であると理解される。例として「ある要素」は１つ以上の要素を意味する。本明細書を通して「含む（comprising）」という単語又は「含む（comprises）」又は「含む（comprising）」などの変形は、記載された要素、整数、若しくは工程、又は要素、整数、若しくは工程の群を含むが、任意の他の要素、整数、若しくは工程、又は要素、整数、若しくは工程の群を排除しないことを意味すると理解される。約は、記載された値の１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％、０．５％、０．１％、０．０５％、又は０．０１％以内であると理解することができる。文脈から特に明白でない限り、本明細書で提供される全ての数値は、用語「約」により修飾される。

【0029】

本明細書に記載されたものと同等の方法及び材料は、本発明の実施又は試験に使用することができるが、適切な方法及び材料は以下に記載される。本明細書で言及される全ての刊行物、特許出願、特許、及び他の参考文献は、その全体が参照により本明細書に組み込まれる。本明細書に引用される参考文献は、本願発明の先行技術であると認めるものではない。矛盾する場合、定義を含む本明細書が支配するものとする。更に、材料、方法、及び実施例は例示的なものに過ぎず、限定することを意図するものではない。本発明の他の特徴及び利点は、以下の詳細な説明及び請求項から明らかあろう。

【0030】

特許又は特許出願ファイルは、カラーで示される少なくとも１つの図面を含む。カラー図面付きの本特許又は特許出願のコピーは、要請及び必要な手数料の納付に応じて、特許庁により提供される。

【0031】

上記及びさらなる特徴は、添付の図面と併せて以下の詳細な説明から明らかになるであろう。

【図面の簡単な説明】

【0032】

【図1】本発明の例示的な配列決定プローブの模式図を示す。

【図2】本発明の例示的な配列決定プローブの模式図を示す。

【図3】本発明の例示的な配列決定プローブの模式図を示す。

【図4】本発明の例示的な配列決定プローブの模式図を示す。

【図5】本発明の例示的な配列決定プローブの模式図を示す。

【図6A】本発明の配列決定プローブの変種を示す概略図である。

【図6B】本発明の配列決定プローブの変種を示す概略図である。

【図6C】本発明の配列決定プローブの変種を示す概略図である。

【図6D】本発明の配列決定プローブの変種を示す概略図である。

【図7】本発明の配列決定プローブの標的結合ドメインの模式図を示す。ドメインは、ユニバーサル塩基を有する０、２、又は４個のヌクレオチドを含む。

【図8A】本発明の配列決定方法の工程を示す。

【図8B】本発明の配列決定方法の工程を示す。

【図8C】本発明の配列決定方法の工程を示す。

【図8D】本発明の配列決定方法の工程を示す。

【図8E】本発明の配列決定方法の工程を示す。

【図9A】本発明の配列決定方法の初期工程を示す。

【図9B】検出可能標識物を含むレポーター複合体の概略図を示す。

【図9C】それぞれ検出可能標識物を含む複数のレポーター複合体を示す。

【図9D】図９Ａから始まる配列決定方法のさらなる工程を示す。

【図9E】図９Ａから始まる配列決定方法のさらなる工程を示す。

【図9F】図９Ａから始まる配列決定方法のさらなる工程を示す。

【図9G】図９Ａから始まる配列決定方法のさらなる工程を示す。

【図10】図９Ｄ及び図９Ｅに示される工程の代替的な説明図、及びそこから得られる例示的なデータを示す。示された配列決定プローブの断片は、配列番号８２の配列を有する。

【図11】図１０に示す方法の変形例を示す。同様に示される配列決定プローブの断片は、配列番号８２の配列を有する。

【図12】本発明の方法を示す。

【図13】本発明の配列決定方法において必要とされる工程を、他の配列決定方法で必要とされる工程と比較する。

【図14】本発明により得られる性能測定値の例を示す。

【図15】本発明により得られる性能測定値の例を示す。

【図16】本発明及び様々な他の配列決定方法／装置についての、配列決定速度、読み取り回数、及び臨床的有用性を比較する。

【図17】本発明の配列決定方法の低い生データエラー率を示す。示された鋳型配列は、配列番号８３の配列を有する。

【図18】本発明から得られる配列決定データを他の配列決定方法と比較する。

【図19】本発明の配列決定方法の単一塩基特異性を示す。示された鋳型及びプローブ配列（上から下へ）は、配列番号８４～配列番号８８の配列を有する。

【図20A】本発明のレポーター複合体の種々のデザインを示す。

【図20B】図２０Ａに示されるレポーター複合体から得られた蛍光カウントを示す。

【図20C】本発明のレポーター複合体を構築するための例示的な配合法を示す。

【図21A】「追加のハンドル」を含むレポーター複合体のデザインを示す。

【図21B】「追加のハンドル」を有するレポーター複合体から得られた蛍光カウントを示す。

【図22A】本発明のレポーター複合体の２つの例示的なデザインのハイブリダイゼーション速度を示す。

【図22B】本発明のレポーター複合体の２つの例示的なデザインのハイブリダイゼーション速度を示す。

【図23】図８～図１２に示す方法とは異なる方法で使用される本発明の配列決定プローブの概略図を示す。

【図24】本発明において有用な消耗型配列決定カードの概略図を示す。

【図25】実施例３に記載の１０量体のミスマッチ検出を示す。示されたヌクレオチド（上から下へ）は、配列番号８９～配列番号９９の配列を有する。

【図26】実施例３に記載されるように、標的結合ドメインのサイズに依存するハイブリダイゼーション能力を示す。非常に高いレポーター濃度のためにバックグラウンドは高く、事前の精製はなかった。示されたヌクレオチド（上から下へ）は、配列番号１００～配列番号１０４の配列を有する。

【図27】単一スポット対完全長レポーターの比較を示す。単一スポットの結果は、ハイブリダイゼーションの速度が全長バーコード（条件１００ｎＭ標的、３０分のハイブリダイゼーション）よりも１０００倍大きいことを示す。

【発明を実施するための形態】

【0033】

本発明は、長い読み取り長さ及び低いエラー率を有する、酵素不要、増幅不要、及びライブラリー不要の核酸配列決定法を提供する、配列決定プローブ、方法、キット及び装置を提供する。
配列決定プローブ

【0034】

本発明は、標的結合ドメイン及びバーコードドメインを含む配列決定プローブに関する。本発明の配列決定プローブの非限定的な例を図１～６に示す。

【0035】

図１は、本発明の配列決定プローブの概略図を示す。この例示的な配列決定プローブは、６つのヌクレオチドの標的結合ドメインを有し、その各々は、バーコードドメイン（これは１つ以上の付着領域を含む）中の位置に対応する。第１付着領域に注目する。これは、標的結合ドメイン中の第１ヌクレオチドにより結合された標的核酸のヌクレオチドに対応する。バーコードドメインの３番目の位置に注目する。２つの付着領域を含む第５の位置に注目する。バーコードドメイン上の各位置は、複数の添付領域を持つことができる。たとえば、１つの位置は１～５０の付着領域を有することができる。バーコードドメイン内の特定の位置は、他の位置よりも多くの付着領域を有することができる（ここでは位置１～４及び６に対して位置５に示されている）。代わりに、バーコードドメイン内の各位置は、同じ数の付着領域を有する（例えば、図２、３、５、及び６参照）。図示されていないが、各付着領域は、相補的核酸分子（ＲＮＡ又はＤＮＡ）に可逆的に結合することができる核酸配列の少なくとも１つ（すなわち１～５０、例えば１０～３０）のコピーを含む。図１では、付着領域は、バーコードドメインを構成する線状ポリヌクレオチド分子と一体化している。

【0036】

図２は、本発明の配列決定プローブの概略図を示す。この例示的な配列決定プローブは、６つのヌクレオチドの標的結合ドメインを有し、その各々はバーコードドメイン中の付着領域に対応する。第１付着領域に注目する。これは、標的結合ドメイン中の第１ヌクレオチドにより結合された標的核酸のヌクレオチドに対応する。バーコードドメインの一部分と２つの第４付着領域とを含むバーコードドメイン上の第４の位置を囲んである。２つの６番目の付着領域に注目する。ここで、各位置は２つの付着領域を有するが、バーコードドメイン上の各位置は、１つの付着領域又は複数の付着領域、例えば２～５０の付着領域を有することができる。図示されていないが、各付着領域は、相補的核酸分子（ＲＮＡ又はＤＮＡ）に可逆的に結合することができる核酸配列の少なくとも１つ（すなわち１～５０、例えば１０～３０）のコピーを含む。図２においてバーコードドメインは、付着領域が連結された線状ポリヌクレオチド分子であり；付着領域はポリヌクレオチド分子と一体化していない。

【0037】

図３は、本発明の配列決定プローブの別の概略図を示す。この例示的な配列決定プローブは、４つのヌクレオチドの標的結合ドメインを有し、これらの４つのヌクレオチドは、バーコードドメインの４つの位置に対応する。各位置は、３つの連結された付着領域で示されている。

【0038】

図４は、本発明の配列決定プローブの更に別の概略図を示す。この例示的な配列決定プローブは、１０ヌクレオチドの標的結合ドメインを有する。しかし、最初の６個のヌクレオチドのみが、バーコードドメイン中の６つの位置に対応する。第７～第１０ヌクレオチド（「ｎ１～ｎ４」で示される）は、標的結合ドメインの長さを延長するために付加され、こうして、プローブが標的核酸にハイブリダイズし、ハイブリダイズしたままである可能性に影響を及ぼす。実施態様において、「ｎ」個のヌクレオチドは、バーコードドメイン中の位置に対応するヌクレオチドの前に存在し得る。実施態様において、「ｎ」個のヌクレオチドは、バーコードドメイン中の位置に対応するヌクレオチドの後に存在し得る。図４には４つの「ｎ」ヌクレオチドが示されているが、標的結合ドメインは、５つ以上の「ｎ」ヌクレオチドを含み得る。「ｎ」個のヌクレオチドは、４つの標準塩基のいずれかと塩基対合することができるユニバーサル塩基［例えば、イノシン、２’－デオキシイノシン（ヒポキサンチンデオキシヌクレオチド）誘導体、ニトロインドール、ニトロアゾール類似体、及び疎水性芳香族非水素結合塩基］を有することができる。

【0039】

本発明の別の配列決定プローブを図５に示す。ここで「ｎ」個のヌクレオチドは、バーコードドメイン中の位置に対応するヌクレオチドの前と後にある。示された例示的な配列決定プローブは、１０ヌクレオチドの標的結合ドメインを有する。しかし、標的結合ドメイン中の３番目～８番目のヌクレオチドのみが、バーコードドメイン中の６つの位置（第１～第６）に対応する。第１、第２、第９、及び第１０ヌクレオチド（「ｎ１～ｎ４」で示される）は、標的結合ドメインの長さを延長するために付加されている。図５には、４つの「ｎ」ヌクレオチドが示されている。しかし、標的結合ドメインは、４つより多いか又は少ない「ｎ」ヌクレオチドを含み得る。

【0040】

図６Ａ～６Ｄは、図１の配列決定プローブの変種を示す。図６Ａにおいて、標的結合ドメイン中のヌクレオチドの直線的順序及びバーコードドメイン中の付着領域の直線的順序は、左から右へ進む（図に関し）。図６Ｂにおいて、標的結合ドメイン中のヌクレオチドの直線的順序及びバーコードドメイン中の付着領域の直線的順序は、右から左へ進む（図に関して）。図６Ｃにおいて、標的結合ドメイン中のヌクレオチドの直線的順序は、バーコードドメイン中の付着領域の直線的順序に対して逆転している。本発明のいずれのプローブにおいても、標的結合ドメイン中の各ヌクレオチドがバーコードドメイン内の付着ドメインに対応するように、プローブが設計される限りは、標的結合ドメイン中のヌクレオチドとバーコードドメイン内の付着領域のヌクレオチドの厳密な秩序が欠如しているかも知れない。厳密な順序の欠如は図６Ｄに示されている。本発明のいかなるプローブ（例えば、図１～５に例示されるプローブ）も、図６に示されるようなヌクレオチド及び付着領域の順序を有し得る。

【0041】

標的結合ドメインは、少なくとも４つのヌクレオチド、例えば、少なくとも４、５、６、７、８、９、１０、１１、１２、又はそれ以上のヌクレオチドを有する。好ましい標的結合ドメインはポリヌクレオチドである。標的結合ドメインは、標的核酸に結合することができる。

【0042】

プローブは、合成主鎖に機能的に連結している標的結合ドメインの複数のコピーを含み得る。

【0043】

プローブは、ハイブリダイゼーション及び／又は脱ハイブリダイゼーションの確率及びこれらが生じる速度を制御するように設計することができる。一般に、プローブのＴｍが低いほど、プローブは標的核酸に／標的核酸から脱ハイブリダイズすることが、より速くかつより高率になる。従って、より低いＴｍプローブの使用は、標的核酸に結合したプローブの数を減少させる。

【0044】

標的結合ドメインの長さは、一部は、プローブが標的核酸にハイブリダイズしハイブリダイズしたままである確率に影響を与える。一般に、標的結合ドメインがより長い（ヌクレオチドの数が多い）ほど、相補的配列が標的ヌクレオチド中に存在する確率は低い。反対に、標的結合ドメインが短いほど、相補的配列が標的ヌクレオチド中に存在する確率が高い。例えば、４量体配列が標的核酸中に位置する確率は１／２５６であり、これに対して６量体配列が標的核酸中に位置する確率は１／４０９６である。結果的に、より短いプローブのコレクションは、より長いプローブのコレクションと比較した場合、核酸の所定のストレッチについて、より多くの位置で結合する確率が高い。

【0045】

図７は、１０量体の標的結合ドメインを示す。いくつかの実施態様において、標的結合ドメインは、４つの標準ヌクレオチド（Ａ、Ｇ、Ｃ、及びＴ）のいずれかと塩基対合する４つのユニバーサル塩基（「Ｕ_b」として識別される）を含む。実施態様において、標的結合ドメインは、１～６（例えば２及び４）のユニバーサル塩基を含む。標的結合ドメインは、ユニバーサルヌクレオチドを含まない場合がある。図７は、標的結合ドメイン中の６個の特異的ヌクレオチドを有するプローブの「完全な」集団が４０９６個のユニークなプローブを必要とし、１０個の特異的ヌクレオチドを有するプローブの「完全な」集団が約１００万個のユニークなプローブを必要とすることを示す。

【0046】

状況に応じて、例えば変異又はＳＮＰ対立遺伝子を検出する時、核酸の所定のストレッチにおける読み取りの数を増加させ、こうして、標的核酸又は標的核酸の一部の適用範囲、特に関係する部分の適用範囲を濃縮するために、より短い標的結合ドメインを有するプローブを有することが好ましい。

【0047】

しかしながら、領域内のあまりにも多くのプローブがそれらの検出可能標識物の重複を引き起こし、こうして２つの近傍のプローブの分解能を妨げることがあるため、標的核酸に結合するプローブの数を少なくすることが好ましい。これは以下のように説明される。１つのヌクレオチドは０．３４ｎｍの長さであり、配列決定装置の横方向（ｘ－ｙ）空間分解能が約２００ｎｍであると仮定すると、配列決定装置の分解能限界は約５８８塩基対（すなわち、１ヌクレオチド／０．３４ｎｍ×２００ｎｍ）である。すなわち、２つのプローブが互いに約５８８塩基対以内にある場合、上記配列決定装置は、標的核酸にハイブリダイズした２つのプローブからの信号を分解することができ、ない。従って、配列決定装置の分解能に応じて、２つのプローブは、それらの検出可能標識物を別個の「スポット」として分離する前に、約６００ｂｐの間隔を置いて配置する必要がある。従って、最適な間隔では、標的核酸の６００ｂｐあたり１つのプローブが存在するはずである。標的核酸の分解可能な領域内のハイブリダイズするプローブの数を追跡し、制限し、おそらくは解析し、それに応じてプローブ集団を設計するために、様々なソフトウェアアプローチ（例えば、蛍光強度値と波長依存比の利用）を用いることができる。更に、より離散した信号を提供する検出可能標識物（例えば蛍光標識物）を選択することができる。更に、文献中の方法（例えば、Small and Parthasarthy: “Superresolution localization methods.” Annu. Rev. Phys Chem., 2014; 65:107-25）は、構造照明及び様々な超解像アプローチを記載しており、これらは、配列決定顕微鏡の分解能の上限を数１０ｎｍまで低下させる、より高分解能の配列決定装置を使用することにより、より短い標的結合ドメインを有するプローブの使用が可能になる。

【0048】

上述したように、プローブのＴｍを設計することは、標的核酸にハイブリダイズするプローブの数に影響を及ぼす可能性がある。代替的に又は追加的に、集団中の配列決定プローブの濃度を増加させて、標的核酸の特定の領域中のプローブの適用範囲を増加させることができる。例えば、配列決定装置の分解能限界を超えるように、配列決定プローブの濃度を低下させて、標的核酸の特定の領域におけるプローブの適用範囲を減少させることができる。

【0049】

「標的核酸」という用語は、本発明のプローブ、方法、及び装置によりその配列が決定される核酸分子（ＤＮＡ、ＲＮＡ、又はＰＮＡ）を意味するものとする。一般に、用語「標的核酸」、「核酸分子」、「核酸配列」、「核酸」、「核酸断片」、「オリゴヌクレオチド」、及び「ポリヌクレオチド」は互換的に使用され、特に限定されないが、種々の長さを有し得るヌクレオチド（デオキシリボヌクレオチド、又はリボヌクレオチド、又はそれらの類似体）のポリマー形態を含むことが企図される。核酸の非限定的な例には、遺伝子、遺伝子断片、エキソン、イントロン、遺伝子間ＤＮＡ（特に限定されないが、ヘテロクロマチン性ＤＮＡを含む）、メッセンジャーＲＮＡ（ｍＲＮＡ）、トランスファーＲＮＡ、リボソームＲＮＡ、リボザイム、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、非コードＲＮＡ（ｎｃＲＮＡ）、ｃＤＮＡ、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、配列の単離されたＤＮＡ、配列の単離されたＲＮＡ、核酸プローブ、及びプライマーが含まれる。

【0050】

本方法は、試料、例えば生物由来の試料から得られた核酸分子を、好ましくは変換（又は増幅）工程なしで直接配列決定する。一例として、ＲＮＡ主体の配列決定のために、本方法は、配列が得られる前にＲＮＡ分子のＤＮＡ分子への変換（すなわちｃＤＮＡの合成による）を必要としない。増幅又は変換が必要でないため、本発明で配列決定された核酸は、核酸が試料中にあるとき又は試料から得られたときに、核酸中に存在する任意のユニークな塩基及び／又はエピジェネティックマーカーを保持するであろう。そのような固有の塩基及び／又はエピジェネティックマーカーは、当技術分野で公知の配列決定法の最中に失われる。

【0051】

標的核酸は、任意の試料又は核酸源、例えば、任意の細胞、組織、又は生物から、インビトロで、化学合成機などから得ることができる。標的核酸は、任意の当該技術分野で認識された方法により得ることができる。実施態様において、核酸は臨床的被験体の血液試料から得られる。核酸は、当該分野で周知の方法及びキットを使用して、供給源又は試料から抽出、単離、又は精製することができる。

【0052】

標的核酸を含む核酸分子は、当技術分野で公知の任意の手段により断片化することができる。好ましくは断片化は、酵素的手段又は機械的手段により実施される。機械的手段は、超音波処理又は物理的剪断であってもよい。酵素的手段は、ヌクレアーゼ（例えば、デオキシリボヌクレアーゼＩ（ＤＮａｓｅＩ））又は１つ以上の制限エンドヌクレアーゼによる消化により行われ得る。

【0053】

標的核酸を含む核酸分子がインタクトな染色体である場合、染色体の断片化を避けるための工程が必要である。

【0054】

標的核酸は、当技術分野で周知のように、修飾されたヌクレオチドを含む天然又は非天然のヌクレオチドを含むことができる。

【0055】

本発明のプローブは、約２０ｎｍ～約５０ｎｍの全長（標的結合ドメイン、バーコードドメイン、及び任意のドメインを含む）を有し得る。プローブの主鎖は、約１２０ヌクレオチドを含むポリヌクレオチド分子であり得る。

【0056】

バーコードドメインは合成主鎖を含む。合成主鎖と標的結合ドメインは機能的に連結されており、例えばリンカーを介して共有結合又は結合している。合成主鎖は、多糖類、ポリヌクレオチド、ポリマー、プラスチック、繊維、ペプチド、ペプチド核酸、又はポリペプチドなどの任意の材料を含むことができる。好ましくは、合成主鎖は剛性である。実施態様において、主鎖は、６個のＤＮＡ2重らせんの「ＤＮＡ折り紙」を含む（例えば、Lin et al, “Submicrometre geometrically encoded fluorescent barcodes self-assembled from DNA.” Nature Chemistry; 2012 Oct; 4(10): 832-9 参照）。バーコードは、ＤＮＡ折り紙タイルで作ることができる（Jungmann et al, “Multiplexed 3D cellular super-resolution imaging with DNA-PAINT and Exchange-PAINT”, Nature Methods, Vol. 11, No. 3, 2014）。

【0057】

バーコードドメインは、複数の位置、例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上の位置を含む。位置の数は、標的結合ドメイン中のヌクレオチドの数より少ないか、等しいか、又はそれ以上でもよい。主鎖ドメイン中の位置の数よりも多くのヌクレオチド、例えば１、２、３、４、５、６、７、８、９、１０、又はそれ以上のヌクレオチドを、標的結合ドメイン中に含むことが好ましい。バーコード領域の長さは、上述したように、少なくとも４つの位置に十分なスペースがあれば、制限されない。

【0058】

バーコードドメインにおける各位置は、標的結合ドメイン中のヌクレオチドに対応し、従って標的核酸中のヌクレオチドに対応する。例として、バーコードドメインの第１の位置は標的結合ドメインの第１ヌクレオチドに対応し、バーコードドメインの第６の位置は標的結合ドメインの第６ヌクレオチドに対応する。

【0059】

バーコードドメイン内の各位置は、少なくとも１つの付着領域、例えば１～５０個又はそれ以上の付着領域を含む。バーコードドメイン内の特定の位置は、他の位置よりも多くの付着領域を有することができる（例えば、第１の位置は３つの付着領域を有し、第２の位置は２つの付着位置を有することができる）。あるいは、バーコードドメイン内の各位置は同じ数の付着領域を有する。各付着領域は、相補的核酸分子（例えばＤＮＡ又はＲＮＡ）により可逆的に結合されることができる核酸配列の少なくとも１つ（すなわち、１～５０、例えば１０～３０）のコピーを含む。例では、第１付着領域中の核酸配列は、標的結合ドメインの第１ヌクレオチドにより結合される標的核酸中の第１ヌクレオチドの位置及び本体を決定する。各付着領域は、付着領域が合成主鎖から分岐するように、合成主鎖内の修飾モノマー（例えば、修飾ヌクレオチド）に連結されてもよい。実施態様において、付着領域はポリヌクレオチド主鎖と一体化している。すなわち、主鎖は単一のポリヌクレオチドであり、付着領域は単一のポリヌクレオチド配列の一部である。実施態様において、用語「バーコードドメイン」及び「合成主鎖」は同義語である。

【0060】

付着領域中の核酸配列は、配列決定プローブの標的結合ドメイン中のヌクレオチドにより結合される標的核酸中のヌクレオチドの位置及び本体を特定する。プローブ中で各付着領域は、ユニークな全体配列を有する。実際、バーコードドメイン上の各位置は、アデニン、チミン／ウラシル、シトシン、及びグアニンの１つに特異的な、４つのヌクレオチドのうちの１つをコードする核酸配列を含む付着領域を有することができる。また、第１の位置の（及び例えばシトシンをコードする）付着領域は、第２の位置の（及び例えばシトシンをコードする）付着領域とは異なる核酸配列を含む。従って、チミンをコードする第１の位置の付着領域の核酸配列に対して、標的結合ドメインの第１ヌクレオチドに対応する標的核酸中のアデニンを特定する相補的核酸分子の結合は存在しない。また、第２の位置の付着領域に対して、標的結合ドメインの第１ヌクレオチドに対応する標的核酸中のアデニンを特定する相補的核酸分子の結合は存在しない。

【0061】

バーコードドメイン上の各位置は、１つ以上（最大５０、好ましくは１０～３０）の付着領域を含むことができ、従って、各付着領域は、１つ以上（最大５０、好ましくは１０～３０）の相補的核酸分子に結合することができる。例として、図１のプローブは、２つの付着領域を含む第５の位置を有し、図２のプローブは、６つの付着領域を有する第２の位置を有する。実施態様において、ある位置における付着領域の核酸配列は同一である。従って、それらの付着領域に結合する相補的核酸分子は同一である。別の実施態様において、ある位置における付着領域の核酸配列は同一ではない。従って、それらの付着領域に結合する相補的核酸分子は、同一ではなく、例えばそれぞれ異なる核酸配列及び／又は検出可能標識物を含む。従って、別の実施態様において、付着領域に付着した非同一核酸分子（例えば、それらの検出可能標識物）の組み合わせは、標的核酸中のヌクレオチドを特定するためのコードを提供する。

【0062】

表１は、例示的目的のみで、そのバーコードドメイン内に最大６個の位置を有するプローブを配列決定するための付着領域、及びそれに結合する相補的核酸上の検出可能標識物の例示的な配列を提供する。

【0063】

【表1】

【0064】

表１から明らかなように、第１付着領域の核酸配列は、配列番号１～配列番号４のうちの１つであってもよく、第２の付着の核酸配列は、配列番号５～配列番号８の１つであってもよい。標的核酸中の第１ヌクレオチドがアデニンである場合、第１付着領域の核酸配列は配列番号１の配列を有し、標的核酸中の第２ヌクレオチドがアデニンである場合、第２付着領域の核酸配列は、配列番号５の配列を有するであろう。

【0065】

実施態様において、相補的核酸分子は検出可能標識物により結合され得る。代替的実施態様において、相補的核酸は、検出可能標識物を含むレポーター複合体と結合される。

【0066】

相補的核酸のヌクレオチド配列は限定されない。好ましくは、これは既知のヌクレオチド配列と実質的な相同性（例えば５０％～９９．９％）を欠く；これは、相補的核酸と標的核酸との望ましくないハイブリダイゼーションを回避するのに助ける。

【0067】

本発明において有用なレポーター複合体の例を図９Ｂに示す。この例では、相補的核酸は、第１の核酸分子に連結され、次にこれは複数の第２の核酸分子にハイブリダイズされ、その各々は、1つ以上の検出可能標識物が結合した複数の第３の核酸分子にハイブリダイズしている。

【0068】

実施態様において、１次核酸分子は約９０ヌクレオチドを含み得る。２次核酸分子は、約８７ヌクレオチドを含み得る。３次核酸分子は、約１５ヌクレオチドを含み得る。

【0069】

図９Ｃは、例示的なレポーター複合体の集団を示す。図９Ｃの左上のパネルには、プローブの付着領域１にハイブリダイズする４つの複合体が含まれる。プローブの標的結合ドメインのヌクレオチド位置１に存在し得る各可能なヌクレオチドについて、１つのタイプのレポーター複合体が存在する。ここで、本発明の配列方法を実施する際に、プローブのレポータードメインの１位が、「青色」の検出可能標識物を有するレポーター複合体により結合されている場合、標的結合ドメイン中の第１ヌクレオチドはアデニンと特定される。あるいは、位置１が、「緑色」の検出可能標識物を有するレポーター複合体により結合されている場合、標的結合ドメイン中の第１ヌクレオチドはチミンとして特定される。

【0070】

レポーター複合体は、様々なデザインのものであり得る。例えば１次核酸分子は、少なくとも１つ（例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上）の２次核酸分子にハイブリダイズすることができる。各２次核酸分子は、少なくとも１つ（例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上）の３次核酸分子にハイブリダイズされ得る。例示的なレポーター複合体を図２０Ａに示す。ここで「４×３」レポーター複合体は、４つの２次核酸分子にハイブリダイズした１つの１次核酸分子（これは相補的核酸分子に連結している）を有し、その各々は、３つの３次核酸分子（それぞれが検出可能標識物を含む）にハイブリダイズしている。この図では、複合体の各相補的核酸は１２ヌクレオチド長（「１２塩基」）である。しかし、相補的核酸の長さは限定されず、１２ヌクレオチド未満又は１２ヌクレオチド超であり得る。右下の複合体は、その相補的核酸とその１次核酸分子との間にスペーサー領域を含む。スペーサーは、２０～４０ヌクレオチドの長さであると特定される。しかし、スペーサーの長さは限定されず、２０ヌクレオチドより短くてもよく、又は４０ヌクレオチドより長くてもよい。

【0071】

図２０Ｂは、図２０Ａに示される４つの例示的なレポーター複合体から得られた可変の平均（蛍光）カウントを示す。図２０Ｂでは、１０ｐＭのビオチン化標的鋳型をストレプトアビジン被覆フローセル表面上に付着させ、１０ｎＭのレポーター複合体をフローセル上に流した。１分間のインキュベーション後、フローセルを洗浄し、フローセルを画像化し、蛍光性特徴をカウントした。

【0072】

実施態様において、レポーター複合体は「予め構築されている」。すなわち、複合体中の各ポリヌクレオチドは、複合体をプローブと接触させる前にハイブリダイズされる。５つの例示的なレポーター複合体を予め構築するための例示的な処方を図２０Ｃに示す。

【0073】

図２１Ａは、２次核酸分子が、３次核酸分子にハイブリダイズせず、１次核酸分子に対して遠位である「追加のハンドル」を有する代替レポーター複合体を示す。この図において、各「追加のハンドル」は１２ヌクレオチド長（「１２量体（12 mer）」）である。しかし、その長さは限定されず、１２ヌクレオチド未満又は１２ヌクレオチド超であり得る。実施態様において、「追加のハンドル」はそれぞれ、相補的核酸のヌクレオチド配列を含む。従って、レポーター複合体が「追加のハンドル」を含む場合、レポーター複合体は、レポーター複合体の相補的核酸を介して、又は「追加のハンドル」を介して、配列決定プローブにハイブリダイズすることができる。従って、レポーター複合体が配列決定プローブに結合する確率が上昇する。「追加のハンドル」のデザインはまた、ハイブリダイゼーション速度を改善し得る。理論に拘束されるつもりはないが、「追加のハンドル」は本質的に、レポーター複合体の相補的核酸の有効濃度を増加させる。

【0074】

図２１Ｂは、図２０Ｂについて記載された手順を使用して、「追加のハンドル」を有する５つの例示的なレポーター複合体から得られた可変の平均（蛍光）カウントを示す。

【0075】

図２２Ａ及び２２Ｂは、２つの例示的なレポーター複合体のハイブリダイゼーション速度及び蛍光強度を示す。約５分後までに、総数がプラトーに変わり、加えられたほとんどのレポーター複合体が利用可能な標的を見出したことが示される。

【0076】

検出可能な部分、標識物、又はレポーターは、蛍光部分、比色部分などの検出可能な部分の直接的又は間接的な結合を含む様々な方法で、相補的核酸に又は３次核酸分子に結合させることができる。当業者は、核酸の標識に関する参考文献を参照することができる。蛍光部分の例は、特に限定されないが、黄色蛍光タンパク質（ＹＦＰ）、緑色蛍光タンパク質（ＧＦＰ）、シアン蛍光タンパク質（ＣＦＰ）、赤色蛍光タンパク質（ＲＦＰ）、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアネート、ローダミン、ジクロロトリアジニルアミンフルオレセイン、シアニン、塩化ダンシル、フィコシアニン、フィコエリトリンなどが挙げられる。蛍光標識物及びヌクレオチド及び／又はオリゴヌクレオチドへのそれらの結合は、多くの総説に記載されており、Haugland, Handbook of Fluorescent Probes and Research Chemicals, Ninth Edition (Molecular Probes, Inc., Eugene, 2002); Keller and Manak, DNA Probes, 2nd Edition (Stockton Press, New York, 1993); Eckstein, editor, Oligonucleotides and Analogues: A Practical Approach (IRL Press, Oxford, 1991); 及び Wetmur, Critical Reviews in Biochemistry and Molecular Biology, 26:227-259 (1991) がある。本発明に適用可能な具体的な方法論は、以下の文献の例に開示されている：米国特許第４，７５７，１４１号；第５，１５１，５０７；及び第５，０９１，５１９号。ある態様において、標識された標的配列の標識物として１つ以上の蛍光色素が使用され、これは、例えば米国特許第５，１８８，９３４号（４，７－ジクロロフルオレセイン色素）；第５，３６６，８６０号（スペクトル的に分割可能なローダミン色素）；第５，８４７，１６２号（４，７－ジクロロローダミン色素）；第４，３１８，８４６号（エーテル置換フルオレセイン色素）；第５，８００，９９６号（エネルギー移動色素）；Lee et al.、第５，０６６，５８０号（キサンチン色素）；第５，６８８，６４８号（エネルギー移動色素）等に開示されている。標識はまた、以下の特許及び特許公報に開示されているように、量子ドットを用いて行うことができる：米国特許第６，３２２，９０１号；第６，５７６，２９１号；第６，４２３，５５１号；第６，２５１，３０３号；第６，３１９，４２６号；第６，４２６，５１３号；第６，４４４，１４３号；第５，９９０，４７９号；第６，２０７，３９２号；第２００２／００４５０４５号；及び２００３／００１７２６４号。本明細書で使用される用語「蛍光標識物」は、１つ以上の分子の蛍光吸収及び／又は放出特性を通して情報を伝達する信号伝達部分を含む。このような蛍光特性には、蛍光強度、蛍光寿命、発光スペクトル特性、エネルギー移動などを含む。

【0077】

ヌクレオチド及び／又はオリゴヌクレオチド配列に容易に組み込まれる市販の蛍光ヌクレオチド類似体としては、特に限定されないが、Ｃｙ３－ｄＣＴＰ、Ｃｙ３－ｄＵＴＰ、Ｃｙ５－ｄＣＴＰ、Ｃｙ５－ｄＵＴＰ（Amersham Biosciences, Piscataway, NJ）、フルオレセイン－１２－ｄＵＴＰ、テトラメチルローダミン－６－ｄＵＴＰ、テキサスレッド（登録商標）－５－ｄＵＴＰ、カスケードブルー（登録商標）－７－ｄＵＴＰ、ＢＯＤＩＰＹＴＭＦＬ－１４－ｄＵＴＰ、ＢＯＤＩＰＹＴＭＲ－１４－ｄＵＴＰ、ＢＯＤＩＰＹＴＭＴＲ－１４－ｄＵＴＰ、ローダミングリーン（登録商標）５－ｄＵＴＰ、ＯＲＥＧＯＮＧＲＥＥＮＲ（商標）４８８－５－ｄＵＴＰ、テキサスレッド（登録商標）－１２－ｄＵＴＰ、ＢＯＤＩＰＹＴＭ６３０／６５０－１４－ｄＵＴＰ、ＢＯＤＩＰＹＴＭ６５０／６６５－１４－ｄＵＴＰ、アレクサフルオール（登録商標）４８８－５－ｄＵＴＰ、アレクサフルオール（登録商標）５３２－５－ｄＵＴＰ、アレクサフルオール（登録商標）５６８－５－ｄＵＴＰ、アレクサフルオール（登録商標）５９４－５－ｄＵＴＰ、アレクサフルオール（登録商標）５４６－１４－ｄＵＴＰ、フルオレセイン－１２－ＵＴＰ、テトラメチルローダミン－６－ＵＴＰ、テキサスレッド（登録商標）－５－ＵＴＰ、ｍＣｈｅｒｒｙ、カスケードブルー（登録商標）－７－ＵＴＰ、ＢＯＤＩＰＹＴＭＦＬ－１４－ＵＴＰ、ＢＯＤＩＰＹＴＭＲ－１４－ＵＴＰ、ＢＯＤＩＰＹＴＭＴＲ－１４－ＵＴＰ、ローダミングリーン（登録商標）－５－ＵＴＰ、アレクサフルオール（商標）４８８－５－ＵＴＰ、アレクサフルオール（商標）５４６－１４－ＵＴＰ（Molecular Probes, Inc. Eugene, OR）などが挙げられる。あるいは、上記蛍光発色団及び本明細書に記載のものは、例えばホスホロアミダイト又はＮＨＳ化学を用いてオリゴヌクレオチド合成中に添加することができる。他の蛍光発色団を有するヌクレオチドの特注の合成についてのプロトコルは当該分野で公知である（Henegariu et al. (2000) Nature Biotechnol. 18:345 参照）。２－アミノプリンは、その合成中にオリゴヌクレオチド配列に直接組み込むことができる蛍光塩基である。核酸はまた、ＤＡＰＩ、ＹＯＹＯ－１、臭化エチジウム、シアニン色素（例えば、ＳＹＢＲグリーン）などのインターカレーティング色素を用いて先験的に染色することもできる。

【0078】

合成後の付着に利用可能な他の蛍光発色団には、特に限定されないが、アレクサフルオール（登録商標）３５０、アレクサフルオール（登録商標）４０５、アレクサフルオール（登録商標）４３０、アレクサフルオール（登録商標）５３２、アレクサフルオール（登録商標）５４６、アレクサフルオール（登録商標）５６８、アレクサフルオール（登録商標）５９４、アレクサフルオール（商標）６４７、ＢＯＤＩＰＹ４９３／５０３、ＢＯＤＩＰＹＦＬ、ＢＯＤＩＰＹＲ６Ｇ、ＢＯＤＩＰＹ５３０／５５０、ＢＯＤＩＰＹＴＭＲ、ＢＯＤＩＰＹ５５８／５６８、ＢＯＤＩＰＹ５５８／５６８、ＢＯＤＩＰＹ５６４／５７０、ＢＯＤＩＰＹ５７６／５８９、ＢＯＤＩＰＹ５８１／５９１、ＢＯＤＩＰＹＴＲ、ＢＯＤＩＰＹ６３０／６５０、ＢＯＤＩＰＹ６５０／６６５、カスケードブルー、カスケードイエロー、ダンシル、リサミンローダミンＢ、マリーナブルー、オレゴングリーン４８８、オレゴングリーン５１４、パシフィックブルー、パシフィックオレンジ、ローダミン６Ｇ、ローダミングリーン、ローダミンレッド、テトラメチルローダミン、テキサスレッド（Molecular Probes, Inc., Eugene, ORから入手可能）、Ｃｙ２、Ｃｙ３、Ｃｙ３．５、Ｃｙ５、Ｃｙ５．５、Ｃｙ７（Amersham Biosciences, Piscataway, NJ）などが挙げられる。特に限定されないが、ＰｅｒＣＰ－Ｃｙ５．５、ＰＥ－Ｃｙ５、ＰＥ－Ｃｙ５．５、ＰＥ－Ｃｙ７、ＰＥ－テキサスレッド、ＡＰＣ－Ｃｙ７、ＰＥ－アレクサ色素（６１０、６４７、６８０）、ＡＰＣ－アレクサ色素等を含むＦＲＥＴタンデム蛍光発色団も使用することができる。

【0079】

金属銀又は金粒子を使用して、蛍光標識されたヌクレオチド及び／又はオリゴヌクレオチド配列からの信号を増強することができる（Lakowicz et al. (2003) BioTechniques 34:62）。

【0080】

オリゴヌクレオチド配列のための他の適切な標識物は、フルオレセイン（ＦＡＭ、ＦＩＴＣ）、ジゴキシゲニン、ジニトロフェノール（ＤＮＰ）、ダンシル、ビオチン、ブロモデオキシウリジン（ＢｒｄＵ）、ヘキサヒスチジン（６ｘＨｉｓ）、ホスホアミノ酸（例えば、Ｐ－ｔｙｒ、Ｐ－ｓｅｒ、Ｐ－ｔｈｒ）等が挙げられる。ある実施態様において、検出のために以下のハプテン／抗体対が使用され、各抗体は検出可能標識物を用いて誘導体化される：ビオチン／α－ビオチン、ジゴキシゲニン／α－ジゴキシゲニン、ジニトロフェノール（ＤＮＰ）／α－ＤＮＰ、５－カルボキシフルオレセイン（ＦＡＭ）／ａ－ＦＡＭ。

【0081】

本明細書に記載される検出可能標識物は、スペクトル的に分解可能である。複数の蛍光標識物に関して「スペクトル的に分解可能」とは、標識物の蛍光発光帯が十分に明確であること、すなわち十分に重複していないことを意味し、それぞれの標識物が付着する分子タグは、それぞれの標識物により生成される蛍光信号に基づいて、標準的な光検出システム、例えば米国特許第４，２３０，５５８号；第４，８１１，２１８号；など、又は Flow Cytometry: Instrumentation and Data Analysis (Academic Press, New York, 1985) 中の Wheeless et al., pgs. 21-76 に記載されているシステムにより例示されるような、バンドパスフィルター及び光電子増倍管などのシステムを使用して区別することができる。ある態様において、フルオレセイン、ローダミンなどのスペクトル的に分解可能な有機色素は、波長放出最大値が少なくとも２０ｎｍ離間しており、別の態様において少なくとも４０ｎｍ離間していることを意味する。別の態様において、キレート化ランタニド化合物、量子ドットなどは、スペクトル分解可能であるとは、波長放出最大値が少なくとも１０ｎｍ離れており、さらなる態様において、少なくとも１５ｎｍ離れていることを意味する。
配列決定方法

【0082】

本発明は、本発明の配列決定プローブを用いて核酸配列を決定する方法に関する。この方法の例を図８～１２に示す。

【0083】

この方法は、本発明の少なくとも１つの配列決定プローブを、基板に固定化された（例えば、１、２、３、４、５、６、７、８、９、１０、又はそれ以上の位置で）標的核酸に可逆的にハイブリダイズさせることを含む。

【0084】

基板は、当技術分野で公知の任意の固体支持体、例えば標的核酸を固定化することができる、被覆スライド及びマイクロ流体デバイスであり得る。ある実施態様において、基板は、表面、膜、ビーズ、多孔質材料、電極、又はアレイである。標的核酸は、当業者に明らかな任意の基板上に固定化することができる。

【0085】

実施態様において、標的核酸は、標的核酸の一部に相補的なドメインを含む捕捉プローブにより結合される。この部分は、標的核酸の末端であっても末端でなくてもよい。

【0086】

有用な基板の例には、リガンド、抗原、炭水化物、核酸、受容体、レクチン、及び抗体からなる群より選択される結合部分を含むものが挙げられる。捕捉プローブは、基板の結合部分と結合することができる結合部分が含まれる。反応性部分を含む有用な基板の例には、特に限定されないが、エポキシ、アルデヒド、金、ヒドラジド、スルフヒドリル、ＮＨＳ－エステル、アミン、チオール、カルボキシレート、マレイミド、ヒドロキシメチルホスフィン、イミドエステル、イソシアネート、ヒドロキシル、ペンタフルオロフェニル－エステル、ソラレン、ピリジルジスルフィド、又はビニルスルホン、ポリエチレングリコール（ＰＥＧ）、ヒドロゲル、又はそれらの混合物を含む表面が挙げられる。そのような表面は、市販品から得ることができるか、又は標準的な技術に従って調製することができる。反応性部分を含む有用な基板の例としては、特に限定されないが、ＯｐｔＡｒｒａｙ－ＤＮＡＮＨＳ基（Accler8）、ネクステリオン（Nexterion）スライドＡＬ（Schott）、及びネクステリオンスライドＥ（Schott）が挙げられる。

【0087】

実施態様において、捕捉プローブの結合部分はビオチンであり、基板はアビジン（例えばストレプトアビジン）を含む。アビジンを含む有用な基板が市販されており、ＴＢ０２００（Accelr8）、ＳＡＤ６、ＳＡＤ２０、ＳＡＤ１００、ＳＡＤ５００、ＳＡＤ２０００（Xantec）、スーパーアビジン（Array-It）、ストレプトアビジンスライド（カタログ番号ＭＰＣ０００、Xenopore）、及びＳストレプトアビジンスライド（カタログ番号４３９００３、Greiner Bio-one）が挙げられる。

【0088】

実施態様において、捕捉プローブの結合部分はアビジン（例えばストレプトアビジン）であり、基板はビオチンを含む。市販されているビオチンを含む有用な基板には、特に限定されないが、Ｏｐｔｉａｒｒａｙ－ｂｉｏｔｉｎ（Accler8）、ＢＤ６、ＢＤ２０、ＢＤ１００、ＢＤ５００、及びＢＤ２０００（Xantec）が含まれる。

【0089】

実施態様において、捕捉プローブの結合部分は、光活性化により基板に結合することができる反応性部分を含むことができる。基板は光反応性部分を含むことができ、又はナノレポーターの第１の部分は光反応性部分を含むことができる。光反応性部分のいくつかの例としては、アリールアジド、例えばＮ（（２－ピリジルジチオ）エチル）－４－アジドサリチルアミド；フッ素化アリールアジド、例えば４－アジド－２，３，５，６－テトラフルオロ安息香酸；ベンゾフェノン主体の試薬、例えば４－ベンゾイル安息香酸のスクシンイミジルエステル；及び５－ブロモ－デオキシウリジンが挙げられる。

【0090】

実施態様において、捕捉プローブの結合部分は、当業者に明らかな他の結合対を介して基板に固定化することができる。

【0091】

基板に結合した後、標的核酸を伸長させるのに十分な力（例えば、重力、流体力、電磁力「エレクトロストレッチング」、流動延伸、後退メニスカス技術、及びそれらの組み合わせ）を加えることにより、伸長させることができる。

【0092】

標的核酸は、標的核酸の第２の部分に相補的なドメインを含む第２の捕捉プローブにより結合されてもよい。この部分は、標的核酸の末端であっても末端でなくてもよい。第２の捕捉プローブの結合は、標的核酸の伸長の後又は伸長中に、又は伸長されていない標的核酸に対して行うことができる。第２の捕捉プローブは、上記のような結合を有することができる。

【0093】

捕捉プローブは、検出可能標識物、すなわち基準スポット点を含むか、又はそれと関連していてもよい。

【0094】

捕捉プローブは、標的核酸を試料から単離することができる。ここでは、捕捉プローブは、標的核酸を含む試料に添加される。捕捉プローブは、標的核酸の領域に相補的な捕捉プローブの領域を介して、標的核酸に結合する。標的核酸が、捕捉プローブの結合部分に結合する部分を含む基板と接触すると、核酸は基板上に固定化される。

【0095】

ユーザーが、高断片化試料からできるだけ多くの標的核酸分子を確実に「捕捉」するためには、それぞれが標的核酸の異なる領域に相補的な複数の捕捉プローブを含むことが有用である。例えば、第１のプールが、その５’末端近くの標的核酸の領域に相補的であり、第２のプールが、標的核酸の中央の領域に相補的であり、及び第３のプールがその３’末端の近くで相補的である、３つのプールの捕捉プローブがあり得る。これは、標的核酸あたり「ｎ個の目的の領域」に一般化することができる。この例では、断片化した標的核酸の個々のプールは、ビオチンタグを含むか又はビオチンタグに結合した捕捉プローブに結合した。１／ｎ番目の投入試料（ｎ＝標的核酸中の異なる領域の数）が、各プールチャンバーについて単離される。捕捉プローブは、目的の標的核酸に結合する。次いで、標的核酸は、捕捉プローブのビオチンを介して、基板に接着したアビジン分子に固定化される。場合により標的核酸は、例えば流れ又は静電気力により伸張される。全てのｎ個のプールは同時に伸長と結合（stretched-and-bound）することができ、又は完全に伸長した分子の数を最大にするために、プール１（これはほとんどの５’領域を捕捉する）を最初に伸長して結合させることができる。次にプール２（これは標的の中間領域を捕捉する）が伸長されて結合される。最後に、プール３を伸長されて結合されることができる。

【0096】

必要とされる別個の捕捉プローブの数は、標的核酸断片のサイズに反比例する。換言すれば、高度に断片化された標的核酸には、より多くの捕捉プローブが必要とされる。高度に断片化され分解された標的核酸を有するタイプの試料（例えば、ホルマリン固定パラフィン包埋組織）では、捕捉プローブの複数のプールを含むことが有用であり得る。一方、長い標的核酸断片を有する試料、例えばインビトロで単離された核酸を有する試料では、５’末端に１つの捕捉プローブで十分であり得る。

【0097】

２つまでの捕捉プローブ間、又は１つの捕捉プローブの後で標的核酸の末端の前の標的核酸の領域は、本明細書では「ギャップ」と呼ぶ。このギャップは、本発明の配列決定プローブにより結合されるのに利用可能な標的核酸の一部分である。最小ギャップは標的結合ドメイン長（例えば４～１０ヌクレオチド）であり、最大ギャップは全染色体の大部分である。

【0098】

固定化された標的核酸を図１２に示す。ここで２つの捕捉プローブは、「５’捕捉プローブ」及び「３’捕捉プローブ」として特定される。

【0099】

図８Ａは、標的核酸に結合した配列決定プローブの概略図を示す。ここで、標的核酸はチミジン（Ｔ）を有する。検出可能標識物を含む相補的核酸又はレポーター複合体の第１のプールが最上部に示され、プールの各メンバーは異なる検出可能標識物（例えば、チミジンは緑色信号により特定される）及び異なるヌクレオチド配列を有する。標的結合ドメイン中の第１ヌクレオチドは、標的核酸中のＴに結合する。プローブの第１付着領域は、プローブの標的結合ドメイン中の第１ヌクレオチドがチミジンに結合することを特定する、１つ以上のヌクレオチド配列を含む。従って、チミジンのための相補的核酸のみが、バーコードドメインの第１の位置に結合する。示されるように、検出可能標識物を含むチミジンをコードする第１の相補的核酸又は検出可能標識物を含むレポーター複合体は、プローブのバーコードドメインの位置１の付着領域に結合される。

【0100】

相補的核酸又はレポーター複合体のプールの数は、バーコードドメイン中の位置の数と同一である。従って、６つの位置を有するバーコードドメインについては、６つのプールがプローブ上で循環される。

【0101】

あるいは、標的核酸をプローブと接触させる前に、プローブを、その第１の位置で検出可能標識物を含む相補的核酸又はレポーター複合体にハイブリダイズさせることができる。従って、その標的核酸と接触すると、プローブはその第１の位置から検出可能な信号を放出することができ、バーコードドメイン上の第１の位置に向けられた相補的核酸又はレポーター複合体の第１のプールを提供する必要はない。

【0102】

図８Ｂは、図８Ａに示す方法を継続する。ここで、バーコードドメインの第１の位置の付着領域に結合したチミジンの第１の相補的核酸（又はレポーター複合体）は、チミジン用であり検出可能標識物を欠く第１のハイブリダイズ性核酸で置換されている。チミジン用であり検出可能標識物を欠く第１のハイブリダイズ性核酸は、検出可能標識物を含むすでに結合している相補的核酸を、又はすでに結合しているレポーター複合体を置換する。こうして、バーコードドメインの位置１はもはや検出可能な信号を放出しない。

【0103】

実施態様において、検出可能標識物を含む相補的核酸又はレポーター複合体は、付着領域から除去され得るが、検出可能標識物を欠くハイブリダイズ性核酸では置換され得ない。これは、例えば、カオトロピック剤を添加すること、温度を上昇させること、塩濃度を変えること、ｐＨを調整すること、及び／又は流体力を加えることにより生じ得る。これらの実施態様において、必要な試薬（すなわち、検出可能標識物を欠くハイブリダイズ性核酸）はより少ない。

【0104】

図８Ｃは、本願発明の方法を継続する。ここで、標的核酸はチミジン（Ｔ）に続いてシチジン（Ｃ）を有する。相補的核酸の又はレポーター複合体の第２のプールが最上部に示され、プールの各メンバーは異なる検出可能標識物及び異なるヌクレオチド配列を有する。更に、第１のプールの相補的核酸又はレポーター複合体の相補的核酸のヌクレオチド配列は、第２のプールのヌクレオチド配列とは異なる。しかし、塩基特異的検出可能標識物は相補的核酸のプールに共通であり、例えばチミジンは緑色信号により特定される。ここで、標的結合ドメイン中の第２ヌクレオチドは、標的核酸中のＣに結合する。プローブの第２付着領域は、プローブの標的結合ドメイン中の第２ヌクレオチドがシチジンに結合することを特定するヌクレオチド配列を有する。従って、検出可能標識物含む相補的核酸又は第２のプールからのシチジン用のレポーター複合体のみが、バーコードドメインの第２の位置に結合する。示されるように、シチジンをコードする第２の相補的核酸又はレポーター複合体は、プローブのバーコードドメインの第２の位置で結合される。

【0105】

実施態様において、図８Ｃに示される工程は、図８Ｂに示される工程に続く。ここで、相補的核酸又はレポーター複合体の第１のプール（図８Ａ）が、検出可能標識物を欠く第１のハイブリダイズ性核酸（図８Ｂ）で置換されると、相補的核酸又はレポーター複合体の第２のプールが提供される（図８Ｃに示すように）。あるいは、図８Ｃに示す工程は、図８Ｂに示す工程と同時に起きる。ここで、検出可能標識物を欠く第１のハイブリダイズ性核酸（図８Ｂ）は、相補的核酸又はレポーター複合体の第２のプールと同時に提供される（図８Ｃに示すように）。

【0106】

図８Ｄは、図８Ｃに示される方法を継続する。ここで、バーコードドメイン上の第１～第５の位置は、検出可能標識物を含む相補的核酸又はレポーター複合体により結合され、検出可能標識物を欠くハイブリダイズ性核酸で置換されている。バーコードドメインの第６の位置は、現在、検出可能標識物を含む相補的核酸又はレポーター複合体により結合されており、これは、標的結合ドメインの第６の位置がグアニン（Ｇ）に結合していると特定する。

【0107】

上述したように、検出可能標識物を含む相補的核酸又はレポーター複合体は、付着領域から除去することはできるが、検出可能標識物を欠くハイブリダイズ性核酸で置換することはできない。

【0108】

必要に応じて、検出可能標識物の交換速度を加速する小さな１本鎖オリゴヌクレオチドを組み込むことにより、検出可能標識物交換の速度を加速することができる（例えば、「Ｔｏｅ－Ｈｏｌｄ」プローブ；例えば、Seeling et al., “Catalyzed Relaxation of a Metastable DNA Fuel”; J. Am. Chem. Soc. 2006, 128(37), pp12211-12220 を参照）。

【0109】

相補的核酸又はレポーター複合体を、バーコードドメイン上の最終位置（図８Ｄの６番目の位置）で置き換えることが可能である。しかし、これは、配列決定プローブを別の配列決定プローブと交換する場合には、必要でないことがある。実際、図８Ｄの配列決定プローブは、標的核酸から脱ハイブリダイズして除去され、そして、図８Ｅで示されるように、任意の相補的核酸によりまだ結合されていない第２の（重複する又は重複していない）配列決定プローブで置換することができる。図８Ｅのプローブは、プローブの第２集団に含めることができる。

【0110】

図８Ａ～８Ｅと同様に、図９Ａ及び９Ｄ～９Ｇは、本発明の方法の工程を示す。しかし図９Ａ及び９Ｄ～９Ｇは、レポーター複合体（検出可能標識物を含む）が配列決定プローブの付着領域に結合していることを明確に示している。図９Ｄ及び９Ｅは、レポーター複合体にハイブリダイズしたプローブから放出された蛍光信号を示す。図９Ｄ及び９Ｅは、標的核酸が「Ｔ－Ａ」配列を有することを示す。

【0111】

図１０は、図９Ｄ及び図９Ｅに示される工程を要約したものである。図の上部には、例示的なプローブのヌクレオチド配列が示され、プローブの重要なドメインを特定する。プローブは、その標的結合ドメインとそのバーコードドメインとの間に任意の２本鎖ＤＮＡスペーサーを含む。バーコードドメインは、順に、「Flank １」部分、「AR-1」部分、「AR-1／Flank ２」部分、「AR-2」部分、及び「AR-2／Flank ３」部分を含む。工程１では、「AR-1 Detect」がプローブの「AR-1」部分及び「AR-1／Flank ２」部分にハイブリダイズされる。「AR-1 Detect」は、第１の位置のチミジンをコードする、検出可能標識物を含むレポーター複合体又は相補的核酸に対応する。従って、工程１は図９Ｄに対応する。工程２では、「Lack １」がプローブの「Flank １」部分及び「AR-1」部分にハイブリダイズされる。「Lack １」は、プローブの第１付着領域（図９Ｅに第１付着領域を覆う黒色の棒として示す）に特異的である検出可能標識物を欠くハイブリダイズ性核酸に対応する。レポーター複合体又は相補的核酸の５’側である「Flank １」位置にハイブリダイズさせることにより、ハイブリダイズ性核酸は、レポーター複合体／相補的核酸をプローブからより効率的に置換する。「Flank」部分は、「Ｔｏｅ－Ｈｏｌｄｓ」とも呼ばれる。工程３では、「AR-2 Detect」はプローブの「AR-2」及び「AR-2／Flank ３」部分にハイブリダイズされる。「AR-2 Detect」は、第２の位置のグアニンをコードする検出可能標識物を含むレポーター複合体又は相補的核酸に対応する。従って、工程３は図９Ｅに対応する。この実施態様において、検出可能標識物を欠くハイブリダイズ性核酸／レポーター複合体が逐次提供される。

【0112】

あるいは、検出可能標識物を欠くハイブリダイズ性核酸及び検出可能標識物を含む相補的核酸／レポーター複合体が同時に提供される。この代替の実施態様を図１１に示す。工程２では、「Lack １」（検出可能な標識物を欠くハイブリダイズ性核酸）が「AR-2 Detect」（位置２のグアニンをコードするレポーター複合体）と共に提供される。この代替の実施態様は、２つの工程を１つにまとめたため、図１０に示された実施態様よりも時間的に有効であり得る。

【0113】

図１２は、本発明の方法を例示する。ここで、標的核酸は捕捉され、２つの位置で固定化され、こうしてプローブが結合することができる「ギャップ」が生じる。第１集団のプローブが標的核酸上にハイブリダイズされ、検出可能標識物が検出される。最初の工程が、第２集団のプローブ、第３集団のプローブから、及び１００を超える集団までのプローブで繰り返される。約１００集団のプローブの使用は、標的核酸中の各ヌクレオチドの約５Ｘの適用範囲を提供する。図１２は、１つの視野（ＦＯＶ）からの信号を検出するのに必要な時間に基づく、読み出し時間の推定速度を提供する。

【0114】

標的核酸の長さに沿ったプローブの分布は、検出可能な信号の分解にとって重要である。上述したように、２つの検出可能標識物の分解能限界は約６００ヌクレオチドである。好ましくは、プローブの集団中の各配列決定プローブは、互いに６００ヌクレオチドよりも近くに結合しない。上述したように、６００ヌクレオチドは、典型的な配列決定装置の分解能限界である。この場合、配列決定プローブは単一の読み取りを提供する。これは図１２の最も左端の分解能制限スポットに示されている。

【0115】

ランダムに、しかし一部は、標的結合ドメインの長さ、プローブのＴｍ、及び適用されるプローブの濃度に依存して、集団中の２つの異なる配列決定プローブが互いの６００ヌクレオチド以内で結合することが可能である。この場合、順序付けされていない複数の読み取りは、単一の分解能制限スポットから発光する。これは図１２の第２の分解能制限スポットに示されている。

【0116】

代替的に又は追加的に、集団中の配列決定プローブの濃度を低下させて、例えば配列決定装置の分解能限界を超えるように、標的核酸の特定の領域におけるプローブの適用範囲を減少させ、こうして分解能制限スポットから単一の読み取りを生成してもよい。

【0117】

図２３は、図８～１２で使用されたものとは異なる配列決定プローブの概略図を示す。ここで、バーコードドメイン上の各位置は、検出可能標識物を含む相補的核酸又はレポーター複合体により結合される。このように、この例では、相補的核酸を順次置換する必要なく、６つのヌクレオチド配列を読み取ることができる。この配列決定プローブの使用は、記載された方法の多くの工程が省略されるため、配列情報を得るための時間を短縮するであろう。しかしながらこのプローブは、重複しない検出可能標識物から利益を受けると考えられ、例えば蛍光発色団が、重複しない波長の光により励起されるか、又は蛍光発色団が、重複しない波長の光を放射するであろう。

【0118】

この方法は更に、固定化された標的核酸の各領域についてヌクレオチドの各特定された直線的順序を組み立て、こうして固定化された標的核酸の配列を特定する工程を含む。この組み立て工程は、実行可能なプログラムが格納された非一時的なコンピュータ可読記憶媒体を使用する。プログラムはマイクロプロセッサに、標的核酸の各領域についてヌクレオチドの各特定された直線的順序を配置し、こうして核酸の配列を得るように指示する。組み立ては、配列決定プローブからデータが収集された後ではなく、「リアルタイム」で、すなわちデータが収集されている間に行われる。

【0119】

上記の態様及び実施態様のいずれも、「課題を解決するための手段」及び／又は「発明を実施するための形態」の項で本明細書に開示されている任意の他の態様又は実施態様と組み合わせることができる。
定義：

【0120】

特定の例示的な実施態様において、本明細書で使用される「アニーリング」及び「ハイブリダイゼーション」という用語は、安定した２本鎖の形成を意味するために交換可能に使用される。ある態様において、安定な２本鎖とは、２本鎖のＴｍより約５℃低いか又は約５℃高い温度、及び低い一価の塩濃度、例えば０．２Ｍ未満、又は０．１Ｍ未満、又は当業者に公知の塩濃度の、厳密な洗浄条件下で、２本鎖構造が破壊されないことを意味する。「完全に一致する」という用語は、２本鎖に関して使用される場合、２本鎖を構成するポリヌクレオチド及び／又はオリゴヌクレオチド鎖が、互いに２本鎖構造を形成して、各鎖中のすべてのヌクレオチドがもう一方の鎖のヌクレオチドとワトソン－クリック塩基対合をすることを意味する。「２本鎖」という用語は、特に限定されないが、使用できるデオキシイノシンヌクレオシドなどのヌクレオシド類似体、２－アミノプリン塩基を有するヌクレオシド、ＰＮＡなどとの対合を含む。２つのオリゴヌクレオチド間の２本鎖における「ミスマッチ」は、２本鎖中の１対のヌクレオチドがワトソン－クリック結合をしないことを意味する。

【0121】

本明細書で使用される「ハイブリダイゼーション条件」という用語は、典型的には、約１Ｍ未満、より一般的は約５００ｍＭ未満、更に一般的は約２００ｍＭ未満の塩濃度を含む。ハイブリダイゼーション温度は、５℃と低くてもよいが、典型的には２２℃より高く、より典型的には約３０℃より高くてもよく、しばしば約３７℃を超える。ハイブリダイゼーションは、通常厳密性条件下で、例えばプローブがその標的部分配列に特異的にハイブリダイズする条件下で行われる。厳密性条件は、配列に依存性であり、異なる状況では異なる。より長い断片は、特異的ハイブリダイゼーションのためにより高いハイブリダイゼーション温度を必要とすることがある。塩基組成、相補鎖の長さ、有機溶媒の存在、及び塩基のミスマッチの程度を含む他の要因が、ハイブリダイゼーションの厳密性に影響を及ぼす可能性があるため、パラメーターの組み合わせは、いずれか１つの要因のみの絶対的な測定値より重要である。

【0122】

一般に、厳密性条件は、特定のイオン強度及びｐＨにおいて、特定の配列のＴｍよりも約５℃低くなるように選択される。例示的な厳密性条件としては、ｐＨ７．０～８．３及び少なくとも２５℃の温度で、少なくとも０．０１Ｍ～１Ｍ以下のＮａイオン濃度（又は他の塩）の塩濃度が挙げられる。例えば、５×ＳＳＰＥ（７５０ｍＭＮａＣｌ、５０ｍＭリン酸ナトリウム、５ｍＭＥＤＴＡ、ｐＨ７．４）及び２５～３０℃の温度条件が、対立遺伝子特異的プローブハイブリダイゼーションに適している。厳密性条件については、例えば Sambrook, Fritsche and Maniatis, “Molecular Cloning A Laboratory Manual, 2nd Ed.” Cold Spring Harbor Press (1989) 及び Anderson Nucleic Acid Hybridization, 1st Ed., BIOS Scientific Publishers Limited (1999) を参照されたい。本明細書で使用される「特異的にハイブリダイズする」という用語又は同様の用語は、厳密性条件下で実質的に特異的ヌクレオチド配列への実質的な、分子の結合、２本鎖形成、又はハイブリダイゼーションを指す。

【0123】

プローブの特定の位置に関連する検出可能標識物は、１回又は複数回「読み出す」（例えば、その蛍光を検出する）ことができる；「読み出し」は、用語「ベースコール（basecall）」と同義であり得る。複数回の読み込みで精度が向上する。単一の元の標的分子に由来する配列情報の連続ストレッチが検出された場合、標的核酸配列は「読み込まれている」。典型的には、これはマルチパスコンセンサス（以下に定義する）により生成される。本明細書で使用される用語「適用範囲（coverage）」又は「適用範囲の深さ」は、標的の領域が（離散読み取りを介して）配列決定され、参照配列に整列された回数を指す。読取り適用範囲は、特定の参照標的配列にマッピングされる読取りの総数である。塩基適用範囲は、特定のゲノム位置で行われたベースコールの総数である。

【0124】

本明細書中で使用される「ハイブ・アンド・セク・サイクル（hybe and seq cycle）”は、特定のプローブ又はプローブ集団上の各付着領域を検出するために必要とされるすべての工程を指す。例えば、標的核酸上の６つの位置を検出することができるプローブの場合、１つの「ハイブ・アンド・セク・サイクル」は、少なくとも、プローブを標的核酸にハイブリダイズさせる工程と、相補的核酸／レポーター複合体をプローブのバーコードドメイン上の６つの位置のそれぞれで付着領域にハイブリダイズさせる工程と、６つの位置のそれぞれに関連する検出可能標識物を検出する工程とを含む。

【0125】

「ｋ－量体プローブ」という用語は、本発明のプローブと同義である。

【0126】

離散読み取りからの２つ以上の配列が整列される場合、重複部分を組み合わせて単一のコンセンサス配列を作製することができる。重複部分が同じ塩基（整列の単一のカラム）を有する位置では、それらの塩基がコンセンサスになる。重複配列の間に不一致がある位置についてコンセンサスを生成するために、様々な規則を使用することができる。単純な多数決規則では、カラム中の最も一般的な塩基をコンセンサスとして使用する。「マルチパスコンセンサス」は、単一の標的分子からの全ての離散プローブ読み取りの整列である。適用されるプローブ集団／ポーリングのサイクルの総数に応じて、単一の標的分子内の各塩基位置を、異なるレベルの冗長性又は重複度で照会することができる。一般に、冗長性はベースコールの信頼水準を高める。

【0127】

「生データの正確性（Raw Accuracy）」は、塩基を正しく特定するシステム固有の能力の尺度である。生データの正確性は配列決定技術に依存する。「コンセンサス正確性（Consensus Accuracy）」は、追加の読み取りと統計力を使用して塩基を正しく特定するシステムの能力の尺度である。「特異性」とは、１回の実行当たりの総読み取りのうち、意図した標的にマッピングする読み取りの割合を指す。「均一性」は、標的領域にわたる配列の適用範囲の変動を指し、高い均一性は小さい変動と相関する。この特徴は一般に、すべての標的領域にわたる平均適用範囲深度の２０％以上によりカバーされる標的領域の割合として報告される。確率的誤差（すなわち、内因性の配列決定化学誤差）は、同じ標的核酸の「マルチパス」配列決定により容易に修正することができる。十分な回数のパスが与えられれば、実質的に「完全なコンセンサス」又は「誤差の無い」配列決定を達成することができる。
本明細書に記載の方法は、本方法を実行し及び／又は結果を記録することができる任意のデバイスを用いて、実行し及び／又は結果を記録することができる。使用できる装置の例には、特に限定されないが、すべてのタイプのコンピュータを含む電子計算装置が含まれる。本明細書に記載の方法がコンピュータで実施され及び／又は記録される場合、本方法の工程を実行するようにコンピュータを構成するために使用できるコンピュータプログラムは、コンピュータプログラムを含むことができる任意のコンピュータ可読媒体に含めることができる。使用可能なコンピューター可読媒体の例には、特に限定されないが、ディスケット、ＣＤ－ＲＯＭ、ＤＶＤ、ＲＯＭ、ＲＡＭ、非一時的コンピュータ可読媒体、及び他のメモリ、及びコンピュータ記憶装置が含まれ得る。本方法の工程を実行し、シーケンス情報を組み立て、及び／又は結果を記録するように、コンピュータを構成するために使用できるコンピュータプログラムは、電子ネットワークを介して、例えばインターネット、イントラネット又は他のネットワークを介して提供されてもよい。

【0128】

「消耗型配列決定カード」（図２４）は、当技術分野で公知の蛍光イメージング装置に組み込むことができる。様々な特徴を有する任意の蛍光顕微鏡は、この配列決定読み出しを行うことができる。例えば、広視野ランプ、レーザー、ＬＥＤ、多光子、共焦点、又は全内部反射照明を、励起及び／又は検出に使用することができる。蛍光顕微鏡の発光検出チャネルでは、フィルタ主体又はグレーティング主体のスペクトル分解能（１つ以上のスペクトル分解された発光波長）を有するカメラ（単一又は複数）及び／又は光電子増倍管（単一又は複数）が可能である。標準的コンピュータは、消耗型配列決定カード、カードを流れる試薬、蛍光顕微鏡による検出の全てを制御することができる。

【0129】

配列決定データは、任意の数の標準的な次世代配列決定アセンブラーにより解析することができる（例えば、Wajid and Serpedin, “Review of general algorithmic features for genome assemblers for next generation sequencers” Genomics, proteomics & bioinformatics, 10 (2), 58-73, 2012を参照）。顕微鏡の単一の回折限界領域内で得られた配列決定データは、「局所的に組み立てられ」、回折スポット内の複数の読み取りからコンセンサス配列を生成する。次に複数の回折スポット組み立て読み取りを一緒にマッピングして、標的遺伝子セット全体を表す連続配列が生成されるか、又はゲノム全体の新規組み立てが生成される。

【0130】

本発明に関連するさらなる教示は、以下の１つ以上に記載されている：米国特許第８，１４８，５１２号、米国特許第７，４７３，７６７号、米国特許第７，９１９，２３７号、米国特許第７，９４１，２７９号、米国特許第８，４１５，１０２号、米国特許第８，４９２，０９４号、米国特許第８，５１９，１１５号、米国特許第２００９／０２２０９７８号、米国特許第２００９／０２９９６４０号、米国特許第２０１０／００１５６０７号、米国特許第２０１０／０２６１０２６号、米国特許第２０１１／００８６７７４号、米国特許第２０１１／０１４５１７６号、米国特許第２０１１／０２０１５１５号、米国特許第２０１１／０２２９８８８号、米国特許第２０１３／０００４４８２号、米国特許第２０１３／００１７９７１号、米国特許第２０１３／０１７８３７２号、米国特許第２０１３／０２３０８５１号、米国特許第２０１３／０３３７４４４号、米国特許第２０１３／０３４５１６１号、米国特許第２０１４／００５０６７号、米国特許第２０１４／００１７６８８号、米国特許第２０１４／００３７６２０号、米国特許第２０１４／００８７９５９号、米国特許第２０１４／０１５４６８１号、及び米国特許第２０１４／０１６２２５１号（これらのそれぞれは、その全体が参照により本明細書に組み込まれる）。

【実施例】

【0131】

実施例１
標的核酸配列を決定する本発明の方法は迅速である

【0132】

図８～図１２に示される本発明の方法中の工程のタイミングが、以下で説明される。

【0133】

本発明の必要な試料調製は最小である。例えば図１３に示すように、試料中の核酸は、２時間以下の調製時間後に読み取ることができる。これは、Ion Torrent（AmpliSeq（登録商標））又はIllumina（TruSight）配列決定について必要な時間（これらは、それぞれ約１２時間又は９時間の調製時間を必要とする）より大幅に短い時間である。

【0134】

例示的な実行時間の計算を図１４に示し、サイクル時間の計算を図１５に示す。

【0135】

固定化された標的核酸にプローブ集団を結合させるには、約６０秒が必要である。この反応は、合成主鎖上の標的結合ドメインの複数のコピーを利用することにより促進することができる。マイクロ流体制御性の流体交換装置を用いると、結合していないプローブを洗い流すのに約０．５秒が必要である。

【0136】

相補的核酸の第１のプール（検出可能標識物を含む）を加え、それらをバーコードドメインの第１の位置の付着領域に結合させるには、約１５秒が必要である。

【0137】

各視野（ＦＯＶ）は、４つの異なる色について画像化され、各色が単一の塩基を表す。５’捕捉プローブ又は３’捕捉プローブ（又はその両方）上に置かれた基準スポットは、２つの位置の間の１本の線の中の光学的バーコードのみ（ギャップ付き標的核酸の存在と一致）を読み取るのに有用であり得る。配列決定プロセスの連続する工程で画像の等しい整列を生成するために、基準スポットを各視野に追加することもできる。４つの画像はすべて１つのＦＯＶで取得することができ、次に、光学読取装置は新しいＦＯＶに移動することができるか、又はすべてのＦＯＶを１つの色で取り込み次に第２の色で再画像化することができる。１つのＦＯＶは、約０．５秒で読み取ることができる。次のＦＯＶに移動するには約０．５秒かかる。従って、「ｎ」個のＦＯＶを読む時間は、「ｎ」×１秒に等しい。

【0138】

検出可能標識物を有する相補的核酸は、加熱、又は検出可能標識物を欠く過剰の相補的核酸による洗浄により、バーコードドメインの第１の位置から除去される。必要に応じて、検出可能標識物の交換速度は、検出可能標識物交換の速度を加速する小さな１本鎖オリゴヌクレオチドを組み込むことにより、を加速することができる（例えば、「Ｔｏｅ－Ｈｏｌｄ」プローブ；Seeling et al., “Catalyzed Relaxation of a Metastable DNA Fuel”; J. Am. Chem. Soc. 2006, 128(37), pp 12211-12220 を参照）。ＦＯＶは再画像化して、検出可能標識物を有する全ての相補的核酸が除去されたことを確認した後、移動が継続される。これには約１５秒かかる。バックグラウンド信号レベルに達するまで、この工程を繰り返すことができる。

【0139】

上記の工程を繰り返される。

【0140】

読み取りの合計時間は、ｍ（読み取られた塩基数）×（１５秒＋ｎＦＯＶ時間×１秒＋１５秒）に等しい。例えば、バーコード領域内の位置の数が６で２０ＦＯＶである場合、読み出す時間は６×（３０＋２０＋１５）、すなわち３９０秒に等しい。

【0141】

第１集団のプローブは、脱ハイブリダイズされる。これには約６０秒かかる。

【0142】

上記工程は、プローブの第２集団及び続く集団について繰り返される。配列決定プローブの集団が融解温度（Ｔｍ）により編成されている場合、プローブの各集団は、各塩基が必要な深さ（これはエラー率により決定される）まで覆われることを確実にするために、複数回のハイブリダイゼーションを必要とする。更に、実行中のハイブリダイゼーション読み取りを分析することにより、配列全体が実際に決定される充分前に配列決定されている個々の遺伝子を認識することが可能である。従って、サイクリングは、特定の所望のエラー頻度（又は適用範囲）が満たされるまで繰り返すことができる。

【0143】

上記タイミングを、いくつかのギャップ付き核酸結合密度推定値と共に使用して、本発明のナノストリング（ＮＳＴＧ）次世代シーケンサー（Nanostring (NSTG)-Next Generation Sequencer）のスループットを推定することができる。

【0144】

シーケンサの正味のスループットは、以下により与えられる：
塩基占有割合×＜ギャップ長＞×ＦＯＶ当たりのギャップの数×光学的バーコード当たりの塩基の数／［６０秒（プローブを標的核酸にハイブリダイズさせる）＋０．５秒（洗浄）＋ｍ：バーコードドメイン内の位置×（１５秒（相補的核酸を結合する）＋ｎｆｏｖｓ×１＋１５秒（相補的核酸の結合をはずす））＋６０秒（標的核酸に対してプローブを脱ハイブリダイズさせる）］

【0145】

従って、ある例では、単一のギャップを有する核酸（図１０に示す方法から一緒に加える）の総「サイクル」：
６０秒（プローブを標的核酸にハイブリダイズさせる）＋０．５秒（洗浄）＋ｍ塩基×（１５秒（相補的核酸を結合する）＋ｎＦＯＶ×１＋１５秒（相補的核酸の結合をはずす））＋６０秒（標的核酸に対してプローブを脱ハイブリダイズさせる）。ｍ＝６、ｎＦＯＶ＝２０を使用すると、時間＝６０＋０．５＋３９０＋６０＝５１０．５秒が得られる。

【0146】

ギャップ付き核酸領域の占有率１％、ギャップ当たり４０００塩基、及びＦＯＶ当たり５，０００個のギャップ付き核酸断片、及びｍ＝６とｎＦＯＶ＝２０（上記のとおり）を仮定すると、
０．０１×４０００×５０００×２０＝５１０．５秒当たり４，０００，０００の６塩基読み取り＝４７，０１２．７３塩基／秒
の正味のスループットが得られる。

【0147】

従って、この例では、２４時間の連続測定当たりの正味のスループット＝４．０６２ギガ塩基（Ｇｂ）／日である。別の推定値は最大１２Ｇｂ／日。図１２を参照。

【0148】

図１４に示されるように、１００個の異なる標的核酸（「１００プレックス」）を配列決定するのに必要な実行時間は、約４．６時間である。１０００個の異なる標的核酸（「１０００プレックス」）を配列決定するのに必要な実行時間は、約１６時間である。

【0149】

図１６は、本発明及び種々の他の配列決定方法／装置の配列決定速度、読み取り数、及び臨床的有用性を比較する。

【0150】

実施例２
本発明の方法のエラー率は低い

【0151】

図１７は、末端位置が省略された場合、本発明が約２．１％の生のエラー率を有することを示す。

【0152】

本願発明に関して、配列決定に関連するエラー率は、完全に一致した（ｍ＋ｎ）量体と単一塩基のミスマッチ（ｍ－１＋ｎ）量体との間の自由エネルギー差に比例する。ｍ＋ｎの合計は標的結合ドメイン中のヌクレオチドの数であり、ｍはバーコードドメイン中の位置の数を表す。ハイブリダイゼーションの選択性の推定は、方程式を使用して得ることができる（Owczarzy, R. (2005), Biophys. Chem., 117:207-215 及び Integrated DNA Technologies ウェブサイト: ワールドワイドウェブ (www) idtdna.com/analyzer/Applications/Instructions/Default.aspx?AnalyzerDefinitions=true#MismatchMeltTem）：

【0153】

【数1】

ここで、Ｋ_aは、予測された熱力学的パラメータから得られる結合平衡定数である：

【0154】

【数2】

【0155】

シータは、特定のハイブリダイゼーション温度で標的にアニーリングされることが予想される、正確な相補体と単一塩基ミスマッチ配列の結合パーセントを表す。Ｔはケルビンで表されるハイブリダイゼーション温度であり、□Ｈ°（エンタルピー）及びＳ°（エントロピー）は、配列と公開された最近傍の熱力学パラメータから計算される融解パラメータであり、Ｒは理想気体定数（１．９８７ｃａｌ・Ｋ^-1ｍｏｌｅ^-1）であり、［鎖１／２］は、オリゴヌクレオチドのモル濃度であり、－２７３．１５の定数は、温度をケルビンから摂氏度に変換する。最も正確な最近傍のパラメータは、以下の刊行物からＤＮＡ／ＤＮＡ塩基対について（Allawi,H., SantaLucia, J. Biochemistry, 36, 10581 参照）、ＲＮＡ／ＤＮＡ塩基対について（Sugimoto et al., Biochemistry, 34, 11211-6 参照）、ＲＮＡ／ＲＮＡ塩基対について（Xia,T. et al., Biochemistry, 37, 14719 参照）得られた。

【0156】

ＮＳＴＧシーケンサーから予想される近似エラー率の推定値の例は、以下の通りである。（ｍ＋ｎ）＝８’量体について。次の８量体バーコードとその１塩基のミスマッチを検討する。
５’ＡＴＣＧＴＡＣＧ３’
（配列決定すべき領域）
３’ＴＡＧＣＡＴＧＣ５’
（完璧に一致した光学的バーコードの配列決定）
３’ＴＡＧＴＡＴＧＣ５’
（単一塩基ミスマッチ（Ｇ－Ｔ）対を有する光学的バーコードの配列決定）

【0157】

上記方程式に基づいてＩＤＴ計算機を使用すると、

【0158】

１７．４℃（完全一致の場合のＴｍ）で、（５０％／０．３％）は、その配列にハイブリダイズした正しい光学的バーコードと、Ｔｍでの不正なバーコードとの比であり、その配列の推定エラー率０．６％が得られる。

【0159】

非常に高いＧＣ含量の配列決定計算により以下が得られる：
５’ＣＧＣＣＧＧＣＣ３’
（配列決定すべき領域）
３’ＧＣＧＧＣＣＧＧ５’
（完璧に一致した光学的バーコードの配列決定）
３’ＧＣＧＧＡＣＧＧ５’
（単一塩基ミスマッチ（Ｇ－Ａ）対を有する光学的バーコードの配列決定）

【0160】

４１．９℃（完全一致の場合のＴｍ）で、（５０％／０．３％）は、その配列にハイブリダイズした正しい光学的バーコードと、Ｔｍでの不正なバーコードとの比であり、その配列の推定エラー率０．８％が得られる。

【0161】

多数の８量体対の試験により、０．２％～１％の範囲のエラー率の分布が得られる。上記計算は使用された条件と同一ではないが、これらの計算は、Pacific Biosciences 及び Oxford Nanopore Technologies （ここで、エラー率は（＞＞１０％）と大きい）のような他の単一分子配列決定技術と比較して、本発明の方法が比較的小さい固有のエラー率を有するという指標を提供する。

【0162】

図１８は、本発明の生データの正確さが他の配列決定方法より高いことを証明する。すなわち本発明は、他の配列決定方法に必要とされるパスよりも少ない回数のパスで、単一標的からのコンセンサス配列を提供する。更に本発明は、３０回以上のパス後に「完全なコンセンサス」／「誤差無し」配列決定（すなわち、９９．９９９９％／Ｑ６０）を得ることができるが、PacBio 配列決定法（例えば）は、７０回パス後でもそのようなコンセンサスを達成できない。

【0163】

実施例３
本発明は単一塩基対の分解能を有する

【0164】

図１９は、本発明が単一塩基分解能を有し、低いエラー率（具体的なヌクレオチド置換に応じて０％～１．５％の範囲）を有することを示す。

【0165】

バーコードにハイブリダイズされ、通常のナノストリング（NanoString）遺伝子発現結合技術を使用してカートリッジの表面に固定化された標的ＲＮＡを用いて、さらなる実験を行った（例えば、Geiss et al, “Direct multiplexed measurement of gene expression with color-coded probe pairs”; Nature Biotechnology, 26, 317-325 (2008)を参照）。異なる標的結合ドメイン長及び完全な一致（完全な１０量体一致配列に連結されたＹＧＢＹＧＲ－２μｍ光学的バーコード）を有するバーコードがＲＮＡ標的にハイブリダイズする能力を測定した（図２６）。標的結合ドメインの長さが長いほど、より大きなカウントが得られる。これはまた、１０量体標的結合ドメインが、バックグラウンドを超える配列を登録するのに十分であることも示している。個々の単一塩基改変一致の各々は、別の光学的バーコードを用いて合成された。正しくない光学的バーコードに対する正確な光学的バーコードの割合を数えた（図２４及び２５）。

【0166】

ＳＮＰである実際の配列を検出する１０量体の能力は、バックグラウンドに対して＞１５０００カウントであり、誤った配列はバックグラウンドに対してせいぜい＞４００である。正確なプローブが存在する場合、エラー率は実際の配列の３％未満であると予想される。このデータは、（本質的に）最悪の場合であることに注意されたい。６．６キロ塩基の光学的バーコードレポーター（Ｇｅｎ２スタイル）に、１０塩基対のハイブリダイゼーション配列のみが付着した。特定の条件の最適化は行われなかった。しかしこのデータは、ナノストリング次世代配列決定アプローチが１塩基対の配列を分割できることを明らかにしている。

【0167】

上記試験で使用された詳細な材料及び方法は以下の通りである：

【0168】

ハイブリダイゼーションプロトコルプローブＢ＋コードセット
・２５μｌの要素（１９４コードセット）を取る
・５μｌプローブＢ＋相補配列を標的（１００μＭ）に添加する
・１５μｌのハイブリダイゼーション（Ｈｙｂ）緩衝液（１４．５６×ＳＳＰＥ０．１８％ツイーン２０）を加える
ＳＳＰＥ（１５０ｍＭＮａＣｌ、ＮａＨ₂ＰＯ₄×Ｈ₂Ｏ１０ｍＭ、Ｎａ２ＥＤＴＡ１０ｍＭ）
・氷上で１０分間インキュベートする。
・１５０μｌのＧビーズ（１０ｍｇ／ｍｌの４０μｌのＧビーズ＋１１０μｌの５ｘＳＳＰＥ０．１％Ｔｗｅｅｎ２０）を加える
・室温で１０分間インキュベートする
・０．１ＳＳＰＥ０．１％Ｔｗｅｅｎ２０でマグネットコレクタを用いて３回洗浄する
・１００μｌの０．１×ＳＳＰＥ中で４５℃で１０分間溶出する。

【0169】

標的ハイブリダイゼーションプロトコール（７５０ｍＭＮａＣｌ）
・上記の溶出した試料２０μｌを取る
・１０μｌのハイブリダイゼーション（Ｈｙｂ）緩衝液を加える
・１μｌの標的（１００ｎＭビオチン化ＲＮＡ）を加える
・氷上で３０分間インキュベートする
１５μｌを取って、ストレプトアビジンスライドに２０分間結合させ、Ｇフックを用いてフローストレッチを行い、ｎＣｏｕｎｔｅｒを用いてカウントする

【0170】

材料
要素１９４コードセット
ＩＤＴから購入したオリゴ
ＳＳＰＥ（１５０ｍＭＮａＣｌ、ＮａＨ₂ＰＯ₄×Ｈ₂Ｏ１０ｍＭ、Ｎａ₂ＥＤＴＡ１０ｍＭ）
ハイブリダイゼーション緩衝液（１４．５６×ＳＳＰＥ０．１８％ツイーン２０）

【0171】

表２：１２，１１、．．．、８量体のプローブＢ配列（配列番号３０～配列番号３４）

【表2】