IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ナノストリング テクノロジーズ,インコーポレイティドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-02
(45)【発行日】2024-08-13
(54)【発明の名称】化学組成物とそれを利用する方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240805BHJP
   C12Q 1/6876 20180101ALN20240805BHJP
【FI】
C12Q1/6869 Z
C12Q1/6876 Z ZNA
【請求項の数】 16
(21)【出願番号】P 2022136803
(22)【出願日】2022-08-30
(62)【分割の表示】P 2020115005の分割
【原出願日】2017-11-21
(65)【公開番号】P2022174137
(43)【公開日】2022-11-22
【審査請求日】2022-09-29
(31)【優先権主張番号】62/424,887
(32)【優先日】2016-11-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/457,237
(32)【優先日】2017-02-10
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/536,147
(32)【優先日】2017-07-24
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】513322707
【氏名又は名称】ナノストリング テクノロジーズ,インコーポレイティド
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100150810
【弁理士】
【氏名又は名称】武居 良太郎
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】マーガレット ホアン
(72)【発明者】
【氏名】マーク グレゴリー
(72)【発明者】
【氏名】テ キム
(72)【発明者】
【氏名】ドウェイン エル.ダナウェイ
(72)【発明者】
【氏名】エリザベス エー.マンラオ
(72)【発明者】
【氏名】ジョーセフ エム.ビーチェム
(72)【発明者】
【氏名】ルステム カフィゾフ
(72)【発明者】
【氏名】サンガミスラ コルコンダ
(72)【発明者】
【氏名】イ デン
【審査官】西 賢二
(56)【参考文献】
【文献】国際公開第2016/081740(WO,A1)
【文献】特表2014-531908(JP,A)
【文献】特表2020-500514(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/68ー1/6897
MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
サンプル中の標的核酸のヌクレオチド配列を決定する方法であって、前記方法は、
(1)少なくとも1つのプローブを前記サンプル中の前記標的核酸にハイブリダイズさせる工程、ここで、前記少なくとも1つのプローブは、標的結合ドメインおよび対応するバーコードドメインを含み、
前記標的結合ドメインは、少なくとも12個のヌクレオチドを含み、かつ前記標的核酸と結合することができ、そして
前記バーコードドメインは合成骨格を含み、前記バーコードドメインは少なくとも4つの付着位置を含み、それぞれの付着位置は、レポータープローブにより結合されることが可能な少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも4つの付着位置のそれぞれは、異なる核酸配列を有する;
(2)第1の検出可能な標識及び第2の標識可能な標識を含む第1のレポータープローブを、前記バーコードドメインの前記少なくも4つの付着位置の第1の付着位置にハイブリダイズさせる工程;
(3)前記第1の付着位置にハイブリダイズさせた前記第1のレポータープローブの前記第1の検出可能な標識及び前記第2の標識可能な標識を同定する工程;
(4)前記第1の付着位置にハイブリダイズさせた前記第1の検出可能な標識及び前記第2の標識可能な標識を除去する工程;
(5)第3の検出可能な標識及び第4の標識可能な標識を含む第2のレポータープローブを、前記バーコードドメインの前記少なくも4つの付着位置の第2の付着位置にハイブリダイズさせる工程;
(6)前記第2の付着位置にハイブリダイズさせた前記第2のレポータープローブの前記第3の検出可能な標識及び前記第4の標識可能な標識を同定する工程;
(7)前記第2の付着位置にハイブリダイズさせた前記第3の検出可能な標識及び前記第4の標識可能な標識を除去する工程;
(8)第5の検出可能な標識及び第6の標識可能な標識を含む第3のレポータープローブを、前記バーコードドメインの前記少なくも4つの付着位置の第3の付着位置にハイブリダイズさせる工程;
(9)前記第3の付着位置にハイブリダイズさせた前記第3のレポータープローブの前記第5の検出可能な標識及び前記第6の標識可能な標識を同定する工程;
(10)前記第3の付着位置にハイブリダイズさせた前記第5の検出可能な標識及び前記第6の標識可能な標識を除去する工程;
(11)第7の検出可能な標識及び第8の標識可能な標識を含む第4のレポータープローブを、前記バーコードドメインの前記少なくも4つの付着位置の第4の付着位置にハイブリダイズさせる工程;
(12)前記第4の付着位置にハイブリダイズさせた前記第4のレポータープローブの前記第7の検出可能な標識及び前記第8の標識可能な標識を同定する工程;
(13)前記第1の検出可能な標識の同一性、第2の検出可能な標識の同一性、第3の検出可能な標識の同一性、第4の検出可能な標識の同一性、第5の検出可能な標識の同一性、第6の検出可能な標識の同一性、第7の検出可能な標識の同一性及び第8の検出可能な標識の同一性に基づき、前記サンプル中の前記標的核酸を検出する工程、を含み、
ここで、前記レポータープローブのそれぞれは、少なくとも6つの二次核酸分子にハイブリダイズされた一次核酸分子を含み、各レポータープローブの各一次核酸分子は、第1のドメインおよび第2のドメインの間に少なくとも1つの切断可能なリンカーを含み、
前記少なくとも6つの二次核酸分子中の前記二次核酸分子のそれぞれは、第1のドメインおよび第2のドメインを含み、前記第1のドメインは、前記一次核酸分子の前記第2のドメインにハイブリダイズされ、そして、前記第2のドメインは、少なくとも5つの三次核酸分子にハイブリダイズされ、各二次核酸分子は、前記第1のドメインおよび前記第2のドメインの間に少なくとも1つの切断可能なリンカーを含み、そして、
前記三次核酸分子のそれぞれは、少なくとも1つの検出可能な標識を含む、方法。
【請求項2】
前記一次核酸分子の前記少なくとも1つの切断可能なリンカーが、光切断可能なリンカーである、請求項1に記載の方法。
【請求項3】
前記一次核酸分子の前記第1のドメインが、14個のヌクレオチドを含む、請求項1又は2に記載の方法。
【請求項4】
前記一次核酸分子が、80~100個のヌクレオチドを含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
各二次核酸分子が、80~90個のヌクレオチドを含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
各三次核酸分子が、10~20個のヌクレオチドを含む、請求項1~5のいずれか1項に記載の方法。
【請求項7】
各三次核酸分子が、15個のヌクレオチドを含む、請求項6に記載の方法。
【請求項8】
前記二次核酸分子の前記少なくとも1つの切断可能なリンカーが、光切断可能なリンカーである、請求項1~7のいずれか1項に記載の方法。
【請求項9】
各レポータープローブが、少なくとも30個の検出可能な標識を含む、請求項1~8のいずれか1項に記載の方法。
【請求項10】
前記少なくとも30個の検出可能な標識のすべてが、同じ発光スペクトルを有する、請求項9に記載の方法。
【請求項11】
前記30個の検出可能な標識の少なくとも1つが、第1の発光スペクトルを有し、前記30個の検出可能な標識の少なくとも1つが、第2の発光スペクトルを有し、前記第1の発光スペクトルと前記第2の発光スペクトルが、スペクトル分解可能である、請求項9に記載の方法。
【請求項12】
ステップ(4)における前記第1の検出可能な標識及び前記第2の標識可能な標識の除去が、前記第1のレポータープローブを光に接触させることを含む、請求項1~11のいずれか1項に記載の方法。
【請求項13】
ステップ(7)における前記第3の検出可能な標識及び前記第4の標識可能な標識の除去が、前記第2のレポータープローブを光に接触させることを含む、請求項1~12のいずれか1項に記載の方法。
【請求項14】
ステップ(10)における前記第5の検出可能な標識及び前記第6の標識可能な標識の除去が、前記第3のレポータープローブを光に接触させることを含む、請求項1~13のいずれか1項に記載の方法。
【請求項15】
前記光が、アークランプ、レーザー、集束紫外線(UV)光源、及び発光ダイオードからなる群から選択される光源によって提供される、請求項12~14のいずれか1項に記載の方法。
【請求項16】
前記切断可能なリンカーが、
【化1】
から選択される、請求項1~15のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連する出願の相互参照
本出願は、2016年11月21日に出願されたアメリカ合衆国仮出願第62/424,887号と、2017年2月10日に出願されたアメリカ合衆国仮出願第62/457,237号と、2017年7月24日に出願されたアメリカ合衆国仮出願第62/536,147号の優先権と恩恵を主張する。上記特許出願のそれぞれの内容は、前記全体が参照によって本明細書に組み込まれている。
【0002】
配列リスト
本出願は、EFS-Webを通じてASCII形式で提出された配列リストを含有しており、前記全体が参照によって本明細書に組み込まれている。このASCIIのコピーは2017年11月20日に作成されてNATE033-001WO_SeqList_ST25.txtと名づけられており、サイズは19,351バイトである。
【背景技術】
【0003】
現在、核酸のシークエンシング、すなわち核酸分子の中のヌクレオチドの正確な順番を求めるプロセスにはさまざまな方法がある。現在の方法は、核酸を酵素によって増幅すること(例えばPCR)および/またはクローニングによって増幅することを必要とする。光検出手段によって検出できる信号を発生させるには、酵素によるさらなるポリマー化が必要とされる。したがって本分野では、迅速で増幅と酵素が不要な核酸シークエンシングの方法が必要とされている。本開示は前記ような必要性に応える。
【発明の概要】
【0004】
本開示により、読み出し長が長く、エラー率が小さく、迅速で、酵素と増幅とライブラリが不要な核酸シークエンシングを提供するシークエンシング用プローブと、方法と、キットと、装置が提供される。本明細書に記載したシークエンシング用プローブはバーコードドメインを含んでいて、前記バーコードドメインの中の各位置は、標的結合ドメインの中の少なくとも2個のヌクレオチドに対応している。さらに、この方法、キット、装置は、サンプルから結果を迅速に取得する能力を有する。これらの特徴は、臨床状況におけるシークエンシングで特に有用である。本開示は、アメリカ合衆国特許出願公開第2016/0194701号に開示されている開示内容(前記内容全体が参照によって本明細書に組み込まれている)の改良である。
【0005】
本開示により、a)標的結合ドメインとバーコードドメインを含む組成物(ここで、標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性(identity)を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有する)と;前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子(ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、前記リンカー修飾は、
【化1】
のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体が提供される。
【0006】
本開示により、a)標的結合ドメインとバーコードドメインを含む組成物(ここで、標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている)と;前記少なくとも3つの付着位置の第1の付着位置にハイブリダイズする第1の相補的一次核酸分子(ここで、前記第1の相補的一次核酸分子は、少なくとも2つのドメインとリンカー修飾を含んでおり、そのうちの第1のドメインは、前記バーコードドメインの第1の付着位置にハイブリダイズし、第2のドメインは、少なくとも1つの第2の相補的二次核酸分子にハイブリダイズすることができ、前記リンカー修飾は、
【化2】
のいずれかであり、このリンカー修飾は第1のドメインと第2のドメインの間に位置する)を含む複合体が提供される。
【0007】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有するシークエンシング用プローブが提供される。
【0008】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
【0009】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドの位置と属性を決めており、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を有するシークエンシング用プローブが提供される。
【0010】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、前記標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、前記標的結合ドメインが結合する前記標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
【0011】
合成骨格は、多糖、ポリヌクレオチド、ペプチド、ペプチド核酸、ポリペプチドのいずれかを含むことができる。合成骨格はDNAを含むことができる。合成骨格は一本鎖DNAを含んでいる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にある二本鎖DNAスペーサとを含んでいる。二本鎖DNAスペーサとして、長さ約1個~約100個のヌクレオチド、または長さ約2個~約50個のヌクレオチド、または長さ20個~40個のヌクレオチドが可能である。二本鎖DNAスペーサは、長さ約36個のヌクレオチドである。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にあってポリマーをベースとするスペーサとを含むことができ、ポリマーをベースとする前記スペーサは、二本鎖DNAスペーサと同様の力学的特性を提供する。
【0012】
標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数と同じにすること、または前記数よりも少なくすること、または前記数よりも多くすることができる。標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数よりも多いことが好ましい。標的結合ドメインの中のヌクレオチドの数は、バーコードドメインの中の付着位置の数よりも少なくとも3個多くすること、または少なくとも4個多くすること、または少なくとも5個多くすること、または少なくとも6個多くすること、または少なくとも7個多くすること、または少なくとも8個多くすること、または少なくとも9個多くすること、または少なくとも10個多くすることができる。標的結合ドメインが8個のヌクレオチドを含み、バーコードドメインが3つの付着位置を含むことが好ましい。
【0013】
標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することのできる少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドとして、修飾されたヌクレオチドまたは核酸類似体が可能である。修飾されたヌクレオチドまたは核酸類似体として、架橋型(locked)核酸(LNA)、架橋化核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシン、またはこれらの任意の組み合わせが可能である。修飾されたヌクレオチドまたは核酸類似体は架橋型核酸(LNA)であることが好ましい。
【0014】
標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも前に位置することができる。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドの後ろに位置することができる。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも前に位置し、標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドのうちの少なくとも1個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドよりも後ろに位置する。すなわち標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドに隣接する。
【0015】
標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、ユニバーサル塩基、または縮重塩基、またはこれらの組み合わせが可能である。標的結合ドメインの中にあって対応するヌクレオチドを同定することがない前記少なくとも4個のヌクレオチドのうちの少なくとも2個として、ユニバーサル塩基、または縮重塩基、またはこれらの組み合わせが可能である。
【0016】
バーコードドメインの中の各付着位置は、1つの付着領域を含むことができる。バーコードドメインの中の各付着位置は、2つ以上の付着領域を含むことができる。
【0017】
バーコードドメインの中の各付着位置は、同数の付着領域を含むことができる。バーコードドメインの中の各付着位置は、異なる数の付着領域を含むことができる。バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つは、他の2つとは異なる数の付着領域を含むことができる。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は同じであってもよい。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は同じ核酸配列を含むことができる。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は異なっていてもよい。バーコードドメインの中の付着位置が2つ以上の付着領域を含むとき、それら付着領域は異なる核酸配列を含むことができる。
【0018】
バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約8個~約20個のヌクレオチドである。バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約12個のヌクレオチドである。バーコードドメインの中の各付着領域を含む各核酸配列は、長さ約14個のヌクレオチドである。
【0019】
バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つ、または少なくとも2つ、または少なくとも3つは、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接することができる。バーコードドメインの中の少なくとも3つの付着位置のそれぞれは、少なくとも1つのフランキング一本鎖ポリヌクレオチドに隣接することができる。
【0020】
少なくとも1つの付着位置の中の少なくとも1つ、または少なくとも2つ、または少なくとも3つの付着領域は、合成骨格に一体化することができる。少なくとも3つの付着領域それぞれの中の各付着領域は、合成骨格に一体化することができる。少なくとも1つの付着位置の中の少なくとも1つ、または少なくとも2つ、または少なくとも3つの付着領域は、合成骨格から分岐することができる。少なくとも3つの付着領域それぞれの中の各付着領域は、合成骨格から分岐することができる。
【0021】
各付着位置の中の少なくとも1つの付着領域の中の少なくとも1つの核酸配列に直接または間接に結合することのできる相補的核酸分子として、RNA、DNA、PNAのいずれかが可能である。相補的核酸分子はDNAであることが好ましい。
【0022】
相補的核酸分子として一次核酸分子が可能である。一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に直接結合する。
【0023】
一次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に結合することができ、第2のドメインは、少なくとも1個の相補的二次核酸分子に結合することができる。一次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域に結合することができ、第2のドメインは、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含んでいる。
【0024】
一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズすることと、少なくとも1個、または2個、または3個、または4個、または5個、またはそれよりも多い個数の二次核酸分子にハイブリダイズすることができる。一次核酸分子は、4個の二次核酸分子にハイブリダイズすることが好ましい。一次核酸分子は、バーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域にハイブリダイズすること、第1の検出可能な標識と、少なくとも第2の検出可能な標識とにハイブリダイズすることができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0025】
一次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
【0026】
二次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、少なくとも1個の一次核酸分子の中の相補的な配列に結合することができ、第2のドメインは、(a)第1の検出可能な標識と少なくとも第2の検出可能な標識に、または(b)少なくとも1個の相補的な三次核酸分子に、または(c)これらの組み合わせに結合することができる。
【0027】
二次核酸分子は、少なくとも1個の一次核酸分子にハイブリダイズすることと、少なくとも1個、または2個、または3個、または4個、または5個、または6個、または7個、またはそれよりも多い個数の三次核酸分子にハイブリダイズすることができる。二次核酸分子は1個の三次核酸分子にハイブリダイズすることが好ましい。二次核酸分子は少なくとも1個の一次核酸分子にハイブリダイズすることができて、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含むことができる。二次核酸分子は、少なくとも1個の一次核酸分子と、少なくとも1個の三次核酸分子と、第1の検出可能な標識と、少なくとも第2の検出可能な標識にハイブリダイズすることができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。二次核酸分子が、少なくとも1個の一次核酸分子と、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の三次核酸分子と、第1の検出可能な標識と、少なくとも第2の検出可能な標識にハイブリダイズするとき、二次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は同じ発光スペクトルを持つことができ、三次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つことができ、二次核酸分子の表面の検出可能な標識の発光スペクトルは、三次核酸分子の表面の検出可能な標識の発光スペクトルとは異なることができる。
【0028】
二次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
【0029】
三次核酸分子は少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは、少なくとも1つの二次核酸分子の中の相補的な配列に結合することができ、第2のドメインは、第1の検出可能な標識と、少なくとも第2の検出可能な標識に結合することができる。
【0030】
三次核酸分子は、少なくとも1個の二次核酸分子にハイブリダイズすることと、第1の検出可能な標識と、少なくとも第2の検出可能な標識を含むことができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0031】
三次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置することが好ましい。切断可能なリンカーとして、光で切断可能なリンカー(例えばUV光で切断可能なリンカー)、還元剤で切断可能なリンカー、酵素で切断可能なリンカーのいずれかが可能である。リンカーは、光で切断可能なリンカーであることが好ましい。
【0032】
本開示により、本明細書に開示したシークエンシング用プローブを複数含むシークエンシング用プローブの集団も提供される。前記複数のシークエンシング用プローブの中の各シークエンシング用プローブが異なる標的結合ドメインを含んでいて、標的核酸の中の異なる領域に結合することが好ましい。
【0033】
本発明により核酸をシークエンシングする方法も提供され、この方法は、(1)本明細書に記載した第1のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(10)場合によっては固定化された標的核酸からシークエンシング用プローブを除去することを含んでいる。
【0034】
この方法はさらに、(11)第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシグ用プローブを除去することを含むことができる。
【0035】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築(assemble)することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0036】
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0037】
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0038】
第1の相補的核酸分子と、検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0039】
第2の相補的核酸分子と、検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0040】
本発明により、核酸をシークエンシングする方法として、(1)本明細書に記載したシークエンシング用プローブを複数含む第1のシークエンシング用プローブの少なくとも1つの第1の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し; (10)場合によっては固定化された標的核酸から第1のシークエンシング用プローブの少なくとも1つの第1の集団を除去することを含む方法も提供される。
【0041】
この方法はさらに、(11)本明細書に記載したシークエンシング用プローブを複数含む第2のシークエンシング用プローブの少なくとも1つの第2の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブの少なくとも1つの第2の集団を除去することを含むことができる。
【0042】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0043】
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0044】
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0045】
第1の相補的核酸分子と、検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0046】
第2の相補的核酸分子と、検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識が欠けた第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接したフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0047】
本開示により、核酸のヌクレオチド配列を求める方法も提供され、この方法は、(1)本明細書に開示した第1のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(3)前記第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を同定し;(4)前記第1の付着位置にハイブリダイズした第1の検出可能な標識と第2の検出可能な標識を除去し;(5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(6)前記第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を同定し;(7)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(9)前記第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(10)シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含んでいる。
【0048】
この方法はさらに、(11)場合によっては固定化された標的核酸の第1の領域から少なくとも第1のシークエンシング用プローブを除去し;(12)本明細書に開示した少なくとも第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸の第2の領域にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと少なくとも第2のシークエンシング用プローブの標的結合ドメインは異なっている);(13)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(14)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(15)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(16)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(17)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(18)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(19)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(20)第2のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第2の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含むことができる。
【0049】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0050】
工程(4)と(5)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第5の検出可能な標識と少なくとも第6の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0051】
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第3の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子のいずれか1つを除去する方法は、光との接触を含むことができる。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0052】
本開示により、核酸のヌクレオチド配列を求める方法として、(1)本明細書に開示した第1のシークエンシング用プローブを、所定の遺伝子から得られて場合によっては基板に1つ以上の位置で固定化された標的核酸の第1の領域にハイブリダイズさせ;(2)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(3)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(4)前記第1の付着位置にハイブリダイズした第1の検出可能な標識と第2の検出可能な標識を除去し;(5)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(6)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(7)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(8)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(9)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(10)第1のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第1の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含む方法も提供される。
【0053】
この方法はさらに、(11)場合によっては固定化された標的核酸の第1の領域から少なくとも第1のシークエンシング用プローブを除去し;(12)本明細書に開示した少なくとも第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸の第2の領域にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと少なくとも第2のシークエンシング用プローブの標的結合ドメインは異なっている);(13)第1の検出可能な標識と第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置にハイブリダイズさせ;(14)第1の付着位置にハイブリダイズした第1の相補的核酸分子の第1の検出可能な標識と第2の検出可能な標識を検出し;(15)第3の検出可能な標識と第4の検出可能な標識を含む第2の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第2の付着位置にハイブリダイズさせ;(16)第2の付着位置にハイブリダイズした第2の相補的核酸分子の第3の検出可能な標識と第4の検出可能な標識を検出し;(17)前記第2の付着位置にハイブリダイズした第3の検出可能な標識と第4の検出可能な標識を除去し;(18)第5の検出可能な標識と第6の検出可能な標識を含む第3の相補的核酸分子を、バーコードドメインの前記少なくとも3つの付着位置のうちの第3の付着位置にハイブリダイズさせ;(19)第3の付着位置にハイブリダイズした第3の相補的核酸分子の第5の検出可能な標識と第6の検出可能な標識を同定し;(20)第2のシークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の第2の領域の中の少なくとも6個のヌクレオチドの線形な順番を、第1の検出可能な標識と、第2の検出可能な標識と、第3の検出可能な標識と、第4の検出可能な標識と、第5の検出可能な標識と、第6の検出可能な標識の属性に基づいて同定することを含むことができる。
【0054】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0055】
工程(4)と(5)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第5の検出可能な標識と少なくとも第6の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0056】
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第3の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能なリンカーであることが好ましい。第1の相補的核酸分子、第2の相補的核酸分子、少なくとも第3の相補的核酸分子のいずれか1つを除去する方法は、光との接触を含むことができる。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0057】
本開示により、本明細書に開示した任意の方法を実施するための装置も提供される。
【0058】
本開示により、基板と、本明細書に開示したシークエンシング用プローブの集団と、第1の検出可能な標識と少なくとも2つの第2の検出可能な標識を含む少なくとも3個の相補的核酸分子と、利用のための指示とを含む1つ以上のキットも提供される。この1つ以上のキットはさらに、少なくとも1つの捕獲用プローブを含むことができる。この1つ以上のキットはさらに、少なくとも2つの捕獲用プローブを含むことができる。
【0059】
上記の側面のうちの任意の1つを他の任意の側面と組み合わせることができる。
【0060】
特に断わらない限り、本明細書で用いられているあらゆる科学技術用語は、本開示が属する分野の当業者によって一般に理解されるのと同じ意味を持つ。明細書では、文脈から明らかに異なることがわかるのでなければ、単数形に複数も含まれ、例えば「1つの」、「前記」という用語は、単数または複数であると理解され、「または」という用語は、包括的であると理解される。例として、「1つの要素」は、1つ以上の要素を意味する。本明細書全体を通じ、「含んでいる」という単語または前記バリエーション(「含む」、「含んでいる」)は、記載されている要素、整数、工程、要素群、整数群、工程群を包含するが、他の任意の要素、整数、工程、要素群、整数群、工程群を排除しないと理解される。約は、記載されている値の10%以内、または9%以内、または8%以内、または7%以内、または6%以内、または5%以内、または4%以内、または3%以内、または2%以内、または1%以内、または0.5%以内、または0.1%以内、または0.05%以内、または0.01%であると理解される。文脈から明らかに異なることがわかるのでなければ、本明細書に提示されているあらゆる数値は「約」という用語によって変えられている。
【0061】
本明細書に記載したのと似ていたり同等だったりする方法と材料を本開示の実施や試験で使用できるとはいえ、以下には適切な方法と材料を記載する。本明細書で言及したあらゆる刊行物、特許出願、特許、それ以外の参考文献は、前記全体が参照によって本明細書に組み込まれている。本明細書で引用した参考文献は、請求項の本発明に対する先行技術であるとは認められない。争いが生じた場合には、本明細書が、定義を含めて優先する。本開示の他の特徴と利点は、以下の詳細な説明と請求項から明らかになろう。
【図面の簡単な説明】
【0062】
本特許または本出願ファイルは、少なくとも1枚のカラー図面を含んでいる。カラー図面を有するこの特許または特許出願公開のコピーは、請求して必要な手数料を支払うと特許商標庁から提供される。
【0063】
上記の特徴とさらに別の特徴は、添付の図面と組み合わせたときに以下の詳細な説明からより明確になろう。
【0064】
図1図1は、本開示によるシークエンシング用プローブの一例の図である。
【0065】
図2図2は、本開示による標準シークエンシング用プローブと3部構成シークエンシング用プローブの設計を示している。
【0066】
図3図3は、本開示によるシークエンシング用プローブの一例にハイブリダイズした本開示のレポータ複合体の一例の図である。
【0067】
図4図4は、本開示によるレポータプローブの一例の模式図を示している。
【0068】
図5図5は、本開示によるレポータプローブのいくつかの例の模式図である。
【0069】
図6図6は、「追加ハンドル」を含む本開示のレポータプローブの例の模式図である。
【0070】
図7図7は、配置の異なる三次核酸を含む本開示によるレポータプローブのいくつかの例の模式図である。
【0071】
図8図8は、分岐した三次核酸を含む本開示によるレポータプローブのいくつかの例の模式図である。
【0072】
図9図9は、切断可能なリンカー修飾を含む本開示によるレポータプローブの一例の図である。
【0073】
図10図10は、本開示によるレポータプローブの一例の中で切断可能なリンカー修飾が可能な位置を示している。
【0074】
図11図11は、本開示による2つの捕獲用プローブシステムを用いて1個の標的核酸を捕獲する模式図である。
【0075】
図12-1】図12は、FFPEサンプルを用いた100個の標的からなる多重がんパネルを捕獲して検出するために本発明の方法を利用する実験からの結果を示している。
図12-2】上記説明に同じ。
【0076】
図13図13は、大きな標的核酸分子を標的としたシークエンシングのため、捕獲用プローブとブロッカーオリゴとシークエンシング用プローブにハイブリダイズした2個の捕獲された標的DNA分子の模式図である。
【0077】
図14図14は、本開示によるシークエンシング法の1つのサイクルの模式図である。
【0078】
図15-1】図15は、本開示によるシークエンシング法の1つのサイクルの模式図と、このサイクル中に回収された対応するイメージングデータである。
図15-2】上記説明に同じ。
【0079】
図16図16は、本開示によるシークエンシング用プローブのプールの構成の一例を示しており、8通りの色組み合わせを用いて異なる8通りのシークエンシング用プローブのプールを設計している。
【0080】
図17図17は、アメリカ合衆国特許出願公開第2016/019470号に開示されているバーコードドメインの設計を本開示のバーコードドメインの設計と比較している。
【0081】
図18図18は、捕獲された標的核酸分子にハイブリダイズした本開示の1つのシークエンシング用プローブまたは複数のシークエンシング用プローブの模式図である。
【0082】
図19図19は、1つのシークエンシング用プローブまたは複数のシークエンシング用プローブを標的核酸にハイブリダイズさせるとき、本開示によるシークエンシング法の間に記録された蛍光画像を示している。
【0083】
図20図20は、標的核酸の長さに沿って結合した本開示の複数のシークエンシング用プローブの模式図と、対応する記録された蛍光画像である。
【0084】
図21図21は、本開示によるシークエンシングサイクルの間に記録されたイメージングデータの例と、本開示によるレポータプローブの蛍光信号強度プロファイルを示している。
【0085】
図22図22は、本開示によるシークエンシングサイクルの模式図であり、ここでは切断可能なリンカー修飾を用いてバーコードの1つの位置を暗くしている。
【0086】
図23図23は、本開示によるシークエンシングサイクルを図解した一例であり、ここではバーコードドメインの中の1つの位置が一次核酸の置換によって暗くされている。
【0087】
図24図24は、FFPEサンプルからRNAとDNAをまとめて捕獲する一例を示している。
【0088】
図25図25は、本開示のシークエンシング法を利用すると、異なるシークエンシング用プローブを用いた標的核酸の同じ塩基のシークエンシングがどのようにして可能になるかの模式図である。
【0089】
図26図26は、標的核酸上の特定のヌクレオチド位置における複数の塩基読み取り(base call)が1つ以上のシークエンシング用プローブから記録され、どのように組み合わされてコンセンサス配列を作り出し、前記ことによって最終的な塩基読み取りの精度を上昇させているかを示している。
【0090】
図27図27は、33キロ塩基のDNA断片の捕獲、伸長、検出の後に記録された本開示のシークエンシング法の蛍光画像を示している。
【0091】
図28-1】図28は、本開示のシークエンシング法を利用して取得してShortStack(商標)アルゴリズムを利用して分析した、シークエンシング実験からの結果を示している。左側のグラフに関しては、示されている配列は、左上のグラフから始まって時計回りに配列番号3、4、6、8、7、5に対応している。右側の表に関しては、配列は、上から下へと配列番号3、4、7、8、6、5に対応している。
図28-2】上記説明に同じ。
【0092】
図29図29は、FFPEサンプルからのがん遺伝子標的の多重捕獲とシークエンシングに関する実験設計の模式図を示している。
【0093】
図30図30は、直接的なシークエンシングの模式図と、本開示のシークエンシング法を利用してRNA分子の適合性を調べる実験からの結果を示している。
【0094】
図31図31は、本開示のシークエンシング法を利用して同じヌクレオチド配列を有するRNA分子とDNA分子をシークエンシングした結果を示している。
【0095】
図32図32は、RNAパネルの多重標的捕獲の結果を示している。
【0096】
図33図33は、ShortStack(商標)ソフトウエアパイプラインの工程全体の模式図を示している。
【0097】
図34図34は、シミュレーションしたデータセットをShortStack(商標)ソフトウエアパイプラインを利用して変異分析した結果を示している。
【0098】
図35図35は、ShortStack(商標)ソフトウエアパイプラインの総合的な変異読み取り精度をさまざまなタイプの変異について示している。
【0099】
図36図36は、特定の色組み合わせで標識したレポータ複合体に関する強度分布である。
【0100】
図37図37は、本開示の典型的な堆積勾配を示している。
【0101】
図38図38は、25 ng~500 ng のDNA質量入力を滴定している間の本開示の捕獲効率を示している。
【0102】
図39図39は、本開示のレポータ複合体の一例のHLPC精製を示している。
【0103】
図40-1】図40は、さまざまな緩衝液添加物の存在下における本開示のレポータプローブのハイブリダイゼーションの効率と精度を示している。
図40-2】上記説明に同じ。
【0104】
図41図41は、さまざまな緩衝液添加物の存在下で本開示のシークエンシング法を利用するときの標的核酸の損失率を示している。
【0105】
図42図42は、12量体相補的核酸を含む本開示のレポータプローブの効率とエラーを示している。
【0106】
図43図43は、8×8×8 14量体レポータセットの一例を用いたレポータプローブの効率とエラーを示している。
【0107】
図44図44は、10×10×10 14量体レポータセットの一例を用いたレポータプローブの効率とエラーを示している。
【0108】
図45図45は、本開示の標準シークエンシング用プローブと3部構成シークエンシング用プローブの性能の比較を示している。
【0109】
図46図46は、個々のプローブを用いたときの本開示による標的結合ドメインの中でのLNA置換の効果を示している。
【0110】
図47図47は、9つのプローブからなるプールを用いたときの本開示による標的結合ドメインの中でのLNA置換の効果を示している。
【0111】
図48図48は、本開示による標的結合ドメインの中での修飾されたヌクレオチドと核酸類似体による置換の効果を示している。
【0112】
図49図49は、本開示によるシークエンシング法の生の精度を定量する実験からの結果を示している。
【0113】
図50図50は、標的核酸の中にあるヌクレオチドを2つ以上のシークエンシング用プローブによってシークエンシングするときの本開示によるシークエンシング法の精度を求める実験からの結果を示している。
【発明を実施するための形態】
【0114】
本開示により、酵素なし、増幅なし、ライブラリなしで迅速に実施され、読み出し長が長くてエラー率が低い核酸シークエンシングを提供するシークエンシング用プローブと、レポータプローブと、方法と、キットと、装置が提供される。
【0115】
本開示の組成物
【0116】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく;前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも1個または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、前記標的結合ドメインの中の前記少なくとも1個または少なくとも2個のヌクレオチドは、ユニバーサル塩基または縮重塩基であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の各付着位置は、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
【0117】
本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、前記標的結合ドメインの中の少なくとも4個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置の各付着領域は、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブが提供される。
【0118】
本開示により、本明細書に開示した任意のシークエンシング用プローブを複数含むシークエンシング用プローブの集団も提供される。
【0119】
開示されているシークエンシング用プローブの標的結合ドメイン、バーコードドメイン、骨格のほか、相補的核酸分子(例えばレポータ分子またはレポータ複合体)は、下により詳しく記載してある。
【0120】
本開示のシークエンシング用プローブは、標的結合ドメインとバーコードドメインを含んでいる。図1は、本開示によるシークエンシング用プローブの一例の模式図である。図1は、標的結合ドメインが標的核酸に結合できることを示している。標的核酸として、本開示のシークエンシング用プローブがハイブリダイズすることのできる任意の核酸が可能である。標的核酸として、DNAまたはRNAが可能である。標的核酸は、対象に由来する生物サンプルから得ることができる。「標的結合ドメイン」と「シークエンシングドメイン」という用語は、本明細書では交換可能に用いられる。
【0121】
標的結合ドメインは、一連のヌクレオチドを含むことができる(例えばポリヌクレオチドである)。標的結合ドメインは、DNA、またはRNA、またはこれらの組み合わせを含むことができる。標的結合ドメインがポリヌクレオチドである場合には、標的結合ドメインは、図1に示してあるように、標的核酸のうちでシークエンシング用プローブの標的結合ドメインと相補的な部分にハイブリダイズすることにより、前記標的核酸に結合する。
【0122】
シークエンシング用プローブの標的結合ドメインは、シークエンシング用プローブのハイブリダイゼーションおよび/または脱ハイブリダイゼーションの可能性と、それが起こる速度を制御できるように設計することができる。一般に、プローブのTmが低くなるほど、プローブが標的核酸から脱ハイブリダイズする可能性が大きくなる。したがってTmがより低いプローブを用いると、標的核酸に結合するプローブの数が少なくなろう。
【0123】
標的結合ドメインの長さが、プローブが標的核酸にハイブリダイズする可能性と標的核酸にハイブリダイズしたままになる可能性に部分的に影響を与える。一般に、標的結合ドメインが長くなるほど(ヌクレオチドの数が多くなるほど)、相補的な配列が標的ヌクレオチドの中に存在する可能性が小さくなる。逆に、標的結合ドメインが短くなるほど、相補的な配列が標的ヌクレオチドの中に存在する可能性が大きくなろう。例えば4量体配列が標的核酸の中に位置する確率は1/256であるのに対して6量体配列が標的核酸の中に位置する確率は1/4096である。前記帰結として、より短いプローブの集合は、より長いプローブの集合と比べたとき、所与の長さの核酸ではより多くの位置に結合する可能性があろう。
【0124】
さまざまな場合において、所与の長さの核酸における読み出しの数を増やすには、より短い標的結合ドメインを有するプローブを用意することが好ましい。そうすることで、例えば変異またはSNPアレルを検出するとき、1つの標的核酸または前記標的核酸の一部、特に特別な興味のある部分のカバレッジが多くなる。
【0125】
標的結合ドメインとして、長さが任意の個数のヌクレオチドが可能である。標的結合ドメインとして、長さが少なくとも12個のヌクレオチド、長さが少なくとも10個のヌクレオチド、長さが少なくとも8個のヌクレオチド、長さが少なくとも6個のヌクレオチド、長さが少なくとも3個のヌクレオチドのいずれかが可能である。
【0126】
標的結合ドメインの中の各ヌクレオチドは、標的分子の相補的なヌクレオチドを同定(またはコード)することができる。あるいは標的結合ドメインの中のいくつかのヌクレオチドが標的分子の相補的なヌクレオチドを同定(またはコード)する一方で、標的結合ドメインの中のいくつかのヌクレオチドは、標的分子の相補的なヌクレオチドを同定(またはコード)することがない。
【0127】
標的結合ドメインは、少なくとも1個の天然塩基を含むことができる。標的結合ドメインは、天然塩基を含まないことが可能である。標的結合ドメインは、少なくとも1個の修飾されたヌクレオチドまたは核酸類似体を含むことができる。標的結合ドメインは、修飾されたヌクレオチドまたは核酸類似体を含まないことが可能である。標的結合ドメインは、少なくとも1個のユニバーサル塩基を含むことができる。標的結合ドメインは、ユニバーサル塩基を含まないことが可能である。標的結合ドメインは、少なくとも1個の縮重塩基を含むことができる。標的結合ドメインは、縮重塩基を含まないことが可能である。
【0128】
標的結合ドメインは、天然塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の天然塩基)、修飾されたヌクレオチドまたは核酸類似体(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の修飾されたヌクレオチドまたは核酸類似体)、ユニバーサル塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数のユニバーサル塩基)、縮重塩基(0個、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数の縮重塩基)の任意の組み合わせを含むことができる。特定の標的結合ドメインの天然塩基、修飾されたヌクレオチドまたは核酸類似体、ユニバーサル塩基、縮重塩基は、組み合わせで存在するとき、任意の順番で配置することができる。
【0129】
「修飾されたヌクレオチド」または「核酸類似体」という用語の非限定的な例に含まれるのは、架橋型核酸(LNA)、架橋化核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシンである。標的結合ドメインは、0~6個(例えば0個、1個、2個、3個、4個、5個、6個)の修飾されたヌクレオチドまたは核酸類似体を含むことができる。修飾されたヌクレオチドまたは核酸類似体は、架橋型核酸(LNA)であることが好ましい。
【0130】
本明細書では、「架橋型核酸(LNA)」という用語の非限定的な例に含まれるのは、2'酸素と4'炭素を接続するメチレン架橋をリボース部分が含んでいる修飾されたRNAヌクレオチドである。このメチレン架橋が、リボースをA型RNA二本鎖で見られる3'-エンドコンホメーション(ノースコンホメーションとしても知られる)の中にロックする。アクセスできないRNAという用語は、LNAと交換可能に用いることができる。本明細書では、「架橋化核酸(BNA)」という用語の非限定的な例に含まれるのは、固定された3'-エンドコンホメーション(ノースコンホメーションとしても知られる)を有する5員または6員の架橋構造を含む修飾されたRNA分子である。架橋構造は、リボースの2'酸素をリボースの4'炭素に接続している。炭素原子、窒素原子、水素原子を含む異なるさまざまな架橋構造が可能である。本明細書では、「プロピンで修飾された核酸」という用語の非限定的な例に含まれるのは、ピリミジン、すなわち核酸塩基のC5位にプロピン修飾を含むシトシンとチミン/ウラシルである。本明細書では、「ジップ核酸(ZNA(登録商標))」という用語の非限定的な例に含まれるのは、カチオン性スペルミン部分に共役したオリゴヌクレオチドである。
【0131】
本明細書では、「ユニバーサル塩基」という用語の非限定的な例に含まれるのは、ワトソン-クリック塩基対合規則に従わないが、標的核酸の上に位置する4種類の基本塩基(A、T/U、C、G)のうちの任意のものに結合することのできるヌクレオチド塩基である。本明細書では、「縮重塩基」という用語の非限定的な例に含まれるのは、ワトソン-クリック塩基対合規則に従わないが、標的核酸の上に位置する4種類の正規塩基(A、T/U、C、G)のうちの4種類全部ではなくて少なくとも2種類に結合することのできるヌクレオチド塩基である。縮重塩基はゆらぎ塩基とも呼ぶことができ、これらの用語は本明細書では交換可能に用いられる。
【0132】
図1に例示したシークエンシング用プローブは、シークエンシングすべき標的核酸の相補的なヌクレオチド1~6に特異的にハイブリダイズする長さ6個のヌクレオチド配列(b1-b2-b3-b4-b5-b6)を含む標的結合ドメインを示している。標的結合ドメインのこの6量体部分(b1-b2-b3-b4-b5-b6)が、標的配列の中の相補的なヌクレオチド(1-2-3-4-5-6)を同定(またはコード)する。この6量体配列は、それぞれの側に塩基(N)が隣接している。(N)によって示される塩基として、独立に、ユニバーサル塩基または縮重塩基が可能である。典型的には、(N)によって示される塩基は、独立に、正規塩基のうちの1つである。(N)によって示される塩基は、標的配列の中で前記塩基が結合する相補的なヌクレオチドを同定(またはコード)することがなく、(6量体)配列(b1-b2-b3-b4-b5-b6)の核酸配列とは独立である。
【0133】
図1に示したシークエンシング用プローブは、本開示のシークエンシング法と組み合わせて用いて標的核酸をシークエンシングすることができ、ハイブリダイゼーション反応だけを利用していて、共有結合化学、酵素、増幅を必要としない。標的核酸分子の中の可能なすべての6量体配列のシークエンシングをするには合計で4096通りのシークエンシング用プローブが必要とされる(46=4096)。
【0134】
図1は、本開示のシークエンシング用プローブの標的結合ドメインの1つの配置例である。表1に本開示の標的結合ドメインの別のいくつかの配置を示してある。好ましい1つの標的結合ドメインは「6 LNA」標的結合ドメインと呼ばれ、標的結合ドメインの位置b1~b6に6個のLNAを含んでいる。これら6個のLNAはそれぞれの側に塩基(N)が隣接している。本明細書では、塩基(N)として、(6量体)配列(b1-b2-b3-b4-b5-b6)の核酸配列とは独立なユニバーサル塩基/縮重塩基、または正規塩基が可能である。言い換えるならば、塩基b1-b2-b3-b4-b5-b6は所与の任意の標的配列に対して特異的である可能性があるのに対し、(N)塩基は、ユニバーサル塩基/縮重塩基であること、または4種類の正規塩基のうちで、b1-b2-b3-b4-b5-b6によって指定される標的に対して特異的ではない任意のもので構成することができる。例えば調べる標的配列がCAGGCATAである場合には、標的結合ドメインの塩基b1-b2-b3-b4-b5-b6はTCCGTAになると考えられるのに対し、標的結合ドメインの(N)塩基のそれぞれは、独立に、A、C、T、Gのいずれかになることができると考えられるため、得られる標的結合ドメインは、配列ATCCGTAG、TTCCGTAC、GTCCGTAGのいずれか、または可能な16通りの配列のうちの他のどれかになることができる。あるいは2個の(N)塩基が6 LNAの前に位置することができると考えられる。あるいはさらに、2個の(N)塩基が6 LNAの後に来ることができると考えられる。
【0135】
【表1】
【0136】
表1には、10個の天然の標的特異的塩基を含む「10量体」標的結合ドメインも記載されている。
【0137】
表1にはさらに、位置b1~b6に6個の天然塩基を含む「Natural I」標的結合ドメインも記載されている。これら6個の天然塩基は、それぞれの側に2個の(N)塩基が隣接している。あるいは4個の(N)塩基すべてがそれら6個の天然塩基の前に位置することができよう。あるいはさらに、4個の(N)塩基すべてがそれら6個の天然塩基の後ろに位置することができよう。4個の(N)塩基のうちの任意の個数(すなわち1個、2個、3個、4個)をそれら6個の天然塩基の前に位置させることができると、残りの(N)塩基はそれら6個の天然塩基の後ろに位置することになろう。
【0138】
表1にはさらに、位置b1~b6に6個の天然塩基を含む「Natural II」標的結合ドメインも記載されている。これら6個の天然塩基はそれぞれの側に1個の(N)塩基が隣接している。あるいは両方の(N)塩基を6個の天然塩基の前に位置させることができよう。あるいはさらに、両方の(N)塩基を6個の天然塩基の後ろに位置させることができよう。
【0139】
表1にはさらに、標的結合ドメインの位置b1~b6に2個のLNAと4個の天然塩基の組み合わせを含む「2 LNA」標的結合ドメインも記載されている。2個のLNAと4個の天然塩基は任意の順番に出現することができる。例えば位置b3とb4をLNAにすることができると、位置b1、b2、b5、b6は天然塩基である。塩基b1~b6はそれぞれの側に1個の(N)塩基が隣接している。あるいは塩基b1~b6の前に2個の(N)塩基を位置させることができる。あるいはさらに、塩基b1~b6の後ろに2個の(N)塩基を位置させることができる。
【0140】
表1にはさらに、標的結合ドメインの位置b1~b6に4個のLNAと2個の天然塩基の組み合わせを含む「4 LNA」標的結合ドメインも記載されている。4個のLNAと2個の天然塩基は任意の順番に出現することができる。例えば位置b2~b5をLNAにすることができると、位置b1とb6は天然塩基である。塩基b1~b6はそれぞれの側に1個の(N)塩基が隣接している。あるいは塩基b1~b6の前に2個の(N)塩基を位置させることができる。あるいはさらに、塩基b1~b6の後ろに2個の(N)塩基を位置させることができる。
【0141】
本開示のシークエンシング用プローブは合成骨格を含んでいる。標的結合ドメインとバーコードドメインは機能可能に連結されている。標的結合ドメインとバーコードドメインは、1つの合成骨格の一部として共有結合させることができる。標的結合ドメインとバーコードドメインはリンカー(例えば核酸リンカー、化学的リンカー)を介して結合させることができる。合成骨格は任意の材料(例えば多糖、ポリヌクレオチド、ポリマー、プラスチック、繊維、ペプチド、ペプチド核酸、ポリペプチド)を含むことができる。合成骨格は堅固であることが好ましい。合成骨格は一本鎖DNA分子を含むことができる。骨格は、6つのDNA二重螺旋からなる「DNA折り紙」を含むことができる(例えばLin他「Submicrometre geometrically encoded fluorescent barcodes self-assembled from DNA」Nature Chemistry; 2012年10月;第4巻(10):832~839ページを参照されたい)。バーコードは、DNA折り紙タイルから作製することができる(Jungmann他「Multiplexed 3D cellular super-resolution imaging with DNA-PAINT and Exchange-PAINT」Nature Methods、第 11巻、第3号、2014年)。
【0142】
本開示のシークエンシング用プローブは、一部が二本鎖になっている合成骨格を含むことができる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間の二本鎖DNAスペーサとを含むことができる。シークエンシング用プローブは、一本鎖DNA合成骨格と、標的結合ドメインとバーコードドメインの間にあって二本鎖DNAと力学的特性が似たポリマーをベースとしたスペーサとを含むことができる。ポリマーをベースとした典型的なスペーサにはポリエチレングリコール(PEG)型ポリマーが含まれる。
【0143】
二本鎖DNAスペーサは、長さが約1個~約100個のヌクレオチド、または長さが約2個~約50個のヌクレオチド、または長さが約20個~約40個のヌクレオチドで構成することができる。二本鎖DNAスペーサは長さが約36個のヌクレオチドであることが好ましい。
【0144】
本開示の1つのシークエンシング用プローブを「標準プローブ」と呼び、図2の左図に示してある。図2の標準プローブは、標的結合ドメインに共有結合したバーコードドメインを含んでいるため、標的結合ドメインとバーコードドメインは同じオリゴヌクレオチド鎖の中に存在する。図2の左図では、一本鎖オリゴヌクレオチドがステムオリゴヌクレオチドに結合してステム配列と呼ばれる長さ36個のヌクレオチドの二本鎖スペーサ領域を生み出している。この構造を用いると、複数のプローブからなるプールの中の各シークエンシング用プローブが同じステム配列にハイブリダイズすることができる。
【0145】
本開示の別のシークエンシング用プローブを「3部構成プローブ」と呼び、図2の右図に示してある。図2の3部構成プローブは、標的結合ドメインにリンカーを介して結合したバーコードドメインを含んでいる。この例では、リンカーは、標的結合ドメインを含有する一本鎖オリゴヌクレオチドと、バーコードドメインを含有する一本鎖オリゴヌクレオチドとにハイブリダイズする一本鎖ステムオリゴヌクレオチドであり、バーコードドメイン(18個のヌクレオチド)と標的結合ドメイン(18個のヌクレオチド)を架橋する長さ36個のヌクレオチドの二本鎖スペーサ領域を生み出している。プローブ構成のこの例を用いると、バーコードドメインの交換を阻止することを目的として、各バーコードを、単一のステム配列にハイブリダイズするように設計することができる。さらに、各バーコードドメインを対応するステムオリゴヌクレオチドにハイブリダイズさせた後に、異なるシークエンシング用プローブをまとめてプールすることもできる。
【0146】
バーコードドメインは、複数の付着位置(例えば1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多い数の付着位置)を含んでいる。付着位置の数は、標的結合ドメインの中のヌクレオチドの数よりも少なくすること、または前記数と同じにすること、または前記数よりも多くすることができる。標的結合ドメインは、骨格ドメインの中の付着位置の数よりも多いヌクレオチド(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数のヌクレオチド)を含むことができる。標的結合ドメインは8個のヌクレオチドを含むことができ、バーコードドメインは3つの付着位置を含んでいる。標的結合ドメインは10個のヌクレオチドを含むことができ、バーコードドメインは3つの付着位置を含んでいる。
【0147】
バーコードドメインは、下に説明するように、少なくとも3つの付着位置にとって十分な長さが存在する限り、長さに制限はない。「付着位置」、「位置」、「スポット」という用語は、本明細書では交換可能に用いられる。「バーコードドメイン」と「レポーティングドメイン」という用語は、本明細書では交換可能に用いられる。
【0148】
バーコードドメインの中の各付着位置は、標的結合ドメインの中の2個のヌクレオチド(ジヌクレオチド)、したがって標的結合ドメインの中の前記ジヌクレオチドにハイブリダイズする標的結合ドメインの中の相補的なジヌクレオチドに対応する。非限定的な一例として、バーコードドメインの中の第1の付着位置は、標的結合ドメインの中の第1と第2のヌクレオチドに対応し(例えば図1では、R1がバーコードドメインの中の第1の付着位置であり、R1が標的結合ドメインの中のジヌクレオチドb1とb2に対応し、それが標的核酸のジヌクレオチド1と2を同定する)、バーコードドメインの中の第2の付着位置は、標的結合ドメインの中の第3と第4のヌクレオチドに対応し(例えば図1では、R2がバーコードドメインの中の第2の付着位置であり、R2が標的結合ドメインの中のジヌクレオチドb3とb4に対応し、それが標的核酸のジヌクレオチド3と4を同定する)、バーコードドメインの中の第3の付着位置は、標的結合ドメインの中の第5と第6のヌクレオチドに対応する(例えば図1では、R3がバーコードドメインの中の第3の付着位置であり、R3が標的結合ドメインの中のジヌクレオチドb5とb6に対応し、それが標的核酸のジヌクレオチド5と6を同定する)。
【0149】
バーコードドメインの中の各付着位置は、少なくとも1つの付着領域(例えば1~50、またはそれよりも多い数の付着領域)を含んでいる。バーコードドメインの中のいくつかの位置は他の位置よりも多くの付着領域を持つことができる(例えば第1の付着位置は3つの付着領域を持つことができるのに対し、第2の付着位置は2つの付着領域を持つことができる)。あるいはバーコードドメインの中の各付着位置は、同数の付着領域を有する。バーコードドメインの中の各付着位置は、1つの付着領域を含むことができる。バーコードドメインの中の各付着位置は、2つ以上の付着領域を含むことができる。バーコードドメインの中の少なくとも3つの付着位置のうちの少なくとも1つは、バーコードドメインの中の他の2つの付着位置とは異なる数の付着領域を含むことができる。
【0150】
各付着領域は、相補的核酸分子(例えばDNAまたはRNA)が可逆的に結合することのできる核酸配列のコピーを少なくとも1つ(すなわち1~50、例えば10~30)含んでいる。1つの付着位置における付着領域の核酸配列は同じにすることができる。前記場合には、これら付着領域に結合する相補的核酸分子は同じである。あるいはある1つの位置における付着領域の核酸配列は同じではない。前記場合には、これら付着領域に結合する相補的核酸分子は同じではない。
【0151】
バーコードドメインの中の各付着領域を含む核酸配列は、長さが約8個~約20個のヌクレオチドにすることができる。バーコードドメインの中の各付着領域を含む核酸配列は、長さが約12個~約14個のヌクレオチドにすることができる。バーコードドメインの中の各付着領域を含む核酸配列は、長さが約14個のヌクレオチドであることが好ましい。
【0152】
バーコードドメインの中の各付着領域を含む核酸のそれぞれは、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体であることが可能である。バーコードドメインの中の付着領域に含まれる少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチド、または核酸類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。バーコードドメインの中の付着領域で有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、バーコードドメインの中の適切な付着領域に対するレポータの結合効率と結合精度を改善する一方で、標的を含めて別の箇所への結合を最少にすることができる。
【0153】
1つ以上の付着領域をポリヌクレオチド骨格と一体化することができる。すなわち骨格は単一のポリヌクレオチドであり、付着領域は前記単一のポリヌクレオチドの配列の一部である。1つ以上の付着領域を合成骨格の中の修飾されたモノマー(例えば修飾されたヌクレオチド)に連結させ、前記付着領域を合成骨格から分岐させることができる。1つの付着位置は、2つ以上の付着領域を含むことができ、そのうちのいくつかの付着領域が合成骨格から分岐する一方で、いくつかの付着領域は合成骨格と一体化している。少なくとも1つの付着位置の中の少なくとも1つの付着領域を合成骨格と一体化することができる。前記少なくとも1つの付着位置のそれぞれの中の各付着領域を合成骨格と一体化することができる。少なくとも1つの付着位置の中の少なくとも1つの付着領域を合成骨格から分岐させることができる。少なくとも3つの付着位置のそれぞれの中の各付着領域を合成骨格から分岐させることができる。
【0154】
バーコードドメインの中の各付着位置は、16通りのジヌクレオチドのうちの1つ、すなわちアデニン-アデニン、アデニン-チミン/ウラシル、アデニン-シトシン、アデニン-グアニン、チミン/ウラシル-アデニン、チミン/ウラシル-チミン/ウラシル、チミン/ウラシル-シトシン、チミン/ウラシル-グアニン、シトシン-アデニン、シトシン-チミン/ウラシル、シトシン-シトシン、シトシン-グアニン、グアニン-アデニン、グアニン-チミン/ウラシル、グアニン-シトシン、グアニン-グアニンのいずれかに対応する。したがってバーコードドメインの単一の付着位置の中に位置する1つ以上の付着領域は、16通りのジヌクレオチドのうちの1つに対応し、前記付着領域が対応するジヌクレオチドに対して特異的な核酸配列を含んでいる。バーコードドメインの異なる付着位置の中に位置する付着領域は、バーコードドメインの中のそれらの位置が同じジヌクレオチドに対応する場合でさえ、独自の核酸配列を含有している。例えば配列A-G-A-G-A-Cをコードする6量体を有する標的結合ドメインを含有する本開示のシークエンシング用プローブが与えられると、このシークエンシング用プローブのバーコードドメインは、3つの位置を含有し、第1の付着位置はアデニン-グアニンというジヌクレオチドに対応し、第2の付着位置はアデニン-グアニンというジヌクレオチドに対応し、第3の付着位置はアデニン-シトシンというジヌクレオチドに対応することになろう。この例のプローブの位置1に位置する付着領域は、付着位置1と付着位置2の両方がアデニン-グアニンというジヌクレオチドに対応する場合でさえ、位置2に位置する付着領域の核酸配列とは異なる独自の核酸配列を含むことになろう。具体的な付着位置の配列を設計し、個々の付着位置の相補的核酸が異なる付着位置と相互作用しないことを調べる。それに加え、相補的核酸のヌクレオチド配列には制限がない。前記ヌクレオチド配列は、既知のヌクレオチド配列との実質的な相同性(例えば50%~99.9%)がないことが好ましい。そうすることで、相補的核酸と標的核酸の望ましくないハイブリダイゼーションが制限される。
【0155】
図1は、バーコードドメインの一例を含む本開示のシークエンシング用プローブの一例の図を示している。図1に例示したバーコードドメインは、3つの付着位置R1、R2、R3を含んでいる。各付着位置は、標的結合ドメインの6量体配列(b1~b6)の中に存在する特定のジヌクレオチドに対応する。この例では、R1は位置b1とb2に対応し、R2は位置b3とb4に対応し、R3は位置b5とb6に対応する。したがって各位置は、標的結合ドメインの6量体配列の中に存在する特定のジヌクレオチドをデコードし、前記ことによってそれぞれのジヌクレオチドの中に存在する特定の2個の塩基(A、C、G、Tのいずれか)の同定が可能になる。
【0156】
図1に示したバーコードドメインの例では、各付着位置は、合成骨格に一体化した単一の付着領域を含んでいる。3つの付着位置の各付着領域は、各付着位置によってコードされた個々のジヌクレオチドに対応する特定のヌクレオチド配列を含有している。例えば付着位置R1は、ジヌクレオチドb1-b2の属性に対応する特定の配列を有する付着領域を含んでいる。
【0157】
バーコードドメインはさらに、1つ以上の結合領域を含むことができる。バーコードドメインは、少なくとも1つの付着位置に隣接した少なくとも1つの一本鎖核酸配列を含むことができる。バーコードドメインは、少なくとも2つの付着位置に隣接した少なくとも2つの一本鎖核酸配列を含むことができる。バーコードドメインは、少なくとも3つの付着位置に隣接した少なくとも3つの一本鎖核酸配列を含むことができる。これら隣接部分は「トーホールド(Toe-Hold)」として知られており、一本鎖オリゴヌクレオチドにとっての追加結合部位を提供することによってトーホールドに隣接してハイブリダイズするオリゴヌクレオチドの交換速度を加速させるのに用いることができる(「トーホールド」プローブ;例えばSeeling他「Catalyzed Relaxation of a Metastable DNA Fuel」;J. Am. Chem. Soc. 2006年、第128巻(37)、12211~12220ページを参照されたい)。
【0158】
本開示のシークエンシング用プローブは、約20ナノメートル~約50ナノメートルの全長を持つことができる(前記中に、標的結合ドメインと、バーコードドメインと、オプションの任意のドメインが含まれる)。シークエンシング用プローブの骨格として、約120個のヌクレオチドを含むポリヌクレオチド分子が可能である。
【0159】
シークエンシング用プローブは、切断可能なリンカー修飾を含むことができる。当業者に知られている任意の切断可能なリンカー修飾を用いることができる。切断可能なリンカー修飾の非限定的な例に含まれるのは、UV光で切断可能なリンカー、還元剤で切断可能なリンカー、酵素で切断可能なリンカーである。酵素で切断可能なリンカーの一例は、USER(商標)酵素によって切断するためのウラシルの挿入である。切断可能なリンカー修飾は、シークエンシング用プローブの長さに沿った任意の場所に位置させることができ、場所の非限定的な例に含まれるのは、標的結合ドメインとバーコードドメインの間の領域である。図10の右図は、本開示のプローブに組み込むことのできる切断可能なリンカー修飾を示している。
【0160】
レポータプローブ
【0161】
本開示によるシークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に結合(例えばハイブリダイズ)する核酸分子は、検出可能な標識を(直接または間接に)含んでいる。前記検出可能な標識を本明細書では「レポータプローブ」または「レポータプローブ複合体」と呼び、これらの用語を本明細書では交換可能に用いる。レポータプローブとして、DNA、RNA、PNAのいずれかが可能である。レポータプローブはDNAであることが好ましい。
【0162】
レポータプローブは少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは少なくとも1個の相補的核酸分子に結合することができ、第2のドメインは第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。図3は、シークエンシング用プローブの一例のバーコードドメインの第1の付着位置に結合した本開示によるレポータプローブの一例の模式図を示している。図3では、レポータプローブの第1のドメイン(栗色の市松模様で表示)がバーコードドメインの付着位置R1の中の相補的核酸配列に結合し、レポータプローブの第2のドメイン(灰色で表示)が2つの検出可能な標識(1つは緑色の標識、1つは赤色の標識)に結合している。
【0163】
あるいはレポータプローブは少なくとも2つのドメインを含むことができ、そのうちの第1のドメインは少なくとも1つの第1の相補的核酸分子に結合することができ、第2のドメインは少なくとも1つの第2の相補的核酸分子に結合することができる。少なくとも1つの第1の相補的核酸分子と少なくとも1つの第2の相補的核酸分子は異なっている(異なる核酸配列を持つ)ことが可能である。
【0164】
「一次核酸分子」は、少なくとも2つのドメインを含むレポータプローブであり、そのうちの第1のドメインは、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に結合(ハイブリダイズ)することができ、第2のドメインは、少なくとも1つの追加の相補的核酸に結合(ハイブリダイズ)することができる。一次核酸分子は、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に直接結合することができる。一次核酸分子は、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の相補的核酸配列に核酸リンカーを介して間接的に結合することができる。一次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
【0165】
一次核酸分子の第1のドメインを含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。一次核酸分子の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。一次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、シークエンシング用プローブのバーコードドメインの少なくとも1つの付着位置の中の少なくとも1つの付着領域の中の適切な相補的核酸配列に対する一次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、標的を含めて別の箇所への結合を最少にすることができる。
【0166】
一次核酸分子に結合する少なくとも1個の追加の相補的核酸を本明細書では「二次核酸分子」と呼ぶ。一次核酸分子は、少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、またはそれよりも多い個数の二次核酸分子に結合(例えばハイブリダイズ)することができる。一次核酸分子は、4個の二次核酸分子に結合(例えばハイブリダイズ)することが好ましい。
【0167】
二次核酸分子は少なくとも2つのドメインを含んでいて、そのうちの第1のドメインは、少なくとも1個の一次核酸分子の中の少なくとも1つの相補的配列に結合(例えばハイブリダイズ)することができ、第2のドメインは、(a)第1の検出可能な標識と少なくとも第2の検出可能な標識に、または(b)少なくとも1個の追加の相補的核酸分子に、または(c)これらの組み合わせに結合(例えばハイブリダイズ)することができる。二次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
【0168】
二次核酸分子の第1のドメインを含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。二次核酸分子の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。バーコードドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。二次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、一次核酸分子の第2のドメインの中の適切な相補的核酸配列に対する二次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、別の箇所への結合を最少にすることができる。
【0169】
二次核酸分子に結合する少なくとも1個の追加の相補的核酸を本明細書では「三次核酸分子」と呼ぶ。二次核酸分子は、少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個、または少なくとも7個、またはそれよりも多い個数の三次核酸分子に結合(例えばハイブリダイズ)することができる。前記少なくとも1個の二次核酸分子は1個の三次核酸分子に結合(例えばハイブリダイズ)することが好ましい。
【0170】
三次核酸分子は少なくとも2つのドメインを含んでいて、そのうちの第1のドメインは、少なくとも1個の二次核酸分子の中の少なくとも1つの相補的配列に結合(例えばハイブリダイズ)することができ、第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合(例えばハイブリダイズ)することができる。あるいは第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識を、オリゴヌクレオチド合成の間に例えばホスホロアミダイトまたはNHS化学を利用してこれら標識を直接または間接に付着させることを通じて含むことができる。三次核酸分子は、切断可能なリンカーを含むことができる。切断可能なリンカーは、第1のドメインと第2のドメインの間に位置させることができる。切断可能なリンカーは、光で切断できることが好ましい。
【0171】
三次核酸分子の第1のドメインを含む核酸のそれぞれは、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体である。三次核酸の第1のドメインの中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であることが可能である。三次核酸分子の第1のドメインの中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。三次核酸分子の第1のドメインで有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。修飾されたヌクレオチドまたは核酸類似体(例えばイソグアニンとイソシトシン)を用いると、二次核酸分子の第2のドメインの中の適切な相補的核酸配列に対する三次核酸分子の第1のドメインの結合効率と結合精度を改善する一方で、別の箇所への結合を最少にすることができる。
【0172】
レポータプローブは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合して2色の組み合わせを生み出す。蛍光染料のこの二重の組み合わせには、単一の色の重複(例えば青-青)を含めることができる。本明細書では、「標識」という用語に、検出可能な信号を発生させることのできる単一の部分、または同じか実質的に同じ検出可能な信号を発生させることのできる複数の部分が含まれる。例えば標識には、単一の黄色蛍光染料(ALEXA FLUOR(商標)532など)、または複数の黄色蛍光染料(ALEXA FLUOR(商標)532などなど)が含まれる。
【0173】
レポータプローブは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができ、それぞれの検出可能な標識は、青(B)、緑(G)、黄(Y)、赤(R)という4種類の蛍光染料のうちの1つである。これら4種類の染料を用いると、可能な2色の組み合わせが10通り(BB;BG;BR;BY;GG;GR;GY;RR;RY;YY)生じる。いくつかの側面では、図3に示したように、本開示のレポータプローブに、8通りの可能な色組み合わせ、すなわちBB;BG;BR;BY;GG;GR;GY;YYのうちの1つで標識する。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0174】
シークエンシング用プローブと一次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子は第1の検出可能な標識と少なくとも第2の検出可能な標識を含み、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的一次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、標的結合ドメインの中の少なくとも6個のヌクレオチドによって指定されない標的に対して特異的でない4通りの正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基が可能である。
【0175】
シークエンシング用プローブと一次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子は第1の検出可能な標識と少なくとも第2の検出可能な標識を含み、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的一次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
【0176】
シークエンシング用プローブと、一次核酸分子と、二次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく、標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、標的結合ドメインの中の前記少なくとも1個、または少なくとも2個のヌクレオチドは、標的結合ドメインの中の他の塩基によって指定されない標的に対して特異的でない4種類の正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的二次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
【0177】
シークエンシング用プローブと、一次核酸分子と、二次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的二次核酸分子の少なくとも第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
【0178】
シークエンシング用プローブと、一次核酸分子と、二次核酸分子と、三次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも8個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも2個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;標的結合ドメインの中の前記6個のヌクレオチドのうちの少なくとも1個、または少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり、標的結合ドメインの中にあって標的核酸分子の中の対応するヌクレオチドを同定することがない前記少なくとも2個のヌクレオチドとして、標的結合ドメインの中の前記少なくとも6個のヌクレオチドによって指定されない標的に対して特異的でない4種類の正規塩基のうちの任意のもの、またはユニバーサル塩基、または縮重塩基が可能であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも1個の相補的二次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的三次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的三次核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
【0179】
シークエンシング用プローブと、一次核酸分子と、二次核酸分子と、三次核酸分子を含む側面では、本開示により、標的結合ドメインとバーコードドメインを含むシークエンシング用プローブとして;標的結合ドメインは少なくとも10個のヌクレオチドを含んでいて標的核酸に結合することができ、標的結合ドメインの中の少なくとも6個のヌクレオチドは標的核酸分子の中の対応する(相補的な)ヌクレオチドを同定することができ、標的結合ドメインの中の少なくとも4個のヌクレオチドは標的核酸分子の中の対応するヌクレオチドを同定することがなく;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、少なくとも1個の相補的一次核酸分子が結合する少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記相補的一次核酸分子にはさらに、少なくとも1個の相補的二次核酸分子が結合し、前記少なくとも1個の相補的二次核酸分子にはさらに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の相補的三次核酸分子が結合し、前記少なくとも3つの付着位置のそれぞれは標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置に結合したそれぞれの相補的三次核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識が、標的結合ドメインが結合した標的核酸の中の前記少なくとも6個のヌクレオチドうちの対応する2個のヌクレオチドの位置と属性を決めているシークエンシング用プローブも提供される。
【0180】
本開示により、シークエンシング用プローブと、二次核酸分子と三次核酸分子の両方の表面に検出可能な標識を有するレポータプローブも提供される。例えば二次核酸分子は一次核酸分子に結合することができ、前記二次核酸分子は、第1の検出可能な標識と少なくとも第2の検出可能な標識の両方を含むことができるとともに、第1の検出可能な標識と少なくとも第2の検出可能な標識を含む少なくとも1個の三次核酸分子にも結合することができる。二次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。三次核酸分子の表面に位置する第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。二次核酸分子の表面に位置する検出可能な標識の発光スペクトルは、互いに同じにすること、または三次核酸分子の表面に位置する検出可能な標識の発光スペクトルとは異なるようにすることができる。
【0181】
図4は、一次核酸分子と二次核酸分子と三次核酸分子の一例を含む本開示のレポータプローブの一例の模式図である。一次核酸分子は3'末端に第1のドメインを含んでいて、この第1のドメインは、シークエンシング用プローブのバーコードドメインの1つの付着位置の中の相補的付着領域にハイブリダイズする12個のヌクレオチドからなる配列を含んでいる。5'末端は、6個の二次核酸分子にハイブリダイズする第2のドメインである。例示した二次核酸分子のほうは、5'末端にあって一次核酸分子にハイブリダイズする第1のドメインと、3'部分にあって5個の三次核酸分子にハイブリダイズするドメインを含んでいる。
【0182】
三次核酸分子は少なくとも2つのドメインを含んでいる。第1のドメインは、二次核酸分子に結合することができる。三次核酸の第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。三次核酸の第2のドメインは、蛍光標識された1個以上のヌクレオチドモノマーを三次核酸の第2のドメインの配列に直接組み込むことにより、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。二次核酸分子の第2のドメインには、標識された短いポリヌクレオチドを二次核酸分子の第2のドメインにハイブリダイズさせることにより、第1の検出可能な標識と少なくとも第2の検出可能な標識を結合させることができる。これらの短いポリヌクレオチド(「標識されたオリゴ」と呼ぶ)には、蛍光標識したヌクレオチドモノマーを直接組み込むことによって、または当業者に知られている他の核酸標識法によって標識することができる。図4に例示した三次核酸は「標識されたオリゴ」と見なすことができ、二次核酸分子にハイブリダイズする第1のドメインを含むとともに、例えばNHS化学を利用してオリゴヌクレオチド合成の間に標識を間接的に付着させることによって、または三次核酸分子の合成の間に蛍光標識した1個以上のヌクレオチドモノマーを組み込むことによって蛍光標識した第2のドメインを含んでいる。標識したオリゴとして、DNA、RNA、PNAのいずれかが可能である。
【0183】
代わりの側面では、二次核酸分子の第2のドメインは、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合することができる。二次核酸分子の第2のドメインは、蛍光標識した1個以上のヌクレオチドモノマーを二次核酸の第2のドメインの配列に直接組み込むことにより、第1の検出可能な標識と少なくとも第2の検出可能な標識に結合させることができる。二次核酸分子の第2のドメインには、標識された短いポリヌクレオチドを二次核酸の第2のドメインにハイブリダイズさせることにより、第1の検出可能な標識と少なくとも第2の検出可能な標識を結合させることができる。これらの短いポリヌクレオチド(「標識されたオリゴ」と呼ぶ)には、蛍光標識したヌクレオチドモノマーを直接組み込むことによって、または当業者に知られている他の核酸標識法によって標識することができる。
【0184】
一次核酸分子は、約100個、または約95個、または約90個、または約85個、または約80個、または約75個のヌクレオチドを含むことができる。一次核酸分子は約100個~約80個のヌクレオチドを含むことができる。一次核酸分子は約90個のヌクレオチドを含むことができる。二次核酸分子は、約90個、または約85個、または約80個、または約75個、または約70個のヌクレオチドを含むことができる。二次核酸分子は約90個~約80個のヌクレオチドを含むことができる。二次核酸分子は約87個のヌクレオチドを含むことができる。二次核酸分子は、約25個、または約20個、または約15個、または約10個のヌクレオチドを含むことができる。三次核酸分子は約20個~約10個のヌクレオチドを含むことができる。三次核酸分子は約15個のヌクレオチドを含むことができる。
【0185】
本開示のレポータプローブはさまざまな設計にすることができる。例えば一次核酸分子を少なくとも1個(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数)の二次核酸分子にハイブリダイズさせることができる。それぞれの二次核酸分子は少なくとも1個(例えば1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、またはそれよりも多い個数)の三次核酸分子にハイブリダイズさせることができる。特定の2色の組み合わせで標識したレポータプローブを作製するため、二次核酸分子、または三次核酸分子、または標識したオリゴ、または二次核酸分子と三次核酸分子と標識したオリゴの任意の組み合わせを前記特定の2色の組み合わせの各色で標識したものを含むレポータプローブを設計する。例えば図4は、合計30個の染料(15個の染料が色1、15個の染料が色2)を含む本開示のレポータプローブを示している。異なる蛍光染料の間の色の交換または交差ハイブリダイゼーションを回避するため、特定の標識または蛍光染料に結合したそれぞれの三次核酸または標識したオリゴは、独自のヌクレオチド配列を含んでいる。
【0186】
図5は、本開示のレポータプローブの例を4つ示している。図5の左上の図は、5×5レポータプローブを示している。5×5プローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、5個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した5個の三次核酸がそれぞれの二次核酸にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
【0187】
図5の右上の図は、4×3レポータプローブを示している。4×3レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、4個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した3個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
【0188】
図5の左下の図は、3×4レポータプローブを示している。3×4レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸は第2のドメインも含んでいて、前記第2のドメインは、3個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、検出可能な標識が結合した4個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
【0189】
図5の右下の図は、スペーサ3×4レポータプローブを示している。スペーサ3×4レポータプローブは一次核酸を含んでおり、前記一次核酸は、12個のヌクレオチドからなる第1のドメインを含んでいる。一次核酸の第1のドメインと第2のドメインの間には、20~40個のヌクレオチドからなるスペーサ領域が位置する。このスペーサは長さが20~40個のヌクレオチドであるとされるが、スペーサの長さに制限はなく、20個未満のヌクレオチドや40個超のヌクレオチドが可能である。一次核酸の第2のドメインは、3個の二次核酸分子にハイブリダイズすることのできるヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識が結合した4個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。
【0190】
図5では、それぞれの一次核酸は、長さが12個のヌクレオチドである第1のドメインを含んでいる。しかし一次核酸の第1のドメインの長さに制限はなく、12個未満のヌクレオチドや12個超のヌクレオチドが可能である。一次核酸の第1のドメインは14個のヌクレオチドであることが好ましい。
【0191】
図5の個々の図に示した1つの具体的なレポータプローブの設計の任意の特徴を、図5の別の図に示すか本明細書の別の箇所に記載したレポータプローブの設計の任意の特徴と組み合わせることができる。例えば5×5レポータプローブを改変し、相補的核酸と一次核酸の間に約20~40個のヌクレオチドからなるスペーサ領域が含まれるようにすることができる。別の一例では、4×3レポータプローブを改変し、4個の二次核酸が、検出可能な標識に結合した5個の三次核酸がそれぞれの二次核酸にハイブリダイズすることを可能にするヌクレオチド配列を含むようにすることで、4×5レポータプローブを作り出すことができる。
【0192】
図5を参照すると、5×5レポータは蛍光標識(25個)を4×3レポータ(12個)よりも多く含有しているため、5×5レポータの蛍光強度はより大きくなろう。所与の視野FOVで検出される蛍光は、さまざまな変数(所与のレポータプローブの蛍光強度や、前記FOV内にあって場合によっては結合した標的分子の数が含まれる)の関数である。場合によっては結合した標的分子の視野(FOV)当たりの数は、FOV当たり標的が100万~250万個になる可能性がある。FOV当たりの結合した標的分子の典型的な数は、20,000~40,000個、220,000~440,000個、100万~200万個の標的分子である。典型的なFOVは0.05 mm2~1 mm2である。典型的なFOVのさらに別の例は0.05 mm2~0.65 mm2である。
【0193】
図6は、二次核酸分子が「追加ハンドル」を含むレポータプローブの設計を示している。この「追加ハンドル」は三次核酸分子にハイブリダイズせず、一次核酸分子の遠位にある。図6では、それぞれの「追加ハンドル」は長さが12個のヌクレオチド(「12量体」)だが、前記長さに制限はなく、12個未満のヌクレオチドや12個超のヌクレオチドが可能である。「追加ハンドル」は、それぞれが、一次核酸分子の第1のドメインのヌクレオチド配列を含むことができ、前記配列に二次核酸がハイブリダイズする。したがってレポータプローブが「追加ハンドル」を含んでいるとき、レポータプローブは、一次核酸分子の第1のドメインを介して、または「追加ハンドル」を介してシークエンシング用プローブにハイブリダイズすることができる。したがってレポータプローブがシークエンシング用プローブに結合する可能性が大きくなる。「追加ハンドル」のこの設計は、ハイブリダイゼーションの反応速度も改善することができる。いかなる理論にも囚われることなく、「追加ハンドル」はレポータプローブの相補的核酸の有効濃度を大きくすることができる。5×4「追加ハンドル」レポータプローブを用いると、標準的FOV当たり約4750蛍光カウントになることが予想される。5×3「追加ハンドル」レポータプローブ、4×4「追加ハンドル」レポータプローブ、4×3「追加ハンドル」レポータプローブ、3×4「追加ハンドル」レポータプローブを用いると、標準的FOV当たり約6000蛍光カウントになることが予想される。図5に示したレポータプローブの設計例も「追加ハンドル」を含むように改変することができる。
【0194】
レポータプローブの個々の二次核酸分子は、すべてが同じ検出可能な標識で標識された複数の三次核酸分子にハイブリダイズさせることができる。例えば図7の左図は、「5×6」レポータプローブを示している。5×6レポータプローブは、第2のドメインを含む1個の一次核酸を含んでおり、前記第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識が結合した5個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。特定の1個の二次核酸分子に結合する5個の三次核酸分子のそれぞれは、同じ検出可能な標識で標識されている。例えば二次核酸分子のうちの3個は黄色蛍光染料で標識した三次核酸分子に結合しており、残る3個の二次核酸分子は赤色蛍光で標識した三次核酸分子に結合している。
【0195】
レポータプローブの個々の二次核酸分子は、異なる検出可能な標識で標識した三次核酸分子にハイブリダイズすることができる。例えば図7の中央の図は、「3×2×6」レポータプローブの設計を示している。「3×2×6」レポータプローブは、第2のドメインを含む1個の一次核酸を含んでいて、前記第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸は、検出可能な標識に結合した5個の三次核酸分子がそれぞれの二次核酸分子にハイブリダイズできるようにするヌクレオチド配列を含んでいる。それぞれの二次核酸は、黄色蛍光染料で標識した三次核酸分子と、赤色蛍光染料で標識した三次核酸分子の両方に結合する。この特別な例では、3個の二次核酸分子が2個の赤色三次核酸分子と3個の黄色三次核酸分子に結合している一方で、残りの3個の二次核酸分子は2個の赤色三次核酸分子と3個の黄色三次核酸分子に結合している。それぞれの二次核酸分子は、異なる検出可能な標識で標識した任意の数の三次核酸分子に結合することができる。図7の中央の図では、個々の二次核酸分子に結合した三次核酸分子は、標識の色が交互に(すなわち赤-黄-赤-黄-赤または黄-赤-黄-赤-黄)なるように配置されている。
【0196】
記載したレポータプローブのどの設計でも、異なる検出可能な標識で標識した三次核酸を二次核酸に沿って任意の順番で配置することができる。例えば図7の右図は、3×2×6レポータプローブの設計と似た「FRET抵抗性3×2×6」レポータプローブを示しており、それぞれの二次核酸分子に沿った赤色三次核酸分子と黄色三次核酸分子の配置(例えば線形な順番またはグループ化)だけが異なっている。
【0197】
図8は、さまざまな三次核酸分子に結合する個々の二次核酸分子を含む本開示のさらに別のレポータプローブの設計を示している。左図は、1個の一次核酸分子を含む「6×1×4.5」レポータプローブを示しており、前記一次核酸分子は第2のドメインを含んでいて、この第2のドメインは、6個の二次核酸分子にハイブリダイズしたヌクレオチド配列を含んでいる。それぞれの二次核酸分子は、5個の三次核酸分子にハイブリダイズしている。それぞれの二次核酸分子にハイブリダイズした5個の三次核酸分子のうちの4個は、同じ色の検出可能な標識で直接標識されている。5番目の三次核酸分子(分岐三次核酸と呼ぶ)は、2色の組み合わせのうちの他方の色になった5個の標識されたオリゴに結合している。6個の二次核酸のうちの3個は、2色の組み合わせのうちの一方の色(この例では赤色)で標識した分岐三次核酸に結合しているのに対し、残りの3個の二次核酸は、2色の組み合わせのうちの他方の色(この例では黄色)で標識した分岐三次核酸に結合している。まとめると、6×1×4.5レポータプローブは合計54個の染料、それぞれの色について27個の染料で標識されている。図8の中央の図は、「4×1×4.5」レポータプローブを示している。この4×1×4.5レポータプローブは、6×1×4.5レポータプローブと同じ全体的アーキテクチャを共有しているが、一次核酸が4個の二次核酸にだけ結合するため、合計36個の染料、それぞれの色について18個の染料となる点が異なっている。
【0198】
レポータプローブは、2色の組み合わせのそれぞれの色について同数の染料を含むことができる。レポータプローブは、2色の組み合わせのそれぞれの色について異なる数の染料を含むことができる。1つのレポータプローブ内でどの色の染料をより多くするかの選択は、2つの染料が吸収する光のエネルギーレベルに基づいてなすことができる。例えば図8の右図は、「5×5エネルギー最適化」レポータプローブの設計を示している。このレポータプローブの設計は、(エネルギーがより高い)15個の黄色染料と(エネルギーがより低い)10個の赤色染料を含んでいる。この例では、15個の黄色染料が第1の標識を構成し、10個の赤色染料が第2の標識を構成することができる。
【0199】
検出可能な部分、標識、レポータのいずれかを、二次核酸分子、三次核酸分子、標識されたオリゴのいずれかに、検出可能な部分(蛍光部分、測色部分など)の直接的または間接的な付着を含むさまざまなやり方で結合させることができる。当業者は、核酸に標識することに関する参考文献を参照することができる。蛍光部分の非限定的な例に含まれるのは、黄色蛍光タンパク質(YFP)、緑色蛍光タンパク質(GFP)、シアン色蛍光タンパク質(CFP)赤色蛍光タンパク質(RFP)、ウンベリフェロン、フルオレセイン、イソチオシアン酸フルオレセイン、ローダミン、ジクロロトリアジニルアミンフルオレセイン、シアニン、塩化ダンシル、フィコシアニン、フィオエリトリンなどである。
【0200】
蛍光標識と、ヌクレオチドおよび/またはオリゴヌクレオチドへの前記蛍光標識の付着は多くの文献に記載されており、前記中に含まれるのは、Haugland、『Handbook of Fluorescent Probes and Research Chemicals』、第9版(Molecular Probes, Inc.社、ユージン、2002年);KellerとManak、『DNA Probes』、第2版(Stockton Press社、ニューヨーク、1993年);Eckstein編、『Oligonucleotides and Analogues: A Practical Approach』(IRL Press社、オックスフォード、1991年);Wetmur、Critical Reviews in Biochemistry and Molecular Biology、第26巻:227~259ページ(1991年)である。本開示に適用できる具体的な方法は、参考文献のサンプルであるアメリカ合衆国特許第4,757,141号;第5,151,507号;第5,091,519号に開示されている。標識された標的配列のための標識として1つ以上の蛍光染料を用いることができる。それが開示されているのは、例えばアメリカ合衆国特許第5,188,934号(4,7-ジクロロフルオレセイン染料);第5,366,860号(スペクトル分解可能なローダミン染料);第5,847,162号(4,7-ジクロロローダミン染料);第4,318,846 (エーテルで置換されたフルオレセイン染料);第5,800,996号(エネルギー移動染料);Lee他 第5,066,580号(キサンチン染料);第5,688,648号(エネルギー移動染料)などである。量子ドットを用いて標識することもできる。それは例えばアメリカ合衆国特許第6,322,901号;第6,576,291号;第6,423,551号;第6,251,303号;第6,319,426号;第6,426,513号;第6,444,143号;第5,990,479号;第6,207,392号;アメリカ合衆国特許出願公開第2002/0045045号;第2003/0017264号に開示されている。本明細書では、「蛍光標識」という用語に、1個以上の分子の蛍光吸収特性および/または蛍光発生特性を通じて情報を伝えるシグナル伝達部分が含まれる。前記ような蛍光特性には、蛍光強度、蛍光の寿命、発光スペクトルの性質、エネルギー移動などが含まれる。
【0201】
ヌクレオチド配列および/またはオリゴヌクレオチド配列に容易に組み込まれる市販の蛍光ヌクレオチド類似体の非限定的な例に含まれるのは、Cy3-dCTP、Cy3-dUTP、Cy5-dCTP、Cy5-dUTP(Amersham Biosciences社、ピスカタウェイ、ニュージャージー州)、フルオレセイン-12-dUTP、テトラメチルローダミン-6-dUTP、TEXAS RED(商標)-5-dUTP、CASCADE BLUE(商標)-7-dUTP、BODIPY TMFL-14-dUTP、BODIPY TMR-14-dUTP、BODIPY TMTR-14-dUTP、RHODAMINE GREEN(商標)-5-dUTP、OREGON GREENR(商標)488-5-dUTP、TEXAS RED(商標)-12-dUTP、BODIPY TM 630/650-14-dUTP、BODIPY TM 650/665-14-dUTP、ALEXA FLUOR(商標)488-5-dUTP、ALEXA FLUOR(商標)532-5-dUTP、ALEXA FLUOR(商標)568-5-dUTP、ALEXA FLUOR(商標)594-5-dUTP、ALEXA FLUOR(商標)546-14-dUTP、フルオレセイン-12-UTP、テトラメチルローダミン-6-UTP、TEXAS RED(商標)-5-UTP、mCherry、CASCADE BLUE(商標)-7-UTP、BODIPY TM FL-14-UTP、BODIPY TMR-14-UTP、BODIPY TM TR-14-UTP、RHODAMINE GREEN(商標)-5-UTP、ALEXA FLUOR(商標)488-5-UTP、LEXA FLUOR(商標)546-14-UTP(Molecular Probes, Inc.社、ユージン、オレゴン州)などである。あるいは上記の蛍光体と本明細書で言及した蛍光体をオリゴヌクレオチド合成の間に例えばホスホロアミダイトまたはNHS化学を利用して付加することができる。他の蛍光体を有するヌクレオチドのカスタム合成に関するプロトコルが本分野で知られている(Henegariu他(2000年)Nature Biotechnol. 第18巻:345ページを参照されたい)。2-アミノプリンは、合成中にオリゴヌクレオチド配列に直接組み込むことのできる蛍光性塩基である。核酸をあらかじめインターカレーティング染料(DAPI、YOYO-1、臭化エチジウム、シアニン染料(例えばSYBR Green)など)で染色することもできよう。
【0202】
合成後に付着させるのに利用できる他の蛍光体の非限定的な例に含まれるのは、ALEXA FLUOR(商標)350、ALEXA FLUOR(商標)405、ALEXA FLUOR(商標)430、ALEXA FLUOR(商標)532、ALEXA FLUOR(商標)546、ALEXA FLUOR(商標)568、ALEXA FLUOR(商標)594、ALEXA FLUOR(商標)647、BODIPY 493/503、BODIPY FL、BODIPY R6G、BODIPY 530/550、BODIPY TMR、BODIPY 558/568、BODIPY 558/568、BODIPY 564/570、BODIPY 576/589、BODIPY 581/591、BODIPY TR、BODIPY 630/650、BODIPY 650/665、Cascade Blue、Cascade Yellow、Dansyl、リッサミンローダミンB、Marina Blue、Oregon Green 488、Oregon Green 514、Pacific Blue、Pacific Orange、ローダミン6G、ローダミン・グリーン、ローダミン・レッド、テトラメチルローダミン、Texas Red(Molecular Probes, Inc. 社、ユージン、オレゴン州から入手可能)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7(Amersham Biosciences社、ピスカタウェイ、ニュージャージー州)などである。FRETタンデム蛍光体も用いることができ、前記非限定的な例に含まれるのは、PerCP-Cy5.5、PE-Cy5、PE-Cy5.5、PE-Cy7、PE-Texas Red、APC-Cy7、PE-Alexa 染料(610、647、680)、APC-Alexa染料などである。
【0203】
金属である銀粒子または金粒子を用い、蛍光標識したヌクレオチド配列および/またはオリゴヌクレオチド配列からの信号を増強することができる(Lakowicz他(2003年)BioTechniques 第34巻:62ページ)。
【0204】
オリゴヌクレオチド配列にとって適切な他の標識に含めることができるのは、フルオレセイン(FAM、FITC)、ジゴキシゲニン、ジニトロフェノール(DNP)、ダンシル、ビオチン、ブロモデオキシウリジン(BrdU)、ヘキサヒスチジン(6×His)、リン-アミノ酸(例えばP-tyr、P-ser、P-thr)などである。以下のハプテン/抗体ペア、すなわちビオチン/a-ビオチン、ジゴキシゲニン/a-ジゴキシゲニン、ジニトロフェノール(DNP)/a-DNP、5-カルボキシフルオレセイン(FAM)/a-FAMを検出に用いることができる。前記ペアの中の抗体のそれぞれは、検出可能な標識で誘導体化されている。
【0205】
本明細書に記載した検出可能な標識はスペクトル分解が可能である。複数の蛍光標識に関する「スペクトル分解可能な」は、それら標識の蛍光発光バンドが十分に明確であるため、すなわち重複のないことが十分であるため、それぞれの標識を付着させた分子タグを、それぞれの標識から発生した蛍光信号に基づき、例えば帯域通過フィルタと光増倍管などからなるシステムを用いた標準的な光検出系によって識別できることを意味する。前記ようなシステムの例は、アメリカ合衆国特許第4,230,558号;第4,811,218号など、または『Flow Cytometry: Instrumentation and Data Analysis』(Academic Press社、ニューヨーク、1985年)の中のWheeless他、21~76ページに記載されている。スペクトル分解可能な有機染料(フルオレセイン、ローダミンなど)は、最大発光波長が互いに少なくとも20 nm離れていることを意味し、別の側面では、互いに少なくとも40 nm離れていることを意味する。キレート化されたランタニド化合物や量子ドットなどに関しては、スペクトル分解可能なは、最大発光波長が互いに少なくとも10 nm離れていること、または互いに少なくとも15 nm離れていることを意味する。
【0206】
レポータプローブは、1つ以上の切断可能なリンカー修飾を含むことができる。前記1つ以上の切断可能なリンカー修飾は、レポータプローブの中の任意の場所に位置させることができる。切断可能なリンカー修飾は、レポータプローブの一次核酸分子の第1のドメインと第2のドメインの間に位置させることができる。図9は、一次核酸分子の第1のドメインと第2のドメインの間にリンカー修飾を含む本開示のレポータプローブの一例を示している。切断可能なリンカー修飾は、レポータプローブの二次核酸分子の第1のドメインと第2のドメインの間に存在することができる。切断可能なリンカー修飾は、レポータプローブの一次核酸分子と二次核酸分子の第1のドメインと第2のドメインの間に存在することができる。図10の左図は、一次核酸の第1のドメインと第2のドメインの間と、二次核酸の第1のドメインと第2のドメインの間に切断可能なリンカー修飾を含む本開示のレポータプローブの一例を示している。
【0207】
切断可能なリンカー修飾として、式(I)の化合物:
【化3】
または前記立体異性体または塩が可能である。ここで、この式においてR1は、水素、ハロゲン、C1-6アルキル、C2-6アルケニル、C2-6アルキニルであり、前記中のC1-6アルキル、C2-6アルケニル、C2-6アルキニルは、それぞれ独立に、少なくとも1個の置換基R10で場合によっては置換されており;R2は、O、NH、N(C1-6アルキル)のいずれかであり;R3は、シクロアルキル、ヘテロシクロアルキル, アリール、ヘテロアリールのいずれかであり、前記それぞれは、場合によっては少なくとも1個の置換基R10で置換されており;それぞれのR4とR7は独立に、C1-6 アルキル、C2-6 アルケニル、C2-6 アルキニルであり、前記中のC1-6アルキル、C2-6アルケニル、C2-6アルキニルは、それぞれ独立に、場合によっては少なくとも1個の置換基R10で置換されており;R5とR9は、それぞれ独立に、シクロアルキル、ヘテロシクロアルキル、アリール、ヘテロアリールのいずれかであり、前記それぞれは、場合によっては少なくとも1個の置換基R10で置換されており;R6は、O、NH、N(C1-6 アルキル)のいずれかであり;R8は、O、NH、N(C1-6アルキル) のいずれかであり;それぞれのR10は独立に、水素、ハロゲン、-C1-6アルキル、-C2-6アルケニル、-C2-6アルキニル、ハロC1-6アルキル、ハロC2-6アルケニル、ハロC2-6アルキニル、シクロアルキル、ヘテロシクリル、アリール、ヘテロアリール、-CN、-NO2、オキソ、-OR11、-SO2R11、-SO3 -、-COR11、-CO2R11、-CONR11R12、-C(=NR11)NR12R13、-NR11R12、-NR12COR12、-NR11CONR12R13、-NR11CO2R12、-NR11SONR12R13、-NR11SO2NR12R13、-NR11SO2R12のいずれかであり;R11、R12、R13は、同じでも異なっていてもよく、それぞれ独立に、水素、-C1-6アルキル、-C2-6アルケニル、-C2-6アルキニル、ハロC1-6アルキル、ハロC2-6アルケニル、ハロC2-6アルキニル、C1-6アルキルオキシC1-6アルキル-、シクロアルキル、ヘテロシクリル、アリール、ヘテロアリールのいずれかである。
【0208】
1つの側面では、R1はC1-6アルキルであり、C1-3アルキル(メチル、エチル、プロピル、イソプロピルなど)が好ましく;R2はNHまたはNであり;R3は5員または6員のシクロアルキルであり、シクロヘキシルが好ましく;R4はC1-6アルキルであり、C1-3アルキレン(メチレン、エチレン、プロピレン、イソプロピレンなど)が好ましく;R5は5員または6員のヘテロシクリルであり、1個の窒素原子と、N、O、Sから選択した0個または1個の追加のヘテロ原子を含んでいて、前記ヘテロシクリルは、場合によっては1個または2個のR10で置換されており;R6はOであり;R7はC1-6アルキルであり、 C1-3 アルキレン(メチレン、エチレン、プロピレン、イソプロピレンなど)が好ましく;R8はOであり;R9は5員または6員のヘテロシクリルであり、1個の窒素原子と、N、O、Sから選択した0個または1個の追加のヘテロ原子を含んでいて、前記ヘテロシクリルは、場合によっては1個または2個のR10で置換されており;それぞれのR10は独立に、ハロゲン、C1-6アルキル、ハロC1-6アルキル、オキソ、-SO2H、-SO3 -のいずれかである。
【0209】
1つの側面では、R3はシクロヘキシルであり、R4はメチレンであり、R5は1H-ピロール-2,5-ジオンであり、R9はピロリジン-2,5-ジオンであり、場合によってはSO3 -で置換されている。
【0210】
リンカー化合物として、
【化4】
または前記立体異性体または塩が可能である。
【0211】
リンカー化合物として、
【化5】
または前記立体異性体または塩が可能である。
【0212】
リンカー化合物またはリンカー修飾として、
【化6】
のいずれかが可能である。
【0213】
リンカー化合物またはリンカー修飾として、
【化7】
のいずれかが可能である。
【0214】
レポータプローブは、3種類の貯蔵溶液を水と互いに混合することによって構成することができる。1つの貯蔵溶液は一次核酸分子を含有し、1つの貯蔵溶液は二次核酸分子を含有し、最後の貯蔵溶液は三次核酸分子を含有している。表2に、個々の設計のレポータプローブを構成するために混合することのできる各貯蔵溶液の量の例を示してある。
【表2】
【0215】
標的核酸
【0216】
本開示により、本開示のシークエンシング用プローブを用いて核酸をシークエンシングする方法が提供される。本開示の方法を利用してシークエンシングする核酸を本明細書では「標的核酸」と呼ぶ。「標的核酸」という用語は、本開示のプローブ、方法、装置によって配列を求める核酸分子(DNA、RNA、PNA)を意味する。一般に、「標的核酸」、「標的核酸分子」、「標的核酸配列」、「標的核酸断片」、「標的オリゴヌクレオチド」、「標的ポリヌクレオチド」という用語は交換可能に用いられ、前記非限定的な例に、さまざまな長さを持つことのできるポリマー形態のヌクレオチド(デオキシリボヌクレオチドまたはリボヌクレオチド、または前記類似体)が含まれることを想定している。核酸の非限定的な例に含まれるのは、遺伝子、遺伝子断片、エキソン、イントロン、遺伝子間DNA(前記非限定的な例に異質染色質DNAが含まれる)、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、小さな干渉性RNA(siRNA)、非コードRNA(ncRNA)、cDNA、組み換えポリヌクレオチド、分岐したポリヌクレオチド、プラスミド、ベクター、ある配列の単離されたDNA、ある配列の単離されたRNA、核酸プローブ、プライマーである。本開示の方法を利用してシークエンシングする前に、標的核酸の属性および/または配列はわかっている。あるいは前記属性および/または配列は未知である。本開示の方法を利用したシークエンシングの前に標的核酸の配列の一部がわかっていることも可能である。例えばこの方法は、既知の標的核酸分子の点変異を求めるのに利用することができる。
【0217】
本開示の方法は、サンプル(例えば生物からのサンプル)から得られた核酸分子を直接シークエンシングし、変換(または増幅)工程は存在しないことが好ましい。一例として、直接的なRNAに基づくシークエンシングを実施するのに、本開示の方法は、配列を取得できるようになる前にRNA分子からDNA分子への(すなわちcDNAの合成を通じた)変換を必要としない。増幅または変換が必要ないため、本開示でシークエンシングされる核酸は、核酸がサンプルの中に存在している場合やサンプルから得られる場合には、核酸の中に存在するあらゆる独自の塩基および/またはエピジェネティックなマーカーを保持することになろう。前記ような独自の塩基および/またはエピジェネティックなマーカーは、本分野において既知のシークエンシング法では失われる。
【0218】
本開示の方法を利用すると1分子の解像度でシークエンシングすることができる。言い換えると、本開示の方法により、利用者は、異なる標的核酸分子からのデータを組み合わせる必要がなく、単一の標的核酸分子から回収したデータに基づいて最終的な配列を生み出すことが可能になるため、前記特定の標的の独自の特徴がすべて保持される。
【0219】
標的核酸は、核酸の任意のサンプルまたは供給源(例えば任意の細胞、組織、生物、インビトロ、化学的合成装置など)から取得することができる。標的核酸は、本分野で認められている任意の方法で得ることができる。標的核酸は、臨床対象の血液サンプルから取得することができる。標的核酸は、本分野で周知の方法とキットを利用して、供給源またはサンプルから抽出すること、または単離すること、または精製することができる。
【0220】
標的核酸は、本分野で知られている任意の手段で断片化することができる。断片化は、酵素的手段または機械的手段で実施することが好ましい。機械的手段として、超音波処理または物理的剪断が可能である。酵素的手段は、ヌクレアーゼ(例えばデオキシリボヌクレアーゼI(DNアーゼI))または1つ以上の制限エンドヌクレアーゼを用いた消化によって実施することができる。
【0221】
標的核酸を含む核酸分子が1つの完全な染色体であるときには、前記染色体の断片化を避ける工程を採用すべきである。
【0222】
本分野で周知のように、標的核酸には天然のヌクレオチドまたは非天然のヌクレオチドを含めることができ、前記中には修飾されたヌクレオチドまたは核酸類似体が含まれる。
【0223】
標的核酸分子に含めることができるのは、長さが数百キロ塩基(例えば1キロ塩基、2キロ塩基、3キロ塩基、4キロ塩基、5キロ塩基、10キロ塩基、20キロ塩基、30キロ塩基、40キロ塩基、50キロ塩基、100キロ塩基、200キロ塩基、500キロ塩基、またはそれよりも大きな数)までのDNA分子、RNA分子、PNA分子である。
【0224】
捕獲用プローブ
【0225】
標的核酸は基板に(例えば1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多くの位置で)固定化することができる。
【0226】
有用な基板の例に含まれるのは結合部分を含むものであり、前記結合部分の選択は、リガンド、光源、炭水化物、核酸、受容体、レクチン、抗体からなるグループからなされる。捕獲用プローブは、基板の結合部分に結合することのできる基板結合部分を含んでいる。反応性部分を含む有用な基板の非限定的な例に含まれるのは、エポキシ、アルデヒド、金、ヒドラジド、スフルヒドリル、NHS-エステル、アミン、アルキン、アジド、チオール、カルボキシレート、マレイミド、ヒドロキシメチルホスフィン、イミドエステル、イソシアネート、ヒドロキシル、ペンタフルオロフェニル-エステル、ソラーレン、ピリジルジスルフィドまたはビニルスルホン、ポリエチレングリコール(PEG)、ヒドロゲルのいずれか、またはこれらの混合物を含む表面である。このような表面は、市販の供給源から得ること、または標準的な技術に従って用意することができる。反応性部分を含む有用な基板の非限定的な例に含まれるのは、OptArray-DNA NHSグループ(Accler8社)、Nexterion Slide AL(Schott社)、Nexterion Slide E(Schott社)である。
【0227】
基板として、本分野で知られていて標的核酸を固定化することのできる任意の堅固な支持体(例えば被覆されたスライドやマイクロ流体装置)が可能である。基板として、表面、膜、ビーズ、多孔性材料、電極、アレイが可能である。基板として、例えばポリマー材料、金属、ケイ素、ガラス、石英が可能である。標的核酸は、当業者にとって明らかな任意の基板の表面に固定化することができる。
【0228】
基板がアレイであるときには、基板はウエルを含むことができ、前記サイズと間隔は、付着させる標的核酸分子によって異なる。一例では、基板は、超高密度に秩序化された標的核酸のアレイが付着するように構成する。基板上の標的核酸アレイの密度の例に含まれるのは、1 mm2当たり500,000個~10,000,000個の標的核酸分子、または1,000,000個~4,000,000個の標的核酸分子、または850,000個~3,500,000個の標的核酸分子である。
【0229】
基板の中のウエルは、標的核酸分子を付着させる位置である。ウエルの表面を上に説明した反応性部分を用いて機能化し、標的核酸分子の表面に存在するか標的核酸分子に結合した捕獲用プローブの表面に存在する特定の化学基を引き付けて結合させることで、標的核酸分子を引き付け、固定化し、結合させる。これら官能基は、生体分子をさまざまな共役化学を通じて特異的に引き付けて結合させうることがよく知られている。
【0230】
基板(アレイなど)の上で1個の核酸分子をシークエンシングするには、ユニバーサルな捕獲用プローブを、または捕獲用プローブの基板結合部分と相補的なユニバーサル配列を、各ウエルに付着させる。次に1個の標的核酸分子を、ユニバーサルな捕獲用プローブに、または捕獲用プローブの基板結合部分と相補的で前記捕獲用プローブに結合したユニバーサル配列に結合させると、シークエンシングを開始することができる。
【0231】
標的核酸分子には1つ以上の捕獲用プローブ(すなわち2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、またはそれよりも多い数の捕獲用プローブ)を結合させることができる。捕獲用プローブは、標的核酸の一部と相補的なドメインと、基板結合部分を含むドメインとを含んでいる。標的核酸のうちで捕獲用プローブと相補的な部分として、標的核酸の末端、または末端近くでない部分が可能である。
【0232】
捕獲用プローブの基板結合部分としてビオチンが可能であり、基板としてアビジン(例えばストレプトアビジン)が可能である。アビジンを含む有用な基板は市販されており、前記中に含まれるのは、TB0200(Accler8社)、SAD6、SAD20、SAD100、SAD500、SAD2000(Xantec社)、SuperAvidin(Array-It社)、ストレプトアビジンスライド(カタログ番号MPC 000、Xenopore社)、STREPTAVIDINnslide(カタログ番号439003、Greiner Bio-one社)である。捕獲用プローブの基板結合部分としてアビジン(例えばストレプトアビジン)が可能であり、基板としてとしてビオチンが可能である。ビオチンを含んでいて市販されている有用な基板の非限定的な例に含まれるのは、Optiarray-ビオチン(Accler8社)、BD6、BD20、BD100、BD500、BD2000(Xantec社)である。
【0233】
捕獲用プローブの基板結合部分として、光活性化によって基板に結合することのできる反応性部分が可能である。基板は光反応性部分を含むことができる。あるいはナノレポータの第1の部分が光反応性部分を含むことができる。光反応性部分のいくつかの例に含まれるのは、アリールアジド(N((2-ピリジルジチオ)エチル)-4-アジドサリチルアミドなど);フッ素化アリールアジド(4-アジド-2,3,5,6-テトラフルオロ安息香酸など);ベンゾフェノンに基づく試薬(4-ベンゾイル安息香酸スクシンイミジルエステルなど);5-ブロモ-デオキシウリジンである。
【0234】
捕獲用プローブの基板結合部分として、基板の相補的な結合部分にハイブリダイズすることのできる核酸が可能である。捕獲用プローブの基板結合部分を含む核酸のそれぞれとして、独立に、正規塩基、または修飾されたヌクレオチド、または核酸類似体が可能である。捕獲用プローブの基板結合部分の中の少なくとも1個、または少なくとも2個、または少なくとも3個、または少なくとも4個、または少なくとも5個、または少なくとも6個のヌクレオチドとして、修飾されたヌクレオチド、または核酸類似体が可能である。捕獲用プローブの基板結合部分の中の修飾されたヌクレオチドまたは核酸類似体と正規塩基の典型的な比率は、1:2~1:8である。捕獲用プローブの基板結合部分で有用な典型的な修飾されたヌクレオチドまたは核酸類似体は、イソグアニンとイソシトシンである。
【0235】
捕獲用プローブの基板結合部分は、当業者にとって明らかな他の結合ペアを介して基板に固定化することができる。標的核酸は、基板に結合させた後、標的核酸を伸長させるのに十分な力(例えば重力、流体力、電磁力「エレクトロストレッチング」、フロー-ストレッチング、後退メニスカス(receding meniscus)技術、これらの組み合わせ)を加えることによって伸長させることができる。捕獲用プローブは、検出可能な標識(すなわち基準スポット)を含むこと、または検出可能な標識と関連させることができる。
【0236】
標的核酸には、標的核酸の第2の部分と相補的なドメインを含む第2の捕獲用プローブを結合させることができる。第2の捕獲用プローブが結合する標的核酸の第2の部分は、第1の捕獲用プローブが結合する標的核酸の第1の部分とは異なる。この部分として、標的核酸の末端、または末端近くでない部分が可能である。第2の捕獲用プローブの結合は、標的核酸の伸長後、または伸長中に起こること、または伸長し終わっていない標的核酸に対して起こることができる。第2の捕獲用プローブは、上記のような結合を持つことができる。
【0237】
標的核酸には、標的核酸の第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の部分と相補的なドメインを含む第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブを結合させることができる。この部分として、標的核酸の末端、または末端近くでない部分が可能である。第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブの結合は、標的核酸の伸長後、または伸長中に起こること、または伸長し終わっていない標的核酸に対して起こることができる。第3、または第4、または第5、または第6、または第7、または第8、または第9、または第10の捕獲用プローブは、上記のような結合を持つことができる。
【0238】
捕獲用プローブは標的核酸をサンプルから単離することができる。ここでは標的核酸を含むサンプルに捕獲用プローブを添加する。捕獲用プローブは、捕獲用プローブのうちで標的核酸の1つの領域と相補的な領域を介して標的核酸と結合する。捕獲用プローブの基板結合部分と結合する部分を含む基板と標的核酸が接触すると、核酸は基板の表面に固定化される。
【0239】
図11は、本開示による2つの捕獲用プローブシステムを用いた1個の標的核酸の捕獲を示している。ゲノムDNAを95℃で変性させ、捕獲試薬のプールにハイブリダイズさせる。捕獲試薬のこのプールは、オリゴヌクレオチド、プローブA、プローブB、アンチセンスブロックプローブを含んでいる。プローブAは、このプローブの3'末端にあるビオチン部分と、標的核酸の5'末端と相補的な配列とを含んでいる。プローブBは、このプローブの5'末端に常磁性ビーズを結合させることのできる精製結合配列と、標的核酸の3'末端と相補的なヌクレオチド配列とを含んでいる。アンチセンスブロックプローブは、標的核酸のうちでシークエンシングする部分のアンチセンス鎖と相補的なヌクレオチド配列を含んでいる。捕獲試薬とハイブリダイズさせた後、ハイブリダイズしたプローブAとプローブBの間の標的核酸にシークエンシングウインドウを作る。プローブBの5'配列に結合する常磁性ビーズを用いて標的核酸を精製する。過剰なあらゆる捕獲試薬または相補的アンチセンスDNA鎖を洗浄除去すると、求める標的核酸が精製される。次に、精製された標的核酸が、ハイブリダイズしたプローブA上のビオチン部分に結合することのできる表面(ストレプトアビジンなど)を含むフローセルを通過するようにする。すると標的核酸の一端がフローセルの表面とつながる。他端を捕獲するには、標的核酸をフロー-ストレッチングさせ、プローブBの精製結合配列と相補的なビオチニル化されたプローブを添加する。ビオチニル化されたプローブは、プローブBの精製結合配列とハイブリダイズするとフローセルの表面に結合することができ、前記結果として、伸長していてフローセルの表面に両端が結合した捕獲された標的核酸になる。
【0240】
利用者が高度に断片化されたサンプルからできるだけ多くの標的核酸分子を確実に「捕獲する」ためには、複数の捕獲用プローブが含まれていて、それぞれの捕獲用プローブが標的核酸の異なる領域と相補的になるようにすることが有用である。例えば捕獲用プローブの3つのプールが存在することが可能であり、そのうちの第1のプールは標的核酸のうちで5'末端近くの領域と相補的であり、第2のプールは標的核酸のうちで中央部の領域と相補的であり、第3のプールは標的核酸のうちで3'末端近くの領域と相補的である。これは、1つの標的核酸につき「興味あるn個の領域」に一般化することができる。この例では、断片化された標的核酸の個々のプールが、ビオチンタグを含むかビオチンタグに結合した捕獲用プローブに結合する。入力サンプルの1/n(nは標的核酸の中の異なる領域の数である)を各プール室で単離する。捕獲用プローブは興味ある標的核酸に結合する。次に標的核酸を、捕獲用プローブのビオチンを介し、基板に付着させたアビジン分子に固定化する。場合によっては、標的核酸を例えば流体力または静電力を通じて伸長させる。n個のプールすべてを同時に伸長させて結合させることや、完全に伸長した分子の数を最大にするため、(大半の5'領域を捕獲する)プール1を伸長させて最初に結合させた後、(標的の中央領域を捕獲する)プール2を伸長させて結合させ、最後にプール3を伸長させて結合させることができる。
【0241】
本開示により、利用者は、複数の標的核酸を捕獲すると同時にシークエンシングすることや、複数の捕獲用プローブを複数の標的核酸が混合されたサンプルにハイブリダイズさせることも可能になる。複数の標的核酸には、それぞれの核酸が同じ配列を含む2つ以上の核酸からなるグループ、またはそれぞれの核酸が必ずしも同じ配列を含んでいない2つ以上の核酸からなるグループを含めることができる。同様に、複数の標的核酸には、配列が同じ2つ以上の捕獲用プローブからなるグループ、または配列が必ずしも同じではない2つ以上の捕獲用プローブからなるグループを含めることができる。例えばどれもが同じ配列を含む複数の捕獲用プローブを用いると、利用者は、どれもが同じ配列を含む複数の標的核酸を捕獲することができる。同じ配列を含むこの複数の標的核酸をシークエンシングすると、データが冗長であるために高レベルのシークエンシング精度を達成することができる。別の一例では、興味ある各遺伝子と相補的な捕獲用プローブを含む一群の捕獲用プローブを用いると、興味ある2つ以上の特定の遺伝子を捕獲すると同時にシークエンシングすることができる。こうすることで、利用者は、特定の遺伝子の多重シークエンシングを実施することができる。図12は、FFPEサンプルを用いた100個の標的からなる多重がんパネルを本開示の方法で捕獲して検出する実験からの結果を示している。
【0242】
全範囲をシークエンシングすることが望ましい場合には、必要とされる別々の捕獲用プローブの数は、標的核酸の断片のサイズと逆になる関係がある。言い換えると、高度に断片化された標的核酸ではより多くの捕獲用プローブが必要になろう。高度に断片化され分解されている標的核酸を含むタイプのサンプル(例えばホルマリン固定パラフィン包埋組織)では、捕獲用プローブのプールを多数含めると有用である可能性がある。逆に、標的核酸の断片が長いサンプル(例えばインビトロで得られた単離された核酸)では、5'末端位置の1つの捕獲用プローブで十分である可能性がある。
【0243】
標的核酸のうちで2つの捕獲用プローブに挟まれた領域、または1つの捕獲用プローブの後かつ標的核酸の末端の前の領域を「シークエンシングウインドウ」と呼ぶ。図11では、2つの捕獲用プローブを用いて1個の標的核酸を捕獲するときに生じるシークエンシングウインドウに標識している。シークエンシングウインドウは、標的核酸のうちでシークエンシング用プローブが結合に利用できる部分である。最小シークエンシングウインドウは標的結合ドメインの長さ(例えば4~10個のヌクレオチド)であり、最大シークエンシングウインドウは1つの染色体全体の大半である。
【0244】
本開示の方法を利用して大きな標的核酸分子をシークエンシングするとき、1個の「ブロッカーオリゴ」または複数のブロッカーオリゴを標的核酸の長さに沿ってハイブリダイズさせてシークエンシングウインドウのサイズを制御することができる。ブロッカーオリゴは標的核酸に特定の位置でハイブリダイズし、前記ことによってシークエンシング用プローブがそれらの位置に結合することを阻止し、興味あるより小さなシークエンシングウインドウが作り出される。図13は、捕獲された2個の標的DNA分子が捕獲用プローブとブロッカーオリゴとシークエンシング用プローブにハイブリダイズしている模式図を示している。より小さなシークエンシングウインドウを作り出すことによってシークエンシング反応は標的DNA分子の興味ある特定の領域に限定されるため、シークエンシングの速度と精度が向上する。ブロッカーオリゴの使用は、標的核酸の中の既知の位置における特定の変異をシークエンシングするときに特に有用である。というのも標的核酸全体をシークエンシングする必要がないからである。図13の例は、2つの異なるハプロタイプを識別することを目的として2つの異種部位を標的としたシークエンシングを示している。
【0245】
本開示の方法
【0246】
本開示のシークエンシング法は、本明細書に開示した少なくとも1つのシークエンシング用プローブを標的核酸に可逆的にハイブリダイズさせることを含んでいる。
【0247】
核酸のシークエンシング法は、(1)本明細書に記載したシークエンシング用プローブを標的核酸にハイブリダイズさせることを含むことができる。標的核酸は、場合によっては基板に1つ以上の位置で固定化することができる。シークエンシング用プローブの一例は、標的結合ドメインとバーコードドメインを含むことができ;標的結合ドメインは標的核酸にハイブリダイズした少なくとも8個のヌクレオチドを含んでいて、前記標的結合ドメインの中の少なくとも6個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することができ(例えば標的結合ドメインの配列が正確に6個のヌクレオチドであるときには、これら6個のヌクレオチドが、標的結合ドメインがハイブリダイズした標的分子と相補的な6個のヌクレオチドを同定する)、前記標的結合ドメインの中の少なくとも2個のヌクレオチドは、標的核酸分子の中の対応するヌクレオチドを同定することがなく(例えばこれら少なくとも2個のヌクレオチドは、標的結合ドメインがハイブリダイズした標的分子と相補的な2個のヌクレオチドを同定することがない);前記標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの少なくとも2個のヌクレオチドは、修飾されたヌクレオチドまたはヌクレオチド類似体であり;バーコードドメインは合成骨格を含んでいて、前記バーコードドメインは少なくとも3つの付着位置を含み、それぞれの付着位置は、相補的核酸分子が結合することのできる少なくとも1つの核酸配列を含む少なくとも1つの付着領域を含み、前記少なくとも3つの付着位置のそれぞれは、標的結合ドメインの中の前記少なくとも6個のヌクレオチドのうちの2個のヌクレオチドに対応するとともに、前記少なくとも3つの付着位置のそれぞれは異なる核酸配列を持ち、前記少なくとも3つの付着位置の各位置の核酸配列が、標的結合ドメインが結合する標的核酸の中の前記少なくとも6個のヌクレオチドのうちの対応する2個のヌクレオチドの位置と属性を決めている。
【0248】
この方法は、シークエンシング用プローブを標的核酸にハイブリダイズさせた後、(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定することを含んでいる。例えば第1の相補的核酸分子が2つの検出可能な標識を含んでいるときには、それら2つの検出可能な標識が、固定化された核酸分子の中の前記少なくとも2個のヌクレオチドを同定する。
【0249】
前記少なくとも2つの検出可能な標識を検出した後、前記少なくとも2つの検出可能な標識を第1の相補的核酸分子から除去する。したがってこの方法はさらに、(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させることを含んでいる。したがって工程(5)の後に第1の検出可能な標識は第1の付着位置に結合しない。この方法はさらに、(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(10)場合によっては固定化された標的核酸からシークエンシング用プローブを除去することを含んでいる。
【0250】
この方法はさらに、(11)第2のシークエンシング用プローブを、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブを除去することを含んでいる。
【0251】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0252】
工程(5)と(6)は順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0253】
第1の相補的核酸は、切断可能なリンカーを含むことができる。第2の相補的核酸は、切断可能なリンカーを含むことができる。第1の相補的核酸と第2の相補的核酸は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能であることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0254】
第1の相補的核酸と、検出可能な標識を欠く第1のハイブリダイズする核酸は、同じ核酸配列を含むことができる。例えば検出可能な標識を欠く第1のハイブリダイズする核酸は、バーコードドメインの少なくとも3つの位置のうちの第1の付着位置に結合する第1の相補的核酸分子の部分と同じ核酸配列を含むことができる。検出可能な標識を欠く第1のハイブリダイズする核酸は、バーコードドメインの中の第1の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0255】
第2の相補的核酸と、検出可能な標識を欠く第2のハイブリダイズする核酸は、同じ核酸配列を含むことができる。検出可能な標識を欠く第2のハイブリダイズする核酸は、バーコードドメインの中の第2の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0256】
本発明によりさらに、本明細書に開示されているシークエンシング用プローブを複数利用して核酸をシークエンシングする方法が提供される。例えば標的核酸を2つ以上のシークエンシング用プローブハイブリダイズさせると、各プローブは、標的核酸のうちで前記プローブがハイブリダイズした部分をシークエンシングすることができる。
【0257】
本発明により、核酸をシークエンシングする方法として、(1)本明細書に記載したシークエンシング用プローブを複数含む第1のシークエンシング用プローブの少なくとも1つの第1の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ;(2)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(3)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(4)固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(5)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(6)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(7)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(8)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(9)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(5)~(8)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第1の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し; (10)場合によっては固定化された標的核酸から第1のシークエンシング用プローブの少なくとも第1の集団を除去することを含む方法も提供される。
【0258】
この方法はさらに、(11)本明細書に記載したシークエンシング用プローブを複数含む第2のシークエンシング用プローブの少なくとも1つの第2の集団を、場合によっては基板に1つ以上の位置で固定化された標的核酸にハイブリダイズさせ(ここで、第1のシークエンシング用プローブと第2のシークエンシング用プローブの標的結合ドメインは異なっている);(12)第1の検出可能な標識と少なくとも第2の検出可能な標識を含む第1の相補的核酸分子を、バーコードドメインの少なくとも3つの付着位置のうちの第1の付着位置に結合させ;(13)結合した第1の相補的核酸分子の第1の検出可能な標識と少なくとも第2の検出可能な標識を検出し;(14)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(15)検出可能な標識が欠けた第1のハイブリダイズする核酸分子を第1の付着位置に結合させることによって検出可能な標識を含む第1の相補的核酸分子または複合体を自由な状態にするか、検出可能な標識を含む第1の相補的核酸分子または複合体を、第1の検出可能な標識と少なくとも第2の検出可能な標識を放出させるのに十分な力と接触させ;(16)第3の検出可能な標識と少なくとも第4の検出可能な標識を含む第2の相補的核酸分子をバーコードドメインの少なくとも3つの付着位置のうちの第2の付着位置に結合させ;(17)結合した第2の相補的核酸分子の第3の検出可能な標識と少なくとも第4の検出可能な標識を検出し;(18)場合によっては固定化された標的核酸の中の少なくとも2個のヌクレオチドの位置と属性を同定し;(19)バーコードドメインの中の少なくとも3つの付着位置のそれぞれに、2つの検出可能な標識を含む相補的核酸分子が結合し、結合した相補的核酸分子の前記2つの検出可能な標識が検出されるまで、工程(15)~(18)を繰り返すことにより、シークエンシング用プローブの標的結合ドメインにハイブリダイズした場合によっては固定化された標的核酸の少なくとも第2の領域のための少なくとも6個のヌクレオチドの線形な順番を同定し;(20)場合によっては固定化された標的核酸から第2のシークエンシング用プローブの少なくとも第2の集団を除去することを含むことができる。
【0259】
この方法はさらに、固定化された標的核酸の少なくとも第1の領域と少なくとも第2の領域の中でそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定することを含むことができる。
【0260】
工程(5)と(6)は、順番に、または同時に実施することができる。第1の検出可能な標識と少なくとも第2の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。第3の検出可能な標識と少なくとも第4の検出可能な標識は、同じ発光スペクトルを持つこと、または異なる発光スペクトルを持つことができる。
【0261】
第1の相補的核酸分子は、切断可能なリンカーを含むことができる。第2の相補的核酸分子は、切断可能なリンカーを含むことができる。第1の相補的核酸分子と第2の相補的核酸分子は、それぞれ切断可能なリンカーを含むことができる。切断可能なリンカーは、光で切断可能であることが好ましい。放出させる力として光が可能である。UV光が好ましい。光は、アークランプ、レーザー、集束UV光源、発光ダイオードからなるグループから選択された光源によって提供することができる。
【0262】
第1の相補的核酸分子と、検出可能な標識を欠く第1のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識を欠く第1のハイブリダイズする核酸分子は、バーコードドメインの中の第1の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0263】
第2の相補的核酸分子と、検出可能な標識を欠く第2のハイブリダイズする核酸分子は、同じ核酸配列を含むことができる。検出可能な標識を欠く第2のハイブリダイズする核酸分子は、バーコードドメインの中の第2の付着位置に隣接するフランキング一本鎖ポリヌクレオチドと相補的な核酸配列を含むことができる。
【0264】
このシークエンシング法を本明細書でさらに説明する。
【0265】
図14は、本開示のシークエンシング法の1つのサイクル全体の模式図を示している。本開示の方法ではシークエンシングの前に標的核酸を固定化する必要はないが、この例では、この方法は、左最上部の図にしてあるように、捕獲用プローブを用いて捕獲されてフローセルの表面に結合している標的核酸から始まる。次にシークエンシング用プローブのプールをフローセルの中に流入させてシークエンシング用プローブが標的核酸にハイブリダイズできるようにする。この例では、シークエンシング用プローブは図1に示したものである。これらシークエンシング用プローブは、標的核酸にハイブリダイズする標的結合ドメインの中に6量体配列を含んでいる。6量体はそれぞれの側に(N)塩基が隣接している。前記(N)塩基は、ユニバーサル塩基/縮重塩基であること、または塩基b1- b2- b3- b4- b5- b6によって指定されない標的に対して特異的ではない4種類の正規塩基のうちの任意のもので構成することが可能である。6量体配列を利用すると、4096(46)通りのシークエンシング用プローブのセットにより、任意の標的核酸をシークエンシングすることが可能になる。この例に関しては、4096通りのシークエンシング用プローブのセットが、512のシークエンシング用プローブからなる8つのプールそれぞれの中の標的核酸にハイブリダイズする。シークエンシング用プローブの標的結合ドメインの中の6量体配列は、図14の中央上の図に示してあるように、標的核酸の長さに沿って、前記6量体と標的核酸の間で完全に相補性が一致している位置でハイブリダイズすることになる。この例では、単一のシークエンシング用プローブが標的核酸にハイブリダイズする。結合しないあらゆるシークエンシング用プローブがフローセルから洗い流される。
【0266】
これらのシークエンシング用プローブは、上に記載したように3つの付着位置R1、R2、R3を有するバーコードドメインも含んでいる。付着位置R1の中の付着領域は、シークエンシング用プローブの6量体の第1のジヌクレオチドに対応する1つ以上のヌクレオチド配列を含んでいる。したがってシークエンシング用プローブの標的結合ドメインの中に存在する第1のジヌクレオチドの属性に対応する相補的核酸を含むレポータプローブだけが付着位置R1にハイブリダイズすることになろう。同様に、シークエンシング用プローブの付着位置R2の中の付着領域は、標的結合ドメインの中に存在する第2のジヌクレオチドに対応し、シークエンシング用プローブの付着位置R3の中の付着領域は、標的結合ドメインの中に存在する第3のジヌクレオチドに対応する。
【0267】
この方法は、図14の右最上部の図に続く。レポータプローブのプールをフローセルの中に流入させる。レポータプローブのプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R1の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、上に説明したように、可能な16通りのジヌクレオチドのうちの1つに対応する。レポータプローブの各プールは、特定のジヌクレオチドに対応する2色の組み合わせがシークエンシング前に確立されるように設計する。例えば図14に示したシークエンシング実験では、付着位置R1にハイブリダイズするレポータプローブの第1のプールに関しては、黄-赤という2色の組み合わせをアデニン-チミンというジヌクレオチドに対応させることができる。図14の右上図に示してあるようにレポータプローブが付着位置R1にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第1のジヌクレオチドの属性を求める。
【0268】
付着位置にハイブリダイズしたレポータプローブに属する検出可能な標識を除去する。検出可能な標識を除去するため、レポータプローブは切断可能なリンカーを含むことができて、それに適切な切断試薬の添加を加えることができる。あるいは検出可能な標識を欠く相補的核酸をシークエンシング用プローブの付着位置R1にハイブリダイズさせることで、検出可能な標識を有するレポータプローブと置き換える。検出可能な標識を除去する方法が何であれ、付着位置R1はもはや検出可能な信号を発生しない。以前に検出可能な信号を発生していたバーコードドメインの付着位置をもはや検出可能な信号を発生しないようにする方法を本明細書では「暗化」と呼ぶ。
【0269】
レポータプローブの第2のプールをフローセルの中に流入させる。レポータプローブのプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R2の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、可能な16通りのジヌクレオチドのうちの1つに対応する。特定の2色の組み合わせが、レポータプローブの第1のプールの文脈では1つのジヌクレオチドに対応し、レポータプローブの第2のプールの文脈では別のジヌクレオチドに対応することが可能である。図14の右下図に示してあるようにレポータプローブが付着位置R2にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第2のジヌクレオチドの属性を求める。
【0270】
位置R2の検出可能な標識を除去するため、レポータプローブは切断可能なリンカーを含むことができて、それに適切な切断試薬の添加を加えることができる。あるいは検出可能な標識を欠く相補的核酸をシークエンシング用プローブの付着位置R2にハイブリダイズさせることで、検出可能な標識を有するレポータプローブと置き換える。検出可能な標識を除去する方法が何であれ、付着位置R2はもはや検出可能な信号を発生しない。
【0271】
次にレポータプローブの第3のプールをフローセルの中に流入させる。第3のレポータプローブプールに含まれる各レポータプローブは、2色の組み合わせの形態になった検出可能な標識と、シークエンシング用プローブの付着位置R3の中の対応する付着領域にハイブリダイズすることのできる相補的核酸を含んでいる。2色の組み合わせと特定のレポータプローブの相補的核酸は、可能な16通りのジヌクレオチドのうちの1つに対応する。図14の中央下図に示してあるようにレポータプローブが位置R3にハイブリダイズした後、結合しないあらゆるレポータプローブをフローセルから洗い流し、結合したレポータプローブの検出可能な標識を記録して6量体の第3のジヌクレオチドの属性を求める。このようにして、標的結合ドメインの3つのジヌクレオチドがすべて同定されるため、それらをまとめて再構築して標的結合ドメインの配列を明らかにすること、したがって標的核酸の配列を明らかにすることができる。
【0272】
標的核酸のシークエンシングを続けるには、結合したあらゆるシークエンシング用プローブを標的核酸から除去することができる。レポータプローブがバーコードドメインの位置R3にハイブリダイズしたままである場合でさえ、シークエンシング用プローブを標的核酸から除去することができる。あるいは位置R3にハイブリダイズしたレポータプローブは、シークエンシング用プローブを標的結合ドメインから除去する前に、例えば位置R1とR2のレポータに関して上に説明した暗化手続きを利用してバーコードドメインから除去することができる。
【0273】
図14に示したシークエンシングサイクルは何回でも繰り返すことができ、各シークエンシングサイクルを、シークエンシング用プローブの同じプールを標的核酸分子にハイブリダイズさせることから始めたり、シークエンシング用プローブの異なるプールを標的核酸分子にハイブリダイズさせることから始めたりする。第1のシークエンシング用プローブ、または第1のシークエンシング用プローブのプールが第1のシークエンシングサイクルの間に標的核酸に結合した位置と重複する位置でシークエンシング用プローブの第2のプールが標的核酸に結合することが可能である。そうすることで、標的核酸の中のいくつかのヌクレオチドを2回以上シークエンシングすることと、2つ以上のシークエンシング用プローブを用いることができる。
【0274】
図15は、本開示のシークエンシング法の1つのサイクル全体の模式図と、このサイクルの間に回収された対応するイメージングデータを示している。この例では、使用するシークエンシング用プローブは図1に示したものであり、シークエンシング工程は、図14に示して上に説明したのと同じである。シークエンシング用プローブのシークエンシングドメインを標的核酸にハイブリダイズさせた後、レポータプローブをシークエンシング用プローブの第1の付着位置(R1)にハイブリダイズさせる。次に第1のレポータプローブの画像を取得して色ドットを記録する。図15では、色ドットを点線の円で示してある。色ドットは、1つのサイクル全体の間に記録される単一のシークエンシング用プローブに対応する。この例では、7つのシークエンシング用プローブを記録する(1~7)。次にバーコードドメインの第1の付着位置を暗化し、二重蛍光レポータプローブをシークエンシング用プローブの第2の付着位置(R2)にハイブリダイズさせる。次に第2のレポータプローブの画像を取得して色ドットを記録する。次にバーコードドメインの第2の付着位置を暗化し、二重蛍光レポータプローブをシークエンシング用プローブの第3の付着位置(R3)にハイブリダイズさせる。次に第3のレポータプローブの画像を取得して色ドットを記録する。次に各シークエンシング用プローブ1~7からの3つの色ドットを順番に並べる。次にデコーディングマトリックスを用いてそれぞれの色ドットを特定のジヌクレオチドにマッピングしてシークエンシング用プローブ1~7の標的結合ドメインの配列を明らかにする。
【0275】
1つのシークエンシングサイクルの間に標的核酸に結合した任意のシークエンシング用プローブの標的結合ドメインの配列を求めるのに必要なレポータプローブのプールの数は、バーコードドメインの中の付着位置の数と同じである。したがって3つの位置を有するバーコードドメインでは、シークエンシング用プローブで3つのレポータプローブをサイクルさせることになろう。
【0276】
シークエンシング用プローブの1つのプールは、配列がすべて同じ複数のシークエンシング用プローブを含むこと、または配列がすべて同じではない複数のシークエンシング用プローブを含むことができる。シークエンシング用プローブの1つのプールが、配列がすべて同じではない複数のシークエンシング用プローブを含んでいるとき、異なるそれぞれのシークエンシング用プローブが同数存在すること、または異なるシークエンシング用プローブが異なる数で存在することができる。
【0277】
図16は、本開示によるシークエンシング用プローブのプールの一構成例を示しており、ここではシークエンシング用プローブが、(a)6個のヌクレオチド(6量体)を含んでいて標的核酸に特異的に結合する標的結合ドメインと、(b)バーコードドメインの中の3つの付着位置(R1、R2、R3)を含有しているため、上に示した8通りの色組み合わせを用いてシークエンシング用プローブの8つの異なるプールを設計する。可能な4096通りの異なる6量体配列(4×4×4×4×4×4=4096)が存在する。バーコードドメインの中の3つの付着位置のそれぞれは、異なる8通りの色組み合わせのうちの1つが結合した相補的核酸にハイブリダイズすることができるため、可能な3つの色組み合わせからなる異なる512のセットが存在する(8×8×8=512)。例えばR1が色組み合わせGGに結合した相補的核酸にハイブリダイズし、R2が色組み合わせBGに結合した相補的核酸にハイブリダイズし、R3が色組み合わせYRに結合した相補的核酸にハイブリダイズするプローブでは、3つの色組み合わせのセットはGG-BG-YRである。シークエンシング用プローブの1つのプールの中では、3つの色組み合わせがそれぞれ異なるセットが、標的結合ドメインの中の異なる6量体に対応することになろう。各プールは512個の異なる6量体を含有しているため合計で4096通りの可能な6量体が存在するゆえ、可能なすべての6量体をシークエンシングするには8つのプールが必要とされる(4096/512=8)。8つのプールそれぞれの中に入る具体的なシークエンシング用プローブは、各シークエンシング用プローブが標的核酸に最適にハイブリダイズするように決められる。最適なハイブリダイゼーションを保証するにはいくつかの注意事項がある。前記注意事項に含まれるのは、(a)6量体の完全な相補体を異なるプールに分けること;(b)高いTmと低いTmを持つ6量体を異なるプールに分けること;(c)経験的に学習したハイブリダイゼーションパターンに基づいて6量体を異なるプールに分けることである。
【0278】
図17は、アメリカ合衆国特許出願公開第2016/0194701号に記載されているシークエンシング用プローブと本開示のシークエンシング用プローブの違いを示している。図17の左図に示してあるように、アメリカ合衆国特許出願公開第2016/0194701号には、相補的核酸にハイブリダイズする6つの付着位置を含むバーコードドメインを有するシークエンシング用プローブが記載されている。それぞれの相補的核酸は異なる4種類の蛍光染料のうちの1つに結合する。この構成では、それぞれの色(赤、青、緑、黄)が、標的結合ドメインの中の1つのヌクレオチド(A、T、C、G)に対応する。プローブをこのように設計することにより、4096通りの異なるプローブ(46)が生まれる。図17の右図に示してあるように、本開示の一例では、各シークエンシング用プローブのバーコードドメインは、相補的核酸にハイブリダイズする3つの付着位置を含んでいる。アメリカ合衆国特許出願公開第2016/0194701号とは異なり、これら相補的核酸には、8通りの色組み合わせ(GG、RR、GY、RY、YY、RG、BB、RB)のうちの1つが結合する。それぞれの色組み合わせは、標的結合ドメインの中にある特定の1つのジヌクレオチドに対応する。この構成では、512通り(83)の異なるプローブが生まれる。標的核酸ドメインの中の可能なあらゆる6量体の組み合わせ(4096)をカバーしようとすると、1つの標的核酸全体をシークエンシングするのにこれら512の異なるプローブからなる8つの別々のプールが必要とされる。相補的核酸を標識するのに8通りの色組み合わせを用いているが可能なジヌクレオチドは16通り存在するため、シークエンシング用プローブのどのプールを用いるかに応じていくつかの色組み合わせが異なるジヌクレオチドに対応することになろう。例えば図17では、シークエンシング用プローブの第1、第2、第3、第4のプールにおいて色組み合わせBBがジヌクレオチドAAに対応し、色組み合わせGGがジヌクレオチドATに対応する。シークエンシング用プローブの第5、第6、第7、第8のプールにおいては色組み合わせBBがジヌクレオチドCAに対応し、色組み合わせCTがジヌクレオチドATに対応する。
【0279】
複数のシークエンシング用プローブ(すなわち2つ以上のシークエンシング用プローブ)をシークエンシングウインドウの中でハイブリダイズさせることができる。シークエンシング中、ハイブリダイズした複数のシークエンシング用プローブの中の各シークエンシング用プローブに結合した検出可能な標識の属性と空間的位置を記録する。こうすることで、複数のジヌクレオチドの位置と属性の両方を前記後同定することが可能になる。言い換えると、複数のシークエンシング用プローブを同時に単一の標的核酸分子にハイブリダイズさせることにより、標的核酸に沿った複数の位置を同時にシークエンシングすることができるため、シークエンシングの速度が向上する。
【0280】
図18は、捕獲された標的核酸分子にハイブリダイズした単一のシークエンシング用プローブと複数のシークエンシング用プローブの模式図を示している。ハイブリダイズした5'捕獲用プローブと3'捕獲用プローブの2つの間のシークエンシングウインドウにより、単一のシークエンシング用プローブ(左図)または複数のシークエンシング用プローブ(右図)を標的核酸分子の長さに沿ってハイブリダイズさせることができる。複数のシークエンシング用プローブを標的核酸分子の長さに沿ってハイブリダイズさせることにより、標的核酸分子上の2つ以上の位置を同時にシークエンシングすることができるため、シークエンシングの速度が向上する。図19は、捕獲された標的核酸に単一のシークエンシング用プローブ(左図)または複数のシークエンシング用プローブ(右図)をハイブリダイズさせたとき、本開示のシークエンシング法の間に記録された蛍光画像を示している。図19の右図は、標的核酸の長さに沿って結合した複数のシークエンシング用プローブの個々のプローブからの蛍光信号を空間的に分離できることを示している。
【0281】
図20は、長さが15キロ塩基である標的核酸の長さに沿って結合した本開示による複数のシークエンシング用プローブと、対応する記録された蛍光画像の模式図を示している。図20の右図に示してあるように、シークエンシング用プローブは標的核酸の長さに沿って均等な間隔で結合することができる。図20の左図に示してあるように、シークエンシング用プローブは標的核酸の長さに沿って均等な間隔で結合する必要はない。図20に示した蛍光画像は、標的核酸の長さに沿って結合した複数のシークエンシング用プローブからの信号を空間的に分離して標的核酸の複数の位置でシークエンシング情報を同時に得ることが可能であることを示している。
【0282】
標的核酸の長さに沿ったプローブの分布が、検出可能な信号の解像度にとって極めて重要である。1つの領域内のプローブが多すぎると検出可能な標識の重複が起こる可能性があるため、2つの近接したプローブの分離が妨げられる。これは以下のように説明される。1つのヌクレオチドは長さが0.34 nmであり、シークエンシング装置の横方向(x-y)の空間解像度は約200 nmであるため、シークエンシング装置の解像度の限界は約588塩基対(すなわち1個のヌクレオチド/0. 34 nm×200 nm)である。すなわち2つのプローブが互いに約588塩基対以内であるときには、上記のシークエンシング装置だと標的核酸にハイブリダイズした2つのプローブから信号を分離することができないと考えられる。したがって検出可能な標識を別々の「スポット」として分離できるようにするには、シークエンシング装置の解像度に応じて2つのプローブを約600塩基対離す必要があろう。前記ため最適な間隔では、標的核酸600 bpごとに1つのプローブが存在すべきである。プローブの集団の中の各シークエンシング用プローブは互いに600ヌクレオチドよりも近距離で結合しないことが好ましい。(例えば蛍光強度の値と波長に依存した比を利用する)さまざまなソフトウエアのアプローチを利用して標的核酸の1つの分離可能な領域の中にハイブリダイズするプローブの数をモニタし、制限し、潜在的に解析することが可能であり、それに応じてプローブの集団を設計することができる。さらに、より多くの明確に異なる信号を提供する検出可能な標識(例えば蛍光標識)を選択することができる。さらに、文献に記載されている方法(SmallとParthasarthy:「Superresolution localization methods」Annu. Rev. Phys Chem.、2014年;第65巻:107~125ページ)には、構造化されたと照明と、シークエンシング用顕微鏡の解像限界を数10ナノメートルまで低下させるさまざまな超解像アプローチが記載されている。より解像度の大きいシークエンシング装置を用いると、より短い標的結合ドメインを有するプローブを用いることが可能になる。
【0283】
上述のように、プローブのTmの設計が、標的核酸にハイブリダイズするプローブの数に影響を与える可能性がある。前記代わりに、またはそれに加えて、1つの集団の中のシークエンシング用プローブの濃度を上昇させて標的核酸の特定の領域の中のプローブのカバレッジを増やすことができる。シークエンシング用プローブの濃度を低下させて標的核酸の特定の領域の中のプローブのカバレッジを減らし、例えばシークエンシング装置の解像限界よりも上にすることができる。
【0284】
2つの検出可能な標識の解像限界は約600ヌクレオチドだが、こうすることで本開示の強力なシークエンシング法が妨げられることはない。いくつかの側面では、任意の集団の中の複数のシークエンシング用プローブが標的核酸上で600ヌクレオチド離れることはなかろう。しかし統計的には(ポアソン分布に従うと)、1つのシークエンシング用プローブが結合しているだけの標的核酸が存在するであろうゆえ、前記シークエンシング用プローブは光学的に分離可能なものである。600ヌクレオチド以内に複数のプローブを有する(ため、光学的に分離可能でない)標的核酸については、これら分離不能なシークエンシング用プローブに関するデータを廃棄することができる。重要なことだが、本開示の方法により、複数のシークエンシング用プローブの結合と検出の操作が複数回なされる。したがって何回かの操作ではあらゆるシークエンシング用プローブから信号を検出し、何回かの操作ではシークエンシング用プローブの一部だけから信号を検出し、何回かの操作ではどのシークエンシング用プローブからも信号を検出しないことが可能である。いくつかの側面では、標的核酸に結合したシークエンシング用プローブの分布を(例えば濃度または希釈度を制御することによって)管理し、1個の標的核酸に1つのシークエンシング用プローブだけが結合するようにできる。
【0285】
ランダムにだが、部分的には標的結合ドメインの長さと、プローブのTmと、適用するプローブの濃度に応じ、1つの集団の中の2つの明確に異なるシークエンシング用プローブが互いに600ヌクレオチド以内で結合することが可能である。
【0286】
前記代わりに、またはそれに加えて、1つの集団の中のシークエンシング用プローブの濃度を低下させて標的核酸の特定の領域の中のプローブのカバレッジを減らし、例えばシークエンシング装置の解像限界よりも上にし、前記ことによって解像度が制限されたスポットから単一の読み出しを発生させることができる。
【0287】
本開示の方法を用いて標的核酸をシークエンシングする前に標的核酸の配列、または配列の一部がわかっている場合には、シークエンシング用プローブを、どの2つのシークエンシング用プローブも互いに600ヌクレオチド以内で結合することがないように設計して選択することができる。
【0288】
シークエンシング用プローブを標的核酸にハイブリダイズさせる前に、1つ以上の相補的核酸分子に第1の検出可能な標識を結合させ、少なくとも第2の検出可能な標識をシークエンシング用プローブのバーコードドメインの中の1つ以上の付着位置にハイブリダイズさせることができる。例えば標的核酸にハイブリダイズさせる前に、第1の検出可能な標識と少なくとも第2の検出可能な標識が結合した1個以上の相補的核酸分子を各シークエンシング用プローブの第1の付着位置にハイブリダイズさせることができる。したがってシークエンシング用プローブは、標的核酸に接触させると第1の付着位置から検出可能な信号を発生させることができるため、バーコードドメイン上の第1の位置に向かう相補的核酸またはレポータプローブの第1のプールを用意する必要はない。別の一例では、第1の検出可能な標識と少なくとも第2の検出可能な標識が結合した1つ以上の相補的核酸分子をシークエンシング用プローブのバーコードドメインの中のすべての付着位置にハイブリダイズさせることができる。したがってこの例では、相補的核酸を順番に交換する必要なく、6個のヌクレオチドからなる配列を読み出すことができる。このあらかじめハイブリダイズしたシークエンシング用プローブ-レポータプローブ複合体を用いると説明した方法の多くの工程が省略されるため、配列情報を取得する時間が短縮されると考えられる。しかしこのプローブは、重複していない検出可能な標識から利益を得ると考えられる。例えば蛍光体は、重複していない波長の光によって励起されたり、重複していない波長の光を出したりする。
【0289】
シークエンシングの間、記録された色ドットからの信号強度を用いて標的核酸をより正確にシークエンシングすることができる。図21は、本開示の1つのシークエンシングサイクルの間に記録されるイメージングデータを示している。図21の右図は、レポータプローブがシークエンシング用プローブの第1の付着位置にハイブリダイズした後に記録された蛍光顕微鏡の画像を示している。個々の色ドットを目立つようにし、記録された特定の色組み合わせを強調してある。これは、二重蛍光信号を明確に検出できてしかも識別可能であることを示している。基準マーカーからの明るい信号を矢印で示してある。図21の左図は、1つの色ドット内の個々の色のスポット強度を用いると、特定の1つの色ドットが1つの色の重複になっている色組み合わせ(すなわちBB、GG、YY、RRのいずれか)に対応する確率を求めることができることを示している。
【0290】
バーコードドメイン内の1つの位置の暗化は、前記位置にハイブリダイズしたレポータプローブの中に存在する切断可能なリンカー修飾の位置での鎖の切断によって実現することができる。図22は、切断可能なリンカー修飾を利用してシークエンシングサイクルの間にバーコード位置を暗化することを示している。図22の最も左側の図に示した第1の工程は、レポータプローブの一次核酸をシークエンシング用プローブの第1の付着位置にハイブリダイズさせることを含んでいる。一次核酸は、バーコードドメインの第1の位置の付着領域の中の特定の相補的配列にハイブリダイゼーションする。一次核酸の第1のドメインと第2のドメインは切断可能なリンカー修飾によって共有結合している。第2の工程では、検出可能な標識を前記後記録してシークエンシング用プローブの標的結合ドメインの中の特定のジヌクレオチドの属性と位置を求める。第3の工程では、切断可能なリンカー修飾の位置でレポータプローブを切断することにより、バーコードドメインの第1の位置を暗化する。こうすることで一次核酸の第2のドメインが放出され、前記ことによって検出可能な標識が放出される。一次核酸分子の第1のドメインは、今や検出可能な標識がまったく欠けた状態でバーコードドメインの第1の付着位置にハイブリダイズしたままになっているため、バーコードドメインの第1の位置はもはや検出可能な信号を発生させず、前記後のシークエンシング工程において他のどのレポータプローブにもハイブリダイズすることはできないであろう。図22の最も右側の図に示した最終工程では、レポータプローブがバーコードドメインの第2の位置にハイブリダイズし、シークエンシングが続いていく。
【0291】
バーコードドメインの付着位置は、検出可能な標識が結合しているレポータプローブの中の任意の二次核酸または三次核酸を置換する一方で、レポータプローブの一次核酸はシークエンシング用プローブにハイブリダイズしたままにすることによって暗化できる。この置換は、検出可能な標識が結合していない二次核酸または三次核酸を一次核酸にハイブリダイズさせることによって実現できる。図23は本開示のシークエンシングサイクルの一例の例示であり、バーコードドメインの中の1つの位置が、標識を有する二次核酸の置換によって暗化されている。図23の最も左側の図はシークエンシングサイクルの開始を示しており、レポータプローブの一次核酸分子がシークエンシング用プローブのバーコードドメインの第1の付着位置にハイブリダイズしている。次に、検出可能な標識に結合している二次核酸分子が一次核酸分子にハイブリダイズし、検出可能な標識が記録される。バーコードドメインの第1の位置を暗化するため、検出可能な標識に結合している二次核酸分子を、検出可能な標識を欠く二次核酸分子で置換する。シークエンシングサイクルの次の工程では、検出可能な標識を含むレポータプローブをバーコードドメインの第2の位置にハイブリダイズさせる。バーコードドメインの付着位置の暗化は、検出可能な標識が結合していない核酸をシークエンシング用プローブにバーコードドメインの対応する付着位置でハイブリダイズさせてレポータプローブの任意の一次核酸分子を置換することにより可能である。バーコードドメインが少なくとも1つの付着位置に隣接した少なくとも1つの一本鎖核酸配列を含んでいる場合には、検出可能な標識が結合していない核酸が一次核酸分子と置き換わることが、前記フランキング配列と、バーコードドメインのうちで前記一次核酸分子によって占められている部分とにハイブリダイズすることによって可能になる。必要な場合には、検出可能な標識の交換速度を大きくする小さな一本鎖オリゴヌクレオチドを組み込むことによって検出可能な標識の交換速度を大きくすることができる(例えば「トーホールド」プローブ;例えばSeeling他、「Catalyzed Relaxation of a Metastable DNA Fuel」;J. Am. Chem. Soc. 2006年、第128巻(37)、12211~12220ページを参照されたい)。
【0292】
検出可能な標識を含む相補的核酸すなわちレポータプローブは、付着領域から除去することができるが、検出可能な標識を欠くハイブリダイズする核酸で置き換えることはできない。これは、例えばカオトロピック剤を添加することによって、および/または温度を上昇させることによって、および/または塩の濃度を変えることによって、および/またはpHを調整することによって、および/または流体力を加えることによって起こる可能性がある。これらの例では、より少数の試薬(すなわち検出可能な標識を欠くハイブリダイズする核酸)が必要とされる。
【0293】
本開示の方法を利用して同じサンプルからRNA分子とDNA分子(mRNAとgDNAが含まれる)を同時に捕獲してシークエンシングすることができる。同じサンプルからRNA分子とDNA分子の両方を捕獲してシークエンシングすることを同じフローセルの中で実行できる。図24の左図は、本開示の方法を利用してFFPEサンプルからmRNAとgDNAの両方を同時に捕獲し、検出し、シークエンシングすることがどのようにして可能になるのかを示す模式図である。
【0294】
本開示のシークエンシング法はさらに、固定化された標的核酸の各領域についてそれぞれ同定されたヌクレオチドの線形な順番を再構築することにより、固定化された標的核酸の配列を同定する工程を含んでいる。再構築する工程では、実行可能なプログラムが記憶されている非一時的コンピュータ可読記憶媒体を利用する。前記プログラムが、標的核酸の各領域についてそれぞれ同定されたヌクレオチドの線形な順番を整える指示をマイクロプロセッサに出すことにより、核酸の配列が得られる。再構築する作業は、「リアルタイム」で、すなわちすべてのデータが回収された後や完全なデータ取得後にではなく、データがシークエンシング用プローブから回収されている間に実行することができる。
【0295】
本開示によるシークエンシング法の生の特異度はほぼ94%である。本開示のシークエンシング法の精度は、2つ以上のシークエンシング用プローブを用いて標的核酸の中の同じ塩基をシークエンシングすることによってほぼ99%まで上昇させることができる。図25は、本開示のシークエンシング法によりどのようにして異なるシークエンシング用プローブを用いて標的核酸の同じ塩基のシークエンシングが可能になるかを示している。この例における標的核酸は、NRASエキソン2(配列番号1)の断片である。興味ある特定の塩基は、標的核酸の中で強調されているシトシン(C)である。興味あるこの塩基は、標的核酸に対するハイブリダイゼーションのフットプリントが異なる2つのシークエンシング用プローブにハイブリダイズすることになろう。この例では、シークエンシング用プローブ1~4(バーコード1~4)は、興味ある塩基の左側の3個のヌクレオチドに結合するのに対し、シークエンシング用プローブ5~8(バーコード5~8)は、興味ある塩基の左側の5個のヌクレオチドに結合する。すると興味ある塩基が異なる2つのプローブによってシークエンシングされるため、前記特定の位置での塩基読み取りの量が増加し、前記ことによって前記特定の位置における全体的な精度が上昇する。図26は、標的ヌクレオチド上の特定のヌクレオチド位置における複数の異なる塩基読み取りが1つ以上のシークエンシング用プローブから記録され、どのように組み合わされてコンセンサス配列(配列番号2)を作り出し、前記ことによって最終的な塩基読み取りの精度を向上させているかを示している。
【0296】
「Hyb & Seq化学」、「Hyb & Seqシークエンシング」、「Hyb & Seq」は、上に説明した本開示の方法を意味する。
【0297】
上記の任意の側面を本明細書に開示した他の任意の側面と組み合わせることができる。
【0298】
定義
【0299】
本明細書では、「アニーリング」と「ハイブリダイゼーション」という用語は交換可能に用いられ、安定な二本鎖の形成を意味する。1つの側面では、安定な二本鎖とは、二本鎖構造が、温度が二本鎖のうちの1本の鎖のTmよりも約5℃下または約5℃上、かつ1価の塩の濃度が低い(例えば0.2 M未満、または0.1 M未満、または当業者に知られている塩濃度)という条件でのストリンジェントな洗浄によって破壊されないことを意味する。「完全に一致した」という表現は、二本鎖に関して用いるときには、前記二本鎖を構成するポリヌクレオチド鎖および/またはオリゴヌクレオチド鎖が互いに二本鎖構造を形成し、それぞれの鎖に含まれるすべてのヌクレオチドが、他方の鎖に含まれるヌクレオチドとワトソン-クリック塩基対合を形成することを意味する。「二本鎖」という用語には、使用可能なヌクレオシド類似体(デオキシイノシンなど)、2-アミノプリン塩基を有するヌクレオシド、PNAなどのペアが含まれるが、これらに限定されない。2個のオリゴヌクレオチドの間の二本鎖の中にある「ミスマッチ」は、前記二本鎖の中のヌクレオチドのペアがワトソン-クリック結合を形成できないことを意味する。
【0300】
本明細書では、「ハイブリダイゼーション条件」という用語は、典型的には、約1 M未満、より一般には約500 mM未満、さらに一般には約200 mM未満の塩の濃度を含むことになろう。ハイブリダイゼーションの温度として5℃という低温が可能だが、典型的には22℃超、より典型的には約30℃超であり、約37℃を超えることがしばしばある。ハイブリダイゼーションは、通常はストリンジェントな条件(例えばプローブが標的の対応する部分配列に特異的にハイブリダイズするであろう条件)下で実施される。ストリンジェントな条件は配列に依存しており、状況が異なれば異なる。より長い断片は、特異的なハイブリダイゼーションのためにはより高いハイブリダイゼーション温度を必要とする可能性がある。他の因子(相補的な鎖の塩基組成と長さ、有機溶媒の存在、塩基ミスマッチの程度が含まれる)がハイブリダイゼーションのストリンジェンシーに影響を与える可能性があるため、パラメータの組み合わせのほうが、どれか1つだけのパラメータの絶対的な指標よりも重要である。
【0301】
一般に、ストリンジェントな条件は、規定されたイオン強度とpHにおける特定の配列のTmよりも約5℃低くなるように選択される。ストリンジェントな条件の例に含まれるのは、pH 7.0~8.3かつ少なくとも25℃の温度において少なくとも0.01 M~1 M以下のNaイオン濃度(または他の塩)である。例えば5×SSPE(750 mM NaCl、50 mMリン酸ナトリウム、5 mM EDTA、pH 7.4)かつ温度25~30℃という条件が、アレル特異的プローブのハイブリダイゼーションに適している。ストリンジェントな条件に関しては、例えばSambrook、Fritsche、Maniatis、『Molecular Cloning A Laboratory Manual』、第2版、Cold Spring Harbor Press(1989年)と、Anderson、『Nucleic Acid Hybridization』、初版、BIOS Scientific Publishers Limited社(1999年)を参照されたい。本明細書では、「~に特異的にハイブリダイズする」または「特異的に~にハイブリダイズする」や同様の表現は、ストリンジェントな条件下である分子が実質的に特定の1つまたは複数のヌクレオチド配列に結合すること、または二本鎖化すること、またはハイブリダイズすることを意味する。
【0302】
プローブの特定の位置に付随する検出可能な標識は、1回または複数回「読み出すこと」(例えば前記蛍光の検出)が可能である。「読み出し」は、「塩基読み取り」という用語の同義語として使用できる。複数回の読み出しによって精度が向上する。標的核酸配列は、元の単一の標的分子に由来する配列情報の連続ストレッチが検出されるときに「読み出される」。典型的には、これは、(下に定義する)マルチパスコンセンサスを通じて生成する。本明細書では、「カバレッジ」または「カバーの深度」という用語は、(別々の読み出しを通じて)標的の1つの領域をシークエンシングして参照配列とアラインメントする回数を意味する。読み出しカバレッジは、特定の参照標的配列にマッピングする読み出しの合計数である。塩基カバレッジは、特定のゲノム位置における塩基読み取りの合計数である。
【0303】
1つの「読み出し」は、配列出力の1つの単位である。元の単一の標的分子に由来する配列情報の連続ストレッチ。各読み出しは、前記読み出しの中の塩基読み取りの信頼レベルと関係した品質指標を有する。シークエンサ出力の単位。元の単一の標的分子に由来する配列情報の連続ストレッチ。Hyb & Seqでは、すべての読み出しがマルチパスコンセンサスを通じて生成する。
【0304】
「読み出し長」は、各読み出しからの配列の長さを記述する指標である(単位はbp)。
【0305】
本明細書では、「Hyb & Seqサイクル」は、特定の1つのプローブ、またはプローブの集団の表面にある各付着領域を検出するのに必要な全工程を意味する。例えば標的核酸の表面にある6つの位置を検出することのできるプローブでは、1つの「Hyb & Seqサイクル」は、少なくとも、プローブを標的核酸にハイブリダイズさせ、相補的核酸/レポータプローブをプローブのバーコードドメインの表面にある6つの位置それぞれの付着領域にハイブリダイズさせ、それら6つの位置それぞれに付随する検出可能な標識を検出することを含むことになろう。
【0306】
「k量体プローブ」という用語は、本開示によるシークエンシング用プローブの同義語である。k量体読み出しは、Hyb & Seqのデータの基本単位である。1つのk量体読み出しは、1つのHyb & Seqサイクルごとに1つの標的分子から得られる。多数回のHyb & Seqサイクルを実施して単一の標的分子から十分な数の別々のk量体読み出しを生成させると、別々のk量体があいまいさなくアラインメントされて配列の連続的なストレッチを得ることが可能になる。
【0307】
別々の読み出しからの2つ以上の配列をアラインメントするとき、重複している部分を組み合わせて単一のコンセンサス配列を作り出すことができる。重複している部分が同じ塩基を有する位置(アラインメントの1つの列)では、それらの塩基がコンセンサスになる。さまざまな規則を利用することで、重複している配列の間に不一致が存在する位置に関するコンセンサスを生成させることができる。単純過半数という規則では、コンセンサスとして、列の中に最もよく出現する塩基を用いる。「マルチパスコンセンサス」は、単一の標的分子からの別々のプローブ読み出しすべてのアラインメントである。プローブの集団/調査の全サイクル数に応じ、単一の標的分子の中の各塩基位置への問い合わせを異なるレベルの冗長性または重複度で実施することができる。一般に、冗長性は塩基読み取りの信頼レベルを向上させる。
【0308】
「コンセンサス」は、別々の読み出しからの2つ以上のDNA配列をアラインメントする場合であり、重複している部分を組み合わせて単一のコンセンサス配列を生成させることができる。重複している部分が同じ塩基を有する位置(アラインメントの1つの列)では、それらの塩基がコンセンサスになる。さまざまな規則を利用することで、重複している配列の間に不一致が存在する位置に関するコンセンサスを生成させることができる。単純過半数という規則では、コンセンサスとして、列の中に最もよく出現する塩基を用いる。
【0309】
「生の精度」は、システムが正しく塩基を同定する固有の能力の1つの指標である。生の精度はシークエンシング技術に依存する。「コンセンサスの精度」は、追加の読み出しと統計学の力を用いてシステムが正しく塩基を同定する能力の1つの指標である。「特異度」は、1回の試行ごとの全読み出しのうちで意図する標的にマッピングされる読み出しの割合を意味する。「一様性」は、標的領域相互間の配列カバレッジの変動性を意味する。大きな一様性は小さな変動性と相関している。この特徴は、標的とするすべての領域のうちで、20%以上の平均カバー深度でカバーされている標的とする領域の割合として一般に報告されている。ランダムなエラー(すなわちシークエンシング化学に固有のエラー)は、同じ標的核酸を「マルチパス」シークエンシングすることによって容易に補正できる。パスの数が十分だと、実質的に「完全なコンセンサス」または「エラーなし」のシークエンシングを実現することができる。
【0310】
本明細書に記載した方法を実現すること、および/または結果を記録することは、前記方法を実現すること、および/または前記結果を記録することのできる任意の装置を用いて可能である。使用できる装置の非限定的な例に含まれるのは、あらゆるタイプのコンピュータを含む電子計算装置である。本明細書に記載した方法をコンピュータの中に実現および/または記録するとき、前記コンピュータに前記方法の工程を実行させるのに使用できるコンピュータプログラムは、前記コンピュータプログラムを収容できる任意のコンピュータ可読媒体の中に収容することができる。使用可能なコンピュータ可読媒体の非限定的な例に含まれるのは、ディスケット、CD-ROM、DVD、ROM、RAM、非一時的コンピュータ可読媒体、それ以外のメモリ、それ以外のコンピュータ記憶装置である。コンピュータに前記方法の工程を実行させる、および/または配列情報を再構築させる、および/または結果を記録させるのに使用できるコンピュータプログラムは、電子的ネットワーク(例えばインターネット、イントラネット、それ以外のネットワーク)に提供することもできる。
【0311】
「使い捨てシークエンシングカード」を本分野で知られている蛍光イメージング装置に組み込むことができる。異なる多くの特徴を備えた任意の蛍光顕微鏡が、このシークエンシング読み出しを実施することができる。例えば広視野ランプ、レーザー、LED、マルチフォトン、共焦点照明、全反射照明のいずれかを励起および/または検出に用いることができる。蛍光顕微鏡の発光検出チャネルには、フィルタまたは格子に基づくスペクトル分解(スペクトル分解された1つ以上の発光波長)ができるカメラ(1台または複数台)および/または光増倍管(1個または複数個)を取り付けることが可能である。標準的なコンピュータを使用して、使い捨てシークエンシングカードと、前記カードを通過する試薬と、蛍光顕微鏡による検出のすべてを制御することができる。
【0312】
シークエンシングのデータは、任意の数の標準的な次世代シークエンシングアセンブラによって分析することができる(例えばWajidとSerpedin、「Review of general algorithmic features for genome assemblers for next generation sequencers」Genomics, proteomics & bioinformatics、第10巻(2)、58~73ページ、2012年を参照されたい)。顕微鏡の1つの回折制限領域の中で得られたシークエンシングデータを「局所的に再構築する」ことにより、1つの回折スポットの中の複数の読み出しからコンセンサス配列を生成させる。次に、多数の回折スポットから再構築した読み出しをまとめてマッピングすることで、標的とする遺伝子セット全体、またはゲノム全体の新規なアセンブリを表わす連続配列を生成させる。
【0313】
本開示に関係する追加の教示は、アメリカ合衆国特許第8,148,512号、第7,473,767号、第7,919,237号、第 7,941,279号、第8,415,102号、第 8,492,094号、第8,519,115号、アメリカ合衆国特許出願公開第2009/0220978号、第 2009/0299640号、第2010/0015607号、第2010/0261026号、第2011/0086774号、第 2011/0145176号、第2011/0201515号、第2011/0229888号、第2013/0004482号、第2013/0017971号、第2013/0178372号、第2013/0230851号、第2013/0337444号、第2013/0345161号、第2014/0005067号、第2014/0017688号、第2014/0037620号、第 2014/0087959号、第2014/0154681号、第2014/0162251号、第2016/0194701号のうちの1つ以上の中に記載されている。なおこれら文献のそれぞれは、前記全体が参照によって本明細書に組み込まれている。
【実施例
【0314】
実施例1:Hyb & Seq化学を利用した単分子長の読み出し
【0315】
本開示のシークエンシング用プローブと、前記シークエンシング用プローブを用いたシークエンシング法を便宜上Hyb & Seqと呼ぶ。開示したシークエンシング用プローブとシークエンシング法を記述するのに明細書全体を通じてこの用語を使用する。Hyb & Seqは、ライブラリなし、増幅なしの単分子シークエンシング技術であり、天然標的の表面にある蛍光分子バーコードの核酸ハイブリダイゼーションサイクルを利用している。
【0316】
Hyb & Seqを用いた長い読み出しを長さ33キロ塩基(kb)の単分子DNA標的について示す。重要な工程は以下の通りである:(1)長いDNA分子がシークエンシング用フローセルの表面に捕獲され、流体力によって伸長される;および/または(2)複数の完全に一致したシークエンシング用プローブが長い単分子標的に沿ってハイブリダイズする;および/または(3)蛍光レポータがシークエンシング用プローブの中のバーコード領域にハイブリダイズし、結合したすべての配列が同定される;および/または(4)空間的に分離された蛍光データを利用して単分子標的の中の配列の相対的位置が求められる。
【0317】
Hyb & Seqを利用した長い読み出しの重要な利点の非限定的な例に含まれるのは、分子の長さによって決まる読み出し長が化学によって制限されないこと;および/または簡単で制限されたサンプル調製の結果として断片化がより少なくなること;および/またはシークエンシング用プローブと関係する位置情報が再構築を助けること;および/またはバリアントのフェージングによって長い範囲のハプロタイプにする能力である。
【0318】
Hyb & Seq化学の設計:シークエンシング用プローブは、単分子標的と塩基対を形成する標的結合ドメインと、標的結合ドメインの中に存在する6量体配列に対応する少なくとも3つの位置(R1、R2、R3)を有するバーコードドメインを含んでいる。4096通りのシークエンシング用プローブによって任意の標的配列のシークエンシングが可能になる。レポータプローブ:3つのレポータプローブがバーコードドメインの上記位置に順番に結合する。それぞれのレポータ複合体は特定の1つのジヌクレオチドに対応する。ハイブリダイゼーションによって機能が発揮される。
【0319】
本開示の長い読み出しシークエンシング法と短い読み出しシークエンシング法は、図18図19に示してあるように、核酸を標的とした捕獲に同じ簡単なプローブハイブリダイゼーション作業フローを利用している。図18の右図に示してあるように複数のシークエンシング用プローブが標的核酸に同時にハイブリダイズすることができ、図19の右図に示してあるように光学的分解によって長い標的1つにつきいくつかのスポットを個別に識別することが可能になる。複数のシークエンシング用プローブを同時にハイブリダイズさせて記録することにより、1回の読み出しの情報内容が増える。長い範囲のハプロタイプは単分子分析に固有であり、コンピュータによる再構成ではなくて実際の物理的位置によって再構築することができる。本開示のシークエンシング法を利用すると、数百キロ塩基までの長いシークエンシング読み出しが可能である。
【0320】
図20に示してあるように、特別なシークエンシング用プローブのプールが、予想されるパターンで15キロ塩基の標的にハイブリダイズしている。シークエンシング用プローブは、予想される配列特異的位置かつ相対的な物理的距離で、伸長した標的(流体力で伸長した標的が好ましい)にハイブリダイズする。本開示のシークエンシング法は、短い読み出し技術と比べて情報内容が増えているため、各サイクルでより多くの塩基を読み出すことができる。本開示の長い読み出しシークエンシング法は、シークエンシングの読み出し結果の相対位置も記録する。これは、長い読み出しの再構築を助ける。本開示の長い読み出しシークエンシング法を利用する場合には、読み出し長=コンセンサス配列の長さ=捕獲された標的分子の長さである。
【0321】
図27は、33キロ塩基のDNA断片を捕獲し、伸長させ、シークエンシングプローブとレポータプローブにハイブリダイズさせ、検出した実験の結果を示している。本開示のシークエンシング法は、33キロ塩基までのDNA断片と33キロ塩基超のDNA断片に適合性がある。読み出し長は、標的核酸断片の初期長によってだけ制限され、酵素またはシークエンシング化学によっては制限されない。
【0322】
図13は、標的となるフェージングされた長い読み出しに関する本開示のシークエンシング法の追加の能力を示している。フェージングされた長い範囲のハプロタイプがデータには固有であり、バリアントのフェージングに関して容易に同定される。長い標的分子全体のシークエンシングは不要である。というのも「ブロッカーオリゴ」を用いて配列のサイクリングを興味あるシークエンシングウインドウに制限できるからである。
【0323】
実施例1の結果は、本開示のシークエンシング法で長い読み出し長の単分子シークエンシングが可能であることを示している。この結果は特に、15キロ塩基と33キロ塩基の一本鎖DNA分子の捕獲と流体力による伸長がうまくいくこと;空間的に分離された蛍光データが、長い単分子に沿った実際の相対位置に正確に対応していること;シークエンシングサイクルごとに10塩基超の複数の配列が同時に読み出されることを示している。
【0324】
実施例2:ShortStack(商標)技術:短いヌクレオチドバリアントとInDelを分離する標的シークエンシングのためHyb & Seq読み出しを参照にガイドされて正確に再構築する
【0325】
ShortStackは、Hyb & Seqの異なる6量体読み出し(6量体スペクトル)を再構築する設計のオープンソースアルゴリズムである。このアルゴリズムは、単分子をベースとしていて、画像化されたそれぞれの特徴からの6量体読み出しを用いて標的を同定し、それら6量体読み出しを再構築してコンセンサス配列にするための統計的アプローチであり、エラー補正を伴っている。
【0326】
Hyb & Seq化学とShortStackを利用した単分子シークエンシングを以下のように実施した:Hyb & Seq化学を利用したハイブリダイゼーションの各サイクルの後に単分子標的の6量体読み出しを生成させた;ハイブリダイゼーションのサイクルが多数回終了した後、各単分子標的の複数の領域をカバーする6量体スペクトルが生成した;6量体スペクトルを標的核酸分子それぞれの参照配列とともに用いて各単分子標的のコンセンサス配列を導出する。
【0327】
Hyb & Seq技術をShortStackとともに用いた標的シークエンシングの結果は以下のことを示している:6量体のスペクトルを用いた単分子標的同定アルゴリズムは成功率が100%であった;および/または参照によってガイドされる再構築アルゴリズムにより単分子コンセンサスの精度が5回のカバレッジで99%超(QVが約 32)になり、それに合致する体細胞バリアント検出(R2約90%)が、あらかじめ特徴付けたgDNAサンプルを用いて証明された;および/またはすべての6量体とShortStackを用いたインシリコ実験から、より大きな標的パネルで平均QVが90超であることが確認された。ShortStackアルゴリズムはHyb & Seqデータを正確に再構築することができる。図28は、シークエンシング実験からの結果を示している。この結果は、本開示のシークエンシング法を利用して取得した後にShortStackアルゴリズムを用いて分析したものである。この実験では、シークエンシングされた標的核酸に含まれているのは、遺伝子BRAF(配列番号3)の断片、遺伝子EGFRex18(配列番号4)の断片、遺伝子KRAS(配列番号5)の断片、遺伝子PIK3CA(配列番号6)の断片、遺伝子EGFRex20(配列番号7)の断片、遺伝子NRAS(配列番号8)の断片である。図28は、塩基カバレッジとバリアント読み取りの両方を示している。カバレッジのプロットは、FFPE(ホルマリン固定パラフィン包埋)gDNAにおける塩基のカバレッジを示している。結果は、利用可能なシークエンシング用プローブによって多彩な標的の大半の塩基がカバーされることを示している。エラープロットは、多彩な標的に関してFFPE gDNAサンプルの中の調べる位置におけるエラー率とカバレッジの関係を示している。結果は、8回のカバレッジでエラー率が1%未満であることを示している。頻度プロットは、シークエンシングされたHorizon gDNAサンプルに含まれるバリアントの予想頻度と既知の頻度の間の相関を示している。表にはシークエンシングされたHorizonゲノム参照gDNAが掲載されており、バリアント分子の一部が参照サンプルの既知の頻度と一致していることがわかる。
【0328】
実施例2の結果は、ShortStackが、本開示のシークエンシング法を利用して得られた6量体スペクトルの部分的再構築のための正確なアルゴリズムであることを示している。結果から特にわかるのは以下のことである:シミュレーションデータを用いると、標的同定が100%の精度、塩基ごとの平均品質値が30超である;Hyb & Seq 実験データの中の塩基読み取りが5回のカバレッジで99%超の精度である;ゲノムDNAからのバリアントの検出が既知の値に合致する頻度である(R2約90%);計算性能が優れており、再構築される6量体の数に正比例し、パーソナルコンピュータで約15分間に69k個の分子を再構築することができる。
【0329】
実施例3:Hyb & Seq(商標)技術を利用してFFPEサンプルから天然gDNAをライブラリなしで標的シークエンシングする - ハイブリダイゼーションに基づく単分子シークエンシングシステム
【0330】
本開示のシークエンシング法(Hyb & Seq)を利用してFFPEサンプルからの天然のgDNAに関してがんパネルを標的としたシークエンシングを実施して以下のことを明らかにした:がん遺伝子標的を標的とする単分子シークエンシングにおける正確な塩基読み取り; および/または既知のがん遺伝子単ヌクレオチドバリアント(SNV)と挿入/欠失(InDel)の正確な検出;および/またはFFPEから抽出されたgDNA(DNA断片のサイズの中央値は200塩基)からのがん遺伝子標的の多重捕獲;および/または改良型プロトタイプ装置での末端から末端までの自動化シークエンシング。
【0331】
Hyb & Seq化学と作業フローは以下のようであった:興味あるゲノム標的をシークエンシング用フローセルの表面に直接捕獲する;数百の6量体シークエンシング用プローブを含有するプールを前記シークエンシング室に流入させる;3回のレポータ交換サイクルで蛍光レポータプローブをシークエンシング用プローブのバーコード領域に順番にハイブリダイズさせて6量体の塩基を同定する;塩基が同定されると、シークエンシング用プローブを洗い流す;標的領域が十分な深度で読み出されるまで、シークエンシング用プローブの新しいプールを用いてサイクルを繰り返す。
【0332】
Hyb & Seqの重要な利点:単純かつ迅速なFFPE作業フロー - 60分以内にシークエンシングを開始するための臨床試料;および/または酵素または増幅がない/ライブラリなしの構成;および/または全作業時間が15分間;および/または高い精度 - 低い化学エラー率+固有エラー補正;および/または長い読み出しと短い読み出しの両方 - 読み出し長は入力サンプルによって規定され、化学によっては制限されない。
【0333】
Hyb & Seq化学の設計は実施例1に記載した通りである。FFPE組織を処理するためのHyb & Seqサンプルの調製は3つの簡単な工程からなる:(1)単一の試験管での脱パラフィンと溶解;(2)シリンジフィルタを用いた粒子の除去;(3)オプションのDNA断片化と標的捕獲。このプロセスでは、サンプルごとに1~3個の10ミクロンFFPE切片を使用する必要がある。このプロセス全体は60分以内に完了するため、一般的な実験室の装置だけ、すなわちヒートブロック、ピペット、フィルタ、試薬だけを必要とする。
【0334】
図29は、FFPEサンプルに由来するがん遺伝子標的の捕獲とシークエンシングを多重化するための実験設計の模式図を示している。11個のがん遺伝子標的の一部(配列番号3~13)をシークエンシングするため、合計425のシークエンシング用プローブを設計して構成した。各遺伝子標的に関する既知のバリアントの遺伝子座が多数のシークエンシング用プローブでカバーされた(完全な一致+単一のミスマッチ)。塩基カバレッジと塩基ごとの精度をこれらの領域で測定した。あらかじめ特徴付けた参照サンプルを用いてバリアント検出の精度を取得した。図29の上図は、シークエンシング用プローブ(青色)が、既知のバリアントの位置(赤色)を取り囲む標的配列(灰色)にアラインメントされることを示している。各バリアントの位置(赤色)について、それぞれの(A、G、C、T)塩基バリアントを有する4つのプローブ配列が含まれるようにした。シークエンシング中に1つの標的DNA分子を800回のバーコード交換サイクルにわたって追跡すると、多数の6量体読み出しが得られ、それらを実施例2に記載したようにしてShortStack(商標)アルゴリズムによって再構築した。
【0335】
図28はシークエンシングの結果を示しており、そこには、各標的の平均カバレッジ、一塩基エラー率、バリアントの頻度の観測値と予想値が含まれている。実施例3の結果は、Hyb & Seqシークエンシングを利用すると、FFPEと参照gDNAサンプルの中の11の標的領域の多重化シークエンシングを実施して一ヌクレオチドバリエーションを小さなエラーで検出できることを示している。
【0336】
実施例4:Hyb & Seq (商標)化学を利用してcDNAへの変換なしに単分子RNAシークエンシングを直接実施する
【0337】
Hyb & Seq化学を利用した直接的な単分子RNAシークエンシングを以下のように実施した:天然RNA分子をcDNAへの変換なしに直接捕獲し、シークエンシング用フローセルの表面に固定化した;数百の6量体シークエンシング用プローブを含有するプールを前記シークエンシング用フローセルに流入させた;完全に一致したシークエンシング用プローブを単分子RNA標的の表面にランダムにハイブリダイズさせた;蛍光レポータプローブをシークエンシング用プローブのバーコード領域に順番にハイブリダイズさせて6量体の塩基を同定した;塩基を同定した後、シークエンシング用プローブを洗い流した;標的領域が十分な深度で読み出されるまで、サイクルを繰り返した。
【0338】
重要な結果:標的とされる単分子RNAをシークエンシングすると、DNAと似たカバレッジプロファイルが示された;および/または200回超のHyb & SeqサイクルにわたってRNA分子がフローセルの表面に安定に維持された;および/または単一のFFPEスライスからmRNAとゲノムDNAが同時に捕獲されて定量された;および/またはわずか10 ngの全RNAを用いて8個の転写産物が多重捕獲されて定量された。
【0339】
Hyb & Seq化学の設計は実施例1に記載した通りである。図30の上図は、直接的なRNAシークエンシングに関係する実験工程を、cDNA変換を利用して実施した従来のRNAシークエンシングに関係する工程と比較した模式図を示している。図30の中央の図と下図は、RNA分子と本開示のシークエンシング法の適合性を調べる実験からの結果を示している。この実験では、4個の標的RNA分子をシークエンシングした(配列番号14~17)。結果は、少なくとも200回のシークエンシングサイクルにわたってRNA分子を捕獲して検出できることを示している。
【0340】
図31は、本開示のシークエンシング法を利用して直接的な単分子RNAシークエンシングを実施する実験からの結果を示している。NRASex2(配列番号18)の断片をコードしている天然RNA分子をcDNAへの変換なしで直接捕獲し、シークエンシング用フローセルの表面に固定化し、本開示の方法を利用してシークエンシングした。この実験は、RNAの代わりに捕獲されたDNA分子も用いて繰り返した。図31は、DNAとRNAのシークエンシングのカバレッジが同等であったことを示している。これは、本開示のシークエンシング法を利用してRNAをcDNAへの変換なしに直接シークエンシングできることを示している。
【0341】
図24は、FFPEサンプルからRNAとDNAをまとめて捕獲する一例を示している。図24の左図は、本開示の方法を利用してFFPEサンプルからgDNAとmRNAの両方を同時に捕獲し、検出し、シークエンシングできることを示す模式図である。サンプルは、実施例3に記載したのと同じFFPE作業フローを利用して調製した。同じ捕獲プロトコルを利用したが、RNA特異的捕獲用プローブとDNA特異的捕獲用プローブを用いた。同じフローセルの中で同じシークエンシング用プローブを用いてDNA分子とRNA分子が同時にシークエンシングされた。図24の右図は、扁桃腺FPPEサンプルからNRASのRNAとDNAを同時に捕獲して検出する実験からの結果を示している。蛍光画像は、RNAとDNAの両方を捕獲して検出できることを示している。棒グラフは、RNAとDNAを同時に捕獲するのに特異的RNA捕獲用プローブと特異的DNA捕獲用プローブが必要とされることを示している。
【0342】
図32は、RNAパネルの多重標的捕獲の結果を示している。全RNAをさまざまな入力量(0 ng、1 ng、10 ng、100 ng、1000 ng)にしたときのヒトユニバーサル参照RNA(Human Universal Reference RNA)に関して中程度から高度に発現した8個の転写産物の多重捕獲を実施した。多重捕獲されたRNA分子をフローセルの表面に固定化し、特異的シークエンシング用プローブとレポータプローブを固定化された前記RNA分子にハイブリダイズさせて定量した。図32の下図は、100 ngの入力で捕獲されたRNA分子の蛍光画像を示している。各RNAの一例を円で囲み、転写産物の名称と、同定に用いた対応するレポータ複合体の色組み合わせを記載してある。図32の上図は、それぞれの特異的RNA標的に関するカウント数の定量結果を示している。
【0343】
実施例4の結果は、単分子RNAシークエンシングがHyb & Seq化学で実現されることを示している。結果から特にわかるのは、(1)cDNAへの変換なしの直接的なRNAシークエンシングが可能であること;(2)Hyb & Seqサイクリングプロセスを通じてRNA分子が安定であること;(3)1つのHyb & Seq作業フローでRNA分子とDNA分子の両方を捕獲してシークエンシングできること;(4)10 ngという少ない全RNA入力でmRNAパネルの標的捕獲を実施できることである。
【0344】
実施例5:Hyb & Seqシークエンシングプラットフォームから生成したハイスループットな分子レベルでの短い読み出しのための統合バイオインフォマティクスアルゴリズム
【0345】
ShortStack(商標)ソフトウエアを設計して標準的なシークエンシングに基づくバイオインフォマティクス分析のタスク(アラインメント、エラー補正、変異読み取り、読み出しの再構築など)を実行した。図33は、ShortStack(商標)ソフトウエアパイプラインの工程全体の模式図を示しており、ここに含まれるのは、6量体のアラインメントとカバレッジの推定;および/または変異した配列の同定;および/またはグラフデータ構造の構成;および/または分子レベルでの配列再構成とエラー補正である。
【0346】
すべてのアルゴリズムが、単分子から得られた情報の範囲中で厳密に実行されたことで、最終的な変異読み取り結果がサンプルの変異頻度に左右されないことが保証された。6量体をパネル結合位置に従って異なる分子にグループ化した。分子を標的に割り当てるため、6量体を分子ごとに異なるすべての標的領域にアラインメントさせ、最もよく一致した遺伝子標的を選択した。
【0347】
1つの統計的指標を測定して分子同定の品質を評価した。N個の異なる標的領域に対するアラインメントから、各標的についてのカバレッジ値の和N個の分布が生成する。カバレッジ値の和の一致スコアが最上位のものを正しい一致として選択した。異なるN個の標的すべてのスコア分布に対する選択された最上位の一致スコアのzスコア統計を測定した。信頼度の低い分子属性(zスコアが2.5σ未満)はフィルタで除外した。
【0348】
ShortStack(商標)アルゴリズムの重要な利点に含まれるのは、階層的ハッシュインデックスの設計を実現することにより、生じる可能のある配列のあいまいさを正確に取り扱えること;および/または進歩したアルゴリズム設計構造が優先順位付けによってマッピングの品質を保証し、変異の過大評価を阻止していることである。
【0349】
それに加え、変異グラフデータ構造によりさまざまなタイプの変異(置換、挿入、欠失)の計算モデルを作ることが可能になり、配列再構成とバリアント読み取りのための出力が生成する(置換バリアントは、元の配列と同じ長さのグラフにおいて追加ノードとして表わされ;挿入は、任意の長さの接続されたノードを追加することによってモデル化することができ;欠失は、グラフの中の人工ノードに空の塩基対ストリングを追加することとしてモデル化される);および/またはブラインド変異検索(すなわち変異許容配列アラインメントの検索)において参照配列のすべての位置からのハミング距離が測定され、検索された変異を表わすグラフに新たなノードが追加される;および/または変異した6量体に関するカバレッジの推定が、階層的ハッシュ表を用いて実行される。
【0350】
構成されたグラフデータ構造により、分子レベルでの配列再構成と装置エラーの補正が可能になる。構成されたグラフにおいて、ダイナミックプログラミングアルゴリズムを適用し、スコアが規格化された塩基カバレッジとして定義されるスコアリング経路のうちで最良のものを見いだす。グラフの最良のスコアリング経路が、分子レベルでの配列再構成を表わしていた。正しい変異配列は含まれた一方で、6量体の中の装置エラーは廃棄された。
【0351】
シミュレーションデータセットから、このソフトウエアが、分子レベルでの非常に正確な配列再構成と変異読み取りの結果を供給できることを確認した。図34は、ShortStack(商標)ソフトウエアパイプラインを用いてシミュレーションデータセットの変異分析をした結果を示している。これらの結果は、10個のランダムな変異についての変異読み取りの精度を示している。装置エラーが中程度のデータセットでは、精度は平均で99.39%(標的を明確にした検索)と98.02%(ブラインド検索)を示した。装置エラーが多いシミュレーションのもとでは、性能は平均で97.19%(標的を明確にした検索)と93.53%(ブラインド検索)を示した。分子レベルでの塩基カバレッジの閾値を2倍にしたとき、結果は99.5%(2回のカバレッジ)と99.9%(3回のカバレッジ)に改善された。
【0352】
ShortStack(商標)ソフトウエアは、広い範囲のさまざまな変異を処理することができる。図35は、全体的な変異読み取り精度を示しており、それぞれの棒は、さまざまなタイプの変異に関して変異した異なる10個の標的からの平均値を表わしている。挿入と欠失の長さは1 bpと15 bpの間で選択した。これらの結果は、変異読み取り精度が94.4%(1回のカバレッジ)、97.2%(2回のカバレッジ)、98.5%(3回のカバレッジ)であったことを示している。
【0353】
実施例6:Hyb & SeqのためのFFPE組織を処理することを目的としたサンプル調製
【0354】
ホルマリン固定パラフィン包埋(FFPE)組織は、伝統的なシークエンシングプラットフォームにとって挑戦的なタイプのサンプル入力である。Hyb & Seqのサンプル調製法によって下流シークエンシングのためのFFPE組織入力がうまく処理される。最初に、シークエンシングする核酸を1工程プロセスでホルマリン固定パラフィン包埋(FFPE)組織から抽出する。厚み10μmの1つ以上のFFPE切片を核酸抽出緩衝水溶液の中で加熱してパラフィンワックスを同時に融解させ、組織を分解し、細胞から核酸を放出させる。適切な抽出緩衝液が本分野で知られており、前記中に典型例に含まれているのは、プロテイナーゼ、洗浄剤(Triton-100など)、キレート剤(EDTAなど)、アンモニウムイオンである。FFPE切片と抽出緩衝液を56℃で30分間インキュベートして組織からパラフィンを分離し、プロテイナーゼKに組織構造を消化させることで包埋された細胞を洗浄剤に対して露出させ、細胞の溶解が可能になるようにする。溶液を8分間の間隔で3回上下反転させ、組織の脱パラフィンと消化のプロセスの間に試薬が混ざりやすくする。この工程の後、溶液を98℃まで加熱してホルムアルデヒド架橋の逆転を促進することで、核酸がさらに抽出されやすくする。
【0355】
核酸がFFPE組織から抽出されると、孔のサイズが2.7μmのガラスファイバーフィルタ(Whatman社)を用いて溶液を濾過して組織のゴミと凍結したパラフィンを除去する。得られた溶液は、核酸を含有する均一で半透明な溶液である。前記核酸は、ホルマリン固定プロセスと保管条件が原因で高度に断片化されている。さらに断片化する必要がある場合には、Covaris社の集中照射式超音波処理装置を用いてDNAを物理的に剪断することができる。緩衝液の条件が理由で、核酸の剪断には延長された超音波処理が必要とされる。ピーク投入電力50 W、デューティ因子20%、200サイクル/バーストという標準的な設定を利用した超音波処理を600秒間実施して捕獲される標的をできるだけ増加させる。断片の長さをより短くするには、4℃にて21,000 gで15分間にわって遠心分離することにより、乳化したパラフィンを濾過された溶液から沈殿させることができる。こうすることで、DNAを剪断して約225 bpにすることができる。
【0356】
次に、迅速なハイブリダイゼーションプロセスの間に捕獲用プローブのペアを標的核酸分子に結合させることにより、標的の捕獲を実行する。5'捕獲用プローブは3'ビオチン部分を含有しているため、標的堆積プロセスの間に、標的が、ストレプトアビジンで被覆したフローセルの表面に結合することができる。3'捕獲用プローブは、精製プロセスの間にビーズに結合できるようにする5'タグ配列(G配列)を含有している。反応速度は、反応速度を最大にするため低いナノモル範囲で添加される捕獲用プローブの濃度に支配される。捕獲用プローブは、興味ある領域に隣接するようにして標的にハイブリダイズしてシークエンシングウインドウを生成させる。それぞれのDNA標的について、捕獲用プローブセットは、標的のアンチセンス鎖にハイブリダイズして再アニーリングを阻止するため、シークエンシングウインドウと配列が同じ構成のオリゴも含んでいる。捕獲用プローブを含有する溶液を3分間にわたって98℃に加熱してゲノムDNAを変性させた後、65℃で15分間インキュベートする。400 mM~600 mMの範囲の濃度のNaClをこのハイブリダイゼーション反応で用いる。実験で確認されている100個超の標的からなるパネルを表3に掲載してある。この表には、遺伝子と、標的となるDNA領域のエキソンが詳しく記載されている。
【表3】
【0357】
捕獲用プローブを標的となるDNA領域に結合させた後、ゲノムDNAの残部から精製すると、標的が豊富になった溶液が生じる。3'捕獲用プローブの結合配列に対するアンチセンスオリゴ(アンチG配列)で被覆したビーズを捕獲反応混合物とともに室温で15分間インキュベートする。この結合工程の後、ビーズを0.1×SSPEで3回洗浄して非標的DNAとビオチン含有5'捕獲用プローブを除去する。洗浄の後、ビーズを14μlの0.1×SSPEに再懸濁させ、次いで10分間にわたって45℃に加熱して精製されたDNA標的をビーズから溶離させる。溶離後、1μlの5 M NaClを添加して捕獲用プローブがDNA標的に結合したままになるようにする。
【0358】
サンプル調製プロセスの最終工程は、DNA標的をフローセルの表面に堆積させることであり、前記場所で本明細書に開示されているようにして本開示のプローブを用いてDNA標的を分析することができる。シリンジポンプを用いて標的をフローセルの流体チャネルに装填する速度を制御する。前記ためすべての標的に、チャネルの高さを横断して拡散してストレプトアビジンの表面に結合する時間がある。この装填法によって標的の密度勾配が生じ、単位面積当たりの分子数は流体チャネルの入口において最大になり、出口に向かう流体流の方向でチャネルの長さに沿って減少していく。0.35μl/秒という流速だと、幅が1.6 mmで高さが40μmのチャネルでは約10 mmのチャネルの長さの中に大量の捕獲が実現する。ビオチニル化された5'捕獲用プローブによって標的が表面に結合すると、3'捕獲用プローブの結合配列の逆相補体であるビオチニル化されたオリゴ(Gフック)の溶液が注入されて標的の自由端が垂れ下がり、架橋した構造を生み出す。前記中央部の中のssDNA領域が、興味あるシークエンシングウインドウである。次に、G配列オリゴの溶液を添加して表面にある過剰なGフックにハイブリダイズさせ、前記表面上のssDNAの量を減らす。図11は、本開示による2つの捕獲用プローブシステムを用いた1個の標的核酸の捕獲を示している。
【0359】
実施例7:Hyb & Seqのための多色レポータ画像処理
【0360】
画像処理パイプラインに含まれる工程は、バックグラウンドを差し引く工程、登録する工程、特徴を検出する工程、分類の工程である。バックグラウンドを差し引く工程では、所与の任意のチャネルの平均バックグラウンドは、ショット雑音と露出の関数である。われわれのシステムでは、青色チャネルが最大レベルのバックグラウンドを持ち、それよりも大きな変動がカップルしている。半径が7画素の円形構造要素を有する単純なシルクハット形フィルタを適用して局在化したバックグラウンドを差し引く。登録に関しては、多色かつ多サイクルの特徴分析のため、興味ある特徴を完全にアラインメントすることが必須である。このシステムは、2つの形態の登録を必要とする。第1の形態に関しては、単一取得スタックの中のあらゆる画像チャネルに局所アフィン変換を適用する。この変換は光学系の関数であるため、所与の装置に適合している。この関数をすべての試行についてあらかじめ計算しておき、取得したすべての画像に適用する。第2の形態に関しては、規格化された交差相関を利用して固定シフトの形態の全体変換を計算し、試行中の機械的ガントリのドリフトを捕獲する。次の工程は特徴の検出である。
【0361】
すべての画像が登録されると、一致したフィルタを用い、LoG(Laplacian of Gaussian)フィルタを通じて特徴を検出する。フィルタは、スポットの応答の増強と一致させるため、(特徴の回折限界に一致した)固定されたカーネルサイズと(対応するチャネルの波長に一致した)変化する標準偏差で適用する。極大を用いてレポータの潜在的な位置を同定する。同定されたそれぞれの特徴に関連する強度値を回収して分類する。最終工程は分類である。ガウス型ナイーブベイズモデルを用いて多色レポータの強度を分類する。このモデルは、レポータの強度が互いに独立であって正規分布に従うことを仮定している。次にこのモデルで、最大事後(maximum a posteriori)規則、すなわちMAP規則を用い、(すべてのチャネルxlにおける強度によって指定される)特定の特徴yが所定のクラス(Ck)に属する確率を計算する。
【数1】
【0362】
個々の色組み合わせで標識したレポータ複合体の強度分布を図36に示してある。図36は、青と赤の2つの染料を用いたコード化スキームを示している。2色コーディングシナリオでは6つのクラス(バックグラウンドを含む)が存在する。実現したシステムでは、4色を選択することで14のクラスが可能になっている。単一の半染料と全染料の分布の間にはいくらか重複があることに注意されたい。前記帰結として、これらクラスの間での分類はより大きなエラー率を示し、「xG」と「GG」の間で誤って分類される割合の最大値は11.8%である。10クラスモデルで誤って分類される割合は0.2%未満である。各レポータは最大で8つのクラスを必要とするため、分類エラーが最小のものを選択するのは簡単である。検出された色コードを、参照表に基づき、同定された塩基対に翻訳する。本明細書に開示した本開示のプローブを用いて複数のサイクルで特徴を追跡する。
【0363】
実施例8:捕獲用プローブを用いた標的核酸の精製と堆積
【0364】
標的核酸分子を捕獲するのに2つの捕獲用プローブシステムを用い、極めて特異的な豊富化を実現する。捕獲用プローブを、標的とする興味ある領域に隣接した位置で標的核酸に結合するように設計し、「シークエンシングウインドウ」を生み出す。5'捕獲用プローブ(CapBと呼ぶ)は3'ビオチン部分を含有している。3'捕獲用プローブ(CapAと呼ぶ)は、5'親和性タグ配列(G配列と呼ぶ)を含有している。平均して捕獲用プローブは長さが約40個のヌクレオチドであり、Tmと配列の文脈に基づいて設計される。シークエンシングウインドウは長さが約70個のヌクレオチドであり、容易に調節される。図11は、2つの捕獲用プローブシステムの模式図を示している。
【0365】
CapB上のビオチン部分が、標的核酸を、ストレプトアビジンで被覆したシークエンシング用フローセルの表面に接続している。CapB上の親和性タグにより、精製中に標的核酸分子を磁性ビーズに可逆的に結合させることが可能になる。CapAとCapBを用いることで、高度なストリンジェンシーでの標的豊富化が可能になる。というのも両方のプローブが1個の標的核酸分子に結合したままになり、前記標的が磁性ビーズ精製プロセスと表面堆積プロセスの両方を生き延びるからである。多重捕獲は、一度に100個までの標的で証明されている。短時間での効率的な捕獲を実現するため、捕獲用プローブは1 nM~10 nMの範囲の濃度で添加する。
【0366】
実験的な試験において、約10個の標的核酸分子からなるパネルを、Gビーズと2つのプローブ捕獲システムを用いて精製した。CapAプローブとCapBプローブが標的核酸に最初にハイブリダイズした。次に、結合したCapAプローブのG配列部分がGビーズ上のGフックにハイブリダイズすることで、標的核酸分子がGビーズに連結される。0.1×SSPEを用いた一連のストリンジェントな洗浄を実施して標的とされないDNAと結合しなかったCapBを除去した。標的核酸分子をGビーズから放出させるため、低い塩濃度で45℃にて溶離させてG配列を変性させる一方で、CapAとCapBは標的核酸にハイブリダイズしたままになるようにした。
【0367】
試験から、約100個の標的核酸分子からなるパネルを精製するとき、非特異的な信号/バックグラウンドの信号が有意に増加することがわかる。バックグラウンドのこの増加は、いくつかの因子に起因する可能性がある。すなわち、(1)CapAプローブ種とCapBプローブ種の間の相互作用が増加し、それが精製を通じて持ち越される増加した量の遊離したCapBプローブにつながることと、(2)CapBプローブとGフックまたはGビーズとの間の相互作用が増加し、それが望まない標的核酸の精製につながることである。さらに、パネルのサイズが大きくなるにつれて、CapB種とCapA種とシークエンシング用プローブの間で可能な相互作用が指数関数的に大きくなる。これら相互作用は、標的を密に堆積させる能力に干渉する可能性があるため、シークエンシングの読み出しが無駄になる。
【0368】
遊離したプローブ種と望まない標的核酸分子の精製に起因する非特異的な信号とバックグラウンドの信号を減らすため、精製手続きをいくらか改変することができる。第1に、標的核酸分子をGビーズに結合させるときに用いる緩衝液の中にホルムアミドを30%v/vの濃度で含めると、(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が1/2に減少する。これはおそらく干渉によって遊離した捕獲用プローブがGフックと不完全にハイブリダイズすることによるのであろう。前記ため過剰なプローブを洗い流すことができる。第2に、Gビーズ上のGフックの中に4個のイソdG塩基を含め、CapA G配列の中に相補的イソdC塩基を含めると、(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が1/3に減少する。イソdCとイソdGは天然のdC塩基とdG塩基の異性体バリアントである。イソ塩基は他のイソ塩基と塩基対を形成するが天然塩基とは塩基対を形成しないため、捕獲用プローブとイソGフックの間の不完全なハイブリダイゼーションだけが、G配列の非イソ塩基とイソGフックの間に存在することができる。これらの不完全な相互作用は、ストリンジェントな洗浄の間により簡単に破壊される。最後に、Ampure(登録商標)XP(Agencourt Biosciences Company社)ビーズを用いたイソGビーズの前記後の精製によって(標的分子を欠く対照におけるカウント数によって測定したとき)バックグラウンドのカウント数が少なくとも1/20に減少する。Ampure(登録商標)XPビーズを用いた精製の間、ポリエチレングリコール(PEG)とNaClの溶液中でDNAサンプルをカルボキシル化された磁性ビーズの懸濁液と混合する。PEGとNaClの濃度を滴定し、分子量の閾値を超えた分子だけが沈殿してビーズに結合するようにできる。捕獲用プローブにハイブリダイズしたHyb & Seq標的は81 kDaのオーダーであるのに対し、遊離したプローブは17 kDa以下のオーダーである。Ampure(登録商標)XPビーズの懸濁液をイソGビーズ溶離液と体積比1.8:1で混合することにより、ハイブリダイズした標的はビーズに結合するため、遊離したプローブの有意な部分を最終的な溶離の前に洗い流すことができる。
【0369】
したがってモデル精製作業フローは以下の工程からなる:(1)5×SSPE/30%ホルムアミドの中で捕獲用プローブ-標的核酸複合体をイソGビーズにハイブリダイズさせる;(2)0.1×SSPEを用いてイソGビーズを洗浄する;(3)0.1×SSPEの中で45℃にて捕獲用プローブ-標的核酸複合体を溶離させる;(4)イソGビーズ溶離液を1.8倍の体積のAmpure(登録商標)XPビーズに結合させる;(5)75%エタノールを用いてAmpure(登録商標)XPビーズを洗浄する;(6)0.1×SSPEの中で捕獲用プローブ-標的核酸複合体を溶離させると標的が7.5μlの中に溶離するため、前記後に0.5μlの5 M NaClを添加する。
【0370】
精製の後、輸液シリンジポンプを用いて捕獲用プローブ-標的核酸複合体をシークエンシング表面に堆積させ、精製された標的をフローセルにゆっくりと注入する。堆積勾配を求めるため、フローセルをチャネルの長さに沿ったさまざまな位置で撮影する。典型的な堆積勾配を図37に示してある。チャネルの高さが20μmだと、サンプルを0.167μl/分の流速で装填すると標的が濃縮され、全標的の80%がチャネルの長さに沿って5.1 mm以内に結合する。これは、FOVが0.0357 mm2、フローセルのチャネル幅が1.7 mmのGen2イメージャでは約240 FOVであることを表わしている。勾配は、堆積中の流速を調節することによって変えることができる。
【0371】
上に記載した手続きを利用して、約300塩基対のサイズに剪断されたゲノムDNAを有する100重の標的核酸パネルの精製と堆積を調べた。DNA入力の範囲を25 ng~500 ngにして一連の実験を三重に実施した。図38に示してあるようにフローセル上の標的の合計数を堆積勾配のイメージングによって外挿し、平均カウント数を取得した。捕獲効率は6.6%であり、DNA質量入力の範囲で一貫性があった。
【0372】
実施例9:シークエンシング用プローブの設計と特徴
【0373】
シークエンシング用プローブは標的結合ドメインを介して標的核酸分子にハイブリダイズする。この実施例では、標的結合ドメインは長さ8個のヌクレオチドであり、(N)塩基((N)塩基として、ユニバーサル塩基/縮重塩基または正規塩基が可能である)が隣接した架橋型核酸(LNA)6量体を含有している(N1-B1-B2-B3-B4-B5-B6-N2、ここで、B1~B6はLNAであり、N1とN2は、(6量体)配列B1-B2-B3-B4-B5-B6とは独立なユニバーサル塩基/縮重塩基または正規塩基である)。4,096通りのシークエンシング用プローブの完全なセットは可能なすべての6量体をコードしているため、任意の標的核酸のシークエンシングが可能である。それぞれのシークエンシング用プローブは、標的結合ドメインの中に存在する6量体配列をコードするバーコードドメインも含んでいる。それぞれのバーコードドメインは、3つの位置(R1、R2、R3)を含有している。バーコードドメインの中の各位置は、標的結合ドメインの6量体の中の特定のジヌクレオチドに対応し、特定の標識されたレポータ複合体に結合することのできる独自の配列を含有している。シークエンシング用プローブ全体の模式図を図1に示してある。バーコードドメインの中の各位置は、4つの蛍光染料、すなわち青(B)、緑(G)、黄(Y)、赤(R)を用いて作り出される8通りの「色組み合わせ」をコードしている。シークエンシングの各サイクル中にレポータ複合体がバーコードドメインの中の3つの位置のうちの1つに結合する。これは、標的結合ドメインの6量体の中の対応するジヌクレオチドの属性を示している。3回の連続したシークエンシングサイクルの間に3つの「色組み合わせ」が、バーコードドメインの中の各位置につき1つ記録されるため、標的結合ドメインの6量体全体の同定が可能になる。4,096通りのシークエンシング用プローブは8つのプールに分割され、それぞれは512の可能なバーコードのうちの1つと関係している。
【0374】
実施例10:レポータ複合体の設計、精製、結合の条件
【0375】
この実施例では、各レポータ複合体は37個のDNAオリゴマーからなる分岐構造であり、合計30個の蛍光染料(色組み合わせのそれぞれの色の染料が15個)を保持する設計にされていた。レポータ複合体を構成する37個のDNAオリゴマーはサイズによって分類することができる。一次核酸と呼ばれる最大のオリゴマーは、長さが12個または14個のヌクレオチドである相補的核酸に共有結合する。一次核酸は、長さが96個のヌクレオチドである。相補的一次核酸は、シークエンシング用プローブのバーコードドメイン上の位置R1、R2、R3のいずれかに結合する。次に大きいDNAオリゴマーは長さが89個のヌクレオチドであり、二次核酸と呼ばれる。レポータ複合体1つにつき6個の二次核酸が存在していて、色組み合わせのそれぞれの色につき3個の二次核酸である。それぞれの二次核酸はヌクレオチド14個の長さの配列を含んでいて、前記配列により二次核酸が一次核酸にハイブリダイズすることが可能になる。最小のDNAオリゴマーは長さが15個のヌクレオチドであり、三次核酸と呼ばれる。2色プローブ1つにつき30個の三次核酸が存在していて、1色につき15個の三次核酸である。37個のDNAオリゴマーからなる分岐構造の模式図を図4に示す。
【0376】
三次核酸は、蛍光染料の形態になった検出可能な標識を含んでいる。4種類の蛍光染料、すなわち青(B)、緑(G)、黄(Y)、赤(R)が存在している。1つのレポータ複合体の中で染料を組み合わせると、2色の組み合わせが10通り可能になる(BB、BG、BR、BY、GG、GR、GY、RR、YR、YY)。異なる蛍光染料の間の色の交換または交差ハイブリダイゼーションを阻止するため、特定の蛍光染料に対応するそれぞれの二次核酸と三次核酸は独自の配列を含有している。例えばAlexa 288蛍光体すなわち青色で標識したそれぞれの三次核酸は、青色二次核酸に対してだけ相補的な配列を含んでいる。青色二次核酸はさらに、青を含む色組み合わせに対応する一次核酸分子に対してだけ相補的な異なる配列を有する。
【0377】
それぞれの相補的核酸は、シークエンシング用プローブのバーコードドメインの位置R1、R2、R3の間で互いに異なる配列を含有している。したがって同じバーコードドメインの位置R1とR2が同じジヌクレオチドをコードしている場合でさえ、位置R1の前記ジヌクレオチドを同定する相補的核酸分子が位置R2に結合することはない。同様に、位置R2の前記ジヌクレオチドを同定する相補的核酸分子が位置R1に結合することはない。相補的核酸は、競合的トーホールド交換(長さが12個のヌクレオチドである相補的核酸の場合)を利用するか、UV切断(長さが14個のヌクレオチドである相補的核酸の場合)を利用してシークエンシング用プローブから効率的に外れることができるように設計される。
【0378】
レポータ複合体の調製は、(1)三次核酸を二次核酸にハイブリダイズさせた後、(2)三次核酸+二次核酸を一次核酸にハイブリダイズさせるという2つの連続したハイブリダイゼーション工程で起こる。4.2×SSPE緩衝液の中で100μMの二次核酸と600μMの三次核酸を室温で30分間にわたって組み合わせることにより、二次核酸に対する三次核酸の反応物を別々に4つ調製する。次に、4.8×SSPEの中で2μMの一次核酸、7.2μMの二次核酸+染料#1三次核酸、7.2μMの二次核酸+染料#2三次核酸を用いて24のレポータプローブを別々に調製する。これらの反応物を5分間45℃に加熱した後、30分間室温に冷却する。次に、これら24の反応物を、バーコードドメインに対応する3つの異なるプールに分類する(すなわちR1、R2、R3)。例えばR1バーコードドメインに結合した8つの異なるレポータプローブ(それぞれ2μM)をまとめてプールし、10倍に希釈して各レポータ複合体が200 nMという最終作業濃度にする。レポータ複合体は高圧液体クロマトグラフィ(HPLC)を利用して精製することができる。図39は、遊離したオリゴマーとうまく形成されなかったプローブをHPLC精製によって除去してレポータプローブを取得できることを示している。
【0379】
レポータ複合体を調製した後は、品質保証のための標準的な試験である。3つの別々のフローセルの中で、レポータプローブの3つのプールのそれぞれを、対応するバーコード領域(R1、R2、R3のいずれか)への結合に関して試験する。試験は、バーコードドメインが1つだけ存在していてフローセルの表面に固定化されている修飾されたシークエンシング用プローブコンストラクトで実施する。それぞれの色を表わす8個の12量体すべてを多重化すると、8つのレポータプローブすべてが大きな色カウント数で同定されることが予想される。
【0380】
レポータプローブとシークエンシング用プローブのバーコードドメインのハイブリダイゼーションの効率と精度を向上させるため、さまざまな緩衝液添加物を試験した。図40は、5%硫酸デキストラン(500K)と、15%ホルムアミドまたは15%炭酸エチレンとを含有する緩衝液により、レポータプローブとシークエンシング用プローブのハイブリダイゼーションが短時間のうちに最高の効率と精度で可能になることを示す実験からの結果を示している。しかし図41は、炭酸エチレンがシークエンシング用スライドの表面に対してマイナスの影響を持ち、前記結果として時間が経つと標的核酸が大きく失われることを示す実験からの結果を示している。したがって5%硫酸デキストラン(500K)と15%ホルムアミドを含有する緩衝液が、レポータプローブとシークエンシング用プローブの効率的で正確なハイブリダイゼーションに関してより優れている。
【0381】
実施例11:相補的核酸配列の設計と確認
【0382】
レポータプローブは、シークエンシング用プローブのバーコードドメイン上の特定の位置(R1、R2、R3のいずれか)に結合する相補的核酸を含有している。12個のヌクレオチド(12量体)または14個のヌクレオチド(14量体)を含有する相補的核酸を設計して試験し、ハイブリダイゼーションに最も適した配列を求めた。スクリーニングのため、以下の基準を用いて最適な配列を求めた。すなわち前記基準とは、レポータプローブとシークエンシング用プローブが10回のシークエンシングサイクルで80%超の効率で結合するという大きな結合効率を配列が示さねばならないことと;配列が15秒~30秒以内に起こる速いハイブリダイゼーション速度を示さねばならないことと;配列がレポータプールにおいて5%未満の交差ハイブリダイゼーションエラーという大きな特異度を示さねばならないことである。
【0383】
表4は、同定された24通りの12量体配列を示している(配列番号19~42)。各バーコードドメインは3つの位置を含有しているため、24通りの12量体配列を3つのグループに分割して8×8×8 12量体レポータセットを作り出すことができる。
【表4】
【0384】
同様にして14量体配列を設計したが、3つの点で12量体配列とは異なっている。第1に、14量体配列はより長いハイブリダイゼーション配列を含有している。というのも14量体配列は、バーコードドメイン上の特定の位置に結合する14個の一本鎖ヌクレオチドを、12量体の中に存在する12個の一本鎖ヌクレオチドの代わりに含有しているからである。第2に、14量体配列は、配列の多様性がより大きい。なぜなら14量体配列はトーホールドを介した除去に適した設計にしなかったからである。14量体配列はシークエンシング用プローブにより強くハイブリダイズするため、トーホールドを介した除去の効率が低下する。したがって14量体配列に関しては配列と独立な除去戦略を探し、スクリーニング中の配列の制約を緩和した。以下の一群の規則を含むアルゴリズムを利用してスクリーニングのための配列を設計した。前記規則とは、「G」または「C」を欠くヌクレオチド組成(すなわち複雑さが低い配列);GC含量が40%~60%;融点(Tm)が35℃~37℃;ヘアピン折り畳みエネルギー(dG)が2超;他のシークエンシング用プローブとの適合性(ハミング距離が7以上)である。標的核酸の中に存在する可能性のあるゲノム配列に対する14量体配列のハイブリダイゼーションをできるだけ少なくするため、外部RNA管理コンソーシアム(External RNA Controls Consortium)配列をガイドとして用いて可能性のある配列をフィルタした。第3に、14量体相補的核酸がレポータ複合体の一次核酸に付着している位置で切断可能なリンカー修飾を利用して鎖を切断することによってシークエンシング用プローブのバーコードドメインから除去されるように14量体配列を設計した。14量体配列を除去するとレポータ複合体の信号の「暗化」が起こり、次のスクリーニングサイクルと信号の検出が可能になる。UV光で切断可能なリンカー、還元剤(TCEPなど)で切断可能なリンカー、酵素で切断可能なリンカー(USER(商標)酵素によって切断されるウラシルなど)を含むさまざまな切断可能なリンカー修飾を調べた。これらの切断可能なリンカー修飾のすべてが、レポータ複合体の効率的な暗化を促進することが見いだされた。暗化は、切断可能なリンカー修飾を二次核酸の中に導入することによってさらに増強された。これらの切断可能なリンカー修飾は、一次核酸にハイブリダイズする配列と、三次核酸にハイブリダイズする配列の間に位置させた。図10は、切断可能なリンカー修飾にとってレポータプローブの中で可能な位置を示している。
【0385】
可能性のある14量体配列のスクリーニングにより、受容可能な配列の2つのグループが同定された。表5は第1のグループを示しており、ここには24個の配列が含まれていた(配列番号43~66)。これら24個の配列を3つのグループに分けて8×8×8 14量体レポータセットを作り出すことができた。
【表5】
【0386】
表6は、他方のグループを示している。ここには30個の配列(配列番号67~96)が含まれていた。これら30個の配列を3つのグループに分けて10×10×10 14量体レポータセットを作り出すことができた。
【表6】
【0387】
スクリーニングの後、8×8×8 12量体レポータセット、8×8×8 14量体レポータセット、10×10×10 14量体レポータセットを実験で確認した。8×8×8 12量体結合スキームに関しては、Hyb & Seqプロトタイプを用いて確認を実行し、10回のシークエンシングサイクルを記録した。長い作業フロー法と短い作業フロー法の両方においてレポータプローブの3つのプールを使用した。512の可能なシークエンシング用プローブのバーコードドメインをすべて調べた。表7は、長い作業フロー法と短い作業フロー法の実験工程を示している。
【表7】
【0388】
長い作業フロー実験によって暗化効率が97%超になった。短い作業フロー実験に関しては暗化が同様に効率的であると推定したが、暗化されないレポータが各画像にわずかな頻度で残って新しいレポータと間違って呼ばれる可能性があることが予想された。実際、短い作業フロー実験でバーコードカウント数が最も多かったのはYYYYYYであった。これは、暗化していないアーチファクトとバックグラウンドである可能性が大きかった。図42は、短い作業フローでは長い作業フローと比べて8×8×8 12量体レポータセットの性能が一般に低いことを示している。(バーコードドメインの位置R1に結合する)レポータ複合体1と(バーコードドメインの位置R3に結合する)レポータ複合体3は、短い作業フローでは長い作業フローと比べて効率が低かった。レポータ複合体3ではそうなることが予想される。というのもレポータ複合体3は、8個の追加トーホールドオリゴヌクレオチドをそれぞれ2.5μMという高い濃度で含んでいるため、レポータのハイブリダイゼーションに干渉する可能性があるからである。レポータ複合体1は、2つの作業フローで同様に機能するはずである。というのも短い作業フローと長い作業フローのどちらでも、第1のレポータ複合体の除去にトーホールドを使用しなかったからである。全エラーも、3つのレポータプローブのすべてで、短い作業フローでは長い作業フローよりも多かった(1.3~2倍)。
【0389】
可能な512のシークエンシング用プローブすべてのバーコードドメインに対する効率、特異度、ハイブリダイゼーションの速度を調べることによって8×8×8 14量体レポータセットを確認した。シークエンシング用プローブのバーコードドメインは、Hyb & Seqシークエンシングカートリッジのガラスの表面に直接固定化した。図43は、8×8×8 14量体レポータプローブがわずか15秒の間に平均効率88%でハイブリダイズして平均エラー率が5.1%であることを示している。このエラーの大半は、正確でないハイブリダイゼーションが原因ではなく、レポータの正確ではない同定に起因する。レポータの分類ミスは、レポータエラーの最大の原因のままである。
【0390】
30個の相補的頭部切断シークエンシング用プローブのバーコードドメインに対する効率、特異度、ハイブリダイゼーションの速度を調べることによって10×10×10 14量体レポータセットを確認した。それぞれのバーコードドメインはレポータ結合部位を1つだけ含有していた。これらバーコードドメインは、Hyb & Seqシークエンシングカートリッジのガラスの表面に直接固定化した。図44は、10×10×10 14量体レポータセットがわずか15秒の間に平均効率90%でハイブリダイズして平均エラー率が5.0%であることを示している。ここでも、エラーの大半は、正確でないハイブリダイゼーションが原因ではなく、レポータの正確ではない同定に起因していた。
【0391】
実施例12:標準シークエンシング用プローブと3部構成シークエンシング用プローブの設計と試験
【0392】
シークエンシング用プローブの標的結合ドメインとバーコードドメインは二本鎖「ステム」によって隔てられている。図2は、実験で調べたシークエンシング用プローブの2つのアーキテクチャを示している。標準シークエンシング用プローブでは、標的結合ドメインとバーコードドメインは同じオリゴヌクレオチド上に存在し、前記オリゴヌクレオチドがステムオリゴヌクレオチドに結合して36個のヌクレオチドの長さがある二本鎖領域を生み出している。このアーキテクチャを用いると、プローブのプールの中の各シークエンシング用プローブは同じステム配列を利用する。3部構成プローブでは、標的結合ドメインとバーコードドメインは別々のDNAオリゴヌクレオチドであり、36個のヌクレオチドからなるステムオリゴヌクレオチドによって互いに結合している。起こる可能性のあるバーコードドメインの交換を阻止するため、各バーコードは独自のステム配列を持っていて、シークエンシング用プローブをプールする前に別々にハイブリダイズさせる。
【0393】
図45は、3部構成シークエンシング用プローブを標準シークエンシング用プローブと比べた一連の実験の結果を示している。これらの実験から、3部構成シークエンシング用プローブが、第3のレポータプローブの検出を含め、両方の構成に関するあらゆる読み出しの約80%で1つのシークエンシングサイクル全体を生き延びることが確認された。3部構成プローブは、標準シークエンシング用プローブと比べて約12%少ないカウント数を示す。バーコードドメインオリゴの交換の傾向を研究するため、同じステム配列を含有する高濃度の短い代替オリゴヌクレオチドを反応物に添加した。結果は、検出された3部構成シークエンシング用プローブの約13%がバーコードオリゴを交換していたことを示していた。オリゴヌクレオチドの交換は、独自のステム配列を組み込むことによって緩和する必要があろう。3部構成プローブは、性能がわずかに低いにもかかわらず、設計の柔軟性、迅速なオリゴ合成、コスト低減という利点を提供する。
【0394】
実施例13:標的結合ドメインの中の架橋型核酸置換の効果
【0395】
シークエンシング用プローブの標的結合ドメインの中に置換によって架橋型核酸(LNA)を入れることの効果を以下のようにして調べた。溶液の中でシークエンシング用プローブをレポータプローブにハイブリダイズさせ、適切に形成されたシークエンシング用プローブ-レポータプローブを精製した。次に、溶液の中でシークエンシング用プローブ-レポータプローブを合成標的核酸にハイブリダイズさせ、プロトタイプシークエンシングカートリッジの表面に装填した。合成標的核酸は50個のヌクレオチドからなり、ビオチニル化されていた。シークエンシング用プローブを個別に、または9つのシークエンシング用プローブのプールの中で試験した。9つのシークエンシング用プローブのプールに関しては、プローブを、標的核酸の長さに沿って結合する設計にした。分析のため、ストレプトアビジンで被覆したカバースライドの表面に反応物全体を回路基板装置によって堆積させた後、流体力で伸長させた。次にレポータプローブの画像を取得し、適切な装置とソフトウエア(例えばNanoString nCounter(登録商標)装置とソフトウエア)を利用してカウントした。
【0396】
それぞれのシークエンシング用プローブは、10個のヌクレオチド(配列番号97)からなる標的結合ドメインを含有していた。標的結合ドメイン内のLNA置換を実行し、2個、または3個、または4個のLNA塩基が図46に示した位置に含まれるようにした。図46は、LNA塩基の数が増えるにつれて標的核酸に対する個々のシークエンシング用プローブの結合親和性が大きくなったことを示している。重要なことだが、図46は、LNA塩基の組み込みによってシークエンシング用プローブの結合の特異度は低下しなかったことを示している。9つのシークエンシング用プローブのプールを試験し、プローブが標的への結合を完了できたときの塩基カバレッジを求めた。図47は、単一のLNAプローブをプールの中に導入したとき、影響を受ける塩基のカバレッジは増加するが、周囲のプローブの結合にはほとんど影響を与えなかったことを示している。これらの結果は、LNA塩基による置換が特異度の低下なしに塩基感受性を向上させうることを示していた。
【0397】
実施例14:標的結合ドメインの中の修飾されたヌクレオチドと核酸類似体による置換の効果
【0398】
さまざまな修飾されたヌクレオチドと核酸類似体(架橋型核酸(LNA)、架橋した核酸(BNA)、プロピンで修飾された核酸、ジップ核酸(ZNA(登録商標))、イソグアニン、イソシトシンが含まれる)による置換をシークエンシング用プローブの標的結合ドメインの中に導入することの効果を以下のようにして調べた。長さが50個のヌクレオチドであるビオチニル化された標的核酸を、プロトタイプシークエンシングカートリッジのストレプトアビジンカバースライドの表面に装填した。次にシークエンシング用プローブとレポータプローブをサンプル室の中に順番に導入し、Hyb & Seqプロトタイプ装置を用いて画像を取得した。異なるそれぞれのシークエンシング用プローブについて画像を処理してカウント数を比較した。シークエンシング用プローブの10個のヌクレオチド(配列番号99)からなる標的結合ドメインで置換を実行し、図48に示した位置にLNA塩基、BNA塩基、プロピン塩基、ZNA(登録商標)塩基が含まれるようにした。図48は、LNAとBNAを含有するプローブが結合親和性に関して最大の増加を示した一方で、特異度は維持したことを示している。前記ことは、一致した標的とミスマッチの標的で検出されたカウント数に示されている。これらの結果は、LNA塩基またはBNA塩基による置換が特異度の低下なしに塩基感受性を向上させうることを示していた。
【0399】
実施例15:本開示によるシークエンシング法の精度を求める
【0400】
図49は、本開示によるシークエンシング法の生の特異度を定量する実験からの結果を示している。この実験では、異なる4つのシークエンシング用プローブのプールを、NRASエキソン2(配列番号1)の断片を含む標的核酸にハイブリダイズさせるというシークエンシング反応を実施した。それぞれのシークエンシング用プローブ(バーコード1~4)は、図49の上図に示したように、6量体の位置b5が異なる以外は同じである標的結合ドメインを持っていた。この実施例では、バーコード4は正しいシークエンシング用プローブである。シークエンシング用プローブをハイブリダイズさせた後、バーコードドメインの3つの位置(R1、R2、R3)のそれぞれにレポータプローブを順番にハイブリダイズさせ、対応する蛍光データを記録した。図49の中央の図は、3つのバーコードドメインの位置について、それぞれの色組み合わせが記録された回数と、正しい組み合わせが記録された回数の割合を示している。R1における色組み合わせは96%の回数で正しく同定され、R2における色組み合わせは97%の回数で正しく同定され、R3における色組み合わせは94%の回数で正しく同定された。図49の下図に示してあるように、こうすることで全体的な生の特異度が94%になる。バーコードドメインの位置が誤って読み取られたことを説明できる可能性のあるエラー発生源に含まれるのは、(a)フローセルの表面へのレポータプローブの非特異的結合と、(b)レポータプローブの正確でないハイブリダイゼーションである。レポータハイブリダイゼーションエラーの推定値は約2~4%であった。
【0401】
図50は、標的核酸の中のヌクレオチドを2つ以上のシークエンシング用プローブによってシークエンシングするときの本開示によるシークエンシング法の精度を求める実験からの結果を示している。図50の上図に示してあるように、この実施例の標的核酸は、NRASエキソン2(配列番号1)の断片である。興味ある特定の塩基は、標的核酸の中で強調してあるシトシン(C)である。興味あるこの塩基は、2つの異なるシークエンシング用プローブにハイブリダイズし、標的核酸へのハイブリダイゼーションのフットプリントがそれぞれ異なることになる。この実施例では、シークエンシング用プローブ1~4(バーコード1~4)は、興味ある塩基の左側に3個のヌクレオチドを結合させる一方で、シークエンシング用プローブ5~8(バーコード5~8)は、興味ある塩基の左側に5個のヌクレオチドを結合させる。図50の中央の図は、シークエンシング用プローブのバーコードドメインのそれぞれの位置で特定の色組み合わせが記録された回数を示している。画像の定量後、図26に示した塩基読み取り技術を利用すると、約98.98%という平均精度を記録することができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12-1】
図12-2】
図13
図14
図15-1】
図15-2】
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28-1】
図28-2】
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38
図39
図40-1】
図40-2】
図41
図42
図43
図44
図45
図46
図47
図48
図49
図50
【配列表】
0007532458000001.app