(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023082003
(43)【公開日】2023-06-13
(54)【発明の名称】配列決定および高分解能画像化の方法
(51)【国際特許分類】
C12Q 1/6874 20180101AFI20230606BHJP
C12M 1/00 20060101ALI20230606BHJP
C12M 1/34 20060101ALI20230606BHJP
G01N 33/53 20060101ALI20230606BHJP
G01N 37/00 20060101ALI20230606BHJP
【FI】
C12Q1/6874 Z
C12M1/00 A
C12M1/34 Z
G01N33/53 M
G01N37/00 102
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2023038310
(22)【出願日】2023-03-13
(62)【分割の表示】P 2020500031の分割
【原出願日】2018-03-19
(31)【優先権主張番号】62/473,163
(32)【優先日】2017-03-17
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】515132515
【氏名又は名称】アプトン バイオシステムズ インコーポレイテッド
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【弁理士】
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】ステイカー ブライアン ピー.
(72)【発明者】
【氏名】リウ ニャンドン
(72)【発明者】
【氏名】フルタード マノハル アール.
(72)【発明者】
【氏名】ファン リシュン
(72)【発明者】
【氏名】バーンズ ノーマン
(72)【発明者】
【氏名】オーエンス ウィンザー
(57)【要約】 (修正有)
【課題】高密度で固定化された複数のポリヌクレオチドを配列決定するための方法を提供する。
【解決手段】a.表面上で別々の位置に固定化された複数のポリヌクレオチドを含む、配列決定のための試薬を含む基材を提供し;b.ポリヌクレオチドを標識を含む可逆的ターミネーターヌクレオチドのセットと接触させ、画像化し光学シグナルを検出し;c.画像からの光学シグナルのピーク位置を決定し;d.光学シグナルのピーク位置をオーバーレイし、ヌクレオチドの相対位置を決定するため光学分布モデルを適用し;e.相対位置及び関数を用いて、光学シグナルをデコンボリューションし;f.ポリヌクレオチドに組み込まれた標識を、デコンボリューションされた光学シグナルから同定し;並びに、g.各ポリヌクレオチドの位置で、複数サイクルにわたって同定された標識から、基材の表面上に固定化された複数のポリヌクレオチドを配列決定する工程を含む、方法である。
【選択図】
図17
【特許請求の範囲】
【請求項1】
基材の表面上に高密度で固定化された複数のポリヌクレオチドを配列決定するための方法であって、以下の工程を含む、方法:
a. 表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数のポリヌクレオチドを含み、かつ該表面が、合成による配列決定(sequencing by synthesis)のための試薬を含む、工程;
b. 以下を含む各サイクルを含む、単一分子の、合成による配列決定の、複数のサイクルを実施する工程:
i. 該ポリヌクレオチドを、検出可能な標識を含む可逆的ターミネーターヌクレオチドのセットと接触させること;
ii. 該ポリヌクレオチドに組み込まれた各ヌクレオチドからの光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化することであって、それにより該サイクルについて該フィールドにおける複数の光学シグナルを検出する、画像化すること;
c. 該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;
d. 各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各組み込まれたヌクレオチドの相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程;
e. 該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする工程;
f. 各フィールドおよび各サイクルについて、該ポリヌクレオチドに組み込まれた該検出可能な標識を、該デコンボリューションされた光学シグナルから同定する工程;ならびに
g. 各ポリヌクレオチドの位置で、該複数のサイクルにわたって同定された該検出可能な標識から、基材の表面上に固定化された該複数のポリヌクレオチドを配列決定する工程。
【請求項2】
前記基材が、同一配列を含むポリヌクレオチドの1,000以下、500以下、100以下、50以下、25以下、20以下、15以下、または10以下のクローンコピーを含む、請求項1に記載の方法。
【請求項3】
前記ポリヌクレオチドがDNAコンカテマーである、請求項1に記載の方法。
【請求項4】
各サイクルが、前記表面を前記複数の可逆的ターミネーターヌクレオチドと接触させることの後であってかつ前記フィールドを画像化することの前に、未結合のヌクレオチドを除去するために前記表面を洗浄することをさらに含む、請求項1に記載の方法。
【請求項5】
別のサイクルが実施されようとする場合に、前記サイクルが、前記可逆的ターミネーターを切断することをさらに含む、請求項1に記載の方法。
【請求項6】
別のサイクルが実施されようとする場合に、前記サイクルが、前記検出可能な標識を切断することをさらに含む、請求項1に記載の方法。
【請求項7】
可逆的ターミネーターヌクレオチドの前記セットが、それぞれ別個の検出可能な標識を有する少なくとも2つの別個のヌクレオチドを含む、請求項1に記載の方法。
【請求項8】
可逆的ターミネーターヌクレオチドの前記セットが、それぞれ別個の検出可能な標識を有する少なくとも4つの別個のヌクレオチドを含む、請求項1に記載の方法。
【請求項9】
可逆的ターミネーターヌクレオチドの前記セットが、アデニン、シトシン、チミン、およびグアニンを含む、請求項1に記載の方法。
【請求項10】
可逆的ターミネーターヌクレオチドの前記セットが、アデニン、シトシン、ウラシル、およびグアニンを含む、請求項1に記載の方法。
【請求項11】
前記ポリヌクレオチドがデオキシリボ核酸またはリボ核酸を含む、請求項1に記載の方法。
【請求項12】
前記複数の標的ポリヌクレオチドが約1 kb~約100 kbの長さを有する、請求項1に記載の方法。
【請求項13】
前記複数の標的ポリヌクレオチドが約10 kb~約50 kbの長さを有する、請求項1に記載の方法。
【請求項14】
表面に結合した前記ポリヌクレオチドが、少なくとも10 nmの距離によって隔てられる、請求項1に記載の方法。
【請求項15】
前記検出可能な標識が、前記可逆的ターミネーターヌクレオチドの3' -OH基に結合される、請求項1に記載の方法。
【請求項16】
検出可能な標識ではない保護基が、前記可逆的ターミネーターヌクレオチドの3' -OHに結合される、請求項1に記載の方法。
【請求項17】
前記複数の標的ポリヌクレオチドが、別々の位置で前記表面に結合した捕捉プローブへの結合によって固定化される、請求項1に記載の方法。
【請求項18】
前記複数の標的ポリヌクレオチドが、前記捕捉プローブの配列に相補的な捕捉配列および前記配列決定プライマーの配列に相補的なプライミング配列を含むアダプターに連結される、請求項17に記載の方法。
【請求項19】
前記捕捉配列が20マーから50マーである、請求項18に記載の方法。
【請求項20】
前記プライミング配列が20マーから50マーである、請求項18に記載の方法。
【請求項21】
同じ配列を有するポリヌクレオチドのセットを比較することによって、またはデータそれ自体に基づいて、位相誤差を補正するために前のサイクルの回帰を実施する工程をさらに含む、請求項1に記載の方法。
【請求項22】
前記デコンボリューションが、隣接するポリヌクレオチドからの干渉光学シグナルを、前記隣接するポリヌクレオチド間の中心間距離を用いて、前記決定された相対位置から除去する工程を含む、請求項1に記載の方法。
【請求項23】
前記デコンボリューション関数が最近傍変数回帰(nearest neighbor variable regression)を含む、請求項22に記載の方法。
【請求項24】
前記デコンボリューションが、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離する工程を含む、請求項1に記載の方法。
【請求項25】
前記デコンボリューション関数がクロストーク回帰(cross-talk regression)を含む、請求項24に記載の方法。
【請求項26】
前記デコンボリューション関数が、最近傍変数回帰、平滑化、またはクロストーク補正を含む、請求項1に記載の方法。
【請求項27】
前記ポリヌクレオチドが、単一分子の、合成による配列決定のために、前記基材上で離れて配置される、請求項1に記載の方法。
【請求項28】
配列決定されようとする別個のポリヌクレオチド配列を含む近接するポリヌクレオチドに結合したプローブからの前記検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、前記ポリヌクレオチドが、前記基材上に高密度に詰め込まれる、請求項1に記載の方法。
【請求項29】
前記表面上に固定化された前記ポリヌクレオチドが、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項1に記載の方法。
【請求項30】
前記表面上に固定化された前記ポリヌクレオチドの少なくとも2つが、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項1に記載の方法。
【請求項31】
前記表面上に固定化された前記ポリヌクレオチドの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が、別の固定化されたポリヌクレオチドから、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項1に記載の方法。
【請求項32】
前記光学システムが0.2~2.0の開口数を含む、請求項28~31のいずれか一項に記載の方法。
【請求項33】
前記光学システムが1~1.1の開口数を含む、請求項28~31のいずれか一項に記載の方法。
【請求項34】
前記放出される光の前記波長が、約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである、請求項28~33のいずれか一項に記載の方法。
【請求項35】
固定化されたポリヌクレオチドが、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接するポリヌクレオチド間の最少の中心間距離を含む、請求項1に記載の方法。
【請求項36】
ポリヌクレオチドが、1平方ミクロンにつき分子約4~25個の平均密度で前記表面上に固定化される、請求項1に記載の方法。
【請求項37】
ポリヌクレオチドが、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で前記表面上に固定化される、請求項1に記載の方法。
【請求項38】
前記表面の前記画像化が、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で実施される、請求項1に記載の方法。
【請求項39】
前記表面の前記画像化が、少なくとも2Xナイキストサンプリング周波数の分解能で実施される、請求項1に記載の方法。
【請求項40】
前記表面の前記画像化が、画像フィールドの1つの軸に沿って300 nmにつき1ピクセル、またはそれ以上の分解能で実施される、請求項1に記載の方法。
【請求項41】
前記表面の前記画像化が、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で実施される、請求項1に記載の方法。
【請求項42】
各サイクルからの前記フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成する工程をさらに含む、請求項1に記載の方法。
【請求項43】
前記オーバーサンプリングされた画像が、前記光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用することによって生成される、請求項42に記載の方法。
【請求項44】
前記フィールド画像もしくは前記オーバーサンプリングされた画像から、光学シグナルピークの位置を含むデータセットを生成する工程をさらに含む、請求項1または42に記載の方法。
【請求項45】
前記ピーク位置をオーバーレイする前記工程が、前記複数のサイクルから、各ポリヌクレオチドについての光学ピーク位置のクラスターを生成するために、複数の前記サイクルについて、各フィールドにおいて検出された前記光学シグナルピークの位置をアラインする工程を含む、請求項1に記載の方法。
【請求項46】
前記光学分布モデルがガウス分布である、請求項1に記載の方法。
【請求項47】
前記光学分布モデルが点像分布関数である、請求項1に記載の方法。
【請求項48】
前記相対位置が、前記フィールドにおける複数の前記ポリヌクレオチドについて決定される、請求項1に記載の方法。
【請求項49】
前記相対位置が、10 nm以内のRMSの正確性で決定される、請求項1に記載の方法。
【請求項50】
前記フィールドの参照画像に対して相対オフセットを決定するために、異なるサイクルからの前記フィールドの複数の画像をオーバーレイする工程をさらに含む、請求項1に記載の方法。
【請求項51】
前記参照フィールドにアラインされた前記フィールドのそれぞれについてオフセット値を生成する工程を含む、請求項50に記載の方法。
【請求項52】
各フィールド内のポリヌクレオチドの前記相対位置が、前記オフセット値から決定される、請求項51に記載の方法。
【請求項53】
そのアラインメントがアラインメント閾値外であるフィールド画像を除外する工程をさらに含む、請求項52に記載の方法。
【請求項54】
方法が、前記フィールドの参照画像に対して相対オフセットを決定するために、前記フィールドからの複数の画像をオーバーレイする工程をさらに含み、前記相対位置が、5 nm以内のRMSの正確性で決定される、請求項1に記載の方法。
【請求項55】
1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる、請求項1に記載の方法。
【請求項56】
前記検出可能な標識が光を放出し、かつポリヌクレオチドが、前記検出可能な標識から放出される光の回折限界未満の平均ピッチで前記基材の表面上に固定化される、請求項1に記載の方法。
【請求項57】
高密度に詰め込まれた基材の表面上に固定化された分析物の相対位置を正確に決定するための方法であって、以下の工程を含む、方法:
a. 表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数の分析物を含む、工程;
b. 該表面上でのプローブ結合およびシグナル検出の複数のサイクルを実施する工程であって、各サイクルが以下を含む、工程:
i. 該分析物を、プローブセットからの複数のプローブと接触させることであって、該プローブが、検出可能な標識を含み、該プローブのそれぞれが、標的分析物に特異的に結合する、接触させること;および
ii. 該表面上の別々の位置で該分析物に結合した個々のプローブからの複数の光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化すること;
c. 該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;ならびに
d. 各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各分析物の相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程。
【請求項58】
a. 前記決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における前記光学シグナルをデコンボリューションする工程;ならびに
b. 各フィールドおよび各サイクルについて、前記固定化された分析物に結合した、前記検出可能な標識を、前記デコンボリューションされた光学シグナルから同定する工程
をさらに含む、請求項57に記載の方法。
【請求項59】
前記基材上の複数の前記分析物を同定するために、各サイクルにおいて検出される各分析物についての前記検出可能な標識のアイデンティティを用いる工程をさらに含む、請求項58に記載の方法。
【請求項60】
前記デコンボリューションが、隣接する分析物からの干渉光学シグナルを、前記隣接する分析物間の中心間距離を用いて、前記隣接する分析物の前記決定された相対位置から除去する工程を含む、請求項58に記載の方法。
【請求項61】
前記デコンボリューション関数が最近傍変数回帰を含む、請求項60に記載の方法。
【請求項62】
前記デコンボリューションが、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離する工程を含む、請求項58に記載の方法。
【請求項63】
前記デコンボリューション関数がクロストーク回帰を含む、請求項62に記載の方法。
【請求項64】
前記デコンボリューション関数が、最近傍変数回帰、平滑化、またはクロストーク補正を含む、請求項58に記載の方法。
【請求項65】
前記分析物が単一分子である、請求項57に記載の方法。
【請求項66】
前記単一分子が単一の生体分子である、請求項65に記載の方法。
【請求項67】
前記単一分子がポリヌクレオチドである、請求項65に記載の方法。
【請求項68】
近接する分析物に結合したプローブからの前記検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、前記分析物が、前記基材上に高密度に詰め込まれる、請求項57に記載の方法。
【請求項69】
前記表面上に固定化された前記分析物が、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項57に記載の方法。
【請求項70】
前記表面上に固定化された前記分析物の少なくとも2つが、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項57に記載の方法。
【請求項71】
前記表面上に固定化された前記分析物の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が、別の分析物から、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項57に記載の方法。
【請求項72】
前記光学システムが0.2~2.0の開口数を含む、請求項68~71のいずれか一項に記載の方法。
【請求項73】
前記光学システムが1~1.1の開口数を含む、請求項68~71のいずれか一項に記載の方法。
【請求項74】
前記光の前記波長が、約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである、請求項68~73のいずれか一項に記載の方法。
【請求項75】
固定化された分析物が、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接する分析物間の最少の中心間距離を含む、請求項57に記載の方法。
【請求項76】
標的分析物が、1平方ミクロンにつき分子約4~25個の平均密度で前記表面上に固定化される、請求項57に記載の方法。
【請求項77】
標的分析物が、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で前記表面上に固定化される、請求項57に記載の方法。
【請求項78】
各サイクルが、前記プローブセットからの追加のプローブを用いてステップi) および ii) を繰り返すことをさらに含む、請求項57に記載の方法。
【請求項79】
各サイクルが、前記表面を前記複数のプローブと接触させることの後であってかつ前記フィールドを画像化することの前に、前記表面から未結合のプローブを除去することをさらに含む、請求項57に記載の方法。
【請求項80】
別のサイクルが実施されようとする場合に、各サイクルが、結合したプローブの前記表面からの除去をさらに含む、請求項57に記載の方法。
【請求項81】
少なくとも5、10、15、20、25、30、35、40、50、60、70、80、90、または100サイクルが実施される、請求項57に記載の方法。
【請求項82】
各サイクルが、前記光学システムを用いて前記表面の複数のフィールドを画像化することを含む、請求項57に記載の方法。
【請求項83】
前記表面の前記画像化が、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で実施される、請求項57に記載の方法。
【請求項84】
前記表面の前記画像化が、少なくとも2Xナイキストサンプリング周波数の分解能で実施される、請求項57に記載の方法。
【請求項85】
前記表面の前記画像化が、画像フィールドの1つの軸に沿って300 nmにつき1ピクセル、またはそれ以上の分解能で実施される、請求項57に記載の方法。
【請求項86】
前記表面の前記画像化が、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で実施される、請求項57に記載の方法。
【請求項87】
各サイクルからの前記フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成する工程をさらに含む、請求項57に記載の方法。
【請求項88】
前記オーバーサンプリングされた画像が、前記光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用することによって生成される、請求項87に記載の方法。
【請求項89】
前記フィールド画像もしくは前記オーバーサンプリングされた画像から、光学シグナルピークの位置を含むデータセットを生成する工程をさらに含む、請求項57または87に記載の方法。
【請求項90】
前記ピーク位置をオーバーレイする前記工程が、前記複数のサイクルから、各分析物についての光学ピーク位置のクラスターを生成するために、複数の前記サイクルについて、各フィールドにおいて検出された前記光学シグナルピークの位置をアラインする工程を含む、請求項57に記載の方法。
【請求項91】
前記光学分布モデルがガウス分布である、請求項57に記載の方法。
【請求項92】
前記光学分布モデルが点像分布関数である、請求項57に記載の方法。
【請求項93】
前記相対位置が、前記フィールドにおける複数の前記分析物について決定される、請求項57に記載の方法。
【請求項94】
前記相対位置が、10 nm以内のRMSの正確性で決定される、請求項57に記載の方法。
【請求項95】
前記フィールドの参照画像に対して相対オフセットを決定するために、異なるサイクルからの前記フィールドの複数の画像をオーバーレイする工程をさらに含む、請求項57に記載の方法。
【請求項96】
前記参照フィールドにアラインされた前記フィールドのそれぞれについてオフセット値を生成する工程を含む、請求項95に記載の方法。
【請求項97】
各フィールド内の分析物の前記相対位置が、前記オフセット値から決定される、請求項96に記載の方法。
【請求項98】
そのアラインメントがアラインメント閾値外であるフィールド画像を除外する工程をさらに含む、請求項95に記載の方法。
【請求項99】
前記フィールドの参照画像に対して相対オフセットを決定するために、前記フィールドからの複数の画像をオーバーレイする工程をさらに含み、前記相対位置が、5 nm以内のRMSの正確性で決定される、請求項90に記載の方法。
【請求項100】
1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる、請求項57に記載の方法。
【請求項101】
前記検出可能な標識が光を放出し、かつ前記アレイに結合した標的分析物が、前記検出可能な標識から放出される光の回折限界未満の平均ピッチを含む、請求項57に記載の方法。
【請求項102】
基材の表面上に固定化されている、高密度に詰め込まれた複数の分析物を同定するための方法であって、以下の工程を含む、方法:
a. 表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数の分析物を含む、工程;
b. 該表面上でのプローブ結合およびシグナル検出の複数のサイクルを実施する工程であって、各サイクルが以下を含む、工程:
i. 該分析物を、プローブセットからの複数のプローブと接触させることであって、該プローブが、検出可能な標識を含み、該プローブのそれぞれが、標的分析物に特異的に結合する、接触させること;および
ii. 該分析物に結合した個々のプローブからの複数の光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化すること;
c. 該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;
d. 各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各分析物の相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程;
e. 該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする工程;
f. 各フィールドおよび各サイクルについて、該固定化された分析物に結合した該検出可能な標識を、該デコンボリューションされた光学シグナルから同定する工程;ならびに
g. 該基材上の複数の該分析物のアイデンティティを決定するために、各サイクルにおいて検出される各分析物についての該検出可能な標識のアイデンティティを用いる工程。
【請求項103】
a. 基材の表面上に固定化された分析物へのプローブ結合の複数のサイクルにわたる、基材のフィールドからの複数の光学シグナルを画像化するように構成される、光学画像化装置;ならびに
b. 以下:
i. 該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する;
ii. 該複数のサイクルからの光学シグナルの各クラスターに光学分布モデルを適用することにより、該表面上の検出される各分析物の相対位置を、改善された正確性で決定する;および
iii. 該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする
ように構成される、画像処理モジュール
を含む、複数の分析物のアイデンティティを決定するためのシステム。
【請求項104】
前記画像処理モジュールが、前記デコンボリューションされた光学シグナルを用いて、前記表面上に固定化された前記分析物のアイデンティティを決定するようにさらに構成される、請求項103に記載のシステム。
【請求項105】
前記分析物がそれぞれポリヌクレオチド分子であり、かつ前記アイデンティティが前記ポリヌクレオチド分子の配列を含む、請求項104に記載のシステム。
【請求項106】
前記光学画像化装置が、スキャン可能な領域を定義する可動ステージを含む、請求項103に記載のシステム。
【請求項107】
前記光学画像化装置が、前記スキャン可能な領域において、回折限界未満で基材の表面をサンプリングするように構成されるセンサーおよび光学拡大力(magnification)を含む、請求項106に記載のシステム。
【請求項108】
回折限界未満の中心間の間隔で基材の表面に固定化された分析物を含む、基材
をさらに含む、請求項103に記載のシステム。
【請求項109】
前記デコンボリューションが、隣接する分析物からの干渉光学シグナルを、前記隣接する分析物間の中心間距離を用いて、前記隣接する分析物の前記決定された相対位置から除去することを含む、請求項103に記載のシステム。
【請求項110】
前記デコンボリューション関数が最近傍変数回帰を含む、請求項109に記載のシステム。
【請求項111】
前記デコンボリューションが、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離することを含む、請求項103に記載のシステム。
【請求項112】
前記デコンボリューション関数がクロストーク回帰を含む、請求項111に記載のシステム。
【請求項113】
前記デコンボリューション関数が、最近傍変数回帰、平滑化、またはクロストーク補正を含む、請求項103に記載のシステム。
【請求項114】
前記分析物が単一分子である、請求項103に記載のシステム。
【請求項115】
前記単一分子が単一の生体分子である、請求項114に記載のシステム。
【請求項116】
前記単一分子がポリヌクレオチドである、請求項114に記載のシステム。
【請求項117】
近接する分析物に結合したプローブからの前記検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、前記分析物が、前記基材上に高密度に詰め込まれる、請求項103に記載のシステム。
【請求項118】
前記表面上に固定化された前記分析物が、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項103に記載のシステム。
【請求項119】
前記表面上に固定化された前記分析物の少なくとも2つが、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項103に記載のシステム。
【請求項120】
前記表面上に固定化された前記分析物の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%が、別の分析物から、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される、請求項103に記載のシステム。
【請求項121】
前記光学システムが0.2~2.0の開口数を含む、請求項117~120のいずれか一項に記載のシステム。
【請求項122】
前記光学システムが1~1.1の開口数を含む、請求項117~120のいずれか一項に記載のシステム。
【請求項123】
前記光の前記波長が約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである、請求項117~122のいずれか一項に記載のシステム。
【請求項124】
固定化された分析物が、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接する分析物間の最少の中心間距離を含む、請求項103に記載のシステム。
【請求項125】
標的分析物が、1平方ミクロンにつき分子約4~25個の平均密度で前記表面上に固定化される、請求項103に記載のシステム。
【請求項126】
標的分析物が、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で前記表面上に固定化される、請求項103に記載のシステム。
【請求項127】
前記光学画像化装置が、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で前記基材を画像化するように構成される、請求項103に記載のシステム。
【請求項128】
前記光学画像化装置が、少なくとも2Xナイキストサンプリング周波数の分解能で前記基材を画像化するように構成される、請求項103に記載のシステム。
【請求項129】
前記光学画像化装置が、画像フィールドの1つの軸に沿って1ピクセルにつき300 nm以下の分解能で前記基材を画像化するように構成される、請求項103に記載のシステム。
【請求項130】
前記光学画像化装置が、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で前記基材を画像化するように構成される、請求項103に記載のシステム。
【請求項131】
前記画像処理モジュールが、各サイクルからの前記フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成するように構成される、請求項103に記載のシステム。
【請求項132】
前記画像処理モジュールが、前記オーバーサンプリングされた画像を生成するために、前記光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用するように構成される、請求項131に記載のシステム。
【請求項133】
前記画像処理モジュールが、前記画像化されたフィールドから、光学シグナルピークの位置を含むデータセットを生成するように構成される、請求項103または131に記載のシステム。
【請求項134】
1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる、請求項57に記載のシステム。
【請求項135】
標的分析物が、光学画像化装置によって検出される光の回折限界未満の平均中心間距離で、前記基材上に固定化される、請求項57に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
この出願は2017年3月17日出願の米国特許仮出願第62/473,163号の恩典を主張するものであり、その開示全体は、すべての目的に関してその全体が参照により本明細書に組み入れられる。
【背景技術】
【0002】
背景
配列決定のコストを削減することは、ヘルスケアの改善を可能にするために重要である。配列決定のコストを判定するための基準は、90ギガ塩基として定義される、30Xヒトゲノムの価格である。
【0003】
ゲノムの価格は2007年から2011年にかけて著しく低下し、ゲノムあたり10,000ドル弱で安定した。1つの重要なマイルストーンは、最近達成された、1,000ドルゲノムであった。次の主なマイルストーンは、数年かかると予想される、100ドルゲノムである。この発明は、実質的に短縮された期間で10ドルゲノムを達成する方法を取り扱う。この価格点において、全新生児を配列決定することが経済的となり、かつ、特に腫瘍学の分野における、疾患の診断およびスクリーニングについてのコスト障壁が、著しくより経済的になるであろう。
【0004】
配列決定システムに関する主なコスト構成要素は、第一にはバイオチップおよび試薬を含む消耗品、そして第二には機器コストである。
【0005】
10ドルの30Xゲノム、すなわち100倍のコスト削減に到達するためには、単位面積あたりのデータの量を100倍増大させる必要があり、かつデータ点あたりの試薬の量を100倍低下させる必要がある。
【0006】
1平方センチメートルにつき1000万個の分子のクラスター密度を有する、1,000ドルゲノムプラットフォームの一例において、各分子は平均で10 um2のチップ面積を占める。したがって、平均有効ピッチは3,160 nmである。もし100倍高い密度を100倍少ないコピーで達成することができれば、同じチップ面積および試薬で100倍多い情報が取得され得、結果として100倍のコスト削減をもたらす。100倍高い密度において、新規なピッチは320 nmであることを必要とし得る。試薬の使用量が同じになるコピーの数は1分子あたり10コピーであり、1クラスターあたり1,000コピーよりも100倍少ない。
【0007】
したがって、必要とされるものは、およそ320 nm離れて配置される単一分子からの光学シグナルを解像することができる、光学画像化システムである。しかしながら、この分解能は、光の回折限界のために達成することが困難である、光の回折限界はλ / (2*N.A.)によって定義され、ここでλは光の波長であり、かつN.A.は光学画像化システムの開口数であり、これは、たとえば配列決定および分析物の検出に有用な水に基づくシステムにおいては1付近である。したがって、およそ650 nmの放出される光学シグナルの検出については、320 nmの間隔は回折限界付近であるかまたはこれ未満であり、これはそのようなアレイ上の個々の特徴物を解像することを妨害し得る。
【0008】
Ion Torrent(Thermo Fisherにより買収)およびOxford Nanoporeなどの会社によって開発された電気に基づくシステムなどの、光学シグナルの回折限界に拘束されない他の方法は存在するが、画像に基づく配列決定システムは、現在、既存のすべての配列決定技術の中で最少の配列決定コストを有する。画像に基づくシステムは、高スループットの画像化光学系および低コストの消耗品の組み合わせによって低コストを達成する。
【0009】
必要とされるものは、したがって、高い正確性で回折限界未満の解像ができるように、回折限界を克服して、密接して詰め込まれた基材上の個々の特徴物の増大された分解能を容易にする、光学画像化方法およびシステムである。これらの方法およびシステムは、ポリヌクレオチド配列検出のための光学画像化における使用のためのものを含む、高い分解能での特徴物の検出における特定の適用を有し得る。
【発明の概要】
【0010】
基材の表面に固定化された単一分子分析物の、回折限界未満での画像化のための、方法およびシステム。基材は、分析物との結合反応を実施するためのフローセル等を含む。分析物は、個々のポリヌクレオチドまたはタンパク質などの、単一分子分解能のために別々の位置で離れて表面上に配置される生体分子を含む。これらは、単一分子の、合成による配列決定(sequencing by synthesis)への適用のような、高い分解能での単一分子検出に使用され得る。
【0011】
いくつかの態様において、本明細書において、単一分子分解能で、基材の表面上に高密度で固定化された複数のポリヌクレオチドを配列決定するための方法が提供され、該方法は以下の工程を含む:表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数のポリヌクレオチドを含み、かつ該表面が、合成による配列決定のための試薬を含む、工程;以下を含む各サイクルを含む、単一分子の、合成による配列決定の、複数のサイクルを実施する工程:該ポリヌクレオチドを、検出可能な標識を含む可逆的ターミネーターヌクレオチドのセットと接触させること;該ポリヌクレオチドに組み込まれた各ヌクレオチドからの光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化することであって、それにより該サイクルについて該フィールドにおける複数の光学シグナルを検出する、画像化すること;該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各分析物の相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程;該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする工程;各フィールドおよび各サイクルについて、該ポリヌクレオチドに組み込まれた該検出可能な標識を、該デコンボリューションされた光学シグナルから同定する工程;ならびに各ポリヌクレオチドの位置で、該複数のサイクルにわたって同定された該検出可能な標識から、基材の表面上に固定化された該複数のポリヌクレオチドを配列決定する工程。
【0012】
いくつかの態様において、基材は、同一配列を含む単一分子の1,000以下、500以下、100以下、50以下、25以下、20以下、15以下、または10以下のクローンコピーを含む。いくつかの態様において、ポリヌクレオチドはDNAコンカテマーである。
【0013】
いくつかの態様において、各サイクルは、該表面を該複数の可逆的ターミネーターヌクレオチドと接触させることの後であってかつ該フィールドを画像化することの前に、未結合のヌクレオチドを除去するために該表面を洗浄することをさらに含む。いくつかの態様において、別のサイクルが実施されようとする場合に、サイクルは、該可逆的ターミネーターを切断することをさらに含む。いくつかの態様において、別のサイクルが実施されようとする場合に、サイクルは、該検出可能な標識を切断することをさらに含む。
【0014】
いくつかの態様において、可逆的ターミネーターヌクレオチドのセットは、それぞれ別個の検出可能な標識を有する少なくとも2つの別個のヌクレオチドを含む。いくつかの態様において、可逆的ターミネーターヌクレオチドのセットは、それぞれ別個の検出可能な標識を有する少なくとも4つの別個のヌクレオチドを含む。いくつかの態様において、可逆的ターミネーターヌクレオチドのセットは、アデニン、シトシン、チミン、およびグアニンを含む。いくつかの態様において、可逆的ターミネーターヌクレオチドのセットは、アデニン、シトシン、ウラシル、およびグアニンを含む。
【0015】
いくつかの態様において、ポリヌクレオチドはデオキシリボ核酸またはリボ核酸を含む。いくつかの態様において、複数の標的ポリヌクレオチドは約1 kb~約100 kbの長さを有する。いくつかの態様において、複数の標的ポリヌクレオチドは約10 kb~約50 kbの長さを有する。いくつかの態様において、表面に結合したポリヌクレオチドは、少なくとも10 nmの距離によって隔てられる。
【0016】
いくつかの態様において、検出可能な標識は、該可逆的ターミネーターヌクレオチドの3' -OH基に結合される。いくつかの態様において、検出可能な標識ではない保護基が、該可逆的ターミネーターヌクレオチドの3' -OHに結合される。
【0017】
いくつかの態様において、複数の標的ポリヌクレオチドは、別々の位置で該表面に結合した捕捉プローブへの結合によって固定化される。いくつかの態様において、複数の標的ポリヌクレオチドは、該捕捉プローブの配列に相補的な捕捉配列および該配列決定プライマーの配列に相補的なプライミング配列を含むアダプターに連結される。いくつかの態様において、捕捉配列は20マーから50マーである。いくつかの態様において、プライミング配列は20マーから50マーである。
【0018】
いくつかの態様において、配列決定する方法は、同じ配列を有するポリヌクレオチドのセットを比較することによって、またはデータそれ自体に基づいて、位相誤差を補正するために前のサイクルの回帰を実施する工程をさらに含む。
【0019】
いくつかの態様において、デコンボリューションは、隣接するポリヌクレオチドからの干渉光学シグナルを、該隣接するポリヌクレオチド間の中心間距離を用いて、該決定された相対位置から除去する工程を含む。いくつかの態様において、デコンボリューション関数は最近傍変数回帰(nearest neighbor variable regression)を含む。いくつかの態様において、デコンボリューションは、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離する工程を含む。いくつかの態様において、デコンボリューション関数はクロストーク回帰(cross-talk regression)を含む。いくつかの態様において、デコンボリューション関数は、最近傍変数回帰、平滑化、またはクロストーク補正を含む。
【0020】
ポリヌクレオチド
いくつかの態様において、ポリヌクレオチドは、単一分子の、合成による配列決定のために、該基材上で離れて配置される。いくつかの態様において、配列決定されようとする別個のポリヌクレオチド配列を含む近接するポリヌクレオチドに結合したプローブからの該検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、ポリヌクレオチドは、該基材上に高密度に詰め込まれる。いくつかの態様において、該表面上に固定化されたポリヌクレオチドは、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該ポリヌクレオチドの少なくとも2つは、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該ポリヌクレオチドの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、別の固定化されたポリヌクレオチドから、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。
【0021】
いくつかの態様において、光学システムは0.2~2.0の開口数を含む。いくつかの態様において、光学システムは1~1.1の開口数を含む。いくつかの態様において、該放出される光の波長は、約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである。
【0022】
いくつかの態様において、固定化されたポリヌクレオチドは、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接するポリヌクレオチド間の最少の中心間距離を含む。いくつかの態様において、ポリヌクレオチドは、1平方ミクロンにつき分子約4~25個の平均密度で該表面上に固定化される。いくつかの態様において、ポリヌクレオチドは、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で該表面上に固定化される。
【0023】
いくつかの態様において、該表面の画像化は、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で実施される。いくつかの態様において、該表面の画像化は、少なくとも2Xナイキストサンプリング周波数の分解能で実施される。いくつかの態様において、該表面の画像化は、画像フィールドの1つの軸に沿って300 nmにつき1ピクセル、またはそれ以上の分解能で実施される。いくつかの態様において、該表面の画像化は、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で実施される。
【0024】
いくつかの態様において、配列決定方法は、各サイクルからの該フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成する工程をさらに含む。いくつかの態様において、オーバーサンプリングされた画像は、該光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用することによって生成される。いくつかの態様において、該画像からの光学シグナルピークの位置を含むデータセットは、該フィールド画像または該オーバーサンプリングされた画像から生成される。
【0025】
いくつかの態様において、該ピーク位置をオーバーレイする工程は、該複数のサイクルから、各ポリヌクレオチドについての光学ピーク位置のクラスターを生成するために、該複数のサイクルについて、各フィールドにおいて検出された該光学シグナルピークの位置をアラインする工程を含む。いくつかの態様において、光学分布モデルはガウス分布である。いくつかの態様において、光学分布モデルは点像分布関数である。
【0026】
いくつかの態様において、相対位置は、該フィールドにおける複数の該ポリヌクレオチドについて決定される。いくつかの態様において、相対位置は、10 nm以内のRMSの正確性で決定される。
【0027】
いくつかの態様において、配列決定方法は、該フィールドの参照画像に対して相対オフセットを決定するために、異なるサイクルからの該フィールドの複数の画像をオーバーレイする工程をさらに含む。いくつかの態様において、方法は、該参照フィールドにアラインされた該フィールドのそれぞれについてオフセット値を生成する工程を含む。いくつかの態様において、各フィールド内のポリヌクレオチドの相対位置は、該オフセット値から決定される。いくつかの態様において、オフセットの決定は、そのアラインメントがアラインメント閾値外であるフィールド画像を除外する工程を含む。いくつかの態様において、配列決定方法は、該フィールドの参照画像に対して相対オフセットを決定するために、該フィールドからの複数の画像をオーバーレイする工程を含み、ここで該相対位置は、5 nm以内のRMSの正確性で決定される。
【0028】
いくつかの態様において、方法は、1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる。
【0029】
いくつかの態様において、検出可能な標識は光を放出し、かつポリヌクレオチドは、該検出可能な標識から放出される光の回折限界未満の平均ピッチで、該基材の表面上に固定化される。
【0030】
いくつかの態様にしたがって、本明細書において、高密度に詰め込まれた基材の表面上に固定化された分析物の相対位置を正確に決定するための方法もまた提供され、これは以下の工程を含む:表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数の分析物を含む、工程;該表面上でのプローブ結合およびシグナル検出の複数のサイクルを実施する工程(各サイクルは以下を含む:該分析物を、プローブセットからの複数のプローブと接触させることであって、該プローブが、検出可能な標識を含み、該プローブのそれぞれが、標的分析物に特異的に結合する、接触させること;および該表面上の別々の位置で該分析物に結合した個々のプローブからの複数の光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化すること);該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;ならびに各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各分析物の相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程。
【0031】
いくつかの態様において、方法は、以下をさらに含む:該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする工程;ならびに各フィールドおよび各サイクルについて、該固定化された分析物に結合した、該検出可能な標識を、該デコンボリューションされた光学シグナルから同定する工程。
【0032】
いくつかの態様において、方法は、該基材上の複数の該分析物を同定するために、各サイクルにおいて検出される各分析物の、該検出可能な標識のアイデンティティを用いる工程をさらに含む。
【0033】
いくつかの態様において、デコンボリューションは、隣接する分析物からの干渉光学シグナルを、該隣接する分析物間の中心間距離を用いて、該隣接する分析物の該決定された相対位置から除去する工程を含む。
【0034】
いくつかの態様において、デコンボリューション関数は最近傍変数回帰を含む。いくつかの態様において、デコンボリューションは、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離する工程を含む。いくつかの態様において、デコンボリューション関数はクロストーク回帰を含む。いくつかの態様において、デコンボリューション関数は、最近傍変数回帰、平滑化、またはクロストーク補正を含む。
【0035】
いくつかの態様において、分析物は単一分子である。いくつかの態様において、単一分子は単一の生体分子である。いくつかの態様において、単一分子はポリヌクレオチドである。
【0036】
いくつかの態様において、近接する分析物に結合したプローブからの該検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、分析物は、該基材上に高密度に詰め込まれる。いくつかの態様において、該表面上に固定化された分析物は、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該分析物の少なくとも2つは、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該分析物の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、別の分析物から、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。
【0037】
いくつかの態様において、光学システムは0.2~2.0の開口数を含む。いくつかの態様において、光学システムは1~1.1の開口数を含む。いくつかの態様において、該光の波長は、約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである。
【0038】
いくつかの態様において、固定化された分析物は、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接する分析物間の最少の中心間距離を含む。いくつかの態様において、標的分析物は、1平方ミクロンにつき分子約4~25個の平均密度で該表面上に固定化される。いくつかの態様において、標的分析物は、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で該表面上に固定化される。
【0039】
いくつかの態様において、各サイクルは、該プローブセットからの追加のプローブを用いてステップ i) および ii) を繰り返す工程をさらに含む。いくつかの態様において、各サイクルは、該表面を該複数のプローブと接触させることの後であってかつ該フィールドを画像化することの前に、該表面から未結合のプローブを除去することをさらに含む。いくつかの態様において、別のサイクルが実施されようとする場合に、各サイクルは、結合したプローブの該表面からの除去をさらに含む。
【0040】
いくつかの態様において、少なくとも5、10、15、20、25、30、35、40、50、60、70、80、90、または100サイクルが実施される。いくつかの態様において、各サイクルは、該光学システムを用いて該表面の複数のフィールドを画像化することを含む。
【0041】
いくつかの態様において、該表面の画像化は、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で実施される。いくつかの態様において、該表面の画像化は、少なくとも2Xナイキストサンプリング周波数の分解能で実施される。いくつかの態様において、該表面の画像化は、画像フィールドの1つの軸に沿って300 nmにつき1ピクセル、またはそれ以上の分解能で実施される。いくつかの態様において、該表面の画像化は、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で実施される。
【0042】
いくつかの態様において、方法は、各サイクルからの該フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成する工程をさらに含む。いくつかの態様において、オーバーサンプリングされた画像は、該光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用することによって生成される。いくつかの態様において、該方法は、該フィールド画像または該オーバーサンプリングされた画像から、光学シグナルピークの位置を含むデータセットを生成する工程をさらに含む。
【0043】
いくつかの態様において、該ピーク位置をオーバーレイする工程は、該複数のサイクルから、各分析物についての光学ピーク位置のクラスターを生成するために、複数の該サイクルについて、各フィールドにおいて検出された該光学シグナルピークの位置をアラインする工程を含む。いくつかの態様において、光学分布モデルはガウス分布である。いくつかの態様において、光学分布モデルは点像分布関数である。
【0044】
いくつかの態様において、該フィールドにおける複数の該分析物について、相対位置が決定される。いくつかの態様において、相対位置は、10 nm以内のRMSの正確性で決定される。
【0045】
いくつかの態様において、方法は、該フィールドの参照画像に対して相対オフセットを決定するために、異なるサイクルからの該フィールドの複数の画像をオーバーレイする工程をさらに含む。いくつかの態様において、方法は、該参照フィールドにアラインされた該フィールドのそれぞれについてオフセット値を生成する工程を含む。いくつかの態様において、各フィールド内の分析物の相対位置は、該オフセット値から決定される。いくつかの態様において、方法は、そのアラインメントがアラインメント閾値外であるフィールド画像を除外する工程をさらに含む。いくつかの態様において、方法は、該フィールドの参照画像に対して相対オフセットを決定するために、該フィールドからの複数の画像をオーバーレイする工程をさらに含み、ここで該相対位置は、5 nm以内のRMSの正確性で決定される。
【0046】
いくつかの態様において、方法は、1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる。
【0047】
いくつかの態様において、検出可能な標識は光を放出し、かつここで、該アレイに結合した標的分析物は、該検出可能な標識から放出される光の回折限界未満の平均ピッチを含む。
【0048】
いくつかの態様にしたがって、本明細書において、基材の表面上に固定化されている、高密度に詰め込まれた複数の分析物を同定するための方法もまた提供され、これは以下の工程を含む:表面を含む基材を提供する工程であって、表面が、表面上で別々の位置に固定化された複数の分析物を含む、工程;該表面上でのプローブ結合およびシグナル検出の複数のサイクルを実施する工程(各サイクルは以下を含む:該分析物を、プローブセットからの複数のプローブと接触させることであって、該プローブが、検出可能な標識を含み、該プローブのそれぞれが、標的分析物に特異的に結合する、接触させること;および該分析物に結合した個々のプローブからの複数の光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化すること);該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定する工程;各光学シグナルについて該ピーク位置をオーバーレイする工程、および該表面上の検出される各分析物の相対位置を、改善された正確性で決定するために、光学シグナルの各クラスターにおいて光学分布モデルを適用する工程;該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションする工程;該デコンボリューションされた光学シグナルから、各フィールドおよび各サイクルにおいて、検出可能な各標識のアイデンティティを決定する工程;ならびに該基材上の複数の該分析物を同定するために、各サイクルにおいて検出される各分析物の、該検出可能な標識のアイデンティティを用いる工程。
【0049】
本明細書において、いくつかの態様にしたがって、基材の表面上に固定化された分析物へのプローブ結合の複数のサイクルにわたる、基材のフィールドからの複数の光学シグナルを画像化するように構成される、光学画像化装置;ならびに該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置を決定するように構成され;該複数のサイクルからの光学シグナルの各クラスターに光学分布モデルを適用することにより、該表面上の検出される各分析物の相対位置を、改善された正確性で決定するように構成され;かつ該決定された相対位置およびデコンボリューション関数を用いて、各サイクルからの各フィールド画像における該光学シグナルをデコンボリューションするように構成される、画像処理モジュールを含む、複数の分析物のアイデンティティを決定するためのシステムもまた、提供される。
【0050】
いくつかの態様において、画像処理モジュールは、該デコンボリューションされた光学シグナルを用いて、該表面上に固定化された該分析物のアイデンティティを決定するようにさらに構成される。
【0051】
いくつかの態様において、分析物はそれぞれポリヌクレオチド分子であり、かつ該アイデンティティは該ポリヌクレオチド分子の配列を含む。
【0052】
いくつかの態様において、光学画像化装置は、スキャン可能な領域を定義する可動ステージを含む。
【0053】
いくつかの態様において、光学画像化装置は、該スキャン可能な領域において、回折限界未満で基材の表面をサンプリングするように構成されるセンサーおよび光学拡大力(magnification)を含む。
【0054】
いくつかの態様において、回折限界未満の中心間の間隔で基材の表面に固定化された分析物を含む基材をさらに含む、光学画像化システム。
【0055】
いくつかの態様において、デコンボリューションは、隣接する分析物からの干渉光学シグナルを、該隣接する分析物間の中心間距離を用いて、該隣接する分析物の該決定された相対位置から除去することを含む。いくつかの態様において、デコンボリューション関数は最近傍変数回帰を含む。いくつかの態様において、デコンボリューションは、各サイクルにおいて使用される特有の検出可能な各標識から、オーバーラップする波長を分離することを含む。いくつかの態様において、デコンボリューション関数はクロストーク回帰を含む。いくつかの態様において、デコンボリューション関数は、最近傍変数回帰、平滑化、またはクロストーク補正を含む。
【0056】
いくつかの態様において、分析物は単一分子である。いくつかの態様において、単一分子は単一の生体分子である。いくつかの態様において、単一分子はポリヌクレオチドである。
【0057】
いくつかの態様において、近接する分析物に結合したプローブからの該検出可能な標識によって放出される光学シグナルの間にオーバーラップが存在するように、分析物は、該基材上に高密度に詰め込まれる。いくつかの態様において、該表面上に固定化された分析物は、平均して、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該分析物の少なくとも2つは、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。いくつかの態様において、該表面上に固定化された該分析物の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、または90%は、別の分析物から、検出可能な標識によって放出される光の回折限界未満の距離を隔てて配置され、かつ光学システムによって画像化される。
【0058】
いくつかの態様において、光学システムは0.2~2.0の開口数を含む。いくつかの態様において、光学システムは1~1.1の開口数を含む。いくつかの態様において、光学システムによって検出される該光の波長は、約400~450 nm、約450~500 nm、約500~550 nm、約550~600 nm、約600~650 nm、または約650~700 nmである。
【0059】
いくつかの態様において、固定化された分析物は、600 nm未満、500 nm未満、400 nm未満、300 nm未満、または200 nm未満の、近接する分析物間の最少の中心間距離を含む。いくつかの態様において、分析物は、1平方ミクロンにつき分子約4~25個の平均密度で該表面上に固定化される。いくつかの態様において、分析物は、1平方ミクロンにつき分子4個超、6個超、8個超、10個超、15個超、または20個超の平均密度で該表面上に固定化される。
【0060】
いくつかの態様において、光学画像化装置は、光学システムのナイキスト限界によって決定される場合の臨界サンプリングレートより大きい分解能で該基材を画像化するように構成される。いくつかの態様において、光学画像化装置は少なくとも2Xナイキストサンプリング周波数の分解能で該基材を画像化するように構成される。いくつかの態様において、光学画像化装置は、画像フィールドの1つの軸に沿って1ピクセルにつき300 nm以下の分解能で該基材を画像化するように構成される。いくつかの態様において、光学画像化装置は、画像フィールドの1つの軸に沿って1ピクセルにつき約162.5 nmの分解能で該基材を画像化するように構成される。
【0061】
いくつかの態様において、画像処理モジュールは、各サイクルからの該フィールド画像のそれぞれから、より高いピクセル密度を有するオーバーサンプリングされた画像を生成するように構成される。いくつかの態様において、画像処理モジュールは、該オーバーサンプリングされた画像を生成するために、該光学シグナルについての予想される点像分布関数に基づき、各フィールド画像に平滑化を適用するように構成される。いくつかの態様において、画像処理モジュールは、該画像化されたフィールドから、光学シグナルピークの位置を含むデータセットを生成するように構成される。
【0062】
いくつかの態様において、システムは、1平方ミクロンにつき約4~25個の密度で、表面からの光学シグナルを解像することができる。
【0063】
いくつかの態様において、標的分析物は、光学画像化装置によって検出される光の回折限界未満の平均中心間距離で、該基材上に固定化される。
【図面の簡単な説明】
【0064】
前述のならびに他の目的、特徴、および利点は、類似の参照記号がさまざまな観点の全体にわたって同じ部分を指す添付の図面に示される、以下の本発明の特定の態様の説明から明らかであろう。図面は必ずしも一定の縮尺ではなく、代わりに強調がなされて、本発明のさまざまな態様の原理を説明する。
【
図1】シーケンサーのスループット 対 アレイのピッチを示し、そして10ドルゲノムのために必要とされる基準を満たすシステム設計を概説する。
【
図2A】低コストの配列決定のための、240 nmのピッチで80 nmの直径の結合領域(スポット)という高密度領域の提案される態様を示す。
【
図2B】1,000ドルゲノムのために使用される試料の有効密度と比較した、提案される基材密度の比較である。
【
図3】600 nmのピッチで2Xフィルターで処理された、シミュレートされた単一分子のためのクロストーク計算を示す。
【
図4】600 nm、400 nm、および300 nmの中心間距離の基材上の単一分子分析物の検出の画像の、2Xオーバーサンプリングされたシミュレーション(左) 対 4Xオーバーサンプリングされ、そしてデコンボリューションされたシミュレーション(右)を示す。
【
図5】2Xオーバーサンプリングされたシミュレーション 対 4Xオーバーサンプリングされそしてデコンボリューションされたシミュレーションを用いて処理された、単一分析物間の異なる中心間距離(アレイのピッチ(nm))で近接するスポット間の、クロストークのプロットを示す。
【
図6】本発明の1つの態様にしたがった、基材上の分析物の相対位置を高い正確性で決定する方法のためのフローチャートを示す。
【
図7】本発明の1つの態様にしたがった、基材から検出された、デコンボリューションされた光学シグナルから、個々の分析物を同定する方法のための、フローチャートを示す。
【
図8】本発明の1つの態様にしたがった、基材上に固定化されたポリヌクレオチドを配列決定する方法のためのフローチャートを示す。
【
図9】本発明の1つの態様にしたがった、反復検出からの光学シグナル検出プロセスにおける工程の概要を示す。
【
図10A】本発明の1つの態様にしたがった、最初の生画像分析のための工程のフローチャートを示す。
【
図10B】本発明の1つの態様にしたがった、複数のサイクルからの光学シグナルピーク情報からの位置決定のための工程のフローチャートを示す。
【
図10C】本発明の1つの態様にしたがった、正確な相対位置情報および画像デコンボリューションアルゴリズムを用いる、画像からの、オーバーラップする光学シグナルの同定のための工程のフローチャートを示す。
【
図11】本発明の1つの態様にしたがった、高密度に詰め込まれた基材の反復検出からの画像についての光学シグナル検出およびデコンボリューションプロセスのための工程の、詳細なフローチャートを示す。
【
図12A】生画像から検出された光学シグナルからの、4つのフルオロフォア間のフルオロフォア強度のクロストークプロットを示す。
【
図12B】4Xオーバーサンプリングされた画像からの、4つのフルオロフォア間のフルオロフォア強度のクロストークプロットを示す。
【
図13A】4Xオーバーサンプリングされた画像からの、4つのフルオロフォア間のフルオロフォア強度のクロストークプロットを示す。
【
図13B】本発明の1つの態様にしたがった、分析物の正確な位置情報を用いるデコンボリューションアルゴリズムを用いて、4Xオーバーサンプリングされ、そしてデコンボリューションされた画像からの、4つのフルオロフォア間のフルオロフォア強度のクロストークプロットを示す。(
図13B)同じ画像化領域であるが、
図11に示されるように、かつ本明細書において記載されるように実施されたデコンボリューションおよび最近傍回帰を用いたクロストークプロットを示す。
【
図14】分析物の間が約315 nmの中心間の間隔での、フィールドの生画像のシミュレートされた4色合成画を示す。
図14Bは、分析物の間が約315 nmの中心間の間隔での、デコンボリューションされた画像のシミュレートされた4色合成画を示す。
【
図15A】変異体標的および野生型(WT)標的の等量を含む、EGFR遺伝子におけるコドン790付近の領域に対応する合成オリゴヌクレオチド鋳型の1:1の混合物の、配列決定の結果を示す。
【
図15B】塩基の組み込みおよび切断の交互のサイクルからの画像を示す。
【
図16】基材上に固定化され、かつフルオロフォアを含むプローブによって結合された単一分子の画像である。
【
図17】
図17の右パネルは、基材上のいくらかの分析物からのオーバーレイされた各サイクルからのフィールドのオーバーサンプリングされた画像からのピーク(ピークのクラスター)を示す。左パネルは、右パネルの平滑化されたバージョンであり、相対位置情報を示す高度に正確なピークを有する複数のサイクルにわたる分析物からのピークのガウス分布を概括する。
【
図18】フィールドにおいて見いだされる複数の分子のそれぞれについてのローカライゼーションの変動を示す。ローカライゼーションの分散の中央値は5 nmであり、かつ3シグマのローカライゼーションの分散は10 nmより小さい。
【発明を実施するための形態】
【0065】
詳細な説明
本発明のさまざまな態様の詳細が、以下の説明において記載される。本発明の他の特徴、目的、および利点は、説明および図面から、ならびに請求の範囲から、明らかである。
【0066】
定義
本明細書において使用される場合、中心間距離との語は、基材上の各分子の平均位置の間の差によって判定される、2つの近接する分子の間の距離を指す。平均の最少中心間距離との語は、基材上に置かれた各分析物の中心とその最近傍の分析物の中心との間の平均距離を特に指すが、一方で、中心間距離との語はまた、基材上の分析物の密度に関連する限定の文脈においては、最少の中心間距離をも指す。本明細書において使用される場合、「ピッチ」または「平均有効ピッチ」との語は、概して、平均の最少の中心間距離を指すために使用される。分析物の規則正しいアレイの文脈においては、ピッチはまた、定義された軸に沿って、近接する分子の間の中心間距離を決定するために、使用されてよい。
【0067】
本明細書において使用される場合、「オーバーレイ」との語(たとえば、画像をオーバーレイする)は、複数のサイクルにわたって各分析物から検出される光学シグナル(たとえば位置および強度、またはピークの位置)の分布を生成するために、異なるサイクルからの画像をオーバーレイすることを指す。検出される光学シグナルのこの分布は、画像をオーバーレイすることによって、処理された人工的な画像をオーバーレイすることによって、または位置情報を含むデータセットをオーバーレイすることによって、生成され得る。したがって、本明細書において使用される場合、「画像をオーバーレイする」との語は、複数のサイクルのそれぞれについて、単一の分析物に結合する単一のプローブからの光学シグナルについての位置情報の分布を生成するための、これら機構の任意のものを包含する。
【0068】
「サイクル」は、1つまたは複数のパスの完了、および検出可能な標識を基材から取り除くことによって、定義される。1サイクルにつき1つまたは複数のパスという、後続のサイクルが、実施され得る。本明細書において記載される方法およびシステムに関して、複数のサイクルが、単一の基材または試料に対して実施される。DNA配列決定に関して、複数のサイクルは、可逆的ターミネーター、および組み込まれたヌクレオチドから除去可能な、検出可能な標識の使用を必要とする。タンパク質に関して、複数のサイクルは、それらの適切な立体配置で折りたたまれたタンパク質を維持するか、または使用されるプローブが、結合効率がタンパク質の折りたたみの立体配置とは無関係であるようペプチド配列に結合するように選ばれるかのいずれかの、プローブを除去する(取り除く)条件を必要とする。
【0069】
検出アッセイにおける「パス」とは、検出可能な標識を含む複数のプローブが、結合した分析物に導入され、プローブと別個の標的分析物との間に選択的な結合が生じ、そして検出可能な標識から複数のシグナルが検出されるというプロセスを指す。パスは、標的分析物に特異的に結合する抗体のセットの導入を含む。パスはまた、合成による配列決定中に伸長する鎖への組み込みのための、標識されたヌクレオチドのセットの導入を含み得る。基材からすべての検出可能な標識が取り除かれる前に、または検出可能な標識もしくは可逆的ターミネーターが配列決定中に組み込まれたヌクレオチドから除去される前に、プローブの異なるセットの複数のパスが存在し得る。一般的に、4つのヌクレオチドがパス中に使用される場合、サイクルは、標準的な4つのヌクレオチドでの合成による配列決定について、単一のパスのみからなる。
【0070】
本明細書において使用される場合、画像とは、サイクル中またはサイクル内のパス中に取得される、フィールドの画像を指す。いくつかの態様において、単一の画像は、単色の検出可能な標識の検出に限定される。
【0071】
本明細書において使用される場合、「フィールド」との語は、画像化される基材の、単一の領域を指す。典型的なアッセイ中に、単一のフィールドは、1サイクルにつき少なくとも1回画像化される。たとえば、4色を用いる20サイクルのアッセイについて、すべて同じフィールドの、20 * 4 = 80枚の画像が存在し得る。
【0072】
「標的分析物」または「分析物」とは、同定、定量化、あるいは特徴付けされようとする、単一の分子、化合物、複合体、物質、もしくは成分を指す。標的分析物は、限定するものではないが、例として、単一の分子(任意の分子サイズのもの)、単一の生体分子、ポリペプチド、タンパク質(折りたたまれている、もしくは折りたたまれていない)、ポリヌクレオチド分子(RNA、cDNA、もしくはDNA)、それらの断片、修飾核酸などのそれらの修飾分子、またはそれらの組み合わせを含み得る。1つの態様において、標的ポリヌクレオチドは、合成による配列決定を容易にするように、ハイブリダイズされるプライマーを含む。標的分析物は、本明細書において記載される光学的検出方法を用いて標的分析物を配列決定する、同定する、および定量化するために使用され得るプローブによって、認識される。
【0073】
「プローブ」とは、本明細書において使用される場合、分子、細胞の構成要素もしくは構造、または細胞の特性を検出するまたは評価するための、他の分子(たとえば合成による配列決定中に標識される相補的ヌクレオチド、ポリヌクレオチド、ポリペプチド、もしくは全長のタンパク質等)、細胞の構成要素もしくは構造(脂質、細胞壁等)、または細胞に結合することができる、分子を指す。プローブは、標的分析物に結合する構造または構成要素を含む。いくつかの態様において、複数のプローブが、同じ標的分析物の異なる部分を認識してよい。プローブの例は、限定するものではないが、標識された可逆的ターミネーターヌクレオチド、アプタマー、抗体、ポリペプチド、オリゴヌクレオチド(DNA、RNA)、またはそれらの任意の組み合わせを含む。プローブとしての、抗体、アプタマー、オリゴヌクレオチド配列、およびそれらの組み合わせはまた、以下に詳細に記載される。
【0074】
プローブは、プローブの標的分析物への結合を検出するために使用される、検出可能な標識を含み得る。プローブは、直接的にまたは間接的に、標的分析物に結合され得るか、ハイブリダイズされ得るか、コンジュゲートされ得るか、もしくは共有結合され得る。
【0075】
本明細書において使用される場合、検出可能な標識との語は、プローブが標的分析物に結合され、そして光学画像化システムを用いて画像化される際に、検出可能な光学シグナルを発生させることができる、プローブに結合される分子を指す。検出可能な標識は、直接的にまたは間接的に、プローブに結合され得るか、ハイブリダイズされ得るか、コンジュゲートされ得るか、もしくは共有結合され得る。いくつかの態様において、検出可能な標識は、蛍光分子または化学発光分子である。プローブは、検出可能な標識を介して光学的に検出され得る。
【0076】
本明細書において使用される場合、光学分布モデルとの語は、点光源からの光検出に関する統計学的な確率の分布を指す。これらは、たとえばガウス分布を含む。ガウス分布は、光学分布モデルとして点像分布関数を生成するために、検出において予想される収差を含むように修正され得る。
【0077】
概観
本明細書において、基材の表面に結合している密集して詰め込まれた分析物に結合したプローブの、光学検出および識別を容易にするシステムおよび方法が、提供される。部分的には、本明細書において記載される方法およびシステムは、基材上の各分析物の相対位置の同定の正確性を改善するために、基材の表面上の複数の標的分析物の、繰り返しの検出に依存する。この情報はその後、各サイクルについての基材のフィールドの各画像におけるシグナルのデコンボリューションを実施して、標的分析物に結合したプローブからのシグナルを信頼性をもって同定するために、使用され得る。いくつかの態様において、このタイプのデコンボリューション処理は、活性化光によって活性化された場合にオーバーラップする放出スペクトルを有する標的分析物に結合する、異なるプローブの間を区別するために使用され得る。いくつかの態様において、デコンボリューション処理は、光学シグナルを隣接する分析物から分離するために使用され得る。これは、光学システムの回折限界のために光学的検出が困難である密度を有する分析物を有する基材にとって、特に有用である。
【0078】
いくつかの態様において、本明細書において記載される方法およびシステムは、配列決定のために特に有用である。高密度に詰め込まれた基材上での、信頼性を有する光学的検出を容易にする方法およびシステムを提供することにより、試薬、使用されるクローン分子の数、処理と読み取りの時間などの、配列決定に関連するコストをすべて削減することができ、配列決定技術、具体的には、光学的に検出されるヌクレオチドを用いる、単一分子の、合成による配列決定を、大きく進展させる。
【0079】
本明細書において記載されるシステムおよび方法は、進展中の配列決定技術に重要な関連を有するが、本明細書において記載される方法およびシステムは、概して、特に単一分子のレベルで、基材の表面に結合した分析物の光学的検出に適用可能である。
【0080】
配列決定コストの削減
配列決定技術は、IlluminaおよびComplete Genomicsなどの会社によって開発された、画像に基づくシステム、ならびにIon TorrentおよびOxford Nanoporeなどの会社によって開発された、電気に基づくシステムを含む。画像に基づく配列決定システムは、現在、既存のすべての配列決定技術の中で最少の配列決定コストを有する。画像に基づくシステムは、高スループットの画像化光学系および低コストの消耗品の組み合わせによって低コストを達成する。しかしながら、先行技術の光学的検出システムは、部分的には光学システムの回折限界のため、約1ミクロンという、近接する解像可能な分子間の最少の中心間の間隔を有する。いくつかの態様において、既存の生化学を用いる、画像に基づく配列決定システムに関して、回折限界未満で機能する、詰め込みの増大した密度に対応するために、反復検出、分析物の精確な位置の決定、および画像化されたシグナルの高度に正確なデコンボリューションのための位置情報の使用を用いる、有意により低いコストを達成するための方法が、本明細書において記載される。
【0081】
本明細書において、回折限界未満の中心間の間隔で表面上に固定化された分析物からのシグナルの画像化を容易にするためのシステムおよび方法が提供される。これらのシステムおよび方法は、高い分解能の画像を生成するために、先進の画像化システムを使用し、かつ、高い正確性での基材上の分子の位置決定を容易にするために、反復検出を使用し、かつ、高密度に詰め込まれた表面上の各分子についてのシグナルのアイデンティティを高い正確性で取得するために、画像のデコンボリューションを使用する。これらの方法およびシステムは、高密度に詰め込まれた基材上での、単一分子の、合成による配列決定を可能にして、高い正確性での高効率かつ非常に高スループットのポリヌクレオチドの配列決定を提供する。
【0082】
配列決定システムに関する主なコスト構成要素は、第一にはバイオチップおよび試薬を含む消耗品、そして第二には機器コストである。10ドルの30Xゲノム、すなわち100倍のコスト削減に到達するためには、単位面積あたりのデータの量を100倍増大させる必要があり、かつデータ点あたりの試薬の量を100倍低下させる必要がある。
【0083】
図1は、シーケンサーのスループット 対 アレイのピッチを示し、そして10ドルゲノムのために必要とされる基準を満たすシステム設計を概説する。基本的な考え方は、100倍のコスト削減を達成するために、単位面積あたりのデータの量を100倍増大させる必要があり、かつデータ点あたりの試薬の量を100倍低下させる必要がある、というものである。コストにおけるこれらの削減を達成するために、本明細書において、回折限界未満の密度で基材の表面上に固定化されたポリヌクレオチドの、信頼性のある配列決定を容易にする方法およびシステムが提供される。これらの高密度アレイは、より効率の良い試薬の使用を可能にし、かつ単位面積あたりのデータの量を増大させる。加えて、検出の信頼性の増大は、配列決定および検出において、誤差を同定しそして補正するために合成されなくてはならないクローンコピーの数の減少を可能にし、試薬のコストおよびデータ処理のコストをさらに減少させる。
【0084】
基材の表面上における、分析物の高密度配置
図2Aは、240 nmのピッチで80 nmの直径の結合領域(スポット)という高密度領域の、提案される態様を示す。この態様において、単鎖DNA分子のみがチップ上の特定の領域に結合した、規則的なアレイが使用され得る。いくつかの態様において、スポットを埋め尽くさないよう、40 kBより小さいコンカテマー(すなわち、連続して連結された同じDNA配列の複数のコピーを含む、長く連続したDNA分子)が使用される。コンカテマーのサイズはほぼ領域に対応しており、同じ増幅プロセスが使用される場合、より小さいコンカテマーの予測される長さは、およそ10コピーをもたらすおよそ4 kB~5 kBとなることを意味する。4 kBの長さのDNAを使用し、そして単一の分子を直接的に配列決定することもまた、可能である。別の選択肢は、排他的な分子を作るのに必要なサイズまで全長を伸ばすために、DNAのより短いセグメントに、配列決定されないフィラーDNAを結合させることである。
【0085】
図2Bは、1,000ドルゲノムのために使用される試料の有効ピッチと比較した、提案されるピッチの比較である。新規なアレイの密度は170倍高く、100倍高い密度を達成するという基準を満たす。単位面積あたりの画像化スポットあたりのコピーの数もまた、先行する既存のプラットフォームよりも少なくとも100倍低いという基準を満たす。これは、試薬コストが基準よりも100倍費用効果が高いことを確実にする助けとなる。
【0086】
高密度に詰め込まれた単一生体分子の画像化および回折限界
画像化プラットフォームの増大した分子密度に関する根本的な制約は、回折限界である。光学システムの回折限界のための方程式は:
であり、ここでDは回折限界であり、λは光の波長であり、かつNAは光学システムの開口数である。典型的な空気中の画像化システムは、0.6~0.8のNAを有する。λ = 600 nmを用いると、回折限界は375 nm~500 nmとなる。水浸システムに関して、NAは約1.0であり、300 nmの回折限界となる。
【0087】
もしも、生体分子を含む、アレイ上または他の基材表面上の特徴物が近すぎると、2つの光学シグナルはオーバーラップして、実際には、画像のみに基づいて信頼性をもって解像することができない、単一のブロブしか見えない。これは、動く基材の不正確な追尾によるぼけ、またはセンサーと基材の表面との間の光路における光学的変動などの、光学画像化システムによって導入される誤差によって悪化し得る。
【0088】
顕微鏡の試料平面における1点から発せられる透過光または蛍光放出の波面は、波面を効果的に広げる対物レンズの開口の端で回折し、有限であるが元の点より大きいサイズの中心ディスクを有する回折パターンへと広がった、点光源の画像を生成する。したがって、光の回折のため、試料の画像は、試料に存在する実際の細部を完全に表現することはない、なぜならば、それを下回って顕微鏡の光学システムが構造の細部を解像することができない、下限が存在するからである。
【0089】
顕微鏡での、波長以下の構造の観察は、回折限界のために困難である。蛍光タンパク質またはヌクレオチドの単一分子などの、顕微鏡における点物体は、中間平面において、干渉の作用によって作り出された回折パターンからなる画像を生成する。高度に拡大されると、点物体の回折パターンは、一連の回折環によって囲まれた中心のスポット(回折ディスク)からなるように観察される。組み合わせて、この点光源回折パターンは、エアリーディスクと称される。
【0090】
エアリーパターンの中心スポットのサイズは、光の波長、および対物レンズの開口角に関連付けられる。顕微鏡の対物レンズに関して、開口角は開口数(NA)によって記述され、これは試料から光を集めることができる対物レンズの半角である、 sin θ との語を含む。分解能に関して、横方向の(x、y)画像平面における回折エアリーディスクの半径は、以下の式によって定義される:アッベ分解能xy = λ/2NA、ここでλは透過光における光の平均波長、または蛍光における励起波長帯域である。対物レンズの開口数(NA = n・sin(θ))は、開口角のサイン(sin(θ))を乗じた画像化媒質(n;通常は空気、水、グリセリン、または油)の屈折率によって定義される。この関連性の結果、点光源によって作られるスポットのサイズは、波長が減少するにつれて、および開口数が増大するにつれて、減少するが、常に有限の直径のディスクを維持する。アッベの分解能(すなわちアッベ限界)はまた、本明細書において回折限界と称され、かつ光学システムの分解能の限界を定義する。
【0091】
2つのエアリーディスクまたは点像分布関数の間の距離がこの値よりも大きい場合、2つの点光源は解像されるとみなされる(そして、容易に区別され得る)。そうでなければ、エアリーディスクはともに合体し、そして解像されないとみなされる。
【0092】
したがって、波長 λ で単一分子の検出可能な標識の点光源から放出され、屈折率 n で媒質中を進み、そして半角 θ でスポットに収束する光は、直径:d = λ/2*NA を有する回折限界のスポットを作り出す。500 nm付近の緑色光で1のNA(開口数)であるとすると、回折限界はおよそ d = λ/2 = 250 nm(0.25 μm)であり、これは従来の画像化技術によって画像化され得る、表面上の単一分子タンパク質およびヌクレオチドなどの分析物の密度を制限する。光学顕微鏡が、利用可能な最高の品質のレンズ要素を備え、完璧に調整され、かつ最大の開口数を有する場合でさえも、分解能は、最良のシナリオにおいて、光の波長のおよそ半分に制限されたままである。分解能を増大させるために、UV顕微鏡およびX線顕微鏡など、より短い波長が使用され得る。これらの技術は、より良い分解能を提供するが、しかし高価であり、生物学的試料におけるコントラストの欠如という難点があり、かつ試料に損傷を与え得る。
【0093】
デコンボリューション
デコンボリューションは、記録されたデータに対するコンボリューションの作用を逆転させるために使用される、アルゴリズムに基づくプロセスである。デコンボリューションの概念は、シグナル処理および画像処理の技術において広く使用されている。これらの技術は次々に、多くの科学および工学の分野において広く使用されているので、デコンボリューションは多くの応用性を提供している。
【0094】
光学系および画像化において、「デコンボリューション」との語は、光学顕微鏡、電子顕微鏡、望遠鏡、または他の画像化機器において起こる光学ひずみを逆転させるプロセスを指すために特に使われ、そうしてより明瞭な画像を作り出す。それは、通常、一連の顕微鏡画像処理技術の一部として、ソフトウェアアルゴリズムによって、デジタル領域においてなされる。
【0095】
通常の方法は、機器を通り抜ける光路が光学的に完璧であると仮定して、光(または他の波)の理論上の点光源が機器を通り抜ける経路に関してひずみを記述する数学関数である、点像分布関数(PSF)を用いてコンボリューションされている。通常、そのような点光源は、最終的な画像に、小さなぼやけた領域をもたらす。この関数が決定され得る場合、その後は、その逆関数または補関数をコンピューターで計算し、そして取得された画像をそれでコンボリューションすればよい。デコンボリューションは、フーリエ終域における除算に写像する。これは、フーリエ変換の対象である実験データにデコンボリューションが容易に適用されることを可能にする。一例はNMR分光法であり、これにおいてはデータは時間領域において記録されるが、周波数領域において分析される。指数関数による時間領域データの除算は、周波数領域におけるローレンツ(Lorenzian)線の幅を減少させる作用を有する。結果は、本来の、ひずみのない画像である。
【0096】
しかしながら、回折限界の画像化のためには、点像分布関数が完全に既知であるとしても、デコンボリューションは、回折限界を超えて分解能を改善するために、シグナルをさらに精製することも必要とする。ナイキスト距離より短い距離にある2つの物体を信頼性をもって分離することは、非常に困難である。しかしながら、ナイキスト距離よりもはるかに短い距離で隔てられている物体を信頼性をもって検出するために、反復検出、分析物の位置決定、アラインメント、およびデコンボリューションを用いる方法ならびにシステムが、本明細書において記載される。
【0097】
配列決定
光学的検出画像化システムには回折限界があり、そのためこれは、配列決定において典型的に使用されるフルオロフォアに関して、約300 nmの、理論上の最大分解能を有する。現在まで、最良の配列決定システムは、それらのアレイ上で約600 nmの、または約2X回折限界の、近接するポリヌクレオチドの間の中心間の間隔を有している。この 2X という係数は、結果として位置の誤差を生じ得る、強度の、アレイの、および生物学的な変動を明らかにするために、必要とされる。10ドルゲノムを達成するために、およそ200 nmの中心間の間隔が必要とされ、これは回折限界未満の画像化能力を必要とする。
【0098】
配列決定に関して、本明細書において記載されるシステムおよび方法の目的は、光学システムの回折限界未満の中心間の間隔を有する基材上で、配列決定されるポリヌクレオチドを解像することである。
【0099】
本明細書において記載されるように、本発明者らは、部分的には、各分析物の位置を高い正確性(たとえば10 nm以下のRMS)で同定することにより、回折限界未満での画像化を達成するための方法およびシステムを提供する。比較として、最新のSuper Resolution systems(Harvard/STORM)は、20 nm RMSにまで下げた正確性でしか位置を同定することができず、本システムより2Xで劣る。したがって、本明細書において開示される方法およびシステムは、基材上に高密度に詰め込まれた分子を同定する回折限界未満の画像化を可能にして、酵素1単位あたりの高いデータレート、時間1単位あたりの高いデータレート、および高いデータ正確性を達成し、10ドルゲノムを達成する。本明細書において記載されるように、これらの回折限界未満の画像化技術は、反復検出を用いる技術に対して広く適用可能である。
【0100】
画像化および反復検出
本明細書において記載されるように、検出方法およびシステムのそれぞれは、回折限界未満の画像化を達成するために、反復検出を必要とした。反復検出は、結合および画像化、または可視光の光学シグナルを放出することができる検出可能な標識に結合した抗体もしくはヌクレオチドなどのプローブを含む。異なるサイクルからの、フィールドの一連の画像からの位置情報を用いることにより、高密度に詰め込まれた基材からのシグナルを解像するデコンボリューションを、光学画像化の回折限界のために不明瞭にされたシグナルからの個々の光学シグナルを効果的に同定するために、使用することができる。複数のサイクル後、分子の厳密な位置は、ますますより正確となる。この情報を用いて、ピクセルへの離散化作用のために生じる、クロストークマトリックスにおける既知の非対称に関するクロストーク補正を補助するために、追加の計算が実施され得る。
【0101】
反復されるプローブ結合および光学的検出を用いる方法ならびにシステムは、その全体が参照により本明細書に組み入れられる、2015年11月19日発行の米国特許出願公開第2015/0330974号、Digital Analysis of Molecular Analytes Using Single Molecule Detectionに記載されている。
【0102】
いくつかの態様において、生画像は、オーバーサンプリングされた画像のより正確な決定を容易にするために、少なくともナイキスト限界であるサンプリングを用いて取得される。ナイキスト限界より大きいサンプリング(オーバーサンプリング)による、画像を表すために使用されるピクセルの数の増大は、画像処理および表示に利用可能なピクセルデータを増大させる。
【0103】
理論上、帯域制限されたシグナルは、ナイキストレート以上でサンプリングされた場合に、完全に再構成され得る。ナイキストレートは、シグナルにおける最高の周波数成分の2倍として定義される。オーバーサンプリングは、分解能を改善し、ノイズを減少させ、そしてアンチエイリアシングフィルターの性能要件を緩和することによって、エイリアシングおよび位相ひずみを回避する助けとなる。シグナルは、それがナイキストレートのN倍でサンプリングされた場合に、N倍オーバーサンプリングされた、と言われる。
【0104】
したがって、いくつかの態様において、各画像は、観察している光の波長の半分以下のピクセルサイズで取得される。いくつかの態様において、ナイキスト限界以上でのサンプリングを達成するために、162.5 nm x 162.5 nmのピクセルサイズが検出において使用される。基材の生画像形成中の、少なくともナイキスト限界の周波数でのサンプリングは、本明細書において記載されるシステムまたは方法の分解能を最適化するために好ましい。これは、高い正確性で、回折限界未満で基材上で特徴物を解像するために、本明細書において記載されるデコンボリューション方法および光学システムとともになされ得る。
【0105】
異なるサイクルからの画像の処理
回折限界未満での画像化を達成するために、本発明によって克服されるいくつかの障壁がある。
【0106】
ピクセル化の誤差は生画像に存在し、そしてピクセル化のために、存在している情報の光学シグナルからの同定を妨害する。本明細書において記載されるような、少なくともナイキスト周波数でのサンプリング、およびオーバーサンプリングされた画像の生成はそれぞれ、ピクセル化(pixilation)の誤差を克服する助けとなる。
【0107】
さまざまな分子の点像分布(PSF)はオーバーラップする、これは、PSFのサイズがピクセルサイズ(ナイキストを下回る)より大きいからであり、かつ中心間の間隔が、空間上のオーバーラップに起因するクロストークが生じるほど小さいからである。最近傍変数回帰(中心間のクロストークに関して)は、複数のオーバーラップする光学シグナルのデコンボリューションを助けるために使用され得る。しかしこれは、基材上の各分析物の相対位置が既知であり、かつフィールドの画像の優れたアラインメントを有していれば、改善され得る。
【0108】
複数のサイクル後、分子の厳密な位置は、ますますより正確となる。この情報を用いて、ピクセルへの離散化作用および回折限界のために生じる、光学シグナルの空間上のオーバーラップにおける既知の非対称を補正することによってデコンボリューションを補助するために、追加の計算が実施され得る。それらはまた、放出スペクトルにおける、異なる放出スペクトルからのオーバーラップを補正するために、使用され得る。
【0109】
各分析物についての高度に正確な相対位置情報は、各分析物に結合した異なるプローブの光学シグナルからの測定されたピークの分布を生成するために、異なるサイクルからの同じフィールドの画像をオーバーレイすることによって、獲得され得る。この分布はその後、分析物の単一の相対位置に対応するピークシグナルを生成するために使用され得る。サイクルのサブセットからの画像は、各分析物についての相対位置情報を生成するために使用され得る。いくつかの態様において、この相対位置情報は、ローカライゼーションファイルにおいて提供される。
【0110】
各サイクルについて、フィールドの画像化される特定の領域は、サイクルからサイクルへと変更されてよい。したがって、各画像について分析物の位置の同定の正確性を改善するために、複数のサイクルにわたるフィールドの画像間のアラインメントが実施され得る。このアラインメントから、参照ファイルと比較したオフセット情報が、その後、同定され得、そして、回折限界のために不明瞭にされた光学シグナルについてデコンボリューションおよびシグナル同定の正確性をさらに増大させるために、デコンボリューションアルゴリズムに組み込まれ得る。いくつかの態様において、この情報はフィールドアラインメントファイルとして提供される。
【0111】
シグナル検出(クロストーク/最近傍)
基材上の分析物について相対位置情報が正確に決定され、そして各サイクルからのフィールド画像がこの位置情報とアラインされると、クロストークおよび最近傍回帰を用いる、オーバーサンプリングされた各画像の分析が、各画像における各分析物からの光学シグナルを正確に同定するために、使用され得る。
【0112】
いくつかの態様において、光学システムの回折限界によって不明瞭にされた複数の光学シグナルは、基材上に固定化され、かつ検出可能な標識を含むプローブに結合された、複数の生体分子のそれぞれに関して、同定される。いくつかの態様において、プローブがヌクレオチドに組み込まれ、そして一連のサイクルが、アレイ上に固定化されたポリヌクレオチドの配列を、単一分子の、合成による配列決定を用いて決定するために、使用される。
【0113】
画像に適用されるデコンボリューションのシミュレーション
分子の密度は、隣接する分子からのクロストークにより制約を受ける。
図3は、単一分子のシミュレートされた画像を示す。この特定の画像は、2Xオーバーサンプリングフィルターで処理された、600 nmのピッチの単一分子アレイのシミュレーションである。8つの近接するスポット中へのクロストークは、アレイのピッチおよびアルゴリズムのタイプの関数として平均される。
【0114】
図4は、複数のピッチ、および画像処理アルゴリズムの2つのバリエーションで処理された、一連の画像であり、一つ目は2Xオーバーサンプリングされた画像であり、そして二つ目は、本明細書において記載されるようにデコンボリューションをともなって4Xオーバーサンプリングされた画像である。
図5は、200 nmに下げたピッチでのこれら2つのタイプの画像処理の、クロストーク分析である。2Xオーバーサンプリングでの、25%以下の許容可能なクロストークレベルは、275 nm以上のピッチについて生じる。光学システムの点像分布関数を用いる4Xデコンボリューションでの、25%以下の許容可能なクロストークレベルは、210 nm以上のピッチについて生じる。
【0115】
分子の物理的なサイズは、スポットを、結合領域のサイズのほぼ半分、拡張するであろう。たとえば、80 nmのスポットについて、ピッチはおよそ40 nm増大されるであろう。より小さいスポットサイズが使用されてよいが、しかしこれは、より少ないコピーしか許容されず、かつより強い光の強度が必要であるという、代償を有するであろう。単一のコピーは、最も単純な試料調製をもたらすが、しかし、最も強い光の強度を必要とする。
【0116】
この点を取り扱う回折限界未満の画像化のための方法は、オーバーサンプリング、デコンボリューション、およびクロストーク補正の画像処理技術を含む。本明細書において、分析物についての、プローブの光学シグナル画像化の複数のサイクルからの情報を用いる、基材上の分析物の精確な相対位置の決定を組み込む方法およびシステムが、記載される。この情報を用いて、ピクセルへの離散化作用のために生じる、クロストークマトリックスにおける既知の非対称に関するクロストーク補正を補助するために、追加の計算が実施され得る。
【0117】
方法
いくつかの態様において、
図6に示されるように、本明細書において、高密度に詰め込まれた基材の表面上に固定化された分析物の相対位置を正確に決定するための方法が提供される。該方法は、表面を含む基材を提供する工程を最初に含み、ここで表面は、表面上で別々の位置に固定化された複数の分析物を含む。その後、該表面上でのプローブ結合およびシグナル検出の複数のサイクルが実施される。検出の各サイクルは、分析物を、表面上に固定化された標的分析物に結合することができるプローブセットと接触させる工程、該表面上の別々の位置で該分析物に結合した個々のプローブからの複数の光学シグナルを検出するために、光学システムを用いて該表面のフィールドを画像化する工程、および検出の別のサイクルが実施されようとする場合に、結合したプローブを除去する工程を含む。各画像から、該複数のサイクルの少なくとも2つからの該フィールドの画像からの該複数の光学シグナルのそれぞれからのピーク位置が検出される。各分析物についてのピークの位置がオーバーレイされて、それから基材上の各分析物の正確な相対位置がその後決定される、ピークのクラスターが生成される。
【0118】
いくつかの態様において、
図7に示されるように、基材上での分析物についての正確な位置情報はその後、該画像のそれぞれからのオーバーラップする光学シグナルをデコンボリューションするために画像に適用され得る、位置情報を組み込む(たとえば、基材における隣接する分析物間の中心間の間隔を同定するため)デコンボリューションアルゴリズムにおいて使用される。いくつかの態様において、デコンボリューションアルゴリズムは、オーバーラップする光学シグナルを有する隣接する分析物の間の空間上の識別のための、最近傍変数回帰を含む。
【0119】
いくつかの態様において、
図8に示されるように、分析物検出の方法は、基材上に固定化された個々のポリヌクレオチドの配列決定に適用される。
【0120】
いくつかの態様において、
図11に示されるように、光学シグナルは、高密度に詰め込まれた基材からデコンボリューションされる。
図9に示されるように、工程は、4つの異なるセクションに分割されることができる:1) 画像分析、これは各サイクルについてのフィールドの各画像からのオーバーサンプリングされた画像の生成、ならびに画像における検出される各光学シグナルのピーク位置および強度を含むピークファイル(すなわちデータセット)の生成を含む。2) ローカライゼーションファイルの生成、これは基材上の分析物の正確な相対位置を決定するための、各分析物についての光学シグナル検出の複数のサイクルから生成される複数のピークのアラインメントを含む。3) フィールドアラインメントファイルの生成、これは選択された参照画像に対して、異なる検出サイクルからのフィールドの画像をアラインするための、各画像についてのオフセット情報を含む。4) 強度の抽出、これは、オーバーサンプリングされた各画像から検出されるシグナルの正確なアイデンティティを決定するために、デコンボリューションモデリングとともに、オフセット情報および位置情報を使用する。「強度の抽出」工程はまた、合成による配列決定の処理および検出における誤差を補正するために使用される、前のサイクルの回帰などの、他の誤差の補正を含み得る。各セクションにおいて実施される工程は、以下に、さらに詳細に記載される。
【0121】
図10Aおよび
図11に示される画像分析工程において、各サイクルからの各フィールドの画像は、検出された各シグナルについてピクセルの数を増大させるように、各シグナルについてピークを鋭利にするように、そして各シグナルからのピーク強度を同定するように、処理される。この情報は、各サイクルについての各フィールドのピークファイルを生成するために使用され、ピークファイルは、各分析物の位置の測定値(観察された光学シグナルのピークから)、および各シグナルからのピーク強度からの強度を含む。いくつかの態様において、各フィールドからの画像は、画像からのノイズの最初の除去を実施するために、バックグラウンド除去を最初に受ける。その後画像は、各画像において観察されたシグナルのモデリングに基づく人工的に生成されたピクセルを含むオーバーサンプリングされた画像を生成するために、平滑化およびデコンボリューションを用いて処理される。いくつかの態様において、オーバーサンプリングされた画像は、生画像からの各ピクセルから、4ピクセル、9ピクセル、または16ピクセルを生成することができる。
【0122】
各生画像において検出される、またはオーバーサンプリングされた画像に存在する、光学シグナルからのピークはその後同定され、そして検出される各分析物についての強度および位置情報は、さらなる処理のためにピークファイル中に置かれる。
【0123】
いくつかの態様において、基材の各サイクルおよび各フィールドから検出されるすべての画像に対応するN枚の生画像、または画像化された各フィールドについてのN枚のオーバーサンプリングされた画像およびN個のピークファイルへの出力。ピークファイルは、各画像に関して検出される各分析物の、相対位置を含む。いくつかの態様において、ピークファイルはまた、検出される各分析物についての強度情報を含む。いくつかの態様において、1つのピークファイルが、各色、および各サイクルにおける各フィールドについて生成される。いくつかの態様において、各サイクルは、1つのピークファイルが、各色、および各サイクルにおける各パスの各フィールドについて生成され得るように、複数のパスをさらに含む。いくつかの態様において、ピークファイルは、単一のフィールド中の光学シグナルからピーク位置を特定する。
【0124】
好ましい態様において、ピークファイルは、各サイクルについてのフィールドの、処理された、オーバーサンプリングされた各画像からの、XY位置情報を含む。XY位置情報は、プローブからの検出された検出可能な各標識(フルオロフォアなど)の位置の、オーバーサンプリングされた画像から判断された座標を含む。ピークファイルは、個々の検出可能な標識それぞれからのシグナルからの強度情報もまた、含み得る。
【0125】
オーバーサンプリングされた画像の生成は、ピクセル化のために抽出することができない、存在している情報を同定して、ピクセル化の誤差を克服するために、使用される。平滑化およびデコンボリューションによる生画像の最初の処理は、各分析物の位置をより高い正確性をもって決定できるように、ピークファイルにおいてより正確な情報を提供する助けとなり、そしてこの情報は続いて、回折限界での画像化において不明瞭にされたシグナルのより正確な決定を提供するために使用され得る。
【0126】
いくつかの態様において、生画像は、オーバーサンプリングされた画像のより正確な決定を容易にするために、少なくともナイキスト限界であるサンプリングを用いて取得される。ナイキスト限界より大きいサンプリング(オーバーサンプリング)による、画像を表すために使用されるピクセルの数の増大は、画像処理および表示に利用可能なピクセルデータを増大させる。
【0127】
理論上、帯域制限されたシグナルは、ナイキストレート以上でサンプリングされた場合に、完全に再構成され得る。ナイキストレートは、シグナルにおける最高の周波数成分の2倍として定義される。オーバーサンプリングは、分解能を改善し、ノイズを減少させ、そしてアンチエイリアシングフィルターの性能要件を緩和することによって、エイリアシングおよび位相ひずみを回避する助けとなる。シグナルは、それがナイキストレートのN倍でサンプリングされた場合に、N倍オーバーサンプリングされた、と言われる。
【0128】
したがって、いくつかの態様において、各画像は、観察されている光の波長の半分以下のピクセルサイズで取得される。いくつかの態様において、ナイキスト限界以上でのサンプリングを達成するために、162.5 nm x 162.5 nmのピクセルサイズが検出において使用される。
【0129】
平滑化は、データにおける重要なパターンを捕捉するが一方でノイズまたは他の微細な規模の構造/急速な現象を排除する近似関数を、使用する。平滑化において、シグナルのデータ点は、個々の点が減少し、かつ近接する点よりも低い点が増やされるように修正されて、より平滑なシグナルがもたらされる。平滑化は、本明細書において、各画像において検出される回折限界の光学シグナルを平滑化して、シグナルからのピークおよび強度をより良く同定するために、使用される。
【0130】
各生画像には回折限界があるが、本明細書において、異なるサイクルからの同じ分析物からの複数のシグナルの収集をもたらす方法が記載される。この方法の態様は、
図10Bのフローチャートにおいて示される。各分析物からのこれらの複数のシグナルは、それぞれの個々の画像からの回折限界のシグナルよりもはるかにより正確な位置を決定するために使用される。それらは、5 nm未満の分解能でフィールド内の分子を同定するために使用され得る。この情報はその後、
図11に示されるように、ローカライゼーションファイルとして保管される。高度に正確な位置情報は、クロストーク回帰および最近傍変数回帰などのデコンボリューションアルゴリズムと組み合わせて、それぞれの個々のフィールド画像からのシグナル同定を大幅に改善するために、その後使用され得る。
【0131】
図11に示されるように、ローカライゼーションファイルを生成する工程は、基材上の分析物のセットの相対位置を決定するために、ピークファイルにおいて提供される位置情報を使用する。いくつかの態様において、各ローカライゼーションファイルは、基材の単一の画像化フィールドからの分析物のセットからの相対位置を含む。ローカライゼーションファイルは、回折限界未満で検出される分析物についての高度に正確な位置情報を生成するために、複数のサイクルからの位置情報を組み合わせる。
【0132】
いくつかの態様において、各分析物についての相対位置情報は、平均で、10 nm未満までの標準偏差(すなわちRMSまたは二乗平均平方根)で決定される。いくつかの態様において、各分析物についての相対位置情報は、平均で、10 nm未満までの2X標準偏差で決定される。いくつかの態様において、各分析物についての相対位置情報は、平均で、10 nm未満までの3X標準偏差で決定される。いくつかの態様において、各分析物についての相対位置情報は、10 nm未満までの中央値の標準偏差で決定される。いくつかの態様において、各分析物についての相対位置情報は、10 nm未満までの中央値の2X標準偏差で決定される。いくつかの態様において、各分析物についての相対位置情報は、10 nm未満までの中央値の3X標準偏差で決定される。
【0133】
異なるサイクルからのフィールドについてのピークファイルのサブセットから、ローカライゼーションファイルが、アレイ上の分析物の位置を決定するために生成される。
図11に示されるように、いくつかの態様において、ピークファイルは最初に、光学システムにおける収差を明らかにするために、点像分布関数を用いて正規化される。正規化されたピークファイルは、ピークファイルにおいて提供される位置および強度情報に基づき、人工的な正規化された画像を生成するために使用され得る。各画像は、その後アラインされる。いくつかの態様において、アラインメントは、各画像ペアを相関させ、そしてファインフィット(fine fit)を実施することによって、実施され得る。アラインされたら、各サイクルからの各分析物についての位置情報は、基材上の位置測定値の分布を提供するために、その後オーバーレイされ得る。この分布は、基材上の分析物の高度に正確な相対位置を提供する単一のピーク位置を決定するために使用される。いくつかの態様において、ポアソン分布が、単一のピークを決定するために、各分析物についてのオーバーレイされた位置に適用される。
【0134】
サイクルからの位置情報の少なくとも1つのサブセットから決定されるピークはその後、ローカライゼーションファイルに記録され、このローカライゼーションファイルは、正確性を有する、回折限界未満で検出される各分析物の相対位置の測定値を含む。記載されるように、サイクルのサブセットのみからの画像が、この情報を決定するために必要とされる。
【0135】
図11に示されるように、各サイクルおよび各色についての各フィールドからの正規化されたピークファイル、ならびに正規化されたローカライゼーションファイルが、フィールドの参照画像に対する、フィールドからの各画像についてのオフセット情報を生成するために、使用され得る。このオフセット情報は、高密度に詰め込まれた基材および回折限界の画像からのシグナル同定のさらなる改善の目的で、各生画像における分析物の相対位置決定の正確性を改善するために使用され得る。いくつかの態様において、このオフセット情報は、フィールドアラインメントファイルとして保管される。いくつかの態様において、組み合わされたローカライゼーションファイルおよびフィールドアラインメントファイルからの、フィールドにおける各分析物の位置情報は、10 nm未満のRMS、5 nm未満のRMS、または2 nm未満のRMSである。
【0136】
いくつかの態様において、フィールドアラインメントファイルは、フィールドのマスターファイルに対するオフセット情報を決定することによる、単一のフィールドからの画像のアラインメントによって、生成される。1つのフィールドアラインメントファイルが、各フィールドについて生成される。このファイルは、すべてのサイクルからのフィールドのすべての画像から生成され、かつフィールドからの参照画像に対する、フィールドのすべての画像についてのオフセット情報を含む。
【0137】
いくつかの態様において、アラインメントの前に、各ピークファイルは点像分布関数を用いて正規化され、その後に正規化されたピークファイルからの人工的な画像の生成、および人工的な画像のフーリエ変換が続く。正規化されたピークファイルの人工的な画像のフーリエ変換はその後、対応するフィールドについて正規化されたローカライゼーションファイルからの人工的な画像のフーリエ変換の複素共役を用いてコンボリューションされる。これは、各サイクルの各ピークファイルについてなされる。結果として生じるファイルはその後、画像ファイルを再生成するために逆フーリエ変換を受け、そして画像ファイルは、各画像ファイルについてのオフセット情報を生成するために、フィールドからの参照ファイルに対してアラインされる。いくつかの態様において、このアラインメントは、参照ファイルに対するファインフィットを含む。
【0138】
フィールドアラインメントファイルは、このようにオーバーサンプリングされた各画像についてのオフセット情報を含み、かつ、続く「強度の抽出」工程における使用のための各分析物についての高度に正確な相対位置を生成するために、対応するフィールドについてのローカライゼーションファイルとともに使用され得る。
【0139】
例として、20サイクルが1つのフィールドにおいて実施され、かつ1枚の画像が検出されようとする4色のそれぞれについて生成されるとすると、フィールドの80枚の画像が生成され、1つのフィールドアラインメントファイルが、フィールドから取得された80枚すべての画像(20サイクル* 4色)について生成される。いくつかの態様において、フィールドアラインメントファイルの内容は、以下を含む:フィールド、各画像について観察された色、反復検出における工程のタイプ(たとえば結合または取り除き)、および参照画像に対する画像のオフセット座標。
【0140】
いくつかの態様において、アラインメントのプロセス中、2枚の画像をアラインするために必要なXY「シフト」または「残余」が計算され、そしてプロセスは残りの画像について繰り返され、すべてに適用されるベストフィット(best fit)の残余が計算される。
【0141】
いくつかの態様において、閾値を超える残余は排除され、そしてベストフィットが再度計算される。このプロセスは、すべての個々の残余が閾値内になるまで繰り返される。
【0142】
オーバーサンプリングされた各画像はその後、ローカライゼーションファイルからの正確な位置情報、およびフィールドアラインメントファイルからのオフセット情報を用いてデコンボリューションされる。強度抽出工程の1つの態様が、
図10Cおよび
図11において示される。さまざまな分子の点像分布関数(PSF)がオーバーラップする、なぜならば、中心間の間隔は、近接する分析物からのシグナルの点像分布関数がオーバーラップするほど小さいからである。正確な分析物の位置情報および/またはオフセット情報と組み合わせた最近傍変数回帰は、回折限界のために分解能が阻害される中心間距離を有する、近接する分析物からのシグナルをデコンボリューションするために、使用され得る。各分析物についての正確な相対位置情報の使用は、回折限界未満で隣接する分析物からの光学シグナルの空間上のデコンボリューションを容易にする。いくつかの態様において、隣接する分析物の相対位置は、隣接する分析物間の正確な中心間距離を決定するために使用され、これは、それぞれの個々の画像からのシグナルのデコンボリューションにおける使用に関して隣接する分析物間の空間上のクロストークを判断するために、光学システムの点像分布関数と組み合わせて使用され得る。これは、ポリヌクレオチドの配列決定などの光学検出技術について、回折限界未満の分析物の密度での基材の使用を可能にする。
【0143】
ある態様において、放出スペクトルは、異なるシグナル間でオーバーラップする(すなわち「クロストーク」)。たとえば、合成による配列決定中に、配列決定プロセスにおいて使用される4つの色素は、典型的に、放出スペクトルにおいていくらかのオーバーラップを有する。
【0144】
特定の態様において、クロストークが異なる色チャンネルの間で生じる場合に、およびクロストークが画像の異なるセットで異なる場合に、サイクルについて得られた画像のセットにおいて、異なる特徴物に対して色を割り当てることの問題(たとえばベースコール)は、使用される異なる検出可能な各標識からの光学シグナルからオーバーラップする放出スペクトルを除去するための、オーバーサンプリングされた各画像についてのローカライゼーションファイルおよびフィールドアラインメントファイルと組み合わせたクロストーク回帰によって、解決され得る。これは、基材上の各分析物に結合する各プローブについての検出可能な標識のアイデンティティの同定の正確性をさらに増大させる。
【0145】
したがって、いくつかの態様において、本明細書において開示されるように、サイクルからのフィールドの単一の画像からのシグナル、および/またはその強度の同定は、以下の特色を使用する:1) オーバーサンプリングされた画像 - 定義された位置において強度およびシグナルを提供する。2) 正確な相対位置 - ローカライゼーションファイル(サイクルの少なくとも1つのサブセットからの情報からの位置情報を提供する)およびフィールドアラインメントファイル(フィールドにおけるすべての画像についてのオフセット/アラインメント情報を提供する)。3) 画像処理 - フィールドにおける各分析物についての正確な相対位置情報を用いる最近傍変数回帰(空間上のデコンボリューション)およびクロストーク回帰(放出スペクトルデコンボリューション)。各分析物のためのプローブ(たとえば、検出用の抗体、または配列決定用の相補的ヌクレオチド)の正確な同定。
【0146】
画像処理シミュレーション
本明細書において開示される方法およびシステムの効果は、
図12A、
図12B、
図13A、および
図13Bに示される、シミュレートされたクロストークプロットにおいて例示される。これらの図のそれぞれについて、10 um X 10 umの領域での検出された各分析物における4つのフルオロフォアの1つと相関する放出スペクトルの強度を示すクロストークプロットが、示される。4つのフルオロフォアのうちの1つに対応するそれぞれの軸は、プロットのそれぞれの角へと伸長する。したがって、プロットの中心に位置するスポットは、すべての4つのフルオロフォアからの、強度の等しい寄与を有する。画像化サイクル中の個々のフルオロフォアから検出された放出強度は、X、Y;X、-Y;-X、Y;または-X、-Yのいずれかの方向にスポットを移動させるように割り当てられる。したがって、これらの4つの軸に沿ったスポットの集団の分離は、分析物の位置におけるフルオロフォアからの明確なデコンボリューションされたシグナルを示す。各シミュレーションは、10.075 um x 10.075 umの領域における1024分子の検出に基づいており、これは1平方ミクロンあたり10.088分子の密度、または約315 nmの分子間の平均中心間距離を示す。これは、162.5 nm x 162.5 nmのピクセルサイズでの約62 x 62ピクセルの画像領域と相関する。
【0147】
図12Aは、生画像から検出された光学シグナルからの4つのフルオロフォア間のフルオロフォア強度のクロストークプロットを示す。
図12Bおよび
図13Aはそれぞれ、4Xオーバーサンプリングされた画像を生成することによって達成された、4つのフルオロフォア間の分離を示し、これは各分析物におけるクロストークのいくつかの除去の達成を示す。
図13Bは、同じ画像化領域であるが、
図11に示されるように、かつ本明細書において記載されるように実施されるデコンボリューションおよび最近傍回帰を用いたクロストークプロットを示す。
図13Aおよび
図12Aと比べ、検出された各分析物は、その光学シグナルの、他のフルオロフォアからの明確な分離を示し、これは、各分析物についての高度に正確なフルオロフォアの同定を示す。
【0148】
図14Aおよび
図14Bは、上記シミュレートされた場合の、検出された10.075 μm x 10.075 μmの各領域のシミュレートされた4色合成画を示す。これは、生画像(
図14A)および本明細書において記載されるように処理された画像(
図14B)からの(form)分析物間の明瞭性を、視覚的に表現する。
【0149】
配列決定
上述のおよび
図11において記載される方法はまた、高密度に詰め込まれたポリヌクレオチドを含む基材上で伸長する相補鎖へと組み込まれる相補的な可逆的ターミネーターの光学的検出を用いる、合成による配列決定による配列決定を容易にする。したがって、回折限界未満の中心間距離で隣接しているポリヌクレオチドの配列と相関するシグナルは、本明細書において記載される方法および光学検出システムを用いて、信頼性をもって検出され得る。配列決定中の画像処理はまた、配列決定反応または検出における誤差を補正するための、基材上の繰り返されたクローン配列に基づく、もしくはデータそれ自体に基づく、前のサイクルの回帰を含み得る。いくつかの態様において、配列決定のために基材上に固定化されるポリヌクレオチドは、コンカテマーである。コンカテマーは、配列決定されようとするポリヌクレオチドの、複数の同一コピーを含み得る。したがって、本明細書において記載される方法およびシステムによって同定される各光学シグナルは、組み込まれたヌクレオチドからの単一の検出可能な標識(たとえばフルオロフォア)を指すことができ、または、シグナルが複数の位置からの平均であるように、単一のコンカテマーにおいて複数の位置に結合した複数の検出可能な標識を指すことができる。生じなくてはならない分解能は、個々の検出可能な標識の間ではなく、基材に固定化された異なるコンカテマーの間である。
【0150】
いくつかの態様において、1つまたは複数のコピーの、配列決定されようとする分子は、共有結合を用いて、表面上の捕捉オリゴヌクレオチドへのハイブリダイズによって、または他の非共有結合によって、表面に結合される。結合した分子は、数百サイクルの間、表面上にとどまり、そして特定の変種の存在の確認のため、最初の配列決定プライマーを取り除いた後で、異なるプライマーセットを用いて再度調査されることができる。
【0151】
1つの態様において、フルオロフォアおよび保護基は、化学反応を用いて除去されてよい。
【0152】
別の態様において、蛍光基および保護基は、UV光を用いて除去されてよい。
【0153】
1つの態様において、配列決定されようとする分子は、50~100 nMの直径を有しておりかつこれらの領域が150~300 nMのピッチで配置され得る反応性の表面上に、固定化され得る。これらの分子は、標的のデコンボリューションのためにそれら分子に結合されたバーコード、および配列決定を開始するために配列決定プライマーが結合する領域を有してよい。緩衝液は、伸長反応を可能にする適切な量のDNAポリメラーゼを含むであろう。これらの位置(sited)は、利用可能な遺伝子増幅方法(PCR、全ゲノム増幅等)のいずれかによって生成された、配列決定されようとする標的の10~100コピーを含み得る。
【0154】
別の態様において、バーコードおよびプライマーアニール部位でタグ付けされた単一標的分子は、60~150 nMのピッチで配置された直径20~50 nMの反応性の表面上に固定化され得る。分子は個々に配列決定され得る。
【0155】
1つの態様において、プライマーは標的に結合し得、かつ1回につき1つまたは複数のフルオロフォアを有する1つのdNTPを用いて伸長し得;表面は画像化され得、フルオロフォアは除去されかつ洗浄され得、そしてプロセスは、第二の伸長を産生するために繰り返され得る。同じdNTPにおける複数のフルオロフォアの存在は、ゲノムのいくつかの領域に存在するヌクレオチドのリピートの数(2~5個またはそれより多く)を決定することを可能にするであろう。
【0156】
異なる態様において、プライマーのアニーリングに続き、フルオロフォアを有する4つすべてのdNTP、および保護された3' ヒドロキシル基は、ポリメラーゼ伸長反応において使用され得、表面は画像化され得、そしてフルオロフォアおよび保護基は除去され得、そしてプロセスは複数のサイクルの間、繰り返され得る。
【0157】
別の態様において、配列は、所定の位置での特定のヌクレオチドの存在に基づいてライゲーションする特定のプローブにアニールするライゲーション反応に基づいて、推定され得る。
【0158】
上記概説した技術を用いる、先行技術のランダムなアレイに対して改善された密度を有するランダムなアレイが使用されてよいが、しかしながら、ランダムなアレイは一般的に、規則的なアレイから4X~10X減少した表面密度を有する。ランダムなアレイの利点は、チップの均一な非パターン化表面、およびより短い核酸鎖の使用を含む、なぜならば、より長い鎖の排他的な特性に依存する必要がないからである。
【0159】
等価物および範囲
当業者は、本明細書において記載される本発明にしたがった特定の態様の多くの等価物を認識するか、または慣例の実験だけを用いてこれらを確認することができる。本発明の範囲は、上述の説明に限定されることを意図せず、むしろ、添付の請求の範囲において記載されるように意図される。
【0160】
請求の範囲において、「1つ(a)」、「1つ(an)」、および「その(the)」などの冠詞は、相反する指示がない限り、またはそうでなければ文脈から明らかでない限り、1つ、もしくは1つより多くを意味し得る。群の1つまたは複数のメンバーの間に「または」を含む請求の範囲または説明は、相反する指示がない限り、またはそうでなければ文脈から明らかでない限り、群のメンバーのうちの1つ、複数、もしくはすべてが所定のものもしくはプロセスに存在する、用いられる、またはそうでなければ関連する場合に、充足されるとみなされる。本発明は、群のメンバーの厳密に1つが所定のものもしくはプロセスに存在する、用いられる、またはそうでなければ関連する態様を含む。本発明は、群のメンバーの複数またはすべてが所定のものもしくはプロセスに存在する、用いられる、またはそうでなければ関連する態様を含む。
【0161】
「含む」との語は、非限定的であることが意図されており、かつ、追加の要素または工程の包含を容認するがこれを必要とするわけではないこともまた、示される。本明細書において「含む」との語が使用される場合、「からなる」との語もまた、したがって包含され、かつ開示される。
【0162】
範囲が示される場合、端点が含まれる。さらに、他に指示されない限り、またはそうでなければ文脈および当業者の理解から明らかでない限り、範囲として表現される値は、文脈が明確に異なって指示しない限り、範囲の下限の単位の10分の1まで、本発明のさまざまな態様における規定の範囲内の、任意の特定の値または部分範囲とみなし得ることが、理解される。
【0163】
すべての引用源、たとえば、本明細書において引用される参考文献、刊行物、データベース、データベースエントリー、および技術は、引用において明示的に記述されていなくても、参照によりこの出願に組み入れられる。引用源の記述と本出願の記述が矛盾する場合には、本出願における記述が優先される。
【0164】
項および表の見出しは、限定することを意図したものではない。
【実施例0165】
以下は、本発明を実施するための特定の態様の例である。実施例は、例示の目的のためにのみ提供するものであり、かつ、本発明の範囲を限定することを意図するものでは決してない。使用される数値(たとえば量、温度等)に関して正確性を確保するための労力が費やされているが、しかし、いくらかの実験誤差および偏差は、当然ながら許容されるべきである。
【0166】
本発明の実施は、他に示されない限り、当業者の技能の範囲内にあるタンパク質化学、生化学、組み換えDNA技術、および薬理学の従来の手法を利用するであろう。そのような技術は、文献において十分に説明されている。たとえば、T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B(1992)参照。
【0167】
実施例1:高密度アレイ
以下の方法は、ピッチが200 nm~333 nmの間にわたる四角形の規則的なアレイをどのように利用するかについて記載する。より小さいピッチですらも可能にする追加の方法が、記載される。画像化システムは、2018年3月2日に出願され、かつ参照により本明細書に組み入れられる国際特許出願PCT/US2018/020737に記載されており、これは回折限界未満の画像化を可能にする参照システムとして使用される。光学システムは、332.8 um x 332.8 umのフィールドサイズで100 Hzまでのフレーム毎秒(fps)で作動する、2,048 x 2,048ピクセルの複数のカメラを含み得る。このシステムは、90 fps以上で、単一のフルオロ(fluor)と同じくらい小さいものを測定することができる。85 fpsにおいて、1分子につき1~10コピー(または1~10個のフルオロフォア)でこのシステムを使用することにより、63 mm x 63 mmのスライドを15分未満で画像化するという、必要とされるスループットが達成される。生化学サイクルおよび画像化が、2つのチップを用いること、または単一のチップを少なくとも2領域に分割することのいずれかによって、連続的かつ同時に実施される。
【0168】
実施例2:合成による配列決定を用いる、単一分子の配列決定
合成による配列決定アプローチを用いる、単一分子の配列決定が、the Apton Systemにおいて評価された。方法論を試験するため、5' リン酸基を有する単鎖DNA鋳型は、EDC(1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(1-Ethyl-3-(3-mplate dimethylaminopropyl) carbodiimide))の化学作用を介して、フローセルのカルボヒドラジド(tecarbohydrazide)活性化シリコン表面を有するチップへと最初に結合された。配列決定プライマーは、表面上に固定化された標的にアニールされた。本発明者らの最初の研究において使用された配列決定の鋳型は、EGFRのL858R変異、EGFRのT790M変異、およびBRAFのV600E変異を含む合成オリゴヌクレオチド、ならびにERCC 00013およびERCC 00171対照RNA転写物から逆転写された2つのcDNA試料を含んでいた。DNA鋳型の固定化およびプライマーのアニーリングの後、フローセルは配列決定反応のためthe Apton instrumentに装填される、ここで配列決定反応は、酵素学的な単一ヌクレオチドの組み込み反応、蛍光色素検出を検出するための画像化、その後に化学的切断が続くという、複数のサイクルを含む。NEBのTherminator IX DNAポリメラーゼが、単一塩基の伸長反応のために使用された、このポリメラーゼは、修飾ジデオキシヌクレオチドを組み込む能力が増強された、9°N(商標)DNAポリメラーゼの変種である。反応において使用された4つのdNTPは、4つの異なる切断可能な蛍光色素で標識されており、かつ3' -OH基において、切断可能なモエティで保護されている(MyChemより、dCTP-AF488、dATP-AFCy3、dTTP-TexRed、およびdGTP-Cy5)。各配列決定反応サイクル中に、標識された単一のdNTPが組み込まれ、そしてdNTPにおける3'-保護基のために、反応は終結する。dNTPの組み込み後、組み込まれなかったヌクレオチドは洗浄によってフローセルから除去され、そして組み込まれた、蛍光色素で標識されたヌクレオチドは、塩基を同定するために画像化される。画像がキャプチャーされた後、蛍光色素および保護モエティは、組み込まれたヌクレオチドから、100 mM TCEP((トリス(2-カルボキシエチル)ホスフィン)、pH9.0)を用いて切断され、次のサイクルにおける次の相補的ヌクレオチドの、その後の付加が可能になる。
この伸長、検出、および切断のサイクルは、その後、読み取りの長さを増大させるために繰り返される。
【0169】
図15Aは、変異体標的および野生型(WT)標的の等量を含む、EGFR遺伝子におけるコドン790付近の領域に対応する合成オリゴヌクレオチド鋳型の1:1の混合物の、配列決定の結果を示す。プライマーの後の第1塩基目に変異(野生型におけるCの組み込み、および変異体におけるTの組み込み)を有する、EGFR遺伝子のコドン790の近くの領域に対応する合成鋳型を配列決定するために使用された、色素標識されたヌクレオチドの組み込みからの画像。
図15Aにおけるモンタージュは、塩基の組み込みおよび切断の交互のサイクルからの画像を示す。このデータは、塩基の組み込みの10サイクルを検出できるシステムの能力を示す。矢印は、塩基の観察された変化を示す。
【0170】
使用された合成オリゴヌクレオチドは、およそ60ヌクレオチドの長さであった。コドン790における変異の1塩基前に終わる配列を有するプライマーが、伸長n反応を可能にするために使用された。表面は、DNAポリメラーゼによるヌクレオチドの組み込み後、およびTCEPを用いる切断反応後に、画像化された。黄色い円は、色素組み込みの10回の連続サイクルからのデータを用いてアラインされた、鋳型分子の位置を示す。分子は、実際の塩基の組み込みが、労働力を必要とする目視検査によって同定されたあとで、既知の色の組み込み配列と同一であるとみなされた。
【0171】
色素標識されたヌクレオチドは、RNA鋳型から産生されたcDNAを配列決定するために使用された。使用されたRNAは、クローン化ERCC対照プラスミドから、T7での転写によって産生された。
図15Bは、塩基の組み込みおよび切断の交互のサイクルからの画像を示す。データは、塩基の組み込みの10サイクルを検出できるシステムの能力を示す。観察された配列は正確であった。黄色い矢印は切断サイクルを示す。
【0172】
具体的には、T7での転写によってERCC(External RNA Controls Consortium)対照プラスミドから産生された転写物に対応するcDNA鋳型が、配列決定された。生成されたcDNA分子は、>350ヌクレオチドの長さであった。表面は、DNAポリメラーゼによるヌクレオチドの組み込み後、およびTCEPを用いる切断反応後に、画像化された。
図15Bにおける黄色い円は、色素組み込みの10回の連続サイクルからのデータを用いてアラインされた、鋳型分子の位置を示す。データは、画像の目視の観察によって、ヌクレオチド組み込みの10サイクルを手動で検出できる能力を示した。
【0173】
実施例3:単一分子変種についての相対位置の決定
図16は、基材上に固定化され、そしてフルオロフォアを含むプローブによって結合された、単一分子の画像である。分子は、抗ERK抗体が結合した、細胞溶解物からのERKタンパク質であり、ERKタンパク質は固体の支持体に共有結合している。抗体は、1分子につき3~5個のフルオロフォアで標識されている。類似の画像は、たとえば合成による配列決定中に、単一のフルオロの核酸標的を用いて獲得可能である。
【0174】
検出の正確性を改善するため、分子は、プローブの結合および取り除きの、連続したサイクル、この場合は30サイクルを受ける。各ラウンドにおいて、画像は、分子の位置を決定するために処理される。画像はバックグラウンド除去され、2Xでオーバーサンプリングされ、その後ピークが同定される。サイクルの複数の層が、20 nmのグリッド上にオーバーレイされる。位置の分散は、標準偏差、または測定の数の平方根で割った半径である。
図17の右パネルは、オーバーレイされた各サイクルからの各ピークを示す。左パネルは、右パネルの平滑化バージョンである。それぞれの明るいスポットは分子を表す。分子の位置は、200 nmより短い分子間距離で解像可能である。
図18は、フィールドにおいて見いだされる複数の分子のそれぞれについてのローカライゼーションの変動を示す。ローカライゼーションの分散の中央値は5 nmであり、かつ、3シグマのローカライゼーションの分散は10 nmより小さい。
【0175】
他の態様
使用されている用語は、限定ではなく説明の用語であること、ならびにそのより広い局面における本発明の真の範囲および精神から逸脱することなく、添付の請求の範囲の範囲内で変更がなされてよいことが、理解される。
【0176】
本発明は、いくつかの記載される態様に関して、いくらかの長さで、およびいくらかの個別性を有して記載されているが、それが任意のそのような個別性もしくは態様、または任意の特定の態様に限定されるべきであることを意図しているわけではなく、むしろそれは、添付の請求の範囲を参照して、先行技術から見て、そのような請求の範囲の最も広い可能な解釈を提供するように、かつしたがって、意図される本発明の範囲が効果的に包含されるように、解釈される。
【0177】
本明細書において言及されるすべての刊行物、特許出願、特許、および他の参考文献は、その全体が参照により組み入れられる。矛盾する場合には、定義を含む本明細書が優先されるであろう。加えて、項の見出し、材料、方法、および実施例は単なる例示であり、かつ、これらは限定することを意図したものではない。