IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エレメント バイオサイエンシズ,インコーポレイティドの特許一覧

特表2025-500808次世代シーケンシングにおける一次分析
<>
  • 特表-次世代シーケンシングにおける一次分析 図1
  • 特表-次世代シーケンシングにおける一次分析 図2
  • 特表-次世代シーケンシングにおける一次分析 図3
  • 特表-次世代シーケンシングにおける一次分析 図4
  • 特表-次世代シーケンシングにおける一次分析 図5A
  • 特表-次世代シーケンシングにおける一次分析 図5B
  • 特表-次世代シーケンシングにおける一次分析 図6
  • 特表-次世代シーケンシングにおける一次分析 図7
  • 特表-次世代シーケンシングにおける一次分析 図8
  • 特表-次世代シーケンシングにおける一次分析 図9
  • 特表-次世代シーケンシングにおける一次分析 図10
  • 特表-次世代シーケンシングにおける一次分析 図11
  • 特表-次世代シーケンシングにおける一次分析 図12
  • 特表-次世代シーケンシングにおける一次分析 図13
  • 特表-次世代シーケンシングにおける一次分析 図14
  • 特表-次世代シーケンシングにおける一次分析 図15
  • 特表-次世代シーケンシングにおける一次分析 図16
  • 特表-次世代シーケンシングにおける一次分析 図17
  • 特表-次世代シーケンシングにおける一次分析 図18
  • 特表-次世代シーケンシングにおける一次分析 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-01-15
(54)【発明の名称】次世代シーケンシングにおける一次分析
(51)【国際特許分類】
   C12Q 1/6872 20180101AFI20250107BHJP
   C12Q 1/6869 20180101ALI20250107BHJP
   C12M 1/00 20060101ALI20250107BHJP
   C12M 1/34 20060101ALI20250107BHJP
【FI】
C12Q1/6872
C12Q1/6869 Z
C12M1/00 A
C12M1/34 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024534498
(86)(22)【出願日】2022-12-09
(85)【翻訳文提出日】2024-08-02
(86)【国際出願番号】 US2022052449
(87)【国際公開番号】W WO2023107720
(87)【国際公開日】2023-06-15
(31)【優先権主張番号】17/547,602
(32)【優先日】2021-12-10
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/316,784
(32)【優先日】2022-03-04
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/316,790
(32)【優先日】2022-03-04
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/725,042
(32)【優先日】2022-04-20
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/725,065
(32)【優先日】2022-04-20
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/349,421
(32)【優先日】2022-06-06
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/854,042
(32)【優先日】2022-06-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVASCRIPT
2.SWIFT
3.PYTHON
4.BLUETOOTH
5.JAVA
(71)【出願人】
【識別番号】523473143
【氏名又は名称】エレメント バイオサイエンシズ,インコーポレイティド
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100138911
【弁理士】
【氏名又は名称】櫻井 陽子
(72)【発明者】
【氏名】ジョウ,チュンホン
(72)【発明者】
【氏名】クルグリャック,セミヨン
(72)【発明者】
【氏名】ガルシア,フランシスコ
(72)【発明者】
【氏名】グオ,ミンハオ
(72)【発明者】
【氏名】ワン,ハオセン
(72)【発明者】
【氏名】ケリー,ライアン
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029AA23
4B029BB20
4B029FA12
4B029FA15
4B063QA13
4B063QQ42
4B063QQ52
4B063QR32
4B063QR35
4B063QS36
4B063QX02
(57)【要約】
画像データ分析、特に、DNAシーケンシング中にデジタルフローセル画像内でベースコーリングを実行するためのクラスタ位置を識別することが記載される。支持体上に固定化された各核酸テンプレート分子は、挿入配列及び試料インデックス配列を含み得る。試料インデックス配列は、k-mer配列を含み得る。シーケンシングシステムは、1回以上の挿入配列シーケンシング反応サイクルを行う前に、k-mer配列のk回のシーケンシング反応サイクルを行い、第1の複数のフローセル画像を生成し得る。ピクセル強度は、第1の複数のフローセル画像のピクセルについて判定され得る。ベースコーリングテンプレートは、判定され得、ピクセル強度及びピクセル強度のそれぞれの色純度に基づいたベースコーリング位置を含み得る。ベースコーリングテンプレートは、k回のサイクルに続く1回以上のサイクルにおける支持体の第2の複数のフローセル画像を位置合わせし得る。

【選択図】図6
【特許請求の範囲】
【請求項1】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を提供することであって、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、提供することと、
シーケンシングシステムによって、前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項2】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を提供することであって、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、提供することと、
シーケンシングシステムによって、前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記k-mer配列の、及び前記k-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項3】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を提供することであって、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別する、提供することと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項4】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を提供することであって、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別する、提供することと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記第1及び第2のk-mer配列の、並びに前記k-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項5】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を提供することであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、提供することと、
シーケンシングシステムによって、前記k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項6】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を提供することであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、提供することと、
シーケンシングシステムによって、前記k-mer配列の、及び前記k-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項7】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を提供することであって、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別する、提供することと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項8】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を提供することであって、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別する、提供することと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列の、並びに前記第1のユニバーサル試料インデックス配列及び前記第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項9】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項10】
方法であって、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列の、及び前記k-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項11】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を受け取ることであって、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項12】
方法であって、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を受け取ることであって、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列の、並びに前記k-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項13】
前記第1及び第2の複数のライブラリ分子をプールすることと、
プールされた前記ライブラリ分子を支持体上に分布させ、増幅反応を行って、前記支持体に固定化された複数の核酸テンプレート分子を生成することであって、前記複数の核酸テンプレート分子が、クローン的に増幅される、生成することと、を更に含む、先行請求項のいずれか一項に記載の方法。
【請求項14】
前記複数の核酸テンプレート分子が、前記第1のライブラリ分子及び前記第2のライブラリ分子からクローン的に増幅される、先行請求項のいずれか一項に記載の方法。
【請求項15】
前記複数の核酸テンプレート分子の各々が、対応するライブラリ分子及び対応するスプリントアダプターを含む対応するスプリント複合体からクローン的に増幅される、先行請求項のいずれか一項に記載の方法。
【請求項16】
前記複数の核酸テンプレート分子の各々が、1つ以上のユニバーサルアダプター配列を更に含む、先行請求項のいずれか一項に記載の方法。
【請求項17】
前記複数のライブラリ分子の各々が、1つ以上のユニバーサルアダプター配列を更に含む、先行請求項のいずれか一項に記載の方法。
【請求項18】
前記複数の核酸テンプレート分子が、前記支持体上のランダムな位置に固定化されている、先行請求項のいずれか一項に記載の方法。
【請求項19】
前記複数の核酸テンプレート分子が、前記支持体上の所定の位置に固定化されている、先行請求項のいずれか一項に記載の方法。
【請求項20】
シーケンシングシステムによって、前記挿入配列の1回以上の前記シーケンシング反応のサイクルを行う前に、前記k-mer配列の、及び前記第1のユニバーサル試料インデックス配列の塩基位置の、k回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成すること、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定すること、並びに
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定すること、のうちの1つ以上が、
前記第1の試料インデックス配列と、
前記第1のユニバーサル試料インデックス配列と、
前記第2の試料インデックス配列と、
前記第2のユニバーサル試料インデックス配列と、のシーケンシング反応のいずれかのサイクルを行う前である、先行請求項のいずれか一項に記載の方法。
【請求項21】
シーケンシングシステムによって、前記挿入配列の1回以上の前記シーケンシング反応サイクルを行う前に、前記k-mer配列の、及び前記第1のユニバーサル試料インデックス配列の塩基位置の、k回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成すること、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定すること、並びに
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定すること、のうちの1つ以上が、
前記第1の試料インデックス配列と、
前記第1のユニバーサル試料インデックス配列と、
前記第2の試料インデックス配列と、
前記第2のユニバーサル試料インデックス配列と、
第3の試料インデックス配列と、
第3のユニバーサル試料インデックス配列と、
第4の試料インデックス配列と、
第4のユニバーサル試料インデックス配列と、のシーケンシング反応のいずれかのサイクルを行う前である、先行請求項のいずれか一項に記載の方法。
【請求項22】
前記k-mer配列の、及び前記第1のユニバーサル試料インデックス配列の塩基位置の、前記k回のシーケンシング反応サイクルを行うことが、シーケンシングランのシーケンシングの順序に基づいている、先行請求項のいずれか一項に記載の方法。
【請求項23】
前記シーケンシングの順序が、前記k-mer配列をシーケンシングすること、次いで、前記第1のユニバーサル試料インデックス配列をシーケンシングすること、次いで、前記第1の挿入配列をシーケンシングすること、を含む、先行請求項のいずれか一項に記載の方法。
【請求項24】
前記シーケンシングの順序が、前記k-mer配列をシーケンシングすること、次いで、前記第1及び第2のユニバーサル試料インデックス配列をシーケンシングすること、次いで、前記第1及び第2の挿入配列をシーケンシングすること、を含む、先行請求項のいずれか一項に記載の方法。
【請求項25】
前記シーケンシングの順序が、前記k-mer配列をシーケンシングすること、次いで、前記第1及び第2のユニバーサル試料インデックス配列をシーケンシングすること、次いで、前記第3及び第4の試料インデックス配列をシーケンシングすること、を含む、先行請求項のいずれか一項に記載の方法。
【請求項26】
前記第1の複数のフローセル画像が、2、3、4、5、又は6つの異なる色チャネルからのものである、先行請求項のいずれか一項に記載の方法。
【請求項27】
k回のサイクル又はk+1回のサイクルからの前記第1の複数のフローセル画像が、前記k回のサイクルの各々において前記支持体上に固定化された前記複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基を含む、先行請求項のいずれか一項に記載の方法。
【請求項28】
前記支持体上に固定化された前記複数の核酸テンプレート分子の各々が、ポロニー又はクローン化クラスタに対応する、先行請求項のいずれか一項に記載の方法。
【請求項29】
前記k-mer配列が、A、G、C、及びT/Uのヌクレオチド塩基のランダム配列である、先行請求項のいずれか一項に記載の方法。
【請求項30】
前記k-mer配列が、A、G、C、及びT/Uの少なくとも2つ又は3つのヌクレオチド塩基のランダム配列を含む、先行請求項のいずれか一項に記載の方法。
【請求項31】
前記支持体が、ガラス基材又はプラスチック基材を含む、先行請求項のいずれか一項に記載の方法。
【請求項32】
前記支持体が、フローセルデバイスに含まれている、先行請求項のいずれか一項に記載の方法。
【請求項33】
前記支持体が、45度以下の水接触角を有する少なくとも1つの親水性ポリマーコーティングで不動態化されている、先行請求項のいずれか一項に記載の方法。
【請求項34】
前記少なくとも1つの親水性ポリマーコーティングが、ポリエチレングリコール(PEG)、ポリ(ビニルアルコール)(PVA)、ポリ(ビニルピリジン)、ポリ(ビニルピロリドン)(PVP)、ポリ(アクリル酸)(PAA)、ポリアクリルアミド、ポリ(N-イソプロピルアクリルアミド)(PNIPAM)、ポリ(メチルメタクリレート)(PMA)、ポリ(2-ヒドロキシルエチルメタクリレート)(PHEMA)、ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(POEGMA)、ポリグルタミン酸(PGA)、ポリリジン、ポリグルコシド、ストレプトアビジン、及びデキストランからなる群から選択される分子を含む、先行請求項のいずれか一項に記載の方法。
【請求項35】
前記少なくとも1つの親水性ポリマーコーティングが、少なくとも4つの分岐を有する分岐親水性ポリマー分子を含む、先行請求項のいずれか一項に記載の方法。いくつかの態様において、前記少なくとも1つの親水性ポリマーコーティングが、少なくとも1000ダルトンの分子量を有するポリマー分子を含む。
【請求項36】
前記支持体上の前記核酸テンプレート分子の密度が、1mm当たり10^4~10^12である、先行請求項のいずれか一項に記載の方法。
【請求項37】
前記支持体上の前記核酸テンプレート分子の密度が、1mm当たり10^4~10^8である、先行請求項のいずれか一項に記載の方法。
【請求項38】
前記挿入配列の前記第1又は第2の試料源が、ゲノムDNA、二本鎖cDNA、又は無細胞循環DNAである、先行請求項のいずれか一項に記載の方法。
【請求項39】
2つ以上の異なる固定化されたテンプレート分子が、異なるk-mer配列及び同じユニバーサル試料インデックス配列を有する、先行請求項のいずれか一項に記載の方法。
【請求項40】
2つ以上の異なる固定化されたテンプレート分子が、異なる挿入配列を有する、先行請求項のいずれか一項に記載の方法。
【請求項41】
前記シーケンシング反応の各サイクルが、ポリメラーゼ媒介性である、先行請求項のいずれか一項に記載の方法。
【請求項42】
前記k-mer配列のk回の前記シーケンシング反応のサイクルを行うことが、
異なる種類のヌクレオチド塩基A、G、C、及びT/Uの混合物を含む複数のヌクレオチド試薬を使用して、ヌクレオチド酸のポロニーを接触させることを含む、先行請求項のいずれか一項に記載の方法。
【請求項43】
個々のヌクレオチド試薬が、各異なる種類のヌクレオチド塩基に対応する、異なる検出可能な色ラベルを含む、先行請求項のいずれか一項に記載の方法。
【請求項44】
前記k-mer配列のk回の前記シーケンシング反応のサイクルを行うことが、
ヌクレオチド酸のポロニーを、複数のシーケンシングプライマー、複数のポリメラーゼ、及び異なる種類のアビダイトの混合物と接触させることを含む、先行請求項のいずれか一項に記載の方法。
【請求項45】
前記混合物中の個々のアビダイトが、複数のヌクレオチドアームが付着したコアを含み、前記個々のアビダイトの各アームが、同じ種類のヌクレオチド塩基を含む、先行請求項のいずれか一項に記載の方法。
【請求項46】
前記k-mer配列のk回の前記シーケンシング反応のサイクルを行うことが、
前記k回のサイクルの各々において、光学システムによって、前記テンプレート分子に結合した前記ヌクレオチド試薬から放出された光学カラーシグナルをイメージングすることを含む、先行請求項のいずれか一項に記載の方法。
【請求項47】
前記k-mer配列のk回の前記シーケンシング反応のサイクルを行うことが、
前記k回のサイクルの各々において、光学システムによって、前記テンプレート分子に結合した前記ヌクレオチド試薬から放出された光学カラーシグナルを含む前記第1の複数のフローセル画像を取得することを含む、先行請求項のいずれか一項に記載の方法。
【請求項48】
各核酸テンプレート分子が、第2のユニバーサル試料インデックス配列を有する第2の試料インデックス配列を更に含み、前記第1及び第2のユニバーサル試料インデックス配列の組み合わせが、前記挿入配列の試料源を一意に識別し、第2の試料インデックスが、ランダム配列を欠く、先行請求項のいずれか一項に記載の方法。
【請求項49】
前記第1の複数のライブラリ分子の各々が、第3のユニバーサル試料インデックス配列を有する第3の試料インデックス配列を更に含み、前記第1及び第3のユニバーサル試料インデックス配列の組み合わせが、前記第1の挿入配列の第1の試料源を一意に識別し、第3の試料インデックスが、ランダム配列を欠く、先行請求項のいずれか一項に記載の方法。
【請求項50】
前記第2の複数のライブラリ分子の各々が、第4のユニバーサル試料インデックス配列を有する第4の試料インデックスを更に含み、前記第2及び第4のユニバーサル試料インデックス配列の組み合わせが、前記第2の挿入配列の第2の試料源を一意に識別し、第4の試料インデックスが、ランダム配列を欠く、先行請求項のいずれか一項に記載の方法。
【請求項51】
kが、0よりも大きく、10よりも小さい整数である、先行請求項のいずれか一項に記載の方法。
【請求項52】
kが、3である、先行請求項のいずれか一項に記載の方法。
【請求項53】
前記k-mer配列が、1つ以上のランダムなヌクレオチド塩基を含む、先行請求項のいずれか一項に記載の方法。
【請求項54】
kが、3又は4であり、前記k-mer配列が、少なくとも2、3、又は4つのランダムなヌクレオチド塩基を含む、先行請求項のいずれか一項に記載の方法。
【請求項55】
前記ベースコーリング位置の各々が、前記複数の固定化されたテンプレート分子の位置に対応する、先行請求項のいずれか一項に記載の方法。
【請求項56】
前記第1の複数のフローセル画像が、前記支持体前記k回のサイクル上に固定化された前記複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含む、先行請求項のいずれか一項に記載の方法。
【請求項57】
前記第2の複数のフローセル画像が、前記k回のサイクルに続く前記1回以上のサイクルにおいて前記支持体上に固定化された前記複数の核酸テンプレート分子間のアンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含む、先行請求項のいずれか一項に記載の方法。
【請求項58】
前記複数の核酸テンプレート分子間の前記アンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基が、(2)塩基の総数に対する(1)1つ以上の種類のヌクレオチド塩基の数のパーセンテージが、前記1回以上のサイクルにおいて20%、15%、10%、又は5%未満であることを含む、先行請求項のいずれか一項に記載の方法。
【請求項59】
前記複数の核酸テンプレート分子間の前記バランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基が、(2)前記1回以上のサイクルにおける塩基の総数に対する(1)各種類のヌクレオチド塩基の数のパーセンテージが、10%、15%、又は20%を超えることを含む、先行請求項のいずれか一項に記載の方法。
【請求項60】
前記シーケンシングシステムによって、前記第1の挿入配列の前記1回以上のシーケンシング反応サイクルを行い、それによって、前記第2の複数のフローセル画像を生成することを更に含む、方法。
【請求項61】
前記シーケンシングシステムによって、前記第1及び第2の挿入配列の前記1回以上のシーケンシング反応サイクルを行い、それによって、前記第2の複数のフローセル画像を生成することを更に含む、方法。
【請求項62】
前記プロセッサによって、1つ以上の後続のフローサイクルからの前記第2の複数のフローセル画像を前記ベースコーリングテンプレートに対して位置合わせすること、
前記プロセッサによって、位置合わせされた前記第2の複数のフローセル画像からのシグナルを使用して、前記ベースコーリングテンプレート内の前記ベースコーリング位置において前記第2の複数のフローセル画像のベースコーリングを実行すること、を更に含む、方法。
【請求項63】
前記プロセッサによって、前記第2の複数のフローセル画像からのシグナルを使用して、前記ベースコーリングテンプレート内の前記ベースコーリング位置においてのみベースコーリングを実行することを更に含む、方法。
【請求項64】
前記ベースコーリング位置が、サブピクセル解像度でである、先行請求項のいずれか一項に記載の方法。
【請求項65】
各ピクセル強度が、前記対応するピクセルの1つ以上のサブピクセル強度を含む、先行請求項のいずれか一項に記載の方法。
【請求項66】
前記ピクセル強度の各々の前記それぞれの色純度が、前記対応するピクセルの前記1つ以上のサブピクセル強度に対応する1つ以上の色純度を含む、先行請求項のいずれか一項に記載の方法。
【請求項67】
前記ピクセル強度の各々の前記それぞれの色純度が、1つ以上の色チャネルについての前記それぞれの色純度を含む、先行請求項のいずれか一項に記載の方法。
【請求項68】
前記ピクセル強度の各々の前記それぞれの色純度を判定することが、(2)他の種類のヌクレオチド塩基についてのシグナルの総量に対する(1)特定の種類のヌクレオチド塩基に対応するシグナルの比率を判定することを含む、先行請求項のいずれか一項に記載の方法。
【請求項69】
前記第1の複数のフローセル画像の前記ピクセルについて、前記ピクセル強度を判定することが、
前記対応するピクセル又はサブピクセル位置でのチャネル強度のセットの比較に基づいて、それぞれの異なる蛍光波長に対応する前記チャネル強度のセット内の各チャネル強度を判定することを含む、先行請求項のいずれか一項に記載の方法。
【請求項70】
前記1つ以上の後続のフローサイクルからの前記第2の複数のフローセル画像を前記ベースコーリングテンプレートに対して位置合わせすることが、
前記ベースコーリングテンプレートとして、共通座標系における前記第2の複数のフローセル画像におけるポロニーの座標を生成することを含む、先行請求項のいずれか一項に記載の方法。
【請求項71】
前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリングテンプレートを判定することが、
前記ピクセル又はサブピクセルの各々について、前記それぞれの色純度が、閾値距離内の他のピクセル又はサブピクセルの色純度よりも大きいか否かを判定することと、
前記それぞれの色純度が、前記閾値距離内の他のピクセル又はサブピクセルの前記色純度よりも大きいとの判定に応答して、前記対応するピクセル又はサブピクセルの位置をベースコーリングテンプレートに追加することと、
前記それぞれの色純度が、前記閾値距離内の前記他のピクセル又はサブピクセルの前記色純度よりも大きくないとの判定に応答して、前記ベースコーリングテンプレートに変更を加えないことと、を含む、先行請求項のいずれか一項に記載の方法。
【請求項72】
前記k-mer配列下流の前記塩基位置が、前記第1のユニバーサル試料インデックス配列のものである、先行請求項のいずれか一項に記載の方法。
【請求項73】
前記k-mer配列下流の前記塩基位置が、前記第1のユニバーサル試料インデックス配列及び前記第2のユニバーサル試料インデックス配列のものである、先行請求項のいずれか一項に記載の方法。
【請求項74】
前記k-mer配列下流の前記塩基位置が、前記第1の挿入配列のものである、先行請求項のいずれか一項に記載の方法。
【請求項75】
前記k-mer配列下流の前記塩基位置が、前記第1の挿入配列及び前記第2の挿入配列のものである、先行請求項のいずれか一項に記載の方法。
【請求項76】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、挿入配列の1回以上のシーケンシング反応サイクルを行う前に、k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が、前記支持体上に固定化されており、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項77】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、挿入配列の1回以上のシーケンシング反応サイクルを行う前に、k-mer配列の、及び第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が前記支持体上に固定化されており、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項78】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、前記第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項79】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、第1及び第2のk-mer配列の、並びに第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項80】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が前記支持体上に固定化されており、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項81】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、k-mer配列の、及び第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体上の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が支持体上に固定化され、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項82】
方法であって、
シーケンシングシステムによって、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体上の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、方法。
【請求項83】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、第1及び第2のk-mer配列の、並びに第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体上の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子を提供することが、前記支持体上に固定化されており、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項84】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項85】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列の、及び前記第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項86】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項87】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を提供することであって、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、提供することと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列の、並びに前記第1のユニバーサル試料インデックス配列及び前記第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項88】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、挿入配列の1回以上のシーケンシング反応サイクルを行う前に、k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が、前記支持体上に固定化されており、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、前記プロセッサによって、
前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項89】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、挿入配列の1回以上のシーケンシング反応サイクルを行う前に、k-mer配列の、及び第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が前記支持体上に固定化されており、各核酸テンプレート分子が、第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項90】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項91】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に、第1及び第2のk-mer配列の、並びに第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項92】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスと、を備え、前記操作が、
シーケンシングシステムによって、k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体の第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が前記支持体上に固定化されており、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む、システム。
【請求項93】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、k-mer配列の、及び第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体上に第1の複数のフローセル画像を生成することであって、複数の核酸テンプレート分子が支持体上に固定化され、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項94】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、支持体上の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子が、前記支持体上に固定化されており、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、前記プロセッサによって、
かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項95】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
シーケンシングシステムによって、第1及び第2のk-mer配列の、並びに第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、支持体上の第1の複数のフローセル画像を生成することであって、第1の複数のライブラリ分子を提供することが、前記支持体上に固定化されており、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別し、第2の複数のライブラリ分子が、前記支持体上に固定化されており、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項96】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項97】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
支持体上に固定化された複数の核酸テンプレート分子を受け取ることであって、各核酸テンプレート分子が、挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、k-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記挿入配列の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記k-mer配列の、及び前記第1のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項98】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、前記第1の複数のライブラリ分子の各々が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記第1の試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を受け取ることであって、前記第2の複数のライブラリ分子の各々が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記第2の試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項99】
非一時的コンピュータ可読デバイスであって、それに格納された命令を有し、前記命令が、少なくとも1つの計算デバイスによって実行されると、前記少なくとも1つの計算デバイスに、
支持体上に固定化された第1の複数のライブラリ分子を受け取ることであって、各ライブラリ分子が、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、前記第1の試料インデックス配列が、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスが、前記第1の挿入配列の前記試料源を識別する、受け取ることと、
前記支持体上に固定化された第2の複数のライブラリ分子を受け取ることであって、各ライブラリ分子が、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、前記第2の試料インデックス配列が、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスが、前記第2の挿入配列の前記試料源を識別する、受け取ることと、
シーケンシングシステムによって、前記第1及び第2のk-mer配列の、並びに前記第1のユニバーサル試料インデックス配列及び前記第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成することと、
プロセッサによって、前記第1の複数のフローセル画像のピクセルについて、ピクセル強度及び前記ピクセル強度の各々のそれぞれの色純度を判定することと、
前記プロセッサによって、かつ前記挿入配列の1回以上のシーケンシング反応サイクルを行う前に、前記ピクセル強度及び前記ピクセル強度の前記それぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することであって、
前記ベースコーリングテンプレートが、前記k回のサイクルに続く1回以上のサイクルにおける前記支持体の第2の複数のフローセル画像を位置合わせするように構成される、判定することと、を含む操作を実行させる、非一時的コンピュータ可読デバイス。
【請求項100】
システムであって、
1つ以上のハードウェアプロセッサと、
前記1つ以上のハードウェアプロセッサに操作を実行させるために、前記1つ以上のハードウェアプロセッサによって実行可能な命令を格納する1つ以上のデータストレージデバイスであって、前記操作が、請求項13~75のいずれか一項を含む、1つ以上のデータストレージデバイスと、を含む、システム。
【請求項101】
シーケンシングデータ分析における操作を実行するために1つ以上のハードウェアプロセッサによって実行可能な命令が符号化された、1つ以上の非一時的コンピュータストレージ媒体であって、前記操作が、請求項13~75のいずれか一項を含む、1つ以上の非一時的コンピュータストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年8月31日に出願された米国仮特許出願第63/072,649号に対する優先権を主張する2021年3月31日に出願された米国特許出願第17/219,556号の継続である2021年12月10日に出願された米国特許出願第17/547,602号の継続である2022年6月30日に出願された米国特許出願第17/854,042号の一部継続である。本出願は、2022年3月4日に出願された米国仮特許出願第63/316,784号に対する優先権を主張する、2022年4月20日に出願された米国特許出願第17/725,065号の一部継続である。本出願は、2022年3月4日に出願された米国仮特許出願第63/316,790号に対する優先権を主張する、2022年4月20日に出願された米国特許出願第17/725,042号の一部継続である。本出願は、2022年6月6日に出願された米国仮特許出願第63/349,421号に対する優先権を主張する。上記の特許出願の全体は、それらの全体が参照により本明細書に組み込まれる。
【0002】
本開示は、概して、画像データ分析に関し、特に、DNAシーケンシング中にフローセルのデジタル画像内でベースコーリングを実行するためのクラスタ位置を識別することに関する。
【背景技術】
【0003】
フローセルを使用した合成による次世代シーケンシングは、DNAの配列を識別するために使用され得る。シーケンシングライブラリからの一本鎖DNA断片がフローセルにわたってフラッディングされると、断片は、典型的には、フローセルの表面に結合した相補オリゴマー又はその上に存在するビーズに起因して、フローセルの表面にランダムに付着する。次いで、DNA断片に対して増幅プロセスを実行し、その結果、所与の断片のコピーが、変性クローン化ヌクレオチド鎖のクラスタ又はポロニーを形成する。いくつかの態様において、単一のビーズは、クラスタを含み得、ビーズは、ランダムな位置でフローセルに付着し得る。
【0004】
鎖の配列を識別するために、一度に1つのヌクレオチド塩基ずつ鎖対を再構築する。各塩基構築サイクル中に、各々が蛍光標識(又はタグ)及びブロッカーに付着した単一のヌクレオチドの混合物がフローセルにわたってフラッディングされる。ヌクレオチドは、鎖上の相補的な位置に付着する。ブロッカーは、単一のサイクル中に1つの塩基のみが任意の所与の鎖に付着するように含まれる。フローセルは励起光に曝露され、ラベルを励起して蛍光を発せさせる。クローン化鎖は一緒にクラスタ化されるため、いずれか1つの断片の蛍光シグナルは、そのクローン化対応物からのシグナルによって増幅され、その結果、クラスタの蛍光が、イメージャによって記録され得る。フローセルがイメージングされた後、ブロッカーが切断され、流れたヌクレオチドから洗浄され、より多くのヌクレオチドがフローセル上にフラッディングされ、サイクルが繰り返される。各フローサイクルで、1つ以上の画像が記録される。
【0005】
ベースコーリングアルゴリズムを記録された画像に適用して、各クラスタからの連続したシグナルを「読み取り」、光シグナルを各断片に付加されたヌクレオチド塩基配列の識別に変換する。正確なベースコーリングは、連続したシグナルが正しい断片に帰属することを確実にするために、クラスタ中心の正確な識別を必要とする。
【発明の概要】
【0006】
システム、装置、製品、方法及び/若しくはコンピュータプログラム製品の態様、並びに/又はそれらの組み合わせ及びサブ組み合わせが本明細書に提供され、これらは、イメージャの解像度をその物理的解像度限界を超えて計算上改善し、かつ/あるいは画像内のより精度の高いソース位置を提供する。
【0007】
そのようなものの特定の用途として、フローセル内のベースコーリング位置のセットを識別するための方法及びシステムの態様が説明される。これらは、各フローサイクルの後にフローセル画像をキャプチャすることと、フローセル画像のうちの少なくとも1つにおいて候補クラスタ中心を識別することと、を含む。強度は、各候補クラスタ中心について判定される。純度は、強度に基づいて各候補クラスタ中心について判定される。いくつかの態様において、強度及び/又は純度は、サブピクセルレベルで判定される。距離閾値内の周囲の候補クラスタ中心の純度よりも高い純度を有する各候補クラスタ中心は、ベースコーリング位置のセットに追加される。ベースコーリング位置のセットは、本明細書においてテンプレートと称する場合がある。
【0008】
いくつかの態様において、候補クラスタ中心を識別することは、フローセル画像の各ピクセルを候補クラスタ中心として標識することを含む。
【0009】
いくつかの態様において、候補クラスタ中心を識別することは、スポット探索アルゴリズムを使用して潜在的なクラスタ中心位置のセットを検出することと、次いで、各潜在的なクラスタ中心位置の周りの追加のクラスタ位置を識別することと、を含む。
【0010】
他の態様は、単独で又は組み合わせて、方法のアクション又は操作を実行するように構成された、コンピュータストレージデバイス(複数可)に記録された対応するコンピュータシステム、装置、及びコンピュータプログラム製品を含む。操作又はアクションを実行するように構成された、又は構成されるコンピュータシステムについて、このコンピュータシステムには、動作中にコンピュータシステムに操作又はアクションを実行させるソフトウェア、ファームウェア、ハードウェア、又はそれらの組み合わせがインストールされている。操作又はアクションを実行するように構成された、又は構成されるコンピュータプログラム製品について、このコンピュータプログラム製品は、ハードウェアプロセッサによって実行されると、ハードウェアプロセッサに操作又はアクションを実行させる命令を含む。
【0011】
本開示の更なる態様、特徴、及び利点、並びに本開示の様々な態様の構造及び操作は、添付の図面を参照して以下に詳細に記載される。
【0012】
本明細書に組み込まれ、本明細書の一部を形成する添付の図面は、本開示の態様を例示し、説明とともに本開示の原理を説明すること、及び技術分野(複数可)の当業者が態様を作製及び使用することを可能にすることに更に役立つ。
【図面の簡単な説明】
【0013】
図1】いくつかの態様による、フローセル上のクラスタ位置を識別するためのシステムのブロック図を示す。
図2】いくつかの態様による、候補クラスタ中心中心を有する例示的なフローセル画像を示す。
図3】いくつかの態様による、ベースコーリングを実行する位置を識別するための方法を示すフローチャートである。
図4】いくつかの態様による、本開示の様々な態様を実行するために使用され得るコンピュータのブロック図を示す。
図5A】表面ピニングプライマー結合部位(520)、任意選択のk-mer配列(561)を有する左のインデックス配列(560)、フォワードシーケンシングプライマー結合部位(540)、目的の配列を有する挿入領域(510)、リバースシーケンシングプライマー結合部位(550)、任意選択のk-mer配列(571)を有する右のインデックス配列(570)、及び表面キャプチャプライマー結合部位(530)を含む、例示的な線形一本鎖ライブラリ分子(500)の概略図である。いくつかの態様によれば、ライブラリ分子(500)は、右のインデックス配列(570)と表面キャプチャプライマー結合部位(530)との間に任意選択の右の固有の識別配列を有することができる。
図5B】二本鎖スプリント分子(580)とハイブリダイズし、それによってライブラリ分子を環状化して、2つのニックを有するライブラリ-スプリント複合体(590)を形成する例示的な線形一本鎖ライブラリ分子(図5Aの500)の概略図である。ライブラリ分子(図5Aの500)は、第1の付加された左のユニバーサルアダプター配列、第1の左のユニバーサルアダプター配列(520)、第1の左の接合アダプター配列、左のインデックス配列(560)、第2の左の接合アダプター配列、第2の左のユニバーサルアダプター配列(540)、第3の左の接合アダプター配列、目的の配列(510)、第3の右の接合アダプター配列、第2の右のユニバーサルアダプター配列(540)、第2の右の接合アダプター配列、右のインデックス配列(570)、第1の右の接合アダプター配列、第1の右の固有の識別配列、第1の右のユニバーサルアダプター配列(530)、及び第1の付加された右のユニバーサルアダプター配列から選択される1つ以上を含むことができる。二本鎖スプリント分子580は、第2のスプリント鎖にハイブリダイズした第1のスプリント鎖を含む。第1のスプリント鎖は、線形一本鎖ライブラリ分子の一方の末端上の配列とハイブリダイズする第1の配列(320)、及び線形一本鎖ライブラリ分子の他方の末端上の配列とハイブリダイズする第2の配列(330)を含む。第1のスプリント鎖の内側領域(310)は、第2のスプリント鎖にハイブリダイズする。簡略化のために、ライブラリ-スプリント複合体(580)は、接合アダプター配列又は付加されたユニバーサルアダプター配列のいずれも示さない。当業者は、線形ライブラリ分子(500)が、付加されたユニバーサルアダプター配列のうちの1つ又は両方を伴うか又は伴わない、接合アダプターのうちのいずれか1つ、又は接合アダプターのうちの2つ以上のいずれかの組み合わせを含むことができることを認識するであろう。当業者は、ライブラリ-スプリント複合体(590)が、いくつかの態様によれば、ライブラリ分子(500)内に存在する、付加されたユニバーサルアダプター配列のうちの1つ又は両方を伴う我々の伴わない、接合アダプターのうちのいずれか1つ、又は接合アダプターのうちの2つ以上のいずれかの組み合わせを含むことができることを認識するであろう。
図6】いくつかの態様による、ベースコーリングを実行する位置を識別するための方法を示すフローチャートである。
図7】多価分子の様々な例示的な構成の概略図である。左(クラスI):「スターバースト」又は「ヘルタースケルター」構成を有する多価分子の概略図。中央(クラスII):デンドリマー構成を有する多価分子の概略図。右(クラスIII)ストレプトアビジンを、ビオチンを有する4アーム又は8アーム型PEG-NHS及びdNTPと反応させることによって形成された複数の多価分子の概略図。いくつかの態様によれば、ヌクレオチド単位は、「N」と表され、ビオチンは、「B」と表され、ストレプトアビジンは、「SA」と表される。
図8】いくつかの態様による、複数のヌクレオチドアームに付着した一般的なコアを含む例示的な多価分子の概略図である。
図9】いくつかの態様による、複数のヌクレオチドアームに付着したデンドリマーコアを含む例示的な多価分子の概略図である。
図10】いくつかの態様による、複数のヌクレオチドアームに付着したコアを含む例示的な多価分子の概略図を示し、ヌクレオチドアームは、ビオチン、スペーサー、リンカー、及びヌクレオチド単位を含む。
図11】いくつかの態様による、コア付着部分、スペーサー、リンカー、及びヌクレオチド単位を含む例示的なヌクレオチドアームの概略図である。
図12】いくつかの態様による、例示的なスペーサーの化学構造(上)、並びに11原子リンカー、16原子リンカー、23原子リンカー、及びN3リンカーを含む様々な例示的なリンカーの化学構造(下)を示す。
図13】いくつかの態様による、リンカー1~9を含む様々な例示的なリンカーの化学構造を示す。
図14】いくつかの態様による、ヌクレオチド単位に連結された/付着した様々な例示的なリンカーの化学構造を示す。
図15】いくつかの態様による、ヌクレオチド単位に連結された/付着した様々な例示的なリンカーの化学構造を示す。
図16】いくつかの態様による、ヌクレオチド単位に連結された/付着した様々な例示的なリンカーの化学構造を示す。
図17】いくつかの態様による、ヌクレオチド単位に連結された/付着した様々な例示的なリンカーの化学構造を示す。
図18】例示的なビオチン化ヌクレオチドアームの化学構造を示す。この例において、いくつかの態様によれば、ヌクレオチド単位は、ピリミジン塩基の5位又はプリン塩基の7位におけるプロパルギルアミン付着を介して、リンカーに接続されている。
図19】本開示の低結合固体支持体の一態様の概略図を提供し、いくつかの態様によれば、この支持体は、ガラス基材と、ガラスに共有結合的に又は非共有結合的に接着された親水性コーティングの交互の層と、を含み、オリゴヌクレオチドプライマーのための付着部位として機能する化学反応性官能基を更に含む。
【0014】
図面において、同様の参照番号は、概して、同じ又は同様の要素を示す。加えて、概して、参照番号の左端の数字(複数可)は、参照番号が最初に表示される図面を識別する。
【発明を実施するための形態】
【0015】
システム、装置、製品、方法及び/若しくはコンピュータプログラム製品の態様、並びに/又はそれらの組み合わせ及びサブ組み合わせが本明細書に提供され、これらは、イメージャの解像度をその物理的解像度限界を超えて計算上改善し、かつ/あるいは画像内のより精度の高いソース位置を提供する。本明細書に記載される画像処理技法は、次世代シーケンシングにおけるベースコーリングに特に有用であり、ベースコーリングは、これらの技法の適用を説明するための本明細書の主要な例として使用される。しかしながら、そのような画像分析技術はまた、スポット探索及び/又はCCDイメージングが使用される他の用途において特に有用であり得る。例えば、知覚された光シグナルの実際の中心(例えば、ソース位置)を識別することは、位置検出及び追跡、天文撮影、ヒートマッピングなどの多くの他の分野において有用性を有する。加えて、本明細書に記載されるような技術は、イメージャの物理的解像度限界に達すると、解像度を計算上上昇させることから利益を得る任意の他の用途において有用であり得る。
【0016】
DNAシーケンシングにおいて、クラスタ又はポロニー(しばしばビーズ上に形成される)の中心を識別することは、一次分析と呼ばれることがある。一次分析は、フローセルのためのテンプレートの形成を伴う。テンプレートは、共通座標系における全ての検出されたクラスタの推定位置を含む。テンプレートは、シーケンシングプロセスの最初のいくつかのフローにおける全ての画像内のクラスタ位置を識別することによって生成される。画像は、共通座標系を提供するために全ての画像にわたって位置合わせされ得る。異なる画像からのクラスタ位置は、座標系における近接度に基づいてマージされ得る。テンプレートが生成されると、全ての更なる画像がそれに対して位置合わせされ、シーケンシングが、テンプレート内のクラスタ位置に基づいて実行される。
【0017】
画像内のクラスタ中心を識別するための様々なアルゴリズムが存在する。これらの既存のアルゴリズムには、いくつかの欠点がある。上で考察したように、クラスタ中心は、それらが互いに近い場合、マージされたように見えることがある。近接は、精度の問題又は位置合わせの問題に起因する場合がある。したがって、異なるクラスタが、単一のクラスタとして扱われ、配列の識別が不適切になるか、あるいは配列が欠落する場合がある。
【0018】
加えて、アルゴリズムでは、テンプレートのクラスタ位置を識別するために、いくつかの画像にわたってクラスタを見つけることが必要となる場合がある。これにより、過度の処理時間が必要となる場合がある。
【0019】
図1は、一態様による、フローセル上のクラスタ位置を識別するためのシステム100のブロック図を示す。システム100は、フローセル112、シーケンサ114、イメージャ116、データストレージ122、及びユーザインターフェース124を含み得るシーケンシングシステム110を有する。シーケンシングシステム110は、クラウド130に接続され得る。シーケンシングシステム110は、専用プロセッサ118、フィールドプログラマブルゲートアレイ(複数可)(FPGA(複数可))120、及びコンピュータシステム126のうちの1つ以上を含み得る。
【0020】
いくつかの態様において、フローセル112は、DNA断片をキャプチャし、フローセル上でベースコーリングのためのDNA配列を形成するように構成される。シーケンサ114は、ヌクレオチド混合物をフローセル112上に流し、流すステップの間にヌクレオチドからブロッカーを切断し、フローセル112上でDNA配列を形成するための他のステップを実行するように構成され得る。ヌクレオチドは、ヌクレオチドの種類を示す波長で光又はエネルギーを放出する蛍光要素を有し得る。各タイプの蛍光要素は、特定のヌクレオチド塩基(例えば、A、G、C、T)に対応し得る。蛍光要素は、可視波長の光を放出し得る。
【0021】
例えば、各ヌクレオチド塩基には、色が割り当てられてもよい。アデニンは、例えば、赤色であってもよく、シトシンは、青色であってもよく、グアニンは、緑色であってもよく、チミンは、黄色であってもよい。各ヌクレオチドの蛍光要素の色又は波長は、蛍光要素によって放出される光の波長に基づいて、ヌクレオチドが互いに区別可能であるように選択され得る。
【0022】
イメージャ116は、各流すステップの後にフローセル112の画像をキャプチャするように構成され得る。一態様では、イメージャ116は、CMOS又はCCDカメラなどのデジタル画像をキャプチャするように構成されたカメラである。カメラは、ヌクレオチドに結合した蛍光要素の波長で画像をキャプチャするように構成され得る。
【0023】
イメージャ116の解像度は、ピクセルサイズを含むフローセル画像における詳細のレベルを制御する。既存のシステムでは、スポット探索アルゴリズムがクラスタ中心を識別する精度を制御するため、この解像度は非常に重要である。スポット探索の精度を高める1つの方法は、イメージャ116の解像度を改善すること、又はイメージャ116によって撮影された画像上で実行される処理を改善することである。本明細書に記載される方法は、スポット探索アルゴリズムによって検出されたピクセル以外のピクセル内のクラスタ中心を検出し得る。これらの方法は、イメージャ116の解像度を上昇させることなく、クラスタ中心の検出精度の改善を可能にする。イメージャの解像度は、同等の性能を有する既存のシステムよりも小さくてもよく、これは、シーケンシングシステム110のコストを削減し得る。
【0024】
一態様では、フローセルの画像は、グループでキャプチャされ得、グループ内の各画像は、蛍光要素のうちの1つだけに一致するか、又はそれを含む波長又はスペクトルで撮影される。別の態様では、画像は、蛍光要素の全ての波長をキャプチャする単一の画像としてキャプチャされ得る。
【0025】
シーケンシングシステム100は、フローセル画像に基づいてフローセル112上のクラスタ位置を識別するように構成され得る。クラスタを識別するための処理は、専用プロセッサ118、FPGA(複数可)120、コンピューティングシステム126、又はそれらの組み合わせによって実行され得る。クラスタ位置を識別又は判定することは、本明細書により具体的に記載されるクラスタ検出方法と組み合わせて、従来のクラスタ検出を実行することを伴い得る。
【0026】
汎用プロセッサは、Windows(商標)又はLinux(商標)などのオペレーティングシステム内で様々なプログラムを実行するためのインターフェースを提供する。そのようなオペレーティングシステムは、典型的には、ユーザに大きな柔軟性を提供する。
【0027】
いくつかの態様において、専用プロセッサ118は、本明細書に記載されるクラスタ検出方法のステップを実行するように構成され得る。これらは、汎用プロセッサではなく、それらのステップを実行するための特定のハードウェア又は命令を有するカスタムプロセッサであり得る。専用プロセッサは、オペレーティングシステムなしで特定のソフトウェアを直接実行する。オペレーティングシステムの欠如は、プロセッサが実行し得るものの柔軟性を犠牲にして、オーバーヘッドを低減する。専用プロセッサは、汎用プロセッサ上で実行されるソフトウェアよりも効率的に動作するように設計され得るカスタムプログラミング言語を利用し得る。これは、ステップが実行される速度を増加させ、リアルタイム処理を可能にし得る。
【0028】
いくつかの態様において、FPGA(複数可)120は、本明細書に記載されるクラスタ検出方法のステップを実行するように構成され得る。FPGAは、特定のタスクのみを実行するハードウェアとしてプログラムされる。特別なプログラミング言語を使用して、ソフトウェアステップをハードウェア構成要素に変換してもよい。FPGAがプログラムされると、ハードウェアはソフトウェアを実行せずに提供されたデジタルデータを直接処理する。代わりに、FPGAは、デジタルデータを処理するために論理ゲート及びレジスタを使用する。オペレーティングシステムに必要なオーバーヘッドがないため、FPGAは、一般に、汎用プロセッサよりも速くデータを処理する。専用プロセッサと同様に、これは柔軟性を犠牲にしている。
【0029】
また、ソフトウェアオーバーヘッドがないと、FPGAは専用プロセッサよりも速く動作することができるが、これは、実行される正確な処理、並びに特定のFPGA及び専用プロセッサに依存する。
【0030】
FPGA(複数可)120のグループは、ステップを並列して実行するように構成され得る。例えば、いくつかのFPGA(複数可)120は、画像、画像のセット、又は1つ以上の画像内のクラスタ位置について処理ステップを実行するように構成され得る。各FPGA(複数可)120は、処理ステップの独自の部分を同時に実行し得、データを処理するために必要な時間を低減する。これにより、処理ステップをリアルタイムで完了することができる。FPGAの使用の更なる考察を以下に提供する。
【0031】
データは、受信されると処理され得るので、リアルタイムで処理ステップを実行することにより、システムが使用するメモリがより少なくなり得る。これは、従来のシステムよりも改善され、処理され得る前にデータを格納する必要があり得、これは、より多くのメモリを必要とし得るか、又はクラウド130内に位置するコンピュータシステムにアクセスし得る。
【0032】
いくつかの態様において、データストレージ122は、クラスタ位置の識別において使用される情報を格納するために使用される。この情報は、画像自体、又はイメージャ116によってキャプチャされた画像から導出される情報を含み得る。ベースコーリングから判定されたDNA配列は、データストレージ122内に格納され得る。クラスタ位置を識別するパラメータもまた、データストレージ122内に格納され得る。
【0033】
ユーザインターフェース124は、ユーザによって、シーケンシングシステムを操作するために、又はデータストレージ122若しくはコンピュータシステム126に格納されたデータにアクセスするために使用され得る。
【0034】
コンピュータシステム126は、シーケンシングシステムの一般的な動作を制御し得、ユーザインターフェース124にカップリングされ得る。また、クラスタ位置の識別及びベースコーリングのステップを実行し得る。いくつかの態様において、コンピュータシステム126は、図4でより詳細に説明されるように、コンピュータシステム400である。コンピュータシステム126は、構成情報、シーケンシングシステム110を動作させるための命令、又はユーザ情報など、シーケンシングシステム110の動作に関する情報を格納し得る。コンピュータシステム126は、シーケンシングシステム110とクラウド130との間で情報を渡すように構成され得る。
【0035】
上で考察したように、シーケンシングシステム110は、専用プロセッサ118、FPGA(複数可)120、又はコンピュータシステム126を有し得る。シーケンシングシステムは、上記の必要な処理を達成するために、これらの要素のうちの1つ、2つ、又は全てを使用し得る。いくつかの態様において、これらの要素が一緒に存在するとき、処理タスクはそれらの間で分割される。例えば、FPGA(複数可)120を使用して、本明細書に記載されるクラスタ中心検出方法を実行してもよく、一方、コンピュータシステム126は、シーケンシングシステム110のための他の処理機能を実行してもよい。当業者は、これらの要素の様々な組み合わせが、処理の効率及び速度と処理要素のコストとのバランスをとる様々なシステム態様を可能にすることを理解するであろう。
【0036】
クラウド130は、シーケンシングシステム110から分離されたネットワーク、リモートストレージ、又はいくつかの他のリモートコンピューティングシステムであり得る。クラウド130への接続は、シーケンシングシステム110の外部に格納されたデータへのアクセスを可能にし得るか、又はシーケンシングシステム110内のソフトウェアの更新を可能にし得る。
【0037】
図3は、ベースコーリングを実行する実際のクラスタ中心位置を識別するための方法300を示すフローチャートである。フローセル画像内のクラスタ中心は、物理フローセル上のクローン化クラスタの位置に対応する画像内の位置である。クラスタ中心で検出された光シグナルの波長は、その位置でフローセル上の断片に付加されたヌクレオチド塩基に相関する。DNA配列が正しく判定されるためには、連続して検出される光シグナルは、一貫して正しいDNA断片に帰属するものでなければならない。したがって、クラスタ中心の位置を正確に識別することは、その断片のベースコーリング精度を改善する。いくつかの態様において、実際のクラスタ中心が識別されると、そのような位置は、同じフローセルを使用して後続のベースコールサイクルで使用するためにテンプレート上にマッピングされ得る。方法300は、専用プロセッサ118、FPGA(複数可)120、又はコンピュータシステム126によって実行され得る。
【0038】
ステップ310では、フローセル画像がキャプチャされる。上で考察したように、フローセル画像は、イメージャ116によってキャプチャされ得る。ステップ310は、以下のステップによって処理される画像を一度に1つキャプチャすることを伴い得るか、又は同時に処理するために画像のセットをキャプチャすることを伴い得る。画像のセットがキャプチャされる例では、画像のセット内の各画像は、異なる検出された波長に対応し得る。例えば、ヌクレオチドに結びついた上記色の表記を考慮すると、画像のセットは、各々が赤、青、緑、及び黄色の波長のそれぞれの1つでキャプチャされたシグナルに対応する4つの画像を含み得る。単一の画像がキャプチャされる例では、その画像は、対象となる全ての検出された波長を含み得る。各画像又は画像のセットは、フローセル上の単一の流すステップのためにキャプチャされ得る。いくつかの態様において、フローセル画像は、座標系を参照してキャプチャされる。
【0039】
図2は、クラスタからのシグナルが存在するフローセル画像200の概略図を示す。フローセル画像200は、ピクセル210A、210B、及び210Cなどのピクセル210で構成される。ステップ310の間に、イメージャは、例えば、フローセル上の断片に結合された蛍光要素の励起後にフローセルから受信された光シグナルを記録し、そのような断片は、断片のクローン化クラスタ内に位置する。
【0040】
ステップ320において、フローセル画像内の潜在的なクラスタ中心の位置が識別される。例えば、いくつかの態様において、ステップ310でイメージングされた光シグナルは、スポット探索アルゴリズムが潜在的なクラスタ中心のセットを出力するように、スポット探索アルゴリズムに入力され得る。いくつかの態様において、潜在的なクラスタ中心は、単一のフローセル画像(例えば、目的の全ての波長を含む1つの画像)のみを使用して識別され得る。いくつかの他の態様では、潜在的なクラスタ中心は、フローセル上の単一の流すサイクル(例えば、目的の各波長における1つの画像)からの画像のセットから識別され得る。スポット探索アルゴリズムは、将来の流すサイクルからの追加の画像が取得されるのを待つ必要がないため、単一の流すサイクルからのフローセル画像又はフローセル画像のセットのみを使用することは、処理時間の量を有利に低減する。
【0041】
更に他の態様では、スポット探索アルゴリズムは、2つ以上のフローサイクルからの画像に適用され得、潜在的なクラスタ中心は、それらの画像のある組み合わせを使用して探索され得る。例えば、潜在的なクラスタ中心は、2つ以上のフローサイクルからの画像内の同じ位置を占有するスポットの存在によって識別され得る。
【0042】
スポット探索アルゴリズムによって識別された潜在的なクラスタ中心位置は、潜在的なクラスタ中心位置220A、220B、及び220Cなど、図2に「X」で示されている。フローセルへの断片付着がランダムであるという性質により、クローン化クラスタのうちのいくつかは互いに近くてもよく、他のクラスタは更に離隔していてもよく、又は単独であってもよい。その結果、図2のいくつかの「X」は、他のものよりもより互いに近くに配置される。加えて、いくつかのピクセルは、潜在的なクラスタ中心を含むものとして識別され得るが、他のピクセルはそのようには識別されない。例えば、ピクセル210Aは、潜在的なクラスタ中心位置220Aを含むものとして識別され得るが、ピクセル210Bは、潜在的なクラスタ中心位置220を含むものとして最初に識別されない。
【0043】
いくつかの態様において、スポット探索アルゴリズムは、ピクセル210にわたって補間することによって、サブピクセル解像度で潜在的なクラスタ中心位置220を識別し得る。例えば、潜在的なクラスタ中心位置220Aは、ピクセル210Aの中心ではなく、ピクセル210Aの右下側に位置する。他の潜在的なクラスタ中心位置は、それらのそれぞれのピクセル210の異なる領域に位置し得る。例えば、潜在的なクラスタ中心位置220Bは、ピクセルの右上に位置し、潜在的なクラスタ中心位置220Cは、ピクセルの左上に位置する。補間は、補間関数によって実行され得る。
【0044】
いくつかの態様において、補間関数は、当業者に既知のガウス補間関数である。サブピクセル解像度は、潜在的なクラスタ位置が、例えば、10分の1のピクセル解像度で判定されることを可能にし得るが、他の解像度も考慮される。態様では、例えば、解像度は、4分の1のピクセル解像度、2分の1のピクセル解像度などであり得る。補間機能は、この解像度を判定するように構成され得る。
【0045】
補間関数は、1つ以上のピクセル210における光の強度に適合するように使用され得る。この補間は、サブピクセル位置の識別を可能にする。補間関数は、潜在的なクラスタ中心位置220を含むピクセル210のセットにわたって適用され得る。一態様では、補間関数は、中に潜在的なクラスタ中心位置220を有するピクセル210、及びそのピクセル210の縁に接触する周囲のピクセル210に適合され得る。
【0046】
いくつかの態様において、補間関数は、画像内のいくつかの点で判定され得る。解像度は、各ピクセル210に位置する点の数を判定する。例えば、解像度がピクセルの10分の1である場合、ピクセルエッジに垂直な線に沿って、ピクセル210全体で9つの点及び各エッジで1つの点が計算され、ピクセル210を10個の部分に分割する。いくつかの態様において、補間関数は、各点で計算され、各点での補間関数とピクセル強度との差が判定される。補間関数の中心は、補間関数と各ピクセル210の強度との差を最小にするようにシフトされる。このサブピクセル補間は、システムがより低解像度のイメージャでより高い解像度を達成することを可能にし、システムのコスト及び/又は複雑さを低減する。
【0047】
いくつかの態様において、補間は、5×5グリッド上で実行され得る。グリッドは、潜在的なクラスタ中心位置を有するピクセル内のピクセル中心210を中心にしてもよい。
【0048】
ステップ320のいくつかの態様は、潜在的なクラスタ中心位置を識別するためにスポット探索アルゴリズムを使用するが、ステップ320のいくつかの他の態様は、最初に、キャプチャされたフローセル画像内の各ピクセルを潜在的なクラスタ中心位置として識別する。例えば、図2において、全てのピクセル210は、潜在的なクラスタ中心位置220として識別され得る。このアプローチは、方法300を実施するために必要とされる処理の種類を単純化し得る、スポット探索アルゴリズムの必要性を排除する。このアプローチは、各潜在的なクラスタ中心位置が並列に処理され得るため、大規模な並列処理が利用可能である場合に有利であり得る。これは、増加した専用プロセッサ118又はFPGA(複数可)120などの追加のハードウェアのコストが潜在的にかかるが、処理時間を低減し得る。いくつかの態様において、次いで、補間関数は、フローセル画像の全体にわたってサブピクセル解像度で強度を識別するために上記に記載されるように使用され得る。
【0049】
上で考察したように、クラスタ中心は、物理フローセル上のクローン化クラスタの位置に対応する、ピクセル210などの画像内の位置を識別する。潜在的なクラスタ中心位置220は、1つ以上の波長の光がイメージャによって検出される画像内の位置である。いくつかの場合では、クラスタの物理的位置がピクセル210の1つのセットに対応するが、例えば、カメラ内の対応するセンサの飽和(「ブルーミング」とも称される)に起因して、そのクラスタからの光シグナルがその1つのセットに隣接する追加のピクセル210にオーバーフローすることが可能である。加えて、クラスタ同士が近接して配置されるとき、クラスタ自体がそうでなくても、それらのクラスタからの光シグナルが重複し得る。真のクラスタ中心を識別することは、検出されたシグナルが正しいDNA断片に帰属することを可能にし、したがって、ベースコーリングアルゴリズムの精度を向上させる。
【0050】
したがって、ステップ325において、追加のクラスタシグナル位置225は、各潜在的なクラスタ中心位置220の周りで識別される。これらは、図2の「+」、例えば、225A、225B、及び225Cで示される。これらの追加のクラスタシグナル位置225は、潜在的なクラスタ中心位置220として既に識別されている位置の代わりに、又はそれに加えて、クラスタ中心を構成し得るフローセル内の他の位置に対応する。
【0051】
いくつかの態様において、追加のクラスタ位置225は、潜在的なクラスタ中心位置220の周りに配置される。いくつかの態様において、これらの追加のクラスタ位置225は、スポット探索アルゴリズムによって最初に識別されるのではなく、スポット探索アルゴリズムによって識別される各潜在的なクラスタ中心位置220の周りにパターンで配置される。追加のクラスタ位置225は、実際の検出されたクラスタ中心を表すのではなく、そうでなければ検出されない可能性のあるクラスタ中心をチェックするための潜在的な位置を表す。そのようなクラスタ中心は、近接クラスタ中心からのシグナル間の混合、スポット探索アルゴリズムのエラー、又は他の影響のために検出されない場合がある。
【0052】
一例として、追加のクラスタ位置225Aは、潜在的なクラスタ中心位置220Aの位置に基づいて、ピクセル210Aに配置され得る。この文脈において、これは、追加のクラスタ位置225Aが潜在的なクラスタ中心位置220Aから離隔したピクセルの幅に配置されることを意味し得る。他の追加のクラスタ位置225も、潜在的なクラスタ中心位置220Aの周りに配置される。潜在的なクラスタ中心位置220がフローセル画像200のエッジの近くにある場合など、追加のクラスタ位置225は、ピクセル210が存在しない場所に配置されないことを理解されたい。
【0053】
いくつかの態様において、追加のクラスタシグナル位置225は、潜在的なクラスタ中心位置220を中心とするグリッドに配置される。追加のクラスタ位置225は、ピクセル幅だけ互いから及び潜在的なクラスタ中心位置220から離隔していてもよい。いくつかの態様において、追加のクラスタ位置225及び潜在的なクラスタ中心位置220は、正方形のグリッドを形成する。グリッドは、5ピクセル×5ピクセル、9×9、15×15、又は他の寸法の面積を有し得る。
【0054】
いくつかの態様において、潜在的なクラスタ中心位置220は、追加のクラスタ位置225の対応するグリッドを重複させるのに十分に互いに近いものであり得る。これにより、同じピクセル210が、2つ以上の潜在的なクラスタ中心位置220からの追加のクラスタ位置225を含み、2つ以上の追加のクラスタ位置225が同じピクセル210に帰属するようになり得る。例えば、ピクセル210Cは、(潜在的なクラスタ中心位置220Bに基づいて識別された)追加のクラスタ位置225B、並びに(潜在的なクラスタ中心位置220Cに基づいて識別された)追加のクラスタ位置225Cを含む。
【0055】
いくつかの態様において、同じピクセル210内の追加のクラスタ位置225が十分に互いに近い場合、追加のクラスタ位置225のうちの一方が破棄され、他方が両方を表すのに使用される。2つの追加のクラスタ位置225は、それらが、例えば、限定されないが、ピクセルの10分の2、ピクセルの10分の1、又はいくつかの他のサブピクセル距離内にある場合、そのような処理にとって十分に互いに近いと考えられ得る。
【0056】
当業者は、ステップ320で、全てのピクセル位置が潜在的なクラスタ中心位置220として識別された場合、ステップ325は、識別された潜在的なクラスタ中心位置に加えて考慮すべき他のピクセルがフローセル画像内に残っていないためにスキップされ得ることを理解するであろう。
【0057】
いくつかの態様において、潜在的なクラスタ中心位置220(及び識別された場合、周囲の追加のクラスタ位置225)は、一緒に全ての候補クラスタ中心のセットを構成する。これらの候補クラスタ中心は、キャプチャされた各フローセル画像についての実際のクラスタ中心を識別するために処理され得る。
【0058】
したがって、潜在的なクラスタ中心位置220及び追加のクラスタ位置225のそれらの周囲のグリッド(すなわち、候補クラスタ中心)が識別されると、それらは、クラスタ中心の実際の位置を判定するための出発点として使用され得、これは、最初に識別された潜在的なクラスタ中心位置220と同じであっても、そうでなくてもよい。
【0059】
図3に戻り、ステップ330において、各キャプチャされたフローセル画像上の各候補クラスタ中心の純度値が判定される。純度値は、ヌクレオチドに結合された蛍光要素の波長及びキャプチャされたフローセル画像内のピクセルの強度に基づいて判定され得る。
【0060】
各候補クラスタ中心において、ピクセルの強度は、イメージャのスペクトル帯域幅にわたって放出されるエネルギー又は光の組み合わせである。いくつかの態様において、各ヌクレオチド塩基の蛍光スペクトル帯域幅に対応するエネルギー又は光の量が探索され得る。特定のヌクレオチド塩基に対応する各シグナルの純度は、1つのヌクレオチド塩基シグナルについてのエネルギーの量と、各他のヌクレオチド塩基シグナルについてのエネルギーの総量との比率として探索され得る(例えば、「赤」シグナルの純度は、検出された青、緑、及び黄色の波長の各々と比較して、そのピクセル又はサブピクセルについて検出された赤い波長の相対強度に基づいて判定され得る)。ピクセルの全体的な純度は、最大の比率、最小の比率、比率の平均、又は比率の中央値であり得る。次いで、計算された純度は、そのピクセル又はサブピクセルに割り当てられ得る。
【0061】
上述のように、フローセル画像のセットは、単一のフローサイクルのためにキャプチャされ得る。セット内の各画像は、異なる波長でキャプチャされ、各波長は、ヌクレオチドに結合した蛍光要素のうちの1つに対応する。画像のセットにわたる所与のクラスタ中心の純度は、画像のセットについての純度のセットからの最高、最低、中央値、又は平均純度であり得る。
【0062】
いくつかの態様において、候補クラスタ中心の純度は、ピクセルの波長からの2番目に高い強度又はエネルギーと、そのピクセルの波長からの最高の強度又はエネルギーとの比率を差し引いたものとして判定され得る。閾値は、高純度又は低純度を構成するものについて設定され得る。例えば、最高純度は、1であってもよく、低純度のピクセルは、ゼロに近い純度値を有してもよい。閾値は、その間に設定され得る。
【0063】
いくつかの態様において、2つの強度の比率は、2番目に高い強度及び最高強度の両方にオフセットを加えることによって修正され得る。オフセットは、品質スコアの改善された精度を提供し得る。例えば、いくつかの場合において、2つの比率強度は、わずかな量の絶対最大強度(高パーセンテージの最高強度でもある)だけ異なることがある。具体的な非限定的な例として、最高強度は10であり得、最低強度は、最大の可能な強度が1000であり得る。この場合の比率は0.1であり、純度は0.9となる。それ以上がなければ、これは高品質スコアとして読み取られる可能性がある。これは、例えば、最高強度の場合は500、及び2番目に高い強度の場合は490である強度とは対照的である。この例は、ほぼ同じ絶対差を有しているが、比率は1に近く、純度はゼロに近い。第1の場合、全体的な強度が低いことはポロニーが存在しないことを示唆するので、純度は誤解を招く。第2の場合、純度はより正確であり、ピクセルが近くに位置する2つの異なるクラスタ中心からの強度又はエネルギーを表示していることを示す。
【0064】
オフセットは、そのような問題を解決するための比率の強度に加えられた値であり得る。例えば、オフセットが最大振幅の10パーセントである場合、上記の例では、オフセットは100であり、第1の比率は110に対して101になり、これは1にはるかに近く、2つの波長強度間の小さなデルタを正確に反映するゼロに近い純度をもたらす。第2の比率では、比率は590に対して600であり、これは依然として1に近く、やはりゼロに近い純度をもたらす。
【0065】
オフセットを組み込む別の例として、最高強度が800であり、最低強度が1である場合、比率がほぼゼロであるため、オフセットのない純度は1に近い。オフセットが再び100であると、比率は900に対して101になる。これにより、純度は1から約0.89にわずかに低下する。これは純度を低下させる可能性があるが、計算された純度は依然として高い。オフセット値は、この影響を低減するように設定してもよい。例えば、別の場合のオフセットは、10であり得る。最高強度が10であり、最低強度が1である前の例を使用すると、純度は、1-10/11、すなわち約0.09となり、これは強度間の小さな差を正確に反映している。最高強度が600であり、最低強度が590である例では、純度は、1-600/610、すなわち約0.016であり、これもやはり強度間の小さな差を反映している。最高強度が800であり、最低強度が1である例では、純度は、1-11/810、すなわち約0.99であり、これは純度のはるかに小さい低下であり、強度間の大きな差を反映している。
【0066】
ステップ340では、実際のクラスタ中心は、フローセルの候補クラスタ中心について計算された純度値に基づいて識別される。実際のクラスタ中心は、ステップ320及び325で識別された候補クラスタ位置のサブセットであってもよい。
【0067】
いくつかの態様において、実際のクラスタ中心は、フローセル画像全体の各候補クラスタ中心の純度を、同じ画像内の近くの候補クラスタ中心と比較することによって識別される。いくつかの態様において、比較されている2つの候補クラスタ中心を考慮すると、より高い純度を有する候補クラスタ中心が維持される。いくつかの態様において、候補クラスタ中心は、ある特定の距離内の他の候補クラスタ中心とのみ比較される。例えば、この距離閾値は、ピクセルサイズ及び所与のヌクレオチドのクラスタのサイズに基づき得る。
【0068】
例えば、クラスタの平均サイズが4つのピクセル幅/高さである場合、距離閾値は、互いの2つのピクセル幅/高さ内の任意の候補クラスタ中心が同じクラスタに属するか、又はより高い強度を有する可能性が高い(候補クラスタ中心が実際に2つの別個のクラスタのエッジ上にあることを示す)ため、2つのピクセル幅/高さであり得る。
【0069】
純度が複数のフローセルサイクルにわたって計算されるいくつかの態様において、候補クラスタ中心が、複数のフローセル画像にわたって周囲の候補クラスタ中心よりも高い純度を一貫して有することを判定することは、位置が実際のクラスタ中心である可能性を更に高め得る。より低い純度は、候補クラスタ中心で検出されたシグナルが実際のクラスタ中心ではなく、ノイズ、他のシグナルの混合、又はいくつかの他の現象であることを示し得る。
【0070】
ステップ350では、実際のクラスタ中心は、フローセル画像上でベースコーリングを実行するために使用される。例えば、実際のクラスタ中心から検出された波長を判定してもよく、これは特定のヌクレオチド塩基(例えば、A、G、C、T)に相関する。次いで、そのヌクレオチド塩基は、実際のクラスタ中心に対応する配列に付加されたものとして記録される。
【0071】
連続したフローセル画像における実際のクラスタ中心でのフローサイクル及び蛍光波長識別の連続した反復により、フローセル上の各実際のクラスタ中心に対応するDNA断片の配列が構築され得る。
【0072】
いくつかの態様において、テンプレートは、単一のフローサイクルについて識別された実際のクラスタ中心から形成される。次に、テンプレート内の実際のクラスタ位置を使用して、後続のフローサイクルからの画像内でベースコーリングを実行する場所を識別し得る。
【0073】
異なるフローサイクルでキャプチャされたフローセル画像は、フローサイクル間のフローセル又はイメージャの位置のシフトに起因して、位置合わせの問題を有し得る。したがって、いくつかの態様において、ステップ350は、連続した画像を適切に整列させるための位置合わせステップを含み得る。これにより、実際のクラスタがテンプレートの中心を各フローセル画像上の同じ位置に正確にマッピングすることが保証され、したがって、ベースコールの精度が向上する。
【0074】
テンプレートが後続の画像内の実際のクラスタ中心を識別するために使用されるいくつかの態様では、それらの後続の画像内の関連する位置に対応するデータのみが維持及び/又は処理される必要がある。処理されるデータの量のこの減少は、レガシーシステムよりも正確な結果がより迅速に得られ得るように、処理の速度及び/又は効率を増加させる。加えて、格納されるデータの量の減少は、シーケンサに必要なストレージの量を減少させ、したがって、必要なリソースの量及び/又はコストを減少させる。
【0075】
加えて、いくつかのレガシーシステムは、クラスタ位置を識別するために、異なる画像を互いに比較することを必要とする。この比較は、複数のフローセルサイクルからの画像にスポット探索アルゴリズムを適用し、次いで、画像にわたってスポット探索結果を比較することを含み得る。これは、複数のフローサイクルの各々の画像又はスポット探索結果を格納することを必要とし得る。画像を直接比較する必要がないため、方法300は、クラスタ探索の処理及び格納効率を改善し得る。代わりに、画像は、リアルタイムで処理され得、純度情報及び/又は最終的なテンプレート位置のみが格納される必要がある。
【0076】
シーケンシングフローサイクル及び画像作成プロセスは、多くの場合、画像を分析するスポット探索及びベースコーリングプログラムよりも高速に実行される。この実行時間の差により、各フローサイクルの後にフローセル画像を格納すること、又は画像分析プロセスのうちのいくつか又は全てが完了するのを待つ間のシーケンシングフローサイクルの遅延が必要となり得る。
【0077】
FPGAを使用することで、精度を犠牲にすることなく処理速度を上昇させることができる。FPGA上で本明細書に記載されるプロセスの一部分又は全てを実施することは、プロセッサオーバーヘッドを低減し、FPGA上での並列処理を可能にし得る。例えば、各可能なクラスタ位置は、異なるFPGAによって処理されてもよく、又は可能なクラスタ位置を同時に並列に処理するように構成された単一のFPGAによって処理されてもよい。適切に実施される場合、これは、リアルタイム処理を可能にし得る。リアルタイム処理は、画像生成時に画像が処理され得るという利点を有する。FPGAは、シーケンシングシステムがフローセルを準備した時間までに、次の画像を処理する準備ができている。シーケンシングシステムは、後処理を待つ必要はなく、一次分析の全体のプロセスは、ほんのわずかの時間で完了し得る。加えて、画像全体が受信時に処理されているため、格納する必要がある情報は、ベースコーリングを実行するためのデータのみである。全ての画像を格納する代わりに、特定のピクセルの純度又は強度のみを格納する必要がある。これは、シーケンシングシステムにおけるデータ格納又は画像のリモート格納の必要性を大幅に低減する。
【0078】
いくつかの態様において、画像位置合わせ、強度抽出、純度計算、ベースコーリング、及び他のステップを含むプロセス全体が、FPGAによって実行される。これは、最もコンパクトな実施を提供し得、リアルタイム処理に必要な速度及びスループットを提供し得る。
【0079】
いくつかの態様において、処理責任は、FPGAと関連付けられたコンピュータシステムとの間などで共有される。例えば、いくつかの態様において、FPGAは、画像位置合わせ、強度抽出、及び純度計算を処理し得る。次いで、FPGAは、ベースコーリングのために情報をコンピュータシステムに渡す。このアプローチは、FPGAとコンピュータシステムとの間の通信をスケールダウンすることを含めて、FPGAとコンピュータシステムリソースとの間の負荷のバランスをとる。また、迅速なアルゴリズムチューンアップ機能を備えたベースコーリングを処理するコンピュータシステム上のソフトウェアに柔軟性を提供する。そのようなアプローチは、リアルタイム処理を提供し得る。
【0080】
FPGA、専用プロセッサ、及びコンピュータシステムの異なる構成が、様々なステップを実行するために使用され得ることが、当業者には認識されよう。所与の構成の選択は、フローセル画像サイズ、イメージャ解像度、処理する画像の数、所望の精度、及び必要な速度に基づいてもよい。FPGA、専用プロセッサ、及びコンピュータシステムの実装コスト及びハードウェアコストもまた、構成の選択に影響を及ぼし得る。
【0081】
既存の方法と本明細書記載の方法の態様との間の性能を比較する非限定的な例として、クラスタの密度が低いフローセルとクラスタの密度が高いフローセルの2つの例示的なフローセル上で試験を実行した。比較のために、識別されたクラスタ上の偽陽性の特定の平均エラー率を標的とするために各方法を使用して試験を実行した。
【0082】
低密度フローセルの場合、平均誤差率は、0.3%であった。既存の方法は、約78,000のクラスタ中心を識別したが、本明細書に記載される方法は、約98,000のクラスタ中心を識別した。高密度フローセルの場合、平均誤差率は、1.1%であった。既存の方法は、約63,000のクラスタ中心を識別したが、本明細書に記載される方法は、約170,0000のクラスタを識別した。
【0083】
結果は、本明細書に記載される方法が既存の方法よりも多くのクラスタを効果的に識別することを示唆している。更に、同じ誤差率であっても、フローセル上のクラスタの密度が増加するとき、本明細書に開示される方法は、更に優れた性能を発揮し、ほぼ3倍の数のクラスタを識別する。いくつかの態様において、これは、既存の方法で典型的に経験される性能損失なしに、フローセルがより高い密度で流れることを可能にし得る。
【0084】
図6は、NGSデータ分析の一次分析におけるベースコーリング位置を識別するための方法600の例示的な態様のフローチャートを示す。方法600は、本明細書に開示される操作のうちのいくつか又は全てを含むことができる。操作は、本明細書に記載される順序で実行され得るが、これに限定されない。
【0085】
方法600は、本明細書に開示される1つ以上のプロセッサ(例えば、図4の404)によって実行することができる。いくつかの態様において、プロセッサは、プロセッシングユニット、集積回路、又はそれらの組み合わせのうちの1つ以上を含むことができる。例えば、プロセッシングユニットは、セントラルプロセッシングユニット(CPU)及び/又はグラフィックスプロセッシングユニット(GPU)を含むことができる。集積回路は、フィールドプログラマブルゲートアレイ(FPGA)などのチップを含むことができる。いくつかの態様において、プロセッサは、コンピューティングシステム400を含み得る。
【0086】
いくつかの態様において、方法600におけるいくつか又は全ての操作は、FPGA(複数可)によって実行され得る。いくつかの操作がFPGA(複数可)によって実行される態様では、FPGA(複数可)によって実行される操作の後のデータは、FPGA(複数可)によってCPU(複数可)に通信されることが可能であり、その結果、CPU(複数可)は、そのようなデータを使用して方法500における後続の操作(複数可)を実行することができる。同様に、データはまた、FPGA(複数可)による処理のために、CPU(複数可)からFPGA(複数可)に伝達され得る。いくつかの態様において、方法500における全ての操作は、CPU(複数可)によって実行され得る。代替的に、CPU(複数可)によって実行される操作は、専用プロセッサ、又はGPU(複数可)などの他のプロセッサによって実行され得る。いくつかの態様において、方法600における全ての操作は、FPGA(複数可)によって実行され得る。
【0087】
いくつかの態様において、方法600のうちのいくつか又は全ての操作は、シーケンシングランにおけるシーケンシングサイクルNの間又はその前に実行される。ベースコーリングテンプレート、例えば、ポロニーマップは、サイクル1~Nのうちのいくつか又は全てにおいて生成され得る。そのようなサイクル内の1つ以上のチャネルからのポロニー又はクラスタは、参照座標系内のテンプレートに含まれ得るが、サイクルN及び/又はその後続のサイクルのフローセル画像は、まだキャプチャされていないか、又は現在キャプチャされていない。いくつかの態様において、サイクルNは、現在のサイクルである。Nは、任意の非ゼロ整数、例えば、3、4、又は5であり得る。
【0088】
多重ライブラリ分子のための方法
いくつかの態様において、方法600は、支持体上に固定化された第1の複数のライブラリ分子を提供する操作610を含むことができる。第1の複数のライブラリ分子の各々は、第1の試料源に由来する第1の挿入配列、及び第1の試料インデックス配列を含むことができる。第1の試料インデックス配列は、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含むことができる。第1のユニバーサル試料インデックスは、第1の挿入配列の第1の試料源の一意の識別のために構成することができる。いくつかの態様において、第1の複数のライブラリ分子は、同じ試料源に由来する。
【0089】
図5Aは、本明細書に開示されるライブラリ分子500の例示的な態様を示す。ライブラリ分子500は、第1の試料から得られた第1の挿入配列510、すなわち、第1の目的の配列と、少なくとも第1のユニバーサル試料配列570を有する第1の試料インデックス配列と、を含むことができる。第1の試料インデックス配列はまた、k-mer配列571を含むことができる。
【0090】
いくつかの態様において、各ライブラリ分子500は、単一の挿入配列510のみを含み得る。他の態様において、各ライブラリ分子500は、複数の挿入配列を含んでもよく、複数の挿入配列は、互いに直接隣接しているか、又はライブラリ分子のある他の部分によって分離されているかのいずれかである。
【0091】
いくつかの態様において、支持体上に固定化された異なるライブラリ分子500は、同じサイズの挿入配列、例えば、120個のヌクレオチド塩基の挿入物を有し得る。他の態様において、支持体上に固定化された異なるライブラリ分子500は、異なるサイズの挿入配列を有し得る。
【0092】
いくつかの態様において、方法600は、支持体上に固定化された第2の複数のライブラリ分子を提供する操作620を含む。第2の複数のライブラリ分子の各々は、第2の試料源に由来する第2の挿入配列、及び第2の試料インデックス配列を含むことができる。第2の試料インデックス配列は、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含むことができる。第2のユニバーサル試料インデックスは、第2の挿入配列の第2の試料源を一意に識別するために使用され得る。いくつかの態様において、第2の試料源は、第1の試料源と異なる。
【0093】
いくつかの態様において、第1の複数のライブラリ分子の各々は、第3のユニバーサル試料インデックス配列を有する第3の試料インデックス配列を更に含む。第1及び第3のユニバーサル試料インデックス配列の組み合わせは、第1の挿入配列の第1の試料源を一意に識別するように構成され得る。いくつかの態様において、第3の試料インデックスは、k-mer配列又はランダム配列を欠く。いくつかの態様において、第3の試料インデックスは、k-mer配列又はランダム配列を含む。第1の試料インデックス配列は、第1の挿入配列の左側、すなわち、5’末端、又は挿入配列の右側、すなわち、3’末端にあり得る。次いで、第3の試料インデックス配列は、挿入配列の反対側の末端にあり得る。
【0094】
図5Aは、第1の試料から得られた、第1の挿入配列510、すなわち、第1の目的の配列と、少なくとも第3のユニバーサル試料配列560を有する第3の試料インデックス配列と、を含むライブラリ分子500の例示的な態様を示す。第1の試料インデックス配列はまた、k-mer配列561を含むことができる。
【0095】
いくつかの態様において、第2の複数のライブラリ分子の各々は、第4のユニバーサル試料インデックス配列を有する第4の試料インデックスを更に含む。第2及び第4のユニバーサル試料インデックス配列の組み合わせは、第2の挿入配列の第2の試料源を一意に識別することができる。いくつかの態様において、第4の試料インデックスは、ランダム配列又はランダム配列を欠く。いくつかの態様において、第4の試料インデックスは、k-mer配列又はランダム配列を含む。第2の試料インデックス配列は、第2の挿入配列の左側、すなわち、5’末端、又は挿入配列の右側、すなわち、3’末端にあり得る。次いで、第3の試料インデックス配列は、第2の挿入配列の反対側の末端にあり得る。
【0096】
いくつかの態様において、ライブラリ分子の各々は、1つ以上のユニバーサルアダプター配列(例えば、図5A~5Bにおける520、540)を更に含む。
【0097】
いくつかの態様において、方法600は、第3の、第4の、第5の、第6の、又は更には複数のライブラリ分子について操作610及び/又は620を繰り返すことを含むことができ、各複数のライブラリ分子は、異なる試料に由来する。例えば、操作610は、操作610及び620を1回実行した後、95回繰り返すことができる。各繰り返しは、異なる試料からの複数のライブラリ分子のものであることができるため、96個の試料は、支持体上でのシーケンシングのために調製することができる。
【0098】
同じ試料からの異なるライブラリ分子について、各ライブラリ分子は、異なる挿入配列、異なるk-mer配列、及び同一のユニバーサル試料インデックス配列(複数可)を有することができる。異なる試料からの異なるライブラリ分子について、各ライブラリ分子は、異なる挿入配列、異なるk-mer配列、及び異なるユニバーサル試料インデックス配列(複数可)を有することができる。
【0099】
挿入配列の第1、第2、又は他の試料源は、ゲノムDNA、二本鎖cDNA、及び/又は無細胞循環DNAであり得る。
【0100】
いくつかの態様において、方法600は、第1及び第2の複数のライブラリ分子を一緒にプールし、プールされたライブラリ分子を支持体上に分布させ、及び増幅反応を行って、支持体に固定化された複数の核酸テンプレート分子を生成する操作を含むことができる。複数の核酸テンプレート分子は、本明細書に開示されるようにクローン的に増幅することができる。3つ以上の試料、例えば、96個の試料を含む態様において、複数のライブラリ分子の全てを一緒にプールし、増幅反応のための支持体上に分布させることができる。
【0101】
いくつかの態様において、核酸テンプレート分子は、対応するライブラリ分子からクローン的に増幅される。各核酸テンプレート分子は、対応するライブラリ分子の複数のクローンコピーを有し得る。いくつかの態様において、複数の核酸テンプレート分子の各々は、対応するライブラリ分子及び対応するスプリント分子/アダプター(例えば、図5Bの580)を含む対応するスプリント複合体(例えば、図5Bの590)からクローン的に増幅される。スプリント分子/アダプターは、一本鎖又は二本鎖であり得る(例えば、図5B)。スプリント複合体の形成及びテンプレート分子を形成するための増幅の詳細は、米国特許出願第17/725,042号及び同第17/725,065号に開示されている(これらの両方の内容は、参照によりそれらの全体が本明細書に組み込まれる)。
【0102】
いくつかの態様において、各核酸テンプレート分子は、対応するライブラリ分子の単一のコピーを有してもよく、複数のテンプレート分子を一緒にクラスタ化して、「クラスタ」を形成することができる。
【0103】
各テンプレート分子は、対応するライブラリ分子の1つ以上のコピーを有することができるため、同じ試料からの異なるテンプレート分子について、各テンプレート分子は、異なる挿入配列、異なるk-mer配列、及び同一のユニバーサル試料インデックス配列(複数可)を有することができる。異なる試料からの異なるテンプレート分子について、各テンプレート分子は、異なる挿入配列、異なるk-mer配列、及び異なるユニバーサル試料インデックス配列(複数可)を有することができる。
【0104】
いくつかの態様において、複数の核酸テンプレート分子は、支持体上のランダムな位置に固定化される。いくつかの態様において、複数の核酸テンプレート分子は、支持体上の所定の位置に固定化されている。支持体上に固定化された複数の核酸テンプレート分子の各々は、ポロニー又はクローン化クラスタに対応し得る。支持体上の複数の固定化されたテンプレート分子の位置は、ベースコーリング位置に対応することができる。固定化された核酸テンプレート分子は、シーケンシング反応サイクルが行われるときにシーケンシングされ得る。
【0105】
支持体上の核酸テンプレート分子の密度は、1mm当たり約10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~10であり得る。
【0106】
支持体は、1つ以上の基材を含み得る。支持体は、ガラス基材又はプラスチック基材を含み得る。支持体は、光学システムの対物レンズに最も近い透明な上部基材を含むことができる。支持体は、1つ以上のマイクロ流体チャネルを含むことができ、テンプレート分子は、マイクロ流体チャネルの表面に固定化される。いくつかの態様において、支持体は、フローセルデバイスに含まれている。
【0107】
いくつかの態様において、支持体又はその一部分(例えば、マイクロ流体チャネルの表面)は、45度以下の水接触角を有する少なくとも1つの親水性ポリマーコーティングで不動態化されている。少なくとも1つの親水性ポリマーコーティングは、ポリエチレングリコール(PEG)、ポリ(ビニルアルコール)(PVA)、ポリ(ビニルピリジン)、ポリ(ビニルピロリドン)(PVP)、ポリ(アクリル酸)(PAA)、ポリアクリルアミド、ポリ(N-イソプロピルアクリルアミド)(PNIPAM)、ポリ(メチルメタクリレート)(PMA)、ポリ(2-ヒドロキシルエチルメタクリレート)(PHEMA)、ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(POEGMA)、ポリグルタミン酸(PGA)、ポリリジン、ポリグルコシド、ストレプトアビジン、及びデキストランからなる群から選択される分子を含み得る。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも4つの分岐を有する分岐親水性ポリマー分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも1000ダルトンの分子量を有するポリマー分子を含む。
【0108】
いくつかの態様において、k-mer配列(例えば、図5Aの561又は571)は、1、2、3、4、5つ、又はそれ以上のヌクレオチド塩基を含み得る。いくつかの態様において、k-mer配列は、A、G、C及びT/Uの少なくとも2つ又は3つのヌクレオチド塩基のランダム配列を含む。いくつかの態様において、k-mer配列は、A、G、C及びT/Uのヌクレオチド塩基のランダム配列のみを含む。
【0109】
方法600は、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行う操作630を含むことができる。操作630は、本明細書に開示されるシーケンシングシステムによって実行され、それによって、第1の複数のフローセル画像を生成することができる。各シーケンシングサイクルにおいて、異なる試料の異なるテンプレート分子からの異なるk-mer配列を並行してシーケンシングすることができる。例えば、第1のシーケンシングサイクルでは、96個の試料からの96,000個のk-mer配列における第1のヌクレオチド塩基を並行してシーケンシングし、それによって、1000個のベースコーリング位置を有するチャネル当たりのフローセル画像を生成する。
【0110】
いくつかの態様において、操作630は、挿入配列、例えば、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前に実行される。
【0111】
いくつかの態様において、操作630は、シーケンシングランのシーケンシングの順序(すなわち、読み取り順序)に基づいている。シーケンシングの順序は、k-mer配列をシーケンシングすること、次いで第1のユニバーサル試料インデックス配列をシーケンシングすること、次いで第1の挿入配列をシーケンシングすること、を含むことができる。シーケンシングの順序は、k-mer配列をシーケンシングすること、次いで第1及び第2のユニバーサル試料インデックス配列をシーケンシングすること、次いで第1及び第2の挿入配列をシーケンシングすること、を含むことができる。シーケンシングの順序は、第1及び第2のユニバーサル試料インデックス配列をシーケンシングすることと、次いで、k-mer配列をシーケンシングすることと、次いで、第1及び第2の挿入配列をシーケンシングすることと、を含むことができる。シーケンシングの順序は、k-mer配列をシーケンシングすることと、次いで第1及び第2の挿入配列をシーケンシングすることと、次いで第1及び第2のユニバーサル試料インデックス配列をシーケンシングすることと、を含むことができる。シーケンシングの順序は、第1及び第2の挿入配列のいくつかの塩基(例えば、第1の3~8塩基)をシーケンシングすることと、k-mer配列をシーケンシングすることと、次いで第1及び第2のユニバーサル試料インデックス配列をシーケンシングすることと、を含むことができる。シーケンシングの順序において、第3及び第4の試料インデックス配列がランダム配列を欠く場合、第3及び第4の試料インデックス配列をシーケンシングすることは、第1及び第2の試料インデックス配列をシーケンシングした後に生じ得る。
【0112】
いくつかの態様において、第1の複数のフローセル画像は、各シーケンシングサイクルにおいて2、3、4、5、又は6つの異なるカラーチャネルからのものである。いくつかの態様において、第1の複数のフローセル画像は、k回のサイクル又はk+1回のシーケンシングサイクルからのものであり、k回又はk+1回のサイクルのうちの1回以上のサイクルは、支持体上に固定化された複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基を含む。
【0113】
いくつかの態様において、各シーケンシング反応サイクルは、ポリメラーゼ媒介性である。k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、異なる種類のヌクレオチド塩基A、G、C及びT/Uの混合物を含む複数のヌクレオチド試薬を使用して、ヌクレオチド酸又は複数の核酸テンプレート分子のポロニーを接触させることを含むことができる。いくつかの態様において、個々のヌクレオチド試薬は、各異なる種類のヌクレオチド塩基に対応する、異なる検出可能な色ラベルを含む。
【0114】
いくつかの他の態様において、操作630は、ヌクレオチド酸又は複数の核酸テンプレート分子のポロニーを、複数のシーケンシングプライマー、複数のポリメラーゼ、及び異なる種類のアビダイトの混合物と接触させることを含む。混合物中の個々のアビダイトは、複数のヌクレオチドアームが付着したコアを含み、個々のアビダイトの各アームは、同じ種類のヌクレオチド塩基を含む。
【0115】
いくつかの態様において、k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、本明細書の光学システムによって、テンプレート分子に結合したヌクレオチド試薬から放出された光学カラーシグナルをイメージングすることを含む。いくつかの態様において、k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、k回のサイクルにおいて、本明細書の光学システムによって、テンプレート分子に結合したヌクレオチド試薬から放出された光学カラーシグナルを含む第1の複数のフローセル画像を取得することを含む。
【0116】
第1の複数のフローセル画像は、k-mer配列におけるシーケンシング反応の伝導に対応するk回のサイクルで生成され得る。第1の複数のフローセル画像は、k回のサイクルにおいて支持体上に固定化された複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含み得る。
【0117】
複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基は、(2)1回以上のサイクルにおける塩基の総数に対する(1)各種類のヌクレオチド塩基の数のパーセンテージを含むことができる。パーセンテージは、10%、15%、又は20%を超えることができる。例えば、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子中の全てのヌクレオチド塩基の総数のそれぞれ26%、15%、27%、及び32%であるヌクレオチド塩基A、G、C、Tの数を含む。
【0118】
方法600は、第1の複数のフローセル画像のピクセルについてのピクセル強度及びピクセル強度の各々のそれぞれの色純度を判定する操作640を含むことができる。操作640は、本明細書に開示されるプロセッサによって実行され得る。ピクセル強度の各々は、ピクセルの強度及び/又はピクセルに対応するサブピクセルの1つ以上のサブピクセル強度を含むことができる。ピクセル強度の各々のそれぞれの色純度は、ピクセルの1つの色純度及び/又は対応するピクセルの1つ以上のサブピクセル強度に対応する1つ以上の色純度を含むことができる。ピクセル強度の各々のそれぞれの色純度は、1つ以上の色チャネルのそれぞれの色純度を含むことができる。
【0119】
ピクセル強度を判定することは、チャネル強度のセット内の各チャネル強度を判定することを含み得、各チャネルは、それぞれ異なる蛍光波長に対応する。そのような判定は、対応するピクセル又は1つ以上のサブピクセル位置におけるチャネル強度のセットの比較に基づくことができる。
【0120】
ピクセル強度のそれぞれの色純度を判定することは、(2)他の種類のヌクレオチド塩基についてのシグナルの総量に対する、(1)特定の種類のヌクレオチド塩基に対応するシグナルの比率を判定することを含むことができる。ピクセル強度の各々のそれぞれの色純度を判定することは、本明細書に開示される操作330を少なくとも部分的に含むことができる。
【0121】
方法600は、操作640で判定されたピクセル強度及びピクセル強度のそれぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定する操作650を含むことができる。
【0122】
本明細書に開示されるように、ピクセル強度及びピクセル強度のそれぞれの色純度に基づいてベースコーリングテンプレートを判定する操作は、ピクセル又はサブピクセルの各々について、それぞれの色純度が距離閾値内の他のピクセル又はサブピクセルの色純度よりも大きいかどうかを判定することを含み得る。それぞれの色純度が、閾値距離内の他のピクセル又はサブピクセルの色純度よりも大きいとの判定に応答して、対応するピクセル又はサブピクセルの位置をベースコーリングテンプレートに追加する。それぞれの色純度が、距離閾値内の他のピクセル又はサブピクセルの色純度よりも大きくないとの判定に応答して、ベースコーリングテンプレートに変更を加えず、次のピクセルに進んで、全てのピクセル又はピクセルの少なくともサブセットが同様の判定操作を通過するまで、判定操作を繰り返す。
【0123】
ベースコーリングテンプレートを判定する操作は、少なくとも部分的に、340の操作を含むことができる。
【0124】
ベースコーリングテンプレートを判定した後、シーケンスランにおけるフローセル画像、例えば、k回のサイクルに続く1回以上のサイクルにおけるフローセルデバイスの第2の複数のフローセル画像を位置合わせするように構成することができる。
【0125】
いくつかの態様において、方法600は、第1の挿入配列の1回以上のシーケンシング反応サイクルを行い、それによって第2の複数のフローセル画像を生成する操作を更に含むことができる。少なくとも2つの異なる試料を有する態様では、本方法は、シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行い、それによって第2の複数のフローセル画像を生成する操作を更に含むことができる。
【0126】
第2の複数のフローセル画像は、k-mer配列におけるシーケンシング反応を行うことに対応するk回のサイクルに続く1回以上のサイクルで生成され得る。第2の複数のフローセル画像は、そのような1回以上のサイクルにおいて支持体上に固定化された複数の核酸テンプレート分子間のアンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含み得る。1回以上のサイクルは、k-mer配列を含まないテンプレート分子の部分のシーケンシング反応に対応することができる。例えば、1回以上のサイクルは、任意選択の第2の試料インデックス配列又は挿入配列の少なくとも一部に対応し得る。
【0127】
複数の核酸テンプレート分子間のアンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基が、(2)塩基の総数に対する(1)1つ以上の種類のヌクレオチド塩基の数のパーセンテージが、1回以上のサイクルにおいて20%、15%、10%、又は5%未満であることを含み得る。例えば、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子中の全てのヌクレオチド塩基の総数の約5%であるヌクレオチド塩基Aの数を含む。別の例として、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子間の全てのヌクレオチド塩基の総数の約8%であるヌクレオチド塩基C及び約1%であるヌクレオチド塩基Tの数を含む。
【0128】
単一のシーケンシングラン中に、ベースコーリング位置、すなわち、ポロニー又はクラスタは、異なるサイクル及び/又はクロスチャネルから得られたフローセル画像内でシフト、回転、又はそうでなければ空間的に変換することができる。結果として、シーケンシングランにおけるベースコーリング位置が空間的にアラインメントされ、ベースコールが対応するポリニー又はクラスタ、テンプレート分子、及び試料に正確に割り当てられることを確実にするために、テンプレートが必要とされる。シーケンシングランの早期にテンプレートを生成し、テンプレートを生成した後のベースコーリング位置全てのシーケンシングサイクルの位置合わせを可能にすることが有利であり得る。テンプレートの早期生成はまた、有利には、後続のサイクルにおけるフローセル画像の一次分析の遅延を低減し、シーケンシングランがまだ進行中である間にリアルタイム分析を可能にすることができる。例えば、テンプレートが最初の3~5サイクルから生成される場合、一次分析は、サイクル6ではフローセル画像が取得された後にリアルタイムで実行され得、サイクル7ではシーケンシング及びイメージング操作と並行して実行され得る。サイクル6後の各サイクルの同様の分析は、その後続のシーケンシングサイクルがまだ進行中である間に実行することができる。したがって、一次分析は、シーケンシングランが完了したときではないにしても、完全にその直後であり得る。
【0129】
いくつかの態様において、方法600は、1つ以上の後続のフローサイクルからの第2の複数のフローセル画像を、ベースコーリングテンプレートに対して位置合わせ又は整列させる操作を更に含むことができる。いくつかの態様において、第2の複数のフローセル画像を位置合わせする操作は、共通座標系における第2の複数のフローセル画像におけるポロニーの座標を生成することを含むことができる。ベースコーリングテンプレートは、座標系にもある。いくつかの態様において、第2の複数のフローセル画像を位置合わせする操作は、フローセル画像のサブタイルに対応する複数の変換を利用して、フローセル画像全体の画像変換を推定することができる。フローセル画像を位置合わせする操作は、フローセル画像の画像変換の推定を提供するサブタイトルの変換を生成することを含むことができる。隣接するサブタイル内の情報は、サブタイルの各個々の変換を判定するときに使用され得る。
【0130】
いくつかの態様において、ポロニーの座標は、一次元ベクトル又はリストに保存され得る。ベクトル又はリストの各エントリは、ポロニー、その座標、及びサイクルの1つ以上のチャネルにおけるピクセル強度などの他の関連情報の一意の識別を含むことができる。
【0131】
いくつかの態様において、方法600は、位置合わせされた第2の複数のフローセル画像からのシグナルを使用して、ベースコーリングテンプレート内のベースコーリング位置において第2の複数のフローセル画像のベースコーリングを実行する操作を更に含むことができる。本明細書における一次分析におけるベースコールは、共通座標系における位置合わせされた画像強度に基づくことができる。いくつかの態様において、ベースコーリングは、テンプレート内のベースコーリング位置でのみ実行される。言い換えれば、テンプレートは、フローセル上の全ての正確なポロニー位置を識別し、ポロニーである可能性が低い他のシグナル位置を無視するポロニーマップとして機能する。本明細書に開示されるように、ベースコーリング位置は、サブピクセル位置にあり得る。
【0132】
第2の複数のフローセル画像のベースコーリングを実行する操作は、図3の操作350を少なくとも部分的に含むことができる。
【0133】
いくつかの態様において、操作610及び620を含む代わりに、方法600は、支持体上に固定化された第1の複数のライブラリ分子を受け取る操作を含み得、第1の複数のライブラリ分子の各々は、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、第1の試料インデックス配列は、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスは、第1の挿入配列の前記第1の試料源を識別する。いくつかの態様において、方法600は、支持体上に固定化された第2の複数のライブラリ分子を受け取る操作を含み得、第2の複数のライブラリ分子の各々は、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、第2の試料インデックス配列は、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスは、第2の挿入配列の第2の試料源を識別する。そのような態様では、方法600の他の操作は、依然として上記に開示されるものと同様である。
【0134】
いくつかの態様において、操作630を含む代わりに、方法600は、第1及び第2のk-mer配列の、並びにk-mer配列下流の(例えば、第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の)塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成する操作を含むことができる。そのような態様では、k-mer配列及びk-mer配列を一緒にシーケンシングした直後の第1のサイクルは、k+1回のサイクルのうちの少なくとも2又は3回のサイクルでバランスのとれた又は高多様性のヌクレオチド塩基を生成するように構成される。ベースコーリングテンプレートは、一緒にk+1回のサイクルに基づいて生成され得る。追加のサイクルは、ランダムな塩基を含んでもよいが、含む必要はない。追加のサイクルは、ユニバーサル試料インデックス配列からのものであることができる。あるいは、特定のシーケンシングの順序に基づいて、追加のサイクルは、挿入配列又はテンプレート分子の任意の他の部分からのものであることができる。そのような態様では、方法600の他の操作は、依然として上記に開示されるものと同様である。
【0135】
いくつかの態様において、操作610及び620を含む代わりに、方法600は、支持体上に固定化された第1の複数のライブラリ分子を受け取る操作を含み得、第1の複数のライブラリ分子の各々は、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、第1の試料インデックス配列は、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスは、第1の挿入配列の前記第1の試料源を識別する。そのような態様では、方法600は、支持体上に固定化された第2の複数のライブラリ分子を受け取る操作を含み得、第2の複数のライブラリ分子の各々は、第2の試料源に由来する第2の挿入配列及び第2の試料インデックス配列を含み、第2の試料インデックス配列は、第2のk-mer配列及び第2のユニバーサル試料インデックス配列を含み、第2のユニバーサル試料インデックスは、第2の挿入配列の第2の試料源を識別する。そのような態様において、操作630を含む代わりに、方法600は、第1及び第2のk-mer配列の、並びに第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成する操作を含むことができる。そのような態様では、k-mer配列及びk-mer配列を一緒にシーケンシングした直後の第1のサイクルは、k+1回のサイクルのうちの少なくとも2又は3回のサイクルでバランスのとれた又は高多様性のヌクレオチド塩基を生成するように構成され、ベースコーリングテンプレートは、k+1回のサイクルに基づいて一緒に生成され得る。追加の1サイクルは、ランダムな塩基を含んでもよいが、含む必要はない。追加のサイクルは、ユニバーサル試料インデックス配列からのものであることができる。あるいは、特定のシーケンシングの順序に基づいて、追加の1サイクルは、挿入配列又はテンプレート分子の任意の他の部分からのものであることができる。そのような態様では、方法600の他の操作は、依然として上記に開示されるものと同様である。
【0136】
いくつかの態様において、操作650は、プロセッサによって、かつ挿入配列の1回以上のシーケンシング反応サイクルを行う前に、ピクセル強度及びピクセル強度のそれぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することを含み得、ベースコーリングテンプレートは、k回のサイクルに続く1回以上のサイクルにおける支持体の第2の複数のフローセル画像を位置合わせするように構成される。そのような態様では、方法600の他の操作は、依然として上記に開示されるものと同様である。
【0137】
一重(uniplex)ライブラリ分子のための方法
上記に開示された態様では、方法600は、多重ライブラリ分子、すなわち、2つ以上の試料からのライブラリ分子に対して構成される。いくつかの態様において、方法600及びその操作は、一重ライブラリ分子、すなわち、単一の試料からのライブラリ分子に対して構成される。そのような態様において、方法は、操作620を含まない。操作610は、依然として上記に開示されるものと同様であり得る。操作は、それに応じて、第2の試料源に対応する、第2の複数のライブラリ分子、第2の挿入配列、第2のk-mer配列、又はそれらの組み合わせを除去するように調整することができる。
【0138】
いくつかの態様において、核酸テンプレート分子の各々は、第2のユニバーサル試料インデックス配列を有する第2の試料インデックス配列(例えば、図5A~5Bの540又は560)を更に含むことができる。そのような態様において、第1及び第2のユニバーサル試料インデックス配列の組み合わせは、挿入配列の試料源を一意に識別する(例えば、図5の510)。いくつかの態様において、第2の試料インデックスは、ランダム配列を欠く(例えば、図5の561又は571)。
【0139】
いくつかの態様において、第1の複数のライブラリ分子の各々は、第3のユニバーサル試料インデックス配列を有する第3の試料インデックス配列を更に含む。第1及び第3のユニバーサル試料インデックス配列の組み合わせは、第1の挿入配列の第1の試料源を一意に識別することができる。いくつかの態様において、第3の試料インデックスは、k-mer配列又はランダム配列を欠く。いくつかの態様において、第3の試料インデックスは、k-mer配列又はランダム配列を含む。第1の試料インデックス配列は、第1の挿入配列の左側、すなわち、5’末端、又は挿入配列の右側、すなわち、3’末端にあり得る。次いで、第3の試料インデックス配列は、挿入配列の反対側の末端にあり得る。
【0140】
いくつかの態様において、ライブラリ分子の各々は、1つ以上のユニバーサルアダプター配列(例えば、図5A~5Bにおける520、540)を更に含む。
【0141】
同じ試料からの異なるライブラリ分子について、各ライブラリ分子は、異なる挿入配列を有することができる。同じ試料からの異なるライブラリ分子について、各ライブラリ分子は、同一のユニバーサルインデックス配列(複数可)を有することができる。同じ試料からの異なるライブラリ分子について、各ライブラリ分子は、異なるk-mer配列を有することができる。
【0142】
挿入配列の第1の試料源は、ゲノムDNA、二本鎖cDNA、又は無細胞循環DNAであり得る。
【0143】
いくつかの態様において、核酸テンプレート分子は、対応するライブラリ分子からクローン的に増幅される。核酸テンプレート分子は、対応するライブラリ分子の1つ又は複数のクローンコピーを有し得る。
【0144】
いくつかの態様において、複数の核酸テンプレート分子の各々は、対応するライブラリ分子及び対応するスプリント分子/アダプターを含む対応するスプリント複合体(例えば、図5Bの590)からクローン的に増幅される。
【0145】
いくつかの態様において、複数の核酸テンプレート分子は、支持体上のランダムな位置に固定化される。いくつかの態様において、複数の核酸テンプレート分子は、支持体上の所定の位置に固定化されている。支持体上に固定化された複数の核酸テンプレート分子の各々は、ポロニー又はクローン化クラスタに対応し得る。支持体上の複数の固定化されたテンプレート分子の位置は、ベースコーリング位置に対応することができる。
【0146】
支持体上の核酸テンプレート分子の密度は、1mm当たり約10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり約10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~10であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~1012であり得る。支持体上の核酸テンプレート分子の密度は、1mm当たり10~10であり得る。
【0147】
核酸テンプレート分子は、シーケンシング反応サイクルが行われるときにシーケンシングされ得る。
【0148】
支持体は、1つ以上の基材を含み得る。支持体は、ガラス基材又はプラスチック基材を含み得る。支持体は、光学システムの対物レンズに最も近い透明な上部基材を含むことができる。支持体は、1つ以上のマイクロ流体チャネルを含むことができ、テンプレート分子は、マイクロ流体チャネルの表面に固定化される。いくつかの態様において、支持体は、フローセルデバイスに含まれている。
【0149】
いくつかの態様において、支持体又はその一部分(例えば、マイクロ流体チャネルの表面)は、45度以下の水接触角を有する少なくとも1つの親水性ポリマーコーティングで不動態化されている。少なくとも1つの親水性ポリマーコーティングは、ポリエチレングリコール(PEG)、ポリ(ビニルアルコール)(PVA)、ポリ(ビニルピリジン)、ポリ(ビニルピロリドン)(PVP)、ポリ(アクリル酸)(PAA)、ポリアクリルアミド、ポリ(N-イソプロピルアクリルアミド)(PNIPAM)、ポリ(メチルメタクリレート)(PMA)、ポリ(2-ヒドロキシルエチルメタクリレート)(PHEMA)、ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(POEGMA)、ポリグルタミン酸(PGA)、ポリリジン、ポリグルコシド、ストレプトアビジン、及びデキストランからなる群から選択される分子を含み得る。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも4つの分岐を有する分岐親水性ポリマー分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも1000ダルトンの分子量を有するポリマー分子を含む。
【0150】
いくつかの態様において、k-mer配列は、1、2、3、4、5つ、又はそれ以上のヌクレオチド塩基を含み得る。いくつかの態様において、k-mer配列は、A、G、C及びT/Uの少なくとも2つ又は3つのヌクレオチド塩基のランダム配列を含む。いくつかの態様において、k-mer配列は、A、G、C及びT/Uのヌクレオチド塩基のランダム配列である。
【0151】
方法600は、第1及び第2のk-mer配列のk回のシーケンシング反応サイクルを行う操作630を含むことができる。操作630は、本明細書に開示されるシーケンシングシステムによって実行され、それによって、第1の複数のフローセル画像を生成することができる。
【0152】
いくつかの態様において、操作630は、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行う前である。
【0153】
いくつかの態様において、操作630は、シーケンシングランのシーケンシングの順序に基づいている。シーケンシングの順序は、k-mer配列をシーケンシングすること、次いで第1のユニバーサル試料インデックス配列をシーケンシングすること、次いで第1の挿入配列をシーケンシングすること、を含むことができる。シーケンシングの順序は、第1のユニバーサル試料インデックス配列をシーケンシングすることと、次いでk-mer配列をシーケンシングすることと、次いで第1の挿入配列をシーケンシングすることと、を含むことができる。シーケンシングの順序は、k-mer配列をシーケンシングすることと、次いで第1の挿入配列をシーケンシングすることと、次いで第1のユニバーサル試料インデックス配列をシーケンシングすることと、を含むことができる。シーケンシングの順序は、いくつかの塩基(例えば、最初の3~8塩基)第1の挿入配列をシーケンシングすること、k-mer配列をシーケンシングすること、次いで第1のユニバーサル試料インデックス配列をシーケンシングすること、を含むことができる。シーケンシングの順序において、第3の試料インデックス配列がランダム配列を欠く場合、第3の試料インデックス配列をシーケンシングすることは、第1の試料インデックス配列をシーケンシングした後に行い得る。
【0154】
いくつかの態様において、第1の複数のフローセル画像は、各シーケンシングサイクルにおいて2、3、4、5、又は6つの異なるカラーチャネルからのものである。いくつかの態様において、第1の複数のフローセル画像は、k回のサイクル又はk+1回のシーケンシングサイクルからのものであり、各サイクルは、支持体上に固定化された複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基を含む。
【0155】
いくつかの態様において、各シーケンシング反応サイクルは、ポリメラーゼ媒介性である。k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、異なる種類のヌクレオチド塩基A、G、C及びT/Uの混合物を含む複数のヌクレオチド試薬を使用して、ヌクレオチド酸又は複数の核酸テンプレート分子のポロニーを接触させることを含むことができる。いくつかの態様において、個々のヌクレオチド試薬は、各異なる種類のヌクレオチド塩基に対応する、異なる検出可能な色ラベルを含む。
【0156】
いくつかの他の態様において、k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、ヌクレオチド酸又は複数の核酸テンプレート分子のポロニーを、複数のシーケンシングプライマー、複数のポリメラーゼ、及び異なる種類のアビダイトの混合物と接触させることを含む。混合物中の個々のアビダイトは、複数のヌクレオチドアームが付着したコアを含み、個々のアビダイトの各アームは、同じ種類のヌクレオチド塩基を含む。
【0157】
いくつかの態様において、k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、本明細書の光学システムによって、テンプレート分子に結合したヌクレオチド試薬から放出された光学カラーシグナルをイメージングすることを含む。いくつかの態様において、k-mer配列のk回のシーケンシング反応サイクルを行う操作630は、k回のサイクルの各々において、本明細書の光学システムによって、テンプレート分子に結合したヌクレオチド試薬から放出された光学カラーシグナルを含む第1の複数のフローセル画像を取得することを含む。
【0158】
第1の複数のフローセル画像は、k-mer配列におけるシーケンシング反応を行うことに対応するk回のサイクルで生成される。第1の複数のフローセル画像は、k回のサイクルにおいて支持体上に固定化された複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含み得る。
【0159】
複数の核酸テンプレート分子間のバランスのとれた多様性のA、G、C、及びT/Uのヌクレオチド塩基は、(2)1回以上のサイクルにおける塩基の総数に対する(1)各種類のヌクレオチド塩基の数のパーセンテージを含むことができる。パーセンテージは、10%、15%、又は20%を超えることができる。例えば、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子中の全てのヌクレオチド塩基の総数のそれぞれ26%、15%、27%、及び32%であるヌクレオチド塩基A、G、C、Tの数を含む。
【0160】
方法600は、第1の複数のフローセル画像のピクセルについてのピクセル強度及びピクセル強度の各々のそれぞれの色純度を判定する操作640を含むことができる。操作640は、本明細書に開示されるプロセッサによって実行され得る。ピクセル強度の各々は、ピクセルの強度及び/又はピクセルに対応するサブピクセルの1つ以上のサブピクセル強度を含むことができる。ピクセル強度の各々のそれぞれの色純度は、ピクセルの1つの色純度及び/又は対応するピクセルの1つ以上のサブピクセル強度に対応する1つ以上の色純度を含むことができる。ピクセル強度の各々のそれぞれの色純度は、1つ以上の色チャネルのそれぞれの色純度を含むことができる。
【0161】
ピクセル強度のそれぞれの色純度を判定することは、(2)他の種類のヌクレオチド塩基についてのシグナルの総量に対する、(1)特定の種類のヌクレオチド塩基に対応するシグナルの比率を判定することを含むことができる。
【0162】
ピクセル強度を判定することは、チャネル強度のセット内の各チャネル強度を判定することを含み得、各チャネルは、それぞれ異なる蛍光波長に対応する。そのような判定は、対応するピクセル又は1つ以上のサブピクセル位置におけるチャネル強度のセットの比較に基づくことができる。
【0163】
方法600は、操作640で判定されたピクセル強度及びピクセル強度のそれぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定する操作650を含むことができる。
【0164】
本明細書に開示されるように、ピクセル強度及びピクセル強度のそれぞれの色純度に基づいてベースコーリングテンプレートを判定する操作は、ピクセル又はサブピクセルの各々について、それぞれの色純度が距離閾値内の他のピクセル又はサブピクセルの色純度よりも大きいかどうかを判定することを含み得る。それぞれの色純度が、閾値距離内の他のピクセル又はサブピクセルの色純度よりも大きいとの判定に応答して、対応するピクセル又はサブピクセルの位置をベースコーリングテンプレートに追加する。それぞれの色純度が、距離閾値内の他のピクセル又はサブピクセルの色純度よりも大きくないとの判定に応答して、ベースコーリングテンプレートに変更を加えず、次のピクセルに進んで、全てのピクセル又はピクセルの少なくともサブセットが同様の判定操作を通過するまで、判定操作を繰り返す。
【0165】
テンプレートを判定した後、ベースコーリングテンプレート、又は同等の、テンプレートは、シーケンスランにおけるフローセル画像、例えば、k回のサイクルに続く1回以上のサイクルにおけるフローセルデバイスの第2の複数のフローセル画像を位置合わせするように構成される。
【0166】
単一のシーケンシングラン中に、ベースコーリング位置、すなわち、ポロニー又はクラスタは、サイクル毎に、及び/又はクロスチャネルで、シフト、回転、又はそうでなければ空間的に変換し得る。結果として、シーケンシングランにおけるベースコーリング位置が空間的にアラインメントされ、ベースコールが対応するポロニー、テンプレート分子、及び試料に正確に割り当てられることを確実にするために、テンプレートが必要とされる。テンプレートを早期に生成し、後続のサイクルにおけるベースコーリング位置の位置合わせを可能にすることが有利であり得る。テンプレートの早期生成はまた、有利には、後続のサイクルにおけるフローセル画像の一次分析の遅延を低減し、シーケンシングランがまだ実行中である間にリアルタイム一次分析を可能にすることができる。例えば、テンプレートが最初の3~5回のサイクルを使用して生成される場合、一次分析は、サイクル6では、サイクル中のフローセル画像が取得された後にリアルタイムで実行され得、サイクル7では、シーケンシング及びイメージング操作と並行して実行され得る。各サイクルの同様の分析をそれに応じて実行することができる。したがって、一次分析は、シーケンシングランが完了したときではないにしても、その直後に完了され得る。
【0167】
いくつかの態様において、方法600は、第1の挿入配列の1回以上のシーケンシング反応サイクルを行い、それによって第2の複数のフローセル画像を生成する操作を更に含むことができる。少なくとも2つの異なる試料を有する態様では、本方法は、シーケンシングシステムによって、第1及び第2の挿入配列の1回以上のシーケンシング反応サイクルを行い、それによって第2の複数のフローセル画像を生成する操作を更に含むことができる。
【0168】
第2の複数のフローセル画像は、k-mer配列におけるシーケンシング反応を行うことに対応するk回のサイクルに続く1回以上のサイクルで生成される。第2の複数のフローセル画像は、そのような1回以上のサイクルにおいて支持体上に固定化された複数の核酸テンプレート分子間のアンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基に結合したヌクレオチド試薬から放出された光シグナルを含み得る。1回以上のサイクルは、k-mer配列を含まないテンプレート分子の部分のシーケンシング反応に対応することができる。例えば、1回以上のサイクルは、任意選択の第2の試料インデックス配列又は挿入配列の少なくとも一部に対応し得る。
【0169】
複数の核酸テンプレート分子間のアンバランスな多様性のA、G、C、及びT/Uのヌクレオチド塩基は、(2)塩基の総数に対する、(1)1つ以上の種類のヌクレオチド塩基の数のパーセンテージを含むことができる。パーセンテージは、1回以上のサイクルにおいて、20%、15%、10%、又は5%未満であり得る。例えば、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子中の全てのヌクレオチド塩基の総数の約5%であるヌクレオチド塩基Aの数を含む。別の例として、アンバランスな多様性のヌクレオチド塩基は、サイクルのテンプレート分子間の全てのヌクレオチド塩基の総数の約8%であるヌクレオチド塩基C及び約1%であるヌクレオチド塩基Tの数を含む。
【0170】
いくつかの態様において、方法600は、1つ以上の後続のフローサイクルからの第2の複数のフローセル画像を、ベースコーリングテンプレートに対して位置合わせ又は整列させる操作を更に含むことができる。いくつかの態様において、第2の複数のフローセル画像を位置合わせする操作は、共通座標系における第2の複数のフローセル画像におけるポロニーの座標を生成することを含むことができる。ベースコーリングテンプレートは、座標系にもある。いくつかの態様において、ポロニーの座標は、一次元ベクトル又はリストに保存され得る。ベクトル又はリストの各エントリは、ポロニー、その座標、及びサイクルの1つ以上のチャネルにおけるピクセル強度などの他の関連情報の一意の識別を含むことができる。
【0171】
いくつかの態様において、方法600は、位置合わせされた第2の複数のフローセル画像からのシグナルを使用して、ベースコーリングテンプレート内のベースコーリング位置において第2の複数のフローセル画像のベースコーリングを実行する操作を更に含むことができる。本明細書における一次分析におけるベースコールは、共通座標系における位置合わせされた画像強度に基づくことができる。いくつかの態様において、ベースコーリングは、テンプレート内のベースコーリング位置でのみ実行される。言い換えれば、テンプレートは、フローセル上の全ての正確なポロニー位置を識別し、ポロニーである可能性が低い他のシグナル位置を無視するポロニーマップとして機能する。本明細書に開示されるように、ベースコーリング位置は、サブピクセル位置にあり得る。
【0172】
いくつかの態様において、操作610及び620を含む代わりに、方法600は、支持体上に固定化された第1の複数のライブラリ分子を受け取る操作を含み得、第1の複数のライブラリ分子の各々は、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、第1の試料インデックス配列は、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスは、第1の挿入配列の前記第1の試料源を識別する。そのような態様では、方法600の他の操作は、一重ライブラリ分子に関して、依然として上記に開示されるものと同様である。
【0173】
いくつかの態様において、操作630を含む代わりに、方法600は、第1及び第2のk-mer配列の、並びにk-mer配列下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成する操作を含むことができる。そのような態様では、k-mer配列及びk-mer配列を一緒にシーケンシングした直後の第1のサイクルは、k+1回のサイクルのうちの少なくとも2又は3回のサイクルでバランスのとれた又は高多様性のヌクレオチド塩基を生成するように構成され、ベースコーリングテンプレートは、k+1回のサイクルに基づいて一緒に生成され得る。追加の1サイクルは、ランダムな塩基を含んでもよいが、含む必要はない。追加の1サイクルは、ユニバーサル試料インデックス配列からのものであることができる。あるいは、特定のシーケンシングの順序に基づいて、追加の1サイクルは、挿入配列又はテンプレート分子の任意の他の部分からのものであることができる。そのような態様では、方法600の他の操作は、一重ライブラリ分子に関して、依然として上記に開示されるものと同様である。
【0174】
いくつかの態様において、操作610及び620を含む代わりに、方法600は、支持体上に固定化された第1の複数のライブラリ分子を受け取る操作を含み得、第1の複数のライブラリ分子の各々は、第1の試料源に由来する第1の挿入配列及び第1の試料インデックス配列を含み、第1の試料インデックス配列は、第1のk-mer配列及び第1のユニバーサル試料インデックス配列を含み、第1のユニバーサル試料インデックスは、第1の挿入配列の前記第1の試料源を識別する。そのような態様では、操作630を含む代わりに、方法600は、第1及び第2のk-mer配列の、並びにk-mer配列の下流の塩基位置の、k+1回のシーケンシング反応サイクルを行い、それによって、第1の複数のフローセル画像を生成する操作を含むことができる。そのような態様では、k-mer配列及びk-mer配列を一緒にシーケンシングした直後の第1のサイクルは、k+1回のサイクルのうちの少なくとも2又は3回のサイクルでバランスのとれた又は高多様性のヌクレオチド塩基を生成するように構成され、ベースコーリングテンプレートは、k+1回のサイクルに基づいて一緒に生成され得る。追加の1サイクルは、ランダムな塩基を含んでもよいが、含む必要はない。追加の1サイクルは、ユニバーサル試料インデックス配列からのものであることができる。あるいは、特定のシーケンシングの順序に基づいて、追加の1サイクルは、挿入配列又はテンプレート分子の任意の他の部分からのものであることができる。そのような態様では、方法600の他の操作は、依然として上記に開示されるものと同様である。
【0175】
いくつかの態様において、操作650は、プロセッサによって、かつ挿入配列の1回以上のシーケンシング反応サイクルを行う前に、ピクセル強度及びピクセル強度のそれぞれの色純度に基づいて、ベースコーリング位置を含むベースコーリングテンプレートを判定することを含み得、ベースコーリングテンプレートは、k回のサイクルに続く1回以上のサイクルにおける支持体の第2の複数のフローセル画像を位置合わせするように構成される。そのような態様では、方法600の他の操作は、一重ライブラリ分子に関して、依然として上記に開示されるものと同様である。
【0176】
アンバランスな多様性を有するテンプレート分子をシーケンシングするための方法
一般に、支持体(例えば、コーティングされたフローセル)上に分布させる核酸ライブラリを調製することが望ましく、ライブラリ分子は、超並列シーケンシングのために、支持体に高密度に固定化されたテンプレート分子に変換される。高密度で、例えば、支持体上のランダムな位置で固定化されたテンプレート分子について、シーケンシングラン中の正確なベースコーリングのために高密度蛍光画像を分解することは、困難になる可能性がある。本明細書に開示される方法は、相対的に高密度のポロニー又はクラスタ、例えば、1mm当たり10~1012のテンプレート分子又はポロニー、のベースコーリングを可能にする。
【0177】
固定化されたテンプレート分子の集団のヌクレオチド多様性は、シーケンシングサイクルに存在するヌクレオチドA、G、C、及びT/Uの相対的な割合を指すことができる。高多様性ライブラリは、概して、シーケンシングランの各サイクルにおいて表される4つのヌクレオチド全てがほぼ等しい割合である目的の配列(挿入)領域を含むことができる。低多様性ライブラリは、概して、ある特定のヌクレオチドの割合が高く、かつ他のヌクレオチドの割合が低い目的の配列(挿入)領域を含むことができる。低多様性ライブラリの問題を克服するために、PhiXバクテリオファージから調製された少量の高多様性ライブラリは、典型的には、目的のライブラリ(例えば、PhiXスパイクインライブラリ)と混合され、同じフローセル上で一緒にシーケンシングされる。PhiXライブラリスパイクインライブラリは、ヌクレオチド多様性を提供することができるが、それはまた、フローセル上の空間を占有し、それによって、目的の配列を保有する標的ライブラリを置き換え、標的ライブラリから得られるシーケンシングデータの量を低減し(例えば、シーケンシングスループットを低減する)。低多様性ライブラリの問題を克服する別の方法は、カラーバランスがとれているように設計され、したがって高い多様性を有する少なくとも1つの試料インデックス配列を有する標的ライブラリ分子を調製することであり得る。しかしながら、多数の試料インデックスセット、例えば、16-plex、24-plex、96-plex、又はより大きなplexyレベルのための単一のインデックス試料配列又は対のインデックス試料配列のセットを設計することが望ましい場合がある。全ての試料インデックス配列がカラーバランスがとれた大規模な試料インデックスセットの試料インデックス配列を単一の又は対の試料インデックスとして設計することは困難であり得る。
【0178】
低多様性ライブラリ分子を(例えば、支持体上の高密度で)シーケンシングするという課題を克服する別の方法は、ユニバーサル試料インデックス配列に直接結合した短いk-mer配列(例えば、NNN)を含む少なくとも1つの試料インデックス配列を有するライブラリを調製することであり、k-mer配列は、ヌクレオチド多様性及び色バランスを提供する。試料インデックス付きライブラリ分子の集団では、試料インデックスのk-mer配列は、シーケンシングランの各サイクルにおいて表される4つのヌクレオチド(例えば、A、G、C、T、及び/又はU)全てがほぼ等しい割合である高いヌクレオチド多様性を提供する。k-mer配列の高いヌクレオチド多様性はまた、シーケンシングランの各サイクル中に色バランスを提供する。k-mer配列(例えば、NNN)を含むように試料インデックスを設計する利点は、ライブラリ分子の低プレキシ集団(例えば、2-plex又は4-plex)において、2つ又は4つの異なる試料を識別するユニバーサル試料インデックス配列がヌクレオチド多様性を示す必要がないことである。加えて、k-mer配列(例えば、NNN)のヌクレオチド多様性は、PhiXスパイクインライブラリを含む必要性を排除することができるか、又はフローセル上に分布され、シーケンシングされるPhiXスパイクインライブラリの使用量を低減することができる。
【0179】
標的ライブラリ分子は、k-mer配列(例えば、試料インデックス)及びユニバーサル試料インデックス配列を含む単一の試料インデックス配列を含むことができる。図5は、k-mer配列及び第2の任意選択のk-mer配列(571)(561)を含む例示的な線形ライブラリ分子(500)を示す。例示的な線形ライブラリ分子(500)はまた、ユニバーサル試料インデックス配列及び任意選択の第2のユニバーサル試料インデックス配列(570)(560)を含むことができる。いくつかの態様において、単一の試料インデックス配列(例えば、図5の570又は560)のみからのシーケンシングデータは、k-mer配列(例えば、NNN)が十分なヌクレオチド多様性及び色バランスを提供するので、ポロニーマッピング及びベースコーリングテンプレートの位置合わせのために使用される。ユニバーサル試料インデックス配列からのシーケンシングデータは、マルチプレックスアッセイにおいて、異なる試料源から得られる目的の配列を区別するために使用され得る。
【0180】
標的ライブラリ分子は、第2のユニバーサル試料インデックス配列を含む第2の試料インデックス配列(例えば、二重試料インデックス)を更に含むことができる。いくつかの態様において、k-mer配列が十分なヌクレオチド多様性及び色バランスを提供するので、また、ポロニーマッピング及び/又はベースコーリングテンプレートの位置合わせが、後続のサイクルにおいてベースコーリングテンプレートを提供するために、シーケンスランのより早期のシーケンシングサイクルにおいて好ましいため、単一の試料インデックス配列のみからのシーケンシングデータは、ポロニーマッピング及び/又はベースコーリングテンプレートの位置合わせのために使用される。第1のユニバーサル試料インデックス配列及び第2のユニバーサル試料インデックス配列からのシーケンシングデータは、マルチプレックスアッセイにおいて、異なる試料源から得られる目的の配列を区別するために、二重試料インデックスとして使用され得る。いくつかの態様において、第2の試料インデックス配列(例えば、第2のk-mer配列(例えば、NNN)を含み得るか、又は含み得ない。
【0181】
また、配列領域及び試料インデックス領域(複数可)をシーケンシングする順序は、低多様性ライブラリ分子のシーケンシングの課題を改善するために使用され得る。例えば、試料インデックス領域は、目的の配列領域をシーケンシングする前に最初にシーケンシングされ得、試料インデックス配列は、目的の配列領域と会合され得る。例えば、試料インデックス領域は、最初に、k-mer配列(例えば、NNN)をシーケンシングすること、及び任意選択でユニバーサル試料インデックスの少なくとも一部分をシーケンシングすること)、次いで目的の配列領域をシーケンシングすることを含んで、シーケンシングされ得る。試料インデックス付きライブラリ分子の集団において、k-mer配列(例えば、NNN)は、ライブラリ分子の目的の配列領域を提供し得ないヌクレオチド多様性を提供する。試料インデックスの配列は、ポロニーマッピング及びテンプレートの位置合わせのための改善されたヌクレオチド多様性及び色バランスを提供する。
【0182】
加えて、最初に試料インデックス領域をシーケンシングする場合、シーケンシングされた試料インデックス領域の長さは、シーケンシングされた試料インデックス領域の生成物の脱ハイブリダイゼーションがより完全であるように、比較的短い(例えば、長さが30ヌクレオチド未満)。穏やかな脱ハイブリダイゼーション条件を使用して、テンプレート分子にハイブリダイズされたままの任意のシーケンシング生成物からの残留シグナルのレベルを低減する、シーケンシングされた試料インデックス領域の生成物の大部分又は全てを除去することができる。対照的に、目的の配列領域は、典型的には、試料インデックス領域よりもはるかに長い(例えば、長さが100ヌクレオチドを超える)。目的の配列領域が試料インデックス領域の前にシーケンシングされる場合、シーケンシングされた目的の配列領域の生成物は、テンプレート分子にハイブリダイズしたままの生成物を除去するために、テンプレート分子を損傷する可能性があるより厳しい脱ハイブリダイゼーション条件に供されなければならない。
【0183】
本開示は、各々が、マルチプレックスアッセイにおいて異なる試料源から得られた目的の配列を区別するために使用することができる少なくとも1つの試料インデックス配列を含む核酸ライブラリ分子(500)を提供し、少なくとも1つの試料インデックス配列は、ユニバーサル試料インデックス配列に連結されたk-mer配列(例えば、NNN)を含む。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列に連結したk-mer配列(例えば、NNN)を含み、かつ/又は右の試料インデックスは、右のユニバーサル試料インデックス配列に連結したk-mer配列(例えば、NNN)を含む。少なくとも1つの試料インデックス配列は、改善されたベースコーリングのための配列多様性を含むことができる。少なくとも1つの試料インデックス配列は、ベースコーリング精度を改善するために使用され得る。
【0184】
いくつかの態様において、k-mer配列(例えば、NNN)は、ユニバーサル試料インデックス配列の上流に配置され、その結果、シーケンシングラン中、k-mer配列部分は、ユニバーサル試料インデックス配列の前にシーケンシングされる。ユニバーサル試料インデックス配列の上流は、シーケンシング又は読み取り順序に応じて、ユニバーサル試料インデックス配列の左側又は右側のいずれかにあってもよい。言い換えれば、ユニバーサル試料インデックス配列の上流は、ユニバーサル試料インデックス配列のシーケンシングが‘5末端からであるか‘3末端からであるかに応じて、ユニバーサル試料インデックス配列の左側又は右側のいずれかにあってもよい。いくつかの態様において、k-mer配列は、シーケンシングラン中にk-mer部分がユニバーサル試料インデックス配列の後にシーケンシングされるように、ユニバーサル試料インデックス配列の下流に配置される。ユニバーサル試料インデックス配列の下流は、シーケンシング又は読み取り順序に応じて、ユニバーサル試料インデックス配列の右側又は左側のいずれかにあってもよい。言い換えれば、ユニバーサル試料インデックス配列の下流は、ユニバーサル試料インデックス配列のシーケンシングが‘5末端からであるか‘3末端からであるかに応じて、ユニバーサル試料インデックス配列の右側又は左側のいずれかにあってもよい。図5に示されるように、例示的な態様において、ユニバーサル試料インデックス配列570の読み取り又はシーケンシングが’5末端から3‘末端へであるとき、ユニバーサル試料インデックス配列570の上流は、インデックス配列の左側にある。同じ態様において、第2のユニバーサル試料インデックス配列560の第2の読み取り又はシーケンシングが‘5末端から3‘末端へであるとき、第2のユニバーサル試料インデックス配列560の上流は、その右手側にある。
【0185】
いくつかの態様において、k-mer配列において、1つ以上の塩基は、A、G、C、T、又はUから独立してかつランダムに選択される。いくつかの態様において、k-mer配列において、1つ以上の塩基は、A、G、C、T、又はUから独立してかつランダムに選択され、その結果、k-mer配列は、2つ又は3つの同じヌクレオチド塩基、例えば、AA、TT、CC、GG、UU、AAA、TTT、CCC、GGG、又はUUUを有する連続したリピート配列を欠く。いくつかの態様において、ライブラリ分子の集団において、ユニバーサル試料インデックス配列は、シーケンシングランの各サイクルにおいて表される4つのヌクレオチド(例えば、A、G、C、T、及び/又はU)全てがほぼ等しい割合である高多様性配列を有するk-mer配列を含む。
【0186】
いくつかの態様において、k-mer配列は、1~20個のヌクレオチド、又は1~10個のヌクレオチド、又は2~8個のヌクレオチド、又は3~6個のヌクレオチド、又は3~5個のヌクレオチド、又は3~4個のヌクレオチドを含む。
【0187】
いくつかの態様において、k-mer配列は、AGC、AGT、GAC、GAT、CAT、CAG、TAG、TACを含むが、これらに限定されない。k-mer配列内の所与の位置における各塩基「N」が、A、G、C、T又はUから独立して選択される、より多くのランダム配列が調製され得る(例えば、64個の可能な組み合わせ)ことが、当業者には認識されよう。
【0188】
いくつかの態様において、ユニバーサル試料インデックス配列は、3~20個のヌクレオチド、又は7~18個のヌクレオチド、又は9~16個のヌクレオチドを含む。
【0189】
いくつかの態様において、k-mer配列は、1つ以上のランダムなヌクレオチド塩基を含む。いくつかの態様において、kは、0よりも大きく、10よりも小さい整数である。いくつかの態様において、kは3であり、k-mer配列はNNNであり、各「N」は、A、G、C、T、及びUからランダムかつ独立して選択される塩基を表す。いくつかの態様において、kは、1、2、3、4、又は5である。いくつかの態様において、kは3であり、k-mer配列は、少なくとも2つのランダムなヌクレオチド塩基を含む。いくつかの態様において、kは4であり、k-mer配列は、少なくとも2つ又は3つのランダムなヌクレオチド塩基を含む。
【0190】
いくつかの態様において、高多様性ヌクレオチド塩基を提供し、本明細書に開示されるポロニーマップ又はベースコーリングテンプレートを生成するために、k-mer配列(例えば、571又は561)は、k-mer配列に隣接するユニバーサル試料インデックス配列からの1つ以上の塩基と組み合わせられる。本明細書に開示される「ポロニーマップ」は、共通座標系内にベースコーリング位置を含む「ベースコーリングテンプレート」と同等であり得る。
【0191】
いくつかの態様において、右の試料インデックス配列の集団における個々の右の試料インデックス配列は、ユニバーサル試料インデックス配列(例えば、図5の570)及びk-mer配列(例えば、図5の571)を含む。いくつかの態様において、右の試料インデックス配列の集団におけるk-mer配列は、k-mer配列のシーケンシング中の各シーケンシングサイクルにおいてヌクレオチド多様性を提供するために、4つ全てのヌクレオチド塩基(例えば、A、G、C及びT/U)の約25%又は約15~35%の全体的な塩基組成を有する。
【0192】
いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列内の任意の所与の位置におけるアデニン(A)の割合は、約20~30%又は約15~35%又は約10~40%である。いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列内の任意の所与の位置におけるグアニン(G)の割合は、約20~30%又は約15~35%又は約10~40%である。いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列における任意の所与の位置におけるシトシン(C)の割合は、約20~30%又は約15~35%又は約10~40%である。いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列内の任意の所与の位置におけるチミン(T)又はウラシル(U)の割合は、約20~30%又は約15~35%又は約10~40%である。
【0193】
いくつかの態様において、右の試料インデックス配列の集団において、アデニン(A)及びチミン(T)の割合、又はアデニン(A)及びウラシル(U)の割合は、k-mer配列における任意の所与の位置で約10~65%である。いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列内の任意の所与の位置におけるグアニン(G)及びシトシン(C)の割合は、約10~65%である。
【0194】
いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列の配列多様性は、少なくともk-mer配列のシーケンシング中に、4つ未満の異なるヌクレオチド塩基を含むシーケンシングサイクルが提示されないことを確実にする。いくつかの態様において、右の試料インデックス配列の集団において、k-mer配列の配列多様性は、少なくともk-mer配列のシーケンシング中に、3つ未満の異なるヌクレオチド塩基を含むシーケンシングサイクルが提示されないことを確実にする。
【0195】
本明細書に開示されるように、「アンバランスな多様性」は、「低多様性」と同義的に使用され、「バランスのとれた多様性」は、「高多様性」と同義的に使用される。
【0196】
ユニバーサル試料インデックス配列に直接連結されたk-mer配列を含む例示的な試料インデックス配列は、NNNGTAGGAGCC(配列番号97)、NNNCCGCTGCTA(配列番号98)、NNNAACAACAAG(配列番号99)、NNNGGTGGTCTA(配列番号100)、NNNTTGGCCAAC(配列番号101)、NNNCAGGAGTGC(配列番号105)、及びNNNATCACACTA(配列番号106)を含むが、これらに限定されない。当業者は、ユニバーサル試料インデックスが任意の長さであり得、マルチプレックスアッセイにおいて異なる試料源から得られた目的の配列を区別するために使用され得る任意の配列を有することを認識するであろう。所与の試料インデックス、例えば、NNNGTAGGAGCC(配列番号97)の集団において、この集団は、各々が同じユニバーサル試料インデックス配列(例えば、GTAGGAGCC)及び異なるk-mer配列(例えば、NNN)を有する個々の試料インデックス分子の混合物を含み、最大64個の異なるk-mer配列が、所与の試料インデックスの集団内に存在し得る。
【0197】
いくつかの態様において、k-mer配列(例えば、NNN又はNNNN)は、ヌクレオ塩基アデニン、シトシン、グアニン、チミン、及び/又はウラシルのバランスのとれた比率を提供する。いくつかの態様において、試料インデックス付きライブラリ分子の集団において、k-mer配列は、ユニバーサル試料インデックス配列の少なくとも一部分とともに、シーケンシングランの各サイクルにおいて表されるヌクレオ塩基アデニン、シトシン、グアニン、チミン及び/又はウラシルのバランスのとれた比率を提供する。いくつかの態様において、試料インデックス付きライブラリ分子の集団において、k-mer配列は、ユニバーサル試料インデックス配列の1、2、3つ、又はそれ以上の塩基とともに、シーケンシングランの各サイクルにおいて表されるヌクレオチド塩基のアデニン、シトシン、グアニン、チミン、及び/又はウラシルのバランスのとれた比率を提供する。
【0198】
いくつかの態様において、シーケンシング反応は、ヌクレオ塩基に対応する異なるフルオロフォアで標識されたポリメラーゼ及びヌクレオチド(例えば、ヌクレオチド類似体)の使用を含む。いくつかの態様において、標識されたヌクレオチドを使用してk-mer配列(例えば、NNN)をシーケンシングすることは、シーケンシングランの各サイクルにおいて、ヌクレオ塩基アデニン、シトシン、グアニン、チミン、及び/又はウラシルに対応する蛍光色のバランスのとれた比率を提供する。いくつかの態様において、標識されたヌクレオチドを使用してk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の少なくとも一部分をシーケンシングすることは、ヌクレオ塩基アデニン、シトシン、グアニン、チミン及び/又はウラシルに対応する蛍光色のバランスのとれた比率を提供する。標識されたヌクレオチドは、シーケンシング反応中に蛍光シグナルを放出する。
【0199】
いくつかの態様において、シーケンシング反応は、本明細書に開示されるシーケンシングシステム(例えば、図1の110)上で行われる。シーケンシングシステムは、固定化されたテンプレート分子上のシーケンシング反応から蛍光画像をキャプチャする光学システムを有することができる。シーケンシングシステムは、光学システムによってキャプチャされた蛍光イメージングデータを、本明細書に開示されるプロセッサ(例えば、図4の400)に中継するように構成され得る。プロセッサは、フローセル上の固定化されたテンプレート分子の位置(例えば、マッピング)を判定するために、本明細書に開示される1つ以上の動作を実行するようにプログラムすることができる。フローセル上の固定化されたテンプレート分子の位置(例えば、マッピング)は、本明細書におけるベースコーリング位置と同等であり得る。プロセッサは、k-mer配列(例えば、NNN)のみの蛍光イメージングデータに基づいて、又はk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の少なくとも一部分に基づいて、固定化されたテンプレート分子のベースコーリング位置のテンプレートを生成することができる。したがって、k-mer配列(例えば、NNN)及び任意選択でユニバーサル試料インデックス配列の一部分をシーケンシングするために使用される数少ないシーケンシングサイクルを使用して、フローセル上のベースコーリング位置のテンプレートと同等である固定化されたテンプレート分子の位置のマップを生成することができる。プロセッサは、k-mer配列(例えば、NNN)のみ、又はk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の少なくとも一部分の蛍光色及び強度を抽出するように構成することができる。プロセッサは、所与の固定化されたテンプレート分子の位置、並びに所与のテンプレート分子に関連付けられた蛍光色及び強度(k-mer配列をシーケンシングしている間に確立された)を、挿入領域をシーケンシングしながらベースコーリングのために使用するように構成することができる。プロセッサは、k-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列、並びに挿入領域をシーケンシングしながら、フェージング及び事前フェージングを検出するように構成され得る。いくつかの態様において、各シーケンシングサイクルにおいてk-mer配列(例えば、NNN)によって提供される蛍光色のバランスのとれた比率は、光学システムによってキャプチャされた蛍光画像から処理されるデータの質を改善することができ、次いで、プロセッサによるフローセル上の固定化されたテンプレート分子の位置、並びに色及び強度を判定する能力を改善することができ、これらの全ては、シーケンシングされた挿入領域のベースコーリング精度及び品質スコアを改善することができる。
【0200】
いくつかの態様において、シーケンシング反応は、所与の多価分子中のヌクレオチドアームに付着するヌクレオチド単位のヌクレオ塩基(例えば、アデニン、グアニン、シトシン、チミン、又はウラシル)に対応する異なるフルオロフォアで標識されたポリメラーゼ及び多価分子の使用を含む。いくつかの態様において、個々の多価分子のコアは、所与の多価分子中のヌクレオチドアームに付着するヌクレオチド単位(例えば、アデニン、グアニン、シトシン、チミン、又はウラシル)に対応するフルオロフォアに付着する。いくつかの態様において、多価分子のヌクレオチドアームの少なくとも1つは、フルオロフォアに結合するリンカー及び/又はヌクレオチド塩基を含み、所与のリンカー又はヌクレオチド塩基に付着するフルオロフォアは、ヌクレオチドアームのヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、チミン、又はウラシル)に対応する。いくつかの態様において、標識された多価分子を使用してk-mer配列(例えば、NNN)をシーケンシングすることは、シーケンシングランの各サイクルにおいて、ヌクレオ塩基アデニン、シトシン、グアニン、チミン、及び/又はウラシルに対応する蛍光色のバランスのとれた比率を提供する。いくつかの態様において、標識された多価分子を使用してk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の少なくとも一部分をシーケンシングすることは、ヌクレオ塩基アデニン、シトシン、グアニン、チミン及び/又はウラシルに対応する蛍光色のバランスのとれた比率を提供する。標識された多価分子は、シーケンシング反応中に蛍光シグナルを放出する。
【0201】
いくつかの態様において、シーケンシング反応は、固定化されたテンプレート分子上のシーケンシング反応から蛍光画像をキャプチャする光学システムを有するシーケンシングシステム(例えば、図1の110)上で行われる。シーケンシング装置は、検出器によってキャプチャされた蛍光イメージングデータを、フローセル上のベースコーリング位置と同等の固定化されたテンプレート分子(ポロニー)の位置を判定する(例えば、マッピング)ようにプログラムされたプロセッサ(例えば、図4の400)に中継するように構成され得る。プロセッサは、k-mer配列(例えば、NNN)のみの蛍光イメージングデータに基づいて、又はk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の少なくとも一部分に基づいて、固定化されたテンプレート分子の位置のマップを生成することができる。したがって、k-mer配列(例えば、NNN)及び任意選択でユニバーサル試料インデックス配列の一部分をシーケンシングするために使用される数少ないシーケンシングサイクルを使用して、固定化されたテンプレート分子の位置のマップを生成することができる。プロセッサは、k-mer配列(例えば、NNN)のみ、又はk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列の蛍光色及び強度を抽出するように構成することができる。プロセッサは、所与の固定化されたテンプレート分子の位置、並びに所与のテンプレート分子に関連付けられた蛍光色及び強度(k-mer配列をシーケンシングしている間に確立された)を、挿入領域をシーケンシングしながらベースコーリングのために使用するように構成することができる。プロセッサは、k-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列、並びに挿入領域をシーケンシングしながら、フェージング及び事前フェージングを検出するように構成され得る。いくつかの態様において、各シーケンシングサイクルにおいてk-mer配列(例えば、NNN)によって提供される蛍光色のバランスのとれた比率は、検出器によってキャプチャされた蛍光画像から処理されるデータの質を改善することができ、次いで、プロセッサによるフローセル上の固定化されたテンプレート分子の位置、並びに色及び強度を判定する能力を改善することができ、これらの全ては、シーケンシングされた挿入領域のベースコーリング精度及び品質スコアを改善することができる。
【0202】
シーケンシングの順序
いくつかの態様において、複数サイクルのシーケンシング反応を行う順序は、(1)右のインデックスが第1のk-mer配列(例えば、図5の571)及び右のユニバーサル試料インデックス配列(例えば、図5の570)を含む右の試料インデックスをシーケンシングすること、(2)左の試料インデックスをシーケンシングすること、及び(3)挿入領域(510)をシーケンシングすることを含む。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列(例えば、図5の560)を含む。いくつかの態様において、左の試料インデックスは、第2のk-mer配列(例えば、図5の561)及び左のユニバーサル試料インデックス配列を含む。いくつかの態様において、第1のk-mer配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックス領域をシーケンシングすることは、左の試料インデックスをシーケンシングすることを省略してもよいように、ベースコーリングテンプレートを生成する目的のために十分なヌクレオチド多様性を提供し得る。
【0203】
いくつかの態様において、支持体に固定化されたテンプレート分子に対応する複数のサイクルにわたってシーケンシング反応を行うための方法であって、個々のテンプレート分子(例えば、図5の500)は、(i)第1の表面プライマーのためのユニバーサル結合配列(520)、(ii)左のユニバーサル試料インデックス配列(560)を有する左の試料インデックス配列、(iii)フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)、(iv)目的の配列(510)、(v)リバースシーケンシングプライマーのためのユニバーサル結合配列(550)、(vi)右のユニバーサル試料インデックス配列(560)に直接連結されたk-mer配列(例えば、NNN)(571)を有する右の試料インデックス配列(vii)第2の表面プライマーのためのユニバーサル結合配列(130)を含む。方法は、ステップ(a):テンプレート分子を、リバースシーケンシングプライマーのためのユニバーサル結合配列にハイブリダイズする第1の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、k-mer配列(例えば、NNN)及び右のユニバーサル試料インデックス配列をシーケンシングすることを含む右試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第1の複数の試料インデックス伸長生成物を生成することを含む。第1の複数の試料インデックス伸長生成物は、右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に相補的である。
【0204】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):第1の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0205】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):保持された固定化されたテンプレート分子を、第1の表面プライマーのためのユニバーサル結合配列(520)にハイブリダイズする第2の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、左の試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を生成することを更に含む。第2の複数の試料インデックス伸長生成物は、左の試料インデックス配列を有する左の試料インデックス配列に相補的である。
【0206】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):第2の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0207】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):保持された固定化されたテンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第3の複数の可溶性シーケンシングプライマーとハイブリダイズし、挿入領域(510)をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の挿入伸長生成物を生成することを更に含む。複数の挿入伸長生成物は、目的の配列(510)に相補的である。
【0208】
いくつかの態様において、シーケンシングのための方法は、ステップ(f1):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0209】
いくつかの態様において、シーケンシングのための方法は、ステップ(f2):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列及び(iii)左の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0210】
いくつかの態様において、ステップ(b)及び(d)の複数のシーケンシング伸長生成物の除去は、例えば、50~90℃などの核酸変性を促進する温度で、ホルムアミドの有無にかかわらず、SSC(例えば、生理食塩水-クエン酸ナトリウム)緩衝液を含む変性試薬を使用して行うことができる。
【0211】
いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ及び検出可能に標識されたヌクレオチド類似体を用いる、本明細書に記載されるシーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ、検出可能に標識された多価分子、及びヌクレオチド類似体を用いる、本明細書に記載される2段階シーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、本明細書に記載される結合によるシーケンシング方法のうちのいずれかを行うことを含む。
【0212】
いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、複数のテンプレート分子は、支持体上のランダムな位置で固定化される。いくつかの態様において、複数のテンプレート分子は、所定のパターンで支持体上に固定化される。
【0213】
いくつかの態様において、シーケンシングの順序は、(1)右のインデックスがk-mer配列(例えば、NNN)及びユニバーサル試料インデックス配列を含む右の試料インデックスをシーケンシングすることと、(2)挿入領域をシーケンシングすることと、(3)左の試料インデックスをシーケンシングすることと、を含む。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列を含む。いくつかの態様において、左の試料インデックスは、第2のk-mer配列(例えば、NNN)及び左のユニバーサル試料インデックス配列を含む。いくつかの態様において、第1のランダム配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックス領域をシーケンシングすることは、左の試料インデックスをシーケンシングすることを省略してもよいように、本明細書のベースコーリングテンプレートを生成する目的のために十分なヌクレオチド多様性を提供し得る。
【0214】
いくつかの態様において、支持体に固定化されたテンプレート分子をシーケンシングするための方法であって、個々のテンプレート分子は、(i)第1の表面プライマーのためのユニバーサル結合配列(520)、(ii)左のユニバーサル試料インデックス配列を有する左の試料インデックス配列、(iii)フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)、(iv)目的の配列(510)、(v)リバースシーケンシングプライマーのためのユニバーサル結合配列(550)、(vi)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列(vii)第2の表面プライマーのためのユニバーサル結合配列(530)を含む。方法は、ステップ(a):テンプレート分子を、リバースシーケンシングプライマーのためのユニバーサル結合配列(550)にハイブリダイズする第1の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、k-mer配列(例えば、NNN)及び右のユニバーサル試料インデックス配列をシーケンシングすることを含む右試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第1の複数の試料インデックス伸長生成物を生成することを含む。第1の複数の試料インデックス伸長生成物は、右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に相補的である。
【0215】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):第1の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0216】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):保持された固定化されたテンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第2の複数の可溶性シーケンシングプライマーとハイブリダイズし、挿入領域(510)をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の挿入伸長生成物を生成することを更に含む。複数の挿入伸長生成物は、目的の配列(510)に相補的である。
【0217】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):複数の挿入伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0218】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):保持された固定化されたテンプレート分子を、第1の表面プライマーのためのユニバーサル結合配列(520)にハイブリダイズする第3の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、左の試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を生成することを更に含む。第2の複数の試料インデックス伸長生成物は、左の試料インデックス配列を有する左の試料インデックス配列に相補的である。
【0219】
いくつかの態様において、シーケンシングのための方法は、ステップ(f1):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0220】
いくつかの態様において、シーケンシングのための方法は、ステップ(f2):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列及び(iii)左の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0221】
いくつかの態様において、ステップ(b)及び(d)の複数のシーケンシング伸長生成物の除去は、例えば、50~90℃などの核酸変性を促進する温度で、ホルムアミドの有無にかかわらず、SSC(例えば、生理食塩水-クエン酸ナトリウム)緩衝液を含む変性試薬を使用して行うことができる。
【0222】
いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ及び検出可能に標識されたヌクレオチド類似体を用いる、本明細書に記載されるシーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ、検出可能に標識された多価分子、及びヌクレオチド類似体を用いる、本明細書に記載される2段階シーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、本明細書に記載される結合によるシーケンシング方法のうちのいずれかを行うことを含む。
【0223】
いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、複数のテンプレート分子は、支持体上のランダムな位置で固定化される。いくつかの態様において、複数のテンプレート分子は、所定のパターンで支持体上に固定化される。
【0224】
いくつかの態様において、支持体に固定化されたテンプレート分子に対応する複数のサイクルにおいてシーケンシング反応を行う順序は、(1)挿入領域(510)をシーケンシングすることと、(2)右のインデックスがランダム配列(例えば、NNN)及びユニバーサル試料インデックス配列を含む右の試料インデックスをシーケンシングすることと、(3)左の試料インデックスをシーケンシングすることと、を含む。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列を含む。いくつかの態様において、左の試料インデックスは、第2のランダム配列(例えば、NNN)及び左のユニバーサル試料インデックス配列を含む。いくつかの態様において、第1のランダム配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックス領域をシーケンシングすることは、左の試料インデックスをシーケンシングすることを省略してもよいように、ベースコーリングテンプレートを生成する目的のために十分なヌクレオチド多様性を提供し得る。
【0225】
いくつかの態様において、支持体に固定化されたテンプレート分子をシーケンシングするための方法であって、個々のテンプレート分子は、(i)第1の表面プライマーのためのユニバーサル結合配列(520)、(ii)左のユニバーサル試料インデックス配列を有する左の試料インデックス配列(iii)フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)、(iv)目的の配列(510)、(v)リバースシーケンシングプライマーのためのユニバーサル結合配列(550)、(vi)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列、及び(vii)第2の表面プライマーのためのユニバーサル結合配列(530)を含む。方法は、ステップ(a):テンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第1の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、挿入領域(510)をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の挿入伸長生成物を生成することを含む。複数の挿入伸長生成物は、目的の配列(510)に相補的である。
【0226】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):複数の挿入伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0227】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):リバースシーケンシングプライマーのためのユニバーサル結合配列(550)にハイブリダイズする第2の複数の可溶性シーケンシングプライマーとテンプレート分子をハイブリダイズさせ、k-mer配列(例えば、NNN)及び右のユニバーサル試料インデックス配列をシーケンシングすることを含む右の試料インデックス配列をシーケンシングし、それによって固定化されたテンプレート分子にハイブリダイズされた第1の複数の試料インデックス伸長生成物を生成することを更に含む。第1の複数の試料インデックス伸長生成物は、右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に相補的である。
【0228】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):第1の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0229】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):保持された固定化されたテンプレート分子を、第1の表面プライマーのためのユニバーサル結合配列(520)にハイブリダイズする第3の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、左の試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を生成することを更に含む。第2の複数の試料インデックス伸長生成物は、左の試料インデックス配列を有する左の試料インデックス配列に相補的である。
【0230】
いくつかの態様において、シーケンシングのための方法は、ステップ(f1):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0231】
いくつかの態様において、シーケンシングのための方法は、ステップ(f2):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列及び(iii)左の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0232】
いくつかの態様において、ステップ(b)及び(d)の複数のシーケンシング伸長生成物の除去は、例えば、50~90℃などの核酸変性を促進する温度で、ホルムアミドの有無にかかわらず、SSC(例えば、生理食塩水-クエン酸ナトリウム)緩衝液を含む変性試薬を使用して行うことができる。
【0233】
いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ及び検出可能に標識されたヌクレオチド類似体を用いる、本明細書に記載されるシーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、シーケンシングポリメラーゼ、検出可能に標識された多価分子、及びヌクレオチド類似体を用いる、本明細書に記載される2段階シーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、及び(e)のシーケンシングは、本明細書に記載される結合によるシーケンシング方法のうちのいずれかを行うことを含む。
【0234】
いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、複数のテンプレート分子は、支持体上のランダムな位置で固定化される。いくつかの態様において、複数のテンプレート分子は、所定のパターンで支持体上に固定化される。
【0235】
いくつかの態様において、テンプレート分子に対応する複数のサイクルにおいてシーケンシング反応を行う順序は、(1)挿入領域(510)の最初の3~5個の塩基をシーケンシングすることと、(2)右のインデックスが任意選択のランダム配列(例えば、NNN)及びユニバーサル試料インデックス配列を含む右の試料インデックスをシーケンシングすることと、(3)左の試料インデックスをシーケンシングすることと、を含む。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列を含む。いくつかの態様において、左の試料インデックスは、第2のランダム配列(例えば、NNN)及び左のユニバーサル試料インデックス配列を含む。いくつかの態様において、挿入領域(510)の最初の3~5個の塩基をシーケンシングすることは、右の試料インデックス及び左の試料インデックスがk-mer配列(例えば、NNN)を含まないように、十分な配列多様性を提供し得る。いくつかの態様において、第1のランダム配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックス領域をシーケンシングすることは、左の試料インデックスをシーケンシングすることを省略してもよいように、十分なヌクレオチド多様性を提供し得る。
【0236】
いくつかの態様において、支持体に固定化されたテンプレート分子をシーケンシングするための方法であって、個々のテンプレート分子は、(i)第1の表面プライマーのためのユニバーサル結合配列(520)、(ii)左のユニバーサル試料インデックス配列を有する左の試料インデックス配列(iii)フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)、(iv)目的の配列(510)、(v)リバースシーケンシングプライマーのためのユニバーサル結合配列(550)、(vi)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列、及び(vii)第2の表面プライマーのためのユニバーサル結合配列(530)を含む。方法は、ステップ(a):テンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第1の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、挿入領域(510)の最初の3~5個の塩基をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の挿入伸長生成物を生成することを含む。複数の挿入伸長生成物は、目的の配列(510)に相補的である。挿入領域(510)の最初の3~5個の塩基の配列は、ポロニーマッピング及びテンプレートの位置合わせのための十分な配列多様性及び色バランスを提供し得る。
【0237】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):複数の挿入伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0238】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):リバースシーケンシングプライマーのためのユニバーサル結合配列(550)にハイブリダイズする第2の複数の可溶性シーケンシングプライマーとテンプレート分子をハイブリダイズさせ、k-mer配列(例えば、NNN)(存在する場合)及び右のユニバーサル試料インデックス配列をシーケンシングすることを含む右の試料インデックス配列をシーケンシングし、それによって固定化されたテンプレート分子にハイブリダイズされた第1の複数の試料インデックス伸長生成物を生成することを更に含む。第1の複数の試料インデックス伸長生成物は、右の試料インデックス配列に相補的である。
【0239】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):第1の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0240】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):保持された固定化されたテンプレート分子を、第1の表面プライマーのためのユニバーサル結合配列(520)にハイブリダイズする第3の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、左の試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を生成することを更に含む。第2の複数の試料インデックス伸長生成物は、左の試料インデックス配列を有する左の試料インデックス配列に相補的である。
【0241】
いくつかの態様において、シーケンシングのための方法は、ステップ(f):第2の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0242】
いくつかの態様において、シーケンシングのための方法は、ステップ(g):テンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第4の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、挿入領域(510)の全長をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の全長挿入伸長生成物を生成することを更に含む。複数の全長挿入伸長生成物は、目的の配列(510)に相補的である。
【0243】
いくつかの態様において、シーケンシングのための方法は、ステップ(h1):(i)挿入領域(510)の全長配列を(ii)右の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0244】
いくつかの態様において、シーケンシングのための方法は、ステップ(h2):(i)挿入領域(510)の全長配列を(ii)右の試料インデックス配列、及び(iii)左の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0245】
いくつかの態様において、ステップ(b)、(d)、及び(f)の複数のシーケンシング伸長生成物の除去は、例えば、50~90℃などの核酸変性を促進する温度で、ホルムアミドの有無にかかわらず、SSC(例えば、生理食塩水-クエン酸ナトリウム)緩衝液を含む変性試薬を使用して行うことができる。
【0246】
いくつかの態様において、ステップ(a)、(c)、(e)、及び(g)のシーケンシングは、シーケンシングポリメラーゼ及び検出可能に標識されたヌクレオチド類似体を用いる、本明細書に記載されるシーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、(e)、及び(g)のシーケンシングは、シーケンシングポリメラーゼ、検出可能に標識された多価分子、及びヌクレオチド類似体を用いる、本明細書に記載される2段階シーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、(e)、及び(g)のシーケンシングは、本明細書に記載される結合によるシーケンシング方法のうちのいずれかを行うことを含む。
【0247】
いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1015である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~1012である。いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、複数のテンプレート分子は、支持体上のランダムな位置で固定化される。いくつかの態様において、複数のテンプレート分子は、所定のパターンで支持体上に固定化される。
【0248】
いくつかの態様において、シーケンシングの順序は、(1)固定化されたテンプレート分子の挿入領域(510)の最初の3~5個の塩基をシーケンシングすること(例えば、前方方向にシーケンシングすること)と、(2)右のインデックスが第1のランダム配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックスをシーケンシングすることと、(3)左の試料インデックスをシーケンシングすることと、(4)固定化されたテンプレート分子が、テンプレート分子と相補的である固定化された鎖で置き換えられるように、ペアワイズターン反応を行うことと、(5)固定化された相補鎖の挿入領域(510)の全長をシーケンシングすること(例えば、逆方向にシーケンシングすること)と、を含む。いくつかの態様において、ライブラリ分子の集団の挿入領域(510)の最初の3~5個の塩基の配列は、改善されたベースコーリング精度のために十分な配列多様性を提供し得る。いくつかの態様において、左の試料インデックスは、左のユニバーサル試料インデックス配列を含む。いくつかの態様において、左の試料インデックスは、第2のランダム配列(例えば、NNN)及び左のユニバーサル試料インデックス配列を含む。いくつかの態様において、第1のランダム配列(例えば、NNN)及び右のユニバーサル試料インデックス配列を含む右の試料インデックス領域をシーケンシングすることは、左の試料インデックスをシーケンシングすることを省略してもよいように、十分なヌクレオチド多様性を提供し得る。
【0249】
いくつかの態様において、支持体に固定化されたテンプレート分子をシーケンシングする方法であって、個々のテンプレート分子は、ウラシル塩基を欠く固定化されたキャプチャプライマーに共有結合しており、個々のテンプレート分子は、ランダムに分布するウラシル塩基を含み、個々のテンプレート分子は、(i)第1の表面プライマーのためのユニバーサル結合配列(520)、(ii)左のユニバーサル試料インデックス配列を有する左の試料インデックス配列(iii)フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)、(iv)目的の配列(510)、(v)リバースシーケンシングプライマーのためのユニバーサル結合配列(550)、(vi)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列、及び(vii)第2の表面プライマーのためのユニバーサル結合配列(530)を含む。方法は、ステップ(a):テンプレート分子を、フォワードシーケンシングプライマーのためのユニバーサル結合配列(540)にハイブリダイズする第1の複数の可溶性シーケンシングプライマー(例えば、フォワードシーケンシングプライマー)とハイブリダイズさせ、挿入領域(510)の最初の3~5個の塩基をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた複数の挿入伸長生成物を生成することを含む。複数の挿入伸長生成物は、目的の配列(510)に相補的である。
【0250】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):複数の挿入伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0251】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):リバースシーケンシングプライマーのためのユニバーサル結合配列(550)にハイブリダイズする第2の複数の可溶性シーケンシングプライマーとテンプレート分子をハイブリダイズさせ、k-mer配列(例えば、NNN)及び右のユニバーサル試料インデックス配列をシーケンシングすることを含む右の試料インデックス配列をシーケンシングし、それによって固定化されたテンプレート分子にハイブリダイズされた第1の複数の試料インデックス伸長生成物を生成することを更に含む。第1の複数の試料インデックス伸長生成物は、右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に相補的である。
【0252】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):第1の複数の試料インデックス伸長生成物を除去し、固定化されたテンプレート分子を保持することを更に含む。
【0253】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):保持された固定化されたテンプレート分子を、第1の表面プライマーのためのユニバーサル結合配列(520)にハイブリダイズする第3の複数の可溶性シーケンシングプライマーとハイブリダイズさせ、左の試料インデックス配列をシーケンシングし、それによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を生成することを更に含む。第2の複数の試料インデックス伸長生成物は、左の試料インデックス配列を有する左の試料インデックス配列に相補的である。
【0254】
いくつかの態様において、シーケンシングのための方法は、ステップ(f):鎖置換ポリメラーゼ及び複数のヌクレオチドを使用してプライマー伸長反応を行うことによって、固定化されたテンプレート分子にハイブリダイズされた第2の複数の試料インデックス伸長生成物を置き換えて、固定化されたキャプチャプライマーを含む固定化されたテンプレート分子にハイブリダイズされた伸長生成物を生成することを更に含む。
【0255】
いくつかの態様において、シーケンシングのための方法は、ステップ(g):固定化されたテンプレート分子のウラシル部位において非塩基性部位を生成し、非塩基性部位においてギャップを生成することによって、固定化されたテンプレート分子を除去し、それによって、ギャップ含有テンプレート分子を生成しつつ、個々の伸長生成物が固定化されたキャプチャプライマーにハイブリダイズされることによって保持されるステップ(f)において生成された伸長生成物を保持することを更に含む。いくつかの態様において、ペアワイズターンは、ステップ(g)及び(h)を行うことによって達成される。
【0256】
いくつかの態様において、シーケンシングのための方法は、ステップ(h):保持された伸長生成物を、リバースシーケンシングプライマーのためのユニバーサル結合配列(550)にハイブリダイズする第4の複数の可溶性シーケンシングプライマー(例えば、リバースシーケンシングプライマー)とハイブリダイズさせ、挿入領域(510)をシーケンシングすること(例えば、挿入領域(510)の少なくとも一部分又は全長をシーケンシングすること)を更に含む。
【0257】
いくつかの態様において、シーケンシングのための方法は、ステップ(i1):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0258】
いくつかの態様において、シーケンシングのための方法は、ステップ(i2):(i)挿入領域(510)の配列を、(ii)右のユニバーサル試料インデックス配列に直接連結されたk-mer配列(例えば、NNN)を有する右の試料インデックス配列及び(iii)左の試料インデックス配列に割り当て、それによって、挿入領域を第1の供給源から得られるものとして識別することを更に含む。
【0259】
いくつかの態様において、ステップ(b)及び(d)の複数のシーケンシング伸長生成物の除去は、例えば、50~90℃などの核酸変性を促進する温度で、ホルムアミドの有無にかかわらず、SSC(例えば、生理食塩水-クエン酸ナトリウム)緩衝液を含む変性試薬を使用して行うことができる。
【0260】
いくつかの態様において、ステップ(a)、(c)、(e)、及び(h)のシーケンシングは、シーケンシングポリメラーゼ及び検出可能に標識されたヌクレオチド類似体を用いる、本明細書に記載されるシーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、(e)、及び(h)のシーケンシングは、シーケンシングポリメラーゼ、検出可能に標識された多価分子、及びヌクレオチド類似体を用いる、本明細書に記載される2段階シーケンシング方法のうちのいずれかを行うことを含む。いくつかの態様において、ステップ(a)、(c)、(e)、及び(h)のシーケンシングは、本明細書に記載される結合によるシーケンシング方法のうちのいずれかを行うことを含む。
【0261】
いくつかの態様において、支持体に固定化された複数のテンプレート分子の密度は、1mm当たり102~1015である。いくつかの態様において、複数のテンプレート分子は、支持体上のランダムな位置で固定化される。いくつかの態様において、複数のテンプレート分子は、所定のパターンで支持体上に固定化される。
【0262】
いくつかの態様において、本開示は、核酸をシーケンシングするための方法を提供し、方法は、(a)支持体上に固定化された(例えば、ランダム又は所定の位置で固定化された)複数の核酸テンプレート分子を提供することであって、個々の固定化されたテンプレート分子が、挿入配列領域及び1つの試料インデックスを含み、各試料インデックスが、挿入配列の試料源を識別するユニバーサル試料インデックス配列に連結されたk-mer配列を含み、異なる固定化されたテンプレート分子が、異なるk-mer配列及び同じユニバーサル試料インデックス配列を有し、固定化されたテンプレート分子が、異なる挿入配列を有する、複数の核酸テンプレート分子を提供することと、(b)異なる種類のヌクレオ塩基A、G、C、及びT/Uの混合物を含む複数の検出可能に標識されたヌクレオチド試薬を使用して、複数の固定化されたテンプレート分子のk-mer配列の3回のポリメラーゼ媒介シーケンシング反応サイクルを行うことであって、ヌクレオチド試薬が、各異なる種類のヌクレオ塩基に対応する異なる検出可能な色ラベルを含み、3回のシーケンシングサイクルが、固定化されたテンプレート分子に結合した検出可能に標識されたヌクレオチド試薬から放出された光カラーシグナルを検出し、イメージングし、それによって、複数の固定化されたテンプレート分子の個々のテンプレート分子内のk-mer配列の配列を判定することを含み、バランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基が、複数の固定化されたテンプレート分子間の第1、第2、及び第3のシーケンシングサイクルの各々において検出され、イメージングされる、3回のポリメラーゼ媒介シーケンシング反応サイクルを行うことと、(c)ステップ(b)で得られた画像を使用して、複数の固定化されたテンプレート分子の位置のマップを生成することであって、挿入領域の配列がマップを生成するために使用されない、生成することと、を含む。
【0263】
いくつかの態様において、核酸をシーケンシングするための方法では、ステップ(b)のバランスのとれた多様性は、第1、第2、及び第3のシーケンシングサイクルの各々において検出され、イメージングされるヌクレオ塩基A、G、C、及びT/Uの各々の約5~85%、又は約5~60%、又は約10~50%、又は約15~55%、又は約25~75%である。
【0264】
いくつかの態様において、核酸をシーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子のユニバーサル試料インデックス配列をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(c)ステップ(b)で得られた所与のテンプレート分子の挿入配列を、ステップ(a)で得られた同じ所与のテンプレート分子からのユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の試料源を識別することと、を更に含む。
【0265】
いくつかの態様において、核酸をシーケンシングするための方法において、複数の核酸テンプレート分子は、挿入配列の試料源を識別する第2のユニバーサル試料インデックス配列を含む第2の試料インデックスを更に含み、第2の試料インデックスは、ランダム配列を欠く。
【0266】
いくつかの態様において、核酸をシーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子のk-mer配列をシーケンシングして、複数の固定化されたテンプレート分子の位置のマップを生成するために第1、第2、及び第3のシーケンシングサイクルの各々において検出され、イメージングされるバランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基を得ることと、(b)複数の固定化されたテンプレート分子の第1のユニバーサル試料インデックス配列をシーケンシングすることと、(c)複数の固定化されたテンプレート分子の第2のユニバーサル試料インデックス配列をシーケンシングすることと、(d)複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(e)所与のテンプレート分子の挿入配列を、ステップ(a)及び(b)で得られた同じ所与のテンプレート分子からの第1及び第2のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の試料源を識別することと、を更に含む。
【0267】
いくつかの態様において、本開示は、核酸をシーケンシングするための方法を提供し、方法は、(a)支持体上に固定化された(例えば、ランダム又は所定の位置で固定化された)複数の核酸テンプレート分子を提供することであって、個々の固定化されたテンプレート分子が、挿入配列領域及び1つの試料インデックスを含み、各試料インデックスが、挿入配列の試料源を識別するユニバーサル試料インデックス配列に連結されたk-mer配列を含み、ユニバーサル試料インデックス配列が、3~20個のヌクレオチドを含み、異なる固定化されたテンプレート分子が、異なるk-mer配列及び同じユニバーサル試料インデックス配列を有し、固定化されたテンプレート分子が、異なる挿入配列を有する、複数の核酸テンプレート分子を提供することと、(b)異なる種類のヌクレオ塩基A、G、C、及びT/Uの混合物を含む複数の検出可能に標識されたヌクレオチド試薬を使用して、複数の固定化されたテンプレート分子のk-mer配列及びユニバーサル試料インデックス配列の第1の塩基位置の4回のポリメラーゼ媒介シーケンシング反応サイクルを行うことであって、ヌクレオチド試薬が、各異なる種類のヌクレオ塩基に対応する異なる検出可能な色ラベルを含み、4回のシーケンシングサイクルが、固定化されたテンプレート分子に結合した検出可能に標識されたヌクレオチド試薬から放出された光カラーシグナルを検出し、イメージングし、それによって、複数の固定化されたテンプレート分子の個々のテンプレート分子内のk-mer配列及びユニバーサル試料インデックス配列の第1の塩基位置の配列を判定することを含み、バランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基が、複数の固定化されたテンプレート分子間の第1、第2、第3、及び第4のシーケンシングサイクルの各々において検出され、イメージングされる、4回のポリメラーゼ媒介シーケンシング反応サイクルを行うことと、(c)ステップ(b)で得られた4回のポリメラーゼ媒介シーケンシング反応サイクルの画像を使用して、複数の固定化されたテンプレート分子の位置のマップを生成することであって、挿入領域の配列がマップを生成するために使用されない、生成することと、を含む。
【0268】
いくつかの態様において、核酸をシーケンシングするための方法では、ステップ(b)のバランスのとれた多様性は、第1、第2、第3、及び第4のシーケンシングサイクルの各々において検出され、イメージングされるヌクレオ塩基A、G、C、及びT/Uの各々の約5~85%、又は約5~60%、又は約10~50%、又は約15~55%、又は約25~75%である。
【0269】
いくつかの態様において、核酸をシーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子のユニバーサル試料インデックス配列の残りの塩基位置をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(c)ステップ(b)で得られた所与のテンプレート分子の挿入配列を、ステップ(a)で得られた同じ所与のテンプレート分子からのユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の試料源を識別することと、を更に含む。
【0270】
いくつかの態様において、核酸をシーケンシングするための方法において、複数の核酸テンプレート分子は、挿入配列の試料源を識別する第2のユニバーサル試料インデックス配列を含む第2の試料インデックスを更に含み、第2の試料インデックスは、ランダム配列を欠く。
【0271】
いくつかの態様において、核酸をシーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子のk-mer配列及びユニバーサル試料インデックス配列の第1の塩基位置をシーケンシングして、複数の固定化されたテンプレート分子の位置のマップを生成するために第1、第2、第3、及び第4のシーケンシングサイクルの各々において検出され、イメージングされるバランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基を得ることと、(b)複数の固定化されたテンプレート分子の第1のユニバーサル試料インデックス配列の残りの塩基位置をシーケンシングすることと、(c)複数の固定化されたテンプレート分子の第2のユニバーサル試料インデックス配列をシーケンシングすることと、(d)複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(e)所与のテンプレート分子の挿入配列を、ステップ(a)及び(b)で得られた同じ所与のテンプレート分子からの第1及び第2のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の試料源を識別することと、を更に含む。
【0272】
いくつかの態様において、核酸をシーケンシングするための方法のうちのいずれかにおいて、支持体は、ガラス基材又はプラスチック基材を含む。いくつかの態様において、支持体は、フローセルチャネル、フローセル、又はキャピラリールーメン上で構成されている。いくつかの態様において、支持体は、45度以下の水接触角を有する少なくとも1つの親水性ポリマーコーティングで不動態化されている。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、ポリエチレングリコール(PEG)、ポリ(ビニルアルコール)(PVA)、ポリ(ビニルピリジン)、ポリ(ビニルピロリドン)(PVP)、ポリ(アクリル酸)(PAA)、ポリアクリルアミド、ポリ(N-イソプロピルアクリルアミド)(PNIPAM)、ポリ(メチルメタクリレート)(PMA)、ポリ(2-ヒドロキシルエチルメタクリレート)(PHEMA)、ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(POEGMA)、ポリグルタミン酸(PGA)、ポリリジン、ポリグルコシド、ストレプトアビジン、及びデキストランからなる群から選択される分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも4つの分岐を有する分岐親水性ポリマー分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも1000ダルトンの分子量を有するポリマー分子を含む。
【0273】
いくつかの態様において、核酸をシーケンシングするための方法のうちのいずれかにおいて、固定化されたテンプレート分子は、挿入配列及び1つの試料インデックスのタンデムリピート配列を有する複数の固定化されたコンカテマー分子を含む。いくつかの態様において、固定化されたテンプレート分子は、挿入配列の1つのコピー及び1つの試料インデックスの1つのコピーを有する複数の異なるクラスタ化されたテンプレート分子を含み、クラスタ化されたテンプレート分子は、ブリッジ増幅により生成される。いくつかの態様において、支持体上のランダム又は所定の位置に配置された固定化核酸テンプレート分子の密度は、1mm当たり10~10である。いくつかの態様において、挿入配列の試料源は、ゲノムDNA、二本鎖cDNA、又は無細胞循環DNAである。
【0274】
いくつかの態様において、核酸をシーケンシングするための方法のうちのいずれかにおいて、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを各々含むヌクレオチドを含む。いくつかの態様において、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、3’炭素糖位置に鎖終端基を有する5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを各々含むヌクレオチドを含む。いくつかの態様において、検出可能に標識されたヌクレオチド試薬は、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを各々含む多価分子を含み、個々のヌクレオチドアームは、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアは、複数のヌクレオチドアームに付着しており、スペーサーは、リンカーに付着しており、リンカーは、ヌクレオチド単位に付着している。
【0275】
いくつかの態様において、核酸をシーケンシングするための方法のいずれかにおいて、ステップ(b)において固定化されたテンプレート分子に結合する検出可能に標識されたヌクレオチド試薬は、シーケンシングプライマーにハイブリダイズして二本鎖を形成する個々の固定化されたテンプレート分子を含み、二本鎖は、ポリメラーゼに結合して複合型ポリメラーゼを形成し、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬に結合する。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合させ、検出可能に標識されたヌクレオチドをハイブリダイズされたシーケンシングプライマーに組み込むのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを含む。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合させ、検出可能に標識されたヌクレオチドをハイブリダイズされたシーケンシングプライマーに組み込むのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、3’炭素糖位置に鎖終端基を有する5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを含む。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合するのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、この条件は、ヌクレオチド組み込みを阻害するのに好適であり、検出可能に標識されたヌクレオチド試薬は、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを含む多価分子を含み、個々のヌクレオチドアームは、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアは、複数のヌクレオチドアームに付着しており、スペーサーは、リンカーに付着しており、リンカーは、ヌクレオチド単位に付着している。
【0276】
いくつかの態様において、核酸をシーケンシングするための方法のいずれかにおいて、固定化されたテンプレート分子は、複数のシーケンシングプライマーにハイブリダイズして、同じコンカテマー分子上に少なくとも第1及び第2の二重鎖を形成する固定化されたコンカテマー分子を含み、第1及び二重鎖は、第1のポリメラーゼに結合し、第2の二重鎖は、第2のポリメラーゼに結合して、第1及び第2の複合型ポリメラーゼを形成し、方法は、(a)複数の多価分子を、同じコンカテマーテンプレート分子上の第1及び第2の複合型ポリメラーゼに接触させることであって、個々の多価分子が、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを含み、個々のヌクレオチドアームが、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアが、複数のヌクレオチドアームに付着しており、スペーサーがリンカーに付着しており、リンカーがヌクレオチド単位に付着しており、接触させることが、複数からの単一の多価分子を第1及び第2の複合型ポリメラーゼに結合するのに好適な条件下で行われ、単一の多価分子の第1のヌクレオチド単位が、コンカテマーテンプレート分子の第1の部分にハイブリダイズした第1のシーケンシングプライマーを含む第1の複合型ポリメラーゼに結合し、それによって第1の結合複合体を形成し、単一の多価分子の第2のヌクレオチド単位が、コンカテマーテンプレート分子の第2の部分にハイブリダイズした第2のシーケンシングプライマーを含む第2の複合型ポリメラーゼに結合し、それによって第2の結合複合体を形成し、同じ多価分子に結合する第1及び第2の結合複合体が、アビディティ複合体を形成し、接触することが、第1及び第2の結合複合体における、結合した第1及び第2のヌクレオチド単位の、ポリメラーゼ触媒組み込みを阻害するのに好適な条件下で行われる、接触することと、(b)同じコンカテマーテンプレート分子上で、第1及び第2の結合複合体を検出することと、(c)同じコンカテマーテンプレート分子上で、第1及び第2の結合複合体を形成する検出可能に標識された多価分子から放出された光カラーシグナルをイメージングすることと、(d)第1の結合複合体における第1のヌクレオチド単位を識別し、それによって、コンカテマーテンプレート分子の第1の部分の配列を判定し、第2の結合複合体における第2のヌクレオチド単位を識別し、それによって、コンカテマーテンプレート分子の第2の部分の配列を識別することと、を含む。
【0277】
いくつかの態様において、本開示は、核酸を多重シーケンシングするための方法を提供し、方法は、(a)(i)第1の試料源に由来する挿入配列領域、(ii)第1のユニバーサル試料インデックス配列に連結されたk-mer配列を有する第1の試料インデックス、及び(iii)ランダム配列を欠く第2のユニバーサル試料インデックス配列を有する第2の試料インデックスを含む、複数の中の第1の複数のライブラリ分子を提供することであって、第1及び第2のユニバーサル試料インデックス配列の組み合わせが、挿入配列の第1の試料源を一意に識別し、異なる第1のライブラリ分子が、異なるk-mer配列を有し、異なる挿入配列を有する、提供することと、(b)(i)第2の試料源に由来する挿入配列領域、(ii)第3のユニバーサル試料インデックス配列に連結したk-mer配列を有する第3の試料インデックス、及び(iii)ランダム配列を欠く第4のユニバーサル試料インデックス配列を有する第4の試料インデックスを含む複数の中の第2の複数のライブラリ分子各分子を提供することであって、第3及び第4のユニバーサル試料インデックス配列の組み合わせが、挿入配列の第2の試料源を一意に識別し、異なる第2のライブラリ分子が、異なるk-mer配列を有し、異なる挿入配列を有する、提供することと、(c)第1及び第2の複数のライブラリ分子をプールすることと、(d)プールされたライブラリ分子を支持体上に分布させ、増幅反応を行って、支持体に固定化された(例えば、ランダム又は所定の位置で固定化された)複数のクローン的に増幅されたテンプレート分子を生成することと、(e)異なる種類のヌクレオ塩基A、G、C、及びT/Uの混合物を含む複数の検出可能に標識されたヌクレオチド試薬を使用して、第1及び第3の試料インデックスのk-mer配列の3回のポリメラーゼ媒介シーケンシング反応サイクルを行うことであって、ヌクレオチド試薬が、各々の異なる種類のヌクレオ塩基に対応する異なる検出可能な色ラベルを含み、3回のシーケンシングサイクルが、固定化された増幅テンプレート分子に結合した検出可能に標識されたヌクレオチド試薬から放出された光カラーシグナルを検出し、イメージングし、それによって、複数の固定化されたテンプレート分子の個々のテンプレート分子におけるk-mer配列の配列を判定することを含み、バランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基が、複数の固定化された増幅テンプレート分子間で第1、第2、及び第3のシーケンシングサイクルの各々において検出され、イメージングされる、3回のポリメラーゼ媒介シーケンシング反応サイクルを行うことと、(f)ステップ(e)で得られた画像を使用して、複数の固定化されたテンプレート分子の位置のマップを生成することであって、挿入領域の配列がマップを生成するために使用されない、生成することと、を含む。
【0278】
いくつかの態様において、核酸を多重シーケンシングするための方法では、ステップ(e)のバランスのとれた多様性は、第1、第2、及び第3のシーケンシングサイクルの各々において検出され、イメージングされるヌクレオ塩基A、G、C、及びT/Uの各々の約5~85%、又は約5~60%、又は約10~50%、又は約15~55%、又は約25~75%である。
【0279】
いくつかの態様において、核酸を多重シーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子の第1のユニバーサル試料インデックス配列をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の第2のユニバーサル試料インデックス配列をシーケンシングすることと、(c)第1のライブラリ分子に由来する複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(d)ステップ(c)で得られた所与のテンプレート分子の挿入配列を、同じ所与のテンプレート分子からの第1及び第2のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の第1の試料源を識別することと、を更に含む。
【0280】
いくつかの態様において、核酸を多重シーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子の第3のユニバーサル試料インデックス配列をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の第4のユニバーサル試料インデックス配列をシーケンシングすることと、(c)第2のライブラリ分子に由来する複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(d)ステップ(c)で得られた所与のテンプレート分子の挿入配列を、同じ所与のテンプレート分子からの第3及び第4のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の第2の試料源を識別することと、を更に含む。
【0281】
いくつかの態様において、本開示は、核酸を多重シーケンシングするための方法を提供し、方法は、(a)(i)第1の試料源に由来する挿入配列領域、(ii)第1のユニバーサル試料インデックス配列に連結されたk-mer配列を有する第1の試料インデックス、及び(iii)ランダム配列を欠く第2のユニバーサル試料インデックス配列を有する第2の試料インデックスを含む、複数の中の第1の複数のライブラリ分子を提供することであって、第1及び第2のユニバーサル試料インデックス配列の組み合わせが、挿入配列の第1の試料源を一意に識別し、第1のユニバーサル試料インデックス配列が、3~20個のヌクレオチドを含み、異なる第1のライブラリ分子が、異なるk-mer配列を有し、異なる挿入配列を有する、提供することと、(b)(i)第2の試料源に由来する挿入配列領域、(ii)第3のユニバーサル試料インデックス配列に連結したk-mer配列を有する第3の試料インデックス、及び(iii)ランダム配列を欠く第4のユニバーサル試料インデックス配列を有する第4の試料インデックスを含む複数の中の第2の複数のライブラリ分子各分子を提供することであって、第3及び第4のユニバーサル試料インデックス配列の組み合わせが、挿入配列の第2の試料源を一意に識別し、第3のユニバーサル試料インデックス配列が、3~20個のヌクレオチドを含み、異なる第2のライブラリ分子が、異なるk-mer配列を有し、異なる挿入配列を有する、提供することと、(c)第1及び第2の複数のライブラリ分子をプールすることと、(d)プールされたライブラリ分子を支持体上に分布させ、増幅反応を行って、支持体に固定化された(例えば、ランダム又は所定の位置で固定化された)複数のクローン的に増幅されたテンプレート分子を生成することと、(e)異なる種類のヌクレオ塩基A、G、C、及びT/Uの混合物を含む複数の検出可能に標識されたヌクレオチド試薬を使用して、第1及び第3の試料インデックスのk-mer配列の4回のポリメラーゼ媒介シーケンシング反応サイクルを行い、第1及び第3のユニバーサル試料インデックス配列の第1の塩基位置をシーケンシングすることであって、ヌクレオチド試薬が、各々の異なる種類のヌクレオ塩基に対応する異なる検出可能な色ラベルを含み、3回のシーケンシングサイクルが、固定化された増幅テンプレート分子に結合した検出可能に標識されたヌクレオチド試薬から放出された光カラーシグナルを検出し、イメージングし、それによって、複数の固定化されたテンプレート分子の個々のテンプレート分子におけるk-mer配列の配列を判定することを含み、バランスのとれた多様性のA、G、C、及びT/Uのヌクレオ塩基が、複数の固定化された増幅テンプレート分子間で第1、第2、第3、及び第4のシーケンシングサイクルの各々において検出され、イメージングされる、第1及び第3の試料インデックスのk-mer配列の4回のポリメラーゼ媒介シーケンシング反応サイクルを行い、第1及び第3のユニバーサル試料インデックス配列の第1の塩基位置をシーケンシングすることと、(f)ステップ(e)で得られた画像を使用して、複数の固定化されたテンプレート分子の位置のマップを生成することであって、挿入領域の配列がマップを生成するために使用されない、生成することと、を含む。
【0282】
いくつかの態様において、多重シーケンシング核酸のための方法では、ステップ(e)のバランスのとれた多様性は、第1、第2、第3、及び第4のシーケンシングサイクルの各々において検出及びイメージングされるヌクレオ塩基A、G、C、及びT/Uの各々の約5~85%、又は約5~60%、又は約10~50%、又は約15~55%、又は約25~75%である。
【0283】
いくつかの態様において、核酸を多重シーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子の第1のユニバーサル試料インデックス配列の残りの塩基位置をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の第2のユニバーサル試料インデックス配列をシーケンシングすることと、(c)第1のライブラリ分子に由来する複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(d)ステップ(c)で得られた所与のテンプレート分子の挿入配列を、同じ所与のテンプレート分子からの第1及び第2のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の第1の試料源を識別することと、を更に含む。
【0284】
いくつかの態様において、核酸を多重シーケンシングするための方法では、本方法は、(a)複数の固定化されたテンプレート分子の第3のユニバーサル試料インデックス配列の残りの塩基位置をシーケンシングすることと、(b)複数の固定化されたテンプレート分子の第4のユニバーサル試料インデックス配列をシーケンシングすることと、(c)第2のライブラリ分子に由来する複数の固定化されたテンプレート分子の挿入配列領域をシーケンシングすることと、(d)ステップ(c)で得られた所与のテンプレート分子の挿入配列を、同じ所与のテンプレート分子からの第3及び第4のユニバーサル試料インデックス配列に割り当て、それによって、所与の挿入配列の第2の試料源を識別することと、を更に含む。
【0285】
いくつかの態様において、核酸を多重シーケンシングするための方法のうちのいずれかにおいて、支持体は、ガラス基材又はプラスチック基材を含む。いくつかの態様において、支持体は、フローセルチャネル、フローセル、又はキャピラリールーメン上で構成されている。いくつかの態様において、支持体は、45度以下の水接触角を有する少なくとも1つの親水性ポリマーコーティングで不動態化されている。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、ポリエチレングリコール(PEG)、ポリ(ビニルアルコール)(PVA)、ポリ(ビニルピリジン)、ポリ(ビニルピロリドン)(PVP)、ポリ(アクリル酸)(PAA)、ポリアクリルアミド、ポリ(N-イソプロピルアクリルアミド)(PNIPAM)、ポリ(メチルメタクリレート)(PMA)、ポリ(2-ヒドロキシルエチルメタクリレート)(PHEMA)、ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(POEGMA)、ポリグルタミン酸(PGA)、ポリリジン、ポリグルコシド、ストレプトアビジン、及びデキストランからなる群から選択される分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも4つの分岐を有する分岐親水性ポリマー分子を含む。いくつかの態様において、少なくとも1つの親水性ポリマーコーティングは、少なくとも1000ダルトンの分子量を有するポリマー分子を含む。
【0286】
いくつかの態様において、核酸を多重シーケンシングするための方法のうちのいずれかにおいて、固定化されたテンプレート分子は、挿入配列及び1つの試料インデックスのタンデムリピート配列を有する複数の固定化されたコンカテマー分子を含む。いくつかの態様において、固定化されたテンプレート分子は、挿入配列の1つのコピー及び1つの試料インデックスの1つのコピーを有する複数の異なるクラスタ化されたテンプレート分子を含み、クラスタ化されたテンプレート分子は、ブリッジ増幅により生成される。いくつかの態様において、支持体上の固定化された核酸テンプレート分子(例えば、ランダム又は所定の位置で固定化された)の密度は、1mm当たり10~10である。いくつかの態様において、挿入配列の試料源は、ゲノムDNA、二本鎖cDNA、又は無細胞循環DNAである。
【0287】
いくつかの態様において、核酸を多重シーケンシングするための方法のうちのいずれかにおいて、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを各々含むヌクレオチドを含む。いくつかの態様において、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、3’炭素糖位置に鎖終端基を有する5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを各々含むヌクレオチドを含む。いくつかの態様において、検出可能に標識されたヌクレオチド試薬は、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを各々含む多価分子を含み、個々のヌクレオチドアームは、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアは、複数のヌクレオチドアームに付着しており、スペーサーは、リンカーに付着しており、リンカーは、ヌクレオチド単位に付着している。
【0288】
いくつかの態様において、核酸を多重シーケンシングするための方法のいずれかにおいて、ステップ(e)において固定化されたテンプレート分子に結合する検出可能に標識されたヌクレオチド試薬は、シーケンシングプライマーにハイブリダイズして二本鎖を形成する個々の固定化されたテンプレート分子を含み、二本鎖は、ポリメラーゼに結合して複合型ポリメラーゼを形成し、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬に結合する。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合させ、検出可能に標識されたヌクレオチドをハイブリダイズされたシーケンシングプライマーに組み込むのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを含む。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合させ、検出可能に標識されたヌクレオチドをハイブリダイズされたシーケンシングプライマーに組み込むのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、検出可能に標識されたヌクレオチド試薬は、芳香族ヌクレオ塩基、3’炭素糖位置に鎖終端基を有する5炭素糖部分、1~10個のリン酸基、及びフルオロフォアを含む。いくつかの態様において、複合型ポリメラーゼは、検出可能に標識されたヌクレオチド試薬を複合型ポリメラーゼに結合するのに好適な条件下で、検出可能に標識されたヌクレオチド試薬に結合され、この条件は、ヌクレオチド組み込みを阻害するのに好適であり、検出可能に標識されたヌクレオチド試薬は、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを含む多価分子を含み、個々のヌクレオチドアームは、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアは、複数のヌクレオチドアームに付着しており、スペーサーは、リンカーに付着しており、リンカーは、ヌクレオチド単位に付着している。
【0289】
いくつかの態様において、核酸を多重シーケンシングするための方法のいずれかにおいて、固定化されたテンプレート分子は、複数のシーケンシングプライマーにハイブリダイズして、同じコンカテマー分子上に少なくとも第1及び第2の二重鎖を形成する固定化されたコンカテマー分子を含み、第1及び二重鎖は、第1のポリメラーゼに結合し、第2の二重鎖は、第2のポリメラーゼに結合して、第1及び第2の複合型ポリメラーゼを形成し、方法は、(a)複数の多価分子を、同じコンカテマーテンプレート分子上の第1及び第2の複合型ポリメラーゼに接触させることであって、個々の多価分子が、(1)コア、(2)複数のヌクレオチドアーム、及び(3)少なくとも1つのフルオロフォアを含み、個々のヌクレオチドアームが、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアが、複数のヌクレオチドアームに付着しており、スペーサーがリンカーに付着しており、リンカーがヌクレオチド単位に付着しており、接触させることが、複数からの単一の多価分子を第1及び第2の複合型ポリメラーゼに結合するのに好適な条件下で行われ、単一の多価分子の第1のヌクレオチド単位が、コンカテマーテンプレート分子の第1の部分にハイブリダイズした第1のシーケンシングプライマーを含む第1の複合型ポリメラーゼに結合し、それによって第1の結合複合体を形成し、単一の多価分子の第2のヌクレオチド単位が、コンカテマーテンプレート分子の第2の部分にハイブリダイズした第2のシーケンシングプライマーを含む第2の複合型ポリメラーゼに結合し、それによって第2の結合複合体を形成し、同じ多価分子に結合する第1及び第2の結合複合体が、アビディティ複合体を形成し、接触することが、第1及び第2の結合複合体における、結合した第1及び第2のヌクレオチド単位の、ポリメラーゼ触媒組み込みを阻害するのに好適な条件下で行われる、接触することと、(b)同じコンカテマーテンプレート分子上で、第1及び第2の結合複合体を検出することと、(c)同じコンカテマーテンプレート分子上で、第1及び第2の結合複合体を形成する検出可能に標識された多価分子から放出された光カラーシグナルをイメージングすることと、(d)第1の結合複合体における第1のヌクレオチド単位を識別し、それによって、コンカテマーテンプレート分子の第1の部分の配列を判定し、第2の結合複合体における第2のヌクレオチド単位を識別し、それによって、コンカテマーテンプレート分子の第2の部分の配列を識別することと、を含む。
【0290】
例示的なコンピュータシステム
様々な態様は、例えば、図4に示されるコンピュータシステム400などの1つ以上のコンピュータシステムを使用して実施され得る。1つ以上のコンピュータシステム400は、例えば、本明細書で考察される態様のうちのいずれか、並びにその組み合わせ及びサブ組み合わせを実施するために使用され得る。
【0291】
コンピュータシステム400は、プロセッサ404などの1つ以上のプロセッサ(セントラルプロセッシングユニット、又はCPUとも呼ばれる)を含み得る。プロセッサ404は、バス又は通信インフラストラクチャ406に接続され得る。
【0292】
コンピュータシステム400はまた、ユーザ入力/出力インターフェース(複数可)402を介して通信インフラストラクチャ406と通信し得る、モニタ、キーボード、ポインティングデバイスなどのユーザ入力/出力デバイス(複数可)403を含み得る。ユーザ入力/出力デバイス403は、図1のユーザインターフェース124に結合され得る。
【0293】
プロセッサ404のうちの1つ以上は、グラフィックスプロセッシングユニット(GPU)であり得る。一態様では、GPUは、数学的に集中的なアプリケーションを処理するように設計された特殊な電子回路であるプロセッサであり得る。GPUは、例えば、コンピュータグラフィックスアプリケーション、画像、ビデオ、ベクトル処理、アレイ処理などに共通の数学的に集中的なデータ、並びに暗号化(ブルートフォースクラッキングを含む)、暗号化ハッシュ若しくはハッシュ配列の生成、部分的なハッシュ反転問題の解決、及び/又はいくつかのブロックチェーンベースアプリケーションのための他のプルーフオブワーク計算の結果の生成など、大きなデータブロックの並列処理のために効率的である並列構造を有し得る。グラフィックスプロセッシングユニット(GPGPU)上の汎用コンピューティングの能力により、GPUは、少なくとも本明細書に記載される画像認識及び機械学習の態様において特に有用であり得る。
【0294】
加えて、プロセッサ404のうちの1つ以上は、ハードウェア加速された暗号化コプロセッサを含む、暗号化計算を加速するための論理のコプロセッサ又は他の実装、又は他の特殊な数学的関数を含み得る。そのような加速されたプロセッサは、そのような加速を促進するために、コプロセッサ及び/又は他の論理を使用して加速するための命令セット(複数可)を更に含み得る。
【0295】
コンピュータシステム400はまた、ランダムアクセスメモリ(RAM)などのメイン又はプライマリメモリ408を含み得る。メインメモリ408は、1つ以上のレベルのキャッシュを含み得る。メインメモリ408は、その中に制御論理(すなわち、コンピュータソフトウェア)及び/又はデータを格納していてもよい。
【0296】
コンピュータシステム400はまた、1つ以上の二次ストレージ又は二次メモリ410を含み得る。二次メモリ410は、例えば、メインストレージドライブ412及び/又はリムーバブルストレージデバイス若しくはドライブ414を含み得る。メインストレージドライブ412は、例えば、ハードディスクドライブ又はソリッドステートドライブであり得る。リムーバブルストレージドライブ414は、フロッピーディスクドライブ、磁気テープドライブ、コンパクトディスクドライブ、光学ストレージデバイス、テープバックアップデバイス、及び/又は任意の他のストレージデバイス/ドライブであり得る。
【0297】
リムーバブルストレージドライブ414は、リムーバブルストレージユニット418と相互作用し得る。
【0298】
リムーバブルストレージユニット418は、コンピュータソフトウェア(制御論理)及び/又はデータを格納したコンピュータ使用可能又は読み取り可能ストレージデバイスを含み得る。リムーバブルストレージユニット418は、フロッピーディスク、磁気テープ、コンパクトディスク、DVD、光学ストレージディスク、及び/又は任意の他のコンピュータデータストレージデバイスであってもよい。リムーバブルストレージドライブ414は、リムーバブルストレージユニット418から読み出し、及び/又はリムーバブルストレージユニット418に書き込み得る。
【0299】
二次メモリ410は、コンピュータプログラム及び/又は他の命令及び/又はデータにコンピュータシステム400がアクセスすることを可能にするための他の手段、デバイス、構成要素、手段又は他のアプローチを含み得る。そのような手段、デバイス、構成要素、機器、又は他のアプローチは、例えば、リムーバブルストレージユニット422及びインターフェース420を含み得る。リムーバブルストレージユニット422及びインターフェース420の例には、プログラムカートリッジ及びカートリッジインターフェース(ビデオゲームデバイスに見られるものなど)、リムーバブルメモリチップ(EPROM又はPROMなど)及び関連するソケット、メモリスティック及びUSBポート、メモリカード及び関連するメモリカードスロット、並びに/又は任意の他のリムーバブルストレージユニット及び関連するインターフェースが含まれ得る。
【0300】
コンピュータシステム400は、通信又はネットワークインターフェース424を更に含み得る。通信インターフェース424は、コンピュータシステム400が、外部デバイス、外部ネットワーク、外部エンティティなどの任意の組み合わせ(参照番号428によって個別に及び集合的に参照される)と通信し、対話することを可能にし得る。例えば、通信インターフェース424は、コンピュータシステム400が、有線及び/又は無線(又はそれらの組み合わせ)であり得、LAN、WAN、インターネットなどの任意の組み合わせを含み得る、通信パス426を介して外部又はリモートデバイス428と通信することを可能にし得る。制御論理及び/又はデータは、通信経路426を介してコンピュータシステム400との間で伝送され得る。いくつかの態様において、通信経路426は、図1に示されるように、クラウド130への接続である。参照番号428によって参照される外部デバイスなどは、クラウド130内のデバイス、ネットワーク、エンティティなどであり得る。
【0301】
コンピュータシステム400はまた、いくつかの非限定的な例、又はそれらの任意の組み合わせを挙げると、パーソナルデジタルアシスタント(PDA)、デスクトップワークステーション、ラップトップ若しくはノート型コンピュータ、ネットブック、タブレット、スマートフォン、スマートウォッチ、又は他のウェアラブル、アプライアンス、Internet of Things(IoT)の一部、及び/又は埋め込みシステムのうちのいずれかであってもよい。
【0302】
本明細書に記載されるフレームワークは、非一時的コンピュータ可読媒体若しくはデバイスなどの方法、プロセス、装置、システム、又は製品として実装され得ることを理解されたい。例示の目的のために、本フレームワークは、分散型台帳が公的に利用可能であるか、又は少なくとも信頼できない第三者がそれを利用可能であるという文脈で説明され得る。最新のユースケースとして、ブロックチェーンベースのシステムが挙げられる。しかしながら、本フレームワークは、機密情報又は機密情報が信頼できない第三者の手を通過する必要があり得る他の設定にも適用され得、この技術は、分散型台帳又はブロックチェーンの使用に決して限定されないことを理解されたい。
【0303】
コンピュータシステム400は、リモート若しくは分散クラウドコンピューティングソリューション、ローカル若しくはオンプレミスのソフトウェア(例えば、「オンプレミス」クラウドベースのソリューション)、「サービスとしての」モデル(例えば、サービスとしてのコンテンツ(CaaS)、サービスとしてのデジタルコンテンツ(DCaaS)、サービスとしてのソフトウェア(SaaS)、サービスとしてのマネージドソフトウェア(MSaaS)、サービスとしてのプラットフォーム(PaaS)、サービスとしてのデスクトップ(DaaS)、サービスとしてのフレームワーク(FaaS)、サービスとしてのバックエンド(BaaS)、サービスとしてのモバイルバックエンド(MBaaS)、サービスとしてのインフラストラクチャ(IaaS)、サービスとしてのデータベース(DBaaS)など)、及び/又は上記の例若しくは他のサービス若しくは配信パラダイムの任意の組み合わせを含むハイブリッドモデルを含むが限定されない任意の配信パラダイムを通じて、任意のアプリケーション及び/又はデータにアクセスするか、又はホスティングするクライアント又はサーバであり得る。
【0304】
任意の適用可能なデータ構造、ファイル形式、及びスキーマは、JavaScriptオブジェクト表記法(JSON)、拡張マークアップ言語(XML)、更にもう1つのマークアップ言語(YAML)、拡張ハイパーテキストマークアップ言語(XHTML)、ワイヤレスマークアップ言語(WML)、MessagePack、XMLユーザインターフェース言語(XUL)、又は単独で又は組み合わせての他の機能的に類似した表現を含むが、これらに限定されない標準から導出され得る。あるいは、独自のデータ構造、形式、又はスキーマを、排他的に、又は既知の標準又はオープン標準と組み合わせて使用することができる。
【0305】
任意の関連するデータ、ファイル、及び/又はデータベースは、他の可能な形式の中でも、様々なタイプのマークアップ言語を更に含む、数値、テキスト、グラフィック、又はマルチメディア形式のような人間が読み取り可能な形式で格納され、取得され、アクセスされ、及び/又は送信されてもよい。代替的に、又は上記の形式との組み合わせで、データ、ファイル、及び/又はデータベースは、バイナリ、符号化、圧縮、及び/若しくは暗号化された形式、又は任意の他の機械可読形式で格納、取得、アクセス、及び/又は送信されてもよい。
【0306】
様々なシステム及び層間のインターフェース又は相互接続は、任意の数のプロトコル、プログラマティックフレームワーク、フロアプラン、又はアプリケーションプログラミングインターフェース(API)などの任意の数のメカニズムを用い得、これらには、ドキュメントオブジェクトモデル(DOM)、ディスカバリーサービス(DS)、NSUserDefaults、ウェブサービス記述言語(WSDL)、メッセージ交換パターン(MEP)、ウェブ分散型データ交換(WDDX)、ウェブハイパーテキストアプリケーション技術ワーキンググループ(WHATWG)、HTML5ウェブメッセージング、表現状態転送(REST又はRESTfulウェブサービス)、拡張可能ユーザインターフェースプロトコル(XUP)、シンプルオブジェクトアクセスプロトコル(SOAP)、XMLスキーマ定義(XSD)、XMLリモートプロシージャコール(XML-RPC)、又は同様の機能及び結果を達成し得る任意の他のメカニズムが含まれるが、これらに限定されない。
【0307】
そのようなインターフェース又は相互接続はまた、ユニフォームリソース識別子(URI)を利用し得、これは、ユニフォームリソースロケータ(URL)又はユニフォームリソース名(URN)を更に含み得る。他の形態の一様及び/又は一意の識別子、ロケータ、又は名前が、排他的に、又は上に記載されたものなどの形態と組み合わせて使用され得る。
【0308】
上記のプロトコル又はAPIのうちのいずれかは、任意のプログラミング言語、手続き型言語、機能型言語、又はオブジェクト指向言語とインターフェースをとり得るか、又はそれらで実装され得、コンパイル又は解釈され得る。非限定的な例としては、C、C++、C#、Objective-C、Java、Scala、Clojure、Elixir、Swift、Go、Perl、PHP、Python、Ruby、JavaScript、WebAssembly、又は実質的にあらゆる他の言語(あらゆる他のライブラリ若しくはスキーマで、あらゆる種類のフレームワーク、ランタイム環境、仮想マシン、インタープリター、スタック、エンジン、若しくは同様のメカニズム(他の多くの非限定的な例の中で、Node.js、V8、Knockout、jQuery、Dojo、Dijit、OpenUI5、AngularJS、Expressjs、Backbone.js、Ember.js、DHTMLX、Vue、React、Electronなどを含むが、これに限定されない)で)が挙げられる。
【0309】
いくつかの態様において、制御論理(ソフトウェア)が格納されたタンジブルな非一時的コンピュータ使用可能又は可読媒体を含むタンジブルな非一時的装置又は製品は、本明細書ではコンピュータプログラム製品又はプログラムストレージデバイスと呼ばれる場合がある。これは、コンピュータシステム400、メインメモリ408、二次メモリ410、及びリムーバブルストレージユニット418及び422、並びに前述の任意の組み合わせを具現化するタンジブルな製品を含むが、これらに限定されない。そのような制御論理は、1つ以上のデータ処理デバイス(コンピュータシステム400など)によって実行されると、そのようなデータ処理デバイスに、本明細書に記載されるように動作させ得る。
【0310】
本開示に含まれる教示に基づいて、図4に示されるもの以外のデータ処理デバイス、コンピュータシステム、及び/又はコンピュータアーキテクチャを使用して、本開示の態様を作成及び使用する方法は、関連技術分野(複数可)の当業者には明らかであろう。特に、態様は、本明細書に記載されるもの以外のソフトウェア、ハードウェア、及び/又はオペレーティングシステムの実装で動作し得る。
【0311】
図1のイメージャ116は、1つ以上の光学システムを含むことができる。本明細書に更に開示されるのは、蛍光イメージングベースのゲノミクス用途のために改善された光学解像度及び画像品質を提供する光学システム設計ガイドライン並びに高性能蛍光イメージング方法及びシステムである。開示された光学イメージングシステム設計は、より大きな視野、増加した空間解像度、改善された変調転送、コントラスト対ノイズ比、及び画像品質、より高い空間サンプリング周波数、一連の画像(例えば、異なる視野の)をキャプチャするために試料面を再配置するときの画像キャプチャ間のより速い遷移、並びに改善されたイメージングシステムデューティサイクルを提供し、したがって、より高いスループット画像取得及び分析を可能にする。
【0312】
いくつかの事例では、例えば、デュアルサイド(フローセル)イメージング用途のためのイメージング性能の改善は、対物レンズと組み合わせて電気光学位相板を使用して、フローセルの上部(近い)及び下部(遠い)内側表面を分離する流体層によって引き起こされる光学収差を補償することによって達成され得る。いくつかの事例では、この設計アプローチはまた、例えば、フローセルのどの表面が画像であるかに応じて、光学経路内又は光学経路外に移動される動き作動型コンペンセータによって導入される振動を補償し得る。
【0313】
いくつかの事例では、例えば、厚いフローセル壁(例えば、壁(又はカバースリップ)の厚さが700μmを超える)及び流体チャネル(例えば、流体チャネルの高さ又は厚さが50~200μm)の使用を含むデュアルサイド(フローセル)イメージング用途のためのイメージング性能の改善は、厚いフローセル壁及び/又は中間の流体層によって引き起こされる光学収差を対物鏡と組み合わせて補正するチューブレンズ設計を使用することによって、市販の既製の対物鏡を使用する場合でも達成され得る。
【0314】
いくつかの事例では、例えば、マルチチャネル(例えば、2色又は4色)イメージングアプリケーションのためのイメージング性能の改善は、複数のチューブレンズ(各イメージングチャネルに対して1つ)を使用することによって達成され得、各チューブレンズ設計は、そのイメージングチャネルで使用される特定の波長範囲に対して最適化されている。
【0315】
本明細書に開示される例示的な態様は、蛍光イメージングシステムを含み得、当該システムは、a)1つ以上の指定された波長範囲内の励起光を提供するように構成された少なくとも1つの光源、b)試料面を励起光に曝露したときに試料面の指定された視野内から生じる蛍光を収集するように構成された対物レンズであって、対物レンズの開口数は、少なくとも0.1、少なくとも0.2、少なくとも0.3、少なくとも0.4、少なくとも0.5、少なくとも0.6、少なくとも0.7、少なくとも0.8、少なくとも0.9、又は前述のもののうちの任意の2つによって定義される範囲内に入るの開口数であり、対物レンズの作動距離が、少なくとも400μm、少なくとも500μm、少なくとも600μm、少なくとも700μm、少なくとも800μm、少なくとも900μm、少なくとも1000μm、又は前述のもののうちの任意の2つによって定義される範囲内に入る作動距離であり、視野が、少なくとも0.1mm、少なくとも0.2mm、少なくとも0.5mm、少なくとも0.7mm、少なくとも1mm、少なくとも2mm、少なくとも3mm、少なくとも5mm、又は少なくとも10mm、又は前述のもののうちのいずれか2つによって定義される範囲内にある視野である、対物レンズ、並びにc)少なくとも1つのイメージセンサであって、対物レンズによって収集された蛍光がイメージセンサ上にイメージングされ、蛍光イメージングシステムの空間サンプリング周波数が蛍光イメージングシステムの光学解像度の少なくとも2倍であるように、イメージセンサのピクセル寸法が選択される、少なくとも1つのイメージセンサを備え得る。
【0316】
いくつかの態様において、開口数は、少なくとも0.75であり得る。いくつかの態様において、開口数は、少なくとも1.0である。いくつかの態様において、作動距離は、少なくとも850μmである。いくつかの態様において、作動距離は、少なくとも1,000μmである。いくつかの態様において、視野は、少なくとも2.5mmの面積を有し得る。いくつかの態様において、視野は、少なくとも3mmの面積を有し得る。いくつかの態様において、空間サンプリング周波数は、蛍光イメージングシステムの光学解像度の少なくとも2.5倍であり得る。いくつかの態様において、空間サンプリング周波数は、蛍光イメージングシステムの光学解像度の少なくとも3倍であり得る。いくつかの態様において、システムは、システムが自動化された方法で一連の2つ以上の蛍光画像を取得するように構成されるように、X-Y-Z並進ステージを更に備え得、一連の画像の各画像は、異なる視野に対して取得されるか、又は取得され得る。いくつかの態様において、試料面の位置は、異なる視野の画像を取得する間に対物レンズ焦点面の位置と一致するように、X方向、Y方向、及びZ方向に同時に調整されてもよい。いくつかの態様において、X方向、Y方向、及びZ方向における同時調整に必要な時間は、0.3秒未満、0.4秒未満、0.5秒未満、0.7秒未満、若しくは1秒未満、又は前述のうちのいずれか2つによって定義される範囲内にある時間であり得る。いくつかの態様において、システムは、誤差シグナルがZ方向における焦点面及び試料面の位置の差が指定された誤差閾値よりも大きいことを示す場合、異なる視野の画像を取得する前に焦点面の位置を調整するように構成されたオートフォーカス機構を更に備える。いくつかの態様において、指定された誤差閾値は、100nm以上である。いくつかの態様において、指定された誤差閾値は、50nm以下である。いくつかの態様において、システムは、3つ以上の画像センサを備え、システムは、3つ以上の波長範囲の各々における蛍光を異なる画像センサ上にイメージングするように構成される。いくつかの態様において、3つ以上の画像センサの各々と試料面との焦点面の位置の差は、100nm未満である。いくつかの態様において、3つ以上の画像センサの各々と試料面との焦点面の位置の差は、50nm未満である。いくつかの態様において、試料面を再配置し、必要に応じて焦点を調整し、画像を取得するのに必要な合計時間は、1視野当たり0.4秒未満である。いくつかの態様において、試料面を再配置し、必要に応じて焦点を調整し、画像を取得するのに必要な合計時間は、1視野当たり0.3秒未満である。
【0317】
また、本明細書に開示されるのは、フローセルのデュアルサイドイメージングのための蛍光イメージングシステムである。この蛍光イメージングシステムは、a)フローセル内の試料面の特定の視野内から生じる蛍光を収集するように構成された対物レンズと、b)対物レンズと少なくとも1つのイメージセンサとの間に配置された少なくとも1つのチューブレンズと、を含み、少なくとも1つのチューブレンズは、フローセルの内側表面をイメージングするときに、対物レンズ、少なくとも1つのチューブレンズ、及び少なくとも1つのイメージセンサの組み合わせについてのイメージング性能メトリックを補正するように構成され、フローセルは、少なくとも700μmの壁厚と、少なくとも50μmの上部内側表面と下部内側表面との間のギャップとを有し、イメージング性能メトリックは、フローセルの上部内側表面又は下部内側表面を、フローセルと少なくとも1つのイメージセンサとの間の光学経路内又は光学経路外に光学コンペンセータを移動させることなく、チューブレンズの1つ以上の光学素子を光学経路に沿って移動させることなく、かつチューブレンズの1つ以上の光学素子を光学経路内又は光学経路外に移動させることなく、イメージングするために実質的に同じである。
【0318】
いくつかの態様において、対物レンズは、市販の顕微鏡対物レンズであり得る。いくつかの態様において、市販の顕微鏡対物レンズは、少なくとも0.3の開口数を有し得る。いくつかの態様において、対物レンズは、少なくとも700μmの作動距離を有し得る。いくつかの態様において、対物レンズは、0.17mm又は0.17mmよりも大きい若しくは小さい厚さのカバースリップ厚さ(又はフローセル壁厚さ)を補償するように補正され得る。いくつかの態様において、光学システムは、カバースリップ厚さ、フローセル厚さ、又は所望の焦点面間の距離を補償するように補正され得る。いくつかの態様において、当該補正は、レンズ又は光学アセンブリなどの補正光学システムを光学システムの光路に挿入することによって行われ得る。いくつかの態様において、当該補正は、レンズ又は光学アセンブリなどの補正光学システムを光学システムの光路に挿入することなく行われ得る。いくつかの態様において、蛍光イメージングシステムは、対物レンズに隣接して、対物レンズとチューブレンズとの間に配置された電気光学位相プレートを更に備え得、電気光学位相プレートは、フローセルの上部内側表面と下部内側表面との間のギャップを満たす流体によって引き起こされる光学収差の補正を提供し得る。いくつかの態様において、少なくとも1つのチューブレンズは、3つ以上の光学部品を含む複合レンズであり得る。いくつかの態様において、少なくとも1つのチューブレンズは、第1の非対称凸凸レンズ、第2の凸平面レンズ、第3の非対称凹凹レンズ、及び第4の非対称凸凹レンズのうちの1つ以上を含み得、上記の順序で、又は任意の代替の順序で存在し得る、4つの光学部品を含む複合レンズである。いくつかの態様において、少なくとも1つのチューブレンズは、少なくとも1mmの壁厚を有するフローセルの内側表面をイメージングするときに、対物レンズ、少なくとも1つのチューブレンズ、及び少なくとも1つのイメージング素子の組み合わせについてのイメージング性能メトリックを補正するように構成される。いくつかの態様において、少なくとも1つのチューブレンズは、少なくとも100μmのギャップを有するフローセルの内側表面をイメージングするときに、対物レンズ、少なくとも1つのチューブレンズ、及び少なくとも1つのイメージング素子の組み合わせのイメージング性能メトリックを補正するように構成される。いくつかの態様において、少なくとも1つのチューブレンズは、少なくとも200μmのギャップを有するフローセルの内側表面をイメージングするときに、対物レンズ、少なくとも1つのチューブレンズ、及び少なくとも1つのイメージング素子の組み合わせについてのイメージング性能メトリックを補正するように構成される。いくつかの態様において、システムは、単一の対物レンズ、2つのチューブレンズ、及び2つのイメージセンサを含み、2つのチューブレンズの各々は、異なる蛍光波長において最適なイメージング性能を提供するように設計される。いくつかの態様において、システムは、単一の対物レンズ、3つのチューブレンズ、及び3つのイメージセンサを含み、3つのチューブレンズの各々は、異なる蛍光波長において最適なイメージング性能を提供するように設計される。いくつかの態様において、システムは、単一の対物レンズ、4つのチューブレンズ、及び4つのイメージセンサを含み、4つのチューブレンズの各々は、異なる蛍光波長において最適なイメージング性能を提供するように設計される。いくつかの態様において、対物レンズ又は少なくとも1つのチューブレンズの設計は、中~高空間周波数範囲における変調伝達関数を最適化するように構成される。いくつかの態様において、イメージング性能メトリックは、1つ以上の指定された空間周波数、脱焦点、球面収差、色収差、コマ、乱視、視野曲率、画像歪み、コントラスト対ノイズ比(CNR)、又はそれらのいずれかの組み合わせにおける変調伝達関数(MTF)の測定を含む。いくつかの態様において、フローセルの上部内側表面及び下部内側表面をイメージングするためのイメージング性能メトリックの差は、10%未満である。いくつかの態様において、フローセルの上部内側表面及び下部内側表面をイメージングするためのイメージング性能メトリックの差は、5%未満である。いくつかの態様において、少なくとも1つのチューブレンズを使用することにより、対物レンズ、動き作動型コンペンセータ、及びイメージセンサを備える従来のシステムについてのものと比較して、デュアルサイドイメージングについてのイメージング性能メトリックを少なくとも同等又はより良好に改善する。いくつかの態様において、少なくとも1つのチューブレンズを使用することにより、対物レンズ、動き作動型コンペンセータ、及びイメージセンサを備える従来のシステムについてのものと比較して、デュアルサイドイメージングについてのイメージング性能メトリックを少なくとも10%改善する。
【0319】
本明細書に開示されるのは、イメージングベースの固相ジェノタイピング及びシーケンシング用途で使用するための照明システムであり、照明システムは、a)光源と、b)光源によって放出される光を収集し、それをテザーされた生体巨大分子を含む支持体表面上の指定された照明野に送達するように構成された液体ライトガイドと、を備える。
【0320】
いくつかの態様において、照明システムは、集光レンズを更に備える。いくつかの態様において、指定された照明野は、少なくとも2mmの面積を有する。いくつかの態様において、指定された照明野に送達される光は、支持体表面の画像を取得するために使用されるイメージングシステムに対して指定された視野にわたって均一な強度のものである。いくつかの態様において、指定された視野は、少なくとも2mmの面積を有する。いくつかの態様において、指定された照明野に送達される光は、光強度の変動係数(CV)が10%未満であるとき、指定された視野にわたって均一な強度のものである。いくつかの態様において、指定された照明野に送達される光は、光強度の変動係数(CV)が5%未満であるとき、指定された視野にわたって均一な強度のものである。いくつかの態様において、指定された照明野に送達される光は、0.1未満のスペックルコントラスト値を有する。いくつかの態様において、指定された照明野に送達される光は、0.05未満のスペックルコントラスト値を有する。
【0321】
イメージングモジュール及びシステム:開示される光学システム、イメージングシステム、又はモジュールは、いくつかの事例では、試料又は基材表面をイメージングするように設計されたスタンドアロン光学システムであり得ることが当業者によって理解されるであろう。いくつかの事例では、それらは、1つ以上のプロセッサ又はコンピュータを備え得る。いくつかの事例では、それらは、器具制御機能及び/又は画像処理機能を提供する1つ以上のソフトウェアパッケージを備え得る。いくつかの事例では、光源(例えば、固体レーザ、染料レーザ、ダイオードレーザ、アークランプ、タングステンハロゲンランプなど)、レンズ、プリズム、ミラー、ダイクロイックリフレクタ、光学フィルタ、光バンドパスフィルタ、開口、及び画像センサ(例えば、相補的金属酸化物半導体(CMOS)画像センサ及びカメラ、電荷結合デバイス(CCD)画像センサ及びカメラなど)などの光学部品に加えて、それらはまた、X-Y並進ステージ、X-Y-Z並進ステージ、圧電気集束機構などの機械的及び/又は光機械的構成要素を備え得る。いくつかの事例では、それらは、ゲノミクス用途(例えば、遺伝子検査及び/又は核酸シーケンシング用途)のために設計されたより大きなシステムのモジュール、構成要素、サブアセンブリ、又はサブシステムとして機能し得る。例えば、いくつかの事例では、それらは、遮光及び/又は他の環境制御ハウジング、温度制御モジュール、流体制御モジュール、流体分配ロボット工学、ピックアンドプレースロボット工学、1つ以上のプロセッサ若しくはコンピュータ、1つ以上のローカル及び/若しくはクラウドベースのソフトウェアパッケージ(例えば、機器/システム制御ソフトウェアパッケージ、画像処理ソフトウェアパッケージ、データ分析ソフトウェアパッケージ)、データ格納モジュール、データ通信モジュール(例えば、Bluetooth、WiFi、イントラネット、若しくはインターネット通信ハードウェア及び関連するソフトウェア)、ディスプレイモジュール、又はそれらの任意の組み合わせを更に備える、より大きなシステムのモジュール、構成要素、サブアセンブリ、又はサブシステムとして機能し得る。
【0322】
シーケンシングのための方法
本開示のいくつかの態様は、固定化されたテンプレート分子又は固定化されていないテンプレート分子をシーケンシングするための方法を提供する。方法は、システム100において、例えば、シーケンサ114において操作することができる。いくつかの態様において、固定化されたテンプレート分子は、目的の標的配列の1つのコピーを有する複数の核酸テンプレート分子を含む。いくつかの態様において、目的の標的配列の1つのコピーを有する核酸テンプレート分子は、線形ライブラリ分子を使用してブリッジ増幅を行うことによって生成することができる。いくつかの態様において、固定化されたテンプレート分子は、目的の標的配列の2つ以上のタンデムコピーを各々が有する複数の核酸テンプレート分子(例えば、コンカテマー)を含む。いくつかの態様において、コンカテマー分子を含む核酸テンプレート分子は、環状化直鎖ライブラリ分子のローリングサークル増幅を行うことによって生成され得る。いくつかの態様において、固定化されていないテンプレート分子は、環状分子を含む。いくつかの態様において、シーケンシングのための方法は、可溶性(例えば、固定化されていない)シーケンシングポリメラーゼ又は支持体に固定化されたシーケンシングポリメラーゼを用いる。
【0323】
いくつかの態様において、シーケンシング反応は、検出可能に標識されたヌクレオチド類似体を用いる。いくつかの態様において、シーケンシング反応は、検出可能に標識された多価分子に結合することと、ヌクレオチド類似体を組み込むことと、を含む2段階シーケンシング反応を用いる。いくつかの態様において、シーケンシング反応は、非標識ヌクレオチド類似体を用いる。いくつかの態様において、シーケンシング反応は、リン酸塩鎖標識ヌクレオチドを用いる。
【0324】
いくつかの態様において、固定化コンカテマーは、各々、目的の配列(例えば、挿入領域)及び任意のアダプター配列のタンデムリピート単位を含む。例えば、タンデムリピート単位は、(i)第1の表面プライマー(720)に対する結合配列を有する左のユニバーサルアダプター配列(例えば、表面ピニングプライマー)、(ii)第1のシーケンシングプライマー(740)(例えば、フォワードシーケンシングプライマー)に対する結合配列を有する左のユニバーサルアダプター配列、(iii)目的の配列(710)、(iv)第2のシーケンシングプライマー(750)(例えば、リバースシーケンシングプライマー)に対する結合配列を有する右のユニバーサルアダプター配列、(v)第2の表面プライマー(730)(例えば、表面キャプチャプライマー)に対する結合配列を有する右のユニバーサルアダプター配列、及び(vii)左の試料インデックス配列(760)及び/又は右の試料インデックス配列(770)を含む。いくつかの態様において、タンデムリピート単位は、左の固有の識別配列(780)及び/又は右の固有の識別配列(790)を更に含む。いくつかの態様において、タンデムリピート単位は、コンパクションオリゴヌクレオチドに対する少なくとも1つの結合配列を更に含む。いくつかの態様において、図6及び7は、線形ライブラリ分子又はコンカテマー分子の単位を示す。
【0325】
固定化されたコンカテマーは、コンパクトな核酸ナノボールに自己崩壊することができる。RCA反応中に1つ以上のコンパクションオリゴヌクレオチドを含めることは、ナノボールのサイズ及び/又は形状を更にコンパクトにすることができる。所与のコンカテマーにおけるタンデムリピート単位の数における増加は、ポリメラーゼ触媒シーケンシング反応のための複数の開始部位として機能する複数のシーケンシングプライマー(例えば、ユニバーサル配列を有するシーケンシングプライマー)にハイブリダイズするためのコンカテマーに沿う部位の数を増加させる。シーケンシング反応が、検出可能に標識されたヌクレオチド及び/又は(例えば、ヌクレオチド単位を有する)検出可能に標識された多価分子を用いるときに、コンカテマーに沿う並列シーケンシング反応に関与するヌクレオチド又はヌクレオチド単位によって放出されるシグナルは、各々のコンカテマーについて増加したシグナル強度をもたらす。所与のコンカテマーの複数の部分が、同時にシーケンシングされ得る。更に、複数の結合複合体は、特定のコンカテマー分子に沿って形成することができ、各々の結合複合体は、テンプレート/プライマー二重鎖に結合した及び多価分子に結合したシーケンシングポリメラーゼを含み、複数の結合複合体は、解離することなく依然として安定しており、増加した持続時間をもたらし、増加した持続時間は、シグナル強度を増加させ、イメージング時間を低減する。
【0326】
ヌクレオチド類似体を使用したシーケンシングのための方法
本開示のいくつかの態様は、本明細書に記載される固定化されたテンプレート分子のうちのいずれかをシーケンシングするための方法であって、(a)シーケンシングポリメラーゼを、(i)核酸テンプレート分子及び(ii)核酸シーケンシングプライマーに接触させるステップを含み、接触させることが、シーケンシングポリメラーゼを、核酸プライマーにハイブリダイズする核酸テンプレート分子に結合するのに好適な条件下で行われ、核酸プライマーにハイブリダイズする核酸テンプレート分子が核酸二本鎖を形成する、方法を提供する。いくつかの態様において、シーケンシングポリメラーゼは、ヌクレオチド類似体を結合し、組み込むことができる組換え変異体シーケンシングポリメラーゼを含む。
【0327】
いくつかの態様において、テンプレート分子をシーケンシングするための方法では、シーケンシングプライマーは、3’伸長可能な末端又は3’伸長不可能な末端を含む。いくつかの態様において、複数の核酸テンプレート分子は、増幅されたテンプレート分子(例えば、クローン的に増幅されたテンプレート分子)を含む。いくつかの態様において、複数の核酸テンプレート分子は、目的の標的配列の1つのコピーを含む。いくつかの態様において、複数の核酸分子は、目的の標的配列(例えば、コンカテマー)の2つ以上のタンデムコピーを含む。いくつかの態様において、複数の核酸テンプレート分子は、同一の目的の標的配列又は異なる目的の標的配列を含む。いくつかの態様において、複数の核酸プライマーは、溶液中にあるか、又は支持体に固定化される。いくつかの態様において、複数の核酸テンプレート分子及び/又は複数の核酸プライマーが支持体に固定化される場合、第1のシーケンシングポリメラーゼとの結合は、複数の固定化された第1の複合型ポリメラーゼを生成する。いくつかの態様において、複数の核酸テンプレート分子及び/又は核酸プライマーは、支持体上の102~1015個の異なる部位に固定化される。いくつかの態様において、複数のテンプレート分子及び核酸プライマーと複数の第1のシーケンシングポリメラーゼとの結合は、支持体上の102~1015個の異なる部位に固定化される複数の第1の複合型ポリメラーゼを生成する。いくつかの態様において、支持体上の複数の固定化された第1の複合型ポリメラーゼは、事前に判定された部位又は支持体上のランダムな部位に固定化される。いくつかの態様において、複数の固定化された第1の複合型ポリメラーゼは、互いに流体連通して、試薬(例えば、シーケンシングポリメラーゼ、多価分子、ヌクレオチド、及び/又は二価カチオンを含む酵素)の溶液を支持体上に流すことを可能にし、その結果、支持体上の複数の固定化された複合型ポリメラーゼを超並列方法で試薬の溶液と反応させる。
【0328】
いくつかの態様において、シーケンシングのための方法は、ステップ(b):シーケンシングポリメラーゼを、少なくとも1つのヌクレオチドを、核酸二重鎖に結合するシーケンシングポリメラーゼに結合するのに好適であり、1つのヌクレオチドによってシーケンシングプライマーを伸長するポリメラーゼ触媒ヌクレオチド組み込みに好適である条件下で、複数のヌクレオチドと接触させることを更に含む。いくつかの態様において、シーケンシングポリメラーゼは、マグネシウム及び/又はマンガンを含む少なくとも1つの触媒カチオンの存在下で、複数のヌクレオチドと接触させる。いくつかの態様において、複数のヌクレオチドは、糖2’又は3’位に鎖終結部分を有する少なくとも1つのヌクレオチド類似体を含む。いくつかの態様において、鎖終結部分は、鎖終結部分をOH又はH基に変換するために、糖2’又は3’位から除去可能である。いくつかの態様において、複数のヌクレオチドは、鎖終結部分を欠く少なくとも1つのヌクレオチドを含む。いくつかの態様において、少なくともヌクレオチド上には、検出可能なシグナルを放出する検出可能なレポーター部分(例えば、フルオロフォア)で標識されている。検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、フルオロフォアは、抜くレオベースに付着している。いくつかの態様において、フルオロフォアは、ヌクレオ塩基にリンカーで付着しており、リンカーは、塩基から切断可能/除去可能である。いくつかの態様において、複数のヌクレオチドにおけるヌクレオチドのうちの少なくとも1つは、検出可能なレポーター部分で標識されていない。いくつかの態様において、ヌクレオチドに付着した特定の検出可能なレポーター部分(例えば、フルオロフォア)は、ヌクレオ塩基の検出及び識別を可能にするように、ヌクレオチド塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応することができる。組み込まれた鎖終結ヌクレオチドが検出可能に標識されるとき、ステップ(b)は、組み込まれた鎖終結ヌクレオチドから放出されたシグナルを検出することを更に含む。いくつかの態様において、ステップ(b)は、組み込まれた鎖終結ヌクレオチドのヌクレオ塩基を識別することを更に含む。
【0329】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):組み込まれた鎖終結ヌクレオチドから鎖終結部分を除去して、伸長可能な3’OH基を生成することを更に含む。いくつかの態様において、ステップ(c)は、組み込まれた鎖終結ヌクレオチドから検出可能な標識を除去することを更に含む。いくつかの態様において、シーケンシングポリメラーゼは、1つのヌクレオ塩基によって伸長されるシーケンシングプライマーにハイブリダイズされるテンプレート分子に結合したままである。
【0330】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):ステップ(b)及び(c)を少なくとも1回繰り返すことを更に含む。
【0331】
核酸シーケンシングのための2段階方法
本開示のいくつかの態様は、本明細書に記載される固定化されたテンプレート分子のうちのいずれかをシーケンシングするための2段階方法を提供する。いくつかの態様において、第1の段階は、概して、多価分子を複合型ポリメラーゼに結合させて、多価複合型ポリメラーゼを形成し、多価複合型ポリメラーゼを検出することを含む。
【0332】
いくつかの態様において、第1の段階は、(a)複数の第1のシーケンシングポリメラーゼを、(i)複数の核酸テンプレート分子及び(ii)複数の核酸シーケンシングプライマーに接触させることを含み、接触させることは、複数の第1のシーケンシングポリメラーゼを複数の核酸テンプレート分子及び複数の核酸プライマーに結合するのに好適な条件下で行われ、それによって複数の第1の複合型ポリメラーゼであって、各々が、核酸二重鎖に結合する第1のシーケンシングポリメラーゼを含む複数の第1の複合型ポリメラーゼを形成し、核酸二重鎖は、核酸プライマーにハイブリダイズする核酸テンプレート分子を含む。いくつかの態様において、第1のポリメラーゼは、組換え変異体シーケンシングポリメラーゼを含む。
【0333】
いくつかの態様において、テンプレート分子をシーケンシングするための方法では、シーケンシングプライマーは、3’伸長可能な末端又は3’伸長不可能な末端を有するオリゴヌクレオチドを含む。いくつかの態様において、複数の核酸テンプレート分子は、増幅されたテンプレート分子(例えば、クローン的に増幅されたテンプレート分子)を含む。いくつかの態様において、複数の核酸テンプレート分子は、目的の標的配列の1つのコピーを含む。いくつかの態様において、複数の核酸分子は、目的の標的配列(例えば、コンカテマー)の2つ以上のタンデムコピーを含む。いくつかの態様において、複数の核酸テンプレート分子中の核酸テンプレート分子は、同一の目的の標的配列又は異なる目的の標的配列を含む。いくつかの態様において、複数の核酸テンプレート分子及び/又は複数の核酸プライマーは、溶液中にあるか、又は支持体に固定化される。いくつかの態様において、複数の核酸テンプレート分子及び/又は複数の核酸プライマーが支持体に固定化される場合、第1のシーケンシングポリメラーゼとの結合は、複数の固定化された第1の複合型ポリメラーゼを生成する。いくつかの態様において、複数の核酸テンプレート分子及び/又は核酸プライマーは、支持体上の102~1015個の異なる部位に固定化される。いくつかの態様において、複数のテンプレート分子及び核酸プライマーと複数の第1のシーケンシングポリメラーゼとの結合は、支持体上の102~1015個の異なる部位に固定化される複数の第1の複合型ポリメラーゼを生成する。いくつかの態様において、支持体上の複数の固定化された第1の複合型ポリメラーゼは、事前に判定された部位又は支持体上のランダムな部位に固定化される。いくつかの態様において、複数の固定化された第1の複合型ポリメラーゼは、互いに流体連通して、試薬(例えば、シーケンシングポリメラーゼ、多価分子、ヌクレオチド、及び/又は二価カチオンを含む酵素)の溶液を支持体上に流すことを可能にし、その結果、支持体上の複数の固定化された複合型ポリメラーゼを超並列方法で試薬の溶液と反応させる。
【0334】
いくつかの態様において、シーケンシングするための方法は、ステップ(b):複数の第1の複合型ポリメラーゼを、複数の多価分子と接触させて、複数の多価複合型ポリメラーゼ(例えば、結合複合体)を形成することを更に含む。いくつかの態様において、複数の多価分子における個々の多価分子は、複数のヌクレオチドアームに付着したコアを含み、ヌクレオチドアームの各々は、ヌクレオチド(例えば、ヌクレオチド単位)に付着している(例えば、図9~13)。いくつかの態様において、ステップ(b)の接触させることは、多価分子の相補的ヌクレオチド単位を複数の第1の複合型ポリメラーゼのうちの少なくとも2つに結合させるのに好適である条件下で行われ、それによって、複数の多価複合型ポリメラーゼを形成する。いくつかの態様において、条件は、複数の多価複合型ポリメラーゼのプライマーへの相補的ヌクレオチド単位のポリメラーゼ触媒組み込みを阻害するのに好適である。いくつかの態様において、複数の多価分子は、複数のヌクレオチドアームを有する少なくとも1つの多価分子であって(例えば、図9~12)、各々が、ヌクレオチド類似体(例えば、ヌクレオチド類似体単位)で結合する少なくとも1つの多価分子を含み、ヌクレオチド類似体は、糖2’及び/又は3’位に鎖終結部分を含む。いくつかの態様において、複数の多価分子は、複数のヌクレオチドアームを含む少なくとも1つの多価分子を含み、複数のヌクレオチドアームは各々、鎖終結部分を欠くヌクレオチド単位と付着している。いくつかの態様において、複数の多価分子における多価分子のうちの少なくとも1つは、シグナルを放出する検出可能なレポーター部分で標識されている。いくつかの態様において、検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、ステップ(b)の接触させることは、ストロンチウム、バリウム、及び/又はカルシウムを含む少なくとも1つの非触媒カチオンの存在下で行われる。
【0335】
いくつかの態様において、シーケンシングのための方法は、ステップ(c):複数の多価複合型ポリメラーゼを検出することを更に含む。いくつかの態様において、検出することは、複合型ポリメラーゼに結合する多価分子によって放出されるシグナルを検出することを含み、多価分子の相補的ヌクレオチド単位は、プライマーに結合するが、相補的ヌクレオチド単位の組み込みは、阻害される。いくつかの態様において、多価分子は、検出を可能にするように、検出可能なレポーター部分で標識されている。いくつかの態様において、標識された多価分子は、多価分子のコア、リンカー、及び/又はヌクレオチド単位に付着したフルオロフォアを含む。
【0336】
いくつかの態様において、シーケンシングのための方法は、ステップ(d):複数の第1の複合型ポリメラーゼに結合した相補的ヌクレオチド単位の抜くレオ塩基を識別し、それによって、核酸テンプレートの配列を判定することを更に含む。いくつかの態様において、多価分子は、複数の第1の複合型ポリメラーゼに結合した相補的ヌクレオチド単位(例えば、ヌクレオチド塩基であるアデニン、グアニン、シトシン、チミン、又はウラシル)の特定を可能にするように、ヌクレオチドアームに付着した特定のヌクレオチド単位に対応する検出可能なレポーター部分で標識されている。
【0337】
いくつかの態様において、シーケンシングのための方法は、ステップ(e):複数の多価複合型ポリメラーゼを解離させ、複数の第1のシーケンシングポリメラーゼ及びそれらの結合した多価分子を除去し、複数の核酸二重鎖を保持することを更に含む。
【0338】
いくつかの態様において、2段階シーケンシング方法の第2の段階は、概して、ヌクレオチド組み込みを含む。いくつかの態様において、シーケンシングのための方法は、ステップ(f):ステップ(e)の複数の保持された核酸二重鎖を、複数の第2のシーケンシングポリメラーゼと接触させることであって、接触させることが、複数の第2のシーケンシングポリメラーゼを複数の保持された核酸二重鎖に結合させるのに好適である条件下で行われ、それによって、複数の第2の複合型ポリメラーゼを形成し、複数の第2の複合型ポリメラーゼが各々、核酸二重鎖に結合した第2のシーケンシングポリメラーゼを含む、接触させることを更に含む。いくつかの態様において、第2のシーケンシングポリメラーゼは、組換え変異体ポリメラーゼを含む。
【0339】
いくつかの態様において、ステップ(a)の複数の第1のシーケンシングポリメラーゼは、ステップ(f)の複数の第2のシーケンシングポリメラーゼとしてアミノ酸配列と100%同一であるアミノ酸配列を有する。いくつかの態様において、ステップ(a)の複数の第1のシーケンシングポリメラーゼは、ステップ(f)の複数の第2のシーケンシングポリメラーゼのアミノ酸配列と異なるアミノ酸配列を有する。
【0340】
いくつかの態様において、シーケンシングのための方法は、ステップ(g):複数の第2の複合型ポリメラーゼを、複数のヌクレオチドと接触させることであって、接触させることが、複数のヌクレオチドからの相補的ヌクレオチドを、第2の複合型ポリメラーゼのうちの少なくとも2つに結合させるのに好適である条件下で行われ、それによって、複数のヌクレオチド複合型ポリメラーゼを形成する、接触させることを更に含む。いくつかの態様において、ステップ(g)の接触させることは、結合した相補的ヌクレオチドのヌクレオチド複合型ポリメラーゼのプライマーへのポリメラーゼ触媒組み込みを促進するのに好適な条件下で行われ、それによってシーケンシングプライマーを1ヌクレオ塩基だけ伸長させる。いくつかの態様において、ステップ(g)においてシーケンシングプライマーの3’末端にヌクレオチドを組み込むことは、プライマー伸長反応を含む。いくつかの態様において、ステップ(g)の接触させることは、マグネシウム及び/又はマンガンを含む少なくとも1つの触媒カチオンの存在下で行われる。いくつかの態様において、複数のヌクレオチドは、天然ヌクレオチド(例えば、非類似体ヌクレオチド)又はヌクレオチド類似体を含む。いくつかの態様において、複数のヌクレオチドは、除去可能であるか又は除去可能でない2’及び/又は3’鎖終結部分を含む。いくつかの態様において、複数のヌクレオチドにおけるヌクレオチドのうちの少なくとも1つは、検出可能なレポーター部分で標識されていない。いくつかの態様において、複数のヌクレオチドは、非標識である。いくつかの態様において、複数のヌクレオチドは、検出可能なレポーター部分で標識された複数のヌクレオチドを含む。検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、フルオロフォアは、ヌクレオチド塩基に付着している。いくつかの態様において、フルオロフォアは、ヌクレオチド塩基にリンカーで付着しており、リンカーは、塩基から切断可能/除去可能であるか、又は塩基から除去可能でない。いくつかの態様において、ヌクレオチドに付着した特定の検出可能なレポーター部分(例えば、フルオロフォア)は、ヌクレオチド塩基の検出及び識別を可能にするように、ヌクレオチド塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応することができる。
【0341】
いくつかの態様において、ステップ(g)における複数のヌクレオチドが検出可能に標識されるとき、シーケンシングのための方法は、ステップ(h):ヌクレオチド複合型ポリメラーゼのプライマーに組み込まれる相補的ヌクレオチドを検出することを更に含む。いくつかの態様において、複数のヌクレオチドは、検出を可能にするように、検出可能なレポーター部分で標識されている。いくつかの態様において、ステップ(g)における複数のヌクレオチドが非標識である場合、ステップ(h)の検出することは省略される。
【0342】
いくつかの態様において、ステップ(g)における複数のヌクレオチドが検出可能に標識されるとき、シーケンシングのための方法は、ステップ(i):ヌクレオチド複合型ポリメラーゼのプライマーに組み込まれる相補的ヌクレオチドの塩基を識別することを更に含む。いくつかの態様において、ステップ(i)における組み込まれた相補的ヌクレオチドの識別は、ステップ(d)における複数の第1の複合型ポリメラーゼに結合する多価分子の相補的ヌクレオチドの同一性を確認するために使用することができる。いくつかの態様において、ステップ(i)の特定することは、核酸テンプレート分子の配列を判定するために使用され得る。いくつかの態様において、ステップ(g)における複数のヌクレオチドが非標識である場合、ステップ(i)の識別することは省略される。
【0343】
いくつかの態様において、シーケンシングのための方法は、ステップ(j):ステップ(g)が、複数の第2の複合型ポリメラーゼを、2’及び/又は3’鎖終結部分を有する少なくとも1つのヌクレオチドを含む複数のヌクレオチドと接触させることによって行われたときに、鎖終結部分を、組み込まれたヌクレオチドから除去することを更に含む。
【0344】
いくつかの態様において、シーケンシングのための方法は、ステップ(k):ステップ(a)~(j)を少なくとも1回繰り返すことを更に含む。いくつかの態様において、核酸テンプレート分子の配列は、ステップ(c)及び(d)において、シーケンシングポリメラーゼに結合するが、プライマーの3’末端内に組み込まれない多価分子を検出及び識別することによって判定され得る。いくつかの態様において、核酸テンプレート分子の配列は、ステップ(h)及び(i)において、プライマーの3’末端内に組み込まれるヌクレオチドを検出及び識別することによって判定(又は確認)され得る。
【0345】
いくつかの態様において、核酸分子をシーケンシングための方法のうちのいずれかにおいて、複数の第1の複合型ポリメラーゼを複数の多価分子と結合させることは、少なくとも1つのアビディティ複合体を形成し、方法は、以下のステップ、(a)第1の核酸プライマー、第1のシーケンシングポリメラーゼ、及び第1の多価分子をコンカテマーテンプレート分子の第1の部分に結合し、それによって第1の結合複合体を形成することであって、第1の多価分子の第1のヌクレオチド単位が、第1のシーケンシングポリメラーゼに結合する、形成することと、(b)第2の核酸プライマー、第2のシーケンシングポリメラーゼ、及び第1の多価分子を同じコンカテマーテンプレート分子の第2の部分に結合し、それによって第2の結合複合体を形成することであって、第1の多価分子の第2のヌクレオチド単位は、第2のシーケンシングポリメラーゼに結合し、同じ多価分子を含む第1及び第2の結合複合体は、アビディティ複合体を形成する、形成することと、を含む。いくつかの態様において、第1のシーケンシングポリメラーゼは、本明細書に記載されるいずれかの野生型又は変異体ポリメラーゼを含む。いくつかの態様において、第2のシーケンシングポリメラーゼは、本明細書に記載されるいずれかの野生型又は変異体ポリメラーゼを含む。コンカテマーテンプレート分子は、目的の配列及び少なくとも1つのユニバーサルシーケンシングプライマー結合部位のタンデムリピート配列を含む。第1及び第2の核酸プライマーは、コンカテマーテンプレート分子に沿ってシーケンシングプライマー結合部位に結合することができる。例示的な多価分子は、図9~12に示される。
【0346】
いくつかの態様において、核酸分子をシーケンシングための方法のうちのいずれかにおいて、方法は、複数の第1の複合型ポリメラーゼを複数の多価分子と結合して、少なくとも1つのアビディティ複合体を形成することを含み、方法は、以下のステップ、(a)複数のシーケンシングポリメラーゼ及び複数の核酸プライマーを、コンカテマー核酸コンカテマー分子の異なる部分と接触させて、同じコンカテマー分子上に少なくとも第1及び第2の複合ポリメラーゼを形成するステップと、(b)複数の多価分子を、同じコンカテマーテンプレート分子上の少なくとも第1及び第2の複合ポリメラーゼに、複数の多価分子からの単一の多価分子を第1及び第2の複合ポリメラーゼに結合するのに好適な条件下で接触させるステップであって、単一の多価分子の少なくとも第1のヌクレオチド単位は、コンカテマーテンプレート分子の第1の部分にハイブリダイズし、それによって第1の結合複合体(例えば、第1の三元複合体)を形成する第1のプライマーを含む第1の複合ポリメラーゼに結合し、単一の多価分子の少なくとも第2のヌクレオチド単位は、コンカテマーテンプレート分子の第2の部分にハイブリダイズし、それによって第2の結合複合体(例えば、第2の三元複合体)を形成する第2のプライマーを含む第2の複合ポリメラーゼに結合して、接触させることが、第1及び第2の結合複合体中の結合した第1及び第2のヌクレオチド単位のポリメラーゼ触媒による取り込みを阻害するのに好適な条件下で行われ、同じ多価分子に結合する第1及び第2の結合複合体がアビディティ複合体を形成する、接触させるステップと、(c)同じコンカテマーテンプレート分子上で第1及び第2の結合複合体を検出するステップと、(d)第1の結合複合体中の第1のヌクレオチド単位を識別し、それによってコンカテマーテンプレート分子の第1の部分の配列を決定し、第2の結合複合体中の第2のヌクレオチド単位を識別し、それによってコンカテマーテンプレート分子の第2の部分の配列を決定するステップと、を含む。いくつかの態様において、複数のシーケンシングポリメラーゼは、本明細書に記載されるいずれかの野生型又は変異体シーケンシングポリメラーゼを含む。コンカテマーテンプレート分子は、目的の配列及び少なくとも1つのユニバーサルシーケンシングプライマー結合部位のタンデムリピート配列を含む。複数の核酸プライマーは、コンカテマーテンプレート分子に沿ってシーケンシングプライマー結合部位に結合することができる。例示的な多価分子は、図10~13に示される。
【0347】
結合によるシーケンシング
本開示のいくつかの態様は、本明細書に記載される固定化されたテンプレート分子のうちのいずれかをシーケンシングするための方法であって、シーケンシング方法は、非標識鎖終結ヌクレオチドを用いる結合によるシーケンシング(SBB)手順を含む、方法を提供する。いくつかの態様において、結合によるシーケンシング(SBB)は、(a)プライミングされたテンプレート核酸を、三元複合体安定化条件下で少なくとも2つの別個の混合物と順次接触させるステップであって、少なくとも2つの別個の混合物は、各々、ポリメラーゼ及びヌクレオチドを含み、それによって、順次接触させるステップは、三元複合体安定化条件下で、プライミングされたテンプレート核酸が、テンプレートにおける第1、第2、及び第3の塩基の種類塩基の種類のヌクレオチド同族体を用いて接触されるプライミングされたテンプレート核酸をもたらす、順次接触させるステップと、(b)少なくとも2つの別個の混合物を調べて、三元複合体が形成されたかどうかを判定するステップと、(c)プライミングされたテンプレート核酸分子の次の正しいヌクレオチドを識別するステップであって、次の正しいヌクレオチドは、三元複合体がステップ(b)で検出された場合、第1、第2、又は第3の塩基の種類の同族体として識別され、次の正しいヌクレオチドは、ステップ(b)での三元複合体の不在に基づいて、第4の塩基の種類のヌクレオチド同族体であると推定される、識別するステップと、(d)次の正しいヌクレオチドを、ステップ(b)の後、プライミングされたテンプレート核酸を添加し、それによって伸長プライマーを産生するステップと、(e)伸長プライマーを含むプライミングされたテンプレート核酸に対してステップ(a)~(d)を繰り返すステップと、を含む。例示的な結合によるシーケンシング方法は、米国特許第10,246,744号及び同第10,731,141号(両方の特許の内容全体が参照により本明細書に組み込まれる)に記載されている。
【0348】
リン酸塩鎖標識ヌクレオチドを使用したシーケンシングのための方法
本開示のいくつかの態様は、固定化されていないテンプレート分子を結合する固定化されたシーケンシングポリメラーゼを使用したシーケンシングのための方法であって、シーケンシング反応が、リン酸塩鎖標識されたヌクレオチドで行われる、方法を提供する。いくつかの態様において、シーケンシング方法は、ステップ(a):複数のシーケンシングポリメラーゼが固定化された支持体を提供することを含む。いくつかの態様において、シーケンシングポリメラーゼは、プロセッシブDNAポリメラーゼを含む。いくつかの態様において、シーケンシングポリメラーゼは、例えば、Phi29DNAポリメラーゼを含む、野生型又は変異体DNAポリメラーゼを含む。いくつかの態様において、支持体は、複数の別個のコンパートメントを含み、シーケンシングポリメラーゼは、コンパートメントの底部に固定化される。いくつかの態様において、別個のコンパートメントは、光が浸透することができるシリカ底部を含む。いくつかの態様において、別個のコンパートメントは、金属クラッディングフィルム(例えば、アルミニウムクラッディングフィルム)の穴を含むナノフォトニック拘束構造で構成されたシリカ底部を含む。いくつかの態様において、金属クラッディングの穴は、例えば、およそ70nmの小さな開口部を有する。いくつかの態様において、ナノフォトニック拘束構造の高さは、およそ100nmである。いくつかの態様において、ナノフォトニック拘束構造は、ゼロモード導波路(ZMW)を備える。いくつかの態様において、ナノフォトニック拘束構造は、液体を含む。
【0349】
いくつかの態様において、シーケンシング方法は、ステップ(b):複数の固定化シーケンシングポリメラーゼを、複数の一本鎖環状核酸テンプレート分子及び複数のオリゴヌクレオチドシーケンシングプライマーと、個々の固定化シーケンシングポリメラーゼが一本鎖環状テンプレート分子に結合するのに好適であり、個々のシーケンシングプライマーが個々の一本鎖環状テンプレート分子にハイブリダイズするのに好適である条件下で接触させ、それによって複数のポリメラーゼ/テンプレート/プライマー複合体を生成することを更に含む。いくつかの態様において、個々のシーケンシングプライマーは、一本鎖環状テンプレート分子上のユニバーサルシーケンシングプライマー結合部位にハイブリダイズする。
【0350】
いくつかの態様において、シーケンシング方法は、ステップ(c):複数のポリメラーゼ/テンプレート/プライマー複合体を、芳香族塩基、5炭素糖(例えば、リボース又はデオキシリボース)、及び3~20個のリン酸基を含むリン酸塩鎖を各々が含む複数のリン酸塩鎖標識ヌクレオチドと接触させることであって、末端リン酸基が、検出可能なレポーター部分(例えば、フルオロフォア)に結合している、接触させることを更に含む。第1、第2、及び第3のリン酸基は、アルファ、ベータ、及びガンマホスフェート基と称され得る。いくつかの態様において、末端リン酸基に付着した特定の検出可能なレポーター部分は、ヌクレオ塩基の検出及び識別を可能にするように、ヌクレオ塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応する。いくつかの態様において、複数のポリメラーゼ/テンプレート/プライマー複合体を、ポリメラーゼ触媒ヌクレオチド組み込みに好適な条件下で、複数のリン酸塩鎖標識ヌクレオチドと接触させる。いくつかの態様において、シーケンシングポリメラーゼは、相補的リン酸塩鎖標識ヌクレオチドを結合し、テンプレート分子におけるヌクレオチドの反対側の相補的ヌクレオチドを組み込むことが可能である。いくつかの態様において、ポリメラーゼ触媒ヌクレオチド組み込み反応は、アルファリン酸基とベータリン酸基との間で切断し、それによって、フルオロフォアに連結された多リン酸塩鎖を放出する。
【0351】
いくつかの態様において、シーケンシング方法は、ステップ(d):シーケンシングポリメラーゼによって結合され、シーケンシングプライマーの末端に組み込まれる、リン酸塩鎖標識ヌクレオチドによって放出される蛍光シグナルを検出することを更に含む。いくつかの態様において、ステップ(d)は、シーケンシングポリメラーゼによって結合され、シーケンシングプライマーの末端に組み込まれるリン酸塩鎖標識ヌクレオチドを識別することを更に含む。
【0352】
いくつかの態様において、シーケンシング方法は、ステップ(d):ステップ(c)~(d)を少なくとも1回繰り返すことを更に含む。いくつかの態様において、リン酸塩鎖標識ヌクレオチドを用いるシーケンシング方法は、米国特許第7,170,050号、第7,302,146号、及び/又は第7,405,281号に記載の方法に従って行うことができる。
【0353】
シーケンシングポリメラーゼ
本開示のいくつかの態様は、核酸分子をシーケンシングするための方法であって、本明細書に記載されるシーケンシング方法のうちのいずれかが、少なくとも1つの種類のシーケンシングポリメラーゼ及び複数のヌクレオチドを用いるか、又は少なくとも1つの種類のシーケンシングポリメラーゼ及び複数のヌクレオチド及び複数の多価分子を用いる、方法を提供する。いくつかの態様において、シーケンシングポリメラーゼ(複数可)は、テンプレート分子におけるヌクレオチドの反対側の相補的ヌクレオチドを組み込むことが可能である。いくつかの態様において、シーケンシングポリメラーゼ(複数可)は、テンプレート分子におけるヌクレオチドの反対側の多価分子の相補的ヌクレオチド単位を結合することが可能である。いくつかの態様において、複数のシーケンシングポリメラーゼは、組換え変異体ポリメラーゼを含む。
【0354】
ヌクレオチド及び/又は多価分子でのシーケンシングにおける使用に好適であるポリメラーゼの例としては、クレノウDNAポリメラーゼ;Thermus aquaticus DNAポリメラーゼI(Taqポリメラーゼ);KlenTaqポリメラーゼ;Candidatus altiarchaeales古細菌;Candidatus Hadarchaeum Yellowstonense;Hadesarchaea古細菌;Euryarchaeota古細菌;Thermoplasmata古細菌;Thermococcusポリメラーゼ、例えば、Thermococcus litoralis、バクテリオファージT7 DNAポリメラーゼ;ヒトアルファ、デルタ、及びエプシロンDNAポリメラーゼ;バクテリオファージポリメラーゼ、例えば、T4、RB69、及びphi29バクテリオファージDNAポリメラーゼ;Pyrococcus furiosus DNAポリメラーゼ(Pfuポリメラーゼ);Bacillus subtilis DNAポリメラーゼIII;E.coli DNAポリメラーゼIIIアルファ及びエプシロン;9 degree Nポリメラーゼ;逆転写酵素、例えば、HIVタイプM若しくはO逆転写酵素;トリ骨髄芽球症ウイルス逆転写酵素;モロニーマウス白血病ウイルス(MMLV)逆転写酵素;又はテロメラーゼが挙げられるが、これらに限定されない。DNAポリメラーゼの更なる非限定的な例としては、様々な古細菌族、例えば、Aeropyrum、Archaeglobus、Desulfurococcus、Pyrobaculum、Pyrococcus、Pyrolobus、Pyrodictium、Staphylothermus、Stetteria、Sulfolobus、Thermococcus、及びVulcanisaetaなどからのもの、又はそれらのバリアントが挙げられ、これらは、当該技術分野で既知のそのようなポリメラーゼ、例えば、9 degrees N、VENT、DEEP VENT、THERMINATOR、Pfu、KOD、Pfx、Tgo、及びRB69ポリメラーゼを含む。
【0355】
ヌクレオチド
本開示のいくつかの態様は、本明細書に記載されるシーケンシング方法のうちのいずれかが、少なくとも1つのヌクレオチドを用いる、核酸分子をシーケンシングするための方法を提供する。ヌクレオチドは、塩基、糖、及び少なくとも1つのリン酸基を含む。いくつかの態様において、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、芳香族塩基、5炭素糖(例えば、リボース又はデオキシリボース)、及び1つ以上のリン酸基(例えば、1つ~10個のリン酸基)を含む。複数のヌクレオチドは、dATP、dGTP、dCTP、dTTP、及びdUTPからなる群から選択される少なくとも1つの種類のヌクレオチドを含むことができる。複数のヌクレオチドは、dATP、dGTP、dCTP、dTTP、及び/又はdUTPからなる群から選択される2つ以上の種類のヌクレオチドのいずれかの組み合わせの混合物において含むことができる。いくつかの態様において、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、ヌクレオチド類似体でない。いくつかの態様において、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、ヌクレオチド類似体を含む。
【0356】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、複数のヌクレオチドのうちの少なくとも1つのヌクレオチドは、1、2、又は3つのリン原子の鎖を含み、鎖は、典型的には、エステル又はホスホラミド結合を介して、糖部分の5’炭素に付着している。いくつかの態様において、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、リン鎖を有する類似体であり、リン鎖において、リン原子が一緒に、介在するO、S、NH、メチレン、又はエチレンと結合している。いくつかの態様において、鎖におけるリン原子は、O、S、又はBH3を含む置換された側鎖基を含む。いくつかの態様において、鎖は、ホスホロアミデート、ホスホロチオエート、ホスホルジチオエート、及びO-メチルホスホロアミダイト基を含む類似体で置換されたリン酸基を含む。
【0357】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、ターミネーターヌクレオチド類似体を含み、ターミネーターヌクレオチド類似体は、鎖終結部分(例えば、ブロッキング部分)を、糖2’位、糖3’位、又は糖2’及び3’位において有する。いくつかの態様において、鎖終結部分は、プライマー伸長反応中の新生の鎖における後続のヌクレオチド単位又は遊離ヌクレオチドのポリメラーゼ触媒組み込みを阻害することができる。いくつかの態様において、鎖終結部分は、3’糖ヒドロキシル位に付着しており、3’糖位において、糖は、リボース又はデオキシリボース糖部分を含む。いくつかの態様において、鎖終結部分は、ポリメラーゼ触媒ヌクレオチド組み込み反応において後続のヌクレオチドで伸長可能である3’OH糖基を有するヌクレオチドを生成するように、3’糖位から除去可能/切断可能である。いくつかの態様において、鎖終結部分は、アルキル基、アルケニル基、アルキニル基、アリル基、アリール基、ベンジル基、アジド基、アミン基、アミド基、ケト基、イソシアネート基、リン酸基、チオ基、ジスルフィド基、カーボネート基、尿素基、シリル基、又はアセタール基を含む。いくつかの態様において、鎖終結部分は、例えば、鎖終結部分を化学剤、pH変化、光、又は熱と反応させることによって、ヌクレオチドから切断可能/除去可能である。いくつかの態様において、鎖終結部分であるアルキル、アルケニル、アルキニル、及びアリルは、ピペリジンを有する又は2,3-ジクロロ-5,6-ジシアノ-1,4-ベンゾ-キノン(DDQ)を有するテトラキス(トリフェニルホスフィン)パラジウム(0)(Pd(PPh3)4)で切断可能である。いくつかの態様において、鎖終結部分であるアリール及びベンジルは、H2 Pd/Cで切断可能である。いくつかの態様において、鎖終結部分であるアミン、アミド、ケト、イソシアネート、ホスフェート、チオ、ジスルフィドは、ホスフィン、又はベータメルカプトエタノール若しくはジチオトリトール(DTT)を含むチオール基で切断可能である。いくつかの態様において、鎖終結部分であるカーボネートは、MeOH中の炭酸カリウム(K2CO3)、ピリジン中のトリエチルアミン、又は酢酸中のZn(AcOH)で切断可能である。いくつかの態様において、鎖終結部分である尿素及びシリルは、フッ化テトラブチルアンモニウム、ピリジン-HF、フッ化アンモニウム、又はトリエチルアミントリヒドロフルオリドで切断可能である。いくつかの態様において、鎖終結部分は、亜硝酸で切断可能/除去可能であり得る。いくつかの態様において、鎖終結部分は、亜硝酸塩を含む溶液、例えば、亜硝酸塩と、酸、例えば、酢酸、硫酸、又は硝酸との組み合わせを使用して切断可能/除去可能であり得る。いくつかの更なる態様において、当該溶液は、有機酸を含み得る。
【0358】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、複数のヌクレオチドにおける少なくとも1つのヌクレオチドは、ターミネーターヌクレオチド類似体を含み、ターミネーターヌクレオチド類似体は、鎖終結部分(例えば、ブロッキング部分)を、糖2’位、糖3’位、又は糖2’及び3’位において有する。いくつかの態様において、鎖終結部分は、アジド(azide)、アジド(azido)、及びアジドメチル基を含む。いくつかの態様において、鎖終結部分は、3’-O-アジド又は3’-O-アジドメチル基を含む。いくつかの態様において、鎖終結部分であるアジド(azide)、アジド(azido)、及びアジドメチル基は、ホスフィン化合物で切断可能/除去可能である。いくつかの態様において、ホスフィン化合物は、誘導体化トリアルキルホスフィン部分又は誘導体化トリアリールホスフィン部分を含む。いくつかの態様において、ホスフィン化合物は、トリス(2-カルボキシエチル)ホスフィン(TCEP)、又はビス-スルホトリフェニルホスフィン(BS-TPP)、又はトリス(ヒドロキシプロイル)ホスフィン(THPP)を含む。いくつかの態様において、切断剤は、4-ジメチルアミノピリジン(4-DMAP)を含む。いくつかの態様において、3’-O-アミノ基、3’-O-アミノメチル基、3’-O-メチルアミノ基、又はそれらの誘導体のうちの1つ以上を含む鎖終結部分は、亜硝酸を利用する機構を介して、又は亜硝酸を含む溶液を使用して、亜硝酸を用いて切断され得る。いくつかの態様において、3’-O-アミノ基、3’-O-アミノメチル基、3’-O-メチルアミノ基、又はそれらの誘導体のうちの1つ以上を含む鎖終結部分は、亜硝酸塩を含む溶液を使用して切断され得る。いくつかの態様において、例えば、亜硝酸塩は、酢酸、硫酸、又は硝酸などの酸と組み合わせられ得るか、又はそれらと接触させ得る。いくつかの更なる態様において、例えば、亜硝酸塩は、例えば、ギ酸、酢酸、プロピオン酸、酪酸、イソ酪酸などの有機酸と組み合わせられ得るか、又はそれらと接触させ得る。いくつかの態様において、鎖終結部分は、パラジウムデブロッキング試薬(例えば、Pd(0))で切断することができる3’-アセタール部分を含む。
【0359】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、ヌクレオチド類似体は、3’-デオキシヌクレオチド、2’,3’-ジデオキシヌクレオチド、3’-メチル、3’-アジド、3’-アジドメチル、3’-O-アジドアルキル、3’-O-エチニル、3’-O-アミノアルキル、3’-O-フルオロアルキル、3’-フルオロメチル、3’-ジフルオロメチル、3’-トリフルオロメチル、3’-スルホニル、3’-マロニル、3’-アミノ、3’-O-アミノ、3’-スルフヒドラル、3’-アミノメチル、3’-エチル、3’ブチル、3’-tertブチル、3’-フルオレニルメチルオキシカルボニル、3’tert-ブチルオキシカルボニル、3’-O-アルキルヒドロキシルアミノ基、3’-ホスホロチオート、3-O-ベンジル、及び3’-O-ベンジル、3-アセタール部分、又はそれらの誘導体からなる群から選択される鎖終結部分を含む。
【0360】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、複数のヌクレオチドは、検出可能なレポーター部分で標識された複数のヌクレオチドを含む。検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、フルオロフォアは、ヌクレオチド塩基に付着している。いくつかの態様において、フルオロフォアは、ヌクレオチド塩基にリンカーで付着しており、リンカーは、塩基から切断可能/除去可能である。いくつかの態様において、複数のヌクレオチドにおけるヌクレオチドのうちの少なくとも1つは、検出可能なレポーター部分で標識されていない。いくつかの態様において、ヌクレオチドに付着した特定の検出可能なレポーター部分(例えば、フルオロフォア)は、ヌクレオチド塩基の検出及び識別を可能にするように、ヌクレオチド塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応することができる。
【0361】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、ヌクレオチド塩基上の切断可能なリンカーは、アルキル基、アルケニル基、アルキニル基、アリル基、アリール基、ベンジル基、アジド基、アミン基、アミド基、ケト基、イソシアネート基、リン酸基、チオ基、ジスルフィド基、カーボネート基、尿素基、又はシリル基を含む切断可能な部分を含む。いくつかの態様において、塩基上の切断可能なリンカーは、切断可能な部分を化学剤、pH変化、光、又は熱と反応させることによって、塩基から切断可能/除去可能である。いくつかの態様において、切断可能な部分であるアルキル、アルケニル、アルキニル、及びアリルは、ピペリジンを有する又は2,3-ジクロロ-5,6-ジシアノ-1,4-ベンゾ-キノン(DDQ)を有するテトラキス(トリフェニルホスフィン)パラジウム(0)(Pd(PPh3)4)で切断可能である。いくつかの態様において、切断可能な部分であるアリール及びベンジルは、H2 Pd/Cで切断可能である。いくつかの態様において、切断可能な部分であるアミン、アミド、ケト、イソシアネート、ホスフェート、チオ、ジスルフィドは、ホスフィン、又はベータメルカプトエタノール若しくはジチオトリトール(DTT)を含むチオール基で切断可能である。いくつかの態様において、切断可能な部分であるカーボネートは、MeOH中の炭酸カリウム(K2CO3)、ピリジン中のトリエチルアミン、又は酢酸中のZn(AcOH)で切断可能である。いくつかの態様において、切断可能な部分である尿素及びシリルは、フッ化テトラブチルアンモニウム、ピリジン-HF、フッ化アンモニウム、又はトリエチルアミントリヒドロフルオリドで切断可能である。
【0362】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかにおいて、ヌクレオチド塩基上の切断可能なリンカーは、アジド(azide)、アジド(azido)、及びアジドメチル基を含む切断可能な部分を含む。いくつかの態様において、切断可能な部分であるアジド(azide)、アジド(azido)、及びアジドメチル基は、ホスフィン化合物で切断可能/除去可能である。いくつかの態様において、ホスフィン化合物は、誘導体化トリアルキルホスフィン部分又は誘導体化トリアリールホスフィン部分を含む。いくつかの態様において、ホスフィン化合物は、トリス(2-カルボキシエチル)ホスフィン(TCEP)、又はビス-スルホトリフェニルホスフィン(BS-TPP)、又はトリス(ヒドロキシプロイル)ホスフィン(THPP)を含む。いくつかの態様において、切断剤は、4-ジメチルアミノピリジン(4-DMAP)を含む。
【0363】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングのための方法のうちのいずれかにおいて、(例えば、糖2’及び/又は糖3’位における)鎖終結部分、及びヌクレオチド塩基上の切断可能なリンカーは、同じ又は異なる切断可能な部分を有する。いくつかの態様において、(例えば、糖2’及び/又は糖3’位における)鎖終結部分、及び塩基に結合した検出可能なレポーター部分は、同じ化学剤で化学的に切断可能/除去可能である。いくつかの態様において、(例えば、糖2’及び/又は糖3’位における)鎖終結部分、及び塩基に結合した検出可能なレポーター部位は、異なる化学剤で化学的に切断可能/除去可能である。
【0364】
多価分子
本開示のいくつかの態様は、本明細書に記載されるシーケンシング方法のうちのいずれかが、少なくとも1つの多価分子を用いる、核酸分子をシーケンシングするための方法を提供する。いくつかの態様において、多価分子は、コアに付着し、スターバースト、ヘルタースケルター、又はボトルブラシ構成を含む任意の構成を有する複数のヌクレオチドアームを含む(例えば、図9)。多価分子は、(1)コア及び(2)複数のヌクレオチドアームを含み、複数のヌクレオチドアームは、(i)コア付着部分、(ii)PEG部分を含むスペーサー、(iii)リンカー、及び(iv)ヌクレオチド単位を含み、コアは、複数のヌクレオチドアームに付着しており、スペーサーは、リンカーに付着しており、リンカーは、ヌクレオチド単位に付着している。いくつかの態様において、ヌクレオチド単位は、塩基、糖、及び少なくとも1つのリン酸基を含み、リンカーは、塩基を介して、ヌクレオチド単位に付着している。いくつかの態様において、リンカーは、脂肪族鎖又はオリゴエチレングリコール鎖を含み、両方のリンカー鎖は、2~6つのサブユニットを有する。いくつかの態様において、リンカーはまた、芳香族部分を含む。例示的なヌクレオチドアームを図13に示す。例示的な多価分子は、図9~12に示される。例示的なスペーサーを図14(上)に示し、例示的なリンカーを図15(下)及び図15に示す。リンカーに付着した例示的なヌクレオチドを図16~19に示す。例示的なビオチン化ヌクレオチドアームを図20に示す。
【0365】
いくつかの態様において、多価分子は、複数のヌクレオチドアームに結合するコアを含み、複数のヌクレオチドアームは、dATP、dGTP、dCTP、dTTP、及びdUTPからなる群から選択される同じ種類のヌクレオチド単位を有する。
【0366】
いくつかの態様において、多価分子は、複数のヌクレオチドアームに付着するコアを含み、各アームは、ヌクレオチド単位を含む。いくつかの態様において、ヌクレオチド単位は、芳香族塩基、5炭素糖(例えば、リボース又はデオキシリボース)、及び1つ以上のリン酸基(例えば、1つ~10個のリン酸基)を含む。複数の多価分子は、dATP、dGTP、dCTP、dTTP、及びdUTPからなる群から選択される1つの種類のヌクレオチド単位を有する1つの種類の多価分子を含むことができる。複数の多価分子は、2つ以上の種類の多価分子のいずれかの組み合わせの混合物において含むことができ、混合物における個々の多価分子は、dATP、dGTP、dCTP、dTTP、及び/又はdUTPからなる群から選択されるヌクレオチド単位を含む。
【0367】
いくつかの態様において、ヌクレオチド単位は、1、2、又は3つのリン原子の鎖を含み、鎖は、典型的には、エステル又はホスホラミド結合を介して、糖部分の5’炭素に付着している。いくつかの態様において、少なくとも1つのヌクレオチド単位は、リン鎖を有するヌクレオチド類似体であり、リン鎖において、リン原子が一緒に、介在するO、S、NH、メチレン、又はエチレンと結合している。いくつかの態様において、鎖におけるリン原子は、O、S、又はBH3を含む置換された側鎖基を含む。いくつかの態様において、鎖は、ホスホロアミデート、ホスホロチオエート、ホスホルジチオエート、及びO-メチルホスホロアミダイト基を含む類似体で置換されたリン酸基を含む。
【0368】
いくつかの態様において、多価分子は、複数のヌクレオチドアームに付着したコアを含み、個々のヌクレオチドアームは、糖2’位、糖3’位、又は糖2’及び3’位に鎖終結部分(例えば、ブロッキング部分)を有するヌクレオチド類似体であるヌクレオチド単位を含む。いくつかの態様において、ヌクレオチド単位は、糖2’位、糖3’位、又は糖2’及び3’位に鎖終結部分(例えば、ブロッキング部分)を含む。いくつかの態様において、鎖終結部分は、プライマー伸長反応中の新生の鎖における後続のヌクレオチド単位又は遊離ヌクレオチドのポリメラーゼ触媒組み込みを阻害することができる。いくつかの態様において、鎖終結部分は、3’糖ヒドロキシル位に付着しており、3’糖位において、糖は、リボース又はデオキシリボース糖部分を含む。いくつかの態様において、鎖終結部分は、ポリメラーゼ触媒ヌクレオチド組み込み反応において後続のヌクレオチドで伸長可能である3’OH糖基を有するヌクレオチドを生成するように、3’糖位から除去可能/切断可能である。いくつかの態様において、鎖終結部分は、アルキル基、アルケニル基、アルキニル基、アリル基、アリール基、ベンジル基、アジド基、アミン基、アミド基、ケト基、イソシアネート基、リン酸基、チオ基、ジスルフィド基、カーボネート基、尿素基、又はシリル基を含む。いくつかの態様において、鎖終結部分は、例えば、鎖終結部分を化学剤、pH変化、光、又は熱と反応させることによって、ヌクレオチド単位から切断可能/除去可能である。いくつかの態様において、鎖終結部分であるアルキル、アルケニル、アルキニル、及びアリルは、ピペリジンを有する又は2,3-ジクロロ-5,6-ジシアノ-1,4-ベンゾ-キノン(DDQ)を有するテトラキス(トリフェニルホスフィン)パラジウム(0)(Pd(PPh3)4)で切断可能である。いくつかの態様において、鎖終結部分であるアリール及びベンジルは、H2 Pd/Cで切断可能である。いくつかの態様において、鎖終結部分であるアミン、アミド、ケト、イソシアネート、ホスフェート、チオ、ジスルフィドは、ホスフィン、又はベータメルカプトエタノール若しくはジチオトリトール(DTT)を含むチオール基で切断可能である。いくつかの態様において、鎖終結部分であるカーボネートは、MeOH中の炭酸カリウム(K2CO3)、ピリジン中のトリエチルアミン、又は酢酸中のZn(AcOH)で切断可能である。いくつかの態様において、鎖終結部分である尿素及びシリルは、フッ化テトラブチルアンモニウム、ピリジン-HF、フッ化アンモニウム、又はトリエチルアミントリヒドロフルオリドで切断可能である。
【0369】
いくつかの態様において、ヌクレオチド単位は、糖2’位、糖3’位、又は糖2’及び3’位に鎖終結部分(例えば、ブロッキング部分)を含む。いくつかの態様において、鎖終結部分は、アジド(azide)、アジド(azido)、及びアジドメチル基を含む。いくつかの態様において、鎖終結部分は、3’-O-アジド又は3’-O-アジドメチル基を含む。いくつかの態様において、鎖終結部分であるアジド(azide)、アジド(azido)、及びアジドメチル基は、ホスフィン化合物で切断可能/除去可能である。いくつかの態様において、ホスフィン化合物は、誘導体化トリアルキルホスフィン部分又は誘導体化トリアリールホスフィン部分を含む。いくつかの態様において、ホスフィン化合物は、トリス(2-カルボキシエチル)ホスフィン(TCEP)、又はビス-スルホトリフェニルホスフィン(BS-TPP)、又はトリス(ヒドロキシプロイル)ホスフィン(THPP)を含む。いくつかの態様において、切断剤は、4-ジメチルアミノピリジン(4-DMAP)を含む。
【0370】
いくつかの態様において、ヌクレオチド単位は、3’-デオキシヌクレオチド、2’,3’-ジデオキシヌクレオチド、3’-メチル、3’-アジド、3’-アジドメチル、3’-O-アジドアルキル、3’-O-エチニル、3’-O-アミノアルキル、3’-O-フルオロアルキル、3’-フルオロメチル、3’-ジフルオロメチル、3’-トリフルオロメチル、3’-スルホニル、3’-マロニル、3’-アミノ、3’-O-アミノ、3’-スルフヒドラル、3’-アミノメチル、3’-エチル、3’ブチル、3’-tertブチル、3’-フルオレニルメチルオキシカルボニル、3’tert-ブチルオキシカルボニル、3’-O-アルキルヒドロキシルアミノ基、3’-ホスホロチオート、及び3-O-ベンジル、又はそれらの誘導体からなる群から選択される鎖終結部分を含む。
【0371】
いくつかの態様において、多価分子は、複数のヌクレオチドアームに付着するコアを含み、ヌクレオチドアームは、スペーサー、リンカー及びヌクレオチド単位を含み、コア、リンカー及び/又はヌクレオチド単位は、検出可能なレポーター部分で標識される。いくつかの態様において、検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、多価分子に付着した特定の検出可能なレポーター部分(例えば、フルオロフォア)は、ヌクレオチド塩基の検出及び識別を可能にするように、ヌクレオチド単位の塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応することができる。
【0372】
いくつかの態様において、多価分子の少なくとも1つのヌクレオチドアームは、検出可能なレポーター部分に付着したヌクレオチド単位を有する。いくつかの態様において、検出可能なレポーター部分は、ヌクレオチド塩基に付着している。いくつかの態様において、検出可能なレポーター部分は、フルオロフォアを含む。いくつかの態様において、多価分子に付着した特定の検出可能なレポーター部分(例えば、フルオロフォア)は、ヌクレオチド塩基の検出及び識別を可能にするように、ヌクレオチド単位の塩基(例えば、dATP、dGTP、dCTP、dTTP、又はdUTP)に対応することができる。
【0373】
いくつかの態様において、多価分子のコアは、アビジン様又はストレプトアビジン様部分を含み、コア付着部分は、ビオチンを含む。いくつかの態様において、コアは、アビジンタンパク質、並びに少なくとも1つのビオチン部分に結合することができる任意の誘導体、類似体、及び他の非天然形態のアビジンを含むストレプトアビジン型又はアビジン型部分を含む。アビジン部分の他の形態としては、天然及び組換えアビジン及びストレプトアビジン、並びに誘導体化分子、例えば、非グリコシル化アビジン及び切断ストレプトアビジンが挙げられる。例えば、アビジン部分は、アビジンの脱グリコシル化形態、Streptomyces(例えば、Streptomyces avidinii)によって産生される細菌ストレプトアビジン、並びに誘導体化形態、例えば、N-アシルアビジン、例えば、N-アセチル、N-フタリル、及びN-スクシニルアビジン、並びに市販の製品であるEXTRAVIDIN、CAPTAVIDIN、NEUTRAVIDIN、及びNEUTRALITE AVIDINを含む。
【0374】
いくつかの態様において、本明細書に記載される核酸分子をシーケンシングするための方法のうちのいずれかは、結合複合体を形成することを含んでもよく、結合複合体は、(i)ポリメラーゼ、プライマーと二重鎖を有する核酸テンプレート分子、及びヌクレオチドを含むか、又は結合複合体は、(ii)ポリメラーゼ、プライマーと二重鎖を有する核酸テンプレート分子、及び多価分子のヌクレオチド単位を含む。いくつかの態様において、結合複合体は、約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、又は1秒間超の持続時間を有する。結合複合体は、約0.1~0.25秒、若しくは約0.25~0.5秒、若しくは約0.5~0.75秒、若しくは約0.75~1秒、若しくは約1~2秒、若しくは約2~3秒、若しくは約3~4秒、若しくは約4~5秒を超える持続時間を有する、及び/又は本方法が15℃以上、20℃以上、25℃以上、35℃以上、37℃以上、42℃以上、55℃以上、60℃以上、若しくは72℃以上、若しくは80℃以上、又は前述のうちのいずれかによって定義される範囲内で実施されるか又は実施され得る。結合複合体(例えば、三元複合体)は、ポリメラーゼ、テンプレート分子、プライマー、及び/又はヌクレオチド単位若しくはヌクレオチドのうちのいずれかの間の相互作用の解離を引き起こす条件に供されるまで依然として安定している。例えば、解離条件は、結合複合体を、洗浄剤、EDTA、及び/若しくは水のうちのいずれか1つ、又はそれらのいずれかの組み合わせと接触させることを含む。いくつかの態様において、本開示は、結合複合体が、検出ステップにおいて20を超えるコントラストノイズ比を示す表面上に堆積されるか、それに付着するか、又はそれにハイブリダイズされる、当該方法を提供する。いくつかの態様において、本開示は、接触させることが、ヌクレオチド又はヌクレオチド単位がテンプレート核酸の次の塩基に相補的であるときに結合複合体を安定化し、ヌクレオチド又はヌクレオチド単位がテンプレート核酸の次の塩基に相補的でないときに結合複合体を不安定化する条件下で実行される、当該方法を提供する。
【0375】
コンパクションオリゴヌクレオチド
コンパクションオリゴヌクレオチドは、コンカテマー分子の第1の部分にハイブリダイズすることができる5’領域を有する一本鎖直鎖オリゴヌクレオチド、及びコンカテマー分子(例えば、同じコンカテマー分子)の第2の部分にハイブリダイズすることができる3’領域を有するコンパクションオリゴヌクレオチドを含む。いくつかの態様において、コンパクションオリゴヌクレオチドの個々のコンカテマー分子へのハイブリダイゼーションは、コンカテマー分子を、非崩壊DNA分子と比較して形状及びサイズがよりコンパクトなDNAナノボールに崩壊又は折り畳ませる。DNAナノボールのスポット画像は、ガウススポットとして表され得、サイズは、全幅半値(FWHM)として測定され得る。より小さいFWHMによって示されるより小さいスポットサイズは、典型的には、スポットの改善された画像と相関する。いくつかの態様において、DNAナノボールスポットのFWHMは、約10um以下であることができる。DNAナノボールは、DNAナノボールに崩壊/折り畳まれていないコンカテマーと比較して小さい全幅半値(FWHM)を有するコンパクトな核酸構造であり得る。
【0376】
いくつかの態様において、コンパクションオリゴヌクレオチドは、DNA、RNA、又はDNA及びRNAの組み合わせを含む一本鎖オリゴヌクレオチドを含む。コンパクションオリゴヌクレオチドは、長さが20~150個のヌクレオチド、又は30~100個のヌクレオチド、又は40~80個のヌクレオチドを含むいずれかの長さであることができる。
【0377】
いくつかの態様において、コンパクションオリゴヌクレオチドは、5’領域及び3’領域、並びに任意選択で、5’領域と3’領域との間の中間領域を含む。介在領域は、いずれかの長さ、例えば、2~20個のヌクレオチドであることができる。介在領域は、連続した同一の塩基(例えば、AAA、GGG、CCC、TTT、又はUUU)を有するホモポリマーを含む。介在領域は、非ホモポリマー配列を含む。
【0378】
コンパクションオリゴヌクレオチドの5’領域は、その長さに沿って、コンカテマー分子の第1の部分と完全に相補的であってもよく、又は部分的に相補的であってもよい。コンパクションオリゴヌクレオチドの3’領域は、その長さに沿って、コンカテマー分子の第2の部分と完全に相補的であってもよく、又は部分的に相補的であってもよい。コンパクションオリゴヌクレオチドの5’領域は、コンカテマー分子の第1のユニバーサル配列部分にハイブリダイズすることができる。コンパクションオリゴヌクレオチドの3’領域は、コンカテマー分子の第2のユニバーサル配列部分にハイブリダイズすることができる。コンパクションオリゴヌクレオチドの5’及び3’領域は、コンカテマーにハイブリダイズして、コンカテマーの遠位部分を一緒にし、コンカテマーのコンパクションを引き起こして、DNAナノボールを形成することができる。
【0379】
コンパクションオリゴヌクレオチドの5’領域は、3’領域と同じ配列を有することができる。コンパクションオリゴヌクレオチドの5’領域は、3’領域とは異なる配列を有することができる。コンパクションオリゴヌクレオチドの3’領域は、5’領域の逆配列である配列を有することができる。
【0380】
いくつかの態様において、配列データは、ナノ細孔シーケンシングを介して導出され得、ナノポアシーケンシングは、膜を横切って、例えば、細孔を介して、当該核酸をトランスロケーションすることによって核酸をシーケンシングすることを含み、配列リード又はベースコールは、トランスロケーション事象中に、インピーダンス、電流、電圧、又はキャパシタンスなどの1つ以上のシグナルを測定することによって行われる。いくつかの態様において、ヌクレオチドのアイデンティティは、電流ブロック、インピーダンス変化、電圧変化、又はキャパシタンス変化のタイミング、持続時間、範囲、又は線形などの独特の電気的署名によって判定され得る。膜を横切る及び/又は細孔を通るトランスロケーションによる核酸のシーケンシングは、光学的、化学的、生化学的、蛍光的、発光的、磁気的、電磁的、音響的、又は電気音響的検出などの代替の検出方法を排除しない。
【0381】
支持体及び低非特異的コーティング
いくつかの態様において、図1のフローセル112は、本明細書に開示される支持体、例えば、固体支持体を含むことができる。本開示は、ペアワイズシーケンシング組成物及び方法であって、複数のオリゴヌクレオチド表面プライマーが上に固定化された支持体を用いる、組成物及び方法を提供する。いくつかの態様において、支持体は、低非特異的結合コーティングで不動態化されている。本明細書に記載される表面コーティングは、核酸キャプチャ、増幅、及びシーケンシングワークフローのために典型的に使用される試薬、例えば、色素、ヌクレオチド、酵素、及び核酸プライマーへの非常に低い非特異的結合を示す。表面コーティングは、従来の表面コーティングと比較して、低いバックグラウンド蛍光シグナル又は高いコントラスト対ノイズ(CNR)比を示す。
【0382】
低非特異的結合コーティングは、1つの層又は複数の層を含む(図20)。いくつかの態様において、複数の表面プライマーが、低非特異的結合コーティングに固定化されている。いくつかの態様において、少なくとも1つの表面プライマーが、低非特異的結合コーティング内に埋め込まれている。低非特異的結合コーティングは、改善された核酸ハイブリダイゼーション及び増幅性能を可能にする。概して、支持体は、基材(又は支持体構造)と、共有結合的に又は非共有結合的に付着した低結合化学修飾層、例えば、シラン層、ポリマーフィルムのうちの1つ以上の層と、一本鎖核酸ライブラリ分子を支持体にデザーするために使用され得る1つ以上の共有結合的に又は非共有結合的に付着した表面プライマーと、を含む。いくつかの態様において、コーティングの配合、例えば、1つ以上の層の化学組成、1つ以上の層を支持体にかつ/又は互いに架橋させるために使用されるカップリング化学、並びに層の総数は、コーティングへのタンパク質、核酸分子、並びに他のハイブリダイゼーション及び増幅反応構成要素の非特異的結合が、同等の単層に対して最小化又は低減されるように変動し得る。本明細書に記載されるコーティングの配合は、コーティング上での非特異的ハイブリダイゼーションが、同等の単層に対して最小化又は低減されるように変動し得る。コーティングの配合は、コーティング上での非特異的増幅が、同等の単層に対して最小化又は低減されるように変動し得る。コーティングの配合は、コーティング上での特異的増幅率及び/又は収率が最大化されるように変動し得る。検出に好適である増幅レベルは、本明細書に開示されるいくつかの場合において、2、3、4、5、6、7、8、9、10、15、20、25、30回以下、又は30回超の増幅サイクルにおいて達成される。
【0383】
1つ以上の化学修飾層、例えば、低非特異的結合ポリマーの層を含む支持体構造は、独立したものであってもよく、又は別の構造若しくはアセンブリ内に統合されたものであってもよい。例えば、いくつかの態様において、支持体構造は、統合又はアセンブルされたマイクロ流体フローセル内の1つ以上の表面を含み得る。支持体構造は、マイクロプレートフォーマット内の1つ以上の表面、例えば、マイクロプレートにおけるウェルの底面を含み得る。いくつかの態様において、支持体構造は、キャピラリーの内側表面(例えば、ルーメン表面)を含む。いくつかの態様において、支持体構造は、平面チップ内にエッチングされたキャピラリーの内側表面(例えば、ルーメン表面)を含む。
【0384】
第1の化学修飾層を支持体の表面にグラフトするために使用される付着化学は、概して、表面が製造される材料及び層の化学的性質の両方に依存する。いくつかの態様において、第1の層は、表面に共有結合的に付着し得る。いくつかの態様において、第1の層は、支持体に、支持体と第1の層の分子構成要素との間の非共有結合相互作用、例えば、静電相互作用、水素結合、又はファンデルワールス相互作用を介して非共有結合的に付着、例えば、吸着し得る。いずれもの場合において、支持体は、第1の層の付着又は堆積前に処理され得る。当業者に既知の様々な表面調製技法のうちのいずれかが、表面を清浄化又は処理するために使用され得る。例えば、ガラス表面又はシリコン表面は、ピラニア溶液(硫酸(H2SO4)及び過酸化水素(H2O2)の混合物)、KOH及びNaOH中の塩基処理を使用して酸洗浄され得、かつ/又は酸素プラズマ処理方法を使用して清浄化され得る。
【0385】
シラン化学は、ガラス表面又はシリコン表面上のシラノール基を共有結合的に修飾して、より反応性の官能基(例えば、アミン又はカルボキシル基)を付着させるための非限定的な手法を構築し、次いで、これは、表面へのリンカー分子(例えば、様々な長さの直鎖炭化水素分子、例えば、C6、C12、C18炭化水素、又は直鎖ポリエチレングリコール(PEG)分子)又は層分子(例えば、分岐PEG分子又は他のポリマー)のカップリングにおいて使用され得る。開示される低結合コーティングのうちのいずれかの作製において使用され得る好適なシランの例としては、(3-アミノプロピル)トリメトキシシラン(APTMS)、(3-アミノプロピル)トリエトキシシラン(APTES)、様々なPEGシラン(例えば、1K、2K、5K、10K、20Kなどの分子量を含むもの)のうちのいずれか、アミノ-PEGシラン(すなわち、遊離アミノ官能基を含むもの)、マレイミド-PEGシラン、及びビオチン-PEGシランなどが挙げられるが、これらに限定されない。
【0386】
アミノ酸、ペプチド、ヌクレオチド、オリゴヌクレオチド、他のモノマー、若しくはポリマー、又はそれらの組み合わせを含むが、これらに限定されない、当業者に既知の様々な分子のうちのいずれかが、支持体上の1つ以上の化学修飾層の作製において使用され得、使用される構成要素の選択は、層の1つ以上の特性、例えば、官能基及び/若しくはテザーされたオリゴヌクレオチドプライマーの表面密度、層の親水性/疎水性、又は層の三次元性質(すなわち、「厚さ」)を改変するように変動し得る。開示されるコーティングのいずれかにおける低非特異的結合材料の1つ以上の層を作製するために使用され得るポリマーの例としては、様々な分子量及び分岐構造のポリエチレングリコール(PEG)、ストレプトアビジン、ポリアクリルアミド、ポリエステル、デキストラン、ポリ-リジン、及びポリ-リジンコポリマー、又はそれらのいずれかの組み合わせが挙げられるが、これらに限定されない。材料の1つ以上の層(例えば、ポリマー層)を表面にグラフトするために、かつ/又は層を互いに架橋させるために使用され得るコンジュゲーション化学の例としては、ビオチン-ストレプトアビジン相互作用(又はそれらの変形形態)、hisタグ-Ni/NTAコンジュゲーション化学、メトキシエーテルコンジュゲーション化学、カルボキシレートコンジュゲーション化学、アミンコンジュゲーション化学、NHSエステル、マレイミド、チオール、エポキシ、アジド、ヒドラジド、アルキン、イソシアネート、及びシランが挙げられるが、これらに限定されない。
【0387】
低非特異的結合表面コーティングは、支持体全体にわたって均一に適用され得る。代替的に、表面コーティングは、化学修飾層が支持体の1つ以上の個別の領域に制限されるようにパターン化され得る。例えば、コーティングは、フォトリソグラフィ技法を使用して、化学修飾領域の整列したアレイ又はランダムなパターンを支持体上で作製するようにパターン化され得る。代替的に又は組み合わせで、コーティングは、例えば、コンタクトプリンティング及び/又はインクジェットプリンティング技法を使用してパターン化され得る。いくつかの態様において、化学修飾領域の整列したアレイ又はランダムなパターンは、少なくとも1つ、5つ、10個、20個、30個、40個、50個、60個、70個、80個、90個、100個、200個、300個、400個、500個、600個、700個、800個、900個、1000個、2000個、3000個、4000個、5000個、6000個、7000個、8000個、9000個、又は10,000個以上の個別の領域を含み得る。
【0388】
いくつかの態様において、低非特異的結合コーティングは、支持体に非特異的に吸着しているか又は共有結合的にグラフトされている親水性ポリマーを含む。典型的には、不動態化は、ポリ(エチレングリコール)(PEG、これは、ポリエチレンオキシド(PEO)又はポリオキシエチレンとしても既知である)、又は支持体に、例えば、シラン化学を使用して結合した異なる分子量及び末端基を有する他の親水性ポリマーを使用して実行される。表面から遠位の末端基は、ビオチン、メトキシエーテル、カルボキシレート、アミン、NHSエステル、マレイミド、及びビス-シランを含むことができるが、これらに限定されない。いくつかの態様において、親水性ポリマー、例えば、直鎖ポリマー、分岐ポリマー、又は多分岐ポリマーの2つ以上の層が、表面上に堆積し得る。いくつかの態様において、2つ以上の層は、得られるコーティングの安定性を改善するために、互いに共有結合的にカップリングしてもよく、又は内部的に架橋してもよい。いくつかの態様において、異なるヌクレオチド配列及び/又は塩基修飾(又は他の生体分子、例えば、酵素若しくは抗体)を有する表面プライマーは、得られた層に、様々な表面密度でテザーされ得る。いくつかの態様において、例えば、表面官能基密度及び表面プライマー濃度の両方が、所望の表面プライマー密度範囲を達成するように変動し得る。加えて、表面プライマー密度は、表面プライマーを、同じ官能基を保有する他の分子で希釈することによって制御され得る。例えば、最終プライマー密度を低減するために、アミン標識表面プライマーが、NHSエステルコーティング表面との反応において、アミン標識ポリエチレングリコールで希釈され得る。また、ハイブリダイゼーション領域と表面付着官能基との間の異なる長さのリンカーを有する表面プライマーが、表面密度を制御するために適用され得る。好適なリンカーの例としては、プライマーの5’末端におけるポリT及びポリA鎖(例えば、0~20個の塩基)、PEGリンカー(例えば、3つ~20個のモノマー単位)、及び炭素鎖(例えば、C6、C12、C18など)が挙げられる。プライマー密度を測定するために、蛍光標識プライマーが、表面にテザーされ得、次いで、蛍光リードが、既知の濃度の色素溶液についてのものと比較され得る。
【0389】
いくつかの態様において、低非特異的結合コーティングは、少なくとも支持体の一部分に、支持体上の化学基を介して共有結合的に結合した官能化ポリマーコーティング層と、官能化ポリマーコーティングにグラフトされたプライマーと、プライマー及び官能化ポリマーコーティング上の水溶性保護コーティングと、を含む。いくつかの態様において、官能化ポリマーコーティングは、ポリ(N-(5-アジドアセトアミジルペンチル)アクリルアミド-コ-アクリルアミド(PAZAM)を含む。
【0390】
プライマー表面密度を調整し、追加の次元性を親水性又は両性コーティングに追加するために、PEG及び他の親水性ポリマーの多層コーティングを含む支持体が開発されている。以下に記載されるポリマー/コポリマー材料を含むが、これらに限定されない親水性及び両性表面層化手法を使用することによって、支持体上のプライマーロード密度を、顕著に増加させることが可能である。従来のPEGコーティング手法は、単層プライマー堆積を使用し、単層プライマー堆積は、概して、単一の分子の用途について報告されているが、核酸増幅用途について高いコピー数をもたらさない。本明細書に記載されるように、「層化」は、従来の架橋手法を使用して、2つ以上の高度に架橋した層を含む表面が順次構築され得るように、いずれかの適合性ポリマー又はモノマーサブユニットで達成され得る。好適なポリマーの例としては、ストレプトアビジン、ポリアクリルアミド、ポリエステル、デキストラン、ポリ-リジン、並びにポリ-リジン及びPEGのコポリマーが挙げられるが、これらに限定されない。いくつかの態様において、異なる層は、様々なコンジュゲーション反応のうちのいずれかを介して互いに付着し得、コンジュゲーション反応は、ビオチン-ストレプトアビジン結合、アジド-アルキンクリック反応、アミン-NHSエステル反応、チオール-マレイミド反応、及び正電荷を有するポリマーと負電荷を有するポリマーとの間のイオン相互作用を含むが、これらに限定されない。いくつかの態様において、高プライマー密度材料は、溶液中で構築され得、その後、複数のステップにおいて、表面上に層化され得る。
【0391】
支持体構造が製造され得る材料の例としては、ガラス、溶融シリカ、シリコン、ポリマー(例えば、ポリスチレン(PS)、マクロ多孔質ポリスチレン(MPPS)、ポリメチルメタクリレート(PMMA)、ポリカーボネート(PC)、ポリプロピレン(PP)、ポリエチレン(PE)、高密度ポリエチレン(HDPE)、環状オレフィンポリマー(COP)、環状オレフィンコポリマー(COC)、ポリエチレンテレフタレート(PET))、又はそれらのいずれかの組み合わせが挙げられるが、これらに限定されない。ガラス支持体構造及びプラスチック支持体構造の両方の様々な組成が企図される。
【0392】
支持体構造は、当業者に既知の様々な幾何学形状及び寸法のうちのいずれかにされ得、当業者に既知の様々な材料のうちのいずれかを含み得る。例えば、支持体構造は、局所的に平面であり得る(例えば、顕微鏡スライド又は顕微鏡スライドの表面を含む)。全般的に、支持体構造は、円柱状(例えば、キャピラリー又はキャピラリーの内側表面を含む)、球状(例えば、非多孔質ビーズの外側表面を含む)、又は不規則(例えば、不規則な形状の非多孔質ビーズ又は粒子の外側表面を含む)であり得る。いくつかの態様において、核酸ハイブリダイゼーション及び増幅のために使用される支持体構造の表面は、固体非多孔質表面であり得る。いくつかの態様において、核酸ハイブリダイゼーション及び増幅のために使用される支持体構造の表面は、多孔質であり得、これにより、本明細書に記載されるコーティングは、多孔質表面を浸透し、その上で実行される核酸ハイブリダイゼーション及び増幅反応は、細孔内で発生し得る。
【0393】
1つ以上の化学修飾層、例えば、低非特異的結合ポリマーの層を含む支持体構造は、独立したものであってもよく、又は別の構造若しくはアセンブリ内に統合されたものであってもよい。例えば、支持体構造は、統合又はアセンブルされたマイクロ流体フローセル内の1つ以上の表面を含み得る。支持体構造は、マイクロプレートフォーマット内の1つ以上の表面、例えば、マイクロプレートにおけるウェルの底面を含み得る。いくつかの態様において、支持体構造は、キャピラリーの内側表面(例えば、ルーメン表面)を含む。いくつかの態様において、支持体構造は、平面チップ内にエッチングされたキャピラリーの内側表面(例えば、ルーメン表面)を含む。
【0394】
上記のように、本開示の低非特異的結合支持体は、固相核酸増幅のために使用されるハイブリダイゼーション及び/又は増幅配合物のタンパク質、核酸、及び他の構成要素の低減された非特異的結合を示す。所与の支持体表面によって示される非特異的結合の程度は、定性的又は定量的のいずれかで評価され得る。表面を、標準化された条件のセット下で、例えば、蛍光色素(例えば、シアニン、例えば、Cy3若しくはCy5など、フルオレセイン、クマリン、ローダミンなど、又は本明細書に開示される他の色素)、蛍光標識ヌクレオチド、蛍光標識オリゴヌクレオチド、及び/又は蛍光標識タンパク質(例えば、ポリメラーゼ)に曝露し、続いて、特定のリンスプロトコル及び蛍光イメージングを行うことは、異なる表面配合物を含む支持体上での非特異的結合の比較のための定性的ツールとして使用され得る。いくつかの態様において、表面を、標準化された条件のセット下で、例えば、蛍光色素、蛍光標識ヌクレオチド、蛍光標識オリゴヌクレオチド、及び/又は蛍光標識タンパク質(例えば、ポリメラーゼ)に曝露し、続いて、特定のリンスプロトコル及び蛍光イメージングを行うことは、異なる表面配合物を含む支持体上での非特異的結合の比較のための定量的ツールとして使用され得るが、蛍光イメージングが、蛍光シグナルが支持体上のフルオロフォアの数に直線的に関係する(又は予測可能な様式で関係する)条件下(例えば、フルオロフォアのシグナル飽和及び/又は自己消光が問題でない条件下)で実行され、好適な較正基準が使用されることを確実にするように配慮されていることを条件とする。いくつかの態様において、当業者に既知の他の技法、例えば、放射性同位体標識及びカウント方法が、非特異的結合が本開示の異なる支持体表面配合物によって示される程度の定量的評価のために使用され得る。
【0395】
本明細書に開示されるいくつかの表面は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、75、100、若しくは100超、又は本明細書に記載される範囲によって包含されるいずれかの中間値のCy3などのフルオロフォアの特異的対非特異的結合の比を示す。本明細書に開示されるいくつかの表面は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、75、100、若しくは100超、又は本明細書に記載される範囲によって包含されるいずれかの中間値のCy3などのフルオロフォアの特異的対非特異的蛍光の比を示す。
【0396】
開示される低結合支持体によって示される非特異的結合の程度は、表面を、標識タンパク質(例えば、ウシ血清アルブミン(BSA)、ストレプトアビジン、DNAポリメラーゼ、逆転写酵素、ヘリカーゼ、一本鎖結合タンパク質(SSB)など、又はそれらのいずれかの組み合わせ)、標識ヌクレオチド、標識オリゴヌクレオチドなどと接触させるための標準化されたプロトコルを使用して、標準化されたインキュベーション及びリンス条件のセットの下で評価され得、続いて、表面上に残存する標識の量の検出、及びそれから得られたシグナルと適切な較正標準との比較が行われ得る。いくつかの態様において、標識は、蛍光標識を含み得る。いくつかの態様において、標識は、放射性同位体を含み得る。いくつかの態様において、標識は、当業者に既知のいずれかの他の検出可能な標識を含み得る。したがって、いくつかの態様において、所与の支持体表面配合物によって示される非特異的結合の程度は、1単位面積当たりの非特異的結合タンパク質分子(若しくは核酸分子、又は他の分子)の数の観点から評価され得る。いくつかの態様において、本開示の低結合支持体は、1μm2当たり0.001分子未満、1μm2当たり0.01分子未満、1μm2当たり0.1分子未満、1μm2当たり0.25分子未満、1μm2当たり0.5分子未満、1μm2当たり1分子未満、1μm2当たり10分子未満、1μm2当たり100分子未満、又は1μm2当たり1,000分子未満の非特異的タンパク質結合(又は他の特定の分子(例えば、シアニン、例えば、Cy3若しくはCy5など、フルオレセイン、クマリン、ローダミンなど、又は本明細書に開示される他の色素)の非特異的結合)を示し得る。本開示の所与の支持体表面は、この範囲内のいずれかの値である非特異的結合、例えば、1μm2当たり86分子未満の非特異的結合を示し得ることが、当業者には認識されよう。例えば、本明細書に開示されるいくつかの修飾表面は、リン酸緩衝生理食塩水(PBS)緩衝液中のCy3標識ストレプトアビジン(GE Amersham)の1μMの溶液と15分間接触させ、続いて、脱イオン水で3回リンスした後に、0.5分子/μm2未満の非特異的タンパク質結合を示す。本明細書に開示されるいくつかの修飾表面は、1μm2当たり0.25分子未満のCy3色素分子の非特異的結合を示す。独立した非特異的結合アッセイにおいて、1μMの標識Cy3 SA(ThermoFisher)、1μMのCy5 SA色素(ThermoFisher)、10μMのアミノアリル-dUTP-ATTO-647N(Jena Biosciences)、10μMのアミノアリル-dUTP-ATTO-Rhol 1(Jena Biosciences)、10μMのアミノアリル-dUTP-ATTO-Rhol 1(Jena Biosciences)、10μMの7-プロパルギルアミノ-7-デアザ-dGTP-Cy5(Jena Biosciences、及び10μMの7-プロパルギルアミノ-7-デアザ-dGTP-Cy3(Jena Biosciences)が、低結合コーティング支持体上で、37℃で15分間、384ウェルプレートフォーマットにおいてインキュベートされた。各々のウェルは、50ulの脱イオン化RNase/DNaseフリー水で2~3回され、pH7.4の25mMのACES緩衝液で2~3回リンスされた。384ウェルプレートは、GE Typhoon機器において、製造業者によって指定されるように(実行された色素試験に従って)Cy3、AF555、又はCy5フィルタセットを使用して、800のPMTゲイン設定及び50~100μmの解像度でイメージングされた。より高い解像度のイメージングのために、画像は、全反射照明蛍光(TIRF)対物レンズ(100×、1.5NA、Olympus)、CCDカメラ(例えば、Olympus EM-CCDモノクロカメラ、Olympus XM-10モノクロカメラ、又はOlympus DP80カラー及びモノクロカメラ)、照明源(例えば、Olympus 100W Hgランプ、Olympus 75W Xeランプ、又はOlympus U-HGLGPS蛍光光源)、及び532nm又は635nmの励起波長を有するOlympus IX83顕微鏡(例えば、倒立蛍光顕微鏡)(Olympus Corp.、Center Valley,Pa.)において収集された。ダイクロイックミラーは、Semrock(IDEX Health&Science,LLC、Rochester,N.Y.)から購入され、例えば、405、488、532、又は633nmのダイクロイックリフレクタ/ビームスプリッタであり、バンドパスフィルタは、適切な励起波長と一致する532LP又は645LPとして選択された。本明細書に開示されるいくつかの修飾表面は、1μm2当たり0.25分子未満の色素分子の非特異的結合を示す。いくつかの態様において、コーティング支持体は、画像が取得されつつ、緩衝液(例えば、25mMのACES、pH7.4)中に浸漬された。
【0397】
いくつかの態様において、本明細書に開示される表面は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、75、100、若しくは100超、又は本明細書に記載される範囲によって包含されるいずれかの中間値のCy3などのフルオロフォアの特異的対非特異的結合の比を示す。いくつかの態様において、本明細書に開示される表面は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、75、100、若しくは100超、又は本明細書に記載される範囲によって包含されるいずれかの中間値のCy3などのフルオロフォアについての特異的対非特異的蛍光シグナルの比を示す。
【0398】
本明細書の開示と一致する低バックグラウンド表面は、少なくとも4:1、5:1、6:1、7:1、8:1、9:1、10:1、15:1、20:1、30:1、40:1、50:1の特異的色素付着(例えば、Cy3付着)対非特異的色素吸着(例えば、Cy3色素吸着)比、又は非特異的に吸着した1分子当たり50超の付着した特異的色素分子を示し得る。同様に、励起エネルギーに供されたときに、フルオロフォア、例えば、Cy3が付着した、本明細書の開示と一致する低バックグラウンド表面は、少なくとも4:1、5:1、6:1、7:1、8:1、9:1、10:1、15:1、20:1、30:1、40:1、50:1、又は50:1超の(例えば、表面に付着したCy3標識オリゴヌクレオチドから生じる)特異的蛍光シグナル対非特異的吸着色素蛍光シグナルの比を示し得る。
【0399】
いくつかの態様において、開示される支持体表面の親水性の程度(又は水溶液との「濡れ性」)は、例えば、水接触角の測定を介して評価され得、この測定において、小さい水滴が、表面上に配置され、表面とのその接触角が、例えば、光学テンシオメータを使用して測定される。いくつかの態様において、静的接触角が判定され得る。いくつかの態様において、前進又は後退接触角が判定され得る。いくつかの態様において、本明細書に開示される表面処理された親水性低結合支持体についての水接触角は、約0度~約30度の範囲であり得る。いくつかの態様において、本明細書に開示される表面処理された親水性低結合支持体についての水接触角は、50度、40度、30度、25度、20度、18度、16度、14度、12度、10度、8度、6度、4度、2度、又は1度以下であり得る。多くの場合において、接触角は、40度以下である。本開示の所与の親水性低結合支持体表面は、この範囲内のいずれかにおける値を有する水接触角を示し得ることが、当業者には認識されよう。
【0400】
いくつかの態様において、本明細書に開示される親水性表面は、しばしば、低結合表面への生体分子の低減された非特異的結合に起因して、バイオアッセイのため低減された洗浄時間を容易にする。いくつかの態様において、適切な洗浄ステップは、60、50、40、30、20、15、10秒間未満、又は10秒間未満内で実行され得る。例えば、適切な洗浄ステップは、30秒間未満内で実行され得る。
【0401】
本開示のいくつかの低結合表面は、溶媒及び高温への長期曝露に対する、又は溶媒曝露若しくは温度における変化の繰り返されるサイクルに対する安定性又は耐久性における顕著な改善を示す。例えば、開示される表面の安定性は、表面上の官能基、又は表面上のテザーされた生体分子(例えば、オリゴヌクレオチドプライマー)を蛍光標識し、溶媒及び高温への、又は溶媒曝露若しくは温度における変化の繰り返されるサイクルへの長期曝露前に、それ中に、かつその後に、蛍光シグナルを監視することによって試験され得る。いくつかの態様において、表面の品質を評価するために使用される蛍光における変化の程度は、溶媒及び/又は高温への曝露の1分間、2分間、3分間、4分間、5分間、10分間、20分間、30分間、40分間、50分間、60分間、2時間、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、15時間、20時間、25時間、30時間、35時間、40時間、45時間、50時間、又は100時間の期間にわたって、1%、2%、3%、4%、5%、10%、15%、20%、又は25%未満(又はこれらの期間にわたって測定された場合のこれらの百分率のいずれかの組み合わせ)であり得る。いくつかの態様において、表面の品質を評価するために使用される蛍光における変化の程度は、5回のサイクル、10回のサイクル、20回のサイクル、30回のサイクル、40回のサイクル、50回のサイクル、60回のサイクル、70回のサイクル、80回のサイクル、90回のサイクル、100回のサイクル、200回のサイクル、300回のサイクル、400回のサイクル、500回のサイクル、600回のサイクル、700回のサイクル、800回のサイクル、900回のサイクル、又は1,000回のサイクルの溶媒変化及び/又は温度における変化への繰り返される曝露にわたって、1%、2%、3%、4%、5%、10%、15%、20%、又は25%未満(又はサイクルのこの範囲にわたって測定された場合のこれらの百分率のいずれかの組み合わせ)であり得る。
【0402】
いくつかの態様において、本明細書に開示される表面は、特異的シグナル対非特異的シグナル又は他のバックグラウンドの高い比を示し得る。例えば、核酸増幅のために使用されるときに、いくつかの表面は、表面の隣接する非集合領域のシグナルよりも少なくとも4、5、6、7、8、9、10、15、20、30、40、50、75、100、又は100倍超大きい増幅シグナルを示し得る。同様に、いくつかの表面は、表面の隣接する増幅された核酸集合領域のシグナルよりも少なくとも4、5、6、7、8、9、10、15、20、30、40、50、75、100、又は100倍超大きい増幅シグナルを示す。
【0403】
いくつかの態様において、核酸ハイブリダイゼーション又は増幅用途において、(例えば、フルオロフォアで直接又は間接的に標識された)ハイブリダイズした又はクローン的に増幅された核酸分子のポロニーを作製するために使用されるときの開示される低バックグラウンド表面の蛍光画像は、少なくとも10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、20、210、220、230、240、250、又は250超のコントラスト対ノイズ比(CNR)を示す。
【0404】
1つ以上のタイプのプライマーが、支持体表面に付着してもよく又はテザーされてもよい。いくつかの態様において、1つ以上のタイプのアダプター又はプライマーは、スペーサー配列、アダプターライゲーションされた標的ライブラリ核酸配列へのハイブリダイゼーションのためのアダプター配列、フォワード増幅プライマー、リバース増幅プライマー、シーケンシングプライマー、及び/若しくは分子バーコード配列、又はそれらのいずれかの組み合わせを含み得る。いくつかの態様において、1つのプライマー又はアダプター配列が、表面の少なくとも1つの層にテザーされ得る。いくつかの態様において、少なくとも2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、又は10個超の異なるプライマー又はアダプター配列が、表面の少なくとも1つの層にテザーされ得る。
【0405】
いくつかの態様において、テザーされたアダプター及び/又はプライマー配列は、約10個のヌクレオチド~約100個のヌクレオチドの範囲の長さであり得る。いくつかの態様において、テザーされたアダプター及び/又はプライマー配列は、少なくとも10個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、又は少なくとも100個のヌクレオチド長であり得る。いくつかの態様において、テザーされたアダプター及び/又はプライマー配列は、最大100個、最大90個、最大80個、最大70個、最大60個、最大50個、最大40個、最大30個、最大20個、又は最大10個のヌクレオチド長であり得る。この段落に記載される下限及び上限値のうちのいずれかが、本開示内に含まれる範囲を形成するように組み合わされ得、例えば、いくつかの態様において、テザーされたアダプター及び/又はプライマー配列の長さは、約20個のヌクレオチド~約80個のヌクレオチドの範囲であり得る。テザーされたアダプター及び/又はプライマー配列の長さは、この範囲内のいずれかの値、例えば、約24個のヌクレオチドを有し得ることが、当業者には認識されよう。
【0406】
いくつかの態様において、本開示の低結合支持体表面上のプライマー(例えば、キャプチャプライマー)の得られる表面密度は、1μm2当たり約100個のプライマー分子~1μm2当たり約100,000個のプライマー分子の範囲であり得る。いくつかの態様において、本開示の低結合支持体表面上のプライマーの得られる表面密度は、1μm2当たり約1,000個のプライマー分子~1μm2当たり約1,000,000個のプライマー分子の範囲であり得る。いくつかの態様において、プライマーの表面密度は、1μm2当たり少なくとも1,000個、少なくとも10,000個、少なくとも100,000個、又は少なくとも1,000,000個の分子であり得る。いくつかの態様において、プライマーの表面密度は、1μm2当たり最大1,000,000個、最大100,000個、最大10,000個、又は最大1,000個の分子であり得る。この段落に記載される下限及び上限値のうちのいずれかが、本開示内に含まれる範囲を形成するように組み合わされ得、例えば、いくつかの態様において、プライマーの表面密度は、1μm2当たり約10,000分子~1μm2当たり約100,000分子の範囲であり得る。プライマー分子の表面密度は、この範囲内のいずれかの値、例えば、1μm2当たり約455,000個の分子を有し得ることが、当業者には認識されよう。いくつかの態様において、支持体表面上のアダプター又はプライマー配列に最初にハイブリダイズした標的ライブラリ核酸配列の表面密度は、テザーされたプライマーの表面密度について示されるもの以下であり得る。いくつかの態様において、支持体表面上のアダプター又はプライマー配列にハイブリダイズしたクローン的に増幅された標的ライブラリ核酸配列の表面密度は、テザーされたプライマーの表面密度について示されるものと同じ範囲を包含する。
【0407】
上記で列挙される局所密度は、表面が、例えば、500,000/μm2のオリゴ密度を有する領域を含みつつ、また、実質的に異なる局所密度を有する少なくとも第2の領域を含み得るように、密度が表面にわたって変動することを排除しない。
【0408】
いくつかの態様において、開示される反応配合物及び低結合支持体を使用する核酸ハイブリダイゼーション及び/又は増幅反応の性能は、蛍光イメージング技法を使用して評価され得、画像のコントラスト対ノイズ比(CNR)は、増幅特異性及び支持体上での非特異的結合の評価における重要なメトリックを提供する。CNRは、一般に、CNR=(シグナル-バックグラウンド)/ノイズとして定義される。バックグラウンド項は、一般に、特定の関心領域(ROI)における特定の特徴(回折限界スポット、DLS)を取り囲むインタースティシャル領域について測定されたシグナルであると考えられる。シグナル対ノイズ比(SNR)は、しばしば、全体的な信号品質のベンチマークであると考えられるが、以下の例に示されるように、改善されたCNRは、迅速な画像キャプチャを必要とする用途(例えば、サイクル時間が最小化されなければならないシーケンシング用途)における信号品質についてのベンチマークとして、SNRよりも顕著な利点を提供できることが示され得る。高いCNRで、正確な識別に到達するために必要とされるイメージング時間(したがって、シーケンシング用途の場合において、正確なベースコーリング)は、CNRにおける中程度の改善であっても著しく低減され得る。イメージング統合時間についてのイメージングデータにおける改善されたCNRは、支持体表面上のクローン的に増幅された核酸コロニーなどの特徴をより正確に検出するための方法を提供する。
【0409】
ほとんどのアンサンブルベースのシーケンシング手法において、バックグラウンド項は、典型的には、「インタースティシャル」領域に関連するシグナルとして測定される。「インタースティシャル」バックグラウンド(Binter)に加えて、「イントラスティシャル」バックグラウンド(Bintra)は、増幅されたDNAコロニーによって占められる領域内に存在する。これらの2つのバックグラウンドシグナルの組み合わせは、達成可能なCNRを決定し、その後、光学機器要件、アーキテクチャコスト、試薬コスト、実行時間、コスト/ゲノムに直接影響し、最終的に、環状アレイベースのシーケンシング用途についての精度及びデータ品質に直接影響する。Binterバックグラウンドシグナルは、様々な供給源から生じ、いくつかの例としては、消耗フローセルからの自己蛍光、ROIからのシグナルを不明瞭にし得るスプリアス蛍光シグナルをもたらす検出分子の非特異的吸着、非特異的DNA増幅産物(例えば、プライマー二量体から生じるもの)の存在が挙げられる。典型的な次世代シーケンシング(NGS)用途において、現在の視野(FOV)におけるこのバックグラウンドシグナルは、経時的に平均化され、減算される。個々のDNAコロニーから生じるシグナル(すなわち、FOVにおける(シグナル)-B(インタースティシャル))は、分類され得る識別可能な特徴をもたらす。いくつかの態様において、イントラスティシャルバックグラウンド(B(イントラスティシャル))は、目的の標的に特異的でないが、同じROIにおいて存在する交絡蛍光シグナルに寄与し得、したがって、平均化及び減算をはるかにより困難にする。
【0410】
本明細書に記載される低結合コーティング支持体上での核酸増幅は、B(インタースティシャル)バックグラウンドシグナルを、非特異的結合を低減することによって減少させ得、特異的核酸増幅における改善をもたらし得、インタースティシャル及びイントラスティシャル領域の両方から生じるバックグラウンドシグナルに影響し得る非特異的増幅における減少をもたらし得る。いくつかの態様において、任意選択で、開示されるハイブリダイゼーション及び/又は増幅反応配合物との組み合わせで使用される、開示される低結合コーティング支持体は、CNRにおける改善を、従来の支持体、並びにハイブリダイゼーション、増幅、及び/又はシーケンシングプロトコルを使用して達成されるものよりも2、5、10、100、250、500、又は1000倍もたらし得る。蛍光イメージングをリードアウト又は検出モードとして使用するという文脈において本明細書に記載されるが、同じ原理が、光学及び非光学検出モードの両方を含む他の検出モードのための、開示される低結合コーティング支持体、並びに核酸ハイブリダイゼーション及び増幅配合物の使用にも適用される。
【0411】
本明細書で提供される表題は、本開示の様々な態様の限定ではなく、これらの態様は、本明細書全体を参照することによって理解され得る。
【0412】
別途定義されない限り、本明細書で使用される全ての技術及び科学用語は、別途定義されない限り、当業者によって一般に理解される意味を有する。概して、本明細書に記載される分子生物学、核酸化学、タンパク質化学、遺伝学、微生物学、遺伝子導入細胞産生、及びハイブリダイゼーションの技法に関する用語は、当該技術分野で周知であり一般に使用されるものである。本明細書に記載される技法及び手順は、概して、当該技術分野で周知の従来の方法に従って実行され、本明細書全体にわたって引用及び考察される様々な全般的な及びより具体的な参照文献に記載されているように実行される。例えば、Sambrook et al.,Molecular Cloning:A Laboratory Manual(Third ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2000)を参照されたい。また、Ausubel et al.,Current Protocols in Molecular Biology,Greene Publishing Associates(1992)を参照されたい。本明細書に記載される実験手順及び技法に関連して使用される命名法、並びに実験手順及び技法は、当該技術分野で周知であり一般に使用されるものである。
【0413】
別途本明細書で文脈によって必要とされない限り、単数形の用語は、複数形を含み、複数形の用語は、単数形を含む。1つという言及に明確にかつ明解に限定されない限り、単数形の「a」、「an」、及び「the」、並びにいずれもの単語の単数形の使用は、複数の言及を含む。
【0414】
代替の用語(例えば、「又は」)の使用は、代替形態の一方若しくは両方、又はそれらのいずれかの組み合わせのいずれかを意味すると理解される。
【0415】
本明細書で使用される場合、「及び/又は」という用語は、特定の特徴又は構成要素の各々が、他方を有するか又は有しないという具体的な開示を意味すると理解されるべきである。例えば、本明細書で「A及び/又はB」という語句などにおいて使用される場合、「及び/又は」という用語は、「A及びB」、「A又はB」、「A」(A単独で)、及び「B」(B単独で)を含むことが意図されている。同様の様式で、「A、B、及び/又はC」という語句などにおいて使用される場合、「及び/又は」という用語は、以下の態様、「A、B、及びC」、「A、B、又はC」、「A又はC」、「A又はB」、「B又はC」、「A及びB」、「B及びC」、「A及びC」、「A」(A単独で)、「B」(B単独で)、及び「C」(C単独で)の各々を包含することが意図されている。
【0416】
本明細書及び添付の特許請求の範囲で使用される場合、「含む(comprising)」、「含む(including)」、「有する(having)」、及び「含有する(containing)」という用語、並びに本明細書で使用される場合、それらの文法上の変形は、列挙内の1つの項目又は複数の項目が、列挙された項目に置換又は追加され得る他の項目を排除しないように非限定的であることが意図されている。態様が、「含む(comprising)」という用語で本明細書に記載されるいかなる場合も、「からなる」及び/又は「から本質的になる」という用語で記載される別法の類似の態様もまた提供されることが理解される。
【0417】
本明細書で使用される場合、「約」、「およそ」、及び「実質的に」という用語は、当業者によって判定される場合の、特定の値又は組成物についての許容されるエラー範囲内である値又は組成物を指し、許容されるエラー範囲は、どのように値又は組成物が測定又は判定されるか、すなわち、測定システムの制限に部分的に依存する。例えば、「約」、「およそ」、又は「実質的に」とは、当該技術分野における実施当たり1つの又は2つ以上の標準偏差内を意味することができる。代替的に、「約」又は「およそ」とは、測定システムの制限に依存して、最大10%(すなわち、±10%)以上の範囲を意味することができる。例えば、約5mgは、4.5mg~5.5mgのいずれかの数を含むことができる。更に、特に、生物学的システム又はプロセスに関して、この用語は、値の最大1桁又は最大5倍を意味することができる。特定の値又は組成物が本開示で提供されるときに、別途記載されない限り、「約」、「およそ」、「実質的に」の意味は、この特定の値又は組成物についての許容されるエラー範囲内であると考えられるべきである。また、値の範囲及び/又はサブ範囲が提供される場合、範囲及び/又はサブ範囲は、範囲及び/又はサブ範囲の終点を含むことができる。
【0418】
本明細書で使用される「ポロニー」という用語は、核酸ライブラリ分子を溶液内又は支持体上でクローン的に増幅して、シーケンシングのためのテンプレート分子として機能することができるアンプリコンを生成することができることを指す。いくつかの態様において、線形ライブラリ分子を環状化して、環状化ライブラリ分子を生成することができ、環状化ライブラリ分子を溶液内又は支持体上でクローン的に増幅して、コンカテマーを生成することができる。いくつかの態様において、コンカテマーは、シーケンシングされ得る核酸テンプレート分子として機能し得る。コンカテマーは、ポロニーと呼ばれることもある。いくつかの態様において、ポロニーは、ヌクレオチド鎖を含む。
【0419】
「ペプチド」、「ポリペプチド」、及び「タンパク質」という用語並びに本明細書で使用される他の関連用語は、同義的に使用され、アミノ酸のポリマーを指し、任意の特定の長さに限定されない。ポリペプチドは、天然及び非天然アミノ酸を含み得る。ポリペプチドとしては、組換え型又は化学合成型が挙げられる。また、ポリペプチドには、タンパク質分解切断、リボソームスキッピングによる切断、ヒドロキシル化、メチル化、脂質化、アセチル化、SUMO化、ユビキチン化、グリコシル化、リン酸化、及び/又はジスルフィド結合形成などの翻訳後修飾をまだ受けていない前駆体分子も含まれる。これらの用語は、タンパク質配列の天然及び人工タンパク質、タンパク質断片及びポリペプチド類似体(変異タンパク質、バリアント、キメラタンパク質、及び融合タンパク質など)、並びに翻訳後、又はそうでなければ共有結合的若しくは非共有結合的に修飾されたタンパク質を包含する。
【0420】
「ポリメラーゼ」という用語及びそのバリアントは、本明細書で使用される場合、ヌクレオチド(その類似体を含む)の核酸鎖への重合を触媒することができる任意の酵素を含む。典型的には、必ずしもそうではないが、そのようなヌクレオチド重合は、テンプレートに依存的な様式で発生することができる。典型的には、ポリメラーゼは、1つ以上の活性部位を含み、1つ以上の活性部位において、ヌクレオチド結合及び/又はヌクレオチド重合の触媒が発生することができる。いくつかの態様において、ポリメラーゼは、他の酵素活性、例えば、3’から5’エキソヌクレアーゼ活性又は5’から3’エキソヌクレアーゼ活性を含む。いくつかの態様において、ポリメラーゼは、鎖置換活性を有する。ポリメラーゼは、自然発生のポリメラーゼ並びにそれらのいずれかのサブユニット及び切断化、変異体ポリメラーゼ、バリアントポリメラーゼ、組換え、融合又は別法で操作されたポリメラーゼ、化学修飾ポリメラーゼ、合成分子又はアセンブリ、並びにヌクレオチド重合を触媒する能力を保持するそれらのいずれかの類似体、誘導体、又は断片(例えば、触媒活性断片)を含むことができるが、これらに限定されない。いくつかの態様において、ポリメラーゼは、細胞から単離されてもよく、又は組換えDNA技術若しくは化学合成方法を使用して生成されてもよい。いくつかの態様において、ポリメラーゼは、原核生物、真核生物、ウイルス、又はファージ生物において発現され得る。いくつかの態様において、ポリメラーゼは、翻訳後修飾タンパク質又はそれらの断片であることができる。ポリメラーゼは、原核生物、真核生物、ウイルス、又はファージに由来することができる。ポリメラーゼは、DNA指向性DNAポリメラーゼ及びRNA指向性DNAポリメラーゼを含む。
【0421】
本明細書で使用される場合、「忠実度」という用語は、テンプレート依存性DNAポリメラーゼによるDNA重合の精度を指す。DNAポリメラーゼの忠実度は、典型的には、エラー率(不正確なヌクレオチド、すなわち、テンプレートヌクレオチドと相補的でないヌクレオチドを組み込む頻度)によって測定される。DNA重合の精度又は忠実度は、DNAポリメラーゼのポリメラーゼ活性及び3’から5’エキソヌクレアーゼ活性の両方によって維持される。
【0422】
本明細書で使用される場合、「結合複合体」という用語は、核酸二重鎖、ポリメラーゼ、及び多価分子の遊離ヌクレオチド又はヌクレオチド単位を一緒に結合させることによって形成される複合体であって、核酸二重鎖が、核酸プライマーにハイブリダイズした核酸テンプレート分子を含む、複合体を指す。結合複合体において、遊離ヌクレオチド又はヌクレオチド単位は、核酸プライマーの3’末端に、核酸テンプレート分子における相補的ヌクレオチドの反対側である位置において結合してもよく又は結合しなくてもよい。「三元複合体」は、核酸二重鎖、ポリメラーゼ、及び多価分子の遊離ヌクレオチド又はヌクレオチド単位を一緒に結合させることによって形成される結合複合体の例であり、遊離ヌクレオチド又はヌクレオチド単位は、(核酸二重鎖の一部分として)核酸プライマーの3’末端に、核酸テンプレート分子における相補的ヌクレオチドと反対側である位置において結合している。
【0423】
「持続時間」という用語及び関連用語は、結合複合体が、構成要素のうちのいずれもが解離することなく依然として安定している時間の長さであって、結合複合体の構成要素が、核酸テンプレート及び核酸プライマー、ポリメラーゼ、多価分子のヌクレオチド単位、又は遊離(例えば、非コンジュゲート型の)ヌクレオチドを含む、時間の長さを指す。ヌクレオチド単位又は遊離ヌクレオチドは、テンプレート分子におけるヌクレオチド残基と相補的であってもよく、又は非相補的であってもよい。ヌクレオチド単位又は遊離ヌクレオチドは、核酸プライマーの3’末端に、核酸テンプレート分子における相補的ヌクレオチド残基の反対側である位置において結合することができる。持続時間は、結合複合体の安定性及び結合相互作用の強度を示す。持続時間は、結合複合体の開始及び/又は持続時間を観察することによって、例えば、結合複合体の標識構成要素からのシグナルを観察することによって測定され得る。例えば、標識ヌクレオチド、又は1つ以上のヌクレオチドを含む標識試薬は、結合複合体において存在し得、したがって、標識からのシグナルが、結合複合体の持続時間中に検出されることを可能にする。1つの例示的な標識は、蛍光標識である。結合複合体(例えば、三元複合体)は、ポリメラーゼ、テンプレート分子、プライマー、及び/又はヌクレオチド単位若しくはヌクレオチドのうちのいずれかの間の相互作用の解離を引き起こす条件に供されるまで依然として安定している。例えば、解離条件は、結合複合体を、洗浄剤、EDTA、及び/若しくは水のうちのいずれか1つ、又はそれらのいずれかの組み合わせと接触させることを含む。
【0424】
本明細書で使用される「核酸」、「ポリヌクレオチド」、及び「オリゴヌクレオチド」という用語、並びに他の関連用語は、互換的に使用され、ヌクレオチドのポリマーを指し、いずれもの特定の長さに限定されない。核酸は、組換え及び化学合成形態を含む。核酸としては、DNA分子(例えば、cDNA又はゲノムDNA)、RNA分子(例えば、mRNA)、ヌクレオチド類似体を使用して生成されたDNA又はRNAの類似体(例えば、ペプチド核酸及び天然に存在しないヌクレオチド類似体)、並びにDNA及びRNAを含有するキメラ型が挙げられる。核酸は、一本鎖又は二本鎖であり得る。核酸は、ヌクレオチドのポリマーを含み、ヌクレオチドは、自然又は非自然塩基及び/又は糖を含む。核酸は、自然発生のヌクレオシド間結合、例えば、ホスホジエステル結合を含む。核酸は、非自然ヌクレオシド間結合を含み、非自然ヌクレオシド間結合は、ホスホロチオエート、ホスホロチオレート、又はペプチド核酸(PNA)結合を含む。いくつかの態様において、核酸は、1つの種類のポリヌクレオチド、又は2つ以上の異なる種類のポリヌクレオチドの混合物を含む。
【0425】
本明細書で使用される「プライマー」という用語及び関連する用語は、DNA及び/又はRNAポリヌクレオチドテンプレートとハイブリダイズし、二本鎖分子を形成することができる天然又は合成のうちのいずれかのオリゴヌクレオチドを指す。プライマーは、いずれかの長さを有し得るが、典型的には、4つ~50個のヌクレオチドの範囲であり得る。典型的なプライマーは、5’末端及び3’末端を含む。プライマーの3’末端は、ポリメラーゼ媒介プライマー伸長反応におけるヌクレオチド重合開始部位として機能する3’OH部分を含むことができる。代替的に、プライマーの3’末端は、3’OH部分を欠くことができるか、又はポリメラーゼ媒介反応においてヌクレオチド重合を阻害する末端3’ブロック基を含むことができる。プライマーの長さに沿ういずれか1つのヌクレオチド又は2つ以上のヌクレオチドは、検出可能なレポーター部分で標識され得る。プライマーは、溶液中にあってもよく(例えば、可溶性プライマー)、又は支持体に固定化されてもよい(例えば、キャプチャプライマー)。
【0426】
「テンプレート核酸」、「テンプレートポリヌクレオチド」、「標的核酸」、「標的ポリヌクレオチド」、「テンプレート鎖」、及び他の変形は、相補的な核酸鎖を生成するための基礎核酸分子として機能する核酸鎖を指す。テンプレート核酸は、一本鎖若しくは二本鎖であってもよく、又はテンプレート核酸は、一本鎖若しくは二本鎖部分を有してもよい。テンプレート核酸の配列は、相補鎖の配列に部分的又は完全に相補的であり得る。テンプレート核酸は、自然発生の供給源若しくは組換え形態から得られてもよく、又はいずれかの種類の核酸類似体を含むように化学的に合成されてもよい。テンプレート核酸は、直鎖、環状、又は他の形態であることができる。テンプレート核酸は、目的の配列としても既知である挿入配列を有する挿入領域を含むことができる。テンプレート核酸はまた、少なくとも1つのアダプター配列を含むことができる。テンプレート核酸は、目的の配列及び少なくとも1つのアダプター配列の2つの又はタンデムコピーを有するコンカテマーであることができる。挿入領域は、いずれかの形態で単離され得、形態は、染色体、ゲノム、オルガネラ(例えば、ミトコンドリア、葉緑体、又はリボソーム)、組換え分子、クローニング、増幅、cDNA、前駆体mRNA若しくはmRNAなどのRNA、オリゴヌクレオチド、新鮮凍結パラフィン包埋組織から得られる全ゲノムDNA、針生検、無細胞循環DNA、又はいずれかのタイプの核酸ライブラリの形態を含む。挿入領域は、いずれかの供給源から単離され得、供給源は、原核生物、真核生物(例えば、ヒト、植物、及び動物)、真菌などの生物、ウイルス細胞、組織、正常若しくは疾患細胞若しくは組織、血液、尿、血清、リンパ液、腫瘍、唾液、肛門及び膣分泌物、羊水試料、汗、精液、環境試料、培養試料を含む体液、又は組換え分子生物学若しくは化学合成方法を使用して調製された合成核酸分子を含む。挿入領域は、いずれかの臓器から単離され得、臓器は、頭部、頸部、脳、乳房、卵巣、子宮頸部、結腸、直腸、子宮内膜、胆嚢、腸、膀胱、前立腺、精巣、肝臓、肺、腎臓、食道、膵臓、甲状腺、下垂体、胸腺、皮膚、心臓、喉頭、又は他の臓器を含む。テンプレート核酸は、シーケンシング及び組成分析を含む核酸分析に供され得る。
【0427】
核酸分子に関して使用されるときに、「ハイブリダイズする」若しくは「ハイブリダイズすること」若しくは「ハイブリダイゼーション」という用語、又は他の関連用語は、二重鎖核酸を形成するための2つの異なる核酸間の水素結合を指す。ハイブリダイゼーションはまた、二重鎖領域を有する自己ハイブリダイゼーション分子を形成するための単一の核酸分子の2つの異なる領域間の水素結合を含む。ハイブリダイゼーションは、二重鎖二本鎖核酸、又は核酸分子内の二本鎖領域を形成するためのワトソンクリック又はフーグステイン結合を含むことができる。二本鎖核酸、又は単一の核酸の2つの異なる領域は、完全に相補的であってもよく又は部分的に相補的であってもよい。相補的核酸鎖は、それらの長さ全体にわたって互いにハイブリダイズする必要はない。相補的塩基対形成は、標準的なA-T若しくはC-G塩基対形成であってもよく、又は塩基対形成相互作用の他の形態であってもよい。二重鎖核酸は、ミスマッチ塩基対形成ヌクレオチドを含み得る。
【0428】
「ヌクレオチド」という用語及び関連用語は、芳香族塩基、5炭素糖(例えば、リボース又はデオキシリボース)、及び少なくとも1つのリン酸基を含む分子を指す。標準又は非標準ヌクレオチドは、この用語の使用と一致する。いくつかの態様において、リン酸は、一リン酸、二リン酸、若しくは三リン酸、又は対応するリン酸類似体を含む。いくつかの態様において、ヌクレオチドは、1、2、3、4、5、6、7、8、9、又は10個のリン酸基を含む。「ヌクレオシド」という用語は、芳香族塩基及び糖を含む分子を指す。
【0429】
ヌクレオチド(及びヌクレオシド)は、典型的には、置換された又は非置換の窒素含有親ヘテロ芳香族環を含むヘテロ環状塩基を含み、これらは、核酸において一般に見出され、自然発生の、置換された、修飾された、若しくは操作されたバリアント、又はそれらの類似体を含む。ヌクレオチド(又はヌクレオシド)の塩基は、適切な相補的塩基とのワトソンクリック及び/又はフーグステイン水素結合を形成することが可能である。例示的な塩基としては、プリン及びピリミジン、例えば、2-アミノプリン、2,6-ジアミノプリン、アデニン(A)、エテノアデニン、N6-Δ2-イソペンテニルアデニン(6iA)、N6-Δ2-イソペンテニル-2-メチルチオアデニン(2ms6iA)、N6-メチルアデニン、グアニン(G)、イソグアニン、N2-ジメチルグアニン(dmG)、7-メチルグアニン(7mG)、2-チオピリミジン、6-チオグアニン(6sG)、ヒポキサンチン、及びO6-メチルグアニン;7-デアザ-プリン、例えば、7-デアザアデニン(7-デアザ-A)及び7-デアザグアニン(7-デアザ-G);ピリミジン、例えば、シトシン(C)、5-プロピニルシトシン、イソシトシン、チミン(T)、4-チオチミン(4sT)、5,6-ジヒドロチミン、O4-メチルチミン、ウラシル(U)、4-チオウラシル(4sU)、及び5,6-ジヒドロウラシル(ジヒドロウラシル;D);インドール、例えば、ニトロインドール及び4-メチルインドール;ピロール、例えば、ニトロピロール;ネブラリン;イノシン;ヒドロキシメチルシトシン;5-メチシトシン;塩基(Y);並びにメチル化、グリコシル化、及びアシル化塩基部分などが挙げられるが、これらに限定されない。追加の例示的な塩基は、Fasman,1989,“Practical Handbook of Biochemistry and Molecular Biology”,pp.385-394,CRC Press,Boca Raton,Flaに見出され得る。
【0430】
ヌクレオチド(及びヌクレオシド)は、典型的には、糖部分、例えば、炭素環式部分(Ferraro and Gotor 2000Chem.Rev.100:4319-48)、非環式部分(Martinez,et al.,1999 Nucleic Acids Research 27:1271-1274、Martinez,et al.,1997 Bioorganic&Medicinal Chemistry Letters vol.7:3013-3016)、及び他の糖部分(Joeng,et al.,1993J.Med.Chem.36:2627-2638、Kim,et al.,1993J.Med.Chem.36:30-7、Eschenmosser 1999 Science 284:2118-2124及び米国特許第5,558,991号)を含む。糖部分は、リボシル;2’-デオキシリボシル;3’-デオキシリボシル;2’,3’-ジデオキシリボシル;2’,3’-ジデヒドロジデオキシリボシル;2’-アルコキシリボシル;2’-アジドリボシル;2’-アミノリボシル;2’-フルオロリボシル;2’-メルカプトリボキシル;2’-アルキルチオリボシル;3’-アルコキシリボシル;3’-アジドリボシル;3’-アミノリボシル;3’-フルオロリボシル;3’-メルカプトリボキシル;3’-アルキルチオリボシル炭素環状;非環状、又は他の修飾糖を含む。
【0431】
いくつかの態様において、ヌクレオチドは、1、2、又は3つのリン原子の鎖を含み、鎖は、典型的には、エステル又はホスホラミド結合を介して、糖部分の5’炭素に付着している。いくつかの態様において、ヌクレオチドは、リン鎖を有する類似体であり、リン鎖において、リン原子が一緒に、介在するO、S、NH、メチレン、又はエチレンと結合している。いくつかの態様において、鎖におけるリン原子は、O、S、又はBH3を含む置換された側鎖基を含む。いくつかの態様において、鎖は、ホスホロアミデート、ホスホロチオエート、ホスホルジチオエート、及びO-メチルホスホロアミダイト基を含む類似体で置換されたリン酸基を含む。
【0432】
核酸に関して使用されるときに、「伸長する」、「伸長すること」、「伸長」という用語及び他のバリアントは、核酸分子内への1つ以上のヌクレオチドの組み込みを指す。ヌクレオチドの取り込みは、核酸鎖の末端3’OH末端への1つ以上のヌクレオチドの重合を含み、核酸鎖の伸長をもたらす。ヌクレオチド組み込みは、自然ヌクレオチド及び/又はヌクレオチド類似体で行われ得る。典型的には、必ずしもそうではないが、ヌクレオチド組み込みは、テンプレートに依存的な様式で発生する。核酸分子を伸長させるいずれかの好適な方法が使用され得、好適な方法は、DNAポリメラーゼ又はRNAポリメラーゼによって触媒されるプライマー伸長を含む。
【0433】
「レポーター部分(reporter moiety)」、「レポーター部分(reporter moieties)」という用語又は関連用語は、検出可能なシグナルを生成するか、又はそれを生成することを引き起こす化合物を指す。レポーター部分は、しばしば、「標識」と称される。いずれかの好適なレポーター部分が使用され得、好適なレポーター部分は、ルミネセンス、光ルミネセンス、エレクトロルミネセンス、生物ルミネセンス、化学ルミネセンス、蛍光、リン光、発色団、放射性同位体、電気化学、質量分析、ラマン、ハプテン、親和性タグ、原子、又は酵素を含む。レポーター部分は、化学的又は物理的変化(例えば、熱、光、電気、pH、塩濃度、酵素活性、又は近接事象)からもたらされる検出可能なシグナルを生成する。近接事象は、2つのレポーター部分が、互いに接近するか、又は互いに会合するか、又は互いに結合することを含む。レポーター部分を、各々が、励起放射線を吸収し、かつ/又は蛍光を、他のレポーター部分から区別可能な波長で発光して、同じ反応又は異なる反応における異なるレポーター部分の存在を監視することを可能にするように選択することは、当業者に周知である。スペクトル的に異なる発光プロファイルを有するか、又は最小のオーバーラップスペクトル発光プロファイルを有する2つ以上の異なるレポーター部分が選択され得る。レポーター部分は、ヌクレオチド、ヌクレオシド、核酸、酵素(例えば、ポリメラーゼ又は逆転写酵素)、又は支持体(例えば、表面)に結合(例えば、動作可能に結合)し得る。
【0434】
レポーター部分(又は標識)は、蛍光標識又はフルオロフォアを含む。蛍光標識又はフルオロフォアとして機能し得る例示的な蛍光部分としては、フルオレセイン及びフルオレセイン誘導体、例えば、カルボキシフルオレセイン、テトラクロロフルオレセイン、ヘキサクロロフルオレセイン、カルボキシナプトフルオレセイン、フルオレセインイソチオシアネート、NHS-フルオレセイン、ヨードアセトアミドフルオレセイン、フルオレセインマレイミド、SAMSA-フルオレセイン、フルオレセインチオセミカルバジド、カルボヒドラジノメチルチオアセチル-アミノフルオレセイン、ローダミン及びローダミン誘導体、例えば、TRITC、TMR、lissamineローダミン、Texas Red、ローダミンB、ローダミン6G、ローダミン10、NHS-ローダミン、TMR-ヨードアセトアミド、lissamineローダミンBスルホニルクロリド、lissamineローダミンBスルホニルヒドラジン、Texas Redスルホニルクロリド、Texas Redヒドラジド、クマリン及びクマリン誘導体、例えば、AMCA、AMCA-NHS、AMCA-スルホ-NHS、AMCA-HPDP、DCIA、AMCE-ヒドラジド、BODIPY及び誘導体、例えば、BODIPY FL C3-SE、BODIPY 530/550 C3、BODIPY 530/550 C3-SE、BODIPY 530/550 C3ヒドラジド、BODIPY 493/503 C3ヒドラジド、BODIPY FL C3ヒドラジド、BODIPY FL IA、BODIPY 530/551 IA、Br-BODIPY 493/503、Cascade Blue及び誘導体、例えば、Cascade Blueアセチルアジド、Cascade Blueカダベリン、Cascade Blueエチレンジアミン、Cascade Blueヒドラジド、Lucifer Yellow及び誘導体、例えば、Lucifer Yellowヨードアセトアミド、Lucifer Yellow CH、シアニン及び誘導体、例えば、インドリウムベースのシアニン色素、ベンゾ-インドリウムベースのシアニン色素、ピリジウムベースのシアニン色素、チオゾリウムベースのシアニン色素、キノリニウムベースのシアニン色素、イミダゾリウムベースのシアニン色素、Cy3、Cy5、ランタニドキレート及び誘導体、例えば、BCPDA、TBP、TMT、BHHCT、BCOT、ユーロピウムキレート、テルビウムキレート、Alexa Fluor色素、DyLight色素、Atto色素、LightCycler Red色素、CAL Flour色素、JOE及びその誘導体、Oregon Green色素、WellRED色素、IRD色素、フィコエリトリン及びフィコビリン色素、マラカイトグリーン、スチルベン、DEG色素、NR色素、近赤外色素、並びに当該技術分野で既知の他のもの、例えば、Haugland,Molecular Probes Handbook,(Eugene,Oreg.)6th Edition、Lakowicz,Principles of Fluorescence Spectroscopy,2nd Ed.,Plenum Press New York(1999)、若しくはHermanson,Bioconjugate Techniques,2nd Editionに記載されているもの又はそれらの誘導体、あるいはそれらのいずれかの組み合わせが挙げられるが、これらに限定されない。シアニン色素は、スルホン化又は非スルホン化形態のいずれかで存在し得、2つの窒素原子間のポリメチン架橋によって分離された2つのインドレニン、ベンゾインドリウム、ピリジウム、チオゾリウム、及び/又はキノリニウム基からなる。市販のシアニンフルオロフォアは、例えば、Cy3(これは、1-[6-(2,5-ジオキソピロリジン-1-イルオキシ)-6-オキソヘキシル]-2-(3-{1-[6-(2,5-ジオキソピロリジン-1-イルオキシ)-6-オキソヘキシル]-3,3-ジメチル-1,3-ジヒドロ-2H-インドール-2-イリデン}プロプ-1-エン-1-イル)-3,3-ジメチル-3H-インドリウム、又は1-[6-(2,5-ジオキソピロリジン-1-イルオキシ)-6-オキソヘキシル]-2-(3-{1-[6-(2,5-ジオキソピロリジン-1-イルオキシ)-6-オキソヘキシル]-3,3-ジメチル-5-スルホ-1,3-ジヒドロ-2H-インドール-2-イリデン}プロプ-1-エン-1-イル)-3,3-ジメチル-3H-インドリウム-5-スルホネートを含み得る)、Cy5(これは、1-(6-((2,5-ジオキソピロリジン-1-イル)オキシ)-6-オキソヘキシル)-2-((1E,3E)-5-((E)-1-(6-((2,5-ジオキソピロリジン-1-イル)オキシ)-6-オキソヘキシル)-3,3-ジメチル-5-インドリン-2-イリデン)ペンタ-1,3-ジエン-1-イル)-3,3-ジメチル-3H-インドール-1-イウム、又は1-(6-((2,5-ジオキソピロリジン-1-イル)オキシ)-6-オキソヘキシル)-2-((1E,3E)-5-((E)-1-(6-((2,5-ジオキソピロリジン-1-イル)オキシ)-6-オキソヘキシル)-3,3-ジメチル-5-スルホインドリン-2-イリデン)ペンタ-1,3-ジエン-1-イル)-3,3-ジメチル-3H-インドール-1-イウム-5-スルホネートを含み得る)、及びCy7(1-(5-カルボキシペンチル)-2-[(1E,3E,5E,7Z)-7-(1-エチル-1,3-ジヒドロ-2H-インドール-2-イリデン)ヘプタ-1,3,5-トリエン-1-イル]-3H-インドリウム、又は1-(5-カルボキシペンチル)-2-[(1E,3E,5E,7Z)-7-(1-エチル-5-スルホ-1,3-ジヒドロ-2H-インドール-2-イリデン)ヘプタ-1,3,5-トリエン-1-イル]-3H-インドリウム-5-スルホネートを含み得る)を含み、「Cy」は、「シアニン」を表し、最初の数字は、2つのインドレニン基の間の炭素原子の数を特定する。インドレニンではなくオキサゾール誘導体であるCy2、並びにベンゾ誘導体化Cy3.5、Cy5.5、及びCy7.5は、この規則に対する例外である。
【0435】
いくつかの態様において、レポーター部分は、FRET対であることができ、これにより、複数の分類が、単一の励起及びイメージングステップ下で実行され得る。本明細書で使用される場合、FRETは、励起交換(Forster)移動、又は電子交換(Dexter)移動を含み得る。
【0436】
「連結した(linked)」、「連結した(joined)」、「結合した(attached)」、という用語及びそれらのバリアントは、特定の手順での使用に耐えるのに十分な安定性を有する化合物又は分子の任意の組み合わせ間の任意のタイプの融合、結合、接着、又は会合を含む。手順は、ヌクレオチド一過性結合、ヌクレオチド組み込み、デブロッキング、洗浄、除去、流動、検出、イメージング、及び/又は識別を含むことができるが、これらに限定されない。そのような結合は、例えば、共有結合、イオン、水素、双極子-双極子、親水性、疎水性、又は親和性結合、ファンデルワールス力を含む結合又は会合、及び機械的結合などを含むことができる。いくつかの態様において、そのような結合は、分子内で、例えば、一本鎖又は二本鎖直鎖核酸分子の末端を一緒に結合させて環状分子を形成するように発生する。いくつかの態様において、そのような結合は、異なる分子の組み合わせ間、又は分子と非分子との間で発生することができ、核酸分子と固体表面との間の結合、タンパク質と検出可能なレポーター部分との間の結合、及びヌクレオチドと検出可能なレポーター部分との間の結合などを含むが、これらに限定されない。結合のいくつかの例は、例えば、Hermanson,G.,“Bioconjugate Techniques”,Second Edition(2008)、Aslam,M.,Dent,A.,“Bioconjugation:Protein Coupling Techniques for the Biomedical Sciences”,London:Macmillan(1998)、Aslam,M.,Dent,A.,“Bioconjugation:Protein Coupling Techniques for the Biomedical Sciences”,London:Macmillan(1998)に見出され得る。
【0437】
本明細書で使用される場合、「動作可能に結合した」及び「動作可能に連結された」という用語、又は関連用語は、構成要素の並列を指す。並列した構成要素は、共有結合的に一緒に結合し得る。例えば、2つの核酸構成要素は、酵素的に一緒にライゲーションされ得、2つの構成要素を一緒に連結する結合は、ホスホジエステル結合を含む。第1及び第2の核酸構成要素は、一緒に結合することができ、第1の核酸構成要素は、機能を第2の核酸構成要素に付与することができる。例えば、プライマー結合配列と目的の配列との間の結合は、プライマーに結合することができる一部分を有する核酸ライブラリ分子を形成する。別の例において、導入遺伝子(例えば、目的のポリペプチド又は核酸配列をコードする核酸)は、ベクターにライゲーションされ得、結合は、ベクター内に含有された導入遺伝子配列の発現又は機能を可能にする。いくつかの態様において、導入遺伝子は、導入遺伝子の発現に影響する宿主細胞調節配列(例えば、プロモーター配列)に動作可能に結合している。いくつかの態様において、ベクターは、少なくとも1つの宿主細胞調節配列を含み、少なくとも1つの宿主細胞調節配列は、プロモーター配列、エンハンサー、転写及び/又は翻訳開始配列、転写及び/又は翻訳終結配列、並びにポリペプチド分泌シグナル配列などを含む。いくつかの態様において、宿主細胞調節配列は、導入遺伝子のレベル、タイミング、及び/又は位置の発現を制御する。
【0438】
「アダプター」という用語及び関連用語は、標的ポリヌクレオチドに動作可能に結合し得る(付加され得る)オリゴヌクレオチドを指し、アダプターは、機能を共連結されたアダプター-標的分子に付与する。アダプターは、DNA、RNA、キメラDNA/RNA、又はそれらの類似体を含む。アダプターは、少なくとも1つのリボヌクレオシド残基を含むことができる。アダプターは、一本鎖若しくは二本鎖であってもよく、又は一本鎖及び/若しくは二本鎖部分を有してもよい。アダプターは、直鎖、ステムループ、ヘアピン、又はY字形状の形態であるように構成され得る。アダプターは、4つ~100個のヌクレオチド以上を含むいずれかの長さであることができる。アダプターは、平滑末端、オーバーハング末端、又は両方の組み合わせを有することができる。オーバーハング末端は、5’オーバーハング及び3’オーバーハング末端を含む。一本鎖アダプターの5’末端、又は二本鎖アダプターの一方の鎖は、5’リン酸基を有してもよく、又は5’リン酸基を欠いてもよい。アダプターは、標的ポリヌクレオチドにハイブリダイズしない5’テールを含んでもよく(例えば、テール付きアダプター)、又はアダプターは、テールなしであってもよい。アダプターは、プライマー、例えば、増幅プライマー、シーケンシングプライマー、又はキャプチャプライマー(例えば、可溶性又は固定化されたキャプチャプライマー)の少なくとも一部分と相補的である配列を含むことができる。アダプターは、ランダム配列又は縮重配列を含むことができる。アダプターは、少なくとも1つのイノシン残基を含むことができる。アダプターは、少なくとも1つのホスホロチオエート、ホスホロチオレート、及び/又はホスホロアミデート結合を含むことができる。アダプターは、バーコード配列を含むことができ、バーコード配列は、マルチプレックスアッセイにおいて、異なる試料源からのポリヌクレオチド(例えば、挿入配列)を区別するために使用され得る。アダプターは、固有の識別配列(例えば、固有の分子インデックス、UMI、又は固有の分子タグ)を含むことができ、固有の識別配列は、アダプターが付加された核酸分子を固有に特定するために使用され得る。いくつかの態様において、固有の識別配列は、エラー訂正及び精度を増加させ、偽陽性バリアントコールの率を低減し、かつ/又はバリアント検出の感度を増加させるために使用され得る。アダプターは、少なくとも1つの制限酵素認識配列を含むことができ、少なくとも1つの制限酵素認識配列は、I型、II型、III型、IV型、Hs型、若しくはIIB型からなる群から選択されるいずれか1つ、又は2つ以上のいずれかの組み合わせを含む。
【0439】
「ユニバーサル配列」、「ユニバーサルアダプター配列」という用語、及び関連用語は、2つ以上のポリヌクレオチド分子間で共通する、核酸分子における配列を指す。例えば、同じユニバーサル配列を有するアダプターは、複数のポリヌクレオチドに連結され得、これにより、共連結された分子の集団は、同じユニバーサルアダプター配列を保有する。ユニバーサルアダプター配列の例としては、増幅プライマー配列、シーケンシングプライマー配列、又はキャプチャプライマー配列(例えば、可溶性又は支持体に固定化されたキャプチャプライマー)が挙げられる。
【0440】
いくつかの態様において、支持体は、固体、半固体、又は両方の組み合わせである。いくつかの態様において、支持体は、多孔質、半多孔質、非多孔質、又は多孔性のいずれかの組み合わせである。いくつかの態様において、支持体は、実質的に平面、凹面、凸面、又はそれらのいずれかの組み合わせであることができる。いくつかの態様において、支持体は、円柱状であることができ、例えば、キャピラリー又はキャピラリーの内側表面を含む。
【0441】
いくつかの態様において、支持体の表面は、実質的に平滑であることができる。いくつかの態様において、支持体は、規則的又は不規則なテクスチャであることができ、隆起、エッチング、細孔、三次元足場、又はそれらのいずれかの組み合わせを含む。
【0442】
いくつかの態様において、支持体は、いずれかの形状を有するビーズを含み、その形状は、球状、半球状、円柱状、バレル形状、トロイダル、ディスク形状、棒状、円錐状、三角形、立方形、多角形、管状、又はワイヤ状を含む。
【0443】
支持体は、いずれかの材料から製造され得、材料は、ガラス、溶融シリカ、シリコン、ポリマー(例えば、ポリスチレン(PS)、マクロ多孔質ポリスチレン(MPPS)、ポリメチルメタクリレート(PMMA)、ポリカーボネート(PC)、ポリプロピレン(PP)、ポリエチレン(PE)、高密度ポリエチレン(HDPE)、環状オレフィンポリマー(COP)、環状オレフィンコポリマー(COC)、ポリエチレンテレフタレート(PET))、又はそれらのいずれかの組み合わせを含むが、これらに限定されない。ガラス基材及びプラスチック基材の両方の様々な組成が企図される。
【0444】
いくつかの態様において、支持体の表面は、1つ以上の化合物でコーティングされ、支持体上に不動態化層を生成する。いくつかの態様において、支持体は、支持体上の改善された核酸ハイブリダイゼーション及び増幅性能を可能にする低い非特異的結合表面を含む。一般に、支持体は、共有結合又は非共有結合している低化学修飾層、例えば、シラン層、ポリマーフィルム、及び複数の核酸テンプレート分子を支持体に固定化するために使用され得る1つ以上の共有結合又は非共有結合しているオリゴヌクレオチドの1つ以上の層を含み得る。
【0445】
いくつかの態様において、表面コーティングの親水性の程度(又は水溶液との「濡れ性」)は、例えば、小さな水滴が表面に配置され、表面との接触角が、例えば、光学テンシオメータを使用して測定される水接触角の測定によって評価され得る。いくつかの態様において、静的接触角が判定され得る。いくつかの態様において、前進又は後退接触角が判定され得る。いくつかの態様において、本明細書に開示される表面処理された親水性低結合支持体についての水接触角は、約0度~約30度の範囲であり得る。いくつかの態様において、本明細書に開示される表面処理された親水性低結合支持体についての水接触角は、50度、40度、30度、25度、20度、18度、16度、14度、12度、10度、8度、6度、4度、2度、又は1度以下であり得る。多くの場合において、接触角は、40度以下である。本開示の所与の親水性低結合支持体表面は、この範囲内のいずれかにおける値を有する水接触角を示し得ることが、当業者には認識されよう。
【0446】
本開示は、支持体に固定化された複数の(例えば、2つ以上の)核酸テンプレートを提供する。いくつかの態様において、固定化された複数の核酸テンプレートは、同じ配列を有するか、又は異なる配列を有する。いくつかの態様において、複数の核酸テンプレートにおける個々の核酸テンプレート分子は、支持体上の異なる部位に固定化されている。いくつかの態様において、複数の核酸テンプレートにおける2つ以上の個々の核酸テンプレート分子は、支持体上の部位に固定化されている。いくつかの態様において、支持体は、アレイに配置された複数の部位を含む。「アレイ」という用語は、支持体上の所定の位置において位置する複数の部位を、部位のアレイを形成するように含む支持体を指す。部位は、分散し得、インタースティシャル領域によって分離され得る。いくつかの態様において、支持体上の所定の部位は、一次元で行又は列に配置されてもよく、又は二次元で行及び列に配置されてもよい。いくつかの態様において、複数の所定の部位は、支持体上に、組織化された様式で配置されている。いくつかの態様において、複数の所定の部位は、いずれかの組織化されたパターンで配置されており、パターンは、直線、六角形パターン、格子パターン、反射対称性を有するパターン、又は回転対称性を有するパターンなどを含む。異なる対の部位間のピッチは、同じであってもよく又は変動してもよい。いくつかの態様において、支持体は、核酸テンプレートアレイを形成するために、1mm当たり約102~1015個の部位の表面密度で複数の部位に固定化された核酸テンプレート分子を有し得る。いくつかの態様において、支持体は、少なくとも102個の部位、少なくとも103個の部位、少なくとも104個の部位、少なくとも105個の部位、少なくとも106個の部位、少なくとも107個の部位、少なくとも108個の部位、少なくとも109個の部位、少なくとも1010個の部位、少なくとも1011個の部位、少なくとも1012個の部位、少なくとも1013個の部位、少なくとも1014個の部位、又は少なくとも1015個の部位以上を含み、部位は、支持体上の所定の位置において位置する。いくつかの態様において、支持体上の複数の所定の部位(例えば、102~1015個の部位以上)は、核酸テンプレートで固定化されており、核酸テンプレートアレイを形成する。いくつかの態様において、固定化された表面キャプチャプライマーへのハイブリダイゼーションによって複数の所定の部位に固定化される核酸テンプレート、又は核酸テンプレートは、表面キャプチャプライマーに共有結合している。いくつかの態様において、複数の所定の部位において固定化されており、例えば、102~1015個の部位以上において固定化されている核酸テンプレート。いくつかの態様において、支持体上の複数の部位に固定化された核酸テンプレートは、線形若しくは環状核酸テンプレート分子、又は線形分子と環状分子の両方の混合物を含む。いくつかの態様において、固定化された核酸テンプレートは、クローン的に増幅されて、固定化された核酸ポロニーを、複数の所定の部位において生成する。いくつかの態様において、個々の固定化核酸テンプレート分子は、目的の標的配列の1つのコピーを含むか、又は目的の標的配列の2つ以上のタンデムコピーを有するコンカテマーを含む。
【0447】
いくつかの態様において、支持体上のランダムな位置において位置する複数の部位を含む支持体は、ランダムに位置する部位を上に有する支持体と本明細書で称される。支持体上のランダムに位置する部位の位置は、所定の位置でない。複数のランダムに位置する部位は、支持体上に、不整列にかつ/又は予測不可能な様式で配置されている。いくつかの態様において、支持体は、少なくとも102個の部位、少なくとも103個の部位、少なくとも104個の部位、少なくとも105個の部位、少なくとも106個の部位、少なくとも107個の部位、少なくとも108個の部位、少なくとも109個の部位、少なくとも1010個の部位、少なくとも1011個の部位、少なくとも1012個の部位、少なくとも1013個の部位、少なくとも1014個の部位、又は少なくとも1015個の部位以上を含み、部位は、支持体上にランダムに位置する。いくつかの態様において、支持体上の複数のランダムに位置する部位(例えば、102~1015個の部位以上)は、核酸テンプレートで固定化されており、核酸テンプレートで固定化された支持体を形成する。いくつかの態様において、固定化された表面キャプチャプライマーへのハイブリダイゼーションによって複数のランダムに位置する部位において固定化された核酸テンプレート、又は核酸テンプレートは、表面キャプチャプライマーに共有結合的に付着している。いくつかの態様において、複数のランダムに位置する部位において固定化されており、例えば、102~1015個の部位以上において固定化されている核酸テンプレート。いくつかの態様において、支持体上の複数の部位に固定化された核酸テンプレートは、線形若しくは環状核酸テンプレート分子、又は線形分子と環状分子の両方の混合物を含む。いくつかの態様において、固定化された核酸テンプレートは、クローン的に増幅されて、固定化された核酸ポロニーを、複数のランダムに位置する部位において生成する。いくつかの態様において、個々の固定化核酸テンプレート分子は、目的の標的配列の1つのコピーを含むか、又は目的の標的配列の2つ以上のタンデムコピーを有するコンカテマーを含む。
【0448】
いくつかの態様において、支持体上の所定の又はランダムな部位に固定化された核酸テンプレート分子に関して、支持体上の複数の固定化された核酸テンプレート分子は互いに流体連通して、試薬(例えば、ポリメラーゼなどを含む酵素、多価分子、ヌクレオチド、二価カチオン、及び/又は緩衝液)の溶液を支持体上に流すことを可能にし、その結果、支持体上の複数の固定化された核酸テンプレート分子を超並列方法で試薬と反応させることができる。いくつかの態様において、複数の固定化された核酸テンプレート分子の流体連通を使用して、ヌクレオチド結合アッセイを行い、及び/又は複数の固定化された核酸テンプレート分子上でヌクレオチド重合反応(例えば、プライマー伸長若しくはシーケンシング)を行い、並びに超並列シーケンシングのための検出及びイメージングを行うことができる。いくつかの態様において、「固定化された」という用語及び関連用語は、核酸分子又は酵素が共有結合又は非共有結合相互作用を介して支持体に直接結合されるか、又は核酸分子又は酵素が支持体上のコーティングに結合される、所定の位置又はランダムな配置で支持体に結合される核酸分子又は酵素(例えば、ポリメラーゼ)を指す。
【0449】
低結合表面コーティングに関して使用されるときに、多層表面コーティングの1つ以上の層は、分岐ポリマーを含んでもよく、又は直鎖であってもよい。好適な分岐ポリマーの例としては、分岐PEG、分岐ポリ(ビニルアルコール)(分岐PVA)、分岐ポリ(ビニルピリジン)、分岐ポリ(ビニルピロリドン)(分岐PVP)、分岐)、ポリ(アクリル酸)(分岐PAA)、分岐ポリアクリルアミド、分岐ポリ(N-イソプロピルアクリルアミド)(分岐PNIPAM)、分岐ポリ(メチルメタクリレート)(分岐PMA)、分岐ポリ(2-ヒドロキシルエチルメタクリレート)(分岐PHEMA)、分岐ポリ(オリゴ(エチレングリコール)メチルエーテルメタクリレート)(分岐POEGMA)、分岐ポリグルタミン酸(分岐PGA)、分岐ポリ-リジン、分岐ポリ-グルコシド、及びデキストランが挙げられるが、これらに限定されない。
【0450】
いくつかの態様において、本明細書に開示される多層表面のうちのいずれかの1つ以上の層を作製するために使用される分岐ポリマーは、少なくとも4つの分岐、少なくとも5つの分岐、少なくとも6つの分岐、少なくとも7つの分岐、少なくとも8つの分岐、少なくとも9つの分岐、少なくとも10個の分岐、少なくとも12個の分岐、少なくとも14個の分岐、少なくとも16個の分岐、少なくとも18個の分岐、少なくとも20個の分岐、少なくとも22個の分岐、少なくとも24個の分岐、少なくとも26個の分岐、少なくとも28個の分岐、少なくとも30個の分岐、少なくとも32個の分岐、少なくとも34個の分岐、少なくとも36個の分岐、少なくとも38個の分岐、又は少なくとも40個の分岐を含み得る。
【0451】
本明細書に開示される多層表面のうちのいずれかの1つ以上の層を作製するために使用される直鎖、分岐、又は多分岐ポリマーは、少なくとも500、少なくとも1,000、少なくとも2,000、少なくとも3,000、少なくとも4,000、少なくとも5,000、少なくとも10,000、少なくとも15,000、少なくとも20,000、少なくとも25,000、少なくとも30,000、少なくとも35,000、少なくとも40,000、少なくとも45,000、又は少なくとも50,000ダルトンの分子量を有し得る。
【0452】
いくつかの態様において、例えば、多層表面の少なくとも1つの層が、分岐ポリマーを含む場合、堆積させる層の分岐ポリマー分子と前の層の分子との間の共有結合の数は、1分子当たり約1つの共有結合~1分子当たり約32個の共有結合の範囲であり得る。いくつかの態様において、新しい層の分岐ポリマー分子と前の層の分子との間の共有結合の数は、1分子当たり少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10個、少なくとも12個、少なくとも14個、少なくとも16個、少なくとも18個、少なくとも20個、少なくとも22個、少なくとも24個、少なくとも26個、少なくとも28個、少なくとも30個、又は少なくとも32個の共有結合であり得る。
【0453】
表面への材料層のカップリング後に残存するいずれもの反応性官能基が、任意選択で、高収率カップリング化学を使用して小さい不活性分子をカップリングさせることによってブロックされ得る。例えば、アミンカップリング化学が、新しい材料層を前のものに付着させるために使用される場合、いずれもの残留アミン基が、その後、グリシンなどの小さいアミノ酸とカップリングすることによってアセチル化又は不活性化され得る。
【0454】
表面上に堆積した低非特異的結合材料、例えば、親水性ポリマー材料の層の数は、1~約10の範囲であり得る。いくつかの態様において、層の数は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10である。いくつかの態様において、層の数は、最大10、最大9、最大8、最大7、最大6、最大5、最大4、最大3、最大2、又は最大1であり得る。この段落に記載される下限及び上限値のうちのいずれかが、本開示内に含まれる範囲を形成するように組み合わされ得、例えば、いくつかの態様において、層の数は、約2~約4の範囲であり得る。いくつかの態様において、層の全てが、同じ材料を含み得る。いくつかの態様において、各々の層は、異なる材料を含み得る。いくつかの態様において、複数の層は、複数の材料を含み得る。いくつかの態様において、少なくとも1つの層は、分岐ポリマーを含み得る。いくつかの態様において、層の全てが、分岐ポリマーを含み得る。
【0455】
低非特異的結合材料の1つ以上の層は、いくつかの場合において、極性プロトン性溶媒、極性若しくは極性非プロトン性溶媒、非極性溶媒、又はそれらのいずれかの組み合わせを使用して、基材表面上に堆積し得、かつ/又はそれにコンジュゲートし得る。いくつかの態様において、層堆積及び/又はカップリングのために使用される溶媒は、アルコール(例えば、メタノール、エタノール、プロパノールなど)、別の有機溶媒(例えば、アセトニトリル、ジメチルスルホキシド(DMSO)、ジメチルホルムアミド(DMF)など)、水、緩衝水溶液(例えば、リン酸緩衝液、リン酸緩衝生理食塩水、3-(N-モルホリノ)プロパンスルホン酸(MOPS)など)、又はそれらのいずれかの組み合わせを含み得る。いくつかの態様において、使用される溶媒混合物の有機構成要素は、総計の少なくとも1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、70%、75%、80%、85%、90%、95%、98%、又は99%を含み得、バランスは、水又は緩衝水溶液からなされる。いくつかの態様において、使用される溶媒混合物の水性構成要素は、総計の少なくとも1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、70%、75%、80%、85%、90%、95%、98%、又は99%を含み得、バランスは、有機溶媒からなされる。使用される溶媒混合物のpHは、6未満、約6、6.5、7、7.5、8、8.5、9、又はpH9超であり得る。
【0456】
「分岐ポリマー」という用語及び関連用語は、ヌクレオチドなどの生物学的に活性な分子にコンジュゲートするのを助長する複数の官能基を有するポリマーを指し、官能基は、ポリマーの側鎖上にあってもよく、又はポリマーの中央コア若しくは中央骨格に直接付着してもよい。分岐ポリマーは、コンジュゲーションのために骨格から解離する1つ以上の官能基を有する直鎖骨格を有することができる。分岐ポリマーはまた、1つ以上の側鎖を有するポリマーあることができ、側鎖は、コンジュゲーションに好適である部位を有する。官能基の例としては、ヒドロキシル、エステル、アミン、カーボネート、アセタール、アルデヒド、アルデヒド水和物、アルケニル、アクリレート、メタクリレート、アクリルアミド、活性スルホン、ヒドラジド、チオール、アルカン酸、酸ハロゲン化物、イソシアネート、イソチオシアネート、マレイミド、ビニルスルホン、ジチオピリジン、ビニルピリジン、ヨードアセトアミド、エポキシド、グリオキサール、ジオン、メシレート、トシレート、及びトレシレートが挙げられるが、これらに限定される。
【0457】
本明細書で使用される場合、「クローン的に増幅された」という用語及びそのバリアントは、溶液中又は支持体上のいずれかの1つ以上の増幅反応に供された核酸テンプレート分子を指す。溶液中で増幅されたテンプレート分子の場合、得られたアンプリコンは、支持体上に分配される。増幅の前に、テンプレート分子は、目的の配列及び少なくとも1つのユニバーサルアダプター配列を含む。いくつかの態様において、クローン増幅が、ポリメラーゼ連鎖反応(PCR)、多重置換増幅(MDA)、転写媒介増幅(TMA)、核酸配列ベース増幅(NASBA)、鎖置換増幅(SDA)、リアルタイムSDA、ブリッジ増幅、等温ブリッジ増幅、ローリングサークル増幅(RCA)、円-円増幅、ヘリカーゼ依存性増幅、リコンビナーゼ依存性増幅、一本鎖結合(SSB)タンパク質依存性増幅、又はそれらの任意の組み合わせの使用を含む、当該方法を提供する。
【0458】
本明細書で使用される場合、「シーケンシング」という用語及びそのバリアントは、典型的には、核酸テンプレート分子内の少なくともいくつかのヌクレオチド(それらの核酸塩基成分を含む)の同一性を決定することによって、核酸鎖から配列情報を取得することを含む。いくつかの態様において、核酸分子の所与の領域を「シーケンシング」は、シーケンシングされる領域内の各ヌクレオチド及び全てのヌクレオチドを識別する/読み取ることを含むが、いくつかの態様において、「シーケンシング」は、領域内の一部のヌクレオチドのみの同一性が判定される一方で、一部のヌクレオチドの同一性がはっきりしないままであるか、又は誤って判定される方法を含む。任意の好適なシーケンシング方法が、使用され得る。例示的な態様において、シーケンシングは、無標識又はイオンベースのシーケンシング方法を含むことができる。いくつかの態様において、シーケンシングは、標識又は染料含有ヌクレオチド又は蛍光ベースのヌクレオチドシーケンシング方法を含むことができる。いくつかの態様において、シーケンシングは、ポロニーベースのシーケンシング又はブリッジシーケンシング方法を含むことができる。いくつかの態様において、シーケンシングには、合成による配列、ハイブリダイゼーションによる配列、又は結合による配列の手順を用いる、超並列したシーケンシングプラットフォームを含む。超並列した合成による配列の手順の例としては、ポロニーシーケンシング、パイロシーケンシング(例えば、454 Life Sciencesから、米国特許第7,211,390号、同第7,244,559号、及び同第7,264,929号)、鎖ターミネーターシーケンシング(例えば、Illuminaから、米国特許第7,566,537号、Bentley 2006 Current Opinion Genetics and Development 16:545-552、及びBentley,et al.,2008 Nature 456:53-59、イオン感受性シーケンシング(例えば、Ion Torrentから)、プローブアンカーライゲーションシーケンシング(例えば、Complete Genomics)、DNAナノボールシーケンシング、ナノ細孔DNAシーケンシングが挙げられる。単一分子シーケンシングの例としては、Heliscope単一分子シーケンシング、及びPacific Biosciences(Levene,et al.,2003 Science 299(5607):682-686、Eid,et al.,2009 Science 323(5910):133-138、米国特許第7,170,050号、第7,302,146号、及び第7,405,281号を参照されたい)からの単一分子リアルタイム(SMRT)シーケンシングが挙げられる。ハイブリダイゼーションによる配列の例としては、SOLiDシーケンシング(例えば、Life Technologiesから、WO2006/084132)が挙げられる。結合によるシーケンシングの例としては、Omniomeシーケンシング(例えば、米国特許第10,246,744号)が挙げられる。
【0459】
他のセクションではなく、詳細な説明セクションが、特許請求の範囲を解釈するために使用されることが意図されることを理解されたい。他のセクションは、発明者(複数可)によって企図されるように、1つ以上の例示的な態様を記載し得るが、全てではなく、したがって、本開示又は添付の特許請求の範囲をいかなる方法でも限定することを意図するものではない。
【0460】
本開示は、例示的な分野及び用途のための例示的な態様を説明するが、本開示はそれに限定されるものではないことを理解されたい。他の態様及びその修正は可能であり、本開示の範囲及び精神内である。例えば、このパラグラフの一般性を限定することなく、態様は、図面に示される、及び/又は本明細書に記載されるソフトウェア、ハードウェア、ファームウェア、及び/又はエンティティに限定されない。更に、態様は(本明細書に明示的に記載されているかどうかにかかわらず)、本明細書に記載されている実施例を超える分野及び用途に対して重要な有用性を有する。
【0461】
態様は、特定の機能及びそれらの関係の実装を例示する機能的ビルディングブロックを用いて上で説明されている。これらの機能的ビルディングブロックの境界は、本明細書において、説明の便宜のために任意に定義されている。指定された機能及び関係(又はその等価物)が適切に実行される限り、代替の境界は定義され得る。また、代替的な態様は、本明細書に記載されるものとは異なる順序を使用して、機能的ブロック、ステップ、操作、方法などを実行し得る。
【0462】
「一態様」、「態様」、「例示的な態様」、「いくつかの態様」、又は同様のフレーズへの本明細書の言及は、説明される態様が特定の特徴、構造、又は特徴を含み得るが、全ての態様が必ずしも特定の特徴、構造、又は特性を含み得るわけではないことを示す。更に、そのような句は、必ずしも同じ態様を指すものではない。更に、特定の特徴、構造、又は特性が態様に関連して記載されるとき、そのような特徴、構造、又は特性を、本明細書に明示的に言及又は記載されるかどうかにかかわらず、他の態様に組み込むことは、関連技術分野(複数可)の当業者の知識の範囲内であろう。
【0463】
加えて、いくつかの態様は、「カップリングされた」及び「接続された」という表現をそれらの派生語とともに使用して説明され得る。これらの用語は、必ずしも互いの同義語として意図されているわけではない。例えば、いくつかの態様は、2つ以上の要素が互いに直接物理的又は電気的に接触していることを示すために、「接続された」及び/又は「カップリングされた」という用語を使用して説明され得る。しかしながら、「カップリングされた」という用語はまた、2つ以上の要素が互いに直接接触しないが、それでも互いに協働又は相互作用することを意味し得る。
【0464】
本開示の態様が本明細書に示され、記載されているが、そのような態様が例としてのみ提供されることは、当業者には明白であろう。本開示の幅及び範囲は、上記の例示的な実施形態のいずれかによって制限されるべきではなく、以下の態様及びそれらの均等物に従ってのみ定義されるべきである。本開示から逸脱することなく、多数の変形、変更、及び置換がここで当業者に想起されるであろう。本明細書に記載される本開示の態様に対する様々な代替案が、本開示の実施において用いられ得ることは理解されるべきである。以下の特許請求の範囲は、本開示の範囲を定義し、これらの特許請求の範囲及びそれらの同等物の範囲内の方法及び構造が、それらによって包含されることが意図される。
図1
図2
図3
図4
図5A
図5B
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
【国際調査報告】