IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アプトン バイオシステムズ,インク.の特許一覧

特表2022-546278核酸分子を使用するデータ保存のためのシステムおよび方法
<>
  • 特表-核酸分子を使用するデータ保存のためのシステムおよび方法 図1
  • 特表-核酸分子を使用するデータ保存のためのシステムおよび方法 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-11-04
(54)【発明の名称】核酸分子を使用するデータ保存のためのシステムおよび方法
(51)【国際特許分類】
   G16B 30/10 20190101AFI20221027BHJP
   C12Q 1/6844 20180101ALN20221027BHJP
   C12Q 1/686 20180101ALN20221027BHJP
   C40B 40/06 20060101ALN20221027BHJP
   C12N 15/11 20060101ALN20221027BHJP
   C12Q 1/6869 20180101ALN20221027BHJP
【FI】
G16B30/10
C12Q1/6844 Z
C12Q1/686 Z
C40B40/06
C12N15/11 Z
C12Q1/6869
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022510831
(86)(22)【出願日】2020-08-26
(85)【翻訳文提出日】2022-04-15
(86)【国際出願番号】 US2020047994
(87)【国際公開番号】W WO2021041540
(87)【国際公開日】2021-03-04
(31)【優先権主張番号】62/892,176
(32)【優先日】2019-08-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ANDROID
(71)【出願人】
【識別番号】522062243
【氏名又は名称】アプトン バイオシステムズ,インク.
(74)【代理人】
【識別番号】100082072
【弁理士】
【氏名又は名称】清原 義博
(72)【発明者】
【氏名】ステイカー,ブライアン
(72)【発明者】
【氏名】バリンガー,デニス
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA18
4B063QQ42
4B063QR08
4B063QR32
4B063QS10
4B063QX02
4B063QX04
(57)【要約】
【解決手段】
本明細書に開示されるのは、核酸分子上のデータおよび/または情報を保存し、核酸分子を保存し、並びにデータおよび/または情報を回収するための方法とシステムである。
これらの方法とシステムは、回収データの効率と正確さの改善時を含むデータ保存のための幅広い用途を有する。
【選択図】図1
【特許請求の範囲】
【請求項1】
データを保存するための方法であって、前記方法は、
a.核酸配列において前記データをコードする工程、
b.1以上の核酸分子を生成する工程であって、前記1以上の核酸分子の核酸分子が、前記核酸配列の少なくとも一部とヘッダー配列を含み、前記ヘッダー配列が、前記核酸配列の少なくとも前記部分に特異的な配列を含み、および前記ヘッダー配列が、前記核酸配列の少なくとも前記部分を識別するために、核酸識別反応の開始を可能にするように構成される、工程、および
c.基板に配置されるアレイにおいて前記1以上の核酸分子またはその誘導体を保存する工程、を含む、方法。
【請求項2】
前記核酸識別反応は配列決定反応である、請求項1に記載の方法。
【請求項3】
前記1以上の核酸分子またはその誘導体は線状である、請求項1に記載の方法。
【請求項4】
前記1以上の核酸分子またはその誘導体を保管する工程をさらに含む、請求項1に記載の方法。
【請求項5】
前記保管する工程は凍結乾燥またはフリーズドライを含む、請求項4に記載の方法。
【請求項6】
(b)は、1以上の増幅産物を形成するために、前記核酸配列の少なくとも前記部分を増幅することをさらに含み、前記1以上の核酸分子は前記1以上の増幅産物を含む、請求項1に記載の方法。
【請求項7】
前記増幅することは、ローリングサークル増幅を実行することを含む、請求項6に記載の方法。
【請求項8】
前記増幅することは、ブリッジ増幅を実行することを含む、請求項6に記載の方法。
【請求項9】
前記1以上の核酸分子またはその誘導体は連鎖状核酸分子を含む、請求項1に記載の方法。
【請求項10】
前記1以上の核酸分子またはその誘導体は、前記1以上の核酸分子またはその誘導体の1つの核酸分子あるいはその誘導体と隣接する核酸分子またはその誘導体との間の距離が500nm未満である密度で、前記基板上に配置される、請求項1に記載の方法。
【請求項11】
前記距離は中心間の距離を含む、請求項10に記載の方法。
【請求項12】
前記1以上の核酸分子またはその誘導体は、平方ミクロン当たり約4~約25の核酸分子またはその誘導体の密度で、前記基板上に配置される、請求項1に記載の方法。
【請求項13】
前記データを回収する工程をさらに含む、請求項1に記載の方法。
【請求項14】
前記回収する工程は、前記1以上の核酸分子またはその誘導体を配列決定することを含む、請求項13に記載の方法。
【請求項15】
前記配列決定することは、検出システムを使用して、1以上の組み込まれる核酸を検出することを含む、請求項14に記載の方法。
【請求項16】
前記検出システムは電気検出システムを含む、請求項14に記載の方法。
【請求項17】
前記電気検出システムはトランジスタを含む、請求項16に記載の方法。
【請求項18】
前記検出システムは光検出システムを含む、請求項14に記載の方法。
【請求項19】
前記光検出システムは光走査システムを含む、請求項18に記載の方法。
【請求項20】
前記光検出システムで検出される前記1以上の組み込まれる核酸から生成される信号の波長は、前記光検出システムのピクセルの2倍を超える、請求項18に記載の方法。
【請求項21】
前記アレイは順序付けられている、請求項1に記載の方法。
【請求項22】
前記アレイは順序付けられていない、請求項1に記載の方法。
【請求項23】
前記開始部位は核酸プライマーに相補的な核酸配列を含む、請求項1に記載の方法。
【請求項24】
前記増幅することは前記保存する工程の前に生じる、請求項6に記載の方法。
【請求項25】
データを保存するための方法であって、前記方法は、
(a)核酸配列において前記データをコードする工程、
(b)前記核酸配列を含む1以上の核酸分子を生成する工程、および
(c)基板上に配置されるアレイにおいて前記1以上の核酸分子を保存して、前記アレイを提供する工程であって、前記アレイが光走査システムを使用して画像化される場合、前記1以上の核酸分子またはその誘導体から生成される信号の波長が、前記光走査システムのピクセルのサイズの2倍を超える、工程、を含む、方法。
【請求項26】
前記1以上の核酸分子は線状である、請求項25に記載の方法。
【請求項27】
(b)は、前記核酸配列の少なくとも一部を含む1以上の線状核酸分子を生成することと、前記1以上の線状核酸分子を環状化することと、1以上の連鎖状核酸分子を生成するためにローリングサークル増幅によって増幅させることとを含む、請求項25に記載の方法。
【請求項28】
(b)は、
a.前記核酸配列、第1のアダプター配列、および第2のアダプター配列を含む1以上の線状核酸分子を生成することであって、前記第1のアダプター配列および前記第2のアダプター配列が1以上の環状核酸分子の形成を可能にすること、および
b.前記1以上の環状核酸分子を増幅すること、を含む、請求項25に記載の方法。
【請求項29】
前記線状核酸分子は1以上の機能性配列を含む、請求項28に記載の方法。
【請求項30】
前記1以上の鎖状核酸分子はローリングサークル増幅によって生成される、請求項28に記載の方法。
【請求項31】
(c)は前記鎖状核酸分子を前記基板上に配置することを含む、請求項25に記載の方法。
【請求項32】
前記1以上の鎖状核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される、請求項31に記載の方法。
【請求項33】
方法は前記基板を保管する工程をさらに含む、請求項25に記載の方法。
【請求項34】
前記保管する工程は凍結乾燥またはフリーズドライを含む、請求項33に記載の方法。
【請求項35】
前記基板はシリコンを含む、請求項25に記載の方法。
【請求項36】
前記基板はガラスを含む、請求項25に記載の方法。
【請求項37】
前記基板は2枚のガラスを含む、請求項36に記載の方法。
【請求項38】
前記回収する工程前の増幅なしに、前記1以上の核酸分子から前記データを回収する工程をさらに含む、請求項25に記載の方法。
【請求項39】
前記アレイは順序付けられている、請求項25に記載の方法。
【請求項40】
前記アレイは順序付けられていない、請求項25に記載の方法。
【請求項41】
前記順序は無作為である、請求項39に記載の方法。
【請求項42】
データを保存するための方法であって、前記方法は、基板に核酸分子を配置する工程を含み、前記核酸分子またはその誘導体は前記データをコードする、方法。
【請求項43】
前記核酸分子またはその誘導体は核酸鎖状体を含む、請求項42に記載の方法。
【請求項44】
前記核酸分子またはその誘導体は、前記基板が光走査システムを使用して画像化される場合に、前記核酸分子またはその誘導体から生成される信号の波長が、前記光走査システムのピクセルのサイズの2倍を超える密度で配置される、請求項42に記載の方法。
【請求項45】
前記基板はシリコンを含む、請求項42に記載の方法。
【請求項46】
前記基板はガラスを含む、請求項42に記載の方法。
【請求項47】
前記基板は2枚のガラスを含む、請求項46に記載の方法。
【請求項48】
前記データは、配列決定前の増幅なしに、前記核酸分子から回収される、請求項42に記載の方法。
【請求項49】
1以上のビットの情報を保存する方法であって、前記方法は、
a.複数のヌクレオチドにおいて前記1以上のビットの情報をコードする工程、
b.前記複数のヌクレオチドを1以上のプライマーに連結する工程、
c.前記複数のヌクレオチドを約300~約1,000の長さのヌクレオチドに合成する工程、
d.前記複数のヌクレオチドを環状化する工程、
e.1以上の核酸分子を生成するために、前記複数の環状分子を、ローリングサークル増幅によって増幅する工程、および
f.前記1以上の核酸分子を基板上に配置する工程、を含む方法。
【請求項50】
1以上のビットの情報を保存する方法であって、前記方法は、
a.前記1以上のビットの情報をコードする線状核酸分子を合成する工程であって、前記線状核酸分子が、
i.前記1以上のビットの情報をコードする核酸配列、
ii.5’アダプター配列、
iii.3’アダプター配列、および
iv.任意の1以上の追加の機能性配列、を含む、工程、
b.前記線状核酸分子から環状核酸分子を生成する工程、
c.前記環状核酸分子の1超のコピーを含む増幅した核酸分子を生成するために、前記環状核酸分子を増幅する工程、
d.前記増幅した核酸分子を基板上に配置する工程、を含む、方法。
【請求項51】
前記基板はパターン化している、請求項50に記載の方法。
【請求項52】
前記基板はパターン化していない、請求項50に記載の方法。
【請求項53】
方法は、前記1以上の基板を保管する工程をさらに含む、請求項50に記載の方法。
【請求項54】
前記保管する工程は凍結乾燥またはフリーズドライを含む、請求項53に記載の方法。
【請求項55】
前記回収する工程前の増幅なしに、前記1以上の核酸分子から、前記1以上のビットの情報を回収する工程をさらに含む、請求項50に記載の方法。
【請求項56】
前記1以上のビットの情報を前記回収する工程は、核酸識別反応を含む、請求項50に記載の方法。
【請求項57】
エラー修正を、回収した1以上のビットの情報に、適用する工程をさらに含む、請求項51に記載の方法。
【請求項58】
前記エラー修正はリードソロモン符号を使用することを含む、請求項52に記載の方法。
【請求項59】
前記ビットの情報は2値ビットを含む、請求項50に記載の方法。
【請求項60】
前記ビットの情報は2値ビットを含み、(a)は前記2値ビットの情報を4値ビットの情報に転写することを含む、請求項50に記載の方法。
【請求項61】
前記5’アダプター配列、3’アダプター配列、または両方は、バーコード配列を含む、請求項50に記載の方法。
【請求項62】
前記1以上の機能性配列は、バーコード配列、タグ配列、ユニバーサルプライマー配列、固有識別子配列、または追加のアダプター配列から成る群から選択される、請求項50に記載の方法。
【請求項63】
前記環状核酸分子は前記5’アダプターおよび前記3’アダプターをライゲートすることによって生成される、請求項50に記載の方法。
【請求項64】
前記環状核酸分子はローリングサークル反応によって増幅される、請求項50に記載の方法。
【請求項65】
前記増幅した核酸分子は核酸鎖状体である、請求項50に記載の方法。
【請求項66】
前記増幅した核酸分子は、前記基板が光走査システムを使用して画像化される場合に、前記核酸分子またはその誘導体から生成される信号の波長が、前記光走査システムのピクセルのサイズの2倍を超える密度で配置される、請求項50に記載の方法。
【請求項67】
前記基板はシリコンを含む、請求項50に記載の方法。
【請求項68】
前記基板はガラスを含む、請求項50に記載の方法。
【請求項69】
前記アレイは第1のガラス基板および第2のガラス基板を含む、請求項1~68のいずれか1つに記載の方法。
【請求項70】
方法は、請求項1~69のいずれか1つにおけるような方法を実施するためにプログラム化されるコンピューターシステムによって自動化される、請求項1~69のいずれか1つに記載の方法。
【請求項71】
コンピューターシステムであって、前記コンピューターシステムは請求項1~70のいずれか1つにおけるような方法を実施するためにプログラム化される、コンピューターシステム。
【請求項72】
複数の核酸配列を含む核酸分子であって、前記複数の核酸配列の少なくとも一部は、少なくとも1ギガバイト(GB)のデータをコードし、および前記核酸分子は、1%以下の前記核酸分子が1年間にわたって分解するような安定性を有する、核酸分子。
【請求項73】
複数のヘッダー配列をさらに含み、前記複数のヘッダー配列の1つのヘッダー配列が、前記1GBのデータを回収するために、前記核酸配列の少なくとも前記部分の配列決定を可能にするように構成される、請求項72に記載の核酸分子。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2019年8月27日に出願された米国仮特許出願第62/892,176号の利益を主張するものであり、これはその全体において参照により本明細書に組み込まれる。
【背景技術】
【0002】
世界のビッグデータの課題と問題のスケールと複雑さは、急速に拡大している。これら課題に対応することは、並外れた技術的および経済的なハードルを提示する。例えば、exabyte-スケールのデータ保存センターは、資源が非常に多く、負担が大きくなる。現在のexabyte-スケールのデータ保存は、大きなウェアハウスを必要とし、メガワットの電力を消費し、構築、作動、および維持するために数十億ドルかかる。この資源の集約モデルは、将来において拡大するための実用的または実行可能な便利なパスを提供することができない。
【発明の概要】
【0003】
本開示は核酸を媒介したデータ保存の方法を提供し、これは、スケーラブルで、従来の保存技術に対する物理的な空間、電力、およびコスト要件と比較して、減少した資源フットプリントを提供する。本明細書に記載される方法とシステムは核酸保存の利点を提供し得、1)アレイは読み取り可能な方法で生成することができ、ここでは、配列決定/読み取り前に核酸配列の増幅を行わず、および2)データ情報をコードする核酸は、1以上の核酸分子の間の距離が光の回折限界を下回る密度で、高密度アレイ上に保存され得る。
【0004】
本明細書に記載される本開示の態様は、データを保存するための方法を提供し、前記方法は、核酸配列において前記データをコードする工程、1以上の核酸分子を生成する工程であって、前記1以上の核酸分子の核酸分子が、前記核酸配列の少なくとも一部とヘッダー配列を含み、前記ヘッダー配列が、前記核酸配列の少なくとも前記部分に特異的な配列を含み、および前記ヘッダー配列が、前記核酸配列の少なくとも前記部分を識別するために、核酸識別反応の開始を可能にするように構成される工程、および基板に配置されるアレイにおいて前記1以上の核酸分子またはその誘導体を保存する工程を含む。いくつかの実施形態では、前記核酸識別反応は配列決定反応である。いくつかの実施形態では、前記1以上の核酸分子またはその誘導体は線状である。いくつかの実施形態では、方法は前記1以上の核酸分子またはその誘導体を保管する工程をさらに含む。いくつかの実施形態では、前記保管する工程は凍結乾燥またはフリーズドライを含む。いくつかの実施形態では、(b)は、1以上の増幅産物を形成するために、前記核酸配列の少なくとも前記部分を増幅することをさらに含み、前記1以上の核酸分子は前記1以上の増幅産物を含む。いくつかの実施形態では、前記増幅することは、ローリングサークル増幅を実行することを含む。いくつかの実施形態では、前記増幅することは、ブリッジ増幅を実行することを含む。いくつかの実施形態では、前記1以上の核酸分子またはその誘導体は連鎖状核酸分子を含む。いくつかの実施形態では、前記1以上の核酸分子またはその誘導体は、前記1以上の核酸分子またはその誘導体の1つの核酸分子またはその誘導体と隣接する核酸分子またはその誘導体との間の距離が500nm未満である密度で、前記基板上に配置される。いくつかの実施形態では、前記距離は中心間の距離を含む。いくつかの実施形態では、前記1以上の核酸分子またはその誘導体は、平方ミクロン当たり約4~約25の核酸分子またはその誘導体の密度で、前記基板上に配置される。いくつかの実施形態では、方法は前記データを回収する工程をさらに含む。いくつかの実施形態では、前記回収する工程は、前記1以上の核酸分子またはその誘導体を配列決定することを含む。いくつかの実施形態では、前記配列決定することは、検出システムを使用して、1以上の組み込まれる核酸を検出することを含む。いくつかの実施形態では、前記検出システムは電気検出システムを含む。いくつかの実施形態では、前記電気検出システムはトランジスタを含む。いくつかの実施形態では、前記検出システムは光検出システムを含む。いくつかの実施形態では、前記光検出システムは光走査システムを含む。いくつかの実施形態では、前記光検出システムで検出される前記1以上の組み込まれる核酸から生成されるシグナルの波長は、前記光検出システムのピクセルの2倍を超える。いくつかの実施形態では、前記アレイは順序付けられている。いくつかの実施形態では、前記アレイは順序付けられていない。いくつかの実施形態では、前記開始部位は核酸プライマーに相補的な核酸配列を含む。いくつかの実施形態では、前記増幅は前記保存する工程の前に生じる。
【0005】
本明細書に記載される本開示の別の態様は、データを保存するための方法を提供し、前記方法は、核酸配列において前記データをコードする工程、前記核酸配列を含む1以上の核酸分子を生成する工程、および前記アレイを提供するために基板に配置されるアレイにおいて前記1以上の核酸分子を保存する工程であって、前記アレイが光走査システムを使用して画像化される場合、前記1以上の核酸分子またはその誘導体から生成されるシグナルの波長が、前記光走査システムのピクセルのサイズの2倍を超える、工程、を含む。いくつかの実施形態では、前記1以上の核酸分子は線状である。いくつかの実施形態では、(b)は、前記核酸配列の少なくとも一部を含む1以上の線状核酸分子を生成することと、前記1以上の線状核酸分子を環状化することと、1以上の連鎖状核酸分子を生成するためにローリングサークル増幅によって増幅することと、を含む。いくつかの実施形態では、(b)は、前記核酸配列、第1のアダプター配列、および第2のアダプター配列を含む1以上の線状核酸分子を生成することを含み、前記第1および前記第2のアダプター配列が1以上の環状核酸分子の形成を可能にし、および前記1以上の環状核酸分子を増幅することを含む。いくつかの実施形態では、前記線状核酸分子は1以上の機能性配列を含む。いくつかの実施形態では、前記1以上の鎖状核酸分子はローリングサークル増幅によって生成される。いくつかの実施形態では、(c)は前記鎖状核酸分子を前記基板上に配置することを含む。いくつかの実施形態では、前記1以上の鎖状核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される。いくつかの実施形態では、方法は前記基板を保管する工程をさらに含む。いくつかの実施形態では、前記保管する工程は凍結乾燥またはフリーズドライを含む。いくつかの実施形態では、前記基板はシリコンを含む。いくつかの実施形態では、前記基板はガラスを含む。いくつかの実施形態では、前記基板は2枚のガラスを含む。いくつかの実施形態では、方法は、前記回収する工程前の増幅なしに、前記1以上の核酸分子から前記データを回収する工程をさらに含む。いくつかの実施形態では、前記アレイは順序付けられている。いくつかの実施形態では、前記アレイは順序つけられていない。いくつかの実施形態では、前記順序は無作為である。
【0006】
本明細書に記載される本開示の別の態様は、データを保存するための方法を提供し、前記方法は、基板に核酸分子を配置する工程を含み、前記核酸分子またはその誘導体は前記データをコードする。いくつかの実施形態では、前記核酸分子またはその誘導体は核酸鎖状体を含む。いくつかの実施形態では、前記核酸分子またはその誘導体は、前記基板が光走査システムを使用して画像化される場合に、前記核酸分子またはその誘導体から生成されるシグナルの波長が、前記光走査システムのピクセルのサイズの2倍を超える密度で配置される。いくつかの実施形態では、前記基板はシリコンを含む。いくつかの実施形態では、前記基板はガラスを含む。いくつかの実施形態では、前記基板は2枚のガラスを含む。いくつかの実施形態では、前記データは、配列決定前の増幅なしに、前記核酸分子から回収される。
【0007】
本明細書に記載される本開示の別の態様は、1以上のビットの情報を保存する方法を提供し、前記方法は、複数のヌクレオチドにおける前記1以上のビットの情報をコードする工程、前記複数のヌクレオチドを1以上のプライマーに連結する工程、前記複数のヌクレオチドを約300~約1,000の長さのヌクレオチドに合成する工程、前記複数のヌクレオチドを環状化する工程、1以上の核酸分子を生成するために、前記複数の環状分子を、ローリングサークル増幅によって、増幅する工程、および前記1以上の核酸分子を基板上に配置する工程、を含む。
【0008】
本明細書に記載される本開示の別の態様は、1以上のビットの情報を保存する方法を提供し、前記方法は、前記1以上のビットの情報をコードする線状核酸分子を合成する工程であって、前記線状核酸分子が、前記1以上のビットの情報をコードする核酸配列、5’アダプター配列、3’アダプター配列、および任意の1以上の追加の機能性配列を含む工程、前記線状核酸分子から環状核酸分子を生成する工程、前記環状核酸分子の1超のコピーを含む増幅した核酸分子を生成するために、前記環状核酸分子を増幅する工程、前記増幅した核酸分子を基板上に配置する工程、を含む。いくつかの実施形態では、前記基板はパターン化している。いくつかの実施形態では、前記基板はパターン化していない。いくつかの実施形態では、方法は、前記1以上の基板を保管する工程をさらに含む。いくつかの実施形態では、前記保管する工程は凍結乾燥またはフリーズドライを含む。いくつかの実施形態では、方法は、前記回収する工程前の増幅なしに、前記1以上の核酸分子から、前記1以上のビットの情報を回収する工程をさらに含む。いくつかの実施形態では、前記1以上のビットの情報を前記回収する工程は、核酸識別反応を含む。いくつかの実施形態では、方法は、エラー修正を、回収した1以上のビットの情報に、適用する工程をさらに含む。いくつかの実施形態では、前記エラー修正はリードソロモン符号を使用することを含む。いくつかの実施形態では、前記ビットの情報は2値ビットを含む。いくつかの実施形態では、前記ビットの情報は2値ビットを含み、(a)は前記2値ビットの情報を4値ビットの情報に転写することを含む。いくつかの実施形態では、前記5’アダプター配列、3’アダプター配列、または両方は、バーコード配列を含む。いくつかの実施形態では、前記1以上の機能性配列は、バーコード配列、タグ配列、ユニバーサルプライマー配列、固有識別子配列、または追加のアダプター配列から成る群から選択される。いくつかの実施形態では、前記環状核酸分子は前記5’アダプターおよび前記3’アダプターをライゲートすることによって生成される。いくつかの実施形態では、前記環状核酸分子はローリングサークル反応によって増幅される。いくつかの実施形態では、前記増幅した核酸分子は核酸鎖状体である。いくつかの実施形態では、前記増幅した核酸分子は、前記基板が光走査システムを使用して画像化される場合に、前記核酸分子またはその誘導体から生成されるシグナルの波長が、前記光走査システムのピクセルのサイズの2倍を超える密度で配置される。いくつかの実施形態では、前記基板はシリコンを含む。いくつかの実施形態では、前記基板はガラスを含む。前記アレイが第1のガラス基板と第2のガラス基板を含む、前述の実施形態のいずれか1つに記載の方法。方法は、前述の実施形態のいずれか1つにおけるような方法を実施するためにプログラム化されるコンピューターシステムによって、自動化される、前述の実施形態のいずれか1つに記載の方法。
【0009】
本明細書に記載される本開示の別の態様は、コンピューターシステムを提供し、コンピューターシステムは前述の実施形態のいずれか1つにおけるような方法を実施するためにプログラム化される。
【0010】
本明細書に記載される本開示の別の態様は、複数の核酸配列を含む核酸分子を提供し、前記複数の核酸配列の少なくとも一部は、少なくとも1ギガバイト(GB)のデータをコードし、および前記核酸分子は、1%以下の前記核酸分子が1年間にわたって分解するような安定性を有する。前述の実施形態の核酸分子は、複数のヘッダー配列をさらに含み、前記複数のヘッダー配列の1つのヘッダー配列が、前記1GBのデータを回収するために、前記核酸配列の少なくとも前記部分の配列決定を可能にするように構成される。
【0011】
本明細書に記載される本開示の別の態様は、データを保存するための方法を提供し、前記方法は、(a)核酸配列において前記データをコードする工程、(b)前記核酸配列を含む1以上の核酸分子を生成する工程、および(c)前記1以上の核酸分子を基板上に配置されるアレイにおいて保存する工程、を含む。いくつかの実施形態では、前記1以上の核酸分子は環状である。いくつかの実施形態では、(b)は、前記核酸配列の少なくとも一部を含む1以上の環状核酸分子を生成することと、前記1以上の環状核酸分子を、個体の核酸分子の1以上の連鎖状コピーを生成するために、ローリングサークル増幅によって、増幅することとを含む。いくつかの実施形態では、(b)は、前記核酸配列、第1のアダプター配列、および第2のアダプター配列を含む1以上の線状核酸分子を生成することを含み、前記第1および前記第2のアダプター配列が1以上の環状核酸分子の形成を可能にし、および前記1以上の環状核酸分子を増幅することを含む。いくつかの実施形態では、前記線状核酸分子は1以上の機能性配列を含む。いくつかの実施形態では、1以上の連鎖状核酸分子は、ローリングサークル増幅によって、増幅される。いくつかの実施形態では、(c)は、核酸分子の前記連鎖状コピーを前記基板上に配置することを含む。いくつかの実施形態では、前記1以上の鎖状核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される。いくつかの実施形態では、方法は、前記基板を保管する工程を含む。いくつかの実施形態では、前記保管する工程は凍結乾燥またはフリーズドライを含む。いくつかの実施形態では、前記基板はシリコンを含む。いくつかの実施形態では、前記基板はガラスを含む。いくつかの実施形態では、前記基板は2枚のガラスを含む。いくつかの実施形態では、方法は、前記回収する工程前の増幅なしに、前記1以上の核酸分子から前記データを回収する工程をさらに含む。
【0012】
本明細書に記載される別の態様は、データを保存するための方法を提供し、前記方法は、基板に核酸分子を配置する工程を含み、前記核酸分子は前記データをコードする。いくつかの実施形態では、前記核酸分子は、核酸鎖状体を含む。いくつかの実施形態では、前記鎖状体分子は、第1の鎖状核酸分子と第2の鎖状核酸分子との間の平均距離がλ/(2NA)の基準未満である密度で配置される。いくつかの実施形態では、前記基板はシリコンを含む。いくつかの実施形態では、前記基板はガラスを含む。いくつかの実施形態では、前記基板は2枚のガラスを含む。いくつかの実施形態では、前記データは、配列決定前の環状化または増幅なしに、核酸分子から回収される。
【0013】
本明細書に記載される別の態様は、1以上のビットの情報を保存する方法を提供し、前記方法は、複数のヌクレオチドにおける前記1以上のビットの情報をコードする工程、前記複数のヌクレオチドを1以上のプライマーに連結する工程、前記複数のヌクレオチドを約300~約1,000の長さのヌクレオチドに合成する工程、前記複数のヌクレオチドを環状化する工程、および前記複数のヌクレオチドを基板上に配置する工程、を含む。
【0014】
本明細書に記載される別の態様は、1以上のビットの情報を保存する方法を提供し、前記方法は、前記1以上のビットの情報をコードする線状核酸分子を合成する工程であって、前記線状核酸分子が、前記1以上のビットの情報をコードする核酸配列、5’アダプター配列、3’アダプター配列、および任意の1以上の追加の機能性配列を含む工程、環状核酸分子を前記線状核酸分子から生成する工程、環状核酸分子の1超のコピーを含む第2の核酸分子を生成するために、前記環状核酸分子を増幅する工程、前記第2の核酸分子をアレイ上に配置する工程、を含む。いくつかの実施形態では、方法は前記アレイを1以上の基板上に配置する工程をさらに含む。いくつかの実施形態では、方法は前記1以上の基板を保管する工程をさらに含む。いくつかの実施形態では、前記保管する工程は凍結乾燥またはフリーズドライを含む。いくつかの実施形態では、方法は前記回収する工程前の増幅なしに、前記1以上の核酸分子から、前記1以上のビットの情報を回収する工程をさらに含む。いくつかの実施形態では、前記1以上のビットの情報は、配列決定反応によって、前記アレイから回収する。いくつかの実施形態では、方法はエラー修正を、回収した1以上のビットの情報に、適用する工程をさらに含む。いくつかの実施形態では、前記エラー修正はリードソロモン符号を使用することを含む。いくつかの実施形態では、前記1以上のビットの情報は、配列決定前の増幅複製反応なしに、前記アレイから回収される。いくつかの実施形態では、前記ビットの情報は2値ビットを含む。いくつかの実施形態では、前記ビットの情報は2値ビットを含み、および(a)は前記2値ビットの情報を4値ビットの情報に転写することを含む。いくつかの実施形態では、前記アダプター配列は、バーコード配列を含む。いくつかの実施形態では、前記1以上の機能性配列は、バーコード配列、タグ配列、ユニバーサルプライマー配列、固有識別子配列、または追加のアダプター配列から成る群から選択される。いくつかの実施形態では、前記環状核酸分子は前記5’アダプターおよび前記3’アダプターをライゲートすることによって生成される。いくつかの実施形態では、前記環状核酸分子は、ローリングサークルPCR増幅によって、増幅される。いくつかの実施形態では、前記第2の核酸分子は核酸鎖状体である。いくつかの実施形態では、前記第2の核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される。いくつかの実施形態では、前記アレイはシリコン処理した基板を含む。いくつかの実施形態では、前記アレイはガラス基板を含む。いくつかの実施形態では、前記アレイは第1のガラス基板および第2のガラス基板を含む。いくつかの実施形態では、方法は、前述の請求項のいずれか1つにおけるような方法を実施するためにプログラム化されるコンピューターシステムによって自動化される。
【0015】
本明細書に記載される別の態様は、コンピューターシステムを提供し、コンピューターシステムは本明細書に記載されるような方法を実施するためにプログラム化される。
【0016】
本明細書に記載される別の態様は、少なくとも1ギガバイト(GB)のデータをコードする、少なくとも一部の核酸配列を含む複数の核酸分子を提供し、前記核酸分子は、1%以下の前記核酸配列が1年間にわたって分解するような安定性を有する。いくつかの実施形態では、核酸分子は環状である。いくつかの実施形態では、核酸分子は、複数のヘッダー配列をさらに含み、前記複数のヘッダー配列の1つのヘッダー配列が、前記1GBのデータを回収するために、前記核酸配列の少なくとも前記部分の配列決定を可能にするように構成される。
【0017】
本明細書に記載される別の態様は、データを保存するための方法を提供し、前記方法は、(a)核酸配列においてデータをコードする工程、(b)核酸配列を含む核酸分子を生成する工程、および(c)核酸分子をアレイに保存する工程、を含む。いくつかの実施形態では、核酸分子は環状である。いくつかの実施形態では、核酸分子は核酸鎖状体である。いくつかの実施形態では、(b)核酸配列の少なくとも一部を含む線状核酸分子を生成すること、および環状核酸分子を生成するために、線状核酸分子の末端を、互いに連結することを含む。別の実施形態では、(b)は、(i)線状核酸分子、第1のアダプター配列、および第2のアダプター配列を含む線状核酸分子を生成することであって、第1のアダプター配列および第2のアダプター配列が環状核酸分子の形成を可能にすること、および(ii)核酸鎖状体を生成するために環状核酸分子を増幅することを含む。いくつかの実施形態では、線状核酸分子は機能性配列を含む。いくつかの実施形態では、線状核酸分子は複数の機能性配列を含む。
【0018】
いくつかの実施形態では、核酸鎖状体は、ローリングサークル増幅によって、生成される。いくつかの実施形態では、(c)は核酸分子を基板に配置することを含む。いくつかの実施形態では、核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される。いくつかの実施形態では、アレイはシリコン基板を含む。いくつかの実施形態では、アレイはガラス基板を含む。
【0019】
いくつかの実施形態では、データは配列決定前のポリメラーゼ連鎖反応増幅なしに、核酸分子から回収される。
【0020】
別の態様では、データを保存するための方法が開示され、核酸分子を基板に固定化する工程または配置する工程を含み、核酸分子はデータをコードする。いくつかの実施形態では、核酸分子は核酸鎖状体を含む。いくつかの実施形態では、核酸分子は、第1の核酸分子と第2の核酸分子との間の平均距離がλ/(2NA)の基準未満である密度で、固定化または配置される。いくつかの実施形態では、基板はシリコンを含む。いくつかの実施形態では、基板はガラスを含む。いくつかの実施形態では、データは配列決定前の増幅なしに、核酸分子から回収される。
【0021】
別の態様では、1以上のビットの情報を保存する方法が開示され、前記方法は、(a)複数のヌクレオチドにおける1以上のビットの情報をコードする工程、(b)複数のヌクレオチドを1以上のプライマーに連結する工程、(c)複数のヌクレオチドを約300~約1,000の範囲のヌクレオチドに合成する工程、(d)複数のヌクレオチドを環状化する工程、(e)複数のヌクレオチドを基板上に配置する工程、を含む。
【0022】
別の態様では、1以上のビットの情報を保存する方法が開示され、前記方法は、(a)1以上のビットの情報をコードする線状核酸分子を合成する工程であって、前記線状核酸分子は、(i)データをコードする核酸配列、(ii)5’アダプター配列、(iii)3’アダプター配列、および(iv)任意の1以上の追加の機能性配列を含む、工程および(b)環状核酸分子を線状核酸分子から生成する工程、および(c)環状核酸分子の1超のコピーを含む第2の核酸分子を生成するために、環状核酸分子を増幅する工程、および(d)パターン化しているまたはパターン化していないアレイ上に第2の核酸分子を固定化するまたは配置する工程、を含む。
【0023】
いくつかの実施形態では、情報は配列決定反応によってアレイから回収する。いくつかの実施形態では、情報を回収することは、エラー修正を、回収した1以上のビットの情報に、適用することをさらに含む。いくつかの実施形態では、エラー修正はリードソロモン符号を使用することを含む。いくつかの実施形態では、情報は、配列決定前の増幅複製反応なしに、アレイから回収される。
【0024】
いくつかの実施形態では、ビットの情報は2値ビットを含む。いくつかの実施形態では、ビットの情報は2値ビットを含み、(a)は2値ビットの情報を4値ビットの情報に転写することを含む。いくつかの実施形態では、アダプター配列はバーコード配列を含む。1以上の機能性配列は、バーコード配列、タグ配列、ユニバーサルプライマー配列、固有識別子配列、または追加のアダプター配列から成る群から選択される。いくつかの実施形態では、環状核酸分子は5’アダプターおよび3’アダプターをライゲートすることによって生成される。いくつかの実施形態では、環状核酸分子はローリングサークル反応によって増幅される。いくつかの実施形態では、第2の核酸分子は核酸鎖状体である。いくつかの実施形態では、第2の核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で、基板上に固定化または配置される。
【0025】
いくつかの実施形態では、アレイはシリコン処理された基板を含む。いくつかの実施形態では、アレイはガラス基板を含む。いくつかの実施形態では、アレイは第1のガラス基板および第2のガラス基板を含む。
【0026】
本開示の別の態様は、1以上のコンピュータプロセッサによる実行に際し、上記または本明細書中の他の場所における方法のうちのいずれかを実施する、機械実行可能なコードを含む非一時的なコンピュータ可読媒体を提供する。
【0027】
本開示の別の態様は、1以上のコンピュータプロセッサ、およびそれに接続されたコンピュータメモリを含む、システムを提供する。コンピュータメモリは、1以上のコンピュータプロセッサによる実行に際して、上記または本明細書中の他の場所における方法のうちいずれかを実行する機械実行可能なコードを含む。
【0028】
本開示の追加の態様および利点は、以下の詳細な説明から当業者に容易に明白となり、ここでは、本開示の例示的な実施形態のみが示され、記載されている。以下の記載から分かるように、本開示は、他の実施形態や異なる実施形態を実施可能であり、その様々な詳細は様々な明白な観点から修正可能であり、そのすべては本開示から逸脱するものではない。したがって、図面とその説明は事実上例示的とみなされるが、限定的とはみなされない。
【0029】
引用による組み込み
本明細書で言及されるすべての公開物、特許、および特許出願は、あたかも個々の公開物、特許、または特許出願がそれぞれ参照により本明細書に具体的かつ個別に組み込まれるのと同じ程度にまで、参照により本明細書に組み込まれている。引用により組み込まれる刊行物および特許または特許出願が、本明細書に含まれる開示に矛盾する程度まで、本明細書は、そのような矛盾のある題材に取って代わる、および/または、それに先立つように意図される。
【図面の簡単な説明】
【0030】
本発明の新規な特徴は、とりわけ添付の請求項で説明される。本発明の特徴と利点は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面(本明細書では「図(“Figure”and“FIG.”)」とも称する)とを参照することにより、より良く理解されるであろう。
【0031】
図1】核酸分子中の情報またはデータのビットをコードするため、およびアレイ上に核酸分子を配置するための概要を描く。その後、アレイは基板上に配置され、長期間保存のために保存されるか、配列決定されるか、または保存されてから配列決定されるかのいずれかである。
図2】本明細書に記載されるシステムおよび方法を自動化するためにコンピューターシステムを利用するための概要を描く。
【発明を実施するための形態】
【0032】
本発明の様々な実施形態が本明細書で示され、記載されているが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多くの変形、変更、および置き換えは、本発明から逸脱することなく、当業者によって想到され得る。本明細書に記載される本発明の実施形態の様々な代案が利用され得ることを理解されたい。
【0033】
本明細書で使用されるように、用語「鎖状体」は、環状核酸分子のコピーを指す。鎖状体は円形の核酸分子から生成され、これは線状核酸分子の末端が、円形の核酸分子を達成するために連結された後、ローリングサークル増幅によって増幅される。鎖状体は全分子にわたって繰り返す核酸の単一の配列を含有し、またはそれらは異なる配列の核酸配列を含有し得、ここでは、各異なる配列または繰り返される配列のセットが、アダプター配列または領域によって分離される。
【0034】
本明細書で使用されるように、「配列決定のため機器」は、核酸分子配列決定の当該技術分野の当業者に知られている、ハードウェア、ソフトウェア、試薬、画像化モジュール、および/または、それらの任意の組み合わせを含む機器を指す。
【0035】
本明細書で使用されるように、「分析物」は分析に適している任意の1以上の分子を指す。限定されないが、核酸分子、タンパク質、ペプチドなどを含む。本明細書に記載される本開示の全体にわたって、用語「分析物(s)」は、開示の範囲を変更せずに、「核酸(s)」および/または「核酸分子(s)」および/または「環状核酸分子(s)」および/または鎖状体と共に互換性があるように使用され得る。
【0036】
本明細書で使用されるように、「ヘッダー配列(s)」は、異なる配列決定プライマーを用いてアドレス可能な既知の配列を指す。
【0037】
用語「少なくとも」、「~超」、または「~以上」は、一連の2つ以上の数値における最初の数値の前に付けられる場合は常に、用語「少なくとも」、「~超」、または「~以上」は、一連の数値における数値の各々に適用される。例えば、1、2、または3以上は、1以上、2以上、または3以上と同等の意味である。
【0038】
用語「~以下(no more than)」、「~未満」、または「~以下(less than or equal to)」が一連の2つ以上の数値における最初の数値の前に付けられる場合は常に、用語「~以下(no more than)」、「~未満」、または「~以下(less than or equal to)は、一連の数値における数値の各々に適用される。例えば、3、2、または1以下は、3以下、2以下、または1以下と同等の意味である。
【0039】
ある場合では、方法はデータを保存する工程を含み、前記方法は、(a)核酸配列においてデータをコードする工程、(b)核酸配列を含む核酸分子を生成する工程、および(c)核酸分子分析物を順序付けられているまたは順序付けられていないアレイ上に保存する工程、を含む。一例では、核酸分子は環状である。一例では、核酸分子は核酸鎖状体である。一例では、(b)は、核酸配列の少なくとも一部を含む線状核酸分子を生成すること、および環状核酸分子を生成するために線状核酸分子の末端を互いに連結することを含む。別の例では、(b)は、(i)線状核酸分子、第1のアダプター配列、および第2のアダプター配列を含む線状核酸分子を生成することであって、第1のアダプター配列および第2のアダプター配列が環状核酸分子の形成を可能にすること、および(ii)核酸鎖状体を生成するために環状核酸分子を増幅することを含む。いくつかの例では、線状核酸分子は機能性配列を含む。いくつかの例では、線状核酸分子は複数の機能性配列を含む。
【0040】
一例では、核酸鎖状体は、ローリングサークル増幅によって、生成される。一例では、(c)は、分析物の核酸分子を基板上に配置することを含む。いくつかの例では、分析物は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で、配置される。いくつかの例では、アレイはシリコン基板を含む。いくつかの例では、アレイはガラス基板を含む。
【0041】
一例では、データは配列決定前の増幅なしに、核酸分子から回収される。
【0042】
ある場合では、データを保存するための方法が開示され、前記方法は、核酸分子を基板に固定化する工程または配置する工程を含み、ここでは、核酸分子がデータをコードする。一例では、核酸分子は核酸鎖状体を含む。一例では、環状核酸分子は、第1の鎖状核酸分子と第2の鎖状核酸分子との間の平均距離がλ/(2NA)の基準未満である密度で、固定化または配置される。いくつかの例では、基板はシリコンを含む。いくつかの例では、基板はガラスを含む。一例では、データは配列決定前のポリメラーゼ連鎖反応増幅なしに核酸分子から回収される。
【0043】
ある場合では、方法は1以上のビットの情報を保存する工程を含み、前記方法は、(a)複数のヌクレオチドにおいて1以上のビットの情報をコードする工程、(b)複数のヌクレオチドを1以上のプライマーに連結する工程、(c)複数のヌクレオチドを約300~約1,000の範囲のヌクレオチドに合成する工程、(d)複数の分析物を環状化する(または環状化しない)工程、および(e)複数の分析物を基板上に配置する工程、を含む。
【0044】
第4の場合では、方法は1以上のビットの情報を保存する工程を含み、前記方法は、(a)1以上のビットの情報をコードする線状核酸分子を合成する工程であって、前記線状核酸分子は、(i)データをコードする核酸配列、(ii)5’アダプター配列、(iii)3’アダプター配列、および(iv)任意の1以上の追加の機能性配列を含む、工程、および(b)環状核酸分子を線状核酸分子から生成する工程、および(c)環状核酸分子の1超のコピーを含む分析物を生成するために、環状核酸分子を増幅する工程、および(d)分析物をアレイ上に固定化する工程または配置する工程、を含む。
【0045】
一例では、情報は配列決定反応によって、アレイから回収される。一例では、情報を回収することは、エラー修正を回収した1以上のビットの情報に、適用することを、さらに含む。いくつかの例では、エラー修正はリードソロモン符号を使用することを含む。一例では、情報は、配列決定前の増幅複製反応なしに、アレイから回収される。
【0046】
一例では、ビットの情報は2値ビットを含む。一例では、ビットの情報は2値ビットを含み、および(a)は2値ビットの情報を4値ビットの情報に転写することを含む。一例では、アダプター配列はバーコード配列を含む。1以上の機能性配列は、バーコード配列、タグ配列、ユニバーサルプライマー配列、固有識別子配列、または追加のアダプター配列から成る群から選択される。一例では、環状核酸分子は、5’アダプターおよび3’アダプターをライゲートすることによって生成される。一例では、環状核酸分子は、ローリングサークルPCR反応によって、増幅される。一例では、第2の核酸分子は核酸鎖状体である。一例では、第2の核酸分子は、2以上の核酸分子間の平均距離がλ/(2NA)の基準未満である密度で配置される。
【0047】
一例では、アレイはシリコン処理された基板を含む。一例では、アレイはガラス基板を含む。一例では、アレイは第1のガラス基板および第2のガラス基板を含む。
【0048】
配列決定の技術は、IlluminaおよびComplete Genomicsなどの会社によって開発された画像ベースのシステムと、Ion TorrentおよびOxford Nanoporeなどの会社によって開発された電気ベースのシステムと、を含む。画像ベースの配列決定システムは、現在、存在する全ての配列決定の技術のうち最も低い配列決定のコストを有する。画像ベースのシステムは、ハイスループットの画像化光学と低コストの消耗品の組み合わせを介して、低コストを達成する。しかしながら、従来の光検出システムは、部分的に、光システムの回折限界によって、最小で約1ミクロンの、隣接する解像可能な分子間の中心点間距離を有する。いくつかの実施形態では、本明細書に記載されるのは、サイクル検出を使用した存在する生物化学を使用する画像ベースの配列決定のシステム、分析物の正確な位置の決定、および回折限界未満で作動する、増加した充填密度に適用するために、画像化信号の高精度なデコンボリューションのための位置情報の使用に対して、大幅な低コストを達成するための方法である。
【0049】
長期保存のための基板上への核酸分子の配置
本明細書に提供されるのは、コードされた核酸分子上に情報を保存するためおよび長期保存のための核酸分子を処理するためのシステムおよび方法である。本明細書に記載されるシステムおよび方法は、核酸分子が商業的に実行可能な速度で分解しないかまたは分解するように、核酸分子を保管する処理技術を対象としている。
【0050】
いくつかの実施形態では、核酸分子は、単一セグメントまたは保存された情報セグメントおよび必要な情報(例えば、リードソロモン符号または冗長性)を含む一連のセグメントのどちらかとして処理され、迅速かつ正確な回収を確実にする。核酸分子のためのセグメント長は、正確な合成(合成による配列決定の技術または他の配列決定のアプローチによって)および正確な回収(配列決定の技術および機器によって)の両方を確実にするために選択される。いくつかの実施形態では、情報セグメントは50-75の塩基の範囲にあり、適切に合成と回収の両方のための大きさにされる。
【0051】
いくつかの実施形態では、情報セグメントは、約30~約140の塩基の長さにある。いくつかの実施形態では、情報セグメントは、約30塩基~約40塩基、約30塩基~約50塩基、約30塩基~約60塩基、約30塩基~約70塩基、約30塩基~約80塩基、約30塩基~約90塩基、約30塩基~約100塩基、約30塩基~約110塩基、約30塩基~約120塩基、約30塩基~約130塩基、約30塩基~約140塩基、約40塩基~約50塩基、約40塩基~約60塩基、約40塩基~約70塩基、約40塩基~約80塩基、約40塩基~約90塩基、約40塩基~約100塩基、約40塩基~約110塩基、約40塩基~約120塩基、約40塩基~約130塩基、約40塩基~約140塩基、約50塩基~約60塩基、約50塩基~約70塩基、約50塩基~約80塩基、約50塩基~約90塩基、約50塩基~約100塩基、約50塩基~約110塩基、約50塩基~約120塩基、約50塩基~約130塩基、約50塩基~約140塩基、約60塩基~約70塩基、約60塩基~約80塩基、約60塩基~約90塩基、約60塩基~約100塩基、約60塩基~約110塩基、約60塩基~約120塩基、約60塩基~約130塩基、約60塩基~約140塩基、約70塩基~約80塩基、約70塩基~約90塩基、約70塩基~約100塩基、約70塩基~約110塩基、約70塩基~約120塩基、約70塩基~約130塩基、約70塩基~約140塩基、約80塩基~約90塩基、約80塩基~約100塩基、約80塩基~約110塩基、約80塩基~約120塩基、約80塩基~約130塩基、約80塩基~約140塩基、約90塩基~約100塩基、約90塩基~約110塩基、約90塩基~約120塩基、約90塩基~約130塩基、約90塩基~約140塩基、約100塩基~約110塩基、約100塩基~約120塩基、約100塩基~約130塩基、約100塩基~約140塩基、約110塩基~約120塩基、約110塩基~約130塩基、約110塩基~約140塩基、約120塩基~約130塩基、約120塩基~約140塩基、または約130塩基~約140塩基の長さにある。いくつかの実施形態では、情報セグメントは、約30塩基、約40塩基、約50塩基、約60塩基、約70塩基、約80塩基、約90塩基、約100塩基、約110塩基、約120塩基、約130塩基、または約140塩基の長さにある。いくつかの実施形態では、情報セグメントは、少なくとも約30塩基、約40塩基、約50塩基、約60塩基、約70塩基、約80塩基、約90塩基、約100塩基、約110塩基、約120塩基、または約130塩基の長さにある。いくつかの実施形態では、情報セグメントは、最大で約40塩基、約50塩基、約60塩基、約70塩基、約80塩基、約90塩基、約100塩基、約110塩基、約120塩基、約130塩基、または約140塩基の長さにある。
【0052】
いくつかの実施形態では、核酸分子は、例えば、ローリングサークル増幅によって、環状核酸分子(例えば、CATまたは鎖状体)に変換され、並びに配列決定および検出のために適切な基板に付着させるために適切なアダプターに付着される(US20150330974またはUS20160201119および/またはUS10378053のとおり)。共通配列は、核酸分子を配列決定および環状化のプライミングに適切な配列を最小限に含有する。いくつかの実施形態では、環状化された核酸分子の完全長は300‐1,000の塩基の範囲にある。いくつかの実施形態では、環状化された核酸分子の長さは、同じ環内の複数の情報セグメントを付加することによって達成され得、異なる配列決定プライマー(本明細書では「ヘッダー配列」と呼ばれる)でアドレス可能な配列によって分離され得る。いくつかの実施形態では、環状化された核酸分子の長さは、適切なサイズを達成するために配列決定されるスタッファーフラグメントを導入することによって達成され得る。
【0053】
いくつかの実施形態では、環状化された核酸分子の長さは、約200~約1,200の塩基である。いくつかの実施形態では、環状化された核酸分子の長さは、約200塩基~約300塩基、約200塩基~約400塩基、約200塩基~約500塩基、約200塩基~約600塩基、約200塩基~約700塩基、約200塩基~約800塩基、約200塩基~約900塩基、約200塩基~約1、000塩基、約200塩基~約1、100塩基、約200塩基~約1、200塩基、約300塩基~約400塩基、約300塩基~約500塩基、約300塩基~約600塩基、約300塩基~約700塩基、約300塩基~約800塩基、約300塩基~約900塩基、約300塩基~約1、000塩基、約300塩基~約1、100塩基、約300塩基~約1、200塩基、約400塩基~約500塩基、約400塩基~約600塩基、約400塩基~約700塩基、約400塩基~約800塩基、約400塩基~約900塩基、約400塩基~約1、000塩基、約400塩基~約1、100塩基、約400塩基~約1、200塩基、約500塩基~約600塩基、約500塩基~約700塩基、約500塩基~約800塩基、約500塩基~約900塩基、約500塩基~約1、000塩基、約500塩基~約1、100塩基、約500塩基~約1、200塩基、約600塩基~約700塩基、約600塩基~約800塩基、約600塩基~約900塩基、約600塩基~約1、000塩基、約600塩基~約1、100塩基、約600塩基~約1、200塩基、約700塩基~約800塩基、約700塩基~約900塩基、約700塩基~約1、000塩基、約700塩基~約1、100塩基、約700塩基~約1、200塩基、約800塩基~約900塩基、約800塩基~約1、000塩基、約800塩基~約1、100塩基、約800塩基~約1、200塩基、約900塩基~約1、000塩基、約900塩基~約1、100塩基、約900塩基~約1、200塩基、約1、000塩基~約1、100塩基、約1、000塩基~約1、200塩基、または約1、100塩基~約1、200塩基である。いくつかの実施形態では、環状化された核酸分子の長さは、約200塩基、約300塩基、約400塩基、約500塩基、約600塩基、約700塩基、約800塩基、約900塩基、約1、000塩基、約1、100塩基、または約1、200塩基である。いくつかの実施形態では、環状化された核酸分子の長さは、少なくとも約200塩基、約300塩基、約400塩基、約500塩基、約600塩基、約700塩基、約800塩基、約900塩基、約1、000塩基、または約1、100塩基である。いくつかの実施形態では、環状化された核酸分子の長さは、最大で約300塩基、約400塩基、約500塩基、約600塩基、約700塩基、約800塩基、約900塩基、約1、000塩基、約1、100塩基、または約1、200塩基である。
【0054】
いくつかの実施形態では、環状化された核酸分子は、基板上(配列決定のためのチップなど)に配置される。いくつかの実施形態では、1以上の核酸分子が基板上に配置された後、基板は長期保存のために処理されなければならない。いくつかの実施形態では、処理は基板を乾燥させることを含む。いくつかの実施形態では、処理は凍結乾燥(lyophilization)または凍結乾燥(cryodesiccation)など、フリーズドライを含む。凍結乾燥は、産物を乾燥させること、圧力を低下すること、その後昇華により氷を取り除くことを含み得る、低温度の脱水処理を含む、フリーズドライ処理の使用を含み得る。いくつかの実施形態では、乾燥処理の前に、環状化された核酸分子が配置される基板は、乾燥処理中の安定性および乾燥処理からの回収を確実にするために、処理される(負荷後の処理)。いくつかの実施形態では、処理は、環状核酸分子を安定化するために基板の表面を、例えばBSAまたは硫酸デキストランでコーティングすることと、フリーズドライ中の氷晶の形成および再脱水中の衝撃から、基板を安定化させ保護するための糖(例えば、マンニトール、スクロース、トレハロース、ラクトース、マルトース、グルコース、グリシン、グリセロールなど)などの適切な賦形剤および適切な緩衝液などの導入と、を含む。
【0055】
いくつかの実施形態では、核酸分子の増幅(例えばローリングサークル増幅)は、核酸分子を含む基板の長期保存前に生じる。いくつかの実施形態では、核酸分子の増幅が、核酸分子が配置される基板上に生じる。いくつかの実施形態では、増幅はブリッジ増幅である。いくつかの実施形態では、核酸分子の増幅(例えばローリングサークル増幅)が、核酸分子を基板上に配置する前に生じる。いつかの実施形態では、増幅はローリングサークル増幅である。
【0056】
いくつかの実施形態では、環状核酸分子は、保存のために複数のスライド上に配置される。いくつかの実施形態では、スライドは複数の明確なレーンおよび/またはトラックを有する。いくつかの実施形態では、固有のヘッダー配列は、情報を含む特異的配列に関する位置情報を識別するために使用される。いくつかの実施形態では、位置情報は、所与のセットの情報を保存するために使用されるすべてのヘッダー配列に関する情報を含むカタログで見つけられる。いくつかの実施形態では、最終的な回収のためにセットアップされた情報は、保存のために基板/スライド上に配置された核酸分子に含有されているが、核酸分子の複数のコピーはバックアップ情報として別々に保存される。いくつかの実施形態では、情報保存処理の将来の保証に加えて、各レーンに対応する核酸分子は、バックアップとして別々に乾燥され保存される。いくつかの実施形態では、バックアップの核酸分子は、その後最初に処理され保存されたスライド上の情報が回収不能であるという事象で、必要に応じて処理され得る。
【0057】
いくつかの実施形態では、保管された核酸の分解速度は、1年当たり約0.05%~1年当たり約2%である。いくつかの実施形態では、保管された核酸の分解速度は、1年当たり約2%~1年当たり約1%、1年当たり約2%~1年当たり約0.9%、1年当たり約2%~1年当たり約0.8%、1年当たり約2%~1年当たり約0.7%、1年当たり約2%~1年当たり約0.6%、1年当たり約2%~1年当たり約0.5%、1年当たり約2%~1年当たり約0.4%、1年当たり約2%~1年当たり約0.3%、1年当たり約2%~1年当たり約0.2%、1年当たり約2%~1年当たり約0.1%、1年当たり約2%~1年当たり約0.05%、1年当たり約1%~1年当たり約0.9%、1年当たり約1%~1年当たり約0.8%、1年当たり約1%~1年当たり約0.7%、1年当たり約1%~1年当たり約0.6%、1年当たり約1%~1年当たり約0.5%、1年当たり約1%~1年当たり約0.4%、1年当たり約1%~1年当たり約0.3%、1年当たり約1%~1年当たり約0.2%、1年当たり約1%~1年当たり約0.1%、1年当たり約1%~1年当たり約0.05%、1年当たり約0.9%~1年当たり約0.8%、1年当たり約0.9%~1年当たり約0.7%、1年当たり約0.9%~1年当たり約0.6%、1年当たり約0.9%~1年当たり約0.5%、1年当たり約0.9%~1年当たり約0.4%、1年当たり約0.9%~1年当たり約0.3%、1年当たり約0.9%~1年当たり約0.2%、1年当たり約0.9%~1年当たり約0.1%、1年当たり約0.9%~1年当たり約0.05%、1年当たり約0.8%~1年当たり約0.7%、1年当たり約0.8%~1年当たり約0.6%、1年当たり約0.8%~1年当たり約0.5%、1年当たり約0.8%~1年当たり約0.4%、1年当たり約0.8%~1年当たり約0.3%、1年当たり約0.8%~1年当たり約0.2%、1年当たり約0.8%~1年当たり約0.1%、1年当たり約0.8%~1年当たり約0.05%、1年当たり約0.7%~1年当たり約0.6%、1年当たり約0.7%~1年当たり約0.5%、1年当たり約0.7%~1年当たり約0.4%、1年当たり約0.7%~1年当たり約0.3%、1年当たり約0.7%~1年当たり約0.2%、1年当たり約0.7%~1年当たり約0.1%、1年当たり約0.7%~1年当たり約0.05%、1年当たり約0.6%~1年当たり約0.5%、1年当たり約0.6%~1年当たり約0.4%、1年当たり約0.6%~1年当たり約0.3%、1年当たり約0.6%~1年当たり約0.2%、1年当たり約0.6%~1年当たり約0.1%、1年当たり約0.6%~1年当たり約0.05%、1年当たり約0.5%~1年当たり約0.4%、1年当たり約0.5%~1年当たり約0.3%、1年当たり約0.5%~1年当たり約0.2%、1年当たり約0.5%~1年当たり約0.1%、1年当たり約0.5%~1年当たり約0.05%、1年当たり約0.4%~1年当たり約0.3%、1年当たり約0.4%~1年当たり約0.2%、1年当たり約0.4%~1年当たり約0.1%、1年当たり約0.4%~1年当たり約0.05%、1年当たり約0.3%~1年当たり約0.2%、1年当たり約0.3%~1年当たり約0.1%、1年当たり約0.3%~1年当たり約0.05%、1年当たり約0.2%~1年当たり約0.1%、1年当たり約0.2%~1年当たり約0.05%、または1年当たり約0.1%~1年当たり約0.05%である。いくつかの実施形態では、保管された核酸の分解速度は、1年当たり約2%、1年当たり約1%、1年当たり約0.9%、1年当たり約0.8%、1年当たり約0.7%、1年当たり約0.6%、1年当たり約0.5%、1年当たり約0.4%、1年当たり約0.3%、1年当たり約0.2%、1年当たり約0.1%、または1年当たり約0.05%である。いくつかの実施形態では、保管された核酸の分解速度は、少なくとも1年当たり約2%、1年当たり約1%、1年当たり約0.9%、1年当たり約0.8%、1年当たり約0.7%、1年当たり約0.6%、1年当たり約0.5%、1年当たり約0.4%、1年当たり約0.3%、1年当たり約0.2%、または1年当たり約0.1%である。いくつかの実施形態では、保管された核酸の分解速度は、最大で1年当たり約1%、1年当たり約0.9%、1年当たり約0.8%、1年当たり約0.7%、1年当たり約0.6%、1年当たり約0.5%、1年当たり約0.4%、1年当たり約0.3%、1年当たり約0.2%、1年当たり約0.1%、または1年当たり約0.05%である。
【0058】
いくつかの実施形態では、核酸分子を含む基板は、1以上のデータセンターで保存される。いくつかの実施形態では、1以上のデータセンターは、基板を含有および維持するように構成される複数の取り付け可能なラックを含む。いくつかの実施形態では、1以上のデータセンターは、核酸分子を配列決定(合成または他の次世代の配列決定の技術または他の核酸分子の配列決定の技術による配列決定)するために、1以上の機器を含む。いくつかの実施形態では、核酸分子を配列決定するための機器は、ラックに取り付け可能にするように構成される。いくつかの実施形態では、1以上のデータセンターは、完全に自動化された基板の保存を支持するようにおよび核酸分子の配列決定のための機器に送達するように構成される。
【0059】
いくつかの実施形態では、本明細書に記載されるシステムと方法は、保存された情報を回収の待ち時間を減少する(送達するためのデータ要求)。いくつかの実施形態では、データ回収のための期間は、約1時間~約12時間まで減少する。いくつかの実施形態では、データ回収のための期間は、約1時間~約2時間、約1時間~約3時間、約1時間~約4時間、約1時間~約5時間、約1時間~約6時間、約1時間~約7時間、約1時間~約8時間、約1時間~約9時間、約1時間~約10時間、約1時間~約11時間、約1時間~約12時間、約2時間~約3時間、約2時間~約4時間、約2時間~約5時間、約2時間~約6時間、約2時間~約7時間、約2時間~約8時間、約2時間~約9時間、約2時間~約10時間、約2時間~約11時間、約2時間~約12時間、約3時間~約4時間、約3時間~約5時間、約3時間~約6時間、約3時間~約7時間、約3時間~約8時間、約3時間~約9時間、約3時間~約10時間、約3時間~約11時間、約3時間~約12時間、約4時間~約5時間、約4時間~約6時間、約4時間~約7時間、約4時間~約8時間、約4時間~約9時間、約4時間~約10時間、約4時間~約11時間、約4時間~約12時間、約5時間~約6時間、約5時間~約7時間、約5時間~約8時間、約5時間~約9時間、約5時間~約10時間、約5時間~約11時間、約5時間~約12時間、約6時間~約7時間、約6時間~約8時間、約6時間~約9時間、約6時間~約10時間、約6時間~約11時間、約6時間~約12時間、約7時間~約8時間、約7時間~約9時間、約7時間~約10時間、約7時間~約11時間、約7時間~約12時間、約8時間~約9時間、約8時間~約10時間、約8時間~約11時間、約8時間~約12時間、約9時間~約10時間、約9時間~約11時間、約9時間~約12時間、約10時間~約11時間、約10時間~約12時間、または約11時間~約12時間まで減少する。いくつかの実施形態では、データ回収のための時間は、約1時間、約2時間、約3時間、約4時間、約5時間、約6時間、約7時間、約8時間、約9時間、約10時間、約11時間、または約12時間まで減少する。いくつかの実施形態では、データ回収のための時間は、少なくとも約1時間、約2時間、約3時間、約4時間、約5時間、約6時間、約7時間、約8時間、約9時間、約10時間、または約11時間まで減少する。いくつかの実施形態では、データ回収のための時間は、最大で約2時間、約3時間、約4時間、約5時間、約6時間、約7時間、約8時間、約9時間、約10時間、約11時間、または約12時間まで減少する。
【0060】
情報回収
本明細書に記載されるデータ保存のシステムおよび方法の1つの利点は、一旦、核酸分子と基板が本明細書に記載されるシステムおよび方法により処理されると(配置されるおよび保管される)、保存されたデータの回収は、サンプル調製(例えば、増幅)をほとんどあるいは全く必要としない。いくつかの実施形態では、サンプル調製は、核酸を基板上へと配置することを含む。いくつかの実施形態では、サンプル調製は、核酸分子の増幅を含む。いくつかの実施形態では、サンプル調製は、ポリメラーゼ連鎖反応増幅を含む。いくつかの実施形態では、サンプル調製は、核酸分子を配列決定に適切な試薬に曝すことを含む(合成または他の次世代の配列決定の技術または他の核酸分子の配列決定の技術による配列決定)。本明細書に記載されるように、対象の特定の情報をコードする核酸分子は、長期保存前に増幅される。したがって、情報回収が所望される場合、保存され、増幅された核酸分子は、再脱水させ(長期保存の技術が凍結乾燥を含んだ場合)および回収される所望の情報をコードする配列に対応するヘッダー配列に特異的な適切な核酸伸長反応プライマーと接触させる必要となるにすぎない。
【0061】
いくつかの実施形態では、本明細書に記載されるシステムおよび方法を利用する場合、配列決定に適切な試薬の必要性は、現在の核酸分子配列決定のシステムおよび方法(例えば、Illumina(登録商標)、Complete Genomics(登録商標)、BGI(登録商標)、または別の核酸配列決定の会社によって利用される現在の配列決定のシステムおよび方法)の試薬の必要性と比較して、約1倍~約12倍低減する。いくつかの実施形態では、本明細書に記載されるシステムおよび方法を利用する場合、配列決定に適切な試薬の必要性は、約1倍~約2倍、約1倍~約3倍、約1倍~約4倍、約1倍~約5倍、約1倍~約6倍、約1倍~約7倍、約1倍~約8倍、約1倍~約9倍、約1倍~約10倍、約1倍~約11倍、約1倍~約12倍、約2倍~約3倍、約2倍~約4倍、約2倍~約5倍、約2倍~約6倍、約2倍~約7倍、約2倍~約8倍、約2倍~約9倍、約2倍~約10倍、約2倍~約11倍、約2倍~約12倍、約3倍~約4倍、約3倍~約5倍、約3倍~約6倍、約3倍~約7倍、約3倍~約8倍、約3倍~約9倍、約3倍~約10倍、約3倍~約11倍、約3倍~約12倍、約4倍~約5倍、約4倍~約6倍、約4倍~約7倍、約4倍~約8倍、約4倍~約9倍、約4倍~約10倍、約4倍~約11倍、約4倍~約12倍、約5倍~約6倍、約5倍~約7倍、約5倍~約8倍、約5倍~約9倍、約5倍~約10倍、約5倍~約11倍、約5倍~約12倍、約6倍~約7倍、約6倍~約8倍、約6倍~約9倍、約6倍~約10倍、約6倍~約11倍、約6倍~約12倍、約7倍~約8倍、約7倍~約9倍、約7倍~約10倍、約7倍~約11倍、約7倍~約12倍、約8倍~約9倍、約8倍~約10倍、約8倍~約11倍、約8倍~約12倍、約9倍~約10倍、約9倍~約11倍、約9倍~約12倍、約10倍~約11倍、約10倍~約12倍、または約11倍~約12倍低減する。いくつかの実施形態では、本明細書に記載されるシステムおよび方法を利用する場合、配列決定に適切な試薬の必要性は、約1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、約11倍、または約12倍低減する。いくつかの実施形態では、本明細書に記載されるシステムおよび方法を利用する場合、配列決定に適切な試薬の必要性は、少なくとも約1倍、約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、または約11倍低減する。いくつかの実施形態では、本明細書に記載されるシステムおよび方法を利用する場合、配列決定に適切な試薬の必要性は、最大で約2倍、約3倍、約4倍、約5倍、約6倍、約7倍、約8倍、約9倍、約10倍、約11倍、または約12倍低減する。
【0062】
いくつかの実施形態では、保存された情報の回収または読み取りは、核酸分子および/または基板の再脱水後、可能である。いくつかの実施形態では、保存された情報の回収または読み取りは、核酸分子を配列決定することおよび検出することを含む(US20150330974またはUS20160201119および/またはUS10378053のとおり)。
【0063】
本明細書に提供されるのは、回折限界未満(例えば、=λ/2*NA未満)の中心点間距離で、表面上に固定化または配置される分析物からの信号の画像化を容易にするためのシステムおよび方法である。これらシステムおよび方法は、高分解能の画像を生成するために高度な画像化システム、および基板上の分子の高精度な位置決定と、密に充填された表面上の各分子に対する信号の固有性を得るための高精度な画像のデコンボリューションと、を容易にするためにサイクル検出を使用する。これら方法とシステムは、密に充填された基板上での合成による単一分子の配列決定が、高効率でかなりハイスループットなポリヌクレオチド配列の高精度な決定を提供することを可能にする。
【0064】
データ保存コストにおける低減を達成するために、本明細書に提供されるのは、回折限界未満の密度で、基板の表面上に固定化または配置されるポリヌクレオチドの信頼できる配列決定を、容易にする方法およびシステムである。これら高密度のアレイは、試薬のより効率的な使用と単位面積当たりのデータ量の増加と、を可能にする。加えて、検出の信頼性を増加することは、配列決定および検出での識別およびエラーの修正をするために合成させる必要があるクローンコピー数を減少させることを可能にし、さらには、試薬のコストとデータ処理コストとを低減する。
【0065】
基板の表面上での分析物の高密度分布
1,000ドルのゲノムに使用されるサンプルの有効ピッチと比較される提案されたピッチとの比較において、新しいアレイの密度は、170倍高く、100倍高い密度を達成する基準を満たす。単位面積当たりの画像化スポットごとのコピー数は、さらに、既存のプラットフォームより少なくとも100倍低い基準を満たす。これは、試薬コストが、コスト効果がベースラインより100倍超であることを確実にすることを助ける。
【0066】
密に充填された単一生体分子の画像化および回折限界
画像化プラットフォームに対する分子密度の増加への主な制約は、回折限界である。光システムの回折限界についての方程式は、D=λ/2*NAである。
Dが回折限界である場合、λは光の波長であり、およびNAは光システムの開口数である。典型的なエア画像化システムは0.6~0.8のNAを有する。λ=600nmを使用すると、回折限界は375nmと500nmとの間である。浸水システムについては、NAは1.0であり、300nmの回折限界を与える。
【0067】
生体分子を含むアレイまたは他の基板表面上の特徴が近すぎると、2つの光信号が実質的に重なるため、画像だけでは確実に解像できない1つの小塊が見えてしまう。これは、動いている基板の不正確なトラッキングまたはセンサーと基板の表面との間の光路における光学的変化によるぼかしなどの、光画像化システムによってもたらされるエラーによって、悪化され得る。
【0068】
顕微鏡の試料面内の一点から発する透過光または蛍光発光の波面は、対物絞りの端で回折されるようになり、効果的に波面を広げて、点源の画像を生成し、この画像は、有限ではあるが、原点より大きいサイズの中央ディスクを有する回折パターンに拡大される。したがって、光の回折によって、試料の画像は、試料中に存在する実際の細部を完全に表すことがない、なぜなら、顕微鏡光システムが構造の細部を解像できない下限未満があるためである。
【0069】
顕微鏡でのサブ波長構造の観察は、回折限界のために困難である。蛍光タンパク質またはヌクレオチドの単一分子などの顕微鏡中の点対象は、干渉の作用によって作られた回折パターンからなる中間面で画像を生成する。高倍率である場合、点対象の回折パターンは、一連の回折リングに囲まれた中心スポット(回折ディスク)からなることが観察される。組み合わせると、この点源回折パターンは、エアリーディスクと呼ばれる。
【0070】
エアリーパターンにおける中心スポットのサイズは、光の波長と対物レンズの開口角とに関連する。顕微鏡対物レンズについては、開口角は、開口数(NA)によって記載され、それは、対物レンズが試料から光を集めることができる半角、sin θという用語を含む。解像度の点から、側面(x、y)画像面における回折エアリーディスクの半径は、以下の式によって定義され、アッベ解像度x,y=λ/2*NA、ここでは、λが透過光における照明の平均波長または蛍光における励起波長帯である。対物レンズの開口数(NA=n・sin(θ))は、画像化媒体の屈折率によって定義される(n;通常、空気、水、グリセリン、または油)に開口角(sin(θ)の正弦を乗する)。この関係の結果、点源によって作られるスポットのサイズは、波長の減少と開口数の増加に伴って減少するが、常に有限の直径のディスクのままである。アッベ解像度(つまりアッベ限界)は、本明細書では回折限界とも呼ばれ、光システムの解像限界を定義する。
【0071】
2つのエアリーディスク間または点広がり関数の距離が、この値より大きい場合、2つの点源は解像される(および容易に見分けることができる)と考えられる。他の方法で、エアリーディスクは合体し、解像されないと考えられる。
【0072】
したがって、波長λの単一分子の検出可能なラベル点源から放射される光が、屈折率nを備えた培地中を移動し、半角θを用いるスポットに収束すると、直径:d=λ/2*NAを備えた回折限界スポットが作られる。500nm付近の緑色の光および1のNA(開口数)を考慮すると、回折限界はおおよそd=λ/2=250nm(0.25μm)であり、それは分析物の密度を制限し、表面上の単一分子タンパク質およびヌクレオチドは、従来の画像化技術によって画像化されることができる。光学顕微鏡は、利用可能な高品質のレンズ素子を備え、完全に整列され、最も高い開口数を有していても、解像度は最良のケースでも光の波長の半分程度に制限されたままである。
【0073】
デコンボリューション
デコンボリューションは、記録されたデータ上でコンボリューションの効果を反転するために使用されるアルゴリズムに基づいたプロセスである。デコンボリューションの概念は、信号処理と画像処理の技術で広く使用される。これらの技術は多くの科学および工学分野で広く使用されるため、デコンボリューションは多くの用途が見出される。
【0074】
光学および画像化において、用語「デコンボリューション」は、光学顕微鏡、電子顕微鏡、望遠鏡、または他の画像化機器で行われる光学歪みを反転させて、より明確な画像を作るプロセスを指すために具体的に使用される。それは、顕微鏡画像処理技術の一式の一部として、通常、ソフトウェアアルゴリズムによって、デジタルドメインで行われる。
【0075】
通常の方法は、機器を介する光路が光学的に完全であると仮定し、点広がり関数(PSF)つまり、光の理論上の点源(または他の波)が機器を通過する経路の観点から、歪みを説明する数学関数で畳み込む。通常、そのような点源は、最終画像に小エリアの曖昧さを与える。この関数を決定できれば、その逆関数または補関数を計算し、取得した画像をそれで畳み込むことになる。デコンボリューションはフーリエ終域における除算に対応する。これは、デコンボリューションが、フーリエ変換の対象となる実験データに容易に適用されることを可能にする。一例は、データが時間領域に記録されるが、周波数領域で分析されるNMRスペクトロスコピーである。指数関数による時間領域データの除算は、周波数領域のLorenzian線の幅を小さくする効果を有する。その結果、元の歪みのない画像が得られる。
【0076】
しかしながら、回折限界の画像化については、点広がり関数が既知でも、デコンボリューションはまた、回折限界を超えた解像度を改善するためのシグナルをさらに精密にするために必要とされる。ナイキスト距離より近い距離で2つの対象を確実に分離させることは、非常に困難である。しかしながら、本明細書に記載されるのは、ナイキスト距離よりはるかに近い距離によって分離される対象を確実に検出するために、サイクル検出、分析物の位置決定、整列、およびデコンボリューションを使用する方法とシステムである。
【0077】
配列決定
光検出画像化システムは回折限界であるため、配列決定で典型的に使用される蛍光を用いる場合、300nmの理論上の最大解像度を有する。現在まで、最良の配列決定システムは、それらのアレイ上の600nmの隣接したポリヌクレオチド間の中心点間距離、または2倍の回折限界を有していた。この2倍の係数は、位置のエラーをもたらし得る強度、アレイと生物学の変動を考慮するために必要とされる。配列決定については、本明細書に記載されるシステムと方法の目的は、光システムの回折限界未満の中心点間距離を有する基板上で配列決定されるポリヌクレオチドを解像するためである。
【0078】
本明細書に記載されるように、我々は、部分的に、高精度で(例えば、10nmRMSまたはそれ未満)各分析物の位置を識別することによって、サブ回折限界の画像化を達成するための方法およびシステムを提供する。比較すると、最先端技術の超解像システム(Harvard/STORM)は、このシステムより2倍悪い20nmRMSまでの精度でしか位置を識別できない。したがって、本明細書に開示される方法およびシステムは、サブ回折限界の画像化が、基板上に密に充填される分子を識別することを可能にし、酵素単位当たりの高速データ速度、時間単位当たりのデータ速度、および高いデータ精度を達成する。これらサブ回折限界の画像化技術は、本明細書に記載されるように、サイクル検出を使用する技術に、広く適用可能である。
【0079】
画像化およびサイクル検出
本明細書に記載されるように、検出方法とシステムの各々は、サブ回折限界の画像化を達成するためにサイクル検出を必要とした。サイクル検出は、結合および画像化を含み、あるいは、抗体またはヌクレオチドなどのプローブは、可視光の光信号を放射することができる検出可能なラベルに結合される。異なるサイクルの電界の一連画像の位置情報を使用することによって、密に充填された基板からの信号を解像するためのデコンボリューションは、光画像化の回折限界により不明瞭になった信号から、個々の光信号を識別するために、有効に使用され得る。複数のサイクルの後、分子の正確な位置は、ますますより正確になる。この情報を使用すると、さらなる計算は、ピクセルの離散化効果により生じるクロストークマトリックスにおいて既知のアシンメトリーに関するクロストーク修正を援助するために、実行され得る。
【0080】
サイクルプローブの結合および光検出を使用する方法およびシステムは、2015年11月19日に公開された、米国特許公開第2015/0330974号、 Digital Analysis of Molecular Analytes Using Single Molecule Detectionに記載されており、これはその全体において参照により本明細書に組み込まれる。
【0081】
いくつかの実施形態では、raw画像は、オーバーサンプリングされた画像のより正確な決定を容易にするために少なくともナイキスト限界にあるサンプリングを使用して得られる。ナイキスト限界を超過してサンプリング(オーバーサンプリング)することによって画像を表すために使用されるピクセル数を増加させることは、画像処理と表示に利用可能なピクセルデータを増加させる。
【0082】
理論上、帯域制限の信号は、ナイキスト速度またはそれより上でサンプリングされる場合、完全に再構成され得る。ナイキスト速度はシグナルで最も高い周波数成分の2倍として定義される。オーバーサンプリングは、解像度を改善し、ノイズを減らし、アンチエイリアシングフィルター性能要件を緩めることによりエイリアシングおよび位相歪みを回避することを助ける。それがナイキスト速度のN倍でサンプリングされる場合、信号はN倍だけオーバーサンプリングされ得る。
【0083】
したがって、いくつかの実施形態では、各画像は、観察される光の波長の半分以下のピクセルサイズで、撮られる。言い換えると、光検出システムで検出される1以上の検出可能なラベルから生成される信号の波長は、光検出システムのピクセルの2倍超である。例えば、いくつかの実施形態では、162.5nm×162.5nmのピクセルサイズは、ナイキスト限界で、またはナイキスト限界より上で、サンプリングを達成するために、検出で使用される。基板のraw画像化中に少なくともナイキスト限界の周波数でサンプリングすることは、本明細書に記載されるシステムまたは方法の解像度を最適化することが好まれる。回折限界未満で基板上の特徴を高精度で解像するために、これは、本明細書に記載されるデコンボリューション法と光システムと共に行われ得る。
【0084】
エラー修正方法
上に記載される光および電気検出方法において、エラーは、信号の結合および/または検出で生じ得る。いくつかの場合では、エラー率は、5分の1に達し得る(例えば、5つの蛍光シグナルのうち1つが正しくない)。これは、5つのサイクル配列ごとに1つのエラーに相当する。実際のエラー率は、20%ほど高くないことがあるが、数パーセントのエラー率はあり得る。一般的に、エラー率は、サンプル中の分析物の種類および使用されるプローブの種類を含む多くの要因に起因する。電気検出方法では、例えば、テール領域は、サイクル中にアプタマー上の対応するプローブ領域に適切に結合し得ない。光検出方法では、抗体プローブは、その標的に結合し得ないか、間違った標的に結合し得る。
【0085】
さらなるサイクルは、検出されたシグナルにおけるエラーを考慮するため、およびパリティビットなどのさらなるビットの情報を得るために、生成される。情報のさらなるビットは、エラー修正コードを使用して、エラーを修正するために使用される。一実施形態では、エラー修正コードは、リードソロモン符号であり、それはシステムにおいてエラーを検出および修正するために使用される非二値の巡回コードである。他の実施形態では、様々な他のエラー修正コードが使用され得る。他のエラー修正コードは、例えば、ブロックコード、畳み込みコード、ゴレイコード、ハミングコード、BCHコード、ANコード、リード-マラーコード、ゴッパコード、アダマールコード、ウォルシュコード、ハーゲルバーガーコード、ポーラーコード、反復コード、反復累積コード、消去コード、オンラインコード、グループコード、伸長コード、一定重みコード、トルネードコード、低密度パリティ検査コード、最大距離コード、バーストエラーコード、luby transformコード、ファウンテンコード、およびラプターコードを含む。Error Control Coding, 2nd Ed., S. Lin and DJ Costello, Prentice Hall, New York, 2004を参照。サイクルを付加することおよびさらなるビットの情報を得ることによって、エラー修正のための方法を示す例が、さらに、以下に提供される。
【0086】
光検出方法
いくつかの実施形態では、基板はN個の標的分析物を含む分析物と結合される。N個の標的分析物を検出するために、プローブ結合のMサイクルおよび信号検出が選択される。Mサイクルの各々は、1以上のパスを含み、および、各パスは、Nセットのプローブを含み、それにより各セットのプローブは、N個の標的分析物の1つに特異的に結合するようになる。ある実施形態では、N個の標的分析物のためのNセットのプローブがある。
【0087】
各サイクルでは、各パスのためのセットのプローブを導入するためにあらかじめ定められた順序がある。いくつかの実施形態では、プローブのセットのためのあらかじめ定められた順序は、無作為化された順序である。他の実施形態では、プローブのセットのためのあらかじめ定められた順序は、無作為化されていない順序である。一実施形態では、無作為化されていない順序は、コンピュータープロセッサによって選択され得る。あらかじめ定められた順序は、標的分析物ごとに、キーで表される。プローブのセットの順序を含むキーが生成され、および、プローブの順序は、標的分析物の各々を識別するためにコードでデジタル化される。
【0088】
いくつかの実施形態では、順序付けられたプローブの各セットは、標的分析物を検出するために、明確なタグと関連し、および明確なタグの数は、N個の標的分析物の数未満である。その場合では、各N個の標的分析物は、MサイクルのためのMタグの配列と一致する。タグの順序付けられた配列は、識別コードとして標的分析物と関連付けられる。
【0089】
一実施形態では、方法は、X個の異なる色の、蛍光でタグ付けされたプローブを使用して、基板上のN個の異なる種類の標的分析物をカウントするために、プローブプールを標識するための以下の工程を含み、
1.基数Xの数を使用して、N個の標的(またはそれらのプローブ)のリストを番号付ける。
2.蛍光タグを0からX-1までの基数Xの数字と関連させる。(例えば、0、1、2、3は赤、青、緑、黄色に対応する。)
3.XC〉NとなるようなCを求める。
4.少なくともCのプローブプールはN個の標的を識別するために必要とされる。k=1からCのインデックスによりCのプローブプールを標識する。
5.第kのプローブプールでは、各プローブを、工程1で作られるリストにおいてプローブの標的を識別する、基数Xの数の第kの基数Xの数字に、対応する色の蛍光タグで、標識する。
【0090】
例えば、1つがN=10,000の標的分析物および4つの蛍光タグを有する場合、基数4が選択され得る。4つの蛍光タグの色は、数字0、1、2、および3により、それぞれ指定される。例えば、数字0、1、2、3は赤、青、緑、および黄色に対応する。
【0091】
基数4が選択される場合、各蛍光色はそれぞれ、2ビット(0および1、ここでは、0=信号がないおよび1=信号が存在する)によって表され、および標的分析物を識別するためにコードとして使用される7つの色がある。例えば、タンパク質Aは、「青、緑、緑、青、青、黄色、黄色」の色の組み合わせと順序を表す「1221133」のコードで識別され得る。7つの可能な色については、標的分析物に関する合計14ビットの情報(7×2=14ビット)がある。
【0092】
次に、Cは4C〉10,000となるように選択される。この場合、Cは7であり得、それにより、10,000の標的を識別するために、7つのプローブプールがある(47=16,384、それは10,000超である)。長さCの色配列は、Cの異なるプローブプールが構成される必要があることを意味する。7つのプローブプールはk=1~7で標識される。その後、各プローブは、第kの基数およびXの数字に対応する蛍光タグで標識される。例えば、コード「1221133」における第3の基数は、第3の基数4の数字になり、緑に対応する。
【0093】
光学上検出されたプローブの定量化
検出工程の後、各プローブプールからの信号がカウントされ、および信号の有無および信号の色は、基板上の各位置に対して記録され得る。
【0094】
検出可能な信号から、Kビットの情報はN個の明確な標的分析物について、Mサイクルの各々で得られる。Kビットの情報は、K×M=Lビットの情報およびL≧log2(N)であるように、Lの合計ビットの情報を決定するために使用される。Lビットの情報は、N個の明確な標的分析物の同一性(および存在)を決定するために使用される。1つのサイクルのみ(M=1)が実行されるならば、K×1=Lである。しかしながら、複数のサイクル(M〉1)は、分析物ごとに合計ビット超の情報を生成するために実行され得る。次のサイクルはそれぞれ、標的分析物を識別するために使用されるさらなる光信号情報を提供する。
【0095】
実際には、信号におけるエラーが生じ、およびこれは標的分析物の識別の正確さに支障をきたす。例えば、プローブは間違った標的(例えば偽陽性)を結合したり、正しい標的(例えば偽陰性)を結合しないことがある。下記に述べられるように、方法は、光および電気信号検出におけるエラーを考慮するために提供される。
【0096】
電気検出方法
他の実施形態では、電気検出方法は、基板上の標的分析物の存在を検出するために使用される。標的分析物は、オリゴヌクレオチドテール領域でタグ付けされ、オリゴヌクレオチドタグは、イオン感応電界効果トランジスタ(ISFET、またはpHセンサ)を使用して検出され、それは溶液中の水素イオン濃度を測定する。
【0097】
ISFETは、分析物の特定と特徴付けのための感応で特異的な電気検出システムを提示する。一実施形態では、本明細書に開示される電気検出方法は、コンピューター(例えばプロセッサ)によって実行される。溶液のイオン濃度は、ISFETの電極によって対数電位に変換され得、および電気出力信号は検出され測定され得る。
【0098】
ISFETはDNA配列決定を促進するためにあらかじめ使用された。一本鎖DNAが二本鎖DNAへ酵素変換される間、水素イオンは各ヌクレオチドがDNA分子に添加される時、水素イオンが放出される。ヌクレオチドがDNA分子に添加されたとき、ISFETはこれらの放出される水素イオンを検出、および決定し得る。ヌクレオシド三リン酸(dATP、dCTP、dGTP、およびdTTP)の取り込みを同期させることによって、DNA配列も決定され得る。例えば、一本鎖DNA鋳型がdATPに曝されるときに電気出力信号が検出されないが、電気出力信号がdGTPの存在下において検出される場合、DNA配列は当位置の相補的なシトシン塩基から成る。
【0099】
一実施形態では、ISFETは、プローブのテール領域を検出し、その後、対応する標的分析物を識別するために使用される。例えば、標的分析物は、1以上のISFETを含有する集積回路チップなどの基板上に固定化され得る。対応するプローブ(例えばアプタマーとテール領域)が添加され、特異的に標的分析物に結合する場合、ヌクレオチドおよび酵素(ポリメラーゼ)はテール領域の転写のために添加される。ISFETは電気出力信号として放出水素イオンを検出し、dNTPがテール領域へ取り込まれた場合、イオン濃度における変化を測定する。放出された水素イオンの量はテール領域の長さと停止に対応し、およびテール領域に関するこの情報は様々なタグ中で区別するために使用され得る。
【0100】
最も簡易な種類のテール領域は、1つのホモポリマー状塩基領域から完全に成るものである。この場合、4つの可能性のあるテール領域があり、ポリ-Aテール、ポリ-Cテール、ポリ-Gテール、およびポリ-Tテールである。しかしながら、テール領域に大きな多様性を有することは、しばしば望ましい。
【0101】
テール領域中の多様性を生成する1つの方法は、テール領域のホモポリマー状塩基領域内に停止塩基を提供することによるものである。停止塩基は、ホモポリマー状塩基領域に隣接する少なくとも1つのヌクレオチドを含むテール領域の一部であり、それにより少なくとも1つのヌクレオチドは、ホモポリマー状塩基領域内の塩基とは異なる塩基から成るようになる。一実施形態では、停止塩基は1つのヌクレオチドである。他の実施形態では、停止塩基は複数のヌクレオチドを含む。通常、停止塩基は2つのホモポリマー状塩基領域と隣接している。一実施形態では、停止塩基を隣接している2つのホモポリマー状塩基領域は、同じ塩基から成る。別の実施形態では、2つのホモポリマー状塩基領域は、2つの異なる塩基から成る。別の実施形態では、テール領域は1超の停止塩基を含有する。
【0102】
一実施例では、ISFETは、100の水素イオンの最小閾値を検出し得る。標的分析物1は、テール領域の長さの合計が201のヌクレオチドについては、100のヌクレオチドポリ-Aテールに続いて、1シトシン塩基、続いて別の100のヌクレオチドポリ-Aテールから成るテール領域を有する組成物に結合される。標的分析物2は、200のヌクレオチドポリ-Aテールから成るテール領域を有する組成物に結合される。dTTPの添加の際およびポリヌクレオチド合成を促す条件下で、標的分析物1と関連するテール領域上の合成は、100の水素イオンを放出し、それは、200の水素イオンを放出する、標的分析物2と関連するテール領域上のポリヌクレオチド合成と区別され得る。ISFETは、各テール領域について異なる電気出力信号を検出する。さらに、dGTPが添加され、続いてより多くのdGTPが添加される場合、標的分析物1と関連するテール領域が1つを放出し、その後、さらなるポリヌクレオチド合成によって、100以上の水素イオンを放出する。テール領域の組成物に基づいた特異的なヌクレオシド三リン酸の添加から生成された異なる電気出力信号は、ISFETがテール部位の各々から水素イオンを検出することを可能にし、その情報はテール領域およびそれらの対応する標的分析物を識別するために使用され得る。
【0103】
ホモポリマー状塩基領域、停止塩基、およびそれらの組み合わせの様々な長さは、サンプルにおいて各分析物を固有にタグ付けするために使用され得る。アプタマーの電気検出に関するさらなる記載および基板中の標的分析物を識別するためのテール領域は、米国特許出願第2016/0201119号に記載され、それはその全体中の参照により組み込まれる。
【0104】
いくつかの実施形態では、基板上に保存されたデータカタログ中の大量の情報は、いくつかのレベルのビルトイン冗長を生成する。いくつかの実施形態では、情報の細分化の第1のレベルは、スライド、レーン、およびデータの各情報セグメントについて特異的な配列決定のプライミング部位において含まれる。いくつかの実施形態では、個々のレーンは、本明細書に記載されるように、回収のために最適化であるように生成される様々な組み合わせで保存される。
【0105】
本明細書に記載されるシステムおよび方法のコンピューターの自動化
本開示は、本開示の方法を実施するようにプログラム化されるコンピューターシステムを提供する。図2は、データセンター内に取り付け可能なラック上に基板を配置するように、および基体を回収するように並びに配列決定のためにデータセンター内でさらに組み合わされる機器に基体を送達するように、プログラム化またはそうでなければ構成される、コンピューターシステム(201)を示す。コンピュータシステム(201)は、例えば、データセンターの温度およびデータセンター内に保存される基板の構成などの、本開示の様々な態様を調節し得る。コンピュータシステム(201)は、電子デバイスに対して遠隔に位置付けられるユーザーまたはコンピュータシステムの電子デバイスであり得る。電子デバイスはモバイル電子デバイスであり得る。
【0106】
コンピュータシステム(201)は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータープロセッサ」とも称される)(205)を含み、これは、シングルコアまたはマルチコアのプロセッサ、あるいは並行処理のための複数のプロセッサであり得る。コンピューターシステム(201)は、メモリまたは記憶場所(210)(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶装置(215)(例えば、ハードディスク)、1以上の他のシステムと通信するための通信インターフェース(220)(例えば、ネットワークアダプタ)、および周辺機器(225)、例えば、キャッシュ、他のメモリ、データ記憶装置、ならびに/あるいは電子ディスプレイアダプターも含む。メモリ(210)、記憶装置(215)、インターフェース(220)、および周辺機器(225)は、マザーボードなどの通信バス(実線)を介してCPU(205)と通信する。記憶装置(215)は、データを保存するためのデータ記憶装置(またはデータレポジトリ)であり得る。コンピュータシステム(201)は、通信インターフェース(220)の助けによってコンピューターネットワーク(「ネットワーク」)(230)に動作可能に連結され得る。ネットワーク(230)は、インターネットおよび/またはエクストラネット、あるいはインターネットと通信状態にあるイントラネットおよび/またはエクストラネットであり得る。いくつかの場合では、ネットワーク(230)は、電気通信および/またはデータのネットワークである。ネットワーク(230)は、1以上のコンピューターサーバーを含み得、これはクラウドコンピューティングなどの分散コンピューティングを可能にし得る。ネットワーク(230)は、いくつかの場合では、コンピュータシステム(201)の助けにより、ピアツーピア・ネットワークを実施することができ、これは、コンピュータシステム(201)に連結されたデバイスが、クライアントまたはサーバーとして動くことを可能にし得る。いくつかの実施形態では、ネットワーク(230)は、基板を、取り付け可能な保存ラックおよび配列決定のための機器に、機械的に搬送するための機器を保存する。いくつかの実施形態では、ネットワーク(230)は、配列決定のための機器を含む。
【0107】
CPU(205)は、機械可読命令の配列を実行することができ、これはプログラムまたはソフトウェアに取り入れることができる。この命令は、メモリ(210)などの記憶場所に保存され得る。この命令は、CPU(205)に向けられ得、これは後に、本開示の方法を実施するようにCPU(205)をプログラムまたはそうでなければ構成することができる。CPU(205)により実行される動作の例は、フェッチ、デコード、実行、およびライトバックを含み得る。
【0108】
CPU(205)は、集積回路など回路の一部であり得る。システム(201)の1以上の他のコンポーネントは回路に含まれ得る。いくつかの場合では、回路は特定用途向け集積回路(ASIC)である。
【0109】
記憶装置(215)は、ドライバー、ライブラリ、およびセーブされたプログラムなどのファイルを保存することができる。記憶装置(215)は、ユーザーデータ、例えばユーザーの嗜好性およびユーザーのプログラム、並びに核酸配列決定の読み出しを保存し得る。コンピュータシステム(201)は、いくつかの場合では、イントラネットまたはインターネットを介してコンピュータシステム(201)と通信状態にあるリモートサーバー上に位置付けられるなどした、コンピュータシステム(201)の外側にある1以上のさらなるデータ記憶装置を含み得る。
【0110】
コンピュータシステム(201)は、ネットワーク(230)を介して1以上のリモートコンピューターシステムと通信し得る。例えば、コンピュータシステム(201)は、ユーザー(例えば、配列決定のための機器)のリモートコンピュータシステムと通信し得る。リモートコンピューターシステムの例は、パーソナルコンピューター(例えば、持ち運び可能なPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone、Android-enabledデバイス、Blackberry(登録商標))、または携帯情報端末を含む。ユーザーは、ネットワーク(230)を介してコンピュータシステム(201)にアクセスし得る。
【0111】
本明細書に記載されるような方法は、例えば、メモリ(210)または電子記憶装置(215)上などの、コンピュータシステム(201)の電子記憶場所に保存された機械(例えば、コンピュータープロセッサ)実行可能コードによって実行され得る。機械実行可能または機械可読コードは、ソフトウェアの形で提供することができる。使用中、コードはプロセッサ(205)により実行され得る。いくつかの場合では、コードは、記憶装置(215)から回収され、およびプロセッサ(205)による即時アクセスのためにメモリ(210)に保存され得る。いくつかの状況では、電子記憶装置(215)は除外され得、機械実行可能命令がメモリ(210)に保存される。
【0112】
コードは、コードを実行するのに適したプロセッサを有する機械とともに使用されるようにあらかじめコンパイルされかつ構成され得るか、あるいは、実行時間中にコンパイルされ得る。コードは、あらかじめコンパイルされたまたはアズコンパイルされた(as-compiled)様式でコードが実行を可能にするために選択され得るプログラミング言語で供給され得る。
【0113】
コンピュータシステム(201)などの本明細書で提供されるシステムと方法の態様は、プログラミングの際に取り入れることができる。この技術の様々な態様は、典型的に一種の機械可読媒体上で運ばれるまたはそれに埋め込まれる機械(またはプロセッサ)実行可能コードおよび/または関連データの形で、「製品」または「製造用品」として考慮され得る。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶することができる。「記憶」型の媒体は、様々な半導体メモリ、テープドライブ、ディスクドライブなどの、コンピュータやプロセッサの有形メモリ、あるいはその関連するモジュールのいずれかまたは全てを含むことができ、これらは、ソフトウェアのプログラミングのためにいかなる時も非一時的な記憶を提供し得る。ソフトウェアの全てまたは一部は、インターネットまたは様々な他の電気通信ネットワークを介して時々通信され得る。そのような通信は、例えば、1つのコンピュータまたはプロセッサから別のものへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。ゆえに、ソフトウェア要素を持ち得る別のタイプの媒体は、有線および光地上通信線ネットワークを通じた、および様々なエアリンク(air-links)上での、ローカルデバイス間の物理インターフェースにわたって使用されるものなどの、光波、電波、および電磁波を含む。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理要素はまた、ソフトウェアを持つ培地と考慮され得る。本明細書で使用されるように、非一時的で有形の「記憶」媒体に制限されない限り、コンピューターまたは機械「可読媒体」などの用語は、実行のためにプロセッサに命令を提供することに関与する媒体を指す。
【0114】
したがって、コンピューター実行可能コードなどの機械可読媒体は、限定されないが、有形記憶媒体、キャリア波媒体、または物理送信媒体を含む、多くの形態をとってもよい。不揮発性記憶媒体は、例えば、図面に示されるデータベースなどを実施するために使用され得るものなど、コンピュータなどにおける記憶デバイスのいずれかといった、光ディスクまたは磁気ディスクを含む。揮発性記憶媒体は、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリを含む。有形送信媒体は、同軸ケーブル、コンピュータシステム内のバスを含むワイヤーを含む、銅線および光ファイバーを含んでいる。搬送波送信媒体は、無線周波(RF)および赤外線(IR)データ通信中に生成されたものなどの、電気信号または電磁気信号、あるいは音波または光波の形態をとり得る。それゆえ、コンピューター可読媒体の共通の形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を伝達するケーブルもしくはリンク、またはコンピューターがプログラミングのコードおよび/またはデータを読み取り得る他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサに1以上の命令の1以上の配列を運ぶことに関与することがある。
【0115】
コンピュータシステム(201)は、例えば、核酸分子配列決定の結果を提供するためのユーザーインターフェース(UI)(240)を含む電子ディスプレイ(235)を含むか、またはそれと通信し得る。UIの例は、限定されないが、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースを含む。
【0116】
本開示の方法とシステムは、1以上のアルゴリズムによって実施され得る。アルゴリズムは、中央処理装置(205)による実行に際して、ソフトウェアによって実施され得る。アルゴリズムは、例えば、保存のための取り付け可能なラックおよび配列決定のための機器から、基板が搬送される速度を、生成し得る。
【0117】
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを目的としていない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。
【0118】
本明細書に提供される方法およびシステムは、他の方法およびシステムと組み合わされ得るかそれらによって修正され得、例えば、それらは米国特許公報第20150330974号および第20180274028号に記載され、それらの各々は、参照によって本明細書に完全に組み込まれる。
【0119】
本発明の好ましい実施形態が本明細書に示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。本発明が明細書内で提供される特定の例によって制限されることは意図していない。本発明は前述の明細書に関して記載されているが、本明細書中の実施形態の記載および例示は、限定的な意味で解釈されることを目的としていない。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書で説明された特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。
図1
図2
【国際調査報告】