(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-17
(54)【発明の名称】核酸データ格納のための処理方法
(51)【国際特許分類】
C12N 15/10 20060101AFI20240709BHJP
C12Q 1/68 20180101ALI20240709BHJP
C40B 40/06 20060101ALN20240709BHJP
C12Q 1/686 20180101ALN20240709BHJP
C12Q 1/6813 20180101ALN20240709BHJP
【FI】
C12N15/10 Z
C12Q1/68
C40B40/06
C12Q1/686 Z
C12Q1/6813 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023577518
(86)(22)【出願日】2022-06-24
(85)【翻訳文提出日】2024-02-06
(86)【国際出願番号】 US2022034912
(87)【国際公開番号】W WO2022272068
(87)【国際公開日】2022-12-29
(32)【優先日】2021-06-25
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】519173978
【氏名又は名称】カタログ テクノロジーズ, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】フリッキンジャー,サラ
(72)【発明者】
【氏名】カンバラ,トレイシー
(72)【発明者】
【氏名】リーク,デヴィン
(72)【発明者】
【氏名】ノースワージー,マイケル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA20
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR62
4B063QS12
4B063QS16
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
【課題】本明細書に提供されるのは、DNAプリンタ-フィニッシャシステム(PFS)で実施されるDNAアセンブリ反応のプールから全長識別子を精製するためのシステム及び方法である。
【解決手段】システムは、第1及び第2の成分核酸分子が基板上で同じ位置にあるように、第1の成分核酸分子を含む第1の溶液の第1の液滴を基板上の座標に分注するように構成された第1のプリントヘッド及び第2の成分核酸分子を含む第2の溶液の第2の液滴を基板上の座標に分注するように構成された第2のプリントヘッドを含み得る。システムは、反応混合物を基板上の座標に分注して、第1の成分核酸分子と第2の成分核酸分子とを物理的にリンクさせるか、第1の成分核酸分子と第2の成分核酸分子とを物理的にリンクさせるのに必要な条件を提供するか又は両方を行うフィニッシャを含み得る。
【特許請求の範囲】
【請求項1】
情報を符号化する核酸分子のプールを精製する方法であって、
(a)標的核酸分子及び非標的核酸分子を含む第1のプールを取得することと、
(b)富化された濃度の前記標的核酸分子及び非標的核酸分子を含む第2のプールを取得するために、前記第1のプールの容積を低減することと、
(c)研究所適合培地において前記標的核酸分子及び非標的核酸分子を含む第3のプールを取得するために、前記第2のプールに対してバッファー交換を実施することと、
(d)前記標的核酸分子を含む第4のプールを取得するために、前記標的核酸分子を前記非標的核酸分子から分離することと、
(e)富化された濃度の前記標的核酸分子を含む第5のプールを取得するために、前記第4のプール中の前記標的核酸分子を増幅することと、
を含み、前記標的核酸分子は、情報を符号化する配列ライブラリを含む、方法。
【請求項2】
前記標的核酸分子は、それぞれ連結核酸断片を含む完全組織化核酸分子を含む、請求項1に記載の方法。
【請求項3】
前記非標的核酸分子は、部分組織化核酸分子、非組織化核酸断片又は単鎖核酸断片の少なくとも1つを含む、請求項2に記載の方法。
【請求項4】
各完全組織化核酸分子は、N個の連結核酸断片を含み、及び各部分組織化核酸分子は、N個よりも少ない連結核酸断片を含む、請求項3に記載の方法。
【請求項5】
ステップ(b)において前記第1のプールの前記容積を低減することは、約99%の容積低減を含む、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記第2のプールにおける前記富化された濃度は、分子定量技法の検出範囲内である、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記分子定量技法は、定量ポリメラーゼ連鎖反応(qPCR)又は蛍光核酸定量である、請求項6に記載の方法。
【請求項8】
前記検出範囲は、qPCRではおよそ0.1fg/μL又は蛍光核酸定量ではおよそ0.01ng/μLの下限を有する、請求項6又は7に記載の方法。
【請求項9】
ステップ(b)は、
前記第1のプールをアニオン交換樹脂に通すこと、
カオトロピック塩を前記第1のプールに添加し、及び減圧濾過若しくはポンプを使用して前記第1のプールをシリカガラス繊維フィルタに通すこと、
前記第1のプールを凍結乾燥すること、
遠心減圧濃縮を使用して前記第1のプールを濃縮すること、又は
前記核酸分子が正電極に向かって移動するように電場を前記第1のプールに印加し、及び残りの液体を廃棄すること、
の1つ又は複数によって実施される、請求項1~8のいずれか一項に記載の方法。
【請求項10】
減圧濾過は、前記アニオン交換樹脂に適用される、請求項9に記載の方法。
【請求項11】
前記第1のプールを前記アニオン交換樹脂に通すことは、前記標的核酸分子及び非標的核酸分子が前記樹脂に結合されている間、前記第1のプールの溶液を前記樹脂に通すことを含む、請求項9又は10に記載の方法。
【請求項12】
ステップ(b)は、高塩溶液を前記樹脂に通して、前記結合分子を前記第2のプールに溶離することをさらに含む、請求項11に記載の方法。
【請求項13】
ステップ(b)は、前記第1のプールを前記アニオン交換樹脂に通す前に、前記第1のプールのpHを前記アニオン交換樹脂に適したpHに調整することをさらに含む、請求項9~12のいずれか一項に記載の方法。
【請求項14】
前記アニオン交換樹脂に適した前記pHは、5.5以下及び5.4以上である、請求項13に記載の方法。
【請求項15】
前記pHを調整することは、塩酸を添加することを含む、請求項13又は14に記載の方法。
【請求項16】
ステップ(b)は、前記第1のプールを前記アニオン交換樹脂に通す前に、添加剤を前記第1のプールに添加することをさらに含む、請求項9~15のいずれか一項に記載の方法。
【請求項17】
前記添加剤は、ポリエチレングリコールである、請求項16に記載の方法。
【請求項18】
前記ポリエチレングリコールは、PEG-6000又はPEG-8000である、請求項17に記載の方法。
【請求項19】
前記添加剤は、前記第1のプールの粘度を高める、請求項16~18のいずれか一項に記載の方法。
【請求項20】
ステップ(c)は、
前記標的核酸分子及び非標的核酸分子を前記第2のプールから沈殿させるために、沈殿剤を前記第2のプールに添加すること、又は
前記標的核酸分子及び非標的核酸分子を前記第2のプールから収集するために、前記第2のプールを脱塩カラムに配置すること、
のいずれかを含む、請求項1~19のいずれか一項に記載の方法。
【請求項21】
前記沈殿剤は、イソプロパノール又はエタノールである、請求項20に記載の方法。
【請求項22】
前記脱塩カラムは、サイズ排除樹脂を含む、請求項20に記載の方法。
【請求項23】
前記沈殿又は収集された分子は、バッファー中に再懸濁又は溶離されて前記第3のプールを形成する、請求項20~22のいずれか一項に記載の方法。
【請求項24】
前記バッファーは、トリス(ヒドロキシメチル)アミノメタン(トリス)エチレンジアミン四酢酸(EDTA)バッファー(トリス-EDTAバッファー)又はヌクレアーゼフリー水である、請求項23に記載の方法。
【請求項25】
前記第3のプールの容積は、前記第2のプールの容積未満である、請求項1~24のいずれか一項に記載の方法。
【請求項26】
ステップ(d)は、サイズ選択を含む、請求項1~25のいずれか一項に記載の方法。
【請求項27】
前記サイズ選択は、常磁性ビーズを使用した固相可逆的固定化(SPRI)、それに続くアガロースゲル抽出を含む逐次的プロセスである、請求項26に記載の方法。
【請求項28】
アガロースゲルは、1~5%のアガロースを含む、請求項27に記載の方法。
【請求項29】
前記アガロースゲル抽出は、ゲルボックス、e-gelシステム又は自動サイズ選択デバイスの1つを使用して実施される、請求項27又は28に記載の方法。
【請求項30】
前記アガロースゲル抽出は、5~25分間にわたって実施される、請求項27~29のいずれか一項に記載の方法。
【請求項31】
前記アガロースゲル抽出は、約8分間、約10分間又は約20分間にわたって実施される、請求項30に記載の方法。
【請求項32】
前記サイズ選択は、核酸分子の露出された末端を選択的に分解するエキソヌクレアーゼを前記第3のプールに添加することを含む、請求項26に記載の方法。
【請求項33】
前記標的核酸分子は、ヘアピンでキャップされるか、環状化されるか、又はライゲーションされてプラスミド構築体になり、及び前記エキソヌクレアーゼは、非標的核酸分子の露出された線形末端を分解する、請求項32に記載の方法。
【請求項34】
ステップ(d)は、標的核酸分子の両末端アフィニティキャプチャ又はハイブリダイゼーションキャプチャを含む、請求項1~33のいずれか一項に記載の方法。
【請求項35】
標的核酸分子は、アフィニティキャプチャを介して捕捉され得る部分をそれぞれ有する、請求項34に記載の方法。
【請求項36】
前記部分は、ビオチン又はジゴキシゲニンであり、及び前記アフィニティキャプチャは、ストレプトアビジン被覆ビーズ又は抗ジゴキシゲニンビーズによって実施される、請求項35に記載の方法。
【請求項37】
前記ハイブリダイゼーションキャプチャは、前記標的核酸分子の部分に相補的なオリゴを有するプローブの使用を伴う、請求項34~36のいずれか一項に記載の方法。
【請求項38】
前記プローブは、オリゴdTを含み、及び前記標的核酸分子は、オリゴdAテールを含む、請求項37に記載の方法。
【請求項39】
前記プローブは、プローブアフィニティキャプチャによって捕捉され得る部分を有する、請求項37又は38に記載の方法。
【請求項40】
前記部分は、ビオチン、デスチオビオチン、TEG-ビオチン、光切断可能なビオチン、フルオレセイン又はジゴキシゲニンであり、及び前記プローブアフィニティキャプチャは、ストレプトアビジン被覆ビーズ、フルオレセイン抗体ビーズ又はジゴキシゲニン抗体ビーズによって実施される、請求項39に記載の方法。
【請求項41】
ステップ(e)は、熱循環又は等温増幅の少なくとも一方を含む、請求項1~40のいずれか一項に記載の方法。
【請求項42】
前記熱循環は、ポリメラーゼ連鎖反応(PCR)又はリガーゼ連鎖反応(LCR)を伴う、請求項41に記載の方法。
【請求項43】
前記PCRは、複数のPCRプローブを前記第4のプールに添加することを伴う、請求項42に記載の方法。
【請求項44】
アニーリング温度、プライマーライブラリ、伸長時間、前記第4のプールの濃度、PCRサイクルの数又はポリメラーゼの忠実度の少なくとも1つは、キメラPCR産物の形成を軽減するように制御される、請求項43に記載の方法。
【請求項45】
前記アニーリング温度は、最大で72℃である、請求項44に記載の方法。
【請求項46】
前記第4のプールの前記濃度は、約0.1ng/μL~約0.0001ng/μLの範囲で希釈される、請求項44又は45に記載の方法。
【請求項47】
前記ポリメラーゼの前記忠実度は、Taq DNAポリメラーゼのものよりも高い、請求項44~46のいずれか一項に記載の方法。
【請求項48】
前記熱循環は、5~25サイクルの増幅を含む、請求項42~47のいずれか一項に記載の方法。
【請求項49】
前記等温増幅は、ローリングサークル増幅(RCA)、ループ媒介等温増幅(LAMP)又は鎖置換増幅(SDA)を伴う、請求項41~48のいずれか一項に記載の方法。
【請求項50】
前記第1のプールの前記容積は、1~1000Lであり、前記第5のプールの容積は、1~1000μLである、請求項1~49のいずれか一項に記載の方法。
【請求項51】
前記第5のプールを用いたアーカイブ、読み取り又は計算をさらに含む、請求項1~50のいずれか一項に記載の方法。
【請求項52】
ステップ(b)及び(c)は、前記標的及び非標的核酸分子を、前記第1のプールから、前記第1のプールの前記容積未満の容積を有するバッファーに移すことによって同時に実施される、請求項1~51のいずれか一項に記載の方法。
【請求項53】
前記分子は、前記バッファーを溶離剤として使用して容積低減モジュールから前記分子を溶離することにより、前記バッファーに移される、請求項52に記載の方法。
【請求項54】
ステップ(b)及び(d)は、大型アフィニティクロマトグラフィカラムを使用して前記第1のプールから標的核酸分子を選択することにより、同時に実施される、請求項1~53のいずれか一項に記載の方法。
【請求項55】
前記第1のプールは、インク配合物を使用して核酸分子を組み立てるプリンタ-フィニッシャシステムの出力である、請求項1~54のいずれか一項に記載の方法。
【請求項56】
ステップ(a)~(e)の1つ又は複数は、前記プリンタ-フィニッシャシステムで実施される、請求項55に記載の方法。
【請求項57】
前記第1のプールは、ステップ(a)~(e)の1つ又は複数を実施するように構成された後処理モジュールに自動的に供給される、請求項55又は56に記載の方法。
【請求項58】
前記プリンタ-フィニッシャシステムは、前記核酸分子が直接又は間接的に結合される表面を含み、及びステップ(a)~(e)の1つ又は複数は、前記核酸分子が前記表面に結合されている間に実施される、請求項55~57のいずれか一項に記載の方法。
【請求項59】
前記第1のプールは、油中水型エマルジョンである、請求項1~58のいずれか一項に記載の方法。
【請求項60】
ステップ(a)前にエマルジョンを破壊することをさらに含む、請求項58に記載の方法。
【請求項61】
エマルジョンを破壊することは、アニオン交換カラム又はシリカカラムを通して前記第1のプールを濾過することを含む、請求項58に記載の方法。
【請求項62】
前記第1のプール、第2のプール、第3のプール、第4のプール及び第5のプールの1つ又は複数は、ステップ(a)~(e)の1つ又は複数の実行中、複数の区画にわたって区画化される、請求項1~61のいずれか一項に記載の方法。
【請求項63】
各区画は、ウェル、液滴、エマルジョン、孔、ビーズ、チャネル又はスポットである、請求項62に記載の方法。
【請求項64】
前記ウェルは、マイクロウェルのアレイ上のマイクロウェルであること、前記エマルジョンは、油中水型エマルジョンであること、前記液滴は、溶液中若しくはエレクトロウェッティングデバイス上にあること、前記孔は、基板上にあること、前記ビーズは、溶液中にあるか若しくは表面に付着されること、前記チャネルは、マイクロ流体デバイス内にあること、又は前記スポットは、官能化表面上にあることの少なくとも1つである、請求項63に記載の方法。
【請求項65】
前記区画は、アレイ又は基板にわたって分布する、請求項62~64のいずれか一項に記載の方法。
【請求項66】
各区画は、標的識別子のサブセットを含み、各サブセットは、情報のブロックを符号化する配列ライブラリを表す、請求項62~65のいずれか一項に記載の方法。
【請求項67】
前記第5のプールは、シーケンシング時、少なくとも8デシベルの信号対雑音(SNR)比を有する、請求項1~66のいずれか一項に記載の方法。
【請求項68】
前記SNR比は、少なくとも13デシベルである、請求項67に記載の方法。
【請求項69】
前記シーケンシングは、ナノポアシーケンシングを使用して実施される、請求項67又は68に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本願は、2021年6月25日付けで出願された「PROCESSING METHODS FOR NUCLEIC ACID DATA STORAGE」という名称の米国仮特許出願第63/215,223号に対する優先権及びその利益を主張するものであり、上記で参照された出願の内容全体は、参照により本明細書に援用される。
【背景技術】
【0002】
背景
[0002] 核酸デジタルデータ格納は、情報を符号化して長期間にわたって格納するための安定した手法であり、データは、磁気テープ又はハードドライブ格納システムよりも高密度で格納される。さらに、低温乾燥条件で格納されている核酸分子に格納されたデジタルデータは、60,000年以上という長期にわたり検索することができる。
【0003】
[0003] 核酸分子に格納されたデジタルデータにアクセスするために、核酸分子はシーケンシングされ得る。したがって、核酸デジタルデータ格納は、頻繁にはアクセスされないが、大量の情報を長期にわたって格納又はアーカイブし得るデータの格納に理想的な方法であり得る。
【0004】
[0004] 現行の方法は、配列中の塩基間関係がデジタル情報(例えば、2進コード)に直接翻訳されるように、デジタル情報(例えば、2進コード)を塩基毎に核酸配列に符号化することに依存する。塩基毎の核酸デノボ合成のコストが高いことがあるため、デジタル的に符号化された情報のビットストリーム又はバイトに読み込むことができる塩基毎の配列に格納されたデジタルデータのシーケンシングは、エラーを受けやすく、符号化にコストがかかる恐れがある。核酸デジタルデータ格納を実行する新しい方法の機会は、コストがより低く、商業的な実施がより容易である、データを符号化し、検索する手法を提供し得る。
【発明の概要】
【課題を解決するための手段】
【0005】
概要
[0005] 本開示のシステム、アセンブリ及び方法は、一般的に、デジタル情報を記憶する核酸(例えば、DNA)分子の作成に関する。例えば、成分核酸分子(例えば、成分)が選択され、ウェビング等の基板材料上に個々に分注される。成分は、同じ位置にあるように基板上の同じ場所(例えば、座標)にプリント又は分注される。成分は、自己組織化又は他の方法でそれら自体を所定の順にソートして、識別子核酸分子(例えば、識別子)を形成するように構成される。各識別子は、記号列(例えば、ビットストリーム)における特定の記号(例えば、ビット若しくは一連のビット)又はその記号の位置(例えば、ランク若しくはアドレス)に対応する。成分を組み立てるために、本システムは、反応混合物を同じ場所にプリント又は分注し得、それにより成分を整列させて識別子を形成し得る。代わりに又は加えて、本システムは、成分を整列させる特定の温度等の成分を物理的にリンクさせるのに必要な条件を提供し得る。形成されると、複数の識別子を結合して識別子のプールにし得、プールは、記号列全体の少なくとも一部を表す。
【0006】
[0006] 本開示のシステム、アセンブリ及び方法は、インクジェットプリントを使用して成分からDNA識別子を迅速及び高スループットで組み立てることにより、デジタル情報をDNAに記憶するプリンタ-フィニッシャシステム(PFS)を含む。本明細書に記載の技術は、PFS(例えば、リットル)から下流の分子プロセス(例えば、マイクロリットル)への容積の扱いにおけるギャップを橋渡しするデバイス及び方法を含む。これらの技術は、信号対雑音比(SNR)を改善し、及び/又はバイアスを最小に抑えながら、全ての識別子の表現を維持することができる。
【0007】
[0007] 一態様では、本開示は、情報を符号化する核酸分子のプールを精製する方法を提供する。本方法は、標的核酸分子及び非標的核酸分子を含む第1のプールを取得することと、1)第1のプールの容積を低減して、富化された濃度の標的核酸分子及び非標的核酸分子を含む第2のプールを取得することと、2)研究所適合培地において標的核酸分子及び非標的核酸分子を含む第3のプールを取得するために、第2のプールに対してバッファー交換を実施することと、3)標的核酸分子を含む第4のプールを取得するために、標的核酸分子を非標的核酸分子から分離することと、4)富化された濃度の標的核酸分子を含む第5のプールを取得するために、第4のプール中の標的核酸分子を増幅することとを含む。標的核酸分子は、情報を符号化する配列ライブラリを含む。
【0008】
参照による援用
[0008] 本明細書で触れられる全ての公開特許、特許及び特許出願は、個々の各公開特許、特許又は特許出願が特に個々に参照により援用されると示されているかのような程度と同程度まで参照により本明細書に援用される。参照により援用される公開特許及び特許又は特許出願が、本明細書に含まれる開示と矛盾する限り、本明細書が任意のそのような矛盾する事項に取って代わり、及び/又はそれに優先することが意図される。
【0009】
図面の簡単な説明
[0009] 本発明の新規の特徴が特に添付の特許請求の範囲に記載される。本発明の原理が利用される例示的な実施形態を記載する以下の詳細な説明及び添付図面(本発明ではまた「図(Figure)」及び「図(FIG.)」)を参照することにより、本発明の特徴及び利点をよりよい理解が得られるであろう。
【図面の簡単な説明】
【0010】
【
図1】[0010]インクジェットプリントを使用して成分からDNA識別子を迅速及び高スループットで組み立てることにより、デジタル情報をDNAに記憶するシステムの一例を示し、システム及びその異なる実施形態は、以下では「プリンタ-フィニッシャシステム」又はPFSと呼ばれる。
【
図2】[0011]プリンタサブシステムの一例をより詳細に示し、プリントヘッドは、ウェブ上の同じ座標に異なる成分を重ねてプリントするように設計される。
【
図3A】[0012]プリンタにおけるプリントヘッドの一例を示す。
【
図3B】[0012]プリンタにおけるプリントヘッドの一例を示す。
【
図3C】[0012]プリンタにおけるプリントヘッドの一例を示す。
【
図3D】[0012]プリンタにおけるプリントヘッドの一例を示す。
【
図4】[0013]プリンタ内のプリントヘッドの潜在的な配置を示す。
【
図5】[0014]プリンタサブシステムにおけるスポットイメージャのセットアップの一例を示す。
【
図6】[0015]フィニッシャサブシステムの一例をより詳細に示す。反応混合物を基板の各座標に分注する部品に加えて、フィニッシャは、統合前に反応阻害剤を基板の各座標に分注する部品も含み得る。
【
図7】[0016]インキュベーションフェーズ中、ウェブをフィニッシャに通すためのローラのループの一例を示す。
【
図8】[0017]インキュベーション中、予期される平衡容積に対する反応混合物のグリセロール組成及びフィニッシャ湿度の影響を示す。
【
図9】[0018]ウェブからの全ての反応物を1つの容器に統合するプーリングシステムの一例を示す。
【
図10】[0019]PFSを通したデータ転送パイプラインの一実施形態の概略図を示す。
【
図11】[0020]4つのモジュール:シャーシモジュール、プリントエンジンモジュール、インキュベータモジュール及びプーリングモジュールを含むPFSの一実施形態を示す。
【
図12】[0021]反応液滴をエマルジョンにプールするPFSの一実施形態を示す。
【
図13】[0022]ウェビングにプリントされた後、反応液滴が油(又は別の非混和液)で被覆されるPFSの一実施形態を示す。
【
図14】[0023]反応液滴が、プリントされたDNA成分に結合するビーズを含む、PFSの一実施形態を示す。
【
図15】[0024]エマルジョンを使用して、ビーズに結合したDNA成分をどのように処理して識別子にするかの一例を示す。
【
図16】[0025]下流のプロセスに適した濃縮され、製された識別子のルートライブラリを精製するマルチステップ書き込み後プロセスの一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
詳細な説明
定義
[0026] 用語「成分」は、本明細書で使用される場合、核酸配列を概して指す。成分は、別個の配列であり得る。成分は、他の核酸配列又は分子を生成するように1つ又は複数の他の成分と連結されるか又は組み立てられ得る。
【0012】
[0027] 用語「層」は、本明細書で使用される場合、成分の群又はプールを概して指す。各層は、1つの層内の成分が別の層内の成分と異なるような別個の成分のセットを含み得る。1つ又は複数の層からの成分は、1つ又は複数の識別子を生成するように組み立てられ得る。
【0013】
[0028] 用語「識別子」は、本明細書で使用される場合、より大きいビット列内のビット列の位置及び値を表す核酸分子又は核酸配列を概して指す。より一般的には、識別子は、記号列中の記号を表すか、又は記号列中の記号に対応する任意のオブジェクトを指し得る。幾つかの実施形態では、識別子は、1つ又は複数の連結された成分を含み得る。
【0014】
[0029] 用語「識別子ライブラリ」は、本明細書で使用される場合、デジタル情報を表す記号列中の記号に対応する識別子の集合を概して指す。幾つかの実施形態では、識別子ライブラリ中の所与の識別子の非存在は、特定の位置における記号値を示し得る。1つ又は複数の識別子ライブラリは、識別子のプール、群又はセット内で組み合わされ得る。各識別子ライブラリは、識別子ライブラリを識別する一意のバーコードを含み得る。
【0015】
[0030] 用語「核酸」は、本明細書で使用される場合、デオキシリボ核酸(DNA)、リボ核酸(RNA)又はそれらのバリアントを概して指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)及びウラシル(U)又はそれらのバリアントから選択される1つ又は複数のサブユニットを含み得る。ヌクレオチドは、A、C、G、T、U又はそれらのバリアントを含み得る。ヌクレオチドは、成長中の核酸鎖に組み込むことができる任意のサブユニットを含み得る。そのようなサブユニットは、A、C、G、T、U或いは1つ若しくは複数の相補的なA、C、G、T若しくはUに特異的であるか、又はプリンに相補的(即ちA若しくはG又はそれらのバリアント)であるか、又はピリミジンに相補的(即ちC、T若しくはU又はそれらのバリアント)であり得る任意の他のサブユニットであり得る。幾つかの例では、核酸は、1本鎖又は2本鎖であり得、場合により、核酸は、環状である。
【0016】
[0031] 用語「核酸分子」又は「核酸配列」は、本明細書で使用される場合、デオキシリボヌクレオチド(DNA)若しくはリボヌクレオチド(RNA)のいずれか又はその類似体である、種々の長さを有し得るポリマー形態のヌクレオチド又はポリヌクレオチドを概して指す。用語「核酸配列」は、ポリヌクレオチドのアルファベット表現を指し得、代替的に、この用語は、物理的なポリヌクレオチド自体に適用され得る。このアルファベット表現は、中央演算処理装置を有するコンピュータ内のデータベースに入力され、核酸配列又は核酸分子を記号又はビットにマッピングし、デジタル情報を符号化するために使用され得る。核酸配列又はオリゴヌクレオチドは、1つ又は複数の非標準ヌクレオチド、ヌクレオチド類似体及び/又は修飾ヌクレオチドも含み得る。
【0017】
[0032] 「オリゴヌクレオチド」は、本明細書で使用される場合、一本鎖核酸配列を概して指し、典型的にはアデニン(A)、シトシン(C)、グアニン(G)及びチミン(T)又はポリヌクレオチドがRNAの場合にはアデニン(A)、シトシン(C)、グアニン(G)及びウラシル(U)の4つのヌクレオチド塩基の特異的配列で構成される。
【0018】
[0033] 修飾ヌクレオチドの例としては、限定されないが、ジアミノプリン、5-フルオロウラシル、5-ブロモウラシル、5-クロロウラシル、5-ヨードウラシル、ヒポキサンチン、キサンチン、4-アセチルシトシン、5-(カルボキシヒドロキシメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ-D-ガラクトシルキューオシン、イノシン、N6-イソペンテニルアデニン、1-メチルグアニン、1-メチルイノシン、2,2-ジメチルグアニン、2-メチルアデニン、2-メチルグアニン、3-メチルシトシン、5-メチルシトシン、N6-アデニン、7-メチルグアニン、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、ベータ-D-マンノシルキューオシン、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、2-メチルチオ-D46-イソペンテニルアデニン、ウラシル-5-オキシ酢酸(v)、ワイブトキソシン、シュードウラシル、キューオシン、2-チオシトシン、5-メチル-2-チオウラシル、2-チオウラシル、4-チオウラシル、5-メチルウラシル、ウラシル-5-オキシ酢酸メチルエステル、ウラシル-5-オキシ酢酸(v)、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、(acp3)w、2,6-ジアミノプリン等が挙げられる。核酸分子は、塩基部分(例えば、通常、相補的ヌクレオチドと水素結合を形成するために利用可能である1つ若しくは複数の原子及び/又は通常、相補的ヌクレオチドと水素結合を形成することができない1つ若しくは複数の原子)が修飾されているか、糖部分が修飾されているか、又はリン酸骨格が修飾されていることもある。核酸分子は、N-ヒドロキシスクシンイミドエステル(NHS)等のアミン反応性部分の共有結合を可能にするために、アミノアリル-dUTP(aa-dUTP)及びアミノヘキシルアクリルアミド-dCTP(aha-dCTP)等のアミン修飾基も含み得る。
【0019】
[0034] 用語「プライマー」は、本明細書で使用される場合、ポリメラーゼ連鎖反応(PCR)等の核酸合成のための出発点として役立つ核酸鎖を概して指す。一例では、DNA試料の複製中、複製を触媒する酵素は、DNA試料に結合したプライマーの3’末端で複製を開始し、反対側の鎖をコピーする。
【0020】
[0035] 用語「ポリメラーゼ」又は「ポリメラーゼ酵素」は、本明細書で使用される場合、ポリメラーゼ反応を触媒することができる任意の酵素を概して指す。ポリメラーゼの例としては、限定されないが、核酸ポリメラーゼが挙げられる。ポリメラーゼは、天然に存在するか又は合成され得る。ポリメラーゼの例は、Φ29ポリメラーゼ又はその誘導体である。幾つかの場合、転写酵素又はリガーゼ(即ち結合の形成を触媒する酵素)は、新たな核酸配列を構築するために、ポリメラーゼと併せて又はポリメラーゼの代替として使用される。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、熱安定性ポリメラーゼ、野生型ポリメラーゼ、修飾ポリメラーゼ、大腸菌(E. coli)DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(ファイ29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、SsoポリメラーゼPocポリメラーゼ、Pabポリメラーゼ、MthポリメラーゼES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、白金Taqポリメラーゼ、Tbrポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’から5’エキソヌクレアーゼ活性を有するクレノウ断片ポリメラーゼ並びにこれらのバリアント、修飾産物及び誘導体が挙げられる。
【0021】
[0036] 本明細書で使用される「約」という用語は、値のプラス又はマイナス20%の範囲を意味するものと理解することができ;例えば、「約20」は、16~24を意味し得る。
【0022】
[0037] 2進コードの形態でのコンピュータデータ等のデジタル情報は、記号の配列又は記号列を含み得る。2進コードは、例えば、典型的には0及び1である、ビットと呼ばれる2つの2進記号を有する2進法を使用して、テキスト又はコンピュータプロセッサ命令を符号化するか又は表し得る。デジタル情報は、非2進記号の配列を含み得る非2進コードの形式で表され得る。符号化された各記号は、一意のビット列(又は「バイト」)に再び割り当てることができ、一意のビット列又はバイトは、バイト列又はバイトストリームに配置することができる。所与のビットについてのビット値は、2つの記号の1つ(例えば、0又は1)であり得る。Nビットの列を含み得るバイトは、合計2Nの一意のバイト値を有することができる。例えば、8ビットを含むバイトは、合計28又は256の可能な一意のバイト値を生じさせることができ、256バイトの各々は、バイトで符号化することができる256の可能な別個の記号、文字又は命令の1つに対応し得る。生データ(例えば、テキストファイル及びコンピュータ命令)は、バイト列又はバイトストリームとして表すことができる。zipファイル又は生データを含む圧縮データファイルは、バイトストリームで記憶することもでき、これらのファイルを圧縮形式でバイトストリームとして記憶し、その後、コンピュータにより読み取られる前に生データに復元することができる。
【0023】
概説
[0038] インクジェットプリンタシステムを使用してデジタル情報を核酸に符号化する従来の方法は、コストがかかると共に時間がかかり得る核酸の塩基ごとの合成に依存していた。例えば、従来、インクジェットプリンタベースの技術がマイクロリアクタチップ上のオリゴヌクレオチド合成に使用されてきた。しかしながら、これらの技術は、合成の各ラウンド中、単一のオリゴヌクレオチドを添加するために、4ステップ(脱保護、結合、キャップ化及び酸化)固相ホスホラミダイトサイクル反応を利用する必要がある塩基ごとの合成を利用する。本明細書に記載の新しい方法は、成分の組合せ配置を使用してデジタル情報を符号化することができ、各成分(例えば、核酸配列)は、基板に分注(例えば、プリント)され、各成分が単一の反応で物理的にリンクされるように反応混合物及び/又は条件が提供される。
【0024】
[0039] 情報は、核酸配列に記憶することができる。本開示の幾つかの態様では、本明細書に提供されるのは、1つ又は複数の成分から構築される識別子にデジタル情報を符号化する方法である。各成分は、核酸配列を含み得る。プリンタ-フィニッシャシステム(又はPFS)として知られているプリントベースのシステムは、成分を同じ位置に配置し組み立てて、識別子を構築するために使用され得る。PFSは、2つのサブシステム:プリンタ及びフィニッシャを含み得る。PFSは、1つのシステム:成分及び反応混合物の両方を基板上に分注するプリンタを含み得る。幾つかの実施形態では、2つのサブシステムを取り付け、個々の機能について互いに依存し得る。他の実施形態では、2つのサブシステムは、別々であり得、独立して機能可能であり得る。
【0025】
情報を核酸配列に符号化し、書き込む方法
[0040] 一態様において、本開示は、情報を核酸配列に符号化する方法を提供する。情報を核酸配列に符号化する方法は、(a)情報を記号列に翻訳することと、(b)記号列を複数の識別子にマッピングすることと、(c)複数の識別子の少なくともサブセットを含む識別子ライブラリを構築することとを含み得る。複数の識別子のうちの個々の識別子は、1つ又は複数の成分を含み得る。1つ又は複数の成分のうちの個々の成分は、核酸配列を含み得る。記号列中の各位置における各記号は、別個の識別子に対応し得る。個々の識別子は、記号列中の個々の位置における個々の記号に対応し得る。さらに、記号列中の各位置における1つの記号は、識別子の不在に対応し得る。例えば、「0」及び「1」の2進記号(例えば、ビット)の列において、「0」の各発生は、識別子の不在に対応し得る。
【0026】
[0041] 別の態様において、本開示は、核酸ベースのコンピュータデータ格納の方法を提供する。核酸ベースのコンピュータデータ格納の方法は、(a)コンピュータデータを受信することと、(b)コンピュータデータを符号化する核酸配列を含む核酸分子を合成することと、(c)核酸配列を有する核酸分子を格納することとを含み得る。コンピュータデータは、合成された核酸分子の少なくともサブセットに符号化され得、各核酸分子の配列に符号化されない。
【0027】
[0042] 別の態様において、本開示は、情報を核酸配列に書き込み、格納する方法を提供する。方法は、(a)情報を表す仮想識別子ライブラリを受信又は符号化することと、(b)識別子ライブラリを物理的に構築することと、(c)識別子ライブラリの1つ又は複数の物理的コピーを1つ又は複数の別個の場所に格納することとを含み得る。識別子ライブラリの個々の識別子は、1つ又は複数の成分を含み得る。1つ又は複数の成分のうちの個々の成分は、核酸配列を含み得る。
【0028】
[0043] 別の態様において、本開示は、核酸ベースのコンピュータデータ格納を提供する。核酸ベースのコンピュータデータ格納の方法は、(a)コンピュータデータを受信することと、(b)コンピュータデータを符号化した少なくとも1つの核酸配列を含む核酸分子を合成することと、(c)少なくとも1つの核酸配列を含む核酸分子を格納することとを含み得る。核酸分子を合成することは、塩基毎の核酸合成を含まなくてよい。
【0029】
[0044] 別の態様において、本開示は、情報を核酸配列に書き込み、格納する方法を提供する。情報を核酸配列に書き込み、格納する方法は、(a)情報を表す仮想識別子ライブラリを受信又は符号化することと、(b)識別子ライブラリを物理的に構築することと、(c)識別子ライブラリの1つ又は複数の物理的コピーを1つ又は複数の別個の場所に格納することとを含み得る。識別子ライブラリの個々の識別子は、1つ又は複数の成分を含み得る。1つ又は複数の成分のうちの個々の成分は、核酸配列を含み得る。
【0030】
核酸配列に格納された情報を読み取る方法
[0045] 別の態様において、本開示は、核酸配列に格納された情報を読み取る方法を提供する。核酸配列に格納された情報を読み取る方法は、(a)識別子ライブラリを提供することと、(b)識別子ライブラリに存在する識別子を識別することと、(c)識別子ライブラリに存在する識別子から記号列を生成することと、(d)記号列から情報をコンパイルすることとを含み得る。識別子ライブラリは、組合せ空間からの複数の識別子のサブセットを含み得る。識別子のサブセットの個々の各識別子は、記号列内の個々の記号に対応し得る。識別子は、1つ又は複数の成分を含み得る。成分は、核酸配列を含み得る。
【0031】
[0046] 情報は、本明細書の他の箇所に記載のように、1つ又は複数の識別子ライブラリに書き込むことができる。識別子は、本明細書の他の箇所に記載の任意の方法を使用して構築され得る。格納されたデータは、本明細書の他の箇所に記載の任意の方法を使用してコピー及びアクセスされ得る。
【0032】
[0047] 識別子は、符号化された記号の場所、符号化された記号の値又は符号化された記号の場所及び値の両方に関連する情報を含み得る。識別子は、符号化された記号の場所に関連する情報を含み得、識別子ライブラリ内のその識別子の有無は、記号の値を示し得る。識別子ライブラリ内の識別子の存在は、2進列内の第1の記号値(例えば、第1のビット値)を示し得、識別子ライブラリ内の識別子の不在は、2進列内の第2の記号値(例えば、第2のビット値)を示し得る。2進系では、ビット値を識別子ライブラリ内の識別子の有無に基づかせることで、組み立てる識別子の数を低減し得、したがって書込み時間を短縮し得る。一例では、識別子の存在は、マッピングされた場所におけるビット値「1」を示し得、識別子の不在は、マッピングされた場所におけるビット値「0」を示し得る。
【0033】
[0048] 情報の記号(例えば、ビット値)を生成することは、記号(例えば、ビット)をマッピング又は符号化し得る識別子の有無を識別することを含み得る。識別子の有無を判断することは、現在の識別子をシーケンシングすること又はハイブリダイゼーションアレイを使用して識別子の存在を検出することを含み得る。一例では、符号化された配列の復号化及び読取りは、シーケンシングプラットフォームを使用して実行され得る。シーケンシングプラットフォームの例は、2014年8月21日付けで出願された米国特許出願第14/465,685号;2013年5月2日付けで出願された米国特許出願第13/886,234号;及び2009年3月9日付けで出願された米国特許出願第12/400,593号に記載されており、これらの各々は、全体的に参照により本明細書に援用される。
【0034】
[0049] 一例では、核酸符号化されたデータを復号化することは、Illumina(登録商標)シーケンシング等の核酸鎖の塩基毎のシーケンシング又は毛細管電気泳動による断片解析等の特定の核酸配列の有無を示すシーケンシング技法を利用することにより達成され得る。シーケンシングは、可逆的ターミネータの使用により採用され得る。シーケンシングは、天然又は非天然(例えば、工学的に操作された)ヌクレオチド又はヌクレオチド類似体の使用を採用し得る。代わりに又は加えて、核酸配列を復号化することは、限定されないが、光信号、電子化学信号又は化学信号を生成する任意の方法を含め、多様な解析的技法を使用して実行され得る。限定されないが、ポリメラーゼ連鎖反応(PCR)、デジタルPCR、サンガーシーケンシング、高スループットシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ライゲーションによるシーケンシング、RNA-Seq(Illuimna)、次世代シーケンシング、デジタル遺伝子発現(Helicos)、クローナルシングルマイクロアレイ(Solexa)、ショットガンシーケンシング、マキサム-ギルバートシーケンシング又は大規模並列シーケンシングを含め、多様なシーケンシング手法が使用可能である。
【0035】
[0050] 種々の読取り方法を使用して、符号化された核酸から情報を引き出すことができる。一例では、マイクロアレイ(又は任意の種類の蛍光ハイブリダイゼーション)、デジタルPCR、定量的PCR(qPCR)及び種々のシーケンシングプラットフォームをさらに使用して、符号化された配列及び伸長によりデジタル符号化されたデータを読み取ることができる。
【0036】
[0051] 識別子ライブラリは、情報についてのメタデータを提供する補足核酸配列、情報を暗号化若しくはマスクする補足核酸配列又はメタデータの提供及び情報のマスクの両方を行う補足核酸配列をさらに含み得る。補足核酸を識別子の識別と同時に識別し得る。代替的に、識別子を識別する前又は識別した後に補足核酸を識別し得る。一例では、補足核酸配列は、符号化された情報の読取り中に識別されない。補足核酸配列を識別子と区別できないこともある。識別子索引又は鍵を使用して、補足核酸分子と識別子とを差別化し得る。
【0037】
[0052] より少ない核酸分子の使用を可能にするように入力ビット列を再符号化することにより、データの符号化及び復号化効率を高め得る。例えば、符号化方法で3つの核酸分子(例えば、識別子)にマッピングされ得る「111」部分列が高度に出現する入力列を受信した場合、それを、核酸分子の空集合にマッピングされ得る「000」部分列に再符号化し得る。「000」の代替入力部分列を「111」に再符号化することもできる。この再符号化方法は、データセット中の「1」の数が低減され得るため、データを符号化するために使用される核酸分子の総量を低減させ得る。この例では、データセットの総サイズを、新しいマッピング命令を指定するコードブックに対応するように増加させ得る。符号化及び復号化効率を高めるための代替方法は、可変長を短縮するように入力列を再符号化することであり得る。例えば、「111」を「00」に再符号化し得、これは、データセットのサイズを縮小し、データセット中の「1」の数を低減させ得る。
【0038】
[0053] 検出を容易にするように識別子を特異的に設計することにより、核酸符号化データを復号化する速度及び効率を制御する(例えば、高める)ことができる。例えば、検出を容易にするように設計される核酸配列(例えば、識別子)は、それらの光学的、電気化学的、化学的又は物理学的特性に基づいて呼び出すこと及び検出することがより容易であるヌクレオチドの大部分を含む核酸配列を含み得る。工学的に操作された核酸配列は、一本鎖状又は二本鎖状のいずれでもあり得る。工学的に操作された核酸配列は、核酸配列の検出可能な特性を向上させる合成又は非天然ヌクレオチドを含み得る。工学的に操作された核酸配列は、全て天然ヌクレオチドを含み得るか、全て合成若しくは非天然ヌクレオチドを含み得るか、又は天然ヌクレオチドと、合成ヌクレオチドと、非天然ヌクレオチドとの組合せを含み得る。合成ヌクレオチドとしては、ヌクレオチド類似体、例えばペプチド核酸、ロックド核酸、グリコール核酸及びトレオース核酸を挙げることができる。非天然ヌクレオチドとしては、dNaM、3-メトキシ-2-ナフチル基を含む人工ヌクレオシド及びd5SICS、6-メチルイソキノリン-1-チオン-2-イル基を含む人工ヌクレオシドを挙げることができる。工学的に操作された核酸配列は、増強された光学的特性等、単一の増強された特性のために設計され得るか、又は設計される核酸配列は、増強された光学的及び電気化学的特性若しくは増強された光学的及び化学的特性等、複数の増強された特性を伴って設計され得る。
【0039】
[0054] 工学的に操作された核酸配列は、核酸配列の光学的、電気化学的、化学的又は物理的特性を向上させない反応性天然、合成及び非天然ヌクレオチドを含み得る。核酸配列の反応性成分は、核酸配列に向上した特性を付与する化学的部分の付加を可能にし得る。各核酸配列は、単一の化学的部分を含み得るか又は複数の化学的部分を含み得る。化学的部分の例としては、蛍光部分、化学発光部分、酸性又は塩基性部分、疎水性又は親水性部分及び核酸配列の酸化状態又は反応性を変更する部分が挙げられるが、これらに限定されない。
【0040】
[0055] シーケンシングプラットフォームは、核酸配列に符号化された情報の復号化及び読取りのために特異的に設計され得る。シーケンシングプラットフォームは、一本鎖又は二本鎖核酸分子のシーケンシング専用であり得る。シーケンシングプラットフォームは、個々の塩基を読み取ること(例えば、塩基毎のシーケンシング)又は核酸分子(例えば、識別子)に組み込まれた全核酸配列(例えば、成分)の存在若しくは非存在を検出することにより、核酸符号化データを復号化し得る。シーケンシングプラットフォームは、無差別な試薬の使用、読取り長の延長の使用及び検出可能な化学的部分の付加による特定の核酸配列の検出の使用を含み得る。シーケンシング中のより多くの無差別な試薬の使用は、より速い塩基呼び出しを可能にすることにより読取り効率を高めることができ、その結果としてシーケンシング時間を短縮することができる。読取り長の延長の使用は、符号化された核酸のより長い配列を読取り毎に復号化することを可能にし得る。検出可能な化学的部分タグの付加は、化学的部分の有無により核酸配列の有無の検出を可能にし得る。例えば、情報のビットを符号化する各核酸配列は、固有の光学的、電気化学的又は化学的シグナルを生成する化学的部分においてタグ付けされ得る。その一意の光学的、電気化学的又は化学的シグナルの有無は、「0」又は「1」ビット値を示し得る。核酸配列は、単一の化学的部分を含み得るか又は複数の化学的部分を含み得る。データを符号化するための核酸配列の使用前に化学的部分を核酸配列に付加させ得る。代わりに又は加えて、データの符号化後であるが、データを復号化する前に化学的部分を核酸配列に付加させ得る。化学的部分タグを核酸配列に直接付加させ得るか、又は核酸配列が合成又は非天然ヌクレオチドアンカーを含み得、そのアンカーに化学的部分タグを付加させ得る。
【0041】
[0056] 符号化及び復号化エラーを最小限にするか又は検出するために、一意のコードを適用し得る。符号化及び復号化エラーは、偽陰性(無作為サンプリングに含まれない核酸分子又は識別子)により起こり得る。誤り検出コードの一例は、識別子ライブラリに含まれている可能な識別子の連続セット中の識別子の数を計数するチェックサム配列であり得る。識別子ライブラリの読取り中、チェックサムは、識別子のその連続セットからの取得期待数を示し得、識別子は、その期待数が満たされるまで読取りのためのサンプリングを継続し得る。幾つかの実施形態では、チェックサム配列をR識別子の連続セット毎に含め得、ここで、Rは、サイズが1、2、5、10、50、100、200、500若しくは1000以上であり得るか、又は1000、500、200、100、50、10、5若しくは2未満であり得る。Rの値が小さいほど、誤り検出が良好である。幾つかの実施形態では、チェックサムは、補足核酸配列であり得る。例えば、7個の核酸配列(例えば、成分)を含むセットを、産物方式で識別子を構築するための核酸配列(層X中の成分X1~X3及び層Y中のY1~Y3)と補足チェックサムのための核酸配列(X4~X7及びY4~Y7)との2つの群に分けることができる。チェックサム配列X4~X7は、層Xの0、1、2又は3個の配列が層Yの各メンバと組み立てられるか否かを示すことができる。代替的に、チェックサム配列Y4~Y7は、層Yの0、1、2又は3個の配列が層Xの各メンバと組み立てられるか否かを示し得る。この例では、識別子{X1Y1、X1Y3、X2Y1、X2Y2、X2Y3}を有する元の識別子ライブラリを、以下のプールになるようにチェックサムを含むように補足し得る:{X1Y1、X1Y3、X2Y1、X2Y2、X2Y3、X1Y6、X2Y7、X3Y4、X6Y1、X5Y2、X6Y3}。チェックサム配列をエラー補正に使用し得る。例えば、上記データセットにおけるX1Y1の非存在並びにX1Y6及びX6Y1の存在は、X1Y1核酸分子がデータセットから欠けているという推測を可能にし得る。チェックサム配列は、識別子が、識別子ライブラリのサンプリング又は識別子ライブラリのアクセスされる部分から欠けているか否かを示し得る。欠けているチェックサム配列の場合、PCR又は親和性タグ付きプローブハイブリダイゼーション等のアクセス方法は、それを増幅及び/又は単離し得る。幾つかの実施形態では、チェックサムは、補足核酸配列でないこともある。その場合、チェックサムを情報に直接符号化し得、その結果、それらは、識別子によって表される。
【0042】
[0057] データ符号化及び復号化のノイズは、パリンドロームとして識別子を構築することにより、例えば産物方式において単一成分ではなく成分のパリンドローム対を使用することにより低減され得る。次いで、異なる層からの成分の対をパリンドローム様式(例えば、成分X及びYについてXYではなくYXY)で互いに組み立て得る。このパリンドローム方法は、より多くの数の層(例えば、XYZではなくZYXYZ)に拡大され得、このパリンドローム方法により、識別子間の誤った交差反応の検出が可能になり得る。
【0043】
[0058] 識別子への過剰(例えば、大過剰)な補足核酸配列の付加は、シーケンシングによる符号化された識別子の収集を妨げる恐れがある。情報の復号化前に識別子は補足核酸配列により濃縮され得る。例えば、識別子末端に特異的なプライマーを使用する核酸増幅反応により、識別子は濃縮され得る。代わりに又は加えて、特異的プライマーを使用するシーケンシング(例えば、合成によるシーケンシング)により、サンプルプールを濃縮することなく情報を復号化し得る。両方の復号化方法において、復号化鍵がないか又は識別子の組成について何らかのことが分かっていなければ、情報を濃縮又は復号化することは、困難であり得る。親和性タグベースのプローブの使用等の代替アクセス方法を利用することもできる。
【0044】
2進配列データを符号化するシステム
[0059] デジタル情報を核酸(例えば、DNA)に符号化するシステムは、ファイル及びデータ(例えば、生データ、圧縮されたzipファイル、整数データ及び他の形態のデータ)をバイトに変換し、バイトを核酸、典型的にはDNAのセグメント、配列又はこれらの組合せに符号化するシステム、方法及びデバイスを含み得る。
【0045】
[0060] 一態様において、本開示は、核酸を使用して2進配列データを符号化するシステムを提供する。核酸を使用して2進配列データを符号化するシステムは、デバイスと、1つ又は複数のコンピュータプロセッサとを含み得る。デバイスは、識別子ライブラリを構築するように構成され得る。1つ又は複数のコンピュータプロセッサは、個々に又は集合的に、(i)情報を記号列に翻訳することと、(ii)記号列を複数の識別子にマッピングすることと、(iii)複数の識別子の少なくともサブセットを含む識別子ライブラリを構築することとを行うようにプログラムされ得る。複数の識別子のうちの個々の識別子は、記号列の個々の記号に対応し得る。複数の識別子の個々の識別子は、1つ又は複数の成分を含み得る。1つ又は複数の成分のうちの個々の成分は、核酸配列を含み得る。
【0046】
[0061] 別の態様において、本開示は、核酸を使用して2進配列データを読み取るシステムを提供する。核酸を使用して2進配列データを読み取るシステムは、データベースと、1つ又は複数のコンピュータプロセッサとを含み得る。データベースは、情報を符号化した識別子ライブラリを格納し得る。1つ又は複数のコンピュータプロセッサは、個々に又は集合的に、(i)識別子ライブラリ内の識別子を識別することと、(ii)(i)において識別された識別子から複数の記号を生成することと、(iii)複数の記号から情報をコンパイルすることとを行うようにプログラムされ得る。識別子ライブラリは、複数の識別子のサブセットを含み得る。複数の識別子の個々の各識別子は、記号列内の個々の記号に対応し得る。識別子は、1つ又は複数の成分を含み得る。成分は、核酸配列を含み得る。
【0047】
[0062] システムを使用してデジタルデータを符号化する方法の非限定的な実施形態は、バイトストリームの形態でデジタル情報を受信するステップを含む。バイトストリームを個々のバイトに解析し、核酸索引(又は識別子ランク)を使用してバイト内のビットの場所をマッピングし、ビット値1又はビット値0のいずれかに対応する配列を識別子に符号化する。デジタルデータを検索するステップは、1つ又は複数のビットにマッピングされる核酸の配列(例えば、識別子)を含む核酸サンプル又は核酸プールをシーケンシングすることと、識別子ランクを参照して、識別子が核酸プールに存在するか否かを確認することと、各配列の場所及びビット値情報を復号化して、デジタル情報の配列を含むバイトにすることとを含み得る。
【0048】
[0063] 符号化され核酸分子に書き込まれた情報を符号化、書込み、コピー、アクセス、読取り及び復号化するシステムは、単一の一体ユニットであり得るか、又は上記演算の1つ若しくは複数を実行するように構成された複数のユニットであり得る。情報を符号化し核酸分子(例えば、識別子)に書き込むシステムは、デバイスと、1つ又は複数のコンピュータプロセッサとを含み得る。1つ又は複数のコンピュータプロセッサは、情報を解析して記号列(例えば、ビット列)にするようにプログラムされ得る。コンピュータプロセッサは、識別子ランクを生成し得る。コンピュータプロセッサは、記号を2つ以上のカテゴリに分類され得る。1つのカテゴリは、識別子ライブラリ内の対応する識別子の存在によって表される記号を含み得、別のカテゴリは、識別子ライブラリ内の対応する識別子の不在によって表される記号を含み得る。コンピュータプロセッサは、識別子ライブラリ内の識別子の存在に対して表される記号に対応する識別子を組み立てるようにデバイスに指示し得る。
【0049】
[0064] デバイスは、複数の領域、セクション又は区画を含み得る。識別子を組み立てるための試薬及び成分は、デバイスの1つ又は複数の領域、セクション又は区画に格納され得る。層をデバイスのセクションの別個の領域に格納し得る。層は、1つ又は複数の一意の成分を含み得る。1つの層内の成分は、別の層内の成分から一意に区別され得る。領域又はセクションは、容器を含み得、区画は、ウェルを含み得る。各層は、別々の容器又は区画に格納され得る。各試薬又は核酸配列は、別々の容器又は区画に格納され得る。代わりに又は加えて、複数の試薬を組み合わせて、識別子を構築するためのマスタミックスを形成し得る。デバイスは、あるセクションで組み合わされるべき試薬、成分及び鋳型をデバイスの別のセクションから移送し得る。デバイスは、アセンブリ反応を完了するための条件を提供し得る。例えば、デバイスは、加熱、攪拌及び反応進行の検出を提供し得る。構築された識別子は、バーコード、共通配列、可変配列又はタグを識別子の1つ又は複数の末端に付加する1つ又は複数の続く反応を経るように向けられ得る。次いで、識別子は、識別子ライブラリを生成する領域又は区画に向けられ得る。1つ又は複数の識別子ライブラリは、デバイスの各領域、セクション又は個々の区画に格納され得る。デバイスは、圧力、真空又は吸引を使用して流体(例えば、試薬、成分、鋳型)を移送し得る。
【0050】
[0065] 識別子ライブラリは、デバイスに格納され得るか又は別々のデータベースに移され得る。データベースは、1つ又は複数の識別子ライブラリを含み得る。データベースは、識別子ライブラリの長期格納条件(例えば、識別子の分解を低減するための条件)を提供し得る。識別子ライブラリは、粉体、液体又は固体形態で格納し得る。識別子の水溶液は、より安定した格納のために凍結乾燥され得る。代替的に、識別子は、酸素の不在下で格納され得る(例えば、嫌気性格納条件)。データベースは、紫外線光保護、低温(例えば、冷蔵又は冷凍)及び分解させる化学物質及び酵素からの保護を提供し得る。データベースへの移送前に、識別子ライブラリは、凍結乾燥又は凍結され得る。識別子ライブラリは、ヌクレアーゼを不活性化するエチレンジアミン四酢酸(EDTA)及び/又は核酸分子の安定性を維持するための緩衝液を含み得る。
【0051】
[0066] データベースは、情報を識別子に書き込み、情報をコピーし、情報にアクセスするか、又は情報を読み取るデバイスに結合され得るか、そのデバイスを含み得るか、又はそのデバイスとは別々であり得る。識別子ライブラリの一部分は、コピー、アクセス又は読取り前にデータベースから除去され得る。情報をデータベースからコピーするデバイスは、情報を書き込むものと同じ又は異なるデバイスであり得る。情報をコピーするデバイスは、デバイスから識別子ライブラリのアリコートを抽出し、そのアリコートを試薬及び構成物質と組み合わせて、識別子ライブラリの一部分又は全体を増幅し得る。デバイスは、増幅反応の温度、圧力及び攪拌を制御し得る。デバイスは、複数の区画を含み得、1つ又は複数の増幅反応は、識別子ライブラリを含む区画で行われ得る。デバイスは、一度に2つ以上の識別子プールをコピーし得る。
【0052】
[0067] コピーされた識別子は、コピーデバイスからアクセスデバイスに移送され得る。アクセスデバイスは、コピーデバイスと同じデバイスであり得る。アクセスデバイスは、別々の領域、セクション又は区画を含み得る。アクセスデバイスは、親和性タグに結合された識別子を単離するための1つ又は複数のカラム、ビーズ貯槽又は磁性領域を有し得る。代わりに又は加えて、アクセスデバイスは、1つ又は複数のサイズ選択ユニットを有し得る。サイズ選択ユニットは、アガロースゲル電気泳動又は核酸分子をサイズ選択する任意の他の方法を含み得る。コピー及び抽出は、デバイスの同じ領域で実行され得るか、又はデバイスの異なる領域で実行され得る。
【0053】
[0068] アクセスされたデータは、同じデバイスで読み出され得るか、又はアクセスされたデータは、別のデバイスに移送され得る。読取りデバイスは、識別子を検出し、識別する検出ユニットを含み得る。検出ユニットは、シーケンサ、ハイブリダイゼーションアレイ又は識別子の有無を識別するための他のユニットの一部であり得る。シーケンシングプラットフォームは、核酸配列に符号化された情報を復号化し、読み取るように特に設計され得る。シーケンシングプラットフォームは、1本鎖又は2本鎖核酸分子のシーケンシングに特化し得る。シーケンシングプラットフォームは、個々の塩基を読み取る(例えば、塩基毎のシーケンシング)ことにより又は核酸分子(例えば、識別子)内に組み込まれた核酸配列(例えば、成分)全体の有無を検出することにより、核酸符号化されたデータを復号化し得る。代替的に、シーケンシングプラットフォームは、Illumina(登録商標)シーケンシング又は毛細管電気泳動による断片化解析等のシステムであり得る。代わりに又は加えて、核酸配列の復号化は、限定されないが、光信号、電子化学信号又は化学信号を生成する任意の方法を含め、デバイスにより実施される多様な解析技法を使用して実行され得る。
【0054】
[0069] 核酸分子への情報格納には、限定されないが、長期情報格納、機密情報格納及び医療情報の格納を含め、種々の用途があり得る。一例では、人の医療情報(例えば、病歴及び医療記録)を核酸分子に格納し、その人に渡すことができる。情報は、身体外(例えば、ウェアラブルデバイスに)又は身体内(例えば、皮下カプセル)に格納され得る。患者が診療所又は病院に運ばれた場合、サンプルをデバイス又はカプセルから取り得、核酸シーケンサを使用して情報を復号化し得る。核酸分子への医療記録の個人的な格納は、コンピュータ及びクラウドベースの格納システムに対する代替を提供し得る。核酸分子への医療記録の個人的な格納は、医療記録がハッキングされる事例又は医療記録ハッキングの蔓延を低減し得る。医療記録のカプセルベースの格納に使用される核酸分子は、ヒトのゲノム配列から導出され得る。ヒトのゲノム配列の使用は、カプセルの故障又は漏出の場合、核酸配列の免疫原性を低減し得る。
【0055】
成分を組み立てる化学的方法
[0070] 本明細書に提供される反応及び方法は、1つ又は複数の成分から識別子を組み立てる、本明細書に記載のシステムで使用することができる。例えば、本明細書に提供される異なる化学的方法用の異なる反応混合物をシステムのフィニッシャで使用して、異なる成分を組み立てることができる。
【0056】
A.オーバーラップ伸長PCR(OEPCR)アセンブリ
[0071] OEPCRでは、成分は、ポリメラーゼ及びdNTP(dATP、dTTP、dCTP、dGTP又はそれらのバリアント若しくは類似体を含むデオキシヌクレオチド三リン酸)を含む反応で組み立てられ得る。成分は、1本鎖又は2本鎖核酸であり得る。互いに隣接して組み立てられる成分は、相補的な3’末端、相補的な5’末端又はある成分の5’末端と、隣接する成分の3’末端との間に相同性を有し得る。これらの末端領域は、「ハイブリダイゼーション領域」と呼ばれ、OEPCR中、成分間にハイブリダイズされた接合部が形成されることを促進することを目的とし、1つの入力成分(又はその相補体)の3’末端は、意図される隣接する成分(又はその相補体)の3’末端にハイブリダイズされる。次いで、ポリメラーゼ伸長により、組み立てられた2本鎖産物が形成される。次いで、続くハイブリダイゼーション及び伸長を通して、この産物をより多くの成分に組み付け得る。
【0057】
[0072] 幾つかの実施形態では、OEPCRは、3つの温度間循環を含み得る:融解温度、アニーリング温度及び伸長温度。融解温度は、2本鎖核酸を1本鎖核酸に変えると共に、成分内又は成分間の二次構造又はハイブリダイゼーションの形成を除去することを意図する。典型的には、融解温度は、高く、例えば95℃を超える。幾つかの実施形態では、融解温度は、少なくとも96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃又は少なくとも105℃であり得る。他の実施形態では、融解温度は、最大で95℃、94℃、93℃、92℃、91℃又は最大で90℃であり得る。融解温度が高いほど、核酸及びそれらの二次構造の解離を改善するが、核酸又はポリメラーゼの分解等の副作用も生じさせ得る。融解温度は、少なくとも1秒、2秒、3秒、4秒若しくは少なくとも5秒又はそれよりも長く、例えば30秒、1分、2分若しくは3分にわたって反応に適用され得る。
【0058】
[0073] アニーリング温度は、意図される隣接成分(又はそれらの相補体)の相補的な3’末端間のハイブリダイゼーションの形成を促進することを意図する。幾つかの実施形態では、アニーリング温度は、意図されるハイブリダイズされた核酸形成の計算された融解温度に一致し得る。他の実施形態では、アニーリング温度は、前記融解温度の10℃以上以内であり得る。幾つかの実施形態では、アニーリング温度は、少なくとも25℃、30℃、50℃、55℃、60℃、65℃又は少なくとも70℃であり得る。融解温度は、成分間の意図されるハイブリダイゼーション領域の配列に依存し得る。ハイブリダイゼーション領域が長いほど、高い融解温度を有し、グアニン又はシトシンヌクレオチドの含有率が高いハイブリダイゼーション領域ほど、高い融解温度を有し得る。したがって、特定のアニーリング温度で最適に組み立てることを意図するOEPCR反応に向けて成分を設計することが可能であり得る。アニーリング温度は、少なくとも1秒、5秒、10秒、15秒、20秒、25秒若しくは30秒又はそれを超える時間にわたって反応に適用され得る。
【0059】
[0074] 伸長温度は、1つ又は複数のポリメラーゼ酵素により触媒されたハイブリダイズされた3’末端の核酸鎖伸長を開始し、促進することを意図する。幾つかの実施形態では、伸長温度は、ポリメラーゼが核酸結合強度、伸長速度、伸長安定性又は忠実性の点で最適に機能する温度に設定され得る。幾つかの実施形態では、伸長温度は、少なくとも30℃、40℃、50℃、60℃若しくは70℃又はそれを超える温度であり得る。アニーリング温度は、少なくとも1秒、5秒、10秒、15秒、20秒、25秒、30秒、40秒、50秒若しくは60秒又はそれよりも長い時間にわたって反応に適用され得る。推奨される伸長時間は、予期される伸長1キロベース当たり15~45秒前後であり得る。
【0060】
[0075] OEPCRの幾つかの実施形態では、アニーリング温度及び伸長温度は、同じであり得る。したがって、3ステップ温度サイクルの代わりに2ステップ温度サイクルを使用することができる。アニーリング温度及び伸長温度の例には、60℃、65℃又は72℃がある。
【0061】
[0076] 幾つかの実施形態では、OEPCRは、1つの温度サイクルを用いて実行され得る。そのような実施形態は、2つのみの成分の意図される組立てを含み得る。他の実施形態では、OEPCRは、複数の温度サイクルを用いて実行され得る。OEPCRにおける任意の所与の核酸は、1つのサイクルで最大で1つの他の核酸に組み付けられ得る。これは、組立て(又は伸長若しくは延長)が核酸の3’末端のみで行われ得、各核酸が1つのみの3’末端を有するためである。したがって、複数の成分を組み立てるには、複数の温度サイクルが必要であり得る。例えば、4個の成分を組み立てることは、3つの温度サイクルを含み得る。6個の成分を組み立てることは、5つの温度サイクルを含み得る。10個の成分を組み立てることは、9つの温度サイクルを含み得る。幾つかの実施形態では、必要最低限よりも多くの温度サイクルを使用して、組立て効率を上げることができる。例えば、4つの温度サイクルを使用して2個の成分を組み立てることにより、1つのみの温度サイクルを使用するよりも産物収率を高くし得る。これは、成分のハイブリダイゼーション及び伸長が、各サイクルにおける成分の総数の関数として生じる統計学的事象であるためである。したがって、組み立てられる成分の総割合は、サイクル数の増大に伴って増大し得る。
【0062】
[0077] 温度循環考慮事項に加えて、OEPCRにおける核酸配列の設計も互いへの組み付け効率に影響し得る。ハイブリダイゼーション領域が長い核酸は、ハイブリダイゼーション領域が短い核酸と比べて、所与のアニーリング温度でより効率的にハイブリダイズされ得る。これは、ハイブリダイズされた産物が長いほど、ハイブリダイズされた産物が短い場合よりも多数の安定した塩基対を含み、したがってハイブリダイズされた産物全体でより安定するためである。ハイブリダイゼーション領域は、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個若しくは10個又はそれよりも多くの塩基分の長さを有し得る。
【0063】
[0078] グアニン又はシトシン含有率が高いハイブリダイゼーション領域は、グアニン又はシトシン含有率が低いハイブリダイゼーション領域よりも所与の温度で効率的にハイブリダイズし得る。これは、アデニンがチミンと形成するよりも安定した塩基対をグアニンがシトシンと形成するためである。ハイブリダイゼーション領域は、0%~100%の範囲のグアニン又はシトシン含有率(GC含有率としても知られる)を有し得る。例えば、ハイブリダイゼーション領域は、0%~5%、5%~10%、10%~15%、15%~20%、20%~25%、25%~30%、30%~35%、35%~40%、40%~45%、45%~50%、50%~55%、55%~60%、60%~65%、65%~70%、70%~75%、75%~80%、80%~85%、85%~90%、90%~95%又は95%~100%のグアニン又はシトシン含有率を有し得る。
【0064】
[0079] ハイブリダイゼーション領域長及びGC含有率に加えて、OEPCRの効率に影響し得る核酸配列設計のはるかに多くの態様が存在する。例えば、成分内の望ましくない二次構造の形成は、意図される隣接成分とハイブリダイゼーション産物を形成する能力に干渉する恐れがある。これらの二次構造は、ヘアピンループを含み得る。核酸に対して生じる可能性のある二次構造のタイプ及びそれらの安定性(例えば、融解温度)は、配列に基づいて予測され得る。設計空間探索アルゴリズムを使用して、潜在的に阻害性二次構造を有する配列を回避しながら、効率的なOEPCRに適切な長さ及びGC含有率基準を満たす核酸配列を特定し得る。設計空間探索アルゴリズムは、遺伝アルゴリズム、ヒューリスティック探索アルゴリズム、タブー探索のようなメタヒューリスティック探索戦略、分枝限定探索アルゴリズム、ダイナミックプログラミングベースのアルゴリズム、制約付き組合せ最適化、勾配降下ベースのアルゴリズム、ランダム探索アルゴリズム又はそれらの組合せを含み得る。
【0065】
[0080] 同様に、ホモ二量体(同じ配列の核酸分子とハイブリダイズする核酸分子)及び不要なヘテロ二量体(意図される組立て相手以外の核酸配列とハイブリダイズする核酸配列)の形成もOEPCRと干渉する恐れがある。核酸内の二次構造と同様に、計算方法及び設計空間探索アルゴリズムを使用して、核酸設計中にホモ二量体及びヘテロ二量体の形成を予測し、考慮に入れることもできる。
【0066】
[0081] 核酸配列が長いほど又はGC含有率が高いほど、OEPCRに伴って形成される不要な二次構造、ホモ二量体及びヘテロ二量体が増え得る。したがって、幾つかの実施形態では、より短い核酸配列又はより低いGC含有率の使用は、より高い組立て効率に繋がり得る。これらの設計原理は、より効率的な組立てに向けて長いハイブリダイゼーション領域又は高いGC含有率を使用する設計戦略に対抗し得る。したがって、幾つかの実施形態では、OEPCRは、高いGC含有率を有する長いハイブリダイゼーション領域を使用するが、低いGC含有率を有する短い非ハイブリダイゼーション領域を使用することにより最適化され得る。核酸の全長は、塩基少なくとも10個、20個、30個、40個、50個、60個、70個、80個、90個若しくは100個又はそれよりも多くの個数分であり得る。幾つかの実施形態では、組立て効率が最適化される、核酸のハイブリダイゼーション領域の最適な長さ及び最適なGC含有率が存在し得る。
【0067】
[0082] OEPCR反応における別個の核酸の数が多いほど、予期される組立て効率に干渉する恐れがある。これは、別個の核酸配列の数が多いほど、特にヘテロ二量体の形態の望ましくない分子相互作用の確率が高くなり得るためである。したがって、多数の成分を組み立てるOEPCRの幾つかの実施形態では、効率的な組立てのために核酸配列制約がより厳しくなり得る。
【0068】
[0083] 期待される最終的に組み立てられた産物を増幅するためのプライマーをOEPCR反応に含め得る。その場合、OEPCR反応は、より多くの温度サイクルを用いて実行されて、構成成分間により多くのアセンブリを作り出すのみならず、完全に組み立てられたサンプルを従来のPCRの様式で指数的に増幅することによりも、組み立てられる産物の収率を改善し得る。
【0069】
[0084] 添加剤をOEPCR反応に含めて、組立て効率を改善し得る。例えば、ベタイン、ジメチルスルホキシド(DMSO)、非イオン性界面活性剤、ホルムアミド、マグネシウム、ウシ血清アルブミン(BSA)又はそれらの組合せの添加である。添加剤含有率(体積当たりの重み)は、少なくとも0%、1%、5%、10%若しくは20%又はそれを超え得る。
【0070】
[0085] 種々のポリメラーゼがOEPCRに使用可能である。ポリメラーゼは、天然に発生するもの又は合成されたものであり得る。ポリメラーゼの一例は、Φ29ポリメラーゼ又はその誘導体である。幾つかの事例では、新しい核酸配列を構築するために、転写酵素又はリガーゼ(即ち結合の形成を触媒する酵素)がポリメラーゼと併せて又はポリメラーゼの代替として使用される。ポリメラーゼの例には、DNAポリメラーゼ、RNAポリメラーゼ、熱安定性ポリメラーゼ、野生型ポリメラーゼ、修飾ポリメラーゼ、大腸菌(E. coli)DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(phi29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ、ES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、白金Taqポリメラーゼ、Tbrポリメラーゼ、Phusionポリメラーゼ、KAPAポリメラーゼ、Q5ポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’から5’エキソヌクレアーゼ活性を有するKlenow断片ポリメラーゼ並びにそれらのバリアント、修飾産物及び誘導体がある。異なるポリメラーゼは、異なる温度で安定し、最適に機能し得る。さらに、異なるポリメラーゼは、異なる性質を有する。例えば、Phusionポリメラーゼ等の幾つかのポリメラーゼは、核酸伸長中、より高い忠実性に寄与し得る3’から5’エキソヌクレアーゼ活性を示し得る。ポリメラーゼによっては、伸長中、先導配列を変位させるものもあれば、先導配列を分解又は伸長を停止させるものもある。ポリメラーゼによっては、Taqのように、核酸配列の3’末端にアデニン塩基を組み込むものがある。このプロセスは、Aテーリングと呼ばれ、アデニン塩基の付加は、意図される隣接成分間に設計される3’相補性を妨害する恐れがあるため、OEPCRを阻害する恐れがある。OEPCRは、ポリメラーゼサイクルアセンブリ(又はPCA)と呼ぶこともできる。
【0071】
B.ライゲーションアセンブリ
[0086] ライゲーションアセンブリでは、1つ又は複数のリガーゼ酵素及び追加の補因子を含む反応において、別々の核酸が組み立てられる。補因子は、アデノシン三リン酸(ATP)、ジチオスレイトール(DTT)又はマグネシウムイオン(Mg2+)を含み得る。ライゲーション中、1本の核酸鎖の3’末端は、別の核酸鎖の5’末端に共有結合され、したがって組み立てられた核酸を形成する。ライゲーション反応における成分は、平滑末端2本鎖DNA(dsDNA)、1本鎖DNA(ssDNA)又は部分的にハイブリダイズされた1本鎖DNAであり得る。核酸の末端を一緒にする戦略は、リガーゼ酵素に対して物質が生き残る頻度を上げ、したがってリガーゼ反応の効率改善に使用され得る。平滑末端dsDNA分子は、リガーゼ酵素が作用し得る疎水性積層を形成する傾向があるが、核酸を一緒にするためのより成功率の高い戦略は、組み付けが意図される成分の突出と相補性を有する5’又は3’1本鎖突出を有する核酸成分を使用することであり得る。後者の場合、塩基/塩基ハイブリダイゼーションに起因して、より安定した核酸二本鎖を形成し得る。
【0072】
[0087] 2本鎖核酸が一方の末端に突出鎖を有する場合、同じ末端上の他方の鎖は、「窪み」(cavity)と呼ぶことができる。窪み及び突出は、一緒に、「付着末端」としても知られる「粘着末端」を形成する。粘着末端は、3’突出及び5’窪みであり得るか、又は5’突出及び3’窪みであり得る。2つの意図される隣接成分間の粘着末端は、各突出末端が他方の成分上の窪みの冒頭に直に隣接するように両方の粘着末端の突出がハイブリダイズするように、相補性を有するように設計され得る。これは、リガーゼの作用により「封止」(sealed)(ホスホジエステル結合を通して共有結合)し得る「ニック」(nick)(2本鎖DNA切断)を形成する。一方若しくは他方の鎖上のニックのいずれか又は両方は、封止され得る。熱力学的に、粘着末端を形成する分子の上鎖及び下鎖は、連結状態と解離状態との間で移行し得、したがって、粘着末端は、過渡的な形成であり得る。しかしながら、2つの成分間の粘着末端2本鎖の一方の鎖に沿ったニックが封止されると、その共有結合は、逆鎖のメンバが解離した場合でも残る。その場合、結合鎖は、逆鎖の意図される隣接メンバが結合し、封止し得るニックを再び形成することができる鋳型になり得る。
【0073】
[0088] 粘着末端は、1つ又は複数のエンドヌクレアーゼを用いてdsDNAを消化することにより作成され得る。エンドヌクレアーゼ(制限酵素と呼ばれ得る)は、dsDNA分子の片方又は両方の末端上の特定の部位(制限部位と呼ばれ得る)を標的とし得、互い違いの開裂を作成し(消化と呼ばれ得る)、したがって粘着末端を残し得る。消化は、パリンドローム突出(それ自体の逆相補鎖である配列を有する突出)を残し得る。その場合、同じエンドヌクレアーゼを用いて消化された2つの成分は、リガーゼを用いてそれらを組み立て得る相補的粘着末端を形成し得る。エンドヌクレアーゼ及びリガーゼが適合する場合、消化及びライゲーションは、同じ反応で一緒に行うことができる。反応は、4℃、10℃、16℃、25℃又は37℃等の均一な温度で生じ得る。又は、反応は、16℃~37℃等の複数の温度間で循環し得る。複数の温度間の循環により、サイクルの異なる部分中、消化及びライゲーションをそれぞれの最適温度で各々進めることが可能になり得る。
【0074】
[0089] 消化及びライゲーションを別々の反応で実行することが有益であり得る。例えば、所望のリガーゼ及び所望のエンドヌクレアーゼが異なる条件で最適に機能する場合である。又は、例えば、ライゲーションされた産物がエンドヌクレアーゼの新しい制限部位を形成する場合である。これらの場合、制限消化を実行してから、次いでライゲーションを別々に実行する方がよいことがあり、おそらくライゲーション前に制限酵素を除去することがさらに有益であり得る。核酸は、フェノール-クロロホルム抽出、エタノール沈殿、磁性ビーズ捕捉及び/又はシリカ膜吸着、洗浄及び溶出を通して酵素から単離され得る。同じ反応で複数のエンドヌクレアーゼが使用可能であるが、複数のエンドヌクレアーゼが互いに干渉せず、同様の反応条件下で機能することを保証することに注意を払うべきである。2つのエンドヌクレアーゼを使用する場合、直交(非相補性)粘着末端をdsDNA成分の両方の末端に作成し得る。
【0075】
[0090] エンドヌクレアーゼ消化は、リン酸化された5’末端を有する粘着末端を残すことになる。リガーゼは、リン酸化された5’末端でのみ機能し得、リン酸化されていない5’末端では機能しない。したがって、消化とライゲーションとの間に中間5’リン酸化ステップのいかなる必要性もなくてよい。パリンドローム突出を粘着末端に有する消化されたdsDNA成分は、それ自体にライゲーションし得る。自己ライゲーションを回避するために、ライゲーション前に前記dsDNA成分を脱リン酸化することが有益であり得る。
【0076】
[0091] 複数のエンドヌクレアーゼは、異なる制限部位を標的とし得るが、適合性の突出(互いの逆相補鎖である突出)を残し得る。2つのそのようなエンドヌクレアーゼを用いて作成された粘着末端のライゲーションの産物は、ライゲーション部位にいずれのエンドヌクレアーゼの制限部位も含まない、組み立てられた産物を生成し得る。そのようなエンドヌクレアーゼは、消化-ライゲーション反復サイクルを実行することにより、2つのみのエンドヌクレアーゼを使用して複数の成分をプログラム可能に組み立て得る、バイオブリックアセンブリ等の組立て方法の土台をなす。
図20は、適合性突出を有するエンドヌクレアーゼBamHI及びBglIIを使用した消化-ライゲーションサイクルの一例を示す。
【0077】
[0092] 幾つかの実施形態では、粘着末端の作成に使用されるエンドヌクレアーゼは、IIS型制限酵素であり得る。これらの酵素は、固定数の塩基を制限部位から特定の方向に離して開裂させ、したがって、それらが生成する突出の配列は、カスタマイズすることが可能である。突出配列は、パリンドロームである必要はない。同じIIS型制限酵素を同じ反応又は複数の反応で使用して、複数の異なる粘着末端を作成し得る。さらに、1つ又は複数のIIS型制限酵素を同じ反応又は複数の反応で使用して、適合性突出を有する成分を作成し得る。IIS型制限酵素により生成された2つの粘着末端間のライゲーション部位は、新しい制限部位を形成しないように設計され得る。加えて、IIS型制限酵素部位は、粘着末端を有する成分を生成するとき、制限酵素がそれ自体の制限部位を開裂するようにdsDNAに配置され得る。したがって、IIS型制限酵素から生成された複数の成分間のライゲーション産物は、いかなる制限部位も含まない。
【0078】
[0093] IIS型制限酵素は、反応においてリガーゼと一緒に混合されて、成分の消化及びライゲーションを一緒に実行し得る。反応の温度は、2つ以上の値間で循環して、最適な消化及びライゲーションを促進し得る。例えば、消化は、37℃で最適に実行され得、ライゲーションは、16℃で最適に実行され得る。より一般には、反応は、少なくとも0℃、5℃、10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃若しくは65℃又はそれを超える値の温度値間を循環し得る。消化及びライゲーション組合せ反応は、少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個又はそれを超える個数の成分を組み立てるために使用され得る。IIS型制限酵素を利用して粘着末端を作成するアセンブリ反応の例には、ゴールデンゲートアセンブリ(ゴールデンゲートクローニングとしても知られている)又はモジュラークローニング(MoCloとしても知られている)がある。
【0079】
[0094] ライゲーションの幾つかの実施形態では、エキソヌクレアーゼを使用して、粘着末端を有する成分を作成し得る。3’エキソヌクレアーゼを使用してdsDNAから3’末端を噛み返し(chew back)得、それにより5’突出を作成し得る。同様に、5’エキソヌクレアーゼを使用してdsDNAから5’末端を噛み返し得、それにより3’突出を作成し得る。異なるエキソヌクレアーゼは、異なる性質を有し得る。例えば、エキソヌクレアーゼは、ヌクレアーゼ活性の方向において(5’から3’に又は3’から5’に)、ssDNAに対して作用するか否か、リン酸化された5’末端に対して作用するか若しくはリン酸化されていない5’末端に対して作用するか、ニックで開始可能であるか否か又は活性を5’窪み、3’窪み、5’突出若しくは3’突出で開始可能であるか否かが異なり得る。異なるタイプのエキソヌクレアーゼとしては、ラムダエキソヌクレアーゼ、RecJf、エキソヌクレアーゼIII、エキソヌクレアーゼI、エキソヌクレアーゼT、エキソヌクレアーゼV、エキソヌクレアーゼVIII、エキソヌクレアーゼVII、ヌクレアーゼBAL_31、T5エキソヌクレアーゼ及びT7エキソヌクレアーゼが挙げられる。
【0080】
[0095] エキソヌクレアーゼを反応においてリガーゼと一緒に使用して、複数の成分を組み立て得る。反応は、固定温度で行われ得、各々がリガーゼ又はエキソヌクレアーゼのそれぞれに理想的な複数の温度間を循環され得る。ポリメラーゼをアセンブリ反応にリガーゼ及び5’→3’エキソヌクレアーゼと一緒に含め得る。そのような反応における成分は、互いに隣接して組み立てることが意図された成分がそれらの縁部に相同な配列を共有するように設計され得る。例えば、成分Yと組み立てられる成分Xは、5’-z-3’形態の3’縁配列を有し得、成分Yは、5’-z-3’形態の5’縁配列を有し得、ここで、zは、任意の核酸配列である。そのような形態の相同な縁配列は、「ギブソンオーバーラップ」と呼ばれ得る。5’エキソヌクレアーゼによりギブソンオーバーラップを有するdsDNA成分の5’末端が噛み返されると、互いにハイブリダイズする適合する3’突出が作成される。次いで、ハイブリダイズした3’末端がポリメラーゼの作用により鋳型成分の末端まで又は一方の成分の伸長した3’突出が隣接成分の5’窪みを満たす点まで伸長し、それによりリガーゼによってシールすることができるニックが形成され得る。ポリメラーゼ、リガーゼ及びエキソヌクレアーゼを一緒に使用するそのようなアセンブリ反応は、多くの場合、「ギブソンアセンブリ」と呼ばれる。ギブソンアセンブリは、T5エキソヌクレアーゼ、Phusionポリメラーゼ及びTaqリガーゼを使用し、反応を50℃でインキュベートすることにより実施され得る。前記例では、好熱性リガーゼであるTaqを使用することにより、反応における3つの型の酵素全てに適した温度である50℃で反応を進行させることが可能になる。
【0081】
[0096] 「ギブソンアセンブリ」という用語は、一般に、ポリメラーゼ、リガーゼ及びエキソヌクレアーゼが関与する任意の組立て反応を指し得る。ギブソンアセンブリは、少なくとも2個、3個、4個、5個、6個、7個、8個、9個若しくは10個又はそれを超える数の成分を組み立てるために使用され得る。ギブソンアセンブリは、1ステップの等温反応として又は1つ若しくは複数の温度インキュベーションを用いたマルチステップ反応として行うことができる。例えば、ギブソンアセンブリは、少なくとも30度、40度、50度、60度若しくは70度又はこれらの温度を上回る温度で行われ得る。ギブソンアセンブリのインキュベーション時間は、少なくとも1分、5分、10分、20分、40分又は80分であり得る。
【0082】
[0097] ギブソンアセンブリ反応は、意図される隣接成分間のギブソン重複が特定の長さであり、ヘアピン、ホモ二量体又は不要なヘテロ二量体等の望ましくないハイブリダイゼーション事象を回避する配列等の配列特徴を有する場合、最適に行われ得る。一般に、少なくとも20の塩基のギブソン重複が推奨される。しかし、ギブソン重複は、少なくとも1、2、3、5、10、20、30、40、50、60若しくは100又はそれを超える塩基長であり得る。ギブソン重複のGC含有率は、0%~100%の範囲であり得る。例えば、ギブソン重複のGC含有率は、0%~5%、5%~10%、10%~15%、15%~20%、20%~25%、25%~30%、30%~35%、35%~40%、40%~45%、45%~50%、50%~55%、55%~60%、60%~65%、65%~70%、70%~75%、75%~80%、80%~85%、85%~90%、90%~95%又は95%~100%であり得る。
【0083】
[0098] ギブソンアセンブリについて一般に5’エキソヌクレアーゼを用いて説明するが、反応は、3’エキソヌクレアーゼを用いて行うことも可能である。3’エキソヌクレアーゼは、dsDNA成分の3’末端を噛み返すため、ポリメラーゼは、3’末端を伸長することにより作用を相殺する。この動的プロセスは、2つの成分(ギブソンオーバーラップを共有する)の5’突出(エキソヌクレアーゼにより作成される)がハイブリダイズし、ポリメラーゼが、隣接成分の5’末端に遭遇するのに十分に遠くまで一方の成分の3’末端を伸長するまで続けられ得、それによりリガーゼによって封止し得るニックを残す。
【0084】
[0099] ライゲーションの幾つかの実施形態では、粘着末端を有する成分は、完全相補性を共有しない2つの単鎖核酸又はオリゴを一緒に混合することにより、酵素とは対照的に合成して作成することができる。
【0085】
[0100] 粘着末端ライゲーションにおけるオリゴの索引領域及びハイブリダイゼーション領域は、成分の適切な組立てを促進するように設計され得る。突出が長い成分は、突出が短い成分と比べて、所与のアニーリング温度で互いにより効率的にハイブリダイズされ得る。突出は、塩基少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個若しくは30個又はそれを超える個数分の長さを有し得る。
【0086】
[0101] 高いグアニン又はシトシン含有率を含む突出を有する成分は、低いグアニン又はシトシン含有率を含む突出を有する成分よりも、所与の温度で相補的成分に効率的にハイブリダイズされ得る。これは、アデニンがチミンと塩基対を形成するよりも、グアニンがシトシンと安定した塩基対を形成するためである。突出は、0%~100%の任意の値のグアニン又はシトシン含有率(GC含有率としても知られている)を有し得る。
【0087】
[0102] 突出配列と同様に、オリゴのGC含量及び索引領域の長さもライゲーション効率に影響を及ぼし得る。これは、各成分の上の鎖及び下の鎖が安定に結合していれば粘着末端成分がより効率的に組み立てることができるためである。したがって、より高いGC含量、より長い配列及びより高い融解温度を促進する他の特徴を有する索引領域を設計し得る。しかしながら、索引領域及び突出配列の両方に関して、ライゲーションアセンブリの効率に影響を及ぼし得るオリゴ設計の態様がさらに多く存在する。例えば、成分内での望ましくない二次構造の形成により、その意図された隣接成分と組み立てられた産物を形成するその能力が妨げられる恐れがある。これは、索引領域内、突出配列内又はその両方の二次構造に起因して起こり得る。これらの二次構造は、ヘアピンループを含み得る。オリゴの可能な二次構造の型及びそれらの安定性(例えば、融解温度)は、配列に基づいて予測され得る。設計空間検索アルゴリズムを使用して、有効な成分を形成するための適当な長さ及びGC含量の基準を満たすオリゴ配列を決定すると同時に、潜在的に阻害性の二次構造を有する配列を回避し得る。設計空間検索アルゴリズムは、遺伝的アルゴリズム、ヒューリスティック検索アルゴリズム、タブー検索のようなメタ-ヒューリスティック検索戦略、分枝限定検索アルゴリズム、動的プログラミングに基づくアルゴリズム、制約された組合せ最適化アルゴリズム、最急降下に基づくアルゴリズム、ランダム化検索アルゴリズム又はこれらの組合せを含み得る。
【0088】
[0103] 同様に、ホモ二量体(同じ配列のオリゴとハイブリダイズするオリゴ)及び望ましくないヘテロ二量体(それらの意図されたアセンブリパートナーに加えて他のオリゴとハイブリダイズするオリゴ)の形成により、ライゲーションが妨げられる恐れがある。成分内の二次構造と同様に、ホモ二量体及びヘテロ二量体の形成は、予測し、オリゴ設計中にコンピュータによる計算方法及び設計空間検索アルゴリズムを使用して説明することができる。
【0089】
[0104] オリゴ配列が長いほど又はGC含有率が高いほど、多くの不要な二次構造体、ホモ二量体及びヘテロ二量体がライゲーション反応内で作成され得る。したがって、幾つかの実施形態では、より短いオリゴ又はより低いGC含有率の使用は、より高いアセンブリ効率に繋がり得る。これらの設計原理は、より効率的なアセンブリに向けて長いオリゴ又は高いGC含有率を使用する設計戦略に対抗し得る。したがって、ライゲーションアセンブリ効率が最適化されるように、各成分を構成するオリゴに最適な長さ及び最適なGC含有率が存在し得る。ライゲーションで使用されるオリゴの全長は、少なくとも10、20、30、40、50、60、70、80、90、100個又は100を超える塩基であり得る。ライゲーションで使用されるオリゴの全体GC含有率は、0%~100%の範囲であり得る。例えば、ライゲーションで使用されるオリゴの全体GC含有率は、0%~5%、5%~10%、10%~15%、15%~20%、20%~25%、25%~30%、30%~35%、35%~40%、40%~45%、45%~50%、50%~55%、55%~60%、60%~65%、65%~70%、70%~75%、75%~80%、80%~85%、85%~90%、90%~95%又は95%~100%であり得る。
【0090】
[0105] 粘着末端ライゲーションに加えて、ライゲーションは、一本鎖核酸間でステープル(又は鋳型又は架橋)鎖を使用して行うこともできる。この方法は、ステープル鎖ライゲーション(SSL)、鋳型により導かれるライゲーション(TDL)又は架橋鎖ライゲーションと呼ぶことができる。TDLでは、2つの一本鎖核酸を鋳型上に隣接的にハイブリダイズさせ、したがってリガーゼによりシールすることができるニックを形成する。粘着末端ライゲーションと同じ核酸設計考慮事項がTDLにも当てはまる。鋳型と、それらの意図された相補的な核酸配列との間のより強力なハイブリダイゼーションにより、ライゲーション効率の上昇を導き得る。したがって、鋳型の両側でのハイブリダイゼーション安定性(又は融解温度)を改善する配列特徴により、ライゲーション効率を改善し得る。これらの特徴は、より長い配列の長さ及びより高いGC含量を含み得る。鋳型を含めたTDLにおける核酸の長さは、少なくとも5塩基、10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、70塩基、80塩基、90塩基若しくは100塩基又はそれよりも多くの塩基であり得る。鋳型を含め、核酸のGC含有率は、0%~100%の範囲であり得る。例えば、鋳型を含め、核酸のGC含有率は、0%~5%、5%~10%、10%~15%、15%~20%、20%~25%、25%~30%、30%~35%、35%~40%、40%~45%、45%~50%、50%~55%、55%~60%、60%~65%、65%~70%、70%~75%、75%~80%、80%~85%、85%~90%、90%~95%又は95%~100%であり得る。
【0091】
[0106] TDLでは、粘着末端ライゲーションと同様に、配列空間探索アルゴリズムを用いる核酸構造予測ソフトウェアを使用することにより、望ましくない二次構造を回避する成分及び鋳型配列を設計するために注意を払うことができる。TDLにおける成分は、二本鎖の代わりに一本鎖であり得るため、露出した塩基に起因して望ましくない二次構造の発生率がより高くなる可能性がある(粘着末端ライゲーションと比較して)。
【0092】
[0107] TDLは、平滑末端化されたdsDNA成分を用いて実行され得る。そのような反応では、ステープル鎖が2つの一本鎖核酸を適当に架橋するために、最初にステープルが完全な一本鎖相補鎖を置き換えるか又は部分的に置き換えることが必要であり得る。dsDNA成分を用いたTDL反応を容易にするために、dsDNAを最初に高温でインキュベートすることで融解させ得る。次いで、反応を冷却し、したがってステープル鎖がそれらの適当な核酸相補鎖にアニーリングすることを可能にし得る。このプロセスは、dsDNA成分と比較して比較的高い濃度の鋳型を使用することにより、さらに一層効率的なものにすることができ、したがって結合に関して鋳型が適当な全長ssDNA相補鎖に打ち勝つことが可能になる。2つのssDNA鎖がそれらの鋳型及びリガーゼにより組み立てられると、次いでその組み立てられた核酸が逆の全長ssDNA相補鎖の鋳型になり得る。したがって、TDLを用いた平滑末端化されたdsDNAのライゲーションを、融解(より高い温度でのインキュベーション)及びアニーリング(より低い温度でのインキュベーション)の複数のラウンドを通して改善し得る。このプロセスは、リガーゼサイクリング反応又はLCRと呼ぶことができる。適当な融解温度及びアニーリング温度は、核酸配列に依存する。融解温度及びアニーリング温度は、少なくとも4℃、10℃、20℃、20℃、30℃、40℃、50℃、60℃、70℃、80℃、90℃又は100℃であり得る。温度サイクルの数は、少なくとも1回、5回、10回、15回、20回、15回、30回又はそれを超え得る。
【0093】
[0108] 全てのライゲーションは、固定温度反応又は多重温度反応で実行され得る。ライゲーション温度は、少なくとも0℃、4℃、10℃、20℃、20℃、30℃、40℃、50℃若しくは60℃又はそれよりも高い温度であり得る。リガーゼ活性に最適な温度は、リガーゼの型に応じて異なり得る。さらに、反応において成分が隣り合う又はハイブリダイズする速度は、それらの核酸配列に応じて異なり得る。より高いインキュベーション温度により、より速い拡散を促進し、したがって成分が一時的に隣り合う又はハイブリダイズする頻度を増大させ得る。しかしながら、温度の上昇により、塩基対結合の破壊、したがってこれらの隣り合った又はハイブリダイズした成分2重鎖の安定性の低下も生じ得る。ライゲーションの最適な温度は、組み立てられる核酸の数、それらの核酸の配列、リガーゼの型並びに反応添加剤等の他の因子に依存し得る。例えば、4塩基の相補的な突出を有する2つの粘着末端成分は、4℃でT4リガーゼを用いると、25℃でT4リガーゼを用いるよりも速く組み立てることができる。しかしながら、25塩基の相補的な突出を有する2つの粘着末端成分は、25℃でT4リガーゼを用いると、4℃でT4リガーゼを用いるよりも速く組み立てることができ、またおそらく4塩基の突出をいずれの温度でライゲーションするよりも速く組み立てることができる。ライゲーションの幾つかの実施形態では、アニーリングのために、リガーゼの添加前に成分を加熱し、ゆっくりと冷却することが有益であり得る。
【0094】
[0109] ライゲーションを使用して、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20又はそれよりも多くの核酸を組み立て得る。ライゲーションインキュベーション時間は、最大で30秒間、1分間、2分間、5分間、10分間、20分間、30分間、1時間又はそれよりも長い時間であり得る。より長いインキュベーション時間により、ライゲーション効率を改善し得る。
【0095】
[0110] ライゲーションには、5’リン酸化末端を有する核酸が必要な場合がある。5’リン酸化末端を有さない核酸成分は、T4ポリヌクレオチドキナーゼ(又はT4 PNK)等のポリヌクレオチドキナーゼとの反応でリン酸化され得る。ATP、マグネシウムイオン又はDTT等の他の補因子が反応中に存在し得る。ポリヌクレオチドキナーゼ反応は、37℃で30分間行われ得る。ポリヌクレオチドキナーゼ反応温度は、少なくとも4℃、10℃、20℃、20℃、30℃、40℃、50℃又は60℃であり得る。ポリヌクレオチドキナーゼ反応のインキュベーション時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間又はそれよりも長い時間であり得る。代替的に、核酸成分は、修飾された5’リン酸化を用いて合成的に(酵素的なものとは対照的に)設計され、製造され得る。それらの5’末端に組み立てられる核酸のみにリン酸化が必要になり得る。例えば、TDLにおける鋳型は、組み立てられるものではないため、リン酸化されていなくてよい。
【0096】
[0111] ライゲーション効率を改善するために、添加剤をライゲーション反応に含め得る。例えば、ジメチルスルホキシド(DMSO)、ポリエチレングリコール(PEG)、1,2-プロパンジオール(1,2-Prd)、グリセロール、Tween-20又はこれらの組合せの添加である。PEG6000が特に有効なライゲーション増強剤であり得る。PEG6000は、クラウディング剤として作用することによりライゲーション効率を上昇させ得る。例えば、PEG6000は、リガーゼ反応溶液中の空間を占める凝集した小塊を形成し、リガーゼと成分とをより近づけ得る。添加剤含有量(体積当たりの重み)は、少なくとも0%、1%、5%、10%、20%又はそれを超え得る。
【0097】
[0112] 種々のリガーゼがライゲーションに使用可能である。リガーゼは、天然に存在するもの又は合成されたものであり得る。リガーゼの例としては、T4 DNAリガーゼ、T7 DNAリガーゼ、T3 DNAリガーゼ、Taq DNAリガーゼ、9oN(商標)DNAリガーゼ、大腸菌(E. coli)DNAリガーゼ及びSplintR DNAリガーゼが挙げられる。異なるリガーゼは、異なる温度で安定に及び最適に機能し得る。例えば、Taq DNAリガーゼは、熱安定性であり、T4 DNAリガーゼは、熱安定性ではない。さらに、異なるリガーゼは、異なる性質を有する。例えば、T4 DNAリガーゼは、平滑末端化されたdsDNAをライゲーションすることができるが、T7 DNAリガーゼは、平滑末端化されたdsDNAをライゲーションすることができない。
【0098】
[0113] ライゲーションを使用して、シーケンシングアダプタを核酸のライブラリに付着させ得る。例えば、ライゲーションは、核酸ライブラリの各メンバの末端の共通の粘着末端又はステープルを用いて実行され得る。核酸の一方の末端の粘着末端又はステープルが他方の末端のものと区別可能な場合、シーケンシングアダプタを非対称にライゲーションすることができる。例えば、フォワードシーケンシングアダプタを核酸ライブラリのメンバの一方の末端にライゲーションすることができ、リバースシーケンシングアダプタを核酸ライブラリのメンバの他方の末端にライゲーションし得る。代替的に、平滑末端化されたライゲーションを使用して、アダプタを、平滑末端化された二本鎖核酸のライブラリに付着させ得る。フォークアダプタを使用して、各末端で均等な平滑末端又は粘着末端のいずれかを有する核酸ライブラリにアダプタを非対称に付着させ得る(例えば、A尾部等)。
【0099】
[0114] ライゲーションは、熱失活(例えば、65℃で少なくとも20分間のインキュベーション)、変性剤の添加又はEDTA等のキレート剤の添加により阻害され得る。
【0100】
C.制限消化
[0115] 制限消化は、制限エンドヌクレアーゼ(又は制限酵素)が核酸上のそれらの同類の制限部位を認識し、その後、前記制限部位を含有する核酸を開裂する(又は消化する)反応である。I型、II型、III型又はIV型制限酵素を制限消化のために使用し得る。II型制限酵素は、核酸消化のための最も効率的な制限酵素であり得る。II型制限酵素は、パリンドローム制限部位を認識し、認識部位内の核酸を開裂し得る。前記制限酵素(及びそれらの制限部位)の例としては、AatII(GACGTC)、AfeI(AGCGCT)、ApaI(GGGCCC)、DpnI(GATC)、EcoRI(GAATTC)、NgeI(GCTAGC)及びさらに多くが挙げられる。DpnI及びAfeI等の幾つかの制限酵素は、それらの制限部位を中央で切断し得、したがって平滑末端化されたdsDNA産物が残される。EcoRI及びAatII等の他の制限酵素は、それらの制限部位を中心から外れて切断し、したがって粘着末端(又はねじれ型の末端)を有するdsDNA産物が残される。幾つかの制限酵素は、不連続の制限部位を標的とし得る。例えば、制限酵素AlwNIは、制限部位CAGNNNCTGを認識し、ここで、Nは、A、T、C又はGのいずれかであり得る。制限部位は、長さ少なくとも2塩基、4塩基、6塩基、8塩基、10塩基又はそれよりも多くの塩基であり得る。
【0101】
[0116] 幾つかのII型制限酵素は、それらの制限部位の外側の核酸を開裂する。この酵素は、IIS型又はIIG型制限酵素に下位分類され得る。前記酵素は、パリンドロームでない制限部位を認識し得る。前記制限酵素の例としては、GAAACを認識し、2塩基(同じ鎖)及び6塩基(逆の鎖)だけさらに下流にねじれ型開裂を作成するBbsIが挙げられる。別の例としては、GGTCTCを認識し、1塩基(同じ鎖)及び5塩基(逆の鎖)だけさらに下流にねじれ型開裂を作成するBsaIが挙げられる。前記制限酵素は、ゴールデンゲートアセンブリ又はモジュラークローニング(MoClo)に使用され得る。BcgI(IIG型制限酵素)等の幾つかの制限酵素は、その認識部位の両方の末端にねじれ型開裂を作成し得る。制限酵素は、それらの認識部位から少なくとも1塩基、5塩基、10塩基、15塩基、20塩基又はそれよりも遠く離れた核酸を開裂し得る。前記制限酵素は、それらの認識部位の外側でねじれ型開裂を作成し得るため、得られる核酸突出の配列を任意に設計し得る。これは、得られる核酸突出の配列が制限部位の配列とカップリングする、それらの認識部位内にねじれ型開裂を作成する制限酵素とは対照的である。制限消化により作成される核酸突出は、長さ少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基又はそれよりも多くの塩基であり得る。制限酵素により核酸を開裂する場合、得られる5’末端は、リン酸を含む。
【0102】
[0117] 1つ又は複数の核酸配列を制限消化反応に含め得る。同様に、1つ又は複数の制限酵素を一緒に制限消化反応に使用し得る。制限消化は、カリウムイオン、マグネシウムイオン、ナトリウムイオン、BSA、S-アデノシル-L-メチオニン(SAM)又はこれらの組合せを含めた添加剤及び補助因子を含み得る。制限消化反応は、37℃で1時間インキュベートされ得る。制限消化反応は、少なくとも0℃、10℃、20℃、30℃、40℃、50℃又は60℃の温度でインキュベートされ得る。最適な消化温度は、酵素に依存し得る。制限消化反応は、最大で1分間、10分間、30分間、60分間、90分間、120分間又はそれよりも長くインキュベートされ得る。より長いインキュベーション時間により、消化の増大をもたらし得る。
【0103】
D.核酸増幅
[0118] 核酸増幅は、ポリメラーゼ連鎖反応又はPCRを用いて実行され得る。PCRでは、核酸の出発プール(鋳型プール又は鋳型と呼ばれる)は、ポリメラーゼ、プライマー(短い核酸プローブ)、ヌクレオチド三リン酸(例えば、dATP、dTTP、dCTP、dGTP及びその類似体又はバリアント等)並びにベタイン、DMSO及びマグネシウムイオン等の追加的な補助因子及び添加剤と組み合わされ得る。鋳型は、一本鎖核酸又は二本鎖核酸であり得る。プライマーは、鋳型プール中の標的配列に相補的であり、ハイブリダイズするように合成的に構築された短い核酸配列であり得る。典型的には、PCR反応には2種のプライマーが存在し、一方は、標的鋳型の上の鎖のプライマー結合部位に相補であり、他方は、第1の結合部位よりも下流の、標的鋳型の下の鎖のプライマー結合部位に相補的である。これらのプライマーがそれらの標的に結合する5’から3’への配向は、それらの間の核酸配列を問題なく複製し、指数関数的に増幅するために互いに向かい合っていなければならない。「PCR」とは、典型的には、特に前記形態の反応を指し得るが、より一般的にはあらゆる核酸増幅反応を指すためにも使用され得る。
【0104】
[0119] 幾つかの実施形態では、PCRは、3つの温度:融解温度、アニーリング温度及び伸長温度間を循環させることを含み得る。融解温度は、二本鎖核酸を一本鎖核酸に変え、ハイブリダイゼーション産物及び二次構造の形成を除去することを目的とするものである。典型的には、融解温度は、高く、例えば95℃を超える。幾つかの実施形態では、融解温度は、少なくとも96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃又は105℃であり得る。他の実施形態では、融解温℃は、最大で95℃、94℃、93℃、92℃、91℃又は90℃であり得る。融解温度が高いほど、核酸及びそれらの二次構造の解離が改善されるが、核酸又はポリメラーゼの分解等の副作用も引き起こされる恐れがある。融解温度は、少なくとも1秒間、2秒間、3秒間、4秒間、5秒間又はそれよりも長く、例えば30秒間、1分間、2分間又は3分間にわたって反応に適用され得る。複雑な又は長い鋳型を用いたPCRには、より長い最初の融解温度ステップが推奨される場合がある。
【0105】
[0120] アニーリング温度は、プライマーとそれらの標的鋳型との間のハイブリダイゼーションの形成を容易にすることを目的とするものである。幾つかの実施形態では、アニーリング温度は、プライマーの算出された融解温度と対応し得る。他の実施形態では、アニーリング温度は、前記融解温度から10℃又はそれよりも高い温度以内であり得る。幾つかの実施形態では、アニーリング温度は、少なくとも25℃、30℃、50℃、55℃、60℃、65℃又は70℃であり得る。融解温度は、プライマーの配列に依存し得る。プライマーが長いほど、融解温度が高くなり得、グアニン又はシトシンヌクレオチドのパーセント含有量が高いプライマーほど、融解温度が高くなり得る。したがって、特定のアニーリング温度で最適に組み立てるように意図されたプライマーを設計することが可能であり得る。アニーリング温度は、少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間若しくは30秒間にわたって又はそれよりも長く反応に適用され得る。アニーリングを確実にすることを補助するために、プライマー濃度を高くするか又は量を飽和させ得る。プライマー濃度は、500ナノモル(nM)であり得る。プライマー濃度は、最大で1nM、10nM、100nM、1000nM又はそれよりも高い濃度であり得る。
【0106】
[0121] 伸長温度は、1つ又は複数のポリメラーゼ酵素により触媒されるプライマーの3’末端核酸鎖伸長を開始させ、容易にすることを目的とするものである。幾つかの実施形態では、伸長温度は、ポリメラーゼが核酸結合強度、伸長速度、伸長安定性又は忠実度に関して最適に機能する温度に設定され得る。幾つかの実施形態では、伸長温度は、少なくとも30℃、40℃、50℃、60℃若しくは70℃又はそれよりも高い温度であり得る。アニーリング温度は、少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間、30秒間、40秒間、50秒間若しくは60秒間にわたって又はそれよりも長く反応に適用され得る。推奨される伸長時間は、予測される伸長の1キロベース当たりおよそ15~45秒間であり得る。
【0107】
[0122] PCRの幾つかの実施形態では、アニーリング温度及び伸長温度は、同じであり得る。したがって、2ステップ温度サイクルを3ステップ温度サイクルの代わりに使用し得る。複合アニーリング及び伸長温度の例としては、60℃、65℃又は72℃が挙げられる。
【0108】
[0123] 幾つかの実施形態では、PCRは、1つの温度サイクルで実行され得る。そのような実施形態は、標的化された一本鎖鋳型核酸を二本鎖核酸に変えることを伴い得る。他の実施形態では、PCRは、複数の温度サイクルで実行され得る。PCRが効率的であれば、各サイクルで標的核酸分子の数が2倍になり、それにより元の鋳型プールからの標的化された核酸鋳型の数の指数関数的な増加が生じることが予想される。PCRの効率は、変動し得る。したがって、各ラウンドで複製される標的化された核酸の実際のパーセントは、100%より多い又は少ないことがある。各PCRサイクルで変異した及び組み換えられた核酸等の望ましくないアーチファクトが導入される恐れがある。この潜在的な害を縮小するために、忠実度が高く、処理能力が高いポリメラーゼを使用し得る。さらに、限られた数のPCRサイクルを使用し得る。PCRは、最大で1、5、10、15、20、25、30、35、40、45又はそれよりも多くのサイクルを伴い得る。
【0109】
[0124] 幾つかの実施形態では、複数の別個の標的核酸配列は、1つのPCRで一緒に増幅され得る。各標的配列が共通のプライマー結合部位を有する場合、全ての核酸配列は、同じプライマーセットを用いて増幅され得る。代替的に、PCRは、各々が別個の核酸を標的とすることが意図された複数のプライマーを含み得る。前記PCRは、多重PCRと呼ぶことができる。PCRは、最大で1個、2個、3個、4個、5個、6個、7個、8個、9個、10個又はそれよりも多くの別個のプライマーを伴い得る。複数の別個の核酸標的を有するPCRでは、各PCRサイクルにより、標的化された核酸の相対的な分布が変化する可能性がある。例えば、均一な分布が歪んだ又は非均一に分布したものになる可能性がある。この潜在的な害を縮小するために、最適なポリメラーゼ(例えば、高忠実度及び配列頑強性を有する)及び最適なPCR条件を使用し得る。アニーリング及び伸長の温度及び時間等の因子を最適化し得る。さらに、限られた数のPCRサイクルを使用し得る。
【0110】
[0125] PCRの幾つかの実施形態では、鋳型中のその標的化プライマー結合部位に対して塩基ミスマッチを有するプライマーを使用して標的配列を変異させ得る。PCRの幾つかの実施形態では、5’末端に余分の配列(突出として知られている)を有するプライマーを使用して、その標的化された核酸に配列を付着させ得る。例えば、5’末端にシーケンシングアダプタを含有するプライマーを使用して、シーケンシングのための核酸ライブラリを調製及び/又は増幅し得る。特定のシーケンシング技術のための十分な富化のために、シーケンシングアダプタを標的とするプライマーを使用して核酸ライブラリを増幅し得る。
【0111】
[0126] 幾つかの実施形態では、プライマーが鋳型の一方の鎖のみ(両方の鎖ではなく)標的とする場合、線形PCR(又は非対称PCR)が使用される。線形PCRでは、各サイクルから複製される核酸は、プライマーと相補的なものではなく、したがって、プライマーは、その核酸に結合しない。したがって、プライマーは、各サイクルで元の標的鋳型のみを複製し、したがって線形(指数関数的なものとは対照的な)増幅になる。線形PCRからの増幅は、従来の(指数関数的な)PCRほど高速でない可能性があるが、最大収率は、より大きい可能性がある。理論的に、線形PCRにおけるプライマー濃度は、従来のPCRでそうなるようなサイクルの増加及び収率の上昇での制限因子にはならない。指数関数的増幅後線形増幅PCR(又はLATE-PCR)は、特に高収率を可能にし得る線形PCRの改変バージョンである。
【0112】
[0127] 核酸増幅の幾つかの実施形態では、融解、アニーリング及び伸長のプロセスは、単一の温度で行われ得る。そのようなPCRは、等温性PCRと呼ぶことができる。等温性PCRでは、プライマー結合に有利になるように十分に相補的な核酸の鎖を互いから解離させるか又は置き換えるために温度に依存しない方法を活用し得る。この戦略としては、ループ媒介性等温増幅、鎖置換増幅、ヘリカーゼ依存性増幅法及びニッキング酵素増幅反応が挙げられる。等温性核酸増幅は、最大で20℃、30℃、40℃、50℃、60℃若しくは70℃又はそれよりも高い温度で行われ得る。
【0113】
[0128] 幾つかの実施形態では、PCRは、サンプル中の核酸の量を数量化するために蛍光プローブ又は色素をさらに含み得る。例えば、色素は、二本鎖核酸に挿入され得る。前記色素の例は、SYBR Greenである。蛍光プローブは、蛍光単位が付着した核酸配列であり得る。蛍光単位は、プローブが標的核酸とハイブリダイズし、その後、伸長ポリメラーゼ単位から修飾されると放出され得る。前記プローブの例としては、TaqManプローブが挙げられる。そのようなプローブをPCR及び光学的測定ツール(励起及び検出のための)と併せて使用して、試料中の核酸濃度を数量化し得る。このプロセスは、定量的PCR(qPCR)又はリアルタイムPCR(rtPCR)と呼ぶことができる。
【0114】
[0129] 幾つかの実施形態では、PCRは、複数の鋳型分子のプールに対してではなく、単一の分子鋳型に対して(単一分子PCRと呼ぶことができるプロセスで)実行され得る。例えば、エマルジョン-PCR(ePCR)を使用して、単一の核酸分子を油エマルジョン中の水滴中に封入し得る。水滴は、PCR試薬も含み得、水滴を、PCRのための必要な温度サイクリングが可能な温度調節された環境で保持し得る。このように、複数の自蔵式PCR反応を同時に高スループットで行い得る。界面活性物質を用いて油エマルジョンの安定性を改善し得る。マイクロ流体チャネルを通して圧力を用いて液滴の動きを制御し得る。マイクロ流体デバイスは、液滴を作成し、液滴を分割し、液滴を同化させ、材料を液滴中に注入し、及び液滴をインキュベートするために使用され得る。油エマルジョン中の水滴のサイズは、少なくとも1ピコリットル(pL)、10pL、100pL、1ナノリットル(nL)、10nL、100nL又はそれよりも大きいサイズであり得る。
【0115】
[0130] 幾つかの実施形態では、単一分子PCRは、固相基板上で実行され得る。例としては、Illumina固相増幅法又はその変形形態が挙げられる。鋳型プールを固相基板に暴露させ、固相基板は、鋳型を特定の空間分解能で固定化することができるものである。次いで、各鋳型の空間的近傍でブリッジ増幅を行い、それにより単一分子を基板上において高スループットで増幅し得る。
【0116】
[0131] 高スループット単一分子PCRは、互いに妨げる可能性がある別個の核酸のプールを増幅するために有用であり得る。例えば、複数の別個の核酸が共通配列領域を共有する場合、この共通領域に沿った核酸間の組換えがPCR反応中に起こり、その結果、新しい組み換えられた核酸がもたらされ得る。単一分子PCRでは、別個の核酸配列が互いに区画化され、したがって相互作用することができないため、この潜在的な増幅エラーが防止される。単一分子PCRは、シーケンシングのための核酸を調製するために特に有用であり得る。単一分子PCRは、鋳型プール中の幾つかの標的の絶対的定量化のためにも有用であり得る。例えば、デジタルPCR(又はdPCR)では、別個の単一分子PCR増幅シグナルの頻度を使用して、サンプル中の出発核酸分子の数を推定する。
【0117】
[0132] PCRの幾つかの実施形態では、全ての核酸に共通するプライマー結合部位に対するプライマーを使用し、核酸の群を非差別的に増幅し得る。例えば、プライマー結合部位に対するプライマーは、プール中の全ての核酸に隣接している。これらの共通部位を一般的な増幅に用いて合成核酸ライブラリを作成又は組み立て得る。しかしながら、幾つかの実施形態では、PCRを使用し得、それにより、例えばプライマーを、前記標的化された核酸のサブセットにおいてのみ存在するプライマー結合部位と使用することにより、標的化された核酸のサブセットをプールから選択的に増幅し得る。合成核酸ライブラリは、サブライブラリをより一般的なライブラリから選択的に増幅するために、目的の潜在的サブライブラリに属する核酸の全てがそれらの端部に共通のプライマー結合部位を共有する(サブライブラリ中では共通するが、他のサブライブラリとは別個)ように作成されるか又は組み立てられ得る。幾つかの実施形態では、PCRを核酸アセンブリ反応(例えば、ライゲーション又はOEPCR等)と組み合わせて、完全に組み立てられた又は潜在的に完全に組み立てられた核酸を、部分的に組み立てられた又は誤って組み立てられた(又は意図されたものではない若しくは望ましくない)副産物から選択的に増幅し得る。例えば、アセンブリは、核酸を各縁配列上のプライマー結合部位と、完全に組み立てられた核酸産物のみが増幅のための必須の2つのプライマー結合部位を含むように組み立てることを伴い得る。前記例では、部分的に組み立てられた産物は、プライマー結合部位を有する縁配列のいずれも含まない又はその一方のみを含む可能性があり、したがって増幅されないはずである。同様に、誤って組み立てられた(又は意図されたものではない若しくは望ましくない)産物は、縁配列のいずれも含まないか若しくはその一方のみを含むか又は両方の縁配列を含むが、誤った配向である若しくは誤った量の塩基により分離されている。したがって、前記誤って組み立てられた産物は、増幅されないか又は増幅されて誤った長さの産物が作成されるはずである。後者の場合、誤った長さの増幅された誤って組み立てられた産物は、正しい長さの増幅された完全に組み立てられた産物から、アガロースゲルでのDNA電気泳動、その後のゲル抽出等の核酸サイズ選択方法により分離され得る。
【0118】
[0133] 核酸増幅の効率を改善するために、PCRに添加剤を含め得る。例えば、ベタイン、ジメチルスルホキシド(DMSO)、非イオン性界面活性剤、ホルムアミド、マグネシウム、ウシ血清アルブミン(BSA)又はこれらの組合せの添加である。添加剤含有量(体積当たりの重み)は、少なくとも0%、1%、5%、10%、20%又はそれを超え得る。
【0119】
[0134] 種々のポリメラーゼがPCRに使用可能である。ポリメラーゼは、天然に存在するもの又は合成されたものであり得る。ポリメラーゼの例は、Φ29ポリメラーゼ又はその誘導体である。幾つかの場合、新しい核酸配列を構築するために、転写酵素又はリガーゼ(即ち結合の形成を触媒する酵素)がポリメラーゼと併せて又はポリメラーゼの代替として使用される。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、耐熱性ポリメラーゼ、野生型ポリメラーゼ、修飾ポリメラーゼ、大腸菌(E. coli)DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(ファイ29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ、ES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、白金Taqポリメラーゼ、Tbrポリメラーゼ、Phusionポリメラーゼ、KAPAポリメラーゼ、Q5ポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’から5’へのエキソヌクレアーゼ活性を有するクレノウ断片ポリメラーゼ並びにそのバリアント、修飾産物及び誘導体が挙げられる。異なるポリメラーゼは、異なる温度で安定に及び最適に機能し得る。さらに、異なるポリメラーゼは、異なる性質を有する。例えば、Phusionポリメラーゼのような一部のポリメラーゼは、核酸伸長中、より高い忠実度に寄与し得る3’から5’へのエキソヌクレアーゼ活性を示し得る。ポリメラーゼによっては、伸長中にリーディング配列を動かし得るものもあれば、それらを分解し得るか又は伸長を停止し得るものもある。Taqのような一部のポリメラーゼは、アデニン塩基を核酸配列の3’末端に組み入れる。さらに、一部のポリメラーゼは、他のポリメラーゼよりも高い忠実度及び処理能力を有し得、増幅された核酸収率のために最小の変異を有することが重要である場合及び別個の核酸の分布のために増幅全体を通して均一な分布を維持することが重要である場合のシーケンシング調製等のPCR適用により適切であり得る。
【0120】
E.サイズ選択
[0135] サイズ選択技法を使用して特定のサイズの核酸をサンプルから選択し得る。幾つかの実施形態では、サイズ選択は、ゲル電気泳動又はクロマトグラフィを使用して実行され得る。核酸の液体サンプルは、固定相又はゲル(又はマトリックス)の一方の電極にロードされ得る。ゲルの負極は、核酸サンプルがロードされる電極になり、ゲルの陽極が逆の電極になるようにゲルにわたって電圧差をかけ得る。核酸は、負に荷電したリン酸骨格を有するため、ゲルにわたって陽極に移動することができる。核酸のサイズにより、核酸がゲルを通る相対的な移動速度が決まる。したがって、サイズが異なる核酸は、ゲル上でそれらが移動するにつれて分解されることになる。電圧差は、100V又は120Vであり得る。電圧の差異は、最大で50V、100V、150V、200V、250V又はそれよりも大きい差異であり得る。電圧の差異が大きいほど、核酸移動の速度及びサイズ分解能が大きくなり得る。しかしながら、電圧差が大きいと、核酸又はゲルの損傷も生じ得る。より大きいサイズの核酸を分解するために、より大きい電圧の差異が推奨される場合がある。典型的な移動時間は、15分間~60分間であり得る。移動時間は、最大で10分間、30分間、60分間、90分間、120分間又はそれよりも長い時間であり得る。より高い電圧と同様に、より長い移動時間により、より良好な核酸分解能を導くことができるが、核酸損傷の増大が導かれ得る。より大きいサイズの核酸を分解するために、より長い移動時間が推奨される場合がある。例えば、200塩基の核酸を250塩基の核酸から分解するために、120Vの電圧の差異及び30分の移動時間で十分であり得る。
【0121】
[0136] ゲル又はマトリックスの性質は、サイズ選択プロセスに影響を及ぼし得る。ゲルは、典型的には、TAE(トリス-酢酸-EDTA)又はTBE(トリス-ホウ酸-EDTA)等の伝導性緩衝剤中に分散したアガロース又はポリアクリルアミド等のポリマー物質を含む。ゲル中の物質(例えば、アガロース又はアクリルアミド)の含有量(体積当たりの重み)は、最大で5%、1%、2%、3%、5%、10%、15%、20%、25%又はそれを超え得る。含有量が高いほど、移動速度が低下し得る。より小さい核酸を分解するために、より高い含有量が好ましい場合がある。二本鎖DNA(dsDNA)を分解するためにアガロースゲルがより良好であり得る。一本鎖DNA(ssDNA)を分解するためにポリアクリルアミドゲルがより良好であり得る。好ましいゲル組成物は、核酸型及びサイズ、添加剤(例えば、色素、染料、変性溶液又はローディング緩衝剤)の適合性並びに先行する下流の適用(例えば、ゲル抽出、次いでライゲーション、PCR又はシーケンシング)に依存し得る。アガロースゲルは、ゲル抽出に関してポリアクリルアミドゲルよりも単純であり得る。抽出プロセスにおけるホウ酸(酵素阻害剤)持ち越し汚染により下流の酵素反応が阻害される可能性があるため、TAEは、TBEほど良好な伝導体ではないが、同様にゲル抽出に関してより良好であり得る。
【0122】
[0137] ゲルは、SDS(ドデシル硫酸ナトリウム)又は尿素等の変性溶液をさらに含み得る。SDSは、例えば、タンパク質を変性させるか、又は核酸を潜在的に結合したタンパク質から単離するために使用され得る。尿素は、DNAの二次構造を変性させるために使用され得る。例えば、尿素により、dsDNAをssDNAに変換し得るか、又は尿素により、フォールディングされたssDNA(例えば、ヘアピン)を、フォールディングされていないssDNAに変換し得る。ssDNAを正確に分解するために尿素-ポリアクリルアミドゲル(TBEをさらに含む)を使用し得る。
【0123】
[0138] サンプルは、ゲルに異なる形式で組み入れることができる。幾つかの実施形態では、ゲルは、サンプルを手動でロードし得るウェルを含み得る。1つのゲルは、複数の核酸サンプルを流すための複数のウェルを有し得る。他の実施形態では、ゲルは、核酸サンプルを自動的にロードするマイクロ流体チャネルに付着され得る。各ゲルは、幾つかのマイクロ流体チャネルの下流にあり得、ゲル自体が別々のマイクロ流体チャネルを占有し得る。ゲルの寸法が核酸検出(又は可視化)の感度に影響を及ぼし得る。例えば、薄いゲル又はマイクロ流体チャネルの内側にあるゲル(例えば、バイオアナライザ又はテープステーション中のもの等)により、核酸検出の感度を改善し得る。核酸検出ステップは、正しいサイズの核酸断片を選択し、抽出するために重要であり得る。
【0124】
[0139] 核酸サイズ参照のためにゲルにラダーをロードし得る。ラダーは、核酸サンプルを比較し得る種々のサイズのマーカーを含み得る。異なるラダーは異なるサイズ範囲及び分解能を有し得る。例えば、50塩基のラダーは、50塩基、100塩基、150塩基、200塩基、250塩基、300塩基、350塩基、400塩基、450塩基、500塩基、550塩基及び600塩基のところにマーカーを有し得る。前記ラダーは、50塩基から600塩基のサイズ範囲内の核酸を検出し、選択するのに有用であり得る。ラダーは、サンプル中の種々のサイズの核酸の濃度を推定するための標準物質として使用することもできる。
【0125】
[0140] 核酸サンプル及びラダーは、ローディング緩衝剤と混合されて、ゲル電気泳動(又はクロマトグラフィ)プロセスを容易にし得る。ローディング緩衝剤は、核酸の移動の追跡を補助するための色素及びマーカーを含み得る。ローディング緩衝剤は、核酸サンプルがサンプルロードウェル(ランニング緩衝剤中に浸され得る)の底部に沈むことを確実にするために、ランニング緩衝剤(例えば、TAE又はTBE)よりも密度の高い試薬(例えば、グリセロール等)をさらに含み得る。ローディング緩衝剤は、SDS又は尿素等の変性剤をさらに含み得る。ローディング緩衝剤は、核酸の安定性を改善するための試薬をさらに含み得る。例えば、ローディング緩衝剤は、核酸をヌクレアーゼから保護するためのEDTAを含み得る。
【0126】
[0141] 幾つかの実施形態では、ゲルは、核酸に結合し、異なるサイズの核酸を光学的に検出するために使用し得る染料を含み得る。染料は、dsDNA、ssDNA又はその両方に特異的なものであり得る。異なる染料を異なるゲル物質に適合させ得る。幾つかの染料は、可視化のために光源光(又は電磁波)からの励起を必要とし得る。光源光は、UV(紫外線)又は青色光であり得る。幾つかの実施形態では、染料をゲルに電気泳動前に添加し得る。他の実施形態では、染料をゲルに電気泳動後に添加し得る。染料の例としては、臭化エチジウム(EtBr)、SYBR Safe、SYBR Gold、銀染色又はメチレンブルーが挙げられる。特定のサイズのdsDNAを可視化するための信頼できる方法は、例えば、アガロースTAEゲルをSYBR Safe又はEtBr染色と一緒に使用することであり得る。特定のサイズのssDNAを可視化するための信頼できる方法は、例えば、尿素-ポリアクリルアミドTBEゲルをメチレンブルー又は銀染色と一緒に使用することであり得る。
【0127】
[0142] 幾つかの実施形態では、ゲルを通る核酸の移動は、電気泳動に加えて他の方法により駆動され得る。例えば、重力、遠心分離、真空又は圧力を使用して、核酸を駆動してゲルを通し、その結果、それらの核酸をサイズに応じて分解し得る。
【0128】
[0143] 刃又は剃刀を使用して特定のサイズの核酸をゲルから抽出して、核酸を含有するゲルのバンドを切り出し得る。切り出しが特定のバンドで的確に行われること及び切り出しにより、異なる望ましくないサイズのバンドに属し得る核酸が問題なく排除されることを確実にするために、適当な光学的検出技法及びDNAラダーを使用し得る。ゲルバンドを緩衝剤と一緒にインキュベートしてゲルバンドを融解させ、したがって核酸を緩衝液中に放出させ得る。加熱又は物理的撹拌により、融解の速度を上げ得る。代替的に、ゲルバンドを、緩衝剤中において、ゲル融解を必要とせずにDNAの緩衝液中への拡散を可能にするために十分に長くインキュベートし得る。次いで、緩衝剤を残りの固相ゲルから例えば吸引又は遠心分離により分離し得る。次いで、核酸を、フェノール-クロロホルム抽出、エタノール沈殿、磁気ビーズ捕捉及び/又はシリカ膜吸着等の標準の精製又は緩衝剤交換技法、洗浄並びに溶出を使用して溶液から精製し得る。このステップで核酸を濃縮することもできる。
【0129】
[0144] ゲル切り出しの代替として、特定のサイズの核酸をゲルから流出させることによりゲルから単離し得る。移動している核酸は、ゲルに埋め込まれたか又はゲルの最後にあるたらい(又はウェル)を通過し得る。移動プロセスについて時間を計るか又は光学的にモニタリングし、それにより特定のサイズの核酸群がたらいに入ったとき、サンプルがたらいから収集される。収集は、例えば、吸引により行われ得る。次いで、核酸は、収集された溶液からフェノール-クロロホルム抽出、エタノール沈殿、磁気ビーズ捕捉及び/又はシリカ膜吸着等の標準の精製又は緩衝剤交換技法、洗浄並びに溶出を使用して精製され得る。このステップで核酸を濃縮することもできる。
【0130】
[0145] 核酸サイズ選択のための他の方法としては、質量分光測定又は膜に基づく濾過を挙げることができる。膜に基づく濾過の幾つかの実施形態では、核酸は、dsDNA、ssDNA又はその両方に優先的に結合し得る膜(例えば、シリカ膜)を通過される。膜は、少なくとも特定のサイズの核酸を優先的に捕捉するように設計され得る。例えば、膜を、20塩基未満、30塩基未満、40塩基未満、50塩基未満、70塩基未満、90塩基未満又はそれよりも多くの塩基未満の核酸を濾過して取り除くように設計し得る。前記膜に基づくサイズ選択技法は、ゲル電気泳動又はクロマトグラフィほどストリンジェントでないことがある。
【0131】
[0146] 幾つかの実施形態では、全長識別子は、構造差に基づいて、組み立てられていない成分又は組み立てが不完全な識別子断片から精製される。線形末端が露出された、組み立てられていない成分及び組み立てが不完全な識別子断片が選択的に分解される一方、構造的に一意(以下を参照されたい)である全長識別子が保護されるように、エキソヌクレアーゼを使用することができる。
【0132】
[0147] 幾つかの実施形態では、全長識別子は、線形末端を含まないように、末端(例えば、ヘアピン構造を含むように設計された末端成分)がヘアピンでキャップされる。幾つかの実施形態では、全長識別子は、末端成分の互いへのライゲーションを介して環状化される。幾つかの実施形態では、全長識別子は、末端成分に適合する粘着末端を含むプラスミド構造体にライゲーションする。
【0133】
[0148] 全長識別子は、両末端アフィニティキャプチャ又はハイブリダイゼーション法を用いて、組み立てられていない成分又は組み立てが不完全な識別子断片から精製することができる。幾つかの実施形態では、識別子の各末端は、アフィニティキャプチャで使用することができる異なる部分で修飾される。例えば、識別子の一方の末端は、ビオチンで修飾され得、他方の末端は、ジゴキシゲニンで修飾され得る。全長識別子は、ストレプトアビジン被覆ビーズを使用し(一方の末端を捕捉する)、続けて抗ジゴキシゲニンビーズを使用(他方の末端を捕捉する)してシーケンシャルキャプチャを実行することによって分離され得る。
【0134】
[0149] 幾つかの実施形態では、捕捉プローブ(識別子のタンパク質と相補的な配列を有するオリゴ)を使用して全長識別子をハイブリダイズすることができる。これらの捕捉プローブは、ストレプトアビジンビーズ又は抗ジゴキシゲニンビーズを使用して全長識別子に結合したプローブを捕捉することができるように、ビオチン又はジゴキシゲニン等の部分で修飾することができる。プローブは、オリゴdTを含み得、標的核酸分子は、オリゴdAテールを含む。プローブは、プローブアフィニティキャプチャによって捕捉され得る部分を有し得る。その部分は、ビオチン、デスチオビオチン、TEG-ビオチン、光切断可能なビオチン、フルオレセイン又はジゴキシゲニンであるか又はそれを含み得、プローブアフィニティキャプチャは、ストレプトアビジン被覆ビーズ、フルオレセイン抗体ビーズ又はジゴキシゲニン抗体ビーズによって実施される。
【0135】
F.核酸捕捉
[0150] 親和性タグ付き核酸は、核酸捕捉のための配列特異的なプローブとして使用され得る。プローブは、核酸のプール内の標的配列と相補的になるように設計され得る。続けて、プローブは、核酸プールと一緒にインキュベートされ、その標的とハイブリダイズされ得る。インキュベーション温度は、ハイブリダイゼーションを容易にするためにプローブの融解温度を下回るようにし得る。インキュベーション温度は、プローブの融解温度を5℃下回る温度まで、10度下回る温度まで、15度下回る温度まで、20度下回る温度まで、25度下回る温度まで又はそれを大きく下回るまでであり得る。ハイブリダイズされた標的は、親和性タグに特異的に結合する固相基板に捕捉され得る。固相基板は、膜、ウェル、カラム又はビーズであり得る。複数のラウンドの洗浄により、ハイブリダイズしなかった核酸は、全て標的から除去され得る。洗浄は、洗浄中の標的配列の安定な固定化を容易にするために、プローブの融解温度を下回る温度で行われ得る。洗浄温度は、プローブの融解温度を5℃下回る温度まで、10℃下回る温度まで、15℃下回る温度まで、20℃下回る温度まで、25℃下回る温度まで、又はそれを大きく下回る温度までであり得る。最終的な溶出ステップにより、核酸標的を固相基板及び親和性タグ付きプローブから収集し得る。溶出ステップは、核酸標的の溶出緩衝剤中への放出を容易にするためにプローブの融解温度を上回る温度で行われ得る。溶出温度は、プローブの融解温度を5℃上回る温度まで、10℃上回る温度まで、15℃上回る温度まで、20℃上回る温度まで、25℃上回る温度まで又はそれを大きく上回る温度までであり得る。
【0136】
[0151] 特定の実施形態では、固相基板に結合したオリゴヌクレオチドは、例えば、酸、塩基、酸化、還元、熱、光、金属イオン触媒作用、置換反応若しくは脱離反応化学又は酵素的開裂等の条件に対する暴露により固相基板から除去され得る。特定の実施形態では、オリゴヌクレオチドは、開裂可能な連結部分を通して固相支持体に付着し得る。例えば、固相基板を官能化して、標的化オリゴヌクレオチドに共有結合するための開裂可能なリンカーを提供し得る。幾つかの実施形態では、リンカー部分は、6原子以上の長さのリンカーであり得る。幾つかの実施形態では、開裂可能リンカーは、TOPS(1合成当たり2個のオリゴヌクレオチドの)リンカー、アミノリンカー又は光開裂可能リンカーであり得る。
【0137】
[0152] 幾つかの実施形態では、ビオチンは、固相基板上のストレプトアビジンにより固定化される親和性タグとして使用され得る。ビオチン化オリゴヌクレオチドは、核酸捕捉プローブとして使用するように設計され、製造され得る。オリゴヌクレオチドの5’末端又は3’末端をビオチン化することができる。オリゴヌクレオチドの内部のチミン残基をビオチン化することもできる。オリゴ上のビオチンを増加させることにより、ストレプトアビジン基板でのより強力な捕捉をもたらし得る。オリゴの3’末端のビオチンにより、PCR中にオリゴが伸長することを遮断し得る。ビオチンタグは、標準のビオチンのバリアントであり得る。例えば、ビオチンバリアントは、ビオチン-TEG(トリエチレングリコール)、二重ビオチン、PCビオチン、デスチオビオチン-TEG及びビオチンアジ化物/アジドであり得る。二重ビオチンは、ビオチン-ストレプトアビジン親和性を増大させ得る。ビオチン-TEGは、TEGリンカーで分離された核酸上のビオチン基に付着する。これにより、ビオチンが核酸プローブの機能、例えばその標的とのハイブリダイゼーションに干渉することを防止し得る。核酸ビオチンリンカーをプローブに付着させることもできる。核酸リンカーは、標的とハイブリダイズすることが意図されていない核酸配列を含み得る。
【0138】
[0153] ビオチン化核酸プローブは、その標的にどのように良好にハイブリダイズすることができるかを考慮して設計され得る。融解温度を高く設計された核酸プローブは、それらの標的により強力にハイブリダイズされ得る。より長い核酸プローブ及びGC含量がより高いプローブは、融解温度が上昇するため、より強力にハイブリダイズされ得る。核酸プローブは、少なくとも5塩基、10塩基、15塩基、20塩基、30塩基、40塩基、50塩基若しくは100塩基又はそれよりも多くの塩基の長さを有し得る。核酸プローブは、0%~100%のいずれかのGC含量を有し得る。プローブの融解温度がストレプトアビジン基板の温度許容度を超えないことを確実にするために注意を払い得る。核酸プローブは、オフターゲットの核酸を有するヘアピン、ホモ二量体及びヘテロ二量体等の阻害性二次構造が回避されるように設計され得る。プローブ融解温度とオフターゲットの結合との間にトレードオフが存在し得る。融解温度が高く、オフターゲットの結合が低い最適なプローブの長さ及びGC含量が存在し得る。合成核酸ライブラリは、その核酸が効率的なプローブ結合部位を含むように設計され得る。
【0139】
[0154] 固相ストレプトアビジン基板は、磁気ビーズであり得る。磁気ビーズは、磁気ストリップ又はプレートを使用して固定化され得る。磁気ストリップ又はプレートを容器と接触させて、磁気ビーズを容器に固定化する。逆に、磁気ストリップ又はプレートを容器から取り出して、磁気ビーズを容器壁から溶液中に放出させ得る。異なるビーズの性質がそれらの適用に影響を及ぼし得る。ビーズは、種々のサイズを有し得る。例えば、ビーズは、直径1マイクロメートル(μm)~3マイクロメートル(μm)のいずれかであり得る。ビーズは、最大で1マイクロメートル、2マイクロメートル、3マイクロメートル、4マイクロメートル、5マイクロメートル、10マイクロメートル、15マイクロメートル、20マイクロメートル又はそれを超える直径を有し得る。ビーズ表面は、疎水性又は親水性であり得る。ビーズは、遮断性タンパク質、例えばBSAでコーティングされ得る。使用前に、ビーズが核酸に非特異的に結合することを防止するために、ビーズを洗浄するか又は遮断性溶液等の添加剤で前処理し得る。
【0140】
[0155] ビオチン化プローブは、磁性ストレプトアビジンビーズとカップリングした後、核酸サンプルプールと一緒にインキュベートされ得る。このプロセスは、直接捕捉と呼ぶことができる。代替的に、ビオチン化プローブを核酸サンプルプールと一緒にインキュベートした後、磁性ストレプトアビジンビーズを添加し得る。このプロセスは、間接的な捕捉と呼ぶことができる。間接的な捕捉方法により、標的の収率を改善し得る。核酸プローブが短いほど、磁気ビーズにカップリングするために必要な時間量を少なくし得る。
【0141】
[0156] 核酸プローブと核酸サンプルとの最適なインキュベーションは、プローブの融解温度を1~10℃又はそれを大きく下回る温度で行われ得る。インキュベーション温度は、最大で5℃、10℃、20℃、30℃、40℃、50℃、60℃、70℃、80℃又はそれよりも高い温度であり得る。推奨されるインキュベーション時間は、1時間であり得る。インキュベーション時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間、90分間、120分間又はそれよりも長い時間であり得る。インキュベーション時間が長いほど、良好な捕捉効率を導くことができる。ビオチン-ストレプトアビジンカップリングを可能にするために、ストレプトアビジンビーズの添加後にさらに10分間のインキュベーションを行い得る。この追加的な時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間、90分間、120分間又はそれよりも長い時間であり得る。インキュベーションは、ナトリウムイオン等の添加剤を伴う緩衝液中で行われ得る。
【0142】
[0157] 核酸プールが一本鎖核酸である場合(二本鎖とは対照的に)、プローブとその標的とのハイブリダイゼーションを改善し得る。ssDNAプールをdsDNAプールから調製するには、一般にプール中の全ての核酸配列の端部に結合する1つのプライマーを用いて線形PCRを実施することが必要になり得る。核酸プールが合成により作成又は組み立てられたものである場合、この共通のプライマー結合部位を合成設計に含め得る。線形PCRの産物は、ssDNAになる。核酸捕捉のためのより多くの出発ssDNA鋳型をより多くの線形PCRのサイクルで生成し得る。
【0143】
[0158] 核酸プローブがそれらの標的とハイブリダイズされ、磁性ストレプトアビジンビーズとカップリングされた後、ビーズを磁石により固定化し、幾つかのラウンドの洗浄を行い得る。非標的核酸を除去するために3~5回の洗浄で十分であり得るが、それよりも多い又は少ないラウンドの洗浄を使用し得る。増やした洗浄の各々により、標的化されていない核酸をさらに減少させ得るが、標的核酸の収率も低下し得る。洗浄ステップ中の標的核酸とプローブとの適当なハイブリダイゼーションを容易にするために、低いインキュベーション温度を使用し得る。60℃、50℃、40℃、30℃、20℃、10℃若しくは5℃又はそれよりも低い低温を使用し得る。洗浄緩衝剤は、ナトリウムイオンを伴うトリス緩衝液を含み得る。
【0144】
[0159] ハイブリダイズした標的の磁気ビーズカップリングプローブからの最適な溶出は、プローブの融解温度以上の温度で行われ得る。温度が高いほど、標的のプローブからの解離が容易になる。溶出温度は、最大で30℃、40℃、50℃、60℃、70℃、80℃若しくは90℃又はそれよりも高い温度であり得る。溶出インキュベーション時間は、最大で1分間、2分間、5分間、10分間、30分間、60分間又はそれよりも長い時間であり得る。典型的なインキュベーション時間は、およそ5分間であり得るが、より長いインキュベーション時間により収率を改善し得る。溶出緩衝剤は、EDTA等の添加剤を伴う水又はトリス緩衝液であり得る。
【0145】
[0160] 別個の部位のセットの少なくとも1つ又は複数を含有する標的配列の核酸捕捉は、それらの部位の各々に対して複数の別個のプローブを用いて1つの反応で実行され得る。別個の部位のセットのあらゆるメンバを含む標的配列の核酸捕捉は、その特定の部位に対するプローブを使用して別個の各部位に対して1つの反応である一連の捕捉反応で実行され得る。一連の捕捉反応後の標的の収率は、低い可能性があるが、その後、捕捉された標的をPCRで増幅し得る。核酸ライブラリが合成により設計されたものである場合、標的は、PCRのために共通のプライマー結合部位を有するように設計され得る。
【0146】
[0161] 一般的な核酸捕捉のために、共通のプローブ結合部位を有する合成核酸ライブラリを作成又は組み立て得る。これらの共通部位は、完全に組み立てられた又は潜在的に完全に組み立てられた核酸をアセンブリ反応から選択的に捕捉し、それにより部分的に組み立てられた又は誤って組み立てられた(又は意図されたものではない若しくは望ましくない)副産物を濾過して取り除くために使用され得る。例えば、アセンブリは、完全に組み立てられた核酸産物のみが、各プローブを使用した一連の2つの捕捉反応を通過するのに必要な必須の2つのプローブ結合部位を含むように、各縁配列にプローブ結合部位を有する核酸を組み立てることを含み得る。前記例では、部分的に組み立てられた産物は、プローブ部位のいずれも含有しないか又は一方のみを含み得、したがって最終的に捕捉されないはずである。同様に、誤って組み立てられた(又は意図されたものではない若しくは望ましくない)産物も、縁配列のいずれも含まない又はその一方のみを含み得る。したがって、前記誤って組み立てられた産物は、最終的に捕捉されない。ストリンジェンシーを増大させるために、アセンブリの各成分に共通のプローブ結合部位を含め得る。各成分に対してプローブを使用したその後の一連の核酸捕捉反応により、完全に組み立てられた産物(各成分を含む)のみをアセンブリ反応のあらゆる副産物から単離し得る。その後のPCRにより、標的富化を改善することができ、その後のサイズ選択により、標的ストリンジェンシーを改善し得る。
【0147】
[0162] 幾つかの実施形態では、核酸捕捉を使用して、標的化された核酸のサブセットをプールから選択的に捕捉し得る。例えば、前記標的化された核酸のサブセットにおいてのみ存在する結合部位を有するプローブを使用することによるものである。合成核酸ライブラリは、サブライブラリをより一般的なライブラリから選択的に捕捉するために、目的の潜在的なサブライブラリに属する核酸の全てが共通のプローブ結合部位を共有する(サブライブラリ内で共通であるが、他のサブライブラリとは別個)ように作成又は組み立てることができる。
【0148】
G.凍結乾燥
[0163] 凍結乾燥は、脱水プロセスである。核酸及び酵素の両方を凍結乾燥し得る。凍結乾燥された物質は、より長い寿命を有し得る。凍結乾燥プロセスを通して機能的産物(例えば、活性酵素)を維持するために、化学的安定剤等の添加剤を使用し得る。スクロース及びトレハロース等の二糖を化学的安定剤として使用し得る。
【0149】
H.DNA設計
[0164] 合成ライブラリ(例えば、識別子ライブラリ)を構築するための核酸の配列(例えば、成分)は、合成、シーケンシング及びアセンブリの複雑化が回避されるように設計され得る。さらに、配列は、合成ライブラリの構築費用が低減され、及び合成ライブラリを保管することができる寿命が改善されるように設計され得る。
【0150】
[0165] 核酸は、合成するのが難しい場合がある長いホモポリマーの列(又は反復塩基配列)が回避されるように設計され得る。核酸は、2を超える、3を超える、4を超える、5を超える、6を超える、7を超える又はそれよりも長いホモポリマーの長さが回避されるように設計され得る。さらに、核酸は、それらの合成プロセスを阻害する恐れがあるヘアピンループ等の二次構造の形成が回避されるように設計され得る。例えば、予測ソフトウェアを使用して、安定な二次構造を形成しない核酸配列を生成し得る。合成ライブラリを構築するための核酸は、短く設計され得る。核酸が長いほど、合成が難しく、費用がかかる恐れがある。核酸が長いほど、合成間の変異の機会も増大する。核酸(例えば、成分)は、最大で5塩基、10塩基、15塩基、20塩基、25塩基、30塩基、40塩基、50塩基、60塩基又はそれよりも多くの塩基であり得る。
【0151】
[0166] アセンブリ反応の成分になる核酸は、そのアセンブリ反応が容易になるように設計され得る。効率的なアセンブリ反応は、典型的には、隣接成分間のハイブリダイゼーションを含む。配列は、これらのオンターゲットのハイブリダイゼーション事象が促進されると同時に、潜在的なオフターゲットのハイブリダイゼーションが回避されるように設計され得る。ロックド核酸(LNA)等の核酸塩基修飾を使用して、オンターゲットのハイブリダイゼーションを強化し得る。これらの修飾核酸は、例えば、ステープル鎖ライゲーションにおけるステープルとして又は粘着鎖ライゲーションにおける粘着末端として使用され得る。合成核酸ライブラリ(又は識別子ライブラリ)を構築するために使用することができる他の修飾塩基としては、2,6-ジアミノプリン、5-ブロモdU、デオキシウリジン、反転dT、反転ジデオキシ-T、ジデオキシ-C、5-メチルdC、デオキシイノシン、Super T、Super G又は5-ニトロインドールが挙げられる。核酸は、1つ又は複数の同じ又は異なる修飾塩基を含み得る。前記修飾塩基の幾つかは、より高い融解温度を有し、したがってアセンブリ反応において特異的なハイブリダイゼーション事象を容易にするために有用であり得る天然の塩基類似体(例えば、5-メチルdC及び2,6-ジアミノプリン)である。前記修飾塩基の幾つかは、全ての天然の塩基に結合することができ、したがって望ましい結合部位内に可変配列を有し得る核酸とのハイブリダイゼーションを容易にするために有用であり得るユニバーサル塩基(例えば、5-ニトロインドール)である。アセンブリ反応におけるそれらの有益な役割に加えて、これらの修飾塩基は、プライマー及びプローブの核酸のプール内のそれらの標的核酸との特異的な結合を容易にするため、プライマー(例えば、PCR用)及びプローブ(例えば、核酸捕捉用)に有用であり得る。
【0152】
[0167] 核酸は、シーケンシングが容易になるように設計され得る。例えば、核酸は、二次構造、一続きのホモポリマー、反復配列及びGC含有率が高すぎるか又は低すぎる配列等の典型的なシーケンシング複雑化が回避されるように設計され得る。特定のシークエンサ又はシーケンシング方法は、エラープローンであり得る。合成ライブラリ(例えば、識別子ライブラリ)を構成する核酸配列(又は成分)は、互いからの特定のハミング距離で設計され得る。このように、シーケンシングにおいて塩基分解能エラーが高い率で生じる場合でも、エラーを含む配列の一続きをなおそれらの最も可能性がある核酸(又は成分)にマッピングして戻すことができる。核酸配列は、少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基又はそれよりも多くの塩基の変異のハミング距離で設計され得る。ハミング距離の代替距離メトリックを使用して、設計される核酸間の最小の必要距離を規定することもできる。
【0153】
[0168] 幾つかのシーケンシング方法及び計器では、アダプタ配列又はプライマー結合部位等の特定の配列を含有させるために入力核酸が必要になり得る。これらの配列は、「方法特異的配列」と呼ぶことができる。前記シーケンシング計器及び方法の典型的な予備的ワークフローは、方法特異的配列を核酸ライブラリと組み立てることを含み得る。しかしながら、合成核酸ライブラリ(例えば、識別子ライブラリ)が特定の計器又は方法でシーケンシングされることが事前に分かっている場合、これらの方法特異的配列は、ライブラリ(例えば、識別子ライブラリ)を含む核酸(例えば、成分)中に設計され得る。例えば、合成核酸ライブラリのメンバ自体が個々の核酸成分から組み立てられるのと同じ反応ステップで合成核酸ライブラリのメンバ上にシーケンシングアダプタを組み立て得る。
【0154】
[0169] 核酸は、DNA損傷を容易にし得る配列が回避されるように設計され得る。例えば、部位特異的ヌクレアーゼに対する部位を含有する配列を回避し得る。別の例として、UVB(紫外線-B)光により、隣接するチミンがピリミジン二量体を形成し、次いでそれによりシーケンシング及びPCRが阻害されることが引き起こされ得る。したがって、合成核酸ライブラリがUVBに暴露される環境で保管されることが意図されている場合、その核酸配列を隣接するチミン(即ちTT)が回避されるように設計することが有益であり得る。
【0155】
識別子ライブラリを構築するシステム
[0170] 上述したように、プリンタ-フィニッシャシステム(又はPFS)として知られるプリントベースのシステムを使用して、識別子を構築するために成分を同じ位置に配置して組み立て得る。
【0156】
[0171] 本明細書に提供されるのは、情報を記憶するために1つ又は複数の成分から識別子を組み立てるシステムであり、システムは、(a)1つ又は複数の成分を基板上に分注するプリンタであって、1つ又は複数の成分の各々は、核酸配列を含む、プリンタと、(b)前記1つ又は複数の成分を前記基板上に組み立てるフィニッシャであって、前記フィニッシャは、1つ又は複数の核酸配列を物理的にリンクさせるために必要な反応混合物及び/又は条件を提供する、フィニッシャとを含む。
【0157】
[0172] 幾つかの実施形態では、前記プリンタは、複数のプリントヘッドをさらに含み、前記複数のうちの各プリントヘッドは、1つ又は複数の成分を含む。幾つかの実施形態では、前記プリンタは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20又はそれよりも多くのプリントヘッドを含む。幾つかの実施形態では、前記複数のうちの各プリントヘッドは、異なる成分を含む。幾つかの実施形態では、各プリントヘッドは、少なくとも1つのノズルを含む。幾つかの実施形態では、各プリントヘッドは、ノズル行を含む。幾つかの実施形態では、各プリントヘッドは、少なくとも1、2、3、4又はそれを超える数の行のノズルを含む。幾つかの実施形態では、プリントヘッドは、同じインクを各々分注するノズルのセットと見なすことができる。幾つかの実施形態では、ノズル行は、同じインクを分注する。幾つかの実施形態では、ノズル行中のノズルの特定のサブセットは、前記ノズル行中の他のノズルと異なるインクを分注する。幾つかの実施形態では、ノズル行は、少なくとも20、40、60、80、100、150、200、250、300、350、400又はそれを超える数のノズルを含む。幾つかの実施形態では、ノズル行中のノズルの一部又は全ては、別々であり得る。幾つかの実施形態では、前記プリントヘッドは、前記成分を含む液滴を前記基板上に分注する。幾つかの実施形態では、前記プリントヘッドは、反応混合物含む液滴を前記基板上に分注する。幾つかの実施形態では、前記液滴は、少なくとも1、2、3、4、5、6、7、8、9又は10ピコリットル容量である。幾つかの実施形態では、前記液滴は、少なくとも10、20、30、40、50、60、70又は80ピコリットル容量である。幾つかの実施形態では、前記プリンタは、プリンタベースをさらに含む。幾つかの実施形態では、前記プリンタは、レジスタ、スポットイメージャ及び/又はスポット乾燥器をさらに含む。幾つかの実施形態では、前記1つ又は複数の成分は、溶液中にある。幾つかの実施形態では、前記1つ又は複数の成分は、乾燥成分である。幾つかの実施形態では、前記反応混合物は、リガーゼを含む。リガーゼは、核酸配列を含む異なる成分のライゲーションに使用することができる。幾つかの実施形態では、前記条件は、温度条件である。幾つかの実施形態では、前記基板は、線形運動で前記プリンタ及び/又は前記フィニッシャに通される。幾つかの実施形態では、前記線形運動は、リールツーリールシステムによって制御される。幾つかの実施形態では、前記スポットイメージャは、カメラである。幾つかの実施形態では、前記1つ又は複数の成分は、染料をさらに含む。幾つかの実施形態では、前記反応混合物は、染料を含む。染料は、任意の核酸染料であり得る。染料は、可視染料であり得る。
【0158】
[0173] 幾つかの実施形態では、前記基板は、ポリマー材料をさらに含む。幾つかの実施形態では、前記プリントヘッドは、MEMS(微小電気機械システム)薄膜圧電インクジェットヘッド又はMEMSサーマルインクジェットヘッドである。幾つかの実施形態では、前記1つ又は複数の成分は、添加剤を含む。幾つかの実施形態では、添加剤は、前記プリントヘッドとの前記1つ又は複数の成分の適合性を提供する。幾つかの実施形態では、添加剤は、溶質、保水剤、界面活性剤である。幾つかの実施形態では、前記スポットイメージャは、ラインスキャン検査原理を使用する。幾つかの実施形態では、前記フィニッシャは、フィニッシャベースをさらに含む。
【0159】
[0174] 幾つかの実施形態では、前記フィニッシャは、スポット加湿器、スポットイメージャ及び/又はプーリングサブシステムをさらに含む。幾つかの実施形態では、前記フィニッシャは、プリントヘッドをさらに含む。幾つかの実施形態では、前記フィニッシャのプリントヘッドは、少なくとも1pL、5pL、10pL、50pL、100pL又は200pLの容量を分注する。幾つかの実施形態では、前記フィニッシャは、反応インキュベーションに最適な一定内部温度を有する。幾つかの実施形態では、前記フィニッシャは、ローラのループを含む。
【0160】
プリンタベースシステム
[0175] PFSは、それぞれ1つ又は複数の核酸分子を基板上にプリントすることが可能な1つ又は複数のプリントヘッドの使用を含む。生成される識別子ライブラリを所与として、所与のビットストリームを符号化する全ての識別子を組み立てるタスクは、サブタスクに分割され得、各サブタスクは、識別子ライブラリの一部分を生成することを含む。この部分は、識別子ライブラリの「セクタ」と呼ぶことができる。セクタのサイズは、PFSによるセクタの生成における任意のエラーをPFSによって検出又は補正することができるように選択することができる。エラーは、限定されないが、プリントヘッドの誤作動、プリント中若しくはプリント後の成分の意図しない混合、プリントヘッドによって分注される試薬量若しくは核酸量のばらつき、プリントヘッドと基板上の標的座標(若しくはスポット)との位置合わせずれ又は高湿度若しくは低湿度に起因した乾燥若しくは湿潤を含む幾つかの原因によって生じ得る。これらの原因によっては、生成される1つ又は複数の識別子が生成されないエラーに繋がるものがある。この種類のエラーは、識別子欠損エラーと呼ぶことができる。
【0161】
[0176] 原因に応じて、幾つかの識別子欠損エラーは、PFSによって検出され得る。例えば、PFSは、1つ又は複数のカメラを使用して、プリントされたセクタの全て又は一部分を自動的に検査し得る。PFSは、プリントされた各セクタの1つ又は複数の画像を常時又はプログラム可能な間隔で捕捉し、それらの画像に計算処理を受けさせて、指定された各反応が基板上にプリントされたか否かを検出し得る。別の実施形態では、PFSは、1つ又は複数のプリントヘッドの1つ又は複数のノズルを常時又はプログラム可能な間隔で監視し、反応を基板にプリントする際、ノズルの画像又は映像を捕捉し得る。PFSは、捕捉された映像又は画像に画像処理を受けさせて、意図された全ての試薬及び核酸液滴が反応に届けられたか否かを検出し得る。監視カメラは、可視光又は他の周波数帯域の光を使用し得る。別の実施形態では、PFSは、全てのプリントヘッドの全てのノズルから1つ又は複数のテストパターンを基板のテストエリアに定期的にプリントし得る。PFSは、スポットイメージャ、カメラ又は解析に適した出力を有する何らかの他のデバイスを用いてテストパターンプリントの結果を視覚的に捕捉又は解析し得る。別の実施形態では、PFSは、テストパターンをプリントし、例えばゲル電気泳動等の1つ又は複数の化学的検証方法を使用してテストパターンを解析し得る。
【0162】
[0177] 視覚的解析後、指定された全ての識別子を組み立てるために必要な幾つか又は全ての成分が反応にプリントされなかったとPFSが結論付けた場合、PFSは、この結論をエラーログに報告し得る。PFSを制御する制御ソフトウェアは、プリント中に常時又は後にこのログを解析し、そのような識別子欠損エラーを含むセクタの再プリントを選択し得る。ログから、制御ソフトウェアは、誤作動しているプリントヘッド又はノズルを識別し、スペアのプリントヘッド又はノズルを使用して残りのセクタをプリントし得る。一実施形態では、制御ソフトウェアは、不完全はセクタが最終的な識別子ライブラリに含まれないように、下流の処理ステップから、識別子欠損エラーを有するセクタを除外することもできる。
【0163】
[0178] 組み立てられる識別子ライブラリは、仕様ファイルのセットを介して指定され、PFSに送信される。生成される識別子ライブラリは、ブロックと呼ばれるより小さい単位のセットで指定し得る。仕様ファイルは、DNA成分から識別子ライブラリを組み立てるために使用されるスキームと、スキーム固有パラメータのリストと、ブロック仕様ファイル名のリストとを含む書き込み使用ファイルを含む。ブロック仕様は、ブロックメタデータファイル及びブロックデータファイルを含み得る。ブロックメタデータファイルは、ブロックの長さ、ハッシュ及び他のコンストラクタ定義のパラメータ等、ブロックについての情報を記述する。ブロックデータファイルは、PFSによって生成される識別子のセットを指定する。ブロックデータファイルは、データ圧縮アルゴリズムを使用して圧縮することができる。ブロックを含む識別子は、限定されないが、ツリー、トライ、リスト又はビットマップ等のシリアル化されたデータ構造の形態で指定され得る。
【0164】
[0179] 例えば、製品スキームを使用して生成される識別子ライブラリは、成分ライブラリ区画スキームを含むブロックメタデータファイルと、各層で使用可能な成分の名前のリストとを用いて指定され得る。ブロックデータファイルは、シリアル化されたトライデータ構造として生成、編成される識別子を含み得、このデータ構造では、トライのルートからリーフまでの各パスが識別子を表し、パスに沿った各ノードは、その識別子のその層で使用される成分名を指定する。ブロックデータファイルは、ルートから始まる順にトライをトラバースし、各ノードの左の子ノードに行き、それからノード自体に行き、次いで右の子ノードに行くことにより、このトライをシリアル化することを含み得る。
【0165】
[0180] PFSは、仕様ファイルの入力について入力キューを監視し得る。新しい仕様が検出されると、PFSは、書き込み仕様を読み取り、適切なプリントヘッド又はノズルに供給される必要な成分をそれ自体にプログラムし得る。PFSは、ブロックベタデータ及びデータファイルを読み取り、それらを処理してプリントヘッドのプリント命令を生成し得る。PFSは、各ブロックのこれらの命令をプリントヘッドに送信し、各セクタのステータス情報をプリントヘッドから取得し得る。正しくプリントすることができなかったか又は完全にはプリントすることができなかったセクタは、ログに報告することができ、自動的に再プリントすることができる。
【0166】
例示的なPFS
[0181]
図1は、インクジェットプリント、例えばサーマルインクジェットプリント、バブルインクジェットプリント及び圧電インクジェットプリントを使用して、成分からDNA識別子を迅速及び高スループットで組み立てることにより、デジタル情報をDNAに記憶するシステムを示す。以下で「プリンタ-フィニッシャシステム」又はPFSと呼ばれるシステム及びその異なる実施形態は、2つのサブシステム:プリンタ120及びフィニッシャ130を含み得る。幾つかの実施形態では、2つのサブシステム120、130が取り付けられ得、個々の機能で互いに依存し得る。他の実施形態では、2つのサブシステム120、130は、別々であり、独立して機能することが可能であり得る。
【0167】
[0182] プリンタ120は、プリントヘッド122の行を含み、各プリントヘッド122は、溶液中にDNA成分(若しくはコンポーネント)又は幾つかの実施形態では乾燥したDNA成分を含む。別個のDNA成分の各水溶液は、「インク」又は「色」と呼ぶことができる。プリントヘッド122は、pL規模の液滴を基板(又はウェブ又はウェビング)の座標上にプログラムによって分注され得る(オンデマンドで)。座標は、直径/間隔1マイクロメートル(μm)、直径/間隔10μm、直径/間隔50μm、直径/間隔100μm、直径/間隔150μm、直径/間隔200μm又はそれを超える直径/間隔であり得る。プリンタシステム120への入力は、水性成分/基板を含む。プリンタシステム120からの出力は、基板上の乾燥した多層スポットを含む。プリンタ120の環境は、乾燥(蒸発)であり得る。
【0168】
[0183] フィニッシャ130は、成分を組み立てて識別子にするために反応混合物(例えば、リガーゼ混合物)を分注する機器部品(例えば、プリントヘッド)を含む。フィニッシャシステム130への入力、フィニッシャ130は、反応混合物を基板(又はウェブ又はウェビング)の各座標上に分注し得る。フィニッシャ130は、次いで、反応をインキュベートし得、それにより組み立てを可能にし、それから組み立てられた識別子を基板から単一のプール132に統合し得る。幾つかの実施形態では、反応混合物は、フィニッシャではなく、プリンタの一環として分注され得る。他の実施形態では、反応混合物は、DNA成分の前に各座標に分注され得る。幾つかの実施形態では、可視染料を反応混合物に組み込み得る。
【0169】
[0184] 基板(又はウェブ)136は、線形(一次元)運動でプリンタ及びフィニッシャを自動的に通り得る。一定速度の線形運動は、リールトゥリールシステム(ローラトゥローラ)134を用いて達成され得る。幾つかの実施形態では、一定速度の線形運動は、ウェビングの再循環又は連続ウェビングを用いて達成され得る。幾つかの実施形態では、一定速度の線形運動は、かたつむりパスに従うウェビングを使用して達成され得る。例えば、
図7を参照されたい。幾つかの実施形態では、一定速度の線形運動は、螺旋パスに従うウェビングを使用して達成され得る。幾つかの実施形態では、一定速度の線形運動は、180°ツイストパスに従うウェビングを使用して達成され得る。例えば、ウェビングは、システムを用いて各ローラで180°ターンし、ウェビングは、表を上にして全てのロールを通過する。他の実施形態では、基板は、固定され得、プリントヘッドは、2つの次元で(例えば、ラスタパターンで)基板の上を移動し得る。
【0170】
[0185]
図2は、プリンタサブシステム120をより詳細に示す。プリンタベース121は、プリントエンジン122、スポットイメージャ126及びスポット乾燥器128をホストするウェブ駆動装置を有するプリンタベースを含む。プリントエンジンは、アドレッシングスキームをサポートするようにプリント及びオーバープリントする。プリントエンジン122は、プリントヘッドを含み得る。プリントヘッドは、異なる成分をウェブ136上の異なる座標にオーバープリント、配置又は重ねるように設計される。単一のノズル、単一のプリントヘッド、複数のノズル、複数のプリントヘッド又はそれらの任意の組合せは、成分を同じ座標上にオーバープリントし得る。プリントヘッドに加えて、プリンタは、任意選択的に、レジスタ124、スポットイメージャ126及びスポット乾燥器128を含み得る。
【0171】
[0186] レジストレーションは、スポット整列を含む(マルチパスシステムの場合)。レジスタ124は、基板の座標とプリントヘッドとの整列を維持することを目的とする。これは、レジスタが基板の動きをリアルタイムで追跡できるようにする特殊な印を基板に付けることにより達成され得る。他の実施形態では、見当合わせ(registration)は、ローラ上のエンコーダから基板位置を推測することにより達成され得る。ウェブに沿った整列の制御は、プリントヘッドからの分注動作のタイミングを取ることにより行われ得る。ウェブにわたる整列では、アクチュエータを使用して基板又はプリントヘッドのいずれかを移動させる必要があり得る。
【0172】
[0187] スポットイメージャ126は、成分添加の検証を提供する。スポットイメージャ126は、成分又は反応混合物の適切な分注を検証することを目的としたカメラであり得る。スポットイメージャ126の機能を促進するために、可視染料を成分インク又は反応混合物に組み込み得る。
【0173】
[0188] スポット乾燥器128は、プリントヘッド間で又はプリンタから出る際(例えば、プリンタから出るときに基板が巻かれることが意図される場合)に乾燥され得るように、プリントされた液滴の乾燥を目的とする。プリントヘッド間での液滴の乾燥は、オーバープリントプロセス中、特定の座標で液体が溢れないようにするのに有用であり得る。各プリントヘッドは、少なくとも1pL、5pL、10pL、20pL、30pL、40pL、50pL又はそれを超える容量の液滴を分注し得る。幾つかの実施形態では、少なくとも1、5、10、20、50、100又はそれを超えるプリントヘッドが同じ座標に分注し得る。
【0174】
[0189] プリンタサブシステムは、任意選択的に、基板及び被覆モジュール129を含み得る。基板及び被覆モジュール129は、ウェブ材料に加えてコーティング/パターニングを含む。基板は、材料を含み得るか、又はポリエチレンテレフタラート(PET)若しくはポリプロピレンのような低結合プラスチック等の材料で被覆され得る。
【0175】
[0190]
図3A~
図3Dは、プリンタ(例えば、
図1のプリンタ120)におけるプリントヘッド300の一例を示す。プリントヘッドは、1、2、3、4つ又はそれよりも多くのインク(別個の成分溶液)を含み得る。この特定の例では、ノズルの各行に1つのインクが提供され、4つまでのインクを含み得るプリントヘッド300を考える。さらに、プリントヘッドは、1インクにつき複数のノズル、例えば300のノズルを含み得る。特定の場合、各インクが、プリントヘッドに線形に通される基板の同じ座標上にオーバープリントされない可能性があるように、ノズルが適宜整列しないことがあるため、幾つか又は全てのノズルによりアドレス指定可能なウェブ座標のセットは、別々であり得る。又は、異なるインクのノズルは、所望のピッチでプリントするように適宜離間されないことがある。これらの問題を解決するために、プリントヘッドは、傾斜して(ウェブの運動に対して)搭載されて、所望のピッチでの成分インクのオーバープリントを可能にし得る。
図3B~
図3Dに示されるように、167μmピッチで4つのインクをオーバープリントできるようにするために、9度までの回転で十分である。特に、
図3Cは、プリントヘッドノズルの4つの行302、304、306、308を示す。行302、304、306、208の各々は、異なる成分を分注し得る。基板312(斜め上に及び矢印312が指す線から右側に延在する)は、プリントヘッド300の下で線形に動く。プリントヘッドの8.7度の回転により、基板312上の座標314は、各ノズルが成分を座標314上に堆積させ得るように、線307に沿って行302、304、306、308中のノズルの真下を通過する。
図3Dに示されるように、複数のプリントヘッド300、310、320を平行に配置して、複数の基板に同時にプリントできるようにし得る。一例では、プリントヘッドを作動させて、オーバープリントに適した整列に至らせ得る。プリントヘッドは、MEMS(微小電気機械システム)薄膜圧電インクジェットヘッド又はMEMSサーマルインクジェットヘッドであり得る。添加剤を成分インクに添加して、プリントヘッドとの適合性を上げ得る。例えば、トリスのような溶質を添加して導電性を上げ得る。一例として、保水剤又は界面活性剤(例えば、グリセロール)を添加して、噴射品質及びプリントヘッドノズルの寿命を改善し得る。
【0176】
[0191]
図4は、プリンタ内のプリントヘッドの潜在的な配置を示す。基板は、異なるトラック(T1~T4)上のプリントヘッドが独立した座標にプリントしているように長手方向に渡されるが、同じトラックに沿ったプリントヘッドは、基板上の同じ座標にプリント(オーバープリント)し得ると仮定される。1座標ごとにより多くのDNA成分を受けるために、基板は、毎回、新しいプリントヘッド(又は新しいインクが充填された同じプリントヘッド)を用いて複数の回数にわたりプリンタを通り得る。しかしながら、十分に多数のプリントヘッドが各トラックに沿って配置される場合、所望の数の識別子を構築するのに十分な数の成分を組み込むのに1回の通過のみでよいことがある。例えば、識別子がそれぞれ8成分の10層の製品スキームから構築され(1ギガビットのデータの記憶に十分な8
10個の識別子を可能にする)、各プリントヘッドが4成分をプリントすることができる場合、基板上に1回の通過で全ての成分セット配置を可能にするのにトラックに沿って20個のプリントヘッドを搭載することで十分であり得る。複数のトラックは、基板(ウェブ)のより効率的な使用を可能にし得、基板をより短くすることができると共に、より高いスループットで識別子を構築できるようにする。トラックがあるよりも基板により大きい幅(緯度)がある場合、基板(又はプリントヘッドシャーシ)は、各通過後に緯度方向にシフトして、長さに沿う代わりに基板の幅に沿って空の基板上にプリントできるようにし得る。別の実施形態では、別個のプリンタベースシステムが同じ基板の別々の部分にプリントし得る。
【0177】
[0192]
図5は、プリンタサブシステムにおけるスポットイメージャのセットアップの一例を示す。スポットイメージャは、ラインスキャン検査原理を使用し得る。例えば、スポットイメージャは、コンピュータシステム520、ディスプレイ510、ラインスキャンカメラ530、回転ドラム540及びエンコーダ550を含み得る。コンピュータシステム520は、ラインスキャンカメラ530と通信する。例えば、コンピュータシステム520は、制御信号をラインスキャンカメラ520に送信し得、ラインスキャンカメラ530は、画像データをコンピュータシステム520に送信し得る。コンピュータシステム520及びラインカメラシステム530は、無線接続又は有線接続を介して通信し得る。ラインスキャンカメラ530を介して収集された画像データは、ディスプレイ510に表示される。
図5に示されるように、ラインスキャンカメラ530は、ドラム540の像を捕捉し得、これは、次いで、ディスプレイ510に表示され得る。
【0178】
[0193]
図6は、フィニッシャサブシステム130をより詳細に示す。フィニッシャサブシステム130は、ウェブ駆動装置、インキュベーションバッファーを有し、分注をホストするフィニッシャベース140と、スポット加湿器144と、スポットイメージャ146と、プーリング(又はプーラ)サブシステム148とを含む。反応混合物を基板の各座標上に分注する部品に加えて、フィニッシャは、統合前に基板136の各座標上に反応阻害剤を分注する部品142も含み得る。これらの分注部品は、プリントヘッドであり得る。プリントヘッドは、オンデマンドプリントヘッドであり得が、ウェブに沿った各座標が分注を受けると予期され得るため、連続プリントでも十分であり得る。分注容量は、DNA成分が前に分注された各座標のエリアをカバーするのに十分であるべきである。分注容量は、少なくとも1pL、5pL、10pL、20pL、30pL、40pL、50pL、60pL、70pL、80pL、90pL、100pL、150pL、200pL又はそれを超える容量であり得る。プリントヘッドは、MEMS(微小電気機械システム)薄膜圧電インクジェットヘッド又はMEMSサーマルインクジェットヘッドであり得る。分注された液体に添加剤(例えば、マスタ混合物又は阻害混合物)を添加して、プリントヘッドとの適合性を上げることができる。例えば、トリスのような溶質を添加して、導電性を上げ得る。別の例として、保水剤又は界面活性剤を添加して、噴射品質及びプリントヘッドノズルの寿命を改善し得る。さらに、グリセロール又はポリエチレングリコール(PEG)のような保水剤を添加して、ノズル-空気境界面における蒸発及び液滴が分注された後の蒸発の両方を制御し得る。これらの保水剤は、反応の産物収量を上げることにより反応混合物にさらに恩恵をもたらし得る。
【0179】
[0194] プリンタサブシステムと同様に、フィニッシャもレジスタ及びスポットイメージャ146を含んで、それぞれプリントヘッドとのウェブの整列及び適切な分注の確認を行い得る。スポットイメージャの機能を促進するために、分注される流体に可視染料を組み込み得る。
【0180】
[0195] フィニッシャは、ローラの幾つかのループ(ウェブイングをループすることを目的としたローラの構成)134をさらに含み得、反応混合物後、ウェブ(基板)136上の反応を反応統合前により長期間にわたってインキュベートし得るように分注し得る。フィニッシャは、反応インキュベーションに最適な一定の内部温度をさらに有し得;例えば、4℃、12℃、25℃、37℃又はそれよりも高い摂氏温度である。インキュベーションフェーズ中、分注された反応混合物の蒸発を遅くし、制御するために、フィニッシャは、一定の高湿度レベルを有し得る。フィニッシャサブシステム130の湿度レベルは、インキュベーション期間(例えば、基板がローラ134を通過している間)を通してウェットスポットの維持を制御するスポット加湿器144によって制御され得る。
【0181】
[0196] 最後に、フィニッシャは、インキュベーション後、識別子アセンブリ反応の全てを1つの容器に統合するプーリング(又はプーラ)システム148を含み得る。反応の阻害は、このステップ前又はその間に行われ得る。
【0182】
[0197]
図7は、インキュベーションフェーズ中、ウェブをフィニッシャに通すためのローラ710、720のループの一例を示す。ウェブのループにより、より限られた空間内でのより長いインキュベーションが可能になる。例えば、ウェブが180mm/sでシステムを通して移動している場合、約60mのインキュベーションウェブ長は、5分のインキュベーション時間を必要とするが、幾つかのループは、約60mの線形トンネルよりもより狭い空間でこの長さをインキュベートできるようにする。インキュベーション時間が短いほど、インキュベートされるウェブ長を短くし得る。例えば、45秒のインキュベーション時間では、9mまでのウェブ長のインキュベートが可能であり得、10秒のインキュベーション時間では、約2mのウェブ長のインキュベートが可能であり得る。これらのより短いインキュベーションウェブ長では、インキュベーションを小さい空間内に閉じ込めるために必要なウェブループ数が少なくなり得る。
【0183】
[0198] ローラループのジオメトリにより、ウェビング740は、表を上にして特定のローラ720を通過し、表を下にして他のローラ710を通過し得る。
【0184】
[0199] 図の下部は、ウェブの移動路に沿ったローラ710の断面を示す。ローラは、反応物(例えば、成分が配置された座標)が邪魔されずに谷を通過し得るように、基板740の接触点間に谷(又は溝、ポケット若しくは任意の他の窪み)730を含むように設計し得る。代替的に、ウェブは、常に表を上にした構成(即ち180°ツイストパス)でローラの上を通過するようにローラ間で180度回転し得る。代替的に、ウェビングは、ローラのセットの周囲のウェビングの円形路により、反応物を含むウェビングの面がローラと接触しないことが保証されるように、インキュベータを通る螺旋パスを移動し得る。例えとして、リボンを円柱体の周りに巻くこと又はグリップテープをテニスラケットに貼り付けることを考える。
【0185】
[0200] 幾つかの実施形態では、ウェビングは、再循環しているウェビング又は連続ウェビングである。幾つかの実施形態では、ウェビングは、リールトゥリールシステム(ローラトゥローラ)である。幾つかの実施形態では、ウェビングは、かたつむりパスを辿る。例えば、
図7を参照されたい。幾つかの実施形態では、ウェビングは、螺旋パスを辿る。幾つかの実施形態では、ウェビングは、180°ツイストパスを辿る。例えば、ウェビングは、システムを用いて各ローラで180°ターンし、ウェビングは、表を上にした構成で全てのロールを通過する。
【0186】
[0201]
図8は、インキュベーション中、予期される平衡容量に対する反応混合物グリセロールの組成及びフィニッシャの湿度の影響を示す。粒子は、液相と気相との間を遷移する水分子を表す。液滴820は、ウェブ810上に分注された反応物を表す。外側の陰影の付いた領域は、水を表し、中間の陰影の付いた領域は、グリセロールを表し、内側の陰影の付いた領域は、溶質(例えば、DNA、酵素/リガーゼ、塩/マグネシウム、トリス)を表す。高湿度及び高グリセロール条件は、元の組成に最も類似する平衡反応組成を生じさせる。しかしながら、平衡における反応組成の変化は、有益であり得る。例えば、DNA成分の相対量の増大は、識別子の産物収量の増大に繋がり得る。同様に、グリセロール含有量の増大は、識別子の生成を促進する混み合い効果をもたらし得る。反応効率は、特定の溶質(塩のような)濃度の増大により悪影響を受け得るが、反応混合物に存在する初期溶質は、意図的に低濃度にし得、反応物液滴が平衡組成及び容量まで蒸発した後、最適濃度で存在するように設計し得る。
【0187】
[0202]
図9は、ウェブからの全ての反応物を1つの容器に統合するプーリングシステム(又はプーラ)を示す。一連のローラ902がウェブ910を噴霧洗浄器914及びウェブ910から反応物及びそれらの識別子産物を捕捉するように設計された収集槽942に案内する。このプロセスで容量の過度の蓄積を防ぐために、収集流体は、核酸を捕捉するように設計された膜を通して連続又は反復して流れ得る。例えば、膜は、シリカ膜であり得、収集流体は、膜への核酸の結合を促進するDNA結合バッファー912であり得る。収集流体は、統合容量に進まないように、反応を阻害する添加剤をさらに含み得る。例えば、反応がライゲーション反応である場合、収集流体は、リガーゼからのマグネシウムイオンをキレートし、したがって反応を阻害するEDTA(例えば、25mM)を含み得る。結合バッファーは、一実施形態では、1つ又は複数の結合カラムを通して再循環して、結合バッファーの容量を最小に抑えることができる。ウェブ910は、ウェブ910からDNAを除去する液体で濡らされ得、これは、収集槽内の液体にウェブ910を浸漬させることと組み合わせることができる。ウェブ910又は液体(例えば、機械的、流体的又は超音波的)の攪拌及び/又は加熱を使用して、ウェブ910からのDNAの解放を促進し得る。スクレーパ918は、物理的スクレーパ、液体ジェット又はガス(例えば、空気)ジェットであり得、ここでもウェブ910からのDNAの除去を促進する。1つ又は複数の噴霧を使用して、ウェブ910からのDNAの解放を促進することができる。
【0188】
[0203] DNAは、膜に捕捉された後、システム(機械)から取り出されて溶離され、さらに評価される。さらなる評価は、DNAをゲル上に長し、予期される識別子長に対応するバンドサイズを選択する(それにより他の潜在的な標的外産物から識別子を生成する)ことを含み得る。この例では、標的識別子長は、300bpである。DNA出力は、任意選択的に、ゲル又は他の濾過940を通過し、凍結乾燥することができるDNAデータ930を生成し得る。
【0189】
[0204] プーリング前又はプーリング中に反応混合物を添加及び阻害することに代えて、反応がプーリングステップにおいて生じるこのシステムの別の実施形態が存在する。この実施形態では、インキュベーションプロセス中、成分は、アニーリングされるが、組み立てられず、次いで反応混合物及び成分を識別子に組み立てるのに適切な環境条件(例えば、温度、pH、塩)を含むプールにおいて一緒に統合される。アニーリングされた成分がプールされると、反応の残りは、システム(機械)外で進み得るため、この実施形態は、ウェブ910でのインキュベーション時間を短縮し、フィニッシャでの厳しいハードウェア要件を緩和できるようにし得る。この実施形態では、プールされた反応物中の異なる識別子の成分間の不要な相互アセンブリを回避するために、プーリング前及びプーリング中、成分が互いに対して強くアニーリングすることを保証するように特別な注意を払い得る。これは、強いアニーリングに向けて長い粘着末端(及びハイブリダイゼーション領域)を有する成分を使用すること及びアニーリングされた産物を維持し、アニーリングされていない産物の拡散を制限するためにプーリングステップでより低い温度を使用することを含み得る。
【0190】
[0205]
図10は、PFSを通したデータ転送パイプラインの一実施形態の概略図を示す。
図10は、1Tbのデータを含むソースストリーム1002で始まる。ソースストリーム1002は、コーデック1004に転送され、ジョブモジュール1006に供給される。ジョブモジュール1006は、ジョブファイル、ブロック記録及びブロックデータを各ソースストリーム及び/又はコーデックファイルに作成する。この情報は、ブロックモニタ1008に供給される。ジョブモジュール1006は、ジョブモニタ1016により監視され、ジョブモニタ1016は、ブロックモニタ1008と通信する。ブロックモニタ1008は、新しいブロックをウォッチし、ブロックを検証し、それらをプリントパイプラインに追加する。ジョブモジュール1006からのブロックデータ1010は、分離され、ブロックリーダ1012に送られ、ブロックリーダ1012は、ブロックデータのプリントに必要なインク及びプリントヘッド構成を処理する。ブロックデータは、次いで、プリント可能フレーム1014に転送され、プリント可能フレーム1014は、ブロックデータ1010と、データ転送の正確性をテストするように構成された「チャープ」とを含む。フレーム1014は、次いで、ドキュメントプリンタモジュール1018に送られ、ドキュメントプリンタモジュール1018は、プリンタ1034と通信する。例えば、ドキュメントプリンタモジュール1018は、フレーム1014をプリンタ1034に送ってプリントし、プリンタ1034は、フィードバックをドキュメントプリンタ1018に送る。あらゆる失敗1020は、フィニッシュコントローラ1022に通信され、テキストファイル又は他の記憶法1024に書き込まれる。ドキュメントプリンタ1018と電子的に通信することに加えて、プリンタ1034は、物理的なウェブセクタ1036を受け取る。ウェブセクタ1036は、1つの隅における印により位置検証される。各ウェブセクタは、一意のIDコードを有する。プリンタ1032は、成分1032をウェブ上に堆積される。ウェブは、次いで、フィニッシャ1026に続く。フィニッシャ1026は、フィニッシュコントローラ1022と通信する。フィニッシュコントローラ1022は、フレーム又は部分フレームに関する情報を最終的にフィニッシャ1026に送り、フィニッシャ1026は、フィードバックをフィニッシュコントローラ1022に送る。プリンタ1034及びフィニッシャシステム1026の両方からのフィードバックは、セクタ割り振りへのフレームの記録、プリント及び品質制御とのウェブレジストレーションの調整及び失敗したフレームの記録を促進する。フィニッシャ1026を出た後、ウェブは、プリントされ、仕上げられており(1028)、DNAスポット1030を有する基板を生成し、DNAスポット1030は、次いで、プーリングシステム又は任意の他の適した記憶法に送ることができる。
【0191】
[0206]
図11は、4つのモジュール:シャーシモジュール、プリントエンジンモジュール、インキュベータモジュール及びプーリング(又はプーラ)モジュールを含むPFSの一実施形態を示す。シャーシモジュールの機能は、システムの全てのモジュールを通るウェビングの移動を駆動、安定化及び制御するベースシステムを提供することであり得る。プリントエンジンモジュールの機能は、DNA成分並びに他の材料及び試薬をウェビング上の反応液滴にプリントすることであり得る。インキュベータモジュールの機能は、反応液滴における産物(例えば、組み立てられたDNA又は識別子)収量を改善するために時間制御及び環境制御を提供することであり得る。プーラモジュールの機能は、ウェビングから反応液滴を取り出し、それらを1つの容器に統合することであり得る。
【0192】
[0207] 幾つかの実施形態では、反応液滴は、酵素ライゲーションを通してDNA識別子を組み立て得る。幾つかの実施形態では、反応液滴は、クリックケミストリを通してDNA識別子を組み立てられ得る。
【0193】
[0208] 幾つかの実施形態では、インキュベータモジュールは、100m、50m、25m、10m、5m、1m、0.1m又はそれ未満のウェビングを含み得る。幾つかの実施形態では、PFSは、インキュベータモジュールを有しなくてよい。
【0194】
[0209] 幾つかの実施形態では、プリントエンジン又はインキュベータは、断続的なプリントヘッド又は分注サブモジュールを含み、反応液滴がウェビング上で蒸発するにつれて反応液滴容量を補充し得る。
【0195】
[0210] 幾つかの実施形態では、PFSを通るウェビングは、プリントエンジン前にロールから解かれ、プーラ後にロールに再び巻かれ得る。幾つかの実施形態では、ウェビングは、プーラ後にプリントエンジンに戻る連続ループを形成し得る。
【0196】
[0211]
図12は、反応液滴をエマルジョン1260にプールするPFSの一実施形態を示す。エマルジョン1260は、反応液滴と混和しない油又は任意の液体を含み得、それによりプールされた後でも反応液滴1250が内容物を維持できるようにする。PFSのウェビング1220は、プリントヘッド1210の下を通過する(例えば、ローラ1230及び1240を介して)前に油で被覆され得る。反応液滴1250は、エマルジョン中のサイズ及び形状を制御する界面活性剤及び他の添加剤を含み得る。界面活性剤及び添加剤は、エマルジョン内の安定性を促進し、異なる反応液滴間の合体を阻止することもできる。乳化され、プールされた反応液滴は、マイクロ流体デバイスを通過し得る。乳化され、プールされた反応液滴は、インキュベートされ得る。さらに、乳化され、プールされた反応液滴は、凝集し、エマルジョンから分離することができる。
【0197】
[0212]
図13は、ウェビング1320にプリントされた後、反応液滴1350が油(又は別の非混和液)1370で被覆されるPFSの一実施形態を示す。油被覆は、ウェビング1320がローラ1330及び1340を介してプリントヘッドクラスタ1310下を通過するにつれて、油を反応液滴1350にプリント、分注又は噴霧する油分注サブモジュール1380を用いて行うことができる。油は、ウェビング1320上の反応液滴の蒸発を低減又は阻止し得る。反応液滴は、界面活性剤及び他の添加剤を含み得る。油で覆われた反応液滴1370は、エマルジョン1390にプールされ得る。乳化され、プールされた反応液滴は、マイクロ流体デバイスを通過し得る。乳化され、プールされた反応液滴は、インキュベートされ得る。さらに、乳化され、プールされた反応液滴は、凝集し、エマルジョンから分離することができる。
【0198】
[0213]
図14は、反応液滴1450が、プリントされたDNA成分に結合するビーズを含む、PFSの一実施形態を示す。ビーズは、シリカ、カルボキシル基又はDNAに結合するアミン若しくはイミダゾール部分で被覆し得る。代わりに又は加えて、ビーズは、ビオチン結合を通してDNA成分と結合するストレプトアビジンで被覆され得る。ビオチンは、光又はUV切断可能リンカーを用いてDNA成分にリンクされ得る。
【0199】
[0214] ウェビング1420は、プリントヘッド1410下を通過する(例えば、ローラ1430及び1440を介して)前に偏在的にビーズで被覆又はパターニングされ得る。代わりに又は加えて、ビーズは、各反応液滴1450に堆積又はプリントされ得る。反応液滴は、DNAがビーズに結合することを促進する添加剤を含み得る。ビーズは、反応液滴ごとに1、2、3、5、10、20、50、100又はそれを超える数量であり得る。
【0200】
[0215] 反応液滴1450は、ビーズへのDNAのさらなる付着を阻止する溶液1460中にプールされ得る。溶液1460は、BSA等の遮断剤を含み得る。プールされた溶液中のDNA結合ビーズは、溶液から分離され、乾燥され得る(1470)。分離は、遠心分離を通して行われ得る。別の実施形態では、ビーズは、磁性であり得、磁石を用いて分離され得る。
【0201】
[0216] プールされたDNA結合ビーズ(乾燥される(1470)か又は溶液中(1460))は、乳化した反応液滴中でさらにカプセル化され得る。一実施形態では、DNA結合ビーズは、マイクロ流体を使用して反応液滴中にそれぞれカプセル化される。別の実施形態では、DNA結合ビーズは、液滴が自然に形成されるように反応溶液と油(又は別の非混和液)とを混合することにより反応液滴中にそれぞれカプセル化される。自然に形成される反応液滴とDNA結合ビーズとの比率は、反応液滴が2つ以上のDNA結合ビーズを含む可能性が高くなるように調整され得る。反応液滴は、サイズを制御又は他の反応液滴の合体を阻止するために界面活性剤又は他の添加剤を含み得る。
【0202】
[0217] 反応液滴は、ビーズ上のDNAを切り離す試薬を含み得る。反応液滴は、DNA成分を一緒にライゲーションして識別子を形成する試薬を含み得る。反応液滴は、酵素によるライゲーション及びATP、DTT又は塩等のライゲーション補助因子を含み得る。
【0203】
[0218] DNAが光切断可能又はUV切断可能結合を通してビーズに結合される場合、DNAは、エマルジョンを適切な波長の電磁波(例えば、光又はUV)に露出させることによりビーズから解放され得る。
【0204】
[0219]
図15は、エマルジョンを使用して、ビーズに結合したDNA成分をどのように処理して識別子にするかの一例を示す。ステップ1510において、DNA結合ビーズが提供される。1520において、DNA結合ビーズは、次いで、反応混合物中にカプセル化されたDNA結合ビーズが油に浸漬するように乳化される。DNAは、次いで、切り離されて、混合物1530が生成される。切り離されたDNA混合物は、インキュベートされ、1540の組み立てられたDNAが生成される。
【0205】
[0220] 例示的な実施形態について本明細書に示し、説明してきたが、そのような実施形態が単なる例として提供されることが当業者に明らかになるであろう。当業者であれば、多くの変形形態、変更形態及び置換形態を想到するであろう。本明細書に記載の実施形態に対する種々の変更形態が採用され得ることを理解されたい。
【0206】
PFSサイズを低減するための変更例
[0221]
図11で上述したように、PFSは、4つのモジュール:シャーシ、プリントエンジン、インキュベータ及び又はプーラを含み得る。1Tbの情報をDNAに符号化するPFSの場合、各モジュールの概ねのサイズを以下の表に列記する。
【0207】
【0208】
[0222] PFSのサイズを低減するために、個々のモジュールのサイズを低減するか又はモジュールを除去し得る。サイズを低減するための変更例には、以下があり得る:
(1)プリントエンジンにおけるプリントヘッド容量の増大。カスタムプリントヘッド又は追加のプリントヘッドのいずれかを使用して、ノズル列の数を3倍にすることができ得る(又は3倍を超える増大)。これは、プリントされる反応物の数及びウェビング上のプリント幅を3倍にし得る。
(2)再循環するウェビングの使用。例えば、PFSは、21キロメートルのポリプロピレンウェビングを使用して、1Tbの情報を符号化するのに十分な反応物をプリントし得る。ウェビングリール(又はロール)の使用をなくすために、ロールトゥロールウェビングに対する代替として再循環ウェビングを使用し得る。復元研究により、DNAをプーラ内のウェブから容易に取り出すことができることが示されている。
(3)ライゲーション反応時間の短縮。これは、より小さいインキュベータの使用又はインキュベータを全く使用しないことを促進し得る。収量を犠牲にせずにライゲーション反応時間を短縮するために、より高いライゲーション速度を満たすように化学的性質を最適化することができる。
(4)室温及び周囲条件でのライゲーションの実行。これは、インキュベータモジュールの必要性をなくし得る。
(5)油エマルジョンを使用して、反応液滴容量を維持するか又はプーラ後にライゲーションを開始又は継続できるようにすること。これは、インキュベータモジュールの必要性をなくし得る。
【0209】
[0223] 例示的な実施形態について本明細書に示し、説明してきたが、そのような実施形態が単なる例として提供されることが当業者に明らかになるであろう。当業者であれば、多くの変形形態、変更形態及び置換形態を想到するであろう。本明細書に記載の実施形態に対する種々の変更形態が採用され得ることを理解されたい。
【0210】
組合せDNAアセンブリの方法及びシステムの適用
[0224] 大きい定義された識別子のセットに成分を組合せにより組み合わせる本明細書に記載の方法及びシステムについて、情報技術(例えば、データ格納、計算及び暗号法)に関連するものとしてこれまで説明してきた。しかしながら、これらのシステム及び方法は、より一般的には、高スループット組合せDNAアセンブリの任意の適用に使用し得る。
【0211】
[0225] 一実施形態では、アミノ酸鎖を符号化する組合せDNAのライブラリを作成し得る。それらのアミノ酸鎖は、ペプチド又はタンパク質のいずれかを表し得る。アセンブリのためのDNA断片は、コドン配列を含み得る。断片がそれに沿って組み立てられる接合部は、組合せライブラリの全てのメンバに共通する機能的又は構造的に不活性なコドンであり得る。代替的に、断片がそれに沿って組み立てられる接合部は、後にプロセシングされたペプチド鎖に翻訳されるメッセンジャーRNAから最終的に除去されるイントロンであり得る。特定の断片は、コドンではなく、コドンの各組合せ列で一意にタグ付けされた(他の組み立てられたバーコードと組み合わせて)バーコード配列であり得る。組み立てられた産物(バーコード+コドンの列)を一緒にプールし、インビトロ発現アッセイのために液滴中に封入し得るか、又は一緒にプールし、インビボ発現アッセイのために細胞に導入してそれを形質転換し得る。アッセイは、蛍光出力を有し得、したがって液滴/細胞を蛍光強度により選別してビン内に入れ、その後、それらのDNAバーコードを、各コドン列を特定の出力と相関付けるためにシーケンシングし得る。
【0212】
[0226] 別の実施形態では、RNAを符号化する組合せDNAのライブラリを作成し得る。例えば、組み立てられたDNAは、マイクロRNA又はCRISPR gRNAの組合せを表し得る。プールされたインビトロ又はインビボのいずれかにおけるRNA発現アッセイを、液滴又は細胞のいずれかを用い、またいずれの液滴又は細胞がいずれのRNA配列を含むかに関する追跡を維持するためにバーコードを用いて上記のように実行し得る。しかしながら、出力自体がRNAシーケンシングデータである場合、一部のプールされたアッセイを液滴又は細胞の外で行い得る。そのようなプールされたアッセイの例としては、RNAアプタマースクリーニング及び試験(例えば、SELEX)が挙げられる。
【0213】
[0227] 別の実施形態では、代謝経路内の遺伝子を符号化する組合せDNAのライブラリを作成し得る。各DNA断片は、遺伝子発現コンストラクトを含み得る。断片がそれに沿って組み立てられる接合部は、遺伝子間にある不活性なDNA配列を表し得る。液滴又は細胞のいずれかを用いると共に、いずれの液滴又は細胞がいずれの遺伝子経路を含むかに関する追跡を維持するためのバーコードを用いて、プールされたインビトロ又はインビボのいずれかにおける遺伝子経路発現アッセイを上述したように実行し得る。
【0214】
[0228] 別の実施形態では、異なる遺伝子調節エレメントの組合せを有する組合せDNAのライブラリを作成し得る。遺伝子調節エレメントの例には、5’非翻訳領域(UTR)、リボソーム結合部位(RBS)、イントロン、エクソン、プロモータ、ターミネータ及び転写因子(TF)結合部位がある。プールされたインビトロ又はインビボのいずれかにおける遺伝子発現アッセイは、液滴又は細胞のいずれかを用いると共に、いずれの液滴又は細胞がいずれの遺伝子調節コンストラクトを含むかに関する追跡を維持するためのバーコードを用いて、上述したように実行し得る。
【0215】
[0229] 別の実施形態では、組換えDNAアプタマーのライブラリを作成し得る。リガンドに結合するDNAアプタマーの能力を試験するためにアッセイを実行することができる。
【0216】
[0230] 本明細書に提供されるのは、少なくとも第1の成分核酸分子及び第2の成分核酸分子から識別子核酸分子を組み立てることにより、デジタル情報を記憶するシステム及びアセンブリである。システムは、(a)第1の成分核酸分子を含む第1の溶液の第1の液滴を基板上の座標上に分注するように構成された第1のプリントヘッドと、(b)第1及び第2の成分核酸分子が基板上の同じ位置に配置されるように、第2の成分核酸分子を含む第2の溶液の第2の液滴を基板上の座標上に分注するように構成された第2のプリントヘッドと、(c)反応混合物を基板上のその座標に分注して、第1の成分核酸分子と第2の成分核酸分子とを物理的にリンクさせるか、第1及び第2の成分核酸分子を物理的にリンクさせるのに必要な条件を提供するか又は両方を行うフィニッシャとを含み得る。一般に、第1及び第2のプリントヘッドは、任意の数のプリントヘッドの行と、種々の成分をプリント又は分注する対応するノズルとを含むシステムの部品であり得る。
【0217】
[0231] 幾つかの実施形態では、識別子核酸分子は、記号列中の記号の位置及び値であり、それを表す。例えば、列中の各記号は、対応する記号位置を表す対応する識別子を有し得る。特に、識別子は、記号の対応する値が1である場合に作成され得る一方、値0を有する記号を表す識別子は、作成されなくてよい。列中の記号の全ての識別子が作成される場合、プール内の特定の識別子の存在が対応する記号位置の値1を表す一方、プール内の特定の識別子の不在が対応する記号位置の値0を表すように、列の識別子分子をプール内で組合せ得る。対応する記号値が0である場合、識別子を作成し得る一方、値1を有する記号を表す識別子が作成されなくよい代替の手法を取り得る。幾つかの実施形態では、フィニッシャは、反応混合物を基板上の座標に分注するように構成された第3のプリントヘッドを含む。フィニッシャは、インキュベータ、プーリングシステム又は両方をさらに含み得る。インキュベータは、成分を組み立てて識別子核酸分子を形成するために反応を進めるのに必要な特定の温度条件又は条件セットを提供し得る。これは、後述する通りである。
【0218】
[0232] 幾つかの実施形態では、第1のプリントヘッドが第1の液滴を座標上に分注する前、第2のプリントヘッドが第2の液滴を座標上に分注する前又は第1及び第2のプリントヘッドが第1の液滴を座標上に分注する前に、フィニッシャは、反応混合物を座標上に分注する。一般に、フィニッシャは、随時、いかなる液滴も分注される前に、第1の液滴が分注された後であるが、最後の液滴が分注される前又は全ての液滴が分注された後に反応混合物を座標上に分注し得る。
【0219】
[0233] 幾つかの実施形態では、システムは、基板を第1のプリントヘッド、第2のプリントヘッド及びフィニッシャを越えて移動させる少なくとも1つのローラを含む。幾つかの実施形態では、ローラは、基板の線形運動を提供する。一般に、ローラは、第1及び第2のプリントヘッドの各々並びにフィニッシャを1回のみ又は複数回通過し得る基板の二次元又は三次元運動を提供し得る。幾つかの実施形態では、ローラは、一定速度での基板の線形運動を達成するリールトゥリールシステムの一部である。
【0220】
[0234] 幾つかの実施形態では、基板は、材料の連続ループを形成し、少なくとも1つのローラは、基板上の座標を第1のプリントヘッド、第2のプリントヘッド及びフィニッシャに複数回通すローラセットの一部である。一般に、少なくとも1つのローラが基板上のいかなる座標にも接触せず、基板上に分注されている材料のいかなるこすれ又は汚染の可能性も阻止するようにシステムを構成することが望ましいことがあり得る。特に、基板は、第1の液滴、第2の液滴及び反応混合物が分注される第1の表面と、第1の表面の逆の第2の表面とを有し、少なくとも1つのローラは、第2の表面に接触し、第1の表面に接触しない。代替的に、ローラの少なくとも1つが第1の表面に接触する場合でも、ローラは、材料が分注される座標のいずれとの接触も回避するように溝が付され得る。
【0221】
[0235] 幾つかの実施形態では、システムは、少なくとも1つの谷を含む第2のローラを含み、第2のローラは、少なくとも1つの谷が座標と整列するように第1の表面に接触する。幾つかの実施形態では、システムは、第2のローラを含み、基板は、第2のローラが第2の表面に接触し、第1の表面に接触しないように、少なくとも1つのローラと第2のローラとの間又は螺旋パスにおいて180度回転する。
【0222】
[0236] 幾つかの実施形態では、座標は、1マイクロメートル~200マイクロメートルの直径又は基板上の他の座標からの間隔を有する。幾つかの実施形態では、第1及び第2の液滴は、1pL~50pLの容量をそれぞれ有する。
【0223】
[0237] 幾つかの実施形態では、システムは、基板の動きをリアルタイムで追跡して、基板の座標と第1及び第2のプリントヘッドとの間の整列を維持するレジスタを含む。幾つかの実施形態では、第1及び第2の溶液は、染料を組み込み、システムは、第1及び/又は第2の液滴の適切な分注を検証するカメラを含むスポットイメージャを含む。
【0224】
[0238] 幾つかの実施形態では、システムは、基板上の第1及び第2の液滴を乾燥させるスポット乾燥器を含む。幾つかの実施形態では、第1のプリントヘッドは、第1の溶液の液滴を基板の異なる座標に分注する第1の複数のノズルを含む。幾つかの実施形態では、第1のプリントヘッドは、第3の溶液の液滴を基板の異なる座標に分注する第2の複数のノズルを含む。
【0225】
[0239] 幾つかの実施形態では、システムは、基板を含む。幾つかの実施形態では、基板は、低結合プラスチックを含む。幾つかの実施形態では、基板は、ポリエチレンテレフタラート(PET)又はポリプロピレンを含む。
【0226】
[0240] 幾つかの実施形態では、第1及び第2のプリントヘッドは、システム内で基板の運動に対して傾斜して搭載され、傾斜により座標上へのオーバープリントが可能になる。幾つかの実施形態では、第1のプリントヘッドは、MEMS薄膜圧電インクジェットヘッド又はMEMSサーマルインクジェットヘッドである。幾つかの実施形態では、第1及び第2のプリントヘッドは、同じトラックに沿って位置して、液滴を座標上に分注し、システムは、少なくとも1つの追加のトラックに沿って位置して、液滴を対応するトラック内の別の座標上に分注する追加のプリントヘッドを含む。
【0227】
[0241] 幾つかの実施形態では、フィニッシャは、反応インキュベーションに最適な一定の内部温度を有する。幾つかの実施形態では、フィニッシャは、インキュベーション中、反応混合物の蒸発を制御する一定の湿度レベルを有する。幾つかの実施形態では、フィニッシャは、濃縮を阻止するためにインキュベーション前に基板を加熱するヒータを含む。幾つかの実施形態では、フィニッシャは、基板上の異なる座標からの複数の反応物を容器に統合するプーリングシステム(又はプーラ)を含む。幾つかの実施形態では、統合前に、フィニッシャは、反応阻害剤を基板の座標上に分注する。
【0228】
[0242] 幾つかの実施形態では、容器は、プーリング溶液、反応阻害剤を含む。幾つかの実施形態では、反応阻害剤は、エチレンジアミン四酢酸(EDTA)である。
【0229】
[0243] 幾つかの実施形態では、システムは、基板上の異なる座標から収集された流体から核酸を捕捉する膜を含む。幾つかの実施形態では、システムは、基板から核酸を取り外すスクレーパを含む。幾つかの実施形態では、異なる座標からの複数の反応物は、複数の反応物がプール後に内容物を維持できるようにするエマルジョンに一緒にプールされる。
【0230】
[0244] 幾つかの実施形態では、基板は、非混和性の液体又は油で被覆される。幾つかの実施形態では、システムは、油を座標上に分注する油分注器を含む。幾つかの実施形態では、基板は、第1及び第2の成分核酸分子と結合するビーズで被覆又はパターニングされる。幾つかの実施形態では、システムは、ビーズを座標上に分注するビーズ分注器を含む。
【0231】
[0245] 幾つかの実施形態では、反応混合物は、リガーゼを含む。幾つかの実施形態では、第1の溶液、第2の溶液及び反応混合物は、添加剤を含む。幾つかの実施形態では、添加剤は、第1のプリントヘッドとの第1の溶液の適合、第2のプリントヘッドとの第2の溶液の適合又はフィニッシャとの反応混合物の適合を可能にするように構成される。幾つかの実施形態では、添加剤は、第1の溶液、第2の溶液又は反応混合物の蒸発を軽減する。幾つかの実施形態では、添加剤は、保水剤、界面活性剤及び殺生物剤の少なくとも1つを含む。
【0232】
[0246] 幾つかの実施形態では、システムは、命令を実行してシステムを動作させるように構成されたコンピュータプロセッサを含む。命令は、(1)例えばローラセットを制御する等により基板を、プリントヘッドを越えて移動させる命令セットと、(2)各プリントヘッド又は対応するノズルが溶液を分注する回数を指定する別の命令セットとを含み得る。
【0233】
[0247] 一態様では、本開示は、核酸分子を組み立てるシステムを提供し、システムは、(a)第1の成分核酸分子を含む第1の溶液の第1の液滴を基板上の座標上に分注するように構成された第1のプリントヘッドと、(b)第1及び第2の成分核酸分子が基板上の同じ位置に配置されるように、第2の成分核酸分子を含む第2の溶液の第2の液滴を基板上の座標上に分注するように構成された第2のプリントヘッドと、(c)反応混合物を基板上のその座標に分注して、第1の成分核酸分子と第2の成分核酸分子とを物理的にリンクさせるか、第1及び第2の成分核酸分子を物理的にリンクさせるのに必要な条件を提供するか又は両方を行うフィニッシャとを含む。
【0234】
[0248] 幾つかの実施形態では、フィニッシャは、反応混合物を基板上の座標に分注するように構成された第3のプリントヘッドを含む。フィニッシャは、インキュベータ、プーリングシステム又は両方をさらに含み得る。一般に、フィニッシャは、反応混合物を随時分注し得る。特に、反応混合物は、第1のプリントヘッドが第1の液滴を座標上に分注する前、第2のプリントヘッドが第2の液滴を座標上に分注する前又は両方の前に座標に分注され得る。
【0235】
[0249] 幾つかの実施形態では、組み立てられた核酸分子は、遺伝子をコードするDNA、ペプチドをコードするDNA又はRNAをコードするDNAを含む。組み立てられる核酸分子は、DNAアプタマーライブラリを含む。
【0236】
識別子の処理
[0250] PFSから直接取得される識別子の形式は、記憶、計算又は読み取り等の下流プロセスと直ちに適合しないことがある。下流プロセス前に、プーラからの識別子を生成し濃縮するために中間プロセスが必要であり得る。より具体的には、大半が標的外の核酸分子を含む大容量プールから、全長識別子の非常に希薄なライブラリを精製することが必要であり得る。識別子を作成するDNAアセンブリ反応及びDNA合成方法(例えば、ホスホラミダイトケミストリ、酵素によるアセンブリ、オリゴアセンブリ)は、一般に、不十分であり得、したがってn-x産物と比べて小さい割合の完全アセンブリ分子のみを生成することができる。n-x産物は、組み立てられない成分、全長識別子よりも短い分子を含む部分的に組み立てられた識別子断片及び/又はssDNA断片等の他の標的外産物を含む非標的断片である。例えば、完全に組み立てられた核酸分子は、N個の連結された核酸断片をそれぞれ含み、部分的に組み立てられた核酸分子は、N未満の連結された核酸断片をそれぞれ含む。これらのn-x産物は、直接(キメラPCR産物の生成を通して若しくは不正確な定量化に繋がるサンプル測定への干渉により)又は間接的(シーケンシング及びストレージ等のプロセスのスケーリングを必要とし、関連コストを増大させる、サンプル質量を上げることにより)に下流プロセスに悪影響を及ぼす。これらの問題を回避するために、所望の産物(即ち全長識別子)をn-x産物から分離することが重要である。DNAデータ格納は、全反応物が一緒にプールされると、ピコリットルであっても反応容量がリットル容量(1012倍)の産物を生成する何兆ものアセンブリ反応を必要とし得るため、この分離プロセスは、課題であり得る。この結果生成される容量は、大きく、マイクロリットル~ミリリットル範囲で使用されるように設計される傾向がある、分子生物学的で頻繁に使用される従来のDNA精製プロトコル及び商用キットの使用を難しくする(及び費用効率的ではないものにする)。さらに、大きいPFS出力容量は、分光測光法(例えば、ThermoFisher(登録商標)Nanodrop(商標))、蛍光法(例えば、ThermoFisher(登録商標)Qubit(商標))及びqPCRを含め、大半の現在の分子生物学的検出方法の検出限界未満に識別子を希釈し得る。したがって、後続の分子生物学的プロトコルを使用して、特に全長識別子について富化できるようにするために、容積低減は、DNAを濃縮するプロセスにおける重要なステップである。
【0237】
[0251] 標準的な分子生物学技法を使用して、容積低減、バッファー交換及びサイズ選択の1つ又は複数(しかし、全てではない)を実行することができる。これらの技法は、標準分子生物学技法の中でも特に、アルコール沈殿、シリカベースの核酸精製カラム、アニオン交換核酸精製カラム、SPRI(固相可逆的固定化)精製、アガロースゲル抽出を含む。容積低減、核酸精製の両方の自動解決策(例えば、ThermoFisher(登録商標)BenchPro(商標)2100、Opentrons(登録商標)及びBeckman Coulter(登録商標)Biomek(商標))及び核酸サイズ選択の自動解決策(例えば、Sage Science(商標)Pippin(商標)及びThermoFisher(登録商標)Kingfisher(商標))を使用することもできる。
【0238】
[0252] しかしながら、既存の技術は、PFSにより精製された希薄なライブラリのスケールを単一ステップで処理するのに十分ではない。さらに、現行技術は、データ格納及び/又は計算を目的として合成的に生成された組換えライブラリと良好に機能するように設計されていない。核酸ベースのデータ格納及び/又は計算は、シグナルの維持、ノイズの低減(n-x産物の除去)及びバイアスの最小化についてより厳しい要件を有する。容積低減の現行技術は、配列バイアス及びコピー数表現の優先度がより低い用途を標的とする一方、データ格納及び計算の用途には、複数の識別子のバイアスのない均等な表現が必要とされる。本明細書に記載の技術は、容積低減、バッファー交換並びに識別子の選択及び増幅を達成するように、幾つかのプロトコルをPFS及び核酸ベース(例えば、DNAベース)のデータスト路エージ及び/又は計算に向けて適合し、形式化する。
【0239】
[0253] 本明細書に記載されるのは、上述したプリンタ-フィニッシャシステム(PFS)を用いて実施される核酸(例えば、DNA)アセンブリ反応のプールから全長識別子を生成するマルチステッププロセスである。このプロセスは、例えば、後処理モジュールにおいて全長識別子を「後処理」することとして説明することができる。この方法の入力は、高い割合の、アセンブリが不完全な核酸(例えば、DNA)を含む核酸(例えば、DNA)アセンブリ反応の大容量プールであり、出力は、ルートライブラリを表す全長識別子について高度に富化された濃縮ライブラリである。このルートライブラリは、読み取り、計算及び/又は記憶を含む下流用途に適する。
図16は、書き込み後プロセスの一例を示す。PFSは、大容量のプーラにおいて識別子を生成する。マルチステップ書き込み後処理は、プーラ容積の出力を取り、下流プロセスに適した、濃縮、精製された識別子のルートライブラリを生成する。
【0240】
[0254] 本明細書に記載されるのは、4つのステップを含むプロセスである。これらのステップは、1)容積を低減して、希薄な大容量プールからの全ての識別及び成分をより小容量のプールに濃縮すること、2)標準的な分子生物学研究動作に適合する培地に識別子を懸濁させるために、バッファーを交換すること、3)完全に組み立てられた識別子を、不完全に組み立てられた識別子断片及び成分から分離すること、及び4)任意の残留するバックグラウンドノイズよりもシグナルをさらに濃縮するために、分離された識別子を増幅することを含む。プロセスは、上述したプリンタ-フィニッシャシステム(PFS)により生成される、情報を符号化する識別子の処理に使用することができる。プロセスは、PFS又は別個のデバイス若しくはシステムで実行することができる。例えば、PFSは、表面を含み得、核酸分子は、直接又は間接的に表面に結合され、核酸分子が表面に結合されいる間にステップ1~4の1つ又は複数が実行される。
【0241】
[0255] ステップ1~4の各々は、1つのステップの出力プールが続くステップの入力プールとして機能するように、核酸を含むプールに対して実行することができる。方法は、標的核酸分子及び非標的核酸分子を含む第1のプールを取得することと、1)富化された濃度の標的核酸分子及び非標的核酸分子を含む第2のプールを取得するために、第1のプールの容積を低減することと、2)研究所適合培地において標的核酸分子及び非標的核酸分子を含む第3のプールを取得するために、第2のプールに対してバッファー交換を実施することと、3)標的核酸分子を含む第4のプールを取得するために、標的核酸分子を非標的核酸分子から分離することと、4)富化された濃度の標的核酸分子を含む第5のプールを取得するために、第4のプール中の標的核酸分子を増幅することとを含み得る。第5のプールは、例えばナノポアシーケンシングを使用してシーケンシングされる場合には、少なくとも8デシベルの信号対雑音(SNR)比又は少なくとも13デシベルのSNRを有し得る。第1のプール、第2のプール、第3のプール、第4のプール及び第5のプールの1つ又は複数は、ステップ1~4の1つ又は複数の実行中、複数の区画に分けられる。幾つかの実施形態では、区画は、アレイ又は基板にわたって分布する。各区画は、標的識別子のサブセットを含み得、各サブセットは、情報のブロックを符号化する配列ライブラリを表す。各区画は、ウェル、液滴、エマルジョン、孔、ビーズ又はスポットであり得る。ウェルは、マイクロウェルのアレイ上のマイクロウェルであり得る。エマルジョンは、油中水型エマルジョンであり得る。液滴は、溶液中又はエレクトロウェッティングデバイス上にあり得る。孔は、基板上にあり得る。ビーズは、溶液中にあり得るか又は表面に付着され得る。チャネルは、マイクロ流体デバイス内にあり得る。スポットは、官能化表面上にあり得る。幾つかの実施形態では、ステップ1~4の2つ以上のステップ間で追加のステップが実行される。本明細書に記載の方法の幾つかの実施形態では、ステップ1~4よりも少ないステップ、例えばステップ1のみ、ステップ2のみ、ステップ3のみ、ステップ4のみ又はステップ1~4の2つ又は3つの任意の組合せが実行される。
【0242】
[0256] 容積低減は、プーラ容量を例えば90%、95%又は99%低減されるように実行される。幾つかの実施形態では、低減は、8リットルから100ミリリットルである。これは、qPCR及び蛍光核酸分子定量化を含む多くの標準的な分子生物学定量化技法の検出範囲内に標的核酸分子を濃縮し、下流の分子操作と実際に相互作用する能力を提供する。例えば、検出範囲は、qPCRではおよそ0.1fg/μL又は蛍光核酸定量ではおよそ0.01ng/μLの下限を有し得る。幾つかの実施形態では、プーラ容量は、大型アニオン交換樹脂への核酸結合を可能にするpHに調整される。幾つかの実施形態では、アニオン交換樹脂に適したpHは、5.5以下及び5.4以上である。pHは、塩酸を使用して調整することができる。幾つかの実施形態では、溶液の粘度を上げ、したがってアニオン交換樹脂又はアニオン交換フィルタにおける溶液の滞留時間を長くするように、プーラ溶液もポリエチレングリコール(例えば、PEG-6000又はPEG-8000)等の添加剤を用いて調整することができ、それにより核酸結合効率が改善する。調整されたプーラ溶液は、減圧濾過を使用してアニオン交換カラムを通過する。全長識別子並びにアセンブリが不完全な断片及び成分を含む核酸分子は、アニオン交換樹脂に結合し、プーリング流体の大容量は、廃棄産物として通過する。プーラ溶液容量全体がカラムを通ると、結合した核酸が洗浄され、より小容量(即ち100ミリリットル)の高塩溶液がフィルタを通過して、結合した識別子及び/又は識別子断片を溶離する。
【0243】
[0257] 幾つかの実施形態では、本明細書に記載のシステムは、容積低減に使用することができる1つ又は複数の大型シリカフィルタを含む。DNAは、カオトロピック塩の存在下でシリカに結合する。一例の実施形態では、カオトロピック塩は、PFSにより生成された大容量プーリング溶液に添加される。このプーリング溶液は、減圧濾過、蠕動ポンプ等の使用を通してシリカガラス繊維フィルタ(GF/F)を通る。DNAは、GF/Fに結合し、プーリング溶液の大容量は廃棄産物として通過する。
【0244】
[0258] 幾つかの実施形態では、本明細書に記載の技術は、凍結乾燥ステップ及び/又は1つ又は複数の凍結乾燥器を含む。容積低減は、凍結乾燥又は遠心減圧濃縮(例えば、ThermoFishre(登録商標)SpeedVac(商標))を通して達成することができる。
【0245】
[0259] 幾つかの実施形態では、本明細書に記載の技術は、ゲルを用いない核酸(例えば、DNA)の電気泳動を含む。核酸(例えば、DNA)が正電極に向かって迅速に移動するように、電場がバルク導電液体溶液に印加される。電極又は電極の近くの安全収集点に達すると、液体を廃棄することができる。このようにして、低濃度環境からDNAを迅速に濃縮することができる。
【0246】
[0260] 幾つかの実施形態では、アニオン交換カラム、シリカカラム、アフィニティクロマトグラフィカラム又は他のモダリティをPFSと統合することを通して容積低減が達成される。ライタ(情報を識別子に書き込むデバイス)からの出力は、上記カラムの1つに自動的に供給され、真空、重力又は他の方法によりカラムに通すことができる。次いで、洗浄バッファーステップ及び溶離ステップを、例えば、カラムへの他のバッファーの適用が可能な場合にはPFSで又はPFS外で実行することができる。
【0247】
[0261] バッファー交換ステップは、識別子及び/又は識別子断片をさらに濃縮する。容積低減プロセスからの高塩溶液は、PCR、qPCR、蛍光定量化及び他のDNAシーケンシングライブラリ準備技法を含む多くの下流プロセスを阻害する。幾つかの実施形態では、イソプロパノールを使用して、識別子及び/又は識別子断片を溶液から沈殿させる。幾つかの実施形態では、イソプロパノールの代わりにエタノールを使用することができる。次いで、識別子及び識別子断片は、下流プロセスに適合するバッファー、例えばトリスEDTAバッファー又はヌクレアーゼフリー水に再懸濁する。幾つかの実施形態では、再懸濁は、バッファー交換の入力として使用された容積よりも小さい容積で実行され、さらに容積低減する。幾つかの実施形態では、バッファー交換のために、脱塩カラムをアルコール沈殿法の代わりに使用することができる。脱塩カラムは、サイズ排除樹脂を含み得る。
【0248】
[0262] 識別子分離により、非標的核酸断片(n-x産物)を除去する。このステップの終わりに、ライブラリは、全長識別子について高度に富化されている。幾つかの実施形態では、固相可逆的固定化(SPRI)常磁性ビーズ、それに続けてアガロースゲル抽出を含む逐次的サイズ選択プロセスを使用して、全長識別子の収量を最適化し、部分的に組み立てられた識別子断片及び成分の持ち越しを最小に抑える。アガロースゲルは、1~5%のアガロース、例えば2%又は4%のアガロースであり得、従来のゲルボックス又はThermoFisher(登録商標)E-gel(商標)システムに流すことができる。ゲルは、5~25分、例えば8分、又は10分、又は20分流すことができる。
【0249】
[0263] 熱循環(例えば、ポリメラーゼ連鎖反応(PCR)又はリガーゼ連鎖反応(LCR))及び/又は等温増幅(例えば、ローリングサークル増幅(RCA)、ループ媒介等温増幅(LAMP)又は鎖置換増幅(SDA))等の増幅プロセスを使用して、全長識別子の存在度を上げることにより標的分子のシグナルを増大させることができる。PCRがこの増幅ステップに使用される場合、ストリンジェントパラメータを使用して、キメラPCR産物の生成を低減することができる。キメラPCR産物は、アニーリングステップ中、短いDNA断片が非相同鋳型に部分的に結合し、ポリメラーゼが伸長するプライマーとして作用する場合に生成される。本願では、キメラPCR産物は、ノイズの一因となり、したがって記憶されたデータの信号対雑音比(SNR)を低減し、ライブラリの質量を上げることによりコストを増大させる。短い断片は、熱循環前にサンプルに存在し得(ここではn-x産物の場合のように)又は前のPCRサイクル中の不完全な伸長に起因して生成され得る。伸長時間の増大を使用して、早期にポリメラーゼ活性を終了させる確率を下げることができる。アニーリング温度が高いほど(例えば、72℃まで)、不正確なプライマー結合事象が低減する。例えば、約0.1ng/μL、約0.0001ng/μL、0.01ng/pLへの初期鋳型の希釈又は本ステップにおける識別子選択の改善は、PCR反応における初期n-x産物量を低減し、それによりキメラPCR産物の形成が低減する。反応物濃度が10ng/pL、5ng/pL又は1ng/pLを決して超えないようにPCRサイクル数を制限することにより、キメラ産物の形成が低減する。New England Biolabs(登録商標)Phusion(登録商標)又はQ5(登録商標)等のより忠実度の高いポリメラーゼ(例えば、Taq DNAポリメラーゼのものよりも高い)を使用することにより、キメラ産物の形成を低減することができる。増幅は、ルートライブラリの生成に繋がり、ルートライブラリは、読み出し、計算及び/又は記憶を含む続く用途で使用することができる。幾つかの実施形態では、熱循環は、5~25サイクルの増幅を含む。
【0250】
[0264] 本明細書に記載の技術の幾つかの実施形態では、プーラライブラリの精製又は後処理のステップの順序は、上記プロセスと異なり得る。例えば、1つ又は複数のステップは、単一のステップに結合することができる。幾つかの実施形態では、容量低減及びバッファー交換を単一ステップに組み合わせることができる。幾つかの実施形態では、例えば比容積低減化学での溶離バッファーが下流ステップに適合する場合、容積低減及びバッファー交換は、単一ステップに組み合わされ得る。例えば、標的及び非標的核酸分子は、第1のプールから、第1のプールの容積未満の容積を有するバッファーに移すことができる。分子は、バッファーを溶離剤として使用して容積低減モジュールからの分子を溶離することにより、バッファーに移すことができる。幾つかの実施形態では、識別子の分離は、容積低減ステップ中に実行され得る。例えば、大型アフィニティクロマトグラフィカラムを使用して、高度希釈プールから全長識別子を選択することができる。
【0251】
[0265] 本明細書に記載の技術の幾つかの実施形態では、プロセスは、種々の又は可変プーラ(モジュール又はシステム)入力容量に適合することができる。書き込み後処理への入力は、例えば、PFSへの変更に基づいて異なり得る。これらの変更の幾つかは、PFSインク配合(例えば、リガーゼの濃度、核酸(例えば、DNA)の濃度、核酸(例えば、DNA)成分の数及び/又はインク添加剤の濃度)、アセンブリ反応の時間、アセンブリ反応の温度及び/又はアセンブリの化学的性質自体への変更を含め、アセンブリ反応の効率を改善することができ、これにより識別子の割合を上げることができると共に、n-x産物の割合を低減することができる。
【0252】
[0266] 幾つかの実施形態では、プールされた入力は、油中水型エマルジョンを含み得る。乳化したアセンブリ反応物は、例えば、より長い反応インキュベーション時間を可能にすることによりアセンブリ効率を改善することができる。これらのエマルジョン反応物は、書き込み後処理前に物理的又は化学的方法を通して分割することができるか、又はエマルジョン反応物は、書き込み後処理中に分割することができる。例えば、幾つかのエマルジョンは、アニオン交換カラム又はシリカカラムを通して濾過されるときに破壊される。
【0253】
[0267] 幾つかの実施形態では、PFSプーラの容量を増大又は低減することができる。入力容量への変更により、n-x産物の割合を低減しながら識別子の割合を上げる実施形態では、書き込み後処理ステップに対応する変更を行うことができる。n-x産物が入力において十分に低減される場合、シグナル増幅のストリンジェントを低減することが許容可能であり得る。このシナリオでは、より高濃度のPCR反応物を使用することができる。
【0254】
[0268] 幾つかの実施形態では、1つ又は複数の反応スポットからの核酸をプーラに結合し、プーラを下流で処理するのではなく、核酸(例えば、DNA)がウェビングに一時的又は永久的に固定されるように、上述のように反応スポットをそのウェビングに残すことができる。そのような実施形態では、任意の後処理ステップは、溶液中の核酸(例えば、DNA)ではなく、核酸(例えば、DNA)が表面に結合された(その結合が直接又は間接的であるかを問わず)状態で実行することができる。さらに、下流の任意の計算又は読み出し/検出方法は、この表面結合形式で行うことができる。
【0255】
[0269] 幾つかの実施形態では、本明細書に記載の技術は、並列後処理を含む。幾つかの実施形態では、PFSからプールされた核酸(例えば、DNA)産物の結合容量を使用するのではなく、本明細書に記載のPFSシステムは、個々の反応容器又は個々の識別子及びそれらの対応するn-x産物を表す物理的に別個のエリアを含み得る。そのような実施形態では、後処理は、識別子の個々の(例えば物理的)分離を維持しながら、概念上同様に実行することができる。幾つかの実施形態では、並列化された後処理は反応ウェル、エマルジョン、マイクロ流体デバイス、エレクトロウェッティング、官能化表面又はそれらの組合せを採用することができる。
【0256】
[0270] 上記技術は、DNAとの併用に限定されず、任意の核酸、例えばDNA、RNA及び/又は人工核酸を用いて実施することも可能である。
【0257】
実施形態例
[0271] 項目1.情報を符号化する核酸分子のプールを精製する方法であって、
(a)標的核酸分子及び非標的核酸分子を含む第1のプールを取得することと、
(b)富化された濃度の標的核酸分子及び非標的核酸分子を含む第2のプールを取得するために、第1のプールの容積を低減して、ことと、
(c)研究所適合培地において標的核酸分子及び非標的核酸分子を含む第3のプールを取得するために、第2のプールに対してバッファー交換を実施することと、
(d)標的核酸分子を含む第4のプールを取得するために、標的核酸分子を非標的核酸分子から分離することと、
(e)富化された濃度の標的核酸分子を含む第5のプールを取得するために、第4のプール中の標的核酸分子を増幅することと、
を含み、標的核酸分子は、情報を符号化する配列ライブラリを含む、方法。
【0258】
[0272] 項目2.標的核酸分子は、それぞれ連結核酸断片を含む完全組織化核酸分子を含む、項目1に記載の方法。
【0259】
[0273] 項目3.非標的核酸分子は、部分組織化核酸分子、非組織化核酸断片又は単鎖核酸断片の少なくとも1つを含む、項目2に記載の方法。
【0260】
[0274] 項目4.各完全組織化核酸分子は、N個の連結核酸断片を含み、及び各部分組織化核酸分子は、N個よりも少ない連結核酸断片を含む、項目3に記載の方法。
【0261】
[0275] 項目5.ステップ(b)において第1のプールの容積を低減することは、約99%の容積低減を含む、項目1~4のいずれかに記載の方法。
【0262】
[0276] 項目6.第2のプールにおける富化された濃度は、分子定量技法の検出範囲内である、項目1~5のいずれかに記載の方法。
【0263】
[0277] 項目7.分子定量技法は、定量ポリメラーゼ連鎖反応(qPCR)又は蛍光核酸定量である、項目6に記載の方法。
【0264】
[0278] 項目8.検出範囲は、qPCRではおよそ0.1fg/μL又は蛍光核酸定量ではおよそ0.01ng/μLの下限を有する、項目6~7のいずれかに記載の方法。
【0265】
[0279] 項目9.ステップ(b)は、
第1のプールをアニオン交換樹脂に通すこと、
カオトロピック塩を第1のプールに添加し、及び減圧濾過若しくはポンプを使用して第1のプールをシリカガラス繊維フィルタに通すこと、
第1のプールを凍結乾燥すること、
遠心減圧濃縮を使用して第1のプールを濃縮すること、又は
核酸分子が正電極に向かって移動するように電場を第1のプールに印加し、及び残りの液体を廃棄すること、
の1つ又は複数によって実施される、項目1~8のいずれかに記載の方法。
【0266】
[0280] 項目10.減圧濾過は、アニオン交換樹脂に適用される、項目9に記載の方法。
【0267】
[0281] 項目11.第1のプールをアニオン交換樹脂に通すことは、標的核酸分子及び非標的核酸分子が樹脂に結合されている間、第1のプールの溶液を樹脂に通すことを含む、項目9~10のいずれかに記載の方法。
【0268】
[0282] 項目12.ステップ(b)は、高塩溶液を樹脂に通して、結合分子を第2のプールに溶離することをさらに含む、項目11に記載の方法。
【0269】
[0283] 項目13.ステップ(b)は、第1のプールをアニオン交換樹脂に通す前に、第1のプールのpHをアニオン交換樹脂に適したpHに調整することをさらに含む、項目9~12のいずれかに記載の方法。
【0270】
[0284] 項目14.アニオン交換樹脂に適したpHは、5.5以下及び5.4以上である、項目13に記載の方法。
【0271】
[0285] 項目15.pHを調整することは、塩酸を添加することを含む、項目13~14のいずれかに記載の方法。
【0272】
[0286] 項目16.ステップ(b)は、第1のプールをアニオン交換樹脂に通す前に、添加剤を第1のプールに添加することをさらに含む、項目9~15のいずれかに記載の方法。
【0273】
[0287] 項目17.添加剤は、ポリエチレングリコールである、項目16に記載の方法。
【0274】
[0288] 項目18.ポリエチレングリコールは、PEG-6000又はPEG-8000である、項目17に記載の方法。
【0275】
[0289] 項目19.添加剤は、第1のプールの粘度を高める、項目16~18のいずれかに記載の方法。
【0276】
[0290] 項目20.ステップ(c)は、
標的核酸分子及び非標的核酸分子を第2のプールから沈殿させるために、沈殿剤を第2のプールに添加すること、又は
標的核酸分子及び非標的核酸分子を第2のプールから収集するために、第2のプールを脱塩カラムに配置すること
のいずれかを含む、項目1~19のいずれかに記載の方法。
【0277】
[0291] 項目21.沈殿剤は、イソプロパノール又はエタノールである、項目20に記載の方法。
【0278】
[0292] 項目22.脱塩カラムは、サイズ排除樹脂を含む、項目20に記載の方法。
【0279】
[0293] 項目23.沈殿又は収集された分子は、バッファー中に再懸濁又は溶離されて第3のプールを形成する、項目20~22のいずれかに記載の方法。
【0280】
[0294] 項目24.バッファーは、トリス(ヒドロキシメチル)アミノメタン(トリス)エチレンジアミン四酢酸(EDTA)バッファー(トリス-EDTAバッファー)又はヌクレアーゼフリー水である、項目23に記載の方法。
【0281】
[0295] 項目25.第3のプールの容積は、第2のプールの容積未満である、項目1~24のいずれかに記載の方法。
【0282】
[0296] 項目26.ステップ(d)は、サイズ選択を含む、項目1~25のいずれかに記載の方法。
【0283】
[0297] 項目27.サイズ選択は、常磁性ビーズを使用した固相可逆的固定化(SPRI)、それに続くアガロースゲル抽出を含む逐次的プロセスである、項目26に記載の方法。
【0284】
[0298] 項目28.アガロースゲルは、1~5%のアガロースを含む、項目27に記載の方法。
【0285】
[0299] 項目29.アガロースゲル抽出は、ゲルボックス、e-gelシステム又は自動サイズ選択デバイスの1つを使用して実施される、項目27~28のいずれかに記載の方法。
【0286】
[0300] 項目30.アガロースゲル抽出は、5~25分間にわたって実施される、項目27~29のいずれかに記載の方法。
【0287】
[0301] 項目31.アガロースゲル抽出は、約8分間、約10分間又は約20分間にわたって実施される、項目30に記載の方法。
【0288】
[0302] 項目32.サイズ選択は、核酸分子の露出された末端を選択的に分解するエキソヌクレアーゼを第3のプールに添加することを含む、項目26に記載の方法。
【0289】
[0303] 項目33.標的核酸分子は、ヘアピンでキャップされるか、環状化されるか、又はライゲーションされてプラスミド構築体になり、及びエキソヌクレアーゼは、非標的核酸分子の露出された線形末端を分解する、項目32に記載の方法。
【0290】
[0304] 項目34.ステップ(d)は、標的核酸分子の両末端アフィニティキャプチャ又はハイブリダイゼーションキャプチャを含む、項目1~33のいずれかに記載の方法。
【0291】
[0305] 項目35.標的核酸分子は、アフィニティキャプチャを介して捕捉され得る部分をそれぞれ有する、項目34に記載の方法。
【0292】
[0306] 項目36.部分は、ビオチン又はジゴキシゲニンであり、及びアフィニティキャプチャは、ストレプトアビジン被覆ビーズ又は抗ジゴキシゲニンビーズによって実施される、項目35に記載の方法。
【0293】
[0307] 項目37.ハイブリダイゼーションキャプチャは、標的核酸分子の部分に相補的なオリゴを有するプローブの使用を伴う、項目34~36のいずれかに記載の方法。
【0294】
[0308] 項目38.プローブは、オリゴdTを含み、及び標的核酸分子は、オリゴdAテールを含む、項目37に記載の方法。
【0295】
[0309] 項目39.プローブは、プローブアフィニティキャプチャによって捕捉され得る部分を有する、項目37~38のいずれかに記載の方法。
【0296】
[0310] 項目40.部分は、ビオチン、デスチオビオチン、TEG-ビオチン、光切断可能なビオチン、フルオレセイン又はジゴキシゲニンであり、及びプローブアフィニティキャプチャは、ストレプトアビジン被覆ビーズ、フルオレセイン抗体ビーズ又はジゴキシゲニン抗体ビーズによって実施される、項目39に記載の方法。
【0297】
[0311] 項目41.ステップ(e)は、熱循環又は等温増幅の少なくとも一方を含む、項目1~40のいずれかに記載の方法。
【0298】
[0312] 項目42.熱循環は、ポリメラーゼ連鎖反応(PCR)又はリガーゼ連鎖反応(LCR)を伴う、項目41に記載の方法。
【0299】
[0313] 項目43.PCRは、複数のPCRプローブを第4のプールに添加することを伴う、項目42に記載の方法。
【0300】
[0314] 項目44.アニーリング温度、プライマーライブラリ、伸長時間、第4のプールの濃度、PCRサイクルの数又はポリメラーゼの忠実度の少なくとも1つは、キメラPCR産物の形成を軽減するように制御される、項目43に記載の方法。
【0301】
[0315] 項目45.アニーリング温度は、最大で72℃である、項目44に記載の方法。
【0302】
[0316] 項目46.第4のプールの濃度は、約0.1ng/μL~約0.0001ng/μLの範囲で希釈される、項目44~45のいずれかに記載の方法。
【0303】
[0317] 項目47.ポリメラーゼの忠実度は、Taq DNAポリメラーゼのものよりも高い、項目44~46のいずれかに記載の方法。
【0304】
[0318] 項目48.熱循環は、5~25サイクルの増幅を含む、項目42~47のいずれかに記載の方法。
【0305】
[0319] 項目49.等温増幅は、ローリングサークル増幅(RCA)、ループ媒介等温増幅(LAMP)又は鎖置換増幅(SDA)を伴う、項目41~48のいずれかに記載の方法。
【0306】
[0320] 項目50.第1のプールの容積は、1~1000Lであり、第5のプールの容積は、1~1000μLである、項目1~49のいずれかに記載の方法。
【0307】
[0321] 項目51.第5のプールを用いたアーカイブ、読み取り又は計算をさらに含む、項目1~50のいずれかに記載の方法。
【0308】
[0322] 項目52.ステップ(b)及び(c)は、標的及び非標的核酸分子を、第1のプールから、第1のプールの容積未満の容積を有するバッファーに移すことによって同時に実施される、項目1~51のいずれかに記載の方法。
【0309】
[0323] 項目53.分子は、バッファーを溶離剤として使用して容積低減モジュールから分子を溶離することにより、バッファーに移される、項目52に記載の方法。
【0310】
[0324] 項目54.ステップ(b)及び(d)は、大型アフィニティクロマトグラフィカラムを使用して第1のプールから標的核酸分子を選択することにより、同時に実施される、項目1~53のいずれかに記載の方法。
【0311】
[0325] 項目55.第1のプールは、インク配合物を使用して核酸分子を組み立てるプリンタ-フィニッシャシステムの出力である、項目1~54のいずれかに記載の方法。
【0312】
[0326] 項目56.ステップ(a)~(e)の1つ又は複数は、プリンタ-フィニッシャシステムで実施される、項目55に記載の方法。
【0313】
[0327] 項目57.第1のプールは、ステップ(a)~(e)の1つ又は複数を実施するように構成された後処理モジュールに自動的に供給される、項目55~56のいずれかに記載の方法。
【0314】
[0328] 項目58.プリンタ-フィニッシャシステムは、核酸分子が直接又は間接的に結合される表面を含み、及びステップ(a)~(e)の1つ又は複数は、核酸分子が表面に結合されている間に実施される、項目55~57のいずれかに記載の方法。
【0315】
[0329] 項目59.第1のプールは、油中水型エマルジョンである、項目1~58のいずれかに記載の方法。
【0316】
[0330] 項目60.ステップ(a)前にエマルジョンを破壊することをさらに含む、項目58に記載の方法。
【0317】
[0331] 項目61.エマルジョンを破壊することは、アニオン交換カラム又はシリカカラムを通して第1のプールを濾過することを含む、項目1~60のいずれかに記載の方法。
【0318】
[0332] 項目62.第1のプール、第2のプール、第3のプール、第4のプール及び第5のプールの1つ又は複数は、ステップ(a)~(e)の1つ又は複数の実行中、複数の区画にわたって区画化される、項目1~61のいずれかに記載の方法。
【0319】
[0333] 項目63.各区画は、ウェル、液滴、エマルジョン、孔、ビーズ、チャネル又はスポットである、項目62に記載の方法。
【0320】
[0334] 項目64.ウェルは、マイクロウェルのアレイ上のマイクロウェルであること、エマルジョンは、油中水型エマルジョンであること、液滴は、溶液中若しくはエレクトロウェッティングデバイス上にあること、孔は、基板上にあること、ビーズは、溶液中にあるか若しくは表面に付着されること、チャネルは、マイクロ流体デバイス内にあること、又はスポットは、官能化表面上にあることの少なくとも1つである、項目63に記載の方法。
【0321】
[0335] 項目65.区画は、アレイ又は基板にわたって分布する、項目62~64のいずれかに記載の方法。
【0322】
[0336] 項目66.各区画は、標的識別子のサブセットを含み、各サブセットは、情報のブロックを符号化する配列ライブラリを表す、項目62~65のいずれかに記載の方法。
【0323】
[0337] 項目67.第5のプールは、シーケンシング時、少なくとも8デシベルの信号対雑音(SNR)比を有する、項目1~66のいずれかに記載の方法。
【0324】
[0338] 項目68.SNR比は、少なくとも13デシベルである、項目67に記載の方法。
【0325】
[0339] 項目69.シーケンシングは、ナノポアシーケンシングを使用して実施される、項目67~68のいずれかに記載の方法。
【国際調査報告】