IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カタログ テクノロジーズ, インコーポレイテッドの特許一覧

特許7556792DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム
<>
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図1
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図2
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図3-1
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図3-2
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図4
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図5
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図6
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図7
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図8
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図9
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図10
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図11
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図12
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図13
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図14
  • 特許-DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-17
(45)【発行日】2024-09-26
(54)【発明の名称】DNAにおけるデータ記憶のためのプリンター-フィニッシャーシステム
(51)【国際特許分類】
   B05C 5/00 20060101AFI20240918BHJP
   B05C 11/10 20060101ALI20240918BHJP
   B05C 9/14 20060101ALI20240918BHJP
   G06N 3/12 20230101ALI20240918BHJP
   C12N 15/115 20100101ALN20240918BHJP
【FI】
B05C5/00 101
B05C11/10
B05C9/14
G06N3/12
C12N15/115 Z
【請求項の数】 20
(21)【出願番号】P 2020564328
(86)(22)【出願日】2019-05-16
(65)【公表番号】
(43)【公表日】2021-09-13
(86)【国際出願番号】 US2019032758
(87)【国際公開番号】W WO2019222562
(87)【国際公開日】2019-11-21
【審査請求日】2022-05-16
(31)【優先権主張番号】62/809,870
(32)【優先日】2019-02-25
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/672,500
(32)【優先日】2018-05-16
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/672,495
(32)【優先日】2018-05-16
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】519173978
【氏名又は名称】カタログ テクノロジーズ, インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ロケ, ナサニエル
(72)【発明者】
【氏名】パク, ヒョンジュン
(72)【発明者】
【氏名】バティア, スワプニル ピー.
(72)【発明者】
【氏名】ヘイゼル, マイク
(72)【発明者】
【氏名】デイ, リチャード
(72)【発明者】
【氏名】ハモンド, リチャード
(72)【発明者】
【氏名】ブラウン, ジェイムズ
(72)【発明者】
【氏名】リチャードソン, ロドニー
(72)【発明者】
【氏名】レッドマン, トーマス
(72)【発明者】
【氏名】リーク, デビン
【審査官】大塚 美咲
(56)【参考文献】
【文献】欧州特許出願公開第01304163(EP,A2)
【文献】米国特許第05847105(US,A)
【文献】米国特許出願公開第2005/0214775(US,A1)
【文献】国際公開第2018/057526(WO,A2)
【文献】特表平09-510452(JP,A)
【文献】特表2020-504849(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B05C 5/00
B05C 11/10
B05C 9/14
G06N 3/123
C12N 15/115
(57)【特許請求の範囲】
【請求項1】
デジタル情報の記号列における記号の記号位置と記号値を表す識別子核酸分子をアセンブルする方法であって、
プリンター-フィニッシャーシステムの第1のプリントヘッドを使用して、基板の座標上に第1の成分核酸分子を含む第1の溶液の第1の液滴を吐出するステップと、
前記第1および第2の成分核酸分子が前記基板上で並べられるように、前記システムの第2のプリントヘッドを使用して、前記基板の前記座標上に前記第2の成分核酸分子を含む第2の溶液の第2の液滴を吐出するステップと、
前記システムのフィニッシャーを使用して、前記第1および第2の成分核酸分子を連結し、前記識別子核酸分子を形成するステップであって、前記連結が前記基板の前記座標上に反応ミックスを吐出するか、前記第1および第2の成分核酸分子を連結するために必要な条件を提供するか、またはその両方によって実施される、ステップと
を含
前記識別子核酸分子は、記号列における記号の記号位置と記号値を表すように構成されている、方法。
【請求項2】
前記記号列に対応する識別子ライブラリーに前記識別子核酸分子が存在しないことは前記記号値を表す、請求項1に記載の方法。
【請求項3】
前記フィニッシャーが、前記反応ミックスを吐出する第3のプリントヘッドを含む、請求項1に記載の方法。
【請求項4】
前記フィニッシャーが、インキュベーターを含み、前記第1および第2の成分核酸分子の連結が、前記インキュベーターを使用して前記座標をインキュベートすることを含む、請求項1に記載の方法。
【請求項5】
インキュベートすることが、前記座標を固定された温度または固定された湿度のうちの少なくとも1つに供することを含む、請求項4に記載の方法。
【請求項6】
ローラーシステムを使用して、前記基板を前記第1のプリントヘッド、前記第2のプリントヘッド、および前記フィニッシャーを超えて移動させることをさらに含む、請求項1に記載の方法。
【請求項7】
前記ローラーシステムが、前記基板を線形方向に移動する少なくとも1つのローラーを含む、請求項6に記載の方法。
【請求項8】
前記基板が、連続する材料ループを含み、前記少なくとも1つのローラーが、前記基板の前記座標に前記第1のプリントヘッド、前記第2のプリントヘッド、および前記フィニッシャーを複数回通過させる前記ローラーシステムのローラーのセットの一部である、請求項7に記載の方法。
【請求項9】
前記基板が、第1の表面、ならびに前記第1の表面とは反対側の第2の表面を含み、その結果、前記第1および第2の液滴が前記第1の表面上に吐出され、前記ローラーシステムが前記第2の表面に接触する、請求項8に記載の方法。
【請求項10】
前記第1のプリントヘッドが、前記基板の異なる座標で前記第1の溶液の液滴を吐出するように構成される第1の複数のノズルを含む、請求項1に記載の方法。
【請求項11】
前記第2のプリントヘッドが、前記基板の異なる座標で前記第2の溶液の液滴を吐出するように構成される第2の複数のノズルを含む、請求項10に記載の方法。
【請求項12】
前記第1および第2のプリントヘッドが、それぞれMEMS薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドである、請求項1に記載の方法。
【請求項13】
前記フィニッシャーがプーリングシステムを含み、前記方法が、前記プーリングシステムを使用して、容器における前記識別子核酸分子を捕捉するステップをさらに含む、請求項1に記載の方法。
【請求項14】
前記捕捉された識別子核酸分子が、前記容器中にけるプーリング溶液中の追加の識別子核酸分子と共にプールされる、請求項13に記載の方法。
【請求項15】
前記プーリング溶液が、反応阻害剤を含む、請求項14に記載の方法。
【請求項16】
前記プールされた識別子核酸分子および前記プーリング溶液が前記容器においてエマルションを形成する、請求項14に記載の方法。
【請求項17】
捕捉するステップが、膜を使用して前記基板から液体を回収することを含む、請求項13に記載の方法。
【請求項18】
捕捉するステップが、スクレイパーを使用して、前記基板から液体をスクレイプすることを含む、請求項13に記載の方法。
【請求項19】
前記フィニッシャーが、ヒーターおよびPCR試薬を含む反応ミックスをさらに含み、前記方法は、前記識別子核酸分子がPCRによって増幅されるように、温度のサイクルにおいて、前記ヒーターを使用して座標を温めるステップをさらに含む、請求項1に記載の方法。
【請求項20】
前記第1および第2のプリントヘッドが前記座標上でオーバープリントするように構成されるように、前記第1および第2のプリントヘッドが、前記基板の動きと比較してある角度でシステム内に搭載される、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、「PRINTER-FINISHER SYSTEMS FOR DATA STORAGE IN DNA」と題する、2018年5月16日に出願された米国特許仮出願第62/672,500号;「COMPOSITIONS AND METHODS FOR NUCLEIC ACID-BASED DATA STORAGE」と題する2018年5月16日に出願された米国特許仮出願第62/672,495号;および「SYSTEM FOR DATA STORAGE IN DNA」と題する、2019年2月25日に出願された米国特許仮出願第62/809,870号の優先権および恩典を主張する。上記で参照した出願の全内容は、参照により本明細書に組み込まれる。
【背景技術】
【0002】
核酸デジタルデータ記憶は、情報を符号化し、長期間にわたって記憶するための安定した手法であり、データは、磁気テープまたはハードドライブ記憶システムよりも高い密度で記憶される。加えて、低温および乾燥条件で保管される核酸分子に記憶されたデジタルデータを、60,000年もの年数またはそれより長い年数を経た後に取得することができる。
【0003】
核酸分子に記憶されたデジタルデータにアクセスするために、核酸分子をシークエンシングすることができる。しかるが故に、核酸デジタルデータ記憶は、長期間にわたって記憶またはアーカイブされる大量の情報を有し得るが稀にしかアクセスされないデータを記憶させるための理想的な方法であり得る。
【0004】
現行の方法は、配列内の塩基間の関係をデジタル情報(例えば、2進コード)に直接変換するような、塩基毎の核酸配列へのデジタル情報(例えば、2進コード)の符号化に依拠する。デジタル符号化された情報のビットストリームまたはバイトに読み込むことができる、塩基毎の配列に記憶されたデジタルデータのシークエンシングは、エラーを起こしやすい可能性があり、塩基毎のデノボ核酸合成の費用が高価であり得るため符号化費用が嵩み得る。核酸デジタルデータ記憶を実施する新規方法の機会は、あまり費用が嵩まず、商業的インプリメンテーションがより容易である、データの符号化および取得のための手法を提供し得る。
【発明の概要】
【課題を解決するための手段】
【0005】
本開示のシステム、アセンブリ、および方法は、一般的にデジタル情報を記憶するDNA分子の創出に関する。例えば、成分核酸分子(例えば、成分)を選択し、ウェビングなどの基板材料上に個々に吐出する。成分は、同一場所に位置するように基板上の同じ位置(例えば、座標)に印刷または吐出される。成分は、自己アセンブルするように、または別のやり方で既定の順序で選別し、識別子核酸分子(例えば、識別子)を形成するように構成される。各識別子は、記号列(例えばビットストリーム)における特定の記号(例えば、ビットまたは一連のビット)またはその記号位置(例えば、ランクまたはアドレス)に対応する。成分をアセンブルするために、システムは、同じ位置に反応ミックスを印刷または吐出し、それによって成分を位置揃えして識別子を形成することができる。あるいはまたは加えて、システムは成分を位置揃えする特定の温度などの、成分を物理的に連結させるために必要な条件を提供することができる。形成後、複数の識別子を、記号列全体の少なくとも一部を表す識別子のプールに組み合わせることができる。
【0006】
本明細書において、少なくとも第1の成分核酸分子および第2の成分核酸分子から識別子核酸分子をアセンブルすることによってデジタル情報を記憶するためのシステムおよびアセンブリを提供する。システムは、(a)基板の座標上に第1の成分核酸分子を含む第1の溶液の第1の液滴を吐出するように構成された第1のプリントヘッドと、(b)第1および第2の成分核酸分子が基板上でコロケートされるように、基板の座標上に第2の成分核酸分子を含む第2の溶液の第2の液滴を吐出するように構成された第2のプリントヘッドと、(c)第1および第2の成分核酸分子を物理的に連結するように基板の座標上に反応ミックスを吐出するか、第1および第2の成分核酸分子を物理的に連結するために必要な条件を提供するか、またはその両方であるフィニッシャーとを含み得る。一般的に、第1および第2のプリントヘッドは、様々な成分を印刷または吐出する任意の数のプリントヘッドの列および対応するノズルを含むシステムの一部であり得る。
【0007】
一部のインプリメンテーションでは、識別子核酸分子は、記号列における記号位置および記号値を表す。例えば、列における各記号は、対応する記号位置を表す対応する識別子を有し得る。特に、識別子は、対応する記号値が1である場合に創出され得るが、0値を有する記号を表す識別子は創出されない。列における記号の全ての識別子が創出される場合、プール内の特定の識別子の存在が、対応する記号位置に関して1の値を表すが、プール内の特定の識別子の非存在が、対応する記号位置の0の値を表すように、列の識別子分子をプール内で組み合わせることができる。対応する記号値が0である場合に識別子が創出されるが、1の値を有する記号を表す識別子が創出されない、代替アプローチをとってもよい。一部のインプリメンテーションでは、フィニッシャーは、基板の座標上に反応ミックスを吐出するように構成される第3のプリントヘッドを含む。フィニッシャーは、インキュベーター、プーリングシステム、またはその両方をさらに含み得る。インキュベーターは、成分をアセンブルして識別子核酸分子を形成するために、反応を進行させるために必要な特定の温度条件または条件のセットを提供し得る。以下に、プーリングシステムを考察する。
【0008】
一部のインプリメンテーションでは、フィニッシャーは、第1のプリントヘッドが座標上に第1の液滴を吐出する前に、第2のプリントヘッドが座標上に第2の液滴を吐出する前に、またはその両方で座標上に反応ミックスを吐出する。一般的に、フィニッシャーは、任意の時間で、任意の液滴が吐出される前、第1の液滴が吐出された後であるが、最後の液滴が吐出される前、または全ての液滴が吐出された後に、座標上に反応ミックスを吐出してもよい。
【0009】
一部のインプリメンテーションでは、システムは、第1のプリントヘッド、第2のプリントヘッド、およびフィニッシャーを超えて基板を移動させる少なくとも1つのローラーを含む。一部のインプリメンテーションでは、ローラーは、基板の線形の移動を提供する。一般的に、ローラーは、第1および第2のプリントヘッドならびにフィニッシャーの各々を1回限りまたは複数回通過し得る、基板の二次元または三次元の移動を提供してもよい。一部のインプリメンテーションでは、ローラーは、一定速度での基板の線形の移動を達成するリール・トゥ・リールシステムの一部である。
【0010】
一部のインプリメンテーションでは、基板は、連続する材料ループを形成し、少なくとも1つのローラーは、基板の座標上に、第1のプリントヘッド、第2のプリントヘッド、およびフィニッシャーを複数回通過させるローラーのセットの一部である。一般的に、基板上に吐出される材料の任意のこすれまたは起こり得る汚れを防止するために、少なくとも1つのローラーが基板上のいずれの座標にも接触しないようにシステムを構成することが望ましいであろう。特に、基板は、第1の液滴、第2の液滴、および反応ミックスが吐出される第1の表面、ならびに第1の表面とは反対側の第2の表面を有し、少なくとも1つのローラーは、第2の表面に接触するが第1の表面には接触しない。あるいは、たとえローラーの少なくとも1つが第1の表面に接触しても、ローラーは、材料が吐出される座標のいずれかに接触することを回避するように溝を有し得る。
【0011】
一部のインプリメンテーションでは、システムは、少なくとも1つの谷を含む第2のローラーを含み、第2のローラーは、少なくとも1つの谷が座標と位置揃えするように、第1の表面に接触する。一部のインプリメンテーションでは、システムは、第2のローラーが第2の表面に接触し、第1の表面に接触しないように、基板が、少なくとも1つのローラーと第2のローラーとの間で180度回転するか、またはらせん軌道にある、第2のローラーを含む。
【0012】
一部のインプリメンテーションでは、座標は、基板上の他の座標から1マイクロメートルから200マイクロメートルの間の直径または間隔を有する。一部のインプリメンテーションでは、第1および第2の液滴は各々、1pL~50pLの間の体積を有する。
【0013】
一部のインプリメンテーションでは、システムは、基板の座標と第1および第2のプリントヘッドとの間のアライメントを維持するために基板の動きをリアルタイムで追跡するレジスターを含む。一部のインプリメンテーションでは、第1および第2の溶液は、色素を組み入れ、システムは第1および/または第2の液滴の適切な吐出を確認するカメラを含むスポットイメージャーを含む。
【0014】
一部のインプリメンテーションでは、システムは、基板上の第1および第2の液滴を乾燥させるスポットドライヤーを含む。一部のインプリメンテーションでは、第1のプリントヘッドは、基板の異なる座標で第1の溶液の液滴を吐出する第1の複数のノズルを含む。一部のインプリメンテーションでは、第1のプリントヘッドは、基板の異なる座標で第3の溶液の液滴を吐出する第2の複数のノズルを含む。
【0015】
一部のインプリメンテーションでは、システムは、基板を含む。一部のインプリメンテーションでは、基板は、低結合性プラスチックを含む。一部のインプリメンテーションでは、基板は、ポリエチレンテレフタレート(PET)またはポリプロピレンを含む。
【0016】
一部のインプリメンテーションでは、第1および第2のプリントヘッドは、基板の動きに対して座標上でのオーバープリントを可能にするある角度でシステム内に搭載される。一部のインプリメンテーションでは、第1のプリントヘッドは、MEMS薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドである。一部のインプリメンテーションでは、第1および第2のプリントヘッドは、座標上で液滴を吐出するために同じトラックに沿って位置し、システムは、対応するトラックにおける別の座標上に液滴を吐出するために少なくとも1つの追加のトラックに沿って位置する追加のプリントヘッドを含む。
【0017】
一部のインプリメンテーションでは、フィニッシャーは、反応のインキュベーションにとって最適な固定された内部温度を有する。一部のインプリメンテーションでは、フィニッシャーは、インキュベーションの間に反応ミックスの蒸発を制御する固定された湿度レベルを有する。一部のインプリメンテーションでは、フィニッシャーは、濃縮を防止するためにインキュベーション前に基板を加熱するヒーターを含む。一部のインプリメンテーションでは、フィニッシャーは、基板の異なる座標からの複数の反応物を容器に統合するプーリングシステムを含む。一部のインプリメンテーションでは、フィニッシャーは、統合前に基板の座標上に反応阻害剤を吐出する。
【0018】
一部のインプリメンテーションでは、容器は、プーリング溶液反応阻害剤を含有する。一部のインプリメンテーションでは、反応阻害剤は、エチレンジアミン四酢酸(EDTA)である。
【0019】
一部のインプリメンテーションでは、システムは、基板上の異なる座標から回収した液体から核酸を捕捉する膜を含む。一部のインプリメンテーションでは、システムは、基板から核酸を取り出すスクレイパーを含む。一部のインプリメンテーションでは、異なる座標からの複数の反応物は、プールされた後に複数の反応物がその内容物を維持することを可能にするエマルションに共にプールされる。
【0020】
一部のインプリメンテーションでは、基板は、非混和性の液体またはオイルによってコーティングされる。一部のインプリメンテーションでは、システムは、座標上にオイルを吐出するオイルディスペンサーを含む。一部のインプリメンテーションでは、基板は、第1および第2の成分核酸分子に結合するビーズによってコーティングされるか、またはパターン形成される。一部のインプリメンテーションでは、システムは、座標上にビーズを吐出するビーズディスペンサーを含む。
【0021】
一部のインプリメンテーションでは、反応ミックスはリガーゼを含む。一部のインプリメンテーションでは、第1の溶液、第2の溶液、および反応ミックスは添加剤を含む。一部のインプリメンテーションでは、添加剤は、第1の溶液と第1のプリントヘッド、第2の溶液と第2のプリントヘッド、または反応ミックスとフィニッシャーとの適合性を可能にするように構成される。一部のインプリメンテーションでは、添加剤は、第1の溶液、第2の溶液、または反応ミックスの蒸発を軽減する。一部のインプリメンテーションでは、添加剤は、湿潤剤、界面活性剤、および殺生物剤のうちの少なくとも1つを含む。
【0022】
一部のインプリメンテーションでは、システムは、システムを操作するための指示を実行するように構成されたコンピュータプロセッサを含む。指示は、(1)例えばローラーのセットを制御することによって、基板を、プリントヘッドを超えて移動させるための指示のセット、および(2)各プリントヘッドまたは対応するノズルが溶液を吐出する時間を指定するための指示の別のセットを含み得る。
【0023】
ある態様では、本開示は、核酸分子をアセンブルするためのシステムであって、(a)基板の座標上に第1の成分核酸分子を含む第1の溶液の第1の液滴を吐出するように構成された第1のプリントヘッドと、(b)第1および第2の成分核酸分子が基板上でコロケートされるように、基板の座標上に第2の成分核酸分子を含む第2の溶液の第2の液滴を吐出するように構成された第2のプリントヘッドと、(c)第1および第2の成分核酸分子を物理的に連結するように基板の座標上に反応ミックスを吐出するか、第1および第2の成分核酸分子を物理的に連結するために必要な条件を提供するか、またはその両方であるフィニッシャーとを含むシステムを提供する。
【0024】
一部のインプリメンテーションでは、フィニッシャーは、基板の座標上に反応ミックスを吐出するように構成された第3のプリントヘッドを含む。フィニッシャーは、インキュベーター、プーリングシステム、または両方をさらに含み得る。一般的に、フィニッシャーは、任意の時点で反応ミックスを吐出し得る。具体的には、反応ミックスは、第1のプリントヘッドが座標上に第1の液滴を吐出する前に、第2のプリントヘッドが座標上に第2の液滴を吐出する前に、または両方で座標に吐出され得る。
【0025】
一部のインプリメンテーションでは、アセンブルされた核酸分子は、遺伝子コードDNA、ペプチドコードDNA、またはRNAコードDNAを含む。アセンブルされた核酸分子は、DNAアプタマーライブラリーを含み得る。
参照による引用
【0026】
本明細書で言及される全ての公表文献、特許および特許出願は、個々の公表文献、特許または特許出願各々が参照により組み込まれると具体的かつ個別に示されている場合と同程度に、参照により本明細書に組み込まれる。参照により組み込まれる公表文献および特許または特許出願が、本明細書に収載される本開示と相反する場合は、本明細書は、一切のそのような相反する物質に取って代わるおよび/または優先するように意図されている。
【0027】
本発明の新規特色を添付の特許請求の範囲において詳しく記載する。本発明の特色および利点のより良好な理解は、本発明の原理を利用する例示的なインプリメンテーションを記載する以下の詳細な説明、および添付の図面(同様に、本明細書における「図面」および「図」)を参照することによって得られるであろう。
【図面の簡単な説明】
【0028】
図1図1は、インクジェットプリンティングを使用して迅速かつハイスループット様式で成分からDNA識別子をアセンブルすることによって、DNAにデジタル情報を記憶させるための例としてのシステムを例証する図である。システムおよびその異なる実施形態を、本明細書において以降「プリンター-フィニッシャーシステム」または「PFS」と称する。
【0029】
図2図2は、プリンターサブシステムの例をより詳細に示す図である。プリントヘッドは、ウェブの同じ座標に異なる成分をオーバープリントするように設計される。
【0030】
図3-1】図3A~Dは、プリンターにおけるプリントヘッドの例を描く図である。
図3-2】図3A~Dは、プリンターにおけるプリントヘッドの例を描く図である。
【0031】
図4図4は、プリンター内のプリントヘッドの可能な配置を描く図である。
【0032】
図5図5は、プリンターサブシステムにおけるスポットイメージャーの例としてのセットアップを実証する図である。
【0033】
図6図6は、フィニッシャーサブシステムの例をより詳細に示す図である。基板の各座標上に反応ミックスを吐出する部分に加えて、フィニッシャーはまた、統合前に基板の各座標上に反応阻害剤を吐出する部分も含み得る。
【0034】
図7図7は、インキュベーション相の間にフィニッシャーを通じてウェブを通過させるためのローラーのループの例を示す図である。
【0035】
図8図8は、インキュベーションの間に予想される平衡体積に及ぼす反応ミックスグリセロール組成物およびフィニッシャー湿度の効果を例証する図である。
【0036】
図9図9は、ウェブからの全ての反応を1つの容器に統合する例としてのプーリングシステムを例証する図である。
【0037】
図10図10は、PFSを通じてのデータ転送パイプラインの実施形態の概略図を描く図である。
【0038】
図11図11は、4つのモジュール:シャーシモジュール、プリントエンジンモジュール、インキュベーターモジュール、およびプーリングモジュールを含むPFSの実施形態を例証する図である。
【0039】
図12図12は、反応液滴をエマルションにプールするPFSの実施形態を例証する図である。
【0040】
図13図13は、ウェビング上に印刷された後、反応液滴がオイル(または別の非混和性の液体)によってコーティングされるPFSの実施形態を例証する図である。
【0041】
図14図14は、反応液滴が、印刷されたDNA成分に結合するビーズを含有するPFSの実施形態を例証する図である。
【0042】
図15図15は、ビーズに結合したDNA成分がエマルションを使用して識別子にどのように処理され得るかの例を例証する図である。
【発明を実施するための形態】
【0043】
定義
用語「成分」は、本明細書で使用される場合、核酸配列を一般に指す。成分は、区別可能な配列であることがある。成分は、他の核酸配列または分子を生成するように、1つまたは複数の他の成分と連結またはアセンブルされることもある。
【0044】
用語「層」は、本明細書で使用される場合、成分の群またはプールを一般に指す。各層は、1つの層内の成分が別の層内の成分と異なるような、1セットの区別可能な成分を含むことがある。1つまたは複数の層からの成分は、1つまたは複数の識別子を生成するようにアセンブルされることもある。
【0045】
用語「識別子」は、本明細書で使用される場合、より大きいビット列内のビット列の位置および値を表す、核酸分子または核酸配列を一般に指す。より一般的には、識別子は、記号列中の記号を表す、または記号列中の記号に対応する、任意のオブジェクトを指すことがある。一部のインプリメンテーションでは、識別子は、1つまたは複数の連結された成分を含み得る。
【0046】
用語「識別子ライブラリー」は、本明細書で使用される場合、デジタル情報を表す記号列中の記号に対応する識別子の集合体を一般に指す。一部のインプリメンテーションでは、識別子ライブラリー中の所与の識別子の非存在は、特定の位置における記号値を示すことができる。1つまたは複数の識別子ライブラリーを、識別子のプール、群、またはセットの中で組み合わせることができる。各識別子ライブラリーは、識別子ライブラリーを識別する一意のバーコードを含むこともある。
【0047】
用語「核酸」は、本明細書で使用される場合、デオキシリボ核酸(DNA)、リボ核酸(RNA)、またはこれらのバリアントを一般に指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)、またはそのバリアントから選択される1つまたは複数のサブユニットを含み得る。ヌクレオチドは、A、C、G、TもしくはU、またはそのバリアントを含み得る。ヌクレオチドは、成長核酸鎖に組み込むことができる任意のサブユニットを含み得る。そのようなサブユニットは、A、C、G、TもしくはUであることもあり、あるいはより多くの相補的A、C、G、TもしくはUのうちの1つに特異的であり得る、またはプリン(すなわち、AもしくはG、またはそのバリアント)もしくはピリミジン(すなわち、C、TもしくはU、またはそのバリアント)と相補的であり得る、任意の他のサブユニットであることもある。一部の例では、核酸は、一本鎖状または二本鎖状であり得、一部の場合には、核酸分子は環状である。
【0048】
用語「核酸分子」または「核酸配列」は、本明細書で使用される場合、デオキシリボヌクレオチド(DNA)もしくはリボヌクレオチド(RNA)のどちらかかまたはその類似体である、様々な長さを有し得る、多量体型のヌクレオチド、またはポリヌクレオチドを一般に指す。用語「核酸配列」は、ポリヌクレオチドのアルファベット表現を指すことがあり、あるいは、この用語は、物理的なポリヌクレオチド自体に適用されることもある。このアルファベット表現を、中央処理装置を有するコンピュータ内のデータベースに入力し、核酸配列または核酸分子を記号またはビットにマッピングするために、したがってデジタル情報を符号化するために、使用することができる。核酸配列またはオリゴヌクレオチドは、1つまたは複数の非標準ヌクレオチド、ヌクレオチド類似体および/または改変ヌクレオチドを含むこともある。
【0049】
「オリゴヌクレオチド」は、本明細書で使用される場合、一本鎖核酸配列を一般に指し、アデニン(A)、シトシン(C)、グアニン(G)およびチミン(T)という、またはポリヌクレオチドがRNAの場合はアデニン(A)、シトシン(C)、グアニン(G)およびウラシル(U)という、4つのヌクレオチド塩基の特異的配列で、概して構成されている。
【0050】
改変ヌクレオチドの例としては、ジアミノプリン、5-フルオロウラシル、5-ブロモウラシル、5-クロロウラシル、5-ヨードウラシル、ヒポキサンチン、キサンチン、4-アセチルシトシン、5-(カルボキシヒドロキシメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ-D-ガラクトシルキューオシン、イノシン、N6-イソペンテニルアデニン、1-メチルグアニン、1-メチルイノシン、2,2-ジメチルグアニン、2-メチルアデニン、2-メチルグアニン、3-メチルシトシン、5-メチルシトシン、N6-アデニン、7-メチルグアニン、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、ベータ-D-マンノシルキューオシン、5’-メトキシカルボキシメチルウラシル、5-メトキシウラシル、2-メチルチオ-D46-イソペンテニルアデニン、ウラシル-5-オキシ酢酸(v)、ワイブトキソシン、シュードウラシル、キューオシン、2-チオシトシン、5-メチル-2-チオウラシル、2-チオウラシル、4-チオウラシル、5-メチルウラシル、ウラシル-5-オキシ酢酸メチルエステル、ウラシル-5-オキシ酢酸(v)、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、(acp3)w、2,6-ジアミノプリンなどが挙げられるが、これらに限定されない。核酸分子は、塩基部分が(例えば、相補的ヌクレオチドと水素結合を形成するために通常は利用可能である1つもしくは複数の原子が、および/または相補的ヌクレオチドと水素結合を形成することが通常はできない1つもしくは複数の原子が)修飾されていることもあり、糖部分が修飾されていることもあり、またはリン酸骨格が修飾されていることもある。核酸分子は、N-ヒドロキシコハク酸エステル(NHS)などのアミン反応性部分の共有結合を可能にするためにアミノアリル-dUTP(aa-dUTP)およびアミノヘキシルアクリルアミド(aminohexhylacrylamide)-dCTP(aha-dCTP)などのアミン修飾基を含有することもある。
【0051】
用語「プライマー」は、本明細書で使用される場合、ポリメラーゼ連鎖反応(PCR)などの核酸合成のための出発点としての役立つ核酸鎖を一般に指す。一例では、DNA試料の複製中に、複製を触媒する酵素が、DNA試料に結合したプライマーの3’末端で複製を開始し、反対側の鎖をコピーする。
【0052】
用語「ポリメラーゼ」または「ポリメラーゼ酵素」は、本明細書で使用される場合、ポリメラーゼ反応を触媒することができる任意の酵素を一般に指す。ポリメラーゼの例としては、限定ではないが、核酸ポリメラーゼが挙げられる。ポリメラーゼは、天然に存在することもあり、または合成されることもある。ポリメラーゼの例は、Φ29ポリメラーゼまたはその誘導体である。一部の場合には、転写酵素またはリガーゼ(すなわち、結合の形成を触媒する酵素)が、新たな核酸配列を構築するために、ポリメラーゼと併せてまたはポリメラーゼの代替として使用される。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、熱安定性ポリメラーゼ、野生型ポリメラーゼ、改変ポリメラーゼ、E.coli DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(ファイ29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、PfuポリメラーゼPwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、SsoポリメラーゼPocポリメラーゼ、Pabポリメラーゼ、MthポリメラーゼES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、Platinum Taqポリメラーゼ、Tbrポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’→5’エキソヌクレアーゼ活性を有するクレノウ断片ポリメラーゼ、ならびにこれらのバリアント、改変産物および誘導体が挙げられる。
【0053】
2進コードの形での、コンピュータデータなどの、デジタル情報は、記号の配列または記号列を含み得る。2進コードは、例えば、ビットと呼ばれる2つの2進記号、通常は0および1、を有する2進法を使用して、テキストまたはコンピュータプロセッサ命令を符号化することまたは表すことができる。デジタル情報は、非2進記号の配列を含み得る非2進コードの形で表すことができる。符号化された各記号を、一意のビット列(または「バイト」)に再び割り当てることができ、一意のビット列またはバイトを、バイト列またはバイトストリームに配列することができる。所与のビットについてのビット値は、2つの記号のうちの1つ(例えば、0または1)であり得る。Nビットの列を含むことができるバイトは、合計2の一意のバイト値を有することができる。例えば、8ビットを含むバイトは、合計2または256の可能な一意のバイト値を生じさせることができ、256バイトの各々は、バイトで符号化することができる256の可能な区別可能な記号、文字または命令のうちの1つに対応し得る。生データ(例えば、テキストファイルおよびコンピュータ命令)を、バイト列またはバイトストリームとして表すことができる。zipファイル、または生データを含む圧縮データファイルを、バイトストリームで記憶することもでき、これらのファイルを圧縮形でバイトストリームとして記憶し、そしてその後、コンピュータにより読み取られる前に生データに復元することができる。
概要
【0054】
インクジェットプリンターシステムを使用してデジタル情報を核酸に符号化するこれまでの方法は、核酸の塩基毎の合成に依存しており、これは費用が高く、かつ時間がかかり得る。例えば、インクジェットプリンターに基づく技術はこれまで、マイクロリアクターチップ上でのオリゴヌクレオチド合成のために使用されている。しかし、これらの技術は、各合成ラウンドの間に単一のオリゴヌクレオチドを付加するために、4ステップ(脱保護、カップリング、キャッピング、および酸化)の固相ホスホロアミダイトサイクル反応の利用を必要とする塩基毎の合成を利用している。本明細書に記載される新規方法は、各成分(例えば、核酸配列)が、基板上に吐出され(例えば、印刷され)、成分の各々が単一の反応で物理的に連結されるように反応混合物および/または条件が提供される成分の組合せ配置を使用して、デジタル情報を符号化することができる。
【0055】
情報は、核酸配列に記憶させることができる。本開示のいくつかの態様では、本明細書において1つまたは複数の成分から構築される識別子にデジタル情報を符号化する方法が提供される。各成分は、核酸配列を含み得る。プリンター-フィニッシャーシステム(またはPFS)として公知であるプリントに基づくシステムを使用して、識別子を構築するための成分をコロケートしてアセンブルすることができる。PFSは、2つのサブシステム、すなわちプリンターおよびフィニッシャーを含み得る。PFSは、1つのシステム、すなわち成分および反応ミックスの両方を基板上に吐出するプリンターを含み得る。一部のインプリメンテーションでは、2つのサブシステムは結合され、個々の機能に関して互いに従属し得る。他のインプリメンテーションでは、2つのサブシステムは分離しており、独立して機能することが可能であり得る。
情報を核酸配列に符号化するおよび書き込む方法
【0056】
ある態様では、本開示は、情報を核酸配列に符号化する方法を提供する。核酸配列に情報を符号化する方法は、(a)情報を記号列に変換するステップと、(b)記号列を複数の識別子にマッピングするステップと、(c)複数の識別子の少なくともサブセットを含む識別子ライブラリーを構築するステップとを含み得る。複数の識別子のうちの個々の識別子は、1つまたは複数の成分を含み得る。1つまたは複数の成分のうちの個々の成分は、核酸配列を含み得る。記号列中の各位置における各記号は、区別可能な識別子に対応し得る。個々の識別子は、記号列中の個々の位置の個々の記号に対応し得る。さらに、記号列中の各位置における1つの記号は、識別子の非存在に対応し得る。例えば、「0」および「1」の2進記号(例えば、ビット)列における「0」の出現各々が、識別子の非存在に対応し得る。
【0057】
別の態様では、本開示は、核酸ベースのコンピュータデータ記憶のための方法を提供する。核酸ベースのコンピュータデータ記憶のための方法は、(a)コンピュータデータを受信するステップと、(b)コンピュータデータを符号化する核酸配列を含む核酸分子を合成するステップと、(c)核酸配列を有する核酸分子を記憶させるステップとを含み得る。コンピュータデータは、合成された核酸分子の少なくともサブセットに符号化され、核酸分子の各々の配列に符号化されないことがある。
【0058】
別の態様では、本開示は、核酸配列に情報を書き込むおよび記憶させる方法を提供する。この方法は、(a)情報を表す仮想識別子ライブラリーを受信または符号化するステップと、(b)識別子ライブラリーを物理的に構築するステップと、(c)識別子ライブラリーの1つまたは複数の物理的コピーを1つまたは複数の別々の位置に記憶させるステップとを含み得る。識別子ライブラリーの個々の識別子は、1つまたは複数の成分を含み得る。1つまたは複数の成分のうちの個々の成分は、核酸配列を含み得る。
【0059】
別の態様では、本開示は、核酸ベースのコンピュータデータ記憶のための方法を提供する。核酸ベースのコンピュータデータ記憶のための方法は、(a)コンピュータデータを受信するステップと、(b)コンピュータデータを符号化する少なくとも1つの核酸配列を含む核酸分子を合成するステップと、(c)少なくとも1つの核酸配列を含む核酸分子を記憶させるステップとを含み得る。核酸分子を合成するステップは、塩基毎の核酸合成の非存在下でのステップであり得る。
【0060】
別の態様では、本開示は、核酸配列に情報を書き込むおよび記憶させる方法を提供する。核酸配列に情報を書き込むおよび記憶させる方法は、(a)情報を表す仮想識別子ライブラリーを受信または符号化するステップと、(b)識別子ライブラリーを物理的に構築するステップと、(c)識別子ライブラリーの1つまたは複数の物理的コピーを1つまたは複数の別々の位置に記憶させるステップとを含み得る。識別子ライブラリーの個々の識別子は、1つまたは複数の成分を含み得る。1つまたは複数の成分のうちの個々の成分は、核酸配列を含み得る。
核酸配列に記憶された情報を読み取る方法
【0061】
別の態様では、本開示は、核酸配列に符号化された情報を読み取る方法を提供する。核酸配列に符号化された情報を読み取る方法は、(a)識別子ライブラリーを用意するステップと、(b)識別子ライブラリー中に存在する識別子を識別するステップと、(c)識別子ライブラリー中に存在する識別子から記号列を生成するステップと、(d)記号列から情報をコンパイルするステップとを含み得る。識別子ライブラリーは、組合せ空間からの複数の識別子のサブセットを含み得る。識別子のサブセットの個々の識別子各々は、記号列中の個々の記号に対応し得る。識別子は、1つまたは複数の成分を含み得る。成分は、核酸配列を含み得る。
【0062】
情報を本明細書の他の箇所に記載されているように1つまたは複数の識別子ライブラリーに書き込むことができる。識別子を、本明細書の他の箇所に記載の任意の方法を使用して構築することができる。本明細書の他の箇所に記載の任意の方法を使用して、記憶されたデータをコピーすることおよび記憶されたデータにアクセスすることができる。
【0063】
識別子は、符号化された記号の位置、符号化された記号の値、または符号化された記号の位置と値の両方に関する情報を含み得る。識別子は、符号化された記号の位置に関する情報を含むことがあり、識別子ライブラリー中の識別子の存在または非存在は、記号の値を示すことができる。識別子ライブラリー中の識別子の存在は、2進列中の第1の記号値(例えば、第1のビット値)を示すことができ、識別子ライブラリー中の識別子の非存在は、2進列中の第2の記号値(例えば、第2のビット値)を示すことができる。二進法で、識別子ライブラリー中の識別子の存在または非存在に関するビット値を偏らせることで、アセンブルされる識別子の数を低減させることができ、したがって、書き込み時間を短縮することができる。一例では、識別子の存在は、マッピングされた位置における「1」のビット値を示すことができ、識別子の非存在は、マッピングされた位置における「0」のビット値を示すことができる。
【0064】
1つの情報についての記号(例えば、ビット値)の生成は、記号(例えば、ビット)をマッピングまたは符号化することができる識別子の存在または非存在を識別することを含み得る。識別子の存在または非存在の決定は、識別子の存在を検出するために存在する識別子をシークエンシングすることまたはハイブリダイゼーションアレイを使用することを含み得る。一例では、符号化された配列の復号および読み取りを、シークエンシングプラットフォームを使用して行うことができる。シークエンシングプラットフォームの例は、2014年8月21日に出願された米国特許出願第14/465,685号;2013年5月2日に出願された米国特許出願第13/886,234号;および2009年3月9日に出願された米国特許出願第12/400,593号に記載されており、その各々の全体が、参照により本明細書に組み込まれる。
【0065】
一例では、核酸符号化データの復号は、Illumina(登録商標)Sequencingなどの、核酸鎖の塩基毎のシークエンシングにより果たすことができ、またはキャピラリー電気泳動による断片化解析などの、特定の核酸配列の存在もしくは非存在を示すシークエンシング技術を利用することにより果たすことができる。シークエンシングは、可逆的ターミネーターの使用を利用することもある。シークエンシングは、天然または非天然(例えば、操作された)ヌクレオチドまたはヌクレオチド類似体の使用を利用することもある。あるいは、または加えて、核酸配列の復号は、光学的、電気化学的または化学的シグナルを生成する任意の方法を含むがこれらに限定されない、様々な分析技術を使用して行うことができる。ポリメラーゼ連鎖反応(PCR)、デジタルPCR、サンガーシークエンシング、ハイスループットシークエンシング、1塩基合成反応、単一分子シークエンシング、ライゲーションによるシークエンシング、RNA-Seq(Illumina)、次世代シークエンシング、デジタル遺伝子発現(Helicos)、クローナルシングルマイクロアレイ(Solexa)、ショットガンシークエンシング、マクサム(Maxim)・ギルバートシークエンシング、または大規模並列シークエンシングを含むがこれらに限定されない、様々なシークエンシング手法を使用することができる。
【0066】
様々な読み出し方法を使用して、符号化された核酸から情報を引き出すことができる。一例では、マイクロアレイ(または任意の種類の蛍光ハイブリダイゼーション)、デジタルPCR、定量的PCR(qPCR)、および様々なシークエンシングプラットフォームをさらに使用して、符号化された配列、および伸長によりデジタル符号化されたデータを、読み出すことができる。
【0067】
識別子ライブラリーは、情報についてのメタデータを提供する補足核酸配列、情報を隠蔽もしくはマスクする補足核酸配列、またはメタデータの提供も情報のマスクもする補足核酸配列を、さらに含み得る。補足核酸を識別子の識別と同時に識別することができる。あるいは、識別子を識別する前または識別した後に、補足核酸を識別することができる。一例では、補足核酸配列は、符号化された情報の読み取り中に識別されない。補足核酸配列を識別子と区別できないこともある。識別子インデックスまたはキーを使用して、補足核酸分子と識別子を差別化することができる。
【0068】
より少ない核酸分子の使用を可能にするように入力ビット列を再符号化することにより、データの符号化および復号効率を高めることができる。例えば、符号化方法で3つの核酸分子(例えば、識別子)にマッピングされ得る「111」部分列が高度に出現する入力列を受信した場合、それを、核酸分子の空集合にマッピングされ得る「000」部分列に再符号化することができる。「000」の代替入力部分列を「111」に再符号化することもできる。この再符号化方法は、データセット中の「1」の数が低減され得るため、データを符号化するために使用される核酸分子の総量を低減させることができる。この例では、データセットの総サイズを、新しいマッピング命令を指定するコードブックに対応するように増加させることができる。符号化および復号効率を高めるための代替方法は、可変長を短縮するように入力列を再符号化することであり得る。例えば、「111」を「00」に再符号化することができ、これは、データセットのサイズを縮小し、データセット中の「1」の数を低減させることができる。
【0069】
検出を容易にするために識別子を特異的に設計することにより、核酸符号化データを復号する速度および効率を制御する(例えば、高める)ことができる。例えば、検出を容易にするために設計される核酸配列(例えば、識別子)は、それらの光学的、電気化学的、化学的または物理学的特性に基づいて呼び出すことおよび検出することがより容易であるヌクレオチドの大部分を含む核酸配列を含み得る。操作された核酸配列は、一本鎖状または二本鎖状のどちらであってもよい。操作された核酸配列は、核酸配列の検出可能な特性を向上させる合成または非天然ヌクレオチドを含むこともある。操作された核酸配列は、全て天然ヌクレオチドを含むこともあり、全て合成もしくは非天然ヌクレオチドを含むこともあり、または天然ヌクレオチドと合成ヌクレオチドと非天然ヌクレオチドの組合せを含むこともある。合成ヌクレオチドとしては、ヌクレオチド類似体、例えば、ペプチド核酸、ロックド核酸、グリコール核酸およびトレオース核酸を挙げることができる。非天然ヌクレオチドとしては、dNaM、3-メトキシ-2-ナフチル基を含有する人工ヌクレオシド、およびd5SICS、6-メチルイソキノリン-1-チオン-2-イル基を含有する人工ヌクレオシド、を挙げることができる。操作された核酸配列は、増強された光学的特性などの、単一の増強された特性のために設計されることもあり、または設計される核酸配列は、増強された光学的および電気化学的特性もしくは増強された光学的および化学的特性などの、複数の増強された特性を考慮して設計されることもある。
【0070】
操作された核酸配列は、核酸配列の光学的、電気化学的、化学的または物理的特性を向上させない、反応性天然、合成および非天然ヌクレオチドを含むこともある。核酸配列の反応性成分は、核酸配列に向上した特性を付与する化学的部分の付加を可能にし得る。各核酸配列は、単一の化学的部分を含むこともあり、または複数の化学的部分を含むこともある。化学的部分の例としては、蛍光部分、化学発光部分、酸性または塩基性部分、疎水性または親水性部分、および核酸配列の酸化状態または反応性を変更する部分が挙げられるが、これらに限定されない。
【0071】
シークエンシングプラットフォームを核酸配列に符号化された情報の復号および読み取りのために特異的に設計することができる。シークエンシングプラットフォームを一本鎖または二本鎖核酸分子のシークエンシング専用にすることができる。シークエンシングプラットフォームは、個々の塩基を読み取ること(例えば、塩基毎のシークエンシング)により、または核酸分子(例えば、識別子)に組み込まれた全核酸配列(例えば、成分)の存在もしくは非存在を検出することにより、核酸符号化データを復号することができる。シークエンシングプラットフォームは、無差別な試薬の使用、読み取り長の延長の使用、および検出可能な化学的部分の付加による特定の核酸配列の検出の使用を含むことができる。シークエンシング中のより多くの無差別な試薬の使用は、より速い塩基呼び出しを可能にすることにより読み取り効率を高めることができ、その結果としてシークエンシング時間を短縮することができる。読み取り長の延長の使用は、符号化された核酸のより長い配列を読み取り毎に復号することを可能にし得る。検出可能な化学的部分タグの付加は、化学的部分の存在または非存在により核酸配列の存在または非存在の検出を可能にし得る。例えば、情報のビットを符号化する各核酸配列に、一意の光学的、電気化学的または化学的シグナルを生成する化学的部分で、タグ付けすることができる。その一意の光学的、電気化学的または化学的シグナルの存在または非存在は、「0」または「1」ビット値を示すことができる。核酸配列は、単一の化学的部分を含むこともあり、または複数の化学的部分を含むこともある。データを符号化するための核酸配列の使用の前に、化学的部分を核酸配列に付加させることができる。あるいは、または加えて、データの符号化後だが、データを復号する前に、化学的部分を核酸配列に付加させることができる。化学的部分タグを核酸配列に直接付加させることができ、または核酸配列が合成または非天然ヌクレオチドアンカーを含むことができ、そのアンカーに化学的部分タグを付加させることができる。
【0072】
符号化および復号エラーを最小限にするまたは検出するために、一意のコードを適用することができる。符号化および復号エラーは、偽陰性(無作為試料抽出に含まれない核酸分子または識別子)によって起こることがある。エラー検出コードの一例は、識別子ライブラリーに含まれている可能な識別子の連続セット中の識別子の数を計数するチェックサム配列であり得る。識別子ライブラリーの読み取り中に、チェックサムは、識別子のその連続セットからの取得期待数を示すことができ、識別子は、その期待数が満たされるまで読み取りのための試料抽出を継続することができる。一部のインプリメンテーションでは、チェックサム配列をR識別子の連続セット毎に含めることができ、この場合のRは、サイズが1、2、5、10、50、100、200、500もしくは1000に等しいまたはそれより大きいこともあり、または1000、500、200、100、50、10、5もしくは2未満であることもある。Rの値が小さいほど、エラー検出は良好である。一部のインプリメンテーションでは、チェックサムは、補足核酸配列であり得る。例えば、7個の核酸配列(例えば、成分)を含むセットを、積スキームで識別子を構築するための核酸配列(層X中の成分X1~X3、および層Y中のY1~Y3)と補足チェックサムのための核酸配列(X4~X7およびY4~Y7)という、2つの群に分けることができる。チェックサム配列X4~X7は、層Xの0、1、2または3個の配列が層Yの各メンバーとアセンブルさせるかどうかを示すことができる。あるいは、チェックサム配列Y4~Y7は、層Yの0、1、2または3個の配列が層Xの各メンバーとアセンブルされるかどうかを示すことができる。この例では、識別子{X1Y1、X1Y3、X2Y1、X2Y2、X2Y3}を有する元の識別子ライブラリーを、次のプールになるようにチェックサムを含むように補足することができる:{X1Y1、X1Y3、X2Y1、X2Y2、X2Y3、X1Y6、X2Y7、X3Y4、X6Y1、X5Y2、X6Y3}。チェックサム配列をエラー補正に使用することもできる。例えば、上記データセットにおけるX1Y1の非存在、ならびにX1Y6およびX6Y1の存在は、X1Y1核酸分子がデータセットから欠けているという推測を可能にし得る。チェックサム配列は、識別子が、識別子ライブラリーの試料抽出または識別子ライブラリーのアクセスされる部分から欠けているかどうかを示すことができる。欠けているチェックサム配列の場合、PCRまたは親和性タグ付きプローブハイブリダイゼーションなどのアクセス方法は、それを増幅および/または単離することができる。一部のインプリメンテーションでは、チェックサムは、補足核酸配列でないこともある。その場合、チェックサムを情報に直接符号化することができ、その結果、それらは識別子により表される。
【0073】
データ符号化および復号のノイズを、回文として識別子を構築することにより、例えば、積スキームにおいて単一成分ではなく成分の回文ペアを使用することにより、低減させることができる。次いで、異なる層からの成分のペアを回文様式(例えば、成分XおよびYについてXYではなくYXY)で互いにアセンブルすることができる。この回文方法を、より多くの数の層(例えば、XYZではなくZYXYZ)に拡大することができ、この回文方法により、識別子間の誤った交差反応の検出が可能になり得る。
【0074】
識別子への過剰(例えば、大過剰)な補足核酸配列の付加は、シークエンシングによる符号化された識別子の回収を妨げることがある。情報の復号の前に、識別子を補足核酸配列によって濃縮することができる。例えば、識別子末端に特異的なプライマーを使用する核酸増幅反応により、識別子を濃縮することができる。あるいは、または加えて、特異的プライマーを使用するシークエンシング(例えば、1塩基合成反応)により、試料プールを濃縮することなく情報を復号することができる。両方の復号方法において、復号キーがなければ、または識別子の組成について何かのことが分かっていなければ、情報を濃縮または復号することは困難であり得る。親和性タグベースのプローブの使用などの代替アクセス方法を利用することもできる。
バイナリ配列データを符号化するためのシステム
【0075】
デジタル情報を核酸(例えば、DNA)に符号化するためのシステムは、ファイルおよびデータ(例えば、生データ、圧縮されたzipファイル、整数データ、および他の形態のデータ)をバイトに変換し、バイトを核酸、一般にはDNAのセグメントまたは配列、またはこれらの組合せに符号化するためのシステム、方法およびデバイスを含み得る。
【0076】
ある態様では、本開示は、核酸を使用してバイナリ配列データを符号化するためのシステムを提供する。核酸を使用してバイナリ配列データを符号化するためのシステムは、デバイスおよび1つまたは複数のコンピュータプロセッサを含み得る。デバイスは、識別子ライブラリーが構築されるように構成することができる。(i)情報を記号列に翻訳するため、(ii)記号列を複数の識別子にマッピングするため、および(iii)少なくとも複数の識別子のサブセットを含む識別子ライブラリーを構築するために、1つまたは複数のコンピュータプロセッサを個別にまたは集合的にプログラミングすることができる。複数の識別子の個々の識別子は、記号列の個々の記号に対応し得る。複数の識別子の個々の識別子は、1つまたは複数の成分に含み得る。1つまたは複数の成分の個々の成分は、核酸配列を含み得る。
【0077】
別の態様では、本開示は、核酸を使用してバイナリ配列データを読み取るためのシステムを提供する。核酸を使用してバイナリ配列データを読み取るためのシステムは、データベースおよび1つまたは複数のコンピュータプロセッサを含み得る。データベースは、情報を符号化する識別子ライブラリーを記憶し得る。(i)識別子ライブラリー中の識別子を識別するため、(ii)(i)で識別された識別子から複数の記号を生成するため、および(iii)複数の記号から情報をコンパイルするために、1つまたは複数のコンピュータプロセッサを個別にまたは集合的にプログラミングすることができる。識別子ライブラリーは、複数の識別子のサブセットを含み得る。複数の識別子の各個の識別子は、記号列内の個々の記号に対応し得る。識別子は、1つまたは複数の成分を含み得る。成分は、核酸配列を含み得る。
【0078】
デジタルデータを符号化するためのシステムを使用する方法の非限定的なインプリメンテーションは、デジタル情報をバイトストリームの形態で受け取るステップを含み得る。バイトストリームを個々のバイトに構文解析し、核酸インデックス(または識別子のランク)を使用してバイト内のビットの位置をマッピングし、ビット値1またはビット値0のいずれかに対応する配列を識別子に符号化する。デジタルデータを取得するステップは、1つまたは複数のビットにマッピングされる核酸の配列(例えば、識別子)を含む核酸試料または核酸プールについてシークエンシングし、識別子のランクを参照してその識別子が核酸プール内に存在するかどうかを確認し、各配列についての位置およびビット値情報を、デジタル情報の配列を含むバイトに復号する。
【0079】
核酸分子に符号化され、書き込まれた情報を符号化し、書き込み、コピーし、アクセスし、読み取り、復号するためのシステムは、単一の統合された単位であってもよく、上述の操作の1つまたは複数が実行されるように構成された複数の単位であってもよい。情報を核酸分子(例えば、識別子)に符号化し、書き込むためのシステムは、デバイスおよび1つまたは複数のコンピュータプロセッサを含み得る。1つまたは複数のコンピュータプロセッサは、情報が記号列(例えば、ビットの列)に構文解析されるようにプログラミングすることができるものである。コンピュータプロセッサは、識別子のランクを生じさせることができるものである。コンピュータプロセッサは、記号を2つまたはそれよりも多くのカテゴリーにカテゴリー化するものである。1つのカテゴリーは、識別子ライブラリー中の対応する識別子の存在によって表される記号を含み得、他のカテゴリーは、識別子ライブラリー中の対応する識別子の非存在によって表される記号を含み得る。コンピュータプロセッサは、識別子ライブラリー中に識別子が存在することによって表される記号に対応する識別子をアセンブルするようにデバイスを方向付けることができるものである。
【0080】
デバイスは、複数の領域、セクション、またはパーティションを含み得る。識別子をアセンブルするための試薬および成分をデバイスの1つまたは複数の領域、セクション、またはパーティションに保管することができる。層をデバイスのセクションの別々の領域に保管することができる。層は、1つまたは複数の一意の成分を含み得る。1つの層内の成分は、別の層の成分と重複しない一意のものであり得る。領域またはセクションは容器を含み得、パーティションはウェルを含み得る。各層を別々の容器またはパーティションに保管することができる。各試薬または核酸配列を別々の容器またはパーティションに保管することができる。その代わりに、またはそれに加えて、試薬を組み合わせて、識別子構築のためのマスターミックスを形成することができる。デバイスは、試薬、成分間、および鋳型をデバイスの1つのセクションから別のセクションに組み合わされるように転送することができる。デバイスは、アセンブリ反応を完了させるための条件をもたらすことができるものである。例えば、デバイスは、加熱、撹拌、および反応進行の検出をもたらすことができるものである。構築された識別子を、1つまたは複数のその後の反応が行われて、識別子の1つまたは複数の末端にバーコード、共通配列、可変配列、またはタグが付加されるように方向付けることができる。次いで、識別子を領域またはパーティションに方向付けて、識別子ライブラリーを生成することができる。1つまたは複数の識別子ライブラリーをデバイスの各領域、セクション、または個々のパーティションに保管することができる。デバイスは、圧力、真空、または吸引を使用して流体(例えば、試薬、成分間、鋳型)を転送することができる。
【0081】
識別子ライブラリーをデバイスに保管することができるまたは別々のデータベースに移すことができる。データベースは、1つまたは複数の識別子ライブラリーを含み得る。データベースは、識別子ライブラリーを長期保管するための条件(例えば、識別子の分解を低減するための条件)をもたらすものであり得る。識別子ライブラリーは、粉末、液体、または固体の形態で保管することができる。より安定な保管のために識別子の水溶液を凍結乾燥させることができる。あるいは、識別子を、酸素の非存在下(例えば、嫌気的記憶条件)で記憶させることができる。データベースは、紫外線光防護、温度の低下(例えば、冷蔵または凍結)、ならびに分解性化学物質および酵素からの保護をもたらすものであり得る。データベースに移す前に、識別子ライブラリーを凍結乾燥または凍結させることができる。識別子ライブラリーは、ヌクレアーゼを不活化するためにエチレンジアミン四酢酸(EDTA)および/または核酸分子の安定性を維持するために緩衝剤を含み得る。
【0082】
データベースは、識別子に情報を書き込む、情報をコピーする、情報にアクセスする、または情報を読み取るデバイスとカップリングしていてもよく、当該デバイスを含んでもよく、当該デバイスとは分離されていてもよい。コピー、アクセスまたは読み取りの前に識別子ライブラリーの一部をデータベースから除去することができる。データベースから情報をコピーするデバイスは、情報を書き込むデバイスと同じデバイスであっても異なるデバイスであってもよい。情報をコピーするデバイスは、一定分量の識別子ライブラリーをデバイスから抽出し、その一定分量を試薬および構成物と組み合わせて、識別子ライブラリーの一部または全部を増幅することができる。デバイスは、増幅反応の温度、圧力、および撹拌を制御することができるものである。デバイスは、パーティションを含んでよく、1つまたは複数の増幅反応を、識別子ライブラリーを含むパーティションで行うことができる。デバイスは、識別子の1つよりも多くのプールを同時にコピーすることができる。
【0083】
コピーされた識別子をコピーデバイスからアクセスデバイスに移すことができる。アクセスデバイスは、コピーデバイスと同じデバイスであってよい。アクセスデバイスは、別々の領域、セクション、またはパーティションを含み得る。アクセスデバイスは、親和性タグと結合した識別子を分離するための1つまたは複数のカラム、ビーズレザバー、または磁気領域を有し得る。その代わりに、またはそれに加えて、アクセスデバイスは、1つまたは複数のサイズ選択ユニットを有し得る。サイズ選択ユニットは、アガロースゲル電気泳動または核酸分子をサイズ選択するための任意の他の方法を含み得る。コピーおよび抽出は、デバイスの同じ領域で実施されてもよく、デバイスの異なる領域で実施されてもよい。
【0084】
アクセスされたデータを同じデバイスにおいて読み取ることができ、アクセスされたデータを別のデバイスに移すことができる。読み取りデバイスは、識別子を検出し、識別するための検出ユニットを含み得る。検出ユニットは、シークエンサー、ハイブリダイゼーションアレイ、または識別子の存在または非存在を識別するための他のユニットの一部であってよい。シークエンシングプラットフォームは、核酸配列に符号化された情報の復号および読み取り専用に設計されたものであってよい。シークエンシングプラットフォームは、一本鎖または二本鎖核酸分子のシークエンシング専用のものであってよい。シークエンシングプラットフォームは、個々の塩基を読み取ることによって(例えば、塩基毎のシークエンシング)、または核酸分子(例えば、識別子)内に組み入れられた核酸配列全体(例えば、成分)の存在もしくは非存在を検出することによって核酸符号化データを復号することができるものである。あるいは、シークエンシングプラットフォームは、Illumina(登録商標)Sequencingなどのシステムまたはキャピラリー電気泳動による断片化解析であってよい。その代わりに、またはそれに加えて、核酸配列の復号は、これだけに限定されないが、光学的シグナル、電気化学的シグナル、または化学的シグナルを生じさせる任意の方法を含めた、デバイスによってインプリメントされる様々な解析技法を使用して実施することができる。
【0085】
核酸分子中への情報保管は、これだけに限定されないが、長期の情報保管、機密情報保管、および医学的情報の保管を含めた種々の適用を有し得る。ある例では、人の医学的情報(例えば、病歴および記録)を核酸分子中に保管し、その彼または彼女に保有させることができる。情報は、体外に保管することもでき(例えば、着用できるデバイス中に)、体内に保管することもできる(例えば、皮下カプセル中に)。患者が診療所または病院に運び込まれた場合に、試料をデバイスまたはカプセルから取得することができ、核酸シークエンサーを使用して情報を復号することができる。核酸分子中への個人的な診断記録の保管により、コンピュータおよびクラウドに基づく保管システムの代替をもたらすことができる。核酸分子中への個人的な診断記録の保管により、診断記録がハッキングされる事例または蔓延を減少させることができる。カプセルに基づく診断記録の保管に使用される核酸分子は、ヒトゲノム配列に由来するものであってよい。ヒトゲノム配列を使用することにより、万一カプセルが破損し漏出した場合の核酸配列の免疫原性を低減することができる。
成分をアセンブルするための化学的方法
【0086】
本明細書に提供される反応および方法は、1つまたは複数の成分から識別子をアセンブルするために本明細書に記載のシステムにおいて使用することができる。例えば、本明細書に提供される異なる化学的方法に関して異なる反応混合物を、異なる成分をアセンブルするためにシステムのフィニッシャーにおいて使用することができる。
A.オーバーラップ伸長PCR(OEPCR)アセンブリ
【0087】
OEPCRでは、成分を、ポリメラーゼおよびdNTP(dATP、dTTP、dCTP、dGTPを含むデオキシヌクレオチド三リン酸、またはそのバリアントもしくはアナログ)を含む反応においてアセンブルすることができる。成分は、一本鎖または二本鎖核酸であり得る。互いに隣接してアセンブルされる成分は、相補的3’末端、相補的5’末端、または1つの成分の5’末端と隣接する成分の3’末端の間の相同性を有し得る。これらの末端領域は、「ハイブリダイゼーション領域」と称され、OEPCR中の成分間のハイブリダイズした接合部の形成を容易にすることを目的とするものであり、1つの入力成分(またはその相補物)の3’末端がその意図された隣接成分(またはその相補物)の3’末端とハイブリダイズする。次いで、アセンブルされた二本鎖産物を、ポリメラーゼ伸長によって形成する。次いで、この産物を、その後のハイブリダイゼーションおよび伸長を通じてより多くの成分とアセンブルすることができる。
【0088】
一部のインプリメンテーションでは、OEPCRは、3つの温度:融解温度、アニーリング温度、および伸長温度の間をサイクルさせることを含み得る。融解温度は、二本鎖核酸を一本鎖核酸に変えること、ならびに成分内または成分間での二次構造またはハイブリダイゼーションの形成を除去することを目的とするものである。一般には、融解温度は、高く、例えば、摂氏95度を超える。一部のインプリメンテーションでは、融解温度は、少なくとも摂氏96度、97度、98度、99度、100度、101度、102度、103度、104度、または少なくとも105度であり得る。他のインプリメンテーションでは、融解温度は、最大で摂氏95度、94度、93度、92度、91度、または最大で90度であり得る。融解温度が高いほど核酸およびそれらの二次構造の解離が改善されるが、核酸またはポリメラーゼの分解などの副作用も引き起こし得る。融解温度は、反応に少なくとも1秒間、2秒間、3秒間、4秒間、または少なくとも5秒間、またはそれよりも長く、例えば、30秒間、1分間、2分間、または3分間にわたって適用することができる。
【0089】
アニーリング温度は、意図された隣接成分(またはそれらの相補物)の相補的な3’末端間のハイブリダイゼーションの形成を容易にすることを目的とするものである。一部のインプリメンテーションでは、アニーリング温度は、意図されたハイブリダイズした核酸形成の算出された融解温度と対応し得る。他のインプリメンテーションでは、アニーリング温度は、前記融解温度から摂氏10度またはそれよりも高い温度以内であり得る。一部のインプリメンテーションでは、アニーリング温度は、少なくとも摂氏25度、30度、50度、55度、60度、65度、または少なくとも70度であり得る。融解温度は、成分間の意図されたハイブリダイゼーション領域の配列に依存し得る。ハイブリダイゼーション領域が長いほど融解温度が高くなり得、グアニンまたはシトシンヌクレオチドのパーセント含有量が高いハイブリダイゼーション領域ほど融解温度が高くなり得る。したがって、特定のアニーリング温度で最適にアセンブルするように意図されたOEPCR反応用の成分を設計することが可能であり得る。アニーリング温度は、反応に少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間、または少なくとも30秒間にわたって、またはそれよりも長く適用することができる。
【0090】
伸長温度は、1つまたは複数のポリメラーゼ酵素によって触媒されるハイブリダイズした3’末端の核酸鎖延長を開始させ、またそれを容易にすることを目的とするものである。一部のインプリメンテーションでは、伸長温度を、ポリメラーゼが核酸結合強度、延長スピード、延長安定性、または忠実度に関して最適に機能する温度に設定することができる。一部のインプリメンテーションでは、伸長温度は、少なくとも摂氏30度、40度、50度、60度、または少なくとも70度、またはそれよりも高い温度であり得る。アニーリング温度は、反応に少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間、30秒間、40秒間、50秒間、または少なくとも60秒間にわたって、またはそれよりも長く適用することができる。推奨される伸長時間は、予測される延長の1キロベース当たり約15~45秒間であり得る。
【0091】
OEPCRの一部のインプリメンテーションでは、アニーリング温度と伸長温度は同じであってよい。したがって、2ステップ温度サイクルを3ステップ温度サイクルの代わりに使用することができる。複合アニーリングおよび伸長温度の例としては、摂氏60度、65度、または72度が挙げられる。
【0092】
一部のインプリメンテーションでは、OEPCRを1つの温度サイクルで実施することができる。そのようなインプリメンテーションには、ただ2つの成分の意図されたアセンブリが伴い得る。他のインプリメンテーションでは、OEPCRを複数の温度サイクルで実施することができる。OEPCRにおけるいかなる所与の核酸も、1つのサイクルでは最大で1つの他の核酸としかアセンブルできない。これは、アセンブリ(または伸長または延長)を核酸の3’末端でしか行うことができず、また、各核酸は3’末端を1つしか有することができないからである。したがって、複数の成分のアセンブリには複数の温度サイクルが必要になり得る。例えば、4種の成分のアセンブルには、3つの温度サイクルが伴い得る。6種の成分のアセンブルには5つの温度サイクルが伴い得る。10種の成分のアセンブルには9つの温度サイクルが伴い得る。一部のインプリメンテーションでは、最低限必要なものよりも多くの温度サイクルを使用することによりアセンブリ効率を上昇させることができる。例えば、2種の成分をアセンブルするために4つの温度サイクルを使用することにより、1つの温度サイクルのみを使用するよりも多くの産物をもたらすことができる。これは、成分のハイブリダイゼーションおよび延長が、各サイクルにおいて成分の総数のうちごく一部で起こる統計学的事象だからである。したがって、アセンブルされた成分の総画分は、サイクルの増加と共に増加させることができる。
【0093】
温度サイクリングの考慮事項に加えて、OEPCRにおける核酸配列の設計がそれらの互いとのアセンブリの効率に影響を及ぼす可能性がある。長いハイブリダイゼーション領域を有する核酸は、所与のアニーリング温度で、短いハイブリダイゼーション領域を有する核酸と比較してより効率的にハイブリダイズし得る。これは、より長いハイブリダイズ産物はより多数の安定な塩基対を含有し、したがって、全体的なハイブリダイズ産物がより短いハイブリダイズ産物よりも安定であり得るからである。ハイブリダイゼーション領域は、少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、もしくは少なくとも10塩基、またはそれよりも多くの塩基の長さを有し得る。
【0094】
高グアニンまたはシトシン含有量のハイブリダイゼーション領域は、所与の温度で、低グアニンまたはシトシン含有量のハイブリダイゼーション領域よりも効率的にハイブリダイズし得る。これは、グアニンとシトシンが、アデニンとチミンよりも安定な塩基対を形成するからである。ハイブリダイゼーション領域は、0%から100%の間の任意のグアニンまたはシトシン含有量(GC含量としても公知)を有し得る。例えば、ハイブリダイゼーション領域は、0%から5%、5%から10%、10%から15%、15%から20%、20%から25%、25%から30%、30%から35%、35%から40%、40%から45%、45%から50%、50%から55%、55%から60%、60%から65%、65%から70%、70%から75%、75%から80%、80%から85%、85%から90%、90%から95%、または95%から100%のグアニンまたはシトシン含有量を有し得る。
【0095】
ハイブリダイゼーション領域の長さおよびGC含量に加えて、OEPCRの効率に影響を及ぼし得る核酸配列設計の態様がさらに多く存在する。例えば、成分内での望ましくない二次構造の形成により、その意図された隣接成分とのハイブリダイゼーション産物を形成するその能力が妨げられる恐れがある。これらの二次構造は、ヘアピンループを含み得る。核酸についての可能な二次構造の型およびそれらの安定性(例えば、融解温度)は、配列に基づいて予測することができる。設計空間検索アルゴリズムを使用して、効率的なOEPCRのための適当な長さおよびGC含量の基準を満たす核酸配列を決定すると同時に、潜在的に阻害性の二次構造を有する配列を回避することができる。設計空間検索アルゴリズムは、遺伝的アルゴリズム、ヒューリスティック検索アルゴリズム、tabu検索のようなメタ-ヒューリスティック検索戦略、分枝限定検索アルゴリズム、動的プログラミングに基づくアルゴリズム、制約された組合せ最適化アルゴリズム、最急降下に基づくアルゴリズム、ランダム化検索アルゴリズム、またはこれらの組合せを含み得る。
【0096】
同様に、ホモ二量体(同じ配列の核酸分子とハイブリダイズする核酸分子)および望ましくないヘテロ二量体(それらの意図されたアセンブリパートナーに加えて他の核酸配列とハイブリダイズする核酸配列)の形成により、OEPCRが妨げられる恐れがある。核酸内の二次構造と同様に、ホモ二量体およびヘテロ二量体の形成は、核酸設計の間にコンピュータによる計算方法および設計空間検索アルゴリズムを使用して予測し、説明することができる。
【0097】
より長い核酸配列またはより高いGC含量により、OEPCRでの望ましくない二次構造、ホモ二量体、およびヘテロ二量体の形成の増加が生じ得る。したがって、一部のインプリメンテーションでは、より短い核酸配列またはより低いGC含量を使用することにより、より高いアセンブリ効率が導かれ得る。これらの設計原理により、より効率的なアセンブリに関して、長いハイブリダイゼーション領域または高いGC含量を使用する設計戦略が打ち消され得る。そのように、一部のインプリメンテーションでは、高いGC含量の長いハイブリダイゼーション領域ではなく低いGC含量の短い非ハイブリダイゼーション領域を使用することによってOEPCRを最適化することができる。核酸の全体的な長さは、少なくとも10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、70塩基、80塩基、90塩基、または少なくとも100塩基、またはそれよりも多くの塩基であり得る。一部のインプリメンテーションでは、アセンブリ効率が最適化される核酸のハイブリダイゼーション領域の最適な長さおよび最適なGC含量が存在し得る。
【0098】
OEPCR反応におけるより多数の区別可能な核酸は、予測されるアセンブリ効率に干渉し得る。これは、より多数の区別可能な核酸配列により、望ましくない分子間相互作用、特にヘテロ二量体の形態のより高い確率が生じ得るからである。したがって、多数の成分をアセンブルするOEPCRの一部のインプリメンテーションでは、効率的なアセンブリのための核酸配列の制約はよりストリンジェントになり得る。
【0099】
予測される最終的なアセンブルされた産物を増幅するためのプライマーをOEPCR反応に含めることができる。次いで、OEPCR反応を、単に構成する成分間でより多くのアセンブリを創出することによってだけでなく、完全なアセンブルされた産物を従来のPCRの様式で指数関数的に増幅することによってもアセンブルされた産物の収率を改善するために、より多くの温度サイクルを用いて実施することができる。
【0100】
アセンブリ効率を改善するために添加剤をOEPCR反応に含めることができる。例えば、ベタイン、ジメチルスルホキシド(DMSO)、非イオン性界面活性剤、ホルムアミド、マグネシウム、ウシ血清アルブミン(BSA)、またはこれらの組合せの添加。添加剤含有量(体積当たりの重み)は、少なくとも0%、1%、5%、10%、もしくは少なくとも20%、またはそれよりも多くであり得る。
【0101】
種々のポリメラーゼをOEPCRのために使用することができる。ポリメラーゼは、天然に存在するものであっても合成されたものであってもよい。ポリメラーゼの例は、Φ29ポリメラーゼまたはその誘導体である。一部の場合では、新しい核酸配列を構築するために、転写酵素またはリガーゼ(すなわち、結合の形成を触媒する酵素)をポリメラーゼと併せてまたはポリメラーゼの代替として使用する。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、耐熱性ポリメラーゼ、野生型ポリメラーゼ、改変ポリメラーゼ、E.coli DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(ファイ29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ、ES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、白金 Taqポリメラーゼ、Tbrポリメラーゼ、Phusionポリメラーゼ、KAPAポリメラーゼ、Q5ポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’から5’へのエキソヌクレアーゼ活性を有するクレノウ断片ポリメラーゼ、ならびにそのバリアント、改変製品および誘導体が挙げられる。異なるポリメラーゼは、異なる温度で安定かつ最適に機能し得る。さらに、異なるポリメラーゼは異なる性質を有する。例えば、Phusionポリメラーゼのような一部のポリメラーゼは、核酸延長の間のより高い忠実度に寄与し得る3’から5’へのエキソヌクレアーゼ活性を示し得る。一部のポリメラーゼは延長の間にリーディング配列を動かし得、一方、他のポリメラーゼは、それらを分解し得るまたは延長を停止し得る。Taqのような一部のポリメラーゼは、アデニン塩基を核酸配列の3’末端に組み入れる。このプロセスはA尾部付加と称され、また、アデニン塩基の付加により、意図された隣接成分間の設計された3’相補性が破壊され得るので、このプロセスはOEPCRに対して阻害性であり得る。OEPCRは、ポリメラーゼサイクリングアセンブリ(またはPCA)とも称され得る。
B.ライゲーションアセンブリ
【0102】
ライゲーションアセンブリでは、別々の核酸を、1つまたは複数のリガーゼ酵素および追加的な補因子を含む反応でアセンブルする。補因子は、アデノシン三リン酸(ATP)、ジチオスレイトール(DTT)、またはマグネシウムイオン(Mg2+)を含み得る。ライゲーションの間、1つの核酸鎖の3’末端を別の核酸鎖の5’末端と共有結合により連結し、したがって、アセンブルされた核酸を形成する。ライゲーション反応の成分は、平滑末端化された二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、または部分的にハイブリダイズした一本鎖DNAであり得る。核酸の末端を1つにまとめる戦略は、リガーゼ酵素の実行可能な基質の頻度を増大させるものであり、したがって、リガーゼ反応の効率を改善するために使用することができる。平滑末端化されたdsDNA分子は、リガーゼ酵素が作用し得る疎水性スタックを形成する傾向があるが、核酸を1つにまとめるためのより上首尾の戦略は、それらがアセンブルすることが意図されている成分の突出との相補性を有する5’または3’一本鎖突出のいずれかを有する核酸成分を使用することであり得る。後者の例では、塩基-塩基ハイブリダイゼーションに起因してより安定な核酸2重鎖が形成され得る。
【0103】
二本鎖核酸が一方の末端に突出鎖を有する場合、同じ末端の他方の鎖は、「くぼみ」と称することができる。まとめると、くぼみと突出は、「粘着末端」としても公知の「付着末端」を形成する。付着末端は、3’突出と5’くぼみ、または5’突出と3’くぼみのいずれであってもよい。2つの意図された隣接成分間の付着末端は、相補性を有し、したがって、両方の付着末端の突出がハイブリダイズし、したがって、各突出末端が他の成分のくぼみの始めと直接隣接するように設計することができる。これにより、リガーゼの作用によって「シール」する(リン酸ジエステル結合を通じて共有結合により連結する)ことができる「ニック」(二本鎖DNA切断)が形成される。一方の鎖または他方の鎖、または両方の鎖のいずれのニックもシールすることができる。熱力学的に、付着末端を形成する分子の上の鎖および下の鎖は、会合した状態と解離した状態を移動し得、したがって、付着末端は、一過性の形成であり得る。しかし、2種の成分間の付着末端2重鎖の一方の鎖に沿ったニックがシールされると、逆の鎖のメンバーが解離したとしても共有結合性の連結が残存する。次いで、連結した鎖が、逆の鎖の意図された隣接メンバーが結合することができる鋳型になり、シールすることができるニックが再度形成される。
【0104】
付着末端は、dsDNAを1つまたは複数のエンドヌクレアーゼで消化することによって創出することができる。エンドヌクレアーゼ(制限酵素と称することができる)は、dsDNA分子のいずれかの末端または両末端の特異的な部位(制限部位と称することができる)を標的とし、ねじれ型切断を創出し得(時には消化と称される)、したがって、付着末端が残される。消化により、パリンドローム突出(それ自体の逆相補物である配列を有する突出)が残される。その場合、同じエンドヌクレアーゼで消化される2種の成分は、リガーゼを用いてそれに沿ってアセンブルすることができる相補的な付着末端を形成し得る。消化およびライゲーションは、エンドヌクレアーゼおよびリガーゼが適合する場合には同じ反応において共に行うことができる。反応は、摂氏4度、10度、16度、25度、または37度などの均一温度で行うことができる。または、反応は、複数の温度間、例えば、摂氏16度と摂氏37度の間のサイクルであってよい。複数の温度間でサイクルさせることにより、サイクルの異なる部分の間に消化およびライゲーションを各々それらのそれぞれの最適な温度で進行させることが可能になる。
【0105】
消化およびライゲーションを別々の反応で実施することが有益な場合がある。例えば、所望のリガーゼおよび所望のエンドヌクレアーゼが異なる条件で最適に機能する場合。または、例えば、ライゲーション産物がエンドヌクレアーゼの新しい制限部位を形成する場合。これらの例では、制限酵素消化、次いでライゲーションを別々に実施することがより良好であり得、また、おそらく、制限酵素をライゲーションの前に除去することがさらに有益であり得る。核酸を酵素からフェノール-クロロホルム抽出、エタノール沈殿、磁気ビーズ捕捉、および/またはシリカ膜吸着、洗浄、および溶出によって分離することができる。複数のエンドヌクレアーゼを同じ反応において使用することができるが、エンドヌクレアーゼが互いに干渉せず、同様の反応条件下で機能することを確実にするために注意を払うべきである。2種のエンドヌクレアーゼを使用し、一方のエンドヌクレアーゼによりdsDNA成分の両末端に直交性の(非相補的な)付着末端を創出することができる。
【0106】
エンドヌクレアーゼ消化により、付着末端にリン酸化された5’末端が残される。リガーゼは、リン酸化された5’末端に対してのみ機能することができ、リン酸化されていない5’末端に対しては機能することができない。そのように、消化とライゲーションの間に中間の5’リン酸化ステップのいかなる必要もない場合がある。付着末端にパリンドローム突出を有する消化されたdsDNA成分はそれ自体とライゲーションする可能性がある。自己ライゲーションを防止するために、ライゲーション前に前記dsDNA成分を脱リン酸化することが有益であり得る。
【0107】
複数のエンドヌクレアーゼが異なる制限部位を標的とし得るが、適合する突出(互いに逆相補物である突出)が残される。2種のそのようなエンドヌクレアーゼを用いて創出された付着末端のライゲーション産物では、ライゲーション部位にいずれのエンドヌクレアーゼの制限部位も含有しないアセンブルされた産物がもたらされ得る。そのようなエンドヌクレアーゼにより、ただ2つのエンドヌクレアーゼを使用し、反復的な消化-ライゲーションサイクルを実施することによってプログラム可能に複数の成分をアセンブルすることができるバイオブリックアセンブリなどのアセンブリ方法の基礎が形成される。図20は、エンドヌクレアーゼBamHIおよびBglIIを適合する突出と共に使用した消化-ライゲーションサイクルの例を例示する。
【0108】
一部のインプリメンテーションでは、付着末端を創出するために使用されるエンドヌクレアーゼは、IIS型制限酵素であり得る。これらの酵素は、固定数の塩基をこれらの酵素の制限部位から特定の方向に切り出し、したがって、これらの酵素によって生成される突出の配列をカスタマイズすることができる。突出配列はパリンドロームである必要はない。同じIIS型制限酵素を使用して、複数の異なる付着末端を同じ反応においてまたは複数の反応において創出することができる。さらに、1つまたは複数のIIS型制限酵素を使用して、適合する突出を有する成分を同じ反応でまたは複数の反応で創出することができる。IIS型制限酵素によって生成される2つの付着末端間のライゲーション部位は、それにより新しい制限部位が形成されないように設計することができる。さらに、IIS型制限酵素部位を、dsDNAにおいて、制限酵素が付着末端を有する成分を生成する際にそれ自体の制限部位を切断するように位置させることができる。したがって、IIS型制限酵素により生成した複数の成分間のライゲーション産物は、いかなる制限部位も含有しない場合がある。
【0109】
IIS型制限酵素を反応においてリガーゼと混合して、成分の消化とライゲーションを一緒に実施することができる。反応の温度を2つまたはそれよりも多くの値の間でサイクルさせて、最適な消化およびライゲーションを促進することができる。例えば、消化を摂氏37度で最適に実施することができ、ライゲーションを摂氏16度で最適に実施することができる。より一般的には、反応を少なくとも摂氏0度、5度、10度、15度、20度、25度、30度、35度、40度、45度、50度、55度、60度、または65度またはそれよりも高い温度値の間をサイクルさせることができる。複合させた消化およびライゲーション反応を使用して、少なくとも2種、3種、4種、5種、6種、7種、8種、9種、10種、11種、12種、13種、14種、15種、16種、17種、18種、19種、または20種の成分間、またはそれよりも多くをアセンブルすることができる。IIS型制限酵素を活用して付着末端を創出するアセンブリ反応の例としては、Golden Gate Assembly(Golden Gateクローニングとしても公知)またはモジュラークローニング(MoCloとしても公知)が挙げられる。
【0110】
ライゲーションの一部のインプリメンテーションでは、エキソヌクレアーゼを使用して、付着末端を有する成分を創出することができる。3’エキソヌクレアーゼを使用して、dsDNAから3’末端をチューバックし(chew back)、したがって、5’突出を創出する。同様に、5’エキソヌクレアーゼを使用して、dsDNAから5’末端をチューバックし、したがって、3’突出を創出する。異なるエキソヌクレアーゼは異なる性質を有し得る。例えば、エキソヌクレアーゼは、ssDNAに作用するかどうかに関わりなく、リン酸化された5’末端に作用するのかリン酸化されていない5’末端に作用するのかに関わりなく、ニックで開始することができるかどうかに関わりなく、またはそれらの活性を5’くぼみ、3’くぼみ、5’突出、もしくは3’突出において開始することができるかどうかに関わりなく、それらのヌクレアーゼ活性の方向が異なり得る(5’から3’へまたは3’から5’へ)。異なる型のエキソヌクレアーゼとしては、ラムダエキソヌクレアーゼ、RecJ、エキソヌクレアーゼIII、エキソヌクレアーゼI、エキソヌクレアーゼT、エキソヌクレアーゼV、エキソヌクレアーゼVIII、エキソヌクレアーゼVII、ヌクレアーゼBAL_31、T5エキソヌクレアーゼ、およびT7エキソヌクレアーゼが挙げられる。
【0111】
エキソヌクレアーゼを反応においてリガーゼと一緒に使用して、複数の成分をアセンブルすることができる。反応は、固定温度で行うこともでき、各々がリガーゼまたはエキソヌクレアーゼそれぞれに理想的な複数の温度の間をサイクルさせることもできる。ポリメラーゼをアセンブリ反応にリガーゼおよび5’から3’へのエキソヌクレアーゼと一緒に含めることができる。そのような反応における成分は、互いに隣接してアセンブルすることが意図された成分がそれらの端部に相同な配列を共有するように設計することができる。例えば、成分Yとアセンブルされる成分Xは、5’-z-3’形態の3’端部配列を有し得、成分Yは、5’-z-3’形態の5’端部配列を有し得、ここで、zは、任意の核酸配列である。本発明者らは、そのような形態の相同な端部配列を、「ギブソンオーバーラップ」と称する。5’エキソヌクレアーゼによりギブソンオーバーラップを有するdsDNA成分の5’末端がチューバックされると、互いとハイブリダイズする適合する3’突出が創出される。次いで、ハイブリダイズした3’末端がポリメラーゼの作用によって鋳型成分の末端までまたは一方の成分の伸長した3’突出が隣接成分の5’くぼみを満たす点まで伸長し、それにより、リガーゼによってシールすることができるニックが形成され得る。ポリメラーゼ、リガーゼ、およびエキソヌクレアーゼを一緒に使用するそのようなアセンブリ反応は、多くの場合、「ギブソンアセンブリ」と称される。ギブソンアセンブリは、T5エキソヌクレアーゼ、Phusionポリメラーゼ、およびTaqリガーゼを使用し、反応を摂氏50度でインキュベートすることによって実施することができる。前記例では、好熱性リガーゼであるTaqを使用することにより、反応における3つの型の酵素全てに適した温度である摂氏50度で反応を進行させることが可能になる。
【0112】
「ギブソンアセンブリ」という用語は、一般に、ポリメラーゼ、リガーゼ、およびエキソヌクレアーゼが関与する任意のアセンブリ反応を指す。ギブソンアセンブリを使用して、少なくとも2種、3種、4種、5種、6種、7種、8種、9種、または少なくとも10種、またはそれより多くの成分をアセンブルすることができる。ギブソンアセンブリは、一段階の等温性反応として行うこともでき、1つまたは複数の温度でのインキュベーションを伴う多段階反応として行うこともできる。例えば、ギブソンアセンブリは、少なくとも30度、40度、50度、60度、または少なくとも70度、またはそれよりも高い温度で行うことができる。ギブソンアセンブリのインキュベーション時間は、少なくとも1分間、5分間、10分間、20分間、40分間、または少なくとも80分間であり得る。
【0113】
ギブソンアセンブリ反応は、意図された隣接成分間のギブソンオーバーラップがある特定の長さであり、ヘアピン、ホモ二量体、または望ましくないヘテロ二量体などの望ましくないハイブリダイゼーション事象を回避する配列などの配列特色を有する場合に、最適に行うことができる。一般に、少なくとも20塩基のギブソンオーバーラップが推奨される。しかし、ギブソンオーバーラップは、少なくとも1塩基、2塩基、3塩基、5塩基、10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、または少なくとも100塩基、またはそれよりも多くの長さの塩基であり得る。ギブソンオーバーラップのGC含量は、0%から100%の間のいずれかであり得る。例えば、ギブソンオーバーラップのGC含量は、0%から5%、5%から10%、10%から15%、15%から20%、20%から25%、25%から30%、30%から35%、35%から40%、40%から45%、45%から50%、50%から55%、55%から60%、60%から65%、65%から70%、70%から75%、75%から80%、80%から85%、85%から90%、90%から95%、または95%から100%であり得る。
【0114】
ギブソンアセンブリは、一般に、5’エキソヌクレアーゼを用いて説明されるが、この反応は、3’エキソヌクレアーゼを用いて行うこともできる。3’エキソヌクレアーゼによりdsDNA成分の3’末端がチューバックされると、ポリメラーゼにより、3’末端が伸長することによって作用が打ち消される。この動的プロセスを、2種の成分(ギブソンオーバーラップを共有する)の5’突出(エキソヌクレアーゼによって創出される)がハイブリダイズし、ポリメラーゼにより一方の成分の3’末端がその隣接成分の5’末端に行くのに十分に伸長し、したがって、リガーゼによってシールすることができるニックが残されるまで続けることができる。
【0115】
ライゲーションの一部のインプリメンテーションでは、付着末端を有する成分は、酵素的なものとは対照的に、完全な相補性を共有しない2つの一本鎖核酸またはオリゴを一緒に混合することによって合成的に創出することができる。
【0116】
付着末端ライゲーションにおけるオリゴのインデックス領域およびハイブリダイゼーション領域(複数可)は、成分の適当なアセンブリが容易になるように設計することができる。長い突出を有する成分は、所与のアニーリング温度で、短い突出を有する成分と比較してより効率的に互いとハイブリダイズすることができる。突出は、少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、15塩基、20塩基、もしくは少なくとも30塩基、またはそれよりも多くの塩基の長さを有し得る。
【0117】
高グアニンまたはシトシン含有量を含有する突出を有する成分は、それらの相補的な成分と、所与の温度で、低グアニンまたはシトシン含有量を含有する突出を有する成分よりも効率的にハイブリダイズし得る。これは、グアニンとシトシンが、アデニンとチミンよりもより安定な塩基対を形成するからである。突出は、0%から100%の間のいずれかのグアニンまたはシトシン含有量(GC含量としても公知)を有し得る。
【0118】
突出配列と同様に、オリゴのGC含量およびインデックス領域の長さもライゲーション効率に影響を及ぼし得る。これは、各成分の上の鎖および下の鎖が安定に結合していれば付着末端成分がより効率的にアセンブルすることができるからである。したがって、より高いGC含量、より長い配列、およびより高い融解温度を促進する他の特色を有するインデックス領域を設計することができる。しかし、インデックス領域および突出配列(複数可)の両方に関して、ライゲーションアセンブリの効率に影響を及ぼし得るオリゴ設計の態様がさらに多く存在する。例えば、成分内での望ましくない二次構造の形成により、その意図された隣接成分とアセンブルされた産物を形成するその能力が妨げられる恐れがある。これは、インデックス領域内、突出配列内、またはその両方の二次構造に起因して起こり得る。これらの二次構造は、ヘアピンループを含み得る。オリゴの可能な二次構造の型およびそれらの安定性(例えば、融解温度)は、配列に基づいて予測することができる。設計空間検索アルゴリズムを使用して、有効な成分を形成するための適当な長さおよびGC含量の基準を満たすオリゴ配列を決定すると同時に、潜在的に阻害性の二次構造を有する配列を回避することができる。設計空間検索アルゴリズムは、遺伝的アルゴリズム、ヒューリスティック検索アルゴリズム、tabu検索のようなメタ-ヒューリスティック検索戦略、分枝限定検索アルゴリズム、動的プログラミングに基づくアルゴリズム、制約された組合せ最適化アルゴリズム、最急降下に基づくアルゴリズム、ランダム化検索アルゴリズム、またはこれらの組合せを含み得る。
【0119】
同様に、ホモ二量体(同じ配列のオリゴとハイブリダイズするオリゴ)および望ましくないヘテロ二量体(それらの意図されたアセンブリパートナーに加えて他のオリゴとハイブリダイズするオリゴ)の形成により、ライゲーションが妨げられる恐れがある。成分内の二次構造と同様に、ホモ二量体およびヘテロ二量体の形成は、予測し、オリゴ設計の間にコンピュータによる計算方法および設計空間検索アルゴリズムを使用して説明することができる。
【0120】
より長いオリゴ配列またはより高いGC含量により、ライゲーション反応内での望ましくない二次構造、ホモ二量体、およびヘテロ二量体の形成の増加が生じ得る。したがって、一部のインプリメンテーションでは、より短いオリゴまたはより低いGC含量を使用することにより、より高いアセンブリ効率が導かれ得る。これらの設計原理により、より効率的なアセンブリに関して、長いオリゴまたは高いGC含量を使用する設計戦略が打ち消され得る。そのように、各成分を構成するオリゴに関して、ライゲーションアセンブリ効率が最適化されるような最適な長さおよび最適なGC含量が存在し得る。ライゲーションに使用されるオリゴの全体的な長さは、少なくとも10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、70塩基、80塩基、90塩基、または少なくとも100塩基、またはそれよりも多くの塩基であり得る。ライゲーションに使用されるオリゴの全体的なGC含量は、0%から100%の間のいずれかであり得る。例えば、ライゲーションに使用されるオリゴの総GC含量は、0%から5%、5%から10%、10%から15%、15%から20%、20%から25%、25%から30%、30%から35%、35%から40%、40%から45%、45%から50%、50%から55%、55%から60%、60%から65%、65%から70%、70%から75%、75%から80%、80%から85%、85%から90%、90%から95%、または95%から100%であり得る。
【0121】
付着末端ライゲーションに加えて、ライゲーションは、一本鎖核酸間でステープル(または鋳型または架橋)鎖を使用して行うこともできる。この方法は、ステープル鎖ライゲーション(SSL)、鋳型により導かれるライゲーション(TDL)、または架橋鎖ライゲーションと称することができる。TDLでは、2つの一本鎖核酸を鋳型上に隣接的にハイブリダイズさせ、したがって、リガーゼによってシールすることができるニックを形成する。付着末端ライゲーションと同じ核酸設計考慮事項がTDLにも当てはまる。鋳型とそれらの意図された相補的な核酸配列の間のより強力なハイブリダイゼーションにより、ライゲーション効率の上昇を導くことができる。したがって、鋳型の両側でのハイブリダイゼーション安定性(または融解温度)を改善する配列特色により、ライゲーション効率を改善することができる。これらの特色は、より長い配列の長さおよびより高いGC含量を含み得る。鋳型を含めたTDLにおける核酸の長さは、少なくとも5塩基、10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、70塩基、80塩基、90塩基、または少なくとも100塩基、またはそれよりも多くの塩基であり得る。鋳型を含めた核酸のGC含量は、0%から100%の間のいずれかであり得る。例えば、鋳型を含む核酸のGC含量は、0%から5%、5%から10%、10%から15%、15%から20%、20%から25%、25%から30%、30%から35%、35%から40%、40%から45%、45%から50%、50%から55%、55%から60%、60%から65%、65%から70%、70%から75%、75%から80%、80%から85%、85%から90%、90%から95%、または95%から100%であり得る。
【0122】
TDLでは、付着末端ライゲーションと同様に、配列空間検索アルゴリズムを用いる核酸構造予測ソフトウェアを使用することにより、望ましくない二次構造を回避する成分および鋳型配列を設計するために注意を払うことができる。TDLにおける成分は、二本鎖の代わりに一本鎖であり得るので、露出した塩基に起因して望ましくない二次構造の発生率がより高くなる可能性がある(付着末端ライゲーションと比較)。
【0123】
TDLは、平滑末端化されたdsDNA成分を用いて実施することもできる。そのような反応では、ステープル鎖が2つの一本鎖核酸を適当に架橋するためには、まずステープルが、完全な一本鎖相補物を置き換えるまたは部分的に置き換えることが必要な可能性がある。dsDNA成分を用いたTDL反応を容易にするために、dsDNAを最初に高温でインキュベートすることで融解させることができる。次いで、反応を冷却し、したがって、ステープル鎖がそれらの適当な核酸相補物にアニーリングすることを可能にすることができる。このプロセスは、dsDNA成分と比較して比較的高い濃度の鋳型を使用することによってさらにいっそう効率的なものにすることができ、したがって、結合に関して鋳型が適当な全長ssDNA相補物に打ち勝つことが可能になる。2つのssDNA鎖がそれらの鋳型およびリガーゼによってアセンブルされたら、次いで、そのアセンブルされた核酸が逆の全長ssDNA相補物の鋳型になり得る。したがって、TDLを用いた平滑末端化されたdsDNAのライゲーションを、融解(より高い温度でのインキュベーション)およびアニーリング(より低い温度でのインキュベーション)の複数のラウンドを通じて改善することができる。このプロセスは、リガーゼサイクリング反応、またはLCRと称することができる。適当な融解温度およびアニーリング温度は核酸配列に依存する。融解温度およびアニーリング温度は、少なくとも摂氏4度、10度、20度、20度、30度、40度、50度、60度、70度、80度、90度、または100度であり得る。温度サイクルの数は、少なくとも1回、5回、10回、15回、20回、15回、30回、またはそれよりも多くであり得る。
【0124】
全てのライゲーションを固定温度反応または多重温度反応で実施することができる。ライゲーション温度は、少なくとも摂氏0度、4度、10度、20度、20度、30度、40度、50度、または60度またはそれよりも高い温度であり得る。リガーゼ活性に最適な温度は、リガーゼの型に応じて異なり得る。さらに、反応において成分が隣り合うまたはハイブリダイズする速度は、それらの核酸配列に応じて異なり得る。より高いインキュベーション温度により、より速い拡散を促進し、したがって、成分が一時的に隣り合うまたはハイブリダイズする頻度を増大させることができる。しかし、温度の上昇により、塩基対結合の破壊、したがって、これらの隣り合ったまたはハイブリダイズした成分2重鎖の安定性の低下も生じ得る。ライゲーションの最適な温度は、アセンブルされる核酸の数、それらの核酸の配列、リガーゼの型、ならびに反応添加剤などの他の因子に依存し得る。例えば、4塩基の相補的な突出を有する2つの付着末端成分は、摂氏4度でT4リガーゼを用いると、摂氏25度でT4リガーゼを用いるよりも速くアセンブルすることができる。しかし、25塩基の相補的な突出を有する2つの付着末端成分は、摂氏25度でT4リガーゼを用いると、摂氏4度でT4リガーゼを用いるよりも速くアセンブルすることができ、また、おそらく、4塩基の突出をいずれの温度でライゲーションするよりも速くアセンブルすることができる。ライゲーションの一部のインプリメンテーションでは、アニーリングのために、リガーゼの添加前に成分を加熱し、ゆっくりと冷却することが有益であり得る。
【0125】
ライゲーションを使用して、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれよりも多くの核酸をアセンブルすることができる。ライゲーションインキュベーション時間は、最大で30秒間、1分間、2分間、5分間、10分間、20分間、30分間、1時間、またはそれよりも長い時間であり得る。より長いインキュベーション時間により、ライゲーション効率を改善することができる。
【0126】
ライゲーションには5’リン酸化末端を有する核酸が必要な場合がある。5’リン酸化末端を有さない核酸成分は、T4ポリヌクレオチドキナーゼ(またはT4 PNK)などのポリヌクレオチドキナーゼとの反応でリン酸化することができる。ATP、マグネシウムイオン、またはDTTなどの他の補因子が反応中に存在し得る。ポリヌクレオチドキナーゼ反応は、摂氏37度で30分間行うことができる。ポリヌクレオチドキナーゼ反応温度は、少なくとも摂氏4度、10度、20度、20度、30度、40度、50度、または60度であり得る。ポリヌクレオチドキナーゼ反応のインキュベーション時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間、またはそれよりも長い時間であり得る。あるいは、核酸成分は、改変された5’リン酸化を用いて合成的に(酵素的なものとは対照的に)設計し、製造することができる。それらの5’末端にアセンブルされる核酸のみにリン酸化が必要になり得る。例えば、TDLにおける鋳型は、アセンブルされるものではないので、リン酸化されていなくてよい。
【0127】
ライゲーション効率を改善するために、添加剤をライゲーション反応に含めることができる。例えば、ジメチルスルホキシド(DMSO)、ポリエチレングリコール(PEG)、1,2-プロパンジオール(1,2-Prd)、グリセロール、Tween-20またはこれらの組合せの添加。PEG6000が特に有効なライゲーション増強剤であり得る。PEG6000は、クラウディング剤として作用することによってライゲーション効率を上昇させ得る。例えば、PEG6000は、リガーゼ反応溶液中の空間を占める凝集した小塊を形成し、リガーゼと成分をより近づけ得る。添加剤含有量(体積当たりの重み)は、少なくとも0%、1%、5%、10%、20%、またはそれよりも多くであり得る。
【0128】
種々のリガーゼをライゲーションのために使用することができる。リガーゼは、天然に存在するものであっても合成されたものであってもよい。リガーゼの例としては、T4 DNAリガーゼ、T7 DNAリガーゼ、T3 DNAリガーゼ、Taq DNAリガーゼ、9N(商標)DNAリガーゼ、E.coli DNAリガーゼ、およびSplintR DNAリガーゼが挙げられる。異なるリガーゼは、異なる温度で安定かつ最適に機能し得る。例えば、Taq DNAリガーゼは熱安定性であり、T4 DNAリガーゼは熱安定性ではない。さらに、異なるリガーゼは異なる性質を有する。例えば、T4 DNAリガーゼは平滑末端化されたdsDNAをライゲーションすることができるが、T7 DNAリガーゼは平滑末端化されたdsDNAをライゲーションすることができない。
【0129】
ライゲーションを使用して、シークエンシングアダプターを核酸のライブラリーに付着させることができる。例えば、ライゲーションを、核酸ライブラリーの各メンバーの末端の共通の付着末端またはステープルを用いて実施することができる。核酸の一方の末端の付着末端またはステープルが他方の末端のものと区別可能な場合、シークエンシングアダプターを非対称にライゲーションすることができる。例えば、フォワードシークエンシングアダプターを核酸ライブラリーのメンバーの一方の末端にライゲーションすることができ、リバースシークエンシングアダプターを核酸ライブラリーのメンバーの他方の末端にライゲーションすることができる。あるいは、平滑末端化されたライゲーションを使用して、アダプターを平滑末端化された二本鎖核酸のライブラリーに付着させることができる。フォークアダプターを使用して、各末端で等価である平滑末端または付着末端のいずれかを有する核酸ライブラリーにアダプターを非対称に付着させることができる(例えば、A尾部など)。
【0130】
ライゲーションは、熱失活(例えば、摂氏65度で少なくとも20分間のインキュベーション)、変性剤の添加、またはEDTAなどのキレート剤の添加によって阻害され得る。
C.制限酵素消化
【0131】
制限酵素消化は、制限エンドヌクレアーゼ(または制限酵素)が核酸上のそれらの同類の制限部位を認識し、その後、前記制限部位を含有する核酸を切断する(または消化する)反応である。I型、II型、III型、またはIV型制限酵素を制限酵素消化のために使用することができる。II型制限酵素が核酸消化のための最も効率的な制限酵素であり得る。II型制限酵素は、パリンドローム制限部位を認識し、認識部位内の核酸を切断することができる。前記制限酵素(およびそれらの制限部位)の例としては、AatII(GACGTC)、AfeI(AGCGCT)、ApaI(GGGCCC)、DpnI(GATC)、EcoRI(GAATTC)、NgeI(GCTAGC)、およびさらに多くが挙げられる。DpnIおよびAfeIなどのいくつかの制限酵素は、それらの制限部位を中央で切断することができ、したがって、平滑末端化されたdsDNA産物が残される。EcoRIおよびAatIIなどの他の制限酵素は、それらの制限部位を中心から外れて切断し、したがって、付着末端(またはねじれ型の末端)を有するdsDNA産物が残される。いくつかの制限酵素は、不連続の制限部位を標的とし得る。例えば、制限酵素AlwNIは、制限部位CAGNNNCTGを認識し、ここで、Nは、A、T、C、またはGのいずれかである。制限部位は、長さ少なくとも2塩基、4塩基、6塩基、8塩基、10塩基、またはそれよりも多くの塩基であり得る。
【0132】
いくつかのII型制限酵素は、それらの制限部位の外側の核酸を切断する。この酵素は、IIS型またはIIG型制限酵素に下位分類することができる。前記酵素は、パリンドロームでない制限部位を認識することができる。前記制限酵素の例としては、GAAACを認識し、2塩基(同じ鎖)および6塩基(逆の鎖)さらに下流にねじれ型切断を創出するBbsIが挙げられる。別の例としては、GGTCTCを認識し、1塩基(同じ鎖)および5塩基(逆の鎖)さらに下流にねじれ型切断を創出するBsaIが挙げられる。前記制限酵素をゴールデンゲートアセンブリまたはモジュラークローニング(MoClo)のために使用することができる。BcgI(IIG型制限酵素)などのいくつかの制限酵素は、その認識部位の両末端にねじれ型切断を創出し得る。制限酵素は、それらの認識部位から少なくとも1塩基、5塩基、10塩基、15塩基、20塩基、またはそれよりも遠く離れた核酸を切断し得る。前記制限酵素は、それらの認識部位の外側でねじれ型切断を創出し得るので、得られる核酸突出の配列を任意に設計することができる。これは、得られる核酸突出の配列が制限部位の配列とカップリングする、それらの認識部位内にねじれ型切断を創出する制限酵素とは対照的である。制限酵素消化によって創出される核酸突出は、長さ少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、またはそれよりも多くの塩基であり得る。制限酵素により核酸を切断する場合、得られる5’末端はリン酸を含有する。
【0133】
1つまたは複数の核酸配列を制限酵素消化反応に含めることができる。同様に、1つまたは複数の制限酵素を一緒に制限酵素消化反応に使用することができる。制限酵素消化は、カリウムイオン、マグネシウムイオン、ナトリウムイオン、BSA、S-アデノシル-L-メチオニン(SAM)、またはこれらの組合せを含めた添加剤および補助因子を含有し得る。制限酵素消化反応は、摂氏37度で1時間インキュベートすることができる。制限酵素消化反応は、少なくとも摂氏0度、10度、20度、30度、40度、50度、または60度の温度でインキュベートすることができる。最適な消化温度は酵素に依存し得る。制限酵素消化反応は、最大で1分間、10分間、30分間、60分間、90分間、120分間、またはそれよりも長くインキュベートすることができる。より長いインキュベーション時間により、消化の増大をもたらすことができる。
D.核酸増幅
【0134】
核酸増幅は、ポリメラーゼ連鎖反応、またはPCRを用いて実行することができる。PCRでは、核酸の出発プール(鋳型プールまたは鋳型と称される)をポリメラーゼ、プライマー(短い核酸プローブ)、ヌクレオチド三リン酸(例えば、dATP、dTTP、dCTP、dGTP、およびその類似体またはバリアントなど)、ならびにベタイン、DMSO、およびマグネシウムイオンなどの追加的な補助因子および添加剤と組み合わせることができる。鋳型は、一本鎖核酸であっても二本鎖核酸であってもよい。プライマーは、鋳型プール中の標的配列に相補的であり、ハイブリダイズするように合成的に構築された短い核酸配列であり得る。プライマーは、鋳型プール中の標的配列に相補的であり、ハイブリダイズするように合成的に構築された短い核酸配列であり得る。一般には、PCR反応には2種のプライマーが存在し、一方は標的鋳型の上の鎖のプライマー結合性部位に相補であり、他方は第1の結合性部位よりも下流の、標的鋳型の下の鎖のプライマー結合性部位に相補的である。これらのプライマーがそれらの標的に結合する5’から3’への配向は、それらの間の核酸配列を首尾よく複製し、指数関数的に増幅するために、互いに向かい合っていなければならない。「PCR」とは、一般には、特に前記形態の反応を指し得るが、より一般的には、あらゆる核酸増幅反応を指すためにも使用され得る。
【0135】
一部のインプリメンテーションでは、PCRは、3つの温度:融解温度、アニーリング温度、および伸長温度の間をサイクルさせることを含み得る。融解温度は、二本鎖核酸を一本鎖核酸に変えること、ならびにハイブリダイゼーション産物および二次構造の形成を除去することを目的とするものである。一般には、融解温度は、高く、例えば、摂氏95度を超える。一部のインプリメンテーションでは、融解温度は、少なくとも摂氏96度、97度、98度、99度、100度、101度、102度、103度、104度、または105度であり得る。他のインプリメンテーションでは、融解温度は、最大で摂氏95度、94度、93度、92度、91度、または90度であり得る。融解温度が高いほど核酸およびそれらの二次構造の解離が改善されるが、核酸またはポリメラーゼの分解などの副作用も引き起こされる恐れがある。融解温度は、反応に少なくとも1秒間、2秒間、3秒間、4秒間、5秒間、またはそれよりも長く、例えば、30秒間、1分間、2分間、または3分間にわたって適用することができる。複雑なまたは長い鋳型を用いたPCRにはより長い最初の融解温度ステップが推奨される場合がある。
【0136】
アニーリング温度は、プライマーとそれらの標的鋳型の間のハイブリダイゼーションの形成を容易にすることを目的とするものである。一部のインプリメンテーションでは、アニーリング温度は、プライマーの算出された融解温度と対応し得る。他のインプリメンテーションでは、アニーリング温度は、前記融解温度から摂氏10度またはそれよりも高い温度以内であり得る。一部のインプリメンテーションでは、アニーリング温度は、少なくとも摂氏25度、30度、50度、55度、60度、65度、または70度であり得る。融解温度は、プライマーの配列に依存し得る。プライマーが長いほど融解温度が高くなり得、グアニンまたはシトシンヌクレオチドのパーセント含有量が高いプライマーほど融解温度が高くなり得る。したがって、特定のアニーリング温度で最適にアセンブルするように意図されたプライマーを設計することが可能であり得る。アニーリング温度は、反応に少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間、または30秒間にわたって、またはそれよりも長く適用することができる。アニーリングを確実にすることを補助するために、プライマー濃度を高くするまたは量を飽和させることができる。プライマー濃度は、500ナノモル(nM)であり得る。プライマー濃度は、最大で1nM、10nM、100nM、1000nM、またはそれよりも高い濃度であり得る。
【0137】
伸長温度は、1つまたは複数のポリメラーゼ酵素によって触媒されるプライマーの3’末端核酸鎖延長を開始させ、容易にすることを目的とするものである。一部のインプリメンテーションでは、伸長温度をポリメラーゼが核酸結合強度、延長スピード、延長安定性、または忠実度に関して最適に機能する温度に設定することができる。一部のインプリメンテーションでは、伸長温度は、少なくとも摂氏30度、40度、50度、60度、または70度、またはそれよりも高い温度であり得る。アニーリング温度は、反応に少なくとも1秒間、5秒間、10秒間、15秒間、20秒間、25秒間、30秒間、40秒間、50秒間、または60秒間にわたって、またはそれよりも長く適用することができる。推奨される伸長時間は、予測される延長の1キロベース当たりおよそ15~45秒間であり得る。
【0138】
PCRの一部のインプリメンテーションでは、アニーリング温度と伸長温度は同じであってよい。したがって、2ステップ温度サイクルを3ステップ温度サイクルの代わりに使用することができる。複合アニーリングおよび伸長温度の例としては、摂氏60度、65度、または72度が挙げられる。
【0139】
一部のインプリメンテーションでは、PCRを1つの温度サイクルで実施することができる。そのようなインプリメンテーションは、標的化された一本鎖鋳型核酸を二本鎖核酸に変えることを伴い得る。他のインプリメンテーションでは、PCRを複数の温度サイクルで実施することができる。PCRが効率的であれば、各サイクルで標的核酸分子の数が2倍になり、それにより、元の鋳型プールからの標的化された核酸鋳型の数の指数関数的な増加が生じることが予想される。PCRの効率は変動し得る。したがって、各ラウンドで複製される標的化された核酸の実際のパーセントは、100%より多いまたは少ない可能性がある。各PCRサイクルで突然変異したおよび組み換えられた核酸などの望ましくないアーチファクトが導入される可能性がある。この潜在的な害を縮小するために、忠実度が高く処理能力が高いポリメラーゼを使用することができる。さらに、限られた数のPCRサイクルを使用することができる。PCRは、最大で1、5、10、15、20、25、30、35、40、45、またはそれよりも多くのサイクルを伴い得る。
【0140】
一部の実施形態では、複数の区別可能な標的核酸配列を1つのPCRで一緒に増幅することができる。各標的配列が共通のプライマー結合性部位を有する場合、全ての核酸配列を、同じプライマーセットを用いて増幅することができる。あるいは、PCRは、各々が区別可能な核酸を標的とすることが意図された複数のプライマーを含み得る。前記PCRは多重PCRと称することができる。PCRは、最大で1種、2種、3種、4種、5種、6種、7種、8種、9種、10種、またはそれよりも多くの区別可能なプライマーを伴い得る。複数の区別可能な核酸標的を有するPCRでは、各PCRサイクルにより、標的化された核酸の相対的な分布が変化する可能性がある。例えば、均一な分布が歪んだまたは非均一に分布したものになる可能性がある。この潜在的な害を縮小するために、最適なポリメラーゼ(例えば、高忠実度および配列頑強性を有する)および最適なPCR条件を使用することができる。アニーリングおよび伸長の温度および時間などの因子を最適化することができる。さらに、限られた数のPCRサイクルを使用することができる。
【0141】
PCRの一部のインプリメンテーションでは、鋳型中のその標的化プライマー結合性部位に対して塩基ミスマッチを有するプライマーを使用して標的配列を突然変異させることができる。PCRの一部のインプリメンテーションでは、5’末端に余分の配列(突出として公知)を有するプライマーを使用して、その標的化された核酸に配列を付着させることができる。例えば、5’末端にシークエンシングアダプターを含有するプライマーを使用して、シークエンシングのための核酸ライブラリーを調製および/または増幅することができる。ある特定のシークエンシング技術のための十分な富化のために、シークエンシングアダプターを標的とするプライマーを使用して核酸ライブラリーを増幅することができる。
【0142】
一部のインプリメンテーションでは、プライマーが鋳型の一方の鎖のみ(両方の鎖ではなく)標的とする場合、線形PCR(または非対称PCR)を使用する。線形PCRでは、各サイクルから複製される核酸はプライマーと相補的なものではなく、したがって、プライマーはその核酸に結合しない。したがって、プライマーは、各サイクルで元の標的鋳型のみを複製し、したがって、線形(指数関数的なものとは対照的な)増幅になる。線形PCRからの増幅は従来の(指数関数的な)PCRほど高速でない可能性があるが、最大収率はより大きい可能性がある。理論的に、線形PCRにおけるプライマー濃度は、従来のPCRではそうなるような、サイクルの増加および収率の上昇での制限因子にはならない。指数関数的増幅後線形増幅PCR(Linear-After-The-Exponential-PCR)(またはLATE-PCR)は、特に高収率を可能にし得る線形PCRの改変バージョン。
【0143】
核酸増幅の一部のインプリメンテーションでは、融解、アニーリング、および伸長のプロセスを単一の温度で行うことができる。そのようなPCRは、等温性PCRと称することができる。等温性PCRでは、プライマー結合に有利になるように十分に相補的な核酸の鎖を互いから解離させるまたは置き換えるために温度に依存しない方法を活用することができる。この戦略としては、ループ媒介性等温増幅、鎖置換増幅、ヘリカーゼ依存性増幅法、およびニッキング酵素増幅反応が挙げられる。等温性核酸増幅は、最大で摂氏20度、30度、40度、50度、60度、または70度またはそれよりも高い温度で行うことができる。
【0144】
一部のインプリメンテーションでは、PCRは、試料中の核酸の量を数量化するための蛍光プローブまたは色素をさらに含み得る。例えば、色素を二本鎖核酸に挿入することができる。前記色素の例は、SYBR Greenである。蛍光プローブは、蛍光単位が付着した核酸配列であってもよい。蛍光単位は、プローブが標的核酸とハイブリダイズし、その後伸長ポリメラーゼ単位から改変されると放出され得る。前記プローブの例としては、TaqManプローブが挙げられる。そのようなプローブをPCRおよび光学的測定ツール(励起および検出のための)と併せて使用して、試料中の核酸濃度を数量化することができる。このプロセスは、定量的PCR(qPCR)またはリアルタイムPCR(rtPCR)と称することができる。
【0145】
一部のインプリメンテーションでは、PCRを複数の鋳型分子のプールに対してではなく単一の分子鋳型に対して(単一分子PCRと称することができるプロセスで)実施することができる。例えば、エマルジョン-PCR(ePCR)を使用して、単一の核酸分子を油エマルジョン中の水滴の中に封入することができる。水滴はPCR試薬も含み得、水滴を、PCRのための必要な温度サイクリングが可能な温度調節された環境で保持することができる。このように、複数の自蔵式PCR反応を同時にハイスループットで行うことができる。界面活性物質を用いて油エマルジョンの安定性を改善することができる。マイクロ流体チャネルを通じて圧力を用いて液滴の動きを制御することができる。マイクロ流体デバイスは、液滴を創出するため、液滴を分割するため、液滴を同化させるため、材料を液滴中に注射するため、ならびに液滴をインキュベートするために使用することができる。油エマルジョン中の水滴のサイズは、少なくとも1ピコリットル(pL)、10pL、100pL、1ナノリットル(nL)、10nL、100nL、またはそれよりも大きいサイズであり得る。
【0146】
一部のインプリメンテーションでは、単一分子PCRを固相基板上で実施することができる。例としては、Illumina固相増幅法またはその変形が挙げられる。鋳型プールを固相基板に暴露させ、ここで、固相基板は、鋳型をある特定の空間分解能で固定化することができるものである。次いで、各鋳型の空間的近傍でブリッジ増幅を行い、それにより、単一分子を基板上でハイスループット様式で増幅することができる。
【0147】
ハイスループット単一分子PCRは、互いに妨げる可能性がある区別可能な核酸のプールを増幅するために有用であり得る。例えば、複数の区別可能な核酸が共通配列領域を共有する場合、この共通領域に沿った核酸間の組換えがPCR反応中に起こり、その結果、新しい、組み換えられた核酸がもたらされる可能性がある。単一分子PCRでは、区別可能な核酸配列が互いに区画化され、したがって、相互作用することができないので、この潜在的な増幅エラーが防止される。単一分子PCRは、シークエンシングのための核酸を調製するために特に有用であり得る。単一分子PCRは、鋳型プール中のいくつかの標的の絶対的定量化のためにも有用であり得る。例えば、デジタルPCR(またはdPCR)では、区別可能な単一分子PCR増幅シグナルの頻度を使用して、試料中の出発核酸分子の数を推定する。
【0148】
PCRの一部のインプリメンテーションでは、全ての核酸に共通するプライマー結合性部位に対するプライマーを使用し、核酸の群を非弁別的に増幅することができる。例えば、プライマー結合性部位に対するプライマーは、プール中の全ての核酸に隣接している。これらの共通部位を一般的な増幅に用いて合成核酸ライブラリーを創出またはアセンブルすることができる。しかし、一部のインプリメンテーションでは、PCRを使用する。例えば、プライマーを前記標的化された核酸のサブセットにおいてのみ存在するプライマー結合性部位と使用することによって、標的化された核酸のサブセットをプールから選択的に増幅することができる。合成核酸ライブラリーは、サブライブラリーをより一般的なライブラリーから選択的に増幅するために、目的の潜在的サブライブラリーに属する核酸全てがそれらの端部に共通のプライマー結合性部位を共有する(サブライブラリー中では共通するが、他のサブライブラリーとは区別可能な)ように創出またはアセンブルすることができる。一部のインプリメンテーションでは、PCRを核酸アセンブリ反応(例えば、ライゲーションまたはOEPCRなど)と組み合わせて、完全にアセンブルされたまたは潜在的に完全にアセンブルされた核酸を部分的にアセンブルされたまたはミスアセンブルされた(または意図されたものではないもしくは望ましくない)副産物から選択的に増幅することができる。例えば、アセンブリは、核酸を各端部配列上のプライマー結合性部位と、完全にアセンブルされた核酸産物のみが増幅のための必須の2つのプライマー結合性部位を含有するようにアセンブルすることを伴い得る。前記例では、部分的にアセンブルされた産物は、プライマー結合性部位を有する端部配列のいずれも含有しないまたはその一方のみを含有する可能性があり、したがって、増幅されないはずである。同様に、ミスアセンブルされた(または意図されたものではないもしくは望ましくない)産物は、端部配列のいずれも含有しないもしくはその一方のみを含有する、または両方の端部配列を含有するが誤った配向であるもしくは誤った量の塩基によって分離されている。したがって、前記ミスアセンブルされた産物は、増幅されないかまたは増幅されて誤った長さの産物が創出されるはずである。後者の場合、誤った長さの増幅されたミスアセンブルされた産物を、正しい長さの増幅された完全にアセンブルされた産物から、アガロースゲルでのDNA電気泳動、その後のゲル抽出などの核酸サイズ選択方法によって分離することができる。
【0149】
核酸増幅の効率を改善するために、PCRに添加剤を含めることができる。例えば、ベタイン、ジメチルスルホキシド(DMSO)、非イオン性界面活性剤、ホルムアミド、マグネシウム、ウシ血清アルブミン(BSA)、またはこれらの組合せの添加。添加剤含有量(体積当たりの重み)は、少なくとも0%、1%、5%、10%、20%、またはそれよりも多くであり得る。
【0150】
種々のポリメラーゼをPCRのために使用することができる。ポリメラーゼは、天然に存在するものであっても合成されたものであってもよい。ポリメラーゼの例は、Φ29ポリメラーゼまたはその誘導体である。一部の場合では、新しい核酸配列を構築するために、転写酵素またはリガーゼ(すなわち、結合の形成を触媒する酵素)をポリメラーゼと併せてまたはポリメラーゼの代替として使用する。ポリメラーゼの例としては、DNAポリメラーゼ、RNAポリメラーゼ、耐熱性ポリメラーゼ、野生型ポリメラーゼ、改変ポリメラーゼ、E.coli DNAポリメラーゼI、T7 DNAポリメラーゼ、バクテリオファージT4 DNAポリメラーゼΦ29(ファイ29)DNAポリメラーゼ、Taqポリメラーゼ、Tthポリメラーゼ、Tliポリメラーゼ、Pfuポリメラーゼ、Pwoポリメラーゼ、VENTポリメラーゼ、DEEPVENTポリメラーゼ、Ex-Taqポリメラーゼ、LA-Tawポリメラーゼ、Ssoポリメラーゼ、Pocポリメラーゼ、Pabポリメラーゼ、Mthポリメラーゼ ES4ポリメラーゼ、Truポリメラーゼ、Tacポリメラーゼ、Tneポリメラーゼ、Tmaポリメラーゼ、Tcaポリメラーゼ、Tihポリメラーゼ、Tfiポリメラーゼ、白金 Taqポリメラーゼ、Tbrポリメラーゼ、Phusionポリメラーゼ、KAPAポリメラーゼ、Q5ポリメラーゼ、Tflポリメラーゼ、Pfutuboポリメラーゼ、Pyrobestポリメラーゼ、KODポリメラーゼ、Bstポリメラーゼ、Sacポリメラーゼ、3’から5’へのエキソヌクレアーゼ活性を有するクレノウ断片ポリメラーゼ、ならびにそのバリアント、改変製品および誘導体が挙げられる。異なるポリメラーゼは、異なる温度で安定かつ最適に機能し得る。さらに、異なるポリメラーゼは異なる性質を有する。例えば、Phusionポリメラーゼのような一部のポリメラーゼは、核酸伸長の間、より高い忠実度に寄与し得る3’から5’へのエキソヌクレアーゼ活性を示し得る。一部のポリメラーゼは伸長の間リーディング配列を動かし得、一方、他のポリメラーゼは、それらを分解し得るまたは伸長を停止し得る。Taqのような一部のポリメラーゼは、アデニン塩基を核酸配列の3’末端に組み入れる。さらに、一部のポリメラーゼは、他のポリメラーゼよりも高い忠実度および処理能力を有し得、増幅された核酸収率のために最小の突然変異を有することが重要である場合、および区別可能な核酸の分布のために増幅全体を通して均一な分布を維持することが重要である場合のシークエンシング調製などのPCR適用により適切であり得る。
E.サイズ選択
【0151】
サイズ選択技法を使用して特定のサイズの核酸を試料から選択することができる。一部のインプリメンテーションでは、サイズ選択を、ゲル電気泳動またはクロマトグラフィーを使用して実施することができる。核酸の液体試料を固定相またはゲル(またはマトリックス)の一方の電極にロードすることができる。ゲルの負極が、核酸試料がロードされる電極になり、ゲルの陽極が逆の電極になるようにゲルにわたって電圧の差異をかけることができる。核酸は負に荷電したリン酸骨格を有するので、ゲルを渡って陽極に移動する。核酸のサイズにより、核酸がゲルを通る相対的な移動スピードが決定される。したがって、サイズが異なる核酸は、ゲル上でそれらが移動するにつれて分解される。電圧の差異は、100Vまたは120Vであり得る。電圧の差異は、最大で50V、100V、150V、200V、250V、またはそれよりも大きい差異であり得る。電圧の差異が大きいほど核酸移動のスピードおよびサイズ分解能が大きくなり得る。しかし、電圧の差異が大きいと、核酸またはゲルの損傷も生じ得る。より大きなサイズの核酸を分解するために、より大きな電圧の差異が推奨される場合がある。典型的な移動時間は15分間から60分間の間であり得る。移動時間は、最大で10分間、30分間、60分間、90分間、120分間、またはそれよりも長い時間であり得る。より高い電圧と同様に、より長い移動時間により、より良好な核酸分解能を導くことができるが、核酸損傷の増大が導かれ得る。より大きなサイズの核酸を分解するために、より長い移動時間が推奨される場合がある。例えば、200塩基の核酸を250塩基の核酸から分解するためには、120Vという電圧の差異および30分という移動時間が十分であり得る。
【0152】
ゲル、またはマトリックスの性質は、サイズ選択プロセスに影響を及ぼし得る。ゲルは、一般には、TAE(トリス-酢酸-EDTA)またはTBE(トリス-ホウ酸-EDTA)などの伝導性緩衝剤中に分散したアガロースまたはポリアクリルアミドなどのポリマー物質を含む。ゲル中の物質(例えば、アガロースまたはアクリルアミド)の含有量(体積当たりの重み)は、最大で5%、1%、2%、3%、5%、10%、15%、20%、25%、またはそれよりも多くであり得る。含有量が高いほど移動スピードが低下し得る。より小さな核酸を分解するために、より高い含有量が好ましい場合がある。二本鎖DNA(dsDNA)を分解するためにはアガロースゲルがより良好であり得る。一本鎖DNA(ssDNA)を分解するためにはポリアクリルアミドゲルがより良好であり得る。好ましいゲル組成物は、核酸型およびサイズ、添加剤(例えば、色素、染料、変性溶液、またはローディング緩衝剤)の適合性ならびに先行する下流の適用(例えば、ゲル抽出、次いでライゲーション、PCR、またはシークエンシング)に依存し得る。アガロースゲルは、ゲル抽出に関してポリアクリルアミドゲルよりも単純であり得る。抽出プロセスにおけるホウ酸(酵素阻害剤)持ち越し汚染により下流の酵素反応が阻害される可能性があるので、TAEはTBEほど良好な伝導体ではないが、同様にゲル抽出に関してはより良好であり得る。
【0153】
ゲルは、SDS(ドデシル硫酸ナトリウム)または尿素などの変性溶液をさらに含み得る。SDSは、例えば、タンパク質を変性させるためまたは核酸を潜在的に結合したタンパク質から分離するために使用することができる。尿素は、DNAの二次構造を変性させるために使用することができる。例えば、尿素により、dsDNAをssDNAに変換することができる、または尿素により、フォールディングされたssDNA(例えば、ヘアピン)をフォールディングされていないssDNAに変換することができる。ssDNAを正確に分解するために尿素-ポリアクリルアミドゲル(TBEをさらに含む)を使用することができる。
【0154】
試料をゲルに異なるフォーマットで組み入れることができる。一部のインプリメンテーションでは、ゲルは、試料を手動でロードすることができるウェルを含有し得る。1つのゲルが複数の核酸試料を流すための複数のウェルを有し得る。他のインプリメンテーションでは、ゲルを、核酸試料(複数可)を自動的にロードするマイクロ流体チャネルに付着させることができる。各ゲルはいくつかのマイクロ流体チャネルの下流にあってもよく、ゲル自体が別々のマイクロ流体チャネルを占有していてもよい。ゲルの寸法が核酸検出(または可視化)の感度に影響を及ぼし得る。例えば、薄いゲルまたはマイクロ流体チャネルの内側にあるゲル(例えば、バイオアナライザまたはテープステーション中のものなど)により、核酸検出の感度を改善することができる。核酸検出ステップは、正しいサイズの核酸断片を選択し、抽出するために重要であり得る。
【0155】
核酸サイズ参照のためにゲルにラダーをロードすることができる。ラダーは、核酸試料を比較することができる種々のサイズのマーカーを含有し得る。異なるラダーは異なるサイズ範囲および分解能を有し得る。例えば、50塩基のラダーは、50塩基、100塩基、150塩基、200塩基、250塩基、300塩基、350塩基、400塩基、450塩基、500塩基、550塩基、および600塩基のところにマーカーを有し得る。前記ラダーは、50塩基から600塩基のサイズ範囲内の核酸を検出し、選択するために有用であり得る。ラダーは、試料中の種々のサイズの核酸の濃度を推定するための標準物質として使用することもできる。
【0156】
核酸試料およびラダーをローディング緩衝剤と混合して、ゲル電気泳動(またはクロマトグラフィー)プロセスを容易にすることができる。ローディング緩衝剤は、核酸の移動の追跡を補助するための色素およびマーカーを含有し得る。ローディング緩衝剤は、核酸試料が試料ロードウェル(ランニング緩衝剤中に浸されていてもよい)の底部に沈むことを確実にするために、ランニング緩衝剤(例えば、TAEまたはTBE)よりも密度の高い試薬(例えば、グリセロールなど)をさらに含み得る。ローディング緩衝剤は、SDSまたは尿素などの変性剤をさらに含み得る。ローディング緩衝剤は、核酸の安定性を改善するための試薬をさらに含み得る。例えば、ローディング緩衝剤は、核酸をヌクレアーゼから保護するためのEDTAを含有し得る。
【0157】
一部のインプリメンテーションでは、ゲルは、核酸に結合し、異なるサイズの核酸を光学的に検出するために使用することができる染料を含み得る。染料は、dsDNA、ssDNA、またはその両方に特異的なものであってよい。異なる染料を異なるゲル物質に適合させることができる。いくつかの染料は、可視化のために光源光(または電磁波)からの励起を必要とする。光源光は、UV(紫外線)または青色光であり得る。一部のインプリメンテーションでは、染料をゲルに電気泳動前に添加することができる。他のインプリメンテーションでは、染料をゲルに電気泳動後に添加することができる。染料の例としては、臭化エチジウム(EtBr)、SYBR Safe、SYBR Gold、銀染色、またはメチレンブルーが挙げられる。ある特定のサイズのdsDNAを可視化するための信頼できる方法は、例えば、アガロースTAEゲルをSYBR SafeまたはEtBr染色と一緒に使用することである。ある特定のサイズのssDNAを可視化するための信頼できる方法は、例えば、尿素-ポリアクリルアミドTBEゲルをメチレンブルーまたは銀染色と一緒に使用することである。
【0158】
一部のインプリメンテーションでは、ゲルを通る核酸の移動を、電気泳動に加えて他の方法によって駆動することができる。例えば、重力、遠心分離、真空、または圧力を使用して、核酸を駆動してゲルを通し、その結果、それらの核酸をサイズに応じて分解することができる。
【0159】
刃または剃刀を使用してある特定のサイズの核酸をゲルから抽出して、核酸を含有するゲルのバンドを切り出すことができる。切り出しがある特定のバンドで的確に行われること、および、切り出しにより、異なる望ましくないサイズのバンドに属し得る核酸が首尾よく排除されることを確実にするために、適当な光学的検出技法およびDNAラダーを使用することができる。ゲルバンドを緩衝剤と一緒にインキュベートしてゲルバンドを溶解させ、したがって、核酸を緩衝液中に放出させることができる。加熱または物理的撹拌により、溶解のスピードを上げることができる。あるいは、ゲルバンドを、緩衝剤中で、ゲル溶解を必要とせずにDNAの緩衝液中への拡散を可能にするために十分に長くインキュベートすることができる。次いで、緩衝剤を残りの固相ゲルから、例えば、吸引または遠心分離によって分離することができる。次いで、核酸を溶液からフェノール-クロロホルム抽出、エタノール沈殿、磁気ビーズ捕捉、および/またはシリカ膜吸着などの標準の精製または緩衝剤交換技法、洗浄、ならびに溶出を使用して精製することができる。このステップで核酸を濃縮することもできる。
【0160】
ゲル切り出しの代替として、ある特定のサイズの核酸を、ゲルから流出させることによってゲルから分離することができる。移動している核酸は、ゲルに埋め込まれたかまたはゲルの最後にあるたらい(またはウェル)を通過し得る。移動プロセスについて時間を計るまたは光学的にモニタリングし、したがって、ある特定のサイズの核酸群がたらいに入ったら、試料をたらいから収集することができる。収集は、例えば吸引によって行うことができる。次いで、核酸を、収集された溶液からフェノール-クロロホルム抽出、エタノール沈殿、磁気ビーズ捕捉、および/またはシリカ膜吸着などの標準の精製または緩衝剤交換技法、洗浄、ならびに溶出を使用して精製することができる。このステップで核酸を濃縮することもできる。
【0161】
核酸サイズ選択のための他の方法としては、質量分光測定または膜に基づく濾過を挙げることができる。膜に基づく濾過の一部のインプリメンテーションでは、核酸を、dsDNA、ssDNA、またはその両方のいずれかに優先的に結合し得る膜(例えば、シリカ膜)を通過させる。膜は、少なくともある特定のサイズの核酸を優先的に捕捉するように設計することができる。例えば、膜を、20塩基未満、30塩基未満、40塩基未満、50塩基未満、70塩基未満、90塩基未満、またはそれよりも多くの塩基未満の核酸を濾過して取り除くように設計することができる。前記膜に基づくサイズ選択技法は、ゲル電気泳動またはクロマトグラフィーほどストリンジェントでない可能性がある。
F.核酸捕捉
【0162】
親和性タグ付き核酸を核酸捕捉のための配列特異的なプローブとして使用することができる。プローブを、核酸のプール内の標的配列と相補的になるように設計することができる。その後、プローブを核酸プールと一緒にインキュベートし、その標的とハイブリダイズさせることができる。インキュベーション温度は、ハイブリダイゼーションを容易にするためにプローブの融解温度を下回るようにすることができる。インキュベーション温度は、プローブの融解温度を摂氏5度下回る温度まで、10度下回る温度まで、15度下回る温度まで、20度下回る温度まで、25度下回る温度まで、またはそれよりも大きく下回るまであってよい。ハイブリダイズした標的を、親和性タグに特異的に結合する固相基板に捕捉することができる。固相基板は、膜、ウェル、カラム、またはビーズであり得る。複数のラウンドの洗浄により、ハイブリダイズしなかった核酸を全て標的から除去することができる。洗浄は、洗浄の間の標的配列の安定な固定化を容易にするためにプローブの融解温度を下回る温度で行うことができる。洗浄温度は、プローブの融解温度を摂氏5度下回る温度まで、10度下回る温度まで、15度下回る温度まで、20度下回る温度まで、25度下回る温度まで、またはそれよりも大きく下回る温度までであってよい。最終的な溶出ステップにより、核酸標的を固相基板から、ならびに親和性タグ付きプローブから回収することができる。溶出ステップは、核酸標的の溶出緩衝剤中への放出を容易にするためにプローブの融解温度を上回る温度で行うことができる。溶出温度は、プローブの融解温度を摂氏5度上回る温度まで、10度上回る温度まで、15度上回る温度まで、20度上回る温度まで、25度上回る温度まで、またはそれよりも大きく上回る温度までであってよい。
【0163】
ある特定のインプリメンテーションでは、固相基板に結合したオリゴヌクレオチドは、例えば、酸、塩基、酸化、還元、熱、光、金属イオン触媒作用、置換反応または脱離反応化学、または酵素的切断などの条件に対する暴露によって、固相基板から除去され得る。ある特定の実施形態では、オリゴヌクレオチドは、切断可能な連結部分を通して固相支持体に付着し得る。例えば、固相基板を官能化して、標的化オリゴヌクレオチドに共有結合するための切断可能なリンカーを提供してもよい。一部の実施形態では、リンカー部分は、6原子またはそれより多くの長さのリンカーであり得る。一部の実施形態では、切断可能リンカーは、TOPS(合成あたり2個のオリゴヌクレオチドの)リンカー、アミノリンカー、または光切断可能リンカーであり得る。
【0164】
一部のインプリメンテーションでは、ビオチンを、固相基板上のストレプトアビジンによって固定化される親和性タグとして使用することができる。ビオチン化オリゴヌクレオチドを、核酸捕捉プローブとして使用するために設計し、製造することができる。オリゴヌクレオチドの5’末端または3’末端をビオチン化することができる。オリゴヌクレオチドの内部のチミン残基をビオチン化することもできる。オリゴ上のビオチンを増加させることにより、ストレプトアビジン基板でのより強力な捕捉をもたらすことができる。オリゴの3’末端のビオチンにより、PCRの間にオリゴが伸長するのを遮断することができる。ビオチンタグは、標準のビオチンのバリアントであってよい。例えば、ビオチンバリアントは、ビオチン-TEG(トリエチレングリコール)、二重ビオチン、PCビオチン、デスチオビオチン-TEG、およびビオチンアジ化物/アジドであり得る。二重ビオチンにより、ビオチン-ストレプトアビジン親和性を増大させることができる。ビオチン-TEGは、TEGリンカーで分離された核酸上のビオチン基に付着する。これにより、ビオチンが核酸プローブの機能、例えば、その標的とのハイブリダイゼーションに干渉するのを防止することができる。核酸ビオチンリンカーをプローブに付着させることもできる。核酸リンカーは、標的とハイブリダイズすることが意図されていない核酸配列を含み得る。
【0165】
ビオチン化核酸プローブは、その標的にいかによくハイブリダイズすることができるかを考慮して設計することができる。融解温度を高く設計された核酸プローブは、それらの標的により強力にハイブリダイズし得る。より長い核酸プローブ、ならびにGC含量がより高いプローブは、融解温度が上昇するので、より強力にハイブリダイズし得る。核酸プローブは、少なくとも5塩基、10塩基、15塩基、20塩基、30塩基、40塩基、50塩基、または100塩基、またはそれよりも多くの塩基の長さを有し得る。核酸プローブは、0%から100%の間のいずれかのGC含量を有し得る。プローブの融解温度がストレプトアビジン基板の温度許容度を超えないことを確実にするために注意を払うことができる。核酸プローブは、オフターゲットの核酸を有するヘアピン、ホモ二量体、およびヘテロ二量体などの阻害性二次構造が回避されるように設計することができる。プローブ融解温度とオフターゲットの結合の間にトレードオフが存在し得る。融解温度が高く、オフターゲットの結合が低い最適なプローブの長さおよびGC含量が存在し得る。合成核酸ライブラリーは、その核酸が効率的なプローブ結合性部位を含むように設計することができる。
【0166】
固相ストレプトアビジン基板は磁気ビーズであってよい。磁気ビーズを、磁気ストリップまたはプレートを使用して固定化することができる。磁気ストリップまたはプレートを容器と接触させて、磁気ビーズを容器に固定化する。逆に、磁気ストリップまたはプレートを容器から取り出して磁気ビーズを容器壁から溶液中に放出させることができる。異なるビーズの性質がそれらの適用に影響を及ぼし得る。ビーズは、種々のサイズを有し得る。例えば、ビーズは、直径1マイクロメートル(μm)から3マイクロメートル(μm)の間のいずれかであってよい。ビーズは、最大で1マイクロメートル、2マイクロメートル、3マイクロメートル、4マイクロメートル、5マイクロメートル、10マイクロメートル、15マイクロメートル、20マイクロメートル、または20マイクロメートルを超える直径を有し得る。ビーズ表面は疎水性であっても親水性であってもよい。ビーズを遮断性タンパク質、例えば、BSAでコーティングすることができる。使用前に、ビーズが核酸に非特異的に結合するのを防止するために、ビーズを洗浄するまたは遮断性溶液などの添加剤で前処理することができる。
【0167】
ビオチン化プローブを磁性ストレプトアビジンビーズとカップリングした後に核酸試料プールと一緒にインキュベートすることができる。このプロセスは、直接捕捉と称することができる。あるいは、ビオチン化プローブを核酸試料プールと一緒にインキュベートした後に磁性ストレプトアビジンビーズを添加することができる。このプロセスは、間接的な捕捉と称することができる。間接的な捕捉方法により、標的の収率を改善することができる。核酸プローブが短いほど、磁気ビーズにカップリングするために必要な時間量を少なくすることができる。
【0168】
核酸プローブと核酸試料の最適なインキュベーションは、プローブの融解温度を摂氏1~10度またはそれよりも大きく下回る温度で行うことができる。インキュベーション温度は、最大で摂氏5度、10度、20度、30度、40度、50度、60度、70度、80度、またはそれよりも高い温度であり得る。推奨されるインキュベーション時間は1時間であり得る。インキュベーション時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間、90分間、120分間、またはそれよりも長い時間であり得る。インキュベーション時間が長いほど良好な捕捉効率を導くことができる。ビオチン-ストレプトアビジンカップリングを可能にするために、ストレプトアビジンビーズの添加後にさらに10分間のインキュベーションを行うことができる。この追加的な時間は、最大で1分間、5分間、10分間、20分間、30分間、60分間、90分間、120分間、またはそれよりも長い時間であり得る。インキュベーションは、ナトリウムイオンなどの添加剤を伴う緩衝液中で行うことができる。
【0169】
核酸プールが一本鎖核酸である場合(二本鎖とは対照的に)、プローブとその標的のハイブリダイゼーションを改善することができる。ssDNAプールをdsDNAプールから調製することには、一般にプール中の全ての核酸配列の端部に結合する1つのプライマーを用いて線形PCRを実施することが必要になり得る。核酸プールが合成により創出またはアセンブルされたものである場合、この共通のプライマー結合性部位を合成設計に含めることができる。線形PCRの産物はssDNAになる。核酸捕捉のためのより多くの出発ssDNA鋳型をより多くの線形PCRのサイクルで生成することができる。
【0170】
核酸プローブがそれらの標的とハイブリダイズし、磁性ストレプトアビジンビーズとカップリングした後、ビーズを磁石によって固定化し、いくつかのラウンドの洗浄を行うことができる。非標的核酸を除去するためには3~5回の洗浄で十分であり得るが、それよりも多いまたは少ないラウンドの洗浄を使用することができる。増やした洗浄各々により、標的化されていない核酸をさらに減少させることができるが、標的核酸の収率も低下し得る。洗浄ステップの間の標的核酸とプローブの適当なハイブリダイゼーションを容易にするために、低インキュベーション温度を使用することができる。摂氏60度、50度、40度、30度、20度、10度、または5度またはそれよりも低いという低さの温度を使用することができる。洗浄緩衝剤は、ナトリウムイオンを伴うトリス緩衝液を含み得る。
【0171】
ハイブリダイズした標的の磁気ビーズ-カップリングしたプローブからの最適な溶出を、プローブの融解温度と等しいまたはそれよりも高い温度で行うことができる。温度が高いほど、標的のプローブからの解離が容易になる。溶出温度は、最大で摂氏30度、40度、50度、60度、70度、80度、または90度、またはそれよりも高い温度であり得る。溶出インキュベーション時間は、最大で1分間、2分間、5分間、10分間、30分間、60分間またはそれよりも長い時間であり得る。典型的なインキュベーション時間はおよそ5分間であり得るが、より長いインキュベーション時間により、収率を改善することができる。溶出緩衝剤は、EDTAなどの添加剤を伴う水またはトリス緩衝液であってよい。
【0172】
区別可能な部位のセットのうちの少なくとも1つ、または複数を含有する標的配列の核酸捕捉を、それらの部位の各々に対して複数の区別可能なプローブを用いて1つの反応で実施することができる。区別可能な部位のセットのあらゆるメンバーを含有する標的配列の核酸捕捉を、その特定の部位に対するプローブを使用して区別可能な部位各々に対して1つの反応である一連の捕捉反応で実施することができる。一連の捕捉反応後の標的の収率は低い可能性があるが、捕捉された標的をその後PCRで増幅することができる。核酸ライブラリーが合成により設計されたものである場合、標的は、PCRのために共通のプライマー結合性部位を有するように設計することができる。
【0173】
一般的な核酸捕捉のために共通のプローブ結合性部位を有する合成核酸ライブラリーを創出またはアセンブルすることができる。これらの共通部位を、完全にアセンブルされたまたは潜在的に完全にアセンブルされた核酸をアセンブリ反応から選択的に捕捉し、それにより、部分的にアセンブルされたまたはミスアセンブルされた(または意図されたものではないもしくは望ましくない)副産物を濾過して取り除くために使用することができる。例えば、アセンブリには、各端部配列にプローブ結合性部位を有する核酸を、完全にアセンブルされた核酸産物のみが、各プローブを使用して一連の2つの捕捉反応を通るのに必要な必須の2つのプローブ結合性部位を含有するようにアセンブルする。前記例では、部分的にアセンブルされた産物は、プローブ部位のいずれも含有しないまたは一方のみを含有する可能性があり、したがって、最終的に捕捉されないはずである。同様に、ミスアセンブルされた(または意図されたものではないもしくは望ましくない)産物は、端部配列のいずれも含有しないまたはその一方のみを含有する可能性がある。したがって、前記ミスアセンブルされた産物は、最終的に捕捉されない可能性がある。ストリンジェンシーを増大させるために、アセンブリの各成分に共通のプローブ結合性部位を含めることができる。各成分に対してプローブを使用したその後の一連の核酸捕捉反応により、完全にアセンブルされた産物(各成分を含有する)のみをアセンブリ反応のあらゆる副産物から単離することができる。その後のPCRにより、標的富化を改善することができ、その後のサイズ選択により、標的ストリンジェンシーを改善することができる。
【0174】
一部のインプリメンテーションでは、核酸捕捉を使用して、標的化された核酸のサブセットをプールから選択的に捕捉することができる。例えば、前記標的化された核酸のサブセットにおいてのみ存在する結合性部位を有するプローブを使用することによって。合成核酸ライブラリーは、サブライブラリーをより一般的なライブラリーから選択的に捕捉するために、目的の潜在的なサブライブラリーに属する核酸の全てが共通のプローブ結合性部位を共有する(サブライブラリー中では共通であるが、他のサブライブラリーとは区別可能な)ように創出またはアセンブルすることができる。
G.凍結乾燥
【0175】
凍結乾燥は、脱水プロセスである。核酸および酵素の両方を凍結乾燥することができる。凍結乾燥された物質は、より長い寿命を有し得る。凍結乾燥プロセスを通して機能的産物(例えば、活性酵素)を維持するために、化学的安定剤などの添加剤を使用することができる。スクロースおよびトレハロースなどの二糖を化学的安定剤として使用することができる。
H.DNA設計
【0176】
合成ライブラリー(例えば、識別子ライブラリー)を構築するための核酸の配列(例えば、成分)は、合成、シークエンシング、およびアセンブリの複雑化が回避されるように設計することができる。さらに、当該配列は、合成ライブラリーの構築費用が低減するように、かつ、合成ライブラリーを保管することができる寿命が改善されるように設計することができる。
【0177】
核酸は、合成するのが難しい場合がある長いホモポリマーの列(または繰り返された塩基配列)が回避されるように設計することができる。核酸は、2を超える、3を超える、4を超える、5を超える、6を超える、7を超えるまたはそれよりも長いホモポリマーの長さが回避されるように設計することができる。さらに、核酸は、それらの合成プロセスを阻害する可能性があるヘアピンループなどの二次構造の形成が回避されるように設計することができる。例えば、予測ソフトウェアを使用して、安定な二次構造を形成しない核酸配列を生成することができる。合成ライブラリーを構築するための核酸は、短く設計することができる。核酸が長いほど合成が難しく、費用がかかる可能性がある。核酸が長いほど、合成の間の突然変異の機会も増大する。核酸(例えば、成分)は、最大で5塩基、10塩基、15塩基、20塩基、25塩基、30塩基、40塩基、50塩基、60塩基またはそれよりも多くの塩基であり得る。
【0178】
アセンブリ反応の成分になる核酸は、そのアセンブリ反応が容易になるように設計することができる。効率的なアセンブリ反応には、一般には、隣接成分間のハイブリダイゼーションが伴う。配列は、これらのオンターゲットのハイブリダイゼーション事象が促進されると同時に潜在的なオフターゲットのハイブリダイゼーションが回避されるように設計することができる。ロックド核酸(LNA)などの核酸塩基修飾を使用して、オンターゲットのハイブリダイゼーションを強化することができる。これらの修飾核酸を、例えば、ステープル鎖ライゲーションにおけるステープルとして、または付着鎖ライゲーションにおける付着末端として使用することができる。合成核酸ライブラリー(または識別子ライブラリー)を構築するために使用することができる他の修飾塩基としては、2,6-ジアミノプリン、5-ブロモdU、デオキシウリジン、反転dT、反転ジデオキシ-T、ジデオキシ-C、5-メチルdC、デオキシイノシン、Super T、Super G、または5-ニトロインドールが挙げられる。核酸は、1つまたは複数の同じまたは異なる修飾塩基を含有し得る。前記修飾塩基のいくつかは、より高い融解温度を有し、したがって、アセンブリ反応において特異的なハイブリダイゼーション事象を容易にするために有用であり得る天然の塩基類似体(例えば、5-メチルdCおよび2,6-ジアミノプリン)である。前記修飾塩基のいくつかは、全ての天然の塩基に結合することができ、したがって、望ましい結合性部位内に可変配列を有し得る核酸とのハイブリダイゼーションを容易にするために有用であり得るユニバーサル塩基(例えば、5-ニトロインドール)である。アセンブリ反応におけるそれらの有益な役割に加えて、これらの修飾塩基は、プライマーおよびプローブの核酸のプール内のそれらの標的核酸との特異的な結合を容易にするので、プライマー(例えば、PCR用)およびプローブ(例えば、核酸捕捉用)に有用であり得る。
【0179】
核酸は、シークエンシングが容易になるように設計することができる。例えば、核酸は、二次構造、ひと続きのホモポリマー、反復配列、およびGC含量が高すぎるまたは低すぎる配列などの典型的なシークエンシング複雑化が回避されるように設計することができる。ある特定のシークエンサーまたはシークエンシング方法は、エラープローンであり得る。合成ライブラリー(例えば、識別子ライブラリー)を構成する核酸配列(または成分)は、互いからのある特定のハミング距離で設計することができる。このように、シークエンシングにおいて塩基分解能エラーが高い率で生じる場合であっても、エラーを含有する配列のひと続きをなおそれらの最も可能性がある核酸(または成分)にマッピングし戻すことができる。核酸配列は、少なくとも1塩基、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基、10塩基、11塩基、12塩基、13塩基、14塩基、15塩基またはそれよりも多くの塩基の突然変異というハミング距離で設計することができる。ハミング距離の代替距離メトリクスを使用して、設計される核酸間の最小の必要距離を規定することもできる。
【0180】
いくつかのシークエンシング方法および計器では、アダプター配列またはプライマー結合性部位などの特定の配列を含有させるために入力核酸が必要になる。これらの配列は、「方法特異的配列」と称することができる。前記シークエンシング計器および方法の典型的な予備的ワークフローには、方法特異的配列を核酸ライブラリーとアセンブルすることが伴う。しかし、合成核酸ライブラリー(例えば、識別子ライブラリー)が特定の計器または方法でシークエンシングされることが前もって分かっている場合には、これらの方法特異的配列を、ライブラリー(例えば、識別子ライブラリー)を含む核酸(例えば、成分)中に設計することができる。例えば、合成核酸ライブラリーのメンバー自体が個々の核酸成分からアセンブルされるのと同じ反応ステップで、合成核酸ライブラリーのメンバー上にシークエンシングアダプターをアセンブルすることができる。
【0181】
核酸は、DNA損傷を容易にし得る配列が回避されるように設計することができる。例えば、部位特異的ヌクレアーゼに対する部位を含有する配列を回避することができる。別の例として、UVB(紫外線-B)光により、隣接するチミンがピリミジン二量体を形成し、次いでそれによりシークエンシングおよびPCRが阻害されることが引き起こされ得る。したがって、合成核酸ライブラリーがUVBに暴露される環境で保管されることが意図されている場合、その核酸配列を隣接するチミン(すなわち、TT)が回避されるように設計することが有益であり得る。

識別子ライブラリーを構築するためのシステム
【0182】
既に記載したように、プリンター-フィニッシャーシステム(またはPFS)として公知のプリントに基づくシステムを使用して、識別子を構築するための成分をコロケートしてアセンブルすることができる。
【0183】
本明細書において、情報を記憶させるために1つまたは複数の成分から識別子をアセンブルするためのシステムであって、(a)1つまたは複数の成分を基板上に吐出するためのプリンターであって、1つまたは複数の成分の各々が核酸配列を含むプリンターと、(b)前記基板上の前記1つまたは複数の成分をアセンブルするためのフィニッシャーであって、1つまたは複数の核酸配列を物理的に連結するために必要な反応混合物および/または条件を提供するフィニッシャーとを含むシステムを提供する。
【0184】
一部のインプリメンテーションでは、前記プリンターは、複数のプリントヘッドをさらに含み、前記複数の各プリントヘッドは、1つまたは複数の成分を含む。一部のインプリメンテーションでは、前記プリンターは、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、またはそれより多くのプリントヘッドを有する。一部のインプリメンテーションでは、前記複数の各プリントヘッドは、異なる成分を含む。一部のインプリメンテーションでは、各プリントヘッドは、少なくとも1つのノズルを含む。一部のインプリメンテーションでは、各プリントヘッドは、ノズル列を含む。一部の実施形態では、各プリントヘッドは、少なくとも1個、2個、3個、4個、またはそれより多くのノズル列を含む。一部のインプリメンテーションでは、プリントヘッドは、各々が同じインクを吐出するノズルのセットであると考慮され得る。一部の実施形態では、ノズル列は、同じインクを吐出する。一部のインプリメンテーションでは、ノズル列における特定のサブセットのノズルは、前記ノズル列における他のノズルとは異なるインクを吐出する。一部のインプリメンテーションでは、ノズル列は、少なくとも20個、40個、60個、80個、100個、150個、200個、250個、300個、350個、400個、またはそれより多くのノズルを含む。一部の実施形態では、ノズル列における一部または全てのノズルを分離することができる。一部のインプリメンテーションでは、前記プリントヘッドは、前記成分を含む液滴を前記基板上に吐出する。一部のインプリメンテーションでは、前記プリントヘッドは、反応ミックスを含む液滴を前記基板上に吐出する。一部のインプリメンテーションでは、前記液滴は、体積中で少なくとも1ピコリットル、2ピコリットル、3ピコリットル、4ピコリットル、5ピコリットル、6ピコリットル、7ピコリットル、8ピコリットル、9ピコリットル、または10ピコリットルである。一部のインプリメンテーションでは、前記液滴は、体積中で少なくとも10ピコリットル、20ピコリットル、30ピコリットル、40ピコリットル、50ピコリットル、60ピコリットル、70ピコリットル、または80ピコリットルである。一部のインプリメンテーションでは、前記プリンターは、プリンターベースをさらに含む。一部のインプリメンテーションでは、前記プリンターは、レジスター、スポットイメージャー、および/またはスポットドライヤーをさらに含む。一部のインプリメンテーションでは、前記1つまたは複数の成分は、溶液中にある。一部のインプリメンテーションでは、前記1つまたは複数の成分は、乾燥成分である。一部のインプリメンテーションでは、前記反応混合物はリガーゼを含む。リガーゼを使用して、核酸配列を含む異なる成分をライゲーションすることができる。一部のインプリメンテーションでは、前記条件は、温度条件である。一部のインプリメンテーションでは、前記基板は、前記プリンターおよび/または前記フィニッシャーの中を、線形の移動で通過する。一部のインプリメンテーションでは、前記線形の移動は、リール・トゥ・リールシステムによって制御される。一部のインプリメンテーションでは、前記スポットイメージャーは、カメラである。一部のインプリメンテーションでは、前記1つまたは複数の成分は、色素をさらに含む。一部のインプリメンテーションでは、前記反応ミックスは、色素を含む。色素は任意の核酸色素であり得る。色素は可視色素であり得る。
【0185】
一部のインプリメンテーションでは、前記基板は、ポリマー材料をさらに含む。一部のインプリメンテーションでは、前記プリントヘッドは、MEMS(微小電気機械システム)薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドである。一部のインプリメンテーションでは、前記1つまたは複数の成分は、添加剤を含む。一部のインプリメンテーションでは、添加剤は、前記1つまたは複数の成分と前記プリントヘッドとの適合性を提供する。一部のインプリメンテーションでは、添加剤は、溶質、湿潤剤、または界面活性剤である。一部のインプリメンテーションでは、前記スポットイメージャーは、ラインスキャン検査原理を使用する。一部のインプリメンテーションでは、前記フィニッシャーは、フィニッシャーベースをさらに含む。
【0186】
一部のインプリメンテーションでは、前記フィニッシャーは、スポット湿潤剤、スポットイメージャー、および/またはプーリングサブシステムをさらに含む。一部のインプリメンテーションでは、前記フィニッシャーは、プリントヘッドをさらに含む。一部のインプリメンテーションでは、前記フィニッシャーのプリントヘッドは、少なくとも1pL、5pL、10pL、50pL、100pL、または200pLを有する体積を吐出する。一部のインプリメンテーションでは、前記フィニッシャーは、反応インキュベーションにとって最適である固定された内部温度を含む。一部のインプリメンテーションでは、前記フィニッシャーは、ローラーのループを含む。
プリンターベースシステム
【0187】
PFSは、各々が1つまたは複数の核酸分子を基板上に印刷することが可能である1つまたは複数のプリントヘッドの使用を伴い得る。生成すべき識別子ライブラリーを考慮して、所与のビットストリームを符号化する全ての識別子をアセンブルするタスクを、サブタスクに分割することができ、各サブタスクは識別子ライブラリーの一部を生成するステップを含む。この部分を、識別子ライブラリーの「セクター」と呼ぶことができる。セクターのサイズは、PFSによるセクターの生成におけるいかなるエラーもPFSによって検出または補正され得るように選択することができる。エラーは、作動不良プリントヘッド、印刷の間または後の成分の意図しない混合、プリントヘッドによって吐出される試薬または核酸の体積の変動、プリントヘッドと基板上の標的座標(またはスポット)との間のミスアライメント、または高湿度もしくは低湿度による乾燥もしくは湿潤を含むがこれらに限定されないいくつかの起源によって引き起こされ得る。これらの原因のいくつかは、生成すべき1つまたは複数の識別子が生成されないというエラーをもたらし得る。このタイプのエラーは、欠損識別子エラーと呼ぶことができる。
【0188】
原因に応じて、一部の欠損識別子エラーは、PFSによって検出され得る。例えば、PFSは、1つまたは複数のカメラを使用して印刷されたセクターの全てまたは一部を自動的に検査し得る。PFSは、各印刷されたセクターの1つまたは複数のイメージを連続的にまたはプログラム可能な間隔で捕捉し、それらのイメージをコンピュータプロセシングに供し、指定された各反応が基板上で印刷されているか否かを検出することができる。別の実施形態では、PFSは、1つまたは複数のプリントヘッド上の1つまたは複数のノズルを連続的にまたはプログラム可能な間隔でモニターすることができ、およびそれらが反応物を基板上に印刷する際のノズルのイメージまたはビデオを捕捉することができる。PFSは、捕捉されたビデオまたはイメージをイメージプロセシングに供して、全ての意図される試薬および核酸液滴が反応に送達されたか否かを検出することができる。監視カメラは、可視光または他の周波数帯の光を使用してもよい。別の実施形態では、PFSは、基板の試験領域における全てのプリントヘッド上の全てのノズルからの1つまたは複数の試験パターンを定期的に印刷してもよい。PFSは、スポットイメージャーまたはカメラまたは一部の他のデバイスによる試験パターンプリンティングの結果を視覚的に捕捉または分析し、出力を分析に供してもよい。別の実施形態では、PFSは、試験パターンを印刷して、例えばゲル電気泳動などの1つまたは複数の化学的確認方法を使用してそれを分析してもよい。
【0189】
視覚的分析後、PFSが、指定された識別子の全てをアセンブルするために必要な一部または全ての成分が反応に印刷されなかったと結論した場合、PFSは、この結論をエラーログに報告し得る。PFSを制御する制御ソフトウェアは、印刷の間連続的にまたは後にこのログを分析し、そのような欠損識別子エラーを含有するセクターを再度プリントするように選択してもよい。ログから、制御ソフトウェアは、作動不良プリントヘッドまたはノズルを特定し、スペアのプリントヘッドまたはノズルを使用して残りのセクターを印刷してもよい。一実施形態では、制御ソフトウェアはまた、そのような不完全なセクターが最終的な識別子ライブラリーに含まれないように下流のプロセシングステップから欠損識別子エラーを有するセクターを除外してもよい。
【0190】
アセンブルされる識別子ライブラリーを指定して、指定ファイルのセットを介してPFSに転送することができる。生成すべき識別子ライブラリーは、ブロックと呼ばれるより小さい単位のセットにおいて指定され得る。指定ファイルは、DNA成分から識別子ライブラリーをアセンブルするために使用されるスキームを含有する書き込み指定ファイル、スキーム特異的パラメータのリスト、およびブロック指定ファイル名のリストを含む。ブロック指定は、ブロックメタデータファイルおよびブロックデータファイルを含み得る。ブロックメタデータファイルは、その長さ、ハッシュ、および他の構築物定義パラメータなどのブロックに関する情報を記載する。ブロックデータファイルは、PFSによって生成される識別子のセットを指定する。ブロックデータファイルは、データ圧縮アルゴリズムを使用して圧縮され得る。ブロックを含む識別子は、ツリー、トライ木、リスト、またはビットマップなどの、しかしこれらに限定されない指定されたデータ構造の形態で指定され得る。
【0191】
例えば、産物スキームを使用して生成される識別子ライブラリーを、成分ライブラリーパーティションスキームを含有するブロックメタデータファイル、および各層に使用される可能な成分の名称の一覧を用いて指定することができる。ブロックデータファイルは、トライの根から葉への各道が識別子を表し、道に沿った各ノードによりその識別子のその層において使用される成分名が指定される、シリアライズされたトライデータ構造として構成された生成される識別子を含有し得る。ブロックデータファイルは、このトライを、根から開始し、各ノードの左側の子ノードを見に行った後、ノード自体を見に行き、次いで、右側の子ノードを見に行く順序で横断することによってシリアライズすることを含み得る。
【0192】
PFSは、入ってきた指定ファイルに関する入力列をモニターし得る。新規指定を検出すると、PFSは、書き込み指定を読み、適切なプリントヘッドまたはノズルに供給された必要な成分によってそれ自身をプログラムすることができる。PFSは、ブロックメタデータおよびデータファイルを読み、それらを処理して、プリントヘッドのプリント指示を生成することができる。PFSは、各ブロックに関するこれらの指示をプリントヘッドに送り、プリントヘッドから各セクターに関するステータス情報を得ることができる。正確にまたは完全に印刷することができなかったセクターをログに報告し、自動的に再プリントすることができる。
例示的なPFS
【0193】
図1は、インクジェットプリンティング、例えばサーマル方式インクジェットプリンティング、バブルインクジェットプリンティング、および圧電方式インクジェットプリンティングを使用して、迅速かつハイスループット様式で成分からDNA識別子をアセンブルすることによって、DNAにデジタル情報を記憶させるシステムを例証する。システムおよびその異なるインプリメンテーションは、本明細書において以降「プリンター-フィニッシャーシステム」またはPFSと称され、2つのサブシステム、すなわちプリンター120およびフィニッシャー130を含み得る。一部のインプリメンテーションでは、2つのサブシステム120、130は、個々に機能するためには互いに付着して従属し得る。他のインプリメンテーションでは、2つのサブシステム120、130は、分離していてもよく、独立して機能することが可能であり得る。
【0194】
プリンター120は、各々が溶液中のDNA成分(またはコプト)を含有するか、または一部のインプリメンテーションでは乾燥DNA成分を含有する、プリントヘッド122の列を含む。本発明者らは、区別可能なDNA成分の各水溶液を「インク」または「カラー」と称することがある。プリントヘッド122は、基板(またはウェブもしくはウェビング)の座標上にpLスケールの液滴をプログラム可能に(オンデマンド方式で)吐出し得る。座標は、1マイクロメートル(μm)の直径/間隔、10μmの直径/間隔、50μmの直径/間隔、100μmの直径/間隔、150μmの直径/間隔、200μmの直径/間隔、またはそれより多くであり得る。プリンターシステム120への入力は、水性成分/基板を含む。プリンターシステム120からの出力は、基板上の乾燥した多層スポットを含む。プリンター120の環境は乾燥(蒸発性)であり得る。
【0195】
フィニッシャー130は、成分を識別子にアセンブルするための反応ミックス(例えば、リガーゼミックス)を吐出するための機器部分(例えば、プリントヘッド)を含む。フィニッシャーシステム130への入力。フィニッシャー130は、基板(またはウェブもしくはウェビング)の各座標上に反応ミックスを吐出し得る。次いで、フィニッシャー130は、反応をインキュベートし、このように、基板からのアセンブルされた識別子を単一のプール132に統合する前にアセンブリを可能にし得る。一部のインプリメンテーションでは、反応ミックスは、フィニッシャーの部分としてではなくプリンターの部分として各座標に吐出され得る。他のインプリメンテーションでは、反応ミックスは、DNA成分の前に各座標に吐出され得る。一部の実施形態では、可視色素を、反応混合物に組み入れることができる。
【0196】
基板(またはウェブ)136は、線形の(一次元的)動きによってプリンターおよびフィニッシャーの中を自動的に通過し得る。一定速度での線形の移動は、リール・トゥ・リールシステム(ローラー・トゥ・ローラー)134によって達成され得る。一部のインプリメンテーションでは、一定速度での線形の移動は、再循環または連続的なウェビングによって達成され得る。一部の実施形態では、一定速度での線形の移動は、スネイルトレイルに従うウェビングを使用して達成され得る。例えば、図7を参照されたい。一部のインプリメンテーションでは、一定速度での線形の移動は、らせん軌道に従うウェビングを使用して達成され得る。一部のインプリメンテーションでは、一定速度での線形の移動は、180度ねじれた軌道に従うウェビングを使用して達成され得る。例として、ウェビングは、システムによって各ローラーで180度のターンを受け、ウェビングは、表面を上にして全てのローラーを通過する。他のインプリメンテーションでは、基板を固定して、プリントヘッドを基板の上で二次元に移動させてもよい(例えば、ラスターパターンで)。
【0197】
図2は、プリンターサブシステム120をより詳細に示す。プリンターベース121は、プリントエンジン122、スポットイメージャー126、およびスポットドライヤー128を提供するウェブドライブを有するプリンターベースを含む。プリントエンジンは、アドレス指定スキームを支持するために印刷およびオーバープリントする。プリントエンジン122は、プリントヘッドを含み得る。プリントヘッドは、ウェブ136上の同じ座標に異なる成分をオーバープリントする、またはコロケートする、または重層するように設計される。単一のノズル、単一のプリントヘッド、複数のノズル、複数のプリントヘッド、またはその任意の組合せが、同じ座標上に成分をオーバープリントすることができる。プリントヘッドに加えて、プリンターは、必要に応じてレジスター124、スポットイメージャー126、およびスポットドライヤー128を含み得る。
【0198】
レジストレーションは、スポットのアライメント(マルチパスシステムの場合)を含む。レジスター124は、基板の座標上とプリントヘッドの間のアライメントを維持することを目的とするものである。これは、レジスターが基板の動きをリアルタイムで追跡することを可能にする特殊なマーキングによって基板を標識することによって達成され得る。他のインプリメンテーションでは、レジストレーションは、ローラー上のエンコーダーからの基板位置をデッドレコニングすることによって達成され得る。ウェブに沿ったアライメントの制御は、プリントヘッドからの吐出動作の時間を調整することによって行うことができる。ウェブを超えてのアライメントでは、基板またはプリントヘッドのいずれかがアクチュエーターを使用して移動する必要があり得る。
【0199】
スポットイメージャー126は、成分添加の確認を提供する。スポットイメージャー126は、成分または反応混合物の適切な吐出を確認することを目的とするカメラであり得る。スポットイメージャー126の機能を容易にするために、可視色素を、成分インクまたは反応混合物に組み入れてもよい。
【0200】
スポットドライヤー128は、プリントヘッドの間で、またはプリンターを出る際に(例えば、基板が、プリンターを出た際に圧延されることが意図される場合)印刷された液滴を乾燥させることを目的とするものである。プリントヘッド間での液滴の乾燥は、オーバープリントプロセスの間に特定の座標に液体があふれ出るのを防止するために有用であり得る。各々のプリントヘッドは、少なくとも1pL、5pL、10pL、20pL、30pL、40pL、50pL、またはそれより多くの液滴を吐出し得る。一部のインプリメンテーションでは、少なくとも1個、5個、10個、20個、50個、100個、またはそれより多くのプリントヘッドが、同じ座標に吐出し得る。
【0201】
プリンターサブシステムは、必要に応じて、基板およびコーティングモジュール129を含み得る。基板およびコーティングモジュール129は、ウェブ材料プラスコーティング/パターニングを含む。基板は、ポリエチレンテレフタレート(PET)またはポリプロピレンのような低結合性プラスチックなどの材料であってもよく、またはそれらの材料によってコーティングされてもよい。
【0202】
図3A~Dは、プリンター(例えば、図1のプリンター120)におけるプリントヘッド300の例を描く。プリントヘッドは、1つ、2つ、3つ、4つ、またはそれより多くのインク(区別可能な成分溶液)を含有し得る。この特定の例では、本発明者らは、各ノズル列に関して1つのインクが提供される、最大4つのインクを含有し得るプリントヘッド300を考慮する。加えてプリントヘッドは、インクあたり複数のノズル、例えば300個のノズルを含有し得る。ある特定の例では、一部または全てのノズルによってアドレス可能なウェブ座標のセットは、ノズルが適切に位置揃えしていないために分離し得るが、それによって各インクはプリントヘッドを通じて線形に移動する基板の同じ座標上にオーバープリントし得る。または異なるインクのノズルは、所望のピッチで印刷するために適切な間隔を空けていない場合がある。これらの問題を解決するために、プリントヘッドは、所望のピッチで成分インクのオーバープリントを可能にするためにある角度で(ウェブの動きに対して)搭載され得る。図3B~Dに例証するように、167μmピッチで4つのインクのオーバープリントを可能にするためには約9度の回転で十分である。具体的には、図3Cは、プリントヘッドノズル302、304、306、308の4つの列を示す。列302、304、306、208の各々は、異なる成分を吐出し得る。基板312(矢印312によって指摘されるラインから上方および右に対角線方向に伸長する)は、プリントヘッド300の下を線形に移動する。プリントヘッドの8.7度の回転のために、基板312上の座標314は、ライン307に沿って列302、304、306、308においてノズルのすぐ下を通過し、各ノズルは、座標314上に成分を蓄積し得る。図3Dに示すように、複数のプリントヘッド300、310、320を、複数の基板上での同時印刷を可能にするために並行に配置することができる。一例では、プリントヘッドを作動させて、それらをオーバープリントにとって適したアライメントにすることができる。プリントヘッドは、MEMS(微小電気機械システム)薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドであり得る。プリントヘッドとの適合性を容易にするために成分インクに添加剤を添加してもよい。例えば、トリスのような溶質を添加して伝導性を増加することができる。一例として、湿潤剤または界面活性剤(例えば、グリセロール)を添加して、吐出品質およびプリントヘッドノズルの寿命を改善することができる。
【0203】
図4は、プリンター内のプリントヘッドの可能な配置を描く。基板は、長軸方向に通過していると仮定され、それによって異なるトラック(T1からT4)上のプリントヘッドが独立した座標上に印刷しているが、同じトラックに沿ったプリントヘッドは基板上の同じ座標上に印刷することができる(オーバープリント)。基板は、座標あたりより多くのDNA成分を受信するように、各回で新規プリントヘッド(または同じインクを充填した同じプリントヘッド)で、プリンターの中を複数回通過することができる。しかし、非常に多数のプリントヘッドが各トラックに沿って位置する場合、構築される識別子の所望の数に関して十分な数の成分を組み入れるために1回の通過で必要十分であり得る。例えば、識別子が各8個の成分の10個の層の産物スキームで構築され(ギガビットを超えるデータを記憶させるために十分な810個の識別子を可能にする)、各プリントヘッドが4つの成分を印刷することができる場合、基板上の1回の通過で全ての成分セットがコロケーションにあることを可能にするために、トラックに沿って20個のプリントヘッドを搭載すれば十分であり得る。複数のトラックは、基板(ウェブ)のより効率的な使用を可能にし、それによって基板をより短くすることを可能にし、よりハイスループット様式で識別子を構築することを可能にする。トラックよりも基板上の幅(長軸)が大きい場合、基板(またはプリントヘッドシャーシ)は、各通過後に長軸方向にシフトし、長さに沿うのではなく基板の幅に沿って空の基板上の印刷を可能にする。別の実施形態では、個別のプリンターベースシステムが、同じ基板の分離した部分に印刷し得る。
【0204】
図5は、プリンターサブシステムにおけるスポットイメージャーの例としてのセットアップを実証する。スポットイメージャーは、ラインスキャン検査原理を使用し得る。例えば、スポットイメージャーは、コンピュータシステム520、ディスプレイ510、ラインスキャンカメラ530、回転ドラム540、およびエンコーダー550を含み得る。コンピュータシステム520は、ラインスキャンカメラ530と通信している。例えば、コンピュータシステム520は、ラインスキャンカメラ520に制御信号を送信することができ、ラインスキャンカメラ530は、イメージデータをコンピュータシステム520に送信する。コンピュータシステム520およびラインカメラシステム530は、無線または有線接続を介して通信し得る。ラインスキャンカメラ530を介して回収されたイメージデータは、ディスプレイ510に表示される。図5に示すように、ラインスキャンカメラ530は、ドラム540のイメージを捕捉することができ、次いでこれがディスプレイ510に表示され得る。
【0205】
図6は、フィニッシャーサブシステム130をより詳細に示す。フィニッシャーサブシステム130は、ウェブドライブを有するフィニッシャーベース140、インキュベーション緩衝液、および吐出の提供、スポット湿潤剤144、スポットイメージャー146、およびプーリングサブシステム148を含む。反応ミックスを基板の各座標上に吐出する部分に加えて、フィニッシャーは、統合前に基板136の各座標上に反応阻害剤を吐出する部分142も含み得る。これらの吐出部分はプリントヘッドであり得る。それらはオンデマンドプリントヘッドであり得るが、ウェブに沿った各座標が吐出を受けると予想され得ることから、連続的印刷もまた十分であり得る。吐出体積は、DNA成分が既に吐出されている各座標の面積を覆うために十分でなければならない。吐出体積は、少なくとも1pL、5pL、10pL、20pL、30pL、40pL、50pL、60pL、70pL、80pL、90pL、100pL、150pL、200pL、またはそれより大きい体積であり得る。プリントヘッドは、MEMS(微小電気機械システム)薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドであり得る。プリントヘッドとの適合性を容易にするために、吐出された液体(例えば、マスターミックスまたは阻害ミックス)に添加剤を添加してもよい。例えば、トリスのような溶質を添加して伝導性を増加することができる。別の例として、湿潤剤または界面活性剤を添加して、吐出品質およびプリントヘッドノズルの寿命を改善することができる。さらに、ノズル-空気界面ならびに液滴が吐出された後の両方での蒸発を制御するために、グリセロールまたはポリエチレングリコール(PEG)のような湿潤剤を添加してもよい。これらの湿潤剤は、反応産物の収量を増加させることによって反応ミックスにさらに利益を与え得る。
【0206】
プリンターサブシステムと同様に、フィニッシャーはまた、ウェブをプリントヘッドと位置揃えするためにおよび適切な吐出を確保するためにそれぞれ、レジスターおよびスポットイメージャー146を含み得る。スポットイメージャーの機能を容易にするために、可視色素を吐出される液体に組み入れてもよい。
【0207】
フィニッシャーは、反応ミックスの吐出後にローラー134のいくつかのループ(ウェビングのループを形成するために意図されるローラーの構成)をさらに含むことができ、それによってウェブ(基板)136上の反応物を反応統合前により長期間インキュベートすることができる。フィニッシャーは、反応物のインキュベーションにとって最適な固定された内部温度、例えば摂氏4度、12度、25度、37度、またはそれより高い温度を含み得る。インキュベーション相の間に吐出された反応ミックスの蒸発を遅らせるよう制御するために、フィニッシャーは、固定された高い湿度レベルを含み得る。フィニッシャーサブシステム130の湿度レベルは、インキュベーション期間を通じて湿潤スポットの維持を制御するスポット湿潤剤144によって制御され得る(例えば、基板がローラー134の上を通過する間)。
【0208】
最後に、フィニッシャーは、インキュベーション後に全ての識別子アセンブリ反応を1つの容器に統合するためにプーリングシステム148を含み得る。反応阻害はこのステップの前に起こり得るか、またはこのステップの間に起こり得る。
【0209】
図7は、インキュベーション相の間にフィニッシャーの中にウェブを通過させるためのローラー710、720のループの例を示す。ウェブのループ形成により、より限定された空間内でより長いインキュベーションが可能となる。例えば、ウェブが180mm/sでシステムの中を移動する場合、5分間のインキュベーション時間では、インキュベートされるウェブの長さ約60mが必要であるが、いくつかのループにより、この長さを、約60mの線形トンネルではなくより限定された空間内でインキュベートすることが可能となる。インキュベーション時間がより短ければ、インキュベートされるウェブ長さをより短くすることが可能であり得る。例えば、45秒間のインキュベーション時間は、約9mのインキュベートされるウェブの長さを可能にし得るが、10秒間のインキュベーション時間は、約2mのインキュベートされるウェブの長さを可能にし得る。これらのインキュベートされるウェブの長さがより短い場合では、インキュベーションを小さい空間内に限定するために必要なウェブループはより少なくなり得る。
【0210】
ローラーループの幾何学のために、ウェビング740は、ある特定のローラー720を、表面を上にして通過し、他のローラー710では表面を下にして通過する。
【0211】
図の底部は、ウェブの移動経路に沿ったローラー710の断面を実証する。ローラーは、基板740の接点の間に谷(または溝、ポケット、もしくは他の任意のへこみ)730を含有するように設計することができ、それによって反応物(例えば、成分が吐出される座標)が谷の中を妨害されずに通過することができる。あるいは、ウェブは、それが表面を上にした構成(すなわち、180度ねじれた経路)でローラーの上を常に通過するように、ローラー間で180度回転してもよい。あるいは、ウェビングは、ローラーのセット周囲のウェビングの環状経路が、反応物を含有するウェビングの面がローラーに確実に接触しないように、インキュベーターの中でらせん軌道を移動し得る。同様に、シリンダー周囲にリボンを巻くことまたはグリップテープをテニスラケットに適用することも考慮する。
【0212】
一部のインプリメンテーションでは、ウェビングは、再循環または連続的なウェビングである。一部のインプリメンテーションでは、ウェビングは、リール・トゥ・リールシステム(ローラー・トゥ・ローラー)である。一部のインプリメンテーションでは、ウェビングは、スネイルトレイルに従う。例えば、図7を参照されたい。一部のインプリメンテーションでは、ウェビングはらせん軌道に従う。一部のインプリメンテーションでは、ウェビングは、180度ねじれた経路に従う。例として、ウェビングは、システムによって各ローラーで180度のターンを受け、ウェビングは、表面を上にした構成で全てのローラーを通過する。
【0213】
図8は、インキュベーションの間に予想される平衡体積に及ぼす反応ミックスグリセロール組成物およびフィニッシャー湿度の効果を例証する。粒子は、液相および気相の間を遷移する水分子を表す。液滴820は、ウェブ810において吐出された反応物を表す。外側に影を付けた領域は、水を表し、中央の影を付けた領域はグリセロールを表し、内側の影を付けた領域は溶質(例えば、DNA、酵素/リガーゼ、塩/マグネシウム、トリス)を表す。高い湿度および高いグリセロール条件は、元の組成物と最も類似の平衡反応組成物をもたらす。しかし、平衡時の反応組成の変化は有益であり得る。例えば、DNA成分の相対量の増加は、識別子のより高い産生収量をもたらし得る。同様に、グリセロール含有量の増加は、識別子産生を促進する込み合い効果を創出し得る。反応効率は、ある特定の溶質(塩のような)濃度の増加によって負の影響を受け得るが、反応ミックスに存在する最初の溶質を、意図的に過少濃縮して、反応液滴がその平衡時の組成および体積まで蒸発した後、最適な濃度で存在するように設計することができる。
【0214】
図9は、ウェブからの全ての反応物を1つの容器に統合するプーリングシステムを例証する。一連のローラー902は、ウェブ910を、噴霧洗浄機914、ならびにウェブ910からの反応物およびその識別子産物を捕捉するように設計された回収リザーバー942の中へと誘導する。このプロセスにおいて体積が過剰に蓄積するのを防止するために、回収液は、核酸を捕捉するために設計された膜の中を連続的または繰り返し流れ得る。例えば、膜は、シリカ膜であり得て、回収液は核酸の膜への結合を促進するために、DNA結合緩衝液912であり得る。回収液は、統合体積中で反応が進行しないように反応を阻害するための添加剤をさらに含み得る。例えば、反応がライゲーション反応である場合、回収液は、リガーゼからのマグネシウムイオンをキレート化し、したがって反応を阻害するようにEDTA(例えば、25mM)を含有し得る。結合緩衝液は、一実施形態では、結合緩衝液の体積を最小限にするために、1つまたは複数の結合カラムの中を再循環することができる。ウェブ910は、ウェブ910からDNAを除去するために液体によって湿潤化され、これは回収リザーバー内で液体中にウェブ910を沈めることと組み合わせることができる。ウェブ910または液体(例えば、力学的、流体、または超音波)の撹拌および/または加熱を使用して、ウェブ910からのDNAの放出を促進してもよい。スクレイパー918は、この場合もウェブ910からDNAの除去を助けるために、物理的スクレイパー、液体ジェットまたはガス(例えば、空気)ジェットであり得る。ウェブ910からのDNAの放出を助けるために、1つまたは複数のスプレーを使用してもよい。
【0215】
DNAが、膜上に捕捉された後、これを、溶出およびさらなる評価のためにシステム(機械)から取り出すことができる。さらなる評価は、DNAをゲル上で泳動させるステップおよび予想される識別子の長さに対応するバンドサイズを選択するステップ(それによって、他の可能なオフターゲット産物から識別子を精製するステップ)を含み得る。本実施例では、標的識別子の長さは300bpである。DNA出力を、必要に応じて、ゲルまたは他の濾過940の中に通過させてDNAデータ930を得てもよく、これを凍結乾燥してもよい。
【0216】
反応ミックスを添加してプーリングの前または間に阻害する代わりに、このシステムでは、反応がプーリングステップで起こる別の実施形態が存在する。この実施形態では、成分は、インキュベーションプロセスの間ではアニールされるがアセンブルされず、次いでそれらを、成分を識別子にアセンブルするために反応ミックスおよび適切な環境条件(例えば、温度、pH、塩)を含有するプール中で共に統合する。この実施形態は、アニールされた成分がプールされると、反応の残りがシステム(機械)の外部で進行し得ることから、ウェブ910上でより短いインキュベーション時間を可能にし、フィニッシャーにおいてより厳密でないハードウェア必要条件を可能にし得る。この実施形態では、プールした反応物中の異なる識別子の成分間での望ましくない交叉アセンブリを防止するために、プーリングの前および間に成分が互いに強く確実にアニールすることに特に注意を払う必要がある。これは、強いアニーリングのために長い付着末端(およびハイブリダイゼーション領域)を有する成分を使用すること、ならびにアニールした産物を維持するためおよび非アニール産物の拡散を制限するためにプーリングステップにおいてより低い温度を使用することを伴い得る。
【0217】
図10は、PFSを通じたデータ転送パイプラインの実施形態の概略図を描く。図10は、1Tbのデータを含有するソースストリーム1002で開始する。ソースストリーム1002は、コーデック1004に転送され、ジョブモジュール1006に供給される。ジョブモジュール1006は、各ソースストリームおよび/またはコーデックファイルに関してジョブファイル、ブロックレコード、およびブロックデータを作成する。この情報を、ブロックモニター1008に供給する。ジョブモジュール1006は、ブロックモニター1008と通信するジョブモニター1016によってモニターされる。ブロックモニター1008は新規ブロックを観察し、ブロックの確認および印刷するためにこれらをパイプラインへ添加する。ジョブモジュール1006からブロックデータ1010を分離し、ブロックリーダー1012に送信し、ここで必要なインクおよびプリントヘッドの構成を処理し、ブロックデータを印刷する。次いで、ブロックデータを、ブロックデータ1010およびデータ転送の精度を試験するように構成された「チャープ」を含むプリント可能なフレーム1014に変換する。次いで、フレーム1014を、プリンター1034と通信するドキュメントプリンターモジュール1018に送信する。例えば、ドキュメントプリンターモジュール1018は、フレーム1014をプリンター1034に送信して印刷させ、プリンター1034は、ドキュメントプリンター1018にフィードバックを送信する。いかなる破損1020も、フィニッシュコントローラー1022に通信し、テキストファイルまたは他の記憶方法1024に書き込まれる。ドキュメントプリンター1018と電子的に通信することに加えて、プリンター1034は、物理的ウェブセクター1036を受信する。ウェブセクター1036は、1つのコーナーでマーカーによって位置を確認される。各ウェブセクターは、一意のIDコードを有する。プリンター1032は、成分1032をウェブ上に蓄積する。次いでウェブは、フィニッシャー1026に続く。フィニッシャー1026は、フィニッシュコントローラー1022と通信する。フィニッシュコントローラー1022は、フレームまたは部分フレームに関する情報を送信し、フィニッシャー1026を完了させ、フィニッシャー1026は、フィニッシュコントローラー1022にフィードバックを送信する。プリンターおよびフィニッシャーシステム1034、1026の両方からのフィードバックは、フレームのセクター割付の記録、印刷時のウェブレジストレーションの調整、および品質管理、および不成功フレームの記録を容易にする。フィニッシャー1026を出た後、ウェブは印刷されて完了し1028、DNAスポット1030を有する基板をもたらし、次いでこれをプーリングシステムまたは他の任意の適した記憶方法に送る。
【0218】
図11は、4つのモジュール:シャーシモジュール、プリントエンジンモジュール、インキュベーターモジュール、およびプーリングモジュールを含むPFSの実施形態を例証する。シャーシモジュールの機能は、システムの全てのモジュールを通じてウェビングの移動を駆動する、安定化する、および制御するベースシステムを提供することであり得る。プリントエンジンモジュールの機能は、DNA成分ならびに他の材料および試薬をウェビングにおける反応液滴に印刷することであり得る。インキュベーターモジュールの機能は、反応液滴中の産物(例えば、アセンブルされたDNAまたは識別子)収量の改善のための時間および環境制御を提供することであり得る。プーラーモジュールの機能は、ウェビングからの反応液滴を除去して1つの容器にそれらを統合することであり得る。
【0219】
一部の実施形態では、反応液滴は、酵素ライゲーションを通じてDNA識別子をアセンブルすることができる。一部の実施形態では、反応液滴は、クリックケミストリーを通じてDNA識別子をアセンブルすることができる。
【0220】
一部の実施形態では、インキュベーターモジュールは、100メートル、50メートル、25メートル、10メートル、5メートル、1メートル、または0.1メートル、またはそれ未満のウェビングを含み得る。一部の実施形態では、PFSは、インキュベーターモジュールを有しなくてもよい。
【0221】
一部の実施形態では、プリントエンジンまたはインキュベーターは、ウェビングにおいて反応液滴が蒸発する際に反応液滴中の体積を補充するために間欠的なプリントヘッドまたは吐出サブモジュールを含有することができる。
【0222】
一部の実施形態では、PFSの中を通過するウェビングは、プリントエンジンの前でロールから巻き戻され、プーラー後にロール上で再度巻くことができる。一部の実施形態では、ウェビングは、プーラー後にプリントエンジンを再度通過する連続的なループを形成し得る。
【0223】
図12は、反応液滴をエマルション1260にプールするPFSの実施形態を例証する。エマルション1260は、反応液滴と混和性ではないオイルまたは任意の液体を含むことができ、それによって反応液滴1250が、プールされた後でもその内容物を維持することを可能にする。PFSのウェビング1220は、プリントヘッド1210の下を通過する(例えば、ローラー1230および1240を介して)前にオイルによってコーティングすることができる。反応液滴1250は、エマルション中でそのサイズおよび形状を制御するために界面活性剤および他の添加剤を含有し得る。界面活性剤および添加剤はまた、エマルション内の安定性を促進し、異なる反応液滴の間の融合を防止することができる。プールされた乳化反応液滴を、マイクロ流体デバイスの中に通過させることができる。プールされた乳化反応液滴をインキュベートすることができる。その上、プールされた乳化反応液滴を凝集させて、エマルションから単離することができる。
【0224】
図13は、反応液滴1350が、ウェビング1320上に印刷された後に、オイル(または別の非混和性の液体)1370によってコーティングされるPFSの実施形態を例証する。オイルコーティングは、ウェビング1320がローラー1330および1340を介してプリントヘッドクラスター1310の下を通過する際に、反応液滴1350上にオイルを印刷、吐出、または噴霧するオイル吐出サブモジュール1380によって起こり得る。オイルは、ウェビング1320上の反応液滴の蒸発を弱めるかまたは防止することができる。反応液滴は、界面活性剤および他の添加剤を含有し得る。オイルで覆われた反応液滴1370を、エマルション1390にプールすることができる。プールされた乳化反応液滴は、マイクロ流体デバイスの中に通過させることができる。プールされた乳化反応液滴をインキュベートすることができる。その上、プールされた乳化反応液滴を凝集させて、エマルションから単離することができる。
【0225】
図14は、反応液滴1450が印刷したDNA成分に結合するビーズを含有するPFSの一実施形態を例証する。ビーズは、DNAに結合するシリカ、カルボキシル基、またはアミンもしくはイミダゾール部分によってコーティングすることができる。あるいはまたは加えて、ビーズを、ビオチン結合を通じてDNA成分に結合するストレプトアビジンによってコーティングしてもよい。ビオチンは、光切断可能リンカーまたはUV切断可能リンカーによってDNA成分に連結され得る。
【0226】
ウェビング1420は、プリントヘッド1410の下を通過する(例えば、ローラー1430および1440を介して)前にビーズによって広く覆うことができ、またはビーズによってパターン形成することができる。あるいは、または加えて、ビーズを、反応液滴1450の各々に蓄積または印刷してもよい。反応液滴は、ビーズへのDNA結合を促進する添加剤を含有し得る。ビーズは、反応液滴あたり1個、2個、3個、5個、10個、20個、50個、100個またはそれより多くの量であり得る。
【0227】
反応液滴1450は、DNAのビーズへのさらなる会合を防止する溶液1460中にプールすることができる。溶液1460は、BSAなどの遮断剤を含有し得る。プールした溶液中のDNA結合ビーズを溶液から分離して、乾燥させることができる1470。分離は遠心分離を通じて起こり得る。別の実施形態では、ビーズは磁性であり得て、それらは磁石によって分離することができる。
【0228】
プールしたDNA結合ビーズ(乾燥1470または溶液1460中)を、乳化した反応液滴中にさらに封入してもよい。一実施形態では、DNA結合ビーズは各々、マイクロフルイディクスを使用して反応液滴中に封入される。別の実施形態では、DNA結合ビーズは各々、液滴が自然に形成するように、反応溶液およびオイル(または別の非混和性の液体)を混合することによって反応液滴中で封入される。自然形成する反応液滴のDNA結合ビーズに対する比率は、反応液滴が1つより多くのDNA結合ビーズを含有する可能性がないように調整することができる。反応液滴は、そのサイズを制御するために、または他の反応液滴の融合を防止するために界面活性剤または他の添加剤を含有し得る。
【0229】
反応液滴は、ビーズ上のDNAを解離させる試薬を含有し得る。反応液滴は、識別子を形成するためにDNA成分を共にライゲーションする試薬を含有し得る、反応液滴は、酵素リガーゼならびにATP、DTT、または塩などのライゲーション補助因子を含有し得る。
【0230】
DNAが、光切断可能なまたはUV切断可能な結合を通じてビーズに結合する場合、DNAは、エマルションを適切な波長(例えば、光またはUV)の電磁波に曝露することによってビーズから放出され得る。
【0231】
図15は、ビーズに結合したDNA成分がエマルションを使用して識別子にどのように処理され得るかの例を例証する。ステップ1510では、DNA結合ビーズを提供する。DNA結合ビーズを1520で乳化し、反応ミックス液滴中で封入したDNA結合ビーズをオイル中に浸漬する。次いで、DNAを解離させて、混合物1530を得る。解離したDNA混合物をインキュベートし、1540のアセンブルされたDNAをもたらす。
【0232】
例示的なインプリメンテーションを、本明細書において示し記載してきたが、そのようなインプリメンテーションは、単なる例として提供されることは当業者に明白であろう。複数の変更、変化、および置換が当業者に想起されるであろう。本明細書に記載のインプリメンテーションに対する様々な代替を使用してもよいと理解すべきである。
PFSサイズを減少させるための例としての改変
【0233】
図11に既に記載したように、PFSは、4つのモジュール:シャーシ、プリントエンジン、インキュベーター、およびプーラーを含み得る。1Tbの情報をDNAに符号化するPFSの場合、各モジュールのサイズの近似値は以下の表に記載する通りであり得る。
表1.モジュールサイズの近似値
【表1】
【0234】
PFSのサイズを減少させるために、個々のモジュールのサイズを低減させてもよく、またはモジュールを除去してもよい。サイズを減少させるための改変の例は、以下を含み得る:
(1)プリントエンジンにおけるプリントヘッド容量を増加させること。カスタムプリントヘッドまたは追加のプリントヘッドのいずれかを使用して、ノズルカラム数を3倍(またはそれより大きい倍数の増加)にすることができる。これは、ウェビングにおけるプリント反応の数ならびにプリント幅を3倍にすることができる。
(2)再循環ウェビングを使用すること。例えばPFSは、1Tbの情報を符号化するために十分な反応を印刷するために21キロメートルのポリプロピレンウェビングを使用することができる。ウェビングリール(またはロール)を使用せずに済むように、再循環ウェビングを、ロール・トー・ロールウェビングの代替として使用してもよい。回収試験から、DNAを、プーラー中のウェブから容易に取り出すことができることが示されている。
(3)ライゲーション反応時間を短縮すること。これによって、より小さいインキュベートターの使用またはインキュベーターを全く使用しないことが容易になり得る。収量を犠牲にすることなくライゲーション反応時間を減少させるために、ケミストリーを最適化してより高いライゲーション速度を満たすことができる。
(4)室温および周囲条件でライゲーションを実施すること。これにより、インキュベーターモジュールの必要がなくなり得る。
(5)反応液滴の体積を維持するため、またはライゲーションをプーラー後に開始させるもしくは継続させることを可能にするために、オイルエマルションを使用すること。これにより、インキュベーターモジュールの必要がなくなり得る。
【0235】
例示的な実施形態を、本明細書において示し記載してきたが、そのような実施形態は、単なる例として提供されることは当業者に明白であろう。複数の変更、変化、および置換が当業者に想起されるであろう。本明細書に記載の実施形態に対する様々な代替を使用してもよいと理解すべきである。
組合せDNAアセンブリの方法およびシステムの適用
【0236】
成分を大きな定義された識別子のセットに組合せアセンブリするための本明細書に記載の方法およびシステムをこれまでに情報技術(例えば、データ記憶、計算、および暗号法)に関するものとして記載した。しかし、これらのシステムおよび方法は、より一般的には、ハイスループット組合せDNAアセンブリの任意の適用のために使用することができる。
【0237】
一実施形態では、アミノ酸の鎖を符号化する組合せDNAのライブラリーを創出することができる。それらのアミノ酸の鎖は、ペプチドまたはタンパク質のいずれかを表し得る。アセンブリのためのDNA断片は、コドン配列を含み得る。断片がそれに沿ってアセンブルされる接合部は、コンビナトリアルライブラリーの全てのメンバーに共通する機能的にまたは構造的に不活性なコドンであり得る。あるいは、断片がそれにそってアセンブルされる接合部は、後にプロセシングされたペプチド鎖に翻訳されるメッセンジャーRNAから最終的に除去されるイントロンであり得る。ある特定の断片は、コドンではなく、コドンの各組合せ列で一意にタグ付けされた(他のアセンブルされたバーコードと組み合わせて)バーコード配列であり得る。アセンブルされた産物(バーコード+コドンの列)を一緒にプールし、in vitro発現アッセイのために液滴の中に封入することができる、または、一緒にプールし、in vivo発現アッセイのために細胞に導入してそれを形質転換することができる。アッセイは、蛍光出力を有し得、したがって、液滴/細胞を蛍光強度によって選別してビンの中に入れ、その後、それらのDNAバーコードを、各コドン列を特定の出力と相関付けるためにシークエンシングすることができる。
【0238】
別の実施形態では、RNAを符号化する組合せDNAのライブラリーを創出することができる。例えば、アセンブルされたDNAは、マイクロRNAまたはCRISPR gRNAの組合せを表し得る。プールされたin vitroまたはin vivoのいずれかにおけるRNA発現アッセイを、液滴または細胞のいずれかを用い、また、どの液滴または細胞がどのRNA配列を含有するかに関する追跡を維持するためにバーコードを用いて上記の通り実施することができる。しかし、出力自体がRNAシークエンシングデータである場合には、一部のプールされたアッセイを液滴または細胞の外で行うことができる。そのようなプールされたアッセイの例としては、RNAアプタマースクリーニングおよび試験(例えば、SELEX)が挙げられる。
【0239】
別の実施形態では、代謝経路内の遺伝子を符号化する組合せDNAのライブラリーを創出することができる。各DNA断片は、遺伝子発現構築物を含有し得る。断片がそれに沿ってアセンブルされる接合部は、遺伝子間にある不活性なDNA配列を表し得る。プールされたin vitroまたはin vivoのいずれかにおける遺伝子経路発現アッセイを、液滴または細胞のいずれかを用いて、また、どの液滴または細胞がどの遺伝子経路を含有するかに関する追跡を維持するためのバーコードを用いて上記の通り実施することができる。
【0240】
別の実施形態では、異なる遺伝子調節エレメントの組合せを有する組合せDNAのライブラリーを創出することができる。遺伝子調節エレメントの例としては、5’非翻訳領域(UTR)、リボソーム結合性部位(RBS)、イントロン、エクソン、プロモーター、ターミネーター、および転写因子(TF)結合性部位が挙げられる。プールされたin vitroまたはin vivoのいずれかにおける遺伝子発現アッセイを、液滴または細胞のいずれかを用い、また、どの液滴または細胞がどの遺伝子調節構築物を含有するかに関する追跡を維持するためのバーコードを用いて上記の通り実施することができる。
【0241】
別の実施形態では、組合せDNAアプタマーのライブラリーを創出することができる。DNAアプタマーのリガンドに結合する能力を試験するためにアッセイを実施することができる。
本発明は、例えば、以下の項目を提供する。
(項目1)
少なくとも第1の成分核酸分子および第2の成分核酸分子から識別子核酸分子をアセンブルすることによってデジタル情報を記憶するためのシステムであって、
(a)基板の座標上に前記第1の成分核酸分子を含む第1の溶液の第1の液滴を吐出するように構成された第1のプリントヘッドと、
(b)前記第1および第2の成分核酸分子が前記基板上で並べられるように、前記基板の前記座標上に前記第2の成分核酸分子を含む第2の溶液の第2の液滴を吐出するように構成された第2のプリントヘッドと、
(c)前記第1および第2の成分核酸分子を物理的に連結するように前記基板の前記座標上に反応ミックスを吐出するか、前記第1および第2の成分核酸分子を物理的に連結するために必要な条件を提供するか、またはその両方であるフィニッシャーと
を含むシステム。
(項目2)
前記識別子核酸分子が、記号列において記号位置および記号値を表すように構成される、項目1に記載のシステム。
(項目3)
前記フィニッシャーが、前記基板の前記座標上に前記反応ミックスを吐出するように構成された第3のプリントヘッドを含む、項目1~2のいずれか一項に記載のシステム。
(項目4)
前記フィニッシャーが、インキュベーター、プーリングシステム、またはその両方をさらに含む、項目3に記載のシステム。
(項目5)
前記フィニッシャーが、前記第1のプリントヘッドが前記第1の液滴を前記座標上に吐出する前に、前記第2のプリントヘッドが前記第2の液滴を前記座標上に吐出する前に、またはその両方で前記座標上に前記反応ミックスを吐出する、項目1~4のいずれか一項に記載のシステム。
(項目6)
前記基板を、前記第1のプリントヘッド、前記第2のプリントヘッド、および前記フィニッシャーを超えて移動させる少なくとも1つのローラーをさらに含む、項目1~5のいずれか一項に記載のシステム。
(項目7)
前記少なくとも1つのローラーが、前記基板の線形の移動を提供する、項目6に記載のシステム。
(項目8)
前記少なくとも1つのローラーが、一定速度での前記基板の前記線形の移動を達成するリール・トゥ・リールシステムの一部である、項目7に記載のシステム。
(項目9)
前記基板が、連続する材料ループを形成し、前記少なくとも1つのローラーが、前記基板の前記座標に前記第1のプリントヘッド、前記第2のプリントヘッド、および前記フィニッシャーを複数回通過させるローラーのセットの一部である、項目6に記載のシステム。
(項目10)
前記基板が、前記第1の液滴、第2の液滴、および反応ミックスが吐出される第1の表面、ならびに前記第1の表面とは反対側の第2の表面を有し、前記少なくとも1つのローラーが前記第2の表面に接触するが、前記第1の表面には接触しない、項目6~9のいずれか一項に記載のシステム。
(項目11)
少なくとも1つの谷を含む第2のローラーをさらに含み、前記少なくとも1つの谷が前記座標と位置揃えするように、前記第2のローラーが前記第1の表面に接触する、項目10に記載のシステム。
(項目12)
第2のローラーをさらに含み、前記第2のローラーが前記第2の表面に接触するが、前記第1の表面には接触しないように、前記基板が、前記少なくとも1つのローラーと前記第2のローラーとの間で180度回転するか、またはらせん軌道にある、項目10に記載のシステム。
(項目13)
前記座標が、前記基板上の他の座標から1マイクロメートルから200マイクロメートルの間の直径または間隔を有する、項目1~12のいずれか一項に記載のシステム。
(項目14)
前記第1および第2の液滴が各々、1pLから50pLの間の体積を有する、項目1~13のいずれか一項に記載のシステム。
(項目15)
前記基板の座標と前記第1および第2のプリントヘッドとの間のアライメントを維持するために、前記基板の動きをリアルタイムで追跡するレジスターをさらに含む、項目1~14のいずれか一項に記載のシステム。
(項目16)
前記第1および第2の溶液が色素を組み入れ、前記システムが、前記第1および第2の液滴の適切な吐出を確認するカメラを含むスポットイメージャーをさらに含む、項目1~15のいずれか一項に記載のシステム。
(項目17)
前記基板上の前記第1および第2の液滴を乾燥させるスポットドライヤーをさらに含む、項目1~16のいずれか一項に記載のシステム。
(項目18)
前記第1のプリントヘッドが、前記基板の異なる座標で前記第1の溶液の液滴を吐出する第1の複数のノズルを含む、項目1~17のいずれか一項に記載のシステム。
(項目19)
前記第1のプリントヘッドが、前記基板の異なる座標で第3の溶液の液滴を吐出する第2の複数のノズルをさらに含む、項目18に記載のシステム。
(項目20)
前記基板をさらに含む、項目1~19のいずれか一項に記載のシステム。
(項目21)
前記基板が低結合性プラスチックを含む、項目20に記載のシステム。
(項目22)
前記基板が、ポリエチレンテレフタレート(PET)またはポリプロピレンを含む、項目21に記載のシステム。
(項目23)
前記第1および第2のプリントヘッドが、前記基板の動きと比較してある角度でシステム内に搭載され、前記角度が前記座標上でのオーバープリントを可能にする、項目1~22のいずれか一項に記載のシステム。
(項目24)
前記第1のプリントヘッドが、MEMS薄膜ピエゾ方式インクジェットヘッドまたはMEMSサーマル方式インクジェットヘッドである、項目1~23のいずれか一項に記載のシステム。
(項目25)
前記第1および第2のプリントヘッドが、同じトラックに沿って位置して前記座標上に液滴を吐出し、前記システムが、対応するトラックにおける別の座標上に液滴を吐出するために少なくとも1つの追加のトラックに沿って位置する追加のプリントヘッドをさらに含む、項目1~24のいずれか一項に記載のシステム。
(項目26)
前記フィニッシャーが、反応のインキュベーションにとって最適な固定された内部温度を有する、項目1~25のいずれか一項に記載のシステム。
(項目27)
前記フィニッシャーが、インキュベーションの間、前記反応ミックスの蒸発を制御する固定された湿度レベルを有する、項目26に記載のシステム。
(項目28)
前記フィニッシャーが、濃縮を防止するためにインキュベーション前に前記基板を加熱するヒーターを含む、項目25または26に記載のシステム。
(項目29)
前記フィニッシャーが、前記基板上の異なる座標からの複数の反応物を容器に統合するプーリングシステムを含む、項目1~28のいずれか一項に記載のシステム。
(項目30)
前記フィニッシャーが、統合前に前記基板の前記座標上に反応阻害剤を吐出する、項目29に記載のシステム。
(項目31)
前記容器が、反応阻害剤を含むプーリング溶液を含有する、項目29に記載のシステム。
(項目32)
前記反応阻害剤が、エチレンジアミン四酢酸(EDTA)である、項目30~31のいずれかに記載のシステム。
(項目33)
前記基板上の異なる座標から回収した液体から核酸を捕捉する膜をさらに含む、項目29~32のいずれか一項に記載のシステム。
(項目34)
前記基板から核酸を取り出すスクレイパーをさらに含む、項目29~33のいずれか一項に記載のシステム。
(項目35)
異なる座標からの前記複数の反応物が、プールされた後に前記複数の反応物がその内容物を維持することを可能にするエマルションに共にプールされる、項目29~34のいずれか一項に記載のシステム。
(項目36)
前記基板が、非混和性の液体またはオイルによってコーティングされる、項目35に記載のシステム。
(項目37)
前記座標上にオイルを吐出するオイルディスペンサーをさらに含む、項目35に記載のシステム。
(項目38)
前記基板が、前記第1および第2の成分核酸分子に結合するビーズによってコーティングされるか、またはパターン形成される、項目1~37のいずれか一項に記載のシステム。
(項目39)
前記座標上にビーズを吐出するビーズディスペンサーをさらに含む、項目1~38のいずれか一項に記載のシステム。
(項目40)
前記反応ミックスがリガーゼを含む、項目1~39のいずれか一項に記載のシステム。
(項目41)
前記第1の溶液、前記第2の溶液、および前記反応ミックスのうちの少なくとも1つが添加剤を含む、項目1~40のいずれか一項に記載のシステム。
(項目42)
前記添加剤が、前記第1の溶液と前記第1のプリントヘッド、前記第2の溶液と前記第2のプリントヘッド、または前記反応ミックスと前記フィニッシャーとの間の適合性を可能にするように構成される、項目41に記載のシステム。
(項目43)
前記添加剤が、前記第1の溶液、前記第2の溶液、または前記反応ミックスの蒸発を軽減する、項目41~42のいずれかに記載のシステム。
(項目44)
前記添加剤が、湿潤剤、界面活性剤、および殺生物剤のうちの少なくとも1つを含む、項目41~43のいずれか一項に記載のシステム。
(項目45)
項目1~42のいずれか一項に記載のシステムを操作するための指示を実行するように構成されたコンピュータプロセッサをさらに含む、項目1~44のいずれか一項に記載のシステム。
(項目46)
核酸分子をアセンブルするためのシステムであって、
(a)基板の座標上に第1の成分核酸分子を含む第1の溶液の第1の液滴を吐出するように構成された第1のプリントヘッドと、
(b)前記第1および第2の成分核酸分子が前記基板上でコロケートされるように、前記基板の前記座標上に前記第2の成分核酸分子を含む第2の溶液の第2の液滴を吐出するように構成された第2のプリントヘッドと、
(c)前記第1および第2の成分核酸分子を物理的に連結するように前記基板の前記座標上に反応ミックスを吐出するか、前記第1および第2の成分核酸分子を物理的に連結するために必要な条件を提供するか、またはその両方であるフィニッシャーとを含むシステム。
(項目47)
前記フィニッシャーが、前記基板の前記座標上に前記反応ミックスを吐出するように構成された第3のプリントヘッドを含む、項目46に記載のシステム。
(項目48)
前記フィニッシャーが、インキュベーター、プーリングシステム、または両方をさらに含む、項目47に記載のシステム。
(項目49)
前記フィニッシャーが、前記第1のプリントヘッドが前記第1の液滴を前記座標上に吐出する前に、前記第2のプリントヘッドが前記第2の液滴を前記座標上に吐出する前に、またはその両方で前記座標上に前記反応ミックスを吐出する、項目46~48のいずれか一項に記載のシステム。
(項目50)
前記アセンブルされた核酸が、遺伝子コードDNA、ペプチドコードDNA、またはRNAコードDNAを含む、項目46に記載のシステム。
(項目51)
前記アセンブルされた核酸が、DNAアプタマーライブラリーを含む、項目46に記載のシステム。
図1
図2
図3-1】
図3-2】
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15