IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ディーエヌエー スクリプトの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-02
(45)【発行日】2024-02-13
(54)【発明の名称】核酸鎖の大規模並列酵素合成
(51)【国際特許分類】
   C12P 19/34 20060101AFI20240205BHJP
   C12Q 1/6874 20180101ALI20240205BHJP
   C12N 9/12 20060101ALN20240205BHJP
   C12Q 1/6844 20180101ALN20240205BHJP
【FI】
C12P19/34 A ZNA
C12Q1/6874 Z
C12N9/12
C12Q1/6844 Z
【請求項の数】 19
(21)【出願番号】P 2021503606
(86)(22)【出願日】2019-07-05
(65)【公表番号】
(43)【公表日】2021-11-25
(86)【国際出願番号】 EP2019068183
(87)【国際公開番号】W WO2020020608
(87)【国際公開日】2020-01-30
【審査請求日】2022-06-03
(31)【優先権主張番号】18306000.3
(32)【優先日】2018-07-23
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】516304610
【氏名又は名称】ディーエヌエー スクリプト
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ホルガン, アドリアン
(72)【発明者】
【氏名】ゴドロン, シャビエル
(72)【発明者】
【氏名】イベール, トマス
(72)【発明者】
【氏名】ニコル, ロベール
【審査官】菅原 洋平
(56)【参考文献】
【文献】国際公開第2016/094512(WO,A1)
【文献】国際公開第2018/102554(WO,A1)
【文献】特表2015-533077(JP,A)
【文献】国際公開第2018/057526(WO,A2)
【文献】国際公開第2017/196783(WO,A1)
【文献】国際公開第2017/176541(WO,A1)
【文献】国際公開第2017/009663(WO,A1)
【文献】米国特許第07544794(US,B1)
【文献】国際公開第2017/011492(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
C12P 19/34
C12N 9/12
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
所定の配列を有する複数のポリヌクレオチドを合成する方法であって、前記方法が、
(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤がその上に配置されているステップと;
(b)ヌクレオチドの種類ごとに、(i)前記電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に電圧差を生成することにより、前記所定のアドレスの前記電極の開始剤または伸長断片を脱保護し、それによって前記所定のアドレスの前記電極の前記開始剤または伸長断片で遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、前記所定のアドレスの前記電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、前記所定のアドレスの前記開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップと;
(c)所定の配列のポリヌクレオチドの前記アレイが完成するまでステップ(b)を繰り返すステップとを含み、
前記電気化学的に不安定な保護基がアミノ基である、方法。
【請求項2】
ポリヌクレオチドのアレイに情報を保存し、かつ取り出す方法であって、前記方法が、
(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤をその上に配置しているステップと;
(b)ヌクレオチドの種類ごとに、(i)前記電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に所定の電圧差を生成することにより、前記所定のアドレスの前記電極の開始剤または伸長断片を脱保護し、それによって前記所定のアドレスの前記電極の前記開始剤または伸長断片上に遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、前記所定のアドレスの前記電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、前記所定のアドレスの前記開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の前記取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップと;
(c)所定の配列のポリヌクレオチドの前記アレイが完成するまでステップ(b)を繰り返すステップであって、前記完成したポリヌクレオチドの各々が、5’から3’の方向に情報コード化領域を含み、その3’末端にシーケンシングプライマー結合部位を含むステップと;
(d)シーケンシングプライマーを前記シーケンシングプライマー結合部位にアニーリングし、1またはそれを超える反応部位の前記完成したポリヌクレオチドを合成によりシーケンシングすることにより、前記情報コード化領域から情報を取り出すステップ、を含み、
前記電気化学的に不安定な保護基がアミノ基である、方法。
【請求項3】
前記合成によりシーケンシングすることが、標識され可逆的にブロックされたヌクレオシド三リン酸を、テンプレート依存性ポリメラーゼによって前記シーケンシングプライマーまたはその延長部に取り込み、取り込まれた前記標識され可逆的にブロックされたヌクレオシド三リン酸の同一性が前記反応部位の前記ポリヌクレオチドの前記配列によって決定されるようにすることを含む、請求項に記載の方法。
【請求項4】
前記標識され可逆的にブロックされたヌクレオシド三リン酸が、所定のアドレスの作用電極の各々と前記参照電極との間に所定の電圧差を発生させることによって、所定のアドレスの反応部位において、前記延長されたシーケンシングプライマーから除去される3’-O-電気化学的に不安定なブロッキング基を含む、請求項に記載の方法。
【請求項5】
前記標識され可逆的にブロックされたヌクレオシド三リン酸の前記標識が、各所定のアドレスの作用電極と前記参照電極との間に所定の電圧差を発生させることによって所定の反応部位で切断され得る、電気化学的に不安定な結合によってそれに付着している、請求項またはに記載の方法。
【請求項6】
前記完成したポリヌクレオチドの各々が、その反応部位で等温増幅される、請求項のいずれか一項に記載の方法。
【請求項7】
前記等温増幅が、テンプレートウォーキングまたはリコンビナーゼ-ポリメラーゼ増幅によって実施される、請求項に記載の方法。
【請求項8】
前記開始剤の一部が、前記3’-O-電気化学的に不安定な保護基とは別個の3’-O-保護基を有する、請求項のいずれか一項に記載の方法。
【請求項9】
前記別個の3’-O-保護基が除去され、前記完成したポリヌクレオチドの各々がその電極で等温増幅される、請求項に記載の方法。
【請求項10】
異なる前記電極の前記完成したポリヌクレオチドのうちの少なくとも2つが、異なる配列を含む前記シーケンシングプライマー結合部位を有し、前記少なくとも2つの前記完成したポリヌクレオチドが別々にシーケンシングされ得る、請求項のいずれか一項に記載の方法。
【請求項11】
前記シーケンシングプライマー結合部位の前記異なる配列が、それらの対応する情報コード化領域でコードされた異なる情報に関連付けられている、請求項10に記載の方法。
【請求項12】
前記合成によりシーケンシングする方法が、延長されたシーケンシングプライマーの電気化学的に不安定な3’-O-ブロッキング基を脱ブロック化するステップを含み、そのようなステップが、前記電極の各々と参照電極との間に所定の電圧差を生成し、前記電気化学的に不安定な保護基が切断される、請求項11のいずれか一項に記載の方法。
【請求項13】
前記開始剤の各々が、切断可能なヌクレオチドまたは切断可能な結合を含み、請求項の前記方法が、前記取り出した情報が合成エラーを示す場合はいつでも、前記切断可能なヌクレオチドまたは切断可能な結合で前記開始剤を切断するステップと、前記切断した開始剤から前記ポリヌクレオチドを再合成するステップをさらに含む、請求項12のいずれか一項に記載の方法。
【請求項14】
前記反応部位の一部が、他の反応部位の開始剤の前記他の3’-O-電気化学的に不安定な保護基とは別個の3’-O-電気化学的に不安定な保護基を有する開始剤を含み、請求項に記載の方法が、前記取り出した情報が合成エラーを示す場合はいつでも、別個の3’-O-電気化学的に不安定な保護基を有する開始剤を有する少なくとも1つの反応部位で開始剤を脱保護するステップと、所定の配列のポリヌクレオチドを再合成するステップとをさらに含請求項13のいずれか一項に記載の方法。
【請求項15】
校正を伴うポリヌクレオチドのテンプレートフリー酵素合成の方法であって、前記方法が、
a)少なくとも1つの作用電極と作動的に関連している反応部位に開始剤を提供するステップであって、前記開始剤が遊離3-O-ヒドロキシルを有するステップと;
b)(i)伸長条件下で、遊離3-O-ヒドロキシルを有する前記開始剤またはその伸長断片と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼを接触させ、その結果、前記開始剤またはその伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルと;(ii)前記ポリヌクレオチドが完成し、シーケンシングプライマー結合部位がその3’末端に付加されるまで、ステップ(i)の前記伸長断片を脱保護して、遊離3’-ヒドロキシルを有する伸長断片を形成するサイクルを繰り返すステップと;
c)シーケンシングプライマーを前記シーケンシングプライマー結合部位にアニーリングし、前記ポリヌクレオチドをシーケンシングするステップ、とを含み、
前記3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸がアミノ基である、方法。
【請求項16】
前記合成によりシーケンシングすることが、標識され可逆的にブロックされたヌクレオシド三リン酸をテンプレート依存性ポリメラーゼによって前記シーケンシングプライマーまたはその延長部に取り込み、前記取り込まれた標識され可逆的にブロックされたヌクレオシド三リン酸の同一性が前記反応部位の前記ポリヌクレオチドの前記配列によって決定される、請求項15に記載の方法。
【請求項17】
前記標識され可逆的にブロックされたヌクレオシド三リン酸が、所定のアドレスの前記電極の各々と参照電極との間に電圧差を発生させることによって、所定のアドレスの反応部位において、前記電気化学的に不安定なブロッキング基が切断されるように、前記延長されたシーケンシングプライマーから除去される3’-O-電気化学的に不安定なブロッキング基を含む、請求項16に記載の方法。
【請求項18】
前記標識され可逆的にブロックされたヌクレオシド三リン酸の前記標識が、各所定のアドレスの作用電極と前記参照電極との間に電圧差を発生させることによって所定の反応部位で切断され得る、電気化学的に不安定な結合によってそれに付着している、請求項16または17のいずれか一項に記載の方法。
【請求項19】
前記開始剤が、切断可能なヌクレオチドまたは切断可能な結合を含み、請求項15の前記方法が、シーケンシングステップが合成エラーを示す場合はいつでも、前記切断可能なヌクレオチドまたは切断可能な結合で前記開始剤を切断するステップと、前記切断した開始剤から前記ポリヌクレオチドを再合成するステップをさらに含む、請求項1518のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸鎖の大規模並列合成のための新規なプロセスに関する。
【背景技術】
【0002】
生物学は、情報を並外れた密度、安定性、および効率で保存することができ、電子ベースの長期データ保存を桁違いに上回る可能性がある。自然は、ヒト細胞内に日常的に3ギガバイトを超える情報を保存および抽出し、組織を分化させ、代謝プロセスを調節するための情報の階層的送達を調整することができる。しかし、この情報の保存およびアクセスは、データ内にコードされた生物学的プロセスと密接に結びついている。したがって、これをデジタルデータ保存に適合させることは、半導体デジタルスケールと同等なわれわれの現在のDNAを読み書きする能力によって大幅に制限されている。DNAシーケンシングの最近の進歩により、シーケンシングの実行あたりのDNAのスループットはテラ塩基を上回り、読み取り能力が大幅に向上し、高スループットの読み取りの可能性が開かれたが、このスループットでさえデジタルシステムに匹敵するスループットを達成するには不十分である。DNAの合成能力は、スループットおよびコストの点で、シーケンシング能力よりも少なくとも2桁遅れている。しかし、既存のDNA合成およびシーケンシング技術を使用したデモンストレーションにより、データ保存に対するこのアプローチの力が実証されている。例えばChurchら、Science、337(6102):1628(2012);Organickら、Nature Biotechnology、36(3):242-248(2018)など。課題は、自然界における高密度の階層的なデータ保存には、真の分子ベースのデータ保存能力を提供するために、コード化アルゴリズム、DNA合成、およびDNAシーケンシングにおいて全体でのブレイクスルーが必要とされることである。
特に、DNAデータ保存に対する現在のアプローチでは、読み取りと書き込みを別個のプロセスとして扱うため、情報は合成の過程でDNAにコード化され、合成されたDNA鎖とコードされたDNA鎖は別々に保存され、情報は選択的増幅およびシーケンシングによって取り出される、例えば、Bornholtら、IEEE Micro、37(3):98-104(2017)。DNAの書き込みまたは合成と、読み取りまたはシーケンシングの両方を同じ基板上でサポートするDNAストレージデバイスが利用可能であるならば、DNAの高い情報保存容量をより有利に活用することができる。
【先行技術文献】
【非特許文献】
【0003】
【文献】Churchら、Science、337(6102):1628(2012)
【文献】Organickら、Nature Biotechnology、36(3):242-248(2018)
【文献】Bornholtら、IEEE Micro、37(3):98-104(2017)
【発明の概要】
【課題を解決するための手段】
【0004】
発明の要旨
本発明は、複数の核酸の並列テンプレートフリー酵素合成の方法に関し、より具体的には、局所的な電気化学的脱保護ステップを伴う、核酸の並列テンプレートフリー酵素合成の方法に関する。局所的な電気化学的脱保護は、例えば、局所反応部位のpHを制御によるpH感受性結合の脱保護、および/あるいは、電位の制御、または局所反応部位と参照電極との間の電圧差の制御による、酸化還元感受性保護基の還元または酸化による脱保護をはじめとする多様な方法で達成されてよい。一部の実施形態では、電気化学的脱保護は、電極アレイを使用して局所的に実施され、各反応部位の電気化学的特性の制御は、1またはそれを超える関連電極によって決定される。一部の実施形態では、本発明は、情報を保存するための基板上でのポリヌクレオチドの並列合成、および情報を取り出すための同じ基板上での同じポリヌクレオチドのシーケンシングに関する。一部の実施形態では、そのようなシーケンシングは、局所的な電気化学的変化によって除去可能な標識および/または局所的な電気化学的変化によって除去可能な3’-O-ブロッキング基を有していてもよいデオキシヌクレオシド三リン酸(dNTP)を用いる、合成によりシーケンシングすることの方法論を用いて実行される。
【0005】
本発明のさらなる目的は、最良の工業的実施に基づいて設計、試験、および最適化される分子データ保存システムを提供するために必要な複数の先端技術を統合することである。これには、高度な新しいDNA合成技術、新しいDNAシーケンシング方法、マイクロスケールの製造、マイクロフルイディクス、および堅牢なコード化が必要である。この目的のために、本発明は、酵素的核酸合成および関連する生物学的機構を使用することによって、生物学的コード化システムの分子精度さおよび多様性を活用すること、高度に並列化された合成、読み出し、および保存を可能にする生化学を正確に制御するためにマイクロシステムおよびマイクロフルイディクスを使用すること、および/または、個々の技術ではなく完全に統合されたシステムを提供するための実験計画を含む、迅速な設計-構築-試験の反復であるプロセス制御ツールボックスを使用することを提案する。
【0006】
本発明のプロセスは、保存、取り出し、およびオペレーティングシステムのための技術的解決策を提供する。より詳細には、保存部分は、新規な酵素DNA合成技術の可能性と、既存の実証済みの高度に並列化された自動化アプローチを組み合わせることによって対処される。取り出し部分は、データ構造の最適化と併せて、特定のDNA構造、バーコーディングおよび密度で機能するように最適化された、既存の合成によりシーケンシングすること「シーケンシング・バイ・シンセシス(sequencing by synthesis:SBS):の技術を活用することによって対処される。オペレーティングシステム部分は、データ密度の最適化のためのスキームを提示する。
【0007】
一部の実施形態では、本発明の方法により作製される複数のポリヌクレオチドを組み合わせて、合成生物学で用いる遺伝子などの、より大きい断片を形成することができる。
【0008】
一部の実施形態では、本発明のテンプレートフリー酵素合成方法を用いて、コードされた情報を有する既存のポリヌクレオチドにさらなる情報を追加することができる。そのような追加情報は、例えばアドレスを訂正または更新する際のように既存の情報を訂正する場合があり、または追加情報は単に既存の情報をある意味で否定するかまたは無効にする場合がある。
【0009】
そのような一実施形態では、既存の情報を含むポリヌクレオチドは、反応部位に播種され、動的排除条件下で増幅させるか、またはテンプレートウォーキング(template walking)によって増幅させることができる。例えば、Maら、Proc.Natl.Acad.Sci.、110(35):14320-14323(2013);米国特許第9476080号;同第8895249号など。新しい情報は、ヌクレオチドの所定の配列をクローン化されたポリヌクレオチドの末端に酵素的に結合させることによってクローン化されたポリヌクレオチドに追加される。ヌクレオチドの所定の配列は、新しい情報をコードされたフォーマットで含むことができる。一部の実施形態では、新しい情報を追加する前に、クローン化されたポリヌクレオチドは部分的または全体的にシーケンシングされるため、特定の反応部位に追加される新しい情報は、最初のシーケンシングによって特定の部位のクローン化されたポリヌクレオチドから抽出された情報量の内容に依存することがある。一部の実施形態では、新しい情報で増強されたクローン化ポリヌクレオチドは、保存のために、またはさらなる処理ステップのために、反応部位から切断され得る。
【0010】
一部の実施形態では、ポリヌクレオチドは、天然ヌクレオチドよりも分解に対してより耐性のある修飾ヌクレオチドを使用して合成してもよく、それにより、保存寿命および情報の完全性を向上させることができる。一部の実施形態では、ホスホロチオエート、2’-フルオロ、または2’-O-Meヌクレオチドモノマーは、例えば酵素分解を減らすために、全体に、または合成された鎖中のヌクレオチドの一部として、天然のヌクレオチドモノマーの代わりに置換されている。一部の実施形態では、完成したポリヌクレオチドは、例えば、エキソヌクレアーゼ消化の可能性を減らすために、その3’-末端をリン酸化することによって「キャッピング」されている。一部の実施形態では、脱アミノ化は、環外アミン上にも塩基保護基を有する3’-O-保護dNTP、例えばN-ベンジル-dATP、N-ベンジル-dCTP、N-イソブチル-dGTPなどを用いることにより減らすことができる。例えばBeaucageおよびIyer、Tetrahedron、48(12):2223-2311(1992)(特に表3);Narang、Synthesis and Applications of DNA and RNAの第1章(Academic Press、Orlando、1987);Srivastavaら、国際特許公開第2010/134992号など。
【0011】
一部の実施形態では、コードされた情報を有するポリヌクレオチドは、例えば、脱プリンに対してより耐性の高い二本鎖形態で保存または維持することができる。他の実施形態では、脱プリンに対する耐性を最大化するために、他のモノマーよりもdAの使用を最大化し、dTの使用を最小化するコーディングスキームが選択されている。特定のそのような実施形態では、情報は、dA、dCおよびdGのみを使用してコード化されている。一部の実施形態では、ポリヌクレオチドを合成する(書き込む)ステップと、ポリヌクレオチドをシーケンシングする(読み取る)ステップを含む本発明の方法は、保存用の二本鎖産物をもたらす、合成によりシーケンシングすることの方法によって新たに合成されたポリヌクレオチドを校正するステップを含む。ポリヌクレオチド内にコードされた情報を後で取り出すために、シーケンシング鎖を融解して、再シーケンシングステップにかけてもよい。
【0012】
一部の実施形態では、情報を含むポリヌクレオチドは、担体溶液、例えばサケ精子DNAなどの容易に入手可能な天然DNA、スペルミジンなどのポリカチオン、ポリビニルピロリドン、ポリメチルメタクリレートなどに保存される。
【0013】
一部の実施形態では、複数のポリヌクレオチドを並列で合成するための本発明の方法は、以下のステップ:(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤がその上に配置されているステップ;(b)ヌクレオチドの種類ごとに、(i)電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に電圧差を生成することにより、所定のアドレスの電極の開始剤または伸長断片を脱保護し、それによって所定のアドレスの電極の開始剤または伸長断片で遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、所定のアドレスの電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、その結果、所定のアドレスの開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップ;ならびに(c)所定の配列のポリヌクレオチドのアレイが完成するまでステップ(b)を繰り返すステップを含む。
【0014】
一部の実施形態では、本発明は、校正を伴うポリヌクレオチドのテンプレートフリー酵素合成の方法に関する。そのような方法は、以下のステップ:a)少なくとも1つの作用電極と作動的に関連している反応部位に開始剤を提供するステップであって、開始剤が遊離3-O-ヒドロキシルを有するステップ;b)(i)伸長条件下で、遊離3-O-ヒドロキシルを有する開始剤またはその伸長断片と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼを接触させ、その結果、開始剤またはその伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成し;(ii)ポリヌクレオチドが完成し、シーケンシングプライマー結合部位がその3’末端に付加されるまで、ステップ(i)の伸長断片を脱保護して、遊離3’-ヒドロキシルを有する伸長断片を形成するサイクルを繰り返すステップ;およびc)シーケンシングプライマーをシーケンシングプライマー結合部位にアニーリングし、ポリヌクレオチドをシーケンシングするステップで実施することができる。
【0015】
一部の実施形態では、本発明は、ポリヌクレオチドアレイに関する情報を保存し、そこから情報を取り出す方法に関する。そのような方法は、以下のステップ:(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤がその上に配置されているステップ;(b)ヌクレオチドの種類ごとに、(i)電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に所定の電圧差を生成することにより、所定のアドレスの電極の開始剤または伸長断片を脱保護し、それによって所定のアドレスの電極の開始剤または伸長断片上に遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、所定のアドレスの電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、その結果、所定のアドレスの開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップ;(c)所定の配列のポリヌクレオチドのアレイが完成するまでステップ(b)を繰り返すステップであって、完成したポリヌクレオチドの各々が、5’から3’の方向に情報コード化領域を含み、その3’末端にシーケンシングプライマー結合部位を含むステップ;ならびに(d)シーケンシングプライマーをシーケンシングプライマー結合部位にアニーリングし、1またはそれを超える反応部位の完成したポリヌクレオチドを合成によりシーケンシングすることにより、情報コード化領域から情報を取り出すステップで実施することができる。
【図面の簡単な説明】
【0016】
図1-1】図1Aは、3’-O-保護dNTPが核酸鎖に付加された後に脱保護される酵素合成サイクルの模式図を含む。
図1-2】図1Bは、アドレス可能な電極アレイ上での複数のポリヌクレオチドの並列テンプレートフリー酵素合成のための、本発明の一実施形態のステップを示す。
【0017】
図2図2は、データ保存用のオリゴヌクレオチドの設計(A)および中間プライマーを用いるデータ保存用のオリゴヌクレオチドの設計(B)を示す。
【0018】
図3図3は、2進コード化(先行技術)、標準的なDNAの4進コード化(先行技術)、本発明による存在/不在の組合せのコード化(各サイクルのヌクレオチドの存在または不在下でデータがコード化されている基数の混合)、および本発明による25%の組み合わせコード化(データが各サイクルで各基数の%にコード化されている基数の混合-各基数に対して5レベルの%が可能:0%、25%、75%および100%)を比較する。
【0019】
図4図4は、DNAアレイの1つのウェル上で図3に提示される本発明の不在/存在の組み合わせスキームを使用するコード化の例を提示する。データは、基数14(X1、X2、…、X14)でコード化されている。ここで示されているコードX1 X2 X10 X6 X11 X8は、6ntの長さのDNA鎖に保存されている。これは22ビットを超えるデータをコードする。同じ量のデータを、4進コード化を用いて保存するには、12ヌクレオチドのDNA断片が必要であった。
【0020】
図5図5は、疑似3次元DNAデータの保存例を説明する。マイクロアレイグリッドは2次元であり、DNA配列(または組み合わせスキームの配列の混合)は3次元である。
【0021】
図6-1】図6Aは、電極での電気化学条件を制御するためのポテンシオスタット電子回路の実施形態である。
【0022】
図6-2】図6Bは、試薬がアレイを越えて順に流れている電極アレイ上でポリヌクレオチドを合成するための装置の一実施形態を図で示す。
【0023】
図6-3】図6Cは、電極の反応部位への試薬の液滴送達を使用する、電極アレイ上でポリヌクレオチドを合成するための装置の一実施形態を図で示す。
【0024】
図7-1】図7A~7Dは、テンプレートフリー酵素合成によって可能なデータ保存技術を説明する。
図7-2】図7A~7Dは、テンプレートフリー酵素合成によって可能なデータ保存技術を説明する。
図7-3】図7A~7Dは、テンプレートフリー酵素合成によって可能なデータ保存技術を説明する。
図7-4】図7A~7Dは、テンプレートフリー酵素合成によって可能なデータ保存技術を説明する。
【0025】
図8図8は、3’-O-アジドメチル保護dNTPを組み込むことができない変異株TdTが、電気化学的に脱保護された反応からの生成物である3’-O-ヒドロキシルdNTPでプライマーをうまく延長し、それによって3’-O-アジドメチルヌクレオチドを電気化学的に脱保護する可能性を実証した反応の延長生成物の電気泳動図を示す。
【0026】
図9図9は、3’-O-NH2-ヌクレオチドを脱保護する(すなわち、3’-O-NH2を3’-OHに変換する)効率を、いくつかのインキュベーション時間のpHと対比して説明する。
【発明を実施するための形態】
【0027】
発明の詳細な説明
本発明は、様々な変更および代替的な形態が可能であるが、その詳細は、例として図面に示され、詳細に説明される。しかし、その意図は、本発明を記載の特定の実施形態に限定するものではないことを理解されたい。その意図は、本発明の精神および範囲内にあるすべての変更、等価物、および代替物を網羅することである。例えば、装置およびアレイのマイクロエレクトロニクス部分は、説明の目的で、CMOS技術に実装されている。しかし、他の半導体ベースの技術を利用して本明細書で考察されるシステムのマイクロエレクトロニクス部分の様々な実施態様を実装することができるため、本開示は、この点で限定することを意図するものではないことが理解されたい。本発明のアレイを作成するためのガイダンスは、集積回路の設計および製造ならびにマイクロマシニングに関する多くの利用可能な参考文献および論文に見出され、それには、限定されるものではないが、Allenら、CMOS Analog Circuit Design(Oxford University Press、第2版、2002);Levinson、Principles of Lithography、第2版(SPIE Press、2005);Doering and Nishi編、Handbook of Semiconductor Manufacturing Technology、第2版(CRC Press、2007);Baker、CMOS Circuit Design、Layout、and Simulation(IEEE Press、Wiley-Interscience、2008);Veendrick、Deep-Submicron CMOS ICs(Kluwer-Deventer、1998);Cao、nanostructures&Nanomaterials(Imperial College Press、2004)などが挙げられ、これらの関連部分は参照により本明細書に組み込まれる。同様に、本発明の電気化学的測定を実施するためのガイダンスは、主題に関する多くの利用可能な参考文献および論文に見出され、それには、限定されるものではないが、Sawyerら、Electrochemistry for Chemists、第2版(Wiley Interscience、1995);Bard and Faulkner、Electrochemical Methods:Fundamentals and Applications、第2版(Wiley、2000)などが挙げられ、これらの関連部分は参照により本明細書に組み込まれる。
【0028】
一態様では、本発明は、ポリヌクレオチドの大規模並列酵素合成を可能にする新規なプロセスを提供する。上記のように、一態様では、この方法は、大規模電極アレイ上での並列合成を容易にするために電気化学的に不安定な保護基を用いる。このプロセスの1つの用途において、ポリヌクレオチドは、例えば、合成によりシーケンシングすることの技術、特に電気化学的に不安定なブロッキング基および/または標識を用いるものを使用するDNAシーケンシング操作によって、後に同じ合成支持体から取り出すことができるデータを保存するために使用される。
A.酵素DNA合成の背景。
【0029】
最近、非常に長いDNAまたはRNA鎖を最高の純度で生成する酵素合成プロセスが開発された(WO2015/159023)。核酸鎖へのヌクレオチドの付加をもたらす酵素合成プロセスのサイクルは、伸長ステップおよび脱保護ステップにそれぞれ対応する2つの連続したステップを含む(図1A)。要約すると、伸長ステップの間に、ポリメラーゼは、保護基を含むヌクレオチドを核酸鎖に付加する。次に、この新しく付加されたヌクレオチドから保護基が削除され、さらなるサイクルを行うことが可能になる。この新しい酵素合成技術は、化学合成と比較して核酸合成に劇的な改善をもたらしている。データ保存の主な利点を次の表に記載する:
【表1】
【0030】
一般に、テンプレートフリー酵素DNA合成方法は、図1Aに図示されるような、所定のヌクレオチドが各サイクルで開始剤または成長鎖に結合されるステップの繰り返しサイクルを含む。テンプレートフリー酵素合成の一般的な要素は、次の参考文献に記載されている:Ybertら、国際公開第2015/159023号;Ybertら、国際公開第2017/216472号;Hyman、米国特許第5436143号;Hiattら、米国特許第5763594号;Jensenら、Biochemistry、57:1821-1832(2018);Mathewsら、Organic&Biomolecular Chemistry、DOI:0.1039/c6ob01371f(2016);Schmitzら、Organic Lett.、1(11):1729-1731(1999)。
【0031】
開始剤ポリヌクレオチド(100)は、例えば、固相支持体(102)に付着した形で提供され、遊離3’-ヒドロキシル基(103)を有する。この開始剤ポリヌクレオチド(100)(または後続のサイクルで伸長した開始剤ポリヌクレオチド)に、開始剤ポリヌクレオチド(100)(または伸長開始剤ポリヌクレオチド)の3’末端への3’-O-保護dNTPの酵素組み込みに効果的な条件(104)下で、3’-O-保護dNTPおよびテンプレートフリーポリメラーゼ、例えばTdTまたはその変異体など(例えばYbertら、国際公開第2017/216472号)を付加する。この反応により、3’-ヒドロキシルが保護された、伸長した開始剤ポリヌクレオチド(106)が生成される。伸長した開始剤ポリヌクレオチドが競合配列を含む場合、3’-O-保護基を除去するか、または脱保護してもよく、所望の配列を元の開始剤ポリヌクレオチドから切断してもよい。そのような切断は、多様な一本鎖切断技術のいずれかを使用して、例えば、元の開始剤ポリヌクレオチド内の所定の位置に切断可能なヌクレオチドを挿入することによって実施されてよい。例示的な切断可能なヌクレオチドは、ウラシルDNAグリコシラーゼによって切断されるウラシルヌクレオチドであり得る。伸長した開始剤ポリヌクレオチドが完成した配列を含まない場合には、3’-O-保護基を除去して遊離3’-ヒドロキシル(103)を露出させ、伸長した開始剤ポリヌクレオチドをヌクレオチド付加および脱保護の別のサイクルにかける。本発明の一態様によれば、3’-O-保護基は電気化学的に不安定な基である。すなわち、保護基の脱保護または切断は、切断をもたらす保護基の近傍の電気化学的条件を変化させることによって達成される。このような電気化学的条件の変化は、補助種を活性化させる電圧差または光などの物理量を変更または適用することによってもたらされることがあり、これは次に、保護基の部位でpHの増加または減少などの電気化学的条件の変化を引き起こす。一部の実施形態では、電気化学的に不安定な基には、例えば、pHが所定の値に変更されるたびに切断されるpH感受性保護基が含まれる。他の実施形態では、電気化学的に不安定な基には、例えば、保護基の部位で電圧差を増加または低下させることによって、還元条件または酸化条件が変更されるたびに直接切断される保護基が含まれる。
【0032】
本明細書において、「開始剤」(または同等の用語、例えば、「開始断片」、「開始剤核酸」、「開始剤オリゴヌクレオチド」など)は、通常、TdTなどのテンプレートフリーポリメラーゼによってさらに伸長することができる遊離3’末端を有する短いオリゴヌクレオチド配列を指す。一実施形態では、開始断片はDNA開始断片である。代替実施形態では、開始断片はRNA開始断片である。一部の実施形態では、開始断片は、3~100ヌクレオチド、特に3~20ヌクレオチドを有する。一部の実施形態では、開始断片は一本鎖である。代替実施形態では、開始断片は二本鎖である。一部の実施形態では、開始剤は、TdTが3’-O-保護dNTPに結合する可能性のある遊離ヒドロキシルを有する非核酸化合物を含むことがある、例えば、Baiga、米国特許出願公開第2019/0078065号および同第2019/0078126号。
【0033】
図1Aに戻ると、一部の実施形態では、ヌクレオチドの順序付けられた配列は、各合成ステップで3’-O-保護dNTPの存在下、TdTなどのテンプレートフリーポリメラーゼを使用して開始剤の核酸に結合される。一部の実施形態では、オリゴヌクレオチドを合成する方法は、(a)遊離3’-ヒドロキシルを有する開始剤を提供するステップ;(b)延長条件下、遊離3’-ヒドロキシルを有する開始剤または延長中間体とテンプレートフリーポリメラーゼを3’-O保護ヌクレオシド三リン酸の存在下で反応させて、3’-O-保護された延長中間体を生成するステップ;(c)延長中間体を脱保護して遊離3’-ヒドロキシルを含む延長中間体を生成するステップ;および(d)ポリヌクレオチドが合成されるまでステップ(b)と(c)を繰り返すステップを含む。(「延長中間体」、「延長生成物」および「伸長断片」という用語は同義的に使用される)。一部の実施形態では、開始剤は、例えばその5’末端で固相支持体に付着したオリゴヌクレオチドとして提供される。上記の方法は、脱保護ステップの後だけでなく、反応ステップ、または延長ステップの後に洗浄ステップを含んでもよい。例えば、反応ステップは、所定のインキュベーション期間または反応時間の後に、例えば洗浄によって、取り込まれていないヌクレオシド三リン酸を除去するサブステップを含んでもよい。そのような所定のインキュベーション期間または反応時間は、数秒、例えば30秒から数分、例えば30分であってよい。
【0034】
本発明で用いられる3’-O-ブロック化dNTPは、商業ベンダーから購入してもよいし、公開された技術を使用して合成してもよい、例えば、米国特許第7057026号;Guoら、Proc.Natl.Acad.Sci.、105(27):9145-9150(2008);Benner、米国特許第7544794号。
【0035】
上記の方法は、脱保護ステップの後だけでなく、反応ステップ、または延長ステップの後に、1または複数のキャッピングステップ、ならびに洗浄ステップを含んでいてもよい。上記のように、一部の実施形態では、キャッピングされた鎖のさらなる延長を防ぐ化合物と延長されていない遊離3’-ヒドロキシルを反応させるキャッピングステップが含まれてよい。一部の実施形態では、そのような化合物は、ジデオキシヌクレオシド三リン酸であってよい。他の実施形態では、遊離3’-ヒドロキシルを有する延長されていない鎖は、それらを3’-エキソヌクレアーゼ活性、例えばExo Iで処理することによって分解され得る。例えば、Hyman、米国特許第5436143号を参照されたい。同様に、一部の実施形態では、脱ブロック化されなかった鎖は、鎖を除去するか、またはさらなる延長部に対してそれを不活性化するように処理することができる。
【0036】
一部の実施形態では、延長または伸長ステップの反応条件は、以下を含むことがある:2.0μMの精製TdT;125~600μMの3’-O-保護dNTP(例えば3’-O-NH-保護dNTP);約10~約500mMのカコジル酸カリウム緩衝液(pH6.5~7.5)および約0.01~約10mMの二価カチオン(例えば、CoClまたはMnCl)、ここで伸長反応は、50μLの反応体積中、室温から45℃の範囲内の温度で3分間実施されてよい。
【0037】
酵素核酸合成は、化学合成よりも長く、純度の高いDNA断片を、化学合成よりも速く合成することを可能にする。サイクル時間係数は、スループットを15倍から20倍に増やすことが可能であるため、データ保存にとって特に興味深い。また、水性媒体で合成を行うことにより、環境に優しく(合成時に有機溶媒を使用しない)、装置使用の簡略化(環境を制御する必要がない)、化学廃棄物管理設備の必要性がなくなる。
【0038】
本発明は、ここで、この酵素合成プロセスを改善して、大規模並列合成を可能にすることを提案する。第1の態様では、本発明は、pH制御された脱保護と互換性のあるプロセスを提供する。
B.並列酵素ポリヌクレオチド合成に対するアプローチ
【0039】
一態様では、本発明は、各々が所定のヌクレオチド配列を有する複数の異なるポリヌクレオチドの高度並列テンプレートフリー酵素合成のための方法および装置を提供する。一部の実施形態では、並列合成は、別個のポリヌクレオチドが合成される、別個の、重複しない、アドレス可能な部位を有する支持体と、他の部位とは独立に、各部位で電気化学的条件を制御するための手段とを提供することによって実施される。一部の実施形態では、そのような並列合成支持体は、規則的なパターンのアドレス可能部位、例えば直線パターンの部位、または六角形パターンの部位などを有する平面支持体である。一部の実施形態では、平面支持体の各部位は1またはそれを超える電極に関連しており、その電気的特性は、平面支持体の他の電極とは独立にアドレス可能な方法で制御することができる。一部の実施形態では、そのような平面支持体は、少なくとも256部位、少なくとも512部位、少なくとも1024部位、少なくとも5000部位、少なくとも10,000部位、少なくとも25,000部位、または少なくとも100,000部位、さらに10,000,000もの部位を含む複数の部位を有する。一部の実施形態では、そのような平面支持体は、1000、または10,000、または25,000、または50,000、または100,000、または500,000を超える複数の部位を有し、1,000,000までの部位または10,000,000までの部位を有する。一部の実施形態では、そのような平面支持体の部位は、規則的なアレイに配置され、各部位は、平面支持体によって集積された少なくとも1つの電極に関連している。一部の実施形態では、合成および/またはシーケンシングがそれぞれ行われる別個の部位は、25μm~1000μm、または1μm~1000μm、または10μm~1000μm、または100μm~1000μmの面積を有する。一部の実施形態では、各部位で合成されるポリヌクレオチドの量は、少なくとも10-6fmol、または少なくとも10-3fmol、または少なくとも1fmol、または少なくとも1pmolであるか、あるいは、各部位で合成されるポリヌクレオチドの量は、10-6fmol~1fmol、または10-3fmol~1fmol、または1fmol~1pmol、または10-6pmol~10pmol、または10-6pmol~1pmolの範囲内である。一部の実施形態では、各部位で合成されるポリヌクレオチドの数は、1000分子~10分子、または1000分子~10分子、または1000分子~1012分子の範囲内である。
【0040】
一部の実施形態では、各反応部位で酵素によって合成されたポリヌクレオチドの長さは、50~500ヌクレオチドの範囲である。他の実施形態では、そのようなポリヌクレオチドの長さは50~1000ヌクレオチドの範囲である。
【0041】
図1Bは、特定の光照射または電極活性化のいずれかに対してアドレス可能な別個の部位での複数のポリヌクレオチドの並列合成の一実施形態のステップを説明する。一部の実施形態では、アレイは、個々の電極を、アレイの任意の所与作用電極と対電極との間に所定の電圧差を生じるように制御することができる、アドレス可能な電極アレイである。アレイ(120)は、各部位(122)が、保護された3’-ヒドロキシル(暗い円盤として示される)を有する開始剤または伸長断片を含むように提供される。合成サイクルを開始するために、選択された部位(次のモノマーがAであるポリヌクレオチドに対応する部位)の開始剤または伸長断片の3’-ヒドロキシルを、選択された部位の位置に制限することができる脱保護方法を使用して脱保護(121)する(開いた空いた円盤として示される)。下でより詳細に説明されるように、一部の実施形態では、そのような局所的な脱保護は、局所的な光化学反応によって、または部位特異的電極を使用する電圧差の局所的な変化によってもたらされ得る。選択的に脱保護された部位に、3’-O-保護dATP(124)を含む試薬が添加され、TdTなどのテンプレートフリーのポリメラーゼが脱保護された部位に送達される。以下に簡単に説明するように、合成試薬は、アレイ全体にわたる単純なバルクフローによるか、個々の部位へのインクジェットデバイスによる液滴送達など、多様な方法で送達されてよい。カップリング反応を完了または適当な程度に前進させる所定の時間が経過した後、アレイを洗浄し、選択された部位の次のグループのポリヌクレオチド(Cが次のモノマーであるもの)の3’-ヒドロキシルを脱保護する。選択的に脱保護された部位に、3’-O-保護dCTP(128)を含む試薬が添加され、TdTなどのテンプレートフリーのポリメラーゼが脱保護された部位に送達される。サイクルが完了するまで、同様のステップがdGTP(130)およびdTTP(132)に対して行われる。ポリヌクレオチドが完成するまで、このサイクルを繰り返す(134)。
光誘起脱保護。
【0042】
一部の実施形態では、本発明のプロセスは、局所的に脱保護するために光生成酸による光誘起脱保護を使用する、例えば、Gaoら、米国特許第6426184号、同第7491680号および同第7838466号。有利には、オリゴヌクレオチドは、今日の合成によりシーケンシングすること(SBS)に使用されているものと非常によく似ているフローセルで合成される。SBSは、さらなる重合をブロックするターミネーターを含む修飾dNTPを使用する。そのため、ポリメラーゼ酵素は、成長する各DNAまたはRNAコピー鎖に1つの塩基しか追加できない。シーケンシング反応は、固体表面に広がる非常に多数の異なるテンプレート分子に対して同時に実行される。テンプレートに4つのdNTPを追加した後、ターミネーターが削除される。この化学は「可逆的ターミネーター」と呼ばれる。最後に、別の4サイクルのdNTP追加が開始される。1つの塩基がすべてのテンプレートに均一に追加されるため、シーケンシングプロセスにより、均一な長さのDNA/RNAシーケンスリードのセットが生成される。有利には、DNA/RNAサンプルは、それぞれ約200塩基長の小片への断片化によって「シーケンシングライブラリー」に調製される。カスタムアダプターを両端に追加し、ライブラリーを固体表面(「フローセル」)を横切って流すと、テンプレート断片がこの表面に結合する。これに続いて、固相「ブリッジ増幅」PCRプロセス(クラスター生成)により、フローセル表面上の密接な物理的クラスターにおよそ100万コピーの各テンプレートが作成される。
【0043】
本発明の一部の実施形態では、SBSによる合成後にチップを直接読み取って、確実にコード化を成功させることができる。一部の実施形態では、チップはおよそ50cmであり得る。チップは、30μm、5μm、さらには1μmのマイクロウェルのグリッドを有する。5μmのピッチの場合は、ウェルの総数は2億個になり、1μmのピッチの場合は、チップは50億個のマイクロウェルを有する。オリゴヌクレオチドは、直接、ウェルの底にグラフトするか、または1つのチップに1つのビーズだけが存在するようにチップに充填されるビーズにグラフトすることができる。脱保護は、デジタルマイクロミラーデバイス(DMD)を使用して、選択したウェル内の光生成酸によって制御することによって行うことができる。
【0044】
一部の実施形態では、合成したオリゴヌクレオチドは、最大400ヌクレオチド長となる。それがデュアルペアエンドリードを使用する合成によりシーケンシングすることで容易に読み取れる最大長さであるためである。データ密度はインデックス形成を行うとオリゴヌクレオチドの割合が低くなるため、オリゴの長さを化学200ntより大きくすることにより、チップ上のデータ密度を高くすることができる。あるいは、合成純度がそれを可能にするならば、合成される長さを増やし、200ヌクレオチドごとに中間プライマーを追加してシーケンシングを容易にし、オリゴヌクレオチドを順次シーケンシングすることも可能であり得る。
【0045】
ウェル間の距離が5μmの1つのフローセルにより、以下が可能になる:
・2億個の400ntオリゴヌクレオチドの並列
・7時間でチップ全体を印刷(80 000 000 000nt)
・コード化システムで1.5ビット/サイクル(下記参照)
・15GB/フローセル
ウェル間のピッチが1μmである(50億個のオリゴヌクレオチドが並列している)場合、保存されるデータ量は375GBであり、これを3回実行すると、1つの機器で1TB以上を合成することが可能になる。
【0046】
フローセルは、UV脱保護およびシーケンシングを可能にするために透明であることが好ましい。必要なDMDの数は、有利には少なくとも50であり得る。ウェルの数を増やし、共焦点レンズを使用してピッチを1μmに縮小し、密度を増加させるために、DMDの数は50以上であることが好ましい。
【0047】
局所的なpH変化の生成における1つの課題は、H3O+イオンの拡散である。汚染を防ぐために、脱保護の間に照射されていないウェルと照射されたウェルでpHは可能な限り安定しているべきである。有利には、脱保護の間、照射されたウェルのpHは4,5~5,8の間であるが、非照射ウェルではpHは約6に維持される。
【0048】
保存されるデータの量をさらに増やすために、非常に迅速に脱保護される光不安定性ヌクレオチドを開発することが可能である(最大約1秒の脱保護)。酵素技術は非常に堅牢で、オープン環境で使用することができるため、フローセルの代わりにテープ上でDNA/RNAを合成することも可能である。
電気化学的脱保護。
【0049】
あるいは、またはpH変化の局所的な光化学的生成に加えて、電極での電位の制御された変化を使用して、電気化学的に不安定な基を直接に、または間接的に切断することができる。例えば、pH感受性保護基は、局所的な電圧差を制御することによりその酸化還元状態を変化させ得る電気活性化合物を用いることによって、電圧の変化を使用して間接的に切断することができ、それにより局所的なpHに影響を及ぼす電子を開放する。例えば、Southern、米国特許第5667667号;Egeland and Southern、米国特許出願公開第2004/0238369号;Egelandら、Nucleic Acids Research、33(14):e125(2005);Maurerら、米国特許第9267213号;Fominaら、LabChip、16:2236-2244(2016)。さらに、例えば、CMOSチップ技術または他の半導体技術を使用して作製された電極アレイを用いることによって、大規模な電気化学的脱保護を可能にするチップを使用することができる。この技術の利点には、以下が挙げられる。
・超大規模合成を可能にするピッチ縮小
・チップのスタック性
・1μmビーズ上での合成および保存
・Ion Torrentなどの半導体シーケンシングプラットフォームを使用するシーケンシング
CMOSチップは、個々にアクセス可能な部位に電流または光を生成することにより、すべての合成部位を制御する。誘導された電流または光は、それぞれ電気化学または光化学と結合して、局所的にプロトンを生成し、pHを低下させることができる。一部の実施形態では、光化学的に生成された酸と電気化学的に生成された酸の両方を使用して、合成および/またはシーケンシングプロセスで3’-ヒドロキシルを脱保護する。
【0050】
一部の実施形態では、電極アレイ上の各部位は、Levineら(上記で引用済み)またはMetrohmアプリケーションノートEC08に記載されているように、ポテンショスタットおよび/またはガルバノスタット電気化学セル(6001)として構成され得る。定電位モードでは、図6Aに図示するポテンショスタット/ガルバノスタット(PGSTAT)回路(6000)は、作用電極(WE)(6004)と参照電極(RE)(6006)との間の電位差が十分に定義され、ユーザーによって指定された値に対応するように、作用電極(WE)(6004)に対する対電極(CE)(6002)の電位を正確に制御する。定電流モードでは、WE(6004)とCE(6002)の間の電流が制御される。RE(6006)とWE(6004)の間の電位差、およびCE(6002)とWE(6004)の間を流れる電流は継続的に監視される。PGSTATを使用することにより、負のフィードバック機構を使用して、測定中はいつでも、ユーザーが指定した値(つまり、印加電位または電流)が正確に制御される。
【0051】
図から分かるように、CE(6002)は、制御増幅器(CA)(6008)と呼ばれる電子ブロックの出力に接続されている。制御増幅器は、電流をセルに強制的に流す。電流の値は、低電流および高電流について、それぞれ、電流フォロワ(LowCF)(6010)またはシャント(HighCR)(6012)を使用して測定される。電位差は、常にRE(6006)とS(6014)の間で差動増幅器(Diffamp)(6016)によって測定される。機器が使用されるモード(定電位または定電流)に応じて、PSTAT/GSTATスイッチ(6018)が適宜に設定される。次に、信号は総和点(Summation Point)(+)(6020)に送られ、デジタル-アナログ変換器(Ein)(6022)によって設定された波形とともに、制御増幅器の入力として使用される。
【0052】
対電極(補助電極としても公知)は、電気化学セルの電流回路を閉じるために使用される電極である。それは通常、不活性材料(例えばPt、Au、グラファイト、ガラス状炭素)で作製されており、通常、電気化学的反応には関与しない。電流はWE(6004)とCE(6002)の間を流れているため、CEの総表面積(電子の源/シンク)は一般にWEの面積よりも大きく、電気化学的プロセスの反応速度論の制限要因にはならない。
【0053】
参照電極は、安定した周知の電極電位を有する電極であり、電位の制御および測定のための電気化学セルの参照点として使用される。参照電極電位の高い安定性は、通常、酸化還元反応の各参加物質の濃度が一定(緩衝化または飽和)の酸化還元系を採用することで達成される。さらに、参照電極を通る電流はゼロ(理想的にはゼロ)に近い状態に保たれる。これは、電位計の入力インピーダンスが非常に高い(>100GOhm)ことと共に、CEを使用してセル内の電流回路を閉じることによって実現される。
【0054】
作用電極は、対象の反応が発生している電気化学系の電極である。一般的な作用電極は、Au、Ag、Pt、グラッシーカーボン(GC)、Hgドロップ電極、フィルム電極などの不活性材料で作製することができる。作用電極(6004)は、テンプレートフリー酵素ポリヌクレオチド合成の開始剤などの分子を付着させるためのコーティングを含み得る。
【0055】
2電極設定。2電極セルの設定では、CE(6002)とRE(6006)が電極の一方で短絡されているのに対して、WE(6004)とS(6014)が反対側の電極で短絡されている。完全なセル全体の電位が測定される。これには、CE/電解質界面および電解質自体からの寄与が含まれる。したがって、WE(6004)の電気化学的界面における界面電位の正確な制御が重要ではなく、セル全体の挙動が調査中である場合はいつでも2電極構成を使用することができる。
【0056】
3電極設定。3電極設定は、電気化学で使用される最も一般的な電気化学セルの設定である。この場合、CE(6002)とWE(6004)の間に電流が流れる。電位差は、WE(6004)とCE(6002)との間で制御され、RE(6006)(好ましくはWE(6004)に近接して保持されている)とS(6014)との間で測定される。WE(6004)はS(6014)と接続されており、WE(6004)は擬似接地(固定された安定した電位)に保たれるため、CE(6002)の分極を制御することによって、RE(6006)とWE(6004)との間の電位差は常時制御されている。WE(6004)とCE(6002)の間の電位は、通常、測定されない。これは、制御増幅器(6008)によって印加される電圧であり、機器のコンプライアンス電圧によって制限される。それはWE(6004)とRE(6006)の電位差が、ユーザーによって指定された電位差と等しくなるように調整される。この構成により、WE(6004)の電気化学的界面の電位をRE(6006)に対して制御することができる。
【0057】
回路支持基板、特にCMOSに形成された、複数の個々にアドレス可能な電極を含む大規模電極アレイは、ホスホロアミダイトに基づく合成のために、そしてセンサ用途のために構築されてきた。例えばMontgomery、米国特許第6093302号、同第6444111号および同第6280595号;Gindilis、米国特許第9339782号;Maurerら、米国特許第9267213号;Maurerら、PLosOne、2006年12月、第1号、e34;Fominaら、LabChip、16:2236-2244(2016);Kavusiら、米国特許第9075041号;Johnsonら、米国特許第9874538号および同第9910008号;Gordonら、米国特許第6251595号;Levineら、など、IEEE J.Solid State Circuits、43:1859-1871(2008)など。これらの参考文献は、アレイ部位での電極数、サイズ、組成および構成;電圧および電流の制御および測定のためのCMOS電気回路;アレイの作製および操作;アレイ部位で化学成分(例えば、開始剤など)を付着または固定化するための方法論などの特徴に関して、本発明の特定の実施形態の設計のためのガイダンスを提供する。
【0058】
特に興味深いのは、Morimotoら、Anal.Chem.80:905-914(2008);Levineら(上記で引用済み);およびFominaら(上記で引用済み)に記載される電極構成、ならびに、特にLevineら、およびFominaらに記載されるCMOS技術によるその実装である。本発明の一部の実施形態では、CMOS基板内の複数の個々にアドレス可能な作用電極を含む電極アレイが提供される。この作用電極は参照電極および対電極と作動的に関連しており、後者はCMOS電極アレイに搭載されていてもよいし、それから分離されていてもよい。CMOS電気回路は、作用電極と1または複数の対電極との間の電圧を調製して、選択した作用電極と参照電極の間に所望の電圧差を確立し維持することができるように構成されている。電気化学的に不安定な保護基を切断するために、所望の電圧差を選択した作用電極で変更することができる。
酵素合成と電気化学的脱保護の組合せ。
【0059】
一態様では、本発明は、pH低下によって、特別に制御された脱保護を誘導するための異なる方法を、酵素によるDNA合成技術と組み合わせるための解決策を提供する。酵素合成は水性媒体に完全に対応する。化学、電気化学、または光化学のほとんどは、物理的な作動は水性媒体でのみ機能しているにもかかわらず、pHの変化を可能にする。本発明は、pH変化のための適切な化学、および酵素合成のための適切な緩衝液、試薬、および保護基を開発することによって、これらの2つの面を対応させるための技術的解決策を提供している。そのため、実施形態の一つでは、制御可能な化学は、DNA合成およびフローセルチップ表面化学と互換性がある。
【0060】
ホスホロアミダイトに基づく合成において、DMT保護基を除去するために、反応部位に隣接する電極での電気化学的、または誘導的脱保護、すなわち、電圧の変化の使用が用いられてきた。例えばEgelandら、Nucleic Acids Research、33(14):e125(2005);Montgomery(上記で引用済み)。本発明は、一部分、酵素合成に特異的な保護基の電気化学的脱保護を使用して並列テンプレートフリー酵素ポリヌクレオチド合成を達成され得るという発見および認識である。特に、3’-O-アジドメチル保護基は、直接還元により切断されることがあり、3’-O-アミノ保護基は電気活性中間化合物を経由して局所的なpHを調整することにより間接的に切断されることがある。例えば、後者の場合、一部の実施形態では、典型的な脱保護溶液は、700mMの亜硝酸ナトリウム(NaNO2)およびHClでpH5.0~5.5に滴定した1M酢酸ナトリウムである。アレイの反応部位での3’-O-NH2基の局所的な脱保護は、局所的なpHをpH7からpH5に低下させることによって行うことができる。
【0061】
本発明の方法を実施するための装置。本発明の方法を実施するための装置の構成要素は、図6Bに図示されている。フローセルおよび電極アレイ(600)は反応部位のアレイを含み、反応部位の各々は、マイクロウェル、開始剤または他の成分の付着を強化するためのコーティングを含んでよく、反応部位の各々は1またはそれを超える電極と作動的に関連している。一部の実施形態では、電極アレイは、単一のチップとしてCMOSの制御および測定電気回路に集積されている。フローセルは、電極アレイ上の試薬の経路および流量を制御するための多様な設計を有することができる。一部の実施形態では、フローセルはマイクロ流体デバイスである。すなわち、それは、追加の流体通路、チャンバなどを含むように、微細加工技術または精密成形によって作製されてよい。一態様では、フローセルは、電極アレイ(607)上の試薬の流路を規定するための入口(602)、出口(603)、およびフローチャンバ(605)を備える。試薬は、フローセルおよびセンサアレイ(600)を出た後、廃棄物容器(606)に廃棄される。この実施形態によれば、装置の機能は、フローセルおよび電極アレイ(600)に、所定の順序で、所定の持続時間、所定の流量で、異なる試薬を送達すること、ならびに、必要に応じて、電極部位で行われている反応の状態についての情報をもたらす物理的および/または化学的パラメータを測定することである。この目的のために、フルイディクス制御装置(fluidics controller)(618)は、ライン(620および622)によって、複数の試薬(614)(例えば、適切な緩衝液および1または複数の脱保護溶液中の3’-O-保護dNTPおよび/またはテンプレートフリーポリメラーゼ)の駆動力およびバルブ(例えば、612および616)の操作を、従来の機器制御ソフトウェア、例えばLab View(National Instruments、テキサス州オースティン)によって制御する。
【0062】
試薬は、ポンプ、ガス圧、または他の従来の方法によって、流体経路、バルブ、およびフローセルを通して駆動されてよい。一部の実施形態では、単一の参照電極(608)は、フローセルおよびセンサーアレイ(600)の上流に配置されてよい。他の実施形態では、参照電極は、フローチャンバ内に配置されてよい。一部の実施形態では、単一の流体または試薬は、多段階反応の全体を通して参照電極(608)に接触している。これは、試薬(614)が通路(609)を通ってフローセル(605)に向けられる図6Bに示される構成で達成され得る。これらの試薬が流れる時、バルブ(612)が閉じられ、それにより洗浄液が通路(609)に流れ込むことが防止される。洗浄液の流れは停止するが、参照電極、通路(609)、および電極アレイ(607)の間の流体連絡および電気通信はなお途切れない。多くの試薬(614)は、通路(609)を通って流れるときに通路(611)に拡散するが、参照電極(608)と、通路(609)と(611)の間の接合部との間の距離は、共通通路(609)を流れる試薬の量が参照電極(608)にほとんどまたは全く到達しないように選択されている。図6Bおよび他の図は、電極(例えば、参照電極、608)を流体通路(例えば、611)と同心の円筒として示しているが、(608)などの参照電極は、様々な異なる形状を有し得る。例えば、それは(611)の内腔に挿入されたワイヤであり得る。一態様では、参照電極(608)は、ステンレス鋼、金などの導電性材料で作製された通路(612)の部分を構成する。一部の実施形態では、材料は、それに接触する試薬に対して不活性である。一実施形態での参照電極(608)は、通路(612)の一部を形成する導電性材料で作製された管である。
【0063】
参照電圧の電位は、電極と、電極が接触している溶液との間の界面に依存する。例えば、異なるヌクレオシド三リン酸の溶液は、参照電圧を変化させ、それにより作用電極で望ましくない変化を引き起こすことがある。頻繁な洗浄ステップを使用する多段階反応の場合、洗浄液(610)は、図6Bに図示する参照電極(608)と連続的に接触する試薬として選択されもよい。
【0064】
この実施形態のさらなる構成要素には、バイアス電圧(作用電極と対電極(621)との間の電位を制御するためなど、アレイ(607)に集積されていてもいなくてもよい)および電極アレイへのタイミング信号と制御信号(そのような構成要素が電極アレイに一体化されていない場合)を提供するための、さらに、出力信号を収集および/または処理するための、アレイ制御装置(624)が含まれる。フローセルおよび電極アレイ(600)からの情報、ならびに機器の設定および制御は、ユーザーインターフェース(628)によって表示され、入力され得る。一部の実施形態、例えば、核酸合成および/またはシーケンシングの場合、フローセルおよびセンサアレイ(600)の温度は、既知温度、好ましくは、所定の温度で反応が起こり、測定が行われるように制御される。そのような温度は、ペルチェ素子などの従来の温度制御デバイスによって制御することができる。一態様では、温度は、フローセルを流れる試薬の温度を制御することによって便利に制御される。装置のフローセルおよび流体回路は、多様な方法および材料によって製造することができる。材料を選択する際に考慮すべき要因には、必要とされる化学的不活性度、温度などの動作条件、送達される試薬の量、基準電圧が必要かどうか、製造可能性などが含まれる。小規模な流体送達のために、マイクロフルイディクス作製技術は、本発明のフルイディクス回路を作製するのに非常に適しており、そのような技術のガイダンスは、当業者であれば容易に入手可能である、例えば、Malloy、Plastic Part Design for Injection Molding:An Introduction(Hanser Gardner Publications、1994);Heroldら編、Lab-on-a-Chip Technology(第1巻):Fabrication and Microfluidics(Caister Academic Press、2009)など。メソスケールおよびより大規模な流体送達の場合、従来の機械加工技術を使用して、本発明のフローセルまたは流体回路に組み立てることができる部品を作製することができる。一態様では、ポリカーボネート、ポリメタクリル酸メチルなどのプラスチックを使用して、本発明のフローセルおよびフルイディクス回路を作製してよい。
【0065】
図6Cは、いくつかの試薬がインクジェット液滴発生器を使用して反応部位に送達される、本発明の方法を実施するための代替装置を図で示す。上記の設計機能の多くは、この実施形態に適用可能である。上記のように、フローセルおよび電極アレイ(650)は反応部位のアレイを含み、反応部位の各々は、マイクロウェル、開始剤または他の成分の付着を強化するためのコーティングを含んでよく、反応部位の各々は1またはそれを超える電極と作動的に関連している。上記のように、一部の実施形態では、電極アレイは、単一のチップとしてCMOSの制御および測定電気回路に集積されていてもよい。フローセルは、電極アレイ上の試薬の経路および流量を制御するための様々な設計を有することができる。しかし、図6Bの装置とは異なり、ここでは、電極アレイの反応部位は、プリントヘッド(680)による試薬含有液滴の送達のためにアクセス可能でなければならない。一態様では、フローセルは、電極アレイ(657)上の試薬(プリントヘッド(680)によって送達されない)の流路を規定するための入口(652)、出口(653)、およびフローチャンバ(655)を備える。試薬は、フローセルおよびセンサアレイ(650)を出た後、廃棄物容器(656)に廃棄される。この実施形態によれば、装置の機能は、入口(652)またはプリントヘッド(680)のいずれかを介して、フローセルおよび電極アレイ(650)に、所定の順序で、所定の持続時間、所定の流量で、異なる試薬を送達すること、ならびに、必要に応じて、電極または反応部位で行われている反応の状態についての情報をもたらす物理的および/または化学的パラメータを測定することである。この目的のために、フルイディクス制御装置(658)は、ライン(671a、6711b、および671c)によって、バルブ(660aおよび660b)およびプリントヘッド(680)を制御する。バルブ(660aおよび660b)は、洗浄液(661)および脱保護溶液(662)(必要な場合)のフローセル(657)への送達を制御する。インクジェット送達システムの設計および制御のためのガイダンスは、当業者に周知であり、米国特許出願公開第2003/0170698号および国特許第6306599号;同第6323043号;同第7276336号;同第7534561号などに見出すことができる。
【0066】
一部の実施形態では、単一の参照電極(608)は、フローセルおよびセンサーアレイ(600)の上流に配置されてよい。他の実施形態では、参照電極は、フローチャンバ内に配置されてよい。一部の実施形態では、単一の対電極(663)が用いられてもよく、他の実施形態では、複数の対電極が用いられてもよい。そして、記載されるように、上記のそのような対電極は、アレイ(657)の作用電極と同じ電子基板上に集積されていてもよいし、集積されていなくてもよい。
装置は、破線(671、672、および673)によって示されるように、フルイディクス/インクジェット制御装置(665)およびアレイ制御装置(690)によって合成ステップを作動および監視するユーザーインターフェース(692)によって制御される。特に、温度などの物理的パラメータ、および電極選択、電圧制御、センサ読み出しなどのための電気回路は、アレイコントローラ(690)によって扱われ、試薬(696)、液滴速度、ヘッドの動きなどの選択は、フルイディクス/インクジェット制御装置(665)によって制御される。一部の実施形態では、3’-O-保護dNTPモノマーおよび/またはテンプレートフリーポリメラーゼの液滴送達の間、異なるモノマーを受け取る隣接する反応部位間の相互汚染を防ぐために、フローセル(655)が排出される可能性があるため、反応部位と参照電極(681)との間の電解質接続は切断される。一部の実施形態では、このような相互汚染は、例えばBrennan、米国特許第5474796号、同第6921636号などに記載されるように、洗浄液または脱保護液などの電解質がフローチャンバから後退するときに、反応部位の周りを疎水性領域で囲むようにして、各部位を分離された液滴で包囲させることによって回避することができる。特に、フローチャンバが脱保護溶液であふれると、連続電解質経路は、参照電極(681)、およびアレイ上(657)またはアレイ外のいずれかであり得る1または複数の対電極に復元される。
一部の実装形態では、作用電極と参照電極との間の電圧差の値は、水の電気分解などの望ましくない酸化還元反応を回避するように選択されるため、デバイスのフルイディクスに気泡が形成されない。一部の実施形態では、本発明において電気化学的反応をもたらす所定の電圧差は約1.5ボルトまたはそれ未満である。
【0067】
一部の実施形態では、図6Bおよび6Cの装置によって実装されるような本発明の方法は、(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤がその上に配置されているステップ;(b)ヌクレオチドの種類ごとに、(i)電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に電圧差を生成することにより、所定のアドレスの電極の開始剤または伸長断片を脱保護し、それによって所定のアドレスの電極の開始剤または伸長断片で遊離3’-ヒドロキシルを生成するステップ、および(ii)伸長条件下で、所定のアドレスの電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、その結果、所定のアドレスの開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するステップを含むサイクルを行うステップ;ならびに(c)所定の配列のポリヌクレオチドのアレイが完成するまでステップ(b)を繰り返すステップを含み得る。反応部位は、一般に、所定の配列を含む単一の種類のポリヌクレオチドが合成される基板上の別個の領域である。反応部位は、基板または表面上に明確に定義された位置を有し、それは通常、直線パターン、六角形パターンなどの規則的なパターンを形成するという意味で、空間的にアドレス可能である。各反応部位は、反応部位の電位または電圧が、関連する1またはそれを超える作用電極によって制御または決定され得るという意味で、少なくとも1つの作用電極と作動的に関連している。一般に、反応部位と作用電極は空間的に整列している。すなわち、電極が基板表面に埋め込まれたディスクまたは他の平面構造である場合、反応部位が占める面積は電極表面の面積に対応する。これは、反応部位で起こる反応において均一な電気的効果を確保するために有利である。反応部位は、基板またはフィルムを作用電極の表面上に含んでよく、例えば、そのような基板またはフィルムは、開始剤などの成分の付着および/または保持を容易にするために使用され得る。そのような基板および電極は、CMOSデバイスなどの半導体デバイスに集積され得る。ステップ(b)に関して、各種類のヌクレオチドについて示されたステップのサイクルの実行は、4つのヌクレオチドA、C、GおよびTに限定されることを意図するものではない。一部の実施形態では、各種類のヌクレオチドは、A、C、GおよびTのサブセットを意味する。他の実施形態では、各種類のヌクレオチドは、ポリヌクレオチドにおいて情報をコード化するのに有用であり得る非天然ヌクレオチドまたは他のヌクレオチド類似体を含み得る、拡張されたセットを意味する。様々なテンプレート非依存性DNAポリメラーゼを、本発明の方法で用いることができる。特に、例えば、Ybertら、国際公開第2019/030149号などに記載される末端デオキシヌクレオチジルトランスフェラーゼの変異体が用いられる。ステップ(b)のサイクルには、洗浄ステップなどのさらなるステップが含まれてよい。伸長条件は、用いられテンプレートフリーポリメラーゼの取り込み活性に必要または有用である緩衝液、塩、温度、補因子などを含む。
【0068】
一部の実施形態では、電気化学的に不安定な保護基は、pH感受性であってよく、pHは、作動電極と参照電極との間の電圧差によって調節されてよく、この電圧は、電気活性剤を活性化し、それは次にpHを変化させる。例えば、参照により本明細書に組み入れられる、Southern、米国特許第5667667号;Mauerら、米国特許第9267213号など。例示的な電気活性剤には、ハイドロキノン、ベンゾキノン、キノン、およびそれらの誘導体が含まれる。
【0069】
一部の実施形態では、電気化学的に不安定な保護基は、それ自体が酸化還元感受性であるため、作業電極と基準電極との間の電圧差は、電気化学的に不安定な保護基を還元状態に変換し、それによって前記電気化学的に不安定な保護基を切断することができる。特に、一部の実施形態では、酸化還元感受性3’-O-保護基はアジドメチルである。
【0070】
上記の装置または同様の装置を使用して、合成されたポリヌクレオチドにコードされた情報を保存し、取り出すことができる。ポリヌクレオチドにコードされた情報は、そのポリヌクレオチドをシーケンシングすることによって取り出すことができる。実質的にどんな核酸シーケンシング技術を使用してもよいが、一部の実施形態では、特に電極アレイ上でシーケンシングが行われる実施形態では、例えばBentleyら、Nature、456:53-59(2008);Rothbergら、Nature、475:348-352(2011);Raviら、Methods Mol Biol.1706:223-232(2018)などに開示されているように、シーケンシング・バイ・シンセシス技術が主な関心事である。一部の実施形態では、本発明の電極アレイ上のポリヌクレオチドは、切断可能な蛍光標識を有する可逆的ターミネーターなどの可逆的ターミネーターを用いるシーケンス・バイ・シンセシス(sequence-by-synthesis)アプローチを使用してシーケンシングされるかまたは読み取られる。そのようなシーケンシング方法は、参照により本明細書に組み込まれる以下の参考文献に記載されている。Wuら、Proc.Natl.Acad.Sci.、104(42):16462-16467(2007);Guoら、Acc.Chem.Res.43(4):551-563(2010);Juら、Proc.Natl.Acad.Sci.、103(52):19635-19640(2006);Guoら、Proc.Natl.Acad.Sci.、105(27):9145-9150(2008);Barnesら、米国特許第7057026号など。特に、一部の実施形態では、蛍光標識された3’-O-アジドメチルヌクレオシド三リン酸を有する可逆性ターミネーターが、本発明の電極アレイ上でポリヌクレオチドをシーケンシングするためのシーケンシング・バイ・シンセシス方法に用いられる。一部の実施形態では、取り込まれた3’-O-アジドメチルヌクレオチドは、ポリヌクレオチドテンプレート内の相補的ヌクレオチドの同一性を決定するために蛍光測定が行われた後に、電気化学的に脱ブロック化される。
【0071】
一部の実施形態では、ポリヌクレオチドに情報を保存し、そのようなポリヌクレオチドから情報を取り出すための方法は、以下のステップ:(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤がその上に配置されているステップ;(b)ヌクレオチドの種類ごとに、(i)電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に所定の電圧差を生成することにより、所定のアドレスの電極の開始剤または伸長断片を脱保護し、それによって所定のアドレスの電極の開始剤または伸長断片上に遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、所定のアドレスの電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、その結果、所定のアドレスの開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップ;(c)所定の配列のポリヌクレオチドのアレイが完成するまでステップ(b)を繰り返すステップであって、完成したポリヌクレオチドの各々が、5’から3’の方向に情報コード化領域を含み、その3’末端にシーケンシングプライマー結合部位を含むステップ;ならびに(d)シーケンシングプライマーをシーケンシングプライマー結合部位にアニーリングし、1またはそれを超える反応部位の完成したポリヌクレオチドの情報コード化領域を合成により配列決定することにより、情報コード化領域から情報を取り出すステップを含み得る。一部の実施形態では、情報コード化領域は、ポリヌクレオチドを処理または操作するための、追加のプライマー結合部位、制限部位などの他の機能を含み得る。
【0072】
一部の実施形態では、合成によりシーケンシングすることは、標識され可逆的にブロックされたヌクレオシド三リン酸をテンプレート依存性ポリメラーゼによって前記シーケンシングプライマーまたはその延長部に組み込み、組み込まれた標識され可逆的にブロックされたヌクレオシド三リン酸の同一性が反応部位のポリヌクレオチドの前記配列によって決定されるようにすることを含み得る。一部の実施形態では、標識され可逆的にブロックされたヌクレオシド三リン酸の標識およびブロッキング基は、標識され可逆的にブロックされたヌクレオシド三リン酸の別々の部分に結合されてよく、その結果、脱ブロック化および標識の除去を同じステップまたは異なるステップによって達成することができる。特に興味深いのは、所定のアドレスの各電極と参照電極との間に所定の電圧差を発生させることによって、所定のアドレスの反応部位において、延長されたシーケンシングプライマーから除去される3’-O-電気化学的に不安定なブロッキング基を含む、標識され可逆的にブロックされたヌクレオシド三リン酸塩である。このように、反応部位のすべてまたは所定のサブセットにあるポリヌクレオチドを、配列決定するか、または読み取ることができる。
【0073】
異なる保護基またはブロッキング基を切断するために用いられる電圧差は様々である可能性があるので、「所定の電圧差」とは、特定の効果、例えば、特定の基の切断をもたらす電気活性剤を介する所望の局所的なpH変化、またはその還元による特定の基の直接切断などをもたらすための特有の所定の電圧差を意味することが理解される。
【0074】
一部の実施形態では、別個の反応部位で少量のポリヌクレオチドを合成した後、それらを増幅して反応部位にさらに集合させるかまたは反応部位を充填することが有利であり得る。これは、ブリッジPCRなどの熱サイクルに依存する技術によって達成されてもよいし、リコンビナーゼポリメラーゼ増幅のテンプレートウォーキングなどの等温技術によって達成されてもよい。
【0075】
一部の実施形態では、アレイ上の反応部位の一部が、他の反応部位の開始剤上の保護基とは別個の(orthogonal)3’-O-電気化学的に不安定な保護基を含む開始剤を有していてもよいし、同じ反応部位内の開始剤の一部が、同じ反応部位の他の開始剤とは別個の3’-O-電気化学的に不安定な保護基を含んでいてもよい。2またはそれを超える保護基に関して「別個」とは、1つの保護基を切断するために使用される条件が他の保護基に影響を与えないこと、および各保護基の除去の条件についても同様である。
【0076】
一部の実施形態では、異なる反応部位にある少なくとも2つの完成したポリヌクレオチドは、異なる配列を含むシーケンシングプライマー結合部位を有するため、少なくとも2つの完成したポリヌクレオチドは、別々にシーケンシングすることができる。一部の例では、シーケンシングプライマー結合部位は、テンプレートフリー酵素合成によって結合され、他の実施形態では、そのようなプライマー結合部位は、合成されたポリヌクレオチドに連結され得る。
【0077】
一部の実施形態では、シーケンシングプライマー結合部位の異なる配列は、それらの対応する情報コード化領域でコードされた異なる情報に関連付けられている。そのような異なるシーケンシングプライマー結合部位は、アレイのポリヌクレオチドに保存された情報のサブセットにインデックスを形成することができる。
【0078】
図7A~7Dは、そのヌクレオチド配列が情報をコードしているポリヌクレオチドの情報を生成し、エラーを減らし、保存し、そしてそこから情報を取り出すための本発明の様々な実施形態を説明する。図7Aは、エラーの訂正を含む実施形態を示す。電極アレイ(700)は、電極(図示せず)に関連する単一の反応部位(702)、および遊離3’-ヒドロキシル、および、遊離3’-ヒドロキシルを残すように切断され得る不安定な結合またはヌクレオチド(706)を有する開始剤の配列(704)と共に示されている。一部の実施形態では、結合またはヌクレオチド(706)は電気化学的に不安定であるので、反応部位(702)で選択的に切断される場合がある。開始剤(704)は、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼを使用するテンプレートフリー酵素合成によって伸長されて(708)、全長ポリヌクレオチド(710)を生成し、その後、全長ポリヌクレオチド(710)は、それが所望の配列を有することを確認するために配列決定される。エラー(714)が判定されれば、ポリヌクレオチド(710)を不安定な結合Y(706)で選択的に切断してよく、代替ポリヌクレオチド(720)が再合成されてよい(718)。
【0079】
一部の実施形態では、合成のステップは、取り込み中にdNTPから放出される標識されたピロリン酸基(例えばFullerら、米国特許第7223541号)を検出することによって監視することができるため、(例えば)反応部位からの蛍光信号のプロファイルは、意図するヌクレオチドが成長するポリヌクレオチドに組み込まれたかどうか、およびもし存在する場合には誤った取り込みの程度を示すことになる。
【0080】
図7Bは、電極アレイの異なる反応部位が別個の保護基を含む開始剤を有する本発明の別の実施形態を示す。この実施形態の一つの応用では、ポリヌクレオチドは、反応部位の一部で開始剤上の第1の保護基のみを脱保護することにより、反応部位の一部のみで合成されることができ、この際、他の反応部位の第2の保護基は除去されない。代替実施形態では、別個の保護基を有する開始剤は同じ反応部位に集合させてよい。図7Bに示されるように、電極アレイ(722)は、それぞれ開始剤(725)および(727)を含む反応部位(724)および(726)を有する。開始剤(725)および(727)は、必要に応じて、それぞれ不安定な結合「Y」および「W」を含み、さらに、電気化学的に不安定な保護基、3’-O-NH2(728)および3’-O-CH2N3(730)をそれぞれ含む。保護基の1つ、例えば3’-O-NH2は除去されて、ポリヌクレオチド(732)が合成され得る(731)。シーケンシング(733)によってポリヌクレオチド(732)のエラー(734)が発見された場合、不正確な配列を含むポリヌクレオチドを必要に応じて切断し(735)、異なる反応部位の第2の保護基(730)を脱保護し、意図した配列を含むポリヌクレオチドを再合成(736)して、正しい配列のポリヌクレオチドを生成することができる(738)。あるいは、エラー(734)のあるポリヌクレオチド(732)は、アレイ(722)上に無傷のまま残されていてもよく、すなわち、切断されなくてもよく、そのアドレスまたは位置は不正確な配列を含むと注釈が付けられる場合がある。図7Aから7Bのエラー訂正スキームは、冗長性に依存するコード化スキームとともに使用されてもよいし、またはそれらは、保存された情報の所定のレベルの信頼性を確保するために必要な冗長性の量を減らすために使用されてもよい。
【0081】
図7Aおよび7Bの実施形態は、以下のステップ:(a)空間的にアドレス可能な反応部位のアレイを提供するステップであって、各反応部位が、少なくとも1つの作用電極と作動的に関連付けられていて、5’-末端で付着した、3’-O-電気化学的に不安定な保護基を有する開始剤をその上に配置しているステップ;(b)ヌクレオチドの種類ごとに、(i)電気化学的に不安定な保護基が切断されるように、所定のアドレスの電極の各々と参照電極との間に所定の電圧差を生成することにより、所定のアドレスの電極の開始剤または伸長断片を脱保護し、それによって所定のアドレスの電極の開始剤または伸長断片上に遊離3’-ヒドロキシルを生成し、(ii)伸長条件下で、所定のアドレスの電極と、3’-O-電気化学的に不安定な保護ヌクレオシド三リン酸およびテンプレート非依存性DNAポリメラーゼとを接触させ、その結果、所定のアドレスの開始剤または伸長断片が3’-電気化学的に不安定な保護ヌクレオシド三リン酸の取り込みによって伸長されて3’-O-電気化学的に不安定な保護された伸長断片を形成するサイクルを行うステップ;(c)所定の配列のポリヌクレオチドのアレイが完成するまでステップ(b)を繰り返すステップであって、完成したポリヌクレオチドの各々が、5’から3’の方向に情報コード化領域を含み、その3’末端にシーケンシングプライマー結合部位を含むステップ;ならびに(d)シーケンシングプライマーをシーケンシングプライマー結合部位にアニーリングし、1またはそれを超える反応部位の完成したポリヌクレオチドを合成によりシーケンシングすることにより、情報コード化領域から情報を取り出すステップで実施することができる。一部の実施形態では、各開始剤は、前記取り出した情報が合成エラーを示す場合はいつでも、開始剤を切断可能なヌクレオチドまたは切断可能な結合で切断することができるように、切断可能なヌクレオチドまたは切断可能な結合を含む。そのような切断の後、ポリヌクレオチドは、切断された開始剤から再合成することができる。一部の実施形態では、そのような切断可能な結合またはヌクレオチドは、電気化学的に不安定である。他の実施形態では、アレイの反応部位の一部は、アレイ上の他の反応部位の開始剤の他の3’-O-電気化学的に不安定な保護基に対して別個の3’-O-電気化学的に不安定な保護基を有する開始剤を含む。そのような実施形態では、方法は、前記取り出した情報が合成エラーを示す場合はいつでも、別個の3’-O-電気化学的に不安定な保護基を含む開始剤を有する少なくとも1つの反応部位で開始剤を脱保護するステップと、所定の配列のポリヌクレオチドを再合成するステップをさらに含む。すなわち、シーケンシングがエラーを示すときはいつでも、所望の正しい配列を含むポリヌクレオチドは、別個の保護基を有する開始剤を含む反応部位の部分の反応部位の1つで再合成される。不正確な配列を含むポリヌクレオチドは、切断されるか、または不正確な配列を有すると注記されることがあるが、それ以外はアレイから切断されない。
【0082】
一部の実施形態では、合成されたポリヌクレオチドは、電極アレイ上に保存される。つまり、合成後、ポリヌクレオチドはアレイ上に残り、アレイと一緒に保存される。ポリヌクレオチドにコードされた情報は、それらがアレイ上に留まっている間にその場でポリヌクレオチドをシーケンシングすることによるか、またはポリヌクレオチドをアレイから切断してシーケンシングすることによって取り出すことができる。
【0083】
図7Cは、反応部位(741)を有する電極アレイ(740)上のポリヌクレオチドを読み取るか、またはシーケンシングするための3つのスキームを示す。スキーム1では、情報コード化セクション(742)が合成された後、配列X(746)、ループ配列(748)、および配列X(746)の相補体である配列Z(750)を含む、自己相補的なヘアピン形成セクション(744)が合成される。アニーリング条件下、Z(750)は(746)にハイブリダイズして、延長された鎖(754)を生成するシーケンシング反応(752)が行われ得る。上記のように、結果として得られる二本鎖ポリヌクレオチドは、そのまま保存されてもよいし、別々に保存するためにアレイ(740)から切断されてもよい。一部の実施形態では、結果として得られる二本鎖ポリヌクレオチドは、例えば、シーケンシング反応が望ましくない付加物を残す場合には、シーケンシング反応で生成された相補鎖(754)を分離するために、取り出しプロセスにおいてヘアピン(744)で切断されてよい。スキーム1には、容易にアクセス可能な遊離3’または5’ヒドロキシルがないことにより、結果として得られる二本鎖ポリヌクレオチドがヌクレアーゼ消化に対してより耐性になるという利点がある。スキーム1には、(i)シーケンシングプライマーを必要とせず、(ii)部位特異的プライマーが選択されている場合、または電気化学的に不安定なブロック基がシーケンシングケミストリーで使用されている場合には、任意の反応部位での別々の読み取りが可能であるという利点がある。スキーム2は、ヘアピン(744)の代わりに、ポリヌクレオチド(755)にプライマー結合部位(756)が付加されていることを除いて、スキーム1と同様である。プライマー(760)をプライマー結合部位(756)にアニールし、シーケンシング反応を行って、ポリヌクレオチド(755)の配列を読み取る。スキーム2には、繰り返し読み取りがアレイ上で可能であるという利点がある。また、部位特異的プライマーが選択されている場合、または電気化学的に不安定なブロック基がシーケンシングケミストリーで使用されている場合には、任意の反応部位での別々の読み取りが可能であるという利点がある。
【0084】
スキーム3では、切断可能な結合(766)を含む開始剤でポリヌクレオチド(765)が合成された後、ポリヌクレオチド(765)が切断されて(768)、アレイ(740)とは別々に保存することができる鎖(770)が放出される。
【0085】
図7Dは、ポリヌクレオチド保存の構成を概説する。パネル1)は、最も単純なストレージ構成を示している。すなわち、ポリヌクレオチド(777)がアレイ(774)上で合成された後、アレイとポリヌクレオチドの両方が、ポリヌクレオチド(777)を切断することなく一緒に保存される。パネル2)の構成は、合成後にポリヌクレオチド(790)が切断され(776)、アレイなしで保存されることを除いて、パネル1)の構成と同様である。パネル3)および4)の構成は、それぞれ合成スキーム1および2に対応する。両方の構成とも、コードされた情報の安全性を高めるために鎖を別々に保存することを可能にするという利点を有する二本鎖ポリヌクレオチドをもたらす。
C.その他の合成に関する考慮事項。
【0086】
エラー訂正プロセス。予想されるエラーの最大の原因は、脱プリンである。酸性条件下でのDNA塩基のこの分解により、DNA鎖に脱塩基部位が残る。配列決定すると、これらは4つの塩基とSBSの混合として現れ、扱いが難しい。グリコシラーゼ酵素を使用して、これらの脱塩基部位でオリゴヌクレオチドを切断することができる。それにより、オリゴヌクレオチドをシーケンシングで検出できなくなる(シーケンシングプライマーがない)ので、それらがデータを汚染することはなくなる。
【0087】
リセット合成(Reset synthesis)。500ntを超える断片が合成される場合、SBSの使用はそれらのシーケンシングには不十分である場合がある。したがって、本発明の目的は、長い断片、特に500ntを超える断片をシーケンシングする新しい方法を提供することである。この目的のために、本発明は、オリゴヌクレオチド内に1つまたはいくつかの中間シーケンシングプライマーを追加して、連続した、より短いオリゴヌクレオチドをシーケンシングすることを可能にすることを提案する。
【0088】
図2に示すように、オリゴヌクレオチド断片の「データ」は、いくつかのサブデータ断片(図2の「データ1」および「データ2」)に断片化することができる。シーケンシングする場合には、最初にアンチセンスシーケンシングプライマーおよびフォワードシーケンシングプライマー1とデュアルペアエンド(dual paried ends)(300ntリード-データ1、ランダムアクセスID、アドレス)を使用し、次にフォワードシーケンシングプライマー2(150nt-データ2)を使用して、このオリゴヌクレオチドをシーケンシングすることができる。これをいくつかの中間フォワードプライマーとともに使用して、必要な配列を読み取ることができる。これらのオリゴヌクレオチドをチップ上で合成するには、中間プライマーを1ヌクレオチドずつ合成するか、連結酵素を使用することが可能である。中間プライマーの後のエラーパターンは、以前と全く同じである。
【0089】
リセット合成を可能にするために、本発明は、特定のdUTP-ONH2可逆的ターミネーターヌクレオチドまたはrUTP-ONH2可逆的ターミネーターヌクレオチドも提供する。本発明はまた、これらの2つのヌクレオチドを許容され得る収率で組み込むことができる酵素変異体も提供する(例えば、国際公開第2017/216472号参照)。dUTP-ONH2は、15分間のUSER酵素ミックス:ウラシルDNAグリコシラーゼおよびエンドヌクレアーゼVIIIの作用を介して切断され得、rUTP-ONH2は、2時間のKOH 1Mの作用を介して切断され得る。結果として、オリゴヌクレオチドの配列中の任意の位置、特にデータセクションとシーケンシングプライマーセクションとの間にこれらのヌクレオチドを組み込み、データの異なる部分を解放して、単一の合成部位から個々のオリゴヌクレオチドを作製することが可能である。
【0090】
オリゴプールの作製。合成後、ライブラリーをオリゴプールの形で合成することが可能である。このプールを得るためには、次の2つの可能性がある。
-オリゴヌクレオチドを切断する
-チップ上で等温増幅を実行する
第2の解決策は、シーケンシングを容易にするためにDNA材料をチップ上に保持する可能性を提供する。
【0091】
以下に説明するように、オリゴヌクレオチドは、5’および3’末端にシーケンシングプライマーを有する場合がある。これらのプライマーのおかげで、このライブラリーの等温増幅が想定される。サイクル温度はチップにダメージを与える可能性があるため、標準的なPCRよりも等温増幅が好ましい。
D.シーケンシングワークフローと互換性のある核酸アレイの合成
【0092】
別の態様では、本発明は、シーケンシングワークフローと互換性のある新しい核酸アレイ合成を提供する。
【0093】
読み取りと書き込みに使用される化学は互換性がないため、DNAを合成し、その後に配列決定することは非常に面倒である。合成およびシーケンシングは、2つの非常に異なる技術(合成のための有機化学とシーケンシングのための酵素反応)を伴うため、これまで同じ機器で行われたことがない。例えば、ホスホロアミダイト化学に使用されるホスホロアミダイト試薬は、無水媒体中で操作する必要がある(非常に微量の水でも反応が効率的に行われなくなる)のに対し、シーケンシングは、合成によりシーケンシングすること、パイロシーケンシング、ナノポアシーケンシング、イオン半導体シーケンシングなどの場合は、水溶液中で行われる。合成されたDNAの配列は使用前に検証する必要があるため、業界にとってこれは課題である。これは、DNA/RNAがチップ上で合成される場合(マイクロアレイ産業またはオリゴプールの合成用)に特に当てはまる。
【0094】
シーケンシングと互換性のあるオンチップ合成。本発明は、シーケンシングと互換性のあるオンチップ合成を可能にすることにより、上記の問題に対する解決策を提供する。本発明によれば、DNA/RNA合成は、シーケンシング機器と互換性のあるフローセル上で酵素的に行われる。シーケンシングは、パイロシーケンシング、合成によりシーケンシングすること、およびイオン半導体シーケンシングにおいてシーケンシングする鎖に相補的なDNA鎖の酵素合成に依存するため、フローセルは酵素合成用に最適化されており、以下の態様を有する。
1.水性試薬の注入可能性
2.チップ内の層流
3.DNA、酵素およびヌクレオチドの付着防止のための表面の不動態化
4.複数の酵素サイクルに対する安定性
DNA合成は、例えば、電気化学、インクジェット印刷、または光誘起脱保護を使用して行うことができる。合成の後、得られる生成物は、その表面に幅広い種類のオリゴヌクレオチドを有するアレイであり得、各スポットは異なるオリゴヌクレオチドを含む。この構成は、まさにに使用される構成である。各スポットは、シーケンシングクラスターである。3’での合成または連結によりシーケンシングプライマーを追加することが、シーケンシングの前に必要な唯一の準備である。通常、サンプルの準備は、いくつかのステップ(希釈、ライゲーション、PCR、ブリッジ増幅など)を含む、より複雑な方法である。また、それはマイクロビーズをマイクロウェルに入れたアレイであってもよく、各マイクロビーズはその表面に定義された配列のオリゴヌクレオチドを有する。機器は、合成とシーケンシングで同じであることさえあり得る。例えば、光化学合成と合成によるシーケンシングは、両方とも光学に依存し、透明なフローセルを必要とするため、同様の機器で行うこともでき得る。例えば、電気化学的合成とイオン半導体(Ion Torrent)シーケンシングも特に互換性がある。
E.DNAデータ保存のための組み合わせコード化スキーム
【0095】
さらなる態様では、本発明は、DNAデータ保存のためのコード化スキームを提供する。DNAデータストレージは、非常に高いデータ密度、容易かつ長期の保存のおかげで、データストレージ市場を混乱させる可能性がある。したがって、実行可能であるためには、非常に高いDNA合成およびシーケンシングのスループットが必要である。DNA合成は、通常、2次元マイクロアレイで行われる。デジタルデータは、通常、基数2で保存され、DNAは基数4で保存される(理論的には1つのヌクレオチドに2ビットをコードすることができる)。データ密度(および付随的に合成およびシーケンシングのスループット)を向上させる1つの解決策は、このコード化基数を4よりも増やすことである。1つの解決策は、非天然DNA塩基(例えばSteven BennerのAEGISヌクレオチド)を追加することであったが、それには制限があり、シーケンシングを困難にする可能性がある。本発明は、4つの天然塩基のみを使用してコード化基数を増加させることをここに提案する。このスキームは、追加の非天然ヌクレオチドを用いて実装することもでき得る。
【0096】
組み合わせスキーム。データ密度をさらに実装するために、本発明は、4つのヌクレオチドのうちの1つだけでなく、各サイクルでヌクレオチドの混合物を追加すること(図3および4)により、組み合わせスキームを実装することを提案する。1つのウェルで、サイクルごとにヌクレオチドの混合物を追加すると、データをコードする塩基を増やすことができる。上記の存在/不在メカニズムを使用すると、コード化基数は14であり、データ密度をおよそ2倍増加させることが可能である。25%の組み合わせスキーム(図3)を使用すると、基数は35であり、サイクルあたり5ビットのコード化が可能である(35>32=2)。10のレベル(X1=AAAAAAAAAA、X2=AAAAAAAAATなど)をもつ10%の組み合わせスキームは、268塩基となる。SBS技術を使用し、各スポットのヌクレオチド量を定量化する、この種類の組み合わせコード化は、かなり容易に配列決定することができる。
【表2】
【0097】
擬似3次元データ保存。このスキームは、合成支持体が保存されている場合にデータ密度を高めるために使用することができる(将来的にデータを取り出す必要がある場合は配列決定される)。合成支持体を維持することにより、シーケンシングで定義された量のデータを解読するために必要な読み取りの数が大幅に削減される。実際、データがDNAオリゴプールに保存されている場合、すべてのオリゴヌクレオチドが配列決定されていることを確認するために、各断片を平均50回読み取る必要がある(リード深度50)。固体支持体が保持されている場合、オリゴヌクレオチドが完全に整列しているため、リード深度は1である。本発明の文脈では、これは擬似3次元データ保存(フローセルは2次元であり、ヌクレオチドの配列は3次元を表す)と名付けられ、DNAデータ保存を中程度のコールドデータ保存に使用することを可能にし、デジタルデータの容易な読み出しを可能にする(図5)。1μmのウェル、400mer、および25%の組み合わせスキームを用いると、データ密度は、本発明者らのフローセルでは2キロビット/μm以上となる。このデータ密度は、現在の最も高密度のデータ保存媒体と比べて遜色がない。
・磁気テープ:200GB/in(2017年のSonyの世界記録)=2480ビット/μm
・HDブルーレイディスク:13.6GB/in(4層ブルーレイ)=215ビット/μm
・1μm、400mers、25%の組み合わせ:>2000ビット/μm
10%の組み合わせスキームを使用すると、現在では到達できない3.5キロビット/μm超を達成することが可能となる。チップの代わりに1μmのビーズで合成を行うと、1cmに100TBを超えるデータを有する可能性があり、これは現在のストレージ技術をはるかに上回る。ビーズは、読み取り深度1の読み取り用にシーケンシングチップに再付着させることができる。
【0098】
本発明の合成およびシーケンシング方法は、参照により組み込まれる以下の参考文献に開示されるものなど、事実上あらゆるコーディングスキームとともに使用することができる:Bornholtら、IEEE Micro、37(3):98-104(2017);Goldmanら、Nature、494:77-80(2013);Chenら、米国特許出願公開第2018/0265921号;Chenら、米国特許出願公開第20180230509A1号;Straussら、米国特許出願公開第20170141793A1号;Blawatら、欧州特許第3067809A1号;など。
切断可能な連鎖およびヌクレオチド
【0099】
幅広い種類の切断可能な連鎖、またはより詳細には、切断可能なヌクレオチドを本発明の実施形態とともに使用することができる。本明細書において、「切断可能な部位」という用語は、所定の条件下で切除または開裂することができ、それによって一本鎖核酸配列を2つの部分に分離することができる、ヌクレオチドまたは一本鎖核酸配列の骨格連鎖を指す。一部の実施形態では、切断可能なヌクレオチド、切断可能な連鎖または切断可能な結合を切断するステップは、切断された鎖上に遊離3’-ヒドロキシルを残し、それにより、例えばポリメラーゼによって切断された鎖を延長することが可能になる。切断ステップは、化学的に、熱的に、酵素的に、または光に基づく切断により実施されてよい。一部の実施形態では、切断可能なヌクレオチドは、特定のグリコシラーゼ(例えば、それぞれ、ウラシルデオキシグリコシラーゼとそれに続くエンドヌクレアーゼVIII、および8-オキソグアニンDNAグリコシラーゼ)によって認識されるデオキシウリジンまたは8-オキソ-デオキシグアノシンなどのヌクレオチド類似体であってよい。一部の実施形態では、グリコシラーゼおよび/またはエンドヌクレアーゼによる切断は、二本鎖DNA基板が必要であり得る。
【0100】
一部の実施形態では、切断可能なヌクレオチドには、エンドヌクレアーゼIIIによって切断可能な塩基類似体を含むヌクレオチドが含まれ、それには、限定されるものではないが、尿素、チミングリコール、メチルタルトニル尿素(methyl tartonyl urea)、アロキサン、ウラシルグリコール、6-ヒドロキシ-5,6-ジヒドロシトシン、5-ヒドロキシヒダントイン、5-ヒドロキシシトシン、トランス-1-カルバモイル-2-オキソ-4,5-ジヒドロオキシイミダゾリジン、5,6-ジヒドロウラシル、5-ヒドロキシシトシン、5-ヒドロキシウラシル、5-ヒドロキシ-6-ヒドロウラシル、5-ヒドロキシ-6-ヒドロチミン、5,6-ジヒドロチミンが挙げられる。一部の実施形態では、切断可能なヌクレオチドには、ホルムアミドピリミジンDNAグリコシラーゼによって切断可能な塩基類似体を含むヌクレオチドが含まれ、それには、限定されるものではないが、7,8-ジヒドロ-8-オキソグアニン、7,8-ジヒドロ-8-オキソイノシン、7,8-ジヒドロ-8-オキソアデニン、7,8-ジヒドロ-8-オキソネブラリン(oxonebularine)、4,6-ジアミノ-5-ホルムアミドピリミジン、2,6-ジアミノ-4-ヒドロキシ-5-ホルムアミドピリミジン、2,6-ジアミノ-4-ヒドロキシ-5-N-メチルホルムアミドピリミジン、5-ヒドロキシシトシン、5-ヒドロキシウラシルが挙げられる。一部の実施形態では、切断可能なヌクレオチドには、hNeil 1によって切断可能な塩基類似体を含むヌクレオチドが含まれ、それには、限定されるものではないが、グアニジノヒダントイン、スピロイミノジヒダントイン、5-ヒドロキシウラシル、チミングリコールが挙げられる。一部の実施形態では、切断可能なヌクレオチドには、チミンDNAグリコシラーゼによって切断可能な塩基類似体を含むヌクレオチドが含まれ、それには、限定されるものではないが、5-ホルミルシトシンおよび5-カルボキシシトシンが挙げられる。一部の実施形態では、切断可能なヌクレオチドには、ヒトアルキルアデニンDNAグリコシラーゼによって切断可能な塩基類似体を含むヌクレオチドが含まれ、それには、限定されるものではないが、3-メチルアデニン、3-メチルグアニン、7-メチルグアニン、7-(2-クロロエチル(chloroehyl))-グアニン、7-(2-ヒドロキシエチル)-グアニン、7-(2-エトキシエチル)-グアニン、1,2-ビス-(7-グアニル)エタン、1,N-エテノアデニン、1,N-エテノグアニン、N,3-エテノグアニン、N,3-エタノグアニン、5-ホルミルウラシル、5-ヒドロキシメチルウラシル、ヒポキサンチンが挙げられる。一部の実施形態では、切断可能なヌクレオチドには、5-メチルシトシンDNAグリコシラーゼによって切断可能な5-メチルシトシンが挙げられる。
【0101】
本明細書に記載される方法で用いる例示的な化学的に切断可能なヌクレオチド間結合としては、例えば、-シアノエーテル、5’-デオキシ-5’-アミノカルバメート、3’デオキシ-3’-アミノカルバメート、尿素、2’シアノ-3’,5’-ホスホジエステル、3’-(S)-ホスホロチオエート、5’-(S)-ホスホロチオエート、3’-(N)-ホスホルアミデート、5’-(N)-ホスホルアミデート、-アミノアミド、隣接ジオール、リボヌクレオシド挿入物、2’-アミノ-3’,5’-ホスホジエステル、アリル性スルホキシド、エステル、シリルエーテル、ジチオアセタール、5’-チオ-フルマル(furmal)、-ヒドロキシ-メチル-ホスホン酸ビスアミド、アセタール、3’-チオ-フルマル(furmal)、メチルホスホネートおよびホスホトリエステルが挙げられる。トリアルキルシリルエーテルおよびジアルコキシシランなどのヌクレオシド間シリル基は、フッ化物イオンで処理することにより切断される。塩基切断可能な部位としては、-シアノエーテル、5’-デオキシ-5’-アミノカルバメート、3’-デオキシ-3’-アミノカルバメート、尿素、2’-シアノ-3’,5’-ホスホジエステル、2’-アミノ-3’,5’-ホスホジエステル、エステルおよびリボースが挙げられる。3’-(S)-ホスホロチオエートおよび5’-(S)-ホスホロチオエートなどのチオ含有ヌクレオチド間結合は、硝酸銀または塩化水銀で処理することにより切断される。酸切断可能な部位としては、3’-(N)-ホスホルアミデート、5’-(N)-ホスホルアミデート、ジチオアセタール、アセタールおよびホスホン酸ビスアミドが挙げられる。-アミノアミドヌクレオチド間結合は、イソチオシアネートでの処理によって切断可能であり、チタンは2’-アミノ-3’,5’-ホスホジエステル-O-オルト-ベンジルヌクレオチド間結合を切断するために使用され得る。隣接ジオール結合は、過ヨウ素酸塩での処理によって切断可能である。熱的に切断可能な基としては、アリル性スルホキシドおよびシクロヘキセンが挙げられ、光不安定性結合としては、ニトロベンジルエーテルおよびチミジン二量体が挙げられる。化学的に切断可能な基、熱的に切断可能な基、および光不安定性基を含む核酸を合成および切断する方法は、例えば、米国特許第5,700,642号に記載されている。
【0102】
さらなる切断可能な結合は、以下の参考文献に開示されている:Pon、R.、Methods Mol.Biol.20:465-496(1993);Vermaら、Ann.Rev.Biochem.67:99-134(1998);米国特許第5,739,386号、同第5,700,642号および同第5,830,655号;ならびに米国特許出願公開第2003/0186226号および同第2004/0106728号、Urdeaら、米国特許第5367066号。
【0103】
切断可能な部位は、オリゴヌクレオチド骨格に沿って位置し、例えば、リボース、ジアルコキシシラン、ホスホロチオエート、およびホスホルアミデートヌクレオチド間結合などのホスホジエステル基の1つの代わりの修飾された3’-5’ヌクレオチド間結合などであり得る。切断可能なオリゴヌクレオチド類似体には、例えば7-デアザグアノシン、5-メチルシトシン、イノシン、ウリジンなどの1つの塩基または糖上の置換基、またはその置き換えも含まれ得る。
【0104】
化学的に切断可能なオリゴヌクレオチドの合成および切断条件は、米国特許第5,700,642号および同第5,830,655号に記載されている。ホスホロチオエートヌクレオチド間結合は、穏やかな酸化条件下で選択的に切断され得る。ホスホルアミデート結合の選択的切断は、80%酢酸などの弱酸条件下で実施され得る。リボースの選択的切断は、希水酸化アンモニウムによる処理によって実施され得る。もう一つの実施形態では、切断可能な連結部分は、アミノリンカーであり得る。ホスホルアミダイト結合を介してリンカーに結合している、得られたオリゴヌクレオチドは、80%酢酸で切断されて3’-リン酸化オリゴヌクレオチドを生成し、これは(必要に応じて)ホスファターゼによって除去され得る。
【0105】
一部の実施形態では、切断可能な連結部分は、オルト-ニトロベンジル光切断可能リンカーなどの光切断可能リンカーであり得る。固相支持体上の光不安定性オリゴヌクレオチドの合成および切断条件は、例えば、Venkatesanら、J.Org.Chem.61:525-529(1996)、Kahlら、J.Org.Chem.64:507-510(1999)、Kahlら、J.Org.Chem.63:4870-4871(1998)、Greenbergら、J.Org.Chem.59:746-753(1994)、Holmesら、J.Org.Chem.62:2370-2380(1997)、および米国特許第5,739,386号に記載されている。オルト-ニトロベンジル系リンカー、例えばヒドロキシメチル、ヒドロキシエチル、およびFmoc-アミノエチルカルボン酸リンカーなどは、商業的に入手してもよい。
【0106】
部の実施形態では、リボヌクレオチドを切断可能なヌクレオチドとして用いることができ、この際、切断ステップはRNase Hなどのリボヌクレアーゼを使用して実施することができる。他の実施形態では、切断ステップは、ニッカーゼを用いる処理によって実施され得る。
【実施例
【0107】
(実施例1)
3’-O-アジドメチル-ヌクレオチドの電気化学的還元
この実施例では、3’-O-アジドメチルヌクレオチドの還元のための条件が、マイクロウェル内の電極に異なる電圧を異なる時間長さで印加することによって決定される。処置されたヌクレオチドはLCMSおよびゲル電気泳動によって分析されて、反応生成物が決定された。
【0108】
2つの白金電極を使用して、3’-O-アジドメチルデオキシチミジンの20uL水性サンプル(@9mM)に、3ボルトおよび10ボルトで異なる時間(0、30、60、および300秒)、電流を印加した。次に、サンプル中の3’OH(脱保護)ヌクレオチドの証拠をLCMSとゲル電気泳動で評価した。処理したヌクレオチドを、プライマーに3’-ヒドロキシルヌクレオチドを結合することができるが3’-O-アジドメチルヌクレオチドを結合することができない変異末端デオキシヌクレオチジルトランスフェラーゼ(配列番号1)によるプライマーの溶液伸長に使用した。伸長反応は以下の通りであった:4uM TdT、136uM dTTP(マイクロプレートからの処理済みヌクレオチド)、10nmolプライマー(5’-FAM-polyTdU-3’-OH)、反応体積103uL。37℃で10分間のインキュベーションおよび取り込まれなかったモノマーの除去(1200rpm)の後、生成物をゲル電気泳動によって分離した。LCMSは、3’OH dNTPバンドの出現により脱保護の証拠を示した(図示せず)。分離した生成物の電気泳動図を図8に示す。大きいほうのバンドは、300秒のサンプルについて明確に見え(で示された列)、脱保護されたdTTPが処理済みのサンプル中にあり、アジドメチル基が電気化学的に除去されていることを示している。それにより、プライマーの延長が許容されてn+1の生成物が形成される。
(実施例2)
3’-O-アミノ-ヌクレオチド脱保護の電気化学的制御
DNAの3’末端上のアミノキシ可逆的保護基は、酸性条件下でニトロシウムイオン(NO+)によって切断される、例えばBenner、米国特許第7544794号。この実験では、脱保護緩衝液のpHが、キノン/ハイドロキノン酸化還元系(例えば、Southernら、米国特許出願公開第2004/0238369号)を介して電気化学的に制御され、局所的にpHが初期値の7.5(2分後に0.5%超の脱保護が得られる)から最終値の5(20秒未満で99%超の脱保護が得られる)に低下する。いくつかのインキュベーション時間についてpHと脱保護効率を比較する図9に結果を示す。
定義
【0109】
「マイクロ流体デバイス」とは、相互に接続され、流体連通しており、単独で、あるいは、サンプル導入、流体および/または試薬駆動手段、温度制御、検出システム、データ収集および/または統合システムなどのサポート機能を提供する器具または装置と組み合わせて、分析反応またはプロセスを実行するように設計された1またはそれを超えるチャンバ、ポート、およびチャネルの統合システムを意味する。マイクロ流体デバイスは、バルブ、ポンプ、および、例えば、サンプル成分または反応物の吸着を防止し、電気浸透などによる試薬の移動を容易にするための、内壁の特殊な機能性コーティングをさらに含むことがある。そのようなデバイスは、通常、ガラス、プラスチック、または他の固体高分子材料であってよい固体基板内に、または固体基板として作製され、一般に、特に光学的または電気化学的方法を介してサンプルおよび試薬の動きを検出および監視する場合のための平面フォーマットを有する。マイクロ流体デバイスの特徴は、通常、数百平方マイクロメートル未満の断面寸法を有し、通路は、一般にキャピラリー寸法、例えば最大断面寸法が約500μmから約0.1μmである。マイクロ流体デバイスは一般に1μL~数nL、例えば10~100nLの範囲の容量を有する。マイクロ流体デバイスの作製および操作は、参照により組み込まれる以下の参考文献によって例示されるように、当技術分野で周知である:Ramsey、米国特許第6,001,229号;同第5,858,195号;同第6,010,607号;および同第6,033,546号;Soaneら、米国特許第5,126,022号および同第6,054,034号;Nelsonら、米国特許第6,613,525号;Maherら、米国特許第6,399,952号;Riccoら、国際公開第02/24322号;Bjornsonら、国際公開第99/19717号;Wildingら、米国特許第5,587,128号;同第5,498,392号;Siaら、Electrophoresis、24:3563-3576(2003);Ungerら、Science、288:113-116(2000);Enzelbergerら、米国特許第6,960,437号。
【0110】
「ポリヌクレオチド」または「オリゴヌクレオチド」は同義的に使用され、各々がヌクレオチドモノマーまたはその類似体の線状ポリマーを意味する。ポリヌクレオチドおよびオリゴヌクレオチドを構成するモノマーは、ワトソン-クリック型の塩基対形成、塩基スタッキング、フーグスティーン型または逆フーグスティーン型の塩基対形成などのモノマー間相互作用の規則的なパターンによって、天然のポリヌクレオチドに特異的に結合する能力がある。そのようなモノマーおよびそれらのヌクレオシド間結合は、天然に存在してもよいし、その類似体、例えば、天然に存在する類似体または天然に存在しない類似体であってもよい。天然に存在しない類似体には、PNA、ホスホロチオエートヌクレオシド間結合、フルオロフォアまたはハプテンなどの標識の付着を可能にする連結基を含む塩基などが含まれ得る。オリゴヌクレオチドまたはポリヌクレオチドの使用が、ポリメラーゼによる延長、リガーゼによる連結などの酵素処理を必要とする場合はいつでも、当業者であれば、それらの例におけるオリゴヌクレオチドまたはポリヌクレオチドは、任意の位置またはいくつかの位置に、ヌクレオシド間結合、糖部分、または塩基の特定の類似体を含まないことを理解するであろう。ポリヌクレオチドのサイズは、通常、数個のモノマー単位、例えば、通常「オリゴヌクレオチド」と呼ばれる5~40から、数千のモノマー単位までの範囲である。ポリヌクレオチドまたはオリゴヌクレオチドが「ATGCCTG」などの文字列(大文字または小文字)で示される場合はいつでも、特に明記しない限りまたは文脈から明らかな場合を除いて、ヌクレオチドは左から右へ5’→3’の順序であり、「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、「T」はチミジンを示し、「I」はデオキシイノシンを示し、「U」はウリジンを示すことが理解される。特に明記されていない限り、用語および原子番号付けの規則は、Strachan and Read、Human Molecular Genetics 2(Wiley-Liss、New York、1999)に開示されているものに従うことになる。通常、ポリヌクレオチドは、ホスホジエステル結合によって連結された4つの天然ヌクレオシド(例えば、DNAの場合はデオキシアデノシン、デオキシシチジン、デオキシグアノシン、デオキシチミジン、またはRNAの場合はそれらのリボース対応物)を含む;しかし、それらは、例えば、修飾塩基、糖、またはヌクレオシド間結合をはじめとする非天然ヌクレオチド類似体も含んでよい。酵素が特定のオリゴヌクレオチドまたはポリヌクレオチド基板を活性のために必要とする場合(例えば、一本鎖DNA、RNA/DNA二本鎖など)、オリゴヌクレオチドまたはポリヌクレオチド基板に適切な組成物の選択は、特に、Sambrookら、Molecular Cloning,Second Edition(Cold Spring Harbor Laboratory、New York、1989)のような論文、および同様の参考文献からのガイダンスにより、十分に当業者の知識の範囲内であることは明らかである。同様に、オリゴヌクレオチドおよびポリヌクレオチドは、一本鎖形態または二本鎖形態(すなわち、オリゴヌクレオチドまたはポリヌクレオチドおよびそのそれぞれの相補体の二本鎖)のいずれかを指してよい。当業者であれば、用語の使用法の文脈から、どちらの形式が意図されているか、あるいは両方の形式が意図されているのかどうかは明らかであろう。
【0111】
「プライマー」とは、ポリヌクレオチドテンプレートと二本鎖を形成する際に、核酸合成の開始点として作用し、その3’末端からテンプレートに沿って延長され、その結果、延長された二重体が形成される、天然または合成のいずれかのオリゴヌクレオチドを意味する。プライマーの延長は、通常、DNAまたはRNAポリメラーゼなどの核酸ポリメラーゼによって実施される。延長プロセスで追加されたヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって延長される。プライマーの長さは、通常、14~40ヌクレオチドの範囲、または18~36ヌクレオチドの範囲である。プライマーは、多様な核酸増幅反応、例えば、単一のプライマーを使用する線形増幅反応、または2またはそれを超えるプライマーを用いるポリメラーゼ連鎖反応で用いられる。プライマーの長さおよび配列を特定の用途のために選択するためのガイダンスは、参照により組み込まれる以下の参考文献から明らかなように、当業者に周知である:Dieffenbach、編集者、PCR Primer:A Laboratory Manual、第2版(Cold Spring Harbor Press、New York、2003)。
【0112】
ポリヌクレオチドに関する「配列決定」、「シーケンシング」または「ヌクレオチド配列の決定」は、ポリヌクレオチドの完全な配列情報と同様に部分的な配列情報の決定を含む。すなわち、これらの用語は、4つの天然ヌクレオチドA、C、GおよびTの完全な集合の部分集合の配列、例えば、標的ポリヌクレオチドのAおよびCだけの配列などを含む。すなわち、これらの用語には、標的ポリヌクレオチド内の4種類のヌクレオチドのうちの1つ、2つ、3つ、またはすべてのヌクレオチドの同一性、順序、および位置の決定が含まれる。一部の実施形態では、これらの用語には、標的ポリヌクレオチド内の4種類のヌクレオチドのうちの2つ、3つ、またはすべてのヌクレオチドの同一性、順序、および位置の決定が含まれる。一部の実施形態では、配列決定は、標的ポリヌクレオチド「catcgc...」内の1種類のヌクレオチド、例えばシトシンの順序および位置を特定することによって達成することができる。そのため、その配列は、2進コード、例えば「c-(c以外)(c以外)c-(c以外)-c...」などを表す「100101...」として示される。一部の実施形態では、これらの用語は、標的ポリヌクレオチドのフィンガープリントとして機能する標的ポリヌクレオチドの部分配列、すなわち、ポリヌクレオチドの集合内の標的ポリヌクレオチドを一意に同定する部分配列、例えば、細胞によって発現されるすべての異なるRNA配列も含み得る。
図1-1】
図1-2】
図2
図3
図4
図5
図6-1】
図6-2】
図6-3】
図7-1】
図7-2】
図7-3】
図7-4】
図8
図9
【配列表】
0007430701000001.app