IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ナイオ, インコーポレイテッドの特許一覧

特表2024-530614核酸データストレージのための組成物、システム、および方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-08-23
(54)【発明の名称】核酸データストレージのための組成物、システム、および方法
(51)【国際特許分類】
   C07H 21/04 20060101AFI20240816BHJP
   C12M 1/00 20060101ALI20240816BHJP
   C12P 19/34 20060101ALI20240816BHJP
   C12Q 1/6869 20180101ALI20240816BHJP
   G11C 13/00 20060101ALI20240816BHJP
   G06N 3/123 20230101ALI20240816BHJP
【FI】
C07H21/04 Z
C12M1/00 A
C12P19/34
C12Q1/6869 Z
G11C13/00 ZNA
G06N3/123
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024505225
(86)(22)【出願日】2022-07-27
(85)【翻訳文提出日】2024-03-19
(86)【国際出願番号】 US2022038591
(87)【国際公開番号】W WO2023009674
(87)【国際公開日】2023-02-02
(31)【優先権主張番号】63/226,720
(32)【優先日】2021-07-28
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/269,324
(32)【優先日】2022-03-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】524035911
【氏名又は名称】ナイオ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】クール, エリック
【テーマコード(参考)】
4B029
4B063
4B064
4C057
【Fターム(参考)】
4B029AA23
4B029BB20
4B029CC03
4B029FA15
4B029GB02
4B063QA13
4B063QA18
4B063QQ42
4B063QR08
4B063QR55
4B063QR62
4B063QS34
4B063QX02
4B064AF27
4B064CC24
4B064DA13
4C057BB04
4C057DD03
4C057MM01
(57)【要約】
データストレージのための書き込み可能なポリマー(例えば、書き込み可能な核酸ポリマー)および関連する方法が本明細書に提示される。一般に、書き込み可能なポリマー(例えば、核酸ポリマー)は、第1の状態から第2の状態に変換することが可能な1つまたは複数の変換可能な残基(例えば、変換可能な核酸塩基)を含有し、第1の状態と第2の状態は異なる。ローリングサークル反応または化学合成およびライゲーションによるポリメラーゼ伸長などの様々な方法を利用して、書き込み可能な核酸ポリマーを生成することができる。核酸塩基を第2の状態に選択的に変換することによる書き込み可能な核酸ポリマーへの書き込みまたは符号化のための様々な方法も本明細書に提示される。データが符号化された核酸ポリマーからの読み取りまたは復号のための様々な方法も本明細書に提示される。
【特許請求の範囲】
【請求項1】
データを符号化するためのポリマーであって、
前記ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含み、
前記複数の変換可能な残基のそれぞれが第1の状態を有し、前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なり、前記第1の状態にある前記複数の変換可能な残基と前記第2の状態にある前記複数の変換可能な残基がポリメラーゼ酵素によって可読であり、
前記複数の変換可能な残基が前記第1の状態および前記第2の状態において前記ポリマーに共有結合により連結している、
ポリマー。
【請求項2】
前記ポリマーが核酸ポリマーであり、前記複数の変換可能な残基が変換可能な核酸塩基である、請求項1に記載のポリマー。
【請求項3】
一本鎖核酸ポリマーである、請求項2に記載のポリマー。
【請求項4】
二本鎖核酸ポリマーである、請求項2に記載のポリマー。
【請求項5】
デオキシリボ核酸(DNA)、リボ核酸(RNA)、ホスホロチオエートDNA、グリセロール核酸(GNA)、トレオース核酸(TNA)、ロックド核酸(LNA)、またはその組合せを含む、請求項2から4のいずれか一項に記載のポリマー。
【請求項6】
10個よりも多くの変換可能な残基を含む、請求項2から5のいずれか一項に記載のポリマー。
【請求項7】
前記核酸ポリマー内のヌクレオチドの総数の前記変換可能な残基に対する比が、2から100の間である、請求項2から6のいずれか一項に記載のポリマー。
【請求項8】
前記複数の変換可能な核酸塩基が、天然に存在しない核酸塩基である、請求項2から7のいずれか一項に記載のポリマー。
【請求項9】
前記複数の変換可能な核酸塩基が、修飾された天然に存在する核酸塩基または天然に存在する核酸塩基の誘導体である、請求項8に記載のポリマー。
【請求項10】
前記複数の変換可能な核酸塩基のそれぞれが、化学修飾可能な部分を含む、請求項2から9のいずれか一項に記載のポリマー。
【請求項11】
前記複数の変換可能な核酸塩基のそれぞれの前記化学修飾可能な部分が、前記変換可能な核酸塩基の塩基に直接付着している、請求項2から10のいずれか一項に記載のポリマー。
【請求項12】
前記複数の変換可能な核酸塩基のそれぞれの前記化学修飾可能な部分が、前記塩基にリンカーも側鎖も介さずに付着している、請求項2から10のいずれか一項に記載のポリマー。
【請求項13】
前記複数の変換可能な核酸塩基が、前記核酸の骨格に糖を介して共有結合により連結している、請求項11または12に記載のポリマー。
【請求項14】
前記化学修飾可能な部分が、光、電圧、酵素剤、化学試薬、または酸化還元剤によって活性化可能であり、それにより、前記第1の状態が前記第2の状態に変換される、請求項2から13のいずれか一項に記載のポリマー。
【請求項15】
前記化学修飾可能な部分が、光によって活性化可能であり、それにより、前記第1の状態が前記第2の状態に変換される、請求項14に記載のポリマー。
【請求項16】
前記第1の状態から前記第2の状態への変換が、不可逆反応によって起こる、請求項14または15に記載のポリマー。
【請求項17】
前記変換可能な核酸塩基が、前記第2の状態への変換後、天然に存在する核酸塩基になる、請求項2から16のいずれか一項に記載のポリマー。
【請求項18】
前記変換可能な核酸塩基が、前記第2の状態への変換後、グアニン、アデニン、チミン、ウラシルまたはシトシンになる、請求項17に記載のポリマー。
【請求項19】
前記ポリマーの骨格(例えば、核酸ポリマー内のリン酸および糖)が、前記第1の状態から前記第2の状態への変換の間、変化しないままである、前記請求項のいずれか一項に記載のポリマー。
【請求項20】
前記ポリマーが、変換可能な残基の異なる2つまたはそれよりも多くのセットを含み、変換可能な残基の各セットが第1の状態を有し、前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なる、前記請求項のいずれか一項に記載のポリマー。
【請求項21】
前記複数の変換可能な残基のそれぞれが、光によって活性化することができる化学修飾可能な部分を含む、前記請求項のいずれか一項に記載のポリマー。
【請求項22】
前記変換可能な残基の異なる2つまたはそれよりも多くのセットが、波長が異なる光によって活性化可能である、請求項20に記載のポリマー。
【請求項23】
変換可能な残基の第1のセットが、第1の波長の光によって活性化可能であり、変換可能な残基の第2のセットが、第2の波長の光によって活性化可能であり、前記第1の波長と前記第2の波長が異なる、請求項22に記載のポリマー。
【請求項24】
前記化学修飾可能な部分が、1つまたは複数の光により除去可能な基を含む、前記請求項のいずれか一項に記載のポリマー。
【請求項25】
前記化学修飾可能な部分が、脱離基である、請求項24に記載のポリマー。
【請求項26】
前記1つまたは複数の光により除去可能な基が、
【化15】
(式中、Xは、NR、NHR、OR、またはSRを表し、Rは、前記光により除去可能な基が付着している核酸塩基である)
である、請求項24に記載のポリマー。
【請求項27】
前記複数の変換可能な核酸塩基が、325nm、360nm、または400nmの波長の光によって変換することが可能である、請求項2から24のいずれか一項に記載のポリマー。
【請求項28】
前記複数の変換可能な核酸塩基が、400nmから850nmの間の波長の光によって変換可能である、請求項2から24のいずれか一項に記載のポリマー。
【請求項29】
前記複数の変換可能な核酸塩基のそれぞれが、酸化還元によって活性化可能な化学修飾可能な部分を含む、請求項2から28のいずれか一項に記載のポリマー。
【請求項30】
前記化学修飾可能な部分が、局所的な酸化によって活性化することが可能である、請求項29に記載のポリマー。
【請求項31】
前記化学修飾可能な部分が、電極を使用する酸化によって活性化することが可能である、請求項29に記載のポリマー。
【請求項32】
前記変換可能な核酸塩基を含むヌクレオチドが、
【化16】
からなる群から選択される、請求項2から30のいずれか一項に記載のポリマー。
【請求項33】
前記変換可能な核酸塩基が、O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンからなる群から選択される、請求項2から30のいずれか一項に記載のポリマー。
【請求項34】
前記複数の変換可能な核酸塩基の前記第1の状態と前記第2の状態が、天然に存在しないおよび/または修飾された核酸塩基を検出し、区別することが可能なシーケンシング方法によって可読である、請求項2から32のいずれか一項に記載のポリマー。
【請求項35】
前記複数の変換可能な核酸塩基の前記第1の状態と前記第2の状態が、ナノポアシーケンシングによって可読である、請求項34に記載のポリマー。
【請求項36】
前記複数の変換可能な核酸塩基の前記第1の状態と前記第2の状態が、合成によるシーケンシングによって可読である、請求項34に記載のポリマー。
【請求項37】
前記複数の変換可能な核酸塩基が前記第2の状態に変換されると、前記第1の状態と比較して前記複数の変換可能な核酸塩基の特性が改変される(例えば、サイズが縮小する、形状が変更される、H結合が改変される、および/またはポリメラーゼ基質能が改変される)、請求項2から36のいずれか一項に記載のポリマー。
【請求項38】
前記複数の変換可能な核酸塩基のうちの1つまたは複数が、前記第2の状態から第3の状態に変換することが可能であり、前記複数の変換可能な核酸塩基のうちの1つまたは複数が前記第3の状態において前記核酸ポリマーに共有結合により付着している、請求項2から37のいずれか一項に記載のポリマー。
【請求項39】
前記複数の変換可能な残基のそれぞれが、独立に、かつ選択的に変換することが可能である、請求項1から38のいずれか一項に記載のポリマー。
【請求項40】
前記ポリマーの骨格を介して連結した複数のスペーサー残基をさらに含み、前記複数の変換可能な残基のそれぞれが、前記複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている、請求項1から38のいずれか一項に記載のポリマー。
【請求項41】
前記複数の変換可能な残基の間の反復的間隔が、前記ポリマー上にデータを符号化するための書き込み機構の分解能に適合する、前記請求項のいずれか一項に記載のポリマー。
【請求項42】
2つの隣接する変換可能な残基の間の反復的間隔が、データを前記ポリマー中に符号化するためのデータ符号化機構の分解能と等しいまたはそれよりも大きい、前記請求項のいずれか一項に記載のポリマー。
【請求項43】
前記書き込み機構の分解能が、少なくとも1nmである、請求項41に記載のポリマー。
【請求項44】
前記複数のスペーサー残基が、前記変換可能な残基の読み取りに干渉しない、前記請求項のいずれか一項に記載のポリマー。
【請求項45】
前記ポリマー内の複数のスペーサー残基が、同じスペーサー残基である、前記請求項のいずれか一項に記載のポリマー。
【請求項46】
前記複数のスペーサー残基が、2つまたはそれよりも多くの異なるスペーサー残基(例えば、異なる核酸塩基、例えば、異なる天然に存在する核酸塩基)を含む、請求項1から44のいずれか一項に記載のポリマー。
【請求項47】
スペーサー残基から本質的になる、前記請求項のいずれか一項に記載のポリマー。
【請求項48】
前記複数の変換可能な核酸塩基のそれぞれが、2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、または50個のスペーサー残基によって分離されている、請求項2から46のいずれか一項に記載のポリマー。
【請求項49】
前記複数の変換可能な核酸塩基のそれぞれが、6個のスペーサー残基によって分離されている、請求項48に記載のポリマー。
【請求項50】
前記複数のスペーサー残基が、天然に存在する核酸塩基、天然に存在しない核酸塩基、テトラヒドロフラン脱塩基残基、またはエチレングリコール残基である、請求項2から49のいずれか一項に記載のポリマー。
【請求項51】
前記複数のスペーサー残基が、天然に存在する核酸塩基である、請求項50に記載のポリマー。
【請求項52】
前記ポリマーの骨格に連結した1つまたは複数のデリミタをさらに含む、前記請求項のいずれか一項に記載のポリマー。
【請求項53】
前記1つまたは複数のデリミタのそれぞれが、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む、請求項52に記載のポリマー。
【請求項54】
前記1つまたは複数のデリミタが、天然に存在する核酸塩基を含む、請求項52または53に記載のポリマー。
【請求項55】
前記1つまたは複数のデリミタにより、前記ポリマー内の2つまたはそれよりも多くの隣接するデータフィールドが分離されている、請求項52から54のいずれか一項に記載のポリマー。
【請求項56】
1つまたは複数のデータタグをさらに含む、前記請求項のいずれか一項に記載のポリマー。
【請求項57】
前記1つまたは複数のデータタグが、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む、請求項56に記載のポリマー。
【請求項58】
前記ポリマーが、核酸ポリマーであり、前記1つまたは複数のデータタグが、核酸ポリマーの5’末端または3’末端に存在する、請求項56または57に記載のポリマー。
【請求項59】
前記1つまたは複数のデータタグは、前記核酸ポリマーに、前記核酸ポリマーが合成される間に、前記複数の変換可能な核酸塩基が前記第2の状態に変換される間に、または前記複数の変換可能な核酸塩基が前記第2の状態に変換された後に、ライゲーションによって組み入れられる、請求項56から58のいずれか一項に記載のポリマー。
【請求項60】
標準的な核酸保存プロトコールの下で保存することができる、前記請求項のいずれか一項に記載のポリマー。
【請求項61】
前記ポリマーが、適当なヌクレアーゼフリー溶液中、室温でまたは低温(例えば、-20℃)で保存することができる核酸ポリマーである、請求項60に記載のポリマー。
【請求項62】
安定剤を用いずに室温で保存することができる、請求項60または61に記載のポリマー。
【請求項63】
データ書き込みのためのシステムであって、
ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含む書き込み可能なポリマーであって、前記複数の変換可能な残基のそれぞれが第1の状態を有し、前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なり、前記第1の状態にある前記複数の変換可能な残基と前記第2の状態にある前記複数の変換可能な残基がポリメラーゼ酵素によって可読であり、前記複数の変換可能な残基が、前記第1の状態および前記第2の状態において前記ポリマーに共有結合により連結している、書き込み可能なポリマーと、
前記書き込み可能なポリマー上にデータを書き込むためのデータ書き込みデバイスと
を含む、システム。
【請求項64】
前記書き込み可能なポリマーが、書き込み可能な核酸ポリマーであり、前記複数の変換可能な残基が、変換可能な核酸塩基である、請求項63に記載のシステム。
【請求項65】
前記データ書き込みデバイスが、ナノポアを含む、請求項63または64に記載のシステム。
【請求項66】
前記データ書き込みデバイスが、光源を備えた顕微鏡を含む、請求項63または64に記載のシステム。
【請求項67】
前記データ書き込みデバイスが、前記複数の変換可能な核酸塩基を、光パルス、電圧パルス、酵素剤、または酸化還元剤によって前記第2の状態に変換する、請求項63から66のいずれか一項に記載のシステム。
【請求項68】
前記データ書き込みデバイスが、前記複数の変換可能な核酸塩基を光パルスによって前記第2の状態に変換する、請求項67に記載のシステム。
【請求項69】
前記データ書き込みデバイスが、光照射デバイスを含む、請求項63から68のいずれか一項に記載のシステム。
【請求項70】
書き込み可能な核酸ポリマーを生成するための方法であって、
変換可能な核酸塩基を含むデータフィールドのリピートと相補的な環状一本鎖オリゴヌクレオチド鋳型を提供するステップと、
前記環状一本鎖オリゴヌクレオチド鋳型を核酸プライマー、ポリメラーゼ、および三リン酸ヌクレオチドの存在下でインキュベートするステップであって、前記三リン酸ヌクレオチドが、第1の状態にある変換可能な核酸塩基を含み、前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なる、ステップと、
を含む、方法。
【請求項71】
前記環状一本鎖オリゴヌクレオチド鋳型が、前記変換可能な核酸塩基と相補的な核酸塩基を含み、前記相補的な核酸塩基が、反復的に間隔が置かれており、したがって、前記鋳型を前記核酸プライマー、前記ポリメラーゼ、および前記三リン酸ヌクレオチドと一緒にインキュベートすることにより、前記核酸ポリマーの骨格に沿って反復的に間隔を置いて前記核酸ポリマーの骨格を介して共有結合により連結した複数の前記変換可能な核酸塩基を含む核酸ポリマーがもたらされ、前記複数の変換可能な核酸塩基が前記第1の状態および前記第2の状態において前記核酸ポリマーに共有結合により連結している、請求項70に記載の方法。
【請求項72】
前記データフィールドのリピートが、スペーサー核酸塩基をさらに含み、前記三リン酸ヌクレオチドが、三リン酸スペーサーヌクレオチドをさらに含む、請求項70または71に記載の方法。
【請求項73】
書き込み可能な核酸ポリマーを生成するための方法であって、
複数のオリゴマーを化学合成するステップであって、各オリゴマーが、核酸ポリマー骨格に沿って反復的に間隔を置いて核酸ポリマー骨格を介して連結した複数の変換可能な核酸塩基を含み、前記複数の変換可能な核酸塩基のそれぞれが第1の状態を有し、前記第1の状態から第2の状態に変換することが可能であり、前記複数の変換可能な核酸塩基が、前記第1の状態および前記第2の状態において前記核酸ポリマーに共有結合により付着しており、前記第1の状態と前記第2の状態が異なる、ステップと、
前記書き込み可能な核酸ポリマーを形成するために、前記複数のオリゴマーをライゲーションするステップと
を含む、方法。
【請求項74】
前記複数のオリゴマーのそれぞれが前記核酸ポリマーの骨格を介して連結した複数のスペーサー残基を含み、前記複数の変換可能な核酸塩基のそれぞれが前記複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている、請求項73に記載の方法。
【請求項75】
前記ライゲーションするステップが、化学的ライゲーションによるものである、請求項73または74に記載の方法。
【請求項76】
前記ライゲーションするステップが、酵素的ライゲーションによるものである、請求項73または74に記載の方法。
【請求項77】
前記ライゲーションするステップにおいて相補DNAスプリントを使用する、請求項73から76のいずれか一項に記載の方法。
【請求項78】
前記ライゲーションするステップの前に、複数の相補物を前記オリゴマーとアニーリングさせるステップをさらに含む、請求項73から77のいずれか一項に記載の方法。
【請求項79】
書き込み可能なポリマー上にデータを書き込むための方法であって、
前記ポリマーの骨格に沿って反復的に間隔を置いて前記ポリマーの骨格を介して共有結合により連結した複数の変換可能な残基を含む書き込み可能なポリマーを提供するステップであって、前記複数の変換可能な残基の変換可能な残基のそれぞれが第1の状態を有し、前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なり、前記第1の状態にある前記複数の変換可能な残基と前記第2の状態にある前記複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、
データ書き込みデバイスを利用して、前記複数の変換可能な残基のうちの1つまたは複数を前記第2の状態に選択的に変換し、それにより、データが符号化されたポリマーを生成するステップと
を含む、方法。
【請求項80】
前記書き込み可能なポリマーが、書き込み可能な核酸ポリマーであり、前記複数の変換可能な残基が、変換可能な核酸塩基である、請求項79に記載の方法。
【請求項81】
前記データ書き込みデバイスが、ナノポアを含み、前記方法が、
前記書き込み可能なポリマーを前記書き込みデバイスのナノポアを通過させるステップであって、前記ナノポアにより、前記複数の変換可能な残基のうちの1つまたは複数を前記第2の状態に変換する、ステップ
をさらに含む、請求項79または80に記載の方法。
【請求項82】
前記ナノポアが、光パルスまたは酸化還元エネルギーを供給して、変換可能な核酸塩基を前記第1の状態から前記第2の状態に選択的に変換するプラズモニックナノポアである、請求項81に記載の方法。
【請求項83】
前記データ書き込みデバイスが、プラズモニックウェルまたはチャネルを含み、前記方法が、
前記書き込み可能なポリマーをデータ符号化デバイスの前記プラズモニックウェルまたはチャネルに移すステップであって、前記プラズモニックウェルまたはチャネルにより、光パルスまたは酸化還元エネルギーを供給して、変換可能な核酸塩基を前記第1の状態から前記第2の状態に選択的に変換する、ステップ
をさらに含む、請求項79または80に記載の方法。
【請求項84】
前記データ書き込みデバイスが、前記変換可能な残基を、光パルス、電圧パルス、酵素剤、または酸化還元剤によって前記第2の状態に選択的に変換する、請求項79から81のいずれか一項に記載の方法。
【請求項85】
前記データ書き込みデバイスが、前記変換可能な残基を光パルスによって前記第2の状態に選択的に変換する、請求項79から82のいずれか一項に記載の方法。
【請求項86】
前記変換可能な残基が、前記第2の状態への変換後、天然に存在する核酸塩基になる、請求項79から85のいずれか一項に記載の方法。
【請求項87】
前記複数の変換可能な残基が、2つまたはそれよりも多くの型の変換可能な残基を含み、第1の型の変換可能な残基が、第1の波長の光によって活性化可能であり、第2の型の変換可能な残基が、第2の波長の光によって活性化可能である、請求項79から86のいずれか一項に記載の方法。
【請求項88】
前記複数の変換可能な残基の間の反復的間隔が、前記変換可能な残基を選択的に変換するためのデータ書き込みデバイスの分解能に適合する、請求項79から87のいずれか一項に記載の方法。
【請求項89】
前記選択的に変換するステップが、前記書き込み可能なポリマーの特定の位置付けを必要としない、請求項79から88のいずれか一項に記載の方法。
【請求項90】
前記変換可能な残基の前記第2の状態への変換が、前記データが符号化されたポリマー上で一様ではない、請求項79から88のいずれか一項に記載の方法。
【請求項91】
前記変換可能な残基の前記第2の状態への変換が、前記データが符号化されたポリマー上のある特定の位置に限定されない、請求項79から88のいずれか一項に記載の方法。
【請求項92】
前記書き込み可能なポリマー(例えば、書き込み可能なDNA)を固体支持体上に引き伸ばすまたはコーミングするステップをさらに含む、請求項79から91のいずれか一項に記載の方法。
【請求項93】
色素を使用して前記変換可能な残基の場所を可視化するステップをさらに含む、請求項79から92のいずれか一項に記載の方法。
【請求項94】
前記書き込み可能なポリマーを局所的に照明するまたは局所的に励起させるステップをさらに含む、請求項79から93のいずれか一項に記載の方法。
【請求項95】
前記局所的に照明するまたは局所的に励起させるステップが、誘導放出抑制(STED)レーザーを使用する、請求項94に記載の方法。
【請求項96】
2つまたはそれよりも多くの書き込み可能なポリマーからの2つまたはそれよりも多くのデータフィールドをエンドツーエンドで接合し、それにより、2つまたはそれよりも多くのデータフィールドを含む接合ポリマーを生じさせるステップをさらに含む、請求項79から95のいずれか一項に記載の方法。
【請求項97】
前記書き込み可能なポリマーが前記書き込みデバイスのナノポアを通る通過速度を制御するステップをさらに含む、請求項79から96のいずれか一項に記載の方法。
【請求項98】
複数の書き込み可能なポリマーを前記データ書き込みデバイスを通過させて、同じデータを書き込む(例えば、データ重複性を生じさせる)、請求項79から97のいずれか一項に記載の方法。
【請求項99】
データが符号化されたポリマーからデータを読み取るための方法であって、
前記ポリマーの骨格に沿って反復的に間隔を置いて前記ポリマーの骨格を介して共有結合により連結した変換可能な残基を含む、前記データが符号化されたポリマーを提供するステップであって、前記変換可能な残基の第1のサブセットが第1の状態にあり、前記変換可能な残基の第2のサブセットが第2の状態にあり、前記第1の状態と前記第2の状態が異なり、前記第1の状態にある前記複数の変換可能な残基と前記第2の状態にある前記複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、
前記書き込み可能なデータが符号化されたポリマーをデータ読み取りデバイスを通過させて、前記データが符号化されたポリマー上の符号化されたデータを読み取るステップと
を含む、方法。
【請求項100】
前記書き込み可能なポリマーが、書き込み可能な核酸ポリマーであり、前記複数の変換可能な残基が、変換可能な核酸塩基である、請求項99に記載の方法。
【請求項101】
前記第1の状態にある変換可能な残基を光によって前記第2の状態に変換することができる、請求項99または100に記載の方法。
【請求項102】
前記データ読み取りデバイスが、ナノポアを含む、請求項99から101のいずれか一項に記載の方法。
【請求項103】
前記データ読み取りデバイスが、シーケンシングデバイスである、請求項99から101のいずれか一項に記載の方法。
【請求項104】
前記シーケンシングデバイスが、合成によるシーケンシングデバイスである、請求項103に記載の方法。
【請求項105】
前記書き込み可能なポリマーが通過する間の電解質における電流の流れを測定するステップをさらに含む、請求項99から104のいずれか一項に記載の方法。
【請求項106】
前記複数の変換可能な残基のそれぞれが前記第1の状態にあるのかそれとも前記第2の状態にあるのかを、測定された、書き込み可能なポリマーが通過する間の電解質における電流の流れに基づいて決定するステップをさらに含む、請求項99から105のいずれか一項に記載の方法。
【請求項107】
前記データが符号化されたポリマーを前記データ読み取りデバイスを再度通過させて、前記データが符号化されたポリマー上の符号化されたデータを再度読み取るステップをさらに含む、請求項99から106のいずれか一項に記載の方法。
【請求項108】
前記データが符号化されたポリマーの複数のコピー上の符号化されたデータを比較することにより、前記データが符号化されたポリマー上の符号化されたデータを検証し、補正するステップをさらに含む、請求項99から107のいずれか一項に記載の方法。
【請求項109】
データが符号化された核酸ポリマーからデータを読み取るまたは復号するための方法であって、
複数の変換された核酸塩基であって、変換された核酸塩基それぞれが第1の核酸塩基構造を含み、前記第1の変換された核酸塩基が第1の状態から第2の状態に変換されており、前記第1の状態と前記第2の状態が異なる、複数の変換された核酸塩基と、
複数の変換可能な核酸塩基であって、変換可能な核酸塩基それぞれが第2の核酸塩基構造および直接連結した脱離基を含み、前記変換可能な核酸塩基が第1の状態でもたらされ、前記第2の核酸塩基構造から前記第2の脱離基を放出させることによって前記第1の状態から第2の状態に変換することが可能であり、前記第1の状態と前記第2の状態が異なる、複数の変換可能な核酸塩基と
を含む、前記データが符号化された核酸ポリマーの複数の重複コピーを提供するステップであって、
前記変換された核酸塩基と変換可能な核酸塩基が、核酸ポリマー骨格を介して連結している、ステップと、
前記核酸ポリマーの複数の重複コピーの各重複コピーの配列を決定するステップと
を含む、方法。
【請求項110】
前記複数の変換された核酸塩基と前記複数の変換可能な核酸塩基を検出するステップと、
検出された複数の変換された核酸塩基に基づいて前記データを復号するステップと
をさらに含む、請求項109に記載の方法。
【請求項111】
前記第1の状態にある前記複数の変換された核酸塩基と前記第2の状態にある前記複数の変換された核酸塩基がポリメラーゼ酵素によって可読である、請求項109または110に記載の方法。
【請求項112】
前記第1の状態にある前記複数の変換可能な核酸塩基と前記第2の状態にある前記複数の変換可能な核酸塩基がポリメラーゼ酵素によって可読である、請求項109から111のいずれか一項に記載の方法。
【請求項113】
前記複数の変換された核酸塩基と前記複数の変換可能な核酸塩基が、前記データが符号化された核酸ポリマーの重複コピーの配列決定結果に基づいて検出される、請求項109から112のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、それぞれの内容全体が参照により本明細書に組み込まれる2021年7月28日出願の米国仮特許出願第63/226,720号および2022年3月14日出願の米国仮特許出願第63/269,324号に基づく利益を主張するものである。
【0002】
技術分野
本開示は、概して、データを核酸分子に保存するための組成物、システム、および方法を対象とする。
【背景技術】
【0003】
背景
デジタルデータの量が増加するにつれ、デジタルデータを長期にわたり保存するという厄介な問題が、急速に増大する問題になりつつある。電子的にまたは磁気的にアーカイブされたデジタルデータは、保存中に容易に操作される、歪められる、かつ/または失われる恐れがある。アーカイブ用データストレージのための効率的なソリッドステートの電子的方法が存在するが、何年も安定なものではなく、データを定期的に書き直すか新しいデバイスに移行するかしなければデータが消失する。同様に、磁気テープがデータアーカイブのために一般に使用されるが、これも経時的に劣化する。したがって、データを効率的に符号化し、特に長期間にわたって保存するための方法が非常に積極的に探求されている。
【0004】
核酸分子(特にDNA)により、データストレージに伴う問題を克服するための潜在的な解決法がもたらされる。核酸ポリマーは、塩基がリピートされる配列を有し、本質的にデジタル情報である生化学的分子であり、高密度で非常に長い持続時間にわたって安定に保存され得る。天然のDNAは、4つの塩基:A、C、T、およびGに符号化されたデジタル情報を含有し、合成される鎖の配列にバイナリデータを符号化するために使用することができる。DNAの単一のポリマーは非常に長いものであり得(例えば染色体に関して)、数百万ビットのデータが符号化される。1立方インチのDNAに1018バイトのデータを符号化することができると推定されている。さらに、DNAは比較的安定であり、数万年または数十万年の年月を経た試料からさえも配列情報が得られている。したがって、DNAは、データのアーカイブに関して注目すべき見込みをもたらすものである。
【0005】
さらに、核酸分子に保存されたデータへのアクセスを容易にするために、保存されたデータをハイスループットシーケンシング技法によって迅速にかつ低費用で読み取ることができる。シーケンシング技術の進歩により、費用が著しく低下しており、かつシーケンシングのスピードが上昇しており、それにより、DNA中のデータを効率的に読み取ることが可能になっている。新しいロングリード単一分子技術により、数万塩基長の単一のDNA分子の塩基を迅速に読み取ることが可能になる。新しいナノポア技術により、DNAの単一分子の配列を数秒~数分で読み取ることが可能になり(それぞれの開示が参照により本明細書に組み込まれるN Kono and K. Arakawa, Dev Growth Differ. 2019; 61: 316-326;およびQ Chen and Z. Liu, Sensors (Basel). 2019; 19: 1886を参照されたい)、数万塩基対長またはそれよりも長い鎖の配列を読み取ることができる。
【0006】
核酸はデータストレージの重要な潜在的供給源であるが、核酸、特にデータを定義する配列を合成するプロセスは非効率的であり、したがって、核酸への符号化プロセスが、核酸をデータストレージとして利用するための実質的な障壁になる。DNA中のデータを保存するための現行の手法は、デジタル情報が符号化された任意の配列の鎖を化学的にまたは酵素的に合成することを伴うものである(それぞれの開示が参照により本明細書に組み込まれるG. M. Church, Y. Gao, and S. Kosuri Science. 2012; 337: 1628; X. Chengtao, et al., Nucleic Acids Res. 2021; 49: 5451-5469;およびE. Yoo, et al., Comput Struct Biotechnol J. 2021; 19: 2468-2476を参照されたい)。オリゴヌクレオチド合成機により、およそ100~200ヌクレオチドまでの長さのDNAを作製することができる。特殊化された合成機では、数百または数千オリゴヌクレオチドを1回で作製することができ、よりハイスループットのデータ書き込みが見込まれる。化学的DNA合成に加えて、ポリメラーゼまたは他の酵素を伴う酵素的手法も、配列に任意のデータが符号化されたDNAの創出に関して調査されている。これらの酵素的手法は、特殊化されたヌクレオチドを1度に1つずつ添加すること、またはDNAの短いセグメントを段階的に添加することを伴うものである。
合成の間にDNAにデータを符号化する手法は、収率、鎖の長さ、時間、および費用によって制限される。現行の効率的なDNA合成機では、最長でおよそ200ヌクレオチドの鎖が作製され、したがって、比較的少量の情報が符号化される。配列の短さを補うためには、多数の異なるオリゴヌクレオチドを合成しなければならない。オリゴヌクレオチド合成には、段階的高収率を実現するために過剰な試薬が必要であり、費用のかかる試薬および溶媒の消費が必要である。また、オリゴヌクレオチド合成には、ヌクレオチドの添加毎にこれらの高収率を実現するために時間も必要になり(一般に、各ステップに1~5分間)、これは、より多量のデータを符号化するためには長時間が必要になることを意味する。開発中の一般的な酵素的手法は、同様にヌクレオチドまたはヌクレオチドの群を段階的に添加するものであり、非常に長い鎖を作製し、大量のデータを符号化する能力に関する著しい改善は未だなされていない。酵素的合成手法も段階的に行われるので、同様にデータ符号化のスピードに限界がある。さらに、上記の化学的戦略および酵素的戦略はどちらも、一般には比較的短い鎖を作製するものであるので、単一分子シーケンシングに理想的ではない可能性があり、その代わりに、1つ1つの書き込みされたDNAをより多量に必要とするシーケンシング方法に依拠し得る。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】N Kono and K. Arakawa, Dev Growth Differ. 2019; 61: 316-326
【非特許文献2】Q Chen and Z. Liu, Sensors (Basel). 2019; 19: 1886: 1628
【非特許文献3】G. M. Church, Y. Gao, and S. Kosuri Science. 2012; 337
【非特許文献4】X. Chengtao, et al., Nucleic Acids Res. 2021; 49: 5451-5469
【非特許文献5】E. Yoo, et al., Comput Struct Biotechnol J. 2021; 19: 2468-2476
【発明の概要】
【課題を解決するための手段】
【0008】
本開示の要旨
一態様では、データを符号化するためのポリマーであって、
ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含み、
複数の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読であり、
複数の変換可能な残基が第1の状態および第2の状態においてポリマーに共有結合により連結している、ポリマーが本明細書に提示される。
【0009】
ある特定の実施形態では、ポリマーは、核酸ポリマーであり、複数の変換可能な残基は、変換可能な核酸塩基である。
【0010】
ある特定の実施形態では、核酸ポリマーは、一本鎖核酸ポリマーである。
【0011】
ある特定の実施形態では、核酸ポリマーは、二本鎖核酸ポリマーである。
【0012】
ある特定の実施形態では、核酸ポリマーは、デオキシリボ核酸(DNA)、リボ核酸(RNA)、ホスホロチオエートDNA、グリセロール核酸(GNA)、トレオース核酸(TNA)、ロックド核酸(LNA)、またはその組合せを含む。
【0013】
ある特定の実施形態では、核酸ポリマーは、10個よりも多くの変換可能な残基を含む。
【0014】
ある特定の実施形態では、核酸ポリマー内のヌクレオチドの総数の変換可能な残基に対する比は、2から100の間である。
【0015】
ある特定の実施形態では、複数の変換可能な核酸塩基は、天然に存在しない核酸塩基である。
【0016】
ある特定の実施形態では、複数の変換可能な核酸塩基は、修飾された天然に存在する核酸塩基または天然に存在する核酸塩基の誘導体である。
【0017】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれが、化学修飾可能な部分を含む。
【0018】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれの化学修飾可能な部分は、変換可能な核酸塩基の塩基に直接付着している。
【0019】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれの化学修飾可能な部分は、塩基にリンカーも側鎖も介さずに付着している。
【0020】
ある特定の実施形態では、複数の変換可能な核酸塩基は、核酸の骨格に糖を介して共有結合により連結している。
【0021】
ある特定の実施形態では、化学修飾可能な部分は、光、電圧、酵素剤、化学試薬、または酸化還元剤によって活性化可能であり、それにより、第1の状態が第2の状態に変換される。
【0022】
ある特定の実施形態では、化学修飾可能な部分は、光によって活性化可能であり、それにより、第1の状態が第2の状態に変換される。
【0023】
ある特定の実施形態では、第1の状態から第2の状態への変換は、不可逆反応によって起こる。
【0024】
ある特定の実施形態では、変換可能な核酸塩基は、第2の状態への変換後、天然に存在する核酸塩基になる。
【0025】
ある特定の実施形態では、変換可能な核酸塩基は、第2の状態への変換後、グアニン、アデニン、チミン、ウラシルまたはシトシンになる。
【0026】
ある特定の実施形態では、ポリマーの骨格(例えば、核酸ポリマーのリン酸および糖)は、第1の状態から第2の状態への変換の間、変化しないままである。
【0027】
ある特定の実施形態では、ポリマーは、変換可能な残基の異なる2つまたはそれよりも多くのセットを含み、変換可能な残基の各セットが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態は異なる。
【0028】
ある特定の実施形態では、複数の変換可能な残基のそれぞれが、光によって活性化することができる化学修飾可能な部分を含む。
【0029】
ある特定の実施形態では、変換可能な残基の異なる2つまたはそれよりも多くのセットは、波長が異なる光によって活性化可能である。
【0030】
ある特定の実施形態では、変換可能な残基の第1のセットは第1の波長の光によって活性化可能であり、変換可能な残基の第2のセットは第2の波長の光によって活性化可能であり、第1の波長と第2の波長は異なる。
【0031】
ある特定の実施形態では、化学修飾可能な部分は、1つまたは複数の光により除去可能な基を含む。
【0032】
ある特定の実施形態では、化学修飾可能な部分は脱離基である。
【0033】
ある特定の実施形態では、1つまたは複数の光により除去可能な基は、
【化1】
(式中、Xは、NR、NHR、OR、またはSRを表し、Rは、光により除去可能な基が付着している核酸塩基である)
である。
【0034】
ある特定の実施形態では、複数の変換可能な核酸塩基は、325nm、360nm、または400nmの波長の光によって変換することが可能である。
【0035】
ある特定の実施形態では、複数の変換可能な核酸塩基は、400nmから850nmの間の波長の光によって変換可能である。
【0036】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれが、酸化還元によって活性化可能な化学修飾可能な部分を含む。
【0037】
ある特定の実施形態では、化学修飾可能な部分は、局所的な酸化によって活性化することが可能である。
【0038】
ある特定の実施形態では、化学修飾可能な部分は、電極を使用した酸化によって活性化することが可能である。
【0039】
ある特定の実施形態では、変換可能な核酸塩基を含むヌクレオチドは、
【化2】
からなる群から選択される。
【0040】
ある特定の実施形態では、変換可能な核酸塩基は、O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンからなる群から選択される。
【0041】
ある特定の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、天然に存在しないおよび/または修飾された核酸塩基を検出し、区別することが可能なシーケンシング方法によって可読である。
【0042】
ある特定の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、ナノポアシーケンシングによって可読である。
【0043】
ある特定の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、合成によるシーケンシングによって可読である。
【0044】
ある特定の実施形態では、複数の変換可能な核酸塩基は、第2の状態に変換されると、第1の状態と比較して複数の変換可能な核酸塩基の特性が改変される(例えば、サイズが縮小する、形状が変更される、H結合が改変される、および/またはポリメラーゼ基質能が改変される)。
【0045】
ある特定の実施形態では、複数の変換可能な核酸塩基のうちの1つまたは複数は、第2の状態から第3の状態に変換することが可能であり、複数の変換可能な核酸塩基のうちの1つまたは複数が第3の状態において核酸ポリマーに共有結合により付着している。
【0046】
ある特定の実施形態では、複数の変換可能な残基のそれぞれが、独立に、かつ選択的に変換することが可能である。
【0047】
ある特定の実施形態では、本明細書に提示されるポリマーは、ポリマーの骨格を介して連結した複数のスペーサー残基をさらに含み、ここで、複数の変換可能な残基のそれぞれが、複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている。
【0048】
ある特定の実施形態では、複数の変換可能な残基の間の反復的間隔は、ポリマー上にデータを符号化するための書き込み機構の分解能に適合する。
【0049】
ある特定の実施形態では、2つの隣接する変換可能な残基の間の反復的間隔は、データをポリマーにおいて符号化するためのデータ符号化機構の分解能と等しいまたはそれよりも大きい。
【0050】
ある特定の実施形態では、書き込み機構の分解能は、少なくとも1nmである。
【0051】
ある特定の実施形態では、複数のスペーサー残基は、変換可能な残基の読み取りに干渉しない。
【0052】
ある特定の実施形態では、ポリマー内の複数のスペーサー残基は、同じスペーサー残基である。
【0053】
ある特定の実施形態では、複数のスペーサー残基は、2つまたはそれよりも多くの異なるスペーサー残基(例えば、異なる核酸塩基、例えば、異なる天然に存在する核酸塩基)を含む。
【0054】
ある特定の実施形態では、ポリマーは、スペーサー残基から本質的になる。
【0055】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれは、2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、または50個のスペーサー残基によって分離されている。
【0056】
ある特定の実施形態では、複数の変換可能な核酸塩基のそれぞれは、6個のスペーサー残基によって分離されている。
【0057】
ある特定の実施形態では、複数のスペーサー残基は、天然に存在する核酸塩基、天然に存在しない核酸塩基、テトラヒドロフラン脱塩基残基、またはエチレングリコール残基である。
【0058】
ある特定の実施形態では、複数のスペーサー残基は、天然に存在する核酸塩基である。
【0059】
ある特定の実施形態では、本明細書に提示されるポリマーは、ポリマーの骨格に連結した1つまたは複数のデリミタをさらに含む。
【0060】
ある特定の実施形態では、1つまたは複数のデリミタのそれぞれは、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む。
【0061】
ある特定の実施形態では、1つまたは複数のデリミタは、天然に存在する核酸塩基を含む。
【0062】
ある特定の実施形態では、1つまたは複数のデリミタにより、ポリマー内の2つまたはそれよりも多くの隣接するデータフィールドが分離されている。
【0063】
ある特定の実施形態では、本明細書に提示されるポリマーは、1つまたは複数のデータタグをさらに含む。
【0064】
ある特定の実施形態では、1つまたは複数のデータタグは、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む。
【0065】
ある特定の実施形態では、ポリマーは、核酸ポリマーであり、1つまたは複数のデータタグは、核酸ポリマーの5’末端または3’末端に存在する。
【0066】
ある特定の実施形態では、1つまたは複数のデータタグは、核酸ポリマーに、核酸ポリマーが合成される間に、複数の変換可能な核酸塩基が第2の状態に変換される間に、または複数の変換可能な核酸塩基が第2の状態に変換された後に、ライゲーションによって組み入れられる。
【0067】
ある特定の実施形態では、ポリマーは、標準的な核酸保存プロトコールの下で保存することができる。
【0068】
ある特定の実施形態では、ポリマーは、適当なヌクレアーゼフリー溶液中、室温でまたは低温(例えば、-20℃)で保存することができる核酸ポリマーである。
【0069】
ある特定の実施形態では、ポリマーは、安定剤を用いずに室温で保存することができる。
【0070】
別の態様では、データ書き込みのためのシステムであって、
ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含む書き込み可能なポリマーであって、複数の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読であり、複数の変換可能な残基が、第1の状態および第2の状態においてポリマーに共有結合により連結している、書き込み可能なポリマーと、
書き込み可能なポリマー上にデータを書き込むためのデータ書き込みデバイスと
を含む、システムも本明細書に提示される。
【0071】
ある特定の実施形態では、書き込み可能なポリマーは、書き込み可能な核酸ポリマーであり、複数の変換可能な残基は、変換可能な核酸塩基である。
【0072】
ある特定の実施形態では、データ書き込みデバイスは、ナノポアを含む。
【0073】
ある特定の実施形態では、データ書き込みデバイスは、光源を備えた顕微鏡を含む。
【0074】
ある特定の実施形態では、データ書き込みデバイスは、複数の変換可能な核酸塩基を光パルス、電圧パルス、酵素剤、または酸化還元剤によって第2の状態に変換する。
【0075】
ある特定の実施形態では、データ書き込みデバイスは、複数の変換可能な核酸塩基を光パルスによって第2の状態に変換する。
【0076】
ある特定の実施形態では、データ書き込みデバイスは、光照射デバイスを含む。
【0077】
別の態様では、書き込み可能な核酸ポリマーを生成するための方法であって、
変換可能な核酸塩基を含むデータフィールドのリピートと相補的な環状一本鎖オリゴヌクレオチド鋳型を提供するステップと、
環状一本鎖オリゴヌクレオチド鋳型を核酸プライマー、ポリメラーゼ、および三リン酸ヌクレオチドの存在下でインキュベートするステップであって、三リン酸ヌクレオチドが、第1の状態にある変換可能な核酸塩基を含み、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なる、ステップと
を含む、方法も本明細書に提示される。
【0078】
ある特定の実施形態では、環状一本鎖オリゴヌクレオチド鋳型は、変換可能な核酸塩基と相補的な核酸塩基を含み、相補的な核酸塩基の間に反復的に間隔が置かれており、したがって、鋳型を核酸プライマー、ポリメラーゼ、および三リン酸ヌクレオチドと一緒にインキュベートすることにより、核酸ポリマーの骨格に沿って反復的に間隔を置いて核酸ポリマーの骨格を介して共有結合により連結した複数の変換可能な核酸塩基を含む核酸ポリマーがもたらされ、複数の変換可能な核酸塩基は、第1の状態および第2の状態において核酸ポリマーに共有結合により連結している。
【0079】
ある特定の実施形態では、データフィールドのリピートは、スペーサー核酸塩基をさらに含み、三リン酸ヌクレオチドは、三リン酸スペーサーヌクレオチドをさらに含む。
【0080】
さらに別の態様では、書き込み可能な核酸ポリマーを生成するための方法であって、
複数のオリゴマーを化学合成するステップであって、各オリゴマーが、核酸ポリマー骨格に沿って反復的に間隔を置いて核酸ポリマー骨格を介して連結した複数の変換可能な核酸塩基を含み、複数の変換可能な核酸塩基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、複数の変換可能な核酸塩基が、第1の状態および第2の状態において核酸ポリマーに共有結合により付着しており、第1の状態と第2の状態が異なる、ステップと、
複数のオリゴマーをライゲーションして、書き込み可能な核酸ポリマーを形成するステップと
を含む、方法が本明細書に提示される。
【0081】
ある特定の実施形態では、複数のオリゴマーのそれぞれは、核酸ポリマーの骨格を介して連結した複数のスペーサー残基を含み、複数の変換可能な核酸塩基のそれぞれは、複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている。
【0082】
ある特定の実施形態では、ライゲーションするステップは、化学的ライゲーションによるものである。
【0083】
ある特定の実施形態では、ライゲーションするステップは、酵素的ライゲーションによるものである。
【0084】
ある特定の実施形態では、ライゲーションするステップにおいて相補DNAスプリントを使用する。
【0085】
ある特定の実施形態では、方法は、ライゲーションするステップの前に、複数の相補物をオリゴマーとアニーリングさせるステップをさらに含む。
【0086】
さらに別の態様では、書き込み可能なポリマー上にデータを書き込むための方法であって、
ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格を介して共有結合により連結した複数の変換可能な残基を含む書き込み可能なポリマーを提供するステップであって、複数の変換可能な残基の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、
データ書き込みデバイスを利用して、複数の変換可能な残基のうちの1つまたは複数を第2の状態に選択的に変換し、それにより、データが符号化されたポリマーを生成するステップと
を含む、方法が本明細書に提示される。
【0087】
ある特定の実施形態では、書き込み可能なポリマーは、書き込み可能な核酸ポリマーであり、複数の変換可能な残基は、変換可能な核酸塩基である。
【0088】
ある特定の実施形態では、データ書き込みデバイスは、ナノポアを含み、方法は、書き込み可能なポリマーを書き込みデバイスのナノポアを通過させるステップであって、ナノポアにより、複数の変換可能な残基のうちの1つまたは複数を第2の状態に変換する、ステップをさらに含む。
【0089】
ある特定の実施形態では、ナノポアは、光パルスまたは酸化還元エネルギーを供給して、変換可能な核酸塩基を第1の状態から第2の状態に選択的に変換するプラズモニックナノポアである。
【0090】
ある特定の実施形態では、データ書き込みデバイスは、プラズモニックウェルまたはチャネルを含み、方法は、書き込み可能なポリマーをデータ符号化デバイスのプラズモニックウェルまたはチャネルに移すステップであって、プラズモニックウェルまたはチャネルにより、光パルスまたは酸化還元エネルギーを供給して、変換可能な核酸塩基を第1の状態から第2の状態に選択的に変換する、ステップをさらに含む。
【0091】
ある特定の実施形態では、データ書き込みデバイスは、変換可能な残基を光パルス、電圧パルス、酵素剤、または酸化還元剤によって第2の状態に選択的に変換する。
【0092】
ある特定の実施形態では、データ書き込みデバイスは、変換可能な残基を光パルスによって第2の状態に選択的に変換する。
【0093】
ある特定の実施形態では、変換可能な残基は、第2の状態への変換後、天然に存在する核酸塩基になる。
【0094】
ある特定の実施形態では、複数の変換可能な残基は、2つまたはそれよりも多くの型の変換可能な残基を含み、第1の型の変換可能な残基は、第1の波長の光によって活性化可能であり、第2の型の変換可能な残基は、第2の波長の光によって活性化可能である。
【0095】
ある特定の実施形態では、複数の変換可能な残基の間の反復的間隔は、変換可能な残基を選択的に変換するためのデータ書き込みデバイスの分解能に適合する。
【0096】
ある特定の実施形態では、選択的に変換するステップは、書き込み可能なポリマーの特定の位置付けを必要としない。
【0097】
ある特定の実施形態では、変換可能な残基の第2の状態への変換は、データが符号化されたポリマー上で一様ではない。
【0098】
ある特定の実施形態では、変換可能な残基の第2の状態への変換は、データが符号化されたポリマー上のある特定の位置に限定されない。
【0099】
ある特定の実施形態では、方法は、書き込み可能なポリマー(例えば、書き込み可能なDNA)を固体支持体上に引き伸ばすまたはコーミングするステップをさらに含む。
【0100】
ある特定の実施形態では、方法は、色素を使用して変換可能な残基の場所を可視化するステップをさらに含む。
【0101】
ある特定の実施形態では、方法は、書き込み可能なポリマーを局所的に照明するまたは局所的に励起させるステップをさらに含む。
【0102】
ある特定の実施形態では、局所的に照明するまたは局所的に励起させるステップは、誘導放出抑制(STED)レーザーを使用する。
【0103】
ある特定の実施形態では、方法は、2つまたはそれよりも多くの書き込み可能なポリマーからの2つまたはそれよりも多くのデータフィールドをエンドツーエンドで接合し、それにより、2つまたはそれよりも多くのデータフィールドを含む接合ポリマーを生じさせるステップをさらに含む。
【0104】
ある特定の実施形態では、方法は、書き込み可能なポリマーが書き込みデバイスのナノポアを通る通過速度を制御するステップをさらに含む。
【0105】
ある特定の実施形態では、複数の書き込み可能なポリマーをデータ書き込みデバイスを通過させて、同じデータを書き込む(例えば、データ重複性を生じさせる)。
【0106】
さらに別の態様では、データが符号化されたポリマーからデータを読み取るための方法であって、
ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格を介して共有結合により連結した変換可能な残基を含む、データが符号化されたポリマーを提供するステップであって、変換可能な残基の第1のサブセットが第1の状態にあり、変換可能な残基の第2のサブセットが第2の状態にあり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、
書き込み可能なデータが符号化されたポリマーをデータ読み取りデバイスを通過させて、データが符号化されたポリマー上の符号化されたデータを読み取るステップと
を含む、方法も本明細書に提示される。
【0107】
ある特定の実施形態では、書き込み可能なポリマーは、書き込み可能な核酸ポリマーであり、複数の変換可能な残基は、変換可能な核酸塩基である。
【0108】
ある特定の実施形態では、第1の状態にある変換可能な残基を光によって第2の状態に変換することができる。
【0109】
ある特定の実施形態では、データ読み取りデバイスは、ナノポアを含む。
【0110】
ある特定の実施形態では、データ読み取りデバイスは、シーケンシングデバイスである。
【0111】
ある特定の実施形態では、シーケンシングデバイスは、合成によるシーケンシングデバイスである。
【0112】
ある特定の実施形態では、方法は、書き込み可能なポリマーが通過する間の電解質における電流の流れを測定するステップをさらに含む。
【0113】
ある特定の実施形態では、方法は、複数の変換可能な残基のそれぞれが第1の状態にあるのかそれとも第2の状態にあるのかを、測定された、書き込み可能なポリマーが通過する間の電解質における電流の流れに基づいて決定するステップをさらに含む。
【0114】
ある特定の実施形態では、方法は、データが符号化されたポリマーをデータ読み取りデバイスを再度通過させて、データが符号化されたポリマー上の符号化されたデータを再度読み取るステップをさらに含む。
【0115】
ある特定の実施形態では、方法は、データが符号化されたポリマーの複数のコピー上の符号化されたデータを比較することにより、データが符号化されたポリマー上の符号化されたデータを検証し、補正するステップをさらに含む。
【0116】
さらに別の態様では、データが符号化された核酸ポリマーからデータを読み取るまたは復号するための方法であって、
複数の変換された核酸塩基であって、変換された核酸塩基それぞれが第1の核酸塩基構造を含み、第1の変換された核酸塩基が第1の状態から第2の状態に変換されており、第1の状態と第2の状態が異なる、複数の変換された核酸塩基と、
複数の変換可能な核酸塩基であって、変換可能な核酸塩基それぞれが第2の核酸塩基構造および直接連結した脱離基を含み、変換可能な核酸塩基が第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させることによって第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なる、複数の変換可能な核酸塩基と
を含む、データが符号化された核酸ポリマーの複数の重複コピーを提供するステップであって、
変換された核酸塩基と変換可能な核酸塩基が、核酸ポリマー骨格を介して連結している、ステップと、
核酸ポリマーの複数の重複コピーの各重複コピーの配列を決定するステップと
を含む、方法も本明細書に提示される。
ある特定の実施形態では、方法は、複数の変換された核酸塩基と複数の変換可能な核酸塩基を検出するステップと、検出された複数の変換された核酸塩基に基づいてデータを復号するステップとをさらに含む。
【0117】
ある特定の実施形態では、第1の状態にある複数の変換された核酸塩基と第2の状態にある複数の変換された核酸塩基は、ポリメラーゼ酵素によって可読である。
【0118】
ある特定の実施形態では、第1の状態にある複数の変換可能な核酸塩基と第2の状態にある複数の変換可能な核酸塩基は、ポリメラーゼ酵素によって可読である。
【0119】
ある特定の実施形態では、複数の変換された核酸塩基と複数の変換可能な核酸塩基は、データが符号化された核酸ポリマーの重複コピーの配列決定結果に基づいて検出される。
【0120】
以下の図面およびデータグラフを参照することで説明および特許請求の範囲がより詳細に理解されよう。以下の図面およびデータグラフは例示的な実施形態として示すものであり、本開示の範囲の完全な記述であると解釈されるべきではない。
【図面の簡単な説明】
【0121】
図1図1Aおよび1Bは、種々の実施形態による、書き込み可能な核酸ポリマーの概略図を提示する。
【0122】
図2図2Aおよび2Bは、種々の実施形態による、データ符号化可能な核酸ポリマーの概略図を提示する。
【0123】
図3-1】図3A~3Gは、書き込み可能な核酸ポリマーに使用するための変換可能な核酸塩基の種々の例の構造を示す。
図3-2】同上。
図3-3】同上。
【0124】
図4図4は、種々の実施形態による、変換可能な核酸塩基O6-ニトロベンジル-グアニンの例を提示する。
【0125】
図5-1】図5Aおよび5Bは、種々の実施形態による、書き込み可能なポリマーに使用するための変換可能な核酸塩基を含むヌクレオチドの種々の例の構造を示す。
図5-2】同上。
【0126】
図6図6は、種々の実施形態による、書き込み可能なポリマーに使用するための変換可能な核酸塩基における種々の除去可能な基(例えば、脱離基)の分子構造図を提示する。
【0127】
図7図7は、種々の実施形態による、ローリングサークル反応によるポリメラーゼ伸長を利用する書き込み可能な核酸ポリマーの生成の概略図を提示する。
【0128】
図8図8は、種々の実施形態による、化学合成およびライゲーションを利用する書き込み可能な核酸ポリマーの生成の概略図を提示する。
【0129】
図9図9A~9Cは、種々の実施形態による、ナノポアおよび光エネルギーを利用する書き込み可能な核酸ポリマーにおけるデータの符号化についての概略図を提示する。
【0130】
図10図10A~10Cは、種々の実施形態による、ナノポアおよび光エネルギーを利用する、変換可能な核酸塩基のペアを含むデータ符号化可能な核酸ポリマーにおけるデータの符号化についての概略図を提示する。
【0131】
図11図11A~11Cは、種々の実施形態による、ナノポアおよび光エネルギーを利用する、変換可能な核酸塩基を含む書き込み可能な核酸ポリマーにおけるデータの符号化を例示する。図11A:変換可能な核酸塩基CおよびCを含む書き込み可能な核酸ポリマー;図11B:書き込み可能な核酸ポリマーがナノポアを通過し、ある特定の変換可能な核酸塩基(例えば、3’末端のC)が光エネルギーによって変換されて、書き込まれた状態の変換された核酸塩基(例えば、C’)になっている;ならびに図11C:ある特定の変換可能な核酸塩基CおよびCが選択的に変換されて、それぞれ変換された核酸塩基C’およびC’になり、その結果、確率的にまたは不規則に間隔を置いて存在する変換された核酸塩基C’およびC’を含む、データが符号化された核酸ポリマーが生じている。
【0132】
図12図12A~12Cは、種々の実施形態による、ナノポアおよび光エネルギーを利用する、対(duad)を含む書き込み可能な核酸ポリマーにおけるデータの符号化についての概略図を提示する。
【0133】
図13図13A~13Cは、種々の実施形態による、書き込み可能な核酸ポリマーへの使用のためのデュアルビットの変換可能な核酸塩基の分子構造図を提示する。
【0134】
図14図14Aおよび14Bは、種々の実施形態による、ナノポア電流に基づくシーケンシング(図14A)および合成によるシーケンシング(図14B)を使用したデータ復号戦略を提示する。
【0135】
図15図15は、変換可能な核酸塩基を含むデータ符号化可能な核酸ポリマーの、ある特定の
【化3】
をTに、および
【化4】
をGにそれぞれ選択的に変換することによる、バイナリデータ1010010を用いた符号化の例を例示する。データ符号化可能な核酸ポリマー内のある特定の変換可能な核酸塩基はデータ符号化プロセス中にスキップされ、結果として得られる、データが符号化された核酸ポリマーは、確率的におよび/または不規則に間隔を置いて存在する変換された核酸塩基(例えば、TおよびG)を含む。
【発明を実施するための形態】
【0136】
詳細な説明
データ符号化/復号(書き込み/読み取り)およびデータストレージのための、データ符号化可能ポリマー(例えば、核酸ポリマー)の組成物ならびにその方法およびシステムが本明細書に提示される。本明細書に記載のポリマー(例えば、核酸ポリマー)を作出する方法も本明細書に提示される。
【0137】
ここで図およびデータを参照すると、種々の実施形態による、核酸データストレージの組成物およびシステム、使用方法および合成方法が開示される。いくつかの実施形態では、データストレージのシステムは、変換可能な1つまたは複数の核酸塩基を有する書き込み可能な(すなわち、データ符号化可能な)核酸ポリマーを含む。したがって、書き込み可能な核酸ポリマーは、符号化可能なブランクテープに類似したものであり、書き込み可能な核酸ポリマーの1つまたは複数の核酸塩基を変換することにより、書き込み可能な核酸ポリマーにおける符号化がなされる。核酸塩基の変換は、バイナリコードであると考えることができ、変換可能な核酸塩基それぞれが「ビット」に類似したものであり、変換されていない核酸塩基は「0」に類似したものであり、変換された核酸塩基が「1」に類似したものである。しかし、バイナリコードのみが可能なのではなく、コードを3進数、4進数、または他の数字コード方式で書き込むこともでき、それは、複数の型の変換可能な塩基を利用して、または、複数回の書き込みを実施して変換可能な塩基の状態をさらに変更することによって行うことができることが理解されるべきである。一部の実施形態では、変換可能な核酸塩基の変換は安定または恒久的なものであり、長期間にわたるアーカイブが可能になる。一部の実施形態では、2つの変換可能なヌクレオチドの組合せは、「ビット」を含む。
【0138】
一部の実施形態では、変換可能な残基(例えば、変換可能な核酸塩基)は書き込み可能な「ビット」と称され、変換された残基(例えば、変換された核酸塩基、例えばネイティブな核酸塩基)は書き込まれた「ビット」と称される。
【0139】
一部の実施形態では、「書き込み可能」および「データ符号化可能」という用語は本明細書では互換的に使用される。一部の実施形態では、「書き込み」および「データ符号化」という用語は本明細書では互換的に使用される。
【0140】
一部の実施形態では、「脱離基」および「除去可能な基」という用語は本明細書では互換的に使用される。一部の実施形態では、変換可能な核酸塩基について言及する場合、「ペア(pair)」および「対(duad)」という用語は本明細書では互換的に使用される。「対」は、本明細書で使用される場合、本明細書に記載のポリマー(例えば、核酸ポリマー)内の、単回の書き込み作用または事象(例えば、同じ光のパルスまたは同じ電圧パルス)に両方が曝露されるように互いに対して十分近くに位置する、異なる変換可能な核酸塩基(例えば、書き込み可能なビット)のペアを指す。したがって、対を含む変換可能なヌクレオチドは、書き込み作用または事象の分解能よりも近くに存在する。
【0141】
本明細書に提示されるシステムの他の実施形態では、システムは、変換可能な核酸塩基(例えば、異なる構造を有する核酸塩基、例えば、異なる化学修飾可能な部分を有するもの)の2つまたはそれよりも多くのセットを含み、ここで、核酸塩基の変換(例えば、核酸塩基のケージ基の除去)は、バイナリコードであると考えることができ、変換可能な核酸塩基(または2つまたはそれよりも多くの変換可能な塩基セット)はそれぞれデータの書き込み可能な「ビット」に類似したものであり、変換された核酸塩基(またはさらに2つの変換された核酸塩基のセット)はそれぞれデータの書き込まれた「ビット」に類似したものである。一部の実施形態では、変換可能な核酸塩基を利用して、データビットを符号化し、ここで、第1の核酸塩基構造(すなわち、変換可能な核酸塩基の第1のセット)の変換は「0」に類似したものであり、ペアの第2の核酸塩基構造(すなわち、変換可能な核酸塩基の第2のセット)の変換は「1」に類似したものであり、ポリマー(例えば、核酸ポリマー)に沿った核酸塩基の選択的な変換によってデータを符号化することができる。一部の実施形態では、変換可能な核酸塩基のペアを利用して、データを書き込み可能なビットに符号化し、ここで、ペアの一方の核酸塩基の変換は「0」に類似したものであり、ペアの両方の核酸塩基の変換は「1」に類似したものであり、ポリマーに沿った核酸塩基ペア変換によってデータを符号化することができる。しかし、バイナリコードのみが可能なのではなく、コードを3進数、4進数、または他の数字コード方式で書き込むこともでき、これは、複数の型の変換可能な塩基を利用して、または、複数回の書き込みを実施して変換可能な塩基の状態をさらに変更することによって行うことができることが理解されるべきである。一部の実施形態では、変換可能な核酸塩基の変換は、長期間にわたって安定である、または恒久的なものであり、長期間のアーカイブが可能になる。
【0142】
一部の実施形態では、核酸ポリマーは一本鎖核酸ポリマーまたは二本鎖核酸ポリマーである。一部の実施形態では、核酸ポリマーは一本鎖核酸ポリマーである。一部の実施形態では、核酸ポリマーは二本鎖核酸ポリマーである。
【0143】
一部の実施形態は、書き込み可能な核酸ポリマーの組成物を対象とする。DNA、RNA、ホスホロチオエートDNA、グリセロール核酸(GNA)、トレオース核酸(TNA)を含めた(しかしこれだけに限定されない)任意の適当な核酸ポリマーを利用することができる。さらに、核酸ポリマーは、一本鎖であっても二本鎖であってもよい。いくつかの実施形態では、書き込み可能な核酸ポリマーは、ポリマー骨格によって連結した複数の変換可能な核酸塩基を含む。ある特定の実施形態では、変換可能な核酸塩基の間に間隔を置いて、核酸塩基それぞれを符号化に応じて独立に、かつ選択的に変換することができるような空間分解能がもたらされるようにする。一部の実施形態では、ポリマー骨格を介して連結したスペーサー残基を利用して、変換可能な核酸塩基の間に間隔をもたらす。一部の実施形態では、スペーサー残基は、書き込み機構に対して非反応性である。種々の実施形態では、書き込み可能な核酸ポリマーは、データを標識するためのデリミタおよび/またはデータタグをさらに含み得、そのそれぞれを特定の配列の核酸塩基によってもたらすことができる。
【0144】
一部の実施形態では、DNA、RNA、ホスホロチオエートDNA、グリセロール核酸(GNA)、トレオース核酸(TNA)、ロックド核酸(LNA)、およびこれらの組合せを含めた(しかしこれだけに限定されない)任意の適当な核酸ポリマーを利用することができる。
【0145】
一部の実施形態では、複数の変換可能なヌクレオチドは、1つまたは複数のポリメラーゼ酵素によって核酸ポリマーに組み入れることが可能である。
【0146】
一部の実施形態では、複数の変換可能な核酸塩基は、天然に存在しない核酸塩基である。一部の実施形態では、複数の変換可能な核酸塩基は、修飾された天然に存在する核酸塩基または天然に存在する核酸塩基の誘導体である。
【0147】
一部の実施形態では、複数の変換可能な核酸塩基のそれぞれは、化学修飾可能な部分を含む。一部の実施形態では、複数の変換可能な核酸塩基のそれぞれの化学修飾可能な部分は、変換可能な核酸塩基の塩基に直接付着している。一部の実施形態では、複数の変換可能な核酸塩基のそれぞれの化学修飾可能な部分は、塩基にリンカーも側鎖も介さずに付着している。一部の実施形態では、複数の変換可能な核酸塩基は、核酸の骨格の糖を介して核酸の骨格に共有結合により連結している。一部の実施形態では、複数の変換可能な核酸塩基の除去可能な基は、核酸塩基を介して核酸の骨格に共有結合により連結している。
【0148】
一部の実施形態では、変換可能な核酸塩基は、核酸ポリマーの骨格に、ネイティブなヌクレオチドの核酸塩基が核酸ポリマーの骨格に連結している(ヌクレオチドの糖を介して)のと同様に、リンカーを介在せずにまたは側鎖として連結している。
【0149】
一部の実施形態では、核酸塩基の変換(すなわち、第1の状態から第2の状態へ)は、核酸塩基から1つまたは複数の除去基を除去することによってなされる。いくつかの実施形態では、除去可能な基はケージング基である。
【0150】
一実施形態では、化学修飾可能な部分は、光によって活性化可能であり、それにより、第1の状態が第2の状態に変換される。一部の実施形態では、第1の状態から第2の状態への変換は、不可逆反応によって起こる。一部の実施形態では、変換可能な核酸塩基は、第2の状態への変換後、天然に存在する核酸塩基になる。一部の実施形態では、変換可能な核酸塩基は、第2の状態への変換後、ネイティブな核酸塩基になる。一実施形態では、変換可能な核酸塩基は、第2の状態への変換後、グアニン、アデニン、チミン、ウラシル、またはシトシンになる。一部の実施形態では、ポリマーの骨格(例えば、核酸ポリマーのリン酸および糖)は、第1の状態から第2の状態への変換の間、変化しないままである。一部の実施形態では、化学修飾可能な部分は、光、電圧、酵素剤、化学試薬、または酸化還元剤または酸化還元電極によって活性化可能であり、それにより、第1の状態が第2の状態に変換される。一部の実施形態では、化学修飾可能な部分は、1つまたは複数の光により除去可能な基を含む。
【0151】
一部の実施形態では、1つまたは複数の光により除去可能な基は、
【化5】
(式中、Xは、NR、NHR、OR、またはSRを表し、Rは、光により除去可能な基が付着している核酸塩基である)
である。
【0152】
一部の実施形態では、複数の変換可能な核酸塩基は、325nm、360nm、または400nmの波長の光によって変換することが可能である。
【0153】
一部の実施形態では、複数の変換可能な核酸塩基は、400nmから850nmの間の波長の光によって変換可能である。
【0154】
一部の実施形態では、複数の変換可能な核酸塩基のそれぞれは、酸化還元によって活性化可能または除去可能な化学修飾可能な部分を含む。一部の実施形態では、化学修飾可能な部分は、局所的な酸化によって活性化することが可能である。一部の実施形態では、化学修飾可能な部分は、1つまたは複数の電極を使用した酸化または還元によって活性化することが可能である。
【0155】
一部の実施形態では、変換可能な核酸塩基を含むヌクレオチドは、
【化6】
からなる群から選択される。
【0156】
一部の実施形態では、変換可能な核酸塩基(除去可能な基の特定の置換位置を有する)は、O6-グアニン、O6-チオグアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、O4-ウラシル、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンからなる群から選択される。
【0157】
一部の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、天然に存在しないおよび/または修飾された核酸塩基を検出し、区別することが可能なシーケンシング方法によって可読である。一部の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、ナノポアシーケンシングによって可読である。一部の実施形態では、複数の変換可能な核酸塩基の第1の状態と第2の状態は、合成によるシーケンシングによって可読である。一部の実施形態では、複数の変換可能な核酸塩基は、第2の状態に変換されると、第1の状態と比較して複数の変換可能な核酸塩基の特性が改変される(例えば、サイズが縮小する、形状が変更される、H結合が改変される、ならびに/またはポリメラーゼ基質能および/もしくはポリメラーゼコーディングが改変される)。一部の実施形態では、複数の変換可能な核酸塩基のうちの1つまたは複数は、第2の状態から第3の状態に変換することが可能であり、複数の変換可能な核酸塩基のうちの1つまたは複数が第3の状態において核酸ポリマーに共有結合により付着している。一部の実施形態では、複数の変換可能な残基のそれぞれは、独立に、かつ選択的に変換することが可能である。
【0158】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、変換可能な残基の異なる2つまたはそれよりも多くのセットを含み、変換可能な残基の各セットが、第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なる。一部の実施形態では、複数の変換可能な残基のそれぞれが、光によって活性化および/または除去することができる化学修飾可能な部分を含み、変換可能な残基の異なる2つまたはそれよりも多くのセットが、波長が異なる光によって活性化可能および/または除去可能である。一部の実施形態では、変換可能な残基の第1のセットは第1の波長の光によって活性化可能であり、変換可能な残基の第2のセットは第2の波長の光によって活性化可能であり、第1の波長と第2の波長は異なる。
【0159】
ある特定の実施形態では、本明細書に記載の書き込み可能な核酸ポリマー内の変換可能な核酸塩基(または変換可能な塩基のペア)の間に反復的に間隔を置いて、核酸塩基それぞれ(または各セットまたはペア)を符号化に応じて独立に、かつ選択的に変換することができるような空間分解能がもたらされるようにする。ある特定の実施形態では、変換可能な核酸塩基は規則的にまたは不規則に間隔を置いているが、ある特定の核酸塩基が同定され、選択的に変換されることによってデータが符号化されて、データが符号化された核酸ポリマーが得られる。実施形態の一部では、データ符号化機構は、必要に応じて、コードに従って正しい変換可能な核酸塩基に達するまで任意の変換可能な核酸塩基をスキップし得る。
【0160】
一部の好ましい実施形態では、変換可能な核酸塩基は、規則的に間隔を置いているが(例えば、スペーサーによって)、ある特定の核酸塩基が同定され、選択的に変換されることによってデータが符号化されて、確率的に間隔を置いて存在する変換された核酸塩基(すなわち、書き込まれたビット)を含む、データが符号化された核酸ポリマーが得られる。本明細書に提示される書き込み可能な核酸ポリマーの利点の1つは、書き込み可能な核酸ポリマーの位置または通過速度を制御する必要がないことである。ある特定の変換可能な核酸塩基をスキップすることができる。
【0161】
いくつかの実施形態では、書き込み手順を利用して、書き込み可能な核酸にデータを符号化する。データ符号化は、核酸分子の変換可能な核酸塩基を選択的に変換することによって実施することができ、したがって、書き込まれた核酸分子は、「0」と「1」のバイナリコードに類似した、変換されていない核酸塩基と変換された核酸塩基の配列を含有する。核酸塩基を第2の構造に化学的に変換するための任意の適当な機構を利用することができる。種々の実施形態によると、核酸塩基を光、電圧、酵素剤、化学試薬、および/または酸化還元剤によって変更させる。
【0162】
一部の実施形態では、データが書き込まれた(データが符号化された)核酸分子は、「0」と「1」のバイナリコードに類似した、核酸塩基の変換された第1のセットと核酸塩基の変換された第2のセットを含む変換された核酸塩基の配列を含有する。
【0163】
一部の実施形態では、データが書き込まれた(符号化された)核酸ポリマーを標準的な核酸保存プロトコールに従って保存する。例えば、データが書き込まれた核酸ポリマーを、乾燥させて、沈殿物として、または適当なヌクレアーゼフリー溶液中で、室温で、またはより低い温度(例えば、-20℃)で保存することができる。(例えば)アルコール、キレート剤およびヌクレアーゼ阻害剤などの安定剤を保存される核酸と共に含めることができる。書き込まれた核酸ポリマー上のデータを読み取るために、非天然および/または変更された核酸塩基を読み取ることが可能な任意の適当なシーケンサー、例えば、Oxford Nanopore TechnologiesのPromethION、MinION、およびGridIONシーケンシングプラットフォーム(Oxford、UK)またはPacific BioscienceのSingle Molecule、Real-Time(SMRT)シーケンシングプラットフォーム(Menlo Park、CA)を利用することができる。あるいは、データを読み取るためのナノポアデバイスを製作または製造することができる。ナノポアは、固体の状態の材料で構成されるものであってもよく、1つまたは複数のタンパク質を含有するものであってもよい。
【0164】
一部の実施形態では、核酸を隔離し、安定化するための固体支持体、例えば、ポリマービーズ、ガラスビーズ、または無機固体の使用も意図されている。一部の実施形態では、書き込まれた(符号化された)核酸ポリマー上のデータを合成によるシーケンシング(SBS)によって復号するまたは読み取る。また、一部の実施形態では、修飾された核酸塩基および/または修飾されていない核酸塩基を読み取ることが可能なシーケンサー、例えば、Oxford Nanopore TechnologiesのPromethION、MinION、およびGridIONシーケンシングプラットフォーム(Oxford、UK)またはPacific BioscienceのSingle Molecule、Real-Time(SMRT)シーケンシングプラットフォーム(Menlo Park、CA)を利用して、データを復号するまたは読み取ることができる。
【0165】
本開示では、合成とデータ符号化を別個のステップに分離することにより、従来の核酸データストレージに付随する限定の多くを克服する。本開示は、それ自体はデータを符号化するものではないが、その代わりに書き込みを受けることが可能な鋳型を提供する、書き込み可能な核酸の長い鎖を作製するための分子戦略を提供する。書き込み可能な核酸ポリマーは、データ符号化より前にバルクで作製することができる。本開示は、第1の状態から第2の状態にスイッチさせることができ、したがって、バイナリコードで「0」と「1」を定義する、データの書き込み可能な「ビット」として作用する変換可能な核酸塩基(および変換可能な核酸塩基のペア)を含む組成物およびシステムをさらに提供する。本開示は、データを本明細書に提示される書き込み可能な核酸ポリマーに、単一分子レベルで、したがって、無視できる量の材料の消費で、書き込むための方法をさらに提供する。データ書き込みは、化学的にまたは物理的に、(例えば)光パルスまたは電圧パルスを利用して実現することができる。最後に、書き込まれた核酸ポリマーは長いので、分子当たりの符号化されるデータが、短いDNAの場合よりも多くなり、また、現在市場に存在する種々のシーケンサーによって効率的にかつ迅速に読み取ることができる。本明細書に記載の組成物、システム、および方法は、核酸データ符号化のスピードおよび密度を著しく増大させる一方で費用を低減させるものである。
データを符号化するための書き込み可能なポリマー
【0166】
一態様では、データを符号化するためのポリマーであって、ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含み、複数の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、複数の変換可能な残基が第1の状態および第2の状態においてポリマーに共有結合により連結している、ポリマーが本明細書に提示される。一部の実施形態では、第1の状態と第2の状態は異なる(例えば、変換可能な残基は、第1の状態の時と第2の状態の時で構造が異なる)。一部の実施形態では、第1の状態にある複数の変換可能な残基および第2の状態にある複数の変換可能な残基は、ポリメラーゼ酵素によって可読である。一部の実施形態では、複数の変換可能な残基は、ポリマーの骨格に沿ってリピートされる間隔を置いて存在する。
【0167】
一部の実施形態では、本明細書に記載のポリマーは核酸ポリマーであり、複数の変換可能な残基は変換可能な核酸塩基である。
【0168】
ある特定の実施形態では、変換可能な残基の間に反復的に間隔を置いて、各残基を独立に変換することができるような空間分解能がもたらされるようにする。一部の実施形態では、任意の適当なスペーサー(例えば、書き込み可能でない、すなわち、データ書き込み機構に対して非反応性である)を変換可能な残基の間に存在させる。一部の実施形態では、ポリマー骨格によって連結した残基をスペーサーとして利用することができる。一部の実施形態では、書き込み機構および/または書き込みデバイスの空間分解能に応じて、変換可能な残基の間にスペーサーによって間隔を置く。一部の実施形態では、スペーサーは、残基であり、書き込み機構に対して非反応性のものであり得る。一部の実施形態では、これらのスペーサーは、修飾されていないDNAヌクレオチドである。種々の実施形態では、ポリマーは、データを標識するためのデリミタおよび/またはデータタグをさらに含む。
【0169】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、ポリマーの骨格を介して連結した複数のスペーサー残基をさらに含み、ここで、複数の変換可能な残基のそれぞれは、複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている。一部の実施形態では、複数の変換可能な残基の間の反復的間隔は、ポリマー上にデータを符号化するための書き込み機構の分解能に適合する。一部の実施形態では、2つの隣接する変換可能な残基の間の反復的間隔は、データをポリマーにおいて符号化するためのデータ符号化機構の分解能と等しいまたはそれよりも大きい。一部の実施形態では、書き込み機構の分解能は、少なくとも1nmである。一部の実施形態では、複数のスペーサー残基は、変換可能な残基の読み取りに干渉しない。一部の実施形態では、ポリマー内の複数のスペーサー残基は、同じスペーサー残基である。一部の実施形態では、複数のスペーサー残基は、2つまたはそれよりも多くの異なるスペーサー残基(例えば、異なる核酸塩基、例えば、異なる天然に存在する核酸塩基)を含む。
【0170】
一部の実施形態では、本明細書に記載のポリマーは、ブランクテープである。一部の実施形態では、本明細書に記載のポリマーは、DNAのブランクテープである。ブランクテープとは、本明細書で使用される場合、書き込み可能な核酸ポリマーに沿って反復的に間隔を置いて存在する変換可能な核酸塩基を含み、したがって、変換可能な核酸塩基の第1の状態から第2の状態への変換により、データの符号化がもたらされる、書き込み可能な核酸ポリマーを指す。ブランクテープ自体はデータを含有しないが、適当な書き込みシステムを使用することにより(例えば、光により)、変換可能な核酸塩基を変換することによってデータを符号化させることが可能である。一部の実施形態では、ブランクテープは、データを符号化するために一方の末端から他方の末端まで連続的に書き込み可能である。
【0171】
一部の実施形態では、ブランクテープは、その全長にわたって書き込み可能である。一部の実施形態では、ブランクテープ内の変換可能な核酸塩基はそれぞれ、独立に、かつ個別に書き込み可能である。
【0172】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、スペーサー残基から本質的になる。
【0173】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、デリミタもデータタグも含まない。
【0174】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、スペーサー残基および変換可能な残基(例えば、変換可能な核酸塩基)からなる。
【0175】
一部の実施形態では、複数の変換可能な核酸塩基のそれぞれは、2個、3個、4個、5個、6個、7個、8個、9個、10個、20個、30個、40個、または50個のスペーサー残基によって分離されている。一部の実施形態では、複数の変換可能な核酸塩基のそれぞれは、6個のスペーサー残基によって分離されている。一部の実施形態では、複数のスペーサー残基は、天然に存在する核酸塩基、天然に存在しない核酸塩基、テトラヒドロフラン脱塩基残基、またはエチレングリコール残基である。複数のスペーサー残基は、天然に存在する核酸塩基である。
【0176】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、ポリマーの骨格に連結した1つまたは複数のデリミタをさらに含む。一部の実施形態では、1つまたは複数のデリミタのそれぞれは、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む。一部の実施形態では、1つまたは複数のデリミタは、天然に存在する核酸塩基を含む。一部の実施形態では、1つまたは複数のデリミタにより、ポリマー内の2つまたはそれよりも多くの隣接するデータフィールドが分離されている。
【0177】
一部の実施形態では、本明細書に記載のポリマー(例えば、核酸ポリマー)は、1つまたは複数のデータタグをさらに含む。一部の実施形態では、1つまたは複数のデータタグは、1つまたは複数の天然に存在する核酸塩基または天然に存在しない核酸塩基を含む。一部の実施形態では、ポリマーは、核酸ポリマーであり、1つまたは複数のデータタグは、核酸ポリマーの5’末端または3’末端に存在する。一部の実施形態では、1つまたは複数のデータタグは、核酸ポリマーに、核酸ポリマーが合成される間に、複数の変換可能な核酸塩基が第2の状態に変換される間に、または複数の変換可能な核酸塩基が第2の状態に変換された後に、ライゲーションによって組み入れられる。
【0178】
一部の実施形態では、ポリマーは、任意の数または長さの単量体単位、例えば、10単量体単位の短さから100,000単量体単位よりも長くまでを有し得る。種々の実施形態では、ポリマーは、500単量体単位を超える、1,000単量体単位を超える、5000単量体単位を超える、10,000単量体単位を超える、50,000単量体単位を超える、または100,000単量体単位を超える。
【0179】
一部の実施形態では、核酸ポリマーは、10個よりも多くの変換可能な残基を含む。一部の実施形態では、核酸ポリマーは、100個よりも多くの変換可能な残基を含む。一部の実施形態では、核酸ポリマーは、500個よりも多くの変換可能な残基を含む。一部の好ましい実施形態では、核酸ポリマーは、1,000個よりも多くの変換可能な残基を含む。一部の実施形態では、核酸ポリマーは、10,000個よりも多くの変換可能な残基を含む。一部の実施形態では、核酸ポリマーは、100,000個よりも多くの変換可能な残基を含む。
【0180】
一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、2から500の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、2から200の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、2から100の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、2から10の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、10から50の間である。
【0181】
一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、10から100の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、20から100の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、20から50の間である。一部の実施形態では、ポリマー(例えば、核酸ポリマー)内の単量体単位(例えば、ヌクレオチド)の総数の変換可能な残基(例えば、変換可能な核酸塩基)に対する比は、100よりも大きい。
書き込み可能な核酸ポリマー
【0182】
ある特定の実施形態では、本明細書に記載のポリマー(例えば、書き込み可能なポリマー)は核酸ポリマーであり、複数の変換可能な残基は変換可能な核酸塩基である。ある特定の実施形態では、本明細書に記載のポリマーは、核酸ポリマーであり、核酸ポリマーの骨格に沿って反復的に間隔を置いて核酸ポリマーの骨格に共有結合により連結した複数の変換可能な核酸塩基を含み、複数の変換可能な核酸塩基のそれぞれが第1の状態を有し(例えば、第1の状態の構造を有する)、第1の状態から第2の状態(例えば、第2の状態の構造を有する)に変換することが可能であり、複数の変換可能な核酸塩基は第1の状態および第2の状態において核酸ポリマーに共有結合により連結している。一部の実施形態では、第1の状態と第2の状態は異なり、どちらもポリメラーゼ酵素によって可読である。一部の実施形態では、第2の状態にある核酸塩基は天然の核酸塩基である。一部の実施形態では、第2の状態にある核酸塩基は痕跡がない(すなわち、グアニン、アデニン、チミン、チオチミン、チオグアニン、または5-メチルシトシン、またはシトシンなどの核酸塩基のネイティブな形態)である。
【0183】
一部の実施形態では、書き込まれていない状態は、変換されていない状態とも称され、書き込まれた状態は、変換された状態とも称される。
【0184】
本開示の実施形態による化合物は、書き込み可能なデータビットに類似した、複数の変換可能な核酸塩基を有する核酸に基づく。変換可能な核酸塩基はそれぞれ、2つまたはそれよりも多くの状態、「0」に類似した、書き込まれていない状態(例えば、第1の状態)、および「1」を意味する書き込まれたビットに類似した少なくとも第1の書き込まれた状態(例えば、核酸塩基の第2の状態)、および一部の実施形態では、第2の書き込まれた状態(例えば、核酸塩基の第3の状態)、および/またはさらなる書き込まれた状態(すなわち、書き込まれたビットがさらに書き込み可能である)で存在し得る。いくつかの実施形態では、書き込み可能な核酸ポリマーを、複数の変換可能な核酸塩基を用い、「書き込まれた」状態に変換することが可能な「書き込まれていない」状態で合成する。一部の実施形態では、2つの異なる変換可能な核酸塩基を、単一のビットを符号化するためのペアとして使用し、その場合、一方の変換が「0」に符号化され、他方の変換が「1」に符号化される。これらの書き込み可能な核酸は、長い長さに(例えば、5~50kb、またはそれよりも長く)創出することができ、また、データ書き込みの前にバルクで作製することができる。
【0185】
一部の実施形態では、単一の変換可能な核酸塩基を利用して、ビットデータを符号化する。一部の実施形態では、2つまたはそれよりも多くの変換可能な核酸塩基のセットを利用して、ビットデータの符号化を可能にする。一部の実施形態では、2つの異なる変換可能な核酸塩基のペアを、単一のビットの符号化を可能にするためのペアとして使用する。一部の実施形態では、2つの異なる変換可能な核酸塩基のペアを利用し、第1の核酸塩基の変換を「0」に符号化し、他方の核酸塩基の変換を「1」に符号化する。一部の実施形態では、2つの異なる変換可能な核酸塩基のペアを利用し、一方の核酸塩基の変換を「0」に符号化し、両方の核酸塩基の変換を「1」に符号化する。
【0186】
いくつかの実施形態では、書き込み可能な核酸ポリマーは、ポリマー骨格に連結した複数の変換可能な核酸塩基を含む。ある特定の実施形態では、変換可能な核酸塩基の間に反復的に間隔を置いて、核酸塩基それぞれを独立に変換することができるような空間分解能がもたらされるようにする。一部の実施形態では、空間分解能は、少なくとも一部において、書き込み機構に依存する。例えば、分解能が1nmである光学光源およびデバイスを使用して核酸塩基を変更する場合、変換可能な塩基それぞれが少なくとも1nm分離されている必要がある。変更可能な核酸塩基の間に任意の適当なスペーサーを利用することができる。一部の実施形態では、ポリマー骨格によって連結した残基をスペーサーとして利用することができる。二本鎖DNAポリマー内の核酸塩基間の距離は約0.34nmであるので、多数の実施形態に従って、変更を誘導する供給源の空間分解能1ナノメートルにつき3つのスペーサーを利用する。一部の実施形態では、スペーサーは、書き込み機構に対して非反応性であり得る核酸塩基である。種々の実施形態では、書き込み可能な核酸ポリマーは、データを標識するためのデリミタおよび/またはデータタグをさらに含み得、そのそれぞれを特定の配列の残基によってもたらすことができる。
【0187】
いくつかの実施形態では、データ符号化可能な核酸ポリマーは、ポリマー骨格によって連結した複数の変換可能な核酸塩基を含む。ある特定の実施形態では、変換可能な核酸塩基は規則的にまたは不規則に間隔を置いて存在するが、核酸塩基が同定され、選択的に変換されることによってデータが符号化されて、符号化されたポリマーが得られる。実施形態の一部では、規則的にまたは不規則に間隔を置いて存在する変換可能な核酸塩基を利用し、データ符号化機構は、必要に応じて、コードに従って正しい変換可能な核酸塩基に達するまで任意の変換可能な核酸塩基をスキップし得、その結果、確率的におよび/または規則的に間隔を置いて存在する変換された核酸塩基を含む、データが符号化された核酸ポリマーがもたらされる。ある特定の実施形態では、変換可能な核酸塩基(または核酸塩基のセット)の間に反復的に間隔を置いて、核酸塩基それぞれ(または核酸塩基のセットそれぞれ)を独立に変換することができるような空間分解能がもたらされるようにする。空間分解能は、少なくとも一部において、書き込み機構に依存する。例えば、分解能が1nmである光学光源およびデバイスを使用して核酸塩基を変更する場合、変換可能な塩基それぞれ(または核酸塩基のセットそれぞれ)が少なくとも1nm分離されている必要がある。変換可能な核酸塩基(または核酸塩基のセット)の間に任意の適当なスペーサーを利用することができる。一部の実施形態では、ポリマー骨格によって連結した残基をスペーサーとして利用することができる。二本鎖DNAポリマー内の核酸塩基間の距離は約0.34nmであるので、多数の実施形態に従って、変更を誘導する供給源の空間分解能1ナノメートルにつき3つのスペーサーを利用する。一部の実施形態では、スペーサーは、書き込み機構に対して非反応性であり得る核酸塩基である。種々の実施形態では、データ符号化可能な核酸ポリマーは、データを標識するためのデリミタおよび/またはデータタグをさらに含み得、そのそれぞれを特定の配列の残基によってもたらすことができる。
【0188】
一部の実施形態では、本明細書に提示される書き込み可能な核酸ポリマーは、どちらの方向にも(例えば、5’から3’への方向または3’から5’への方向のいずれでも)書き込むこと(例えば、変換可能な核酸塩基を、選択的にかつ逐次的に、変換された(例えば、天然に存在するまたはネイティブな核酸塩基)に変換すること)が可能である。
【0189】
図1Aに、複数の書き込み可能な核酸塩基を有する書き込み可能な核酸ポリマーの例を例示する。書き込み可能な核酸ポリマーは、一本鎖または二本鎖分子として存在し得るリピート鎖配列を含む。リピート単位は変換可能な核酸塩基を含み、変換可能な核酸塩基は天然または非天然のものであり得、第1の構造の状態から第2の構造の状態への化学的変化を受けることができ、これは、「0」の状態から「1」の状態への切り換えに類似したものである。これらの変換可能な塩基のそれぞれはデータ符号化のための「ビット」に類似したものである。「1」および「0」の定義は任意であり、単にバイナリコードを示すものであることが理解される。あらゆるデータ書き込みの前に、変換可能な核酸塩基を最初に変換されていない状態で提供する。一部の実施形態では、書き込み可能な核酸ポリマーのリピート単位は、複数の変換可能な核酸塩基を含み、ビットを区切るまたは隔てるスペーサーまたは配列も含有し得るデータフィールドを含む。図1Bに、スペーサーによって隔てられた複数の変換可能な核酸塩基を有するデータフィールド配列の別の例を提示する。例えば、示されている通り、変換可能な核酸塩基それぞれの間に3つのスペーサーを利用し、それにより、1nmの空間分解能がもたらされる。低ビット書き込み分解能の場合にはより長いスペーサー配列を使用することができることが理解される。一部の実施形態では、書き込み可能な核酸ポリマーは、データの型、日付、または他の情報などのドキュメンテーションを示す1つまたは複数の一意データタグ配列を含む。一意データタグ配列は、書き込み可能なDNAの合成の間に書き込むこともでき、データ書き込みプロセスの間に書き込むこともでき、あるいは、プライマーを介して末端に付加することもでき、データ書き込み後に、ライゲーションを介してデータ鎖に付加することもできる。
【0190】
図2Aに、各ビットがポリマーに沿って反復的にリピートされる変換可能な核酸塩基のペアである、複数の変換可能な核酸塩基を有するデータ符号化可能な核酸ポリマーのさらに別の例を例示する。データ符号化可能な核酸ポリマーは、一本鎖または二本鎖分子として存在し得る。変換可能な核酸塩基それぞれが除去可能な基を含有し、したがって、除去可能な基を光または酸化還元エネルギーによって除去することにより、核酸塩基を1つの構造の状態から第2の構造の状態に変換することができる。図2Aに関して、一部の実施形態では、「C」核酸塩基を変換し「C」は変換せずに維持することにより「0」ビットが得られ、「C」核酸塩基を変換し「C」を変換せずに維持することにより「1」ビットが得られる。一部の実施形態では、「C」核酸塩基を変換し「C」は変換せずに維持することにより「0」ビットが得られ、「C」および「C」核酸塩基の両方の変換により「1」ビットが得られる。「0」および「1」の定義は任意であり、単にバイナリコードを示すものであることが理解される。
【0191】
図2Bに、複数の変換可能な核酸塩基を有するデータ符号化可能な核酸ポリマーのさらなる例を例示し、この例では、各ビットは、核酸ポリマーに沿って間隔を置いて存在する変換可能な核酸塩基である。データ符号化可能な核酸ポリマーは、一本鎖または二本鎖分子として存在し得る。変換可能な核酸塩基それぞれが除去基を含有し、したがって、除去可能な基を光または酸化還元エネルギーによって除去することにより、核酸塩基を1つの構造の状態から第2の構造の状態に変換することができる。図2Bに示されている通り、一部の実施形態では、「C」核酸塩基の変換により「0」ビットが得られ、「C」核酸塩基の変換により「1」ビットが得られる。これらの実施形態では、変換されないまま残り得、したがって、データのコードに寄与しない変換可能な核酸塩基が存在する。
【0192】
一部の実施形態では、データ符号化可能な核酸ポリマーは、データの型、日付、または他の情報などのドキュメンテーションを示す1つまたは複数の一意データタグ配列を含む。一意データタグ配列は、符号化可能なポリマーの合成の間に組み入れることもでき、プライマーを介して末端に付加することもでき、データ符号化後に、ライゲーションを介してデータ鎖に付加することもできる。
【0193】
種々の実施形態では、書き込み可能な核酸ポリマーは、任意の長さ、例えば、15ヌクレオチドの短さから100キロベースを超える長さまでであってよい。種々の実施形態では、書き込み可能な核酸ポリマーは、500ヌクレオチド長を超える、1000ヌクレオチドを超える、5000ヌクレオチドを超える、10,000ヌクレオチドを超える、50,000ヌクレオチドを超える、または、100,000ヌクレオチドを超える。最大長は、DNAの安定性によって、それらを作出するために使用される方法によって、および書き込まれたデータを読み取るために使用される方法によってのみ限定される。一部の実施形態では、より長い鎖には、分子当たりに含有されるデータがより多くなるという利点がある。注目すべきことに、現行のシーケンシング技術では、数万~数十万塩基長の核酸鎖を扱うことができる(それぞれの開示が参照により本明細書に組み込まれるN Kono and K. Arakawa, Dev Growth Differ. 2019; 61: 316-326;およびQ Chen and Z. Liu, Sensors (Basel). 2019; 19: 1886を参照されたい)。
【0194】
いくつかの実施形態は、書き込み可能な核酸ポリマーに組み入れることができる変換可能な核酸塩基を対象とする。種々の実施形態による変換可能な核酸塩基は、制御された反応化学によって第1の化学的状態から第2の化学的状態に変換することが可能な核酸塩基である。光パルス、電圧パルス、酵素剤、化学試薬、および/または酸化還元剤を含めた(しかしこれだけに限定されない)、核酸塩基を第1の状態から第2の状態に変換するための任意の適当な機構を利用することができる。「核酸塩基」は、天然に存在する構造に限定されず、デザイナー核酸塩基などの非天然核酸塩基を具体化するものであってもよいことが理解される。
【0195】
一部の実施形態では、変換可能な核酸塩基は、制御された反応化学によって第1の構造的状態から第2の構造的状態に変換することが可能な核酸塩基である。一部の実施形態では、変換可能な核酸塩基は、除去して(例えば、脱離基として)構造的変化をもたらすことができる、除去可能な基を含む。光パルス、電圧パルス、酵素剤、化学試薬、および/または酸化還元剤を含めた(しかしこれだけに限定されない)、核酸塩基を第1の状態から第2の状態に変換するための任意の適当な機構を利用することができる。「核酸塩基」は、天然に存在する構造に限定されず、デザイナー核酸塩基などの非天然核酸塩基を具体化するものであってもよいことが理解される。
【0196】
一部の実施形態では、構造的変化の結果、天然でない核酸塩基(例えば、第1の構造的状態にある核酸塩基)の、天然のまたはネイティブな核酸塩基(例えば、第2の構造の状態にある核酸塩基)への変換がもたらされる。この定義における天然のまたはネイティブな核酸塩基は、標準的なシーケンシング方法によって同定することができる。一部の実施形態では、第2の状態にある核酸塩基は天然の核酸塩基である。一部の実施形態では、第2の状態にある核酸塩基は、痕跡を有さない。一部の実施形態では、第1の状態にある核酸塩基は、化学修飾可能な部分を含む。一部の実施形態では、第1の状態にある核酸塩基は、核酸塩基の基部と化学修飾可能な部分の間にリンカー(またはリンカー部分)も側鎖も含まない。一部の実施形態では、第1の状態にある核酸塩基が第2の状態に変換される場合、化学修飾可能な部分が除去され、それにより、第2の状態にある核酸塩基が天然のまたはネイティブな核酸塩基として残される。一部の実施形態では、第1の状態にある核酸塩基と第2の状態にある核酸塩基はポリメラーゼによって可読または認識可能である。一部の実施形態では、書き込まれた核酸ポリマーは、種々のシーケンシング方法、例えば、合成によるシーケンシング(SBS)によって可読である。
【0197】
一部の実施形態では、「痕跡」とは、本明細書で使用される場合、共有結合が切断された後に残っている、天然に存在するDNAに通常は見いだされない基(例えば、リンカーまたは側鎖の一部など)を指す。痕跡は、一部のDNAシーケンシング技術において、シーケンシングステップの間にリンカーを切断することによって標識を放出させる場合に頻繁に観察される。
【0198】
図3A~3Gに、変換可能な核酸塩基の変換されていない状態および変換された状態の例を提示する。いくつかの実施形態では、変換可能な核酸塩基を「ビット」データに符号化することができ、それにより、デジタルビット名「0」または「1」に類似した、第1の構造の状態から第2の構造の状態への変換が可能になる。一部の実施形態では、核酸塩基の各状態は(例えば)合成によるシーケンシングまたはナノポアシーケンシングなどの、非天然および/または修飾塩基を検出し、区別することが可能なシーケンシング方法によって可読であるべきである。図3A~3Gに、塩基のケージング基を除去する、サイズを縮小させる、形状またはH結合を変更させる局所的な光のパルスによって第1の状態から第2の状態に変換されるように設計された変換可能な核酸塩基の例を提示する。種々の光により除去可能な基を、光により変換可能な核酸塩基に組み入れることができる(例えば、それぞれの開示が参照により本明細書に組み込まれるD. D. Young and A. Deiters, Org Biomol Chem. 2007; 5: 999-1005;およびY. Wu, Z. Yang, and Y. Lu, Curr Opin Chem Biol. 2020; 57: 95-104を参照されたい)。数例が提示されているが、任意の適当な、光により除去可能な基および他の核酸塩基を種々の実施形態に従って使用することができることが理解される。図3Eに、ある1つの基を除去し、その結果、サイズ、形状、およびH結合の変更をもたらす局所的な酵素活性によって変換することができる変換可能な核酸塩基を提示する(A. E. Pegg and T. L. Byers, FASEB J 1992; 6: 2302-10を参照されたい)。図3Fに、形状およびポリメラーゼ基質能の変更をもたらす局所的な酸化によって変換される変換可能な核酸塩基を提示する(K. Kino, et al., Genes Environ. 2017; 39: 21)。図3Gに、同様にサイズ、形状、および/またはポリメラーゼ基質能の変更をもたらす酸化還元により除去可能な基で変換される変換可能な核酸塩基を提示する。図3A~3Gに関して、これらの核酸塩基の変換されていない状態と変換された状態はどちらも現行のシーケンシング方法によって一意的に同定可能である。
【0199】
図4に、変換可能な核酸塩基O6-ニトロベンジル-グアニンからグアニンへの、光エネルギーを使用してニトロベンジル基との結合を切断することによる変換を例示する。この変換により、ビットデータを表すことができる、または、この変換を1つもしくは複数の他の変換可能な核酸塩基と組み合わせて利用して、書き込み可能なビットデータを表すことができる。合成によるシーケンシングによってデータを復号する場合、変換されていないO6-ニトロベンジル-グアニンはAとGが混在するものとして読み取られ、変換後は、得られたグアニンが>99%のGとして読み取られる。
【0200】
図5A~5Bに、ケージング基を除去し、それにより天然の核酸塩基構造をもたらす局所的な光のパルスによって第1の状態から第2の状態に変換することができる変換可能な核酸塩基のさらなる例を示す。例示的な変換可能な核酸塩基はそれぞれがケージングまたは除去可能な基を含み、その基が構造図において「CG」と示されている。数例が提示されているが、光により除去可能なケージング基を含む任意の適当な変換可能な核酸塩基構造を種々の実施形態に従って使用することができることが理解される。図5A~5Bに関しては、これらの核酸塩基構造の変換されていない状態と変換された状態のどちらも現行のシーケンシング方法によって一意的に同定可能である。
【0201】
図6は、局所的な光のパルスによって第1の状態から第2の状態に変換することができる変換可能な核酸塩基をもたらすために核酸塩基構造と共に利用することができる光により除去可能なケージング基のさらなる例を提示する。種々の実施形態では、図6の光により除去可能なケージング基の任意の1つを図4および5A~5Bの核酸塩基構造と組み合わせることができる。光により除去可能なケージング基は、Rと示される核酸塩基構造と接続した「X」と示されるリンカーを含む。提示されている実施例に加えて、種々の他の光により除去可能なケージング基を光により変換可能な核酸塩基に組み入れることができる(例えば、それぞれの開示が参照により本明細書に組み込まれるD. D. Young and A. Deiters, Org Biomol Chem. 2007; 5: 999-1005;およびY. Wu, Z. Yang, and Y. Lu, Curr Opin Chem Biol. 2020; 57: 95-104を参照されたい)。
【0202】
多数の実施形態が同様に、スペーサー、デリミタ、およびデータタグのうちの1つまたは複数がさらに組み入れられる書き込み可能な核酸ポリマーを対象とする。種々の実施形態によると、スペーサーは、書き込み可能な核酸ポリマー内に組み入れられる、変換可能な核酸塩基間にデータ書き込み機構の空間分解能に応じて必要な間隔をもたらす分子残基である。多くの実施形態では、スペーサーは変換可能な核酸塩基と区別可能であり、したがって、シーケンサーでデータを読み取る際に、スペーサーは、変換可能な核酸塩基を読み取る能力に干渉しない。一部の実施形態では、スペーサーは、データ書き込み機構に対して非反応性である。一部の実施形態では、書き込み可能な核酸ポリマーには、スペーサーひとつひとつに同じ残基をリピート利用する。一部の実施形態では、しかし、書き込み可能な核酸ポリマーには、スペーサーとして2つまたはそれよりも多くの異なる残基を利用する。天然に存在する核酸塩基、非天然核酸塩基、テトラヒドロフラン脱塩基残基、および/またはエチレングリコール残基を含めた、変換可能な核酸塩基と区別可能な任意の適当な残基をスペーサーとして利用することができる。
【0203】
一部の実施形態では、スペーサーは、変換可能な核酸塩基および/または変換された核酸塩基と区別可能であり、したがって、シーケンサーでデータを読み取る際に、スペーサーは、データを符号化する能力および符号化されたデータを復号する/読み取る能力に干渉しない。一部の実施形態では、スペーサーは、データ符号化機構に対して非反応性である。
【0204】
種々の実施形態によるデリミタは、境界を示す残基である。一部の実施形態では、デリミタを利用して、2つの隣接するデータフィールドを隔てる。天然に存在する核酸塩基、非天然核酸塩基、テトラヒドロフラン脱塩基残基、および/またはエチレングリコール残基を含めた、変換可能な核酸塩基と区別可能な任意の適当な残基をデリミタとして利用することができる。
【0205】
いくつかの実施形態では、データタグは、ある特定のデータを示す一連の残基(一般には4つまたはそれよりも多くの残基)である。例えば、データタグは、データの型、日付、データソース、または任意の他の情報を示すものであり得る。天然に存在する核酸塩基、非天然核酸塩基、テトラヒドロフラン脱塩基残基、および/またはエチレングリコール残基を含めた、変換可能な核酸塩基と区別可能な任意の適当な残基をデータタグ残基として利用することができる。
【0206】
別の態様では、書き込み可能な核酸ポリマーを生成するための方法であって、変換可能な核酸塩基を含むデータフィールドのリピートと相補的な環状一本鎖オリゴヌクレオチド鋳型を提供するステップと、環状一本鎖オリゴヌクレオチド鋳型を核酸プライマー、ポリメラーゼ、および三リン酸ヌクレオチドの存在下でインキュベートするステップであって、三リン酸ヌクレオチドが、第1の状態にある変換可能な核酸塩基を含み、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なる、ステップを含む、方法も本明細書に提示される。
【0207】
一部の実施形態では、環状一本鎖オリゴヌクレオチド鋳型は、変換可能な核酸塩基と相補的な核酸塩基を含み、相補的な核酸塩基の間に反復的に間隔が置かれており、したがって、鋳型を核酸プライマー、ポリメラーゼ、および三リン酸ヌクレオチドと一緒にインキュベートすることにより、核酸ポリマーの骨格に沿って反復的に間隔を置いて核酸ポリマーの骨格を介して共有結合により連結した複数の変換可能な核酸塩基を含む核酸ポリマーがもたらされ、複数の変換可能な核酸塩基は、第1の状態および第2の状態において核酸ポリマーに共有結合により連結している。
【0208】
一部の実施形態では、データフィールドのリピートは、スペーサー核酸塩基をさらに含み、三リン酸ヌクレオチドは、三リン酸スペーサーヌクレオチドをさらに含む。
【0209】
別の態様では、書き込み可能な核酸ポリマーを生成するための方法であって、複数のオリゴマーを化学合成するステップであって、各オリゴマーが、核酸ポリマー骨格に沿って反復的に間隔を置いて核酸ポリマー骨格を介して連結した複数の変換可能な核酸塩基を含み、複数の変換可能な核酸塩基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、複数の変換可能な核酸塩基が、第1の状態および第2の状態において核酸ポリマーに共有結合により付着しており、第1の状態と第2の状態が異なる、ステップと、複数のオリゴマーをライゲーションして、書き込み可能な核酸ポリマーを形成するステップとを含む、方法も本明細書に提示される。
【0210】
一部の実施形態では、複数のオリゴマーのそれぞれが、核酸ポリマーの骨格を介して連結した複数のスペーサー残基を含み、複数の変換可能な核酸塩基のそれぞれが、複数のスペーサー残基のうちの1つまたは複数のスペーサー残基によって分離されている。一部の実施形態では、ライゲーションするステップは、化学的ライゲーションによるものである。一部の実施形態では、ライゲーションするステップは、酵素的ライゲーションによるものである。一部の実施形態では、ライゲーションするステップにおいて相補DNAスプリントを使用する。
【0211】
一部の実施形態では、複数のオリゴマーは同じ配列を有する。一部の実施形態では、複数のオリゴマーは同じ配列の複数のコピーである。一部の実施形態では、複数のオリゴマーは異なる配列を有する。
【0212】
一部の実施形態では、方法は、ライゲーションするステップの前に、複数の相補物をオリゴマーとアニーリングさせるステップをさらに含む。
【0213】
書き込み可能な核酸は、長い核酸ポリマーを生成するための任意の適当な方法によって生成することができる。一般に、種々の実施形態によると、ポリメラーゼ伸長または化学合成を利用して、書き込み可能な核酸ポリマーを生成する。ポリメラーゼ伸長を利用する場合、適当な変換可能な核酸塩基、およびポリメラーゼによって重合することができる残基が利用される。化学合成を利用する場合、より広範囲の変換可能な核酸塩基および残基が利用されるが、一般に、合成によりもたらされる核酸鎖は短く(例えば、10から200残基の間)、これを一緒にライゲーションして、より長い核酸ポリマーを生成することができる。ポリメラーゼおよびライゲーション方法はどちらも、書き込み可能なポリマーのリピートを一本鎖または二本鎖のいずれの状態でも構築し得るものであることが理解される。
【0214】
図7に、ポリメラーゼ伸長を利用する書き込み可能な核酸の生成の例が例示されており、具体的には、図7には酵素的ローリングサークル反応法が例示されている。ある特定の実施形態では、環状一本鎖DNAオリゴヌクレオチドを鋳型として利用する(その開示が参照により本明細書に組み込まれるM. G. Mohsen and E. T. Kool, Acc Chem Res. 2016; 49: 2540-2550)。環状一本鎖DNAオリゴヌクレオチドは、変換可能な核酸塩基を含むデータフィールドのリピートに相補的である。種々の実施形態では、環状一本鎖DNAオリゴヌクレオチドは、スペーサー、デリミタ、および/またはデータタグをさらに含む。種々の実施形態では、環状DNAサイズは、2~2000ヌクレオチド長、好ましくは2~200ヌクレオチド長、およびより好ましくは45~95ヌクレオチド長である。
【0215】
データフィールドのリピートを符号化する核酸環状鋳型が構築されたら、その鋳型を、核酸プライマー、ポリメラーゼ、ポリメラーゼ活性を支持するための適切な緩衝剤、および書き込み可能な核酸の生成に適したヌクレオシド三リン酸と一緒にインキュベートする。プライマーが環に結合し、次いで、ポリメラーゼにより、環の長いリピートの相補物が産生される。ローリングサークル核酸合成は、何千ものヌクレオチドに対して進行し、それにより、長いDNAリピートが生じることが実証されている(その開示が参照により本明細書に組み込まれるM. M. Ali, et al., Chem Soc Rev. 2014; 43: 3324-41;およびM. G. Mohsen and E. T. Kool, Acc Chem Res. 2016 Nov 15; 49 (11): 2540-2550を参照されたい)。一部の実施形態では、データタグを利用し、データタグは、プライマーの遠く離れた5’末端に含めることができ、DNA環には非相補的なままにする。この場合、ローリングサークルDNA合成により、5’末端にデータタグが付着した書き込み可能な核酸のリピートがもたらされる。書き込み可能な核酸ポリマーが二本鎖であることが望まれる場合、データフィールドのリピートと相補的なプライマーを、ポリメラーゼおよび第1のポリマーと相補的なヌクレオチドと一緒に使用して、相補鎖を生成することができる。
【0216】
図8に、書き込み可能な核酸を生成するための化学合成およびライゲーション方法を例示する。一部の場合では、書き込み可能な核酸に組み入れるためのヌクレオチドは、効率的なポリメラーゼ基質ではなく、特に、多くの非天然核酸塩基であり、ポリメラーゼを有効に使用して、長鎖の核酸ポリマーを生成する能力が妨げられる。化学合成およびライゲーション手法では、DNA合成機で短い書き込み可能な核酸ポリマーを構築し、これは、ホスホラミダイト合成プロトコールを利用して行うことができ、一般には、10~200ヌクレオチドのポリマー長がもたらされる。ライゲーションを補助するために、一部の実施形態では、合成される短いポリマーに、5’-リン酸基およびネイティブな変更されていない3’-ヒドロキシル基をさらに含める。ATPの存在下で、DNAリガーゼ酵素(例えば、T4 DNAリガーゼ)により、短いポリマーを一緒に接合して、長いリピートのポリマーを生成する。一部の実施形態では、反応性末端とハイブリダイズすることができる相補的な「スプリント」核酸オリゴヌクレオチドを利用して、ライゲーションを補助する。
【0217】
一部の実施形態では、二本鎖の書き込み可能な核酸を生成するために、5’-リン酸基を含む核酸相補物を合成する。ライゲーション前に、相補鎖を書き込み可能な核酸とハイブリダイズさせる。一部の実施形態では、相補鎖のハイブリダイゼーションにより、リガーゼ酵素を利用して二本鎖の書き込み可能な核酸ポリマーに効率的にライゲーションすることができる、粘着末端を有する2重鎖をもたらす。
【0218】
ライゲーションにより引き出されたポリマー分子からは、様々なポリマー長がもたらされ得る。一部の実施形態では、様々な長さのポリマーの混合物をデータ符号化に使用する。一部の実施形態では、特定の長さのものを富化および/または単離し(例えば、電気泳動によって)、その後、データ符号化に使用する。
【0219】
いくつかの実施形態は、耐熱性ポリメラーゼ(例えば、Thermococcus litoralis由来のDNAポリメラーゼ)を使用した繰り返し拡大による、書き込み可能な核酸ポリマーのポリメラーゼによる拡大を対象とする。繰り返しの領域のポリメラーゼによる拡大に関するさらなる詳細については、その開示が参照により本明細書に組み込まれるJ. S. Hartig and E. T. Kool, Nucleic Acids Res. 2005; 33: 4922-7を参照されたい。
【0220】
ライゲーションされるデータフィールドDNAの末端が、ハイブリダイゼーションが不十分であることまたは酵素に干渉する非天然構造であることに起因してリガーゼ酵素基質として非効率的なものである場合、種々の実施形態によると、良好なハイブリダイゼーション/ライゲーションを確実にするために、天然の核酸塩基をライゲーション部位に付加することができる。一部の実施形態では、書き込み可能な核酸ポリマーを生成するために化学的ライゲーションを利用する。化学的ライゲーションは、臭化シアンを用いて、カルボジイミド試薬を用いて、または、一方の核酸ポリマー鎖末端のホスホロチオエート基と、他方の核酸ポリマー鎖末端の(例えば)ヨウ化物などの脱離基の求核反応によって、実現することができる。化学的ライゲーションには、リン酸末端とヒドロキシル末端を接合することが伴うが、5’-リン酸と3’-ヒドロキシル、または3’-リン酸と5’-ヒドロキシルを用いて反応を行うことができる。そのような化学的ライゲーションの方法は記載されている(それぞれの開示が参照により本明細書に組み込まれるE. T. Kool, Acc Chem Res. 1998; 31: 502-510; C. Obianyor, et al., Chembiochem. 2020; 21: 3359-3370;およびY. Xu and E. T. Kool, Nucleic Acids Res. 1999; 27: 875-81を参照されたい)。
データ書き込みおよび読み取りの方法およびシステム
【0221】
別の態様では、本明細書に提示される書き込み可能なポリマー(例えば、核酸ポリマー)への書き込みまたは書き込まれたポリマー(例えば、核酸ポリマー)の読み取りのためのシステムおよび方法が本明細書に提示される。
システム
【0222】
別の態様では、データ書き込みのためのシステムであって、ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格に共有結合により連結した複数の変換可能な残基を含む書き込み可能なポリマーであって、複数の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読であり、複数の変換可能な残基が、第1の状態および第2の状態においてポリマーに共有結合により連結している、書き込み可能なポリマーと、書き込み可能なポリマー上にデータを書き込むためのデータ書き込みデバイスとを含む、システムが本明細書に提示される。
【0223】
一部の実施形態では、書き込み可能なポリマーは書き込み可能な核酸ポリマーであり、複数の変換可能な残基は変換可能な核酸塩基である。一部の実施形態では、データ書き込みデバイスは、ナノポアを含む。一部の実施形態では、データ書き込みデバイスは、複数の変換可能な核酸塩基を光パルス、電圧パルス、酵素剤、または酸化還元剤によって第2の状態に変換する。一部の実施形態では、データ書き込みデバイスは、複数の変換可能な核酸塩基を光パルスによって第2の状態に変換する。一部の実施形態では、データ書き込みデバイスは、光照射デバイスを含む。
書き込み可能なポリマーへの書き込み/符号化のための方法
【0224】
さらに別の態様では、書き込み可能なポリマー上にデータを書き込むための方法であって、書き込み可能なポリマーの骨格に沿って反復的に間隔を置いて書き込み可能なポリマーの骨格を介して共有結合により連結している複数の変換可能な残基を含む書き込み可能なポリマーを提供するステップであって、複数の変換可能な残基の変換可能な残基のそれぞれが第1の状態を有し、第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、データ書き込みデバイスを利用して、複数の変換可能な残基のうちの1つまたは複数を第2の状態に選択的に変換し、それにより、データが符号化されたポリマーを生成するステップとを含む、方法が本明細書に提示される。
【0225】
いくつかの実施形態は、核酸ポリマー上のデータの書き込みおよび読み取りを対象とする。多くの実施形態では、書き込み可能なポリマーに沿って反復的に間隔を置いて存在する変換可能な核酸塩基を有する書き込み可能な核酸ポリマーが提供される。提供される書き込み可能な核酸ポリマーは、本明細書に記載のスペーサー、デリミタ、およびデータタグも有し得る。核酸ポリマー上にデータを書き込むために、種々の実施形態によると、個々の鎖をナノポアを有するデバイスを通過させる。ナノポアを有するデバイスは、変換可能な核酸塩基を第1の状態から第2の状態に選択的に変換するための手段をさらに提供する。変換可能な核酸塩基を変換するために、光パルス、電圧パルス、酵素剤、化学試薬、および/または酸化還元剤を含めた(しかしこれだけに限定されない)いくつもの手段を利用することができる。DNAを通過させ、局所的な光パルスを用いて符号化するためのナノポアデバイスの例が、例示的な実施形態に提示される例の中に記載されている。
【0226】
一部の実施形態では、書き込み可能なポリマーは書き込み可能な核酸ポリマーであり、複数の変換可能な残基は変換可能な核酸塩基である。一部の実施形態では、データ書き込みデバイスは、ナノポアを含み、方法は、書き込み可能なポリマーを書き込みデバイスのナノポアを通過させるステップであって、ナノポアにより、複数の変換可能な残基のうちの1つまたは複数を第2の状態に変換する、ステップをさらに含む。
【0227】
一部の実施形態では、ナノポアは、変換可能な核酸塩基を第1の状態から第2の状態に選択的に変換するための局所的な励起エネルギーを供給するプラズモニックナノポアである。一部の実施形態では、データ書き込みデバイスは、プラズモニックウェルまたはチャネルを含み、方法は、書き込み可能なポリマーをデータ符号化デバイスのプラズモニックウェルまたはチャネルに移すステップであって、プラズモニックウェルまたはチャネルにより、光パルスから局所的な励起をもたらして、変換可能な核酸塩基を第1の状態から第2の状態に選択的に変換する、ステップをさらに含む。一部の実施形態では、データ書き込みデバイスは、変換可能な残基を光パルス、電圧パルス、酵素剤、または酸化還元剤によって第2の状態に選択的に変換する。一部の実施形態では、データ書き込みデバイスは、変換可能な残基を光パルスによって第2の状態に選択的に変換する。
【0228】
一部の実施形態では、変換可能な残基は、第2の状態への変換後、天然に存在する核酸塩基になる。
【0229】
一部の実施形態では、書き込み可能なポリマー上への書き込みの開始位置および/または終了位置は、書き込み可能なポリマー(例えば、書き込み可能な核酸ポリマー)内の任意の位置(すなわち、任意の変換可能な残基、例えば変換可能な核酸塩基)であってよく、特定の開始および/または終了位置は必要ない。
【0230】
一部の実施形態では、選択的に変換するステップは、書き込み可能なポリマーのいずれかの末端(例えば、核酸ポリマーの5’末端または3’末端)において開始される。一部の実施形態では、選択的に変換するステップは、核酸ポリマーの5’末端または3’末端において開始される。一部の実施形態では、選択的に変換するステップで、変換可能な残基(例えば、変換可能な核酸塩基)が書き込み可能なポリマーのいずれかの方向に選択的に変換される。一部の実施形態では、選択的に変換するステップで、変換可能な核酸塩基(例えば、書き込み可能なビット)が5’から3’への方向または3’から5’への方向のいずれかで選択的に変換される。一部の実施形態では、選択的に変換するステップは、核酸ポリマーの5’末端において開始される。一部の実施形態では、選択的に変換するステップは、核酸ポリマーの3’末端において開始される。
【0231】
一部の実施形態では、書き込みは、書き込み可能なポリマー上の任意の位置(例えば、任意の変換可能な残基、例えば変換可能な核酸塩基)において開始される。一部の実施形態では、書き込みは、書き込み可能なポリマー上の任意の位置(例えば、任意の変換可能な残基、例えば変換可能な核酸塩基)において終了する。一部の実施形態では、書き込みは、書き込み可能なポリマー上の任意の位置(例えば、任意の変換可能な残基、例えば変換可能な核酸塩基)において開始され、終了する。
【0232】
一部の実施形態では、書き込み可能なポリマーは、その全長にわたって書き込み可能であり、書き込みは、始まり位置(例えば、核酸ポリマーの3’末端)において開始され、終了位置(例えば、核酸ポリマーの5’末端)において終了する。
【0233】
一部の実施形態では、複数の変換可能な残基は、2つまたはそれよりも多くの型の変換可能な残基を含み、第1の型の変換可能な残基は、第1の波長の光によって活性化可能であり、第2の型の変換可能な残基は、第2の波長の光によって活性化可能である。一部の実施形態では、複数の変換可能な残基の間の反復的間隔は、変換可能な残基を選択的に変換するためのデータ書き込みデバイスの分解能に適合する。一部の実施形態では、選択的に変換するステップは、書き込み可能なポリマーの特定の位置付けを必要としない。一部の実施形態では、変換可能な残基の第2の状態への変換は、データが符号化されたポリマー上で一様ではない。一部の実施形態では、変換可能な残基の第2の状態への変換は、データが符号化されたポリマー上のある特定の位置に限定されない。
【0234】
一部の実施形態では、書き込み可能なポリマーは、書き込み可能なポリマーに沿って規則的に間隔を置いて存在する複数の変換可能な残基を含む。一部の実施形態では、データが書き込まれた後の、データが符号化されたポリマーは、確率的にまたは不規則に間隔を置いて存在する変換された核酸塩基を含む。
【0235】
一部の実施形態では、複数の変換可能な核酸塩基は、325nm、360nm、または400nmの波長の光によって変換することが可能である。
【0236】
一部の実施形態では、複数の変換可能な核酸塩基は、400nmから850nmの間の波長の光によって変換可能である。
【0237】
一部の実施形態では、方法は、書き込み可能なポリマー(例えば、書き込み可能なDNA)を固体支持体上に引き伸ばすまたはコーミングするステップをさらに含む。
【0238】
一部の実施形態では、方法は、色素を使用して変換可能な残基の場所を可視化するステップをさらに含む。
【0239】
一部の実施形態では、方法は、書き込み可能なポリマーを局所的に照明するまたは局所的に励起させるステップをさらに含む。一部の実施形態では、局所的に照明するまたは局所的に励起させるステップは、誘導放出抑制(STED)レーザーを使用する。
【0240】
一部の実施形態では、方法は、2つまたはそれよりも多くの書き込み可能なポリマーからの2つまたはそれよりも多くのデータフィールドをエンドツーエンドで接合し、それにより、2つまたはそれよりも多くのデータフィールドを含む接合ポリマーを生じさせるステップをさらに含む。
【0241】
一部の実施形態では、方法は、書き込み可能なポリマーが書き込みデバイスのナノポアを通る通過速度を制御するステップをさらに含む。
【0242】
一部の実施形態では、複数の書き込み可能なポリマーを、データ書き込みデバイスまたは複数のデバイスを並行して通過させて、同じデータを書き込む(例えば、データ重複性が生じる)。
【0243】
一部の実施形態では、変換可能な核酸塩基を選択的に変換することによって生成された、データが符号化されたポリマーは、同じデータが符号化された異なるポリマー分子を含む。一部の実施形態では、データが符号化された核酸ポリマーには、変換された核酸塩基が核酸ポリマーに沿って異なる位置に(例えば、違うようにおよび必要に応じて不規則に間隔を置いて)含まれるが、同じデータが符号化されている(例えば、異なる符号化されたポリマー分子の間で、書き込まれたデータビットの順序が同じである)。
【0244】
一部の実施形態では、本明細書に提示される書き込み可能な核酸ポリマー上にデータを符号化するために、種々の実施形態によると、個々のポリマーが、ポリマーに反復的に当たる光エネルギーまたは酸化還元エネルギーを有し、したがって、それにより、変換可能な核酸塩基を制御可能にかつ選択的に変換して、データコード(例えば、バイナリデータコード)を符号化することができる。
【0245】
ナノポアを備えたデバイスが記載されているが、任意のデバイスにより、変換可能な核酸塩基をデータコードに従って制御可能にかつ選択的に変換することができる。一部の実施形態では、デバイスは、変換可能な核酸塩基を制御可能にかつ選択的に変換するためにプラズモニックチャネルまたはプラズモニックウェルを利用するものである。
【0246】
いくつかの実施形態では、書き込み可能な核酸ポリマーがナノポアを通過するにしたがい、デバイスにより、変換可能な核酸塩基を変換するための手段が選択的にもたらされる。例えば、核酸塩基が光パルスによって第2の状態に変換されるべき場合、核酸ポリマーがナノポアを通過するにしたがい、デバイスにより光がもたらされ、したがって、その光が変換可能な核酸塩基と接触し、変換可能な核酸塩基が第2の状態に変換され得る。核酸塩基が第1の状態のまま残るべき場合、デバイスから光はもたらされず、したがって、変換可能な核酸塩基は変換されずにナノポアを通過する。多くの実施形態では、デバイスによって単一の核酸塩基のみが変換されることを確実にするために、変換可能な核酸塩基をデバイスの書き込み分解能に応じたスペーサーで挟むことができる。例えば、分解能が1nmである光学光源およびデバイスを使用して核酸塩基を変更する場合、変換可能な塩基それぞれが少なくとも1nm分離されている必要がある。
【0247】
ある特定の実施形態では、核酸塩基が光パルスによって第2の状態に変換されるべき場合、核酸ポリマーがナノポアを通過するにしたがい、デバイスにより光がもたらされ、したがって、その光が変換されるべき変換可能な核酸塩基のセットのみと接触し得る。核酸塩基が最初の状態のまま残るべき場合、デバイスから光はもたらされず、したがって、変換可能な核酸塩基は変換されずにナノポアを通過する。多くの実施形態では、デバイスにより核酸塩基のセットのみが変換されることを確実にするために、変換可能な核酸塩基のセットをデバイスの書き込み分解能に応じたスペーサーで挟むことができる。
【0248】
一部の実施形態では、デバイスによって単一の核酸塩基(または核酸塩基のセット)のみが変換されることを確実にするために、デバイスに、核酸塩基を変換するための手段を2つまたはそれよりも多く利用する;第1の手段は、第1の核酸塩基構造を変換することができるが、第2の核酸塩基構造を変換することはできないものであり、第2の手段は、第2の核酸塩基構造を変換することができるが、第1の核酸塩基構造を変換することはできないものである。例えば、デバイスに、エネルギーを供給するための2つの波長の光を利用することができ、したがって、第1の波長により第1の核酸塩基構造を変換することができるが、第2の核酸塩基構造を変換することはできず、第2の波長により第2の核酸塩基構造を変換することができるが、第1の核酸塩基構造を変換することはできない。
【0249】
一部の実施形態では、デバイスによって単一の核酸塩基(または核酸塩基のセット)のみが変換されることを確実にするために、デバイスに、核酸塩基を変換するための手段を2つまたはそれよりも多く利用する;第1の手段は第1の核酸塩基構造を変換することができるが、第2の核酸塩基構造を変換することはできないものであり、第2の手段は第1の核酸塩基構造と第2の核酸塩基構造の両方をペアとして同時に変換することができる。例えば、デバイスに、エネルギーを供給するための2つの波長の光を利用することができ、したがって、第1の波長により第1の核酸塩基構造を変換することができるが、第2の核酸塩基構造を変換することはできず、第2の波長により第1の核酸塩基構造と第2の核酸塩基構造の両方をペアとして同時に変換することができる。
【0250】
多くの実施形態では、書き込みデバイスには核酸ポリマー内にデータを書き込むためのコードがもたらされる。したがって、書き込みデバイスにより、バイナリコードの「1」に類似したポリマーの種々の核酸塩基が選択的に変換され、一方、「0」に類似したポリマーの核酸塩基が変換されずにポアを通過することが選択的に可能になる。データコードが核酸ポリマー内に書き込まれた後、データコードが書き込まれた核酸ポリマーを、核酸分子を保存するための任意の適当な手段によって保存することができる。例えば、データが書き込まれた核酸ポリマーを、乾燥させて、沈殿物として、または適当なヌクレアーゼフリー溶液中で、室温で、またはより低い温度(例えば、-20℃)で保存することができる。(例えば)アルコール、キレート剤およびヌクレアーゼ阻害剤などの安定剤を保存される核酸と共に含めることができる。
【0251】
一部の実施形態では、本明細書に提示されるポリマー(例えば、核酸ポリマー)は、標準的な核酸保存プロトコールの下で保存することができる。一部の実施形態では、ポリマーは、適当なヌクレアーゼフリー溶液中、室温で、または低温(例えば、-20℃)で保存することができる核酸ポリマーである。一部の実施形態では、ポリマーは、安定剤を用いずに室温で保存することができる。
【0252】
多くの実施形態では、データ符号化デバイスに、核酸ポリマー内にデータを書き込むためのコードがもたらされる。したがって、一部の実施形態では、符号化デバイスにより、ポリマーの種々の核酸塩基がコードに従って選択的に変換される。単独の核酸塩基をビットとして使用する一部の実施形態では、核酸塩基の一部が選択的に変換され、他の核酸塩基が選択的に変換されず、その結果、変換された核酸塩基と変換されていない核酸塩基のバイナリコードがもたらされることにより、データが符号化される。単独の核酸塩基をビットとして使用する一部の実施形態では、核酸塩基の一部が第1の変換された構造に選択的に変換され、他の核酸塩基が第2の変換された構造に選択的に変換され、その結果、変換された核酸塩基のバイナリコードがもたらされることにより、データが符号化される。この場合、変換されていない核酸塩基はいずれも符号化されずに残り、データコードの復号には利用されない。
【0253】
ビットを符号化するために核酸塩基のセットを利用する一部の実施形態では、各セットが少なくとも2つの変換可能な核酸塩基を含み、符号化デバイスにより、セットの一部の第1の核酸塩基が変換された構造に選択的に変換され、他のセットの第2の核酸塩基が変換された構造に選択的に変換され、その結果、バイナリコードがもたらされる。ビットを符号化するために核酸塩基のセットを利用する一部の実施形態では、各セットが少なくとも2つの変換可能な核酸塩基を含み、符号化デバイスにより、セットの一部の第1の核酸塩基が変換された構造に選択的に変換され、他のセットの両方の核酸塩基が変換された構造に選択的に変換され、その結果、バイナリコードがもたらされる。
【0254】
一部の実施形態では、核酸ポリマーは、データを単一分子レベルで最も効率的に保存し、それにより、最も高い情報の潜在的密度をもたらすものである。しかし、一部の実施形態では、データストレージの正確度をより良好にするためにデータの重複性が必要な場合、複数の核酸ポリマーを使用して、複数のポリマーの各ポリマーに同じデータを重複して書き込むことができる。デジタルデータストレージのためのエラー補正アルゴリズムがすでに十分に開発されており、これらのアルゴリズムのうちのいくつかを本手法に適用することができる(その開示が参照により本明細書に組み込まれるJ. Li, et al., IEEE Transactions on Emerging Topics in Computing. 2021; 9: 651-663を参照されたい)。
【0255】
符号化されたデータを合成によるシーケンシング(SBS)によって復号する種々の実施形態では、データに重複性をもたせること、したがって、複数のポリマーの各ポリマー上に同じデータをもたせることが望ましい場合がある。例えば、O6-ニトロベンジル-グアニンなどの核酸塩基構造を使用する場合、構造はSBSを使用するとAとGが混在するものとして読み取られ、したがって、構造がO6-ニトロベンジル-グアニンであるか、グアニンであるか、またはアデニンであるかを解釈するために、構造の読み取りの重複性が必要になる。SBSの一部の方法では、重複性は、読み取られる単一の配列それぞれに固有のものである。
書き込み可能なポリマーの読み取り/復号のための方法
【0256】
別の態様では、データが符号化されたポリマーからデータを読み取るための方法であって、ポリマーの骨格に沿って反復的に間隔を置いてポリマーの骨格を介して共有結合により連結した変換可能な残基を含む、データが符号化されたポリマーを提供するステップであって、変換可能な残基の第1のサブセットが第1の状態にあり、変換可能な残基の第2のサブセットが第2の状態にあり、第1の状態と第2の状態が異なり、第1の状態にある複数の変換可能な残基と第2の状態にある複数の変換可能な残基がポリメラーゼ酵素によって可読である、ステップと、書き込み可能なデータが符号化されたポリマーをデータ読み取りデバイスを通過させて、データが符号化されたポリマー上の符号化されたデータを読み取るステップとを含む、方法も本明細書に提示される。
【0257】
一部の実施形態では、書き込み可能なポリマーは書き込み可能な核酸ポリマーであり、複数の変換可能な残基は変換可能な核酸塩基である。一部の実施形態では、第1の状態にある変換可能な残基を光によって第2の状態に変換することができる。一部の実施形態では、データ読み取りデバイスは、ナノポアを含む。一部の実施形態では、データ読み取りデバイスは、シーケンシングデバイスである。一部の実施形態では、シーケンシングデバイスは、合成によるシーケンシングデバイスである。
【0258】
一部の実施形態では、方法は、書き込み可能なポリマーが通過する間の電解質における電流の流れを測定するステップをさらに含む。
【0259】
一部の実施形態では、方法は、複数の変換可能な残基のそれぞれが第1の状態にあるのかそれとも第2の状態にあるのかを、測定された、書き込み可能なポリマーが通過する間の電解質における電流の流れに基づいて決定するステップをさらに含む。
【0260】
一部の実施形態では、方法は、データが符号化されたポリマーをデータ読み取りデバイスを再度通過させて、データが符号化されたポリマー上の符号化されたデータを再度読み取るステップをさらに含む。
【0261】
一部の実施形態では、方法は、データが符号化されたポリマーの複数のコピー上の符号化されたデータを比較することにより、データが符号化されたポリマー上の符号化されたデータを検証し、補正するステップをさらに含む。
【0262】
別の態様では、データが符号化された核酸ポリマーからデータを読み取るまたは復号するための方法であって、
複数の変換された核酸塩基であって、変換された核酸塩基それぞれが第1の核酸塩基構造を含み、第1の変換された核酸塩基が第1の状態から第2の状態に変換されており、第1の状態と第2の状態が異なる、複数の変換された核酸塩基と、
複数の変換可能な核酸塩基であって、変換可能な核酸塩基それぞれが第2の核酸塩基構造および直接連結した除去可能な基を含み、変換可能な核酸塩基が第1の状態でもたらされ、第2の核酸塩基構造から第2の除去可能な基を放出することによって第1の状態から第2の状態に変換することが可能であり、第1の状態と第2の状態が異なる、複数の変換可能な核酸塩基と
を含む、データが符号化された核酸ポリマーの複数の重複コピーを提供するステップであって、変換された核酸塩基と変換可能な核酸塩基が、核酸ポリマー骨格を介して連結している、ステップと、
核酸ポリマーの複数の重複コピーの各重複コピーの配列を決定するステップと
を含む、方法も本明細書に提示される。
【0263】
一部の実施形態では、方法は、複数の変換された核酸塩基と複数の変換可能な核酸塩基を検出するステップと、検出された複数の変換された核酸塩基に基づいてデータを復号するステップとをさらに含む。
【0264】
一部の実施形態では、第1の状態にある複数の変換された核酸塩基と第2の状態にある複数の変換された核酸塩基がポリメラーゼ酵素によって可読である。一部の実施形態では、第1の状態にある複数の変換可能な核酸塩基と第2の状態にある複数の変換可能な核酸塩基がポリメラーゼ酵素によって可読である。一部の実施形態では、複数の変換された核酸塩基と複数の変換可能な核酸塩基がデータが符号化された核酸ポリマーの重複コピーの配列決定結果に基づいて検出される。
【0265】
一部の実施形態では、配列を決定するステップは、書き込み可能なポリマーのいずれかの末端(例えば、核酸ポリマーの5’末端または3’末端)において開始される。一部の実施形態では、配列を決定するステップは、核酸ポリマーの5’末端または3’末端において開始される。一部の実施形態では、配列を決定するステップは、核酸ポリマーの5’末端において開始される。一部の実施形態では、配列を決定するステップは、核酸ポリマーの3’末端において開始される。
【0266】
図9A~9Cに、書き込み可能な核酸ポリマー503にデータを書き込むために、ナノポアを備えたデバイス501を利用する例を例示する。デバイスは、書き込み可能なポリマー503に局所的な光エネルギーを供給するためのプラズモニックナノ構造507を含む基材505を含む。書き込み可能なポリマー503を、ナノポア501を一定の速度で制御可能に通過させる。ナノポアは、タンパク質で構成されたものであってもよく、in silicoで工学的に作製されたポア、または他の無機固体などの人工的なものであってもよい(それぞれの開示が参照により本明細書に組み込まれるN Kono and K. Arakawa, Dev Growth Differ. 2019; 61: 316-326;およびQ Chen and Z. Liu, Sensors (Basel). 2019; 19: 1886を参照されたい)。ナノポアを構築するための方法、および通過速度を制御するための方法は以前に記載されている(その開示が参照により本明細書に組み込まれるY. Zhishan, et al., Nanoscale Res Lett. 2020; 15: 80を参照されたい)。書き込み可能な核酸ポリマー503がナノポア501を制御された速度で通過するにしたがい、デバイスにより、個々の変換可能な核酸塩基が、その変換可能な核酸塩基がポアを通過すると、コードされた通り選択的に変換される。図9Bに示されている通り、変換可能な核酸塩基がポアを通過すると同時に局所的にプラズモニックナノ構造507を介してその変換可能な核酸塩基に光のパルス509を当てることができ、これは、ポアの通過速度を制御することで適切に時間調整することができる。選択的な核酸塩基の変換の結果として、バイナリデジタルデータがポリマー内に符号化される(図9C)。
【0267】
図10A~10Cに、ポリマーに沿って反復的にリピートされる変換可能な核酸塩基の複数のセットを含む符号化可能な核酸ポリマー703内にデータを符号化するためのナノポアを備えたデバイス701を利用する別の例を例示する。デバイスは、データ符号化可能ポリマー703に複数の波長の局所的な光エネルギーを供給するためのプラズモニックナノ構造707を含む基材705を含む。ポリマー703を、ナノポア701を一定の速度で制御可能に通過させる。データ符号化可能な核酸ポリマー703がナノポア701を制御された速度で通過するにしたがい、デバイスにより、各セットの変換可能な核酸塩基の一方または両方が、そのセットがポアを通過すると、データコードによる規定の通り選択的に変換される。本実施例では、符号化されるデータコードは1001であり、1がC’によって表され、0がC’C’によって表される。図10Aに示されている通り、セットがポアを通過すると同時に局所的に当該セットに第1の波長(例えば、400nm)の光のパルス709をプラズモニックナノ構造707を介して当てることができ、それにより、単一の変換可能な塩基の変換がもたらされる(示されている通り、塩基CがC’に変換される)。図10Bに示されている通り、当該セットがポアを通過すると同時に局所的に当該セットに第2の波長(例えば、365nm)の光のパルス711を、プラズモニックナノ構造707を介して当てることができ、それにより、変換可能な塩基の両方の変換がもたらされる(示されている通り、塩基CおよびCがC’およびC’に変換される)。選択的な核酸塩基の変換の結果として、バイナリデジタルデータがポリマー703内に符号化され、これは、シングル核酸塩基変換713を有するセットおよびデュアル核酸塩基変換715を有するセットによって符号化される(図10C)。
【0268】
図11A~11Cに、ポリマーに沿って確率的にまたは不規則にリピートされる複数の2つの変換可能な核酸塩基構造を含む符号化可能な核酸ポリマー803内にデータを符号化するためのナノポアを備えたデバイス801を利用するさらに別の例を例示する。デバイスは、データ符号化可能ポリマー803に1つまたは複数の波長の局所的な光エネルギーを供給するためのプラズモニックナノ構造807を含む基材805を含む。ポリマー803を、ナノポア801を一定の速度で制御可能に通過させる。データ符号化可能な核酸ポリマー803がナノポア801を制御された速度で通過するにしたがい、デバイスにより、データコードによる規定の通り、一度に1つの変換可能な核酸塩基構造が選択的に変換される。本実施例では、符号化されるデータコードは10110であり、1はC’によって表され、0はC’によって表される。図11Aに示されている通り、第1の核酸塩基構造がポアを通過すると同時に局所的に第1の核酸塩基構造に光のパルス809をプラズモニックナノ構造807を介して当てることができ、それにより、核酸塩基の変換がもたらされる(示されている通り、塩基CがC’に変換される)。図11Bに示されている通り、第2の核酸塩基構造がポアを通過すると同時に局所的に第2の核酸塩基構造にプラズモニックナノ構造807を介して光のパルス809を当てることができ、それにより、核酸塩基の変換がもたらされる(示されている通り、塩基CがC’に変換される)。さらに、図11Bおよび11Cに示されている通り、コードに従って、変換可能な塩基813、815、および817がスキップされる。選択的な核酸塩基の変換の結果として、バイナリデジタルデータがポリマー803内に符号化され、これは、データコードに従って、変換された核酸塩基Ca’Cb’Ca’Ca’Cb’によって符号化され、変換可能な塩基はいずれもスキップされる。
【0269】
高度に局所的な光励起を、STEDXなどの特殊化された顕微鏡によるサブ波長集束戦略によって、またはボウタイなどのナノプラズモニック構造を使用することによって、またはゼロモード導波管を使用することによって実現することができる(それぞれの開示が参照により本明細書に組み込まれるY. Fang and M Sun, Light Sci Appl. 2015; 4:e294;およびX. Shi, et al. Small. 2018; 14:e1703307を参照されたい)。核酸塩基の変換に酸化還元を使用する場合、ナノポアまたはナノチャネルの付近またはその中の電極の印加電位を使用することができる。一定の通過速度を用い、時間調整された電圧電位の電子パルスにより、核酸塩基の変換の適当な間隔がもたらされ得る。酵素による核酸塩基の変換に関しては、書き込み可能な核酸ポリマーを、2つの隣接するナノポアを制御された速度で通過させることができる。変換可能な核酸塩基が2つのポア間の体積に入ると、局所的な部分/塩基/ビットにおいて酵素が鎖と接触する(例えば、マイクロフルイディクスによって)。マイクロ流体の流れおよび書き込み可能なポリマーの制御された通過のタイミングは、忠実度を伴ってデータが符号化されるように適当な間隔と協調させることができる。
【0270】
いくつかの実施形態が同様に、デュアルビットを用いた正のビット書き込みを対象とする。したがって、ある特定の実施形態では、書き込み可能な核酸ポリマーは、変換可能な核酸塩基の1つまたは複数のリピートされる対を含み、対の変換可能な塩基それぞれが同じ書き込み機構の分解能のフィールド内に存在する。一部の実施形態では、対の変換可能な核酸塩基それぞれがその対の他方の核酸塩基と隣接している。一部の実施形態では、対の変換可能な核酸塩基それぞれは、対の他方の核酸塩基が同じ変換シグナルで扱われるように十分に近くに存在する。一部の実施形態では、対の変換可能な核酸塩基の一方は、核酸塩基の変換に関して対の他方の核酸塩基とは異なる反応条件を有する。例えば、一部の実施形態では、対の第1の変換可能な核酸塩基は第1の波長の光によって変換され、対の第2の変換可能な核酸塩基は第2の波長の光によって変換される。したがって、1つまたは複数の対を含む書き込み可能な核酸ポリマーを符号化するある特定の実施形態では、各対がナノポアに入ると、特定の反応条件がもたらされて、第1の変換可能な核酸塩基、または第2の変換可能な核酸塩基、または第1の変換可能な核酸残基と第2の変換可能な核酸塩基の両方がコードに従って変換される。
【0271】
図12A~12Cに、複数の対を含む書き込み可能な核酸ポリマー603にデータを書き込むために、ナノポアを備えたデバイス601を利用する例を例示する。このデバイスは、書き込み可能なポリマー603に複数の波長の局所的な光エネルギーを供給するためのプラズモニックナノ構造607を含む基材605を含む。書き込み可能なポリマー603を、ナノポア601を一定の速度で制御可能に通過させる。書き込み可能な核酸ポリマー603がナノポア601を制御された速度で通過するにしたがい、デバイスにより、対がポアを通過するとコードされた通り対の個々の変換可能な核酸塩基が選択的に変換される。図12Aに示されている通り、対がポアを通過すると局所的に対に第1の波長(例えば、400nm)の光のパルス609を、プラズモニックナノ構造607を介して当てることができ、それにより、単一の変換可能な塩基の変換がもたらされる(示されている通り、塩基WがW’に変換される)。図12Bに示されている通り、対がポアを通過すると局所的に対に第2の波長(例えば、325nm)の光のパルス611を、プラズモニックナノ構造607を介して当てることができ、それにより、変換可能な塩基の両方の変換がもたらされる(示されている通り、塩基WおよびWがW’およびW’に変換される)。選択的な核酸塩基の変換の結果として、バイナリデジタルデータがポリマー603内に符号化され、これは、シングル核酸塩基変換された対613およびデュアル核酸塩基変換された対615によって符号化される(図12C)。特定の波長で変換される変換可能な核酸塩基の例が図13A~13Cに提示されている。
【0272】
多くの実施形態では、書き込まれた核酸ポリマー上のデータを読み取るために、非天然および/または変更された核酸塩基を読み取ることが可能な任意の適当なシーケンサーを利用することができる。ある特定の実施形態では、デバイスは、核酸ポリマーへの書き込みおよび核酸ポリマーからの読み取りを行うことが可能である。ある特定の実施形態では、ナノポアは、核酸ポリマーへの書き込みおよび核酸ポリマーからの読み取りの両方のための二重機能性を有するが、一部のデバイスは、書き込みと読み取りを実施するために別個のナノポアを含むものであり得る。市販のナノポアシーケンサーの例として、Oxford Nanopore TechnologiesのPromethION、MinION、およびGridIONシーケンシングプラットフォーム(Oxford、UK)ならびにPacific BioscienceのSingle Molecule,Real-Time(SMRT)シーケンシングプラットフォーム(Menlo Park、CA)が挙げられる。あるいは、データの書き込みおよび/または読み取りのためのナノポアデバイスを製作または製造することができる。ナノポアは、固体の状態の材料で構成されるものであり得る、または1つまたは複数のタンパク質を含有し得る。
【0273】
多くの実施形態では、符号化された核酸ポリマー上のデータを復号するために、非天然および/または変更された核酸塩基を読み取ることが可能な任意の適当なシーケンサーを利用することができる。DNAを復号するために使用されるシーケンシング技法の例としては(これだけに限定されないが)、ショットガンシーケンシング、ロングリードシーケンシング、ナノポアシーケンシング、および合成によるシーケンシングが挙げられる。
【0274】
符号化されたデータを合成によるシーケンシング(SBS)によって復号する種々の実施形態では、データに重複性をもたせること、したがって、複数のポリマーの各ポリマーに同じデータをもたせることが望ましい場合がある。例えば、O6-ニトロベンジル-グアニンなどの核酸塩基構造を使用する場合、構造はSBSを使用するとAとGが混在するものとして読み取られ、したがって、構造がO6-ニトロベンジル-グアニンであるか、グアニンであるか、またはアデニンであるかを解釈するために、構造の読み取りの重複性が必要になる。
【0275】
図14Aに、ナノポアを利用して、変換可能な核酸塩基と変換された核酸塩基の核酸塩基配列を読み取る例が提示されている。本実施例では、O4-ニトロベンジルチミン(T-4-ONB)を変換可能な塩基として用い、ニトロベンジル基の除去により、核酸塩基がチミンに変換される。T-4-ONBの微弱電流は低電流であり、チミンの電流の方が大きいので、得られる電流の読み取りからこれらの2つの構造が区別可能である。本実施例ではT-4-ONBを用いているが、図4および5A~5Bに提示されている構造を含めた(しかしこれだけに限定されない)、構造サイズおよび/または電荷の変化を認識できる任意の変換可能な核酸塩基を利用することができる。
【0276】
ある特定の実施形態では、合成によるシーケンシング(SBS)を実施して、核酸ポリマー内のデータを復号する。SBSは、変換されたおよび/または変換されずに残っているある特定の塩基間の復号に役立ち得る。標準的なSBSでは、ポリメラーゼaを利用して、DNA配列の鎖を読み取り、その鎖の相補的なコピーを作出する。変換された核酸塩基はポリメラーゼ基質としての役割を果たす能力を有し、予測可能な配列結果が得られ、それにより、ポリメラーゼが逆側に塩基を組み入れ、合成を続けることが可能になるはずである。例えば、O6-ニトロベンジルグアニン(O6NBG)が変換可能な塩基として意図されており、これはDNAポリメラーゼ酵素の適切な基質であり、したがって、SBSによって読み取ることが可能である。O6NBG核酸塩基の配列決定の結果、その位置に符号化されるA核酸塩基とG核酸塩基が混在する読み取りが得られる(例えば、その開示が参照により本明細書に組み込まれるA. M. Kietrys, W. A. Velema, and E. T. Kool, J Am Chem Soc. 2017; 139: 17074-17081を参照されたい)。しかし、ニトロベンジル基が除去されてグアニン構造に変換されると、シーケンシング読み取りは明白なGのシグナルを有する。SBSを利用する場合、符号化された核酸の複数のコピーの配列決定を行うことが、所与の位置における核酸塩基が変換された構造(例えば、グアニン)であるか変換されていない構造(例えば、O6-ニトロベンジルグアニン)であるかを区別し、したがって、データがその位置に符号化されているかどうかの存在を示すのに役立ち得る。注目すべきことに、符号化された核酸の複数のコピーの配列決定を行うことは、図4および5A~5Bに提示されている構造などのいくつかの変換可能な/変換された核酸塩基構造を区別することに役立ち得る。
【0277】
図14Bに、SBSを利用して、変換可能な核酸塩基と変換された核酸塩基の核酸塩基配列を読み取る例が提示されている。本実施例では、O4-ニトロベンジルチミン(T-4-ONB)を変換可能な塩基として用い、ニトロベンジル基の除去により、核酸塩基がチミンに変換される。T-4-ONBのSBSの結果、塩基が混在する読み取りがもたらされるが、ニトロベンジル基の除去により、チミンの特異的な読み取りがもたらされる(例えば、その開示が参照により本明細書に組み込まれるA. M. Kietrys, W. A. Velema, and E. T. Kool, J Am Chem Soc. 2017; 139: 17074-17081を参照されたい)。本実施例ではT-4-ONBを用いているが、図4および5A~5Bに提示されている構造を含めた(しかしこれだけに限定されない)変換の結果としてシーケンシング読み取りが変化する任意の変換可能な核酸塩基を利用することができる。
ある特定の実施形態
【0278】
実施形態1.データを符号化するための核酸ポリマーであって、
変換可能な核酸塩基の複数のペアを含み、ペアが、核酸ポリマーに沿って反復的に間隔を置いて存在し、変換可能な核酸塩基それぞれが核酸ポリマー骨格を介して連結しており、
各ペアの変換可能な核酸塩基それぞれが、核酸塩基構造および脱離基を含み、脱離基が核酸塩基構造にリンカーを介して連結しており、各ペアの変換可能な核酸塩基それぞれが第1の状態でもたらされ、脱離基を核酸塩基構造から放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、核酸ポリマー。
【0279】
実施形態2.スペーサー残基の第1の複数のセットをさらに含み、各スペーサー残基が核酸ポリマー骨格を介して連結しており、第1の複数のセットの各セットが、2つまたはそれよりも多くのスペーサー残基を含み、第1の複数のセットの各セットが、変換可能な核酸塩基の複数のペアの各ペアの間に置かれて、変換可能な核酸塩基の複数のペアの間の反復的間隔がもたらされている、実施形態1の核酸ポリマー。
【0280】
実施形態3.スペーサー残基の第2の複数のセットをさらに含み、各スペーサー残基が核酸ポリマー骨格を介して連結しており、第2の複数のセットの各セットが、1つまたは複数のスペーサー残基を含み、第2の複数のセットの各セットが、核酸塩基のペアそれぞれの変換可能な核酸塩基の間に置かれており、第2の複数のセットの各セット内のスペーサー残基の数が、第1の複数のセットの各セット内のスペーサー残基の数よりも少ない、実施形態2の核酸ポリマー。
【0281】
実施形態4.変換可能な核酸塩基のペアの間の反復的間隔が、核酸ポリマーにおけるデータを符号化するためのデータ符号化機構の分解能と等しいまたはそれよりも大きい、実施形態1または2の核酸ポリマー。
【0282】
実施形態5.変換可能な核酸塩基それぞれが、以下の核酸塩基構造:O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンのうちの1つを含む、実施形態1から4のいずれか1つの核酸ポリマー。
【0283】
実施形態6.脱離基が、
【化7】
(式中、Xは、核酸塩基構造に対するリンカーであり、リンカーは、NR、NHR、OR、またはSRのうちの1つであり、Rは、核酸塩基構造である)
のうちの1つを含む、実施形態1から5のいずれか1つの核酸ポリマー。
【0284】
実施形態7.光エネルギーを使用して各脱離基を放出させるものであり、光の第1の波長により各ペアの第1の変換可能な核酸塩基をその第2の状態に変換することが可能なエネルギーがもたらされ、光の第2の波長により各ペアの第2の変換可能な塩基をその第2の状態に変換することが可能なエネルギーがもたらされる、実施形態1の核酸ポリマー。
【0285】
実施形態8.光の第2の波長により、各ペアの第1の変換可能な核酸塩基をその第2の状態に変換することがさらに可能なエネルギーがもたらされる、実施形態7の核酸ポリマー。
【0286】
実施形態9.データを符号化するための核酸ポリマーであって、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換可能な核酸塩基であって、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の核酸塩基構造および第1の脱離基を含み、第1の脱離基が第1の核酸塩基構造に第1のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第1の複数の変換可能な核酸塩基と、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換可能な核酸塩基であって、第2の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第2の核酸塩基構造および第2の脱離基を含み、第2の脱離基が第2の核酸塩基構造に第2のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第2の複数の変換可能な核酸塩基と
を含む、核酸ポリマー。
【0287】
実施形態10.核酸ポリマー骨格を介して連結した複数のスペーサー残基をさらに含み、変換可能な核酸塩基の間にスペーサー残基が確率的にまたは不規則に置かれている、実施形態9の核酸ポリマー。
【0288】
実施形態11.変換可能な核酸塩基それぞれが、以下の核酸塩基構造:O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンのうちの1つを含む、実施形態9または10の核酸ポリマー。
【0289】
実施形態12.脱離基が、
【化8】
(式中、Xは、核酸塩基構造に対するリンカーであり、リンカーは、NR、NHR、OR、またはSRのうちの1つであり、Rは、核酸塩基構造である)
のうちの1つを含む、実施形態9から11のいずれか1つの核酸ポリマー。
【0290】
実施形態13.データ符号化可能ポリマーにおける使用のための変換可能な核酸塩基であって、核酸塩基構造および脱離基を含み、脱離基が核酸塩基構造にリンカーを介して連結しており、脱離基が、光エネルギーまたは酸化還元エネルギーによって核酸塩基構造から除去することが可能である、変換可能な核酸塩基。
【0291】
実施形態14.核酸塩基構造が、O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンを含む、実施形態13の変換可能な核酸塩基。
【0292】
実施形態15.脱離基が、
【化9】
(式中、Xは、核酸塩基構造に対するリンカーであり、リンカーは、NR、NHR、OR、またはSRのうちの1つであり、Rは、核酸塩基構造である)
を含む、実施形態13の変換可能な核酸塩基。
【0293】
実施形態16.リンカーが、NR、NHR、OR、またはSRを含み、Rが、核酸塩基構造である、実施形態15の変換可能な核酸塩基。
【0294】
実施形態17.核酸塩基の複数のペアを含む、データが符号化された核酸ポリマーであって、
核酸塩基のペアそれぞれが、少なくとも第1の変換された核酸塩基を含み、第1の変換された核酸塩基が、第1の核酸塩基構造を含み、第1の変換された核酸塩基が、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されており;
核酸塩基のペアそれぞれが、
核酸塩基構造および第2の脱離基を含む変換可能な核酸塩基であって、第2の脱離基が第2の核酸塩基構造にリンカーを介して連結しており、変換可能な核酸塩基が第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、変換可能な核酸塩基;または
第2の変換された核酸塩基であって、第2の核酸塩基構造を含み、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、第2の変換された核酸塩基
のうちの少なくとも1つをさらに含み、
核酸塩基のペアが、核酸ポリマーに沿って反復的に間隔を置いて存在し、核酸塩基が、核酸ポリマー骨格を介して連結している、
核酸ポリマー。
【0295】
実施形態18.スペーサー残基の第1の複数のセットをさらに含み、各スペーサー残基が核酸ポリマー骨格を介して連結しており、第1の複数のセットの各セットが、2つまたはそれよりも多くのスペーサー残基を含み、第1の複数のセットの各セットが、核酸塩基の複数のペアの各ペアの間に置かれて、核酸塩基の複数のペアの間に反復的間隔がもたらされている、実施形態17の核酸ポリマー。
【0296】
実施形態19.スペーサー残基の第2の複数のセットをさらに含み、各スペーサー残基が核酸ポリマー骨格を介して連結しており、第2の複数のセットの各セットが、1つまたは複数のスペーサー残基を含み、第2の複数のセットの各セットが、核酸塩基のペアそれぞれの変換可能な核酸塩基の間に置かれており、第2の複数のセットの各セット内のスペーサー残基の数が、第1の複数のセットの各セット内のスペーサー残基の数よりも少ない、実施形態18の核酸ポリマー。
【0297】
実施形態20.核酸塩基のペアの間の反復的間隔が、データが符号化された核酸ポリマーにおいてデータを符号化するために使用されるデータ符号化機構の分解能と等しいまたはそれよりも大きい、実施形態17または18の核酸ポリマー。
【0298】
実施形態21.変換された核酸塩基それぞれが、以下の核酸塩基構造:グアニン、アデニン、チミン、またはシトシンのうちの1つを有する、実施形態14から20のいずれか1つの核酸ポリマー。
【0299】
実施形態22.変換可能な核酸塩基それぞれが、以下の核酸塩基構造:O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンのうちの1つを含む、実施形態14から21のいずれか1つの核酸ポリマー。
【0300】
実施形態23.変換可能な核酸塩基それぞれの第2の脱離基が、
【化10】
(式中、Xは、核酸構造に対するリンカーであり、リンカーは、NR、NHR、OR、またはSRのうちの1つであり、Rは、核酸塩基構造である)
のうちの1つを含む、実施形態14から22のいずれか1つの核酸ポリマー。
【0301】
実施形態24.データが符号化された核酸ポリマーであって、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換された核酸塩基であって、第1の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第1の核酸塩基構造を含み、第1の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、第1の複数の変換された核酸塩基と、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換された核酸塩基であって、第2の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第2の核酸塩基構造を含み、第2の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、第2の複数の変換された核酸塩基と
を含む、データが符号化された核酸ポリマー。
【0302】
実施形態25.核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換可能な核酸塩基であって、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の核酸塩基構造および第1の脱離基を含み、第1の脱離基が第1の核酸塩基構造に第1のリンカーを介して連結している、第1の複数の変換可能な核酸塩基と、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換可能な核酸塩基であって、第2の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第2の核酸塩基構造および第2の脱離基を含み、第2の脱離基が第2の核酸塩基構造に第2のリンカーを介して連結している、第2の複数の変換可能な核酸塩基と
をさらに含む、実施形態24のデータが符号化された核酸ポリマー。
【0303】
実施形態26.核酸ポリマー骨格を介して連結した複数のスペーサー残基をさらに含み、スペーサー残基が、変換された核酸塩基および変換可能な核酸塩基を含む核酸塩基の間に確率的にまたは不規則に置かれている、実施形態25の核酸ポリマー。
【0304】
実施形態27.変換された核酸塩基それぞれが、以下の核酸塩基構造:グアニン、アデニン、チミン、またはシトシンのうちの1つを有する、実施形態24から26のいずれか1つの核酸ポリマー。
【0305】
実施形態28.変換可能な核酸塩基それぞれが、以下の核酸塩基構造:O6-グアニン、N2-グアニン、N7-グアニン、N6-アデニン、N5-アデニン、O4-チミン、N3-チミン、2-チオ-チミン、4-チオ-チミン、N4-シトシン、またはN3-シトシンのうちの1つを含む、実施形態25から27のいずれか1つの核酸ポリマー。
【0306】
実施形態29.変換可能な核酸塩基それぞれの脱離基が、
【化11】
(式中、Xは、核酸塩基構造に対するリンカーであり、リンカーは、NR、NHR、OR、またはSRのうちの1つであり、Rは、核酸塩基構造である)
のうちの1つを含む、実施形態25から28のいずれか1つの核酸ポリマー。
【0307】
実施形態30.データ符号化可能な核酸ポリマーにデータを符号化する方法であって、
変換可能な核酸塩基の複数のペアを含むデータ符号化可能な核酸ポリマーであって、ペアが、核酸ポリマーに沿って反復的に間隔を置いて存在し、変換可能な核酸塩基それぞれが、核酸ポリマー骨格を介して連結しており、
各ペアの変換可能な核酸塩基それぞれが、核酸塩基構造および脱離基を含み、脱離基が核酸塩基構造にリンカーを介して連結しており、各ペアの変換可能な核酸塩基それぞれが第1の状態でもたらされ、脱離基を核酸塩基構造から放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、データ符号化可能な核酸ポリマーを提供するステップと、
データ符号化デバイスを利用して、光エネルギーまたは酸化還元エネルギーを供給して、少なくとも1つの核酸塩基の核酸塩基構造から脱離基を放出させることにより、変換可能な核酸塩基の各ペアの少なくとも1つの核酸塩基を第2の状態に選択的に変換するステップと
を含む、方法。
【0308】
実施形態31.データ符号化デバイスが、プラズモニックナノポアを含み、方法が、データ符号化可能な核酸ポリマーをデータ符号化デバイスのプラズモニックナノポアを通過させるステップであって、プラズモニックナノポアにより光エネルギーまたは酸化還元エネルギーを供給して、少なくとも1つの核酸塩基の核酸塩基構造から脱離基を放出させる、ステップをさらに含む、実施形態30の方法。
【0309】
実施形態32.データ符号化可能な核酸ポリマーが、スペーサー残基の第1の複数のセットをさらに含み、各スペーサー残基が核酸ポリマー骨格を介して連結しており、第1の複数のセットの各セットが、2つまたはそれよりも多くのスペーサー残基を含み、第1の複数のセットの各セットが、変換可能な核酸塩基の複数のペアの各ペアの間に置かれて、変換可能な核酸塩基の複数のペアの間の反復的間隔がもたらされている、実施形態31の方法。
【0310】
実施形態33.変換可能な核酸塩基のペアの間の反復的間隔が、データ符号化デバイスの分解能と等しいまたはそれよりも大きい、実施形態31または32の方法。
【0311】
実施形態34.データ符号化デバイスが、プラズモニックウェルまたはチャネルを含み、方法が、データ符号化可能な核酸ポリマーをデータ符号化デバイスのプラズモニックウェルまたはチャネルに移すステップであって、プラズモニックウェルまたはチャネルにより光エネルギーまたは酸化還元エネルギーを供給して、少なくとも1つの核酸塩基の核酸塩基構造から脱離基を放出させる、ステップをさらに含む、実施形態30の方法。
【0312】
実施形態35.データ符号化デバイスが、STEDレーザーシステムを含み、方法が、データ符号化可能な核酸ポリマーを引き伸ばし、引き伸ばされたデータ符号化可能な核酸ポリマーにSTEDレーザーの焦点を合わせるステップであって、STEDレーザーにより光エネルギーまたは酸化還元エネルギーを供給して、少なくとも1つの核酸塩基の核酸塩基構造から脱離基を放出させる、ステップをさらに含む、実施形態30の方法。
【0313】
実施形態36.データ符号化可能な核酸ポリマーにデータを符号化する方法であって、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換可能な核酸塩基であって、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の核酸塩基構造および第1の脱離基を含み、第1の脱離基が第1の核酸塩基構造に第1のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第1の複数の変換可能な核酸塩基と、
核酸ポリマーに沿って確率的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換可能な核酸塩基であって、第2の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第2の核酸塩基構造および第2の脱離基を含み、第2の脱離基が第2の核酸塩基構造に第2のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第2の複数の変換可能な核酸塩基と
を含むデータ符号化可能な核酸ポリマーを提供するステップと、
データ符号化デバイスを利用して光エネルギーまたは酸化還元エネルギーを供給して、変換可能な核酸塩基の核酸塩基構造から脱離基を放出させることにより、第1の複数の変換可能な核酸塩基および第2の複数の変換可能な核酸塩基の変換可能な核酸塩基のサブセットを第2の状態に選択的に変換するステップと
を含む、方法。
【0314】
実施形態37.選択的に変換される第1の複数の変換可能な核酸塩基および第2の複数の変換可能な核酸塩基の変換可能な核酸塩基のサブセットが、符号化されるデータコードに基づく、実施形態36の方法。
【0315】
実施形態38.核酸塩基の選択的変換により、変換された核酸塩基の間に変換可能な核酸塩基を含む核酸ポリマーが得られる、実施形態37の方法。
【0316】
実施形態39.データ符号化デバイスが、プラズモニックナノポアを含み、方法が、
データ符号化可能な核酸ポリマーをデータ符号化デバイスのプラズモニックナノポアを通過させるステップであって、プラズモニックナノポアにより光エネルギーまたは酸化還元エネルギーを供給して、変換可能な核酸塩基の核酸塩基構造から脱離基を放出させる、ステップ
をさらに含む、実施形態36の方法。
【0317】
実施形態40.データ符号化デバイスが、プラズモニックウェルまたはチャネルを含み、方法が、
【0318】
データ符号化可能な核酸ポリマーをデータ符号化デバイスのプラズモニックウェルまたはチャネルに移すステップであって、プラズモニックウェルまたはチャネルにより光エネルギーまたは酸化還元エネルギーを供給して、変換可能な核酸塩基の核酸塩基構造から脱離基を放出させる、ステップ
をさらに含む、実施形態30の方法。
【0319】
実施形態41.データ符号化デバイスが、STEDレーザーシステムを含み、方法が、
データ符号化可能な核酸ポリマーを引き伸ばし、引き伸ばされたデータ符号化可能な核酸ポリマーにSTEDレーザーエネルギーの焦点を当てるステップであって、STEDレーザーにより光エネルギーまたは酸化還元エネルギーを供給して、変換可能な核酸塩基の核酸塩基構造から脱離基を放出させる、ステップ
をさらに含む、実施形態30の方法。
【0320】
実施形態42.データが符号化された核酸ポリマーからデータを復号するための方法であって、
複数の変換された核酸塩基であって、変換された核酸塩基それぞれが、第1の核酸塩基構造を含み、第1の変換された核酸塩基が、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、複数の変換された核酸塩基と、
複数の変換可能な核酸塩基であって、変換可能な核酸塩基それぞれが、核酸塩基構造および脱離基を含み、脱離基が第2の核酸塩基構造にリンカーを介して連結しており、変換可能な核酸塩基が第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、複数の変換可能な核酸塩基と
を含む、データが符号化された核酸ポリマーの複数の重複コピーを提供するステップであって、変換された核酸塩基と変換可能な核酸塩基が、核酸ポリマー骨格を介して連結している、ステップと、
複数の重複コピーの各重複コピーの配列を決定するステップと、
複数の変換された核酸塩基と複数の変換可能な核酸塩基を検出するステップと、
検出された複数の変換された核酸塩基に基づいてデータを復号するステップと
を含む、方法。
【0321】
実施形態43.複数の変換された核酸塩基と複数の変換可能な核酸塩基が、データが符号化された核酸ポリマーの重複コピーの配列決定結果に基づいて検出される、実施形態42の方法。
【0322】
実施形態44.特定の核酸塩基において核酸塩基構造が混在することを示す配列決定結果により、データコードの一部ではない変換可能な核酸塩基が示される、実施形態43の方法。
【0323】
実施形態45.データを符号化するための核酸ポリマーであって、
核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換可能な核酸塩基であって、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の核酸塩基構造および第1の脱離基を含み、第1の脱離基が第1の核酸塩基構造に第1のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第1の複数の変換可能な核酸塩基と、
核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換可能な核酸塩基であって、第2の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第2の核酸塩基構造および第2の脱離基を含み、第2の脱離基が第2の核酸塩基構造に第2のリンカーを介して連結しており、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の状態でもたらされ、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換することが可能である、第2の複数の変換可能な核酸塩基と
を含む、核酸ポリマー。
【0324】
実施形態46.核酸ポリマー骨格を介して連結した複数のスペーサー残基をさらに含み、スペーサー残基が、変換可能な核酸塩基の間に置かれている、実施形態45の核酸ポリマー。
【0325】
実施形態47.データが符号化された核酸ポリマーであって、
核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換された核酸塩基であって、第1の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第1の核酸塩基構造を含み、第1の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第1の核酸塩基構造から第1の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、第1の複数の変換された核酸塩基と、
核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換された核酸塩基であって、第2の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第2の核酸塩基構造を含み、第2の複数の変換された核酸塩基の変換された核酸塩基それぞれが、第2の核酸塩基構造から第2の脱離基を放出させる光エネルギーまたは酸化還元エネルギーによって第1の状態から第2の状態に変換されている、第2の複数の変換された核酸塩基と
を含む、データが符号化された核酸ポリマー。
【0326】
実施形態48.核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第1の複数の変換可能な核酸塩基であって、第1の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第1の核酸塩基構造および第1の脱離基を含み、第1の脱離基が第1の核酸塩基構造に第1のリンカーを介して連結している、第1の複数の変換可能な核酸塩基と、
核酸ポリマーに沿って規則的にまたは不規則に間隔を置いて核酸ポリマー骨格を介して連結した第2の複数の変換可能な核酸塩基であって、第2の複数の変換可能な核酸塩基の変換可能な核酸塩基それぞれが第2の核酸塩基構造および第2の脱離基を含み、第2の脱離基が第2の核酸塩基構造に第2のリンカーを介して連結している、第2の複数の変換可能な核酸塩基と
をさらに含む、実施形態47のデータが符号化された核酸ポリマー。
【0327】
実施形態49.核酸ポリマー骨格を介して連結した複数のスペーサー残基をさらに含み、スペーサー残基が、変換された核酸塩基を含む核酸塩基と変換可能な核酸塩基を含む核酸塩基の間に置かれている、実施形態48の核酸ポリマー。
例示的な実施形態
【0328】
核酸ポリマーを利用するデータストレージのための組成物、システム、および方法の種々の実施例が本明細書に記載される。書き込み可能な核酸ポリマー、そのようなポリマーを作製するための方法、データを書き込むための方法、およびデータを読み取るための方法の実施例が提示される。
【実施例
【0329】
(実施例1)
MeNPOC核酸塩基を有する書き込み可能なDNAポリマー
ビット、データフィールド、スペーサー、デリミタ、および/または末端識別子タグを含む書き込み可能な核酸分子を生成することができる。本実施例では、変換された核酸塩基(すなわち「1」)は5-アミノプロピニル-デオキシウリジンであり、変換されていない核酸塩基(すなわち「0」)は、光によって効率的に除去することができるMeNPOC基による置換をアミン基に有する同じ分子である(その開示が参照により本明細書に組み込まれるP. Klan, et al., Chem Rev. 2013; 113: 119-91を参照されたい)。以下の例:データフィールド:5’-C-(A)-0-(A)-0-(A)-0-(A)-0-(A)-0-(A)-0-(A)-0-(A)-0-(A)-(C)-3’において「0」と示される、MeNPOCによる置換を有するデオキシウリジン塩基を有する変換可能な核酸塩基で全て構成される書き込み可能な核酸を構築する。
【0330】
データフィールドは、集束光エネルギーによる書き込みのための空間分解能を可能にするために6つのアデニンヌクレオチド(A)によって間隔を置いて「0」ビットを含有する。ここではデータフィールドを8ビット(8ビットアーキテクチャでは1「バイト」)で示す。末端のシトシンはデータデリミタ機能をもたらし得るものであり、1つの8ビットフィールドと次の8ビットフィールドの間の中断を示す。スペーサーおよびデリミタはアデノシンおよびシチジンに限定されず、変換可能な核酸塩基と検出可能に異なり、書き込み機構と非反応性であることが好ましいほぼ全ての単一または複数の天然残基または非天然残基であり得ることが理解される。効率的なデータ符号化を実現するためにデリミタは必要ない場合があることも理解される。そのような場合では、書き込み可能な核酸は、デリミタ内に含有されない、リピートされるビットおよびスペーサーを含有する。ビット間のスペーサーの間隔および数を容易に変更して、書き込み方法の分解能および精度に反映させることができることも理解される。
【0331】
書き込み可能な核酸ポリマーは、一列にリピートされるデータフィールド配列からなる。ポリマーの5’末端または3’末端にデータタグによってタグ付けすることができる。データタグは、時間、日付、データの型、使用者、または他の有用な識別情報を示す天然の塩基の配列を含み得る。一部の適用に関しては、識別情報を直接データフィールドに書き込むことができるので、データタグは必要ない場合があることが理解される。
(実施例2)
ローリングサークル反応によって作製される書き込み可能な核酸ポリマー
【0332】
本実施例では、実施例1のリピートされる「データフィールド」を符号化する環状DNAオリゴヌクレオチドを記載する。環をリピート単位と相補的になるように選択し、また、この場合には、サイズが、DNAポリメラーゼ媒介性ローリングサークル合成の良好な基質として作用することが分かっているサイズ範囲に入る57ヌクレオチドになるように選択する(その開示が参照により本明細書に組み込まれるM. G. Mohsen and E. T. Kool, Acc Chem Res. 2016 Nov 15; 49(11): 2540-2550を参照されたい)。環の配列は以下の通り:5’-GTTTTTTATTTTTTATTTTTTATTTTTTATTTTTTATTTTTTATTTTTTATTTTTTG-3’であり、5’末端と3’末端が分子内接合して、環をなしている。
【0333】
環と相補的な3’末端を用いてDNAプライマーを構築する。効果的なプライマー配列の例は以下の通りである:プライマー:5’-ID配列-AAAAAATAAAAAACCAAAAAA-3’
【0334】
ID配列は必要に応じたものである。DNAポリメラーゼ活性を支持するMg2+含有緩衝剤中でDNAプライマーをDNA環とアニーリングさせる。混合物を、データフィールドのリピートを構成することになるヌクレオシド三リン酸(dNTP)と接触させる。実施例1のデータフィールドについては、必要なdNTPは5-ニトロベラトリル-オキシカルボニル-アミノプロピニル(aminoproynyl)デオキシウリジン5’-三リン酸、dATP、およびdCTPである。この溶液を適切なDNAポリメラーゼ酵素と、酵素活性を支持する温度で接触させることにより、データフィールドのリピート、および5’末端にDNAデータ識別子タグを含む長いリピートされる書き込み可能なDNAポリマーを作製する。ゲル分析から、このブランクテープが10,000~50,000ヌクレオチド長であることが示される。このブランクテープをより小さなポリメラーゼ、ヌクレオチド、および環から、サイズ排除クロマトグラフィー、カラム精製、沈殿、ゲル電気泳動によって、または他の精製方法によって単離し、意図しないビット書き込みを回避するために暗闇中で保存する。
【0335】
ローリングサークル合成用の種々のDNAポリメラーゼ酵素が記載されている(その開示が参照により本明細書に組み込まれるS. Ishino and Y. Ishino, Front Microbiol. 2014; 5: 465を参照されたい)。例として、phi29およびBST3.0ポリメラーゼが挙げられる。処理能力が高いポリメラーゼでは、より長い書き込み可能なDNAポリマーを作製することが可能になる。修飾されたヌクレオチド(例えば、本明細書に記載の修飾されたデオキシウリジンなど)を基質として効率的に受容することができるポリメラーゼを使用することができる。
(実施例3)
合成およびライゲーションによって作製される書き込み可能な核酸ポリマー
【0336】
本実施例では、リガーゼ酵素を使用して、塩基対合能が遮断されていることに起因して大多数のポリメラーゼ酵素ではDNAに効率的に組み入れられないO6-オルト-ニトロベンジルG(図3D参照、ここではXと示す)を変換可能な核酸塩基として含有する一本鎖および/または二本鎖の書き込み可能なDNAポリマーをアセンブルする。設計した8ビットデータフィールドのリピート配列は以下の通りである:5’-CCT-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-CGA-3’
【0337】
単一の8ビットフィールドを含むライゲーション可能なオリゴヌクレオチドを以下の配列:5’-pCCT-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-X-(A)6-(CGA)-3’(配列中、「p」は末端リン酸基を示す)を用いて合成する。この配列をライゲーションするためのスプリントを以下の配列:5’-TTTTTTAGGTCGTTTTTT-3’を用いて合成する。
【0338】
このスプリントおよびデータフィールドオリゴヌクレオチドを、リガーゼを支持する緩衝剤中でT4 DNAリガーゼおよびATPと接触させることにより、多くのデータフィールドオリゴマーのエンドツーエンドでの接合をもたらし、それにより、長いポリマー鎖を生じさせる。この産物のゲル分析から、サイズが5000~50,000ヌクレオチドにわたる長さのラダーが明らかになる。所望であれば、「データフィールド」DNA産物の一部を分割し、データ書き込みに別々に使用するために、各末端を別々に異なるDNA識別子とライゲーションすることができる。長いデータフィールドを長さが混在するものとして書き込みに使用する。あるいは、電気泳動ゲルを使用し、特定のバンドを切り出し、溶出させることにより、長さが均一なブランクテープDNAを生じさせる。
【0339】
二本鎖の書き込み可能なDNAポリマーを同様の方法によって得る。この場合、第1のデータフィールドオリゴヌクレオチドも使用するが、粘着末端を有する2重鎖の形成に異なる相補物を使用する。この相補的なオリゴヌクレオチドの配列は以下の通りである:5’-pGTTTTTTCTTTTTTCTTTTTTCTTTTTTCTTTTTTCTTTTTTCTTTTTTCTTTTTTCTTTTTTAGGTC-3’
【0340】
相補的なオリゴヌクレオチドをデータフィールドオリゴヌクレオチドとハイブリダイズさせることにより、粘着末端を有する2重鎖を生じさせる。T4 DNAリガーゼおよびATPとライゲーションすることにより、長いリピートされるDNA二本鎖ポリマーを生じさせる。この産物のゲル分析により、サイズが5000~50,000塩基対にわたる長さのラダーが明らかになる。所望であれば、データフィールドDNA産物の一部を分割し、データ書き込みに別々に使用するために、一方の末端を別々に異なるDNA識別子とライゲーションすることができる。長いデータフィールドを長さが混在するものとして書き込みに使用する。あるいは、電気泳動ゲルを使用し、特定のバンドを切り出し、溶出させることにより、長さが均一なブランクテープDNAを生じさせる。
(実施例4)
光によるデータ書き込み
【0341】
ポアの出口側にプラズモニックボウタイを備えたナノポアデバイスを使用して、実施例1の書き込み可能なDNAポリマーにデジタルデータを書き込む。プラズモニックボウタイを備えたナノポアが記載されている(その開示が参照により本明細書に組み込まれるX. Shi, et al., Small. 2018 May; 14 (18): e1703307を参照されたい)。書き込み可能なポリマーを電解質溶液中に溶解させ、ポアの2つの側面をわたる印加電位によって一定速度でポアを通して移動させる。試験ビット配列「01100101」をリピートして書き込む。これは、ナノプラズモニック構造に、データフィールド内のビットの間隔と一致するように時間間隔を空けて光束を放つことによって実現される。その後のナノポアシーケンシングによる解析により「1」および「0」ビットの配列が明らかになり、繰り返すことにより、ビット書き込みの精度およびエラーを解析することが可能になる。配列内のリピート単位に対する統計解析およびデータ補正により、意図されたビット配列が確認される。より長いデータの列を用いたその後の実験により、分子当たりより多くのデータを符号化する能力が明らかになる。同じデータが書き込まれたDNAテープの複数のコピーを比較することにより、配列比較およびエラー補正が可能になる。
(実施例5)
DNA引き伸ばしおよび光によるデータの書き込み
【0342】
本実施例では、DNA引き伸ばしまたはコーミング(stretching or combing)を、ビットを書き込むための局所的な照明と組み合わせることにより、実施例3の二本鎖の書き込み可能なDNAポリマーにデータを符号化する。引き伸ばし/コーミング技法では、流れを使用して、何万ヌクレオチドもの長さを有する個々のDNA分子をスライドまたは他の固体支持体上に引き延ばし、長いDNAの場所を溶液に添加した単純な色素によって可視化する(それぞれの開示が参照により本明細書に組み込まれるT. F. Chan, et al., Nucleic Acids Res. 2006; 34:e113;およびS Takahashi, M. Oshige, and S. Katsura, Molecules. 2021; 26: 1050を参照されたい)。鎖に沿って漸進的に、鎖に沿って意図された「1」部位において光を集束させて、核酸塩基ビットを「0」の状態から「1」の状態に変換する。光の照明を、2つのレーザーを使用して、高い精度で局所的に照明するSTED技法を使用することによって高分解能で実現する(その開示が参照により本明細書に組み込まれるG. Vicidomini, P. Bianchini, and A. Diaspro, Nat Methods. 201; 15: 173-182を参照されたい)。
【0343】
得られた書き込まれたDNAをアーカイブのために保存することができる。データを検索すべき場合、保存されたデータを、DNAポリマーのナノポアシーケンシングによって読み取ることができる(実施例7を参照されたい)。
【0344】
別の実施形態では、ビットヌクレオチドは、光により切断可能なリンカーによって蛍光クエンチャーと連結された蛍光色素を含む。クエンチャーが存在することにより、書き込まれていないDNAが非蛍光のまま保たれる。「引き伸ばされたDNA」鎖に対する「局所的な照明」により、リンカーの切断がもたらされ、それにより、クエンチャーが消失し、局所的なヌクレオチドが蛍光を発する。引き伸ばされたデータフィールドDNAに沿って光励起光が進行することにより、データ符号化間隔でビットの書き込みがもたらされる。スライドを書き込まれたデータとして保存する。データを検索すべき場合、鎖をスライド上に画像化し、「1」ビットを蛍光スポットとして解析することによって読み取る;間隔から、介在する「0」ビットの存在および数が示される。
(実施例6)
酸化還元によるデータの書き込み
【0345】
本実施例では、図3Gの酸化還元反応性ヌクレオチドを含む書き込み可能なDNAポリマーを用いた酸化還元によるデータの書き込みを記載する。本実験では、ポアに電極を備えたナノポアデバイスを使用する。酸化還元反応性核酸塩基を含有するDNAブランクテープを制御された速度でポアを通過させる。DNAが通過するにしたがい、還元的電圧電位が時間調整された間隔でパルスとして印加される。これにより、還元および「0」ビット上の基の消失がもたらされ、「0」ビットが「1」を符号化するものであるアミノプロピン基に切り換えられる。還元が適用される時間間隔により、「1」基と「0」基の変動するが予測可能な間隔がもたらされ、それにより、デジタルデータが定義される。
(実施例7)
ナノポアシーケンシングによる書き込まれたDNAポリマーの読み取り
【0346】
一般的なナノポアシーケンシングデバイスでは、DNA分子がポアを通過する間の電解質の電流の流れを測定する。DNA塩基はそれぞれサイズおよび形状が異なるので、異なる塩基がそれぞれポアを通過すると電流がわずかに変更される。本実施例では、市販のナノポアデバイスを用いて実験を実施し、書き込まれたDNAテープが通過している間、電流の変化を経時的に読み取る。この場合、実施例3において作製され、実施例4において書き込まれた一本鎖の書き込まれたDNAポリマーを使用する。「1」および「0」ビットは、GおよびニトロベンジルGを含み、これらはサイズが相当に異なる。ビットが全て「0」の状態であるDNAテープ(ブランクポリマー)を用いた実験により、最も大きなニトロベンジルGヌクレオチドが通過した時に電流が低下することが明らかになり、これらの「0」ビットとスペーサーおよびデリミタの間の電流の差異を区別することができる。別途、全てが「1」のポリマーであるDNAを測定すると、「1」(G)ビットが通過した際の観察される電流のレベルが示される。これらの実験により、「1」ビットおよび「0」ビットを示す電流レベルの読み取りおよび区別に関する較正がもたらされる。次に、完全に書き込まれたDNAポリマーを通過させる。「1」および「0」を示す電流レベルを読み取り、スペーサーおよびデリミタについて見られた電流レベルの状況下に置く。必要であれば、データ読み取りの正確度を改善するために同じ鎖の多数の読み取りを使用する。
(実施例8)
デュアルビット書き込み可能な核酸ポリマー
【0347】
本実施例では、活性シグナルを用いて「1」ビットと「0」ビットの両方の書き込みを可能にする書き込み可能な核酸ポリマー設計を提示する。本設計では、ゼロはデータフィールドに受動的に含められず、むしろ能動的な切り換えシグナルが必要である。別個の波長の光で光により除去可能な基の引き金を引くことができる。図13A~13Cに、325nmで照射することによって除去可能な基、および400nmの照射によって除去可能な異なる基を含むヌクレオチドの例を示す。これらの2つの基がブランクDNAテープのデータフィールド内で互いに近くに置かれている場合、400nmの光パルスでは、ペア内の2つの基のうちの一方のみが除去される。他方では、325nmの光パルスにより、これらの基の両方の喪失がもたらされる。これらの2つのアウトカムはデータを符号化するための「0」および「1」に類似したものである。
(実施例9)
データ符号化可能DNAの構築
【0348】
141ヌクレオチドのDNA鎖を、2つのスペーサー核酸塩基によって隔てられた反復的にリピートされる変換可能な核酸塩基(XおよびY)のペアを含有するように合成する。各ペアが、符号化可能なデータのビットを表す。核酸塩基のペアそれぞれを10個の介在するスペーサー核酸塩基によって隔てる。鎖内のペアの総数は11であり、したがって、DNAは11ビットの「1」および「0」データを符号化し得る。この150merの配列は、
【化12】
であり、配列中、XはO6-ニトロベンジルグアニンを示し、YはN6-クマリニルメチル-アデニンを示す。
【0349】
相補DNA配列を、第1の鎖と相補的であり、したがって2重鎖を形成することができるように合成する。突出した粘着末端が創出されるように相補配列を設計することができ、2つの鎖を5’リン酸基でさらに修飾する。この141merの配列は、
【化13】
である。
【0350】
この相補物内の塩基は塩基XおよびYの変換されたバージョンと相補的になるように設計されていることに留意されたい。より長いDNAには、分子当たりにより多くのデータを保存することができる。データストレージのためにより長い核酸ポリマーを生成するために、2つのDNA鎖を、ハイブリダイゼーションおよび酵素的ライゲーションを支持するMg2含有緩衝剤中で混合することができる。ATPおよびT4 DNAリガーゼを添加し、それにより、150ヌクレオチドのDNAのエンドツーエンド接合をもたらして、アガロースゲル電気泳動によって分析して約1500bpのDNAを含めた、長さ約300bpおよびそれよりも長い、長いポリマー鎖にする。好ましいサイズのデータ符号化可能DNAをゲル電気泳動および抽出によって単離することができる。したがって、データ符号化可能ポリマーを、長さが混在するものとして、または、特定のバンドを切り取ることによって特定の長さを有するものとして提供し、利用することができる。
(実施例10)
ポリマー内へのデータ符号化
【0351】
ポアの出口側にプラズモニックボウタイを備えたナノポアデバイスを使用して、実施例9のデータ符号化可能DNAポリマーにデジタルデータを書き込む。プラズモニックボウタイを備えたナノポアは記載されている(その開示が参照により本明細書に組み込まれるX. Shi, et al., Small. 2018 May; 14 (18): e1703307を参照されたい)。データ符号化可能ポリマーを電解質溶液中に溶解させ、ポアの2つの側面をわたる印加電位によって一定速度でポアを通して移動させる。データ配列「01100101100」をポリマー内に符号化する(最初の150ヌクレオチドについて)。これは、ペアをなすビットの間隔と一致するように時間間隔を空けてナノプラズモニック構造上に光束を放つことによって実現される。
【0352】
ビットデータを符号化するために、光エネルギーを400nmの波長でビットペアに供給して、N6-クマリニルメチル-アデニンからクマリニルメチル基を放出させて、核酸塩基をアデニンに変換することができる。400nmの光エネルギーはO6-ニトロベンジルグアニンには影響を及ぼさず、この核酸塩基は変換されないまま残る。このビットペア変換は「0」と示すことができる。同様に、光エネルギーを365nmの波長でビットペアに供給して、O6-ニトロベンジルグアニンからニトロベンジル基を放出させて、核酸塩基をグアニンに変換し、かつ、N6-クマリニルメチル-アデニンからクマリニルメチル基を放出させて、核酸塩基をアデニンに変換することができる。このビットペア変換は「1」と示すことができる。データ符号化を継続して、データ配列「01100101100」を得ることができ、これは、構造的に以下の核酸塩基配列を有する:
【化14】
(配列中、XはO6-ニトロベンジルグアニンを示し、YはN6-クマリニルメチル-アデニンを示す)。特に、変換されていない核酸塩基が配列決定結果において塩基が混在するものとして読み取られるSBSによって復号を実施することができるように、複数のコピーを符号化することができる。
(実施例11)
符号化されたDNAからのデータの復号
【0353】
ナノポアデバイスをデュアル波長光パルスの使用と組み合わせて使用することによってデータを1500bpのDNA鎖に符号化した後、得られたDNAは、データを回収すべき場合に復号(「読み取り」)の提供ができたものである。DNAをおよそ10~100コピーの多重度で符号化することができ、符号化されたDNAは、混在するアウトカムを復号できるようにするために十分なコピーを含有する。合成によるロングリード単一分子シーケンシング(Pacific Biosciences)の使用によってDNAの配列を決定する。配列出力から、ほぼ100%の忠実度(98%またはそれよりも良好)で元のアセンブリに存在した塩基の通りの読み取りで、変換可能な塩基が予測通り配列決定されることが示される。「0」が符号化される場合、N6-クマリニルメチル-アデニンからクマリニル基が除去され、それにより、アデニンの形成がもたらされる。したがって、この位置においてN6-クマリニルメチル-アデニンのシグナルを超える「A」のシグナルの増強が見いだされる。しかし、同じビットペアにおけるO6-ニトロベンジルグアニンのシーケンシングシグネチャーは、GとAが混在するものとして読み取られる。「1」と符号化される位置では、クマリニル基およびニトロベンジル基の両方が除去され、それにより、ビットのY位においてAシグナルが増強されると共に、同じビットペアのX位においてもアデニンシグナルが増強される。
(実施例12)
確率的または不規則なデータ符号化
【0354】
本実施例では、変換可能な核酸塩基がポリマーに沿って不規則に間隔を置いてもたらされる。データ符号化可能ポリマーは、鎖に沿ってO6-ニトロベンジルグアニンおよびO4-ニトロベンジルチミンを含む。O6-ニトロベンジルグアニンのグアニンへの変換を「0」と示すことができ、O4-ニトロベンジルチミンのチミンへの変換を「1」と示すことができる。ポリマーがナノポアを通過するにしたがい、データコードに従って適当な変換可能な核酸塩基が選択的に変換されることによってデータが符号化される。さらに、正しいコードが確実に符号化されるように、変換可能な核酸塩基をスキップすることができる。図15に、「1010010」というコードが符号化されるデータ符号化の前後のDNAポリマーを例示する。このプロセスでは、いくつかの変換可能な核酸塩基がスキップされ、変換されないまま残る。符号化されたデータを復号する際、変換された核酸塩基のみを利用してデータコードを解読し、変換されていない塩基は無視する。SBSを使用する場合、特定の核酸塩基が変換されていないか(例えば、核酸塩基構造が混在する読み取りがもたらされる)または変換されているか(例えば、単独の核酸塩基構造の読み取りがもたらされる)を解読するために、多数の重複する符号化されたDNAポリマーを利用することができる。
(実施例13)
修飾された変換可能な核酸塩基を一定の間隔で用いた「書き込み可能な」DNAの構築
【0355】
変換可能な塩基O6-クマリニルG(G*)をデオキシヌクレオシド三リン酸誘導体(dG*TP)として合成する。G*は、DNA鋳型を「ベンジ」などの相補的な塩基を含有するように提供するとポリメラーゼ基質として作用する(例えば、C. M. N. Aloisi et al., J. Am. Chem. Soc 2020, 142 (15): 6962-6969を参照されたい)。ベンジは、O6アルキルG修飾塩基と選択的に対合することが分かっている。
【0356】
配列内に単一の「ベンジ」ヌクレオチドを有する、60ヌクレオチドのサイズを有する環状一本鎖DNAオリゴヌクレオチドを構築する。他の59ヌクレオチドは、ネイティブなA、C、T、およびGヌクレオチドで構成される。環の非ベンジ領域と相補的なDNAプライマー(20ヌクレオチド長)(1μM)を、ポリメラーゼを支持する緩衝剤中の環の溶液(1μM)に添加する。「ローリングサークル」DNA合成を誘導するために、Phi29ポリメラーゼをそれぞれ500uMの5種のヌクレオチド(dATP、dGTP、dCTP、dTTP、およびdG*TP)と共に、Phi29ポリメラーゼ活性について既知の適切な条件下で添加する。4時間後、長さが様々であるが、多くが、サイズマーカーを用いたアガロースゲル電気泳動によって判断して10kBを超える長さである、長いリピートされる一本鎖DNAを有する溶液が得られる。溶液中の一本鎖DNAの配列決定により、リピートされる配列にリピート当たり1つのG*塩基が60ヌクレオチドの等間隔を置いて含有されることが確認される。
【0357】
この一本鎖DNAの溶液を、このリピートされる配列と相補的なプライマーを、4種のネイティブなヌクレオシド三リン酸およびphi29ポリメラーゼと共に使用して二本鎖形態に変換する。その結果、60bpごとに単一のG*修飾塩基を含有する長い二本鎖DNAの溶液が生じる。
【0358】
このポリメラーゼ手法を修飾されたDNA塩基と共に使用して、光により改変可能な基がポリメラーゼ酵素の基質ではない場合に光により改変可能な基をDNAの核酸塩基に組み入れることに関する問題を解決する。
【0359】
第2の修飾塩基を含有するリピートされるDNAを構築するために、この戦略を改変したものを使用する。修飾塩基T*をデオキシヌクレオシド三リン酸誘導体として合成する。T*は、光を用いて除去することができるNPE基を含有するO4-ニトロフェネチルTである。O4-アルキルTは、ポリメラーゼにより、相対するGと対合することが分かっている。例えば、M. K. Dosanjh et al., Carcinogenesis 1993, 14 (9): 1915-1919を参照されたい。
【0360】
配列内に1回ベンジを含有する第2の環状DNAを構築する。この場合、同様に配列内にただ1つのCもベンジから10ヌクレオチド離れて存在する;残りの塩基はG、C、およびTである。上記のDNAポリメラーゼおよびプライマーを上記と同じ5種のヌクレオチド(dATP、dGTP、dCTP、dTTP、およびdG*TP)と共に使用することにより、リピート当たり1回のG*および10ヌクレオチド置いてリピート当たり単一のGを含有する長いリピートされるDNAが生じる。このリピートと相補的なDNAプライマーをポリメラーゼおよびヌクレオチド(dTTP、dGTP、dATP、dT*TP、dCTPは用いない)と共に使用することにより、リピート当たり1回のG*およびG*から10bp置いて逆の鎖内にリピート当たり1回のT*を含有する長いリピートされるDNA2重鎖の合成がもたらされる。
【0361】
本実施例では、光により除去可能な核酸塩基(例えば、光による変換後に天然の核酸塩基に変換される、光により除去可能な核酸塩基)を有するヌクレオチドをポリメラーゼの存在下で使用することで、光により除去可能な核酸塩基を一定の間隔で有する書き込み可能なDNAを合成することができることが示される。この方法では、より長いDNA鎖の制御可能な作製のためにポリメラーゼを利用することができる。この方法を使用して作製されるDNAは、骨格修飾を有するDNAなどの合成オリゴのライゲーションによってのみ合成することができるDNAよりも有意に長い。
(実施例14)
DNA内への「痕跡がない」のデータ書き込みおよびロングリードSMRTシーケンシングを用いた読み取り
【0362】
20kbのDNAを、光照射による「書き込み」の際にネイティブなDNA核酸塩基に変換することができる2つの修飾された変換可能な核酸塩基(XおよびY)を含有するように構築する。全ての修飾の位置が既知であり、所与の修飾の各存在間に約60塩基対(約20nm)の距離の間隔をリピートして置く。すなわち、Xが隣接するXからおよそ60塩基対(bp)のところに位置し、Yが隣接するYからおよそ60bpのところに位置する。両方の修飾(XおよびY)は互いに10塩基対以内に存在し、したがって、X/Yの所与のペアまたは対が所与の局所的な光励起事象に同時に曝露する。このDNAアセンブリは「DNAブランクテープ」と示される。2つまたはそれよりも多くの修飾された核酸塩基をDNAブランクテープに組み入れるために混合ポリメラーゼを使用することができる。
【0363】
核酸塩基Xは、O-6にリンカーも側鎖も伴わずに直接付着したO-ニトロフェネチル(NPE)基で修飾されたグアニンである。核酸塩基Xは、360nmでの照射によってネイティブなグアニン(すなわち、痕跡を有さない)に変換することができる。本実施例では、O-6修飾されたグアニンはヌクレオチドの「書き込まれていない」(「ブランク」)形態であり、照射による上首尾の除去後、グアニン産物は書き込まれたものとみなされ、その1または0の解釈は近くのY修飾の状態に依存する。
【0364】
以前の研究により、O-6においてアルキル基によって修飾されたグアニンを、合成によるシーケンシングを介してポリメラーゼ酵素によって読み取ることができることが示されている。例えば、A. M. Kietrys, J. Am. Chem. Soc. 2017, 139 (47); 17074-17081を参照されたい。O-6においてアルキル基によって修飾されたグアニンには、一般には、配列の多数の読み取りの中でAとGが混在して符号化される。符号化の定量的パーセンテージは、いずれの正確な修飾およびいずれのポリメラーゼが読み取りに使用されるかに依存し、これを、修飾を含有する合成DNA断片のSMRTシーケンシングによって事前に測定する(較正実験)。一致する読み取りから、この修飾が符号化された塩基のパーセンテージが得られる。例えば、同じDNA断片を再度読み取ると、ポリメラーゼにより読み取りの30%の修飾塩基の逆側にCが挿入され(塩基が「G」であると解釈される)、読み取りの64%の塩基の逆側にTが挿入される(塩基が「A」であると解釈される)ことが認められることを観察することができる。この単一の修飾塩基に対する混在シグナルは、書き込まれていないビットのシグナル(指紋)である。その単一分子内の塩基がGへの光による変換を首尾よく受けた場合、読み取りの本質的に100%がGであると解釈される。
【0365】
1つの位置にこの修飾を含有する同じDNA分子の複数のコピー(例えば、1000コピー)が存在し、DNAにバルク溶液中で360nmの光をDNAの50%においてNPE基が除去される程度まで照射した場合、この変化は合成によるシーケンシングによって可読のままになる。それと一致する読み取りは、修飾された核酸塩基(すなわち、O-6ニトロフェネチル置換グアニン)の指紋とネイティブな核酸塩基(すなわち、グアニン)の指紋の間で平均50%になる。したがって、使用者は、光によって符号化されたデータを100%未満の完全収率で読み取ることができる。
【0366】
本実施例では、同様に、核酸塩基Yは、O-4においてクマリニル(Coum)基で修飾されたチミンである。核酸塩基Yは、360nmまたは400nmでの光照射によって「痕跡がない反応」でネイティブなチミンに変換することができる。上記のグアニンの解析と同様に、SMRTシーケンシングを用いて較正を行って、ネイティブなチミンとは別個の混在する符号化のパーセンテージを決定する。この混在する符号化のパーセンテージは、書き込まれていないビットに存在するものなどの、変換されていないCoum-チミンを示す指紋である。Coum-チミンがネイティブな核酸塩基チミン(T)への光による変換を受けると、読み取りの本質的に100%がネイティブなTとして符号化される。核酸塩基Xに関しては、修飾された核酸塩基Yの指紋とネイティブな核酸塩基Tの指紋が平均化することが観察されることにより、DNAの複数のコピーの一部が変換されたと解釈することができる。
【0367】
本実施例では、「0」ビットを、G-NPE/T-Coumペア内のT-Coumが400nmでの照射によってTに変換された場合であると解釈する。両方の修飾が除去された場合(360nmでの照射を使用する)、ビットを「1」と解釈する。再度、最大収率100%未満で変換されたビットを解釈するために、データの複数のコピーの読み取りを使用することができる。
【0368】
データ「ビット」の局所的な書き込みには、局所的な照射または局所的な励起方法、例えば、STED顕微鏡照射ビームをDNAに沿って移行させること、またはDNAをゼロモード導波管またはプラズモニックナノポアを当技術分野で公知の方法を使用して通して移行させることを使用する。
【0369】
本実施例におけるブランクテープDNAは、DNA配列内のいたるところで、ほぼ等間隔を置いてXおよびYで修飾することに留意されたい。したがって、本実施例におけるブランクテープDNAは、いたるところにバイナリデータが書き込まれる潜在性を含む。X、Yの修飾された基のペアは、単にデータを欠く(すなわち、書き込まれていない)ものとみなされる。DNAの任意の場所から開始して同一のデータを書き込むことができる(完全な書き込みプロセスのために十分な長さがあると仮定する)。書き込み用の光に対するDNAの位置付けは確率的に変動し得、移行のスピードも変動し得るので、0ビットおよび1ビットの列を、「ブランク」ビットをスキップして解釈することにより、それにもかかわらずデータの書き込みおよび読み取りを行うことができる。これには、書き込みの開始部位および終止部位を慎重に位置付ける必要がなく、また、移行スピードを完全に制御する必要がないという利点がある。ビットの位置付けのために中断する必要がないので、この書き込み方法は、DNAポリマーのナノポアを通る移行および正確な位置を制御することによって機能する方法よりもより単純かつ高速である。
【0370】
文字「e」が符号化されるデータを、DNAブランクテープに、スライド上に引き伸ばされたDNA分子に対して超分解能顕微鏡を使用して単一分子レベルで書き込む。文字「e」の8ビットユニコードバイナリ列は、20nmの分解能の超分解能顕微鏡からの360nmの光(1)および/または400nmの光(0)を8パルスで使用し、01100101である。1000個の単一分子に対して書き込みを1000回行い、終了時にDNAを含有するスライドを洗浄することによってDNAを収集する。
【0371】
この「書き込まれた」DNAをSMRTシーケンシングにかける。修飾された核酸塩基(G-NPE/T-Coumペアとして)の指紋を示す位置をブランクであり、データが符号化されていないものと解釈する。読み取りの一致により修飾された塩基と修飾されていない塩基の指紋の平均化が示されるペアをなすビット位置をデータと解釈する;NPEの除去によるTの選択的なブロッキング除去は「0」を示し、TおよびGの両方の実質的な変換が示されるペアをなすビット位置は書き込まれたビット「1」を示す。データの保存(文字「e」であると解釈されるデータ変換)を示すビット列01100101を生成するために鎖に沿って進行する。
【0372】
必要に応じてデータ補正を使用してエラーを補正することができることに留意されたい。例えば、大多数の単一分子DNAコピーにより01100101列が得られたが他のバイナリ列も存在するという場合、バイナリデータを比較することにより、正しい結論が導かれ得る。例えば、いくつかのビットの見落としが生じる可能性がある(例0100101)またはDNAの末端に達する可能性があることに起因してデータがなくなる可能性がある(例01100)。しかし、これらの異なる列を比較することにより、これらのエラーがあったとしても正しい結論が導かれる。このデュアルビットでのアクティブな書き込みにより、使用者が、DNAの特定の位置付けが必要な場合に可能なものよりも迅速に書き込みを行うことが可能になる。
図1
図2
図3-1】
図3-2】
図3-3】
図4
図5-1】
図5-2】
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【国際調査報告】