(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-20
(54)【発明の名称】デジタルデータ保存のための生体適合性核酸
(51)【国際特許分類】
C12M 1/00 20060101AFI20221213BHJP
C12N 15/09 20060101ALI20221213BHJP
C12N 15/11 20060101ALI20221213BHJP
G16B 50/30 20190101ALI20221213BHJP
【FI】
C12M1/00 Z
C12N15/09 Z ZNA
C12N15/11 Z
G16B50/30
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022520144
(86)(22)【出願日】2020-10-01
(85)【翻訳文提出日】2022-05-20
(86)【国際出願番号】 EP2020077497
(87)【国際公開番号】W WO2021064095
(87)【国際公開日】2021-04-08
(32)【優先日】2019-10-01
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】516086358
【氏名又は名称】サントル ナショナル デ ラ ルシェルシュ シアンティフィック
(71)【出願人】
【識別番号】518170446
【氏名又は名称】ソルボンヌ ウニベルシテ
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】ルメール,ステファン
(72)【発明者】
【氏名】クロゼット,ピエール
(72)【発明者】
【氏名】シュイ,ジュオ
(72)【発明者】
【氏名】マース,アレクサンドル
(72)【発明者】
【氏名】ル ペイエ,ジャンヌ
【テーマコード(参考)】
4B029
【Fターム(参考)】
4B029AA27
4B029BB20
(57)【要約】
本発明は、少なくとも1つの二本鎖複製性複合核酸分子を含むデジタルデータの保存および/または編集のための装置に関する。上記複合核酸分子は、デジタルデータ符号化核酸および非デジタルデータ符号化核酸の両方を含む。非デジタルデータ符号化核酸は、隣接するデジタルデータ符号化核酸のメタデータの索引作成および/または提供を可能にし得る。本発明に係る複合核酸分子は、アレイを構成するためにプールされ得、アレイは、デジタルデータを保存する物理的支持体を表すDNAドライブを構成し得る。
【選択図】
図2
【特許請求の範囲】
【請求項1】
式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、
[DB]は、約8ヌクレオチド~約10
6ヌクレオチド、好ましくは約500ヌクレオチド~約5,000ヌクレオチドの長さを有するデジタルデータ符号化核酸を表し、
[UP]および[DO]は、それぞれが約0ヌクレオチド~約10
4ヌクレオチド、好ましくは約10ヌクレオチド~約200ヌクレオチドの長さを有する、非デジタルデータ符号化核酸の対を表し、
xは、約1~約10
5を表す)
の核酸を含む、少なくとも1つの二本鎖複製性複合核酸分子を含むデジタルデータの保存および/または編集のための装置。
【請求項2】
前記複合核酸分子が、約500ヌクレオチド~約10
11ヌクレオチド、好ましくは約10
3ヌクレオチド~約10
5ヌクレオチドの長さを有する、請求項1に記載の装置。
【請求項3】
前記式(I)の核酸が、約35%~約65%のC+Gパーセンテージを有する、請求項1または2に記載の装置。
【請求項4】
前記式(I)の核酸が、1つ以上のRNAを符号化せず、好ましくは1つ以上のmRNAを符号化しない、請求項1~3のいずれか1項に記載の装置。
【請求項5】
前記式(I)の核酸が、1つ以上の開始コドンを含まず、かつ/または6つ全てのリーディングフレームにおいて約200ヌクレオチドあたり1つ以上の終止コドンを含む、請求項1~4のいずれか1項に記載の装置。
【請求項6】
前記式(I)の核酸が、BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIからなる群で選択される酵素またはそのアイソシゾマーに関する1つ以上の制限部位を含まない、請求項1~5のいずれか1項に記載の装置。
【請求項7】
前記式(I)の核酸が、少なくとも4つの同一のヌクレオチドの1つ以上の反復を含まない、請求項1~6のいずれか1項に記載の装置。
【請求項8】
前記[DB]核酸の各ヌクレオチドが、1または2ビットのデジタルデータを符号化する、請求項1~7のいずれか1項に記載の装置。
【請求項9】
前記[UP]および[DO]核酸が、それぞれ、少なくとも1つのバーコード符号化核酸および/または少なくとも1つのメタデータ符号化核酸を含む、請求項1~8のいずれか1項に記載の装置。
【請求項10】
デジタルデータを保存するための方法であって、
a)前記デジタルデータに、少なくとも1つの二本鎖のデジタルデータ符号化[DB]核酸配列(S
DB)および少なくとも1対の非デジタルデータ符号化[UP]および[DO]核酸配列(S
UP)および(S
DO)を割り当てるステップと、
b)配列(S
UP)、(S
DB)、および(S
DO)、それぞれから、式(Ia):
5’-([UP]-[DB]-[DO])-3’(Ia)
の少なくとも1つの核酸を合成するステップと、
c)式(Ia)の1つ以上の核酸をアセンブルして、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、xは、約1~約10
5を表す)
の核酸を含む二本鎖複製性複合核酸分子を得るステップと、
d)別個の配列の1~約10
9個の複合核酸分子を含み、ステップc)で得た式(I)の核酸を含む少なくとも1つのプールをストレージセルに保存するステップと
を含む、方法。
【請求項11】
e)ステップd)で得たプールを、1つのプール~約10
6のプール、好ましくは約96または約384のプールを含む少なくとも1つのアレイに構築およびグループ化するステップをさらに含む、請求項10に記載の方法。
【請求項12】
ステップc)で得た複合核酸分子が、プラスミド、コスミド、原核生物染色体、または真核生物染色体である、請求項10または11に記載の方法。
【請求項13】
c1)in vivoで、ステップc)で得た式(I)の核酸を含む少なくとも1つの複合核酸分子を増幅するステップと、
c2)ステップc1)で得た増幅された複合核酸分子を抽出および精製するステップと
をさらに含む、請求項10~12のいずれか1項に記載の方法。
【請求項14】
ステップc1)が、生物、好ましくは微生物によりin vivoで行われる、請求項13に記載の方法。
【請求項15】
請求項1~9のいずれか1項に記載の装置により保存されたおよび/または請求項10~14のいずれか1項に記載の方法により保存されたデジタルデータを回収するための方法であって、
a)式(I)の核酸を含む二本鎖複製性複合核酸分子に含まれている式(Ia)の少なくとも1つの核酸をシーケンシングして、少なくとも1つの核酸配列(S
UP-S
DB-S
DO)を得るステップと、
b)少なくとも1つの核酸配列(S
DB)をデジタルデータに変換するステップと
を含み、
任意選択で、ステップa)の前に、式(Ia)の少なくとも1つの核酸を増幅するステップa0)が行われる、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルデータの生体分子への保存に関する。より具体的には、デジタルデータは、二本鎖複製性複合核酸分子に保存され得、さらにシーケンシング後に容易に回収され得る。
【背景技術】
【0002】
デジタルデータの保存およびアーカイブ化は、我々現代社会の主要な問題である。データセンターに保存される現在のデジタルメディアは、脆弱であり、かさばり、エネルギーを消費する。光学データ、磁性テープ、ハードドライブ、またはフラッシュメモリが開発されているが、それらの耐久性は平均して20年を超えることはない。これらデータは、定期的に新規の信頼性のある媒体にコピーされなければならず、この作業は、制御された温度および湿度で行われなければならず、莫大なエネルギーコストを誘発し、大量の原材料を必要とする。データセンターにより消費されるエネルギーの量は、インターネットが一国に匹敵する場合、これは世界で6番目に大きな電気の消費者である当該閾値に達しており、年間消費量は150TWhであり、これは、世界全体のエネルギー消費の4%に対応し、イギリスの年間消費量よりも約40%多くを表す。データセンターのカーボン・フットプリントは、全世界の民間航空のカーボン・フットプリントにおおよそ対応する。これらのエネルギーコスト、これらのカーボン・フットプリント、およびそれらのかさばる領域に対する必要性の増大にも関わらず、データセンターが保存できるのは我々が生産するデータのわずか30%に過ぎず、一方我々のデータ生産は指数関数的に大きくなっている。「今日、我々は生産する情報の約30%を保存できるが、10または12年以内に、我々が保存できるのは約3%となるであろう」(Dr. Karin Strauss, Microsoft Research)。これら全般的な検討を考慮すると、データの革命、ビッグ・データの市場、および人工知能の開発は、データ保存の問題に対する革新的な解決策を見出すことなく、推進することはできない。
【0003】
国際特許公開公報第2019079802号は、ヌクレオチド配列を復号する方法であって、上記ヌクレオチド配列が、情報の形式に対応する値を符号化しており、情報の形式を2進法のASCIIビットの配列に変換するステップと、2進法のASCIIビットの配列を3進法のASCIIビットの配列に変換するステップと、3進法のASCIIビットの配列を対応するオリゴヌクレオチド配列に変換するステップとを含む、方法を開示した。
【0004】
Taejin Ahnら(Genomics and Informatics, 2018, Vol. 16(4) :e30)は、ロングリードDNA(約1,000bp)にデジタル情報を保存することを開示し、ここで、各ビット0または1は、6bpのノイズ配列(ランダム配列)に各末端で隣接している4bpのシグナル配列(ビット0ではTATTおよびビット1ではACCC)で作製されている16bpの核酸単位により符号化されている。
【0005】
ヌクレオチド配列(たとえばDNAまたはRNA分子)の形態で情報を保存する既存の方法は、限定および技術的な問題を有しており、中でも(1)これらは通常、短い配列の一本鎖オリゴヌクレオチド(<200ヌクレオチド)に基づき、そのために保存された情報の密度および量が限定され;(2)これらは通常、in vitroでの化学合成または酵素による合成を必要としており;(3)これらは通常、物理的な媒体、すなわち短いヌクレオチド配列により制約されている指標構築システムに基づくものであり、よって有効性が限定されており;(4)これらは通常、生物を使用する操作と互換性はない。
【0006】
細胞DNAへのデジタルデータの保存は、たとえばDagherら(Evolutionary Intelligence, 2019)により論述されている。著者は、細胞への保存に適した核酸分子を着想するための示唆を提供しており、DNA符号化に好ましい環境としてタンパク質符号化DNA(pcDNA)を、実施が容易であり、pcDNAがコドンを介して十分に理解されており、ウイルス、原核生物、および酵母のゲノムを支配しているため、明確に推奨している。
【0007】
大量のデータの符号化を持続でき、さらに生体適合性であり得る、すなわち、生物を使用してコピー、編集、書き込み、および/または読み取られ得るデジタルデータを保存する手段を伴う最先端技術を提供する必要性が、依然として存在する。
【発明の概要】
【0008】
本発明の一態様は、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、
[DB]は、約8ヌクレオチド~約106ヌクレオチド、好ましくは約500ヌクレオチド~約5,000ヌクレオチドの長さを有するデジタルデータ符号化核酸を表し、
[UP]および[DO]は、それぞれが約0ヌクレオチド~約104ヌクレオチド、好ましくは約10ヌクレオチド~約200ヌクレオチドの長さを有する、非デジタルデータ符号化核酸の対を表し、
xは、約1~約105を表す)
の核酸を含む、少なくとも1つの二本鎖複製性複合核酸分子を含むデジタルデータの保存および/または編集のための装置に関する。
【0009】
一部の実施形態では、複合核酸分子は、約500ヌクレオチド~約1011ヌクレオチド、好ましくは約103ヌクレオチド~約105ヌクレオチドの長さを有する。特定の実施形態では、式(I)の核酸は、約35%~約65%のC+Gパーセンテージを有する。一部の実施形態では、式(I)の核酸は、1つ以上のRNAを符号化せず、好ましくは1つ以上のmRNAを符号化しない。特定の実施形態では、式(I)の核酸は、1つ以上の開始コドンを含まず、および/または6つ全てのリーディングフレームにおいて約200ヌクレオチドあたり1つ以上の終止コドンを含む。一部の実施形態では、式(I)の核酸は、BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIからなる群で選択される酵素またはそのアイソシゾマーに関する1つ以上の制限部位を含まない。特定の実施形態では、式(I)の核酸は、少なくとも4つの同一のヌクレオチドの1つ以上の反復を含まない。一部の実施形態では、[DB]核酸の各ヌクレオチドは、1または2ビットのデジタルデータを符号化する。特定の実施形態では、[UP]および[DO]の核酸は、それぞれ、少なくとも1つのバーコード符号化核酸および/または少なくとも1つのメタデータ符号化核酸を含む。
【0010】
一態様では、デジタルデータを保存するための方法は、
a)前記デジタルデータに、少なくとも1つの二本鎖のデジタルデータ符号化[DB]核酸配列(SDB)および少なくとも1対の非デジタルデータ符号化[UP]および[DO]核酸配列(SUP)および(SDO)を割り当てるステップと、
b)配列(SUP)、(SDB)、および(SDO)、それぞれから、式(Ia):
5’-([UP]-[DB]-[DO])-3’(Ia)
の少なくとも1つの核酸を合成するステップと、
c)式(Ia)の1つ以上の核酸をアセンブルして、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、xは、約1~約105を表す)
の核酸を含む二本鎖複製性複合核酸分子を得るステップと、
d)別個の配列の1~約109個の複合核酸分子を含み、ステップc)で得た式(I)の核酸を含む少なくとも1つのプールをストレージセルに保存するステップと
を含む。
【0011】
特定の実施形態では、本方法は、
e)ステップd)で得たプールを、1つのプール~約106のプール、好ましくは約96~約384のプールを含む少なくとも1つのアレイに構築およびグループ化するステップをさらに含む。
【0012】
一部の実施形態では、ステップc)で得た複合核酸分子は、プラスミド、コスミド、原核生物染色体、または真核生物染色体である。
【0013】
特定の実施形態では、本方法は、
c1)in vivoで、ステップc)で得た式(I)の核酸を含む少なくとも1つの複合核酸分子を増幅するステップと、
c2)ステップc1)で得た増幅された複合核酸分子を抽出および精製するステップと
をさらに含む。
【0014】
一部の実施形態では、ステップc1)は、生物、好ましくは微生物によりin vivoで行われる。
【0015】
本発明の別の態様は、本発明に係る装置により保存されたおよび/または本発明に係る方法により保存されたデジタルデータを回収するための方法であって、
a)式(I)の核酸を含む二本鎖複製性複合核酸分子に含まれている式(Ia)の少なくとも1つの核酸をシーケンシングして、少なくとも1つの核酸配列(SUP-SDB-SDO)を得るステップと、
b)少なくとも1つの核酸配列(SDB)をデジタルデータに変換するステップと
を含み、
任意選択で、ステップa)の前に、式(Ia)の少なくとも1つの核酸を増幅するステップa0)が行われる、
方法に関する。
【0016】
定義
本発明では、以下の用語は、以下の意味を有する。
【0017】
ある数字の前の「約」は、上記数値の±10%以下を包有する。用語「約」が表す値はまた、それ自体が具体的であり、好ましくは開示されていることを理解されたい。
【0018】
「デジタルデータ」は、コンピュータ化された機械が管理できるデータを表す。本明細書中に使用される場合、「デジタルデータ」との表現は、2進法のシステムにより表されるデータを表すことを意味する。本明細書中に使用される場合、「二進法のシステム」は、ビット「0」および「1」から構成される言語を表す。デジタルデータの非限定的な例は、プロフラムファイル、テキストファイル、音楽ファイル、画像ファイル、ビデオファイル、およびそれらの組み合わせであり得る。
【0019】
「保存」または「~を保存する(storing)」は、さらに使用するためまたは保管のため特定の場所にアイテムを維持するアクションを表す。より具体的には、「デジタルデータの保存」との表現は、さらなる使用のためデジタル情報を安全に維持するアクションを意味するように意図されている。
【0020】
「~を編集する(editing)」は、アイテムのフラグメントを切り取り、ペースト、および/または再配置することにより、上記アイテムをアセンブルするアクションを表す。本明細書中に使用される場合、「核酸分子を編集する」は、核酸の配列の中の1つ以上のヌクレオチドを挿入、欠失、または置き換えることによる上記核酸分子の修飾を表すように意図されている。
【0021】
「生体適合性」は、生物によって操作される能力を表す。本明細書中に使用される場合、「生体適合性核酸分子」は、生物での/生物による複製および操作、たとえばコピーまたは編集などと適合可能である核酸分子を表すように意図されている。
【0022】
「複製性」は、たとえばDNAポリメラーゼなどのポリメラーゼによりin vivoで複製される、すなわち生物の複製機構の誤差の範囲内で正確に複製される能力を表す。本明細書中に使用される場合、「複製性核酸分子」は、少なくとも1回コピーされ得る核酸分子を表すように意図されている。一部の実施形態では、本発明に係る核酸分子は、プラスミド、コスミド、および染色体からなる群で選択される。実際に、複製性核酸分子は、(染色体の)1つ以上のセントロメアを含む、1つ以上の複製起点(ORIとも称される)を含む。
【0023】
「複合」は、共に組み合わせられる、別個の部分またはエレメントから作製されるアイテムを表す。本明細書中に使用される場合、「複合核酸分子」は、in silicoで特異的に設計され得、in vitroもしくはin vivoで合成、およびアセンブル、および/または作製され得る核酸のフラグメントに由来する核酸分子を表す。
【0024】
「バーコード」は、別個の複数の対象の集合からある対象を一意的に同定するために、バーコードが標識する当該対象についての情報を含むパターン化されたアイテムを表す。本明細書中に使用される場合、「バーコード符号化核酸」は、隣接するデジタルデータ符号化核酸の標識および/または索引作成を可能にする非デジタルデータ符号化核酸を表すように意図されている。
【0025】
「メタデータ」は、デジタルデータの著者、デジタルデータの作成日、デジタルデータの修正日、データの内容、およびファイルの大きさなどの、参照するデジタルデータについての基本的な情報を表すことを意味する。
【0026】
「ヌクレオチド」および「核酸塩基」は、互いの代用として意味され、DNAまたはRNA分子の核酸構築ブロックを表すように意図されている。本明細書中に使用される場合、ヌクレオチドは、プリンであるアデニン(A)もしくはグアニン(G)、またはピリミジンであるシトシン(C)、チミン(T)、もしくはウラシル(U)を表す。DNAの核酸では、Aは、dAMPデオキシリボヌクレオチドを表し、Gは、dGMPデオキシリボヌクレオチドを表し;Cは、dCMPデオキシリボヌクレオチドを表し;Tは、dTMPデオキシリボヌクレオチドを表す。RNA核酸では、Aは、AMPリボヌクレオチドを表し;Gは、GMPリボヌクレオチドを表し;Cは、CMPリボヌクレオチドを表し;Uは、UMPリボヌクレオチドを表す。
【0027】
「アレイ」は、好ましくは1つ以上のプールで構築された、核酸分子の集合またはセットを含む固相支持体を表す。
【0028】
「~を増幅する(Amplifying)」は、目的の化合物を増大するアクションを表す。本明細書中に使用される場合、「核酸分子を増幅する」との表現は、テンプレートとしての上記核酸分子のコピー数の増大を表す。特段他の記載がない限り、用語「増幅された」、「複製された」、および「倍化された」は、同義語として使用するように意図されており、よって互いに置き換わり得る。
【0029】
「~を抽出する」は、物理的かつ/化学的なプロセスにより目的の化合物を引き出すアクションを表す。本明細書中に使用される場合、「増幅した核酸分子を抽出する」は、上記核酸分子を増幅した生物からの上記核酸分子の除去を表すように意図されている。
【0030】
「~を精製する」は、化合物の混合物から、純粋または実質的に純粋な目的の化合物を得るアクションを表す。本明細書中に使用される場合、「核酸分子を精製する」との表現は、純粋または実質的に純粋な上記核酸分子の組成物を得るための、上記核酸分子を含む混合物からの不純物の除去を表すように意図されている。
【0031】
詳細な説明
本発明者らは、コンピュータ化されたファイルとも呼ばれるデジタルデータが二本鎖複製性複合核酸分子に容易に保存され得ることを示している。本発明者らは、デジタルデータ符号化核酸および非デジタルデータ符号化核酸の両方を含む(DNA分子の形態の)核酸分子を操作した。上記非デジタルデータ符号化核酸は、好適には、生物におけるアセンブル、複製、デジタルデータの索引作成、および/またはメタデータの提供に使用される。本発明に係る複合核酸分子の複製特性は、それらの容易な操作、特に生物における/生物によるそれらの増幅および/またはそれらの編集を可能にすることである。
【0032】
本発明は、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、
[DB]は、約8ヌクレオチド~約106ヌクレオチド、好ましくは約500ヌクレオチド~約5,000ヌクレオチドの長さを有するデジタルデータ符号化核酸を表し、
[UP]および[DO]は、それぞれが約0ヌクレオチド~約104ヌクレオチド、好ましくは約10ヌクレオチド~約200ヌクレオチドの長さを有する、非デジタルデータ符号化核酸の対を表し、
xは、約1~約105を表す)
の核酸を含む、少なくとも1つの二本鎖複製性複合核酸分子を含むデジタルデータの保存および/または編集のための装置に関する。
【0033】
本発明に係る複合核酸分子は、生物において/生物の中で/生物により複製および編集され得る意味で、生体適合性であることを理解されたい。
【0034】
式(I)の核酸を含む複合核酸分子は、式(Ia):
5’-([UP]-[DB]-[DO])-3’(Ia)
のx個の核酸を含むことを理解されたい。
【0035】
特定の実施形態では、デジタルデータは、二進法のデジタルデータからなる。実際に、2進法のデジタルデータは、各ビットがビット「0」またはビット「1」のいずれかにより表される、連続的なビットにより表される。
【0036】
一部の実施形態では、デジタルデータは、プログラムファイル、テキストファイル、表のファイル、音楽ファイル、画像ファイル、ビデオファイル、およびそれらの組み合わせを含む群で選択され得る。
【0037】
特定の実施形態では、テキストファイルは、.htm、.html、.rtf、.txt、.ccp、.py、または.xmlの形式下にあり得る。一部の実施形態では、ビデオファイルは、.avi、.mov、.mpeg、または.mpgの形式下にあり得る。特定の実施形態では、画像ファイルは、.gif、.jpe、.jpeg、.jpg、または.pngの形式下にあり得る。一部の実施形態では、音声ファイルは、.mp3または.oggの形式下にあり得る。特定の実施形態では、ファイルは、.exe、.doc、.pdf、.ppt、.ps、.xls、または.zipの形式下にあり得る。
【0038】
本発明に係る核酸は、二本鎖の核酸分子、すなわち2つの逆平行の相補的な核酸鎖を含む二本鎖の核酸分子であることを理解されたい。実際に、1つの鎖は、5’から3’の方向であり、相補鎖は、3’から5’の方向である。
【0039】
本明細書中に使用される場合、本発明に係る核酸分子の「複製」特性は、特にポリメラーゼ、より具体的にはDNAポリメラーゼにより、生物においてin vivoで1回以上複製される能力を表す。
【0040】
実際に、核酸分子の複製特性の評価は、最新技術に由来する任意の標準的な方法またはそれに由来する方法により行われ得る。例示的に、複製特性は、生物における/生物による上記核酸分子のコピー数の増大、および/または核酸をその子孫に伝える生物の能力により、評価され得る。
【0041】
一部の実施形態では、生物は、微生物、特には細菌、微細藻類、古細菌、真菌、ファージ、ウイルス、または酵母である。一部の実施形態では、生物は原核生物である。本発明に係る原核生物の非限定的な例として、細菌、たとえば放線菌類、クラミジア目、シアノバクテリア、ファーミキューテス、プロテオバクテリア、スピロヘータ、テルモトガ門(thermotogales)など;および古細菌、たとえばユーリ古細菌(euarchaeota)、クレン古細菌が挙げられる。特定の実施形態では、生物は、真核生物である。本発明に係る真核生物の非限定的な例として、原虫、藻類、植物、真菌、動物、およびそれらの各細胞が挙げられる。
【0042】
複製されるために、本発明に係る複合核酸分子は、少なくとも1つの複製起点、すなわち複製開始機構により認識される1つ以上のヌクレオチドの配列を有する。例示的に、古細菌および細菌の複製起点として、oriCが挙げられる。実際に、大部分の細菌は、固有の複製起点を有していてもよく、古細菌は、1つ以上の複製起点を有し得、真核生物は、特にセントロメアの形態で、複数の複製起点を有し得る。本発明の範囲内において、用語「複数の複製起点」は、核酸分子あたり少なくとも2、3、4、5、10、15、20、25、50、75、100、150、200個の複製起点を表す。
【0043】
特定の実施形態では、複合核酸分子は、約500ヌクレオチド~約1011ヌクレオチド、好ましくは約103ヌクレオチド~約105ヌクレオチドの長さを有する。
【0044】
本発明の範囲内では、「500ヌクレオチド~約1011ヌクレオチド」との表現は、500、600、700、800、900、103、5×103、104、5×104、105、5×105、106、5×106、107、5×107、108、5×108、109、5×109、1010、5×1010、および1011個のヌクレオチドを包有する。
【0045】
本発明の範囲内では、「約103ヌクレオチド~約105ヌクレオチド」との表現は、103、2.5×103、5×103、7.5×103、104、2.5×104、5×104、7.5×104、および105個のヌクレオチドを包有する。
【0046】
本発明に係る核酸分子は、連続したヌクレオチドの配列により表されることを理解されたい。
【0047】
一部の実施形態では、本発明に係る複合核酸分子のヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチド、およびそれらの類縁体の群から選択されるヌクレオチド、より好ましくはデオキシリボヌクレオチドにより表される。本明細書中に使用される場合、デオキシリボヌクレオチドは、dATP、dCTP、dGTP、dTTP、dADP、dCDP、dGDP、dTDP、dAMP、dCMP、dGMP、およびdTMPを包有する。本明細書中に使用される場合、リボヌクレオチドは、ATP、CTP、GTP、UTP、ADP、CDP、GDP、UDP、AMP、CMP、GMP、およびUMPを包有する。
【0048】
特定の実施形態では、ヌクレオチドの類縁体は、2-アミノ-ATP、8-アザ-ATP、2’-フルオロ-dATP、2’-フルオロ-dCTP、2’-フルオロ-dGTP、2’-フルオロ-dUTP、5-ヨード-CTP、5-ヨード-UTP、N6-メチル-ATP、5-メチル-CTP、2’-O-メチル-ATP、2’-O-メチル-CTP、2’-O-メチル-GTP、2’-O-メチル-UTP、プソイド-UTP、ITP、2’-O-メチル-ITP、プロマイシン-TP、キサントシン-TP、5-メチル-UTP、4-チオ-UTP、2’-アミノ-dCTP、2’-アミノ-dUTP、2’-アジド-dCTP、2’-アジド-dUTP、O6-メチル-GTP、2-チオ-UTP、Ara-CTP、Ara-UTP、5,6-ジヒドロ-UTP、2-チオ-CTP、6-アザ-CTP、6-アザ-UTP、N1-メチル-GTP、2’-O-メチル-2-アミノ-ATP、2’-O-メチルプソイド-UTP、N1-メチル-ATP、2’-O-メチル-5-メチル-UTP、7-デアザGTP、2’-アジド-dATP、2’-アミノ-dATP、Ara-ATP、8-アジド-ATP、5-ブロモ-CTP、5-ブロモ-UTP、2’-フルオロ-dTTP、3’-O-メチル-ATP、3’-O-メチル-CTP、3’-O-メチル-GTP、3’-O-メチル-UTP、7-デアザATP、5-AA-UTP、2’-アジド-dGTP、2’-アミノ-dGTP、5-AA-CTP、8-オキソ-GTP、プソイドイソ-CTP、N4-メチル-CTP、N1-メチルプソイド-UTP、5,6-ジヒドロ-5-メチル-UTP、N6-メチル-アミノ-ATP、5-カルボキシ-CTP、5-ホルミル-CTP、5-ヒドロキシメチル-UTP、5-ヒドロキシメチル-CTP、チエノ-GTP、5-ヒドロキシ-CTP、5-ホルミル-UTP、チエノ-UTP、2-アミノ-dATP、5-ブロモ-dCTP、5-ブロモ-dUTP、7-デアザ-dATP、7-デアザ-dGTP、dITP、5-プロピニル-dCTP、5-プロピニル-dUTP、2’-dUTP、5-フルオロ-dUTP、5-ヨード-dCTP、5-ヨード-dUTP、N6-メチル-dATP、5-メチル-dCTP、O6-メチル-dGTP、N2-メチル-dGTP、8-オキソ-dATP、8-オキソ-dGTP、2-チオ-dTTP、2’-dPTP、5-ヒドロキシ-dCTP、4-チオ-dTTP、2-チオ-dCTP、6-アザ-dUTP、6-チオ-dGTP、8-クロロ-dATP、5-AA-dCTP、5-AA-dUTP、N4-メチル-dCTP、2’-デオキシゼブラリン-TP、5-ヒドロキシメチル-dUTP、5-ヒドロキシメチル-dCTP、5-プロパルギルアミノ-dCTP、5-プロパルギルアミノ-dUTP、
5-カルボキシ-dCTP、5-ホルミル-dCTP、5-インドリル-AA-dUTP、5-カルボキシ-dUTP、5-ホルミル-dUTP、3’-dATP、3’-dGTP、3’-dCTP、5-メチル-3’-dUTP、3’-dUTP、ddATP、ddGTP、ddUTP、ddTTP、ddCTP、3’-アジド-ddATP、3’-アジド-ddGTP、3’-アジド-ddTTP、3’-アミノ-ddATP、3’-アミノ-ddCTP、3’-アミノ-ddGTP、3’-アミノ-ddTTP、3’-アジド-ddCTP、3’-アジド-ddUTP、5-ブロモ-ddUTP、ddITP、(1-チオ)-dATP、(1-チオ)-dCTP、(1-チオ)-dGTP、(1-チオ)-dTTP、(1-チオ)-ATP、(1-チオ)-CTP、(1-チオ)-GTP、(1-チオ)-UTP、(1-チオ)-ddATP、(1-チオ)-ddCTP、(1-チオ)-ddGTP、
(1-チオ)-ddTTP、(1-チオ)-3’-アジド-ddTTP、(1-チオ)-ddUTP、(1-ボラノ)-dATP、(1-ボラノ)-dCTP、(1-ボラノ)-dGTP、(1-ボラノ)-dTTP、ガンシクロビル-TP、およびシドホビル-DPを含む非限定的な群において選択され得る。
【0049】
一部の実施形態では、式(I)の核酸は、約35%~約65%のC+Gパーセンテージを有する。
【0050】
本発明の範囲内では、「約35%~約65%」との表現は、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、および65%を包有する。
【0051】
本発明に係る複合核酸分子は、これらを含む生物にとって安全であり得、さらには消費者個人が操作するために安全であり得ることを理解されたい。よって、本発明に係る式(I)の核酸は、特に消費者個人にとってではあるが、動物、植物、および環境にとっても、予測されるように有害である産物を符号化していなくてもよい。本明細書中に使用される場合、「有害ではない」との表現は、産物が、消費者個人、動物、または植物に疾患または障害を促進せず、さらには環境の汚染物質を構成しないことを意味するように意図されている。例示的かつ非限定的に、本発明に係る核酸分子は、毒素、汚染物質、酵素、毒、抗生剤などを符号化しなくてよい。
【0052】
特定の実施形態では、式(I)の核酸は、予測されるように、1つ以上のRNAを符号化せず、好ましくは1つ以上のmRNAを符号化しない。
【0053】
一部の実施形態では、式(I)の核酸は、1つ以上のRNAを符号化せず、好ましくは1つ以上のmRNAを符号化しない。
【0054】
本発明の範囲内において、「RNA」は、非限定的に、アンチセンスRNA、ガイドRNA(gRNA)、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、リボソームRNA(rRNA)、低分子ヘアピン型RNA(shRNA)、低分子干渉RNA(siRNA)、核内低分子RNA(snRNA)、核小体低分子RNA(snoRNA)、および転移RNA(tRNA)を表すように意味されている。
【0055】
実際に、式(I)の核酸が1つ以上のRNAを符号化しないという予測の評価は、in silicoにて、たとえばプロモーター配列などの転写開始に関するシグネチャー配列の存在に関して、核酸分子の配列を分析することにより行われ得る。
【0056】
一部の実施形態では、式(I)の核酸分子は1つ以上の開始コドンを含まず、および/または、6つ全てのリーディングフレームにおいて約200ヌクレオチドあたり1つ以上の終止コドンを含む。
【0057】
本明細書中に使用される場合、「開始コドン」は、ATG、AUG、GTG、GUG、CTG、またはCUGのコドンを表し得る。
【0058】
特定の実施形態では、[DB]デジタルデータ符号化核酸は、1つ以上の開始コドンを含まず、[UP]および/または[DO]非デジタルデータ符号化核酸は、1つ以上の開始コドンを含み得、ただし[DB]デジタルデータ符号化核酸は、6つ全てのリーディングフレームにおいて約200ヌクレオチドあたり1つ以上の終止コドンを含む。
【0059】
本明細書通使用される場合、「終止コドン」は、UAA、UAG、UGA、TAA、TAG、またはTGAのコドンを表し得る。
【0060】
本発明の範囲内において、「200ヌクレオチドあたりの1つ以上の終止コドン」は、200ヌクレオチドあたり1、2、3、4、5、6、7、8、9、10、12、14、16、18、20、25、30、35、40、45、50個の終止コドンを包有する。
【0061】
一部の実施形態では、式(I)の核酸は、1つ以上の特異的制限部位を含まない、本明細書中に使用される場合、「特異的制限部位」は、決定される配列の制限部位を表す。
【0062】
特定の実施形態では、式(I)の核酸は、BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIからなる群において選択される、酵素またはそのアイソシゾマーに関する1つ以上の制限部位を含まない。
【0063】
本明細書中に使用される場合、「制限部位」との表現は、制限酵素により標的化されるヌクレオチド配列、すなわち、核酸分子の中で上記配列を切断する特性を有するポリペプチドを表す。一部の実施形態では、式(I)の核酸は、以下のリスト:BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIのいずれの制限部位も含まない。
【0064】
一部の実施形態では、1つ以上の制限部位の存在または非存在は、本発明に係る複合核酸分子を有する生物に依存し得る。実際に、細菌の制限部位を含む本発明に係る複合核酸分子は、細菌生物が有さなくてもよい。例示的に、1つの種由来の酵素が認識する制限部位を含む本発明に係る複合核酸分子は、上記種に由来する生物が有さなくてもよい。
【0065】
本発明に係る式(I)の核酸は、好適には、高い忠実度で合成およびシーケンシングされることを理解されたい。少なくとも4つの同一のヌクレオチドの反復が、エラーを合成するまたはエラーをシーケンシングする傾向があるため、核酸分子の高い忠実度の合成および/またはシーケンシングを妨げ得ることが知られている。
【0066】
特定の実施形態では、式(I)の核酸は、少なくとも4つの同一のヌクレオチドの1つ以上の反復を含まない。
【0067】
本発明の範囲内において、「少なくとも4つの同一のヌクレオチド」との表現は、4、5、6、7、8、9、10、12、14、16、18、20、25、30、40、50個の同一のヌクレオチドを包有する。本明細書中に使用される場合、少なくとも4つの同一のヌクレオチドは、同じ性質を有する一連のヌクレオチド、たとえば「AAAA」、「CCCC」、「GGGG」、「TTTT」、または「UUUU」を表す。
【0068】
本発明に係る二本鎖複製性複合核酸分子は、デジタルデータ符号化核酸および非デジタルデータ符号化核酸の両方を含むことを理解されたい。
【0069】
実際に、デジタルデータ符号化核酸は、「データブロック」で[DB]と表され、デジタル情報のみを含む核酸を表すように意図されている。
【0070】
本発明の範囲内において、「約8ヌクレオチド~約106ヌクレオチド」との表現は、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、103、5×103、104、5×104、105、5×105、および106個のヌクレオチドを包有する。
【0071】
本発明の範囲内において、「約500ヌクレオチド~約5000ヌクレオチド」との表現は、500、550、600、650、700、750、800、850、900、950、1,000、1,250、1,500、1,750、2,000、2,250、2,500、2,750、3,000、3,250、3,500、3,750、4,000、4,250、4,500、4,750、および5,000個のヌクレオチドを包有する。
【0072】
特定の実施形態では、[DB]核酸の各ヌクレオチドは、1または2ビットのデジタルデータを符号化する。
【0073】
一実施形態では、[DB]核酸の各ヌクレオチドは、1ビットのデジタルデータを符号化する。例示的に、以下の表1は、可能性のある組み合わせを提供する。
【0074】
【0075】
一実施形態では、[DB]核酸の各ヌクレオチドは、2ビットのデジタルデータを符号化する。例示的に、以下の表2は、可能性のある組み合わせを提供する。
【0076】
【0077】
本発明に係る二本鎖、複製性複合核酸分子は、1つ以上のデジタルデータ符号化核酸に加え、1つ以上の非デジタルデータ符号化核酸を含み得ることを理解されたい。
【0078】
本明細書中に使用される場合、「非デジタルデータ符号化核酸」との表現は、デジタルデータの情報を全く含まないが、デジタルデータ符号化[DB]核酸に隣接する、バーコーディング、索引作成、メタデータ、セキュリティーシステム、プルーフリーディングシステムについての情報を含み得る核酸を表す。
【0079】
特定の実施形態では、[UP]および[DO]は、それぞれが約0ヌクレオチド~約104ヌクレオチドの長さを有する非デジタルデータ符号化核酸の対を表す。
【0080】
本発明の範囲内において、「約0ヌクレオチド~約104ヌクレオチド」との表現は、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、103、2.5×103、5×103、7.5×103、および104個のヌクレオチドを包有する。
【0081】
特定の実施形態では、[UP]および[DO]は、それぞれが約10ヌクレオチド~約200ヌクレオチドの長さを有する非デジタルデータ符号化核酸の対を表す。
【0082】
本発明の範囲内において、「約10ヌクレオチド~200ヌクレオチド」との表現は、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、および200個のヌクレオチドを包有する。
【0083】
一部の実施形態では、[UP]および[DO]核酸は、それぞれ、少なくとも1つのバーコード符号化核酸および/またはメタデータ符号化核酸を含む。
【0084】
本明細書中に使用される場合、「バーコード符号化核酸」は、隣接するデジタルデータ符号化[DB]核酸の標識を可能にする核酸を表すように意図されている。実際に、バーコード符号化核酸の標識特性は、データ回収プロセスを容易にする。
【0085】
実際に、バーコードは、入手可能なライブラリーから得られてもよく、またはin silicoで作製され得る。
【0086】
一部の実施形態では、本発明に係る複合核酸分子は、非デジタルデータ符号化システムブロック[SB]核酸をさらに含み、上記[SB]核酸は、[DB]核酸の上流および/または下流に位置している。
【0087】
本明細書中に使用される場合、「非デジタルデータ符号化システムブロック[SB]核酸」は、隣接するデジタルデータ符号化[DB]核酸に関する索引作成、メタデータの提供、セキュリティーシステム、プルーフリーディングのためのシステムの提供を可能にする核酸を表すように意図されている。
【0088】
一実施形態では、[SB]核酸は、式(IIa):
5’-[UP]-[SB]-[DB]-[DO]-3’(IIa)
により例示されるように、[DB]核酸の上流に位置している。
【0089】
1つの別の実施形態では、[SB]核酸は、式(IIb):
5’-[UP]-[DB]-[SB]-[DO]-3’(IIb)
により例示されるように、[DB]核酸の下流に位置している。
【0090】
別の実施形態では、[SB]核酸は、式(IIc):
5’-[UP]-[SB1]-[DB]-[SB2]-[DO]-3’(IIc)
により例示されるように、[DB]核酸の上流および下流の両方に位置している。
【0091】
後者の実施形態では、[SB1]および[SB2]核酸は、同一または別個のいずれかである。
【0092】
特定の実施形態では、[SB]は、約0~約105ヌクレオチドの長さを有する核酸を表す。
【0093】
本発明の範囲内において、「約0ヌクレオチド~約105ヌクレオチド」との表現は、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950および103、5×103、104、5×104、および105個のヌクレオチドを包有する。
【0094】
[SB]核酸が存在する場合、[UP]および[DO]核酸は、単に、バーコード符号化核酸を表していることを理解されたい。
【0095】
特定の実施形態では、式(Ia)の1つ以上の核酸分子は、セクター(S)を構成し得る。一部の実施形態では、最大約105個のセクター(S)が、トラック(T)を構成するために二本鎖複製性複合核酸分子にアセンブルされ得る。一部の実施形態では、最大109個のトラック(T)が、プール(P)を構成するためにプールされ得る。一部の実施形態では、プール(P)は、アレイ(A)を構成するためにグループ化され得る。一部の実施形態では、アレイ(A)は、DNAドライブを構成する。本明細書中に使用される場合、「DNAドライブ」との表現は、デジタルデータが保存される物理的支持体を表す。
【0096】
[UP]および[DO]核酸は、トラック(T)もしくはトラックのプール(P)の内部にセクターを位置づけることを可能にし得、および/または所定のプール(P)から所定のセクターの特異的な増幅を可能にし得、および/またはin vitroもしくはin vivoでのセクター(S)の編集のための認識部位の提供を可能にし得る。
【0097】
本発明に係る装置は、オクテット(o)、キロオクテット(Ko)メガオクテット(Mo)、ギガオクテット(Go)、またはテラオクテット(To)で表されるその保存能を特徴とし得る。一部の実施形態では、本発明に係る装置の特性は、約1o(オクテット)~約105Toの範囲である。
【0098】
本発明の範囲内において、「約1o~約105To」との表現は、1o、5o、10o、25o、50o、75o、1Ko、2Ko、3Ko、4Ko、5Ko、6Ko、7Ko、8Ko、9Ko、10Ko、50Ko、100Ko、250Ko、500Ko、750Ko、1Mo、5Mo、10Mo、25Mo、50Mo、75Mo、100Mo、150Mo、200Mo、250Mo、300Mo、400Mo、500Mo、600Mo、700Mo、800Mo、900Mo、1Go、2Go、3Go、4Go、5Go、10Go、15Go、20Go、25Go、50Go、75Go、100Go、150Go、200Go、250Go、300Go、400Go、500Go、600Go、700Go、800Go、900Go、1To、5To、10To、50To、100To、500To、103To、5×103To、104To、5×104To、および105Toを包有する。
【0099】
図2に例示されるように、セクター(S)は、本発明に係る二本鎖複製性複合核酸分子に対応するトラック(T)にアセンブルされ得;トラック(T)は、プール(P)にプールされ得、プール(P)は、さらに1つのアレイにグループ化され得る。1つ以上のアレイ(A)は、DNAドライブを構成する。
【0100】
本発明に係る使用および方法は、in vivo、in vitro、ex vivoで行われ得る。
【0101】
本発明の一態様は、デジタルデータの保存および/または編集および/または回収のための、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、
[UP]および[DO]は、それぞれが約0ヌクレオチド~約104ヌクレオチド、好ましくは約10ヌクレオチド~約200ヌクレオチドの長さを有する、非デジタルデータ符号化核酸の対を表し、
[DB]は、約8ヌクレオチド~約106ヌクレオチド、好ましくは約500ヌクレオチド~約5,000ヌクレオチドの長さを有するデジタルデータ符号化核酸を表し、
xは、約1~約105を表す)
の核酸を含む少なくとも1つの二本鎖複製性複合核酸分子を含む装置の使用に関する。
【0102】
本発明の別の態様は、デジタルデータを保存するための方法であって、
a)上記デジタルデータに少なくとも1つの二本鎖のデジタルデータ符号化[DB]核酸配列(SDB)ならびに少なくとも1対の非デジタルデータ符号化[UP]および[DO]核酸配列(SUP)および(SDO)を割り当てるステップと、
b)配列(SUP)、(SDB)、および(SDO)のそれぞれから、式(Ia):
5’-([UP]-[DB]-[DO])-3’(Ia)
の少なくとも1つの核酸を合成するステップと、
c)式(Ia)の1つ以上の核酸をアセンブルして、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、xは、約1~約105を表す)
の核酸を含む二本鎖複製性複合核酸分子を得るステップと、
d)別個の配列の、ステップc)で得た式(I)の1~約109個の複合核酸分子を含む少なくとも1つのプールをストレージセルに保存するステップと
を含む、方法に関する。
【0103】
一部の実施形態では、デジタルデータは、圧縮および/または暗号化され得る。実際に、圧縮および/または暗号化は、いずれかの適切なアルゴリズムにより行われ得る。本明細書中に使用される場合、用語「圧縮」は、元の表示よりも少ないビットを使用することにより、たとえば冗長性を排除することにより、情報を符号化するアクションを表すように意図されている。デジタルデータの圧縮を行うためのアルゴリズムの非限定的な例は、LZMA(Lempel Ziv Markow Algorithm)、LZMA2であり得る。
【0104】
実際に、上記デジタルデータに、デジタルデータおよび非デジタルデータの両方を符号化する少なくとも1つの二本鎖核酸分子を割り当てるステップa)は、適切なソフトウェアにより自動的に行われ得る。例示的に、デジタルデータ、たとえば2進法のデータは、特定のヌクレオチド配列に割り当てられ得る。
【0105】
本発明の別の対象は、デジタルデータを保存するための使用および方法を実施するためのコンピュータソフトウェアである。
【0106】
一実施形態では、本発明の方法は、デジタルデータに少なくとも1つの二本鎖核酸分子を割り当てるように構成されたソフトウェアを含むマイクロプロセッサで実施される。一部の実施形態では、このソフトウェアは、本発明に係る複合核酸分子の配列に関して約35%~約65%のC+Gパーセンテージを達成するように構成されている。一部の実施形態では、このソフトウェアは、本発明に係る複合核酸分子の配列が、1つ以上のRNAを符号化する、好ましくは1つ以上のmRNAを符号化することを予防するように構成されている。一部の実施形態では、このソフトウェアは、本発明に係る複合核酸分子の配列が、特に[DB]核酸において、1つ以上の開始コドンを含むことを防止するように構成されている。一部の実施形態では、このソフトウェアは、6つ全てのリーディングフレームにおいて200ヌクレオチドあたり1つ以上の終止コドンを含む本発明に係る複合核酸分子の配列を達成するように構成されている。一部の実施形態では、このソフトウェアは、本発明に係る複合核酸分子の配列が1つ以上の特異的な制限部位を含むことを予防するように構成されている。一部の実施形態では、このソフトウェアは、本発明に係る複合核酸分子の配列が、1つ以上の制限部位、特にBamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIを含むことを防止するように構成されている。一部の実施形態では、ソフトウェアは、本発明に係る複合核酸分子の配列が、少なくとも4つの同一のヌクレオチドの1つ以上の反復を含むことを防止するように構成されている。
【0107】
図1により示されるように、各ビット「0」は、ヌクレオチドAまたはヌクレオチドCに割り当てられ、各ビット「1」は、ヌクレオチドGまたはヌクレオチドTに割り当てられ得る。
【0108】
以下の式(III)の256ビットのデジタルデータ:
0100000110010010101000010000110000001101010001100011001000000000001111011101101000001111100101000111010011010110110100001100000001000001001111000010001010000011000101001001111111101000011101111001100001000110010100111110100010011111101111001100110111011000(III)
は、以下の式(IV)の256ヌクレオチド配列(SDB):
5’[CGCAACCGTCCGACTAGCTAAACGCAACGTCAACAAGTCTCGCAAGTAACGTCCGACCCAACCCAAGTTGAGTTAGGAGAACCCGTTTGACGATACCGGGCTCCTTCGAGTCTTATCAAAGTCCAACCCGCCCAAGAAGGTTCCAAGCAAGAGACAAAGGCCCGCTACGAATTGGTTTGAGACAAGGTAGTTGCCGGAACCTCAATTCCGATAAGTTGGCTCAAGACGGTTGGCTTTGACGGAAGTCGTTAGGAAC]3’(IV)(配列番号1)
に割り当てられ得る。
【0109】
よって、指標[UP]および[DO]の対は、それぞれ5’末端および3’末端に追加され得る。
【0110】
たとえば25ヌクレオチドの指標は、配列:
(TATGAGGACGAATCTCCCGCTTATA;[UP];配列番号2)および(GGTCTTGACAAACGTGTGCTTGTAC;[DO];配列番号3)に対応し得る。
【0111】
よって、結果得られる一般式(I)の複合核酸分子は、以下の式(V)の核酸分子により表され得る:
5’[TATGAGGACGAATCTCCCGCTTATA]-[CGCAACCGTCCGACTAGCTAAACGCAACGTCAACAAGTCTCGCAAGTAACGTCCGACCCAACCCAAGTTGAGTTAGGAGAACCCGTTTGACGATACCGGGCTCCTTCGAGTCTTATCAAAGTCCAACCCGCCCAAGAAGGTTCCAAGCAAGAGACAAAGGCCCGCTACGAATTGGTTTGAGACAAGGTAGTTGCCGGAACCTCAATTCCGATAAGTTGGCTCAAGACGGTTGGCTTTGACGGAAGTCGTTAGGAAC]-[GGTCTTGACAAACGTGTGCTTGTAC]3’(V)(配列番号4)。
【0112】
実際に、式(Ia)の少なくとも1つの核酸を合成するステップb)は、最新技術で知られているいずれかの適切な方法により行われ得る。適切な方法の非限定的な例として、化学的な合成および酵素を使用した合成が挙げられる。例示的に、最大200ヌクレオチドの核酸分子の化学的な合成が行われ得る。最大200ヌクレオチド長の核酸分子が、望ましい長さ、たとえば最大約106ヌクレオチドの核酸分子を得るためにアセンブルされ得る。
【0113】
実際に、式(I)の核酸を含む二本鎖、複製性複合核酸分子を得るために式(Ia)の1つ以上の核酸をアセンブルするステップc)は、式(Ia)の核酸分子のアセンブルに関して行われ得る。
【0114】
実際に、ステップd)は、1~約109個の同一または別個の式(I)の複合核酸分子を含む少なくとも1つのプールをストレージセルに保存するステップを含む。本明細書中に使用される場合、「同一の複合核酸分子」は、100%の同一性を有する配列を有する複合核酸分子を表す。本明細書中に使用される場合、「別個の複合核酸分子」は、100%未満の同一性を有する配列を有する複合核酸分子を表す。
【0115】
用語「同一性」または「同一な」は、2つ以上の核酸の配列の間の関係に使用される場合、2つ以上のヌクレオチドの鎖間の一致数により決定される、核酸間の配列の関連性の度合いを表す。「同一性」は、特定の数学モデルまたはコンピュータプログラム(すなわち「アルゴリズム」)により提示されるギャップアライメント(存在する場合)を伴う2つ以上の配列の小さいほうの間の同一である一致のパーセントを測定する。関連する核酸配列の同一性は、既知の方法により容易に計算され得る。
【0116】
実際に、核酸の同一性のパーセンテージは、以下のように設定されているCLUSTAL Wソフトウェア(バージョン1.83)のパラメータ:
slow/正確なアライメントでは:(1)ギャップ開始ペナルティ:15;(2)ギャップ伸長ペナルティ:6.66;(3)重み行列:IUB;
fast/おおよそのアライメントでは:(4)K-タプル(ワード)サイズ:2;(5)ギャップペナルティ:5;(6)top対角線の数:5;(7)ウィンドウサイズ:4;(8)スコアリング方法:PERCENT
を使用して決定され得る:
【0117】
一部の実施形態では、ステップd)は、別個の、式(I)の1~約109個の複合核酸分子を含む少なくとも1つのプールをストレージセルに保存するステップを含む。
【0118】
本発明の範囲内において、「1~約109個の複合核酸分子」との表現は、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、103、5×103、104、5×104、105、5×105、106、5×106、107、5×107、108、5×108、および109個の複合核酸分子を包有する。
【0119】
本発明の範囲内において、「少なくとも1つのプール」との表現は、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、103、5×103、104、5×104、105、5×105、106個のプールを包有する。
【0120】
実際に、ストレージセルは、核酸分子の保存を持続するために先端技術において公知であるいずれかの適切な受信体であり得る。一部の実施形態では、ストレージセルは、生物、ガラスベースの受信体、金属ベースの受信体、シリカベースの受信体、ポリマーベースの受信体、紙ベースの受信体を含む群において選択され得る。
【0121】
特定の実施形態では、生物は、細菌、微細藻類、古細菌、真菌、または酵母由来の細胞であり得る。一部の実施形態では、生物は、ファージまたはウイルスなどの粒子である。一部の実施形態では、特に細菌、たとえば放線菌類、クラミジア目、シアノバクテリア、ファーミキューテス、プロテオバクテリア、スピロヘータ、テルモトガ門(thermotogales);古細菌、たとえばクレン古細菌、ユーリ古細菌門、コル古細菌門、ナノ古細菌門、およびタウム古細菌の古細菌を含む群において選択される、原核生物である。特定の実施形態では、生物は、真核生物細胞、特には、原虫、藻類、植物、真菌、および動物の細胞を含む群において選択される細胞である。
【0122】
一部の実施形態では、動物または動物細胞は、それぞれヒトまたはヒト細胞ではない。
【0123】
一部の実施形態では、本発明に係る複合核酸分子の保存は、溶液中でまたは乾燥状態で行われ得る。実際に、本発明に係る複合核酸分子の溶液での保存は、アルカリ性溶液、特にはpH8超の溶液において行われ得る。実際に、本発明に係る乾燥核酸分子は、たとえば噴霧乾燥、噴霧凍結乾燥、空気乾燥、または凍結乾燥により、得られ得る。一部の実施形態では、本発明に係る凍結乾燥核酸分子は、不活性雰囲気下でカプセル化され得る。一実施形態では、本発明に係る核酸分子の保存は、紙、たとえばFTA(登録商標)カード(Whatman(登録商標))上で行われ得る。
【0124】
特定の実施形態では、本発明に係る複合核酸分子の保存は、約-196℃~約+100℃の温度で行われ得る。一部の実施形態では、保存は、液体窒素(約-196℃)で行われ得る。一部の実施形態では、保存は、フリーザーにおいて、特に約-80℃~約-20℃の温度で行われ得る。一部の実施形態では、保存は、室温で、特に約+15℃~約+30℃の温度で行われ得る。
【0125】
本発明の範囲内において、「約-196℃~約+100℃」との表現は、-196℃、-180℃、-170℃、-160℃、-150℃、-140℃、-130℃、-120℃、-110℃、-100℃、-90℃、-80℃、-70℃、-60℃、-50℃、-40℃、-30℃、-20℃、-10℃、-5℃、0℃、+4℃、+5℃、+10℃、+15℃、+20℃、+25℃、+30℃、+35℃、+40℃、+45℃、+50℃、+55℃、+60℃、+65℃、+70℃、+75℃、+80℃、+85℃、+90℃、+95℃、および+100℃を含む。
【0126】
一部の実施形態では、本方法は、
e)ステップdで得たプールを、1個のプール~約106個のプール、好ましくは約96または約384個のプールを含む少なくとも1つのアレイへ構築およびグループ化するステップ
をさらに含む。
【0127】
本発明の範囲内において、「1個のプール~約106個のプール」との表現は、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、102、103、104、105、および106個のプールを包有する。
【0128】
本発明の範囲内において、「約96または約384個のプール」との表現は、96、102、108、114、120、126、132、138、144、150、156、162、168、174、180、186、192、198、204、210、216、222、228、234、240、246、252、258、264、270、276、282、288、294、300、306、312、318、324、330、336、342、348、354、360、366、372、378、および384個のプールを包有する。
【0129】
特定の実施形態では、ステップc)で得た複合核酸分子は、プラスミド、コスミド、原核生物染色体、または真核生物染色体である。
【0130】
本明細書中に使用される場合、用語「プラスミド」は、最大50kb(すなわち50,000塩基対(bp))のDNAフラグメントのコピーを作製/修飾するために、分子生物学でクローニングベクターとして使用され得る円形の二本鎖DNA分子として最も一般的に見出される、小分子のゲノム外DNA分子を表す。
【0131】
本発明の範囲内において、「最大約50kb」との表現は、0.1kb、0.2kb、0.3kb、0.4kb、0.5kb、0.6kb、0.7kb、0.8kb、0.9kb、1kb、1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、2.2kb、2.4kb、2.6kb、2.8kb、3kb、3.2kb、3.4kb、3.6kb、3.8kb、4kb、4.2kb、4.4kb、4.6kb、4.8kb、5kb、5.2kb、5.4kb、5.6kb、5.8kb、6kb、6.2kb、6.4kb、6.8kb、7kb、7.5kb、8kb、8.5kb、9kb、9.5kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、20kb、21kb、22kb、23kb、24kb、25kb、26kb、27kb、28kb、29kb、30kb、31kb、32kb、33kb、34kb、35kb、36kb、37kb、38kb、39kb、40kb、41kb、42kb、43kb、44kb、45kb、46kb、47kb、48kb、49kb、および50kbを包有する。
【0132】
本明細書中に使用される場合、用語「コスミド」は、コスミドのファージヘッドへのパッケージングおよびその後の細菌細胞の感染を可能にする、ラムダファージ由来のcos配列を含むハイブリッドプラスミドであり、コスミドは、環化されており、プラスミドとして複製することができる。多くの場合、コスミドは、約32kb~52kbの大きさの範囲のDNA核酸分子を表す。
【0133】
本発明の範囲内において、「約32kb~52kb」との表現は、32kb、33kb、34kb、35kb、36kb、37kb、38kb、39kb、40kb、41kb、42kb、43kb、44kb、45kb、46kb、47kb、48kb、49kb、50kb、51kb、および52kbを包有する。
【0134】
本明細書中に使用される場合、「原核生物染色体」は、原核生物で複製し得る核酸分子を表す。
【0135】
一部の実施形態では、原核生物染色体は、細菌染色体、好ましくは細菌人工染色体である。本明細書中に使用される場合、「細菌人工染色体」または「BAC」は、細菌細胞の分裂後のゲノム外核酸分子のDNA核酸分子のさらなる分割を可能にする機能的な稔性プラスミドに基づくゲノム外核酸分子を表す。BACは、通常、約50kb~350kbの大きさの範囲のDNAフラグメントでクローニングベクターとして使用される。
【0136】
本発明の範囲内において、「約50kb~350kb」との表現は、50kb、60kb、70kb、80kb、90kb、100kb、110kb、120kb、130kb、140kb、150kb、160kb、170kb、180kb、190kb、200kb、210kb、220kb、230kb、240kb、250kb、260kb、270kb、280kb、290kb、300kb、310kb、320kb、330kb、340kb、および350kbを包有する。
【0137】
本明細書中に使用される場合、「真核生物染色体」は、真核生物で複製し得る核酸分子を表す。
【0138】
一部の実施形態では、本方法は、
c1)in vivoで、ステップc)で得た式(I)の核酸を含む少なくとも1つの複合核酸分子を増幅するステップと、
c2)ステップc1)で得た増幅された複合核酸分子を抽出および精製するステップと
をさらに含む。
【0139】
一部の実施形態では、ステップc1)を、生物、好ましくは微生物によりin vivoで行う。
【0140】
一部の実施形態では、本発明に係る複合核酸分子の保存および/または増幅を生物で行う場合、上記複合核酸分子は、上記生物の内部、好ましくは上記生物の少なくとも1つの細胞に導入される。実際に、これらステップは、本発明に係る複合核酸分子が生体適合性であるため、行われ得る。
【0141】
実際に、核酸分子の原核細胞または真核細胞への導入は、最先端由来のいずれかの適切な方法により行われ得る。
【0142】
例示的に、核酸分子の原核細胞、特に細菌への導入は、コンピテントな細菌の形質転換またはファージを使用した形質導入により行われ得る。本明細書中に使用される場合、用語「コンピテントな」は、細胞外ゲノム核酸分子を細菌の細胞質に取り込むその能力を増大させるように処置された上記細菌を表す。当業者は、コンピテントな細菌を調製するための技術に精通している。
【0143】
例示的に、核酸分子の真核細胞への導入は、物理的/化学的処置、微生物、ウイルス粒子、および/またはリポソームを使用する形質転換、コンジュゲーション、トランスフェクション、または形質導入により行われ得る。
【0144】
実際に、1つは、市販のキットまたは物質が使用される場合、製造社の説明を表し、かつ/またはあるいは、Maniatisら(Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, 1982)により記載されるプロトコルを表す。
【0145】
さらに、本発明の別の態様は、本発明に係る装置により保存されているおよび/または本発明に係る方法により保存されているデジタルデータを回収するための方法であって、
a)式(I)の核酸を含む二本鎖複製性複合核酸分子に含まれている式(Ia)の少なくとも1つの核酸をシーケンシングして、少なくとも1つの核酸配列(SUP-SDB-SDO)を得るステップと、
b)少なくとも1つの核酸配列(SDB)をデジタルデータに変換するステップと
を含み、
任意選択で、ステップa)の前に、式(Ia)の少なくとも1つの核酸を増幅するステップa0)が行われる、
方法に関する。
【0146】
実際に、核酸分子をシーケンシングするステップa)は、当業者に公知であるいずれかの適切な技術により行われ得る。適切なシーケンシング技術の非限定的な例として、サンガーシーケンシング、およびハイスループットシーケンシング(HTS)とも呼ばれている次世代シーケンシング(NGS)が挙げられる。
【0147】
実際に、少なくとも1つの核酸配列(SDB)をデジタルデータに変換するステップb)は、適切なソフトウェアによるかまたはin silicoにて自動的に行われ得る。復号するステップは、暗号化するステップと逆の手法で行われ得る。
【0148】
実際に、任意選択の、式(I)の核酸を含む核酸分子を増幅するステップa0)は、生物においてin vivoで、または最先端技術由来の公知のいずれかの適切な技術によりin vitroで行われ得る。核酸分子を増幅するのに適した技術の一例として、PCRが挙げられる。PCRを行う場合、(SDB)は、5’(SUP)配列および3’(SDO)配列内の相補的配列と好適にハイブリダイズするプライマー対を使用して増幅され得る。実際に、ステップa0)は、本発明に係る複合核酸分子が生体適合性であるため、in vivoで行われ得る。
【0149】
本発明の別の対象は、デジタルデータを回収するための使用および方法を実施するためのコンピュータソフトウェアである。
【0150】
一実施形態では、本発明の方法は、少なくとも1つの核酸配列(SDB)をデジタルデータに変換するように構成されたソフトウェアを含むマイクロプロセッサで実施される。
【図面の簡単な説明】
【0151】
【
図1】
図1は、本発明に係る複合核酸分子としてのデジタルデータファイルを符号化するための戦略を示すスキームである。上部パネルは、符号化される256ビット長のデジタルデータを示す。下部のパネルは、符号化に基づく対応するデジタルデータ符号化核酸を示す(ここで、ビット「0」は、AまたはGのヌクレオチドにより符号化されており、ビット「1」は、CまたはTのヌクレオチドにより符号化されている)(配列番号1の配列の[DB]を参照)。[DB]核酸は、5’末端で配列番号2の配列の[UP]核酸と隣接しており、3’末端で配列番号3の配列の[DO]核酸と隣接している。
【
図2】
図2は、本発明に係るDNAドライブの構築を示すスキームである、スキームの上から下に、以下を表す:(1)デジタルデータが符号化される最小単位に対応するセクター(S);セクター(S)は、核酸[UP]、[DB]、および[DO]から作製されている;(2)セクター(S)は、複数のセクターを含む二本鎖複製性複合核酸分子に対応するトラック(T)にアセンブルされ得る;ボックスは、1つ以上の複製起点を含む二本鎖の核酸分子を表す。トラック(T)は、1つのアレイ(A)にアセンブルされ得るプール(P)にプールされ得る。いくつかのアレイ(A)は、DNAドライブを構成する。
【発明を実施するための形態】
【0152】
実施例
本発明を、以下の実施例によりさらに例示する。
【0153】
実施例1
それぞれが25ヌクレオチドの[UP]および[DO]核酸の対と隣接した3,000ヌクレオチドの1つの[DB]核酸からなる9つのセクター(S)から作製された、10,000個のトラック(T)の96個のプールを含む1つのアレイ(A)のDNAドライブは、ヌクレオチドあたり1ビットの符号化密度(encoding density)で3.24Goのデジタルデータとの均等物を含み得る。
【0154】
実施例2
それぞれが25ヌクレオチドの[UP]および[DO]核酸の対と隣接した3,000ヌクレオチドの1つの[DB]核酸からなる9つのセクター(S)から作製された、10,000個のトラック(T)の384個のプールを含む100個のアレイ(A)のDNAドライブは、ヌクレオチドあたり1ビットの符号化密度(encoding density)で1.3Toのデジタルデータとの均等物を含み得る。
【0155】
実施例3
「人間と市民の権利の宣言(Declaration of the Rights of Man and of the Citizen from 1789)」を含むDNAドライブの例
DNAドライブを、本明細書中以下で完全に再現されている人間と市民の権利の宣言(Declaration of the Rights of Man and of the Citizen from 1789(“La declaration des droits de l’homme et du citoyen de 1789”)(供給元:Bibliotheque Nationale de France)のフランス共和国での創始原文に対応する単一のテキストファイルを含むように物理的に構築した。
“Declaration des Droits de l’Homme et du Citoyen de 1789
Les Representants du Peuple Francais, constitues en Assemblee Nationale, considerant que l’ignorance, l’oubli ou le mepris des droits de l’Homme sont les seules causes des malheurs publics et de la corruption des Gouvernements, ont resolu d’exposer, dans une Declaration solennelle, les droits naturels, inalienables et sacres de l’Homme, afin que cette Declaration, constamment presente a tous les Membres du corps social, leur rappelle sans cesse leurs droits et leurs devoirs ; afin que les actes du pouvoir legislatif, et ceux du pouvoir executif, pouvant etre a chaque instant compares avec le but de toute institution politique, en soient plus respectes ; afin que les reclamations des citoyens, fondees desormais sur des principes simples et incontestables, tournent toujours au maintien de la Constitution et au bonheur de tous.
En consequence, l’Assemblee Nationale reconnait et declare, en presence et sous les auspices de l’Etre supreme, les droits suivants de l’Homme et du Citoyen.
Art. 1er. Les hommes naissent et demeurent libres et egaux en droits. Les distinctions sociales ne peuvent etre fondees que sur l’utilite commune.
Art. 2. Le but de toute association politique est la conservation des droits naturels et imprescriptibles de l’Homme. Ces droits sont la liberte, la propriete, la surete, et la resistance a l’oppression.
Art. 3. Le principe de toute Souverainete reside essentiellement dans la Nation. Nul corps, nul individu ne peut exercer d’autorite qui n’en emane expressement.
Art. 4. La liberte consiste a pouvoir faire tout ce qui ne nuit pas a autrui : ainsi, l’exercice des droits naturels de chaque homme n’a de bornes que celles qui assurent aux autres Membres de la Societe la jouissance de ces memes droits. Ces bornes ne peuvent etre determinees que par la Loi.
Art. 5 La Loi n’a le droit de defendre que les actions nuisibles a la Societe. Tout ce qui n’est pas defendu par la Loi ne peut etre empeche, et nul ne peut etre contraint a faire ce qu’elle n’ordonne pas.
Art. 6. La Loi est l’expression de la volonte generale. Tous les Citoyens ont droit de concourir personnellement, ou par leurs Representants, a sa formation. Elle doit etre la meme pour tous, soit qu’elle protege, soit qu’elle punisse. Tous les Citoyens etant egaux a ses yeux sont egalement admissibles a toutes dignites, places et emplois publics, selon leur capacite, et sans autre distinction que celle de leurs vertus et de leurs talents.
Art. 7. Nul homme ne peut etre accuse, arrete ni detenu que dans les cas determines par la Loi, et selon les formes qu’elle a prescrites. Ceux qui sollicitent, expedient, executent ou font executer des ordres arbitraires, doivent etre punis ; mais tout citoyen appele ou saisi en vertu de la Loi doit obeir a l’instant : il se rend coupable par la resistance.
Art. 8. La Loi ne doit etablir que des peines strictement et evidemment necessaires, et nul ne peut etre puni qu’en vertu d’une Loi etablie et promulguee anterieurement au delit, et legalement appliquee.
Art. 9. Tout homme etant presume innocent jusqu’ a ce qu’il ait ete declare coupable, s’il est juge indispensable de l’arreter, toute rigueur qui ne serait pas necessaire pour s’assurer de sa personne doit etre severement reprimee par la loi.
Art. 10. Nul ne doit etre inquiete pour ses opinions, meme religieuses, pourvu que leur manifestation ne trouble pas l’ordre public etabli par la Loi.
Art. 11. La libre communication des pensees et des opinions est un des droits les plus precieux de l’Homme : tout Citoyen peut donc parler, ecrire, imprimer librement, sauf a repondre de l’abus de cette liberte dans les cas determines par la Loi.
Art. 12. La garantie des droits de l’Homme et du Citoyen necessite une force publique : cette force est donc instituee pour l’avantage de tous, et non pour l’utilite particuliere de ceux auxquels elle est confiee.
Art. 13. Pour l’entretien de la force publique, et pour les depenses d’administration, une contribution commune est indispensable : elle doit etre egalement repartie entre tous les citoyens, en raison de leurs facultes.
Art. 14. Tous les Citoyens ont le droit de constater, par eux-memes ou par leurs representants, la necessite de la contribution publique, de la consentir librement, d’en suivre l’emploi, et d’en determiner la quotite, l’assiette, le recouvrement et la duree.
Art. 15. La Societe a le droit de demander compte a tout Agent public de son administration.
Art. 16. Toute Societe dans laquelle la garantie des Droits n’est pas assuree, ni la separation des Pouvoirs determinee, n’a point de Constitution.
Art. 17. La propriete etant un droit inviolable et sacre, nul ne peut en etre prive, si ce n’est lorsque la necessite publique, legalement constatee, l’exige evidemment, et sous la condition d’une juste et prealable indemnite.”
【0156】
このテキストファイルは、ISO8859-1標準物質(一般にLatin-1と称される)を使用して符号化され、最終的な大きさは5,253オクテットである。このファイルを、LZMA(Lempel-Ziv-Markov chain Algorithm)で圧縮した。圧縮したファイル(本明細書中以下では2進法で提供される)は、2,293オクテットの長さを有する。
010111010000000000000000100000000000000000000000001000100011101001001000011001101100001100101010101100010000110001110100101011101100001001011011101001100110111011111010011000000000001011111000101001010100001110101111101110010100000110110000101111011000101001111011000010101110000011001010000010001000100100011101101011010100101001100010010101010011001011101101110011111011100110011111010010100000011101101000011010101100100000101101010100110010010100001101100010010011000111111110110101011110101011111110000111111111100111101001000001101011101011000000000101010001110110011100010100011100100010011111100010110010100001110000011110101101000110011111100111110001001100010011101100111011111000011000101111000110101010011110110110100111011010111111011011101110001110100001001000011000001110110110110101011110111000010001110000011010010110101110101010001100011000000111110101101110011111010001101000111100110100111110001100011110100011001100111101100010111010101111100101100110110101100111000011111101100011111110110001110011101110111101001111010011011110010001110000101000110110111010010111101000101110100010110100101010001101100010111000111111000010000010110111100000010111001010110101111100100000011111010010011010110001000101000111010110001001001111001001001101000011111010101111111010000000000110110010001110010110100100001001000100110010110111110000001000001110100000000110000101100111010111101111100011100100100010111101100111100100010001010100100101111110000000010011101111100111101011001000000111001100100101100011110010100001010000111001011001100010000000011011101110011001010011010011001011100100100001011101000111101110011010110110001110011101010010111111110100010110111001001110011100011000010001011101011101111101011100010110110000011000111000001111001011111010000011100011001111011010011100100110001101010000001001110101100101010101101101010110100010000101001010101011111011110001100011101101000011001101110000110011100010100111110110000101111101110100001100010100111000101100111000000001011101011111111100000111111100110101010001100111011110111011111000011000111110001011110111100101101101110010111011011001010000011011010001100110000001100100110001111011010000111010110000110101111001111001111010111111001110011111111011011110010001001101111101110110101011000000011101001101001011010110100111000101111111000001100001001101100001101111000001011111110010010000111111100001110011011010000000001000101000011010000101101100000000001000111011011001110010000001011111011011011100110100000011011111000101010011100100111001000101101010101101001010011001111010001000111110001001010100101000101101000011010100110011111100111111001100110111010110110111001010111001111010011100100111000011001010010100000101100000010110010100000001110111100001101110001100000000010100111010000110011110000001010111001011011010001101110100000011000100011011110101011011111011000100100110011110111110010101100011011000010101110001111010100110010100000000010101000101001100111011100001010000100110001001111101100001011011110101101011111111110010100001111000111100010111100010001001001110100110001110100111000101101111110111001101011001111101111101100110110100000010011101011110010000111000001100111110001111111010111001111100100010111001001100111001011101110110011111000011001001011100100011010101010110010010100010010001001001101011110101101100111011110001100001001111011011011111010100101000001010011110011110010111000110111011110111001010100011110101000100101000111110000100100110111001101000010000001101100010101001011000010010010000101100110111011111010100000010111100100101101001001010010011011100101001100001111000110100100100001010111011010011100111110101010000011001001010100001000011000000110101000110001100100000000000111101110110100000111110010100011101001101011011010000110000000100000100111100001000101000001100010100100111111110100001110111100110000100011001010011111010001001111110111100110011011101100001111001000000111011101111010110100000101110111100100111011101001000100110111101101010011110111001101111100101011101011110010101110011001010001010011010110001110000001001111100111000111011111000101110010110101001010001001101111001101110111010100011000001011010110000110110010000001011100110111010000100101101100110110001011101010101001111010111100111010000111010110001111010011000100000010010010110001100100011001111101110001110010000110001011110010010101010011100000100010001000011010111010100011100001110011010101011110000001001101010111110000011000111001110001111011001011111101010001110110111110111101100010111010111000011011001000101101000100111100101001011110100011100111110100011000100010100100100001100001001000101101110000000011100100110010101111110100101100010101010110100101010100101001101010011100010010100111000110010110011100011010101000011110100110001111011000111111011001000111010110100000011100010111111001011101010011011001001001101111010001000010001001010110111100011101001011000001100101110001000110100101100010111101000011011010100111101001111101000010111111110010100101011100111101110111001110000000111100011100101010111010011000000100111001110110000000001111010111001011100101101000011100011010010100
110100001101000001110000100010110111001111001001101010101011010110011000011010111000100010100101111000101111101001110001001011000011010111001001101101001111101001100011011100001100111100011010110100000110000000101110000011110101000111011010000001101110111111110110011111101110100000011000101110110011100101011110110110010011001101110100101000111011101011010011001010111111010011110001001111010101000011110100010001000001101111111110000100100110011111111000011101000110011100110110000101010010001001101011000011001000100010100000010000101101110111001000011110100101011101000011110100001000110000000100001000111001001100101110011000111110001111010001100110100010111101101011111010011111110000011010001111101010111100111100001100110110000100111110010100101000011011011011010001001100111100010000010111010001001100001000101100110010000000000110100010101001000111111001101111001100010001110101111000001000101100110110010111101111100101001000110001001001000001111110001110100001100001010110110100111100001100000001010011111111011010001110001110111110001110101011101110101100000011101101000010010000010111001010111111111100001011001111110000100110110101000110101100110001101111011011101101111001000010000111010100111011011111011010011100111110111101111011000111101110111100000000101111000000011010001001010101111000111011001001111100010110011101000100010101101100011001110011100000000101100111110101011110001101010001011111111110000011000001010010000111110011110000110001011100110011100011110000001000011000000010100000111011100010110010110001101001011001100101100111101010111100100100100111111001101101110101011000100100111010011000101000100001001010010000101111011000111110100001000000010100001010011010010110000000011010110011101100001011000110101011000011100000110101100110001101000001010000000000000011100010000110000011001100000111000100011110111011110010110001100001011001110111100110110101101011100101010111110010100100100000001010101101100011000111111111001000101001100110111001100111000111101011100000111011110000110011111101110011100101000010011101011110100100111101101001000001000001111110111010011100101011111100111111101010010101001010001110001110100010100011110011001001101001100011100111111100100010110001110010010100011000101001101100000100111000000100101101001111000000000010011001110011000001011011101011111000111101100100111101000111101001001000100010010011101110101001010111011001110110111001010001100011100001000101000001100100011100001010011110001100011111110100010010010011110010000101101101000011111110011001111110110111000011011111001110111011010101010000010011101010001000010010111110011000111111111010000111100001101110010111010100010100010101101001110110010011001100010111110011011001011001110101000010001100010011011100100000110100100011001000011001001111011100101100101001011010100110010111001001010000011101011010000111100010011000010000110001110000000001001010110100001100010111001100011101011011100111001001010011100010110001011011010110011100111110011000110010111001000000101011000000111110010011100001101001111011100110101010101100100000011111010101100000000001011011010110001010010110011100100001101000111110110001001110110110100010011100001110010000100001101010000010100011001000011010101110100101000000010101110100010010101010111111001010111100101100001100111110000110111000010100000001010100011011000111001001000110001110101100110011010011110000010011001011111111001001100001001001110110011011100111000110101000110000100110001001111110010000110111010010101010111000100100011101111111010110101011010000111100111011001011100111001101000001101111000000011011101001000101101101101000011010110011011001001100100010010010100001111000011101010101001111101110010110011101001000000110101010001000000110100010000001100110111011110101000100100010011101001011000000101111001000011001111110000000110101000111000001111000000111100001011101110011011100110110101011111110101011101110010101111010011101011011100111010001110111110000100111001111010101010010001110011000110111110011011000011101111011000010101001101010101101001100000010100110010001001101111111101000101000110110110011101000111110001000010001010101110100000111111101110110100110000111101000100000001001001111111010111011110011110001010011100011011110100011111010011001110101011000010011010001110110010010001110101100011010011010110000000101010010011001111000000001111101000110110011011100101101101100111011110111100110110011001000100011010111111001101100010110100110101001111001010001000001101010000001000001110111100001000110110000001101110111100000000110111111001100000110110111010011001101000101000011000000000100111011110011011111100111100111000011100111110100001010010101100000001110111011100110010100111001000110010110001011100010110010011100000010001100001101001010111010101010100101110001110111010011001011001100110001110110111110001110110110111100111001001011101011011110101101111001101101111100100001011110101011001011000000011101100011011110110001101010010011110101100011111000101111010011011100010110001100001010101100010011000000111001111011111100110100000110001000100111111001110101011110101000111010110110101001001110011001100
001011010101000101101000101010000000001100111111010101110100000010100011011001001100011100011011010000100110100001100100000000100010111011001110011001011001100010011001010010110011101001111001101110101111001011110111100010001110110100110100110011110100110101110111111101111011110010101001011110001100101101010111100100110110101011101100010100101001111011101001001000111000101001010011000101000000110111101101001010101101001011110111011011100101110101110000110010011010001010111000111100100111000101110101011011101011001000011100101010010111010000010010010110111010100000100110011101101010001111000000010000100011010101101001001011111011110000011000110100111110110111001010010001110011001010101010000111010111100111111000111010110000000101011110000001110010000001101111010001111011011101100001001110100011110001100000101001110010110111110101101111001000011011101011110010011000110101101111100011101000111101000010101101011010111110011101100010001011100101110100101001000100011101100011101010101000011110000101110000010100001000011000011001010010110110000000001011011110110110100110110001110110100101110111101100001010011100010001100011001100001001001111001000101101000111100010111110111011111110100011001100001001101001101001000111011101110100100111100010011110010010010000000000111111001101011001101011000110000101110100111110100010101101111011111011011101000100000100111001100011110000001001001101110010000011010011001010111000100000010000100001101011010110110110111011011100010111111000110001001000001110010100011001111001010100001101010000011110001011011100011111110010100110010101001100101010100001011000101001101011001011011011000110100100101100101100000110000001011100011111000100111111000001101111101101010001011101111000111100001111101111111010111010000100000001111111010101011101111010101111100011000011000011001110100011100010000000111111000111111000011111101001001110010101000001101010101000110001010101100110001100101011100100101001001101100101000111010010111111101011111111111010011111000111101100010111010000110000010011110011000101110010110111000100101111110110100111011110100010100110010101001111000010000111011011000100100110011001010001000010001000010110100011100010011100101011001010000011101101111001101011001110100010111001110011010000010011100110011011001001110001000010110001110001111110000111011100101101001010110111100011101110101101001001110000011010000001000011000101100110100100110010111010011000101101001011011111001101111001111001011100101011101011010001100100101001000110001110100000111111001001001101100100110011100000101110110000111100010000001010000100010011101110110011011100011010001100000011001011011111011111111001100100010000100100000000001000001101010110101000111010010100001000010100001111001111000101000000000010110000000011001001001111010000111110101100010111110101101100000101110101010000100101000110010100000110011101111101010110000101010111000100100100100110100010111000110001101111010110100100100011010110000110111011000100110001011010101101100000110011111000100110110011001110011011101101111000000010000000110011100110111101110000111011000000010011111001000110111101110101001101000011101000000110000100010010010111010001000001001000010110000011011100111010010010010101000001011101000110100110001111100111010011111011011001111011100000010110001000010110101001001111011000000110010101101000100111001101111101111010011000000011101010111000101100011101111010011011111101101001011001001110011111010001011110110101010011101011010111110101001100101001001000100100110000111010110111100001011101011100100110001010110101111110011010001110101001001101111111000001001110101001111001111100100111010010011111000011011011100010000101000101010000000000001100010111100100000011110011001011100010111110011011111011100000101000000000111110000101101011110100110010100101111011000100100000011101100111101110110001000110100110001110001101111001001000111100100110001010101010101010010011111001110101011101100001110101001010010011000010000111110000101101000000110010110101001110110000100010101011001111011001100000011110111001011000111011010101111101010000110001101011110011100011110000010011001101100000101110101111000000000001011110001111000010011100100001011001001111011011011001001111101111101110001010010101111000000000000011101101001001011001011011001101100010010101100100110000011010001001000100111111111011101001101000110100001000011011000010011100100101100011011001100100111000000010001101010101111010101010100111001000101110111110011010011111101110001000001110011101000001011101110101011001100111110110100010000010111101000010011101011001101111011001111111001001110111001000111110001110011000111111011010000010001111001111111011100110101111001010101000011110101100100101010101011111011001111001101101100100111111111001110000001001100111010010001111011110000101010010001000111101000001111001100111100001111110000000000011001111101010011110010000111011001110100000010101110110010101111001010101010001010001110101000100100101001111111111000101000101101101000100101010010101100100110100001100010011001011010000001000001010000111011100000010111000100001010010110100010011010000111000000101000
11111101011010001111101111100001001011010101011000011110100111101110011010001010101111011001110111001010010001011011111101000110000010001110001001001110110000011010000000001111100011101011000111010000001101100001111111011110011110000101001001001100100101100100010000000100101100101100001111101111100101001100010101000110001000010000111011010110110011010001111010100111101010010100010000101111110011000111110110001011010011010100011111111011001110111011101001111101110111000110110001100010010101111000000011110101011011001111000111101101010111101101001000011010010011010000001011111110001010110010110110110110111100111001111101001011011100001100011000000111000011000101000000001001101010010111001010110100110011100000101011101100000110101010110110110100000110100000000110000010010011110001011010110011001011111111111101011011000010011010100111001000100100111011111001110101001001111000101100110011101010110011101000110011101001001000101111001000101101100101111111111000010011100101000100110100111111110111100110000001010100101101100011001000101010111110001011011000001000100110101011000110100010000011101100110010011011001111111110011011100010100010111010100110011101100100101101110110001010101101011101101000011110110110000001110000011011011001111001001010000111000001001110111111101010000000111010100100010001011001001011010111000001010011011000011001100011000110111001011110010011011001011010000110111100110000110000001010101101010001100011100000100000010010011011111111010101000000110010001001100111100001001010110001101000001001011011111111110110010010011100010000000100111010111001110001001001110001001100110100111000011111001100011110011111001111010001000001110010100010010111100001001101010000111110100001110011001011100010101111100101111010010101100110111110111011111100100001011111111010000101000110110110001111001010100110100110110101110011110111001001011101100011010110000100011101000100110000111101101111111100001011111101110011011010010010111100101001000101011101100001101011000101011101110000000000010110101100100101100001010001000100111000010000101010001110100011110010010010001001101111000110001110000010001011010100000111011100000001100011110111100010101111100001111010010010101110111110101010100011101111110110111001111111111101011000101011011101111110111011001010101111110010001010011110010010111010000111110000100100001011111111111000111111111010001100010101111111011001001101110100010000011011000010000010110110010100010010011111111011010010101010011111011011100011001111110010100100101011100100100010011100001110100111011001000100010101111000010110101001011111110001111010001100110101001110011011101011110100111101111110001100011000101110010100111011111001101111001101111000011110111110100011000001010110001011101111011101110011001010010110001101111101001101111000111100011100101100000111110111111000011110111011110000110001100110100111101011001000101001111010010101110011011111111110001101111100111101110010111100000111111111101010010111001001101111000000000
【0157】
この2進法のファイルを、Church-Gao-Kosuriを符号化するスキーム(Church et al.; 2012, Science, Volume 337, Issue 6102, pp1628)を使用してヌクレオチドに変換し、ここでAおよびCはビット0により表されており、TおよびGはビット1により表されている。各ビット(0または1)に関して、対応するヌクレオチドは、無作為に、2つの可能性のあるヌクレオチドのうちの1つ(0ではAまたはC、1ではTまたはG)に帰結した。結果得られる18,344ヌクレオチドの配列を、3,000ヌクレオチドの6つのデータブロック([DB])および344ヌクレオチドの1つのデータブロックに分けた。次に、各[DB]は、以下のDNAドライブの仕様に従う生体適合性配列に向けた配列の収束を可能にするために、ランダムヌクレオチド改変サイクルを受けている:制御されたG+Cのパーセンテージ(35%~65%)、mRNAが符号化されていないこと、開始コドンがないこと、6つ全てのリーディングフレームにおいて200ヌクレオチドあたりの少なくとも1つの終止コドン、酵素BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIに関する制限部位がないこと、ならびに3超の同一のヌクレオチドの反復がないこと。
【0158】
得られたヌクレオチド配列を、表3に表されるようにデータブロック[DB]([DB-1]~[DB-7])と呼ぶ。
【0159】
【0160】
実際に、各配列を、禁止されたヌクレオチドパターン(たとえば、BamHI制限部位「GGATCC」の存在など)に関してスキャンし、このパターン内の1つの無作為に選択されたヌクレオチドを、その二進法の均等物に変更した。複数の反復組み合わせの後、最終的に配列は、DNAドライブの仕様に従う生体適合性配列へと収束した(表3参照)。
【0161】
各[DB]で、非デジタルデータ符号化ブロック[UP]および[DO]を、[DB]の前および後に付加した。[UP]および[DO]ブロックの7つの対の配列を、それぞれ表4および表5に提供する。
【0162】
【0163】
【0164】
セクターを化学的に合成およびアセンブルして、式I:5’-([UP]-[DB]-[DO])x-3’(x=7)(配列番号26)の最終的な配列を得た。この18,732ヌクレオチドの配列を、大腸菌のDNA配列の操作のため、複製プラスミドに挿入した。
【0165】
このプラスミドを、大腸菌において複製し、抽出し、DNAシーケンサーを使用してシーケンシングした。実験により得た7つの[DB]のヌクレオチド配列を、Church-Gao-Kosuri復号スキーム(A=C=0、G=T=1)を使用して2進法のファイルに変換し、二進法のファイルは、LZMAアルゴリズムで圧縮せず、テキストファイルは、100%で回収できた。
【0166】
配列番号26(DNAドライブの完全な配列)
tatgaggacgaatctcccgcttatacctcttgcgccaacaaacaacaaccgccaacaacaacaaccaacaaccaacgaaagaacgggagccgacgccaattaaggaggcaaagtcctctagctcggaactaaccggaccggtatccgctatttcggccaatcctagtaggtagaaggacgtcttgcgttggctaaggcaacaacaaactcgggttacctatacgcgctcaaattgcgcttggtcggtaagcgccaacggattcaacgaggttagtaacgcgaagggtcggcaacgatctttcccaaggaagctaccaagaacgccctaagaacgttcttataggcgctcctcgccggaaataatctatcgacggcctatttcggcgggaattgggctttccttccttgttcgacgagccaaacttgcggctaaacgtagctattcctccaactagtagcgcgacgtactacgctccaattcttcaagcctacggcaaggttgtttcgtagagattggagcgattgggttacccttgttgggttactttgcgcctaccaagtataggtcgcggacaacaacctcgctaacggtagtacgggaactagacctttaagccctacttgtttcccgcttacgcgaaccttgccaacttgtatcgtcgaccggaaggtttgccttggtacctaaggaccgaaggtcttacggtctttggacccgtcaagagtttcccgtatagctccgggtattaggataaggtagtcgcttggttcgtctttcgggaaaggtcgcaacgaagaaccttacaaagggcgtcggaggctagcttgtctttacaatcccggtcaaacggcgactagtctattgcgctagcaaggcaaggaaacccttgggcgcttaggtacttgttataccgtcgaccgttgccttatccggtttcccgtaaagttgctaccttacggcctttgcttacctcggtagcgctttggacgattacgtaggataggccttgaaacggttggaggaacggttgggcttaccgttacggtctttcgtttctacttggcgccttcgtttactcccttgaccctataacggcttaggtcgcctcgtttctcccgcttgataccgattctacgagagaaaggaggaacgagggcaaggtttgacaagccaacgaggcgtttcaacaatcggtcctagattcgcgttggcctaacaacgttggagcctacgtctaggcaagaaagagcccgggctattacctactccttggaatccgccgtagacaattgggcgatattggtttagacccaaacccttcttaagcaagggacgagtagcctaacctacgcccgaaggaatcttcggttgacaaacgcaaacgttcgcaacaaccttccaatcggaagggctcgttgagggttcaagttcctacgaacgagtttcggacgggtaagccctacctatatacgacgcgtttggccaaaccctaaggtattgggcctttgagaggaagcaaaccgggccttaagcctagtaaagggtccgcgacaagatacaatttacgagtccggaccgccaaacccgtatttctttacgtcctagccttctacggactcgttcctacgaccctcttgctaacgggtctttaaggagagtagtaccggtaagggagataagcggttggttctaccgaggagggaatccttgacggtaccttaccctacctcttgctagttcgttgtagattgccctcttcggcaaccttccctttcccaagggtactatttggcgaacccgttaaaggccgttgagtctaattgccgccttcaaggagagcccaactaaggtatcggacgagatagcggcttctcgagtcgaactcaactagacgagctcgagggttcgggtcaagtcaattgcgtatcaacggacggagggcaaaggaattgaactagacgggttcggcaacgatttgtagttagacccttaccgctactttccctcttccgggaacccaaagaggtagcggttggttgaaaccttgggttacggagcgagcaaggaagttatttgagggcggttgacccttaccgtttgaaagattggcgttgcctcggcgtatttactctttcgtcgtccgatcccaaggcggctaaattaaggcaaaccggacgccggaaattgtagtatcaacgggcgcttaaccggatctttgccttggaattgtcgcgtttgtcctttccgttggttgcttcttggactcccgacttcgtttgctttaggctagaggccaacaaggtagaaggctaagaggagcttcgccttgaccgcttgttgtcaaccggccaataaggcggaaccttattggcaacctcttgttgtccgcctacaatttgggtaaccggtaattcggcgaccaacaaagccctagccaaggatacaagaggcggacaacaacaagaccttgcgtcttacgggaatcaaccctcttgggcttcttcttgacttagccaaccgtcggtttcaagagagacttgaatacggtccgaccgcggagatatagtatcctatacggacgtttcgccctcccgttgtaactccgctagaagatcaatcggagccaaggcgataaggaagggttgaagggttgccttaaggcggtataggcgtcggtaatctcttgccttgtctacgggactccgggacaattaagataagcgccaaagcgtaaaccctcgtccgagaacaaccggtcgtttacaagtcgttaccggacccaaaccgagaagttcgcaaaggccttgtaaccaagagcttgacgcttagtagaccgtcgttctaccaacgtcaagcccgtattggagagcttcggtttaggaacgcctccttacttggaggtttacgcgagtaacgtaggacaatcgcgggaacgttgagagaaggaatcgccaaacaacgagcgaacgataaggacttgcttgacaagagcaacgaaggcaagccgggttagtcaacgcggaggaggtcttgacaaacgtgtgcttgtacaagggtttatcgggcgtggtgctcgcatagggatcggagcgttggtttgtccgctacccgtttaacgggtaacgagttgaaagaacgccgacggtataaggcaagttctacgggaccgattcgttggtagggacttagcttccgggttcttggtattacttcggcgaaacccgactttctagggtcctaaccgttcccaaggcctttggaacgttgggtagattgaagggttaagaacgcgggactaattacggtccgagggcgggattaagttgtaaccttccgcctagttaagcccgtctatagagcggccgactatacctccgaaatactaaggcgcgttgagcgtattacttgagtttcccggcaaagcctttgcgtagtcggtttagagccgcgaccaatagaaggttacttggcctaggtaaaggagggagggtatttaagcgctcccgtttcgctccctaatcgcaattggtcaacgactaattcgggacggctaaactcaaaccgtcgtccctagcgacgcttaacctacgacgacaataggccgtattgcgttgtcgcgaacaaagaggttacgcctcttagactactagacgccgtctttaagcgacggcaaattggaccgtagacgactacaagagcgggagtagacttgaagggttagagcgcaaccgtccgactagctaaacgcaacgtcaacaagtctcgcaagtaacgtccgacccaacccaagttgagttaggagaacccgtttgacgataccgggctccttcgagtcttatcaaagtccaacccgcccaagaaggttccaagcaagagacaaaggcccgctacgaattggtttgagacaaggtagttgccggaacctcaattccgataagttggctcaagacggttggctttgacggaagtcgttaggaaccgggtactcaacccttgaggtagtttctaggctcccaagcggtatttgacgcctttcggtctaagaactccttcggttcgtcgagccgtttagttacttctttggcctagcgggatattggaagctcgttaaggccgataccgagaaggcgaggaaagggcaaacctacgttggaaggtcaagttaggttgaccgattgacgcttatatcctctcccgacgtagggtacggcttgaggtcgataccttcccaatcgtagaggaaccgtcggactaacaacgagttaaggcgttcgccaagcctcttaggaaggaggaaagcttgcgctctatccggttagattgtccgttagccaagggataggcaagttgctccttacctcaaccctacgaagaggaaaggcctaccttacggtttcggtaacgggaagcaacggacctagttgactactcgctctccgttccaactacctccctccaattctcggtctagaacgttcaacgggccggagatctcttgtaaaccctaattcgagattgggcaaccggaacttgaattgcccgggtaggaagcgtttgtcgagaaaggtcggaggttgagggtattcaagcttgagcgggaaccttaggacgaaatcgtcgccctaagttgactctccgaggttatcaagggaagttggcgaacttccctaactatcctacgacccgtccaatacgaaatcggagttcccaacaattgccgacgtaagatcggttgtcgaagcgtccctctctctagtctcctatagctcctcgccttctatccgttaactcctcgacttgaccgtacgcttaagggcaagtcgctatacccgggtagacttaacgggtcttaacgttggtcggcctcaatttctattcgcaaaccggtaacgagttgttccgcgttctctccttcgtcctactaaggcttggcgaacgaaactaacgccgcgattcttggaacttgcgaagagtaccaattacgcgggaactcaaggcgaataggcaagcgttgatacccgtcgtagctaagtttcgaaggttgcgcaactcgttgttggactagccgctatttccgtttcggtcgggactttcccaaacttggaaagggaatctcgagg
gcgaagtccaaactaagggacttgcggaccaacaaagggtcgcggtaatctttcctcttatcaacggtcccttatcctagccttagacccttctcccaagggcaactcaatcttcgttccggttccgacttcgatctagcgtatcttccgtaaccggcgcttgccctaactagactattggcaagcggttgagaatttcccgacgcgtacccgtctatttaagaaggaggagccggttgcgaaggaaaggagggaaacgtaagggtcaagtagagtctacaacggaccaaactcgggaccaagtttcgctacctttcttcgaccaaaggcggtattgttggtaggccttgttgattgagaaacccggacctcggtaggactttacgagcgttgcttagtccgccgtaattagttagaagctaccgggcgggagattctaaggaagagcgggtttagaagggtaacgacgttgagagatacaagggtctaccgacctccaacggcggttggtttcaaagccgccgtacttgttggtaaacttgctcaaggacgggccttagtaccctatagaagcaatccttagaggacccggaagaacgcaatagacaaccgaaacgaggcgttaggtactaaccgggtcgacgctcgttatcaacttggagcaacgaacggcaaacaagacccgaacggtccgaattaagcttgacggaacgggttcccgttgataacgtccgtctcaatagttgcgtctagttggcgccttggtttacaaaggcgaaaggttgctatctttgccgggtacccttaattcggaacctccttggtaatcgcctctacccggattcgtagtagccctccttaatttgcccgccaactcttgctacctccttaaactcaagcggccgtccgaccaaaccaattagcaagcgctacgaacgtttgtaaggcgttgccgtcaagaaccgatgttgacggactaatcctgacatcatagtagttcagacgccgttaagcgccaattgagattggaccaagaaagcggaaggaggaatcgggtagttgtaagagccgaaagtaccgaagaagcccaagttggtcaagggctacaaggcaactagagtcttagccgggtcaaaggccaaacctcgacttgttggtagtctaacgggcaattgattggtaccggtcgctagttagggagcttcccaaattgaggctaccctaagcaaacgcggtaagctcttgggttgggacaatcggactttgggcaacgacttagtatcgaccggatagtacgtaacgtcttggcttcgggagtaggttacgaaactacccggtagctactttcgtaggtttcgtctccggtccggtttcgtttcttgtattcccttggcggtcgttgccaaccaatcttggccaacccgtataaatccgctcgatttgacctttcggcctaagttgtacctaggacgttagaacgacctcgcgtagtaaaggacgggaaggtccaacaacgcttacggttgagctcgttgcccttatagaacgcggttgttgttcccaattcaacctcgcctaacctttgtccggttcaacggaaatcgggacttacgggaacggttacccaagaaccgtccaaaccgataaaccgttagttacctcggccgagtcaattatccgaggacggactattccgggtcgctcttggaatacgccgaagttgttacggcggagttctagagtaaagcctaagggctaagtccctctaccgaaccgacgatcctaaacgcgtttcggaaagttggcgaaactccaaacctctcaaagagccgtcgaagaggcaaaccaagtagcttaaggtcggccaataggaccttcgctagtccaagggaaaccggagattaaggaccttctaacccgctaccaacaacaacaaggtaccgaaacggaacccttccgtcaaacttgaacgcaaggttagggagggtccgattaacggcaacgattacttgcttgtaaggcggagcgtctagggactctatagttggacgagcctccgcaaacaagagctattattaccggaccgggtttggtcctcaatcgacgtacggaggtaaggaattgcccttggagcgggaaaccgttagtttacccgtacgggtttcgttccttgcctagcaaataaggtcgcggttatacgccgttgcttagaagccaacgaccaattgggtagggcgacgggacgatagtttgtccgttgttgctatcctctcgactatcccgttaacgggctaactataccgttgacggacgaaggatccgtaaagggccgttgttgactcaagcggcaatttccgaagcgcaagtaacgagaaggcgtcaacctacttgaaacccgaagaggagccgttgacaacccaaagaaggaattgccggcccaagcttcgttcgcttgttaacttgtagtccgacttggcgaccttgtatccgaataactcccgacgaaggtcgttcgatactcgagttcggccgggattagttcctctcaaggaaagggcaacgaactagccaaagtacgcaaggtaccctagaattggcaaggaacgggtttgctaccgacgcctaattggccgacaataggaggctaaacgttgttgccgtccgggtttattcgttccaaggctttggcctttattgcttcgctcgcgaacaatccgttctataacgcaacgcctattgggaaggcccggtttgtttcgccaatttgccaagtcggtcctcttgatcgaacgctaactatcggagacgttcgtccgccttaaggaacgcttgttaaggattccgcggaaggtatatccaagaaaggcccgacgtcttgcctaacccttatcctaccttccgacaattcctccttggcttgacgattacgagaagattcgagccgtccgaggtactaatctaaaccgggcgagtcgcaaagtttaacgccttaccctacccggaaatttcaaccaaccgaagcgcgtcgaaccttaaatctttccggcccttgctagtcggtacgttcctcctctcctttacctcttaccgcttaggctagtacgggacgttggaagtaaaggacgcgggcctacaaacgctattacccaagttggactccgggcaacttagaagggtcgttaaggcgctagagcggaagaaccaagttggatagcggacccaaccaagattattcgaggaaagcgcctagtccgttcctccaaggcgaaatttggaggaccgacttgattcggagcaagaagttacaagggccgacaagacaattcgctcaacctcgaacgtcctaaccgtctctcttgctactctaccaaccgatagggctccctaatatcgagaggtttgcctctcgtttcctcttaaccggaagggttacaaggcttgaaccgataacccaagagctaccggcgtaccgttccgaataaattaccgggatcggacgtccttcgaattgtccaactccggcctatttgttggcctccgtaaacgacgaattgcgtccggattgactttcccggagatcaagtccaagacggcaatacgttgggcctcaacttaggtcgccgagctatctttcccgactaacttgattggttgcgcgtcgatagtatccaattggactttcggcctagggacgttccgtataccaaggcttggacccaacttattgagcctaccgcttcgtaggctaaccttctaggccggcttaagacttaagaacgccgacgcgacaagtttacccttgcgctctctaaggttgcggtaagaggaattgagcctaaacccggcgctataacgacccaagtctaactacccaattccggcttgcgttgctcgcaatcctaactaattgagccgaggaaccaagattggccgacccttccggtttgaaaccaaggagctaacgttccaacttggcccaaagttgaaactcgggagggccgtagggaagtagtatctaccgtacctagatacactcaatttgtactcggggttccgttttacattccaggaaacgttgttgcgataggtattgaagcgagggtagaagggctattagttacgggcgaacgggatttggaccctcctttacttggcgctctagaatcaagggccgtaccttctttgtccttcggaaccttgcttgtcgtcaactcgctacttagatctcggcgacggaccaactataagtaagccctaaggcgtttgggtcgcaatataacggcttaggcctttcgccctttggacctacaagcaagagagagggatcaaacggttgggatttcggatccggacaattgtatccctaaccaacgacgacgttgttgcgcgttagggtcctttgaacgcgaagggaaaggattggcgaccttgggctaattactttcgcgcgtaacctacttcgaccttgagtacgccgaaattgctcggaccttctacgtatcgtaacaaccgctctacgacggccgtttcaaacaacgttggctaccgtagtccgtaggtacgagtaggaggaagggaggttagggtaattcttccggacgaaatcaagtagcgttgggccttagtcccgattcgaaggagctacttgtccgctacctccaacttagctccaacctaacccgggattggcaaataacgtaggccaaacgtcttgagttgacccaaacgtagttgggacggaacccttcggctttagaaggaattagcccgctacaaggccaaacaacgacgggcgtttacgtagttgttccgttgacgttcaaagggacttggtcgccaatctactcgcggaaacaacttgcggtcggtaagtaagcgacggtaagaaagtcctcttccctagttcaagcggcctaattgaccaacgaacgtacaattcgacgctagggagatatagcgcctagggaaagggcgggataattccgattccgtacggcaagttcgtcttgttcccgggcttcttagtttacggtcctacgcgttagagtcgttgcgagtcggttccttattcggtttccgccaagagggtctataggactagtacaacccggtcggcccttc
tttgcttaaaggctctcctccttggcgcgtaactttgtcaagcgttgcgaagtaggtcaagaggaaaggcaacgctagcgtaactccgtccaaacgttacttgtcggtttgacggagaaaccgtaacgacctccttgggtaagttcgatcttggctagcccttgctagtcgtctctcctcctttacgtaaggacaagcgtagcgctaactaggctacctctctccaaaccaaggaattgggtagcgaggtatccaacctctcaagtcggaataaggcccgttcccgtattatccaagacgtctaaccggactaccaacccgaactagggcggaattgacgtaatattccgtcccgccttaatcgactcgtacgggatacggttaagtcttgctcgggtaatcttggcggttccctaactttcttcgccgtagaagtacgggtcgaaggcgagggatttgggtattggaggttacgctagccgattgtcaaggccgcttatagattggcctacttaggctagattgcggaactcgaatcgacgtttcggtagccgaagaaagggaacgcgcctataagtacctcgaaacccttcgttgagtagcctctcgaggataagcggttattgcgtcgggaagagttctagttacccgtacgccgtatccctatctttaacgggtaagccttgaccgcggtagatagtagggatcgtactcaaagggaagcgctcctcgttagaaaccgacgaagcggcttgctatacaacgccgtactttaggcgatcccgtttcaaacccgcaaagcaagtctcgcttagcctaatctttggcttggccaacgtaacggctacttgggcgtctttactcgcctaaattgccggcctctctatctcaacgggagcttggaattgggtaacttgctaggcaaaccctagaggttcaacaaggtccgaccaacggagggtatcaagttgagtaggtaggcaaagaagggcgaacggttaacggaacaagagccggtaagcgtcttggtatcttcgttgcctcaacgtcggtctagttgactaagtaccgtcgaggcgtttgcccttgagaacggttagaacctctcgtcgagtagaggtttaaggtcggaaagaaatcggtccgcggtatactctactaccgaaaggtcgtcccggtagctagctaaacttggaaactcgggcccaatctccaagacaagtacaaggcctagcctcggcttaaaccaacctcggagttgcttaggctacttcgtcaaggtaggctaatcgggcgttgattaaacgctacggtaccgaaagtaccggacgtaacctactccgtttacgccctagtcgaaagggtaacgcttgggagttcgttgttgcgcccttacgtcaaagacggataaggagaagccctttcggtagttcgcctaagttgaactccgttgcctacgactaaccaaccaaggttgtccgtctcttaaggctcggaacttcaactcgggagacttgttcgaacgatattcgttgcgggttcggctttagaacgaaaccgaagggacggaacgtttaaaccctcctccttctttccgccaaagtcgaaggactcgctttaacgcccaaataaccgccaaggatcggcgcgtagtattagttcgtcttgccctatttgggaacttccctccgcaacctttacgctaccttacttggacgagagccaagtagagccaacggttacctcttagggcccggtttgtaatataaggcctcgctaaggaagagcgcgaaccgcttaaatctccttagcggcctcttcttattaccggcgactacgcggaagaggacaaattcccaactcgttcaattgggcccgactttggtccaacttagttggagtctagacctaggtattggcccggttaaccgggttagggttgtctagggagaatatcccgtgaagcttgagtggaatcgccgctgacgtgtgaggcgctagagcatagaccgaaaccaattggtttctagagcggtagggtagctagggttaacttacccgtcaacggccgttagcccgttaactacaaaccgttgggacctttgggcaacttgttgctacgactttaagctcgaacccttcgagagagcaagtacctagctcggaagtaacggcctagatttactcctcgccgaagtaggaagatcccggtcgacgcgttgtttctaggtttgggttgctccttgggacctttgagtaacgagttcgaaccggaccaatacgttgccgtacctctttaatagtcttgaccgcctcggttggcttagacggtcggttagcaatatccgtcctctagaagggtacccgaaacttgcgtagtaacgcctaaggacgtcctagacctaaccgaaagaccctaggagcaaggtacctaaggtcctatagtccgagccaaaggtcgtagttgacttagaggccgggatcaagagggaagggacggatcaaactacttgaaggccttcggccgaattgacctcaaatattcccgggaccgttgggaaccttgctttccgagtctccgctagtcgttgaacttgagggatcttctactccgggaaaccgtcgcaaaccgacaaggcaataggacttctaatccgtcctagggagccttcaagagtcgacgagtcttggtaattcttggacgtttacgcggtacgagcgttcgcttatcaaggcctccgatactaacttaaagggctcaaccggttgtcctaatccggagtactaagtacgggcaaactcggtaggacccgttgaaagaacaaagcgacccgaaagacttgcgttattccggctttcccttctcaagtcaaaccgtccgcttctttggaggttgttgaaggcctccctcaactcctaaccaaacaagaccaaggagcgaggagagaaattgcgaagcgaccctaaccgagaaacttgtacgggtcaatcgcccaaccaactattacccaaccgtcctcctacttggctacaagggttagcgtcaagatttggcgcttaggaaacctcttgctagagcaaagaagctcccggaagatccaaaggacggtagggttctagcttcaaatcgcgcttgacctaataagccgacggagccctcggtaaagtcaattcgggtagcttagaagccgcaaggagattacccttcgttagtccctccttcccgattcgagaggattacaacggaattgggaccgaagtaggccggaagttacggagttcgtcgtttcaaaccctcccaaacttacgggacgtattgtagggacccgggattccaaccctaattgttactcccggcgttgagttagagccttagacaaggtcgccaaacggaccctaactaagacgagttagcccgccaactaataccctagtaacccttcggtaaggtcgccgactccgatatcaaacgcgttagaaaggcgacggcaattggtacggtctacgttgtcttaggacggttcgggaacaacgaggaaagacaataggcgctaagccgttgagtcccaacgtaagagaggagcaagacttgaaggcttggtcgggtctaaggcaaaccctttagcgattgcccgaggaacggtagttgatccgtaggttggagtctccgattaatccgttccggtttctccctcggttcgtcgagataagggcgattagaggtttagcgccgtaagctaatccgaacgactacttccaattgctcggcggttacaagcttgctcgttacgacggcaagatagtcgagggtttacgtataccgggagctacgccttcttggtttccaaatccggtcgctaagggtacggtttaatccggtagccgacttggtaaccttattcgggaacgacaagcgcaagcgatcccaaacaaaccgtaactcgggtaatcaacaagttgccgtccgctttacctcgttgtaagtcgggttagggcccaatctaccaaccaagggttaacctcttctattggagacggccgataagctttgcggccctcctaaccaattgagtacgttgcgttcttcccgcccttatacgtacctttcccttcttgtacgccgaccgttgacgaagtacctctagcgctagctatccgaattgttacgggctataggtcgtaaccgggatcgaagctcctaattccaagaccctttggcaacgattctaccaacggacgaggagctacgttcttacaagaacgcgcgaggaaggttaggccttaaacaaggttcggtacgattcccgggattctagcggtttagctccaaggcccttagagggtcctttaacgtttaccaatccggacgtcggacaactattgcgattggacccaaccaactcttggcaattggaaactaagggccgacaataggcctacgggtagtaggagtaagacggtttcgttggcggtaactagacgcgagttgacaacccaaacaaggtagtctacgaagcggactcttcttccggagtcccgactagattacgaaggacaaagtcgcaagcctcaagccttgggttggagttctaaggagcccgtataaacgcaaaggaggaaacgacttgaagccgaggaaaggcggaagtaatacttgaccaaccgcaagtcgctctattgtcgctagctagaaggtcctaccgagggcgtttgaattagacgtttggcggtcaagcaaacgggacgggagaaacctcttgcgttctctagtacttccttgggagtcgaacgaacaagcttgtagaacctacggtagcggccttagggtattacgttgttgacgaagggcggtactcccttgttaacttgaaggcccggttggcttctaccaatcaagggtacgttgggtcttgacggctaggttaatcgcgctccaattggcgcgtcctaatatagctctattgggaggacggttacgtattcggcctaaggttgggttccttgaacaaggtatggcacgcctaatctggacacaggagaggtctttcatgcgtatagtcacatccgaaggccgggagaagcaattggagttgaccctatctccgcaagacctttgcgcaa
ccttgtaaggacgttgaaacggttgtacccaaacaacggccggttgatctaagggtaatccaagggcttacgggagcaacaagctagttcggactagagggtcctctagcgataaagctaacgttcgagaacgccgccgctaattgttgttgtcaagctaccgaggcttcgcaatacgatcgaagctagtccgacggctcaaaggaaagccgtaatcgtcgcccaactaccaatcgaaccttgaggtacccaagaggtcaataccctatcctaggcgaacgaaggatacaagggacccaatagcaaggttggatagtcgcccttggtattgggccaagaagaggcgatatcgtaaccgttgatccgttgagttacttcgaccgctctaggttcttacggtcggtactcgcctaaagcggcttgtttcgaccttaaaccgaacgggcaagacgaattgaggaacaaggctcccaaccaaggttgaacgttagcggcaattgatccaaccgtcgtaaccttgttgtagggtccgtttaaccgctaagcctaaggaagccgagtcctaaataaaccaagccgcggactaggcaacgggttagttgtccgataattaccgagcgaccggaccgcaaatacaagttagtagaggcggacgtctaacgttgctcgaattggatcgactcgcaagaccctagttgggacttcccttgggattacctcttcgccttctagcaaggttgttgcggacggtagttaggtcgacttggtcgttcttgaccttcttcccgtccctaagctagggtaaccaaaggttcgcgattcgtccgggtaaatttgcgtagcgcgttgcttctaataaccggatcctccggatacccaatcgttggttaactctcgtccgattaggcgtcggcgtttacgttaagggttagaagaggcgggcaaaggaacttaacaacgttacccggaaagcgaccaaaccgaagtcgatcctcttgacgagaggagaaggaatttccaaagagcgggcttcaaacggctctagcggcttcgtctaaaccttcgcaaccaacttcccaagacgacttggaacgcgtagagtaaggccgctttgttgttgggatcttcttccaatccggatatccggtcctaccgaagaaggtattggtaagggatcgcctccgttgaccgattacttacttgatcgcggccgttagcaagtccggtatacgcctcaatagtttacgcaagcggaggaagcttggttgggtaaccgaagggaagctccctacttagacgggtttggagtttacgtccaaacgctcgcctcttattaccggaagccctcgatctttggaccgcgtaggacaactacctacgtcgctcttaaattcgaccgacaacgttcgtaaggcctacggcttccttggttgttacggcgttcaatagcaagcgttagcgaaggccgggagtaataataggagggagtcaagagagattatcggtcggagccaagttgagtcggacccaagttaaaccgtcgtcgtacggttaatcctctaaccggtaaacctccgttcgttgggtcgatccaaacctttctctcctaccgaccgcttaagcctagtcgaggtaccaagctaagtagtcaacggacgtaacttcccgtcgttacgcttggactacttcttaagcggcgacaaggattggacgtccaagtacccaatctcgagtagctcaattaccgggccaactacccaagactaaggcgggttgttcgagctaaccaaggactcccgacgtaattgtacccgccgatcgtaaattcgcccaataagcggattgggtttgtcggactccgacgttaacgaacccaataagggatagttaagggcccgacgaagttaaagccggacggctaaggtacaattgttacggcccggttcctttgtccgtttctacctcaaccttgccgcgaacgactcgtttaaccgaaggctagaaactttggcgaaacggtacttacgagggacctagctttgtaagcggttatccgcgcggacttatttggaggtcgttgggcctaacctcttggttgtagacccgataccgtcggcttcaattggaagatcgaaggctccttagtatcgggaagggtagttcctacgcgttaggaaaggctcttaaacgcccttgagcaagccgtcaacgtttagtcgttgttggacccgaggttgtaggtaagtaggatacgactcgggtccgcgaagaaatataggtcggcaacttagagtcccgagctttagggaacaacaaacctcggctattcctacgcggaaacgctacctaaagaagggcaacgacaagcgcgaacggtataacgggtacgactactcccgacttaggttaccttaacgggcaaccgaacgcttagctcaaacgttcggtcccaaccttcaattgtcgggtccctctagggttacaatttgctccgcctctagggaggtttcgctatagcaagttcgttggtaggcttgacgggtttggttgcgaggcaatataggaggtattgggtctttaggacgagcgagtttggccgcaatcgaatttgacgcctagggcgaaccggtttaaccgaagcaactattggttgggttcaagggttgggtctaccggaaatcgagttgggtcgtactccggagttctcaagccaacttaggcaactcaaacgattcgtccgctaactccgacttggttgtcgtataagcgctctcctttggagtctttaacgtccgggtttacgagactacgcgattgcctcctaaagcctttaaccggtagccgggcttaagcccgaaagagctttgaaacgcggatatccgcttgttgtcaattgtcgaccggccttagctaagggacggagggctagtttatacgggtcggagattcaatatgtgtcgtctatcctcagtcggtaactgcgcatagttggctctataggttcccggaacttcaatcgttccgctcctttaggttgaaggcgtttacggcgggtaaccgtttagggttagcaaggcaacctcgaggaaataggtcgggtattgagggaagtactagaagcttcccggagggttagaaggagggtaacggttaacgggacgaggaccaatttgtcggttgtcaacggttagttcgggtcaaaggaaaggacggatactttgctcggccgacctagaagttgagaagagaggtccggaggttgggtttcaattaggttgccgtttagggcctagggtaacaaggtttggtttcgagccgcttgactacggatttgaccaaaccaagcgtttaaggtcacatcgcatgaat
【手続補正書】
【提出日】2022-06-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、
[DB]は、約8ヌクレオチド~約10
6ヌクレオチ
ドの長さを有するデジタルデータ符号化核酸を表し、
[UP]および[DO]は、それぞれが約0ヌクレオチド~約10
4ヌクレオチ
ドの長さを有する、非デジタルデータ符号化核酸の対を表し、
xは、約1~約10
5を表す)
の核酸を含む、少なくとも1つの二本鎖複製性複合核酸分子を含むデジタルデータの保存および/または編集のための装置。
【請求項2】
[DB]が、約500ヌクレオチド~約5,000ヌクレオチドの長さを有するデジタルデータ符号化核酸を表す、請求項1に記載の装置。
【請求項3】
[UP]および[DO]は、それぞれが約10ヌクレオチド~約200ヌクレオチドの長さを有する、非デジタルデータ符号化核酸の対を表す、請求項1または2に記載の装置。
【請求項4】
前記複合核酸分子が、約500ヌクレオチド~約10
11ヌクレオチ
ドの長さを有する、請求項1
~3のいずれか1項に記載の装置。
【請求項5】
前記複合核酸分子が、約10
3
ヌクレオチド~約10
5
ヌクレオチドの長さを有する、請求項4に記載の装置。
【請求項6】
前記式(I)の核酸が、約35%~約65%のC+Gパーセンテージを有する、請求項1
~5のいずれか1項に記載の装置。
【請求項7】
前記式(I)の核酸が、1つ以上のRNAを符号
化しない、請求項1~
6のいずれか1項に記載の装置。
【請求項8】
前記式(I)の核酸が、1つ以上のmRNAを符号化しない、請求項7に記載の装置。
【請求項9】
前記式(I)の核酸が、1つ以上の開始コドンを含まず、かつ/または6つ全てのリーディングフレームにおいて約200ヌクレオチドあたり1つ以上の終止コドンを含む、請求項1~
8のいずれか1項に記載の装置。
【請求項10】
前記式(I)の核酸が、BamHI、BsaI、BbsI、EcoRI、FokI、およびI-SceIからなる群で選択される酵素またはそのアイソシゾマーに関する1つ以上の制限部位を含まない、請求項1~
9のいずれか1項に記載の装置。
【請求項11】
前記式(I)の核酸が、少なくとも4つの同一のヌクレオチドの1つ以上の反復を含まない、請求項1~
10のいずれか1項に記載の装置。
【請求項12】
前記[DB]核酸の各ヌクレオチドが、1または2ビットのデジタルデータを符号化する、請求項1~
11のいずれか1項に記載の装置。
【請求項13】
前記[UP]および[DO]核酸が、それぞれ、少なくとも1つのバーコード符号化核酸および/または少なくとも1つのメタデータ符号化核酸を含む、請求項1~
12のいずれか1項に記載の装置。
【請求項14】
デジタルデータを保存するための方法であって、
a)前記デジタルデータに、少なくとも1つの二本鎖のデジタルデータ符号化[DB]核酸配列(S
DB)および少なくとも1対の非デジタルデータ符号化[UP]および[DO]核酸配列(S
UP)および(S
DO)を割り当てるステップと、
b)配列(S
UP)、(S
DB)、および(S
DO)、それぞれから、式(Ia):
5’-([UP]-[DB]-[DO])-3’(Ia)
の少なくとも1つの核酸を合成するステップと、
c)式(Ia)の1つ以上の核酸をアセンブルして、式(I):
5’-([UP]-[DB]-[DO])x-3’(I)
(式中、xは、約1~約10
5を表す)
の核酸を含む二本鎖複製性複合核酸分子を得るステップと、
d)別個の配列の1~約10
9個の複合核酸分子を含み、ステップc)で得た式(I)の核酸を含む少なくとも1つのプールをストレージセルに保存するステップと
を含む、方法。
【請求項15】
e)ステップd)で得たプールを、1つのプール~約10
6のプー
ルを含む少なくとも1つのアレイに構築およびグループ化するステップをさらに含む、請求項
14に記載の方法。
【請求項16】
ステップe)が、ステップd)で得たプールを、1つのプール~約96または約384のプールを含む少なくとも1つのアレイに構築およびグループ化するステップを含む、請求項15に記載の方法。
【請求項17】
ステップc)で得た複合核酸分子が、プラスミド、コスミド、原核生物
の染色体、または真核生物
の染色体である、請求項
14~16のいずれか1項に記載の方法。
【請求項18】
c1)in vivoで、ステップc)で得た式(I)の核酸を含む少なくとも1つの複合核酸分子を増幅するステップと、
c2)ステップc1)で得た増幅された複合核酸分子を抽出および精製するステップと
をさらに含む、請求項
14~
17のいずれか1項に記載の方法。
【請求項19】
ステップc1)が、生
物によりin vivoで行われる、請求項
18に記載の方法。
【請求項20】
ステップc1)が、微生物によりin vivoで行われる、請求項19に記載の方法。
【請求項21】
請求項1~
13のいずれか1項に記載の装置により保存されたおよび/または請求項
14~
20のいずれか1項に記載の方法により保存されたデジタルデータを回収するための方法であって、
a)式(I)の核酸を含む二本鎖複製性複合核酸分子に含まれている式(Ia)の少なくとも1つの核酸をシーケンシングして、少なくとも1つの核酸配列(S
UP-S
DB-S
DO)を得るステップと、
b)少なくとも1つの核酸配列(S
DB)をデジタルデータに変換するステップと
を含み、
任意選択で、ステップa)の前に、式(Ia)の少なくとも1つの核酸を増幅するステップa0)が行われる、
方法。
【請求項22】
任意選択で、ステップa)の前に、式(Ia)の少なくとも1つの核酸を増幅するステップa0)が行われる、請求項21に記載の方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
【国際調査報告】