IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アジレント・テクノロジーズ・インクの特許一覧

特表2024-528094インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー
<>
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図1
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図2
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図3
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図4
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図5
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図6
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図7
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図8
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図9
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図10
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図11
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図12
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図13
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図14
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図15
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図16
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図17
  • 特表-インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-26
(54)【発明の名称】インデックスを付したスプリントオリゴを使用したライゲーションによる長い核酸のアセンブリー
(51)【国際特許分類】
   C12Q 1/6818 20180101AFI20240719BHJP
   C12N 15/11 20060101ALI20240719BHJP
   C12P 19/34 20060101ALI20240719BHJP
   C40B 40/06 20060101ALI20240719BHJP
   C12N 9/00 20060101ALN20240719BHJP
【FI】
C12Q1/6818 Z
C12N15/11 Z
C12P19/34 Z
C40B40/06
C12N9/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024505406
(86)(22)【出願日】2022-08-02
(85)【翻訳文提出日】2024-02-29
(86)【国際出願番号】 US2022039193
(87)【国際公開番号】W WO2023014728
(87)【国際公開日】2023-02-09
(31)【優先権主張番号】63/228,448
(32)【優先日】2021-08-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】399117121
【氏名又は名称】アジレント・テクノロジーズ・インク
【氏名又は名称原語表記】AGILENT TECHNOLOGIES, INC.
(74)【代理人】
【識別番号】100099623
【弁理士】
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100125380
【弁理士】
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【弁理士】
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【弁理士】
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100180231
【弁理士】
【氏名又は名称】水島 亜希子
(72)【発明者】
【氏名】タウシッグ,デイヴィッド
(72)【発明者】
【氏名】サンパス,ニコラス・エム.
【テーマコード(参考)】
4B063
4B064
【Fターム(参考)】
4B063QA20
4B063QQ42
4B063QQ52
4B063QR08
4B063QR20
4B063QR32
4B063QR35
4B063QR62
4B063QS25
4B063QS34
4B064AF27
4B064CA21
4B064CA36
4B064CB30
4B064CC01
4B064CC24
4B064CD15
4B064DA01
4B064DA13
(57)【要約】
本開示は、インデックスを付したスプリントオリゴヌクレオチド分子にハイブリダイズされたオリゴヌクレオチド分子を酵素によりライゲーションすることにより、長い核酸をアセンブルする方法に関する。開示されている方法の実施において有用な、インデックスを付したスプリントオリゴヌクレオチドを含むオリゴヌクレオチド構造も開示される。本発明のキットは、開示されているオリゴヌクレオチド構造を含む核酸ライブラリーを含む。オリゴヌクレオチドは、高度に特異的な順序で連接されて、最適な所望のライゲーション産物を構築する。
【特許請求の範囲】
【請求項1】
2個の核酸コンポーネントをアセンブルしてマルチコンポーネントライゲーション産物を産生するための方法であって、
(A)第1のDNA配列コンポーネントを含む第1の一本鎖オリゴヌクレオチドおよび第2のDNA配列コンポーネントを含む第2の一本鎖オリゴヌクレオチドを、インデックスを付したスプリントにハイブリダイズさせるステップであって、前記第1の一本鎖オリゴヌクレオチドの5’端および3’端の両方が、前記インデックスを付したスプリントにハイブリダイズされ、前記第2の一本鎖オリゴヌクレオチドの5’端および3’端の両方が、前記インデックスを付したスプリントにハイブリダイズされる、ステップと、
(B)前記第1の一本鎖オリゴヌクレオチドの3’端を前記第2の一本鎖オリゴヌクレオチドの5’端にライゲーションし、これにより、第1のマルチコンポーネントライゲーション産物を産生するステップと
を含む、方法。
【請求項2】
(a)前記インデックスを付したスプリントが、スプリント配列、ならびに前記スプリント配列にフランキングする第1のインデックス配列および第2のインデックス配列をさらに含み、
(b)前記スプリント配列が、前記第1の一本鎖オリゴヌクレオチドの3’端および前記第2の一本鎖オリゴヌクレオチドの5’端の両方にハイブリダイズし、
(c)前記第1のインデックス配列が、前記第1の一本鎖オリゴヌクレオチドの5’端にハイブリダイズして、第1の二本鎖インデックスエレメントを形成し、前記第2のインデックス配列が、前記第2の一本鎖オリゴヌクレオチドの3’端にハイブリダイズして、第2の二本鎖インデックスエレメントを形成する、請求項1に記載の方法。
【請求項3】
前記インデックスを付したスプリントの前記スプリント配列が、
(a)二本鎖5’スプリントエレメントを形成する、前記第2の一本鎖オリゴヌクレオチドの5’端にハイブリダイズする5’エレメントと、
(b)二本鎖3’スプリントエレメントを形成する、前記第1の一本鎖オリゴヌクレオチドの3’端にハイブリダイズする3’エレメントと
を含有し、前記スプリント配列の前記5’エレメントおよび前記3’エレメントが、接している、すなわち、介在するヌクレオチドがない、請求項2に記載の方法。
【請求項4】
(1)前記第1のインデックス配列が、前記インデックスを付したスプリントの3’端に位置し、
(2)前記第2のインデックス配列が、前記インデックスを付したスプリントの5’端に位置する、
請求項2または3に記載の方法。
【請求項5】
(a)前記第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)前記第1の一本鎖オリゴヌクレオチドの5’末端配列を含む第3のインデックス配列と、
(2)前記マルチコンポーネントライゲーション産物へとライゲーションされる前記第1のDNA配列コンポーネントであって、前記第1の一本鎖オリゴヌクレオチドの3’末端配列を含む前記第1のDNA配列コンポーネントと
を含み、
(b)前記第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)前記第2の一本鎖オリゴヌクレオチドの5’末端配列を含む前記マルチコンポーネントライゲーション産物へとライゲーションされる前記第2のDNA配列コンポーネントと、
(2)前記第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列と
を含み、
(c)前記インデックスを付したスプリントが、5’から3’の向きに、
(1)前記第2のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)前記スプリント配列であって、
前記スプリント配列の前記5’エレメントが、前記第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズし、
前記スプリント配列の前記3’エレメントが、前記第1の一本鎖オリゴヌクレオチドの3’末端配列にハイブリダイズする、前記スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)前記第1のインデックス配列である3’末端配列と
を含む、
請求項4に記載の方法。
【請求項6】
各スペーサー配列が独立して、1~30ヌクレオチドからなる、請求項5に記載の方法。
【請求項7】
(1)前記第1のインデックス配列が、前記インデックスを付したスプリントの5’端に位置し、
(2)前記第2のインデックス配列が、前記インデックスを付したスプリントの3’端に位置する、
請求項2または3に記載の方法。
【請求項8】
(a)前記第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)前記第1の一本鎖オリゴヌクレオチドの5’末端配列を含む第3のインデックス配列と、
(2)前記マルチコンポーネントライゲーション産物へとライゲーションされる第1のDNA配列コンポーネントであって、前記第1の一本鎖オリゴヌクレオチドの3’末端配列を含む第1のDNA配列コンポーネントと
を含み、
(b)前記第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)前記第2の一本鎖オリゴヌクレオチドの5’末端配列を含む前記マルチコンポーネントライゲーション産物へとライゲーションされる第2のDNA配列コンポーネントと、
(2)前記第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列と
を含み、
(c)前記インデックスを付したスプリントが、5’から3’の向きに、
(1)前記第1のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)前記スプリント配列であって、
前記スプリント配列の前記5’エレメントが、前記第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズし、
前記スプリント配列の前記3’エレメントが、前記第1の一本鎖オリゴヌクレオチドの3’末端配列にハイブリダイズする、前記スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)前記第2のインデックス配列である3’末端配列と
を含む、
請求項7に記載の方法。
【請求項9】
各スペーサー配列が独立して、1~30ヌクレオチドからなる、請求項7または8に記載の方法。
【請求項10】
各二本鎖インデックスエレメントが、10~40塩基対を含む、請求項2から9のいずれか1項に記載の方法。
【請求項11】
(C)前記マルチコンポーネントライゲーション産物から前記インデックスを付したスプリントを変性させるステップと、
その後、ステップ(A)、(B)および(C)を反復的に行うステップと
をさらに含む、請求項1から10のいずれか1項に記載の方法。
【請求項12】
前記第4のインデックス配列が、前記第2のDNA配列コンポーネントに除去可能に連結される、請求項5から11のいずれか1項に記載の方法。
【請求項13】
前記第2の一本鎖オリゴヌクレオチドが、前記第2のDNA配列コンポーネントに対して3’にあるIIs型制限酵素部位をさらに含み、前記制限酵素切断の部位が、前記第2のDNA配列コンポーネントの直接3’にある、請求項12に記載の方法。
【請求項14】
前記第4のインデックス配列が、切断可能なリンカーによって前記第2のDNA配列コンポーネントに連結され、前記切断の部位が、前記第2のDNA配列コンポーネントの直接3’にある、請求項12に記載の方法。
【請求項15】
前記第1のライゲーション産物における前記第2のDNAコンポーネントから前記第4のインデックス配列を除去するステップと、
前記第4のインデックス配列を有するさらに別の第2の一本鎖オリゴヌクレオチド、および第2のスプリント配列を含むさらに別のインデックスを付したスプリントを用意するステップと、
その後、ステップ(A)、(B)および(C)を行うステップと
をさらに含み、
前記第1のライゲーション産物が、ステップ(A)の前記第1の一本鎖オリゴヌクレオチドであり、
前記さらに別のインデックスを付したスプリントの前記第2のスプリント配列が、前記さらに別の第2の一本鎖オリゴヌクレオチドにおける5’末端配列にハイブリダイズする5’エレメント、および前記第1のライゲーション産物の3’末端配列にハイブリダイズする3’エレメントを含有する、請求項12から14のいずれか1項に記載の方法。
【請求項16】
前記インデックスを付したスプリントが、第5のインデックス配列に隣接する第2のスプリント配列をさらに含み、前記第2のスプリント配列の前記5’エレメントが、前記第2のDNA配列コンポーネントの前記3’末端配列にハイブリダイズすることができる、請求項12から14のいずれか1項に記載の方法。
【請求項17】
前記第3のインデックス配列が、前記第1のDNA配列コンポーネントに除去可能に連結される、請求項5から11のいずれか1項に記載の方法。
【請求項18】
前記第1の一本鎖オリゴヌクレオチドが、前記第1のDNA配列コンポーネントに対して5’にあるIIs型制限酵素部位をさらに含み、前記制限酵素切断の部位が、前記第1のDNA配列コンポーネントの直接5’にある、請求項17に記載の方法。
【請求項19】
前記第3のインデックス配列が、切断可能なリンカーによって前記第1のDNA配列コンポーネントに連結され、前記切断の部位が、前記第1のDNA配列コンポーネントの直接5’にある、請求項17に記載の方法。
【請求項20】
前記第1のライゲーション産物における前記第1のDNA配列コンポーネントから前記第3のインデックス配列を除去するステップと、
前記第3のインデックス配列を有するさらに別の第1の一本鎖オリゴヌクレオチド、およびさらに別のインデックスを付したスプリントを用意するステップと、
その後、ステップ(A)、(B)および(C)を行うステップと
をさらに含み、
前記第1のライゲーション産物が、ステップ(A)の前記第2の一本鎖オリゴヌクレオチドであり、
前記さらに別のインデックスを付したスプリントの前記スプリント配列が、前記さらに別の第1の一本鎖オリゴヌクレオチドにおける3’末端配列にハイブリダイズする3’エレメント、および前記第1のライゲーション産物における5’末端配列にハイブリダイズする5’エレメントを含有する、請求項17から19のいずれか1項に記載の方法。
【請求項21】
前記ハイブリダイズするステップが、前記インデックスエレメントの融解温度(Tm)に基づく温度の範囲で行われ、
前記ライゲーションするステップが、前記スプリント配列の前記5’および前記3’エレメントの融解温度(Tm)よりも高く、前記インデックスエレメントの融解温度(Tm)よりも低い温度で行われる、請求項1から20のいずれか1項に記載の方法。
【請求項22】
前記ライゲーションステップの温度が、約45°~70℃であり、リガーゼが熱安定性である、請求項1から21のいずれか1項に記載の方法。
【請求項23】
前記インデックスエレメントの融解温度が、約60°~90℃である、請求項1から22のいずれか1項に記載の方法。
【請求項24】
前記5’スプリントエレメントおよび前記3’スプリントエレメントの融解温度が、約20°~42℃である、請求項1から23のいずれか1項に記載の方法。
【請求項25】
2個の核酸コンポーネントをアセンブルしてマルチコンポーネントライゲーション産物を産生するためのオリゴヌクレオチド構造であって、第1の一本鎖オリゴヌクレオチドと、第2の一本鎖オリゴヌクレオチドと、インデックスを付したスプリントとを含み、前記第1の一本鎖オリゴヌクレオチドおよび前記第2の一本鎖オリゴヌクレオチドが、前記インデックスを付したスプリントに部分的にハイブリダイズされている、オリゴヌクレオチド構造。
【請求項26】
請求項25に記載のオリゴヌクレオチド構造をそれぞれ有する、オリゴヌクレオチド構造のセットまたはライブラリー。
【請求項27】
請求項25に記載のセットまたはライブラリーを含む、キット。
【請求項28】
DNAリガーゼをさらに含む、請求項27に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、その内容全体が引用することにより本明細書の一部をなすものとする、2021年8月2日に出願された米国特許仮出願第63/228,448号に基づく優先権の利益を主張する。
【0002】
本開示は、分子生物学の分野に関する。特に、本開示は、長い核酸、特に、長いDNAライブラリーを生成するための方法に関する。
【背景技術】
【0003】
DNAライブラリーは、生物学研究や創薬における広範囲の適用で使用される。現在、DNAライブラリーは、ほとんどの場合、固体表面における超並列様式で、または個々に化学合成されたオリゴヌクレオチド(「オリゴ」)をプールすることにより、オリゴの化学合成によって生成される。これらのアプローチの主要な限界の1つは、単鎖化学合成によって作製され得るDNA分子の長さである。最も長い市販のオリゴライブラリーは現在、350ヌクレオチドの最大の長さを有する。しかし、遺伝子合成、タンパク質工学、ゲノム工学および突然変異飽和スキャニング等、多くの研究適用は、より長いDNAライブラリーから利益を得るであろう。
【0004】
より長い長さのライブラリーを生成するアプローチの1つは、2個以上の化学合成されたオリゴをより長いコンストラクトとなるよう連接するDNAリガーゼの作用による、ライブラリーメンバーの酵素によるアセンブリーが関与する。本分野で知られている方法は、所定の順序で配列を連結するための配列の特異的なアニーリングを達成するために、特異的な二本鎖配列における一本鎖の適合性オーバーハングに頼る。例えば、米国特許第6,495,318号を参照されたい。この’318号特許は、各小片に相補的な領域を有する単一のスプリントオリゴにハイブリダイズされる末端一本鎖部分を有する2個の特異的配列も開示する。理想的な条件下で、オリゴは、スプリントに適切にハイブリダイズし、リガーゼは、2個の小片を連接して、より長いコンストラクトを形成する。これと同様の方法は現在、様々な研究グループによって用いられているが、成功は部分的なものである。この方法の主要な弱点は、不十分な品質のライブラリーを生じ得るハイブリダイゼーション特異性である。
【0005】
長いオリゴの酵素によるアセンブリーの代替方法は、ライゲーションに先立ちコンストラクトを空間的に隔離するための、固体表面DNAアレイへのライブラリー小片のハイブリダイゼーションが関与する。例えば、米国特許第10,538,796号を参照されたい。
【発明の概要】
【0006】
一部の態様では、本発明は、目的の配列に対する高い特異性を有する、溶液中で実施され得る方法の必要性に取り組む。
【図面の簡単な説明】
【0007】
図1図1は、オリゴヌクレオチドをマルチコンポーネントDNAコンストラクトへとアセンブルするためのオリゴヌクレオチド構造の一型を描写する。オリゴヌクレオチド構造は、各オリゴヌクレオチド小片に相補的な隣接配列領域を有する単一のスプリントオリゴヌクレオチド(スプリント)にハイブリダイズされた、2個のオリゴヌクレオチド小片(1は、上流アセンブリーコンポーネントであるアセンブリーコンポーネント1であり、2は、下流アセンブリーコンポーネントであるアセンブリーコンポーネント2である)からなる。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。意図されるライゲーションポイントは、アセンブリーコンポーネント1および2の接合部である。
図2図2は、オリゴヌクレオチドをマルチコンポーネントDNAコンストラクトへとアセンブルするためのオリゴヌクレオチド構造の別の型を描写する。オリゴヌクレオチド構造は、インデックスを付したスプリント構造にハイブリダイズされた、2個のオリゴヌクレオチド小片(アセンブリーコンポーネント1およびアセンブリーコンポーネント2)からなる。インデックスを付したスプリント構造は、スプリントオリゴヌクレオチドメンバーのペアを有する。ペアの各メンバーは、他方のメンバーの他方のインデックス配列にハイブリダイズして、二本鎖インデックスエレメント(インデックス)を形成し、よって、2個のアセンブリーコンポーネントを互いにごく近づけるための機能を果たす、インデックス配列を有する。一方のスプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1オリゴヌクレオチドに相補的なスプリント配列領域(L-スプリント)を有する。他方のスプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1の3’末端部分およびアセンブリーコンポーネント2オリゴヌクレオチドの5’末端部分に相補的なスプリント配列領域(R-スプリント)を有する。矢じりは、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。
図3図3は、オリゴヌクレオチドをマルチコンポーネントDNAコンストラクトへとアセンブルするためのオリゴヌクレオチド構造の別の型を描写する。オリゴヌクレオチド構造は、図2における構造と同様に、インデックスを付したスプリント構造にハイブリダイズされた、2個のオリゴヌクレオチド小片(アセンブリーコンポーネント1およびアセンブリーコンポーネント2)からなる。インデックスを付したスプリント構造は、スプリントオリゴヌクレオチドメンバーのペアを有する。ペアの各メンバーは、他方のメンバーの他方のインデックス配列にハイブリダイズして二本鎖インデックスエレメントを形成する、インデックス配列を有する。この構造において、スプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端の近位にない、アセンブリーコンポーネント1オリゴヌクレオチドにおける配列に相補的なスプリント配列領域(L-スプリント)を有し、アセンブリーコンポーネント1のループ状の部分をもたらす。他方のスプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1の3’末端部分およびアセンブリーコンポーネント2オリゴヌクレオチドの5’末端部分に相補的なスプリント配列領域(R-スプリント)を有する。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。
図4図4は、オリゴヌクレオチドをマルチコンポーネントDNAコンストラクトへとアセンブルするためのオリゴヌクレオチド構造の別の型を描写する。オリゴヌクレオチド構造は、単一のインデックスを付したスプリント分子にハイブリダイズされた、2個のオリゴヌクレオチド小片(アセンブリーコンポーネント1およびアセンブリーコンポーネント2)からなる。この構造において、アセンブリーコンポーネント1オリゴヌクレオチドは、アセンブリー配列に対して5’にある5’インデックス配列を有する。インデックス配列は、インデックスを付したスプリント分子のインデックス配列にハイブリダイズして、二本鎖インデックスエレメントを形成する。スプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端におけるアセンブリーコンポーネント1オリゴヌクレオチドにおける配列およびアセンブリーコンポーネント2オリゴヌクレオチドの5’末端部分に相補的な配列領域(R-スプリント)を有し、アセンブリーコンポーネント1のループ部をもたらす(若干図3と同様)。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。
図5図5A図5Cは、オリゴヌクレオチドをマルチコンポーネントDNAコンストラクトへとアセンブルするためのオリゴヌクレオチド構造の別の型を描写する。オリゴヌクレオチド構造は、2個のオリゴヌクレオチド小片(アセンブリーコンポーネント1およびアセンブリーコンポーネント2)にハイブリダイズされる、インデックスを付したスプリント分子(図5Aに描写)を含む。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。点線は、任意選択的なスペーサー配列を表す。図5Aに示す通り、オリゴヌクレオチド構造のこの型において、インデックスを付したスプリント分子は、スプリント配列(スプリント)ならびに2個のインデックス配列AおよびB(インデックス配列Bおよびインデックス配列A)を含む。インデックスを付したスプリント分子の2個のインデックス配列は、介在するスペーサー配列スペーサー1およびスペーサー2(点線)と共に、スプリント配列を挟む。スプリント配列は、スプリントの拡大に描写される通り、5’エレメントおよび3’エレメントを有する。スプリント配列の5’エレメントは、アセンブリーコンポーネント2オリゴヌクレオチドの5’端にハイブリダイズする。スプリント配列の3’エレメントは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端にハイブリダイズする。インデックスを付したスプリント分子の一方のインデックス配列は、一方のアセンブリーコンポーネントオリゴヌクレオチドの末端におけるインデックス配列にハイブリダイズする。インデックスを付したスプリント分子の他方のインデックス配列は、他方のアセンブリーコンポーネントオリゴヌクレオチドの末端におけるインデックス配列にハイブリダイズする。図5Aおよび図5Bは、オリゴヌクレオチド構造における2個のアセンブリーコンポーネントに結合するインデックスを付したスプリント分子について、2種の例示的な方向性を図示する。図5Bは、二本鎖インデックスエレメント(インデックス2)が、アセンブリーコンポーネント2の3’端におけるインデックス配列へのインデックス配列A(インデックスを付したスプリント分子の5’端におけるインデックス配列)のハイブリダイゼーションによって形成される、方向性を描写する。二本鎖インデックスエレメント(インデックス1)は、アセンブリーコンポーネント1の5’端におけるインデックス配列にハイブリダイズされたインデックス配列B(インデックスを付したスプリント分子の3’端におけるインデックス配列)によって形成される。スプリント配列の5’エレメントは、アセンブリーコンポーネント2オリゴヌクレオチドの5’端にハイブリダイズする。スプリント配列の3’エレメントは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端にハイブリダイズする。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。図5Cは、二本鎖インデックスエレメント(インデックス1)が、アセンブリーコンポーネント1の5’端におけるインデックス配列(セグメントC)へのインデックス配列A(インデックスを付したスプリント分子の5’端におけるインデックス配列)のハイブリダイゼーションによって形成される、第2の方向性を描写する。二本鎖インデックスエレメント(インデックス2)は、アセンブリーコンポーネント1の3’端におけるインデックス配列(セグメントF)にハイブリダイズされたインデックス配列B(インデックスを付したスプリント分子の3’端におけるインデックス配列)によって形成される。スプリント配列の5’エレメントは、アセンブリーコンポーネント2オリゴヌクレオチドの5’端にハイブリダイズする。スプリント配列の3’エレメントは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端にハイブリダイズする。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。
図6図6は、図2の変種を図示するものであり、図中、オリゴヌクレオチド構造は、スプリントにハイブリダイズしないアセンブリー配列の領域にハイブリダイズされ得る少なくとも1個のブロッキングオリゴヌクレオチド(例えば、ブロッカー1)を含む。2個のブロッキングオリゴヌクレオチド(ブロッカー1およびブロッカー2)が図6に描写されている。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。意図されるライゲーションポイントは、アセンブリーコンポーネントの接合部である。1個または複数のブロッキングヌクレオチドが図5Bおよび図5Cのオリゴヌクレオチド構造において利用され得る。
図7図7は、4パートアセンブリープロセスの第1のライゲーションステップにおいてライゲーションされることになる2種のオリゴヌクレオチド構造を描写する。(図8および図9も参照)。第1のライゲーションステップは、2パートアセンブリーと同様の機構で別々の反応において、アセンブリーコンポーネント1+2(上部構造)およびアセンブリーコンポーネント3+4(下部構造)をアセンブルする。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。各オリゴヌクレオチド構造における意図されるライゲーションポイントが指し示されている。第1のスプリント構造(スプリント1)に加えて、上部オリゴヌクレオチド構造のインデックスを付したスプリントは、スペーサーセクションに第2のスプリント配列(スプリント2)を、ならびに5’インデックス配列(インデックス2)および第1のスプリント構造(スプリント1)の間に別のインデックス配列(インデックス3)を含む。下部オリゴヌクレオチド構造のインデックスを付したスプリントは、第1のスプリント構造(スプリント3)および5’インデックス配列(インデックス4)の間にインデックス3の相補的配列(インデックス3相補体)を含む。
図8図8は、4パートアセンブリープロセスの次のステップを描写する。図7に描写されるアセンブリーステップのライゲーション産物は、図8に図示されている。ライゲーションは、2個のマルチコンポーネントライゲーション産物である、アセンブルされた産物(1-2)((a)に描写)およびアセンブルされた産物(3-4)((c)に描写)を生じる。インデックス配列と、アセンブルされた産物(1-2)およびアセンブルされた産物(3-4)のためのアセンブリーコンポーネントとの間に位置するIIS型制限酵素切断部位(REカット部位)も描写されている。図7に描写されるアセンブリーステップのライゲーション産物はそれぞれ、IIS型制限酵素による消化に付されて、RE切断部位(図7には示されていない)で切断する。(a)におけるライゲーション産物において、(b)に図示される通り、切断は、インデックス2を除去し、アセンブルされた産物(1-2)における3’端にアセンブリーコンポーネント配列のみを残す。(c)におけるライゲーション産物において、(d)に図示される通り、切断は、インデックス4を除去し、アセンブルされた産物(3-4)における5’端にアセンブリーコンポーネント配列のみを残す。その結果生じる産物は、例えば、SPRI精製によって精製される。
図9図9は、4パートアセンブリープロセスの第2のライゲーションステップを描写する。次に、制限消化の精製された産物(図8における(b)および(d)を参照)は、模式像において描写される通りに一体にハイブリダイズされ(インデックス3を参照)、ライゲーションされて、アセンブルされた産物を産生する(1-2-3-4)。この産物は、例えば、SPRIによって精製し、追加のライゲーションに付すかまたはPCRにより増幅することができる。例えば、プライマー配列が、インデックス1およびアセンブリーコンポーネント1のアセンブリー配列の間(フォワードプライマー)ならびにインデックス5およびアセンブリーコンポーネント4のアセンブリー配列の間(リバースプライマー)に存在してもよい。
図10図10は、開示されている方法のバリアント態様を模式的に図示する。図10は、2個のアセンブリーコンポーネントのインデックス配列が、2個のインデックス配列にハイブリダイズする単一のスプリント(「インデックススプリント」)にハイブリダイズされて、二本鎖インデックス1およびインデックス2を形成する、オリゴヌクレオチド構造を図示する。
図11図11は、開示されている方法のバリアント態様を模式的に図示する。図11は、図10のオリゴヌクレオチド構造のライゲーション産物を描写する。図11は、インデックススプリントが、固体支持体またはインデックスを付したアレイへの取付けのためにビオチン化されている、任意選択的な態様も図示する。
図12図12は、開示されている方法のバリアント態様を模式的に図示する。図12Aおよび図12Bは、第2のスプリント分子(「コンストラクトスプリント」)が、アセンブリーコンポーネントの3’および5’端にハイブリダイズしている、オリゴヌクレオチド構造を描写する。図12Aは、インデックスを付したスプリントが、スペーサー(「任意選択的な繋留」)を介してコンストラクトスプリントに連結されている、オリゴヌクレオチド構造を描写する。これは、5’から3’の向きに、第1のインデックス配列(オリゴ1の5’端におけるインデックスに結合して、インデックス1を形成する);第2のインデックス配列(オリゴ2の3’端におけるインデックスに結合して、インデックス2を形成する);スペーサー(任意選択的な繋留);5’エレメントがオリゴ2の5’端にハイブリダイズし、3’エレメントがオリゴ鎖1の3’端にハイブリダイズする、スプリントを含む、請求されるインデックススプリント分子の別の実施形態を表す。図12Bは、インデックススプリントに連結されていない第2のスプリント分子(「コンストラクトスプリント」)が、アセンブリーコンポーネントの3’および5’端にハイブリダイズされている、オリゴヌクレオチド構造を描写する。インデックススプリントが、固体支持体またはインデックスを付したアレイへの取付けのためにビオチン化されている、任意選択的な態様も描写される。
図13図13は、開示されている方法のバリアント態様を模式的に図示する。図13は、図12Bのライゲーション産物を示す。図13は、ライゲーション産物のアセンブリーコンポーネントに関する任意選択的な追加の構造特色も示す。任意選択的な制限酵素部位が、インデックススプリントの5’端において描写される。PBS1およびBPS1は、アセンブリー産物の増幅に有用な(任意選択的な)プライマー結合部位を表す。
図14図14は、図1図2および図3に図示されるオリゴヌクレオチド構造(それぞれ、アセンブリーコンポーネント1およびアセンブリーコンポーネント2をさらに含む)に描写される通りの3つの型の検査スプリント分子を使用した、低相同性ライブラリーの溶液アセンブリーを評価する実験に関するデータのグラフを描写する。検査スプリント分子の型毎に、スプリント対コンストラクトの3つの比を検査した(1:1、2:1および4:1)。図2および図3の検査スプリント分子は、3ヌクレオチド(nt)支柱あり(+)およびなし(-)で調製した。アセンブルされたコンストラクトは、PCR増幅されたアセンブルされたコンストラクトの次世代配列決定(NGS)によって特徴付けした。グラフにおけるY軸は、15セットのそれぞれにおける正しくアセンブルされたコンストラクトに関するリードの平均数である。さらなる情報については実施例1を参照されたい。
図15図15は、図5Bの検査スプリント分子の模式図(上部パネル)および概念実証実験から得たデータ(下部パネル)を描写する。矢印は、オリゴヌクレオチドの3’端を指し示し;平らな端は、オリゴヌクレオチドの5’端である。プライマーF - PCRのためのフォワードプライマーの位置。プライマーR - PCRのためのリバースプライマーの位置。Tmは、左および右コンストラクトオリゴヌクレオチド(それぞれアセンブリーコンポーネント1およびアセンブリーコンポーネント2)にハイブリダイズされるスプリントの各セクションの融解温度(すなわち、5’エレメントおよび3’エレメントの融解温度)である。BC1およびBC2は、ペア形成したバーコード配列のポジションを指し示す。インデックス1およびインデックス2は、オリゴヌクレオチド構造におけるインデックスエレメントを指し示す。インデックスを付したスプリント分子のインデックス配列およびスプリント配列の間の点線は、この検査では20塩基ポリTヌクレオチド配列であるスペーサー配列を指し示す。さらなる情報については実施例2を参照されたい。
図16図16は、3つの型の代表的なオリゴライブラリーを模式的に図示する。塗りつぶされたボックスは、アセンブルされたコンストラクトを挟む特有のバーコードを表す。
図17図17は、3つの型の代表的なオリゴライブラリー(図16を参照)における3つの型の検査スプリント分子(図1図2および図5Bのオリゴヌクレオチド構造を参照)を利用したアセンブリーの検査に関する代表的なデータを描写する。さらなる情報については実施例3を参照されたい。
図18図18は、検査スプリント分子(図5Bのオリゴヌクレオチド構造)の模式図、ならびに異なるスプリント長さおよびライゲーション温度で検査スプリント分子を使用したアセンブリーに関する代表的なデータを描写する。実験において、スプリント対コンストラクトのハイブリダイズしたエレメント(5’エレメントおよび3’エレメント)のそれぞれの融解温度(Tm)の範囲を設計し、8種の異なる温度におけるライゲーションを検査した。65.9℃ライゲーションデータのリード数値の中央値の数に関するデータが、グラフに描写されている。スプリント温度毎に、正しいリードおよび間違ったリードの割合が、リード数値の中央値で表されている。さらなる情報については実施例4を参照されたい。
【発明を実施するための形態】
【0008】
図面または本明細書のいずれかにおける「ハーフ」の使用、例えば、「ハーフコンストラクト左」は、限定を意図するものではない。例えば、「ハーフコンストラクト左」および「ハーフコンストラクト右」は、アセンブリーコンポーネント1およびアセンブリーコンポーネント2が同じ長さであることを指し示すと意図するものではない。アセンブリーコンポーネントは、サイズが異なりうる。この文脈において、「ハーフ」は、「部分」、「パート」または「オリゴヌクレオチド分子」に匹敵する。
【0009】
詳細な説明
本開示は、とりわけ、インデックスを付したスプリントオリゴヌクレオチド分子にハイブリダイズされたオリゴヌクレオチドを酵素によりライゲーションすることにより、溶液中で長いDNAライブラリーを生成するための方法に関係する。態様では、オリゴヌクレオチドは、化学合成される。方法は一般に、より短いコンポーネントをライゲーションすることにより、DNAまたはRNAを含む長い核酸の産生に有用である。
【0010】
A.定義
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈上明らかに別段の指示がない限り、複数形の指示対象を含む。
【0011】
本明細書で使用される場合、用語「核酸アセンブリー」は、少なくとも2個の核酸断片もしくはオリゴヌクレオチドを特異的な順序で一体に物理的に連接して、所望の核酸配列(マルチコンポーネントコンストラクト)を創出する方法、またはこのプロセスの結果生じる核酸を指す。断片またはオリゴヌクレオチドのそれぞれは、「アセンブリーコンポーネント」(時に口語的に、「ハーフコンストラクト」と本明細書で称される)である。2個のアセンブリーコンポーネントが連接される場合、上流コンポーネントが「上流アセンブリーコンポーネント」(またはアセンブリーコンポーネント1または左ハーフコンストラクトまたはハーフコンストラクト左)であり、下流コンポーネントが「下流アセンブリーコンポーネント」(またはアセンブリーコンポーネント2または右ハーフコンストラクトまたはハーフコンストラクト右)である。上流アセンブリーコンポーネント(アセンブリーコンポーネント1)の3’端は、下流アセンブリーコンポーネント(アセンブリーコンポーネント2)の5’端と連接される。アセンブリーコンポーネントは、アセンブリー配列および少なくとも1個の非アセンブリー配列を含む。「アセンブリー配列」は、最終マルチコンポーネントコンストラクトに含まれる目的の配列である。非アセンブリー配列は、インデックス配列、プライマー配列、制限酵素配列、バーコード配列その他等、アセンブリーの方法に関係する配列を指す。
【0012】
本明細書で使用される場合、用語「5’末端配列」は、核酸の5’末端を含むオリゴヌクレオチド配列を指す。本明細書で使用される場合、用語「3’末端配列」は、核酸の3’末端を含むオリゴヌクレオチド配列を指す。末端配列は、2個以上の連続したヌクレオチド、3個以上の、5個以上のもしくは10個以上の連続したヌクレオチド、30個以上の連続したヌクレオチド、50個以上の連続したヌクレオチド、または100個以上の連続したヌクレオチドを含有することができる。3’または5’「実質的に末端配列」は、3’または5’末端の近位にあるがそれを含まない配列を指す。例えば、3’または5’実質的に末端配列の3’または5’端は、それぞれ3’または5’末端ヌクレオチドの約100ヌクレオチド以内、約50ヌクレオチド以内、約30ヌクレオチド以内、約25ヌクレオチド以内、約20ヌクレオチド以内、約15ヌクレオチド以内、約10ヌクレオチド以内、約5ヌクレオチド以内、約4ヌクレオチド以内、約3ヌクレオチド以内、約2ヌクレオチド以内または1ヌクレオチド以内となることができる。
【0013】
用語「核酸」、「ポリヌクレオチド」または「オリゴヌクレオチド」は、DNA分子、RNA分子、またはそれらのアナログを指す。本明細書で使用される場合、用語「核酸」、「ポリヌクレオチド」および「オリゴヌクレオチド」は、DNA分子、例えば、cDNA、ゲノムDNAまたは合成DNA、およびRNA分子、例えば、ガイドRNA、メッセンジャーRNAまたは合成RNAを含むがこれらに限定されない。さらに、本明細書で使用される場合、この用語は、一本鎖および二本鎖形態を含む。
【0014】
用語「ハイブリダイゼーション」または「ハイブリダイズすること」は、完全にまたは部分的に相補的なポリヌクレオチド鎖同士が、適したハイブリダイゼーション条件下で一体になって、2本の構成鎖が水素結合によって連接された二本鎖構造または領域を形成するプロセスを指す。本明細書で使用される場合、用語「部分的ハイブリダイゼーション」は、二本鎖構造または領域が、1個または複数のバルジまたはミスマッチを含有する場合を含む。水素結合は典型的に、アデニンとチミンまたはアデニンとウラシル(それぞれAとTまたはAとU)またはシトシンとグアニン(CとG)の間に形成されるが、他の非正準的塩基対が形成される場合もある(例えば、Adams et al., “The Biochemistry of the Nucleic Acids,” 11th ed., 1992を参照)。修飾ヌクレオチドが、非正準的な仕方でのハイブリダイゼーションを可能にするまたは促進する水素結合を形成することができることが考慮される。
【0015】
本明細書で使用される場合、配列の「部分」、「セグメント」、「エレメント」または「断片」という用語は、完全な配列よりも小さい、配列のいずれかの部分(例えば、ヌクレオチド部分配列またはアミノ酸部分配列)を指す。ポリヌクレオチドの部分、セグメント、エレメントまたは断片は、2個以上、例えば、少なくとも5、10、15、20、25、30、40、50、75、100、150、200、300または500個以上のヌクレオチドの長さである、いずれかの長さのものとなることができる。
【0016】
本明細書で使用される場合、用語「インデックスを付したスプリント」は、(1)少なくとも1個の標的配列にハイブリダイズすることができるスプリント配列、および(2)標的分子におけるインデックス配列にハイブリダイズすることができるインデックス配列を含むオリゴヌクレオチドを指す。例えば、図5Aを参照されたい。「標的」は、アセンブリーコンポーネントである。典型的には、インデックスを付したスプリントは、マルチコンポーネントコンストラクトへの2個の標的のライゲーションを容易にするために、2個の標的にハイブリダイズするように設計される。例えば、図5Bを参照されたい。その目的のために、スプリント配列は典型的に、両方の標的にハイブリダイズし、一方の標的の3’端および他方の標的の5’端を近づける。標的におけるインデックス配列は、インデックスを付したスプリントにおけるインデックス配列にハイブリダイズする目的で標的に付加された余分な配列である。
【0017】
本明細書で使用される場合、用語「インデックスを付したスプリント特異的な順序のライゲーション」は、実質的に一本鎖断片が、リガーゼを使用して互いにライゲーションされて、マルチコンポーネント核酸ライゲーション産物を産生するプロトコールを指し、この場合、ライゲーション産物における断片の順序は、ライゲーションされる2個の断片の3’末端配列および5’末端配列にハイブリダイズするスプリントを含むインデックスを付したスプリント分子によって方向付けられる。「実質的に一本鎖断片」は、インデックスを付したスプリント分子におけるスプリント配列にハイブリダイズされた3’もしくは5’末端配列、および/またはインデックスを付したスプリント分子におけるインデックス配列にハイブリダイズされた3’もしくは5’末端インデックス配列(または3’もしくは5’の実質的に末端インデックス配列)等、部分的二本鎖部分を含む断片を指す。
【0018】
「インデックスエレメント」は、互いの逆相補体である配列を有する2本の鎖によって形成された(で構成された)二本鎖DNAセグメントを指す。「インデックス配列」は、互いの逆相補体であり、互いへのハイブリダイゼーションによってインデックスエレメントを形成する、配列の2本の鎖の一方である配列を指す。一部の実施形態では、インデックス配列は、パリンドローム型ではない(例えば、ステムループも他の二次構造もない)。単一のインデックスを付したスプリントにおける2個のインデックス配列は、互いにハイブリダイズしない。
【0019】
本開示の方法および産物は、少なくとも一部には、図5、パネルAに模式的に描写される通りのインデックスを付したスプリント分子の利用が、オリゴヌクレオチドライブラリーにおけるマルチコンポーネントコンストラクトの改善されたアセンブリーをもたらすという予想外の発見に基づく。ライゲーションされるアセンブリーコンポーネントの各ペアが、アセンブリーコンポーネントのペアに特異的なスプリント配列およびインデックス配列を有する対応するインデックスを付したスプリント分子を有する、インデックスを付したスプリント特異的な順序のライゲーションを使用することにより、相同オリゴライブラリー(オリゴが相当な程度の配列相同性を共有するオリゴライブラリー)における場合であっても、オリゴヌクレオチドライブラリーにおける複数の正しいコンストラクトのアセンブリーが可能となる。インデックスを付したスプリント分子のインデックス配列は、コンストラクト配列の一部ではなく、よって、ライブラリーメンバー間の相同性によって影響されない。これは、マルチプレックスアセンブリーの以前のハイスループット方法を上回る予想外の利益および改善である。
【0020】
本明細書で使用される場合、「一本鎖オリゴヌクレオチドの混合物」は、その中に溶解された複数の異なる一本鎖オリゴヌクレオチドを含有する水溶液を指す。混合物は、50~例えば50,000の間のいずれかの値を含む、少なくとも50、少なくとも100、少なくとも500、少なくとも1,000、少なくとも5,000、少なくとも10,000または少なくとも50,000種以上のオリゴヌクレオチドを含むことができる。オリゴヌクレオチドの混合物は、in situでオリゴヌクレオチドを合成する、すなわち、アレイにおいて適所にオリゴヌクレオチドを合成し、次いで、合成された後にアレイの表面からオリゴヌクレオチドを切断することにより作製することができる。例えば、Geary et al.(Nature Methods 2004 1: 241-248)およびLeProust et al.(Nucleic Acids Research 2010 38: 2522-2540)を参照されたい。
【0021】
用語「オリゴヌクレオチド」は、本明細書で使用される場合、ヌクレオチドの多量体を表示する。例えば、オリゴヌクレオチドは、約2~約200ヌクレオチド、最大で約50ヌクレオチド、最大で約100ヌクレオチド、最大で約500ヌクレオチドの長さ、または2~500の間のいずれかの整数値のヌクレオチド数を有することができる。一部の実施形態では、オリゴヌクレオチドは、30~300ヌクレオチドの長さまたは30~400ヌクレオチドの長さの範囲内となることができる。オリゴヌクレオチドは、リボヌクレオチド単量体(すなわち、オリゴリボヌクレオチドとなることができる)および/またはデオキシリボヌクレオチド単量体を含有することができる。オリゴヌクレオチドは、例えば、10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150、150~200、200~250、250~300、300~350または350~400ヌクレオチドの長さ、およびこれらの範囲の間のいずれかの整数値となることができる。
【0022】
本明細書で使用される場合、用語「マルチコンポーネントライゲーション産物を産生するためにアセンブルされ得る一本鎖オリゴヌクレオチドのセット」およびその文法上の均等物は、定義された順序で、オリゴヌクレオチドのそれぞれに由来する配列を含有する「マルチコンポーネントコンストラクト」または「マルチコンポーネントライゲーション産物」と本明細書で称されるより長い配列へと酵素によりアセンブルされ得る、オリゴヌクレオチドのセットを指す。本開示から理解される通り、セットの一本鎖オリゴヌクレオチドは、(i)インデックスを付したスプリント分子における相補的配列にハイブリダイズして二本鎖インデックスエレメントを形成するインデックス配列である、3’または5’末端(または実質的に末端)配列、および(ii)インデックスを付したスプリント分子におけるスプリント配列にハイブリダイズする5’または3’末端配列を含むアセンブリー配列を含有することができる。「アセンブリー配列」は、最終コンストラクトに含まれる目的の配列であり、インデックス配列、プライマー配列、制限酵素配列、バーコード配列その他等、アセンブリーの方法に関係する配列を含まない。
【0023】
本明細書で開示される場合、値の多数の範囲が提供される。当該範囲の上限および下限の間に介在する値のそれぞれもまた、特に考慮されることが理解される。記述される範囲によって包含されるより小さい範囲または介在する値のそれぞれもまた、特に考慮される。用語「約」は一般に、指し示される数のプラスマイナス10%を指す。例えば、「約10%」は、9%~11%の範囲を指し示すことができ、「約20」は、18~22を意味することができる。「約」の他の意義は、四捨五入すること等、文脈から明らかとなることができるため、例えば、「約1」は、0.5~1.4を意味することもできる。
【0024】
用語の他の定義は、本明細書を通して現れる可能性がある。
【0025】
B.方法および産物の記載
所望のコンストラクトを形成するための酵素によるライゲーションのための特異的オリゴヌクレオチドをアセンブルするための一方法が、図1に描写されている。図1は、ライゲーションされる2個のオリゴヌクレオチドを描写しており、そのうち一方は、上流オリゴヌクレオチド(「アセンブリーコンポーネント1」)であり、もう一方は、下流オリゴヌクレオチド(「アセンブリーコンポーネント2」)である。上流コンストラクトオリゴヌクレオチドは、ライゲーションポイントの上流(5’から3’への基盤で)にあり、下流コンストラクトオリゴヌクレオチドは、ライゲーションポイントの下流にある。上流および下流コンストラクトオリゴヌクレオチドは、単一のスプリントオリゴヌクレオチドにハイブリダイズされる。スプリントオリゴヌクレオチドは、相補的配列の2個の領域を有し、そのうち一方は、上流コンストラクトオリゴヌクレオチドにハイブリダイズし、他方は、下流コンストラクトオリゴヌクレオチドにハイブリダイズし、これにより、左コンストラクトの3’端が、右コンストラクトの5’端に直接隣接して、意図されるライゲーション部位を形成する。ハイブリダイゼーション条件下で、2個のアセンブリーコンポーネントは、単一のスプリントオリゴヌクレオチドにハイブリダイズし、リガーゼは、2個の小片を連接して、より長いマルチコンポーネントコンストラクトを形成する。
【0026】
一部の実施形態では、開示されている方法は、ライゲーションのためのアセンブリーコンポーネントをアセンブルするための、スプリント領域ならびに2個のインデックス配列AおよびBを含むインデックスを付したスプリント分子(例えば、図5Aを参照)を用いる。インデックスを付したスプリント分子の2個のインデックス配列は、介在するスペーサー配列(点線)と共に、スプリント配列を挟む。スプリント領域は、スプリントの拡大に描写される通り、5’エレメントおよび3’エレメントを有する。スプリント配列の5’エレメントは、アセンブリーコンポーネント2オリゴヌクレオチドの5’端にハイブリダイズする(例えば、図5Bを参照)。スプリント配列の3’エレメントは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端にハイブリダイズする。一部の態様では、インデックス配列AおよびBは、パリンドローム型ではなく(例えば、ステムループも他の二次構造もない)、また、互いにハイブリダイズすることもない。インデックスを付したスプリント分子の一方のインデックス配列は、一方のハーフコンストラクトの末端においてインデックス配列にハイブリダイズする。インデックスを付したスプリント分子の他方のインデックス配列は、他方のハーフコンストラクトの末端におけるインデックス配列にハイブリダイズする。よって、両者が2個のハーフコンストラクトにハイブリダイズするスプリント配列およびインデックス配列により、インデックスを付したスプリントは、2個のハーフコンストラクトを近づけ、これらをライゲーションのためのポジションにおいて整列する。
【0027】
インデックス配列は、目的の配列の一部ではない。これらは、両方のアセンブリーコンポーネントの端に付加された余分な配列である。そのようなものとして、特に、複数の異なるアセンブリーコンポーネントが、同じ反応においてライゲーションされる場合(すなわち、マルチプレックス)、これらは、可能な限り反応混合物における他の配列とは異なるものとして設計され、よって、アセンブリーコンポーネントの意図されないペアの機会を低減させることができる。
【0028】
スプリントの3’エレメントおよび5’エレメントはそれぞれ、約5~20ヌクレオチドの長さであり、任意選択的に、インデックスエレメントの融解温度に満たない融解温度を有する。一部の実施形態では、2個のアセンブリーコンポーネントの意図されないペア形成を実質的に低減または排除するために、スプリントエレメントは、単独では(すなわち、インデックスエレメントの非存在下では)、反応条件下でのハイブリダイゼーションを駆動するのに十分となるべきではないが、アセンブリーコンポーネントが、2個のアセンブリーコンポーネントへのインデックスを付したスプリントのインデックス配列のハイブリダイゼーションにより適所に保持された場合、単に一過的にハイブリダイズするであろう。これは、反応におけるアセンブリーコンポーネントが、相当な程度の相同性(例えば、相同オリゴライブラリー)を共有する場合に特に重要である。
【0029】
図5Bおよび図5Cに図示される通り、オリゴヌクレオチド構造における2個のアセンブリーコンポーネントに結合するインデックスを付したスプリント分子について、2種の例示的な方向性が存在する。
【0030】
図5Bは、インデックス配列A(インデックスを付したスプリント分子の5’端におけるインデックス配列)が、アセンブリーコンポーネント2の3’端におけるインデックス配列にハイブリダイズし、二本鎖インデックスエレメント(インデックス2)を形成する方向性を描写する。インデックス配列B(インデックスを付したスプリント分子の3’端におけるインデックス配列)は、アセンブリーコンポーネント1の5’端におけるインデックス配列にハイブリダイズし、二本鎖インデックスエレメント(インデックス1)を形成する。
【0031】
図5Cは、インデックス配列A(インデックスを付したスプリント分子の5’端におけるインデックス配列)が、アセンブリーコンポーネント1の5’においてインデックス配列にハイブリダイズし、二本鎖インデックスエレメント(インデックス2)を形成する第2の方向性を描写する。インデックス配列B(インデックスを付したスプリント分子の3’端におけるインデックス配列)は、アセンブリーコンポーネント2の3’においてインデックス配列にハイブリダイズし、二本鎖インデックスエレメント(インデックス1)を形成する。インデックスを付したスプリント分子が、アセンブリーコンポーネント2オリゴヌクレオチドの5’端にハイブリダイズするスプリントの5’エレメント、およびアセンブリーコンポーネント1オリゴヌクレオチドの3’端にハイブリダイズするスプリント配列の3’エレメント結合を収容するために、180°のねじれで図示されていることに留意されたい。ねじれは、単なる図示目的であり、限定を意図するものではない。
【0032】
マルチコンポーネントコンストラクトへのポリヌクレオチドのアセンブリーにおける、本発明の例示的な利点および際立った特色は、次のものを含む。本発明は、アセンブリー方法のためにアレイまたは固体支持体を要求しない。本方法を使用して、一本鎖オリゴヌクレオチドをアセンブルすることができる。一態様では、本方法は、合成オリゴヌクレオチドを使用して実行される。一態様では、本方法は、一本鎖オリゴヌクレオチドの混合物を含むオリゴヌクレオチドライブラリーを使用して実行される。混合物は、少なくとも50、少なくとも100、少なくとも500、少なくとも1,000、少なくとも5,000、少なくとも10,000または少なくとも50,000種以上のオリゴヌクレオチドを含むことができる。その上、態様では、本方法は、II型制限(すなわち、断片連接の部位に「傷跡がない」)のように、次のサイクルの前に非アセンブリー配列がきれいに除去され得る反復的プロセスとして行うことができる。本方法を利用して、複合ライブラリー、低相同性ライブラリーおよび高相同性ライブラリー、例えば、僅かな変種を除いて実質的に同一の配列を有するライブラリーをアセンブルすることができる。
【0033】
インデックスを付したスプリントは、他の様式で使用することができる。図2に示される一変種では、意図されるコンストラクトの左および右ハーフを表す2個のオリゴヌクレオチドは、スプリントオリゴヌクレオチドメンバーのペアにハイブリダイズされる。スプリントオリゴヌクレオチドメンバーのペアの各メンバーは、ペアの他のメンバーにおけるインデックス配列の逆相補体であり、よって、互いにハイブリダイズし、インデックスエレメント(図2において「インデックス」と標識)と本明細書で称される二本鎖DNA部分を形成することができるインデックス配列をさらに含有する。2個のインデックス配列は、2個のアセンブリーコンポーネントを一体にするように間接的に機能を果たす。インデックス配列は、アセンブリー配列それ自体の一部ではない。図2において、右インデックスを付したスプリントは、左コンストラクトオリゴヌクレオチドの3’端に相同なスプリント配列(R-スプリント)、および右コンストラクトオリゴヌクレオチドの5’端に相同なセクションを含有する。図2において、R-スプリントは、約10ヌクレオチド(nt)を含有するが、これは、例えば、約5nt~約20ntの範囲に及び得る。
【0034】
全てのスプリント配列が、標的の末端配列にハイブリダイズする必要はない。インデックスを付したスプリントの別の変種が、図3に図示されている。このオリゴヌクレオチド構造は、図2のオリゴヌクレオチド構造のバリアントである。本発明者らは、この構造が、設計されたアセンブリーコンポーネントの5’端を欠如するトランケートされた合成産物によって引き起こされる干渉を低減または排除することができると考慮した。この構造において、スプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1オリゴヌクレオチドの3’端の近位でないアセンブリーコンポーネント1オリゴヌクレオチドにおける配列に相補的なスプリント配列領域(L-スプリント)を有し、アセンブリーコンポーネント1のループ状の部分をもたらす。他方のスプリントオリゴヌクレオチドメンバーは、アセンブリーコンポーネント1の3’末端部分およびアセンブリーコンポーネント2オリゴヌクレオチドの5’末端部分に相補的なスプリント配列領域(R-スプリント)を有する。
【0035】
図4において、アセンブリーコンポーネント1オリゴヌクレオチドは、5’端アセンブリーコンポーネント1における5’インデックス配列を有する。インデックス配列は、インデックスを付したスプリント分子のインデックス配列にハイブリダイズして、二本鎖インデックスエレメントを形成する。スプリント分子は、アセンブリーコンポーネント1の3’末端部分およびアセンブリーコンポーネント2オリゴヌクレオチドの5’末端部分に相補的な配列を有し、アセンブリーコンポーネント1のループ部をもたらす(図3と同様であるが、1個のみのインデックスを付したスプリントが使用されている)。
【0036】
本明細書に示される通り、図5A図5Cに図示される実施形態等の実施形態は、著しい利点を提供した。図5のインデックスを付したスプリント分子を使用した低相同性ライブラリーまたは複合ライブラリーのアセンブリーは、高い正確性(すなわち、リードの総数と比べた正しいリードの総数)を生じた。図17を参照されたい。「複合ライブラリー」は、末梢プライマー結合部位を除いて、配列類似性がほとんどないライブラリー配列を指す。加えて、ドロップアウトコンストラクトは存在しなかった。よって、データは、図5のインデックスを付したスプリント分子を使用してアセンブリーコンポーネントをアセンブルすることが、はるかにより高い識別を可能にすることを指し示す。したがって、本発明は、図1中のもの等、スプリント分子のでたらめなハイブリダイゼーションが原因で他の仕方では不可能であろうコンストラクトの正しいアセンブリーを可能にする。
【0037】
よって、本開示は、酵素によるライゲーションのためにインデックスを付したスプリントを用いた特異的オリゴヌクレオチドを利用してマルチコンポーネントコンストラクトをアセンブルするための方法を提供する。本開示は、とりわけ、インデックスを付したスプリント特異的な順序のライゲーションによって2個以上の特異的コンポーネントをアセンブルして、予め定義された順序を有するマルチコンポーネントライゲーション産物を形成するための方法を提供する。本方法は、溶液中で、かつ固体支持体の非存在下で遂行することができる。本方法を使用して、定義された順序で2、3または4個以上の一本鎖オリゴヌクレオチド由来の配列をライゲーションすることにより、合成マルチコンポーネントコンストラクトを産生することができる。複数の異なる合成マルチコンポーネントコンストラクト(例えば、少なくとも2、少なくとも10、少なくとも100、少なくとも1,000または少なくとも10,000または少なくとも100,000種のマルチコンポーネントコンストラクト)を同じ溶液中で産生することができるという点において、本方法はマルチプレックス化することができる。このプロセスを数回反復して、より長い核酸を産生することもできる。
【0038】
ある特定の実施形態では、オリゴヌクレオチド分子は、合成有機化学の技術分野でよく知られている方法を使用した化学合成によって産生される。本明細書に記載されている一部のオリゴヌクレオチド分子は、その代わりに、in vitro転写および細胞に基づく発現を含む、当技術分野で知られている方法を使用して作製することができる。
【0039】
本開示の方法において使用されている様々なオリゴヌクレオチド分子と共に本方法が、次の開示においてより詳細に記載されている。
【0040】
インデックスを付したスプリント
一部の実施形態では、本開示の方法は、図5Aに図示される通りのインデックスを付したスプリントを用いる。インデックスを付したスプリントは、スプリント領域、第1のインデックス配列および第2のインデックス配列を含む。一部の実施形態では、第1のインデックス配列および第2のインデックス配列は、スプリント領域を挟む。第1のインデックス配列および第2のインデックス配列は、インデックスを付したスプリントの5’および3’端に位置することができる。一態様では、第1のインデックス配列および第2のインデックス配列の一方または両方は、インデックスを付したスプリントの末端配列(例えば、5’末端配列および/または3’末端配列)を含む。一部の実施形態では、第1のインデックス配列および第2のインデックス配列の一方または両方は、インデックスを付したスプリントの実質的に末端(例えば、5’実質的に末端配列および/または3’実質的に末端配列)を含むが、末端ヌクレオチドを含まない。スプリント領域は、それぞれ2個のアセンブリーコンポーネントのそれぞれにハイブリダイズし、アセンブリーコンポーネントの端を近づける、5’配列エレメントおよび3’配列エレメントを有する。図5A図5Cにおいて図示される通り、スプリント配列の5’エレメントは、下流アセンブリーコンポーネント(アセンブリーコンポーネント2)の5’端にハイブリダイズし、一方、スプリント配列の3’エレメントは、上流アセンブリーコンポーネント(アセンブリーコンポーネント1)の3’端にハイブリダイズする。結果として、下流アセンブリーコンポーネントの5’端および上流アセンブリーコンポーネントの3’端は一体にされ、リガーゼによってライゲーションされ得る。
【0041】
それぞれ図5Bおよび図5Cに示される、ライゲーションのためにオリゴヌクレオチド構造における2個のアセンブリーコンポーネントに結合するインデックスを付したスプリント分子について、2種の例示的な方向性が存在する。
【0042】
インデックス配列は、目的の配列の一部ではなく、最終アセンブリーにおいて現れることはないであろう。これらは、両方のアセンブリーコンポーネントの端に付加された余分な配列である。そのようなものとして、特に、複数の異なるアセンブリーコンポーネントが、同じ反応においてライゲーションされる場合(すなわち、マルチプレックス)、これらは、可能な限り反応混合物における他の配列とは異なるものとして設計され、よって、アセンブリーコンポーネントの意図されないペアの機会を低減させることができる。
【0043】
インデックスエレメントの特色は、次のものを含む。インデックス配列は、その相補体のみにハイブリダイズするように設計される。よって、いずれか所与のインデックスエレメントについて、いずれの配列(相補体または逆相補体)も最終コンストラクト分子に存在しない。同様に、1個または複数のスペーサー配列を含むインデックスを付したスプリント分子について、いずれのインデックス配列(相補体または逆相補体)もスペーサーに存在しない。インデックス配列は、好ましくは、ステム-ループ構造等、それ自体で安定した二次構造を有しないように設計され、したがって、パリンドローム型ではない。さらに、インデックスエレメントのヌクレオチド組成は、好ましくは、アセンブリーの方法における使用に適した融解温度(Tm)を有するように設計される。一部の実施形態では、インデックスエレメントは、スプリントエレメントが、アセンブリーコンポーネントに対して100%同一性を有するスプリントエレメントを除いて、アセンブリーコンポーネントに単に一過的にハイブリダイズすることができる温度範囲において、ハイブリダイズされたままとなるように設計される。コンストラクトエレメントに対するスプリントエレメント配列におけるミスマッチは、ハイブリダイゼーションを不安定化する。理論に縛られることなく、この動的ハイブリダイゼーションは、100%同一性のスプリントエレメント対アセンブリーコンポーネントのハイブリダイゼーションの形成を支持するサンプリングを可能にすると考えられる。これは、本開示の方法において形成されたマルチコンポーネントコンストラクトの高い正確性に寄与すると考えられる。一部の態様では、アセンブリー正確性(すなわち、リードの総数と比べた正しいリードの総数)は、少なくとも80%、85%または少なくとも90%、例えば、少なくとも91、92%、93%、94%、95%または少なくとも96%である。理論に縛られることなく、これは、意図されるコンストラクトのドロップアウトがほとんどないか、まったく無いことに寄与し、よって、意図されるコンストラクトが高いパーセンテージで表されるとも考えられる。一部の態様では、意図されるコンストラクトのパーセンテージは、意図されるコンストラクトの総数の少なくとも80%、85%または少なくとも90%、例えば、少なくとも91、92%、93%、94%、95%、96%、97%または少なくとも98%である。
【0044】
任意選択的に、インデックス配列は、融解温度の予測に役立つために、塩基のバランスが保たれた(A=T=G=C)ランダムな高い複雑性の配列である。ホモポリマー反復が含まれてよい。他の実施形態では、インデックス配列は、反復エレメント、例えば、ホモポリマーおよび/またはジヌクレオチド反復、例えば、GTGTGTGTを含まない。高い融解温度は、開示されている方法の実施において有用である。各インデックス配列のTmは、約50℃~約80℃、約65℃~約72℃、約55℃~約75℃、約50℃~約70℃または60℃~約80℃となることができる。ある態様では、各インデックス配列のTmは、約65℃~約69℃である。ある態様では、インデックス配列は、20nt~60ntとなることができる。インデックス配列は、20ヌクレオチド(nt)~50nt、25nt~45nt、25~35ntまたは28nt~32ntとなることができる。ある態様では、インデックス配列は、約30ヌクレオチドである。インデックス配列をより短く保つ理由は、アセンブリーコンポーネントにおけるコンストラクト配列の長さを最大化するためである。非常に短いインデックス配列を作製することの主要な妨害は、特異性および二重鎖安定性が劣化することである。インデックス配列は、配列のライブラリーとして調製することができる。潜在的なインデックス配列は、ハイブリダイズし得る配列を除外するために、適切なゲノムに対してスクリーニングされる。ある態様では、潜在的なインデックス配列は、ヒトゲノムに対してスクリーニングされる。配列のライブラリーにおけるインデックス配列は、異なるインデックス配列の間のハイブリダイゼーションを支持しないように設計しつつ、長さ、塩基バランスまたは融解温度等の一部の特色を共有するように設計することができる。ある態様では、配列のライブラリーは、他のセットとは異なるがセット内の特色を共有するインデックス配列の複数のセットを含有することができる。例えば、配列のライブラリーは、ある1つの予測される融解温度で設計されたインデックス配列の1セットを含むことができ、一方、ライブラリー内のインデックス配列の第2のセットは、異なる融解温度で設計することができる。
【0045】
スプリント
インデックスを付したスプリントは、スプリント配列を含む。スプリント配列は、2個のアセンブリーコンポーネントのペア形成の特異性をガイドすることが意図される。図5Aに図示される通り、スプリント配列(スプリント)は、2個の配列エレメント:5’エレメント(5’-エレメント)および3’エレメント(3’エレメント)を有する。スプリント配列の5’エレメントは、下流アセンブリーコンポーネントの5’端にハイブリダイズする。より具体的には、5’エレメントは、下流アセンブリーコンポーネント(アセンブリーコンポーネント2)の5’末端または5’実質的に末端配列にハイブリダイズする(例えば、図5Bを参照)。スプリント配列の3’エレメントは、上流アセンブリーコンポーネント(アセンブリーコンポーネント1)の3’端にハイブリダイズする。より具体的には、3’エレメントは、上流アセンブリーコンポーネント(アセンブリーコンポーネント1)のセグメントDの3’末端または3’実質的に末端配列にハイブリダイズする(例えば、図5Bを参照)。
【0046】
スプリントは典型的に、短い配列またはインデックス領域の融解温度よりも低い融解温度を有する配列である。一部の実施形態では、各スプリントエレメントは、反応条件下でハイブリダイゼーションを駆動するのにそれ自体では不十分となるように設計される。その代わりに、スプリント配列は、アセンブリーコンポーネントが、インデックスを付したスプリントオリゴヌクレオチドのインデックス配列へのハイブリダイゼーションにより適所に保持されたときに、アセンブリーコンポーネントオリゴヌクレオチドに単に一過的にハイブリダイズするように設計される。ある態様では、スプリント配列の5’エレメントおよび3’エレメントは、介在するヌクレオチドなしで、接している。ある態様では、スプリント配列の5’エレメントおよび3’エレメントは、実質的に接しており、例えば、介在する数個の(1、2または3)ヌクレオチドが、5’エレメントおよび3’エレメントの間に存在し、介在する数個のヌクレオチドは、アセンブリーコンポーネントのいずれかのアセンブリー配列に結合することが意図されない。スプリント配列の5’エレメントおよび3’エレメントは独立して、約5ヌクレオチド~約25ヌクレオチドの長さ、または約5ヌクレオチド~約20ヌクレオチドの長さ、または約8ヌクレオチド~約15ヌクレオチドもしくは約10ヌクレオチド~13ヌクレオチドの長さとなることができる。スプリントの5’エレメントおよび3’エレメントは一般に、同様の融解温度を有する。スプリントエレメントの融解温度は、インデックスエレメントの融解温度に満たない。スプリントエレメントの融解温度の選択は、アセンブリーステップにおいて使用されるリガーゼによって影響される。一部の態様では、スプリントエレメントの融解温度(Tm)は、Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7)によって計算される場合、10℃~80℃、14℃~44℃、20℃~42℃または22℃~40℃の範囲内となることができる。当業者は、異なるリガーゼのために異なるスプリント融解温度を選択することができ、例えば、より高い温度で使用することができるリガーゼ、例えば、熱安定性リガーゼ、例えば、9°N(商標)DNAリガーゼ(New England Biolabs、Ipswich、MA)を、より高い融解温度を有するスプリントにより使用することができることを認識するであろう。
【0047】
一部の態様では、インデックスを付したスプリントは、インデックスを付したスプリントの特異的構造特色(例えば、インデックス配列およびスプリント配列)の間のリンカーであるスペーサー配列を含む。スペーサーは、一部の実施形態では、1~30ヌクレオチドの長さとなることができる。スペーサーは、アセンブリー配列またはインデックス配列にハイブリダイズしないように設計されたいずれかの配列または非核酸コンポーネントである。一部の実施形態では、スペーサーは、単純配列、例えば、ホモポリマー配列または短い反復配列、例えば、ジ-ヌクレオチドもしくはトリ-ヌクレオチド反復となることができる。一部の態様では、インデックスを付したスプリントは、図5Aに図示される通り、2個のスペーサー配列を有する。一部の態様では、インデックスを付したスプリントは、1個または複数の追加の構造特色を連結するための2個を超えるスペーサー配列を有する。例えば、本明細書の他の箇所で記述される通り、反復的アセンブリー適用のためのインデックスを付したスプリントは、第2のスプリントエレメントおよび第3のインデックス配列を含有することができ、スペーサー配列は、任意選択的に、特異的構造特色を分離することができる。
【0048】
アセンブリーコンポーネント
一部の実施形態では、アセンブリーコンポーネントは、最終コンストラクトアセンブリーに存在することが所望される配列を含むオリゴヌクレオチド分子、およびインデックス配列である。アセンブリーコンポーネントにおけるインデックス配列の位置は、コンポーネントが、意図されるライゲーション反応において左(上流)コンポーネントであるか右(下流)コンポーネントであるかに依存する。
【0049】
典型的には、上流アセンブリーコンポーネントにおいて、インデックスを付したスプリント配列は、アセンブリーコンポーネントオリゴヌクレオチドの5’末端または実質的に5’末端に位置する。アセンブリー配列は、アセンブリーコンポーネントオリゴヌクレオチドの3’末端領域に位置する。ある態様では、インデックス配列は、アセンブリー配列と接している。他の態様では、追加の配列(構造特色)は、インデックス配列およびアセンブリー配列の間に位置することができる。そのような構造特色は、少なくとも1個のプライマー配列、少なくとも1個のバーコード配列および/または少なくとも1個の制限酵素切断部位のうち1種または複数となることができる。態様では、IIS型制限酵素部位は、アセンブリー配列の直接上流にある。例えば、図8、分子(c)を参照されたい。本態様では、IIS型制限酵素部位は、切断部位における酵素による切断が、アセンブリー配列から全ての非アセンブリー配列を分離するように配置される。本態様は、方法の反復的バージョンに有用であり、例えば、その場合、第1のアセンブリーステップの産物は次いで、その後のアセンブリーステップにおけるコンポーネントとして使用される。
【0050】
典型的には、下流アセンブリーコンポーネントにおいて、インデックスを付したスプリント配列は、アセンブリーコンポーネントオリゴヌクレオチドの3’末端または実質的に3’末端に位置する。アセンブリー配列は、アセンブリーコンポーネントオリゴヌクレオチドの5’末端配列に位置する。ある態様では、インデックス配列は、アセンブリー配列(セグメントE)と接している。他の態様では、追加の配列は、アセンブリー配列(セグメントE)およびインデックス配列(セグメントF)の間に位置することができる。そのような配列は、少なくとも1個のプライマー配列、少なくとも1個のバーコード配列および少なくとも1個の制限酵素切断部位のうち1種または複数となることができる。態様では、IIS型制限酵素部位は、アセンブリー配列の直接下流にある。例えば、図8、分子(a)を参照されたい。IIS型制限酵素部位は、切断部位における酵素による切断が、アセンブリー配列から全ての非アセンブリー配列を除去するように配置される。本態様は、方法の反復的バージョンに有用である。本態様は、例えば、第1のアセンブリーステップの産物が、次いで、その後のアセンブリーステップにおけるコンポーネントとして使用される方法の反復的バージョンに有用である。
【0051】
方法
本開示は、2個の核酸アセンブリーコンポーネントをアセンブルして、ライゲーション産物(マルチコンポーネントアセンブリー)を産生するための方法を提供する。一部の実施形態では、本方法は、反応混合物中に存在するインデックスを付したスプリントに上流アセンブリーコンポーネントおよび下流アセンブリーコンポーネントをハイブリダイズさせるステップを含む。一部の実施形態では、ハイブリダイズされた構造において、上流アセンブリーコンポーネントの5’端および3’端の両方は、インデックスを付したスプリントにハイブリダイズされ、下流アセンブリーコンポーネントの5’端および3’端の両方は、インデックスを付したスプリントにハイブリダイズされる。ハイブリダイズするステップに続いて、ライゲーションするステップが行われる。ライゲーションするステップにおいて、上流アセンブリーコンポーネントの3’端は、下流アセンブリーコンポーネントの5’端にライゲーションされ、これにより、第1のライゲーション産物を産生する。ある態様では、反応混合物は、マルチプレックス化されており、複数の上流アセンブリーコンポーネント種、複数の下流アセンブリーコンポーネント種および複数のインデックスを付したスプリント分子種を含む一本鎖オリゴヌクレオチドの混合物を含む。複数のインデックスを付したスプリント分子種のそれぞれは、混合物中の所定の上流アセンブリーコンポーネントおよび所定の下流アセンブリーコンポーネントにハイブリダイズすることができる。
【0052】
本方法は、水溶液中で実行される。水溶液は、ハイブリダイズするステップおよびライゲーションするステップの両方で同じものとなることができる。ライゲーションステップのための水溶液は、本方法において使用されるリガーゼに適した、適したpHおよび塩濃度を有するいずれかの水溶液となることができる。反応溶液は典型的に緩衝されており、1種または複数の塩を含み、任意選択的に、リガーゼに適した場合、PEG(ポリエチレングリコール)等の分子クラウディング剤を含むことができる。一部の実施形態では、ハイブリダイゼーションおよびライゲーションステップの両方で同じ水溶液が使用される場合、バッファーのコンポーネントは、リガーゼ酵素にとってより有利もしくは不利、またはハイブリダイゼーション反応にとってより有利もしくは不利となるように選択して、最良の結果を達成することができる。例えば、マグネシウムの当該濃度が、よりストリンジェントなハイブリダイゼーションステップを支持する場合、溶液中のマグネシウムの濃度は、リガーゼ反応にとって理想的なものよりも僅かに低くまたは著しく高くなるように選択することができる。
【0053】
ハイブリダイゼーションステップは、インデックスを付したスプリントおよび2個のアセンブリーコンポーネントを含むオリゴヌクレオチド構造を形成するのに十分な期間にわたり、上昇した温度からより冷たい温度へと反応を冷却するウォーターバスにおけるインキュベーションによって実行することができる。ハイブリダイズするステップの温度プロファイルは、インデックス配列のTmおよびスプリント領域のTmによってガイドされる。例えば、ハイブリダイゼーションステップは、より高い温度で始めて、それに続いて冷却期間を設けることができる。出発温度は、いかなる二次構造も融解するように、インデックス配列のTmを超える。例示的な温度プロファイルは、約95℃から約40℃、例えば、93℃から44℃である。ハイブリダイゼーション冷却の持続時間は、約15分間から数時間の範囲に及ぶことができる。例示的な持続時間は、1.75時間である。ある態様では、ハイブリダイゼーションステップは、1.75時間にわたり93℃から44℃へと冷却するステップを含む。一部の実施形態では、ハイブリダイゼーションステップの温度は、経時的に変動され得る、または数サイクルにわたりより高い温度からより低い温度へとサイクル化され得る。
【0054】
ライゲーションステップは、ハイブリダイズされたオリゴヌクレオチド構造をリガーゼと接触させることにより実行される。反応混合物の温度は、使用されるリガーゼに適切な温度に変更することができ、一部の実施形態では、温度は、インデックスエレメントの融解温度を下回り、スプリントエレメントの融解温度を上回る。例えば、ハイブリダイゼーション後に、反応混合物の温度は、約45°~約70℃、約45°~65℃、約50°~65℃または約61℃~65℃等の範囲まで増加され、次いで、ハイブリダイズされたオリゴヌクレオチド構造は、熱安定性リガーゼと接触させられる。より低い温度を非熱安定性リガーゼのために使用することができる。ライゲーションステップは、数分間から数時間の範囲に及び得る、適した長さの時間にわたり実行される。任意選択的に、ライゲーションステップは、当技術分野で知られている方法によって終結される。例えば、リガーゼは、高い温度、化学的変性剤によって変性させることができる、またはEDTAを添加することができる(ライゲーション反応に必要とされるマグネシウムに結合させるために)。
【0055】
本方法は、いかなるリガーゼを用いて実行することもできる。DNAおよびRNAリガーゼは市販されている。その代わりに、リガーゼは、化学合成することができるか(例えば、Creighton, PROTEINS: STRUCTURES AND MOLECULAR PRINCIPLES, 2nd Edition, W.H. Freeman & Co., NY, 1992を参照)、または細胞における発現等の分子生物学方法による組換えにより作製することができる。組換えリガーゼは、例えば、精製を助けるために、融合タンパク質として調製することができる。ある特定の態様では、リガーゼは、精製または単離された形態で提供される。ある特定の実施形態では、リガーゼは、約80%、約90%、約95%または約99%純度で提供される。ある特定の実施形態では、リガーゼは、組成物の一部として提供される。ある特定の実施形態では、リガーゼは、マルチコンポーネント構築のアセンブリーのための組成物としての使用またはその中への包含に適した水性組成物において提供される。当業者であれば、そのようなリガーゼ反応組成物中に含まれ得る様々な物質に気づく筈である。
【0056】
リガーゼの選択は、ライゲーションするステップの温度に影響を与えるであろう。異なるリガーゼは、異なる効率、異なる温度における異なる活性、およびライゲーション部位におけるミスマッチに対する異なる感受性を有することができる。より低い温度範囲で機能する中温性DNAリガーゼの多くの例がある。熱安定性リガーゼも利用できる。熱安定性リガーゼは、より高い温度、例えば、最大で65℃におけるリガーゼ反応条件を可能にする。より高い温度反応条件は、より正確なアセンブルされたコンストラクトに寄与することができる。ある態様では、熱安定性リガーゼは、ライゲーションがライゲーション部位で起こる前に、より大きいフットプリント要件(例えば、約25ヌクレオチドのハイブリダイズされた配列)を有する。この特色は、より優れた特異性に寄与することができ、ライゲーションされた産物の、より良い純度をもたらす。ある態様では、複数のリガーゼを使用することができる。ある態様では、異なるリガーゼを、同じハイブリダイゼーション反応に逐次に添加することができる。ある態様では、異なるリガーゼが同じ反応に含まれてよい。例えば、中温性リガーゼおよび熱安定性リガーゼが反応に含まれてよく、好熱性リガーゼのために温度を上げる前に、中温性リガーゼをより低い温度で使用することができる。そのような実施形態は、ある1つの予測される融解温度で設計されたインデックス配列の1セットを含む配列のライブラリーを用いた方法であって、ライブラリー内のインデックス配列の第2のセットが、異なる融解温度で設計することができる、方法の実施により適用可能となることができる。
【0057】
オリゴヌクレオチドコンポーネントの濃度は、ライゲーションの正確性に影響する反応パラメータである。高い濃度のオリゴヌクレオチドコンポーネントは、間違ったライゲーション結果の可能性を増加させる。よって、より低い濃度は、ライゲーション産物の改善された正確性をもたらすことができる。
【0058】
一般に、ハイブリダイゼーション条件、ハイブリダイズされた配列の長さ、およびライゲーション条件は、正確にアセンブルされたコンストラクトの最高収率を達成するために変動され得る。例えば、条件のセットが、コンポーネントの特定のセットの不正確なアセンブリーを生じる場合、より高いライゲーション温度および/またはよりストリンジェントなハイブリダイゼーション条件を使用することができる。ハイブリダイゼーション条件およびリガーゼ条件の最適化は、本開示および当技術分野の従来知識を考慮して、当業者の範囲内である。例えば、Sambrook et al.,Molecular Cloning A Laboratory Manual,2nd Ed. Cold Spring Harbor Press (1989)またはAnderson,Nucleic Acid Hybridization,1st Ed., BIOS Scientific Publishers Limited (1999)を参照されたい。
【0059】
ある態様では、本方法は、図2のおよび少なくとも1個のブロッキングヌクレオチドをさらに含むインデックスを付したスプリントを使用して実行することができる。図6は、オリゴヌクレオチド構造を図示し、このオリゴヌクレオチド構造は、アセンブリーコンポーネントのアセンブリー配列における一本鎖領域にハイブリダイズされた少なくとも1個のブロッキングオリゴヌクレオチドを含む。この変種は、意図されないハイブリダイゼーションを防止するために考慮される。ブロッキングオリゴヌクレオチドは、一本鎖領域の一部または全てをブロックするように設計することができる。図6の描写されている実施形態では、オリゴヌクレオチド構造は、2本のさらに別のオリゴヌクレオチド鎖を含み、そのうち1本は、アセンブリーコンポーネント1配列にハイブリダイズし、もう1本は、アセンブリーコンポーネント2配列にハイブリダイズする。ブロッキングオリゴヌクレオチドを、図6に描写されるインデックスを付したスプリント分子の2個のオリゴヌクレオチド分子の一部として合成することができることが考慮される。ブロッキングオリゴヌクレオチドは、図5または本発明の他の実施形態のオリゴヌクレオチド構造において用いることもできる。ブロッキングオリゴヌクレオチドを、図5に描写されるインデックスを付したスプリント分子の一部として合成することができることが考慮される。
【0060】
本方法は、反復的に実行することができる。ある態様では、下流アセンブリーコンポーネントは、3’端に除去可能な(取り外し可能な)インデックス配列を含む。アセンブリーコンポーネントを含むライゲーション産物を提供するためのハイブリダイゼーションおよびライゲーションステップ後に、ライゲーションされた産物の3’末端配列が、アセンブリー配列の3’配列となるように、インデックス配列は除去される(例えば、酵素による切断または切断可能なリンカーの切断により)。この第1のライゲーションされた産物は次いで、方法のさらなる繰り返しにおいて上流アセンブリーコンポーネントとして利用して、第2のライゲーションされた産物を産生する。反応混合物は、第1のライゲーションされた産物および別の下流アセンブリーコンポーネントにハイブリダイズするインデックスを付したスプリント分子を含む。
【0061】
ある態様では、除去可能な(または取り外し可能な)インデックス配列は、制限酵素部位を含む。ある態様では、制限酵素部位は、IIS型制限酵素のためのものである。IIS型制限酵素は、非対称DNA配列を認識し、その認識配列の外側の定義された距離で、通常、1~20ヌクレオチド以内で切断する酵素の特異的な群を含む。IIS型制限酵素のこの特異的な切断作用機序は、所望のアセンブリー配列が保持され、非アセンブリー配列が除去されるような切断を可能にする。これは、最終アセンブリー配列を変更しないDNA操作を可能にし、よって、マルチコンポーネントコンストラクトにおける傷跡がない継ぎ目の生成を可能にする。
【0062】
ある態様では、除去可能な(または取り外し可能な)インデックス配列は、切断可能なリンカーによってアセンブリー配列に連結されたインデックス配列となることができる。光切断可能なリンカー化学が当技術分野で知られており、TriLink Biotechnologies、Integrated DNA TechnologiesおよびGlen Researchから市販されている。
【0063】
ある態様では、本方法は、第1のアセンブリーのライゲーション産物においてアセンブリープロセスが反復される、図7図9に図示される通りの4パートアセンブリーである。本態様では、制限酵素消化ステップによって分離された2回のライゲーションステップが存在する。ハイブリダイゼーションステップは、図7に描写される2種のオリゴヌクレオチド構造を形成する。図7に描写される上部オリゴヌクレオチド構造において、オリゴヌクレオチド構造は、図5Bに図示される方向性である(ただし、図5Cに描写される方向性で設計することができる)。インデックスを付したスプリント分子は、5’から3’の向きに、下流アセンブリーコンポーネント2にハイブリダイズされてインデックス2を形成する第1のインデックス配列と、スプリント配列(スプリント1)と、上流アセンブリーコンポーネント1にハイブリダイズされてインデックス1を形成する第2のインデックス配列とを含む。スプリント1は、上流アセンブリーコンポーネント1の3’末端配列および下流アセンブリーコンポーネント2の5’末端配列にハイブリダイズされる。第1のスプリント構造(スプリント1)に加えて、上部オリゴヌクレオチド構造のインデックスを付したスプリントは、スペーサーセクションにおける第2のスプリント配列(スプリント2)、ならびに5’インデックス配列(インデックス2)および第1のスプリント構造(スプリント1)の間の別のインデックス配列(インデックス3を形成する)をさらに含む。下流アセンブリーコンポーネント2は、アセンブリー配列の3’にある制限酵素配列である、さらに別の構造特色を含む(図8に描写)。
【0064】
図7に描写される下部オリゴヌクレオチド構造において、オリゴヌクレオチド構造は、図5Cに図示される方向性である(ただし、図5Bの方向性で設計することができる)。インデックスを付したスプリント分子は、5’から3’の向きに、上流アセンブリーコンポーネント3にハイブリダイズされてインデックス4を形成する第1のインデックス配列と、スプリント配列(スプリント3)と、下流アセンブリーコンポーネント4にハイブリダイズされてインデックス5を形成する第2のインデックス配列とを含む。スプリント3は、上流アセンブリーコンポーネント3の3’末端配列および下流アセンブリーコンポーネント4の5’末端配列にハイブリダイズされる。下部オリゴヌクレオチド構造のインデックスを付したスプリントは、5’インデックス配列(インデックス4)およびスプリント3の間にインデックス3の相補的配列(インデックス3相補体)をさらに含む。
【0065】
ライゲーションステップは、それぞれ図8、構造(a)および(c)に図示される通り、コンポーネント1&2、アセンブルされた産物(1-2)のライゲーション産物と、コンポーネント3&4、アセンブルされた産物(3-4)の第2のライゲーション産物とを産生する。図8に図示される通り、上部構造(a)のインデックスを付したスプリントは、アセンブリーコンポーネント2のアセンブリー配列の3’かつインデックス2に対して5’にある制限酵素部位(REカット部位)を含む。構造(c)のインデックスを付したスプリントは、アセンブリーコンポーネント3のアセンブリー配列の5’かつインデックス3の3’にある制限酵素部位を含む。インデックスを付したスプリントは、スプリント2およびインデックス4のインデックス配列の間に位置する、インデックス3を形成するための相補体配列であるインデックス配列、ならびにインデックス4のインデックス配列の5’にある制限酵素部位である、2個のさらに別の構造特色を含む。ライゲーション産物は、IIS型制限酵素消化に付されて、アセンブルされた産物1-2およびアセンブルされた産物3-4における制限酵素部位を切断して、それぞれインデックス2およびインデックス4を除去する。結果的に、方法のさらなる繰り返しにおいて、ライゲーション産物1-2の消化産物は、上流アセンブリーコンポーネントとなることができ、ライゲーション産物3-4の消化産物は、下流アセンブリーコンポーネントとなることができる。消化産物は、例えば、SPRI精製(例えば、SPRIは、固相可逆的固定化の略語である)によって精製し、次いでハイブリダイゼーションステップに付すことができる。ハイブリダイゼーションステップは、図9に図示されるオリゴヌクレオチド構造を産生する。図示される通り、二本鎖インデックス3は、2個のインデックスを付したスプリント分子のインデックス3配列のハイブリダイゼーションによって形成される。スプリント2は、アセンブリーコンポーネントにハイブリダイズしてライゲーション部位を形成するように作用する;5’エレメントは、アセンブルされた産物(3-4)の5’端に結合し、3’エレメントは、アセンブルされた産物(1-2)の3’端に結合する。第2のライゲーションステップが行われ、マルチコンポーネントライゲーション産物1-2-3-4を産生する(示されていない)。第2のライゲーションステップの産物は、任意選択的に、SPRI精製し、PCRにより増幅することができる。
【0066】
本明細書に示される通り、インデックスに基づくライゲーションにおいて、2個の相補的インデックス配列を有する共通のインデックスを付したスプリント分子への2個のアセンブリーコンポーネントの反対の端のハイブリダイゼーションは、優れた特異性を提供する。例えば、インデックスエレメントの融解温度(Tm)は、2個のハイブリダイズされたスプリントエレメントのそれぞれの融解温度(Tm)よりも高くなることができない。このようにして、インデックス結合は、ハイブリダイゼーション条件下で安定する一方で、スプリント結合は準安定である。よって、特異的に設計されたインデックス配列は、ハイブリダイゼーション反応を駆動し、反応混合物におけるスプリント配列および意図されない標的の間の望まれない結合を回避することができる。
【0067】
さらにより大型の産物のアセンブリーのために同じプロセスを反復することができる。
【0068】
開示されている方法の変種によって特異性が改善され得る条件が存在し得ることがさらに考慮される。次に、インデックス配列の融解温度を増加させ、よって、特異性を増加させるための方法について記載する。本態様はまた、2ステップライゲーションプロセスに頼る。簡潔に説明すると、また、図10図13に図示される通り、第1のライゲーションステップにおいて、2個のアセンブリーコンポーネントオリゴは、互いに隣接する2個のインデックス配列を含むがスプリント領域を含まない分子(図10における「インデックススプリント」を参照)にハイブリダイズされ、それらのインデックス付け配列で一体にライゲーションされ、第1のライゲーションステップにおいてはるかにより長いオリゴを形成する(図11を参照)。第1のライゲーションステップ(インデックス配列の端をライゲーションする)の後に、温度を、それらの相補的スプリント配列を有するインデックス付け配列の融解温度を上回るように増加させることができ、第2の分子(2個のアセンブリー標的にハイブリダイズする「コンストラクトスプリント」)が、このより高い温度で付加され(図12Bを参照)、より高いストリンジェンシーを可能にし、相同コンストラクトの間の交差ハイブリダイゼーションの機会を減らし、したがって、以前に記載された実施形態よりも潜在的にさらにより良い特異性をもたらす。第1のライゲーションのライゲーション産物の遊離端がスプリントオリゴとハイブリダイズし、その後ライゲーションされて一本鎖ループを形成する際に、分子毎の第2のライゲーション事象が起こる(図13を参照)。ループの形成を安定化するために、第2のスプリントのセクションの一方は、他方のセクションよりも実質的に長くなり、一方の端において安定した二重鎖を形成することができ、一方、他方の端は、それがライゲーションされてループを形成するようになるために、二重鎖端と短時間接触することのみを必要とする。その上、キメラ形成は、さらに多くのバッファー溶液の添加によって、第1のライゲーションステップの後に溶液を希釈することにより阻害することができる。これは、溶液のエントロピーを増加させることにより、分子間ライゲーションよりも分子内ライゲーションおよびループ形成の確率を増加させる。
【0069】
図10に図示される通り、2個のアセンブリーコンポーネントは、一方のアセンブリーコンポーネントの5’端におけるインデックス配列および他方のアセンブリーコンポーネントの3’端におけるインデックス配列によってスプリント分子にハイブリダイズされる。ライゲーション後に、ライゲーション産物は、2個のアセンブリーコンポーネントを含み、そこで、2個のインデックス配列は、隣接しており、ライゲーションされた産物の中央で互いにライゲーションされる。図11を参照されたい。ライゲーション後に、ライゲーション産物は、インデックススプリントへの現在ライゲーションされている2個のインデックス配列(インデックス1-インデックス2)によってハイブリダイズされたままであり、著しく増加された融解温度を有する。例えば、ある態様では、各インデックス配列が30ヌクレオチド長であり、各インデックスエレメントが約69℃の融解温度を有する場合、二重鎖における2個のインデックス配列の組み合わせた融解温度は、約17℃高くなり、約86℃の平均温度となる。これは、二重鎖を変性させることなく、反応溶液の温度を80代前半の温度まで上げることができることを意味する。
【0070】
任意選択的に、方法のステップの間で、結合されていない断片またはライゲーションされていない産物は、例えば、ハイブリダイゼーション溶液を洗い流して反応溶液を清浄化することによって、反応溶液から除去することができる。任意選択的に、この清浄化は、インデックス付けスプリントオリゴを固体支持体に結合させることにより行うことができる。例えば、インデックススプリントオリゴは、その3’端(図11に示す通り)またはその5’端のいずれかに取り付けられたビオチンを有することができる。次に、オリゴ二重鎖は、標的富化のために一般的に使用されている磁気ストレプトアビジンビーズに結合させることができる。SPRIビーズで一般的に行われる通り、これらをチューブ内で混合し、数分間インキュベートし、次いで、強い勾配の磁場を用いてチューブの側面または底面に引き寄せる必要がある。次に、ハイブリダイゼーション溶液を取り除き、容器を再充填し、1回または複数回チューブ内でライゲーションされた産物を洗浄バッファーでリンスすることにより、洗浄ステップを達成することができる。これは、ライゲーションされていないオリゴヌクレオチドの濃度を低減させ、第2のライゲーションステップにおける正しくないライゲーション事象の見込みを低減させるであろう。
【0071】
ライゲーションされた産物は、水もしくはよりストリンジェントなライゲーションバッファーを添加することにより、またはバッファーに適切な融解温度を超えるまで加熱することにより、二重鎖から(よって、ビーズから)放出することができる。熱安定性リガーゼ、例えば、9°N(商標)リガーゼ(NEB、Ipswich、MA)をリガーゼバッファーに添加し、温度を80℃以上にまたは別の熱安定性リガーゼが活性を維持する最高温度に増加させることができ、このポイントで、ライゲーション産物の遊離端のためのスプリント分子をチューブに添加することができる。その代わりに、加熱前に混合物にスプリントを添加し、加熱後にリガーゼを添加することができる。このステップは、溶液中のオリゴを用いて行うことも、または磁気ビーズに結合させたままで行うこともできる。この第2のライゲーション事象は、図12および図13に描写されている。ライゲーション反応の期間の後に、EDTAを添加することにより、または単純に、室温までもしくは室温で迅速に冷却することにより、ライゲーション反応を停止することができる。
【0072】
図13は、例えば、プライマー結合部位(PBS1およびBPS1)および任意選択的な制限酵素部位を含む、オリゴにおける任意選択的な追加の構造特色を示す。増幅は、PCRまたはローリングサークル増幅のいずれかによって行うことができる。ローリングサークル増幅は、ループ状のオリゴにおけるいずれかのプライマー結合部位に相補的な単一のプライマーおよび高い処理能力を有するDNAポリメラーゼ、例えば、バクテリオファージphi29 DNAポリメラーゼをチューブに添加することにより行われる。その代わりに、ポリメラーゼ、プライマーのペアおよびdNTPにより、次いでサーマルサイクラーにおける熱サイクリングにより、PCRを行うことができる。
【0073】
時に、アセンブルされた産物のPCR増幅の際に、非ライゲーションオリゴヌクレオチドがポリメラーゼによって伸長され、望まれないキメラを創出する場合がある。環状化DNAを創出する図12および図13に示す実施形態は、エキソヌクレアーゼステップの追加によって、このキメラ産生を低減させることができる。この追加のステップにおいて、エキソヌクレアーゼを使用して、環状DNAアセンブリーを後に残しつつ、その5’端から一本鎖DNAおよび二本鎖を消化することができる。エキソヌクレアーゼステップは、PCT増幅に先立ち実行するべきである。消化プロセスは、EDTAの添加によりもしくは反応混合物を75℃に加熱することにより酵素を死滅させることにより、またはその両方により停止することができる。このような環状コンストラクトはその後、PCRによって、または高い処理能力のポリメラーゼ、例えば、phi29を使用するローリングサークル増幅によって増幅される。
【0074】
ある態様では、図10における2個のアセンブリーコンポーネントをライゲーションするための第1のライゲーションステップは省略される。第2のスプリント(「コンストラクトスプリント」)は、2個のアセンブリーコンポーネントの5’および3’遊離端においてコンストラクト配列にハイブリダイズし、これらは次いでライゲーションされる。
【0075】
図10図13に関係する別の実施形態では、インデックススプリントおよびコンストラクトスプリントは、リンカー分子または配列(図12Aにおける「任意選択的な繋留」)を用いて接続される。分子は、図5Aのインデックスを付したスプリントのコンポーネントを有するが、異なる5’から3’への順序である。
【0076】
本開示の一部の実施形態では、マルチコンポーネントコンストラクトは先ず、本開示に従って溶液中でアセンブルし、当技術分野で知られているいずれかの方法によってアセンブリー後に固体基材に取り付けることができる。よって、本開示を使用して、マルチコンポーネントコンストラクトのアレイを調製することができ、それによると、マルチコンポーネントコンストラクトは、アセンブリー後にアレイ基材に取り付けられる。その後、マルチコンポーネントコンストラクトまたはマルチコンポーネントコンストラクトのプールもしくは複数のプールは、アレイ基材から任意選択的におよび選択的に切断し、ライブラリー(単数または複数)として使用することができる。その代わりに、マルチコンポーネントコンストラクトは、ビーズに取り付けることができる。コンストラクトは、化学的手段によりまたは特異的ハイブリダイゼーションによってビーズに取り付けることができる。取付け方法に応じて、異なるビーズを使用して、特異的な異なるコンストラクトを捕捉することができる、または1種のビーズが、複数のコンストラクトを捕捉することができる。ビーズへのライブラリーの取付けは、ライブラリーを貯蔵、洗浄、濃縮または酵素により操作するための利点を提供することができる。
【0077】
キット
本開示はまた、開示されている方法の実行に有用なキットを提供する。一態様では、少なくとも1つの型の上流アセンブリーコンポーネント、1つの型の下流アセンブリーコンポーネント、およびアセンブリーコンポーネントのライゲーションを方向付けるためのインデックスを付したスプリントを含む一本鎖オリゴヌクレオチドの混合物を含むオリゴヌクレオチドライブラリー、ならびにDNAリガーゼを含む、上述の方法を行うための試薬を含有するキットが提供される。ある特定の実施形態では、本キットは、1種または複数の他の反応コンポーネントを含む。ある特定の実施形態では、適切な量の1種または複数の反応コンポーネントは、1個もしくは複数の容器内に提供されるか、または基材に保持される。キットの追加のコンポーネントの例は、反応バッファー、ライゲーション産物を検出するための1種または複数の試薬(例えば、プローブまたはPCRプライマー)その他を含むがこれらに限定されない。使用される反応コンポーネントは、種々の形態で提供することができる。例えば、コンポーネント(例えば、酵素、オリゴヌクレオチド、プローブおよび/またはプライマー)は、水溶液に懸濁することができる、またはビーズに結合させることができる、またはフリーズドライもしくは凍結乾燥された粉末もしくはペレットとして提供することができる。本開示のキットは、いずれか適した温度で提供することができる。例えば、液体におけるタンパク質コンポーネントまたはその複合体を含有するキットの貯蔵のため、おそらくグリセロールまたは他の適した不凍剤を含有する凍結抵抗性溶液中で、0℃未満、好ましくは約-20℃で提供および維持されることが好まれる。
【0078】
キットまたはシステムは、少なくとも1回のアッセイに十分な量で、本明細書に記載されているコンポーネントのいずれかの組合せを含有することができる。一部の適用では、1種または複数の反応コンポーネントは、個々の、典型的には使い捨ての、チューブまたは均等な容器において、予め測定された1回使用量で提供することができる。キットにおいて供給されるコンポーネントの量は、いずれか適切な量となることができ、製品が標的とする市場に依存することができる。コンポーネントが供給される容器(複数可)は、供給された形態を保持することができるいずれか従来の容器、例えば、微量遠心チューブ、マイクロタイタープレート、アンプル、ボトルまたは一体型の検査デバイス、例えば、流体デバイス、カートリッジ、側方流または他の同様のデバイスとなることができる。
【0079】
本キットは、容器または容器の組合せを保持するための包装材料を含むこともできる。そのようなキットおよびシステムのための典型的な包装材料は、種々の構成(例えば、バイアル、マイクロタイタープレートウェル、マイクロアレイその他における)のいずれかにおいて反応コンポーネントまたは検出プローブを保持する固体マトリックス(例えば、ガラス、プラスチック、紙、ホイル、微小粒子その他)を含む。本キットは、コンポーネントの使用のための、有形の形態で記録された説明書をさらに含むことができる。
【0080】
アセンブリーの開示されている方法は、インデックスを付したスプリント分子のインデックス配列およびアセンブリーコンポーネント分子の間の安定したかつ特異的なハイブリダイゼーションに頼る。対照的に、アセンブリーを方向付けるためにスプリントを利用した先行技術方法は、スプリント分子および2個のアセンブリーコンポーネントの間の安定したかつ特異的なハイブリダイゼーションに頼る。理論に縛られることなく、本開示のアプローチ(図5A図5C)と先行技術アプローチの間の根本的な区別は、開示されている方法において、所望のアセンブリー配列が、ライゲーションのためのポジションに小片をアセンブルさせるために使用されないことであると考えられる。アセンブリーの開示されている方法におけるスプリント配列は、安定したハイブリダイゼーションとなるには短すぎるように設計され、よって、アセンブリー非存在インデックスハイブリダイゼーションを可能にするには十分ではない。インデックスを付したスプリント分子のインデックス配列は、コンストラクト配列の一部ではなく、よって、ライブラリーメンバー間の相同性によって影響されない。これは、マルチプレックスアセンブリーの以前のハイスループット方法を上回る予想外の利益および改善である。
【実施例
【0081】
本教示の態様は、決して本教示の範囲の限定として解釈されるべきではない次の実施例を踏まえて、さらに理解することができる。
【0082】
[実施例1]
次の実験を設計および実施して、図1図2および図3に描写されるオリゴヌクレオチドスプリント構造を使用した溶液における低相同性ライブラリーの調製を評価した。よって、評価される3つの型の検査スプリント分子が存在した。用語「検査スプリント分子」は、図1における単一のスプリント分子を指す。図2および図3において、「検査スプリント分子」は、インデックスエレメントを形成する相補的なインデックス配列のハイブリダイゼーションによって形成された2個のオリゴヌクレオチド構造を指す。図2および図3におけるインデックスエレメントは同じものであり、60℃~75℃の範囲内のTmを有した。ハイブリダイズされたインデックスの高いTmは、Tmを下回る温度で、有効に2個のヌクレオチド構造を単一の分子にする。
【0083】
コンストラクト配列を、低相同性ゲノム配列、UTR(非翻訳領域)のセットから得た。140種のUTRをアセンブルした。検査されるスプリント分子の設計により、正しいコンストラクトは、同じUTR配列にライゲーションされるUTR配列であった。よって、140種の異なるUTRについて、140種の異なる検査スプリント分子およびアセンブルするための可能な140種の全ての正しいコンストラクト、ならびに可能な19,460種の全ての正しくないコンストラクトが存在した。典型的には、140種のUTRのそれぞれが、本来のオリゴライブラリーにおいて2種のバージョンを有する:PCR増幅およびMiSeq(Illumina)に要求されるアダプターの導入のために、一方のバージョンは5’端にプライマー部位を有し、もう一方のバージョンは3’端にプライマー部位を有する。
【0084】
検査スプリント分子対コンストラクトの3種の比(1:1、2:1および4:1)を検査スプリント分子の型毎に検査した。図2および図3の検査スプリント分子(どちらもインデックスを有する)について、+/-3ヌクレオチドスペーサー(支柱と称される)も検査した。3ヌクレオチド支柱は、検査スプリント分子のインデックスおよびスプリント部分の間に位置した。結果として、本実験においてアセンブルされる15セットが存在した。各セットは、420種の異なるUTR配列からアセンブルされ得る140種の正しいUTRコンストラクトを有した。異なるセット由来の産物は、配列決定によって区別可能であり、それによると、異なる配列は、DNAライブラリー材料の産生においてサブセット毎に異なる分子コピー番号をプリントされた。
【0085】
セット毎に、オリゴライブラリーを、UTRおよび検査スプリント分子から調製した。約80ngのライブラリーを可溶化し(キナーゼ反応およびリガーゼ反応の両方に適したバッファー中に)、次いで、DNAオリゴの5’末端をリン酸化するために、製造業者の推奨に従ってT4ポリヌクレオチドキナーゼ(NEB)を使用したキナーゼ反応に付した。キナーゼ処理された産物を、1.75時間にわたり93℃から44℃へと冷却するウォーターバスにおけるインキュベーションによってハイブリダイズさせて、図1図2および図3に描写されるオリゴヌクレオチド構造を形成した。次に、ハイブリダイズされた産物をライゲーション温度に加熱し、1マイクロリットル(μl)の9°N(商標)リガーゼ(New England Biolabs Inc.,Ipswich、MA)を添加した。ライゲーション反応を1時間進めた。ライゲーションされた産物を、1.5×AMPure(登録商標)XPビーズ(Beckman Coulter、Brea、CA)を使用して精製し、PCRによって増幅した。PCR産物をNGS(次世代配列決定)によって配列決定して、各セットにおける正しいアセンブリーの程度を特徴付けた。
【0086】
結果
NGSリードデータを図14に示す。データは、検査スプリント分子の3つの型全て(図1図2または図3に描写されるオリゴヌクレオチド構造の)が、15セット全てにおいて機能したことを示す。図1の検査スプリント分子が、最も良く機能した。特に、スプリント/コンストラクト分子比が4:1であったセットが、検査した3種の比の中で最も良く機能し、700個に近い平均数の正しくアセンブルされたコンストラクトに関するリードを有した。図2および図3のデータは、互いに同様であり、図2データが、僅かにより多い平均数の正しくアセンブルされたコンストラクトに関するリードを示す。図2の検査スプリント分子における3ヌクレオチド支柱の存在は、図2の検査スプリント分子にほとんど影響がなかった。図3の検査スプリント分子における3ヌクレオチド支柱の存在は、支柱がない検査スプリント分子のデータと比べて、僅かに低減した平均数のリードをもたらした。
【0087】
[実施例2]
実施例1におけるものとは異なる検査スプリント分子を試験するために、次の実験を設計および実施した。本実験は、図5Bのオリゴヌクレオチド構造に図示される通りの検査スプリント分子を使用した。検査スプリント分子は、検査スプリント分子の5’および3’末端に位置し、2個のアセンブリーコンポーネントに結合するスプリント領域を挟む、インデックス配列を含有する単一のオリゴヌクレオチド配列である、インデックスを付したスプリント分子である。アセンブリーコンポーネント(ライゲーションされて、アセンブルされたコンストラクトを形成することになるアセンブリー配列を含む)は、検査スプリント分子のインデックス配列に対する逆相補体配列をさらに含み、これにより、2個の位置におけるアセンブリーコンポーネントへの検査スプリント分子のハイブリダイゼーションを可能にするように調製した。左アセンブリーコンポーネントについて、検査スプリント分子は、(1)左アセンブリーコンポーネントの3’端における特異的配列に結合するスプリントエレメントにおいて、および(2)左アセンブリーコンポーネントの5’末端におけるインデックス配列において(ハイブリダイズして、インデックスエレメントを形成する)結合する。右アセンブリーコンポーネントについて、検査スプリント分子は、(1)右アセンブリーコンポーネントの5’端における特異的配列に結合するスプリントエレメントにおいて、および(2)右アセンブリーコンポーネントの5’端におけるインデックス配列において(ハイブリダイズして、別のインデックスエレメントを形成する)結合する。左アセンブリーコンポーネントの3’末端におけるインデックスエレメントは、右アセンブリーコンポーネントの3’末端におけるインデックスエレメントとは異なる配列を有するため、2個の別々のインデックスエレメントの間に交差ハイブリダイゼーションは存在しない。左アセンブリーコンポーネントの5’末端におけるインデックスエレメントは、30ヌクレオチドからなり、65~72℃の範囲内のTmを有し、右アセンブリーコンポーネントの3’末端におけるインデックスエレメントは、30ヌクレオチドからなり、65~72℃の範囲内のTmを有する。
【0088】
コンストラクト配列(2250種の配列)を、低相同性ゲノム配列、UTR(非翻訳領域)のセットから得た。アセンブリー配列は、200ヌクレオチドの長さであった。アセンブリーコンポーネントは、UTRコンストラクト配列、インデックス配列、バーコードおよびプライマー配列を含んだ。図15に図示される通り、左アセンブリーコンポーネント(左)は、5’から3’の向きに、インデックス配列(インデックスを付したスプリントにハイブリダイズされたときにインデックス1を形成するため)、プライマー配列(プライマーF)、バーコード(BC1)およびアセンブリー配列を含んだ。右アセンブリーコンポーネント(右)は、5’から3’の向きに、アセンブリー配列、バーコード(BC2)、プライマー配列(プライマーR)およびインデックス配列(インデックスを付したスプリントにハイブリダイズされたときにインデックス2を形成するため)を含んだ。
【0089】
検査スプリント分子は、5’から3’の向きに、インデックス配列(右アセンブリーコンポーネントにハイブリダイズして、オリゴヌクレオチド構造におけるインデックス2を形成する)、スペーサー(点線)、スプリント配列、別のスペーサー(点線)および別のインデックス配列(ハイブリダイズして、オリゴヌクレオチド構造におけるインデックス1を形成する)を含んだ。スプリント配列は、右アセンブリーコンポーネントのアセンブリー配列の5’末端配列にハイブリダイズする5’配列エレメントと、右アセンブリーコンポーネントのアセンブリー配列の3’末端配列にハイブリダイズする3’配列とを含有する。スプリントの5’配列エレメントおよび3’配列エレメントのそれぞれは、少なくとも12ヌクレオチド長であり、それぞれ、28℃以上のTmを有する(EQ.1:Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7を使用して計算される通り)。
【0090】
実験において利用されるスプリント分子の設計により、正しいコンストラクトは、同じUTRにライゲーションされるUTRであり、400ヌクレオチドマルチコンポーネントコンストラクト(非コンストラクト配列を含まない)を生じた。各UTRアセンブリーコンポーネントは、6つの特有のバーコードペアをさらに含むように設計された。正しいコンストラクトは、アセンブルされたコンストラクトにおいて正しくペア形成されている左および右バーコードによって指し示される。よって、UTR毎に、可能な6個の正しいコンストラクト(および可能な30個の正しくないコンストラクト)が存在する。2250個の異なるUTR配列および6個の特有のバーコードペアが検査されたため、総計13,500個の特有のインデックスを付したスプリント分子(2250×6)および可能な13,500個の特有の正しいコンストラクトが存在する。
【0091】
UTRコンポーネント構築およびインデックスを付したスプリント分子を含有するオリゴライブラリーを調製した。約80ngのライブラリーを可溶化し、次いで、DNAオリゴの5’末端をリン酸化するために、製造業者の推奨に従ってT4ポリヌクレオチドキナーゼ(NEB)を使用したキナーゼ反応に付した。キナーゼ処理された産物を、1.75時間にわたり93℃から44℃へと冷却するウォーターバスにおけるインキュベーションによってハイブリダイズさせた。次に、ハイブリダイズされた産物を、ライゲーション温度60.6℃に加熱し、1マイクロリットル(μl)の9°N(商標)リガーゼ(New England Biolabs Inc.,Ipswich、MA)を添加した。ライゲーション反応を10分間進めた。ライゲーションされた産物を、1.5×AMPure(登録商標)XPビーズ(Beckman Coulter、Brea、CA)を使用して精製し、PCRによって増幅した。PCR産物をNGS(次世代配列決定)によって配列決定して、正しいアセンブリーの程度を特徴付けた。
【0092】
結果
データを、図15中の表に示す。13,500個の可能な正しい構築のうち、13,465は、10,000,000個よりも少ないリードによるライブラリーの配列決定により検出された。アセンブリーの反対の端に位置する特有のバーコードに基づき、このデータは、可能な正しい構築の99.70%が、反応においてアセンブルされたことを示すが、バーコード間で各配列の全長配列正確性を示すものではない。
【0093】
よって、図5Bオリゴヌクレオチド構造は、著しく多い数の正しいコンストラクトを可能にした。これは、オリゴヌクレオチドライブラリーの調製に対して非常に結果的に必然な数である。
【0094】
[実施例3]
次の実験を設計および実施して、図1図2および図5Bのオリゴヌクレオチド構造を使用したアセンブリーを検査した。実験を設計して、3つの型のオリゴヌクレオチドライブラリー:(a)複合ライブラリー、(b)タイル状のライブラリーおよび(c)相同ライブラリーを比較した。3つの型のライブラリーは、図16に模式的に描写されている。
【0095】
本実験の複合ライブラリーにおいて、配列は、末梢プライマー部位を除いて配列類似性がほとんどない。複合ライブラリー(a型)は、600個の別個のUTR配列(すなわち、総計600個の可能な正しいアセンブルされたコンストラクト)を有した。相同ライブラリー(c型)は、60個の別個のUTR配列を利用し、別個のUTR配列のそれぞれは、10個の特有にバーコード付けされたコンストラクト(総計600個の可能な正しいアセンブルされたコンストラクト)を有した。本実験のタイル状のライブラリーにおいて、各メンバーは、3種の他のメンバーと配列同一性を重複する。タイル状のライブラリー(b型)について、150個の別個のUTR配列のそれぞれに対して4個のタイル状のコンストラクト(82~246塩基対の重複配列同一性で)が存在した(総計600個の可能な正しいアセンブルされたコンストラクト)。ライブラリー毎に、アセンブルされたコンストラクトは、400塩基長であった。
【0096】
各型の検査スプリント分子(図1図2および図5Bのオリゴヌクレオチド構造を参照)を用いて各型のライブラリーを検査し、表1に示す通りに検査される9つのカテゴリーをもたらした。
【0097】
【表1】
【0098】
9つのカテゴリーは全て同じライブラリー中にあり、一体にアセンブルされた。PCR産物をNGS(次世代配列決定)によって配列決定して、正しいアセンブリーの程度を特徴付けた。
【0099】
結果
データを図17に示す。リード(正しいおよび正しくない)の総数についてのデータは、左上グラフに描写されている。これらのデータは、相同性ライブラリー(c型)における図1および図2のインデックスを付したスプリントが、大多数の正しくなくアセンブルされたコンストラクトをもたらしたことを示す。パーセント正確性データ(すなわち、リードの総数と比べた正しいリードの総数)は、左下グラフに描写されている。インデックスを付したスプリント分子の3つの型全てが、複合ライブラリー(a型)において高い正確性を生じ、タイル状のライブラリー(b型)において中等レベルの正確性を生じた。図5Bのスプリント分子のみが、相同ライブラリー(c型)に対して高い正確性を有した。正しいリードデータの中央値は、右上グラフに描写されている。ドロップアウトコンストラクトの数についてのデータは、右下グラフに描写されている。「ドロップアウトコンストラクト」は、正しいリードが存在しない正しいコンストラクトを指す(ライブラリー毎に600個の可能な正しいコンストラクトが存在する)。これらのデータは、図1および図2アセンブリーのインデックスを付したスプリントが、ライブラリーの型毎にドロップアウトコンストラクトを有したことを示す。例えば、図1インデックスを付したスプリントは、複合ライブラリー(a型)について50個を超えるドロップアウトコンストラクト、タイル状のライブラリー(b型)について60個を超えるドロップアウトコンストラクト、および相同ライブラリー(c型)について70個に近いドロップアウトコンストラクトを示した。図5Bインデックスを付したスプリントのライブラリーのいずれについてもドロップアウトコンストラクトは存在しなかった。
【0100】
このデータにおいて図5Bデータの2つの注目すべき側面が観察される。第一に、図5Bインデックスを付したスプリント分子を使用したアセンブリー方法は、有用なレベルの正確性でc型(複合ライブラリー)のライブラリー型をアセンブルすることができる唯一のものであった(左下グラフを参照)。第二に、図5Bインデックスを付したスプリント分子を使用したアセンブリー方法は、ドロップアウトがなかった(右下グラフを参照)。可能な正しいアセンブルされたコンストラクトの全600個は、図5Bアセンブリーにおいてアセンブルされた。対照的に、他の2種のアプローチは、50~80個のドロップアウト、すなわち、600個の可能な正しいコンストラクトで構築されなかったコンストラクトを有した。
【0101】
これらのデータは、図5Bに描写されているインデックスを付したスプリント分子を使用した正しいアセンブリーにおける効果を指し示し、スプリント分子のでたらめなハイブリダイゼーションが原因で他の仕方では不可能であろうコンストラクトの正しいアセンブリーを実証する。
【0102】
[実施例4]
次の実験を設計および実施して、図5Bに示す通りのインデックスを付したスプリント分子を利用したコンストラクトのアセンブルにおける2種の実験変数の効果を測定した。
【0103】
コンストラクト配列を、低相同性ゲノム配列、UTR(非翻訳領域)のセットから得た。融解温度(Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7によって計算されたTm)によって組織化された、スプリントを付した配列のハーフ毎に16種の可変的な長さを設計した。2℃における14℃~44℃の温度閾値をスプリントハーフのために調製した。40個のUTR特有の配列をスプリント設計毎にアセンブルした(16×40=総計640個のUTR配列)。UTR配列のそれぞれに対して10個の特有のバーコードを使用した(総計6,400個の可能な正しいコンストラクト)。アセンブルされたコンストラクトにおいてバーコードが正しくペア形成された場合(NGSによって測定)、「正しい」ペアをコールした。アセンブリーコンポーネントは、フォワードプライマー(上流アセンブリーコンポーネント)およびリバースプライマー(下流アセンブリーコンポーネント)のための配列をさらに含んで、PCT増幅を可能にした。8種の異なるライゲーション温度でライブラリーをアセンブルした。図18は、本実験の図5B検査スプリント分子の模式図を描写する。
【0104】
オリゴライブラリーを、UTRアセンブリーコンポーネントおよび様々な検査スプリント分子から調製した。約80ngのライブラリーを可溶化し(キナーゼ反応およびリガーゼ反応の両方に適したバッファー中に)、次いで、DNAオリゴの5’末端をリン酸化するために、製造業者の推奨に従ってT4ポリヌクレオチドキナーゼ(NEB)を使用したキナーゼ反応に付した。キナーゼ処理された産物を、1.75時間にわたり93℃から44℃へと冷却するウォーターバスにおけるインキュベーションによってハイブリダイズさせて、図5Bに描写されているオリゴヌクレオチド構造を形成した。次に、ハイブリダイズされた産物を検査されているライゲーション温度の1つに加熱し、1マイクロリットル(μl)の9°N(商標)リガーゼ(New England Biolabs Inc.,Ipswich、MA)を添加した。ライゲーション反応を1時間進めた。ライゲーションされた産物を、1.5×AMPure(登録商標)XPビーズ(Beckman Coulter、Brea、CA)を使用して精製し、PCRによって増幅した。PCR産物をNGS(次世代配列決定)によって配列決定して、正しいアセンブリーの程度を特徴付けた。
【0105】
結果
データは全般的に、アセンブリーの特異性が、より高いライゲーション温度で増加することを実証する。データはまた全般的に、短くされたスプリント長さ(より低いTm)を有するアセンブリーコンストラクトの効率が、高いライゲーション温度で減少することを実証する。代表的なデータは、図18中のグラフに描写されている。データは、2個のスプリントセグメントに対するTmの範囲にわたる、図5Bにおけるインデックスを付したスプリント分子を利用して可能な高い程度の正しいアセンブリーを図示する。
【0106】
例示的な実施形態
産物
実施形態1. 2個の核酸コンポーネントをアセンブルしてマルチコンポーネントライゲーション産物を産生するためのオリゴヌクレオチド構造であって、第1の一本鎖オリゴヌクレオチドと、第2の一本鎖オリゴヌクレオチドと、インデックスを付したスプリントとを含み、第1の一本鎖オリゴヌクレオチドおよび第2の一本鎖オリゴヌクレオチドが、インデックスを付したスプリントに部分的にハイブリダイズされている、オリゴヌクレオチド構造。
実施形態2. (a)インデックスを付したスプリントが、スプリント配列、ならびにスプリント配列を挟む第1のインデックス配列および第2のインデックス配列を含み、
(b)スプリント配列が、第1の一本鎖オリゴヌクレオチドの3’端および第2の一本鎖オリゴヌクレオチドの5’端の両方にハイブリダイズされ、
(c)第1のインデックス配列が、第1の一本鎖オリゴヌクレオチドの5’端にハイブリダイズされて、第1の二本鎖インデックスエレメントを形成し、第2のインデックス配列が、第2の一本鎖オリゴヌクレオチドの3’端にハイブリダイズされて、第2の二本鎖インデックスエレメントを形成する、
実施形態1に記載のオリゴヌクレオチド構造。
実施形態3. インデックスを付したスプリントのスプリント配列が、
(a)第2の一本鎖オリゴヌクレオチドの5’端にハイブリダイズされる(それに対する逆相補体である)5’エレメントと、
(b)第1の一本鎖オリゴヌクレオチドの3’端にハイブリダイズされる(それに対する逆相補体である)3’エレメントと
を含有し、スプリント配列の5’エレメントおよび3’エレメントが、接している、すなわち、介在するヌクレオチドがない、実施形態2に記載のオリゴヌクレオチド構造。
実施形態4. (a)の5’ハイブリダイズされたスプリントエレメントおよび(b)の3’ハイブリダイズされたスプリントエレメントのそれぞれが、約14℃~約44℃の融解温度(Tm)を有し、
Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7である、実施形態3に記載のオリゴヌクレオチド構造。
実施形態5. (1)第1のインデックス配列が、インデックスを付したスプリントの3’端に位置し、
(2)第2のインデックス配列が、インデックスを付した配列の5’端に位置する、
実施形態2、3および4のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態6. (a)第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第1の一本鎖オリゴヌクレオチド(左アセンブリーコンポーネント)の5’末端配列を含む第3のインデックス配列と、
(2)マルチコンポーネントライゲーション産物へとライゲーションされる第1のDNA配列コンポーネントであって、第1の一本鎖オリゴヌクレオチド(左アセンブリーコンポーネント)の3’末端配列を含む第1のDNA配列コンポーネントとを含み、
(b)第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第2の一本鎖オリゴヌクレオチドの5’末端配列を含むマルチコンポーネントライゲーション産物へとライゲーションされる第2のDNA配列コンポーネントと、
(2)第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列とを含み、
(c)インデックスを付したスプリントが、5’から3’の向きに、
(1)第2のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)スプリント配列であって、
スプリント配列の5’エレメントが、第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズし(その逆相補体であり)、
スプリント配列の3’エレメントが、第1の一本鎖オリゴヌクレオチドの3’末端配列にハイブリダイズする(その逆相補体である)、スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)第1のインデックス配列である3’末端配列とを含む、
実施形態5に記載のオリゴヌクレオチド構造。
実施形態7. 各スペーサー配列が独立して、1~30ヌクレオチドからなる、実施形態6に記載のオリゴヌクレオチド構造。
実施形態8. (1)第1のインデックス配列が、インデックスを付したスプリントの5’端に位置し、
(2)第2のインデックス配列が、インデックスを付した配列の3’端に位置する、
実施形態2、3および4のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態9. (a)第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第1の一本鎖オリゴヌクレオチドの5’末端配列を含む第3のインデックス配列と、
(2)マルチコンポーネントライゲーション産物へとライゲーションされる第1のDNA配列コンポーネントであって、第1の一本鎖オリゴヌクレオチド(左アセンブリーコンポーネント)の3’末端配列を含む第1のDNA配列コンポーネントとを含み、
(b)第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第2の一本鎖オリゴヌクレオチドの5’末端配列を含むマルチコンポーネントライゲーション産物へとライゲーションされる第2のDNA配列コンポーネントと、
(2)第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列とを含み、
(c)インデックスを付したスプリントが、5’から3’の向きに、
(1)第1のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)スプリント配列であって、
スプリント配列の5’エレメントが、第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズされ(その逆相補体であり)、
スプリント配列の3’エレメントが、第1の一本鎖オリゴヌクレオチド(左アセンブリーコンポーネント)の3’末端配列にハイブリダイズされる(その逆相補体である)、スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)第2のインデックス配列である3’末端配列とを含む、
実施形態8に記載のオリゴヌクレオチド構造。
実施形態10. 各スペーサー配列が独立して、1~30ヌクレオチドからなる、実施形態8または9に記載のオリゴヌクレオチド構造。
実施形態11. 各二本鎖インデックスエレメントが、10~40塩基対を含む、実施形態2から10のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態12. 各二本鎖インデックスエレメントが、約10℃~約80℃の融解温度(Tm)を有し、
Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7である、
実施形態2から11のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態13. 第4のインデックス配列(セグメントF)が、第2のDNA配列コンポーネントに除去可能に(または取り外し可能に)連結される、実施形態6、7、9、10および11のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態14. 第2の一本鎖オリゴヌクレオチドが、第2のDNA配列コンポーネントに対して3’にあるII型制限酵素部位をさらに含み、切断の制限酵素部位が、第2のDNA配列コンポーネントの直接3’にある、実施形態13に記載のオリゴヌクレオチド構造。
実施形態15. 第2の一本鎖オリゴヌクレオチドが、切断可能なリンカーによって第2のDNA配列コンポーネントに除去可能に(または取り外し可能に)連結され、切断の部位が、第2のDNA配列コンポーネントの直接3’にある、実施形態13に記載のオリゴヌクレオチド構造。
実施形態16. セグメントDまたはセグメントEの配列セグメントにハイブリダイズされる(その逆相補体である)少なくとも1個のブロッキングオリゴヌクレオチドコンポーネントをさらに含み、配列セグメントが、スプリントにハイブリダイズされる配列を除外する、実施形態2から15のいずれか1つに記載のオリゴヌクレオチド構造。
実施形態17. 実施形態1から16のいずれか1つに記載のオリゴヌクレオチド構造のセットまたはライブラリー。
実施形態18. 実施形態17に記載のセットまたはライブラリーを含むキット。
実施形態19. DNAリガーゼをさらに含む、実施形態18に記載のキット。
【0107】
方法
実施形態20. 2個の核酸コンポーネントをアセンブルしてマルチコンポーネントライゲーション産物を産生するための方法であって、
(A)第1のDNA配列コンポーネントを含む第1の一本鎖オリゴヌクレオチドおよび第2のDNA配列コンポーネントを含む第2の一本鎖オリゴヌクレオチドを、インデックスを付したスプリントにハイブリダイズさせるステップであって、第1の一本鎖オリゴヌクレオチドの5’端および3’端の両方が、インデックスを付したスプリントにハイブリダイズされ、第2の一本鎖オリゴヌクレオチドの5’端および3’端の両方が、インデックスを付したスプリントにハイブリダイズされる、ステップと、
(B)第1の一本鎖オリゴヌクレオチドの3’端を第2の一本鎖オリゴヌクレオチドの5’端にライゲーションし、これにより、第1のマルチコンポーネントライゲーション産物を産生するステップとを含む方法。
実施形態21. (a)インデックスを付したスプリントが、スプリント配列、ならびにスプリント配列を挟む第1のインデックス配列および第2のインデックス配列をさらに含み、
(b)スプリント配列が、第1の一本鎖オリゴヌクレオチドの3’端および第2の一本鎖オリゴヌクレオチドの5’端の両方にハイブリダイズし、
(c)第1のインデックス配列が、第1の一本鎖オリゴヌクレオチドの5’端にハイブリダイズして、第1の二本鎖インデックスエレメントを形成し、第2のインデックス配列が、第2の一本鎖オリゴヌクレオチドの3’端にハイブリダイズして、第2の二本鎖インデックスエレメントを形成する、実施形態20に記載の方法。
実施形態22. インデックスを付したスプリントのスプリント配列が、
(a)二本鎖5’スプリントエレメントを形成する、第2の一本鎖オリゴヌクレオチドの5’端にハイブリダイズする5’エレメントと、
(b)二本鎖3’スプリントエレメントを形成する、第1の一本鎖オリゴヌクレオチドの3’端にハイブリダイズする3’エレメントと
を含有し、スプリント配列の5’エレメントおよび3’エレメントが、接している、すなわち、介在するヌクレオチドがない、実施形態21に記載の方法。
実施形態23. 二本鎖5’スプリントエレメントおよび二本鎖3’スプリントエレメントがそれぞれ、約10℃~約80℃の融解温度(Tm)を有し、
Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7である、
実施形態22に記載の方法。
実施形態24. (1)第1のインデックス配列が、インデックスを付したスプリントの3’端に位置し、
(2)第2のインデックス配列が、インデックスを付したスプリントの5’端に位置する、
実施形態21、22または23に記載の方法。
実施形態25. (a)第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第1の一本鎖オリゴヌクレオチドの5’末端配列を含む第3のインデックス配列と、
(2)マルチコンポーネントライゲーション産物へとライゲーションされる第1のDNA配列コンポーネントであって、第1の一本鎖オリゴヌクレオチドの3’末端配列を含む第1のDNA配列コンポーネントとを含み、
(b)第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第2の一本鎖オリゴヌクレオチドの5’末端配列を含むマルチコンポーネントライゲーション産物へとライゲーションされる第2のDNA配列コンポーネントと、
(2)第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列とを含み、
(c)インデックスを付したスプリントが、5’から3’の向きに、
(1)第2のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)スプリント配列であって、
スプリント配列の5’エレメントが、第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズし、
スプリント配列の3’エレメントが、第1の一本鎖オリゴヌクレオチドの3’末端配列にハイブリダイズする、スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)第1のインデックス配列である3’末端配列とを含む、
実施形態24に記載の方法。
実施形態26. 各スペーサー配列が独立して、1~30ヌクレオチドからなる、実施形態25に記載の方法。
実施形態27. (1)第1のインデックス配列が、インデックスを付したスプリントの5’端に位置し、
(2)第2のインデックス配列が、インデックスを付したスプリントの3’端に位置する、
実施形態21、22または23に記載の方法。
実施形態28. (a)第1の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第1の一本鎖オリゴヌクレオチドの5’末端配列を含む第3のインデックス配列と、
(2)マルチコンポーネントライゲーション産物へとライゲーションされる第1のDNA配列コンポーネントであって、第1の一本鎖オリゴヌクレオチドの3’末端配列を含む第1のDNA配列コンポーネントとを含み、
(b)第2の一本鎖オリゴヌクレオチドが、5’から3’の向きに、
(1)第2の一本鎖オリゴヌクレオチドの5’末端配列を含むマルチコンポーネントライゲーション産物へとライゲーションされる第2のDNA配列コンポーネントと、
(2)第2の一本鎖オリゴヌクレオチドの3’末端配列を含む第4のインデックス配列とを含み、
(c)インデックスを付したスプリントが、5’から3’の向きに、
(1)第1のインデックス配列である5’末端配列と、
(2)任意選択的な第1のスペーサー配列と、
(3)スプリント配列であって、
スプリント配列の5’エレメントが、第2の一本鎖オリゴヌクレオチドの5’末端配列にハイブリダイズし、
スプリント配列の3’エレメントが、第1の一本鎖オリゴヌクレオチドの3’末端配列にハイブリダイズする、スプリント配列と、
(4)任意選択的な第2のスペーサー配列と、
(5)第2のインデックス配列である3’末端配列とを含む、
実施形態27に記載の方法。
実施形態29. 各スペーサー配列が独立して、1~30ヌクレオチドからなる、実施形態27または28に記載の方法。
実施形態30. 各二本鎖インデックスエレメントが、10~40塩基対を含む、実施形態21から29のいずれか1つに記載の方法。
実施形態31. 各二本鎖インデックスエレメントが、約10℃~約80℃の融解温度(Tm)を有し、
Tm=(2*(A数値+T数値))+(4*(C数値+G数値))-7である、
実施形態21から30のいずれか1つに記載の方法。
実施形態32. (C)マルチコンポーネントライゲーション産物からインデックスを付したスプリントを変性させるステップと、
その後、ステップ(A)、(B)および(C)を反復的に行うステップと
をさらに含む、実施形態20から31のいずれか1つに記載の方法。
実施形態33. 第4のインデックス配列が、第2のDNA配列コンポーネントに除去可能に(または取り外し可能に)連結される、実施形態20から32のいずれか1つに記載の方法。
実施形態34. 第2の一本鎖オリゴヌクレオチドが、第2のDNA配列コンポーネントに対して3’にあるIIs型制限酵素部位をさらに含み、制限酵素切断の部位が、第2のDNA配列コンポーネントの直接3’にある、実施形態33に記載の方法。
実施形態35. 第4のインデックス配列が、切断可能な(または取り外し可能な)リンカーによって第2のDNA配列コンポーネントに連結され、切断の部位が、第2のDNA配列コンポーネントの直接3’にある、実施形態33に記載の方法。
実施形態36. 第1のライゲーション産物における第2のDNAコンポーネントから第4のインデックス配列を除去するステップと、
第4のインデックス配列を有するさらに別の第2の一本鎖オリゴヌクレオチド、および第2のスプリント配列を含むさらに別のインデックスを付したスプリントを用意するステップと、
その後、ステップ(A)、(B)および(C)を行うステップと
をさらに含み、第1のライゲーション産物が、ステップ(A)の第1の一本鎖オリゴヌクレオチドであり、
さらに別のインデックスを付したスプリントの第2のスプリント配列が、さらに別の第2の一本鎖オリゴヌクレオチドにおける5’末端配列にハイブリダイズする5’エレメント、および第1のライゲーション産物の3’末端配列にハイブリダイズする3’エレメントを含有する、実施形態33から35のいずれか1つに記載の方法。
実施形態37. インデックスを付したスプリントが、第5のインデックス配列に隣接する第2のスプリント配列をさらに含み、第2のスプリント配列の5’エレメントが、第2のDNA配列コンポーネントの3’末端配列にハイブリダイズすることができる、実施形態33から35のいずれか1つに記載の方法。
実施形態38. 第3のインデックス配列が、第1のDNA配列コンポーネントに除去可能に(または取り外し可能に)連結される、実施形態20から32のいずれか1つに記載の方法。
実施形態39. 第1の一本鎖オリゴヌクレオチドが、第1のDNA配列コンポーネントに対して5’にあるIIs型制限酵素部位をさらに含み、制限酵素切断の部位が、第1のDNA配列コンポーネントの直接5’にある、実施形態38に記載の方法。
実施形態40. 第3のインデックス配列が、切断可能な(または取り外し可能な)リンカーによって第1のDNA配列コンポーネントに連結され、切断の部位が、第1のDNA配列コンポーネントの直接5’にある、実施形態38に記載の方法。
実施形態41. 第1のライゲーション産物における第1のDNA配列コンポーネントから第3のインデックス配列を除去するステップと、
第3のインデックス配列を有するさらに別の第1の一本鎖オリゴヌクレオチド、およびさらに別のインデックスを付したスプリントを用意するステップと、
その後、ステップ(A)、(B)および(C)を行うステップと
をさらに含み、第1のライゲーション産物が、ステップ(A)の第2の一本鎖オリゴヌクレオチドであり、
さらに別のインデックスを付したスプリントのスプリント配列が、さらに別の第1の一本鎖オリゴヌクレオチドにおける3’末端配列にハイブリダイズする3’エレメント、および第1のライゲーション産物における5’末端配列にハイブリダイズする(それに対する逆相補体である)5’エレメントを含有する、実施形態38から40のいずれか1つに記載の方法。
実施形態42. ハイブリダイズするステップが、インデックスエレメントの融解温度(Tm)に基づく温度の範囲で行われ、
ライゲーションするステップが、スプリント配列の5’および3’エレメントの融解温度(Tm)よりも高く、インデックスエレメントの融解温度(Tm)よりも低い温度で行われる、実施形態20から41のいずれか1つに記載の方法。
実施形態43. ライゲーションステップの温度が、約45°~70℃であり、リガーゼが熱安定性である、実施形態20から42のいずれか1つに記載の方法。
実施形態44. インデックスエレメントの融解温度が、約60°~90℃である、実施形態20から43のいずれか1つに記載の方法。
実施形態45. 5’スプリントエレメントおよび3’スプリントエレメントの融解温度が、約20°~42℃である、実施形態20から44のいずれか1つに記載の方法。
【0108】
例示的なまたは好まれる実施形態の先の記載は、特許請求の範囲によって定義される本開示の限定ではなく例証として解釈されるべきである。容易に認められる通り、特許請求の範囲に示す本開示から逸脱することなく、上に示す特色の多数の変種および組合せを利用することができる。そのような変種は、本開示の範囲からの逸脱として考慮されず、そのような変種は全て、次の特許請求の範囲の範囲内に含まれることが意図される。本明細書に引用されるあらゆる参考文献は、それらの全体が参照により本明細書に組み込まれる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
【国際調査報告】