(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-02
(54)【発明の名称】バーコードに基づいた核酸配列アセンブリ
(51)【国際特許分類】
C12N 15/10 20060101AFI20221125BHJP
【FI】
C12N15/10 Z ZNA
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021576310
(86)(22)【出願日】2020-06-19
(85)【翻訳文提出日】2022-02-21
(86)【国際出願番号】 US2020038679
(87)【国際公開番号】W WO2020257612
(87)【国際公開日】2020-12-24
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521556635
【氏名又は名称】ツイスト バイオサイエンス コーポレーション
(74)【代理人】
【識別番号】100082072
【氏名又は名称】清原 義博
(72)【発明者】
【氏名】ニュージェント,レベッカ
(72)【発明者】
【氏名】チェン,スユエン
(72)【発明者】
【氏名】ケトルバラ,ロス
(72)【発明者】
【氏名】リー,エリアン
(72)【発明者】
【氏名】レイナード,ネイサン
(57)【要約】
【解決手段】本明細書に提供されるのは、有効な核酸アセンブリのための方法、システムおよび組成物である。核酸アセンブリは、一対になった相同性を含む変異体のアセンブリを含むことができる。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
核酸アセンブリのための方法であって、該方法は、
(a)第1の複数のポリヌクレオチドを提供する工程であって、ここで、前記第1の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の第1の末端領域を含む、工程と、
(b)第2の複数のポリヌクレオチドを提供する工程であって、ここで、前記第2の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の前記第1の末端領域に対する配列相同性の第2の末端領域を含む、工程と、
(c)核酸のライブラリーをアセンブルするために、前記第1の複数のポリヌクレオチドおよび前記第2の複数のポリヌクレオチドを、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程であって、ここで、核酸の少なくとも80%は、各々が、ライブラリーの核酸の各々の平均頻度の2倍(2x)以内の量でライブラリーにおいて存在する、工程と、を含む、方法。
【請求項2】
前記第1の複数のポリヌクレオチドは、最大で100の異なる配列を含む、請求項1に記載の方法。
【請求項3】
前記 第2の複数のポリヌクレオチドは、最大で100の異なる配列を含む、請求項1に記載の方法。
【請求項4】
少なくとも10,000の核酸がアセンブルされる、請求項1に記載の方法。
【請求項5】
少なくとも100,000の核酸がアセンブリされる、請求項1に記載の方法。
【請求項6】
前記第1の複数のポリヌクレオチドの各々のポリヌクレオチドは、最大で2500塩基長を含む、請求項1に記載の方法。
【請求項7】
前記第2の複数のポリヌクレオチドの各ポリヌクレオチドは、最大で2500の塩基長を含む、請求項1に記載の方法。
【請求項8】
前記エキソヌクレアーゼは、エキソヌクレアーゼIIIである、請求項1に記載の方法。
【請求項9】
前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項1に記載の方法。
【請求項10】
前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である、請求項9に記載の方法。
【請求項11】
前記ポリメラーゼは、5’~3’のポリメラーゼ活性を含む、請求項1に記載の方法。
【請求項12】
前記ポリメラーゼはDNAポリメラーゼである、請求項1に記載の方法。
【請求項13】
前記リガーゼは、少なくとも2つの核酸の結合を触媒する、請求項1に記載の方法。
【請求項14】
核酸アセンブリのための方法であって、該方法は、
(a)5’~3’の順番でバーコード配列、第1の制限エンドヌクレアーゼ部位、第2の制限エンドヌクレアーゼ部位、および第1の超可変領域配列を含む第1の核酸をデノボ合成する工程と、
(b)5’~3’の順番で任意の定義された配列長さの第1の領域、自己切断型ペプチド配列、第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第2の核酸をデノボ合成する工程と、
(c)第3の核酸を生成するために、前記第1の核酸と前記第2の核酸を接触させる工程と、
(d)5’~3’の順番でベクター配列、第2の可変領域配列に隣接する第2の相補的領域、第2の可変領域配列、第2の超可変領域配列、第1の制限エンドヌクレアーゼ部位、およびバーコード配列を含む第4の核酸を提供する工程と、
(e)前記第3の核酸および前記第4の核酸を制限エンドヌクレアーゼと接触させる工程と、
(f)1つ以上の酵素を含む反応混合物を使用して前記第3の核酸および前記第4の核酸をアセンブルする工程と、を含む、方法。
【請求項15】
前記第1の制限エンドヌクレアーゼ部位、または前記第2の制限エンドヌクレアーゼ部位は、IIS型制限エンドヌクレアーゼ(TIIS-RE)部位である、請求項14に記載の方法。
【請求項16】
前記制限エンドヌクレアーゼは、IIS型制限エンドヌクレアーゼである、請求項14に記載の方法。
【請求項17】
反応混合物はリガーゼを含む、請求項14に記載の方法。
【請求項18】
前記第1の超可変領域配列および前記第2の超可変領域配列は、各々が相補性決定領域(CDR)を含む、請求項14に記載の方法。
【請求項19】
前記CDRはCDR3である、請求項18に記載の方法。
【請求項20】
前記自己切断型ペプチドはP2Aである、請求項14に記載の方法。
【請求項21】
前記第1の可変領域配列の約100の変異体が合成される、請求項14に記載の方法。
【請求項22】
前記第2の可変領域配列の約130の変異体が合成される、請求項14に記載の方法。
【請求項23】
第1のバーコード配列に相補的な第1のプライマー、およびアンプリコンの少なくとも99%が欠失がない第2のプライマーを用いて、核酸を増幅する工程と、をさらに含む、請求項14に記載の方法。
【請求項24】
核酸アセンブリのための方法であって、該方法は、
(a)第1の可変領域配列を含む第1の核酸をデノボ合成する工程と、
(b)第2の可変領域配列を含む第2の核酸をデノボ合成する工程と、
(c)5’~3’の順番で固定された可変性配列の第1の領域、任意の定義された配列長さの第1の領域、自己切断型ペプチド配列、第1の可変領域配列に隣接する第1の相補的領域、および固定された可変性配列の第2の領域を含む第3の核酸をデノボ合成する工程と、
(d)前記第1の核酸、前記第2の核酸、前記第3の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、を含む、方法。
【請求項25】
前記第1の可変領域配列、または前記第2の可変領域配列は、超可変領域配列を用いて増幅される、請求項24に記載の方法。
【請求項26】
前記超可変領域配列は、CDRを含む、請求項25に記載の方法。
【請求項27】
前記CDRはCDR3である、請求項26に記載の方法。
【請求項28】
任意の定義された長さの1つ以上の領域を含む配列と接触させる工程をさらに含む、請求項24に記載の方法。
【請求項29】
前記第1の可変領域配列の約100の変異体が合成される、請求項24に記載の方法。
【請求項30】
前記第2の可変領域配列の約130の変異体が合成される、請求項24に記載の方法。
【請求項31】
前記自己切断型ペプチドはP2Aである、請求項24に記載の方法。
【請求項32】
前記エキソヌクレアーゼは、エキソヌクレアーゼIIIである、請求項24に記載の方法。
【請求項33】
前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項24に記載の方法。
【請求項34】
前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である、請求項33に記載の方法。
【請求項35】
前記ポリメラーゼは、5’~3’のポリメラーゼ活性を含む、請求項24に記載の方法。
【請求項36】
前記ポリメラーゼはDNAポリメラーゼである、請求項24に記載の方法。
【請求項37】
前記リガーゼは、少なくとも2つの核酸の結合を触媒する、請求項24に記載の方法。
【請求項38】
前記固定された可変性配列の第1の領域、および前記固定された可変性配列の第2の領域は、各々が約10~約100の塩基対である、請求項24に記載の方法。
【請求項39】
前記固定された可変性配列の第1の領域、および前記固定された可変性配列の第2の領域は、各々が約40の塩基対である、請求項24に記載の方法。
【請求項40】
核酸アセンブリのための方法であって、該方法は、
(a)任意の定義された長さの配列の第1の領域を含む第1の核酸を提供する工程と、
(b)任意の定義された長さの配列の第2の領域を含む第2の核酸を提供する工程と、
(c)5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、第1の可変領域配列、および第1の超可変領域配列を含む第3の核酸をアセンブルする工程と、
(d)5’~3’の順番で第2の可変領域配列に隣接する第2の相補的領域、第2の可変領域配列、および第2の超可変領域配列を含む第4の核酸をアセンブルする工程と、
(e)前記第1の核酸と、前記第2の核酸と、前記第3の核酸と第4の核酸とを接触させる工程と、
(f)工程(e)から産物を増幅する工程と、を含む、方法。
【請求項41】
エラー修正工程をさらに含む、請求項40に記載の方法。
【請求項42】
工程(e)の間に、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物を接触させる工程をさらに含む、請求項40に記載の方法。
【請求項43】
前記第1の超可変領域配列および前記第2の超可変領域配列は、各々が相補性決定領域(CDR)を含む、請求項40に記載の方法。
【請求項44】
前記CDRはCDR3である、請求項43に記載の方法。
【請求項45】
前記第1の核酸は、約300~約700の塩基対を含む、請求項40に記載の方法。
【請求項46】
前記第2の核酸は、約200~約600の塩基対を含む、請求項40に記載の方法。
【請求項47】
前記第3の核酸は、約200~約600の塩基対を含む、請求項40に記載の方法。
【請求項48】
前記第4の核酸は、約200~約600の塩基対を含む、請求項40に記載の方法。
【請求項49】
核酸アセンブリのための方法であって、該方法は、
(a)
i.5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸と、
ii.5’~3’の順番で固定された可変性配列の第1の領域、および第1の超可変領域配列を含む第2の核酸と、
iii.第2の可変領域配列を含む第3の核酸と、
iv.5’~3’の順番で制限エンドヌクレアーゼ部位、および固定された可変性配列の第2の領域を含む第4の核酸と、
v.5’~3’の順番で固定された可変性配列の第2の領域、第2の超可変領域配列、および可変定常領域配列を含む第5の核酸と、をデノボ合成する工程と、
(b)前記第1の核酸、前記第2の核酸、前記第3の核酸、前記第4の核酸、および前記第5の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、
(c)工程(b)の構築物を、ベクター配列へとクローン化する工程と、を含む、方法。
【請求項50】
前記第1の超可変領域配列および前記第2の超可変領域配列は、各々が相補性決定領域(CDR)を含む、請求項49に記載の方法。
【請求項51】
前記CDRはCDR3である、請求項49に記載の方法。
【請求項52】
1つ以上の可変定常領域を接触させる工程をさらに含む、請求項49に記載の方法。
【請求項53】
前記エキソヌクレアーゼは、エキソヌクレアーゼIIIである、請求項49に記載の方法。
【請求項54】
前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項49に記載の方法。
【請求項55】
前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である、請求項54に記載の方法。
【請求項56】
前記ポリメラーゼは、5’~3’のポリメラーゼ活性を含む、請求項49に記載の方法。
【請求項57】
核酸アセンブリのための方法であって、該方法は、
(a)5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸を提供する工程と、
(b)5’~3’の順番で固定された可変性配列の第1の領域、第1の超可変領域配列、制限エンドヌクレアーゼ部位、第2の超可変領域配列、およびユニバーサルプライマーを含む第2の核酸配列を提供する工程と、
(c)第3の核酸を生成するために、前記第1の核酸と前記第2の核酸を増幅させる工程と、
(d)第1の可変領域配列に隣接する第1の相補的領域、および任意の定義された長さの配列の第1の領域を含むベクター配列を提供する工程と、
(e)前記第3の核酸と前記ベクター配列とを接触させる工程と、
(f)5’~3’の順番で自己切断型ペプチド配列、第2の可変領域配列に隣接する第2の相補的領域、および第2の可変領域配列を含む第4の核酸と接触させる工程と、を含む、方法。
【請求項58】
第1の超可変領域配列および第2の超可変領域配列は、各々が相補性決定領域(CDR)を含む、請求項57に記載の方法。
【請求項59】
前記CDRはCDR3である、請求項58に記載の方法。
【請求項60】
前記自己切断型ペプチドはP2Aである、請求項57に記載の方法。
【請求項61】
核酸アセンブリのための方法であって、該方法は、
(a)
i.第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸と、
ii.第1の超可変領域配列を含む第2の核酸と、
iii.第2の可変領域配列を含む第3の核酸と、
iv.5’~3’の順番で第1の超可変領域配列、固定された可変性の第1の領域、およびバーコードを含む第4の核酸と、をデノボ合成する行程と、
(b)第5の核酸を生成するために、前記第1の核酸および前記第2の核酸を増幅させる工程と、
(c)第5の核酸を生成するために、前記第3の核酸および前記第4の核酸を増幅させる行程と、
(d)第7の核酸を生成するために、前記第5の核酸および第6の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程と、
(e)前記第7の核酸を環状化させる行程と、
(f)前記第7の核酸をバーコードを使用して配列決定および同定する行程と、
(g)前記第7の核酸を増幅する行程と、
(h)前記第7の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物を使用してベクターにアセンブルする行程と、を含む、方法。
【請求項62】
前記第1の可変領域配列、または前記第2の可変領域配列は、超可変領域配列を用いて増幅される、請求項61に記載の方法。
【請求項63】
前記超可変領域配列はCDRを含む、請求項62に記載の方法。
【請求項64】
CDRはCDR3である、請求項63に記載の方法。
【請求項65】
任意の定義された長さの1つ以上の領域を含む配列と接触する行程をさらに含む、請求項61に記載の方法。
【請求項66】
前記第1の可変領域配列の約100の変異体が合成される、請求項61に記載の方法。
【請求項67】
前記第2の可変領域配列の約130の変異体が合成される、請求項61に記載の方法。
【請求項68】
前記自己切断型ペプチドはP2Aである、請求項61に記載の方法。
【請求項69】
前記エキソヌクレアーゼは、エキソヌクレアーゼIIIである、請求項61に記載の方法。
【請求項70】
前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項61に記載の方法。
【請求項71】
前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である、請求項70に記載の方法。
【請求項72】
前記ポリメラーゼは、5’~3’のポリメラーゼ活性を含む、請求項61に記載の方法。
【請求項73】
前記ポリメラーゼはDNAポリメラーゼである、請求項61に記載の方法。
【請求項74】
前記リガーゼは、少なくとも2つの核酸の結合を触媒する、請求項61に記載の方法。
【請求項75】
前記固定された可変性配列の第1の領域および前記固定された可変性配列の第2の領域は、各々が約10~約100の塩基対である、請求項61に記載の方法。
【請求項76】
前記固定された可変性配列の第1の領域および前記固定された可変性配列の第2の領域は、各々が約40の塩基対である、請求項61に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本発明は、2019年6月21日に出願の米国仮特許出願第62/865,094号の利益を主張し、これは引用によって本明細書に組み込まれる。
【背景技術】
【0002】
デノボ核酸合成は、基礎的な生物学的研究およびバイオテクノロジーでの適用のための強力なツールである。小規模での比較的短い核酸断片の合成のための様々な方法が知られているが、これらの技術には、スケーラビリティ、自動化、速度、精度、およびコストの点で問題がある。したがって、必要は変異体核酸アセンブリの有効な方法の必要性が残る。
【発明の概要】
【0003】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:(a)第1の複数のポリヌクレオチドを提供する工程であって、ここで、第1の複数のポリヌクレオチドの各々のリヌクレオチドは、配列相同性の第1の末端領域を含む、工程と、(b)第2の複数のポリヌクレオチドを提供する工程であって、ここで、第2の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の第2の末端領域~配列相同性の前記第1の末端領域を含む、工程と、(c)核酸のライブラリをアセンブリするために、第1の複数のポリヌクレオチドおよび第2の複数のポリヌクレオチドを、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程であって、ここで、核酸の少なくとも80%は、各々が、ライブラリの核酸の各々の平均頻度の2倍(2x)内の量でライブラリにおいて存在する、工程と、を含む。本明細書にはさらに、第1の複数のポリヌクレオチドが最大100の異なる配列を含む方法が提供される。本明細書にはさらに、第2の複数のポリヌクレオチドが最大100の異なる配列を含む方法が提供される。本明細書にはさらに、少なくとも10,000の核酸がアセンブリされる方法が提供される。本明細書にはさらに、少なくとも100,000の核酸がアセンブリされる方法が提供される。本明細書にはさらに、第1の複数のポリヌクレオチドの各ポリヌクレオチドが、最大で2500の塩基長を含む方法が提供される。本明細書にはさらに、第2の複数のポリヌクレオチドの各ポリヌクレオチドが、最大で2500の塩基長を含む方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼIIIである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップエンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である方法が提供される。本明細書にはさらに、ポリメラーゼが、5’~3’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがDNAポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも2つの核酸の結合を触媒する方法が提供される。
【0004】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:5’~3’の順番でバーコード配列、第1の制限エンドヌクレアーゼ部位、第2の制限エンドヌクレアーゼ部位、および第1の超可変領域配列を含む第1の核酸をデノボ合成する工程と、5’~3’の順番で任意の定義された配列長さの第1の領域、自己切断型ペプチド配列、第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第2の核酸をデノボ合成する工程と、第3の核酸を生成するために、第1の核酸と第2の核酸を接触させる工程と、5’~3’の順番でベクター配列、第2の可変領域配列に隣接する第2の相補的な領域、第2の可変領域配列、第2の超可変領域配列、第1の制限エンドヌクレアーゼ部位、およびバーコード配列を含む第4の核酸を提供する工程と、第3の核酸および第4の核酸を制限エンドヌクレアーゼと接触させる工程と、1つ以上酵素を含む反応混合物を使用して第3の核酸および第4の核酸をアセンブルする工程と、を含む。本明細書にはさらに、第1の制限エンドヌクレアーゼ部位、または第2の制限エンドヌクレアーゼ部位が、IIS型制限エンドヌクレアーゼ(TIIS-RE)部位である方法が提供される。本明細書にはさらに、制限エンドヌクレアーゼがIIS型制限エンドヌクレアーゼである方法が提供される。本明細書にはさらに、反応混合物がリガーゼを含む方法が提供される。本明細書にはさらに、第1の超可変領域配列および前記第2の超可変領域配列が、各々が相補性決定領域(CDR)を含む方法が提供される。本明細書にはさらに、CDRがCDR3である方法が提供される。本明細書にはさらに、自己切断型ペプチドがP2Aである方法が提供される。本明細書にはさらに、第1の可変領域配列の約100の変異体が合成される方法が提供される。本明細書にはさらに、第2の可変領域配列の約130の変異体が合成される方法が提供される。本明細書にはさらに、核酸を、第1のバーコード配列に相補的な第1のプライマー、およびアンプリコンの少なくとも99%が欠失がない第2のプライマーで増幅する工程と、をさらに含む方法が提供される。
【0005】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:第1の可変領域配列を含む第1の核酸をデノボ合成する工程と、第2の可変領域配列を含む第2の核酸をデノボ合成する工程と、5’~3’の順番で固定された可変性配列の第1の領域、任意の定義された配列長さの第1の領域、自己切断型ペプチド配列、第1の可変領域配列に隣接する第1の相補的領域、および固定された可変性配列の第2の領域を含む第3の核酸をデノボ合成する工程と、第1の核酸、第2の核酸、第3の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、を含む。本明細書にはさらに、第1の可変領域配列、または第2の可変領域配列が、超可変領域配列で増幅される方法が提供される。本明細書にはさらに、超可変領域配列がCDRを含む方法が提供される。本明細書にはさらに、CDRがCDR3である方法が提供される。本明細書にはさらに、任意の定義された長さの配列の1つ以の領域を含むと接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第1の可変領域配列の約100の変異体が合成される方法が提供される。本明細書にはさらに、第2の可変領域配列の約130の変異体が合成される方法が提供される。本明細書にはさらに、自己切断型ペプチドがP2Aである方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼIIIである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップエンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である方法が提供される。本明細書にはさらに、ポリメラーゼが、5’~3’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがDNAポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも2つの核酸の結合を触媒する方法が提供される。本明細書にはさらに、固定された可変性配列の第1の領域および固定された可変性配列の第2の領域が、各々が約10~約100の塩基対である方法が提供される。本明細書にはさらに、固定された可変性配列の第1の領域および固定された可変性配列の第2の領域が、各々が約40の塩基対である方法が提供される。
【0006】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:任意の定義された長さの配列の第1の領域を含む第1の核酸を提供する工程と、任意の定義された長さの配列の第2の領域を含む第2の核酸を提供する工程と、5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、第1の可変領域配列、および第1の超可変領域配列を含む第3の核酸をアセンブルする工程と、5’~3’の順番で第2の可変領域配列に隣接する第2の相補的領域、第2の可変領域配列、および第2の超可変領域配列を含む第4の核酸をアセンブルする工程と、第1の核酸と、前記第2の核酸と、前記第3の核酸と第4の核酸とを接触させる工程と、結果として生じる産物を増幅させる行程と、を含む。本明細書にはさらに、エラー修正工程をさらに含む方法が提供される。本明細書にはさらに、第1の核酸、第2の核酸、第3の核酸および第4の核酸と接触させる工程の間に、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第1の超可変領域配列および前記第2の超可変領域配列が、各々が相補的を含む方法が提供される。本明細書にはさらに、第1の核酸が約300~約700の塩基対を含む方法が提供される。本明細書にはさらに、第2の核酸が約200~約600の塩基対を含む方法が提供される。本明細書にはさらに、第3の核酸が約200~約600の塩基対を含む方法が提供される。本明細書にはさらに、第4の核酸が約200~約600の塩基対を含む方法が提供される。
【0007】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸と、5’~3’の順番で固定された可変性配列の第1の領域、および第1の超可変領域配列を含む第2の核酸と、第2の可変領域配列を含む第3の核酸と、5’~3’の順番で制限エンドヌクレアーゼ部位、および固定された可変性配列の第2の領域を含む第4の核酸と、5’~3’の順番で固定された可変性配列の第2の部位、第2の超可変領域配列、および可変定常領域配列を含む第5の核酸と、をデノボ合成する工程と、第1の核酸、第2の核酸、第3の核酸、第4の核酸、および第5の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、工程bの構築物を、ベクター配列へとクローン化する工程と、を含む。本明細書にはさらに、第1の超可変領域配列および前記第2の超可変領域配列が、各々が相補性決定領域(CDR)を含む方法が提供される。本明細書にはさらに、CDRがCDR3である方法が提供される。本明細書にはさらに、1つ以上の可変定常領域と接触させる行程をさらに含む方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼIIIである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である方法が提供される。本明細書にはさらに、ポリメラーゼが、5’~3’のポリメラーゼ活性を含む方法が提供される。
【0008】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:5’~3’の順番で第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸を提供する工程と、5’~3’の順番で固定された可変性配列の第1の領域、第1の超可変領域配列、制限エンドヌクレアーゼ部位、第2の超可変領域配列、およびユニバーサルプライマーを含む第2の核酸配列を提供する工程と、第3の核酸を生成するために、第1の核酸と第2の核酸を増幅させる工程と、第1の可変領域配列に隣接する第1の相補的領域、および任意の定義された長さの配列の第1の領域を含むベクター配列を提供する工程と、第3の核酸とベクター配列と接触させる工程と、5’~3’の順番で自己切断型ペプチド配列、第2の可変領域配列に隣接する第2の相補的領域、および第2の可変領域配列を含む第4の核酸と接触させる工程と、を含む。本明細書にはさらに、第1の超可変領域配列および前記第2の超可変領域配列が、各々が相補性決定領域(CDR)を含む方法が提供される。本明細書にはさらに、CDRがCDR3である方法が提供される。本明細書にはさらに、自己切断型ペプチドがP2Aである方法が提供される。
【0009】
本明細書には、核酸アセンブリのための方法が提供され、該方法は:i.第1の可変領域配列に隣接する第1の相補的領域、および第1の可変領域配列を含む第1の核酸と、第1の超可変領域配列を含む第2の核酸と、第2の可変領域配列を含む第3の核酸と、5’~3’の順番で第1の超可変領域配列、固定された可変性の第1の領域、およびバーコードを含む第4の核酸と、をデノボ合成する行程と、第5の核酸を生成するに、第1の核酸および第2の核酸を増幅する工程と、第5の核酸を生成するために、第3の核酸および第4の核酸を増幅する行程と、第7の核酸を生成するために、第5の核酸および第6の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程と、第7の核酸を環状化させる行程と、第7の核酸を、バーコードを使用して配列決定および同定する行程と、第7の核酸を増幅させる行程と、第7の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物を使用してベクターにアセンブルする行程と、を含む。本明細書にはさらに、第1の可変領域配列、または第2の可変領域配列が、超可変領域配列で増幅される方法が提供される。本明細書にはさらに、超可変領域配列がCDRを含む方法が提供される。本明細書にはさらに、CDRがCDR3である方法が提供される。本明細書にはさらに、任意の定義された長さの配列の1つ以の領域を含むと接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第1の可変領域配列の約100の変異体が合成される方法が提供される。本明細書にはさらに、第2の可変領域配列の約130の変異体が合成される方法が提供される。本明細書にはさらに、自己切断型ペプチドがP2Aである方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼIIIである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップ弁エンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、XPG、Dna2、またはGEN1である方法が提供される。本明細書にはさらに、ポリメラーゼが、5’~3’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがDNAポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも2つの核酸の結合を触媒する方法が提供される。本明細書にはさらに、固定された可変性配列の第1の領域および固定された可変性配列の第2の領域が、各々が約10~約100の塩基対である方法が提供される。本明細書にはさらに、固定された可変性配列の第1の領域および固定された可変性配列の第2の領域が、各々が約40の塩基対である方法が提供される。
【0010】
引用による組み込み
本明細書で明記されるすべての公開物、特許、および特許出願は、個々の公開物、特許、または特許出願がそれぞれ参照により組み込まれるべく特別かつ個別に示されるかのような同じ程度で、参照により本明細書に組み込まれる。
【図面の簡単な説明】
【0011】
【
図1A】
図1Aは、モジュラー入力(2つの入力または「ドメイン」は説明のためにのみ示されている)と特有のリンカー領域によって接続されたプールを備えたコンビナトリアルアセンブリの概略図を示す。
【
図1B】
図1Bは、IIS型に暴露されたバーコードを使用してペア化された変異体アセンブリの概略図を示す。
【
図2】
図2は、ペア化された相同性を使用してペア化された変異体アセンブリの概略図を示す。
【
図3】
図3は、免疫グロブリン、またはその断片をコードする核酸などの変異体核酸のデノボ合成の概略図を示す。
【
図4】
図4は、ペア化された相同性を使用してベクターへのペア化された変異体アセンブリの概略図を示す。
【
図5A】
図5Aは、IIS型を使用してベクターへのペア化された変異体アセンブリの概略図を示す。
【
図5B】
図5Bは、ペア化されたバーコードおよびダイヤルアウトPCR(dial-out PCR)を使用する核酸アセンブリの概略図を示す。
【
図6】
図6は、各可変領域に特異的なポリヌクレオチド集団を使用する核酸アセンブリの概略図を示す。
【
図7】
図7は、ポリヌクレオチド合成および核酸アセンブリのためのシステムを描く。
【
図9】
図9は、コンピュータシステムのアーキテクチャを示すブロック図である。
【
図10】
図10は、共有仮想アドレスメモリ空間を用いる、マルチプロセッサーコンピュータシステムのブロック図である。
【
図11】
図11は、複数のコンピュータシステム、複数の携帯電話および個人用携帯情報端末、ならびにネットワーク接続ストレージ(NAS)を組み込むように構成されたネットワークを実証する図である。
【
図12B】
図12Bは、A/T豊富なオーバーラップ相同性配列のコロニー形成単位(CFU)のグラフである。
【
図12C】
図12Cは、コンパレータ1およびコンパレータ2の合格率のグラフである。
【
図12D】
図12Dは、3つのアセンブルされた遺伝子を含む集団のパーセントによる、酵素的アセンブリ方法によるアセンブリ特異性および配列バイアスのグラフである。アダプターを有する9つのdsDNA入力断片から構成された、3つの様々な遺伝子(遺伝子A、遺伝子B、遺伝子C)のアセンブリは、単一反応においてアセンブルされた。
【
図12E】
図12Eは、酵素学的なアセンブリ方法を使用して、0~6のDNA断片の同時のアセンブリのためのコロニー形成単位(CFU)のグラフである。
【
図12F】
図12Fは、酵素学的なアセンブリ方法、コンパレータ1、またはコンパレータ2を使用して、0~10のDNA断片の同時のアセンブリのためのコロニー形成単位(CFU)のグラフである。
【
図12G】
図12Gは、酵素学的なアセンブリ方法を使用して、25bp、または40bpのいずれかのオーバーラップ相同性領域のためのコロニー形成単位(CFU)のグラフである。
【
図13A】
図13Aは、多重アセンブリに続くユニバーサルプライマーを使用するPCR後のDNAの相対濃度を示す。
【
図13B】
図13Bは、多重アセンブリ後BioAnalyzer読み取りからのプロットを示す。
【
図13C】
図13Cは、多重アセンブリ後の遺伝子の集団の140x適用範囲を使用する密度プロットを示す。
【
図13D】
図13Dは、400bpの遺伝子プールの多重アセンブリ後の遺伝子の集団にける挿入/欠失なしのものの割合を示す。
【
図13E】
図13Eは、多重アセンブリ後の遺伝子の集団における挿入/欠失なしのものの割合を示す。
【
図13F】
図13Fは、多重アセンブリ後の遺伝子の集団における完全ドロップアウト、ドロップアウト、およびランナウェイ(ranaway)の割合を示す。
【
図13G】
図13Gは、多重アセンブリ後の遺伝子の集団におけるトクリッピング/キメラ・リードのグラフを示す。
【
図14A】
図14Aは、遺伝子断片の4つの集団を使用するコンビナトリアルアセンブリのクローニング前後における完全長配列の均一性のグラフである。
【
図14B】
図14Bは、遺伝子断片の4つの集団を使用するコンビナトリアルアセンブリ後のドメイン内の変異体の頻度のグラフである。
【
図15A】
図15Aは、プリクローン化されたプール(左)、およびクローン化されたプール(右)の頻度密度対対数(読み取り数)のグラフである。
【
図15B】
図15Bは、遺伝子断片の4つの集団を使用するコンビナトリアルアセンブリ後のドメイン内の変異体の頻度のグラフである。
【
図15C】
図15Cは、4x4アセンブリ(左)および10x10アセンブリ(右)の頻度密度対対数(読み取り数)のグラフである。
【
図15D】
図15Dは、50x50コンビナトリアルアセンブリ(左)および100x100コンビナトリアルアセンブリ(右)の頻度密度対対数(読み取り数)のグラフである。
【
図16A】
図16Aは、ウイルスタンパク質をコードする250kの配列コンビナトリアルライブラリの遺伝子プール中のポジションの関数としての配列多様性(塩基数)のグラフである。
【
図16B】
図16Bは、ウイルスタンパク質をコードする250kの配列コンビナトリアルライブラリの変動するGC含有量を有する配列にわたる配列表現のグラフである。
【
図16C】
図16Cは、ウイルスタンパク質のためのコードする250kの配列コンビナトリアルライブラリにおける遺伝子のサイズ分布のグラフである。
【
図16D】
図16Dは、ウイルスタンパク質をコードする250kの配列コンビナトリアルライブラリの頻度密度対対数(読み取り数)のグラフである。
【
図16F】
図16Fは、ドロップアウト(プールから喪失している)、過小表現(平均の<10x)、脱走(平均の10x>)および完璧な配列を有するパーセント遺伝子を含むプール特性のグラフである。
【発明を実施するための形態】
【0012】
定義
【0013】
本開示の全体にわたって、様々な実施形態が範囲フォーマット(range format)で提示される。範囲形式での記載は単に利便性と簡潔さのためのものに過ぎず、任意の実施形態の範囲に対する確固たる限定として解釈されてはならないということを理解されたい。これに応じて、範囲の記載は、文脈で別段の定めのない限り、すべての可能性のある下位範囲と、下限の単位の小数第2位までのその範囲内の個々の数値を具体的に開示していると考えられなければならない。例えば、1から6などの範囲の記載は、1から3、1から4、1から5、2から4、2から6、3から6などの下位範囲と、例えば、1.1、2、2.3、5、および5.9のその範囲内の個々の数値を具体的に開示していると考えられなければならない。これは、範囲の広さにかかわらず適用される。これらの介在する範囲の上限および下限は、より小さな範囲内に独立して含まれてもよく、また、定められた範囲内のあらゆる具体的に除外された限界に従って、本発明内に包含される。定められた範囲が上限および下限の1つまたはその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲も、文脈から明確に指示されない限り、本発明内に包含される。
【0014】
本明細書で使用される用語は、特定の実施形態のみを記載するためのものであり、任意の実施形態を限定することを意図してはいない。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が他に明白に示していない限り、同様に複数形を含むように意図される。用語「含む」および/または「含むこと」は、本明細書での使用時に、明示された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するが、1以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を妨げないことが、さらに理解される。本明細書で使用されるように、用語「および/または」は、関連する列挙された項目の1つ以上のあらゆる組み合わせを含む。
【0015】
本明細書で使用されるように、別段の定めのない限り、あるいは文脈から明らかでない限り、「核酸」という用語は、二本鎖または三本鎖核酸、ならびに一本鎖分子を包含する。二本鎖または三本鎖の核酸において、核酸鎖は同一の広がりをもつ必要はない(すなわち、二本鎖の核酸は、両鎖の全長に沿って二本鎖である必要はない)。核酸配列は、提供される場合、別段の記載がない限り、5’から3’方向に記載される。本明細書に記載される方法は、単離された核酸の生成を提供する。本明細書に記載される方法は、単離および精製された核酸の生成をさらにもたらす。本明細書に言及されるような「核酸」は、少なくとも5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、またはそれより多くの塩基長を含み得る。さらに、本明細書に提供されるのは、ヌクレオチド配列をコードするポリペプチド-セグメントの任意の数の合成のための方法であり、それらは、非リボソームペプチド(NRP)をコードする配列、非リボソームペプチド合成酵素(NRPS)モジュールおよび合成変異体をコードする配列、抗体など他のモジュールタンパク質のポリペプチドセグメント、他のタンパク質ファミリーからのポリペプチドセグメント、調節配列などの非コードのDNAまたはRNA(例えば、プロモータ、転写因子、エンハンサー、siRNA、shRNA、RNAi、miRNA、マイクロRNAに由来する核小体低分子RNA、あるいは対象の任意の機能的または構造的なDNAまたはRNAユニット)を含む。以下はポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコードまたは非コード領域、遺伝子間DNA、連鎖解析から定義された遺伝子座(複数の遺伝子座)、エキソン、イントロン、メッセンジャー核酸(mRNA)、転移RNA、リボソームRNA、低分子干渉RNA(siRNA)、低分子ヘアピン型RNA(shRNA)、マイクロRNA(miRNA)、核小体低分子RNA、リボザイム、メッセンジャーRNA(mRNA)の逆転写あるいは増幅によって通常得られるmRNAのDNA表現である、相補的DNA(cDNA);合成的にあるいは増幅により生成されるDNA分子、ゲノムDNA、組み換えポリヌクレオチド、分枝鎖ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、およびプライマー。本明細書で言及される遺伝子または遺伝子断片をコードするcDNAは、ゲノム等価配列において介在イントロン配列のないエキソン配列をコードする少なくとも1つの領域を含むことがある。
【0016】
別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用されるように、数あるいは数の範囲に関連して用語「約」とは、明示された数とその数+/-10%、あるいはある範囲の列挙された値について列挙された下限の10%以下と列挙された10%以上を意味するものと理解されたい。
【0017】
「ユニバーサルプライマー」として本明細書に言及された例示的なワークフローで言及されるプライマーは、複数のDNA断片に対する共通のプライマー結合部位を認識する短いポリヌクレオチドである。しかし、これらのワークフローは、ユニバーサルプライマーのみの使用に制限されることなく、断片特異的なプライマーは追加的に、または代替的に取り込まれる場合がある。加えて、本明細書に記載される例示的なワークフローは、遺伝子断片のアセンブリを指しているが、それらはあるがまま制限されることなく、一般的により長い核酸のアセンブリに適用可能である。
【0018】
配列アセンブリ
【0019】
本明細書に記載されているのは、核酸配列アセンブリのための方法および組成物である。このような配列アセンブリは、GC含有量、反復領域、二次構造などのアセンブリ断片の特異性のため、場合によっては困難な場合がある。さらに、このような配列のライブラリのアセンブリは、ライブラリのメンバーがメンバー間で高い可変性の領域を有し、並行してアセンブルされる場合がある。このような断片の並行アセンブリは、このような断片のためのライブラリのメンバー間で高度に可変な領域が存在するため、困難である。さらに、アセンブリの結果、核酸が不正確にアセンブルされないなどのエラーが発生する可能性もある。可変領域を含む核酸は、遺伝子(タンパク質または抗体などの)のためにコードする核酸、または非コードの核酸を含む場合がある。いくつかの例では、本明細書にアセンブルされる核酸は、免疫グロブリンまたはその断片のためにコードする領域を含む。高可変性のライブラリを含む核酸のアセンブリは、本明細書に記載される方法によって達成され得る。いくつかの例では、そのような方法は、PCR/PCAベースのオーバーラップアセンブリ、ライゲーション、ベクターでのクローニング、フラパーゼ(flapase)ベースのアセンブリ、エキソヌクレアーゼベースのアセンブリ、または他のアセンブリ方法を含む。いくつかの例では、核酸のライブラリを生成するために複数の方法が組み合わせられる。そのような方法は、任意の順序で実行され、いくつかの例では、精製などの工程が介在する場合もある。いくつかの例では、アセンブルされた核酸は、ライブラリを生成するために部分的および完全にアセンブルされた核酸のプールから増幅される。いくつかの例では、正確にアセンブルされた核酸は、ライブラリを生成するために、正確にアセンブルされた核酸および不正確にアセンブルされた核酸を含むプールから増幅される。
【0020】
バーコードを使用する配列アセンブリの例示的なプロセスは、
図1Bで見られる。遺伝子断片(121)は、合成され、バーコード(101)、それに続く第1の制限エンドヌクレアーゼ部位(112A)、第2の制限エンドヌクレアーゼ部位(112B)、および第1の超可変領域(102)を含む。いくつかの例では、第1の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。いくつかの例では、第1の制限エンドヌクレアーゼ部位、または第2の制限エンドヌクレアーゼ部位は、IIS型制限エンドヌクレアーゼ(TIIS-RE)部位である。いくつかの例では、第1の制限エンドヌクレアーゼ部位、および第2の制限エンドヌクレアーゼ部位は、異なるTIIS-RE部位である。遺伝子断片(123)は、合成され、任意の定義された長さの第1の領域(103)、それに続く自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および第1の可変領域(106)を含む。いくつかの例では、自己切断型ペプチド配列はP2Aである。いくつかの例では、合成された第1の可変領域の数は、約100である。いくつかの例では、合成された第1の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。遺伝子断片(121)は、遺伝子断片(123)と組み合わされる(113)。結果として生じる断片(125)は、バーコード(101)、それに続く制限エンドヌクレアーゼ部位(112A)、任意の定義された長さの第1の領域(103)、切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(127)は、合成され、ベクター配列(107)、それに続く第2の可変領域に隣接する第2の相補的領域(108)、第2の可変領域(109)、第2の超可変領域(110)、TIIS-RE部位(112A)、および第2のバーコード(101’)を含む。いくつかの例では、合成された第2の可変領域の数は、約130である。いくつかの例では、合成された第2の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。遺伝子断片(125)は、その後遺伝子断片(127)でPCR増幅される(114)。結果として生じる断片(129)は、ベクター配列(107)、それに続く第2の可変領域に隣接する第2の相補的領域(108)、第2の可変領域(109)、第2の超可変領域(110)、TIIS-RE部位(112A)、バーコード(101)、TIIS-RE部位(112A)、任意の定義された長さの第1の領域(103)、切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。その後、遺伝子断片(129)は、クローン化され、およびTIIS制限エンドヌクレアーゼは、バーコード(101)を除去するためにTIIS-RE部位でカットされる。結果として生じる断片(131)は、ベクター配列(107)、それに続く第2の可変領域に隣接する第2の相補的領域(108)、第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第1の領域(103)、切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(131)は、最終構築物(133)を生成するためにその後クローン化される(116)。最終構築物(133)は、第2の可変領域に隣接する第2の相補的領域(108)、第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第1の領域(103)、切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第1の可変定常セグメント(111)を含む。いくつかの例では、生成された最終構築物の数は、約1000である。いくつかの例では、合成された遺伝子断片の数は、約50、100、250、500、1000、2000、3000、5000、7500、10,000、または約20,000である。いくつかの例では、合成された第1の可変領域の数は、100~5000、200~5000、500~5000、100~2000、250~1500、750~1250、2000~7500、900~10,000、3000~10,000、750~5000、500~2000、または500~3000である。いくつかの例では、合成された最終構築物の数は、約5000、10,000、25,000、500,000、100,000、200,000、300,000、500,000、750,000、1,000,000、または約5,000,000である。いくつかの例では、合成された最終構築物の数は、少なくとも5000、10,000、25,000、500,000、100,000、200,000、300,000、500,000、750,000、1,000,000、または少なくとも5,000,000である。
【0021】
配列アセンブリの例示的なプロセスは、
図2で見られる。遺伝子断片(221)は、合成され、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および固定された可変性の第1の領域(106’)を含む。いくつかの例では、固定された可変性の第1の領域は、少なくとも15、20、25、30、35、40、45、50、または50を超える塩基長である。いくつかの例では、固定された可変性の第1の領域は、約15、20、25、30、35、40、45、50、55、60、または約65の塩基長である。いくつかの例では、自己切断型ペプチド配列はP2Aである。遺伝子断片(223)は、合成され、固定された可変性の第2の領域(109’)、それに続く第2の超可変領域(110)、および任意の定義された長さの第2の領域(203)に相同的である領域(203’)を含む。いくつかの例では、第2の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。遺伝子断片(221)は、遺伝子断片(225)を生成するために遺伝子断片(223)でPCR増幅される(213)。遺伝子断片(225)は、セグメント(109’)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および固定された可変性の第1の領域(106’)を含む。遺伝子断片(225)および遺伝子断片(209)は、酵素学的ベースのアセンブリにかけられ、遺伝子断片(227)を生成するためにPCR増幅される(215)。遺伝子断片(227)は、第2の可変領域(109)、それに続く第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および固定された可変性の第1の領域(106’)を含む。別個の反応では、第1の可変領域(106)は、固定された可変性の第1の領域(106’)に相同的に合成される。第1の可変領域(106)は、第1の可変領域(106)、それに続く第1の超可変領域(102)を含む遺伝子断片(225)を生成するために、第1の超可変領域(102)で増幅される(214)。遺伝子断片(225)および遺伝子断片(227)は、その後組み合わされ、および遺伝子断片(229)を生成するために酵素学的ベースのアセンブリ(216)にかけられる。遺伝子断片(229)は、第2の可変領域(109)、それに続く第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(229)は、最終構築物(231)を生成するためにベクターにクローン化される(217)。構築物(231)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第1の可変定常セグメント(111)を含む。いくつかの例では、合成された第1の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された第2の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された遺伝子断片の数は、約50、100、250、500、1000、2000、3000、5000、7500、10,000、または約20000である。いくつかの例では、合成された第1の可変領域の数は、100~5000、200~5000、500~5000、100~2000、250~1500、750~1250、2000~7500、900~10,000、3000~10,000、750~5000、500~2000、または500~3000である。
【0022】
例示的なデノボ合成方法は、
図3で見られる。第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)は、合成され、その後、遺伝子断片(323)を生成するためにポリメラーゼ・サイクル・アセンブリ(polymerase cycling assembly )(PCA)(314)にかけられる。遺伝子断片(323)は、第1の可変領域に隣接する第1の相補的領域(105)、それに続く第1の可変領域(106)、および第1の超可変領域(102)を含む。いくつかの例では、第1の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。第2の可変領域に隣接する第2の相補的領域(108)、第2の可変領域(109)、および第2の超可変領域(110)は、合成され、遺伝子断片(321)を生成するためにPCRまたはPCA(313)に従う。いくつかの例では、第2の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。遺伝子断片(321)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、および第2の超可変領域(110)を含む。任意の定義された長さの第2の領域(203)、それに続く自己切断型ペプチド配列(104)、および第1の可変定常セグメント(111)を含む遺伝子断片(325)のクローンが合成される。遺伝子断片(321)、(323)および(325)は、それぞれ個々のウェル中で合成され、PCR増幅される。遺伝子断片(325)および第1の可変定常セグメント(111)は、遺伝子断片(327)を生成するために、遺伝子断片(321)および遺伝子断片(323)に追加され、その後にPCRが行われる。いくつかの例では、エラー修正反応は実施される。遺伝子断片(327)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第1の可変定常セグメント(111)を含む。その後、遺伝子断片(327)はクローン化され、次世代の配列決定にかけられる。いくつかの例では、合成された第1の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された第2の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された遺伝子断片の数は、約50、100、250、500、1000、2000、3000、5000、7500、10,000、または約20000である。いくつかの例では、合成された第1の可変領域の数は、100~5000、200~5000、500~5000、100~2000、250~1500、750~1250、2000~7500、900~10,000、3000~10,000、750~5000、500~2000、または500~3000である。
【0023】
本明細書に提供されるのは、ペア化された相同性を使用するペア化された変異体アセンブリのための方法である。例示的なプロセスは
図4で見られる。遺伝子断片(421)は、固定された可変性の第2の領域(109’)、それに続く任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および固定された可変性の第1の領域(106’)を含んで合成される。いくつかの例では、第2の可変領域に相補的な塩基対領域は、少なくとも15、20、25、30、35、40、45、50、または50を超える塩基長である。いくつかの例では、第2の可変領域に相補的な塩基対領域は、約15、20、25、30、35、40、45、50、55、60、または約65の塩基長である。いくつかの例では、第1の超可変領域に相同的な配列、任意の定義された長さの第2の領域、自己切断型ペプチド配列、第1の可変領域に隣接する第1の相補的領域、および固定された可変性の領域を含む約130の変異体が合成される。いくつかの例では、第1の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。遺伝子断片(421)は、遺伝子断片(425)を生成するために、第1の可変領域(106)および第1の超可変領域(102)を含む遺伝子断片(423)と組み合わされる(413)。いくつかの例では、第1の可変セグメントおよび第1の超可変領域を含む約100の変異体が合成される。遺伝子断片(425)は、固定された可変性第2の領域(109’)、それに続く任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(425)は、その後、遺伝子断片(429)を生成するために、第2の可変領域(109)および第2の超可変領域(110)を含む遺伝子断片(427)と組み合わされる(414)。いくつかの例では、第2の可変領域および第2の超可変領域を含む約130の変異体が合成される。いくつかの例では、第2の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。遺伝子断片(429)は、第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(429)は、その後プールされ、目的ベクター(destination vector)(431)にクローン化される(415)。目的ベクター(431)は、第2の可変領域に隣接する第2の相補的領域(108)および第1の可変定常セグメント(111)を含む。結果として生じる構築物(433)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第1の可変定常セグメント(111)を含む。
【0024】
配列アセンブリの例示的なプロセスは、
図5Aで見られる。遺伝子断片(521)は、合成され、第2の可変領域に隣接する第2の相補的領域(108)および第2の可変領域(109)を含む。遺伝子断片(523)は、合成され、第1のく制限エンドヌクレアーゼ部位(112A)、それに続く固定された可変性の第2の領域(109’)を含む。いくつかの例では、固定された可変性の第2の領域は、少なくとも15、20、25、30、35、40、45、50、または50よりも多くの塩基長である。いくつかの例では、固定された可変性の第2の領域は、約15、20、25、30、35、40、45、50、55、60、または約65の塩基長である。いくつかの例では、固定された可変性の第2の領域は、10~60、10~40、15~60、20~60、20~80、30~50、20~45、35~55、40~80、または50~80である。遺伝子断片(525)は、合成され、固定された可変性の第2の領域(109’)、それに続く、第2の超可変領域(110)および第2の可変定常セグメント(211)を含む。遺伝子断片(527)は、合成され、固定された可変性の第1の領域(106’)、それに続く第1の超可変領域(102)および第1のく制限エンドヌクレアーゼ部位(112A)を含む。いくつかの例では、第1の超可変領域はCDRを含む。いくつかの例では、第2の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。いくつかの例では、制限エンドヌクレアーゼ部位は、TIIS-RE部位である。遺伝子断片(521)、(523)、(525)、(527)、および第1の可変領域(106)は、プールされ、第1の超可変領域(102)および第2の超可変領域(110)を追加するためにPCR増幅される(513)。結果として生じる遺伝子断片(529)は、第2の可変領域(109)、それに続く第2の超可変領域(110)、第1の制限エンドヌクレアーゼ部位(112A)、第1の可変領域(106)、および第1の超可変領域(102)を含む。遺伝子断片(529)および目的ベクター(531)は、第2の可変領域に隣接する第2の相補的領域(108)および第2の可変定常セグメント(211)を含み、その後、遺伝子断片(533)を生成するためにフラップエンドヌクレアーゼ媒介の核酸アセンブリ(514)にかけられる。遺伝子断片(533)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、第1の制限エンドヌクレアーゼ部位(112A)、第1の可変領域(106)、第1の超可変領域(102)、および第2の可変定常セグメント(211)を含む。遺伝子断片(533)は、その後、最終構築物(535)を生成するために任意の定義された長さの第2の領域(203)を挿入するために、ゴールデンゲートアセンブリ(515)にかけられる。最終構築物(535)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第2の可変定常セグメント(211)を含む。生成された最終構築物の数は、いくつかの例では、約10000である。いくつかの例では、合成された第1の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された第2の可変領域の数は、約50、100、150、200、250、300、500、1000、または約2000である。いくつかの例では、合成された第1の可変領域の数は、10~100、20~1000、50~1000、100~1000、25~500、75~125、200~2000、150~2000、300~5000、50~5000、1000~5000、または50~300である。いくつかの例では、合成された最終構築物の数は、約5000、10,000、25,000、500,000、100,000、200,000、300,000、500,000、750,000、1,000,000、または約5,000,000である。いくつかの例では、合成された最終構築物の数は、少なくとも5000、10,000、25,000、500,000、100,000、200,000、300,000、500,000、750,000、1,000,000、または少なくとも5,000,000である。いくつかの例では、合成された第1の可変領域の数は、1000~50,000、2900~50,000、5000~50,000、1000~20,000、2500~15,000、7500~12,500、20,000~75,000、9000~100,000、30,000~100,000、7500~50,000、5000~20,000、または5000~30,000である。
【0025】
配列アセンブリの例示的なプロセスは、
図5Bで見られる。遺伝子断片(551)は合成され、第2の可変領域に隣接する第2の相補的領域(108)および第2の可変領域(109)を含む。第2の超可変領域(110)を含む遺伝子断片が合成される。第1の可変領域(106)を含む遺伝子断片が合成される。遺伝子断片(553)は、第1の超可変領域(102)、それに続く固定された可変性の第1の領域(106’)およびバーコード(101)を含んでいる。遺伝子断片(551)および第2の超可変領域(110)の第1のコンビナトリアルライブラリは、PCRを使用して生成される。遺伝子断片(553)および第1の可変領域(106)の第2のコンビナトリアルライブラリは、PCRを使用して生成される。第1のコンビナトリアルライブラリおよび第2のコンビナトリアルライブラリは、断片(559)を生成するために酵素ベースアセンブリ(555)を使用してアセンブルされる。遺伝子断片(557)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、固定された可変性の第1の領域(106’)、およびバーコード(101)を含む。いくつかの例では、遺伝子断片(559)は、定数の塩基対の領域を含む。塩基対の数は、いくつかの例では、少なくとも、あるいは約5、10、15、20、25、30、35、40、45、50、または50よりも多くの塩基対である。遺伝子断片(557)は、遺伝子断片(561)を生成するために環状化される(559)。遺伝子断片(561)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、固定された可変性の第1の領域(106’)、およびバーコード(101)を含む。第1の可変領域および第1の超可変領域は、変動する長さを含む場合がある。いくつかの例では、第1の可変領域および第1の超可変領域の長さは、少なくとも、あるいは約15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、または700よりも多くの塩基長である。いくつかの例では、第1の可変領域および第1の超可変領域の長さは、約10~1000、50~900、100~800、または200~600の塩基対の範囲内である。第2の可変領域および第2の超可変領域は、変動する長さを含む場合がある。いくつかの例では、第2の可変領域および第2の超可変領域の長さは、少なくとも、あるいは約15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、またはで700よりも多くの塩基長である。いくつかの例では、第2の可変領域および第2の超可変領域の長さは、約10~1000、50~900、100~800、または200~600の塩基対の範囲内である。いくつかの例では、任意の定義された長さの第2の領域、自己切断型ペプチド配列、第1の可変領域に隣接する第1の相補的領域は変動する長さを含む。いくつかの例では、任意の定義された長さの第2の領域、自己切断型ペプチド配列、第1の可変領域に隣接する第1の相補的領域の長さは、少なくとも、あるいは約15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、1000、または1000より多くの塩基長である。いくつかの例では、任意の定義された長さの第2の領域、自己切断型ペプチド配列、第1の可変領域に隣接する第1の相補的領域の長さは、約10~1000、50~900、100~800、または200~600の塩基対の範囲内である。いくつかの例では、固定された可変性の第1の領域は、少なくとも、あるいは約15、20、25、30、35、40、45、50、60、70、80、90、100、または100より多くの塩基対を含む。いくつかの例では、バーコードは、少なくともあるいは約1、5、10、15、20、25、30、35、40、45、50、または50より多くの塩基対を含む。その後、遺伝子断片(561)は、プライマー(581)および(583)で配列決定され、およびサンプルは、遺伝子断片(565)を生成するためにバーコード(563)を有して識別されます。遺伝子断片(565)は、その後、ダイヤルアウトPCR(dial-out PCR)および最終ベクター(569)中への酵素ベースアセンブリ(567)にかけられる。
【0026】
各々の変異体の特異的な集団を使用する例示的なプロセスは、
図6で見られる。遺伝子断片(631)は、固定された可変性の第2の領域(109’)、それに続く第2の超可変領域(110)、第1の制限エンドヌクレアーゼ部位(112A)、第1の超可変領域(102)、およびユニバーサルプライマー(211’)を含んで合成される。いくつかの例では、第1の超可変領域はCDRを含む。いくつかの例では、第2の超可変領域はCDRを含む。いくつかの例では、CDRはCDR3である。いくつかの例では、制限エンドヌクレアーゼ部位は、TIIS-RE部位である。遺伝子断片(631)は、遺伝子断片(635)を生成するために、組み合わされ、および第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)を含む遺伝子断片(633)の集団でPCR増幅される(613)。遺伝子断片(635)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、第1の制限エンドヌクレアーゼ部位(112A)、第1の超可変領域(106)、およびユニバーサルプライマー(211’)を含む。遺伝子断片(635)は、遺伝子断片(639)を生成するために、その後、第2の可変領域に隣接する第2の相補的領域(108)および第2の可変定常セグメント(211)を含む目的ベクター(637)へとアセンブルされる(614)。遺伝子断片(639)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、第1の制限エンドヌクレアーゼ部位(112A)、第1の超可変領域(102)、および第2の可変定常セグメント(211)を含む。遺伝子断片(641)は、合成され、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、および第1の可変領域(106)を含む。遺伝子断片(639)および遺伝子断片(641)は、最終構築物(643)を生成するために、任意の定義された長さの第2の領域(203)を挿入するためにアセンブルされる(615)。最終構築物(643)は、第2の可変領域に隣接する第2の相補的領域(108)、それに続く第2の可変領域(109)、第2の超可変領域(110)、任意の定義された長さの第2の領域(203)、自己切断型ペプチド配列(104)、第1の可変領域に隣接する第1の相補的領域(105)、第1の可変領域(106)、第1の超可変領域(102)、および第2の可変定常セグメント(211)を含む。いくつかの例では、生成された最終構築物の数は、約10000である。いくつかの例では、生成された最終構築物の数は、約1000、2000、5000、8000、10000、15,000、20,000、100,000、または約1,000,000である。いくつかの例では、生成された最終構築物の数は、少なくとも1000、2000、5000、8000、10000、15,000、20,000、100,000、または1,000,000である。
【0027】
本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さな核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、オーバーラップ領域、超可変領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、第1の定常配列、第1の可変配列、および第1の配列は、合成され、第1の複数の遺伝子断片を生成するためにその後、ポリメラーゼ連鎖アセンブリ(PCA)にかけられる。いくつかの例では、第1の定常配列は、リーダー配列である。いくつかの例では、第2の配列は、CDRである。いくつかの例では、第1の定常配列は、リーダー配列であり、かつ第2の配列はCDRである。いくつかの例では、第2の定常配列、第2の可変配列、および第2の配列は、合成され、第2の複数の遺伝子断片を生成するためにその後、PCRまたはPCAにかけられる。いくつかの例では、第2の定常配列は、リーダー配列である。いくつかの例では、第2の配列は、CDRである。いくつかの例では、第3の定常領域、それに続く第1の相補的配列を含む第3の複数の遺伝子断片、および可変定常セグメントを含む第4の複数の遺伝子断片が合成される。いくつかの例では、第1の相補的配列は、1つ以上の可変領域に隣接する配列の相補的な領域を含む。いくつかの例では、第1の相補的配列は、20-60bp、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、あるいは40-60bpの領域を含む。いくつかの例では、第1の相補的配列は、約15、20、25、30、35、40、45、50、55、60、または65のbp領域を含む。いくつかの例では、第1の相補的配列は、約40bpの領域を含む。いくつかの例では、第1の相補的配列は、自己切断型ペプチドを含む。いくつかの例では、自己切断型ペプチド配列はP2Aである。いくつかの例では、第3の複数の遺伝子断片および第4の複数の遺伝子断片は、第1の複数の遺伝子断片および第2の複数の遺伝子断片とそれに続くPCRに追加される。随意に、エラー修正反応は実施される。いくつかの例では、結果として生じる構築物は、プールされ、クローン化され、および次世代の配列決定にかけられる。いくつかの例では、結果として生じる構築物は、1つ以上の遺伝子を含む。いくつかの例では、結果として生じる構築物は、免疫グロブリン、またはその断片を含む。
【0028】
本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さな核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、超可変領域、オーバーラップ領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、核酸断片は遺伝子断片を含む。いくつかの例では、断片は、少なくとも50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または少なくとも20,000の塩基長である。いくつかの例では、断片は、50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000以下、または20,000以下の塩基長である。いくつかの例では、断片は、約50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または約20,000の塩基長である。いくつかの例では、断片は、50~5000、50~1000、50~500、50~250、100~500、200~1000、500~10,000、500~5,000、1000~8000、または1500~10,000の塩基長である。核酸断片は、第1の可変領域の変異体を含んで合成され、固定された変動性の領域を含む断片で増幅される。いくつかの例では、固定された可変性の領域は、第1に複数の断片を生成するために第1の可変領域に相補的領域および第1の超可変領域を含む。いくつかの例では、第1の超可変領域はCDRおよびJセグメントを含む。いくつかの例では、固定された可変性の領域は、20-60塩基対(bp)、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、または40-60bpの領域を含む。いくつかの例では、固定された可変性の領域は、約15、20、25、30、35、40、45、50、55、60、または65のbp領域を含む。いくつかの例では、固定された可変性の領域は、約40bpの領域を含む。断片は、第2の可変領域の変異体含んで合成され得、第2の複数の断片を生成するために、第2のCDRおよびJセグメントを含む断片で増幅され得る。第3の複数の断片は、定常領域、可変領域に隣接する第1の相補的領域、第1のリーダー配列、および第2の可変領域および第2のCDRおよびJセグメントに相補的な第2の相補的領域を含んで合成され得る。いくつかの例では、第1の相補的配列は、20-60bp、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、あるいは40-60bpの領域を含む。いくつかの例では、第1の相補的配列は、約15、20、25、30、35、40、45、50、55、60、または65のbp領域を含む。いくつかの例では、第1の相補的配列は、約40bpの領域を含む。いくつかの例では、第2の相補的配列は、20-60bp、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、あるいは40-60bpの領域を含む。いくつかの例では、第2の相補的配列は、約15、20、25、30、35、40、45、50、55、60、または65のbp領域を含む。いくつかの例では、第2の相補的配列は、約40bpの領域を含む。定常領域は構築物サイズのために調節される場合がある。いくつかの例では、定常領域は、少なくとも50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または少なくとも20,000の塩基長である。いくつかの例では、定常領域は、50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000以下、または少なくとも20,000以下の塩基長である。いくつかの例では、定常領域は、約50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または約20,000の塩基長である。いくつかの例では、定常領域は、50~5000、50~1000、50~500、50~250、100~500、200~1000、500~10,000、500~5,000、1000~8000、または1500~10,000の塩基長さである。いくつかの例では、第1の複数の断片は、第2の複数の断片および第3の複数の断片は、酵素学的ベースアセンブリ方法を使用して、アセンブルされ、PCR精製され、プールされる。いくつかの例では、実質的に、全ての非アセンブルの断片は、精製され出される。いくつかの例では、非アセンブルの断片の少なくとも90%、95%、97%、98%、99%、99.5%、99.9%、または少なくとも99.99%は、精製され出される。いくつかの例では、最終構築物は、大きい核酸へとクローン化される。いくつかの例では、大きい核酸はベクターである。
【0029】
本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さい核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、超可変領域、オーバーラップ領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、核酸断片は遺伝子断片を含む。いくつかの例では、遺伝子断片は変異体遺伝子断片である。いくつかの例では、第1の可変領域を含む断片が合成される。いくつかの例では、断片は、少なくとも50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10000、または少なくとも20000の塩基の長さである。いくつかの例では、断片は、50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000以下、または20,000以下の塩基長である。いくつかの例では、断片は、約50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または約20,000の塩基長である。いくつかの例では、断片は、50~5000、50~1000、50~500、50~250、100~500、200~1000、500~10,000、500~5,000、1000~8000、または1500~10,000の塩基長さである。いくつかの例では、断片は、第1の複数の遺伝子断片を生成するために第1の超可変のセグメントで増幅される。いくつかの例では、第2の可変領域を含む断片の別のセットが合成される。いくつかの例では、断片の別のセットは、第2の複数の遺伝子断片を生成するために第2の超可変のセグメントで増幅される。いくつかの例では、超可変セグメントはCDR3およびJセグメントを含む。いくつかの例では、第1の超可変のセグメントに相同的配列、それに続く定常領域、相補的配列、第1のリーダー配列、および第2の可変領域に相補的領域を含む第3の複数の遺伝子断片が合成される。いくつかの例では、第2の可変領域に相補的領域は、20-60bp、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、または40-60の長さである。いくつかの例では、第2の可変領域に相補的な領域は、約15、20、25、30、35、40、45、50、55、60、または65bpの長さである。いくつかの例では、第1の相補的配列は、1つ以上の可変領域に隣接する配列の相補的領域を含む。いくつかの例では、第1の相補的配列は、20-60bp、10-20bp、15-45bp、20-60bp、30-40bp、30-60bp、または40-60bpの領域を含む。いくつかの例では、第1の相補的配列は、約15、20、25、30、35、40、45、50、55、60、または65のbp領域を含む。いくつかの例では、第1の相補的配列は、約40bpの領域を含む。いくつかの例では、第1の相補的配列は、自己切断型ペプチドを含む。いくつかの例では、自己切断型ペプチド配列はP2Aである。いくつかの例では、第3の複数の核酸は、10~1000、100~500、50~5,000、50~10,000、100~1000、200~1000、500~10,000、または1000~10,000の変異体を含む。いくつかの例では、第1の複数の遺伝子断片、第2の複数の遺伝子断片と第3の複数の遺伝子断片はアセンブルされる。いくつかの例では、第1の複数の遺伝子断片、第2の複数の遺伝子断片と第3の複数の遺伝子断片は、アセンブルされ、そして目的ベクターへとクローン化される。いくつかの例では、最終構築物は、第2のリーダー配列、それに続く第2の可変領域、第2の超可変セグメント、第2の定常領域、第1の相補的配列、第1のリーダー配列、第1の可変領域、第1の超可変セグメント、および可変定常領域を含む。
【0030】
本明細書に提供されるのは、アセンブリ用の遺伝子断片または遺伝子が、相同性配列を含む、核酸アセンブリのための方法である。いくつかの例では、相同性核酸は、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、または100を超える塩基対を含む。いくつかの例では、塩基対の数は40の塩基対である。いくつかの例では、塩基対の数は、約5~100、10~90、20~80、30~70、または40~60の塩基対の範囲内である。
【0031】
本明細書に記載される遺伝子断片は、相同性配列を含む場合がある。いくつかの例では、アセンブリ用の遺伝子断片、または遺伝子は、1つ以上の相同性配列を含む。いくつかの例では、1つ以上の相同性配列は、高多様性の領域である。いくつかの例では、1つ以上の相同性配列は、可変領域に相補的である。いくつかの例では、1つ以上の相同性配列は、超可変領域である。
【0032】
本明細書に提供されるのは、アセンブリ用の遺伝子断片または遺伝子が、バーコードを含む、核酸合成のための方法である。いくつかの例では、バーコードは、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、または100を超える塩基対を含む。いくつかの例では、バーコードは制限酵素によって認識される。いくつかの例では、制限酵素は、非対称的なDNA配列を認識する。いくつかの例では、遺伝子断片の第1の集団および遺伝子断片の第2の集団は、各集団の核酸の切断後に、第1の集団および第2の集団が互いにアニールすることができるように、相補的なバーコード配列を有するように設計されている。
【0033】
様々な制限酵素および制限部位は、本明細書に使用されてもよい。いくつかの例では、制限酵素は、エンドヌクレアーゼである。いくつかの例では、制限酵素は回文配列を認識し、認識配列内に両方の鎖を対称的に切断する。いくつかの例では、制限酵素は、非対称的な核酸配列を認識し、認識配列外の両方の核酸鎖を切断する。いくつかの例では、エンドヌクレアーゼは、II型エンドヌクレアーゼである。例示的なII型エンドヌクレアーゼは、HhaI、HindIII、NotI、BbvCI、EcoRIとBglIを含むが、それらに限定されない。いくつかの例では、エンドヌクレアーゼは、IIS型エンドヌクレアーゼである。例示的なIIS型エンドヌクレアーゼは、AcuI、AlwI、BaeI、BbsI、BbvI、BccI、BceAI、BcgI、BciVI、BcoDI、BfuAI、BmrI、BpmI、BpuEI、BsaI、BsaXI、BseRI、BsgI、BsmAI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BsrDI、BsrI、BtgZI、BtsCI、BtsI、BtsIMutI、CspCI、EarI、EciI、Esp3I、FauI、FokI、HgaI、HphI、HpyAV、MboII、MlyI、MmeI、MnlI、NmeAIII、PleI、SapIおよびSfaNIを含むが、それらに限定されない。
【0034】
本明細書に記載されているような方法は、いくつかの実施形態では、自己切断型ペプチドをコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、自己切断型ペプチドは、2Aペプチドである。いくつかの例では、2Aペプチドは、T2A、P2A、E2A、またはF2Aである。いくつかの例では、この2AペプチドはP2Aである。
【0035】
本明細書に提供されるのは、超可変領域をコードする遺伝子、または遺伝子断片から核酸を合成する方法である。いくつかの例では、超可変領域は相補性決定領域(CDR)である。いくつかの例では、CDRは、CDR1、CDR2、またはCDR3である。いくつかの例では、CDRは、CDR-H1、CDR-H2およびCDR-H3を含むが、これらに限定されない重ドメインである。いくつかの例では、CDRは、CDR-L1、CDR-L2およびCDR-L3を含むが、これらに限定されない軽ドメインである。
【0036】
CDR領域は、変動する長さを有する場合がある。いくつかの例では、CDR領域は、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、または400を超える塩基対を含む。いくつかの例では、CDR領域は、約100の塩基対を含む。
【0037】
本明細書に記載される組成物および方法は、CDR、または他の配列などの抗原結合配列を含む遺伝子、または遺伝子断片を含む場合がある。いくつかの例では、遺伝子断片または遺伝子は、CDR領域およびVセグメント、Dセグメント、Jセグメント、またはその組み合わせをコードする。いくつかの例では、遺伝子断片または遺伝子は、CDR領域およびVセグメントを含む。いくつかの例では、CDR領域およびVセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、または400を超える塩基対を含む。いくつかの例では、遺伝子断片または遺伝子は、CDR領域およびDセグメントを含む。いくつかの例では、CDR領域およびDセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、または400を超える塩基対を含む。いくつかの例では、遺伝子断片または遺伝子は、CDR領域およびJセグメントを含む。いくつかの例では、CDR領域およびJセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、または400を超える塩基対を含む。いくつかの例では、CDRは、CDR1、CDR2、またはCDR3である。いくつかの例では、CDRはCDR3である。
【0038】
本明細書に記載されているような方法は、いくつかの実施形態では、可変領域をコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、可変領域は免疫グロブリンのものである。いくつかの例では、複数の変異体可変領域が合成される。いくつかの例では、少なくとも、あるいは約10、101、102、103、104、105、106、または106を超える変異体可変領域が合成される。いくつかの例では、少なくとも、あるいは約10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、または、200を超える変異体可変領域が合成される。
【0039】
本明細書に記載されているような方法は、いくつかの実施形態では、任意の定義された長さの領域をコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、任意の定義された長さの領域は定常領域である。いくつかの例では、定常領域は免疫グロブリンのものである。いくつかの例では、少なくとも、あるいは約10、101、102、103、104、105、106、または106を超える任意の定義された長さの変異体領域が合成される。いくつかの例では、少なくとも、あるいは約10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、または、200を超える任意の定義された長さの変異体領域が合成される。いくつかの例では、定常領域は、少なくとも50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または少なくとも20,000の塩基長である。いくつかの例では、定常領域は、50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000以下、または20,000以下の塩基長である。いくつかの例では、定常領域は、約50、75、100、125、150、175、200、250、500、800、1000、2000、5000、8000、10,000、または約20,000の塩基長である。いくつかの例では、定常領域は、50-5000、50-1000、50-500、50-250、100-500、200-1000、500-10,000、500-5,000、1000-8000、または1500-10,000の塩基長である。
【0040】
本明細書に提供されるのは、多数の遺伝子断片がアセンブルされる、核酸アセンブリのための方法である。いくつかの例では、遺伝子断片は、前進的にまたは順次にアセンブルされる。いくつかの例では、遺伝子断片はベクターへとアセンブルされる。いくつかの例では、遺伝子断片は、長い線状遺伝子アセンブリのためにアセンブルされる。いくつかの例では、遺伝子断片の数は、少なくとも、あるいは約2、3、4、5、6、7、8、9、10、または10を超える遺伝子断片である。いくつかの例では、遺伝子断片の数は、少なくとも、あるいは約10、11、12、13、14、15、16、17、18、19、20、または20を超える遺伝子断片である。いくつかの例では、遺伝子断片の数は、約1~2、1~3、1~4、1~5、1~6、1~7、1~8、1~9、1~10、2~3、2~4、2~5、2~6、2~7、2~8、2~9、2~10、3~4、3~5、3~6、3~7、3~8、3~9、3~10、4~5、4~6、4~7、4~8、4~9、4~10、5~6、5~7、5~8、5~9、5~10、6~7、6~8、6~9、6~10、7~8、7~9、7~10、8~9、8~10、または9~10の範囲内である.
いくつかの例では、遺伝子断片の数は、約1~約20、約2~約18、約3~約17、約4~約16、約6~約14、または約8~約12である。
【0041】
本明細書に提供されるのは、アセンブルされた遺伝子断片の比率が、約0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5、または1:5を超える比率である、核酸アセンブリのための方法である。例えば、2つの遺伝子断片がアセンブルされる場合、第2の遺伝子断片に対する第1の遺伝子断片の比率は、1:1である。いくつかの例では、第2の遺伝子断片に対する第1の遺伝子断片の比率は、少なくとも、あるいは約1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1、または1:0.1未満である。
【0042】
核酸アセンブリのための本明細書に記載されているような方法は、ベクターへの1つ以上の遺伝子断片のアセンブリを含む場合があり、ここで、ベクターに対する1つ以上の遺伝子断片の比率は変動する。いくつかの例では、ベクターに対する1つ以上の遺伝子断片の比率は、少なくとも、あるいは約0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5、または1:5を超える比率である。いくつかの例では、ベクターに対する1つ以上の遺伝子断片の比率は、少なくとも、あるいは約1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1、または1:0.1未満である。
【0043】
核酸アセンブリのための本明細書に記載されているような方法は、ベクターへのアセンブリのためのポリヌクレオチド集団のアセンブリを含む場合がある。いくつかの例では、ポリヌクレオチド集団のアセンブリのためにPCRが実施される。いくつかの例では、ポリヌクレオチド集団は、少なくとも、あるいは約2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、または200を超えるポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド集団は、少なくとも、あるいは約50、100、200、250、300、400、500、600、700、800、900、1000、1100、1300、1400、1500、1600、1700、1800、2000、2400、2600、2800、3000、3200、3400、3600 3800、4000、4200、4400、4800、4600、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、または100000を超える塩基を含む長い核酸を生成するためにアセンブルされる。
【0044】
核酸アセンブリ、いくつかの実施形態では、免疫グロブリンをコードする核酸の生成を引き起こす。いくつかの実施形態では、免疫グロブリンは抗体である。本明細書で使用されるように、抗体という用語は、典型的な抗体分子の特徴的な二アームのY字型、ならびに抗原に特異的に結合する能力を保持する抗体の1つ以上の断片を有するタンパク質を含むと理解される。例示的な抗体は、モノクローナル抗体、ポリクローナル抗体、二重特異性の抗体、多特異性抗体、グラフト抗体、ヒト抗体、ヒト化抗体、合成抗体、キメラ抗体、ラクダに化抗体、単鎖Fvs(scFv)(VLおよびVH領域がペアになって、一本鎖FabおよびscFabを含む一価分子を形成する単一のタンパク質鎖としてそれらを作ることを可能にする合成または天然リンカーによる組換え法を使用してVLおよびVHが結合されるフラグメントを含む)単鎖抗体、FAb断片(VL、VH、CLおよびCH1ドメインを含む一価断片を含む)、F(ab′)2断片(ヒンジ領域においてジスルフィドブリッジによってリンクされる2つのFAbフラグメントを含む二価断片を含む)、Fd断片(VHおよびCH1断片を含む断片を含む)、Fv断片(抗体の単一アームのVLおよびVHのドメインを含む断片を含む)単一ドメイン抗体(dAbまたはsdAb)(VHドメインを含む断片を含む)、単離された相補性決定領域(CDR)、二特異性抗体(2つの異なる抗原を認識する互いに結合される2つのVLおよびVHのドメインなどの二価二量体を含む断片を含む)、単量体可変ドメインのみで構成される断片、ジスルフィド連結されたFvs(sdFv)、イントラボディ、抗イディオタイプ(抗Id)の抗体、またはそのab抗原結合性断片を含むが、それらに限定されない。いくつかの例では、本明細書に開示されるライブラリは、スキャフォールドのためのコードする核酸を含み、ここで、スキャフォールドは、完全な抗原認識および抗原結合部位を含有している最小の抗体断片で構成されるFv抗体を含むFv抗体である。いくつかの実施形態では、Fv抗体は、緊密な非共有結合の1つの重鎖と1つの軽鎖可変ドメインの二量体で構成され、各可変ドメインの3つの超可変領域が相互作用して、VH-VL二量体の表面に抗原結合部位を定義する。いくつかの実施形態では、6つの超可変領域が抗体に対する抗原結合特異性を与える。いくつかの実施形態では、単一の可変ドメイン(または、VHH抗体またはナノボディなどの1つの重鎖可変ドメインを含むラクダ科動物から単離された単一ドメイン抗体を含む、抗原に特異的な3つの超可変領域のみを含むFvの半分)は、抗原を認識して結合する能力を有する。いくつかの例では、本明細書に開示されるライブラリは、スキャフォールドのためのコードする核酸を含み、ここで、スキャフォールドは、単鎖FvまたはscFvであり、VH、VL、またはVHドメインとVLドメインの両方を含む抗体フ断片を含み、両方のドメインが単一のポリペプチド鎖に存在する。いくつかの実施形態では、Fvポリペプチドは、scFvが抗原結合に所望される構造を形成することを可能にする、VH及びVLのドメインの間にポリペプチドリンカーをさらに含む。いくつかの例では、scFvはFc断片にリンクされ、あるいはVHHはFc断片(ミニボディを含む)にリンクされる。いくつかの例では、抗体は、免疫グロブリン分子、および免疫学的に活性断片の免疫グロブリン分子、例えば、抗原結合部位を含有している分子を含む。免疫グロブリン分子は、任意のタイプ(例えば、IgG、IgE、IgM、IgD、IgAおよびIgY)、クラス(例えば、IgG1、IgG2、IgG3、IgG4、IgA1およびIgA2)、またはサブクラスのものである。
【0045】
核酸アセンブリのための本明細書に記載されているような方法は、個々の反応において遺伝子断片の合成を含む場合がある。いくつかの例では、遺伝子断片の合成の後に、多重遺伝子アセンブリが行われる。いくつかの例では、多重遺伝子アセンブリは、少なくとも、あるいは約2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000年、3000、4000、5000、6000、7000、8000、9000、10000、20000、40000、または40000を超える配列、あるいは遺伝子断片がアセンブルされる結果をもたらす。いくつかの例では、少なくとも、あるいは約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、または100を超える遺伝子がアセンブルされる。いくつかの例では、多重遺伝子アッセンブリは、少なくとも、あるいは約2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、または800を超える塩基対(bp)のアセンブリを引き起こす。
【0046】
本明細書に記載されているような方法を利用する核酸アセンブリは、低エラー率、低ドロップアウト率、低暴走、低パーセンテージのキメラ遺伝子、またはそれらの組み合わせを含む核酸のライブラリの結果をもたらす場合がある。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、ライブラリ全体にわたって、またはライブラリの80%、85%、90%、93%、95%、96%、97%、98% 99% 99.5% 99.8% 99.9% 99.95% 99.98% 99.99%、またはそれ以上にわたって、塩基の挿入、欠失、置換、あるいは1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000未満、またはそれ以下である合計のエラー率を含む。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、1.0%未満、1.5%未満、2.0%未満、2.5%未満、3.0%未満、3.5%未満、4.0%未満、4.5%未満、5.0%未満、6.0%未満、6.5%未満、7.0%未満、7.5%未満、8.0%未満、8.5%未満、9.0%未満、9.5%未満、または10%未満のATドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、1.0%未満、1.5%未満、2.0%未満、2.5%未満、3.0%未満、3.5%未満、4.0%未満、4.5%未満、または5.0%未満のATドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、1.0%未満、1.5%未満、2.0%未満、2.5%未満、3.0%未満、3.5%未満、4.0%未満、4.5%未満、5.0%未満、6.0%未満、6.5%未満、7.0%未満、7.5%未満、8.0%未満、8.5%未満、9.0%未満、9.5%未満、または10%未満の GCドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、1.0%未満、1.5%未満、2.0%未満、2.5%未満、3.0%未満、3.5%未満、4.0%未満、4.5%未満、または5.0%未満のGCドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、最大で1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、6.0%、6.5%、7.0%、7.5%、8.0%、8.5%、9.0%、9.5%、または10%のキメラ遺伝子を含む。
【0047】
核酸アセンブリのために本明細書に記載されているような方法は、1つ以上の遺伝子断片の酵素学的ベースのアセンブリを含む場合がある。いくつかの例では、酵素学的媒介の核酸アセンブリは、遺伝子断片に相同的な配列の添加を含む。いくつかの例では、デノボ合成遺伝子断片は、相同性配列を既に含む。いくつかの例では、酵素学的媒介された核酸アセンブリは、酵素学的混合物の使用を含む。いくつかの例では、酵素学的混合物はエンドヌクレアーゼを含む。いくつかの例では、酵素学的混合物は、随意にエキソヌクレアーゼ、ポリメラーゼ、またはリガーゼを含む。いくつかの例では、酵素学的混合物は、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む。いくつかの例では、酵素学的混合物は、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、酵素学的媒介した核酸アセンブリは、効率を向上させる。いくつかの例では、酵素学的混合物は、制限酵素でない酵素を含む。いくつかの例では、酵素学的混合物は、構造特異的酵素である酵素を含む。いくつかの例では、酵素学的混合物は、構造特異的酵素かつ配列特異的でない酵素である酵素を含む。
【0048】
酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、エキソヌクレアーゼ活性を含む酵素を使用して、核酸と接触させる工程を含む。いくつかの例では、エキソヌクレアーゼは、3’エキソヌクレアーゼ活性を含む。3’エキソヌクレアーゼ活性を含む例示的なエキソヌクレアーゼは、エキソヌクレアーゼI、エキソヌクレアーゼIII、エキソヌクレアーゼV、エキソヌクレアーゼVII、およびエキソヌクレアーゼTを含むが、それらに限定されない。いくつかの例では、エキソヌクレアーゼは、5’エキソヌクレアーゼ活性を含む。5’エキソヌクレアーゼ活性を含む例示的なエキソヌクレアーゼは、エキソヌクレアーゼII、エキソヌクレアーゼIV、エキソヌクレアーゼV、エキソヌクレアーゼVI、エキソヌクレアーゼVII、エキソヌクレアーゼVIII、T5エキソヌクレアーゼ、およびT7エキソヌクレアーゼを含むが、それらに限定されない。いくつかの例では、エキソヌクレアーゼは、エキソヌクレアーゼIII(ExoIII)である。エキソヌクレアーゼは、野生型エキソヌクレアーゼおよび誘導体、キメラ、および/またはその突然変異体を含む。突然変異体エキソヌクレアーゼは、エキソヌクレアーゼのアミノ酸または核酸配列内の1つ以上の突然変異、挿入、欠失、またはその任意の組み合わせを含む酵素を含む。
【0049】
いくつかの例では、エキソヌクレアーゼは、酵素活性のために最適な温度、例えば、約25-80°C、25-70°C、25-60°C、25-50°C、または25-40 °Cの範囲内の温度で使用される。いくつかの例では、温度は約37℃である。いくつかの例では、温度は約50℃である。いくつかの例では、温度は約55℃である。いくつかの例では、温度は約65℃である。いくつかの例では、温度は、少なくとも、あるいは約15°C、20°C、25°C、30°C、35°C、40°C、45°C、50°C、5 °C、60°C、65°C、70°C、75°C、80°C、または80°Cを超える温度である。
【0050】
いくつかの例では、酵素学的媒介した核酸アセンブリのための方法は、エキソヌクレアーゼの使用を含まない。いくつかの例では、酵素学的媒介した核酸アセンブリのための方法は、エキソヌクレアーゼの使用を含む。いくつかの例では、1つ以上のエキソヌクレアーゼが使用される。例えば、少なくとも、あるいは約1、2、3、4、5、6、または6を超えるエキソヌクレアーゼが使用される。いくつかの例では、エキソヌクレアーゼは、5’~3’のエキソヌクレアーゼ活性を含む。いくつかの例では、エキソヌクレアーゼは、3’~5’のエキソヌクレアーゼ活性を含む。いくつかの例では、方法、二本鎖DNAをエンドヌクレアーゼと接触させる工程を含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、方法は、二本鎖DNAを、フラップエンドヌクレアーゼ、リガーゼ、またはポリメラーゼと接触させる工程を含む。いくつかの例では、フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1である。
【0051】
酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、エンドヌクレアーゼ活性を含む酵素を使用して、核酸と接触させる工程を含む。いくつかの例では、エンドヌクレアーゼは、5’ヌクレアーゼ活性を含む。いくつかの例では、エンドヌクレアーゼは、3’ヌクレアーゼ活性を含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、フラップエンドヌクレアーゼは、5’ヌクレアーゼ活性を含む。いくつかの例では、フラップエンドヌクレアーゼは、酵素の5’ヌクレアーゼ族のメンバーである。例示的な5’ヌクレアーゼ酵素は、フラップエンドヌクレアーゼ1、エキソヌクレアーゼ1、色素性乾皮症相補群G(XPG)、Dna2、およびギャップエンドヌクレアーゼ1(GEN1)を含むが、それらに限定されない。いくつかの例では、フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ1である。いくつかの例では、フラップエンドヌクレアーゼは、3’ヌクレアーゼ活性を含む。3’ヌクレアーゼ活性を有する例示的なフラップエンドヌクレアーゼは、RAG1、RAG2、およびMUS81を含むが、それらに限定されない。いくつかの例では、フラップエンドヌクレアーゼは、古細菌、細菌、酵母、植物、または哺乳類のフラップエンドヌクレアーゼである。
【0052】
いくつかの例では、エンドヌクレアーゼは、酵素活性のために最適な温度、例えば、25-80°C、25-70°C、25-60°C、25-50°C、または25-40°Cの温度で使用される。いくつかの例では、温度は約50℃である。いくつかの例では、温度は約55℃である。いくつかの例では、温度は約65℃である。いくつかの例では、温度は、少なくとも、あるいは約15°C、20°C、25°C、30°C、35°C、40°C、45°C、50°C、5 °C、60°C、65°C、70°C、75°C、80°C、または80°Cを超える温度である。いくつかの例では、エンドヌクレアーゼは、熱安定性エンドヌクレアーゼである。熱安定性エンドヌクレアーゼは、少なくとも、あるいは約60°C、65°C、70°C、75°C、80°C、または80°Cを超える温度で官能性であるエンドヌクレアーゼを含む場合がある。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、フラップエンドヌクレアーゼは、熱安定性フラップエンドヌクレアーゼである。
【0053】
本明細書に提供されるのは、エキソヌクレアーゼに対するエンドヌクレアーゼの比率が約0.1:1~約1:5である、核酸アセンブリのための方法である。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、エキソヌクレアーゼに対するエンドヌクレアーゼの比率は、少なくとも、あるいは約0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5、または1:5を超えるものである。いくつかの例では、エキソヌクレアーゼに対するエンドヌクレアーゼの比率は少なくともある、あるいは約1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1、または1:0.1未満である。
【0054】
本明細書に提供されるのは、エキソヌクレアーゼを含む核酸アセンブリのための方法であり、ここで、エキソヌクレアーゼの濃度は約0.1U~約20U、またはそれを超えるものである。例えば、エキソヌクレアーゼの濃度は、少なくとも、あるいは約0.1U、0.25U、0.5U、0.75U、1U、1.6U、2U、3U、4U、5U、6U、7U、8U、9U、10U、12U、14U、16U、18U、20U、または20Uを超えるものである。いくつかの例では、エキソヌクレアーゼの濃度は、約0.5~約1.0U範囲内である。いくつかの例では、エキソヌクレアーゼの濃度は、約1.0U~約2.0Uである。いくつかの例では、エキソヌクレアーゼの濃度は約1.6Uである。いくつかの例では、エキソヌクレアーゼの濃度は約5.0Uである。いくつかの例では、エキソヌクレアーゼの濃度は、約0.1U~20U、0.25U~18U、0.5U~16U、0.75U~14U、1U~12U、2U~10U、3U~9U、または4U~8Uである。
【0055】
本明細書に記載される酵素学的媒介した核酸アセンブリのための方法は、エンドヌクレアーゼを含む場合があり、ここで、エンドヌクレアーゼの濃度は、約0.25U~約12U、またはそれを超えるものである。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。エンドヌクレアーゼの例示的な濃度は、少なくとも、あるいは約0.25U、0.5U、0.75U、1U、2U、3U、4U、5U、6U、7U、8U、9U、10U、11U、12U、または12Uを超えるものを含むが、それらに限定されない。いくつかの例では、エンドヌクレアーゼの濃度は0.32Uである。いくつかの例では、エンドヌクレアーゼの濃度は1.6Uである。いくつかの例では、エンドヌクレアーゼの濃度は、約0.32U~約4.8Uの範囲内である。いくつかの例では、エンドヌクレアーゼの濃度は、0.25U~12U、0.5U~11U、0.75U~10U、1U~9U、2U~8U、3U~7U、または4U~6Uの範囲内である。
【0056】
本明細書に提供されるのは、核酸がポリメラーゼと混合される、酵素学的媒介した核酸アセンブリのための方法である。いくつかの例では、ポリメラーゼは、DNAポリメラーゼである。いくつかの例では、ポリメラーゼは、高忠実度ポリメラーゼである。高忠実度ポリメラーゼは、鋳型核酸の正確な複製または増幅を引き起こすポリメラーゼを含む場合がある。いくつかの例では、DNAポリメラーゼは、熱安定性DNAポリメラーゼである。DNAポリメラーゼは、ファミリーAポリメラーゼ、ファミリーBポリメラーゼ、ファミリーCポリメラーゼ、ファミリーDポリメラーゼ、ファミリーXポリメラーゼ、およびファミリーYポリメラーゼを含むが、これらに限定されないDNAポリメラーゼの任意のファミリーからであってもよい。いくつかの例では、DNAポリメラーゼは、Thermus、Bacillus、Thermococcus、Pyrococcus、Aeropyrum、Aquifex、Sulfolobus、Pyrolobus、またはMethanopyrusを含むが、これらに限定されない属からである。
【0057】
増幅反応に使用するための本明細書に記載されるポリメラーゼは、様々な酵素活性を含む場合がある。ポリメラーゼは、例えば、伸長産物を産生するためにプライマーを伸長するために本発明の方法で使用される。いくつかの例では、DNAポリメラーゼは、5’~3’のポリメラーゼ活性を含む。いくつかの例では、DNAポリメラーゼは、3’~5’のポリメラーゼ活性を含む。いくつかの例では、DNAポリメラーゼは校正活性を含む。例示的なポリメラーゼは、DNAポリメラーゼ(I、II、またはIII)、T4DNAポリメラーゼ、T7DNAポリメラーゼ、BstDNAポリメラーゼ、Bcaポリメラーゼ、VentDNAポリメラーゼ、PfuDNAポリメラーゼ、およびTaqDNAポリメラーゼを含むが、それらに限定されない。熱安定性DNAポリメラーゼの非限定的な例は、Taq、PhusionR DNAポリメラーゼ、Q5RHigh FidelityDNAポリメラーゼ、LongAmpR DNAポリメラーゼ、Expand High Fidelityポリメラーゼ、HotTubポリメラーゼ、Pwoポリメラーゼ、Tflポリメラーゼ、Tliポリメラーゼ、UlTmaポリメラーゼ、Pfuポリメラーゼ、KOD DNAポリメラーゼ、JDF-3 DNAポリメラーゼ、PGB-D DNAポリメラーゼ、Tgo DNAポリメラーゼ、Pyrolobus furmarius DNAポリメラーゼ、Vent ポリメラーゼ、およびDeep Vent ポリメラーゼを含むが、それらに限定されない。
【0058】
本明細書に記載されるのは、DNAポリメラーゼを含む方法であり、ここで、DNAポリメラーゼの濃度は、約0.1U~約2U、または2Uを超えるものである。いくつかの例では、DNAポリメラーゼの濃度は約0.1Uである。いくつかの例では、DNAポリメラーゼの濃度は約0.2Uである。いくつかの例では、DNAポリメラーゼの濃度は約0.01Uである。いくつかの例では、DNAポリメラーゼの濃度は、少なくとも、または約0.005U~2U、0.005U~1U、0.005U~0.5U、0.01U~1U、0.1U~0.5U、0.1U~0.5U、0.1U~1U、0.1U~1.5U、0.1U~2U、0.5U~1.0U、0.5U~1.5U、0.5U~2U、1U~1.5U、1.0U~2.0U、または1.5U~2Uの範囲内である。
【0059】
本明細書に記載される方法での使用のためのDNAポリメラーゼは、酵素活性のために最適な温度、例えば、25-80°C、25-70°C、25-60°C、25-50°C、または25-40°Cの温度で使用される。いくつかの例では、温度は約50℃である。いくつかの例では、温度は約55℃である。いくつかの例では、温度は約65℃である。いくつかの例では、温度は、少なくとも、あるいは約15°C、20°C、25°C、30°C、35°C、40°C、45°C、50°C、5°C、60°C、65°C、70°C、75°C、80°C、または80°Cを超える温度である。
【0060】
本明細書に記載されているような酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、リガーゼを使用して、核酸を処置する工程を含む。本明細書に記載されているようなリガーゼは、核酸断片を結合するために機能する場合がある。例えば、リガーゼは、隣接するDNAの3’ヒドロキシル化された末端と5’リン酸化された末端を結合するように機能する。リガーゼは、大腸菌リガーゼ、T4リガーゼ、哺乳類のリガーゼ(例えば、DNAリガーゼI、DNAリガーゼII、DNAリガーゼIII、DNAリガーゼIV)、熱安定性リガーゼ、およびファストリガーゼ(fast ligase)を含むが、それらに限定されない。いくつかの例では、リガーゼは、熱安定性リガーゼである。いくつかの例では、リガーゼはAmpligaseである。
【0061】
リガーゼの濃度は変動する場合がある。いくつかの例では、リガーゼの濃度は、約0U~約2Uの範囲内である。リガーゼの例示的な濃度は、約0.5Uである。いくつかの例では、リガーゼの濃度は、約1.0Uである。いくつかの例では、リガーゼの濃度は、約5.0Uである。いくつかの例では、リガーゼの濃度は、少なくとも、あるいは約0U~0.25U、0U~0.5U、0U~1U、0U~1.5U、0U~2U、0.25U~0.5U、0.25U~1.0U、0.25U~1.5U、0.25U~2.0U、0.5U~1.0U、0.5U~1.5U、0.5U~2.0U、1.0U~1.5U、1.0U~2.0U、または1.5U~2.0U、2.0U~4.0U、4.0U~6.0U、4.0U~8.0U、6.0U~10.0Uの範囲内である。
【0062】
いくつかの例では、リガーゼは、酵素活性のために最適な温度、例えば、25-80°C、25-70°C、25-60°C、25-50°C、または25-40°Cの温度で使用される。いくつかの例では、温度は約50℃である。いくつかの例では、温度は約55℃である。いくつかの例では、温度は約65℃である。いくつかの例では、温度は、少なくとも、あるいは約15°C、20°C、25°C、30°C、35°C、40°C、45°C、50°C、5°C、60°C、65°C、70°C、75°C、80°C、または80°Cを超える温度である。
【0063】
核酸アセンブリのための本明細書に記載された方法は、ライゲーション反応を含む場合がある。ライゲーション反応の1つの例は、ポリメラーゼ連鎖アセンブリ(PCA)である。いくつかの例では、少なくともポリヌクレオチドの一部は、ユニバーサルプライマー結合のための基質である、追加された領域を含むように設計されている。PCA反応については、あらかじめ合成されたポリヌクレオチドは、互いにオーバーラップ(例えば、重複する配列を備えた4、20、または40以上塩基)を含む。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニーリングされ、その後はポリメラーゼにより充填される。したがって、各サイクルは、どのポリヌクレオチドが互いに見出されるかにランダムに依存して、様々な断片の長さを増加させる。断片間の相補性は、完全な大きなスパンの二本鎖DNAの形成を可能にする。いくつかの例では、PCA反応が完了した後、エラー修正工程が、配列のミスマッチを除去するためにミスマッチの修正の検出酵素を使用して行なわれる。
【0064】
いくつかの例では、本明細書に記載される方法は増幅反応を含む。いくつかの実施形態では、増幅反応はポリメラーゼ連鎖反応(PCR)である。いくつかの例では、増幅反応は、ダイヤルアウトPCR(dial-out PCR)である。いくつかの例では、増幅反応は、増幅中のユニバーサルプライマー結合配列のハイブリダイゼーションを含む。いくつかの例では、ユニバーサルプライマー結合配列は、同じ5’あるいは3’プライマーを結合することができる。いくつかの例では、ユニバーサルプライマー結合配列は、増幅反応での複数の標的核酸中で共有される。
【0065】
エラー修正工程を含み得る核酸アセンブリのための方法が、本明細書に提供される。エラー修正は、合成されたポリヌクレオチド上および/またはアセンブルされた産物上で実行されてもよい。エラー修正用の例示的な戦略は、エラーを修正するためのオーバーラップ伸長PCRによる部位特異的突然変異誘発を含み、これは、随意に、クローニングと配列決定の2以上のラウンドと連結される。ある例では、ミスマッチ、バルジ、および小ループを伴う二本鎖核酸、化学上改変された塩基および/または他のヘテロ二本鎖は、正確に合成された核酸の集団から選択的に取り除かれる。いくつかの例では、エラー修正は、二本鎖核酸内のミスマッチの塩基または不対塩基を認識し、そしてそれらに結合するか、またはそれらに隣接するタンパク質/酵素を使用して実施され、一本鎖切断または二本鎖切断が作成されるか、ストランド転移転位事象が開始される。エラー修正用のタンパク質/酵素の非限定的な例は、エンドヌクレアーゼ(T7エンドヌクレアーゼI、大腸菌エンドヌクレアーゼV、T4エンドヌクレアーゼVII、マングビーンヌクレアーゼ、細胞、大腸菌エンドヌクレアーゼIV、UVDE)、制限酵素、グリコシラーゼ、リボヌクレアーゼ、ミスマッチ修正酵素、リゾルバーゼ(resolvases)、ヘリカーゼ、リガーゼ、ミスマッチに特異的な抗体、およびそれらの変異体を含む。特定のエラー修正酵素の例は、T4エンドヌクレアーゼ7、T7エンドヌクレアーゼ1、S1、マングビーンエンドヌクレアーゼ、MutY、MutS、MutH、MutL、クリベース(cleavase)、CELI、およびHINF1を含む。いくつかの例では、DNAミスマッチ結合タンパク質MutS(サーマス・アクアティカス(Thermus aquaticus))は、合成された産物の集団から失敗産物を取り除くために使用される。いくつかの例では、エラー修正は、酵素のコレクターゼ(Correctase)を使用して実施される。いくつかの例では、エラー修正は、ヘテロ二本鎖DNAのための、既知および未知の変異および多型性をスキャンするミスマッチ特異的DNAエンドヌクレアーゼであるSURVEYORエンドヌクレアーゼ(Transgenomic)を使用して実施される。
【0066】
結果として生じる核酸は証明可能である。場合によっては、核酸が配列決定によって証明される。いくつかの例では、核酸は次世代シーケンシングなどのハイスループットシーケンシングによって証明される。配列決定ライブラリの配列決定は、単一分子のリアルタイム(SMRT)シーケンシング、ポロニーシーケンシング、ライゲーションシーケンシング、可逆的なターミネーターシーケンシング、陽子検出シーケンシング、イオン半導体シーケンシング、ナノポアシーケンシング、電子シーケンシング、パイロシーケンシング、マクサム-ギルバートシーケンシング、連鎖停止反応(例えば、サンガー)シーケンシング、+Sシーケンシング、あるいは合成によるシーケンシングを含むがこれらに限定されない、任意の適切なシーケンシング技術を用いて実施可能である。
【0067】
本明細書に記載される通りの方法は、いくつかの実施形態で、結果として、少なくともあるいは約101、102、103、104、105、106、107、108、109、1010、あるいは1010を超える変異体を含むライブラリの生成をもたらす。いくつかの例では、少なくともあるいは約101、102、103、104、105、106、107、108、109、あるいは1010の変異体を含むライブラリの各々の変異体に対する配列が知られている。いくつかの例では、ライブラリは、変異体の予測された多様性を含む。いくつかの例では、ライブラリで表された多様性は、予測された多様性の少なくともあるいは約60%、65%、70%、75%、80%、85%、90%、95%、あるいは95%よりも高い。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約70%である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約80%である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約90%である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約99%である。本明細書に記載される時、用語「予測された多様性」とは、あらゆる可能性のある変異体を含む集団中の理論的な多様性の合計を指す。
【0068】
本明細書に記載される通りの核酸アセンブリを使用する方法は、高GC含有量、直列反復配列、あるいは二次構造にもかかわらず、効率的に断片をアセンブルしてもよい。いくつかの例では、アセンブリのための断片は、少なくともまたは約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、、60%、65%、70%、75%、80%、85%、90%、95%、または95%よりも高いGC含有量を含む。いくつかの例では、アセンブリのための断片は、少なくともまたは約10、15、20、25、30、35、40、45、50、55、60、65、70、75、あるいは80の塩基対(bp)隣接直列反復配列を含む。いくつかの例では、アセンブリのための断片は、少なくともまたは約-5、-6、-7、-8、-9、-10、-11、-12、-13、-14、-15、-16、-17、-18、-19、-20、-21、-22、-23、-24、-25、あるいは-26dGのdG値を有するヘアピン構造などの二次構造を含む。いくつかの例では、アセンブリのための断片は、約-11~約-18dGの範囲のdG値を有するヘアピン構造などの二次構造を含む。
【0069】
核酸の高均一的ライブラリのアセンブリのための方法が、本明細書に提供される。場合によっては、約80%を超える合成された核酸(RNAまたはDNA)が、核酸ライブラリの核酸表現の平均の5X以内で表わされる。場合によっては、約90%を超える合成された核酸(RNAまたはDNA)が、核酸ライブラリの核酸表現の平均の5X以内で表わされる。場合によっては、約90%を超える核酸が、ライブラリの核酸表現の平均の2X以内で表わされる。場合によっては、約90%を超える核酸が、ライブラリの核酸表現の平均の1.5X以内で表わされる。場合によっては、約80%を超える核酸が、ライブラリの核酸表現の平均の1.5X以内で表わされる。
【0070】
本明細書に記載される方法によってアセンブルされた核酸ライブラリは、あらかじめ定められた配列と比較して、高割合の正確な配列を含む。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、70%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、75%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、80%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、85%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、90%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、95%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、100%を超える正確な配列を有する。
【0071】
いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、70%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、75%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、80%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、85%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、90%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、95%を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、100%を超える正確な配列を有する。
【0072】
増幅後に高均一性を有する核酸ライブラリが、本明細書に提供される。いくつかの例では、80%を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約1.5X以内で表される。いくつかの例では、本明細書に記載される90%を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約1.5X以内で表される。いくつかの例では、80%を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約2X以内で表される。いくつかの例では、80%を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約2X以内で表される。
【0073】
核酸配列アセンブリのためのシステム
【0074】
ポリヌクレオチド合成
【0075】
本明細書に記載の方法によるデノボ合成によるポリヌクレオチドの生成後の、核酸のバーコード核酸配列アセンブリのための方法が、本明細書に提供される。例示的なワークフローは、
図7に確認される。核酸配列を含むコンピュータ可読入力ファイルが受け取られる。コンピュータは、核酸配列を処理して、集合的に核酸配列をコードするポリヌクレオチド配列または複数のポリヌクレオチド配列の合成のための命令を生成する。命令は、複数の核酸配列に基づく複数のポリヌクレオチドの合成用の材料堆積装置(703)に転送される。ポリヌクレオチド酸シンセサイザーなどの材料堆積装置(703)は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して一度に1つの残基を伸長させ、それによりあらかじめ決められた核酸配列を有するオリゴマーを生成する。材料堆積装置(703)は、ポリヌクレオチド酸合成および伸長用の遺伝子座の複数のクラスタ(707)を含むアレイ(705)上に、オリゴマーを生成する。しかし、アレイは、クラスタ中に遺伝子座を組織化させる必要はない。例えば、遺伝子座は、アレイにわたって均一に広げられ得る。デノボポリヌクレオチドは、合成され、そしてプレートから取り除かれ、そしてアセンブリ反応が収集チャンバ(709)で開始され、その後に、より長いポリヌクレオチド(711)の集団が形成される。収集チャンバは、複数の表面(例えば上面と底面)のサンドイッチ形状、またははウェル、あるいはチャネルを含み、合成表面からの転移材料を含有する。デノボポリヌクレオチドもまた合成され、そしてプレートから取り除かれて、より長いポリヌクレオチド(711)の集団を形成し得る。その後、より長いポリヌクレオチド(711)の集団は、液滴に分割され得るか、またはPCRにかけられ得る。その後、より長いポリヌクレオチド(711)の集団は、核酸アセンブリ(713)にかけられる。いくつかの例では、核酸アセンブリは、変異体相同性配列を含む。いくつかの例では、核酸アセンブリは、ペア化された相同性配列を使用する、ペア化された変異体アセンブリを含む。いくつかの例では、ペア化された変異体アセンブリは、バーコードを含む。いくつかの例では、バーコードは、IIS型制限エンドヌクレアーゼなどの制限エンドヌクレアーゼに曝露される。
【0076】
本明細書に記載される方法によるデノボ合成によるポリヌクレオチドの生成後の、核酸の配列アセンブリのためのシステムが、本明細書に提供される。いくつかの例では、システムは、コンピュータ、材料堆積装置、表面、および核酸アセンブリ面を含む。いくつかの例では、コンピュータは、核酸配列を有する可読入力ファイルを含む。いくつかの例では、コンピュータは、核酸配列を処理して、集合的に核酸配列をコードするポリヌクレオチド配列または複数のポリヌクレオチド配列の合成のための命令を生成する。いくつかの例では、コンピュータは、複数のポリヌクレオチド酸配列の合成のための材料堆積装置に、命令を提供する。いくつかの例では、材料堆積装置は、伸長反応のために、表面にヌクレオシドを堆積させる。いくつかの例では、表面は、伸長反応のための遺伝子座を含む。いくつかの例では、遺伝子座は、スポット、ウェル、マイクロウェル、チャネル、あるいはポストである。いくつかの例では、複数のポリヌクレオチド酸配列は、伸長反応後に合成される。いくつかの例では、複数のポリヌクレオチド酸配列は、表面から取り除かれ、そして核酸アセンブリのために調製される。いくつかの例では、核酸アセンブリは、バーコード免疫グロブリン配列アセンブリを含む。
【0077】
本明細書に提供されるのは、ホスホラミダイト化学を関与するポリヌクレオチド合成のための方法である。いくつかの例では、ポリヌクレオチド合成は、塩基をホスホラミダイトと連結させることを含む。いくつかの例では、ポリヌクレオチド合成は、連結条件下でホスホラミダイトの堆積によって塩基を連結させることを含み、ここで、同じ塩基が随意に、1回を超えて、すなわち、二重の連結でホスホラミダイトと堆積する。いくつかの例では、ポリヌクレオチド合成は、未反応の部位のキャッピングを含む。いくつかの例では、キャッピングは随意である。いくつかの例では、ポリヌクレオチド合成は、酸化硫化を含む。いくつかの例では、ポリヌクレオチド合成は、非ブロック化または脱トリチルを含む。いくつかの例では、ポリヌクレオチド合成は、硫化を含む。いくつかの例では、ポリヌクレオチド合成は、酸化または硫化のいずれかを含む。いくつかの例では、ポリヌクレオチド合成反応中の1つの工程または各々の工程間で、基質は、例えば、テトラゾールまたはアセトニトリルを使用して洗浄される。ホスホラミダイト合成方法における任意の1工程に対する時間枠は、約2分、1分、50秒、40秒、30秒、20秒、および10秒未満を含む。
【0078】
ホスホラミダイト方法を使用するポリヌクレオチド合成は、亜リン酸塩トリエステルリンケージの形成のために成長しているポリヌクレオチド鎖へのホスホラミダイトビルディングブロック(例えば、ヌクレオシドホスホラミダイト)のその後の追加を含む。ホスホラミダイトポリヌクレオチド合成は、3’方向から5’方向に進行する。ホスホラミダイトポリヌクレオチド合成は、1つの合成サイクル当たり、成長している核酸鎖への1つのヌクレオチドの制御された追加を可能にする。いくつかの例では、各合成サイクルは連結工程を含む。ホスホラミダイト連結は、活性化されたヌクレオシドホスホラミダイトと、例えば、リンカーを介して基質に結合されたヌクレオシドとの間の亜リン酸トリエステルリンケージの形成を含む。いくつかの例では、ヌクレオシドホスホラミダイトは、起動された基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、アクチベーター(activator)とともに基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、基質に結合したヌクレオシドよりも、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍、またはそれ以上の過剰量で、基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトの追加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。ヌクレオシドホスホラミダイトの追加に続いて、基質は随意に洗浄される。いくつかの例では、連結工程は、随意に、基質へのヌクレオシドホスホラミダイトの追加の間の洗浄工程とともに、1回以上追加して繰り返される。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、1、2、3、またはそれ以上の順次的な連結工程を含む。連結前に、多くの場合において、基質に連結されたヌクレオシドは、保護基の除去によって脱保護され、ここで、保護基は重合を防ぐように機能する。一般的な保護基は、4,4’-ジメトキシトリチル(DMT)である。
【0079】
連結の後、ホスホラミダイトポリヌクレオチド合成方法は、随意にキャッピング工程を含む。キャッピング工程では、成長しているポリヌクレオチドは、キャッピング剤で処理される。キャッピング工程は、さらなる鎖伸長からの連結後に未反応の基質に連結した5’-OH基をブロックするのに有用であり、これによって、内部塩基の欠失を伴うポリヌクレオチドの形成を防ぐ。さらに、1H-テトラゾールで活性化されたホスホラミダイトは、わずかな範囲で、グアノシンのO6位置と反応し得る。理論に縛られることなく、I2/水による酸化で、この副産物は、おそらくO6-N7遊走を介して、脱プリン化を受けることもある。脱プリン部位は、結局、ポリヌクレオチドの最終的な脱保護の間に切断され、したがって、完全長の産物の収率を低下させる。O6修飾は、I2/水での酸化前にキャッピング試薬による処理によって除去され得る。いくつかの例では、ポリヌクレオチド合成の間にキャッピング工程を含めることで、キャッピングのない合成と比較して、エラー率は低下する。一例として、キャッピング工程は、無水酢酸と1-メチルイミダゾールとの混合物で、基質に結合したポリヌクレオチドを処理することを含む。キャッピング工程に続いて、基質は随意に洗浄される。
【0080】
いくつかの例では、ヌクレオシドホスホラミダイトの添加後に、および随意にキャッピングと1以上の洗浄工程後に、基質に結合した成長している核酸は酸化される。酸化工程は、亜リン酸トリエステルが、自然発生のリン酸ジエステルヌクレオシド間リンケージの保護された前駆体である、四配位リン酸トリエステルへの酸化を含む。いくつかの例では、成長しているポリヌクレオチドの酸化は、随意に弱塩基(例えば、ピリジン、ルチジン、コリジン)の存在下で、ヨウ素および水による処理によって達成される。酸化は、例えば、tert-ブチルヒドロペルオキシドまたは(1S)-(+)-(10-カンファースルホニル)-オキサジリジン(CSO)を使用して、無水条件下で実行され得る。いくつかの方法では、キャッピング工程は、酸化に続いて実行される。持続する可能性のある酸化からの残留水がその後の連結を阻害することができるため、第2のキャッピング工程は基質の乾燥を可能にする。酸化後に、基質と成長しているポリヌクレオチドは、随意に洗浄される。いくつかの例では、酸化の工程は、ポリヌクレオチドホスホロチオエートを得るために硫化工程に置き換えられ、ここで、いかなるキャッピング工程も硫化後に実行することができる。限定されないが、3-(ジメチルアミノメチリデン)アミノ)-3H-1,2,4-ジチアゾール-3-チオン、DDTT、3H-1,2-ベンゾジチオール-3-オン1,1-ジオキシド(Beaucage試薬としても知られている)、およびN,N,N’N’-テトラエチルチウラムジスルフィド(TETD)を含む多くの試薬が、効率的な硫黄移動を行うことができる。
【0081】
ヌクレオシド取り込みのその後のサイクルが連結を介して生じるようにするために、基質に連結した成長しているポリヌクレオチドの保護された5’末端は除去され、一次ヒドロキシル基が次のヌクレオシドホスホラミダイトと反応する。いくつかの例では、保護基はDMTであり、非ブロック化が、ジクロロメタン中でトリクロロ酢酸とともに生じる。長時間にわたる、または推奨された酸の溶液よりも強力な脱トリチル化を行うことで、固体支持体に結合したポリヌクレオチドの脱プリン化を増大させ、ゆえに、望ましい完全長の産物の収率を低下させることがある。本明細書に記載の本発明の方法および組成物は、望ましくない脱プリン反応を制限する制御された非ブロック化の条件を提供する。いくつかの例では、基質に結合したポリヌクレオチドは、非ブロック化後に洗浄される。いくつかの例では、非ブロック化後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。
【0082】
ポリヌクレオチドの合成のための方法は、典型的には以下の工程の一連の繰り返し(iterating sequence)を含む:活性化された表面、リンカー、または以前に脱保護された単量体とリンクするために、保護された単量体の活発に官能化された表面(例えば、遺伝子座)への適用;後に適用される保護された単量体と反応するような、適用された単量体の脱保護;および、リンクのための別の保護された単量体の適用。1以上の中間工程は、酸化または硫化を含む。いくつかの例では、1以上の洗浄工程は、工程の1つまたはすべてに先行するかまたはその後に続く。
【0083】
ホスホラミダイトベースのポリヌクレオチド合成のための方法は、一連の化学的な工程を含む。いくつかの例では、合成方法の1以上の工程は、試薬のサイクリングを含み、ここで、方法の1以上の工程は、工程に有用な試薬の基質への適用を含む。例えば、試薬は、一連の液体堆積および真空乾燥の工程によって循環する。ウェル、マイクロウェル、チャネルなどの三次元の特徴を含む基質のために、試薬は、随意にウェルおよび/またはチャネルを介して基質の1つ以上の領域を通過する。
【0084】
本明細書に記載される方法および/または基質を使用して合成されたポリヌクレオチドは、少なくとも約20、30、40、50、60、70、75、80、90、長さで100、120の、150、200、または500以上の塩基を含む。いくつかの例では、ポリヌクレオチドの少なくとも約1pmol、10pmol、20pmol、30pmol、40pmol、50pmol、60pmol、70pmol、80pmol、90pmol、100pmol、150pmol、200pmol、300pmol、400pmol、500pmol、600pmol、700pmol、800pmol、900pmol、1nmol、5nmol、10nmol、または100以上nmolが、遺伝子座内に合成される。本明細書で提供される表面上のポリヌクレオチド合成のための方法は、高速での合成を可能にする。一例として、1時間あたり少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、70、80、90、100、125、150、175、200ヌクレオチド、またはそれ以上が合成される。ヌクレオチドは、アデニン、グアニン、チミン、シトシン、ウリジンの構築ブロック、またはそれらのアナログ/修飾バージョンを含む。いくつかの例では、ポリヌクレオチドのライブラリは基質上で並行して合成される。例えば、約または少なくとも約100;1,000;10,000;100,000;1,000,000;2,000,000;3,000,000;4,000,000;または5,000,000の分解された遺伝子座を含む基質は、少なくとも同じ数の別個のポリヌクレオチドの合成を支持することができ、ここで、別個の配列をコードするポリヌクレオチドは分解された遺伝子座で合成される。
【0085】
高密度のポリヌクレオチドアレイを生成するための様々な適切な方法が知られている。例示的なワークフローでは、基質表面層が提供される。この例では、表面の化学的性質(chemistry)は、ポリヌクレオチド合成プロセスを改善するために改変される。低表面エネルギーの領域が液体を弾くように生成され、一方で高表面エネルギーの領域は液体を引き付けるように生成される。表面自体は平坦な表面の形態であってもよく、または、表面積を増加させる突起またはマイクロウェルなどの形状の変形を含んでもよい。ワークフローの例では、全体として参照により本明細書に組み込まれる国際特許出願公開WO/2015/021080で開示されるように、選択された高表面エネルギー分子は、DNAの化学的性質を支援する二重の機能を果たす。
【0086】
ポリヌクレオチドアレイのインサイツ調製物は固体支持体上で生成され、並行して複数のオリゴマーを伸長させるために単一のヌクレオチド伸長プロセスを利用する。ポリヌクレオチドシンセサイザーなどの堆積装置は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して、一度に1つの残基を伸長させ、それによりあらかじめ決められた核酸配列を有するオリゴマーを生成する。いくつかの場合では、ポリヌクレオチドはこの段階で表面から切断される。切断は、例えば、アンモニアまたはメチルアミンによる気相切断(gas cleavage)を含む。
【0087】
基質
【0088】
ポリヌクレオチド合成のための表面として使用されるデバイスは、限定されることなく、均質アレイ表面、パターン化されたアレイ表面、チャネル、ビーズ、ゲル等を含む基質の形態であってもよい。複数のクラスタを含む基質が本明細書で提供され、ここで、各クラスタ、ポリヌクレオチドの付着および合成を支持する複数の遺伝子座を含む。本明細書で使用されるような「遺伝子座」という用語は、表面から伸長するために単一のあらかじめ定められた配列をコードするポリヌクレオチドに支持を与える構造上の離散領域を指す。いくつかの例では、遺伝子座は、二次元表面、例えば、実質的に平らな表面上にある。いくつかの例では、遺伝子座は、三次元表面、例えば、ウェル、微小ウェル、チャネル、又はポスト上にある。いくつかの例では、遺伝子座の表面は、ポリヌクレオチド合成のための少なくとも1つのヌクレオチド、または、好ましくは、ポリヌクレオチドの集団の合成のための同一のヌクレオチドの集団に結合するために活発に機能化される材料を含む。いくつかの例では、ポリヌクレオチドとは、同じ核酸配列をコードするポリヌクレオチドの集団を指す。場合により、基質の表面は、基質の1つ又は複数の表面を包含する。提供されるシステム及び方法を用いて本明細書に記載されるライブラリ内で合成されるポリヌクレオチドに関する平均エラー率は、しばしばエラー訂正なしで、多くの場合、1000分の1未満、2000分の1未満、3000分の1未満である。
【0089】
共通の支持体上のアドレス可能位置で異なる予め決められた配列を有している複数のポリヌクレオチドのパラレル合成を支持する表面が本明細書で提供される。いくつかの例では、基質は、50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000;5,000;10,000;20,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000以上、またはそれ以上の非同一ポリヌクレオチドの合成のための支持を提供する。場合により、表面は、別々の配列をコードする50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000;5,000;10,000;20,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000以上、または、それ以上のポリヌクレオチドの合成のための支持を提供する。いくつかの例では、ポリヌクレオチドの少なくとも一部は、同一の配列を有しているか、または同一の配列で合成されるように構成される。いくつかの例では、基質は、少なくとも80、90、100、120、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、又はそれ以上の塩基を持つポリヌクレオチドの成長のための表面環境を提供する。
【0090】
基質の別個の遺伝子座上でのポリヌクレオチド合成のための方法が本明細書で提供され、ここで、各遺伝子座はポリヌクレオチドの集団の合成を支持する。場合により、各遺伝子座は、別の遺伝子座上で成長したポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の合成を支持する。いくつかの例では、各ポリヌクレオチド配列は、ポリヌクレオチド合成のための表面上の遺伝子座の同じクラスタ内の異なる遺伝子座にわたって、1、2、3、4、5、6、7、8、9、またはそれ以上の重複性で合成される。いくつかの例では、基質の遺伝子座は複数のクラスタ内に位置する。いくつかの例において、基質は、少なくとも10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000、又はそれ以上のクラスタを含む。いくつかの例では、基質は、2,000;5,000;10,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,100,000;1,200,000;1,300,000;1,400,000;1,500,000;1,600,000;1,700,000;1,800,000;1,900,000;2,000,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000以上、または、10,000,000以上、あるいはそれ以上の別々の遺伝子座を含む。いくつかの例では、基質は約10,000の別々の遺伝子座を含む。単一のクラスタ内の遺伝子座の量は、異なる例では変動する。場合により、各クラスタは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500、又はそれ以上の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約50-500の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約100-200の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約100-150の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約109、121、130、または137の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約19、20、61、64、またはそれ以上の遺伝子座を含む。
【0091】
いくつかの例では、基質上で合成された別々のポリヌクレオチドの数は、基質上で利用可能な別々の遺伝子座の数に左右され得る。いくつかの例では、基質のクラスタ内の遺伝子座の密度は、1mm2当たり少なくとも、又は約1、10、25、50、65、75、100、130、150、175、200、300、400、500、又は1,000以上の遺伝子座である。場合によっては、基質は、10-500、25-400、50-500、100-500、150-500、10-250、50-250、10-200、又は50-200mm2を含む。いくつかの例では、クラスタ内の2つの隣接した遺伝子座の中心間の距離は、約100-500、約10-200、又は約10-100μmである。いくつかの例では、隣接した遺伝子座の2つの中心間の距離は、約10、20、30、40、50、60、70、80、90、又は100μmより大きい。いくつかの例では、2つの隣接した遺伝子座の中心間の距離は、約200、150、100、80、70、60、50、40、30、20、又は10μm未満である。いくつかの例では、各遺伝子座は、独立して、約0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、又は100umの幅を有する。場合によっては、各遺伝子座は、独立して、約0.5-100、0.5-50、10-75、又は0.5-50umの幅を有する。
【0092】
いくつかの例では、基質内のクラスタの密度は、100mm2当たり少なくともまたは約1のクラスタ、10mm2当たり1のクラスタ、5mm2当たり1のクラスタ、4mm2当たり1のクラスタ、3mm2当たり1のクラスタ、2mm2当たり1のクラスタ、1mm2当たり1のクラスタ、1mm2当たり2のクラスタ、1mm2当たり3のクラスタ、1mm2当たり4のクラスタ、1mm2当たり5のクラスタ、1mm2当たり10のクラスタ、1mm2当たり50のクラスタ、またはそれ以上である。いくつかの例では、基質は、10mm2当たり約1のクラスタから1mm2当たり約10のクラスタを含む。いくつかの例では、2つの隣接したクラスタの中心間の距離は、少なくとも、又は約50、100、200、500、1000、2000、又は5000μmである。場合によっては、2つの隣接したクラスタの中心間の距離は、約50-100、50-200、50-300、50-500、又は100-2000umの間である。場合によっては、2つの隣接したクラスタの中心間の距離は、約0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5、または0.5-2mmの間である。場合によっては、各クラスタは、独立して約0.5~2、約0.5~1、または約1~2mmの断面積を有している。場合によっては、各クラスタは、独立して約0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、または2mmの断面積を有している。場合によっては、各クラスタは、独立して約0.5、0.6、0.7、0.8、0.9、1、1.1、1.151.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、または2mmの内部断面積を有している。
【0093】
いくつかの例では、基質は、標準の96ウェルプレートのサイズであり、例えば、約100~約200mmから約50~約150mmまでの間である。いくつかの例では、基質は、約1000、500、450、400、300、250、200、150、100、または50mm以下の直径を有している。いくつかの例では、基質の直径は、約25-1000、25-800、25-600、25-500、25-400、25-300、または25-200mmの間である。いくつかの例では、基質は、少なくとも約100;200;500;1,000;2,000;5,000;10,000;12,000;15,000;20,000;30,000;40,000;50,000mm2、またはそれ以上の平面の表面積を有している。いくつかの例では、基質の厚さは、約50-2000、50-1000、100-1000、200-1000、又は250-1000mmの間である。
【0094】
表面材料
【0095】
本明細書で提供される基質、装置、およびリアクターは、本明細書に記載される方法、組成物、およびシステムに適した様々な材料から作り上げられる。特定の例では、低レベルのヌクレオチド結合を示すために、基質材料が作り上げられる。いくつかの例では、基質材料は、高レベルのヌクレオチド結合を示す別々の表面を生成するために修正される。いくつかの例では、基質材料は、可視光及び/又はUV光に対して透過性である。いくつかの例では、基質材料は、十分に導電性であり、例えば、基質の全て又は一部にわたって均一な電場を形成することができる。いくつかの例では、導電性材料は電気接地(electric ground)に接続される。いくつかの例では、基質は、熱伝導性であるか又は断熱される。いくつかの例では、材料は、化学的または生化学的な反応、例えば、ポリヌクレオチド合成反応プロセスを支持するために、耐薬品性および熱安定性である。いくつかの例では、基質は可撓性材料を含む。可撓性材料に関しては、材料は、限定されることなく以下を含むことができる:ナイロン、修飾および非修飾の、ニトロセルロース、ポリプロピレンなど。いくつかの例では、基質は剛性材料を含む。剛性材料に関しては、材料は、限定されることなく以下を含むことができる:ガラス;石英ガラス;シリコン、プラスチック(例えば、ポリテトラフルオロエチレン)、ポリプロピレン、ポリスチレン、ポリカーボネート、およびその混合など);金属(例えば金、白金など)。基質、固体担体またはリアクターは、シリコン、ポリスチレン、アガロース、デキストラン、セルロース酸ポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)およびからガラスから成る群から選択される材料から製造され得る。基質/固体担体またはミクロ構造、そのリアクターは、本明細書中にリストされる材料の組み合わせ、または当該技術分野で既知の他の適切な材料により製造され得る。
【0096】
表面のアーキテクチャ
【0097】
本明細書に記載される方法、組成物、及びシステムのための基質が本明細書で提供され、ここで、基質は、本明細書に記載される方法、組成物、及びシステムに適した表面構造を有する。いくつかの例では、基質は隆起した及び/又は沈降した特徴を含む。そのような特徴を有することの1つの利点は、ポリヌクレオチド合成を支持する表面積の増大である。いくつかの例では、隆起した及び/又は沈降した特徴を有する基質は、三次元基質と呼ばれる。場合により、三次元基質は1つ以上のチャネルを含む。場合により、1つ以上の遺伝子座はチャネルを含む。場合により、チャネルは、ポリヌクレオチドシンセサイザーなどの堆積装置による試薬の堆積に利用可能である。場合により、試薬及び/又は流体は、1つ以上のチャネルと流体連通するより大きなウェルに集まる。例えば、基質は、クラスタ内の複数の遺伝子座に対応する複数のチャネルを含み、複数のチャネルは、クラスタの1つのウェルと流体連通している。いくつかの方法において、ポリヌクレオチドのライブラリは、クラスタの複数の遺伝子座において合成される。
【0098】
本明細書に記載される方法、組成物、システムのための基質が本明細書で提供され、ここで、基質はポリヌクレオチド合成のために構成される。いくつかの例では、その構造は、表面上のポリヌクレオチド合成に関する流れの制御および材料移動経路制御を可能にするように構成されている。いくつかの例では、基質の構成は、ポリヌクレオチド合成中の材料移動経路、化学暴露時間、及び/又は洗浄効果の制御並びにその分布までをも可能にする。いくつかの例では、基質の構成は、例えば、成長しているポリヌクレオチドによる排除体積が、ポリヌクレオチドの成長に利用可能な又は適切な最初に利用可能な体積の50、45、40、35、30、25、20、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1%を超えて、又はそれ以下を占めないほど十分な、ポリヌクレオチドの成長に対する体積を提供することによって、奏効率の増大を可能にする。いくつかの例では、三次元構造は、化学暴露の急速な交換を可能にするために流体の流れの管理を可能にする。
【0099】
本明細書に記載される酵素的に媒介された核酸アセンブリ及びポリヌクレオチド合成に関する方法、組成物、及びシステムのための基質が本明細書で提供され、ここで、上記基質は、本明細書に記載される酵素反応を収容するように構成された構造を含む。 いくつかの事例では、物理構造によって隔離が達成される。いくつかの例では、ポリヌクレオチド合成に対する能動領域および受動領域を生成する表面の差次的な官能基化によって、隔離が達成される。いくつかの例では、差次的な官能化は、基質表面にわたる疎水性を変え、それによって、堆積した試薬の水滴(beading)又は湿りを引き起こす水接触角の効果を作り出すことによって達成される。より大きな構造を利用することで、飛散(splashing)および隣接するスポットの試薬による別々のポリヌクレオチド合成位置の相互汚染を減らすことができる。場合により、ポリヌクレオチドシンセサイザーなどの装置が、別々のポリヌクレオチド合成位置に試薬を堆積させるために使用される。三次元の特徴を有する基質は、低いエラー率(例えば、約1:500、1:1000、1:1500、1:2,000、1:3,000、1:5,000、または1:10,000未満)で、多数のポリヌクレオチド(例えば、約10,000を超える)の合成を可能にする方法で構成される。いくつかの例では、基質は、1mm2当たり約1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400又は500、或いはそれらを超える特徴の密度を備えた特徴を含む。
【0100】
基質のウェルは、基質の別のウェルと同じまたは異なる幅、高さ、および/または体積を有し得る。基質のチャネルは、基質の別のチャネルと同じ又は異なる幅、高さ、及び/又は体積を有し得る。いくつかの例では、クラスタの直径、あるいはクラスタを含むウェルの直径、または両方は、約0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.05-1、0.05-0.5、0.05-0.1、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5、または0.5-2mmの間である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約5、4、3、2、1、0.5、0.1、0.09、0.08、0.07、0.06、または0.05mm未満である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約1.0と約1.3mmの間である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約1.150mmである。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約0.08mmである。クラスタの直径は、二次元又は三次元の基質内のクラスタを指す。
【0101】
いくつかの例では、ウェルの高さは、約20-1000、50-1000、100-1000、200-1000、300-1000、400-1000、又は500-1000umである。場合によっては、ウェルの高さは、約1000、900、800、700、又は600umより低い。
【0102】
いくつかの例では、基質は、クラスタ内の複数の遺伝子座に対応する複数のチャネルを含み、ここで、チャネルの高さ又は深さは、5-500、5-400、5-300、5-200、5-100、5-50、又は10-50umである。場合によっては、チャネルの高さは、100、80、60、40、又は20um未満である。
【0103】
いくつかの例では、チャネル、遺伝子座(例えば、実質的に平面の基質における)、又はチャネルと遺伝子座の両方(例えば、遺伝子座がチャネルに対応する三次元基質における)の直径は、約1-1000、1-500、1-200、1-100、5-100、又は10-100um、例えば、約90、80、70、60、50、40、30、20又は10umである。いくつかの例では、チャネル、遺伝子座、またはチャネルと遺伝子座の両方の直径は、約100、90、80、70、60、50、40、30、20または10μm未満である。いくつかの例では、2つの隣接したチャネル、遺伝子座、又はチャネルと遺伝子座の中心間の距離は、約1-500、1-200、1-100、5-200、5-100、5-50、又は5-30、例えば、約20umである。
【0104】
表面修飾
【0105】
表面上のポリヌクレオチド合成のための方法が本明細書で提供される、ここで、上記表面は様々な表面改質を含む。いくつかの例では、基質表面、又は基質表面の選択部位或いは領域の1つ以上の化学的及び/又は物理的な特性を変更するための加算或いは減算のプロセスによる、表面の化学的及び/又は物理的な変更のために、表面修飾が利用される。例えば、表面修飾は、限定されないが、(1)表面の湿潤性を変更すること、(2)表面を官能化すること、つまり、表面官能基を提供する、修飾する、または置換すること、(3)表面を脱官能基化すること、つまり、表面官能基を除去すること、(4)そうでなければ、例えばエッチングによって、表面の化学組成を変更すること、(5)表面粗さを増大または低減すること、(6)表面上にコーティング、例えば、表面の湿潤性とは異なる湿潤性を示すコーティングを提供すること、および/または(7)表面上に粒子を堆積させることを含む。
【0106】
いくつかの場合では、表面の上部の化学層(接着促進剤と呼ばれる)の添加は、基質の表面の遺伝子座の構造化したパターン化を促進する。接着促進に適用される典型的な表面は、限定されないが、ガラス、シリコン、二酸化ケイ素、および窒化ケイ素を含む。場合により、接着プロモータは、高い表面エネルギーを有する化学材料である。いくつかの例では、基質の表面上に第2の化学層が堆積される。場合により、第2の化学層は、低い表面エネルギーを有している。場合により、表面上にコーティングされた化学層の表面エネルギーは、表面上での液滴の局在化を支持する。選択されるパターン化の配置によって、遺伝子座の接近および/または遺伝子座での流体接触の領域は変更可能である。
【0107】
いくつかの例では、例えば、ポリヌクレオチド合成のために、核酸または他の部分が堆積する基質表面または分解された遺伝子座は、滑らかであるか、実質的に平面であり(例えば、二次元)、あるいは隆起したまたは陥没した特徴(例えば、三次元の特徴)などの不規則性を有している。いくつかの例では、基質表面は、化合物の1つ以上の異なる層で修飾される。対象のそのような修飾層は、限定されないが、金属、金属酸化物、ポリマー、小さな有機分子などの無機層および有機層を含む。
【0108】
いくつかの例では、基質の分解された遺伝子座は、表面エネルギーを増加および/または減少させる1つ以上の部分で官能化される。場合によっては、部分は化学的に不活性である。場合により、部分は、望ましい化学反応、例えば、ポリヌクレオチド酸合成反応における1つ以上のプロセスを支持するように構成されている。表面の表面エネルギー、すなわち、疎水性は、表面に結合するヌクレオチドの親和性を決定するための因子である。いくつかの例では、基質の官能化のための方法は、(a)二酸化ケイ素を含む表面を有する基質を提供する工程;および、(b)本明細書に記載されるか、さもなければ当該技術分野で知られている適切なシラン化剤、例えば、有機官能性アルコキシシラン分子を使用して、表面をシラン処理する工程を含む。方法および官能化剤は、米国特許第5,474,796号に記載され、参照によってその全体が本明細書に組み込まれる。
【0109】
いくつかの例では、基質表面は、典型的に基質表面上に存在する反応性の親水性部分を介して、基質表面にシランを連結させるのに有効な反応条件下で、シランの混合物を含有している誘導体化組成物との接触によって官能化される。シラン処理は、一般に、自己組織化を介して有機官能性アルコキシシラン分子で表面を覆う。当該技術分野において現在知られているように、例えば、表面エネルギーを減少または増加させるために、様々なシロキサンを官能化試薬も使用することができる。有機官能性アルコキシシランは、その有機官能基に応じて分類される。
【0110】
コンピュータシステム
【0111】
本明細書に記載されるシステムのいずれかがコンピュータに操作可能に接続され、局所的にまたは遠隔的にコンピュータを介して自動化されてもよい。いくつかの例では、本発明の方法及びシステムは、コンピュータシステム上のソフトウェアプログラム、及びその使用をさらに含み得る。従って、材料堆積装置の動作、分配行為、及び減圧の作動を編成及び同期するなど、機能の分配/減圧/再充填の同期のためのコンピュータ制御は、本発明の範囲内にある。コンピュータシステムは、ユーザーに指定された塩基配列と材料堆積装置の位置との間に干渉するようにプログラムされ、基質の指定された領域に正しい試薬を送達する。
【0112】
図8で例証されるコンピュータシステム(800)は、媒体(811)、および/または固定された媒体(812)を有するサーバー(809)に随意に接続可能なネットワークポート(805)からの命令を読み取ることができる論理的な装置として理解されてもよい。
図8に示されるようなシステムは、CPU(801)、ディスクドライブ(803)、キーボード(815)及び/またはマウス(816)などの随意の入力装置、並びに随意のモニター(807)を含み得る。データ通信は指示された通信媒体を介して局所位置または遠隔位置のサーバーまで達成され得る。通信媒体は、データを送信および/または受信する任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であってもよい。そのような接続は、ワールド・ワイド・ウェブ上での通信を提供することができる。本開示に関するデータは、
図8に例示されるように当事者(822)による受理及び/又は検討のためにそのようなネットワーク又は接続によって伝達され得る。
【0113】
図9は、本発明の例示的実施形態に関連して使用され得るコンピュータシステム(900)のアーキテクチャを例示するブロック図である。
図9に表されるように、コンピュータシステムの例は、命令を処理するためのプロセッサ(902)を含み得る。プロセッサの非限定的な例は、以下を含む:Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32-bit RISC ARM 1176JZ(F)-S v1.0(商標)プロセッサ、ARM Cortex-A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に同等なプロセッサ。実行の複数のスレッドが並列処理に使用可能である。いくつかの例では、複数のプロセッサ、または複数のコアを持つプロセッサも、単一のコンピュータシステム中であろうと、クラスタの中であろうと、または、複数のコンピュータ、携帯電話、および/または個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されていても、使用可能である。
【0114】
図9に示されるように、高速キャッシュ(904)は、プロセッサ(902)に接続するか、または組み込まれることで、プロセッサ(902)により近年使用されてきたまたは頻繁に使用されている命令またはデータのための高速メモリを提供することができる。プロセッサ(902)は、プロセッサバス(908)によりノースブリッジ(906)に接続される。ノースブリッジ(906)は、メモリバス(912)によりランダムアクセスメモリ(RAM)(910)に接続され、プロセッサ(902)によりRAM(910)へのアクセスを管理する。ノースブリッジ(906)は、チップセットバス(916)によりサウスブリッジ(914)にも接続される。サウスブリッジ(914)は次に、周辺バス(918)に接続される。周辺バスは、例えば、PCI、PCI-X、PCI Express、または他の周辺バスであってもよい。ノースブリッジおよびサウスブリッジはしばしば、プロセッサチップセットと称され、周辺バス(918)上でプロセッサと、RAMと、周辺コンポーネントとの間のデータ転送を管理する。いくつかの代替的なアーキテクチャでは、ノースブリッジの機能性は、別のノースブリッジチップを使用する代わりにプロセッサに組み込まれることができる。いくつかの例では、システム(900)は、周辺バス(918)に取り付けられたアクセラレータカード(922)を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ(FPGA)または特定の処理を促進するための他のハードウェアを含んでもよい。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用され得る。
【0115】
ソフトウェアとデータは、外部記憶装置(924)に記憶され、プロセッサにより使用されるRAM(910)および/またはキャッシュ(904)へとロードすることができる。システム(900)は、システムリソースの管理のためのオペレーティングシステムを含み;オペレーティングシステムの非限定的な例は、以下を含む:Linux(登録商標)、Windows(商標)、MACOS(商標)、BlackBerry OS(商標)、iOS(商標)、及び他の機能的に同等なOS、同様に、本発明の実施形態の例に従ってデータの記憶と最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェア。この例では、システム(900)はさらに、ネットワーク接続ストレージ(NAS)などの外部記憶装置、および分散並列処理に使用することができる他のコンピュータシステムにネットワークインターフェースを提供するために、周辺バスに接続されるネットワークインターフェースカード(NIC)(920)および(921)を含む。
【0116】
図10は、例示的な実施形態に従って共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステムのブロック図である。上記システムは、共有メモリサブシステム(1004)にアクセス可能な複数のプロセッサ(1002a-f)を含む。上記システムは、メモリサブシステム(1004)に複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ(MAP)(1006a-f)を組み込む。各MAP(1006a-f)は、メモリ(1008a-f)および1以上のフィールドプログラマブルゲートアレイ(FPGA)(1010a-f)を含んでもよい。MAPは設定可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの一部は、各プロセッサと密接に協働して処理を行うためにFPGA(1010a-f)に提供可能である。例えば、MAPは、データモデルに関する代数式を評価する及び例となる実施形態において適応データの再構成を実行するために使用され得る。この例では、各MAPは、このような目的のためにプロセッサすべてによって世界中からアクセス可能である。1つの構成において、各MAPは、関連するメモリ(1008a-f)にアクセスするためのダイレクトメモリアクセス(DMA)を使用することができ、それにより、各マイクロプロセッサ(1002a-f)とは別個に、且つこれらから非同期的にタスクを実行することが可能となる。この構成では、MAPは、アルゴリズムのパイプライン処理(pipelining)および並列実行のために別のMAPに直接結果を供給することができる。
【0117】
図11は、複数のコンピュータシステム(1102a)および(1102b)、複数の携帯電話および個人用携帯情報端末(1102c)、ならびにネットワーク接続ストレージ(NAS)(1104a)および(1104b)を備えたネットワークを示す略図である。例示的な実施形態では、システム(1102a)、(1102b)、および(1102c)は、データ記憶を管理し、ネットワーク接続ストレージ(NAS)(1104a)および(1104b)に記憶されたデータに対するデータアクセスを最適化することができる。数学モデルがこのデータに対して使用可能であり、コンピュータシステム(1102a)および(1102b)、ならびに携帯電話および個人用携帯情報端末システム(1102c)にわたって分散並列処理を使用して評価可能である。コンピュータシステム(1102a)および(1102b)、ならびに携帯電話および個人用携帯情報端末システム(1102c)は、ネットワーク接続ストレージ(NAS)(1104a)および(1104b)に記憶されたデータの適応データ再構築に対して並列処理を提供することもできる。
図11は一例のみを示しており、様々な他のコンピュータのアーキテクチャ及びシステムが、本発明の様々な実施形態と共に使用され得る。例えば、ブレードサーバーは並列処理を提供するために使用することができる。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続可能である。ストレージも、バックプレーンに接続することができるか、または別のネットワークインターフェースを介してネットワーク接続ストレージ(NAS)として接続可能である。いくつかの例において、プロセッサは、別個のメモリ空間を維持し、ネットワークインターフェース、バックプレーン、又は他のプロセッサによる並列処理のための他のコネクターを通じてデータを伝達することができる。いくつかの例において、プロセッサのいくつか又は全てが、共有仮想アドレスメモリ空間を使用することができる。
【0118】
本明細書に記載されるシステムのいずれかは、非一時的なコンピュータ可読記憶媒体上に記憶された配列情報を含むことができる。いくつかの例では、本明細書に記載されるシステムのいずれかは、コンピュータ入力ファイルを含む。いくつかの例では、コンピュータ入力ファイルは配列情報を含む。いくつかの例では、コンピュータ入力ファイルは、複数のポリヌクレオチド配列の合成のための命令を含む。いくつかの例では、上記命令はコンピュータによって受けられる。いくつかの例では、上記命令はコンピュータによって処理される。いくつかの例では、上記命令は材料堆積装置に伝達される。いくつかの例において、非一時的なコンピュータ読み取り可能な記憶媒体は、随意にネットワーク接続されたデジタル処理装置のオペレーティングシステムによって実行可能な命令を含むプログラムで符号化される。いくつかの例において、コンピュータ可読記憶媒体は、デジタル処理装置の具体的な構成要素である。いくつかの例において、コンピュータ可読記憶媒体は、デジタル処理装置から随意に除去可能である。いくつかの例おいて、コンピュータ可読記憶媒体は、限定されないが、CD-ROM、DVD、フラッシュメモリデバイス、固体記憶装置、磁気ディスクドライブ、磁気テープドライブ、光ディスク欲動、クラウドコンピューティングシステム及びサービスなどを含む。いくつかの例において、プログラム及び命令は、永続的に、ほぼ永続的に、半永続的に、又は非一時的に、媒体上で符号化される。
【実施例】
【0119】
以下の実施例は、本発明の様々な実施形態を例示する目的で与えられ、いかなる方法でも本発明を制限するようには意図されていない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態を代表するものであり、例示的なものであり、および、本発明の範囲を限定することを意図したものではない。請求の範囲によって定義される本発明の趣旨内に包含されるその変化形および他の使用は、当業者に想到される。
【0120】
実施例1:基質表面の官能化
【0121】
ポリヌクレオチドのライブラリの付着および合成を助けるために、基質を官能化した。基質表面をまず、20分間、90%のH2SO4および10%のH2O2を含むピラニア溶液を使用して湿式洗浄した。基質を、脱イオン水を含む幾つかのビーカーの中ですすぎ、5分間脱イオン水のグーズネック形状の蛇口の下で保持して、N2で乾燥させた。その後、基質を5分間、NH4OH(1:100;3mL:300mL)に浸し、ハンドガン(handgun)を使用してDI水ですすぎ、脱イオン水を含む3つの連続するビーカーの中で各々1分間浸し、その後、ハンドガンを使用して脱イオン水で再びすすいだ。その後、基質表面をO2にさらすことにより基質をプラズマ洗浄した。SAMCO PC-300機器を使用して、下流モードで1分間、250ワットでO2をプラズマエッチングした。
【0122】
以下のパラメータを有するYES-1224P気相蒸着オーブンシステムを使用して、清潔になった基質表面をN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含む溶液で能動的に官能化した:0.5から1トル、60分、70℃、135℃の気化器。Brewer Science 200Xスピンコータを使用して、基質表面をレジストコートした(resist coated)。SPR(商標)3612フォトレジストを、40秒間2500rpmで基質上でスピンコートした。基質を予め、Brewerホットプレート上で、90℃で30分間焼いた。Karl Suss MA6マスクアライナー機器を使用して、基質をフォトリソグラフィーに曝露した。基質を2.2秒間さらし、MSF 26Aの中で1分間、展開させた(developed)。残りの展開物(developer)をハンドガンですすぎ、基質を5分間水に浸した。基質をオーブンの中で、100℃で30分間焼き、その後、Nikon L200を使用してリソグラフィーの欠損に対する目視検査を行った。洗浄処理を使用し、SAMCO PC-300機器を用いて残りのレジストを取り除き、1分間250ワットでO2プラズマエッチングした。
【0123】
基質表面を、10μLの軽油と混合したペルフルオロオクチルトリクロロシランの100μL溶液で受動的に官能化した。基質をチャンバに入れ、10分間ポンプでくみ出し、その後、バルブを閉じてポンプを止め、10分間放置した。チャンバを通気した。最大パワー(Crestシステム上で9)での超音波処理による70℃で500mLのNMPの中で5分間の2回の浸漬を行なうことにより、基質をレジスト剥離した。その後、最大パワーでの超音波処理により室温で500mLのイソプロパノールの中で5分間、基質を浸した。基質を、300mLの200プルーフエタノール(200 proof ethanol)に漬けて、N2で送風乾燥した。官能化した表面は活性化され、ポリヌクレオチド合成のための支持体として役立った。
【0124】
実施例2:オリゴヌクレオチド合成装置上での50量体の配列の合成
【0125】
二次元オリゴヌクレオチド合成装置をフローセルに組み入れ、フローセル(Applied Biosystems(「ABI394 DNA Synthesizer」))に接続させた。N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド(Gelest)で二次元オリゴヌクレオチド合成装置を均一に官能化し、これを使用して、本明細書に記載されるポリヌクレオチド合成方法を用いて50bpの例示的なポリヌクレオチド(「50量体のポリヌクレオチド」)を合成した。
【0126】
50量体の配列は、配列番号:1.5’AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3’(配列番号:1)に記載される通りであり、ここで、#は、チミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244)を表し、これは、脱保護中に表面からのポリヌクレオチドの放出を可能にする切断可能なリンカーである。
【0127】
表3のプロトコルおよびABIシンセサイザーに従って標準的なDNA合成化学(結合、キャッピング、酸化、および非ブロック化)を使用して、合成を行った。
【0128】
【0129】
【0130】
【0131】
ホスホラミダイト/活性化因子の組み合わせを、フローセルを介するバルク試薬の送達と同様に送達した。環境が時間全体にわたって試薬により「湿った」ままであるため、いかなる乾燥工程も行わなかった。
【0132】
フローリストリクターをABI394DNA合成装置から取り除き、より速い流れを可能した。フローリストリクターなしで、アミダイト(ACN中で0.1M)、活性化因子(ACN中で0.25Mのベンゾイルチオテトラゾール(「BTT」;GlenResearchの30-3070-xx))、およびOx(20%のピリジン、10%の水、および70%のTHF中の0.02MのI2)の流量は、およそ~100uL/秒、アセトニトリル(「ACN」)およびキャッピング試薬(キャップAとキャップBの1:1の混合物、ここで、キャップAはTHF/ピリジン中の無水酢酸であり、キャップBはTHF中の16%の1-メチルイミダゾール(methylimidizole))についてはおよそ~200uL/秒、および、Deblock(トルエン中の3%のジクロロ酢酸)についてはおよそ~300uL/秒(フローリストリクターで全ての試薬に対し~50uL/秒と比較して)であった。酸化剤(Oxidizer)を完全に押し出す時間を観察し、化学フロー時間のタイミングを適宜調整し、余分なACN洗浄を異なる化学物質間に導入した。ポリヌクレオチド合成後、75psiで一晩、ガス状のアンモニア中でチップを脱保護した。表面に水を5滴加えて、ポリヌクレオチドを再生させた。その後、再生させたポリヌクレオチドを、BioAnalyzerの小さなRNAチップ上で分析した(データは示されていない)。
【0133】
実施例3:オリゴヌクレオチド合成装置上での100量体の配列の合成
【0134】
50量体の配列の合成について実施例2に記載されるのと同じプロセスを、100量体のポリヌクレオチド(「100量体のポリヌクレオチド」;5’CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3’、ここで、#はチミジン-スクシニルヘキサミドCEDホスホラミダイト(ChemGenesのCLP-2244);配列番号:2を表す)の、2つの異なるシリコンチップ上での合成に使用し、第1のシリコンチップはN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドで均一に官能化され、第2のシリコンチップは11-アセトキシウンデシルトリエトキシシランとn-デシルトリエトキシシランの5/95の混合物で官能化され、表面から抽出されたポリヌクレオチドを、BioAnalyzer機器で分析した(データは示されていない)。
【0135】
以下の熱サイクルプログラムを使用して、50uLのPCR混合物(25uLのNEB Q5 マスターミックス、2.5uLの10uMフォワードプライマー、2.5uLの10uMリバースプライマー、表面から抽出した1uLのポリヌクレオチド、および最大50uLの水)中で、フォワードプライマー(5’ATGCGGGGTTCTCATCATC3’;配列番号:3)およびリバースプライマー(5’CGGGATCCTTATCGTCATCG3’;配列番号:4)を使用して、2つのチップからの10の試料すべてをさらに増幅した:
98℃、30秒
98℃、10秒;63℃、10秒;72℃、10秒;12サイクルを繰り返す
72℃、2分
【0136】
PCR産物をBioAnalyzer上でも実行して(データは示されていない)、100量体の位置での急なピークを実証した。次に、PCR増幅サンプルをクローン化し、サンガー配列決定を行った。表4は、チップ1からのスポット1-5から得たサンプル、およびチップ2からのスポット6-10から得たサンプルに対するサンガー配列決定からの結果を要約する。
【0137】
【0138】
ゆえに、高品質および高均一性の合成ポリヌクレオチドを、異なる界面化学的性質を持つ2つのチップ上で繰り返した。配列決定された100量体の262のうち233に対応している全体の89%が、エラーのない完全な配列であった。表5は、スポット1-10からのポリヌクレオチドサンプルから得た配列に対するエラー特徴を要約している。
【0139】
【0140】
実施例4.酵素学に基づくアセンブリのための例示的な製剤
【0141】
様々な反応条件が、表6-表14に確認される。試薬を、様々な順序で添加する。あるいは、試薬を段階的に添加し、例えば、試薬を表14にリストされる順序で添加する。
【0142】
【0143】
【0144】
【0145】
【0146】
【0147】
【0148】
【0149】
【0150】
【0151】
【0152】
【0153】
実施例5.酵素学的媒介核酸アセンブリ
【0154】
実施例4に記載される通りの反応条件を使用して、酵素学的媒介核酸(ガイドされたアセンブリ)を行った(「条件A」)。酵素学的媒介核酸アセンブリは、結果として、隣接する相同性配列および二次構造の直列反復の存在下でさえ、高いコロニー形成単位(CFU)をもたらした(
図12A)。さらに、酵素学的媒介核酸アセンブリからのCFUは、密に分布して、ロバストな反応条件を実証した。A/Tに富むオーバーラップ相同性配列は、
図12Bに確認できる通りの、10%未満のGCを含有していた。コンパレータ1およびコンパレータ2アセンブリ(代替のエキソヌクレアーゼ/リガーゼベースのアセンブリ方法)と比較して、酵素媒介核酸アセンブリは、72.5%GCを超える相同領域で有意に効率的であった。精度を、NGS配列決定8-12クローンによっても測定した。極端なGC%、ヘアピン、または直列反復を伴うような、酵素媒介核酸アセンブリの精度に対する大きな影響は無かった。ユニバーサルアダプタ配列の有無に関係なく、酵素媒介核酸アセンブリの平均的な合格率は56%~88%の範囲であった。コンパレータ1およびコンパレータ2アセンブリのパフォーマンスは、より低かった。コンパレータ2アセンブリの反応は41%~56%の範囲の合格率を有し、そして、コンパレータ1は53%~75%の範囲の合格率を有していた(
図12C)。
【0155】
アセンブリ特異度および配列バイアスを、多重遺伝子アセンブリ通じて評価した(
図12D)。3つの異なる遺伝子(遺伝子A、遺伝子B、遺伝子C)のアセンブリは、ユニバーサルアダプタを伴う9つのdsDNA入力断片からなり、単一の反応でアセンブルされた。相同性配列の類似性は、28-60%の範囲であった。平行独立反応(N=4)で、9つの入力断片を酵素学的媒介核酸アセンブリにかけて、3つの遺伝子を形成した。構築物はすべて5’および3’のプライマー部位を共有して、PCR増幅させて完全長の遺伝子について濃縮し、酵素媒介核酸アセンブリを使用してプラスミドにクローン化し、そして大腸菌に形質転換させた。各反応プールからの96のコロニーを、サンガー配列用に単離し、そして最終構築物を配列決定した。配列決定の読み取りはすべて、所望の遺伝子に対して完全長の構築物を示し、ユニバーサルアダプタ配列、キメラ遺伝子配列、またはミスアセンブリ(misassemblies)のエビデンスを示すことはなかった。
図12Dで確認される通り、各遺伝子配列は、33%の予想平均の周りで密に分布していることが観察され、このこともまた、配列バイアスのない酵素媒介核酸アセンブリの正確性および特異性を実証している。より大きな断片も、成功裡にアセンブルされた。酵素学的アセンブリ方法を使用し、6つのDNA断片を、酵素反応を使用して一度にアセンブルし、多数のコロニー形成単位を得た(
図12E)。条件Aは、結果として、
図12Fに示される通りのコンパレータ1またはコンパレータ2の条件と比較して、より大きな断片(最大10)のアセンブリのためにより多数のCFUをもたらす。断片間の最適な相同性長さなどの追加の設計要素をテストした(
図12G)。
【0156】
実施例6.400の塩基対の多重遺伝子アセンブリ
【0157】
60の遺伝子/クラスタの多重アセンブリを、Uni9ユニバーサルプライマーを含む270量体の核酸を使用して行った。23,000の遺伝子のアセンブリからのデータを、
図13A-
図13Gに示す。
図13Aは、ユニバーサルプライマーを使用するPCR後のDNAの相対濃度を示す。
図13Bは、BioAnalyzer読み取り値からのプロットを示す。
図13C-
図13Eは、次世代シーケンシング(NGS)の結果、特に、140x適用範囲を使用する密度プロット(
図13C)と、挿入/欠失がない遺伝子のパーセントの分布(
図13D-
図13E)とを示す。
図13Fは、完全なドロップアウト、ドロップアウト、およびランナウェイ(runaway)のパーセントを示す。
図13Gは、ソフトクリッピング/キメラの読み取りのグラフを示す。約1%の核酸の集団は、キメラ遺伝子断片を含む。結果は、以下の表15-表16にも確認される。
【0158】
【0159】
【0160】
実施例7.変異体のコンビナトリアルアセンブリ
【0161】
変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。4つの入力集団をアセンブルした。アセンブリは、結果として、約150,000の変異体と、クローン化前後の完全長配列の均一性(
図14A)、ならびに均一な変異体の頻度(
図14B)をもたらした。アセンブル後、産物をPCR増幅させて完全長の遺伝子について濃縮を行い、その後、プラスミドへのクローン化を行い、そして大腸菌に形質転換させた。各反応プールからの96のコロニーを、サンガー配列用に単離した。配列決定読み取りはすべて、所望の遺伝子について完全長の構築物を示した。内部のユニバーサルアダプタ配列、キメラ遺伝子配列、またはミスアセンブリ(misassemblies)は観察されなかった。
【0162】
実施例8.酵素学的媒介核酸アセンブリを使用する、スケーラブルなアセンブリ
【0163】
酵素学的媒介核酸アセンブリを、Labcyte Echo(登録商標)525 Liquid Handlerを使用して実施して、アクショナブルな(actionable)DNA構築物を大規模に生成した。単一ポットの反応では、小型化された酵素媒介核酸アセンブリ反応を使用して、2つの線形dsDNA断片をベクターにアセンブルし、野生型および変異体のp70プロモーター下での蛍光タンパク質発現を可能にした。p70プロモーター調整は、野生型(WT)プロモーター下で蛍光タンパク質mCherryの発現を駆動し、同じ構築物中でGFP発現を異なって駆動する合成p70変異体をテストすることで、評価した。GFPをmCherryシグナルに正規化することによって、さまざまな変異p70プロモーターの強度を概算した。多重化DNAアセンブリとmyTXTL(登録商標)タンパク質合成の結果として、最適なタンパク質生成条件を、小型化された反応内で確認した。
【0164】
実施例9.免疫グロブリン配列アセンブリ
【0165】
この例は、免疫グロブリン配列アセンブリのためのデノボ合成方法を示す。
【0166】
第1のリーダー配列、第1の可変領域、および第1のCDRセグメントを合成し、その後、ポリメラーゼ鎖アセンブリ(PCA)にさらして、第1の複数の遺伝子断片を生成した。第2のリーダー配列、第2の可変領域、および第2のCDRセグメントを合成し、その後、アセンブリPCRまたはPCAにさらして、第2の複数の遺伝子断片を生成した。第2の定常領域とそれに続く自己切断型ペプチドとを含む第3の複数の遺伝子断片、および可変定常セグメントを含む第4の複数の遺伝子断片を、合成する。第3の複数の遺伝子断片と第4の複数の遺伝子断片とは、第1の複数の遺伝子断片と第2の複数の遺伝子断片とに添加され、その後にPCRが続く。エラー修正反応を、随意に行ってもよい。結果として生じる構築物をプールし、クローン化し、そして次世代シーケンシングにかける。
【0167】
実施例10.多重免疫グロブリン配列アセンブリ
【0168】
この実施例は、多重免疫グロブリン配列アセンブリのためのデノボ合成方法を示す。
【0169】
第1の可変領域の変異体を含む遺伝子断片を合成し、そして、第1の可変領域に相補的な40の塩基対(bp)領域と第1のCDRおよびJセグメントとを含む遺伝子断片で増幅して、第1の複数の遺伝子断片を生成する。第2の可変領域の変異体を含む遺伝子断片を合成し、そして、第2のCDRおよびJセグメントを含む遺伝子断片で増幅して、第2の複数の遺伝子断片を生成する。定常領域、自己切断型ペプチド配列、第1のリーダー配列、ならびに第2の可変領域と第2のCDRおよびJセグメントとに相補的な40の塩基対(bp)領域を含む、第3の複数の遺伝子断片を合成する。自己切断型ペプチド配列はP2Aである。
【0170】
第1の複数の遺伝子断片、第2の複数の遺伝子断片、および第3の複数の遺伝子断片を、酵素ベースのアセンブリ方法を使用してアセンブルし、PCR精製し、そしてプールする。アセンブルされていない断片をすべて精製して取り除く。その後、最終構築物をベクターにクローン化する。
【0171】
実施例11.IIS型曝露バーコードを使用する、ペア化された変異体アセンブリ
【0172】
この実施例は、IIS型曝露バーコードを使用する、ペア化された変異体アセンブリ方法を示す。
【0173】
バーコード、それに続く第1の制限エンドヌクレアーゼ部位、第2の制限エンドヌクレアーゼ部位、ならびに第1の相補性決定領域(CDR)セグメントおよびJセグメントを含む、第1の複数の遺伝子断片を合成する。CDRセグメントおよびJセグメントは、約100の塩基対である。第一の制限エンドヌクレアーゼ部位または第2の制限エンドヌクレアーゼ部位は、IIS型制限エンドヌクレアーゼ(TIIS-RE)部位である。第1の定常領域、それに続く自己切断型ペプチド配列、第1のリーダー配列、および第1の可変領域を含む、第2の複数の遺伝子断片を合成する。自己切断型ペプチド配列はP2Aである。合成された第1の可変領域の数は、約100である。
【0174】
第1の複数の遺伝子断片と第2の複数の遺伝子断片とを組み合わせ、そして、PCR増幅して、第3の複数の遺伝子断片を生成する。第3の複数の遺伝子断片は、バーコード、それに続く第1の制限エンドヌクレアーゼ部位、第1の定常領域、切断ペプチド配列、第1のリーダー配列、第1の可変領域、ならびに第1のCDRおよびJセグメントを含む。第3の複数の遺伝子断片を、ベクター配列、それに続く第2のリーダー配列、第2の可変領域、第2のCDRセグメントおよびJセグメント、第1のTIIS-RE部位、およびバーコードを含む、第4の複数の遺伝子断片と組み合わせて、第5の複数の遺伝子断片を生成する。合成された第2の可変領域の数は、約130である。
【0175】
第5の複数の遺伝子断片は、ベクター配列、それに続く第2のリーダー配列、第2の可変領域、第2のCDRおよびJセグメント、第1のTIIS-RE部位、バーコード、第1のTIIS-RE部位、第1の定常領域、切断型ペプチド配列、第1のリーダー配列、第1の可変領域、および第1のCDRセグメントを含む。50の複数の遺伝子断片をPCR増幅してクローン化し、その後に、TIIS制限エンドヌクレアーゼで処理してTIIS-RE部位をカットし、バーコードを除去して、ベクター配列、それに続く第2のリーダー配列、第2の可変領域、第2のCDRセグメント、第1の定常領域、切断型ペプチド配列、第1のリーダー配列、第1の可変領域、ならびに第1のCDRおよびJセグメントを含む、第6の複数の遺伝子断片を生成した。その後、第6の複数の遺伝子断片をベクターにクローン化して、第2のリーダー配列、第2の可変領域、第2のCDRセグメント、第1の定常領域、切断型ペプチド配列、第1のリーダー配列、第1の可変領域、第1のCDRおよびJセグメント、ならびに可変定常領域を含む、最終構築物を生成する。合成された遺伝子断片の数は、約1000である。
【0176】
実施例12.ペア化された相同性を使用する、変異体アセンブリ
【0177】
この実施例は、ペア化された相同性を含む、ペア化された変異体のアセンブリを示す。
【0178】
第1の可変領域を含む103の変異体遺伝子断片を合成する。103の変異体遺伝子断片を、第1のCDR3およびJセグメントで増幅して、第1の複数の遺伝子断片を生成する。第2の可変領域を含む131の変異体遺伝子断片の異なるセットを合成する。131の変異体遺伝子断片を、第2のCDR3およびJセグメントで増幅して、第2の複数の遺伝子断片を生成する。第1のCDR3およびJセグメントに相同的な配列、それに続く定常領域、自己切断型ペプチド配列、第1のリーダー配列、および第2の可変領域に相補的な40の塩基対(bp)領域を含む、第3の複数の130の変異体遺伝子断片を合成する。
【0179】
第1の複数の遺伝子断片、第2の複数の遺伝子断片、および第3の複数の遺伝子断片をアセンブルし、そして目的ベクターにクローン化する。最終構築物は、第2のリーダー配列、それに続く第2の可変領域、第2のCDRおよびJセグメント、第2の定常領域、自己切断型ペプチド配列、第1のリーダー配列、第1の可変領域、第1のCDRおよびJセグメント、ならびに可変定常領域を含む。
【0180】
実施例13.IIS型部位を使用する、ペア化された変異体アセンブリ
【0181】
この実施例は、IIS型部位を含む遺伝子断片の、ペア化された変異体アセンブリ方法を示す。
【0182】
第1のリーダー配列と第1の可変領域とを含む第1の複数の遺伝子断片を合成する。第2の可変領域を含む第2の複数の遺伝子断片を合成する。第1のIIS型部位と、それに続く、第2の可変領域に相補的な40の塩基対(bp)領域とを含む、第3の複数の遺伝子断片を合成する。第2の可変領域に相補的な40の塩基対(bp)領域、それに続く第2のCDR3およびJセグメント、ならびに可変定常セグメントを含む、第4の複数の遺伝子断片を合成する。第1の可変領域に相同的なセグメント、それに続く第1のCDR3およびJセグメント、ならびにTIIS部位を含む、第5の複数の遺伝子断片を合成する。
【0183】
第1の複数の遺伝子断片、第2の複数の遺伝子断片、第3の複数の遺伝子断片、第4の複数の遺伝子断片、および第5の複数の遺伝子断片をプールし、そして、第1のCDR3およびJセグメントと第2のCDR3およびJセグメントとを添加するために、PCR増幅する。結果として生じる遺伝子断片は、第2の可変領域、それに続く第2のCDR3およびJセグメント、TIIS部位、第1の可変領域、ならびに第1のCDR3およびJセグメントを含む。結果として生じる遺伝子断片に対して、フラップエンドヌクレアーゼ媒介核酸アセンブリと、目的ベクターへの挿入が行われる。目的ベクターは、第2のリーダー配列と可変定常領域とを含む。目的ベクターへの挿入後、遺伝子断片は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、第1の制限エンドヌクレアーゼ部位、第1の可変領域、第1のCDR3およびJセグメント、ならびに可変定常領域を含む。その後、遺伝子断片をゴールデンゲートアセンブリ(Golden Gate Assembly)にかけ、第2の定常領域を挿入して、最終構築物を生成する。最終構築物は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、第2の定常領域、自己切断型ペプチド配列、第1のリーダー配列、第1の可変領域、第1のCDR3およびJセグメント、および可変定常領域を含む。生成された最終構築物の数は約10000である。
【0184】
実施例14.各変異体に特異的なポリヌクレオチド集団
【0185】
この実施例は、各可変領域に特異的なポリヌクレオチド集団の使用を示す。自己切断型ペプチド配列、第1のリーダー配列、および第1の可変領域を含む、第1の複数の遺伝子断片を合成する。第2の可変領域に相同的なセグメント、それに続く第2のCDR3およびJセグメント、IIS型部位、第1のCDR3およびJセグメント、ならびにユニバーサルプライマーを含む、遺伝子断片を合成する。当該遺伝子断片を、リーダー配列とそれに続く第2の可変領域とを含む遺伝子断片の集団と組み合わせ、そしてPCR増幅させて、第2の複数の遺伝子断片を生成し、当該第2の複数の遺伝子断片は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、IIS型部位、第1のCDR3およびJセグメント、ならびにユニバーサルプライマーを含む。その後、第2の複数の遺伝子断片を、第2のリーダー配列と可変定常領域とを含む目的ベクターにアセンブルして、第3の複数の遺伝子断片を生成する。第3の複数の遺伝子断片は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、IIS型部位、第1のCDR3およびJセグメント、および可変定常領域を含む。
【0186】
第1の複数の遺伝子断片と第3の複数の遺伝子断片とをアセンブルし、第2の定常領域を挿入して、最終構築物を生成する。最終構築物は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、第2の定常領域、自己切断型ペプチド配列、第1のリーダー配列、第1の可変領域、第1のCDR3およびJセグメント、ならびに可変定常領域を含む。生成された最終構築物の数は約10000である。
【0187】
実施例15.ダイヤルアウトPCR(dial-out PCR)を使用する、ペア化されたバーコード
【0188】
この実施例は、核酸アセンブリのための、ペア化されたバーコードとダイヤルアウトPCRとの使用を示す。第1の可変領域を含む第1の複数の遺伝子断片を合成する。第1の超可変領域、それに続く、第1の可変領域に補足的な40の塩基対(bp)領域、第1のCDR3およびJセグメント、ならびにバーコードを含む、第2の複数の遺伝子断片を合成する。第2のリーダー配列と第2の可変領域とを含む第3の複数の遺伝子断片を合成する。第2のCDR3およびJセグメントを含む第4の複数の遺伝子断片を合成する。第1の複数の遺伝子断片と第2の複数の遺伝子断片とを組み合わせて、PCRを使用して、第1のコンビナトリアルライブラリを作り出す。第3の複数の遺伝子断片と第4の複数の遺伝子断片とを組み合わせて、PCRを使用して、第2のコンビナトリアルライブラリを作り出す。
【0189】
第1のコンビナトリアルライブラリと第2のコンビナトリアルライブラリとを、フラップエンドヌクレアーゼ媒介核酸アセンブリを使用してアセンブルし、第5の複数の遺伝子断片を生成し、当該第5の複数の遺伝子断片は、第2のリーダー配列、それに続く第2の可変領域、第2のCDR3およびJセグメント、第2の定常領域、自己切断型ペプチド配列、第1のリーダー配列、第1の可変領域、第1のCDR3およびJセグメント、第1の可変領域に相補的な40の塩基対(bp)領域、およびバーコードを含む。第5の複数の遺伝子断片を、環状化し、そしてプライマーで配列決定して、第6の複数の遺伝子断片を生成する。サンプルをバーコードによって同定する。その後、第6の複数の遺伝子断片を、ダイヤルアウトPCRと目的ベクターへのフラップエンドヌクレアーゼ媒介核酸アセンブリとにかけて、最終構築物を生成する。
【0190】
実施例16.変異体のコンビナトリアルアセンブリ
【0191】
変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。長さが1.2-2.2kbの範囲の15-20の変異体を伴う4つの入力集団(またはドメイン)を、各々アセンブルした(変異体の数はカッコ内):
5’ベクター-ドメイン1(15)-ドメイン2(20)-ドメイン3(20)-ドメイン4(20)-3’ベクター
【0192】
アセンブリは、結果として、約120,000の変異体と、細菌発現ベクタークローン化前後の完全長配列の均一性(
図15A、表17)、ならびに均一な変異体の頻度(
図15B)をもたらした。
【0193】
【0194】
NGSの結果は、変異体のあらゆる組み合わせの均一な分布が得られたことを示した。このことは、プールが、互いに5X以内の可能な変異体の組み合わせの95%で、偏っていないことを示した。89の個々のクローンを配列決定して、存在する異なる組み合わせを確認した。変異体はすべて選択されたコロニー中で表わされ、そして追加的に、89の経路はすべて、変異体の特有の組み合わせを有していた(
図15B)。
【0195】
実施例17.変異体のコンビナトリアルアセンブリ
【0196】
変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。長さがおよそ1.5kbで最大100の変異体を伴う2つの入力集団(またはドメイン)を、各々アセンブルした(変異体Xの数):
5’ベクター-ドメイン1(X)-定常ドメイン-ドメイン3(X)-3’ベクター
【0197】
複雑さが増加する4つのプール(4、10、50、100の変異体)を最大100,000の組み合わせと共に生成した。プールは、均一のアセンブリを示した(
図15C、
図15D、および表18)。
【0198】
【0199】
実施例18.250,000の配列の多様な遺伝子プールをアセンブルすること
【0200】
実施例7の一般的な方法に従って、ウイルスタンパク質をコードする250Kの配列を、11のサブ遺伝子プールを通して作り出した。配列は、最初に第1のアダプターに隣接され、その後に遠位端で第2のアダプターに隣接される、ウイルスタンパク質DNAを含んでいた。450bpの遺伝子は、配列多様性によってプール間で分配され、1つのプールあたり平均23kの遺伝子となった(
図16Aおよび
図16B)。プールをアセンブルし、そしてPCR増幅して、デジタルDNA電気泳動で視覚化した(
図16C)。遺伝子プールの質を、標準化された50x遺伝子適用範囲で評価した(
図16Dおよび
図16E)。90番目のパーセンタイル/10番目のパーセンタイルの比は、平均で、集団の80%が平均の10.8x以内にあることを示す。プールをさらに、ドロップアウト(プールから喪失)、過小表示(平均の<10x)、およびランナウェイ(平均の>10x)によって特徴付けた(
図16F)。平均で、遺伝子の>98%で、50xNGS適用範囲で完全配列を検出した(
図16F)。
【0201】
本発明の好ましい実施形態が本明細書中で示され、そして説明されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。
【配列表】
【国際調査報告】