特表2022-550497 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ツイストバイオサイエンスコーポレーションの特許一覧

特表2022-550497バーコードに基づいた核酸配列アセンブリ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3
4
5A
5B
6
7
8
9
10
11
12A
12B
12C
12D
12E
12F
12G
13A
13B
13C
13D
13E
13F
13G
14A
14B
15A
15B
15C
15D
16A
16B
16C
16D
16E
16F

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-12-02

(54)【発明の名称】バーコードに基づいた核酸配列アセンブリ

(51)【国際特許分類】

C12N 15/10 20060101AFI20221125BHJP

【ＦＩ】

C12N15/10 Z ZNA

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021576310

(86)(22)【出願日】2020-06-19

(85)【翻訳文提出日】2022-02-21

(86)【国際出願番号】 US2020038679

(87)【国際公開番号】W WO2020257612

(87)【国際公開日】2020-12-24

(31)【優先権主張番号】62/865,094

(32)【優先日】2019-06-21

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】521556635

【氏名又は名称】ツイストバイオサイエンスコーポレーション

(74)【代理人】

【識別番号】100082072

【弁理士】

【氏名又は名称】清原義博

(72)【発明者】

【氏名】ニュージェント，レベッカ

(72)【発明者】

【氏名】チェン，スユエン

(72)【発明者】

【氏名】ケトルバラ，ロス

(72)【発明者】

【氏名】リー，エリアン

(72)【発明者】

【氏名】レイナード，ネイサン

(57)【要約】

【解決手段】本明細書に提供されるのは、有効な核酸アセンブリのための方法、システムおよび組成物である。核酸アセンブリは、一対になった相同性を含む変異体のアセンブリを含むことができる。
【選択図】図１Ａ

【特許請求の範囲】

【請求項1】

核酸アセンブリのための方法であって、該方法は、
（ａ）第１の複数のポリヌクレオチドを提供する工程であって、ここで、前記第１の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の第１の末端領域を含む、工程と、
（ｂ）第２の複数のポリヌクレオチドを提供する工程であって、ここで、前記第２の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の前記第１の末端領域に対する配列相同性の第２の末端領域を含む、工程と、
（ｃ）核酸のライブラリーをアセンブルするために、前記第１の複数のポリヌクレオチドおよび前記第２の複数のポリヌクレオチドを、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程であって、ここで、核酸の少なくとも８０％は、各々が、ライブラリーの核酸の各々の平均頻度の２倍（２ｘ）以内の量でライブラリーにおいて存在する、工程と、を含む、方法。

【請求項2】

前記第１の複数のポリヌクレオチドは、最大で１００の異なる配列を含む、請求項１に記載の方法。

【請求項3】

前記第２の複数のポリヌクレオチドは、最大で１００の異なる配列を含む、請求項１に記載の方法。

【請求項4】

少なくとも１０，０００の核酸がアセンブルされる、請求項１に記載の方法。

【請求項5】

少なくとも１００，０００の核酸がアセンブリされる、請求項１に記載の方法。

【請求項6】

前記第１の複数のポリヌクレオチドの各々のポリヌクレオチドは、最大で２５００塩基長を含む、請求項１に記載の方法。

【請求項7】

前記第２の複数のポリヌクレオチドの各ポリヌクレオチドは、最大で２５００の塩基長を含む、請求項１に記載の方法。

【請求項8】

前記エキソヌクレアーゼは、エキソヌクレアーゼＩＩＩである、請求項１に記載の方法。

【請求項9】

前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項１に記載の方法。

【請求項10】

前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である、請求項９に記載の方法。

【請求項11】

前記ポリメラーゼは、５’～３’のポリメラーゼ活性を含む、請求項１に記載の方法。

【請求項12】

前記ポリメラーゼはＤＮＡポリメラーゼである、請求項１に記載の方法。

【請求項13】

前記リガーゼは、少なくとも２つの核酸の結合を触媒する、請求項１に記載の方法。

【請求項14】

核酸アセンブリのための方法であって、該方法は、
（ａ）５’～３’の順番でバーコード配列、第１の制限エンドヌクレアーゼ部位、第２の制限エンドヌクレアーゼ部位、および第１の超可変領域配列を含む第１の核酸をデノボ合成する工程と、
（ｂ）５’～３’の順番で任意の定義された配列長さの第１の領域、自己切断型ペプチド配列、第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第２の核酸をデノボ合成する工程と、
（ｃ）第３の核酸を生成するために、前記第１の核酸と前記第２の核酸を接触させる工程と、
（ｄ）５’～３’の順番でベクター配列、第２の可変領域配列に隣接する第２の相補的領域、第２の可変領域配列、第２の超可変領域配列、第１の制限エンドヌクレアーゼ部位、およびバーコード配列を含む第４の核酸を提供する工程と、
（ｅ）前記第３の核酸および前記第４の核酸を制限エンドヌクレアーゼと接触させる工程と、
（ｆ）１つ以上の酵素を含む反応混合物を使用して前記第３の核酸および前記第４の核酸をアセンブルする工程と、を含む、方法。

【請求項15】

前記第１の制限エンドヌクレアーゼ部位、または前記第２の制限エンドヌクレアーゼ部位は、ＩＩＳ型制限エンドヌクレアーゼ（ＴＩＩＳ－ＲＥ）部位である、請求項１４に記載の方法。

【請求項16】

前記制限エンドヌクレアーゼは、ＩＩＳ型制限エンドヌクレアーゼである、請求項１４に記載の方法。

【請求項17】

反応混合物はリガーゼを含む、請求項１４に記載の方法。

【請求項18】

前記第１の超可変領域配列および前記第２の超可変領域配列は、各々が相補性決定領域（ＣＤＲ）を含む、請求項１４に記載の方法。

【請求項19】

前記ＣＤＲはＣＤＲ３である、請求項１８に記載の方法。

【請求項20】

前記自己切断型ペプチドはＰ２Ａである、請求項１４に記載の方法。

【請求項21】

前記第１の可変領域配列の約１００の変異体が合成される、請求項１４に記載の方法。

【請求項22】

前記第２の可変領域配列の約１３０の変異体が合成される、請求項１４に記載の方法。

【請求項23】

第１のバーコード配列に相補的な第１のプライマー、およびアンプリコンの少なくとも９９％が欠失がない第２のプライマーを用いて、核酸を増幅する工程と、をさらに含む、請求項１４に記載の方法。

【請求項24】

核酸アセンブリのための方法であって、該方法は、
（ａ）第１の可変領域配列を含む第１の核酸をデノボ合成する工程と、
（ｂ）第２の可変領域配列を含む第２の核酸をデノボ合成する工程と、
（ｃ）５’～３’の順番で固定された可変性配列の第１の領域、任意の定義された配列長さの第１の領域、自己切断型ペプチド配列、第１の可変領域配列に隣接する第１の相補的領域、および固定された可変性配列の第２の領域を含む第３の核酸をデノボ合成する工程と、
（ｄ）前記第１の核酸、前記第２の核酸、前記第３の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、を含む、方法。

【請求項25】

前記第１の可変領域配列、または前記第２の可変領域配列は、超可変領域配列を用いて増幅される、請求項２４に記載の方法。

【請求項26】

前記超可変領域配列は、ＣＤＲを含む、請求項２５に記載の方法。

【請求項27】

前記ＣＤＲはＣＤＲ３である、請求項２６に記載の方法。

【請求項28】

任意の定義された長さの１つ以上の領域を含む配列と接触させる工程をさらに含む、請求項２４に記載の方法。

【請求項29】

前記第１の可変領域配列の約１００の変異体が合成される、請求項２４に記載の方法。

【請求項30】

前記第２の可変領域配列の約１３０の変異体が合成される、請求項２４に記載の方法。

【請求項31】

前記自己切断型ペプチドはＰ２Ａである、請求項２４に記載の方法。

【請求項32】

前記エキソヌクレアーゼは、エキソヌクレアーゼＩＩＩである、請求項２４に記載の方法。

【請求項33】

前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項２４に記載の方法。

【請求項34】

前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である、請求項３３に記載の方法。

【請求項35】

前記ポリメラーゼは、５’～３’のポリメラーゼ活性を含む、請求項２４に記載の方法。

【請求項36】

前記ポリメラーゼはＤＮＡポリメラーゼである、請求項２４に記載の方法。

【請求項37】

前記リガーゼは、少なくとも２つの核酸の結合を触媒する、請求項２４に記載の方法。

【請求項38】

前記固定された可変性配列の第１の領域、および前記固定された可変性配列の第２の領域は、各々が約１０～約１００の塩基対である、請求項２４に記載の方法。

【請求項39】

前記固定された可変性配列の第１の領域、および前記固定された可変性配列の第２の領域は、各々が約４０の塩基対である、請求項２４に記載の方法。

【請求項40】

核酸アセンブリのための方法であって、該方法は、
（ａ）任意の定義された長さの配列の第１の領域を含む第１の核酸を提供する工程と、
（ｂ）任意の定義された長さの配列の第２の領域を含む第２の核酸を提供する工程と、
（ｃ）５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、第１の可変領域配列、および第１の超可変領域配列を含む第３の核酸をアセンブルする工程と、
（ｄ）５’～３’の順番で第２の可変領域配列に隣接する第２の相補的領域、第２の可変領域配列、および第２の超可変領域配列を含む第４の核酸をアセンブルする工程と、
（ｅ）前記第１の核酸と、前記第２の核酸と、前記第３の核酸と第４の核酸とを接触させる工程と、
（ｆ）工程（ｅ）から産物を増幅する工程と、を含む、方法。

【請求項41】

エラー修正工程をさらに含む、請求項４０に記載の方法。

【請求項42】

工程（ｅ）の間に、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物を接触させる工程をさらに含む、請求項４０に記載の方法。

【請求項43】

前記第１の超可変領域配列および前記第２の超可変領域配列は、各々が相補性決定領域（ＣＤＲ）を含む、請求項４０に記載の方法。

【請求項44】

前記ＣＤＲはＣＤＲ３である、請求項４３に記載の方法。

【請求項45】

前記第１の核酸は、約３００～約７００の塩基対を含む、請求項４０に記載の方法。

【請求項46】

前記第２の核酸は、約２００～約６００の塩基対を含む、請求項４０に記載の方法。

【請求項47】

前記第３の核酸は、約２００～約６００の塩基対を含む、請求項４０に記載の方法。

【請求項48】

前記第４の核酸は、約２００～約６００の塩基対を含む、請求項４０に記載の方法。

【請求項49】

核酸アセンブリのための方法であって、該方法は、
（ａ）
ｉ．５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸と、
ｉｉ．５’～３’の順番で固定された可変性配列の第１の領域、および第１の超可変領域配列を含む第２の核酸と、
ｉｉｉ．第２の可変領域配列を含む第３の核酸と、
ｉｖ．５’～３’の順番で制限エンドヌクレアーゼ部位、および固定された可変性配列の第２の領域を含む第４の核酸と、
ｖ．５’～３’の順番で固定された可変性配列の第２の領域、第２の超可変領域配列、および可変定常領域配列を含む第５の核酸と、をデノボ合成する工程と、
（ｂ）前記第１の核酸、前記第２の核酸、前記第３の核酸、前記第４の核酸、および前記第５の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、
（ｃ）工程（ｂ）の構築物を、ベクター配列へとクローン化する工程と、を含む、方法。

【請求項50】

前記第１の超可変領域配列および前記第２の超可変領域配列は、各々が相補性決定領域（ＣＤＲ）を含む、請求項４９に記載の方法。

【請求項51】

前記ＣＤＲはＣＤＲ３である、請求項４９に記載の方法。

【請求項52】

１つ以上の可変定常領域を接触させる工程をさらに含む、請求項４９に記載の方法。

【請求項53】

前記エキソヌクレアーゼは、エキソヌクレアーゼＩＩＩである、請求項４９に記載の方法。

【請求項54】

前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項４９に記載の方法。

【請求項55】

前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である、請求項５４に記載の方法。

【請求項56】

前記ポリメラーゼは、５’～３’のポリメラーゼ活性を含む、請求項４９に記載の方法。

【請求項57】

核酸アセンブリのための方法であって、該方法は、
（ａ）５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸を提供する工程と、
（ｂ）５’～３’の順番で固定された可変性配列の第１の領域、第１の超可変領域配列、制限エンドヌクレアーゼ部位、第２の超可変領域配列、およびユニバーサルプライマーを含む第２の核酸配列を提供する工程と、
（ｃ）第３の核酸を生成するために、前記第１の核酸と前記第２の核酸を増幅させる工程と、
（ｄ）第１の可変領域配列に隣接する第１の相補的領域、および任意の定義された長さの配列の第１の領域を含むベクター配列を提供する工程と、
（ｅ）前記第３の核酸と前記ベクター配列とを接触させる工程と、
（ｆ）５’～３’の順番で自己切断型ペプチド配列、第２の可変領域配列に隣接する第２の相補的領域、および第２の可変領域配列を含む第４の核酸と接触させる工程と、を含む、方法。

【請求項58】

第１の超可変領域配列および第２の超可変領域配列は、各々が相補性決定領域（ＣＤＲ）を含む、請求項５７に記載の方法。

【請求項59】

前記ＣＤＲはＣＤＲ３である、請求項５８に記載の方法。

【請求項60】

前記自己切断型ペプチドはＰ２Ａである、請求項５７に記載の方法。

【請求項61】

核酸アセンブリのための方法であって、該方法は、
（ａ）
ｉ．第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸と、
ｉｉ．第１の超可変領域配列を含む第２の核酸と、
ｉｉｉ．第２の可変領域配列を含む第３の核酸と、
ｉｖ．５’～３’の順番で第１の超可変領域配列、固定された可変性の第１の領域、およびバーコードを含む第４の核酸と、をデノボ合成する行程と、
（ｂ）第５の核酸を生成するために、前記第１の核酸および前記第２の核酸を増幅させる工程と、
（ｃ）第５の核酸を生成するために、前記第３の核酸および前記第４の核酸を増幅させる行程と、
（ｄ）第７の核酸を生成するために、前記第５の核酸および第６の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程と、
（ｅ）前記第７の核酸を環状化させる行程と、
（ｆ）前記第７の核酸をバーコードを使用して配列決定および同定する行程と、
（ｇ）前記第７の核酸を増幅する行程と、
（ｈ）前記第７の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物を使用してベクターにアセンブルする行程と、を含む、方法。

【請求項62】

前記第１の可変領域配列、または前記第２の可変領域配列は、超可変領域配列を用いて増幅される、請求項６１に記載の方法。

【請求項63】

前記超可変領域配列はＣＤＲを含む、請求項６２に記載の方法。

【請求項64】

ＣＤＲはＣＤＲ３である、請求項６３に記載の方法。

【請求項65】

任意の定義された長さの１つ以上の領域を含む配列と接触する行程をさらに含む、請求項６１に記載の方法。

【請求項66】

前記第１の可変領域配列の約１００の変異体が合成される、請求項６１に記載の方法。

【請求項67】

前記第２の可変領域配列の約１３０の変異体が合成される、請求項６１に記載の方法。

【請求項68】

前記自己切断型ペプチドはＰ２Ａである、請求項６１に記載の方法。

【請求項69】

前記エキソヌクレアーゼは、エキソヌクレアーゼＩＩＩである、請求項６１に記載の方法。

【請求項70】

前記エンドヌクレアーゼは、フラップエンドヌクレアーゼである、請求項６１に記載の方法。

【請求項71】

前記フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である、請求項７０に記載の方法。

【請求項72】

前記ポリメラーゼは、５’～３’のポリメラーゼ活性を含む、請求項６１に記載の方法。

【請求項73】

前記ポリメラーゼはＤＮＡポリメラーゼである、請求項６１に記載の方法。

【請求項74】

前記リガーゼは、少なくとも２つの核酸の結合を触媒する、請求項６１に記載の方法。

【請求項75】

前記固定された可変性配列の第１の領域および前記固定された可変性配列の第２の領域は、各々が約１０～約１００の塩基対である、請求項６１に記載の方法。

【請求項76】

前記固定された可変性配列の第１の領域および前記固定された可変性配列の第２の領域は、各々が約４０の塩基対である、請求項６１に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

相互参照
本発明は、２０１９年６月２１日に出願の米国仮特許出願第６２／８６５，０９４号の利益を主張し、これは引用によって本明細書に組み込まれる。

【背景技術】

【0002】

デノボ核酸合成は、基礎的な生物学的研究およびバイオテクノロジーでの適用のための強力なツールである。小規模での比較的短い核酸断片の合成のための様々な方法が知られているが、これらの技術には、スケーラビリティ、自動化、速度、精度、およびコストの点で問題がある。したがって、必要は変異体核酸アセンブリの有効な方法の必要性が残る。

【発明の概要】

【0003】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：（ａ）第１の複数のポリヌクレオチドを提供する工程であって、ここで、第１の複数のポリヌクレオチドの各々のリヌクレオチドは、配列相同性の第１の末端領域を含む、工程と、（ｂ）第２の複数のポリヌクレオチドを提供する工程であって、ここで、第２の複数のポリヌクレオチドの各々のポリヌクレオチドは、配列相同性の第２の末端領域～配列相同性の前記第１の末端領域を含む、工程と、（ｃ）核酸のライブラリをアセンブリするために、第１の複数のポリヌクレオチドおよび第２の複数のポリヌクレオチドを、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程であって、ここで、核酸の少なくとも８０％は、各々が、ライブラリの核酸の各々の平均頻度の２倍（２ｘ）内の量でライブラリにおいて存在する、工程と、を含む。本明細書にはさらに、第１の複数のポリヌクレオチドが最大１００の異なる配列を含む方法が提供される。本明細書にはさらに、第２の複数のポリヌクレオチドが最大１００の異なる配列を含む方法が提供される。本明細書にはさらに、少なくとも１０，０００の核酸がアセンブリされる方法が提供される。本明細書にはさらに、少なくとも１００，０００の核酸がアセンブリされる方法が提供される。本明細書にはさらに、第１の複数のポリヌクレオチドの各ポリヌクレオチドが、最大で２５００の塩基長を含む方法が提供される。本明細書にはさらに、第２の複数のポリヌクレオチドの各ポリヌクレオチドが、最大で２５００の塩基長を含む方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼＩＩＩである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップエンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である方法が提供される。本明細書にはさらに、ポリメラーゼが、５’～３’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがＤＮＡポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも２つの核酸の結合を触媒する方法が提供される。

【0004】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：５’～３’の順番でバーコード配列、第１の制限エンドヌクレアーゼ部位、第２の制限エンドヌクレアーゼ部位、および第１の超可変領域配列を含む第１の核酸をデノボ合成する工程と、５’～３’の順番で任意の定義された配列長さの第１の領域、自己切断型ペプチド配列、第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第２の核酸をデノボ合成する工程と、第３の核酸を生成するために、第１の核酸と第２の核酸を接触させる工程と、５’～３’の順番でベクター配列、第２の可変領域配列に隣接する第２の相補的な領域、第２の可変領域配列、第２の超可変領域配列、第１の制限エンドヌクレアーゼ部位、およびバーコード配列を含む第４の核酸を提供する工程と、第３の核酸および第４の核酸を制限エンドヌクレアーゼと接触させる工程と、１つ以上酵素を含む反応混合物を使用して第３の核酸および第４の核酸をアセンブルする工程と、を含む。本明細書にはさらに、第１の制限エンドヌクレアーゼ部位、または第２の制限エンドヌクレアーゼ部位が、ＩＩＳ型制限エンドヌクレアーゼ（ＴＩＩＳ－ＲＥ）部位である方法が提供される。本明細書にはさらに、制限エンドヌクレアーゼがＩＩＳ型制限エンドヌクレアーゼである方法が提供される。本明細書にはさらに、反応混合物がリガーゼを含む方法が提供される。本明細書にはさらに、第１の超可変領域配列および前記第２の超可変領域配列が、各々が相補性決定領域（ＣＤＲ）を含む方法が提供される。本明細書にはさらに、ＣＤＲがＣＤＲ３である方法が提供される。本明細書にはさらに、自己切断型ペプチドがＰ２Ａである方法が提供される。本明細書にはさらに、第１の可変領域配列の約１００の変異体が合成される方法が提供される。本明細書にはさらに、第２の可変領域配列の約１３０の変異体が合成される方法が提供される。本明細書にはさらに、核酸を、第１のバーコード配列に相補的な第１のプライマー、およびアンプリコンの少なくとも９９％が欠失がない第２のプライマーで増幅する工程と、をさらに含む方法が提供される。

【0005】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：第１の可変領域配列を含む第１の核酸をデノボ合成する工程と、第２の可変領域配列を含む第２の核酸をデノボ合成する工程と、５’～３’の順番で固定された可変性配列の第１の領域、任意の定義された配列長さの第１の領域、自己切断型ペプチド配列、第１の可変領域配列に隣接する第１の相補的領域、および固定された可変性配列の第２の領域を含む第３の核酸をデノボ合成する工程と、第１の核酸、第２の核酸、第３の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、を含む。本明細書にはさらに、第１の可変領域配列、または第２の可変領域配列が、超可変領域配列で増幅される方法が提供される。本明細書にはさらに、超可変領域配列がＣＤＲを含む方法が提供される。本明細書にはさらに、ＣＤＲがＣＤＲ３である方法が提供される。本明細書にはさらに、任意の定義された長さの配列の１つ以の領域を含むと接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第１の可変領域配列の約１００の変異体が合成される方法が提供される。本明細書にはさらに、第２の可変領域配列の約１３０の変異体が合成される方法が提供される。本明細書にはさらに、自己切断型ペプチドがＰ２Ａである方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼＩＩＩである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップエンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である方法が提供される。本明細書にはさらに、ポリメラーゼが、５’～３’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがＤＮＡポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも２つの核酸の結合を触媒する方法が提供される。本明細書にはさらに、固定された可変性配列の第１の領域および固定された可変性配列の第２の領域が、各々が約１０～約１００の塩基対である方法が提供される。本明細書にはさらに、固定された可変性配列の第１の領域および固定された可変性配列の第２の領域が、各々が約４０の塩基対である方法が提供される。

【0006】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：任意の定義された長さの配列の第１の領域を含む第１の核酸を提供する工程と、任意の定義された長さの配列の第２の領域を含む第２の核酸を提供する工程と、５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、第１の可変領域配列、および第１の超可変領域配列を含む第３の核酸をアセンブルする工程と、５’～３’の順番で第２の可変領域配列に隣接する第２の相補的領域、第２の可変領域配列、および第２の超可変領域配列を含む第４の核酸をアセンブルする工程と、第１の核酸と、前記第２の核酸と、前記第３の核酸と第４の核酸とを接触させる工程と、結果として生じる産物を増幅させる行程と、を含む。本明細書にはさらに、エラー修正工程をさらに含む方法が提供される。本明細書にはさらに、第１の核酸、第２の核酸、第３の核酸および第４の核酸と接触させる工程の間に、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第１の超可変領域配列および前記第２の超可変領域配列が、各々が相補的を含む方法が提供される。本明細書にはさらに、第１の核酸が約３００～約７００の塩基対を含む方法が提供される。本明細書にはさらに、第２の核酸が約２００～約６００の塩基対を含む方法が提供される。本明細書にはさらに、第３の核酸が約２００～約６００の塩基対を含む方法が提供される。本明細書にはさらに、第４の核酸が約２００～約６００の塩基対を含む方法が提供される。

【0007】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸と、５’～３’の順番で固定された可変性配列の第１の領域、および第１の超可変領域配列を含む第２の核酸と、第２の可変領域配列を含む第３の核酸と、５’～３’の順番で制限エンドヌクレアーゼ部位、および固定された可変性配列の第２の領域を含む第４の核酸と、５’～３’の順番で固定された可変性配列の第２の部位、第２の超可変領域配列、および可変定常領域配列を含む第５の核酸と、をデノボ合成する工程と、第１の核酸、第２の核酸、第３の核酸、第４の核酸、および第５の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼ、およびリガーゼを含む反応混合物と接触させる工程と、工程ｂの構築物を、ベクター配列へとクローン化する工程と、を含む。本明細書にはさらに、第１の超可変領域配列および前記第２の超可変領域配列が、各々が相補性決定領域（ＣＤＲ）を含む方法が提供される。本明細書にはさらに、ＣＤＲがＣＤＲ３である方法が提供される。本明細書にはさらに、１つ以上の可変定常領域と接触させる行程をさらに含む方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼＩＩＩである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である方法が提供される。本明細書にはさらに、ポリメラーゼが、５’～３’のポリメラーゼ活性を含む方法が提供される。

【0008】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：５’～３’の順番で第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸を提供する工程と、５’～３’の順番で固定された可変性配列の第１の領域、第１の超可変領域配列、制限エンドヌクレアーゼ部位、第２の超可変領域配列、およびユニバーサルプライマーを含む第２の核酸配列を提供する工程と、第３の核酸を生成するために、第１の核酸と第２の核酸を増幅させる工程と、第１の可変領域配列に隣接する第１の相補的領域、および任意の定義された長さの配列の第１の領域を含むベクター配列を提供する工程と、第３の核酸とベクター配列と接触させる工程と、５’～３’の順番で自己切断型ペプチド配列、第２の可変領域配列に隣接する第２の相補的領域、および第２の可変領域配列を含む第４の核酸と接触させる工程と、を含む。本明細書にはさらに、第１の超可変領域配列および前記第２の超可変領域配列が、各々が相補性決定領域（ＣＤＲ）を含む方法が提供される。本明細書にはさらに、ＣＤＲがＣＤＲ３である方法が提供される。本明細書にはさらに、自己切断型ペプチドがＰ２Ａである方法が提供される。

【0009】

本明細書には、核酸アセンブリのための方法が提供され、該方法は：ｉ．第１の可変領域配列に隣接する第１の相補的領域、および第１の可変領域配列を含む第１の核酸と、第１の超可変領域配列を含む第２の核酸と、第２の可変領域配列を含む第３の核酸と、５’～３’の順番で第１の超可変領域配列、固定された可変性の第１の領域、およびバーコードを含む第４の核酸と、をデノボ合成する行程と、第５の核酸を生成するに、第１の核酸および第２の核酸を増幅する工程と、第５の核酸を生成するために、第３の核酸および第４の核酸を増幅する行程と、第７の核酸を生成するために、第５の核酸および第６の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物と接触させる行程と、第７の核酸を環状化させる行程と、第７の核酸を、バーコードを使用して配列決定および同定する行程と、第７の核酸を増幅させる行程と、第７の核酸を、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む反応混合物を使用してベクターにアセンブルする行程と、を含む。本明細書にはさらに、第１の可変領域配列、または第２の可変領域配列が、超可変領域配列で増幅される方法が提供される。本明細書にはさらに、超可変領域配列がＣＤＲを含む方法が提供される。本明細書にはさらに、ＣＤＲがＣＤＲ３である方法が提供される。本明細書にはさらに、任意の定義された長さの配列の１つ以の領域を含むと接触させる行程をさらに含む方法が提供される。本明細書にはさらに、第１の可変領域配列の約１００の変異体が合成される方法が提供される。本明細書にはさらに、第２の可変領域配列の約１３０の変異体が合成される方法が提供される。本明細書にはさらに、自己切断型ペプチドがＰ２Ａである方法が提供される。本明細書にはさらに、エキソヌクレアーゼがエキソヌクレアーゼＩＩＩである方法が提供される。本明細書にはさらに、エンドヌクレアーゼがフラップ弁エンドヌクレアーゼである方法が提供される。本明細書にはさらに、フラップエンドヌクレアーゼが、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、ＸＰＧ、Ｄｎａ２、またはＧＥＮ１である方法が提供される。本明細書にはさらに、ポリメラーゼが、５’～３’のポリメラーゼ活性を含む方法が提供される。本明細書にはさらに、ポリメラーゼがＤＮＡポリメラーゼである方法が提供される。本明細書にはさらに、リガーゼが、少なくとも２つの核酸の結合を触媒する方法が提供される。本明細書にはさらに、固定された可変性配列の第１の領域および固定された可変性配列の第２の領域が、各々が約１０～約１００の塩基対である方法が提供される。本明細書にはさらに、固定された可変性配列の第１の領域および固定された可変性配列の第２の領域が、各々が約４０の塩基対である方法が提供される。

【0010】

引用による組み込み
本明細書で明記されるすべての公開物、特許、および特許出願は、個々の公開物、特許、または特許出願がそれぞれ参照により組み込まれるべく特別かつ個別に示されるかのような同じ程度で、参照により本明細書に組み込まれる。

【図面の簡単な説明】

【0011】

【図1A】図１Ａは、モジュラー入力（２つの入力または「ドメイン」は説明のためにのみ示されている）と特有のリンカー領域によって接続されたプールを備えたコンビナトリアルアセンブリの概略図を示す。

【図1B】図１Ｂは、ＩＩＳ型に暴露されたバーコードを使用してペア化された変異体アセンブリの概略図を示す。

【図2】図２は、ペア化された相同性を使用してペア化された変異体アセンブリの概略図を示す。

【図3】図３は、免疫グロブリン、またはその断片をコードする核酸などの変異体核酸のデノボ合成の概略図を示す。

【図4】図４は、ペア化された相同性を使用してベクターへのペア化された変異体アセンブリの概略図を示す。

【図5A】図５Ａは、ＩＩＳ型を使用してベクターへのペア化された変異体アセンブリの概略図を示す。

【図5B】図５Ｂは、ペア化されたバーコードおよびダイヤルアウトＰＣＲ（ｄｉａｌ－ｏｕｔＰＣＲ）を使用する核酸アセンブリの概略図を示す。

【図6】図６は、各可変領域に特異的なポリヌクレオチド集団を使用する核酸アセンブリの概略図を示す。

【図7】図７は、ポリヌクレオチド合成および核酸アセンブリのためのシステムを描く。

【図8】図８は、コンピュータシステムを示す。

【図9】図９は、コンピュータシステムのアーキテクチャを示すブロック図である。

【図10】図１０は、共有仮想アドレスメモリ空間を用いる、マルチプロセッサーコンピュータシステムのブロック図である。

【図11】図１１は、複数のコンピュータシステム、複数の携帯電話および個人用携帯情報端末、ならびにネットワーク接続ストレージ（ＮＡＳ）を組み込むように構成されたネットワークを実証する図である。

【図12A】図１２Ａは、コロニー形成単位（ＣＦＵ）のグラフである。

【図12B】図１２Ｂは、Ａ／Ｔ豊富なオーバーラップ相同性配列のコロニー形成単位（ＣＦＵ）のグラフである。

【図12C】図１２Ｃは、コンパレータ１およびコンパレータ２の合格率のグラフである。

【図12D】図１２Ｄは、３つのアセンブルされた遺伝子を含む集団のパーセントによる、酵素的アセンブリ方法によるアセンブリ特異性および配列バイアスのグラフである。アダプターを有する９つのｄｓＤＮＡ入力断片から構成された、３つの様々な遺伝子（遺伝子Ａ、遺伝子Ｂ、遺伝子Ｃ）のアセンブリは、単一反応においてアセンブルされた。

【図12E】図１２Ｅは、酵素学的なアセンブリ方法を使用して、０～６のＤＮＡ断片の同時のアセンブリのためのコロニー形成単位（ＣＦＵ）のグラフである。

【図12F】図１２Ｆは、酵素学的なアセンブリ方法、コンパレータ１、またはコンパレータ２を使用して、０～１０のＤＮＡ断片の同時のアセンブリのためのコロニー形成単位（ＣＦＵ）のグラフである。

【図12G】図１２Ｇは、酵素学的なアセンブリ方法を使用して、２５ｂｐ、または４０ｂｐのいずれかのオーバーラップ相同性領域のためのコロニー形成単位（ＣＦＵ）のグラフである。

【図13A】図１３Ａは、多重アセンブリに続くユニバーサルプライマーを使用するＰＣＲ後のＤＮＡの相対濃度を示す。

【図13B】図１３Ｂは、多重アセンブリ後ＢｉｏＡｎａｌｙｚｅｒ読み取りからのプロットを示す。

【図13C】図１３Ｃは、多重アセンブリ後の遺伝子の集団の１４０ｘ適用範囲を使用する密度プロットを示す。

【図13D】図１３Ｄは、４００ｂｐの遺伝子プールの多重アセンブリ後の遺伝子の集団にける挿入／欠失なしのものの割合を示す。

【図13E】図１３Ｅは、多重アセンブリ後の遺伝子の集団における挿入／欠失なしのものの割合を示す。

【図13F】図１３Ｆは、多重アセンブリ後の遺伝子の集団における完全ドロップアウト、ドロップアウト、およびランナウェイ（ｒａｎａｗａｙ）の割合を示す。

【図13G】図１３Ｇは、多重アセンブリ後の遺伝子の集団におけるトクリッピング／キメラ・リードのグラフを示す。

【図14A】図１４Ａは、遺伝子断片の４つの集団を使用するコンビナトリアルアセンブリのクローニング前後における完全長配列の均一性のグラフである。

【図14B】図１４Ｂは、遺伝子断片の４つの集団を使用するコンビナトリアルアセンブリ後のドメイン内の変異体の頻度のグラフである。

【図15A】図１５Ａは、プリクローン化されたプール（左）、およびクローン化されたプール（右）の頻度密度対対数（読み取り数）のグラフである。

【図15B】図１５Ｂは、遺伝子断片の４つの集団を使用するコンビナトリアルアセンブリ後のドメイン内の変異体の頻度のグラフである。

【図15C】図１５Ｃは、４ｘ４アセンブリ（左）および１０ｘ１０アセンブリ（右）の頻度密度対対数（読み取り数）のグラフである。

【図15D】図１５Ｄは、５０ｘ５０コンビナトリアルアセンブリ（左）および１００ｘ１００コンビナトリアルアセンブリ（右）の頻度密度対対数（読み取り数）のグラフである。

【図16A】図１６Ａは、ウイルスタンパク質をコードする２５０ｋの配列コンビナトリアルライブラリの遺伝子プール中のポジションの関数としての配列多様性（塩基数）のグラフである。

【図16B】図１６Ｂは、ウイルスタンパク質をコードする２５０ｋの配列コンビナトリアルライブラリの変動するＧＣ含有量を有する配列にわたる配列表現のグラフである。

【図16C】図１６Ｃは、ウイルスタンパク質のためのコードする２５０ｋの配列コンビナトリアルライブラリにおける遺伝子のサイズ分布のグラフである。

【図16D】図１６Ｄは、ウイルスタンパク質をコードする２５０ｋの配列コンビナトリアルライブラリの頻度密度対対数（読み取り数）のグラフである。

【図16E】図１６Ｅは、１１のサブ遺伝子プールにわたる均一性のグラフである。

【図16F】図１６Ｆは、ドロップアウト（プールから喪失している）、過小表現（平均の＜１０ｘ）、脱走（平均の１０ｘ＞）および完璧な配列を有するパーセント遺伝子を含むプール特性のグラフである。

【発明を実施するための形態】

【0012】

定義

【0013】

本開示の全体にわたって、様々な実施形態が範囲フォーマット（ｒａｎｇｅｆｏｒｍａｔ）で提示される。範囲形式での記載は単に利便性と簡潔さのためのものに過ぎず、任意の実施形態の範囲に対する確固たる限定として解釈されてはならないということを理解されたい。これに応じて、範囲の記載は、文脈で別段の定めのない限り、すべての可能性のある下位範囲と、下限の単位の小数第２位までのその範囲内の個々の数値を具体的に開示していると考えられなければならない。例えば、１から６などの範囲の記載は、１から３、１から４、１から５、２から４、２から６、３から６などの下位範囲と、例えば、１．１、２、２．３、５、および５．９のその範囲内の個々の数値を具体的に開示していると考えられなければならない。これは、範囲の広さにかかわらず適用される。これらの介在する範囲の上限および下限は、より小さな範囲内に独立して含まれてもよく、また、定められた範囲内のあらゆる具体的に除外された限界に従って、本発明内に包含される。定められた範囲が上限および下限の１つまたはその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲も、文脈から明確に指示されない限り、本発明内に包含される。

【0014】

本明細書で使用される用語は、特定の実施形態のみを記載するためのものであり、任意の実施形態を限定することを意図してはいない。本明細書で使用されるように、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が他に明白に示していない限り、同様に複数形を含むように意図される。用語「含む」および／または「含むこと」は、本明細書での使用時に、明示された特徴、整数、工程、操作、要素、および／または構成要素の存在を特定するが、１以上の他の特徴、整数、工程、操作、要素、構成要素、および／またはそれらの群の存在または追加を妨げないことが、さらに理解される。本明細書で使用されるように、用語「および／または」は、関連する列挙された項目の１つ以上のあらゆる組み合わせを含む。

【0015】

本明細書で使用されるように、別段の定めのない限り、あるいは文脈から明らかでない限り、「核酸」という用語は、二本鎖または三本鎖核酸、ならびに一本鎖分子を包含する。二本鎖または三本鎖の核酸において、核酸鎖は同一の広がりをもつ必要はない（すなわち、二本鎖の核酸は、両鎖の全長に沿って二本鎖である必要はない）。核酸配列は、提供される場合、別段の記載がない限り、５’から３’方向に記載される。本明細書に記載される方法は、単離された核酸の生成を提供する。本明細書に記載される方法は、単離および精製された核酸の生成をさらにもたらす。本明細書に言及されるような「核酸」は、少なくとも５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、６００、７００、８００、９００、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、２０００、またはそれより多くの塩基長を含み得る。さらに、本明細書に提供されるのは、ヌクレオチド配列をコードするポリペプチド－セグメントの任意の数の合成のための方法であり、それらは、非リボソームペプチド（ＮＲＰ）をコードする配列、非リボソームペプチド合成酵素（ＮＲＰＳ）モジュールおよび合成変異体をコードする配列、抗体など他のモジュールタンパク質のポリペプチドセグメント、他のタンパク質ファミリーからのポリペプチドセグメント、調節配列などの非コードのＤＮＡまたはＲＮＡ（例えば、プロモータ、転写因子、エンハンサー、ｓｉＲＮＡ、ｓｈＲＮＡ、ＲＮＡｉ、ｍｉＲＮＡ、マイクロＲＮＡに由来する核小体低分子ＲＮＡ、あるいは対象の任意の機能的または構造的なＤＮＡまたはＲＮＡユニット）を含む。以下はポリヌクレオチドの非限定的な例である：遺伝子または遺伝子断片のコードまたは非コード領域、遺伝子間ＤＮＡ、連鎖解析から定義された遺伝子座（複数の遺伝子座）、エキソン、イントロン、メッセンジャー核酸（ｍＲＮＡ）、転移ＲＮＡ、リボソームＲＮＡ、低分子干渉ＲＮＡ（ｓｉＲＮＡ）、低分子ヘアピン型ＲＮＡ（ｓｈＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、核小体低分子ＲＮＡ、リボザイム、メッセンジャーＲＮＡ（ｍＲＮＡ）の逆転写あるいは増幅によって通常得られるｍＲＮＡのＤＮＡ表現である、相補的ＤＮＡ（ｃＤＮＡ）；合成的にあるいは増幅により生成されるＤＮＡ分子、ゲノムＤＮＡ、組み換えポリヌクレオチド、分枝鎖ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、核酸プローブ、およびプライマー。本明細書で言及される遺伝子または遺伝子断片をコードするｃＤＮＡは、ゲノム等価配列において介在イントロン配列のないエキソン配列をコードする少なくとも１つの領域を含むことがある。

【0016】

別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用されるように、数あるいは数の範囲に関連して用語「約」とは、明示された数とその数＋／－１０％、あるいはある範囲の列挙された値について列挙された下限の１０％以下と列挙された１０％以上を意味するものと理解されたい。

【0017】

「ユニバーサルプライマー」として本明細書に言及された例示的なワークフローで言及されるプライマーは、複数のＤＮＡ断片に対する共通のプライマー結合部位を認識する短いポリヌクレオチドである。しかし、これらのワークフローは、ユニバーサルプライマーのみの使用に制限されることなく、断片特異的なプライマーは追加的に、または代替的に取り込まれる場合がある。加えて、本明細書に記載される例示的なワークフローは、遺伝子断片のアセンブリを指しているが、それらはあるがまま制限されることなく、一般的により長い核酸のアセンブリに適用可能である。

【0018】

配列アセンブリ

【0019】

本明細書に記載されているのは、核酸配列アセンブリのための方法および組成物である。このような配列アセンブリは、ＧＣ含有量、反復領域、二次構造などのアセンブリ断片の特異性のため、場合によっては困難な場合がある。さらに、このような配列のライブラリのアセンブリは、ライブラリのメンバーがメンバー間で高い可変性の領域を有し、並行してアセンブルされる場合がある。このような断片の並行アセンブリは、このような断片のためのライブラリのメンバー間で高度に可変な領域が存在するため、困難である。さらに、アセンブリの結果、核酸が不正確にアセンブルされないなどのエラーが発生する可能性もある。可変領域を含む核酸は、遺伝子（タンパク質または抗体などの）のためにコードする核酸、または非コードの核酸を含む場合がある。いくつかの例では、本明細書にアセンブルされる核酸は、免疫グロブリンまたはその断片のためにコードする領域を含む。高可変性のライブラリを含む核酸のアセンブリは、本明細書に記載される方法によって達成され得る。いくつかの例では、そのような方法は、ＰＣＲ／ＰＣＡベースのオーバーラップアセンブリ、ライゲーション、ベクターでのクローニング、フラパーゼ（ｆｌａｐａｓｅ）ベースのアセンブリ、エキソヌクレアーゼベースのアセンブリ、または他のアセンブリ方法を含む。いくつかの例では、核酸のライブラリを生成するために複数の方法が組み合わせられる。そのような方法は、任意の順序で実行され、いくつかの例では、精製などの工程が介在する場合もある。いくつかの例では、アセンブルされた核酸は、ライブラリを生成するために部分的および完全にアセンブルされた核酸のプールから増幅される。いくつかの例では、正確にアセンブルされた核酸は、ライブラリを生成するために、正確にアセンブルされた核酸および不正確にアセンブルされた核酸を含むプールから増幅される。

【0020】

バーコードを使用する配列アセンブリの例示的なプロセスは、図１Ｂで見られる。遺伝子断片（１２１）は、合成され、バーコード（１０１）、それに続く第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第２の制限エンドヌクレアーゼ部位（１１２Ｂ）、および第１の超可変領域（１０２）を含む。いくつかの例では、第１の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。いくつかの例では、第１の制限エンドヌクレアーゼ部位、または第２の制限エンドヌクレアーゼ部位は、ＩＩＳ型制限エンドヌクレアーゼ（ＴＩＩＳ－ＲＥ）部位である。いくつかの例では、第１の制限エンドヌクレアーゼ部位、および第２の制限エンドヌクレアーゼ部位は、異なるＴＩＩＳ－ＲＥ部位である。遺伝子断片（１２３）は、合成され、任意の定義された長さの第１の領域（１０３）、それに続く自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および第１の可変領域（１０６）を含む。いくつかの例では、自己切断型ペプチド配列はＰ２Ａである。いくつかの例では、合成された第１の可変領域の数は、約１００である。いくつかの例では、合成された第１の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。遺伝子断片（１２１）は、遺伝子断片（１２３）と組み合わされる（１１３）。結果として生じる断片（１２５）は、バーコード（１０１）、それに続く制限エンドヌクレアーゼ部位（１１２Ａ）、任意の定義された長さの第１の領域（１０３）、切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（１２７）は、合成され、ベクター配列（１０７）、それに続く第２の可変領域に隣接する第２の相補的領域（１０８）、第２の可変領域（１０９）、第２の超可変領域（１１０）、ＴＩＩＳ－ＲＥ部位（１１２Ａ）、および第２のバーコード（１０１’）を含む。いくつかの例では、合成された第２の可変領域の数は、約１３０である。いくつかの例では、合成された第２の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。遺伝子断片（１２５）は、その後遺伝子断片（１２７）でＰＣＲ増幅される（１１４）。結果として生じる断片（１２９）は、ベクター配列（１０７）、それに続く第２の可変領域に隣接する第２の相補的領域（１０８）、第２の可変領域（１０９）、第２の超可変領域（１１０）、ＴＩＩＳ－ＲＥ部位（１１２Ａ）、バーコード（１０１）、ＴＩＩＳ－ＲＥ部位（１１２Ａ）、任意の定義された長さの第１の領域（１０３）、切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。その後、遺伝子断片（１２９）は、クローン化され、およびＴＩＩＳ制限エンドヌクレアーゼは、バーコード（１０１）を除去するためにＴＩＩＳ－ＲＥ部位でカットされる。結果として生じる断片（１３１）は、ベクター配列（１０７）、それに続く第２の可変領域に隣接する第２の相補的領域（１０８）、第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第１の領域（１０３）、切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（１３１）は、最終構築物（１３３）を生成するためにその後クローン化される（１１６）。最終構築物（１３３）は、第２の可変領域に隣接する第２の相補的領域（１０８）、第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第１の領域（１０３）、切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第１の可変定常セグメント（１１１）を含む。いくつかの例では、生成された最終構築物の数は、約１０００である。いくつかの例では、合成された遺伝子断片の数は、約５０、１００、２５０、５００、１０００、２０００、３０００、５０００、７５００、１０，０００、または約２０，０００である。いくつかの例では、合成された第１の可変領域の数は、１００～５０００、２００～５０００、５００～５０００、１００～２０００、２５０～１５００、７５０～１２５０、２０００～７５００、９００～１０，０００、３０００～１０，０００、７５０～５０００、５００～２０００、または５００～３０００である。いくつかの例では、合成された最終構築物の数は、約５０００、１０，０００、２５，０００、５００，０００、１００，０００、２００，０００、３００，０００、５００，０００、７５０，０００、１，０００，０００、または約５，０００，０００である。いくつかの例では、合成された最終構築物の数は、少なくとも５０００、１０，０００、２５，０００、５００，０００、１００，０００、２００，０００、３００，０００、５００，０００、７５０，０００、１，０００，０００、または少なくとも５，０００，０００である。

【0021】

配列アセンブリの例示的なプロセスは、図２で見られる。遺伝子断片（２２１）は、合成され、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および固定された可変性の第１の領域（１０６’）を含む。いくつかの例では、固定された可変性の第１の領域は、少なくとも１５、２０、２５、３０、３５、４０、４５、５０、または５０を超える塩基長である。いくつかの例では、固定された可変性の第１の領域は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または約６５の塩基長である。いくつかの例では、自己切断型ペプチド配列はＰ２Ａである。遺伝子断片（２２３）は、合成され、固定された可変性の第２の領域（１０９’）、それに続く第２の超可変領域（１１０）、および任意の定義された長さの第２の領域（２０３）に相同的である領域（２０３’）を含む。いくつかの例では、第２の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。遺伝子断片（２２１）は、遺伝子断片（２２５）を生成するために遺伝子断片（２２３）でＰＣＲ増幅される（２１３）。遺伝子断片（２２５）は、セグメント（１０９’）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および固定された可変性の第１の領域（１０６’）を含む。遺伝子断片（２２５）および遺伝子断片（２０９）は、酵素学的ベースのアセンブリにかけられ、遺伝子断片（２２７）を生成するためにＰＣＲ増幅される（２１５）。遺伝子断片（２２７）は、第２の可変領域（１０９）、それに続く第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および固定された可変性の第１の領域（１０６’）を含む。別個の反応では、第１の可変領域（１０６）は、固定された可変性の第１の領域（１０６’）に相同的に合成される。第１の可変領域（１０６）は、第１の可変領域（１０６）、それに続く第１の超可変領域（１０２）を含む遺伝子断片（２２５）を生成するために、第１の超可変領域（１０２）で増幅される（２１４）。遺伝子断片（２２５）および遺伝子断片（２２７）は、その後組み合わされ、および遺伝子断片（２２９）を生成するために酵素学的ベースのアセンブリ（２１６）にかけられる。遺伝子断片（２２９）は、第２の可変領域（１０９）、それに続く第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（２２９）は、最終構築物（２３１）を生成するためにベクターにクローン化される（２１７）。構築物（２３１）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第１の可変定常セグメント（１１１）を含む。いくつかの例では、合成された第１の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された第２の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された遺伝子断片の数は、約５０、１００、２５０、５００、１０００、２０００、３０００、５０００、７５００、１０，０００、または約２００００である。いくつかの例では、合成された第１の可変領域の数は、１００～５０００、２００～５０００、５００～５０００、１００～２０００、２５０～１５００、７５０～１２５０、２０００～７５００、９００～１０，０００、３０００～１０，０００、７５０～５０００、５００～２０００、または５００～３０００である。

【0022】

例示的なデノボ合成方法は、図３で見られる。第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）は、合成され、その後、遺伝子断片（３２３）を生成するためにポリメラーゼ・サイクル・アセンブリ（ｐｏｌｙｍｅｒａｓｅｃｙｃｌｉｎｇａｓｓｅｍｂｌｙ）（ＰＣＡ）（３１４）にかけられる。遺伝子断片（３２３）は、第１の可変領域に隣接する第１の相補的領域（１０５）、それに続く第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。いくつかの例では、第１の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。第２の可変領域に隣接する第２の相補的領域（１０８）、第２の可変領域（１０９）、および第２の超可変領域（１１０）は、合成され、遺伝子断片（３２１）を生成するためにＰＣＲまたはＰＣＡ（３１３）に従う。いくつかの例では、第２の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。遺伝子断片（３２１）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、および第２の超可変領域（１１０）を含む。任意の定義された長さの第２の領域（２０３）、それに続く自己切断型ペプチド配列（１０４）、および第１の可変定常セグメント（１１１）を含む遺伝子断片（３２５）のクローンが合成される。遺伝子断片（３２１）、（３２３）および（３２５）は、それぞれ個々のウェル中で合成され、ＰＣＲ増幅される。遺伝子断片（３２５）および第１の可変定常セグメント（１１１）は、遺伝子断片（３２７）を生成するために、遺伝子断片（３２１）および遺伝子断片（３２３）に追加され、その後にＰＣＲが行われる。いくつかの例では、エラー修正反応は実施される。遺伝子断片（３２７）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第１の可変定常セグメント（１１１）を含む。その後、遺伝子断片（３２７）はクローン化され、次世代の配列決定にかけられる。いくつかの例では、合成された第１の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された第２の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された遺伝子断片の数は、約５０、１００、２５０、５００、１０００、２０００、３０００、５０００、７５００、１０，０００、または約２００００である。いくつかの例では、合成された第１の可変領域の数は、１００～５０００、２００～５０００、５００～５０００、１００～２０００、２５０～１５００、７５０～１２５０、２０００～７５００、９００～１０，０００、３０００～１０，０００、７５０～５０００、５００～２０００、または５００～３０００である。

【0023】

本明細書に提供されるのは、ペア化された相同性を使用するペア化された変異体アセンブリのための方法である。例示的なプロセスは図４で見られる。遺伝子断片（４２１）は、固定された可変性の第２の領域（１０９’）、それに続く任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および固定された可変性の第１の領域（１０６’）を含んで合成される。いくつかの例では、第２の可変領域に相補的な塩基対領域は、少なくとも１５、２０、２５、３０、３５、４０、４５、５０、または５０を超える塩基長である。いくつかの例では、第２の可変領域に相補的な塩基対領域は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または約６５の塩基長である。いくつかの例では、第１の超可変領域に相同的な配列、任意の定義された長さの第２の領域、自己切断型ペプチド配列、第１の可変領域に隣接する第１の相補的領域、および固定された可変性の領域を含む約１３０の変異体が合成される。いくつかの例では、第１の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。遺伝子断片（４２１）は、遺伝子断片（４２５）を生成するために、第１の可変領域（１０６）および第１の超可変領域（１０２）を含む遺伝子断片（４２３）と組み合わされる（４１３）。いくつかの例では、第１の可変セグメントおよび第１の超可変領域を含む約１００の変異体が合成される。遺伝子断片（４２５）は、固定された可変性第２の領域（１０９’）、それに続く任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（４２５）は、その後、遺伝子断片（４２９）を生成するために、第２の可変領域（１０９）および第２の超可変領域（１１０）を含む遺伝子断片（４２７）と組み合わされる（４１４）。いくつかの例では、第２の可変領域および第２の超可変領域を含む約１３０の変異体が合成される。いくつかの例では、第２の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。遺伝子断片（４２９）は、第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（４２９）は、その後プールされ、目的ベクター（ｄｅｓｔｉｎａｔｉｏｎｖｅｃｔｏｒ）（４３１）にクローン化される（４１５）。目的ベクター（４３１）は、第２の可変領域に隣接する第２の相補的領域（１０８）および第１の可変定常セグメント（１１１）を含む。結果として生じる構築物（４３３）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第１の可変定常セグメント（１１１）を含む。

【0024】

配列アセンブリの例示的なプロセスは、図５Ａで見られる。遺伝子断片（５２１）は、合成され、第２の可変領域に隣接する第２の相補的領域（１０８）および第２の可変領域（１０９）を含む。遺伝子断片（５２３）は、合成され、第１のく制限エンドヌクレアーゼ部位（１１２Ａ）、それに続く固定された可変性の第２の領域（１０９’）を含む。いくつかの例では、固定された可変性の第２の領域は、少なくとも１５、２０、２５、３０、３５、４０、４５、５０、または５０よりも多くの塩基長である。いくつかの例では、固定された可変性の第２の領域は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または約６５の塩基長である。いくつかの例では、固定された可変性の第２の領域は、１０～６０、１０～４０、１５～６０、２０～６０、２０～８０、３０～５０、２０～４５、３５～５５、４０～８０、または５０～８０である。遺伝子断片（５２５）は、合成され、固定された可変性の第２の領域（１０９’）、それに続く、第２の超可変領域（１１０）および第２の可変定常セグメント（２１１）を含む。遺伝子断片（５２７）は、合成され、固定された可変性の第１の領域（１０６’）、それに続く第１の超可変領域（１０２）および第１のく制限エンドヌクレアーゼ部位（１１２Ａ）を含む。いくつかの例では、第１の超可変領域はＣＤＲを含む。いくつかの例では、第２の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。いくつかの例では、制限エンドヌクレアーゼ部位は、ＴＩＩＳ－ＲＥ部位である。遺伝子断片（５２１）、（５２３）、（５２５）、（５２７）、および第１の可変領域（１０６）は、プールされ、第１の超可変領域（１０２）および第２の超可変領域（１１０）を追加するためにＰＣＲ増幅される（５１３）。結果として生じる遺伝子断片（５２９）は、第２の可変領域（１０９）、それに続く第２の超可変領域（１１０）、第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第１の可変領域（１０６）、および第１の超可変領域（１０２）を含む。遺伝子断片（５２９）および目的ベクター（５３１）は、第２の可変領域に隣接する第２の相補的領域（１０８）および第２の可変定常セグメント（２１１）を含み、その後、遺伝子断片（５３３）を生成するためにフラップエンドヌクレアーゼ媒介の核酸アセンブリ（５１４）にかけられる。遺伝子断片（５３３）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第２の可変定常セグメント（２１１）を含む。遺伝子断片（５３３）は、その後、最終構築物（５３５）を生成するために任意の定義された長さの第２の領域（２０３）を挿入するために、ゴールデンゲートアセンブリ（５１５）にかけられる。最終構築物（５３５）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第２の可変定常セグメント（２１１）を含む。生成された最終構築物の数は、いくつかの例では、約１００００である。いくつかの例では、合成された第１の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された第２の可変領域の数は、約５０、１００、１５０、２００、２５０、３００、５００、１０００、または約２０００である。いくつかの例では、合成された第１の可変領域の数は、１０～１００、２０～１０００、５０～１０００、１００～１０００、２５～５００、７５～１２５、２００～２０００、１５０～２０００、３００～５０００、５０～５０００、１０００～５０００、または５０～３００である。いくつかの例では、合成された最終構築物の数は、約５０００、１０，０００、２５，０００、５００，０００、１００，０００、２００，０００、３００，０００、５００，０００、７５０，０００、１，０００，０００、または約５，０００，０００である。いくつかの例では、合成された最終構築物の数は、少なくとも５０００、１０，０００、２５，０００、５００，０００、１００，０００、２００，０００、３００，０００、５００，０００、７５０，０００、１，０００，０００、または少なくとも５，０００，０００である。いくつかの例では、合成された第１の可変領域の数は、１０００～５０，０００、２９００～５０，０００、５０００～５０，０００、１０００～２０，０００、２５００～１５，０００、７５００～１２，５００、２０，０００～７５，０００、９０００～１００，０００、３０，０００～１００，０００、７５００～５０，０００、５０００～２０，０００、または５０００～３０，０００である。

【0025】

配列アセンブリの例示的なプロセスは、図５Ｂで見られる。遺伝子断片（５５１）は合成され、第２の可変領域に隣接する第２の相補的領域（１０８）および第２の可変領域（１０９）を含む。第２の超可変領域（１１０）を含む遺伝子断片が合成される。第１の可変領域（１０６）を含む遺伝子断片が合成される。遺伝子断片（５５３）は、第１の超可変領域（１０２）、それに続く固定された可変性の第１の領域（１０６’）およびバーコード（１０１）を含んでいる。遺伝子断片（５５１）および第２の超可変領域（１１０）の第１のコンビナトリアルライブラリは、ＰＣＲを使用して生成される。遺伝子断片（５５３）および第１の可変領域（１０６）の第２のコンビナトリアルライブラリは、ＰＣＲを使用して生成される。第１のコンビナトリアルライブラリおよび第２のコンビナトリアルライブラリは、断片（５５９）を生成するために酵素ベースアセンブリ（５５５）を使用してアセンブルされる。遺伝子断片（５５７）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、固定された可変性の第１の領域（１０６’）、およびバーコード（１０１）を含む。いくつかの例では、遺伝子断片（５５９）は、定数の塩基対の領域を含む。塩基対の数は、いくつかの例では、少なくとも、あるいは約５、１０、１５、２０、２５、３０、３５、４０、４５、５０、または５０よりも多くの塩基対である。遺伝子断片（５５７）は、遺伝子断片（５６１）を生成するために環状化される（５５９）。遺伝子断片（５６１）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、固定された可変性の第１の領域（１０６’）、およびバーコード（１０１）を含む。第１の可変領域および第１の超可変領域は、変動する長さを含む場合がある。いくつかの例では、第１の可変領域および第１の超可変領域の長さは、少なくとも、あるいは約１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、５２５、５５０、５７５、６００、６２５、６５０、６７５、７００、または７００よりも多くの塩基長である。いくつかの例では、第１の可変領域および第１の超可変領域の長さは、約１０～１０００、５０～９００、１００～８００、または２００～６００の塩基対の範囲内である。第２の可変領域および第２の超可変領域は、変動する長さを含む場合がある。いくつかの例では、第２の可変領域および第２の超可変領域の長さは、少なくとも、あるいは約１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、５２５、５５０、５７５、６００、６２５、６５０、６７５、７００、またはで７００よりも多くの塩基長である。いくつかの例では、第２の可変領域および第２の超可変領域の長さは、約１０～１０００、５０～９００、１００～８００、または２００～６００の塩基対の範囲内である。いくつかの例では、任意の定義された長さの第２の領域、自己切断型ペプチド配列、第１の可変領域に隣接する第１の相補的領域は変動する長さを含む。いくつかの例では、任意の定義された長さの第２の領域、自己切断型ペプチド配列、第１の可変領域に隣接する第１の相補的領域の長さは、少なくとも、あるいは約１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、５２５、５５０、５７５、６００、６２５、６５０、６７５、７００、７２５、７５０、７７５、８００、８２５、８５０、８７５、９００、１０００、または１０００より多くの塩基長である。いくつかの例では、任意の定義された長さの第２の領域、自己切断型ペプチド配列、第１の可変領域に隣接する第１の相補的領域の長さは、約１０～１０００、５０～９００、１００～８００、または２００～６００の塩基対の範囲内である。いくつかの例では、固定された可変性の第１の領域は、少なくとも、あるいは約１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、または１００より多くの塩基対を含む。いくつかの例では、バーコードは、少なくともあるいは約１、５、１０、１５、２０、２５、３０、３５、４０、４５、５０、または５０より多くの塩基対を含む。その後、遺伝子断片（５６１）は、プライマー（５８１）および（５８３）で配列決定され、およびサンプルは、遺伝子断片（５６５）を生成するためにバーコード（５６３）を有して識別されます。遺伝子断片（５６５）は、その後、ダイヤルアウトＰＣＲ（ｄｉａｌ－ｏｕｔＰＣＲ）および最終ベクター（５６９）中への酵素ベースアセンブリ（５６７）にかけられる。

【0026】

各々の変異体の特異的な集団を使用する例示的なプロセスは、図６で見られる。遺伝子断片（６３１）は、固定された可変性の第２の領域（１０９’）、それに続く第２の超可変領域（１１０）、第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第１の超可変領域（１０２）、およびユニバーサルプライマー（２１１’）を含んで合成される。いくつかの例では、第１の超可変領域はＣＤＲを含む。いくつかの例では、第２の超可変領域はＣＤＲを含む。いくつかの例では、ＣＤＲはＣＤＲ３である。いくつかの例では、制限エンドヌクレアーゼ部位は、ＴＩＩＳ－ＲＥ部位である。遺伝子断片（６３１）は、遺伝子断片（６３５）を生成するために、組み合わされ、および第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）を含む遺伝子断片（６３３）の集団でＰＣＲ増幅される（６１３）。遺伝子断片（６３５）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第１の超可変領域（１０６）、およびユニバーサルプライマー（２１１’）を含む。遺伝子断片（６３５）は、遺伝子断片（６３９）を生成するために、その後、第２の可変領域に隣接する第２の相補的領域（１０８）および第２の可変定常セグメント（２１１）を含む目的ベクター（６３７）へとアセンブルされる（６１４）。遺伝子断片（６３９）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、第１の制限エンドヌクレアーゼ部位（１１２Ａ）、第１の超可変領域（１０２）、および第２の可変定常セグメント（２１１）を含む。遺伝子断片（６４１）は、合成され、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、および第１の可変領域（１０６）を含む。遺伝子断片（６３９）および遺伝子断片（６４１）は、最終構築物（６４３）を生成するために、任意の定義された長さの第２の領域（２０３）を挿入するためにアセンブルされる（６１５）。最終構築物（６４３）は、第２の可変領域に隣接する第２の相補的領域（１０８）、それに続く第２の可変領域（１０９）、第２の超可変領域（１１０）、任意の定義された長さの第２の領域（２０３）、自己切断型ペプチド配列（１０４）、第１の可変領域に隣接する第１の相補的領域（１０５）、第１の可変領域（１０６）、第１の超可変領域（１０２）、および第２の可変定常セグメント（２１１）を含む。いくつかの例では、生成された最終構築物の数は、約１００００である。いくつかの例では、生成された最終構築物の数は、約１０００、２０００、５０００、８０００、１００００、１５，０００、２０，０００、１００，０００、または約１，０００，０００である。いくつかの例では、生成された最終構築物の数は、少なくとも１０００、２０００、５０００、８０００、１００００、１５，０００、２０，０００、１００，０００、または１，０００，０００である。

【0027】

本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さな核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、オーバーラップ領域、超可変領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、第１の定常配列、第１の可変配列、および第１の配列は、合成され、第１の複数の遺伝子断片を生成するためにその後、ポリメラーゼ連鎖アセンブリ（ＰＣＡ）にかけられる。いくつかの例では、第１の定常配列は、リーダー配列である。いくつかの例では、第２の配列は、ＣＤＲである。いくつかの例では、第１の定常配列は、リーダー配列であり、かつ第２の配列はＣＤＲである。いくつかの例では、第２の定常配列、第２の可変配列、および第２の配列は、合成され、第２の複数の遺伝子断片を生成するためにその後、ＰＣＲまたはＰＣＡにかけられる。いくつかの例では、第２の定常配列は、リーダー配列である。いくつかの例では、第２の配列は、ＣＤＲである。いくつかの例では、第３の定常領域、それに続く第１の相補的配列を含む第３の複数の遺伝子断片、および可変定常セグメントを含む第４の複数の遺伝子断片が合成される。いくつかの例では、第１の相補的配列は、１つ以上の可変領域に隣接する配列の相補的な領域を含む。いくつかの例では、第１の相補的配列は、２０－６０ｂｐ、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、あるいは４０－６０ｂｐの領域を含む。いくつかの例では、第１の相補的配列は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５のｂｐ領域を含む。いくつかの例では、第１の相補的配列は、約４０ｂｐの領域を含む。いくつかの例では、第１の相補的配列は、自己切断型ペプチドを含む。いくつかの例では、自己切断型ペプチド配列はＰ２Ａである。いくつかの例では、第３の複数の遺伝子断片および第４の複数の遺伝子断片は、第１の複数の遺伝子断片および第２の複数の遺伝子断片とそれに続くＰＣＲに追加される。随意に、エラー修正反応は実施される。いくつかの例では、結果として生じる構築物は、プールされ、クローン化され、および次世代の配列決定にかけられる。いくつかの例では、結果として生じる構築物は、１つ以上の遺伝子を含む。いくつかの例では、結果として生じる構築物は、免疫グロブリン、またはその断片を含む。

【0028】

本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さな核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、超可変領域、オーバーラップ領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、核酸断片は遺伝子断片を含む。いくつかの例では、断片は、少なくとも５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または少なくとも２０，０００の塩基長である。いくつかの例では、断片は、５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００以下、または２０，０００以下の塩基長である。いくつかの例では、断片は、約５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または約２０，０００の塩基長である。いくつかの例では、断片は、５０～５０００、５０～１０００、５０～５００、５０～２５０、１００～５００、２００～１０００、５００～１０，０００、５００～５，０００、１０００～８０００、または１５００～１０，０００の塩基長である。核酸断片は、第１の可変領域の変異体を含んで合成され、固定された変動性の領域を含む断片で増幅される。いくつかの例では、固定された可変性の領域は、第１に複数の断片を生成するために第１の可変領域に相補的領域および第１の超可変領域を含む。いくつかの例では、第１の超可変領域はＣＤＲおよびＪセグメントを含む。いくつかの例では、固定された可変性の領域は、２０－６０塩基対（ｂｐ）、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、または４０－６０ｂｐの領域を含む。いくつかの例では、固定された可変性の領域は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５のｂｐ領域を含む。いくつかの例では、固定された可変性の領域は、約４０ｂｐの領域を含む。断片は、第２の可変領域の変異体含んで合成され得、第２の複数の断片を生成するために、第２のＣＤＲおよびＪセグメントを含む断片で増幅され得る。第３の複数の断片は、定常領域、可変領域に隣接する第１の相補的領域、第１のリーダー配列、および第２の可変領域および第２のＣＤＲおよびＪセグメントに相補的な第２の相補的領域を含んで合成され得る。いくつかの例では、第１の相補的配列は、２０－６０ｂｐ、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、あるいは４０－６０ｂｐの領域を含む。いくつかの例では、第１の相補的配列は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５のｂｐ領域を含む。いくつかの例では、第１の相補的配列は、約４０ｂｐの領域を含む。いくつかの例では、第２の相補的配列は、２０－６０ｂｐ、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、あるいは４０－６０ｂｐの領域を含む。いくつかの例では、第２の相補的配列は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５のｂｐ領域を含む。いくつかの例では、第２の相補的配列は、約４０ｂｐの領域を含む。定常領域は構築物サイズのために調節される場合がある。いくつかの例では、定常領域は、少なくとも５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または少なくとも２０，０００の塩基長である。いくつかの例では、定常領域は、５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００以下、または少なくとも２０，０００以下の塩基長である。いくつかの例では、定常領域は、約５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または約２０，０００の塩基長である。いくつかの例では、定常領域は、５０～５０００、５０～１０００、５０～５００、５０～２５０、１００～５００、２００～１０００、５００～１０，０００、５００～５，０００、１０００～８０００、または１５００～１０，０００の塩基長さである。いくつかの例では、第１の複数の断片は、第２の複数の断片および第３の複数の断片は、酵素学的ベースアセンブリ方法を使用して、アセンブルされ、ＰＣＲ精製され、プールされる。いくつかの例では、実質的に、全ての非アセンブルの断片は、精製され出される。いくつかの例では、非アセンブルの断片の少なくとも９０％、９５％、９７％、９８％、９９％、９９．５％、９９．９％、または少なくとも９９．９９％は、精製され出される。いくつかの例では、最終構築物は、大きい核酸へとクローン化される。いくつかの例では、大きい核酸はベクターである。

【0029】

本明細書に記載されるのは、核酸配列アセンブリのためのデノボ合成の方法である。そのような方法は、いくつかの例では、より小さい核酸断片のアセンブリに使用される。いくつかの例では、核酸断片は、定常領域、可変領域、超可変領域、オーバーラップ領域、バーコード、ペプチド切断部位のためにコードする領域、遺伝子または遺伝子の断片のためにコードする領域、制限部位、または他の領域を含む。いくつかの例では、核酸断片は遺伝子断片を含む。いくつかの例では、遺伝子断片は変異体遺伝子断片である。いくつかの例では、第１の可変領域を含む断片が合成される。いくつかの例では、断片は、少なくとも５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１００００、または少なくとも２００００の塩基の長さである。いくつかの例では、断片は、５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００以下、または２０，０００以下の塩基長である。いくつかの例では、断片は、約５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または約２０，０００の塩基長である。いくつかの例では、断片は、５０～５０００、５０～１０００、５０～５００、５０～２５０、１００～５００、２００～１０００、５００～１０，０００、５００～５，０００、１０００～８０００、または１５００～１０，０００の塩基長さである。いくつかの例では、断片は、第１の複数の遺伝子断片を生成するために第１の超可変のセグメントで増幅される。いくつかの例では、第２の可変領域を含む断片の別のセットが合成される。いくつかの例では、断片の別のセットは、第２の複数の遺伝子断片を生成するために第２の超可変のセグメントで増幅される。いくつかの例では、超可変セグメントはＣＤＲ３およびＪセグメントを含む。いくつかの例では、第１の超可変のセグメントに相同的配列、それに続く定常領域、相補的配列、第１のリーダー配列、および第２の可変領域に相補的領域を含む第３の複数の遺伝子断片が合成される。いくつかの例では、第２の可変領域に相補的領域は、２０－６０ｂｐ、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、または４０－６０の長さである。いくつかの例では、第２の可変領域に相補的な領域は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５ｂｐの長さである。いくつかの例では、第１の相補的配列は、１つ以上の可変領域に隣接する配列の相補的領域を含む。いくつかの例では、第１の相補的配列は、２０－６０ｂｐ、１０－２０ｂｐ、１５－４５ｂｐ、２０－６０ｂｐ、３０－４０ｂｐ、３０－６０ｂｐ、または４０－６０ｂｐの領域を含む。いくつかの例では、第１の相補的配列は、約１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、または６５のｂｐ領域を含む。いくつかの例では、第１の相補的配列は、約４０ｂｐの領域を含む。いくつかの例では、第１の相補的配列は、自己切断型ペプチドを含む。いくつかの例では、自己切断型ペプチド配列はＰ２Ａである。いくつかの例では、第３の複数の核酸は、１０～１０００、１００～５００、５０～５，０００、５０～１０，０００、１００～１０００、２００～１０００、５００～１０，０００、または１０００～１０，０００の変異体を含む。いくつかの例では、第１の複数の遺伝子断片、第２の複数の遺伝子断片と第３の複数の遺伝子断片はアセンブルされる。いくつかの例では、第１の複数の遺伝子断片、第２の複数の遺伝子断片と第３の複数の遺伝子断片は、アセンブルされ、そして目的ベクターへとクローン化される。いくつかの例では、最終構築物は、第２のリーダー配列、それに続く第２の可変領域、第２の超可変セグメント、第２の定常領域、第１の相補的配列、第１のリーダー配列、第１の可変領域、第１の超可変セグメント、および可変定常領域を含む。

【0030】

本明細書に提供されるのは、アセンブリ用の遺伝子断片または遺伝子が、相同性配列を含む、核酸アセンブリのための方法である。いくつかの例では、相同性核酸は、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、または１００を超える塩基対を含む。いくつかの例では、塩基対の数は４０の塩基対である。いくつかの例では、塩基対の数は、約５～１００、１０～９０、２０～８０、３０～７０、または４０～６０の塩基対の範囲内である。

【0031】

本明細書に記載される遺伝子断片は、相同性配列を含む場合がある。いくつかの例では、アセンブリ用の遺伝子断片、または遺伝子は、１つ以上の相同性配列を含む。いくつかの例では、１つ以上の相同性配列は、高多様性の領域である。いくつかの例では、１つ以上の相同性配列は、可変領域に相補的である。いくつかの例では、１つ以上の相同性配列は、超可変領域である。

【0032】

本明細書に提供されるのは、アセンブリ用の遺伝子断片または遺伝子が、バーコードを含む、核酸合成のための方法である。いくつかの例では、バーコードは、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、または１００を超える塩基対を含む。いくつかの例では、バーコードは制限酵素によって認識される。いくつかの例では、制限酵素は、非対称的なＤＮＡ配列を認識する。いくつかの例では、遺伝子断片の第１の集団および遺伝子断片の第２の集団は、各集団の核酸の切断後に、第１の集団および第２の集団が互いにアニールすることができるように、相補的なバーコード配列を有するように設計されている。

【0033】

様々な制限酵素および制限部位は、本明細書に使用されてもよい。いくつかの例では、制限酵素は、エンドヌクレアーゼである。いくつかの例では、制限酵素は回文配列を認識し、認識配列内に両方の鎖を対称的に切断する。いくつかの例では、制限酵素は、非対称的な核酸配列を認識し、認識配列外の両方の核酸鎖を切断する。いくつかの例では、エンドヌクレアーゼは、ＩＩ型エンドヌクレアーゼである。例示的なＩＩ型エンドヌクレアーゼは、ＨｈａＩ、ＨｉｎｄＩＩＩ、ＮｏｔＩ、ＢｂｖＣＩ、ＥｃｏＲＩとＢｇｌＩを含むが、それらに限定されない。いくつかの例では、エンドヌクレアーゼは、ＩＩＳ型エンドヌクレアーゼである。例示的なＩＩＳ型エンドヌクレアーゼは、ＡｃｕＩ、ＡｌｗＩ、ＢａｅＩ、ＢｂｓＩ、ＢｂｖＩ、ＢｃｃＩ、ＢｃｅＡＩ、ＢｃｇＩ、ＢｃｉＶＩ、ＢｃｏＤＩ、ＢｆｕＡＩ、ＢｍｒＩ、ＢｐｍＩ、ＢｐｕＥＩ、ＢｓａＩ、ＢｓａＸＩ、ＢｓｅＲＩ、ＢｓｇＩ、ＢｓｍＡＩ、ＢｓｍＢＩ、ＢｓｍＦＩ、ＢｓｍＩ、ＢｓｐＣＮＩ、ＢｓｐＭＩ、ＢｓｐＱＩ、ＢｓｒＤＩ、ＢｓｒＩ、ＢｔｇＺＩ、ＢｔｓＣＩ、ＢｔｓＩ、ＢｔｓＩＭｕｔＩ、ＣｓｐＣＩ、ＥａｒＩ、ＥｃｉＩ、Ｅｓｐ３Ｉ、ＦａｕＩ、ＦｏｋＩ、ＨｇａＩ、ＨｐｈＩ、ＨｐｙＡＶ、ＭｂｏＩＩ、ＭｌｙＩ、ＭｍｅＩ、ＭｎｌＩ、ＮｍｅＡＩＩＩ、ＰｌｅＩ、ＳａｐＩおよびＳｆａＮＩを含むが、それらに限定されない。

【0034】

本明細書に記載されているような方法は、いくつかの実施形態では、自己切断型ペプチドをコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、自己切断型ペプチドは、２Ａペプチドである。いくつかの例では、２Ａペプチドは、Ｔ２Ａ、Ｐ２Ａ、Ｅ２Ａ、またはＦ２Ａである。いくつかの例では、この２ＡペプチドはＰ２Ａである。

【0035】

本明細書に提供されるのは、超可変領域をコードする遺伝子、または遺伝子断片から核酸を合成する方法である。いくつかの例では、超可変領域は相補性決定領域（ＣＤＲ）である。いくつかの例では、ＣＤＲは、ＣＤＲ１、ＣＤＲ２、またはＣＤＲ３である。いくつかの例では、ＣＤＲは、ＣＤＲ－Ｈ１、ＣＤＲ－Ｈ２およびＣＤＲ－Ｈ３を含むが、これらに限定されない重ドメインである。いくつかの例では、ＣＤＲは、ＣＤＲ－Ｌ１、ＣＤＲ－Ｌ２およびＣＤＲ－Ｌ３を含むが、これらに限定されない軽ドメインである。

【0036】

ＣＤＲ領域は、変動する長さを有する場合がある。いくつかの例では、ＣＤＲ領域は、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、または４００を超える塩基対を含む。いくつかの例では、ＣＤＲ領域は、約１００の塩基対を含む。

【0037】

本明細書に記載される組成物および方法は、ＣＤＲ、または他の配列などの抗原結合配列を含む遺伝子、または遺伝子断片を含む場合がある。いくつかの例では、遺伝子断片または遺伝子は、ＣＤＲ領域およびＶセグメント、Ｄセグメント、Ｊセグメント、またはその組み合わせをコードする。いくつかの例では、遺伝子断片または遺伝子は、ＣＤＲ領域およびＶセグメントを含む。いくつかの例では、ＣＤＲ領域およびＶセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、または４００を超える塩基対を含む。いくつかの例では、遺伝子断片または遺伝子は、ＣＤＲ領域およびＤセグメントを含む。いくつかの例では、ＣＤＲ領域およびＤセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、または４００を超える塩基対を含む。いくつかの例では、遺伝子断片または遺伝子は、ＣＤＲ領域およびＪセグメントを含む。いくつかの例では、ＣＤＲ領域およびＪセグメントを含む遺伝子断片または遺伝子は、少なくとも、あるいは約５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、または４００を超える塩基対を含む。いくつかの例では、ＣＤＲは、ＣＤＲ１、ＣＤＲ２、またはＣＤＲ３である。いくつかの例では、ＣＤＲはＣＤＲ３である。

【0038】

本明細書に記載されているような方法は、いくつかの実施形態では、可変領域をコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、可変領域は免疫グロブリンのものである。いくつかの例では、複数の変異体可変領域が合成される。いくつかの例では、少なくとも、あるいは約１０、１０１、１０２、１０３、１０４、１０５、１０６、または１０６を超える変異体可変領域が合成される。いくつかの例では、少なくとも、あるいは約１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、または、２００を超える変異体可変領域が合成される。

【0039】

本明細書に記載されているような方法は、いくつかの実施形態では、任意の定義された長さの領域をコードする遺伝子、または遺伝子断片から核酸を合成する工程を含む。いくつかの例では、任意の定義された長さの領域は定常領域である。いくつかの例では、定常領域は免疫グロブリンのものである。いくつかの例では、少なくとも、あるいは約１０、１０１、１０２、１０３、１０４、１０５、１０６、または１０６を超える任意の定義された長さの変異体領域が合成される。いくつかの例では、少なくとも、あるいは約１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、または、２００を超える任意の定義された長さの変異体領域が合成される。いくつかの例では、定常領域は、少なくとも５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または少なくとも２０，０００の塩基長である。いくつかの例では、定常領域は、５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００以下、または２０，０００以下の塩基長である。いくつかの例では、定常領域は、約５０、７５、１００、１２５、１５０、１７５、２００、２５０、５００、８００、１０００、２０００、５０００、８０００、１０，０００、または約２０，０００の塩基長である。いくつかの例では、定常領域は、５０－５０００、５０－１０００、５０－５００、５０－２５０、１００－５００、２００－１０００、５００－１０，０００、５００－５，０００、１０００－８０００、または１５００－１０，０００の塩基長である。

【0040】

本明細書に提供されるのは、多数の遺伝子断片がアセンブルされる、核酸アセンブリのための方法である。いくつかの例では、遺伝子断片は、前進的にまたは順次にアセンブルされる。いくつかの例では、遺伝子断片はベクターへとアセンブルされる。いくつかの例では、遺伝子断片は、長い線状遺伝子アセンブリのためにアセンブルされる。いくつかの例では、遺伝子断片の数は、少なくとも、あるいは約２、３、４、５、６、７、８、９、１０、または１０を超える遺伝子断片である。いくつかの例では、遺伝子断片の数は、少なくとも、あるいは約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、または２０を超える遺伝子断片である。いくつかの例では、遺伝子断片の数は、約１～２、１～３、１～４、１～５、１～６、１～７、１～８、１～９、１～１０、２～３、２～４、２～５、２～６、２～７、２～８、２～９、２～１０、３～４、３～５、３～６、３～７、３～８、３～９、３～１０、４～５、４～６、４～７、４～８、４～９、４～１０、５～６、５～７、５～８、５～９、５～１０、６～７、６～８、６～９、６～１０、７～８、７～９、７～１０、８～９、８～１０、または９～１０の範囲内である．
いくつかの例では、遺伝子断片の数は、約１～約２０、約２～約１８、約３～約１７、約４～約１６、約６～約１４、または約８～約１２である。

【0041】

本明細書に提供されるのは、アセンブルされた遺伝子断片の比率が、約０．２：１、０．２５：１、０．５：１、０．７５：１、１：１、１：１．５、１：２、１：３、１：４、１：５、または１：５を超える比率である、核酸アセンブリのための方法である。例えば、２つの遺伝子断片がアセンブルされる場合、第２の遺伝子断片に対する第１の遺伝子断片の比率は、１：１である。いくつかの例では、第２の遺伝子断片に対する第１の遺伝子断片の比率は、少なくとも、あるいは約１：１、１：０．９、１：０．８５、１：０．８、１：０．７５、１：０．７、１：０．６５、１：０．６、１：０．５５、１：０．５、１：０．４５、１：０．４、１：０．３５、１：０．３、１：０．２５、１：０．２、１：０．１５、１：０．１、または１：０．１未満である。

【0042】

核酸アセンブリのための本明細書に記載されているような方法は、ベクターへの１つ以上の遺伝子断片のアセンブリを含む場合があり、ここで、ベクターに対する１つ以上の遺伝子断片の比率は変動する。いくつかの例では、ベクターに対する１つ以上の遺伝子断片の比率は、少なくとも、あるいは約０．２：１、０．２５：１、０．５：１、０．７５：１、１：１、１：１．５、１：２、１：３、１：４、１：５、または１：５を超える比率である。いくつかの例では、ベクターに対する１つ以上の遺伝子断片の比率は、少なくとも、あるいは約１：１、１：０．９、１：０．８５、１：０．８、１：０．７５、１：０．７、１：０．６５、１：０．６、１：０．５５、１：０．５、１：０．４５、１：０．４、１：０．３５、１：０．３、１：０．２５、１：０．２、１：０．１５、１：０．１、または１：０．１未満である。

【0043】

核酸アセンブリのための本明細書に記載されているような方法は、ベクターへのアセンブリのためのポリヌクレオチド集団のアセンブリを含む場合がある。いくつかの例では、ポリヌクレオチド集団のアセンブリのためにＰＣＲが実施される。いくつかの例では、ポリヌクレオチド集団は、少なくとも、あるいは約２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、２００、または２００を超えるポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド集団は、少なくとも、あるいは約５０、１００、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１０００、１１００、１３００、１４００、１５００、１６００、１７００、１８００、２０００、２４００、２６００、２８００、３０００、３２００、３４００、３６００３８００、４０００、４２００、４４００、４８００、４６００、５０００、６０００、７０００、８０００、９０００、１００００、２００００、３００００、４００００、５００００、６００００、７００００、８００００、９００００、１０００００、または１０００００を超える塩基を含む長い核酸を生成するためにアセンブルされる。

【0044】

核酸アセンブリ、いくつかの実施形態では、免疫グロブリンをコードする核酸の生成を引き起こす。いくつかの実施形態では、免疫グロブリンは抗体である。本明細書で使用されるように、抗体という用語は、典型的な抗体分子の特徴的な二アームのＹ字型、ならびに抗原に特異的に結合する能力を保持する抗体の１つ以上の断片を有するタンパク質を含むと理解される。例示的な抗体は、モノクローナル抗体、ポリクローナル抗体、二重特異性の抗体、多特異性抗体、グラフト抗体、ヒト抗体、ヒト化抗体、合成抗体、キメラ抗体、ラクダに化抗体、単鎖Ｆｖｓ（ｓｃＦｖ）（ＶＬおよびＶＨ領域がペアになって、一本鎖ＦａｂおよびｓｃＦａｂを含む一価分子を形成する単一のタンパク質鎖としてそれらを作ることを可能にする合成または天然リンカーによる組換え法を使用してＶＬおよびＶＨが結合されるフラグメントを含む）単鎖抗体、ＦＡｂ断片（ＶＬ、ＶＨ、ＣＬおよびＣＨ１ドメインを含む一価断片を含む）、Ｆ（ａｂ′）２断片（ヒンジ領域においてジスルフィドブリッジによってリンクされる２つのＦＡｂフラグメントを含む二価断片を含む）、Ｆｄ断片（ＶＨおよびＣＨ１断片を含む断片を含む）、Ｆｖ断片（抗体の単一アームのＶＬおよびＶＨのドメインを含む断片を含む）単一ドメイン抗体（ｄＡｂまたはｓｄＡｂ）（ＶＨドメインを含む断片を含む）、単離された相補性決定領域（ＣＤＲ）、二特異性抗体（２つの異なる抗原を認識する互いに結合される２つのＶＬおよびＶＨのドメインなどの二価二量体を含む断片を含む）、単量体可変ドメインのみで構成される断片、ジスルフィド連結されたＦｖｓ（ｓｄＦｖ）、イントラボディ、抗イディオタイプ（抗Ｉｄ）の抗体、またはそのａｂ抗原結合性断片を含むが、それらに限定されない。いくつかの例では、本明細書に開示されるライブラリは、スキャフォールドのためのコードする核酸を含み、ここで、スキャフォールドは、完全な抗原認識および抗原結合部位を含有している最小の抗体断片で構成されるＦｖ抗体を含むＦｖ抗体である。いくつかの実施形態では、Ｆｖ抗体は、緊密な非共有結合の１つの重鎖と１つの軽鎖可変ドメインの二量体で構成され、各可変ドメインの３つの超可変領域が相互作用して、ＶＨ－ＶＬ二量体の表面に抗原結合部位を定義する。いくつかの実施形態では、６つの超可変領域が抗体に対する抗原結合特異性を与える。いくつかの実施形態では、単一の可変ドメイン（または、ＶＨＨ抗体またはナノボディなどの１つの重鎖可変ドメインを含むラクダ科動物から単離された単一ドメイン抗体を含む、抗原に特異的な３つの超可変領域のみを含むＦｖの半分）は、抗原を認識して結合する能力を有する。いくつかの例では、本明細書に開示されるライブラリは、スキャフォールドのためのコードする核酸を含み、ここで、スキャフォールドは、単鎖ＦｖまたはｓｃＦｖであり、ＶＨ、ＶＬ、またはＶＨドメインとＶＬドメインの両方を含む抗体フ断片を含み、両方のドメインが単一のポリペプチド鎖に存在する。いくつかの実施形態では、Ｆｖポリペプチドは、ｓｃＦｖが抗原結合に所望される構造を形成することを可能にする、ＶＨ及びＶＬのドメインの間にポリペプチドリンカーをさらに含む。いくつかの例では、ｓｃＦｖはＦｃ断片にリンクされ、あるいはＶＨＨはＦｃ断片（ミニボディを含む）にリンクされる。いくつかの例では、抗体は、免疫グロブリン分子、および免疫学的に活性断片の免疫グロブリン分子、例えば、抗原結合部位を含有している分子を含む。免疫グロブリン分子は、任意のタイプ（例えば、ＩｇＧ、ＩｇＥ、ＩｇＭ、ＩｇＤ、ＩｇＡおよびＩｇＹ）、クラス（例えば、ＩｇＧ１、ＩｇＧ２、ＩｇＧ３、ＩｇＧ４、ＩｇＡ１およびＩｇＡ２）、またはサブクラスのものである。

【0045】

核酸アセンブリのための本明細書に記載されているような方法は、個々の反応において遺伝子断片の合成を含む場合がある。いくつかの例では、遺伝子断片の合成の後に、多重遺伝子アセンブリが行われる。いくつかの例では、多重遺伝子アセンブリは、少なくとも、あるいは約２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１０００、２０００年、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、２００００、４００００、または４００００を超える配列、あるいは遺伝子断片がアセンブルされる結果をもたらす。いくつかの例では、少なくとも、あるいは約１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、または１００を超える遺伝子がアセンブルされる。いくつかの例では、多重遺伝子アッセンブリは、少なくとも、あるいは約２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、または８００を超える塩基対（ｂｐ）のアセンブリを引き起こす。

【0046】

本明細書に記載されているような方法を利用する核酸アセンブリは、低エラー率、低ドロップアウト率、低暴走、低パーセンテージのキメラ遺伝子、またはそれらの組み合わせを含む核酸のライブラリの結果をもたらす場合がある。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、ライブラリ全体にわたって、またはライブラリの８０％、８５％、９０％、９３％、９５％、９６％、９７％、９８％９９％９９．５％９９．８％９９．９％９９．９５％９９．９８％９９．９９％、またはそれ以上にわたって、塩基の挿入、欠失、置換、あるいは１／３００、１／４００、１／５００、１／６００、１／７００、１／８００、１／９００、１／１０００、１／１２５０、１／１５００、１／２０００、１／２５００、１／３０００、１／４０００、１／５０００、１／６０００、１／７０００、１／８０００、１／９０００、１／１００００、１／１２０００、１／１５０００、１／２００００、１／２５０００、１／３００００、１／４００００、１／５００００、１／６００００、１／７００００、１／８００００、１／９００００、１／１０００００、１／１２５０００、１／１５００００、１／２０００００、１／３０００００、１／４０００００、１／５０００００、１／６０００００、１／７０００００、１／８０００００、１／９０００００、１／１００００００未満、またはそれ以下である合計のエラー率を含む。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、１．０％未満、１．５％未満、２．０％未満、２．５％未満、３．０％未満、３．５％未満、４．０％未満、４．５％未満、５．０％未満、６．０％未満、６．５％未満、７．０％未満、７．５％未満、８．０％未満、８．５％未満、９．０％未満、９．５％未満、または１０％未満のＡＴドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、１．０％未満、１．５％未満、２．０％未満、２．５％未満、３．０％未満、３．５％未満、４．０％未満、４．５％未満、または５．０％未満のＡＴドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、１．０％未満、１．５％未満、２．０％未満、２．５％未満、３．０％未満、３．５％未満、４．０％未満、４．５％未満、５．０％未満、６．０％未満、６．５％未満、７．０％未満、７．５％未満、８．０％未満、８．５％未満、９．０％未満、９．５％未満、または１０％未満のＧＣドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、１．０％未満、１．５％未満、２．０％未満、２．５％未満、３．０％未満、３．５％未満、４．０％未満、４．５％未満、または５．０％未満のＧＣドロップアウトの結果をもたらす。いくつかの例では、本明細書に記載されているような方法を利用してアセンブルされた核酸のライブラリは、最大で１．０％、１．５％、２．０％、２．５％、３．０％、３．５％、４．０％、４．５％、５．０％、６．０％、６．５％、７．０％、７．５％、８．０％、８．５％、９．０％、９．５％、または１０％のキメラ遺伝子を含む。

【0047】

核酸アセンブリのために本明細書に記載されているような方法は、１つ以上の遺伝子断片の酵素学的ベースのアセンブリを含む場合がある。いくつかの例では、酵素学的媒介の核酸アセンブリは、遺伝子断片に相同的な配列の添加を含む。いくつかの例では、デノボ合成遺伝子断片は、相同性配列を既に含む。いくつかの例では、酵素学的媒介された核酸アセンブリは、酵素学的混合物の使用を含む。いくつかの例では、酵素学的混合物はエンドヌクレアーゼを含む。いくつかの例では、酵素学的混合物は、随意にエキソヌクレアーゼ、ポリメラーゼ、またはリガーゼを含む。いくつかの例では、酵素学的混合物は、エキソヌクレアーゼ、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む。いくつかの例では、酵素学的混合物は、エンドヌクレアーゼ、ポリメラーゼおよびリガーゼを含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、酵素学的媒介した核酸アセンブリは、効率を向上させる。いくつかの例では、酵素学的混合物は、制限酵素でない酵素を含む。いくつかの例では、酵素学的混合物は、構造特異的酵素である酵素を含む。いくつかの例では、酵素学的混合物は、構造特異的酵素かつ配列特異的でない酵素である酵素を含む。

【0048】

酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、エキソヌクレアーゼ活性を含む酵素を使用して、核酸と接触させる工程を含む。いくつかの例では、エキソヌクレアーゼは、３’エキソヌクレアーゼ活性を含む。３’エキソヌクレアーゼ活性を含む例示的なエキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩＩ、およびエキソヌクレアーゼＴを含むが、それらに限定されない。いくつかの例では、エキソヌクレアーゼは、５’エキソヌクレアーゼ活性を含む。５’エキソヌクレアーゼ活性を含む例示的なエキソヌクレアーゼは、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、Ｔ５エキソヌクレアーゼ、およびＴ７エキソヌクレアーゼを含むが、それらに限定されない。いくつかの例では、エキソヌクレアーゼは、エキソヌクレアーゼＩＩＩ（ＥｘｏＩＩＩ）である。エキソヌクレアーゼは、野生型エキソヌクレアーゼおよび誘導体、キメラ、および／またはその突然変異体を含む。突然変異体エキソヌクレアーゼは、エキソヌクレアーゼのアミノ酸または核酸配列内の１つ以上の突然変異、挿入、欠失、またはその任意の組み合わせを含む酵素を含む。

【0049】

いくつかの例では、エキソヌクレアーゼは、酵素活性のために最適な温度、例えば、約２５－８０°Ｃ、２５－７０°Ｃ、２５－６０°Ｃ、２５－５０°Ｃ、または２５－４０ °Ｃの範囲内の温度で使用される。いくつかの例では、温度は約３７℃である。いくつかの例では、温度は約５０℃である。いくつかの例では、温度は約５５℃である。いくつかの例では、温度は約６５℃である。いくつかの例では、温度は、少なくとも、あるいは約１５°Ｃ、２０°Ｃ、２５°Ｃ、３０°Ｃ、３５°Ｃ、４０°Ｃ、４５°Ｃ、５０°Ｃ、５ °Ｃ、６０°Ｃ、６５°Ｃ、７０°Ｃ、７５°Ｃ、８０°Ｃ、または８０°Ｃを超える温度である。

【0050】

いくつかの例では、酵素学的媒介した核酸アセンブリのための方法は、エキソヌクレアーゼの使用を含まない。いくつかの例では、酵素学的媒介した核酸アセンブリのための方法は、エキソヌクレアーゼの使用を含む。いくつかの例では、１つ以上のエキソヌクレアーゼが使用される。例えば、少なくとも、あるいは約１、２、３、４、５、６、または６を超えるエキソヌクレアーゼが使用される。いくつかの例では、エキソヌクレアーゼは、５’～３’のエキソヌクレアーゼ活性を含む。いくつかの例では、エキソヌクレアーゼは、３’～５’のエキソヌクレアーゼ活性を含む。いくつかの例では、方法、二本鎖ＤＮＡをエンドヌクレアーゼと接触させる工程を含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、方法は、二本鎖ＤＮＡを、フラップエンドヌクレアーゼ、リガーゼ、またはポリメラーゼと接触させる工程を含む。いくつかの例では、フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１である。

【0051】

酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、エンドヌクレアーゼ活性を含む酵素を使用して、核酸と接触させる工程を含む。いくつかの例では、エンドヌクレアーゼは、５’ヌクレアーゼ活性を含む。いくつかの例では、エンドヌクレアーゼは、３’ヌクレアーゼ活性を含む。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、フラップエンドヌクレアーゼは、５’ヌクレアーゼ活性を含む。いくつかの例では、フラップエンドヌクレアーゼは、酵素の５’ヌクレアーゼ族のメンバーである。例示的な５’ヌクレアーゼ酵素は、フラップエンドヌクレアーゼ１、エキソヌクレアーゼ１、色素性乾皮症相補群Ｇ（ＸＰＧ）、Ｄｎａ２、およびギャップエンドヌクレアーゼ１（ＧＥＮ１）を含むが、それらに限定されない。いくつかの例では、フラップエンドヌクレアーゼは、フラップエンドヌクレアーゼ１である。いくつかの例では、フラップエンドヌクレアーゼは、３’ヌクレアーゼ活性を含む。３’ヌクレアーゼ活性を有する例示的なフラップエンドヌクレアーゼは、ＲＡＧ１、ＲＡＧ２、およびＭＵＳ８１を含むが、それらに限定されない。いくつかの例では、フラップエンドヌクレアーゼは、古細菌、細菌、酵母、植物、または哺乳類のフラップエンドヌクレアーゼである。

【0052】

いくつかの例では、エンドヌクレアーゼは、酵素活性のために最適な温度、例えば、２５－８０°Ｃ、２５－７０°Ｃ、２５－６０°Ｃ、２５－５０°Ｃ、または２５－４０°Ｃの温度で使用される。いくつかの例では、温度は約５０℃である。いくつかの例では、温度は約５５℃である。いくつかの例では、温度は約６５℃である。いくつかの例では、温度は、少なくとも、あるいは約１５°Ｃ、２０°Ｃ、２５°Ｃ、３０°Ｃ、３５°Ｃ、４０°Ｃ、４５°Ｃ、５０°Ｃ、５ °Ｃ、６０°Ｃ、６５°Ｃ、７０°Ｃ、７５°Ｃ、８０°Ｃ、または８０°Ｃを超える温度である。いくつかの例では、エンドヌクレアーゼは、熱安定性エンドヌクレアーゼである。熱安定性エンドヌクレアーゼは、少なくとも、あるいは約６０°Ｃ、６５°Ｃ、７０°Ｃ、７５°Ｃ、８０°Ｃ、または８０°Ｃを超える温度で官能性であるエンドヌクレアーゼを含む場合がある。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、フラップエンドヌクレアーゼは、熱安定性フラップエンドヌクレアーゼである。

【0053】

本明細書に提供されるのは、エキソヌクレアーゼに対するエンドヌクレアーゼの比率が約０．１：１～約１：５である、核酸アセンブリのための方法である。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。いくつかの例では、エキソヌクレアーゼに対するエンドヌクレアーゼの比率は、少なくとも、あるいは約０．２：１、０．２５：１、０．５：１、０．７５：１、１：１、１：１．５、１：２、１：３、１：４、１：５、または１：５を超えるものである。いくつかの例では、エキソヌクレアーゼに対するエンドヌクレアーゼの比率は少なくともある、あるいは約１：１、１：０．９、１：０．８５、１：０．８、１：０．７５、１：０．７、１：０．６５、１：０．６、１：０．５５、１：０．５、１：０．４５、１：０．４、１：０．３５、１：０．３、１：０．２５、１：０．２、１：０．１５、１：０．１、または１：０．１未満である。

【0054】

本明細書に提供されるのは、エキソヌクレアーゼを含む核酸アセンブリのための方法であり、ここで、エキソヌクレアーゼの濃度は約０．１Ｕ～約２０Ｕ、またはそれを超えるものである。例えば、エキソヌクレアーゼの濃度は、少なくとも、あるいは約０．１Ｕ、０．２５Ｕ、０．５Ｕ、０．７５Ｕ、１Ｕ、１．６Ｕ、２Ｕ、３Ｕ、４Ｕ、５Ｕ、６Ｕ、７Ｕ、８Ｕ、９Ｕ、１０Ｕ、１２Ｕ、１４Ｕ、１６Ｕ、１８Ｕ、２０Ｕ、または２０Ｕを超えるものである。いくつかの例では、エキソヌクレアーゼの濃度は、約０．５～約１．０Ｕ範囲内である。いくつかの例では、エキソヌクレアーゼの濃度は、約１．０Ｕ～約２．０Ｕである。いくつかの例では、エキソヌクレアーゼの濃度は約１．６Ｕである。いくつかの例では、エキソヌクレアーゼの濃度は約５．０Ｕである。いくつかの例では、エキソヌクレアーゼの濃度は、約０．１Ｕ～２０Ｕ、０．２５Ｕ～１８Ｕ、０．５Ｕ～１６Ｕ、０．７５Ｕ～１４Ｕ、１Ｕ～１２Ｕ、２Ｕ～１０Ｕ、３Ｕ～９Ｕ、または４Ｕ～８Ｕである。

【0055】

本明細書に記載される酵素学的媒介した核酸アセンブリのための方法は、エンドヌクレアーゼを含む場合があり、ここで、エンドヌクレアーゼの濃度は、約０．２５Ｕ～約１２Ｕ、またはそれを超えるものである。いくつかの例では、エンドヌクレアーゼは、フラップエンドヌクレアーゼである。エンドヌクレアーゼの例示的な濃度は、少なくとも、あるいは約０．２５Ｕ、０．５Ｕ、０．７５Ｕ、１Ｕ、２Ｕ、３Ｕ、４Ｕ、５Ｕ、６Ｕ、７Ｕ、８Ｕ、９Ｕ、１０Ｕ、１１Ｕ、１２Ｕ、または１２Ｕを超えるものを含むが、それらに限定されない。いくつかの例では、エンドヌクレアーゼの濃度は０．３２Ｕである。いくつかの例では、エンドヌクレアーゼの濃度は１．６Ｕである。いくつかの例では、エンドヌクレアーゼの濃度は、約０．３２Ｕ～約４．８Ｕの範囲内である。いくつかの例では、エンドヌクレアーゼの濃度は、０．２５Ｕ～１２Ｕ、０．５Ｕ～１１Ｕ、０．７５Ｕ～１０Ｕ、１Ｕ～９Ｕ、２Ｕ～８Ｕ、３Ｕ～７Ｕ、または４Ｕ～６Ｕの範囲内である。

【0056】

本明細書に提供されるのは、核酸がポリメラーゼと混合される、酵素学的媒介した核酸アセンブリのための方法である。いくつかの例では、ポリメラーゼは、ＤＮＡポリメラーゼである。いくつかの例では、ポリメラーゼは、高忠実度ポリメラーゼである。高忠実度ポリメラーゼは、鋳型核酸の正確な複製または増幅を引き起こすポリメラーゼを含む場合がある。いくつかの例では、ＤＮＡポリメラーゼは、熱安定性ＤＮＡポリメラーゼである。ＤＮＡポリメラーゼは、ファミリーＡポリメラーゼ、ファミリーＢポリメラーゼ、ファミリーＣポリメラーゼ、ファミリーＤポリメラーゼ、ファミリーＸポリメラーゼ、およびファミリーＹポリメラーゼを含むが、これらに限定されないＤＮＡポリメラーゼの任意のファミリーからであってもよい。いくつかの例では、ＤＮＡポリメラーゼは、Ｔｈｅｒｍｕｓ、Ｂａｃｉｌｌｕｓ、Ｔｈｅｒｍｏｃｏｃｃｕｓ、Ｐｙｒｏｃｏｃｃｕｓ、Ａｅｒｏｐｙｒｕｍ、Ａｑｕｉｆｅｘ、Ｓｕｌｆｏｌｏｂｕｓ、Ｐｙｒｏｌｏｂｕｓ、またはＭｅｔｈａｎｏｐｙｒｕｓを含むが、これらに限定されない属からである。

【0057】

増幅反応に使用するための本明細書に記載されるポリメラーゼは、様々な酵素活性を含む場合がある。ポリメラーゼは、例えば、伸長産物を産生するためにプライマーを伸長するために本発明の方法で使用される。いくつかの例では、ＤＮＡポリメラーゼは、５’～３’のポリメラーゼ活性を含む。いくつかの例では、ＤＮＡポリメラーゼは、３’～５’のポリメラーゼ活性を含む。いくつかの例では、ＤＮＡポリメラーゼは校正活性を含む。例示的なポリメラーゼは、ＤＮＡポリメラーゼ（Ｉ、ＩＩ、またはＩＩＩ）、Ｔ４ＤＮＡポリメラーゼ、Ｔ７ＤＮＡポリメラーゼ、ＢｓｔＤＮＡポリメラーゼ、Ｂｃａポリメラーゼ、ＶｅｎｔＤＮＡポリメラーゼ、ＰｆｕＤＮＡポリメラーゼ、およびＴａｑＤＮＡポリメラーゼを含むが、それらに限定されない。熱安定性ＤＮＡポリメラーゼの非限定的な例は、Ｔａｑ、ＰｈｕｓｉｏｎＲＤＮＡポリメラーゼ、Ｑ５ＲＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ、ＬｏｎｇＡｍｐＲＤＮＡポリメラーゼ、ＥｘｐａｎｄＨｉｇｈＦｉｄｅｌｉｔｙポリメラーゼ、ＨｏｔＴｕｂポリメラーゼ、Ｐｗｏポリメラーゼ、Ｔｆｌポリメラーゼ、Ｔｌｉポリメラーゼ、ＵｌＴｍａポリメラーゼ、Ｐｆｕポリメラーゼ、ＫＯＤＤＮＡポリメラーゼ、ＪＤＦ－３ＤＮＡポリメラーゼ、ＰＧＢ－ＤＤＮＡポリメラーゼ、ＴｇｏＤＮＡポリメラーゼ、ＰｙｒｏｌｏｂｕｓｆｕｒｍａｒｉｕｓＤＮＡポリメラーゼ、Ｖｅｎｔポリメラーゼ、およびＤｅｅｐＶｅｎｔポリメラーゼを含むが、それらに限定されない。

【0058】

本明細書に記載されるのは、ＤＮＡポリメラーゼを含む方法であり、ここで、ＤＮＡポリメラーゼの濃度は、約０．１Ｕ～約２Ｕ、または２Ｕを超えるものである。いくつかの例では、ＤＮＡポリメラーゼの濃度は約０．１Ｕである。いくつかの例では、ＤＮＡポリメラーゼの濃度は約０．２Ｕである。いくつかの例では、ＤＮＡポリメラーゼの濃度は約０．０１Ｕである。いくつかの例では、ＤＮＡポリメラーゼの濃度は、少なくとも、または約０．００５Ｕ～２Ｕ、０．００５Ｕ～１Ｕ、０．００５Ｕ～０．５Ｕ、０．０１Ｕ～１Ｕ、０．１Ｕ～０．５Ｕ、０．１Ｕ～０．５Ｕ、０．１Ｕ～１Ｕ、０．１Ｕ～１．５Ｕ、０．１Ｕ～２Ｕ、０．５Ｕ～１．０Ｕ、０．５Ｕ～１．５Ｕ、０．５Ｕ～２Ｕ、１Ｕ～１．５Ｕ、１．０Ｕ～２．０Ｕ、または１．５Ｕ～２Ｕの範囲内である。

【0059】

本明細書に記載される方法での使用のためのＤＮＡポリメラーゼは、酵素活性のために最適な温度、例えば、２５－８０°Ｃ、２５－７０°Ｃ、２５－６０°Ｃ、２５－５０°Ｃ、または２５－４０°Ｃの温度で使用される。いくつかの例では、温度は約５０℃である。いくつかの例では、温度は約５５℃である。いくつかの例では、温度は約６５℃である。いくつかの例では、温度は、少なくとも、あるいは約１５°Ｃ、２０°Ｃ、２５°Ｃ、３０°Ｃ、３５°Ｃ、４０°Ｃ、４５°Ｃ、５０°Ｃ、５°Ｃ、６０°Ｃ、６５°Ｃ、７０°Ｃ、７５°Ｃ、８０°Ｃ、または８０°Ｃを超える温度である。

【0060】

本明細書に記載されているような酵素学的媒介した核酸アセンブリのための方法は、いくつかの実施形態では、リガーゼを使用して、核酸を処置する工程を含む。本明細書に記載されているようなリガーゼは、核酸断片を結合するために機能する場合がある。例えば、リガーゼは、隣接するＤＮＡの３’ヒドロキシル化された末端と５’リン酸化された末端を結合するように機能する。リガーゼは、大腸菌リガーゼ、Ｔ４リガーゼ、哺乳類のリガーゼ（例えば、ＤＮＡリガーゼＩ、ＤＮＡリガーゼＩＩ、ＤＮＡリガーゼＩＩＩ、ＤＮＡリガーゼＩＶ）、熱安定性リガーゼ、およびファストリガーゼ（ｆａｓｔｌｉｇａｓｅ）を含むが、それらに限定されない。いくつかの例では、リガーゼは、熱安定性リガーゼである。いくつかの例では、リガーゼはＡｍｐｌｉｇａｓｅである。

【0061】

リガーゼの濃度は変動する場合がある。いくつかの例では、リガーゼの濃度は、約０Ｕ～約２Ｕの範囲内である。リガーゼの例示的な濃度は、約０．５Ｕである。いくつかの例では、リガーゼの濃度は、約１．０Ｕである。いくつかの例では、リガーゼの濃度は、約５．０Ｕである。いくつかの例では、リガーゼの濃度は、少なくとも、あるいは約０Ｕ～０．２５Ｕ、０Ｕ～０．５Ｕ、０Ｕ～１Ｕ、０Ｕ～１．５Ｕ、０Ｕ～２Ｕ、０．２５Ｕ～０．５Ｕ、０．２５Ｕ～１．０Ｕ、０．２５Ｕ～１．５Ｕ、０．２５Ｕ～２．０Ｕ、０．５Ｕ～１．０Ｕ、０．５Ｕ～１．５Ｕ、０．５Ｕ～２．０Ｕ、１．０Ｕ～１．５Ｕ、１．０Ｕ～２．０Ｕ、または１．５Ｕ～２．０Ｕ、２．０Ｕ～４．０Ｕ、４．０Ｕ～６．０Ｕ、４．０Ｕ～８．０Ｕ、６．０Ｕ～１０．０Ｕの範囲内である。

【0062】

いくつかの例では、リガーゼは、酵素活性のために最適な温度、例えば、２５－８０°Ｃ、２５－７０°Ｃ、２５－６０°Ｃ、２５－５０°Ｃ、または２５－４０°Ｃの温度で使用される。いくつかの例では、温度は約５０℃である。いくつかの例では、温度は約５５℃である。いくつかの例では、温度は約６５℃である。いくつかの例では、温度は、少なくとも、あるいは約１５°Ｃ、２０°Ｃ、２５°Ｃ、３０°Ｃ、３５°Ｃ、４０°Ｃ、４５°Ｃ、５０°Ｃ、５°Ｃ、６０°Ｃ、６５°Ｃ、７０°Ｃ、７５°Ｃ、８０°Ｃ、または８０°Ｃを超える温度である。

【0063】

核酸アセンブリのための本明細書に記載された方法は、ライゲーション反応を含む場合がある。ライゲーション反応の１つの例は、ポリメラーゼ連鎖アセンブリ（ＰＣＡ）である。いくつかの例では、少なくともポリヌクレオチドの一部は、ユニバーサルプライマー結合のための基質である、追加された領域を含むように設計されている。ＰＣＡ反応については、あらかじめ合成されたポリヌクレオチドは、互いにオーバーラップ（例えば、重複する配列を備えた４、２０、または４０以上塩基）を含む。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニーリングされ、その後はポリメラーゼにより充填される。したがって、各サイクルは、どのポリヌクレオチドが互いに見出されるかにランダムに依存して、様々な断片の長さを増加させる。断片間の相補性は、完全な大きなスパンの二本鎖ＤＮＡの形成を可能にする。いくつかの例では、ＰＣＡ反応が完了した後、エラー修正工程が、配列のミスマッチを除去するためにミスマッチの修正の検出酵素を使用して行なわれる。

【0064】

いくつかの例では、本明細書に記載される方法は増幅反応を含む。いくつかの実施形態では、増幅反応はポリメラーゼ連鎖反応（ＰＣＲ）である。いくつかの例では、増幅反応は、ダイヤルアウトＰＣＲ（ｄｉａｌ－ｏｕｔＰＣＲ）である。いくつかの例では、増幅反応は、増幅中のユニバーサルプライマー結合配列のハイブリダイゼーションを含む。いくつかの例では、ユニバーサルプライマー結合配列は、同じ５’あるいは３’プライマーを結合することができる。いくつかの例では、ユニバーサルプライマー結合配列は、増幅反応での複数の標的核酸中で共有される。

【0065】

エラー修正工程を含み得る核酸アセンブリのための方法が、本明細書に提供される。エラー修正は、合成されたポリヌクレオチド上および／またはアセンブルされた産物上で実行されてもよい。エラー修正用の例示的な戦略は、エラーを修正するためのオーバーラップ伸長ＰＣＲによる部位特異的突然変異誘発を含み、これは、随意に、クローニングと配列決定の２以上のラウンドと連結される。ある例では、ミスマッチ、バルジ、および小ループを伴う二本鎖核酸、化学上改変された塩基および／または他のヘテロ二本鎖は、正確に合成された核酸の集団から選択的に取り除かれる。いくつかの例では、エラー修正は、二本鎖核酸内のミスマッチの塩基または不対塩基を認識し、そしてそれらに結合するか、またはそれらに隣接するタンパク質／酵素を使用して実施され、一本鎖切断または二本鎖切断が作成されるか、ストランド転移転位事象が開始される。エラー修正用のタンパク質／酵素の非限定的な例は、エンドヌクレアーゼ（Ｔ７エンドヌクレアーゼＩ、大腸菌エンドヌクレアーゼＶ、Ｔ４エンドヌクレアーゼＶＩＩ、マングビーンヌクレアーゼ、細胞、大腸菌エンドヌクレアーゼＩＶ、ＵＶＤＥ）、制限酵素、グリコシラーゼ、リボヌクレアーゼ、ミスマッチ修正酵素、リゾルバーゼ（ｒｅｓｏｌｖａｓｅｓ）、ヘリカーゼ、リガーゼ、ミスマッチに特異的な抗体、およびそれらの変異体を含む。特定のエラー修正酵素の例は、Ｔ４エンドヌクレアーゼ７、Ｔ７エンドヌクレアーゼ１、Ｓ１、マングビーンエンドヌクレアーゼ、ＭｕｔＹ、ＭｕｔＳ、ＭｕｔＨ、ＭｕｔＬ、クリベース（ｃｌｅａｖａｓｅ）、ＣＥＬＩ、およびＨＩＮＦ１を含む。いくつかの例では、ＤＮＡミスマッチ結合タンパク質ＭｕｔＳ（サーマス・アクアティカス（Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓ））は、合成された産物の集団から失敗産物を取り除くために使用される。いくつかの例では、エラー修正は、酵素のコレクターゼ（Ｃｏｒｒｅｃｔａｓｅ）を使用して実施される。いくつかの例では、エラー修正は、ヘテロ二本鎖ＤＮＡのための、既知および未知の変異および多型性をスキャンするミスマッチ特異的ＤＮＡエンドヌクレアーゼであるＳＵＲＶＥＹＯＲエンドヌクレアーゼ（Ｔｒａｎｓｇｅｎｏｍｉｃ）を使用して実施される。

【0066】

結果として生じる核酸は証明可能である。場合によっては、核酸が配列決定によって証明される。いくつかの例では、核酸は次世代シーケンシングなどのハイスループットシーケンシングによって証明される。配列決定ライブラリの配列決定は、単一分子のリアルタイム（ＳＭＲＴ）シーケンシング、ポロニーシーケンシング、ライゲーションシーケンシング、可逆的なターミネーターシーケンシング、陽子検出シーケンシング、イオン半導体シーケンシング、ナノポアシーケンシング、電子シーケンシング、パイロシーケンシング、マクサム－ギルバートシーケンシング、連鎖停止反応（例えば、サンガー）シーケンシング、＋Ｓシーケンシング、あるいは合成によるシーケンシングを含むがこれらに限定されない、任意の適切なシーケンシング技術を用いて実施可能である。

【0067】

本明細書に記載される通りの方法は、いくつかの実施形態で、結果として、少なくともあるいは約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、１０^１０、あるいは１０^１０を超える変異体を含むライブラリの生成をもたらす。いくつかの例では、少なくともあるいは約１０^１、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、あるいは１０^１０の変異体を含むライブラリの各々の変異体に対する配列が知られている。いくつかの例では、ライブラリは、変異体の予測された多様性を含む。いくつかの例では、ライブラリで表された多様性は、予測された多様性の少なくともあるいは約６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、あるいは９５％よりも高い。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約７０％である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約８０％である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約９０％である。いくつかの例では、ライブラリで表された多様性は予測された多様性の少なくともあるいは約９９％である。本明細書に記載される時、用語「予測された多様性」とは、あらゆる可能性のある変異体を含む集団中の理論的な多様性の合計を指す。

【0068】

本明細書に記載される通りの核酸アセンブリを使用する方法は、高ＧＣ含有量、直列反復配列、あるいは二次構造にもかかわらず、効率的に断片をアセンブルしてもよい。いくつかの例では、アセンブリのための断片は、少なくともまたは約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９５％よりも高いＧＣ含有量を含む。いくつかの例では、アセンブリのための断片は、少なくともまたは約１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、あるいは８０の塩基対（ｂｐ）隣接直列反復配列を含む。いくつかの例では、アセンブリのための断片は、少なくともまたは約－５、－６、－７、－８、－９、－１０、－１１、－１２、－１３、－１４、－１５、－１６、－１７、－１８、－１９、－２０、－２１、－２２、－２３、－２４、－２５、あるいは－２６ｄＧのｄＧ値を有するヘアピン構造などの二次構造を含む。いくつかの例では、アセンブリのための断片は、約－１１～約－１８ｄＧの範囲のｄＧ値を有するヘアピン構造などの二次構造を含む。

【0069】

核酸の高均一的ライブラリのアセンブリのための方法が、本明細書に提供される。場合によっては、約８０％を超える合成された核酸（ＲＮＡまたはＤＮＡ）が、核酸ライブラリの核酸表現の平均の５Ｘ以内で表わされる。場合によっては、約９０％を超える合成された核酸（ＲＮＡまたはＤＮＡ）が、核酸ライブラリの核酸表現の平均の５Ｘ以内で表わされる。場合によっては、約９０％を超える核酸が、ライブラリの核酸表現の平均の２Ｘ以内で表わされる。場合によっては、約９０％を超える核酸が、ライブラリの核酸表現の平均の１．５Ｘ以内で表わされる。場合によっては、約８０％を超える核酸が、ライブラリの核酸表現の平均の１．５Ｘ以内で表わされる。

【0070】

本明細書に記載される方法によってアセンブルされた核酸ライブラリは、あらかじめ定められた配列と比較して、高割合の正確な配列を含む。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、７０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、７５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、８０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、８５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、９０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、９５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、あらかじめ定められた配列と比較して、１００％を超える正確な配列を有する。

【0071】

いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、７０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、７５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、８０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、８５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、９０％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、９５％を超える正確な配列を有する。いくつかの例では、本明細書に開示される核酸ライブラリは、増幅反応後に、あらかじめ定められた配列と比較して、１００％を超える正確な配列を有する。

【0072】

増幅後に高均一性を有する核酸ライブラリが、本明細書に提供される。いくつかの例では、８０％を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約１．５Ｘ以内で表される。いくつかの例では、本明細書に記載される９０％を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約１．５Ｘ以内で表される。いくつかの例では、８０％を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約２Ｘ以内で表される。いくつかの例では、８０％を超える核酸が、増幅後に、ライブラリ全体の平均表現の少なくとも約２Ｘ以内で表される。

【0073】

核酸配列アセンブリのためのシステム

【0074】

ポリヌクレオチド合成

【0075】

本明細書に記載の方法によるデノボ合成によるポリヌクレオチドの生成後の、核酸のバーコード核酸配列アセンブリのための方法が、本明細書に提供される。例示的なワークフローは、図７に確認される。核酸配列を含むコンピュータ可読入力ファイルが受け取られる。コンピュータは、核酸配列を処理して、集合的に核酸配列をコードするポリヌクレオチド配列または複数のポリヌクレオチド配列の合成のための命令を生成する。命令は、複数の核酸配列に基づく複数のポリヌクレオチドの合成用の材料堆積装置（７０３）に転送される。ポリヌクレオチド酸シンセサイザーなどの材料堆積装置（７０３）は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して一度に１つの残基を伸長させ、それによりあらかじめ決められた核酸配列を有するオリゴマーを生成する。材料堆積装置（７０３）は、ポリヌクレオチド酸合成および伸長用の遺伝子座の複数のクラスタ（７０７）を含むアレイ（７０５）上に、オリゴマーを生成する。しかし、アレイは、クラスタ中に遺伝子座を組織化させる必要はない。例えば、遺伝子座は、アレイにわたって均一に広げられ得る。デノボポリヌクレオチドは、合成され、そしてプレートから取り除かれ、そしてアセンブリ反応が収集チャンバ（７０９）で開始され、その後に、より長いポリヌクレオチド（７１１）の集団が形成される。収集チャンバは、複数の表面（例えば上面と底面）のサンドイッチ形状、またははウェル、あるいはチャネルを含み、合成表面からの転移材料を含有する。デノボポリヌクレオチドもまた合成され、そしてプレートから取り除かれて、より長いポリヌクレオチド（７１１）の集団を形成し得る。その後、より長いポリヌクレオチド（７１１）の集団は、液滴に分割され得るか、またはＰＣＲにかけられ得る。その後、より長いポリヌクレオチド（７１１）の集団は、核酸アセンブリ（７１３）にかけられる。いくつかの例では、核酸アセンブリは、変異体相同性配列を含む。いくつかの例では、核酸アセンブリは、ペア化された相同性配列を使用する、ペア化された変異体アセンブリを含む。いくつかの例では、ペア化された変異体アセンブリは、バーコードを含む。いくつかの例では、バーコードは、ＩＩＳ型制限エンドヌクレアーゼなどの制限エンドヌクレアーゼに曝露される。

【0076】

本明細書に記載される方法によるデノボ合成によるポリヌクレオチドの生成後の、核酸の配列アセンブリのためのシステムが、本明細書に提供される。いくつかの例では、システムは、コンピュータ、材料堆積装置、表面、および核酸アセンブリ面を含む。いくつかの例では、コンピュータは、核酸配列を有する可読入力ファイルを含む。いくつかの例では、コンピュータは、核酸配列を処理して、集合的に核酸配列をコードするポリヌクレオチド配列または複数のポリヌクレオチド配列の合成のための命令を生成する。いくつかの例では、コンピュータは、複数のポリヌクレオチド酸配列の合成のための材料堆積装置に、命令を提供する。いくつかの例では、材料堆積装置は、伸長反応のために、表面にヌクレオシドを堆積させる。いくつかの例では、表面は、伸長反応のための遺伝子座を含む。いくつかの例では、遺伝子座は、スポット、ウェル、マイクロウェル、チャネル、あるいはポストである。いくつかの例では、複数のポリヌクレオチド酸配列は、伸長反応後に合成される。いくつかの例では、複数のポリヌクレオチド酸配列は、表面から取り除かれ、そして核酸アセンブリのために調製される。いくつかの例では、核酸アセンブリは、バーコード免疫グロブリン配列アセンブリを含む。

【0077】

本明細書に提供されるのは、ホスホラミダイト化学を関与するポリヌクレオチド合成のための方法である。いくつかの例では、ポリヌクレオチド合成は、塩基をホスホラミダイトと連結させることを含む。いくつかの例では、ポリヌクレオチド合成は、連結条件下でホスホラミダイトの堆積によって塩基を連結させることを含み、ここで、同じ塩基が随意に、１回を超えて、すなわち、二重の連結でホスホラミダイトと堆積する。いくつかの例では、ポリヌクレオチド合成は、未反応の部位のキャッピングを含む。いくつかの例では、キャッピングは随意である。いくつかの例では、ポリヌクレオチド合成は、酸化硫化を含む。いくつかの例では、ポリヌクレオチド合成は、非ブロック化または脱トリチルを含む。いくつかの例では、ポリヌクレオチド合成は、硫化を含む。いくつかの例では、ポリヌクレオチド合成は、酸化または硫化のいずれかを含む。いくつかの例では、ポリヌクレオチド合成反応中の１つの工程または各々の工程間で、基質は、例えば、テトラゾールまたはアセトニトリルを使用して洗浄される。ホスホラミダイト合成方法における任意の１工程に対する時間枠は、約２分、１分、５０秒、４０秒、３０秒、２０秒、および１０秒未満を含む。

【0078】

ホスホラミダイト方法を使用するポリヌクレオチド合成は、亜リン酸塩トリエステルリンケージの形成のために成長しているポリヌクレオチド鎖へのホスホラミダイトビルディングブロック（例えば、ヌクレオシドホスホラミダイト）のその後の追加を含む。ホスホラミダイトポリヌクレオチド合成は、３’方向から５’方向に進行する。ホスホラミダイトポリヌクレオチド合成は、１つの合成サイクル当たり、成長している核酸鎖への１つのヌクレオチドの制御された追加を可能にする。いくつかの例では、各合成サイクルは連結工程を含む。ホスホラミダイト連結は、活性化されたヌクレオシドホスホラミダイトと、例えば、リンカーを介して基質に結合されたヌクレオシドとの間の亜リン酸トリエステルリンケージの形成を含む。いくつかの例では、ヌクレオシドホスホラミダイトは、起動された基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、アクチベーター（ａｃｔｉｖａｔｏｒ）とともに基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、基質に結合したヌクレオシドよりも、１．５、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、５０、６０、７０、８０、９０、１００倍、またはそれ以上の過剰量で、基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトの追加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。ヌクレオシドホスホラミダイトの追加に続いて、基質は随意に洗浄される。いくつかの例では、連結工程は、随意に、基質へのヌクレオシドホスホラミダイトの追加の間の洗浄工程とともに、１回以上追加して繰り返される。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、１、２、３、またはそれ以上の順次的な連結工程を含む。連結前に、多くの場合において、基質に連結されたヌクレオシドは、保護基の除去によって脱保護され、ここで、保護基は重合を防ぐように機能する。一般的な保護基は、４，４’－ジメトキシトリチル（ＤＭＴ）である。

【0079】

連結の後、ホスホラミダイトポリヌクレオチド合成方法は、随意にキャッピング工程を含む。キャッピング工程では、成長しているポリヌクレオチドは、キャッピング剤で処理される。キャッピング工程は、さらなる鎖伸長からの連結後に未反応の基質に連結した５’－ＯＨ基をブロックするのに有用であり、これによって、内部塩基の欠失を伴うポリヌクレオチドの形成を防ぐ。さらに、１Ｈ－テトラゾールで活性化されたホスホラミダイトは、わずかな範囲で、グアノシンのＯ６位置と反応し得る。理論に縛られることなく、Ｉ２／水による酸化で、この副産物は、おそらくＯ６－Ｎ７遊走を介して、脱プリン化を受けることもある。脱プリン部位は、結局、ポリヌクレオチドの最終的な脱保護の間に切断され、したがって、完全長の産物の収率を低下させる。Ｏ６修飾は、Ｉ２／水での酸化前にキャッピング試薬による処理によって除去され得る。いくつかの例では、ポリヌクレオチド合成の間にキャッピング工程を含めることで、キャッピングのない合成と比較して、エラー率は低下する。一例として、キャッピング工程は、無水酢酸と１－メチルイミダゾールとの混合物で、基質に結合したポリヌクレオチドを処理することを含む。キャッピング工程に続いて、基質は随意に洗浄される。

【0080】

いくつかの例では、ヌクレオシドホスホラミダイトの添加後に、および随意にキャッピングと１以上の洗浄工程後に、基質に結合した成長している核酸は酸化される。酸化工程は、亜リン酸トリエステルが、自然発生のリン酸ジエステルヌクレオシド間リンケージの保護された前駆体である、四配位リン酸トリエステルへの酸化を含む。いくつかの例では、成長しているポリヌクレオチドの酸化は、随意に弱塩基（例えば、ピリジン、ルチジン、コリジン）の存在下で、ヨウ素および水による処理によって達成される。酸化は、例えば、ｔｅｒｔ－ブチルヒドロペルオキシドまたは（１Ｓ）－（＋）－（１０－カンファースルホニル）－オキサジリジン（ＣＳＯ）を使用して、無水条件下で実行され得る。いくつかの方法では、キャッピング工程は、酸化に続いて実行される。持続する可能性のある酸化からの残留水がその後の連結を阻害することができるため、第２のキャッピング工程は基質の乾燥を可能にする。酸化後に、基質と成長しているポリヌクレオチドは、随意に洗浄される。いくつかの例では、酸化の工程は、ポリヌクレオチドホスホロチオエートを得るために硫化工程に置き換えられ、ここで、いかなるキャッピング工程も硫化後に実行することができる。限定されないが、３－（ジメチルアミノメチリデン）アミノ）－３Ｈ－１，２，４－ジチアゾール－３－チオン、ＤＤＴＴ、３Ｈ－１，２－ベンゾジチオール－３－オン１，１－ジオキシド（Ｂｅａｕｃａｇｅ試薬としても知られている）、およびＮ，Ｎ，Ｎ’Ｎ’－テトラエチルチウラムジスルフィド（ＴＥＴＤ）を含む多くの試薬が、効率的な硫黄移動を行うことができる。

【0081】

ヌクレオシド取り込みのその後のサイクルが連結を介して生じるようにするために、基質に連結した成長しているポリヌクレオチドの保護された５’末端は除去され、一次ヒドロキシル基が次のヌクレオシドホスホラミダイトと反応する。いくつかの例では、保護基はＤＭＴであり、非ブロック化が、ジクロロメタン中でトリクロロ酢酸とともに生じる。長時間にわたる、または推奨された酸の溶液よりも強力な脱トリチル化を行うことで、固体支持体に結合したポリヌクレオチドの脱プリン化を増大させ、ゆえに、望ましい完全長の産物の収率を低下させることがある。本明細書に記載の本発明の方法および組成物は、望ましくない脱プリン反応を制限する制御された非ブロック化の条件を提供する。いくつかの例では、基質に結合したポリヌクレオチドは、非ブロック化後に洗浄される。いくつかの例では、非ブロック化後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。

【0082】

ポリヌクレオチドの合成のための方法は、典型的には以下の工程の一連の繰り返し（ｉｔｅｒａｔｉｎｇｓｅｑｕｅｎｃｅ）を含む：活性化された表面、リンカー、または以前に脱保護された単量体とリンクするために、保護された単量体の活発に官能化された表面（例えば、遺伝子座）への適用；後に適用される保護された単量体と反応するような、適用された単量体の脱保護；および、リンクのための別の保護された単量体の適用。１以上の中間工程は、酸化または硫化を含む。いくつかの例では、１以上の洗浄工程は、工程の１つまたはすべてに先行するかまたはその後に続く。

【0083】

ホスホラミダイトベースのポリヌクレオチド合成のための方法は、一連の化学的な工程を含む。いくつかの例では、合成方法の１以上の工程は、試薬のサイクリングを含み、ここで、方法の１以上の工程は、工程に有用な試薬の基質への適用を含む。例えば、試薬は、一連の液体堆積および真空乾燥の工程によって循環する。ウェル、マイクロウェル、チャネルなどの三次元の特徴を含む基質のために、試薬は、随意にウェルおよび／またはチャネルを介して基質の１つ以上の領域を通過する。

【0084】

本明細書に記載される方法および／または基質を使用して合成されたポリヌクレオチドは、少なくとも約２０、３０、４０、５０、６０、７０、７５、８０、９０、長さで１００、１２０の、１５０、２００、または５００以上の塩基を含む。いくつかの例では、ポリヌクレオチドの少なくとも約１ｐｍｏｌ、１０ｐｍｏｌ、２０ｐｍｏｌ、３０ｐｍｏｌ、４０ｐｍｏｌ、５０ｐｍｏｌ、６０ｐｍｏｌ、７０ｐｍｏｌ、８０ｐｍｏｌ、９０ｐｍｏｌ、１００ｐｍｏｌ、１５０ｐｍｏｌ、２００ｐｍｏｌ、３００ｐｍｏｌ、４００ｐｍｏｌ、５００ｐｍｏｌ、６００ｐｍｏｌ、７００ｐｍｏｌ、８００ｐｍｏｌ、９００ｐｍｏｌ、１ｎｍｏｌ、５ｎｍｏｌ、１０ｎｍｏｌ、または１００以上ｎｍｏｌが、遺伝子座内に合成される。本明細書で提供される表面上のポリヌクレオチド合成のための方法は、高速での合成を可能にする。一例として、１時間あたり少なくとも３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００ヌクレオチド、またはそれ以上が合成される。ヌクレオチドは、アデニン、グアニン、チミン、シトシン、ウリジンの構築ブロック、またはそれらのアナログ／修飾バージョンを含む。いくつかの例では、ポリヌクレオチドのライブラリは基質上で並行して合成される。例えば、約または少なくとも約１００；１，０００；１０，０００；１００，０００；１，０００，０００；２，０００，０００；３，０００，０００；４，０００，０００；または５，０００，０００の分解された遺伝子座を含む基質は、少なくとも同じ数の別個のポリヌクレオチドの合成を支持することができ、ここで、別個の配列をコードするポリヌクレオチドは分解された遺伝子座で合成される。

【0085】

高密度のポリヌクレオチドアレイを生成するための様々な適切な方法が知られている。例示的なワークフローでは、基質表面層が提供される。この例では、表面の化学的性質（ｃｈｅｍｉｓｔｒｙ）は、ポリヌクレオチド合成プロセスを改善するために改変される。低表面エネルギーの領域が液体を弾くように生成され、一方で高表面エネルギーの領域は液体を引き付けるように生成される。表面自体は平坦な表面の形態であってもよく、または、表面積を増加させる突起またはマイクロウェルなどの形状の変形を含んでもよい。ワークフローの例では、全体として参照により本明細書に組み込まれる国際特許出願公開ＷＯ／２０１５／０２１０８０で開示されるように、選択された高表面エネルギー分子は、ＤＮＡの化学的性質を支援する二重の機能を果たす。

【0086】

ポリヌクレオチドアレイのインサイツ調製物は固体支持体上で生成され、並行して複数のオリゴマーを伸長させるために単一のヌクレオチド伸長プロセスを利用する。ポリヌクレオチドシンセサイザーなどの堆積装置は、段階的な手法で試薬を放出するように設計され、複数のポリヌクレオチドが並行して、一度に１つの残基を伸長させ、それによりあらかじめ決められた核酸配列を有するオリゴマーを生成する。いくつかの場合では、ポリヌクレオチドはこの段階で表面から切断される。切断は、例えば、アンモニアまたはメチルアミンによる気相切断（ｇａｓｃｌｅａｖａｇｅ）を含む。

【0087】

基質

【0088】

ポリヌクレオチド合成のための表面として使用されるデバイスは、限定されることなく、均質アレイ表面、パターン化されたアレイ表面、チャネル、ビーズ、ゲル等を含む基質の形態であってもよい。複数のクラスタを含む基質が本明細書で提供され、ここで、各クラスタ、ポリヌクレオチドの付着および合成を支持する複数の遺伝子座を含む。本明細書で使用されるような「遺伝子座」という用語は、表面から伸長するために単一のあらかじめ定められた配列をコードするポリヌクレオチドに支持を与える構造上の離散領域を指す。いくつかの例では、遺伝子座は、二次元表面、例えば、実質的に平らな表面上にある。いくつかの例では、遺伝子座は、三次元表面、例えば、ウェル、微小ウェル、チャネル、又はポスト上にある。いくつかの例では、遺伝子座の表面は、ポリヌクレオチド合成のための少なくとも１つのヌクレオチド、または、好ましくは、ポリヌクレオチドの集団の合成のための同一のヌクレオチドの集団に結合するために活発に機能化される材料を含む。いくつかの例では、ポリヌクレオチドとは、同じ核酸配列をコードするポリヌクレオチドの集団を指す。場合により、基質の表面は、基質の１つ又は複数の表面を包含する。提供されるシステム及び方法を用いて本明細書に記載されるライブラリ内で合成されるポリヌクレオチドに関する平均エラー率は、しばしばエラー訂正なしで、多くの場合、１０００分の１未満、２０００分の１未満、３０００分の１未満である。

【0089】

共通の支持体上のアドレス可能位置で異なる予め決められた配列を有している複数のポリヌクレオチドのパラレル合成を支持する表面が本明細書で提供される。いくつかの例では、基質は、５０、１００、２００、４００、６００、８００、１０００、１２００、１４００、１６００、１８００、２，０００；５，０００；１０，０００；２０，０００；５０，０００；１００，０００；２００，０００；３００，０００；４００，０００；５００，０００；６００，０００；７００，０００；８００，０００；９００，０００；１，０００，０００；１，２００，０００；１，４００，０００；１，６００，０００；１，８００，０００；２，０００，０００；２，５００，０００；３，０００，０００；３，５００，０００；４，０００，０００；４，５００，０００；５，０００，０００；１０，０００，０００以上、またはそれ以上の非同一ポリヌクレオチドの合成のための支持を提供する。場合により、表面は、別々の配列をコードする５０、１００、２００、４００、６００、８００、１０００、１２００、１４００、１６００、１８００、２，０００；５，０００；１０，０００；２０，０００；５０，０００；１００，０００；２００，０００；３００，０００；４００，０００；５００，０００；６００，０００；７００，０００；８００，０００；９００，０００；１，０００，０００；１，２００，０００；１，４００，０００；１，６００，０００；１，８００，０００；２，０００，０００；２，５００，０００；３，０００，０００；３，５００，０００；４，０００，０００；４，５００，０００；５，０００，０００；１０，０００，０００以上、または、それ以上のポリヌクレオチドの合成のための支持を提供する。いくつかの例では、ポリヌクレオチドの少なくとも一部は、同一の配列を有しているか、または同一の配列で合成されるように構成される。いくつかの例では、基質は、少なくとも８０、９０、１００、１２０、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、又はそれ以上の塩基を持つポリヌクレオチドの成長のための表面環境を提供する。

【0090】

基質の別個の遺伝子座上でのポリヌクレオチド合成のための方法が本明細書で提供され、ここで、各遺伝子座はポリヌクレオチドの集団の合成を支持する。場合により、各遺伝子座は、別の遺伝子座上で成長したポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の合成を支持する。いくつかの例では、各ポリヌクレオチド配列は、ポリヌクレオチド合成のための表面上の遺伝子座の同じクラスタ内の異なる遺伝子座にわたって、１、２、３、４、５、６、７、８、９、またはそれ以上の重複性で合成される。いくつかの例では、基質の遺伝子座は複数のクラスタ内に位置する。いくつかの例において、基質は、少なくとも１０、５００、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、１１０００、１２０００、１３０００、１４０００、１５０００、２００００、３００００、４００００、５００００、又はそれ以上のクラスタを含む。いくつかの例では、基質は、２，０００；５，０００；１０，０００；１００，０００；２００，０００；３００，０００；４００，０００；５００，０００；６００，０００；７００，０００；８００，０００；９００，０００；１，０００，０００；１，１００，０００；１，２００，０００；１，３００，０００；１，４００，０００；１，５００，０００；１，６００，０００；１，７００，０００；１，８００，０００；１，９００，０００；２，０００，０００；３００，０００；４００，０００；５００，０００；６００，０００；７００，０００；８００，０００；９００，０００；１，０００，０００；１，２００，０００；１，４００，０００；１，６００，０００；１，８００，０００；２，０００，０００；２，５００，０００；３，０００，０００；３，５００，０００；４，０００，０００；４，５００，０００；５，０００，０００以上、または、１０，０００，０００以上、あるいはそれ以上の別々の遺伝子座を含む。いくつかの例では、基質は約１０，０００の別々の遺伝子座を含む。単一のクラスタ内の遺伝子座の量は、異なる例では変動する。場合により、各クラスタは、１、２、３、４、５、６、７、８、９、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２０、１３０、１５０、２００、３００、４００、５００、又はそれ以上の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約５０－５００の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約１００－２００の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約１００－１５０の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約１０９、１２１、１３０、または１３７の遺伝子座を含む。いくつかの例では、クラスタはそれぞれ、約１９、２０、６１、６４、またはそれ以上の遺伝子座を含む。

【0091】

いくつかの例では、基質上で合成された別々のポリヌクレオチドの数は、基質上で利用可能な別々の遺伝子座の数に左右され得る。いくつかの例では、基質のクラスタ内の遺伝子座の密度は、１ｍｍ^２当たり少なくとも、又は約１、１０、２５、５０、６５、７５、１００、１３０、１５０、１７５、２００、３００、４００、５００、又は１，０００以上の遺伝子座である。場合によっては、基質は、１０－５００、２５－４００、５０－５００、１００－５００、１５０－５００、１０－２５０、５０－２５０、１０－２００、又は５０－２００ｍｍ^２を含む。いくつかの例では、クラスタ内の２つの隣接した遺伝子座の中心間の距離は、約１００－５００、約１０－２００、又は約１０－１００μｍである。いくつかの例では、隣接した遺伝子座の２つの中心間の距離は、約１０、２０、３０、４０、５０、６０、７０、８０、９０、又は１００μｍより大きい。いくつかの例では、２つの隣接した遺伝子座の中心間の距離は、約２００、１５０、１００、８０、７０、６０、５０、４０、３０、２０、又は１０μｍ未満である。いくつかの例では、各遺伝子座は、独立して、約０．５、１、２、３、４、５、６、７、８、９、１０、２０、３０、４０、５０、６０、７０、８０、９０、又は１００ｕｍの幅を有する。場合によっては、各遺伝子座は、独立して、約０．５－１００、０．５－５０、１０－７５、又は０．５－５０ｕｍの幅を有する。

【0092】

いくつかの例では、基質内のクラスタの密度は、１００ｍｍ^２当たり少なくともまたは約１のクラスタ、１０ｍｍ^２当たり１のクラスタ、５ｍｍ^２当たり１のクラスタ、４ｍｍ^２当たり１のクラスタ、３ｍｍ^２当たり１のクラスタ、２ｍｍ^２当たり１のクラスタ、１ｍｍ^２当たり１のクラスタ、１ｍｍ^２当たり２のクラスタ、１ｍｍ^２当たり３のクラスタ、１ｍｍ^２当たり４のクラスタ、１ｍｍ^２当たり５のクラスタ、１ｍｍ^２当たり１０のクラスタ、１ｍｍ^２当たり５０のクラスタ、またはそれ以上である。いくつかの例では、基質は、１０ｍｍ^２当たり約１のクラスタから１ｍｍ^２当たり約１０のクラスタを含む。いくつかの例では、２つの隣接したクラスタの中心間の距離は、少なくとも、又は約５０、１００、２００、５００、１０００、２０００、又は５０００μｍである。場合によっては、２つの隣接したクラスタの中心間の距離は、約５０－１００、５０－２００、５０－３００、５０－５００、又は１００－２０００ｕｍの間である。場合によっては、２つの隣接したクラスタの中心間の距離は、約０．０５－５０、０．０５－１０、０．０５－５、０．０５－４、０．０５－３、０．０５－２、０．１－１０、０．２－１０、０．３－１０、０．４－１０、０．５－１０、０．５－５、または０．５－２ｍｍの間である。場合によっては、各クラスタは、独立して約０．５～２、約０．５～１、または約１～２ｍｍの断面積を有している。場合によっては、各クラスタは、独立して約０．５、０．６、０．７、０．８、０．９、１、１．１、１．２、１．３、１．４、１．５、１．６、１．７、１．８、１．９、または２ｍｍの断面積を有している。場合によっては、各クラスタは、独立して約０．５、０．６、０．７、０．８、０．９、１、１．１、１．１５１．２、１．３、１．４、１．５、１．６、１．７、１．８、１．９、または２ｍｍの内部断面積を有している。

【0093】

いくつかの例では、基質は、標準の９６ウェルプレートのサイズであり、例えば、約１００～約２００ｍｍから約５０～約１５０ｍｍまでの間である。いくつかの例では、基質は、約１０００、５００、４５０、４００、３００、２５０、２００、１５０、１００、または５０ｍｍ以下の直径を有している。いくつかの例では、基質の直径は、約２５－１０００、２５－８００、２５－６００、２５－５００、２５－４００、２５－３００、または２５－２００ｍｍの間である。いくつかの例では、基質は、少なくとも約１００；２００；５００；１，０００；２，０００；５，０００；１０，０００；１２，０００；１５，０００；２０，０００；３０，０００；４０，０００；５０，０００ｍｍ^２、またはそれ以上の平面の表面積を有している。いくつかの例では、基質の厚さは、約５０－２０００、５０－１０００、１００－１０００、２００－１０００、又は２５０－１０００ｍｍの間である。

【0094】

表面材料

【0095】

本明細書で提供される基質、装置、およびリアクターは、本明細書に記載される方法、組成物、およびシステムに適した様々な材料から作り上げられる。特定の例では、低レベルのヌクレオチド結合を示すために、基質材料が作り上げられる。いくつかの例では、基質材料は、高レベルのヌクレオチド結合を示す別々の表面を生成するために修正される。いくつかの例では、基質材料は、可視光及び／又はＵＶ光に対して透過性である。いくつかの例では、基質材料は、十分に導電性であり、例えば、基質の全て又は一部にわたって均一な電場を形成することができる。いくつかの例では、導電性材料は電気接地（ｅｌｅｃｔｒｉｃｇｒｏｕｎｄ）に接続される。いくつかの例では、基質は、熱伝導性であるか又は断熱される。いくつかの例では、材料は、化学的または生化学的な反応、例えば、ポリヌクレオチド合成反応プロセスを支持するために、耐薬品性および熱安定性である。いくつかの例では、基質は可撓性材料を含む。可撓性材料に関しては、材料は、限定されることなく以下を含むことができる：ナイロン、修飾および非修飾の、ニトロセルロース、ポリプロピレンなど。いくつかの例では、基質は剛性材料を含む。剛性材料に関しては、材料は、限定されることなく以下を含むことができる：ガラス；石英ガラス；シリコン、プラスチック（例えば、ポリテトラフルオロエチレン）、ポリプロピレン、ポリスチレン、ポリカーボネート、およびその混合など）；金属（例えば金、白金など）。基質、固体担体またはリアクターは、シリコン、ポリスチレン、アガロース、デキストラン、セルロース酸ポリマー、ポリアクリルアミド、ポリジメチルシロキサン（ＰＤＭＳ）およびからガラスから成る群から選択される材料から製造され得る。基質／固体担体またはミクロ構造、そのリアクターは、本明細書中にリストされる材料の組み合わせ、または当該技術分野で既知の他の適切な材料により製造され得る。

【0096】

表面のアーキテクチャ

【0097】

本明細書に記載される方法、組成物、及びシステムのための基質が本明細書で提供され、ここで、基質は、本明細書に記載される方法、組成物、及びシステムに適した表面構造を有する。いくつかの例では、基質は隆起した及び／又は沈降した特徴を含む。そのような特徴を有することの１つの利点は、ポリヌクレオチド合成を支持する表面積の増大である。いくつかの例では、隆起した及び／又は沈降した特徴を有する基質は、三次元基質と呼ばれる。場合により、三次元基質は１つ以上のチャネルを含む。場合により、１つ以上の遺伝子座はチャネルを含む。場合により、チャネルは、ポリヌクレオチドシンセサイザーなどの堆積装置による試薬の堆積に利用可能である。場合により、試薬及び／又は流体は、１つ以上のチャネルと流体連通するより大きなウェルに集まる。例えば、基質は、クラスタ内の複数の遺伝子座に対応する複数のチャネルを含み、複数のチャネルは、クラスタの１つのウェルと流体連通している。いくつかの方法において、ポリヌクレオチドのライブラリは、クラスタの複数の遺伝子座において合成される。

【0098】

本明細書に記載される方法、組成物、システムのための基質が本明細書で提供され、ここで、基質はポリヌクレオチド合成のために構成される。いくつかの例では、その構造は、表面上のポリヌクレオチド合成に関する流れの制御および材料移動経路制御を可能にするように構成されている。いくつかの例では、基質の構成は、ポリヌクレオチド合成中の材料移動経路、化学暴露時間、及び／又は洗浄効果の制御並びにその分布までをも可能にする。いくつかの例では、基質の構成は、例えば、成長しているポリヌクレオチドによる排除体積が、ポリヌクレオチドの成長に利用可能な又は適切な最初に利用可能な体積の５０、４５、４０、３５、３０、２５、２０、１５、１４、１３、１２、１１、１０、９、８、７、６、５、４、３、２、１％を超えて、又はそれ以下を占めないほど十分な、ポリヌクレオチドの成長に対する体積を提供することによって、奏効率の増大を可能にする。いくつかの例では、三次元構造は、化学暴露の急速な交換を可能にするために流体の流れの管理を可能にする。

【0099】

本明細書に記載される酵素的に媒介された核酸アセンブリ及びポリヌクレオチド合成に関する方法、組成物、及びシステムのための基質が本明細書で提供され、ここで、上記基質は、本明細書に記載される酵素反応を収容するように構成された構造を含む。いくつかの事例では、物理構造によって隔離が達成される。いくつかの例では、ポリヌクレオチド合成に対する能動領域および受動領域を生成する表面の差次的な官能基化によって、隔離が達成される。いくつかの例では、差次的な官能化は、基質表面にわたる疎水性を変え、それによって、堆積した試薬の水滴（ｂｅａｄｉｎｇ）又は湿りを引き起こす水接触角の効果を作り出すことによって達成される。より大きな構造を利用することで、飛散（ｓｐｌａｓｈｉｎｇ）および隣接するスポットの試薬による別々のポリヌクレオチド合成位置の相互汚染を減らすことができる。場合により、ポリヌクレオチドシンセサイザーなどの装置が、別々のポリヌクレオチド合成位置に試薬を堆積させるために使用される。三次元の特徴を有する基質は、低いエラー率（例えば、約１：５００、１：１０００、１：１５００、１：２，０００、１：３，０００、１：５，０００、または１：１０，０００未満）で、多数のポリヌクレオチド（例えば、約１０，０００を超える）の合成を可能にする方法で構成される。いくつかの例では、基質は、１ｍｍ^２当たり約１、５、１０、２０、３０、４０、５０、６０、７０、８０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、３００、４００又は５００、或いはそれらを超える特徴の密度を備えた特徴を含む。

【0100】

基質のウェルは、基質の別のウェルと同じまたは異なる幅、高さ、および／または体積を有し得る。基質のチャネルは、基質の別のチャネルと同じ又は異なる幅、高さ、及び／又は体積を有し得る。いくつかの例では、クラスタの直径、あるいはクラスタを含むウェルの直径、または両方は、約０．０５－５０、０．０５－１０、０．０５－５、０．０５－４、０．０５－３、０．０５－２、０．０５－１、０．０５－０．５、０．０５－０．１、０．１－１０、０．２－１０、０．３－１０、０．４－１０、０．５－１０、０．５－５、または０．５－２ｍｍの間である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約５、４、３、２、１、０．５、０．１、０．０９、０．０８、０．０７、０．０６、または０．０５ｍｍ未満である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約１．０と約１．３ｍｍの間である。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約１．１５０ｍｍである。いくつかの例ではある、クラスタの直径、あるいはウェルの直径、または両方は、約０．０８ｍｍである。クラスタの直径は、二次元又は三次元の基質内のクラスタを指す。

【0101】

いくつかの例では、ウェルの高さは、約２０－１０００、５０－１０００、１００－１０００、２００－１０００、３００－１０００、４００－１０００、又は５００－１０００ｕｍである。場合によっては、ウェルの高さは、約１０００、９００、８００、７００、又は６００ｕｍより低い。

【0102】

いくつかの例では、基質は、クラスタ内の複数の遺伝子座に対応する複数のチャネルを含み、ここで、チャネルの高さ又は深さは、５－５００、５－４００、５－３００、５－２００、５－１００、５－５０、又は１０－５０ｕｍである。場合によっては、チャネルの高さは、１００、８０、６０、４０、又は２０ｕｍ未満である。

【0103】

いくつかの例では、チャネル、遺伝子座（例えば、実質的に平面の基質における）、又はチャネルと遺伝子座の両方（例えば、遺伝子座がチャネルに対応する三次元基質における）の直径は、約１－１０００、１－５００、１－２００、１－１００、５－１００、又は１０－１００ｕｍ、例えば、約９０、８０、７０、６０、５０、４０、３０、２０又は１０ｕｍである。いくつかの例では、チャネル、遺伝子座、またはチャネルと遺伝子座の両方の直径は、約１００、９０、８０、７０、６０、５０、４０、３０、２０または１０μｍ未満である。いくつかの例では、２つの隣接したチャネル、遺伝子座、又はチャネルと遺伝子座の中心間の距離は、約１－５００、１－２００、１－１００、５－２００、５－１００、５－５０、又は５－３０、例えば、約２０ｕｍである。

【0104】

表面修飾

【0105】

表面上のポリヌクレオチド合成のための方法が本明細書で提供される、ここで、上記表面は様々な表面改質を含む。いくつかの例では、基質表面、又は基質表面の選択部位或いは領域の１つ以上の化学的及び／又は物理的な特性を変更するための加算或いは減算のプロセスによる、表面の化学的及び／又は物理的な変更のために、表面修飾が利用される。例えば、表面修飾は、限定されないが、（１）表面の湿潤性を変更すること、（２）表面を官能化すること、つまり、表面官能基を提供する、修飾する、または置換すること、（３）表面を脱官能基化すること、つまり、表面官能基を除去すること、（４）そうでなければ、例えばエッチングによって、表面の化学組成を変更すること、（５）表面粗さを増大または低減すること、（６）表面上にコーティング、例えば、表面の湿潤性とは異なる湿潤性を示すコーティングを提供すること、および／または（７）表面上に粒子を堆積させることを含む。

【0106】

いくつかの場合では、表面の上部の化学層（接着促進剤と呼ばれる）の添加は、基質の表面の遺伝子座の構造化したパターン化を促進する。接着促進に適用される典型的な表面は、限定されないが、ガラス、シリコン、二酸化ケイ素、および窒化ケイ素を含む。場合により、接着プロモータは、高い表面エネルギーを有する化学材料である。いくつかの例では、基質の表面上に第２の化学層が堆積される。場合により、第２の化学層は、低い表面エネルギーを有している。場合により、表面上にコーティングされた化学層の表面エネルギーは、表面上での液滴の局在化を支持する。選択されるパターン化の配置によって、遺伝子座の接近および／または遺伝子座での流体接触の領域は変更可能である。

【0107】

いくつかの例では、例えば、ポリヌクレオチド合成のために、核酸または他の部分が堆積する基質表面または分解された遺伝子座は、滑らかであるか、実質的に平面であり（例えば、二次元）、あるいは隆起したまたは陥没した特徴（例えば、三次元の特徴）などの不規則性を有している。いくつかの例では、基質表面は、化合物の１つ以上の異なる層で修飾される。対象のそのような修飾層は、限定されないが、金属、金属酸化物、ポリマー、小さな有機分子などの無機層および有機層を含む。

【0108】

いくつかの例では、基質の分解された遺伝子座は、表面エネルギーを増加および／または減少させる１つ以上の部分で官能化される。場合によっては、部分は化学的に不活性である。場合により、部分は、望ましい化学反応、例えば、ポリヌクレオチド酸合成反応における１つ以上のプロセスを支持するように構成されている。表面の表面エネルギー、すなわち、疎水性は、表面に結合するヌクレオチドの親和性を決定するための因子である。いくつかの例では、基質の官能化のための方法は、（ａ）二酸化ケイ素を含む表面を有する基質を提供する工程；および、（ｂ）本明細書に記載されるか、さもなければ当該技術分野で知られている適切なシラン化剤、例えば、有機官能性アルコキシシラン分子を使用して、表面をシラン処理する工程を含む。方法および官能化剤は、米国特許第５，４７４，７９６号に記載され、参照によってその全体が本明細書に組み込まれる。

【0109】

いくつかの例では、基質表面は、典型的に基質表面上に存在する反応性の親水性部分を介して、基質表面にシランを連結させるのに有効な反応条件下で、シランの混合物を含有している誘導体化組成物との接触によって官能化される。シラン処理は、一般に、自己組織化を介して有機官能性アルコキシシラン分子で表面を覆う。当該技術分野において現在知られているように、例えば、表面エネルギーを減少または増加させるために、様々なシロキサンを官能化試薬も使用することができる。有機官能性アルコキシシランは、その有機官能基に応じて分類される。

【0110】

コンピュータシステム

【0111】

本明細書に記載されるシステムのいずれかがコンピュータに操作可能に接続され、局所的にまたは遠隔的にコンピュータを介して自動化されてもよい。いくつかの例では、本発明の方法及びシステムは、コンピュータシステム上のソフトウェアプログラム、及びその使用をさらに含み得る。従って、材料堆積装置の動作、分配行為、及び減圧の作動を編成及び同期するなど、機能の分配／減圧／再充填の同期のためのコンピュータ制御は、本発明の範囲内にある。コンピュータシステムは、ユーザーに指定された塩基配列と材料堆積装置の位置との間に干渉するようにプログラムされ、基質の指定された領域に正しい試薬を送達する。

【0112】

図８で例証されるコンピュータシステム（８００）は、媒体（８１１）、および／または固定された媒体（８１２）を有するサーバー（８０９）に随意に接続可能なネットワークポート（８０５）からの命令を読み取ることができる論理的な装置として理解されてもよい。図８に示されるようなシステムは、ＣＰＵ（８０１）、ディスクドライブ（８０３）、キーボード（８１５）及び／またはマウス（８１６）などの随意の入力装置、並びに随意のモニター（８０７）を含み得る。データ通信は指示された通信媒体を介して局所位置または遠隔位置のサーバーまで達成され得る。通信媒体は、データを送信および／または受信する任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であってもよい。そのような接続は、ワールド・ワイド・ウェブ上での通信を提供することができる。本開示に関するデータは、図８に例示されるように当事者（８２２）による受理及び／又は検討のためにそのようなネットワーク又は接続によって伝達され得る。

【0113】

図９は、本発明の例示的実施形態に関連して使用され得るコンピュータシステム（９００）のアーキテクチャを例示するブロック図である。図９に表されるように、コンピュータシステムの例は、命令を処理するためのプロセッサ（９０２）を含み得る。プロセッサの非限定的な例は、以下を含む：ＩｎｔｅｌＸｅｏｎ（商標）プロセッサ、ＡＭＤＯｐｔｅｒｏｎ（商標）プロセッサ、Ｓａｍｓｕｎｇ３２－ｂｉｔＲＩＳＣＡＲＭ１１７６ＪＺ（Ｆ）－Ｓｖ１．０（商標）プロセッサ、ＡＲＭＣｏｒｔｅｘ－Ａ８ＳａｍｓｕｎｇＳ５ＰＣ１００（商標）プロセッサ、ＡＲＭＣｏｒｔｅｘ－Ａ８ＡｐｐｌｅＡ４（商標）プロセッサ、ＭａｒｖｅｌｌＰＸＡ９３０（商標）プロセッサ、または機能的に同等なプロセッサ。実行の複数のスレッドが並列処理に使用可能である。いくつかの例では、複数のプロセッサ、または複数のコアを持つプロセッサも、単一のコンピュータシステム中であろうと、クラスタの中であろうと、または、複数のコンピュータ、携帯電話、および／または個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されていても、使用可能である。

【0114】

図９に示されるように、高速キャッシュ（９０４）は、プロセッサ（９０２）に接続するか、または組み込まれることで、プロセッサ（９０２）により近年使用されてきたまたは頻繁に使用されている命令またはデータのための高速メモリを提供することができる。プロセッサ（９０２）は、プロセッサバス（９０８）によりノースブリッジ（９０６）に接続される。ノースブリッジ（９０６）は、メモリバス（９１２）によりランダムアクセスメモリ（ＲＡＭ）（９１０）に接続され、プロセッサ（９０２）によりＲＡＭ（９１０）へのアクセスを管理する。ノースブリッジ（９０６）は、チップセットバス（９１６）によりサウスブリッジ（９１４）にも接続される。サウスブリッジ（９１４）は次に、周辺バス（９１８）に接続される。周辺バスは、例えば、ＰＣＩ、ＰＣＩ－Ｘ、ＰＣＩＥｘｐｒｅｓｓ、または他の周辺バスであってもよい。ノースブリッジおよびサウスブリッジはしばしば、プロセッサチップセットと称され、周辺バス（９１８）上でプロセッサと、ＲＡＭと、周辺コンポーネントとの間のデータ転送を管理する。いくつかの代替的なアーキテクチャでは、ノースブリッジの機能性は、別のノースブリッジチップを使用する代わりにプロセッサに組み込まれることができる。いくつかの例では、システム（９００）は、周辺バス（９１８）に取り付けられたアクセラレータカード（９２２）を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）または特定の処理を促進するための他のハードウェアを含んでもよい。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用され得る。

【0115】

ソフトウェアとデータは、外部記憶装置（９２４）に記憶され、プロセッサにより使用されるＲＡＭ（９１０）および／またはキャッシュ（９０４）へとロードすることができる。システム（９００）は、システムリソースの管理のためのオペレーティングシステムを含み；オペレーティングシステムの非限定的な例は、以下を含む：Ｌｉｎｕｘ（登録商標）、Ｗｉｎｄｏｗｓ（商標）、ＭＡＣＯＳ（商標）、ＢｌａｃｋＢｅｒｒｙＯＳ（商標）、ｉＯＳ（商標）、及び他の機能的に同等なＯＳ、同様に、本発明の実施形態の例に従ってデータの記憶と最適化を管理するためのオペレーティングシステム上で実行するアプリケーションソフトウェア。この例では、システム（９００）はさらに、ネットワーク接続ストレージ（ＮＡＳ）などの外部記憶装置、および分散並列処理に使用することができる他のコンピュータシステムにネットワークインターフェースを提供するために、周辺バスに接続されるネットワークインターフェースカード（ＮＩＣ）（９２０）および（９２１）を含む。

【0116】

図１０は、例示的な実施形態に従って共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステムのブロック図である。上記システムは、共有メモリサブシステム（１００４）にアクセス可能な複数のプロセッサ（１００２ａ－ｆ）を含む。上記システムは、メモリサブシステム（１００４）に複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ（ＭＡＰ）（１００６ａ－ｆ）を組み込む。各ＭＡＰ（１００６ａ－ｆ）は、メモリ（１００８ａ－ｆ）および１以上のフィールドプログラマブルゲートアレイ（ＦＰＧＡ）（１０１０ａ－ｆ）を含んでもよい。ＭＡＰは設定可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの一部は、各プロセッサと密接に協働して処理を行うためにＦＰＧＡ（１０１０ａ－ｆ）に提供可能である。例えば、ＭＡＰは、データモデルに関する代数式を評価する及び例となる実施形態において適応データの再構成を実行するために使用され得る。この例では、各ＭＡＰは、このような目的のためにプロセッサすべてによって世界中からアクセス可能である。１つの構成において、各ＭＡＰは、関連するメモリ（１００８ａ－ｆ）にアクセスするためのダイレクトメモリアクセス（ＤＭＡ）を使用することができ、それにより、各マイクロプロセッサ（１００２ａ－ｆ）とは別個に、且つこれらから非同期的にタスクを実行することが可能となる。この構成では、ＭＡＰは、アルゴリズムのパイプライン処理（ｐｉｐｅｌｉｎｉｎｇ）および並列実行のために別のＭＡＰに直接結果を供給することができる。

【0117】

図１１は、複数のコンピュータシステム（１１０２ａ）および（１１０２ｂ）、複数の携帯電話および個人用携帯情報端末（１１０２ｃ）、ならびにネットワーク接続ストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）を備えたネットワークを示す略図である。例示的な実施形態では、システム（１１０２ａ）、（１１０２ｂ）、および（１１０２ｃ）は、データ記憶を管理し、ネットワーク接続ストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）に記憶されたデータに対するデータアクセスを最適化することができる。数学モデルがこのデータに対して使用可能であり、コンピュータシステム（１１０２ａ）および（１１０２ｂ）、ならびに携帯電話および個人用携帯情報端末システム（１１０２ｃ）にわたって分散並列処理を使用して評価可能である。コンピュータシステム（１１０２ａ）および（１１０２ｂ）、ならびに携帯電話および個人用携帯情報端末システム（１１０２ｃ）は、ネットワーク接続ストレージ（ＮＡＳ）（１１０４ａ）および（１１０４ｂ）に記憶されたデータの適応データ再構築に対して並列処理を提供することもできる。図１１は一例のみを示しており、様々な他のコンピュータのアーキテクチャ及びシステムが、本発明の様々な実施形態と共に使用され得る。例えば、ブレードサーバーは並列処理を提供するために使用することができる。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続可能である。ストレージも、バックプレーンに接続することができるか、または別のネットワークインターフェースを介してネットワーク接続ストレージ（ＮＡＳ）として接続可能である。いくつかの例において、プロセッサは、別個のメモリ空間を維持し、ネットワークインターフェース、バックプレーン、又は他のプロセッサによる並列処理のための他のコネクターを通じてデータを伝達することができる。いくつかの例において、プロセッサのいくつか又は全てが、共有仮想アドレスメモリ空間を使用することができる。

【0118】

本明細書に記載されるシステムのいずれかは、非一時的なコンピュータ可読記憶媒体上に記憶された配列情報を含むことができる。いくつかの例では、本明細書に記載されるシステムのいずれかは、コンピュータ入力ファイルを含む。いくつかの例では、コンピュータ入力ファイルは配列情報を含む。いくつかの例では、コンピュータ入力ファイルは、複数のポリヌクレオチド配列の合成のための命令を含む。いくつかの例では、上記命令はコンピュータによって受けられる。いくつかの例では、上記命令はコンピュータによって処理される。いくつかの例では、上記命令は材料堆積装置に伝達される。いくつかの例において、非一時的なコンピュータ読み取り可能な記憶媒体は、随意にネットワーク接続されたデジタル処理装置のオペレーティングシステムによって実行可能な命令を含むプログラムで符号化される。いくつかの例において、コンピュータ可読記憶媒体は、デジタル処理装置の具体的な構成要素である。いくつかの例において、コンピュータ可読記憶媒体は、デジタル処理装置から随意に除去可能である。いくつかの例おいて、コンピュータ可読記憶媒体は、限定されないが、ＣＤ－ＲＯＭ、ＤＶＤ、フラッシュメモリデバイス、固体記憶装置、磁気ディスクドライブ、磁気テープドライブ、光ディスク欲動、クラウドコンピューティングシステム及びサービスなどを含む。いくつかの例において、プログラム及び命令は、永続的に、ほぼ永続的に、半永続的に、又は非一時的に、媒体上で符号化される。

【実施例】

【0119】

以下の実施例は、本発明の様々な実施形態を例示する目的で与えられ、いかなる方法でも本発明を制限するようには意図されていない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態を代表するものであり、例示的なものであり、および、本発明の範囲を限定することを意図したものではない。請求の範囲によって定義される本発明の趣旨内に包含されるその変化形および他の使用は、当業者に想到される。

【0120】

実施例１：基質表面の官能化

【0121】

ポリヌクレオチドのライブラリの付着および合成を助けるために、基質を官能化した。基質表面をまず、２０分間、９０％のＨ_２ＳＯ_４および１０％のＨ_２Ｏ_２を含むピラニア溶液を使用して湿式洗浄した。基質を、脱イオン水を含む幾つかのビーカーの中ですすぎ、５分間脱イオン水のグーズネック形状の蛇口の下で保持して、Ｎ２で乾燥させた。その後、基質を５分間、ＮＨ_４ＯＨ（１：１００；３ｍＬ：３００ｍＬ）に浸し、ハンドガン（ｈａｎｄｇｕｎ）を使用してＤＩ水ですすぎ、脱イオン水を含む３つの連続するビーカーの中で各々１分間浸し、その後、ハンドガンを使用して脱イオン水で再びすすいだ。その後、基質表面をＯ_２にさらすことにより基質をプラズマ洗浄した。ＳＡＭＣＯＰＣ－３００機器を使用して、下流モードで１分間、２５０ワットでＯ_２をプラズマエッチングした。

【0122】

以下のパラメータを有するＹＥＳ－１２２４Ｐ気相蒸着オーブンシステムを使用して、清潔になった基質表面をＮ－（３－トリエトキシシリルプロピル）－４－ヒドロキシブチルアミドを含む溶液で能動的に官能化した：０．５から１トル、６０分、７０℃、１３５℃の気化器。ＢｒｅｗｅｒＳｃｉｅｎｃｅ２００Ｘスピンコータを使用して、基質表面をレジストコートした（ｒｅｓｉｓｔｃｏａｔｅｄ）。ＳＰＲ（商標）３６１２フォトレジストを、４０秒間２５００ｒｐｍで基質上でスピンコートした。基質を予め、Ｂｒｅｗｅｒホットプレート上で、９０℃で３０分間焼いた。ＫａｒｌＳｕｓｓＭＡ６マスクアライナー機器を使用して、基質をフォトリソグラフィーに曝露した。基質を２．２秒間さらし、ＭＳＦ２６Ａの中で１分間、展開させた（ｄｅｖｅｌｏｐｅｄ）。残りの展開物（ｄｅｖｅｌｏｐｅｒ）をハンドガンですすぎ、基質を５分間水に浸した。基質をオーブンの中で、１００℃で３０分間焼き、その後、ＮｉｋｏｎＬ２００を使用してリソグラフィーの欠損に対する目視検査を行った。洗浄処理を使用し、ＳＡＭＣＯＰＣ－３００機器を用いて残りのレジストを取り除き、１分間２５０ワットでＯ_２プラズマエッチングした。

【0123】

基質表面を、１０μＬの軽油と混合したペルフルオロオクチルトリクロロシランの１００μＬ溶液で受動的に官能化した。基質をチャンバに入れ、１０分間ポンプでくみ出し、その後、バルブを閉じてポンプを止め、１０分間放置した。チャンバを通気した。最大パワー（Ｃｒｅｓｔシステム上で９）での超音波処理による７０℃で５００ｍＬのＮＭＰの中で５分間の２回の浸漬を行なうことにより、基質をレジスト剥離した。その後、最大パワーでの超音波処理により室温で５００ｍＬのイソプロパノールの中で５分間、基質を浸した。基質を、３００ｍＬの２００プルーフエタノール（２００ｐｒｏｏｆｅｔｈａｎｏｌ）に漬けて、Ｎ_２で送風乾燥した。官能化した表面は活性化され、ポリヌクレオチド合成のための支持体として役立った。

【0124】

実施例２：オリゴヌクレオチド合成装置上での５０量体の配列の合成

【0125】

二次元オリゴヌクレオチド合成装置をフローセルに組み入れ、フローセル（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ（「ＡＢＩ３９４ＤＮＡＳｙｎｔｈｅｓｉｚｅｒ」））に接続させた。Ｎ－（３－トリエトキシシリルプロピル）－４－ヒドロキシブチルアミド（Ｇｅｌｅｓｔ）で二次元オリゴヌクレオチド合成装置を均一に官能化し、これを使用して、本明細書に記載されるポリヌクレオチド合成方法を用いて５０ｂｐの例示的なポリヌクレオチド（「５０量体のポリヌクレオチド」）を合成した。

【0126】

５０量体の配列は、配列番号：１．５’ＡＧＡＣＡＡＴＣＡＡＣＣＡＴＴＴＧＧＧＧＴＧＧＡＣＡＧＣＣＴＴＧＡＣＣＴＣＴＡＧＡＣＴＴＣＧＧＣＡＴ＃＃ＴＴＴＴＴＴＴＴＴＴ３’（配列番号：１）に記載される通りであり、ここで、＃は、チミジン－スクシニルヘキサミドＣＥＤホスホラミダイト（ＣｈｅｍＧｅｎｅｓのＣＬＰ－２２４４）を表し、これは、脱保護中に表面からのポリヌクレオチドの放出を可能にする切断可能なリンカーである。

【0127】

表３のプロトコルおよびＡＢＩシンセサイザーに従って標準的なＤＮＡ合成化学（結合、キャッピング、酸化、および非ブロック化）を使用して、合成を行った。

【0128】

【表1-1】

【0129】

【表1-2】

【0130】

【表1-3】

【0131】

ホスホラミダイト／活性化因子の組み合わせを、フローセルを介するバルク試薬の送達と同様に送達した。環境が時間全体にわたって試薬により「湿った」ままであるため、いかなる乾燥工程も行わなかった。

【0132】

フローリストリクターをＡＢＩ３９４ＤＮＡ合成装置から取り除き、より速い流れを可能した。フローリストリクターなしで、アミダイト（ＡＣＮ中で０．１Ｍ）、活性化因子（ＡＣＮ中で０．２５Ｍのベンゾイルチオテトラゾール（「ＢＴＴ」；ＧｌｅｎＲｅｓｅａｒｃｈの３０－３０７０－ｘｘ））、およびＯｘ（２０％のピリジン、１０％の水、および７０％のＴＨＦ中の０．０２ＭのＩ２）の流量は、およそ～１００ｕＬ／秒、アセトニトリル（「ＡＣＮ」）およびキャッピング試薬（キャップＡとキャップＢの１：１の混合物、ここで、キャップＡはＴＨＦ／ピリジン中の無水酢酸であり、キャップＢはＴＨＦ中の１６％の１－メチルイミダゾール（ｍｅｔｈｙｌｉｍｉｄｉｚｏｌｅ））についてはおよそ～２００ｕＬ／秒、および、Ｄｅｂｌｏｃｋ（トルエン中の３％のジクロロ酢酸）についてはおよそ～３００ｕＬ／秒（フローリストリクターで全ての試薬に対し～５０ｕＬ／秒と比較して）であった。酸化剤（Ｏｘｉｄｉｚｅｒ）を完全に押し出す時間を観察し、化学フロー時間のタイミングを適宜調整し、余分なＡＣＮ洗浄を異なる化学物質間に導入した。ポリヌクレオチド合成後、７５ｐｓｉで一晩、ガス状のアンモニア中でチップを脱保護した。表面に水を５滴加えて、ポリヌクレオチドを再生させた。その後、再生させたポリヌクレオチドを、ＢｉｏＡｎａｌｙｚｅｒの小さなＲＮＡチップ上で分析した（データは示されていない）。

【0133】

実施例３：オリゴヌクレオチド合成装置上での１００量体の配列の合成

【0134】

５０量体の配列の合成について実施例２に記載されるのと同じプロセスを、１００量体のポリヌクレオチド（「１００量体のポリヌクレオチド」；５’ＣＧＧＧＡＴＣＣＴＴＡＴＣＧＴＣＡＴＣＧＴＣＧＴＡＣＡＧＡＴＣＣＣＧＡＣＣＣＡＴＴＴＧＣＴＧＴＣＣＡＣＣＡＧＴＣＡＴＧＣＴＡＧＣＣＡＴＡＣＣＡＴＧＡＴＧＡＴＧＡＴＧＡＴＧＡＴＧＡＧＡＡＣＣＣＣＧＣＡＴ＃＃ＴＴＴＴＴＴＴＴＴＴ３’、ここで、＃はチミジン－スクシニルヘキサミドＣＥＤホスホラミダイト（ＣｈｅｍＧｅｎｅｓのＣＬＰ－２２４４）；配列番号：２を表す）の、２つの異なるシリコンチップ上での合成に使用し、第１のシリコンチップはＮ－（３－トリエトキシシリルプロピル）－４－ヒドロキシブチルアミドで均一に官能化され、第２のシリコンチップは１１－アセトキシウンデシルトリエトキシシランとｎ－デシルトリエトキシシランの５／９５の混合物で官能化され、表面から抽出されたポリヌクレオチドを、ＢｉｏＡｎａｌｙｚｅｒ機器で分析した（データは示されていない）。

【0135】

以下の熱サイクルプログラムを使用して、５０ｕＬのＰＣＲ混合物（２５ｕＬのＮＥＢＱ５マスターミックス、２．５ｕＬの１０ｕＭフォワードプライマー、２．５ｕＬの１０ｕＭリバースプライマー、表面から抽出した１ｕＬのポリヌクレオチド、および最大５０ｕＬの水）中で、フォワードプライマー（５’ＡＴＧＣＧＧＧＧＴＴＣＴＣＡＴＣＡＴＣ３’；配列番号：３）およびリバースプライマー（５’ＣＧＧＧＡＴＣＣＴＴＡＴＣＧＴＣＡＴＣＧ３’；配列番号：４）を使用して、２つのチップからの１０の試料すべてをさらに増幅した：
９８℃、３０秒
９８℃、１０秒；６３℃、１０秒；７２℃、１０秒；１２サイクルを繰り返す
７２℃、２分

【0136】

ＰＣＲ産物をＢｉｏＡｎａｌｙｚｅｒ上でも実行して（データは示されていない）、１００量体の位置での急なピークを実証した。次に、ＰＣＲ増幅サンプルをクローン化し、サンガー配列決定を行った。表４は、チップ１からのスポット１－５から得たサンプル、およびチップ２からのスポット６－１０から得たサンプルに対するサンガー配列決定からの結果を要約する。

【0137】

【表2】

【0138】

ゆえに、高品質および高均一性の合成ポリヌクレオチドを、異なる界面化学的性質を持つ２つのチップ上で繰り返した。配列決定された１００量体の２６２のうち２３３に対応している全体の８９％が、エラーのない完全な配列であった。表５は、スポット１－１０からのポリヌクレオチドサンプルから得た配列に対するエラー特徴を要約している。

【0139】

【表3】

【0140】

実施例４．酵素学に基づくアセンブリのための例示的な製剤

【0141】

様々な反応条件が、表６－表１４に確認される。試薬を、様々な順序で添加する。あるいは、試薬を段階的に添加し、例えば、試薬を表１４にリストされる順序で添加する。

【0142】

【表4】

【0143】

【表5】

【0144】

【表6-1】

【0145】

【表6-2】

【0146】

【表6-3】

【0147】

【表7】

【0148】

【表8】

【0149】

【表9】

【0150】

【表10】

【0151】

【表11】

【0152】

【表12】

【0153】

実施例５．酵素学的媒介核酸アセンブリ

【0154】

実施例４に記載される通りの反応条件を使用して、酵素学的媒介核酸（ガイドされたアセンブリ）を行った（「条件Ａ」）。酵素学的媒介核酸アセンブリは、結果として、隣接する相同性配列および二次構造の直列反復の存在下でさえ、高いコロニー形成単位（ＣＦＵ）をもたらした（図１２Ａ）。さらに、酵素学的媒介核酸アセンブリからのＣＦＵは、密に分布して、ロバストな反応条件を実証した。Ａ／Ｔに富むオーバーラップ相同性配列は、図１２Ｂに確認できる通りの、１０％未満のＧＣを含有していた。コンパレータ１およびコンパレータ２アセンブリ（代替のエキソヌクレアーゼ／リガーゼベースのアセンブリ方法）と比較して、酵素媒介核酸アセンブリは、７２．５％ＧＣを超える相同領域で有意に効率的であった。精度を、ＮＧＳ配列決定８－１２クローンによっても測定した。極端なＧＣ％、ヘアピン、または直列反復を伴うような、酵素媒介核酸アセンブリの精度に対する大きな影響は無かった。ユニバーサルアダプタ配列の有無に関係なく、酵素媒介核酸アセンブリの平均的な合格率は５６％～８８％の範囲であった。コンパレータ１およびコンパレータ２アセンブリのパフォーマンスは、より低かった。コンパレータ２アセンブリの反応は４１％～５６％の範囲の合格率を有し、そして、コンパレータ１は５３％～７５％の範囲の合格率を有していた（図１２Ｃ）。

【0155】

アセンブリ特異度および配列バイアスを、多重遺伝子アセンブリ通じて評価した（図１２Ｄ）。３つの異なる遺伝子（遺伝子Ａ、遺伝子Ｂ、遺伝子Ｃ）のアセンブリは、ユニバーサルアダプタを伴う９つのｄｓＤＮＡ入力断片からなり、単一の反応でアセンブルされた。相同性配列の類似性は、２８－６０％の範囲であった。平行独立反応（Ｎ＝４）で、９つの入力断片を酵素学的媒介核酸アセンブリにかけて、３つの遺伝子を形成した。構築物はすべて５’および３’のプライマー部位を共有して、ＰＣＲ増幅させて完全長の遺伝子について濃縮し、酵素媒介核酸アセンブリを使用してプラスミドにクローン化し、そして大腸菌に形質転換させた。各反応プールからの９６のコロニーを、サンガー配列用に単離し、そして最終構築物を配列決定した。配列決定の読み取りはすべて、所望の遺伝子に対して完全長の構築物を示し、ユニバーサルアダプタ配列、キメラ遺伝子配列、またはミスアセンブリ（ｍｉｓａｓｓｅｍｂｌｉｅｓ）のエビデンスを示すことはなかった。図１２Ｄで確認される通り、各遺伝子配列は、３３％の予想平均の周りで密に分布していることが観察され、このこともまた、配列バイアスのない酵素媒介核酸アセンブリの正確性および特異性を実証している。より大きな断片も、成功裡にアセンブルされた。酵素学的アセンブリ方法を使用し、６つのＤＮＡ断片を、酵素反応を使用して一度にアセンブルし、多数のコロニー形成単位を得た（図１２Ｅ）。条件Ａは、結果として、図１２Ｆに示される通りのコンパレータ１またはコンパレータ２の条件と比較して、より大きな断片（最大１０）のアセンブリのためにより多数のＣＦＵをもたらす。断片間の最適な相同性長さなどの追加の設計要素をテストした（図１２Ｇ）。

【0156】

実施例６．４００の塩基対の多重遺伝子アセンブリ

【0157】

６０の遺伝子／クラスタの多重アセンブリを、Ｕｎｉ９ユニバーサルプライマーを含む２７０量体の核酸を使用して行った。２３，０００の遺伝子のアセンブリからのデータを、図１３Ａ－図１３Ｇに示す。図１３Ａは、ユニバーサルプライマーを使用するＰＣＲ後のＤＮＡの相対濃度を示す。図１３Ｂは、ＢｉｏＡｎａｌｙｚｅｒ読み取り値からのプロットを示す。図１３Ｃ－図１３Ｅは、次世代シーケンシング（ＮＧＳ）の結果、特に、１４０ｘ適用範囲を使用する密度プロット（図１３Ｃ）と、挿入／欠失がない遺伝子のパーセントの分布（図１３Ｄ－図１３Ｅ）とを示す。図１３Ｆは、完全なドロップアウト、ドロップアウト、およびランナウェイ（ｒｕｎａｗａｙ）のパーセントを示す。図１３Ｇは、ソフトクリッピング／キメラの読み取りのグラフを示す。約１％の核酸の集団は、キメラ遺伝子断片を含む。結果は、以下の表１５－表１６にも確認される。

【0158】

【表13】

【0159】

【表14】

【0160】

実施例７．変異体のコンビナトリアルアセンブリ

【0161】

変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。４つの入力集団をアセンブルした。アセンブリは、結果として、約１５０，０００の変異体と、クローン化前後の完全長配列の均一性（図１４Ａ）、ならびに均一な変異体の頻度（図１４Ｂ）をもたらした。アセンブル後、産物をＰＣＲ増幅させて完全長の遺伝子について濃縮を行い、その後、プラスミドへのクローン化を行い、そして大腸菌に形質転換させた。各反応プールからの９６のコロニーを、サンガー配列用に単離した。配列決定読み取りはすべて、所望の遺伝子について完全長の構築物を示した。内部のユニバーサルアダプタ配列、キメラ遺伝子配列、またはミスアセンブリ（ｍｉｓａｓｓｅｍｂｌｉｅｓ）は観察されなかった。

【0162】

実施例８．酵素学的媒介核酸アセンブリを使用する、スケーラブルなアセンブリ

【0163】

酵素学的媒介核酸アセンブリを、ＬａｂｃｙｔｅＥｃｈｏ（登録商標）５２５ＬｉｑｕｉｄＨａｎｄｌｅｒを使用して実施して、アクショナブルな（ａｃｔｉｏｎａｂｌｅ）ＤＮＡ構築物を大規模に生成した。単一ポットの反応では、小型化された酵素媒介核酸アセンブリ反応を使用して、２つの線形ｄｓＤＮＡ断片をベクターにアセンブルし、野生型および変異体のｐ７０プロモーター下での蛍光タンパク質発現を可能にした。ｐ７０プロモーター調整は、野生型（ＷＴ）プロモーター下で蛍光タンパク質ｍＣｈｅｒｒｙの発現を駆動し、同じ構築物中でＧＦＰ発現を異なって駆動する合成ｐ７０変異体をテストすることで、評価した。ＧＦＰをｍＣｈｅｒｒｙシグナルに正規化することによって、さまざまな変異ｐ７０プロモーターの強度を概算した。多重化ＤＮＡアセンブリとｍｙＴＸＴＬ（登録商標）タンパク質合成の結果として、最適なタンパク質生成条件を、小型化された反応内で確認した。

【0164】

実施例９．免疫グロブリン配列アセンブリ

【0165】

この例は、免疫グロブリン配列アセンブリのためのデノボ合成方法を示す。

【0166】

第１のリーダー配列、第１の可変領域、および第１のＣＤＲセグメントを合成し、その後、ポリメラーゼ鎖アセンブリ（ＰＣＡ）にさらして、第１の複数の遺伝子断片を生成した。第２のリーダー配列、第２の可変領域、および第２のＣＤＲセグメントを合成し、その後、アセンブリＰＣＲまたはＰＣＡにさらして、第２の複数の遺伝子断片を生成した。第２の定常領域とそれに続く自己切断型ペプチドとを含む第３の複数の遺伝子断片、および可変定常セグメントを含む第４の複数の遺伝子断片を、合成する。第３の複数の遺伝子断片と第４の複数の遺伝子断片とは、第１の複数の遺伝子断片と第２の複数の遺伝子断片とに添加され、その後にＰＣＲが続く。エラー修正反応を、随意に行ってもよい。結果として生じる構築物をプールし、クローン化し、そして次世代シーケンシングにかける。

【0167】

実施例１０．多重免疫グロブリン配列アセンブリ

【0168】

この実施例は、多重免疫グロブリン配列アセンブリのためのデノボ合成方法を示す。

【0169】

第１の可変領域の変異体を含む遺伝子断片を合成し、そして、第１の可変領域に相補的な４０の塩基対（ｂｐ）領域と第１のＣＤＲおよびＪセグメントとを含む遺伝子断片で増幅して、第１の複数の遺伝子断片を生成する。第２の可変領域の変異体を含む遺伝子断片を合成し、そして、第２のＣＤＲおよびＪセグメントを含む遺伝子断片で増幅して、第２の複数の遺伝子断片を生成する。定常領域、自己切断型ペプチド配列、第１のリーダー配列、ならびに第２の可変領域と第２のＣＤＲおよびＪセグメントとに相補的な４０の塩基対（ｂｐ）領域を含む、第３の複数の遺伝子断片を合成する。自己切断型ペプチド配列はＰ２Ａである。

【0170】

第１の複数の遺伝子断片、第２の複数の遺伝子断片、および第３の複数の遺伝子断片を、酵素ベースのアセンブリ方法を使用してアセンブルし、ＰＣＲ精製し、そしてプールする。アセンブルされていない断片をすべて精製して取り除く。その後、最終構築物をベクターにクローン化する。

【0171】

実施例１１．ＩＩＳ型曝露バーコードを使用する、ペア化された変異体アセンブリ

【0172】

この実施例は、ＩＩＳ型曝露バーコードを使用する、ペア化された変異体アセンブリ方法を示す。

【0173】

バーコード、それに続く第１の制限エンドヌクレアーゼ部位、第２の制限エンドヌクレアーゼ部位、ならびに第１の相補性決定領域（ＣＤＲ）セグメントおよびＪセグメントを含む、第１の複数の遺伝子断片を合成する。ＣＤＲセグメントおよびＪセグメントは、約１００の塩基対である。第一の制限エンドヌクレアーゼ部位または第２の制限エンドヌクレアーゼ部位は、ＩＩＳ型制限エンドヌクレアーゼ（ＴＩＩＳ－ＲＥ）部位である。第１の定常領域、それに続く自己切断型ペプチド配列、第１のリーダー配列、および第１の可変領域を含む、第２の複数の遺伝子断片を合成する。自己切断型ペプチド配列はＰ２Ａである。合成された第１の可変領域の数は、約１００である。

【0174】

第１の複数の遺伝子断片と第２の複数の遺伝子断片とを組み合わせ、そして、ＰＣＲ増幅して、第３の複数の遺伝子断片を生成する。第３の複数の遺伝子断片は、バーコード、それに続く第１の制限エンドヌクレアーゼ部位、第１の定常領域、切断ペプチド配列、第１のリーダー配列、第１の可変領域、ならびに第１のＣＤＲおよびＪセグメントを含む。第３の複数の遺伝子断片を、ベクター配列、それに続く第２のリーダー配列、第２の可変領域、第２のＣＤＲセグメントおよびＪセグメント、第１のＴＩＩＳ－ＲＥ部位、およびバーコードを含む、第４の複数の遺伝子断片と組み合わせて、第５の複数の遺伝子断片を生成する。合成された第２の可変領域の数は、約１３０である。

【0175】

第５の複数の遺伝子断片は、ベクター配列、それに続く第２のリーダー配列、第２の可変領域、第２のＣＤＲおよびＪセグメント、第１のＴＩＩＳ－ＲＥ部位、バーコード、第１のＴＩＩＳ－ＲＥ部位、第１の定常領域、切断型ペプチド配列、第１のリーダー配列、第１の可変領域、および第１のＣＤＲセグメントを含む。５０の複数の遺伝子断片をＰＣＲ増幅してクローン化し、その後に、ＴＩＩＳ制限エンドヌクレアーゼで処理してＴＩＩＳ－ＲＥ部位をカットし、バーコードを除去して、ベクター配列、それに続く第２のリーダー配列、第２の可変領域、第２のＣＤＲセグメント、第１の定常領域、切断型ペプチド配列、第１のリーダー配列、第１の可変領域、ならびに第１のＣＤＲおよびＪセグメントを含む、第６の複数の遺伝子断片を生成した。その後、第６の複数の遺伝子断片をベクターにクローン化して、第２のリーダー配列、第２の可変領域、第２のＣＤＲセグメント、第１の定常領域、切断型ペプチド配列、第１のリーダー配列、第１の可変領域、第１のＣＤＲおよびＪセグメント、ならびに可変定常領域を含む、最終構築物を生成する。合成された遺伝子断片の数は、約１０００である。

【0176】

実施例１２．ペア化された相同性を使用する、変異体アセンブリ

【0177】

この実施例は、ペア化された相同性を含む、ペア化された変異体のアセンブリを示す。

【0178】

第１の可変領域を含む１０３の変異体遺伝子断片を合成する。１０３の変異体遺伝子断片を、第１のＣＤＲ３およびＪセグメントで増幅して、第１の複数の遺伝子断片を生成する。第２の可変領域を含む１３１の変異体遺伝子断片の異なるセットを合成する。１３１の変異体遺伝子断片を、第２のＣＤＲ３およびＪセグメントで増幅して、第２の複数の遺伝子断片を生成する。第１のＣＤＲ３およびＪセグメントに相同的な配列、それに続く定常領域、自己切断型ペプチド配列、第１のリーダー配列、および第２の可変領域に相補的な４０の塩基対（ｂｐ）領域を含む、第３の複数の１３０の変異体遺伝子断片を合成する。

【0179】

第１の複数の遺伝子断片、第２の複数の遺伝子断片、および第３の複数の遺伝子断片をアセンブルし、そして目的ベクターにクローン化する。最終構築物は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲおよびＪセグメント、第２の定常領域、自己切断型ペプチド配列、第１のリーダー配列、第１の可変領域、第１のＣＤＲおよびＪセグメント、ならびに可変定常領域を含む。

【0180】

実施例１３．ＩＩＳ型部位を使用する、ペア化された変異体アセンブリ

【0181】

この実施例は、ＩＩＳ型部位を含む遺伝子断片の、ペア化された変異体アセンブリ方法を示す。

【0182】

第１のリーダー配列と第１の可変領域とを含む第１の複数の遺伝子断片を合成する。第２の可変領域を含む第２の複数の遺伝子断片を合成する。第１のＩＩＳ型部位と、それに続く、第２の可変領域に相補的な４０の塩基対（ｂｐ）領域とを含む、第３の複数の遺伝子断片を合成する。第２の可変領域に相補的な４０の塩基対（ｂｐ）領域、それに続く第２のＣＤＲ３およびＪセグメント、ならびに可変定常セグメントを含む、第４の複数の遺伝子断片を合成する。第１の可変領域に相同的なセグメント、それに続く第１のＣＤＲ３およびＪセグメント、ならびにＴＩＩＳ部位を含む、第５の複数の遺伝子断片を合成する。

【0183】

第１の複数の遺伝子断片、第２の複数の遺伝子断片、第３の複数の遺伝子断片、第４の複数の遺伝子断片、および第５の複数の遺伝子断片をプールし、そして、第１のＣＤＲ３およびＪセグメントと第２のＣＤＲ３およびＪセグメントとを添加するために、ＰＣＲ増幅する。結果として生じる遺伝子断片は、第２の可変領域、それに続く第２のＣＤＲ３およびＪセグメント、ＴＩＩＳ部位、第１の可変領域、ならびに第１のＣＤＲ３およびＪセグメントを含む。結果として生じる遺伝子断片に対して、フラップエンドヌクレアーゼ媒介核酸アセンブリと、目的ベクターへの挿入が行われる。目的ベクターは、第２のリーダー配列と可変定常領域とを含む。目的ベクターへの挿入後、遺伝子断片は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、第１の制限エンドヌクレアーゼ部位、第１の可変領域、第１のＣＤＲ３およびＪセグメント、ならびに可変定常領域を含む。その後、遺伝子断片をゴールデンゲートアセンブリ（ＧｏｌｄｅｎＧａｔｅＡｓｓｅｍｂｌｙ）にかけ、第２の定常領域を挿入して、最終構築物を生成する。最終構築物は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、第２の定常領域、自己切断型ペプチド配列、第１のリーダー配列、第１の可変領域、第１のＣＤＲ３およびＪセグメント、および可変定常領域を含む。生成された最終構築物の数は約１００００である。

【0184】

実施例１４．各変異体に特異的なポリヌクレオチド集団

【0185】

この実施例は、各可変領域に特異的なポリヌクレオチド集団の使用を示す。自己切断型ペプチド配列、第１のリーダー配列、および第１の可変領域を含む、第１の複数の遺伝子断片を合成する。第２の可変領域に相同的なセグメント、それに続く第２のＣＤＲ３およびＪセグメント、ＩＩＳ型部位、第１のＣＤＲ３およびＪセグメント、ならびにユニバーサルプライマーを含む、遺伝子断片を合成する。当該遺伝子断片を、リーダー配列とそれに続く第２の可変領域とを含む遺伝子断片の集団と組み合わせ、そしてＰＣＲ増幅させて、第２の複数の遺伝子断片を生成し、当該第２の複数の遺伝子断片は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、ＩＩＳ型部位、第１のＣＤＲ３およびＪセグメント、ならびにユニバーサルプライマーを含む。その後、第２の複数の遺伝子断片を、第２のリーダー配列と可変定常領域とを含む目的ベクターにアセンブルして、第３の複数の遺伝子断片を生成する。第３の複数の遺伝子断片は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、ＩＩＳ型部位、第１のＣＤＲ３およびＪセグメント、および可変定常領域を含む。

【0186】

第１の複数の遺伝子断片と第３の複数の遺伝子断片とをアセンブルし、第２の定常領域を挿入して、最終構築物を生成する。最終構築物は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、第２の定常領域、自己切断型ペプチド配列、第１のリーダー配列、第１の可変領域、第１のＣＤＲ３およびＪセグメント、ならびに可変定常領域を含む。生成された最終構築物の数は約１００００である。

【0187】

実施例１５．ダイヤルアウトＰＣＲ（ｄｉａｌ－ｏｕｔＰＣＲ）を使用する、ペア化されたバーコード

【0188】

この実施例は、核酸アセンブリのための、ペア化されたバーコードとダイヤルアウトＰＣＲとの使用を示す。第１の可変領域を含む第１の複数の遺伝子断片を合成する。第１の超可変領域、それに続く、第１の可変領域に補足的な４０の塩基対（ｂｐ）領域、第１のＣＤＲ３およびＪセグメント、ならびにバーコードを含む、第２の複数の遺伝子断片を合成する。第２のリーダー配列と第２の可変領域とを含む第３の複数の遺伝子断片を合成する。第２のＣＤＲ３およびＪセグメントを含む第４の複数の遺伝子断片を合成する。第１の複数の遺伝子断片と第２の複数の遺伝子断片とを組み合わせて、ＰＣＲを使用して、第１のコンビナトリアルライブラリを作り出す。第３の複数の遺伝子断片と第４の複数の遺伝子断片とを組み合わせて、ＰＣＲを使用して、第２のコンビナトリアルライブラリを作り出す。

【0189】

第１のコンビナトリアルライブラリと第２のコンビナトリアルライブラリとを、フラップエンドヌクレアーゼ媒介核酸アセンブリを使用してアセンブルし、第５の複数の遺伝子断片を生成し、当該第５の複数の遺伝子断片は、第２のリーダー配列、それに続く第２の可変領域、第２のＣＤＲ３およびＪセグメント、第２の定常領域、自己切断型ペプチド配列、第１のリーダー配列、第１の可変領域、第１のＣＤＲ３およびＪセグメント、第１の可変領域に相補的な４０の塩基対（ｂｐ）領域、およびバーコードを含む。第５の複数の遺伝子断片を、環状化し、そしてプライマーで配列決定して、第６の複数の遺伝子断片を生成する。サンプルをバーコードによって同定する。その後、第６の複数の遺伝子断片を、ダイヤルアウトＰＣＲと目的ベクターへのフラップエンドヌクレアーゼ媒介核酸アセンブリとにかけて、最終構築物を生成する。

【0190】

実施例１６．変異体のコンビナトリアルアセンブリ

【0191】

変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。長さが１．２－２．２ｋｂの範囲の１５－２０の変異体を伴う４つの入力集団（またはドメイン）を、各々アセンブルした（変異体の数はカッコ内）：
５’ベクター－ドメイン１（１５）－ドメイン２（２０）－ドメイン３（２０）－ドメイン４（２０）－３’ベクター

【0192】

アセンブリは、結果として、約１２０，０００の変異体と、細菌発現ベクタークローン化前後の完全長配列の均一性（図１５Ａ、表１７）、ならびに均一な変異体の頻度（図１５Ｂ）をもたらした。

【0193】

【表15】

【0194】

ＮＧＳの結果は、変異体のあらゆる組み合わせの均一な分布が得られたことを示した。このことは、プールが、互いに５Ｘ以内の可能な変異体の組み合わせの９５％で、偏っていないことを示した。８９の個々のクローンを配列決定して、存在する異なる組み合わせを確認した。変異体はすべて選択されたコロニー中で表わされ、そして追加的に、８９の経路はすべて、変異体の特有の組み合わせを有していた（図１５Ｂ）。

【0195】

実施例１７．変異体のコンビナトリアルアセンブリ

【0196】

変異体のコンビナトリアルアセンブリを、本明細書に記載される通りの方法を使用して行った。長さがおよそ１．５ｋｂで最大１００の変異体を伴う２つの入力集団（またはドメイン）を、各々アセンブルした（変異体Ｘの数）：
５’ベクター－ドメイン１（Ｘ）－定常ドメイン－ドメイン３（Ｘ）－３’ベクター

【0197】

複雑さが増加する４つのプール（４、１０、５０、１００の変異体）を最大１００，０００の組み合わせと共に生成した。プールは、均一のアセンブリを示した（図１５Ｃ、図１５Ｄ、および表１８）。

【0198】

【表16】

【0199】

実施例１８．２５０，０００の配列の多様な遺伝子プールをアセンブルすること

【0200】

実施例７の一般的な方法に従って、ウイルスタンパク質をコードする２５０Ｋの配列を、１１のサブ遺伝子プールを通して作り出した。配列は、最初に第１のアダプターに隣接され、その後に遠位端で第２のアダプターに隣接される、ウイルスタンパク質ＤＮＡを含んでいた。４５０ｂｐの遺伝子は、配列多様性によってプール間で分配され、１つのプールあたり平均２３ｋの遺伝子となった（図１６Ａおよび図１６Ｂ）。プールをアセンブルし、そしてＰＣＲ増幅して、デジタルＤＮＡ電気泳動で視覚化した（図１６Ｃ）。遺伝子プールの質を、標準化された５０ｘ遺伝子適用範囲で評価した（図１６Ｄおよび図１６Ｅ）。９０番目のパーセンタイル／１０番目のパーセンタイルの比は、平均で、集団の８０％が平均の１０．８ｘ以内にあることを示す。プールをさらに、ドロップアウト（プールから喪失）、過小表示（平均の＜１０ｘ）、およびランナウェイ（平均の＞１０ｘ）によって特徴付けた（図１６Ｆ）。平均で、遺伝子の＞９８％で、５０ｘＮＧＳ適用範囲で完全配列を検出した（図１６Ｆ）。

【0201】

本発明の好ましい実施形態が本明細書中で示され、そして説明されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。

【図1A】