(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-26
(54)【発明の名称】連続配列決定に関する方法および組成物
(51)【国際特許分類】
C12N 15/11 20060101AFI20241219BHJP
C12Q 1/6869 20180101ALI20241219BHJP
C12M 1/00 20060101ALI20241219BHJP
C12Q 1/6876 20180101ALI20241219BHJP
C12M 1/42 20060101ALI20241219BHJP
【FI】
C12N15/11 Z
C12Q1/6869 Z
C12M1/00 A
C12Q1/6876 Z
C12M1/42
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024536309
(86)(22)【出願日】2022-10-17
(85)【翻訳文提出日】2024-06-17
(86)【国際出願番号】 US2022046906
(87)【国際公開番号】W WO2023069367
(87)【国際公開日】2023-04-27
(32)【優先日】2021-10-18
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】516040017
【氏名又は名称】ツイスト バイオサイエンス コーポレーション
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】ラッキー,ジェレミー
(72)【発明者】
【氏名】バンニャイ,ウィリアム
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029AA23
4B029FA15
4B063QA20
4B063QQ42
4B063QR32
4B063QS32
4B063QS33
4B063QS34
4B063QX02
4B063QX05
(57)【要約】
本明細書には、ポリヌクレオチド配列決定のための組成物、デバイス、システム、および方法が提供される。さらに、連続配列決定のための表面を含むデバイスがさらに提供される。本発明に記載される組成物、デバイス、システム、および方法は、生体分子に基づく情報の保存、密度および検索の改善を可能にする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
ポリヌクレオチド配列決定のための方法であって、以下を含む:a) 複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する;b) ポリヌクレオチドの1つ以上の塩基を検出するステップであって、複数の三元複合体が表面に結合しているときに検出が起こるステップと、c) 表面から三元錯体を除去するステップと、d)工程a~cを繰り返してポリヌクレオチドを配列決定する工程。
【請求項2】
ステップc)は、表面を洗浄することを含むことを特徴とする請求項1に記載の方法。
【請求項3】
洗浄は、表面を溶媒、熱、小分子、核酸、またはタンパク質の1つ以上と接触させることを含むことを特徴とする請求項1に記載の方法。
【請求項4】
小分子は、第2の部分へのコンジュゲーションのために構成された第1の部分を含むことを特徴とする請求項3に記載の方法。
【請求項5】
コンジュゲーションは求核剤/カルボニルを含む;アジド/ホスフィン;1,4マイケル付加、1,3-双極子環状付加、逆電子要求環状付加;オレフィンメタセシス;またはクロスカップリング反応であることを特徴とする請求項4に記載の方法。
【請求項6】
小分子は、ビオチン、アルキン、アザイド、テトラジン、アルケン、アルキン、カルボニル、マイケル受容体/供与体、または抗原を含むことを特徴とする請求項3に記載の方法。
【請求項7】
溶媒は有機溶媒を含むことを特徴とする請求項3に記載の方法。
【請求項8】
有機溶媒は、MeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、ホルムアミド、THF、またはDMSOを含むことを特徴とする請求項3に記載の方法。
【請求項9】
有機溶媒を加熱することを特徴とする請求項8に記載の方法。
【請求項10】
タンパク質は、プロテイナーゼまたはヌクレアーゼを含むことを特徴とする請求項3に記載の方法。
【請求項11】
プロテイナーゼはアミノペプチダーゼを含むことを特徴とする請求項10に記載の方法。
【請求項12】
アミノペプチダーゼは、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはL ysCを含むことを特徴とする請求項11に記載の方法。
【請求項13】
タンパク質はストレプトアビジンを含むことを特徴とする請求項3に記載の方法。
【請求項14】
ポリメラーゼは、Phi29ポリメラーゼまたはその変異体を含むことを特徴とする請求項1に記載の方法。
【請求項15】
ポリメラーゼは、工程a)において表面に結合されることを特徴とする請求項1に記載の方法。
【請求項16】
ポリメラーゼは、工程a)において表面に結合しないことを特徴とする請求項1に記載の方法。
【請求項17】
複数のポリヌクレオチドは、少なくとも100,000個のユニークなポリヌクレオチドを含む。54であることを特徴とする請求項1に記載の方法。
【請求項18】
複数のポリヌクレオチドは50~30,000塩基長であることを特徴とする請求項1に記載の方法。
【請求項19】
検出は、独特の波長、蛍光寿命、または電流もしくは電圧の変化を使用する塩基の同定を含むことを特徴とする請求項1に記載の方法。
【請求項20】
検出は、合成による配列決定およびナノポア検出の1つ以上を含むことを特徴とする請求項1に記載の方法。
【請求項21】
検出はFRETを含むことを特徴とする請求項1に記載の方法。
【請求項22】
検出することは、三元複合体を少なくとも1つのヌクレオチドと接触させることを含むことを特徴とする請求項1に記載の方法。
【請求項23】
ヌクレオチドは標識を含むことを特徴とする請求項22に記載の方法。
【請求項24】
標識は発光標識を含むことを特徴とする請求項23に記載の方法。
【請求項25】
発光標識は色素であることを特徴とする請求項24に記載の方法。
【請求項26】
ポリメラーゼは量子ドットに結合されることを特徴とする請求項1に記載の方法。
【請求項27】
複数のポリヌクレオチドは、工程a)において表面に結合されることを特徴とする請求項1に記載の方法。
【請求項28】
検出することは、電磁エネルギーによる励起を含むことを特徴とする請求項1に記載の方法。
【請求項29】
検出は、レーザーによる励起を含むことを特徴とする請求項28に記載の方法。
【請求項30】
レーザはパルス状であることを特徴とする請求項29に記載の方法。
【請求項31】
複数のポリヌクレオチドはヘアピンアダプターを含むことを特徴とする請求項1に記載の方法。
【請求項32】
複数のポリヌクレオチドは環状であることを特徴とする請求項1に記載の方法。
【請求項33】
ステップa~cは、少なくとも3回繰り返されることを特徴とする請求項1に記載の方法。
【請求項34】
ステップa~cを少なくとも20回繰り返すことを特徴とする請求項1に記載の方法。
【請求項35】
ステップa~cは、10分以下で行われることを特徴とする請求項1に記載の方法。
【請求項36】
ステップcは、5分以下で行われることを特徴とする請求項1に記載の方法。
【請求項37】
ポリヌクレオチド配列決定のための方法であって、以下を含む:a) 表面上の複数のポリヌクレオチドの配列決定であって、表面が単分子配列決定のための複数の遺伝子座を含む、配列決定;b) 表面からポリヌクレオチドを除去する;c)ステップa~bを繰り返してポリヌクレオチドを配列決定し、少なくとも1メガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される。
【請求項38】
少なくとも1ギガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得されることを特徴とする請求項37に記載の方法。
【請求項39】
少なくとも1テラバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される。55であることを特徴とする請求項37に記載の方法。
【請求項40】
1メガバイト~1ゼータバイトの配列決定データは、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得されることを特徴とする請求項37に記載の方法。
【請求項41】
複数のポリヌクレオチドは、少なくとも1Gbのデジタル情報をコードすることを特徴とする請求項37に記載の方法。
【請求項42】
デジタル情報のアイテムを符号化する方法であって、以下を含む:a) デジタルシーケンスとして情報アイテムを提供するステップと、b) デジタル配列を核酸配列としてコードする;c)請求項1~36のいずれかに記載の複数のポリヌクレオチドを生成すること。
【請求項43】
デジタル情報のアイテムを復号するための方法であって、以下を含む:a) 請求項1~36のいずれかに記載の方法を用いて、前記複数のポリヌクレオチドの核酸配列を得る工程;b) 核酸配列を1つ以上のデジタル配列に解読するステップ;c)1つ以上のデジタルシーケンスを使用してデジタル情報のアイテムを読み取るステップ。
【請求項44】
核酸配列決定のためのデバイスであって、以下を含む:(a) 表面を含み、前記表面が複数の遺伝子座を含む、固体支持体;(b) 前記遺伝子座の少なくともいくつかを覆う結合部分であって、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成され、前記表面が再利用可能である、結合部分;(c)検出器であって、ポリメラーゼによって付加された1つ以上の塩基のアイデンティティを識別するように構成されている検出器。
【請求項45】
表面は、結合部分の除去なしに再利用可能であることを特徴とする請求項44に記載の装置。
【請求項46】
表面は、化学修飾なしで再利用可能であることを特徴とする請求項44に記載の装置。
【請求項47】
デバイスは、mm2当たり少なくとも100,000個の遺伝子座を含むことを特徴とする請求項44に記載の装置。
【請求項48】
デバイスは、mm2当たり少なくとも1,000,000遺伝子座を含むことを特徴とする請求項44に記載の装置。
【請求項49】
デバイスは、mm2当たり100,000~10億の遺伝子座を含むことを特徴とする請求項44に記載の装置。
【請求項50】
プライマーは、15~50塩基の長さを有することを特徴とする請求項44に記載の装置。
【請求項51】
表面は、複数のウェルまたはチャネルを含むことを特徴とする請求項44に記載の装置。
【請求項52】
ウェルまたはチャネルは、10~200nmの最長線寸法を有することを特徴とする請求項44に記載の装置。
【請求項53】
デバイスは、1つ以上のナノ細孔をさらに含むことを特徴とする請求項44に記載の装置。
【請求項54】
表面は実質的に平面であることを特徴とする請求項44に記載の装置。
【請求項55】
固体支持体は、ガラス、シリコン、またはこれらの組み合わせを含む。56であることを特徴とする請求項44に記載の装置。
【請求項56】
表面は、それに結合した複数のポリメラーゼを含むことを特徴とする請求項44に記載の装置。
【請求項57】
表面は、それに結合した複数のポリヌクレオチドを含むことを特徴とする請求項44に記載の装置。
【請求項58】
表面は、ポリヌクレオチド、ポリメラーゼ、またはプライマーのうちの2つ以上を含む複合体を含むことを特徴とする請求項44に記載の装置。
【請求項59】
遺伝子座の少なくとも1%は、ポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含む、請求項44に記載の装置。
【請求項60】
遺伝子座の少なくとも30%は、ポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含む、請求項44に記載の装置。
【請求項61】
複合体は共有結合を介して結合することを特徴とする請求項44に記載の装置。
【請求項62】
複合体は、非共有結合を介して結合することを特徴とする請求項44に記載の装置。
【請求項63】
複合体は、親和性相互作用、タンパク質、オリゴヌクレオチド、または熱放出可能な結合を介して結合されることを特徴とする請求項44に記載の装置。
【請求項64】
親和性相互作用はストレプトアビジン-ビオチンを含むことを特徴とする請求項44に記載の装置。
【請求項65】
親和性相互作用は、抗体-抗原結合を含むことを特徴とする請求項44に記載の装置。
【請求項66】
親和性相互作用は、タンパク質-タンパク質相互作用を含むことを特徴とする請求項44に記載の装置。
【請求項67】
流体インターフェースをさらに含む請求項44に記載の装置。
【請求項68】
フローセルをさらに含む請求項44に記載の装置。
【請求項69】
デバイスは、遺伝子座毎に少なくとも1つの検出器を含むことを特徴とする請求項44に記載の装置。
【請求項70】
検出器は、複数のゼロモード導波路を含むことを特徴とする請求項44に記載の装置。
【請求項71】
検出器は、可視波長、UV波長、またはそれらの組み合わせを測定するように構成されることを特徴とする請求項44に記載の装置。
【請求項72】
検出器は、蛍光を測定するように構成されることを特徴とする請求項44に記載の装置。
【請求項73】
検出器は、電圧または電流の変化を測定するように構成されることを特徴とする請求項44に記載の装置。
【請求項74】
ポリヌクレオチド合成デバイス。57をさらに含む請求項44に記載の装置。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、その全体が参照により組み込まれる米国特許仮出願63/256,866号(2021年10月18日)の利益を主張する。
【背景技術】
【0002】
生体分子(例えば、核酸)は、研究、医学、および情報保存における用途を有する。しかしながら、生体分子を配列決定するための高密度、スケーラブル、自動化、高度に正確かつ高度に効率的なシステムが必要とされている。
【発明の概要】
【0003】
本明細書では、以下の工程を含むポリヌクレオチド配列決定のための方法が提供される:a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する;b)ポリヌクレオチドの1つ以上の塩基を検出するステップであって、複数の三元複合体が表面に結合しているときに検出が起こるステップと、c)表面から三元錯体を除去するステップと、d)工程a~cを繰り返してポリヌクレオチドを配列決定する工程。さらに本明細書では、工程c)が表面を洗浄することを含む方法が提供される。洗浄が、表面を溶媒、熱、小分子、核酸、またはタンパク質の1つ以上と接触させることを含む方法が本明細書でさらに提供される。本明細書においてさらに提供されるのは、小分子が、第2の部分へのコンジュゲーションのために構成された第1の部分を含む方法である。さらに本明細書では、コンジュゲーションが求核剤/カルボニルを含む方法が提供される;アジド/ホスフィン;1,4マイケル付加、1,3-双極子環状付加、逆電子要求環状付加;オレフィンメタセシス;またはクロスカップリング反応。さらに本明細書では、小分子がビオチン、アルキン、アザイド、テトラジン、アルケン、アルキン、カルボニル、マイケル受容体/供与体、または抗原を含む方法が提供される。溶媒が有機溶媒を含む方法が本明細書でさらに提供される。さらに本明細書では、有機溶媒がMeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、ホルムアミド、THF、またはDMSOを含む方法が提供される。さらに本明細書では、有機溶媒を加熱する方法が提供される。さらに本明細書では、タンパク質がプロテイナーゼまたはヌクレアーゼを含む方法が提供される。本明細書においてさらに提供されるのは、プロテイナーゼがアミノペプチダーゼを含む方法である。アミノペプチダーゼが、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはL ysCを含む方法が、本明細書においてさらに提供される。さらに本明細書では、タンパク質がストレプトアビジンを含む方法が提供される。本明細書においてさらに提供されるのは、ポリメラーゼがPhi29ポリメラーゼまたはその変異体を含む方法である。本明細書においてさらに提供されるのは、工程a)においてポリメラーゼが表面に結合される方法である。本明細書においてさらに提供されるのは、工程a)においてポリメラーゼが表面に結合しない方法である。複数のポリヌクレオチドが少なくとも100,000個のユニークなポリヌクレオチドを含む方法が本明細書においてさらに提供される。本明細書においてさらに提供されるのは、複数のポリヌクレオチドが50~30,000塩基長である方法である。さらに、本明細書では、検出が、ユニークな波長、蛍光寿命、または電流もしくは電圧の変化を使用する塩基の同定を含む方法が提供される。さらに、検出が合成による配列決定およびナノポア検出の1つ以上を含む方法が本明細書において提供される。さらに本明細書では、検出がFRETを含む方法が提供される。さらに本明細書では、検出が三元複合体を少なくとも1つのヌクレオチドと接触させることを含む方法が提供される。本明細書においてさらに提供されるのは、ヌクレオチドが標識を含む方法である。本明細書においてさらに提供されるのは、標識が発光標識を含む方法である。本明細書においてさらに提供されるのは、発光標識が色素である方法である。本明細書においてさらに提供されるのは、ポリメラーゼが量子ドットに結合される方法である。さらに、複数のポリヌクレオチドが工程a)において表面に結合される方法が本明細書において提供される。さらに本明細書では、検出が電磁エネルギーによる励起を含む方法が提供される。本明細書においてさらに提供されるのは、検出がレーザーによる励起を含む方法である。さらに、レーザがパルス化される方法が本明細書で提供される。さらに本明細書では、複数のポリヌクレオチドがヘアピンアダプターを含む方法が提供される。本明細書においてさらに提供されるのは、複数のポリヌクレオチドが環状である方法である。さらに本明細書では、工程a~cを少なくとも3回繰り返す方法が提供される。さらに本明細書では、工程a~cを少なくとも20回繰り返す方法が提供される。さらに本明細書では、工程a~cが10分以下で行われる方法が提供される。さらに本明細書では、工程cが5分以下で起こる方法が提供される。
【0004】
本明細書では、以下の工程を含むポリヌクレオチド配列決定のための方法が提供される:a)表面上の複数のポリヌクレオチドの配列決定であって、表面が単分子配列決定のための複数の遺伝子座を含む、配列決定;b)表面からポリヌクレオチドを除去する;c)ステップa~bを繰り返してポリヌクレオチドを配列決定し、少なくとも1メガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される。本明細書においてさらに提供されるのは、少なくとも1ギガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以下で取得される方法である。本明細書においてさらに提供されるのは、少なくとも1テラバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以下で取得される方法である。1メガバイト~1ゼータバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される方法が、本明細書においてさらに提供される。本明細書においてさらに提供されるのは、複数のポリヌクレオチドが少なくとも1Gbのデジタル情報をコードする方法である。
【0005】
本明細書では、デジタル情報のアイテムを符号化する方法が提供され、この方法は、a)デジタルシーケンスとして情報アイテムを提供するステップと、b)デジタル配列を核酸配列としてコードする;c)本明細書に記載の複数のポリヌクレオチドを生成すること。
【0006】
本明細書では、デジタル情報のアイテムを復号するための方法が提供され、この方法は、本明細書に記載の方法を用いて複数のポリヌクレオチドの核酸配列を得る工程;核酸配列を1つ以上のデジタル配列に解読するステップ;そして、1つ以上のデジタルシーケンスを使用してデジタル情報のアイテムを読み取る。
【0007】
本明細書では、以下を含む核酸配列決定のためのデバイスが提供される:表面を含み、前記表面が複数の遺伝子座を含む、固体支持体;前記遺伝子座の少なくともいくつかを覆う結合部分であって、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成され、前記表面が再利用可能である、結合部分;検出器であって、前記検出器は、前記ポリメラーゼによって付加された1つ以上の塩基のアイデンティティを識別するように構成される、検出器。本明細書においてさらに提供されるのは、表面が結合部分の除去なしに再使用可能であるデバイスである。さらに、表面が化学修飾なしで再使用可能であるデバイスが本明細書で提供される。mm2当たり少なくとも100,000個の遺伝子座を含むデバイスが、本明細書においてさらに提供される。デバイスがmm2当たり少なくとも1,000,000遺伝子座を含むデバイスが本明細書でさらに提供される。mm2当たり100,000~10億の遺伝子座を含むデバイスが、本明細書においてさらに提供される。
プライマーが15~50塩基の長さを有するデバイスが本明細書においてさらに提供される。さらに本明細書では、表面が複数のウェルまたはチャネルを含むデバイスが提供される。本明細書においてさらに提供されるのは、ウェルまたはチャネルが10~200nmの最長線寸法を有するデバイスである。1つ以上のナノ細孔をさらに含むデバイスが、本明細書においてさらに提供される。本明細書においてさらに提供されるのは、表面が実質的に平坦な表面であるデバイスである。固体支持体が、ガラス、シリコン、またはそれらの組み合わせを含むデバイスが、本明細書においてさらに提供される。本明細書においてさらに提供されるのは、表面が、それに結合した複数のポリメラーゼを含むデバイスである。本明細書においてさらに提供されるのは、表面が、それに結合した複数のポリヌクレオチドを含むデバイスである。表面が、ポリヌクレオチド、ポリメラーゼ、またはプライマーのうちの2つ以上を含む複合体を含むデバイスが、本明細書においてさらに提供される。さらに本明細書では、遺伝子座の少なくとも1%がポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含むデバイスが提供される。さらに本明細書では、遺伝子座の少なくとも30%がポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含むデバイスが提供される。本明細書ではさらに、複合体が共有結合を介して結合しているデバイスが提供される。本明細書では、複合体が非共有結合を介して結合しているデバイスがさらに提供される。本明細書においてさらに提供されるのは、複合体が親和性相互作用、タンパク質、オリゴヌクレオチド、または熱放出可能な結合を介して結合しているデバイスである。本明細書においてさらに提供されるのは、親和性相互作用がストレプトアビジン-ビオチンを含むデバイスである。さらに本明細書では、親和性相互作用が抗体-抗原結合を含むデバイスが提供される。さらに本明細書では、親和性相互作用がタンパク質-タンパク質相互作用を含むデバイスが提供される。さらに、流体インターフェースをさらに備えるデバイスが本明細書で提供される。フローセルをさらに含むデバイスが本明細書でさらに提供される。本明細書においてさらに提供されるのは、デバイスが遺伝子座当たり少なくとも1つの検出器を含むデバイスである。検出器が複数のゼロモード導波路を含むデバイスが本明細書でさらに提供される。さらに、検出器が、可視波長、UV波長、またはそれらの組み合わせを測定するように構成される、デバイスが、本明細書に提供される。さらに本明細書では、検出器が蛍光を測定するように構成されるデバイスが提供される。さらに、検出器が電圧または電流の変化を測定するように構成されるデバイスが本明細書で提供される。本明細書においてさらに提供されるのは、ポリヌクレオチド合成デバイスをさらに含むデバイスである。
【0008】
参照による援用
本明細書で言及される全ての刊行物、特許、および特許出願は、あたかも各個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれることが示されるのと同程度に、参照により本明細書に援用される。
【図面の簡単な説明】
【0009】
本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴および利点のより良い理解は、本発明の原理が利用される例示的な実施形態を記載する以下の詳細な説明および添付の図面を参照することによって得られるであろう:
【0010】
【
図1】配列決定前のポリヌクレオチド合成および調製のためのスキームの非限定的な例を示す;
【
図2】この場合は再使用可能な配列決定チップを用いる、ポリヌクレオチド配列決定のためのスキームの非限定的な例を示す;
【
図3A】スポットを有する、可撓性構造のズームインを描写する。
【
図3B】チャネルを有する、可撓性構造のズームインを描写する。
【
図3C】ウェルを有する、可撓性構造のズームインを描写する。
【
図4A】活性領域および流体界面を含む固体支持体の概略図である;そして
【
図4B】固体支持体アレイの一例の正面図である。いくつかの例におけるそのようなアレイは、本明細書に記載のポリヌクレオチド合成デバイスを数万または数万含み得る;
【
図5】ラック型器具の例である。そのような器具は、数万個以上の固体支持アレイを含み得る。
【
図7】コンピュータシステムのアーキテクチャを示すブロック図である。
【
図8】複数のコンピュータシステム、複数の携帯電話および携帯情報端末、ならびにネットワーク接続ストレージ(NAS)を組み込むように構成されたネットワークを示す図である。
【
図9】共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステムのブロック図である。
【発明を実施するための形態】
【0011】
生成および記憶される情報の量が指数関数的に増加するにつれて、より大容量の記憶システムが必要とされている。DNA分子などの生体分子は、従来のバイナリ情報コーディングとは対照的に、時間にわたるその安定性および4ビット情報コーディングの能力により、部分的に情報記憶に適したホストを提供する。本明細書で提供されるのは、連続ワークフローを使用して核酸読み取り速度および効率を増加させるためのデバイスおよび方法である。本明細書においてさらに提供されるのは、単分子配列決定のために表面を再利用または再利用するためのデバイスおよび方法である。
【0012】
定義
別段の定義がない限り、本明細書で使用されるすべての技術用語および科学用語は、これらの発明が属する技術分野の当業者によって通常理解されるのと同じ意味を有する。
【0013】
本開示を通して、数値的特徴は範囲形式で提示される。範囲形式での記載は、単に便宜上および簡潔さのためであり、任意の実施形態の範囲に対する柔軟性のない限定として解釈されるべきではないことを理解されたい。したがって、範囲の記載は、文脈が明確に別段の指示がない限り、その範囲内の全ての可能な部分範囲ならびに個々の数値を下限の単位の10分の1まで具体的に開示していると見なされるべきである。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などの部分範囲、ならびにその範囲内の個々の値、例えば、1.1,2,2.3,5,および5.9を具体的に開示していると見なすべきである。これは、範囲の幅にかかわらず適用される。これらの介在する範囲の上限および下限は、より小さな範囲に独立して含まれてもよく、また本発明に包含され、記載された範囲内の任意の具体的に除外された限界に従う。記載された範囲が限界値の一方または両方を含む場合、それらの含まれる限界値の一方または両方を除外する範囲もまた、文脈が明らかに別段の指示がない限り、本発明に含まれる。
【0014】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、いかなる実施形態も限定することを意図していない。本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈が明確に別段の指示がない限り、複数形も含むものとする。さらに、「備える(comprises)」および/または「備える(comprising)」という用語は、本明細書で使用される場合、述べられた特徴、整数、ステップ、動作、要素、および/または構成要素の存在を指定するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除しないことが理解されよう。本明細書で使用される場合、「および/または」という用語は、関連する列挙された項目のうちの1つ以上の任意のおよび全ての組み合わせを含む。
【0015】
特に明記しない限り、または文脈から明らかでない限り、本明細書で使用する場合、数または数の範囲に関する用語「約」は、その明記された数および数/-10%、またはある範囲について列挙された値について列挙された下限より下の10%および列挙された上限より上の10%を意味すると理解される。
【0016】
本明細書中で使用される場合、用語「予め選択された配列」、「予め定義された配列」または「予め決定された配列」は、交換可能に使用される。これらの用語は、ポリマーの配列が既知であり、ポリマーの合成または組み立ての前に選択されることを意味する。特に、本発明の様々な態様は、主に核酸分子の調製に関して本明細書に記載され、ポリヌクレオチドの配列は、核酸分子の合成またはアセンブリの前に公知であり、選択される。
【0017】
本明細書で使用する「シンボル」という用語は、概して、デジタル情報の単位の表現を指す。デジタル情報は、1つまたは複数のシンボルに分割または変換され得る。ある例では、シンボルはビットであり得、ビットは数値を有し得る。いくつかの例では、シンボルは「0」または「1」の値を有し得る。いくつかの例では、デジタル情報は、シンボルのシーケンスまたはシンボルのストリングとして表され得る。いくつかの例では、シンボルのシーケンスまたはシンボルのストリングはバイナリデータを備え得る。
【0018】
合成(例えば、de novo合成または化学合成)ポリヌクレオチドの生成および配列決定のための方法および組成物が本明細書において提供される。ポリヌクレオチドはまた、オリゴヌクレオチドまたはオリゴと称され得る。本明細書に記載されるポリヌクレオチド配列は、別段の記載がない限り、DNAまたはRNAを含み得る。
【0019】
連続配列決定
本明細書に記載の方法を用いて配列決定されたポリヌクレオチドは、合成されたポリヌクレオチドの配列を読み取り、その配列をバイナリーコードなどのコンピューターによって読み取り可能な1つまたは複数の記号を含むコードに変換することによって解釈することができるデータをコードする。場合によっては、配列はアセンブリを必要とし、アセンブリ工程は核酸配列段階またはデジタル配列段階で起こり得る。場合によっては、配列決定は、配列中の個々の塩基の識別的同定/検出を含む。場合によっては、配列決定は、デバイス上の個々の分子に対して行われる。
【0020】
本明細書で提供されるのは、本明細書に記載のデバイスに組み込むことができる配列決定システムである。配列決定の様々な方法が当技術分野において周知であり、試料ポリヌクレオチド中の塩基のアイデンティティが同定/配列決定される「塩基呼び出し」を含む。場合によっては、本明細書に記載される方法、デバイス、組成物、およびシステムを使用して合成されるポリヌクレオチドは、合成表面からの切断後に配列決定される。いくつかの例では、配列決定は、ポリヌクレオチド合成中またはポリヌクレオチド合成と同時に起こり、塩基呼び出しは、ヌクレオシドモノマーの伸長直後または伸長前に起こる。塩基呼び出しのための方法は、電流/電圧(例えば、ACまたはDC)、蛍光の測定、または鋳型鎖への塩基のポリメラーゼ触媒付加(または過渡的結合)によって生成される他の測定を含む。いくつかの例では、合成表面または配列決定表面は、ポリメラーゼなどの酵素を含む。場合によっては、そのような酵素は、電極または合成もしくは配列決定表面に係留される。場合によっては、合成または配列決定表面は、複数の遺伝子座(例えば、配列スポット)またはウェル(例えば、ナノ細孔)を含む。配列決定後、場合によっては、ポリメラーゼ、プライマー、またはサンプルポリヌクレオチドのうちの1つ以上が、デバイスの表面から除去され、新しい成分が、同じデバイス表面を使用する配列決定の第2のサイクルを促進するように添加される。場合によっては、このプロセスを多数回繰り返して、多数の試料ポリヌクレオチドを配列決定する。
【0021】
本明細書において提供されるのは、構造上に直接、および/または構造(例えば、固体支持体)から除去した後に、保存されたポリヌクレオチドを配列決定するためのデバイスを含む検出システムである。場合によっては、デバイスは、表面、流体インターフェース、および検出器のうちの1つ以上を備える。いくつかの例では、シグナルは、ポリヌクレオチドの存在を示す。いくつかの例では、シグナルは、ポリヌクレオチドの配列を示す(例えば、蛍光シグナル)。いくつかの例では、検出システムは、ポリヌクレオチド配列決定デバイス、ポリヌクレオチド配列に関連するデータの保存および検索のためのデータベース、ポリヌクレオチド配列のDNAコードをバイナリーコードなどの1つまたは複数の記号に変換するためのソフトウェア、バイナリーコードを読み取るためのコンピュータ、またはそれらの任意の組合せを含むコンピュータシステムを含む。いくつかの例では、本明細書に記載されるものは、固体支持体、遺伝子座の少なくともいくつかを覆う結合部分、および検出器のうちの1つ以上を含む。いくつかの例では、遺伝子座の少なくともいくつかは、単一のサンプルポリヌクレオチドを含む。いくつかの例では、固体支持体は表面を含む。いくつかの例では、表面は複数の遺伝子座を含む。場合によっては、結合部分は、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成される。場合によっては、検出器は、ポリメラーゼによって付加された1つ以上の塩基のアイデンティティを識別するように構成される。いくつかの例では、表面は再利用可能である。
【0022】
本明細書で説明されるデバイスは、1つ以上の検出器を備えてもよい。いくつかの例では、検出器は電磁放射線源を含む。場合によっては、電磁放射線源は、可視、赤外、またはUV波長光を生成するように構成される。場合によっては、デバイスは、1つ以上のゼロモード導波路を備える。いくつかの例では、デバイスは1つ以上のナノ細孔を含む。
【0023】
本明細書で説明されるデバイスは、可撓性表面を備える構造を備えてもよい。構造体が可撓性材料のリールツーリールテープである場合、検出システムは、場合によっては、構造体を保持し、検出位置を通って前進させるためのデバイスと、検出位置に近接して配置され、セクションが検出位置にあるときにテープのセクションから生じる信号を検出するための検出器とを備える。場合によっては、連続テープ上のポリヌクレオチド内にコードされる情報は、テープがコンピュータに動作可能に接続された検出器を通して連続的に搬送される際にコンピュータによって読み取られる。
【0024】
ポリヌクレオチド配列決定のための方法が本明細書において提供される。いくつかの例では、本明細書に記載される方法は、(a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する1つ以上のステップを含む;(b)ポリヌクレオチドの1つ以上の塩基を検出するステップであって、複数の三元複合体が表面に結合しているときに検出が起こるステップと、(c)表面から三元錯体を除去するステップと、(d)工程a~cを繰り返してポリヌクレオチドを配列決定する工程。いくつかの例では、方法は、表面を洗浄することを含む。配列決定の前に、ポリヌクレオチドを合成し、非限定的な例において、
図1に示すスキームを通して、配列決定のために調製する。ポリヌクレオチドは、本明細書に記載の方法を用いて合成表面101上で合成される。DNA合成102が行われ、合成表面103上に複数のポリヌクレオチドが得られる。合成されたポリヌクレオチドは、表面104から除去され、例えば、微量遠心管または他の好適な媒体もしくは容器に収集される。いくつかの例では、遊離ポリヌクレオチド105を含む微量遠心管は、ポリヌクレオチドを保存するのに適した緩衝溶液を含む。いくつかの例において、該ポリヌクレオチドは環状である。いくつかの場合において、ポリヌクレオチドはヘアピンアダプターを含む。場合によっては、ポリヌクレオチドは、合成表面上で、または合成チップから除去された後に増幅される。プライマー107およびポリメラーゼ酵素109もポリヌクレオチドと接触させる。場合によっては、プライマー107は、次のステップ106においてポリヌクレオチドに添加され、プライマーおよびポリヌクレオチド複合体108をもたらす。いくつかの場合において、プライマー107は、10塩基対、20塩基対、30塩基対、40塩基対、50塩基対、または60塩基対以下である。さらなる場合において、ポリメラーゼ酵素109は、さらなるステップ110において微量遠心管に添加され、複数の三元複合体111をもたらす。いくつかの例では、ポリメラーゼ酵素109は、結合部分であり得る第1の部分を含む。いくつかの例では、ポリメラーゼ酵素109上の第1の部分はビオチンを含む。いくつかの例では、ポリメラーゼ酵素109上の第1の部分はタンパク質鎖を含む。いくつかの例では、ポリメラーゼ酵素109上の第1の部分はオリゴヌクレオチドを含む。いくつかの例では、ポリメラーゼ酵素109は、非限定的な例として、バクテリオファージphi29(029)ポリメラーゼ、遺伝子改変phi29(029)DNAポリメラーゼ、サーミネーターDNAポリメラーゼ、DNAポリメラーゼIのKI enow断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ(例えば、VentR(エキソ-)DNAポリメラーゼ)を含む。Deep Vent DNAポリメラーゼ(例えば、Deep Vent(エキソ-)DNAポリメラーゼ)、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、T5 DNAポリメラーゼ、Sequenase、T7 DNAポリメラーゼ、T7-Sequenase、T7 gp5 DNAポリメラーゼ、PRDI DNAポリメラーゼ、またはT4 DNAポリメラーゼ。いくつかの例では、追加の鎖置換核酸ポリメラーゼもまた、本明細書に記載される方法と適合性である。所与のポリメラーゼが鎖置換複製を行う能力は、例えば、鎖置換複製アッセイにおいてポリメラーゼを使用して決定することができる。このようなアッセイは、場合によっては、使用される酵素の最適な活性に適した温度、例えば、phi29 DNAポリメラーゼについては32°C、exo(-)Bst DNAポリメラーゼについては46°C~64°C、または超好熱性生物由来の酵素については約60°C~70°Cで実施される。いくつかの例では、ポリメラーゼを選択するための別の有用なアッセイは、プライマーブロックアッセイである。いくつかの例では、ポリメラーゼは、Cl、C2、P4-XL、P5-C3、またはP6-C4(Pacific Biosciences)を含む。
【0025】
構造の表面からのポリヌクレオチドの抽出および/または増幅後、適切な配列決定技術を用いてポリヌクレオチドを配列決定することができる。いくつかの場合において、ポリヌクレオチド配列は、構造(本明細書において反応部位とも呼ばれる)の表面上の基質上または構造(例えば、ナノウェル、マイクロウェル、ナノポアなど。)のフィーチャ内で読み取られる。いくつかの例では、構造体は金属膜を含む。いくつかの例では、構造は、
図2に示すような単分子配列決定チップ203である。いくつかの場合において、ポリヌクレオチドは、場合により、より長い核酸に組み立てられ、次いで配列決定される。ポリヌクレオチド三元複合体ライブラリ201は、複数の三元複合体111から作製され、配列決定される単一分子配列決定チップ203上にロードされる(例えば、固定化される)。いくつかの例では、ポリヌクレオチド三元複合体ライブラリ201は、少なくとも100,000、100万、1000万、5000万、1億、2億、5億、または少なくとも7.5億のユニークなポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド三元複合体ライブラリ201は、約1~750、1~500、1~250、1~100、または1~1000万のユニークなポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド三元複合体ライブラリ201は、100,000個、100万個、1000万個、5000万個、1億個、2億個、5億個、または少なくとも7.5億個のユニークなポリヌクレオチドを含む。単一分子配列決定チップ203は、三元複合体ライブラリ201における三元複合体を固定するための遺伝子座を含む。いくつかの例では、単一分子配列決定チップ203は、少なくとも50,000、100,000、200,000、500,000、750,000、100万、200万、500万、800万、1000万、または少なくとも2000万遺伝子座を含む。いくつかの例では、単一分子配列決定チップ203は、80,000~2000万、100万~2000万、100万~1000万、または500万~2000万遺伝子座を含む。いくつかの例では、単一分子配列決定チップ203は、50,000、100,000、200,000、500,000、750,000、100万、200万、500万、800万、1000万以下、または2000万以下の遺伝子座を含む。
【0026】
本明細書で説明される構成要素(例えば、基板)は、表面に付着または固定されてもよい。場合によっては、基質(例えば、ポリヌクレオチド、ポリメラーゼ、プライマー、またはそれらの任意の組み合わせの複合体)は、材料を含む反応部位の表面上に固定化され、および/または付着のために基質とのカップリング反応を促進する材料でコーティングされる。そのような場合、基板表面または表面の選択された部位もしくは領域の1つまたは複数の化学的および/または物理的特性を変化させるために、加法的または減法的プロセスによって基板表面を化学的および/または物理的に変化させる表面改質を使用することができる。例えば、表面修飾は、(1)表面の湿潤特性を変化させること、(2)表面を官能化すること、例えば、表面官能基を提供すること、修飾すること、または置換すること、(3)表面を脱官能化すること、例えば、表面官能基を除去すること、(4)そうでなければ、例えば、エッチングを通して、表面の化学組成を変化させることを含む。(5)表面粗さを増加または減少させること、(6)表面上にコーティング、例えば、表面の湿潤特性とは異なる湿潤特性を示すコーティングを提供すること、および/または(7)表面上に微粒子を堆積させること。場合によっては、構造の表面は、選択的に官能化されて、構造上に2つ以上の別個の領域を生成し、少なくとも1つの領域は、同じ構造の別の領域とは異なる表面または化学的特性を有する。このような特性としては、限定されないが、表面エネルギー、化学停止、化学部分の表面濃度などが挙げられる。場合によっては、官能化剤の混合物を用いて表面を改質してもよい。反応部位の表面は、基質固定化の目的を含めて、本明細書にさらに記載される方法を使用して調製することができる。場合によっては、表面は、配列決定後に基質で再固定化される。
【0027】
配列決定チップへのポリヌクレオチドの固定化は、リンカー部分またはテザーを介した共有結合または非共有結合相互作用によって、例えば、反応部位で基質(例えば、核酸鋳型、例えば、DNA、RNA、またはそのハイブリッド、類似体、および模倣体、またはキナーゼの標的分子)に結合した酵素(例えば、ポリメラーゼ、転写酵素、キナーゼなど。)を使用して達成することができる。場合によっては、コンジュゲーション化学を使用して、ポリヌクレオチドまたは他の成分を配列決定チップに固定化する。場合によっては、コンジュゲーション化学は求核剤/カルボニルを含む;アジド/ホスフィン;1,4マイケル付加、1,3-双極子環状付加、逆電子要求環状付加;オレフィンメタセシス;またはクロスカップリング反応。
【0028】
代替例では、ポリヌクレオチドまたはプライマーを含む基質は、反応部位に直接結合される(例えば、酵素を介さない)。場合によっては、反応部位は、単一分子配列決定チップ203の表面であるか、または光閉じ込め(例えば、マイクロウェル、ナノウェル、ナノポアなど。)内にある。核酸またはポリメラーゼを固体支持体に結合させるための結合部分の非限定的な例としては、アミドまたはアミノ結合、カルバメート結合、ジスルフィド結合、エステル結合、官能化マレイミド結合、ヒドラゾン結合、(N)-官能化チオ尿素、チオエステル結合、ストレプトアビジンもしくはアビジン/ビオチン結合、またはそれらの組み合わせが挙げられる。場合によっては、1つ以上の反応成分に結合する抗体が、結合部分として使用される。いくつかの例では、シリル部分は、ガラスなどの反応部位の基質に直接核酸に結合するために使用される。いくつかの例では、核酸テンプレート(例えば、ポリヌクレオチド)は、反応部位に直接付着される。いくつかの例では、核酸鋳型(例えば、ポリヌクレオチド)は、鋳型とハイブリダイズすることができる反応部位に相補的領域を含むプライマーを付着させることによって反応部位上に固定化され、それによってモニタリングに適した位置にそれを固定化する。代替例では、核酸テンプレート(例えば、ポリヌクレオチド)は、本明細書に記載されるポリメラーゼを介して反応部位に固定化される。
【0029】
様々なコンジュゲーション反応を使用して、リンカー、コンジュゲーション部分、および本明細書に記載のサイトカインペプチドに組み込まれた非天然アミノ酸をコンジュゲートする。このようなコンジュゲーション反応は、しばしば、「生物直交型」反応などの水性条件と適合する。場合によっては、コンジュゲーション反応は、触媒、光、またはリンカー、コンジュゲーション部分、もしくは非天然アミノ酸上に見出される反応性化学基等の化学試薬によって媒介される。場合によっては、コンジュゲーション反応は酵素によって媒介される。いくつかの例では、本明細書で使用されるコンジュゲーション反応は、Gong,Y.,Pan,L.Tettに記載されている。2015,56,2123.いくつかの例では、本明細書で使用されるコンジュゲーション反応は、Chen,X.に記載されている;Wu.Y-W.Org.Biomol.Chem.2016,14,5417.
【0030】
本明細書に記載のいくつかの例では、コンジュゲーション反応は、ケトンまたはアルデヒドと求核試薬との反応を含む。いくつかの例では、コンジュゲーション反応は、ケトンとアミノオキシ基との反応を含み、オキシムを形成する。いくつかの例では、コンジュゲーション反応は、イミンを形成するためのケトンとアリール又はヘテロアリールアミン基との反応を含む。いくつかの例では、コンジュゲーション反応は、イミンを形成するためのアルデヒドとアリール又はヘテロアリールアミン基との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、オキシムを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、コンジュゲーション反応は、アルデヒドまたはケトンとトリプタミン求核試薬とのピクテ-スペングラー反応を含む。いくつかの例では、コンジュゲーション反応は、ヒドラジノ-ピクテット-スペングラー反応を含む。いくつかの例では、コンジュゲーション反応は、Pictet-Spenglerライゲーションを含む。
【0031】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドとホスフィンとの反応(Staudingerライゲーション)を含む。いくつかの例では、ホスフィンはアリールホスフィンである。いくつかの例では、アリールホスフィンはオルトエステル基を含む。いくつかの例では、ホスフィンは、2-(ジフェニルホスファニル)安息香酸メチルの構造を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アリールアミドを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アミドを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。
【0032】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、1,3-双極性付加環化反応を含む。いくつかの例では、1,3-双極性付加環化反応は、アジドとホスフィンとの反応(「クリック」反応)を含む。いくつかの例では、コンジュゲーション反応は銅によって触媒される。いくつかの例では、本明細書に記載のコンジュゲーション反応は、トリアゾールを介して結合したリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドと歪んだオレフィンとの反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドと歪んだアルキンとの反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドとシクロアルキン、例えば、OCT、DIFO、DIFBO、DIBO、BARAC、TMTH、または他の歪みシクロアルキンとの反応を含み、その構造はGong,Y.,Pan,L.Tettに示される。2015,56,2123.いくつかの例では、1,3-双極性環化付加反応は、光(「フォトクリック」)によって触媒される。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、末端アリール基とテトラゾールおよび光との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、末端アルキニル基とテトラゾールおよび光との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、O-アリルアミノ酸とテトラジンおよび光との反応を含む。幾つかの例において、本明細書に記載されるコンジュゲーション反応は、O-アリルチロシンとテトラジン及び光との反応を含む。
【0033】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ジエンおよびジエノフィルを含む逆電子要求環状付加反応を含む。いくつかの例では、ジエンはテトラジンを含む。いくつかの例では、ジエノフィルはアルケンを含む。いくつかの例では、ジエノフィルはアルキンを含む。いくつかの例では、アルキンは歪んだアルキンである。いくつかの例では、アルケンは歪みジエンである。いくつかの例では、アルキンはトランスシクロオクチンである。いくつかの例では、アルキンはシクロオクテンである。いくつかの例では、アルケンはシクロプロペンである。いくつかの例では、アルケンはフルオロシクロプロペンである。いくつかの例では、本明細書に記載のコンジュゲーション反応は、環内に2つの窒素原子を含む6員環複素環を介してリンカーまたはコンジュゲーション部分に結合したサイトカインペプチドの形成をもたらす。
【0034】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、オレフィンメタセシス反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アルケンおよびアルキンとルテニウム触媒との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、2つのアルケンとルテニウム触媒との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、2種のアルキンとルテニウム触媒との反応を含む。幾つかの例において、本明細書に記載されるコンジュゲーション反応は、アルケン又はアルキンとルテニウム触媒及びアリール基を含むアミノ酸との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アルケンまたはアルキンとルテニウム触媒およびアリルスルフィド又はセレニドを含むアミノ酸との反応を含む。いくつかの例では、ルテニウム触媒は、Hoveda-Grubbs第2世代触媒である。場合によっては、オレフィンメタセシス反応は、1つ以上の歪んだアルケンまたはアルキンの反応を含む。
【0035】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、クロスカップリング反応を含む。場合によっては、クロスカップリング反応は、イリジウム、金、ルテニウム、ロジウム、パラジウム、ニッケル、白金、または他の遷移金属触媒などの遷移金属触媒および1つまたは複数の配位子を含む。場合によっては、遷移金属触媒は水溶性である。本明細書に記載されるいくつかの例では、本明細書に記載されるコンジュゲーション反応は、Suzuki-Miyauraクロスカップリング反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ハロゲン化アリール(またはトリフレート、またはトシレート)、アリール又はアルケニルボロン酸、およびパラジウム触媒の反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、Sonogashiraクロスカップリング反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ハロゲン化アリール(またはトリフレート、またはトシレート)、アルキン、およびパラジウム触媒の反応を含む。いくつかの例では、クロスカップリング反応は、炭素-炭素結合を介したサイトカインペプチドへのリンカーまたはコンジュゲート部分の結合をもたらす。
【0036】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、コンジュゲーション前の反応性基の脱保護または「アンケージング」反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、光による反応基の脱ケージング、その後のコンジュゲーション反応を含む。いくつかの例では、反応基は、1つ以上のニトロ基を含むアラルキル部分で保護される。いくつかの例では、反応性基の脱ケージ化は、遊離アミン、スルフィド、または他の反応性基をもたらす。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、遷移金属触媒による反応性基の脱ケージング、その後のコンジュゲーション反応を含む。場合によっては、遷移金属触媒は、パラジウムおよび1つ以上の配位子を含む。いくつかの例では、反応基は、アリール部分で保護される。いくつかの例では、反応基は、アリルカルバメートで保護される。いくつかの例では、反応基は、プロパルギル部分で保護される。いくつかの例では、反応基は、プロパルギルカルバメートで保護される。いくつかの例では、反応基は、ジエノフィルで保護され、ジエン(テトラジンなど)への曝露は、反応基の脱保護をもたらす。
【0037】
本明細書に記載されるいくつかの例において、本明細書に記載されるコンジュゲーション反応は、リガンド指向反応を含み、ここで、リガンドは、反応基に(場合により)結合して、反応基とサイトカインペプチドとの間のコンジュゲーションの部位を促進する。いくつかの例では、リガンドは、サイトカインペプチドと反応基との反応中または反応後に切断される。いくつかの例では、サイトカインペプチドのコンジュゲーション部位は天然アミノ酸である。いくつかの例では、サイトカインペプチドのコンジュゲーション部位は、リジン、システイン、またはセリンである。いくつかの例では、サイトカインペプチドのコンジュゲーション部位は、本明細書に記載される非天然アミノ酸である。いくつかの例では、反応基は、電子不足アリールまたはヘテロアリール基などの脱離基を含む。いくつかの例では、反応基は、サイトカインペプチドによって置換される電子不足アルキル基などの脱離基を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、ラジカル捕捉剤とラジカル種との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、酸化的ラジカル付加反応を含む。いくつかの例では、ラジカル捕捉剤はアリールアミンである。いくつかの例では、ラジカル種はチロシルラジカルである。いくつかの例では、ラジカル種は、ルテニウム触媒([Ru(bpy)3]など)および光によって生成される。
【0038】
酵素反応は、随意に、本明細書に記載されるコンジュゲーション反応のために使用される。例示的な酵素的コンジュゲーションとしては、SortA媒介性コンジュゲーション、TGs媒介性コンジュゲーション、またはFGE媒介性コンジュゲーションが挙げられる。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アミド結合を形成するためのチオエステルとの末端l-アミノ-2-チオ基の天然タンパク質ライゲーション(NPL)を含む。
【0039】
リンカーまたはコンジュゲーション部分をサイトカインペプチドと反応させるための様々なコンジュゲーション反応が本明細書に記載されており、反応はサイトカインペプチド中の天然(「標準」)アミノ酸と起こる。いくつかの例では、天然アミノ酸は、野生型配列中に見出されるコンジュゲーション位置に見出されるか、あるいはその位置が変異されている。いくつかの例では、コンジュゲーション反応は、システイン残基でのジスルフィド結合の形成を含む。いくつかの例では、コンジュゲーション反応は、システインまたはリジンの1,4マイケル付加反応を含む。いくつかの例では、コンジュゲーション反応は、システインのシアノベンゾチアゾールライゲーションを含む。いくつかの例では、コンジュゲーション反応は、1,3-ジクロロ-2-プロピオンなどのアセトン部分との架橋を含む。いくつかの例では、コンジュゲーション反応は、システインとO-メシチレンスルホニルヒドロキシルアミンとの反応によって形成されるデヒドロアラニンへの1,4マイケル付加を含む。いくつかの例では、コンジュゲーション反応は、チロシンとトリアゾリンジオン(TAD)またはTAD誘導体との反応を含む。いくつかの例では、コンジュゲーション反応は、トリプトファンとロジウムカルベノイドとの反応を含む。
【0040】
いくつかの場合において、ポリメラーゼは、三元複合体を単一分子配列決定チップ203に直接連結するために使用される第1の部分を含む。場合によっては、結合分子は、第1の部分に結合され、これは、三元複合体を単一分子配列決定チップ203に係留するために使用される。さらなる場合において、単分子配列決定チップ203は、その反応部位上に複数の第2の部分を含む。いくつかの例では、第2の部分はビオチンである。いくつかの例では、第2の部分はタンパク質である。いくつかの例では、第2の部分はオリゴヌクレオチドである。いくつかの場合において、複数の第2の部分は、ポリヌクレオチド、ポリメラーゼ、プライマー、またはそれらの組み合わせのいずれかを介して、三元複合体を単一分子配列決定チップ203に繋留するために使用される。さらなる場合において、複数の第2の部分は、第1の部分に結合した結合分子に結合するか、または第1の部分に直接結合する(例えば、結合分子なしで)。いくつかの例では、第1および第2の部分は同じ部分である。代替例では、第1および第2の部分は異なる部分である。場合によっては、単一分子配列決定チップ203は、サンプルポリヌクレオチドを有する能力に「負荷される」か、または充填される。いくつかの例では、1つ以上の遺伝子座は各々、単分子試料ポリヌクレオチドを含む。場合によっては、単分子配列決定チップ203は、約1%、2%、5%、10%、20%、30%、40%、50%、60%、または70%の容量で負荷される。いくつかの例では、単一分子配列決定チップ203は、約33%、約50%、または約66%の容量で負荷される。場合によっては、単分子配列決定チップ203は、1%、2%、5%、10%、20%、30%、40%、50%、60%、または70%以下の容量で負荷される。場合によっては、単分子配列決定チップ203は、約1~50%、2~50%、5~50%、5~25%、5~10%、10~50%の容量、約10~40%の容量、約10~30%の容量、約20~40%の容量、約20~30%の容量、約30~40%の容量で負荷される。または約30~50%の容量を有する。いくつかの例では、単分子配列決定チップ203は、所定の分布に従ってアレイとしてロードされる。いくつかの例では、単分子配列決定チップ203は、ポアソン分布または正規分布に従ってロードされる。
【0041】
次に、装填された単一分子配列決定チップ203上のポリヌクレオチドを配列決定し(204)、配列決定中に組み込まれたヌクレオチドに特有の出力信号205が得られる。出力シグナルは、配列相補性を介してポリヌクレオチドの配列を決定するために使用される。いくつかの例では、配列決定されるポリヌクレオチドは、30,000個以下、20,000個以下、10,000個以下、5,000個以下、1000個以下、500個以下、または250個以下の塩基を含む。いくつかの例では、配列決定されるポリヌクレオチドは、少なくとも30,000、20,000、10,000、5,000、1000、500、または少なくとも250塩基を含む。配列決定チップ上のポリヌクレオチドが配列決定されたら、三元複合体を洗浄工程207によって除去する206。場合によっては、無負荷の単分子配列決定チップ208の表面は、洗浄ステップ207の後に再官能化される必要はない。場合によっては、複数の第2の部分は、洗浄ステップ207に続いて、無負荷(または少なくとも部分的に無負荷)の単一分子配列決定チップ208に係留されたままである。場合によっては、洗浄ステップ207は、有機溶媒、熱、または酵素のうちの1つ以上を含む。いくつかの例では、有機溶媒は、MeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、DMSO、ホルムアミド、THF、またはこれらの任意の組み合わせを含む。いくつかの場合では、酵素はプロテイナーゼである。ある場合には、プロテイナーゼはアミノペプチダーゼを含む。いくつかの場合において、アミノペプチダーゼは、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはL ysCを含む。いくつかの例では、プロテイナーゼはプロテイナーゼKである。いくつかの例では、洗浄ステップ207は、ストレプトアビジンまたはアビジン/ビオチン結合を破壊するためのビオチンを含む液体の使用を含む。いくつかの例では、洗浄ステップ207は、1分、2分、3分、4分、5分、6分、7分、8分、9分、または10分以下を要する。いくつかの例では、洗浄ステップ207は、約1~10分、約1~7分、約1~5分、約1~2分、約2~6分、約3~4分、約5~6分、5~10分、または7~10分かかる。場合によっては、ポリヌクレオチド三元複合体ライブラリ201を配列決定し、単一分子配列決定チップ203を洗浄する全サイクルは、5分、6分、7分、8分、9分、10分、11分、12分、13分、14分、15分、18分、20分、25分、または30分以下かかる。洗浄は、洗浄が1,2,3,4,5,8,10,12,15,20,25,30,50,または100回繰り返されるように、洗浄条件との繰り返し接触を含み得る。洗浄は、洗浄が少なくとも1回、2回、3回、4回、5回、8回、10回、12回、15回、20回、25回、30回、50回、または少なくとも100回繰り返されるように、洗浄条件との繰り返し接触を含み得る。いくつかの例では、除去された三元複合体が回収される。代替例では、除去された三元複合体は回収されない。
図2を参照すると、洗浄工程207において三元複合体がすべて除去されると、ロードされていない単一分子配列決定チップ208に新たな三元複合体ライブラリを再ロード209する。いくつかの例では、負荷されていない単一分子配列決定チップ208の表面は、再負荷される前に調整される。いくつかの例では、負荷されていない単一分子配列決定チップ208の表面は、再負荷される前に調整されない。いくつかの例では、コンディショニングは、その後のポリヌクレオチド配列決定に適した条件に表面を浸すこと、ベーキングすること、洗浄すること、エッチングすること、洗浄すること、またはさもなければ再選別することを含む。新しい三元複合体ライブラリ209が配列決定のために再ロードされ、本明細書に記載の配列決定ステップが繰り返される。表面が再利用される回数および再利用のために表面を再利用/調製する方法は、その後の用途に応じて変化する。再使用のために調製された表面は、場合によっては、少なくとも1回、2回、3回、5回、10回、20回、50回、100回、1,000回以上再使用される。場合によっては、表面が再利用に適している残りの「寿命」または回数が測定または予測される。いくつかの例では、配列決定方法は、(a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する1つ以上のステップを含む;(b)ポリヌクレオチドの1つ以上の塩基を検出するステップであって、複数の三元複合体が表面に結合しているときに検出が起こるステップと、(c)表面から三元錯体を除去するステップと、(d)工程a~cを繰り返してポリヌクレオチドを配列決定し、この方法は少なくとも1つの洗浄工程を含む。
【0042】
デバイスの表面に新しい成分が再ロードされる前に、任意の数の読み取りを取得することができる(例えば、プライマー、ポリメラーゼ、サンプルポリヌクレオチド)。いくつかの例において、少なくとも1000万、5000万、1億、10億、100億、1000億、または少なくとも2000億リードは、デバイスが再ロードされる前に取得される。いくつかの例では、リードは、核酸配列データのセグメントを含む。いくつかの例では、読み取りは、少なくとも10、50、75、100、125、150、200、250、500、1000、2000、5000、または少なくとも10,000塩基長である。いくつかの例では、リードは、より大きな連続配列(例えば、コンティグ)にインシリコでアセンブルされる。場合によっては、コンティグは、染色体、ゲノム、データファイル、または他の単位などのより大きな群にIn silicoで組み立てられる。場合によっては、リードは、1つ以上のインデックスを使用して組み立てられる。場合によっては、1つ以上の指標は、核酸配列中にコードされるデジタル情報の位置またはアドレスを示す。
【0043】
本明細書に記載される配列決定方法は、ポリヌクレオチドを配列決定するための発光マーカーの使用を含み得る。いくつかの場合において、反応混合物中の各ヌクレオチドA、T、C、およびGは、ユニークな発光マーカーで標識される。発光マーカーの例は、酵素、蛍光分子、フルオロフォア、蛍光染料、蛍光染料、染料(例えば、有機染料または非有機染料)、蛍光タンパク質(例えば、内因性または非内因性)、非蛍光タグ(例えば、表面増強ラマン散乱(SERS)粒子)、散乱金属ナノ粒子(例えば、金または銀)、発色団の組み合わせ(例えば、単一または複数の成分上の蛍光共鳴エネルギー移動(FRET)標識)、量子ドットを含むが、これらに限定されない。またはそれらの組み合わせである。場合によっては、ユニークな発光マーカの各々は、発光波長、発光の時間的特性(例えば、発光減衰期間)、および/または励起エネルギー(例えば、励起光子を吸収する確率)に対する応答など、それらの発光特性が異なる。場合によっては、各発光マーカの発光特性のいずれか1つにおける差異は、それらが互いから区別されることを可能にする。いくつかの例では、発光マーカーを識別するために、放出された発光の時間変動(例えば、蛍光寿命)の測定が用いられる。いくつかの例では、発光マーカーは、リンカーを介してヌクレオチドに、例えば、ヌクレオチドの末端リン酸に結合される。リンカーの例は、少なくとも1つまたは複数のヒドロキシル基、スルフヒドリル基、アミノ基またはハロアルキル基であり、これらは、例えば、天然または修飾ヌクレオチドの末端リン酸でリン酸エステル、チオエステル、ホスホルアミデートまたはアルキルホスホネート結合を形成するのに好適であり得る。ポリヌクレオチド、プライマー、またはポリメラーゼは、場合によっては、ゼロモード導波路を形成する配列決定チップ上のウェルに係留される。いくつかの例において、ウェル(例えば、ナノウェル)は、直径を有する円筒形状である。いくつかの例では、ゼロモード導波路は、ウェルを通る伝搬光学モードをサポートしない単一の金属層を形成する。場合によっては、チップ上の各ウェルは、約1つの試料(例えば、1つのポリヌクレオチド)を含有する。ユニークな発光マーカーを有する新しいヌクレオチドは、ポリメラーゼおよびプライマーを介してポリヌクレオチドの配列に連続的に組み込まれる。組み込まれた各ヌクレオチドに関連するユニークな発光マーカーは、その組み込み中または組み込み後に少なくとも1つの適切な励起源(例えば、レーザなどの光源)で励起される。いくつかの例では、励起源は、励起を誘導する電磁エネルギーを生成する。いくつかの例では、少なくとも1つの励起源からの励起エネルギーはパルス化される。いくつかの例では、少なくとも1つの励起源は、複数の励起エネルギーを生成する。発光マーカーからの発光は、その後検出され、組み込まれた特定のヌクレオチドに起因する。検出された発光マーカーのコレクションから得られた配列を使用して、配列相補性を介してポリヌクレオチドの配列を決定する。発光マーカーの検出に続いて、リンカーは、新たに組み込まれたヌクレオチドから発光マーカーを分離するために切断される。いくつかの例では、発光マーカーは、末端リン酸に結合され、ポリメラーゼなどの重合酵素が、発光マーカーを切断するために使用される。
【0044】
本明細書に記載されるさらなる配列決定方法は、ポリヌクレオチドを配列決定するための電子機器の使用を含み得る。そのような場合、分子電子センサを使用して、ポリヌクレオチド配列中のヌクレオチドのパターンに応じて識別可能なシグナルを生成する。分子電子センサは、離間した一対の電極を含む。分子複合体は各電極に結合し、分子電子回路を形成する。いくつかの例では、分子複合体は、架橋分子およびプローブ分子を含む。架橋分子の非限定的な例は、グラフェンナノリボン、抗体、カーボンナノチューブ、抗体のFabアーム、二本鎖DNAオリゴマー、タンパク質アルファヘリックス、またはそれらの組み合わせである。いくつかの例では、プローブ分子は、その活性を通じて測定可能な電気的パラメータを調節するポリメラーゼである。いくつかの場合において、測定可能な電気的パラメータは、分子複合体を通過する電極間の電流を含み、これは、ヌクレオチドパターンを定量的に(例えば、ピーク振幅、信号持続時間など)および/または定性的に(例えば、ピーク形状)区別するために使用される。区別可能な測定された電気的パラメータは、ポリヌクレオチド配列に関連するバイナリーデータに変換される。
【0045】
本明細書に記載されるさらなる配列決定方法は、合成によるナノポア配列決定(SBS)の使用を含み得る。そのような場合、酵素(例えば、ポリメラーゼ)を使用して、標的配列テンプレートに相補的なポリヌクレオチド配列を合成する。同時に、成長鎖に付加されたヌクレオチドの各々のアイデンティティは、ポリメラーゼ活性部位に隣接するナノポアを通る電流の流れ(例えば、ACまたはDC)をモニタリングすることによって決定される。タグは、付加された各ヌクレオチドに結合され、これは、ナノポアを通って流れる電流の識別可能な変化を生じるために使用される。タグの例には、ポリエチレン-グリコール(PEG)オリゴマー、有機色素部分、オリゴヌクレオチド(天然および/または非天然類似体モノマー単位を含む)、ポリペプチド(天然および/または非天然類似体モノマー単位を含む)、オリゴマー部分、またはそれらの任意の組み合わせが含まれるが、これらに限定されない。場合によっては、タグは、ナノポアを通る電流の識別可能な遮断(例えば、「遮断電流」)を提供するのに充分な時間(例えば、「滞留時間」)、ナノポア内に存在する。ブロッキング電流を使用して、タグと関連する特定のヌクレオチドを同定し、それを他のタグ付きヌクレオチドと区別する。
【0046】
さらなるコンピュータ統合方法は、本明細書に記載される配列決定方法とともに使用され得る。いくつかの例では、機械学習(ML)を含むアルゴリズムを使用して、電流/電圧を、ポリヌクレオチドに添加されたヌクレオシドモノマーに関連付ける。いくつかの場合において、MLを含むアルゴリズムは、電流/電圧をポリヌクレオチドに添加されたヌクレオシドモノマーに関連付けるために、訓練データを用いて訓練され得る。いくつかの場合において、アルゴリズムは、分類および/またはクラスタリングのための古典的なMLアルゴリズムを含む(例えば、K-は、クラスタリング、平均シフトクラスタリング、ノイズを有するアプリケーションの密度ベースの空間クラスタリング(DBSCAN)、期待値最大化(EM)クラスタリング、凝集階層クラスタリング、ロジスティック回帰、ナイーブベイズ、K最近傍、ランダムフォレストもしくは決定木、勾配ブースティング、サポートベクターマシン(SVM)、またはそれらの組み合わせを意味する)。
【0047】
場合によっては、アルゴリズムは、1つまたは複数のニューラルネットワークなどの層を備える学習アルゴリズムを備える。ニューラルネットワークは、入力データの変換または変換などの機能を実行し得るネットワーク内の接続されたノードを備え得る。いくつかの例では、所与のノードからの出力は、別のノードへの入力として渡され得る。いくつかの実施形態では、ネットワーク内のノードは、入力ユニット、隠れユニット、出力ユニット、またはそれらの組合せを備え得る。場合によっては、入力ノードは、1つまたは複数の隠れユニットに接続され得る。場合によっては、1つまたは複数の隠しユニットを出力ユニットに接続することができる。ノードは、入力を取り込むことができ、アクティブ化関数に基づいて出力を生成することができる。いくつかの実施形態では、入力または出力は、テンソル、行列、ベクトル、アレイ、またはスカラーであってもよい。いくつかの実施形態では、活性化関数は、整流線形単位(ReLU)活性化関数、シグモイド活性化関数、または双曲線正接活性化関数であってもよい。いくつかの実施形態では、活性化関数は、Softmax活性化関数であってもよい。ノード間の接続は、所与のノード(例えば、入力データをアクティブにするか、または入力データを非アクティブにする)への入力データを調整するための重みをさらに含み得る。いくつかの実施形態では、重みは、ニューラルネットワークによって学習され得る。いくつかの実施形態では、ニューラルネットワークは、勾配ベースの最適化を使用して訓練され得る。場合によっては、勾配ベースの最適化は、1つまたは複数の損失関数を備え得る。いくつかの例では、勾配ベースの最適化は、共役勾配降下、確率的勾配降下、またはそれらの変形(例えば、適応モーメント推定(Adam))であり得る。さらなる例では、勾配ベースの最適化における勾配は、逆伝搬を使用して計算され得る。いくつかの実施形態では、ノードは、ネットワーク(例えば、グラフニューラルネットワーク)を生成するためにグラフに編成されてもよい。いくつかの実施形態では、ノードは、ネットワーク(例えば、フィードフォワードニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)など。)を生成するために1つまたは複数のレイヤに編成され得る。場合によっては、ニューラルネットワークは、複数の層を備えるディープニューラルネットワークであり得る。
【0048】
場合によっては、ニューラルネットワークは、1つまたは複数の反復層を備え得る。いくつかの例では、1つまたは複数の再帰層は、連続データ分類およびクラスタリングを実行し得る1つまたは複数のロングショートタームメモリ(LSTM)層またはゲート再帰ユニット(GRU)であり得る。いくつかの実施形態では、ニューラルネットワークは、1つまたは複数の畳み込み層を備え得る。入力および出力は、特徴マップ(または活性化マップ)と呼ばれ得る、データセット(たとえば、特徴)中の変数または属性を表すテンソルであり得る。場合によっては、畳み込みは、1次元(ID)畳み込み、2次元(2D)畳み込み、3次元(3D)畳み込み、またはそれらの任意の組合せであり得る。さらなる場合において、畳み込みは、1D転置畳み込み、2D転置畳み込み、3D転置畳み込み、またはそれらの任意の組合せであり得る。いくつかの例では、1次元畳み込み層は、並列畳み込みを通して時系列を分類し得るので、時系列データに適し得る。いくつかの例では、畳み込み層は、ポリヌクレオチドに添加されるヌクレオシドモノマーへの電流/電圧を分析するために使用され得る。
【0049】
ニューラルネットワーク内の層は、畳み込み層の前または後に1つまたは複数のプーリング層をさらに含み得る。1つまたは複数のプーリング層は、行列の領域を要約するフィルタを使用して特徴マップの次元を低減し得る。これは、出力の数をダウンサンプリングし、したがって、ニューラルネットワークのために必要とされるパラメータおよび計算リソースを低減し得る。いくつかの実施形態では、1つまたは複数のプーリングレイヤは、最大プーリング、最小プーリング、平均プーリング、グローバルプーリング、ノルムプーリング、またはそれらの組合せであり得る。最大プーリングは、行列の領域内の最大値のみを取ることによってデータの次元を低減し得、これは、有意な特徴を捕捉するのに役立つ。いくつかの実施形態では、1つ以上のプール層は、1次元(ID)、2次元(2D)、3次元(3D)、またはそれらの任意の組み合わせであってもよい。ニューラルネットワークはさらに、次の層に渡される入力を平坦化し得る、1つ以上の平坦化層を備えてもよい。場合によっては、入力は、1次元アレイに縮小することによって平坦化されてもよい。平坦化された入力は、オブジェクトの分類(例えば、ポリヌクレオチドに添加されるヌクレオシドモノマーに対する電流/電圧の分類など。)を出力するために使用され得る。ニューラルネットワークはさらに、1つ以上のドロップアウト層を備えてもよい。ドロップアウト層は、ニューラルネットワーク(例えば、バイナリまたはマルチクラス分類を実行する)のトレーニング中に使用され得る。1つまたは複数のドロップアウトレイヤは、いくつかの重みを0としてランダムに設定することができ、これは、特徴マップ中の対応する要素を0として設定することができ、したがって、ニューラルネットワークは、過剰適合を回避することができる。ニューラルネットワークはさらに、完全接続ネットワークを備える、1つ以上の高密度層を備えてもよい。密な層では、情報は、オブジェクトの予測された分類を生成するために全接続ネットワークを通過し得、誤差が計算され得る。いくつかの実施形態では、誤差は、予測を改善するために逆伝搬されてもよい。1つまたは複数の密な層は、数のベクトルを確率のベクトルに変換し得るSoftmax活性化関数を備え得る。これらの確率は、その後、分類、例えば、ポリヌクレオチドに添加されるヌクレオシドモノマーに対する電流および/または電圧の分類において使用され得る。
【0050】
核酸に基づく情報記憶装置
本明細書では、核酸ベースの情報(データ)記憶のためのデバイス、組成物、システム、および方法が提供される。第1のステップにおいて、情報項目(例えば、コンピュータによる処理のためのバイナリコード内のデジタル情報)を符号化するデジタルシーケンスが受信される。暗号化スキームを適用して、デジタル配列を1つ以上のシンボル(例えば、バイナリーコード)から核酸配列に変換する。一例では、核酸伸長のための表面材料、核酸伸長のための遺伝子座の設計(別名、配置スポット)、および核酸合成のための試薬が選択される。構造の表面は、核酸合成のために調製される。次いで、De novoポリヌクレオチド合成を行う。別の例では、デジタル配列は、予め合成された核酸のセットによって表される。いくつかの例では、予め合成された核酸は互いに結合して、情報の項目を表すより大きな核酸を形成する。いくつかの例では、結合は、リガーゼまたは増幅(例えば、PCR)を用いて行われる。合成されたポリヌクレオチドは保存され、全体的または部分的にその後の放出に利用可能である。いったん放出されると、ポリヌクレオチドは、全体的または部分的に、本明細書に記載される方法を使用して配列決定され、解読に供されて、核酸配列をデジタル配列に戻す。次いで、デジタル配列を組み立てて、元の情報項目のアラインメントコードを得る。場合によっては、デジタル情報は、生物の天然に存在するゲノムから得られる遺伝子情報を含まない。
【0051】
デジタル情報をコードする核酸は、エラー訂正成分を含み得る。いくつかの例では、誤り訂正構成要素は、リードソロモン(RS)符号、LDPC符号、ポーラー符号、ターボ符号などの誤り訂正符号を備える。いくつかの例では、エラー訂正コードは、多くのポリヌクレオチドにわたって格納されるべきデジタルデータを拡散する。場合によっては、データを複数のポリヌクレオチドにわたって拡散させることは、消去(例えば、失われたオリゴ)を補正するために冗長性を構築する。場合によっては、デジタル情報は、エラーの存在下で回復することができる。いくつかの例では、誤り訂正構成要素はパリティベースを備える。いくつかの例では、エラー訂正コンポーネントはインデックスシーケンスを含む。場合によっては、インデックス配列は、核酸中にコードされるデジタル情報の位置またはアドレスを定義する。いくつかの例では、インデックスシーケンスは、デジタル情報のソースを定義する。デジタル情報をコードする核酸は、場合によっては、同じライブラリまたはセット中の1つ以上の核酸との重複を含む。いくつかの例では、エラー訂正コンポーネントは重複または冗長領域を含む。いくつかの例では、アルゴリズムは、エラーを低減するために配列決定された核酸に適用される。場合によっては、エラー訂正アルゴリズムは、コンセンサス配列決定、HEDGES(Hash Encoded,Decoded by Greedy Exhaustive Search)、または他の方法を含む。
【0052】
デジタル情報をコードする核酸は、異なる媒体中に保存され得る。いくつかの例では、核酸は、本質的に乾燥粉末または凍結乾燥粉末として保存される。いくつかの例では、核酸は緩衝液中に保存される。場合によっては、核酸は、チップ、ウェハ、または他のシリコン固体支持体上に保存される。いくつかの例では、核酸は、プラスミドまたはゲノムなどの生物(または生物の集団)の内部に保存される。
【0053】
情報の項目
任意選択で、本明細書で開示されるデータ記憶プロセスの初期ステップは、初期コードの形態の情報の1つまたは複数の項目を取得または受信することを含む。情報の項目は、テキスト、音声、および視覚情報を含むが、それらに限定されない。情報のアイテムの例示的なソースは、限定はしないが、書籍、定期記事、電子データベース、医療記録、文字、フォーム、音声記録、動物記録、生物学的プロファイル、放送、映画、ショートビデオ、電子メール、ブックキーピング電話ログ、インターネット活動ログ、図面、絵画、プリント、写真、ピクセル化グラフィックス、およびソフトウェアコードを含む。情報の項目のための例示的な生物学的プロファイル源としては、遺伝子ライブラリ、ゲノム、遺伝子発現データ、およびタンパク質活性データが挙げられるが、これらに限定されない。情報の項目の例示的なフォーマットは、限定はしないが、.txt、.PDF、.doc、.docx、.ppt、.pptx、.xls、.xlsx、.rtf、.jpg、.gif、.psd、.bmp、.tiff、.png、および.mpegを含む。場合によっては、デジタル情報は、磁気媒体、フラッシュメモリ、クラウドストレージ、または保存された核酸から得られる。デジタル形式で情報項目または情報項目を符号化する複数のファイルを符号化する個々のファイルサイズの量は、限定はしないが、最大1024バイト(1KBに等しい)、1024KB(1MBに等しい)、1024MB(1GBに等しい)、1024GB(1TBに等しい)、1024TB(1PBに等しい)、1エキサバイトを含む。1ゼッタバイト、1ヨットバイト、1ゼノタバイト以上。いくつかの例では、デジタル情報の量は、少なくとも1ギガバイト(GB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000ギガバイト、または1000ギガバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1テラバイト(TB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000テラバイト、または1000テラバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1ペタバイト(PB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000ペタバイト、または1000ペタバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000または1000ジッタバイト超である。場合によっては、デジタル情報は、生物から取得されたゲノムデータを含まない。場合によっては、塩基あたり2ビット、塩基あたり3ビット(例えば、ハフマン)、コンマコード化(等温融解温度を有する6つのコドンのフレームを読み取ること)、交互コード、コンマフリーコード、完全遺伝コード(可変コドン長)、または他のコード化方法が使用される。場合によっては、デジタル情報は、鍵でさらに暗号化されるか、またはステガノグラフィを使用して不明瞭にされる。
【0054】
本明細書に記載されるデバイスおよび方法は、核酸に格納されるデジタル情報の配列決定または「読み取り」率を増加させ得る。いくつかの例では、1Mbのデータは、15分、20分、25分、30分、35分、40分、または1時間以下で取得される。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが24時間以内に読み取られる。いくつかの例では、1Gbのデータは、15分、20分、25分、30分、35分、40分、または1時間以下で取得される。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが24時間以内に読み取られる。いくつかの例では、1~50、1~30、1~20、1~15、1~10、1~5、5~20、5~30、10~50、10~25、20~30、または20~50テラバイトのデータが24時間以内に読み取られる。場合によっては、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立して読み取り可能な場所の間の距離)を有するデバイス上で24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが、1000,900,800,700,600,500,400,300,200,100,75,50,25,20,15,または10nm以下のピッチ距離を有するデバイス上で24時間以内に読み取られる。場合によっては、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30ペタバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立して読み取り可能な場所の間の距離)を有するデバイス上で24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30ゼータバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立して読み取り可能な場所間の距離)を有するデバイス上で24時間以内に読み取られる。
【0055】
本明細書に記載されるデバイスおよび方法は、核酸に格納されるデジタル情報の配列決定または「読み取り」忠実度を増加させ得る。いくつかの例では、デジタル情報は、10%以下、5%以下、4%以下、3%以下、2%以下、1.5%以下、1%以下、0.5%以下、0.2%以下、0.1%以下、0.01%以下、0.001%以下、または0.0001%以下のエラー率(塩基当たり)で回収される。場合によっては、デジタル情報は、0.0001~0.001%、0.0001~0.01%、0.001~1%、0.001~2%、0.1~2%、0.1~1%、0.1~5%、0.1~2%の誤り率(塩基当たり)で回収される。または0.01~2%である。いくつかの例では、デジタル情報は、10%、5%、4%、3%、2%、1.5%、1%、0.5%、0.2%、0.1%、0.01%、0.001%以下のエラー率(塩基当たり)で回収される。またはエラー訂正アルゴリズムによる処理の前に0.0001%以下である。
【0056】
ポリヌクレオチドは、デジタル情報をコードする所定の配列の大きな領域に集合的に及ぶように設計することができる。いくつかの例では、より大きなポリヌクレオチドは、合成されたポリヌクレオチドを連結するためのライゲーション反応によって生成される。ライゲーション反応の一例は、ポリメラーゼ連鎖アセンブリ(PCA)である。場合によっては、ポリヌクレオチドの少なくとも一部は、ユニバーサルプライマー結合の基質である付加領域を含むように設計される。PCA反応の場合、予め合成されたポリヌクレオチドは、互いに重複している(例えば、重複配列を有する4、20、40またはそれ以上の塩基)。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニールし、次いでポリメラーゼによって充填される。したがって、各サイクルは、どのポリヌクレオチドが互いに発見するかに応じて、様々な断片の長さをランダムに増加させる。断片間の相補性は、完全な大規模な二本鎖DNAの形成を可能にする。場合によっては、PCA反応が完了した後、ミスマッチ修復検出酵素を使用して、配列中のミスマッチを除去するように、エラー修正ステップが行われる。標的配列のより大きな断片が生成されたら、それらを増幅することができる。例えば、いくつかの場合において、5’および3’末端アダプター配列を含む標的配列は、アダプター配列にハイブリダイズする修飾プライマーを含むポリメラーゼ連鎖反応(PCR)において増幅される。いくつかの場合において、修飾プライマーは、1つ以上のウラシル塩基を含む。修飾プライマーの使用は、修飾塩基および/または断片から修飾塩基対を切断する酵素によって残されるギャップの標的化を中心とする酵素反応によるプライマーの除去を可能にする。残っているのは、アダプター配列の残留物を欠く二本鎖増幅産物である。このようにして、複数の増幅産物を同じプライマーセットと並行して生成して、二本鎖DNAの異なる断片を生成することができる。エラー訂正は、ポリヌクレオチドおよび/またはアセンブルされた産物に対して行われ得る。エラー修正のための例示的な戦略は、エラーを修正するための重複伸長PCRによる部位特異的突然変異誘発を含み、これは、場合により、2回以上のクローニングおよび配列決定と組み合わせられる。特定の例において、ミスマッチ、バルジおよび小ループ、化学的に改変された塩基および/または他のヘテロ二重鎖を有する二本鎖核酸は、正確に合成された核酸の集団から選択的に除去される。場合によっては、エラー修正は、二本鎖核酸内のミスマッチまたは不対塩基を認識し、それに結合するか、またはそれに隣接し、単鎖もしくは二本鎖切断を生成するか、または鎖移動転位事象を開始する、タンパク質/酵素を使用して行われる。エラー修正のためのタンパク質/酵素の非限定的な例としては、エンドヌクレアーゼ(T7エンドヌクレアーゼI、大腸菌エンドヌクレアーゼV、T4エンドヌクレアーゼVII、マングビーンヌクレアーゼ、細胞、大腸菌エンドヌクレアーゼIV、UVDE)、制限酵素、グリコシラーゼ、リボヌクレアーゼ、ミスマッチ修復酵素、リゾルバーゼ、ヘリカーゼ、リガーゼ、ミスマッチに特異的な抗体、およびそれらの変異体が挙げられる。具体的なエラー訂正酵素の例としては、T4エンドヌクレアーゼ7、T7エンドヌクレアーゼ1、SI、マングビーンエンドヌクレアーゼ、MutY,MutS,MutH,MutL,切断酵素、CELI、およびHINF1が挙げられる。いくつかの場合において、DNAミスマッチ結合タンパク質MutS(Thermus aquaticus)を使用して、合成産物の集団から失敗産物を除去する。いくつかの例では、エラー訂正は、酵素コレクターゼを用いて行われる。いくつかの場合において、エラー訂正は、SURVEYORエンドヌクレアーゼ(Transgenomic)、ヘテロ二重鎖DNAについての既知および未知の突然変異および多型をスキャンするミスマッチ特異的DNAエンドヌクレアーゼを使用して行われる。
【0057】
デジタル情報は、複数のポリヌクレオチドに保存され得る。いくつかの例では、複数のポリヌクレオチドは、約10,000,20,000,50,000,70,000,100,000,120,000,150,000,または200,000個のユニークなポリヌクレオチドを含む。いくつかの例では、複数のポリヌクレオチドは、少なくとも約10,000,20,000,50,000,70,000,100,000,120,000,150,000,または200,000個のユニークなポリヌクレオチドを含む。いくつかの例では、複数のポリヌクレオチドは、約10,50,100,200,300,500,700,1,000,5,000,10,000,15,000,20,000,25,000,30,000,35,000,40,000,または50,000塩基長である。いくつかの例では、複数のポリヌクレオチドは、少なくとも約10,50,100,200,300,500,700,1,000,5,000,10,000,15,000,20,000,25,000,30,000,35,000,40,000,または50,000塩基長である。いくつかの例では、複数のポリヌクレオチドは、最大で約10,50,100,200,300,500,700,1,000,5,000,10,000,15,000,20,000,25,000,30,000,35,000,40,000,または50,000塩基長である。
【0058】
ポリヌクレオチド配列決定のための構造
本明細書では、ポリヌクレオチド配列決定のための剛性または可撓性構造が提供される。剛性構造の場合、ポリヌクレオチドのライブラリを生成するための構造を有するデバイスが本明細書において提供される。いくつかの例では、構造体はプレートを含む。いくつかの場合において、構造は、ウェル(例えば、ナノウェル)を有するプレートを含む。いくつかの例では、構造体は、複数の遺伝子座を含む表面を有する固体支持体を含む。場合によっては、複数の場所は、構造上にレイアウトされたアレイに配置される。いくつかの場合において、固体支持体は、ガラスおよび/またはシリコンを含む。いくつかの場合では、付着部分は、遺伝子座の少なくともいくつかを覆っている。いくつかの例では、付着部分は、本明細書に記載される方法を使用して、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成される。いくつかの例では、表面は再利用可能である。いくつかの場合において、表面は、再使用前に洗浄、処理、および/またはコンディショニングされる。場合によっては、表面は、付着部分の除去および/または化学修飾を伴わずに再利用可能である。いくつかの例では、構造は、本明細書に記載の方法を用いてポリメラーゼによって付加された1つ以上の塩基のアイデンティティを識別するように構成された検出器を含む。いくつかの場合において、検出器は、複数の光検出器を含む。いくつかの場合において、検出器は、複数のゼロモード導波路を含む。いくつかの場合において、検出器は、光学検出器、電気検出器、またはそれらの組み合わせを含む。いくつかの例では、光検出器は、様々な強度および/または波長を測定するように構成される。いくつかの例では、光検出器は、可視光および/またはUV光を測定するように構成される。いくつかの例では、光検出器は、蛍光を測定するように構成される。いくつかの例では、電気検出器は、電圧または電流の変化を測定するように構成される。いくつかの例では、構造体はフローセルを含む。いくつかの場合において、液体はフローセル内に連続的に流される。いくつかの例では、フローセル内を流れる液体は、ヌクレオチドまたはヌクレオチド(例えば、ポリヌクレオチドまたは核酸、例えば、DNA、RNA、そのハイブリッド、類似体、および模倣体)を含む分子を含む。いくつかの例では、構造は、ポリヌクレオチド配列決定に加えてポリヌクレオチド合成のために使用され得る。
【0059】
図3A~3Cは、ポリヌクレオチド配列決定のための構造上に位置する遺伝子座の拡大図を示す。構造3601の一部における各場所は、実質的に平面のスポット3603(例えば、平坦)、チャネル3605、またはウェル3607であってもよい。いくつかの例において、遺伝子座は、構造の各遺伝子座が約10μmの幅および約21μmの各構造の中心間の距離を有するようにアレイ状に配置される。幾つかの例において、構造体の各場所は、約1μmの幅及び約2μmの各構造体の中心間の距離を有する。幾つかの例において、構造体の各場所は、約0.1μmの幅及び約0.2μmの各構造体の中心間の距離を有する。場所は、限定ではないが、円形、長方形、先細、または丸みを帯びた形状を含んでもよい。いくつかの例では、構造は可撓性である。代替として、または組み合わせて、構造は、剛性である。いくつかの例では、剛性構造は、ポリヌクレオチド配列決定のための遺伝子座を含む。場合によっては、剛性構造は、ポリヌクレオチド配列決定のための実質的に平面の領域、チャネル、またはウェルを含む。
【0060】
本明細書に記載されるウェルは、任意のサイズまたは寸法を含み得る。いくつかの例において、本明細書に記載されるウェルは、1~0.01の幅対深さ(または高さ)比を有し、ここで幅はウェルの最も狭いセグメントにおける幅の測定値である。いくつかの例において、本明細書に記載されるウェルは、0.5~0.01の幅対深さ(または高さ)比を有し、ここで幅はウェルの最も狭いセグメントにおける幅の測定値である。いくつかの例において、本明細書に記載されるウェルは、約0.01,0.05,0.1,0.15,0.16,0.2,0.5,または1の幅対深さ(または高さ)比を有する。本明細書では、ポリヌクレオチド配列決定のための複数の別個の遺伝子座を含むポリヌクレオチド配列決定のための構造が提供される。遺伝子座の例示的な構造としては、実質的に平面の領域、チャネル、ウェルまたは突出部が挙げられるが、これらに限定されない。本明細書に記載される構造は、複数のクラスターを含み得、各クラスターは、複数のウェル、遺伝子座またはチャネルを含む。あるいは、本明細書に記載されるのは、ウェル、遺伝子座またはチャネルの均質な配置を含み得る。本明細書において提供される構造は、約5μm~約500μm、約5μm~約400μm、約5μm~約300μm、約5μm~約200μm、約5μm~約100μm、約5μm~約50μm、または約10μm~約50μmの高さまたは深さを有するウェルを含み得る。いくつかの例において、ウェルの高さは、100μm未満、80μm未満、60μm未満、40μm未満または20μm未満である。いくつかの例では、ウェルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500μm以上である。いくつかの例では、ウェルの高さまたは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、ウェルの高さまたは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲内である。いくつかの例において、ウェルの高さまたは深さは、約50nm~約1μmの範囲である。いくつかの例では、ウェルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500、700、800、900または約1000nmである。
【0061】
本明細書において提供されるポリヌクレオチド配列決定のための構造は、チャネルを含み得る。チャネルは、1~0.01の幅対深さ(または高さ)比を有してもよく、幅は、チャネルの最も狭いセグメントにおける幅の測定値である。場合によっては、本明細書に記載されるチャネルは、0.5~0.01の幅対深さ(または高さ)比を有し、幅は、チャネルの最も狭いセグメントにおける幅の測定値である。いくつかの例では、本明細書に記載のチャネルは、約0.01,0.05,0.1,0.15,0.16,0.2,0.5,または1の幅対深さ(または高さ)比を有する。
【0062】
本明細書には、複数の別個の遺伝子座を含むポリヌクレオチド配列決定のための構造が記載される。構造は、ポリヌクレオチド合成のための実質的に平面の領域、チャネル、突出部、またはウェルを含むが、これらに限定されない。いくつかの例では、複数のチャネルを含む本明細書に記載の構造体が提供され、チャネルの高さまたは深さは、約5μm~約500μm、約5μm~約400μm、約5μm~約300μm、約5μm~約200μm、約5μm~約100μm、約5μm~約50μmである。または約10μm~約50μmである。いくつかの場合において、チャネルの高さは、100μm未満、80μm未満、60μm未満、40μm未満、または20μm未満である。いくつかの場合において、チャネル高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500μm以上である。いくつかの例では、チャネルの高さまたは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、チャネルの高さまたは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲内である。本明細書に記載されるチャネルは、クラスターで、または均質な場として表面上に配置され得る。
【0063】
本明細書に記載されるポリヌクレオチド配列決定のための構造の表面上の遺伝子座の幅は、約0.1μm~約500μm、約0.5μm~約500μm、約1μm~約200μm、約1μm~約100μm、約5μm~約100μm、または約0.1μm~約100μmであり得る。例えば、約90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、10μm、5μm、1μmまたは0.5μmである。いくつかの例では、遺伝子座の幅は、約100μm、90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μmまたは10μm未満である。いくつかの例では、遺伝子座の幅は、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、遺伝子座の幅は、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。いくつかの例では、軌跡の幅は、約50nm~約1000nmの範囲である。いくつかの例では、2つの隣接する場所の中心間の距離は、約0.1μm~約500μm、0.5μm~約500μm、約1μm~約200μm、約1μm~約100μm、約5μm~約200μm、約5μm~約100μm、約5μm~約50μmである。または約5μm~約30μm、例えば約20μmである。いくつかの例において、遺伝子座の全幅は、約5μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、又は100μmである。いくつかの例では、遺伝子座の全幅は、約1μm~100μm、30μm~100μm、または50μm~70μmである。いくつかの例では、2つの隣接する場所の中心間の距離は、約0.5μm~約2μm、0.5μm~約2μm、約0.75μm~約2μm、約1μm~約2μm、約0.2μm~約1μm、約0.5μm~約1.5μmである。約0.5μm~約0.8μm、または約0.5μm~約1μm、例えば、約1μm。いくつかの例では、遺伝子座の全幅は、約50nm、0.1μm、0.2μm、0.3μm、0.4μm、0.5μm、0.6μm、0.7μm、0.8μm、0.9μm、1μm、1.1μm、1.2μm、1.3μmである。1.4μm、または1.5μm。いくつかの例において、遺伝子座の全幅は、約0.5μm~2μm、0.75μm~1μm、又は0.9μm~2μmである。いくつかの例では、軌跡は実質的に平面である。
【0064】
本明細書には、複数の別個の遺伝子座を含むポリヌクレオチド配列決定のための構造が記載される。構造は、ポリヌクレオチド合成のための実質的に平面の領域、チャネル、突出部、またはウェルを含むが、これらに限定されない。いくつかの例では、複数のチャネルを含む本明細書に記載の構造が提供され、チャネルの高さまたは深さは、約5nm~約500nm、約5nm~約400nm、約5nm~約300nm、約5nm~約200nm、約5nm~約100nm、約5nm~約50nmである。または約10nm~約50nmである。いくつかの場合において、チャネルの高さは、100nm未満、80nm未満、60nm未満、40nm未満、または20nm未満である。いくつかの場合において、チャネル高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500nm以上である。いくつかの例では、チャネルの高さまたは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、チャネルの高さまたは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲内である。本明細書に記載されるチャネルは、クラスターで、または均質な場として表面上に配置され得る。
【0065】
本明細書に記載されるポリヌクレオチド配列決定のための構造の表面上の遺伝子座の幅は、約0.1nm~約500nm、約0.5nm~約500nm、約1nm~約200nm、約1nm~約100nm、約5nm~約100nm、または約0.1nm~約100nmであり得る。例えば、約90nm、80nm、70nm、60nm、50nm、40nm、30nm、20nm、10nm、5nm、1nmまたは0.5nmである。いくつかの例では、遺伝子座の幅は、約100nm、90nm、80nm、70nm、60nm、50nm、40nm、30nm、20nmまたは10nm未満である。いくつかの例では、遺伝子座の幅は、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、遺伝子座の幅は、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。いくつかの例では、軌跡の幅は、約50nm~約1000nmの範囲である。いくつかの例では、2つの隣接する場所の中心間の距離は、約0.1nm~約500nm、0.5nm~約500nm、約1nm~約200nm、約1nm~約100nm、約5nm~約200nm、約5nm~約100nm、約5nm~約50nmである。または約5nm~約30nm、例えば約20nmである。いくつかの例では、遺伝子座の全幅は、約5nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、または100nmである。いくつかの例では、遺伝子座の全幅は、約1nm~100nm、30nm~100nm、または50nm~70nmである。いくつかの例では、2つの隣接する場所の中心間の距離は、約0.5nm~約2nm、0.5nm~約2nm、約0.75nm~約2nm、約1nm~約2nm、約0.2nm~約1nm、約0.5nm~約1.5nmである。約0.5nm~約0.8nm、または約0.5nm~約1nm、例えば約1nm。いくつかの例では、軌跡の全幅は、約50nm、0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、1.1nm、1.2nm、1.3nmである。1.4nm、または1.5nm。いくつかの例では、軌跡の全幅は、約0.5nm~2nm、0.75nm~1nm、または0.9nm~2nmである。いくつかの例では、軌跡は実質的に平面である。
【0066】
いくつかの例では、各遺伝子座は、別の遺伝子座上で配列決定されるポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の配列決定を支持する。少なくとも10個、100個、256個、500個、1000個、2000個、3000個、4000個、5000個、6000個、7000個、8000個、9000個、10000個、11000個、12000個、13000個、14000個、15000個、20000個、30000個、40000個、50000個以上のクラスターを含む表面が本明細書において提供される。2,000超を含む表面が本明細書において提供される;5,000;10,000;20,000;30,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;5,000,000;または10,000,000以上の別個の遺伝子座である。いくつかの場合において、各クラスターは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、500またはそれ以上の遺伝子座を含む。いくつかの場合において、各クラスターは、50~500、50~200、50~150、または100~150の遺伝子座を含む。いくつかの場合では、各クラスターは100~150の遺伝子座を含む。いくつかの例では、各クラスターは109,121,130または137遺伝子座を含む。
【0067】
本明細書では、5~100μmの最も長いセグメントにおける幅を有する遺伝子座が提供される。幾つかの場合では、遺伝子座は、約30,35,40,45,50,55又は60μmの最も長いセグメントの幅を有する。いくつかの場合において、遺伝子座は複数のセグメントを有するチャネルであり、各セグメントは5~50μmの中心間距離を有する。いくつかの場合において、各セグメントの中心間距離は、約5,10,15,20または25μmである。
【0068】
本明細書において提供されるのは、5~500nmの最長セグメントにおける幅を有する遺伝子座である。幾つかの場合では、遺伝子座は、約30,35,40,45,50,55,60,80,又は100nmの最も長いセグメントにおける幅を有する。いくつかの場合において、遺伝子座は、複数のセグメントを有するチャネルであり、各セグメントは、5~50nmの中心間距離を有する。いくつかの場合において、各セグメントの中心間距離は、約5,10,15,20,25,50,100,または200nmである。
【0069】
いくつかの例では、本明細書に記載される構造の表面上で配列決定される別個のポリヌクレオチドの数は、基質中で利用可能な別個の遺伝子座の数に依存する。場合によっては、遺伝子座の密度は、少なくともまたは約1遺伝子座/mm2、10遺伝子座/mm2、25遺伝子座/mm2、50遺伝子座/mm2、65遺伝子座/mm2、75遺伝子座/mm2、100遺伝子座/mm2、130遺伝子座/mm2、150遺伝子座/mm2、175遺伝子座/mm2、200遺伝子座/mm2、300遺伝子座/mm2、400遺伝子座/mm2である。500座/mm2、1,000座/mm2/104座/mm2、105座/mm2、106座/mm2、またはそれ以上。いくつかの場合において、基材は、約10個/mm2~約500mm2、約25個/mm2~約400mm2、約50個/mm2~約500mm2、約100個/mm2~約500mm2、約150個/mm2~約500mm2、約10個/mm2~約250mm2を含む。約50座/mm2~約250mm2、約10座/mm2~約200mm2、または約50座/mm2~約200mm2。いくつかの場合において、基質は、mm2あたり約104座~約105mm2を含む。いくつかの場合において、基質は、mm2当たり約105座~約107mm2を含む。いくつかの場合において、基質は、mm2当たり少なくとも105遺伝子座を含む。いくつかの場合において、基質は、mm2あたり少なくとも106座を含む。いくつかの場合において、基質は、mm2当たり少なくとも107遺伝子座を含む。いくつかの場合において、基質は、mm2当たり約104座位~約105mm2を含む。場合によっては、遺伝子座の密度は、少なくともまたは約1遺伝子座/um2、10遺伝子座/um2、25遺伝子座/um2、50遺伝子座/um2、65遺伝子座/um2、75遺伝子座/um2、100遺伝子座/um2、130遺伝子座/um2、150遺伝子座/um2、175遺伝子座/um2、200遺伝子座/um2、300遺伝子座/um2、400遺伝子座/um2である。500座/um2、1,000座/um2以上。いくつかの場合において、基材は、約10座位/um2~約500um2、約25座位/um2~約400um2、約50座位/um2~約500um2、約100座位/um2~約500um2、約150座位/um2~約500um2、約10座位/um2~約250um2を含む。約50座/um2~約250um2、約10座/um2~約200um2、または約50座/um2~約200um2。
【0070】
いくつかの例では、2つの隣接する場所の中心間の距離は、約10μm~約500μm、約10μm~約200μm、または約10μm~約100μmである。幾つかの場合では、隣接する場所の2つの中心間の距離は、約10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm又は100μmより大きい。幾つかの場合では、2つの隣接する場所の中心間の距離は、約200μm、150μm、100μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm又は10μm未満である。いくつかの場合において、2つの隣接する遺伝子座の中心間の距離は、約10000nm、8000nm、6000nm、4000nm、2000nm、1000nm、800nm、600nm、400nm、200nm、150nm、100nm、80μm、70nm、60nm、50nm、40nm、30nm、20nmまたは10nm未満である。場合によっては、本明細書に記載の構造の各平方メートルは、少なくとも107、108、109、1010、1011座位を可能にし、各座位は1つのポリヌクレオチドを支持する。いくつかの例では、109ポリヌクレオチドは、本明細書に記載の構造の約6,5,4,3,2または1m2未満で支持される。
【0071】
いくつかの例では、本明細書に記載される構造は、2,000超の配列決定のサポートを提供する;5,000;10,000;20,000;30,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;10,000,000個以上の非同一ポリヌクレオチド。いくつかの場合において、構造は2,000超の配列決定のための支持を提供する;5,000;10,000;20,000;50,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;異なる配列をコードする10,000,000個以上のポリヌクレオチド。場合によっては、ポリヌクレオチドの少なくとも一部は、同一の配列を有する。いくつかの例では、構造は、少なくとも50、60、70、75、80、85、90、95、100、110、120、130、140、150、160、175、200、225、250、275、300、325、350、375、400、425、450、475、500塩基以上を有するポリヌクレオチドの配列のための表面環境を提供する。いくつかの配置において、本明細書に記載されるポリヌクレオチド配列決定のための構造は、均一な配置におけるポリヌクレオチド配列決定のための部位を含む。いくつかの例では、ポリヌクレオチド配列決定のための部位は、準均一配置にある。いくつかの例では、ポリヌクレオチド配列決定のための部位は、ポアソン分布に従って負荷される。いくつかの例では、ポリヌクレオチド配列決定のための部位は、正規分布に従って負荷される。
【0072】
いくつかの例では、ポリヌクレオチドは、構造の別個の遺伝子座上で配列決定され、各遺伝子座は、ポリヌクレオチドの集団の配列決定を支持する。いくつかの場合において、各遺伝子座は、別の遺伝子座上で配列決定されたポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の配列決定を支持する。いくつかの例では、構造の遺伝子座は、複数のクラスター内に位置する。いくつかの例では、構造は、少なくとも10個、500個、1000個、2000個、3000個、4000個、5000個、6000個、7000個、8000個、9000個、10000個、11000個、12000個、13000個、14000個、15000個、20000個、30000個、40000個、50000個またはそれ以上のクラスターを含む。いくつかの例では、構造は2,000超を含む;5,000;10,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,100,000;1,200,000;1,300,000;1,400,000;1,500,000;1,600,000;1,700,000;1,800,000;1,900,000;2,000,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;1,200,000;1,400,000;1,600,000;1,800,000;2,000,000;2,500,000;3,000,000;3,500,000;4,000,000;4,500,000;5,000,000;または10,000,000以上の別個の遺伝子座である。いくつかの場合において、各クラスターは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150またはそれ以上の遺伝子座を含む。いくつかの例では、各クラスターは、50~500、100~150、または100~200の遺伝子座を含む。いくつかの例では、各クラスターは109,121,130または137遺伝子座を含む。いくつかの例では、各クラスターは5,6,7,8,9,10,11または12の遺伝子座を含む。場合によっては、1つのクラスター内の別個の遺伝子座に由来するポリヌクレオチドは、組み立てられると、所定の配列の連続するより長いポリヌクレオチドをコードする配列を有する。
【0073】
構造サイズ
いくつかの例では、本明細書に記載される構造は、プレート(例えば、チップまたはウェハ)のサイズ程度、例えば、約40~120mm×約25~100mmである。いくつかの例では、本明細書に記載の構造体は、約1000mm、500mm、450mm、400mm、300mm、250nm、200mm、150mm、100mmまたは50mm以下の直径を有する。いくつかの例では、基材の直径は、約25mm~1000mm、約25mm~約800mm、約25mm~約600mm、約25mm~約500mm、約25mm~約400mm、約25mm~約300mm、または約25mm~約200mmである。基板サイズの非限定的実施例は、約300mm、200mm、150mm、130mm、100mm、84mm、76mm、54mm、51mm、および25mmを含む。いくつかの例では、基板は、少なくとも100mm2の平面表面積を有する;200mm2;500mm2;1,000mm2;2,000mm2、4,500mm2、5,000mm2、10,000mm2、12,000mm2;15,000mm2;20,000mm2、30,000mm2、40,000mm2、50,000mm2以上。いくつかの例では、厚さは、約50mm~約2000mm、約50mm~約1000mm、約100mm~約1000mm、約200mm~約1000mm、または約250mm~約1000mmである。非限定的な例としては、275mm、375mm、525mm、625mm、675mm、725mm、775mm、及び925mmが挙げられる。いくつかの例では、厚さは、少なくともまたは約0.5mm、1.0mm、1.5mm、2.0mm、2.5mm、3.0mm、3.5mm、4.0mm、または4.0mm超である。いくつかの場合において、厚さは直径と共に変化し、基材の組成に依存する。例えば、シリコン以外の材料を含む構造は、同じ直径のシリコン構造とは異なる厚さを有し得る。構造の厚さは、使用される材料の機械的強度によって決定され得、構造は、取り扱い中に割れることなくそれ自体の重量を支持するのに充分な厚さでなければならない。いくつかの例では、構造は、任意の1つの次元において約1フィート、2フィート、3フィート、4フィート、5フィート、10フィート、15フィート、30フィート、40フィート、50フィートを超える。いくつかの例では、構造は、ポリヌクレオチド合成デバイスのアレイを含む。いくつかの例では、構造はCMOSに統合される。
【0074】
材料
表面を含むデバイスが本明細書で提供され、表面は、所定の位置でポリヌクレオチド配列決定を支持するように修飾され、結果として低いエラー率、低いドロップアウト率、高い収率、および高いオリゴ表現を有する。いくつかの例において、本明細書に提供されるポリヌクレオチド配列決定のためのデバイスの表面は、デノボポリヌクレオチド配列決定反応を支持するための修飾が可能な様々な材料から作製される。場合によっては、デバイスは充分に導電性であり、例えば、デバイスの全部または一部にわたって均一な電界を形成することができる。本明細書で説明されるデバイスは、可撓性材料を含んでもよい。例示的な可撓性材料としては、修飾ナイロン、非修飾ナイロン、ニトロセルロース、およびポリプロピレンが挙げられるが、これらに限定されない。本明細書で説明されるデバイスは、剛性材料を含んでもよい。例示的な剛性材料としては、ガラス、溶融シリカ、ケイ素、二酸化ケイ素、窒化ケイ素、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、およびそれらのブレンド)、および金属(例えば、金、白金)が挙げられるが、これらに限定されない。本明細書に開示されるデバイスは、シリコン、ポリスチレン、アガロース、デキストラン、セルロースポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、ガラス、またはそれらの任意の組み合わせを含む材料から加工されてもよい。場合によっては、本明細書に開示されるデバイスは、本明細書に列挙される材料または当技術分野で公知の任意の他の好適な材料の組み合わせを用いて製造される。
【0075】
本明細書で説明されるデバイスは、ある範囲の引張強度を有する材料を含んでもよい。ある範囲の引張強度を有する例示的な材料としては、ナイロン(70MPa)、ニトロセルロース(1.5MPa)、ポリプロピレン(40MPa)、シリコン(268MPa)、ポリスチレン(40MPa)、アガロース(1-10MPa)、ポリアクリルアミド(1-10MPa)、ポリジメチルシロキサン(PDMS)(3.9-10.8MPa)が挙げられるが、これらに限定されない。本明細書に記載の固体支持体は、1~300MPa、1~40MPa、1~10MPa、1~5MPa、または3~11MPaの引張強度を有することができる。本明細書に記載の固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、270MPa以上の引張強度を有し得る。いくつかの例において、本明細書に記載されるデバイスは、テープまたは可撓性シートなどの連続ループまたはリールに保存することができる可撓性材料の形態である、ポリヌクレオチド配列決定のための固体支持体を含む。
【0076】
ヤング率は、荷重下での弾性(回復可能)変形に対する材料の抵抗を測定する。ヤング率剛性の範囲を有する例示的な材料としては、ナイロン(3GPa)、ニトロセルロース(1.5GPa)、ポリプロピレン(2GPa)、シリコン(150GPa)、ポリスチレン(3GPa)、アガロース(1~10GPa)、ポリアクリルアミド(1~10GPa)、ポリジメチルシロキサン(PDMS)(1~10GPa)が挙げられるが、これらに限定されない。本明細書に記載の固体支持体は、1~500、1~40、1~10、1~5、または3~11GPaのヤング率を有することができる。本明細書に記載の固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、400、500GPa以上のヤング率を有することができる。可撓性材料は、可撓性と剛性の関係が逆であるため、ヤング率が低く、荷重により大きく変形する。いくつかの例では、本明細書に記載の固体支持体は、少なくともナイロンの可撓性を有する表面を有する。
【0077】
いくつかの場合において、本明細書中に開示されるデバイスは、二酸化ケイ素ベースおよび酸化ケイ素の表面層を含む。あるいは、デバイスは、酸化ケイ素のベースを有してもよい。本明細書に提供されるデバイスの表面は、テクスチャ加工されてもよく、ポリヌクレオチド合成のための全表面積の増加をもたらす。本明細書に開示されるデバイスは、いくつかの場合において、少なくとも5%、10%、25%、50%、80%、90%、95%、または99%のシリコンを含む。本明細書に開示されるデバイスは、場合によっては、シリコンオンインシュレータ(SOI)ウェハから製造される。
【0078】
構造体は、本明細書に記載の本発明の方法および組成物に適した様々な材料から製造することができる。例において、本発明の基材/固体支持体が作製される材料は、低レベルのポリヌクレオチド結合を示す。いくつかの状況では、可視光および/またはUV光に対して透明な材料を使用することができる。充分に導電性である材料、例えば、本明細書に記載される基材/固体支持体の全部または一部にわたって均一な電場を形成することができる材料を利用することができる。場合によっては、そのような材料は、電気接地に接続されてもよい。いくつかの場合において、基材または固体支持体は、熱伝導性または断熱性であり得る。材料は、一連のポリヌクレオチド配列決定反応などの化学的または生化学的反応を支持するために耐化学性および耐熱性であり得る。可撓性材料の場合、対象の材料は以下を含むことができる:ナイロン、修飾および非修飾の両方、ニトロセルロース、ポリプロピレンなど。
【0079】
剛性材料の場合、関心のある特定の材料は、以下を含む:ガラス;溶融シリカ;シリコン、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネートおよびそのブレンドなどである);金属(例えば、金、白金など)。構造体は、シリコン、ポリスチレン、アガロース、デキストラン、セルロースポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、及びガラスからなる群から選択される材料から製造することができる。基板/固体支持体またはその中の微細構造、反応器は、本明細書に列挙される材料または当技術分野で公知の任意の他の好適な材料の組み合わせを用いて製造されてもよい。
【0080】
いくつかの例では、本明細書に開示される基材は、コンピュータ可読材料を含む。コンピュータ可読材料としては、限定されないが、磁気媒体、リールツーリールテープ、カートリッジテープ、カセットテープ、フレキシブルディスク、紙媒体、フィルム、マイクロフィーチ、連続テープ(例えば、ベルト)、及び電子命令を記憶するのに適した任意の媒体が挙げられる。いくつかの場合において、基材は、磁気リールツーリールテープまたは磁気ベルトを含む。いくつかの例では、基板はフレキシブルプリント回路基板を含む。
【0081】
本明細書で説明される構造は、可視光および/またはUV光に対して透明であってもよい。場合によっては、本明細書に記載の構造は、構造の全部または一部にわたって均一な電場を形成するのに充分な導電性を有する。いくつかの例では、本明細書に記載の構造は、熱伝導性または絶縁されている。いくつかの例では、構造は、ポリヌクレオチド配列決定反応などの化学反応を支持するために耐化学性および耐熱性である。いくつかの例において、基材は磁性である。いくつかの例では、構造は金属または金属合金を含む。
【0082】
ポリヌクレオチド配列決定のための構造は、任意の次元で1フィート、2フィート、5フィート、10フィート、30フィート、50フィート以上の長さであり得る。可撓性構造物の場合、可撓性構造物は、任意選択で、巻かれた状態で、例えばリール内に保管される。例えば長さが1フィートを超える大きな剛性構造体の場合、剛性構造体は垂直又は水平に保管することができる。
【0083】
表面調製
場合によっては、本明細書に開示される構造の表面は、基質の表面および生体分子(例えば、ポリヌクレオチド、ポリメラーゼ、プライマー、またはそれらの任意の組み合わせの複合体)の両方に結合するように構成される、1つ以上の能動的に官能化された表面を含むように修飾され、それによって、表面へのカップリング反応を支持する。場合によっては、表面はまた、生体分子に効率的に結合しない受動材料で官能化され、それによって、受動官能化剤が結合する部位での生体分子の付着を防止する。いくつかの場合において、表面は、生体分子支持のための別個の場所のみを画定する活性層を含む。
【0084】
場合によっては、表面は、任意の異なる比率である官能基の混合物と接触させられる。いくつかの例では、混合物は、少なくとも2、3、4、5種類以上の異なる種類の官能化剤を含む。場合によっては、混合物中の少なくとも2種類の表面官能化剤の比は、約1:1、1:2、1:5、1:10、2:10、3:10、4:10、5:10、6:10、7:10、8:10、9:10である。または2つの群の所望の表面表現を達成するための任意の他の比。場合によっては、他の好適な溶媒の所望の表面張力、湿潤性、水接触角、及び/又は接触角は、好適な比率の官能化剤を基材表面に提供することによって達成される。場合によっては、混合物中の薬剤は、好適な反応性および不活性部分から選択され、したがって、反応性基の表面密度を下流反応のための所望のレベルに希釈する。場合によっては、官能化試薬の混合物は、生体分子に結合する1つ以上の試薬と、生体分子に結合しない1つ以上の試薬とを含む。したがって、試薬の調節は、異なる官能化領域で生じる生体分子結合の量の制御を可能にする。場合によっては、生体分子結合の量は、構造の結合能の約10%、20%、30%、40%、50%、60%、または70%であり得る。いくつかの例では、生体分子結合の量は、構造の結合能力の約10~60%、約10~50%、約20~50%、または約20~40%であり得る。
【0085】
いくつかの例では、基板官能化のための方法は、基板の表面上へのシラン分子の堆積を含む。シラン分子は、基板の高エネルギー表面上に堆積され得る。いくつかの例では、高表面エネルギー領域は受動的官能化試薬を含む。本明細書に記載される方法は、表面に結合するシラン基を提供するが、分子の残りは、表面からの距離および生体分子が付着する末端における遊離ヒドロキシル基を提供する。いくつかの例では、シランは有機官能性アルコキシシラン分子である。有機官能性アルコキシシラン分子の非限定的な例としては、ジメチルクロロ-オクトデシル-シラン、メチルジクロロ-オクトデシル-シラン、トリクロロ-オクトデシル-シラン、およびトリメチル-オクトデシル-シラン、トリエチル-オクトデシル-シランが挙げられる。いくつかの例では、シランはアミノシランである。アミノシランの例としては、限定されないが、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシランが挙げられる。(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシラン及びN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド-アミノプロピル)トリメトキシシラン、(3)によって、シランは11、-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-N-(3アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシラン-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドにある場合に、アクティブ得る関数化剤は11-アセトキシウンデシルトリエトキシシラン。場合によって得る関数化剤は、アクティブ。場合によってn-デシルトリエトキシシラン活性得る関数化剤は、グリシジルオキシプロピルトリエトキシシラン(GOPS)。いくつかの例では、シランはフルオロシランである。いくつかの例では、シランは炭化水素シランである。いくつかの場合において、シランは3-ヨード-プロピルトリメトキシシランである。ある場合には、シランはオクチルクロロシランである。
【0086】
いくつかの例では、シラン化は、有機官能性アルコキシシラン分子との自己組織化によって表面上で行われる。有機官能性アルコキシシランは、それらの有機機能によって分類される。シロキサン官能化試薬の非限定的な例としては、ヒドロキシアルキルシロキサン(表面をシリル化し、ジボランで官能化し、過酸化水素によってアルコールを酸化する)、ジオール(ジヒドロキシアルキル)シロキサン(シリル化表面、及びジオールへの加水分解)、アミノアルキルシロキサン(アミンは中間官能化工程を必要としない)、グリシドキシシラン(3-グリシドキシプロピル-ジメチル-エトキシシラン、グリシドキシ-トリメトキシシラン)、メルカプトシラン(3-メルカプトプロピル-トリメトキシシラン、3-4エポキシシクロヘキシル-エチルトリメトキシシラン又は3-メルカプトプロピル-メチル-ジメトキシシラン)、ビシクロヘプテニル-トリクロロシラン、ブチル-アルデヒド-トリメトキシシラン、又は二量体二次アミノアルキルシロキサンが挙げられる。例示的なヒドロキシアルキルシロキサンとしては、3-ヒドロキシプロピルに変わるアリルトリクロロクロロシラン、または8-ヒドロキシオクチルに変わる7-オクタ-l-エニルトリクロロクロロシランが挙げられる。ジオール(ジヒドロキシアルキル)シロキサンは、グリシジルトリメトキシシラン由来(2,3-ジヒドロキシプロピルオキシ)プロピル(GOPS)を含む。アミノアルキルシロキサンは、3-アミノプロピル(3-アミノプロピルトリエトキシシラン、3-アミノプロピル-ジエトキシ-メチルシラン、3-アミノプロピル-ジメチル-エトキシシランまたは3-アミノプロピル-トリメトキシシラン)に変わる3-アミノプロピルトリメトキシシランを含む。いくつかの場合において、二量体第二級アミノアルキルシロキサンは、ビス(シリルオキシプロピル)アミンに変わるビス(3-トリメトキシシリルプロピル)アミンである。
【0087】
活性官能化領域は、1種または複数の異なるシラン種、例えば、1種、2種、3種、4種、5種、6種、7種、8種、9種、10種またはそれ以上のシランを含んでもよい。いくつかの場合において、1つ以上のシランの1つは、別のシランよりも多い量で官能化組成物中に存在する。例えば、2つのシランを有する混合シラン溶液は、99:1、98:2、97:3、96:4、95:5、94:6、93:7、92:8、91:9、90:10、89:11、88:12、87:13、86:14、85:15、84:16、83:17を含む。82:18、81:19、80:20、75:25、70:30、65:35、60:40、55:45のシラン対別のシラン比。いくつかの例では、活性官能化剤は11-アセトキシウンデシルトリエトキシシラン及びn-デシルトリエトキシシランを含む。いくつかの例では、活性官能化剤は、約20:80~約1:99、または約10:90~約2:98、または約5:95の比で11-アセトキシウンデシルトリエトキシシラン及びn-デシルトリエトキシシランを含む。
【0088】
いくつかの例では、官能化は、化学気相堆積(CVD)、原子層堆積(ALD)、プラズマCVD(PECVD)、プラズマALD(PEALD)、有機金属CVD(MOCVD)、熱線CVD(HWCVD)、開始CVD(iCVD)、改質CVD(MCVD)を含むがこれらに限定されない任意の堆積技術による、構造への官能化剤の堆積を含む。蒸着軸方向堆積(VAD)、外部蒸着(OVD)、物理蒸着(例えば、スパッタ堆積、蒸着)、および分子層堆積(MLD)。
【0089】
以下の官能化プロセスにおける任意の工程または成分は、最終的な官能化基材の所望の特性に従って省略または変更することができる。場合によっては、追加の構成要素および/またはプロセスステップが、本明細書で具現化されるプロセスワークフローに追加される。いくつかの例では、基板は、例えばピラニア溶液を使用して最初に洗浄される。洗浄プロセスの例は、基板をピラニア溶液(例えば、90%H2SO4、10%H2O2)に高温(例えば、120°C)で浸漬し、洗浄(例えば、水)し、基板(例えば、窒素ガス)を乾燥させることを含む。プロセスは、任意選択で、塩基性溶液(例えば、NH4OH)にピラニア処理された基材を浸漬し、続いて水性洗浄(例えば、水)することを含むピラニア処理後を含む。場合によっては、構造の表面は、任意選択でピラニア浸漬および任意選択のピラニア後処理に続いて、プラズマ洗浄される。プラズマ洗浄プロセスの例は、酸素プラズマエッチングを含む。いくつかの例では、表面は、蒸発に続いて活性官能化剤で堆積される。場合によっては、基板は、例えば、ピラニア処理および/またはプラズマ洗浄によって、洗浄前に能動的に官能化される。
【0090】
表面官能化のためのプロセスは、任意選択で、レジストコートおよびレジストストリップを含む。場合によっては、活性表面機能化に続いて、基板は、レジスト、例えば、SPR(商標)3612ポジ型フォトレジストでスピンコーティングされる。表面官能化のためのプロセスは、様々な場合において、パターン化された官能化を伴うリソグラフィを含む。いくつかの例では、フォトリソグラフィは、レジストコーティングの後に実行される。いくつかの例では、リソグラフィの後、表面はリソグラフィ欠陥について視覚的に検査される。表面機能化のためのプロセスは、場合によっては、洗浄ステップを含み、それによって、基板の残留物は、例えば、プラズマ洗浄またはエッチングによって除去される。場合によっては、プラズマ洗浄ステップは、リソグラフィステップ後のあるステップで行われる。
【0091】
場合によっては、レジストでコーティングされた表面は、例えば、官能化後および/またはリソグラフィ後に、レジストを除去するように処理される。いくつかの場合において、レジストは、溶媒を用いて、例えばN-メチル-2-ピロリドンを含むストリッピング溶液を用いて除去される。ある場合には、レジスト剥離は、超音波処理または超音波処理を含む。いくつかの例では、レジストがコーティングされ、剥離され、その後、所望の異なる官能化パターンを生成するために露光された領域の能動的官能化が続く。
【0092】
いくつかの例において、本明細書に記載される方法および組成物は、選択的領域における改変された表面特性の生成のためのフォトレジストの適用に関し、フォトレジストの適用は、フォトレジストの空間分布を画定する表面の流体特性に依存する。理論に束縛されるものではないが、適用される流体に関連する表面張力効果は、フォトレジストの流れを定義し得る。例えば、表面張力および/または毛管作用効果は、レジスト溶媒が蒸発する前に、制御された様式でフォトレジストを小さな構造に引き込むことを促進し得る。いくつかの例では、レジスト接触点は、鋭い縁部によってピン止めされ、それによって流体の前進を制御する。下層構造は、製造および機能化プロセス中にフォトレジストを適用するために使用される所望のフローパターンに基づいて設計され得る。溶媒が蒸発した後に残る固体有機層を使用して、製造プロセスの後続のステップを追求することができる。構造は、隣接する流体経路の中への流動効果を促進または阻害することによって、流体の流動を制御するように設計されてもよい。例えば、構造は、上縁と下縁との間の重複を回避するように設計され、それは、レジストの特定の配置を可能にする上部構造内の流体の維持を促進する。代替例では、上縁部および底縁部が重なり、適用された流体を底部構造に吸い上げる。したがって、レジストの所望の用途に応じて、適切な設計を選択することができる。
【0093】
いくつかの例では、本明細書に記載の構造は、ヌクレオシドに結合することができる反応基を含む、少なくともまたは少なくとも0.1nm、0.5nm、1nm、2nm、5nm、10nmまたは25nmの厚さを有する材料を含む表面を有する。例としては、ガラス及びシリコン、例えば二酸化ケイ素及び窒化ケイ素が挙げられるが、これらに限定されない。いくつかの場合において、例示的な表面は、ナイロンおよびPMMAを含む。
【0094】
いくつかの例では、UV光の形態の電磁放射線が表面パターニングに使用される。いくつかの例では、ランプが表面パターニングのために使用され、マスクが表面へのUV光の露光位置を媒介する。いくつかの例では、レーザが表面パターニングのために使用され、シャッターの開/閉状態は、表面へのUV光の露出を制御する。レーザ装置は、移動可能な可撓性構造と組み合わせて使用されてもよい。そのような配置では、レーザ露光と柔軟な構造運動との協調を使用して、異なるヌクレオシド結合能力を有する1つまたは複数の薬剤のパターンを作成する。
【0095】
材料堆積システム
いくつかの場合において、配列決定されたポリヌクレオチドは、基材、例えば固体支持体上に保存される。ポリヌクレオチドは、非連続的またはドロップオンデマンド法で基板表面上に堆積させることができる。いくつかの例では、ポリヌクレオチドは、配列決定のためにデバイスに移される。例えば、電気機械転写方式、電気熱転写方式、静電引力方式などが挙げられる。電気機械転写方式では、電気パルスにより変形する圧電素子により液滴が吐出される。電気熱転写法では、装置のチャンバー内に気泡が発生し、この気泡の膨張力によって液滴が吐出される。静電吸着方式は、静電吸着力を利用して液滴を基板上に吐出する方式である。いくつかの場合において、ドロップ周波数は、約5KHz~約500KHzである;約5KHz~約100KHz;約10KHz~約500KHz;約10KHz~約100KHz;または約50KHz~約500KHzである。場合によっては、周波数は、約500KHz、200KHz、100KHz、または50KHz未満である。
【0096】
分注される液滴のサイズは、デバイスの分解能と相関する。場合によっては、デバイスは、約0.01pl~約20pl、約0.01pl~約10pl、約0.01pl~約1pl、約0.01pl~約0.5pl、約0.01pl~約0.01plのサイズの試薬の液滴を堆積させる。または約0.05pl~約1plである。いくつかの例では、液滴サイズは、約1pl、0.5pl、0.2pl、0.1pl、または0.05pl未満である。
【0097】
いくつかの構成において、ポリヌクレオチド配列決定システムの構成は、リールツーリール型プロセスにおける移動のための基質の柔軟性を利用する連続的なポリヌクレオチド配列決定プロセスを可能にする。この配列決定プロセスは、連続生産ライン様式で動作し、基質は、基質の位置を回転させるための1つ以上のリールを使用するポリヌクレオチド配列決定の種々の段階を通って移動する。例示的な例において、ポリヌクレオチド配列決定における反応は、基質をローリングすることを含む:溶媒浴を通して、ホスホラミダイト堆積のための堆積デバイスの下に、酸化剤の浴を通して、アセトニトリル洗浄浴を通して、およびデブロック浴を通して。任意選択的に、テープはまた、キャッピング浴を通して横断される。リールツーリール型プロセスは、配列決定されたポリヌクレオチドを含む基質の完成品を巻取りリール上に容易に集めることを可能にし、そこでさらなる処理または貯蔵のために輸送することができる。
【0098】
本明細書には、ポリヌクレオチド配列決定のための試薬がリサイクルされるかまたは再使用されるデバイス、方法、システムおよび組成物が記載される。試薬のリサイクルは、未使用の試薬の収集、貯蔵、および使用、または使用された試薬の精製/形質転換を含み得る。例えば、試薬浴は、リサイクルされ、同じまたは異なる表面上のポリヌクレオチド配列決定ステップのために使用される。本明細書に記載される試薬は、1回、2回、3回、4回、5回、6回、7回、8回、9回、10回またはそれ以上リサイクルされ得る。あるいは、または組み合わせて、反応副生成物を含む試薬溶液を濾過して副生成物を除去し、試薬溶液をさらなるポリヌクレオチド配列決定反応のために使用する。
【0099】
多くの統合要素または非統合要素が、しばしばポリヌクレオチド配列決定システムと共に使用される。いくつかの例では、ポリヌクレオチド配列決定システムは、合成されたポリヌクレオチドが配列決定される前に、合成されたポリヌクレオチドのプロセシングに有用な1つ以上のエレメントを含む。例として、システムは、熱サイクリングデバイスなどの温度制御要素を備える。場合によっては、温度制御要素は、ポリヌクレオチド配列決定の前に、PCA等の核酸アセンブリおよび/またはPCR等の核酸増幅を行うために、複数の分解された反応器とともに使用される。
【0100】
デノボポリヌクレオチド合成
本明細書では、短時間で基板上に高密度のポリヌクレオチドを合成するためのシステムおよび方法が提供される。いくつかの例では、基板は可撓性基板である。いくつかの例では、少なくとも1010、1011、1012、1013、1014、または1015塩基が1日に合成される。場合によっては、少なくとも10x108、10x109、10x1010、10x1011、または10x1012のポリヌクレオチドが1日に合成される。いくつかの例において、合成される各ポリヌクレオチドは、少なくとも20,50,100,200,300,400または500個の核酸塩基を含む。いくつかの場合において、これらの塩基は、100中約1未満の総平均誤り率で合成される;200;300;400;500;1000;2000;5000;10000;15000;20000塩基。いくつかの例では、これらのエラー率は、合成されたポリヌクレオチドの少なくとも50%、60%、70%、80%、90%、95%、98%、99%、99.5%、またはそれ以上である。場合によっては、合成されたポリヌクレオチドのこれらの少なくとも90%、95%、98%、99%、99.5%、またはそれ以上は、それらがコードする所定の配列と異ならない。いくつかの例において、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、約1/200未満である。いくつかの例において、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、1,000中約1未満である。いくつかの例では、本明細書に記載の方法およびシステムを用いて基板上で合成されたポリヌクレオチドのエラー率は、2,000個あたり約1個未満である。いくつかの例では、本明細書に記載の方法およびシステムを用いて基板上で合成されたポリヌクレオチドのエラー率は、3,000個あたり約1個未満である。いくつかの例において、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、5,000個中約1個未満である。個々のタイプのエラー率には、基板上で合成されたポリヌクレオチドに対するミスマッチ、欠失、挿入、および/または置換が含まれる。用語「エラー率」は、合成されたポリヌクレオチドの総量と所定のポリヌクレオチド配列の凝集体との比較を指す。いくつかの例では、本明細書に開示される合成されたポリヌクレオチドは、12~25塩基のテザーを含む。いくつかの例では、テザーは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、を含む。46、47、48、49、50またはそれ以上の塩基。
【0101】
本明細書には、ポリヌクレオチド合成において使用される化学反応が電気化学を使用して制御される方法、システム、デバイス、および組成物が記載される。電気化学反応は、場合によっては、光、熱、放射、または電気等の任意のエネルギー源によって制御される。例えば、電極は、表面上の離散的遺伝子座の全てまたは一部として化学反応を制御するために使用される。場合によっては、電極は、電極に電位を印加してポリヌクレオチド合成における1つ以上の化学的工程を制御することによって荷電される。場合によっては、これらの電極はアドレス指定可能である。本明細書に記載される任意の数の化学的ステップは、場合によっては、1つ以上の電極を用いて制御される。電気化学反応は、酸化、還元、酸/塩基化学、または電極によって制御される他の反応を含み得る。場合によっては、電極は、化学変換のための試薬として使用される電子またはプロトンを生成する。場合によっては、電極は、酸などの試薬を直接生成する。いくつかの例では、酸はプロトンである。いくつかの例における電極は、塩基などの試薬を直接生成する。酸または塩基は、保護基を切断するため、または例えば反応溶液のpHを調節することによって、様々なポリヌクレオチド合成反応の動力学に影響を及ぼすために使用されることが多い。電気化学的に制御されたポリヌクレオチド合成反応は、いくつかの例において、酸化還元活性金属または他の酸化還元活性有機材料を含む。場合によっては、金属または有機触媒が、これらの電気化学反応とともに使用される。いくつかの例では、酸はキノンの酸化から生成される。
【0102】
化学反応の制御は、試薬の電気化学的生成に限定されない;化学反応性は、電極によって生成される電場(または勾配)を通した基質または試薬への生物物理学的変化を通して間接的に影響され得る。いくつかの例では、基質は、核酸を含むが、これに限定されない。いくつかの例では、電極または表面に向かって、または電極または表面から離れて、特定の試薬または基質を反発または誘引する電場が生成される。そのような場は、場合によっては、電位を1つ以上の電極に印加することによって生成される。例えば、負に荷電した核酸は負に荷電した電極表面からはじかれる。局所電場によって引き起こされるポリヌクレオチドまたは他の試薬のそのような反発または引力は、場合によっては、合成デバイスまたは構造の領域の中または外へのポリヌクレオチドまたは他の試薬の移動を提供する。いくつかの例では、電極は、合成表面、構造、またはデバイスからポリヌクレオチドをはじく電場を生成する。場合によっては、電極は、合成表面、構造、またはデバイスに向かってポリヌクレオチドを誘引する電場を生成する。いくつかの例では、陽子は正に帯電した表面からはじかれて、陽子と基板またはその部分との接触を制限する。場合によっては、反発力または引力が、合成表面の特定の領域への試薬または基質の進入を可能にするか、または阻止するために使用される。いくつかの例では、ヌクレオシドモノマーは、一方または両方の構成要素の近傍に電場を印加することによってポリヌクレオチドと接触することを妨げられる。そのような配置は、特定の試薬のゲーティングを可能にし、これは、試薬および/または基質間の接触の濃度または速度が制御されるとき、保護基の必要性をなくし得る。いくつかの例では、保護されていないヌクレオシドモノマーがポリヌクレオチド合成に使用される。あるいは、一方または両方の成分の近傍における電場の適用は、ヌクレオシドモノマーとポリヌクレオチドとの接触を促進する。加えて、基板への電場の印加は、基板の反応性または立体構造を変化させることができる。例示的な用途において、電極によって生成される電場は、隣接する遺伝子座におけるポリヌクレオチドが相互作用するのを防ぐために使用される。いくつかの例では、基質は、任意選択で表面に付着されたポリヌクレオチドである。いくつかの例における電場の印加は、ポリヌクレオチドの三次元構造を変化させる。このような改変は、ヘリックス、ヘアピン、ループ、または他の3次元核酸構造などの様々な構造のフォールディングまたはアンフォールディングを含む。そのような改変は、ウェル、チャネル、または他の構造の内側の核酸を操作するために有用である。いくつかの例では、二次構造を防止するために、電場が核酸基質に印加される。いくつかの例では、電場は、ポリヌクレオチド合成中にリンカーまたは固体支持体への付着の必要性をなくす。
【0103】
本開示の基質上でのポリヌクレオチド合成に好適な方法は、ホスホラミダイト構築ブロックと基質に結合したヌクレオシドとの間にホスファイトトリエステル結合を形成するカップリング工程において、成長中のポリヌクレオチドへのホスホラミダイト構築ブロック、例えばヌクレオシドホスホラミダイトの制御された付加を含むホスホラミダイト法である。いくつかの例では、ヌクレオシドホスホラミダイトは、活性化された基質に提供される。いくつかの例では、ヌクレオシドホスホルアミダイトは、活性化剤とともに基板に提供される。いくつかの例では、ヌクレオシドホスホラミンチオールは、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90で基材に提供される。基質結合ヌクレオシドに対して100倍過剰以上。いくつかの例では、ヌクレオシドホスホラミダイトの添加は、無水環境、例えば無水アセトニトリル中で行われる。カップリングステップにおけるヌクレオシドホスホラミダイトの添加および連結に続いて、基質は、随意に洗浄される。いくつかの例では、カップリング工程は、1回または複数回さらに繰り返され、任意選択で、基質へのヌクレオシドホスホラミダイト付加の間に洗浄工程を伴う。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、1、2、3またはそれ以上の連続したカップリング工程を含む。カップリングの前に、多くの場合、基質に結合したヌクレオシドは、保護基を除去することによって脱保護され、保護基は重合を防止するように機能する。保護基は、ポリヌクレオチドの伸長を防止する任意の化学基を含み得る。いくつかの例では、保護基は、酸の存在下で切断(または除去)される。いくつかの例では、保護基は塩基の存在下で切断される。いくつかの例では、保護基は、光、熱、または他のエネルギー源などの電磁放射線で除去される。いくつかの例では、保護基は、酸化または還元反応によって除去される。いくつかの例では、保護基はトリアリールメチル基を含む。いくつかの例では、保護基はアリールエーテルを含む。いくつかの例では、保護はジスルフィドを含む。いくつかの例では、保護基は酸不安定性シランを含む。いくつかの例では、保護基はアセタールを含む。いくつかの例では、保護基はケタールを含む。いくつかの例では、保護基はエノールエーテルを含む。いくつかの例では、保護基は、メトキシベンジル基を含む。いくつかの例では、保護基はアジドを含む。いくつかの例では、保護基は4,4’-ジメトキシトリチル(DMT)である。いくつかの例では、保護基はtert-ブチルカルボネートである。いくつかの例では、保護基はtert-ブチルエステルである。いくつかの例では、保護基は塩基不安定基を含む。いくつかの例では、酵素的方法を用いてポリヌクレオチドを生成する。いくつかの例では、酵素的方法は、ポリメラーゼの使用を含む。いくつかの例では、酵素的方法は、保護されたヌクレオチドの使用を含む。いくつかの例では、酵素的方法は、末端デオキシトランスフェラーゼまたはその変異体の使用を含む。
【0104】
カップリングに続いて、ホスホラミダイトポリヌクレオチド合成方法は、場合によりキャッピング工程を含む。キャッピング工程では、成長しているポリヌクレオチドをキャッピング剤で処理する。キャッピング工程は、一般に、カップリング後に未反応の基質結合5’-OH基をさらなる鎖伸長から遮断し、内部塩基欠失を有するポリヌクレオチドの形成を防止する働きをする。さらに、IH-テトラゾールで活性化されたホスホラミダイトは、しばしば、グアノシンの06位とわずかに反応する。理論に束縛されるものではないが、I2/水で酸化すると、この副生成物は、おそらくO6-N7移動を介して、脱プリン化を受ける。アプリン部位は、ポリヌクレオチドの最終脱保護の過程で最終的に切断され、したがって全長生成物の収率を低下させる可能性がある。06修飾は、E/水で酸化する前にキャッピング試薬で処理することによって除去することができる。いくつかの例では、ポリヌクレオチド合成中にキャッピング工程を含めることは、キャッピングを伴わない合成と比較してエラー率を減少させる。例として、キャッピング工程は、基質結合ポリヌクレオチドを無水酢酸および1-メチルイミダゾールの混合物で処理することを含む。キャッピングステップに続いて、基板は任意選択で洗浄される。
【0105】
ヌクレオシドホスホラミダイトの添加後、および任意選択でキャッピングおよび1つまたは複数の洗浄工程後、本明細書に記載される基質は、酸化され得る結合した成長核酸を含む。酸化工程は、亜リン酸トリエステルを、天然に存在するリン酸ジエステルヌクレオシド間結合の保護された前駆体である四配位リン酸トリエステルに酸化することを含む。いくつかの例では、亜リン酸トリエステルは電気化学的に酸化される。いくつかの例では、成長ポリヌクレオチドの酸化は、任意選択でピリジン、ルチジン、またはコリジンなどの弱塩基の存在下で、ヨウ素および水で処理することによって達成される。酸化は、時には、tert-ブチルヒドロペルオキシドまたは(1S)-(+)-(1O-カンファースルホニル)-オキサジリジン)(CSO)を使用して無水条件下で行われる。いくつかの方法において、キャッピング工程は酸化後に行われる。第2のキャッピングステップは、持続し得る酸化からの残留水が後続の結合を阻害し得るため、基質乾燥を可能にする。酸化後、基質および成長ポリヌクレオチドは、任意選択で洗浄される。いくつかの例では、酸化工程は、ポリヌクレオチドホスホロチオエートを得るために硫化工程で置換され、硫化後に任意のキャッピング工程を行うことができる。Beaucage試薬としても知られる3-(ジメチルアミノメチリデン)アミノ)-3H-l,2,4-ジチアゾール-3-チオン、DDTT、3H-l,2-ベンゾジチオール-3-オン1,1-ジオキシドおよびN,N,N’N’-テトラエチルチウラムジスルフィド(TETD)を含むがこれらに限定されない多くの試薬が効率的な硫黄移動が可能である。
【0106】
結合を通して起こるヌクレオシド取り込みのその後のサイクルのために、基質結合成長ポリヌクレオチドの保護された5’末端(あるいは、合成が5’から3’方向に行われる場合、3’末端)を除去して、一次ヒドロキシル基が次のヌクレオシドホスホロアミダイトと反応できるようにする。いくつかの例では、保護基はDMTであり、脱ブロッキングはジクロロメタン中のトリクロロ酢酸で起こる。いくつかの例では、保護基はDMTであり、脱ブロッキングは電気化学的に生成されたプロトンで起こる。長時間、または推奨される酸溶液よりも強力に脱トリチル化を行うことは、固体支持体結合ポリヌクレオチドの脱プリン化の増加をもたらし得、したがって、所望の全長生成物の収率を低下させる。本明細書に記載の方法および組成物は、望ましくない脱プリン反応を制限する制御された脱ブロッキング条件を提供する。いくつかの例では、基質結合ポリヌクレオチドは、脱ブロック化後に洗浄される。いくつかの場合において、デブロッキング後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。
【0107】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下のステップの反復シーケンスを含み得る:基質の表面への保護されたモノマーの適用は、表面、リンカーまたは予め脱保護されたモノマーのいずれかと連結する特徴を有する;後に適用される保護されたモノマーと反応することができるように、適用されたモノマーの脱保護、及び連結のための別の保護されたモノマーの適用。1つ以上の中間工程は、酸化および/または硫化を含む。いくつかの例では、1つまたは複数の洗浄ステップが、ステップのうちの1つまたはすべての前または後に続く。
【0108】
本明細書に記載される基質上でのポリヌクレオチドの合成のための方法は、酸化工程を含み得る。例えば、方法は、以下のステップの反復シーケンスを含む:基質の表面への保護されたモノマーの適用は、表面、リンカーまたは予め脱保護されたモノマーのいずれかと連結する特徴を有する;後に適用される保護されたモノマーと反応することができるように、適用されたモノマーの脱保護、連結のための別の保護されたモノマーの適用、ならびに酸化および/または硫化。いくつかの例では、1つまたは複数の洗浄ステップが、ステップのうちの1つまたはすべての前または後に続く。
【0109】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下のステップの反復シーケンスをさらに含み得る:基質の表面への保護されたモノマーの適用は、表面、リンカーまたは予め脱保護されたモノマーのいずれかと連結する特徴を有する;後に適用される保護されたモノマーと反応することができるように、適用されたモノマーの脱保護、ならびに酸化および/または硫化。いくつかの例では、1つまたは複数の洗浄ステップが、ステップのうちの1つまたはすべての前または後に続く。
【0110】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下のステップの反復シーケンスをさらに含み得る:基質の表面への保護されたモノマーの適用は、表面、リンカーまたは予め脱保護されたモノマーのいずれかと連結する特徴を有する;ならびに酸化および/または硫化。いくつかの例では、1つまたは複数の洗浄ステップが、ステップのうちの1つまたはすべての前または後に続く。
【0111】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下のステップの反復シーケンスをさらに含み得る:基質の表面への保護されたモノマーの適用は、表面、リンカーまたは予め脱保護されたモノマーのいずれかと連結する特徴を有する;後に適用される保護されたモノマーと反応することができるように、適用されたモノマーの脱保護、ならびに酸化および/または硫化。いくつかの例では、1つまたは複数の洗浄ステップが、ステップのうちの1つまたはすべての前または後に続く。
【0112】
いくつかの例では、ポリヌクレオチドは、光不安定性保護基を用いて合成され、表面上に生成されたヒドロキシル基は、光不安定性保護基によってブロックされる。表面が、フォトリソグラフィマスクなどを通してUV光に曝露されると、表面上の遊離ヒドロキシル基のパターンが生成され得る。これらのヒドロキシル基は、ホスホラミダイト化学に従って、光保護されたヌクレオシドホスホラミダイトと反応することができる。第2のフォトリソグラフィマスクを適用することができ、表面をUV光に曝露してヒドロキシル基の第2のパターンを生成し、続いて5’-光保護ヌクレオシドホスホロアミダイトとカップリングさせることができる。同様に、パターンを生成することができ、オリゴマー鎖を伸長することができる。理論に束縛されるものではないが、光切断可能な基の不安定性は、使用される溶媒の波長および極性に依存し、光切断の速度は、曝露の持続時間および光の強度によって影響され得る。この方法は、マスクの位置合わせの精度、光保護基の除去効率、およびホスホラミダイトカップリング工程の収率などのいくつかの要因を活用することができる。さらに、隣接する部位への意図しない光の漏れを最小限に抑えることができる。スポットあたりの合成されたオリゴマーの密度は、合成の表面上のリーダーヌクレオシドの負荷を調節することによってモニタリングすることができる。
【0113】
ポリヌクレオチド合成のための支持体を提供する本明細書に記載される基質の表面は、合成されたポリヌクレオチドが表面から切断されることを可能にするように化学的に修飾され得る。いくつかの例では、ポリヌクレオチドは、ポリヌクレオチドが脱保護されるのと同時に切断される。いくつかの例において、該ポリヌクレオチドは、該ポリヌクレオチドが脱保護された後に切断される。例示的なスキームでは、(CH3CH2O)3Si-(CH2)2-NH2などのトリアルコキシシリルアミンを基質の表面SiOH基と反応させ、続いて無水コハク酸とアミンと反応させてアミド結合および遊離OHを生成し、その上で核酸鎖の成長が支持される。開裂は、アンモニア又はメチルアミンによるガス開裂を含む。いくつかの例では、切断は、酸または塩基などの電気的に生成された試薬を用いたリンカー切断を含む。いくつかの例では、いったん表面から放出されると、ポリヌクレオチドは、保存された情報を抽出するために配列決定および解読されるより大きな核酸に組み立てられる。
【0114】
本明細書に記載される表面は、ポリヌクレオチド合成のさらなるサイクルを支持するために、ポリヌクレオチド切断後に再使用され得る。例えば、リンカーは、さらなる処理剤/化学修飾なしで再使用することができる。いくつかの例では、リンカーは、基質表面またはポリヌクレオチドに非共有結合される。いくつかの実施形態では、リンカーは、表面からの切断後にポリヌクレオチドに結合したままである。いくつかの実施形態では、リンカーは、エステル、アミド、ケタール、ベータ置換ケトン、複素環、または可逆的に切断され得る他の基などの可逆的な共有結合を含む。そのような可逆的切断反応は、場合によっては、試薬の添加もしくは除去によって、または電極によって制御される電気化学的プロセスによって制御される。任意選択で、化学リンカーまたは表面結合化学基は、反応性を回復し、そのようなリンカーまたは表面結合化学基上の望ましくない副産物形成を除去するために、いくつかのサイクル後に再生される。
【0115】
コンピュータシステム
様々な態様では、本明細書に記載のシステムのいずれかは、コンピュータに動作可能にリンクされ、任意選択で、ローカルまたはリモートのいずれかでコンピュータを介して自動化される。様々な例において、本発明の方法およびシステムは、コンピュータシステム上のソフトウェアプログラムおよびその使用をさらに含む。したがって、材料堆積デバイスの移動、分注動作、および真空作動の調整および同期などの分注/真空/補充機能の同期のためのコンピュータ制御は、本発明の範囲内である。場合によっては、コンピュータシステムは、ユーザ指定の塩基配列と材料堆積デバイスの位置との間でインターフェース接続し、基板の指定領域に正しい試薬を送達するようにプログラムされる。例として、
図6または
図7に示されるシステムなどのコンピュータシステムは、シンボルのセットとして表されるデータをシンボルの別のセットに符号化するために使用され得る。例えば、データは、「0」および「1」のバイナリ値等の数値記号として表されてもよく、コンピュータシステムは、コンピュータプログラムを実行し、データを複数の核酸配列に変換する、複数の核酸配列をデータに変換する、または両方を行ってもよい。いくつかの例では、コンピュータプログラムは機械学習アルゴリズムであり得る。いくつかの例では、機械学習アルゴリズムは、電流または電圧などの電気信号に基づいてヌクレオチド塩基を決定し得る。
【0116】
図6に示すコンピュータシステム3700は、媒体3711および/またはネットワークポート3705から命令を読み取ることができる論理装置として理解することができ、任意選択で、固定媒体3712を有するサーバ3709に接続することができる。システムは、CPU3701と、ディスクドライブ3703と、キーボード3715および/またはマウス3716などの任意選択の入力デバイスと、任意選択のモニタ3707とを含むことができる。データ通信は、示された通信媒体を通して、ローカルまたは遠隔場所におけるサーバに達成されることができる。通信媒体は、データを送信および/または受信する任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続とすることができる。そのような接続は、ワールドワイドウェブを介した通信を提供することができる。本開示に関連するデータは、当事者3722による受信および/またはレビューのために、そのようなネットワークまたは接続を介して送信され得ることが想定される。
【0117】
図7は、本発明の例示的なインスタンスに関連して使用することができるコンピュータシステムの第1の例示的なアーキテクチャを示すブロック図である。
図5に示すように、例示的なコンピュータシステムは、命令を処理するためのプロセッサ3802を含むことができる。プロセッサの非限定的な例は、以下を含む:Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32ビットRISC ARM 1176JZ(F)-S vl.O(商標)プロセッサ、ARM Cortex-A8Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に同等のプロセッサ。並列処理のために複数の実行スレッドを使用することができる。いくつかの事例では、複数のプロセッサまたは複数のコアを伴うプロセッサもまた、単一のコンピュータシステムであろうと、クラスタであろうと、または複数のコンピュータ、携帯電話、および/または携帯情報端末デバイスを備えるネットワークを介してシステムにわたって分散されてあろうと、使用されることができる。
図38に図示されるように、高速キャッシュ3804は、プロセッサ3802によって最近、または頻繁に使用された命令またはデータのための高速メモリを提供するように、プロセッサ3802に接続されるか、または組み込まれることができる。プロセッサ3802は、プロセッサバス3808によってノースブリッジ3806に接続されている。ノースブリッジ3806は、メモリバス3812によってランダムアクセスメモリ(RAM)3810に接続され、プロセッサ3802によるRAM3810へのアクセスを管理する。また、ノースブリッジ3806は、チップセットバス3816によってサウスブリッジ3814に接続されている。サウスブリッジ3814は、周辺バス3818に接続されている。周辺バスは、例えば、PCI、PCI-X、PCI Express、又は他の周辺バスとすることができる。ノースブリッジおよびサウスブリッジは、しばしばプロセッサチップセットと呼ばれ、プロセッサ、RAM、および周辺バス3818上の周辺コンポーネントの間のデータ転送を管理する。いくつかの代替アーキテクチャでは、ノースブリッジの機能性は、別個のノースブリッジチップを使用する代わりに、プロセッサに組み込まれることができる。いくつかの例では、システム3800は、周辺バス3818に取り付けられたアクセラレータカード3822を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ(FPGA)または特定の処理を加速するための他のハードウェアを含むことができる。例えば、アクセラレータは、適応型データ再構成のために、または拡張セット処理において使用される代数式を評価するために使用することができる。
【0118】
ソフトウェアおよびデータは、外部ストレージ3824に記憶され、プロセッサによる使用のためにRAM3810および/またはキャッシュ3804にロードされ得る。システム3800は、システムリソースを管理するためのオペレーティングシステムを含む;オペレーティングシステムの非限定的な例は、以下を含む:Linux(登録商標)、Windows(登録商標)、MACOS(登録商標)、BlackBerry OS(登録商標)、iOS(登録商標)、および他の機能的に等価なオペレーティングシステム、ならびに本発明の例示的な実施形態によるデータ記憶および最適化を管理するためのオペレーティングシステムの上で動作するアプリケーションソフトウェア。この例では、システム3800はまた、ネットワーク接続ストレージ(NAS)および分散並列処理に使用することができる他のコンピュータシステムなどの外部ストレージへのネットワークインターフェースを提供するために周辺バスに接続されたネットワークインターフェースカード(NIC)3820および3821を含む。
【0119】
図8は、複数のコンピュータシステム3902aおよび3902bと、複数の携帯電話および携帯情報端末3902cと、ネットワーク接続ストレージ(NAS)3904aおよび3904bとを有するネットワーク3900を示す図である。例示的実施形態では、システム3902a、3902b、および3902cは、データ記憶を管理し、ネットワーク接続記憶(NAS)3904aおよび3904bに記憶されたデータのためのデータアクセスを最適化することができる。数学モデルは、データのために使用され、コンピュータシステム3902aおよび3902b、ならびに携帯電話および携帯情報端末システム3902cにわたる分散並列処理を使用して評価されることができる。コンピュータシステム3902aおよび3902b、ならびに携帯電話および携帯情報端末システム3902cはまた、ネットワーク接続ストレージ(NAS)3904aおよび3904bに記憶されたデータの適応データ再構築のための並列処理を提供することができる。
図39は例のみを示し、多種多様な他のコンピュータアーキテクチャおよびシステムを本発明の様々な実施形態と併せて使用することができる。例えば、ブレードサーバを使用して並列処理を提供することができる。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続され得る。ストレージはまた、バックプレーンに、または別個のネットワークインターフェースを介してネットワーク接続ストレージ(NAS)として接続され得る。
【0120】
いくつかの例示的実施形態では、プロセッサは、別個のメモリ空間を維持し、他のプロセッサによる並列処理のために、ネットワークインターフェース、バックプレーン、または他のコネクタを通してデータを伝送することができる。他の実施形態では、プロセッサのうちのいくつかまたは全ては、共有仮想アドレスメモリ空間を使用することができる。
図9は、例示的な実施形態による共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステム4000のブロック図である。システムは、共有メモリサブシステム4004にアクセスすることができる複数のプロセッサ4002a~fを含む。システムは、複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ(MAP)4006a~fをメモリサブシステム4004に組み込む。各MAP4006a~fは、メモリ4008a~fと、1つまたは複数のフィールドプログラマブルゲートアレイ(FPGA)4010a~fとを備えることができる。MAPは、構成可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの部分は、それぞれのプロセッサと密接に協調して処理するためにFPGA4010a~fに提供することができる。例えば、例示的な実施形態では、MAPを使用して、データモデルに関する代数式を評価し、適応データ再構築を実行することができる。この例では、各MAPは、これらの目的のためにプロセッサのすべてによってグローバルにアクセス可能である。一構成では、各MAPは、関連するメモリ4008a~fにアクセスするためにダイレクトメモリアクセス(DMA)を使用することができ、それぞれのマイクロプロセッサ4002a~fとは独立して、かつ非同期にタスクを実行することを可能にする。この構成では、MAPは、アルゴリズムのパイプライン化および並列実行のために、結果を別のMAPに直接供給することができる。
【0121】
上記のコンピュータアーキテクチャおよびシステムは例にすぎず、汎用プロセッサ、コプロセッサ、FPGAおよび他のプログラマブル論理デバイス、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、ならびに他の処理および論理要素の任意の組合せを使用するシステムを含む、多種多様な他のコンピュータ、携帯電話、および携帯情報端末アーキテクチャおよびシステムを例示的実施形態に関連して使用することができる。いくつかの実施形態では、コンピュータシステムの全てまたは一部は、ソフトウェアまたはハードウェアで実装することができる。ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワーク接続ストレージ(NAS)、ならびに他のローカルまたは分散データストレージデバイスおよびシステムを含む、任意の様々なデータストレージ媒体が、例示的な実施形態に関連して使用され得る。
【0122】
例示的実施形態では、コンピュータシステムは、上記または他のコンピュータアーキテクチャおよびシステムのいずれかで実行するソフトウェアモジュールを使用して実装することができる。他の実施形態では、システムの機能は、ファームウェア、フィールドプログラマブルゲートアレイ(FPGA)などのプログラマブル論理デバイス、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、または他の処理および論理要素において部分的または完全に実装され得る。例えば、セットプロセッサおよびオプティマイザは、ハードウェアアクセラレータカードの使用によるハードウェアアクセラレーションを用いて実装することができる。
【実施例】
【0123】
実施例1:
ポリヌクレオチドは、フルオロフォアヌクレオチドを用いて配列決定される。配列決定の前に、ポリヌクレオチドが合成され(またはそうでなければ得られ)、
図1の一般的スキームに従って調製され、ポリヌクレオチド、プライマー、およびポリメラーゼを含む複数の三元複合体が得られる。複数の三元複合体を含むポリヌクレオチド三元複合体ライブラリが作製され、遺伝子座を含む単一分子配列決定チップ上にロードされる。
【0124】
三元複合体の各々は、単一分子配列決定チップの遺伝子座上にロードされる。三元複合体中の各ポリヌクレオチドは、三元複合体を配列決定チップに繋ぎ止めるために、アビジン/ビオチン結合を用いて配列決定チップの遺伝子座に結合される。三元複合体は、配列決定チップの約33%容量のポアソン分布に従って配列決定チップ上にロードされる。
【0125】
遊離ヌクレオチドA、T、C、およびGを含む反応混合物を調製し、これらはそれぞれ独特のフルオロフォアで標識される。この場合、ユニークなフルオロフォアは、ヌクレオチドの末端ホスフェートにおけるホスホルアミデート結合を介してヌクレオチドに結合される。
【0126】
配列決定中、ユニークなフルオロフォアを有するヌクレオチドが、ポリメラーゼおよびプライマーを介してポリヌクレオチドの配列に連続的に組み込まれる。励起源は、固有のフルオロフォアの各々を励起するための適切な波長を有する1つ以上の励起エネルギーを放出するように構成される。励起源によって放出される励起エネルギーは、所定の時間間隔でパルス化され、フルオロフォアの蛍光寿命が測定される。蛍光寿命測定を使用して、新たに組み込まれたヌクレオチドを決定する。新たに組み込まれたヌクレオチドの検出後、ポリヌクレオチドからフルオロフォアを分離するために、ポリメラーゼを用いてホスホロアミデート結合を切断する。次いで、検出された発光のコレクションから得られた配列を使用して、配列相補性を介してポリヌクレオチドの配列を決定する。配列決定チップ上にロードされたポリヌクレオチドの配列決定に続いて、洗浄工程中にアビジン/ビオチン結合を切断して、配列決定チップから三元複合体を分離する。アビジン/ビオチン結合は、ビオチンを含む溶離液で配列決定チップを洗浄することによって破壊され、それによって、配列決定チップの表面から三元複合体を放出する。
【0127】
三元複合体を除去した後、任意選択で、配列決定チップの表面を再使用のために再調整する。次いで、新しい三元複合体ライブラリを配列決定のために配列決定チップ上に再ロードし、本明細書に記載の配列決定工程を繰り返す。
【0128】
実施例2:
エレクトロニクスを用いてポリヌクレオチドを配列決定する。ポリヌクレオチドを合成し、実施例1の一般的方法に従って配列決定チップ上にロードする。
【0129】
配列決定チップは、離間した一対の電極を含む分子電子センサを含む。分子複合体は各電極に結合して分子電子回路を形成する。分子複合体は、カーボンナノチューブブリッジと、その活性を通じて測定可能な電気的パラメータを調節するポリメラーゼプローブ分子とを含む。
【0130】
電流を電極および分子複合体に流して、配列に組み込まれているヌクレオチドのパターンに応じて識別可能なシグナルを生成する。区別可能な測定された電気的パラメータは、ポリヌクレオチド配列に関連するバイナリーデータに変換される。
【0131】
三元複合体中のポリヌクレオチドを配列決定した後、配列決定チップを洗浄し、実施例1の一般的な方法に従って、三元複合体を配列決定チップから除去する。次いで、配列決定チップを再使用のために調製し、新しい三元複合体ライブラリを再ロードする。
【0132】
実施例S:
合成によるナノポア配列決定(SBS)を用いたポリヌクレオチド配列決定を行う。ポリヌクレオチドを配列決定し、実施例1の一般的方法に従って配列決定チップ上にロードする。
【0133】
配列決定デバイスは、それぞれポリメラーゼにコンジュゲートされたナノポアを含む。ナノ細孔に埋め込まれたポリメラーゼは、ポリヌクレオチドテンプレートおよび複数のヌクレオチドに曝露され、各々はオリゴヌクレオチドタグを含む。ポリヌクレオチド鋳型に相補的なタグ付きヌクレオチドがポリメラーゼ活性部位によって捕捉されると、タグ部分はナノポア内に位置するようになる。電位が印加され、細孔中のタグの存在は、開放細孔電流と比較して特有の遮断電流を引き起こす。ブロッキング電流は、ポリメラーゼがポリヌクレオチドテンプレートに相補的な鎖を合成するときに測定される。測定されたブロッキング電流の配列は、ポリヌクレオチド鋳型の配列を同定するために使用される。
【0134】
三元複合体中のポリヌクレオチドを配列決定した後、配列決定チップを洗浄し、実施例1の一般的な方法に従って、三元複合体を配列決定チップから除去する。次いで、配列決定チップを再使用のために調製し、新しい三元複合体ライブラリを再ロードする。
【0135】
本発明の好ましい実施形態が本明細書に示され、説明されてきたが、そのような実施形態は例としてのみ提供されることが当業者には明らかであろう。多数の変形、変更、および置換が、本発明から逸脱することなく、当業者に思い浮かぶであろう。本明細書に記載される本発明の実施形態の様々な代替形態が、本発明を実施する際に採用され得ることを理解されたい。以下の特許請求の範囲が本発明の範囲を定義し、これらの特許請求の範囲内の方法および構造ならびにそれらの均等物がそれによって包含されることが意図される。
【誤訳訂正書】
【提出日】2024-08-30
【誤訳訂正1】
【訂正対象書類名】明細書
【訂正対象項目名】全文
【訂正方法】変更
【訂正の内容】
【発明の詳細な説明】
【背景技術】
【0001】
相互参照
本出願は、2021年10月18日に出願された米国仮特許出願第63/256,866の利益を主張し、この文献は、その全体が参照により援用される。
【0002】
背景
生体分子(例えば、核酸)は、研究、医学、および情報記憶における用途を有する。しかし、生体分子を配列決定するためには、高密度でスケーラブル、自動化され、高精度で高効率なシステムが必要とされている。
【0003】
概要
本明細書では、ポリヌクレオチド配列決定のための方法が提供され、該方法は、a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する工程と、b)ポリヌクレオチドの1つ以上の塩基を検出する工程であって、複数の三元複合体が表面に結合している場合に検出が起こる、工程と、c)表面から三元複合体を除去する工程と、d)工程a~cを繰り返して、ポリヌクレオチドを配列決定する工程とを含む。さらに本明細書では、工程c)が表面を洗浄することを含む方法が提供される。さらに本明細書では、洗浄することが、表面を溶媒、熱、小分子、核酸、またはタンパク質の1つ以上と接触させることを含む方法が提供される。さらに本明細書では、小分子が、第2の部分へのコンジュゲーションのために構成された第1の部分を含む方法が提供される。さらに本明細書では、コンジュゲーションが、求核剤/カルボニル、アジド/ホスフィン、1,4マイケル付加、1,3-双極性環状付加、逆電子需要型環状付加(inverse electron demand cycloaddition)、オレフィンメタセシス、またはクロスカップリング反応を含む方法が提供される。さらに本明細書では、小分子がビオチン、アルキン、アザイド、テトラジン、アルケン、アルキン、カルボニル、マイケル受容体/供与体、または抗原を含む方法が提供される。さらに本明細書では、溶媒が有機溶媒を含む方法が提供される。さらに本明細書では、有機溶媒が、MeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、ホルムアミド、THF、またはDMSOを含む方法が提供される。さらに本明細書では、有機溶媒を加熱する方法が提供される。さらに本明細書では、タンパク質がプロテイナーゼまたはヌクレアーゼを含む方法が提供される。さらに本明細書では、プロテイナーゼがアミノペプチダーゼを含む方法が提供される。さらに本明細書では、アミノペプチダーゼが、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはLysCを含む方法が提供される。さらに本明細書では、タンパク質がストレプトアビジンを含む方法が提供される。さらに本明細書では、ポリメラーゼがPhi29ポリメラーゼまたはその変異体を含む方法が提供される。さらに本明細書では、工程a)において、ポリメラーゼが表面に結合される方法が提供される。さらに本明細書では、工程a)において、ポリメラーゼが表面に結合しない方法が提供される。さらに本明細書では、複数のポリヌクレオチドが、少なくとも100,000個の固有なポリヌクレオチドを含む方法が提供される。さらに本明細書では、複数のポリヌクレオチドが50~30,000塩基長である方法が提供される。さらに本明細書では、検出する工程が、固有な波長、蛍光寿命、または電流もしくは電圧の変化を使用する塩基の同定を含む方法が提供される。さらに本明細書では、検出する工程が、合成による配列決定およびナノポア検出の1つ以上を含む方法が提供される。さらに本明細書では、検出する工程がFRETを含む方法が提供される。さらに本明細書では、検出する工程が三元複合体を少なくとも1つのヌクレオチドと接触させることを含む方法が提供される。さらに本明細書では、ヌクレオチドが標識を含む方法が提供される。さらに本明細書では、標識が発光標識を含む方法が提供される。さらに本明細書では、発光標識が色素である方法が提供される。さらに本明細書では、ポリメラーゼが量子ドットに結合される方法が提供される。さらに本明細書では、複数のポリヌクレオチドが、工程a)において、表面に結合される方法が提供される。さらに本明細書では、検出する工程が電磁エネルギーによる励起を含む方法が提供される。さらに本明細書では、検出する工程がレーザによる励起を含む方法が提供される。さらに本明細書では、レーザがパルス化される方法が提供される。さらに本明細書では、複数のポリヌクレオチドがヘアピンアダプタを含む方法が提供される。さらに本明細書では、複数のポリヌクレオチドが環状である方法が提供される。さらに本明細書では、工程a~cを少なくとも3回繰り返す方法が提供される。さらに本明細書では、工程a~cを少なくとも20回繰り返す方法が提供される。さらに本明細書では、工程a~cが10分以下で行われる方法が提供される。さらに本明細書では、工程cが5分以下で行われる方法が提供される。
【0004】
本明細書では、ポリヌクレオチド配列決定のための方法が提供され、該方法は、a)表面上の複数のポリヌクレオチドを配列決定する工程であって、表面が単分子配列決定のための複数の遺伝子座を含む、工程と、b)表面からポリヌクレオチドを除去する工程と、c)工程a~bを繰り返して、ポリヌクレオチドを配列決定する工程であって、少なくとも1メガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される、工程とを含む。さらに本明細書では、少なくとも1ギガバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内で取得される方法が提供される。さらに本明細書では、少なくとも1テラバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内で取得される方法が提供される。さらに本明細書では、1メガバイト~1ゼータバイトの配列決定データが、表面上の複数の遺伝子座のうちの150,000個以下の遺伝子座から1時間以内に取得される方法が提供される。
さらに本明細書では、複数のポリヌクレオチドが少なくとも1Gbのデジタル情報をコード化する方法が提供される。
【0005】
本明細書では、デジタル情報の項目をコード化する方法が提供され、該方法は、a)デジタル配列として情報の項目を提供する工程と、b)デジタル配列を核酸配列としてコード化する工程と、c)本明細書に記載の複数のポリヌクレオチドを生成する工程とを含む。
【0006】
本明細書では、デジタル情報の項目を復号するための方法が提供され、該方法は、本明細書に記載の方法を用いて複数のポリヌクレオチドの核酸配列を得る工程と、核酸配列を1つ以上のデジタル配列に復号する工程と、1つ以上のデジタル配列を使用してデジタル情報の項目を読み取る工程とを含む。
【0007】
本明細書では、核酸配列決定のためのデバイスが提供され、該デバイスは、固体支持体であって、該固体支持体が表面を含み、該表面が複数の遺伝子座を含む、固体支持体と、遺伝子座の少なくともいくつかを覆う結合部分であって、該結合部分は、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成され、該表面が再使用可能である、結合部分と、検出器であって、該検出器は、ポリメラーゼによって付加された1つ以上の塩基の同一性を識別するように構成される、検出器とを含む。さらに本明細書では、表面が結合部分の除去なしに再使用可能である、デバイスが提供される。さらに本明細書では、表面が化学修飾なしで再使用可能である、デバイスが提供される。さらに本明細書では、1mm2当たり少なくとも100,000の遺伝子座を含む、デバイスが提供される。さらに本明細書では、1mm2当たり少なくとも1,000,000の遺伝子座を含む、デバイスが提供される。さらに本明細書では、1mm2当たり100,000~10億の遺伝子座を含む、デバイスが提供される。さらに本明細書では、プライマーが、15~50塩基の長さを有する、デバイスが提供される。さらに本明細書では、表面が、複数のウェルまたはチャネルを含む、デバイスが提供される。さらに本明細書では、ウェルまたはチャネルが、10~200nmの最長線寸法を有する、デバイスが提供される。さらに本明細書では、1つ以上のナノポアをさらに含む、デバイスが提供される。さらに本明細書では、表面が実質的に平面である、デバイスが提供される。さらに本明細書では、固体支持体が、ガラス、シリコン、またはそれらの組み合わせを含む、デバイスが提供される。さらに本明細書では、表面が、それに結合した複数のポリメラーゼを含む、デバイスが提供される。さらに本明細書では、表面が、それに結合した複数のポリヌクレオチドを含む、デバイスが提供される。さらに本明細書では表面が、ポリヌクレオチド、ポリメラーゼ、またはプライマーのうちの2つ以上を含む複合体を含む、デバイスが提供される。さらに本明細書では、遺伝子座の少なくとも1%が、ポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含む、デバイスが提供される。さらに本明細書では、遺伝子座の少なくとも30%が、ポリメラーゼ、ポリヌクレオチド、プライマー、またはそれらの任意の組み合わせの複合体を含む、デバイスが提供される。さらに本明細書では、複合体が共有結合を介して接続される、デバイスが提供される。さらに本明細書では、複合体が非共有結合を介して接続される、デバイスが提供される。さらに本明細書では、複合体が親和性相互作用、タンパク質、オリゴヌクレオチド、または熱放出可能な結合を介して接続される、デバイスが提供される。さらに本明細書では、親和性相互作用がストレプトアビジン-ビオチンを含む、デバイスが提供される。さらに本明細書では、親和性相互作用が抗体-抗原結合を含む、デバイスが提供される。さらに本明細書では、親和性相互作用がタンパク質-タンパク質相互作用を含む、デバイスが提供される。さらに本明細書では、流体インターフェースをさらに備える、デバイスが本明細書で提供される。さらに本明細書では、フローセルをさらに含む、デバイスが提供される。さらに本明細書では、デバイスが遺伝子座当たり少なくとも1つの検出器を含む、デバイスが提供される。さらに本明細書では、検出器が複数のゼロモード導波路を含む、デバイスが提供される。さらに本明細書では、検出器が、可視波長、UV波長、またはそれらの組み合わせを測定するように構成される、デバイスが提供される。さらに本明細書では、検出器が蛍光を測定するように構成されるデバイスが提供される。さらに本明細書では、検出器が電圧または電流の変化を測定するように構成される、デバイスが提供される。さらに本明細書では、ポリヌクレオチド合成デバイスをさらに含む、デバイスが提供される。
【0008】
参照による援用
本明細書で言及されるすべての公開物、特許、および特許出願は、あたかも個々の公開物、特許、または特許出願がそれぞれ参照により本明細書に具体的かつ個別に示されて援用されるのと同じ程度にまで、参照により本明細書に援用される。
【図面の簡単な説明】
【0009】
本発明の新規な特徴は、添付の特許請求の範囲内に特に明記されている。本発明の特徴と利点についてのよりよい理解は、本発明の原則が用いられている例証的な実施形態を記載する以下の詳細な記載、および添付の図面を参照することによって得られるであろう。
【
図1】配列決定前のポリヌクレオチド合成および調製のためのスキームの非限定的な例を示す。
【
図2】この場合は再使用可能な配列決定チップを用いる、ポリヌクレオチド配列決定のためのスキームの非限定的な例を示す。
【
図3A】
図3A~3Cは、それぞれ、スポット、チャネル、またはウェルを有する、可撓性構造のズームインを描写する。
【
図3B】
図3A~3Cは、それぞれ、スポット、チャネル、またはウェルを有する、可撓性構造のズームインを描写する。
【
図3C】
図3A~3Cは、それぞれ、スポット、チャネル、またはウェルを有する、可撓性構造のズームインを描写する。
【
図4A】活性領域および流体界面を含む固体支持体の概略図である。
【0010】
図4Bは、固体支持体アレイの一例の正面図である。いくつかの例におけるこのようなアレイは、本明細書に記載のポリヌクレオチド合成デバイスを数千または数百万含み得る。
【
図5】ラック型器具の例である。このような器具は、数百または数千の固体支持アレイを含み得る。
【
図7】コンピュータシステムのアーキテクチャを示すブロック図である。
【
図8】複数のコンピュータシステム、複数の携帯電話および携帯情報端末、ならびにネットワーク接続ストレージ(Network Attached Storage)(NAS)を組み込むように構成されたネットワークを示す図である。
【
図9】共有仮想アドレスメモリ空間を使用する、マルチプロセッサコンピュータシステムのブロック図である。
【発明の詳細な説明】
【0011】
生成および記憶される情報の量が指数関数的に増加するにつれて、より大容量の記憶システムが必要とされる。DNA分子などの生体分子は、従来のバイナリ情報コード化とは対照的に、その経時的な安定性および4ビットの情報コード化の能力により、部分的には情報記憶に適したホストを提供する。本明細書では、連続ワークフローを使用して、核酸リード速度および効率を増加させるためのデバイスおよび方法が提供される。さらに本明細書では、単分子配列決定のために表面を再使用または再生利用するためのデバイスおよび方法提供される。
【0012】
定義
【0013】
他に定義されない限り、本明細書で使用されるすべての技術的および科学的用語は、本発明が属する当該技術分野における当業者によって一般に理解されるものと同じ意味を有する。
【0014】
本開示全体にわたって、数値的特徴は範囲形式で示される。範囲表示形式での記載は利便性と簡潔さのみを目的とするものであり、任意の実施形態の範囲に対する確固たる限定として解釈するべきではないことを理解されたい。したがって、範囲の記載は、前後関係から明らかでない限り、可能な下位範囲すべて、ならびにその範囲内の個々の数値を、下限値の単位の10分の1まで具体的に開示したものと考慮する必要がある。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などの下位範囲と、その範囲内の個々の数値、例えば1.1、2、2.3、5、5.9を具体的に開示したものと考慮する必要がある。このことは範囲の広さに関係なく適用される。これらの介在する範囲の上限および下限は、より小さな範囲内に独立して含まれ得、また、定められた範囲内のあらゆる具体的に除外された限界に従って、本発明内に包含される。定められた範囲が上限および下限の1つまたはその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲も、文脈から明確に指示されない限り、本発明内に包含される。
【0015】
本明細書で使用される用語は、特定の実施形態のみを記載するためのものであり、任意の実施形態を限定することを意図してはいない。本明細書では、単数形「a」、「an」、および「the」は、前後関係から明らかでない限り、同様に複数形を含むことを意図している。本明細書では、用語「含む(comprises)」および/または「含むこと(comprising)」は、明示された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するが、1以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在あるいは追加を妨げるものではないことが、さらに理解される。本明細書では、用語「および/または(and/or)」は、関連する列記された項目の1つ以上のあらゆる組み合わせを含む。
【0016】
別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用される場合、数あるいは数の範囲に関連して、用語「約(about)」とは、明示された数とその数+/-10%、あるいはある範囲の列挙された値について列挙された下限の10%以下と列挙された10%以上を意味するものと理解されたい。
【0017】
本明細書で使用される場合、用語「あらかじめ選択された配列(preselected sequence)」、「あらかじめ決められた配列(predefined sequence)」、または「あらかじめ定められた配列(predetermined sequence)」は、交換可能に使用される。用語は、ポリマー配列が知られており、ポリマーの合成または組立の前に選択されることを意味する。特に、本発明の様々な態様は、主に核酸分子の調製に関して本明細書に記載されており、ポリヌクレオチドの配列は知られており、核酸分子の合成または組立の前に選択される。
【0018】
本明細書で使用される場合、用語「記号(symbol)」は、概して、デジタル情報の単位の表現を指す。デジタル情報は、1つ以上の記号に分割または変換され得る。一例では、記号はビットであり得、ビットは数値を有し得る。いくつかの例では、記号は、「0」または「1」の値を有し得る。いくつかの例では、デジタル情報は、記号の配列(sequence)または記号の文字列(string)として表され得る。いくつかの例では、記号の配列または記号の文字列は、バイナリデータを備え得る。
【0019】
本明細書では、合成(例えば、de novo合成または化学合成)ポリヌクレオチドの生成および配列決定のための方法および組成物が提供される。ポリヌクレオチドはまた、オリゴヌクレオチドまたはオリゴと称され得る。本明細書に記載のポリヌクレオチド配列は、別段の定めのない限り、DNAまたはRNAを含む場合がある。
【0020】
連続配列決定
【0021】
本明細書に記載の方法を用いて配列決定されたポリヌクレオチドは、合成されたポリヌクレオチドの塩基配列を読み取り、その塩基配列をバイナリーコードなどの、コンピュータで読み取り可能な1つ以上の記号からなるコードに変換することによって解釈することができるデータをコード化する。いくつかの場合では、配列はアセンブリを必要とし、アセンブリ工程は核酸配列段階またはデジタル配列段階で起こり得る。いくつかの例では、配列決定は、配列中の個々の塩基の識別的な同定/検出を含む。いくつかの例では、配列決定は、デバイス上の個々の分子に対して行われる。
【0022】
本明細書では、本明細書に記載のデバイスに組み込むことができる配列決定システムが提供される。配列決定の様々な方法は、当技術分野において周知であり、試料ポリヌクレオチド中の塩基の同一性が同定/配列決定される「塩基呼び出し(base calling)」を含む。いくつかの例では、本明細書に記載される方法、デバイス、組成物、およびシステムを使用して合成されるポリヌクレオチドは、合成表面からの切断後に配列決定される。いくつかの例では、配列決定は、ポリヌクレオチド合成中またはポリヌクレオチド合成と同時に行われ、塩基呼び出しは、成長するポリヌクレオチド鎖へのヌクレオシドモノマーの伸長の直後またはその前に起こる。塩基呼び出しのための方法は、電流/電圧(例えば、ACまたはDC)、蛍光の測定、または鋳型鎖(template strand)への塩基のポリメラーゼ触媒付加(または過渡的結合)によって生成される他の測定を含む。いくつかの例では、合成表面または配列決定表面は、ポリメラーゼなどの酵素を含む。いくつかの例では、そのような酵素は、電極または合成もしくは配列決定表面に係留される。いくつかの例では、合成または配列決定表面は、複数の遺伝子座(例えば、配列スポット)またはウェル(例えば、ナノポア)を含む。配列決定後、いくつかの例では、ポリメラーゼ、プライマー、または試料ポリヌクレオチドのうちの1つ以上が、デバイスの表面から除去され、新しい成分が、同じデバイス表面を使用する配列決定の第2のサイクルを促進するように添加される。いくつかの例では、このプロセスが多数回繰り返されて、多数の試料ポリヌクレオチドを配列決定する。
【0023】
本明細書では、構造上に直接、および/または構造(例えば、固体支持体)から除去した後に、保存されたポリヌクレオチドを配列決定するためのデバイスを含む検出システムが提供される。いくつかの例では、デバイスは、表面、流体インターフェース、および検出器のうちの1つ以上を備える。いくつかの例では、シグナルは、ポリヌクレオチドの存在を示す。いくつかの例では、シグナルは、ポリヌクレオチドの配列を示す(例えば、蛍光シグナル)。いくつかの例では、検出システムは、ポリヌクレオチド配列決定デバイス、ポリヌクレオチド配列に関連するデータの保存および検索のためのデータベース、ポリヌクレオチド配列のDNAコードをバイナリーコードなどの1つ以上の記号に変換するためのソフトウェア、バイナリーコードを読み取るためのコンピュータ、またはそれらの任意の組合せを含むコンピュータシステムを含む。いくつかの例では、本明細書に記載されるものは、固体支持体、遺伝子座の少なくともいくつかを覆う結合部分、および検出器のうちの1つ以上を含む。いくつかの例では、遺伝子座の少なくともいくつかは、単一の試料ポリヌクレオチドを含む。いくつかの例では、固体支持体は表面を含む。いくつかの例では、表面は複数の遺伝子座を含む。いくつかの例では、結合部分は、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成される。いくつかの例では、検出器は、ポリメラーゼによって付加された1つ以上の塩基の同一性を識別するように構成される。いくつかの例では、表面は再使用可能である。
【0024】
本明細書で説明されるデバイスは、1つ以上の検出器を備え得る。いくつかの例では、検出器は電磁放射線源を備える。いくつかの例では、電磁放射線源は、可視、赤外、またはUV波長光を生成するように構成される。場合によっては、デバイスは、1つ以上のゼロモード導波路を備える。いくつかの例では、デバイスは1つ以上のナノポアを備える。
【0025】
本明細書で説明されるデバイスは、可撓性表面を備える構造を備え得る。構造が可撓性材料のリールツーリールテープである場合、いくつかの例における検出システムは、検出位置を通って構造を保持し、かつ前進させる(advancing)ためのデバイスと、セクションが検出位置にあるときにテープのセクションから生じる信号を検出するために検出位置に近接して配置される検出器とを備える。場合によっては、連続テープ上のポリヌクレオチド内にコード化される情報は、テープがコンピュータに動作可能に接続された検出器を通して連続的に搬送される際にコンピュータによって読み取られる。
【0026】
ポリヌクレオチド配列決定のための方法が本明細書において提供される。いくつかの例では、本明細書に記載される方法は、(a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する工程、(b)ポリヌクレオチドの1つ以上の塩基を検出する工程であって、検出する工程は、複数の三元複合体が表面に結合している場合に行われる、工程、(c)表面から三元複合体を除去する工程、および(d)工程a~cを繰り返してポリヌクレオチドを配列決定する工程の1つ以上の工程を含む。いくつかの例では、方法は、表面を洗浄する工程を含む。配列決定の前に、ポリヌクレオチドを合成し、
図1に示すスキームを通して、非限定的な例において示されるように、配列決定のために調製する。ポリヌクレオチドは、本明細書に記載の方法を用いて合成表面(101)上で合成される。DNA合成(102)が行われ、合成表面(103)上に複数のポリヌクレオチドが得られる。合成されたポリヌクレオチドは、表面(104)から除去され、例えば、微量遠心管または他の適切な媒体もしくは容器に収集される。いくつかの例では、遊離ポリヌクレオチドを含有する微量遠心管(105)は、ポリヌクレオチドを保存するのに適した緩衝液を含有する。いくつかの場合では、ポリヌクレオチドは環状である。いくつかの場合では、ポリヌクレオチドはヘアピンアダプタを含む。いくつかの例では、ポリヌクレオチドは、合成表面上で、または合成チップから除去された後に増幅される。プライマー(107)およびポリメラーゼ酵素(109)もポリヌクレオチドと接触させる。いくつかの例では、プライマー(107)は、次の工程(106)においてポリヌクレオチドに添加され、このことが、プライマーおよびポリヌクレオチド複合体(108)をもたらす。いくつかの場合では、プライマー(107)は、10塩基対、20塩基対、30塩基対、40塩基対、50塩基対、または60塩基対以下である。さらなる例では、ポリメラーゼ酵素(109)は、さらなる工程(110)において、微量遠心管に添加され、このことは、複数の三元複合体(111)をもたらす。いくつかの例では、ポリメラーゼ酵素(109)は、結合部分であり得る第1の部分を含む。いくつかの例では、ポリメラーゼ酵素(109)上の第1の部分は、ビオチンを含む。いくつかの例では、ポリメラーゼ酵素(109)上の第1の部分は、タンパク質鎖を含む。いくつかの例では、ポリメラーゼ酵素(109)上の第1の部分は、オリゴヌクレオチドを含む。いくつかの例では、ポリメラーゼ酵素(109)は、非限定的な例として、バクテリオファージphi29(φ29)ポリメラーゼ、遺伝子改変phi29(φ29)DNAポリメラーゼ、サーミネーターDNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、エキソ(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ(例えば、VentR(エキソ-)DNAポリメラーゼ)、Deep Vent DNAポリメラーゼ(例えば、Deep Vent(エキソ-)DNAポリメラーゼ)、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、T5 DNAポリメラーゼ、Sequenase、T7 DNAポリメラーゼ、T7-Sequenase、T7 gp5 DNAポリメラーゼ、PRDI DNAポリメラーゼ、またはT4 DNAポリメラーゼを含む。いくつかの例では、追加の鎖置換核酸ポリメラーゼもまた、本明細書に記載される方法と適合性がある。所与のポリメラーゼが鎖置換複製を行う能力は、例えば、鎖置換複製アッセイにおいてポリメラーゼを使用して、決定することができる。このようなアッセイは、いくつかの例では、使用される酵素の最適な活性に適切な温度、例えば、phi29 DNAポリメラーゼについては32℃、エキソ(-)Bst DNAポリメラーゼについては46℃~64℃、または超好熱性生物(hyperthermophylic organism)からの酵素については約60℃~70℃で実施される。いくつかの例では、ポリメラーゼを選択するための別の有用なアッセイは、プライマーブロックアッセイである。いくつかの例では、ポリメラーゼは、C1、C2、P4-XL、P5-C3、またはP6-C4(Pacific Biosciences)を含む。
【0027】
構造の表面からのポリヌクレオチドの抽出および/または増幅後、適切な配列決定技術は、ポリヌクレオチドを配列決定するために採用され得る。いくつかの場合では、ポリヌクレオチド配列は、構造の表面上の基質上(本明細書では反応部位とも呼ばれる)または構造の特徴(例えば、ナノウェル、マイクロウェル、ナノポアなど)内で読み取られる。いくつかの例では、構造は金属膜を含む。いくつかの例では、構造は、
図2に示すような単一分子配列決定チップ(203)である。いくつかの場合では、ポリヌクレオチドは、任意選択で、より長い核酸にアセンブルされ、次いで配列決定される。ポリヌクレオチド三元複合体ライブラリー(201)は、複数の三元複合体(111)から作製され、配列決定される単一分子配列決定チップ(203)上にローディングされる(例えば、固定化される)。いくつかの例では、ポリヌクレオチド三元複合体ライブラリー(201)は、少なくとも100,000、100万、1000万、5000万、1億、2億、5億、または少なくとも7.5億個の固有なポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド三元複合体ライブラリー(201)は、約1~750、1~500、1~250、1~100、または1~1000万個の固有なポリヌクレオチドを含む。いくつかの例では、ポリヌクレオチド三元複合体ライブラリー(201)は、100,000、100万、1000万、5000万、1億、2億、5億、または少なくとも7.5億個以下の固有なポリヌクレオチドを含む。単一分子配列決定チップ(203)は、三元複合体ライブラリ(201)における三元複合体を固定するための遺伝子座を含む。いくつかの例では、単一分子配列決定チップ(203)は、少なくとも50,000、100,000、200,000、500,000、750,000、100万、200万、500万、800万、1000万、または少なくとも2000万個の遺伝子座を含む。いくつかの例では、単一分子配列決定チップ(203)は、80,000~2000万、100万~2000万、100万~1000万、または500万~2000万個の遺伝子座を含む。いくつかの例では、単一分子配列決定チップ(203)は、50,000、100,000、200,000、500,000、750,000、100万、200万、500万、800万、1000万以下、または2000万個以下の遺伝子座を含む。
【0028】
本明細書で説明される構成要素(例えば、基板)は、表面に結合または固定され得る。いくつかの例では、基質(例えば、ポリヌクレオチド、ポリメラーゼ、プライマー、またはそれらの任意の組み合わせの複合体)は、材料を含む反応部位の表面上に固定化され、および/または結合のための基質とのカップリング反応を促進する材料でコーティングされる。このような例では、基板表面または表面の選択された部位もしくは領域の1つ以上の化学的および/または物理的特性を変化させるために、加法的または減法的プロセスによって基板表面を化学的および/または物理的に変化させる表面改質が採用され得る。例えば、表面の改質は、(1)表面の湿潤特性を変化させること、(2)表面を官能基化すること、例えば、表面官能基を提供すること、修飾すること、または置換すること、(3)表面を脱官能基化すること、例えば、表面官能基を除去すること、(4)別様に、例えば、エッチングを通して、表面の化学組成を変化させること、(5)表面の粗さ(surface roughness)を増加または減少させること、(6)表面上にコーティング、例えば、表面の湿潤特性とは異なる湿潤特性を示すコーティングを提供すること、および/または(7)表面上に微粒子を堆積させること。いくつかの例では、構造の表面は、選択的に官能基化されて、構造上に2つ以上の別個の領域を生成し、ここで、少なくとも1つの領域は、同じ構造の別の領域とは異なる表面または化学的特性を有する。このような特性としては、限定されないが、表面エネルギー、化学的停止、化学部分の表面濃度などが挙げられる。いくつかの場合では、官能基化剤(functional agents)の混合物は、表面を改質(modify)するために使用され得る。反応部位の表面は、基質固定化(substrate immobilization)の目的を含めて、本明細書にさらに記載される方法を使用して調製され得る。いくつかの例では、表面は、配列決定後に基質で再固定化される。
【0029】
配列決定チップへのポリヌクレオチドの固定化は、リンカー部分またはテザーを介した共有結合または非共有結合相互作用によって達成することができ、例えば、反応部位で基質(例えば、核酸鋳型、例えば、DNA、RNA、またはそのハイブリッド、類似体、および模倣体、またはキナーゼの標的分子)に結合した酵素(例えば、ポリメラーゼ、転写酵素、キナーゼなど)を使用する。いくつかの例では、コンジュゲーション化学を使用して、ポリヌクレオチドまたは他の成分を配列決定チップに固定化する。いくつかの例では、コンジュゲーション化学は、求核剤/カルボニル、アジド/ホスフィン、1,4マイケル付加、1,3-双極性環状付加、逆電子需要型環状付加、オレフィンメタセシス、またはクロスカップリング反応を含む。
【0030】
代替的な例では、ポリヌクレオチドまたはプライマーを含む基質は、反応部位に直接接続される(例えば、酵素を介さない)。いくつかの場合では、反応部位は、単一分子配列決定チップ(203)の表面であるか、または光閉じ込め(optical confinement)(例えば、マイクロウェル、ナノウェル、ナノポアなど)内にある。核酸またはポリメラーゼを固体支持体に結合させるための結合部分の非限定的な例としては、アミドもしくはアミノ結合、カルバメート結合、ジスルフィド結合、エステル結合、官能基化マレイミド結合、ヒドラゾン結合、(N)-官能基化チオ尿素、チオエステル結合、ストレプトアビジンもしくはアビジン/ビオチン結合、またはそれらの組み合わせが挙げられる。いくつかの例では、1つ以上の反応成分に結合する抗体が、結合部分として使用される。いくつかの例では、シリル部分は、ガラスなどの反応部位の基質に対して、直接核酸に接続するために使用される。いくつかの例では、核酸テンプレート(例えば、ポリヌクレオチド)は、反応部位に直接接続される。いくつかの例では、核酸鋳型(例えば、ポリヌクレオチド)は、鋳型とハイブリダイズすることができる反応部位に、相補性領域を含むプライマーを接続させることによって、反応部位上に固定化され、それによってモニタリングに適した位置にそれを固定化する。代替例では、核酸テンプレート(例えば、ポリヌクレオチド)は、本明細書に記載されるポリメラーゼを介して反応部位に固定化される。
【0031】
様々なコンジュゲーション反応を使用して、リンカー、コンジュゲーション部分、および本明細書に記載のサイトカインペプチドに組み込まれた非天然アミノ酸をコンジュゲートする。このようなコンジュゲーション反応は、多くの場合、「生体直交型(bioorthogonal)」反応など、水性条件と適合性がある。いくつかの例では、コンジュゲーション反応は、触媒、光、またはリンカー、コンジュゲーション部分、もしくは非天然アミノ酸上に見出される反応性化学基等の化学試薬によって媒介される。いくつかの例では、コンジュゲーション反応は酵素によって媒介される。いくつかの例では、本明細書で使用されるコンジュゲーション反応は、Gong,Y.,Pan,L.Tett.Lett.2015,56,2123に記載されている。いくつかの例では、本明細書で使用されるコンジュゲーション反応は、Chen,X.;Wu.Y-W.Org.Biomol.Chem.2016,14,5417に記載されている
【0032】
本明細書に記載のいくつかの例では、コンジュゲーション反応は、ケトンまたはアルデヒドの求核試薬との反応を含む。いくつかの例では、コンジュゲーション反応は、オキシムを形成するための、ケトンとアミノオキシ基との反応を含む。いくつかの例では、コンジュゲーション反応は、イミンを形成するための、ケトンとアリールまたはヘテロアリールアミン基との反応を含む。いくつかの例では、コンジュゲーション反応は、イミンを形成するためのアルデヒドとアリールまたはヘテロアリールアミン基との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、オキシムを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、コンジュゲーション反応は、アルデヒドまたはケトンとトリプタミン求核試薬とのピクテ-スペングラー反応(Pictet-Spengler reaction)を含む。いくつかの例では、コンジュゲーション反応は、ヒドラジノ-ピクテット-スペングラー反応(hydrazino-Pictet-Spengler reaction)を含む。いくつかの例では、コンジュゲーション反応は、ピクテ-スペングラーライゲーションを含む。
【0033】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドおよびホスフィンの反応(Staudingerライゲーション)を含む。いくつかの例では、ホスフィンはアリールホスフィンである。いくつかの例では、アリールホスフィンはオルトエステル基を含む。いくつかの例では、ホスフィンは、メチル 2-(ジフェニルホスファニル)安息香酸の構造を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アリールアミドを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アミドを介して結合されたリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。
【0034】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、1,3-双極性付加環化反応を含む。いくつかの例では、1,3-双極性付加環化反応は、アジドおよびホスフィンの反応(「クリック(Click)」反応)を含む。いくつかの例では、コンジュゲーション反応は、銅によって触媒される。いくつかの例では、本明細書に記載のコンジュゲーション反応は、トリアゾールを介して接続したリンカーまたはコンジュゲーション部分を含むサイトカインペプチドをもたらす。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドの歪みオレフィンとの反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドの歪みアルキンとの反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アジドとシクロアルキン、例えば、OCT、DIFO、DIFBO、DIBO、BARAC、TMTH、または他の歪みシクロアルキンとの反応を含み、その構造は、Gong,Y.,Pan,L.Tett.Lett.2015,56,2123に示される。いくつかの例では、1,3-双極性環化付加反応は、光(「フォトクリック(photoclick)」)によって触媒される。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、末端アリル基と、テトラゾールおよび光との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、末端アルキニル基と、テトラゾールおよび光との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、O-アリルアミノ酸と、テトラジンおよび光との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、O-アリルチロシンと、テトラジンおよび光との反応を含む。
【0035】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ジエンおよびジエノフィルを含む逆電子要求環状付加反応を含む。いくつかの例では、ジエンはテトラジンを含む。いくつかの例では、ジエノフィルはアルケンを含む。いくつかの例では、ジエノフィルはアルキンを含む。いくつかの例では、アルキンは歪みアルキンである。いくつかの例では、アルケンは歪みジエンである。いくつかの例では、アルキンはトランス-シクロオクチンである。いくつかの例では、アルキンはシクロオクテンである。いくつかの例では、アルケンはシクロプロペンである。いくつかの例では、アルケンはフルオロシクロプロペンである。いくつかの例では、本明細書に記載のコンジュゲーション反応は、環内に2つの窒素原子を含む6員環複素環を介してリンカーまたはコンジュゲーション部分に接続したサイトカインペプチドの形成をもたらす。
【0036】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、オレフィンメタセシス反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アルケンおよびアルキンとルテニウム触媒との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、2つのアルケンとルテニウム触媒との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、2つのアルキンとルテニウム触媒との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アルケンまたはアルキンと、ルテニウム触媒およびアリル基を含むアミノ酸との反応を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、アルケンまたはアルキンと、ルテニウム触媒およびアリルスルフィドまたはセレニドを含むアミノ酸との反応を含む。いくつかの例では、ルテニウム触媒は、Hoveda-Grubbs第2世代触媒。いくつかの例では、オレフィンメタセシス反応は、1つ以上の歪みアルケンまたはアルキンの反応を含む。
【0037】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、クロスカップリング反応を含む。いくつかの例では、クロスカップリング反応は、イリジウム、金、ルテニウム、ロジウム、パラジウム、ニッケル、白金、または他の遷移金属触媒などの遷移金属触媒および1つ以上のリガンドを含む。場合によっては、遷移金属触媒は水溶性がある。本明細書に記載されるいくつかの例では、本明細書に記載されるコンジュゲーション反応は、Suzuki-Miyauraクロスカップリング反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ハロゲン化アリール(またはトリフレート、もしくはトシレート)、アリールまたはアルケニルボロン酸、およびパラジウム触媒の反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、Sonogashiraクロスカップリング反応を含む。本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、ハロゲン化アリール(またはトリフレート、もしくはトシレート)、アルキン、およびパラジウム触媒の反応を含む。いくつかの例では、クロスカップリング反応は、炭素-炭素結合を介した、リンカーまたはコンジュゲート部分のサイトカインペプチドへの結合をもたらす。
【0038】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、コンジュゲーション前の反応性基の脱保護または「アンケージング(uncaging)」反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、光による反応基の脱ケージング、その後のコンジュゲーション反応を含む。いくつかの例では、反応基は、1つ以上のニトロ基を含むアラルキル部分で保護される。いくつかの例では、反応性基の脱ケージ化は、遊離アミン、スルフィド、または他の反応性基をもたらす。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、遷移金属触媒による反応性基の脱ケージング、その後のコンジュゲーション反応を含む。いくつかの例では、遷移金属触媒は、パラジウムおよび1つ以上のリガンドを含む。いくつかの例では、反応基は、アリル部分で保護される。いくつかの例では、反応基は、アリルカルバメートで保護される。いくつかの例では、反応基は、プロパルギル部分で保護される。いくつかの例では、反応基は、プロパルギルカルバメートで保護される。いくつかの例では、反応基は、ジエノフィルで保護され、ジエン(テトラジンなど)への曝露は、反応基の脱保護をもたらす。
【0039】
本明細書に記載のいくつかの例では、本明細書に記載のコンジュゲーション反応は、リガンド指向性反応を含み、リガンド((任意選択で)反応基に結合)は、反応基とサイトカインペプチドとの間のコンジュゲーション部位を促進する。いくつかの例では、リガンドは、サイトカインペプチドと反応基との反応中または反応後に切断される。いくつかの例では、サイトカインペプチドの結合部位は、天然アミノ酸である。いくつかの例では、サイトカインペプチドのコンジュゲーション部位は、リジン、システイン、またはセリンである。いくつかの例では、サイトカインペプチドのコンジュゲーション部位は、本明細書に記載の非天然アミノ酸である。いくつかの例では、反応基は脱離基を含むことであって、電子不足のアリール(electron-poor aryl)またはヘテロアリール基である。いくつかの例では、反応基は、サイトカインペプチドによって置換される電子不足アルキル基などの脱離基を含む。いくつかの例では、本明細書に記載のコンジュゲーション反応は、ラジカル捕捉剤とラジカル種との反応を含む。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、酸化的ラジカル付加反応を含む。いくつかの例では、ラジカル捕捉剤はアリールアミンである。いくつかの例では、ラジカル種はチロシルラジカルである。いくつかの例では、ラジカル種は、ルテニウム触媒([Ru(bpy)3]など)および光によって生成される。
【0040】
酵素反応は、任意選択で、本明細書に記載されるコンジュゲーション反応のために使用される。例示的な酵素的コンジュゲーションとしては、SortA媒介性コンジュゲーション、TGs媒介性コンジュゲーション、またはFGE媒介性コンジュゲーションが挙げられる。いくつかの例では、本明細書に記載されるコンジュゲーション反応は、アミド結合を形成するための、末端1-アミノ-2-チオ基のチオエステルとの天然タンパク質ライゲーション(NPL)を含む。
【0041】
リンカーまたはコンジュゲーション部分をサイトカインペプチドと反応させるための様々なコンジュゲーション反応が本明細書に記載され、反応は、サイトカインペプチド中の天然(「標準(canonical)」)アミノ酸で起こる。いくつかの例では、天然アミノ酸は、野生型配列中に見出されるコンジュゲーション位置に見出されるか、あるいはその位置が変異されている。いくつかの例では、コンジュゲーション反応は、システイン残基でのジスルフィド結合の形成を含む。いくつかの例では、コンジュゲーション反応は、システインまたはリジンの1,4マイケル付加反応を含む。いくつかの例では、コンジュゲーション反応は、システインのシアノベンゾチアゾールライゲーションを含む。いくつかの例では、コンジュゲーション反応は、1,3-ジクロロ-2-プロピオノンなどのアセトン部分との架橋を含む。いくつかの例では、コンジュゲーション反応は、システインと、O-メシチレンスルホニルヒドロキシルアミンとの反応によって形成されるデヒドロアラニンへの1,4マイケル付加を含む。いくつかの例では、コンジュゲーション反応は、チロシンと、トリアゾリンジオン(TAD)またはTAD誘導体との反応を含む。いくつかの例では、コンジュゲーション反応は、トリプトファンとロジウムカルベノイドとの反応を含む。
【0042】
いくつかの場合では、ポリメラーゼは、三元複合体を単一分子配列決定チップ(203)に直接繋ぎ止めるために使用される第1の部分を含む。いくつかの例では、結合分子は、第1の部分に結合され、これは、三元複合体を単一分子配列決定チップ(203)に繋ぎ止めるために使用される。さらなる場合では、単一分子配列決定チップ(203)は、その反応部位上に、複数の第2の部分を含む。いくつかの例では、第2の部分はビオチンである。いくつかの例では、第2の部分はタンパク質である。いくつかの例では、第2の部分はオリゴヌクレオチドである。いくつかの場合では、複数の第2の部分は、ポリヌクレオチド、ポリメラーゼ、プライマー、またはそれらの組み合わせのいずれかを介して、三元複合体を単一分子配列決定チップ(203)に繋留するために使用される。さらなる場合では、複数の第2の部分は、第1の部分に接続した結合分子に接続するか、または第1の部分に直接接続する(例えば、結合分子なしで)。いくつかの例では、第1および第2の部分は、同じ部分である。代替例では、第1および第2の部分は、異なる部分である。いくつかの例では、単一分子配列決定チップ(203)は、試料ポリヌクレオチドを「ローディング」されるか、またはある容量まで集められる。いくつかの例では、1つ以上の遺伝子座はそれぞれ、単分子試料ポリヌクレオチドを含む。いくつかの例では、単一分子配列決定チップ(203)は、約1%、2%、5%、10%、20%、30%、40%、50%、60%、または70%の容量でローディングされる。いくつかの例では、単一分子配列決定チップ(203)は、約33%、約50%、または約66%の容量でローディングされる。いくつかの例では、単一分子配列決定チップ(203)は、1%、2%、5%、10%、20%、30%、40%、50%、60%、または70%以下の容量でローディングされる。いくつかの例では、単一分子配列決定チップ(203)は、約1~50%、2~50%、5~50%、5~25%、5~10%、10~50%の容量、約10~40%の容量、約10~30%の容量、約20~40%の容量、約20~30%の容量、約30~40%の容量、または約30~50%の容量でローディングされる。いくつかの例では、単一分子配列決定チップ(203)は、所定の分布に従って、アレイとしてローディングされる。いくつかの例では、単一分子配列決定チップ(203)は、ポアソン分布または正規分布に従ってローディングされる。
【0043】
次に、ローディングされた単一分子配列決定チップ(203)上のポリヌクレオチドを配列決定し(204)、配列決定中に組み込まれたヌクレオチドに固有の出力信号(205)が得られる。出力シグナルは、配列相補性を介して、ポリヌクレオチドの配列を決定するために使用される。いくつかの例では、配列決定されるポリヌクレオチドは、30,000、20,000、10,000、5,000、1000、500以下、または250以下の塩基を含む。いくつかの例では、配列決定されるポリヌクレオチドは、少なくとも30,000、20,000、10,000、5,000、1000、500、または少なくとも250塩基を含む。一度、配列決定チップ上のポリヌクレオチドを配列決定されると、三元複合体は、洗浄する工程(207)によって除去される(206)。いくつかの例では、ローディングされていない(unloaded)単一分子配列決定チップ(208)の表面は、洗浄する工程(207)の後に再官能基化される必要はない。いくつかの場合では、複数の第2の部分は、洗浄する工程(207)に続いて、ローディングされていない(または、少なくとも部分的にローディングされていない)単一分子配列決定チップ(208)に係留されたままである。いくつかの例では、洗浄する工程(207)は、有機溶媒、熱、または酵素のうちの1つ以上を含む。いくつかの例では、有機溶媒は、MeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、DMSO、ホルムアミド、THF、またはこれらの任意の組み合わせを含む。いくつかの場合では、酵素はプロテイナーゼである。いくつかの場合では、プロテイナーゼはアミノペプチダーゼを含む。いくつかの場合では、アミノペプチダーゼは、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはLysCを含む。いくつかの例では、プロテイナーゼはプロテイナーゼKである。いくつかの例では、洗浄する工程(207)は、ストレプトアビジンまたはアビジン/ビオチン結合を破壊するためのビオチンを含む液体の使用を含む。いくつかの例では、洗浄する工程(207)は、1分、2分、3分、4分、5分、6分、7分、8分、9分、または10分以下を要する。いくつかの例では、洗浄する工程(207)は、約1~10分、約1~7分、約1~5分、約1~2分、約2~6分、約3~4分、約5~6分、5~10分、または7~10分を要する。いくつかの例では、ポリヌクレオチド三元複合体ライブラリー(201)の配列決定および単一分子配列決定チップ(203)の洗浄の全サイクルは、5分、6分、7分、8分、9分、10分、11分、12分、13分、14分、15分、18分、20分、25分、または30分以下を要する。洗浄は、洗浄条件との繰り返し接触を含み得、洗浄を1、2、3、4、5、8、10、12、15、20、25、30、50、または100回繰り返す。洗浄は、洗浄条件との繰り返し接触を含み得、洗浄は、少なくとも1、2、3、4、5、8、10、12、15、20、25、30、50、または少なくとも100回繰り返される。いくつかの例では、除去された三元複合体を回収する。代替例では、除去された三元複合体は回収されない。
図2を参照すると、洗浄する工程(207)において三元複合体がすべて除去されると、ローディングされていない単一分子配列決定チップ(208)に新たな三元複合体ライブラリーを再ローディング(209)する。いくつかの例では、ローディングされていない単一分子配列決定チップ(208)の表面は、再ローディングされる前に調整される。いくつかの例では、ローディングされていない単一分子配列決定チップ(208)の表面は、再ローディングされる前に調整されない。いくつかの例では、調整は、その後のポリヌクレオチド配列決定に適した条件に表面を浸すこと、ベーキングすること、洗浄すること、エッチングすること、洗浄すること、またはさもなければ再選別することを含む。新しい三元複合体ライブラリ(209)が配列決定のために再ローディングされ、本明細書に記載の配列決定の工程が繰り返される。表面が再使用される回数および再使用のために表面を再生利用/調製する方法は、その後の用途に応じて変化する。再使用のために調製された表面は、いくつかの例では、少なくとも1、2、3、5、10、20、50、100、1,000回以上再使用される。いくつかの例では、表面が再使用に適している残りの「寿命(life)」または回数が、測定または予測される。いくつかの例では、配列決定方法は、(a)複数のポリヌクレオチドを少なくとも1つのプライマーおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する工程、(b)ポリヌクレオチドの1つ以上の塩基を検出する工程であって、検出は、複数の三元複合体が表面に結合している場合に起こる、工程、(c)表面から三元複合体を除去する工程、ならびに、(d)工程a~cを繰り返してポリヌクレオチドを配列決定する工程のうちの1つ以上の工程を含み、該方法は、少なくとも1つの洗浄する工程を含む。
【0044】
デバイスの表面に新しい構成要素(例えば、プライマー、ポリメラーゼ、試料ポリヌクレオチド)を再ローディングする前に、任意の数のリードが、取得され得る。いくつかの例において、少なくとも1000万、5000万、1億、10億、100億、1000億、または少なくとも2000億リードは、デバイスが再ローディングされる前に取得される。いくつかの例では、リードは、核酸配列データのセグメントを含む。いくつかの例では、リードは、少なくとも10、50、75、100、125、150、200、250、500、1000、2000、5000、または少なくとも10,000塩基長である。いくつかの例では、リードは、より大きな連続配列(例えば、コンティグ)にインシリコでアセンブルされる。いくつかの例では、コンティグは、染色体、ゲノム、データファイル、または他の単位などのより大きな群にインシリコでアセンブルされる。いくつかの例では、リードは、1つ以上のインデックスを使用してアセンブルされる。いくつかの例では、1つ以上の指標は、核酸配列中にコード化されるデジタル情報の位置またはアドレスを示す。
【0045】
本明細書に記載される配列決定方法は、ポリヌクレオチドを配列決定するために、発光マーカーの使用を含み得る。いくつかの場合では、反応混合物中の各ヌクレオチドA、T、C、およびGは、固有の発光マーカーで標識される。発光マーカーの例としては、酵素、蛍光分子、フルオロフォア、蛍光染料、蛍光染料、染料(例えば、有機染料または非有機染料)、蛍光タンパク質(例えば、内因性または非内因性)、非蛍光タグ(例えば、表面増強ラマン散乱(SERS)粒子)、散乱金属ナノ粒子(例えば、金または銀)、発色団の組み合わせ(例えば、単一または複数の成分上の蛍光共鳴エネルギー移動(FRET)標識)、量子ドット、またはそれらの組み合わせが挙げられるが、これらに限定されない。いくつかの例では、固有の発光マーカのそれぞれは、発光波長、発光の時間的特性(例えば、発光減衰期間)、および/または励起エネルギーに対する応答(例えば、励起光子を吸収する確率)などのそれらの発光特性において異なる。いくつかの場合では、各発光マーカの発光特性のいずれか1つの相違は、それらが互いから識別されることを可能にする。いくつかの例では、発光マーカーを識別するために、放出された発光の時間変動(例えば、蛍光寿命)の測定が用いられる。いくつかの例では、発光マーカーは、リンカーを介して、ヌクレオチドに、例えばヌクレオチドの末端リン酸に結合される。リンカーの例は、少なくとも1つ以上のヒドロキシル基、スルフヒドリル基、アミノ基またはハロアルキル基であり、これらは、例えば、天然または修飾ヌクレオチドの末端リン酸でリン酸エステル、チオエステル、ホスホルアミデートまたはアルキルホスホネート結合を形成するのに適切であり得る。ポリヌクレオチド、プライマー、またはポリメラーゼは、いくつかの場合、ゼロモード導波路を形成する配列決定チップ上のウェルに繋ぎとめられる。いくつかの例では、ウェル(例えば、ナノウェル)は、直径を有する円筒形状である。いくつかの例では、ゼロモード導波路は、ウェルを通る伝搬光学モードを支持しない単一の金属層を形成する。いくつかの例では、チップ上の各ウェルは、約1つの試料(例えば、1つのポリヌクレオチド)を含有する。固有の発光マーカーを有する新しいヌクレオチドは、ポリメラーゼおよびプライマーを介してポリヌクレオチドの配列に連続的に組み込まれる。組み込まれた各ヌクレオチドに関連する固有の発光マーカーは、その組み込み中または組み込み後に、少なくとも1つの適切な励起源(例えば、レーザーなどの光源)で励起される。いくつかの例では、励起源は、励起を誘導する電磁エネルギーを生成する。いくつかの例では、少なくとも1つの励起源からの励起エネルギーはパルス化される。いくつかの例では、少なくとも1つの励起源は、1を超える励起エネルギーを生成する。発光マーカーからの発光は、その後検出され、組み込まれた特定のヌクレオチドに起因する。検出された発光マーカーの収集から得られた配列を使用して、配列相補性を介して、ポリヌクレオチドの配列を決定する。発光マーカーの検出に続いて、リンカーは、新たに組み込まれたヌクレオチドから発光マーカーを分離するために切断される。いくつかの例では、発光マーカーを末端ホスフェートに接続させ、ポリメラーゼなどの重合酵素を用いて発光マーカーを切断する。
【0046】
本明細書に記載されるさらなる配列決定方法は、ポリヌクレオチドを配列決定するための電子機器の使用を含み得る。そのような場合、分子電子センサを使用して、ポリヌクレオチド配列中のヌクレオチドのパターンに応じて識別可能なシグナルを生成する。分子電子センサは、離間した一対の電極を含む。分子複合体は各電極に接続し、分子電子回路を形成する。いくつかの例では、分子複合体は、架橋分子およびプローブ分子を含む。架橋分子の非限定的な例は、グラフェンナノリボン、抗体、カーボンナノチューブ、抗体のFabアーム、二本鎖DNAオリゴマー、タンパク質αヘリックス、またはそれらの組み合わせである。いくつかの例では、プローブ分子は、その活性を通じて測定可能な電気的パラメータを調節するポリメラーゼである。いくつかの場合では、測定可能な電気的パラメータは、分子複合体を通過する電極間の電流を含み、これは、ヌクレオチドパターンを定量的に(例えば、ピーク振幅、シグナル持続時間など)および/または定性的に(例えば、ピーク形状)区別するために使用される。識別可能な測定された電気的パラメータは、ポリヌクレオチド配列に関連するバイナリデータに変換される。
【0047】
本明細書に記載されるさらなる配列決定方法は、合成によるナノポア配列決定(SBS)の使用を含み得る。そのような場合、酵素(例えば、ポリメラーゼ)を使用して、標的配列テンプレートに相補的なポリヌクレオチド配列を合成する。同時に、成長鎖に付加されたヌクレオチドのそれぞれの同一性は、ポリメラーゼ活性部位に隣接するナノポアを通る電流の流れ(例えば、ACまたはDC)をモニタリングすることによって決定される。タグは、付加された各ヌクレオチドに付けられ、これは、ナノポアを通って流れる電流の識別可能な変化を生じるために使用される。タグの例としては、ポリエチレン-グリコール(PEG)オリゴマー、有機色素部分、オリゴヌクレオチド(天然および/もしくは非天然アナログモノマー単位を含む)、ポリペプチド(天然および/もしくは非天然アナログモノマー単位を含む)、オリゴマー部分、またはそれらの任意の組み合わせが挙げられるが、これらに限定されない。いくつかの例では、タグは、ナノポアを通る電流の識別可能な遮断(例えば、「遮断電流(blocking current)」)を提供するのに十分な時間(例えば、「滞留時間(dwell time)」)の間、ナノポア内に存在する。遮断電流を使用して、タグと関連する特定のヌクレオチドを同定し、それを他のタグ付きヌクレオチドと識別する。
【0048】
さらなるコンピュータ統合方法は、本明細書に記載される配列決定方法とともに使用され得る。いくつかの例では、機械学習(ML)を含むアルゴリズムを使用して、電流/電圧を、ポリヌクレオチドに添加されたヌクレオシドモノマーに関連付ける。いくつかの場合では、MLを含むアルゴリズムは、電流/電圧を、ポリヌクレオチドに添加されたヌクレオシドモノマーに関連付けるために訓練データを用いて訓練され得る。いくつかの場合では、アルゴリズムは、分類および/またはクラスタリング(例えば、K平均クラスタリング、平均シフトクラスタリング、ノイズを有するアプリケーションの密度ベースの空間クラスタリング(Density-based spatial clustering of applications with noise)(DBSCAN)、期待値最大化(EM)クラスタリング、凝集階層クラスタリング、ロジスティック回帰、ナイーブベイズ、K近傍、ランダムフォレストまたは決定木、勾配ブースティング、サポートベクターマシン(SVM))のための古典的MLアルゴリズム、またはこれらの組み合わせ)を含む。
【0049】
いくつかの場合では、アルゴリズムは、1つ以上のニューラルネットワークなどの層を備える学習アルゴリズムを備える。ニューラルネットワークは、入力データの変換または翻訳などの機能を実行し得る、ネットワーク内の接続されたノードを備え得る。いくつかの例では、所与のノードからの出力は、入力として別のノードに送られ得る。いくつかの実施形態では、ネットワーク内のノードは、入力ユニット、隠れユニット、出力ユニット、またはそれらの組合せを備え得る。いくつかの場合では、入力ノードは、1つ以上の隠れユニットに接続され得る。いくつかの場合では、1つ以上の隠れユニットを出力ユニットに接続し得る。ノードは、入力を取り込み得、活性化関数に基づいて出力を生成し得る。いくつかの実施形態では、入力または出力は、テンソル、行列、ベクトル、アレイ、またはスカラーであり得る。いくつかの実施形態では、活性化関数は、正規化線形ユニット(Rectified Linear Unit)(ReLU)活性化関数、シグモイド活性化関数(sigmoid activation function)、または双曲線正接活性化関数(hyperbolic tangent activation function)であり得る。いくつかの実施形態では、活性化関数は、ソフトマックス活性化関数(Softmax activation function)であり得る。ノード間の接続はさらに、所与のノードへの入力データを調節するための重みを備え得る(例えば、入力データを活性化または非活性化するために)。いくつかの実施形態では、重みは、ニューラルネットワークによって学習され得る。いくつかの実施形態では、ニューラルネットワークは、勾配ベースの最適化を使用して訓練され得る。いくつかの場合では、勾配ベースの最適化は、1つ以上の損失関数を含み得る。いくつかの例では、勾配ベースの最適化は、共役勾配降下(conjugate gradient descent)、確率的勾配降下(stochastic gradient descent)、またはそれらの変形(例えば、適応モーメント推定(Adam))であり得る。さらなる例では、勾配ベースの最適化における勾配は、逆伝搬を使用して計算され得る。いくつかの実施形態では、ノードは、ネットワーク(例えば、グラフニューラルネットワーク)を生成するためにグラフに編成され得る。いくつかの実施形態では、ノードは、ネットワーク(たとえば、フィードフォワードニューラルネットワーク、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)など)を生成するために1つ以上の層に編成され得る。いくつかの場合では、ニューラルネットワークは、複数の層を備えるディープニューラルネットワークであり得る。
【0050】
いくつかの場合では、ニューラルネットワークは、1つ以上の回帰層(recurrent layer)を備え得る。いくつかの例では、1つ以上の回帰層は、連続データ分類およびクラスタリングを実行し得る1つ以上の長・短期記憶(long short-term memory)(LSTM)層またはゲート回帰ユニット(gated recurrent unit)(GRU)であり得る。いくつかの実施形態では、ニューラルネットワークは、1つ以上の畳み込み層を備え得る。入力および出力は、特徴量マップ(または活性化マップ)と呼ばれ得る、データセット(例えば、特徴量)中の変数または属性を表すテンソルであり得る。いくつかの場合では、畳み込みは、1次元(1D)畳み込み、2次元(2D)畳み込み、3次元(3D)畳み込み、またはそれらの任意の組合せであり得る。さらなる場合、畳み込みは、1D転置畳み込み、2D転置畳み込み、3D転置畳み込み、またはそれらの任意の組合せであり得る。いくつかの例では、1次元畳み込み層は、並列畳み込みにより時系列を分類し得るので、時系列データに適し得る。いくつかの例では、畳み込み層は、ポリヌクレオチドに添加されるヌクレオシドモノマーへの電流/電圧を分析するために使用され得る。
【0051】
ニューラルネットワーク内の層は、畳み込み層の前または後に、1つ以上のプーリング層をさらに含み得る。1つ以上のプーリング層は、行列の領域を要約するフィルタを使用して、特徴量マップの次元を低減し得る。これは、出力の数をダウンサンプリング(down sample)し、したがって、ニューラルネットワークのために必要とされるパラメータおよび計算リソースを低減し得る。いくつかの実施形態では、1つ以上のプーリング層は、最大プーリング、最小プーリング、平均プーリング、グローバルプーリング、ノルムプーリング、またはそれらの組合せであり得る。最大プーリングは、行列の領域内の最大値のみを取ることによってデータの次元を低減し得、これは、有意な特徴量を捕捉するのに役立つ。いくつかの実施形態では、1つ以上のプール層は、1次元(1D)、2次元(2D)、3次元(3D)、またはそれらの任意の組み合わせであり得る。ニューラルネットワークはさらに、次の層に送られる入力を平坦化し得る、1つ以上の平坦化層を備え得る。いくつかの場合では、入力は、1次元アレイに縮小することによって平坦化され得る。平坦化された入力は、対象の分類(例えば、ポリヌクレオチドに添加されたヌクレオシドモノマーに対する電流/電圧の分類など)を出力するために使用され得る。ニューラルネットワークはさらに、1つ以上のドロップアウト層を備え得る。ドロップアウト層は、(たとえば、バイナリ分類またはマルチクラス分類を実行するために)ニューラルネットワークの訓練中に使用され得る。1つ以上のドロップアウト層は、いくつかの重みを0としてランダムに設定し得、これは、特徴量マップ中の対応する要素を0として設定することができ、したがって、ニューラルネットワークは、過剰適合を回避し得る。ニューラルネットワークはさらに、完全接続ネットワークを備える、1つ以上の高密度層を備え得る。密な層では、情報は、オブジェクトの予測された分類を生成するために全接続ネットワークを通過させられ得、誤差が計算され得る。いくつかの実施形態では、誤差は、予測を改善するために逆伝搬され得る。1つ以上の密な層は、数のベクトルを確率のベクトルに変換し得るSoftmax活性化関数を備え得る。これらの確率は、その後、ポリヌクレオチドに添加されたヌクレオシドモノマーに対する電流および/または電圧の分類などの分類に使用され得る。
【0052】
核酸ベースの情報記憶(Nucleic Acid Based Information Storage)
【0053】
本明細書では、核酸ベースの情報(データ)記憶のためのデバイス、組成物、システム、および方法が提供される。第1のステップでは、情報の項目(例えば、コンピュータによる処理のためのバイナリコード内のデジタル情報)をコード化するデジタル配列が受信される。暗号化スキームを適用して、デジタル配列を1つ以上の記号(例えば、バイナリーコード)から核酸配列に変換する。一例では、核酸伸長のための表面材料、核酸伸長のための遺伝子座の設計(別名、配置スポット)、および核酸合成のための試薬が選択される。構造の表面は、核酸合成のために調製される。次いで、De novoポリヌクレオチド合成を行う。別の例では、デジタル配列は、予め合成された核酸のセットによって表される。いくつかの例では、予め合成された核酸は互いに接続して、情報の項目を表すより大きな核酸を形成する。いくつかの例では、接続は、リガーゼまたは増幅(例えば、PCR)を用いて行われる。合成されたポリヌクレオチドは記憶され、全体的または部分的にその後の放出に利用可能である。いったん解放されると、ポリヌクレオチドは、全体的または部分的に、本明細書に記載される方法を使用して配列決定され、復号に供されて、核酸配列をデジタル配列に戻す。次いで、デジタル配列はアセンブルされ、元の情報の項目のアラインメントエンコーディング(alignment encoding)を得る。場合によっては、デジタル情報は、生物の天然に存在するゲノムから得られる遺伝子情報を含まない。
【0054】
デジタル情報をコード化する核酸は、エラー訂正コンポーネント(error correction component)を含み得る。いくつかの例では、誤り訂正コンポーネントは、リードソロモン(Reed-Solomon)(RS)コード、LDPCコード、ポーラーコード、ターボコードなどの誤り訂正コードを含む。いくつかの例では、エラー訂正コードは、多くのポリヌクレオチドにわたって記憶されるべきデジタルデータを拡散する。いくつかの例では、データを複数のポリヌクレオチドにわたって拡散させることは、消失(例えば、失われたオリゴ)を補正するために冗長性を構築する。いくつかの例では、デジタル情報は、エラーの存在下で回復することができる。いくつかの例では、エラー訂正コンポーネントはパリティベースを含む。いくつかの例では、エラー訂正コンポーネントはインデックス配列を含む。いくつかの例では、インデックス配列は、核酸中にコード化されるデジタル情報の位置またはアドレスを定義する。いくつかの例では、インデックス配列は、デジタル情報のソースを定義する。デジタル情報をコード化する核酸は、いくつかの例では、同じライブラリーまたはセット中の1つ以上の核酸との重複を含む。いくつかの例では、エラー訂正コンポーネントは重複または冗長領域(an overlap or redundancy region)を含む。いくつかの例では、アルゴリズムは、エラーを低減するために配列決定された核酸に適用される。いくつかの例では、エラー訂正アルゴリズムは、コンセンサス配列決定、HEDGES(Hash Encoded,Decoded by Greedy Exhaustive Search)、または他の方法を含む。
【0055】
デジタル情報をコード化する核酸は、異なる媒体中に記憶され得る。いくつかの例では、核酸は、本質的に乾燥粉末または凍結乾燥粉末として保存される。いくつかの例では、核酸は緩衝液中に保存される。いくつかの例では、核酸は、チップ、ウェハ、または他のシリコン固体支持体上に保存される。いくつかの例では、核酸は、プラスミドまたはゲノムなどの生物(または生物の集団)の内部に保存される。
【0056】
情報の項目
【0057】
任意選択で、本明細書で開示されるデータ記憶プロセスの初期工程は、初期コードの形態の情報の1つ以上の項目を取得または受信することを含む。情報の項目は、テキスト、音声、および視覚情報を含むが、これらに限定されない。情報の項目の例示的なソースは、書籍、定期記事、電子データベース、医療記録、文字、フォーム、音声記録、動物記録、生物学的プロファイル、放送、映画、ショートビデオ、電子メール、電話応対記録(bookkeeping phone logs)、インターネット活動ログ、図面、絵画、プリント、写真、ピクセル化されたグラフィックス、およびソフトウェアコードを含むが、これらに限定されない。情報の項目のための例示的な生物学的プロファイル源は、遺伝子ライブラリー、ゲノム、遺伝子発現データ、およびタンパク質活性データを含むが、これらに限定されない。情報の項目の例示的なフォーマットは、.txt、.PDF、.doc、.docx、.ppt、.pptx、.xls、.xlsx、.rtf、.jpg、.gif、.psd、.bmp、.tiff、.png、および.mpegを含むが、これらに限定されない。いくつかの例では、デジタル情報は、磁気媒体、フラッシュメモリ、クラウドストレージ、または保存された核酸から得られる。デジタル形式で情報の項目をコード化する個々のファイルサイズ、または情報の項目をコード化する複数のファイルの量は、最大1024バイト(1KBに等しい)、1024KB(1MBに等しい)、1024MB(1GBに等しい)、1024GB(1TBに等しい)、1024TB(1PBに等しい)、1エキサバイト、1ゼッタバイト、1ヨットバイト、1ゼノタバイト以上を含む。いくつかの例では、デジタル情報の量は、少なくとも1ギガバイト(GB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000、または1000ギガバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1テラバイト(TB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000または1000テラバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1ペタバイト(PB)である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000、または1000ペタバイト超である。いくつかの例では、デジタル情報の量は、少なくとも1、2、3、4、5、6、7、8、9、10、20、50、100、200、300、400、500、600、700、800、900、1000または1000ゼッタバイト超である。いくつかの例では、デジタル情報は、生物から取得されたゲノムデータを含まない。いくつかの例では、塩基あたり2ビット、塩基あたり3ビット(例えば、ハフマン)、カンマコード化(等温融解温度を有する6つのコドンのフレームを読み取ること)、交互コード、カンマフリーコード、完全遺伝コード(可変コドン長)、または他のコード化方法が使用される。いくつかの例では、デジタル情報は、鍵でさらに暗号化されるか、またはステガノグラフィを使用して不明瞭にされる。
【0058】
本明細書に記載されるデバイスおよび方法は、核酸に記憶されるデジタル情報の配列決定または「リード(reading)」率を増加させ得る。いくつかの例では、1Mbのデータは、15分、20分、25分、30分、35分、40分、または1時間以内で取得される。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが24時間以内に読み取られる。
いくつかの例では、1Gbのデータは、15分、20分、25分、30分、35分、40分、または1時間以内で取得される。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが、24時間以内に読み取られる。いくつかの例では、1~50、1~30、1~20、1~15、1~10、1~5、5~20、5~30、10~50、10~25、20~30、または20~50テラバイトのデータが24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立してリード可能な遺伝子座間の距離)を有するデバイス上で、24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30テラバイトのデータが、1000,900,800,700,600,500,400,300,200,100,75,50,25,20,15,または10nm以下のピッチ距離を有するデバイス上で、24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30ペタバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立してリード可能な遺伝子座間の距離)を有するデバイス上で、24時間以内に読み取られる。いくつかの例では、少なくとも1、2、3、4、5、7、10、12、15、20、25、または少なくとも30ゼータバイトのデータが、100,75,50,25,20,15,10,5,2または1ミクロン以下のピッチ距離(独立してリード可能な遺伝子座間の距離)を有するデバイス上で、24時間以内に読み取られる。
【0059】
本明細書に記載されるデバイスおよび方法は、核酸に格納されるデジタル情報の配列決定または「リード」忠実度を増加させ得る。いくつかの例では、デジタル情報は、10%、5%、4%、3%、2%、1.5%、1%、0.5%、0.2%、0.1%、0.01%、0.001%以下、または0.0001%以下のエラー率(塩基当たり)で回収される。いくつかの例では、デジタル情報は、0.0001~0.001%、0.0001~0.01%、0.001~1%、0.001~2%、0.1~2%、0.1~1%、0.1~5%、0.1~2%、または0.01~2%のエラー率(塩基当たり)で回収される。いくつかの例では、デジタル情報は、エラー訂正アルゴリズムによる処理の前に、10%、5%、4%、3%、2%、1.5%、1%、0.5%、0.2%、0.1%、0.01%、0.001%以下、または0.0001%以下のエラー率(塩基当たり)で回収される。
【0060】
ポリヌクレオチドは、デジタル情報をコード化する所定の配列の大きな領域に集合的に及ぶように設計され得る。いくつかの例では、より大きなポリヌクレオチドは、合成されたポリヌクレオチドを連結するためのライゲーション反応によって生成される。ライゲーション反応の一例は、ポリメラーゼ連鎖アセンブリ(PCA)である。いくつかの場合では、ポリヌクレオチドの少なくとも一部は、ユニバーサルプライマー結合の基質である付加領域を含むように設計される。PCA反応について、予め合成されたポリヌクレオチドは、互いの重複(例えば、重複配列を有する4、20、40またはそれ以上の塩基)を含む。ポリメラーゼサイクル中、ポリヌクレオチドは相補的断片にアニール( anneal)し、次いでポリメラーゼによって充填(filled)される。したがって、各サイクルは、どのポリヌクレオチドが互いに発見するかに応じて、様々な断片の長さをランダムに増加させる。断片間の相補性は、完全な大規模な二本鎖DNAの形成を可能にする。いくつかの場合では、PCA反応が完了した後、ミスマッチ修復検出酵素(mismatch repair detecting enzymes)を使用して、配列中のミスマッチを除去するように、エラー修正工程が行われる。標的配列のより大きな断片が生成されたら、それらを増幅することができる。例えば、いくつかの場合では、5’および3’末端アダプタ配列を含む標的配列は、アダプタ配列にハイブリダイズする修飾プライマーを含むポリメラーゼ連鎖反応(PCR)において増幅される。いくつかの場合では、修飾プライマーは、1つ以上のウラシル塩基を含む。修飾プライマーの使用は、修飾塩基、および/または断片から修飾塩基対を切断する酵素によって残されるギャップの標的化を中心とする、酵素反応によるプライマーの除去を可能にする。残留するのは、アダプタ配列の残留物を欠く二本鎖増幅産物である。このようにして、複数の増幅産物が、同じプライマーセットと並行して生成され得、二本鎖DNAの異なる断片を生成する。エラー訂正は、ポリヌクレオチドおよび/またはアセンブルされた産物に対して行われ得る。エラー修正のための例示的な戦略は、エラーを修正するための重複伸長PCRによる部位特異的突然変異導入(site-directed mutagenesis)を含み、これは、任意選択で、2回以上のクローニングおよび配列決定と合わせられる。特定の例において、ミスマッチ、バルジおよび小ループ、化学的に改変された塩基および/または他のヘテロ二重鎖を有する二本鎖核酸は、正確に合成された核酸の集団から選択的に除去される。いくつかの例では、エラー修正は、タンパク質/酵素を使用して行われ、該タンパク質/酵素は、二本鎖核酸内のミスマッチ塩基または不対塩基を認識し、それに結合するか、またはそれに隣接して、単鎖もしくは二本鎖切断を作製するか、または鎖移動転位事象(strand transfer transposition event)を開始する。エラー修正のためのタンパク質/酵素の非限定的な例としては、エンドヌクレアーゼ(T7エンドヌクレアーゼI、大腸菌エンドヌクレアーゼV、T4エンドヌクレアーゼVII、マングビーンヌクレアーゼ、細胞、大腸菌エンドヌクレアーゼIV、UVDE)、制限酵素、グリコシラーゼ、リボヌクレアーゼ、ミスマッチ修復酵素、リゾルバーゼ、ヘリカーゼ、リガーゼ、ミスマッチに特異的な抗体、およびそれらの変異体が挙げられる。
具体的なエラー訂正酵素の例としては、T4エンドヌクレアーゼ7、T7エンドヌクレアーゼ1、S1、マングビーンエンドヌクレアーゼ(mung bean endonuclease)、MutY,MutS,MutH,MutL,切断酵素、CELI、およびHINF1が挙げられる。いくつかの場合では、合成産物の集団から失敗産物を除去するために、DNAミスマッチ結合タンパク質MutS(Thermus aquaticus)が使用される。いくつかの例では、エラー訂正は、酵素コレクターゼを用いて行われる。いくつかの場合では、エラー訂正は、SURVEYORエンドヌクレアーゼ(Transgenomic)、ヘテロ二重鎖DNAについて既知および未知の突然変異および多型をスキャンするミスマッチ特異的DNAエンドヌクレアーゼを使用して行われる。
【0061】
デジタル情報は、複数のポリヌクレオチドに記憶され得る。いくつかの例では、複数のポリヌクレオチドは、約10,000、20,000、50,000、70,000、100,000、120,000、150,000、または200,000個の固有なポリヌクレオチドを含む。いくつかの例では、複数のポリヌクレオチドは、少なくとも約10,000,20,000、50,000、70,000、100,000、120,000、150,000、または200,000個の固有なポリヌクレオチドを含む。いくつかの例では、複数のポリヌクレオチドは、約10、50、100、200、300、500、700、1,000、5,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、または50,000塩基長である。いくつかの例では、複数のポリヌクレオチドは、少なくとも約10、50、100、200、300、500、700、1,000、5,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、または50,000塩基長である。いくつかの例では、複数のポリヌクレオチドは、最大で約10、50、100、200、300、500、700、1,000、5,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、または50,000塩基長である。
【0062】
ポリヌクレオチド配列決定のための構造
【0063】
本明細書では、ポリヌクレオチド配列決定のための剛性または可撓性構造が提供される。剛性構造の場合、本明細書では、ポリヌクレオチドのライブラリーを生成するための構造を有するデバイスが提供される。いくつかの例では、構造はプレートを含む。いくつかの場合では、構造は、ウェル(例えば、ナノウェル)を有するプレートを含む。いくつかの例では、構造は、複数の遺伝子座を含む表面を有する固体支持体を含む。いくつかの場合では、複数の遺伝子座は、構造上にレイアウトされたアレイに配置される。いくつかの場合では、固体支持体は、ガラスおよび/またはシリコンを含む。いくつかの場合では、付着部分は、遺伝子座の少なくともいくつかを覆っている。いくつかの例では、付着部分は、本明細書に記載される方法を使用して、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマー、およびそれらの任意の組み合わせの複合体に結合するように構成される。いくつかの例では、表面は再使用可能である。いくつかの場合では、表面は、再使用前に洗浄、処理、および/または調整される。いくつかの場合では、表面は、付着部分の除去および/または化学修飾を伴わずに再使用可能である。いくつかの例では、構造は、本明細書に記載の方法を用いて、ポリメラーゼによって付加された1つ以上の塩基の同一性を識別するように構成された検出器を備える。いくつかの場合では、検出器は、複数の光検出器を含む。いくつかの場合では、検出器は、複数のゼロモード導波路(zero-mode waveguides)を含む。いくつかの場合では、検出器は、光学検出器、電気検出器、またはそれらの組み合わせを含む。いくつかの例では、光学検出器は、様々な強度および/または波長を測定するように構成される。いくつかの例では、光学検出器は、可視光および/またはUV光を測定するように構成される。いくつかの例では、光学検出器は、蛍光を測定するように構成される。いくつかの例では、電気検出器は、電圧または電流の変化を測定するように構成される。いくつかの例では、構造はフローセルを含む。いくつかの場合では、液体はフローセル内に連続的に流される。いくつかの例では、フローセル内を流れる液体は、ヌクレオチドまたはヌクレオチドを含む分子(例えば、ポリヌクレオチドまたは核酸、例えば、DNA、RNA、ハイブリッド、類似体、およびそれらの模倣物)を含む。いくつかの例では、構造は、ポリヌクレオチド配列決定に加えて、ポリヌクレオチド合成のために使用され得る。
【0064】
図3A~3Cは、ポリヌクレオチド配列決定のための構造上に位置する遺伝子座の拡大図を示す。構造(3601)の一部における各場所は、実質的に平面のスポット(3603)(例えば、平坦)、チャネル(3605)、またはウェル(3607)であり得る。いくつかの例では、遺伝子座は、構造の各遺伝子座が約10umの幅および約21umの各構造の中心間の距離を有するようにアレイ状に配置される。いくつかの例では、構造の各遺伝子座は、約1umの幅および約2umの各構造の中心間の距離を有する。いくつかの例では、構造の各遺伝子座は、約0.1umの幅および約0.2umの各構造の中心間の距離を有する。遺伝子座は、円形、長方形、先細、または丸みを帯びた形状を含み得るが、これらに限定されない。いくつかの例では、構造は可撓性である。代替的に、または組み合わせて、構造は剛性である。いくつかの例では、剛性構造は、ポリヌクレオチド配列決定のための遺伝子座を含む。いくつかの例では、剛性構造は、ポリヌクレオチド配列決定のための実質的に平面の領域、チャネル、またはウェルを含む。
【0065】
本明細書に記載されるウェルは、任意のサイズまたは寸法を含み得る。いくつかの例では、本明細書に記載されるウェルは、1~0.01の幅対深さ(または高さ)の比を有し、この幅は、ウェルの最も狭いセグメントにおける幅の測定値である。いくつかの例では、本明細書に記載されるウェルは、0.5~0.01の幅対深さ(または高さ)の比を有し、この幅は、ウェルの最も狭いセグメントにおける幅の測定値である。いくつかの例では、本明細書に記載されるウェルは、約0.01、0.05、0.1、0.15、0.16、0.2、0.5、または1の幅対深さ(または高さ)の比を有する。本明細書では、ポリヌクレオチド配列決定のための複数の別個の遺伝子座を含むポリヌクレオチド配列決定のための構造が提供される。遺伝子座の例示的な構造としては、実質的に平面の領域、チャネル、ウェルまたは突出部が挙げられるが、これらに限定されない。本明細書に記載される構造は、複数のクラスターを含み得、各クラスターは、複数のウェル、遺伝子座またはチャネルを含む。あるいは、本明細書に記載されるのは、ウェル、遺伝子座またはチャネルの均質な配置を含み得る。本明細書において提供される構造は、約5um~約500um、約5um~約400um、約5um~約300um、約5um~約200um、約5um~約100um、約5um~約50um、または約10um~約50umの高さもしくは深さを有するウェルを含み得る。いくつかの例では、ウェルの高さは、100um未満、80um未満、60um未満、40um未満または20um未満である。いくつかの例では、ウェルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500um以上である。いくつかの例では、ウェルの高さまたは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、ウェルの高さまたは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。いくつかの例では、ウェルの高さまたは深さは、約50nm~約1umの範囲である。いくつかの例では、ウェルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500、700、800、900または約1000nmである。
【0066】
本明細書において提供されるポリヌクレオチド配列決定のための構造は、チャネルを含み得る。チャネルは、1~0.01の幅対深さ(または高さ)の比を有し得、この幅は、チャネルの最も狭いセグメントにおける幅の測定値である。いくつかの例では、本明細書に記載のチャネルは、0.5~0.01の幅対深さ(または高さ)の比を有し、この幅は、チャネルの最も狭いセグメントにおける幅の測定値である。いくつかの例では、本明細書に記載のチャネルは、約0.01、0.05、0.1、0.15、0.16、0.2、0.5、または1の幅対深さ(または高さ)の比を有する。
【0067】
本明細書には、複数の別個の遺伝子座を含むポリヌクレオチド配列決定のための構造が記載される。構造は、ポリヌクレオチド合成のための実質的に平面の領域、チャネル、突出部、またはウェルを含むが、これらに限定されない。いくつかの例では、本明細書に記載の構造が提供され、該構造は、複数のチャネルを含み、このチャネルの高さもしくは深さは、約5um~約500um、約5um~約400um、約5um~約300um、約5um~約200um、約5um~約100um、約5um~約50um、または約10um~約50umである。いくつかの場合では、チャネルの高さは、100um未満、80um未満、60um未満、40um未満、または20um未満である。いくつかの場合では、チャネルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500um以上である。いくつかの例では、チャネルの高さもしくは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、チャネルの高さもしくは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。
本明細書に記載されるチャネルは、クラスターで、または均質な場として表面上に配置され得る。
【0068】
本明細書に記載されるポリヌクレオチド配列決定のための構造の表面上の遺伝子座の幅は、約0.1um~約500um、約0.5um~約500um、約1um~約200um、約1um~約100um、約5um~約100um、または約0.1um~約100um、例えば、約90um、80um、70um、60um、50um、40um、30um、20um、10um、5um、1umまたは0.5umであり得る。いくつかの例では、遺伝子座の幅は、約100um、90um、80um、70um、60um、50um、40um、30um、20umまたは10um未満である。いくつかの例では、遺伝子座の幅は、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、遺伝子座の幅は、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。いくつかの例では、遺伝子座の幅は、約50nm~約1000nmの範囲である。いくつかの例では、2つの隣接する遺伝子座の中心間の距離は、約0.1um~約500um、0.5um~約500um、約1um~約200um、約1um~約100um、約5um~約200um、約5um~約100um、約5um~約50um、または約5um~約30um、例えば約20umである。いくつかの例では、遺伝子座の全幅は、約5um、10um、20um、30um、40um、50um、60um、70um、80um、90um、または100umである。いくつかの例では、遺伝子座の全幅は、約1um~100um、30um~100um、または50um~70umである。いくつかの例では、2つの隣接する遺伝子座の中心間の距離は、約0.5um~約2um、0.5um~約2um、約0.75um~約2um、約1um~約2um、約0.2um~約1um、約0.5um~約1.5um、約0.5um~約0.8um、または約0.5um~約1um、例えば、約1umである。いくつかの例では、遺伝子座の全幅は、約50nm、0.1um、0.2um、0.3um、0.4um、0.5um、0.6um、0.7um、0.8um、0.9um、1um、1.1um、1.2um、1.3um、1.4um、または1.5umである。いくつかの例では、遺伝子座の全幅は、約0.5um~2um、0.75um~1um、または0.9um~2umである。いくつかの例では、遺伝子座は実質的に平面である。
【0069】
本明細書には、複数の別個の遺伝子座を含む、ポリヌクレオチド配列決定のための構造が記載される。構造は、ポリヌクレオチド合成のための実質的に平面の領域、チャネル、突出部、またはウェルを含むが、これらに限定されない。いくつかの例では、本明細書に記載の構造が提供され、この構造は、複数のチャネルを含み、このチャネルの高さもしくは深さは、約5nm~約500nm、約5nm~約400nm、約5nm~約300nm、約5nm~約200nm、約5nm~約100nm、約5nm~約50nm、または約10nm~約50nmである。いくつかの場合では、チャネルの高さは、100nm未満、80nm未満、60nm未満、40nm未満または20nm未満である。いくつかの場合では、チャネルの高さは、約10、20、30、40、50、60、70、80、90、100、200、300、400、500nm以上である。いくつかの例では、チャネルの高さもしくは深さは、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、チャネルの高さもしくは深さは、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。本明細書に記載されるチャネルは、クラスターで、または均質な場として表面上に配置され得る。
【0070】
本明細書に記載されるポリヌクレオチド配列決定のための構造の表面上の遺伝子座の幅は、約0.1nm~約500nm、約0.5nm~約500nm、約1nm~約200nm、約1nm~約100nm、約5nm~約100nm、または約0.1nm~約100nm、例えば、約90nm、80nm、70nm、60nm、50nm、40nm、30nm、20nm、10nm、5nm、1nmまたは0.5nmであり得る。いくつかの例では、遺伝子座の幅は、約100nm、90nm、80nm、70nm、60nm、50nm、40nm、30nm、20nmまたは10nm未満である。いくつかの例では、遺伝子座の幅は、少なくとも10、25、50、75、100、200、300、400、500、600、700、800、900、1000nm、または1000nm超である。いくつかの例では、遺伝子座の幅は、約10nm~約1000nm、約25nm~約900nm、約50nm~約800nm、約75nm~約700nm、約100nm~約600nm、または約200nm~約500nmの範囲である。いくつかの例では、遺伝子座の幅は、約50nm~約1000nmの範囲である。いくつかの例では、2つの隣接する遺伝子座の中心間の距離は、約0.1nm~約500nm、0.5nm~約500nm、約1nm~約200nm、約1nm~約100nm、約5nm~約200nm、約5nm~約100nm、約5nm~約50nm、または約5nm~約30nm、例えば約20nmである。いくつかの例では、遺伝子座の全幅は、約5nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nmまたは100nmである。いくつかの例では、遺伝子座の総幅は、1nm~100nm、30nm~100nm、または50nm~70nm程度である。いくつかの例では、2つの隣接する遺伝子座の中心間の距離は、約0.5nm~約2nm、0.5nm~約2nm、約0.75nm~約2nm、約1nm~約2nm、約0.2nm~約1nm、約0.5nm~約1.5nm、約0.5nm~約0.8nm、または約0.5nm~約1nm、例えば約1nmである。いくつかの例では、遺伝子座の全幅は、約50nm、0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、1.1nm、1.2nm、1.3nm、1.4nm、または、1.5nmである。いくつかの例では、遺伝子座の総幅は、0.5nm~2nm、0.75nm~1nm、または0.9nm~2nm程度である。いくつかの例では、遺伝子座は実質的に平面である。
【0071】
いくつかの例では、各遺伝子座は、別の遺伝子座上で配列決定されるポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の配列決定を支持する。本明細書では、少なくとも10、100、256、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000以上のクラスターを含む表面が提供される。本明細書では、2,000、5,000、10,000、20,000、30,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、5,000,000超、または10,000,000以上の別個の遺伝子座を含む表面が提供される。いくつかの場合では、各クラスターは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、500またはそれ以上の遺伝子座を含む。いくつかの場合では、各クラスターは、50~500、50~200、50~150、または100~150の遺伝子座を含む。いくつかの場合では、各クラスターは100~150の遺伝子座を含む。いくつかの例では、各クラスターは109,121,130または137の遺伝子座を含む。
【0072】
本明細書では、最長セグメントにおいて、5~100umの幅を有する遺伝子座が提供される。いくつかの場合では、遺伝子座は、最長セグメントにおいて、約30、35、40、45、50、55または60umの幅を有する。いくつかの場合では、遺伝子座は、複数のセグメントを有するチャネルであり、各セグメントは、5~50umの中心間距離を有する。いくつかの場合では、各セグメントの中心間距離は、約5,10,15,20または25umである。
【0073】
本明細書では、最長セグメントにおいて、5~500nmの幅を有する遺伝子座が提供される。いくつかの場合では、遺伝子座は、最長セグメントにおいて、約30,35,40,45,50,55,60,80,または100nmの幅を有する。いくつかの場合では、遺伝子座は、複数のセグメントを有するチャネルであり、各セグメントは、5~50nmの中心間距離を有する。いくつかの場合では、各セグメントの中心間距離は、約5、10、15、20、25、50、100、または200nmである。
【0074】
いくつかの例では、本明細書に記載される構造の表面上で配列決定される別個のポリヌクレオチドの数は、基質中で利用可能な別個の遺伝子座の数に依存する。いくつかの例では、遺伝子座の密度は、少なくともまたは約1の遺伝子座/mm2、10遺伝子座/mm2、25の遺伝子座/mm2、50の遺伝子座/mm2、65の遺伝子座/mm2、75の遺伝子座/mm2、100の遺伝子座/mm2、130の遺伝子座/mm2、150の遺伝子座/mm2、175の遺伝子座/mm2、200の遺伝子座/mm2、300の遺伝子座/mm2、400の遺伝子座/mm2、500の遺伝子座/mm2、1,000の遺伝子座/mm2、104の遺伝子座/mm2、105の遺伝子座/mm2、106の遺伝子座/mm2、またはそれ以上である。いくつかの場合では、基質は、約10の遺伝子座/mm2~約500の遺伝子座/mm2、約25の遺伝子座/mm2~約400の遺伝子座/mm2、約50の遺伝子座/mm2~約500の遺伝子座/mm2、約100の遺伝子座/mm2~約500の遺伝子座/mm2、約150の遺伝子座/mm2~約500の遺伝子座/mm2、約10の遺伝子座/mm2~約250の遺伝子座/mm2の遺伝子座、約50の遺伝子座/mm2~約250の遺伝子座/mm2、約10の遺伝子座/mm2~約200の遺伝子座/mm2、または約50の遺伝子座/mm2~約200の遺伝子座/mm2を含む。いくつかの場合では、基質は、約104の遺伝子座/mm2~約105/mm2を含む。いくつかの場合では、基質は、約105の遺伝子座/mm2~約107の遺伝子座/mm2を含む。いくつかの場合では、基質は、少なくともまたは約105の遺伝子座/mm2を含む。いくつかの場合では、基質は、少なくともまたは約106の遺伝子座/mm2を含む。いくつかの場合では、基質は、少なくともまたは約107の遺伝子座/mm2を含む。いくつかの場合では、基質は、約104の遺伝子座/mm2~約105の遺伝子座/mm2を含む。いくつかの例では、遺伝子座の密度は、少なくともまたは約1の遺伝子座/um2、10の遺伝子座/um2、25の遺伝子座/um2、50の遺伝子座/um2、65の遺伝子座/um2、75の遺伝子座/um2、100の遺伝子座/um2、130の遺伝子座/um2、150の遺伝子座/um2、175の遺伝子座/um2、200の遺伝子座/um2、300の遺伝子座/um2、400の遺伝子座/um2、500の遺伝子座/um2、1,000の遺伝子座/um2以上である。いくつかの場合では、基質は、約10の遺伝子座/um2~約500の遺伝子座/um2、約25の遺伝子座/um2~約400の遺伝子座/um2、約50の遺伝子座/um2~約500の遺伝子座/um2、約100の遺伝子座/um2~約500の遺伝子座/um2、約150の遺伝子座/um2~約500の遺伝子座/um2、約10の遺伝子座/um2~約250の遺伝子座/um2、約50の遺伝子座/um2~約250の遺伝子座/um2、約10の遺伝子座/um2~約200の遺伝子座/um2、または約50の遺伝子座/um2~約200の遺伝子座/um2を含む。
【0075】
いくつかの例では、2つの隣接する遺伝子座の中心間の距離は、約10um~約500um、約10um~約200um、または約10um~約100umである。いくつかの場合では、隣接する遺伝子座の2つの中心間の距離は、約10um、20um、30um、40um、50um、60um、70um、80um、90umまたは100um超である。いくつかの場合では、2つの隣接する遺伝子座の中心間の距離は、約200um、150um、100um、80um、70um、60um、50um、40um、30um、20umまたは10um未満である。いくつかの場合では、2つの隣接する遺伝子座の中心間の距離は、約10000nm、8000nm、6000nm、4000nm、2000nm、1000nm、800nm、600nm、400nm、200nm、150nm、100nm、80um、70nm、60nm、50nm、40nm、30nm、20nmまたは10nm未満である。いくつかの例では、本明細書に記載の構造の各平方メートルは、少なくとも107、108、109、1010、1011の遺伝子座を可能にし、各遺伝子座は1つのポリヌクレオチドを支持する。いくつかの例では、109のポリヌクレオチドが、本明細書に記載される構造の約6,5,4,3,2または1m2未満で支持される。
【0076】
いくつかの例では、本明細書に記載される構造は、2,000、5,000、10,000、20,000、30,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000を超える、または10,000,000以上の非同一ポリヌクレオチドの配列決定の支持を提供する。いくつかの場合では、この構造は、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000を超える、または10,000,000以上の、異なる配列をコード化するポリヌクレオチドの配列決定のための支持を提供する。いくつかの例では、ポリヌクレオチドの少なくとも一部は、同一の配列を有する。いくつかの例では、構造は、少なくとも50、60、70、75、80、85、90、95、100、110、120、130、140、150、160、175、200、225、250、275、300、325、350、375、400、425、450、475、500塩基またはそれ以上を有するポリヌクレオチドの配列のための表面環境を提供する。いくつかの配置において、本明細書に記載されるポリヌクレオチド配列決定のための構造は、均一配置におけるポリヌクレオチド配列決定のための部位を含む。いくつかの例では、ポリヌクレオチド配列決定のための部位は、準均一配置(a quasi-uniform arrangement)にある。いくつかの例では、ポリヌクレオチド配列決定のための部位は、ポアソン分布に従ってローディングされる。いくつかの例では、ポリヌクレオチド配列決定のための部位は、正規分布に従ってローディングされる。
【0077】
いくつかの例では、ポリヌクレオチドは、構造の別個の遺伝子座上で配列決定され、各遺伝子座は、ポリヌクレオチドの集団の配列決定を支持する。いくつかの場合では、各遺伝子座は、別の遺伝子座上で配列決定されたポリヌクレオチドの集団とは異なる配列を有するポリヌクレオチドの集団の配列決定を支持する。いくつかの例では、構造の遺伝子座は、複数のクラスター内に位置する。いくつかの例では、構造は、少なくとも10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000個またはそれ以上のクラスターを含む。いくつかの例では、構造は、2,000、5,000、10,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,100,000、1,200,000、1,300,000、1,400,000、1,500,000、1,600,000、1,700,000、1,800,000、1,900,000、2,000,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000を超える、または10,000,000以上の別個の遺伝子座を含む。いくつかの場合では、各クラスターは、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150以上の遺伝子座を含む。いくつかの例では、各クラスターは、50~500、100~150、または100~200の遺伝子座を含む。いくつかの例では、各クラスターは、109、121、130または137遺伝子座を含む。いくつかの例では、各クラスターは5、6、7、8、9、10、11または12の遺伝子座を含む。いくつかの例では、1つのクラスター内の別個の遺伝子座に由来するポリヌクレオチドは、アセンブルされると、所定の配列の連続するより長いポリヌクレオチドをコード化する配列を有する。
【0078】
構造サイズ
【0079】
いくつかの例では、本明細書に記載される構造は、プレート(例えば、チップまたはウェハ)のおおよそのサイズ、例えば、約40~120mm×約25~100mmである。いくつかの例では、本明細書に記載の構造は、約1000mm、500mm、450mm、400mm、300mm、250nm、200mm、150mm、100mmまたは50mm以下の直径を有する。いくつかの例では、基板の直径は、約25mm~1000mm、約25mm~約800mm、約25mm~約600mm、約25mm~約500mm、約25mm~約400mm、約25mm~約300mm、または約25mm~約200mmである。基板サイズの非限定的な例には、約300mm、200mm、150mm、130mm、100mm、84mm、76mm、54mm、51mm、および25mmを含む。いくつかの例では、基板は、少なくとも100mm2、200mm2、500mm2、1,000mm2、2,000mm2、4,500mm2、5,000mm2、10,000mm2、12,000mm2、15,000mm2、20,000mm2、30,000mm2、40,000mm2、50,000mm2以上の平面表面積を有する。いくつかの例では、厚さは、約50mm~約2000mm、約50mm~約1000mm、約100mm~約1000mm、約200mm~約1000mm、または約250mm~約1000mmである。非限定的な例には、275mm、375mm、525mm、625mm、675mm、725mm、775mm、および925mmが含まれる。いくつかの例では、厚さは、少なくともまたは約0.5mm、1.0mm、1.5mm、2.0mm、2.5mm、3.0mm、3.5mm、4.0mm、または4.0mm超である。いくつかの場合では、厚さは直径によって変化し、基材の組成に依存する。例えば、シリコン以外の材料を含む構造は、同じ直径のシリコン構造とは異なる厚さを有し得る。構造の厚さは、使用される材料の機械的強度によって決定され得、構造は、取り扱い中に割れることなくそれ自体の重量を支持するのに十分な厚さでなければならない。いくつかの例では、構造は、任意の1次元において約1、2、3、4、5、10、15、30、40、50フィートを超える。いくつかの例では、構造は、ポリヌクレオチド合成デバイスのアレイを含む。いくつかの例では、構造はCMOSに統合される。
【0080】
材料
【0081】
本明細書では、表面を含むデバイスが提供され、ここで、該表面は、所定の位置でポリヌクレオチド配列決定を支持するように改質され、その結果、低いエラー率、低いドロップアウト率、高い収率、および高いオリゴ表現が得られる。いくつかの例では、本明細書に提供されるポリヌクレオチド配列決定のためのデバイスの表面は、de novoポリヌクレオチド配列決定反応を支持するための改質が可能な様々な材料から作製される。いくつかの場合では、デバイスは十分に導電性であり、例えば、デバイスのすべてまたは一部にわたって、均一な電場を形成することができる。明細書に記載されるデバイスは可撓性材料を含み得る。典型的な可撓性材料は、限定されないが、修飾ナイロン、非修飾ナイロン、ニトロセルロース、およびポリプロピレンなどを含む。本明細書に記載されるデバイスは剛性材料を含むこともある。典型的な剛性材料は、限定されないが、ガラス、石英ガラス(fuse silica)、シリコン、二酸化ケイ素、窒化ケイ素、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、およびそれらの混合物など)、ならびに金属(例えば、金、白金など)を含む。本明細書で開示されるデバイスは、シリコン、ポリスチレン、アガロース、デキストラン、セルロース系ポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、ガラス、またはそれらの任意の組み合わせを含む材料から作られることもある。場合によっては、本明細書で開示されるデバイスは、本明細書に列挙された材料または当該技術分野において知られている他の適切な材料の組み合わせで製造される
【0082】
本明細書で説明されるデバイスは、ある範囲の引張強度(tensile strength)を有する材料を含み得る。ある範囲の引張強度を有する例示的な材料は、ナイロン(70MPa)、ニトロセルロース(1.5MPa)、ポリプロピレン(40MPa)、シリコン(268MPa)、ポリスチレン(40MPa)、アガロース(1~10MPa)、ポリアクリルアミド(1~10MPa)、ポリジメチルシロキサン(PDMS)(3.9~10.8MPa)が含まれるが、これらに限定されない。本明細書に記載される固体支持体は、1~300、1~40、1~10、1~5、または3~11MPaの引張強度(tensile strength)を有することができる。本明細書に記載される固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、270、あるいはそれ以上のMPaの引っ張り強度を有することができる。いくつかの例では、本明細書に記載されるデバイスは、テープまたは可撓性シートなどの、連続ループまたはリールに保存することができる可撓性材料の形態である、ポリヌクレオチド配列決定のための固体支持体を含む。
【0083】
ヤング率は、ローディング下での弾性(復元可能)変形に対する材料の耐性を測定する。ヤング率剛性(Young’s modulus stiffness)の範囲を有する例示的な材料には、ナイロン(3GPa)、ニトロセルロース(1.5GPa)、ポリプロピレン(2GPa)、シリコン(150GPa)、ポリスチレン(3GPa)、アガロース(1~10GPa)、ポリアクリルアミド(1~10GPa)、ポリジメチルシロキサン(PDMS)(1~10GPa)含まれるが、これらに限定されない。本明細書に記載される固体支持体は、1~500、1~40、1~10、1~5、または3~11GPaのヤング率を有することができる。本明細書に記載される固体支持体は、約1、1.5、2、3、4、5、6、7、8、9、10、11、20、25、40、50、60、70、80、90、100、150、200、250、400、500GPa、またはそれ以上のヤング率を有することができる。軟性と剛性の関係は互いに逆であることから、可撓性材料は低ヤング率を有し、ローディング下でその形状を大きく変化させる。いくつかの例では、本明細書に記載の固体支持体は、少なくともナイロンの可撓性を有する表面を有する。
【0084】
いくつかの場合では、本明細書中に開示されるデバイスは、二酸化ケイ素ベースおよび酸化ケイ素の表面層を含む。あるいは、デバイスは、酸化ケイ素のベースを有することができる。本明細書に提供されるデバイスの表面は、テクスチャ加工され得、ポリヌクレオチド合成のための全表面積の増加をもたらす。本明細書に開示されるデバイスは、いくつかの場合では、少なくとも5%、10%、25%、50%、80%、90%、95%、または99%のシリコンを含む。本明細書に開示されるデバイスは、いくつかの例では、シリコンオンインシュレータ(silicon on insulator)(SOI)ウェハから製造される。
【0085】
構造は、本明細書に記載の本発明の方法および組成物に適した様々な材料から製造することができる。例えば、本発明を構成する基板/固体支持体が作製される材料は、低レベルのポリヌクレオチド結合を示す。いくつかの状況では、可視光および/またはUV光に対して透明な材料を使用することができる。十分に導電性のある材料、例えば、本明細書に記載される基板/固体支持体の全部または一部にわたって、一様な電場を形成することができる材料を利用することができる。いくつかの例では、そのような材料は、電気接地に接続され得る。いくつかの場合では、基材または固体支持体は、熱伝導性または断熱性があり得る。材料は、一連のポリヌクレオチド配列決定反応などの化学的または生化学的反応を支持するために耐化学性および耐熱性があり得る。可撓性材料について、関心のある材料は、ナイロン、改質および非改質の両方、ニトロセルロース、ポリプロピレンなどを含むことができる。
【0086】
剛性材料について、関心のある特定の材料は、ガラス、溶融シリカ(fuse silica)、シリコン、プラスチック(例えば、ポリテトラフルオロエチレン、ポリプロピレン、ポリスチレン、ポリカーボネート、およびそれらの混合物など)、金属(例えば、金、白金など)である。構造体は、シリコン、ポリスチレン、アガロース、デキストラン、セルロースポリマー、ポリアクリルアミド、ポリジメチルシロキサン(PDMS)、およびガラスからなる群から選択される材料から製造することができる。本明細書中の基質/固体支持体またはミクロ構造、リアクターは、本明細書中に列挙される物質の組み合わせ、または当該技術分野で既知の他の適切な物質により製造され得る。
【0087】
いくつかの例では、本明細書に開示される基板(substrate)は、コンピュータ可読材料(computer readable material)を含む。コンピュータ可読材料には、磁気媒体、リールツーリールテープ(reel-to-reel tape)、カートリッジテープ、カセットテープ、フレキシブルディスク、紙媒体、フィルム、マイクロフィーチ、連続テープ(例えば、ベルト)、および電子命令を記憶するのに適した任意の媒体が含まれるが、これらに限定されない。いくつかの場合では、基板は、磁気リールツーリールテープまたは磁気ベルトを含む。いくつかの例では、基板はフレキシブルプリント回路基板を含む。
【0088】
本明細書に記載の構造体は、可視光および/またはUV光に対して透明であり得る。いくつかの例では、本明細書に記載の構造体は、構造体の全部または一部にわたって一様な電場を形成するのに十分な導電性(conductive)を有する。いくつかの例では、本明細書に記載の構造体は、熱伝導性(heat conductive)を有するか、または絶縁されている。いくつかの例では、構造体は、ポリヌクレオチド配列決定反応(polynucleotide sequencing reaction)などの化学反応を支持するために耐化学性(chemical resistant)および耐熱性(heat resistant)を有する。いくつかの例では、基板は磁性を有する。いくつかの例では、構造体は、金属または金属合金を含む。
【0089】
ポリヌクレオチド配列決定のための構造体は、任意の次元で、1、2、5、10、30、50フィート以上、またはそれ以上の長さであり得る。可撓性構造の場合では、可撓性構造は、任意選択で、巻かれた状態で、例えばリール内に保管される。例えば長さが1フィートを超える大きな剛性構造体(rigid structure)の場合、剛性構造体は、垂直または水平に保管することができる。
【0090】
表面調製
【0091】
いくつかの例では、本明細書に開示される構造体の表面は、基質の表面および生体分子(例えば、ポリヌクレオチド、ポリメラーゼ、プライマ、またはそれらの任意の組み合わせの複合体)の両方に結合するように構成される、1つ以上の能動的に官能基化された表面を含むように変質され、それによって、表面へのカップリング反応を支持する。いくつかの例では、表面はまた、生体分子に効率的に結合しない受動材料で官能基化され、それによって、受動的官能基化剤(passive functionalization agent)が結合される部位での生体分子の付着を防止する。いくつかの場合では、表面は、生体分子支持のための別個の場所のみを画定する活性層を含む。
【0092】
いくつかの例では、表面を、任意の異なる比率の官能基の混合物と接触させる。いくつかの例では、混合物は、少なくとも2、3、4、5種類以上の異なる種類の官能基化剤(functionalization agents)を含む。いくつかの場合では、混合物中の少なくとも2種類の表面官能基化剤の比は、約1:1、1:2、1:5、1:10、2:10、3:10、4:10、5:10、6:10、7:10、8:10、9:10、または2つの基の所望の表面表現を達成するための任意の他の比である。いくつかの例では、他の適切な溶媒の所望の表面張力、湿潤性、水接触角、および/または接触角は、適切な比率の官能基化剤を基材表面に提供することによって達成される。いくつかの場合では、混合物中の作用物質は、適切な反応性および不活性部分から選択され、したがって、反応性基の表面密度を下流反応のために所望のレベルに希釈する。いくつかの例では、官能基化試薬の混合物は、生体分子に結合する1つ以上の試薬と、生体分子に結合しない1つ以上の試薬とを含む。したがって、試薬の調節は、異なる官能基化領域で生じる生体分子結合の量の制御を可能にする。いくつかの例では、生体分子結合の量は、構造体の結合能の約10%、20%、30%、40%、50%、60%、または70%であり得る。いくつかの例では、生体分子結合の量は、構造体の結合能の約10~60%、約10~50%、約20~50%、または約20~40%であり得る。
【0093】
いくつかの例では、基板官能基化のための方法は、基板の表面上へのシラン分子の堆積を含む。シラン分子は、基板の高エネルギー表面上に堆積され得る。いくつかの例では、高表面エネルギー領域は受動的官能基化試薬を含む。本明細書に記載される方法は、表面に結合するシラン基を提供するが、分子の残りの部分が表面から距離をとり、生体分子が結合する末端に遊離のヒドロキシル基を提供する。いくつかの例では、シランは、有機官能性アルコキシシラン分子である。有機官能性アルコキシシラン分子の非限定的な例には、ジメチルクロロ-オクトデシル-シラン、メチルジクロロ-オクトデシル-シラン、トリクロロ-オクトデシル-シラン、およびトリメチル-オクトデシル-シラン、トリエチル-オクトデシル-シランが含まれる。いくつかの例では、シランはアミノシランである。アミノシランの例には、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシランおよびN-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミドを含むが、これらに限定されない。いくつかの例では、シランは、11-アセトキシウンデシルトリエトキシシラン、n-デシルトリエトキシシラン、(3-アミノプロピル)トリメトキシシラン、(3-アミノプロピル)トリエトキシシラン、グリシジルオキシプロピル/トリメトキシシラン、N-(3-トリエトキシシリルプロピル)-4-ヒドロキシブチルアミド、またはそれらの任意の組み合わせを含む。いくつかの例では、活性官能基化性剤(active functionalization agent)は、11-アセトキシウンデシルトリエトキシシランを含む。いくつかの例では、活性官能基化性剤は、n-デシルトリエトキシシランを含む。いくつかの場合では、活性官能基化性剤は、グリシジルオキシプロピルトリエトキシシラン(GOPS)を含む。いくつかの例では、シランはフルオロシランである。いくつかの例では、シランは炭化水素シランである。いくつかの場合では、シランは3-ヨード-プロピルトリメトキシシランである。いくつかの場合では、シランはオクチルクロロシランである。
【0094】
いくつかの例では、シラン化は、有機官能性アルコキシシラン分子との自己組織化によって表面上で行われる。有機官能性アルコキシシランは、それらの有機機能によって分類される。シロキサン官能基化試薬の非限定的な例は、ヒドロキシアルキルシロキサン(シリル化表面、ジボランで官能基化し、過酸化水素によってアルコールを酸化する)、ジオール(ジヒドロキシアルキル)シロキサン(シリル化表面、およびジオールへの加水分解)、アミノアルキルシロキサン(アミンは中間官能基化工程を必要としない)、グリシドキシシラン(3-グリシドキシプロピル-ジメチル-エトキシシラン、グリシドキシ-トリメトキシシラン)、メルカプトシラン(3-メルカプトプロピル-トリメトキシシラン、3-4エポキシシクロヘキシル-エチルトリメトキシシラン、または3-メルカプトプロピル-メチル-ジメトキシシラン)、ビシクロヘプテニル-トリクロロシラン、ブチル-アルデヒド-トリメトキシシラン、または二量体第二級アミノアルキルシロキサンが含まれる。例示的なヒドロキシアルキルシロキサンは、3-ヒドロキシプロピルに変化するアリルトリクロロクロロシラン、または8-ヒドロキシオクチルに変化する、7-オクタ-1-エニルトリクロロクロロシランを含む。ジオール(ジヒドロキシアルキル)シロキサンは、グリシジルトリメトキシシラン由来の(2,3-ジヒドロキシプロピルオキシ)プロピル(GOPS)を含む。アミノアルキルシロキサンは、3-アミノプロピル (3-アミノプロピル-トリエトキシシラン、3-アミノプロピル-ジエトキシ-メチルシラン、3-アミノプロピル-ジメチル-エトキシシラン、または3-アミノプロピル-トリメトキシシラン)に変化する3-アミノプロピルトリメトキシシランを含む。いくつかの場合では、二量体第二級アミノアルキルシロキサンは、ビス(シリルオキシプロピル)アミンに変化するビス(3-トリメトキシシリルプロピル)アミンである。
【0095】
活性官能基化領域は、1つ以上の異なるシラン種、例えば、1、2、3、4、5、6、7、8、9、10またはそれ以上のシランを含み得る。いくつかの場合では、1つ以上のシランの1つは、別のシランよりも多い量で官能基化組成物中に存在する。例えば、2つのシランを有する混合シラン溶液は、99:1、98:2、97:3、96:4、95:5、94:6、93:7、92:8、91:9、90:10、89:11、88:12、87:13、86:14、85:15、84:16、83:17、82:18、81:19、80:20、75:25、70:30、65:35、60:40、55:45の比で、1つのシランと、もう一つのシランと含む。いくつかの例では、活性官能基化剤は、11-アセトキシウンデシルトリエトキシシランおよびn-デシルトリエトキシシランを含む。いくつかの例では、活性官能基化剤は、約20:80~約1:99、または約10:90~約2:98、または約5:95の比で、11-アセトキシウンデシルトリエトキシシランおよびn-デシルトリエトキシシランを含む。
【0096】
いくつかの例では、官能基化は、化学気相堆積(chemical vapor deposition)(CVD)、原子層堆積(atomic layer deposition)(ALD)、プラズマCVD(plasma enhanced CVD)(PECVD)、プラズマALD(plasma enhanced ALD )(PEALD)、有機金属CVD(metal organic CVD)(MOCVD)、熱線CVD(hot wire CVD)(HWCVD)、開始CVD(initiated CVD)(iCVD)、改質CVD(modified CVD)(MCVD)、蒸着軸方向堆積(vapor axial deposition)(VAD)、外部蒸着(outside vapor deposition)(OVD)、物理蒸着(physical vapor deposition)(例えば、スパッタ堆積(sputter deposition)、蒸着(evaporative deposition))、および分子層堆積(molecular layer deposition)(MLD)を含むが、これらに限定されない任意の堆積技術による、構造への官能基化剤の堆積を含む。
【0097】
以下の官能基化プロセスにおける任意の工程または成分は、最終的な官能基化基材(final functionalized substrate)の所望の特性に従って省略または変更することができる。いくつかの場合では、追加の構成要素および/またはプロセス工程が、本明細書で具現化されるプロセスワークフローに追加される。いくつかの例では、基板は、例えばピラニア溶液を使用して最初に洗浄される。洗浄プロセスの例は、基板をピラニア溶液(例えば、90%H2SO4、10%H2O2)に高温(例えば、120℃)で浸漬し、洗浄(例えば、水)し、基板(例えば、窒素ガス)を乾燥させることを含む。プロセスは、任意選択で、塩基性溶液(例えば、NH4OH)にピラニア処理された基材を浸漬し、続いて水性洗浄(例えば、水)することを含むピラニア処理後を含む。いくつかの例では、構造体の表面は、任意選択でピラニア浸漬および任意選択のピラニア後処理に続いて、プラズマ洗浄される。プラズマ洗浄プロセスの例は、酸素プラズマエッチングを含む。いくつかの例では、表面は、蒸発に続いて、活性官能基化剤で堆積される。いくつかの例では、基板は、洗浄の前に、例えばピラニア処理および/またはプラズマ洗浄によって能動的に官能基化される。
【0098】
表面官能基化のためのプロセスは、任意選択で、レジストコートおよびレジストストリップを含む。いくつかの例では、活性表面機能化に続いて、基板は、レジスト、例えば、SPR(商標)3612ポジ型フォトレジストでスピンコーティングされる。表面官能基化のためのプロセスは、様々な場合において、パターン化された官能基化を伴うリソグラフィを含む。いくつかの例では、フォトリソグラフィは、レジストコーティングの後に実行される。いくつかの例では、リソグラフィの後、表面はリソグラフィ欠陥について視覚的に検査される。表面官能基化のためのプロセスは、いくつかの例では、洗浄する工程を含み、基板の残渣は、例えば、プラズマ洗浄またはエッチングによって除去される。いくつかの例では、プラズマクリーニング工程は、リソグラフィ工程の後の何らかの工程で行われる。
【0099】
いくつかの例では、レジストでコーティングされた表面は、例えば、官能基化後および/またはリソグラフィ後に、レジストを除去するように処理される。いくつかの場合では、レジストは、溶媒を用いて、例えばN-メチル-2-ピロリドンを含むストリッピング溶液を用いて除去される。いくつかの例では、レジスト剥離は、超音波処理(sonicatio)または超音波処理(ultrasonication)を含む。いくつかの例では、レジストがコーティングされ、剥離され、その後、所望の異なる官能基化パターンを生成するために露光された領域の能動的官能基化が続く。
【0100】
いくつかの例では、本明細書に記載される方法および組成物は、選択的領域における改質された表面特性の生成のためのフォトレジストの塗布に関連し、ここで、フォトレジストの塗布は、フォトレジストの空間分布を規定する表面の流体特性に依存する。理論に束縛されるものではないが、塗布される流体に関連する表面張力効果は、フォトレジストの流れを定義し得る。例えば、表面張力および/または毛管作用効果(capillary action effects)は、レジスト溶媒が蒸発する前に、制御された様式でフォトレジストを小さな構造体に引き込むことを促進し得る。いくつかの例では、レジスト接触点は、鋭い縁部によってピン止めされ、それによって流体の前進を制御する。基礎構造(underlying structures)は、製造および機能化プロセス中にフォトレジストを塗布するために使用される所望のフローパターンに基づいて設計され得る。溶媒が蒸発した後に残る固形有機層(solid organic layer)を使用して、製造プロセスの後続の工程を追求することができる。構造体は、隣接する流体経路の中へのウィッキング効果を促進または阻害することによって、流体の流動を制御するように設計され得る。例えば、構造体は、上縁と下縁との間の重複を回避するように設計され、それが、レジストの特定の配置を可能にする上部構造内の流体の維持を促進する。代替的な例では、上縁および下縁は重複し、塗布された流体の下部構造へのウィッキングをもたらす。したがって、レジストの所望の用途に応じて、適切な設計を選択することができる。
【0101】
いくつかの例では、本明細書に記載の構造は、ヌクレオシドに結合することができる反応基を含む、少なくともまたは少なくとも0.1nm、0.5nm、1nm、2nm、5nm、10nmまたは25nmの厚さを有する材料を含む表面を有する。例には、ガラスおよびシリコン、例えば二酸化ケイ素および窒化ケイ素が含まれるが、これらに限定されない。いくつかの場合では、例示的な表面は、ナイロンおよびPMMAを含む。
【0102】
いくつかの例では、UV光の形態の電磁放射線が表面パターニングに使用される。いくつかの例では、ランプが表面パターニングのために使用され、マスクが表面へのUV光の露光位置を媒介する。いくつかの例では、レーザが表面パターニングのために使用され、シャッターの開/閉状態は、表面へのUV光の露出を制御する。レーザ装置は、移動可能な可撓性構造と組み合わせて使用され得る。そのような配置では、異なるヌクレオシドカップリング能力を有する1つ以上の薬剤のパターンを作成するために、レーザ曝露と柔軟な構造運動との協調が使用される。
【0103】
材料堆積システム
【0104】
いくつかの場合では、配列決定されたポリヌクレオチドは、基板、例えば固体支持体上に保存される。ポリヌクレオチドは、非連続的またはドロップオンデマンド法で基板表面上に堆積させることができる。いくつかの例では、ポリヌクレオチドは、配列決定のためにデバイスに移される。このような方法の例には、電気機械転写方式(electric thermal transfer method)、電気熱転写方式(electric thermal transfer method)、静電吸引力方式(electrostatic attraction method)が含まれる。電気機械転写方式では、電気パルスにより変形される圧電素子が、液滴を吐出させる。電気熱転写方式では、装置のチャンバー内に気泡が発生し、この気泡の膨張力が、液滴を吐出される。静電吸引力方式は、静電吸引力を使用して、液滴を基板上に吐出する。いくつかの場合では、ドロップ周波数は、約5KHz~約500KHz、約5KHz~約100KHz、約10KHz~約500KHz、約10KHz~約100KHz、または約50KHz~約500KHzである。いくつかの場合では、周波数は、約500KHz、200KHz、100KHz、または50KHz未満である。
【0105】
分注される液滴のサイズは、デバイスの分解能と相関する。いくつかの例では、デバイスは、約0.01pl~約20pl、約0.01pl~約10pl、約0.01pl~約1pl、約0.01pl~約0.5pl、約0.01pl~約0.01pl、または約0.05pl~約1plのサイズの試薬の液滴を堆積させる。いくつかの例では、液滴サイズは、約1pl、0.5pl、0.2pl、0.1pl、または0.05pl未満である。
【0106】
いくつかの構成では、ポリヌクレオチド配列決定システムの構成は、リールツーリールタイプのプロセスにおける移動のための基板の柔軟性を利用する連続的なポリヌクレオチド配列決定プロセスを可能にする。この配列決定プロセスは、連続生産ライン様式で動作し、基板は、基板の位置を回転させるための1つ以上のリールを使用するポリヌクレオチド配列決定の種々の段階を通って移動する。例示的な例では、ポリヌクレオチド配列決定における反応は、溶媒浴を(solvent bath)通して、ホスホラミダイト堆積のための堆積デバイスの下に、酸化剤の浴(bath of oxidizing agent)を通して、アセトニトリル洗浄浴(acetonitrile wash bath)を通して、およびデブロック浴(deblock bath)を通して、基質をローリングすることを含む。任意選択で、テープはまた、キャッピング浴(capping bath)に通される。リールツーリール型プロセスは、配列決定されたポリヌクレオチドを含む基板の完成品を巻き取りリール上に容易に集めることを可能にし、さらなる処理または貯蔵のために輸送することができる。
【0107】
本明細書には、ポリヌクレオチド配列決定のための試薬がリサイクルされるかまたは再使用されるデバイス、方法、システムおよび組成物が記載される。試薬のリサイクルは、未使用の試薬の収集、貯蔵、および使用、または使用された試薬の精製/形質転換を含み得る。例えば、試薬浴は、リサイクルされ、同じまたは異なる表面上のポリヌクレオチド配列決定ステップのために使用される。本明細書に記載される試薬は、1、2、3、4、5、6、7、8、9、10回またはそれ以上リサイクルされ得る。代替的に、または組み合わせにより、反応副生成物を含む試薬溶液を濾過して副生成物を除去し、試薬溶液をさらなるポリヌクレオチド配列決定反応のために使用する。
【0108】
多くの統合要素または非統合要素が、しばしばポリヌクレオチド配列決定システムと共に使用される。いくつかの例では、ポリヌクレオチド配列決定システムは、合成されたポリヌクレオチドが配列決定される前に、合成されたポリヌクレオチドの処理に有用な1つ以上の要素を含む。例として、システムは、熱循環装置などの温度制御要素を含む。いくつかの例では、温度制御要素は、ポリヌクレオチド配列決定に先立って、PCAなどの核酸アセンブリおよび/またはPCRなどの核酸増幅を行うために、複数の分解された反応器とともに使用される。
【0109】
デノボポリヌクレオチド合成(De Novo Polynucleotide Synthesis)
【0110】
本明細書では、短時間で基板上に高密度のポリヌクレオチドを合成するためのシステムおよび方法が提供される。いくつかの例では、基板は可撓性基板である。いくつかの例では、少なくとも1010、1011、1012、1013、1014、または1015の塩基が1日に合成される。いくつかの例では、少なくとも10×108、10×109、10×1010、10×1011、または10×1012のポリヌクレオチドが1日に合成される。いくつかの場合では、合成された各ポリヌクレオチドは、少なくとも20、50、100、200、300、400または500の核酸塩基を含む。いくつかの場合では、これらの塩基は、合計平均エラー率が100、200、300、400、500、1000、2000、5000、10000、15000、20000の塩基中約1未満で、合成される。いくつかの例では、これらのエラー率は、合成されたポリヌクレオチドの少なくとも50%、60%、70%、80%、90%、95%、98%、99%、99.5%、またはそれ以上である。いくつかの例では、合成されたポリヌクレオチドのこれらの少なくとも90%、95%、98%、99%、99.5%、またはそれ以上は、それらがコード化する所定の配列と異ならない。いくつかの例では、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、200中約1未満である。いくつかの例では、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、1,000中約1未満である。いくつかの例では、本明細書に記載の方法およびシステムを用いて基板上に合成されたポリヌクレオチドのエラー率は、2,000中約1未満である。いくつかの例では、本明細書に記載される方法およびシステムを使用して基板上で合成されたポリヌクレオチドのエラー率は、3,000中約1未満である。いくつかの例では、本明細書に記載の方法およびシステムを用いて基板上に合成されたポリヌクレオチドのエラー率は、5,000中約1未満である。エラー率の個々のタイプには、基板上で合成されたポリヌクレオチドに対するミスマッチ、欠失、挿入、および/または置換が含まれる。「エラー率(error rate)」という用語は、合成されたポリヌクレオチドの総量(collective amount)と所定のポリヌクレオチド配列の凝集体(aggregate)との比較を指す。いくつかの例では、本明細書に開示される合成されたポリヌクレオチドは、12~25塩基のテザーを含む。いくつかの例では、テザーは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれ以上の塩基を含む。
【0111】
本明細書には、ポリヌクレオチド合成に用いられる化学反応を、電気化学を用いて制御する方法、システム、装置、および組成物が記載されている。電気化学反応は、いくつかの例では、光、熱、放射、または電気など、任意のエネルギー源によって制御される。例えば、電極は、表面上の離散的遺伝子座のすべてまたは一部として化学反応を制御するために使用される。いくつかの例では、電極は、電極に電位を印加してポリヌクレオチド合成における1つ以上の化学的工程を制御することによって、荷電される。いくつかの例では、これらの電極はアドレス指定可能である。本明細書に記載される任意の数の化学的ステップは、いくつかの例では、1つ以上の電極を用いて制御される。電気化学反応は、酸化、還元、酸/塩基化学、または電極によって制御される他の反応を含み得る。いくつかの例では、電極は、化学変換のための試薬として使用される電子またはプロトンを生成する。いくつかの例における電極は、酸などの試薬を直接生成する。いくつかの例では、酸はプロトンである。いくつかの例では、電極は、塩基などの試薬を直接生成する。酸または塩基は、保護基を切断するため、または例えば反応溶液のpHを調節することによって、様々なポリヌクレオチド合成反応の動力学に影響をおよぼすために使用されることが多い。いくつかの例では、電気化学的に制御されたポリヌクレオチド合成反応は、酸化還元活性金属または他の酸化還元活性有機材料を含む。いくつかの例では、金属または有機触媒が、これらの電気化学反応とともに使用される。いくつかの例では、酸はキノンの酸化から生成される。
【0112】
化学反応の制御は、試薬の電気化学的生成に限定されず、化学反応性は、電極によって生成される電場(または勾配)を通した基質または試薬への生物物理学的変化を通して間接的に影響され得る。いくつかの例では、基質は、核酸を含むが、これに限定されない。いくつかの例では、電極または表面に向かって、または電極または表面から離れて、特定の試薬または基質を反発(repel)または誘引する(attract)電場が生成される。このような場は、いくつかの例では、電位を1つ以上の電極に印加することによって生成される。例えば、負に荷電した核酸は、負に荷電した電極表面からはじかれる。局所電場によって引き起こされるポリヌクレオチドまたは他の試薬のこのような反発または誘引力は、いくつかの例では、合成デバイスまたは構造体の領域内、または領域外へのポリヌクレオチドまたは他の試薬の移動を提供する。いくつかの例では、電極は、合成表面、構造、またはデバイスからポリヌクレオチドをはじく電場を生成する。場合によっては、電極は、合成表面、構造体、またはデバイスに向かってポリヌクレオチドを誘引する電場を生成する。いくつかの例では、陽子は正に帯電した表面からはじかれて、陽子と基板またはその部分との接触を制限する。いくつかの例では、斥力(repulsion force)または引力(attractive force)が、合成表面の特定の領域への試薬または基質の進入を可能にするか、または阻止するために使用される。いくつかの例では、ヌクレオシドモノマーは、一方または両方の構成要素の近傍に電場を印加することによって、ポリヌクレオチドと接触することを妨げられる。このような配置は、特定の試薬のゲーティングを可能にし、これは、試薬および/または基質間の接触の濃度または速度が制御されるとき、保護基の必要性をなくし得る。いくつかの例では、保護されていないヌクレオシドモノマーがポリヌクレオチド合成に使用される。あるいは、一方または両方の成分の近傍における電場の印加は、ヌクレオシドモノマーとポリヌクレオチドとの接触を促進する。加えて、基板への電場の印加は、基板の反応性または立体構造を変化させることができる。例示的な用途において、電極によって生成される電場は、隣接する遺伝子座におけるポリヌクレオチドが相互作用するのを防ぐために使用される。いくつかの例では、基質は、任意選択で表面に結合したポリヌクレオチドである。いくつかの例では、電場の印加は、ポリヌクレオチドの三次元構造を変化させる。そのような変化は、ヘリックス、ヘアピン、ループ、または他の三次元核酸構造など、様々な構造の折り畳み(folding)または展開(unfolding)を含む。このような変化は、ウェル、チャネル、または他の構造の内側の核酸を操作するために有用である。いくつかの例では、二次構造を防止するために、電場が核酸基質に印加される。いくつかの例では、電場は、ポリヌクレオチド合成中にリンカーまたは固体支持体への付着の必要性をなくす。
【0113】
本開示の基板上でのポリヌクレオチド合成に適切な方法は、ホスホラミダイト構築ブロックと基質に結合したヌクレオシドとの間に、ホスファイトトリエステル結合を形成するカップリング工程において、成長中のポリヌクレオチドへのホスホラミダイト構築ブロック、例えばヌクレオシドホスホラミダイトの制御された付加を含むホスホラミダイト法である。いくつかの例では、ヌクレオシドホスホラミダイトは、活性化された基質に提供される。いくつかの例では、ヌクレオシドホスホラミダイトは、活性化剤とともに基板に提供される。いくつかの例において、ヌクレオシドホスホラミダイトは、基質結合ヌクレオシドに対して1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍またはそれ以上の過剰量で基質に供給される。いくつかの例では、ヌクレオシドホスホラミダイトの追加は、無水環境において、例えば、無水アセトニトリルにおいて実行される。カップリング工程におけるヌクレオシドホスホラミダイトの付加および連結に続き、基板は任意選択で洗浄される。いくつかの例では、結合工程は、随意に、基質へのヌクレオシドホスホラミダイトの追加の間の洗浄する工程とともに、1回以上追加して繰り返される。いくつかの例では、本明細書で使用されるポリヌクレオチド合成方法は、1、2、3、またはそれ以上の順次的な結合工程を含む。カップリングの前に、多くの場合、基質に結合したヌクレオシドは、保護基の除去によって脱保護され、保護基は重合を防止する働きをする。保護基は、ポリヌクレオチドの伸長を防止する任意の化学基を含み得る。いくつかの例では、保護基は、酸の存在下で切断(または除去)される。いくつかの例では、保護基は、塩基の存在下で切断される。いくつかの例では、保護基は、光、熱、または他のエネルギー源などの電磁放射線で除去される。いくつかの例では、保護基は、酸化または還元反応によって除去される。いくつかの例では、保護基はトリアリールメチル基を含む。いくつかの例では、保護基はアリールエーテルを含む。いくつかの例では、保護は、ジスルフィドを含む。いくつかの例では、保護基は酸不安定性シランを含む。いくつかの例では、保護基はアセタールを含む。いくつかの例では、保護基はケタールを含む。いくつかの例では、保護基はエノールエーテルを含む。いくつかの例では、保護基は、メトキシベンジル基を含む。いくつかの例では、保護基はアジドを含む。いくつかの例では、保護基は4,4’-ジメトキシトリチル(DMT)である。いくつかの例では、保護基はtert-ブチルカルボネートである。いくつかの例では、保護基はtert-ブチルエステルである。いくつかの例では、保護基は塩基不安定基を含む。いくつかの例では、酵素的方法を使用して、ポリヌクレオチドを生成する。いくつかの例では、酵素的方法は、ポリメラーゼの使用を含む。いくつかの例では、酵素的方法は、保護されたヌクレオチドの使用を含む。いくつかの例では、酵素的方法は、末端デオキシトランスフェラーゼまたはその変異体の使用を含む。
【0114】
結合の後、ホスホラミダイトポリヌクレオチド合成方法は、任意選択で、キャッピング工程を含む。キャッピング工程では、成長しているポリヌクレオチドは、キャッピング剤で処理される。キャッピング工程は一般に、カップリング後に、未反応の基質結合5’-OH基のさらなる鎖伸長(chain elongation)をブロックするように機能し、このことが、内部塩基欠失を有するポリヌクレオチドの形成を防ぐ役割を果たす。さらに、1H-テトラゾールで活性化されたホスホラミダイトは、しばしば、グアノシンのO6位とわずかに反応する。理論に束縛されるものではないが、I2/水で酸化すると、この副生成物は、おそらくO6-N7移動を介して、脱プリン化を受ける。アプリン部位は、ポリヌクレオチドの最終脱保護の過程で最終的に切断され、したがって全長生成物の収率を低下させる可能性がある。O6修飾は、I2/水での酸化前にキャッピング試薬による処理によって除去され得る。いくつかの例では、ポリヌクレオチド合成の間にキャッピング工程を含めることで、キャッピングのない合成と比較して、エラー率は低下する。一例として、キャッピング工程は、無水酢酸と1-メチルイミダゾールとの混合物で、基質に結合したポリヌクレオチドを処理することを含む。キャッピングステップに続き、基板は任意選択で洗浄される。
【0115】
ヌクレオシドホスホラミダイトの添加後、任意選択でキャッピング工程および1つ以上の洗浄する工程後、本明細書に記載される基質は、酸化され得る結合した成長核酸を含む。酸化工程は、亜リン酸トリエステルを、天然に存在するリン酸ジエステルヌクレオシド間結合の保護された前駆体である四配位リン酸トリエステルに酸化することを含む。いくつかの例では、亜リン酸トリエステルは電気化学的に酸化される。いくつかの例では、成長ポリヌクレオチドの酸化は、任意選択でピリジン、ルチジン、またはコリジンなどの弱塩基の存在下で、ヨウ素および水による処理によって達成される。酸化は、tert-ブチルヒドロペルオキシドまたは(1S)-(+)-(10-カンファースルホニル)-オキサジリジン(CSO)を用いて、無水条件下で行われることもある。いくつかの方法では、キャッピング工程は、酸化に続いて実行される。持続する可能性のある酸化からの残留水がその後の結合を阻害することができるため、第2のキャッピング工程は基質の乾燥を可能にする。酸化後に、基質と成長しているポリヌクレオチドは、随意に洗浄される。いくつかの例では、酸化の工程は、ポリヌクレオチドホスホロチオエートを得るために硫化工程に置き換えられ、ここで、いかなるキャッピング工程も硫化後に実行することができる。Beaucage試薬としても知られる3-(ジメチルアミノメチリデン)アミノ)-3H-1,2,4-ジチアゾール-3-チオン、DDTT、3H-1,2-ベンゾジチオール-3-オン 1,1-ジオキシド、およびN,N,N’N’-テトラエチルチウラムジスルフィド(TETD)を含むがこれらに限定されない、多くの試薬が効率的な硫黄輸送が可能である。
【0116】
カップリングによるヌクレオシドの取り込みのその後のサイクルのために、基質結合成長ポリヌクレオチドの保護された5’末端(または合成が5’から3’方向に行われる場合、3’末端)を除去して、第一級ヒドロキシル基(primary hydroxyl group)が次のヌクレオシドホスホロアミダイトと反応できるようにする。いくつかの例では、保護基はDMTであり、非ブロック化が、ジクロロメタン中でトリクロロ酢酸とともに生じる。いくつかの例では、保護基はDMTであり、脱ブロッキングは電気化学的に生成されたプロトンで起こる。長時間にわたる、または推奨された酸の溶液よりも強力な脱トリチル化を行うことで、固体支持体に結合したポリヌクレオチドの脱プリン化を増大させ、ゆえに、望ましい完全長の産物の収率を低下させることがある。本明細書に記載される本の方法および組成物は、望ましくない脱プリン化反応を制限する制御された非ブロック化条件を提供する。いくつかの例では、基質に結合したポリヌクレオチドは、非ブロック化後に洗浄される。いくつかの場合では、非ブロック化後の効率的な洗浄は、低いエラー率を有する合成されたポリヌクレオチドに寄与する。
【0117】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下の工程、 表面、リンカー、または事前に脱保護されたモノマーのいずれかと連結するために、基質フィーチャ(substrate feature)の表面に保護モノマーを塗布する工程、その後に塗布される保護モノマーと反応し得るように、塗布されたモノマーを脱保護する工程、および連結のために別の保護モノマーを塗布する工程の反復シーケンスを含み得る。1つ以上の中間工程は、酸化および/または硫化を含む。いくつかの例では、1つ以上の洗浄する工程は、工程の1つまたはすべてに先行するかあるいはその後に続く。
【0118】
本明細書に記載される基質上でのポリヌクレオチドの合成のための方法は、酸化工程を含み得る。例えば、方法は、以下の工程、 表面、リンカー、または事前に脱保護されたモノマーのいずれかと連結するために、基質フィーチャの表面に保護モノマーを塗布する工程、その後に塗布される保護モノマーと反応し得るように、塗布されたモノマーを脱保護する工程、および連結のために別の保護モノマーを塗布する工程、ならびに酸化および/または硫化工程の反復シーケンスを含む。いくつかの例では、1つ以上の洗浄する工程は、工程の1つまたはすべてに先行するかあるいはその後に続く。
【0119】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下の工程、 表面、リンカー、または事前に脱保護されたモノマーのいずれかと連結するために、基質フィーチャの表面に保護モノマーを塗布する工程、その後に塗布される保護モノマーと反応し得るように、塗布されたモノマーを脱保護する工程、ならびに酸化および/または硫化工程の反復シーケンスをさらに含み得る。いくつかの例では、1つ以上の洗浄する工程は、工程の1つまたはすべてに先行するかあるいはその後に続く。
【0120】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下の工程、表面、リンカー、または事前に脱保護されたモノマーのいずれかと連結するために、基質フィーチャの表面に保護モノマーを塗布する工程、ならびに酸化および/または硫化工程の反復シーケンスをさらに含み得る。いくつかの例では、1つ以上の洗浄する工程は、工程の1つまたはすべてに先行するかあるいはその後に続く。
【0121】
本明細書に記載の基質上でのポリヌクレオチドの合成方法は、以下の工程、 表面、リンカー、または事前に脱保護されたモノマーのいずれかと連結するために、基質フィーチャの表面に保護モノマーを塗布する工程、その後に塗布される保護モノマーと反応し得るように、塗布されたモノマーを脱保護する工程、ならびに酸化および/または硫化工程の反復シーケンスをさらに含み得る。いくつかの例では、1つ以上の洗浄する工程は、工程の1つまたはすべてに先行するかあるいはその後に続く。
【0122】
いくつかの例では、ポリヌクレオチドは、光不安定性保護基(photolabile protecting groups)を用いて合成され、表面上に生成されたヒドロキシル基は、光不安定性保護基によってブロックされる。フォトリソグラフィマスクを通するなどして、表面がUV光に曝露されると、表面上の遊離ヒドロキシル基のパターンが生成され得る。これらのヒドロキシル基は、ホスホラミダイト化学にしたがって、光保護されたヌクレオシドホスホラミダイトと反応し得る。第2のフォトリソグラフィマスクを適用することができ、表面をUV光に曝露してヒドロキシル基の第2のパターンを生成し、続いて5’-光保護ヌクレオシドホスホロアミダイトとカップリングさせることができる。同様に、パターンを生成することができ、オリゴマー鎖を伸長することができる。理論に拘束されるものではないが、光切断可能な基の不安定性は、使用される溶媒の波長および極性に依存し、光切断の速度は、曝露の持続時間および光の強度によって影響され得る。この方法は、マスクの位置合わせの精度、光保護基の除去効率、およびホスホラミダイトカップリング工程の収率など、多くの要素を活用することができる。さらに、隣接する部位への意図しない光の漏れを最小限に抑えることができる。スポットあたりの合成されたオリゴマーの密度は、合成の表面上のリーダーヌクレオシドのローディングを調節することによってモニタリングすることができる。
【0123】
ポリヌクレオチド合成のための支持体を提供する本明細書に記載される基板の表面は、合成されたポリヌクレオチドが表面から切断されることを可能にするように化学的に修飾され得る。いくつかの例では、ポリヌクレオチドは、ポリヌクレオチドが脱保護されるのと同時に切断される。いくつかの場合では、ポリヌクレオチドは、ポリヌクレオチドが脱保護された後に切断される。例示的なスキームでは、(CH3CH2O)3Si-(CH2)2-NH2などのトリアルコキシシリルアミンを基質の表面SiOH基と反応させ、続いて無水コハク酸とアミンと反応させてアミド結合および遊離OHを生成し、その上で核酸鎖の成長が支持される。開裂は、アンモニアまたはメチルアミンによるガス開裂を含む。いくつかの例では、切断は、酸または塩基などの電気的に生成された試薬を用いたリンカー切断を含む。いくつかの例では、いったん表面から放出されると、ポリヌクレオチドは、保存された情報を抽出するために配列決定および復号されるより大きな核酸に組み立てられる。
【0124】
本明細書に記載される表面は、ポリヌクレオチド合成のさらなるサイクルを支持するために、ポリヌクレオチド切断後に再使用され得る。例えば、リンカーは、さらなる処理/化学的修飾なしに再使用することができる。いくつかの例では、リンカーは、基質表面またはポリヌクレオチドに非共有結合される。いくつかの実施形態では、リンカーは、表面からの切断後にポリヌクレオチドに付着したままである。いくつかの実施形態では、リンカーは、エステル、アミド、ケタール、ベータ置換ケトン、複素環、または可逆的に切断され得る他の基などの可逆的な共有結合を含む。このような可逆的切断反応は、いくつかの例では、試薬の添加もしくは除去によって、または電極によって制御される電気化学的プロセスによって制御される。任意選択で、化学リンカーまたは表面結合化学基は、反応性を回復し、このようなリンカーまたは表面結合化学基上の望ましくない副産物形成を除去するために、いくつかのサイクル後に再生される。
【0125】
コンピュータシステム
【0126】
様々な態様では、本明細書に記載のシステムのいずれかは、コンピュータに動作可能に連結され、任意選択で、ローカルまたはリモートのいずれかでコンピュータを介して自動化される。様々な場合であって、本発明の方法およびシステムは、コンピュータシステム上のソフトウェアプログラムおよびその使用をさらに含む。したがって、材料堆積デバイスの移動、分注動作(dispense action)、および真空作動(vacuum actuation)を編成し(orchestrating)、同期させる(synchronizing)などの、分注/真空/補充機能の同期のためのコンピュータ制御は、本発明の範囲内である。いくつかの例では、コンピュータシステムは、ユーザ指定の塩基配列と材料堆積デバイスの位置との間でインターフェース接続し、基板の指定領域に正しい試薬を送達するようにプログラムされる。例として、
図6または
図7に示されるシステムなどのコンピュータシステムは、記号のセットとして表されるデータを記号の別のセットにコード化するために使用され得る。例えば、データは、「0」および「1」のバイナリ値などの数値記号として表され得、コンピュータシステムは、コンピュータプログラムを実行して、データを複数の核酸配列に変換するか、複数の核酸配列をデータに変換するか、または両方を行い得る。いくつかの例では、コンピュータプログラムは機械学習アルゴリズムであり得る。いくつかの例では、機械学習アルゴリズムは、電流または電圧などの電気信号に基づいてヌクレオチド塩基を決定し得る。
【0127】
図6に示されるコンピュータシステム(3700)は、媒体(3711)および/またはネットワークポート(3705)から命令を読み取ることができる論理装置(logical apparatus)として理解され得、任意選択で、固定媒体(3712)を有するサーバ(3709)に接続することができる。システムは、CPU(3701)と、ディスクドライブ(3703)と、キーボード(3715)および/またはマウス(3716)などの任意選択の入力デバイスと、任意選択で、モニタ(3707)とを備え得る。データ通信は指示された通信媒体を介して局所位置または遠隔位置のサーバーまで達成され得る。通信媒体は、データを送信および/または受信する任意の手段を含むことができる。例えば、通信媒体は、ネットワーク接続、無線接続、またはインターネット接続であり得る。そのような接続は、ワールドワイドウェブ上での通信を提供することができる。本開示に関連するデータが、当事者(3722)による受信および/またはレビューのために、そのようなネットワークまたは接続を介して送信され得ることが想定される。。
【0128】
図7は、本発明の例示的な例に関連して使用することができるコンピュータシステムの第1の例示的なアーキテクチャを示すブロック図である。
図5に示すように、例示的なコンピュータシステムは、命令を処理するためのプロセッサ(3802)を含むことができる。プロセッサの非限定的な例は、Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32-bit RISC ARM 1176JZ(F)-S v1.0(商標)プロセッサ、ARM Cortex-A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に同等なプロセッサを含む。実行の複数のスレッドが並列処理に使用することができる。いくつかの例では、複数のプロセッサ、または複数のコアを持つプロセッサも、単一のコンピュータシステム中であろうと、クラスターの中であろうと、または、複数のコンピュータ、携帯電話、および/または個人用携帯情報端末装置を含むネットワーク上のシステムにわたって分布されていても、使用可能である。
図38に示されるように、高速キャッシュ(3804)は、プロセッサ(3802)に接続するか、または組み込まれることで、プロセッサ(3802)により近年使用されてきたまたは頻繁に使用されている命令またはデータのための高速メモリを提供することができる。プロセッサ(3802)は、プロセッサバス(3808)によりノースブリッジ(3806)に接続される。ノースブリッジ(3806)は、メモリバス(3812)によりランダムアクセスメモリ(RAM)(3810)に接続され、プロセッサ(3802)によりRAM(3810)へのアクセスを管理する。ノースブリッジ(3806)は、チップセットバス(3816)によりサウスブリッジ(3814)にも接続される。サウスブリッジ(3814)は次に、周辺バス(3818)に接続される。周辺バスは、例えば、PCI、PCI-X、PCI Express、または他の周辺バスであり得る。ノースブリッジおよびサウスブリッジはしばしば、プロセッサチップセットと称され、周辺バス(3818)上でプロセッサと、RAMと、周辺コンポーネントとの間のデータ転送を管理する。いくつかの代替的なアーキテクチャでは、ノースブリッジの機能性は、別のノースブリッジチップを使用する代わりにプロセッサに組み込まれることができる。いくつかの例では、システム(3800)は、周辺バス(3818)に取り付けられたアクセラレータカード(3822)を含むことができる。アクセラレータは、フィールドプログラマブルゲートアレイ(FPGA)または特定の処理を促進するための他のハードウェアを含み得る。例えば、アクセラレータは、適応データの再構成のために、または拡張された設定処理に使用される代数式を評価するために使用され得る。
【0129】
ソフトウェアおよびデータは、外部ストレージ(3824)に記憶され、プロセッサによる使用のために、RAM(3810)および/またはキャッシュ(3804)にローディングされ得る。システム(3800)は、システムリソースを管理するためのオペレーティングシステムを含み、オペレーティングシステムの非限定的な例は、Linux(登録商標)、Windows(登録商標)、MACOS(登録商標)、BlackBerry OS(登録商標)、iOS(登録商標)、および他の機能的に等価なオペレーティングシステム、ならびに本発明の例示的な実施形態によるデータ記憶および最適化を管理するためのオペレーティングシステムの上で動作するアプリケーションソフトウェアを含む。この例では、システム(3800)はまた、ネットワーク接続ストレージ(NAS)および並列分散処理に使用することができる他のコンピュータシステムなどの、外部ストレージへのネットワークインターフェースを提供するためにペリフェラルバスに接続されたネットワークインターフェースカード(NIC)(3820および3821)を含む。
【0130】
図8は、複数のコンピュータシステム(3902aおよび3902b)と、複数の携帯電話および携帯情報端末(3902c)と、ネットワーク接続ストレージ(NAS)(3904aおよび3904b)とを有するネットワーク(3900)を示す図である。例示的な実施形態では、システム(3902a、3902b、および3902c)は、データ記憶を管理し、ネットワーク接続記憶(NAS)(3904aおよび3904b)に記憶されたデータのためのデータアクセスを最適化することができる。数学モデルは、データのために使用され、コンピュータシステム(3902aおよび3902b)、ならびに携帯電話および携帯情報端末システム(3902c)にわたる並列分散処理(distributed parallel processing)を使用して評価されることができる。コンピュータシステム(3902aおよび3902b)、ならびに携帯電話および携帯情報端末システム(3902c)はまた、ネットワーク接続ストレージ(Network Attached Storage)(NAS)(3904aおよび3904b)に記憶されたデータの適応データ再構築のための並列処理を提供することができる。
図39は例のみを示し、多種多様な他のコンピュータアーキテクチャおよびシステムを本発明の様々な実施形態と併せて使用することができる。例えば、ブレードサーバーは並列処理を提供するために使用することができる。プロセッサブレードは、並列処理を提供するためにバックプレーンを介して接続可能である。ストレージも、バックプレーンに接続することができるか、または別のネットワークインターフェースを介してネットワーク接続ストレージ(NAS)として接続可能である。
【0131】
いくつかの例示的な実施形態では、プロセッサは、別個のメモリ空間を維持し、他のプロセッサによる並列処理のために、ネットワークインターフェース、バックプレーン、または他のコネクタを通してデータを伝送することができる。他の実施形態では、プロセッサのうちのいくつかまたはすべては、仮想共有アドレスメモリ空間を使用することができる。
図9は、例示的な実施形態に従って、仮想共有アドレスメモリ空間を使用するマルチプロセッサコンピュータシステム(4000)のブロック図である。システムは、共有メモリサブシステム(4004)にアクセスすることができる複数のプロセッサ(4002a~f)を含む。システムは、複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ(MAP)(4006a~f)をメモリサブシステム(4004)に組み込む。各MAP(4006a~f)は、メモリ(4008a~f)と、1つ以上のフィールドプログラマブルゲートアレイ(field programmable gate arrays)(FPGA)(4010a~f)とを備えることができる。MAPは、構成可能な機能ユニットを提供し、特定のアルゴリズムまたはアルゴリズムの部分は、それぞれのプロセッサと密接に協調して処理するために、FPGA(4010a~f)に提供することができる。例えば、例示的な実施形態では、MAPを使用して、データモデルに関する代数式を評価し、適応データ再構築を実行することができる。この例では、各MAPは、このような目的のためにプロセッサすべてによって世界中からアクセス可能である。一構成では、各MAPは、関連するメモリ(4008a~f)にアクセスするためにダイレクトメモリアクセス(DMA)を使用することができ、それぞれのマイクロプロセッサ(4002a~f)から独立して、かつ非同期にタスクを実行することを可能にする。この構成では、MAPは、アルゴリズムのパイプライン処理(pipelining)および並列実行のために別のMAPに直接結果を供給することができる。
【0132】
上記のコンピュータアーキテクチャおよびシステムは例示に過ぎず、一般的なプロセッサ、コプロセッサ、FPGAおよび他のプログラマブルロジックデバイス、システムオンチップ(system on chips)(SOC)、特定用途向け集積回路(application specific integrated circuits)(ASIC)、および他の処理要素および論理要素の任意の組み合わせを使用するシステムを含む、多種多様な他のコンピュータ、携帯電話、およびパーソナルデータアシスタントのアーキテクチャおよびシステムを例示の実施形態に関連して使用することができる。
いくつかの実施形態では、コンピュータシステムのすべてまたは一部は、ソフトウェアまたはハードウェアで実装することができる。ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワーク接続ストレージ(NAS)、ならびに他のローカルまたは分散データストレージデバイスおよびシステムを含む、任意の様々なデータストレージ媒体が、例示的な実施形態に関連して使用され得る。
【0133】
例示的な実施形態では、コンピュータシステムは、上記または他のコンピュータアーキテクチャおよびシステムのいずれかで実行されるソフトウェアモジュールを使用して実装することができる。他の実施形態では、システムの機能は、ファームウェア、フィールドプログラマブルゲートアレイ(field programmable gate arrays)(FPGA)などのプログラマブル論理デバイス、システムオンチップ(system on chips)(SOC)、特定用途向け集積回路(application specific integrated circuits)(ASIC)、または他の処理および論理要素において部分的または完全に実装され得る。例えば、セットプロセッサ(Set Processor)およびオプティマイザ(Optimizer)は、ハードウェアアクセラレータカード(hardware accelerator card)の使用によるハードウェアアクセラレーション(hardware acceleration)を用いて実装することができる。
【実施例】
【0134】
実施例1:
【0135】
ポリヌクレオチドは、フルオロフォアヌクレオチドを用いて配列決定される。配列決定の前に、ポリヌクレオチドが合成され(またはそうでなければ得られ)、
図1の一般的スキームに従って調製され、ポリヌクレオチド、プライマー、およびポリメラーゼを含む複数の三元複合体が得られる。複数の三元複合体を含むポリヌクレオチド三元複合体ライブラリーが作製され、遺伝子座を含む単一分子配列決定チップ上にローディングされる。
【0136】
三元複合体の各々は、単一分子配列決定チップの遺伝子座上にローディングされる。三元複合体中の各ポリヌクレオチドは、三元複合体を配列決定チップに繋ぎ止めるために、アビジン/ビオチン結合を用いて配列決定チップの遺伝子座に接続される。三元複合体は、配列決定チップの約33%容量のポアソン分布に従って、配列決定チップ上にローディングされる。
【0137】
反応混合物を調製し、それぞれ独特のフルオロフォアで標識される、遊離ヌクレオチドA、T、C、およびGを含む。この場合、固有なフルオロフォアは、ヌクレオチドの末端ホスフェートにおけるホスホルアミデート結合を介してヌクレオチドに結合される。
【0138】
配列決定中、固有なフルオロフォアを有するヌクレオチドが、ポリメラーゼおよびプライマーを介してポリヌクレオチドの配列に連続的に組み込まれる。励起源は、固有のフルオロフォアの各々を励起するための適切な波長を有する1つ以上の励起エネルギーを放出するように構成される。励起源によって放出される励起エネルギーは、所定の時間間隔でパルス化され、フルオロフォアの蛍光寿命が測定される。蛍光寿命測定を使用して、新たに組み込まれたヌクレオチドを決定する。新たに組み込まれたヌクレオチドの検出に続いて、ポリヌクレオチドからフルオロフォアを分離するために、ポリメラーゼを用いてホスホロアミデート結合を切断する。次いで、検出された発光のコレクションから得られた配列を使用して、配列相補性を介してポリヌクレオチドの配列を決定する。配列決定チップ上にローディングされたポリヌクレオチドの配列決定に続いて、洗浄する工程中にアビジン/ビオチン結合を切断して、配列決定チップから三元複合体を分離する。アビジン/ビオチン結合は、ビオチンを含む溶離液で配列決定チップを洗浄することによって破壊され、それによって、配列決定チップの表面から三元複合体を放出する。
【0139】
三元複合体を除去した後、任意選択で、配列決定チップの表面を再使用のために再調整する。次いで、新しい三元複合体ライブラリーを配列決定のために配列決定のためのチップ上に再ローディングし、本明細書に記載の配列決定工程を繰り返す。
【0140】
実施例2:
【0141】
電子機器(electronics)を用いてポリヌクレオチドを配列決定する。ポリヌクレオチドを合成し、実施例1の一般的な方法に従って配列決定チップ上にローディングする。
【0142】
配列決定チップは、離間した一対の電極を含む分子電子センサを含む。分子複合体は各電極に結合して、分子電子回路を形成する。分子複合体は、カーボンナノチューブブリッジと、その活性を通じて測定能な電気的パラメータを調節するポリメラーゼプローブ分子とを含む。
【0143】
電流を電極および分子複合体に流して、配列に組み込まれているヌクレオチドのパターンに応じて、識別可能なシグナルを生成する。識別可能な測定された電気的パラメータは、ポリヌクレオチド配列に関連するバイナリデータに変換される。
【0144】
三元複合体中のポリヌクレオチドを配列決定した後、配列決定チップを洗浄し、実施例1の一般的な方法に従って、三元複合体を配列決定チップから除去する。次いで、配列決定チップを再使用のために調製し、新しい三元複合体ライブラリーを再ローディングする。
【0145】
実施例3:
【0146】
合成によるナノポア配列決定(SBS)を用いたポリヌクレオチド配列決定を行う。ポリヌクレオチドを配列決定し、実施例1の一般的な方法に従って配列決定チップ上にローディングする。
【0147】
配列決定デバイスは、それぞれポリメラーゼにコンジュゲートされたナノポアを含む。
ナノポアに埋め込まれたポリメラーゼは、ポリヌクレオチドテンプレートおよび複数のヌクレオチドに曝露され、各々はオリゴヌクレオチドタグを含む。ポリヌクレオチドテンプレートに相補的なタグ付きヌクレオチドがポリメラーゼ活性部位によって捕捉され、タグ部分は、ナノポア内に位置するようになる。電位が印加され、細孔中のタグの存在は、開放細孔電流(open pore current)と比較して、特有のブロッキング電流(blocking current)を引き起こす。ブロッキング電流は、ポリメラーゼがポリヌクレオチドテンプレートに相補的な鎖を合成するときに測定される。測定されたブロッキング電流の配列は、ポリヌクレオチドテンプレートの配列を同定するために使用される。
【0148】
三元複合体中のポリヌクレオチドを配列決定した後、配列決定チップを洗浄し、実施例1の一般的な方法に従って、三元複合体を配列決定チップから除去する。次いで、配列決定チップを再使用のために調製し、新しい三元複合体ライブラリーを再ローディングする。
【0149】
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造がそれによって包含されるものであるということが意図されている。
【誤訳訂正2】
【訂正対象書類名】特許請求の範囲
【訂正対象項目名】全文
【訂正方法】変更
【訂正の内容】
【特許請求の範囲】
【請求項1】
ポリヌクレオチド配列決定のための方法であって、前記方法は、
a)複数のポリヌクレオチドを少なくとも1つのプライマおよび少なくとも1つのポリメラーゼと接触させて、複数の三元複合体を形成する工程と、
b)前記ポリヌクレオチドの1つ以上の塩基を検出する工程であって、検出は、前記複数の三元複合体が表面に結合している場合に起こる、工程と、
c)前記表面から前記三元複合体を除去する工程と、
d)工程a~cを繰り返して、前記ポリヌクレオチドを配列決定する工程と
を含む、方法。
【請求項2】
工程c)が、前記表面を洗浄する工程を含む、請求項1に記載の方法。
【請求項3】
洗浄する工程が、前記表面を溶媒、熱、小分子、核酸、またはタンパク質の1つ以上と接触させることを含む、請求項1に記載の方法。
【請求項4】
前記小分子が、第2の部分へのコンジュゲーションのために構成された第1の部分を含む、請求項3に記載の方法。
【請求項5】
前記コンジュゲーションが、求核剤/カルボニル、アジド/ホスフィン、1,4マイケル付加、1,3-双極性環状付加、逆電子需要型環状付加、オレフィンメタセシス、またはクロスカップリング反応を含む、請求項4に記載の方法。
【請求項6】
前記小分子が、ビオチン、アルキン、アジド、テトラジン、アルケン、アルキン、カルボニル、マイケル受容体/供与体、または抗原を含む、請求項3に記載の方法。
【請求項7】
前記溶媒が有機溶媒を含む、請求項3に記載の方法。
【請求項8】
前記有機溶媒が、MeCN、メタノール、エタノール、2-プロパノール、アセトン、DMF、ホルムアミド、THF、またはDMSOを含む、請求項3に記載の方法。
【請求項9】
前記有機溶媒が加熱される、請求項8に記載の方法。
【請求項10】
前記タンパク質が、プロテイナーゼまたはヌクレアーゼを含む、請求項3に記載の方法。
【請求項11】
前記プロテイナーゼがアミノペプチダーゼを含む、請求項10に記載の方法。
【請求項12】
前記アミノペプチダーゼが、プロテイナーゼK、N末端アミノペプチダーゼ、C末端アミノペプチダーゼ、キモトリプシン、トリプシン、ペプシン、またはLysCを含む、請求項11に記載の方法。
【請求項13】
前記タンパク質がストレプトアビジンを含む、請求項3に記載の方法。
【請求項14】
前記ポリメラーゼが、Phi29ポリメラーゼまたはその変異体を含む、請求項1に記載の方法。
【請求項15】
工程a)において、前記ポリメラーゼが、前記表面に結合される、請求項1に記載の方法。
【請求項16】
工程a)において、前記ポリメラーゼが、前記表面に結合されない、請求項1に記載の方法。
【請求項17】
前記複数のポリヌクレオチドが、少なくとも100,000の固有のポリヌクレオチドを含む、請求項1に記載の方法。
【請求項18】
前記複数のポリヌクレオチドが、50~30,000塩基長である、請求項1に記載の方法。
【請求項19】
検出する工程が、固有の波長、蛍光寿命、または電流もしくは電圧の変化を使用する塩基の同定を含む、請求項1に記載の方法。
【請求項20】
検出する工程が、合成による配列決定およびナノポア検出のうちの1つ以上を含む、請求項1に記載の方法。
【請求項21】
検出する工程がFRETを含む、請求項1に記載の方法。
【請求項22】
検出する工程が、前記三元複合体を少なくとも1つのヌクレオチドと接触させることを含む、請求項1に記載の方法。
【請求項23】
前記ヌクレオチドが標識を含む、請求項22に記載の方法。
【請求項24】
前記標識が発光標識を含む、請求項23に記載の方法。
【請求項25】
前記発光標識が色素である、請求項24に記載の方法。
【請求項26】
前記ポリメラーゼが量子ドットに付着される、請求項1に記載の方法。
【請求項27】
工程a)において、前記複数のポリヌクレオチドが、前記表面に結合される、請求項1に記載の方法。
【請求項28】
検出する工程が、電磁エネルギーによる励起を含む、請求項1に記載の方法。
【請求項29】
検出する工程が、レーザによる励起を含む、請求項28に記載の方法。
【請求項30】
前記レーザがパルス状である、請求項29に記載の方法。
【請求項31】
前記複数のポリヌクレオチドがヘアピンアダプタを含む、請求項1に記載の方法。
【請求項32】
前記複数のポリヌクレオチドが環状である、請求項1に記載の方法。
【請求項33】
工程a~cが、少なくとも3回繰り返される、請求項1に記載の方法。
【請求項34】
工程a~cが、少なくとも20回繰り返される、請求項1に記載の方法。
【請求項35】
工程a~cが、10分以下で行われる、請求項1に記載の方法。
【請求項36】
工程cが、5分以下で行われる、請求項1に記載の方法。
【請求項37】
ポリヌクレオチド配列決定のための方法であって、前記方法は、
a)表面上の複数のポリヌクレオチドを配列決定する工程であって、前記表面が単分子配列決定のための複数の遺伝子座を含む、工程と、
b)前記表面から前記ポリヌクレオチドを除去する工程と、
c)工程a~bを繰り返して、前記ポリヌクレオチドを配列決定する工程であって、少なくとも1メガバイトの配列決定データが、前記表面上の前記複数の遺伝子座のうちの150,000以下の遺伝子座から1時間以内に取得される、工程と
を含む、方法。
【請求項38】
少なくとも1ギガバイトの配列決定データが、前記表面上の前記複数の遺伝子座のうちの150,000以下の遺伝子座から1時間以内に取得される、請求項37に記載の方法。
【請求項39】
少なくとも1テラバイトの配列決定データが、前記表面上の前記複数の遺伝子座のうちの150,000以下の遺伝子座から1時間以内に取得される、請求項37に記載の方法。
【請求項40】
1メガバイト~1ゼータバイトの配列決定データが、前記表面上の前記複数の遺伝子座のうちの150,000以下の遺伝子座から1時間以内に取得される、請求項37に記載の方法。
【請求項41】
前記複数のポリヌクレオチドが、少なくとも1Gbのデジタル情報をコード化する、請求項37に記載の方法。
【請求項42】
デジタル情報の項目をコード化する方法であって、前記方法は、
a)デジタル配列として情報の項目を提供する工程と、
b)デジタル配列を核酸配列としてコード化する工程と、
c)請求項1~36のいずれか一項に記載の複数のポリヌクレオチドを生成する工程と
を含む、方法。
【請求項43】
デジタル情報の項目を復号するための方法であって、前記方法は、
a)請求項1~36のいずれか一項に記載の方法を用いて、前記複数のポリヌクレオチドの核酸配列を得る工程と、
b)前記核酸配列を1つ以上のデジタル配列に復号する工程と、
c)前記1つ以上のデジタル配列を使用して、デジタル情報の項目を読み取る工程と
を含む、方法。
【請求項44】
核酸配列決定のためのデバイスであって、前記デバイスは、
(a)固体支持体であって、前記固体支持体が表面を含み、前記表面が複数の遺伝子座を含む、固体支持体と、
(b)前記遺伝子座の少なくともいくつかを覆う結合部分であって、前記結合部分が、1つ以上のポリヌクレオチド、ポリメラーゼ、プライマ、およびそれらの任意の組み合わせの複合体に結合するように構成され、前記表面が再使用可能である、結合部分と、
(c)前記ポリメラーゼによって付加された1つ以上の塩基の同一性を識別するように構成される、検出器と
を含む、デバイス。
【請求項45】
前記表面が、前記結合部分の除去なしに、再利用可能である、請求項44に記載のデバイス。
【請求項46】
前記表面が、化学修飾なしに、再利用可能である、請求項44に記載のデバイス。
【請求項47】
1mm
2あたり少なくとも100,000の遺伝子座を含む、請求項44に記載のデバイス。
【請求項48】
1mm
2あたり少なくとも1,000,000の遺伝子座を含む、請求項44に記載のデバイス。
【請求項49】
1mm
2あたり100,000~10億の遺伝子座を含む、請求項44に記載のデバイス。
【請求項50】
プライマが15~50塩基の長さを有する、請求項44に記載のデバイス。
【請求項51】
前記表面が、複数のウェルまたはチャネルを含む、請求項44に記載のデバイス。
【請求項52】
前記ウェルまたはチャネルが、10~200nmの最長線寸法を有する、請求項44に記載のデバイス。
【請求項53】
1つ以上のナノポアをさらに含む、請求項44に記載のデバイス。
【請求項54】
前記表面が実質的に平面である、請求項44に記載のデバイス。
【請求項55】
前記固体支持体が、ガラス、シリコン、またはこれらの組み合わせを含む、請求項44に記載のデバイス。
【請求項56】
前記表面が、前記表面に付着した複数のポリメラーゼを含む、請求項44に記載のデバイス。
【請求項57】
前記表面が、前記表面に付着した複数のポリヌクレオチドを含む、請求項44に記載のデバイス。
【請求項58】
前記表面が、ポリヌクレオチド、ポリメラーゼ、またはプライマのうちの2つ以上を含む複合体を含む、請求項44に記載のデバイス。
【請求項59】
遺伝子座の少なくとも1%が、ポリメラーゼ、ポリヌクレオチド、プライマ、またはそれらの任意の組み合わせの複合体を含む、請求項44に記載のデバイス。
【請求項60】
遺伝子座の少なくとも30%が、ポリメラーゼ、ポリヌクレオチド、プライマ、またはそれらの任意の組み合わせの複合体を含む、請求項44に記載のデバイス。
【請求項61】
前記複合体が、共有結合を介して結合される、請求項44に記載のデバイス。
【請求項62】
前記複合体が、非共有結合を介して結合される、請求項44に記載のデバイス。
【請求項63】
前記複合体が、親和性相互作用、タンパク質、オリゴヌクレオチド、または熱放出可能な結合を介して付着される、請求項44に記載のデバイス。
【請求項64】
前記親和性相互作用がストレプトアビジン-ビオチンを含む、請求項44に記載のデバイス。
【請求項65】
前記親和性相互作用が、抗体-抗原結合を含む、請求項44に記載のデバイス。
【請求項66】
前記親和性相互作用が、タンパク質-タンパク質相互作用を含む、請求項44に記載のデバイス。
【請求項67】
流体インターフェースをさらに備える、請求項44に記載のデバイス。
【請求項68】
フローセルをさらに備える、請求項44に記載のデバイス。
【請求項69】
1つの遺伝子座につき、少なくとも1つの検出器を備える、請求項44に記載のデバイス。
【請求項70】
前記検出器が、複数のゼロモード導波路を備える、請求項44に記載のデバイス。
【請求項71】
前記検出器が、可視波長、UV波長、またはそれらの組み合わせを測定するように構成される、請求項44に記載のデバイス。
【請求項72】
前記検出器が、蛍光を測定するように構成される、請求項44に記載のデバイス。
【請求項73】
前記検出器が、電圧または電流の変化を測定するように構成される、請求項44に記載のデバイス。
【請求項74】
ポリヌクレオチド合成デバイスをさらに備える、請求項44に記載のデバイス。
【国際調査報告】