(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】ビーズベースの核酸の組み合わせインデックス付けのための方法及び組成物
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240621BHJP
C12Q 1/686 20180101ALI20240621BHJP
C12Q 1/6855 20180101ALI20240621BHJP
C12Q 1/6874 20180101ALI20240621BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/686 Z
C12Q1/6855 Z
C12Q1/6874 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023579590
(86)(22)【出願日】2022-06-23
(85)【翻訳文提出日】2023-12-25
(86)【国際出願番号】 US2022034734
(87)【国際公開番号】W WO2022271954
(87)【国際公開日】2022-12-29
(32)【優先日】2021-06-24
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】アンドレア・マンゾ
(72)【発明者】
【氏名】コリン・ブラウン
(72)【発明者】
【氏名】スティーブン・ノーバーグ
(72)【発明者】
【氏名】ティモシー・ハリントン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ41
4B063QR08
4B063QR32
4B063QR55
4B063QR62
(57)【要約】
いくつかの実施形態は、組み合わせインデックス付きビーズを調製するための方法及び組成物に関する。いくつかの実施形態は、ビーズに付着したポリヌクレオチドへの異なるインデックスの逐次付加を含む。いくつかの実施形態では、インデックスは、化学ライゲーション、ポリメラーゼ伸長、部分的二本鎖アダプターのライゲーション、又は短いスプリントライゲーションによって付加される。
【特許請求の範囲】
【請求項1】
複数の組み合わせインデックス付きビーズを調製する方法であって、
(a)第1のインデックスを含む第1のポリヌクレオチドを含む一次インデックス付きビーズの集団を得ることであって、前記一次インデックス付きビーズの集団が、複数の第1のインデックス付きビーズの亜集団を含み、前記第1のインデックス付きビーズの亜集団が、互いに異なる第1のインデックスを含む、一次インデックス付きビーズの集団を得ることと、
(b)前記一次インデックス付きビーズの集団を複数の第2のビーズの亜集団に分割することと、
(c)二次インデックス付きビーズの集団を得ることであって、
(i)前記複数の第2のビーズの亜集団の第1のポリヌクレオチドを、第2のインデックスを含む第2のポリヌクレオチドで伸長して、第2のインデックス付きビーズの亜集団を得ることであって、前記第2のインデックス付きビーズの亜集団が、互いに異なる第2のインデックスを含む、第2のインデックス付きビーズの亜集団を得ることと、
(ii)前記第2のインデックス付きビーズの亜集団を組み合わせて、前記二次インデックス付きビーズの集団を得ることと、を含む、二次インデックス付きビーズの集団を得ることと、を含み、任意選択で、
(d)前記二次インデックス付きビーズの集団を複数の第3のビーズの亜集団に分割することと、
(e)三次インデックス付きビーズの集団を得ることであって、
(i)前記複数の第3のビーズの亜集団の第2のポリヌクレオチドを、第3のインデックスを含む第3のポリヌクレオチドで伸長して、第3のインデックス付きビーズの亜集団を得ることであって、前記第3のインデックス付きビーズの亜集団が、互いに異なる第3のインデックスを含む、第3のインデックス付きビーズの亜集団を得ることと、
(ii)前記第3のインデックス付きビーズの亜集団を組み合わせて、前記三次インデックス付きビーズの集団を得ることと、を含む、三次インデックス付きビーズの集団を得ることと、を更に含む、方法。
【請求項2】
(c)が、化学ライゲーションによって前記第1のポリヌクレオチドを前記第2のポリヌクレオチドで伸長することを含む、請求項1に記載の方法。
【請求項3】
前記第1のポリヌクレオチドが、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’修飾デオキシヌクレオチド(dNTP)を含み、
前記第2のポリヌクレオチドが、前記3’-官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾dNTPを含み、
前記3’官能性部分及び前記5’官能性部分が、互いに反応して、修飾バックボーン結合を形成することができる、請求項2に記載の方法。
【請求項4】
前記第1のポリヌクレオチドを前記第2のポリヌクレオチドで伸長することにより、二次インデックス付きポリヌクレオチドを得、前記方法が、前記二次インデックス付きポリヌクレオチドを修飾して、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’修飾デオキシヌクレオチド(dNTP)を含む修飾ポリヌクレオチドを得ることを更に含む、請求項3に記載の方法。
【請求項5】
前記修飾することが、前記二次インデックス付きポリヌクレオチドをテンプレート非依存性ポリメラーゼと接触させることを含む、請求項4に記載の方法。
【請求項6】
前記テンプレート非依存性ポリメラーゼが、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、ポリAポリメラーゼ、又はCCA付加RNAポリメラーゼから選択される、請求項5に記載の方法。
【請求項7】
前記テンプレート非依存性ポリメラーゼが、TdTである、請求項6に記載の方法。
【請求項8】
化学ライゲーション反応によって前記修飾ポリヌクレオチドを前記第3のポリヌクレオチドで伸長することを更に含み、前記第3のポリヌクレオチドが、前記3’官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾dNTPを含む、請求項3~7のいずれか一項に記載の方法。
【請求項9】
前記3’官能性部分が、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される、請求項3~8のいずれか一項に記載の方法。
【請求項10】
前記5’官能性部分が、前記3’官能性部分と異なり、かつそれと適合性があり、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される、請求項3~9のいずれか一項に記載の方法。
【請求項11】
前記3’官能性部分及び前記5’官能性部分が、以下の対:(i)3’-アジド/5’-アルキニル、(ii)3’-アルキニル/5’-アジド、(iii)3’-チオール/5’-アルキニル、(iv)3’-チオール/5’-アルケニル、(v)3’-アルキニル/5’-チオール、(vi)3’-アルケニル/5’-チオール、(vii)3’-アジド/5’-シクロオクチニル、(viii)3’-シクロオクチニル/5’-アジド、(ix)3’-ニトロン/5’-シクロオクチニル、及び(x)3’-シクロオクチニル/5’-ニトロンから選択される、請求項3~10のいずれか一項に記載の方法。
【請求項12】
前記3’官能性部分が、3’-アジドであり、前記5’官能性部分が、5’-アルキニルである、請求項3~11のいずれか一項に記載の方法。
【請求項13】
前記クリックケミストリー反応が、トリアゾリルを含む修飾バックボーン結合を形成するための銅触媒アジド-アルキン環化付加(CuAAC)を含む、請求項3~12のいずれか一項に記載の方法。
【請求項14】
(c)が、ポリメラーゼ伸長によって前記第1のポリヌクレオチドを伸長することを含み、前記第1のポリヌクレオチドが、第1のリンカーを含む、請求項1に記載の方法。
【請求項15】
(i)前記第1のリンカーにハイブリダイズすることができる領域と、前記第2のインデックス又は前記第2のインデックスの相補体を含む領域と、を含む、第1のアダプターを得ることと、
(ii)前記第1のアダプターを前記第1のリンカーにハイブリダイズすることと、
(iii)前記第1のポリヌクレオチドを伸長して、二次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項14に記載の方法。
【請求項16】
前記第1のアダプターが、非伸長性3’末端を含む、請求項14又は15に記載の方法。
【請求項17】
前記非伸長性3’末端が、3’2’ジデオキシヌクレオチド又はC3リンカーを含む、請求項16に記載の方法。
【請求項18】
前記第1のアダプターを前記二次インデックス付きポリヌクレオチドから除去することを更に含む、請求項14~17のいずれか一項に記載の方法。
【請求項19】
前記除去することが、熱若しくは塩基によって前記第1のアダプターを変性させること、又は酵素分解によって前記第1のアダプターを分解することを含む、請求項18に記載の方法。
【請求項20】
前記第1のリンカーが、10個未満の連続するヌクレオチドの長さを有する、請求項14~19のいずれか一項に記載の方法。
【請求項21】
前記第1のリンカーが、5個未満の連続するヌクレオチドの長さを有する、請求項14~20のいずれか一項に記載の方法。
【請求項22】
(e)が、ポリメラーゼ伸長によって前記第2のポリヌクレオチドを伸長することを含む、請求項14~21のいずれか一項に記載の方法。
【請求項23】
前記第1のアダプターが、第2のリンカーの相補体を含み、その結果、前記二次インデックス付きポリヌクレオチドが、前記第2のリンカーを含む、請求項15~22のいずれか一項に記載の方法。
【請求項24】
(i)前記第2のリンカーにハイブリダイズすることができる領域と、前記第3のインデックス又は前記第3のインデックスの相補体を含む領域と、を含む、第2のアダプターを得ることと、
(ii)前記第2のアダプターを前記第2のリンカーにハイブリダイズすることと、
(iii)前記二次インデックス付きポリヌクレオチドを伸長して、三次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項23に記載の方法。
【請求項25】
前記第2のアダプターが、非伸長性3’末端を含む、請求項24に記載の方法。
【請求項26】
前記非伸長性3’末端が、3’2’ジデオキシヌクレオチド又はC3リンカーを含む、請求項25に記載の方法。
【請求項27】
前記第2のアダプターを前記三次インデックス付きポリヌクレオチドから除去することを更に含む、請求項24~26のいずれか一項に記載の方法。
【請求項28】
前記除去することが、熱若しくは塩基によって前記第1のアダプターを変性させること、又は酵素分解によって前記第1のアダプターを分解することを含む、請求項27に記載の方法。
【請求項29】
前記第2のリンカーが、10個未満の連続するヌクレオチドの長さを有する、請求項23~28のいずれか一項に記載の方法。
【請求項30】
前記第2のリンカーが、5個未満の連続するヌクレオチドの長さを有する、請求項23~29のいずれか一項に記載の方法。
【請求項31】
(c)が、ライゲーションによって前記第1のポリヌクレオチドを前記第2のポリヌクレオチドで伸長することを含む、請求項1に記載の方法。
【請求項32】
(i)前記第2のポリヌクレオチドと、前記第1のポリヌクレオチドの第1のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第1のアダプターを得ることと、
(ii)前記第1のアダプターを前記第1のリンカーにハイブリダイズすることと、任意選択で、追加のオリゴヌクレオチドを前記第1のインデックスにハイブリダイズすることと、
(iii)前記第1のポリヌクレオチドを前記第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項31に記載の方法。
【請求項33】
ライゲーションによって前記第2のポリヌクレオチドを第3のポリヌクレオチドで伸長することを更に含む、請求項32に記載の方法。
【請求項34】
(i)前記第3のポリヌクレオチドと、前記第2のポリヌクレオチドの第2のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第2のアダプターを得ることと、
(ii)前記第2のアダプターを前記第2のリンカーにハイブリダイズすることと、
(iii)前記第2のポリヌクレオチドを前記第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項33に記載の方法。
【請求項35】
前記ライゲーションが、リガーゼの使用を含む、請求項31~34のいずれか一項に記載の方法。
【請求項36】
前記ライゲーションが、化学ライゲーション反応を含む、請求項31~34のいずれか一項に記載の方法。
【請求項37】
(c)が、ライゲーションによって前記第1のポリヌクレオチドを伸長することを含み、前記第1のポリヌクレオチドが、第1のリンカーを含み、前記第2のポリヌクレオチドが、第2のリンカーを含む、請求項1に記載の方法。
【請求項38】
(i)前記第1のリンカーにハイブリダイズすることができる領域と、前記第2のリンカーにハイブリダイズすることができる領域と、を含む、第1のアダプターを得ることと、
(ii)前記第1のアダプターを前記第1のリンカーにハイブリダイズすることと、
(iii)前記第2のオリゴヌクレオチドを、前記第2のリンカーにハイブリダイズすることができる前記領域にハイブリダイズすることと、
(iv)前記第1のポリヌクレオチドを前記第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項37に記載の方法。
【請求項39】
前記第1のリンカー及び/又は前記第2のリンカーが、10個未満の連続するヌクレオチドの長さを有する、請求項38に記載の方法。
【請求項40】
前記第1のリンカー及び/又は前記第2のリンカーが、5個未満の連続するヌクレオチドの長さを有する、請求項39に記載の方法。
【請求項41】
前記第1のリンカー/又は第2のリンカーが、前記第1のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したT
mを有するように修飾されている、請求項37~40のいずれか一項に記載の方法。
【請求項42】
前記第1のリンカー及び/又は前記第2のリンカーが、同じ長さを有する前記オリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む、請求項41に記載の方法。
【請求項43】
前記第1のアダプターを前記二次インデックス付きポリヌクレオチドから除去することを更に含む、請求項37~42のいずれか一項に記載の方法。
【請求項44】
前記除去することが、熱若しくは塩基によって前記第1のアダプターを変性させること、又は酵素分解によって前記第1のアダプターを分解することを含む、請求項43に記載の方法。
【請求項45】
(e)が、ライゲーションによって前記第2のポリヌクレオチドを伸長することを含み、前記第2のオリゴヌクレオチドが、第3のリンカーを含み、その結果、前記二次インデックス付きポリヌクレオチドが、前記第3のリンカーを含み、前記第3のポリヌクレオチドが、第4のリンカーを含む、請求項37~44のいずれか一項に記載の方法。
【請求項46】
(i)前記第3のリンカーにハイブリダイズすることができる領域と、前記第4のリンカーにハイブリダイズすることができる領域と、を含む、第2のアダプターを得ることと、
(ii)前記第2のアダプターを前記第3のリンカーにハイブリダイズすることと、
(iii)前記第3のポリヌクレオチドを、第4のインデックスにハイブリダイズすることができる前記領域を介して、前記第2のアダプターにハイブリダイズすることと、
(iv)前記二次インデックス付きポリヌクレオチドを前記第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を更に含む、請求項45に記載の方法。
【請求項47】
前記第3のリンカー及び/又は前記第4のリンカーが、9個未満の連続するヌクレオチドの長さを有する、請求項46に記載の方法。
【請求項48】
前記第3のリンカー及び/又は前記第4のリンカーが、5個未満の連続するヌクレオチドの長さを有する、請求項47に記載の方法。
【請求項49】
前記第3のリンカー及び/又は前記第4のリンカーが、前記第2のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したT
mを有するように修飾されている、請求項45~48のいずれか一項に記載の方法。
【請求項50】
前記第3のリンカー及び/又は前記第4のリンカーが、同じ長さを有する前記オリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む、請求項49に記載の方法。
【請求項51】
前記第2のアダプターを前記三次インデックス付きポリヌクレオチドから除去することを更に含む、請求項46~50のいずれか一項に記載の方法。
【請求項52】
前記除去することが、熱若しくは塩基によって前記第1のアダプターを変性させること、又は酵素分解によって前記第1のアダプターを分解することを含む、請求項51に記載の方法。
【請求項53】
(a)が、
(i)前記第1のポリヌクレオチドを複数の第1のビーズの亜集団に付着させて、前記第1のインデックス付きビーズの亜集団を得ることであって、前記第1のポリヌクレオチドが、第1のビーズの亜集団ごとに異なる第1のインデックスを含む、第1のインデックス付きビーズの亜集団を得ることと、
(ii)前記第1のインデックス付きビーズの亜集団を組み合わせて、前記一次インデックス付きビーズの集団を得ることと、を含む、請求項1~52のいずれか一項に記載の方法。
【請求項54】
前記第1のポリヌクレオチドが、第1の結合パートナー及び第2の結合パートナーを介してビーズに付着される、請求項53に記載の方法。
【請求項55】
前記第1の結合パートナー又は前記第2の結合パートナーが、ビオチン、ストレプトアビジン、ビオチン誘導体、ストレプトアビジン誘導体、抗体、及び抗体の抗原結合断片からなる群から選択される、請求項54に記載の方法。
【請求項56】
(d)及び(e)を繰り返すことと、追加のインデックスをインデックス付きビーズの亜集団に付加することと、を更に含む、請求項1~55のいずれか一項に記載の方法。
【請求項57】
前記第1のポリヌクレオチドが、P5配列、P5’配列、P7配列、及びP7’配列からなる群から選択されるプライマー結合部位を含む、請求項1~56のいずれか一項に記載の方法。
【請求項58】
前記第1のインデックス、前記第2のインデックス、及び/又は前記第3のインデックスが、20個未満の連続するヌクレオチドの長さを有する、請求項1~57のいずれか一項に記載の方法。
【請求項59】
前記第1のインデックス、前記第2のインデックス、及び/又は前記第3のインデックスが、10個未満の連続するヌクレオチドの長さを有する、請求項1~58のいずれか一項に記載の方法。
【請求項60】
(b)が、前記一次インデックス付きビーズの集団を複数の区画にランダムに分配することを含む、請求項1~59のいずれか一項に記載の方法。
【請求項61】
(d)が、前記二次インデックス付きビーズの集団を複数の区画にランダムに分配することを含む、請求項1~60のいずれか一項に記載の方法。
【請求項62】
前記複数の区画が、ウェル、チャネル、又は液滴から選択される区画を含む、請求項60又は61に記載の方法。
【請求項63】
前記複数の組み合わせインデックス付きビーズが、磁気ビーズを含む、請求項1~62のいずれか一項に記載の方法。
【請求項64】
前記複数の組み合わせインデックス付きビーズをアレイ上に分配することを更に含む、請求項1~63のいずれか一項に記載の方法。
【請求項65】
アレイ上の前記組み合わせインデックス付きビーズを配列決定することを更に含む、請求項1~64のいずれか一項に記載の方法。
【請求項66】
前記組み合わせインデックスに基づいて、アレイ上の前記複数の組み合わせインデックス付きビーズのうちの1つのビーズの位置をデコードすることを更に含む、請求項65に記載の方法。
【請求項67】
前記複数の組み合わせインデックス付きビーズの各ビーズが、捕捉プローブを含む、請求項1~66のいずれか一項に記載の方法。
【請求項68】
前記第1のポリヌクレオチド、前記第2のポリヌクレオチド、又は前記第3のポリヌクレオチドが、前記捕捉プローブを含む、請求項67に記載の方法。
【請求項69】
複数の標的核酸を前記捕捉プローブにハイブリダイズすることを更に含む、請求項1~68のいずれか一項に記載の方法。
【請求項70】
前記捕捉プローブを伸長することを更に含む、請求項69に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、米国仮特許第63/214,693号(2021年6月24日出願)、表題「METHODS AND COMPOSITIONS FOR COMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS」に対する優先権を主張し、これは、参照によりその全体が組み込まれる。
【0002】
配列表の参照
本出願は、電子フォーマットでの配列表とともに出願されている。配列表は、ILLINC608WOSEQLISTと題され、2022年6月17日に作成されたファイルとして提供され、これは、およそ3.15キロバイトのサイズである。配列表の電子フォーマット中の情報は、参照によりその全体が本明細書に組み込まれる。
【0003】
いくつかの実施形態は、組み合わせインデックス付きビーズを調製するための方法及び組成物に関する。いくつかの実施形態は、ビーズに付着したポリヌクレオチドへの異なるインデックスの逐次付加を含む。いくつかの実施形態では、インデックスは、化学ライゲーション、ポリメラーゼ伸長、部分的二本鎖アダプターのライゲーション、又は短いスプリントライゲーションによって付加される。
【背景技術】
【0004】
生体試料中に存在する特定の核酸配列の検出は、例えば、微生物を識別及び分類する、感染症を診断する、遺伝子異常を検出及び特徴付ける、がんに関連する遺伝的変化を識別する、疾患に対する遺伝的感受性を調べる、並びに様々な種類の治療に対する応答を測定するための方法として使用されてきた。生体試料中の特定の核酸配列を検出するための一般的な技術は、核酸配列決定である。
【0005】
核酸配列決定方法は、Maxam及びGilbertによって使用された化学的分解法並びにSangerによって使用されたストランド伸長法から著しく進化している。現在では、単一チップ上での数千個の核酸の並行処理を可能にするいくつかの配列決定方法が使用されている。いくつかのプラットフォームは、ビーズベース及びマイクロアレイのフォーマットを含み、シリカビーズが、配列決定、遺伝子型決定、遺伝子発現プロファイリングを含む用途でのこのようなフォーマットの適用に応じたプローブで官能化される。
【0006】
現在のビーズベースのアレイ上で異なる試料を遺伝子型決定する方法は、ビーズチップの異なる面積を複数のセクターに物理的に細分割するためのガスケットを必要とする。次いで、個々の試料を、ガスケットによって作成された各別個のセクションにロードする。しかしながら、そのような方法は、比較的少ない試料数の投入で使用されるが、ビーズチップ当たりの試料の密度が、ビーズチップ当たり24~96、384、1536、又はそれ以上の試料に増加すると、困難であり管理不能であることが立証されている。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【課題を解決するための手段】
【0008】
本明細書において提供される方法及び組成物のいくつかの実施形態は、複数の組み合わせインデックス付きビーズを調製する方法であって、(a)第1のインデックスを含む第1のポリヌクレオチドを含む一次インデックス付きビーズの集団を得ることであって、一次インデックス付きビーズの集団が、複数の第1のインデックス付きビーズの亜集団を含み、第1のインデックス付きビーズの亜集団が、互いに異なる第1のインデックスを含む、一次インデックス付きビーズの集団を得ることと、(b)一次インデックス付きビーズの集団を複数の第2のビーズの亜集団に分割することと、(c)二次インデックス付きビーズの集団を得ることであって、(i)複数の第2のビーズの亜集団の第1のポリヌクレオチドを、第2のインデックスを含む第2のポリヌクレオチドで伸長して、第2のインデックス付きビーズの亜集団を得ることであって、第2のインデックス付きビーズの亜集団が、互いに異なる第2のインデックスを含む、第2のインデックス付きビーズの亜集団を得ることと、(ii)第2のインデックス付きビーズの亜集団を組み合わせて、二次インデックス付きビーズの集団を得ることと、を含む、二次インデックス付きビーズの集団を得ることと、を含み、任意選択で、(d)二次インデックス付きビーズの集団を複数の第3のビーズの亜集団に分割することと、(e)三次インデックス付きビーズの集団を得ることであって、(i)複数の第3のビーズの亜集団の第2のポリヌクレオチドを、第3のインデックスを含む第3のポリヌクレオチドで伸長して、第3のインデックス付きビーズの亜集団を得ることであって、第3のインデックス付きビーズの亜集団が、互いに異なる第3のインデックスを含む、第3のインデックス付きビーズの亜集団を得ることと、(ii)第3のインデックス付きビーズの亜集団を組み合わせて、三次インデックス付きビーズの集団を得ることと、を含む、三次インデックス付きビーズの集団を得ることと、を更に含む、方法を含む。
【0009】
いくつかの実施形態では、(c)は、化学ライゲーションによって第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することを含む。
【0010】
いくつかの実施形態では、第1のポリヌクレオチドは、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’修飾デオキシヌクレオチド(dNTP)を含み、第2のポリヌクレオチドは、3’-官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾dNTPを含み、3’官能性部分及び5’官能性部分は、互いに反応して、修飾バックボーン結合を形成することができる。
【0011】
いくつかの実施形態では、第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することにより、二次インデックス付きポリヌクレオチドを得、本方法は、二次インデックス付きポリヌクレオチドを修飾して、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’修飾デオキシヌクレオチド(dNTP)を含む修飾ポリヌクレオチドを得ることを更に含む。
【0012】
いくつかの実施形態では、修飾することは、二次インデックス付きポリヌクレオチドをテンプレート非依存性ポリメラーゼと接触させることを含む。いくつかの実施形態では、テンプレート非依存性ポリメラーゼは、末端デオキシヌクレオチジルトランスフェラーゼ(terminal deoxynucleotidyl transferase、TdT)、ポリAポリメラーゼ、又はCCA付加RNAポリメラーゼから選択される。いくつかの実施形態では、テンプレート非依存性ポリメラーゼは、TdTである。
【0013】
いくつかの実施形態はまた、化学ライゲーション反応によって修飾ポリヌクレオチドを第3のポリヌクレオチドで伸長することを含み、第3のポリヌクレオチドは、3’官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾dNTPを含む。
【0014】
いくつかの実施形態では、3’官能性部分は、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される。
【0015】
いくつかの実施形態では、5’官能性部分は、3’官能性部分と異なり、かつ3’官能性部分と適合性があり、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される。
【0016】
いくつかの実施形態では、3’官能性部分及び5’官能性部分は、以下の対:(i)3’-アジド/5’-アルキニル、(ii)3’-アルキニル/5’-アジド、(iii)3’-チオール/5’-アルキニル、(iv)3’-チオール/5’-アルケニル、(v)3’-アルキニル/5’-チオール、(vi)3’-アルケニル/5’-チオール、(vii)3’-アジド/5’-シクロオクチニル、(viii)3’-シクロオクチニル/5’-アジド、(ix)3’-ニトロン/5’-シクロオクチニル、及び(x)3’-シクロオクチニル/5’-ニトロンから選択される。いくつかの実施形態では、3’官能性部分は、3’-アジドであり、5’官能性部分は、5’-アルキニルである。
【0017】
いくつかの実施形態では、クリックケミストリー反応は、トリアゾリルを含む修飾バックボーン結合を形成するための銅触媒アジド-アルキン環化付加(copper catalyzed azide-alkyne cycloaddition、CuAAC)を含む。
【0018】
いくつかの実施形態では、(c)は、ポリメラーゼ伸長によって第1のポリヌクレオチドを伸長することを含み、第1のポリヌクレオチドは、第1のリンカーを含む。
【0019】
いくつかの実施形態はまた、(i)第1のリンカーにハイブリダイズすることができる領域と、第2のインデックス又は第2のインデックスの相補体を含む領域と、を含む、第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第1のポリヌクレオチドを伸長して、二次インデックス付きポリヌクレオチドを得ることと、を含む。
【0020】
いくつかの実施形態では、第1のアダプターは、非伸長性3’末端を含む。いくつかの実施形態では、非伸長性3’末端は、3’2’ジデオキシヌクレオチド、又はC3リンカーを含む。
【0021】
いくつかの実施形態はまた、二次インデックス付きポリヌクレオチドから第1のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0022】
いくつかの実施形態では、第1のリンカーは、10個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のリンカーは、5個未満の連続するヌクレオチドの長さを有する。
【0023】
いくつかの実施形態では、(e)は、ポリメラーゼ伸長によって第2のポリヌクレオチドを伸長することを含む。
【0024】
いくつかの実施形態では、第1のアダプターは、第2のリンカーの相補体を含み、その結果、二次インデックス付きポリヌクレオチドが、第2のリンカーを含む。
【0025】
いくつかの実施形態はまた、(i)第2のリンカーにハイブリダイズすることができる領域と、第3のインデックス又は第3のインデックスの相補体を含む領域と、を含む、第2のアダプターを得ることと、(ii)第2のアダプターを第2のリンカーにハイブリダイズすることと、(iii)二次インデックス付きポリヌクレオチドを伸長して、三次インデックス付きポリヌクレオチドを得ることと、を含む。
【0026】
いくつかの実施形態では、第2のアダプターは、非伸長性3’末端を含む。
【0027】
いくつかの実施形態では、非伸長性3’末端は、3’2’ジデオキシヌクレオチド、又はC3リンカーを含む。
【0028】
いくつかの実施形態はまた、三次インデックス付きポリヌクレオチドから第2のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0029】
いくつかの実施形態では、第2のリンカーは、10個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第2のリンカーは、5個未満の連続するヌクレオチドの長さを有する。
【0030】
いくつかの実施形態では、(c)は、ライゲーションによって第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することを含む。
【0031】
いくつかの実施形態はまた、(i)第2のポリヌクレオチドと、第1のポリヌクレオチドの第1のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第1のポリヌクレオチドを第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を含む。
【0032】
いくつかの実施形態はまた、ライゲーションによって第2のポリヌクレオチドを第3のポリヌクレオチドで伸長することを含む。
【0033】
いくつかの実施形態はまた、(i)第3のポリヌクレオチドと、第2のポリヌクレオチドの第2のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第2のアダプターを得ることと、(ii)第2のアダプターを第2のリンカーにハイブリダイズすることと、任意選択で、追加のオリゴヌクレオチドを第1のインデックスにハイブリダイズすることと、(iii)第2のポリヌクレオチドを第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を含む。
【0034】
いくつかの実施形態では、ライゲーションは、リガーゼの使用を含む。
【0035】
いくつかの実施形態では、ライゲーションは、ケミカルライゲーション反応を含む。
【0036】
いくつかの実施形態では、(c)は、ライゲーションによって第1のポリヌクレオチドを伸長することを含み、第1のポリヌクレオチドは、第1のリンカーを含み、第2のポリヌクレオチドは、第2のリンカーを含む。
【0037】
いくつかの実施形態はまた、(i)第1のリンカーにハイブリダイズすることができる領域と、第2のリンカーにハイブリダイズすることができる領域と、を含む、第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第2のオリゴヌクレオチドを、第2のリンカーにハイブリダイズすることができる領域にハイブリダイズすることと、(iv)第1のポリヌクレオチドを第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を含む。
【0038】
いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、10個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、5個未満の連続するヌクレオチドの長さを有する。
【0039】
いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、第1のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したTmを有するように修飾されている。
【0040】
いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、同じ長さを有するオリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む。
【0041】
いくつかの実施形態はまた、二次インデックス付きポリヌクレオチドから第1のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0042】
いくつかの実施形態では、(e)は、ライゲーションによって第2のポリヌクレオチドを伸長することを含み、第2のオリゴヌクレオチドは、第3のリンカーを含み、その結果、二次インデックス付きポリヌクレオチドが、第3のリンカーを含み、第3のポリヌクレオチドは、第4のリンカーを含む。
【0043】
いくつかの実施形態はまた、(i)第3のリンカーにハイブリダイズすることができる領域と、第4のリンカーにハイブリダイズすることができる領域と、を含む、第2のアダプターを得ることと、(ii)第2のアダプターを第3のリンカーにハイブリダイズすることと、(iii)第4のインデックスにハイブリダイズすることができる領域を介して、第3のポリヌクレオチドを第2のアダプターにハイブリダイズすることと、(iv)二次インデックス付きポリヌクレオチドを第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を含む。
【0044】
いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、9個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、5個未満の連続するヌクレオチドの長さを有する。
【0045】
いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、第2のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したTmを有するように修飾されている。
【0046】
いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、同じ長さを有するオリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む。
【0047】
いくつかの実施形態はまた、三次インデックス付きポリヌクレオチドから第2のアダプターを除去することを含む。
【0048】
いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0049】
いくつかの実施形態では、(a)は、(i)第1のポリヌクレオチドを複数の第1のビーズの亜集団に付着させて、第1のインデックス付きビーズの亜集団を得ることであって、第1のポリヌクレオチドが、第1のビーズの亜集団ごとに異なる第1のインデックスを含む、第1のインデックス付きビーズの亜集団を得ることと、(ii)第1のインデックス付きビーズの亜集団を組み合わせて、一次インデックス付きビーズの集団を得ることと、を含む。
【0050】
いくつかの実施形態では、第1のポリヌクレオチドは、第1の結合パートナー及び第2の結合パートナーを介してビーズに付着される。いくつかの実施形態では、第1の結合パートナー又は第2の結合パートナーは、ビオチン、ストレプトアビジン、ビオチン誘導体、ストレプトアビジン誘導体、抗体、及び抗体の抗原結合断片からなる群から選択される。
【0051】
いくつかの実施形態はまた、(d)及び(e)を繰り返すことと、追加のインデックスをインデックス付きビーズの亜集団に付加することと、を含む。
【0052】
いくつかの実施形態では、第1のポリヌクレオチドは、P5配列、P5’配列、P7配列、及びP7’配列からなる群から選択されるプライマー結合部位を含む。
【0053】
いくつかの実施形態では、第1のインデックス、第2のインデックス、及び/又は第3のインデックスは、20個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のインデックス、第2のインデックス、及び/又は第3のインデックスは、10個未満の連続するヌクレオチドの長さを有する。
【0054】
いくつかの実施形態では、(b)は、一次インデックス付きビーズの集団を複数の区画にランダムに分配することを含む。
【0055】
いくつかの実施形態では、(d)は、二次インデックス付きビーズの集団を複数の区画にランダムに分配することを含む。
【0056】
いくつかの実施形態では、複数の区画は、ウェル、チャネル、又は液滴から選択される区画を含む。
【0057】
いくつかの実施形態では、複数の組み合わせインデックス付きビーズは、磁気ビーズを含む。
【0058】
いくつかの実施形態はまた、複数の組み合わせインデックス付きビーズをアレイ上に分布させることを含む。いくつかの実施形態はまた、アレイ上の組み合わせインデックス付きビーズを配列決定することを含む。
【0059】
いくつかの実施形態はまた、組み合わせインデックスに基づいて、アレイ上の複数の組み合わせインデックス付きビーズのうちの1つのビーズの位置をデコードする。
【0060】
いくつかの実施形態では、複数の組み合わせインデックス付きビーズの各ビーズは、捕捉プローブを含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、又は第3のポリヌクレオチドは、捕捉プローブを含む。いくつかの実施形態はまた、複数の標的核酸を捕捉プローブにハイブリダイズすることを含む。いくつかの実施形態はまた、捕捉プローブを伸長することを含む。
【図面の簡単な説明】
【0061】
【
図1】プール及び分割戦略を含む組み合わせインデックス付けの例示的な実施形態を示す。
【
図2】リンカー-スプリントを用いた逐次的なスプリントされたライゲーション反応によって、基質に付着した第1のインデックス(インデックスA)、第2のインデックス(インデックスB)、及び第3のインデックス(インデックスC)に接合するスキームの実施形態を示す。
【
図3】クリックケミストリーライゲーションによって、第2のインデックス(インデックスB)を、基質に付着した第1のインデックス(インデックスA)に接合するスキームの一実施形態を示す。
【
図4】逐次的ポリメラーゼ伸長反応によって、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
【
図5】二本鎖領域及び一本鎖オーバーハングを含むアダプターを使用して、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
【
図6】短いリンカー-スプリントを用いた逐次的なスプリントされたライゲーション反応によって、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
【
図7A】ポリメラーゼ伸長のための伸長テンプレート(リンク1a’-インデックスB’-Hyb’)とハイブリダイズした捕捉オリゴヌクレオチド(P5-インデックスA-リンク1a)を有するビーズ、及び捕捉オリゴヌクレオチドの量を測定するのに有用なプライマーの位置、並びに伸長生成物を有するビーズ、及び全長伸長生成物の量を測定するのに有用なプライマーの位置を含む概略図を示す。
【
図7B】捕捉オリゴヌクレオチドの量、及び様々な条件下での捕捉オリゴヌクレオチドのライゲーション伸長又は捕捉オリゴヌクレオチドのポリメラーゼ伸長からの全長生成物の量についてのグラフを示す。
【
図8A】ポリメラーゼ伸長又はライゲーションのいずれかによる捕捉オリゴヌクレオチドの伸長を含む3レベルインデックス付けのための方法において試験される工程及び条件を概説する概略図である。番号付けは、試験した条件に対応する。
【
図8B】スプリントライゲーション(splint ligation、SL)及びポリメラーゼ伸長(polymerase extension、PE)を比較するための様々な実験条件を要約した表であり、レベル1インデックス付け(L1)、レベル2インデックス付け(L2)、及びレベル3インデックス付け(L3)について
図8Aで番号付けされた様々な条件(condition、cond)を含む。
【
図9】様々な条件下での捕捉オリゴヌクレオチド(capture oligonucleotide、CO)、第2のレベルの伸長生成物、及び第3のレベルの伸長生成物の量を示すグラフである。
【
図10】定量PCRによって測定された、ビオチン又は二重デスチオビオチン(dual desthiobiotin、ddbiotin)を介してビーズに付着され、様々な変性条件下で処理された第1の伸長生成物を有する捕捉オリゴヌクレオチドの濃度のグラフである。
【
図11A】3レベルインデックス付け生成物、合成生成物に由来するPCR生成物、及びPCR生成物に由来する配列決定リードを含む、ビーズ上の合成生成物の配列決定リード方向を示す概略図である。
【
図11B】ポリメラーゼ伸長若しくはスプリントライゲーションによって生成された伸長生成物について、完全に正確であるか、又は両方のインデックスが使用可能であるかのいずれかである配列を含む配列決定リードのパーセンテージを示すグラフである。使用可能なインデックスには、インデックスエラー補正履行でデコード補正することができ、3個のヌクレオチドハミング距離で設計されたインデックス内に1つ以下の「SNP」を含み、「インデックス」領域全体にわたって挿入欠失を含まないものが含まれ、例えば、3レベルインデックスオリゴヌクレオチドでは、インデックス領域は、3つのインデックスを含む。
【
図11C】ポリメラーゼ伸長若しくはスプリントライゲーションによって生成された伸長生成物について、完全に正確であるか、又は両方のインデックスが使用可能であるかのいずれかである配列を含む配列決定リードに関して、エラーが欠失、挿入、又は塩基変化(SNP)であるかどうかを含む塩基ごとのエラー率を示すグラフである。使用可能なインデックスには、インデックスエラー補正履行でデコード補正することができ、3ヌクレオチドハミング距離で設計されたインデックス内に1つ以下の「SNP」を含み、「インデックス」領域全体にわたって挿入欠失を含まないものが含まれ、例えば、3レベルインデックスオリゴヌクレオチドでは、インデックス領域は、3つのインデックスを含む。
【
図12A】標準スプリントライゲーション法(左パネル)及び二本鎖スプリントライゲーション法(右パネル)における工程を示す概略図である。いくつかの実施形態では、二本鎖スプリントライゲーション法は、追加のオリゴヌクレオチド(インデックス1’)を含み得る。
【
図12B】標準スプリントライゲーション及び二本鎖スプリントライゲーションのための方法における工程で試験された条件を示す概略図である。
【
図12C】標準ライゲーション又は二本鎖ライゲーションのいずれかからの伸長生成物を測定するための順方向プライマー又は逆方向プライマーの位置を示す概略図である。
【
図13A】定量PCRによって測定された、伸長生成物の濃度を示すグラフである。
図12Cに示されるように、F2及びR1プライマーを用いて捕捉オリゴヌクレオチドを測定し、F2及びR2又はF3及びR2プライマーのいずれかを用いて全長生成物を測定した。
【
図13B】全長対照に対して正規化された伸長生成物の相対濃度を示すグラフである。
【
図13C】捕捉オリゴヌクレオチド濃度に対して正規化された伸長生成物の相対濃度を示すグラフである。
【
図13D】様々な量の二本鎖スプリントオリゴの存在下で生成された伸長生成物の濃度を示すグラフである。
【
図13E】
図12Aに示されるインデックス1に相補的な追加のオリゴヌクレオチドの存在下で生成された伸長生成物の濃度を示すグラフである。
【
図13F】非伸長性3’ddC末端を有するオリゴヌクレオチドの存在下で生成された伸長生成物の濃度を示すグラフである。
【
図13G】室温又は75℃でのライゲーション前の工程で生成された伸長生成物の濃度を示すグラフである。
【
図14A】スプリントライゲーション伸長若しくは二本鎖スプリントライゲーションによって生成された伸長生成物について、完全に正確であるか、又は両方のインデックスが使用可能であるかのいずれかである配列を含む配列決定リードのパーセンテージを示すグラフである。使用可能なインデックスには、インデックスエラー補正履行でデコード補正することができ、3ヌクレオチドハミング距離で設計されたインデックス内に1つ以下の「SNP」を含み、「インデックス」領域全体にわたって挿入欠失を含まないものが含まれ、例えば、3レベルインデックスオリゴヌクレオチドでは、インデックス領域は、3つのインデックスを含む。
【
図14B】スプリントライゲーション伸長又は二本鎖スプリントライゲーションによって生成された伸長生成物の配列決定リードについて、エラーが欠失、挿入、又は塩基変化(SNP)のいずれであるかを含む塩基ごとのエラー率を示すグラフである。
【
図15A】標準スプリントライゲーション法(左パネル)及び二本鎖スプリントライゲーション法(右パネル)についての3レベルインデックス付けにおける工程を示す概略図である。
【
図15B】標準スプリントライゲーション又は二本鎖スプリントライゲーションを用いた3レベルインデックス付けのための方法における工程において試験された条件を示す概略図である。
【
図16A】定量PCRによって測定された、捕捉オリゴヌクレオチドの伸長生成物、第2レベル生成物、及び第3レベル生成物の濃度を示すグラフである。
【
図16B】スプリントライゲーション伸長若しくは二本鎖スプリントライゲーションによって生成された伸長生成物について、完全に正確であるか、又は3つ全てのインデックスが使用可能であるかのいずれかである配列を含む配列決定リードのパーセンテージを示すグラフである。使用可能なインデックスには、インデックスエラー補正履行でデコード補正することができ、3ヌクレオチドハミング距離で設計されたインデックス内に1つ以下の「SNP」を含み、「インデックス」領域全体にわたって挿入欠失を含まないものが含まれ、例えば、3レベルインデックスオリゴヌクレオチドでは、インデックス領域は、3つのインデックスを含む。
【
図16C】スプリントライゲーション伸長又は二本鎖スプリントライゲーションによって生成された伸長生成物の配列決定リードについて、エラーが欠失、挿入、又は塩基変化(SNP)のいずれであるかを含む塩基ごとのエラー率を示すグラフである。
【
図17】標準スプリントライゲーションによる、又は短縮されたスプリントを使用するスプリントライゲーションによる捕捉オリゴヌクレオチドの伸長を示す概略図である(上パネル)。下のパネルは、伸長生成物を測定するためのプライマーの位置を示す。
【
図18A】様々なスプリントオリゴヌクレオチドを示す概略図である。
図18Aに示される配列は、配列番号07~16を含む。
【
図18B】レベル1インデックスを有する捕捉オリゴヌクレオチド(L1オリゴ)、スプリントオリゴヌクレオチド(スプリント)、及びレベル2オリゴヌクレオチド(L2オリゴ)を含む様々な実験条件を示す表である。
【
図18C】様々なスプリントオリゴヌクレオチドを用いたスプリントライゲーション伸長によって生成された伸長生成物についての、対照の全長伸長生成物に対する全長伸長生成物のグラフである。
【
図19A】リンカー配列「KS-3’」及び「MS-3’」を含む二本鎖スプリントライゲーションを含む組み合わせインデックス法の概略図である。
【
図19B】二本鎖スプリントライゲーションを含む組み合わせインデックス法のための例示的なワークフローの概要の模式図である。
【発明を実施するための形態】
【0062】
いくつかの実施形態は、組み合わせインデックス付きビーズを調製するための方法及び組成物に関する。いくつかの実施形態は、ビーズに付着したポリヌクレオチドへの異なるインデックスの逐次付加を含む。いくつかの実施形態では、インデックスは、化学的ライゲーション、ポリメラーゼ伸長、部分的二本鎖アダプターのライゲーション、又は短いスプリントライゲーションによって付加される。
【0063】
各ビーズが単一のオリゴヌクレオチド配列で均一にコーティングされているビーズ連結オリゴヌクレオチドのプールは、合成ロングリード配列決定などの配列決定法の構成要素である。そのようなビーズプールの組み合わせアセンブリは、十分なインデックス多様性を達成するために使用され得るが、しかしながら、いくつかの方法は、インデックスの連続的なレベルを接合するために、スプリントされたライゲーション戦略に依存する。スプリントライゲーションは、ビーズコードに不変塩基を導入し、完全なビーズコードを読み取るのに必要な合成による配列決定(sequencing by synthesis、SBS)サイクルの数を増加させるという欠点を有する。本明細書で提供される特定の実施形態は、ビーズコード中の不変塩基の数を低減させ、ビーズコード情報密度を増加させ、より効率的なビーズコード配列決定を可能にする、標準スプリントライゲーションビーズコード合成戦略に対するいくつかの代替法を含む。
【0064】
ビーズ連結オリゴヌクレオチドの組み合わせアセンブリは、各ビーズが単一の固有インデックスオリゴヌクレオチドで均一にコーティングされている多数の固有インデックスを含有するビーズプールの生成を可能にする。表面付着ストレプトアビジンなどのオリゴヌクレオチド捕捉のために誘導体化された磁気ビーズの共通プールから開始して、ビーズをマルチウェルプレートの「M」個のウェルに等分し、各ウェルは、ビオチンなどのビーズ捕捉部分を用いて合成された単一オリゴヌクレオチド配列を含有する。結合後、ビーズを再びプールし、混合し、マルチウェルプレートの「N」個のウェルに分割して、第2のレベルのインデックスを付着させる。第2のインデックス反応における各ウェルは、第1のレベルのオリゴヌクレオチドの均一な混合物を含有するので、固有インデックスの総数は、第2のインデックスが付着された後に「M」×「N」になる。このプロセスを複数回繰り返すことにより、標準的なマルチウェルプレート、例えば、96ウェルプレート、192ウェルプレート、又は384ウェルプレートに容易に適合し得る個々のインデックスオリゴヌクレオチドの小さなセットから、数百万の固有インデックスを有するビーズプールが得られ得る。プール及び分割戦略を含む組み合わせインデックス付けの例示的な実施形態を
図1に示す。
【0065】
直接捕捉された第1のレベルを超えるインデックスについては、一本鎖インデックスオリゴヌクレオチドをビーズに結合したインデックスに共有付着させる方法が必要である。これは、長いスプリントライゲーションアプローチを用いて行うことができる(
図2)。直接捕捉された第1のレベルのオリゴヌクレオチドは、その3’末端に8個のヌクレオチドの捕捉配列(L1A)を有するように設計され、入ってくるインデックスオリゴヌクレオチドは、その5’末端に第2の8個のヌクレオチドの捕捉配列(L1B)、並びに5’末端にリン酸を有する。いくつかの実施形態では、LIA及び/又はLIBは、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、又は20個以上のヌクレオチドの長さを有し得る。次いで、これらの2つの片を、3’末端のL1A及び5’末端のL1Bに相補的である16個のヌクレオチドのスプリントオリゴヌクレオチドとのライゲーション反応において組み立てられ、結合スプリントは、ビーズに結合した捕捉オリゴヌクレオチド及び溶液中インデックスオリゴヌクレオチドの両方とハイブリダイズし、2つの片の3’末端及び5’末端を互いに直接隣接させる。次いで、反応中のリガーゼ酵素が、インデックスオリゴヌクレオチドのリン酸化された5’末端を捕捉オリゴの3’末端に共有結合させる。表1は、特定の方法において、12、96、192、又は384及び768マルチウェルプレートを使用して得ることができる固有ビーズコードの数を列挙する。いくつかのそのような方法は、以下を含む:(a)ビーズを第1のマルチウェルプレートのウェルに分配することであって、各ウェルが、異なるインデックスAを含有する、分配することと、インデックスAをビーズに付着させることと、ビーズをプールすることと、(b)ビーズを第2のマルチウェルプレートのウェル内に再分配することであって、各ウェルが、異なるインデックスBを含有する、再分配することと、インデックスBをビーズに付着させることと、(c)ビーズを第3のマルチウェルプレートのウェル内に再分配することであって、各ウェルが、異なるインデックスCを含有する、再分配することと、インデックスCをビーズに付着させること。
【0066】
【0067】
スプリントされたライゲーションアプローチは、ビーズコード中のインデックスの各レベルについて可変インデックス領域間に16個のヌクレオチドの不変スプリント配列を必要とする。ビーズコードは、典型的には単一リードで配列決定されるので、これらの不変領域は、SBS中の「暗」サイクルなどの化学のみのサイクルで読み取られなければならない。例えば、不変領域中の各塩基は、正しいフェージングを維持するために追加のSBSサイクルを必要とする。これらは、典型的には、「化学のみ」又は「暗」のSBSサイクルであり、重合化学工程が画像化工程なしで使用される。8個のヌクレオチドの個々のサブインデックスを有する3レベルインデックスの場合、これは、情報インデックス配列の24個のヌクレオチドを配列決定するだけのために、少なくとも32の合計暗サイクルが必要であることを意味する。この多数のサイクルは、インデックス配列及び任意の後続のインサート配列決定リードの両方について、リード品質の低下をもたらすことが観察されている。
【0068】
本明細書で提供される特定の実施形態は、不変塩基の数を低減するための長いスプリントライゲーション戦略に加えて、ビーズコード合成戦略を含み、その結果、ビーズコードを読み取るのに必要な化学のみのSBSサイクルを含む。いくつかのそのような実施形態は、アジド-アルキンクリックケミストリーを使用する化学ライゲーションによるビーズコード合成、テンプレートポリメラーゼ伸長によるビーズコード合成、二本鎖断片の酵素的ライゲーションによるビーズコード合成、及び非標準ヌクレオチドを含有する短いスプリントでのスプリントされたライゲーションによるビーズコード合成を含む。
【0069】
本明細書で提供されるいくつかの実施形態は、アレイ上でのハイスループット遺伝子型決定に関する。いくつかの実施形態は、アレイ内の微小特徴部(マイクロフィーチャ)の位置をデコードすることに関する。いくつかの実施形態では、微小特徴部は、バーコード及びインデックスを有するポリヌクレオチドを含む。いくつかの実施形態は、バーコード及びインデックスを配列決定して、アレイ内のポリヌクレオチドの位置を識別することを含む。本明細書に開示される方法及び組成物に有用であり得る特定の態様は、その全体が参照により組み込まれる国際公開第2020/086746号に開示されている。
【0070】
ハイブリダイゼーションによるデコードは、捕捉プローブのランダムに分配されたアレイ内の捕捉プローブの位置を識別することを含む。この方法は、典型的には、標識されたハイブリダイゼーションプローブを捕捉プローブの1つ又はそれ以上の部分にハイブリダイズし、ハイブリダイゼーションイベントを撮像し、ハイブリダイゼーションプローブを除去する、数回の連続的なサイクルを伴う。ハイブリダイゼーションによるデコードは、特殊な試薬、特殊な流体デバイス、及び特殊な検出器を必要とする。いくつかの実施形態では、ハイブリダイゼーションによるデコードは、7~8回の連続的なサイクルとともに最大8時間かかり得る。
【0071】
本明細書で提供される実施形態は、プライマー結合部位及びバーコードを含むポリヌクレオチドのランダムに分配されたアレイを含む。いくつかの実施形態では、バーコードは、ハイスループット配列決定システムを使用してアレイをデコードするために、容易に配列決定することができる。いくつかの実施形態は、追加の試薬、ハイブリダイゼーションプローブ、又は特殊なデコーディング機器なしで、アレイをデコードするためにかかる時間を大幅に短縮することができる。
【0072】
いくつかの実施形態は、次世代配列決定(next generation sequencing、NGS)技術及びビーズベースのマイクロアレイの使用を含む。いくつかのこのような実施形態は、基質及び試薬に対するわずかな改変とともに一般的なNGS配列決定プラットフォーム上で実行することができる、高性能、低コスト、かつハイスループットの遺伝子型決定アッセイをもたらす。
【0073】
いくつかの実施形態は、「S」個のウェルを含有するマルチウェルプレートにS個のビーズプールがロードされている遺伝子型決定アッセイを行うことを含み、各ビーズプールは、固有の試料インデックスを有し、各ウェルは、「N」個の固有のビーズタイプを含有する。ランダムプライマー増幅、その後の酵素的断片化、及びクリーンアップを含む工程で核酸試料を処理するなど、試料からの核酸ライブラリ生成後、各試料ライブラリは、インデックス付きウェルに付加され、捕捉プローブにハイブリダイズされる。ハイブリダイゼーションが完了した後、蛍光ヌクレオチド及び適切なポリメラーゼを含むインコーポレーションミックスを添加することにより、対象となるSNPをプローブするための一塩基伸長アッセイが実行される。この取り込みの最後に、プレート内の全てのビーズ捕捉試料がプールされ、フローセルにロードされる。フローセルは、そのままにすることも、パターン化することもでき、表面は、ビーズの固定化を所望の密度で支持するように適切に修正することができる。いくつかの実施形態では、ビーズ固定化時に、SNP部位での蛍光インコーポレーション由来のシグナルを読み取るための1回のスキャンサイクルを含むSNPリードアウトが実施される。このサイクルは、器具上でのSBSサイクルを含んでもよい。また、フローセル内の特定のビーズの捕捉プローブ及び位置を識別するために、ビーズプールの複雑さに応じて、12~20回のSBSサイクルを含むバーコードリードアウトも実施される。いくつかの実施形態では、この工程は、識別されたSNPを通り越して配列決定する追加のサイクルによって置き換えることができる。また、試料インデックスを読み取るための6~12回のSBSサイクルを含む試料インデックスリードアウトも実施される。いくつかの実施形態では、フローセル上のアッセイ全体は、約30回未満のSBSサイクルを含むことができ、4時間未満で実行することができる。
【0074】
定義
本明細書で使用される場合、「核酸」は、当技術分野におけるその使用と一致することを意図し、天然に存在する核酸又はその機能的類似体を含む。特に有用な機能的類似体は、配列特異的な様式で核酸にハイブリダイズすることができ、又は特定のヌクレオチド配列を複製するためのテンプレートとして使用することができる。天然に存在する核酸は、一般に、ホスホジエステル結合を含有するバックボーンを有する。アナログ構造は、当技術分野において既知の様々なもののいずれかを含む、代替的バックボーン結合を有することができる。天然に存在する核酸は、一般に、デオキシリボース糖(例えば、デオキシリボ核酸(deoxyribonucleic acid、DNA)に見られる)又はリボース糖(例えば、リボ核酸(ribonucleic acid、RNA)に見られる)を有する。核酸は、当技術分野において既知のこれらの糖部分の様々な類似体のいずれかを含有することができる。核酸は、天然又は非天然塩基を含み得る。この点に関して、天然デオキシリボ核酸は、アデニン、チミン、シトシン、又はグアニンからなる群から選択される1つ以上の塩基を有することができ、リボ核酸は、ウラシル、アデニン、シトシン、又はグアニンからなる群から選択される1つ以上の塩基を有することができる。核酸に含まれ得る有用な非天然塩基は、当技術分野において既知である。非天然の塩基の例としては、ロックド核酸(locked nucleic acid、LNA)及び架橋核酸(bridged nucleic acid、BNA)が挙げられる。LNA及びBNA塩基をDNAオリゴヌクレオチドに組み込んで、オリゴヌクレオチドのハイブリダイゼーション強度及び特異性を高めることができる。LNA及びBNA塩基、並びにそのような塩基の使用は、当業者に既知であり、日常的である。
【0075】
本明細書で使用される場合、「ヌクレオチド類似体」という用語は、修飾ヌクレオチド塩基部分、修飾ペントース部分、及び/又は修飾リン酸部分、並びにポリヌクレオチドの場合、修飾ヌクレオチド間結合を有する合成類似体を指す。修飾ヌクレオチド間結合としては、リン酸類似体、アキラル及び非荷電サブユニット間結合を有する類似体、並びにアキラルサブユニット間結合を有する非荷電モルホリノベースのポリマーが挙げられる。一部のヌクレオチド間結合類似体は、モルホリデート、アセタール、及びポリアミド結合複素環を含む。リン酸類似体の例は、ホスホロチオエート、ホスホロジチオエート、ホスホロセレノエート、ホスホロジセレノエート、ホスホロアニロチオエート、ホスホラニリデート、ホスホルアミデート、ボラノホスフェートが含まれ、そのような対イオンが存在する場合、関連する対イオン、例えば、H+、NH4+、Na+を含むが、それらに限定されない。修飾されたヌクレオチド塩基部分の例は、5-メチルシトシン(5mC);C-5プロピニル-C及びC-5プロピニル-Uを含むがそれらに限定されないC-5-プロピニル類似体;2,6-ジアミノプリン(2-アミノアデニン又は2-アミノ-dAとしても知られる);ヒポキサンチン、シュードウリジン、2-チオピリミジン、イソシトシン(isoC)、5-メチルisoC、及びイソグアニン(isoG)を含むがこれらに限定されない。修飾ペントース部分の例としては、Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA、及びT-LNAを含むロックド核酸(LNA)類似体、並びに2’位又は3’位が水素、ヒドロキシ、アルコキシ(例えば、メトキシ、メトキシ-エチル、-O-メチル、エトキシ、アリルオキシ、イソプロポキシ、ブトキシ、イソブトキシ、及びフェノキシ)、アジド、アミノ、アルキルアミノ、フルオロ、クロロ、又はブロモである2’修飾又は3’修飾が挙げられるが、これらに限定されない。他の例としては、2-アミノプリン;5-ブロモデュ、デオキシウリジン、デオキシイノシン、ヒドロキシメチルdC、5-メチルdC、5-ニトロインドール、5-ヒドロキシブチン-2’-デオキシウリジン、及び8-アザ-7-デアザグアノシンが挙げられる。
【0076】
本明細書で使用される場合、「ターゲット」は、核酸に関して使用する場合、本明細書に記載の方法又は組成物の文脈における核酸の意味的識別子として意図され、別途明示的に示されるもの以外の核酸の構造又は機能を必ずしも限定するものではない。標的核酸は、本質的に既知又は未知の配列の任意の核酸であってもよい。それは、例えば、ゲノムDNA又はcDNAの断片であってもよい。配列決定は、標的分子の全体又は一部の配列の決定をもたらし得る。標的は、核又は無細胞の試料などの一次核酸試料に由来し得る。一実施形態では、標的は、各標的断片の末端にユニバーサル配列を配置することによって増幅に好適なテンプレートに処理することができる。標的はまた、cDNAへの逆転写によって一次RNA試料から得ることもできる。
【0077】
本明細書で使用される場合、「ユニバーサル」は、ヌクレオチド配列を記述するために使用する場合、2つ以上の核酸分子に共通する配列の領域を指し、分子はまた、互いに異なる配列の領域を有する。分子の集合の異なるメンバーに存在するユニバーサル配列は、ユニバーサル捕捉核酸の集団、例えば、ユニバーサル配列の一部に相補的な捕捉オリゴヌクレオチド、例えば、ユニバーサル捕捉配列を使用して、複数の異なる核酸を捕捉することができる。ユニバーサル捕捉配列の非限定的な例としては、P5及びP7プライマーと同一又は相補的な配列が挙げられる。同様に、分子の集合の異なるメンバーに存在するユニバーサル配列は、ユニバーサル配列の一部に相補的なユニバーサルプライマーの集団、例えば、ユニバーサルアンカー配列を使用して、複数の異なる核酸を増幅又は複製(例えば、配列決定)することができる。したがって、捕捉オリゴヌクレオチド又はユニバーサルプライマーは、ユニバーサル配列に特異的にハイブリダイズすることができる配列を含む。ハイブリダイズする2つのユニバーサル配列は、ユニバーサル結合対と称される。例えば、ハイブリダイズする捕捉オリゴヌクレオチド及びユニバーサル捕捉配列は、ユニバーサル結合対である。
【0078】
本明細書で使用される場合、「P5」及び「P7」は、プライマー配列又はプライマー結合部位を指す場合に使用され得る。「P5’」(P5プライム)及び「P7’」(P7プライム)という用語は、それぞれP5及びP7の相補体を指す。本明細書に提示される方法において、任意の好適な増幅プライマーを使用することができ、P5及びP7の使用は、例示的な実施形態のみであることが理解されるであろう。フローセル上でのP5及びP7などの増幅プライマーの使用は、各々その全体が参照により本明細書に組み込まれる国際公開第2007/010251号、同第2006/064199号、同第2005/065814号、同第2015/106941号、同第1998/044151号及び同第2000/018957号の開示によって例示されるように、技術分野において既知である。例えば、任意の好適な順方向増幅プライマーは、固定化されているか又は溶液中にあるかに関わらず、相補的配列及び配列の増幅のために本明細書に提示される方法において有用であり得る。同様に、任意の好適な逆増幅プライマーは、固定化されているか又は溶液中にあるかに関わらず、相補的配列及び配列の増幅のために本明細書に提示される方法において有用であり得る。当業者であれば、本明細書に提示される核酸の捕捉及び/又は増幅に好適なプライマー配列の設計及び使用方法を理解するであろう。
【0079】
本明細書で使用される場合、「区画」は、何かを他の物から分離又は単離する面積又は容積を意味することを意図する。例示的な区画としては、バイアル、チューブ、ウェル、液滴、ボーラス、ビーズ、容器、表面特色、又は流体流、磁性、電流などの物理的な力によって分離された面積又は容積が挙げられる。一実施形態では、区画は、96又は384ウェルプレートなどのマルチウェルプレートのウェルである。
【0080】
本明細書で使用される場合、「プライマー」という用語及びその派生語は、一般に、対象とするターゲット配列にハイブリダイズすることができる任意の核酸を指す。典型的には、プライマーは、基質として機能し、その上に、ヌクレオチドは、ポリメラーゼによって重合され得る。いくつかの実施形態では、プライマーは、合成された核酸鎖に組み込まれ、別のプライマーがハイブリダイズして、合成された核酸分子に相補的な新たな鎖合成をプライムすることができる部位を提供することができる。プライマーは、ヌクレオチド又はその類似体の任意の組み合わせを含み得る。いくつかの実施形態では、プライマーは、一本鎖オリゴヌクレオチド又はポリヌクレオチドである。「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語とは、任意の長さのヌクレオチドのポリマー形態を指すために本明細書において交換可能に使用され、リボヌクレオチド、デオキシリボヌクレオチド、これらの類似体、又はこれらの混合物を含み得る。これらの用語は、同等物として、ヌクレオチド類似体から作製されたDNA又はRNAのいずれかの類似体を含み、一本鎖(センス又はアンチセンスなど)及び二本鎖ポリヌクレオチドに適用可能であることを理解されたい。本明細書で使用するこの用語はまた、例えば逆転写酵素の作用によって、RNAテンプレートから生成される相補的又はコピーDNAであるcDNAも包含する。この用語は、分子の一次構造のみを指す。したがって、この用語は、三本鎖、二本鎖、及び一本鎖デオキシリボ核酸(「DNA」)、並びに三本鎖、二本鎖、及び一本鎖リボ核酸(「RNA」)を含む。
【0081】
本明細書で使用される場合、「アダプター(adaptor)」又は「アダプター(adapter)」及びその派生語、例えば、ユニバーサルアダプターは、一般に、核酸分子にライゲーションされ得るか、又はライゲーション反応においてスプリントを形成することができる任意の線状オリゴヌクレオチドを指す。いくつかの実施形態では、アダプター又はアダプターの一部は、標的核酸のリンカー領域などの標的配列の3’末端又は5’末端に実質的に相補的又は相補的である。一般に、アダプターは、ヌクレオチド及び/又は核酸の任意の組み合わせを含み得る。いくつかの態様では、アダプターは、1つ以上の位置に1つ以上の切断可能な基を含み得る。別の態様では、アダプターは、プライマー、例えばユニバーサルプライマーの少なくとも一部と実質的に同一であるか、又は実質的に相補的である配列を含み得る。いくつかの実施形態では、アダプターは、下流エラー補正、同定、又は配列決定を支援するために、バーコード又はタグを含み得る。「アダプター(adaptor)」及び「アダプター(adapter)」という用語は、交換可能に使用される。
【0082】
本明細書で使用される場合、「アレイ」は、相対的な位置に従って互いに区別することができる部位の集団を指す。アレイの異なる部位にある異なる分子は、アレイ内の部位の位置に従って互いに区別することができる。アレイの個々の部位は、特定の種類の1つ以上の分子を含み得る。例えば、部位は、特定の配列を有する単一の標的核酸分子を含むことができ、又は部位は、同じ配列(及び/又はその相補的配列)を有するいくつかの核酸分子を含むことができる。アレイの部位は、同じ基質上に位置する異なる特徴とすることができる。例示的な特徴としては、基質中のウェル、基質中又は基質上のビーズ(又は他の粒子)、基質からの突出部、基質上の隆起部、又は基質内のチャネルが挙げられるが、これらに限定されない。アレイの部位は、それぞれ異なる分子を有する別個の基質とすることができる。別個の基質に付着した異なる分子は、基質が会合する表面上の基質の位置に従って、又は液体若しくはゲル内の基質の位置に従って特定することができる。別個の基質が表面上に位置する例示的なアレイとしては、ウェル内にビーズを有するものが挙げられる。いくつかの実施形態では、アレイは、フローセル上に位置することができる。
【0083】
組み合わせインデックス付け
本明細書で提供される方法及び組成物のいくつかの実施形態は、ビーズに付着した第1のポリヌクレオチドがインデックスの逐次付加によって伸長される、組み合わせインデックス付けによるインデックス付きビーズの調製を含む。いくつかの実施形態では、一本鎖DNAポリヌクレオチドなどの第1のポリヌクレオチドは、化学ライゲーションによって、ポリメラーゼ伸長によって、第2のポリヌクレオチド及び一本鎖オーバーハングを含む二本鎖アダプターのライゲーションによって、又はスプリントライゲーションによってなどを含む様々な方法によって、インデックスを含む一本鎖DNAポリヌクレオチドなどの第2のポリヌクレオチドで伸長される。
【0084】
いくつかの実施形態は、分割及びプールインデックス付けを含む。例えば、第1のビーズの集団は、第1の複数の亜集団に分割され、第1のインデックスを含む第1のポリヌクレオチドをビーズに付着させることによって、異なる第1のインデックスが各亜集団に付加され、亜集団が組み合わされて、第2のビーズの集団が得られる。第2のビーズの集団は、第2の複数の亜集団に分割され、付着した第1のポリヌクレオチドを、第2のインデックスを含むポリヌクレオチドで伸長することによって、異なる第2のインデックスが各亜集団に付加され、亜集団が組み合わされて、第3のビーズの集団が得られる。第3のビーズ集団は、第3の複数の亜集団に分割され、第2のポリヌクレオチドを、第3のインデックスを含むポリヌクレオチドで伸長することによって、異なる第3のインデックスが各亜集団に付加され、亜集団が組み合わされて、第4のビーズの集団が得られる。集団を亜集団に分割し、各亜集団に異なるインデックスを付加することを繰り返して、更により多様な組み合わせインデックスを生成することができる。
【0085】
複数の組み合わせインデックス付きビーズを調製するためのいくつかの実施形態は、(a)第1のインデックスを含む第1のポリヌクレオチドを含む一次インデックス付きビーズの集団を得ることであって、一次インデックス付きビーズの集団が、複数の第1のインデックス付きビーズの亜集団を含み、第1のインデックス付きビーズの亜集団が、互いに異なる第1のインデックスを含む、一次インデックス付きビーズの集団を得ることと、(b)一次インデックス付きビーズの集団を複数の第2のビーズの亜集団に分割することと、(c)二次インデックス付きビーズの集団を得ることであって、(i)複数の第2のビーズの亜集団の第1のポリヌクレオチドを、第2のインデックスを含む第2のポリヌクレオチドで伸長して、第2のインデックス付きビーズの亜集団を得ることであって、インデックス付きビーズの第2の亜集団が、互いに異なる第2のインデックスを含む、第2のインデックス付きビーズの亜集団を得ることと、(ii)第2のインデックス付きビーズの亜集団を組み合わせて、二次インデックス付きビーズの集団を得ることと、を含む、二次インデックス付きビーズの集団を得ることと、を含む。
【0086】
いくつかの実施形態はまた、(d)二次インデックス付きビーズの集団を複数の第3のビーズの亜集団に分割することと、(e)三次インデックス付きビーズの集団を得ることであって、(i)複数の第3のビーズの亜集団の第2のポリヌクレオチドを、第3のインデックスを含む第3のポリヌクレオチドで伸長して、第3のインデックス付きビーズの亜集団を得ることであって、第3のインデックス付きビーズの亜集団が、互いに異なる第3のインデックスを含む、第3のインデックス付きビーズの亜集団を得ることと、(ii)第3のインデックス付きビーズの亜集団を組み合わせて、三次インデックス付きビーズの集団を得ることと、を含む、三次インデックス付きビーズの集団を得ることと、を含む。いくつかの実施形態はまた、(d)及び(e)を繰り返すことと、追加のインデックスをインデックス付きビーズの亜集団に付加して、更により多様な組み合わせインデックスを生成することと、を含む。
【0087】
いくつかの実施形態では、第1のインデックスを含む第1のポリヌクレオチドを含む一次インデックス付きビーズの集団を得ることは、(i)第1のポリヌクレオチドを複数の第1のビーズの亜集団に付着させて、第1のインデックス付きビーズの亜集団を得ることであって、第1のポリヌクレオチドが、第1のビーズの亜集団ごとに異なる第1のインデックスを含む、第1のインデックス付きビーズの亜集団を得ることと、(ii)第1のインデックス付きビーズの亜集団を組み合わせて、一次インデックス付きビーズの集団を得ることと、を含む。いくつかの実施形態では、第1のポリヌクレオチドは、第1の結合パートナー及び第2の結合パートナーを介して、複数の第1のビーズの亜集団のうちの1つのビーズに付着される。いくつかの実施形態では、第1の結合パートナー又は第2の結合パートナーは、ビオチン、ストレプトアビジン、ビオチン誘導体、ストレプトアビジン誘導体、抗体、及び抗体の抗原結合断片からなる群より選択される。いくつかの実施形態では、第1のポリヌクレオチドは、共有付着によって、例えば化学反応を介してビーズに付着される。
【0088】
いくつかの実施形態では、第1のポリヌクレオチドは、プライマー結合部位を含む。プライマー結合部位の例としては、P5配列、P5’配列、P7配列、及びP7’配列を挙げることができる。P5プライマー:AAT GAT ACG GCG ACC ACC GA(配列番号01)、及びP7プライマー:CAA GCA GAA GAC GGC ATA CGA GAT(配列番号02)。いくつかの実施形態では、第1のポリヌクレオチドは、切断可能なリンカーを含む。いくつかの実施形態では、第1のポリヌクレオチドは、ユニバーサル配列を含む。
【0089】
いくつかの実施形態では、第1のインデックス、第2のインデックス、及び/又は第3のインデックスは、100、90、80、70、60、50、40、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2個の連続するヌクレオチドを超える、それ未満の、若しくはそれに等しい長さ、又は前述の数のいずれか2つの範囲内の長さを有する。いくつかの実施形態では、インデックス又はインデックスの組み合わせを使用して、付着した核酸などの要素、又はビーズをタグ付けすることができる。本明細書で提供される実施形態により有用な特定の方法及び組成物は、各々その全体が参照により組み込まれる米国特許出願公開第2018/0023119号及び同第2018/0355348号に開示されている。
【0090】
いくつかの実施形態では、一次インデックス付きビーズの集団又は二次インデックス付きビーズの集団などのインデックス付きビーズの集団を分割することは、インデックス付きビーズの集団を複数の区画にランダムに分配することを含み得る。いくつかの実施形態では、複数の区画は、ウェル、チャネル、又は液滴から選択される区画を含む。いくつかの実施形態では、複数の区画は、96ウェルプレート、192ウェルプレート、又は384ウェルプレートを含む。いくつかの実施形態では、フローセルは、複数の区画を含む。
【0091】
いくつかの実施形態では、複数のビーズは、磁気ビーズを含む。
【0092】
いくつかの実施形態はまた、複数の組み合わせインデックス付きビーズをアレイ上に分布させることを含む。いくつかの実施形態では、複数の組み合わせインデックス付きビーズは、アレイ上にランダムに分布している。
【0093】
いくつかの実施形態はまた、組み合わせインデックス付きビーズを配列決定することを含む。例えば、ビーズの組み合わせインデックス又はその相補体を配列決定することができる。いくつかの実施形態では、組み合わせインデックス又はその相補体は、アレイ上で配列決定することができる。いくつかの実施形態では、配列決定は、合成による配列決定(SBS)を含み得る。本明細書で提供される方法及び組成物との使用に容易に適合させ得る例示的なSBS手順、流体システム、及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、米国特許第7,329,492号、米国特許第7,211,414号、米国特許第7,315,019号、米国特許第7,405,281号に記載されており、それらの各々は、参照により本明細書に組み込まれる。いくつかの実施形態はまた、ビーズの組み合わせインデックスに基づいて、アレイ上の複数の組み合わせインデックス付きビーズのうちの1つのビーズの位置をデコードすることを含む。
【0094】
いくつかの実施形態では、複数の組み合わせインデックス付きビーズのうちの1つのビーズは、捕捉プローブを含む。いくつかの実施形態では、第1のポリヌクレオチド、第2のポリヌクレオチド、又は第3のポリヌクレオチドは、捕捉プローブを含む。いくつかの実施形態はまた、標的核酸を捕捉プローブにハイブリダイズすることを含む。いくつかの実施形態はまた、捕捉プローブを伸長することを含む。
【0095】
化学ライゲーションを含む組み合わせインデックス付け
本明細書で提供される方法及び組成物のいくつかの実施形態は、ビーズに付着したポリヌクレオチドが、化学ライゲーションによるインデックスの逐次付加によって伸長される、組み合わせインデックス付けによるインデックス付きビーズの調製を含む。本明細書で提供される実施形態により有用な特定の方法及び組成物は、その全体が参照により組み込まれる米国特許出願公開第2018/0127816号に開示されている。
【0096】
いくつかの実施形態では、化学ライゲーションによるインデックスの逐次付加は、インデックスオリゴヌクレオチド又はポリヌクレオチドの連続レベルを共有結合させるための銅触媒アジド-アルキン環化付加「クリック」反応(CuAAC)を含む(
図3)。クリックケミストリーは、DNAオリゴヌクレオチドと適合性があり、環状トリアゾール生成物は、DNAに存在するホスホジエステル結合と同様の寸法を有する。DNA中に存在するホスホジエステル結合と同様の寸法の環状トリアゾール生成物は、トリアゾール結合を、多くのDNAポリメラーゼにとって実行可能なテンプレートにし、トリアゾール含有DNA鎖は、ポリメラーゼ連鎖反応(polymerase chain reaction、PCR)を含む方法によって増幅することができる。化学ライゲーションの利点としては、異なる一本鎖ポリヌクレオチドの末端が、過剰のインデックスオリゴヌクレオチド又はポリヌクレオチドを使用し、最終的なビーズコード又は組み合わせインデックス内の全ての又はほんの一握りの不変塩基位置を排除することによって、スプリントオリゴヌクレオチド又はスプリントアダプターの非存在下で接合され得る方法が挙げられる。加えて、CuAAC反応は、代替の溶媒中及び非標準温度で行うことができるので、酵素的ライゲーション工程の不在は、反応条件の柔軟性を増加させる。
【0097】
いくつかの実施形態では、ビーズコード又は組み合わせインデックス合成のための化学ライゲーションは、2段階合成戦略を含む。ビーズコードの第1のレベルに関して、第1のインデックスを含む第1のポリヌクレオチドなどの最初の捕捉オリゴヌクレオチドは、3’末端にCuAACハンドル(アジド又はアルキン)を伴って生成され、このオリゴヌクレオチドは、5’-ビオチン/ストレプトアビジンなどの結合パートナーを介して磁気ビーズに結合される。ビーズコードの第2のレベルについては、3’-アジド/5’アルキン又は3’-アルキン/5’-アジドなどの同族CuAACハンドルを有する、第2のインデックスを含む第2のポリヌクレオチドなどの過剰なインデックスオリゴヌクレオチドが、銅触媒とともに、ビーズに結合した第1のポリヌクレオチドに付加される。いくつかの実施形態では、第2のインデックスを含むポリヌクレオチドは、5’末端上のクリックハンドルのみを有するであろう。反応が完了したら、ビーズはペレット化され、残りのCuAAC試薬は、洗い流される。これは、第1のポリヌクレオチドと第2のポリヌクレオチドの間などのインデックスレベル間に本質的に「瘢痕のない」接合部をもたらし、レベルを分離する不変塩基はない。
【0098】
いくつかの実施形態では、第3のインデックスを含む第3のポリヌクレオチドを付着させることは、5’末端及び3’末端の両方に相補的クリックハンドルを有するように合成された第2のポリヌクレオチドの使用を含み得るが、しかしながら、これは、長いコンカテマーの形成をもたらし得る。コンカテマーの形成を回避しながら追加のインデックスレベルを付加するために、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)などの酵素を使用して、デオキシリボースの3’OH位にクリックハンドルを含有する単一塩基を、組み立てられた2レベルビーズコードの3’末端に挿入する。TdTは、ヌクレオチド三リン酸を一本鎖オリゴヌクレオチドの3’末端にほとんど特異性を有さずに付着させるが、クリックハンドルが3’OHをブロックするので、単一塩基のみが各オリゴに付着される。TdTを洗い流した後、同一の手順を使用して、最初の2つのオリゴヌクレオチドの結合に追加のインデックスレベルが付加される。クリック反応は、100%の効率を有さない場合があるので、更なるライゲーションをブロックして、「スキップされた」レベルを有する組み合わせインデックスを回避することができる。これは、相補的クリックハンドルを含有する小分子を付加して、任意の未反応の3’基をブロックすることによって達成される。
【0099】
いくつかの実施形態では、化学ライゲーションは、反応に必要なオリゴヌクレオチドの量を低減させるために、スプリントされたライゲーション戦略において使用され得る。化学ライゲーションは、非標準ヌクレオチドの使用に適合する。より高いハイブリダイゼーション特異性を有する特定の非標準ヌクレオチドの使用は、より短いスプリントオリゴヌクレオチドを可能にする。例えば、ペプチド核酸(peptide nucleic acid、PNA)、ロックド核酸(LNA)、又は2’-OMe塩基などの修飾ヌクレオチドは、長さを付加することなくオリゴヌクレオチドの融解温度を上昇させることができる。
【0100】
図3は、クリックケミストリーライゲーションによって、第2のインデックス(インデックスB)を、基質に付着した第1のインデックス(インデックスA)に接合するスキームの一実施形態を示す。
図3に示されるように、P5配列及びインデックスAを含む第1のポリヌクレオチドは、ビオチン/ストレプトアビジン結合対を介してビーズに接合される。例えば、ビーズは、ビオチンでコーティングされており、第1のポリヌクレオチドは、ストレプトアビジンに連結された5’末端を含み、又はビーズは、ストレプトアビジンでコーティングされており、第1のポリヌクレオチドは、ビオチンに連結された5’末端を含む。第1のポリヌクレオチドは、プロパルギル部分を有する3’末端を含む。第2のポリヌクレオチドは、インデックスB及びアジド部分を有する5’末端を含む。銅触媒クリック反応は、第1及び第2のポリヌクレオチドの接合をもたらす。最初にビーズ連結ポリヌクレオチドをTdTで処理して、プロパルギル部分を含む単一ヌクレオチドを付加することによって、追加のポリヌクレオチドは、第2のポリヌクレオチドの3’末端に付加される。アジド部分を有する5’末端を含む追加のポリヌクレオチドを使用して、追加のクリック反応を介してビーズ連結ポリヌクレオチドを更に伸長することができる。
【0101】
いくつかの実施形態は、化学ライゲーション反応によって、ビーズ連結された第1のポリヌクレオチドなどの第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することを含む。いくつかの実施形態では、第1のポリヌクレオチドは、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’-修飾デオキシヌクレオチド(dNTP)を含む。いくつかの実施形態では、第2のポリヌクレオチドは、3’官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾ヌクレオチドを含む。いくつかの実施形態では、3’官能性部分及び5’官能性部分は、互いに反応して、修飾バックボーン結合を形成することができる。
【0102】
いくつかの実施形態では、第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することにより、二次インデックス付きポリヌクレオチドを得、本方法は、二次インデックス付きポリヌクレオチドを修飾して、クリックケミストリー反応に関与することができる3’官能性部分を含む末端3’修飾ヌクレオチドを含む修飾ポリヌクレオチドを得ることを更に含む。いくつかの実施形態では、修飾することは、二次インデックス付きポリヌクレオチドをテンプレート非依存性ポリメラーゼと接触させることを含む。いくつかの実施形態では、テンプレート非依存性ポリメラーゼは、末端デオキシヌクレオチジルトランスフェラーゼ(TdT)、ポリAポリメラーゼ、又はCCA付加RNAポリメラーゼから選択される。いくつかの実施形態では、テンプレート非依存性ポリメラーゼは、TdTである。
【0103】
いくつかの実施形態はまた、化学ライゲーション反応によって、修飾ポリヌクレオチドを第3のポリヌクレオチドで伸長することを含み、第3のポリヌクレオチドは、3’官能性部分とのクリックケミストリー反応に関与することができる適合性5’官能性部分を含む末端5’修飾ヌクレオチドを含む。
【0104】
いくつかの実施形態では、3’官能性部分は、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される。いくつかの実施形態では、5’官能性部分は、3’官能性部分とは異なり、かつ3’官能性部分と適合性があり、アジド、アルキニル、アルケニル、チオール、及びニトロンからなる群から選択される。いくつかの実施形態では、3’官能性部分及び5’官能性部分は、以下の対:(i)3’-アジド/5’-アルキニル、(ii)3’-アルキニル/5’-アジド、(iii)3’-チオール/5’-アルキニル、(iv)3’-チオール/5’-アルケニル、(v)3’-アルキニル/5’-チオール、(vi)3’-アルケニル/5’-チオール、(vii)3’-アジド/5’-シクロオクチニル、(viii)3’-シクロオクチニル/5’-アジド、(ix)3’-ニトロン/5’-シクロオクチニル、及び(x)3’-シクロオクチニル/5’-ニトロンから選択される。いくつかの実施形態では、3’官能性部分は、3’-アジドであり、5’官能性部分は、5’-アルキニルである。いくつかの実施形態では、直交クリック反応がL1/L2インデックスとL2/L3インデックスとの間で使用される場合、TdT工程は、回避され得る。
【0105】
いくつかの実施形態では、クリックケミストリー反応は、トリアゾリルを含む修飾バックボーン結合を形成するための銅触媒アジド-アルキン環化付加を含む。
【0106】
ポリメラーゼ伸長を含む組み合わせインデックス付け
本明細書で提供される方法及び組成物のいくつかの実施形態は、ビーズに付着したポリヌクレオチドがポリメラーゼ伸長によるインデックスの逐次付加によって伸長される、組み合わせインデックス付けによるインデックス付きビーズの調製を含む。
【0107】
いくつかの実施形態では、アダプターは、第1のインデックスを含むビーズに結合した第1のポリヌクレオチドの3’リンカー(L1A)領域に相補的な3’領域、及び第2のインデックス配列の逆相補体の両方を含有するオリゴヌクレオチドを含む(
図4)。アダプターオリゴヌクレオチドは、ビーズに結合した第1のポリヌクレオチドにハイブリダイズされ、DNAポリメラーゼ及びdNTPは、第1のポリヌクレオチドを伸長し、その結果、その3’末端にアダプターの相補体を含有する共有結合した、ビーズに結合したオリゴヌクレオチドがもたらされる。アダプターは、第1のポリヌクレオチドに直接ハイブリダイズするので、現在のスプリントライゲーションワークフローでは、8個の塩基対16個の塩基など、半数の塩基が、同様の結合特異性を達成するのに十分である。重合が完了すると、例えば、アダプターがチミンの代わりにデオキシウラシル残基を含む場合、アダプターは、熱、塩基(NaOH)、又はUSER酵素による処理を用いた変性によって除去され得る。第3のインデックスを含む第2のアダプターを、伸長された第1のポリヌクレオチドの3’末端にハイブリダイズし、伸長された第1のポリヌクレオチドを、重合反応及びハイブリダイズされた第2のアダプターで更に伸長することによって、追加のインデックスレベルを付加することができる。いくつかの実施形態では、ポリメラーゼがアダプターの3’末端をプライマーとして使用し、望ましくない生成物を生成することを防止するために、アダプターの3’末端を、例えば、3’2’ジデオキシヌクレオチド、C3リンカー、又は他の標準的なブロッキング化学によりブロックすることができる。
【0108】
図4は、逐次的ポリメラーゼ伸長反応によって、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
図4に示されるように、P5配列、インデックスA、及び第1のリンカー(リンク1a)を含む第1のポリヌクレオチドは、ビオチン/ストレプトアビジン結合対を介してビーズに接合される。例えば、ビーズは、ビオチンでコーティングされており、第1のポリヌクレオチドは、ストレプトアビジンに連結された5’末端を含み、又はビーズは、ストレプトアビジンでコーティングされており、第1のポリヌクレオチドは、ビオチンに連結された5’末端を含む。第1のリンカーにハイブリダイズすることができる領域、インデックスB’、及びリンカー2a’を含む第1のアダプターを第1のリンカーにハイブリダイズし、第1のポリヌクレオチドをポリメラーゼの存在下で伸長して、インデックスA及びBを含む伸長されたポリヌクレオチドを得る。第1のアダプターは、除去される。リンカー2aにハイブリダイズすることができる領域、インデックスC’、及び捕捉プローブ’(Hyb’)を含む第2のアダプターを、インデックスA及びBを含む伸長されたポリヌクレオチドのリンカー2a領域にハイブリダイズし、インデックスA及びBを含む伸長されたポリヌクレオチドを、ポリメラーゼの存在において更に伸長して、インデックスA、B、及びC、並び捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドを得る。
【0109】
いくつかの実施形態は、ポリメラーゼ伸長によって第1のポリヌクレオチドを伸長することを含む。いくつかの実施形態では、第1のポリヌクレオチドは、第1のリンカーを含む。いくつかの実施形態はまた、(i)第1のリンカーにハイブリダイズすることができる領域と、第2のインデックス又は第2のインデックスの相補体を含む領域と、を含む、第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第1のポリヌクレオチドを伸長して、二次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態では、第1のアダプターは、非伸長性3’末端を含む。いくつかの実施形態では、非伸長性3’末端は、3’2’ジデオキシヌクレオチド、又は3炭素スペーサーアームなどのC3リンカーを含む。いくつかの実施形態はまた、二次インデックス付きポリヌクレオチドから第1のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。いくつかの実施形態では、第1のリンカーは、10、9、8、7、6、5、4、3、又は2個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のリンカーは、5個未満の連続するヌクレオチドの長さを有する。
【0110】
いくつかの実施形態では、三次インデックス付きビーズの集団を得ることは、ポリメラーゼ伸長によって第2のポリヌクレオチドを伸長することを含む。いくつかの実施形態では、第1のアダプターは、第2のリンカーの相補体を含み、その結果、二次インデックス付きポリヌクレオチドが、第2のリンカーを含む。いくつかの実施形態はまた、(i)第2のリンカーにハイブリダイズすることができる領域と、第3のインデックス又は第3のインデックスの相補体を含む領域と、を含む、第2のアダプターを得ることと、(ii)第2のアダプターを第2のリンカーにハイブリダイズすることと、(iii)二次インデックス付きポリヌクレオチドを伸長して、三次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態では、第2のアダプターは、非伸長性3’末端を含む。いくつかの実施形態では、非伸長性3’末端は、3’2’ジデオキシヌクレオチド、又はC3リンカーを含む。いくつかの実施形態はまた、三次インデックス付きポリヌクレオチドから第2のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。いくつかの実施形態では、第2のリンカーは、10、9、8、7、6、5、4、3、又は2個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第2のリンカーは、5個未満の連続ヌクレオチドの長さを有する。
【0111】
二本鎖断片のライゲーションを含む組み合わせインデックス付け
本明細書で提供される方法及び組成物のいくつかの実施形態は、ビーズに付着したポリヌクレオチドが、第2のポリヌクレオチド及び二本鎖領域を含むアダプターのライゲーションによるインデックスの逐次付加によって伸長される、組み合わせインデックス付けによるインデックス付きビーズの調製を含む。いくつかの実施形態では、部分的二本鎖アダプターの使用は、単一のリンカー配列を使用して、追加のインデックスをビーズ連結オリゴヌクレオチドにライゲーションすることができ、それによって、いくつかの他の方法と比較して、組み合わせインデックス付きオリゴヌクレオチド中のリンカー配列の長さを低減させることを意味する。例えば、
図15A(左パネル)は、スプリントが、ビーズ連結オリゴヌクレオチド中の「KS-3’」配列に、及びインデックス2を含有するアダプター配列中の「KS-5’」配列にそれぞれアニーリングする2つのリンカー配列「KS-3」及び「KS-5」を含有する、標準スプリントライゲーションについての例示的な実施形態を示す。対照的に、
図15A(右パネル)に示される二本鎖スプリントライゲーションの例示的な実施形態は、インデックスを含有するアダプター配列をビーズ連結オリゴヌクレオチドにライゲーションするのに十分な単一リンカー配列「KS-3」を含有する二本鎖スプリントを示す。
【0112】
いくつかの実施形態は、二本鎖の両方の鎖の3’末端から伸長する相補的オーバーハングを有するインデックスオリゴヌクレオチドを含む二本鎖アダプターの使用を含む(例えば、
図5、
図15A、及び
図19Aを参照されたい)。いくつかのそのような実施形態は、相補的塩基の単一領域のみがアセンブリに十分であるため、ビーズコード中の不変塩基の数を最大50%低減させる。第1のインデックスを含むビーズに結合した第1のポリヌクレオチドから始めて、第1のポリヌクレオチドの3’末端に相補的な3’オーバーハングを有する二本鎖断片を含むアダプターをビーズに付加し、ハイブリダイズする。次いで、インデックス配列、及び次のインデックスレベルのための3’ハイブリダイゼーション配列を含有する「上部」断片を、酵素的又は化学ライゲーションによって第1のポリヌクレオチドに連結する。ライゲーションが完了したら、アダプターの二本鎖インデックス部分の下部の鎖は、変性によって除去することができ、同じ手順によって追加のインデックスレベルが付加され得る。いくつかの実施形態では、ライゲーション中に追加の一本鎖オリゴヌクレオチドが存在してもよい(例えば、
図12、右パネル「インデックス1’オリゴ」を参照されたい)。追加のオリゴヌクレオチドは、ビーズに結合したポリヌクレオチドのインデックス配列にハイブリダイズすることができる。いくつかのそのような実施形態では、追加のオリゴヌクレオチドは、ライゲーション複合体を更に安定化させ、ライゲーションを促進することができる。
【0113】
図5は、二本鎖領域及び一本鎖オーバーハングを含むアダプターを使用して、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
図5に示されるように、P5配列、インデックスA、及び第1のリンカー(リンク1a)を含む第1のポリヌクレオチドは、ビオチン/ストレプトアビジン結合対を介してビーズに接合される。例えば、ビーズは、ビオチンでコーティングされており、第1のポリヌクレオチドは、ストレプトアビジンに連結された5’末端を含み、又はビーズは、ストレプトアビジンでコーティングされており、第1のポリヌクレオチドは、ビオチンに連結された5’末端を含む。第1のリンカーにハイブリダイズすることができる領域を含む一本鎖5’オーバーハング、インデックスBを含む二本鎖領域、及び第2のリンカー(リンク2a)を含む領域を含む第1のアダプターは、第1のリンカーにハイブリダイズされる。第1のアダプターは、第1のポリヌクレオチド及びアダプターのリンカー1a及びインデックスB領域を介して、それぞれリガーゼによるライゲーションによって、又は化学ライゲーションによって第1のポリヌクレオチドに共有接合されて、インデックスA及びBを含む伸長されたポリヌクレオチドを得る。第1のポリヌクレオチドに共有接合されていない第1のアダプターの鎖は、除去される。第2のリンカーにハイブリダイズすることができる領域を含む一本鎖5’オーバーハング、インデックスCを含む二本鎖領域、及び捕捉プローブ(Hyb)を含む第2のアダプターは、第2のリンカーにハイブリダイズされる。第2のアダプターは、第1のポリヌクレオチド及びアダプターのリンカー1a及びインデックスB領域を介して、それぞれリガーゼによるライゲーションによって、又は化学ライゲーションによって伸長された第1のポリヌクレオチドに共有接合されて、インデックスA、B、及びC、並びに捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドを得る。インデックスA、B、及びC、並びに捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドに共有接合していない第2のアダプターの鎖は、除去される。
【0114】
図19Aは、ビーズに付着したポリヌクレオチドが、第2のポリヌクレオチド及び二本鎖領域を含むアダプターのライゲーションによるインデックスの逐次付加によって伸長される、組み合わせインデックス付けの追加の例示的な実施形態を示す。
図19Aに示されるように、P5配列、インデックス1、及びKS-3’配列を含むオリゴヌクレオチドは、ビオチン(biotin、B)及びストレプトアビジン(streptavidin、SA)を介してビーズに連結される。一方の鎖がKS-3配列、インデックス2’、及びMS-3配列を含み、他方の鎖がインデックス2配列及びMS-3’配列を含む部分的二本鎖アダプターを、KS-3及びKS-3’配列を介してビーズ連結オリゴヌクレオチドにアニーリングする。アダプター配列をビーズ連結配列にライゲーションして、アダプターの鎖にハイブリダイズされた、伸長されたビーズ連結オリゴヌクレオチドを形成する。アダプターの鎖は、変性によって除去される。2回目のインデックス付けが実施される。
【0115】
いくつかの実施形態は、ライゲーションによって、第1のポリヌクレオチドを第2のポリヌクレオチドで伸長することを含む。いくつかの実施形態はまた、(i)第2のポリヌクレオチドと、第1のポリヌクレオチドの第1のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第1のポリヌクレオチドを第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態はまた、ライゲーションによって第2のポリヌクレオチドを第3のポリヌクレオチドで伸長することを含む。いくつかの実施形態はまた、(i)第3のポリヌクレオチドと、第2のポリヌクレオチドの第2のリンカーにハイブリダイズすることができる3’一本鎖オーバーハングと、を含む、二本鎖の第2のアダプターを得ることと、(ii)第2のアダプターを第2のリンカーにハイブリダイズすることと、(iii)第2のポリヌクレオチドを第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態では、ライゲーションは、リガーゼの使用を含む。いくつかの実施形態では、ライゲーションは、本明細書に開示されるクリックケミストリー反応などの化学ライゲーション反応を含む。
【0116】
スプリントライゲーションを含む組み合わせインデックス付け
本明細書で提供される方法及び組成物のいくつかの実施形態は、ビーズに付着したポリヌクレオチドが、スプリントライゲーションによるインデックスの逐次付加によって伸長される、組み合わせインデックス付けによるインデックス付きビーズの調製を含み、スプリントは、増加したハイブリダイゼーション特異性を有するヌクレオチドを含む。いくつかの実施形態では、スプリントは、相補的配列とのより強い結合を有するヌクレオチド、例えば、ヌクレオチド配列に対するTmの増加をもたらすヌクレオチドを含むヌクレオチド配列を含む。いくつかの実施形態では、スプリントは、1つ以上の修飾ヌクレオチド又はヌクレオチド類似体を含む。いくつかの実施形態では、スプリントは、ロックド核酸(LNA)を含む。いくつかの実施形態では、スプリントは、1つ以上のイノシンヌクレオチドを含む。
【0117】
いくつかの実施形態は、スプリントとインデックス/捕捉オリゴヌクレオチドとの間のハイブリダイゼーションの強度を増加させる化学修飾塩基を含むスプリント中の低減された数の塩基と、インデックスの連続的なレベルを連結するためのスプリントされたライゲーションの使用を含む(
図6)。それらの現在の形態において、スプリント配列は、室温(約25℃)に近い変性中点(Tm)を有する8個のヌクレオチド長である。これは、スプリントが室温ライゲーション反応中に捕捉オリゴヌクレオチド及びインデックスオリゴヌクレオチドの両方に結合することができることを確実にする。
【0118】
図6は、短いリンカー-スプリントを用いた逐次的なスプリントされたライゲーション反応によって、基質に付着した第1のインデックス(インデックスA)に、第2のインデックス(インデックスB)及び第3のインデックス(インデックスC)を付加するスキームの実施形態を示す。
図6に示されるように、P5配列、インデックスA及び第1のリンカー(リンク1a)を含む第1のポリヌクレオチドは、ビオチン/ストレプトアビジン結合対を介してビーズに接合される。例えば、ビーズは、ビオチンでコーティングされており、第1のポリヌクレオチドは、ストレプトアビジンに連結された5’末端を含み、又はビーズは、ストレプトアビジンでコーティングされており、第1のポリヌクレオチドは、ビオチンに連結された5’末端を含む。第2のポリヌクレオチドは、第2のリンカー(リンク1b)、インデックスB、及び第3のリンカー(リンク2a)を含む。第1のリンカーにハイブリダイズすることができる領域及び第2のリンカーにハイブリダイズすることができる領域を含むスプリントなどの一本鎖の第1のアダプターは、第1のポリヌクレオチドの第1のリンカー及び第2のポリヌクレオチドの第2のリンカーの両方にハイブリダイズされる。第1のポリヌクレオチドは、リガーゼの使用によるなど、ライゲーションによって第2のポリヌクレオチドに共有接合されて、インデックスA及びB並びに第3のリンカー(リンク2a)を含む伸長されたポリヌクレオチドを得る。第1のアダプターは、除去される。第3のポリヌクレオチドは、第4のリンカー(リンク2b)、インデックスC、及び捕捉プローブ(Hyb)を含む。第3のリンカーにハイブリダイズすることができる領域と、第4のリンカーにハイブリダイズすることができる領域と、を含むスプリントなどの一本鎖の第2のアダプターは、伸長されたポリヌクレオチドの第3のリンカー及び第3のポリヌクレオチドの第4のリンカーの両方にハイブリダイズされる。第3のポリヌクレオチドは、リガーゼの使用によるなど、ライゲーションによって、伸長されたポリヌクレオチドに共有接合されて、インデックスA、B、及びC、並びに捕捉プローブを含む伸長されたポリヌクレオチドを得る。第2のアダプターは、除去される。
【0119】
いくつかの実施形態は、ライゲーションによって第1のポリヌクレオチドを伸長することを含み、第1のポリヌクレオチドは、第1のリンカーを含み、第2のポリヌクレオチドは、第2のリンカーを含む。いくつかの実施形態はまた、(i)第1のリンカーにハイブリダイズすることができる領域と、第2のリンカーにハイブリダイズすることができる領域と、を含む、第1のアダプターを得ることと、(ii)第1のアダプターを第1のリンカーにハイブリダイズすることと、(iii)第2のオリゴヌクレオチドを、第2のリンカーにハイブリダイズすることができる領域にハイブリダイズすることと、(iv)第1のポリヌクレオチドを第2のポリヌクレオチドにライゲーションして、二次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、10、9、8、7、6、5、4、3、又は2個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、5個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、第1のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したTmを有するように修飾されている。いくつかの実施形態では、第1のリンカー及び/又は第2のリンカーは、同じ長さを有するオリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む。いくつかの実施形態はまた、二次インデックス付きポリヌクレオチドから第1のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0120】
いくつかの実施形態では、三次インデックス付きビーズの集団を得ることは、ライゲーションによって第2のポリヌクレオチドを伸長することを含み、第2のオリゴヌクレオチドは、第3のリンカーを含み、その結果、二次インデックス付きポリヌクレオチドが、第3のリンカーを含み、第3のポリヌクレオチドは、第4のリンカーを含む。いくつかの実施形態はまた、(i)第3のリンカーにハイブリダイズすることができる領域と、第4のリンカーにハイブリダイズすることができる領域と、を含む第2のアダプターを得ることと、(ii)第2のアダプターを第3のリンカーにハイブリダイズすることと、(iii)第4のインデックスにハイブリダイズすることができる領域を介して、第3のポリヌクレオチドを第2のアダプターにハイブリダイズすることと、(iv)二次インデックス付きポリヌクレオチドを第3のポリヌクレオチドにライゲーションして、三次インデックス付きポリヌクレオチドを得ることと、を含む。いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、9、8、7、6、5、4、3、又は2個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、5個未満の連続するヌクレオチドの長さを有する。いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、第2のアダプターと同じ長さを有するオリゴヌクレオチドと比較して増加したTmを有するように修飾されている。いくつかの実施形態では、第3のリンカー及び/又は第4のリンカーは、同じ長さを有するオリゴヌクレオチドと比較して増加したG/C含量を含むか、又は修飾ヌクレオチドを含む。いくつかの実施形態はまた、三次インデックス付きポリヌクレオチドから第2のアダプターを除去することを含む。いくつかの実施形態では、除去することは、熱若しくは塩基によって第1のアダプターを変性させること、又は酵素分解によって第1のアダプターを分解することを含む。
【0121】
標的核酸の配列決定及び分析
いくつかの実施形態は、標的核酸の配列決定及び/又は分析を含む。本明細書で提供される実施形態により有用な特定の方法及び組成物は、米国特許出願公開第2021/0087613号に開示されており、その全体は、参照により組み込まれる。いくつかの実施形態は、本明細書で提供される方法に従って、アレイ内のポリヌクレオチドの位置をデコードすることと、標的核酸を捕捉プローブにハイブリダイズすることと、捕捉プローブを伸長することと、アレイ上の位置で標的核酸にハイブリダイズされた捕捉プローブの伸長を検出することと、を含む。いくつかの実施形態では、アレイ上のポリヌクレオチドの位置は、標的核酸をポリヌクレオチドにハイブリダイズする前にデコードすることができる。いくつかの実施形態では、アレイ上のポリヌクレオチドの位置は、標的核酸にハイブリダイズされた捕捉プローブの伸長を検出した後にデコードすることができる。いくつかのそのような実施形態では、各ポリヌクレオチドは、共通の要素を介して捕捉プローブと関連付けられることができる。例えば、ポリヌクレオチド及び捕捉プローブはそれぞれ、ビーズなどの同じ微小特徴部に結合されることができる。より多くのそのような実施形態では、各ポリヌクレオチドは、捕捉プローブを含むことができる。
【0122】
いくつかの実施形態は、捕捉プローブの一塩基伸長(single base extension、SBE)を含む。いくつかの実施形態では、SBEは、標的核酸中の対立遺伝子、変異、又は他の特徴部の検出に使用することができる。簡潔に述べると、SBEは、検出位置に近位の又は隣接した位置で標的ゲノム断片にハイブリダイズする捕捉プローブを利用し、検出位置は特定の遺伝子座を示す。捕捉プローブの3’末端を、検出標識で標識されたヌクレオチド類似体で伸長するために、ポリメラーゼを使用することができる。酵素の忠実度に基づいて、ヌクレオチドは、標的核酸中の検出位置に相補的である場合にのみ、捕捉プローブに取り込まれる。所望により、ヌクレオチドは、ブロッキング基(可逆的なブロッキング基を含む)を使用して、更なる伸長が起こることができないように誘導体化することができ、したがって、単一のヌクレオチドのみが付加される。伸長された捕捉プローブ中の標識されたヌクレオチドの存在は、例えば、アレイ内の特定の位置で、検出することができ、付加されたヌクレオチドは、遺伝子座又は対立遺伝子の同一性を決定するために識別することができる。SBEは、各々その全体が参照により組み込まれる米国特許第9,441,267号及び同第9,045,796号に記載される条件などの既知の条件下で行うことができる。
【0123】
いくつかの実施形態は、対立遺伝子特異的プライマー伸長(allele specific primer extension、ASPE)を含む。いくつかの実施形態では、ASPEは、3’末端でのヌクレオチド組成が異なる捕捉プローブの伸長を含み得る。ASPE法は、切断可能なリンカーを含有するヌクレオシド又はヌクレオチドを使用して実施することができ、その結果、標識は、プローブが検出された後に除去することができる。これは、プローブの更なる使用、又は検出されたシグナルが、たった今除去された標識によるものであったことの検証を可能にする。簡潔に述べると、ASPEは、検出位置に相補的である3’配列部分と、検出位置に隣接する配列に相補的である5’部分と、を有する捕捉プローブに標的核酸をハイブリダイズすることによって実施することができる。例えば、ポリメラーゼによる標識されたヌクレオチドの付加による、捕捉プローブの3’部分のテンプレート指向修飾は、標識された伸長生成物を産生するが、これは、テンプレートが標的配列を含む場合のみである。次いで、このような標識されたプライマー伸長生成物の存在は、例えば、特定の対立遺伝子の存在を示すために、アレイ内でのその位置に基づいて検出することができる。いくつかの実施形態では、ASPEは、標的核酸中の同じ検出位置に隣接してアニーリングするように同様の5’末端を有するが、検出位置を補完する3’末端を有する捕捉プローブのみがポリメラーゼによって修飾されるように、異なる3’末端を有する、複数の捕捉プローブを用いて実施することができる。特定の検出位置に相補的である3’末端塩基を有する捕捉プローブは、位置に対する完全一致(perfect match、PM)プローブと称されるが、一方で、3’末端不一致塩基を有し、ASPE反応で伸長されることができない捕捉プローブは、位置に対する不一致(mismatch、MM)プローブである。PMプローブ中の標識されたヌクレオチドの存在は、検出することができ、捕捉プローブの3’配列は、検出位置において特定の対立遺伝子を識別するために決定することができる。
【0124】
キット及びシステム
本明細書で提供されるいくつかの実施形態は、キット及びシステムを含む。いくつかのそのような実施形態は、ビーズ、マルチウェルプレート、リガーゼ及びポリメラーゼなどの酵素、ポリヌクレオチド、ビオチン及びストレプトアビジン又はそれらの誘導体などの結合対、並びにクリックケミストリー試薬を含む、本明細書で提供される特定の方法を実施するための試薬を含み得る。
【実施例】
【0125】
実施例1-クリックケミストリーライゲーションによるビーズコード合成
複数のビーズをストレプトアビジンでコーティングし、第1の96ウェルプレートのウェルに分配する。異なる第1のポリヌクレオチドを各ウェルに分配する。各第1のポリヌクレオチドは、第1のポリヌクレオチドがビオチン/ストレプトアビジン結合対を介してビーズに接合されるように、ビオチンに連結された5’末端を含む。第1のポリヌクレオチドは、P5配列、インデックスA、及びプロパルギル部分を有する3’末端を含む。各ウェル中の第1のポリヌクレオチドは、異なるウェル中の第1のポリヌクレオチドとは異なるインデックスAを有する。ビーズをプールし、第2の96ウェルプレートのウェルに分配する。
【0126】
第2のポリヌクレオチドを第2の96ウェルプレートの各ウェルに添加する。第2のポリヌクレオチドは、インデックスB、及びアジド部分を有する5’末端を含む。インデックスBは、ウェルごとに異なる。銅触媒クリック反応を各ウェルで実施し、第1及び第2のポリヌクレオチドの接合をもたらす。ビーズ連結ポリヌクレオチドをTdTで処理して、プロパルギル部分を含む単一ヌクレオチドを付加する。ビーズをプールし、第3の96ウェルプレートのウェルに分配する。
【0127】
追加のポリヌクレオチドを第2のポリヌクレオチドの3’末端に付加する。アジド部分を有する5’末端及びインデックスCを含む第3のポリヌクレオチドを使用して、追加のクリック反応を介してビーズ連結ポリヌクレオチドを更に伸長することができる。インデックスCは、ウェルごとに異なる。
【0128】
実施例2-ポリメラーゼ伸長を含む組み合わせインデックス付け
複数のビーズをストレプトアビジンでコーティングし、第1の96ウェルプレートのウェルに分配する。異なる第1のポリヌクレオチドを各ウェルに分配する。各第1のポリヌクレオチドは、第1のポリヌクレオチドがビオチン/ストレプトアビジン結合対を介してビーズに接合されるように、ビオチンに連結された5’末端を含む。第1のポリヌクレオチドは、P5配列、インデックスA、及び8個のヌクレオチドの第1のリンカーを含む。各ウェル中の第1のポリヌクレオチドは、異なるウェル中の第1のポリヌクレオチドとは異なるインデックスAを有する。ビーズをプールし、第2の96ウェルプレートのウェルに分配する。
【0129】
第1のアダプターを第2の96ウェルプレートの各ウェルに添加する。第1のアダプターは、第1のリンカーにハイブリダイズすることができる領域、インデックスB’配列、及びリンカー2a’を含む。インデックスB’配列は、ウェルごとに異なる。第1のアダプターを第1のリンカーにハイブリダイズし、第1のポリヌクレオチドをポリメラーゼの存在下で伸長して、インデックスA及びBを含む伸長されたポリヌクレオチドを得る。第1のアダプターをビーズから除去する。ビーズをプールし、第3の96ウェルプレートのウェルに分配する。
【0130】
第2のアダプターを第3の96ウェルプレートの各ウェルに添加する。第2のアダプターは、リンカー2aにハイブリダイズすることができる領域、インデックスC’、及び捕捉プローブ’(Hyb’)を含む。いくつかの実施形態では、捕捉プローブは、ユニバーサルトランスポソームがビーズ連結オリゴの3’末端に付着している特定の用途に有用であり、インデックス付けに無関係であり得る(すなわち、これは用途に応じて任意の配列であり得る)。インデックスC’配列は、ウェルごとに異なる。第2のアダプターを、インデックスA及びBを含む伸長されたポリヌクレオチドのリンカー2a領域にハイブリダイズし、インデックスA及びBを含む伸長されたポリヌクレオチドをポリメラーゼの存在下で更に伸長して、インデックスA、B、及びC、並びに捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドを得る。第2のアダプターをビーズから除去する。
【0131】
実施例3-二本鎖断片のライゲーションを含む組み合わせインデックス付け
複数のビーズをストレプトアビジンでコーティングし、第1の96ウェルプレートのウェルに分配する。異なる第1のポリヌクレオチドを各ウェルに分配する。各第1のポリヌクレオチドは、第1のポリヌクレオチドがビオチン/ストレプトアビジン結合対を介してビーズに接合されるように、ビオチンに連結された5’末端を含む。第1のポリヌクレオチドは、P5配列、インデックスA、及び8個のヌクレオチドの第1のリンカーを含む。各ウェル中の第1のポリヌクレオチドは、異なるウェル中の第1のポリヌクレオチドとは異なるインデックスAを有する。ビーズをプールし、第2の96ウェルプレートのウェルに分配する。
【0132】
第1のアダプターを第2の96ウェルプレートの各ウェルに添加する。第1のアダプターは、第1のリンカーにハイブリダイズすることができる領域を含む一本鎖5’オーバーハングと、インデックスBを含む二本鎖領域と、第2のリンカー(リンク2a)を含む領域と、を含む。インデックスBは、ウェルごとに異なる。第1のアダプターを第1のリンカーにハイブリダイズする。第1のアダプターを、第1のポリヌクレオチド及びアダプターのリンカー1a及びインデックスB領域を介して、それぞれリガーゼによるライゲーションによって、又は化学ライゲーションによって第1のポリヌクレオチドに共有接合させて、インデックスA及びBを含む伸長されたポリヌクレオチドを得る。第1のポリヌクレオチドに共有接合されていない第1のアダプターの鎖を除去する。ビーズをプールし、第3の96ウェルプレートのウェルに分配する。
【0133】
第2のアダプターを第3の96ウェルプレートの各ウェルに添加する。第2のアダプターは、第2のリンカーにハイブリダイズすることができる領域を含む一本鎖5’オーバーハングと、インデックスCを含む二本鎖領域と、捕捉プローブ(Hyb)と、含む。第2のアダプターを第2のリンカーにハイブリダイズする。第2のアダプターを、第1のポリヌクレオチド及びアダプターのリンカー1a及びインデックスB領域を介して、それぞれリガーゼによるライゲーションによって、又は化学ライゲーションによって伸長された第1のポリヌクレオチドに共有接合させて、インデックスA、B、及びC、並びに捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドを得る。インデックスA、B、及びC、並びに捕捉プローブ(Hyb)を含む伸長されたポリヌクレオチドに共有接合していない第2のアダプターの鎖を、ビーズから除去する。
【0134】
実施例4-スプリントライゲーションを含む組み合わせインデックス付け
複数のビーズをストレプトアビジンでコーティングし、第1の96ウェルプレートのウェルに分配する。異なる第1のポリヌクレオチドを各ウェルに分配する。各第1のポリヌクレオチドは、第1のポリヌクレオチドがビオチン/ストレプトアビジン結合対を介してビーズに接合されるように、ビオチンに連結された5’末端を含む。第1のポリヌクレオチドは、P5配列、インデックスA、及び第1のリンカーを含む。各ウェル中の第1のポリヌクレオチドは、異なるウェル中の第1のポリヌクレオチドとは異なるインデックスAを有する。ビーズをプールし、第2の96ウェルプレートのウェルに分配する。
【0135】
第2のポリヌクレオチドを第2の96ウェルプレートの各ウェルに添加する。第2のポリヌクレオチドは、第2のリンカー(リンク1b)、インデックスB、及び第3のリンカー(リンク2a)を含む。インデックスBは、ウェルごとに異なる。第1のリンカーにハイブリダイズすることができる領域と、第2のリンカーにハイブリダイズすることができる領域と、を含む、スプリントなどの一本鎖の第1のアダプターを各ウェルに添加する。第1のアダプターを、第1のポリヌクレオチドの第1のリンカー及び第2のポリヌクレオチドの第2のリンカーの両方にハイブリダイズする。第1のポリヌクレオチドを、リガーゼの使用によるなど、ライゲーションによって第2のポリヌクレオチドに共有接合させて、インデックスA及びB並びに第3のリンカー(リンク2a)を含む伸長されたポリヌクレオチドを得る。第1のアダプターを除去する。ビーズをプールし、第3の96ウェルプレートのウェルに分配する。
【0136】
第3のポリヌクレオチドを第3の96ウェルプレートの各ウェルに添加する。第3のポリヌクレオチドは、第4のリンカー(リンク2b)、インデックスC、及び捕捉プローブ(Hyb)を含む。インデックスBは、ウェルごとに異なる。第3のリンカーにハイブリダイズすることができる領域と、第4のリンカーにハイブリダイズすることができる領域と、を含む、スプリントなどの一本鎖の第2のアダプターを各ウェルに添加する。第2のアダプターは、伸長されたポリヌクレオチドの第3のリンカー及び第3のポリヌクレオチドの第4のリンカーの両方にハイブリダイズされる。第3のポリヌクレオチドは、リガーゼの使用によるなど、ライゲーションによって、伸長されたポリヌクレオチドに共有接合させて、インデックスA、B、及びC、並びに捕捉プローブを含む伸長されたポリヌクレオチドを得る。第2のアダプターをビーズから除去する。
【0137】
実施例5-ポリメラーゼ伸長を含む組み合わせインデックス付け
ポリメラーゼ伸長を含む組み合わせインデックス付け(例えば、
図4を参照されたい)を、スプリントライゲーションを含む組み合わせインデックス付け(例えば、
図2を参照されたい)と比較した。捕捉オリゴヌクレオチド(P5-インデックスA-リンク1a)及び伸長テンプレート(リンク1a’-インデックスB’-Hyb’)を有するビーズを使用して、ポリメラーゼ伸長による2レベルインデックス付けプロトコルを実施した。ポリメラーゼ伸長を、異なる量のテンプレート、並びにエキソヌクレアーゼ活性を有するT4ポリメラーゼ及びエキソヌクレアーゼ活性を有さないT4ポリメラーゼを用いて行った。捕捉プローブの数及び全長生成物の数を、
図7Aに示される位置のプライマーを用いる定量PCR(quantitative PCR、qPCR)を使用して測定した。
図7Bに示されるように、(1)T4ポリメラーゼ(エキソ+)は、捕捉プローブ及び伸長テンプレートを分解し、(2)T4ポリメラーゼ(エキソ-)は、捕捉オリゴヌクレオチドの分解の低減を示し、(3)捕捉オリゴに対して50×過剰の伸長テンプレート(330fmol/ug)は、T4ポリメラーゼ(エキソ-)を用いた全長伸長に十分であった。
【0138】
図8A及び
図8Bは、3レベルインデックス付けプロトコルにおいて試験された様々な条件を要約する。容量は、2連で25μl/条件であった。ポリメラーゼ伸長を20℃(回転なし)で15分間、NaOH伸長オリゴ変性を用いて実施した。スプリントライゲーションを一晩及び4時間(回転なし)、60℃のスプリント変性で行った。読み出しは、定量PCR(qPCR)アッセイ、及び直接ビーズコード配列決定を含んだ。qPCRについて、化学合成された全長対照オリゴ(対応する3レベルPE又はSLオリゴと同一の配列)を使用して、定量化のための標準曲線を作成した。スプリントライゲーション(SL)の第2のレベル及び第3のレベルのアンプリコンの濃度を、サイズ差について調整した。
【0139】
図9は、qPCR結果を要約したものであり、PE(8)がSL(12)よりも少ない全長オリゴを与えることを示す。合成の効率は、SLに対してPEでより低く、例えば、PEでは20%のオリゴが全長であり、SLでは40%のオリゴが全長であり、これは、1回目のライゲーションよりもはるかに効率が低い2回目のライゲーション(12)に、及び/又は回転を伴わない20℃のインキュベーションに起因した可能性がある。PEを受けた試料は、全長(full length、FL)PE(1)及びSL(10~12)と比較して、より低い捕捉オリゴ(capture oligo、CO)分子/ビーズ(3~8)を示した。各伸長は、CO分子/ビーズを低減させた(3~5対6~8)。いくらかの損失は、NaOH洗浄によるビーズからのBio-オリゴのストリッピングによるものであった。(6)対(7及び8)、及び(3)対(5)におけるように、いくらかの損失は、T4ポリメラーゼがオリゴを噛み戻すことに起因した可能性があるが、これは(3)対(4)においては観察されなかった。
【0140】
変性工程における0.2N NaOHの効果を試験した。5’ビオチン又は5’ddビオチンのいずれかを介してビーズに結合した6.6fmolの第1のレベルのオリゴ(B1インデックス)を有するビーズを、5つの異なる変性処理及び対照において伸長/連結なしで使用した:なし(-対照);変性なし、洗浄工程のみ(1つのレベル当たり2回の洗浄、合計4回);2×60℃での熱変性+洗浄;2×80℃での熱変性+洗浄;1×0.2N NaOH変性+洗浄;及び2×0.2N NaOH変性+洗浄。残りのオリゴを、第1のレベルのプライマーを用いてqPCRによって測定した。結果を
図10に要約するが、これは、0.2N NaOH変性がビオチン特異的CO損失を引き起こしたことを示す。
【0141】
直接ビーズコード配列決定分析を、3レベルインデックス付けについて実施した。簡単に述べると、このアッセイは、Hyb領域を標的とするP5フォワードプライマー及びリバースプライマーを使用して、PCRによってビーズから合成ビーズコードオリゴを増幅することを含む。リバースプライマーは、試料インデックス、ME_V2_B15配列決定プライマーのための結合領域、及びクラスタリングを可能にするP7’配列を導入する。
図11Aは、分析のためのリード方向を概説する。分析は、配列中の塩基変化エラーを示す、欠失及び推定「SNP」の同定を含むエラーコールを用いた、予想される配列に対する各リードのトリミング及びペアワイズアライメントを含む。完全に正確なインデックスは、例えば、3レベルインデックス、インデックス1、インデックス2、及びインデックス3において、インデックス領域にわたってエラー(SNP、挿入欠失)を含まなかった。全ての使用可能なインデックスは、インデックスエラー補正履行により正しくデコードされ得るそれらのインデックスを含んでいた。
図11B及び
図11Cは、完全に正確な配列のレベル、使用可能なインデックス、及び塩基ごとのエラー率を示す。スプリントライゲーションは、ポリメラーゼ伸長よりも効率的であったが、両方とも同様のレベルのエラーを有した。
【0142】
前述の研究から、3レベルポリメラーゼ伸長は、スプリントライゲーションよりも少ない全長分子を生成した。0.2N NaOH変性及びT4ポリメラーゼエキソヌクレアーゼ活性の付加は、総捕捉オリゴの低減に寄与した可能性が高い。ポリメラーゼ伸長は、この実験においてスプリントライゲーションよりも効率が低いようであった。0.2N NaOH変性は、ビーズからのビオチン化オリゴの損失をもたらしたが、これは、単一の5’ビオチンを5’二重デスチオビオチンで置き換えることによって軽減することができる。合成されたポリメラーゼ伸長オリゴは、スプリントライゲーション法と比較して同様のレベルのエラーを有した。
【0143】
実施例6-二本鎖スプリントライゲーションによる2レベルインデックス付け
二本鎖スプリントライゲーションを含む2レベルインデックス付けを、スプリントライゲーション(標準)を含む2レベルインデックス付けと比較した。スプリントライゲーション及び二本鎖スプリントライゲーションによる標準的な組み合わせインデックス付けの概要を
図12Aに示す。標準スプリントライゲーションと比較して、二本鎖法では、スプリントの5’半分が第2のレベルのインデックスに相補的であり得、インデックス間の共通配列長を半分に低減させる。試験したプロトコル及び条件の概要を
図12Bに示す。
【0144】
qPCRアッセイを実施し、全長スプリントライゲーション及び二本鎖ライゲーションオリゴを使用して、標準曲線を作成した。スプリントライゲーション(標準)を含む組み合わせインデックス付け、及び二本鎖スプリントライゲーション(dsインデックスライゲーション)を含む組み合わせインデックス付けについて、プライマー位置を
図12Cに示し、生成物は、F2及びR2又はF3及びR2を含むプライマーの組み合わせを使用して決定した。濃度は、各試料について適切な標準曲線を使用して決定した。
図13Aは、qPCRの結果を示し、
図13B及び
図13Cは、正規化qPCRの結果を示し、合成されたdsインデックスライゲーションオリゴがスプリントライゲーションオリゴと同様であった。SL全長対照オリゴとDS全長対照オリゴとの間の差次的増幅について正規化した後、DSライゲーション及びスプリントライゲーションオリゴは、同様の性能を示した。
【0145】
二本鎖スプリントライゲーションを、漸増量のdsインデックスオリゴを用いて実施し、生成物をqPCRで測定した。
図13Dに示されるように、生成物の量の実質的な増加はなかった。二本鎖スプリントライゲーションをインデックス1に相補的なオリゴの存在下で実施し、生成物をqPCRで測定した。
図13Eに示されるように、二本鎖スプリントライゲーションをインデックス1に相補的なオリゴの存在下で実施した場合、生成物の量の実質的な増加はなかった。3’ddCを有するオリゴを用いて二本鎖スプリントライゲーションを実施し、生成物をqPCRで測定した。
図13Fに示されるように、3’ddCを有するオリゴを用いて二本鎖スプリントライゲーションを実施した場合、生成物の量は実質的に増加しなかった。室温又は75℃のいずれかでのライゲーション前インキュベーションを含む二本鎖スプリントライゲーションを実施し、生成物をqPCRで測定した。
図13Gに示されるように、室温又は75℃のいずれかでのライゲーション前インキュベーションを用いて二本鎖スプリントライゲーションを実施した場合、生成物の量の実質的な増加はなかった。
【0146】
2レベル二本鎖インデックスライゲーションのための直接ビーズコード配列決定を実施した。結果を
図14A及び
図14Bに要約する。
【0147】
前述の2レベル実験から、二本鎖インデックスライゲーションは、qPCRによって測定されるスプリントライゲーションと同様の結果を与えた。33fmol/μgビーズを超える二本鎖インデックス量については、単一ライゲーションによる全長生成物の実質的な増加、又はビーズコード内のエラーの増加はなかった。以下の操作は、ほとんど効果がなかった:(1)インデックス1に相補的なオリゴの付加、(2)3’ddC修飾の除去、又は(3)75℃でのライゲーション前インキュベーションの室温インキュベーションへの置き換え。加えて、ビーズコード配列決定は、スプリントライゲーションと比較して、二本鎖ライゲーションでより少ないエラーを示した。
【0148】
実施例7-二本鎖スプリントライゲーションによる3レベルインデックス付け
二本鎖スプリントライゲーションを含む3レベルインデックス付けを、スプリントライゲーション(標準)を含む3レベルインデックス付けと比較した。実験計画の概要を
図15A及び
図15Bに示す。
【0149】
qPCRを、二本鎖スプリントライゲーション又はスプリントライゲーションのいずれかを使用して3レベルインデックス付き生成物に対して実施した。全長二本鎖ライゲーションインデックス対照を標準曲線(より高い純度)として使用し、スプリントライゲーションアンプリコンの濃度をサイズ調整した。結果を
図16Aに要約する。スプリントライゲーションについて、80℃での変性は、オリゴの総数を低減させ(2対3)、50℃でのアニーリングは、オリゴの総数をわずかに増加させた(3対4)。スプリントライゲーション対dsライゲーションに関して、50℃でのアニーリング及び80Cでの変性は、スプリント及びdsライゲーション法と同等の数の全長オリゴを与え(4対7)、オリゴは、全長であり(第3レベル対バイオオリゴ)、dsライゲーションは、より少ない数の第2レベルオリゴを示した。全長対照については、おそらく純度の問題により、分子の総数がより少なかった。
【0150】
3レベル二本鎖インデックスライゲーションのための直接ビーズコード配列決定を実施した。結果を
図16B及び
図16Cに要約する。
【0151】
前述の二本鎖スプリントライゲーション研究から、スプリントライゲーション及びdsライゲーションは、同等の数の全長オリゴを与え、80℃での変性は、いくつかの捕捉オリゴヌクレオチド(CO)の損失をもたらしたが、50℃でのアニーリングは、COの数をわずかに増加させた。dsライゲーションによって合成されたCOは、スプリントライゲーションによって合成されたCOよりもエラーが少なかった。
【0152】
実施例8-LNA含有スプリントオリゴ
ロックド核酸ヌクレオチド(LNA)を含有する短縮された第1のスプリント(カンガルースプリント)を設計する。カンガルースプリントは、配列:ATGCTCTAGACAAGT/3ddC(配列番号03)に基づき、「3ddC」は、3’ジデオキシシチジンである。生成されたスプリントには、5’末端及び3’末端の両方から短縮されたスプリントであって、全てが最後の塩基をジデオキシシチジン(dideoxy-cytidine、ddC)に保つスプリント、及び全ての可能なLNA置換を含有するスプリントが含まれる。生成されたオリゴを、IDTのOligoAnalyzer(Integrated DNA Technologies(商標)、Coralville,Iowa)で分析する。LNAオリゴについてのQiagenの設計ガイドラインに従う生成されたオリゴを選択し、ガイドラインには、30~60%のGC含量、連続して4個未満のLNA塩基、連続して3個未満のG又はCが含まれる。元のスプリントと同様のTmを有し、ライゲーション部位に相補的な塩基位置にいかなるLNAも有さない生成されたオリゴを選択する。室温で二次構造又は自己ハイブリダイゼーションを有さず、P5又はHyb配列に相補的でない生成されたオリゴが選択される。表2は、3つの例示的なオリゴを列挙する。
【0153】
【0154】
5’及び3’TMは、以下の設定(ライゲーション反応に基づく)を用いてIDTのオリゴアナライザーを使用して計算する:1.98μMのオリゴ、100mMのNa
+、7.9mMのMg
++。全長TMは、以下の設定(スプリント変性に基づく)を用いてIDTのオリゴアナライザーを使用して計算する:0.05μMのオリゴ、100mMのNa
+。実験の概要を
図17に示す。
【0155】
実施例9-リンカー配列長を低減させるための修飾スプリントオリゴヌクレオチド
ホス-オリゴスプリントハイブリダイゼーション配列が6個のヌクレオチドに減少し、G/C含量が増加した更なるスプリントを設計した。新しいホス-オリゴに対して複数のスプリントを設計した。設計されたスプリントの概要を
図18Aに示し、これは、表3に列挙された配列を示し、Xは、イノシンである。
【0156】
【0157】
実験条件の概要を
図18Bに示す。試験した条件は、20℃対12℃のスプリントライゲーションを含み、これは、サーモサイクラー(回転なし)中で一晩実施した。DSオリゴアニーリングを、急速冷却プロトコル(75℃でのインキュベーション、直ちに氷に移す)又は低速アニーリング(試料をサーモサイクラー中75℃でインキュベートし、次いで温度を1℃/30秒の低下速度で低下させた)のいずれかを使用して実施した。qPCRにより捕捉及び全長オリゴを測定した。結果を
図18Cに要約するが、これは、再設計された6個のヌクレオチドp-オリゴ/スプリントとのライゲーションが約10~20%少なかったことを示す。再設計された4個のヌクレオチドスプリントとのライゲーションは約40~50%少なかった。試験したスプリントのうちスプリントの最も短い3’部分を有する、
図18Aに示される「6bp_New_6bp-Kスプリント」を用いた結果から、スプリントの3’半分をわずか6個のヌクレオチドに低減させると、ライゲーション効率が約90%低減したことが推測された。低速アニーリングは、全長オリゴの数にほとんど影響を及ぼさなかった。イノシン塩基の付加は、ライゲーション効率を改善しない可能性がある。イノシンとの塩基の置換は、ライゲーション効率を低減させた可能性がある。要約すると、スプリント配列の再設計、並びにスプリントの5’末端の6個のヌクレオチド及び4個のヌクレオチドへの短縮は、連結がスプリントTmより下で行われた場合であっても、ライゲーション効率を低減させた。イノシンをスプリントの5’末端に付加することは、ライゲーション効率を改善しなかった。スプリントの5’末端の塩基をイノシンで置換することは、ライゲーション効率を低減させた。低速アニーリングは、ライゲーション効率にほとんど影響を及ぼさないことが見出された。短縮されたリンカー配列を有するビーズ連結インデックス付きオリゴヌクレオチドを調製する際のライゲーション効率の低減は、低減された長さを有するリンカー配列の使用を含む配列決定ワークフローの効率の増加よりも勝る可能性が高いはずである。
【0158】
実施例10-二本鎖スプリントライゲーションによるインデックス付けのためのワークフロー
二本鎖スプリントライゲーションによるインデックス付けの概要を
図19Aに示し、例示的なワークフローを
図19Bに示す。
図19Aに示されるスキームでは、アニーリングは、60℃で3分間、氷に移すことを含み、ライゲーションは、1回目のライゲーション:O/N、2回目のライゲーション:5時間を含み、変性は、80℃で2分間、緩衝液を直ちに除去することを含む。以下に、二本鎖スプリントライゲーションによってインデックス付きビーズプールを調製するための工程を要約する。
【0159】
【0160】
【0161】
【0162】
【0163】
【0164】
【0165】
【0166】
【0167】
【0168】
【0169】
【0170】
本明細書で使用される場合、「含む」という用語は、「包含する」、「含有する」又は「特徴とする」と同義であり、包括的又は非限定的であり、更なる列挙されていない要素又は方法工程を除外しない。
【0171】
上記の説明は、本発明のいくつかの方法及び材料を開示するものである。本発明は、方法及び材料の修正、並びに製造方法及び設備の変更を受け入れる余地がある。そのような修正は、本開示又は本明細書に開示される本発明のその開示又は実施を考慮することで当業者に明らかになるであろう。したがって、本発明は、本明細書に開示される特定の実施形態に限定されることを意図するものではなく、本発明の真の範囲及び趣旨に含まれる全ての修正及び代替を網羅することを意図する。
【0172】
公開及び未公開の出願、特許、並びに文献の参照を含むがこれらに限定されない、本明細書で引用される全ての参考文献は、それらの全体が参照により本明細書に組み込まれ、本明細書の一部をなす。参照により組み込まれる刊行物及び特許又は特許出願が本明細書に含まれる開示と矛盾する場合、本明細書は、そのような矛盾する資料に優先する及び/又はより上位にあることを意図する。
【配列表】
【国際調査報告】