(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-19
(45)【発行日】2024-12-27
(54)【発明の名称】正確な分子バーコーディング
(51)【国際特許分類】
C12N 15/11 20060101AFI20241220BHJP
C12Q 1/6811 20180101ALI20241220BHJP
C12N 15/09 20060101ALI20241220BHJP
C12Q 1/6837 20180101ALI20241220BHJP
C12Q 1/6876 20180101ALI20241220BHJP
C40B 40/06 20060101ALI20241220BHJP
C12N 15/13 20060101ALN20241220BHJP
C12Q 1/686 20180101ALN20241220BHJP
C12Q 1/6869 20180101ALN20241220BHJP
C12Q 1/6874 20180101ALN20241220BHJP
【FI】
C12N15/11 Z
C12Q1/6811 ZNA
C12N15/09 200
C12Q1/6837
C12Q1/6876 Z
C40B40/06
C12N15/13
C12Q1/686
C12Q1/6869
C12Q1/6874
【外国語出願】
(21)【出願番号】P 2022106377
(22)【出願日】2022-06-30
(62)【分割の表示】P 2018557413の分割
【原出願日】2017-04-28
【審査請求日】2022-08-01
(32)【優先日】2016-05-02
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】595117091
【氏名又は名称】ベクトン・ディキンソン・アンド・カンパニー
【氏名又は名称原語表記】BECTON, DICKINSON AND COMPANY
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100119013
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100111796
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100123766
【氏名又は名称】松田 七重
(74)【代理人】
【識別番号】100168631
【氏名又は名称】佐々木 康匡
(72)【発明者】
【氏名】シャム, エリーン
(72)【発明者】
【氏名】フー, グレン
【審査官】小田 浩代
(56)【参考文献】
【文献】特表2004-526433(JP,A)
【文献】国際公開第2015/031691(WO,A1)
【文献】特表2008-538505(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N 1/00-15/90
C12Q 1/00- 3/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
PubMed
(57)【特許請求の範囲】
【請求項1】
複数のユニークオリゴヌクレオチド種を含む組成物であって、各ユニークオリゴヌクレオチド種が、
少なくとも7ヌクレオチドを含む分子バーコードと、少なくとも3ヌクレオチドを含むサンプルバーコードとを含む、バーコード領域と、
標的特異的領域を含むユニフォーム領域と、
少なくとも3ヌクレオチドを含む非Gスペーサーと
を含み、
前記標的特異的領域が、標的核酸に相補的な少なくとも10ヌクレオチドを含み、前記ユニフォーム領域が、前記バーコード領域の3’側にあり、
前記スペーサーが、前記バーコード領域と前記ユニフォーム領域の間にあり、
且つ、前記スペーサーがTのみを含み、
各ユニークオリゴヌクレオチド種の分子バーコードの核酸配列が、他のユニークオリゴヌクレオチド種の分子バーコードの核酸配列と異なる、
組成物。
【請求項2】
前記ユニフォーム領域が、免疫細胞レセプター又は免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、請求項1に記載の組成物。
【請求項3】
前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、請求項2に記載の組成物。
【請求項4】
前記スペーサーの長さが、3~10ヌクレオチドである、請求項1~
3のいずれか1項に記載の組成物。
【請求項5】
前記スペーサーが、TTT又はTTTTTである、請求項1~
4のいずれか1項に記載の組成物。
【請求項6】
各ユニークオリゴヌクレオチド種について、前記分子バーコードが、サンプルバーコードの3’側にある、請求項1~
5のいずれか1項に記載の組成物。
【請求項7】
前記ユニークオリゴヌクレオチド種が、少なくとも2つの空間分離されたプールに配設されており、各プールが前記ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、
同一のプール中のユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含み、かつ
同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含む、請求項1~
6のいずれか1項に記載の組成物。
【請求項8】
前記ユニークオリゴヌクレオチド種が、少なくとも48プールに配設されている、請求項
7に記載の組成物。
【請求項9】
前記分子バーコードではなく前記サンプルバーコードが、各基材に固定されたオリゴヌクレオチド種について同一になるように、各プールのユニークオリゴヌクレオチド種が基材に固定されている、請求項
7又は8に記載の組成物。
【請求項10】
表面が2つ以上の基材を含みうるように、前記基材が離散した表面領域を含む、請求項
9に記載の組成物。
【請求項11】
前記基材がビーズを含む、請求項
9に記載の組成物。
【請求項12】
前記ユニークオリゴヌクレオチド種のそれぞれが、前記ユニークオリゴヌクレオチドを前記基材に固定するように構成されたアダプターをさらに含み、前記バーコード領域が前記アダプターの3’側にある、請求項
9~
11のいずれか一項に記載の組成物。
【請求項13】
各オリゴヌクレオチド種が、少なくとも24ヌクレオチド長を有する、請求項1~
12のいずれか一項に記載の組成物。
【請求項14】
少なくとも1000ユニークオリゴヌクレオチド種を含む、請求項1~
13のいずれか一項に記載の組成物。
【請求項15】
同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む、請求項1~
14のいずれか一項に記載の組成物。
【請求項16】
前記組成物の2オリゴヌクレオチドは、同一のユニークオリゴヌクレオチド種ではない、請求項1~
14のいずれか一項に記載の組成物。
【請求項17】
それぞれ核酸を含む2以上のサンプルからの複数の核酸に特異的にバーコードを付ける方法であって、
各サンプルを請求項1~
16のいずれか一項に記載の組成物を含むプールと接触させる工程であって、各サンプルが他のサンプルから空間分離した状態で接触される、工程と、
前記ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域を、前記サンプルの核酸の少なくともいくつかにハイブリダイズさせる工程と、
ハイブリダイズされた前記オリゴヌクレオチドを伸長させることにより、前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖を生成する工程であって、各サンプルについては、前記鎖が同一のサンプルバーコード及び異なる分子バーコードを含み、かつ異なるサンプルについては、前記サンプルバーコードが異なっている、工程と
を含む方法。
【請求項18】
請求項2又は3に記載の組成物を含むキットであって、前記標的特異的領域によってハイブリダイズされる鎖に対して相補的な鎖にハイブリダイズするように構成されたプライマーをさらに含み、前記標的特異的領域によってハイブリダイズされる鎖は、前記可変領域コード配列を含み、且つ前記プライマーは、前記標的特異的領域を含むユニークオリゴヌクレオチド種と共に前記可変領域コード配列を増幅するように構成されている、前記キット。
【請求項19】
前記プライマーと、前記標的特異的領域を含むユニークオリゴヌクレオチド種が、前記可変領域コード配列を含む少なくとも1kbの核酸を増幅するように構成されている、請求項
18に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の参照
本出願は、2016年5月2日出願の米国仮特許出願第62/330,500号明細書(その全体が本出願をもって参照により組み込まれる)に基づく利益を主張する。
【0002】
配列リストの参照
本出願は、電子形式の配列リストと共に出願されている。配列リストは、2017年4月18日に32,588バイトのサイズで作成され最後に修正されたSEQUENCEBDCRI019WO.TXTという名称のファイルとして提供される。配列リストの電子形式の情報は、その全体が参照により本明細書に組み込まれる。
【0003】
本明細書の実施形態は、一般的には、分子(たとえば核酸分子)の正確なバーコーディングのための組成物および方法に関する。
【発明の概要】
【課題を解決するための手段】
【0004】
いくつかの実施形態は、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物を提供することを含む。各ユニークオリゴヌクレオチド種は、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含みうるとともに、ユニークオリゴヌクレオチド種は、そのバーコード領域に異なる核酸配列を含み、かつ(a)組成物は各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または(b)組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードは全体として12.5%以下のG含有率を有するか、の少なくとも一方である。いくつかの実施形態では、バーコード領域は、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、組成物は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2つの空間分離されたプールに配設され、各プールは、ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、同一のプールのユニークオリゴヌクレオチドは、同一のサンプルバーコード配列を含み、かつ同一のプールの異なるユニークオリゴヌクレオチドは、異なる分子バーコード配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種のサンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種のバーコード領域は、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、組成物は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各オリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各オリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、組成物は少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、組成物は少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、組成物は同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、組成物の2オリゴヌクレオチドは同一のユニークオリゴヌクレオチド種でない。いくつかの実施形態では、組成物は少なくとも48プールを含む。いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、各基材に固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。いくつかの実施形態では、基材は、表面が2つ以上の基材を含みうるように表面の離散領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプター可変領域コード配列または免疫グロブリン可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物を含むキットが提供される。キットは、標的特異的領域と共に可変領域を増幅するようにプライマーを構成すべく、可変領域の標的特異的領域がある側とは反対の側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成されたプライマーをさらに含みうる。いくつかの実施形態では、プライマーおよび標的特異的領域は、可変領域を含む少なくとも1kbの核酸を増幅するように構成される。いくつかの実施形態では、キットのプライマーは、ユニークオリゴヌクレオチド種を含む組成物の一部分である。いくつかの実施形態では、キットのプライマーは、ユニークオリゴヌクレオチド種を含む組成物とは別の他の組成物の一部分である。
【0005】
いくつかの実施形態は、2つ以上のサンプルからの複数の核酸に特異的にバーコードを付ける方法を提供することを含む。各サンプルは核酸を含みうる。本方法は、各サンプルが他のサンプルから空間分離した状態で接触される条件で、各サンプルと少なくとも100ユニークオリゴヌクレオチド種を含むプールとを接触させることを含みうる。各ユニークオリゴヌクレオチド種は、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含みうる。各プールのユニークポリヌクレオチド種は、同一のサンプルバーコードを含みうるともに異なる分子バーコードを含みうる。本方法では、少なくとも、(a)サンプルに接触させるユニークオリゴヌクレオチド種は各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になること、または(b)すべてのユニークオリゴヌクレオチド種の分子バーコードは全体として12.5%以下のG含有率を有すること、を適用しうる。本方法は、ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域をサンプルの核酸の少なくともいくつかにハイブリダイズさせることを含みうる。本方法は、ハイブリダイズされたオリゴヌクレオチドを伸長させることにより、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖を生成することを含みうる。ただし、各サンプルでは、鎖は同一のサンプルバーコードと異なる分子バーコードとを含み、かつ異なるサンプルでは、分子バーコードは異なる。いくつかの実施形態では、バーコード領域は、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含む。いくつかの実施形態では、各プールの少なくとも100ユニークオリゴヌクレオチド種は、所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、基材に固定される。いくつかの実施形態では、各サンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、各プールは、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、少なくとも48ユニークサンプルは、それぞれ、ユニークプールと接触させる。いくつかの実施形態では、サンプルの少なくとも99%は、それぞれ、1細胞以下である。いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、複数の基材のそれぞれに固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。いくつかの実施形態では、基材は、異なるプールの基材が空間分離された異なる表面領域を含むように空間分離された表面領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種のそれぞれは、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、可変領域は、T細胞レセプターもしくはB細胞レセプターのものまたはそれらの組合せである。いくつかの実施形態では、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む伸長鎖と、可変領域の標的特異的領域がある側とは反対の側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成されたプライマーと、を接触させることをさらに含む。このため、本方法は、T細胞レセプター、B細胞レセプター、または免疫グロブリンの可変領域をコードする配列を増幅することを含みうる。いくつかの実施形態では、本方法は、可変領域コード配列を含む少なくとも1kbの配列を増幅する。
【0006】
いくつかの実施形態は、ユニークオリゴヌクレオチドを含む組成物の作製方法を提供することを含む。本方法は、それぞれ少なくとも3ヌクレオチドを含む複数の異なるサンプルバーコードを提供することを含みうる。本方法は、それぞれ少なくとも7ヌクレオチドを含む複数の異なる分子バーコードを提供することを含みうる。本方法は、複数のユニークオリゴヌクレオチド種を合成することを含みうる。ただし、各ユニークオリゴヌクレオチド種は、サンプルバーコードと分子バーコードとを含むバーコード領域を含み、(a)複数のユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または(b)複数のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有するか、の少なくとも一方である。本方法は、空間分離されたプールにユニークオリゴヌクレオチド種を配設することを含みうる。ただし、各プールは、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むようにかつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように複数のユニークオリゴヌクレオチド種を含み、かつ各プールは、少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、バーコード領域の3’側に標的特異的領域をさらに含み、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、複数のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、各分子バーコードは、50%以下のG含有率を有する。いくつかの実施形態では、各サンプルバーコードは、50%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のサンプルバーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列を含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドの各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側のスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、少なくとも48プールが作製される。いくつかの実施形態では、本方法は、複数の基材のそれぞれに固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、各プールのユニークオリゴヌクレオチド種を基材に固定することをさらに含む。いくつかの実施形態では、基材は離散表面領域を含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成と同時に配設される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成の後に配設される。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、キットは、可変領域コード配列の標的特異的領域がある側とは反対の側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、したがって、標的特異的領域と共に可変領域コード配列を増幅するように構成された、プライマーをさらに含む。
【0007】
いくつかの実施形態は、アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドを含む。バーコード領域は、少なくとも7ヌクレオチドを含む分子バーコードを含みうるとともに、分子バーコードは、50%以下のG含有率を有する。いくつかの実施形態では、オリゴヌクレオチドは、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の5’側にアダプター領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む。いくつかの実施形態では、免疫細胞レセプター可変領域コード配列は、T細胞レセプター可変領域コード配列、B細胞レセプター可変領域コード配列、またはそれらの組合せである。いくつかの実施形態では、キットは、可変領域コード配列の標的特異的領域がある側とは反対の側にハイブリダイズするようにかつ標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、したがって、標的特異的領域と共に可変領域コード配列を増幅するように構成された、プライマーをさらに含む。
【図面の簡単な説明】
【0008】
【
図1A-C】
図1Aは、本明細書のいくつかの実施形態に従ってユニフォーム領域の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。
図1Bは、本明細書のいくつかの実施形態に従ってオリゴdT配列の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。
図1Cは、本明細書のいくつかの実施形態に従って遺伝子特異的領域の5’側にバーコード領域を含むオリゴヌクレオチド種を例示する模式図である。
【0009】
【
図2A-B】
図2Aは、サンプルバーコードの5’側に分子バーコードを含むバーコード領域を例示する模式図であり、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種のバーコード領域を構成しうる。
図2Bは、分子バーコードの5’側にサンプルバーコードを含むバーコード領域を例示する模式図であり、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種のバーコード領域を構成しうる。
【0010】
【
図3A-D】
図3A~3Hは、本明細書のいくつかの実施形態に従ってオリゴヌクレオチド種のさまざまな構成を例示する図である。
図3Aは、ベースラインオリゴヌクレオチドを例示する。
図3Bは、バーコード領域の3’側に塩基スペーサーを有するオリゴヌクレオチドを例示する。
図3Cは、バーコード領域の3’側に5塩基スペーサーを有するオリゴヌクレオチドを例示する。
図3Dは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が
図3Aと比較して入れ替えられたオリゴヌクレオチドを例示する。
図3Eは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が
図3Aと比較して入れ替えられるとともに3塩基スペーサーを含むオリゴヌクレオチドを例示する。
図3Fは、分子バーコードがサンプルバーコードの5’側になるようにバーコード領域内の分子バーコード(「NNNNNNNN」で表される)およびサンプルバーコードの位置が入れ替えられるとともに5塩基スペーサーを含むオリゴヌクレオチドを例示する。
図3Gは、分子バーコードが配列HHHHHHHH(ただし、各Hは、A、C、またはTであり、かつ各Hは、いずれかの他のHと同一であっても異なっていてもよい)を含むオリゴヌクレオチドを例示する。
図3Hは、分子バーコードが配列HNHNHNHN(ただし、各Hは、A、C、またはTであり、かつ各Hは、いずれかの他のHと同一であっても異なっていてもよい)を含むオリゴヌクレオチドを例示する。
【0011】
【0012】
【
図4A】
図4Aは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
【0013】
【
図4B】
図4Bは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
【0014】
【
図4C】
図4Cは、従来のユニークオリゴヌクレオチド種のサンプリングにおけるヌクレオチド使用頻度を例示する図である。
【0015】
【
図5A】
図5Aは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
図5A~5Dの最も右側の列に指定された配列番号は、示されるように「アンカー」と「第1のbc」と「第2のbc」と「スペーサー」(もしあれば)と「5→3’認識配列」とを含むポリヌクレオチド配列を意味する。
図5A~5D中の各「アンカー」は、配列番号97のポリヌクレオチド配列を有する。
【0016】
【
図5B】
図5Bは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
【0017】
【
図5C】
図5Cは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
【0018】
【
図5D】
図5Dは、本明細書のいくつかの実施形態に従って構築されたオリゴヌクレオチド種の核酸配列を例示する図である。
【0019】
【
図6】
図6は、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種を用いた分析での個別によるエラー訂正のグラフである。
【0020】
【
図7】
図7は、本明細書のいくつかの実施形態に従ってユニークオリゴヌクレオチド種を用いた分析での個別およびフィルターMIクロスオーバーによるエラー訂正のグラフである。
【0021】
【
図8】
図8は、なんら理論により制限されるものではないが、高いG含有率を有するオリゴヌクレオチドから生じる可能性のある増幅エラーを模式的に例示する図である。
【発明を実施するための形態】
【0022】
本明細書のいくつかの実施形態に従って核酸の正確なバーコーディングおよび分析のための方法および組成物を記載する。いくつかの実施形態では、増幅およびシーケンス解析によりサンプルの個別核酸を定量できるように、サンプルの個別核酸をユニークバーコード(たとえば「分子バーコード」)に関連付けることが可能である。なんら理論により制限されるものではないが、ある特定の種類のバーコード配列の提示、増幅、または性質に有利または不利なバイアスは、サンプルの個別核酸の定量および分析を妨害する可能性があることが企図される(いくつかの増幅イベントにおける可能性のあるバイアス源を
図8に模式的に例示する)。本明細書のいくつかの実施形態には、バーコードを含むユニークオリゴヌクレオチド種の構成および特徴が記載されている。ただし、ユニークオリゴヌクレオチド種は、バーコード関連バイアスを最小限に抑えるようにかつ核酸の正確な分析をもたらすように構成される。なんら理論により制限されるものではないが、グアノシン(G)含有率が50%未満であることおよび/またはバーコード領域に2個の連続した「G」が存在しないことなどの特徴を含むバーコード領域は、さもなければサンプルの核酸の定量および/または分析を混乱させる可能性のあるバイアスを最小限に抑えることが可能であることが企図される。任意選択的に、所与のサンプルの個別核酸分子はまた、たとえば次世代シーケンシングによる2つ以上のサンプルからの核酸の効率的バッチ分析のためにバーコード関連核酸を後でプールできるように、「サンプルバーコード」に関連付けることも可能である。
【0023】
核酸
【0024】
本明細書のいくつかの実施形態に従って種々の核酸が記載されている。たとえば、オリゴヌクレオチド種、サンプル、および/または標的は、核酸を含みうる。
【0025】
本明細書で用いられる場合、「核酸」とは、ポリヌクレオチド配列またはその断片を意味する。核酸はヌクレオチドを含みうる。核酸は細胞に対して外因性または内因性でありうる。核酸は細胞フリー環境中に存在しうる。核酸は遺伝子またはその断片を含むか、またはからなるかまたはそれらから本質的になる。核酸はDNAを含むか、またはからなるかまたはそれらから本質的になる。核酸はRNAを含むか、またはからなるかまたはそれらから本質的になる。核酸は1つ以上のアナログ(たとえば、修飾された骨格、糖または核酸塩基)を含みうる。アナログのいくつかの例としては、限定されるものではないが、5-ブロモウラシル、ペプチド核酸、ゼノ核酸、モルホリノ体、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コルジセピン、7-デアザ-GTP、フルオロフォア(たとえば、糖に結合されたローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基アナログ、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、およびワイオシンが挙げられる。「核酸」、「ポリヌクレオチド」、「標的ポリヌクレオチド」、および「標的核酸」は、同義的に用いうる。
【0026】
本明細書で用いられる場合、「上流」(およびこのルート語の変化形)とは、核酸上の相対的に5’側(たとえば、参照位置と比較して5’側)の位置を意味する。本明細書で用いられる場合、「下流」(およびこのルート語の変化形)とは、核酸上の相対的に3’側(たとえば、参照位置と比較して3’側)の位置を意味する。たとえば、
図2Aに示されるように、「サンプルバーコード」が「分子バーコード」の3’側にあるということは、分子「バーコード」の下流にあるものと理解される。たとえば、
図2Bに示されるように、「サンプルバーコード」が「分子バーコード」の5’側にあるということは、分子「バーコード」の上流にあるものと理解される。
【0027】
核酸は、新しいまたは向上した特徴(たとえば、向上した安定性)を有する核酸を提供するために1つ以上の修飾(たとえば、塩基修飾、骨格修飾)を含みうる。核酸は核酸アフィニティータグを含みうる。ヌクレオシドは塩基-糖の組合せを含むか、またはからなるかまたはそれらから本質的になる。ヌクレオシドの塩基部分はヘテロ環塩基でありうる。かかるヘテロ環塩基の2つの最も一般的なクラスはプリンおよびピリミジンである。ヌクレオチドは、ヌクレオシドの糖部分に共有結合されたリン酸基をさらに含むヌクレオシドを含むか、またはからなるかまたはそれらから本質的になる。ペントフラノシル糖を含むヌクレオシドでは、リン酸基は、糖の2’、3’、または5’ヒドロキシル部分に結合可能である。核酸を形成する際、リン酸基は、隣接ヌクレオシドを互いに共有結合して線状高分子化合物を形成可能である。ひいては、この線状高分子化合物のそれぞれの末端をさらに連結して環状化合物を形成可能である。しかしながら、線状化合物が一般に好適である。そのほかに、線状化合物は、内部ヌクレオチド塩基相補性を有しうるので、完全二本鎖または部分二本鎖の化合物を生成するようにフォールディングしうる。核酸内では、リン酸基は、通常、核酸のヌクレオシド間骨格を形成するものとして参照可能である。核酸の結合または骨格は、3’→5’ホスホジエステル結合でありうる。
【0028】
核酸は、修飾骨格および/または修飾ヌクレオシド間結合を含みうる。修飾骨格は、骨格中にリン原子を保持するものおよび骨格中にリン原子を有していないものを含みうる。リン原子を中に含有する好適な修飾核酸骨格は、たとえば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、3’-アルキレンホスホネートや5’-アルキレンホスホネートなどのメチルや他のアルキルのホスホネート、キラルホスホネート、ホスフィネート、3’-アミノホスホルアミデートやアミノアルキルホスホルアミデートなどのホスホルアミデート、ホスホロジアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、セレノホスフェート、および通常3’-5’結合、2’-5’結合アナログを有するボラノホスフェート、ならびに1つ以上のヌクレオチド間結合が3’→3’、5’→5’、または2’→2’結合である逆極性を有するものを含みうる。
【0029】
核酸は、短鎖アルキルもしくはシクロアルキルのヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルのヌクレオシド間結合、または1つ以上の短鎖ヘテロ原子もしくはヘテロ環のヌクレオシド間結合により形成されるポリヌクレオチド骨格を含みうる。これらは、モルホリノ結合(ヌクレオシドの糖部分から部分的に形成される)、シロキサン骨格、スルフィド、スルホキシド、およびスルホン骨格、ホルムアセチルおよびチオホルムアセチル骨格、メチレンホルムアセチルおよびチオホルムアセチル骨格、リボアセチル骨格、アルケン含有骨格、スルファメート骨格、メチレンイミノおよびメチレンヒドラジノ骨格、スルホネートおよびスルホンアミド骨格、アミド骨格を有するもの、ならびに混合N、O、S、およびCH2構成部分を有する他のものを含みうる。
【0030】
核酸は核酸ミメティックを含みうる。「ミメティック」という用語は、たとえば、フラノース環のみまたはフラノース環とヌクレオチド間結合の両方が非フラノース基で置き換えられているポリヌクレオチドを含み、フラノース環のみの置換えは、糖サロゲートであるとして参照可能である。ヘテロ環塩基部分または修飾ヘテロ環塩基部分は、適切な標的核酸とのハイブリダイゼーションのために保持可能である。かかる核酸の1つはペプチド核酸(PNA)でありうる。PNAでは、ポリヌクレオチドの糖骨格は、アミド含有骨格とくにアミノエチルグリシン骨格で置換え可能である。ヌクレオチドは保持可能であり、かつ骨格のアミド部分のアザ窒素原子に直接的または間接的に結合される。PNA化合物中の骨格は、PNAにアミド含有骨格を与える2つ以上の結合されたアミノエチルグリシン単位を含みうる。ヘテロ環塩基部分は、骨格のアミド部分のアザ窒素原子に直接的または間接的に結合可能である。
【0031】
核酸はモルホリノ骨格構造を含みうる。たとえば、核酸は、リボース環の代わりに6員モルホリノ環を含みうる。これらの実施形態のいくつかでは、ホスホロジアミデートまたは他の非ホスホジエステルのヌクレオシド間結合によりホスホジエステル結合を置換え可能である。
【0032】
核酸は、モルホリノ環に結合されたヘテロ環塩基を有する結合されたモルホリノ単位(すなわちモルホリノ核酸)を含みうる。結合基は、モルホリノ核酸中のモルホリノモノマー単位を結合可能である。非イオン性モルホリノ系オリゴマー化合物は、細胞タンパク質とのより少ない望ましくない相互作用を有しうる。モルホリノ系ポリヌクレオチドは、核酸の非イオン性ミミックでありうる。モルホリノクラス内のさまざまな化合物は、異なる結合基を用いて連結可能である。ポリヌクレオチドミメティックのさらなるクラスは、シクロヘキセニル核酸(CeNA)として参照可能である。核酸分子中に通常存在するフラノース環は、シクロヘキセニル環で置換え可能である。CeNA DMT保護ホスホロアミダイトモノマーは、ホスホロアミダイト化学を用いたオリゴマー化合物合成のために調製および使用が可能である。核酸鎖中へのCeNAモノマーの取込みは、DNA/RNAハイブリッドの安定性を増加可能である。CeNAオリゴアデニレートは、天然複合体に類似した安定性を有する核酸相補体との複合体を形成可能である。さらなる修飾は、2’-ヒドロキシル基が糖環の4’炭素原子に結合されて2’-C,4’-C-オキシメチレン結合を形成することにより二環式糖部分を形成するロックド核酸(LNA)を含みうる。結合は、2’酸素原子と4’炭素原子とを架橋するメチレン(-CH2-),基(式中、nは1または2である)を含むか、またはからなるかまたはそれらから本質的になる。LNAおよびLNAアナログは、相補的核酸との非常に高い二本鎖熱安定性(Tm=+3~+10℃)、3’-エキソヌクレアーゼ分解に対する安定性、および良好な溶解性を示しうる。
【0033】
核酸はまた、いくつかの実施形態では、核酸塩基(単に「塩基」ということが多い)の修飾または置換を含みうる。本明細書で用いられる場合、「非修飾」または「天然」の核酸塩基は、プリン塩基(たとえば、アデニン(A)およびグアニン(G))ならびにピリミジン塩基(たとえば、チミン(T)、シトシン(C)、およびウラシル(U))を含みうる。修飾核酸塩基は、他の合成および天然の核酸塩基、たとえば、5-メチルシトシン(5-me-C)、5-ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2-アミノアデニン、アデニンおよびグアニンの6-メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2-プロピルおよび他のアルキル誘導体、2-チオウラシル、2-チオチミン、および2-チオシトシン、5-ハロウラシルおよびシトシン、5-プロピニル(-C=C-CH3)ウラシルおよびシトシン、ならびにピリミジン塩基の他のアルキニル誘導体、6-アゾウラシル、シトシン、およびチミン、5-ウラシル(プソイドウラシル)、4-チオウラシル、8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシル、および他の8-置換アデニンおよびグアニン、5-ハロとくに5-ブロモ、5-トリフルオロメチルおよび他の5-置換ウラシルおよびシトシン、7-メチルグアニンおよび7-メチルアデニン、2-F-アデニン、2-アミノアデニン、8-アザグアニンおよび8-アザアデニン、7-デアザグアニンおよび7-デアザアデニン、ならびに3-デアザグアニンおよび3-デアアデニンを含みうる。修飾核酸塩基は、三環式ピリミジン、たとえば、フェノキサジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾオキサジン-2(3H)-オン)、フェノチアジンシチジン(1H-ピリミド(5,4-b)(1,4)ベンゾチアジン-2(3H)-オン)、置換フェノキサジンシチジン(たとえば、9-(2-アミノエトキシ)-H-ピリミド(5,4-(b)(1,4)ベンゾオキサジン-2(3H)-オン)などのG-クランプ、カルバゾールシチジン(2H-ピリミド(4,5-b)インドール-2-オン)、ピリドインドールシチジン(Hピリド(3’,’:4,5)ピロロ[2,3-d]ピリミジン-2-オン)を含みうる。
【0034】
本明細書で用いられる場合、「サンプル」という用語は、標的を含む組成物を意味する。本開示の方法、デバイス、およびシステムによる分析に好適なサンプルとしては、細胞、単一細胞、組織、器官、または生物が含まれるがこれらに限定されない。いくつかの実施形態では、サンプルは、生サンプルまたは未処理サンプル、たとえば、全細胞、全細胞集団、または全組織を含む。いくつかの実施形態では、サンプルは、単離された細胞もしくは細胞抽出物またはそれらの核酸含有画分たとえば単離された核酸、あるいは富化または単離された核酸を含む組成物を含む。いくつかの実施形態では、サンプルは、固定された組織、細胞、またはそれらの核酸含有画分を含む。いくつかの実施形態では、サンプルは、凍結された組織、細胞、またはそれらの核酸含有画分を含む。いくつかの実施形態では、サンプルは、核酸を含む溶液を含む。いくつかの実施形態では、サンプルは、核酸を含む溶液を含む。いくつかの実施形態では、サンプルは、固体形態の核酸、たとえば、凍結乾燥された核酸などを含む。
【0035】
ユニークオリゴヌクレオチド種
本明細書のいくつかの実施形態に係る組成物、方法、およびオリゴヌクレオチドで用いられる場合、「ユニークオリゴヌクレオチド種」とは、他のユニークオリゴヌクレオチド種と少なくとも1塩基異なる配列を有するオリゴヌクレオチド(たとえば、DNA、RNA)を意味する。本明細書のいくつかの実施形態に係る組成物のユニークオリゴヌクレオチド種は、ある特定の構造上の特徴または形態を共有しうるが、互いに異なる核酸配列を有しうる。ユニークオリゴヌクレオチド種は、一本鎖または二本鎖でありうる。組成物は、2ユニークオリゴヌクレオチド種以上、たとえば、さまざまな100、1000、6500、または65,000ユニークオリゴヌクレオチド種を含みうる。任意選択的に、ユニークオリゴヌクレオチド種を含む組成物はまた、同一のユニークオリゴヌクレオチド種を2オリゴヌクレオチド以上含みうる。例として、組成物は、2ユニークオリゴヌクレオチド種:ACTT-XおよびTCTT-Xを含みうる。ただし、「X」は、両方のユニークオリゴヌクレオチド種で同一の配列である。組成物は、配列ACTT-Xを有するオリゴヌクレオチド2コピーと配列TCTT-Xを有するオリゴヌクレオチド1コピーとを含む可能性がありうる。
【0036】
本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドのオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域とユニフォーム領域とを含みうる。バーコード領域は、ユニークオリゴヌクレオチド種集団の多様性を提供するためにユニークオリゴヌクレオチド種間で異なりうるのに対し、ユニフォーム領域は同じままである。バーコード領域は、本明細書に記載されるように分子インデックスを含みうる。分子インデックスは、たとえば、ユニークオリゴヌクレオチド種集団中のユニークオリゴヌクレオチド種が50%超のG含有率の分子インデックスを持たないようにおよび/または配列「GG」が分子インデックス中に現われないように(たとえば、2個の連続したGが存在しないように)G含有率を最小限に抑えることにより、バイアスを最小限に抑えるように構成可能である。任意選択的に、バーコード領域はサンプルインデックスを含む。サンプルインデックスは、所与のプールのユニークオリゴヌクレオチドのサンプルインデックスは同一でありうるが分子インデックスは異なりうるように構成可能である。このため、複数のサンプルを分析する場合、サンプルインデックスは、各オリゴヌクレオチドがどのサンプルに対応するかを表すことが可能である。このため、ユニークオリゴヌクレオチド種が標的に結合した後、ユニークオリゴヌクレオチド種をプール可能であるとともに配列を分析可能である。いくつかの実施形態では、サンプルインデックスは分子インデックスの5’側にある。いくつかの実施形態では、分子インデックスはサンプルインデックスの5’側にある。任意選択的に、ユニークオリゴヌクレオチド種はアダプターを含む。アダプターは、バーコード領域の5’側に位置決め可能である。いくつかの実施形態では、アダプターは、ユニークオリゴヌクレオチド種を基材に固定するように構成される。
【0037】
なんら理論により制限されるものではないが、本明細書のいくつかの実施形態に従って構成されたユニークオリゴヌクレオチド種は、たとえば、分子バーコードまたはバーコード領域のG含有率を最小限に抑えることによりおよび/またはユニフォーム領域の近傍のG含有率を最小限に抑えることにより、正確な分析および低減バイアス、最小バイアス、または無バイアスのシーケンシング結果をもたらしうることが企図される。例として、バイアスの低減は、サンプル中の標的核酸の個別分子の数を検出する際のノイズの低減および/または感度の増加により確認可能である(たとえば、
図6~7を参照されたい)。いくつかの実施形態では、バイアスの低減は、ノイズの減少として(
図6参照)、たとえば、サンプル中に検出される標的核酸分子の数のより小さい標準誤差として、確認可能である。いくつかの実施形態では、バイアスの低減は、感度の増加として(
図7参照)、たとえば、サンプル中の標的核酸の個別分子のより多くの数の検出(たとえば、より少ない標的核酸分子の見落とし)として、確認可能である。このため、いくつかの実施形態では、組成物および方法は、低ノイズで、たとえば、30%未満の相対標準誤差で、たとえば、列挙された値の任意の2つの間の範囲を含めて30%未満、25%未満、20%未満、15%未満、10%未満、5%未満、4%未満、3%未満、2%未満、1%未満、または.01%未満の相対標準誤差で、サンプル中の標的核酸分子の定量をもたらす。いくつかの実施形態では、組成物および方法は、高感度で、たとえば、(検出されるサンプル中の個別標的核酸の実際の数に対するパーセントとして測定される)感度で、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも70%、75%、80%、85%、90%、85%、96%、97%、98%、99%、99.9%の感度で、サンプル中の標的核酸分子の定量をもたらす。いくつかの実施形態では、本明細書に記載の方法または組成物は、
図3Aに一致するユニークオリゴヌクレオチド種を含む組成物または方法と比べて感度を増加させるか、相対標準誤差を減少させるか、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
【0038】
図3Aは、従来のオリゴヌクレオチド設計を例示する。分子インデックス配列NNNNNNNN(ただし、各Nは、A、G、C、またはTであり、かつNの任意の2つは、互いに同一であっても異なっていてもよい)は、2個以上の連続したGを含みうることおよび/または50%超のG含有率を有しうることに留意されたい。たとえば、
図3Aに一致するユニークオリゴヌクレオチド種の集団のサブセットは、Gリッチでありうる。なんら理論により制限されるものではないが、
図3Aの構成に基づく集団中の少なくともいくつかのユニークオリゴヌクレオチド種は、優先してバイアスをもたらしうることが企図される。バイアスを受ける可能性のある「ベースライン」分子インデックスの他の例は、配列「BBBBBBV」(ただし、Bは、C、G、またはTであり、かつVは、A、C、またはGである)である。本明細書のいくつかの実施形態に係るユニークオリゴヌクレオチド種の構成例は、
図3B~3Hに例示される。
図3B~Cに示されるように、本明細書のいくつかの実施形態に従って分子インデックスの後にTTTまたはTTTTTのいずれかを付加することにより、その領域に沿ったGリッチ度を低減することが可能である(非Gスペーサーの長さは可変でありうるとともに任意の1つまたは複数の非Gヌクレオチドを含みうる)。
図3Dでは、サンプルインデックスおよび分子の位置は、ユニークオリゴヌクレオチド種の少なくともサブセット中の高Gリッチの可能性のあるMIが潜在的にGリッチな遺伝子特異的標的領域に隣接しないように、(分子インデックスがサンプルインデックスの5’側になるように)入れ替えられる。
図3E~Fでは、
図3Dに例示される構成にTTTまたはTTTTTのいずれかを付加することにより、潜在的Gリッチ領域をさらに最小限に抑えることが可能である。なんら理論により制限されるものではないが、サンプルバーコードは(たとえば「非Gリッチ」になるように)しばしば低G含有率を有しうることに留意されたい。非Gスペーサーの長さは可変でありうるとともに任意の非Gヌクレオチドでありうることにさらに留意されたい)。
図3G~Hの構成では、分子バーコードは、「HHHHHHHH」または「HNHNHNHN」(ただし、Hは、A、C、またはTであり、かつ任意の2つのHは、互いに同一であっても異なっていてもよく、かつ任意の2つのNは、互いに同一であっても異なっていてもよい)を含む。
【0039】
いくつかの実施形態では、組成物または方法における複数のユニークオリゴヌクレオチド種のそれぞれ(たとえば、ユニークオリゴヌクレオチド種のそれぞれ)は、少なくとも24ヌクレオチド長、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135または140ヌクレオチド長、たとえば、24~140、24~135、24~130、24~125、24~120、24~115、24~110、24~105、24~100、24~95、24~90、24~85、24~80、24~75、24~70、24~65、24~60、24~55、24~50、24~45、24~40、25~140、25~135、25~130、25~125、25~120、25~115、25~110、25~105、25~100、25~95、25~90、25~85、25~80、25~75、25~70、25~65、25~60、25~55、25~50、25~45、25~40、27~140、27~135、27~130、27~125、27~120、27~115、27~110、27~105、27~100、27~95、27~90、27~85、27~80、27~75、27~70、27~65、27~60、27~55、27~50、27~45、27~40、30~140、30~135、30~130、30~125、30~120、30~115、30~110、30~105、30~100、30~95、30~90、30~85、30~80、30~75、30~70、30~65、30~60、30~55、30~50、30~45、30~40、35~140、35~135、35~130、35~125、35~120、35~115、35~110、35~105、35~100、35~95、35~90、35~85、35~80、35~75、35~70、35~65、35~60、35~55、35~50、35~45、35~40、40~140、40~135、40~130、40~125、40~120、40~115、40~110、40~105、40~100、40~95、40~90、40~85、40~80、40~75、40~70、40~65、40~60、40~55、40~50、または40~45ヌクレオチド長を有する。任意選択的に、組成物または方法における異なるユニークオリゴヌクレオチド種は、互いに異なる長さを有する。任意選択的に、組成物または方法におけるユニークオリゴヌクレオチド種はすべて、互いに同一の長さを有する。任意選択的に、組成物または方法におけるいくつかのユニークオリゴヌクレオチド種は、互いに同一の長さであり、一方、いくつかのユニークオリゴヌクレオチド種は、互いに異なる長さである。
【0040】
いくつかの実施形態では、ユニフォーム領域は、標的核酸または標的核酸クラスに対する5’→3’増幅用配列を含むか、それらからなるか、またはそれらから本質的になる(この増幅用配列は、「標的特異的」領域としても参照しうる)。たとえば、標的核酸がmRNAを含む場合、ユニフォーム領域はオリゴdTを含みうる。たとえば、標的核酸がT細胞レセプターの可変領域を含む場合、ユニフォーム領域は、T細胞レセプターmRNAの可変領域にフランキングする配列を含みうる。いくつかの実施形態では、ユニフォーム領域は、標的核酸に相補的な少なくとも10ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド、たとえば、10~30、10~29、10~28、10~27、10~26、10~25、10~24、10~23、10~22、10~21、10~20、11~30、11~29、11~28、11~27、11~26、11~25、11~24、11~23、11~22、11~21、11~20、12~30、12~29、12~28、12~27、12~26、12~25、12~24、12~23、12~22、12~21、12~20、15~30、15~29、15~28、15~27、15~26、15~25、15~24、15~23、15~22、15~21、15~20、20~30、20~29、20~28、20~27、20~26、20~25、20~24、20~23、20~22、または20~21ヌクレオチドを含む。いくつかの実施形態では、ユニフォーム領域は、免疫細胞レセプターの可変領域、たとえば、T細胞レセプター、B細胞レセプター、または免疫グロブリンの可変領域をコードする配列にフランキングする配列にハイブリダイズする標的特異的領域たとえば抗体を含む。B細胞レセプターは膜結合免疫グロブリンを含むので、免疫グロブリン可変領域コード配列に特異的な標的特異的領域は、典型的には、B細胞レセプターさらには分泌免疫グロブリン(たとえば抗体)の増幅に好適であることに留意されたい。両選択肢は、本明細書では、膜結合免疫グロブリン(B細胞レセプター)さらには分泌免疫グロブリン(抗体)の増幅が企図されることを明確化するものであることに留意されたい。本明細書で用いられる場合、プライマーまたはユニフォーム領域が、免疫細胞レセプターおよび/または免疫グロブリンの可変領域の「フランキング配列」(およびこのルート語の変化形、たとえば「フランキングする配列」)を含む標的特異的領域を含む場合、標的特異的領域が、(i)可変領域をコードする配列の下流(3’側)にハイブリダイズするとともにとくにコード配列の鎖にハイブリダイズする配列、したがって、5’→3’方向の伸長時に可変領域コード配列の逆相補体を含む鎖を生成するよう構成された配列、または(ii)可変領域をコードする配列の上流(5’側)にハイブリダイズするとともにとくにコード配列の鎖に相補的な鎖にハイブリダイズする配列、したがって、5’→3’方向の伸長時に可変領域コード配列を含む鎖を生成するように構成された配列、の少なくとも一方を含むものと理解されることは、理解されよう。そのため、フランキング配列は、好適なプライミングパートナー(たとえば、可変領域の他方の側のフランキング配列)と共に可変領域コード配列の増幅を行うように構成可能である。コード配列が開始または終了する位置でフランキング配列が必ずしも正確に終了または開始する必要がないことは、理解されよう。そのため、フランキング配列のハイブリダイゼーション部位と可変領域コード配列自体との間に介在配列を存在させうる。フランキング配列は、一般的には、広範にわたる可能な可変領域コード配列を増幅するために可変領域コード配列の外側の配列にハイブリダイズするが、いくつかの実施形態では、たとえば、可能な可変領域のサブセットが対象である場合、可変領域「フランキング配列」が可変領域自体のいくらかの配列をさらに含むことは、理解されよう。しかしながら、本明細書で用いられる「フランキング配列」は、可変領域の両側にフランキングする単一の配列を必要とするものではない。より正確には、フランキング配列が本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドとの関連で記載される場合、可変領域コード配列を増幅するのに好適なプライマー対を含む5’および3’配列が明示的に企図されることは、理解されよう。
【0041】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域を含むとともに、免疫細胞レセプターおよび/または免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含むユニフォーム領域を含む。ユニフォーム領域の標的特異的領域と共に可変領域配列を増幅するために、可変領域コード配列の他方の側に第2のオリゴヌクレオチドプライマーも提供可能である。いくつかの実施形態では、ユニフォーム領域は、免疫グロブリン可変領域にフランキングする(したがって、B細胞レセプター可変領域さらには対応する抗体可変領域にフランキングする)配列、たとえば、免疫グロブリン重鎖遺伝子座の可変領域にフランキングする配列、免疫グロブリン(軽鎖)κ遺伝子座の可変領域にフランキングする配列、または免疫グロブリン(軽鎖)λ遺伝子座の可変領域にフランキングする配列を含む、バーコード領域の3’側に位置決めされた標的特異的領域を含む。いくつかの実施形態では、ユニフォーム領域は、T細胞レセプターα鎖の可変領域、T細胞レセプターβ鎖の可変領域、T細胞レセプターγ鎖の可変領域、またはT細胞レセプターδ鎖の少なくともの1つにフランキングする配列を含む、バーコード領域の3’側に位置決めされた標的特異的領域を含む。
【0042】
いくつかの実施形態では、キットは、本明細書に記載されるようにユニークオリゴヌクレオチド種を含む組成物を含み、ユニークオリゴヌクレオチド種は、それぞれ、本明細書に記載されるように免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングするユニフォーム配列を含む。いくつかの実施形態では、キットは、ユニフォーム領域と比較して可変領域コード配列の他方の側の対向鎖にハイブリダイズするように構成された、したがって、ユニフォーム領域の標的特異的領域と共に可変領域配列を増幅するように構成された、オリゴヌクレオチドプライマーをさらに含む。いくつかの実施形態では、増幅された配列は、少なくとも1kbであり、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも1kb、2kb、3kb、4kb、または5kbの可変コード配列を含む。
【0043】
いくつかの免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする核酸は、1kb超の長さでありうることに留意されたい。たとえば、T細胞レセプター可変領域配列は、CDR1コード配列が開始される位置から1kb超離れて終了するCDR3コード配列を含みうる。理論により限定されるものではないが、いくつかの従来および次世代のシーケンシング法、たとえば、合成シーケンシングは、典型的には1kbよりもかなり短いショートリードに限定されることに留意されたい。したがって、本明細書のいくつかの実施形態に係る方法および組成物およびキットは、他の手段では1kb未満のシングルリードシーケンシングに適合しないと思われる免疫細胞レセプターおよび/または免疫グロブリンの可変領域をコードする核酸にバーコードを付けて分析するのに有用でありうることが企図される。したがって、いくつかの実施形態では、ユニークオリゴヌクレオチド種は、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含み、可変領域コード配列を含む少なくとも1kbの配列、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも1kb、2kb、3kb、4kb、または5kbの配列を増幅するように構成される。
【0044】
バーコード領域
本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドによれば、バーコード領域は、核酸、たとえば、サンプルからの標的核酸またはサンプルの単一の標的核酸に由来するアンプリコンもしくは逆転写物を同定するのに有用な核酸配列を含む。たとえば、サンプルからの2種のmRNA転写物は、第1のmRNAに対応する核酸が第1のバーコードを含むようにかつ第2のmRNAに対応する核酸が第2のバーコードを含むように、逆転写およびバーコード付けが行われる。シーケンシング(または他の分析)の際、サンプル中の個別mRNAに関する情報、たとえば、コピー数は、増幅後でさえも確認可能である。しかしながら、mRNAの大集団が確率的に標識されていくつかのバーコードがより有利に提示されると(たとえば、安定性、増幅効率などに起因して)、バイアスを生じてサンプルの核酸を定量する能力が歪められる可能性がある。このため、本明細書のいくつかの実施形態によれば、集団中の各ユニークオリゴヌクレオチド種は、ユニークバーコード領域を含みうる。バーコードの多様性が大きいほど、ユニークオリゴヌクレオチド種の多様性は大きくなり、特定のバーコード配列がサンプルの標的核酸1つのみに関連付けられる可能性は高くなる。バーコード領域は、たとえば、オリゴヌクレオチド種のユニフォーム領域の5’側に位置決めしうる。いくつかの実施形態では、バーコード領域は、本明細書に記載されるように分子バーコードを含む。任意選択的に、バーコード領域は、本明細書に記載されるように分子バーコードとサンプルバーコードとを含む。任意選択的に、バーコード領域は、サンプルバーコードの5’側に分子バーコードを含む。いくつかの実施形態では、本明細書に記載されるように分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。本明細書で用いられる場合、「分子バーコード(molecule barcode)」は、「分子バーコード(molecular barcode)」、「分子インデックス(MI)」、またはユニーク分子識別子(UMI)としても参照可能である。本明細書で用いられる場合、「サンプルバーコード」は、「サンプルインデックス」(SI)としても参照可能である。
【0045】
バーコード領域は分子バーコードを含みうる。分子バーコードはユニーク配列を含みうるので、複数のサンプル核酸(互いに同一であってもおよび/または異なっていてもよい)が分子バーコードに1対1に関連付けられたとき、異なるサンプル核酸を分子バーコードにより互いに区別可能である。このため、サンプルがたとえ同一の配列を有する2つの核酸を含んでいたとしても、これらの2つの核酸のそれぞれを異なる分子バーコードで標識可能であるので、増幅後でさえも集団中の核酸を定量可能である。分子バーコードは、少なくとも5ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチド、たとえば、5~50、5~45、5~40、5~35、5~30、5~25、5~20、5~15、5~14、5~13、5~12、5~11、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~40、6~35、6~30、6~25、6~20、6~15、6~14、6~13、6~12、6~11、6~10、6~9、6~8、6~7、7~50、7~45、7~40、7~35、7~30、7~25、7~20、7~15、7~14、7~13、7~12、7~11、7~10、7~9、7~8、8~50、8~45、8~40、8~35、8~30、8~25、8~20、8~15、8~14、8~13、8~12、8~11、8~10、8~9、9~50、9~45、9~40、9~35、9~30、9~25、9~20、9~15、9~14、9~13、9~12、9~11、9~10、10~50、10~45、10~40、10~35、10~30、10~25、10~20、10~15、10~14、10~13、10~12、または10~11ヌクレオチドの核酸配列を含みうる。いくつかの実施形態では、分子バーコードの核酸配列は、たとえば、組成物中の各ユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、ユニーク配列を含む。いくつかの実施形態では、2ユニークオリゴヌクレオチド種以上は、同一の分子バーコードを含みうるが、依然として互いに異なる。たとえば、ユニークオリゴヌクレオチド種がサンプルバーコードを含む場合、特定のサンプルバーコードを有する各ユニークオリゴヌクレオチド種は、異なる分子バーコードを含みうる。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも1000種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも6,500種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物は、少なくとも65,000種の異なる分子バーコードの分子バーコード多様性、したがって、少なくとも65,000ユニークオリゴヌクレオチド種を含む。
【0046】
なんら理論により制限されるものではないが、低G含有率(たとえば、50%G以下、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)の分子バーコードは、核酸集団にバーコードを付けるためにユニークオリゴヌクレオチド種の組成物またはプールを使用する場合、バイアスを最小限に抑えることが企図される(たとえば、より高いG含有率のバーコードを優先的に増幅する可能性のあるバイアスを最小限に抑える)。従来のバーコーディング法は、典型的には、より高いG含有率に有利なバイアスを呈することに留意されたい。たとえば、
図4A、4B、および4Cは、ES32、TRAC(
図4A)、ES32 TRBC(
図4B)、およびES32 オリゴdT(
図4C)に対する多数のユニーク分子バーコードを含む組成物の従来の分子バーコードのヌクレオチド使用頻度のサンプルを例示する。すなわち、どちらかといえば、本明細書に提供されるある特定の指針を考慮せずに設計された従来の分子バーコードおよびバーコード領域は、ランダムチャンスで予想されるより高いG含有率を含みうる。いくつかの実施形態では、本明細書に記載されるように分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
【0047】
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む本明細書に記載の方法に使用される組成物または組成物の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%GのG含有率を有する。「ユニークオリゴヌクレオチド種の組成物の分子バーコードがすべて、全体として…のG含有率を有する」とは、全組成物中の分子バーコードのすべてにわたる全G含有率を計算した場合(たとえば、少なくとも10、50、100、200、500、1000、2000、5000、6500、10,000、20,000、30,000、40,000、50,000、60,000、または65,000ユニークオリゴヌクレオチド種の集団)、バーコード全体のこの全G含有率が、挙げられた値未満または挙げられた範囲内でありうることを意味する。それでもなお個別ユニークオリゴヌクレオチド種が指示値超または指示範囲外のG含有率の分子バーコードを有する可能性がありうるが、組成物のユニークオリゴヌクレオチド種の総ヌクレオチド含有率は、指示値未満または指示範囲内でありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物中の分子バーコードはすべて、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、本明細書に記載の組成物のバーコード領域はすべて、本明細書に記載されるように全体として50%未満のG含有率を有する。
【0048】
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物は、それぞれ50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの分子バーコードG含有率のユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。「組成物が、それぞれ…未満の分子バーコードG含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる」とは、組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種のそれぞれまたは本質的にそれぞれが指示値未満または指示範囲外の分子バーコードG含有率を有することを意味する。すなわち、それぞれ指示G含有率を有するユニークオリゴヌクレオチド種「から本質的になる」組成物、集団、またはプールでは、組成物中のユニークオリゴヌクレオチドの解析的に有意でない部分は、指示値超または挙げられた範囲外のG含有率の分子バーコードを有する可能性がありうる。たとえば、ユニークオリゴヌクレオチドの解析的に有意でない部分は、組成物中のユニークオリゴヌクレオチドの5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%、0.1%でありうるかまたはそれらを超えないかもしくはそれら未満でありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、50%超のG含有率を有する。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドの組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドの組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有する分子バーコードを含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、25%超のG含有率を有する。任意選択的に、組成物のユニークオリゴヌクレオチド種の分子バーコードはいずれも、全体として50%G超のG含有率を有していない。たとえば、ユニークオリゴヌクレオチド種の分子バーコードはすべて、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。
【0049】
いくつかの実施形態では、本明細書に記載の組成物(または方法に使用されるかかる組成物)は、本明細書に記載されるようにそれぞれ50%未満のバーコード領域G含有率を含むユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物では、組成物は、それぞれ50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gのバーコード領域G含有率を含むユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。「組成物が、それぞれ…未満のバーコード領域G含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる」とは、組成物中、集団中、またはプール中のユニークオリゴヌクレオチド種のそれぞれまたは本質的にそれぞれが指示値未満または指示範囲外の分子バーコードG含有率を有することを意味する。すなわち、それぞれ指示G含有率を有するユニークオリゴヌクレオチド種「から本質的になる」組成物、集団、またはプールでは、組成物中のユニークオリゴヌクレオチドの解析的に有意でない部分は、指示値超または挙げられた範囲外のG含有率のバーコード領域を有する可能性がありうる。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、50%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて50%超のG含有率を有する。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチドを含む組成物中のユニークオリゴヌクレオチド種の1%未満は、25%超のG含有率を有するバーコード領域を含む。たとえば、ユニークオリゴヌクレオチド種の1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.05%未満、0.01%未満、0.001%未満、または0.0001%未満は、列挙された値の任意の2つの間の範囲を含めて25%超のG含有率を有する。任意選択的に、組成物のユニークオリゴヌクレオチド種のバーコード領域はいずれも、全体として50%G超のG含有率を有していない。たとえば、ユニークオリゴヌクレオチド種のバーコード領域はすべて、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。
【0050】
いくつかの実施形態では、組成物(または方法に使用されるかかる組成物)は、それぞれダブレット「HN」(ただし、各「H」は、A、C、またはTのいずれかであり、かつ「N」は、A、G、C、またはTのいずれかである)の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートの配列を含む分子バーコードを有するユニークオリゴヌクレオチド種からなるかまたはそれらから本質的になる。ダブレット「HN」の複数のリピートの例としては、HN、HNHN、HNHNHN、およびHNHNHNHNが挙げられる。式「HN」は塩基含有率に対する制約を記述するが、すべてのHまたはすべてのNが同一である必要も異なる必要もあるわけではないことに留意されたい。たとえば、組成物中のユニークオリゴヌクレオチド種の分子バーコードがHNHNHNを含む場合、ある分子バーコードは配列ACTGCAを含みうるのに対して、他の分子バーコードは配列TAACTAを含みうるとともに、他の分子バーコードは配列AGACACを含みうる。任意のリピート数のダブレット「HN」は50%以下のG含有率を有しうることに留意されたい。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも1000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも6500ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも95%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、少なくとも65,000ユニークオリゴヌクレオチド種を含む組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、ダブレット「HN」の少なくとも3リピート、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20リピートを含む分子バーコードを含む。いくつかの実施形態では、組成物は、それぞれ配列HNHNHNを含む分子バーコードを有する少なくとも1000、6500、または65,000ユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、組成物は、それぞれ配列HNHNHNHNを含む分子バーコードを有する少なくとも1000、6500、または65,000ユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、本明細書に記載の組成物のバーコード領域の少なくとも95%、99%、または99.9%は、本明細書に記載されるようにダブレット「HN」の少なくとも3リピートを含む。なんら理論により制限されるものではないが、分子バーコードの利用可能なヌクレオチド配列の数を相対的に大きくすることは、たとえば、オリゴヌクレオチド種のサイズを最小限に抑えつつ、各標的核酸がユニークに標識される可能性と共に所与の配列長内のバーコードの多様性を増加させるために、サンプルからの標的核酸の集団にバーコードを付ける際に役立ちうることに留意されたい。分子バーコードおよび/またはバーコード領域のG含有率を限定することは、バーコードを構築できる利用可能なヌクレオチドの数(および核酸の長さ当たりの利用可能な異なる配列の数)を減少させることになるので、こうしたバーコードおよびバーコード領域の多様性を限定する可能性があることに留意されたい。このため、本明細書の種々の実施形態に係る分子バーコードまたはバーコード領域にいくつかのGを有することは、多様性を増加させるのに役立ちうるとともに、一方、G含有率を限定することは、バイアスを最小限に抑えるのに役立ちうる。「HN」ダブレットの繰返しを含む配列は、バイアスを最小限に抑えたまま比較的短い配列で比較的高い多様性が得られるように、バイアスを低減することと比較的多くの利用可能なヌクレオチド配列を維持することとの間の折合いをつけつつ、低いバイアスをもたらしうることが観測されており、このことに留意されたい(実施例2および
図6~7を参照されたい)。いくつかの実施形態では、本明細書に記載されるように「HN」ダブレットの繰返しを含む分子バーコードを含むユニークオリゴヌクレオチド種を含む方法または組成物は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
【0051】
いくつかの実施形態では、組成物(または方法に使用されるかかる組成物)は、少なくとも6個の連続した「H」(ただし、各「H」は、A、C、またはTのいずれかである)、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードをそれぞれ含むユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になる。式「H」は塩基含有率に対する制約を記述するが、すべてのHが同一である必要も異なる必要もあるわけではないことに留意されたい。たとえば、集団中のユニークオリゴヌクレオチド種の分子バーコードがそれぞれ配列HHHHを含んでいた場合、ユニークオリゴヌクレオチド種の分子バーコードの1つはACTAを含みうるとともに、他のユニークオリゴヌクレオチド種の分子バーコードの1つはTTACを含みうるし、他のユニークオリゴヌクレオチド種の分子バーコードの1つはACATを含みうる。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも1000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも6500ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも95%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、組成物は、少なくとも65,000ユニークオリゴヌクレオチド種を含むか、それらからなるか、またはそれらから本質的になり、これらのユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含む分子バーコードを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列、たとえば、列挙された値の任意の2つの間の範囲を含めてHとNとが交互に少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個現れる配列を含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
【0052】
いくつかの実施形態では、本明細書に記載の組成物(または方法に使用されるかかる組成物)のユニークオリゴヌクレオチド種の少なくとも95%(たとえば、95%、96%、97%、98%、99%、またはそれ以上)は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。いくつかの実施形態では、本明細書に記載の組成物のユニークオリゴヌクレオチド種の少なくとも99%は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。いくつかの実施形態では、本明細書に記載の組成物のユニークオリゴヌクレオチド種の少なくとも99.9%は、少なくとも6個の連続したH、たとえば、本明細書に記載される列挙された値の任意の2つの間の範囲を含めて少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したHを含むバーコード領域を含む。
【0053】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種のサンプルバーコードは、50%以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
【0054】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種のバーコード領域は、50%以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
【0055】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満、たとえば、列挙された値の任意の2つの間の範囲を含めて12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
【0056】
いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%未満、たとえば、列挙された値の任意の2つの間の範囲を含めて12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
【0057】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも99%は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、ユニークオリゴヌクレオチド種のすべてまたは実質的にすべてで、分子バーコードのいずれのGも他のGに隣接しない。
【0058】
各バーコード領域は、サンプルバーコードを任意選択的に含みうる。本明細書のいくつかの実施形態の組成物、方法、およびオリゴヌクレオチドによれば、プール中の各ユニークオリゴヌクレオチド種は、同一のサンプルバーコードを含みうるが、異なるサンプルバーコードにそれぞれ関連付けられるプールが2つ以上存在しうる。このため、プール#1中のユニークオリゴヌクレオチド種はすべてまたは本質的にすべて、サンプルバーコード#1を含みうるとともに、プール#2中のユニークオリゴヌクレオチド種はすべてまたは本質的にすべて、サンプルバーコード#2を含みうる。たとえば、ハイブリダイゼーションおよび増幅により、第1のサンプルからの核酸は、プール#1中のユニークオリゴヌクレオチド種に関連付け可能であり、かつ第2のサンプルからの核酸は、プール#2中のユニークオリゴヌクレオチド種に関連付け可能である。このため、第1のサンプルに対応する増幅核酸はすべてまたは本質的にすべて、サンプルバーコード#1を含むであろう(ただし、異なる分子バーコードを含みうる)。そして第2のサンプルに対応する増幅核酸はすべて、サンプルバーコード#2を含むであろう。いくつかの実施形態では、少なくとも24、48、96、または192プールが存在する。
【0059】
サンプルバーコードは、少なくとも3ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50ヌクレオチド、たとえば、3~50、3~45、3~40、3~35、3~30、3~25、3~20、3~15、3~14、3~13、3~12、3~11、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~50、4~45、4~40、4~35、4~30、4~25、4~20、4~15、4~14、4~13、4~12、4~11、4~10、4~9、4~8、4~7、4~6、4~5、5~50、5~45、5~40、5~35、5~30、5~25、5~20、5~15、5~14、5~13、5~12、5~11、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~40、6~35、6~30、6~25、6~20、6~15、6~14、6~13、6~12、6~11、6~10、6~9、6~8、6~7、7~50、7~45、7~40、7~35、7~30、7~25、7~20、7~15、7~14、7~13、7~12、7~11、7~10、7~9、7~8、8~50、8~40、8~35、8~30、8~25、8~20、8~15、8~14、8~13、8~12、8~11、8~10、8~9、9~50、9~45、9~40、9~35、9~30、9~25、9~20、9~15、9~14、9~13、9~12、9~11、9~10、10~50、10~45、10~40、10~35、10~25、10~20、10~15、10~14、10~13、10~12、または10~11ヌクレオチドの核酸配列を含みうる。いくつかの実施形態では、サンプルバーコードの核酸配列は、たとえば、集団中の各ユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、ユニーク配列を含む。
【0060】
なんら理論により制限されるものではないが、比較的Gリッチなサンプルバーコードをユニフォーム領域から分離させることによりバイアスを最小限に抑えるべく、低G含有率(たとえば、50%G未満、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)のサンプルバーコードは、比較的高いG含有率のサンプルバーコードの3’側かつユニフォーム領域(たとえば、標的特異的配列またはオリゴdT配列)の5’側に位置決め可能であることが企図される。いくつかの実施形態では、バーコード領域は、50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率のサンプルバーコードを含む。
【0061】
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物のユニークオリゴヌクレオチドのサンプルバーコードの少なくとも95%は、それぞれ、50%G未満、たとえば、列挙された値の任意の2つの間の範囲を含めて45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率を有する。
【0062】
いくつかの実施形態では、ユニークオリゴヌクレオチド種を含む組成物(または方法に使用されるかかる組成物)では、組成物のユニークオリゴヌクレオチドのサンプルバーコードの少なくとも99%は、それぞれ、50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%G、たとえば、2.5~50%G、2.5~45%G、2.5~40%G、2.5~35%G、2.5~30%G、2.5~25%G、2.5~20%G、2.5~15%G、2.5~10%G、2.5~7.5%G、2.5~5%G、5~50%G、5~45%G、5~40%G、5~35%G、5~30%G、5~25%G、5~20%G、5~15%G、5~10%G、5~7.5%G、7.5~50%G、7.5~45%G、7.5~40%G、7.5~35%G、7.5~30%G、7.5~25%G、7.5~20%G、7.5~15%G、7.5~10%G、10~50%G、10~45%G、10~40%G、10~35%G、10~30%G、10~25%G、10~20%G、10~15%G、10~12.5%G、12.5~50%G、12.5~45%G、12.5~40%G、12.5~35%G、12.5~30%G、12.5~25%G、12.5~20%G、12.5~15%G、15~50%G、15~45%G、15~40%G、15~35%G、15~30%G、15~25%G、15~20%G、20~50%G、20~45%G、20~40%G、20~35%G、20~30%G、または20~25%Gの含有率を有する。すなわち、ユニークオリゴヌクレオチド集団内では、サンプルバーコードの1%未満は、50%超のG含有率を有する。いくつかの実施形態では、組成物のユニークオリゴヌクレオチド種は、本明細書に記載されるように、それぞれ50%未満のG含有率のサンプルバーコードを有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。
【0063】
いくつかの実施形態では、バーコード領域は、バーコード領域とユニフォーム領域との間に介在配列をなんら含むことなくユニフォーム領域の5’側に位置決めされる。いくつかの実施形態では、バーコード領域は、スペーサーがバーコード領域とユニフォーム領域との間になるように、ユニフォーム領域の5’側に位置決めされたスペーサーの5’側に位置決めされる。任意選択的に、スペーサーは、低G含有率(たとえば、50%G以下、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満)を有する。スペーサーは、少なくとも1ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50ヌクレオチド、1~50、1~45、1~35、1~30、1~25、1~20、1~15、1~10、1~9、1~8、1~7、1~6、1~5、1~4、1~3、1~2、2~50、2~45、2~35、2~30、2~25、2~20、2~15、2~10、2~9、2~8、2~7、2~6、2~5、2~4、2~3、3~50、3~45、3~35、3~30、3~25、3~20、3~15、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~50、4~45、4~35、4~30、4~25、4~20、4~15、4~10、4~9、4~8、4~7、4~6、4~5、5~50、5~45、5~35、5~30、5~25、5~20、5~15、5~10、5~9、5~8、5~7、5~6、6~50、6~45、6~35、6~30、6~25、6~20、6~15、6~10、6~9、6~8、6~7、7~50、7~45、7~35、7~30、7~25、7~20、7~15、7~10、7~9、7~8、8~50、8~45、8~35、8~30、8~25、8~20、8~15、8~10、8~9、9~50、9~45、9~35、9~30、9~25、9~20、9~15、9~10、10~50、10~45、10~35、10~30、10~25、10~20、または10~15ヌクレオチドの長さを有しうる。いくつかの実施形態では、スペーサーは、少なくとも2個の連続した非Gヌクレオチド(「H」(ただし、「H」は、A、C、またはTである)で表される)、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個の連続したH、たとえば、2~20、2~15、2~10、2~9、2~8、2~7、2~6、2~5、2~4、2~3、3~20、3~15、3~10、3~9、3~8、3~7、3~6、3~5、3~4、4~20、4~15、4~10、4~9、4~8、4~7、4~6、4~5、5~20、5~15、5~10、5~9、5~8、5~7、5~6、6~20、6~15、6~10、6~9、6~8、または6~7個を含みうる。いくつかの実施形態では、スペーサーのヌクレオチドはTである。たとえば、スペースは、TT、TTT、TTTT、TTTTT、TTTTTT、TTTTTTTT、TTTTTTTTTTなどのポリT配列を含みうる。スペーサーは必ずしも多様性を提供するわけではないので、本明細書に記載のユニークオリゴヌクレオチド種を含む組成物では、ユニークオリゴヌクレオチド種の一部または全部は同一のスペーサー配列を有しうることに留意されたい。任意選択的に、組成物のユニークオリゴヌクレオチド種はすべて、同一のスペーサー配列を含む。
【0064】
プールおよびプーリング
本明細書のいくつかの実施形態の組成物および方法に従って記載されるユニークオリゴヌクレオチド種を含む組成物は、たとえば、1サンプル/プールで複数のサンプルを分析できるように、空間分離されたプールに配設可能である。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに配設され、各プールは、同一のプールのユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含むように、かつ同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含むように、ユニークオリゴヌクレオチド種の複数のユニークオリゴヌクレオチドを含む。本明細書で用いられる場合、「空間分離」(およびこのルート語の変化形)とは、他のプールと実質的に交差反応することなくかつプールのユニークオリゴヌクレオチド種が他のサンプルの標的核酸に実質的にハイブリダイズすることなく、サンプルの標的核酸がプールのユニークオリゴヌクレオチド種にハイブリダイズ可能であることを意味する。このため、サンプルバーコードは、所与のユニークオリゴヌクレオチド種がどのプールに由来したかを同定可能である。さらに、ユニークオリゴヌクレオチド種で標的核酸配列にバーコードを付けることにより、サンプルバーコードは、バーコード付き標的核酸配列(またはその逆転写物またはアンプリコン)がどのプールに由来したかを同定可能である。
【0065】
いくつかの実施形態では、基材は、互い空間分離されるようにプールを構築する。たとえば、マルチウェルプレートは、各プールが個別ウェルに存在するように空間分離されたプールを構築可能である。たとえば、各プールは、異なるビーズに固定可能である。任意選択的に、マルチウェルプレートの各ウェルは、ユニークオリゴヌクレオチド種の異なるプールがマルチウェルプレートの各ウェルに位置決めされるように、ユニークオリゴヌクレオチド種のプールが固定される単一のビーズを含有しうる。
【0066】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2プール、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも2、3、4、4、5、6、7、8、9、10、11、12、13、14の15、16、17、18、19、20、21の22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、72、96、99、100、110、120、144、168、または192プールに配設される。任意選択的に、少なくとも100ユニークオリゴヌクレオチド/プールが存在しうる。
【0067】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも2プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
【0068】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも24プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
【0069】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも48プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
【0070】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、少なくとも96プールに配設され、かつ少なくとも100ユニークオリゴヌクレオチド/プール、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、4000、5000、6000、6500、10,000、または65,000ユニークオリゴヌクレオチド種/プールが存在する。
【0071】
基材
本明細書のいくつかの実施形態の組成物および方法に係るユニークオリゴヌクレオチド種は、ビーズ、マルチウェルプレートのウェル、アレイなどの基材に固定可能である。たとえば、同一のサンプルバーコードただし異なる分子バーコードを有するユニークオリゴヌクレオチド種はすべて、単一ビーズやマルチウェルプレートの単一ウェルなどの基材に固定可能である。このため、特定の基材に固定されたユニークオリゴヌクレオチド種と単一細胞などの特定のサンプルとを接触させた場合、その基材に固定されたユニークオリゴヌクレオチド種は、同一のサンプルの標的核酸に関連付けられるであろう。同一の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを有し、一方、他の基材上のものが異なるサンプルバーコードを有する場合、各標的核酸に関連付けられたサンプルは容易に同定可能である(たとえば、基材#1上のユニークオリゴヌクレオチド種はすべて、サンプルバーコード#1を有し、基材#2上のユニークオリゴヌクレオチド種はすべて、サンプルバーコード#2を有する)。
【0072】
いくつかの実施形態では、ユニークオリゴヌクレオチド種を基材に固定するかかる構成は、効率およびスループットの向上に役立ちうる。たとえば、単一細胞は、1個以下の単一細胞が各ウェルに存在するようにマルチウェルプレートのウェルに添加可能である。所与のウェル内(たとえば、ウェル上またはビーズ上)に固定されたユニークオリゴヌクレオチド種がユニークサンプルバーコードを含む場合、単一細胞に対応するバーコード付き標的核酸ならびにその逆転写物およびアンプリコンは、複数のサンプルからのバーコード付き逆転写物またはアンプリコンをプールしたとしても、同定および定量が可能である。
【0073】
基材はあるタイプの固体担体を含みうる。基材は、本開示の方法を行いうる連続した固体または半固体の表面を意味しうる。基材は、たとえば、アレイ、カートリッジ、チップ、デバイス、およびスライドを意味しうる。このため、「固体担体」および「基材」は同義的に用いうる。
【0074】
本明細書のいくつかの実施形態に係る基材または固体担体は、核酸を(たとえば共有結合または非共有結合で)固定しうるプラスチック、セラミック、金属、または高分子材料(たとえばヒドロゲル)で構成された任意のタイプの中実、多孔性、または中空のスフェア、ボール、ベアリング、シリンダー、または他の類似の構成体を包含しうる。基材または固体担体は、球状(たとえばマイクロスフェア)でありうるまたは非球状もしくは不規則形状、たとえば、立方体形、直方体形、角錐形、円柱形、円錐形、扁球形、ディスク形などを有しうる離散粒子を含みうる。アレイ状に離間して配置された複数の固体担体は、基材を含まないこともありうる。固体担体は、「ビーズ」という用語と同義的に用いうる。
【0075】
いくつかの実施形態では、複数の基材を提供して、ユニーク基材がユニークサンプルバーコードを含みうるように複数の基材にサンプルバーコードの多様性を提示可能である。
【0076】
バーコーディング法
本明細書のいくつかの実施形態によれば、2サンプル以上からの核酸に特異的にバーコードを付ける方法が記載される。各サンプルは核酸を含みうる。本方法は、本明細書に記載されるように、各サンプルと複数のユニークオリゴヌクレオチド種を含むプールとを接触させることを含みうる。各サンプルは、他のサンプルから空間分離した状態で接触可能である。各プールのユニークポリヌクレオチド種は、同一のサンプルバーコードを含みうるとともに、異なる分子バーコードを含みうる。本方法は、ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域をサンプルの核酸の少なくともいくつかにハイブリダイズさせることを含みうる。本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的領域に相補的な配列とを含む鎖を生成するように、ハイブリダイズされたオリゴヌクレオチドを伸長させることを含みうる。そのため、各サンプルでは、生成された鎖は、同一のサンプルバーコードと異なる分子バーコードとを含みうる。異なるサンプルでは、サンプルバーコードが異なりうる。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。任意選択的に、各プールは、少なくとも100ユニークオリゴヌクレオチド種、たとえば、少なくとも100、500、100、500、1000、2000、6500、または65,000ユニークオリゴヌクレオチド種を含む。本明細書のいくつかの実施形態に係るかかる方法は、単一細胞の核酸の分析および定量が可能になるように、2つ以上の異なるサンプルたとえば単一細胞サンプルの核酸にバーコードを付けることが可能である。
【0077】
任意選択的に、各サンプルは、他のプールおよびサンプルから空間分離した状態でユニークオリゴヌクレオチド種の単一プールに接触させる。いくつかの実施形態では、プールは、ユニーク閉込め空間、たとえば、マルチウェルプレートの異なるウェル、異なる試験管、異なるマイクロ流体チャネルなど、に置くことにより空間分離される。いくつかの実施形態では、プールは、異なる表面領域、たとえば、アレイ上の反応ドット、に置くことにより空間分離される。
【0078】
オリゴヌクレオチドは、標準的ハイブリダイゼーション条件下で(たとえば、標準的緩衝液中で、かつ標的核酸に相補的なユニフォーム領域の部分のTm未満の温度で)サンプルの標的核酸に接触させうる。任意選択的に、たとえば、標的核酸がRNAを含む場合、サンプルの標的核酸は、DNA(たとえばcDNA)を生成するためにユニークオリゴヌクレオチド種へのハイブリダイゼーション後に逆転写される。任意選択的に、ハイブリダイゼーションまたは逆転写反応の産物は、DNAのライブラリーを生成するために増幅される。増幅は、標準的条件下でPCRにより、または他の好適な方法、たとえば、等温増幅、ローリングサークル増幅などにより、行いうる。任意選択的に、増幅は、5’→3’活性を有するポリメラーゼを用いて逆転写物またはハイブリダイズされた核酸を増幅することを含みうる。任意選択的に、増幅産物は、たとえばシーケンスによりさらに分析可能である。任意選択的に、異なるプールからの逆転写物またはアンプリコンは、異なるサンプルバーコードがそれぞれの個別バーコード付き核酸の対応するプール(およびサンプル)を表すので、シーケンシングのためのプール可能である。Gリッチな分子バーコードまたはユニークオリゴヌクレオチド種に有利なバイアスが存在しうることおよび本明細書のいくつかの実施形態に係る方法がかかるバイアスを最小限に抑えうるかまたは排除しうることに留意されたい。例として、単一核酸レベルでサンプルの核酸を定量する場合、いくつかの核酸の提示に有利で、サンプルの代表的な標的核酸ではなくある特定の種類のバーコードに有利になるように定量結果を歪める可能性のある、かかるバイアスを最小限に抑えるかまたは排除するのに有用でありうる。いくつかの実施形態では、本明細書に記載のユニークオリゴヌクレオチド種を含む方法は、感度を増加させることにより、相対標準誤差を減少させることにより、または感度を増加させるとともに標準誤差を低減することにより、バイアスを低減する。
【0079】
任意選択的に、本方法は、ユニークオリゴヌクレオチド種のオリゴヌクレオチドと標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含みうる。たとえば、ユニークオリゴヌクレオチドプローブのハイブリダイゼーションおよび伸長から生成された逆転写物ライブラリー、アンプリコンライブラリー、および/またはcDNAライブラリーはシーケンス可能である。当技術分野で公知の任意の好適なシーケンシング法、好ましくは高スループット法を使用可能である。たとえば、Roche454、Illumina Solexa、ABI-SOLiD、ION Torrent、Complete Genomics、Pacific Bioscience、Helicos、Polonatorプラットフォームなどのプラットフォームを用いたサイクリックアレイシーケンシングを利用することも可能である。シーケンシングは、MiSeqシーケンシングを含みうる。シーケンシングは、HiSeqシーケンシングを含みうる。適用可能であれば、ユニークオリゴヌクレオチド種は、高スループットシーケンシングを媒介するアダプターたとえばユニバーサルプライミング部位を含みうる。任意選択的に、2つ以上の異なるサンプルに対応する(たとえば、2つ以上の異なるプールからの)バーコード付き核酸は、シーケンシングのためにプーリングまたは組合せが可能である。任意選択的に、プールはすべて、シーケンシングのために組合せまたはプーリングが可能である。なんら理論により制限されるものではないが、サンプルバーコードは、組み合わされたバーコード付き核酸の対応するサンプル(またはプール)を同定しうること、核酸の組合せまたはプーリングは、シーケンシングのスループットおよび/または資源利用を向上させうること、ならびに本明細書のいくつかの実施形態に係る正確なバーコーディングは、多数の異なる核酸を分析する場合でさえもバイアスを最小限に抑えまたは排除しうること、に留意されたい。
【0080】
いくつかの実施形態では、各プールのバーコード領域は、本明細書に記載されるように少なくとも3ヌクレオチド、たとえば、列挙された値の任意の2つの間の範囲を含めて少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドを含むサンプルバーコードを含む。任意選択的に、サンプルバーコードは分子バーコードの3’側に位置決めされる。任意選択的に、分子バーコードはサンプルバーコードの3’側に位置決めされる。任意選択的に、ユニークオリゴヌクレオチド種は、他のプールのユニークオリゴヌクレオチド種とは異なるサンプルバーコードでありうる同一のサンプルバーコードを含む。任意選択的に、サンプルバーコードは、本明細書に記載されるように低G含有率、たとえば、50%G未満、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、または2.5%G未満を有する。任意選択的に、サンプルバーコードの少なくとも95%、99%、または99.9%、本明細書に記載されるように低G含有率を有する。任意選択的に、各ユニークオリゴヌクレオチドは、本明細書に記載されるように分子バーコードの3’側かつユニフォーム領域の5’側にスペーサーを含む。
【0081】
いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種は、各分子バーコードが本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の少なくとも95%の分子バーコードは、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の少なくとも99%の分子バーコードは、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを含む。いくつかの実施形態では、サンプルに接触させるユニークオリゴヌクレオチド種の分子バーコードはすべて、本明細書に記載されるように50%未満のG含有率、たとえば、45%G未満、40%G、35%G、30%G、25%G、20%G、15%G、12.5%G、10%G、7.5%G、5%G、もしくは2.5%Gの含有率、または0%Gの含有率を有する分子バーコードを含む。
【0082】
いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として50%G未満、たとえば、列挙された値の任意の2つの間の範囲を含めて45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。
【0083】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側にユニフォーム領域をさらに含む。任意選択的に、ユニフォーム領域は、標的核酸配列に相補的な少なくとも10ヌクレオチド(たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド)を含み、かつかかるヌクレオチドは、標的核酸配列の5’→3’増幅用として構成される。任意選択的に、ユニフォーム領域はオリゴdT配列を含む。
【0084】
いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、基材に固定される。例として、基材は、マルチウェルプレート(たとえば、24、48、および96ウェルプレート)のウェル、アレイ上のスポット、ビーズなどを含みうる。いくつかの実施形態では、少なくとも100ユニークオリゴヌクレオチドが各基材に固定される。任意選択的に、所与の基材(ひいては同一のプール)に固定されたユニークオリゴヌクレオチド種はすべて、同一のサンプルバーコードを含む。いくつかの実施形態では、各サンプルバーコードは、50%以下、たとえば、50%以下、40%以下、25%以下、20%以下、12.5%以下、10%以下、または5%以下のG含有率を有する。
【0085】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%未満、たとえば、12.5%未満、10%未満、7.5%未満、5%未満、2.5%未満、または1%未満のG含有率を有する。
【0086】
いくつかの実施形態では、ユニークオリゴヌクレオチド種のバーコード領域は、全体として12.5%以下、たとえば、12.5%以下、10%以下、7.5%以下、5%以下、2.5%以下、または1%以下のG含有率を有する。
【0087】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%は、分子バーコードのいずれのGも他のGに隣接しない。たとえば、ユニークオリゴヌクレオチド種の少なくとも95%、96%、97%、98%、99%、99.5%、99.9%、または99.99%は、分子バーコードのいずれのGも他のGに隣接できない。
【0088】
いくつかの実施形態では、各プールは、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種からなるかまたはそれから本質的になる。
【0089】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、HとNとが交互に合計で少なくとも6個現れる配列、たとえば、列挙された値の任意の2つの間の範囲を含めてHとNとが交互に少なくとも6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個現れる配列を含む。例として、HとNとが交互に6個現れるものは、HNHNHNとして表しうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。
【0090】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HNHNHNHNを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。
【0091】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも99%は、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。
【0092】
いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含む。任意選択的に、スペーサーは配列HNHを含みうる。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。任意選択的に、スペーサーは配列HHHを含みうる。任意選択的に、スペーサーは配列HNHNHNHNを含みうる。任意選択的に、スペーサーは配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、各ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、前記スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
【0093】
いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。
【0094】
いくつかの実施形態では、標的特異的領域は、標的核酸の5’→3’増幅用の配列を含みうる。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、標的特異的領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む。
【0095】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。
【0096】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。
【0097】
いくつかの実施形態では、各プールは少なくとも1000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。
【0098】
いくつかの実施形態では、少なくとも48ユニークサンプルは、それぞれ、ユニークオリゴヌクレオチド種の異なるプールに接触させる。たとえば、少なくとも48、72、96、120、144、168、または192サンプルは、それぞれ、異なるプールに接触させうる。たとえば、各サンプルは、マルチウェルプレートのウェルのユニークオリゴヌクレオチド種の異なるプールに接触させうる。
【0099】
いくつかの実施形態では、サンプルの少なくとも99%は、それぞれ、1細胞以下である。たとえば、サンプルの少なくとも99%、99.5%、99.9%、または99.99%は、1細胞以下でありうる。例として、複数の細胞を含む溶液は、各サンプルが1細胞以下になる可能性が好適に高くなるように、適切な濃度に希釈可能である。
【0100】
いくつかの実施形態では、各プールのユニークオリゴヌクレオチド種は、各基材に固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように基材に固定される。このため、各プールは、特定のサンプルバーコードにより同定可能である。異なる基材(ひいては異なるプール)は異なるサンプルバーコードに関連付け可能であることに留意されたい。いくつかの実施形態では、基材は、異なるプールの基材が空間分離された異なる表面領域を含むように空間分離された表面領域を含む。いくつかの実施形態では、基材は、マルチウェルプレートのウェルを含む。いくつかの実施形態では、基材はビーズを含む。
【0101】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、基材にユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域は、アダプターの3’側にある。任意選択的に、各アダプターは、たとえば、シーケンシングに使用するために、ユニバーサルプライミング部位を含みうる。
【0102】
ユニークオリゴヌクレオチド種を含む組成物の作製方法
本明細書のいくつかの実施形態によれば、ユニークオリゴヌクレオチドを含む組成物の作製方法が記載される。本方法は、本明細書に記載されるように複数の異なるサンプルバーコードを提供することを含みうる。本方法は、本明細書に記載されるように複数の異なる分子バーコードを提供することを含みうる。本方法は、本明細書に記載されるように複数のユニークオリゴヌクレオチド種を合成することを含みうる。ただし、各ユニークオリゴヌクレオチド種は、本明細書に記載されるようにサンプルバーコードと分子バーコードとを含むバーコード領域を含む。本方法は、空間分離されたプールに複数のユニークオリゴヌクレオチド種を配設することを含みうる。各プールは、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むように、かつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように、複数のユニークオリゴヌクレオチド種を含みうる。任意選択的に、ユニークオリゴヌクレオチド種は、空間分離されたプールに合成と同時に配設される。任意選択的に、ユニークオリゴヌクレオチド種は、空間分離されたプールに合成の後に配設される。任意選択的に、組成物は、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる。任意選択的に、すべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。任意選択的に、組成物は、各分子バーコードが50未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になり、かつすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として12.5%以下のG含有率を有する。いくつかの実施形態では、それぞれ空間分離されたプールは、少なくとも100ユニークオリゴヌクレオチド種、たとえば、少なくとも100、200、300、400、500、1000、2000、3000、5000、6500、または65,000ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、それぞれ空間分離されたプールは、少なくとも1000ユニークオリゴヌクレオチド種を含む。
【0103】
ユニークオリゴヌクレオチドは、いくつかの好適な方法のいずれかを用いて合成可能である。いくつかの実施形態では、サンプルバーコード配列および分子バーコード配列は、in silicoで生成され、そしてサンプルバーコード配列と分子バーコード配列とを共に含むユニークオリゴヌクレオチド種は、たとえば、化学オリゴヌクレオチド合成を用いて合成される。いくつかの実施形態では、同一のサンプルバーコード配列を含む複数のオリゴヌクレオチドは、空間分離した状態でプールされ、そして、たとえば、ハイブリダイゼーションおよび伸長によりまたはライゲーションにより、分子バーコードを含む複数のオリゴヌクレオチドに連結される。かかる方法は、複数のユニークオリゴヌクレオチド種を得るために、並行的または逐次的に複数の空間分離された環境で行うことが可能である。
【0104】
任意選択的に、各ユニークオリゴヌクレオチド種は、本明細書に記載されるようにバーコード領域の3’側にユニフォーム領域をさらに含む。任意選択的に、ユニフォーム領域は標的特異的領域を含む。いくつかの実施形態では、標的特異的領域は、標的核酸に相補的な少なくとも10ヌクレオチド(たとえば、列挙された値の任意の2つの間の範囲を含めて標的に相補的な少なくとも10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、または30ヌクレオチド)を含み、かつ標的核酸配列の5’→3’増幅用として構成される。任意選択的に、ユニフォーム領域はオリゴdT配列を含む。
【0105】
いくつかの実施形態では、複数の分子バーコード(ひいては複数のユニークオリゴヌクレオチド種)は、各分子バーコードが本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有するユニークオリゴヌクレオチド種から本質的になる。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%の分子バーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも99%の分子バーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードはすべて、本明細書に記載されるように50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する分子バーコードを有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種の各分子バーコードは、50%以下のG含有率、たとえば、50%G未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。
【0106】
いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種の分子バーコードは、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満、または0%GのG含有率を有する。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種の分子バーコード、全体として12.5%以下のG含有率を有する。
【0107】
いくつかの実施形態では、各サンプルバーコードは、本明細書に記載されるように50%以下のG含有率、たとえば、50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G未満の含有率、または0%Gの含有率を有する。
【0108】
いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種のサンプルバーコードは、全体として50%G以下、たとえば、列挙された値の任意の2つの間の範囲を含めて50%未満、45%G未満、40%G未満、35%G未満、30%G未満、25%G未満、20%G未満、15%G未満、12.5%G未満、10%G未満、7.5%G未満、5%G未満、もしくは2.5%G、または0%GのG含有率を有する。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種のすべてのユニークオリゴヌクレオチド種のサンプルバーコード、全体として12.5%以下のG含有率を有する。
【0109】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の少なくとも95%(たとえば、少なくとも95%、96%、97%、98%、99%、99.5%、99.9%、または99.99%)は、分子バーコードのいずれのGも他のGに隣接しない。いくつかの実施形態では、複数のユニークオリゴヌクレオチド種は、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる。
【0110】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%は、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HNHNHNHNを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HNHNHNHNを含む。
【0111】
いくつかの実施形態では、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも99%は、配列HHHHHHHHを含む分子バーコードを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。たとえば、ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%、96%、97、%、98%、99%、99.5%、99.9%、または99.99%は、配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、ユニークオリゴヌクレオチド種の各分子バーコードは、配列HHHHHHHHを含む。
【0112】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含む。任意選択的に、スペーサーは配列HNHを含みうる。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。任意選択的に、スペーサーは配列HHHを含みうる。任意選択的に、スペーサーは配列HNHNHNHNを含みうる。任意選択的に、スペーサーは配列HHHHHHHHを含みうる。各Hはいずれかの他のHと同一であっても異なっていてもよく、かつ各Nはいずれかの他のNと同一であっても異なっていてもよいことに留意されたい。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、バーコード領域の3’側かつ標的特異的領域の5’側のスペーサーを含み、前記スペーサーは、配列HNHNHNHNを含む。ただし、各「H」は、A、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである。いくつかの実施形態では、ユニークオリゴヌクレオチドは、バーコード領域の3’側かつ標的特異的領域の5’側にスペーサーを含み、スペーサーは、配列HHHHHHHHを含む。ただし、各「H」は、A、C、またはTのいずれか1つである。
【0113】
いくつかの実施形態では、少なくとも1プールは、同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む。いくつかの実施形態では、プールは、同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない。
【0114】
いくつかの実施形態では、標的特異的領域は、標的核酸の5’→3’増幅用の配列を含みうる。いくつかの実施形態では、標的特異的領域はオリゴdT配列を含む。いくつかの実施形態では、標的特異的領域は、免疫細胞レセプターまたは免疫グロブリンの可変領域をコードする配列にフランキングする配列を含む。
【0115】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、分子バーコードがサンプルバーコードの3’側にある。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は、サンプルバーコードが分子バーコードの3’側にある。
【0116】
いくつかの実施形態では、各ユニークオリゴヌクレオチド種は少なくとも24ヌクレオチド長を有する。いくつかの実施形態では、各ユニークオリゴヌクレオチド種は24~140ヌクレオチド長を有する。
【0117】
いくつかの実施形態では、各プールは少なくとも6,500ユニークオリゴヌクレオチド種を含む。いくつかの実施形態では、各プールは少なくとも65,000ユニークオリゴヌクレオチド種を含む。
【0118】
いくつかの実施形態では、本方法は、各基材に固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、それぞれ空間識別可能なプールのユニークオリゴヌクレオチド種を基材に固定することをさらに含む。このため、各プールは、特定のサンプルバーコードにより同定可能である。異なる基材(ひいては異なるプール)は異なるサンプルバーコードに関連付け可能であることに留意されたい。いくつかの実施形態では、基材は、異なるプールの基材が異なる離散表面領域を含むように離散表面領域を含む。いくつかの実施形態では、基材は、マルチウェルプレートのウェルを含む。いくつかの実施形態では、基材はビーズを含む。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、共有結合により基材に固定される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、磁力または電磁力により基材に固定される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、基材に固定するために基材に埋め込まれる。
【0119】
いくつかの実施形態では、空間識別可能な少なくとも48プール、たとえば、空間識別可能な少なくとも48、72、96、120、144、168、または192プールが作製される。
【0120】
いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成と同時に配設される。いくつかの実施形態では、ユニークオリゴヌクレオチド種は、空間分離されたプールに前記合成の後に配設される。
【0121】
オリゴヌクレオチド
いくつかの実施形態では、アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドが記載される。バーコード領域は、本明細書に記載されるように分子バーコードを含みうるとともに、分子バーコードは、50%以下のG含有率を有する。分子バーコードは少なくとも7ヌクレオチドを含みうる。
【0122】
いくつかの実施形態では、オリゴヌクレオチドは、本明細書に記載されるようにサンプルバーコードをさらに含む。サンプルバーコードは、少なくとも3ヌクレオチドを含みうる。
【0123】
いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の3’側にユニフォーム領域をさらに含む。いくつかの実施形態では、ユニフォーム領域は、本明細書に記載されるように標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む。いくつかの実施形態では、ユニフォーム領域はオリゴdT配列を含む。いくつかの実施形態では、オリゴヌクレオチドは、バーコード領域の5’側にアダプター領域をさらに含む。いくつかの実施形態では、オリゴヌクレオチドは、本明細書に記載されるようにバーコード領域の3’側かつユニフォーム領域の5’側にスペーサーをさらに含む。
【0124】
代替実施形態
いくつかの実施形態では、核酸転写物の正確で偏りのないバーコーディングの設計が提供される。このプライマー設計は、遺伝子特異的方法を介して特異的核酸(DNA/RNA)転写物を標的としうるまたは(たとえば、メッセンジャーRNAのポリAテールもしくは他のコンセンサス配列を介して)一群の多くの核酸転写物を標的としうる核酸配列(DNA、RNA、またはLNA)で構成される(
図1A~C)。標的配列と共に、こうしたプライマーは、2つのカテゴリーの核酸バーコード、すなわち、1)「分子バーコード(molecular barcodes)」、分子インデックス(MI)、またはユニーク分子識別子(UMI)とも呼ばれる分子バーコード(molecule barcodes)と、2)サンプルインデックス(SI)とも呼ばれるサンプルバーコードと、を含む(
図1A~C)。MIおよびSIバーコードは、次世代シーケンシング法または他のシーケンスリードアウト法およびバーコードリードアウト法のためのライブラリー調製の後、MIおよびそのサンプル源(SI)を介してその元の標的転写物を同定すべくユニークに標識するために使用される。いくつかの実施形態では、正確な遺伝子発現プロファイリングのために標的転写物にバーコードを偏りなくランダムに標識することを保証するプライマー内のMIおよびSIの異なる配置が詳述される(たとえば、
図3A~3Hを参照されたい)(Fu et al.2011 PNAS 108:9026-9032(ランダム標識化の考察に関してその全体が本出願をもって参照により組み込まれる))を見る)。
【0125】
いくつかの実施形態では、他のバーコード組成と比較して高Gヌクレオチド含有率のバーコードがより高頻度で使用される先行技術において観測される現象である「バーコードバイアス」を低減可能なユニークプライマー設計を設計する(
図4)。遺伝子特異的配列を用いてmRNA転写物を標的として標識するために従来のプライマーを使用するある特定の場合には、高い%のG含有率と複数のGとを有するMIが好ましくは観測される(
図4)。さらに、なんら理論により制限されるものではないが、従来の設計の範囲内で、標的遺伝子に関連付けられないSIを用いると、サンプルマルチプレックスPCR時にこうしたプライマーがクロス反応するため、少量のPCRエラーが観測される(
図4~5)。こうしたクロスオーバーイベントは、おそらくGリッチオリゴヌクレオチドの「G四重鎖」と呼ばれるユニーク二次構造が原因で、多くの場合、高い%のG含有率と複数のGとを有するプライマーで起こる。こうしたGリッチMI/SIプライマーは互いに分子間および分子内複合体を形成する可能性があるので、プライマーを除去する従来のDNAクリーンアップ工程(たとえば、Ampure XPビーズ)は十分でないこともありうる。こうしたイベントが起こるのを最小限に抑えるために、本発明では、プライマーのG含有率を低減して「バーコードバイアス」およびプライマークロスオーバーを最小限に抑えるいくつかの設計を提供することが必要とされる(
図3A~3H)。
【0126】
図3A~3Hは、先行技術のバーコードレイアウトの設計(
図3A)と、記載の通りバイアスを最小限に抑える新規な設計(
図3B~H)と、を示す。
図3Aでは、従来の設計は、「BBBBBBV」または「NNNNNNNN」(Bは、C、G、またはTであり、Vは、A、C、またはGであり、Nは、A、T、G、またはCである)のMI組成のいずれかを可能にする。従来設計のMIバーコードのサブセットはGリッチでありうる。パネル3B~Cでは、MIの後にTTTまたはTTTTTのいずれかを付加することにより領域に沿ってGリッチ度を低減する(非Gスペーサーの長さは可変でありうるとともに、任意の非Gヌクレオチドでありうる)。
図3Dでは、高GリッチなMIが潜在的にGリッチな遺伝子特異的標的領域に隣接しないように
図3Aと比較してSI位置とMI位置とを入れ替える。
図3E~Fでは、
図3Dの設計にTTTまたはTTTTTのいずれかを付加することによりGリッチ領域をさらに低減する(SIはGリッチではなく、しかも非Gスペーサーの長さは可変でありうるとともに、任意の非Gヌクレオチドでありうることに留意されたい)。
図3G~Hの設計では、MIは、「HHHHHHHH」または「HNHNHNHN」(ただし、Hは、A、C、またはTである)を用いてGリッチにならないように設計される。
【0127】
従来の設計のGリッチの欠点は、遺伝子特異的ターゲッティング法が使用されるときに最も多く観測される。いくつかの実施形態は、T細胞レセプター(TCR)などの遺伝子特異的標的パネルで新しいプライマー設計を使用することを含み、TCRの場合、プライマーは、TCR特異的配列を標的とするために使用される。本明細書のいくつかの実施形態に係る設計では、SIバーコードクロスオーバーを軽減可能であるので、TCR分子バーコーディングアッセイの「ノイズ」が低減される。
【実施例】
【0128】
実施例1:ユニークオリゴヌクレオチド種を用いたサンプル標的核酸の正確な分析
96フォーマットのユニークオリゴヌクレオチド種を設計した。それらの配列は
図5A~5E(配列番号1~96)にまとめられている。ユニークオリゴヌクレオチド種のフォーマットA01~A12(配列番号1~12)は、分子バーコード(「第2のbc」)がNNNNNNNNである対照として提供した。このため、これらの対照ユニークオリゴヌクレオチド種の分子バーコードは、G含有率に関する制約や限定をなんら有していなかった。ユニークオリゴヌクレオチド種のフォーマットB01~B12(配列番号13~24)は、分子バーコード(「第2のbc」)の3’側かつユニフォーム領域(「5’→3’認識配列」)の5’側に配列TTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットC01~C12(配列番号25~36)は、分子バーコード(「第2のbc」)の3’側かつユニフォーム領域(「5’→3’認識配列」」)の5’側に配列TTTTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットD01~D12(配列番号37~48)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)を含んでいた。ユニークオリゴヌクレオチド種のフォーマットE01~E12(配列番号49~60)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)およびバーコード領域の3’側かつユニフォーム領域の
5’側に配列TTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットF01~F12(配列番号61~72)は、サンプルバーコード(「第2のbc」)の5’側に分子バーコード(「第1のbc」)およびバーコード領域の3’側かつユニフォーム領域の
5’側に配列TTTTTのスペーサーを含んでいた。ユニークオリゴヌクレオチド種のフォーマットG01~G12(配列番号73~84)は、それぞれ配列HHHHHHHH(ただし、各「H」は、A、C、またはTであり、かつ任意の2つの「H」ヌクレオチドは、同一であっても異なっていてもよい)を含む分子バーコード(「第2のbc」)を含んでいた。ユニークオリゴヌクレオチド種のフォーマットH01~H12(配列番号85~96)は、それぞれ配列HNHNHNHN(ただし、各「H」は、A、C、またはTであり、かつ任意の2つの「H」ヌクレオチドは、同一であっても異なっていてもよく、かつ各「N」は、A、G、C、またはTでありうるとともに、任意の2つの「N」ヌクレオチドは、同一であっても異なっていてもよい)を含む分子バーコード(「第2のbc」)を含んでいた。
【0129】
標的T細胞レセプターの核酸配列の増幅および分析は、次のように行った。すなわち、Precise(商標)TCRエンコーディングプレート(BD Cellular Research Inc.)を室温で解凍し、そして短時間遠心して各ウェルに5μLの試薬を捕集した。プレートを96ウェルラックに配置し、ウェル内の試薬の擾乱を回避しつつ非常に注意深く氷上でシールを除去した。細胞を選別してまたは直接に96ウェルエンコーディングプレートに添加した(1細胞/ウェル)。プレートをシールし、そして短時間撹拌(5~10s)して混合し、次いで短時間遠心(約1000rpm×10s)した。選別サンプルプレートは、Precise(商標)プロトコルの開始の準備ができるまで任意選択的に-80℃で貯蔵可能である。逆転写のために、プレートを65℃で3分間インキュベートし、4℃に冷却し、次いで氷上に5分間配置した。反応マスターミックスは、次の通りであった。
【0130】
【0131】
5μLのRT MMを各ウェルにピペッティングした。各プレートをシールし、逆転写酵素プログラムを次のように実施した。42℃30分間、80C5分間、4C休止。
【0132】
cDNA精製は次のプロトコルを用いて行った。プレートを遠心する(1000rpm×10s)。すべての反応を組み合わせて単一2mL管に入れる。8μLのPrecise DBPミックスをプールcDNA管に添加する。穏やかに撹拌して緩衝液を溶液状態にする。プールRT反応産物(1×体積のプールPCR産物)の入った単一チューブに等価体積のAMPure XPビーズを添加する。上下にピペッティングしてサンプルとビーズとを混合する。ビーズミックスを室温で5分間インキュベートする。キャップを開けてビーズの擾乱がないことを確認する。管を磁石の上に置いて液体とビーズとが分離するまで待つ。液体は除去前に完全に透明になっていなければならない。これには5分間かかる。管を磁石の上に保持しながら液体のみを注意深く除去し廃棄する。管をマグネットスタンドの上に保持しながら2mLの70%EtOH/30%H2Oを用いてビーズを穏やかに1回濯ぐ。蒸発を回避するために新鮮なEtOH溶液を毎日調製する。注意を払って濯ぎ工程時にビーズの擾乱や再懸濁が起こらないようにしうる。ピペットを用いてすべての残留EtOH溶液をただちに除去する。管を磁石の上に置いた状態でタッピングし、できる限り多くのEtOHを管の底部で捕集する。ビーズから産物を溶出させるために管を磁石から離す。ビーズの入った管に68μLの溶出緩衝液を導入する。管を傾けることにより溶出緩衝液でビーズを湿潤させる。十分に撹拌して混合し1分間待つ。管を磁石に戻す。溶液が透明になるまで典型的には<5分間待つ。溶液を注意深くピペッティングしてビーズから取り出すことにより精製PCR産物溶液を回収する。透明液体産物(68μL)を新しい1.5mL管に導入する。
【0133】
PCR N1増幅(標的増幅)は、次のプロトコルを用いて行った。表2に従ってプレ増幅領域でPCRミックス(200μL)を調製する。
【0134】
【0135】
この200μLの反応ミックスを4つのPCR管に分配する。次のPCR条件、すなわち、60Cで3分間のアニーリング時間、68Cで1分間の伸長時間の20サイクル行う(約2時間)。すべてのPCR産物を組み合わせて1つのサンプル管に入れる。160μLのAmpureビーズ(0.8×)を添加し、ピペッティングして十分に混合し、そして室温で5分間インキュベートする。管を磁石の上に置いて液体とビーズとが分離するまで待つ。液体は除去前に完全に透明になっていなければならない。これには5分間かかる。液体のみ除去して廃棄する。マグネットスタンドの上にある状態で1mLの70%EtOH/30%H2Oを用いて管を穏やかに1回濯ぐ。濯ぎ工程時にビーズを再懸濁させない。ピペットを用いてすべての残留EtOHをただちに除去する。管を磁石の上に置いた状態でタッピングし、できる限り多くのEtOHを管の底部で捕集する。50μLの溶出緩衝液にPCR産物を溶出させる。
【0136】
PCR N1増幅(アダプターおよびインデクシングPCR)は、次のプロトコルを用いて行った。表3に従ってPCRミックス(50μL)を調製する。
【0137】
【0138】
次のPCR条件、すなわち、60Cで3分間のアニーリング時間、68Cで1分間の伸長時間の25サイクル行う。0.8×Ampureで2回精製し、30μLの溶出緩衝液に溶出させる。
【0139】
図6は、シーケンス結果の平均に対するエラー訂正を示す(個別TCRa CDR3による)。
図6では、Y軸は、TCRaに対して検出された異なる分子バーコードの数をプロットする。
【0140】
結果は、50pgの標的RNAとの反応(
図6では「50」、たとえば、A50、B50、C50、D50、E50、F50、G50で表される)および0pgの標的RNAを取り込んだ陰性対照(
図6では「0」、たとえば、A0、B0、C0、D0、E0、F0、G0で表される)に対して示されている。このため、0pgは、陰性対照および50pgサンプルから漏れたアッセイノイズのディテクターとして機能する。標的RNAを取り込んだ反応では、本明細書のいくつかの実施形態に係るユニークオリゴヌクレオチド設計B01~B12(「B50」)、C01~C12(「C50」)、D01~D12(「D50」)、E01~E12(「E50」)、F01~F12(「F50」)、G01~G12(「G50」)、およびH01~H12(「H50」)は、従来のフォーマットA01~A12(「A50」)よりも低いエラー率を有していた。とくに、この実験のTRACでは、フォーマット「H」は、低ノイズで最も高い感度を有し、元のバーコード付きプライマー(A)よりも良好な挙動を示した。
【0141】
そのため、本明細書に記載されるようにバーコード領域と比較的低いG含有率を有する分子バーコードとを含むユニークオリゴヌクレオチド種および/または分子バーコードの3’側かつユニフォーム領域の5’側にスペーサーを含むユニークオリゴヌクレオチドを含む組成物は、かかる特徴を含まない一般的ポリヌクレオチド種を含む組成物よりも低いエラー率ひいては高い確度で増幅をもたらした。
【0142】
種々の態様および実施形態を本明細書に開示してきたが、他の態様および実施形態は当業者には自明であろう。本明細書に開示される種々の態様および実施形態は、例示を目的としたものであり、限定を意図したものではなく、真の範囲および趣旨は、以下の特許請求の範囲により示される。
【0143】
本明細書に開示されるこうしたおよび他のプロセスおよび方法では、プロセスおよび方法で発揮される機能を異なる順序で実現可能であることは、当業者であれば分かるであろう。さらに、概説された工程および操作は、単に例として提供されており、工程および操作の一部は、任意選択的でありうるとともに、本開示の実施形態の本質を損なうことなく、組み合わせてより少ない工程および操作にし、拡張して追加の工程および操作を追加しうる。
【0144】
本明細書に記載の実質的に任意の複数形および/または単数形の用語の使用に関連して、文脈上および/または適用上適切であれば、当業者は複数形から単数形へおよび/または単数形から複数形への変換が可能である。明確にするために種々の単数形/複数形の入替えを本明細書に明示的に記述しうる。
【0145】
一般的には、本明細書とくに添付の特許請求の範囲(たとえば添付の特許請求の範囲の本文)で用いられる用語は「オープン」用語であることが一般に意図されることは当業者であれば理解されよう(たとえば、「including(~を含む)」という用語は「~を含むがこれらに限定されるものではない」と解釈すべきであり、「having(~を有する)」という用語は「少なくとも~を有する」と解釈すべきであり、「includes(~を含む)」という用語は「~を含むがこれらに限定されるものではない」と解釈すべきであるなど)。さらに、導入クレームレシテーションの特定数が意図される場合、かかる意図は請求項で明示的にリサイトされ、かかるレシテーションの不在下ではかかる意図は存在しないことは当業者であれば理解されようたとえば、理解の一助として、以下の添付の特許請求の範囲は、クレームレシテーションを導入するために導入語句「at least one(少なくとも1つ)」および「one or more(1つ以上)」の使用を含みうる。しかしながら、かかる語句が用いられたとしても、不定冠詞「a」または「an」によるクレームレシテーションの導入が、かかる導入クレームレシテーションを含む任意の特定の請求項を、一方のかかるレシテーションを含む実施形態のみに限定することを意味するものと解釈すべきでない。たとえ同一の請求項が導入語句「one or more(1つ以上)」または「at least one(少なくとも1つ)」と不定冠詞たとえば「a」または「an」とを含む場合でさえも、そのように解釈すべきでない(たとえば、「a」および/または「an」は「at least one(少なくとも1つ)」または「one or more(1つ以上)」を意味するものと解釈すべきである)。定冠詞を用いてクレームレシテーションを導入する場合にも、同じことが当てはまる。そのほかに、たとえ特定数の導入クレームレシテーションが明示的にリサイトされたとしても、かかるレシテーションは少なくともリサイトされた数を意味すると解釈すべきであることは当業者であれば分かるであろう(たとえば、「2つのレシテーション」という他の修飾語を含まないベアのレシテーションは、少なくとも2つのレシテーションまたは2つ以上レシテーションを意味する)。さらに、「A、B、およびCの少なくとも1つ」に類似した条件が用いられる場合、一般的には、かかる構成は当業者がその条件を理解する意味であることが意図される(たとえば、「A、B、およびCの少なくとも1つを有する系」は、限定されるものではないが、A単独、B単独、C単独、AとBの両方、AとCの両方、BとCの両方、および/またはAとBとCの全部などを有する系を含であろう)。「A、B、またはCの少なくとも1つなど」に類似した条件が用いられる場合、一般的には、かかる構成は当業者がその条件を理解する意味であることが意図される(たとえば、「A、B、またはCの少なくとも1つを有する系」は、限定されるものではないが、A単独、B単独、C単独、AとBの両方、AとCの両方、BとCの両方、および/またはAとBとCの全部などを有する系を含であろう)。さらに、2つ以上の代替用語を表す実質上任意の選言的な語および/または語句は、明細書、請求項、または図面にかかわらず、用語の1つ、用語のいずれか、または用語の両方を含む可能性が企図されると理解すべきであることは当業者であれば理解されよう。たとえば、「AまたはB」という語句は「A」または「B」または「AおよびB」の可能性を含むものと理解されよう。
【0146】
そのほかに、本開示の特徴または態様がマーカッシュグループにより記述される場合、それにより、本開示は、マーカッシュグループの任意の個別のメンバーまたはメンバーのサブグループにより記述されることは当業者であれば分かるであろう。
【0147】
当業者であれば理解されるであろうが、あらゆる目的で、たとえば、明細書の提供に関して、本明細書に開示された範囲はすべて、あらゆる可能なサブ範囲およびそのサブ範囲の組合せをも包含する。いずれの列挙された範囲も、十分に記述されたものとしてかつその範囲が少なくとも2等分、3等分、4等分、5等分、10等分などされうるものとして容易に認識可能である。たとえば、限定されるものではないが、本明細書で考察した各範囲は、下3分の1、中3分の1、上3分の1に容易に分解可能である。同様に、当業者であれば理解されるであろうが、「~まで」、「少なくとも~」などの表現はすべて、リサイトされた数を含み、以上で考察したように後続的にサブ範囲に分解可能な範囲を意味する。最終的に、当業者であれば理解されるであろうが、範囲は各個別のメンバーを含む。したがって、たとえば、1~3個の細胞を有するグループは、1、2、または3個の細胞を有するグループを意味する。同様に、1~5個の細胞を有するグループは、1、2、3、4、または5個の細胞を有するグループを意味し、他も同様である。
【0148】
以上のことから、例示を目的として本開示の種々の実施形態を本明細書に記載してきたことおよび本開示の範囲および趣旨から逸脱することなく種々の変更を行いうることは分かるであろう。したがって、本明細書に開示される各種実施形態は、限定を意図したものではなく、真の範囲および趣旨は、以下の特許請求の範囲により示される。
本発明のまた別の態様は、以下のとおりであってもよい。
〔1〕少なくとも1000ユニークオリゴヌクレオチド種を含む組成物であって、各ユニークオリゴヌクレオチド種が、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含み、
前記ユニークオリゴヌクレオチド種がそのバーコード領域に異なる核酸配列を含み、かつ
(a)前記組成物がユニークオリゴヌクレオチド種から本質的になりその各分子バーコードが50%未満のG含有率を有するか、または
(b)前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、組成物。
〔2〕前記バーコード領域が、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、前記〔1〕に記載の組成物。
〔3〕各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、前記〔1〕または前記〔2〕に記載の組成物。
〔4〕前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、前記〔3〕に記載の組成物。
〔5〕前記組成物がユニークオリゴヌクレオチド種から本質的になりその各分子バーコードが50%未満のG含有率を有する、前記〔1〕~〔4〕のいずれか一項に記載の組成物。
〔6〕前記組成物中のすべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、前記〔1〕~〔5〕のいずれか一項に記載の組成物。
〔7〕前記ユニークオリゴヌクレオチド種が少なくとも2つの空間分離されたプールに配設され、各プールが前記ユニークオリゴヌクレオチド種の少なくとも100ユニークオリゴヌクレオチドを含み、同一のプールのユニークオリゴヌクレオチドが同一のサンプルバーコード配列を含み、かつ同一のプールの異なるユニークオリゴヌクレオチドが異なる分子バーコード配列を含む、前記〔1〕~〔6〕のいずれか一項に記載の組成物。
〔8〕各ユニークオリゴヌクレオチド種のサンプルバーコードが50%以下のG含有率を有する、前記〔2〕~〔7〕のいずれか一項に記載の組成物。
〔9〕各ユニークオリゴヌクレオチド種のバーコード領域が50%以下のG含有率を有する、前記〔1〕~〔8〕のいずれか一項に記載の組成物。
〔10〕前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、前記〔1〕~〔9〕のいずれか一項に記載の組成物。
〔11〕前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、前記〔1〕~〔10〕のいずれか一項に記載の組成物。
〔12〕前記ユニークオリゴヌクレオチド種の少なくとも95%は分子バーコードのいずれのGも他のGに隣接しない、前記〔1〕~〔11〕のいずれか一項に記載の組成物。
〔13〕前記組成物がユニークオリゴヌクレオチド種から本質的になりその分子バーコードのいずれのGも他のGに隣接しない、前記〔1〕~〔12〕のいずれか一項に記載の組成物。
〔14〕前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔1〕~〔13〕のいずれか一項に記載の組成物。
〔15〕前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔1〕~〔14〕のいずれか一項に記載の組成物。
〔16〕前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔1〕~〔15〕のいずれか一項に記載の組成物。
〔17〕前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HHHHHHHHを含み、かつ各「H」がA、C、またはTのいずれか1つである、前記〔1〕~〔16〕のいずれか一項に記載の組成物。
〔18〕前記ユニークオリゴヌクレオチド種のそれぞれが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔1〕~〔17〕のいずれか一項に記載の組成物。
〔19〕前記ユニークオリゴヌクレオチド種のそれぞれが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、かつ各「H」がA、C、またはTのいずれか1つである、前記〔1〕~〔17〕のいずれか一項に記載の組成物。
〔20〕前記標的特異的領域がオリゴdT配列を含む、前記〔4〕~〔19〕のいずれか一項に記載の組成物。
〔21〕各ユニークオリゴヌクレオチド種の前記分子バーコードが前記サンプルバーコードの3’側にある、前記〔1〕~〔20〕のいずれか一項に記載の組成物。
〔22〕各ユニークオリゴヌクレオチド種の前記サンプルバーコードが前記分子バーコードの3’側にある、前記〔1〕~〔20〕のいずれか一項に記載の組成物。
〔23〕各オリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、前記〔1〕~〔22〕のいずれか一項に記載の組成物。
〔24〕各オリゴヌクレオチド種が24~140ヌクレオチド長を有する、前記〔1〕~〔22〕のいずれか一項に記載の組成物。
〔25〕前記組成物が少なくとも6,500ユニークオリゴヌクレオチド種を含む、前記〔1〕~〔24〕のいずれか一項に記載の組成物。
〔26〕前記組成物が少なくとも65,000ユニークオリゴヌクレオチド種を含む、前記〔1〕~〔24〕のいずれか一項に記載の組成物。
〔27〕前記組成物が同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む、前記〔1〕~〔26〕のいずれか一項に記載の組成物。
〔28〕前記組成物のいずれの2オリゴヌクレオチドも同一のユニークオリゴヌクレオチド種ではない、前記〔1〕~〔27〕のいずれか一項に記載の組成物。
〔29〕前記組成物が少なくとも48プールを含む、前記〔7〕~〔28〕のいずれか一項に記載の組成物。
〔30〕各基材に固定されたオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように各プールのユニークオリゴヌクレオチド種が基材に固定される、前記〔7〕~〔29〕のいずれか一項に記載の組成物。
〔31〕表面が2つ以上の基材を含みうるように前記基材が離散表面領域を含む、前記〔30〕に記載の組成物。
〔32〕前記基材がビーズを含む、前記〔30〕に記載の組成物。
〔33〕前記ユニークオリゴヌクレオチド種のそれぞれが、前記ユニークオリゴヌクレオチドを前記基材に固定するように構成されたアダプターをさらに含み、前記バーコード領域が前記アダプターの3’側にある、前記〔27〕~〔29〕のいずれか一項に記載の組成物。
〔34〕各サンプルが核酸を含む2サンプル以上からの複数の核酸に特異的にバーコードを付ける方法であって、
各サンプルが他のサンプルから空間分離した状態で接触される条件で各サンプルと少なくとも100ユニークオリゴヌクレオチド種を含むプールとを接触させることであって、 各ユニークオリゴヌクレオチド種が、少なくとも7ヌクレオチドを含む分子バーコードを含むバーコード領域を含み、
各プールのユニークポリヌクレオチド種が同一のサンプルバーコードを含むとともに異なる分子バーコードを含み、かつ
(a)前記サンプルに接触させる前記ユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または
(b)すべてのユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、接触させることと、
前記ユニークオリゴヌクレオチド種の少なくともいくつかのオリゴヌクレオチドの標的特異的領域を前記サンプルの核酸の少なくともいくつかにハイブリダイズさせることと、 ハイブリダイズされた前記オリゴヌクレオチドを伸長させることにより、前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖を生成することであって、各サンプルでは前記鎖が同一のサンプルバーコードと異なる分子バーコードとを含み、かつ異なるサンプルでは分子バーコードが異なる、生成することと、
を含む方法。
〔35〕前記バーコード領域が、少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、前記〔34〕に記載の方法。
〔36〕各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、前記〔34〕または前記〔35〕に記載の方法。
〔37〕前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、前記〔36〕に記載の方法。
〔38〕前記サンプルに接触させる前記ユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる、前記〔34〕~〔37〕のいずれか一項に記載の方法。
〔39〕すべての前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%以下のG含有率を有する、前記〔34〕~〔38〕のいずれか一項に記載の方法。
〔40〕前記ユニークオリゴヌクレオチド種のオリゴヌクレオチドと前記標的に相補的な配列とを含む鎖の核酸配列を確認することをさらに含む、前記〔34〕~〔39〕のいずれか一項に記載の方法。
〔41〕所与の基材に固定されたユニークオリゴヌクレオチド種が同一のサンプルバーコードを含むようにかつ前記基材に固定された異なるユニークオリゴヌクレオチド種が異なる分子バーコードを含むように、各プールの少なくとも100ユニークオリゴヌクレオチド種が基材に固定される、前記〔34〕~〔40〕のいずれか一項に記載の方法。
〔42〕各サンプルバーコードが50%以下のG含有率を有する、前記〔34〕~〔41〕のいずれか一項に記載の方法。
〔43〕前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、前記〔34〕~〔42〕のいずれか一項に記載の方法。
〔44〕前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、前記〔34〕~〔43〕のいずれか一項に記載の方法。
〔45〕前記ユニークオリゴヌクレオチド種の少なくとも95%は前記分子バーコードのいずれのGも他のGに隣接しない、前記〔34〕~〔44〕のいずれか一項に記載の方法。
〔46〕前記各プールが、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる、前記〔34〕~〔44〕のいずれか一項に記載の方法。
〔47〕前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」は、A、G、C、またはTのいずれか1つである、前記〔34〕~〔46〕のいずれか一項に記載の方法。
〔48〕前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔34〕~〔47〕のいずれか一項に記載の方法。
〔49〕前記ユニークオリゴヌクレオチド種の各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔34〕~〔47〕のいずれか一項に記載の方法。
〔50〕前記ユニークオリゴヌクレオチドの各分子バーコードが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、前記〔34〕~〔49〕のいずれか一項に記載の方法。
〔51〕各ユニークオリゴヌクレオチドが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つであるむ、前記〔34〕~〔50〕のいずれか一項に記載の方法。
〔52〕各ユニークオリゴヌクレオチドが前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、前記〔34〕~〔50〕のいずれか一項に記載の方法。
〔53〕少なくとも1プールが同一のユニークオリゴヌクレオチド種の少なくとも2オリゴヌクレオチドを含む、前記〔34〕~〔52〕のいずれか一項に記載の方法。
〔54〕いずれのプールも同一のユニークオリゴヌクレオチド種の2オリゴヌクレオチドを含まない、前記〔34〕~〔52〕のいずれか一項に記載の方法。
〔55〕前記標的特異的領域がオリゴdT配列を含む、前記〔34〕~〔54〕のいずれか一項に記載の方法。
〔56〕各ユニークオリゴヌクレオチド種では前記分子バーコードが前記サンプルバーコードの3’側にある、前記〔34〕~〔55〕のいずれか一項に記載の方法。
〔57〕各ユニークオリゴヌクレオチド種では前記サンプルバーコードが前記分子バーコードの3’側にある、前記〔34〕~〔55〕のいずれか一項に記載の方法。
〔58〕各ユニークオリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、前記〔34〕~〔57〕のいずれか一項に記載の方法。
〔59〕各ユニークオリゴヌクレオチド種が24~140ヌクレオチド長を有する、前記〔34〕~〔58〕のいずれか一項に記載の方法。
〔60〕各プールが少なくとも6,500ユニークオリゴヌクレオチド種を含む、前記〔34〕~〔59〕のいずれか一項に記載の方法。
〔61〕各プールが少なくとも65,000ユニークオリゴヌクレオチド種を含む、前記〔34〕~〔59〕のいずれか一項に記載の方法。
〔62〕少なくとも48ユニークサンプルがそれぞれユニークプールに接触される、前記〔34〕~〔61〕のいずれか一項に記載の方法。
〔63〕前記サンプルの少なくとも99%がそれぞれ1細胞以下である、前記〔34〕~〔62〕のいずれか一項に記載の方法。
〔64〕複数の基材のそれぞれに固定されたユニークオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、各プールのユニークオリゴヌクレオチド種が基材に固定される、前記〔34〕~〔63〕のいずれか一項に記載の方法。
〔65〕異なるプールの基材が空間分離された異なる表面領域を含むように、前記基材が空間分離された表面領域を含む、前記〔64〕に記載の方法。
〔66〕前記基材がビーズを含む、前記〔64〕に記載の方法。
〔67〕前記ユニークオリゴヌクレオチド種のそれぞれが、前記基材に前記ユニークオリゴヌクレオチドを固定するように構成されたアダプターをさらに含み、前記バーコード領域が前記アダプターの3’側にある、前記〔64〕~〔66〕のいずれか一項に記載の方法。
〔68〕ユニークオリゴヌクレオチドを含む組成物を作製する方法であって、
それぞれ少なくとも3ヌクレオチドを含む複数の異なるサンプルバーコードを提供することと、
それぞれ少なくとも7ヌクレオチドを含む複数の異なる分子バーコードを提供することと、
各ユニークオリゴヌクレオチド種が、サンプルバーコードと分子バーコードとを含むバーコード領域を含む、複数のユニークオリゴヌクレオチド種を合成することであって、
(a)前記複数のユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になるか、または
(b)前記複数のユニークオリゴヌクレオチド種すべての分子バーコードが全体として12.5%以下のG含有率を有するか、
の少なくとも一方である、合成することと、
空間分離されたプールに前記ユニークオリゴヌクレオチド種を配設することであって、同一のプールのユニークオリゴヌクレオチド種が同一のサンプルバーコード配列を含むようにかつ同一のプールの異なるユニークオリゴヌクレオチド種が異なる分子バーコード配列を含むように各プールが複数のユニークオリゴヌクレオチド種を含み、
各プールが少なくとも1000ユニークオリゴヌクレオチド種を含む、配設することと、
を含む方法。
〔69〕各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側にユニフォーム領域をさらに含む、前記〔68〕に記載の方法。
〔70〕前記ユニフォーム領域が前記バーコード領域の3’側に標的特異的領域をさらに含み、前記標的特異的領域が標的核酸に相補的な少なくとも10ヌクレオチドを含む、前記〔69〕に記載の方法。
〔71〕前記複数のユニークオリゴヌクレオチド種が、各分子バーコードが50%未満のG含有率を有するユニークオリゴヌクレオチド種から本質的になる、前記〔68〕~〔70〕のいずれか一項に記載の方法。
〔72〕前記複数のユニークオリゴヌクレオチド種すべての分子バーコードが全体として12.5%以下のG含有率を有する、前記〔68〕または〔69〕に記載の方法。
〔73〕各分子バーコードが50%以下のG含有率を有する、前記〔68〕に記載の方法。
〔74〕各サンプルバーコードが50%以下のG含有率を有する、前記〔68〕~〔69〕のいずれか一項に記載の方法。
〔75〕前記ユニークオリゴヌクレオチド種のサンプルバーコードが全体として12.5%以下のG含有率を有する、前記〔68〕~〔72〕のいずれか一項に記載の方法。
〔76〕前記ユニークオリゴヌクレオチド種の分子バーコードが全体として12.5%未満のG含有率を有する、前記〔68〕~〔72〕のいずれか一項に記載の方法。
〔77〕前記ユニークオリゴヌクレオチド種のバーコード領域が全体として12.5%以下のG含有率を有する、前記〔68〕~〔76〕のいずれか一項に記載の方法。
〔78〕前記ユニークオリゴヌクレオチド種の少なくとも95%は前記分子バーコードのいずれのGも他のGに隣接しない、前記〔68〕~〔77〕のいずれか一項に記載の方法。
〔79〕前記複数のユニークオリゴヌクレオチド種が、分子バーコードのいずれのGも他のGに隣接しないユニークオリゴヌクレオチド種から本質的になる、前記〔68〕~〔77〕のいずれか一項に記載の方法。
〔80〕前記ユニークオリゴヌクレオチド種の分子バーコードの少なくとも95%がHとNとが交互に合計で少なくとも6個現れる配列を含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔68〕~〔79〕のいずれか一項に記載の方法。
〔81〕前記ユニークオリゴヌクレオチドの分子バーコードの少なくとも95%が配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔68〕~〔80〕のいずれか一項に記載の方法。
〔82〕前記ユニークオリゴヌクレオチドの各分子バーコードが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔68〕~〔81〕のいずれか一項に記載の方法。
〔83〕前記ユニークオリゴヌクレオチドの各分子バーコードが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、前記〔68〕~〔82〕のいずれか一項に記載の方法。
〔84〕各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HNHNHNHNを含み、各「H」がA、C、またはTのいずれか1つであり、かつ各「N」がA、G、C、またはTのいずれか1つである、前記〔68〕~〔83〕のいずれか一項に記載の方法。
〔85〕各ユニークオリゴヌクレオチド種が前記バーコード領域の3’側かつ前記標的特異的領域の5’側にスペーサーを含み、前記スペーサーが配列HHHHHHHHを含み、各「H」がA、C、またはTのいずれか1つである、前記〔68〕~〔84〕のいずれか一項に記載の方法。
〔86〕前記標的特異的領域がオリゴdT配列を含む、前記〔70〕~〔85〕のいずれか一項に記載の方法。
〔87〕各ユニークオリゴヌクレオチド種の前記分子バーコードが前記サンプルバーコードの3’側にある、前記〔68〕~〔86〕のいずれか一項に記載の方法。
〔88〕各ユニークオリゴヌクレオチド種の前記サンプルバーコードが前記分子バーコードの3’側にある、前記〔68〕~〔86〕のいずれか一項に記載の方法。
〔89〕各ユニークオリゴヌクレオチド種が少なくとも24ヌクレオチド長を有する、前記〔68〕~〔88〕のいずれか一項に記載の方法。
〔90〕各ユニークオリゴヌクレオチド種が24~140ヌクレオチド長を有する、前記〔68〕~〔89〕のいずれか一項に記載の方法。
〔91〕各プールが少なくとも6,500ユニークオリゴヌクレオチド種を含む、前記〔68〕~〔90〕のいずれか一項に記載の方法。
〔92〕各プールが少なくとも65,000ユニークオリゴヌクレオチド種を含む、前記〔68〕~〔91〕のいずれか一項に記載の方法。
〔93〕少なくとも48プールが作製される、前記〔68〕~〔92〕のいずれか一項に記載の方法。
〔94〕前記複数の基材のそれぞれに固定され前記たオリゴヌクレオチド種の分子バーコードではなくサンプルバーコードが同一になるように、基材に各プールのユニークオリゴヌクレオチド種を固定することをさらに含む、前記〔68〕~〔93〕のいずれか一項に記載の方法。
〔95〕前記基材が離散表面領域を含む、前記〔94〕に記載の方法。
〔96〕前記基材がビーズを含む、前記〔94〕に記載の方法。
〔97〕前記ユニークオリゴヌクレオチド種が空間分離されたプールに前記合成と同時に配設される、前記〔68〕~〔96〕のいずれか一項に記載の方法。
〔98〕前記ユニークオリゴヌクレオチド種が空間分離されたプールに前記合成の後に配設される、前記〔68〕~〔96〕のいずれか一項に記載の方法。
〔99〕アダプター領域の3’側にバーコード領域を含むオリゴヌクレオチドであって、前記バーコード領域が、少なくとも7ヌクレオチドを含む分子バーコードを含み、前記分子バーコードが50%以下のG含有率を有する、オリゴヌクレオチド。
〔100〕少なくとも3ヌクレオチドを含むサンプルバーコードをさらに含む、前記〔99〕に記載のオリゴヌクレオチド。
〔101〕前記バーコード領域の3’側にユニフォーム領域をさらに含む、前記〔99〕または前記〔100〕に記載のオリゴヌクレオチド。
〔102〕前記ユニフォーム領域が、標的核酸に相補的な少なくとも10ヌクレオチドを含む標的特異的領域を含む、前記〔101〕に記載のオリゴヌクレオチド。
〔103〕前記バーコード領域の5’側にアダプター領域をさらに含む、前記〔99〕~〔102〕のいずれか一項に記載のオリゴヌクレオチド。
〔104〕前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、前記〔3〕~〔19〕または〔21〕~〔33〕のいずれか一項に記載の組成物。
〔105〕前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、前記〔104〕に記載の組成物。
〔106〕前記〔104〕または〔105〕に記載の組成物を含むキットであって、前記標的特異的領域に対向して前記可変領域の反対側にハイブリダイズするようにかつ前記標的特異的領域がハイブリダイズする鎖の相補鎖にハイブリダイズするように構成された、それにより、前記標的特異的領域と共に前記可変領域を増幅するように構成されたプライマーをさらに含むキット。
〔107〕前記プライマーおよび標的特異的領域が、前記可変領域を含む少なくとも1kbの核酸を増幅するように構成される、前記〔106〕に記載のキット。
〔108〕前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域コード配列にフランキングする配列を含む標的特異的領域を含む、前記〔36〕~〔54〕、〔56〕~〔67〕、69~85、または87~98のいずれか一項に記載の方法。
〔109〕前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、前記〔108〕に記載の方法。
〔110〕前記ユニフォーム領域が、免疫細胞レセプターまたは免疫グロブリンの可変領域にフランキングする配列を含む標的特異的領域を含む、前記〔101〕~〔103〕のいずれか一項に記載のオリゴヌクレオチド。
〔111〕前記免疫細胞レセプターの可変領域コード配列が、T細胞レセプターの可変領域コード配列、B細胞レセプターの可変領域コード配列、およびそれらの組合せからなる群から選択される、前記〔110〕に記載のオリゴヌクレオチド。
【配列表】