(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-01-28
(54)【発明の名称】細胞源識別可能な核酸コレクションを生成するための方法及び組成物
(51)【国際特許分類】
C12N 15/09 20060101AFI20250121BHJP
C12Q 1/6855 20180101ALI20250121BHJP
C12Q 1/6876 20180101ALI20250121BHJP
C12Q 1/6853 20180101ALI20250121BHJP
C12Q 1/6869 20180101ALI20250121BHJP
C40B 40/06 20060101ALI20250121BHJP
C12M 1/00 20060101ALI20250121BHJP
C12M 1/28 20060101ALI20250121BHJP
C12N 15/11 20060101ALI20250121BHJP
【FI】
C12N15/09 Z
C12Q1/6855 Z ZNA
C12Q1/6876 Z
C12Q1/6853 Z
C12Q1/6869 Z
C40B40/06
C12M1/00 A
C12M1/28
C12N15/11 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024535574
(86)(22)【出願日】2022-12-22
(85)【翻訳文提出日】2024-06-13
(86)【国際出願番号】 US2022053883
(87)【国際公開番号】W WO2023122309
(87)【国際公開日】2023-06-29
(32)【優先日】2021-12-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】500481499
【氏名又は名称】タカラ バイオ ユーエスエー, インコーポレイテッド
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】當利 和夫
(72)【発明者】
【氏名】ボスティック,マグノリア
(72)【発明者】
【氏名】シュ,ペン
(72)【発明者】
【氏名】チャン,サリー エクス.
(72)【発明者】
【氏名】プ,シューユアン エリック
(72)【発明者】
【氏名】ユン,ユエ
(72)【発明者】
【氏名】ファーマー,アンドゥリュー エー.
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA23
4B029BB20
4B029CC01
4B029GA03
4B029GB05
4B029HA05
4B063QA01
4B063QA18
4B063QQ08
4B063QQ42
4B063QQ53
4B063QR08
4B063QR55
4B063QR62
4B063QS25
4B063QS34
(57)【要約】
組み合わせインデックス付け方法論を使用して、細胞又は細胞核などの複数の源からの源識別可能な核酸コレクションを調製する方法が提供される。一般に、この方法は、細胞源サブ部分の第1のセットを提供することを含み、各サブ部分は、初期の複数の細胞源のうちの複数の細胞源を含む。次に、第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、第1のセットの各サブ部分の複数の細胞源において第1の識別子タグ付き核酸が生成され、第1のセットの異なるサブ部分において用いられる鋳型スイッチオリゴヌクレオチドの第1の識別子は、所与のサブ部分内で同一であるが、異なるサブ部分間で異なる。次に、サブ部分の細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成し、次いで、第1のプールを、第1の識別子タグ付き核酸を有する複数の細胞源を各々が含むサブ部分の第2のセットに配分する。次に、第1の識別子及び第2の識別子の両方を含む、第2のセットの各サブ部分における複数の細胞源から細胞源識別可能な核酸が産生されて(第2のセットの各サブ部分の第2の識別子は、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる)、初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製する。各細胞源識別可能な核酸コレクションの核酸は、核酸の細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む。また、例えば、本明細書に記載の方法の実施形態を実行する際に使用するためのキット、組成物、及びデバイスも提供される。
【選択図】
図7
【特許請求の範囲】
【請求項1】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップb)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)第1の識別子及び第2の識別子の両方を含む、前記第2のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第2のセットの各サブ部分の前記第2の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む、方法。
【請求項2】
前記細胞源が、細胞である、請求項1に記載の方法。
【請求項3】
前記細胞源が、核である、請求項1に記載の方法。
【請求項4】
前記細胞源が、透過処理される、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記サブ部分の第1のセットが、2~25,000のサブ部分を含む、先行請求項のいずれか一項に記載の方法。
【請求項6】
前記鋳型スイッチオリゴヌクレオチドが、一意の分子識別子を更に含む、先行請求項のいずれか一項に記載の方法。
【請求項7】
前記鋳型スイッチング媒介反応が、リボ核酸鋳型を用いる、先行請求項のいずれか一項に記載の方法。
【請求項8】
前記リボ核酸鋳型が、mRNAである、請求項7に記載の方法。
【請求項9】
前記鋳型スイッチング反応が、オリゴdTプライマー、ランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項8に記載の方法。
【請求項10】
前記鋳型スイッチング媒介反応が、デオキシリボ核酸を用いる、請求項1~6のいずれか一項に記載の方法。
【請求項11】
前記鋳型スイッチング反応が、ランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項10に記載の方法。
【請求項12】
前記サブ部分の第2のセットが、2~25,000のサブ部分を含む、先行請求項のいずれか一項に記載の方法。
【請求項13】
前記第2の識別子が、第1及び第2のサブ識別子を含む、先行請求項のいずれか一項に記載の方法。
【請求項14】
前記第2の識別子が、第2の鎖合成反応に組み込まれる、先行請求項のいずれか一項に記載の方法。
【請求項15】
前記細胞源識別可能な核酸が、増幅媒介反応を使用して産生される、先行請求項のいずれか一項に記載の方法。
【請求項16】
前記細胞源識別可能な核酸が、ライゲーション媒介反応を使用して産生される、先行請求項のいずれか一項に記載の方法。
【請求項17】
前記細胞源識別可能な核酸が、タグメンテーション媒介反応を使用して産生される、先行請求項のいずれか一項に記載の方法。
【請求項18】
前記方法が、前記サブ部分の第2のセットの前記複数の細胞源を溶解することを更に含む、先行請求項のいずれか一項に記載の方法。
【請求項19】
前記方法が、少なくとも1つの更なる識別子を組み込む核酸を産生するための少なくとも1つの追加のプール/分割ステップを更に含む、先行請求項のいずれか一項に記載の方法。
【請求項20】
前記方法が、前記複数の細胞源識別可能な核酸コレクションを配列決定することを更に含む、先行請求項のいずれか一項に記載の方法。
【請求項21】
前記配列決定することが、次世代配列決定を含む、請求項20に記載の方法。
【請求項22】
前記方法が、少なくとも細胞源識別可能な核酸コレクションの核酸の前記第1及び第2の識別子に基づいて、細胞源を前記核酸コレクションに割り当てることを更に含む、先行請求項のいずれか一項に記載の方法。
【請求項23】
前記細胞源が、免疫細胞源である、先行請求項のいずれか一項に記載の方法。
【請求項24】
前記免疫細胞源が、T細胞又はその核である、請求項23に記載の方法。
【請求項25】
前記免疫細胞源が、B細胞又はその核である、請求項23に記載の方法。
【請求項26】
前記第1及び第2のセットにおけるサブ部分の数が、同一である、先行請求項のいずれか一項に記載の方法。
【請求項27】
前記第1及び第2のセットにおけるサブ部分の数が、異なる、請求項1~25のいずれか一項に記載の方法。
【請求項28】
前記第2のセットにおけるサブ部分の数が、前記第1のセットにおけるサブ部分の数を超える、請求項27に記載の方法。
【請求項29】
キットであって、
共通の第1の識別子を含む鋳型スイッチオリゴヌクレオチドを各々が含む、複数の別個の鋳型スイッチオリゴヌクレオチド組成物であって、異なる鋳型スイッチオリゴヌクレオチド組成物の鋳型スイッチオリゴヌクレオチドの第1の識別子が異なる、複数の別個の鋳型スイッチオリゴヌクレオチド組成物と、
複数の別個の第2の識別子核酸と、を含む、キット。
【請求項30】
前記複数の別個の鋳型スイッチオリゴヌクレオチド組成物が、別個の容器内に存在する、請求項29に記載のキット。
【請求項31】
前記別個の容器が、マルチウェルプレートのウェルである、請求項30に記載のキット。
【請求項32】
所与の鋳型スイッチオリゴヌクレオチド組成物の各鋳型スイッチオリゴヌクレオチドが、異なる一意の分子識別ドメインを更に含む、請求項29~31のいずれか一項に記載のキット。
【請求項33】
前記複数の別個の第2の識別子核酸が、別個の容器内に存在する、請求項29~32のいずれか一項に記載のキット。
【請求項34】
前記別個の容器が、マルチウェルプレートのウェルである、請求項33に記載のキット。
【請求項35】
前記第2の識別子核酸が、プライマーである、請求項29~34のいずれか一項に記載のキット。
【請求項36】
前記第2の識別子核酸が、アダプタである、請求項29~35のいずれか一項に記載のキット。
【請求項37】
前記キットが、逆転写酵素を更に含む、請求項29~36のいずれか一項に記載のキット。
【請求項38】
前記キットが、ポリメラーゼを更に含む、請求項29~37のいずれか一項に記載のキット。
【請求項39】
前記キットが、リガーゼを更に含む、請求項29~38のいずれか一項に記載のキット。
【請求項40】
前記キットが、トランスポザーゼを更に含む、請求項29~39のいずれか一項に記載のキット。
【請求項41】
前記キットが、緩衝液を更に含む、請求項29~40のいずれか一項に記載のキット。
【請求項42】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップ(b)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、前記第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)前記第2のセットの各サブ部分の前記複数の細胞源において、第2の識別子タグ付き核酸を生成することであって、前記第2のセットの異なるサブ部分における第2の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分の各々の間では異なる、生成することと、
(f)ステップ(e)で産生された前記サブ部分の前記細胞源をプールして、第1及び第2の識別子タグ付き核酸を含む第2の細胞源プールを生成することと、
(g)前記第2の細胞源プールを、前記第1及び第2の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第3のセットに配分することと、
(h)第1の識別子、第2の識別子及び第3の識別子を含む、サブ部分の前記第3のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第3のセットの各サブ部分の前記第3の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1、第2及び第3の識別子の一意の組み合わせを含む、方法。
【請求項43】
ステップ(e)が、前記第2の識別子を付加するために第2の鎖合成反応を使用して実行される、請求項42に記載の方法。
【発明の詳細な説明】
【背景技術】
【0001】
次世代配列決定(NGS)技術の開発により、生成された核酸ライブラリからの貴重なゲノム及びトランスクリプトーム情報の迅速な抽出が可能になった。
【0002】
Illumina(登録商標)(例えば、HiSeq(商標)、MiSeq(商標)及び/又はNextSeq(商標)配列決定システム)、Ion Torrent(商標)(例えば、Ion PGM(商標)及び/又はIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、PACBIO RS II Sequel配列決定システム)、Life Technologies(商標)(例えば、SOLiD(商標)配列決定システム)、Roche(例えば、454 GS FLX+及び/又はGS Junior配列決定システム)などによって提供される配列決定プラットフォームなどの高スループットNGS技術は、以前に使用されたSanger配列決定よりもより迅速かつ安価に核酸分子の配列決定を可能にし、したがって、これらの技術は、バイオテクノロジー及びバイオメディカル研究に革命をもたらした。更に、これらの技術が成熟し、よりユーザーフレンドリーになるにつれて、臨床応用におけるそれらの存在は増加し続けている。
【0003】
これらの強力な配列決定技術は、ライブラリ調製に特に重点を置いている。よく調製され、効率的に生成された逆転写相補DNA(cDNA)ライブラリは、多様な範囲の目的のためにNGS技術を使用して分析することができる。
【0004】
現在のNGSワークフローでは、バルク細胞集団又は単一細胞から得られた試料から調製されたライブラリを配列決定することができる。バルク細胞集団の配列決定では、単一細胞分解能でのゲノム及び/又はトランスクリプトーム変化を分析することができず、バルク集団における異なる細胞型の根本的な不均一性が隠蔽される可能性がある。核酸ライブラリが個々の細胞から調製される場合、NGS技術により、単一細胞分解能でのゲノム及び/又はトランスクリプトーム変化の分析が可能になる。単一細胞配列決定により、バルク細胞配列決定よりも多くの利点が得られるが、単一細胞配列決定では、所与の核酸を元の源までさかのぼることができる必要がある。
【0005】
この要件に対処するために試料バーコード付け技術が開発されているが、所与の実験で現実的に処理することができる異なる細胞の数に関しては依然として上限がある。いくつかの事例では、単一の実験において処理されるのが望ましい細胞の数、例えば、細胞の全てが最終的に単一の配列決定準備済ライブラリ組成物においてプールされる場合、現在のプロトコルを使用して容易に処理できる数を超える。例えば、ヒト適応性免疫レパートリー試料の処理に関して、単一細胞分析は、ペアリング鎖情報(例えば、TCRのためのアルファ/ベータ/ガンマ/デルタペアリング及びBCRのための重/軽ペアリング)を可能にする。しかしながら、所与の実験で調べることができる細胞の数は、例えば、最大10,000個の異なる細胞まで限定され、又は特殊な計装を必要とし得る。
【発明の概要】
【0006】
そのような事例では、本発明者らは、必要とされるのは、並行して10,000個を超える細胞の分析を可能にするアプローチであることを認識している。理想的には、必要とされるのは、並行して10,000個を超える細胞の分析を可能にする方法であり、更に、そのような方法が、現在の最先端技術で既知の計装を超えた特殊な装置を必要としない場合である。例えば、当該技術分野で必要とされるのは、100,000個以上の細胞、例えば、最大100万個の単一細胞、又は100万個を超える細胞が、単一の実験において並行して分析されるのを可能にするアプローチ(例えば、TCR又はBCRのためのペアリングされた鎖情報を与えるなど)である。加えて、本発明者らはまた、各試料中の単一細胞の数は少ないかもしれないが、独立した試料の数が大きいので、分析する必要のある細胞の集合数が大きい、単一細胞の複数の試料に対して単一細胞実験を実行するための方法が、当該技術分野で必要であることも認識している。例えば、当該技術分野で必要とされるのは、分析される細胞の総数が100,000個以上であるように、例えば、100個以上の試料(各試料は1,000個以上の細胞を含む)の分析を可能にするアプローチである。そのため、所与の実験において多数の細胞の処理を提供することができる改善された単一細胞配列決定技術の継続的な必要性が存在する。
【0007】
本発明の実施形態は、同じ細胞源から産生される核酸を一意に識別するための組み合わせインデックス付けアプローチを提供することによって、当該技術分野における上記及び他の必要性を満たす。本明細書に記載される本発明の実施形態によって使用される組み合わせインデックス付けアプローチは、アッセイされた集団内の各細胞が、アッセイされる他の細胞から分離されて容器内に個々に存在する必要がない、この一意の識別を提供することによって、当該技術分野に対する実質的な改善を表す。提供される組み合わせアプローチは、多数の単一細胞、例えば、10,000個以上の単一細胞、100,000個以上の単一細胞、又は100万個以上の単一細胞の実用的な分析を可能にする。提供される組み合わせアプローチは、同じワークフローを使用してその成分、例えば、核に等しく適用される。例えば、この同じワークフローでは、例えば、100,000個以上の単一細胞又は単一核由来の核酸の配列決定準備済ライブラリがプールされ、一緒に配列決定され、各リードの結果として生じる配列情報はその元の細胞源までさかのぼって追跡することが可能である。更に、本明細書で提供される組み合わせ分析のための方法は、例えば、分析される細胞の総数が100,000個以上であるように、100個以上の試料(各試料は1,000個以上の細胞を含む)の分析などの、多くの独立した細胞試料の実用的な分析を可能にする。
【0008】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法が提供される。この方法の態様は、細胞源サブ部分の第1のセットを提供することを含み、各サブ部分は、初期の複数の細胞源のうちの複数の細胞源を含む。次に、第1の識別子(本明細書では、第1のインデックス又は第1の細胞バーコードとも呼ばれる)を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、第1のセットの各サブ部分の複数の細胞源において第1の識別子タグ付き核酸が生成され、第1のセットの異なるサブ部分において用いられる鋳型スイッチオリゴヌクレオチドの第1の識別子は、所与のサブ部分内で同一であるが、異なるサブ部分間で異なる。次に、サブ部分の細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成し、次いで、第1のプールを、第1の識別子タグ付き核酸を有する複数の細胞源を各々が含むサブ部分の第2のセットに配分する。次に、第1の識別子及び第2の識別子の両方を含む、第2のセットの各サブ部分における複数の細胞源から細胞源識別可能な核酸が産生され、第2のセットの各サブ部分の第2の識別子は、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる。この方法は、初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを提供する。各細胞源識別可能な核酸コレクションの核酸は、核酸の細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む。
【0009】
他の実施形態では、追加ラウンドのインデックス(すなわち、識別子)を核酸コレクションに付加するために、所望に応じて、新しいサブ部分へのプール及び再分配の追加ラウンドを用いることができる。追加ラウンドのインデックス付けにより、方法論におけるより多くの個々の細胞又は核などの細胞成分の分析が可能になる。一般に、検査される細胞の総数は、ヌクレオチド配列識別子(例えば、バーコード、インデックス、タグ、又は任意のタイプの分子識別子)の一意の組み合わせ及び配向の総数が、研究者が調査したい一意の細胞の数よりも多いようなものであるべきである。
【0010】
また、例えば、本明細書に記載の方法の実施形態を実行する際に使用するためのキット、組成物、及びデバイスも提供される。
【図面の簡単な説明】
【0011】
【
図1A】本発明の一実施形態によるワークフローを図示する。
【
図1B】本発明の一実施形態によるワークフローを図示する。
【
図1C】本発明の一実施形態によるワークフローを図示する。
【
図1D】本発明の一実施形態によるワークフローを図示する。
【
図2】本発明の一実施形態を示す概略図を提供する。
【
図3】本発明の一実施形態を示す概略図を提供する。
【
図4】本発明の一実施形態を示す概略図を提供する。
【
図5】本発明の方法の一実施形態を概略的に示すフローチャートを提供する。
【
図6】実施例2に記載されるように、本発明の実施形態を使用して作製したNGSライブラリ生成物の構造を示す概略図を提供する。より具体的には、T細胞受容体遺伝子は、分析のために特異的に標的化される。
図6に示すように、リード1は、標的化TCR遺伝子の配列を提供する。リード2はまた、T細胞受容体遺伝子の配列を、第1の2つのインデックス配列、すなわち、第2のインデックス付けステップからのインデックス2(IN2、第2の識別子)、及び第1のインデックス付けステップからのインデックス1(IN1、第1の識別子)とともに提供する。インデックス3(第3の識別子)は、第3のインデックス付けステップでPCRによって付加されたi7及びi5インデックスの組み合わせによって提供されるように示される。
【
図7】本発明の一実施形態を示す概略図を提供し、具体的には、初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製するための方法を提供し、本方法は、核酸のインデックス付けの3つの独立したラウンドを使用する。
【
図8A】本発明の実施形態による、(以下の実施例4に記載されるような)TCR配列決定のための2ラウンドのバーコード付けプロトコルを図示する。
【
図8B】2ラウンドのTCRバーコード付けについて、1,000個の細胞を含む8×8分割プールの実験設計を図示する。
【
図8C】2ラウンドのTCRバーコード付けについて、TCRbライブラリからのBioAnalyzerの結果を図示する。
【
図8D】2ラウンドのTCRバーコード付けについて、Lプロット分析を図示する。
【
図9】本発明の実施形態による、PCR1及びPCR2にわたって分割された第2のラウンドのバーコード付けを用いた、TCR配列決定のための2ラウンドのバーコード付けを図示する。
【
図10A】本発明の実施形態による、PCR1及びPCR2にわたって分割された第3のラウンドのバーコード付けを用いた、(以下の実施例5に記載されるような)TCR配列決定のための3ラウンドのバーコード付けを図示する。
【
図10B】3ラウンドのTCRバーコード付けについて、実施例5に記載されるように生成されたTCRライブラリのBioanalyzerの追跡を図示する。
【
図10C】3ラウンドのTCRバーコード付けについて、ライブラリで検出されたリードカウント、マッピング率、及びクロノタイプを示す表である。
【
図11】本発明の実施形態による、TCR配列決定のための代替の3ラウンドのバーコード付け戦略を図示する。
【
図12A】本発明の実施形態による、(以下の実施例6に記載されるような)組み合わされた標的化配列決定及び5’差次的発現(5’DE)のための2ラウンドのバーコード付けを図示する。
【
図12B】
図12Aに図示されるプロトコルを使用して生成される生成物及びライブラリ構造を示す。
【
図12C】品質メトリックに合格する検出された細胞の数を決定するために使用されるニープロットを提供する。この場合、Cogent APソフトウェアを用いた、BC1、BC2a、BC2b(i7)及びi5を使用するデータ逆多重化に基づいて、10,000個を超えるリード/細胞を有する細胞。1310個の細胞は、10,000個を超えるリードを有し、下流分析に使用した。
【
図12D】ヒトhg38(K562)又はマウスmm10(3T3)のいずれかへのマッピングに基づく、K562及び3T3細胞の平均マッピング統計量を提供する。遺伝子間、イントロン、エクソン、マルチマッピング、マッピングされていない、及びトリミングされたリードのパーセンテージを計算した。
【
図12E】細胞当たりのリードの関数として、K562又は3T3細胞のいずれかにおいて検出される遺伝子の数を提供する。
【
図12F】L-プロット分析を提供する。全てのK562、3T3及び混合細胞の配列決定リードを、ヒト(hg38)及びマウス(mm10)ゲノムの両方に対してマッピングし、各ゲノムにマッピングされた細胞当たりのマッピングされたリードの数に基づいてプロットした。
【
図13A】実施例7に記載されるように、2ラウンドの分割-プールバーコード付け後に調製されたTCRライブラリの生成物及びライブラリ構造を示す。
【
図13B】TCR分析について、10ngのPBMC RNAで調製した全長cDNAを示す。
【
図13C】TCR分析について、全長cDNAから調製したTCRa、TCRb及びTCRa+bライブラリを示す。
【
図14】本発明の実施形態による、(以下の実施例8に記載されるような)組み合わされた標的化配列決定及び5’差次的発現(5’DE)のための3ラウンドのバーコード付けプロトコルを図示する。
【
図15】本発明の様々な実施形態に従って生成されるライブラリ及び生成物を図示する。
図15パネルAは、実施例8に記載されるような5’DEライブラリ生成を示す。
図15パネルBは、実施例8に記載されるようなTCRライブラリの調製を示す。
【
図16】実施例9に記載されるようなTSO分析の結果を提供する。
【
図17】実施例10に記載されるような、逆多重化後の単一細胞のニープロットを提供する。
【
図18】実施例10に記載されるように、本発明の実施形態に従って調製されたヒト-マウス細胞混合物のL-プロットを提供する。
【
図19】実施例11に記載されるように高濃度のPFA及びジギトニンを使用して、組み合わせインデックス付けのために処理されたヒト-マウス細胞混合物のL-プロットを提供する。
【0012】
定義
本明細書で使用される場合、「ハイブリダイゼーション条件」という用語は、プライマー又は他のポリヌクレオチドが、プライマー又は他のポリヌクレオチドがいくつかの相補性を共有する標的核酸の領域に特異的にハイブリダイズする条件を意味する。プライマーが標的核酸に特異的にハイブリダイズするかどうかは、ポリマーと標的核酸との間の相補性の程度、及びハイブリダイゼーションが行われる温度(プライマーの融解温度(TM)によって知ることができる)などの因子によって決定される。融解温度は、プライマー-標的核酸二本鎖の半分がハイブリダイズしたままであり、二本鎖の半分が一本鎖に解離する温度を指す。二本鎖のTmは、以下の式:Tm=81.5+16.6(log10[Na+])+0.41(画分G+C)-(60/N)を使用して実験的に決定又は予測され得、式中、Nは鎖長であり、[Na+]は1M未満である。Sambrook and Russell(2001;Molecular Cloning:A Laboratory Manual,3rd ed.Cold Spring Harbor Press,Cold Spring Harbor N.Y.,Ch.10)を参照されたい。様々なパラメータに依存する他のより高度なモデルを使用して、様々なハイブリダイゼーション条件に応じて、プライマー/標的二重鎖のTmを予測してもよい。特異的な核酸ハイブリダイゼーションを達成するためのアプローチは、例えば、Tijssen,Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,part I,chapter 2,“Overview of principles of hybridization and the strategy of nucleic acid probe assays,”Elsevier(1993)に見出すことができる。
【0013】
本明細書で使用される「相補的」及び「相補性」という用語は、標的核酸の全て又は領域(例えば、生成物核酸の領域)に非共有結合によって塩基対合するヌクレオチド配列を指す。カノニカルなワトソンクリック塩基対合では、アデニン(A)は、DNA中のシトシン(C)とのグアニン(G)と同様に、チミン(T)と塩基対を形成する。RNAにおいて、チミンは、ウラシル(U)に置き換えられる。したがって、AはTに相補的であり、GはCに相補的である。RNAでは、AはUに相補的であり、逆もまた同様である。典型的には、「相補的」は、少なくとも部分的に相補的であるヌクレオチド配列を指す。「相補的」という用語はまた、一方の鎖における全てのヌクレオチドが、対応する位置で他方の鎖中の全てのヌクレオチドに相補的であるように、完全に相補的である二本鎖を包含し得る。特定の場合において、ヌクレオチド配列は、全てのヌクレオチドが全ての対応する位置で標的核酸中の全てのヌクレオチドに相補的ではない、標的に部分的に相補的であり得る。例えば、プライマーは、標的核酸に完全に(すなわち、100%)相補的であってもよく、又はプライマー及び標的核酸は、完全未満のある程度の相補性(例えば、70%、75%、85%、90%、95%、99%)を共有してもよい。
【0014】
2つのヌクレオチド配列の同一性パーセントは、最適な比較目的のために配列をアライメントすることによって決定することができる(例えば、最適なアライメントのために第1の配列の配列にギャップを導入することができる)。次いで、対応する位置のヌクレオチドを比較し、2つの配列間の同一性パーセントは、それらの配列が共有する同一の位置の数の関数である(すなわち、同一性%=同一の位置の数/位置の総数×100)。1つの配列の位置が他の配列の対応する位置と同じヌクレオチドで占有されている場合、その分子はその位置で同一である。そのような数学的アルゴリズムの非限定的な例は、Karlin et al.,Proc.Natl.Acad.Sci.USA 90:5873-5877(1993)を参照されたい。そのようなアルゴリズムは、Altschul et al.,Nucleic Acids Res.25:389-3402(1997)に記載されるようなNBLAST及びXBLASTプログラム(バージョン2.0)に組み込まれる。BLAST及びGapped BLASTプログラムの利用時には、それぞれのプログラム(例えば、NBLAST)の初期設定パラメータを使用することができる。一態様では、配列比較のためのパラメータは、スコア=100、ワード長=12に設定することができ、又は変化させることができる(例えば、ワード長=5若しくはワード長=20)。
【0015】
本明細書で使用される場合、「オリゴヌクレオチド」は、2~500ヌクレオチド、例えば2~200ヌクレオチドのヌクレオチドの一本鎖多量体である。オリゴヌクレオチドは、合成であり得るか、又は酵素的に作製され得、いくつかの実施形態では、10~50ヌクレオチド長であり得る。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチド若しくは「RNAオリゴヌクレオチド」であり得る)又はデオキシリボヌクレオチドモノマー(すなわち、オリゴデオキシリボヌクレオチド若しくは「DNAオリゴヌクレオチド」であり得る)を含有し得る。いくつかの場合では、オリゴヌクレオチドは、リボヌクレオチド及びデオキシリボヌクレオチドの混合物を含有し得る。いくつかの場合では、オリゴヌクレオチドは、修飾された、すなわち、例えば、LNA、FANA、2’-O-Me RNA、2’-フルオロRNAなどを含む非天然ヌクレオチド若しくは修飾、連結修飾(例えば、ホスホロチオエート、3’-3’及び5’-5’逆連結)、5’及び/若しくは3’末端修飾(例えば、5’及び/若しくは3’アミノ、ビオチン、DIG、ホスフェート、チオール、染料、クエンチャーなど)、1つ以上の蛍光標識されたヌクレオチド、又はオリゴヌクレオチドに所望の機能を提供する任意の他の特徴を含有し得る。オリゴヌクレオチドは、例えば、10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150、又は150~200、最大500個のヌクレオチド又はそれ以上のヌクレオチド長であり得る。
【0016】
「ドメイン」は、核酸に関して使用される場合、複数のヌクレオチドからなる核酸の伸長又は長さを指し、その伸長又は長さは、核酸に定義された機能を提供する。ドメインの例としては、バーコードドメイン(ソースバーコードドメインなど)、プライマー結合ドメイン、ハイブリダイゼーションドメイン、一意の分子識別子(UMI)ドメイン、次世代配列決定(NGS)アダプタドメイン、NGSインデックス付けドメインなどが挙げられる。いくつかの事例では、「ドメイン」及び「領域」という用語は、同義的に使用され得、例えば、免疫受容体鎖ドメイン/領域が記載される場合、免疫受容体定常ドメイン/領域などを含む。所与のドメインの長さは様々であり得るが、いくつかの事例では、長さは、2~100nt、例えば、5~50nt、例えば、5~30ntの範囲である。増幅プライマー結合ドメインは、増幅プライマーにハイブリダイゼーションを介して結合するように構成されるドメインである。
【0017】
本明細書で使用される場合、「~に由来する」という表現は、第1の成分(例えば、第1の核酸分子)、又はその第1の成分からの情報が、異なる第2の成分(例えば、それが由来する第1の核酸分子とは構造、配列又は特徴が異なる第2の核酸分子)を単離、由来又は構築するために使用されるプロセスから生じる組成物を説明する。例えば、cDNA分子は、細胞中に見出される対応するmRNAに由来する。同様に、DNAライブラリは、細胞又は細胞集団から収集される全RNAに由来する。また、例えば、cDNAライブラリは、細胞又は細胞集団から収集されるmRNAに由来し得る。
【0018】
本明細書で使用される場合、「バーコード」という表現は、最も広範には、例えば、6~12ヌクレオチドの短い配列を説明し、これは、より大きなポリヌクレオチドに付加されると、そのより大きなポリヌクレオチドにタグ付けするのに役立ち、それによって、核酸のより大きなプール内の個々の核酸をカウント又は区別するための手段を提供する。本明細書で使用される場合、及び当業者によって認識されるように、広範なバーコード及びバーコード戦略が広く利用され、従来技術に記載されており、これらの全てが本明細書に記載されている本発明で使用される。本明細書で使用される場合、「バーコード」又は「インデックス」という用語は、タグ、識別子タグ、細胞バーコード、細胞バーコード配列、試料バーコード及び試料バーコード配列、ウェルバーコード、ソースバーコード配列、識別子、分子識別子、並びに他の類似及び等価の発現及び技術という用語と互換的に使用され得る。「一意の分子識別子」又は「UMI」という表現はまた、様々な長さのランダマーを指し、また、本明細書で使用される場合、広義の「バーコード」にも包含される。
【発明を実施するための形態】
【0019】
初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製する方法が提供される。この方法の態様は、細胞源サブ部分の第1のセットを提供することを含み、各サブ部分は、初期の複数の細胞源のうちの複数の細胞源を含む。次に、第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、第1のセットの各サブ部分の複数の細胞源において第1の識別子タグ付き核酸が生成され、第1のセットの異なるサブ部分において用いられる鋳型スイッチオリゴヌクレオチドの第1の識別子は、所与のサブ部分内で同一であるが、異なるサブ部分間で異なる。次に、サブ部分の細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成し、次いで、第1のプールを、第1の識別子タグ付き核酸を有する複数の細胞源を各々が含むサブ部分の第2のセットに配分する。次に、第1の識別子及び第2の識別子の両方を含む、第2のセットの各サブ部分における複数の細胞源から細胞源識別可能な核酸が産生されて(第2のセットの各サブ部分の第2の識別子は、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる)、初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製する。各細胞源識別可能な核酸コレクションの核酸は、核酸の細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む。本発明の1つの方法は、
図5に提供されるフローチャートに図示される。
【0020】
他の実施形態では、追加ラウンドのインデックスを核酸コレクションに付加するために、所望に応じて、新しいサブ部分へのプール及び再分配の追加ラウンドを用いることができる。ラウンドの数、及び各ラウンドにおける個々の細胞源サブ部分の総数は、方法論の任意の特定の適用のための方法を最適化するように、すなわち、ユーザーの目的に適合し、最適に検査される細胞の総数(すなわち、細胞源の総数)を反映するように選択される。
【0021】
一般に、検査される細胞の総数は、第1及び第2の付加ステップ(及び任意選択的な更なる追加)で付加されるヌクレオチド配列識別子(例えば、バーコード、タグ、又は任意のタイプの分子識別子)の可能な一意の組み合わせ及び配向の総数が、研究者が調査したい一意の細胞の数よりも大幅に大きいため、各細胞がヌクレオチド配列識別子の一意の組み合わせを取得し、それにより個々の細胞源に割り当てられる可能性が高い。例として、識別子の数が細胞源の数の10倍である場合、約5%のダブレット率が達成される。細胞源に対する識別子の比率を増加又は減少させることにより、ダブレット率を所望に応じて増加又は減少させることができる。
【0022】
本発明がより詳細に記載される前に、本発明は、記載される特定の実施形態に限定されず、したがって、もちろん、変動し得ることを理解されたい。また、本発明の範囲は、添付の特許請求の範囲によってのみ限定されることになるため、本明細書で使用される用語は、特定の実施形態のみを説明する対象となるためのものであり、限定することが意図されるものではないことも理解されるべきである。
【0023】
値の範囲が提供される場合、文脈が明確に別段の指示をしない限り、その範囲の上限と下限との間の、下限の単位の10分の1までの各中間値、及びこの記載の範囲内の任意の他の記載される値又は中間値が本発明に包含されることが理解されるべきである。これらのより小さな範囲の上限及び下限は、独立して、より小さな範囲に含まれ得、また、記述の範囲内の任意の特定の除外された制限に従うことを条件として、本発明内に包含される。記述の範囲が、制限の一方又は両方を含む場合、それらの含まれる制限の一方又は両方を除外する範囲もまた、本発明に含まれる。
【0024】
ある範囲は、「約」という用語が数値に先行して本明細書で提示される。「約」という用語は、この用語が先行する正確な数、及びこの用語が先行する数に近い数又はほぼその数である数についての逐語的支持を提供するために本明細書で使用される。ある数が、具体的に列挙された数に近いか又はほぼその数であるかを決定する際に、列挙されていない数に近いか又はほぼその数は、提示される文脈において、具体的に列挙された数の実質的な同等性を提供する数であり得る。
【0025】
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する当業者によって一般に理解される意味と同じ意味を有する。また、本明細書に記載のものと同様の又は同等な任意の方法及び材料が、本発明の実施又は試験に使用され得るが、代表的な例示的な方法及び材料が以下に記載される。
【0026】
本明細書で引用される全ての刊行物及び特許は、各個々の刊行物又は特許が、参照により組み込まれると具体的かつ個々に示されるかのように参照により本明細書に組み込まれ、方法及び/又は材料を刊行物が引用されるものに関して開示及び記載するために参照により本明細書に組み込まれる。いずれもの刊行物の引用は、出願日前のその開示についてのものであり、本発明が、従来発明のためそのような刊行物に先行する権利がないことを認めるものとして解釈されるべきでない。更に、提供される刊行物の日付は、実際の公開日とは異なり得、これらは独立して確認する必要があり得る。
【0027】
本明細書及び添付の特許請求の範囲で使用される場合、「a」、「an」、及び「the」との単数形は、別途文脈が明確に指示しない限り、複数の指示対象を含むことに留意されたい。特許請求の範囲は、あらゆる任意選択的な要素を排除するように設計され得ることに更に留意されたい。したがって、この記述は、特許請求要素の列挙に関連した「もっぱら(solely)」及び「のみ(only)」などの排他的用語の使用のための、又は「消極的な」限定の使用のための先行詞として機能することが意図される。
【0028】
本開示を読むと当業者には明らかであろうように、本明細書に記載及び例証される個々の実施形態の各々は、本発明の範囲又は趣旨から逸脱することなく、他の様々な実施形態のいずれかの特徴から容易に分離され得るか、又はこれらと組み合わされ得る別個の構成要素及び特徴を有する。任意の列挙された方法は、列挙された事象の順序、又は論理的に可能な任意の他の順序で実行され得る。
【0029】
装置及び方法は、文法的流動性のために、機能的な説明で記載されているか又は記載されるが、特許請求の範囲は、米国特許法第112条下で明確に記載されない限り、「手段」又は「ステップ」限定の構文によって必然的に限定されるとなんら解釈されるべきでなく、司法均等論下で特許請求の範囲によって提供される定義の意味及び均等物の完全な範囲を付与されるべきであり、特許請求の範囲は、米国特許法第112条下で明確に記載される場合、米国特許法第112条下で完全な法定による均等物が付与されるべきであることを明確に理解されたい。
【0030】
方法
上記に要約され、図に概略的に図示されるように、本明細書は、組み合わせインデックス付け技術を使用して、初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製するための方法を提供する。本明細書に記載のこれらの方法は、当業者に認識されるように、既存の細胞組み合わせインデックス付けプロトコルよりも利点を提供する。例えば、本明細書に記載の方法において、mRNA転写産物の全長を、長いリード配列決定技術を適用することなく、組み合わせてインデックス付けし、アッセイすることができる。更に、免疫細胞受容体中のものなどの5’末端配列は、分析のために具体的に標的化することができる。
【0031】
細胞源
本明細書で使用される場合、「細胞源」という表現は、核酸を含有する細胞又はその任意の成分を指す。細胞成分を使用する場合、その成分は、「核酸提供成分」と称される。いくつかの事例では、細胞源は、細胞又は細胞核のいずれかであり得る(ここで、「核」という用語は、細胞の染色体を含有する膜結合細胞小器官を指すべく、その従来の意味で使用される)。
【0032】
本発明の実施形態に従って細胞源識別可能な核酸が産生される初期の細胞源は、様々であり得、特に限定されない。細胞源が得られ得る細胞試料は、限定されないが、例えば、細胞組織、生検、血液試料、細胞培養物などを含む様々な源に由来し得る。更に、細胞試料は、特定の臓器、組織、腫瘍、新生物などに由来し得る。更に、任意の集団からの細胞は、細菌又は酵母を含む原核生物又は真核生物の集団などの、主題の方法で使用される細胞源の供給源であり得る。いくつかの事例では、主題の方法で利用される細胞源は、げっ歯類(例えば、マウス又はラット)細胞試料、非ヒト霊長類細胞試料、ヒト細胞試料などの哺乳動物細胞試料であり得る。いくつかの事例では、哺乳動物細胞試料は、例えば、げっ歯類(例えば、マウス又はラット)血液試料、非ヒト霊長類血液試料、ヒト血液試料などを含むが、これらに限定されない、哺乳動物血液試料であってもよい。
【0033】
生物又は細胞培養物由来の細胞を使用する場合、特定の細胞型の細胞、例えば、免疫系細胞、神経細胞、心臓細胞、腫瘍細胞、又は任意の他の細胞型が好ましい場合がある。免疫系細胞を使用する場合、組み合わせインデックス付け分析で使用される細胞型をなお更に絞り込むことが好ましい場合がある。例えば、分析をB細胞又はT細胞のいずれかのみに限定することが好ましい場合がある。全血からの細胞を分析に使用する場合、末梢血単核細胞(PBMC)を使用することが好ましい場合がある。
【0034】
細胞源が細胞核である場合、核は、任意の好都合な核単離プロトコルを使用して初期細胞から得てもよい。細胞源が細胞であり、細胞が最初に単離されていない場合、例えば、細胞が組織の一部である場合、細胞は、例えば、任意の好都合な細胞単離プロトコルを使用して、初期細胞試料から得てもよい。
【0035】
初期の複数の細胞源における細胞又は細胞核の数は、用いられる複数ラウンドのインデックス付けによって十分な多様性が作成されることを考えると、最小数の細胞又は核の要件、又は分析され得る最大数の細胞又は核の上限のいずれにも特に限定若しくは制限されない。例えば、本発明の方法では、2、3、又はそれ以上のラウンドのインデックス付けが用いられ得る。初期の複数の細胞源における細胞又は細胞核の数は様々であり得るが、いくつかの事例では、初期の複数の細胞源の数は、2~10,000,000の範囲であり、例えば、1,000~1,000,000であり、10,000~100,000を含み、いくつかの事例では、複数の細胞源における初期の細胞源の数は、1,000,000以上など、100,000以上である。いくつかの実施形態では、初期の複数の細胞源は、任意の数の異なる独立した細胞試料、例えば、1~100個の独立した試料又はそれ以上、例えば、100~1,000個又はそれ以上の独立した試料を含み得る。
【0036】
本明細書で使用される場合、「細胞源識別可能な」という表現は、所与のコレクションの核酸の源、例えば、単一細胞又は単一の核を、同一の細胞源から生成される所与の核酸集団の核酸が同一又は共通起源の源までさかのぼって追跡できるように、決定することができることを意味する。言い換えれば、所与の細胞源識別可能なコレクションの核酸は、同じ源、例えば、細胞又は核に由来していると決定できる核酸集団から構成される。本発明の方法は、初期の複数の細胞源からの細胞源識別可能な核酸コレクションの調製を提供し、各調製されたコレクションは、複数の細胞源のうちの異なる細胞源までさかのぼって追跡できる。言い換えれば、本発明の方法は、いくつかの初期の細胞源、例えば、細胞又は核からいくつかの核酸コレクションを調製することを可能にし、各調製されたコレクションは、初期の複数の細胞源のうちのそれ自体の一意の細胞源までさかのぼって追跡することができ、すなわち、核酸は、初期の複数の細胞源のうちのそれ自体の一意の細胞源に由来すると決定することができる。細胞源識別可能な核酸の識別子成分、例えば、以下により詳細に記載されるような第1及び第2の識別子は、所与の核酸コレクションの源、例えば、細胞又は核を遡及的に識別することを可能にし、それによって、集合的に、コレクションの核酸についてのソースバーコードとして機能する。更に、当業者には理解されるように、本方法によって用いられる細胞源は、例えば、細胞培養物からの個々の細胞を含むものに限定されない。本方法によって用いられる細胞源は、異なる集団又は異なる試料、例えば、異なる患者、異なる細胞培養物、異なる治療群、繁殖集団又は異なる細菌種からの異なる植物などからの細胞源であり得る。
【0037】
サブ部分の第1のセットの産生
本発明の実施形態の方法の態様は、細胞源サブ部分の第1のセットを提供することを含み、各サブ部分は、初期の複数の細胞源のうちの複数の細胞源を含む。このステップにおいて、初期の複数の細胞源は、いくつかのサブ部分に分割され、そのサブ部分は、集合的に第1のセットを構成し、各サブ部分は、複数の異なる細胞源を含む。言い換えれば、各々が複数の細胞源から構成される複数のサブ部分が、初期の複数の細胞源から生成される。所望される場合、サブ部分は、例えば、マルチウェルプレートのウェルなどの固体バリアによって互いから隔離された容器(container)又は容器(vessel)内に存在してもよい。あるいは、サブ部分は、当該技術分野で既知であるように、液滴に含有され得、例えば、液滴は、液滴コレクション中の任意の他の液滴とは異なる。第1のセットを構成するサブ部分の数は様々であり得るが、いくつかの事例では、その数は、2~25,000個のサブ部分、例えば、96~10,000個のサブ部分、例えば、96~384個のサブ部分の範囲である。上記に示されるように、第1のセットの各サブ部分は、複数の細胞源で構成されている、すなわち、複数の細胞源を含む。複数の細胞試料が分析されるいくつかの実施形態では、各々の独立した試料は、初期の細胞源コレクションのサブ部分であるとみなされる。第1のセットの所与のサブ部分を構成する細胞源の数は様々であり得るが、いくつかの事例では、その数は、1~10,000、例えば10~1,000の範囲であり、100~1,000を含む。
【0038】
例えば、上記及び以下に記載されるように、本発明の方法で用いられるサブ部分は、多様な異なる形式をとり得る。サブ部分は、例えば、チューブ、マルチウェルプレートのウェルなどを含むが、これらに限定されない、任意の好適な反応容器の形態をとり得る。いくつかの事例では、サブ部分は、マルチウェルデバイス(例えば、マルチウェルプレート又はマルチウェルチップ又は液滴など)のウェルである。いくつかの事例では、特定の反応ステップに必要な成分は、他の試薬の添加の前に反応容器内に配置され得、例えば、反応容器は、反応の1つ以上の成分で事前に調製され得る。例えば、反応容器は、1つ以上のオリゴヌクレオチドで事前に調製され得、そのようなオリゴヌクレオチドが水和(例えば、溶液若しくは液滴)又は脱水(例えば、乾燥、凍結乾燥)形態で反応容器内に配置される場合が含まれる。脱水反応成分、例えば、凍結乾燥オリゴヌクレオチド及び/又は酵素は、使用前に反応容器内で再水和されてもよく、又は他の反応成分若しくは細胞源の添加中に再水和されてもよい。反応混合物及びその成分を添加してもよく、主題の方法の反応が行われてもよいサブ部分として機能し得る反応容器は、様々であろう。有用な反応容器としては、例えば、チューブ(例えば、単一のチューブ、マルチチューブストリップなど)、ウェル(例えば、マルチウェルプレート(例えば、96ウェルプレート、384ウェルプレート、又は2000、4000、6000、又は10,000以上のような任意の数のウェルを有するプレート)が挙げられるが、これらに限定されない。マルチウェルプレートは、例えば、以下でより詳細に説明するように、独立していてもよく、チップ及び/又はデバイスの一部であってもよい。例えば、96ウェルプレート、384ウェルプレート、又は2000、4000、6000、若しくは10000個以上のような任意の数のウェルを有するプレートである。マルチウェルプレートは、チップ及び/又はデバイスの一部であり得る。本開示は、マルチウェルプレート内のウェルの数に限定されない。様々な実施形態では、プレート上のウェルの総数は、100~200,000、又は5,000~10,000である。他の実施形態では、プレートは、各々が5,000~20,000ウェルを含む、より小さなチップを含む。例えば、正方形のチップは、0.1mmの直径を有する125×125ナノウェルを含み得る。マルチウェルプレート内のウェル(例えば、ナノウェル)は、任意の好都合なサイズ、形状、又は体積で作製され得る。ウェルは、長さ100μm~1mm、幅100μm~1mm、及び深さ100μm~5mm以上であってもよい。いくつかの事例では、ウェルは、例えば、4mm以下、3mm以下、2mm以下、1mm以下を含むが、これらに限定されない、5mm以下の深さを有し得る。様々な実施形態では、各ナノウェルは、1~6以上のアスペクト比(深さ対幅の比)を有する。一実施形態では、各ナノウェルは、1:6のアスペクト比を有する。横断面領域は、円形、楕円形、楕円形、円錐形、長方形、三角形、多面体、又は任意の他の形状であり得る。ウェルの任意の所与の深さにおける横断面積も、サイズ及び形状が様々であり得る。特定の実施形態では、ウェルは、0.1nL~1μLの体積を有する。ナノウェルは、1μL以下、例えば500nL以下の体積を有し得る。体積は、100nL以下などの200nL以下であってもよい。一実施形態では、ナノウェルの体積は、100nLである。必要に応じて、ナノウェルは、表面積対体積比を増加させるように作製され得、それによって、熱サイクルのランプ時間を減らすことができる、ユニットを通る熱伝達を促進する。各ウェル(例えば、ナノウェル)の空洞は、様々な構成を取り得る。例えば、ウェル内の空洞は、線形又は湾曲した壁によって分割されて別個であるが隣接する区画を形成することができ、又は円形の壁によって分割されて内側及び外側の環状区画を形成することができる。いくつかの実施形態では、例えば、アドレス指定可能なナノウェルのアレイの形態のマルチウェルプレートが用いられる。そのようなマルチウェルプレートの例は、ICELL8(登録商標)Single-Cell MSND System(Takara Bio USA)の一部であるものである。ICELL8(登録商標)MSNDシステムの詳細は、米国特許第7,833,709号及び第8,252,581号、並びに公開されている米国特許出願公開第2015/0362420号及び2016/0245813号(これらの開示は参照により本明細書に組み込まれる)に更に見出される。
【0039】
第1の識別子タグ付き核酸の生成
例えば、上記のように、サブ部分の第1のセットの生成に続いて、本発明の実施形態の方法は、鋳型スイッチング媒介反応を使用して、第1のセットの各サブ部分の複数の細胞源において第1の識別子タグ付き核酸を生成することを含む。このステップで生成又は産生される第1の識別子タグ付き核酸は、第1の識別子ドメイン又は領域を含む核酸である。所与の第1の識別子ドメインは、長さが限定されずに様々であり得、例えば、いくつかの事例では、4~20ヌクレオチド(nt)、例えば、8~12ntの範囲であり、いくつかの実施形態では、所与の方法において用いられる他の第1の識別子ドメインの配列と区別可能な配列を有するであろう。いくつかの実施形態では、第1の識別子ドメインはまた、方法の後続のステップで用いられる第2の又は追加の識別子ドメインとは異なるであろう。第1の識別子タグ付き核酸を生成するために用いられるプロトコルに応じて、第1の識別子は、第1の識別子タグ付き核酸上の、タグ付き核酸の末端(end)又は末端(terminus)に近接する位置に存在し得る。
【0040】
更に他の実施形態では、第1のバーコード(すなわち、第1の識別子ドメイン配列)及び第2又は後続のバーコード(すなわち、第2の識別子ドメイン配列)が同一であり、やはり細胞源識別可能な核酸コレクションを生成するために使用され得ることが可能である。すなわち、バーコードが異なるラウンドで付加されるという事実により、各ラウンドにおけるバーコードが別のバーコード付けラウンドにおけるバーコードとは異なることを必要とせずに、付加の順序によってバーコードを区別することができる。
【0041】
上記のように、第1の識別子タグ付き核酸は、複数の細胞源内で生成され、これは、第1の識別子タグ付き核酸が、無傷であるが透過処理された細胞源の内側で生成されることを意味する。したがって、細胞源が細胞である場合、第1の識別子タグ付き核酸が細胞内で生成される。同様に、細胞源が核である場合、第1の識別子タグ付き核酸が核内で産生される。このステップで用いられる試薬を細胞源の初期鋳型核酸にアクセスさせるために、細胞源を透過処理してもよい。細胞源、例えば、細胞又は核を透過処理するための任意の好都合なプロトコルを用いてもよい。本明細書で使用される場合、「透過処理する」という用語は、鋳型スイッチング媒介反応で用いられる試薬、例えば、鋳型スイッチオリゴヌクレオチド、逆転写酵素、第一鎖cDNAプライマーなどに対して、膜、例えば、細胞膜又は核エンベロープを透過性にすることを意味する。本明細書で使用される場合、「透過性」という用語は、酵素、オリゴヌクレオチド(例えば、鋳型スイッチオリゴヌクレオチド若しくはプライマー)など、又は核を囲む膜である細胞膜若しくは核エンベロープなどの脂質二重層膜を通過する他の材料の能力を指す。「透過性」という用語は、他の試薬に対する(例えば、特定のサイズの)特定の試薬に対する透過性を示す相対的な用語であり得る。本明細書に記載される実施形態では、透過処理している間、細胞源、例えば、細胞又は核は、構造的に無傷のままである。本明細書に記載の実施形態では、透過処理は、細胞源を、細胞及び/又は細胞小器官膜を多孔化することができる化学薬品と接触させることによって実行され得る。いくつかの事例では、化学剤は、洗剤であり、細胞源を、1つ以上の洗剤を含む緩衝液と接触させることによって、透過処理を実行することができる。「洗剤」という用語は、本明細書で使用される場合、両親媒性(部分的に親水性/極性及び部分的に疎水性/非極性)界面活性剤又は両親媒性界面活性剤の混合物を指す。洗剤は、それらの極性部分の電荷に従って、「アニオン性」(負電荷;例えば、アルキルベンゼンスルホネート及びデオキシコール酸などの胆汁酸を含むがこれらに限定されない)、「カチオン性」(正電荷;例えば、四級アンモニウム及びピリジニウム系洗剤を含むがこれらに限定されない)、「非イオン性」(無電荷;例えば、Tween及びTritonなどのポリオキシエチレン/PEG系洗剤、並びにHEGA及びMEGAなどのグリコシド系洗剤を含むがこれらに限定されない)、並びに「双性イオン性」(洗剤分子上の正及び負電荷の数が等しいために無電荷;例えば、CHAPS及びアミドスルホベタイン型洗剤を含むがこれらに限定されない)として広く分類することができる。いくつかの実施形態では、細胞源を透過処理するための好適な洗剤には、ドデシル硫酸ナトリウム(SDS)、ジギトニン、leucoperm、サポニン、及びtween20が含まれるが、これらに限定されない。いくつかの実施形態では、核を透過処理するための好適な洗剤としては、非イオン性洗剤、Triton X-100、Nonidet-P40、イオン性洗剤、ドデジル硫酸ナトリウム(SDS)、デオキシコール酸塩、サルコシル、及び当業者によって識別可能な追加の洗剤が挙げられるが、これらに限定されない。細胞及び核などの細胞小器官を透過処理するための洗剤の好適な濃度は、洗剤に応じて様々な濃度を含む(例えば、最大1%の最終濃度のドデシル硫酸ナトリウムを参照されたい)。それらの臨界ミセル濃度値(CMC)及び他の特性を含む一般的な洗剤に関する追加情報は、“Detergents:G-Biosciences(2018)から入手可能なHandbook&Selection Guide to Detergents&Detergent Removal”、Neugebauer,Detergents:An overview,in Methods in Enzymology,M.P.Deutscher,Editor(1990)Academic Press.p.239-253、及びSchramm et al.,Surfactants and their applications.Annual Reports Section“C”(Physical Chemistry),2003.99(0):p.3-48に見ることができる。そのような情報により、熟練したユーザーは、洗剤の濃度を微調整して、CMCを超えず、細胞/細胞小器官の完全な溶解を引き起こさないようにすることが容易に可能となる。当業者には理解されるように、本明細書で説明される実施形態では、透過処理は、酵素及び他の試薬が細胞膜を受動的に通過し、細胞内又は細胞小器官内で酵素反応を実行することを可能にするが、一方で、核酸(例えば、mRNA及びゲノムDNA)などの細胞材料は、細胞又は核内に捕捉されたままであり、拡散しない。
【0042】
本明細書に記載の方法の実施形態では、透過処理後、細胞又は細胞小器官、例えば、核を、細胞内又は細胞小器官内、例えば、核内で細胞源の内部の第1の識別子タグ付き核酸を産生することができる試薬と接触させる。上記で要約したように、第1の識別子タグ付き核酸は、鋳型スイッチング媒介反応を使用して細胞源内で生成される。「鋳型スイッチング媒介」反応とは、ポリメラーゼが鋳型核酸から鋳型スイッチオリゴヌクレオチドに切り替わる核酸合成反応を意味する。したがって、本発明の方法では、第1の識別子タグ付き核酸は、鋳型スイッチオリゴヌクレオチド及び好適なポリメラーゼを使用して細胞源において産生される。鋳型スイッチオリゴヌクレオチドは、鋳型スイッチング反応、例えば、RNA鋳型の逆転写又はDNA鋳型の逆転写に利用されるオリゴヌクレオチドである。したがって、識別子タグ付き核酸の産生は、鋳型スイッチング及び特定の核酸ポリメラーゼの「鋳型切り替え」能力、すなわち、重合のための鋳型として第1の核酸鎖を使用し、次いで、重合反応を継続しながら、第2の鋳型核酸鎖(「鋳型スイッチ核酸」又は「アクセプタ鋳型」と称する場合もある)に切り替えることができる。結果は、第1の鋳型核酸鎖に相補的な5’領域及び鋳型スイッチ核酸に相補的な3’領域を有するハイブリッド核酸鎖の合成である。鋳型スイッチングに関連する方法及び試薬は、米国特許第9,410,173号及び第10,941,397号(これらの開示は参照によりその全体が本明細書に組み込まれる)にも記載されている。
【0043】
本開示の方法は、鋳型スイッチングによる第1の識別子タグ付き核酸の産生において鋳型スイッチオリゴヌクレオチドを利用する。したがって、方法の実施形態は、透過処理された細胞源を、細胞源における鋳型スイッチング反応を介して第1の識別子タグ付き核酸を生成するのに十分な試薬と接触させることを含み、そのような試薬は、以下でより詳細に記載するように、鋳型スイッチオリゴヌクレオチド、鋳型スイッチングポリメラーゼ、第1の鎖プライマーなどを含み得る。
【0044】
「鋳型スイッチオリゴヌクレオチド」とは、核酸重合反応中に、ポリメラーゼが初期鋳型(例えば、鋳型核酸(例えば、RNA鋳型又はDNA鋳型))から切り替わるオリゴヌクレオチド鋳型を意味する。この点において、鋳型は、「ドナー鋳型」と呼ばれ得、鋳型スイッチオリゴヌクレオチドは、「アクセプタ鋳型」と呼ばれる場合もある。鋳型スイッチオリゴヌクレオチドは、修飾されているか、又はそうでなければ天然に存在しない1つ以上のヌクレオチド(又はその類似体)を含み得る。例えば、鋳型スイッチオリゴヌクレオチドは、1つ以上のヌクレオチド類似体(例えば、LNA、FANA、2’-O-Me RNA、2’-フルオロRNAなど)、連結修飾(例えば、ホスホロチオエート、3’-3’及び5’-5’逆連結)、5’及び/若しくは3’末端修飾(例えば、5’及び/若しくは3’アミノ、ビオチン、DIG、ホスフェート、チオール、染料、クエンチャーなど)、1つ以上の蛍光標識されたヌクレオチド、又は鋳型スイッチオリゴヌクレオチドに所望の機能を提供する任意の他の特徴を含み得る。
【0045】
特定の態様では、鋳型スイッチオリゴヌクレオチドは、その3’末端に位置する3’ハイブリダイゼーションドメインを含む。3’ハイブリダイゼーションドメインは、長さが様々であり得、いくつかの事例では、長さが2~10ヌクレオチド、例えば長さが3~7ntの範囲である。鋳型スイッチオリゴヌクレオチドの3’ハイブリダイゼーションドメインは、非鋳型化配列に相補的な配列、例えば、新しく合成された逆転写された第1の鎖cDNAの3’末端に付加されたデオキシシチジン伸長を含み得る。以下でより詳細に記載される非鋳型化配列は、一般に、鋳型、例えば、RNA鋳型又はDNA鋳型に対応せず、鋳型化されない配列を指す。鋳型スイッチオリゴヌクレオチドの3’ハイブリダイゼーションドメインに存在する場合、非鋳型化配列は、3’ハイブリダイゼーションドメイン全体又はその一部分を包含し得る。いくつかの事例では、非鋳型化配列は、ヘテロ-ポリヌクレオチドを含み得るか、又はヘテロ-ポリヌクレオチドからなり得、そのようなヘテロ-ポリヌクレオチドの長さは、2~10ntの間で様々であり得、例えば、長さ3~7ntであり、3ntを含む。いくつかの事例では、非鋳型化配列は、ホモ-ポリヌクレオチドを含み得るか、又はホモ-ポリヌクレオチドからなり得、そのようなホモ-ポリヌクレオチドの長さは、2~10ntの間で様々であり得、例えば、長さ3~7ntであり、3ntを含む。いくつかの実施形態によれば、反応混合物に組み合わされたポリメラーゼ(例えば、MMLV RTなどの逆転写酵素)は、ホモ-ヌクレオチド伸長(例えば、C-C-Cなどのホモ-トリヌクレオチド)が新生鎖の3’末端に付加され得るように末端トランスフェラーゼ活性を有し、鋳型スイッチオリゴヌクレオチドの3’ハイブリダイゼーションドメインは、新生鎖の3’末端のホモヌクレオチド伸長(例えば、G-G-Gなどのホモ-トリヌクレオチド)に相補的なホモヌクレオチド伸長を含む。他の態様では、末端トランスフェラーゼ活性を有するポリメラーゼが、新生鎖の3’末端にヌクレオチド伸長(例えば、トリヌクレオチド伸長)を付加する場合、鋳型スイッチオリゴヌクレオチドの3’ハイブリダイゼーションドメインは、シトシン及びグアニンを含むヘテロ-トリヌクレオチド伸長(例えば、r(C/G)3オリゴヌクレオチド)を含み、鋳型スイッチオリゴヌクレオチドのヘテロ-トリヌクレオチド伸長は、新生鎖の3’末端に相補的である。3’ハイブリダイゼーションドメイン及び鋳型スイッチオリゴヌクレオチドの例は、米国特許第5,962,272号(その開示は、参照により本明細書に組み込まれる)に更に記載されている。
【0046】
(鋳型スイッチオリゴヌクレオチドの3’末端に位置する)3’ハイブリダイゼーションドメインに加えて、鋳型スイッチオリゴヌクレオチドは、例えば、上記のように、第1の識別子ドメインを更に含む。いくつかの実施形態では、第1の識別子ドメインは、鋳型スイッチオリゴヌクレオチド上の、5’末端の3’、したがって3’ハイブリダイゼーションドメインの5’の位置に配置される。第1のセットのサブ部分の所与の細胞源の全てについて、同じ第1の識別子ドメインを有する同じ鋳型スイッチオリゴヌクレオチドを、鋳型スイッチング媒介反応に用いる。したがって、各サブ部分の各細胞源で産生される第1の識別子タグ付き核酸は、同一又は共通の第1の識別子ドメインを有する。しかしながら、第1のセットの異なるサブ部分とともに用いられる鋳型スイッチオリゴヌクレオチドは、少なくともそれらの第1の識別子ドメインの配列に関して互いに異なるため、第1のサブ部分のタグ付き核酸の第1の識別子ドメインは、第1のセットの任意の他のサブ部分のタグ付き核酸の第1の識別子ドメインと区別することができる。したがって、第1のセットの異なるサブ部分で用いられる鋳型スイッチオリゴヌクレオチドの第1の識別子は、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる。所与のワークフロー内で、異なる鋳型スイッチオリゴヌクレオチド(それらの第1の識別子の配列に関して互いに異なる)の数は、様々であり得、かつ所与の第1のセットの第1のサブ部分の数に対応し得、いくつかの事例では、2~25,000個の異なる鋳型スイッチオリゴヌクレオチド、例えば96~10,000個の異なる鋳型スイッチオリゴヌクレオチドを含む2~25,000個の異なる鋳型スイッチオリゴヌクレオチドの範囲であり得る。一般に、第1のサブ部分と同じ数の異なる鋳型スイッチオリゴヌクレオチドがあるべきである。
【0047】
いくつかの実施形態によれば、鋳型スイッチオリゴヌクレオチドは、鋳型スイッチオリゴヌクレオチドの5’末端の相補体(例えば、鋳型スイッチオリゴヌクレオチドの5’アダプタ配列)を合成した後、ポリメラーゼが鋳型スイッチオリゴヌクレオチドから異なる鋳型核酸に切り替わるのを防ぐ修飾を含む。有用な修飾としては、脱塩基損傷(例えば、テトラヒドロフラン誘導体)、ヌクレオチド付加物、イソヌクレオチド塩基(例えば、イソシトシン、イソグアニンなど)、及びそれらの任意の組み合わせが挙げられるが、これらに限定されない。
【0048】
いくつかの事例では、鋳型スイッチオリゴヌクレオチドは、一意の分子識別子を含み得る。用語「一意の分子識別子」及び「UMI」は、所与の分子種の個々の分子のカウントに使用することができる、様々な長さ、例えば、いくつかの事例において6~12ntの長さの範囲のランダマーを指す。いくつかの事例では、カウントは、各個々の分子が一意のUMIを受け取るように、多様なUMIプールから目的の標的の個々の分子にUMIを結合させることによって促進される。そのような場合、個々の転写分子をカウントすることによって、NGSライブラリの準備中に生成されたPCRバイアスを補正することができ、試料集団のより定量的な理解を達成することができる。UMIは、いくつかの事例では、ソースバーコード配列(例えば、細胞バーコード配列、試料バーコード配列、ウェルバーコード配列など)などの他のバーコード配列と併せて使用され得る。鋳型スイッチオリゴヌクレオチド上に存在する場合、所与のサブ部分内で、異なる鋳型スイッチオリゴヌクレオチドの集団が用いられてもよく、この鋳型スイッチオリゴヌクレオチドの集団は、同一又は共通の第1の識別子ドメインを有し得るが、それらのUMIドメインの配列に関して互いに異なる。そのような場合、UMIドメインに関して互いに異なるが、所与のサブ部分に提供される共通の第1の識別子ドメインを共有する異なる鋳型スイッチオリゴヌクレオチドの数は、様々であり得る。
【0049】
いくつかの事例では、鋳型スイッチオリゴヌクレオチドは、アダプタドメイン(例えば、3’ハイブリダイゼーションドメインの定義されたヌクレオチド配列5’及び鋳型スイッチオリゴヌクレオチドの第1の識別子ドメイン)を含み得る。アダプタドメインは、下流用途において様々な目的を果たし得る。いくつかの事例では、アダプタドメインは、更なる増幅、又は例えば、入れ子増幅若しくは抑制増幅のためのプライマー結合部位として、例えば、NGS用途(以下により詳細に記載されるような)で用いられ得るような追加のドメインを導入するためのプライマー結合部位として機能し得る。いくつかの事例では、鋳型スイッチオリゴヌクレオチドは、配列決定プラットフォームアダプタ構築物を含む。「配列決定プラットフォームアダプタ構築物」とは、Illumina(登録商標)(例えば、HiSeq(商標)、MiSeq(商標)及び/若しくはGenome Analyzer(商標)配列決定システム)、Ion Torrent(登録商標)(例えば、Ion PGM(商標)及び/若しくはIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、PACBIO RS II配列決定システム)、Thermo Fisher Scientific(例えば、SOLiD配列決定システム)、又は目的の任意の他の配列決定プラットフォームなどの目的の配列決定プラットフォームによって利用される核酸ドメイン(例えば、配列決定プラットフォームアダプタ核酸配列)の少なくとも一部分を含む核酸構築物を意味する。特定の態様では、配列決定プラットフォームアダプタ構築物としては、表面結合配列決定プラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)配列決定システムにおけるフロー細胞の表面に結合したP5又はP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「捕捉部位」若しくは「捕捉配列」);配列決定プライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのリード1若しくはリード2プライマーが結合し得るドメイン);バーコードドメイン(例えば、所与の試料からの全ての分子を特定のバーコード若しくは「タグ」でマーキングすることによって、試料多重化を可能にするように配列決定される核酸の試料源を一意に識別するドメイン);バーコード配列決定プライマー結合ドメイン(バーコード配列決定に使用されるプライマーが結合するドメイン);一意のタグが配列決定される事例数に基づいて発現レベルを決定するために、目的の分子を一意にマーキングするための分子識別ドメイン(例えば、4、6、若しくは他の数のヌクレオチドのランダム化タグなどの分子インデックスタグ);又はそのようなドメインの任意の組み合わせが挙げられる。特定の態様では、バーコードドメイン(例えば、試料インデックスタグ)及び分子識別ドメイン(例えば、分子インデックスタグ)は、同じ核酸に含まれてもよい。配列決定プラットフォームアダプタ構築物は、目的の配列決定プラットフォームに好適な任意の長さ及び配列の核酸ドメイン(例えば、「配列決定アダプタ」)を含み得る。特定の態様では、核酸ドメインは、4~200ヌクレオチド長である。例えば、核酸ドメインは、4~100ヌクレオチド長、例えば、6~75、8~50、又は10~40ヌクレオチド長であり得る。特定の実施形態によれば、配列決定プラットフォームアダプタ構築物は、2~8ヌクレオチド長、例えば、9~15ヌクレオチド長、16~22ヌクレオチド長、23~29ヌクレオチド長、又は30~36ヌクレオチド長の核酸ドメインを含む。存在し得る配列決定プラットフォームアダプタ構築物を含むそのようなアダプタドメインの例としては、限定されないが、米国特許第9,719,136号、同第10,415,087号、同第10,781,443号、同第10,941,397号、同第10,954,510号、及び第11,124,828号(これらの開示は参照により本明細書に組み込まれる)に記載されるものが挙げられる。
【0050】
特定の態様では、配列決定プラットフォームアダプタ構築物は、表面結合配列決定プラットフォームオリゴヌクレオチド(例えば、Illumina(登録商標)配列決定システムにおけるフロー細胞の表面に結合したP5又はP7オリゴヌクレオチド)に特異的に結合するドメイン(例えば、「捕捉部位」又は「捕捉配列」)である核酸ドメイン、配列決定プライマー結合ドメイン(例えば、Illumina(登録商標)プラットフォームのリード1又はリード2プライマーが結合し得るドメイン)を含む。配列決定プラットフォームアダプタ構築物は、目的の配列決定プラットフォームに好適な任意の長さ及び配列の核酸ドメイン(例えば、「配列決定アダプタ」)を含み得る。特定の態様では、核酸ドメインは、4~200nt長である。例えば、核酸ドメインは、4~100nt長、例えば、6~75、8~50、又は10~40nt長であり得る。特定の実施形態によれば、配列決定プラットフォームアダプタ構築物は、2~8nt長、例えば、9~15ヌクレオチド長、16~22nt長、23~29nt長、又は30~36nt長の核酸ドメインを含む。
【0051】
核酸ドメインは、目的の配列決定プラットフォームによって用いられるポリヌクレオチド(例えば、オリゴヌクレオチド)が、例えば、核酸ドメインに隣接するcDNA挿入物の合成による固相増幅及び/又は配列決定のために、核酸ドメインに特異的に結合することを可能にする長さ及び配列を有し得る。例示的な核酸ドメインとしては、P5(5’-AATGATACGGCGACCACCGA-3’)(配列番号01)、P7(5’-CAAGCAGAAGACGGCATACGAGAT-3’)(配列番号02)、リード1プライマー(5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’)(配列番号03)及びリード2プライマー(5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’)(配列番号04)ドメインが挙げられる。他の例示的な核酸ドメインとしては、Aアダプタ(5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’)(配列番号05)及びP1アダプタ(5’-CCTCTCTATGGGCAGTCGGTGAT-3’)(配列番号06)がIon Torrent(商標)ベースの配列決定プラットフォーム上で用いられるドメインが挙げられる。
【0052】
目的の配列決定プラットフォーム上での配列決定に有用なアダプタ構築物のヌクレオチド配列は、時間の経過とともに変動及び/又は変化し得る。アダプタ配列は、典型的には、配列決定プラットフォームの製造元によって(例えば、配列決定システムとともに提供される、及び/又は製造元のウェブサイトで入手可能な技術文書において)提供される。そのような情報に基づいて、配列決定プラットフォームアダプタ構築物の配列は、目的のプラットフォーム上で核酸挿入物(鋳型核酸に対応する)を配列決定することを可能にする構成において、1つ以上の核酸ドメインの全て又は一部分を含むように設計され得る。非鋳型化配列に含まれ得る配列決定プラットフォームアダプタ構築物、並びに本明細書に記載される他の核酸試薬は、米国特許出願第14/478,978号(US2015-0111789A1として公開され、米国特許第10,941,397号として発行され、その開示は、参照により本明細書に組み込まれる)に更に記載される。
【0053】
鋳型スイッチオリゴヌクレオチドに加えて、例えば、第1のセットのサブ部分の透過処理された細胞源と接触するように提供される試薬は、第1の鎖プライマー(すなわち、例えば、鋳型核酸、例えば、RNA鋳型又はDNA鋳型からの合成をプライミングするための単一生成物核酸プライマー)を含み得る。第1の鎖プライマー(単一生成物核酸プライマー)は、鋳型結合ドメインを含む。例えば、核酸は、鋳型核酸、例えば、mRNA、ssDNAなどにハイブリダイズするように構成される第1の(例えば、3’)ドメインを含み得、鋳型核酸にハイブリダイズしない第2の(例えば、5’)ドメイン、例えば、以下でより詳細に説明するような非鋳型配列ドメインとしてみなされ得る1つ以上の追加のドメインを含んでも、含まなくてもよい。鋳型結合ドメインの配列は、独立して定義されてもよく、又は任意であってもよい。特定の態様では、鋳型結合ドメインは、定義された配列、例えば、ポリdT又は遺伝子特異的配列を有する。他の態様では、鋳型結合ドメインは、任意の配列(例えば、ランダム六量体配列などのランダム配列)を有する。更に他の事例では、鋳型結合ドメインは、例えば、米国特許第8,206,913号(その開示は、参照により本明細書に組み込まれる)に記載されるように、準ランダムであってもよい。鋳型結合ドメインの長さは様々であり得るが、いくつかの事例では、このドメインの長さは、5~50nt、例えば、6~25nt、例えば、6~20ntの範囲である。第1の鎖プライマーは、修飾されているか、又はそうでなければ天然に存在しない1つ以上のヌクレオチド(又はその類似体)を含み得る。例えば、単一生成物核酸プライマーは、1つ以上のヌクレオチド類似体(例えば、LNA、FANA、2’-O-Me RNA、2’-フルオロRNAなど)、連結修飾(例えば、ホスホロチオエート、3’-3’及び5’-5’逆連結)、5’及び/若しくは3’末端修飾(例えば、5’及び/若しくは3’アミノ、ビオチン、DIG、ホスフェート、チオール、染料、クエンチャーなど)、1つ以上の蛍光標識されたヌクレオチド、又は単一生成物核酸プライマーに所望の機能を提供する任意の他の特徴を含み得る。いくつかの事例では、第1の鎖プライマー(すなわち、単一生成物核酸プライマー)は、アダプタドメイン(例えば、単一生成物核酸プライマーの3’鋳型結合ドメインの定義されたヌクレオチド配列5’)を含んでもよく、アダプタドメインは、下流用途において様々な目的を果たし得る。いくつかの事例では、アダプタドメインは、本明細書に記載されるように、更なる増幅のためのプライマー結合部位として機能し得る。
【0054】
鋳型スイッチオリゴヌクレオチド及び第1の鎖プライマーに加えて、例えば、第1のセットのサブ部分の透過処理された細胞源と接触させるように提供される試薬は、鋳型スイッチングが可能であるポリメラーゼを含み得、ポリメラーゼは、第1の核酸鎖を重合のための鋳型として使用し、次いで、第2の鋳型核酸鎖の3’末端に切り替わり、すなわち、同じ重合反応を継続する。いくつかの事例では、鋳型スイッチングが可能なポリメラーゼは、逆転写酵素である。本発明の方法を実施するのに使用することができる鋳型スイッチングが可能な逆転写酵素としては、レトロウイルス逆転写酵素、レトロトランスポゾン逆転写酵素、レトロプラスミド逆転写酵素、レトロン逆転写酵素、細菌逆転写酵素、第II族イントロン由来逆転写酵素、及びその変異体、バリアント誘導体、又は機能性断片、例えば、RNase Hマイナス又はRNase H還元酵素が挙げられるが、これらに限定されない。例えば、逆転写酵素は、モロニーマウス白血病ウイルス逆転写酵素(MMLV RT)又はBombyx mori逆転写酵素(例えば、Bombyx mori R2非LTRエレメント逆転写酵素)であってもよい。主題の方法を実施するのに有用な鋳型スイッチングが可能なポリメラーゼは、市販されており、Takara Bio USA(San Jose,CA)から入手可能なSMARTScribe(商標)逆転写酵素及びPrimeScript(商標)逆転写酵素を含む。鋳型スイッチング能力に加えて、ポリメラーゼは、他の有用な機能を含んでもよい。例えば、ポリメラーゼは、末端トランスフェラーゼ活性を有し得、ポリメラーゼは、RNA又はDNA分子の3’ヒドロキシル末端へのデオキシリボヌクレオチドの付加を触媒することができる。特定の態様では、ポリメラーゼが鋳型の5’末端に到達すると、ポリメラーゼは、鋳型によってコードされない新生鎖の3’末端に1つ以上の追加のヌクレオチドを組み込むことができる。例えば、ポリメラーゼが末端トランスフェラーゼ活性を有する場合、ポリメラーゼは、新生鎖の3’末端に、1、2、3、4、5、6、7、8、9、10個又はそれよりも多くの追加のヌクレオチドを組み込むことが可能であり得る。ヌクレオチドの全ては、同じであってもよく(例えば、新生鎖の3’末端にホモヌクレオチド伸長を作成すること)、又はヌクレオチドのうちの1つ以上は、他のヌクレオチドと異なっていてもよい(例えば、新生鎖の3’末端にヘテロヌクレオチド伸長を作成すること)。特定の態様では、ポリメラーゼの末端トランスフェラーゼ活性により、2、3、4、5、6、7、8、9、10個又はそれよりも多くの同じヌクレオチド(例えば、全てのdCTP、全てのdGTP、全てのdATP、又は全てのdTTP)のホモヌクレオチド伸長が付加される。例えば、一実施形態によれば、ポリメラーゼは、MMLV逆転写酵素(MMLV RT)である。MMLV RTは、新生鎖の3’末端に追加のヌクレオチド(主にdCTP、例えば、3つのdCTP)を組み込む。本明細書の他の場所でより詳細に記載されるように、これらの追加のヌクレオチドは、例えば、鋳型から鋳型スイッチオリゴヌクレオチドへのポリメラーゼによる鋳型スイッチングを促進するために、鋳型スイッチオリゴヌクレオチドの3’ハイブリダイゼーションドメインと新生鎖の3’末端との間のハイブリダイゼーションを可能にするのに有用であり得る。
【0055】
第1の識別子タグ付き核酸が細胞源で産生される細胞源の鋳型核酸は、様々であり得る。特定の実施形態によれば、鋳型核酸は、鋳型リボ核酸(鋳型RNA)である。鋳型RNAは、メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、トランザクション低分子干渉RNA(ta-siRNA)、天然低分子干渉RNA(nat-siRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、核小体低分子RNA(snoRNA)、核内低分子RNA(snRNA)、長鎖ノンコーディングRNA(lncRNA)、ノンコーディングRNA(ncRNA)、トランスファー-メッセンジャーRNA(tmRNA)、前駆体メッセンジャーRNA(pre-mRNA)、低分子Cajal体特異的(small Cajal body-specific)RNA(scaRNA)、piwi結合(interacting)RNA(piRNA)、エンドリボヌクレアーゼ調製(endoribonuclease-prepared)siRNA(esiRNA)、短鎖一過性(small temporal)RNA(stRNA)、シグナル認識RNA、テロメアRNA、リボザイム、又はそれらのRNA型若しくはサブタイプの任意の組み合わせを含むが、これらに限定されない任意のタイプのRNA(又はそのサブタイプ)であってもよい。特定の実施形態によれば、鋳型核酸は、鋳型デオキシリボ核酸(鋳型DNA)である。鋳型DNAは、ゲノムDNA(例えば、原核生物ゲノムDNA(例えば、細菌ゲノムDNA、古細菌ゲノムDNAなど)、真核生物ゲノムDNA(例えば、植物ゲノムDNA、真菌ゲノムDNA、動物ゲノムDNA(例えば、哺乳動物ゲノムDNA(例えば、ヒトゲノムDNA、げっ歯類ゲノムDNA(例えば、マウス、ラット))、昆虫ゲノムDNA(例えば、ショウジョウバエ)、両生類ゲノムDNA(例えば、ゼノプス)など))、ウイルスゲノムDNA、ミトコンドリアDNA、又はそれらのDNA型若しくはそれらのサブタイプの任意の組み合わせを含むがこれらに限定されない任意のタイプのDNA(又はそのサブタイプ)であってもよい。
【0056】
上記のような鋳型スイッチング反応により、第1の識別子タグ付き細胞源サブ部分の第1のセットが生成され、各細胞源サブ部分は、複数の細胞源を含み、複数の細胞源(the cellular sources of the plurality)は、第1の識別子タグ付き核酸、例えば、第1の識別子ドメインを含む逆転写産物核酸を収容又は含有する(すなわち、内含する)。上記で概説したように、所与のサブ部分の細胞源内の第1の識別子タグ付き核酸の第1の識別子は、その第1の識別子を有する鋳型スイッチオリゴによって提供されたため、同一又は共通である。しかしながら、第1のセットの任意の2つのサブ部分の中では、タグ付き核酸の第1の識別子が異なるため、第1のサブ部分のタグ付き核酸は、第1のセットの任意の他のサブ部分のタグ付き核酸と区別することができる。
【0057】
第1のセットのサブ部分の細胞源内の第1の識別子タグ付き核酸の生成に用いられる試薬は、任意の好都合なプロトコルを使用して細胞源に提供され得る。例えば、上記で示されるように、試薬は、容器内に細胞源を導入する前に、必要に応じて、乾燥された形態又は液体形態で、サブ部分用容器(例えば、ウェル)内に存在し得る。あるいは、試薬は、例えば、手動でそれらを容器内に導入することによって、例えば、自動液体分配システムなどを使用して容器内に分配することによって、細胞源を収容するサブ部分用容器に提供され得る。いくつかの実施形態では、例えば、アドレス指定可能なナノウェルのアレイの形態で、マルチウェルプレートと、試料ディスペンサーとを含むマルチ試料ナノディスペンサー(MSND)システムが用いられる。そのようなMSNDシステムの例は、ICELL8(登録商標)Single-Cell MSND System(Takara Bio USA、San Jose,CA)である。ICELL8(登録商標)MSNDシステムの詳細は、米国特許第7,833,709号及び第8,252,581号、並びに公開されている米国特許出願公開第2015/0362420号及び2016/0245813号(これらの開示は参照により本明細書に組み込まれる)に更に見出される。
【0058】
プール/再配分
第1の識別子タグ付き細胞源サブ部分の第1のセットの産生後、第1の識別子タグ付き細胞源サブ部分を組み合わせるか、又はプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成する。異なるサブ部分の細胞源は、任意の好都合なプロトコルを使用して組み合わせてもよく、又はプールしてもよい。結果として生じる第1の細胞源プールにおける細胞源の数は様々であり得、いくつかの事例では、10,000~1,000,000個の細胞又は10,000~100,000個の細胞など、2~10,000,000個の細胞の範囲である。
【0059】
プールの後、得られた第1の細胞源プールを、第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分する。言い換えれば、第1の細胞源プールは、複数のサブ部分に分割又は分離され、これらは、集合的にサブ部分の第2のセットを構成し、異なるサブ部分は、複数の(a plurality of)又は複数の(multiple)細胞源を含み、異なるサブ部分を構成する複数の細胞源は、例えば、上記のように、第1の識別子タグ付き核酸を含む。第2のセットを構成するサブ部分の数は様々であり得るが、いくつかの事例では、その数は、2~25,000個のサブ部分、例えば、96~10,000個のサブ部分(96~5,184個のサブ部分を含む)の範囲である。いくつかの事例では、第2のセットにおけるサブ部分の数は、第1のセットにおけるサブ部分の数と同一である。上記に示されるように、第2のセットの各サブ部分は、複数の細胞源で構成されている、すなわち、複数の細胞源を含む。第2のセットの所与のサブ部分を構成する細胞源の数は様々であり得るが、いくつかの事例では、その数は、1~10,000、例えば100~1,000の範囲であり、100~500を含む。
【0060】
第2のセットの所与のサブ部分内で、そのサブ部分を構成する複数の細胞源は、細胞源に存在する第1の識別子タグ付き核酸の第1の識別子ドメインに関して各々異なる。プール/再配分ステップのために、第1のセットの異なるサブ部分からの細胞源は、第2のセットの同じサブ部分に組み合わされる。この同じサブ部分内で、細胞源内の第1の識別子タグ付き核酸は、第1の識別子ドメインの配列に関して互いに異なる。したがって、第2のセットの所与のサブ部分は、複数の異なる第1の識別子ドメインを有し、各々の異なるドメインは、それ自体の細胞源内に存在する。
【0061】
細胞源識別可能な核酸の産生
本発明の一実施形態では、プールされた細胞源の第1のセットをサブ部分の第2のセットに配分した後、次いで、第2のセットのサブ部分における複数の細胞源から細胞源識別可能な核酸が産生される。上述のように、細胞源識別可能な核酸は、その起源又は供給源が、核酸内に存在する識別子配列に基づいて決定され得る核酸であり、識別子配列は、少なくとも第1及び第2の識別子配列を含む。したがって、細胞源識別可能な核酸は、第1の識別子及び第2の識別子の両方を含み、これらの組み合わせから得られる配列情報は、細胞源識別可能な核酸が調製された源又は起源、すなわち開始細胞源を決定することを可能にする。以下でより詳細に検討するように、第2の識別子は、例えば、細胞源識別可能な核酸を調製するために使用されるプロトコルに応じて、連続したヌクレオチドの単一のドメインから構成され得るか、又は2つ以上の、例えば、第1及び第2の異なるサブ識別子ドメインから構成され得る。各サブ部分において、細胞源識別可能な核酸上に存在する第2の識別子は、同一である。更に、第2のセットの異なるサブ部分の第2の識別子は、異なる。したがって、第2のセットの各サブ部分の第2の識別子は、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる。したがって、第2のセットの異なるサブ部分の細胞源識別可能な核酸は、それらの第2の識別子によって互いに区別することができる。いくつかの実施形態では、サブ部分の第2のセットにおける核酸と会合した第2の識別子とサブ部分の第1のセットにおける核酸と会合した第1の識別子との組み合わせは、第1及び第2の識別子の一意の組み合わせを、それらの核酸の細胞源を識別する所与の細胞源から生成される各核酸コレクションに付与する。他の実施形態では、第1の識別子、第2の識別子、及び追加ラウンドのインデックス付けにおいて付加される任意の第3又は追加の識別子の組み合わせは、初期の複数の細胞源からの特定の細胞源に由来する核酸に一意の識別を付与する。
【0062】
適切な数の初期の細胞源、並びに異なる第1の識別子及び第2の識別子(及び対応する第1のサブ部分及び第2のサブ部分)、又は任意選択的に、後続ラウンドのインデックス付けからの第3若しくは更なる識別子を選択することによって、同一の第1及び第2の識別子を有する2つの異なる細胞源に由来する核酸の確率が、無視できる、すなわち、ゼロに近い確率、又は5%未満の確率、又は2%未満の確率、1%未満の確率、0.1%未満の確率、又は0.01%未満の確率であるいくつかの組み合わせを容易に提供することができる。
【0063】
上記のように、第2のセットのサブ部分における第1の識別子タグ付き核酸に組み込まれる第2の識別子は、例えば、細胞源識別可能な核酸を調製するために使用されるプロトコルに応じて、連続したヌクレオチドの単一のドメインから構成され得るか、又は2つ以上の、例えば、第1及び第2の異なるサブ識別子ドメインから構成され得る。したがって、いくつかの事例では、第2の識別子は、連続したヌクレオチドの単一ドメインからなり得、そのようなドメインの長さは、いくつかの事例において4~20、例えば8~12の範囲で様々であり得る。この実施形態の第2の識別子は、例えば、増幅反応(1つ以上の増幅ラウンド、例えば、1つ以上のPCRラウンドを含み得る)におけるプライマーによって、ライゲーションアダプタの一部として、タグメンテーションを介してなどにより、いくつかの異なる方法で導入され得る。更に他の事例では、第2の識別子は、2つ以上の、例えば、第1及び第2の異なるサブ識別子ドメインで構成される。これらのサブ識別子ドメインの長さは、4~20、例えば8~12の範囲で様々であり得る。本実施形態の第2の識別子は、いくつかの異なる方法で、例えば、増幅反応(1つ以上の増幅ラウンド、例えば、1つ以上のPCRラウンドを含み得る)におけるプライマーによって、ライゲーションアダプタの一部として、タグメンテーションを介してなどにより導入され得る。2つ以上の、例えば、第1及び第2のサブ識別子が第2の識別子を構成するために用いられるこれらの実施形態では、サブ識別子の同じ組み合わせが所与のサブ集団に対して使用され、サブ識別子の異なる組み合わせが異なるサブ集団に対して使用される。しかしながら、所与の第1のサブ識別子は、1つのサブ集団のみに対して使用される必要はない。代わりに、所与のサブ集団の第1及び第2のサブ識別子の組み合わせが第2のセットの他のサブ集団を区別するように、同じ第1のサブ識別子は、それが各サブ集団内の異なる第2のサブ識別子と対合される限り、異なるサブ集団で使用され得る。このようにして、細胞源識別可能な核酸を産生するために用いられる総サブ識別子コレクションは、第2のセットにおけるサブ集団の総数よりも少なくてもよく、いくつかの事例では、サブ識別子の総数は、第2のセットにおけるサブ集団の総数の1~30%、例えば、1~25%、又は3~10%である。
【0064】
所望の場合、細胞源識別可能な核酸の産生の前に、核酸は、例えば、細胞源を溶解することによって、第2のセットのサブ集団内の細胞源から放出され得る。溶解は、例えば、細胞源の加熱又は凍結融解、又は洗剤若しくは他の化学方法の使用、又はこれらの組み合わせによって達成することができる。しかしながら、任意の好適な溶解方法を使用することができる。いくつかの事例では、軽度の溶解手順を有利に使用して、核クロマチンの放出を防止し、それによってcDNAライブラリのゲノム汚染を回避し、mRNAの分解を最小限に抑えることができる。例えば、Tween-20の存在下で細胞を72℃で2分間加熱することは、核クロマチンから検出可能なゲノム汚染をもたらさない一方で、細胞を溶解するのに十分である。あるいは、細胞を水中で10分間65℃に加熱することができる(Esumi et al.,Neurosci Res 60(4):439-51(2008))か、又は0.5% NP-40を補充したPCR緩衝液II(Applied Biosystems)中で90秒間70℃に加熱することができる(Kurimoto et al.,Nucleic Acids Res 34(5):e42(2006))か、又は溶解は、プロテイナーゼKなどのプロテアーゼで、又はグアニジンイソチオシアネートなどのカオトロピック塩の使用によって達成することができる(米国公報第2007/0281313号)。
【0065】
上記のように、細胞源識別可能な核酸は、第2の識別子(第2の識別子が第1及び第2のサブ識別子を含む場合を含む)をサブ部分の第1の識別子タグ付き核酸と会合させて、第1及び第2の識別子の両方を含む細胞源識別可能な核酸を産生する任意の好都合なプロトコルを使用して、第2のセットのサブ部分において産生され得る。そのようなプロトコルの例としては、増幅プロトコル、ライゲーションプロトコル、タグメンテーションプロトコル、第2の鎖合成反応などが挙げられるが、これらに限定されない。そのようなプロトコルにおける反応混合物成分を、反応の所望の細胞源識別可能な核酸生成物を生成するのに十分な条件下で組み合わせる。例えば、いくつかの事例では、増幅反応の反応成分を、1つ以上の増幅ラウンド、例えば、1つ以上のPCRラウンドを介して、細胞源識別可能な核酸生成物を生成するのに十分な条件下で組み合わせる。いくつかの事例では、ライゲーション反応の反応成分を、ライゲーションされた細胞源識別可能な生成物核酸を産生するのに十分な条件下で組み合わせる。更に他の事例では、タグメンテーション反応の反応成分を、細胞源識別可能なタグメンテーション核酸を産生するのに十分な条件下で組み合わせ、この核酸は、後続の反応ステップで使用されてもされなくてもよく、又は後続の反応ステップに供されてもされなくてもよい。
【0066】
調製された反応混合物は、所望の細胞源識別可能な生成物核酸を産生するのに十分な条件を生成するのに必要な成分を提供する。「所望の細胞源識別可能な核酸を産生するのに十分な条件」とは、反応中の関連する核酸及び/又は他の反応成分が所望の方法で互いに相互作用することを可能にする反応条件を意味する。例えば、いくつかの事例では、条件は、反応混合物の核酸がハイブリダイズするのに十分であり得る。いくつかの事例では、条件は、反応混合物の酵素が、例えば、重合、加水分解、ライゲーション、タグメンテーションなどの化学プロセスを触媒するのに十分であり得る。好適な反応条件を達成することは、反応混合物成分、その濃度、及び反応温度を選択して、例えば、関連する核酸が配列特異的な方法で互いにハイブリダイズすること、関連するポリメラーゼが核酸の伸長をもたらすことなどを含む、関連するプロセスが進行する環境を作成することを含み得る。反応の特定の核酸(例えば、鋳型核酸、オリゴヌクレオチド、プライマーなど)に加えて、反応混合物は、適切なpH、塩濃度(例えば、KCl濃度)などを確立する緩衝液成分を含み得る。二本鎖核酸複合体を生成するのに十分な条件には、ハイブリダイゼーションに適切な条件(「ハイブリダイゼーション条件」とも呼ばれる)が含まれ得る。
【0067】
好適な反応条件を達成することは、反応混合物成分、その濃度、及び反応温度を選択して、1つ以上のポリメラーゼが活性である環境及び/又は反応中の関連する核酸が所望の方法で互いに相互作用する(例えば、ハイブリダイズする)環境を作成することを含み得る。好適な反応条件では、反応成分に加えて、反応混合物は、伸長反応、例えば、第2鎖合成反応、及び/又は鋳型スイッチングが生じるのに適切なpH、塩濃度(例えば、KCl濃度)、金属補因子濃度(例えば、Mg2+又はMn2+濃度)などを確立する緩衝液成分を含み得る。他の成分は、1つ以上のヌクレアーゼ阻害剤(例えば、RNase阻害剤及び/若しくはDNase阻害剤)、GCリッチ配列の増幅/複製を促進するための1つ以上の添加剤(例えば、GC-Melt(商標)試薬(Takara Bio USA,Inc.(San Jose,CA))、ベタイン、DMSO、エチレングリコール、1,2-プロパンジオール、若しくはそれらの組み合わせ)、1つ以上の分子群集剤(例えば、ポリエチレングリコールなど)、1つ以上の酵素安定化成分(例えば、1~10mM(例えば、5mM)の範囲の最終濃度で存在するDTT)、並びに/又はポリメラーゼ媒介伸長反応及び/若しくは鋳型スイッチングを促進するのに有用な任意の他の反応混合物成分などが含まれ得る。
【0068】
1つ以上の反応混合物は、増幅(例えば、PCR増幅)、ライゲーション、第2の鎖合成、又はタグメンテーションに好適なpHを有してもよい。特定の実施形態では、反応混合物のpHは、5~9、例えば7~9、8~9、例えば8~8.5の範囲である。いくつかの事例では、反応混合物は、pH調整剤を含む。目的のpH調整剤としては、限定されないが、水酸化ナトリウム、塩酸、リン酸緩衝液、クエン酸緩衝液などが挙げられる。例えば、反応混合物のpHは、適切な量のpH調整剤を添加することによって所望の範囲に調整することができる。
【0069】
プライマー伸長反応に好適な温度範囲は、用いられる特定のポリメラーゼ、用いられる任意のプライマーの融解温度(Tm)などの要因に従って様々であり得る。いくつかの事例では、逆転写酵素(例えば、MMLV逆転写酵素)を用いてもよく、ハイブリダイズしたプライマーの逆転写酵素媒介伸長に十分な反応混合物条件は、反応混合物を、4℃~72℃、例えば、16℃~70℃、例えば、37℃~50℃、例えば、40℃~45℃(42℃を含む)の範囲の温度にすることを含む。
【0070】
上記に要約したように、第2の識別子配列は、様々な手段によって、例えば、増幅媒介反応、ライゲーション媒介反応、タグメンテーション媒介反応、第2の鎖合成反応、等温増幅反応、鋳型スイッチング反応などを介して、第1の識別子タグ付き核酸と会合し得る。例えば、プライマー又はオリゴヌクレオチド上に存在する第2の識別子配列は、増幅反応中に第1の識別子タグ付き核酸に組み込まれ得る。いくつかの事例では、第2の識別子配列は、第1の識別子タグ付き核酸に直接結合してもよい。非鋳型化配列を核酸に直接結合させる方法は様々であり、例えば、ライゲーション、化学合成/連結、酵素ヌクレオチド付加(例えば、末端トランスフェラーゼ活性を有するポリメラーゼによる)などを含み得るが、これらに限定されない。更に他の事例では、第2の識別子配列は、タグメンテーションを使用して第1の識別子タグ付き核酸に会合され得る。
【0071】
増幅が用いられる場合、第2の識別子と、第2のセットのサブ部分における第1の識別子タグ付き核酸との会合は、1つ以上の増幅ラウンド、例えば、PCRラウンドを利用してもよく、プライマー、例えば、フォワード及びリバース増幅プライマーは、好適な増幅ポリメラーゼと組み合わせて使用されて、第1及び第2の識別子ドメインを含む細胞源識別可能な核酸を産生してもよく、第2の識別子ドメインは、単一の連続したドメイン又は2つ以上のサブドメインから構成されてもよい。そのような実施形態では、プライマーは、第1の識別子タグ付き核酸の相補的部位にハイブリダイズするように構成されたプライマー結合部位を含み得る。増幅実施形態で使用されるプライマーは、第1の識別子タグ付き核酸における対応するドメインにハイブリダイズする鋳型結合ドメインを有する。この鋳型結合ドメインは、上記のように、例えば、遺伝子特異的、任意、例えば、ランダム、準ランダムなどとして定義され得る。1つ以上の増幅ラウンドで使用される所与のプライマーは、第2の識別子成分、例えば、ドメイン全体又はそのサブ識別子を含み得る。例えば、第2の識別子が第1及び第2のサブ識別子から構成される場合、第1及び第2のプライマーの各々は、サブ識別子のうちの1つ、例えば、プライマーのプライマー結合部位の5’位を含み得る。加えて、増幅媒介反応に用いられるプライマーは、所望に応じて、1つ以上の追加のドメインを含み得る。そのような追加のドメインには、多くの場合、上記のようなアダプタドメイン(例えば、配列決定プラットフォームアダプタ構築物)が含まれるが、これらに限定されない。
【0072】
細胞源識別可能な核酸を産生するための増幅媒介反応はまた、例えば、プライミングされた第1の識別子タグ付き核酸等の増幅での使用に好適なポリメラーゼを用いてもよい。熱安定性ポリメラーゼを含むDNAポリメラーゼを含むがこれらに限定されない任意の好都合な増幅ポリメラーゼが使用され得る。有用な増幅ポリメラーゼとしては、例えば、Taq DNAポリメラーゼ、Pfu DNAポリメラーゼ、Terra(商標)DNAポリメラーゼ、米国特許第6,127,155号(その開示は参照によりその全体が本明細書に組み込まれる)に記載されるもの、及びそれらの誘導体などが挙げられる。いくつかの事例では、増幅ポリメラーゼは、例えば、ホットスタートTaq DNAポリメラーゼ、ホットスタートPfu DNAポリメラーゼなどを含むが、これらに限定されない、ホットスタートポリメラーゼであってもよい。増幅ポリメラーゼは、増幅ポリメラーゼの最終濃度が所望の量の生成物核酸を産生するのに十分であるように、反応混合物に組み合わされてもよい。特定の態様では、増幅ポリメラーゼ(例えば、熱安定性DNAポリメラーゼ、ホットスタートDNAポリメラーゼなど)は、反応混合物中に、例えば、0.5~100U/μL、例えば、1~50U/μL、例えば、5~25U/μL、例えば、20U/μLを含む、0.1~200ユニット/μL(U/μL)の最終濃度で存在する。主題の方法の核酸反応、例えば、増幅反応は、dNTPを反応混合物に組み合わせることを含み得る。特定の態様では、4つの天然に存在するdNTP(dATP、dGTP、dCTP及びdTTP)の各々を反応混合物に添加する。例えば、dATP、dGTP、dCTP、及びdTTPは、各dNTPの最終濃度が、0.01~100mM、例えば、0.1~10mM(0.5~5mM(例えば、1mM)を含む)であるように、反応混合物に添加され得る。いくつかの事例では、反応混合物に添加される1つ以上のタイプのヌクレオチドは、天然に存在しないヌクレオチド、例えば、結合若しくはそれに結合された他の部分(例えば、蛍光部分、ビオチン部分)を有する修飾ヌクレオチド、ヌクレオチド類似体、又は主題の方法若しくは目的の下流用途において使用されることが見出される任意の他のタイプの天然に存在しないヌクレオチドであってもよい。
【0073】
反応混合物は、限定されないが、例えば、核酸の変性/融解、核酸のハイブリダイゼーション/アニーリング、ポリメラーゼ媒介の伸び/伸長などを含む反応の様々な態様を駆動するために様々な温度にさらされてもよい。様々なプロセスが実行される温度は、例えば、融解温度、アニーリング温度、伸び温度などを含む発生するプロセスに従って参照され得る。そのようなプロセスに最適な温度は、例えば、使用されるポリメラーゼに応じて、核酸の特徴などに応じて変化する。逆転写酵素及び増幅ポリメラーゼを含む特定のポリメラーゼに最適な温度は、参照テキストから容易に得られ得る。核酸に関連する最適温度、例えば、アニーリング及び融解温度は、例えば、全長、ハイブリダイゼーション長、G/C含有率(content)、二次構造予測などを含む主題の核酸の既知の特性に基づいて容易に計算され得る。
【0074】
上述のように、第2の識別子を第1の識別子タグ付き核酸と会合させて細胞源識別可能な核酸を産生するための増幅媒介反応は、1つ以上の増幅ラウンド、例えば、PCR適用ラウンドを含み得る。例えば、各第1のラウンドプライマーは、第2の識別子の異なるサブドメインを含み得、そのようなプライマーを用いた第1の識別子タグ付き核酸の増幅により、第1の識別子だけでなく、第2の識別子を集合的に構成する第1及び第2のサブドメインを含むアンプリコンが産生される。あるいは、第1の増幅ラウンドは、例えば、遺伝子特異的鋳型結合ドメインを含むプライマーを用いて増幅が実行される、第1の識別子タグ付き核酸の所望の画分を増幅するプライマーとともに採用され得る。この第1のラウンドの後、第1及び第2のサブドメインを導入するプライマーの第2のラウンドを実行して、細胞源識別可能な核酸を産生してもよい。所与のワークフローで使用される周囲の増幅の数は、所望に応じて様々であり得る。
【0075】
特定の態様では、第2の識別子配列は、ライゲーションプロトコルを使用して、第1の識別子タグ付き核酸と会合される。これらの事例において、第2の識別子配列は、第1の識別子タグ付き核酸の末端にライゲーションされる核酸上に存在し得る。任意の好都合なリガーゼ、例えば、T4リガーゼを用いてもよい。いくつかの事例では、第2の識別子は、第1の識別子タグ付き核酸にライゲーションされるステム-ループアダプタ構築物に組み込まれてもよい。そのようなアダプタに関する更なる詳細は、米国特許第7,803,550号、同第8,071,312号、同第8,399,199号、同第8,728,737号、同第9,598,727号、同第10,196,686号、同第10,208,337号、及び同第11,072,823号(これらの開示は参照により本明細書に組み込まれる)に提供されている。
【0076】
更に他の実施形態では、本方法は、タグメンテーション反応を利用し、例えば、タグメンテーション反応成分の使用を含み得、第2の識別子配列を第1の識別子タグ付き核酸と会合させることができる。使用される反応成分及びタグメンテーションのプロセスは、必要に応じて様々であり得る。タグメンテーションに用いられるトランスポゾームは、トランスポザーゼ及びトランスポゾン末端ドメイン及び第2の識別子配列、例えば、第2のサブ識別子ドメインを含むトランスポゾン核酸を含み得る。これらのドメインは、機能的に定義されるため、研究者によって要求されるように、同じ配列内の1つであっても、異なる配列であってもよい。ドメインはまた、第2の識別子配列ドメインの一部がトランスポゾン末端ドメインに存在し得るように、重複し得る。タグメンテーションプロセス、トランスポジションベースの配列操作、及びタグメンテーション又はトランスポジションベースの反応に用いられ得る成分は、例えば、米国特許第10,017,759号、同第9,790,476号、同第9,683,230号、同第9,388,465号、同第9,238,671号、同第9,193,999号、同第8,383,345号、同第6,294,385号、同第6,159,736号、同第5,869,296号、及び同第5,677,170号(これらの開示は参照によりその全体が本明細書に組み込まれる)に記載されている。様々なタグメンテーションプロセス、及び/又はその1つ以上の成分は、本明細書に記載の方法での使用に適合され得る。いくつかの事例では、得られるタグメンテーションされた試料は、例えば、タグメンテーション反応中に付加される1つ以上のタグメンテーション後プライマー結合部位にハイブリダイズする1つ以上のタグメンテーション後PCRプライマーを使用して、PCR増幅条件に供され得る。タグメンテーション後プライマーは、例えば、配列決定プラットフォームアダプタ構築物ドメインなどの非鋳型化配列を含み得る。非鋳型化配列は、本明細書の他の箇所に記載される核酸ドメイン(例えば、表面結合配列決定プラットフォームオリゴヌクレオチドに特異的に結合するドメイン、配列決定プライマー結合ドメイン、バーコードドメイン、バーコード配列決定プライマー結合ドメイン、分子識別ドメイン、又はそれらの任意の組み合わせ)のうちのいずれかを含み得る。そのような実施形態は、例えば、タグメンテーションされた試料の核酸が、目的の配列決定プラットフォームでの配列決定に有用又は必要な全てのアダプタドメインを含まず、残りのアダプタドメインが、タグメンテーションされた試料の核酸の増幅に使用されるプライマーによって提供される、使用を見出す。
【0077】
細胞源識別可能な核酸を産生するために使用される任意のプロトコルでは、そのようなプロトコルで用いられる試薬は、細胞源識別可能な核酸生成物に追加の特徴を導入するために使用され得、そのような追加の特徴は、細胞源識別可能な核酸の下流処理で使用される特徴であり得る。例えば、細胞源識別可能な核酸の生成が配列決定ライブラリ生成プロトコルの一部である場合、例えば、上記のように、例えば、上記のような配列決定プラットフォームアダプタ構築物ドメイン、例えば、配列決定アダプタプラットフォーム構築物などを追加するために、後続の増幅ラウンドで用いられ得るプライマー結合ドメインなど、細胞源識別可能な核酸に組み込まれる追加の特徴を含み得る。
【0078】
代表的な実施形態
以下のセクションは、本発明の代表的な実施形態を提供し、この実施形態では、合成NGSプロトコルによる配列決定で使用する準備ができた細胞源識別可能な核酸が調製される。この実施形態は、初期の複数の細胞核から細胞源識別可能な核酸を産生するためのワークフローを図示する
図1A~1Dに概略的に示されるが、細胞核の代わりに全細胞を使用することもできる。
【0079】
このプロトコルの間、細胞源材料の完全性は無傷のままであることに留意することが重要である。例えば、細胞がプロトコルで使用される場合、細胞は無傷のままである。細胞核がプロトコルで使用される場合、核は無傷のままである。
【0080】
図1Aに図示されるように、複数の細胞核を96ウェルプレートのウェルに分配する。いくつかの実施形態では、96ウェルプレート上の各ウェルは細胞核を受容するが、プロトコルの要件ではない。更に、プロトコルは、96ウェルプレートの使用に限定されず、当業者は、任意の好適な容器、チューブ、又は容器が本発明と同等の使用を見出すことを認識しており、更に例えば、24ウェル若しくは384ウェルを有するマルチウェルプレート、又は任意の他のマルチウェル形式プレートは全て、本発明とともに使用される。
【0081】
図1Aに示すように、複数の核を96ウェルプレートの各ウェルに分配する。例えば、一般に100~1,000個程度の核、例えば、100個の核、200個の核、又は300個の核の複数個が、各ウェルに分配される。
【0082】
核は、ウェルへの分配の前又は後のいずれかで透過処理され、組み合わせインデックス付け試薬、例えば、鋳型スイッチング試薬は、核に入り、分析される核酸にアクセスすることができる。
【0083】
細胞核を96ウェルプレートのウェルに分配した後、一意の第1の識別子を含むウェル特異的鋳型スイッチオリゴヌクレオチドを各ウェルに分配する。各ウェルは、その一意の第1の識別子の配列によって、任意の他のウェルに分配された鋳型スイッチオリゴヌクレオチドとは異なる、一意のウェル特異的鋳型スイッチオリゴヌクレオチド(TSO)を受容する。したがって、各ウェルは、ウェルに送達されるウェル特異的鋳型スイッチオリゴヌクレオチドによって提供される異なる第1の識別子を受容する。鋳型スイッチングオリゴヌクレオチドに加えて、逆転写酵素及びオリゴdTプライマーを含む鋳型スイッチング試薬もウェルに送達され、逆転写反応は、第1の鎖cDNAがポリAプライミングによって産生されるように生じさせ、第1の鎖は、その3’末端に鋳型スイッチオリゴヌクレオチドの第1の識別子配列を含む。その結果、マルチウェルプレートの各ウェル内の核の各々は、それらの細胞核に存在したmRNAに対応する(すなわち、由来する)cDNA分子を含有する。
図1Aの下部パネルに図示されるように、得られるcDNA分子は各々、第1の識別子でタグ付けされる。すなわち、各cDNAは、第1の識別子タグ付き核酸であり、単一のウェルにおける全ての核内のcDNAの第1の識別子は、同一である。しかしながら、異なるウェルにおける核内のcDNAの第1の識別子は、異なる。
【0084】
このプロトコルの続きを
図1Bに示す。
図1B、左上パネルに示されるように、逆転写により、ウェル特異的な第1の識別子を有するcDNAを含む96ウェルプレートが生成される。すなわち、このcDNAは、第1の識別子タグ付き核酸である。単一のウェル内の各核内の第1の識別子は同一であるが、第1の識別子は、異なるハッチパターンによって表されるように、96ウェルプレートの異なるウェルの間で異なる。各ウェルの核を収集し、次いで単一のチューブにプールし、洗浄して、溶解した核並びに過剰なプライマー及びRT試薬を除去する(
図1B、右上パネル)。次いで、得られたプールされた核を、各ウェルに100個の核を有する別の96ウェルプレートのウェルに再配分する。次いで、各ウェル内の核を溶解して、核内に存在する第1の識別子タグ付きcDNAを放出する。
図1B、下部パネルに示すように、各ウェルは、異なる溶解核から放出されたcDNAのコレクションを含み、異なるウェルからのコレクションの第1の識別子は、互いに異なる。
【0085】
このプロトコルが、
図1Cに更に図示されている。
図1Cでは、96ウェルプレートの各ウェルは、示されるように、複数の異なる元の核からの第1の識別子タグ付き核酸のプール又は混合物を含み、複数の異なる第1の識別子が各ウェル内に存在する。次いで、第2の識別子を集合的に構成する第1及び第2のサブ識別子のウェルに一意の組み合わせを、ウェルの各々における第1の識別子タグ付き核酸と会合させる。第1及び第2のサブ識別子の一意の組み合わせは、集合的に各ウェルに一意の第2の識別子を提供する。
図1Cに示されるように、TSOによって導入された第1の遺伝子特異的プライマー及びアダプタドメイン、例えば、リードプライマー2ドメインに相補的なプライマーを用いる第1のPCRラウンドを使用して、第1の識別子タグ付き核酸のサブセットを増幅する。次いで、第2の増幅ラウンドを、第2の識別子を集合的に構成する異なるサブドメインを導入するプライマーとともに用いる。一意の第2の識別子は、第1及び第2のサブ識別子の一意の組み合わせを各ウェルに提供することによって提供され、一意の組み合わせは、ウェルの数よりも数が少ない、より限定されたサブ識別子ドメインのセットから提供される。図示のアプローチでは、異なる第1のサブ識別子がプレート上のウェルの各列に提供され、異なる第2のサブ識別子がプレート上のウェルの各行に提供され、プレートの各ウェルが第1及び第2のサブ識別子のそれ自体の一意の組み合わせを有することになる。各ウェル内で、第1及び第2のサブ識別子を、増幅媒介反応を使用して、ウェル内の第1の識別子タグ付き核酸と会合させる。図示の増幅媒介反応では、上記のように、目的の遺伝子、例えば、TCR又はBCR遺伝子を、3’末端上で(アダプタなしで)かつTSOからのRP2などのアダプタを用いて増幅する第1のPCRラウンドが実行され、このPCRラウンドは、全てのウェルに対して同じプライマーを用いる。この第1のPCRラウンドに続いて、半ネスト化されたPCRは、クラスター生成配列P7を5’末端に付加し(RP2アダプタ配列にアニールし)、リードプライマー1及びクラスター生成配列P5を3’末端(ネスト化された遺伝子特異的プライマー)に付加する。このPCRはまた、各ウェルに異なるi5及びi7インデックス(第1及び第2のサブ識別子)を付加する。この場合、所与の列内の全てのウェル(円及びダイヤモンドとして示される)に同じi7インデックスが付加され、所与の行内の全てのウェル(星及び六角形として示される)に同じi5インデックスが付加される組み合わせパターンを使用する。異なるi7インデックスは、異なる列のウェルに与えられ、異なるi5インデックスは、異なる行のウェルに与えられる。このようにして、異なるi5及びi7インデックスの一意の組み合わせが各ウェルに付加され、これらのインデックスは第1及び第2の識別子として機能する。i5及びi7インデックスの組み合わせは、一意の第2の識別子を、各ウェルの第1の識別子タグ付き核酸と集合的に会合させる。
図1Cの右下パネルは、左上のプレートに示されている左上のウェル内で発生すると予測される反応を示している。
【0086】
図1Dは、
図1A~
図1Cに示されるプロトコルによって産生される細胞源識別可能な核酸を図示する。
図1Dに示されるように、細胞源識別可能な核酸は、例えば、
図1Cに示される96ウェルプレートの左上のウェルから得られ、左から右に、P5ドメイン、左上ウェルに特異的なi5ドメイン、リードプライマー1ドメイン、第1のPCRラウンドで増幅された遺伝子特異的プライマー、例えば、TCR又はBCR遺伝子によって増幅された遺伝子の5’末端、鋳型スイッチオリゴヌクレオチドによって提供される第1の識別子(すなわち、バーコード)、リードプライマー2ドメイン、左上ウェルに特異的なi7ドメイン、及びP7ドメインを含む。同じi5インデックス、TSO第1の識別子及びi7インデックスの組み合わせを共有する全ての核酸は、同じ元の核から得られたものと決定することができる。
図1Dに図示される細胞源識別可能な核酸は、次世代配列決定(NGS)のための準備ができており、配列の取得後、例えば、コレクションの核酸の、第1の識別子、i5及びi7インデックスによって示されるように、少なくとも第1及び第2の識別子に基づいて、同じ第1の識別子及びi5、i7インデックスを共有するコレクションの細胞源識別可能な核酸に、細胞源、すなわち、起源となる核を割り当てることができる。
【0087】
反復
所望される場合、所与のワークフローは、少なくとも1つの更なる識別子を組み込む核酸を産生するための少なくとも1つの追加のプール/分割ステップを更に含み得る。例えば、第1の識別子タグ付き核酸の産生の後であるが、細胞源の溶解の前に、そこに存在する識別子タグ付き核酸を含む細胞源を、例えば、上記のように、プールし、サブ部分のセットに配分してもよい。識別子を、任意の適切な方法によって、各サブ部分の細胞源に存在する識別子タグ付き核酸と会合させ、それによって、別の識別子を識別子タグ付き核酸と会合させてもよい。最終の細胞源識別可能な核酸に所望の数の異なる識別子を提供するために、任意の数の追加のプール/分割ステップを用いてもよい。そのような実施形態の所与のワークフローにおける任意の溶解を、サブ部分の最終セットにおける細胞源に対して行う。この最後のステップにより、各インデックス付けラウンドにおいて付加された識別子のそれらの一意の組み合わせによって識別され得る細胞源識別可能な核酸の生成が完了する。
【0088】
更なる処理
第2のセットの異なるサブ部分における細胞源識別可能な核酸の産生に続いて、異なるサブ部分をプールして、例えば、更なる処理のために、第2のセットの2つ以上の(各々を含む)サブ部分からの異なる細胞源識別可能な核酸を単一の組成物に組み合わせてもよい。そのような実施形態において組み合わされる、又はプールされる異なるサブ部分の数は、いくつかの事例では、2~25,000又はそれ以上、例えば、96~10,000(384~5,184を含む)の範囲で様々であり得る。
【0089】
例えば、説明されるように、調製された細胞源識別可能な核酸を、所望に応じて、例えば、特定のワークフローに応じて更に処理してもよい。例えば、細胞源識別可能な核酸は、配列決定用途、例えば、次世代配列決定用途のために調製してもよい。そのような事例において、組成物を構成する細胞源識別可能な核酸コレクションは、全てのドメイン、例えば、上記のようなアダプタが、すでに核酸に組み込まれているという点で、配列決定準備ができていてもよい。例えば、所与の配列決定用途で使用するために必要であり得る配列決定プラットフォームアダプタ構築物は、細胞源識別可能な核酸の調製中に、例えば、鋳型スイッチオリゴヌクレオチド、増幅プライマー、トランスポゾン核酸などの細胞源識別可能な核酸の調製に用いられる成分上にそのようなものを含めることによって、細胞源識別可能な核酸に組み込まれ得る。
【0090】
更に他の事例では、細胞源識別可能な核酸を、配列決定準備済ライブラリを生成するために更に処理してもよく、そのような事例では、任意の好都合なアプローチを用いてもよい。そのような実施形態では、そのような構築物のうちの1つ以上を、その調製後に、細胞源識別可能な核酸に組み込んでもよい。所望される場合、そのようなアダプタ構築物を、様々な手段によって、目的の核酸、例えば、細胞源識別可能な核酸に添加してもよい。例えば、アダプタ配列は、末端トランスフェラーゼ活性を有するポリメラーゼの作用を通じて添加され得る。アダプタ配列は、増幅反応中に核酸に組み込んでもよい。場合によっては、アダプタ配列は、核酸、例えば、細胞源識別可能な核酸に直接結合され得る。アダプタ配列を核酸に直接結合させる方法は様々であり、例えば、ライゲーション、化学合成/連結、酵素ヌクレオチド付加(例えば、末端トランスフェラーゼ活性を有するポリメラーゼによる)、タグメンテーションなどを含み得るが、これらに限定されない。
【0091】
いくつかの事例では、この方法は、配列決定プラットフォームアダプタ構築物、及び/又は任意の使用のための任意の配列を含むアダプタを、核酸の末端に結合させることを含み得る。例えば、いくつかの事例では、主題の方法で利用されるオリゴヌクレオチド及び/又はプライマーは、配列決定プラットフォームアダプタ構築物を含んでいなくてもよく、したがって、所望の配列決定プラットフォームアダプタ構築物は、目的の細胞源識別可能な核酸の産生後に結合されてもよい。目的の核酸又はその誘導体の末端に結合されたアダプタ構築物は、本明細書に記載される方法のオリゴヌクレオチド及び/又はプライマーの任意選択的な配列決定プラットフォームアダプタ構築物に関して上に記載される要素のうちのいずれかを含む、下流配列決定用途に有用な任意の配列要素を含み得る。例えば、目的の核酸又はその誘導体の末端に結合したアダプタ構築物は、表面結合配列決定プラットフォームオリゴヌクレオチドに特異的に結合するドメイン、配列決定プライマー結合ドメイン、バーコードドメイン、バーコード配列決定プライマー結合ドメイン、分子識別ドメイン、及びそれらの組み合わせからなる群から選択される核酸ドメイン又はその相補体を含み得る。
【0092】
配列決定プラットフォームアダプタ構築物の結合は、任意の好適なアプローチを使用して達成され得る。特定の態様では、アダプタ構築物は、「シームレスな」クローニング戦略と同一又は類似のアプローチを使用して、生成物核酸又はその誘導体の末端に結合される。シームレスな戦略は、1ラウンド以上の制限酵素分析及び消化、DNA末端修復、脱リン酸化、ライゲーション、酵素不活性化及びクリーンアップ、並びに対応する核酸材料の損失を排除する。目的のシームレスな結合戦略には、Takara Bio USA,Inc.(San Jose,CA)から入手可能なIn-Fusion(登録商標)クローニングシステム、Li&Elledge(2007)Nature Methods 4:251-256に記載されているSLIC(配列及びリガーゼ非依存性クローニング)、Gibson et al.(2009)Nature Methods 6:343-345に記載されているGibsonアセンブリ、Quan&Tian(2009)PLoS ONE 4(7):e6441に記載されているCPEC(環状ポリメラーゼ伸長クローニング)、Zhang et al.(2012)Nucleic Acids Research 40(8):e55に記載されているSLiCE(シームレスライゲーションクローニング抽出物)、及びLife Technologies(Carlsbad,CA)によるGeneArt(登録商標)シームレスクローニング技術が含まれる。
【0093】
任意の好適なアプローチは、目的の配列決定プラットフォームのための有用な又は必要な配列決定ドメインの全て未満を有する目的の核酸又はその誘導体に追加の核酸配列決定ドメインを提供するために用いられ得る。例えば、目的の核酸又はその誘導体は、それらの5’末端(例えば、目的の核酸又はその誘導体に相補的なプライマーの領域の5’)にアダプタ配列を有するPCRプライマーを使用して増幅され得、その結果、アンプリコンは、任意の所望の構成で、元の核酸中のアダプタ配列だけでなく、プライマー中のアダプタ配列も含む。シームレスなクローニング戦略、制限消化/ライゲーション、タグメンテーションなどに基づくものを含む、他のアプローチが使用され得る。次世代配列決定ライブラリに核酸ドメインを加えるための方法は、当該技術分野で既知であり、例えば、限定されないが、米国特許第11,124,828号(その全体が参照により本明細書に組み込まれる)に記載されている。
【0094】
例えば、上記のように、処方されたライブラリ調製及び/又は増幅ステップの後に、調製されたライブラリは、配列決定の準備ができているとみなされ得る。特定の実施形態では、提供される方法は、調製されたライブラリをNGSプロトコルに供することを更に含み得る。プロトコルは、任意の好適なNGS配列決定プラットフォーム上で実施してもよい。目的のNGS配列決定プラットフォームとしては、Illumina(登録商標)(例えば、HiSeq(商標)、MiSeq(商標)及び/若しくはNextSeq(商標)配列決定システム)、Ion Torrent(登録商標)(例えば、Ion PGM(商標)及び/若しくはIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、PACBIO RS II配列決定システム)、Oxford Nanopore Technologies(ONT)、Life Technologies(商標)(例えば、SOLiD配列決定システム)、Roche(例えば、454 GS FLX+及び/若しくはGS Junior配列決定システム)、又は目的の任意の他の配列決定プラットフォームが挙げられるが、これらに限定されない。NGSプロトコルは、用いられる特定のNGS配列決定システムに応じて様々であろう。例えば、更なる増幅(例えば、固相増幅)、アンプリコンの配列決定、及び配列決定データの分析を含み得る、NGSライブラリを配列決定するための詳細なプロトコルは、用いられるNGS配列決定システムの製造元から入手可能である。
【0095】
他の変形例としては、例えば、Ion Torrent(商標)(例えば、Ion PGM(商標)及びIon Proton(商標)配列決定システム)、Pacific Biosciences(例えば、PACBIO RS II配列決定システム)、Life Technologies(商標)(例えば、SOLiD配列決定システム)、Roche(例えば、454GS FLX+及びGS Junior配列決定システム)、又は目的の任意の他の配列決定プラットフォームからの配列決定システムによって必要とされる配列決定ドメインでIllumina(登録商標)特異的配列決定ドメインを置き換えることが挙げられる。
【0096】
細胞源
上述のように、本発明の実施形態に従って、細胞源識別可能な核酸が産生される初期の細胞源は、様々であり得る。細胞源が得られ得る細胞試料は、限定されないが、例えば、細胞組織、生検、血液試料、細胞培養物などを含む様々な源に由来し得る。更に、細胞試料は、特定の臓器、組織、胚、胚盤胞、腫瘍、新生物などに由来し得る。限定されないが、本発明の任意の実施形態で分析することができる細胞試料の数は、研究者の希望に基づいて変えることができる。複数の細胞試料を使用する場合、各々の独立した試料は、初期の細胞源の初期のサブ部分として扱われる。更に、任意の集団からの細胞は、細菌又は酵母を含む原核生物又は真核生物の集団などの、主題の方法で使用される細胞源の供給源であり得る。いくつかの事例では、主題の方法で利用される細胞源は、げっ歯類(例えば、マウス又はラット)細胞試料、非ヒト霊長類細胞試料、ヒト細胞試料などの哺乳動物細胞試料であり得る。いくつかの事例では、哺乳動物細胞試料は、例えば、げっ歯類(例えば、マウス又はラット)血液試料、非ヒト霊長類血液試料、ヒト血液試料などを含むが、これらに限定されない、哺乳動物血液試料であってもよい。
【0097】
いくつかの事例では、主題の方法で利用される細胞源は、リンパ球源、例えば、T細胞(例えば、細胞傷害性T細胞(例えば、CD8+T細胞)、ヘルパーT細胞(例えば、CD4+T細胞)、制御性T細胞(「Treg」)など)、ナチュラルキラー(NK)細胞、B細胞などを含むがこれらに限定されない免疫細胞源であり得る。対象の免疫細胞はまた、例えば、末梢血単核細胞、マクロファージ、樹状細胞、単球などを含み得る。
【0098】
いくつかの事例では、主題の方法で利用される細胞源は、植物に由来してもよく、単子葉植物又は双子葉植物、例えば、以下を含むが、これらに限定されない:研究植物(例えば、Arabidopsis)、並びに果物(例えば、リンゴ、アプリコット、アボカド、バナナ、ブラックベリー、ブルーベリー、カンタロープ、ココナッツ、クランベリー、ナツメヤシ、イチジク、メロン、グレープフルーツ、ブドウ、グアバ、ハニーデュー(honeydew)、キウイフルーツ、レモン、ライム、マンゴー、ネクタリン、オリーブ、オレンジ、パパイヤ、パッションフルーツ、モモ、セイヨウナシ、パイナップル、オオバコ、プラム、ザクロ、プルーン、ラズベリー、イチゴ、タンジェリン、スイカ、など)、穀物(例えば、大麦、豆、キャノーラ、トウモロコシ、綿、亜麻仁、干し草、オート麦、ピーナッツ、米、ソルガム、大豆、サトウダイコン、サトウキビ、ヒマワリ、タバコ、小麦、など)、野菜(例えば、アーティチョーク、アスパラガス、豆、ビート、パクチョイ、ブロッコリー、芽キャベツ、キャベツ、ニンジン、カリフラワー、セロリ、コラードグリーン(collard green)、スイートトウモロコシ(corn-sweet)、キュウリ、ナス、エンダイブ、グリーン、ケールグリーン、レタス、パセリ、パースニップ、エンドウ豆、ペッパー、カボチャ(pumpkin)、ラディッシュ、ルバーブ、ルタバガ、ほうれん草、カボチャ(squash)、サツマイモ、トマティーヨ、トマト、カブ、ヒシの実など)などの農業植物。
【0099】
本明細書に記載のそれに関連する方法で使用するための単一細胞の細胞源は、任意の好都合な方法によって得られ得る。例えば、いくつかの事例では、単一細胞は、細胞試料の希釈を制限することによって得られ得る。いくつかの事例では、本方法は、単一細胞を得るステップを含んでもよい。単一細胞懸濁液は、例えば、トリプシン又はパパインを酵素的に使用して組織試料中の細胞を接続するタンパク質を消化するか、又は培養物中の接着細胞を放出するか、又は試料中の細胞を機械的に分離することを含む、当該技術分野で既知の標準的な方法を使用して得ることができる。
【0100】
いくつかの事例では、単一細胞は、細胞選別機器具を使用して細胞試料を選別することによって得られ得る。本明細書で使用される場合、「細胞選別機」とは、本明細書に記載されるようなライブラリ調製のプロセスなど、下流プロセスに適切な容器への個々の細胞の選別を可能にする任意の器具を意味する。有用な細胞選別機には、蛍光活性化細胞選別(FACS)で利用される器具などのフローサイトメーターが含まれる。フローサイトメトリーは、異なる粒子(例えば、細胞)タイプ、すなわち、流体媒体中のラベル(波長、強度)、サイズなどの別の用語から変化する粒子を識別及び区別するためのマルチパラメータデータを使用する周知の方法論である。試料のフローサイトメトリー分析では、最初に、試料のアリコートをフローサイトメーターのフロー経路に導入する。フロー経路内で、試料中の細胞は、1つ以上の検知領域を実質的に一度に1つずつ通過し、細胞の各々は、単一の波長(又はいくつかの事例では、2つ以上の異なる光源)で光源に別々に個々に曝露され、必要に応じて、散乱及び/又は蛍光パラメータの測定値が、細胞ごとに別々に記録される。各細胞について記録されたデータは、リアルタイムで分析されるか、又は必要に応じて後の分析のために、コンピュータなどのデータ記憶及び分析手段に記憶される。フローサイトメーターを使用して選別された細胞は、共通の容器(すなわち、単一のチューブ)に選別され得るか、又は個々の容器に別々に選別され得る。例えば、いくつかの事例では、細胞は、以下に記載されるように、マルチウェルプレートの個々のウェルに選別され得る。
【0101】
用途
例えば、上述のように、本発明による細胞源核酸を調製する方法を用いて、様々な異なる目的のために配列準備済ライブラリを調製してもよい。特定の実施形態では、主題の方法を使用して、目的の配列決定プラットフォーム(例えば、Illumina(登録商標)、Ion Torrent(商標)、Pacific Biosciences、Life Technologies(商標)、Rocheなどによって提供される配列決定プラットフォーム)上での下流配列決定のためのmRNAに対応する発現ライブラリを生成してもよい。
【0102】
調製されたライブラリは、様々な下流分析に利用され得、いくつかの事例では、ライブラリの調製は、所望のタイプの下流分析のために特異的に再構成され得る。例えば、いくつかの事例では、調製されたライブラリを、mRNA、並びにノンコーディングRNA(例えば、長鎖ノンコーディングRNA(lncRNA)、非ポリアデニル化RNA、snRNA及びsnoRNA)などの非mRNA RNA種の分析を含む、全トランスクリプトーム分析(WTA)に供してもよい。したがって、いくつかの事例では、ライブラリ調製は、例えば、ポリ(A)テールへのハイブリダイゼーションに依存しないプライマー(例えば、ランダムプライマー)を利用することによって、又は例えば、生成物の二本鎖cDNAの産生前に天然にポリアデニル化されていないRNA種にポリ(A)テールを付加することによって、トランスクリプトーム内の非mRNA RNAの分析を可能にするように特異的に構成され得る。
【0103】
いくつかの事例では、ライブラリ、例えば、WTA用ライブラリの調製は、試料及び/又はライブラリ内のリボソームRNAの量を減少させるステップを含み得る。これは、本発明の任意のインデックス付けステップの前に、例えば、RiboGone(商標)製品(Takara Bio USA Inc.、San Jose,CA)を使用して、又はインデックス付き断片の生成後(例えば、米国特許第10,150,985号に記載されるようなZapR技術など)、例えば、配列決定前の全てのインデックス付けステップの終わりを含む任意のインデックス付けステップの後に行ってもよい。不要なリボソームRNAを低減及び/又は除去する任意の好都合な方法は、例えば、親和性精製、汚染核酸の分解(例えば、RiboGone(商標)製品(Takara Bio USA Inc.、San Jose,CA)、並びに米国特許第9,428,794号及び同第10,150,985号(その開示は参照によりそれらの全体が本明細書に組み込まれる)に記載されているそれらの方法を使用することを含む)、選択的除去のために用いられてもよい。
【0104】
特定の実施形態では、調製されたライブラリは、例えば、1つ以上の遺伝子の相対的発現(すなわち、上方又は下方調節)が決定される場合を含む、差次的発現分析で利用されてもよい。差次的発現は、定性的又は定量的に決定され得、そのような分析は、トランスクリプトームワイドであり得るか、又は標的化され得る。したがって、対象差次的発現分析において評価される発現転写産物の数は様々であろう。本明細書で使用される差次的発現分析は、対象ゲノムで分析される発現された転写産物の数に関して限定されない。いくつかの実施形態では、差次的発現分析により、分析のために特異的に標的化されるマーカー遺伝子のパネルなどの限られた数の転写産物を評価してもよい。あるいは、細胞の転写分全体を、差次的発現について評価してもよい。
【0105】
標的化発現分析が限定され得る転写産物カテゴリーには、様々であり、例えば、サイトカイン、ケモカイン、又は免疫細胞サブセットの細胞表面マーカー、キナーゼ、Gタンパク質共役受容体、創薬可能な遺伝子などの免疫遺伝子転写産物が含まれ得るが、これらに限定されない。免疫遺伝子の有用なカテゴリー及びサブカテゴリーには、概して、免疫系の機能及び病原体に対する防御の成功に関与する遺伝子群が含まれ、これらとしては、限定されないが、免疫系プロセスに関連する遺伝子(例えば、遺伝子オントロジー(GO)受託番号GO:0002376(geneontology(.)orgでオンラインで入手可能)によって識別される遺伝子)が含まれ、これらには、例えば、B細胞媒介免疫、B細胞選択、T細胞媒介免疫、T細胞選択、免疫応答の活性化、抗原プロセシング及び提示、粘膜関連リンパ組織における抗原サンプリング、好塩基球媒介免疫、好酸球媒介免疫、血球分化、血球増殖、免疫エフェクタープロセス、免疫応答、免疫系発達、免疫記憶プロセス、白血球活性化、白血球恒常性、白血球媒介免疫、白血球移動、リンパ球共刺激、リンパ球媒介免疫、肥満細胞媒介免疫、骨髄細胞恒常性、骨髄性白血球媒介免疫、ナチュラルキラー細胞媒介免疫、免疫系プロセスの陰性調節、好中球媒介免疫、免疫系プロセスの陽性調節、免疫応答の分子媒介物質の産生、免疫調節免疫系プロセス、免疫受容体の体細胞多様化、寛容誘導などが含まれるが、これらに限定されない。目的の特定の遺伝子としては、サイトカイン、インターロイキン、インターロイキン受容体、CD4、CD8、CD3、PD-1などが含まれるが、これらに限定されない。
【0106】
いくつかの実施形態では、本発明の方法は、RNA試料から免疫細胞受容体レパートリーライブラリを調製することを含む。主題の方法の態様は、RNA試料から生成された生成物二本鎖cDNAから免疫細胞特異的cDNAを増幅して、免疫細胞受容体レパートリーライブラリを産生することを含む。「免疫細胞受容体レパートリーライブラリ」とは、一般に、細胞又は細胞集団の1つ以上のタイプの免疫受容体の全長又は部分的な配列を含む核酸ライブラリを意味する。例えば、免疫細胞受容体レパートリーライブラリは、単一細胞について、あるいは、単一の細胞試料若しくは単一の対象に由来する細胞集団、又は細胞試料集団(例えば、2以上の対象からの試料集団を含む)について生成され得る。いくつかの事例では、主題のライブラリは、識別核酸配列の付加後に、プールされ得る個々の単一細胞から生成され得る。
【0107】
上述のように、免疫細胞受容体レパートリーライブラリのメンバーは、長さが様々であり得、全長であってもよく、又は全長未満であってもよい。いくつかの事例では、ライブラリのメンバーは、免疫細胞受容体の5’末端を優先的に含む。目的の免疫細胞受容体としては、限定されないが、例えば、T細胞受容体(TCR)及びB細胞受容体(BCR)が挙げられる。
【0108】
いくつかの事例では、免疫細胞レセプターレパートリーライブラリは、TCRレパートリーライブラリを含んでもよい。TCR複合体は、ジスルフィド結合膜アンカーヘテロ二量体タンパク質であり、通常はT細胞の表面上で発現され、CD3鎖分子との複合体の一部として発現される高可変アルファ(α)及びベータ(β)鎖からなる。多くの天然TCRは、ヘテロ二量体αβ又はγδ形態で存在する。ヘテロ二量体αβ形態の完全な内因性TCR複合体は、8つの鎖、すなわち、アルファ鎖(本明細書ではTCRα又はTCRアルファと称される)、ベータ鎖(本明細書ではTCRβ又はTCRベータと称される)、デルタ鎖、ガンマ鎖、2つのエプシロン鎖、及び2つのゼータ鎖を含む。アルファ及びベータTCR鎖は、可変(V)領域及び定常(C)領域を含む。TCR多様性は、遺伝子組換え(アルファ鎖のVJ組換え及びベータ鎖のVDJ組換え)から生成され、抗原(すなわち、ペプチド/MHC)認識にとって重要な交差領域をもたらす。
【0109】
いくつかの事例では、TCRレパートリーライブラリは、TCR-α鎖配列、TCR-β鎖配列、又はTCR-α鎖配列及びTCR-β鎖配列の両方を含み得る。主題のTCRレパートリーライブラリのTCR鎖配列は、全長TCR鎖配列(例えば、全長TCRアルファ鎖配列、全長TCRベータ鎖配列)又は部分TCR鎖配列(例えば、部分長TCRアルファ鎖配列、部分長TCRベータ鎖配列)を含み得る。
【0110】
主題のTCRレパートリーライブラリメンバーが部分TCR鎖配列を含む場合、部分TCR鎖配列は、TCR鎖可変領域全体又は本質的にTCR鎖可変領域全体(例えば、TCRアルファ鎖可変領域、TCRベータ鎖可変領域)を含み得る。いくつかの事例では、得られるライブラリメンバーは、TCR可変領域及びTCR定常領域の少なくとも一部分を含む。いくつかの事例では、得られたライブラリメンバーは、TCRアルファ及び/又はベータ鎖5’mRNA末端に対応する配列を含む。いくつかの事例では、得られるライブラリメンバーは、TCRアルファ又はベータ鎖5’末端から対応する鎖定常領域の少なくとも一部分までの配列を含む。
【0111】
特定の実施形態では、免疫細胞特異的ライブラリの調製は、TCR特異的増幅を含んでもよい。そのようなTCR特異的増幅は、TCR特異的プライマーを利用してもよい。「TCR特異的プライマー」とは、TCR鎖(例えば、TCRアルファ鎖、TCRベータ鎖)核酸配列の領域又はその相補体に特異的にハイブリダイズするプライマーを意味する。いくつかの事例では、TCR特異的プライマーは、1つのタイプのTCR鎖のみ、例えば、TCRアルファ鎖のみ又はTCRベータ鎖のみにハイブリダイゼーションしてもよい。場合によっては、TCR特異的プライマーは、2つ以上のタイプのTCR鎖にハイブリダイズするように構成されてもよく、例えば、TCRアルファ鎖及びTCRベータ鎖の両方にハイブリダイズするように構成されてもよい。
【0112】
TCR特異的プライマーは、TCRアルファ鎖定常領域又はその相補体に特異的にハイブリダイズするように設計され得る。例えば、いくつかの事例では、TCR特異的プライマーは、例えば、ヒトTCRアルファ鎖定常領域、マウスTCRアルファ鎖定常領域、アカゲザル、ハムスター、ラクダなどを含む、哺乳動物TCRアルファ鎖定常領域又はその相補体にハイブリダイズし得る。
【0113】
例示的なヒトTCRアルファ鎖定常領域は、以下のアミノ酸配列を有する:
PNIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS(配列番号07)。
これは、以下の核酸配列によってコードされる:
CCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGA(配列番号08;T細胞受容体アルファ鎖C領域、ヒト;GenBank:AY247834.1、AAO72258.1;UniProtKB:P01848)。
【0114】
例示的なマウスTCRアルファ鎖定常領域は、以下のアミノ酸配列を有する:
PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS(配列番号09;UniProtKB:P01849)、又は
PNIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS(配列番号10;GenBank:AAA53226.1)
これらは、それぞれ以下の核酸配列によってコードされる:
CCATACATCCAGAACCCAGAACCTGCTGTGTACCAGTTAAAAGATCCTCGGTCTCAGGACAGCACCCTCTGCCTGTTCACCGACTTTGACTCCCAAATCAATGTGCCGAAAACCATGGAATCTGGAACGTTCATCACTGACAAAACTGTGCTGGACATGAAAGCTATGGATTCCAAGAGCAATGGGGCCATTGCCTGGAGCAACCAGACAAGCTTCACCTGCCAAGATATCTTCAAAGAGACCAACGCCACCTACCCCAGTTCAGACGTTCCCTGTGATGCCACGTTGACCGAGAAAAGCTTTGAAACAGATATGAACCTAAACTTTCAAAACCTGTCAGTTATGGGACTCCGAATCCTCCTGCTGAAAGTAGCGGGATTTAACCTGCTCATGACGCTGAGGCTGTGGTCCAGT(配列番号11)、
及び
CCAAACATCCAGAACCCAGAACCTGCTGTGTACCAGTTAAAAGATCCTCGGTCTCAGGACAGCACCCTCTGCCTGTTCACCGACTTTGACTCCCAAATCAATGTGCCGAAAACCATGGAATCTGGAACGTTCATCACTGACAAAACTGTGCTGGACATGAAAGCTATGGATTCCAAGAGCAATGGGGCCATTGCCTGGAGCAACCAGACAAGCTTCACCTGCCAAGATATCTTCAAAGAGACCAACGCCACCTACCCCAGTTCAGACGTTCCCTGTGATGCCACGTTGACCGAGAAAAGCTTTGAAACAGATATGAACCTAAACTTTCAAAACCTGTCAGTTATGGGACTCCGAATCCTCCTGCTGAAAGTAGCGGGATTTAACCTGCTCATGACGCTGAGGCTGTGGTCCAGT(配列番号12;GenBank:U07662.1)。
【0115】
TCR特異的プライマーは、TCRベータ鎖(例えば、TCRベータ1鎖定常領域又はTCRベータ2鎖定常領域)定常領域又はその相補体に特異的にハイブリダイズするように設計され得る。例えば、いくつかの事例では、TCR特異的プライマーは、例えば、ヒトTCRベータ鎖定常領域、マウスTCRベータ鎖定常領域、アカゲザル、ハムスター、ラクダなどを含む、哺乳動物TCRベータ鎖定常領域又はその相補体にハイブリダイズし得る。
【0116】
例示的なヒトTCRベータ鎖1定常領域は、以下のアミノ酸配列を有する:
EDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF(配列番号13;UniProtKB:P01850;GenBank:CAA25134.1)
これは、以下の核酸配列によってコードされる:
GAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTC(配列番号14;GenBank:EF101778.1、X00437.1)。
【0117】
例示的なヒトTCRベータ鎖2定常領域は、以下のアミノ酸配列を有する:
DLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSESYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDSRG(配列番号15;UniProtKB:A0A5B9、GenBank:AAA60662.1)
これは、以下の核酸配列によってコードされる:
GACCTGAAAAACGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTATGCCTGGCCACAGGCTTCTACCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTCACCTCCGAGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTCAAGAGAAAGGATTCCAGAGGCTAG(配列番号16;GenBank:L34740.1)。
【0118】
例示的なマウスTCRベータ鎖1定常領域は、以下のアミノ酸配列を有する:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS(配列番号17;UniProtKB:P01852)
これは、以下の核酸配列によってコードされる:
GAGGATCTGAGAAATGTGACTCCACCCAAGGTCTCCTTGTTTGAGCCATCAAAAGCAGAGATTGCAAACAAACAAAAGGCTACCCTCGTGTGCTTGGCCAGGGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGCAAGGAGGTCCACAGTGGGGTCAGCACGGACCCTCAGGCCTACAAGGAGAGCAATTATAGCTACTGCCTGAGCAGCCGCCTGAGGGTCTCTGCTACCTTCTGGCACAATCCTCGCAACCACTTCCGCTGCCAAGTGCAGTTCCATGGGCTTTCAGAGGAGGACAAGTGGCCAGAGGGCTCACCCAAACCTGTCACACAGAACATCAGTGCAGAGGCCTGGGGCCGAGCAGACTGTGGGATTACCTCAGCATCCTATCAACAAGGGGTCTTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAAGCCACCCTGTATGCTGTGCTTGTCAGTACACTGGTGGTGATGGCTATGGTCAAAAGAAAGAATTCATGA(配列番号18;GenBank:FJ188408.1)。
【0119】
例示的なマウスTCRベータ鎖2定常領域は、以下のアミノ酸配列を有する:
EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYHQGVLSATILYEILLGKATLYAVLVSGLVLMAMVKKKNS(配列番号19、UniProtKB:P01851)
これは、以下の核酸配列によってコードされる:
GAGGATCTGAGAAATGTGACTCCACCCAAGGTCTCCTTGTTTGAGCCATCAAAAGCAGAGATTGCAAACAAACAAAAGGCTACCCTCGTGTGCTTGGCCAGGGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGCAAGGAGGTCCACAGTGGGGTCAGCACGGACCCTCAGGCCTACAAGGAGAGCAATTATAGCTACTGCCTGAGCAGCCGCCTGAGGGTCTCTGCTACCTTCTGGCACAATCCTCGAAACCACTTCCGCTGCCAAGTGCAGTTCCATGGGCTTTCAGAGGAGGACAAGTGGCCAGAGGGCTCACCCAAACCTGTCACACAGAACATCAGTGCAGAGGCCTGGGGCCGAGCAGACTGTGGAATCACTTCAGCATCCTATCATCAGGGGGTTCTGTCTGCAACCATCCTCTATGAGATCCTACTGGGGAAGGCCACCCTATATGCTGTGCTGGTCAGTGGCCTGGTGCTGATGGCCATGGTCAAGAAAAAAAATTCCTGA(配列番号20;GenBank:U46841.1)。
【0120】
いくつかの事例では、免疫細胞レセプターレパートリーライブラリは、BCRレパートリーライブラリを含んでもよい。BCR複合体は、B細胞の表面上に見出され、膜結合免疫グロブリン(すなわち、抗体)結合部分を含み、重鎖及び軽鎖を含み、その各々が定数(C)及び可変(V)領域を含有する。BCRの免疫グロブリン鎖は、ジスルフィド架橋によって、シグナル伝達CD79A/B鎖に結合される。BCRのイムノグロブリン鎖は、IgD、IgM、IgA、IgG、又はIgEを含む様々なアイソタイプであってもよい。TCRと同様に、BCRの免疫グロブリン部分は、V(D)J組換えを受けて、集団内に膨大な多様性を生成する。
【0121】
いくつかの事例では、免疫細胞受容体レパートリーライブラリは、BCRレパートリーライブラリを含み得、例えば、BCRレパートリーライブラリは、BCR免疫グロブリン鎖配列(例えば、IgD、IgM、IgA、IgG、又はIgE鎖配列を含む)を含み得る。主題のBCRレパートリーライブラリの免疫グロブリン鎖配列は、全長免疫グロブリン鎖配列(例えば、全長重鎖配列、全長軽鎖配列)又は部分免疫グロブリン配列(例えば、部分重鎖配列、部分軽鎖配列)を含み得る。
【0122】
主題のBCRレパートリーライブラリメンバーが部分免疫グロブリン鎖配列を含む場合、部分免疫グロブリン鎖配列は、免疫グロブリン可変領域全体又は本質的に免疫グロブリン可変領域全体(例えば、免疫グロブリン軽鎖可変領域、免疫グロブリン重鎖可変領域)を含み得る。いくつかの事例では、得られるライブラリメンバーは、免疫グロブリン可変領域及び免疫グロブリン定常領域の少なくとも一部分を含む。いくつかの事例では、得られるライブラリメンバーは、免疫グロブリン重鎖及び/又は軽鎖5’mRNA末端に対応する配列を含む。いくつかの事例では、得られるライブラリメンバーは、免疫グロブリン重鎖又は軽鎖5’末端から、対応する免疫グロブリン鎖定常領域の少なくとも一部分までの配列を含む。
【0123】
特定の実施形態では、免疫細胞特異的ライブラリの調製は、BCR特異的増幅(例えば、免疫グロブリン鎖特異的増幅を含む)を含み得る。そのような免疫グロブリン特異的増幅は、免疫グロブリン特異的プライマーを使用し得る。「免疫グロブリン特異的プライマー」とは、免疫グロブリン鎖(例えば、免疫グロブリン重鎖、免疫グロブリン軽鎖)核酸配列の領域又はその相補体に特異的にハイブリダイズするプライマーを意味する。いくつかの事例では、免疫グロブリン特異的プライマーは、1つのタイプの免疫グロブリン鎖のみ、例えば、免疫グロブリン重鎖のみ、免疫グロブリン軽鎖のみ、IgD鎖のみ、IgM鎖のみ、IgA鎖のみ、IgG鎖のみ、IgE鎖のみなどにハイブリダイズし得る。
【0124】
免疫グロブリン特異的プライマーは、免疫グロブリン重鎖定常領域又はその相補体に特異的にハイブリダイズするように設計され得る。例えば、いくつかの事例では、免疫グロブリン特異的プライマーは、例えば、ヒト免疫グロブリン重鎖定常領域、マウス免疫グロブリン重鎖定常領域などを含む、哺乳動物免疫グロブリン重鎖定常領域又はその相補体にハイブリダイズし得る。
【0125】
免疫グロブリン特異的プライマーは、免疫グロブリン軽鎖定常領域又はその相補体に特異的にハイブリダイズするように設計され得る。例えば、いくつかの事例では、免疫グロブリン特異的プライマーは、例えば、ヒト免疫グロブリン軽鎖定常領域、マウス免疫グロブリン軽鎖定常領域、アカゲザル、ハムスター、ラクダなどを含む、哺乳動物免疫グロブリン軽鎖定常領域又はその相補体にハイブリダイズし得る。
【0126】
例えば、免疫受容体特異的増幅を含む、ライブラリ調製中に実行される増幅は、単一の増幅ラウンドで実行することができ、又は複数の増幅ラウンドを用いてもよい。例えば、いくつかの事例では、第1の増幅ラウンドの後、第1のラウンドで利用されない1つ以上の増幅プライマーを反応混合物に添加して、第1の増幅ラウンドの生成物を核酸鋳型として使用する第2の増幅ラウンドを促進し得る。いくつかの事例では、第2の又は後続の増幅ラウンドは、ネスト化された増幅、すなわち、第2の又は後続の増幅ラウンドで利用されるプライマー結合部位が、第1の増幅ラウンドで生成される生成物の範囲内(すなわち、3’又は5’末端からの1つ以上のヌクレオチド)にある場合を含み得る。使用される場合、ネスト化の程度は、所望に応じて様々であり、例えば、第2の又は後続のプライマー結合部位が、第1の増幅ラウンドで生成されたアンプリコンの3’又は5’末端からの、1個以上(2個以上、3個以上、4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、10個以上、15個以上、20個以上などを含む)ヌクレオチドである場合を含む。
【0127】
いくつかの事例では、第2の又は後続のラウンド増幅はネスト化されず、例えば、第2の増幅ラウンドが、以前の増幅ラウンドで利用された1つ以上のプライマー結合部位、又は以前の増幅ラウンド中に加えられたプライマー結合部位(例えば、非鋳型化配列の一部として添加されたプライマー結合部位)を利用する場合を含む。いくつかの事例では、第2の又は後続の増幅ラウンドは、一方の末端にあるネスト化されたプライマー増幅部位、他方の末端にあるネスト化されていない(例えば、以前に使用されたプライマー結合部位又は追加されたプライマー結合部位)プライマー増幅部位を利用し得、ネスト化された部位が、アンプリコンの3’末端又はアンプリコンの5’末端にある場合を含む。
【0128】
キット、組成物及びデバイス
本開示の態様は、組成物及びキット、並びにそれらとともに、又はそれらの中で使用するためのデバイスも含む。
【0129】
最も一般的には、「キット」という用語は、プロセス、方法、アッセイ、分析、試料の操作などの実行を容易にする物品の任意の組立体を説明するために使用される。キットは、キットの使用方法を説明する説明書(例えば、本発明の方法を説明する説明書)、方法に必要な化学試薬又は酵素、プライマー、プローブ、緩衝液、任意のタイプの容器(例えば、試料収集又は試料操作のための容器)又は反応容器、又は任意の他の成分を含有することができる。キットは、本発明の方法を実行するために必要な全ての成分を含有する必要はない。本発明の組成物及びキットは、例えば、主題の方法に関して上述した反応成分のうちのいずれかの1つ以上を含み得る。
【0130】
いくつかの実施形態では、本発明のキットは、共通の第1の識別子を含む鋳型スイッチオリゴヌクレオチドを各々が含む複数の別個の鋳型スイッチオリゴヌクレオチド組成物であって、異なる鋳型スイッチオリゴヌクレオチド組成物の鋳型スイッチオリゴヌクレオチドの第1の識別子が異なる、複数の別個の鋳型スイッチオリゴヌクレオチド組成物と、例えば、サブドメインとして提供され得る複数の別個の第2の識別子核酸と、を含み得る。そのような事例では、所与の鋳型スイッチオリゴヌクレオチド組成物は、同一又は共通鋳型スイッチオリゴヌクレオチドの多くのコピー、又は同一又は共通の第1の識別子配列を共有するが、UMIドメインに関して各々異なる様々な鋳型スイッチオリゴヌクレオチドの集団から作製され得る。必要に応じて、異なる鋳型スイッチオリゴヌクレオチドは、異なる容器内、例えば、マイクロウェルプレートの異なるマイクロウェルを含む、マルチプレートの異なるウェル内に存在し得る。鋳型スイッチオリゴヌクレオチド組成物と同様に、異なる第2の識別子核酸は、別個の容器、例えば、マイクロウェルプレートの異なるマイクロウェルを含むマルチプレートの異なるウェルに存在してもよく、別個の容器は、鋳型スイッチオリゴヌクレオチド組成物を保持する容器とは異なる。
【0131】
キットは、例えば、上記のように、本発明の実施形態で用いられる1つ以上の追加の試薬を更に含んでもよく、そのような試薬は、1つ以上のポリメラーゼ(例えば、鋳型スイッチングポリメラーゼ、逆転写酵素、増幅ポリメラーゼなど)、リガーゼ、トランスポザーゼ、プライマー、緩衝液、dNTP(例えば、dATP、dCTP、dGTP、dTTP、dUTPなど、又はそれらのうちの任意の1つ若しくはそれらの任意の組み合わせを含む)などを含んでもよいが、これらに限定されない。主題のキットは、例えば、対照核酸(例えば、対照核酸鋳型)などを含む1つ以上の試験試薬を含んでもよく、又は組成物及びデバイスは、これらを備えてもよい。いくつかの事例では、試薬は、凍結乾燥酵素(例えば、凍結乾燥逆転写酵素、凍結乾燥DNAポリメラーゼ)などの凍結乾燥形態で提供され得る。
【0132】
いくつかの事例では、本発明の組成物及び/又はキットの成分は、「カクテル」として提示されてもよく、本明細書で使用される場合、カクテルは、単一の容器内の2つ以上の異なるが同様の成分のコレクション又は組み合わせを指す。必要に応じて、キットの成分は、別個の容器内に存在してもよく、又は複数の成分が単一の容器内に存在してもよい。主題の組成物は、任意の好適な環境に存在してもよい。一実施形態によれば、組成物は、反応チューブ(例えば、0.2mLチューブ、0.6mLチューブ、1.5mLチューブなど)、又はウェル若しくはマイクロ流体チャンバ若しくは液滴、又は他の好適な容器内に存在する。特定の態様では、組成物は、2つ以上(例えば、複数の)反応チューブ又はウェル(例えば、プレート、例えば、96ウェルプレート、マルチウェルプレート、例えば、約1000、5000、又は10,000以上のウェルを含有する)に存在する。チューブ及び/又はプレートは、例えば、ポリプロピレンなどの任意の好適な材料、PDMS、又はアルミニウムで作製されてもよい。容器は、核酸の容器の壁への吸着を低減するように処置されてもよい。特定の態様では、組成物が存在するチューブ及び/又はプレートは、組成物への効率的な熱伝達を提供する(例えば、ヒートブロック、水浴、サーモサイクラーなどに配置された場合)ため、組成物の温度は、例えば、特定の酵素反応が生じるために必要に応じて、短期間内に変更してもよい。特定の実施形態によれば、組成物は、薄壁のポリプロピレンチューブ、又は薄壁のポリプロピレンウェルを有するプレート、又は高い熱伝導率を有するアルミニウムなどの材料に存在する。
【0133】
いくつかの事例では、個々の容器(例えば、別個のチューブ)のコレクション又は複数の容器、例えば、マルチウェルデバイスを含有するコレクションは、液体又は乾燥形態で提供され得る試薬を含み得る。
【0134】
任意の好適な反応容器を、主題のキット若しくはデバイスに用いることができ、かつ/又は主題の組成物を含有することができる。有用な反応容器としては、例えば、チューブ(例えば、単一のチューブ、マルチチューブストリップなど)、ウェル(例えば、マルチウェルプレート(例えば、96ウェルプレート、384ウェルプレート、又は2000、4000、6000、又は10000以上のような任意の数のウェルを有するプレート)が挙げられるが、これらに限定されない。マルチウェルプレートは、例えば、以下でより詳細に説明するように、独立していてもよく、チップ及び/又はデバイスの一部であってもよい。したがって、特定の実施形態では、用いられる反応容器は、マルチウェルデバイスの1つ以上のウェルである。本開示は、用いられるマルチウェルデバイス(例えば、プレート又はチップ)のタイプによって限定されない。一般に、そのようなデバイスは、液体(例えば、重力だけでは液体をウェルから流出させることができないように、ウェル内に閉じ込められた液体)を含有する、又は含有するように寸法決めされた複数のウェルを有する。1つの例示的なチップは、5184ウェルSMARTCHIP(商標)(Takara Bio USA、San Jose CA)である。他の例示的なチップは、米国特許第8,252,581号、同第7,833,709号、及び同第7,547,556号に提供され、これらの全ては、その全体が参照により本明細書に組み込まれ、例えば、チップ、ウェル、熱循環条件、及びその中で使用される関連する試薬の教示を含む)。他の例示的なチップとしては、QUANTSTUDIO(商標)リアルタイムPCRシステム(Applied Biosystemsによって販売される)において使用されるOPENARRAY(商標)プレートが挙げられる。別の例示的なマルチウェルデバイスは、96ウェル又は384ウェルプレートである。
【0135】
上記の構成要素に加えて、対象のキットは、例えば、上記のような対象方法を実践するために、キットの構成要素を使用するための説明書を更に含んでもよい。説明書は、一般に、好適な記録媒体に記録される。説明書は、紙又はプラスチックなどの基材上に印刷され得る。したがって、説明書は、添付文書としてキットに存在してもよく、キット又はその構成要素の容器のラベル(すなわち、包装又はサブ包装に関連付けられた)に存在してもよい。他の実施形態では、説明書は、好適なコンピュータ可読記憶媒体、例えば、ポータブルフラッシュドライブ、CD-ROM、ディスケット、ハードディスクドライブ(HDD)などに存在する電子記憶データファイルとして存在する。更に他の実施形態では、実際の説明書は、キットには存在しないが、例えば、インターネットを介して、遠隔ソースから説明書を取得するための手段が提供される。この実施形態の例は、説明書を閲覧することができる、及び/又は説明書をダウンロードすることができるウェブアドレスを含むキットである。説明書と同様に、これは、説明書を得るための手段が好適な基材上に記録されることを意味する。
【0136】
以下の実施例は、例示として提供され、限定として提供されるものではない。
【実施例】
【0137】
実施例1 複数の細胞又は核の各々における1つ以上の遺伝子の発現の分析
この実施例は、
図2及び3に広く示されている。細胞又は核を、適切な溶液(例えば、NP40又はジギトニンを有する1%又は4%のパラホルムアルデヒド)中で固定及び透過処理する。固定細胞又は核を、マルチウェルデバイスのウェル(例えば、96ウェル又は384ウェルプレート)に等分する。あるいは、ウェルは、物理的なウェルである必要はなく、液滴で構成されてもよく、細胞又は核を異なる液滴に配分する。ウェル又は容器当たりの細胞又は核の数は、研究者が実行したい実験の規模に応じて適宜変動し得る。例えば、プレートの96又は384ウェルの各々について、ウェル当たり100個又は1,000個の細胞を分析することができる。逆転写酵素、オリゴdT、第1の細胞特異的バーコード(すなわち、ウェル特異的な第1の識別子又は第1のインデックス)と、PCR用アダプタハンドル(すなわち、プライマー結合部位)と、を含む鋳型スイッチオリゴ(TSO)、dNTP、及び緩衝塩を含む逆転写混合物をウェルの各々に添加し、RT反応を進行させる(例えば、37~50℃、例えば、42℃などの任意の適切な温度で、反応を完了するのに十分な時間、例えば、60~90分以上)。これは、
図2のステップAに示される。反応を停止し、細胞又は核をウェルの各々から収集し、一緒にプールし、次いで、第2のマルチウェルデバイスのウェルに再分配する。あるいは、細胞又は核は、別の液滴セットに再分配され得る。任意選択的に、溶解緩衝液をウェルの各々に添加して、細胞又は核の各々から核酸を放出する。任意選択的に、核酸は、各ウェルにおいて独立して精製される。次いで、PCRを実行するのに有効な試薬をウェルに添加する。これらは、熱安定性ポリメラーゼ、dNTP、緩衝液、及び2つ以上のPCRプライマーを含み得る。第1のプライマーは、
図2のステップBに示されるように、逆転写酵素ステップで使用されるTSOに存在するアダプタハンドル(プライマー結合部位)配列、及び遺伝子特異的配列(例えば、TCR定常領域遺伝子配列)、ポリA配列、アダプタハンドル、又はランダム配列のいずれかに相補的な領域を3’末端に有する1つ以上の第2のプライマーに特異的である。一実施形態では、2つ以上のPCRプライマーの各々は、組み合わせたときに、第2の細胞特異的バーコード配列(すなわち、第2の識別子タグ)を提供するバーコード配列(
図2においてBC2A及びBC2Bとして示される)を更に含有する。代替的な実施形態では、BC2A又はBC2Bは、第2の細胞特異的バーコード配列(すなわち、第2の識別子タグ)として単独で使用することができる。任意選択的に、PCRプライマーはまた、次世代配列決定のための追加の配列も含み得る。例えば、リードプライマー配列、p5、p7配列などの配列決定プラットフォームアダプタ構築物である。あるいは、これらの配列決定プラットフォームアダプタ構築物配列は、第2のPCRラウンドにおいて付加することができる。第2のPCRラウンドを伴うこの代替実施形態を
図3に示し、第2のPCR(PCR2)を追加のステップCとして示す。このステップCでは、ネスト化された3’プライマーを、ステップBからの二次プライマー結合部位に対して内部的に使用する。このネスト化されたプライマーは、三次プライミング部位(ステップBの二次プライミング部位への5’)に相補的な配列、任意選択的な二次タグ配列(第2のサブ識別子、BC2B)、及びIllumina p7配列を含む。
【0138】
図2及び3に示されるように、第2の識別子タグは、2つの部分(BC2A及びBC2B)として付加される。
図2に示される実施形態では、BC2A及びBC2Bの両方が、PCR1の一部として付加される(
図2のステップB)。
図3に示す実施形態では、
図3のステップBでBC2Aを付加し、ステップCと同様にBC2Bを付加する。
【0139】
次いで、得られた配列決定生成物を、次世代配列決定プラットフォームを使用して配列決定して、遺伝子配列情報及びバーコード情報(第1の(TSO)バーコード(すなわち、第1の識別子)及び第2の(組み合わされたPCRバーコード;第2の識別子)の組み合わせ)を取得し、各個々の細胞又は核に遺伝子特異的な配列を追跡することができる一意の細胞特異的バーコードを提供する。したがって、元のコレクションの細胞又は核の各々で検出された遺伝子又は遺伝子の発現が決定される。
【0140】
実施例2 本発明の実施形態
この実施例は、第2のマルチウェルデバイスへの細胞又は核の再分配まで、実施例1と同一の初期ステップに従う。この実施例は、
図7に広く示されている。
【0141】
分析される細胞又は核を、適切な溶液(例えば、NP40又はジギトニンを有する1%又は4%のパラホルムアルデヒド)中で固定及び透過処理する。固定細胞又は核を、マルチウェルデバイスのウェル(例えば、96ウェル又は384ウェルプレート)に等分する。あるいは、物理的なウェルの代わりに、細胞又は核を、当該技術分野で既知であるように、複数の液滴に配分することができる。
【0142】
ウェル又は容器当たりの細胞又は核の数は、研究者が実行したい実験の規模に応じて適宜変動し得る。例えば、プレートの96又は384ウェルのウェルの各々について、ウェル当たり100個又は1,000個の細胞を使用することができる。逆転写酵素、オリゴdT、第1の細胞特異的バーコード(すなわち、ウェル特異的な第1の識別子タグ)と、PCR用アダプタハンドル(すなわち、プライマー結合部位)と、を含む鋳型スイッチオリゴ(TSO)、dNTP、及び緩衝塩を含む逆転写混合物をウェルの各々に添加し、RT反応を進行させる(例えば、37~50℃、例えば、42℃などの任意の適切な温度で、反応を完了するのに十分な時間、例えば、60~90分以上)。反応を停止し、細胞又は核をウェルの各々から収集し、一緒にプールし、次いで、第2のマルチウェルデバイスのウェルに再分配する。あるいは、細胞又は核は、別の液滴セットに再分配されてもよい。
【0143】
第2の鎖合成及び/又は等温増幅は、再分配された細胞又は核上で実行される。この段階では、再分配された材料は、依然として、第2のマルチウェルデバイスの個々のウェル内に、無傷の細胞又は無傷の核として残っている。第2の鎖合成は、反応緩衝液、dNTP、第2の鎖プライマー、例えば、第2のウェル特異的バーコード(すなわち、第2の識別子タグ)及び第2のプライマー結合部位を含むプライマー、並びにポリメラーゼのうちの1つ以上をウェルに添加することによって開始される。第2の鎖合成を実行し、第2のバーコード5’をTSOバーコード(すなわち、ウェル特異的な第1の識別子タグ)に付加する。任意選択的に、等温増幅は、標的特異的配列、オリゴdT配列、第1のラウンドで付加されたアダプタハンドル配列に相補的な配列、又はランダム配列のいずれかを3’末端に有する1つ以上のリバースプライマーを含むことによって実行され、それによって、2つのバーコードを有する細胞特異的核酸を生成する。各ステップ(鋳型スイッチングステップ及び第2の鎖合成ステップ)からの1つは、組み合わせると、第1のマルチウェルデバイスのどのウェル、及び第2のマルチウェルデバイスのどのウェルが、いずれかの特定の細胞又は核が最初に位置したかを識別することができる。
【0144】
この第2のバーコード付けステップの完了後、細胞を第2のプレートの各ウェルから再び収集し、一緒にプールし、第3のマルチウェルデバイスに再分配する。任意選択的に、細胞又は核は、溶解され、核酸は、各ウェルにおいて独立して精製される。次いで、熱安定性ポリメラーゼ、dNTP、緩衝液、及び2つのPCRプライマーを含むPCR用試薬をウェルに添加する。第1のプライマーは、第2の鎖合成ステップで使用されるプライマーに存在するアダプタハンドル配列(第2のプライマー結合)、及び上記第2のステップで使用されるリバースプライマーに対して内部にネスト化された遺伝子特異的配列(例えば、TCR定常領域遺伝子配列)、又は第2のインデックス付けステップで使用されるリバースプライマーに含まれたアダプタハンドルのいずれかに相補的な領域を3’末端に有する1つ以上の第2のプライマーに特異的である。これらのPCRプライマーの一方又は両方は、単独で又は組み合わせて第3の細胞特異的バーコード配列を提供するバーコード配列(すなわち、第3の識別子タグ)を含有してもよい。
【0145】
任意選択的に、PCRプライマーはまた、次世代配列決定のための追加の配列も含み得る。例えば、リードプライマー配列、p5、p7配列などの配列決定プラットフォームアダプタ構築物である。あるいは、これらの配列決定プラットフォームアダプタ構築物配列は、第3の識別子配列(第3の細胞特異的バーコード配列)を付加するために使用されるPCR反応に続いて、別のPCRのラウンドにおいて付加され得る。
【0146】
次いで、得られた配列決定生成物を、次世代配列決定プラットフォームを使用して配列決定し、遺伝子配列情報及びバーコード情報を取得する。各インデックス付加ラウンドからのバーコードの組み合わせは、個々の細胞又は核配列が、各それぞれのマルチウェルデバイスの第1、第2、及び第3の一意のウェルを細胞又は核が一意に通過することによって生じた細胞又は核を識別する。すなわち、例えば、第1の(TSO)バーコード、第2のバーコード(第2の鎖合成からの)及びPCRからの第3のバーコードは、各個々の細胞又は核に遺伝子特異的配列を追跡することができる一意の細胞特異的バーコードを提供する。したがって、元のコレクションの細胞又は核の各々で検出された遺伝子又は遺伝子の発現が決定される。
【0147】
図6は、実施例2に記載されるように、本発明の実施形態を使用して作製したNGSライブラリ生成物の構造を示す概略図を提供する。より具体的には、T細胞受容体遺伝子は、分析のために特異的に標的化される。
図6に示すように、リード1は、標的化TCR遺伝子の配列を提供する。リード2はまた、T細胞受容体遺伝子の配列を、第1の2つのインデックス配列、すなわち、第2のインデックス付けステップからのインデックス2(IN2)、及び第1のインデックス付けステップからのインデックス1(IN1)とともに提供する。インデックス3は、第3のインデックス付けステップでPCRによって付加されたi7及びi5インデックスの組み合わせによって提供されるように示される。
【0148】
実施例3 本発明の実施形態
実施例3は、
図4に広く示され、実施例1と同様の方法で実行されるが、以下に記載されるように、第2のステップで3’バーコードを付加する方法が異なる。この実施例は、実施例1と同じ初期ステップに従い、第1の細胞特異的バーコード(すなわち、ウェル特異的第1の識別子タグ)を付加する。本方法論のステップを以下に記載する。
【0149】
細胞又は核を、適切な溶液(例えば、NP40又はジギトニンを有する1%又は4%のパラホルムアルデヒド)中で固定及び透過処理する。固定細胞又は核を、マルチウェルデバイスのウェル(例えば、96ウェル又は384ウェルプレート)に等分する。あるいは、ウェルは、物理的である必要はなく、液滴で構成されてもよく、細胞又は核を異なる液滴に配分する。ウェル又は容器当たりの細胞又は核の数は、研究者が実行したい実験の規模に応じて適宜変動し得る。例えば、プレートの96又は384ウェルの各々について、ウェル当たり100個又は1,000個の細胞である。逆転写酵素、オリゴdT、第1の細胞特異的バーコード(すなわち、ウェル特異的な第1の識別子タグ)と、PCR用アダプタハンドル(すなわち、プライマー結合部位)と、を含む鋳型スイッチオリゴ(TSO)、dNTP、及び緩衝塩を含む逆転写混合物をウェルの各々に添加し、RT反応を進行させる(例えば、37~50℃、例えば、42℃などの任意の適切な温度で、反応を完了するのに十分な時間、例えば、60~90分以上)。これは、
図4のステップAに示される。反応を停止し、細胞又は核をウェルの各々から収集し、一緒にプールし、次いで、第2のマルチウェルデバイスのウェルに再分配する。あるいは、細胞又は核は、別の液滴セットに再分配されてもよい。
【0150】
所望であれば、溶解緩衝液をウェルの各々に添加して、細胞又は核の各々から核酸を放出する。任意選択的に、核酸は、各ウェルにおいて独立して精製される。次いで、
図4のステップB-PCR1に図示されるように、PCRを実行するのに有効な試薬をウェルに添加する。これらは、熱安定性ポリメラーゼ、dNTP、緩衝液、及び2つ以上のPCRプライマーを含み得る。第1のプライマーは、逆転写酵素ステップで使用されるTSOに存在するアダプタハンドル(プライマー結合部位)配列、及び遺伝子特異的配列(例えば、TCR定常領域遺伝子配列)、ポリA配列、アダプタハンドル、又はランダム配列のいずれかに相補的な領域を3’末端に有する1つ以上の第2のプライマーに特異的である。これは、
図4にステップBとして示される。このステップでは、第2の細胞特異的バーコード配列(第2の識別子)の全て又は一部分が、TSOにおけるプライマー結合部位に結合するプライマーに含まれる。
図4では、これをBC2Aとして示す。増幅後、ThruPLEX(登録商標)ライブラリ調製キット(Takara Bio USA Inc.、San Jose,CA)の修正版を使用して、すなわち、単一のアダプタのみを使用して、ステップBで生成された断片の3’末端に、第2の細胞特異的バーコードの全て又はサブ部分を含むヘアピンアダプタを付加し、バーコードを有するアダプタを断片の3’末端に付加する。これは、
図4のステップCに詳述されている。
【0151】
任意選択的に、ThruPLEX(登録商標)の代わりにタグメンテーションを使用して、バーコードアダプタを断片の末端に付加することができる。このアダプタの付加後、PCRを実行して、3’末端上にアダプタを有する配列のみを増幅し、例えば、Illumina P7配列などの次世代配列に必要な任意の追加の配列を付加する。必要に応じて、例えば、必要とされるバーコード付きオリゴの総数を減少させるために、鋳型スイッチオリゴ内のハンドルに特異的なプライマーは、第2の細胞特異的バーコードのサブ部分(すなわち、第2の識別子タグ)を含むことができる。このサブ識別子(
図4のBC2A)は、3’アダプタ内のタグ(
図4のBC2B)によって提供されるサブ識別子と組み合わされると、第2の細胞特異的バーコード配列(すなわち、第2の識別子タグ)を提供する。BC2A又はBC2Bのいずれかが、他方のタグを使用する必要なしに第2の識別子タグ全体として使用され得ること、又はBC2A及びBC2Bの組み合わせを使用して、組み合わされた第2の識別子を提供することができることは、当業者によって理解されるべきである。
【0152】
次いで、得られた配列決定生成物を、次世代配列決定プラットフォームを使用して配列決定して、遺伝子配列情報及びバーコード情報(第1の(TSO)バーコード、第2のバーコード(第2の鎖合成由来)、及びPCRからの第3のバーコードの組み合わせ)を取得し、各個々の細胞又は核に遺伝子特異的配列を追跡することができる一意の細胞特異的バーコードを提供する。したがって、元のコレクションの細胞又は核の各々で検出された遺伝子又は遺伝子の発現が決定される。
【0153】
図2、
図3、及び
図4に図示されるように、バーコードBC2A及び2Bは、計算上、第2のプールステップのウェルを一意に画定する単一の一意の二次バーコードであるように組み合わせることができる。BC1とBC2を組み合わせて、元のプールからの細胞を一意に定義する。
【0154】
実施例4 Jurkat細胞とCCRF-CEM細胞との混合物からのTCRベータ鎖の2ラウンドのバーコード付け
図8A及び
図8Bは、TCR配列決定ライブラリを調製するために用いられた2ラウンドのバーコード付けプロトコルを図示する。
図8Aに示すように、Jurkat細胞及びCCRF-CEM細胞を、4体積の冷メタノールで-20℃で30分間インキュベートすることによって固定した(
図8A、ステップB)。固定細胞を-20℃の冷凍庫から取り出し、メタノールを除去した後、PBS緩衝液、BSA、RNase Inhibitor、及びDTTを含む500ulの再水和緩衝液で氷上で再水和した。1,000個の固定Jurkat細胞及びCCRF-CEM細胞を、陰性対照としてPBSを有する3つのチューブ並びに2つのチューブの各々に配分した(
図8B)。逆転写酵素、RNase阻害剤、ポリ-dTオリゴ、第1のチューブ特異的バーコード(BC1)及びIllumina RP1配列を含む鋳型スイッチオリゴ(TSO)、dNTP、並びにRT緩衝液を含む逆転写混合物を各チューブに添加し、RT反応を42℃で90分間実行した(
図8A、ステップC)。細胞を各チューブから収集し、一緒にプールした(
図8A、ステップD)。遠心分離後、上清を廃棄し、細胞をPBS緩衝液で再懸濁した。再懸濁された細胞を、8本のチューブの新しいセットに再分配した(
図8A、ステップE、及び
図8B)。
【0155】
DNAポリメラーゼ、Illumina RP1配列を含むPCRプライマー、T細胞抗原受容体(TCR)ベータ鎖の定常領域に特異的にハイブリダイズするプライマー(TCRb PCR1プライマー)、dNTP、及びPCR緩衝液を含むPCR1混合物を、再懸濁細胞を含有する8本のチューブに添加した。次いで、40μlでPCR1を実行した(
図8A、ステップF)。TCRb PCR1プライマーは、RNaseの非存在下でPCRプライマーとして機能するキメラDNA/RNAオリゴヌクレオチドであるが、例えば、US2020-0332341A1として公開されている米国特許出願第16/603,788号(代理人整理番号CLON-169)(その開示は、参照により本明細書に組み込まれる)に記載されているように、様々なRNase(例えば、RNaseH、RNaseAなど)による消化によってPCR後に不活性にすることができる。
【0156】
DNAポリメラーゼ;RNaseH;Illumina RP1配列、BC2a(i5)及びP5アダプタ配列を含むBC2a(i5)プライマー;Illumina RP2配列、BC2b(i7)及びP7アダプタ配列を含むBC2b(i7)プライマー;TCRb PCR2プライマー(TCRb PCR1プライマーに対して内部の点でTCRb定常領域にハイブリダイズし、Illumina RP2配列を更に含む);dNTP;並びにPCR緩衝液を含むPCR2混合物を、PCR1反応生成物を含有する8本のチューブに直接添加した。次いで、PCR2を70ulで実行した(
図8A、ステップH)。得られたTCRbライブラリは、第1及び第2のラウンドのバーコード(BC1、BC2a(i5)及びBC2b(i7))の両方でマークされた全ての分子を含有する。
【0157】
8つのバーコード付きTCRbライブラリを磁気ビーズで精製し、Qubit、Bioanalyzer High sensitivity kit(8つのライブラリのうちの1つを
図8Cに示す)、及びqPCRによって定量した。次いで、それらを一緒にプールし、ペアリングエンド配列決定(2×151PE)のために、NextSeqシーケンサー(Illumina Inc.、San Diego,CA)に装填した。得られた配列決定リードをBC1、BC2a(i5)及びBC2b(i7)で逆多重化し、Cogent APソフトウェア(Takara Bio USA,Inc.、San Jose CA)によって分析した。64個の予想されるバーコードの組み合わせ(8個の第1のラウンドのバーコード×8個の第2のラウンドのバーコード)を全て検出し、結果を、検出したJurkatクロノタイプ(アミノ酸配列:CASSFSTCSANYGYTF)及びCCRFクロノタイプ(アミノ酸配列:CASSLGTDTQYF)のリード数に基づいてプロットした(
図8D)。予想通り、ほとんどのリードは、Jurkat又はCCRFクロノタイプに割り当てられた。これにより、TSOからの第1のラウンドのバーコードの使用を含む組み合わせバーコード付け戦略が予想どおりに機能していたことが確認された。
【0158】
なお、PCR1用のフォワードプライマーが、部分的な第2のラウンドのバーコードBC2a、P5配列、及びIllumina RP1配列を含む、代替のバーコード付け戦略も想定される。これを
図9に示す。
【0159】
実施例5 PBMC RNAからのTCRアルファ及びベータ鎖の3ラウンドのバーコード付け
配列決定ライブラリを、
図10Aに図示される3ラウンドのバーコード付けプロトコルを使用して調製した。PBMC RNA(Takara Bio USA Inc.)を5ng/ulに希釈し、2ul(10ng)をエッペンドルフチューブに分配した。陰性対照として、2ulのRNaseフリー水を別のチューブに分配した。逆転写酵素、RNase阻害剤、ポリ-dTオリゴ、第1のバーコード(BC1)及び第2の鎖合成のためのプライマー結合部位(第2のSSハンドル)を含む鋳型スイッチオリゴ(TSO)、dNTP、並びにRT緩衝液を含む逆転写混合物を各チューブに加え、RT反応を20ulで42℃で90分間実行し、続いて70℃で10分間インキュベートした(
図10A、ステップC)。この反応に使用されるTSOは、RNaseの非存在下で鋳型スイッチングオリゴとして機能するが、例えば、US2020-0332341A1として公開されている米国特許出願第16/603,788号(代理人整理番号CLON-169)(その開示は参照により本明細書に組み込まれる)に記載されているように、様々なRNase(例えば、RNaseH、RNaseAなど)での消化により使用後に不活性化することができるキメラDNA/RNAオリゴヌクレオチドである。BC1を含むRT生成物を磁気ビーズによって精製し、13ulの溶出緩衝液中に溶出させた。
【0160】
逆転写酵素;RNaseH;TSOプライマー結合配列にハイブリダイズする配列、BC2及びIllumina RP2配列を含む第2のSSオリゴ;dNTP;並びに第2のSS反応緩衝液を含む第2の鎖合成混合物(第2のSS)を、13ulの精製されたRT生成物を収容するクリーンチューブに添加した。次いで、第2のSS反応を20ulで42℃で10分間実行し、続いて70℃で10分間インキュベーションした(
図10A、ステップF)。BC1及びBC2を有する第2のSS生成物を磁気ビーズによって精製し、12ulの溶出緩衝液中に溶出した。
【0161】
DNAポリメラーゼ;Illumina RP2配列、BC3b(i7)及びP7アダプタ配列を含むBC3b(i7)プライマー;T細胞抗原受容体(TCR)アルファ鎖の定常領域に特異的にハイブリダイズするTCRa PCR1プライマー;T細胞抗原受容体(TCR)ベータ鎖の定常領域に特異的にハイブリダイズするTCRb PCR1プライマー;dNTP;並びにPCR緩衝液を含むPCR1混合物を、精製された第2SSの生成物10ulを収容するクリーンチューブに添加し、次いで40ulでPCR1を実行した(
図10A、ステップI)。上記のTCRa PCR1プライマー及びTCRb PCR1プライマーは両方とも、RNaseの非存在下でPCRプライマーとして機能することができるが、例えば、US2020-0332341A1として公開されている米国特許出願第16/603,788号(代理人整理番号CLON-169)(その開示は参照により本明細書に組み込まれる)に記載されているように、使用後に様々なRNase(例えば、RNaseH、RNaseAなど)で消化することによって不活性化することができるキメラDNA/RNAオリゴヌクレオチドである。
【0162】
PCR1に続いて、DNAポリメラーゼ;RNaseH;Illumina RP1配列、BC3a(i5)及びP5アダプタ配列を含むBC3a(i5)プライマー;TCRa PCR1プライマーに対して内部の点でTCRa定常領域にハイブリダイズし、更にIllumina RP1配列を含むTCRb PCR2プライマー;TCRb PCR1プライマーに対して内部の点でTCRb定常領域にハイブリダイズし、更にIllumina RP1配列を含むTCRb PCR2プライマー;dNTP;並びにPCR緩衝液を含むPCR2混合物を、PCR1チューブに直接添加した。次いで、PCR2を70ulで実行した(
図10A、ステップK)。PCR2の後、第1、第2、及び第3のラウンドのバーコード(BC1、BC2、BC3a(i5)、及びBC3b(i7))でマークされた分子を含むTCRライブラリを磁気ビーズによって精製し、Qubit及びBioanalyzer High sensitivity kitによって定量した。10ngのPBMC RNAからのみ得られたライブラリは、予想されるサイズ(約650bp)を有するように適合させた(
図10パネルB)。
【0163】
ライブラリをIllumina MiSeq(Illumina Inc、San Diego,CA)に装填して、ペアエンド配列決定(2×151PE)を行い、得られた配列決定データをCogent APソフトウェア(Takara Bio USA,Inc.San Jose CA)を使用して分析した。410,696個のリードが逆多重化後に得られ、286,070個のリード(70%のマッピング率を表す)がTCRa及びTCRbにマッピングされた。検出されたクローンタイプの数は、93(TCRa)及び890(TCRb)であった(
図10パネルC)。この結果は、TSOを使用して第1のラウンドのバーコード(第1の識別子)を供給し、第2の鎖合成を使用して第2のラウンドのバーコード(第2の識別子)を提供する3ラウンドの組み合わせバーコード付け戦略が予想どおりに機能することを実証する。
【0164】
なお、PCR1用のフォワードプライマーが、バーコード配列を含まない、代替のバーコード付け戦略も想定されることに留意されたい。これを
図11に示す。
【0165】
実施例6 組み合わされた標的化配列決定と5’差次的発現(5’DE)のための2ラウンドのバーコード付け
配列決定ライブラリを、
図12Aに図示されるプロトコルを使用して生成した。1%パラホルムアルデヒド(PFA)を使用してK562及び3T3細胞を固定し、0.01%ジギトニンで透過処理した(
図12A、ステップB)。洗浄後、細胞を、各ウェルが約1,000個の細胞を含有するように、96ウェルプレートの39個のウェル(K562細胞に対して8個のウェル、3T3細胞に対して8個のウェル、並びにK562及び3T3細胞の混合物に対して23個のウェル)に等分した。逆転写酵素;RNase阻害剤;ポリ-dT配列及びPCRハンドル配列を含むRTオリゴ;第1のウェル特異的バーコード(BC1)及びPCR用のプライマー結合部位を含む鋳型スイッチオリゴ(TSO);dNTP;並びにRT緩衝液を含む逆転写混合物を各ウェルに添加し、RT反応を42℃で90分間実行した(
図12A、ステップC)。次いで、ウェルの各々から細胞を収集し、一緒にプールした。遠心分離後、上清を廃棄し、細胞をPBS緩衝液中に再懸濁した。
【0166】
再懸濁細胞を、ICELL8機器(Takara Bio USA,Inc.、San Jose CA)を使用して、ICELL8ナノウェルチップの1,296個のウェルに再分配した(
図12A、ステップE)。RTオリゴからのPCRハンドル配列にハイブリダイズする逆PCRプライマー、並びにDNAポリメラーゼ、dNTP及びPCR緩衝液を含有するPCR試薬とともに、部分的な第2のラウンドのウェル特異的バーコード(BC2a及びBC2bのいずれか)対のうちの1つを含む2つのフォワードPCRプライマーをチップに順次分配した。2つのフォワードプライマーを、一方がチップ上のウェルの特定の行を画定し、他方がウェルの特定の列を画定するように付加した。したがって、組み合わせて、それらは一意のウェル位置を画定する。第1のフォワードPCRプライマーは、TSOによって提供されるPCRハンドルにハイブリダイズすることができる配列、BC2a、及びIllumina RP2配列を含む。第2のフォワードPCRプライマーは、Illumina RP2配列、BC2b、及びP7配列を含む。したがって、
図12A、ステップFに示すように、これらのプライマーを合わせると、両方のプライマーに由来する配列を組み合わせて最終的に含むPCR生成物を生成する「ステップアウト」PCR反応が可能になる。
【0167】
この第2のバーコード付けステップの完了後、バーコード付き全長cDNAを遠心分離によってICELL8チップから抽出し、磁気ビーズで精製した。Qubit及びBioanalyzer High sensitivity kitによる定量後、cDNAを使用して、Illumina Nextera XTキットを使用した差動遺伝子発現分析(5’DE)のための配列決定ライブラリを調製し、続いてP7プライマー及びIllumina P5インデックスプライマーを使用したPCRを行った(
図12B)。精製及び定量の後、最後の5’DEライブラリを、ペアエンド配列決定のためにIllumina NextSeqに装填した(2×75PE)。得られた配列決定リードを逆多重化し、Cogent APソフトウェア(Takara Bio USA,Inc.、San Jose CA)を使用して分析した。
【0168】
Cogent APソフトウェアを使用してBC1、BC2a、BC2b(i7)及びi5インデックスを使用して配列決定リードを逆多重化した後、10,000リード/細胞を超える1310個の細胞を識別した(
図12C)。これらの細胞からのデータを、(
図12D~12Fに示されるように)下流分析に使用した。特に、
図12Fに示されるL-プロット分析は、ヒトゲノム(hg38;K562細胞の代表)又はマウスゲノム(mm10;3T3細胞の代表)のいずれかに対するデータの高いマッピング率を明らかに示し、ダブレット率は非常に低かった。これは、この組み合わせバーコード付け戦略が単一細胞データを生成することができることを実証した。
【0169】
実施例7 PBMC RNAを使用する、組み合わされたTCR鎖の標的化配列決定と5’差次的発現(5’DE)のための2ラウンドのバーコード付け
PBMC RNA(Takara Bio USA Inc.、San Jose CA)を5.0ng/ulに希釈し、2ul(10ng)をエッペンドルフチューブに分配した。逆転写酵素;RNase阻害剤;ポリ-dT配列及びPCRハンドル配列を含むRTオリゴ;第1のウェル特異的バーコード(BC1)及びPCR用のプライマー結合部位を含む鋳型スイッチオリゴ(TSO);dNTP;並びにRT緩衝液を含む逆転写混合物をチューブに添加し、RT反応を20ul、42℃で90分間実行し、続いて70℃で10分間インキュベートした(
図12A、ステップC)。BC1を含むRT生成物を磁気ビーズによって精製し、12ulの溶出緩衝液中に溶出させた。
【0170】
RTオリゴからのPCRハンドル配列にハイブリダイズする逆PCRプライマー、並びにDNAポリメラーゼ、dNTP及びPCR緩衝液を含むPCR試薬とともに、部分的な第2のラウンドのウェル特異的バーコード(BC2a又はBC2bのいずれか)対のうちの1つを含む2つのフォワードPCRプライマーをチューブに添加した。一方が部分的な第2のラウンドのバーコード配列BC2aを提供し、他方が部分的な第2のラウンドのバーコード配列BC2bを提供するように、2つのフォワードプライマーを添加した。したがって、それらを組み合わせて、一意の第2のラウンドのバーコードを定義する。第1のフォワードPCRプライマーは、TSOによって提供されるPCRハンドルにハイブリダイズすることができる配列、BC2a、及びIllumina RP2配列を含む。第2のフォワードPCRプライマーは、Illumina RP2配列、BC2b、及びP7配列を含む。したがって、
図12A、ステップFに示すように、これらのプライマーを合わせると、両方のプライマーに由来する配列を組み合わせて最終的に含むPCR生成物を生成する「ステップアウト」PCR反応が可能になる。
【0171】
PCRによるこの第2のバーコード付けステップの完了後、バーコード付き全長cDNAを磁気ビーズで精製した。Qubit及びBioanalyzer High sensitivity kit(
図13B)による定量後、cDNAを以下のように3つのチューブに等分した:
TCRa用チューブ1、
TCRb用チューブ2、及び
TCRa及びb用チューブ3。
【0172】
DNAポリメラーゼ、P7プライマー、dNTP、及びPCR緩衝液を含むPCR1混合物を3つのチューブの各々に添加した。次に、T細胞抗原受容体(TCR)アルファ鎖の定常領域に特異的にハイブリダイズするTCRa PCR1プライマーをチューブ1に加えた。T細胞抗原受容体(TCR)ベータ鎖の定常領域を特異的にハイブリダイズするTCRb PCR1プライマーをチューブ2に加え、TCRaとTCRb PCR1プライマーの両方をチューブ3に加えた。次いで、PCR1を40ulで実行した(
図13A)。上記のTCRa PCR1プライマー及びTCRb PCR1プライマーは両方とも、RNaseの非存在下でPCRプライマーとして機能することができるが、例えば、US2020-0332341A1として公開されている米国特許出願第16/603,788号(代理人整理番号CLON-169)(その開示は参照により本明細書に組み込まれる)に記載されているように、使用後に様々なRNase(例えば、RNaseH、RNaseAなど)で消化することによって不活性化することができるキメラDNA/RNAオリゴヌクレオチドである。
【0173】
PCR1に続いて、DNAポリメラーゼ;RNaseH;Illumina RP1配列、i5インデックス及びP5アダプタ配列を含むi5インデックスを有するP5インデックスプライマー;dNTP;並びにPCR緩衝液を含むPCR2混合物を、T細胞抗原受容体(TCR)アルファ鎖(チューブ1)の定常領域を特異的にハイブリダイズするTCRa PCR2プライマー、T細胞抗原受容体(TCR)ベータ鎖(チューブ2)の定常領域を特異的にハイブリダイズするTCRb PCR2プライマー、又はTCRa及びTCRb PCR2プライマー(チューブ3)の両方のいずれかとともに、3つのチューブの各々に添加した。TCRa及びb PCR2プライマーの各々はまた、RP1配列も含む。次いで、PCR2を70ulで実行した(
図13A)。
【0174】
PCR2の後、磁気ビーズによって、BC1、BC2a、BC2b(i7)及びTCR特異的インデックス(i5)の全ての3つのバーコード配列を有するTCRライブラリを精製し、Qubit、Bioanalyzer High sensitivity kit(
図13C)及びqPCRによって定量した。ライブラリをIllumina MiniSeqシーケンサーに装填して、ペアエンド配列決定(2×151PE)を行い、得られた配列決定データをCogent APソフトウェア(Takara Bio USA,Inc.、San Jose CA)で分析した。以下の表1に提供される配列決定結果の要約:
【表1】
【0175】
この結果は、この組み合わせバーコード付け戦略が機能することを示す。
【0176】
実施例8 組み合わされた標的化配列決定と5’差次的発現(5’DE)のための3ラウンドのバーコード付け
3ラウンドのバーコード付けを使用して標的化配列決定及び5’差異発現ライブラリを生成するためのプロトコルを
図14に示す。この実施例では、細胞は固定され、プレート(例えば、96ウェルプレート)のウェルにわたって分配される。逆転写酵素、RNase阻害剤、ポリ-dTオリゴ、第1のバーコード(BC1)及び第2の鎖合成のためのプライマー結合部位(第2のSSハンドル)を含む鋳型スイッチオリゴ(TSO)、dNTP、並びにRT緩衝液を含む逆転写混合物を各ウェルに加え、RT反応を実行する(
図14、ステップC)。この反応に使用されるTSOは、RNaseの非存在下で鋳型スイッチングオリゴとして機能するが、例えば、US2020-0332341A1として公開されている米国特許出願第16/603,788号(代理人整理番号CLON-169)(その開示は参照により本明細書に組み込まれる)に記載されているように、様々なRNase(例えば、RNaseH、RNaseAなど)での消化により使用後に不活性化することができるキメラDNA/RNAオリゴヌクレオチドである。次いで、BC1を含む各ウェルからの細胞をプールする(
図14、ステップD)。次いで、プールされた細胞を、新たなマルチウェルプレート又はナノウェルチップ内のウェルの第2のセットに再分配する(
図14、ステップE)。
【0177】
逆転写酵素;RNaseH;TSOプライマー結合配列にハイブリダイズする配列、BC2及びPCRハンドル配列を含む第2のSSオリゴ;dNTP;並びに第2のSS反応緩衝液を含む第2の鎖合成混合物(第2のSS)を各ウェルに添加する。次いで、第2のSS反応を実行する(
図14、ステップF)。次に、BC1及びBC2を含む第2のSS生成物を含む細胞をプールする(
図14、ステップG)。次いで、プールされた細胞を、新たなマルチウェルプレート又はナノウェルチップ内のウェルの第3のセットに再分配する(
図14、ステップH)。
【0178】
RTオリゴからのPCRハンドル配列にハイブリダイズする逆PCRプライマー、並びにDNAポリメラーゼ、dNTP及びPCR緩衝液を含有するPCR試薬とともに、部分的な第3のラウンドのウェル特異的バーコード(BC3a又はBC3bのいずれか)対のうちの1つを含む2つのフォワードPCRプライマーを各ウェルに添加する。一方が部分的な第3のラウンドのバーコード配列BC3aを提供し、他方が部分的な第3のラウンドのバーコード配列BC3bを提供するように、2つのフォワードプライマーを添加する。したがって、それらを組み合わせて、一意の第3のラウンドのバーコードを定義する。第1のフォワードPCRプライマーは、第2のバーコード付けラウンドからの第2の鎖合成プライマーによって提供されるPCRハンドルにハイブリダイズすることができる配列、BC3a、及びIllumina RP2配列を含む。第2のフォワードPCRプライマーは、Illumina RP2配列、BC3b、及びP7配列を含む。したがって、
図14、ステップIに示すように、これらのプライマーを合わせると、両方のプライマーに由来する配列を組み合わせて最終的に含むPCR生成物を生成する「ステップアウト」PCR反応が可能になる。
【0179】
PCRによるこの第3のバーコード付けステップの完了後、バーコード付き全長cDNAは、実施例6(5’DEについてはNextera(Illumina,Inc.、San Diego CA)を使用して)又は実施例7(TCR特異的ライブラリ生成のための2ラウンドPCR)のいずれかに記載されているプロセスと同様のプロセスを使用して、最終5’DE及び/若しくはTCR又は他の遺伝子特異的ライブラリに変換することができる。これのためのステップ及び生成された最終ライブラリの構造を
図15に示す。
図15パネルAは、(例えば、Nextera(Illumina,Inc.、San Diego CA)を用いて)タグメンテーションを使用して5’DEライブラリを生成するためのステップを示す。他の実施形態では、ヘアピンアダプタの組み合わされた断片化及びライゲーションは、SMART-Seq Library Prep Kit(カタログ番号634764、Takara Bio USA,Inc.San Jose CA)に記載されるように使用することができる。
図15パネルBは、第3のバーコード付けラウンド後にTCRライブラリを生成するためのステップを示す。
【0180】
実施例9 精製RNAを使用した、異なるインデックスを有する鋳型スイッチングオリゴ(TSO)の分析
異なる一意の8ntインデックスを有するTSOの性能を、逆転写(RT)反応において試験した。10ngの精製K562RNAを、4μlのRT緩衝液(250mMのTris、375mMのKCl、30mMのMgCl2)、1μlのランダム六量体、1μlのヌクレアーゼフリー水と混合し、85℃で6分間加熱することによって断片化し、次いで直ちに氷上で冷却した。4.5ulのTSO緩衝液、0.5ulのRNase Inhibitor、1ulの逆転写酵素(200u/ul)、8ntの第1の識別子(すなわち、第1のインデックス)を有する1ulのTSO(50μM)、及び6ulのRNaseフリー水を含有するRT Mastermixを、断片化されたRNAに添加した。96ウェルプレートの各ウェルは、一意の第1の識別子を有するTSOを含有した。RT反応を、25℃、10分、42℃、90分、次いで72℃、5分で実行した。RT反応後、25ulの2X CB緩衝液、1ulのDNAポリメラーゼ、1ulの5’PCRプライマー、及び1ulの3’PCRプライマーを含有するPCR Mastermixを添加して、以下のPCRプログラムでRT生成物を増幅した:94℃、1分;98℃、15秒、55℃、15秒、68℃、30秒の10サイクル;68℃、2分;4℃で保持。PCR生成物を磁気ビーズによって精製し、PCR生成物の濃度をQubitによって測定した。
【0181】
図16に示すように、8ntの第1の識別子を有する全ての試験されたTSOは、良好なライブラリ収率を生成した。TSOなしの場合、RT反応は、非常に低い収率を有した。この結果は、RTステップ中でのTSOを使用した第1の識別子の付加が、精製されたRNAを使用して成功したことを示す。
【0182】
第1の識別子の長さは、6~12ヌクレオチド(nt)の間で様々であり得る。RT緩衝液中のMg2+濃度は、2~12mMの間で様々であり得る。ランダムプライマーの長さは、6~15ntの間で様々であり得る。RT反応におけるTSO最終濃度は、0.5~5μMの間で様々であり得る。RT反応におけるランダムプライマー最終濃度は、0.5~5μMの間で様々であり得る。RNA断片化温度は、65℃~95℃の間で様々であり得、インキュベーション時間は、1~30分の間で様々であり得る。RT反応は、一定温度インキュベーションであってもよく、熱循環の有無にかかわらず温度勾配であってもよい。
【0183】
実施例10 単一細胞での組み合わせインデックス付けの分析
細胞又は核を適切な固定溶液(例えば、1~4%のパラホルムアルデヒド、グリオキサール、DSP、DST、メタノールなど)に固定した。固定細胞又は核を、マルチウェルデバイス(例えば、96ウェルプレート又は384ウェルプレート、ナノウェルICELL8チップなど)のウェルに等分した。細胞RNAを断片化し、次いで細胞透過処理試薬(例えば、0.01~0.5%のジギトニン、サポニン、Tween20、Triton X-100、NP40など)を含有する逆転写Mastermixを熱処理細胞に添加した。第1の識別子を、鋳型スイッチングオリゴ(TSO)を使用することによって、インサイチュでの逆転写(RT)反応中に付加し、鋳型スイッチングオリゴ(TSO)の各々が一意の第1の識別子を担持する。次いで、第1の識別子を有するcDNAを含有する細胞をプールし、次いで複数の区画(partition)(例えば、96ウェルプレート若しくは384ウェルプレート、又は5184ナノウェルICELL8チップ(Takara Bio USA,Inc.San Jose CA))に再度分割し、各第2の区画が異なる第1の識別子を有する複数の細胞を含有するようにした。次に、一意の第2の識別子を担持するプライマーを有するPCR Mastermixを各分画に加え、PCR反応を実施して、第2の識別子を最終ライブラリDNAに組み込んだ。必要に応じて、細胞は、追加のプール分割ラウンドを経ることができ、増幅又はライゲーションによってより多くの識別子を付加することができる。識別子付加ステップの複数のラウンドは、手動で、又はロボット液体ハンドラなどの自動化によって行った。各個々の細胞からの最終的なライブラリDNAは、識別子の一意の組み合わせを有する。次いで、rRNAをライブラリから枯渇させ、クリーンアップ及び定量後、ライブラリをシーケンサー(例えば、Miseq、NextSeq、Novaseqなど、全てIllumina Inc.、San Diego CAによって製造された)上で配列決定した。
【0184】
この実施例では、細胞(K562(ヒト):3T3(マウス)を1:1の比率で)を1%パラホルムアルデヒドで固定し、各ウェルがウェル当たり約2000個の細胞を含有するように、96ウェルプレートのウェルにわたって等分した。RNA断片化は、5μlの固定細胞を4μlのRT緩衝液(250mMのTris、375mMのKCl、30mMのMgCl2)及び12μMのランダム六量体1μlと混合し、次いで細胞を85℃で6分間加熱することによって実施した。次いで、細胞を直ちに氷上で冷却した。4.5ulのTSO緩衝液、1ulのジギトニン(0.2%)、0.5ulのRNase Inhibitor、1ulの逆転写酵素(200U/ul)、及び1ulのRNaseフリー水を含有するRT混合物を調製し、プレートの各ウェルに添加した。次いで、一意の第1の識別子を有する1ulのTSO(50uM)を96ウェルプレートの各ウェルに添加し、PATEを25℃で10分間、次いで42℃で90分間インキュベートすることによって、RT反応を実施した。RT反応が完了した後、96ウェルプレートの全てのウェルからの細胞を一緒にプールし、PBSで一度洗浄し、30ulの液体を残して細胞を再懸濁し、次いで、ICELL8機器(Takara Bio USA,Inc(San Jose CA)を使用してICELL8チップのナノウェルにわたって分配した。次いで、この実験で第2の識別子として使用されるi5、i7インデックス、及びPCR混合物(SeqAmp DNAポリメラーゼ及び2X CB緩衝液、いずれもTakara Bio USA,Inc.San Jose CAによって供給された)をICELL8チップに分配して、細胞と混合した。以下のプログラムでオンチップでPCRを実行した:94℃、1分;100℃、15秒、49.3℃、5秒、54.5℃、10秒、72.2℃、9秒、67.9℃、31秒の10サイクル;67.9℃、2分;4℃で保持。PCR反応後、ライブラリをプールし、磁気ビーズによってクリーンアップした。ビーズを、2.2μlの10X ZapR緩衝液、1.5μlのscZapR、1.5μlの加熱プローブ及び16.8μlのヌクレアーゼフリー水を含有するZapR混合物(Takara Bio USA,Inc.San Jose CA)で溶出し、ZapR反応を37℃で1時間及び72℃で10分間実施して、ライブラリからrRNAを除去した。ZapRが完了した後、以下のプログラムで、20ulのZapR生成物を収容する各チューブに80ulのPCR混合物(2ulのSeqAmp DNAポリメラーゼ、2ulのPCR2プライマー、50ulの2X CB緩衝液、及び26ulのヌクレアーゼフリー水)を添加することによって、第2のPCR反応を実行して、ライブラリを増幅した:94℃、1分;98℃、15秒、55℃、15秒、68℃、30秒の5サイクル;4℃で保持。第2のPCR反応の後、生成物を磁気ビーズによって精製し、Qubit、BioAnalyzer及びqPCRによって定量した。定量に基づいて、ライブラリDNAを4nMに希釈した。5ulの4nMのライブラリを、5ulの新たに作製した0.2NのNaOHと混合し、室温で5分間インキュベートした。次に、5μlの200mMのTris-HCl(pH7)を添加し、続いて985μlのHT緩衝液(Illumina Inc.San Diego CA)を添加した結果は、20pMの変性ライブラリであった。次いで、これを以下のように1.5pMに希釈した。変性ライブラリ溶液(97μl)及びPrechilled HT1(1203μl)を、配列決定のためにNextseqカートリッジ(Illumina Inc.San Diego CA)に装填した。
【0185】
表2に示すように、配列決定リードの93.4%が正常にバーコード付けされ、総リード数の6.6%のみが未決定であった。逆多重化されたリードを使用して「ニープロット」を作成し、識別することができるQCを合格する細胞の数を決定した。
図17に示すように、1133個の細胞が正常にバーコード付けされ、QC閾値に合格した(20,000リード/細胞)。これは、TSOによる鋳型スイッチングを使用して第1の識別子を付加すること、及びPCRを使用して第2の識別子を付加することによって、組み合わせインデックス付けが達成されたことを実証する。この場合、第2の識別子は、2a+2b、すなわちi5及びi7の形態であり、これらは各々、ICELLナノウェルチップの行又は列のいずれかを画定するが、組み合わせは、特定のウェルに対して一意である。組み込まれた第1及び第2の識別子の組み合わせは、固定細胞の元のプールからの各個々の単一細胞に対して一意である。Cogent NGS Analysis Pipeline(Takara Bio USA,Inc.San Jose CA)を用いて、配列決定リードを分析し、それらをヒト及びマウスゲノムの両方に対してマッピングした。マッピング結果を使用して「L-プロット」を作成し、これを使用して、個々に捕捉された細胞のパーセンテージ、並びに細胞ダブレットの存在を決定した。
図18に示されるように、L-プロットのx軸は、ヒトゲノムに対してマッピングされたリードを示し、y軸は、マウスゲノムに対してマッピングされたリードを示す。ヒト及びマウス細胞は、L-プロット上で十分に分離された。ダブレット比率は、使用されるインデックスの数及びアッセイされた細胞の総数に基づいて予想された予想比率10.5%に近い9.8%であると計算された。これは、組み合わせインデックス付けワークフロー中に細胞間クロストークが最小限であったこと、したがって、この方法を使用して単一細胞を個々に識別できることを実証する。表3に示すように、配列決定データは、良好なエクソン及びイントロン比率、並びに低い遺伝子間/ミトコンドリア/リボソーム比率を有する全体的に良好なマッピングメトリックを示した。5896個の遺伝子を、148,000リード/細胞の平均配列決定深度で検出した。これらのデータは、この例示的な実施形態に従って実施される本発明が、良好な性能でハイスループットで単一細胞の全RNA-seqを分析することができることを実証する。
【表2】
【表3】
【0186】
実施例11 高濃度のPFA及びジギトニンを有する単一細胞レベルでの組み合わせインデックス付けの分析
この実施例では、400万個の細胞(K562:3T3が1:1の比率で)を300gで3分間遠心分離した。ペレットを1mlの4%PFA中に再懸濁し、氷上で15分間インキュベートして、細胞固定した。次いで、500gで5分間の遠心分離によって細胞をペレット化した。細胞ペレットを、3mMのグリシン(pH7.5)1mlに再懸濁し、氷上で5分間インキュベートして、固定プロセスをクエンチした。細胞を500gで5分間遠心分離することによって再びペレット化して、グリシン溶液を除去し、次に、1%の第2の希釈剤及び1%のRNase阻害剤を含有するPBS中に再懸濁した。9μlの固定細胞を4μlのRT緩衝液(250mMのTris、375mMのKCl、30mMのMgCl2)と混合し、85℃で6分間インキュベートして、RNA断片化を行った。次に、1ulの1.4%ジギトニンを加熱した細胞に添加し、混合物を室温で5分間インキュベートして細胞透過処理した。最終的なジギトニン濃度は、0.1%であった。RT混合物(4.5ulのscTSO混合物、0.5ulのRNase阻害剤、1ulの逆転写酵素(200u/ul)、1ulの12uMランダムプライマー)を、透過処理細胞を含有する96ウェルプレートの各ウェルに添加し、プレートを42℃で90分間インキュベートしてRT反応させた。RT後、96ウェルプレートの全てのウェルからの細胞を一緒にプールし、0.04%BSAでPBSで一度洗浄し、25ulの液体を残して細胞を再懸濁し、次いでICELL8機器(Takara Bio USA,Inc.San Jose CA)を使用してICELL8チップのナノウェルに分配した。次いで、i5、i7インデックス及びPCR混合物(SeqAmp DNAポリメラーゼ及び2X CB緩衝液-両方ともTakara Bio USA,Inc.San Jose CA製)をICELL8チップに分配して、細胞と混合した。以下のプログラムでオンチップでPCRを実行した:72.1℃、3分;98.2℃、18秒;96.5℃、42秒;100℃、10秒、54.4℃、5秒、59.6℃、10秒、72.2℃、9秒、67.9℃、1分51秒の10サイクル;4℃で保持。PCR反応後、ライブラリをプールし、磁気ビーズを使用してクリーンアップした。ビーズを、2.2μlの10X ZapR緩衝液、1.5μlのscZapR、1.5μlの加熱プローブ混合物、及び16.8μlのヌクレアーゼフリー水を含有するZapR混合物(Takara Bio USA,Inc.San Jose CA)で溶出した。次いで、ZapR反応(Takara Bio USA Inc.San Jose CA)を37℃で1時間実施し、続いて72℃で10分間インキュベーションして、ライブラリからrRNAを除去した。ZapR反応が完了した後、以下のプログラムで、20ulのZapR生成物を収容する各チューブに80ulのPCR混合物(2ulのSeqAmp DNAポリメラーゼ、2ulのPCR2プライマー、50ulの2X CB緩衝液、及び26ulのヌクレアーゼフリー水)を添加することによって、第2のPCR反応を実行して、ライブラリを増幅した:94℃、1分;98℃、15秒、55℃、15秒、68℃、30秒の5サイクル;4℃で保持。PCR反応が完了した後、生成物を磁気ビーズによって精製し、Qubit、BioAnalyzer及びqPCRによって定量した。定量に基づいて、ライブラリDNAを4nMに希釈した。5ulの4nMのライブラリを、5ulの新たに作製した0.2NのNaOHと混合し、室温で5分間インキュベートした。次に、5μlの200mMのTris-HCl(pH7)を添加し、続いて985μlのHT緩衝液(Illumina Inc.San Diego CA)を添加した結果は、20pMの変性ライブラリであった。次いで、これを1.7pMに希釈し、配列決定のためにNextseqカートリッジIllumina Inc.、San Diego CA)に装填した。
【0187】
配列決定の後、Cogent NGS analysis Pipeline(Takara Bio USA,Inc.San Jose CA)を用いて、ヒト及びマウスゲノムの両方に対してマッピングされた配列決定リードを分析した。マッピング結果を使用して、L-プロットを作成した。
図19に示すように、x軸は、ヒトゲノムに対するリードマッピングを示し、y軸は、マウスゲノムに対するリードマッピングを示した。結果は、ヒト及びマウス細胞がL-プロット上で十分に分離されていたことを示した。ダブレット比率は5.8%であり、計算された予想比率5%に近かった。これは、4%PFA及び0.1%ジギトニンによる組み合わせインデックス付けワークフロー中に細胞-細胞クロストークが最小限であったことを証明した。
【0188】
実施例12 異なる細胞固定溶液の試験
この実施例では、K562細胞を使用して、異なる固定溶液を試験した。200万個の細胞を最初にPBSで洗浄し、次いで、1~5と標識した5本のチューブに分割した。各チューブ中の細胞を、200gで5分間の遠心分離によってペレット化した。各チューブ(1~5)において、細胞ペレットを、4%PFA、1%PFA、0.5%PFA、0.25%PFA、又はPBSのいずれか1つの0.5mL中に完全に再懸濁した。次いで細胞を氷上で10分間インキュベートした。次いで25μlの2%ジギトニンを各チューブの細胞に添加し、氷上で3分間インキュベートして細胞を透過処理した。透過処理後、2mLのクエンチ溶液(1MのTris-Cl(pH8)、1%RNase阻害剤、1%BSA)をチューブ1~4に加えて、細胞固定をクエンチした。2mLのPBS溶液(PBS、1%RNase阻害剤、1%BSA)を対照としてチューブ5に添加した。次いで、細胞を、4℃で10分間、200gでの遠心分離によってペレット化し、200μlの再懸濁液(PBS、1%のRNase阻害剤、1%の第2の希釈剤、Takara Bio USA Inc.San Jose CA)中に再懸濁した。各チューブ中の10μlの細胞を10μlのトリパンブルーと混合し、顕微鏡下でチェックした。表4に示すように、広範囲のPFA濃度(0.25%~4%)は、固定化及び細胞透過処理後に大きな細胞塊を形成することなく非常に良好な細胞回復を示した。細胞固定がなく、ジギトニン処理を用いた対照細胞は、単一細胞が非常に少ない明らかな大きな細胞塊を形成した。これは、広範囲のPFA濃度が単一細胞研究のための細胞固定に使用され得ることを示した。
【表4】
【0189】
実施例13 ジギトニンの滴定による異なる細胞透過処理条件の試験
この実施例では、K562細胞を使用して、異なる透過処理条件を試験した。200万個の細胞を、最初にPBSで洗浄し、次いで、5分間、200gでの遠心分離によってペレット化した。細胞ペレットを、固定のために0.5mLの1%PFAに完全に再懸濁した。次いで、細胞を氷上で10分間インキュベートした。次いで、2mLのクエンチ溶液(1MのTris-Cl(pH8)、1%のRNase阻害剤、1%のBSA)を添加し、細胞固定をクエンチした。次いで、細胞を、4℃で10分間、200gでの遠心分離によってペレット化し、200μlの再懸濁液(PBS、1%のRNase阻害剤、1%の第2の希釈剤、Takara Bio USA Inc.San Jose CA)中に再懸濁した。次いで、細胞をカウントし、200,000細胞/mLの濃度で再懸濁溶液中で希釈した。各チューブ中の10μlの細胞を10μlのトリパンブルー及び2つの異なる濃度の2μlのジギトニンと混合し、顕微鏡下でチェックした。表5に示されるように、ジギトニンを含まない細胞(試料ID3)は、トリパンブルーによってほとんど青く染色されず、1%のPFAによって固定された細胞膜が、ジギトニンを添加しなかった場合に透過性ではなかったことを示している。ジギトニン(0.1%又は0.01%)を添加すると、細胞は全てトリパンブルー(試料ID1及び2)によって青く染色され、広範な濃度のジギトニンにより細胞膜が透過性になったことを示している。
【表5】
【0190】
上記の発明は、明確な理解のために例示及び例によって多少詳しく説明されてきたが、当業者であれば、本発明の教示に照らして、添付の特許請求の範囲の趣旨又は範囲から逸脱することなく、それらの発明に対して特定の変更及び修正が行われ得ることは、容易に明らかである。
【0191】
したがって、上記は単に本発明の原理を例示するにすぎない。当業者は、本明細書に明示的に記載又は示されていないが、本発明の原理を具現化し、その精神及び範囲内に含まれる様々な配置を考案することができることが理解されるであろう。更に、本明細書に列挙された全ての例及び条件的文言は、主として本発明の原理及び発明者らにより当該技術の促進のために寄与された概念を理解する上で読者を助けることを意図しており、このように具体的に列挙された例及び条件への限定ではないと解釈されるべきである。更に、本発明の原理、態様、及び実施形態を記載する、本明細書の全ての記述、並びにそれらの具体例は、それらの構造的及び機能的等価物の両方を包含することが意図されている。更に、そのような同等物は、現在既知の同等物及び将来開発される同等物の両方、すなわち、構造に関係なく、同じ機能を実施する開発される任意の要素を含むことが意図される。したがって、本発明の範囲は、本明細書に図示及び記載の例示的な実施形態に限定されることを意図していない。むしろ、本発明の範囲及び趣旨は、添付の特許請求の範囲によって具現化される。
【0192】
関連出願の相互参照
米国特許法第119条(e)に従って、本出願は、2021年12月23日に出願された米国仮特許出願第63/293,589号の出願日への優先権を主張し、その出願の開示は参照により本明細書に組み込まれる。
【配列表】
【手続補正書】
【提出日】2024-06-24
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップb)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)第1の識別子及び第2の識別子の両方を含む、前記第2のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第2のセットの各サブ部分の前記第2の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む、方法。
【請求項2】
前記細胞源が、細胞である、請求項1に記載の方法。
【請求項3】
前記細胞源が、核である、請求項1に記載の方法。
【請求項4】
前記細胞源が、透過処理される、請求項
1に記載の方法。
【請求項5】
前記サブ部分の第1のセットが、2~25,000のサブ部分を含む、
請求項1に記載の方法。
【請求項6】
前記鋳型スイッチオリゴヌクレオチドが、一意の分子識別子を更に含む、
請求項1に記載の方法。
【請求項7】
前記鋳型スイッチング媒介反応が、リボ核酸鋳型を用いる、
請求項1に記載の方法。
【請求項8】
前記リボ核酸鋳型が、mRNAである、請求項7に記載の方法。
【請求項9】
前記鋳型スイッチング
媒介反応が、オリゴdTプライマー、ランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項8に記載の方法。
【請求項10】
前記鋳型スイッチング媒介反応が、デオキシリボ核酸を用いる、請求項
1に記載の方法。
【請求項11】
前記鋳型スイッチング
媒介反応が、ランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項10に記載の方法。
【請求項12】
前記サブ部分の第2のセットが、2~25,000のサブ部分を含む、
請求項1に記載の方法。
【請求項13】
前記第2の識別子が、第1及び第2のサブ識別子を含む、
請求項1に記載の方法。
【請求項14】
前記第2の識別子が、第2の鎖合成反応に組み込まれる、
請求項1に記載の方法。
【請求項15】
前記細胞源識別可能な核酸が、増幅媒介反応を使用して産生される、
請求項1に記載の方法。
【請求項16】
前記細胞源識別可能な核酸が、ライゲーション媒介反応を使用して産生される、
請求項1に記載の方法。
【請求項17】
前記細胞源識別可能な核酸が、タグメンテーション媒介反応を使用して産生される、
請求項1に記載の方法。
【請求項18】
前記方法が、前記サブ部分の第2のセットの前記複数の細胞源を溶解することを更に含む、
請求項1に記載の方法。
【請求項19】
前記方法が、少なくとも1つの更なる識別子を組み込む核酸を産生するための少なくとも1つの追加のプール/分割ステップを更に含む、
請求項1に記載の方法。
【請求項20】
前記方法が、前記複数の細胞源識別可能な核酸コレクションを配列決定することを更に含む、
請求項1に記載の方法。
【請求項21】
前記配列決定することが、次世代配列決定を含む、請求項20に記載の方法。
【請求項22】
前記方法が、少なくとも細胞源識別可能な核酸コレクションの核酸の前記第1及び第2の識別子に基づいて、細胞源を前記核酸コレクションに割り当てることを更に含む、
請求項1に記載の方法。
【請求項23】
前記細胞源が、免疫細胞源である、
請求項1に記載の方法。
【請求項24】
前記免疫細胞源が、T細胞又はその核である、請求項23に記載の方法。
【請求項25】
前記免疫細胞源が、B細胞又はその核である、請求項23に記載の方法。
【請求項26】
前記第1及び第2のセットにおけるサブ部分の数が、同一である、
請求項1に記載の方法。
【請求項27】
前記第1及び第2のセットにおけるサブ部分の数が、異なる、請求項
1に記載の方法。
【請求項28】
前記第2のセットにおけるサブ部分の数が、前記第1のセットにおけるサブ部分の数を超える、請求項27に記載の方法。
【請求項29】
キットであって、
共通の第1の識別子を含む鋳型スイッチオリゴヌクレオチドを各々が含む、複数の別個の鋳型スイッチオリゴヌクレオチド組成物であって、異なる鋳型スイッチオリゴヌクレオチド組成物の鋳型スイッチオリゴヌクレオチドの第1の識別子が異なる、複数の別個の鋳型スイッチオリゴヌクレオチド組成物と、
複数の別個の第2の識別子核酸と、を含む、キット。
【請求項30】
前記複数の別個の鋳型スイッチオリゴヌクレオチド組成物が、別個の容器内に存在する、請求項29に記載のキット。
【請求項31】
前記別個の容器が、マルチウェルプレートのウェルである、請求項30に記載のキット。
【請求項32】
所与の鋳型スイッチオリゴヌクレオチド組成物の各鋳型スイッチオリゴヌクレオチドが、異なる一意の分子識別ドメインを更に含む、請求項2
9に記載のキット。
【請求項33】
前記複数の別個の第2の識別子核酸が、別個の容器内に存在する、請求項2
9に記載のキット。
【請求項34】
前記別個の容器が、マルチウェルプレートのウェルである、請求項33に記載のキット。
【請求項35】
前記第2の識別子核酸が、プライマーである、請求項2
9に記載のキット。
【請求項36】
前記第2の識別子核酸が、アダプタである、請求項2
9に記載のキット。
【請求項37】
前記キットが、逆転写酵素を更に含む、請求項2
9に記載のキット。
【請求項38】
前記キットが、ポリメラーゼを更に含む、請求項2
9に記載のキット。
【請求項39】
前記キットが、リガーゼを更に含む、請求項2
9に記載のキット。
【請求項40】
前記キットが、トランスポザーゼを更に含む、請求項2
9に記載のキット。
【請求項41】
前記キットが、緩衝液を更に含む、請求項2
9に記載のキット。
【請求項42】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップ(b)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、前記第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)前記第2のセットの各サブ部分の前記複数の細胞源において、第2の識別子タグ付き核酸を生成することであって、前記第2のセットの異なるサブ部分における第2の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分の各々の間では異なる、生成することと、
(f)ステップ(e)で産生された前記サブ部分の前記細胞源をプールして、第1及び第2の識別子タグ付き核酸を含む第2の細胞源プールを生成することと、
(g)前記第2の細胞源プールを、前記第1及び第2の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第3のセットに配分することと、
(h)第1の識別子、第2の識別子及び第3の識別子を含む、サブ部分の前記第3のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第3のセットの各サブ部分の前記第3の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1、第2及び第3の識別子の一意の組み合わせを含む、方法。
【請求項43】
ステップ(e)が、前記第2の識別子を付加するために第2の鎖合成反応を使用して実行される、請求項42に記載の方法。
【手続補正書】
【提出日】2024-12-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップb)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)第1の識別子及び第2の識別子の両方を含む、前記第2のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第2のセットの各サブ部分の前記第2の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1及び第2の識別子の一意の組み合わせを含む、方法。
【請求項2】
前記細胞源が、細胞
又は核である、請求項1に記載の方法。
【請求項3】
(i)前記細胞源が、透過処理され
、
(ii)前記サブ部分の第1のセットが、2~25,000のサブ部分を含み、及び/又は、
(iii)前記鋳型スイッチオリゴヌクレオチドが、一意の分子識別子を更に含む、請求項1
又は2に記載の方法。
【請求項4】
前記鋳型スイッチング媒介反応が、リボ核酸鋳型を用い
、
任意選択的に、前記リボ核酸鋳型がmRNAであり、
さらに任意選択的に、前記リボ核酸鋳型がmRNAであり、前記鋳型スイッチング媒介反応が、オリゴdTプライマー、ランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項1
又は2に記載の方法。
【請求項5】
前記鋳型スイッチング媒介反応が、デオキシリボ核酸を用い
、任意選択的に、前記鋳型スイッチング媒介反応がランダムプライマー、準ランダムプライマー、又は遺伝子特異的プライマーを用いる、請求項1
又は2に記載の方法。
【請求項6】
(i)前記サブ部分の第2のセットが、2~25,000のサブ部分を含
み、
(ii)前記第2の識別子が、第1及び第2のサブ識別子を含み、
(iii)前記第2の識別子が、第2の鎖合成反応に組み込まれ、
(iv)前記細胞源識別可能な核酸が、増幅媒介反応を使用して産生され、
(v)前記細胞源識別可能な核酸が、ライゲーション媒介反応を使用して産生され、及び/又は、
(vi)前記細胞源識別可能な核酸が、タグメンテーション媒介反応を使用して産生される、請求項1
又は2に記載の方法。
【請求項7】
前記方法が、
(i)前記サブ部分の第2のセットの前記複数の細胞源を溶解すること
、
(ii)少なくとも1つの更なる識別子を組み込む核酸を産生するための少なくとも1つの追加のプール/分割ステップ、
(iii)前記複数の細胞源識別可能な核酸コレクションを配列決定することであって、任意選択的に、前記配列決定することが次世代配列決定を含む、配列決定すること、及び/又は、
(iv)少なくとも細胞源識別可能な核酸コレクションの核酸の前記第1及び第2の識別子に基づいて、細胞源を前記核酸コレクションに割り当てること
を更に含む、請求項1
又は2に記載の方法。
【請求項8】
前記細胞源が、免疫細胞源であ
り、任意選択的に、
(i)前記免疫細胞源が、T細胞又はその核であり、又は、
(ii)前記免疫細胞源が、B細胞又はその核である、
請求項1
又は2に記載の方法。
【請求項9】
前記第1及び第2のセットにおけるサブ部分の数が、同一である、請求項1
又は2に記載の方法。
【請求項10】
前記第1及び第2のセットにおけるサブ部分の数
が異な
り、任意選択的に、前記第2のセットにおけるサブ部分の数が前記第1のセットにおけるサブ部分の数を超える、請求項1
又は2に記載の方法。
【請求項11】
キットであって、
共通の第1の識別子を含む鋳型スイッチオリゴヌクレオチドを各々が含む、複数の別個の鋳型スイッチオリゴヌクレオチド組成物であって、異なる鋳型スイッチオリゴヌクレオチド組成物の鋳型スイッチオリゴヌクレオチドの第1の識別子が異なる、複数の別個の鋳型スイッチオリゴヌクレオチド組成物と、
複数の別個の第2の識別子核酸と、
を含
み、
任意選択的に、前記複数の別個の鋳型スイッチオリゴヌクレオチド組成物が別個の容器内に存在し、
さらに任意選択的に、前記複数の別個の鋳型スイッチオリゴヌクレオチド組成物が別個の容器内に存在し、前記別個の容器がマルチウェルプレートのウェルである、キット。
【請求項12】
(i)所与の鋳型スイッチオリゴヌクレオチド組成物の各鋳型スイッチオリゴヌクレオチドが、異なる一意の分子識別ドメインを更に含
み、
(ii)前記複数の別個の第2の識別子核酸が別個の容器内に存在し、任意選択的に、前記別個の容器がマルチウェルプレートのウェルであり、
(iii)前記第2の識別子核酸が、プライマーであり、及び/又は、
(iv)前記第2の識別子核酸が、アダプタである、請求項
11に記載のキット。
【請求項13】
前記キットが、
(i)逆転写酵素
、
(ii)ポリメラーゼ、
(iii)リガーゼ、
(iv)トランスポザーゼ、及び/又は、
(v)緩衝液
を更に含む、請求項
11又は12に記載のキット。
【請求項14】
初期の複数の細胞源に由来する複数の細胞源識別可能な核酸コレクションを調製する方法であって、前記方法が、
(a)細胞源サブ部分の第1のセットを提供することであって、各サブ部分が、前記初期の複数の細胞源のうちの複数の細胞源を含む、提供することと、
(b)第1の識別子を含む鋳型スイッチオリゴヌクレオチドを用いる鋳型スイッチング媒介反応を使用して、前記第1のセットの各サブ部分の前記複数の細胞源において第1の識別子タグ付き核酸を生成することであって、前記第1のセットの異なるサブ部分において用いられる前記鋳型スイッチオリゴヌクレオチドの前記第1の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分間では異なる、生成することと、
(c)ステップ(b)で産生された前記サブ部分の前記細胞源をプールして、第1の識別子タグ付き核酸を含む第1の細胞源プールを生成することと、
(d)前記第1の細胞源プールを、前記第1の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第2のセットに配分することと、
(e)前記第2のセットの各サブ部分の前記複数の細胞源において、第2の識別子タグ付き核酸を生成することであって、前記第2のセットの異なるサブ部分における第2の識別子が、所与のサブ部分内では同一であるが、前記異なるサブ部分の各々の間では異なる、生成することと、
(f)ステップ(e)で産生された前記サブ部分の前記細胞源をプールして、第1及び第2の識別子タグ付き核酸を含む第2の細胞源プールを生成することと、
(g)前記第2の細胞源プールを、前記第1及び第2の識別子タグ付き核酸を含む複数の細胞源を各々が含むサブ部分の第3のセットに配分することと、
(h)第1の識別子、第2の識別子及び第3の識別子を含む、サブ部分の前記第3のセットの各サブ部分における前記複数の細胞源から細胞源識別可能な核酸を産生することであって、前記第3のセットの各サブ部分の前記第3の識別子が、所与のサブ部分内では同一であるが、異なるサブ部分間では異なる、産生することと、を含み、
それによって、前記初期の複数の細胞源からの複数の細胞源識別可能な核酸コレクションを調製し、各細胞源識別可能な核酸コレクションの核酸が、前記核酸の前記細胞源を識別する第1、第2及び第3の識別子の一意の組み合わせを含む、方法。
【請求項15】
ステップ(e)が、前記第2の識別子を付加するために第2の鎖合成反応を使用して実行される、請求項
14に記載の方法。
【国際調査報告】