IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オクタント,インク.の特許一覧

特表2024-546168レポータースクリーニングアッセイ用の品質管理
<>
  • 特表-レポータースクリーニングアッセイ用の品質管理 図1
  • 特表-レポータースクリーニングアッセイ用の品質管理 図2
  • 特表-レポータースクリーニングアッセイ用の品質管理 図3
  • 特表-レポータースクリーニングアッセイ用の品質管理 図4
  • 特表-レポータースクリーニングアッセイ用の品質管理 図5
  • 特表-レポータースクリーニングアッセイ用の品質管理 図6
  • 特表-レポータースクリーニングアッセイ用の品質管理 図7
  • 特表-レポータースクリーニングアッセイ用の品質管理 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-17
(54)【発明の名称】レポータースクリーニングアッセイ用の品質管理
(51)【国際特許分類】
   C12Q 1/02 20060101AFI20241210BHJP
   C12Q 1/6806 20180101ALI20241210BHJP
   C12Q 1/6844 20180101ALI20241210BHJP
   C12Q 1/6869 20180101ALI20241210BHJP
   C12N 15/09 20060101ALN20241210BHJP
【FI】
C12Q1/02
C12Q1/6806 Z
C12Q1/6844 Z
C12Q1/6869 Z
C12N15/09 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024537422
(86)(22)【出願日】2022-12-20
(85)【翻訳文提出日】2024-08-19
(86)【国際出願番号】 US2022053472
(87)【国際公開番号】W WO2023122068
(87)【国際公開日】2023-06-29
(31)【優先権主張番号】63/292,841
(32)【優先日】2021-12-22
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.UNIX
(71)【出願人】
【識別番号】521229005
【氏名又は名称】オクタント,インク.
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】バーガー,カーター
(72)【発明者】
【氏名】コスリ,スリラム
(72)【発明者】
【氏名】シンプキンス,スコット
(72)【発明者】
【氏名】タン,ジェフリー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ01
4B063QQ42
4B063QQ52
4B063QR32
4B063QR56
4B063QR62
4B063QS25
4B063QS36
(57)【要約】
【解決手段】本明細書では、対照核酸を用いて試料損失、混入、および最適ではないプロセス工程を検出して診断する、ハイスループットスクリーニングシステム用の品質保証の方法が記載される。
【選択図】図6
【特許請求の範囲】
【請求項1】
ハイスループットスクリーニングシステム用の品質保証の方法であって、
(a)複数の細胞を含む第1の組成物を提供する工程と、
(b)前記複数の細胞を溶解して溶解細胞組成物を得る工程であって、前記溶解細胞組成物は、第1の複数の対照核酸、第2の複数の対照核酸、または第1の複数の対照核酸および第2の複数の対照核酸を含む、工程と、
(c)前記溶解細胞組成物の少なくとも一部、ならびに、第3の複数の対照核酸、第4の複数の対照核酸、または第3の複数の対照核酸および第4の複数の対照核酸を含む逆転写反応物を調製する工程と、
(d)前記逆転写反応物を逆転写して逆転写核酸を得、任意選択で、前記逆転写核酸を増幅する工程と、
(e)前記逆転写核酸を含むシーケンシングライブラリーを調製する工程と、
(f)前記シーケンシングライブラリーに対して配列決定反応を行い、(i)複数のレポーター、および(ii)前記第1の複数の対照核酸、前記第2の複数の対照核酸、前記第3の複数の対照核酸、または前記第4の複数の対照核酸のうちの1つ以上に関する配列情報を得る工程と
を含む、方法。
【請求項2】
前記溶解細胞組成物をDNA分解剤に接触させる工程をさらに含む、請求項1に記載の方法。
【請求項3】
前記溶解細胞組成物を前記DNA分解剤に接触させる前に、前記溶解細胞組成物を第5の複数の対照核酸に接触させる工程をさらに含む、請求項2に記載の方法。
【請求項4】
前記複数の細胞を検査薬に接触させる工程をさらに含む、請求項1に記載の方法。
【請求項5】
前記複数の細胞を前記検査薬に接触させる工程は、工程(b)の前である、請求項4に記載の方法。
【請求項6】
前記複数のレポーターに関する前記配列情報は、前記複数のレポーターのうちの少なくとも1つのレポーターに関するmRNA発現レベルの情報を提供する、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記少なくとも1つのレポーターは、バーコード配列を含む、請求項6に記載の方法。
【請求項8】
前記バーコード配列は、プロモーターエレメントおよび/またはエンハンサーエレメントに作動可能に連結される、請求項7に記載の方法。
【請求項9】
前記シーケンシングライブラリーに対して配列決定反応を行い、(i)複数のレポーター、ならびに(ii)前記第1の複数の対照核酸、前記第2の複数の対照核酸、および前記第4の複数の対照核酸に関する配列情報を得る工程を含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記第1の複数の対照核酸は、RNA核酸を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記第1の複数の対照核酸は、前記複数の細胞を溶解する前に前記複数の細胞に添加される、請求項10に記載の方法。
【請求項12】
前記第1の複数の対照核酸は、互いに区別可能な第1のヌクレオチド配列、第2のヌクレオチド配列、第3のヌクレオチド配列、および/または第4のヌクレオチド配列を含む、請求項10または11に記載の方法。
【請求項13】
前記複数のレポーターのうちの少なくとも1つのレポーターに関する配列情報を、前記第1の複数の対照核酸に基づいて正規化する工程をさらに含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記第2の複数の対照核酸は、二本鎖DNA核酸を含む、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記第3の複数の対照核酸は、RNA核酸を含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記逆転写核酸内における前記第2の複数の対照核酸の相対的存在量を判定する工程をさらに含む、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記第4の複数の対照核酸は、一本鎖DNA核酸を含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
前記複数のレポーター、前記第1の複数の対照核酸、前記第2の複数の対照核酸、および前記第4の複数の対照核酸の配列ではない対照配列を判定する工程をさらに含む、請求項1~17のいずれか一項に記載の方法。
【請求項19】
前記複数のレポーターは、少なくとも10個のレポーター、少なくとも100個のレポーター、少なくとも1,000個のレポーター、少なくとも5,000個のレポーター、少なくとも10,000個のレポーターを含む、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記少なくとも10個のレポーター、前記少なくとも100個のレポーター、前記少なくとも1,000個のレポーター、前記少なくとも5,000個のレポーター、前記少なくとも10,000個のレポーターはそれぞれ、固有のバーコード配列を含む、請求項19に記載の方法。
【請求項21】
前記少なくとも10個のレポーター、前記少なくとも100個のレポーター、前記少なくとも1,000個のレポーター、前記少なくとも5,000個のレポーター、前記少なくとも10,000個のレポーターはそれぞれ、標的分子を固有に特定する、請求項19または20に記載の方法。
【請求項22】
前記標的分子は、前記複数の細胞によって核酸から発現されるポリペプチドである、請求項21に記載の方法。
【請求項23】
前記第1の複数の対照核酸、前記第2の複数の対照核酸、前記第3の複数の対照核酸、前記第4の複数の対照核酸、または第5の複数の対照核酸のうちのいずれかの核酸のヌクレオチド配列を、後続の実験実行のために変更する工程を含む、請求項1~22のいずれか一項に記載の方法。
【請求項24】
前記配列決定反応は、ハイスループットシーケンシング反応である、請求項1~23のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2021年12月22日出願の米国仮特許出願第63/292,841号の利益を主張し、当該文献の全体は、引用によって本明細書に組み込まれる。
【背景技術】
【0002】
ハイスループットスクリーニング(HTS)には、ある特定の条件下で最適に機能しない可能性がある複数の工程が含まれている場合がある。液体処理時の不備、最適ではない溶解工程、最適ではない酵素反応(DNase消化、逆転写、増幅、および配列決定を含む)、および混入により非効率がもたらされる場合がある。本明細書では、ハイスループットスクリーニングプロセス全体での非効率を管理するための方法およびプロセス工程が記載される。
【発明の概要】
【0003】
ハイスループットスクリーニング(HTS)は、細胞の生物学について多くを明らかにし、新たな治療分子の開発を加速させる可能性を有している。しかしながら、エンドツーエンドプロセスとしてのHTSには不確かさが伴い、その理由としては、最も有用なアッセイ(例えば、複数の直交読み出し(orthogonal readout)を展開するもの)に、試料処理やデータ獲得中に変動やデータ損失がもたらされるからである。本明細書に記載される方法は、研究者が、より信頼性が高いデータを生成して信頼性に疑問のあるデータを除外することができるようにする。
【0004】
本明細書では、ハイスループットスクリーニングアッセイのデータ出力を改善する方法が記載される。本方法は、読み出しとして次世代シーケンシングを用いるアッセイに最も有用であるが、これは、そのようなアッセイが、変動、混入、および/またはデータ損失の複数の原因をもたらす可能性がある複数の工程を有しているからである。本明細書に記載される方法は、様々な工程においてエンドツーエンドプロセスに添加される対照核酸を使用する工程を含み、研究者が、信頼性のないデータを特定して除外することができるようにする。
【0005】
本明細書には、ハイスループットスクリーニングシステム用の品質保証の方法が記載され、該方法は、(a)複数の細胞を含む第1の組成物を提供する工程と、(b)複数の細胞を溶解して溶解細胞組成物を得る工程であって、溶解細胞組成物は、第1の複数の対照核酸、および第2の複数の対照核酸、または第1の複数の対照核酸および第2の複数の対照核酸を含む、工程と、(c)溶解細胞組成物の少なくとも一部、ならびに、第3の複数の対照核酸、第4の複数の対照核酸、または第3の複数の対照核酸および第4の複数の対照核酸を含む逆転写反応物を調製する工程と、(d)逆転写反応物を逆転写して逆転写核酸を得る工程と、(e)逆転写核酸を含むシーケンシングライブラリーを調製する工程と、(f)シーケンシングライブラリーに対して配列決定反応を行い、(i)複数のレポーター、および(ii)第1の複数の対照核酸、第2の複数の対照核酸、第3の複数の対照核酸、または第4の複数の対照核酸のうちの1つ以上に関する配列情報を得る工程とを含む。ある特定の実施形態では、本方法は、溶解細胞組成物をDNA分解剤に接触させる工程をさらに含む。ある特定の実施形態では、本方法は、溶解細胞組成物をDNA分解剤に接触させる前に、溶解細胞組成物を第5の複数の対照核酸に接触させる工程をさらに含む。ある特定の実施形態では、本方法は、複数の細胞を検査薬に接触させる工程をさらに含む。ある特定の実施形態では、複数の細胞を検査薬に接触させる工程は、工程(b)の前である。ある特定の実施形態では、複数のレポーターに関する配列決定情報は、複数のレポーターのうちの少なくとも1つのレポーターに関するmRNA発現レベルの情報を提供する。ある特定の実施形態では、少なくとも1つのレポーターは、バーコード配列を含む。ある特定の実施形態では、バーコード配列は、プロモーターエレメントおよび/またはエンハンサーエレメントに作動可能に連結される。ある特定の実施形態では、本方法は、シーケンシングライブラリーに対して配列決定反応を行い、(i)複数のレポーター、ならびに(ii)第1の複数の対照核酸、第2の複数の対照核酸、および第4の複数の対照核酸に関する配列決定情報を得る工程をさらに含む。ある特定の実施形態では、第1の複数の対照核酸は、RNA核酸を含む。ある特定の実施形態では、第1の複数の対照核酸は、溶解前に複数の細胞に添加される。ある特定の実施形態では、第1の複数の対照核酸は、互いに区別可能な第1のヌクレオチド配列、第2のヌクレオチド配列、第3のヌクレオチド配列、および/または第4のヌクレオチド配列を含む。ある特定の実施形態では、本方法は、複数のレポーターのうちの少なくとも1つのレポーターに関する配列情報を、第1の複数の対照核酸に対して正規化する工程をさらに含む。ある特定の実施形態では、第2の複数の対照核酸は、二本鎖DNA核酸を含む。ある特定の実施形態では、第3の複数の対照核酸は、RNA核酸を含む。ある特定の実施形態では、本方法は、逆転写核酸内における第2の複数の対照核酸の相対的存在量を判定する工程をさらに含む。ある特定の実施形態では、第4の複数の対照核酸は、一本鎖DNA核酸を含む。ある特定の実施形態では、本方法は、複数のレポーター、第1の複数の対照核酸、第2の複数の対照核酸、および第4の複数の対照核酸の配列ではない対照配列を判定する工程をさらに含む。ある特定の実施形態では、複数のレポーターは、少なくとも10個のレポーター、少なくとも100個のレポーター、少なくとも1,000個のレポーター、少なくとも5,000個のレポーター、少なくとも10,000個のレポーターを含む。ある特定の実施形態では、少なくとも10個のレポーター、少なくとも100個のレポーター、少なくとも1,000個のレポーター、少なくとも5,000個のレポーター、少なくとも10,000個のレポーターはそれぞれ、固有のバーコード配列を含む。ある特定の実施形態では、少なくとも10個のレポーター、少なくとも100個のレポーター、少なくとも1,000個のレポーター、少なくとも5,000個のレポーター、少なくとも10,000個のレポーターはそれぞれ、標的分子を固有に特定する。ある特定の実施形態では、標的分子は、複数の細胞によって発現されるポリペプチドである。ある特定の実施形態では、配列決定反応は、ハイスループットシーケンシング反応である。
【図面の簡単な説明】
【0006】
本明細書で説明される新規な特徴は、添付の特許請求の範囲に具体的に示されている。本明細書で説明される特徴の原理が用いられている例示的な例が示されている以下の詳細な説明と添付の図面を参照することによって、本明細書で説明される特徴とその特徴の利点についてのよりよい理解が得られるであろう。
【0007】
図1】HTSアッセイからの例示的な次世代シーケンシング読み取り出力を示す。点線より下のリード数を有するウェルは棄却した。
図2】棄却したウェルのプレートマップを、本明細書に記載される品質管理基準を使用して生成して示す。
図3】DNAseで処理する前後の試料の二本鎖DNA対照スパイクインのリードカウントを示す。
図4】逆転写で処理する前後の試料の一本鎖DNA対照スパイクインのリードカウントを示す。
図5】1つ以上の工程を行った後の様々な複数の対照核酸のリードカウントを示す。
図6】様々な複数の核酸スパイクを添加した例示的なプロセスを示す。
図7】様々な複数の核酸のリードカウントを示す。
図8】様々なアッセイおよびアッセイ内の工程に関して工程性能および信頼性のあるデータを分析するための関連比率を示す。
【発明を実施するための形態】
【0008】
以下の説明では、様々な実施形態を完全に理解できるように、ある特定の詳細が示されている。しかし、当業者であれば、これらの詳細なしに、提供される実施形態が実践されてもよいことを理解するであろう。文脈上特に必要としない限り、本明細書と後述する特許請求の範囲全体にわたり、「含む(comprise)」という語およびその変形(「含む(comprises)」および「含むこと(comprising)」など)は、開放的で包括的な意味、つまり、「含むが、限定されない(including,but not limited)」として解釈されるものとする。明細書と添付の特許請求の範囲において使用される場合、単数形「a」、「an」、および「the」は、その内容が他に明確に指示していない限り、複数の指示対象を含む。「または」という用語は概して、その内容が他に明確に指示していない限り、「および/または」を含む意味で用いられていることにも留意されたい。さらに、本明細書に提供される見出しは、便宜上のものであり、請求される実施形態の範囲や意味の解釈を行うものではない。
【0009】
本明細書で使用される場合、「約」という用語は、示される量の10%以下付近の量を指す。
【0010】
「ポリペプチド」および「タンパク質」という用語は、アミノ酸残基のポリマーを指すように互換可能に使用され、最小長に限定されるものではない。提供される標的ポリペプチド、例えば、リンカーおよび結合ペプチドを含むポリペプチドは、天然アミノ酸残基および/または非天然アミノ酸残基を含むアミノ酸残基を含んでもよい。この用語はまた、例えば、グリコシル化、シアリル化、アセチル化、リン酸化など、ポリペプチドの発現後修飾を含む。いくつかの態様では、ポリペプチドは、タンパク質が所望の活性を維持する限り、生来または天然の配列に対する修飾を含んでもよい。これらの修飾は、部位特異的突然変異導入によるもののように意図的であってよく、あるいはタンパク質を産生する宿主の突然変異またはPCR増幅による不備によるもののように偶発的であってもよい。
【0011】
基準ポリペプチド配列に関する配列同一性パーセント(%)は、配列をアライメントし、最大の配列同一性パーセントが得られるように必要に応じてギャップを導入した後に、基準ポリペプチド配列中のアミノ酸残基と同一である候補配列中のアミノ酸残基の割合であり、いかなる保存的置換も配列同一性の一部と見なさない。アミノ酸配列同一性パーセントを判定する目的のアライメントは、公知の様々な手段、例えば、BLAST、BLAST-2、ALIGN、またはMegalign(DNASTAR)ソフトウェアといった公的に入手可能なコンピュータソフトウェアを使用して、達成することができる。比較される配列の全長にわたって最大のアライメントを達成するのに必要なアルゴリズムを含む、配列をアライメントするのに適切なパラメータを判定することができる。しかしながら、本明細書における目的のためには、%アミノ酸配列同一性の値は、配列比較コンピュータプログラムALIGN-2を使用して生成される。ALIGN-2配列比較コンピュータプログラムは、ジェネンテック社によって著作され、ソースコードは米国著作権庁、ワシントンD.C.,20559に使用者用書類とともに提出され、米国著作権登録番号TXU510087で登録されている。ALIGN-2プログラムは、ジェネンテック社(カリフォルニア州、南サンフランシスコ)から公的に入手可能であり、あるいはそのソースコードからコンパイルしてもよい。ALIGN-2プログラムは、デジタルUNIXのV4.0Dを含むUNIXオペレーティングシステムでの使用のためにコンパイルされる。すべての配列比較パラメータは、ALIGN-2プログラムによって設定され、変動しない。
【0012】
アミノ酸配列比較にALIGN-2が用いられる状況では、所与のアミノ酸配列Aの、所与のアミノ酸配列Bへの、それとの、またはそれに対する%アミノ酸配列同一性(代わりに、所与のアミノ酸配列Bへの、それとの、またはそれに対するある特定の%アミノ酸配列同一性を有するか、これを含む所与のアミノ酸配列Aと言うこともできる)は次のように計算される。XがAおよびBのそのプログラムのアライメントにて配列アライメントプログラムALIGN-2によって同一の一致としてスコア化されたアミノ酸残基の数であり、YがBにおけるアミノ酸残基の総数である分数X/Yを100倍する。アミノ酸配列Aの長さがアミノ酸配列Bの長さと同等ではない場合、Bに対するAの%アミノ酸配列同一性はAに対するBの%アミノ酸配列同一性と同等ではないことが理解されるであろう。具体的に言及されない限り、本明細書で使用される%アミノ酸配列同一性の値はすべて、ALIGN-2コンピュータプログラムを使用して直前の段落に記載されているように得られる。
【0013】
本明細書に記載されるポリペプチドは、核酸によってコードできる。核酸は、2つ以上のヌクレオチド塩基を含むポリヌクレオチドの一種である。ある特定の実施形態において、核酸は、ポリペプチドをコードするポリヌクレオチドを細胞に転写するために使用できるベクターの成分である。本明細書で使用される場合、「ベクター」という用語は、それが連結している別の核酸を輸送可能な核酸分子を指す。ベクターの一種は、宿主細胞の染色体DNAに組み込まれることができるゲノム組み込み型ベクターまたは「組み込み型ベクター」である。ベクターの別の一種は、「エピソーマル」ベクター、例えば、染色体外で複製可能な核酸である。作動可能に連結している遺伝子の発現を指向することが可能なベクターは、本明細書において「発現ベクター」と呼ばれる。好適なベクターは、プラスミド、細菌人工染色体、酵母人工染色体、ウイルスベクターなどを含む。発現ベクターにおいて、転写を制御するために使用される、プロモーター、エンハンサー、ポリアデニル化シグナルなどの調節エレメントは、哺乳動物、細菌、ウイルス、または昆虫遺伝子由来であってもよい。通常、複製起点によって付与される宿主中での複製能や、形質転換体の認識を容易にするための選択遺伝子をさらに取り込むことができる。ウイルス、例えば、レンチウイルス、レトロウイルス、アデノウイルス、アデノ随伴ウイルスなどに由来するベクターを用いてもよい。プラスミドベクターは、染色体位置への組み込みのために線形化することができる。ベクターは、ゲノム内の規定された位置または制限された部位のセットに部位特異的な組み込み(例えば、AttP-AttB組み換え)を導く配列を含んでもよい。さらに、ベクターは、転移可能エレメント由来の配列を含んでもよい。
【0014】
本明細書で使用される場合、基準配列に対して、アミノ酸配列または核酸配列に対して記載するために本明細書に使用される場合、「相同性である」、「相同性」、または「相同性パーセント」という用語は、KarlinおよびAltschul(Proc. Natl. Acad. Sci. USA 87巻:2264~2268頁、1990年、modified as in Proc. Natl. Acad. Sci. USA 90巻:5873~5877頁、1993年)によって記載される式を使用して判定され得る。係る式は、Altschul et al. (J. Mol. Biol. 215巻:403~410頁、1990年)のbasic local alignment search tool(BLAST)プログラムに組み入れられる。配列の相同性パーセントは、本出願の出願日の時点での、BLASTの最も最近のバージョンを使用して判定されてもよい。
【0015】
アッセイ
本明細書では、ハイスループットスクリーニングアッセイ用の品質管理の方法が記載される。このようなアッセイは、細胞ベースであり、異なる潜在的な標的ポリペプチドを発現する複数の細胞を含む。標的ポリペプチドに対する、例えば小分子またはポリペプチドのスクリーニングライブラリーの活性は、標的ポリペプチドによって活性化され得る様々なレポーターアッセイ、または下流の媒介物質による標的ポリペプチドの活性を使用して判定できる。ある特定の実施形態では、レポーターは、標的ポリペプチドに固有にマッピングされ、ポリペプチドにおける活性を配列決定アッセイによって判定できるようにするバーコード(例えば、インデックス配列。本明細書では「固有の分子識別子」とも呼ばれる)を含む。概して、異なる標的ポリペプチドを含む細胞のライブラリーは、バーコードによって固有に標識された少なくとも100、200、300、400、500、600、700、800、900、または1000個以上の異なるポリペプチドを含んでもよい。本開示のアッセイは、96ウェルプレート、384ウェルプレート、または1,536ウェルプレートで実施できる。レポーターはまた、概して、レポーターの活性化を標識することができる視覚的に追跡可能な遺伝子(例えば、蛍光または発光レポーター遺伝子)を含んでもよい。本明細書に記載されるアッセイでは、異なる標的ポリペプチド(およびバーコード)を含む異なる細胞が、同じウェルに存在してもよい。ある特定の実施形態では、複数の細胞のうちのいくつかまたはすべてが、特定の標的を発現しない場合があり、UMIを含む生物学的レポーターを含んでもよい。このような生物学的レポーターは、UMIに作動可能に連結されたプロモーター、リプレッサー、またはエンハンサーエレメント、および任意選択でルシフェラーゼ酵素または蛍光タンパク質などの追加のレポーター遺伝子を含んでもよい。
【0016】
本明細書に記載される方法によるアッセイ設計の非限定的な例は、1)ウェルプレートのウェルに細胞を播種する工程と、2)細胞を検査薬に接触させて、検査薬がレポーターの活性化(例えば、バーコードの発現)に影響を及ぼす時間を与える工程と、3)細胞を溶解して細胞から核酸を放出させる工程と、4)溶解物をDNAse処理し、混入ゲノムDNAを除去する工程と、5)逆転写されたmRNAを逆転写および/または増幅し、cDNAまたは増幅されたcDNA(例えば、RT-PCR)を作製する工程と、6)次世代配列決定反応のためにcDNAを調製する工程と、7)調製したcDNAを配列決定する工程とを含んでもよい。上記の工程は、アッセイのウェルごとに実施され得る。工程3)~7)に関して、細胞をウェルに播種して検査薬で処理した後に様々な核酸が放出および/または処理される。溶解工程に関して、核酸は細胞から放出される。これらの核酸は、二本鎖DNAを切断して除去するDNAseで処理されてもよい。その後、RNAは、逆転写によって一本鎖DNAに逆転写され、その後、PCRによってさらに増幅され、二本鎖DNAが生じる。ゆえに、アッセイの工程を通して、複数の核酸が導入および/または生成され、核酸のそれぞれが配列決定され特定されてもよい。様々な工程中に添加される対照核酸の他、各工程中、または、ある特定の実施形態では最後の配列決定段階に対照核酸配列(プロセス工程中にアッセイのウェルに添加される場合、本明細書では様々な核酸「スパイクイン」とも呼ばれる)を使用して検出されるリードカウント、量、または対照核酸の比率を使用して、各工程の効果が評価されてもよい。
【0017】
上記の非限定的な例の各工程について、ある特定の条件が各工程の効果(例えば、どのくらいの細胞が溶解工程中に溶解されるか、DNase工程の効率、どのくらいのcDNAまたは増幅されたcDNAが逆転写工程中に作製されるかなど)に影響を及ぼす場合があり、これが、cDNAのどれくらいのリードがその工程に関連または変換されるかに影響を及ぼす場合があり、これが、異なる条件を有するアッセイを使用する場合にどのような条件がより良好な性能または移動につながるかを示す。以下に記載されるように、本方法全体にわたって特定できる対照核酸の使用により、各工程がどのくらい効率的であるかの指標を可能にし、結果として、当該工程が可能な限り効率的であるように条件を変更することによって工程の最適化につなげることができる。また、これらのプロセス対照は、アッセイまたはプレートにわたってデータを正規化して比較する能力を増加させることができる。また、これらのプロセス対照は、分析から除外されるべきアッセイの区画またはウェルを特定することができる。
【0018】
さらに、様々な工程中の様々な対照核酸のリードカウントは、当該プロセスの各工程が効率的に行われたか否かを示すことができる。例えば、溶解工程中に10,000個の核酸(例えば、DNAスパイクイン)がウェルに添加され、核酸が切断されることが意図されるDNase工程後にこれらの10,000個の核酸が残り、これらの核酸のリードカウントが10,000である場合は、その特定のウェルにおいてDNase工程が効率的ではなく、ゆえに、当該データは除外されるべきであると判定できる。逆に、RNAスパイクインが最終的にDNAに変換されることが予想されるRT-PCR中に10,000個のRNAスパイクインが添加され、予想されるリードカウントが5,000リードであるにもかかわらず、RT-PCR工程の終了時に算出されるDNAのリードカウントが10,000リードである場合、実際のリードカウントが予想されるリードカウントよりもはるかに大きいので、アッセイの少なくとも1つの工程またはアッセイの測定が誤りであるか、非効率的であるかのいずれかであり、ゆえに、そのウェルからのデータは除外されるべきであると判定できる。
【0019】
対照核酸
溶解工程、DNase工程、逆転写反応、RT-PCR反応、または次世代シーケンシングライブラリー調製反応のうちの1つ以上の間に対照核酸が添加されてもよい。対照核酸は、異なる種類の対照核酸内で異なる既知の配列を含み、異なるプロセス工程における変動性を特定することができる。
【0020】
図6は、上述のように、溶解工程、DNase工程、およびRT-PCR工程などの様々な工程の間に対照核酸が添加される例示的なプロセスを示す。アッセイの工程中にウェルに添加される場合、対照核酸は、種々の核酸(例えば、DNAまたはRNA)の「スパイクイン」と称されてもよい。対照核酸の既知の量と、後に配列決定される核酸のリード量とを比較することで、各工程の効果について洞察がもたらされる。各工程で添加される対照核酸の量は変化してもよい。さらに、対照核酸の量は、各工程の効果を妨害しないように、ある範囲(例えば、複数の核酸中、1,000~10,000個の対照核酸)内に制限されてもよい。例えば、ある工程中に添加される対照核酸の量が少なすぎる場合、工程を較正(例えば、工程の1つ以上の条件を変更)したり、好ましいリードカウント(例えば、ウェルあたり1,000リード)を得たりするのに十分な対照核酸が添加されていない。逆に、添加される対照核酸の量が多すぎると、当該工程の観測可能な性能を妨害し(例えば、核酸スパイクインが多すぎる場合があり、これが、レポーターによって生成されたUMIから読み取りを得るために利用可能な試薬を過剰に使用する)、ゆえに、リードカウントにも影響を及ぼす。
【0021】
対照核酸は、絶対数(または絶対数と同等の濃度)に基づいて、種々のプロセス工程において試料に添加されてもよい。いくつかの実施形態では、特定のプロセス工程で添加される対照核酸(例えば、RNAまたはDNAスパイクイン)の量は、約1,000個の核酸から約50,000個の核酸を含む。いくつかの実施形態では、核酸(例えば、RNAまたはDNAスパイクイン)の量は、約1,000個の核酸から約2,000個の核酸、約1,000個の核酸から約3,000個の核酸、約1,000個の核酸から約4,000個の核酸、約1,000個の核酸から約5,000個の核酸、約1,000個の核酸から約7,500個の核酸、約1,000個の核酸から約10,000個の核酸、約1,000個の核酸から約12,500個の核酸、約1,000個の核酸から約15,000個の核酸、約1,000個の核酸から約20,000個の核酸、約1,000個の核酸から約30,000個の核酸、約1,000個の核酸から約50,000個の核酸、約2,000個の核酸から約3,000個の核酸、約2,000個の核酸から約4,000個の核酸、約2,000個の核酸から約5,000個の核酸、約2,000個の核酸から約7,500個の核酸、約2,000個の核酸から約10,000個の核酸、約2,000個の核酸から約12,500個の核酸、約2,000個の核酸から約15,000個の核酸、約2,000個の核酸から約20,000個の核酸、約2,000個の核酸から約30,000個の核酸、約2,000個の核酸から約50,000個の核酸、約3,000個の核酸から約4,000個の核酸、約3,000個の核酸から約5,000個の核酸、約3,000個の核酸から約7,500個の核酸、約3,000個の核酸から約10,000個の核酸、約3,000個の核酸から約12,500個の核酸、約3,000個の核酸から約15,000個の核酸、約3,000個の核酸から約20,000個の核酸、約3,000個の核酸から約30,000個の核酸、約3,000個の核酸から約50,000個の核酸、約4,000個の核酸から約5,000個の核酸、約4,000個の核酸から約7,500個の核酸、約4,000個の核酸から約10,000個の核酸、約4,000個の核酸から約12,500個の核酸、約4,000個の核酸から約15,000個の核酸、約4,000個の核酸から約20,000個の核酸、約4,000個の核酸から約30,000個の核酸、約4,000個の核酸から約50,000個の核酸、約5,000個の核酸から約7,500個の核酸、約5,000個の核酸から約10,000個の核酸、約5,000個の核酸から約12,500個の核酸、約5,000個の核酸から約15,000個の核酸、約5,000個の核酸から約20,000個の核酸、約5,000個の核酸から約30,000個の核酸、約5,000個の核酸から約50,000個の核酸、約7,500個の核酸から約10,000個の核酸、約7,500個の核酸から約12,500個の核酸、約7,500個の核酸から約15,000個の核酸、約7,500個の核酸から約20,000個の核酸、約7,500個の核酸から約30,000個の核酸、約7,500個の核酸から約50,000個の核酸、約10,000個の核酸から約12,500個の核酸、約10,000個の核酸から約15,000個の核酸、約10,000個の核酸から約20,000個の核酸、約10,000個の核酸から約30,000個の核酸、約10,000個の核酸から約50,000個の核酸、約12,500個の核酸から約15,000個の核酸、約12,500個の核酸から約20,000個の核酸、約12,500個の核酸から約30,000個の核酸、約12,500個の核酸から約50,000個の核酸、約15,000個の核酸から約20,000個の核酸、約15,000個の核酸から約30,000個の核酸、約15,000個の核酸から約50,000個の核酸、約20,000個の核酸から約30,000個の核酸、約20,000個の核酸から約50,000個の核酸、または約30,000個の核酸から約50,000個の核酸を含む。いくつかの実施形態では、核酸(例えば、RNAまたはDNAスパイクイン)の量は、約1,000個の核酸、約2,000個の核酸、約3,000個の核酸、約4,000個の核酸、約5,000個の核酸、約7,500個の核酸、約10,000個の核酸、約12,500個の核酸、約15,000個の核酸、約20,000個の核酸、約30,000個の核酸、または約50,000個の核酸を含む。いくつかの実施形態では、核酸(例えば、RNAまたはDNAスパイクイン)の量は、少なくとも約1,000個の核酸、約2,000個の核酸、約3,000個の核酸、約4,000個の核酸、約5,000個の核酸、約7,500個の核酸、約10,000個の核酸、約12,500個の核酸、約15,000個の核酸、約20,000個の核酸、または約30,000個の核酸を含む。いくつかの実施形態では、核酸(例えば、RNAまたはDNAスパイクイン)の量は、最大で約2,000個の核酸、約3,000個の核酸、約4,000個の核酸、約5,000個の核酸、約7,500個の核酸、約10,000個の核酸、約12,500個の核酸、約15,000個の核酸、約20,000個の核酸、約30,000個の核酸、または約50,000個の核酸を含む。これらのスパイクインは、dsDNA、ssDNA、ssRNA、またはこれらの組み合わせを含んでもよい。ウェル中の核酸の濃度を判定するために核酸の量(例えば、リードカウント/絶対数)が使用されてもよく、ウェル中の核酸の量を判定するためにウェル中の核酸の濃度が使用されてもよい。いくつかの実施形態では、既知量の核酸が、方法または工程の開始時にウェルに添加されてもよく、核酸の濃度は、方法または工程が実施された後に判定されてもよい。
【0022】
いくつかの実施形態では、アッセイの様々な工程に添加される対照核酸によって、異なる複数の対照核酸のすべてについてある特定の総リード数がもたらされ、アッセイにおけるウェルあたりの予想されるリードカウントは、対照核酸の約1,000リードである。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約0個の対照核酸から約150個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約0個の対照核酸から約5個の対照核酸、約0個の対照核酸から約10個の対照核酸、約0個の対照核酸から約15個の対照核酸、約0個の対照核酸から約20個の対照核酸、約0個の対照核酸から約25個の対照核酸、約0個の対照核酸から約30個の対照核酸、約0個の対照核酸から約40個の対照核酸、約0個の対照核酸から約50個の対照核酸、約0個の対照核酸から約75個の対照核酸、約0個の対照核酸から約100個の対照核酸、約0個の対照核酸から約150個の対照核酸、約5個の対照核酸から約10個の対照核酸、約5個の対照核酸から約15個の対照核酸、約5個の対照核酸から約20個の対照核酸、約5個の対照核酸から約25個の対照核酸、約5個の対照核酸から約30個の対照核酸、約5個の対照核酸から約40個の対照核酸、約5個の対照核酸から約50個の対照核酸、約5個の対照核酸から約75個の対照核酸、約5個の対照核酸から約100個の対照核酸、約5個の対照核酸から約150個の対照核酸、約10個の対照核酸から約15個の対照核酸、約10個の対照核酸から約20個の対照核酸、約10個の対照核酸から約25個の対照核酸、約10個の対照核酸から約30個の対照核酸、約10個の対照核酸から約40個の対照核酸、約10個の対照核酸から約50個の対照核酸、約10個の対照核酸から約75個の対照核酸、約10個の対照核酸から約100個の対照核酸、約10個の対照核酸から約150個の対照核酸、約15個の対照核酸から約20個の対照核酸、約15個の対照核酸から約25個の対照核酸、約15個の対照核酸から約30個の対照核酸、約15個の対照核酸から約40個の対照核酸、約15個の対照核酸から約50個の対照核酸、約15個の対照核酸から約75個の対照核酸、約15個の対照核酸から約100個の対照核酸、約15個の対照核酸から約150個の対照核酸、約20個の対照核酸から約25個の対照核酸、約20個の対照核酸から約30個の対照核酸、約20個の対照核酸から約40個の対照核酸、約20個の対照核酸から約50個の対照核酸、約20個の対照核酸から約75個の対照核酸、約20個の対照核酸から約100個の対照核酸、約20個の対照核酸から約150個の対照核酸、約25個の対照核酸から約30個の対照核酸、約25個の対照核酸から約40個の対照核酸、約25個の対照核酸から約50個の対照核酸、約25個の対照核酸から約75個の対照核酸、約25個の対照核酸から約100個の対照核酸、約25個の対照核酸から約150個の対照核酸、約30個の対照核酸から約40個の対照核酸、約30個の対照核酸から約50個の対照核酸、約30個の対照核酸から約75個の対照核酸、約30個の対照核酸から約100個の対照核酸、約30個の対照核酸から約150個の対照核酸、約40個の対照核酸から約50個の対照核酸、約40個の対照核酸から約75個の対照核酸、約40個の対照核酸から約100個の対照核酸、約40個の対照核酸から約150個の対照核酸、約50個の対照核酸から約75個の対照核酸、約50個の対照核酸から約100個の対照核酸、約50個の対照核酸から約150個の対照核酸、約75個の対照核酸から約100個の対照核酸、約75個の対照核酸から約150個の対照核酸、または約100個の対照核酸から約150個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約0個の対照核酸、約5個の対照核酸、約10個の対照核酸、約15個の対照核酸、約20個の対照核酸、約25個の対照核酸、約30個の対照核酸、約40個の対照核酸、約50個の対照核酸、約75個の対照核酸、約100個の対照核酸、または約150個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、少なくとも約0個の対照核酸、約5個の対照核酸、約10個の対照核酸、約15個の対照核酸、約20個の対照核酸、約25個の対照核酸、約30個の対照核酸、約40個の対照核酸、約50個の対照核酸、約75個の対照核酸、または約100個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、最大で約5個の対照核酸、約10個の対照核酸、約15個の対照核酸、約20個の対照核酸、約25個の対照核酸、約30個の対照核酸、約40個の対照核酸、約50個の対照核酸、約75個の対照核酸、約100個の対照核酸、または約150個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約100個の対照核酸から約1,500個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約100個の対照核酸から約200個の対照核酸、約100個の対照核酸から約300個の対照核酸、約100個の対照核酸から約400個の対照核酸、約100個の対照核酸から約500個の対照核酸、約100個の対照核酸から約600個の対照核酸、約100個の対照核酸から約700個の対照核酸、約100個の対照核酸から約800個の対照核酸、約100個の対照核酸から約900個の対照核酸、約100個の対照核酸から約1,000個の対照核酸、約100個の対照核酸から約1,250個の対照核酸、約100個の対照核酸から約1,500個の対照核酸、約200個の対照核酸から約300個の対照核酸、約200個の対照核酸から約400個の対照核酸、約200個の対照核酸から約500個の対照核酸、約200個の対照核酸から約600個の対照核酸、約200個の対照核酸から約700個の対照核酸、約200個の対照核酸から約800個の対照核酸、約200個の対照核酸から約900個の対照核酸、約200個の対照核酸から約1,000個の対照核酸、約200個の対照核酸から約1,250個の対照核酸、約200個の対照核酸から約1,500個の対照核酸、約300個の対照核酸から約400個の対照核酸、約300個の対照核酸から約500個の対照核酸、約300個の対照核酸から約600個の対照核酸、約300個の対照核酸から約700個の対照核酸、約300個の対照核酸から約800個の対照核酸、約300個の対照核酸から約900個の対照核酸、約300個の対照核酸から約1,000個の対照核酸、約300個の対照核酸から約1,250個の対照核酸、約300個の対照核酸から約1,500個の対照核酸、約400個の対照核酸から約500個の対照核酸、約400個の対照核酸から約600個の対照核酸、約400個の対照核酸から約700個の対照核酸、約400個の対照核酸から約800個の対照核酸、約400個の対照核酸から約900個の対照核酸、約400個の対照核酸から約1,000個の対照核酸、約400個の対照核酸から約1,250個の対照核酸、約400個の対照核酸から約1,500個の対照核酸、約500個の対照核酸から約600個の対照核酸、約500個の対照核酸から約700個の対照核酸、約500個の対照核酸から約800個の対照核酸、約500個の対照核酸から約900個の対照核酸、約500個の対照核酸から約1,000個の対照核酸、約500個の対照核酸から約1,250個の対照核酸、約500個の対照核酸から約1,500個の対照核酸、約600個の対照核酸から約700個の対照核酸、約600個の対照核酸から約800個の対照核酸、約600個の対照核酸から約900個の対照核酸、約600個の対照核酸から約1,000個の対照核酸、約600個の対照核酸から約1,250個の対照核酸、約600個の対照核酸から約1,500個の対照核酸、約700個の対照核酸から約800個の対照核酸、約700個の対照核酸から約900個の対照核酸、約700個の対照核酸から約1,000個の対照核酸、約700個の対照核酸から約1,250個の対照核酸、約700個の対照核酸から約1,500個の対照核酸、約800個の対照核酸から約900個の対照核酸、約800個の対照核酸から約1,000個の対照核酸、約800個の対照核酸から約1,250個の対照核酸、約800個の対照核酸から約1,500個の対照核酸、約900個の対照核酸から約1,000個の対照核酸、約900個の対照核酸から約1,250個の対照核酸、約900個の対照核酸から約1,500個の対照核酸、約1,000個の対照核酸から約1,250個の対照核酸、約1,000個の対照核酸から約1,500個の対照核酸、または約1,250個の対照核酸から約1,500個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約100個の対照核酸、約200個の対照核酸、約300個の対照核酸、約400個の対照核酸、約500個の対照核酸、約600個の対照核酸、約700個の対照核酸、約800個の対照核酸、約900個の対照核酸、約1,000個の対照核酸、約1,250個の対照核酸、または約1,500個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、少なくとも約100個の対照核酸、約200個の対照核酸、約300個の対照核酸、約400個の対照核酸、約500個の対照核酸、約600個の対照核酸、約700個の対照核酸、約800個の対照核酸、約900個の対照核酸、約1,000個の対照核酸、または約1,250個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、最大で約200個の対照核酸、約300個の対照核酸、約400個の対照核酸、約500個の対照核酸、約600個の対照核酸、約700個の対照核酸、約800個の対照核酸、約900個の対照核酸、約1,000個の対照核酸、約1,250個の対照核酸、または約1,500個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約500個の対照核酸から約15,000個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約500個の対照核酸から約750個の対照核酸、約500個の対照核酸から約1,000個の対照核酸、約500個の対照核酸から約1,250個の対照核酸、約500個の対照核酸から約1,500個の対照核酸、約500個の対照核酸から約2,000個の対照核酸、約500個の対照核酸から約3,000個の対照核酸、約500個の対照核酸から約4,000個の対照核酸、約500個の対照核酸から約5,000個の対照核酸、約500個の対照核酸から約7,500個の対照核酸、約500個の対照核酸から約10,000個の対照核酸、約500個の対照核酸から約15,000個の対照核酸、約750個の対照核酸から約1,000個の対照核酸、約750個の対照核酸から約1,250個の対照核酸、約750個の対照核酸から約1,500個の対照核酸、約750個の対照核酸から約2,000個の対照核酸、約750個の対照核酸から約3,000個の対照核酸、約750個の対照核酸から約4,000個の対照核酸、約750個の対照核酸から約5,000個の対照核酸、約750個の対照核酸から約7,500個の対照核酸、約750個の対照核酸から約10,000個の対照核酸、約750個の対照核酸から約15,000個の対照核酸、約1,000個の対照核酸から約1,250個の対照核酸、約1,000個の対照核酸から約1,500個の対照核酸、約1,000個の対照核酸から約2,000個の対照核酸、約1,000個の対照核酸から約3,000個の対照核酸、約1,000個の対照核酸から約4,000個の対照核酸、約1,000個の対照核酸から約5,000個の対照核酸、約1,000個の対照核酸から約7,500個の対照核酸、約1,000個の
対照核酸から約10,000個の対照核酸、約1,000個の対照核酸から約15,000個の対照核酸、約1,250個の対照核酸から約1,500個の対照核酸、約1,250個の対照核酸から約2,000個の対照核酸、約1,250個の対照核酸から約3,000個の対照核酸、約1,250個の対照核酸から約4,000個の対照核酸、約1,250個の対照核酸から約5,000個の対照核酸、約1,250個の対照核酸から約7,500個の対照核酸、約1,250個の対照核酸から約10,000個の対照核酸、約1,250個の対照核酸から約15,000個の対照核酸、約1,500個の対照核酸から約2,000個の対照核酸、約1,500個の対照核酸から約3,000個の対照核酸、約1,500個の対照核酸から約4,000個の対照核酸、約1,500個の対照核酸から約5,000個の対照核酸、約1,500個の対照核酸から約7,500個の対照核酸、約1,500個の対照核酸から約10,000個の対照核酸、約1,500個の対照核酸から約15,000個の対照核酸、約2,000個の対照核酸から約3,000個の対照核酸、約2,000個の対照核酸から約4,000個の対照核酸、約2,000個の対照核酸から約5,000個の対照核酸、約2,000個の対照核酸から約7,500個の対照核酸、約2,000個の対照核酸から約10,000個の対照核酸、約2,000個の対照核酸から約15,000個の対照核酸、約3,000個の対照核酸から約4,000個の対照核酸、約3,000個の対照核酸から約5,000個の対照核酸、約3,000個の対照核酸から約7,500個の対照核酸、約3,000個の対照核酸から約10,000個の対照核酸、約3,000個の対照核酸から約15,000個の対照核酸、約4,000個の対照核酸から約5,000個の対照核酸、約4,000個の対照核酸から約7,500個の対照核酸、約4,000個の対照核酸から約10,000個の対照核酸、約4,000個の対照核酸から約15,000個の対照核酸、約5,000個の対照核酸から約7,500個の対照核酸、約5,000個の対照核酸から約10,000個の対照核酸、約5,000個の対照核酸から約15,000個の対照核酸、約7,500個の対照核酸から約10,000個の対照核酸、約7,500個の対照核酸から約15,000個の対照核酸、または約10,000個の対照核酸から約15,000個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、約500個の対照核酸、約750個の対照核酸、約1,000個の対照核酸、約1,250個の対照核酸、約1,500個の対照核酸、約2,000個の対照核酸、約3,000個の対照核酸、約4,000個の対照核酸、約5,000個の対照核酸、約7,500個の対照核酸、約10,000個の対照核酸、または約15,000個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、少なくとも約500個の対照核酸、約750個の対照核酸、約1,000個の対照核酸、約1,250個の対照核酸、約1,500個の対照核酸、約2,000個の対照核酸、約3,000個の対照核酸、約4,000個の対照核酸、約5,000個の対照核酸、約7,500個の対照核酸、または約10,000個の対照核酸である。いくつかの実施形態では、アッセイにおけるウェルあたりのリードカウントは、最大で約750個の対照核酸、約1,000個の対照核酸、約1,250個の対照核酸、約1,500個の対照核酸、約2,000個の対照核酸、約3,000個の対照核酸、約4,000個の対照核酸、約5,000個の対照核酸、約7,500個の対照核酸、約10,000個の対照核酸、または約15,000個の対照核酸である。以上に特定のリードカウントが記載されているが、当該リードカウントは例示的なものであり、他のリードカウントに判定されてもよい。さらに、様々な対照核酸について、ウェルで異なるリードカウントが判定されてもよい。さらに、すべての核酸について、ウェル間で同じリードカウントが判定される必要はない。
【0023】
対照核酸(または複数の対照核酸)を添加することで、1つ以上の工程の効果を判定する方法が提供される。例えば、ある工程中に対照核酸が既知の量で導入されてもよく、これらの対照核酸の読み取りは、対照核酸が導入される工程中に後で算出されてもよく、または後の工程中に算出されてもよい。ゆえに、対照核酸の導入量と比較した、ある特定の工程中の対照核酸のリードカウントにより、工程がどのくらい適切に機能しているか(例えば、逆転写反応がどのくらい効率的であるか)について洞察がもたらされ得る。工程が効率的に機能していると判定される場合(例えば、対照核酸のリードが、リードの予想量付近である場合)、工程の条件が変更されなくてもよく、あるいは工程の効果をさらに高めるために工程の条件が変更されてもよいが、工程が適切に機能していないと判定される場合(例えば、対照核酸のリードが、リードの予想量付近でない場合)は、効果を高めるために工程の条件が変更されてもよい。
【0024】
溶解工程は、細胞内部から核酸が放出されるように細胞膜を破壊することを含んでもよい。核酸は、DNA、RNA、または他の核酸を含んでもよい。
【0025】
第1の複数の対照核酸(例えば、RNAスパイク602)は、溶解工程中またはその前に添加されてもよい。ある特定の実施形態では、第1の複数の対照核酸は、細胞溶解中に細胞に添加される溶解剤または緩衝液に含まれてもよい。いくつかの実施形態では、第1の複数の核酸は、ウェルに播種された複数の細胞内に存在し、その後、細胞が溶解されると、細胞の内部内容物が放出される。ある特定の実施形態では、これらの核酸はRNAを含む。ある特定の実施形態では、これらの核酸はDNAを含む。ある特定の実施形態では、第1の複数の対照核酸のうちの一方がDNAであり、第1の複数の対照核酸のうちの他方はRNAである。この第1の複数の核酸は、(1)既知の参照標準に対してエンドリードカウントを正規化するか、および/または(2)関心対象の試料のリードカウント対他の対照核酸スパイクインの比率を判定するために使用されてもよく、スパイクインは、細胞溶解反応の効果の定量的測定として使用されてもよい。第1の複数の核酸は、1つ以上の後の工程(例えば、配列決定工程)中の第1の複数の核酸のリードカウントと、最初に含まれていた第1の複数の核酸の量とを比較することによって既知の参照標準に対してエンドリードカウントを正規化するために使用されてもよい。また、第1の複数の核酸は、配列決定工程中に算出された第1の複数の核酸のリード数と、溶解工程に添加された第1の複数の核酸の数とを比較することによってリードカウントの細胞溶解反応比率を判定するために使用されてもよい。細胞溶解反応が非効率的である場合、細胞溶解反応比率が低くなり、細胞溶解反応が効率的である場合、細胞溶解反応は高くなる。例えば、細胞溶解反応比率が0.1の場合、第1の複数の核酸の10%しか溶解されなかったので細胞溶解反応は非効率的であったことを示す。対照的に、細胞溶解反応比率が0.95の場合、第1の複数の核酸の95%が溶解されているので細胞溶解反応が効率的であったことを示す。細胞溶解反応比率を改善するために、溶解工程の条件、例えばアッセイのpH、アッセイの持続時間、添加される細胞の量、または他の条件などが変更されてもよい。
【0026】
溶解RNA安定性比率(例えば、「溶解RNA安定性」618)などの他の比率は、溶解工程中に添加された別の複数の核酸に基づいて判定されてもよい。例えば、溶解RNA安定性比率は、溶解工程からDNase工程への移動の効果を測定することができ、および/または、RNaseの存在がRT工程を含むRT工程以前の後続工程のいずれかに影響を与えるか否かを判定することができる。さらに、溶解RNA安定性比率は、ウェル中のDNaseの存在が強すぎるか否かを示すことができる。例えば、DNase工程中に多すぎるDNaseが存在する場合、DNaseがDNAを切断するだけではなく、RNAも切断し得、これによってRNAの濃度が低くなり、結果として、溶解RNA安定性比率が低くなる。ゆえに、溶解RNA安定性比率は、DNase工程中に過剰なDNaseが使用されることを示すことができる。例えば、溶解工程の終了時に別の複数の核酸(例えば、別のRNAスパイク)のリードカウントが行われ、その後、DNase工程の開始時に別の複数の核酸の別のリードカウントが行われる場合、移動の効果は、溶解RNA安定性比率を使用して評価されてもよい。ゆえに、溶解RNA安定性比率が0.94の場合、移動が効率的であったことを示す。対照的に、溶解RNA安定性比率が0.25の場合、移動が非効率非的であったことと、移動の特定の条件(例えば、速度、持続時間、温度、および/またはpH)を変更する必要があり得ることとを示す。
【0027】
第2の複数の対照核酸(例えば、DNAスパイク604)は、溶解工程中またはその前に添加されてもよい。いくつかの実施形態では、第2の複数の核酸は、溶解工程中に添加される複数の細胞のうちにあり、当該細胞は、その後、溶解される。ある特定の実施形態では、第2の複数の対照核酸は、細胞溶解中に細胞に添加される溶解剤または緩衝液に含まれてもよい。ある特定の実施形態では、これらの核酸は二本鎖DNAを含む。これらの二本鎖DNAは、DNase工程の効果を判定するために使用でき、したがって、不完全にDNase処理された試料から潜在的な混入源を特定する。例えば、第2の複数の核酸のリードカウントは、DNaseの非効率(例えば、「DNase非効率」616)を示すことができる。DNase非効率は、DNase工程中に測定される第2の複数の核酸に関連するRNAのリードカウントと、逆転写工程中に測定される第2の複数の核酸に関連するRNAのリードカウントとを比較することによって判定されてもよい。特に、溶解工程中に添加される第2の複数の核酸のすべてまたは一部は、DNase工程中に切断されてもよく、結果として生じるRNAは、DNase工程中に算出される。ゆえに、溶解工程中に添加される第2の複数の核酸の既知量とDNase工程中のRNAのリードカウントとを比較することによって、DNase非効率を判定することができる。例えば、DNase非効率が1,000:10,000の場合、第2の複数の核酸の90%がDNase工程中に切断されたことを示す。対照的に、DNase非効率が5,000:10,000の場合、第2の複数の核酸の50%のみがDNase工程中に切断されたことを示す。DNase非効率を改善するために、溶解工程の条件、例えば、アッセイのpH、アッセイの持続時間、添加される細胞の量、または他の条件などが変更されてもよい。
【0028】
第3の複数の核酸(例えば、RNAスパイク608)は、RT-PCR工程中に添加されてもよい。ある特定の実施形態では、これらの核酸はRNAを含む。この複数の核酸は、RT-PCR工程から配列決定工程への核酸移動の不備または準最適性、RT-PCR工程中の何らかの非特異的なRNAの消化、またはRT反応中の混入RNaseの存在を特定するために使用できる。RT-PCR RNA安定性比率は、どれくらいのRNAが移動されるかに基づいて判定されてもよい。例えば、第3の複数の核酸(例えば、RNAスパイク)は、RT-PCR工程中に第1の位置に既知量で添加され、その後、配列決定工程が行われるように第2の位置に移動されてもよい。移動が効率的であった場合、RT-PCR RNA安定性比率は高くなるが、移動が非効率的であった場合、RT-PCR RNA安定性比率は低くなる。例えば、RT-PCR RNA安定性比率が0.3の場合、RNAスパイクの30%しか移動しなかったので、RT-PCR工程から配列決定工程への移動が非効率的であることを示す。対照的に、RT-PCR RNA安定性比率が0.99の場合、RNAスパイクの99%が移動を行ったので、RT-PCR工程から配列決定工程への移動が有効であることを示す。RT-PCR RNA安定性比率が低い場合、工程に関連する特定の条件、例えば、移動の速度またはRNAスパイクの量が変更されてもよい。
【0029】
第4の複数の核酸(例えば、DNAスパイク610)は、RT-PCR工程中に添加されてもよい。ある特定の実施形態では、これらの核酸は一本鎖DNA(ssDNA)を含む。このスパイクインは、RT-PCR工程の逆転写部分の効果を判定するために使用できる。第4の複数の核酸は、逆転写工程で添加される一本鎖DNAスパイクを含んでもよく、様々な工程における第4の複数の核酸のリードカウントにより、どれくらいの相補的DNAが生成されるかについて洞察がもたらされることによって、RT-PCR性能の効率およびRT効率(例えば、「RT効率」612)を示し得る。例えば、RT-PCR工程中に既知量の第4の複数の核酸(例えば、ssDNAスパイク)が添加されてもよく、当該既知量は、RT-PCR工程中またはその後の第4の複数の核酸のリードカウントと比較されてもよい。例えば、RT効率が0.8の場合、RT-PCR工程によりssDNAの80%が変換されることを示す。対照的に、RT効率が0.1の場合、RT-PCR工程によりssDNAの10%のみが変換されることを示す。RT効率が低いことは、RT-PCR工程の条件、例えば、RT-PCR工程の温度、RT-PCR工程のpH、および/またはRT-PCR工程の持続時間の変更につながり得る。
【0030】
第5の複数の核酸(例えば、RNAスパイク606)は、DNase工程中に添加されてもよい。ある特定の実施形態では、これらの核酸は、DNase工程で添加されるRNAスパイクを含む。このスパイクインは、DNaseプレートからRT-PCRプレートへの送液の効果を判定するために使用できる。DNase RNA安定性(例えば、「DNase RNA安定性」614)は、どれくらいのRNAが移動されるかに基づいて判定されてもよい。例えば、第5の複数の核酸(例えば、RNAスパイク)は、DNase工程中に第1の位置(例えば、DNaseプレート)に既知量で添加され、その後、逆転写工程が行われるように第2の位置(例えば、RT-PCRプレート)に移動されてもよい。移動が効率的であった場合、DNase RNA安定性比率は高くなるが、移動が非効率的であった場合、DNase RNA安定性比率は低くなる。例えば、DNase RNA安定性比率が0.3の場合、RNAスパイクの30%しか移動しなかったので、DNase工程から逆転写工程への移動が非効率的であることを示す。対照的に、DNase RNA安定性比率が0.99の場合、RNAスパイクの99%が移動したので、DNase工程から逆転写工程への移動が有効ではないことを示す。DNase RNA安定性比率が低い場合、工程に関連する特定の条件、例えば、移動の速度またはRNAスパイクの量が変更されてもよい。
【0031】
さらなる情報により、プロセスに関連するさらなる態様、例えば、複数の核酸に基づいて判定されるさらなる比率が示され得る。例えば、gDNA混入比率(例えば、「gDNA混入」620)を判定すると、第1の複数の核酸を添加した後に生じるgDNA混入が示される。例えば、第1の複数の核酸(例えば、二本鎖DNAスパイク)は、溶解工程中に既知量で添加されてもよく、これは、DNAの何割がgDNAであるかを判定するために、RT-PCR工程中の第1の複数の核酸のリードカウントと比較されてもよい。ゆえに、gDNA混入比率が0.75の場合、DNase工程により、溶解工程中に添加されたDNAスパイクインの大部分がRNAに変換されたことを示す。対照的に、gDNA混入比率が0.25の場合、DNase工程により、溶解工程中に添加されたDNAスパイクインの大部分がRNAに変換されたことを示す。
【0032】
本明細書に記載される対照核酸のヌクレオチド配列(例えば、バーコード)は、以前の実験実行による交叉汚染を検出するために、後続実験実行のために変更できる。このような交叉汚染は、以前の実験実行で使用された機器または試薬に起因し得る。いくつかの実施形態において、複数の複数の核酸は、ヌクレオチドが共通に配列決定されていてもよい。他の実施形態では、複数の核酸はそれぞれ、それ自体のヌクレオチド配列を有する。
【0033】
さらに、上述のように、様々な複数の核酸が、1つ以上の工程中に添加されてもよい。いくつかの実施形態では、単一の複数の核酸が添加され、各工程を通して評価されてもよい。例えば、単一の複数の核酸(例えば、RNAスパイク)は、溶解工程中に添加され、溶解工程の終了時に算出され、DNase工程の開始時に算出され、DNase工程の終了時に算出され、RT-PCR工程の開始時に算出され、RT-PCR工程の終了時に算出され、その後、配列決定工程中に再度算出され、単一の複数の核酸の複数のリードカウントが効率的にでき、以上に特定される比率、例えば、溶解RNA安定性比率、DNase RNA安定性比率、およびRT-PCR RNA安定性比率のうちのいくつかを判定することができる。
【0034】
いくつかの実施形態では、溶液中に複数の核酸がある濃度で存在してもよい。いくつかの実施形態では、溶媒が添加されて溶液中の濃度が達成されてもよい。いくつかの実施形態において、濃度は、約0pMから約0.05pMであり得る。いくつかの実施形態において、濃度は、約0pMから約0.01pM、約0pMから約0.015pM、約0pMから約0.02pM、約0pMから約0.025pM、約0pMから約0.03pM、約0pMから約0.035pM、約0pMから約0.04pM、約0pMから約0.045pM、約0pMから約0.05pM、約0.01pMから約0.015pM、約0.01pMから約0.02pM、約0.01pMから約0.025pM、約0.01pMから約0.03pM、約0.01pMから約0.035pM、約0.01pMから約0.04pM、約0.01pMから約0.045pM、約0.01pMから約0.05pM、約0.015pMから約0.02pM、約0.015pMから約0.025pM、約0.015pMから約0.03pM、約0.015pMから約0.035pM、約0.015pMから約0.04pM、約0.015pMから約0.045pM、約0.015pMから約0.05pM、約0.02pMから約0.025pM、約0.02pMから約0.03pM、約0.02pMから約0.035pM、約0.02pMから約0.04pM、約0.02pMから約0.045pM、約0.02pMから約0.05pM、約0.025pMから約0.03pM、約0.025pMから約0.035pM、約0.025pMから約0.04pM、約0.025pMから約0.045pM、約0.025pMから約0.05pM、約0.03pMから約0.035pM、約0.03pMから約0.04pM、約0.03pMから約0.045pM、約0.03pMから約0.05pM、約0.035pMから約0.04pM、約0.035pMから約0.045pM、約0.035pMから約0.05pM、約0.04pMから約0.045pM、約0.04pMから約0.05pM、または約0.045pMから約0.05pMであってもよい。いくつかの実施形態において、濃度は、約0pM、約0.01pM、約0.015pM、約0.02pM、約0.025pM、約0.03pM、約0.035pM、約0.04pM、約0.045pM、または約0.05pMであり得る。いくつかの実施形態において、濃度は、少なくとも約0pM、約0.01pM、約0.015pM、約0.02pM、約0.025pM、約0.03pM、約0.035pM、約0.04pM、または約0.045pMであり得る。いくつかの実施形態において、濃度は、最大で約0.01pM、約0.015pM、約0.02pM、約0.025pM、約0.03pM、約0.035pM、約0.04pM、約0.045pM、または約0.05pMであり得る。いくつかの実施形態において、濃度は、約0.05pMから約0.5pMであり得る。いくつかの実施形態において、濃度は、約0.05pMから約0.1pM、約0.05pMから約0.15pM、約0.05pMから約0.2pM、約0.05pMから約0.25pM、約0.05pMから約0.3pM、約0.05pMから約0.35pM、約0.05pMから約0.4pM、約0.05pMから約0.45pM、約0.05pMから約0.5pM、約0.1pMから約0.15pM、約0.1pMから約0.2pM、約0.1pMから約0.25pM、約0.1pMから約0.3pM、約0.1pMから約0.35pM、約0.1pMから約0.4pM、約0.1pMから約0.45pM、約0.1pMから約0.5pM、約0.15pMから約0.2pM、約0.15pMから約0.25pM、約0.15pMから約0.3pM、約0.15pMから約0.35pM、約0.15pMから約0.4pM、約0.15pMから約0.45pM、約0.15pMから約0.5pM、約0.2pMから約0.25pM、約0.2pMから約0.3pM、約0.2pMから約0.35pM、約0.2pMから約0.4pM、約0.2pMから約0.45pM、約0.2pMから約0.5pM、約0.25pMから約0.3pM、約0.25pMから約0.35pM、約0.25pMから約0.4pM、約0.25pMから約0.45pM、約0.25pMから約0.5pM、約0.3pMから約0.35pM、約0.3pMから約0.4pM、約0.3pMから約0.45pM、約0.3pMから約0.5pM、約0.35pMから約0.4pM、約0.35pMから約0.45pM、約0.35pMから約0.5pM、約0.4pMから約0.45pM、約0.4pMから約0.5pM、または約0.45pMから約0.5pMであり得る。いくつかの実施形態において、濃度は、約0.05pM、約0.1pM、約0.15pM、約0.2pM、約0.25pM、約0.3pM、約0.35pM、約0.4pM、約0.45pM、または約0.5pMであり得る。いくつかの実施形態において、濃度は、少なくとも約0.05pM、約0.1pM、約0.15pM、約0.2pM、約0.25pM、約0.3pM、約0.35pM、約0.4pM、または約0.45pMであり得る。いくつかの実施形態において、濃度は、最大で約0.1pM、約0.15pM、約0.2pM、約0.25pM、約0.3pM、約0.35pM、約0.4pM、約0.45pM、または約0.5pMであり得る。いくつかの実施形態において、濃度は、約0.5pMから約2pMであり得る。いくつかの実施形態において、濃度は、約0.5pMから約0.6pM、約0.5pMから約0.7pM、約0.5pMから約0.8pM、約0.5pMから約0.9pM、約0.5pMから約1pM、約0.5pMから約1.25pM、約0.5pMから約1.5pM、約0.5pMから約1.75pM、約0.5pMから約2pM、約0.6pMから約0.7pM、約0.6pMから約0.8pM、約0.6pMから約0.9pM、約0.6pMから約1pM、約0.6pMから約1.25pM、約0.6pMから約1.5pM、約0.6pMから約1.75pM、約0.6pMから約2pM、約0.7pMから約0.8pM、約0.7pMから約0.9pM、約0.7pMから約1pM、約0.7pMから約1.25pM、約0.7pMから約1.5pM、約0.7pMから約1.75pM、約0.7pMから約2pM、約0.8pMから約0.9pM、約0.8pMから約1pM、約0.8pMから約1.25pM、約0.8pMから約1.5pM、約0.8pMから約1.75pM、約0.8pMから約2pM、約0.9pMから約1pM、約0.9pMから約1.25pM、約0.9pMから約1.5pM、約0.9pMから約1.75pM、約0.9pMから約2pM、約1pMから約1.25pM、約1pMから約1.5pM、約1pMから約1.75pM、約1pMから約2pM、約1.25pMから約1.5pM、約1.25pMから約1.75pM、約1.25pMから約2pM、約1.5pMから約1.75pM、約1.5pMから約2pM、または約1.75pMから約2pMであり得る。いくつかの実施形態において、濃度は、約0.5pM、約0.6pM、約0.7pM、約0.8pM、約0.9pM、約1pM、約1.25pM、約1.5pM、約1.75pM、または約2pMであり得る。いくつかの実施形態において、濃度は、少なくとも約0.5pM、約0.6pM、約0.7pM、約0.8pM、約0.9pM、約1pM、約1.25pM、約1.5pM、または約1.75pMであり得る。いくつかの実施形態において、濃度は、最大で約0.6pM、約0.7pM、約0.8pM、約0.9pM、約1pM、約1.25pM、約1.5pM、約1.75pM、または約2pMであり得る。いくつかの実施形態において、濃度は、約1pMから約50pMであり得る。いくつかの実施形態において、濃度は、約1pMから約2pM、約1pMから約3pM、約1pMから約4pM、約1pMから約5pM、約1pMから約7.5pM、約1pMから約10pM、約1pMから約12.5pM、約1pMから約15pM、約1pMから約20pM、約1pMから約25pM、約1pMから約50pM、約2pMから約3pM、約2pMから約4pM、約2pMから約5pM、約2pMから約7.5pM、約2pMから約10pM、約2pMから約12.5pM、約2pMから約15pM、約2pMから約20pM、約2pMから約25pM、約2pMから約50pM、約3pMから約4pM、約3pMから約5pM、約3pMから約7.5pM、約3pMから約10pM、約3pMから約12.5pM、約3pMから約15pM、約3pMから約20pM、約3pMから約25pM、約3pMから約50pM、約4pMから約5pM、約4pMから約7.5pM、約4pMから約10pM、約4pMから約12.5pM、約4pMから約15pM、約4pMから約20pM、約4pMから約25pM、約4pMから約50pM、約5pMから約7.5pM、約5pMから約10pM、約5pMから約12.5pM、約5pMから約15pM、約5pMから約20pM、約5pMから約25pM、約5pMから約50pM、約7.5pMから約10pM、約7.5pMから約12.5pM、約7.5pMから約15pM、約7.5pMから約20pM、約7.5pMから約25pM、約7.5pMから約50pM、約10pMから約12.5pM、約10pMから約15pM、約10pMから約20pM、約10pMから約25pM、約10pMから約50pM、約12.5pMから約15pM、約12.5pMから約20pM、約12.5pMから約25pM、約12.5pMから約50pM、約15pMから約20pM、約15pMから約25pM、約15pMから約50pM、約20pMから約25pM、約20pMから約50pM、または約25pMから約50pMであり得る。いくつかの実施形態において、濃度は、約1pM、約2pM、約3pM、約4pM、約5pM、約7.5pM、約10pM、約12.5pM、約15pM、約20pM、約25pM、または約50pMであり得る。いくつかの実施形態において、濃度は、少なくとも約1pM、約2pM、約3pM、約4pM、約5pM、約7.5pM、約10pM、約12.5pM、約15pM、約20pM、または約25pMであり得る。いくつかの実施形態において、濃度は、最大で約2pM、約3pM、約4pM、約5pM、約7.5pM、約10pM、約12.5pM、約15pM、約20pM、約25pM、または約50pMであり得る。以上に特定の濃度が記載されているが、当該濃度は例示的なものであり、他の濃度が使用されてもよい。様々な核酸が、ウェルで様々な濃度で存在し得る。さらに、すべての核酸が、ウェル間で同じ濃度で存在する必要はない。
【0035】
図8は、複数のアッセイの様々なウェルにおける1モル当たりのリードカウントの比率を示す。
【0036】
区分802では、予想されるRT効率は0.50であるが、様々なウェルにおいてRT効率が0.0から1.0であることが示されている。特に、RT効率が0.39を下回る場合、データが信頼性のないものであり、除外できることを示す。RT効率は、RT-PCR工程の逆転写部分の効果を示す(例えば、複数の核酸(例えば、ssDNAスパイクイン)のどの部分が逆転写によって変換されるか)。高いRT効率は、信頼性が高いデータであることを示し、逆に、低いRT効率は、データを除外する必要があり得ることを示す。いくつかの実施形態では、RT効率は、約0から約1であり得る。いくつかの実施形態では、RT効率は、約0から約0.1、約0から約0.2、約0から約0.3、約0から約0.4、約0から約0.5、約0から約0.6、約0から約0.7、約0から約0.8、約0から約0.9、約0から約0.95、約0から約1、約0.1から約0.2、約0.1から約0.3、約0.1から約0.4、約0.1から約0.5、約0.1から約0.6、約0.1から約0.7、約0.1から約0.8、約0.1から約0.9、約0.1から約0.95、約0.1から約1、約0.2から約0.3、約0.2から約0.4、約0.2から約0.5、約0.2から約0.6、約0.2から約0.7、約0.2から約0.8、約0.2から約0.9、約0.2から約0.95、約0.2から約1、約0.3から約0.4、約0.3から約0.5、約0.3から約0.6、約0.3から約0.7、約0.3から約0.8、約0.3から約0.9、約0.3から約0.95、約0.3から約1、約0.4から約0.5、約0.4から約0.6、約0.4から約0.7、約0.4から約0.8、約0.4から約0.9、約0.4から約0.95、約0.4から約1、約0.5から約0.6、約0.5から約0.7、約0.5から約0.8、約0.5から約0.9、約0.5から約0.95、約0.5から約1、約0.6から約0.7、約0.6から約0.8、約0.6から約0.9、約0.6から約0.95、約0.6から約1、約0.7から約0.8、約0.7から約0.9、約0.7から約0.95、約0.7から約1、約0.8から約0.9、約0.8から約0.95、約0.8から約1、約0.9から約0.95、約0.9から約1、または約0.95から約1であり得る。いくつかの実施形態では、RT効率は、約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、約0.95、または約1であり得る。いくつかの実施形態では、RT効率は、少なくとも約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、または約0.95であり得る。いくつかの実施形態では、RT効率は、最大で約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、約0.95、または約1であり得る。
【0037】
区分804では、予想されるDNase-RNA安定性比率は1.00から2.00であるが、様々なウェルにおいてDNase-RNA安定性比率が0.00から4.00であることが示されている。特に、DNase安定性比率が2.75を上回るか、1.75を下回る場合、データが信頼性のないものであり、除外できることを示す。DNase-RNA安定性比率は、DNase工程中に添加された複数の核酸のうちのどのくらいが別のウェルへの移動後に残存しているかを(例えば、当該工程中に添加された核酸の量と、DNase工程後に残存している核酸の量とを比較することによって)示す。予想より高いDNase-RNA安定性比率は、データの破損が生じた可能性があることを示し(例えば、後の工程が核酸の添加によって影響を受けたことを示すデータ)、逆に、予想より低いDNase-RNA安定性比率は、移動が失敗に終わったことを示す。いくつかの実施形態では、DNase RNA安定性比率は、約0から約2.5であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約0から約0.25、約0から約0.5、約0から約0.75、約0から約1、約0から約1.25、約0から約1.5、約0から約1.75、約0から約2、約0から約2.25、約0から約2.5、約0.25から約0.5、約0.25から約0.75、約0.25から約1、約0.25から約1.25、約0.25から約1.5、約0.25から約1.75、約0.25から約2、約0.25から約2.25、約0.25から約2.5、約0.5から約0.75、約0.5から約1、約0.5から約1.25、約0.5から約1.5、約0.5から約1.75、約0.5から約2、約0.5から約2.25、約0.5から約2.5、約0.75から約1、約0.75から約1.25、約0.75から約1.5、約0.75から約1.75、約0.75から約2、約0.75から約2.25、約0.75から約2.5、約1から約1.25、約1から約1.5、約1から約1.75、約1から約2、約1から約2.25、約1から約2.5、約1.25から約1.5、約1.25から約1.75、約1.25から約2、約1.25から約2.25、約1.25から約2.5、約1.5から約1.75、約1.5から約2、約1.5から約2.25、約1.5から約2.5、約1.75から約2、約1.75から約2.25、約1.75から約2.5、約2から約2.25、約2から約2.5、または約2.25から約2.5であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約0、約0.25、約0.5、約0.75、約1、約1.25、約1.5、約1.75、約2、約2.25、または約2.5であり得る。いくつかの実施形態では、DNase RNA安定性比率は、少なくとも約0、約0.25、約0.5、約0.75、約1、約1.25、約1.5、約1.75、約2、または約2.25であり得る。いくつかの実施形態では、DNase RNA安定性比率は、最大で約0.25、約0.5、約0.75、約1、約1.25、約1.5、約1.75、約2、約2.25、または約2.5であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約1.75から約2.75であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約1.75から約2、約1.75から約2.25、約1.75から約2.5、約1.75から約2.75、約2から約2.25、約2から約2.5、約2から約2.75、約2.25から約2.5、約2.25から約2.75、または約2.5から約2.75であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約1.75、約2、約2.25、約2.5、または約2.75であり得る。いくつかの実施形態では、DNase RNA安定性比率は、少なくとも約1.75、約2、約2.25、または約2.5であり得る。いくつかの実施形態では、DNase RNA安定性比率は、最大で約2、約2.25、約2.5、または約2.75であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2.75から約4であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2.75から約3、約2.75から約3.25、約2.75から約3.5、約2.75から約3.75、約2.75から約4、約3から約3.25、約3から約3.5、約3から約3.75、約3から約4、約3.25から約3.5、約3.25から約3.75、約3.25から約4、約3.5から約3.75、約3.5から約4、または約3.75から約4であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2.75、約3、約3.25、約3.5、約3.75、または約4であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2.75、約3、約3.25、約3.5、または約3.75であり得る。いくつかの実施形態では、DNase RNA安定性比率は、最大で約3、約3.25、約3.5、約3.75、または約4であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2から約20であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2から約4、約2から約6、約2から約8、約2から約10、約2から約12、約2から約14、約2から約16、約2から約18、約2から約20、約4から約6、約4から約8、約4から約10、約4から約12、約4から約14、約4から約16、約4から約18、約4から約20、約6から約8、約6から約10、約6から約12、約6から約14、約6から約16、約6から約18、約6から約20、約8から約10、約8から約12、約8から約14、約8から約16、約8から約18、約8から約20、約10から約12、約10から約14、約10から約16、約10から約18、約10から約20、約12から約14、約12から約16、約12から約18、約12から約20、約14から約16、約14から約18、約14から約20、約16から約18、約16から約20、または約18から約20であり得る。いくつかの実施形態では、DNase RNA安定性比率は、約2、約4、約6、約8、約10、約12、約14、約16、約18、または約20であり得る。いくつかの実施形態では、DNase RNA安定性比率は、少なくとも約2、約4、約6、約8、約10、約12、約14、約16、または約18であり得る。いくつかの実施形態では、DNase RNA安定性比率は、最大で約4、約6、約8、約10、約12、約14、約16、約18、または約20であり得る。
【0038】
区分806では、予想されるDNase非効率は約0.05であるが、様々なウェルにおいてDNase非効率が0.00から0.75であることが示されている。特に、DNase非効率が0.15より高い場合、データが信頼性のないものであり、除外できることを示す。DNase非効率は、溶解工程中に添加される核酸(例えば、DNAスパイクイン)の残量とDNase工程中に添加される核酸(例えば、RNAスパイクイン)の量とを比較することによってDNase工程の効果を示す。より高いDNase非効率は、DNase工程が成功せず、関連データを除外する必要があることを示す。いくつかの実施形態では、DNase非効率は、約0から約0.1であり得る。いくつかの実施形態では、DNase非効率は、約0から約0.01、約0から約0.02、約0から約0.03、約0から約0.04、約0から約0.05、約0から約0.06、約0から約0.07、約0から約0.08、約0から約0.09、約0から約0.1、約0.01から約0.02、約0.01から約0.03、約0.01から約0.04、約0.01から約0.05、約0.01から約0.06、約0.01から約0.07、約0.01から約0.08、約0.01から約0.09、約0.01から約0.1、約0.02から約0.03、約0.02から約0.04、約0.02から約0.05、約0.02から約0.06、約0.02から約0.07、約0.02から約0.08、約0.02から約0.09、約0.02から約0.1、約0.03から約0.04、約0.03から約0.05、約0.03から約0.06、約0.03から約0.07、約0.03から約0.08、約0.03から約0.09、約0.03から約0.1、約0.04から約0.05、約0.04から約0.06、約0.04から約0.07、約0.04から約0.08、約0.04から約0.09、約0.04から約0.1、約0.05から約0.06、約0.05から約0.07、約0.05から約0.08、約0.05から約0.09、約0.05から約0.1、約0.06から約0.07、約0.06から約0.08、約0.06から約0.09、約0.06から約0.1、約0.07から約0.08、約0.07から約0.09、約0.07から約0.1、約0.08から約0.09、約0.08から約0.1、または約0.09から約0.1であり得る。いくつかの実施形態では、DNase非効率は、約0、約0.01、約0.02、約0.03、約0.04、約0.05、約0.06、約0.07、約0.08、約0.09、または約0.1であり得る。いくつかの実施形態では、DNase非効率は、少なくとも約0、約0.01、約0.02、約0.03、約0.04、約0.05、約0.06、約0.07、約0.08、または約0.09であり得る。いくつかの実施形態では、DNase非効率は、最大で約0.01、約0.02、約0.03、約0.04、約0.05、約0.06、約0.07、約0.08、約0.09、または約0.1であり得る。いくつかの実施形態では、DNase非効率は、約0から約1であり得る。いくつかの実施形態では、DNase非効率は、約0から約0.1、約0から約0.2、約0から約0.3、約0から約0.4、約0から約0.5、約0から約0.6、約0から約0.7、約0から約0.8、約0から約0.9、約0から約1、約0.1から約0.2、約0.1から約0.3、約0.1から約0.4、約0.1から約0.5、約0.1から約0.6、約0.1から約0.7、約0.1から約0.8、約0.1から約0.9、約0.1から約1、約0.2から約0.3、約0.2から約0.4、約0.2から約0.5、約0.2から約0.6、約0.2から約0.7、約0.2から約0.8、約0.2から約0.9、約0.2から約1、約0.3から約0.4、約0.3から約0.5、約0.3から約0.6、約0.3から約0.7、約0.3から約0.8、約0.3から約0.9、約0.3から約1、約0.4から約0.5、約0.4から約0.6、約0.4から約0.7、約0.4から約0.8、約0.4から約0.9、約0.4から約1、約0.5から約0.6、約0.5から約0.7、約0.5から約0.8、約0.5から約0.9、約0.5から約1、約0.6から約0.7、約0.6から約0.8、約0.6から約0.9、約0.6から約1、約0.7から約0.8、約0.7から約0.9、約0.7から約1、約0.8から約0.9、約0.8から約1、または約0.9から約1であり得る。いくつかの実施形態では、DNase非効率は、約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、または約1であり得る。いくつかの実施形態では、DNase非効率は、少なくとも約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、または約0.9であり得る。いくつかの実施形態では、DNase非効率は、最大で約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、または約1であり得る。
【0039】
区分(808)では、予想される溶解RNA安定性比率は0.20から0.50であるが、様々なウェルにおいて溶解RNA安定性比率が0.00から1.00であることが示されている。特に、溶解RNA安定性比率が0.15より低い場合、データが信頼性のないものであり、除外できることを示す。溶解RNA安定性比率は、溶解工程中に添加される核酸(例えば、RNAスパイクイン)の量とDNase工程中に添加される核酸(例えば、他のRNAスパイクイン)の量とを比較することによって、工程間の移動の効果を示すか、またはRNaseの存在が後の工程に影響を及ぼすか否かを判定する。予想より高い溶解RNA安定性比率は、データの破損が生じた可能性があることを示し(例えば、後の工程が核酸の添加によって影響を受けたことを示すデータ)、逆に、予想より低い溶解RNA安定性比率は、移動が失敗に終わったことを示す。いくつかの実施形態では、溶解RNA安定性比率は、約0から約1であり得る。いくつかの実施形態では、溶解RNA安定性比率は、約0から約0.1、約0から約0.2、約0から約0.3、約0から約0.4、約0から約0.5、約0から約0.6、約0から約0.7、約0から約0.8、約0から約0.9、約0から約1、約0.1から約0.2、約0.1から約0.3、約0.1から約0.4、約0.1から約0.5、約0.1から約0.6、約0.1から約0.7、約0.1から約0.8、約0.1から約0.9、約0.1から約1、約0.2から約0.3、約0.2から約0.4、約0.2から約0.5、約0.2から約0.6、約0.2から約0.7、約0.2から約0.8、約0.2から約0.9、約0.2から約1、約0.3から約0.4、約0.3から約0.5、約0.3から約0.6、約0.3から約0.7、約0.3から約0.8、約0.3から約0.9、約0.3から約1、約0.4から約0.5、約0.4から約0.6、約0.4から約0.7、約0.4から約0.8、約0.4から約0.9、約0.4から約1、約0.5から約0.6、約0.5から約0.7、約0.5から約0.8、約0.5から約0.9、約0.5から約1、約0.6から約0.7、約0.6から約0.8、約0.6から約0.9、約0.6から約1、約0.7から約0.8、約0.7から約0.9、約0.7から約1、約0.8から約0.9、約0.8から約1、または約0.9から約1であり得る。いくつかの実施形態では、溶解RNA安定性比率は、約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、または約1であり得る。いくつかの実施形態では、溶解RNA安定性比率は、少なくとも約0、約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、または約0.9であり得る。いくつかの実施形態では、溶解RNA安定性比率は、最大で約0.1、約0.2、約0.3、約0.4、約0.5、約0.6、約0.7、約0.8、約0.9、または約1であり得る。
【0040】
区分(810)では、予想されるgDNA混入比率は0.0から0.09であるが、様々なウェルにおいてgDNA混入比率が0.00から0.10であることが示されている。特に、gDNA混入比率が0.10より高い場合、データが信頼性のないものであり、除外できることを示す。gDNA混入比率は、溶解工程中に添加される複数の核酸(例えば、DNAスパイクイン)と配列決定前にRT-PCR工程中に添加される複数の核酸(例えば、別の複数のDNAスパイクイン)とを比較することによって、アッセイの過程にわたってどれくらいのDNAが変換されなかったかを示す。より高いgDNA混入比率は、以前の核酸の添加によって後の工程に影響が及び、ゆえに、関連データを除外する必要があり得ることを示す。いくつかの実施形態では、gDNA混入比率は、約0から約0.5であり得る。いくつかの実施形態では、gDNA混入比率は、約0から約0.05、約0から約0.1、約0から約0.15、約0から約0.2、約0から約0.25、約0から約0.3、約0から約0.35、約0から約0.4、約0から約0.45、約0から約0.5、約0.05から約0.1、約0.05から約0.15、約0.05から約0.2、約0.05から約0.25、約0.05から約0.3、約0.05から約0.35、約0.05から約0.4、約0.05から約0.45、約0.05から約0.5、約0.1から約0.15、約0.1から約0.2、約0.1から約0.25、約0.1から約0.3、約0.1から約0.35、約0.1から約0.4、約0.1から約0.45、約0.1から約0.5、約0.15から約0.2、約0.15から約0.25、約0.15から約0.3、約0.15から約0.35、約0.15から約0.4、約0.15から約0.45、約0.15から約0.5、約0.2から約0.25、約0.2から約0.3、約0.2から約0.35、約0.2から約0.4、約0.2から約0.45、約0.2から約0.5、約0.25から約0.3、約0.25から約0.35、約0.25から約0.4、約0.25から約0.45、約0.25から約0.5、約0.3から約0.35、約0.3から約0.4、約0.3から約0.45、約0.3から約0.5、約0.35から約0.4、約0.35から約0.45、約0.35から約0.5、約0.4から約0.45、約0.4から約0.5、または約0.45から約0.5であり得る。いくつかの実施形態では、gDNA混入比率は、約0、約0.05、約0.1、約0.15、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45、または約0.5であり得る。いくつかの実施形態では、gDNA混入比率は、少なくとも約0、約0.05、約0.1、約0.15、約0.2、約0.25、約0.3、約0.35、約0.4、または約0.45であり得る。いくつかの実施形態では、gDNA混入比率は、最大で約0.05、約0.1、約0.15、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45、または約0.5であり得る。
【0041】
ある特定の比率が示され、ある特定の予想される比率が記載されているが、当業者であれば、核酸のリードカウントから比率を判定する他、予想されるリードカウントに基づいて予想される比率を判定することができるであろう。さらに、信頼性のないデータについてある特定のパラメータが記載されているが、これらは例示的なものであり、どのような工程が実行されるか、どのような条件でそれらの工程が実行されるか、また、当業者の最終的な実験目標に基づいて変化し得る。
【0042】
バーコード
指標として機能する可変ヌクレオチド配列(バーコード)は、本明細書に記載されるレポーター遺伝子のいずれに含まれていてもよい。さらに、バーコードは、別個のライブラリー調製反応において添加されてもよい。本明細書に記載される可変ヌクレオチド配列は、本明細書で使用される配列決定反応から得られた結果をデコンボリューションするために、試料インデックスとして使用することができる。
【0043】
いったん細胞の内容物が溶解剤によってそれぞれの区画に放出されると、そこに含まれる高分子成分(例えば、RNA、DNA、またはタンパク質などの試料の高分子成分)は、区画内でさらに処理され得る。本明細書に記載される方法およびシステムに従って、個々の試料の高分子成分の内容物は、それらの高分子成分の特徴付けの際に、それらが同じ試料または粒子に由来するものとして帰属され得るように、固有の識別子を提供され得る。個々の試料または試料の群に特徴を帰する能力は、特に個々の試料または試料の群に固有の識別子を割り当てることによって提供される。試料の高分子成分(および、結果としてのその特徴)に固有の識別子をタグ付けまたは標識するために、例えば、核酸バーコードの形態の固有の識別子は、個々の試料または試料の集団に割り当てられ得るか、または関連付けられ得る。その後、これらの固有の識別子を使用して、試料の成分や特徴を個々の試料または試料の群に帰属させることができる。
【0044】
いくつかの態様では、これは、個々の試料または試料の群を、固有の分子識別子配列(UMI)を含む固有の識別子またはバーコードと共に区画に分けることによって実行される。いくつかの態様では、固有の識別子は、個々の試料の核酸内容物、または試料の他の成分、特にそれらの核酸の断片に結合するか、またはそれ以外の方法で関連付けることができる核酸バーコード配列を含む核酸分子(例えば、オリゴヌクレオチド)の形態で提供される。核酸分子は、所定の区画における核酸分子間として、そこに含まれる核酸バーコード配列が同じであるが、異なる区画間として、核酸分子が異なるバーコード配列を有することができ、かつ、有し、あるいは、所定の分析における区画のすべてで多くの異なるバーコード配列を少なくとも表すように、区画に分けられる。いくつかの態様では、1つの核酸バーコード配列のみが所定の区画に関連付けられ得るが、いくつかの実施形態では、2つ以上の異なるバーコード配列が存在してもよい。
【0045】
核酸バーコード配列は、核酸分子(例えば、オリゴヌクレオチド)の配列内に約6個から約20個以上のヌクレオチドを含み得る。核酸バーコード配列は、約6個から約20、30、40、50、60、70、80、90、または100個以上のヌクレオチドを含み得る。いくつかの実施形態では、バーコード配列の長さは、約6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチドまたはそれ以上であってもよい。いくつかの実施形態では、バーコード配列の長さは、少なくとも約6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチドまたはそれ以上であってもよい。いくつかの実施形態では、バーコード配列の長さは、最大で約6、7、8、9、10、11、12、13、14、15、16、17、18、19、20ヌクレオチドまたはそれ以下であってもよい。これらのヌクレオチドは、完全に連続していてもよく、すなわち、隣接するヌクレオチドの単一のストレッチであってもよく、または1個以上のヌクレオチドによって分離された2個以上の別々の部分配列(subsequences)に分離されていてもよい。いくつかの実施形態では、分離したバーコード部分配列は、長さが約4から約16ヌクレオチドであってもよい。いくつかの実施形態では、バーコード部分配列は、約4、5、6、7、8、9、10、11、12、13、14、15、16ヌクレオチドまたはそれより長くてもよい。いくつかの実施形態では、バーコード部分配列は、少なくとも約4、5、6、7、8、9、10、11、12、13、14、15、16ヌクレオチドまたはそれより長くてもよい。いくつかの実施形態では、バーコード部分配列は、最大で約4、5、6、7、8、9、10、11、12、13、14、15、16ヌクレオチドまたはそれより短くてもよい。
【0046】
共に区画に分けられた核酸分子は、共に区画に分けられた試料からの核酸の処理に有用な他の機能的配列も含むことができる。これらの配列としては、例えば、関連するバーコード配列を結合させながら区画内の個々の試料からゲノムDNAを増幅するための標的化またはランダム/ユニバーサル増幅プライマー配列、配列決定プライマーまたはプライマー認識部位、例えば、配列の存在の識別のための、またはバーコード核酸をプルダウンするためのハイブリダイゼーションまたはプローブ配列、あるいは多くの他の潜在的な機能的配列のいずれかが挙げられる。例えば、1つの区画がオリゴヌクレオチドを含有している2つ以上の区画の合体、または区画、例えば、マイクロ流体系内の区画へのオリゴヌクレオチドの微分散を含む、オリゴヌクレオチドを共に区画に分ける他の機構も採用されてもよい。いくつかの実施形態では、プライマーは、バーコードオリゴヌクレオチドを含む。いくつかの実施形態では、プライマー配列は、鋳型核酸分子内の配列に相補的な標的化プライマー配列である。いくつかの実施形態では、第1の核酸分子は、1つ以上の機能的配列をさらに含み、第2の核酸分子は、1つ以上の機能的配列を含む。いくつかの実施形態では、1つ以上の機能的配列は、アダプター配列、追加のプライマー配列、プライマーアニーリング配列、配列決定プライマー配列、シーケンサーのフローセルに結合するように構成された配列、および固有の分子識別子配列からなる群から選択される。
【0047】
例えば、上記のバーコード化核酸分子(例えば、バーコード化オリゴヌクレオチド)を試料に添加する。いくつかの実施形態では、区画は、同じバーコード配列を有するバーコード化オリゴヌクレオチドを含む。いくつかの実施形態では、複数の区分のうちの1つの区分は、同一のバーコード配列を有するバーコード化オリゴヌクレオチドを含み、複数の区分内の各区分は、固有のバーコード配列を含む。いくつかの実施形態では、バーコード化オリゴヌクレオチドの集団は、少なくとも約1,000個の異なるバーコード配列、少なくとも約5,000個の異なるバーコード配列、少なくとも約10,000個の異なるバーコード配列、少なくとも約50,000個の異なるバーコード配列、少なくとも約100,000個の異なるバーコード配列、少なくとも約1,000,000個の異なるバーコード配列、少なくとも約5,000,000個の異なるバーコード配列、または少なくとも約10,000,000個以上の異なるバーコード配列を含む多様なバーコード配列ライブラリーを提供する。さらに、各バーコード化オリゴヌクレオチドは、多数の核酸(例えば、オリゴヌクレオチド)分子が結合した状態で提供され得る。特に、個々のバーコード化オリゴヌクレオチド上にバーコード配列を含む核酸分子の分子の数は、少なくとも約1,000個の核酸分子、少なくとも約5,000個の核酸分子、少なくとも約10,000個の核酸分子、少なくとも約50,000個の核酸分子、少なくとも約100,000個の核酸分子、少なくとも約500,000個の核酸分子、少なくとも約1,000,000個の核酸分子、少なくとも約5,000,000個の核酸分子、少なくとも約10,000,000個の核酸分子、少なくとも約50,000,000個の核酸分子、少なくとも約100,000,000個の核酸分子、少なくとも約250,000,000個の核酸分子、および、実施形態によっては、少なくとも約10億個以上の核酸分子であり得る。所与のバーコード化オリゴヌクレオチドの核酸分子は、同一(または共通)のバーコード配列、異なるバーコード配列、またはその両方の組み合わせを含んでもよい。所与のバーコード化オリゴヌクレオチドの核酸分子は、複数のセットの核酸分子を含んでもよい。所与のセットの核酸分子は、同一のバーコード配列を含んでもよい。同一のバーコード配列は、別のセットの核酸分子のバーコード配列と異なり得る。
【0048】
さらに、バーコード化オリゴヌクレオチドの集団が区画に分けられる際、結果として生じる区画の集団はさらに、少なくとも約1,000個の異なるバーコード配列、少なくとも約5,000個の異なるバーコード配列、少なくとも約10,000個の異なるバーコード配列、少なくとも約50,000個の異なるバーコード配列、少なくとも約100,000個の異なるバーコード配列、少なくとも約1,000,000個の異なるバーコード配列、少なくとも約5,000,000個の異なるバーコード配列、または少なくとも約10,000,000個の異なるバーコード配列を含む多様なバーコードライブラリーを含んでもよい。さらに、集団の各区画は、少なくとも約1,000個の核酸分子、少なくとも約5,000個の核酸分子、少なくとも約10,000個の核酸分子、少なくとも約50,000個の核酸分子、少なくとも約100,000個の核酸分子、少なくとも約500,000個の核酸分子、少なくとも約1,000,000個の核酸分子、少なくとも約5,000,000個の核酸分子、少なくとも約10,000,000個の核酸分子、少なくとも約50,000,000個の核酸分子、少なくとも約100,000,000個の核酸分子、少なくとも約250,000,000個の核酸分子、および、実施形態によっては、少なくとも約10億個の核酸分子を含んでもよい。
【0049】
いくつかの実施形態では、所定の区画内に複数の異なるバーコードを組み込むことが望ましい場合がある。例えば、いくつかの実施形態では、区画内のバーコード化オリゴヌクレオチドは、(1)区画内のすべてのバーコード化オリゴヌクレオチドによって共有される共通のバーコード配列、および(2)各バーコード化オリゴヌクレオチド間で異なる固有の分子識別子または追加のバーコード配列を含むことができる。共通のバーコード配列は、例えば、所定の区画からの出力の二重の確認または独立した確認として、所定の区画へのバーコードのより強いアドレスまたは属性を提供することによって、その後の処理における識別をより確実なものとする場合がある。
【0050】
いくつかの実施形態では、バーコード化オリゴヌクレオチドはビーズに結合し、ここで、特定のビーズに結合する核酸分子のすべては同じ核酸バーコード配列を含むが、多くの多様なバーコード配列は、使用されるビーズの集団にわたって表される。いくつかの実施形態では、例えば、ポリアクリルアミドポリマーマトリックスを含むヒドロゲルビーズは、多くの核酸分子を運ぶことができるため、核酸分子の固体支持体および区画への送達ビヒクルとして用いられ、本明細書の他の箇所に記載されるように、特定の刺激への曝露時にそれらの核酸分子を放出するように構成されてもよい。
【0051】
核酸分子(例えば、オリゴヌクレオチド)は、ビーズへの特定の刺激の適用時にビーズから放出可能であってもよい。いくつかの実施形態では、刺激は、例えば、核酸分子を放出する感光性の連結の切断による、光刺激であってもよい。他の実施形態では、熱刺激が使用されてもよく、ビーズ環境の温度の上昇は、連結の切断を引き起こすか、核酸分子の他の放出はビーズを形成する。さらに他の実施形態では、ビーズへの核酸分子の連結を切断するか、さもなければビーズからの核酸分子の放出をもたらす化学的刺激が使用されてもよい。一実施形態では、このような組成物は、試料のカプセル化のために上記のポリアクリルアミドマトリックスを含み、DTTなどの還元剤への曝露を介して結合した核酸分子の放出のために分解されてもよい。
【0052】
本開示の方法において使用するために企図され得る支持体は、例えば、ウェル、マトリックス、ロッド、容器、またはビーズであってもよい。支持体は、任意の有用なサイズ、表面化学、流動性、固体性、密度、多孔性、および組成などの任意の有用な特性および特徴を有していてもよい。いくつかの実施形態では、支持体は、プレート上のウェルの表面である。いくつかの実施形態では、支持体は、ゲルビーズなどのビーズであってもよい。ビーズは、固体または半固体であってもよい。ビーズのさらなる詳細は、本明細書の他の箇所で提供されている。
【0053】
支持体(例えば、ビーズ)は、それに官能化されたアンカー配列(例えば、本明細書に記載されている)を含んでもよい。アンカー配列は、例えば、ジスルフィド結合を介して支持体に結合されてもよい。アンカー配列は、部分的なリード配列および/またはフローセル機能的配列を含んでもよい。このような配列は、シーケンサー(例えば、Illuminaシーケンサー)によって配列に結合した核酸分子の配列決定を可能にし得る。様々なアンカー配列は様々な配列決定用途に役立つことがある。アンカー配列は、例えば、TruSeqまたはNexteraの配列を含んでもよい。アンカー配列は任意の有用な長さおよびヌクレオチド組成などの任意の有用な特徴を有していてもよい。例えば、アンカー配列は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20個以上のヌクレオチドを含んでもよい。いくつかの実施形態では、アンカー配列は、15個のヌクレオチドを含んでもよい。アンカー配列のヌクレオチドは、自然発生のものであってもよく、または、非自然発生のものであってもよい(例えば、本明細書に記載されるように)。ビーズは、それに結合した複数のアンカー配列を含んでもよい。例えば、ビーズは、それに結合した複数の第1のアンカー配列を含んでもよい。いくつかの実施形態では、ビーズは、それに結合した2つ以上の異なるアンカー配列を含んでもよい。例えば、ビーズは、それに結合した複数の第1のアンカー配列(例えば、Nextera配列)および複数の第2のアンカー配列(例えば、TruSeq配列)の両方を含んでもよい。それに結合した2つ以上の異なるアンカー配列を含むビーズについて、各異なるアンカー配列の配列は、ビーズから遠位の端部において、他のアンカー配列のそれぞれの配列から区別可能であってもよい。例えば、異なるアンカー配列は、ビーズから最も遠い2、3、4、5、6、7、8、9、または10個以上のヌクレオチドにおいて1個以上のヌクレオチドの違いを含んでもよい。
【0054】
いくつかの実施形態では、複数の異なるバーコード分子(例えば、核酸バーコード分子)が、同じ支持体(例えば、ビーズ)上に生成されてもよい。例えば、2つの異なるバーコード分子が同じ支持体上に生成されてもよい。代替的に、3つ以上の異なるバーコード分子が、同じ支持体上に生成されてもよい。同じ支持体に結合した異なるバーコード分子は、1つ以上の異なる配列を含んでもよい。例えば、異なるバーコード分子は、1つ以上の異なるバーコード配列および/または他の配列(例えば、スターター配列)を含んでもよい。いくつかの実施形態では、同じ支持体に結合した異なるバーコード分子は、同じバーコード配列を含んでもよい。同じ支持体に結合した異なるバーコード分子は、同じまたは異なるバーコード配列を含んでもよい。同様に、異なるバーコード分子は、同じまたは異なる固有の分子識別子(UMI)を含んでもよい。
【0055】
次世代シーケンシング
本明細書に開示される方法に記載されるように、細胞ベースのアッセイを含む細胞に対する検査薬による生物学的効果を検出するのに核酸分子の配列決定が使用され、これが有用である。概して、配列決定は、1つ以上のポリヌクレオチドにおけるヌクレオチド塩基の配列を判定するための方法および技術を指す。ポリヌクレオチドは、例えば、その変異体または誘導体(例えば、一本鎖DNA)を含む、デオキシリボ核酸(DNA)またはリボ核酸(RNA)であり得る。配列決定は、現在入手可能な様々なシステム、例えば、限定されないが、Illumina、Pacific Biosciences、Oxford Nanopore、またはLife Technologies(Ion Torrent)による配列決定システムによって実施することができる。このような装置は、対象によって提供された試料から装置によって生成された、対象(例えば、ヒト)の遺伝情報に対応する複数の生の遺伝データを提供することができる。いくつかの状況では、本明細書で提供されるシステムおよび方法は、プロテオミクス情報と共に使用されてもよい。代替的にまたは追加的に、配列決定は、核酸増幅、ポリメラーゼ連鎖反応(PCR)(例えば、デジタルPCR、定量的PCR、またはリアルタイムPCR)、または等温増幅を使用して実施されてもよい。そのようなシステムは、対象によって提供された試料からシステムによって生成された、対象(例えば、ヒト)の遺伝情報に対応する複数の生の遺伝データを提供してもよい。いくつかの例では、そのようなシステムは、配列決定リード(本明細書では「リード」ともいう)を提供する。リードは、配列決定された核酸分子の配列に対応する核酸塩基の文字列を含み得る。いくつかの状況では、本明細書で提供されるシステムおよび方法は、プロテオミクス情報と共に使用されてもよい。
【0056】
次世代シーケンシングは、大量の配列情報を生成することができる多くの技術(例えば、ハイスループットシーケンシング)を含み、サンガーシーケンシングまたはマキサム・ギルバートシーケンシングを除くものである。概して、次世代シーケンシングは、単一分子リアルタイムシーケンシング、合成によるシーケンシング、イオン半導体シーケンシングなどを包含する。例示的な次世代シーケンシングマシンは、Illumina,Inc.のMiniSeq、iSeq100、NextSeq 1000、NextSeq 2000、NovaSeq 6000、NextSeq 550シリーズなど、Thermo Fisher ScientificからのIon Torrentマシン、または、Pacific BiosciencesからのSequelシステムを含んでもよい。
【0057】
本明細書における方法と共に使用される次世代シーケンシングマシンは、1つの機械から24時間以内に少なくとも1、5、10、15、25、50、75、100、200、または300ギガバス以上のデータを生成することができる。
【0058】
本明細書における方法と共に使用される次世代シーケンシングマシンは、1つの機械から24時間以内に少なくとも1、1、4、10、15、25、50、75、100、200、300、500、または10億以上の配列リードのデータを生成することができる。
【0059】
シーケンシングデータを受信して解析し、その後、サーバー、解析ポータル、または電子メールを介して電子的に送信またはアクセスすることができる1つ以上のレポートを出力するためのコンピュータプログラム、コンピューティング装置、または解析プラットフォーム/システムも含まれる。コンピューティング装置または解析プラットフォームは、本明細書に記載されるアルゴリズムおよび方法に従って動作することができる。
【0060】
反応混合物
本明細書では、配列決定によって試料中のレポーターの発現レベルを判定するための反応混合物も提供される。いくつかの実施形態では、反応混合物は、本明細書で提供される対照核酸と、上記生体試料の少なくとも一部と、存在する場合には試料中のバーコードを増幅するのに十分な1つ以上の酵素または試薬とを含む。
【0061】
対照核酸は、一本鎖DNA、二本鎖DNA、一本鎖RNA、または二本鎖RNAのうちのいずれか1つ以上であってもよい。いくつかの実施形態では、上記対照核酸は、反応混合物あたり約10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、320、340、360、380、400、420、440、460、480、または500コピーの濃度で存在する。
【0062】
いくつかの実施形態では、酵素または試薬は、逆転写酵素、dNTP、バーコードもしくは対照核酸配列に特異的なプライマー対、マグネシウム塩、またはそれらの組み合わせを含む。
【0063】
いくつかの実施形態では、反応混合物は、対照核酸またはバーコード核酸を増幅または複製するために使用することができる1つ以上の酵素を含む。いくつかの実施形態では、酵素は、逆転写酵素である。逆転写酵素の非限定的な例としては、限定されないが、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、およびモロニーマウス白血病ウイルス(M-MuLV、MMLV)、およびその変異体が挙げられる。
【0064】
いくつかの実施形態では、反応はデオキシヌクレオチド三リン酸(dNTP)を含む。いくつかの実施形態では、キットは、核酸の他、いずれかの他の所望の核酸(例えば、dATG、dCTP、dTTP、dGTP)の増幅に必要なdNTPの各々の混合物を含む。
【0065】
いくつかの実施形態では、反応混合物はマグネシウム塩を含む。いくつかの実施形態では、マグネシウム塩は、反応の酵素(例えば、逆転写酵素)が機能し、標的核酸を増幅できるように十分な量で含まれる。いくつかの実施形態では、マグネシウム塩は、塩化マグネシウムである。いくつかの実施形態では、反応混合物は、約0.1mMから約50mMのマグネシウムイオンの濃度を含む。いくつかの実施形態では、マグネシウムイオンの濃度は、約1mMから約10mMである。
【0066】
いくつかの実施形態では、上記反応混合物の体積は、約10マイクロリットルから約100マイクロリットルである。いくつかの実施形態では、上記反応混合物の体積は、約20マイクロリットルから約90マイクロリットル、約30マイクロリットルから約80マイクロリットル、または約40マイクロリットルから約60マイクロリットルである。いくつかの実施形態では、上記反応混合物の体積は、約10、20、30、40、50、60、70、80、90、または100マイクロリットルである。
【0067】
品質管理方法
上述のように、本明細書に記載される方法によるアッセイ設計の非限定的な例は、1)ウェルプレートのウェルに細胞を播種する工程と、2)細胞を検査薬に接触させて、標的ポリペプチドを介して検査薬がレポーターの活性化(例えば、バーコードの発現)に影響を及ぼす時間を与える工程と、3)細胞を溶解して細胞から核酸を放出させる工程と、4)溶解物をDNAse処理し、関連RNAを生成する工程と、5)逆転写されたmRNAを逆転写および/または増幅し、cDNAまたは増幅されたcDNA(例えば、RT-PCR)を作製する工程と、6)次世代配列決定反応のためにcDNAを調製する工程と、7)調製したcDNAを配列決定する工程とを含んでもよい。
【0068】
図3は、DNase工程中に添加される複数の対照核酸のリードカウントを示す。示されているこの実施形態では、複数の核酸は、複数の二本鎖DNAスパイクである。この例では、溶解工程中に複数の核酸を添加した。DNase工程が行われなかったアッセイについては、「スパイク-DNaseなし」と標識されているグラフの左半分にある複数の核酸のリードカウントが得られ、DNase工程が行われたアッセイについては、「スパイク-標準-p」と標識されているグラフの右半分のリードカウントが得られた。ゆえに、グラフの左半分のリードカウントは大きく(1e+05と1e+04との間)、これは、複数の核酸(例えば、二本鎖DNAスパイク)が切断されておらず、したがって依然として溶液中に存在し、特定することができたためである。対照的に、左側のリードカウントははるかに低く、これは、複数の核酸のうちの多くが切断されており、したがって依然として溶液中に存在しているわけではなく、特定することができなかったためである。ゆえに、バーコードの使用により、DNase工程の程度を評価することができ(例えば、二本鎖DNAの量を約1e+05から0リードまで低下させる)、これは、リードカウントに基づくある特定の比率(例えば、DNase非効率)を用いても評価することができる。
【0069】
図4は、導入される複数の核酸の元の合計量に対する複数の対照核酸のリード割合を示す。示されているこの実施形態では、複数の核酸は、複数の一本鎖DNAである。さらに、示されているこの実施形態では、RT-PCR工程の直前に複数の核酸を添加した。この実施形態では、「スパイク-RTなし」と標識されているグラフの左側のリード割合は、逆転写試薬を使用しなかったアッセイのリード割合である。ゆえに、リード割合は高い傾向があり、多数は1.0付近であり、これは、RT-PCR工程において、試料中のRNAがいずれもDNAに変換されず、したがって配列決定反応に至ったリードのみがssDNAスパイクインに関連付けられるものであるからである。「スパイク-標準-p」と標識されているグラフの右側のリード割合は、RT-PCR工程を行ったアッセイのリード割合であり、RT-PCR工程を行った後にリード割合を判定した。ゆえに、リード割合は、試料中に存在するRNAの大部分がcDNAに転写されたことを示す。
【0070】
図5は、上述の1つ以上の工程中に添加される10,000スパイクの量で導入される様々な複数の核酸のリードカウントを示す。例えば、「n10185」と標識されたリードカウントは、RT-PCR工程中に添加されたRNAスパイクの量を表し、「n10186」と標識されたリードカウントは、DNase工程中に添加されたRNAの量を表し、「n10187」と標識されたリードカウントは、溶解工程中に添加された二本鎖DNAスパイクの量を表し、「n10188」と標識されたリードカウントは、RT-PCR工程中の一本鎖DNAの量を表す。示されているこの実施形態では、リードカウントn10185は、RT-PCR工程の開始時にとられ、ゆえに、リードカウントは、逆転写酵素がまだ行われていないため、10,000であるか、またはこれをわずかに下回る。示されているこの実施形態では、リードカウントn10186は、DNase工程中のRNAの保存に関する情報を提供し、ゆえに、リードカウントは、10,000であるか、またはこれをわずかに下回るので、DNaseがRNAスパイクを分解しなかったことを示す。示されているこの実施形態では、リードカウントn10187は、DNase工程におけるDNA分解の効率に関する情報をもたらし、したがって、多くの二本鎖DNAがDNase工程中に切断されるため、リードカウントがより低くなる。さらに、示されているこの実施形態では、リードカウントn10188は、RT-PCR工程の効率に関する情報をもたらし、したがって、試料RNAの多くがDNAに変換されたため、リードカウントがより低くなり、添加されたDNAスパイクの全体のカウントを引き下げている。
【0071】
図7は、DNase工程中のRNAスパイク(例えば、リードカウント702)、溶解工程中のDNAスパイク(例えば、リードカウント704)、溶解工程中のRNAスパイク(例えば、リードカウント706)、RT-PCR工程中のDNAスパイク(例えば、リードカウント708)、およびRT-PCR工程中のRNAスパイク(例えば、リードカウント710)の様々なリードカウントを示す。示されているリードカウントは、2つの異なるアッセイ(例えば、実行110と実行112)に関連付けられ、各アッセイで使用される複数のウェル(例えば、プレート105、プレート106、プレート109、プレート110、プレート5、およびプレート6)から得たものである。
【0072】
上述のように、図3~7に示されている上記結果から、溶解RNA安定性比率、DNase非効率、RT効率、RT-PCR RNA安定性比率、およびDNase RNA安定性比率などの特定の比率が算出されてもよい。
【実施例
【0073】
以下の例示的な実施例は、本明細書に記載される組成物および方法の実施形態を表し、いずれにしても限定することを意味するものではない。
【0074】
実施例1-対照におけるRNAベースのスパイクにより、液体処理の不備を示すウェルからのデータを棄却することができる
いくつかの重要な工程において本発明者らのワークフローの性能を知らせることができる特殊なプロセス対照を設けた。これらの対照は、様々な中間反応で試料に正確な量で添加された様々な合成DNA分子とRNA分子を含む。その後、これらの「スパイクイン」は、実際の試料と共に同じ下流プロセスを受ける。これらの対照の配列決定による読み出しは、多重化アッセイ終了時に行われ、その結果により、プロセスがどのように行われたか、そして問題があるのであれば、プロセスのどの態様が問題を経験していたかについて重要な洞察がもたらされる。これらの対照のメトリックによって、プロセスの課題の迅速な検出、調査、および解決が可能になった。
【0075】
例えば、図1では、マルチウェルプレートのウェル中の細胞を検査薬に接触させてバーコード化レポーターを発現させる(または発現させない)HTSアッセイを実施した。RNAを回収し、逆転写し、次世代シーケンシングアッセイを用いて配列決定した。いくつかの合成RNAスパイクの性能により、どのように多重化アッセイを行うかについて洞察がもたらされる。図1の例では、これらの分子の存在量が少ないウェルを相当数含んだプレートが4つあり、これらは、本発明者らの液体移動工程のうちの1つにおいてプロセスに課題があることを示している。この図では、RNAスパイクイン(sike in)のリードカウントを有するウェルが所定のカットオフを下回っており、棄却となった。
【0076】
個別の品質管理スパイクインを使用することで実現した改善の影響を測定するのに加え、データの品質を測定するための解析ツールを開発した。大部分のハイスループットバイオアッセイは、マルチウェルのマイクロタイタープレートで行う。概して、これらのプレートの各ウェルでは、特定の実験条件、すなわち、化学物質がウェル中の細胞に及ぼす影響を試験する。上述のプロセス対照の他、本発明者らの細胞レポーターの挙動により、複数の特定の品質管理フィルタを適用して、性能の低いウェルと良好なものを区別することができる。品質が高いウェルからくるデータのみを下流バイオインフォマティクスパイプラインに通して解析を行う。どのくらいのウェルがQCゲートを通過できないか、そしてなぜ通過できないかについてのメトリックにより、プロセスの監視が可能になり、より重点的に問題をトラブルシューティングすることができる。
【0077】
実施例2-対照におけるRNAベースのスパイクにより、液体処理の不備を示すウェルからのデータを棄却することができる
上述のような溶解工程、DNase工程、RT-PCR工程、および配列決定工程を含むプロセスに対する特殊なプロセス対照を判定する。
【0078】
20μLの溶解緩衝液と複数の細胞を含む溶液を作製して細胞を溶解し、DNAスパイク(例えば、第2の複数の核酸)とRNAスパイク(例えば、第1の複数の核酸)を、RNAスパイク(例えば、第1の複数の対照核酸)の濃度が0.5pM、DNAスパイク(例えば、第2の複数の対照核酸)の濃度が0.5pMとなるように添加する。
【0079】
8μLの溶解溶液を新たなウェルに移し、4μmの緩衝液を添加するのに加えて(その結果、総体積が12μLとなる)、RNAスパイクイン(例えば、第5の複数の核酸)を添加して0.5pMの濃度を達成し、DNase工程を行う。
【0080】
4μLのDNase溶液を新たなウェルに移して、RNAスパイク(例えば、第3の複数の核酸)を、総濃度が0.13pMとなるように、DNAスパイク(例えば、第4の複数の核酸)を、総濃度が0.13pMとなるようにした(その結果、総体積が12μLとなる)。RT-PCRを行う。その後、RT PCR工程の試料を調製し、次世代シーケンシングマシン上で配列決定する。配列決定後にそれぞれの複数の核酸について総カウントを収集し、データを用いて、アッセイが特定の公差未満で実施され、それに応じて個々のウェルからのデータを認容するか、棄却するかを判定する。あるいは、通過できないウェルが多すぎる場合は、オペレータがトラブルシューティングして、どの工程が非効率的に実行されているかを判定してもよい。
【0081】
本発明の好ましい実施形態が本明細書中で示され、記載されてきたが、このような実施形態はほんの一例として提供されているに過ぎないことが当業者に明らかであろう。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代替案が、本発明の実施に際して利用され得ることを理解されたい。
【0082】
本明細書で言及されているすべての刊行物、特許出願、発行特許、およびその他の文書は、個々の刊行物、特許出願、発行特許、またはその他の文書がその全体が参照により組み込まれることが具体的かつ個別に示されているかのように、参照により本明細書に組み込まれる。参照により組み込まれるテキストに含まれる定義は、本開示における定義と矛盾する範囲において除外される。
図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】