(58)【調査した分野】(Int.Cl.,DB名)
前記第1の細胞ポリヌクレオチドが、重鎖免疫グロブリン(IgH)ポチヌクレオチド、T細胞受容体アルファ(TCRα)ポリヌクレオチド、またはT細胞受容体ガンマ(TCRγ)ポリヌクレオチドであり、前記第2の細胞ポリヌクレオチドが、軽鎖免疫グロブリン(IgL)ポリヌクレオチド、T細胞受容体ベータ(TCRβ)ポリヌクレオチド、T細胞受容体デルタ(TCRδ)ポリヌクレオチドである、請求項1に記載の方法。
前記第1および前記第2の容器−分子バーコード化ポリヌクレオチド、またはこれらの増幅産物をシークエンシングするステップをさらに含む、請求項1から3のいずれか一項に記載の方法。
前記複数の容器のうちの単一容器における前記第1および前記第2の容器−分子バーコード化ポリヌクレオチドが、異なる分子バーコードを含む、請求項1から5のいずれか一項に記載の方法。
前記複数の容器のうちの2つまたはそれより多くの異なる容器内の容器バーコード化オリゴヌクレオチドが、これらの容器バーコードの上流の第1の共通容器配列、これらの容器バーコードの下流の第2の共通容器配列、またはこれらの両方を含む、請求項1から9のいずれか一項に記載の方法。
前記複数の容器のうちの各容器内の前記複数の分子バーコード化オリゴヌクレオチド分子の各々が、前記分子バーコードの上流の第1の共通分子配列、前記分子バーコードの下流の第2の共通分子配列、またはこれらの両方を含む、請求項1から11のいずれか一項に記載の方法。
(b)が、前記第1の細胞ポリヌクレオチドの共通配列にハイブリダイズした第1の標的プライマーを伸長するステップ、および前記第2の細胞ポリヌクレオチドの共通配列にハイブリダイズした第2の標的プライマーを伸長するステップを含み、ここで、該第1および該第2の標的プライマーが、非鋳型ターミナルトランスフェラーゼ活性を含む逆転写酵素によって伸長され、3つまたはそれより多くの同一の非鋳型ヌクレオチドが該第1および該第2の相補的ポリヌクレオチドの3’末端に付加される、請求項1から15のいずれか一項に記載の方法。
(c)の形成するステップが、前記複数の分子バーコード化オリゴヌクレオチド分子の前記第1および前記第2の分子バーコード化オリゴヌクレオチド分子の3’末端領域を、それぞれ前記第1および第2の相補的ポリヌクレオチドの3’末端に存在する3つまたはそれより多くの非鋳型ヌクレオチドにハイブリダイズさせることを含む、請求項1から16のいずれか一項に記載の方法。
第1の標的プライマー、第2の標的プライマー、前記容器バーコード化オリゴヌクレオチド、前記複数の分子バーコード化オリゴヌクレオチド分子、またはこれらの任意の組合せが、固体支持体に結合されていない、請求項1から20のいずれか一項に記載の方法。
前記第1または第2の細胞ポリヌクレオチド、またはこれらの両方の配列を有するいくつかの出発分子を、前記固有の分子バーコードに基づき決定するステップをさらに含む、請求項1から27のいずれか一項に記載の方法。
前記第1の容器−分子バーコード化ポリヌクレオチドが、前記容器バーコード化オリゴヌクレオチド分子の容器バーコードまたはその増幅産物、および前記第1の分子バーコード化ポリヌクレオチドまたはその増幅産物を含み、前記第2の容器−分子バーコード化ポリヌクレオチドが、前記容器バーコード化オリゴヌクレオチドの容器バーコードまたはその増幅産物、および前記第2の分子バーコード化ポリヌクレオチドまたはその増幅産物を含む、請求項1から29のいずれか一項に記載の方法。
(c)の形成するステップが、前記複数の分子バーコード化オリゴヌクレオチド分子の第1の分子バーコード化オリゴヌクレオチド分子を、前記第1の相補的ポリヌクレオチドに結合させること、および前記複数の分子バーコード化オリゴヌクレオチド分子の第2の分子バーコード化オリゴヌクレオチド分子を、前記第2の相補的ポリヌクレオチドに結合させること、を含む、請求項1から31のいずれか一項に記載の方法。
(d)の形成するステップが、第1の容器バーコード化オリゴヌクレオチド分子を、前記第1の分子バーコード化ポリヌクレオチドに結合させること、および第2の容器バーコード化オリゴヌクレオチド分子を、前記第2の分子バーコード化ポリヌクレオチドに結合させること、を含む、請求項1から32のいずれか一項に記載の方法。
(a)複数の容器を形成するステップであって、該複数の容器のうちの各容器が、複数の細胞を含む試料に由来する単一細胞、各々が固有の分子バーコードを含む複数の分子バーコード化オリゴヌクレオチド分子、および容器バーコードを含む容器バーコード化オリゴヌクレオチドを含み、該複数の容器のうちの第1の容器内の容器バーコード化オリゴヌクレオチドの容器バーコードが、該複数の容器のうちの第2の容器内の容器バーコード化オリゴヌクレオチドの容器バーコードと異なり、該複数の容器のうちの各容器内の容器バーコード化オリゴヌクレオチドが、単一の分子として存在する、ステップと;
(b)該複数の容器のうちの1つまたは複数の容器内で、(i)該単一細胞に由来する第1の細胞ポリヌクレオチドに相補的な第1の相補的ポリヌクレオチド、および(ii)該単一細胞に由来する第2の細胞ポリヌクレオチドに相補的な第2の相補的ポリヌクレオチドを作製するステップと;
(c)第1の分子バーコード化ポリヌクレオチド、および第2の分子バーコード化ポリヌクレオチドを形成するステップと;
(d)容器バーコード化オリゴヌクレオチドを増幅させて、1つまたはそれより多くのコピーの該容器バーコード化オリゴヌクレオチドを生成するステップと;
(e)該1つまたはそれより多くのコピーの該容器バーコード化オリゴヌクレオチドの第1のコピーを、該第1の分子バーコード化ポリヌクレオチドにハイブリダイズさせるステップ、および該1つまたはそれより多くのコピーの該容器バーコード化オリゴヌクレオチドの第2のコピーを、該第2の分子バーコード化ポリヌクレオチドにハイブリダイズさせるステップと;
(f)第1の容器−分子バーコード化ポリヌクレオチド、および第2の容器−分子バーコード化ポリヌクレオチドを形成するステップと
を含む、ポリヌクレオチドをバーコード化する方法。
(f)の形成するステップが、前記第1の分子バーコード化ポリヌクレオチドの3’末端を伸長させること、および前記第2の分子バーコード化ポリヌクレオチドの3’末端を伸長させること、を含む、請求項37に記載の方法。
【発明を実施するための形態】
【0065】
いくつかの態様を、例示のための例の適用について言及しながら以下に記載する。本明細書で記載される特色についての完全な理解をもたらすように、多数の具体的な詳細、関係、および方法が明示されることを理解されたい。しかし、当業者は、本明細書で記載される特色は、具体的な詳細の1つまたは複数を伴わずに実施することもでき、他の方法によっても実施できることを容易に認識するであろう。一部の行為は、異なる順序で生じる場合もあり、かつ/または他の行為もしくはイベントと共時的に生じる場合もあるので、本明細書で記載される特色は、行為またはイベントについて例示される順序付けによって限定されない。さらに、例示される全ての行為またはイベントが、本明細書で記載される特色に従う方法を実行するのに要求されるわけではない。
【0066】
本明細書で使用される用語法は、特定の場合について記載することだけを目的とするものであり、限定的であることを意図するものではない。本明細書で使用される場合、単数形の「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈によりそうでないことが明らかに示されない限りにおいて、複数形も含むことが意図される。さらに、「含むこと」、「含む」、「有すること」、「有する」、「伴う」という用語、またはこれらの変化形が詳細な説明および/または特許請求の範囲で使用される限り、このような用語は、「含むこと」という用語と同様に包含的であることを意図する。
【0067】
「約」または「およそ」という用語は、当業者により決定される特定の値について、許容可能な誤差の範囲内にあることを意味する場合があり、これは、値がどのように測定または決定されるか、すなわち、測定システムの限界に部分的に依存するであろう。例えば、「約」とは、当技術分野における慣行に従い、1の標準偏差または1の標準偏差を超える範囲内を意味しうる。代替的に、「約」とは、所与の値の最大で20%、最大で10%、最大で5%、または最大で1%の範囲を意味しうる。代替的に、特に、生体系または生物学的過程に関して述べると、用語は、値の桁数の範囲内、5倍以内、より好ましくは2倍以内を意味しうる。特定の値が本出願および特許請求の範囲において記載される場合、そうでないことが述べられていない限りにおいて、特定の値について、許容可能な誤差の範囲内にあることを意味する「約」という用語を仮定するものとする。
【0068】
T細胞受容体鎖の対および抗体免疫グロブリン鎖の対は、両方とも免疫受容体の種類であり、進化において類縁である。ハイスループットシークエンシングおよび診断法のためのポリヌクレオチドライブラリーを生成することが、本発明の目的である。また、抗体および/またはTCRを発見するための、ヒト由来のライブラリーパネルであって、特異的な共通の属性を有する患者またはコホートに由来するライブラリーパネルを開発することも本発明の目的である。出発材料は、末梢血の場合もあり、免疫細胞を、包括的に単離するか、または望ましい場合、ナイーブ、メモリー、およびASCについて部分分取する組織生検からのものである場合もある。開示される発明は、複数の異なる種類の可変配列の対、例えば、T細胞受容体鎖の対および抗体免疫グロブリン鎖の対に適用することができる。
【0069】
免疫細胞などの単離細胞は、液滴1つ当たり単一またはそれ未満の免疫細胞を含有する、個別のピコリットルコンパートメントを創出するように、油中水エマルジョン(液滴)などの容器内に封入することができる。被験体に由来する生物学的試料など、各試料について、数百万個の細胞を加工することができ、単一細胞シークエンシング技術におけるハイスループットが可能となる。本明細書で記載される方法を使用して、ビーズなど、固体支持体の使用を回避することができる。また、本明細書で記載される方法を使用して、別個の容器集団を生成する必要も回避することができる。例えば、配列のライブラリーを、同じもしくは単一の反応で、または単一もしくは複数の容器集団内で生成することができる。V
HおよびV
L抗体鎖ならびに/またはVα/VβおよびVγ/VδT細胞受容体(TCR)鎖などの細胞ポリヌクレオチドに相補的なポリヌクレオチドを、容器の形成中に導入する。また、容器バーコードを有するポリヌクレオチドも、容器の形成中に導入することができる。これらの容器バーコード化ポリヌクレオチドは、容器バーコードを含有する各細胞ポリヌクレオチドが、それらが存在する容器に対応する固有の同一性コードを含有するように、縮重バーコードを保有しうる。また、分子バーコードを有する複数のポリヌクレオチドも、容器の形成中に導入することができる。これらの分子バーコード化ポリヌクレオチドは、分子バーコードを含有する各細胞ポリヌクレオチド分子が、それらが由来する単一細胞ポリヌクレオチド分子に対応する固有の同一性コードを含有するように、縮重バーコードを保有しうる。数百万個の単一の免疫細胞を、エマルジョンの内部で溶解させることができ、プライマーを使用して、V
HおよびV
Lならびに/またはVα/Vβおよび/もしくはVγ/Vδ鎖転写物などの細胞転写物を逆転写またはコピーさせるのに続き、容器バーコードおよび分子バーコードによりタグ付けし、バーコード化ポリヌクレオチドのPCR増幅を行うことができる。単一の免疫細胞(例えば、B細胞またはT細胞)から生じる、各V
HおよびV
Lならびに/またはVα/Vβおよび/もしくはVγ/Vδ鎖は事実上、同じ容器バーコードの同一性により、互いと連結することができる。
【0070】
次いで、次世代シークエンシング(NGS)タグを付加するために、V
HおよびV
Lならびに/またはVα/Vβおよび/もしくはVγ/Vδ鎖を容器から回収し、PCRで富化することができる。ハイスループットシークエンシングプラットフォームに続き、レパートリーの多様性、抗体の頻度についての解析、CDR3の特徴付け、体細胞超変異についての系統発生解析などを使用して、ライブラリーをシークエンシングすることができる。容器および分子バーコード配列をデコンボリュートすることにより、適正にマッチさせたV
HおよびV
Lならびに/またはVα/Vβおよび/もしくはVγ/Vδ対のデータベースを生成することができる。単一の免疫細胞の各々を、それらのそれぞれの容器内で単離するため、2回ずつ観察される各容器バーコードについて、シークエンシングされた転写物は、同じエマルジョン液滴から導出され、したがって、固有の単一細胞から導出された。同じ容器バーコードを含有する配列について観察される、異なる分子バーコードの各々について、シークエンシングされた転写物は、単一細胞からの異なる転写物分子から導出された。同じ容器バーコードを含有する配列について観察される、同じ分子バーコードの各々について、シークエンシングされた転写物は、単一細胞からの同じ転写物分子から導出された(例えば、PCR複製物)。
【0071】
シークエンシングと並行して、容器から回収される、V
HおよびV
Lならびに/またはVα/Vβおよび/もしくはVγ/Vδ鎖のライブラリーを、抗体発現ベクターにクローニングし、酵母ディスプレイスクリーニングのために共トランスフェクトすることができる。この同一なライブラリープールのクローニングは、一部の希少な免疫細胞だけを、1つまたは他のアッセイにおいて捕捉するので、生物学的試料を最初に分けることと比較して好ましい方法である。ヒト由来のV
HおよびV
Lならびに/またはVαおよびVβならびに/もしくはVγおよびVδ鎖のライブラリーは、古典的なディスプレイアッセイと同様に、対のマッチングが適正であるか適正でないかに関わらず、発現させることができる。次いで、酵母ディスプレイを、1つまたは複数の抗原標的に対して実施して、潜在的な抗体候補について富化することができる。
【0072】
酵母ディスプレイなどのディスプレイ技術から得られる陽性の候補抗体を、シークエンシングし、マッチさせた対についてのバーコードデータベースに対して検索することができる。酵母ディスプレイされたV
Hならびに/またはVαおよび/もしくはVγ鎖の各々は、それぞれ、そのそれぞれのV
LまたはVβもしくはVδ鎖へと戻してマッチさせることができ、酵母ディスプレイされたV
Lならびに/またはVβおよび/もしくはVδ鎖の各々は、それぞれ、そのそれぞれのV
HまたはVαもしくはVγ鎖へと戻してマッチさせることができる。これらの適正な候補の対は、遺伝子合成し、哺乳動物の細胞系内で発現させ、目的の標的に対して、機能的に検証することができる。これらの候補は、完全ヒト抗体および/またはTCRでありうる。
【0073】
「抗体」とは、自然であれ、部分的または全体的に合成により作製されたのであれ、免疫グロブリン(Ig)を指す。「T細胞受容体」(「TCR」)とは、自然であれ、部分的または全体的に合成により作製されたのであれ、主要組織適合性複合体(MHC)分子に結合した抗原を認識する、Tリンパ球(T細胞)の表面上に見出される分子を指す。抗原結合性ドメインであるか、または抗原結合性ドメインと相同である、結合性ドメインを有するポリペプチドまたはタンパク質が含まれる。用語は、「抗原結合性断片」および下記で記載されるような類似の結合性断片についての他の互換的な用語をさらに含む。また、相補性決定領域(CDR)グラフトされた抗体およびTCRならびに他のヒト化抗体およびTCR(CDRの修飾およびフレームワーク領域の修飾を含む)も、これらの用語により想定されている。免疫グロブリン鎖(例えば、重鎖および軽鎖)だけに言及しうるが、開示される発明は、複数の他の異なる種類の配列の対、例えば、T細胞受容体鎖の対(TCRαおよびTCRβ鎖ならびにTCRγおよびTCRδ鎖)にも適用することができ、免疫グロブリンに限定されないことに注目されたい。
【0074】
天然抗体および天然の免疫グロブリンは通例、2つの同一な軽(L)鎖および2つの同一な重(H)鎖からなる、約150,000ドルトンのヘテロ四量体の糖タンパク質である。各軽鎖は典型的に、1つの共有結合によるジスルフィド結合により、重鎖に連結されているが、ジスルフィド連結の数は、異なる免疫グロブリンアイソタイプの重鎖間で変化する。各重鎖および軽鎖はまた、規則的な間隔を置いた鎖内ジスルフィド架橋も有する。各重鎖は、一方の末端において、可変ドメイン(V
H)に続いて、いくつかの定常ドメイン(C
H)を有する。各軽鎖は、一方の末端(V
L)において、可変ドメインを有し、その他方の末端において、定常ドメイン(C
L)を有し;軽鎖の定常ドメインは、重鎖の第1の定常ドメインによりアラインされ、軽鎖の可変ドメインは、重鎖の可変ドメインによりアラインされる。特定のアミノ酸残基が、軽鎖可変ドメインと重鎖可変ドメインとの間のインターフェースを形成すると考えられる。抗体は、IgA、IgD、IgE、IgG、およびIgMなど、それらの重鎖の定常ドメインのアミノ酸配列に応じて異なるクラスに割り当てることができ、これらのうちのいくつかは、サブクラス(アイソタイプ)、例えば、IgG
1、IgG
2、IgG
3、IgG
4、IgA、およびIgA
2にさらに分けることができる。抗体の重鎖(IgH)は、それらの定常ドメインのアミノ酸配列に基づき、それぞれ、α、δ、ε、γ、およびμと呼ばれる、免疫グロブリンの異なるクラスに対応する。任意の脊椎動物種に由来する抗体の軽鎖(IgL)は、それらの定常ドメインのアミノ酸配列に基づき、カッパ(κ)およびラムダ(λ)と呼ばれる、2つの明らかに顕著に異なる種類のうちの1つに割り当てることができる。
【0075】
多様ながんまたは感染性生物と関連する抗原を認識するT細胞の能力は、アルファ(α)鎖およびベータ(β)鎖またはガンマ(γ)およびデルタ(δ)鎖の両方から構成される、そのTCRにより付与される。これらの鎖を構成するタンパク質は、TCRのとてつもない多様性を生み出す固有の機構を用いるDNAによりコードされる。このマルチサブユニットの免疫認識受容体は、CD3複合体と会合し、抗原提示細胞(APC)の表面上のMHCクラスIおよびIIタンパク質により提示されるペプチドに結合する。TCRの、APC上の抗原性ペプチドへの結合は、T細胞とAPCとの接点の免疫シナプスにおいて生じるT細胞の活性化における中心的イベントである。
【0076】
各TCRは、可変相補性決定領域(CDR)のほか、フレームワーク領域(FR)および定常領域を含有する。αおよびβ鎖可変ドメインの第3の相補性決定領域(CDR3)ループのアミノ酸配列が大部分、β鎖遺伝子座内の、可変(Vβ)遺伝子セグメントと、多様性(Dβ)遺伝子セグメントと、結合(Jβ)遺伝子セグメントとの間の組換え、およびα鎖遺伝子座内の、類似するVα遺伝子セグメントとJα遺伝子セグメントとの間の組換えのそれぞれから生じる、αβT細胞の配列多様性を決定する。TCRαおよびβ鎖遺伝子座における、複数のこのような遺伝子セグメントの存在は、多数の顕著に異なるCDR3配列のコードを可能とする。TCR遺伝子再構成の過程中の、Vβ−Dβ、Dβ−Jβ、およびVα−Jα結合部における、ヌクレオチドの独立の付加および欠失は、CDR3配列の多様性をさらに増大させる。この点で、免疫能は、TCRの多様性に反映されている。
【0077】
γδTCRは、それが、生得的免疫系と緊密に相互作用する受容体をコードするという点で、αβTCRと顕著に異なる。TCRγδは、発生の早期に発現し、特殊な解剖学的分布を有し、固有の病原体および低分子特異性を有し、広範なスペクトルの生得的および後天的細胞性相互作用を有する。個体発生の早期には、出生前に、TCRγδ細胞の限局的なサブセットが多様な組織に定着するので、TCRγ VおよびJセグメント発現の偏りのあるパターンが確立される。したがって、病原体および毒性分子への環境的曝露による刺激に続く、末梢における広範にわたる拡大により、成体組織内の多様なTCRγレパートリーの大半がもたらされる。
【0078】
B細胞により発現されるIgは、2つの重鎖(IgH)および2つの軽鎖(IgL)である、4つのポリペプチド鎖からなるタンパク質であり、H
2L
2構造を形成する。IgHおよびIgL鎖の各対は、V
LおよびV
H領域からなる超可変ドメインと、定常ドメインとを含有する。IgのIgH鎖には、μ、δ、γ、α、およびβといういくつかの種類がある。個体におけるIgの多様性は主に、超可変ドメインにより決定される。TCRと同様に、IgH鎖のVドメインは、V
H、D
H、およびJ
H遺伝子セグメントのコンビナトリアル結合により創出される。Ig遺伝子再構成の過程中の、V
H−D
H、D
H−J
H、およびV
H−J
H結合部における、ヌクレオチドの独立の付加および欠失は、超可変ドメイン配列の多様性をさらに増大させる。この場合、免疫能は、Igの多様性に反映されている。
【0079】
抗体鎖、例えば、重鎖および軽鎖、またはTCR鎖、例えば、アルファ(α)およびベータ鎖またはガンマ(γ)およびデルタ(δ)鎖について言及する場合の「可変」とは、抗体またはTCR間で配列が異なり、その特定の抗原に対する、各特定の抗体またはTCRの結合および特異性に参与する、抗体またはTCR鎖の部分を指す。このような可変性は、軽鎖および重鎖可変ドメインまたはアルファおよびベータ可変ドメインの両方において、超可変領域と呼ばれる3つセグメントに集中している。可変ドメインのより高度に保存された部分を、フレームワーク領域(FR)と呼ぶ。天然重鎖および天然軽鎖の可変ドメインは各々、3つ超可変領域によりつなぎ合わされた4つのFR(それぞれ、FR1、FR2、FR3、およびFR4)を含む。各鎖内の超可変領域は、FRにより、一体に近接するように保持され、他の鎖に由来する超可変領域と共に、抗体の抗原結合性部位の形成に寄与する(Kabatら、Sequences of Proteins of Immunological Interest、5版、Public Health Service、National Institutes of Health、Bethesda、Md.(1991年)、647〜669頁を参照されたい)。定常ドメインは、抗体またはTCRの、抗原への結合には直接関与しないが、多様なエフェクター機能、例えば、抗体依存性細胞傷害性への抗体の参与を呈示する。
【0080】
「超可変領域」とは、抗原への結合の一因となる、抗体またはTCRのアミノ酸残基を指す。超可変領域は、「相補性決定領域」または「CDR」に由来するアミノ酸残基を含む。「フレームワーク」または「FR」残基とは、本明細書で規定される超可変領域残基以外の可変ドメイン残基である。
【0081】
「抗体断片」および「TCR断片」は、全長抗体またはTCRの部分、一般に、それらの抗原結合性または可変ドメインを含む。抗体およびTCR断片の例は、Fab、Fab’、F(ab’)
2、Fv、およびscFv断片、直鎖状抗体またはTCR、単鎖抗体またはTCR分子、ダイアボディ、ならびに抗体またはTCR断片から形成された、多特異性抗体またはTCRを含むがこれらに限定されない。
【0082】
「モノクローナル抗体」とは、免疫細胞の単一のクローンにより合成された抗体分子を指す。「モノクローナル」という修飾語は、抗体の実質的に均質な集団から得られるものとしての抗体の特徴を示し、任意の特定の方法による抗体の作製を要求するとはみなさないものとする。したがって、モノクローナル抗体は、KohlerおよびMilstein、Nature、256巻:495頁(1975年);Eur.J.Immunol.、6巻:511頁(1976年)により初めて記載されたハイブリドーマ法により作ることもでき、組換えDNA法により作ることもでき、また、ファージ抗体ライブラリーから単離することもできる。
【0083】
「ポリクローナル抗体」とは、免疫細胞の集団により合成された抗体分子の集団を指す。
【0084】
「単鎖Fv」または「scFv」とは、抗体の可変重鎖(V
H)および可変軽鎖(V
L)ドメインまたはTCRの可変アルファもしくはガンマ鎖(VαまたはVγ)および可変ベータもしくはデルタ鎖(VβまたはVδ)ドメインを含む、抗体またはTCR断片であって、これらのドメインが、単一のポリペプチド鎖内に存在する抗体またはTCR断片を指す。一般に、Fvポリペプチドは、sFvが、抗原の結合に所望の構造を形成することを可能とする、V
HドメインとV
LドメインまたはVαドメインとVβドメインもしくはVγドメインとVδドメインとの間のポリペプチドリンカーをさらに含む。
【0085】
「ダイアボディ」とは、2つの抗原結合性部位を有する、小型抗体および/またはTCR断片であって、同じポリペプチド鎖内のV
Lにつなぎ合わされたV
H(V
H−V
L)または同じポリペプチド鎖内のVβにつなぎ合わされたVα(Vα−Vβ)または同じポリペプチド鎖内のVδにつなぎ合わされたVγ(Vγ−Vδ)を含む断片を指す。同じ鎖上の2つのドメインの間の対合を可能とするには短すぎるリンカーを使用することにより、ドメインは、別の鎖の相補的なドメインと対合し、2つの抗原結合性部位を創出することを強いられる。例示的なダイアボディは、例えば、EP404097およびWO93111161において、より完全に記載されている。
【0086】
「二特異性抗体」または「二特異性TCR」とは、2つの異なる種類の抗原に対する特異性を示す抗体またはTCRを指す。本明細書で使用される用語は、限定なしに、標的抗原および特定の組織への送達を容易とする別の標的に対する結合特異性を示す抗体およびTCRを具体的に含む。同様に、多特異性抗体およびTCRは、2つまたはそれ超の結合特異性を有する。
【0087】
「直鎖状抗体」または「直鎖状TCR」とは、抗原結合領域の対を形成するタンデムFdセグメント(例えば、V
H−C
H1−V
H−C
H1またはVα−Cα
1−Vα−Cα
1)の対を指す。直鎖状抗体およびTCRは、例えば、Zapataら、Protein Eng.、8巻(10号):1057〜1062頁(1995年)により記載されている通り、二特異性の場合もあり、単一特異性の場合もある。
【0088】
「抗原結合性ドメイン」とは、抗原に特異的に結合する能力を保持する、抗体またはTCRの1つまたは複数の断片を指す。このような用語の中に含まれる抗体断片の非限定的な例は、(i)V
L、V
H、C
L、およびC
H1ドメインからなる一価断片であるFab断片;(ii)ヒンジ領域におけるジスルフィド架橋により連結された2つのFab断片を含有する二価断片であるF(ab’)
2断片;(iii)V
HおよびC
H1ドメインからなるFd断片;(iv)抗体の単一のアームのV
LおよびV
HドメインからなるFv断片;(v)V
Hドメインを含有するdAb断片(Wardら、(1989年)、Nature、341巻:544〜546頁);ならびに(vi)単離CDRを含むがこれらに限定されない。加えて、この定義には、単一の重鎖および単一の軽鎖を含む抗体または単一のアルファ鎖もしくは単一のベータ鎖を有するTCRが含まれる。
【0089】
「F(ab’)
2」および「Fab」部分は、Igを、ペプシンおよびパパインなどのプロテアーゼで処置することにより作製することができ、2つの重鎖の各々の中のヒンジ領域の間に存在するジスルフィド結合の近傍で、免疫グロブリンを消化することにより生成される抗体断片を含む。例えば、パパインは、2つの重鎖の各々の中のヒンジ領域の間に存在するジスルフィド結合の上流においてIgGを切断して、V
LおよびC
Lからなる軽鎖と、V
HおよびC
Hγ1(重鎖の定常領域内のγ1領域)からなる重鎖断片とを、ジスルフィド結合を介して、それらのC末端領域においてつなぎ合わせた2つの相同な抗体断片を生成する。これらの2つの相同な抗体断片の各々を、「Fab」と呼ぶ。ペプシンもまた、2つの重鎖の各々の中のヒンジ領域の間に存在するジスルフィド結合の下流においてIgGを切断して、上記で言及された2つの「Fab」をヒンジ領域においてつなぎ合わせた断片よりわずかに大きな抗体断片を生成する。この抗体断片を、F(’ab’)
2と呼ぶ。Fab断片はまた、軽鎖の定常ドメインおよび重鎖の第1の定常ドメイン(C
H1)も含有する。「Fab」断片は、抗体のヒンジ領域に由来する1つまたは複数のシステインを含む、重鎖C
H1ドメインのカルボキシル末端における少数の残基の付加により、Fab断片と異なる。Fab’−SHとは、定常ドメインのシステイン残基が、遊離チオール基を持つFab’のための、本明細書における表記である。F(ab’)
2抗体断片は元来、それらの間にヒンジシステインを有するFab’断片の対として作製されている。
【0090】
「Fv」とは、完全な抗原認識および抗原結合性部位を含有する抗体またはTCR断片を指す。この領域は、緊密な非共有結合的な会合下にある、1つの重鎖可変ドメインと1つの軽鎖可変ドメインとの二量体または1つのTCRα鎖と1つのTCRβ鎖との二量体または1つのTCRγ鎖と1つのTCRδ鎖との二量体からなる。各可変ドメインの3つCDRが相互作用して、V
H−V
L二量体またはVα−Vβ二量体もしくはVγ−Vδ二量体の表面上で、抗原結合性部位を規定するのは、この立体配置においてである。併せて、V
HおよびV
L鎖またはVα−Vβ鎖もしくはVγ−Vδ鎖の各々に由来するCDRの1つまたは複数の組合せは、抗体またはTCRに、抗原結合性特異性を付与する。例えば、例えば、CDRH3およびCDRL3は、レシピエントの選択された抗体、TCR、またはそれらの抗原結合性断片のV
HおよびV
L鎖またはVαおよびVβ鎖もしくはVγ−Vδ鎖に移されると、抗体またはTCRに、抗原結合性特異性を付与するのに十分であることが可能であり、このCDRの組合せを、結合、親和性などについて調べうることが理解されるであろう。単一の可変ドメイン(または抗原に対して特異的な3つのCDRだけを含むFvの半分)であっても、抗原を認識し、これに結合する能力を有するが、第2の可変ドメインと組み合わせた場合より低い親和性で結合する可能性が高い。さらに、Fv断片(V
LおよびV
HまたはVαおよびVβもしくはVγおよびVδ)の2つのドメインは、別個の遺伝子によりコードされるが、これらは、V
LおよびV
HまたはVαおよびVβもしくはVγおよびVδ鎖領域が対合して、一価分子(単鎖Fv(scFv)として公知である;Birdら(1988年)、Science、242巻:423〜426頁;Hustonら(1988年)、Proc.Natl.Acad.Sci.USA、85巻:5879〜5883頁;およびOsbournら(1998年)、Nat.Biotechnol.、16巻:778頁)を形成する、単一のタンパク質鎖として、これらを作ることを可能とする、合成リンカーによる組換え法を使用して結合させることができる。このようなscFvもまた、抗体の「抗原結合性部分」という用語の中に包摂することを意図する。完全なIg(例えば、IgG)分子または他のアイソタイプをコードする発現ベクターを生成するために、特異的なscFvの任意のV
HおよびV
L配列を、Fc領域のcDNAまたはゲノム配列に連結することができる。V
HおよびV
Lはまた、タンパク質化学反応または組換えDNA技術を使用して、Fab、Fvまたは他のIg断片を生成するのにも使用することができる。
【0091】
抗原結合性ポリペプチドはまた、例えば、ラクダ科動物およびサメに由来する抗体など、重鎖二量体も含む。ラクダ科動物およびサメ抗体は、V様およびC様ドメインの2つの鎖(いずれも軽鎖を有さない)のホモ二量体対を含む。ラクダ科動物における重鎖二量体であるIgGのV
H領域は、軽鎖と疎水性相互作用する必要がないので、軽鎖に通常接触する重鎖内の領域は、ラクダ科動物における親水性アミノ酸残基に変化する。重鎖二量体IgGのV
Hドメインは、V
HHドメインと呼ばれる。サメIg−NARは、1つの可変ドメイン(V−NARドメインと称する)と、5つのC様定常ドメイン(C−NARドメイン)とのホモ二量体を含む。ラクダ科動物では、抗体レパートリーの多様性は、V
HまたはV
HH領域内のCDR1、2、および3により決定される。ラクダV
HH領域内のCDR3は、平均して16アミノ酸という、その比較的長い長さを特徴とする(Muyldermansら、1994年、Protein Engineering、7巻(9号):1129頁)。
【0092】
非ヒト(例えば、マウス)抗体またはTCRの「ヒト化」形態は、非ヒトIgまたはTCRから導出された最小限の配列を含有する、キメラ抗体またはTCRを含む。大部分において、ヒト化抗体またはTCRは、レシピエントのCDRの1つまたは複数が、マウス、ラット、ウサギ、または非ヒト霊長動物など、非ヒト種抗体またはTCR(ドナー抗体またはTCR)に由来するCDRであって、所望の特異性、親和性、および結合機能を有するCDRにより置きかえられた、ヒトIgまたはTCR(レシピエント抗体またはTCR)である。場合によって、ヒトIgまたはTCRの1つまたは複数のFRアミノ酸残基を、対応する非ヒトアミノ酸残基により置きかえる。さらに、ヒト化抗体またはTCRは、レシピエント抗体またはTCRにおいても、ドナー抗体またはTCRにおいても見出されない残基を含有しうる。必要な場合、これらの修飾を施して、抗体またはTCRの性能を精緻化することができる。ヒト化抗体またはTCRは、実質的に全てのまたは少なくとも1つの、場合によって、2つの可変ドメインであって、超可変領域の全てまたは実質的に全てが、非ヒト免疫グロブリンまたはTCRの超可変領域に対応し、FRの全てまたは実質的に全てが、ヒト免疫グロブリンまたはTCR配列のFRである可変ドメインを含みうる。ヒト化抗体またはTCRはまた任意選択で、免疫グロブリンまたはTCRの定常領域(Fc)の少なくとも一部、典型的には、ヒト免疫グロブリンまたはTCRの少なくとも一部も含みうる。例えばJonesら、Nature、321巻:522〜525頁(1986年);Reichmannら、Nature、332巻:323〜329頁(1988年);およびPresta、Curr.Op.Struct.Biol.、2巻:593〜596頁(1992年)を参照されたい。
【0093】
「生殖細胞系列の配列」とは、生殖細胞系列(一倍体配偶子およびそれらがそこから形成される二倍体細胞)に由来する遺伝子配列を指す。生殖細胞系列のDNAは、単一のIg重鎖または軽鎖、あるいは単一のTCRαもしくはTCRβ鎖、または単一のTCRγもしくはTCRδ鎖をコードする、複数の遺伝子セグメントを含有する。これらの遺伝子セグメントは、胚細胞内に保有されるが、それらが、機能的な遺伝子へと整備されるまでは、転写も翻訳もされえない。骨髄内のB細胞およびT細胞の分化中に、これらの遺伝子セグメントは、10
8を超える特異性を発生させることが可能な動的な遺伝子系により、ランダムにシャッフルされる。これらの遺伝子セグメントの大半は、生殖細胞系列データベースにより公表および集成されている。
【0094】
「親和性」とは、2つの薬剤の可逆的結合についての平衡定数を指し、K
Dとして表される。結合性タンパク質の、リガンドに対する親和性、例えば、抗体の、エピトープに対する親和性は、例えば、約100ナノモル(nM)〜約0.1nM、約100nM〜約1ピコモル(pM)、または約100nM〜約1フェムトモル(fM)でありうる。「アビディティー」という用語は、希釈後における、2つまたはそれ超の薬剤の複合体の、解離に対する抵抗性を指す。
【0095】
「エピトープ」とは、抗体またはTCRの可変領域の結合性ポケットと結合性相互作用を形成することが可能な、抗原または他の高分子の部分を指す。このような結合性相互作用は、1つまたは複数のCDRの1つまたは複数のアミノ酸残基との分子間接触として顕在化されうる。抗原の結合は、例えば、V
HおよびV
L鎖の、CDR3、CDR3対、または、場合によって、最大で6つのCDR全ての相互作用を伴いうる。エピトープは、直鎖状ペプチド配列の場合(すなわち、「連続」)の場合もあり、非連続アミノ酸配列(すなわち、「コンフォメーショナル」または「不連続」)からなる場合もある。抗体またはTCRは、1つまたは複数のアミノ酸配列を認識することが可能であり、したがって、エピトープは、1つ超の顕著に異なるアミノ酸配列を規定しうる。抗体およびTCRにより認識されるエピトープは、当業者に周知のペプチドマッピング法および配列解析法により決定することができる。結合性相互作用は、CDRの1つまたは複数のアミノ酸残基との分子間接触として顕在化される。
【0096】
「特異的」とは、抗体またはTCRが、抗体またはTCRにより認識されるエピトープを含有する抗原以外の分子への著明な結合を示さない状況を指す。用語はまた、例えば、抗原結合性ドメインが、いくつかの抗原により保有される特定のエピトープに対して特異的である場合にも当てはまり、この場合、抗原結合性ドメインを保有する、選択された抗体、TCR、またはそれらの抗原結合性断片は、エピトープを保有する多様な抗原に結合することが可能であろう。「優先的に結合する」または「特異的に結合する」という用語は、抗体、TCR、またはそれらの断片が、エピトープに、非類縁のアミノ酸配列に結合する場合より大きな親和性で結合し、エピトープを含有する他のポリペプチドに対して交差反応性の場合、それらがヒトに対する使用における投与のために製剤化されるレベルにおいて毒性でないことを意味する。一態様では、このような親和性は、抗体、TCR、またはそれらの断片の、非類縁のアミノ酸配列に対する親和性の少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、または少なくとも1000倍である。「結合すること」という用語は、例えば、生理学的条件下における、共有結合的、静電的、疎水性、およびイオン性、ならびに/または水素結合相互作用に起因する、2つの分子の間の直接的な会合を指し、塩架橋および水架橋のほか、他の任意の従来の結合手段などの相互作用を含む。
【0097】
「薬学的に許容される」とは、生理学的に忍容性であり、典型的に、アレルギー反応、またはヒトに投与された場合に、急性胃蠕動、めまいなど、類似の望ましくない反応をもたらさない分子実体および組成物を指す。
【0098】
治療用組成物について言及して使用される場合の「単位用量」とは、ヒトのための単位投与量として適する、物理的に個別の単位であって、各単位が、要求される希釈剤;すなわち、担体、または媒体と会合して、所望の治療的効果をもたらすように計算された所定量の活性材料を含有する単位を指す。
【0099】
「パッケージング材料」とは、キットの構成要素を格納する物理的構造を指す。パッケージング材料は、構成要素を滅菌状態で維持することが可能であり、このような目的で一般に使用される材料(例えば、紙、段ボール、ガラス、プラスチック、ホイル、アンプルなど)で作ることができる。表示または添付文書は、適切な指示書を含みうる。したがって、キットは、加えて、キットの構成要素を、本発明の任意の方法で使用するための表示または指示も含みうる。キットは、本明細書で記載される方法において化合物を投与するための指示と併せて、パック中の化合物または分注器を含みうる。
【0100】
「防止」とは、症状の発症の予防、防止、過剰レベルのタンパク質と関連する、またはタンパク質の活性と相関する疾患または障害の進行の防止を指す。
【0101】
「阻害」、「処置」、および「処置すること」は、互換的に使用され、例えば、症状の静止状態、生存の延長、症状の部分的または完全な改善、および過剰レベルのタンパク質と関連する、またはタンパク質の活性と相関する状態、疾患、または障害の部分的または完全な根絶を指す。例えば、がんの処置は、がん性増殖または腫瘍の、静止状態、部分的または完全な消失を含むがこれらに限定されない。処置または部分的消失は、例えば、約2分の1、約3分の1、約4分の1、約5分の1、約10分の1、約20分の1、約50分の1、または任意の中間の分数の低減など、増殖または腫瘍サイズおよび/もしくは容量のある分数の低減を含む。同様に、処置または部分的消失は、増殖または腫瘍サイズおよび/もしくは容量のあるパーセントの低減であって、約1%、2%、3%、4%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、または任意の中間の百分率の低減を含みうる。
【0102】
「中和抗体」または「中和TCR」とは、中和が達成される機構に関わらず、ウイルスまたは細菌などの病原体の複製を阻害する、任意の抗体またはTCRを指す。
【0103】
「抗体レパートリー」または「TCRレパートリー」とは、抗体、TCR、またはそれらの断片のコレクションを指す。例えば、抗体レパートリーを使用して、特定の抗体を選択することもでき、結合能力、結合特異性、消化管の輸送能力、安定性、親和性など、特定の特性についてスクリーンすることもできる。用語は具体的に、例えば、限定なしに、ナイーブ、合成、および半合成ライブラリーを含む、任意の供給源に由来する単鎖Fv(scFv)およびFab抗体ファージディスプレイライブラリーを含む抗体ファージディスプレイライブラリーなど、全ての形態のコンビナトリアルライブラリーを含む、抗体およびTCRライブラリーを含む。
【0104】
「標的核酸分子」、「標的分子」、「標的ポリヌクレオチド」、「標的ポリヌクレオチド分子」は、目的の任意の核酸を指す。
【0105】
ポリメラーゼ連鎖反応(PCR)とは、二本鎖ポリヌクレオチドの相補鎖の同時的なプライマーによる伸長によるin vitroにおけるポリヌクレオチド配列の増幅反応を指す。PCR反応では、プライマー結合性部位により挟まれた鋳型ポリヌクレオチドのコピーが作製される。各サイクルと共に、両方の鎖が複製されるため、2つのプライマーによる結果は、各サイクルに伴う、両方の鎖の鋳型ポリヌクレオチドコピー数の指数関数的増大である。ポリヌクレオチド二重鎖は、使用されるプライマーの端部に対応する末端を有する。PCRは、鋳型ポリヌクレオチドを変性させるステップと、プライマーを、プライマー結合性部位にアニールさせるステップと、ヌクレオチドの存在下で、DNAまたはRNAポリメラーゼにより、プライマーを伸長させるステップとの、1回または複数回の反復を含みうる。各ステップにおける特定の温度、持続時間、およびステップ間の変化の速度は、当業者に周知の多くの因子に依存する。(McPhersonら、IRL Press、Oxford(1991年および1995年))。例えば、Taq DNAポリメラーゼを使用する従来のPCRでは、二本鎖鋳型ポリヌクレオチドは、>90℃の温度で変性させることができ、プライマーは、50〜75℃の範囲の温度でアニールさせることができ、プライマーは、72〜78℃の範囲の温度で伸長させることができる。一部の実施形態では、PCRは、逆転写PCR(RT−PCR)、リアルタイムPCR、ネステッドPCR、定量的PCR、マルチプレックスPCRなどを含む。一部の実施形態では、PCRは、RT−PCRを含まない。(米国特許第5,168,038号、同第5,210,015号、同第6,174,670号、同第6,569,627号、および同第5,925,517号;Mackayら、Nucleic Acids Research、30巻:1292〜1305頁(2002年))。RT−PCRは、逆転写反応を先行させたPCR反応を含み、結果として得られるcDNAを増幅する。ネステッドPCRは、第1のプライマーセットを使用する第1のPCR反応のアンプリコンが、そのうちの少なくとも1つが、第1のPCR反応のアンプリコンの内部の場所に結合する、第2のプライマーセットを使用する第2のPCR反応のための試料となる、二段階式PCRを含む。マルチプレックスPCRは、複数のポリヌクレオチド配列を、同じ反応混合物中のPCRに同時にかけるPCR反応を含む。PCR反応の容量は、0.2pL〜1000μLのいずれかでありうる。定量的PCRは、試料中の1つまたは複数の配列の絶対もしくは相対量、存在度、または濃度を測定するようにデザインされたPCR反応を含む。定量的測定は、1つまたは複数の基準配列または標準物質を、目的のポリヌクレオチド配列と比較することを含みうる。(Freemanら、Biotechniques、26巻:112〜126頁(1999年);Becker−Andreら、Nucleic Acids Research、17巻:9437〜9447頁(1989年);Zimmermanら、Biotechniques、21巻:268〜279頁(1996年);Diviaccoら、Gene、122巻:3013〜3020頁(1992年);Becker−Andreら、Nucleic Acids Research、17巻:9437〜9446頁(1989年))。
【0106】
他の実施形態では、本明細書で開示される方法、キット、および組成物は、支持体を含みうる。一部の実施形態では、本明細書で開示される方法、キット、および組成物は、支持体を含まない。典型的には、固体支持体は、1つまたは複数の剛体または半剛体表面を含む、1つまたは複数の材料を含む。一部の実施形態では、支持体は、非固体支持体である。支持体または基質は、膜、紙、プラスチック、コーティング表面、平面、ガラス、スライド、チップ、またはこれらの任意の組合せを含みうる。一部の実施形態では、支持体の1つまたは複数の表面は、実質的に平坦であるが、一部の実施形態では、例えば、ウェル、凸領域、ピン、エッチングトレンチなどにより、異なる化合物に対して、合成領域を物理的に分離することが望ましいことがある。一部の実施形態では、固体支持体は、ビーズ、樹脂、ゲル、マイクロスフェア、または他の幾何学的形状を含む。代替的に、固体支持体は、シリカチップ、マイクロ粒子、ナノ粒子、プレート、およびアレイを含みうる。固体支持体は、マイクロウェル内で自己組織化するビーズの使用を含みうる。例えば、固体支持体は、Illumina製のBeadArray技術を含む。代替的に、固体支持体は、Abbott Molecular製のBead Array技術、およびApplied Microarray製のFlexiPlex(商標)システムを含む。他の場合には、固体支持体は、プレートである。プレートの例は、MSDマルチアレイプレート、MSD Multi−Spot(登録商標)プレート、マイクロプレート、ProteOnマイクロプレート、AlphaPlate、DELFIAプレート、IsoPlate、およびLumaPlateを含むがこれらに限定されない。一部の実施形態では、支持体は、複数のビーズを含みうる。一部の実施形態では、支持体は、アレイを含みうる。一部の実施形態では、支持体は、スライドガラスを含みうる。ポリマーに適用可能な方法、基質、および技法(米国特許第5,744,305号、同第5,143,854号、同第5,242,974号、同第5,252,743号、同第5,324,633号、同第5,384,261号、同第5,405,783号、同第5,424,186号、同第5,451,683号、同第5,482,867号、同第5,491,074号、同第5,527,681号、同第5,550,215号、同第5,571,639号、同第5,578,832号、同第5,593,839号、同第5,599,695号、同第5,624,711号、同第5,631,734号、同第5,795,716号、同第5,831,070号、同第5,837,832号、同第5,856,101号、同第5,858,659号、同第5,936,324号、同第5,968,740号、同第5,974,164号、同第5,981,185号、同第5,981,956号、同第6,025,601号、同第6,033,860号、同第6,040,193号、同第6,090,555号、同第6,136,269号、同第6,269,846号、および同第6,428,752号;米国特許公開第20090149340号、同第20080038559号、同第20050074787号;ならびにPCT公開第WO00/58516号;同第WO99/36760号、および同第WO01/58593号)。ポリヌクレオチドの、支持体への結合は、アミン−チオール架橋、マレイミド架橋、N−ヒドロキシスクシンイミドもしくはN−ヒドロキシスルホスクシンイミド、Zenon、またはSiteClickを含みうる。標識された核酸を支持体に結合することは、ビオチンを複数のポリヌクレオチドに結合すること、および1つまたは複数のビーズをストレプトアビジンでコーティングすることを含みうる。一部の実施形態では、固体支持体は、ビーズである。ビーズの例は、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)、MACS(登録商標)マイクロビーズ、抗体コンジュゲートビーズ(例えば、抗免疫グロブリンマイクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、ポリヌクレオチドdTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、およびBcMag(商標)カルボキシ末端磁気ビーズを含むがこれらに限定されない。ビーズの直径は、約5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm、または50μmでありうる。固体支持体は、アレイまたはマイクロアレイでありうる。固体支持体は、個別の領域を含みうる。固体支持体は、アレイ、例えば、アドレス可能なアレイでありうる。
【0107】
本明細書で使用される「ヌクレオチド」、「ヌクレオシド」、「ヌクレオチド残基」、および「ヌクレオシド残基」は、増幅反応(例えば、PCR反応)における使用に適するプライマーの構成要素として用いることが可能な、デオキシリボヌクレオチドまたはリボヌクレオチド残基、または他の類似のヌクレオシド類似体を意味しうる。このようなヌクレオシドおよびその誘導体は、そうでないことが示される場合を除き、本明細書で記載されるプライマーの構成単位として使用することができる。化学修飾が、ポリメラーゼによる、必要に応じた、デオキシグアニン、デオキシシトシン、デオキシチミジン、またはデオキシアデニンとしてのそれらの認識に干渉しないことを条件として、本出願における何物も、増幅反応におけるそれらの安定性または有用性を増強するように化学修飾されたヌクレオシド誘導体または塩基の活用を除外することを意図しない。一部の実施形態では、ヌクレオチド類似体は、ハイブリッド体の形成を安定化させうる。一部の実施形態では、ヌクレオチド類似体は、ハイブリッド体の形成を不安定化させうる。一部の実施形態では、ヌクレオチド類似体は、ハイブリダイゼーション特異性を増強しうる。一部の実施形態では、ヌクレオチド類似体は、ハイブリダイゼーションの特異性を低減しうる。
【0108】
「核酸」または文法的同等物は、単一のヌクレオチドまたは共有結合により一体に連結された少なくとも2つのヌクレオチドを指す。
【0109】
「ポリヌクレオチド」または「ポリヌクレオチド」または「ポリヌクレオチド」または文法的同等物は、共有結合により一体に連結された少なくとも2つのヌクレオチドを指す。ポリヌクレオチドは、2つまたはそれ超のヌクレオチドを含有する分子を含む。ポリヌクレオチドは、リボヌクレオチド、デオキシリボヌクレオチド、またはペプチド核酸(PNA)である、任意の長さのヌクレオチドのポリマー形態であって、プリンおよびピリミジン塩基、または他の自然ヌクレオチド塩基、化学的もしくは生化学的に修飾されたヌクレオチド塩基、非自然ヌクレオチド塩基、あるいはヌクレオチド塩基の誘導体を含む、ヌクレオチドのポリマー形態を含む。ポリヌクレオチドの骨格は、糖およびリン酸基、または修飾もしくは置換された糖もしくはリン酸基を含みうる。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド類似体などの修飾ヌクレオチドを含みうる。ヌクレオチドの配列は、非ヌクレオチド構成要素により中断される場合がある。ポリヌクレオチドは、別のハイブリダイズさせたポリヌクレオチドなど、他の分子を含みうる。ポリヌクレオチドは、デオキシリボ核酸(DNA)、リボ核酸(RNA)、またはこれらの両方の配列を含む。ポリヌクレオチドの非限定的な例は、遺伝子、遺伝子断片、エクソン、イントロン、遺伝子間DNA(限定なしに、ヘテロクロマチンDNAを含む)、メッセンジャーRNA(mRNA)、転移RNA、リボソームRNA、リボザイム、低分子干渉RNA(siRNA)、cDNA、組換えポリヌクレオチド、分枝状ポリヌクレオチド、プラスミド、ベクター、配列の単離DNA、配列の単離RNA、核酸プローブ、およびプライマーを含む。ポリヌクレオチドは、自然供給源から単離することもでき、組換えることもでき、人工的に合成することもできる。
【0110】
ポリヌクレオチドは、4つのヌクレオチド塩基:アデニン(A);シトシン(C);グアニン(G);およびチミン(T)(ポリヌクレオチドがRNAである場合は、チミン(T)に代わりウラシル(U))の特異的な配列を含む。したがって、ポリヌクレオチド配列は、ポリヌクレオチド分子のアルファベット表示であり;代替的に、用語は、ポリヌクレオチド分子自体に適用することもできる。このアルファベット表示は、中央演算装置を有するコンピュータ内のデータベースに入力し、機能的ゲノミクス、相同性検索、配列のビニング、配列のアライメント、コンセンサス配列の決定などのバイオインフォマティクス適用のために使用することができる。
【0111】
ポリヌクレオチドは、ヌクレオチド類似体または修飾ヌクレオチドなどの非標準的ヌクレオチドを含みうる。一部の実施形態では、非標準的ヌクレオチドは、ハイブリッド体の形成を安定化させうる。一部の実施形態では、非標準的ヌクレオチドは、ハイブリッド体の形成を不安定化させうる。一部の実施形態では、非標準的ヌクレオチドは、ハイブリダイゼーション特異性を増強しうる。一部の実施形態では、非標準的ヌクレオチドは、ハイブリダイゼーションの特異性を低減しうる。非標準的ヌクレオチド修飾の例は、2’O−Me、2’O−アリル、2’O−プロパルギル、2’O−アルキル、2’フルオロ、2’アラビノ、2’キシロ、2’フルオロアラビノ、ホスホロチオエート、ホスホロジチオエート、ホスホロアミデート、2’アミノ、5−アルキル置換ピリミジン、3’デオキシグアノシン、5−ハロ置換ピリミジン、アルキル置換プリン、ハロ置換プリン、二環式ヌクレオチド、2’MOE、PNA分子、LNA分子、LNA様分子、ジアミノプリン、S2T、5−フルオロウラシル、5−ブロモウラシル、5−クロロウラシル、5−ヨードウラシル、ヒポキサンチン、キサンチン、4−アセチルシトシン、5−(カルボキシヒドロキシルメチル)ウラシル、5−カルボキシメチルアミノメチル−2−チオウリジン、5−カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ−D−ガラクトシルケノシン、イノシン、N6−イソペンテニルアデニン、1−メチルグアニン、1−メチルイノシン、2,2−ジメチルグアニン、2−メチルアデニン、2−メチルグアニン、3−メチルシトシン、5−メチルシトシン、N
6−アデニン、7−メチルグアニン、5−メチルアミノメチルウラシル、5−メトキシアミノメチル−2−チオウラシル、ベータ−D−マンノシルケノシン、5’−メトキシカルボキシメチルウラシル、5−メトキシウラシル、2−メチルチオ−D46−イソペンテニルアデニン、ウラシル−5−オキシ酢酸(v)、ワイブトキソシン(wybutoxosine)、シュードウラシル、ケノシン、2−チオシトシン、5−メチル−2−チオウラシル、2−チオウラシル、4−チオウラシル、5−メチルウラシル、ウラシル−5−オキシ酢酸メチルエステル、ウラシル−5−オキシ酢酸(v)、5−メチル−2−チオウラシル、3−(3−アミノ−3−N−2−カルボキシプロピル)ウラシル、(acp3)w、2,6−ジアミノプリン、およびそれらの誘導体を含む。
【0112】
「被験体」、「個体」、「宿主」、または「患者」とは、哺乳動物などの生物を指す。被験体および宿主の例は、ウマ、ウシ、ラクダ、ヒツジ、ブタ、ヤギ、イヌ、ネコ、ウサギ、モルモット、ラット、マウス(例えば、ヒト化マウス)、アレチネズミ、非ヒト霊長動物(例えば、マカクザル)、ヒトなど、例えば、トリ(例えば、ニワトリまたはカモ)、魚類(例えば、サメ)またはカエル(例えば、Xenopus)などの非哺乳動物の脊椎動物、および非哺乳動物の非脊椎動物のほか、これらのトランスジェニック種を含む非哺乳動物を含むがこれらに限定されない。ある特定の態様では、被験体は、単一の生物(例えば、ヒト)を指す。ある特定の態様では、研究される共通の免疫因子および/もしくは疾患を有する小規模なコホート、ならびに/または疾患を伴わない個体(例えば、陰性/正常対照)のコホートを構成する、個体または個体群が提示される。試料が得られる被験体は、疾患および/または障害(例えば、1つまたは複数のアレルギー、感染症、がんまたは自己免疫障害など)に罹患している場合があり、疾患の影響を受けていない陰性対照の被験体に対して比較することができる。
【0113】
「キット」とは、本明細書で開示される方法を実行するための材料または試薬を送達するための送達システムを指す。一部の実施形態では、キットは、反応試薬(例えば、適切なコンテナー内のプローブ、酵素など)および/または補助材料(例えば、アッセイを実施するための緩衝液、指示書など)の保存、1つの場所から別の場所への輸送、または送達を可能とするシステムを含む。例えば、キットは、関連する反応試薬および/または補助材料を含有する、1つまたは複数の筐体(例えば、箱)を含む。このような内容物は、意図されるレシピエントに、併せてまたは別々に送達することができる。例えば、第1のコンテナーが、アッセイにおける使用のための酵素を含有しうるのに対し、第2のコンテナーは、複数のプライマーを含有する。
【0114】
「ポリペプチド」とは、少なくとも2つのアミノ酸を含む分子を指す。一部の実施形態では、ポリペプチドは、単一のペプチドからなる。一部の実施形態では、ポリペプチドは、2つまたはそれ超のペプチドを含む。例えば、ポリペプチドは、少なくとも約2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000のペプチドまたはアミノ酸を含みうる。ポリペプチドの例は、アミノ酸鎖、タンパク質、ペプチド、ホルモン、ポリペプチドサッカリド、脂質、糖脂質、リン脂質、抗体、酵素、キナーゼ、受容体、転写因子、およびリガンドを含むがこれらに限定されない。
【0115】
「試料」とは、生物学的、環境的、医学的、被験体、もしくは患者試料、または標的ポリヌクレオチドなどのポリヌクレオチドを含有する試料を指す。
【0116】
試料
ポリヌクレオチドを含有する任意の生物学的試料は、本明細書で記載される方法で使用することができる。例えば、試料は、RNAまたはDNAを含有する被験体に由来する生物学的試料でありうる。ポリヌクレオチドを、生物学的試料から抽出することもでき、試料を、ポリヌクレオチドの抽出または精製を伴わない方法に直接かけることもできる。試料は、抽出または単離されたDNAまたはRNAでありうる。試料はまた、生物学的検体から抽出された全RNAまたはDNAの場合もあり、cDNAライブラリー、ウイルスDNA、またはゲノムDNAの場合もある。一実施形態では、ポリヌクレオチドを、タンパク質、脂質、および非鋳型核酸など、他の様々な成分を含有する生物学的試料から単離する。核酸鋳型分子は、動物、植物、細菌、真菌、または他の任意の細胞生物から得られた、任意の細胞材料から得ることができる。ある特定の実施形態では、ポリヌクレオチドを、単一細胞から得る。ポリヌクレオチドは、生物から直接得ることもでき、生物から得られた生物学的試料から得ることもできる。任意の組織または体液検体を、本発明における使用のための核酸のための供給源として使用することができる。ポリヌクレオチドはまた、初代細胞培養物または細胞系など、培養細胞からも単離することができる。鋳型核酸が得られる細胞または組織には、ウイルスまたは他の細胞内病原体を感染させることができる。
【0117】
ある特定の実施形態では、抗体またはTCRを産生する免疫細胞を、免疫化されているか、または感染症、がん、自己免疫状態、もしくは他の任意の疾患を患っている、ヒトまたは他の動物など、ヒトまたは他の動物など、被験体または宿主の血液または他の生物学的試料から単離して、潜在的な臨床的重要性を有する病原体、腫瘍、および/または疾患特異的抗体またはTCRを同定することができる。例えば、ヒトは、疾患と診断される場合もあり、疾患の症状を呈示している場合もあり、疾患と診断されない場合もあり、疾患の症状を呈示していない場合もある。例えば、ヒトは、感染性作用物質(例えば、ウイルス、細菌、寄生虫、プリオンなど)、抗原、または疾患に曝露された、かつ/またはこれらに対して有用な抗体もしくはTCRを作りうるヒトでありうる。例えば、動物は、感染性作用物質(例えば、ウイルス、細菌、寄生虫、プリオンなど)、抗原、または疾患に曝露された、かつ/またはこれらに対して有用な抗体もしくはTCRを作りうる動物でありうる。免疫化された宿主に由来するある特定の免疫細胞は、問題となる1つもしくは複数の標的抗原、および/または1つもしくは複数の未知の抗原に対する抗体またはTCRを作る。本発明では、蛍光活性化細胞分取(FACS)、磁気活性化細胞分取(MACS)、パニング、または他のスクリーニング法を使用する、細胞のスクリーニングおよび分取など、任意の適切な方法により、リンパ球のプールを、所望の免疫細胞について富化して、免疫細胞ライブラリーなど、試料に由来する複数の免疫細胞を生成してから、抗体鎖をシークエンシングすることもでき、抗体を作ることもでき、発現ライブラリーを作ることもできる。異なる抗体を発現させる免疫細胞の少数のサブセットだけ、したがって、可変ドメインの少数の自然発生の組合せだけをもたらす、先行技術の富化法とは対照的に、本発明の免疫細胞ライブラリーは、異なる抗体またはTCRを発現させる個別の免疫細胞の少なくとも2つのサブセットを含有する。例えば、本発明の免疫細胞ライブラリーは、異なる抗体またはTCRを発現させる個別の免疫細胞の少なくとも5つ、10、100、250、500、750、1000、2500、5000、10000、25000、50000、75000、10000、250000、500000、750000、1000000、2500000、5000000、7500000、または10000000のサブセットを含有しうる。本発明の方法は、免疫細胞の回収を最大化し、非常に高度な多様性をもたらす。
【0118】
一部の実施形態では、免疫化されていないヒトまたは非ヒトドナーに由来する免疫細胞を活用する。動物のナイーブレパートリー(抗原感作前のレパートリー)は、任意の本質的に非自己分子に、中程度の親和性(約1×10
−6〜1×10
−7MのK
A)で結合しうる抗体またはTCRを、動物にもたらす。抗体またはTCRの結合性部位の配列多様性は、生殖細胞系列内では直接コードされないが、V遺伝子セグメントから、コンビナトリアル方式でアセンブルされる。免疫化は、免疫原に結合するV
H−V
LまたはVα−VβもしくはVγ−Vδの組合せを作る任意の免疫細胞が、増殖(クローン的拡大)し、上記で注目した対応する抗体を分泌することを誘発する。しかし、免疫化されていない被験体に由来する脾臓細胞および/もしくは免疫細胞または他の末梢血リンパ球(PBL)の使用は、可能な抗体またはTCRレパートリーについてのよりよい表示をもたらすことができ、また、任意の動物種を使用する、後続の、B細胞もしくはT細胞抗体またはTCRライブラリーの構築も可能とする。
【0119】
場合によって、検査に十分な核酸を得るために、少なくとも0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45、または50mLの血液容量を採取する。
【0120】
場合によって、出発材料は、末梢血である。末梢血細胞は、特定の細胞型(例えば、単核細胞;赤血球;CD4
+細胞;CD8
+細胞;免疫細胞;T細胞、NK細胞など)について富化することができる。末梢血細胞からはまた、特定の細胞型(例えば、単核細胞;赤血球;CD4
+細胞;CD8
+細胞;免疫細胞;T細胞、NK細胞など)を選択的に枯渇させることができる。
【0121】
場合によって、出発材料は、非限定的な例が、脳、肝臓、肺、腎臓、前立腺、卵巣、脾臓、リンパ節(扁桃腺を含む)、甲状腺、膵臓、心臓、骨格筋、腸、喉頭、食道、および胃を含む、固形組織を含む組織試料でありうる。他の場合には、出発材料は、核酸を含有する細胞、免疫細胞、特に、B細胞またはT細胞でありうる。場合によって、出発材料は、遺伝子材料が得られうる、任意の生物に由来する、核酸を含有する試料でありうる。場合によって、試料は、体液、例えば、血液、唾液、リンパ、または尿である。
【0122】
試料は、状態を有する被験体から採取することができる。場合によって、試料が採取される被験体は、患者、例えば、がん患者またはがんを有することが疑われる患者でありうる。被験体は、哺乳動物、例えば、ヒトであることが可能であり、男性の場合もあり、女性の場合もある。場合によって、女性は、妊娠している。試料は、腫瘍生検でありうる。生検は、例えば、医師、医師の助手、看護師、獣医、歯科医、カイロプラクター、救急医療師、皮膚科医、がん専門医、消化器科医、または外科医を含む医療ケア提供者により実施されうる。
【0123】
場合によって、酵素処理(プロテアーゼ消化など)を使用して、非核酸材料を、出発材料から取り出すことができる。
【0124】
場合によって、血液は、EDTAを含むがこれに限定されないマグネシウムキレート剤を含有する器具に回収することができ、4℃で保存する。任意選択で、EGTAを含むがこれに限定されないカルシウムキレート剤を添加することができる。別の場合には、ホルムアルデヒド、ホルムアルデヒド誘導体、ホルマリン、グルタルアルデヒド、グルタルアルデヒド誘導体、タンパク質架橋剤、核酸架橋剤、タンパク質−核酸架橋剤、一級アミン反応性架橋剤、スルフヒドリル反応性架橋剤、スルフヒドリルの付加またはジスルフィドの還元、炭水化物反応性架橋剤、カルボキシル反応性架橋剤、光反応性架橋剤、または切断性架橋剤を含むがこれらに限定されない細胞溶解阻害剤を血液に添加する。
【0125】
場合によって、抽出された材料が、一本鎖RNA、二本鎖RNA、またはDNA−RNAハイブリッド体を含む場合、当技術分野で公知の技法を使用して、これらの分子を二本鎖DNAに転換することができる。例えば、逆転写酵素を用いて、DNAをRNA分子から合成することができる。場合によって、RNAの、DNAへの転換は、リンカー断片をRNAにライゲートし、これにより、逆転写を開始するユニバーサルプライマーの使用を可能とする、あらかじめのライゲーションステップを要求しうる。他の場合には、例えば、mRNA分子のポリAテールを使用して、逆転写を開始することができる。場合によって、DNAへの転換に続き、本明細書で詳述される方法を使用して、所望の配列をさらに捕捉するか、選択するか、これにタグ付けするか、またはこれを単離することができる。
【0126】
核酸分子は、デオキシリボ核酸(DNA)および/またはリボ核酸(RNA)を含む。核酸分子は、合成の場合もあり、自然発生の供給源から導出される場合もある。一実施形態では、核酸分子を、タンパク質、脂質、および非鋳型核酸などの他の様々な成分を含有する生物学的試料から単離する。核酸鋳型分子は、動物、植物、細菌、真菌、または他の任意の細胞生物から得られた、任意の細胞材料から得ることができる。ある特定の実施形態では、核酸分子を、単一細胞から得る。本発明における使用のための生物学的試料は、ウイルス粒子または調製物を含む。核酸分子は、生物から直接得ることもでき、生物から得られた生物学的試料、例えば、血液、尿、脳脊髄液、精液、唾液、痰、糞便、および組織から得ることもできる。任意の組織または体液検体を、本発明における使用のための核酸のための供給源として使用することができる。核酸分子はまた、初代細胞培養物または細胞系など、培養細胞からも単離することができる。鋳型核酸が得られる細胞または組織には、ウイルスまたは他の細胞内病原体を感染させることができる。
【0127】
試料はまた、生物学的検体から抽出された全RNAの場合もあり、cDNAライブラリー、ウイルスDNA、またはゲノムDNAの場合もある。ある特定の実施形態では、核酸分子を、タンパク質、酵素、基質、抗体、結合剤、ビーズ、低分子、ペプチド、または他の任意の分子など、他の標的分子に結合させる。一般に、核酸は、SambrookおよびRussell、Molecular Cloning: A Laboratory Manual、3版、Cold Spring Harbor、N.Y.(2001年)により記載されている技法など、様々な技法により、生物学的試料から抽出することができる。核酸分子は、一本鎖、二本鎖、または一本鎖領域を有する二本鎖(例えば、ステムループ構造)でありうる。
【0128】
DNAの抽出法は、当技術分野で周知である。古典的なDNA単離プロトコールは、フェノールとクロロホルムとの混合物などの有機溶媒を使用する抽出とその後のエタノールによる沈殿に基づく(J.Sambrookら、「Molecular Cloning: A Laboratory Manual」、1989年、2版、Cold Spring Harbour Laboratory Press:New York、N.Y.)。他の方法は、塩析によるDNAの抽出(P.Sunnucksら、Genetics、1996年、144巻:747〜756頁;S.M.Aljanabiら、Nucl.Acids Res.、1997年、25巻:4692〜4693頁)、トリメチルアンモニウムブロミド塩によるDNAの抽出(S.Gustincichら、BioTechniques、1991年、11巻:298〜302頁)およびチオシアン酸グアニジウムによるDNAの抽出(J.B.W.Hammondら、Biochemistry、1996年、240巻:298〜300頁)を含む。生物学的試料からDNAを抽出するための様々なキットが市販されている(例えば、BD Biosciences Clontech(Palo Alto、CA);Epicentre Technologies(Madison、WI);Gentra Systems,Inc.(Minneapolis、MN);MicroProbe Corp.(Bothell、WA);Organon Teknika(Durham、NC);およびQiagen Inc.(Valencia、CA))。
【0129】
当技術分野では、RNAの抽出法も周知であり(例えば、J.Sambrookら、「Molecular Cloning:A Laboratory Manual」、1989年、211d Ed.、Cold Spring Harbour Laboratory Press:New York)、体液からRNAを抽出するためのキットが市販されている(例えば、Ambion,Inc.(Austin、TX);Amersham Biosciences(Piscataway、NJ);BD Biosciences Clontech(Palo Alto、CA);BioRad Laboratories(Hercules、CA);Dynal Biotech Inc.(Lake Success、NY);Epicentre Technologies(Madison、WI);Gentra Systems,Inc.(Minneapolis、MN);GIBCO BRL(Gaithersburg、MD);Invitrogen Life Technologies(Carlsbad、CA);MicroProbe Corp.(Bothell、WA);Organon Teknika(Durham、NC);Promega,Inc.(Madison、WI);およびQiagen Inc.(Valencia、CA))。
【0130】
1つまたは複数の試料は、1つまたは複数の供給源に由来しうる。試料の1つまたは複数は、2つまたはそれ超の供給源に由来しうる。試料の1つまたは複数は、1つまたは複数の被験体に由来しうる。試料の1つまたは複数は、2つまたはそれ超の被験体に由来しうる。試料の1つまたは複数は、同じ被験体に由来しうる。1つまたは複数の被験体は、同じ種に由来しうる。1つまたは複数の被験体は、異なる種に由来しうる。1つまたは複数の被験体は、健常でありうる。1つまたは複数の被験体は、疾患、障害、または状態の影響を受けている可能性がある。
【0131】
一部の実施形態では、試料は、血液、唾液、リンパ、尿、脳脊髄液、精液などの体液、痰、糞便、または組織ホモジネートである。
【0132】
試料は、状態を有する被験体から採取することができる。一部の実施形態では、試料が採取される被験体は、患者、例えば、がん患者またはがんを有することが疑われる患者でありうる。被験体は、哺乳動物、例えば、ヒトであることが可能であり、男性の場合もあり、女性の場合もある。一部の実施形態では、女性は、妊娠している。試料は、腫瘍生検でありうる。生検は、例えば、医師、医師の助手、看護師、獣医、歯科医、カイロプラクター、救急医療師、皮膚科医、がん専門医、消化器科医、または外科医を含む医療ケア提供者により実施されうる。
【0133】
一部の実施形態では、ポリヌクレオチドを、タンパク質、酵素、基質、抗体、結合剤、ビーズ、低分子、ペプチド、または他の任意の分子など、他の標的分子に結合させる。一部の実施形態では、ポリヌクレオチドを、固体支持体に結合させない。核酸は、様々な技法(Sambrookら、Molecular Cloning: A Laboratory Manual、3版、Cold Spring Harbor、N.Y.(2001年))により、生物学的試料から抽出することができる。
【0134】
一部の実施形態では、試料は、唾液である。一部の実施形態では、試料は、全血である。一部の実施形態では、検査に十分な量のポリヌクレオチドを得るために、少なくとも約0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45、または50mLの血液容量を採取する。一部の実施形態では、血液は、EDTAを含むがこれに限定されないマグネシウムキレート剤を含有する器具に回収することができ、4℃で保存する。任意選択で、EGTAを含むがこれに限定されないカルシウムキレート剤を添加することができる。
【0135】
一部の実施形態では、ホルムアルデヒド、ホルムアルデヒド誘導体、ホルマリン、グルタルアルデヒド、グルタルアルデヒド誘導体、タンパク質架橋剤、核酸架橋剤、タンパク質−核酸架橋剤、一級アミン反応性架橋剤、スルフヒドリル反応性架橋剤、スルフヒドリルの付加またはジスルフィドの還元のための薬剤、炭水化物反応性架橋剤、カルボキシル反応性架橋剤、光反応性架橋剤、または切断性架橋剤を含むがこれらに限定されない細胞溶解阻害剤を血液に添加する。一部の実施形態では、酵素処理(プロテアーゼ消化など)を使用して、非核酸材料を、出発材料から取り出すことができる。
【0136】
複数の試料は、少なくとも2つ、3つ、4つ、5つ、10、20、30、40、50、60、70、80、90、もしくは100、またはそれ超の試料を含みうる。複数の試料は、少なくとも約100、200、300、400、500、600、700、800、900、もしくは1000、またはそれ超の試料を含みうる。複数の試料は、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000の試料、9000、もしくは10,000の試料、もしくは100,000の試料、もしくは1,000,000、またはそれ超の試料を含みうる。複数の試料は、少なくとも約10,000の試料を含みうる。
【0137】
第1の試料中の1つまたは複数のポリヌクレオチドは、第2の試料中の1つまたは複数のポリヌクレオチドと異なりうる。第1の試料中の1つまたは複数のポリヌクレオチドは、複数の試料中の1つまたは複数のポリヌクレオチドと異なりうる。試料中の1つまたは複数のポリヌクレオチドは、少なくとも約80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を含みうる。一部の実施形態では、試料中の1つまたは複数のポリヌクレオチドは、約100、90、80、70、60、50、40、30、25、20、25、10、9つ、8つ、7つ、6つ、5つ、4つ、3つ、2つ、または1つ未満のヌクレオチドまたは塩基対と異なりうる。複数の試料の1つまたは複数の試料中の複数のポリヌクレオチドは、2つまたはそれ超の同一な配列を含みうる。複数の試料の1つまたは複数中の全ポリヌクレオチドの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%は、同じ配列を含みうる。複数の試料の1つまたは複数の試料中の複数のポリヌクレオチドは、少なくとも2つの異なる配列を含みうる。複数の試料の1つまたは複数中の全ポリヌクレオチドの少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%は、少なくとも2つの異なる配列を含みうる。一部の実施形態では、1つまたは複数のポリヌクレオチドは、互いの変異体である。例えば、1つまたは複数のポリヌクレオチドは、一塩基多型または他の種類の変異を含有しうる。別の例では、1つまたは複数のポリヌクレオチドは、スプライス変異体である。
【0138】
第1の試料は、1つまたは複数の細胞を含むことができ、第2の試料は、1つまたは複数の細胞を含むことができる。第1の試料の1つまたは複数の細胞は、第2の試料の1つまたは複数の細胞と同じ細胞型でありうる。第1の試料の1つまたは複数の細胞は、複数の試料の1つまたは複数の細胞と異なる細胞型でありうる。
【0139】
複数の試料は、共時的に得ることができる。複数の試料は、同時に得ることができる。複数の試料は、逐次的に得ることができる。複数の試料は、1つまたは複数の異なる試料を得る何年間かの経過、例えば、100年間、10年間、5年間、4年間、3年間、2年間、または1年間にわたり得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約1年間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから12カ月間、11カ月間、10カ月間、9カ月間、8カ月間、7カ月間、6カ月間、4カ月間、3カ月間、2カ月間、または1カ月間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから30日間、28日間、26日間、24日間、21日間、20日間、18日間、17日間、16日間、15日間、14日間、13日間、12日間、11日間、10日間、9日間、8日間、7日間、6日間、5日間、4日間、3日間、2日間、または1日間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約24時間、22時間、20時間、18時間、16時間、14時間、12時間、10時間、8時間、6時間、4時間、2時間、または1時間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約60秒間、45秒間、30秒間、20秒間、10秒間、5秒間、2秒間、または1秒間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから1秒間未満以内に得ることができる。
【0140】
試料の異なるポリヌクレオチドは、試料中に、異なる濃度または量(例えば、異なる分子数)で存在しうる。例えば、1つのポリヌクレオチドの濃度または量は、試料中の別のポリヌクレオチドの濃度または量を超えうる。一部の実施形態では、試料中の少なくとも1つのポリヌクレオチドの濃度または量は、試料中の少なくとも1つの他のポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍、またはそれ超である。別の例では、1つのポリヌクレオチドの濃度または量は、試料中の別のポリヌクレオチドの濃度または量未満である。試料中の少なくとも1つのポリヌクレオチドの濃度または量は、試料中の少なくとも1つの他のポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000分の1、またはそれ未満でありうる。
【0141】
一部の実施形態では、2つまたはそれ超の試料は、異なる量または濃度のポリヌクレオチドを含有しうる。一部の実施形態では、1つの試料中の1つのポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドの濃度または量を超えうる。例えば、血液試料は、尿試料より多量の特定のポリヌクレオチドを含有しうる。代替的に、単一の試料は、2つまたはそれ超の部分試料に分けることができる。部分試料は、異なる量または濃度の同じポリヌクレオチドを含有しうる。1つの試料中の少なくとも1つのポリヌクレオチドの濃度または量は、別の試料中の同じポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍、またはそれ超でありうる。代替的に、1つの試料中の1つのポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドの濃度または量未満でありうる。例えば、1つの試料中の少なくとも1つのポリヌクレオチドの濃度または量は、別の試料中の同じポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000分の1、またはそれ未満でありうる。
【0142】
標的ポリヌクレオチド
場合によって、本明細書で提示される方法は、細胞に由来するポリヌクレオチド分子などの標的ポリヌクレオチド分子の増幅およびシークエンシングを対象とする。場合によって、本明細書で提示される方法は、標的ポリヌクレオチド分子の2つまたはそれ超の領域の増幅およびシークエンシングを対象とする。場合によって、本明細書で提示される方法は、2つまたはそれ超の標的ポリヌクレオチド分子の増幅およびシークエンシングを対象とする。一態様では、標的ポリヌクレオチドは、RNAである。一態様では、標的ポリヌクレオチドは、ゲノム核酸である。特定の生物の染色体内の遺伝子材料から導出されるDNAは、ゲノムDNAでありうる。好ましい実施形態では、標的ポリヌクレオチドは、免疫細胞により産生される抗体またはTCRの可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生される抗体の重鎖の可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生される抗体の軽鎖の可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生されるTCRのアルファ鎖の可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生されるTCRのベータ鎖の可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生されるTCRのガンマ鎖の可変領域を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、免疫細胞により産生されるTCRのデルタ鎖の可変領域を含む配列を含む。
【0143】
標的ポリヌクレオチドは、事実上任意の供給源から得ることができ、当技術分野で公知の方法を使用して調製することができる。例えば、標的ポリヌクレオチドは、限定なしに、ゲノムDNAまたはmRNAの断片を、生物または細胞(例えば、免疫細胞)から抽出して、標的ポリヌクレオチドを得ることを含む当技術分野で公知の方法を使用する増幅を伴わずに、直接単離することができる。標的ポリヌクレオチドはまた、逆転写PCRを介してRNA(mRNAなど)から生成されるcDNAも包摂しうる。場合によって、標的ポリヌクレオチドは、RNA分子である。場合によって、標的ポリヌクレオチドは、mRNA分子、またはmRNA分子から作製されたcDNAである。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、mRNA分子、またはmRNA分子から作製されたcDNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、mRNA分子、またはmRNA分子から作製されたcDNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、重鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、重鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、軽鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、軽鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、抗体可変配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、可変抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、可変軽鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、可変軽鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、可変重鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、単一の免疫細胞に由来する、可変重鎖抗体配列をコードするmRNA分子である。場合によって、標的ポリヌクレオチドは、無細胞核酸、例えば、DNAまたはRNAでありうる。場合によって、標的ポリヌクレオチドは、個別の免疫細胞に由来する、可変アルファ、ベータ、ガンマ、および/またはデルタ鎖TCR配列をコードするmRNA分子である。
【0144】
本明細書で記載される方法を使用して、シークエンシングのために、1つまたは複数の標的ポリヌクレオチドに由来するポリヌクレオチドのライブラリーを生成することができる。標的ポリヌクレオチドは、増幅反応の産物ではない、目的の任意のポリヌクレオチドを含む。例えば、標的ポリヌクレオチドは、生物学的試料中のポリヌクレオチドを含みうる。例えば、標的ポリヌクレオチドは、PCR反応の産物を含まない。例えば、標的ポリヌクレオチドは、増幅反応の産物を生成するのに使用されるポリヌクレオチド鋳型を含みうるが、増幅産物自体を含まない。例えば、標的ポリヌクレオチドは、逆転写反応またはプライマー伸長反応の産物を生成するのに使用されるポリヌクレオチド鋳型を含むことが可能であり、また、逆転写反応またはプライマー伸長反応産物自体も含みうる。例えば、標的ポリヌクレオチドは、逆転写反応またはプライマー伸長反応にかけうる、目的のポリヌクレオチドを含む。例えば、標的ポリヌクレオチドは、RNAまたはDNAを含む。例えば、標的ポリヌクレオチドは、cDNAを含む。一部の実施形態では、標的のRNAポリヌクレオチドは、mRNAである。一部の実施形態では、標的のRNAポリヌクレオチドは、ポリアデニル化されている。一部の実施形態では、RNAポリヌクレオチドは、ポリアデニル化されていない。一部の実施形態では、標的ポリヌクレオチドは、DNAポリヌクレオチドである。DNAポリヌクレオチドは、ゲノムDNAでありうる。DNAポリヌクレオチドは、エクソン、イントロン、非翻訳領域、またはこれらの任意の組合せを含みうる。
【0145】
一部の実施形態では、ライブラリーは、標的ポリヌクレオチドの2つまたはそれ超の領域から生成することができる。一部の実施形態では、ライブラリーは、2つまたはそれ超の標的ポリヌクレオチドから生成することができる。一部の実施形態では、標的ポリヌクレオチドは、染色体から導出される、ゲノム核酸またはDNAである。一部の実施形態では、標的ポリヌクレオチドは、多型または変異などの変異体を含む配列を含む。一部の実施形態では、標的ポリヌクレオチドは、DNAを含み、RNAを含まない。一部の実施形態では、標的ポリヌクレオチドは、RNAを含み、DNAを含まない。一部の実施形態では、標的ポリヌクレオチドは、DNAおよびRNAを含む。一部の実施形態では、標的ポリヌクレオチドは、mRNA分子である。一部の実施形態では、標的ポリヌクレオチドは、DNA分子である。一部の実施形態では、標的ポリヌクレオチドは、一本鎖ポリヌクレオチドである。一部の実施形態では、標的ポリヌクレオチドは、二本鎖ポリヌクレオチドである。一部の実施形態では、標的ポリヌクレオチドは、二本鎖ポリヌクレオチドの単一の鎖である。
【0146】
標的ポリヌクレオチドは、任意の生物学的試料から得ることができ、当技術分野で公知の方法を使用して調製することができる。一部の実施形態では、標的ポリヌクレオチドを、増幅を伴わずに、直接単離する。直接的な単離のための方法は、当技術分野で公知である。非限定的な例は、ゲノムDNAまたはmRNAを、生物学的試料、生物、または細胞から抽出するステップを含む。
【0147】
一部の実施形態では、1つまたは複数の標的ポリヌクレオチドを、生物学的試料から精製する。一部の実施形態では、標的ポリヌクレオチドを、それが含有される生物学的試料から精製しない。一部の実施形態では、標的ポリヌクレオチドを、生物学的試料から単離する。一部の実施形態では、標的ポリヌクレオチドを、それが含有される生物学的試料から単離しない。一部の実施形態では、標的ポリヌクレオチドは、無細胞核酸でありうる。一部の実施形態では、標的ポリヌクレオチドは、断片化された核酸でありうる。一部の実施形態では、標的ポリヌクレオチドは、転写された核酸でありうる。一部の実施形態では、標的ポリヌクレオチドは、修飾ポリヌクレオチドである。一部の実施形態では、標的ポリヌクレオチドは、非修飾ポリヌクレオチドである。
【0148】
一部の実施形態では、標的ポリヌクレオチドは、単一細胞に由来するポリヌクレオチドである。一部の実施形態では、標的ポリヌクレオチドは、個別の細胞に由来する。一部の実施形態では、標的ポリヌクレオチドは、複数の細胞を含有する試料に由来するポリヌクレオチドである。
【0149】
一部の実施形態では、標的ポリヌクレオチドは、バイオマーカー配列をコードする。一部の実施形態では、標的ポリヌクレオチドは、2つまたはそれ超のバイオマーカー配列をコードする。一部の実施形態では、複数の標的ポリヌクレオチドは、バイオマーカー配列をコードする。一部の実施形態では、複数の標的ポリヌクレオチドは、2つまたはそれ超のバイオマーカー配列をコードする。一部の実施形態では、複数の標的ポリヌクレオチドは、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、もしくは100、またはそれ超のバイオマーカー配列をコードする。
【0150】
一部の実施形態では、複数の標的ポリヌクレオチドは、免疫グロブリン配列のパネルを含む。一部の実施形態では、複数の標的ポリヌクレオチドは、TCR配列のパネルを含む。例えば、免疫グロブリン配列のパネルは、V
Hおよび/またはV
L配列でありうる。一部の実施形態では、免疫グロブリンまたはTCR配列のパネルは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の免疫グロブリンまたはTCR配列を含有する。一部の実施形態では、免疫グロブリンまたはTCR配列のパネルは、少なくとも約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×10
6、2×10
6、3×10
6、4×10
6、5×10
6、6×10
6、7×10
6、8×10
6、9×10
6、1×10
7、2×10
7、3×10
7、4×10
7、5×10
7、6×10
7、7×10
7、8×10
7、9×10
7、1×10
8、2×10
8、3×10
8、4×10
8、5×10
8、6×10
8、7×10
8、8×10
8、9×10
8、1×10
9、2×10
9、3×10
9、4×10
9、5×10
9、6×10
9、7×10
9、8×10
9、9×10
9、1×10
10、2×10
10、3×10
10、4×10
10、5×10
10、6×10
10、7×10
10、8×10
10、9×10
10、1×10
11、2×10
11、3×10
11、4×10
11、5×10
11、6×10
11、7×10
11、8×10
11、9×10
11、1×10
12、2×10
12、3×10
12、4×10
12、5×10
12、6×10
12、7×10
12、8×10
12、または9×10
12の免疫グロブリンまたはTCR配列を含有する。一部の実施形態では、免疫グロブリンまたはTCR配列のパネルは、最大で約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×10
6、2×10
6、3×10
6、4×10
6、5×10
6、6×10
6、7×10
6、8×10
6、9×10
6、1×10
7、2×10
7、3×10
7、4×10
7、5×10
7、6×10
7、7×10
7、8×10
7、9×10
7、1×10
8、2×10
8、3×10
8、4×10
8、5×10
8、6×10
8、7×10
8、8×10
8、9×10
8、1×10
9、2×10
9、3×10
9、4×10
9、5×10
9、6×10
9、7×10
9、8×10
9、9×10
9、1×10
10、2×10
10、3×10
10、4×10
10、5×10
10、6×10
10、7×10
10、8×10
10、9×10
10、1×10
11、2×10
11、3×10
11、4×10
11、5×10
11、6×10
11、7×10
11、8×10
11、9×10
11、1×10
12、2×10
12、3×10
12、4×10
12、5×10
12、6×10
12、7×10
12、8×10
12、または9×10
12の免疫グロブリンまたはTCR配列を含有する。一部の実施形態では、免疫グロブリンまたはTCR配列のパネルは、約10〜20、10〜30、10〜40、10〜30、10〜40、10〜50、10〜60、10〜70、10〜80、10〜90、10〜100、50〜60、50〜70、50〜80、50〜90、50〜100、100〜200、100〜300、100〜400、100〜300、100〜400、100〜500、100〜600、100〜700、100〜800、100〜900、100〜1000、500〜600、500〜700、500〜800、500〜900、500〜1000、1000〜2000、1000〜3000、1000〜4000、1000〜3000、1000〜4000、1000〜5000、1000〜6000、1000〜7000、1000〜8000、1000〜9000、1000〜10000、5000〜6000、5000〜7000、5000〜8000、5000〜9000、5000〜10000、1つ〜1×10
5、1つ〜2×10
5、1つ〜3×10
5、1つ〜4×10
5、1つ〜5×10
5、1つ〜6×10
5、1つ〜7×10
5、1つ〜8×10
5、9×10
5、1つ〜1×10
6、1つ〜2×10
6、1つ〜3×10
6、1つ〜4×10
6、1つ〜5×10
6、1つ〜6×10
6、1つ〜7×10
6、1つ〜8×10
6、9×10
6、1×10
7、1つ〜2×10
7、1つ〜3×10
7、1つ〜4×10
7、1つ〜5×10
7、1つ〜6×10
7、1つ〜7×10
7、1つ〜8×10
7、1つ〜9×10
7、1つ〜1×10
8、1つ〜2×10
8、1つ〜3×10
8、1つ〜4×10
8、1つ〜5×10
8、1つ〜6×10
8、1つ〜7×10
8、1つ〜8×10
8、1つ〜9×10
8、1つ〜1×10
9、1つ〜2×10
9、1つ〜3×10
9、1つ〜4×10
9、1つ〜5×10
9、1つ〜6×10
9、1つ〜7×10
9、1つ〜8×10
9、1つ〜9×10
9、1つ〜1×10
10、1つ〜2×10
10、1つ〜3×10
10、1つ〜4×10
10、1つ〜5×10
10、1つ〜6×10
10、1つ〜7×10
10、1つ〜8×10
10、1つ〜9×10
10、1つ〜1×10
11、1つ〜2×10
11、1つ〜3×10
11、1つ〜4×10
11、1つ〜5×10
11、1つ〜6×10
11、1つ〜7×10
11、1つ〜8×10
11、1つ〜9×10
11、1つ〜1×10
12、1つ〜2×10
12、1つ〜3×10
12、1つ〜4×10
12、1つ〜5×10
12、1つ〜6×10
12、1つ〜7×10
12、1つ〜8×10
12、または1つ〜9×10
12の免疫グロブリンまたはTCR配列を含有する。
【0151】
一部の実施形態では、標的ポリヌクレオチドは、約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対の長さである。一部の実施形態では、標的ポリヌクレオチドは、少なくとも約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対の長さである。一部の実施形態では、標的ポリヌクレオチドは、最大で約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対の長さである。一部の実施形態では、標的ポリヌクレオチドは、約10〜20、10〜30、10〜40、10〜30、10〜40、10〜50、10〜60、10〜70、10〜80、10〜90、10〜100、50〜60、50〜70、50〜80、50〜90、50〜100、100〜200、100〜300、100〜400、100〜300、100〜400、100〜500、100〜600、100〜700、100〜800、100〜900、100〜1000、500〜600、500〜700、500〜800、500〜900、500〜1000、1000〜2000、1000〜3000、1000〜4000、1000〜3000、1000〜4000、1000〜5000、1000〜6000、1000〜7000、1000〜8000、1000〜9000、1000〜10000、5000〜6000、5000〜7000、5000〜8000、5000〜9000、もしくは5000〜10000塩基または塩基対の長さである。一部の実施形態では、標的ポリヌクレオチドまたはその断片の平均の長さは、約100、200、300、400、500、もしくは800塩基対未満、または約5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、もしくは200ヌクレオチド未満、または約1、2、5、10、20、30、40、50、60、70、80、90、100キロベース未満でありうる。一部の実施形態では、標的ポリヌクレオチドを含有する試料など、比較的短い鋳型に由来する標的配列は、約40、45、50、55、60、65、70、75、80、85、90、95、または100塩基である。ある特定の実施形態では、疾患または状態と関連する配列または免疫グロブリンもしくはTCR配列を含有するデータベースを使用して、シークエンシングデータを、既知のまたは期待される配列に対してアラインする。
【0152】
免疫レパートリーのシークエンシング
本発明は、ポリヌクレオチドのライブラリーを生成するために核酸を操作するステップを、シークエンシングのために活用する。一部の実施形態では、本発明は、組換えモノクローナル抗体を作製するために、核酸を操作するステップを活用する。一般的な意味において、本発明の一部の実施形態では、免疫細胞および/またはT細胞の遺伝子材料の増幅のために、例えば、逆転写ポリメラーゼ連鎖反応(逆転写PCR)が、免疫細胞の遺伝子材料のcDNA増幅を起こすために用いられる。抗体分子では、免疫グロブリン遺伝子は、免疫細胞またはT細胞のゲノムDNAまたはmRNAから得ることができる。RNAは、重鎖(V、D、Jセグメント)の場合もあり、軽鎖(V、Jセグメント)の場合もある。一部の実施形態では、出発材料は、抗体をコードし、定常領域を含有する、V、D、J遺伝子セグメントからなる、免疫細胞に由来するRNAである。
【0153】
RNAなどのポリヌクレオチド出発材料は、ポリヌクレオチドの1つまたはプールを使用して、cDNAに逆転写することができる。ポリヌクレオチドは、例えば定常領域内またはmRNAのポリAテールに、RNAの領域に相補的な部分を含む。容器バーコードは、NNNNWNNNNWNNNNWNNNNW[配列中、Wは、AまたはTを意味する]などの公知の挿入塩基位置を伴うかまたは伴わない、約20の縮重ヌクレオチドの連なりでありうる。
【0154】
逆転写から生じるcDNAは、1つまたは複数のバーコード、例えば、容器バーコードおよび分子バーコードでタグ付けすることができる。特定のデザインの多様なオリゴヌクレオチドを、タグ付けのために使用することができる。逆転写から生じるタグ付けされたcDNAは、PCR増幅などにより、1回または複数回増幅することができる。特定のデザインの多様なプライマーを、増幅のために使用することができる。PCRなどの第1の増幅反応の産物は、第1または第2のPCRフェーズなど、第2の増幅反応を使用して増幅することができる。多様なプライマーを、増幅ステップのために使用することができる。本明細書で記載される方法を使用して、増幅されたポリヌクレオチドのライブラリーを生成することができる。結果として得られるライブラリーは、適切な分子および容器バーコードを有する、完全または部分的な抗体またはTCR配列を含みうる。
【0155】
他の実施形態では、鋳型のスイッチングを使用して、免疫レパートリーをシークエンシングするためなどのライブラリーを生成することができる。例えば、鋳型のスイッチングを、逆転写中に用いて、容器バーコード化ポリヌクレオチドまたは分子バーコード化ポリヌクレオチドなど、バーコードを有するポリヌクレオチドに相補的な、逆転写産物における領域を生成することができる。鋳型のスイッチングを、逆転写中に用いて、PCRバイアスの問題を取り除くことができる。これらの方法は、ハイスループットシークエンシングプラットフォームの使用などを介する、抗体のシークエンシングのために使用することができる。
【0156】
出発材料は、抗体をコードし、定常領域を含有する、V、D、J遺伝子セグメントを含む、免疫細胞またはT細胞などに由来するRNAまたはDNAでありうる。一部の実施形態では、標的ポリヌクレオチドは、重鎖セグメント(V、D、Jセグメント)、または軽鎖セグメント(V、Jセグメント)を含む。
【0157】
標的ポリヌクレオチドは、ポリヌクレオチドの1つまたはプールを使用して、cDNAに逆転写することができる。標的ポリヌクレオチドを逆転写するためのポリヌクレオチドのプール中のプライマーの例は、標的ポリヌクレオチドの領域に相補的な部分を含みうる。一部の実施形態では、標的ポリヌクレオチドの領域に相補的な部分は、mRNAなど、標的ポリヌクレオチドの定常領域またはポリAテールに相補的でありうる。プライマーなどの複数のオリゴヌクレオチドは、1つまたは複数の定常領域をアニールするのに使用することができる。逆転写酵素を用いて、逆転写反応を実行することができる。特定の実施形態では、逆転写酵素は、非鋳型ターミナルトランスフェラーゼ活性を含みうる。非鋳型ターミナルトランスフェラーゼ活性を含む逆転写酵素が、鋳型の端部に達すると、この逆転写酵素は、3つまたはそれ超の非鋳型シトシン残基など、3つまたはそれ超の非鋳型残基を付加しうる。一部の実施形態では、Superscipt II(商標)逆転写酵素を、この目的で使用する。一部の実施形態では、Maxima(商標)逆転写酵素を、この目的で使用する。一部の実施形態では、Protoscript II(商標)逆転写酵素を、この目的で使用する。一部の実施形態では、モロニーマウス白血病ウイルス逆転写酵素(MMLV−RT)を、この目的で使用する。一部の実施形態では、HighScriber(商標)逆転写酵素を、この目的で使用する。一部の実施形態では、末端デオキシヌクレオチジルトランスフェラーゼを、この目的で使用する。一部の実施形態では、トリ骨髄芽球症ウイルス(AMV)逆転写酵素を、この目的で使用する。非鋳型ターミナルトランスフェラーゼ活性を有する、RNAを転写することが可能な任意の逆転写酵素を使用することができる。非鋳型ターミナルトランスフェラーゼ活性を有する、RNAを転写することが可能な任意のリバースポリメラーゼを使用することができる。非鋳型ターミナルトランスフェラーゼ活性を有する、DNAを転写することが可能な任意のリバースポリメラーゼを使用することができる。
【0158】
上記で記載した逆転写反応などの逆転写反応は、3’側タグ付けポリヌクレオチドの存在下で行うことができる。3’側タグ付けポリヌクレオチドは、cDNAなど、標的ポリヌクレオチドの3’末端に核酸を付加するのに使用されるポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、cDNAなど、標的ポリヌクレオチドの3’末端に核酸を付加する鋳型として使用されるポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、cDNAなど、標的ポリヌクレオチドの3’末端とハイブリダイズするポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、cDNAなど、標的ポリヌクレオチドの3’末端とハイブリダイズする3’末端領域など、3’側領域を含有するポリヌクレオチドでありうる。例えば、3’側タグ付けポリヌクレオチドは、3つまたはそれ超の非鋳型残基にアニールするセグメントなどのセグメントを含みうる。一部の実施形態では、3’側タグ付けポリヌクレオチドは、分子バーコードポリヌクレオチドである。一部の実施形態では、3’側タグ付けポリヌクレオチドは、分子バーコードを含みうる。一部の実施形態では、3’側タグ付けポリヌクレオチドは、逆転写酵素により産生される鎖に相補的であり、これにアニールする、3’末端における、3つのリボグアニン残基またはそれらの類似体(rGrGrG)(RNA塩基)を含みうる。一部の実施形態では、リボグアニンの代わりに、3つまたはそれ超のグアニン残基(RNAヌクレオチドの代わりに、DNAヌクレオチド)を使用することができる。一部の実施形態では、3’側タグ付けポリヌクレオチドは、逆転写酵素により産生される鎖に相補的であり、これにアニールする、3’末端における1つまたは2つのリボグアニン残基および3’末端におけるデオキシリボグアニン残基またはその類似体(rGrGG)を含みうる。
【0159】
3’側タグ付けポリヌクレオチドが、cDNA鎖のCCCにアニールしたら、逆転写酵素は、反応中、引き続き、cDNAを、タグ付けポリヌクレオチドへと伸長させ、これにより、分子バーコードまたはその相補体を、cDNAなど、ポリヌクレオチドの標的集団に結合させることが可能である。例えば、3’側タグ付けポリヌクレオチドは、標的ポリヌクレオチドの3’末端とハイブリダイズする5’側領域〜3’側領域を含有するポリヌクレオチドでありうる。標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、cDNAなどの標的ポリヌクレオチドに相補的ではない領域を含みうる。標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、分子バーコードを含みうる。標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、容器バーコード化ポリヌクレオチドまたはその相補体に相補的な領域を含みうる。他の実験では、鋳型のスイッチングを、別個の反応において実施することができる。例えば、逆転写反応の後で、3’側タグ付けポリヌクレオチドを付加することができ、逆転写酵素またはポリメラーゼなどの酵素を使用して、タグ付けポリヌクレオチドへと伸長させることができる。タグ付けポリヌクレオチドは、容器内の各分子上に、固有の縮重分子バーコードを有しうるため、容器内の各cDNAを、分子バーコードにより、固有にタグ付けすることができる。一部の実施形態では、鋳型のスイッチングを、逆転写反応を行うのと同時に実施することができる。
【0160】
一部の実施形態では、分子バーコード化ポリヌクレオチドなど、3’側タグ付けポリヌクレオチドは、容器バーコードなど、別のバーコードを含有する、3’側タグ付けポリヌクレオチドまたはその相補体に相補的な、5’末端領域などの5’側領域をさらに含みうる。一部の実施形態では、タグ付けされたcDNA分子など、分子バーコードまたはその相補体を含有する標的ポリヌクレオチドは、容器バーコードなど、別のバーコードを含有する、3’側タグ付けポリヌクレオチドまたはその相補体に相補的な、3’末端領域などの3’側領域を含みうる。
【0161】
一部の実施形態では、3’側タグ付けポリヌクレオチドは、容器バーコード化ポリヌクレオチドである。分子バーコードまたはその相補体を含有するポリヌクレオチドを、標的ポリヌクレオチドから生成したら、容器バーコードを、分子バーコード化標的ポリヌクレオチドに付加することができる。3’側タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなど、標的ポリヌクレオチドの3’末端に核酸を付加するのに使用されるポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなど、標的ポリヌクレオチドの3’末端に核酸を付加する鋳型として使用されるポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなど、標的ポリヌクレオチドの3’末端とハイブリダイズするポリヌクレオチドでありうる。3’側タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなど、標的ポリヌクレオチドの3’末端とハイブリダイズする、3’末端領域などの3’側領域を含有するポリヌクレオチドでありうる。容器バーコード化ポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする、3’末端領域などの3’側領域を含みうる。
【0162】
3’側タグ付けポリヌクレオチドが、分子バーコード化標的ポリヌクレオチドにアニールしたら、逆転写酵素は、反応中、引き続き、cDNAを、容器バーコード化ポリヌクレオチドなど、3’側タグ付けポリヌクレオチドへと伸長させ、これにより、容器バーコードまたはその相補体を、分子バーコード化標的ポリヌクレオチドなど、ポリヌクレオチドの標的集団に結合させることが可能である。例えば、3’側タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする5’側領域〜3’側領域を含有するポリヌクレオチドでありうる。分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、標的ポリヌクレオチドまたは分子バーコード化標的ポリヌクレオチドに相補的ではない領域を含みうる。分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、容器バーコードを含みうる。
【0163】
一部の実施形態では、3’側タグ付けポリヌクレオチドは、増幅産物である。一部の実施形態では、3’側タグ付けポリヌクレオチドは、単一分子に由来する増幅産物である。一部の実施形態では、3’側タグ付けポリヌクレオチドは、容器バーコード化ポリヌクレオチドの増幅産物である。一部の実施形態では、3’側タグ付けポリヌクレオチドは、単一の容器バーコード化ポリヌクレオチドに由来する増幅産物である。分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、プライマーまたはその相補体に相補的な領域を含みうる。分子バーコード化標的ポリヌクレオチドの3’末端とハイブリダイズする、5’側領域〜3’側領域は、容器バーコード化ポリヌクレオチドを増幅するのに使用されたプライマーまたはその相補体に相補的な領域を含みうる。
【0164】
次いで、分子バーコードおよび容器バーコードを含有する二重バーコード化標的ポリヌクレオチド、例えばcDNAなどを、PCRなどにより増幅することができる。次いで、例えば、プライマーセットを使用することにより、PCRを行うことができる。次いで、前述のPCR反応の産物を、1つまたは複数のラウンドのPCRなどにより、1回または複数回増幅することもでき、直接シークエンシングすることもできる。
【0165】
本明細書で記載される方法に従い作製されたライブラリーは、容器バーコードおよび分子バーコードなど、適切なバーコードを有する大型の抗体もしくはTCR配列または完全な抗体もしくはTCR配列であって、シークエンシングされる抗体またはTCR配列を含むライブラリーでありうる。一部の実施形態では、本明細書で記載される方法に従い作製されたライブラリーは、シークエンシングに適切なクラスタリングセグメントを含有しうる。一部の実施形態では、同一な分子バーコードの多くのコピーを生成することができる。一部の実施形態では、同一な分子バーコードを含有するポリヌクレオチドの多くのコピーを、固有の出発標的ポリヌクレオチド分子の各々について生成することができる。一部の実施形態では、同一な分子バーコードを含有するポリヌクレオチドの多くのコピーを、容器バーコードでタグ付けされた、固有の出発標的ポリヌクレオチド分子の各々について生成することができる。
【0166】
シークエンシングしたら、同一な分子バーコードを有する配列を、マッチまたは対合させることができる。シークエンシングしたら、同一な容器バーコードを有する配列を、マッチまたは対合させることができる。シークエンシングしたら、同一な標的配列を有する配列を、マッチまたは対合させることができる。一部の実施形態では、シークエンシングリードを、コンセンサス配列へとコラプシングすることができる。マッチまたは対合させたシークエンシングリードを、コンセンサス配列へとコラプシングし、これにより、シークエンシングエラーおよびPCRエラーを低減するか、または消失させることができる。シークエンシングは、第1のリードについて、第1のプライマー部位を使用して実施することができる。シークエンシングは、第2のリードについて、第1のプライマー部位を使用して実施することができる。シークエンシングは、第2のリードについて、第2のプライマー部位を使用して実施することができる。
【0167】
同じ容器バーコードを含有する抗体の重鎖および軽鎖を対合させることができ、一部の実施形態では、哺乳動物のベクター系においてクローニングすることができる。抗体構築物は、他のヒトまたは哺乳動物の宿主細胞系において発現させることができる。次いで、構築物を、一過性トランスフェクションアッセイおよび発現させた目的の抗体またはTCRについてのウェスタンブロット解析により検証することができる。
【0168】
RNAまたはDNAの増幅法は、当技術分野で周知であり、本明細書で提示される教示および指針に基づき、過度の実験を伴わずに、本発明に従って使用することができる。DNAまたはRNAの公知の増幅法は、ポリメラーゼ連鎖反応(PCR)および関連する増幅工程(例えば、Mullisらによる、米国特許第4,683,195号、同第4,683,202号、同第4,800,159号、同第4,965,188号;Taborらによる同第4,795,699号および同第4,921,794号;Innisによる同第5,142,033号;Wilsonらによる同第5,122,464号;Innisによる同第5,091,310号;Gyllenstenらによる同第5,066,584号;Gelfandらによる同第4,889,818号;Silverらによる同第4,994,370号;Biswasによる同第4,766,067号;Ringoldによる同第4,656,134号を参照されたい)、ならびに二本鎖DNA合成のための鋳型として、標的配列に対するアンチセンスRNAを使用するRNAを媒介する増幅(Malekらによる米国特許第5,130,238号、商標名をNASBAとする)を含むがこれらに限定されず、これらの参考文献の全内容は、参照により本明細書に組み込まれる。(例えば、Ausubel、前出;またはSambrook、前出を参照されたい。)
【0169】
増幅、シークエンシングなど、本明細書で記載される方法ステップは、アレイなど、その上に、例えば、抗原など、複数の基質を固定化させた固相を用いるマルチプレックスアッセイフォーマットで実行してもしなくてもよく、好都合である。一部の実施形態では、アレイは、タンパク質バイオチップである。タンパク質バイオチップを使用して、数百さらには数千の抗原をスクリーニングすることができる。本明細書で使用される場合、「アレイ」、「マイクロアレイ」、または「バイオチップ」とは、吸着材を結合させたほぼ平面を有する固体基質を指す。多くの場合、バイオチップの表面は、複数のアドレス可能な場所を含み、これらの場所の各々に吸着材を結合させる。バイオチップは、プローブインターフェースに係合するように適合させることができ、したがって、プローブとして機能しうる。「タンパク質バイオチップ」とは、ポリペプチドの捕捉に適合させたバイオチップを指す。当技術分野では、多くのタンパク質バイオチップが記載されている。ポリペプチドアレイを作製する方法は、例えば、De Wildtら、2000年、Nat.Biotechnol.、18巻:989〜994頁;Luekingら、1999年、Anal.Biochem.、270巻:103〜111頁;Ge、2000年、Nucleic Acids Res.、28巻、e3号、1−V
H;MacBeathおよびSchreiber、2000年、Science、289巻:1760〜1763頁;WO01/40803およびWO99/51773A1において記載されている。アレイの使用は、スクリーニングなど、いくつかのステップを、ロボット方式および/またはハイスループット方式で実施することを可能とする。アレイのためのポリペプチドは、例えば、Genetic MicroSystems製またはBioRobotics製などの市販のロボット装置を使用して、高速度でスポッティングすることができる。アレイ基質は、例えば、ニトロセルロース、プラスチック、ガラス、例えば、表面改変ガラスでありうる。アレイはまた、多孔性マトリックス、例えば、アクリルアミド、アガロース、または別のポリマーも含みうる。バイオチップ上に捕捉したら、解析物を、例えば、気相イオン分光分析法、光学法、電気化学法、原子間力顕微鏡法、および高周波法から選択される、様々な検出法により検出することができる。特に興味深いのは、質量分析、特にSELDIの使用である。光学法は、例えば、蛍光、発光、化学発光、吸光度、反射率、透過率、複屈折または屈折率の検出(例えば、表面プラズモン共鳴、偏光解析法、共振ミラー法、グレーティングカプラ導波路法、または干渉法)を含む。光学法は、顕微鏡法(共焦点および非共焦点の両方)、イメージング法、および非イメージング法を含む。多様なフォーマットにおけるイムノアッセイ(例えば、ELISA)は、固相上で捕捉された解析物を検出するための一般的な方法である。電気化学法は、ボルタンメトリーおよびアンペロメトリー法を含む。高周波法は、多重極共鳴分光法を含む。
【0170】
本発明の一部の実施形態では、例えば、モノクローナル抗体を調製するための自然多様性法、単一細胞に対処するために確立された技法を用いる。1つの技法は、FACSにおいて、単一細胞を、別々のコンテナーへと偏向させるのに使用しうる、特殊なアクセサリーを組み込む。このようなアクセサリーは、市販されており、当技術分野で周知である。このようなアクセサリーは、単一細胞を、例えば、標準的な96ウェルマイクロ滴定培養プレートの選択されたコンパートメントに分注するのに有用である。代替的に、細胞は、単一細胞の沈着を確保するように、限界希釈率で、マイクロ滴定プレートへと沈着させることができる。
【0171】
第2の技法は、V
HおよびV
Lセグメントを増幅するように、単一の免疫細胞上で実施されるPCRである。自然多様性法では、単一細胞PCRを使用して、単一細胞内のV
LとV
Hとの天然対合を保持する。抗体の特異性は、V
L領域およびV
H領域内の相補性決定領域(CDR)により決定される。
【0172】
当技術分野では、単一細胞PCRを実施するための方法が周知である(例えば、Larrick,J.W.ら、Bio/Technology、7巻:934頁(1989年))。例えば、B細胞ライブラリーに由来する抗体産生B細胞またはT細胞ライブラリーに由来するTCR産生T細胞は、固定剤溶液、またはホルムアルデヒド、グルタルアルデヒドなどの化学物質を含有する溶液で固定することができる。次いで、細胞を、例えば、洗浄剤を含む透過化溶液で透過処理する。固定および透過化工程は、細胞内コンパートメントまたはその中の核酸の過度の破壊を伴わずに、酵素、ヌクレオチド、および他の試薬の、細胞への移入を可能とするのに十分な多孔性をもたらすものとする。次いで、添加された酵素およびヌクレオチドは、細胞に移入して、細胞内V
HおよびV
LまたはVαおよびVβまたはVγおよびVδmRNAを、例えば、対応するcDNA配列に逆転写しうる。逆転写酵素、十分な量の4つのdNTP、およびmRNAに結合するプライマーであって、逆転写酵素が重合を開始するための3’ヒドロキシル基をもたらすプライマーを使用して、単一のステップで、または任意選択で、PCR手順と併せて、逆転写を実施することができる。mRNAに相補的な任意のプライマーを使用しうるが、可変領域mRNAの選択を容易とするように、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ分子の3’末端に相補的なプライマーを使用することが好ましい。多数の研究は、縮重ポリヌクレオチドを、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδのための5’末端プライマーとして用いるために調製しうることを示している。標的化分子を作るコンビナトリアルライブラリー法は、このようなプライマーに依拠する。さらに、多数の実験は、PCRにより、単一細胞から、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδなど、目的の遺伝子セグメントを増幅しうることを示している。単一細胞に対してでも対処する能力のため、このPCR法により、目的の免疫細胞が低頻度で生じる場合であっても、抗体を生成することができる。
【0173】
高多様性の実施形態では、FACSによる分取の後で、免疫細胞ライブラリーの細胞をプールし、逆転写PCRを、細胞のプール全体に対して実施する。抗体またはTCRをクローニングする目的での、mRNAの生成は、抗体またはTCRの調製および特徴付けのための周知の手順により、容易に達成される(例えば、参照により本明細書に組み込まれる、Antibodies: A Laboratory Manual、1988年を参照されたい)。例えば、B細胞ライブラリーに由来する全RNAは、当技術分野で標準的であり、常套的である、適切な方法により抽出する。次いで、例えば、ランダムヘキサマーポリヌクレオチド、またはC遺伝子もしくはC遺伝子ファミリー特異的プライマー、またはV遺伝子もしくはV遺伝子ファミリー特異的プライマーを使用する適切な方法により、cDNAを、RNAから合成する。ここでもまた、これらは、上記で説明した通り、当業者に公知の工程である。B細胞またはT細胞ライブラリーから導出される核酸分子のライブラリー、例えば、このようなBまたはTリンパ球から導出されるRNAまたはcDNA分子のライブラリーは、発現ライブラリーを形成するように、発現ベクターにクローニングすることができる。一部の実施形態では、免疫細胞ライブラリーから導出されるV
HまたはVαもしくはVγドメインだけを増幅して、V
HまたはVαもしくはVγドメインのライブラリーを生成する。本明細書で記載される方法を使用して、抗体またはTCRを生成するのに、別の供給源に由来するV
LまたはVβもしくはVδライブラリーを、V
HまたはVαもしくはVγライブラリーと組み合わせて使用する。抗体またはTCR断片のライブラリーは、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδライブラリーを、当業者に公知の任意の数の方式で、併せて組み合わせることにより構築することができる。例えば、各ライブラリーを、異なるベクター内で創出し、ベクターを、in vitroまたはin vivoで組み換えることができる。代替的に、ライブラリーは、同じベクターに逐次的にクローニングすることもでき、PCRにより併せてアセンブルし、次いで、クローニングすることもできる。PCRアセンブリーはまた、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδDNAを、可撓性のペプチドスペーサーをコードするDNAと結合させて、本明細書の別の箇所で記載される単鎖Fv(scFv)ライブラリーを形成するのにも使用することができる。さらに別の技法では、細胞内PCRアセンブリーを使用して、PCRにより、リンパ球内のV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ遺伝子を組み合わせ、次いで、連結された遺伝子のレパートリーをクローニングする。
【0174】
単一細胞のバーコード化
容器バーコードおよび分子バーコードにより、単一細胞にバーコードを付けるために、結果として得られる容器が、容器1つ当たり細胞1個またはそれ未満を含有するように、油中水エマルジョンなどの容器を創出することができる。結果として得られる容器がまた、容器1つ当たり1つの容器バーコードも含有するように、容器を創出することができる。結果として得られる容器がまた、容器1つ当たり1つの分子バーコード化ポリヌクレオチドも含有するように、容器を創出することができる。結果として得られる容器がまた、容器1つ当たり2つもしくはそれ超または複数の分子バーコード化ポリヌクレオチドも含有するように、容器を創出することができる。細胞/容器は、本明細書で記載される、RNAまたはDNAの単一バーコード化プロトコールの下にあり、各容器の容器バーコードおよび1つまたは複数の分子バーコードを、細胞ポリヌクレオチドなど、目的の標的と融合させることができる。一部の実施形態では、マッチする容器バーコード化ポリヌクレオチドは、1つまたは複数の分子バーコード化ポリヌクレオチドと同じ容器内に存在する細胞構成要素と融合させることができる。シークエンシングに続き、容器バーコードおよび分子バーコードのデコンボリューションを使用して、どのRNA(またはDNA)が、どの細胞に由来するかを同定することができる。一部の実施形態では、結果として得られるエマルジョンが、エマルジョン1つ当たり細胞1個またはそれ超を含有するように、油中水エマルジョンなどの容器を創出することができる。一部の実施形態では、結果として得られるエマルジョンが、容器1つ当たり1つの容器バーコード化ポリヌクレオチドおよび2つまたはそれ超の分子バーコード化ポリヌクレオチドを含有するように、油中水エマルジョンを創出することができる。一部の実施形態では、結果として得られる容器が、容器1つ当たり1つ超の容器バーコード化ポリヌクレオチドおよび2つまたはそれ超の分子バーコード化ポリヌクレオチドを含有するように、容器を創出することができる。一部の実施形態では、容器バーコードおよび分子バーコードは、溶液中にある場合に、容器に導入することができる。一部の実施形態では、容器バーコードおよび分子バーコードは、ビーズなど、固体支持体に結合させていない場合に、容器に導入することができる。
【0175】
一部の態様では、単一細胞は、コンパートメントとして作用しうる、エマルジョンの内部で単離することができる。細胞は、溶解させることができ、細胞からの転写物は、バーコード化することができる。同じ容器バーコードで、2つまたはそれ超のRNA転写物が検出される場合、それらは、同じ出発細胞から導出されたと決定されうるように、転写物の各々を、分子バーコードまたは容器バーコードと融合させることができる。これは、多くの異なる種類の配列に適用することができる。1つの特定の適用は、抗体およびTCR配列のV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ鎖を連結することでありうる。
【0176】
1つまたは複数の単一細胞は、1つまたは複数のエマルジョンの1つの液滴が、最大で細胞1個またはそれ未満を含有しうるように、1つまたは複数のエマルジョン内、容器バーコードおよび分子バーコードの存在下で単離することができる。細胞は、エマルジョン中に含有される緩衝液により化学的に溶解させることもでき、凍結融解より溶解させることもでき、これにより、細胞の内容物を、エマルジョン中に放出することができる。
【0177】
単一細胞のRNAは、cDNAに逆転写することができる。逆転写反応は、上記で記載した通り、約3つのシトシン残基を付加する、非鋳型ターミナルトランスフェラーゼ活性を所有する逆転写酵素によりなされうる。エマルジョンを形成する場合は、逆転写緩衝液、酵素、およびヌクレオチドの全てが存在しうる。一部の実施形態では、全てのmRNAを標的化するように、プライマーを一般化することができる(ポリdT配列を含むポリヌクレオチドなど)。一部の実施形態では、DNAを使用することができる。一部の実施形態では、2つ超のRNAを標的化することができる。
【0178】
一部の実施形態では、逆転写中に、容器バーコードを、RNAに連結することができる。一部の実施形態では、逆転写中に、分子バーコードを、RNAに連結することができる。一部の実施形態では、逆転写中に、容器バーコードおよび分子バーコードを、RNAに連結することができる。
【0179】
逆転写反応は、3’側タグ付けポリヌクレオチドの存在下で行うことができる。3’側タグ付けポリヌクレオチドは、シークエンシングプライマーをアニールさせるために使用されうるP7セグメントを含みうる。3’側タグ付けポリヌクレオチドは、容器バーコードまたは分子バーコードを含みうる。3’側タグ付けポリヌクレオチドは、逆転写酵素により産生される鎖に相補的でありえ、これにアニールさせうる、3’末端における3つのリボグアニン残基(rGrGrG)(RNA塩基)を含みうる。したがって、容器バーコードおよび分子バーコードを、逆転写酵素により、この同じエマルジョン中のcDNAの末端に付加することができる。一部の実施形態では、リボグアニンの代わりに、グアニン残基(RNAヌクレオチドの代わりに、DNAヌクレオチド)を使用することができる。3’側タグ付けポリヌクレオチドが、cDNA鎖のCCCにアニールしたら、逆転写酵素は、反応中、引き続き、cDNAを、3’側タグ付けポリヌクレオチドへと伸長させ、これにより、全てのcDNAに対する分子バーコード化タグを創出する。3’側タグ付けポリヌクレオチドが、分子バーコード化cDNAの領域にアニールしたら、逆転写酵素またはポリメラーゼは、反応中、引き続き、分子バーコード化cDNAを、別の3’側タグ付けポリヌクレオチドへと伸長させ、これにより、全てのcDNAに対する容器バーコード化タグを創出する。一部の実施形態では、鋳型のスイッチングは、逆転写反応が行われうるときと同時になされる代わりに、別個の反応で施すことができる。一部の実施形態では、逆転写反応の後で、3’側タグ付けポリヌクレオチドを付加することができ、逆転写酵素またはポリメラーゼなどの酵素を使用して、類似の方式で、タグ付けポリヌクレオチドへと伸長させることができる。3’側タグ付けポリヌクレオチドは、各単一分子上に、固有の縮重分子バーコードを有しうるため、各cDNAを、分子バーコードで、固有にタグ付けすることができる。3’側タグ付けポリヌクレオチドは、単一の容器に由来する各単一分子上に、同じ縮重容器バーコードを有しうるため、各cDNAを、容器に固有の容器バーコードでタグ付けすることができる。
【0180】
B細胞ライブラリーの遺伝子材料のクローニングおよび発現
本明細書で使用される「抗体発現ライブラリー」または「TCR発現ライブラリー」または「発現ライブラリー」とは、核酸またはタンパク質レベルにおける、分子のコレクション(すなわち、2つまたはそれ超の分子)を指す場合がある。したがって、この用語は、複数の抗体またはTCR分子をコードする発現ベクターのコレクション(すなわち、核酸レベルにおける)を指す場合もあり、それらを適切な発現系において発現させた後における、抗体またはTCR分子のコレクション(すなわち、タンパク質レベルにおける)を指す場合もある。代替的に、発現ベクター/発現ライブラリーは、それらを発現させうる適切な宿主細胞内に含有される場合もある。本発明の発現ライブラリー内でコードされるかまたは発現する抗体分子は、任意の適切なフォーマットであることが可能であり、例えば、全抗体またはTCR分子の場合もあり、抗体またはTCR断片、例えば、単鎖抗体(例えば、scFv抗体)、Fv抗体、Fab’抗体、(Fab’)
2断片、ダイアボディなどの場合もある。特定の酵素を「コードする(encoding)」/「コードする(coding for)」核酸配列、またはそのDNAコード配列、またはそれを「コードする(encoding)」/「コードする(coding for)」ヌクレオチド配列である場合の、「コードすること(encoding)」および「コードすること(coding for)」という用語、ならびに他の同義の用語は、適切な調節配列の制御下に置かれた場合に、酵素に転写および翻訳されるDNA配列を指す。「プロモーター配列」とは、細胞内のRNAポリメラーゼに結合し、下流の(3’方向の)コード配列の転写を開始することが可能な、DNA調節領域である。プロモーターは、DNA配列の一部である。この配列領域は、その3’末端において、開始コドンを有する。プロモーター配列は、バックグラウンドを上回る検出可能なレベルで転写を開始するのに必要なエレメントを有する、最小数の塩基を含む。しかし、RNAポリメラーゼが配列に結合し、転写が、開始コドン(プロモーターを有する3’末端)において開始された後、転写は、下流において、3’方向に進行する。プロモーター配列内には、転写開始部位(ヌクレアーゼS1によるマッピングにより規定されるので好都合である)のほか、RNAポリメラーゼの結合の一因となるタンパク質結合性ドメイン(コンセンサス配列)も見出されるであろう。
【0181】
本発明の抗体またはTCR発現ライブラリーにより同定されるか、これらから導出されるか、これらから選択されるか、またはこれらから得られる、抗体またはTCR分子は、本発明のなおさらなる態様を形成する。ここでもまた、これらの抗体またはTCR分子は、タンパク質の場合もあり、抗体またはTCR分子をコードする核酸の場合もあり、これらの核酸は、適切な発現ベクターに組み込まれる場合もあり、かつ/または適切な宿主細胞内に含有される場合もある。
【0182】
cDNAプールは、抗体遺伝子の重鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体またはTCR遺伝子の、V
HまたはVαもしくはVγ鎖領域の5’末端にハイブリダイズするポリヌクレオチドとを伴うPCR反応にかけることができる。cDNAプールは、抗体またはTCR遺伝子の重鎖またはアルファもしくはガンマ鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体またはTCR配列を含むバーコード化ポリヌクレオチドの、V
HまたはVαもしくはVγ鎖領域の5’末端に対して5’側の領域にハイブリダイズするポリヌクレオチドとを伴うPCR反応にかけることができる。PCR反応はまた、例えば、カッパおよびラムダクラスのV
LまたはVβもしくはVδ鎖プールを増幅するためにも設定することができる。cDNAプールは、抗体遺伝子の軽鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体またはTCR遺伝子の、V
LまたはVβもしくはVδ鎖領域の5’末端にハイブリダイズするポリヌクレオチドとを伴うPCR反応にかけることができる。cDNAプールは、抗体遺伝子の軽鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体またはTCR配列を含むバーコード化ポリヌクレオチドの、V
LまたはVβもしくはVδ鎖領域の5’末端に対して5’側の領域にハイブリダイズするポリヌクレオチドとを伴うPCR反応にかけることができる。このようなオリゴヌクレオチドまたはプライマーは、公知であり、公表されている、免疫グロブリンまたはTCR遺伝子の配列データベース情報に基づきデザインすることができる。
【0183】
一部の実施形態では、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列は、重鎖遺または軽鎖遺伝子に対して特異的ではなく、特に、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδポリヌクレオチドの一方または両方の末端領域に対して特異的ではない、1つまたは複数のプライマーを使用するPCR増幅により作製された、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから好都合に得ることができる。一部の実施形態では、V
HおよびV
L配列は、容器バーコード化ポリヌクレオチドの領域に対して特異的な、プライマーを使用するPCR増幅により作製された、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから好都合に得ることができる。一部の実施形態では、V
HおよびV
L配列は、C遺伝子ファミリー特異的プライマーまたはC遺伝子特異的プライマーを使用するPCR増幅により作製された、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから好都合に得ることができる。一部の実施形態では、V
HおよびV
L配列は、容器バーコード化ポリヌクレオチドの領域に対して特異的な第1のプライマーと、C遺伝子ファミリー特異的プライマーまたはC遺伝子特異的プライマーである、第2のプライマーまたは複数の第2のプライマーとを有するプライマーセットを使用するPCR増幅により作製された、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから好都合に得ることができる。一部の実施形態では、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列は、容器バーコード化ポリヌクレオチドの領域に対して特異的な第1のプライマーと、ユニバーサル配列に対して特異的な第2のプライマーとを有するプライマーセットを使用するPCR増幅により作製された、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから好都合に得ることができる。
【0184】
一部の実施形態では、逆転写時に、結果として得られるcDNA配列を、免疫グロブリン遺伝子に特異的であり、特に、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδポリヌクレオチドの一方または両方の末端領域に特異的な、1つまたは複数のプライマーを使用するPCRにより増幅することができる。一部の実施形態では、V
HおよびV
L配列は、V遺伝子ファミリー特異的プライマーまたはV遺伝子特異的プライマーを使用するPCR増幅により作製される、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列のライブラリーから得ることができるか(Nichollsら、J.Immunol.Meth.、1993年、165巻:81頁;W093/12227)、または入手可能な配列情報に基づき、当技術分野で公知の標準的な方法に従いデザインされる。(V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列は通例、介在するスペーサー配列(例えば、インフレームの可撓性のペプチドスペーサーをコードする)とライゲートし、単鎖抗体をコードするカセットを形成することが可能である)。V領域配列は、免疫グロブリン発現細胞のためのcDNA増幅産物またはPCR増幅産物として好都合にクローニングしうる。V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ領域を任意選択で、本明細書で記載される方法で、特に、言及されたある特定のステップの後で(例えば、単一細胞PCRの後;哺乳動物または他の細胞表面ディスプレイの後、FACSによるスクリーニングの後など)シークエンシングする。シークエンシングは、とりわけ、多様性のレベルが、許容可能なレベルであることを検証する理由で使用することができる。シークエンシングは、ハイスループットシークエンシング、ディープシークエンシング(配列の差異を同定するのに、複数の個別の試料から同じ遺伝子をシークエンシングする)、またはこれら2つの組合せを含みうる。
【0185】
一部の実施形態では、本明細書で記載される方法を使用して、自然のV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδの組合せを物理的に連結することは不要である。一部の実施形態では、cDNA、バーコード化ポリヌクレオチド、またはPCR増幅されたバーコード化cDNAを、物理的に連結しない。一部の実施形態では、cDNA、バーコード化ポリヌクレオチド、またはPCR増幅されたバーコード化cDNAを、同じ反応中または容器内で、物理的に連結しない。
【0186】
一部の実施形態では、cDNAプライマーに加えて、V
HまたはVαもしくはVγ遺伝子の5’末端のための1つのプライマーまたは複数のプライマーおよびV
LまたはVβもしくはVδ遺伝子の5’末端のための別のプライマーまたは複数のプライマーを使用して、自然のV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδの組合せを物理的に連結する。これらのプライマーはまた、V
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ遺伝子の自己組織化を可能とするように、追加の配列の相補的なテールも含有する。増幅および連結反応は、各細胞内で実施されるため、PCR増幅および連結の後、混合された産物、言い換えれば、混合された可変領域を得る可能性は、最小限である。混合の危険性は、ジゴキシゲニンで標識されたヌクレオチドなどのバルキー試薬を活用して、V領域のcDNA対が、細胞内コンパートメントを離れ、交雑することなく、PCR増幅および連結のために細胞内にとどまることをさらに確保することにより、さらに減少させることができる。増幅した配列は、相補的な末端配列のハイブリダイゼーションにより連結する。連結の後、本明細書で記載されるさらなる方法ステップにおける使用のために、配列を細胞から回収することができる。例えば、回収されたDNAは、必要な場合、末端のプライマーを使用してPCR増幅することができ、下記で詳述される通り、プラスミド、ファージ、コスミド、ファージミド、ウイルスベクター、またはこれらの組合せでありうるベクターにクローニングすることができる。好都合な制限酵素部位を、ハイブリダイズさせる配列に組み込んで、クローニングを容易とすることができる。これらのベクターはまた、その後の使用のために、連結された可変領域のライブラリーとして保存することもできる。
【0187】
さらなるV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδの組合せをもたらすことが所望される一部の実施形態では、これを容易とするように、発現系を選び出す。例えば、バクテリオファージ発現系は、重鎖配列および軽鎖配列のランダムな組換えを可能とする。他の適切な発現系は、当業者に公知である。
【0188】
非ヒトから導出されるV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδ配列の場合、一部の実施形態では、これらの配列を、完全ヒトFcと共にキメラ化することが好ましい場合があることに注目されたい。本明細書で使用される「キメラ化された」とは、重鎖および軽鎖可変領域またはVαおよびVβもしくはVγおよびVδ領域がヒト由来ではなく、重鎖および軽鎖またはVαおよびVβもしくはVγおよびVδ鎖の定常領域がヒト由来である、免疫グロブリンまたはTCRを指す。これは、可変ドメインを、ヒトFcへと増幅およびクローニングすることによりなされる。ヒトFcは、ベクターの一部の場合もあり、別個の分子内にある場合もあり、Fcのライブラリーもまた、使用しうる。好ましい実施形態では、キメラ化分子を、CHO細胞など、哺乳動物細胞内で増殖させ、FACSにより、2回スクリーニングして、細胞集団を、目的の抗体を発現させる細胞について富化した。キメラ化抗体またはTCRは、シークエンシングとその後の機能的特徴付け、または直接的な機能的特徴付けもしくは反応速度により特徴付ける。増殖、スクリーニング、および特徴付けは、下記に詳細に記載する。
【0189】
上記で記載されたPCR反応が、IgG形態にある抗体のクローニングについて記載されていることに注目することは重要である。これらは、一般に、より成熟した免疫応答と関連し、一般にIgM抗体より高度な親和性を呈示し、これにより、ある特定の治療および診断適用により望ましいものとなっているので、好ましい。しかし、所望または適切な場合、免疫グロブリン分子の他の形態、例えば、IgM、IgA、IgE、およびIgDの1つまたは複数のクローニングを可能とするポリヌクレオチドをデザインしうることが明らかである。
【0190】
抗体またはTCRを同定し、前記細胞の適切な集団を、適切な時点において単離し、上記で記載した通り、任意選択で富化したら、細胞内に含有される遺伝子材料を完全に保つことができ、これにより、後日にライブラリーを作ることを可能とする限りにおいて、抗体またはTCR発現ライブラリーを即座に作成する必要はない。したがって、例えば、細胞、細胞溶解物、または核酸、例えば、これらに由来するRNAまたはDNAは、適切な方法、例えば、凍結により、後日まで保存し、後日、望ましい場合に発現ライブラリーを生成することができる。
【0191】
発現ベクターのライブラリーを生成したら、次いで、コードされた抗体分子を、適切な発現系において発現させ、当技術分野で周知であり、記述されている適切な技法を使用してスクリーニングすることができる。したがって、上記で規定された本発明の方法は、発現ベクターのライブラリーを、適切な発現系において発現させ、下記でさらに詳細に説明される通り、発現させたライブラリーを、所望の特性を有する抗体についてスクリーニングする、さらなるステップを含みうる。
【0192】
本明細書で示される通り、抗体またはTCR配列をコードするポリヌクレオチドを含む、本開示の方法により調製されたポリヌクレオチドは、抗体またはTCR断片自体のアミノ酸配列をコードするポリヌクレオチド、全抗体もしくはTCRまたはそれらの部分の非コード配列、抗体またはTCR、断片または部分のコード配列のほか、少なくとも1つのシグナルリーダーのコード配列などのさらなる配列、例えば少なくとも1つのイントロンなど、前述のさらなるコード配列を伴うかまたは伴わない融合ペプチドであって、転写されるが翻訳されない配列であって、スプライシングおよびポリアデニル化シグナル(例えば、リボソームの結合およびmRNAの安定性)を含む、転写、mRNAのプロセシングにおいて役割を果たす配列など、非コードの5’および3’配列を含むがこれらに限定されない、さらなる非コード配列と併せた融合ペプチドのコード配列;さらなる機能性をもたらすアミノ酸など、さらなるアミノ酸をコードするさらなるコード配列を含みうるがこれらに限定されない。したがって、抗体をコードする配列を、抗体断片もしくは抗体部分またはTCR断片もしくはTCR部分を含む、融合抗体またはTCRの精製を容易とするペプチドをコードする配列などのマーカー配列と融合させることができる。
【0193】
次いで、一次PCR産物を、任意選択で、抗体またはTCR可変ドメインである、V
H、V
Lカッパ、およびV
LラムダまたはVαおよびVβまたはVγおよびVδの5’および3’末端(新しいポリヌクレオチドセットを共に使用する一次PCR反応を、重鎖または軽鎖抗体遺伝子あるいはVαもしくはVβTCR遺伝子またはVγもしくはVδTCR遺伝子の部分を増幅するようにデザインしたかどうかに応じて適宜)とハイブリダイズする新しいポリヌクレオチドセットによる、二次PCR反応にかけることができる。これらのポリヌクレオチドは、後続のクローニングのための、制限酵素(すなわち、制限酵素部位)の規定されたセットに特異的なDNA配列を含むと有利である。選択される制限酵素は、ヒト抗体またはTCR V遺伝子セグメント内で切断しないように選択しなければならない。このようなポリヌクレオチドは、公知の公的に利用可能な免疫グロブリンまたはTCR遺伝子配列および制限酵素データベース情報に基づきデザインすることができる。しかし、組入れることが好ましい制限酵素部位は、NcoI、Hind III、MluI、およびNotIである。このような二次PCR反応の産物は、多様な抗体重鎖V断片/ドメイン、抗体軽鎖カッパV断片/ドメイン、および抗体軽鎖ラムダV断片/ドメインのレパートリーである。したがって、この種類の二次PCR反応は一般に、目的の発現ライブラリーフォーマットが、抗体またはTCRのV
HおよびV
LまたはVαおよびVβもしくはVγおよびVδドメインだけが存在する、scFvまたはFvフォーマットである場合に実行される。
【0194】
PCR産物はまた、バーコード化ポリヌクレオチドの5’および3’末端とハイブリダイズする新しいプライマーセットによるPCR反応にかけることもできる。これらのポリヌクレオチドは、後続のクローニングのための、制限酵素(すなわち、制限酵素部位)の規定されたセットに特異的なDNA配列を有利に含みうる。選択される制限酵素は、ヒト抗体またはヒトTCR V遺伝子セグメント内で切断しないように選択しなければならない。このようなポリヌクレオチドは、公知の公的に利用可能な免疫グロブリンまたはTCR遺伝子配列および制限酵素データベース情報に基づきデザインすることができる。しかし、組入れることが好ましい制限酵素部位は、NcoI、Hind III、MluI、およびNotIである。このような二次PCR反応の産物は、多様なV
H、V
Lカッパ、およびV
Lラムダ抗体断片/ドメイン、またはVαおよびVβもしくはVγおよびVδTCR断片/ドメインのレパートリーである。
【0195】
当業者は、また、重鎖または軽鎖あるいはVαもしくはVβ鎖またはVγもしくはVδ鎖による、FvもしくはFab断片、または単鎖抗体もしくはTCRも、このシステムと共に使用しうることを認識するであろう。重鎖または軽鎖あるいはVαもしくはVβ鎖またはVγもしくはVδ鎖を変異誘発するのに続いて、相補的な鎖を溶液に添加することができる。次いで、2つの鎖を組み合わせ、機能的な抗体断片を形成させる。ランダムで非特異的な軽鎖または重鎖あるいはVαもしくはVβ鎖またはVγもしくはVδ鎖配列の付加は、多様なメンバーによるライブラリーを生成するコンビナトリアルシステムの作製を可能とする。
【0196】
本明細書で規定される免疫感作宿主のBまたはTリンパ球から導出される抗体またはTCR遺伝子の、可変重鎖またはVα鎖もしくはVγ鎖領域、あるいはそれらの断片、および/あるいは可変軽鎖またはVβ鎖もしくはVδ鎖領域、あるいはそれらの断片を含む、クローニングされた断片のこのようなレパートリーのライブラリーは、本発明のさらなる態様を形成する。クローニングされた可変領域を含むこれらのライブラリーを、任意選択で、発現ベクターに挿入して、発現ライブラリーを形成することができる。
【0197】
一部の実施形態では、単離免疫細胞集団内に含有される、多様な抗体またはTCR鎖の定常領域の全部または一部を保持するように、PCR反応を設定することができる。これは、発現ライブラリーフォーマットが、重鎖またはアルファもしくはガンマ鎖成分が、V
HまたはVαもしくはVγおよびC
HまたはCαもしくはCγドメインを含み、軽鎖またはVβ鎖もしくはVδ鎖成分が、V
LまたはVβもしくはVδ鎖およびC
LまたはCβもしくはCδドメインを含む、Fabフォーマットである場合に望ましい。ここでもまた、抗体またはTCR鎖の定常領域の全部または一部を含む、このようなクローニングされた断片のライブラリーは、本発明のさらなる態様を形成する。
【0198】
これらの核酸は、本発明のポリヌクレオチドに加えて、配列を好都合に含みうる。例えば、1つまたは複数のエンドヌクレアーゼ制限部位を含むマルチクローニング部位を核酸に挿入して、ポリヌクレオチドの単離の一助としうる。また、翻訳可能な配列を挿入して、翻訳された本発明のポリヌクレオチドの単離の一助とすることもできる。例えば、ヘキサ−ヒスチジンマーカー配列は、本発明のタンパク質を精製するのに好都合な手段を提供する。コード配列を除く、本発明の核酸は、任意選択で、本発明のポリヌクレオチドをクローニングおよび/または発現するための、ベクター、アダプター、またはリンカーである。
【0199】
さらなる配列を、このようなクローニングおよび/または発現配列に付加して、クローニングおよび/または発現におけるそれらの機能を最適化することもでき、ポリヌクレオチドの単離の一助とすることもでき、ポリヌクレオチドの、細胞への導入を改善することもできる。当技術分野では、クローニングベクター、発現ベクター、アダプター、およびリンカーの使用が周知である。(例えば、Ausubel、前出;またはSambrook、前出を参照されたい)。
【0200】
本明細書で開示されるライブラリーは、様々な適用において使用することができる。本明細書で使用される場合、ライブラリーは、複数の分子を含む。一部の実施形態では、ライブラリーは、複数のポリヌクレオチドを含む。一部の実施形態では、ライブラリーは、複数のプライマーを含む。一部の実施形態では、ライブラリーは、1つまたは複数のポリヌクレオチド、アンプリコン、またはアンプリコンのセットに由来する複数の配列リードを含む。ライブラリーは、保存し、解析のための試料を生成するために、複数回使用することができる。一部の適用は、例えば、多型の遺伝子型決定、RNAプロセシングについての研究、および代表的クローンを選択して、本明細書で提示される方法に従い、シークエンシングを行うことを含む。プライマーなど、複数のポリヌクレオチドを含むライブラリー、またはシークエンシングもしくは増幅のためのライブラリーを生成することができ、この場合、複数のポリヌクレオチドは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000、またはそれ超の分子バーコードまたは容器バーコードを含む。一部の実施形態では、ポリヌクレオチドのライブラリーは、複数の少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000、またはそれ超の固有のポリヌクレオチドを含み、各固有のポリヌクレオチドは、1つまたは複数の分子バーコードおよび容器バーコードを含む。
【0201】
バーコード
バーコードは、分子バーコードまたは容器バーコードでありうる。一部の実施形態では、分子バーコードまたは容器バーコードなどのバーコードは、各々、2〜36ヌクレオチド、4〜36ヌクレオチド、または6〜30ヌクレオチド、または8〜20ヌクレオチド、2〜20ヌクレオチド、4〜20ヌクレオチド、または6〜20ヌクレオチドの範囲内の長さを有しうる。ある特定の態様では、セット内のバーコードの溶融温度は、互いから10℃以内、互いから5℃以内、または互いから2℃以内である。ある特定の態様では、セット内のバーコードの溶融温度は、互いから10℃以内、互いから5℃以内、または互いから2℃以内ではない。他の態様では、バーコードは、交差ハイブリダイズが最小限であるセットのメンバーである。例えば、このようなセットの各メンバーのヌクレオチド配列は、メンバーが、厳密なハイブリダイゼーション条件下で、他の任意のメンバーの相補体と安定的な二重鎖を形成しえないセットの他のあらゆるメンバーの配列と十分に異なりうる。一部の実施形態では、交差ハイブリダイズが最小限であるセットの各メンバーのヌクレオチド配列は、他のあらゆるメンバーの配列と、少なくとも2つのヌクレオチド異なる。バーコード技術は、Winzelerら(1999年)、Science、285巻:901頁;Brenner(2000年)、Genome Biol.、1巻:1頁 Kumarら(2001年)、Nature Rev.、2巻:302頁;Giaeverら(2004年)、Proc.Natl.Acad.Sci.USA、101巻:793頁;Easonら(2004年)、Proc.Natl.Acad.Sci.USA、101巻:11046頁;およびBrenner(2004年)、Genome Biol.、5巻:240頁において記載されている。
【0202】
本明細書で使用される場合、分子バーコードは、単一細胞もしくは単一の容器に由来する単一の分子、または2つもしくはそれ超の単一細胞または2つもしくはそれ超の単一の容器に由来する、複数の分子または分子のライブラリーの2つまたはそれ超の分子に固有の情報を含む。本明細書で使用される場合、容器バーコードは、異なる単一細胞または異なる単一の容器に由来するポリヌクレオチドと比較して、単一細胞または単一の容器に由来するポリヌクレオチドに固有の情報を含む。一部の実施形態では、固有の情報は、ヌクレオチドの固有の配列を含む。例えば、分子バーコードまたは容器バーコードを含む、ヌクレオチドの固有なまたはランダムな配列の同一性および順序を決定することにより、分子バーコードまたは容器バーコードの配列を決定することができる。一部の実施形態では、固有の情報を使用して、標的ポリヌクレオチドの配列を同定することはできない。例えば、分子バーコードを、1つの標的ポリヌクレオチドに結合させうるが、分子バーコードを使用して、それを結合させた標的ポリヌクレオチドを決定することはできない。一部の実施形態では、固有の情報は、標的ポリヌクレオチドの配列の同一性と連関する既知の配列ではない。例えば、容器バーコードを、1つまたは複数の標的ポリヌクレオチドに結合させうるが、容器バーコードを使用して、それを結合させた、1つまたは複数の標的ポリヌクレオチドを決定することはできない。一部の実施形態では、固有の情報は、ヌクレオチドのランダムな配列を含む。一部の実施形態では、固有の情報は、ポリヌクレオチド上の、ヌクレオチドの1つまたは複数の固有な配列を含む。一部の実施形態では、固有の情報は、縮重ヌクレオチド配列または縮重バーコードを含む。縮重バーコードは、可変的なヌクレオチド塩基の組成または配列を含みうる。例えば、縮重バーコードは、ランダム配列でありうる。一部の実施形態では、分子バーコードまたは容器バーコードの相補体配列もまた、分子バーコードまたは容器バーコード配列である。
【0203】
分子バーコードまたは容器バーコードは、任意の長さのヌクレオチドを含みうる。例えば、分子バーコードまたは容器バーコードは、少なくとも約2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000のヌクレオチドを含みうる。例えば、分子バーコードまたは容器バーコードは、最大で約5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000のヌクレオチドを含みうる。一部の実施形態では、分子バーコードまたは容器バーコードは、特定の長さのヌクレオチドを有する。例えば、分子バーコードまたは容器バーコードは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチドの長さでありうる。
【0204】
一部の実施形態では、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、少なくとも約2つのヌクレオチドを有する。例えば、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチドの長さでありうる。一部の実施形態では、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、最大で約1000のヌクレオチドを有する。例えば、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、最大で約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチドの長さでありうる。一部の実施形態では、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、同じ長さのヌクレオチドを有する。例えば、複数の分子バーコードまたは容器バーコード内の各分子バーコードまたは容器バーコードは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチドの長さでありうる。一部の実施形態では、複数の分子バーコードまたは容器バーコード内の、1つまたは複数の分子バーコードまたは容器バーコードは、異なる長さのヌクレオチドを有する。例えば、複数の分子バーコードまたは容器バーコード内の、1つまたは複数の第1の分子バーコードまたは容器バーコードは、約2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、もしくは1000ヌクレオチド、または少なくともおよそそれらの数のヌクレオチドを有することが可能であり、複数の分子バーコードまたは容器バーコード内の、1つまたは複数の第2の分子バーコードまたは容器バーコードは、約2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000のヌクレオチドを有することが可能であり、この場合、1つまたは複数の第1の分子バーコードまたは容器バーコードのヌクレオチドの数は、1つまたは複数の第2の分子バーコードまたは容器バーコードと異なる。
【0205】
分子バーコードの数は、複数の容器内で標識される総分子数に対して過剰でありうる。容器バーコードの数は、複数の容器内で標識される総分子数に対して過剰でありうる。例えば、分子バーコードまたは容器バーコードの数は、複数の容器内で標識される総分子数の少なくとも約2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍でありうる。
【0206】
異なる分子バーコードの数は、複数の容器内で標識される総分子数に対して過剰でありうる。一部の実施形態では、異なる分子バーコードの数は、複数の容器内で標識される総分子数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0207】
単一の容器内の異なる分子バーコードの数は、単一の容器内で標識される異なる分子の数に対して過剰でありうる。一部の実施形態では、単一の容器内の異なる分子バーコードの数は、単一の容器内で標識される異なる分子の数の、少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0208】
異なる容器バーコードの数は、複数の容器内で標識される総分子数未満でありうる。一部の実施形態では、異なる容器バーコードの数は、複数の容器内で標識される総分子数の、少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100分の1である。
【0209】
単一の容器内の容器バーコード化ポリヌクレオチド分子に由来する増幅産物分子の数は、単一の容器内で標識される異なる分子の数に対して過剰でありうる。一部の実施形態では、単一の容器内の容器バーコード化ポリヌクレオチド分子に由来する増幅産物分子の数は、単一の容器内で標識される異なる分子の数の、少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0210】
単一の容器内の容器バーコード化ポリヌクレオチド分子の数は、単一の容器内で標識される異なる分子の数未満でありうる。一部の実施形態では、単一の容器内の容器バーコード化ポリヌクレオチド分子の数は、単一の容器内で標識される異なる分子の数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100分の1である。
【0211】
単一の容器内の容器バーコード化ポリヌクレオチド分子の数は、1つの分子でありうる。単一の容器内の増幅されない容器バーコード化ポリヌクレオチド分子の数は、1つの分子でありうる。
【0212】
一部の実施形態では、異なる分子バーコードの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は同じ濃度を有する。一部の実施形態では、異なる容器バーコードの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は同じ濃度を有する。
【0213】
一部の実施形態では、異なる分子バーコードの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は異なる濃度を有する。一部の実施形態では、異なる容器バーコードの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は異なる濃度を有する。
【0214】
分子バーコードまたは容器バーコードの集団内の、分子バーコードまたは容器バーコードは、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、またはそれ超の異なる配列を有しうる。例えば、集団内の分子バーコードまたは容器バーコードは、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、またはそれ超の異なる配列を有しうる。したがって、複数の分子バーコードまたは容器バーコードを使用して、標的ポリヌクレオチドなど、1つまたは複数のポリヌクレオチドに由来する、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、またはそれ超の異なる配列を生成することができる。例えば、複数の分子バーコードまたは容器バーコードを使用して、標的ポリヌクレオチドなど、1つまたは複数のポリヌクレオチドに由来する、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×10
6、2×10
6、3×10
6、4×10
6、5×10
6、6×10
6、7×10
6、8×10
6、9×10
6、1×10
7、2×10
7、3×10
7、4×10
7、5×10
7、6×10
7、7×10
7、8×10
7、9×10
7、1×10
8、2×10
8、3×10
8、4×10
8、5×10
8、6×10
8、7×10
8、8×10
8、9×10
8、1×10
9、2×10
9、3×10
9、4×10
9、5×10
9、6×10
9、7×10
9、8×10
9、9×10
9、1×10
10、2×10
10、3×10
10、4×10
10、5×10
10、6×10
10、7×10
10、8×10
10、9×10
10、1×10
11、2×10
11、3×10
11、4×10
11、5×10
11、6×10
11、7×10
11、8×10
11、9×10
11、1×10
12、2×10
12、3×10
12、4×10
12、5×10
12、6×10
12、7×10
12、8×10
12、9×10
12またはそれ超の異なる配列を生成することができる。例えば、複数の分子バーコードまたは容器バーコードを使用して、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×10
6、2×10
6、3×10
6、4×10
6、5×10
6、6×10
6、7×10
6、8×10
6、9×10
6、1×10
7、2×10
7、3×10
7、4×10
7、5×10
7、6×10
7、7×10
7、8×10
7、9×10
7、1×10
8、2×10
8、3×10
8、4×10
8、5×10
8、6×10
8、7×10
8、8×10
8、9×10
8、1×10
9、2×10
9、3×10
9、4×10
9、5×10
9、6×10
9、7×10
9、8×10
9、9×10
9、1×10
10、2×10
10、3×10
10、4×10
10、5×10
10、6×10
10、7×10
10、8×10
10、9×10
10、1×10
11、2×10
11、3×10
11、4×10
11、5×10
11、6×10
11、7×10
11、8×10
11、9×10
11、1×10
12、2×10
12、3×10
12、4×10
12、5×10
12、6×10
12、7×10
12、8×10
12、9×10
12またはそれ超の標的ポリヌクレオチドに由来する、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×10
6、2×10
6、3×10
6、4×10
6、5×10
6、6×10
6、7×10
6、8×10
6、9×10
6、1×10
7、2×10
7、3×10
7、4×10
7、5×10
7、6×10
7、7×10
7、8×10
7、9×10
7、1×10
8、2×10
8、3×10
8、4×10
8、5×10
8、6×10
8、7×10
8、8×10
8、9×10
8、1×10
9、2×10
9、3×10
9、4×10
9、5×10
9、6×10
9、7×10
9、8×10
9、9×10
9、1×10
10、2×10
10、3×10
10、4×10
10、5×10
10、6×10
10、7×10
10、8×10
10、9×10
10、1×10
11、2×10
11、3×10
11、4×10
11、5×10
11、6×10
11、7×10
11、8×10
11、9×10
11、1×10
12、2×10
12、3×10
12、4×10
12、5×10
12、6×10
12、7×10
12、8×10
12、9×10
12またはそれ超の異なる配列を生成することができる。
【0215】
一部の実施形態では、1つまたは複数の分子バーコードを使用して、配列を群分けまたはビニングする。一部の実施形態では、1つまたは複数の分子バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、同じ分子バーコードを含有する。一部の実施形態では、1つまたは複数の分子バーコードまたは容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、アンプリコンのセットを含む。一部の実施形態では、1つまたは複数の分子バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、複数の配列を含み、複数の配列が生成されたポリヌクレオチドは、増幅反応中の同じポリヌクレオチド分子から導出された。
【0216】
一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列を群分けまたはビニングする。一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、同じ容器バーコードを含有する。一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、1つまたは複数のアンプリコンのセットを含む。一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、複数の配列を含み、複数の配列が生成されたポリヌクレオチドは、単一の容器または単一細胞に由来するポリヌクレオチドから導出された。
【0217】
一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列を群分けまたはビニングする。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、同じ分子バーコードおよび同じ容器バーコードを含有する。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、1つまたは複数のアンプリコンのセットを含む。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列を群分けまたはビニングするが、この場合、各ビン内の配列は、複数の配列を含み、複数の配列が生成されたポリヌクレオチドは、増幅反応中の同じポリヌクレオチドから導出され、同じ単一細胞または単一の容器から導出された。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードは、配列をアラインするのに使用しない。
【0218】
一部の実施形態では、1つまたは複数の分子バーコードは、配列をアラインするのに使用しない。一部の実施形態では、1つまたは複数の分子バーコードを使用して、配列をアラインする。一部の実施形態では、1つまたは複数の分子バーコードを使用して、配列を群分けまたはビニングし、標的特異的な領域を使用して、配列をアラインする。一部の実施形態では、1つまたは複数の容器バーコードは、配列をアラインするのに使用しない。一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列をアラインする。一部の実施形態では、1つまたは複数の容器バーコードを使用して、配列を群分けまたはビニングし、標的特異的な領域を使用して、配列をアラインする。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列をアラインする。一部の実施形態では、1つまたは複数の分子バーコードおよび容器バーコードを使用して、配列を群分けまたはビニングし、標的特異的な領域を使用して、配列をアラインする。
【0219】
一部の実施形態では、アラインされた配列は、同じ分子バーコードを含有する。一部の実施形態では、アラインされた配列は、同じ容器バーコードを含有する。一部の実施形態では、アラインされた配列は、同じ分子バーコードおよび容器バーコードを含有する。一部の実施形態では、1つまたは複数の分子バーコードまたは容器バーコードを使用して、配列をアラインするが、この場合、アラインされた配列は、アンプリコンのセットに由来する2つまたはそれ超の配列を含む。一部の実施形態では、1つまたは複数の分子バーコードまたは容器バーコードを使用して、配列をアラインするが、この場合、アラインされた配列は、複数の配列を含み、複数の配列が生成されたポリヌクレオチドは、増幅反応中の同じポリヌクレオチド分子から導出された。一部の実施形態では、1つまたは複数の分子バーコードまたは容器バーコードを使用して、配列をアラインするが、この場合、アラインされた配列は、複数の配列を含み、複数の配列が生成されたポリヌクレオチドは、単一細胞または単一の容器から導出された。
【0220】
液滴の生成
複数の細胞の試料を、複数の細胞に由来する個別の細胞に由来するかまたはそれから導出されるポリヌクレオチドの分子および容器バーコード化とカップリングさせて、小反応容量に分けることにより、バイオマーカー配列などの配列のレパートリーのハイスループットシークエンシングを可能とすることができる。
【0221】
複数の細胞の試料を、複数の細胞に由来する個別の細胞に由来するかまたはそれから導出されるポリヌクレオチドの分子および容器バーコード化とカップリングさせて、小反応容量に分けることにより、生物のトランスクリプトームのある百分率を表す配列などの配列のレパートリーのハイスループットシークエンシングを可能とすることができる。例えば、配列のレパートリーは、生物のトランスクリプトームの少なくとも約0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、30%、35%、40%、45、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%を表す複数の配列を含みうる。
【0222】
免疫細胞の試料を、複数の免疫細胞に由来する個別の免疫細胞に由来するかまたはそれから導出されるポリヌクレオチドの分子および容器バーコード化とカップリングさせて、小反応容量に分けることにより、重鎖および軽鎖配列のレパートリーのハイスループットシークエンシングを可能とすることができる。これらの方法により、バーコード化配列に基づくシークエンシングの後における、重鎖と軽鎖との対合もまた可能とすることができる。本明細書で記載される通り、試料を小反応容量に分けることにより、量を低減した試薬の使用もまた可能とすることができ、これにより、解析の材料費用の低廉化を可能とすることができる。
【0223】
場合によって、逆転写反応および/または増幅反応(例えば、PCR)は、液滴型デジタルPCRなど、液滴中で実行する。ある特定の態様では、本発明は、標的材料の全部または部分を含有する流体コンパートメントを提供する。一部の実施形態では、コンパートメントは、液滴である。本明細書全体を通して「液滴」に言及する場合、そうでないことが示されない限りにおいて、この用語は、流体コンパートメントおよび流体区画と互換的に使用される。そうでないことが示される場合を除き、簡便さのために「液滴」を使用し、任意の流体区画またはコンパートメントを使用することができる。本明細書で使用される液滴は、米国特許第7,622,280号において記載されているエマルジョン組成物などのエマルジョン組成物(または2つまたはそれ超の不混和流体の混合物)を含みうる。液滴は、WO/2010/036352において記載されているデバイスにより生成させることができる。エマルジョンという用語は、本明細書で使用される場合、不混和液体(油および水など)の混合物を指す場合がある。油相および/または油中水エマルジョンは、水滴中の反応混合物のコンパートメント化を可能とする。エマルジョンは、連続油相中の水滴を含みうる。本明細書で提示されるエマルジョンは、水中油エマルジョンであることが可能であり、この場合、液滴は、連続水性相中の油滴である。本明細書で提示される液滴は、その内容物が蒸発し、他のコンパートメントの内容物とコアレセンスすることを、各コンパートメントが防ぐことで、コンパートメント間の混合を防止するようにデザインされている。
【0224】
本明細書で記載される混合物またはエマルジョンは、安定な場合もあり、不安定な場合もある。エマルジョンは、比較的安定であることが可能であり、最小限のコアレセンスを有する。コアレセンスは、小さな液滴を組み合わせて、徐々に大きな液滴を形成する場合に生じる。ある場合には、液滴生成器から生成した液滴の0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、または10%未満が他の液滴とコアレセンスする。エマルジョンではまた、分散相が懸濁液からフレーク状に析出する過程、フロキュレーションも限定されうる。
【0225】
約0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400、もしくは500ミクロン、およそそれら未満、またはおよそそれら超、または少なくともおよそそれらの平均直径を有する液滴を生成させることができる。液滴は、約0.001〜約500、約0.01〜約500、約0.1〜約500、約0.1〜約100、約0.01〜約100、または約1〜約100ミクロンの平均直径を有しうる。マイクロチャネルクロスフローフォーカシングまたは物理的撹拌を使用して、エマルジョン液滴を生み出すマイクロ流体法は、単分散または多分散エマルジョンを生み出すことが公知である。液滴は、単分散液滴でありうる。液滴のサイズが、液滴の平均サイズの±5%を超えて変動しないように、液滴を生成させることができる。場合によって、液滴のサイズが、液滴の平均サイズの±2%を超えて変動しないように、液滴を生成させる。液滴生成器は、単一の試料に由来する液滴の集団を生成することができ、液滴のいずれもサイズが、液滴の総集団の平均サイズの±約0.1%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%、または10%を超えて変動しない。
【0226】
より高度な力学的安定性は、マイクロ流体の操作および高せん断流体加工(例えば、マイクロ流体キャピラリー内または流体管路内の弁など、90度の屈曲を介する)に有用でありうる。熱処理前または熱処理後の液滴またはカプセルは、標準的なピペット操作および遠心分離に対して、力学的に安定でありうる。
【0227】
液滴は、油相を、水性試料中に流動させることにより形成することができる。水性相は、細胞、ヌクレオチド、ヌクレオチド類似体、分子バーコード化ポリヌクレオチド、容器バーコード化ポリヌクレオチドのプライマー、鋳型核酸、ならびにDNAポリメラーゼ、RNAポリメラーゼ、および/または逆転写酵素などの酵素を含む、増幅反応を実施するための緩衝液および試薬を含みうる。
【0228】
水性相は、ビーズなど、固体表面を伴うかまたは伴わない、増幅反応を実施するための緩衝液および試薬を含みうる。緩衝液は、約1、5、10、15、20、30、50、100、もしくは200mM、およそそれら超、またはおよそそれら未満のトリスを含みうる。場合によって、塩化カリウムの濃度は、約10、20、30、40、50、60、80、100、200mMであるか、およそそれら超であるか、またはおよそそれら未満でありうる。緩衝液は、約15mMのトリスおよび50mMのKClを含みうる。ヌクレオチドは、dATP、dCTP、dGTP、およびdTTPを、各々、約50、100、200、300、400、500、600、もしくは700μM、およそそれら超、またはおよそそれら未満の濃度で含む、デオキシリボヌクレオチド三リン酸分子を含みうる。場合によって、dUTPを、水性相中に、約50、100、200、300、400、500、600、もしくは700、800、900、もしくは1000μM、およそそれら超、またはおよそそれら未満の濃度まで添加する。場合によって、塩化マグネシウムまたは酢酸マグネシウム(MgCl
2)を、水性相に、約1.0、2.0、3.0、4.0、もしくは5.0mM、およそそれら超、またはおよそそれら未満の濃度で添加する。MgCl
2の濃度は、約3.2mMでありうる。場合によって、酢酸マグネシウムまたはマグネシウムを使用する。場合によって、硫酸マグネシウムを使用する。
【0229】
BSAまたはウシの皮膚に由来するゼラチンなど、非特異的ブロッキング剤を使用することができ、ゼラチンまたはBSAは、約0.1〜0.9%w/vの濃度範囲で存在する。他の可能なブロッキング剤は、ベータラクトグロブリン、カゼイン、粉乳、または他の一般的なブロッキング剤を含みうる。場合によって、BSAおよびゼラチンの好ましい濃度は、約0.1%w/vである。
【0230】
水性相中の増幅のためのプライマーは、約0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7、もしくは2.0μM、およそそれら超、またはおよそそれら未満の濃度を有しうる。水性相中のプライマーの濃度は、約0.05〜約2、約0.1〜約1.0、約0.2〜約1.0、約0.3〜約1.0、約0.4〜約1.0、または約0.5〜約1.0μMでありうる。プライマーの濃度は、約0.5μMでありうる。PCRにおける標的核酸濃度に適する範囲は、約1pg〜約500ngの間を含むがこれに限定されない。
【0231】
場合によって、水性相はまた、非特異的バックグラウンド/ブロッキング核酸(例えば、サケ精子DNA)、バイオプリザーバティブ(例えば、アジドナトリウム)、PCR増強剤(例えば、ベタイン、トレハロースなど)、および阻害剤(例えば、RNアーゼ阻害剤)を含むがこれらに限定されない添加剤も含みうる。他の添加剤は、例えば、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン一水和物(N,N,N−トリメチルグリシン=[カルボキシ(caroxy)−メチル]トリメチルアンモニウム)、トレハロース、7−デアザ−2’−デオキシグアノシン三リン酸(dC7GTPまたは7−デアザ−2’−dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、テトラメチルアンモニウムクロリド(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば、テトラエチルアンモニウムクロリド(tetraethyammonium chloride)(TEA−Cl)およびテトラプロピルアンモニウムクロリド(TPrA−Cl))、非イオン性洗浄剤(例えば、Triton X−100、Tween 20、Nonidet P−40(NP−40))、またはPREXCEL−Qを含みうる。場合によって、水性相は、0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含みうる。他の場合には、水性相は、少なくとも0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含みうる。
【0232】
場合によって、非イオン性エチレンオキシド/酸化プロピレンブロックコポリマーを、水性相に、約0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、または1.0%の濃度で添加することができる。一般的なバイオサーファクタントは、Pluronic F−68、Tetronics、およびZonyl FSNなどの非イオン性界面活性剤を含む。Pluronic F−68は、約0.5%w/vの濃度で存在しうる。
【0233】
場合によって、硫酸マグネシウムを、類似の濃度の塩化マグネシウムに代用することもできる。様々な販売元からの広範にわたる一般的な市販のPCRバッファーを、緩衝液に代用することができる。
【0234】
エマルジョンは、加熱することにより、固体様界面間薄膜を有するマイクロカプセルに転換されうる、液体様界面間薄膜を有する、単分散性の高い液滴を作製するように調合することができ;このようなマイクロカプセルは、PCR増幅など、反応過程を通して、それらの内容物を保持することが可能なバイオリアクターとして挙動しうる。マイクロカプセル形態への転換は、加熱時に生じうる。例えば、このような転換は、約50℃、60℃、70℃、80℃、90℃、または95℃超の温度で生じうる。場合によって、この加熱は、サーモサイクラーを使用して施す。加熱工程中、流体または鉱物油によるオーバーレイを使用して、蒸発を防止することができる。過剰な連続油相は、加熱の前に除去できる場合もあり、除去できない場合もある。生体適合性カプセルは、広範に及ぶ熱的および機械的加工にわたり、コアレセンスおよび/またはフロキュレーションに対して抵抗性でありうる。転換に続き、カプセルを、約3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃、もしくは40℃、およそそれら超、またはおよそそれら未満で保存することができる。これらのカプセルは、高分子、特に、核酸もしくはタンパク質、またはこれらの両方のミックスを併せて含有する水性の生物学的流体の、安定的でデジタル化された封入;薬物およびワクチンの送達;生体分子のライブラリー;臨床用イメージング適用、その他など、生物医学的適用において有用でありうる。
【0235】
マイクロカプセルは、1つまたは複数のポリヌクレオチドを含有することが可能であり、特に高温において、コアレセンスに抵抗しうる。したがって、PCR増幅反応は、非常に高い密度(例えば、単位容量当たりの反応の数)で生じうる。場合によって、1ml当たり100,000、500,000、1,000,000、1,500,000、2,000,000、2,500,000、5,000,000、または10,000,000超の別個の反応が生じうる。場合によって、反応は、反応容量間の混和を伴わずに、単一のウェル、例えば、マイクロ滴定プレートのウェル内で生じる。マイクロカプセルはまた、逆転写、プライマーの伸長、および/またはPCR反応が生じるのを可能にするのに必要な他の成分、例えば、プライマー、プローブ、dNTP、DNAまたはRNAポリメラーゼなども含有しうる。これらのカプセルは、広範に及ぶ熱的および機械的加工にわたり、コアレセンスおよびフロキュレーションに対する抵抗性を呈示する。
【0236】
場合によって、増幅するステップは、マイクロ流体ベースのデジタルPCRまたは液滴型デジタルPCRなど、デジタルPCRを実施することにより実行される。
【0237】
液滴は、マイクロ流体システムまたはデバイスを使用して生成させることができる。本明細書で使用される場合、「マイクロ」という接頭辞(例えば、「マイクロチャネル」または「マイクロ流体」など)は一般に、約1mm未満、場合によって約100ミクロン(マイクロメートル)未満の幅または直径を有する要素または事物を指す。場合によって、要素または事物は、流体が流動しうるチャネルを含む。加えて、本明細書で使用される「マイクロ流体」は、少なくとも1つのマイクロスケールのチャネルを含む、デバイス、装置、またはシステムを指す。
【0238】
マイクロ流体システムおよびデバイスは、様々な文脈で、典型的には、ミニ検査室(例えば、臨床)解析の文脈で記載されている。他の使用もまた、記載されている。例えば、国際特許出願公開第WO01/89788号;同第WO2006/040551号;同第WO2006/040554号;同第WO2004/002627号;同第WO2008/063227号;同第WO2004/091763号;同第WO2005/021151号;同第WO2006/096571号;同第WO2007/089541号;同第WO2007/081385号;および同第WO2008/063227号。
【0239】
液滴は一般に、第2の担体流体中に、ある量の第1の試料流体を含む。液滴を形成するための、当技術分野で公知の任意の技法を、本発明の方法と共に使用することができる。例示的な方法は、それが、担体流体を流動させる2つの向かい合う流れと交差するように、標的材料(例えば、免疫細胞)を含有する試料流体の流れを流動させるステップを伴う。担体流体は、試料流体と不混和である。試料流体の、担体流体を流動させる2つの向かい合う流れとの交差は、試料流体の、標的材料を含有する個別の試料液滴への区画化を結果としてもたらす。
【0240】
担体流体は、試料流体と不混和である、任意の流体でありうる。例示的な担体流体は、油である。ある特定の実施形態では、担体流体は、界面活性剤を含む。
【0241】
同じ方法を適用して、ポリメラーゼ連鎖反応(PCR)、または多重鎖置換増幅など、非PCRベースの増幅反応、または当業者に公知の他の方法などの増幅反応のための試薬など、他の試薬を含有する個別の液滴を創出することができる。PCRベースの増幅反応を実行するのに適する試薬は、当業者に公知であり、DNAポリメラーゼ、フォワードおよびリバースプライマー、デオキシヌクレオチド三リン酸(dNTP)、および1つまたは複数の緩衝液を含むがこれらに限定されない。
【0242】
ある特定の実施形態では、標的材料(例えば、免疫細胞および/またはビーズなどの固体支持体)を含む第1の流体区画(例えば、液滴)および第2の流体(例えば、流体の流れとして、または液滴内)を供給することにより、流体コンパートメントを形成する。第1および第2の流体を融合させて、液滴を形成する。融合は、2つの流体に電界をかけることにより達成することができる。ある特定の実施形態では、第2の流体は、ポリメラーゼ連鎖反応または増幅反応などの増幅反応を実行するための試薬を含有する。
【0243】
ある特定の態様では、本発明は、固有にバーコード化された、重鎖および軽鎖抗体配列ならびに/またはアルファおよびベータ鎖TCR配列ならびに/もしくはガンマおよびデルタ鎖TCR配列のライブラリーを作る方法であって、複数の核酸構築物を得るステップを含み、各構築物が、固有のNマーおよび機能的なNマーを含む方法を提供する。機能的なNマーは、ランダムNマー、PCRプライマー、ユニバーサルプライマー、抗体、粘着末端、または他の任意の配列でありうる。方法は、各々が、1つまたは複数のコピーの固有の構築物を含有する、数Nの流体コンパートメントのMセットを作るステップを含みうる。方法は、さらなる構築物を各コンパートメントにセットで添加し、これを各セットについて反復して、各々が、構築物の固有の対を含有するN×Mコンパートメントを作製することにより、より高い複雑性のバーコードライブラリーを創出しうる。対を、ハイブリダイズさせるかまたはライゲートして、新しい構築物を作製することができる。バーコードライブラリー内の各構築物では、各固有のNマーを、シークエンシング、プローブハイブリダイゼーション、他の方法、または方法の組合せによる同定に適合させることができる。
【0244】
液滴ライブラリー
一般に、液滴ライブラリーは、単一のコレクション内に併せてプールされている、いくつかのライブラリーエレメントから構成される。ライブラリーは、単一のライブラリーエレメント〜1×10
15またはそれ超のライブラリーエレメントで、複雑性を変動させることができる。各ライブラリーエレメントは、一定の濃度における、1つまたは複数の所与の成分である。エレメントは、細胞、ビーズ、アミノ酸、タンパク質、ポリペプチド、核酸、ポリヌクレオチド、または低分子化合物でありうるがこれらに限定されない。エレメントは、分子バーコード、容器バーコード、またはこれらの両方などの識別子を含有しうる。
【0245】
細胞ライブラリーエレメントは、ハイブリドーマ、B細胞、T細胞、初代細胞、培養細胞系、がん細胞、幹細胞、または他の任意の細胞型を含みうるがこれらに限定されない。細胞ライブラリーエレメントは、千〜数万個の多数の細胞を、個別の液滴内に封入することにより調製する。封入される細胞の数は通例、細胞数密度および液滴の容量から、ポアソン統計により与えられる。しかし、場合によって、Eddら、「Controlled encapsulation of single−cells into monodisperse picolitre drops.」、Lab Chip、8巻(8号):1262〜1264頁、2008年において記載されている通り、数は、ポアソン統計から逸脱する。細胞の個別の性格は、ライブラリーを、各々が1つずつの抗体またはTCRを産生する免疫細胞など、複数の細胞変異体であって、全てが単一の出発媒質中に存在する複数の細胞変異体を有する塊で調製することを可能とし、次いで、この媒質を、最大で1個の細胞を含有する個別の液滴カプセルに分割する。次いで、個別の液滴カプセル内の細胞を溶解させ、溶解させた細胞に由来する、重鎖および軽鎖ポリヌクレオチドならびに/またはアルファおよびベータ鎖ポリヌクレオチドならびに/もしくはガンマおよびデルタ鎖ポリヌクレオチドを、分子バーコードおよび容器バーコードでバーコード化し、増幅し、次いで、組み合わせるか、またはプールして、重鎖および軽鎖ライブラリーエレメントならびに/またはアルファおよびベータならびに/もしくはガンマおよびデルタ鎖ライブラリーエレメントからなるライブラリーを形成する。
【0246】
ビーズベースのライブラリーエレメントは、1つまたは複数のビーズを含有し、また、抗体、酵素、または他のタンパク質など、他の試薬も含有しうる。全てのライブラリーエレメントが、異なる種類のビーズを含有するが、同じ周囲の媒質を含有する場合、ライブラリーエレメントは、全てが単一の出発流体から調製される場合もあり、様々な出発流体を有する場合もある。変異体のコレクションから塊で調製される細胞ライブラリーの場合、ライブラリーエレメントは、様々な出発流体から調製されるであろう。複数の細胞から出発する場合、液滴1つ当たり正確に1個の細胞を有し、1個超の細胞を含有する液滴はほんの少数であることが望ましい。場合によって、ポアソン統計からの変動を達成して、液滴1つ当たり正確に1個の細胞を有する液滴が増え、空の液滴または1個超の細胞を含有する液滴が少数の例外となるように、液滴のローディングを増強することができる。
【0247】
一部の実施形態では、複数の容器バーコード化ポリヌクレオチドから出発する場合、液滴1つ当たり正確に1つの容器バーコード化ポリヌクレオチドを有し、1つ超の容器バーコード化ポリヌクレオチドを含有する液滴はほんの少数であることが望ましい。場合によって、ポアソン統計からの変動を達成して、液滴1つ当たり正確に1つの容器バーコード化ポリヌクレオチドを有する液滴が増え、空の液滴または1つ超の容器バーコード化ポリヌクレオチドを含有する液滴が少数の例外となるように、液滴のローディングを増強することができる。
【0248】
液滴ライブラリーの例は、ビーズ、細胞、低分子、DNA、プライマー、抗体、およびバーコード化ポリヌクレオチドの範囲の異なる内容物を有する、液滴のコレクションである。液滴のサイズは、ほぼ0.5ミクロン〜500ミクロンの直径の範囲であり、これは、約1ピコリットル〜1ナノリットルに対応する。しかし、液滴は、5ミクロンほど小さい場合があり、500ミクロンほど大きい場合がある。液滴は、直径が100ミクロン未満、約1ミクロン〜約100ミクロンであることが好ましい。最も好ましいサイズは、約20〜40ミクロンの直径(10〜100ピコリットル)である。液滴ライブラリーについて検討される好ましい特性は、浸透圧の均衡、均一のサイズ、およびサイズの範囲を含む。
【0249】
本発明により提供される液滴ライブラリー内に含まれる液滴は、サイズが均一であることが好ましい。すなわち、ライブラリー内の任意の液滴の直径は、同じライブラリー内の他の液滴の直径と比較した場合、5%、4%、3%、2%、1%、または0.5%未満変動する。ライブラリー内の液滴の均一なサイズは、液滴の安定性および完全性を維持するのに極めて重要な場合があり、また、本明細書で記載される、多様な生物学的および化学的アッセイのための、ライブラリー内の液滴のその後の使用に不可欠でもありうる。
【0250】
本発明は、不混和流体内に複数の水滴を含む液滴ライブラリーであって、各液滴が、サイズが実質的に均一であり、異なるライブラリーエレメントを含む液滴ライブラリーを提供する。本発明は、液滴ライブラリーを形成する方法であって、異なるライブラリーエレメントを含む単一の水性流体を用意するステップと、各ライブラリーエレメントを、不混和流体内の水滴に封入するステップとを含む方法を提供する。
【0251】
ある特定の実施形態では、異なる種類のエレメント(例えば、細胞またはビーズ)を、同じ媒質中に含有される単一の供給源中にプールする。初期のプーリングの後、次いで、エレメントを、液滴内に封入して、液滴のライブラリーを生成するが、この場合、異なる種類のビーズまたは細胞を有する各液滴は、異なるライブラリーエレメントである。初期溶液の希釈は、封入工程を可能とする。一部の実施形態では、形成される液滴は、単一のエレメントを含有するか、または何も含有しない、すなわち、空である。他の実施形態では、形成される液滴は、ライブラリーエレメントの複数のコピーを含有する。封入されるエレメントは一般に、1つの種類の変異体である。一例では、エレメントは、血液試料の免疫細胞であり、各免疫細胞を封入して、免疫細胞内のヌクレオチドの抗体配列を増幅し、バーコードを付ける。
【0252】
例えば、エマルジョンライブラリーの1つの種類では、異なる媒質中に、異なる粒子、すなわち、細胞またはバーコード化ポリヌクレオチドを有し、プーリングの前に封入されるライブラリーエレメントが存在する。一例では、指定された数のライブラリーエレメント、すなわち、数nの異なる細胞またはバーコード化ポリヌクレオチドが、異なる媒質中に含有されている。ライブラリーエレメントの各々を、別々に乳化させ、プールするが、この時点で、数nのプールされた異なるライブラリーエレメントの各々を組み合わせ、単一のプールにプールする。結果として得られるプールは、各々が異なる種類の粒子を含有する、複数の油中水エマルジョン液滴を含有する。
【0253】
一部の実施形態では、形成される液滴は、単一のライブラリーエレメントを含有するか、または何も含有しない、すなわち、空である。他の実施形態では、形成される液滴は、ライブラリーエレメントの複数のコピーを含有する。ビーズの内容物は、ポアソン分布(いくつかのイベントが、既知の平均速度で、直前のイベントからの時間とは独立に生じる場合、これらのイベントが一定の時間内に生じる確率を表す個別の確率分布が存在する)に従う。ライブラリーを創出するのに使用される油および界面活性剤により、液滴間における、ライブラリーの内容物の交換を防止する。
【0254】
逆転写
場合によって、標的ポリヌクレオチドは、逆転写により、RNAから調製される。場合によって、標的ポリヌクレオチドは、ポリメラーゼなどを使用して、プライマーの伸長により、DNAから調製される。
【0255】
本明細書で記載される方法は、逆転写−PCRのカップリング(逆転写PCR)において使用することができる。例えば、逆転写およびPCRは、2つの顕著に異なるステップにおいて実行することができる。第1に、ポリヌクレオチドdTプライマー、配列特異的プライマー、ユニバーサルプライマー、または本明細書で記載される任意のプライマーを使用して、試料mRNAのcDNAコピーを合成することができる。
【0256】
逆転写およびPCRは、単一の閉じた容器反応において実行することができる。例えば、1つは逆転写のためのプライマーであり、2つはPCRのためのプライマーである、3つのプライマーを用いることができる。逆転写のためのプライマーは、PCRアンプリコンの位置の3’側のmRNAに結合しうる。不可欠ではないが、逆転写プライマーは、RNA残基または修飾された類似体であって、mRNAとハイブリダイズさせる場合に、RNase Hの基質を形成しない、2’−O−メチルRNA塩基などの類似体を含みうる。
【0257】
逆転写反応を実行する温度は、使用される逆転写酵素に依存する。場合によって、熱安定性逆転写酵素を使用し、約37℃〜約75℃、約37℃〜約50℃、約37℃〜約55℃、約37℃〜約60℃、約55℃〜約75℃、約55℃〜約60℃、約37℃、または約60℃において、逆転写反応を実行する。場合によって、3つまたはそれ超の非鋳型末端ヌクレオチドを、転写産物の末端に転移させる逆転写酵素を使用する。
【0258】
本明細書で記載される逆転写反応およびPCR反応は、チューブ、マイクロ滴定プレート、マイクロ流体デバイス、または、好ましくは液滴など、当技術分野で公知の多様なフォーマットで実行することができる。
【0259】
逆転写反応は、5μL〜100μLの範囲の容量、または10μL〜20μLの反応容量で実行することができる。液滴内で、反応容量は、1pL〜100nLまたは10pL〜1nLの範囲でありうる。場合によって、逆転写反応は、約1nLまたはそれ未満の容量を有する液滴内で実行する。場合によって、PCR反応は、1pL〜100nL、好ましくは10pL〜1nLの範囲の反応容量を有する液滴内のPCR反応である。場合によって、PCR反応は、約1nLまたはそれ未満の容量を有する液滴内で実行する。場合によって、逆転写反応およびPCR反応は、1pL〜100nLまたは10pL〜1nLの範囲の反応容量を有する同じ液滴内で実行する。場合によって、逆転写反応およびPCR反応は、約1nLもしくはそれ未満の容量または約1pLもしくはそれ未満の容量を有する液滴内で実行する。場合によって、逆転写反応およびPCR反応は、異なる液滴内で実行する。場合によって、逆転写反応およびPCR反応は、各々が1pL〜100nLまたは10pL〜1nLの範囲の反応容量を有する複数の液滴内で実行する。場合によって、逆転写反応およびPCR反応は、各々が約1nLまたはそれ未満の容量を有する複数の液滴内で実行する。
【0260】
場合によって、第1のPCR反応は、1pL〜100nL、好ましくは10pL〜1nLの範囲の反応容量を有する第1の液滴内のPCR反応であり、第2のPCR反応は、1pL〜100nL、好ましくは10pL〜1nLの範囲の反応容量を有する第2の液滴内のPCR反応である。場合によって、第1のPCR反応は、約1nLまたはそれ未満の容量を有する第1の液滴内のPCR反応であり、第2のPCR反応は、約1nLまたはそれ未満の容量を有する第2の液滴内のPCR反応である。
【0261】
場合によって、第1のPCR反応および第2のPCR反応は、各々が1pL〜100nLまたは10pL〜1nLの範囲の反応容量を有する複数の液滴内で実行する。場合によって、第1のPCR反応および第2のPCR反応は、各々が約1nLまたはそれ未満の容量を有する複数の液滴内で実行する。
【0262】
RNAなどの標的ポリヌクレオチドは、1つまたは複数の逆転写プライマーを使用して、cDNAに逆転写することができる。1つまたは複数の逆転写プライマーは、定常領域(例えば、重鎖もしくは軽鎖定常領域またはmRNAのポリAテール)など、RNAの領域に相補的な領域を含みうる。一部の実施形態では、逆転写プライマーは、第1のRNAの定常領域に相補的な領域を有する第1の逆転写プライマーと、第2のRNAの定常領域に相補的な領域を有する第2の逆転写プライマーとを含みうる。一部の実施形態では、逆転写プライマーは、第1のRNAの定常領域に相補的な領域を有する第1の逆転写プライマー、および1つまたは複数のRNAの定常領域に相補的な領域を有する1つまたは複数の逆転写プライマーをそれぞれ含みうる。
【0263】
一部の実施形態では、逆転写プライマーは、バーコードを含まない。
【0264】
逆転写プライマーは、RNAの領域に相補的ではない領域をさらに含みうる。一部の実施形態では、RNAの領域に相補的ではない領域は、RNAに相補的なプライマーの領域に対して5’側である。一部の実施形態では、RNAの領域に相補的ではない領域は、RNAに相補的なプライマーの領域に対して3’側である。一部の実施形態では、RNAの領域に相補的ではない領域は、5’突出領域である。一部の実施形態では、RNAの領域に相補的ではない領域は、増幅および/またはシークエンシング反応のためのプライミング部位を含む。本明細書で記載される1つまたは複数のプライマーを使用し、当技術分野で公知の適切な試薬を使用して、RNA分子を逆転写する。
【0265】
RNA分子の逆転写反応を実施した後で、結果として得られるcDNA分子を、分子バーコードおよび容器バーコードでバーコード化し、第1および/または第2のPCR反応など、1つまたは複数のPCR反応により増幅することができる。第1および/または第2のPCR反応では、1つまたは複数のプライマー対を活用することができる。第1および/または第2のPCR反応では、複数のフォワード/リバースプライマーおよびリバースプライマーを活用することができる。第1および/または第2のPCR反応では、複数のフォワード/リバースプライマーおよびフォワードプライマーを活用することができる。複数のフォワード/リバースプライマーのうちの第1および/または第2のプライマーは、cDNA分子またはバーコード化cDNA分子に相補的な領域を含有するフォワード/リバースプライマーでありうる。複数のフォワード/リバースプライマーのうちの第1および/または第2のプライマーは、バーコード化cDNA分子に相補的な領域を含有するフォワード/リバースプライマーでありうる。
【0266】
一部の実施形態では、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、複数のフォワード/リバースプライマー中のフォワード/リバースプライマーの各々は、cDNAまたはバーコード化cDNAのVセグメントに対する、1つまたは複数の上流または下流領域に相補的な領域を含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントに対する、上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントに対する、1つまたは複数の他の上流または下流領域に相補的な領域を含む1つまたは複数の他のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントに対する、第3の上流または下流領域に相補的な領域を含む第3のフォワード/リバースプライマーなどとを含む。複数のフォワード/リバースプライマー中のプライマーを使用して、試料中の免疫B細胞またはT細胞などの細胞により発現される、全てのVセグメントの、全ての可能な上流または下流領域にアニールさせることができる。
【0267】
一部の実施形態では、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、複数のフォワード/リバースプライマー中のフォワード/リバースプライマーの各々は、cDNAまたはバーコード化cDNAのCセグメントに対する、1つまたは複数の上流または下流領域に相補的な領域を含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントに対する、上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントに対する、1つまたは複数の他の上流または下流領域に相補的な領域を含む1つまたは複数の他のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントに対する、第3の上流または下流領域に相補的な領域を含む第3のフォワード/リバースプライマーなどとを含む。複数のフォワード/リバースプライマー中のプライマーを使用して、試料中の免疫B細胞またはT細胞などの細胞により発現される、全てのCセグメントの、全ての可能な上流または下流領域にアニールさせることができる。
【0268】
一部の実施形態では、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、複数のフォワード/リバースプライマー中のフォワード/リバースプライマーの各々は、バーコード化cDNAの分子バーコードに対する、1つまたは複数の上流または下流領域に相補的な領域を含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードに対する、上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、バーコード化cDNAの分子バーコードに対する、1つまたは複数の他の上流または下流領域に相補的な領域を含む1つまたは複数の他のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、バーコード化cDNAの分子バーコードに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、バーコード化cDNAの分子バーコードに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーと、バーコード化cDNAの分子バーコードに対する、第3の上流または下流領域に相補的な領域を含む第3のフォワード/リバースプライマーなどとを含む。複数のフォワード/リバースプライマーを使用して、試料中の免疫B細胞またはT細胞などの細胞により発現される、全ての分子バーコードの、全ての可能な上流または下流領域にアニールさせることができる。
【0269】
一部の実施形態では、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、複数のフォワード/リバースプライマー中のフォワード/リバースプライマーの各々は、バーコード化cDNAの容器バーコードに対する、1つまたは複数の上流または下流領域に相補的な領域を含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの容器バーコードに対する、上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、バーコード化cDNAの容器バーコードに対する、1つまたは複数の他の上流または下流領域に相補的な領域を含む1つまたは複数の他のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの容器バーコードに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、バーコード化cDNAの容器バーコードに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーとを含む。例えば、複数のフォワード/リバースプライマーは、バーコード化cDNAの容器バーコードに対する、第1の上流もしくは下流領域および/または第2の上流もしくは下流領域に相補的な領域を含む第1および/または第2のフォワード/リバースプライマーと、バーコード化cDNAの容器バーコードに対する、第2の上流または下流領域に相補的な領域を含む第2のフォワード/リバースプライマーと、バーコード化cDNAの容器バーコードに対する、第3の上流または下流領域に相補的な領域を含む第3のフォワード/リバースプライマーなどとを含む。複数のフォワード/リバースプライマー中のプライマーを使用して、試料中の免疫B細胞またはT細胞などの細胞により発現される、全ての容器バーコードの、全ての可能な上流または下流領域にアニールさせることができる。
【0270】
複数のフォワード/リバースプライマー中のフォワード/リバースプライマーは、RNAの領域に相補的ではない領域をさらに含む。一部の実施形態では、RNAの領域に相補的ではない領域は、RNAに相補的なフォワード/リバースプライマーの領域に対して5’側(すなわち、Vセグメントの上流または下流領域)である。一部の実施形態では、RNAの領域に相補的ではない領域は、RNAに相補的なフォワード/リバースプライマーの領域に対して3’側である。一部の実施形態では、RNAの領域に相補的ではない領域は、5’突出領域である。一部の実施形態では、RNAの領域に相補的ではない領域は、増幅および/または第2のシークエンシング反応のためのプライミング部位を含む。一部の実施形態では、RNAの領域に相補的ではない領域は、増幅および/または第3のシークエンシング反応のためのプライミング部位を含む。一部の実施形態では、RNAの領域に相補的ではない領域は、第2および第3のシークエンシング反応のためのプライミング部位を含む。一部の実施形態では、第2のシークエンシング反応のためのプライミング部位の配列と、第3のシークエンシング反応のためのプライミング部位の配列とは、同じである。本明細書で記載される、1つまたは複数のフォワード/リバースプライマーおよびリバースプライマーを使用し、当技術分野で公知の適切な試薬を使用して、cDNA分子を増幅する。一部の実施形態では、領域は、mRNAの定常領域またはポリAテールなど、RNAの領域に相補的である。
【0271】
増幅
標的ポリヌクレオチドを含有する試料は、増幅されうるmRNA、またはその断片を含みうる。場合によって、mRNAまたはその断片の平均の長さは、約100、200、300、400、500、もしくは800塩基対未満、または約5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、もしくは200ヌクレオチド未満、または約1、2、5、10、20、30、40、50、60、70、80、90、100キロベース未満でありうる。場合によって、約40、45、50、55、60、65、70、75、80、85、90、95、または100塩基である鋳型を含有する試料など、比較的短い鋳型に由来する標的配列を増幅する。
【0272】
増幅反応は、1つまたは複数の添加剤を含みうる。場合によって、1つまたは複数の添加剤は、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン一水和物(N,N,N−トリメチルグリシン=[カルボキシ−メチル]トリメチルアンモニウム)、トレハロース、7−デアザ−2’−デオキシグアノシン三リン酸(dC7GTPまたは7−デアザ−2’−dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、テトラメチルアンモニウムクロリド(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば、テトラエチルアンモニウムクロリド(TEA−Cl)およびテトラプロピルアンモニウムクロリド(TPrA−Cl))、非イオン性洗浄剤(例えば、Triton X−100、Tween 20、Nonidet P−40(NP−40))、またはPREXCEL−Qである。場合によって、増幅反応は、0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含む。他の場合には、増幅反応は、少なくとも0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含む。
【0273】
サーモサイクリング反応を、反応容量(例えば、液滴)中に含有される試料に対して実施することができる。液滴は、撹拌、超音波処理を介して、またはT−チャネルジャンクションもしくは当業者による他の手段を介するマイクロ流体法により生成させた多分散液滴、好ましくは単分散液滴でありうる。密度は、40ul当たりの液滴20,000(1nLの液滴)、40ul当たりの液滴200,000(100pLの液滴)を超える場合がある。液滴は、サーモサイクリング中に完全なままでありうる。液滴は、1μL当たりの液滴約10,000、1μL当たりの液滴100,000、1μL当たりの液滴200,000、1μL当たりの液滴300,000、1μL当たりの液滴400,000、1μL当たりの液滴500,000、1μL当たりの液滴600,000、1μL当たりの液滴700,000、1μL当たりの液滴800,000、1μL当たりの液滴900,000、または1μL当たりの液滴1,000,000超の密度におけるサーモサイクリング中に完全なままでありうる。他の場合に、2つまたはそれ超の液滴は、サーモサイクリング中にコアレセンスしない。他の場合に、100超、または1,000超の液滴は、サーモサイクリング中にコアレセンスしない。
【0274】
プライマーの伸長を触媒する任意のDNAポリメラーゼであって、E.coli DNAポリメラーゼ、E.coli DNAポリメラーゼ1のKlenow断片、T7 DNAポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、Pfu DNAポリメラーゼ、Vent DNAポリメラーゼ、バクテリオファージ29、REDTaq(商標)、ゲノムDNAポリメラーゼ、またはシークエナーゼを含むがこれらに限定されないDNAポリメラーゼを使用することができる。場合によって、熱安定性DNAポリメラーゼを使用する。ポリメラーゼを添加する前に、反応物を、2分間にわたり、95℃まで加熱するか、またはサイクル1における第1の加熱ステップまで、ポリメラーゼを不活性に保ちうる、ホットスタートPCRもまた、実施することができる。ホットスタートPCRを使用して、非特異的増幅を最小化することができる。例えば、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、もしくは45サイクル、およそそれら超、またはおよそそれら未満など、任意の数のPCRサイクルを使用して、DNAを増幅することができる。増幅サイクルの数は、約1〜45、10〜45、20〜45、30〜45、35〜45、10〜40、10〜30、10〜25、10〜20、10〜15、20〜35、25〜35、30〜35、または35〜40でありうる。
【0275】
標的核酸の増幅は、当技術分野で公知の任意の手段により実施することができる。標的核酸は、ポリメラーゼ連鎖反応(PCR)または等温DNA増幅により増幅することができる。使用されうるPCR法の例は、定量的PCR、定量的蛍光PCR(QF−PCR)、マルチプレックス蛍光PCR(MF−PCR)、リアルタイムPCR(逆転写PCR)、単一細胞PCR、制限断片長多型PCR(PCR−RFLP)、PCR−RFLP/逆転写PCR−RFLP、ホットスタートPCR、ネステッドPCR、in situポロニーPCR、in situローリングサークル増幅(RCA)、デジタルPCR(dPCR)、液滴型デジタルPCR(ddPCR)、架橋PCR、ピコリットルPCR、およびエマルジョンPCRを含むがこれらに限定されない。他の適切な増幅法は、リガーゼ連鎖反応(LCR)、転写増幅、分子反転プローブ(MIP)PCR、自己持続配列複製、標的ポリヌクレオチド配列の選択的増幅、コンセンサス配列プライミングポリメラーゼ連鎖反応(CP−PCR)、任意プライムポリメラーゼ連鎖反応(AP−PCR;arbitrarily primed polymerase chain reaction)、縮重ポリヌクレオチドプライミングPCR(DOP−PCR)、および核酸ベースの配列増幅(NABSA)を含む。本明細書で使用されうる他の増幅法は、米国特許第5,242,794号;同第5,494,810号;同第4,988,617号;および同第6,582,938号において記載されている増幅法を含むほか、Qベータレプリカーゼ媒介型RNA増幅も含む。増幅は、等温増幅、例えば、等温線形増幅でありうる。
【0276】
一部の実施形態では、増幅を、固体支持体上で行わない。一部の実施形態では、増幅を、液滴内の固体支持体上で行わない。一部の実施形態では、増幅が、液滴内の増幅ではない場合、増幅を、固体支持体上で行う。
【0277】
増幅反応は、1つまたは複数の添加剤を含みうる。一部の実施形態では、1つまたは複数の添加剤は、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン一水和物(N,N,N−トリメチルグリシン=[カルボキシ−メチル]トリメチルアンモニウム)、トレハロース、7−デアザ−2’−デオキシグアノシン三リン酸(dC7GTPまたは7−デアザ−2’−dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、テトラメチルアンモニウムクロリド(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば、テトラエチルアンモニウムクロリド(TEA−Cl)およびテトラプロピルアンモニウムクロリド(TPrA−Cl))、非イオン性洗浄剤(例えば、Triton X−100、Tween 20、Nonidet P−40(NP−40))、またはPREXCEL−Qである。一部の実施形態では、増幅反応は、0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含みうる。他の場合には、増幅反応は、少なくとも0、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、または10の異なる添加剤を含みうる。
【0278】
プライマー
一般に、1つまたは複数のプライマー対を、増幅反応において使用することができ、プライマー対のうちの1つのプライマーは、フォワードプライマーであることが可能であり、プライマー対のうちの1つのプライマーは、リバースプライマーでありうる。
【0279】
場合によって、プライマーの第1の対を、増幅反応において使用することができ、第1の対の1つのプライマーは、第1の標的ポリヌクレオチド分子の配列に相補的なフォワードプライマーであることが可能であり、第1の対の1つのプライマーは、第1の標的ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第1の標的遺伝子座は、第1の配列と第2の配列との間に存在しうる。一部の実施形態では、第1の標的遺伝子座は、V
HまたはVαもしくはVγ配列を含む。
【0280】
場合によって、プライマーの第2の対を、増幅反応において使用することができ、第2の対の1つのプライマーは、第2の標的ポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることが可能であり、第2の対の1つのプライマーは、第2の標的ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第2の標的遺伝子座は、第1の配列と第2の配列との間に存在しうる。一部の実施形態では、第2の標的遺伝子座は、V
LまたはVβもしくはVδ配列を含む。
【0281】
場合によって、プライマーの第3の対を、増幅反応において使用することができ、第3の対の1つのプライマーは、第3の標的ポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることが可能であり、第3の対の1つのプライマーは、第3の標的ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第3の標的遺伝子座は、第1の配列と第2の配列との間に存在しうる。一部の実施形態では、第3の標的遺伝子座は、分子バーコードまたは容器バーコードなどのバーコードを含む。
【0282】
フォワードプライマーおよびリバースプライマーの長さは、標的ポリヌクレオチドおよび標的遺伝子座の配列に依存しうる。例えば、フォワードプライマーおよびリバースプライマーの長さおよび/またはT
Mは、最適化することができる。場合によって、プライマーは、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、もしくは60ヌクレオチドの長さであるか、およそそれら超の長さであるか、またはおよそそれら未満の長さでありうる。場合によって、プライマーは、約15〜約20、約15〜約25、約15〜約30、約15〜約40、約15〜約45、約15〜約50、約15〜約55、約15〜約60、約20〜約25、約20〜約30、約20〜約35、約20〜約40、約20〜約45、約20〜約50、約20〜約55、または約20〜約60ヌクレオチドの長さである。
【0283】
プライマーは、鋳型ポリヌクレオチドに結合する前に、一本鎖DNAでありうる。場合によって、プライマーは当初、二本鎖配列を含む。プライマーの適切な長さは、プライマーの意図される使用に依存しうるが、約6〜約50ヌクレオチド、または約15〜約35ヌクレオチドの範囲でありうる。短鎖プライマー分子は一般に、鋳型との十分に安定的なハイブリッド体複合体を形成するのにより低い温度を要求しうる。一部の実施形態では、プライマーは、鋳型核酸の正確な配列を反映する必要はないが、鋳型とハイブリダイズするのに十分に相補的でありうる。場合によって、プライマーは、鋳型ポリヌクレオチドに結合する前に、部分的に二本鎖でありうる。二本鎖配列を有するプライマーは、約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、もしくは20塩基、およそそれら超、またはおよそそれら未満のヘアピンループを有しうる。プライマーの二本鎖部分は、約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、もしくは50塩基対、およそそれら超、およそそれら未満、または少なくともおよそそれらでありうる。当技術分野では、所与の標的配列の増幅に適するプライマーのデザインが周知である。
【0284】
プライマーには、プライマーの検出または固定化を可能とするが、プライマーの基本的な特性(例えば、DNA合成の開始点として作用する)は変更しない、さらなる特色を組み込むことができる。例えば、プライマーは、5’末端に、標的核酸とハイブリダイズしないが、クローニングもしくはさらなる増幅、または増幅産物のシークエンシングを容易とする、さらなる核酸配列を含有しうる。例えば、さらなる配列は、ユニバーサルプライマー結合性部位などのプライマー結合性部位を含みうる。本明細書では、鋳型とハイブリダイズするのに十分に相補的なプライマーの領域を、ハイブリダイジング領域と称することができる。
【0285】
別の場合には、本明細書で記載される方法および組成物において活用されるプライマーは、1つまたは複数のユニバーサルヌクレオシドを含みうる。ユニバーサルヌクレオシドの非限定的な例は、米国出願公開第2009/0325169号および同第2010/0167353号において記載されている、5−ニトロインドールおよびイノシンである。
【0286】
プライマーは、二次構造および自己ハイブリダイゼーションを回避するための公知のパラメータに従いデザインすることができる。異なるプライマー対を、ほぼ同じ温度、例えば、別のプライマー対から1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、または10℃以内でアニールおよび溶融させることができる。場合によって、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000超のプライマーを、当初使用する。このようなプライマーは、本明細書で記載される標的ポリヌクレオチドとハイブリダイズしうる。
【0287】
プライマーは、当技術分野で周知(Narangら、Methods Enzymol.、68巻:90頁(1979年);Brownら、Methods Enzymol.、68巻:109頁(1979年))の方法を使用して、適切な配列のクローニングおよび直接的な化学合成を含むがこれらに限定されない、様々な方法により調製することができる。プライマーはまた、市販の供給源からも得ることができる。プライマーは、同一の溶融温度を有しうる。プライマーは、同一でない溶融温度を有しうる。プライマーの長さを、5’末端または3’末端において、伸長させるかまたは短縮して、所望の溶融温度を有するプライマーを作製することができる。プライマー対のプライマーのうちの1つは、他のプライマーより長い場合がある。プライマー対のうち、プライマーの3’側アニーリングの長さは、異なりうる。プライマー対の配列および長さが、所望の溶融温度をもたらすように、各プライマー対のアニーリング位置もまた、デザインすることができる。25塩基対より小型のプライマーの溶融温度を決定するための式は、ウォレスの規則(T
M=2(A+T)+4(G+C))である。コンピュータプログラムもまた、プライマーをデザインするのに使用することができる。各プライマーのT
M(溶融またはアニーリング温度)は、ソフトウェアプログラムを使用して計算することができる。プライマーのアニーリング温度は、サイクル1、2、3、4、5、サイクル6〜10、サイクル10〜15、サイクル15〜20、サイクル20〜25、サイクル25〜30、サイクル30〜35、またはサイクル35〜40を含むがこれらに限定されない、増幅の任意のサイクルの後で、再計算し、増大させることができる。増幅の初期サイクルの後、プライマーの5’側を、目的の各遺伝子座に由来する産物に組み込むことができ、したがって、T
Mを、各プライマーの5’側および3’側の両方の配列に基づき、再計算することができる。
【0288】
本明細書で開示される方法の1つまたは複数の反応の実行は、1つまたは複数のプライマーの使用を含みうる。本明細書で使用される場合、プライマーは、二本鎖、一本鎖、または鋳型ポリヌクレオチドとハイブリダイズするのに十分に相補的な部分的に一本鎖のポリヌクレオチドを含む。プライマーは、鋳型ポリヌクレオチドに結合する前に、一本鎖DNAでありうる。一部の実施形態では、プライマーは当初、二本鎖配列を含む。プライマー部位は、プライマーがハイブリダイズする鋳型の帯域を含む。一部の実施形態では、プライマーは、鋳型指向型核酸合成のための開始点として作用することが可能である。例えば、プライマーは、4つの異なるヌクレオチドおよびDNAもしくはRNAポリメラーゼまたは逆転写酵素などの重合化剤または酵素と共に使用されると、鋳型指向型核酸合成を開始することができる。プライマー対は、2つのプライマー:鋳型配列の5’末端とハイブリダイズする5’側上流領域を有する第1のプライマー、および鋳型配列の3’末端の相補体とハイブリダイズする3’側下流領域を有する第2のプライマーを含む。プライマーセットは、2つまたはそれ超のプライマー:1つまたは複数の鋳型配列の5’末端とハイブリダイズする5’側上流領域を有する第1の1つまたは複数のプライマー、および1つまたは複数の鋳型配列の3’末端の相補体とハイブリダイズする3’側下流領域を有する第2の1つまたは複数のプライマーを含む。一部の実施形態では、プライマーは、標的特異的配列を含む。一部の実施形態では、プライマーは、試料バーコード配列を含む。一部の実施形態では、プライマーは、ユニバーサルプライミング配列を含む。一部の実施形態では、プライマーは、PCRプライミング配列を含む。一部の実施形態では、プライマーは、ポリヌクレオチドの増幅を開始するのに使用される、PCRプライミング配列を含む。(Dieffenbach、PCR Primer:A Laboratory Manual、2版(Cold Spring Harbor Press、New York(2003年))。ユニバーサルプライマー結合性部位または配列は、ユニバーサルプライマーの、ポリヌクレオチドおよび/またはアンプリコンへの結合を可能とする。ユニバーサルプライマーは、当技術分野で周知であり、−47F(M13F)、alfaMF、AOX3’、AOX5’、BGHr、CMV−30、CMV−50、CVMf、LACrmt、lamgda gt10F、lambda gt10R、lambda gt11F、lambda gt11R、M13 rev、M13Forward(−20)、M13Reverse、male、p10SEQPpQE、pA−120、pet4、pGAP Forward、pGLRVpr3、pGLpr2R、pKLAC14、pQEFS、pQERS、pucU1、pucU2、reversA、seqIREStam、seqIRESzpet、seqori、seqPCR、seqpIRES−、seqpIRES+、seqpSecTag、seqpSecTag+、seqretro+PSI、SP6、T3−prom、T7−prom、およびT7−termInvを含むがこれらに限定されない。本明細書で使用される場合、「結合する」とは、共有結合的相互作用および非共有結合的相互作用の両方または一方を指す場合がある。ユニバーサルプライマーの、ユニバーサルプライマー結合性部位への結合を、ポリヌクレオチドおよび/またはアンプリコンの増幅、検出、および/またはシークエンシングのために使用することができる。ユニバーサルプライマー結合性部位は、少なくとも約1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000のヌクレオチドまたは塩基対を含みうる。別の例では、ユニバーサルプライマー結合性部位は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000のヌクレオチドまたは塩基対を含む。一部の実施形態では、ユニバーサルプライマー結合性部位は、1〜10、10〜20、10〜30、または10〜100のヌクレオチドまたは塩基対を含む。一部の実施形態では、ユニバーサルプライマー結合性部位は、約1〜90、1〜80、1〜70、1〜60、1〜50、1〜40、1〜30、1〜20、1〜10、2〜90、2〜80、2〜70、2〜60、2〜50、2〜40、2〜30、2〜20、2〜10、1〜900、1〜800、1〜700、1〜600、1〜500、1〜400、1〜300、1〜200、1〜100、2〜900、2〜800、2〜700、2〜600、2〜500、2〜400、2〜300、2〜200、2〜100、5〜90、5〜80、5〜70、5〜60、5〜50、5〜40、5〜30、5〜20、5〜10、10〜90、10〜80、10〜70、10〜60、10〜50、10〜40、10〜30、10〜20、10〜10、5〜900、5〜800、5〜700、5〜600、5〜500、5〜400、5〜300、5〜200、5〜100、10〜900、10〜800、10〜700、10〜600、10〜500、10〜400、10〜300、10〜200、10〜100、25〜900、25〜800、25〜700、25〜600、25〜500、25〜400、25〜300、25〜200、25〜100、100〜1000、100〜900、100〜800、100〜700、100〜600、100〜500、100〜400、100〜300、100〜200、200〜1000、200〜900、200〜800、200〜700、200〜600、200〜500、200〜400、200〜300、300〜1000、300〜900、300〜800、300〜700、300〜600、300〜500、300〜400、400〜1000、400〜900、400〜800、400〜700、400〜600、400〜500、500〜1000、500〜900、500〜800、500〜700、500〜600、600〜1000、600〜900、600〜800、600〜700、700〜1000、700〜900、700〜800、800〜1000、800〜900、または900〜1000のヌクレオチドまたは塩基対を含む。
【0289】
プライマーは、プライマー伸長産物の合成におけるその使用と適合性の長さを有しうる。プライマーは、8〜200ヌクレオチドの長さのポリヌクレオチドでありうる。プライマーの長さは、鋳型ポリヌクレオチドおよび鋳型遺伝子座の配列に依存しうる。例えば、プライマーまたはプライマーセットの長さおよび/または溶融温度(T
M)を最適化することができる。場合によって、プライマーは、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、もしくは60ヌクレオチドの長さであるか、およそそれら超の長さであるか、またはおよそそれら未満の長さでありうる。一部の実施形態では、プライマーは、約8〜100ヌクレオチドの長さ、例えば、10〜75、15〜60、15〜40、18〜30、20〜40、21〜50、22〜45、25〜40、7〜9、12〜15、15〜20、15〜25、15〜30、15〜45、15〜50、15〜55、15〜60、20〜25、20〜30、20〜35、20〜45、20〜50、20〜55、または20〜60ヌクレオチドの長さ、およびこれらの間の任意の長さである。一部の実施形態では、プライマーは、最大で約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、または100ヌクレオチドの長さである。
【0290】
一般に、1つまたは複数のプライマー対は、指数関数的増幅反応において使用することができ、プライマー対のうちの1つのプライマーは、フォワードプライマーであることが可能であり、プライマー対のうちの1つのプライマーは、リバースプライマーでありうる。一部の実施形態では、プライマーの第1の対は、指数関数的増幅反応において使用することができ、第1の対の1つのプライマーは、第1の鋳型ポリヌクレオチド分子の配列に相補的なフォワードプライマーであることが可能であり、第1の対の1つのプライマーは、第1の鋳型ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第1の鋳型遺伝子座は、第1の配列と第2の配列との間に存在しうる。一部の実施形態では、プライマーの第2の対を、増幅反応において使用することができ、第2の対の1つのプライマーは、第2の標的ポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることが可能であり、第2の対の1つのプライマーは、第2の標的ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第2の標的遺伝子座は、第1の配列と第2の配列との間に存在しうる。一部の実施形態では、第2の標的遺伝子座は、可変軽鎖抗体配列を含む。一部の実施形態では、プライマーの第3の対を、増幅反応において使用することができ、第3の対の1つのプライマーは、第3の鋳型ポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることが可能であり、第3の対の1つのプライマーは、第3の鋳型ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることが可能であり、第3の鋳型遺伝子座は、第1の配列と第2の配列との間に存在しうる。
【0291】
1つまたは複数のプライマーは、複数の鋳型ポリヌクレオチドの少なくとも一部にアニールしうる。1つまたは複数のプライマーは、複数の鋳型ポリヌクレオチドの3’末端および/または5’末端にアニールしうる。1つまたは複数のプライマーは、複数の鋳型ポリヌクレオチドの内部領域にアニールしうる。内部領域は、複数の鋳型ポリヌクレオチドの3’末端または5’末端から、少なくとも約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900、または1000のヌクレオチドでありうる。1つまたは複数のプライマーは、プライマーの固定されたパネルを含みうる。1つまたは複数のプライマーは、少なくとも1つまたはそれ超のカスタムプライマーを含みうる。1つまたは複数のプライマーは、少なくとも1つまたはそれ超の対照プライマーを含みうる。1つまたは複数のプライマーは、少なくとも1つまたはそれ超のハウスキーピング遺伝子プライマーを含みうる。1つまたは複数のプライマーは、ユニバーサルプライマーを含みうる。ユニバーサルプライマーは、ユニバーサルプライマー結合性部位にアニールしうる。一部の実施形態では、1つまたは複数のカスタムプライマーは、SBC、標的特異的な領域、その相補体、またはこれらの任意の組合せにアニールする。1つまたは複数のプライマーは、ユニバーサルプライマーを含みうる。1つまたは複数のプライマーは、1つまたは複数の標的または鋳型ポリヌクレオチドを増幅するか、またはこれらのプライマーの伸長、逆転写、直鎖状の伸長、非指数関数的増幅、指数関数的増幅、PCR、もしくは他の任意の増幅法を実施するようにデザインすることができる。
【0292】
標的特異的な領域は、少なくとも約1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900、または1000のヌクレオチドまたは塩基対を含みうる。別の例では、標的特異的な領域は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000のヌクレオチドまたは塩基対を含む。一部の実施形態では、標的特異的な領域は、約5〜10、10〜15、10〜20、10〜30、15〜30、10〜75、15〜60、15〜40、18〜30、20〜40、21〜50、22〜45、25〜40、7〜9、12〜15、15〜20、15〜25、15〜30、15〜45、15〜50、15〜55、15〜60、20〜25、20〜30、20〜35、20〜45、20〜50、20〜55、20〜60、2〜900、2〜800、2〜700、2〜600、2〜500、2〜400、2〜300、2〜200、2〜100、25〜900、25〜800、25〜700、25〜600、25〜500、25〜400、25〜300、25〜200、25〜100、100〜1000、100〜900、100〜800、100〜700、100〜600、100〜500、100〜400、100〜300、100〜200、200〜1000、200〜900、200〜800、200〜700、200〜600、200〜500、200〜400、200〜300、300〜1000、300〜900、300〜800、300〜700、300〜600、300〜500、300〜400、400〜1000、400〜900、400〜800、400〜700、400〜600、400〜500、500〜1000、500〜900、500〜800、500〜700、500〜600、600〜1000、600〜900、600〜800、600〜700、700〜1000、700〜900、700〜800、800〜1000、800〜900、または900〜1000のヌクレオチドまたは塩基対を含む。
【0293】
プライマーは、二次構造および自己ハイブリダイゼーションを回避するための公知のパラメータに従いデザインすることができる。一部の実施形態では、異なるプライマー対を、ほぼ同じ温度、例えば、別のプライマー対から1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、または10℃以内でアニールおよび溶融させることができる。一部の実施形態では、複数のプライマー中の1つまたは複数のプライマーを、ほぼ同じ温度、例えば、複数のプライマー中の別のプライマーから1、2、3、4、5、6、7、8、9、または10℃以内でアニールおよび溶融させることができる。一部の実施形態では、複数のプライマー中の1つまたは複数のプライマーを、複数のプライマー中の別のプライマーと異なる温度でアニールおよび溶融させることができる。
【0294】
本明細書で記載される方法の1つまたは複数のステップのための複数のプライマーは、約1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000の異なるプライマー、最大でおよそそれらの異なるプライマー、または少なくともおよそそれらの異なるプライマーを含む複数のプライマーを含みうる。例えば、複数のプライマー中の各プライマーは、異なる標的特異的な領域もしくは配列または鋳型特異的な領域もしくは配列を含みうる。
【0295】
シークエンシング
本明細書で記載される方法または方法ステップの1つまたは複数を実施した後、生成されたポリヌクレオチドのライブラリーをシークエンシングすることができる。
【0296】
シークエンシングは、当技術分野で公知の任意のシークエンシング法により実施することができる。一部の実施形態では、シークエンシングを、ハイスループットで実施することができる。適切な次世代シークエンシング技術は、454 Life Sciencesプラットフォーム(Roche、Branford、CT)(Marguliesら、Nature、437巻、376〜380頁(2005年));Illumina製のGenome Analyzer、GoldenGate Methylation Assay、またはInfinium Methylation Assay、すなわち、Infinium HumanMethylation 27K BeadArrayまたはVeraCode GoldenGateメチル化アレイ(Illumina、San Diego、CA;Bibkovaら、Genome Res.、16巻、383〜393頁(2006年);および米国特許第6,306,597号、同第7,598,035号、同第7,232,656号)、またはライゲーションによるDNAシークエンシングである、SOLiD System(Applied Biosystems/Life Technologies;米国特許第6,797,470号、同第7,083,917号、同第7,166,434号、同第7,320,865号、同第7,332,285号、同第7,364,858号、および同第7,429,453号);またはHelicos True Single Molecule DNAシークエンシング技術(Harrisら、Science、320巻、106〜109頁(2008年);および米国特許第7,037,687号、同第7,645,596号、同第7,169,560号、および同第7,769,400号)、Pacific Biosciencesの単一分子リアルタイム(SMRTTm)技術、およびシークエンシング(Soniら、Clin.Chem.、53巻、1996〜2001頁(2007年))を含む。これらのシステムは、試料から単離された多くのポリヌクレオチドのマルチプレックスパラレルシークエンシングを可能とする(Dear、Brief Funct.Genomic Proteomic、1巻(4号)、397〜416頁(2003年);およびMcCaughanら、J.Pathol.、220巻、297〜306頁(2010年))。一部の実施形態では、ポリヌクレオチドを、色素で修飾されたプローブのライゲーションによるシークエンシング、パイロシークエンシング、または単一分子シークエンシングによりシークエンシングする。ポリヌクレオチドの配列の決定は、Helioscope(商標)単一分子シークエンシング、ナノポアDNAシークエンシング、Lynx Therapeutics製のMassively Parallel Signature Sequencing(MPSS)、454製のパイロシークエンシング、Single Molecule real time(RNAP)シークエンシング、Illumina(Solexa)シークエンシング、SOLiDシークエンシング、Ion Torrent(商標)、Ion半導体シークエンシング、Single Molecule SMRT(商標)シークエンシング、ポロニーシークエンシング、DNAナノボールシークエンシング、およびVisiGen Biotechnologies製の手法などのシークエンシング法により実施することができる。代替的に、ポリヌクレオチドの配列の決定では、Illuminaにより提供されているGenome Analyzer IIx、HiSeqおよびMiSeq、Pacific Biosciences(California)により提供されているPacBio RSシステムおよびSolexa SequencerなどのSingle Molecule Real Time(SMRT(商標))技術、Helicos Inc.(Cambridge、MA)により提供されているHeliScope(商標)SequencerなどのTrue Single Molecule Sequencing(tSMS(商標))技術を含むがこれらに限定されない、シークエンシングプラットフォームを使用することができる。シークエンシングは、MiSeqシークエンシングを含みうる。シークエンシングは、HiSeqシークエンシングを含みうる。一部の実施形態では、ポリヌクレオチドの配列の決定は、ペアドエンドシークエンシング、ナノポアシークエンシング、ハイスループットシークエンシング、ショットガンシークエンシング、色素ターミネーターシークエンシング、多重プライマーDNAシークエンシング、プライマーウォーキング、サンガージデオキシシークエンシング、マキシム−ギルバートシークエンシング、パイロシークエンシング、true single moleculeシークエンシング、またはこれらの任意の組合せを含む。代替的に、ポリヌクレオチドの配列は、電子顕微鏡法または化学感受性電界効果トランジスター(chemFET)アレイにより決定することができる。
【0297】
方法は、ライブラリー内の1つまたは複数のポリヌクレオチドをシークエンシングするステップをさらに含みうる。方法は、ライブラリー内の1つまたは複数のポリヌクレオチド配列、配列リード、アンプリコンの配列、またはアンプリコンのセットの配列を、互いに照らしてアラインするステップをさらに含みうる。
【0298】
本明細書で使用される場合、アラインするステップは、配列リードなどの被験配列を、1つまたは複数の他の被験配列、基準配列、またはこれらの組合せと比較することを含む。一部の実施形態では、アラインするステップを使用して、複数の配列またはアラインされた配列からコンセンサス配列を決定することができる。一部の実施形態では、アラインするステップは、各々が同一な分子バーコードまたは容器バーコードを有する複数の配列からコンセンサス配列を決定することを含む。一部の実施形態では、比較を目的としてアラインされる配列の長さは、基準配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つまたはそれ超の配列の実際の比較は、例えば、数学的アルゴリズムを使用する周知の方法により達成することができる。このような数学的アルゴリズムの非限定的な例は、Karlin,S.およびAltschul,S.、Proc.Natl.Acad.Sci.USA、90−5873〜5877頁(1993年)において記載されている。このようなアルゴリズムは、Altschul,S.ら、Nucleic Acids Res.、25巻:3389〜3402頁(1997年)において記載されている、NBLASTおよびXBLASTプログラム(version2.0)に組み込まれている。BLASTおよびGapped BLASTプログラムを活用する場合、それぞれのプログラム(例えば、NBLAST)の任意の関与性のパラメータを使用することができる。例えば、配列比較のためのパラメータは、スコア=100、ワード長=12に設定することもでき、変動させることもできる(例えば、W=5またはW=20)。他の例は、MyersおよびMiller、CABIOS(1989年)のアルゴリズムである、ADVANCE、ADAM、BLAT、およびFASTAを含む。一部の実施形態では、2つのアミノ酸配列の間の同一性パーセントは、例えば、GCGソフトウェアパッケージ(Accelrys、Cambridge、UK)内のGAPプログラムを使用して達成することができる。
【0299】
シークエンシングするステップは、少なくとも約10、20、30、40、50、60、70、80、90、100またはそれ超のヌクレオチドまたは塩基対のポリヌクレオチドをシークエンシングすることを含みうる。一部の実施形態では、シークエンシングするステップは、少なくとも約200、300、400、500、600、700、800、900、1000、またはそれ超のヌクレオチドまたは塩基対のポリヌクレオチドをシークエンシングすることを含む。他の場合には、シークエンシングするステップは、少なくとも約1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、またはそれ超のヌクレオチドまたは塩基対のポリヌクレオチドをシークエンシングすることを含む。
【0300】
シークエンシングするステップは、試行1回当たり少なくとも約200、300、400、500、600、700、800、900、1000、またはそれ超のシークエンシングリードを含みうる。本明細書で使用される場合、配列リードは、シークエンシング法により生成される一連のデータまたはデータの連なりから決定されるヌクレオチドの配列を含む。一部の実施形態では、シークエンシングするステップは、試行1回当たり少なくとも約1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、またはそれ超のシークエンシングリードをシークエンシングすることを含む。シークエンシングするステップは、試行1回当たり約1,000,000,000超、それ未満、またはそれと等しいシークエンシングリードを含みうる。シークエンシングするステップは、試行1回当たり約200,000,000超、それ未満、またはそれと等しいリードを含みうる。
【0301】
一部の実施形態では、コンセンサス配列を決定するのに使用される配列リードの数は、約2〜1000の配列リードである。例えば、コンセンサス配列を決定するのに使用される配列リードの数は、約2〜900、2〜800、2〜700、2〜600、2〜500、2〜400、2〜300、2〜200、2〜100、25〜900、25〜800、25〜700、25〜600、25〜500、25〜400、25〜300、25〜200、25〜100、100〜1000、100〜900、100〜800、100〜700、100〜600、100〜500、100〜400、100〜300、100〜200、200〜1000、200〜900、200〜800、200〜700、200〜600、200〜500、200〜400、200〜300、300〜1000、300〜900、300〜800、300〜700、300〜600、300〜500、300〜400、400〜1000、400〜900、400〜800、400〜700、400〜600、400〜500、500〜1000、500〜900、500〜800、500〜700、500〜600、600〜1000、600〜900、600〜800、600〜700、700〜1000、700〜900、700〜800、800〜1000、800〜900、または900〜1000の配列リードでありうる。一部の実施形態では、コンセンサス配列を決定するのに使用される配列リードの数は、少なくとも約1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000、1,000,000、50,000,000、または100,000,000のリードである。一部の実施形態では、コンセンサス配列を決定するのに使用される配列リードの数は、最大で約1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000、1,000,000、50,000,000、または100,000,000のリードである。
【0302】
方法は、ミスリードをシークエンシングするステップを含みうる。方法は、反応条件を決定することまたはプライマー配列をデザインすることなどのために、ミスリードの数を決定するステップを含みうる。1つまたは複数の第1の条件または条件のセットの下で生成されるミスリードの数の比較を使用して、好ましい条件または条件のセットを決定することができる。例えば、第1の方法は、PCR反応中の高塩濃度において実行することができ、第2の方法は、PCR反応中の低塩濃度において実行することができ、第1および第2の方法は、塩濃度の差を除くと、実質的に同様に実行される。第1の方法が、特定の標的ポリヌクレオチド配列またはプライマーについてのより大きな数のミスリードなど、より大きな数のミスリードを結果としてもたらす場合、より少ない塩の反応条件を、この特定の標的ポリヌクレオチド配列またはプライマーに好ましいと決定することができる。
【0303】
診断法
一部の実施形態では、方法は、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。一部の実施形態では、方法は、標的ポリヌクレオチドの存在、非存在、またはレベルに基づき、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。一部の実施形態では、方法は、1つまたは複数の標的ポリヌクレオチドの存在、非存在、またはレベルに基づき、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。
【0304】
一部の実施形態では、方法は、本明細書で記載される方法を使用して得られる配列の1つまたは複数の存在、非存在、レベル、または配列に基づき、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。例えば、疾患の診断は、本明細書で記載される方法を使用して得られる変異体配列の存在、非存在、レベル、または配列に基づき下すことができる。一部の実施形態では、方法は、本明細書で記載される方法を使用して得られる配列リードの1つまたは複数の存在、非存在、レベル、または配列に基づき、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。一部の実施形態では、方法は、本明細書で記載される方法を使用して得られるコンセンサス配列の1つまたは複数の存在、非存在、レベル、または配列に基づき、被験体において、疾患、障害、症状、および/または状態を、診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。一部の実施形態では、方法は、試料中の標的ポリヌクレオチドのレベル(例えば、量または濃度)の決定に基づき、被験体において、疾患、障害、症状、および/または状態を診断し、予後予測し、モニタリングし、処置し、改善し、かつ/または防止するステップをさらに含みうる。試料中の標的ポリヌクレオチドのレベルは、1つまたは複数の配列リード、配列、コンセンサス配列、またはこれらの任意の組合せに基づき決定することができる。試料中の複数の標的ポリヌクレオチドの各々のレベルは、本明細書で記載される方法を使用して決定することができる。試料中の複数の標的ポリヌクレオチドの各々のレベルは、複数の標的ポリヌクレオチド中の各標的ポリヌクレオチドについての、いくつかの配列リード、配列、コンセンサス配列、またはこれらの任意の組合せに基づき決定することができる。例えば、第1の標的ポリヌクレオチドのレベルおよび第2の標的ポリヌクレオチドのレベルは、本明細書で記載される方法を使用して決定することができる。
【0305】
一部の実施形態では、複数の標的ポリヌクレオチドのうちの第1および第2の標的ポリヌクレオチドは、同じである。例えば、第1の標的ポリヌクレオチドは、mRNA分子の第1のコピーを含むことが可能であり、第2の標的ポリヌクレオチドは、mRNA分子の第2のコピーを含みうる。一部の実施形態では、第1および第2の標的ポリヌクレオチドは、異なる。例えば、第1の標的ポリヌクレオチドは、第1のmRNA分子を含むことが可能であり、第2の標的ポリヌクレオチドは、第1のmRNA分子とは異なる遺伝子から転写された第2のmRNA分子を含みうる。例えば、第1の標的ポリヌクレオチドは、第1の対立遺伝子を含むことが可能であり、第2の標的ポリヌクレオチドは、第2の対立遺伝子を含みうる。例えば、第1の標的ポリヌクレオチドは、野生型配列を含むことが可能であり、第2の標的ポリヌクレオチドは、変異体配列を含みうる。
【0306】
一部の実施形態では、方法は、疾患、障害、症状、および/または状態を有する被験体を、少なくとも50%の信頼度で診断または予後予測するステップをさらに含みうる。例えば、疾患、障害、症状、および/または状態を有する被験体の診断または予後予測は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%の信頼度で決定することができる。一部の実施形態では、疾患、障害、症状、および/または状態を有する被験体の診断または予後予測は、50%〜100%の信頼度で決定することができる。例えば、疾患、障害、症状、および/または状態を有する被験体の診断または予後予測は、60%〜100%、70%〜100%、80%〜100%、90%〜100%、50%〜90%、50%〜80%、50%〜70%、50%〜60%、60%〜90%、60%〜80%、60%〜70%、70%〜90%、70%〜80%、または80%〜90%の信頼度で決定することができる。
【0307】
一部の実施形態では、バイオマーカーなど、被験体における標的ポリヌクレオチドの存在、非存在、レベル、配列、またはこれらの任意の組合せは、少なくとも50%の信頼度で決定することができる。例えば、被験体における標的ポリヌクレオチドの存在、非存在、レベル、配列、またはこれらの任意の組合せは、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%の信頼度で決定することができる。一部の実施形態では、被験体における標的ポリヌクレオチドの存在、非存在、レベル、配列、またはこれらの任意の組合せは、50%〜100%の信頼度で決定することができる。例えば、被験体における標的ポリヌクレオチドの存在、非存在、レベル、配列、またはこれらの任意の組合せは、60%〜100%、70%〜100%、80%〜100%、90%〜100%、50%〜90%、50%〜80%、50%〜70%、50%〜60%、60%〜90%、60%〜80%、60%〜70%、70%〜90%、70%〜80%、または80%〜90%の信頼度で決定することができる。
【0308】
酵素
本明細書で開示される方法およびキットは、1つまたは複数の酵素を含みうる。酵素の例は、リガーゼ、逆転写酵素、ポリメラーゼ、および制限ヌクレアーゼを含むがこれらに限定されない。
【0309】
一部の実施形態では、ポリヌクレオチドへのアダプターの結合は、1つまたは複数のリガーゼの使用を含む。リガーゼの例は、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIV、およびT4 DNAリガーゼなどのDNAリガーゼ、ならびにT4 RNAリガーゼIおよびT4 RNAリガーゼIIなどのRNAリガーゼを含むがこれらに限定されない。
【0310】
本明細書で開示される方法およびキットは、1つまたは複数の逆転写酵素の使用をさらに含みうる。一部の実施形態では、逆転写酵素は、HIV−1逆転写酵素、M−MLV逆転写酵素、AMV逆転写酵素、およびテロメラーゼ逆転写酵素である。一部の実施形態では、逆転写酵素は、M−MLV逆転写酵素である。
【0311】
一部の実施形態では、本明細書で開示される方法およびキットは、1つまたは複数のプロテアーゼの使用を含む。
【0312】
一部の実施形態では、本明細書で開示される方法およびキットは、1つまたは複数のポリメラーゼの使用を含む。ポリメラーゼの例は、DNAポリメラーゼおよびRNAポリメラーゼを含むがこれらに限定されない。一部の実施形態では、DNAポリメラーゼは、DNAポリメラーゼI、DNAポリメラーゼII、DNAポリメラーゼIIIホロ酵素、およびDNAポリメラーゼIVである。市販されているDNAポリメラーゼは、Bst 2.0 DNAポリメラーゼ、Bst 2.0 WarmStart(商標)DNAポリメラーゼ、Bst DNAポリメラーゼ、Sulfolobus DNAポリメラーゼIV、Taq DNAポリメラーゼ、9°N(商標)m DNAポリメラーゼ、Deep VentR(商標)(exo−)DNAポリメラーゼ、Deep VentR(商標)DNAポリメラーゼ、Hemo KlenTaq(商標)、LongAmp(登録商標)Taq DNAポリメラーゼ、OneTaq(登録商標)DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、Q5(商標)High−Fidelity DNAポリメラーゼ、Therminator(商標)γ DNAポリメラーゼ、Therminator(商標)DNAポリメラーゼ、Therminator(商標)II DNAポリメラーゼ、Therminator(商標)III DNAポリメラーゼ、VentR(登録商標)DNAポリメラーゼ、VentR(登録商標)(exo−)DNAポリメラーゼ、Bsu DNAポリメラーゼ、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、ターミナルトランスフェラーゼ、Titanium(登録商標)Taqポリメラーゼ、KAPA Taq DNAポリメラーゼ、およびKAPA Taq Hot Start DNAポリメラーゼを含むがこれらに限定されない。
【0313】
一部の実施形態では、ポリメラーゼは、RNAポリメラーゼI、RNAポリメラーゼII、RNAポリメラーゼIII、E.coliポリ(A)ポリメラーゼ、phi6 RNAポリメラーゼ(RdRP)、ポリ(U)ポリメラーゼ、SP6 RNAポリメラーゼ、およびT7 RNAポリメラーゼなどのRNAポリメラーゼである。
【0314】
さらなる試薬
本明細書で開示される方法およびキットは、1つまたは複数の試薬の使用を含みうる。試薬の例は、PCR試薬、ライゲーション試薬、逆転写試薬、酵素試薬、ハイブリダイゼーション試薬、試料調製試薬、親和性捕捉のための試薬、ビーズなどの固体支持体、ならびに核酸の精製および/または単離のための試薬を含むがこれらに限定されない。
【0315】
固体支持体は、事実上任意の不溶性または固体材料を含むことが可能であり、水中で不溶性の固体支持体組成を選択することが多い。例えば、固体支持体は、シリカゲル、ガラス(例えば、制御細孔ガラス(CPG;controlled−pore glass))、ナイロン、Sephadex(登録商標)、Sepharose(登録商標)、セルロース、金属表面(例えば、鉄鋼、金、銀、アルミニウム、ケイ素、および銅)、磁気材料、プラスチック材料(例えば、ポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、ポリビニリデンジフルオリド(PVDF))などを含むか、または本質的にこれらからなりうる。実施形態に従う使用のためのビーズの例は、ビーズが核酸分子と相互作用することを可能とする親和性部分を含みうる。固相(例えば、ビーズ)は、結合性対(例えば、アビジン、ストレプトアビジン、またはそれらの誘導体)のメンバーを含みうる。例えば、ビーズは、ストレプトアビジン−コーティングされたビーズであることが可能であり、ビーズ上に固定化するための核酸分子は、ビオチン部分を含みうる。場合によって、各ポリヌクレオチド分子は、ポリヌクレオチドをさらに安定化させるように、ビオチンなど、2つの親和性部分を含みうる。ビーズは、核酸の固定化に使用するためのさらなる特色または下流のスクリーニングもしくは選択工程において使用されうるさらなる特色を含みうる。例えば、ビーズは、結合性部分、蛍光標識、または蛍光消光剤を含みうる。場合によって、ビーズは、磁気ビーズでありうる。場合によって、固体支持体は、ビーズである。ビーズの例は、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)、MACS(登録商標)マイクロビーズ、抗体コンジュゲートビーズ(例えば、抗免疫グロブリンマイクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、ポリヌクレオチド−dTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、およびBcMag(商標)カルボキシ末端磁気ビーズを含むがこれらに限定されない。ビーズまたは粒子は、膨潤性(例えば、ワング樹脂などのポリマービーズ)または非膨潤性(例えば、CPG)でありうる。一部の実施形態では、固相は、実質的に親水性である。一部の実施形態では、固相(例えば、ビーズ)は、実質的に疎水性である。一部の実施形態では、固相は、結合性対(例えば、アビジン、ストレプトアビジン、またはそれらの誘導体)のメンバーを含み、実質的に疎水性であるか、または実質的に親水性である。一部の実施形態では、固相は、結合性対(例えば、アビジン、ストレプトアビジン、またはそれらの誘導体)のメンバーを含み、固体支持体1mg当たり約1350ピコモルの遊離捕捉剤(例えば、遊離ビオチン)を超える結合能を有する。一部の実施形態では、結合性対のメンバーを含む固相の結合能は、固体支持体1mg当たり800、900、1000、1100、1200、1250、1300、1350、1400、1450、1500、1600、1800、2000ピコモルの遊離捕捉剤を超える。本発明に適するビーズの他の例は、金コロイドまたはポリスチレンビーズもしくはシリカビーズなどのビーズである。実質的に任意のビーズ半径を使用することができる。ビーズの例は、150ナノメートル〜10ミクロンの範囲の半径を有するビーズを含みうる。他のサイズもまた、使用することができる。
【0316】
本明細書で開示される方法およびキットは、1つまたは複数の緩衝液の使用を含みうる。緩衝液の例は、洗浄緩衝液、ライゲーション緩衝液、ハイブリダイゼーション緩衝液、増幅緩衝液、および逆転写緩衝液を含むがこれらに限定されない。一部の実施形態では、ハイブリダイゼーション緩衝液は、TMAC Hyb液、SSPEハイブリダイゼーション液、およびECONO(商標)ハイブリダイゼーション緩衝液など、市販の緩衝液である。本明細書で開示される緩衝液は、1つまたは複数の洗浄剤を含みうる。
【0317】
本明細書で開示される方法およびキットは、1つまたは複数の担体の使用を含みうる。担体は、本明細書で開示される1つまたは複数の反応(例えば、ライゲーション反応、逆転写、増幅、ハイブリダイゼーション)の効率を増強または改善しうる。担体は、分子またはその任意の産物(例えば、ポリヌクレオチドおよび/またはアンプリコン)の非特異的な喪失を減少させるか、または防止しうる。例えば、担体は、表面への吸収を介して、ポリヌクレオチドの非特異的な喪失を減少させうる。担体は、ポリヌクレオチドの、表面または基質(例えば、コンテナー、エッペンドルフチューブ、ピペットチップ)に対する親和性を減少させうる。代替的に、担体は、ポリヌクレオチドの、表面または基質(例えば、ビーズ、アレイ、ガラス、スライド、チップ)に対する親和性を増大させうる。担体は、ポリヌクレオチドを、分解から保護しうる。例えば、担体は、RNA分子を、リボヌクレアーゼから保護しうる。代替的に、担体は、DNA分子を、DNアーゼから保護しうる。担体の例は、DNAおよび/もしくはRNAなどのポリヌクレオチド、またはポリペプチドを含むがこれらに限定されない。DNA担体の例は、プラスミド、ベクター、ポリアデニル化DNA、およびDNAポリヌクレオチドを含む。RNA担体の例は、ポリアデニル化RNA、ファージRNA、ファージMS2 RNA、E.coli RNA、酵母RNA、酵母tRNA、哺乳動物RNA、哺乳動物tRNA、短鎖ポリアデニル化合成リボヌクレオチド、およびRNAポリヌクレオチドを含む。RNA担体は、ポリアデニル化RNAでありうる。代替的に、RNA担体は、非ポリアデニル化RNAでありうる。一部の実施形態では、担体は、細菌、酵母、またはウイルスに由来する。例えば、担体は、細菌、酵母、またはウイルスから導出されたポリヌクレオチドまたはポリペプチドでありうる。例えば、担体は、Bacillus subtilisに由来するタンパク質である。別の例では、担体は、Escherichia coliに由来するポリヌクレオチドである。代替的に、担体は、哺乳動物(例えば、ヒト、マウス、ヤギ、ラット、ウシ、ヒツジ、ブタ、イヌ、またはウサギ)、トリ、両生類、または爬虫類に由来するポリヌクレオチドまたはペプチドである。
【0318】
本明細書で開示される方法およびキットは、1つまたは複数の対照薬剤の使用を含みうる。対照薬剤は、対照ポリヌクレオチド、不活性酵素、非特異的競合物質を含みうる。代替的に、対照薬剤は、ブライトハイブリダイゼーション、ブライトプローブ対照、核酸鋳型、スパイクイン対照、PCR増幅対照を含む。PCR増幅対照は、陽性対照でありうる。他の場合には、PCR増幅対照は、陰性対照である。核酸鋳型対照は、濃度が既知でありうる。対照薬剤は、1つまたは複数の標識を含みうる。
【0319】
スパイクイン対照は、反応または試料に添加される鋳型でありうる。例えば、スパイクイン鋳型を、増幅反応物に添加することができる。スパイクイン鋳型を、第1の増幅サイクル後の任意の時点において、増幅反応物に添加することができる。一部の実施形態では、スパイクイン鋳型を、サイクル数2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、または50の後で、増幅反応物に添加する。スパイクイン鋳型を、最後の増幅サイクル前の任意の時点において、増幅反応物に添加することができる。スパイクイン鋳型は、1つまたは複数のヌクレオチドまたは核酸塩基対を含みうる。スパイクイン鋳型は、DNA、RNA、またはこれらの任意の組合せを含みうる。スパイクイン鋳型は、1つまたは複数の標識を含みうる。
【0320】
本明細書では、本明細書で開示される方法および組成物のために使用されうるか、これらと共に使用されうるか、これらを調製するときに使用されうるか、またはこれらの産物である、分子、材料、組成物、および成分が開示される。これらの材料の組合せ、サブセット、相互作用、群などが開示される一方、これらの分子および化合物についての、各々の多様で個別かつ包括的な組合せおよび順列に対する具体的な言及が、明示的に開示されえない場合、本明細書では、これらの各々が具体的に想定され、記載されていると理解される。例えば、ヌクレオチドまたは核酸について開示し、論じ、ヌクレオチドまたは核酸を含むいくつかの分子に対して施されうるいくつかの修飾について論じる場合、逆のことが具体的に示されない限りにおいて、ヌクレオチドまたは核酸のありとあらゆる組合せおよび順列ならびに可能な修飾が具体的に想定される。この概念は、開示される方法および組成物を作る方法および使用する方法におけるステップを含むがこれらに限定されない、本出願の全ての態様に当てはまる。したがって、実施しうる様々なさらなるステップが存在する場合、これらのさらなるステップの各々を、開示される方法の任意の特異的な実施形態または実施形態の組合せと共に実施することができ、このような組合せの各々が、具体的に想定され、開示されていると考えるものとすることが理解される。
【0321】
本明細書では、本明細書で記載される一部の実施形態を示し、記載してきたが、このような実施形態は、例だけを目的として提示するものである。当業者は、本明細書で提示される本開示から逸脱することなく、多数の変更、変化、および代替に想到するであろう。本明細書で記載される方法を実施するときには、本明細書で記載される実施形態に対する多様な代替物を採用しうることを理解されたい。
【0322】
そうでないことが説明されない限りにおいて、本明細書で使用される全ての科学技術用語は、本開示が属する技術分野の当業者により共通に理解されるのと同じ意味を有する。以下の参考文献は、本明細書で使用しうる方法および組成物についての実施形態を含有する:The Merck Manual of Diagnosis and Therapy、18版、Merck Research Laboratories刊、2006年(ISBN 0−9119102);Benjamin Lewin、Genes IX、Jones & Bartlett Publishing刊、2007年(ISBN−13:9780763740634);Kendrewら(編)、The Encyclopedia of Mol. Biology、Blackwell Science Ltd.刊、1994年(ISBN 0−632−02182−9);およびRobert A. Meyers(編)、Mol. Biology and Biotechnology: a Comprehensive Desk Reference、VCH Publishers, Inc.刊、1995年(ISBN 1−56081−569−8)。
【0323】
本開示の標準的手順は、例えば、Maniatisら、Molecular Cloning: A Laboratory Manual、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、USA(1982年);Sambrookら、Molecular Cloning: A Laboratory Manual(2版)、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、USA(1989年);Davisら、Basic Methods in Molecular Biology、Elsevier Science、Publishing, Inc.、New York、USA(1986年);またはMethods in Enzymology: Guide to Molecular Cloning Techniques、152巻、S.L.BergerおよびA.R.Kimmerl(編)、Academic Press Inc.、San Diego、USA(1987年))において記載されているCurrent Protocols in Molecular Biology (CPMB)(Fred M.Ausubelら編、John Wiley and Sons,Inc.);Current Protocols in Protein Science (CPPS)(John E.Coliganら編、John Wiley and Sons,Inc.);Current Protocols in Immunology(CPI)(John E.Coliganら編、John Wiley and Sons,Inc.);Current Protocols in Cell Biology(CPCB)(Juan S.Bonifacinoら編、John Wiley and Sons,Inc.);Culture of Animal Cells:A Manual of Basic Technique、R.Ian Freshney、Wiley−Liss刊、5版(2005年);ならびにAnimal Cell Culture Methods(Methods in Cell Biology、57巻、Jennie P.MatherおよびDavid Barnes編、Academic Press、1版、1998年)。
【実施例】
【0324】
(実施例1a)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するための細胞を調製するためのプロトコール
目的の細胞集団を得た。これらは、全PBMC、分取細胞、抗体により富化されたBもしくはT細胞、または他の細胞型を含んだ。細胞は、それらが、過剰量のmRNAを、周囲の培地へと漏出しないように、無傷の細胞膜を有した。細胞は、生細胞である必要はなかった。
【0325】
細胞を、細胞緩衝液:1倍濃度のダルベッコリン酸緩衝生理食塩液(PBS)中、2回の遠心分離(T細胞またはB細胞について、200gで10分間にわたる)により洗浄した。次いで、細胞を、細胞緩衝液中、1mL当たり3.5×10
6個の細胞濃度に希釈した。次いで、20μmの細胞ストレイナーを介して、懸濁液をピペッティングした。
【0326】
(実施例1b)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するための固形組織を調製するためのプロトコール
固形組織(例えば、腫瘍または非腫瘍生検試料)を、コラゲナーゼIII(200U/mL)、DNアーゼI(200U/mL)およびトリプシン(5mg/mL)、およびNEDB(Invitrogen)を含む多様なプロテアーゼで処理して、個別の細胞と、1つ超の細胞を含有する凝集物との混合物をもたらした。略述すると、マウスから摘出された腫瘍を、低温の培養培地に添加し、周囲のマウス乳腺組織および脂肪を除去した。腫瘍を、2〜4mmの断片へとミンチにし、次いで、これを、適切な解離溶液または酵素と共に、37℃で30分間にわたりインキュベートした。チップを組織断片サイズに適合する直径に切断した1,000mLのマイクロピペットを使用して、腫瘍断片を、10分間ごとに、上下に混合した。各インキュベーション時間の後、40mmのナイロンメッシュによる細胞ストレイナーを介して、断片を濾過した。放出された細胞を、1200r.p.m.で2分間にわたり遠心分離し、30%のFCSを含む低温の培地中、4℃で保存した。未使用の解離溶液を、残りの組織断片に、30分間にわたり添加した。さらなる細胞が放出されなくなったら、解離を停止させた。断片を、篩を介して押し出し、全てのインキュベーション時間に由来する全ての細胞をプールし、カウントした。次いで、ストレイナー(例えば、10、20、30、40μm)を介して、細胞懸濁液を濾して、大型の凝集物を取り除いた。細胞を、細胞緩衝液:1倍濃度のダルベッコリン酸緩衝生理食塩液(PBS)中、2回の遠心分離(T細胞またはB細胞について、200gで10分間にわたる)により洗浄した。エマルジョンによる解析の前に、細胞集団を、染色、分取またはそれ以外の方法によって分離しなかった。
【0327】
また、摘出された腫瘍を調製するための代替法も実施した。摘出された腫瘍を、1mLの解離緩衝液1(RPMI+10%のFBS中に100U/mlのIV型コラゲナーゼおよび100μg/mLのDNアーゼ)、または解離緩衝液2(5%のFBS、I型コラゲナーゼ(200U/mL)およびDNアーゼI(100μg/mL)を補充したRPMI培地)中に入れ、37℃で30分間にわたりインキュベートした。その後、骨髄細胞を単離する場合は、5%のFBSおよびI型コラゲナーゼを、解離緩衝液2中、それぞれ、10%のFBSおよびIV型コラゲナーゼ(200U/ml)で置きかえた。1,000mLのマイクロピペットを使用して、腫瘍断片を、上下に混合した。次いで、懸濁液を、70μmのフィルターを介して濾過し、骨髄細胞を単離するための、10%のFBSを補充したMACS分離緩衝液で、3回洗浄した。非常に大型の腫瘍(>300mm
2)では、密度勾配遠心分離(PercollまたはFicoll)を使用して、炎症性細胞を、あらかじめ富化することができる。次いで、濾過された細胞懸濁液を、400gで10分間にわたり遠心分離した。ペレットを、10mLのMACS緩衝液ですすぎ、同じ設定で、再度遠心分離した。
【0328】
(実施例2)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するためのエマルジョン反応混合物を調製するためのプロトコール
下記の表1中の試薬およびオリゴヌクレオチドを含有する、エマルジョン反応混合物を、PCR用クリーンフード中、室温で混合した。
【表1】
/5Biosg/=5’ビオチン修飾;/iSp18/=18炭素のスペーサー;V=A、C、またはG;N=任意の塩基;rG=リボグアノシン;W=AまたはT
【0329】
(実施例3)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、エマルジョンを生成するためのプロトコール
細胞および反応混合物を調製したら、エマルジョンを形成した。100μLのHamilton Microliterシリンジを使用して、約100μLずつの反応混合物の2回の注入により、100μLのPEEK試料ループにオーバーロードした。100μLのHamilton Gastightシリンジを使用して、約110μLの細胞懸濁液を、約100μLで、内径を0.2mmとするFEPチュービングループにロードした。ループを、1〜2秒間ごとに約1回、定常的に細胞ループを反転させて、細胞が定着して固まることを防止する機械的ローテーターに結合させた。内部にフルオロフィリックコーティングを施したDolomite 2試薬チップを介して、ジェット流の焦点を絞ることにより、エマルジョンを形成した。外側の油チャネルは、HFE7500(Novec 7500)フルオロカーボン油中に、0.5〜5.0%(w/v)のポリエチレングリコールベースの界面活性剤を含有した。エマルジョンジェットは、一定の流量(細胞相チャネル内と、反応物相チャネル内とで等しい)で走らせた。エマルジョンチップの出力は、低温ブロック内、およそ0℃に保たれたポリプロピレン製のPCRチューブへと滴下させることにより、12cmで、内径を0.5mmとするPEEKチューブを介して回収した。各々がエマルジョン中に50μLずつの水性材料を含有する、4つの画分を回収した(画分1つ当たりの試行時間を5分間とする)。定着した油の大半は、キャピラリーマイクロピペットにより、各チューブの底部から除去した。各エマルジョン画分は、40μLのオーバーレイ溶液:50mMのNa−EDTA、pH8.0、0.002%(w/v)のクレゾールレッドと共に、静かにオーバーレイした。エマルジョンは、以下のプログラム(分:秒):
1.30:00にわたり42.0℃(逆転写)、
2.05:00にわたり95.0℃(逆転写酵素およびDNA鋳型の変性)、
3.00:10にわたり95.0℃、
4.00:30にわたり65.0℃、
5.00:30にわたり72.0℃、
6.3に戻り合計55サイクル(容器バーコードを増幅し、cDNAと融合させる)、
7.無期限で4.0℃
により、サーマルサイクラー内でインキュベートした。
【0330】
エマルジョンは、4.0℃で一晩にわたり保持した。
【0331】
(実施例4)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、エマルジョンを壊すためのプロトコール
キャピラリーマイクロピペットチップを使用して、エマルジョン材料を除去せずに、可能な限り多くのオーバーレイ溶液を除去した。各チューブに、12.5μLのQiagen Protease溶液および0.5MのNa−EDTA 2.5μL、pH8.0を添加した。1:1のFC−40:ペルフルオロオクタノール40μLを添加することにより、エマルジョンを壊し、約10回、静かに反転させた。
【0332】
チューブの内容物を、静かに遠心分離し、サーマルサイクラー内で、以下のプログラム(分:秒):
1.15:00にわたり50℃(プロテアーゼによる消化)、
2.10:00にわたり70℃で(プロテアーゼの不活化)、
3.03:00にわたり95℃(プロテアーゼの不活化およびDNAの変性)、
4.無期限で4.0℃
により、インキュベートした。
【0333】
チューブを遠心分離し、上側の水性相および界面を、未使用のマイクロ遠心管に移し、15,000gで1分間にわたりで遠心分離した。界面を撹乱せずに、上側の水性相を、新しいチューブに移し替えた。
【0334】
(実施例5)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、ポリヌクレオチドを、エマルジョンから清浄化するためのプロトコール
0.25倍容量のNEBストレプトアビジンビーズを、2×BW(10mMのトリス−Cl、pH8.0、1mMのEDTA、2MのNaCl、0.2%のTween−20)中に添加し、室温で15分間にわたりインキュベートした。次いで、ビーズを、1×BWで洗浄し、0.001%のTween−20で3回洗浄し、0.25倍容量の0.001%のTween−20を添加し、3分間にわたり95℃に加熱することにより溶出させた。5倍容量のQiagen Buffer PBを添加し、Zyppyシリカカラムに適用した。次いで、ビーズを、0.7mLのZyppy洗浄緩衝液で洗浄し、5mMのトリス−Cl、pH8.8、0.1mMのEDTA、0.001%のTween−20 180μL中に溶出させた。
【0335】
(実施例6)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、次世代シークエンシングのための、ポリヌクレオチドに対する第1のPCR反応(PCR1)のためのプロトコール
163.2μLの精製cDNAを、PCR1のために使用した。第1のPCR反応のための例示的な設定を、下記の表2に示す。
【表2-1】
【表2-2】
【0336】
60μLずつの反応物4つを、PCRチューブに等分し、サーモサイクラー内で以下のプログラム:
1.01:00にわたり98℃、
2.00:10にわたり98℃、
3.00:20にわたり64℃、
4.00:20にわたり72℃、
5.2に戻り合計6サイクル
6.無期限で4℃
を試行した。
【0337】
PCR産物を、1.2倍容量のAMPure XPで精製し、80%のエタノールで洗浄し、60μLの希釈緩衝液(10mMのトリス−Cl、pH8.0、0.1mMのEDTA)中で溶出させた。
【0338】
(実施例7)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、次世代シークエンシングのための、ポリヌクレオチドに対する第2のPCR反応(PCR2)のためのプロトコール
20μLの精製PCR1産物を、各サブライブラリー(例えば、IgLまたはIgH鎖あるいはTCRαもしくはTCRβ鎖またはTCRγもしくはTCRδ鎖)のために使用した。第2のPCR反応のための例示的な設定を、下記の表3に示す。
【表3-1】
【表3-2】
【0339】
Illumina C7、6塩基のバーコード、およびP7配列の連結を含むプライマーである「P7−インデックス−C7」:
【化2】
を使用した。
【0340】
以下のプログラム:
1.01:00にわたり98℃、
2.00:10にわたり98℃、
3.00:20にわたり64℃、
4.00:20にわたり72℃、
5.2に戻り合計6サイクル、
6.無期限で4℃
を、サーモサイクラー内で試行した。
【0341】
PCR産物を、1.2倍容量のAMPureで精製し、40μLの希釈緩衝液中で溶出させた。
【0342】
(実施例8)
エマルジョンベースの超ハイスループット単一細胞ポリヌクレオチドシークエンシングを実施するために、次世代シークエンシングのための、ポリヌクレオチドに対する第3のPCR反応(PCR3)のためのプロトコール
8μLの精製PCR2産物を、最終的な増幅サイクル数を決定するqPCRのために使用した。第3のPCR反応のための設定を、下記の表4に示す。
【表4】
【0343】
以下のプログラム:
1.01:00にわたり98℃、
2.00:10にわたり98℃、
3.00:20にわたり64℃、
4.00:20にわたり72℃、
5.プレートの読み取り、
6.2に戻り合計25サイクル、
7.無期限で4℃
を、qPCR装置内で試行した。
【0344】
qPCR強度プロットを精査して、蛍光強度は最大となるが、DNAの指数関数的増幅はいまだ終了していない増幅サイクルを決定した。これを、PCR3の終点のための、最終的なサイクル数とした。
【0345】
24.0μLの精製PCR2産物を、終点のPCR3のために使用した。第3のPCRの終点のサイクル数を決定するPCR反応のための例示的な設定を、下記の表5に示す。
【表5】
【0346】
以下のプログラム:
1.01:00にわたり98℃、
2.00:10にわたり98℃、
3.00:20にわたり64℃、
4.00:20にわたり72℃、
5.2に戻り決定された数のサイクル
6.無期限で4℃
を、サーモサイクラー内で試行した。
【0347】
PCR産物を、1.2倍容量のAMPureで精製し、20μLの希釈緩衝液中で溶出させた。ライブラリーは、シークエンシングの準備ができた。ライブラリーは、アガロースゲル精製を伴うかまたは伴わずに、所望の通り、夾雑する切断型アンプリコンを除去するようにプールし、次いで、次世代シークエンシング技術によるプラットフォームを使用して、シークエンシングした。
【0348】
(実施例9)
リードの加工およびアイソタイプの割り当て
pRESTOパッケージ1をもとにして構築されたカスタムパイプラインを使用して、mRNA分子および液滴の全長コンセンサス配列を生成するように、Illumina MiSeqリードを加工し、IgBLASTおよびIMGT/HighV−QUESTにより注釈付けし、カスタムスクリプトおよびChange−Oパッケージで加工して、統計量および図を生成した。Illuminaソフトウェアを使用して、MiSeqリードのマルチプレックス処理を解除した。Phredクォリティーが5未満の位置は、Nでマスキングした。アイソタイプ特異的プライマー、液滴バーコード(DB)、および分子バーコード(MB)を、アンプリコン内で同定し、pRESTO MaskPrimers−cutを使用し、最大のエラーを0.2として、トリミングした。リード1のコンセンサス配列およびリード2のコンセンサス配列は、DBとMBとを一緒に含む固有分子識別子(UMI)によって群分けされたリードから各mRNAにつき別々に生成されたものであり、このUMIは、同じ起源のmRNA分子から生じるPCR複製物である。UMIリード群は、MUSCLEによりアラインし、以下のパラメータ:maxdiv=0.1;bf PRIMER;prfreq=0.6;maxmiss=0.5;q=5;リード群について判定されたPCRプライマー配列の一致≧60%;最大のヌクレオチド多様性=0.1;インデル位置について多数決を使用すること;および事後(コンセンサス)クォリティーの低いアライメントカラムのマスキングにより、pRESTOを使用して、コンセンサス配列を構築した。次いで、ペアドエンドコンセンサス配列を、2ラウンドでスティッチングした。第1に、各リード対のコンセンサス配列末端の、ギャップを施さないアライメントを、Zスコア近似を使用して最適化し、以下のパラメータ:最小の長さ=8;アルファ1×10
−5;および最大のエラー=0.3により、pRESTO AssemblePairs−alignにおいて実装される、二項検定のp値によりスコア付けした。この方式でスティッチングできないリード対については、pRESTOのAssemblePairs−referenceパラメータ:最小の同一性=0.5;e値1×10
−5を使用する、スティッチングまたはギャップを施したリード結合の前に、各リードの足場を組むように、ヒトBCRおよびTCR生殖細胞系列のVエクソンを使用して、スティッチングを試みた。
【0349】
(実施例10)
V(D)Jセグメントの注釈付けおよびアイソタイプの確認
IgBLAST、Change−O、およびカスタムスクリプトを使用して、元の生殖細胞系列V(D)J遺伝子を同定し、mRNA配列を、V(D)J領域に照らしてトリミングし、CDR3領域を同定し、生殖細胞系列Vヌクレオチド配列からの変異を計算した。IgBLASTでは、Nをミスマッチとしてカウントするが、V領域におけるNが6つを超えるmRNA配列には、変異解析および交差画分対合についての精度解析のためにフィルターをかけた。Ig重鎖については、pRESTO MaskPrimers−scoreパラメータ:start=0;最大のエラー=0.2を使用して、非プライマーC領域(定常領域エクソン)を、期待される配列とマッチさせることにより、アイソタイプの同一性を確認した。プライマー/非プライマーC領域による判定が一致しないアンプリコンは、目視により、特異的なプライマークロストークイベントを解決した、2つのプライマー/非プライマーの組合せを除き、棄却した。
【0350】
(実施例11)
V(D)J配列の、クローン系統への群分け
重み付けされたクローン内距離による、単一連関クラスタリングを使用して、V(D)J配列を、クローンへと群分けした。クラスタリングは、Change−OパッケージのDefineClones−by−groupパラメータ:model=m1n;遺伝子=第1;dist=4.0;norm=なしにより実施した。第1に、同じ初期組換えイベントから生じた可能性がある配列が、併せてビニングされる(マッチが最良のIgV
H遺伝子、マッチが最良のIgJ
H遺伝子、およびIMGT/HighV−QUESTにより同定される結合部の長さに基づき)ように、全ての機能的なIgV
H鎖の液滴コンセンサス配列を、V−J結合部ビンへとビニングした。クローン内距離の閾値は、Change−OのshmパッケージのdistToNearest関数を使用して、各IgV
Hビン内の最近傍距離についてのヒストグラムを生成し、ヒストグラムを、自然距離カットオフ(二峰性のヒストグラムのトラフ内)について目視することにより選び出した。軽鎖のクローンクラスターは、同じ距離モデルおよび閾値を使用して規定した。
【0351】
(実施例12)
液滴のフィルタリング、対合忠実度の計算
重鎖−軽鎖対合の信頼度を2つの独立の方式で:液滴内のmRNA配列の一致と、複製物対間のmRNA配列一致とを使用して評価した。液滴内のmRNAの一致は、遺伝子座内のV(D)J配列についての、対応のあるヌクレオチド差異の平均値(Neiによるパイ<0.02)として規定した。mRNA配列は、IgBLASTによる注釈付けを使用して、V(D)Jヌクレオチドコード配列へとトリミングした。各液滴内で、全ての有効なmRNA配列を、V遺伝子座により群分けした。各群内では、デフォルトのパラメータを使用するpRESTO AlignSets内で実装されるMUSCLEを使用して、複数の配列をアラインした。液滴コンセンサス鎖は、pRESTOパラメータ:BuildConsensus.py;maximum div=0.2;maximum miss=0.5を使用して、遺伝子座1つ当たり複数のmRNAから構築した。ランダムにシャッフルされた液滴を使用して、多様性のカットオフであるパイ≦0.02を選択した。シャッフルされた液滴内で、重鎖遺伝子座の0.01%未満(軽鎖遺伝子座の<0.2%)がこの基準を満たした。複数の細胞または免疫受容体を含む液滴を、さらなる精度解析のために分離した。
【0352】
対合の精度は、単一の系統、すなわち、単一のV(D)JおよびVJ再構成に続く拡大から生じる系統だけを含有する可能性が高いVDJクラスターに焦点を当てた、複数の複製物(別個のエマルジョン実験)にわたる同じクローン対についての観察に基づき計算した。天然では、複数の異なる軽鎖VJ再構成と対合する、同じ重鎖V(D)J再構成をもたらす、類似のVDJ再構成は、個々の複数の独立の時間以内で生じうる。V(D)J再構成が、本明細書で記載される方法により達成される技法上の精度のより正確な尺度をもたらすことは希少であるため、長鎖である重鎖CDR3(CDR3
H)を、この解析の焦点とした(より希少なV(D)J再構成の代用物として)。また、>6Nを有する配列も除去して、クローンへの割り当ての信頼度を増大させた。対合の精度は、画分にわたり観察される、最長四分位のクローン(結合部長≧54ntである2,604のクローン)について、CDR3
Hの長さと共に、96%超まで増大した。クローン対一致の確率は、2つの独立の実験における、真の対の結合の確率であるため、対合の精度は、複製物にわたる、対合の一致についての平方根であって、以下の式[式中、
【数1】
は、重鎖クローンhと、軽鎖クローンlとの対を有し、物理的画分f内で見出される、液滴バーコードの数dである]の通りに計算される平方根として推定した。各実験についての対合の精度の平均値(平方)は、重鎖クローンhおよび全ての画分の対(f、g)にわたり、対合した軽鎖クローン(l、k)の一致を平均すること:
【数2】
により、推定する。
【0353】
したがって、この例示的な実験に従う、各実験についての平均値精度(実験間の精度の分散の範囲内の)は、96.1%であった。
【0354】
(実施例13)
HIV系統進化解析
HIVに対する新しい広域中和抗体(bNAb)は、本発明者らのハイスループットの抗体対の公知のbNAbとの類似性に関して加工された配列により、発見した。PGTドナーおよび他のドナーに由来する既知のbNAbを、文献から取り出した。エマルジョンから回収された、全てのHIV IgH mRNAを、公知のCDR3アミノ酸配列との類似性について、tblastx 10によりスコア付けした。健常ドナーに由来するIgH mRNA配列を使用して、配列類似性のバックグラウンドの分布を生成し、27のビットスコアカットオフを使用して、候補bNAb様CDR3を、さらなる解析のために区別した。デフォルトのパラメータによるMUSCLE 11を使用して、候補配列のV(D)J配列を、公知のbNAbに照らしてアラインしたが、特に、gapopen=−15を除き、デフォルトのパラメータを使用して、PGTドナー系統に照らしてアラインした。PhyMLのデフォルトのパラメータにより、系統樹を生成し、操作し、Newick UtilsおよびDendroscopeにより視覚化し、手作業で精査して、公知のbNAb配列と共に散在する免疫グロブリン重鎖配列を選択した。各液滴のコンセンサス配列は、任意の液滴内アミノ酸の不一致についてのアライメントに対する手作業による精査を、JALVIEWにおいて使用して、既に記載した通りに構築した。8つの重鎖配列およびこれらの天然で対合する軽鎖抗体配列を、合成、クローニング、発現、および中和アッセイのために選択した。
【0355】
(実施例14)
データ解析およびプロッティング
プロットは、dplyrおよびggplot2Rパッケージを使用して生成した。データは、散布図による視覚化だけを目的として、ランダムにダウンサンプリングし、かつ/またはRによるジッター付加を施した。ダウンサンプリングの最小は、アイソタイプ1つ当たり20,000の液滴であるか、または他の形で言及される通りであった。同じ一様な確率分布から取り出された、垂直方向および水平方向のノイズを添加することにより、mRNA単位については、最大≦0.2とし、変異については、最大≦0.6%として、データ点にジッター付加を施した。