(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-10-17
(54)【発明の名称】表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトームの分析のためのRNAシークエンス法
(51)【国際特許分類】
C12N 15/09 20060101AFI20221007BHJP
C12N 15/11 20060101ALI20221007BHJP
C12Q 1/6876 20180101ALI20221007BHJP
C12Q 1/686 20180101ALI20221007BHJP
C12Q 1/6869 20180101ALI20221007BHJP
C12Q 1/68 20180101ALI20221007BHJP
C12Q 1/04 20060101ALI20221007BHJP
C12M 1/00 20060101ALI20221007BHJP
C12M 1/34 20060101ALI20221007BHJP
【FI】
C12N15/09 Z
C12N15/11 Z ZNA
C12Q1/6876 Z
C12Q1/686 Z
C12Q1/6869 Z
C12Q1/68
C12Q1/04
C12M1/00 A
C12M1/34 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022507320
(86)(22)【出願日】2020-08-07
(85)【翻訳文提出日】2022-03-08
(86)【国際出願番号】 EP2020072223
(87)【国際公開番号】W WO2021023853
(87)【国際公開日】2021-02-11
(32)【優先日】2019-08-08
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】591100596
【氏名又は名称】アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル
(71)【出願人】
【識別番号】595040744
【氏名又は名称】サントル・ナショナル・ドゥ・ラ・ルシェルシュ・シャンティフィク
【氏名又は名称原語表記】CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE
(71)【出願人】
【識別番号】511025226
【氏名又は名称】ユニヴェルシテ デクス-マルセイユ
【氏名又は名称原語表記】UNIVERSITE D’AIX-MARSEILLE
【住所又は居所原語表記】Jardin du Pharo, 58, Bld Charles Livon, F-13284 Marseille cedex 07, France
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】ミルピエ,ピエール
(72)【発明者】
【氏名】アタフ,ヌジュッド
(72)【発明者】
【氏名】セルベラ-マルツァル,イニャキ
(72)【発明者】
【氏名】ジル,ラウリーヌ
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029AA23
4B029BB16
4B029BB17
4B029BB20
4B029FA12
4B029FA15
4B063QA13
4B063QQ08
4B063QQ28
4B063QQ42
4B063QQ46
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR62
4B063QR77
4B063QS25
4B063QX02
(57)【要約】
シングルセルRNAシークエンス(scRNAseq)は、組織における細胞型の同定、特徴付け、及び定量を可能とする。適応免疫系のT細胞及びB細胞に焦点を当てた場合、scRNAseqは、その抗原受容体(それぞれT細胞受容体又はB細胞受容体)の固有な再編成配列を通して、分析された各細胞のクローン系統を追跡する能力を有し、そしてそれを、トランスクリプトーム分析から推測される機能的状態に連関させる。T細胞及びB細胞のscRNAseqのデータセットからクローン性及び成熟状態(B細胞受容体に関してのみ)を推測するコンピューターアプローチが開発されたが、それらは、厄介であり、費用対効果は高くない。本発明者らは今回、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析のための、FACSに基づいた5’末端RNAseq法、特にFACSに基づいた5’末端scRNAseq法を開発した。特に、本発明の方法は、多くの異なるウェル特異的な鋳型乗換えオリゴヌクレオチド(TSO)を使用して、cDNAの5'末端にウェル特異的なDNAバーコードを導入する、逆転写工程を含む。
【特許請求の範囲】
【請求項1】
-5’末端PCRハンドル配列、
-バーコード配列、
-固有分子識別子(UMI)配列、
-インスレーター配列、及び
-3個のリボグアノシン(rG)からなる3’末端配列
を含むことを特徴とする、鋳型乗換えオリゴヌクレオチド(TSO)。
【請求項2】
5’末端PCRハンドル配列が、AGACGTGTGCTCTTCCGATCT(配列番号1)の配列からなる、請求項1記載のTSO。
【請求項3】
バーコード配列が、配列番号2から配列番号97、及び配列番号233から配列番号251からなる群より選択される、請求項1記載のTSO。
【請求項4】
配列番号99から配列番号194からなる群より選択される配列からなる、請求項1記載のTSO。
【請求項5】
請求項1記載の鋳型乗換えオリゴヌクレオチド(TSO)の存在下において逆転写反応を実施する工程を含む、RNA分子に対して相補的であるDNA(すなわちcDNA)を調製するための方法。
【請求項6】
-A)RNA試料を準備する工程、
-B)請求項5記載の方法を実施することによって、該RNA分子の逆転写(RT)を行なう工程、
-C)工程B)で得られたcDNAを増幅する工程、
-D)cDNAをプール及び精製する工程、
-E)cDNAライブラリーを調製する工程、及び
-F)該cDNAライブラリーをシークエンスする工程
を含む、RNAシークエンス法。
【請求項7】
-A)単一細胞を単離する工程、
-B)単一細胞を溶解し、RNA分子を抽出する工程、
-C)請求項5記載の方法を実施することによって、該RNA分子の逆転写(RT)を行なう工程、
-D)工程C)で得られたcDNAを増幅する工程、
-E)cDNAをプール及び精製する工程、
-F)cDNAライブラリーを調製する工程、及び
-G)該cDNAライブラリーをシークエンスする工程
を含む、シングルセルRNAシークエンス法。
【請求項8】
逆転写(RT)工程が、96個の異なるウェル特異的な鋳型乗換えオリゴヌクレオチド(TSO)を使用して、cDNAの5'末端にウェル特異的なDNAバーコードを導入し、該鋳型乗換えオリゴヌクレオチドは配列番号99~194の配列である、請求項6又は7記載の方法。
【請求項9】
B細胞及びT細胞に適用される、請求項6又は7記載の方法。
【請求項10】
溶解が、リボヌクレアーゼ阻害剤、ある量のdNTP、及び配列TGCGGTATCTAAAGCGGTGAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN(配列番号195)からなる、ポリアデニル化mRNAの逆転写を開始し、cDNA分子の3’末端にユニバーサルPCRハンドルを組み込むのに適したある量のプライマーを含む、溶解混合物を用いて行なわれ、ここでのVは、dG、dA、又はdCのいずれかを示し、NによってdA、dT、dG、又はdCを示す、請求項7記載の方法。
【請求項11】
PCRベースの増幅が、正方向プライマーについては配列AGACGTGTGCTCTTCCGATCT(配列番号196)及び逆方向プライマーについては配列TGCGGTATCTAAAGCGGTGAG(配列番号197)からなる、一対のプライマーを使用する、請求項6又は7記載の方法。
【請求項12】
cDNAライブラリーの調製工程が、前の工程で精製されたcDNAを、配列番号214~229に示されるような複数のアダプター配列を用いてのタグメンテーション反応にかける工程からなる、請求項6又は7記載の方法。
【請求項13】
cDNAライブラリーのシークエンス工程が、配列番号230~232のプライマーを用いて行なわれる、請求項6又は7記載の方法。
【請求項14】
被験者の表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したBCRとTCRのレパートリーについての費用対効果の高い統合分析のための、請求項6又は7記載の方法の使用。
【請求項15】
配列情報、V、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体の使用の表示、V、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体及び固有な配列の量の表示;突然変異の頻度の表示、VJ、V、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体の使用の相関測度を含む、データセットを得るための、請求項14記載の使用。
【請求項16】
結果が、レパートリー分析のデータベースに出力されるか又は保存され、そしてこれを参照又は対照のレパートリーと比較して使用することにより、所望の分析が行なわれる、請求項15記載の使用。
【請求項17】
被験者の免疫応答を診断するための、あるいは治療後若しくは治療中の免疫応答の確立をモニタリングするための、あるいはワクチン応答を評価するための、あるいはリンパ腫で起こるクローン性再編成及び/又は染色体転座を評価するための、あるいは移植片拒絶に至る可能性のある免疫応答を評価するための、あるいは被験者の免疫老化を評価するための、あるいは免疫不全を診断するための、請求項14記載の使用。
【請求項18】
(a)動物を関心対象の抗原を用いて免疫化する工程;(b)複数のB細胞を免疫化動物から単離する工程;(c)請求項6記載のシングルセルRNAシークエンス法を実施することによって、複数のB細胞を特徴付ける工程、及び(d)関心対象の抗体の配列を提供する工程を含む、関心対象の抗原に特異的に結合する抗体を選択するための方法。
【請求項19】
請求項1記載の複数のTSOを含むキット。
【請求項20】
配列番号99から配列番号194の96個のTSOを含む、請求項19記載のキット。
【請求項21】
細胞選別用の一団の抗体、プライマー、dNTP、アダプター配列、又は他の合成後の標識用試薬、例えば蛍光色素の化学的に活性な誘導体、酵素、例えば逆転写酵素、DNAポリメラーゼ、RNAポリメラーゼ、トランスポザーゼなど、様々な緩衝媒体、例えばハイブリダイゼーション用緩衝液及び洗浄用緩衝液、精製用ビーズなどをさらに含む、請求項19記載のキット。
【請求項22】
統計分析用のソフトウェアパッケージをさらに含み、及び2つのレパートリーの間で一致する確率を計算するための参照データベースを含み得る、請求項19記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野:
本発明は、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトームの分析のためのRNAシークエンス(RNAseq)法、特に、シングルセルRNAシークエンス(scRNAseq)法に関する。
【0002】
発明の背景:
シングルセルRNAシークエンス(scRNAseq)は、組織における細胞型の同定、特徴付け、及び定量を可能とする。適応免疫系のT細胞及びB細胞に焦点を当てた場合、scRNAseqは、その抗原受容体(それぞれT細胞受容体又はB細胞受容体)の固有な再編成された配列を通して、分析された各細胞のクローン系統を追跡する能力を有し、そしてそれを、トランスクリプトーム分析から推測される機能的状態に関連づける。
【0003】
T細胞及びB細胞のscRNAseqのデータセットからクローン性及び成熟状態(B細胞受容体に関してのみ)を推測するコンピューターアプローチが開発されたが、これまで、それらは、厄介な完全長のシークエンスプロトコール(Smart-seq2)によって作成されたデータ、又は5’末端scRNAseqプロトコールからPCRで増幅されたアンプリコンライブラリーの費用のかかる追加のシークエンス(テンエックス・ゲノミクス)のいずれかに依拠する。
【0004】
Smart-seq2(又は任意の他の完全長のプレートに基づいたscRNAseq法)は、表現型の規定されたFACSにより選別された細胞の詳細な分析を可能とするが、それは費用がかかり、労働集約的であり、ライブラリー調製中の増幅の偏りを修正するための固有分子識別子(UMI)の使用を可能としない。
【0005】
逆に、テンエックス・ゲノミクス(又は任意の他の液滴ベースのscRNAseq法)はUMIを組み込み、比較的安価かつ実施が簡単であるが、scRNAseqリードからの表現型の規定された細胞の正確な選択、又はB細胞受容体及びT細胞受容体のレパートリーの直接的再構築を可能とせず、そして感度が低い。
【0006】
よって、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析のための、scRNAseq法が依然として必要である。
【0007】
発明の要約:
本発明は、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトームの分析のためのRNAシークエンス(RNAseq)法に関する。特に、本発明は、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトームの分析のためのシングルセルRNAシークエンス(scRNAseq)法に関する。特に、本発明は特許請求の範囲によって定義される。
【0008】
本発明の詳細な説明:
本発明者らは今回、表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析のための、FACSに基づいた5’末端scRNAseq法を開発した。特に、本発明の方法は、多くの異なるウェル特異的な鋳型乗換えオリゴヌクレオチド(TSO)を使用して、cDNAの5'末端にウェル特異的なDNAバーコードを導入する、逆転写工程を含む。
【0009】
本発明の鋳型乗換えオリゴヌクレオチド及び逆転写のためのその使用
したがって、本発明の第一の目的は、
-5’末端PCRハンドル配列、
-バーコード配列、
-固有分子識別子(UMI)配列、
-インスレーター配列、及び
-3個のリボグアノシン(rG)からなる3’末端配列
を含むことを特徴とする、鋳型乗換えオリゴヌクレオチド(TSO)に関する。
【0010】
いくつかの実施態様では、本発明は、
-5’末端PCRハンドル配列、
-バーコード配列、
-固有分子識別子(UMI)配列、
-インスレーター配列、及び
-3個のリボグアノシン(rG)からなる3’末端配列
を順番にかつ連続して含むことを特徴とする、鋳型乗換えオリゴヌクレオチド(TSO)に関する。
【0011】
本明細書において使用する「ヌクレオチド」という用語は、糖に結合したリン酸基を含んでいる、糖、通常はリボース又はデオキシリボース、及びプリン塩基又はピリミジン塩基(「ヌクレオシド」)を示す。本明細書において使用する「ピリミジンヌクレオシド」又は「py」という用語は、ヌクレオシドの塩基成分がピリミジン塩基(例えばシトシン(C)又はチミン(T)又はウラシル(U))である、ヌクレオシドを指す。同様に、「プリンヌクレオシド」又は「pu」という用語は、ヌクレオシドの塩基成分がプリン塩基(例えばアデニン(A)又はグアニン(G))であるヌクレオシドを指す。
【0012】
本明細書において使用する「ポリヌクレオチド」及び「核酸」という用語は同義語として使用され、任意の長さのヌクレオチドのポリマーを指し、これにはDNA及びRNAが挙げられる。ヌクレオチドは、デオキシリボヌクレオチド、リボヌクレオチド、修飾されたヌクレオチド若しくは塩基、及び/又はそれらの類似体、又はDNA若しくはRNAポリメラーゼによってポリマーに取り込まれ得る任意の基質であり得る。ポリヌクレオチドは、修飾されたヌクレオチド、例えばメチル化ヌクレオチド及びそれらの類似体を含み得る。
【0013】
本明細書において使用する「3’」という用語は方向に関して使用される場合、一般的にポリヌクレオチド又はオリゴヌクレオチド内の別の領域又は位置の3’(下流)にある同ポリヌクレオチド又はオリゴヌクレオチド内の領域又は位置を指す。
【0014】
本明細書において使用する「5’」という用語は方向に関して使用される場合、一般的にポリヌクレオチド又はオリゴヌクレオチド内の別の領域又は位置の5’(下流)にある同ポリヌクレオチド又はオリゴヌクレオチド内の領域又は位置を指す。
【0015】
本明細書において使用する「オリゴヌクレオチド」という用語は、一般的にであって必ずしもではないが、約200ヌクレオチド長未満である、短い、一般的には一本鎖の、一般的には合成のポリヌクレオチドを指す。本発明のオリゴヌクレオチドは、ゲノム又はcDNAを含む、既存の核酸源から得ることができるが、好ましくは合成法によって作製される。いくつかの実施態様では、各ヌクレオシド単位は、野生型オリゴヌクレオチドと比較して、修飾されたヌクレオシド塩基及び/又は修飾された糖単位を含むがこれらに限定されない、様々な化学的な修飾及び置換を包含し得る。化学的修飾の例は当業者には公知であり、例えば、Uhlmann E et al. (1990) Chem. Rev. 90:543;「Protocols for Oligonucleotides and Analogs」に記載されている。ヌクレオチド、それらの誘導体、及びその合成は、Habermehl et al.、Naturstoffchemie、第3版、 Springer、2008に記載されている。
【0016】
本明細書において使用する「鋳型乗換えオリゴヌクレオチド」又は「TSO」という用語は、プライマー伸長終結部位の5’の位置で鋳型にハイブリダイズすることができる部分(又は領域)を含み、かつ、一般的には鋳型にハイブリダイズしない配列に因り、DNAポリメラーゼによるプライマー伸長プロセスにおいて鋳型の乗換えを起こすことができる、オリゴヌクレオチドを指す。
【0017】
本明細書において使用する「PCRハンドル配列」という用語は、PCR増幅を可能とするであろう、任意の核酸配列を指す。典型的には、該配列は、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、又は25個のヌクレオチドを含む。いくつかの実施態様では、該配列は、21個のヌクレオチドを含む。いくつかの実施態様では、該配列は、AGACGTGTGCTCTTCCGATCT(配列番号1)からなる。
【0018】
本明細書において使用する「核酸バーコード配列」という用語は、核酸バーコードがコンジュゲートしている1つ以上の第一の分子を、1つ以上の第二の分子から同定及び/又は識別するために使用され得る、配列を有する核酸を指す。核酸バーコード配列は典型的には短く、例えば約5~20塩基長であり、そして、関心対象の1つ以上の標的分子又はその増幅産物にコンジュゲートしていてもよい。核酸バーコード配列は、一本鎖であっても、二本鎖であってもよい。
【0019】
いくつかの実施態様では、バーコード配列は、DNAバーコード配列である。
【0020】
いくつかの実施態様では、バーコード配列は、
【表1】
からなる群より選択される。
【0021】
本明細書において使用する「固有分子識別子(UMI)配列」又は「UM配列」という用語は、UMIがコンジュゲートしている、1つ以上の第一の分子を、1つ以上の第二の分子から同定及び/又は識別するために使用され得る、配列を有する、核酸を指す。UMIは典型的には短く、例えば約4から10塩基長であり、典型的には4個、5個、6個、7個、8個、9個、又は10個のヌクレオチドを含む。本発明によると、UMI配列は、ランダムな配列からなる。本明細書において使用する「ランダムな配列」という用語は、各ヌクレオチドの位置に任意の天然又は修飾されたヌクレオチドを含有している、デオキシリボヌクレオチド、リボヌクレオチド、又はデオキシリボヌクレオチド/リボヌクレオチドの混合した配列として定義される。いくつかの実施態様では、UMI配列は、5ヌクレオチド長のランダムな配列NNNNNからなり、ここでのNは任意のヌクレオチドを示す。
【0022】
本明細書において使用する「インスレーター配列」という用語は、3個、4個、5個、6個、7個のヌクレオチドからなる任意の配列を指す。いくつかの実施態様では、該配列は、TATA(配列番号98)からなる。
【0023】
本明細書において使用する「リボグアノシン」又は「rG」という用語は、当技術分野におけるその一般的な意味を有し、プリンデオキシリボヌクレオシドを指し、これは、RNA分子を構成する4つの標準的なヌクレオシドの1つである。リボースの2’位における-OH基の存在により、RNAは、DNA(これはこの位置の-OH基を欠失している)より安定性が低くなる。なぜなら、この2’ヒドロキシル基は、RNAの糖-リン酸骨格において隣接しているホスホジエステル結合を化学的に攻撃する可能性があり、これにより骨格構造は切断されるからである。rGは、RNA二本鎖においてrC(リボシトシン/シトシン)と、又はRNA-DNA二本鎖においてdC(デオキシリボシトシン)と、ワトソンクリック塩基対を形成する。
【0024】
いくつかの実施態様では、本発明のTSOは、配列AGACGTGTGCTCTTCCGATCTXXXXXXXXNNNNNTATArGrGrGからなり、ここでの配列XXXXXXXXはDNAバーコード配列を示し、配列NNNNNはUMI配列を示す。
【0025】
いくつかの実施態様では、本発明のTSOは、以下からなる群より選択される配列からなる:
【表2】
【0026】
本発明のさらなる目的は、RNA分子に対して相補的であるDNA(すなわちcDNA)を調製するための方法に関し、該方法は、本発明の鋳型乗換えオリゴヌクレオチド(TSO)の存在下において逆転写反応を実施する工程を含む。
【0027】
本発明によると、TSOは、鋳型の乗換えを可能とする。本明細書において使用する「鋳型の乗換え」反応という用語は、2つの鋳型(これらは、ホスホジエステル結合によって互いに共有結合していない)を順番に使用した、DNAポリメラーゼによる、鋳型依存的な相補鎖の合成プロセスを指す。合成された相補鎖は、両方の鋳型に対して相補的である、1本の連続した鎖であろう。典型的には、第一の鋳型はポリA+RNAであり、第二の鋳型は鋳型乗換え又は「キャップ乗換え」オリゴヌクレオチドである。
【0028】
本明細書において使用する「逆転写酵素」という用語は、鋳型としてポリA+RNA又は全RNAを使用した第一鎖のcDNA合成に使用され得る、逆転写酵素活性を有する任意のDNAポリメラーゼとして定義される。本発明の方法に使用され得る逆転写酵素の例としては、高温菌及び古細菌(archaebacteria)、レトロウイルス、酵母、ニューロスポラ属(Neurospora)、ショウジョウバエ属、霊長類及びげっ歯類などの生物に由来するDNAポリメラーゼが挙げられる。好ましくは、DNAポリメラーゼは、モロニーマウス白血病ウイルス(M-MLV)(米国特許第4,943,531号)又はリボヌクレアーゼ(RNase)H活性を欠失したM-MLV逆転写酵素(米国特許第5,405,776号)、ヒトT細胞白血病ウイルスI型(HTLV-1)、ウシ白血病ウイルス(BLV)、ラウス肉腫ウイルス(RSV)、ヒト免疫不全ウイルス(HIV)、又はサーマス・アクアティカス(Thermus aquaticu)(Taq)又はサーマス・サーモフィルス(Thermus thermophilus)(Tth)(米国特許第5,322,770号)から単離される。他の例としては、RNaseH活性を欠失したMMLV関連の逆転写酵素、例えばSUPER-SCRIPT II(インビトロジェン社)、POWER SCRIPT(BDバイオサイエンシーズ社)及びSMART SCRIBE(クロンテック社)が挙げられる。これらのDNAポリメラーゼは、生物それ自体から単離されても、又は場合によっては、商業的に得られてもよい。対象の本発明に有用な逆転写酵素はまた、ポリメラーゼをコードしているクローニングされた遺伝子を発現している細胞から得られてもよい。
【0029】
典型的には、逆転写酵素反応は、反応を実施するのに必要な他の成分、例えば、デオキシリボヌクレオシド三リン酸のATP、CTP、GTP、及びTTP、Mg2+、最適な緩衝液などの適切な量の存在下においてサーマルサイクラーを用いて行なわれる。いくつかの実施態様では、反応は、ベタインなどのメチル基ドナーの存在下において実施される。本発明によると、「サーマルサイクラー」は、反応プロセス、特にポリメラーゼ連鎖反応に関するサーマルサイクルを実施するための、実験機具又は装置である。サーマルサイクラーは、環境の温度を上下することができ、この中の微小環境が、個別に予め決定された工程で提供される。いくつかの実施態様では、反応は、42℃で90分間インキュベートし、続いて、(50℃で2分間、42℃で2分間)を10サイクル、続いて70℃で15分間のインキュベーションによる逆転写酵素の不活化によって行なわれる。
【0030】
本発明のRNAシークエンス(RNAseq)法
本発明のTSO及び逆転写法は、RNAシークエンス(RNAseq)法に使用するのに適している。
【0031】
したがって、本発明のさらなる目的は、
A)RNA試料を準備する工程、
B)該RNA分子の逆転写(RT)を行なう工程、
D)工程C)で得られたcDNAを増幅する工程、
E)cDNAをプール及び精製する工程、
F)cDNAライブラリーを調製する工程、及び
G)該cDNAライブラリーをシークエンスする工程
を含む、RNAシークエンス法に関する。
【0032】
本明細書において使用する「RNA試料」という用語は、大きな細胞集団に由来するRNA分子を含んでいる試料を指す。RNA試料は、全RNA及び/又はメッセンジャーRNA(mRNA)を含むがこれらに限定されない。
【0033】
いくつかの実施態様では、RNA分子はmRNA分子である。
【0034】
いくつかの実施態様では、RNAシークエンス法は、シングルセルRNAシークエンス法である。
【0035】
したがって、本発明のTSO及び逆転写法は、シングルセルRNAシークエンス(scRNAseq)法における使用に適している。
【0036】
したがって、本発明のさらなる目的は、
A)単一細胞を単離する工程、
B)単一細胞を溶解し、RNA分子を抽出する工程、
C)該RNA分子の逆転写(RT)を行なう工程、
D)工程C)で得られたcDNAを増幅する工程、
E)cDNAをプール及び精製する工程、
F)cDNAライブラリーを調製する工程、及び
G)該cDNAライブラリーをシークエンスする工程
を含む、シングルセルRNAシークエンス法に関する。
【0037】
前記工程の実施態様は、以下のように記載される:
【0038】
A)単一細胞の単離
工程は、単一細胞を単一の容器に単離することからなる。
【0039】
本発明のscRNAseq法は、任意の種類の細胞に適用され得る。しかしながら、該方法は、B細胞及びT細胞、特に、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析に適切に適用され得る。
【0040】
本明細書において使用する「B細胞」という用語は、適応免疫系の体液性免疫における一種のリンパ球を指す。B細胞は主に、抗体を作製するように機能し、抗原提示細胞としての役目を果たし、サイトカインを放出し、そして抗原との相互作用による活性化後に記憶B細胞を発達させる。B細胞は、細胞表面上のB細胞受容体の存在によって、他のリンパ球から区別される。いくつかの実施態様では、B細胞は、記憶B細胞である。いくつかの実施態様では、B細胞は制御性B細胞である。「制御性B細胞」(Breg)は、免疫応答を抑制するB細胞である。制御性B細胞は、T細胞の活性化を直接的に又は間接的にのいずれかで抑制することができ、また、抗原提示細胞、他の自然免疫細胞、又は他のB細胞も抑制し得る。制御性B細胞は、CD1dhiCD5陽性であり得るか、あるいは、多くの他のB細胞マーカーを発現及び/又は他のB細胞サブセットに属し得る。これらの細胞はまた、IL-10を分泌する場合もある。制御性B細胞はまた、TIM-1も発現し、例えばTIM-1陽性CD19陽性B細胞である。B細胞には、例えば、形質B細胞、記憶B細胞、B1細胞、B2細胞、辺縁帯B細胞、及び濾胞B細胞なども含まれる。例示的なB細胞表面マーカーとしては、CD10、CD19、CD20、CD21、CD22、CD23、CD24、CD37、CD53、CD72、CD73、CD74、CDw75、CDw76、CD77、CDw78、CD79a、CD79b、CD80、CD81、CD82、CD83、CDw84、CD85、及びCD86の白血球表面マーカーが挙げられるがこれらに限定されない。特に関心の高いB細胞表面マーカーは、哺乳動物の他のB細胞ではない組織と比較して、B細胞上に優先的に発現されている。1つの実施態様では、該マーカーは、CD20又はCD19のようなものであり、これは幹細胞段階から形質細胞への終末分化の直前の時点までの系統分化の全期間を通して、B細胞上に見られる。
【0041】
本明細書において使用する「T細胞」という用語は、細胞性免疫において重要な役割を果たしている一種のリンパ球を指し、これは細胞表面上のT細胞受容体の存在により、B細胞などの他のリンパ球から区別される。いくつかのT細胞のサブセットが記載されており、これには典型的には、特記されない限り、ヘルパーT細胞(例えばTh1、Th2、Th9、及びTh17細胞)、細胞障害性T細胞、記憶T細胞、制御性/抑制性T細胞(Treg細胞)、ナチュラルキラーT細胞、[ガンマ/デルタ]T細胞、及び/又は自己攻撃性T細胞(例えばTH40細胞)が挙げられる。いくつかの実施態様では、「T細胞」という用語は、具体的にはヘルパーT細胞を指す。いくつかの実施態様では、「T細胞」という用語は、より具体的にはTH17細胞(すなわち、IL-17を分泌するT細胞)を指す。いくつかの実施態様では、「T細胞」という用語は、制御性T細胞を指す。
【0042】
本明細書において使用する、本明細書において使用されるような「CD4陽性T細胞」という用語は、マクロファージ及びCD8陽性T細胞の活性化(Th1細胞)、B細胞による抗体の産生を調整するか(Th2細胞)、又は、自己免疫疾患において必要不可欠な役割を果たしていると考えられている(Th17細胞)のいずれかである、ヘルパーT細胞を指す。さらに、「CD4陽性T細胞」という用語はまた、CD4陽性T細胞の全集団の約10%に相当する、制御性T細胞も指す。制御性T細胞は、免疫応答を弱める際に、自己免疫疾患の防御において、及び経口免疫寛容において、必要不可欠な役割を果たしている。本明細書において使用する「天然の制御性T細胞」又は「制御性T細胞」という用語は、Treg細胞、Th3細胞、及びTr1細胞を指す。Tregは、表面マーカーCD4、CD25、CTLA4及び転写因子Foxp3の発現によって特徴付けられる。Th3及びTr1細胞は、CD4陽性T細胞であり、これらはそれぞれ、TGF-β(Th3細胞)又はIL-10(Trl細胞)の発現によって特徴付けられる。
【0043】
本明細書において使用する「CD8陽性T細胞」という用語は、当技術分野におけるその一般的な意味を有し、それらの表面上にCD8を発現しているT細胞サブセットを指す。それらはMHCクラスI拘束性であり、細胞障害性T細胞として機能する。「CD8陽性T細胞」はまた、細胞障害性Tリンパ球(CTL)、Tキラー細胞、細胞溶解性T細胞、又はキラーT細胞とも呼ばれる。CD8抗原は、免疫グロブリンスーパー遺伝子ファミリーのメンバーであり、主要組織適合性複合体クラスI拘束性相互作用における関連認識エレメントである。
【0044】
本明細書において使用する「制御性T細胞」又は「Treg細胞」という用語は、T細胞の活性、特にCD8陽性T細胞の細胞障害活性を抑制するか、阻害するか、又は妨げる細胞を指す。制御性T細胞は、i)胸腺由来Treg細胞(tTreg、以前「天然Treg細胞」と呼ばれた)、及びii)末梢由来Treg細胞(pTreg、以前「誘導性Treg細胞」と呼ばれた)を含む。本明細書において使用するtTregは、休止時に以下の表現型:CD4陽性CD25陽性FoxP3陽性を有する。pTreg細胞としては、例えば、Tr1細胞、TGF(腫瘍増殖因子)-βを分泌するTh3細胞、制御性ナチュラルキラーT細胞、制御性γδT細胞、制御性CD8陽性T細胞、及びダブルネガティブ制御性T細胞が挙げられる。本明細書において使用する「Trl細胞」という用語は、休止時に以下の表現型:CD4陽性CD25陰性CD127陰性を、活性化時には以下の表現型:CD4陽性CD25陽性CD127陰性を有する細胞を指す。Tr1細胞、1型制御性T細胞(1型Treg)、及びIL-10産生Tregは、本明細書において同じ意味で使用される。1つの実施態様では、Tr1細胞は、一部には、それらの固有なサイトカインプロファイルによって特徴付けられ得る:それらはIL-10及びインターフェロン(IFN)-γを産生するが、IL-4又はIL-2は殆ど又は全く産生しない。1つの実施態様では、Tr1細胞はまた、活性化時にIL-13を産生することができる。本明細書において使用する「Th3細胞」という用語は、以下の表現型:CD4陽性FoxP3陽性を有し、活性化時に高いレベルのTGF-βと、少量のIL-4及びIL-10を分泌することができ、IFN-γ又はIL-2は全く分泌しない細胞を指す。これらの細胞は、TGF-βに由来する。本明細書に使用する「制御性NKT細胞」という用語は、休止時に以下の表現型:CD161陽性CD56陽性CD16陽性を有し、Vα/Vβ11TCRを発現している細胞を指す。本明細書に使用する「制御性CD8陽性T細胞」という用語は、休止時に以下の表現型:CD8陽性CD122陽性を有し、活性化時に高いレベルのIL-10を分泌することができる細胞を指す。本明細書において使用する「ダブルネガティブ制御性T細胞」という用語は、休止時に以下の表現型:TCRαβ陽性CD4陰性CD8陰性を有する細胞を指す。本明細書において使用する「γδT細胞」という用語は、T細胞受容体の[γ][δ]ヘテロダイマーを発現するTリンパ球を指す。[α][β]Tリンパ球とは異なり、それらは、MHC分子による提示とは独立した機序を介して、非ペプチド抗原を認識する。γδT細胞の2つの集団が記載され得る:末梢血中の主要な集団に相当する、Vγ9Vδ2受容体を有するyδTリンパ球、及び、粘膜における主要な集団に相当し、末梢血には非常に少数しか存在しない、Vδ1受容体を有するγδTリンパ球。Vγ9Vδ2Tリンパ球は、細胞内病原体に対する免疫応答及び血液疾患に関与していることが知られている。
【0045】
典型的には、上記のような細胞、特にB細胞及びT細胞は、細胞選別によって単離される。本明細書において使用する「細胞選別」という用語は、細胞を溶液中で結合パートナー(例えば蛍光で検出可能な抗体)と混合する方法を指すために使用される。本発明によると、任意の慣用的な細胞選別法が使用され得る。蛍光活性化細胞選別(FACS)は、細胞選別法の一例である。本明細書において使用する「蛍光活性化細胞選別」又は「FACS」という用語は、試料の個々の細胞を、1つのファイルの中の狭い流れの中で、レーザービームを通過する時に、それらの光学特性(例えば吸光度、光散乱、及び蛍光特性など)により、それらを分析し、選別する方法を指す。蛍光活性化細胞選別は、特殊な種類のフローサイトメトリーである。それは、各細胞の特定の光散乱及び蛍光特徴に基づいて、生物学的細胞の不均一な混合物を、1回に1つの細胞の割合で、2つ以上の容器中に選別するための方法を提供する。それは、個々の細胞からの蛍光シグナルを迅速に、客観的に、かつ定量的に記録し、並びに、特に関心の高い細胞を物理的に分離するので、それは有用な科学的機器である。典型的なFACSシステムでは、細胞懸濁液は、急速に流れている狭い液体流の中心に載せられる。それらの直径に関して細胞間で大きく分離されるように、流れを整える。振動機序により、細胞流は、個々の液滴へと崩壊する。液滴中に1つを超える細胞が存在する確率が低くなるように、システムを調整する。流れが液滴へと崩壊する直前に、フローは蛍光測定ステーションを通過し、そこで各細胞の関心のある蛍光特徴が測定される。帯電リングは、流れが液滴に崩壊するちょうどその点に配置される。直前の蛍光強度測定値に基づいて電荷がリング上に置かれ、流れから液滴へと崩壊するにつれて、逆の電荷が液滴上に捕捉される。その後、帯電した液滴は、静電偏向システムを通って落下し、液滴はその荷電に基づいて転向して容器中に入る。いくつかのシステムでは、電荷は流れに直接アプライされ、崩壊して離れた液滴は、流れと同じ符号の電荷を保持する。その後、液滴へと崩壊して離れた後、流れは中性に戻る。FACS技術用の蛍光標識は、蛍光色素を励起するために使用されるランプ又はレーザーに、及び利用可能な検出器に依存する。シングルレーザー機械で最も一般的な利用可能なレーザーは、青色アルゴンレーザー(488nm)である。この種のレーザーで作動可能な蛍光標識としては、1)緑色蛍光では(通常、標識FL1):FITC、Alexa Fluor488、GFP(緑色蛍光タンパク質)、CFSE(カルボキシフルオレセインジアセテートスクシンイミジルエステル)、CFDA-SE(カルボキシフルオレセイン二酢酸サクシニミジルエステル)、及びDyLight488;2)オレンジ色蛍光では(通常FL2):PE(フィコエリトリン)及びPI(ヨウ化プロピジウム);3)赤色蛍光では(通常FL3):PerCP、PE-Alexa Fluor700、PE-Cy5(トリカラー)、及びPE-Cy5.5;及び4)赤外蛍光では(通常FL4;いくつかのFACS機械において):PE-Alexa Fluor750、及びPE-Cy7が挙げられるがこれらに限定されない。他のレーザー及びそれらの対応する蛍光標識としては、1)赤色ダイオードレーザー(635nm):アロフィコシアニン(APC)、APC-Cy7、Alexa Fluor700、Cy5、及びDraq-5;及び2)バイオレットレーザー(405nm):パシフィックオレンジ、アミンアクア(Amine Aqua)、パシフィックブルー、4’,6’-ジアミジノ-2-フェニルインドール(DAPI)、及びAlexa Fluor405が挙げられるがこれらに限定されない。
【0046】
したがって、FACSは典型的には、関心対象のいくつかの細胞表面マーカー(例えばB細胞についてはB細胞受容体、CD19又はCD20、T細胞についてはT細胞受容体、CD4、CD8、CD25)に特異的な一団の結合パートナーの使用を含む。したがって、結合パートナーは、上記のような蛍光標識にコンジュゲートしている。結合パートナーは、ポリクローナルであってもモノクローナルであってもよいが、好ましくはモノクローナルである抗体であり得る。別の実施態様では、結合パートナーは、1セットのアプタマーであってもよい。本発明のポリクローナル抗体又はその断片は、公知の技術に従って、適切な抗原又はエピトープを、選択された宿主動物、例えばブタ、ウシ、ウマ、ウサギ、ヤギ、ヒツジ、及びとりわけマウスに投与することによって発生させることができる。当技術分野において公知である様々なアジュバントを使用して、抗体の産生を増強させることができる。本発明の実施に有用な抗体は、ポリクローナル抗体であってもよいが、モノクローナル抗体が好ましい。本発明のモノクローナル抗体又はその断片は、細胞株の連続培養によって抗体分子の産生をもたらす、任意の技術を使用して調製及び単離され得る。産生及び単離のための技術としては、元来のハイブリドーマ技術;ヒトB細胞ハイブリドーマ技術;及びエプシュタイン・バーウイルス-ハイブリドーマ技術が挙げられるがこれらに限定されない。
【0047】
最後に、一旦、単一細胞が選別されたら、それらをマルチウェル容器に個々に沈着させる。好ましくは、該容器は、96ウェルプレートからなる。いくつかの実施態様では、いくつかの96ウェルプレートが調製される。いくつかの実施態様では、2個、3個、4個、5個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、又は20個のプレートが調製される。
【0048】
B)単一細胞の溶解及びRNA分子の抽出
工程は、mRNA分子を利用可能にするための、単一細胞の溶解からなる。
【0049】
単一細胞の溶解は、当技術分野において公知である任意の慣用的な方法に従って行なわれる。例えば、該方法は、溶解物を生成し、それに続いてmRNA分子を利用可能にするための条件下及び時間で、単一細胞を溶解混合物と接触させる工程を含む。
【0050】
典型的には、溶解混合物は、プロテアーゼ活性を有するポリペプチド、デオキシリボヌクレアーゼ活性を有するポリペプチド、及び界面活性剤を含む。例えば、溶解混合物は、プロテイナーゼK又は酵素的に活性なその突然変異体若しくは変異体、デオキシリボヌクレアーゼI、及び0.02%~3%、又は0.05%~2%、又は0.05%~1%の濃度のトリトンX-114(商標)、0.01%~5%、又は0.02%~3%、又は0.05%~2%、又は0.05%~1%、又は0.05%~0.5%、又は0.05%~0.3%の濃度のTHESIT(商標)、0.05%~3%、又は0.05%~1%、又は0.05%~0.3%の濃度のトリトンX-100(商標)、0.05%~5%、又は0.1%~3%、又は0.1%~2%、0.1%~1%、又は0.1%~0.3%、又は0.1%~5%の濃度のノニデットP-40(商標)、又はそれらの組合せを含む界面活性剤を含み得、ここでの溶解混合物は、実質的に陽イオンキレート剤を含まない。
【0051】
最も重要なことには、溶解混合物は、RNA分子の完全性を保つためのリボヌクレアーゼ(RNase)阻害剤を含む。本明細書において使用する「リボヌクレアーゼ(RNAse)阻害剤」という用語は、RNaseA、RNaseB、RNaseC、RNaseT1、RNaseH、RNaseP、RNaseI、及びRNaseIIIを含む、公知のリボヌクレアーゼのいずれか又は全ての活性を阻害する、タンパク質、タンパク質断片、ペプチド、又は小分子を指す。公知であるが以下に限定されないリボヌクレアーゼ阻害剤のいくつかの例としては、ScriptGuard(Epicentre Biotechnologies社、マジソン、ウィスコンシン州)、Superase-in(Ambion社、オースティン、テキサス州)、Stop RNase阻害剤(5 PRIME社、ゲイサーズバーグ、メリーランド州)、ANTI-RNase(Ambion社)、RNase阻害剤(クローニングされたもの)(Ambion社)、RNaseOUT(商標)(インビトロジェン社、カールズバッド、カリフォルニア州)、リボヌクレアーゼ阻害剤III(インビトロジェン社)、RNasin(登録商標)(プロメガ社、マジソン、ウィスコンシン州)、プロテクターリボヌクレアーゼ阻害剤(ロシュアプライドサイエンス社、インディアナポリス、インディアナ州)、胎盤リボヌクレアーゼ阻害剤(USB社、クリーブランド、オハイオ州)、及びProtectRNA(商標)(シグマ社、セントルイス、ミズーリ州)が挙げられる。いくつかの実施態様では、リボヌクレアーゼ阻害剤は、細胞の場所に、例えば、分析予定の細胞又は細胞群を含有しているウェルに、ウェル中のリボヌクレアーゼ活性を有意に、1~100%、好ましくは20~100%、最も好ましくは50~100%阻害するに十分な濃度で添加され得る。好ましくは、溶解混合物は、インサイツの逆転写酵素及びDNAポリメラーゼ反応と適合性である。
【0052】
いくつかの実施態様では、溶解混合物をさらに、次の工程で実施されるような逆転写用の試薬と配合させることができる。
【0053】
特に、溶解混合物は典型的には、ある量のdNTPを含む。本明細書において使用する「dNTP」という用語は、デオキシリボヌクレオシド三リン酸を指す。このようなdNTPの非限定的な例は、dATP、dGTP、dCTP、dTTP、dUTPであり、これはまた、例えば蛍光標識、放射性標識、ビオチン標識を含む、標識された誘導体の形態で存在してもよい。ヌクレオチド塩基の修飾されたdNTPも包含され、ここでのヌクレオチド塩基は、例えば、ヒポキサンチン、キサンチン、7-メチルグアニン、イノシン、キサントシン、7-メチルグアノシン、5,6-ジヒドロウラシル、5-メチルシトシン、プソイドウリジン、ジヒドロウリジン、5-メチルシチジンである。
【0054】
いくつかのさらなる実施態様では、溶解混合物は、ポリアデニル化mRNAの逆転写を開始し、cDNA分子の3'末端にユニバーサルPCRハンドルを組み込むのに適したある量のプライマー(すなわち「オリゴ-dT逆転写プライマー」)を含む。典型的には、該プライマーは、配列TGCGGTATCTAAAGCGGTGAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN(配列番号195)からなり、ここでのVは、dG、dA、又はdCを示し、Nは、dA、dT、dG、又はdCを示す。
【0055】
C)前記RNA分子の逆転写(RT)
工程は、前の工程で抽出されたか又はRNA試料中に含まれているRNA分子の逆転写(RT)からなる。本発明によると、該工程は、96個の異なるウェル特異的な鋳型乗換えオリゴヌクレオチド(TSO)を使用して、cDNAの5'末端にウェル特異的なDNAバーコードを導入する。前記の異なるウェル特異的な鋳型乗換えオリゴヌクレオチドは、配列番号99~194の配列である。したがって、特定のウェルについてのcDNAは、特定のバーコードの解読によって同定されるだろう。
【0056】
D)工程C)で得られたcDNAの増幅
工程は、前の工程で産生されたcDNAの増幅反応からなる。
【0057】
本明細書において使用する「増幅反応」は、この中でヌクレオチド配列の増幅が起こり得る反応混合物を指し、これにより、酵素的手段によって核酸配列のコピー数が増加する。増幅手順は当技術分野において周知であり、典型的にはポリメラーゼ連鎖反応(PCR)を含む。典型的には、増幅は、1つの正方向プライマーと1つの逆方向プライマーからなる一対の二方向性プライマー(すなわちプライマー対)を用いて行なわれるか、又は、PCR増幅などのDNA増幅の分野において一般的に使用されるような一対の正方向プライマーとして提供される。本明細書において使用する「プライマー」という用語は、核酸標的にアニーリングすることができ、かつ、プライマー伸長産物の合成が誘導される条件下(例えば、ヌクレオチド及びDNAポリメラーゼなどの重合用物質の存在下、並びに至適温度及びpHで)に置かれた場合、DNA合成の開始点としての役目を果たすことのできる、オリゴヌクレオチドを指す。プライマー(いくつかの実施態様では伸長用プライマー、及びいくつかの実施態様では増幅用プライマー)は、いくつかの実施態様では、伸長及び/又は増幅の効率を最大限にするための一本鎖である。いくつかの実施態様では、プライマーはオリゴデオキシリボヌクレオチドである。プライマーは典型的には、重合用物質の存在下で、伸長産物及び/又は増幅産物の合成を開始するのに十分に長い。プライマーの最小長は、温度及びプライマーの組成(A/T含量対G/C含量)を含むがこれらに限定されない、多くの因子に依存し得る。プライマーは、任意の適切な方法によって調製されてもよい。特定の配列のオリゴヌクレオチドを調製するための方法は、当技術分野において公知であり、これには、例えば、適切な配列のクローニング及び制限酵素による消化、並びに直接的化学合成が含まれる。化学合成法としては、例えば、リン酸二エステル又は三エステル法、ジエチルホスホルアミデート法、及び、米国特許第4,458,066号に開示された固相支持体法が挙げられ得る。
【0058】
本発明によると、PCRベースの増幅は、TSOの5'に組み込まれたPCRハンドルを使用する。したがって、いくつかの実施態様では、PCR反応は、TSOのPCRハンドル配列に対して相補的な正方向プライマー、及びオリゴdT逆転写プライマーを通して組み込まれた3'末端PCRハンドルにハイブリダイズする逆方向プライマーを用いて行なわれる。いくつかの実施態様では、PCRベースの増幅は、正方向プライマーについては配列AGACGTGTGCTCTTCCGATCT(配列番号196)、及び逆方向プライマーについては配列TGCGGTATCTAAAGCGGTGAG(配列番号197)からなる一対のプライマーを使用する。
【0059】
PCR法は、教科書に十分に記載されており、これは当業者には公知である。PCRによる増幅後、標的ポリヌクレオチドは、ストリンジェントから中程度にストリンジェントなハイブリダイゼーション条件及び洗浄条件下において、標的配列のポリヌクレオチドと安定なハイブリッドを形成する、プローブポリヌクレオチドとのハイブリダイゼーションによって検出され得る。プローブが、標的配列に対して実質的に完全に(すなわち約99%又はそれ以上)相補的であると予想される場合、ストリンジェントな条件が使用され得る。いくつかのミスマッチが予想される場合、例えば、変異株が結果に予想され、よってプローブは完全に相補的ではないであろう場合、ハイブリダイゼーションのストリンジェンシーは低減させてもよい。いくつかの実施態様では、条件は、非特異的/不定の結合を除外するように選択される。ハイブリダイゼーションに影響を及ぼし、かつ、非特異的結合を淘汰する条件は当技術分野において公知であり、これは例えば、Sambrook & Russell (2001). Molecular Cloning: A Laboratory Manual、第3版、コールドスプリングハーバーラボラトリー出版、コールドスプリングハーバー、ニューヨーク、米国に記載されている。一般的には、低塩濃度及びより高い温度でのハイブリダイゼーション及び/又は洗浄が、ハイブリダイゼーション条件のストリンジェンシーを増加させる。典型的には、増幅は、サーマルサイクラーを用いて行なわれる。いくつかの実施態様では、増幅は、98℃で3分間のインキュベーション、続いて(98℃で15秒間、67℃で20秒間、72℃で6分間)を22サイクルによって行なわれる。
【0060】
E)cDNAのプール及び精製:
工程は、各ウェルの増幅されたcDNAを、1つの容器(例えばチューブ)にプールし、その後、それを精製して、PCRに由来するプライマー及び試薬を除去することからなる。典型的には、精製は、磁気ビーズ、又は高濃度の塩の存在下でDNAの選択的結合を可能とするシリカ表面の官能基化された粒子の使用を含む。磁気ビーズに結合したDNAは、磁石を使用して水相から容易に分離され得、これにより、迅速な試料の処理及び溶液の体積の微細な制御が可能となる。
【0061】
F)cDNAライブラリーの調製
工程は、前の工程で精製されたcDNAをタグメンテーション反応にかける工程からなる。
【0062】
本明細書において使用する「タグメンテーション反応」という用語は、cDNAを、トランスポソーム又は転移複合体と共にインキュベートすることにより、トランスポゾン末端を用いて該cDNAをタグ化及び断片化することを指す。本明細書において使用する「トランスポザーゼ」又は「断片化及び標識化酵素」という用語は、転移することのできる機能的な核酸-タンパク質複合体の一成分であり、かつ転移を媒介する、酵素を指す。本明細書において使用する「トランスポゾン末端」又は「トランスポゾン末端配列」という用語は、インビトロでの転移反応で機能的である、トランスポザーゼ酵素と複合体を形成するのに必要である、ヌクレオチド配列を示す、二本鎖DNAを指す。トランスポゾン末端配列は、転移のためのトランスポゾンを同定するのに関与する。トランスポゾン末端は、トランスポザーゼとトランスポソーム又は転移複合体を形成して、転移反応を遂行する。いくつかの実施態様では、トランスポゾン末端配列はさらに、プライマー結合部位又は他の機能的な配列などの追加の配列を含み得る。
【0063】
いくつかの実施態様では、タグメンテーションは、Nextera(商標)DNA試料調製キット(イルミナ社)を用いて行なわれ、ここでのゲノムDNAは、インプットDNAを同時に断片化及びタグ化する(「タグメンテーション」)工学操作されたトランスポソームによって断片化され得、これにより、断片の末端に固有のアダプター配列を含む断片化核酸分子の集団が作出される。
【0064】
典型的には、タグメンテーションは、過剰活性のTn5トランスポザーゼ及びTn5型トランスポザーゼ認識部位(Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998))、又は、R1及びR2末端配列を含んでいるMuAトランスポザーゼ及びMuトランスポザーゼ認識部位(Mizuuchi, K., Cell, 35: 785, 1983; Savilahti, H, et al., EMBO J., 14: 4893, 1995)の使用を含む。過剰活性のTn5トランスポザーゼ(例えば、EZ-Tn5(商標)トランスポザーゼ、Epicentre Biotechnologies社、マジソン、ウィスコンシン州)と複合体を形成する、例示的なトランスポザーゼ認識部位。使用され得る転移システムのさらなる例としては、黄色ブドウ球菌Tn552(Colegio et al., J. Bacteriol., 183: 2384-8, 2001; Kirby C et al., Mol. Microbiol., 43: 173-86, 2002)、Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994及び国際公開公報WO95/23875号)、トランスポゾンTn7(Craig, N L, Science. 271: 1512, 1996; Craig, N L、Curr Top Microbiol Immunol., 204:27-48, 1996に総説されている)、Tn/O及びIS10(Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996)、Marinerトランスポザーゼ(Lampe D J, et al., EMBO J., 15: 5470-9, 1996)、Tc1(Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996)、P因子(Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004)、Tn3(Ichikaa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990)、細菌挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996)、レトロウイルス(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989)、及び酵母のレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989)が挙げられる。さらなる例としては、IS5、Tn10、Tn903、IS911、及び工学操作された型のトランスポザーゼファミリー酵素(Zhang et al., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct. 16; Wilson C. et al (2007) J. Microbiol. Methods 71:332-5)が挙げられる。
【0065】
本明細書において使用する「アダプター」という用語は、標的ポリヌクレオチド断片に接続され、その後の標的ポリヌクレオチド断片の分析に機能を果たす、非標的核酸成分、一般的にはDNAを指す。いくつかの実施態様では、アダプターは、アダプターが結合したポリヌクレオチドの同定、認識、及び/又は分子的若しくは生化学的操作を可能とする、ヌクレオチド配列を含み得る。例えば、アダプターは、ポリヌクレオチド断片の配列を解読するための、プライマー結合部位として使用され得る、配列を含み得る。別の例では、アダプターは、バーコードの付いたポリヌクレオチド断片の同定を可能とする、バーコード配列を含んでいてもよい。いくつかの実施態様では、該バーコードは、以下からなる群より選択される:
【表3】
【0066】
いくつかの実施態様では、アダプターは、配列CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTからなり、ここでのXXXXXXXXはバーコード配列を示す。
【0067】
いくつかの実施態様では、タグメンテーションは、配列番号214から配列番号229の複数の配列を用いて行なわれる。
【0068】
【0069】
最後に、バーコードの付いたポリヌクレオチド断片のライブラリーは、典型的には前の工程で記載されたのと同じ技術によって、すなわち、試薬(例えばアダプター)を除去するであろう磁気ビーズを使用することによって精製される。いくつかの実施態様では、該ライブラリーはその後、次の工程でシークエンスされる前にさらに特徴付けられてもよい。例えば、断片の断片サイズの分布は、バイオアナライザー、断片アナライザーを使用して、又はアガロースゲルに沿ってシグナル強度を積分することによって測定され得る。結果として得られたライブラリーは、平均サイズ600~800bpの幅広いサイズ分布(300~1000bp)を有すると予想される。
【0070】
G)cDNAライブラリーのシークエンス:
工程は、前の工程に従って調製されたようなcDNAライブラリーをシークエンスすることからなる。
【0071】
本明細書において使用する「シークエンス」という用語は一般的に、核酸中のヌクレオチドの順序を決定するためのプロセスを意味する。核酸をシークエンスするための様々な方法は当技術分野において周知であり、該方法を使用することができる。
【0072】
いくつかの実施態様では、次世代シークエンスが行なわれる。本明細書において使用する「次世代シークエンス」という用語は、当技術分野におけるその一般的な意味を有し、例えば、数十万個の又は数百万個の比較的短い配列リードを一度に生成する能力を持ち、伝統的なサンガー及びキャピラリー電気泳動に基づいたアプローチと比較して、増加した処理能力を有するシークエンス技術を指す。次世代シークエンス技術のいくつかの例としては、逐次合成によるシークエンス、ライゲーションによるシークエンス、及びハイブリダイゼーションによるシークエンスが挙げられるがこれらに限定されない。したがって、シークエンスは、シークエンサーを用いて行なわれる。いくつかの実施態様では、シークエンサーは、次世代シークエンス(NGS)を行なうように構成される。いくつかの実施態様では、シークエンサーは、可逆的な色素終結因子を用いた逐次合成によるシークエンスを使用して、大量に平行してシークエンスを行なうように構成される。いくつかの実施態様では、シークエンサーは、ライゲーションによるシークエンスを行なうように構成される。さらに他の実施態様では、シークエンサーは、一分子シークエンスを行なうように構成される。次世代シークエンサーは、イルミナ(Solexa社)シークエンス、ロシュ454シークエンス、Ion torrentシークエンス、SOLiDシークエンスなどの様々な技術に基づいた、多くの異なるシークエンサーを含み得る。本発明の方法に使用され得るシークエンス技術の一例は、イルミナ社のプラットフォームである。イルミナ社のプラットフォームは、折り返しPCR及びアンカープライマー(例えば捕捉用オリゴヌクレオチド)を使用した、固相表面(例えばフローセル)上でのDNAの増幅に基づく。したがって、イルミナ社のプラットフォームを用いたシークエンスのために、DNAを断片化し、アダプターを、断片の両末端に付加させる(前の工程を参照)。断片のアダプター末端にハイブリダイズすることのできるオリゴヌクレオチドを捕捉することによって、DNA断片をフローセルチャネルの表面に付着させる。その後、DNA断片を伸長し、橋を増幅する。複数回サイクルの固相増幅、続いて変性後に、数百万個の空間的に固定された核酸クラスター又は一本鎖核酸のコロニーのアレイを作製する。各クラスターは、およそ数百個から数千個の同じ鋳型の一本鎖DNA分子のコピーを含み得る。イルミナ社のプラットフォームは、逐次合成法によるシークエンス法を使用し、ここでは検出可能な標識(例えばフルオロフォア)を含むシークエンスヌクレオチドが、連続的に遊離3'ヒドロキシル基に付加される。ヌクレオチドの取り込み後、標識されたヌクレオチドに特異的な波長のレーザー光を使用して、標識を励起させ得る。画像を取得し、ヌクレオチド塩基の種類を記録する。これらの工程を繰り返して、残りの塩基をシークエンスすることができる。この技術によるシークエンスは、例えば、米国特許公開出願第2011/0009278号、第2007/0014362号、第2006/0024681号、第2006/0292611号、及び米国特許第7,960,120号、第7,835,871号、第7,232,656号、及び第7,115,200号に記載され、その各々はその全体が参照により本明細書に組み込まれる。
【0073】
本発明により複数のリードが得られるだろう。本明細書において使用する「リード」という用語は、核酸試料の一部からのシークエンスリードを指す。典型的には、リードは、試料中の短い連続的な塩基対の配列を示す。リードは、塩基の正しさの推定確率と一緒に(品質スコア)、A、T、C及びGの記号での試料の一部の塩基対配列によって示され得る。
【0074】
いくつかの実施態様では、リードは、以下のプライマーを用いて得られる:
【0075】
【0076】
本発明によると、3つのリードが得られ、これから4つのカテゴリーの情報を得ることができる:
-リード1は、mRNAが転写された遺伝子の同定を可能とする、
-リードi7は、アダプターの特定のi7バーコードを検出することによって、プレートの同定を可能とし、よって、特定のプレートの同定を可能とするだろう。換言すれば、リードは、データの分析者に、これらのバーコードが、プレートに対応する1つのバーコードン群として扱われるべきであることを知らせる、
-リード2は、ウェル特異的な特定のバーコード配列を検出することによってウェルの同定を可能とし、よって、該情報は、個々の配列の検出及び定量を、特定のウェルに関連付け、続いて、特定の単一の細胞に関連付けるだろう。換言すれば、リードは、データの分析者に、これらのバーコードが、特定のウェル(すなわち1つの細胞)に対応する1つのバーコード群として扱われるべきであることを知らせる、
-リード2はまた、UMI配列を検出することによって、ライブラリーに存在する個々の分子の同定及び定量を可能とする。
【0077】
よって、特定の遺伝子に対して特定の配列を整列及びマッピングすることによって、方法は、前記の特定の遺伝子の発現の検出並びに該発現レベルの定量を可能とするだろう。整列は典型的には、コンピューターアルゴリズムによって実行される。配列の整列のアルゴリズムの一例は、イルミナ社のゲノム解析パイプラインの一部として配布された、ヌクレオチドデータの効率的局所的整列(ELAND)コンピュータープログラムである。あるいは、ブルームフィルタ又は類似のセットメンバーシップテスターを使用して、参照ゲノムに対してリードを整列させてもよい。2014年4月25日に出願された、米国特許出願番号第14/354,528号を参照(これは、その全体が参照により本明細書に組み入れられる)。整列における配列リードの一致は、100%の配列の一致であっても、又は100%未満(すなわち完全ではない一致)であってもよい。
【0078】
したがって、リードの組合せは、単一細胞における複数の遺伝子の発現の検出及び定量を可能とする。典型的には、プレート及びウェルによる情報のプールを含む、様々なリードの分析は、生物情報学的アルゴリズムによって行なわれ得る。
【0079】
適用:
本発明のRNAシークエンス(RNAseq)法は、様々な適用を見出し得、そして、被験者の表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析に特に適している。
【0080】
本発明のシングルセルRNAシークエンス(scRNAseq)法は、様々な適用を見出し得、そして、被験者の表現型の規定されたB細胞及びT細胞のサブセットにおける、B細胞とT細胞のトランスクリプトーム、及び対を形成したB細胞受容体とT細胞受容体のレパートリーについての費用対効果の高い統合分析に特に適している。
【0081】
被験者は好ましくはヒト被験者であるが、非ヒト被験者、例えば非ヒト哺乳動物に由来していてもよい。非ヒト哺乳動物の例としては、非ヒト霊長類(例えば類人猿、サル、ゴリラ)、げっ歯類(例えばマウス、ラット)、ウシ、ブタ、ヒツジ、ウマ、イヌ、ネコ、又はウサギが挙げられるがこれらに限定されない。
【0082】
したがって、RNA試料及び/又は単一細胞は、被験者から得られた試料から調製される。本明細書において使用する「試料」としては、被験者に由来する成分(体液、例えば血液など)が挙げられるがこれらに限定されない。いくつかの実施態様では、試料は、体液試料又は組織試料である。いくつかの実施態様では、試料は、血液、血漿、血清、骨髄、精液、膣分泌液、尿、羊水、脳脊髄液、滑液、及び生検組織試料(感染及び/又は腫瘍の場所に由来するものを含む)からなる群より選択される。試料は腫瘍生検材料であってもよい。生検材料は、例えば、脳、肝臓、肺、心臓、大腸、腎臓、又は骨髄の腫瘍に由来し得る。典型的には、組織試料を、コラゲナーゼ及びデオキシヌクレアーゼIを用いて酵素的に脱凝集させることにより、細胞の懸濁液が得られる。
【0083】
本明細書において使用する「B細胞受容体」又は「BCR」という用語は、B細胞の形質膜における抗原受容体を指す。BCRは、免疫グロブリン(Ig)として知られている。膜結合型Igは、B細胞受容体として抗原受容体分子として作用する。その分泌タンパク質は、抗体として細胞の外に分泌される。大量の抗体が、最終分化した形質細胞から分泌され、そして、ウイルス若しくは細菌などの病原性分子への結合によって、又は補体結合反応などのそれに続く免疫反応によって、病原体を排除する機能を有する。B細胞受容体は、B細胞表面上に発現される。抗原に結合した後、B細胞受容体は、細胞内シグナルを伝達して、様々な免疫応答又は細胞増殖を惹起する。抗原結合部位におけるアミノ酸配列の多様性は、B細胞受容体の特異性に関与する。抗原結合部位における配列は、B細胞受容体分子間で大きく異なり、可変区分(V領域)と呼ばれる。その一方で、定常領域(C領域)の配列は、B細胞受容体分子又は抗体分子間で高度に保存されている。このような領域は、抗体のエフェクター機能又は受容体のシグナル伝達機能を有する。B細胞受容体及び抗体は、膜結合ドメインの有無を除いて同じである。Ig分子は、ポリペプチド鎖、すなわち2本の重鎖(H鎖)及び2本の軽鎖(L鎖)からなる。1つのIg分子では、2本の重鎖、又は1本の重鎖と1本の軽鎖は、ジスルフィド結合によって結合している。Igにおいて、μ鎖、α鎖、γ鎖、δ鎖、及びε鎖と呼ばれる、5つの異なる重鎖クラス(アイソタイプ)が存在し、これらはそれぞれIgM、IgA、IgG、IgD、及びIgEと呼ばれる。機能及び役割は一般的に、アイソタイプに応じて異なることが知られており、例えば、生物学的防御において機能的である高いレベルの特異性を有する抗体はIgG抗体であり、IgA抗体は粘膜免疫に関与し、IgE抗体は、アレルギー、喘息、及びアトピー性皮膚炎において重要である。さらに、アイソタイプには数種類のサブクラス、例えばIgG1、IgG2、IgG3及びIgG4が存在することが知られている。あらゆるクラスの重鎖に結合することのできる、2種類の軽鎖、すなわちλ鎖(IgL)及びκ鎖(IgK)が存在することが理解され、そして、その間には機能的な差は全くない。B細胞受容体遺伝子は、体細胞において起こる遺伝子再編成によって形成される。可変区分は、ゲノム内のいくつかの離れた遺伝子断片にコードされ、これは細胞の分化プロセスにおいて体細胞の遺伝子組換えを誘導する。重鎖の可変区分の遺伝子配列は、
D領域、J領域、及びV領域とは異なるアイソタイプを規定するC領域(定常領域、C)からなる。各遺伝子断片は、ゲノム内で離れているが、遺伝子再編成によって一連のV-D-J-C遺伝子として発現される。IMGTのデータベースは、38~44種類の機能的なIgH鎖のV遺伝子断片(IGHV)、23種類のD遺伝子断片(IGHD)、6種類のJ遺伝子断片(IGHJ)、34種類の機能的なIgK鎖V遺伝子断片(IGKV)、5種類のJ遺伝子断片(IGKJ)、29~30種類の機能的なIgL鎖V遺伝子断片(IGLV)、及び5種類のJ遺伝子断片(IGLJ)を有する。これらの遺伝子断片は、B細胞受容体の多様性を確実にするために遺伝子再編成を受ける。さらに、高度に多様なCDR3領域は、T細胞受容体のようなアミノ酸配列におけるランダムな挿入又は欠失によって形成される。
【0084】
本明細書において使用する「T細胞受容体」という用語は当技術分野におけるその一般的な意味を有し、MHC分子に結合した抗原を認識するのに関与する、T細胞表面上に見られる分子を指す。抗原プロセシング中に、抗原は、細胞内で分解され、その後、主要組織適合複合体(MHC)分子(ヒトにおけるヒト白血球抗原HLA分子)に結合したペプチドの形態で細胞表面に運ばれる。T細胞は、プロフェッショナルな抗原提示細胞又は1型糖尿病におけるβ細胞などの標的組織細胞の表面において、これらのペプチド-MHC複合体を認識することができる。MHC分子には2つの異なるクラスが存在する:CD8陽性T細胞及びCD4陽性T細胞によってそれぞれ認識される、異なる細胞内区画から細胞表面にペプチドを送達する、MHCクラスI及びMHCクラスII。T細胞受容体すなわちTCRは、MHC分子に結合した抗原の認識に関与する、T細胞表面上に見られる分子である。TCRヘテロダイマーは、T細胞の95%においてα鎖及びβ鎖からなり、一方、T細胞の5%は、γ鎖及びδ鎖からなるTCRを有する。抗原及びMHCとTCRの結合により、関連する酵素、共受容体、及び特殊な補助分子によって媒介される一連の生化学的事象を通して、そのTリンパ球は活性化される。TCRの各鎖は、免疫グロブリンスーパーファミリーの一員であり、そして、1つのN末端の免疫グロブリン(Ig)可変(V)ドメイン、1つのIg定常(C)ドメイン、膜貫通領域、及びC末端における短い細胞質側テイルを有する。TCRの定常ドメインは、2本の鎖を連結している、短い接続配列(この中でシステイン残基がジスルフィド結合を形成している)からなる。該構造は、TCRが、哺乳動物における3つの別個の鎖(γ、δ、及びε)とζ鎖とを有する、CD3のような他の分子との会合を可能とする。これらの補助分子は、負に荷電した膜貫通領域を有し、細胞内にT細胞受容体からのシグナルを伝播するのに不可欠である。CD3鎖は、T細胞受容体と共に、T細胞受容体複合体として知られるものを形成する。T細胞受容体複合体からのシグナルは、特定の共受容体によるMHC分子との同時結合によって増強される。ヘルパーT細胞上では、この共受容体はCD4(クラスIIのMHCに特異的)であり;一方、細胞障害性T細胞上では、この共受容体はCD8(クラスIのMHCに特異的)である。共受容体は、抗原に対するT細胞受容体の特異性を確実にするだけでなく、抗原提示細胞とT細胞の間の延長された結合を可能とし、活性化Tリンパ球のシグナル伝達に関与する細胞内に必須な分子(例えばLCK)を動員する。よって、「T細胞受容体」という用語は、MHC分子によって提示されるペプチドを認識することのできる分子を意味するために慣用的な意味で使用される。該分子は、2本のα鎖及びβ鎖(又は場合によりγ鎖及びδ鎖)のヘテロダイマーであっても、又は、それは組換え型の一本鎖のTCR構築物であってもよい。TCRのα鎖及びβ鎖の両方の可変ドメインは、3つの超可変領域又は相補性決定領域(CDR)を有する。CDR3は、プロセシングされた抗原を認識するのに関与する主なCDRである。その超可変性は、いくつかの可能な対立遺伝子を有する異なる遺伝子座に由来するセグメントを合わせる、組換え事象によって決定される。関与する遺伝子は、TCRのα鎖ではV及びJであり、TCRのβ鎖ではV、D及びJである。このCDR3ドメインの多様性のさらなる増幅、組換え中のランダムなヌクレオチドの欠失及び付加が、TCRのα鎖ではV-Jの接合部で起こり、これにより、V(N)J配列が生じ;TCRのβ鎖ではV-D及びD-Jの接合部で起こり、これにより、V(N)D(N)J配列が生じる。したがって、生じる可能なCDR3配列の数は莫大であり、全TCRレパートリーが多くの異種の抗原を認識する幅広い能力を説明する。同時に、このCDR3配列は、その対応するT細胞に対して特異的な分子指紋を成す。再編成されたヌクレオチド配列は、IMGTデータベース(www.imgt.org)を使用して注釈が付されているように、Vセグメント(下線)に続いて(ND)Nセグメント(下線を付していない;Nの付加は太文字で示されている)、及びその後のJセグメント(下線)として提示される。
【0085】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、配列情報、V、D、J、C、VJ、VDJ、VJC、VDJCの表示、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体の使用の表示、V、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体及び固有な配列の量の表示;突然変異の頻度の表示、VJ V、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体の使用の相関測度などを含む、データセットを得るのに特に適している。その後、このような結果は、例えばレパートリー分析のデータベースに出力されるか又は保存され、そして、試験結果、参照結果などと比較して使用され得る。
【0086】
アッセイされる試料から免疫レパートリー分析結果を得た後に、レパートリーを、参照又は対照のレパートリーと比較することによって、所望の分析を行なうことができる。2つのレパートリー間の差の決定又は分析は、任意の慣用的な技術(ここで多種多様な方法はアレイの当業者には公知である)を使用して、例えば、使用データ等のデータベースを比較することなどによって実施され得る。その後、統計分析の工程を実施することにより、配列の存在の重み付き寄与、例えばV、D、J、C、VJ、VDJ、VJC、VDJC、抗体重鎖、抗体軽鎖、CDR3、又はT細胞受容体の使用、突然変異分析などを得ることができる。統計分析は、1セットの免疫学的受容体の多様性を特徴付けるための、統計測度(例えばエントロピー測度、エコロジー測度、多様な量の測度、種における豊富さの測度、又は種における不均一さの測度)の使用を含み得る。統計学的測度はまた、量のばらつき又は不均一性を特徴付けるために使用され得る。
【0087】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、クローン型の存在及び出現頻度を決定するのに特に適している。本明細書において使用する「クローン型」という用語は、免疫受容体又はその一部をコードしている、リンパ球の再編成された又は組換えられたヌクレオチド配列を意味する。より特定すると、クローン型は、T細胞受容体(TCR)若しくはB細胞受容体(BCR)又はその一部をコードしている、T細胞又はB細胞の組換えられたヌクレオチド配列を意味する。様々な実施態様では、クローン型は、IgHのVDJ再編成、IgHのDJ再編成、IgKのVJ再編成、IgLのVJ再編成、T細胞受容体βのVDJ再編成、T細胞受容体βのDJ再編成、T細胞受容体αのVJ再編成、T細胞受容体γのVJ再編成、T細胞受容体δのVDJ再編成、T細胞受容体δのVD再編成、Kde-V再編成などの全て又は一部をコードし得る。クローン型はまた、免疫受容体遺伝子の関与する転座切断領域もコードし得る。1つの態様では、クローン型は、それらが由来する免疫分子の多様性を示すか又は反映するに十分に長い配列を有する。
【0088】
したがって、いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、再編成されたT細胞又はB細胞の受容体のレパートリーの部分的な又は完全な検出を可能とする。特に、T細胞受容体又はB細胞受容体のレパートリーの分析は、単一クローン性又は免疫障害を分析するのに有用な分析ツールである。したがって、本発明のRNAseq法及び/又はシングルセルRNAseq法は、被験者における免疫応答の診断のために使用又は適用され得る。特に、T細胞及びB細胞のレパートリーは、アレルゲン、毒素、自己抗原から病原体に至る、様々な外部及び内部の刺激に曝された時の、免疫系の刺激に応答して変化するだろう。これらの刺激に応答したVDJ再編成、ヌクレオチドの欠失及び挿入、並びに超突然変異経路の結果は今回、本発明のRNAseq法及び/又はシングルセルRNAseq法を実施することによって慣用的な方法で可視化され得る。本発明のRNAseq法及び/又はシングルセルRNAseq法は、特定の物質に応答して誘導される、両方の優勢な再編成の検出を可能とする。一旦、再編成パターンが確立されたら、被験者のT細胞及び/又はB細胞のレパートリーを、本発明のRNAseq法及び/又はシングルセルRNAseq法を使用して診断することにより、免疫応答を検出し得、この免疫応答は、臨床症状又は疾患と関連している可能性がある。いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、可変配列、抗原特異性、又はT細胞表現型の事前知識がなくても、T細胞クローンの同定及びモニタリングを可能とする。該方法は、単一のクローンを検出するに十分な解像度、及び抗原への曝露又は刺激又は感染後早期にT細胞クローンの増幅を拾い上げるのに十分な感度を有する。いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、優勢なクローンの存在、又はB細胞受容体若しくはT細胞受容体のレパートリー若しくは組成の変化の存在について、B細胞及びT細胞のレパートリーの迅速で完全で偏りのないスクリーニングのために使用され得る。記載の方法を使用してクローン特異的な配列を同定した後、優勢なB細胞受容体又はT細胞受容体の鎖の完全なヌクレオチド配列を得ることができる。レパートリーの群れ、レパートリーの変化、及び優勢なクローンに関する、結果として得られた情報は、診断及び医学において適用を見出すだろう。
【0089】
したがって、本発明のRNAseq法及び/又はシングルセルRNAseq法はこのようにして、感染症、自己免疫疾患、及びがんの診断への使用に有益である。
【0090】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、自己免疫性炎症疾患の診断に適用を見出す。いくつかの実施態様では、自己免疫性炎症疾患は、関節炎、関節リウマチ、急性関節炎、慢性関節リウマチ、痛風性関節炎、急性痛風性関節炎、慢性炎症性関節炎、変性関節炎、感染性関節炎、ライム関節炎、増殖性関節炎、乾癬性関節炎、脊椎関節炎、及び若年発症型関節リウマチ、骨関節炎、進行性慢性関節炎、変形関節炎、慢性原発性多発性関節炎、反応性関節炎、及び強直性脊椎炎)、炎症性過剰増殖性皮膚疾患、乾癬、例えば尋常性乾癬、滴状乾癬、膿疱性乾癬、及び爪乾癬、皮膚炎、例えば接触性皮膚炎、慢性接触性皮膚炎、アレルギー性皮膚炎、アレルギー性接触性皮膚炎、疱疹状皮膚炎、及びアトピー性皮膚炎、x連鎖高IgM症候群、蕁麻疹、例えば慢性アレルギー性蕁麻疹及び慢性特発性蕁麻疹、例えば慢性自己免疫性蕁麻疹、多発性筋炎/皮膚筋炎、若年性皮膚筋炎、中毒性表皮壊死症、強皮症、全身性強皮症、硬化症、全身性硬化症、多発性硬化症(MS)、視神経脊髄型多発性硬化症、原発性進行性多発性硬化症(PPMS)、再発寛解型多発性硬化症(RRMS)、進行性全身性硬化症、アテローム性動脈硬化症、動脈硬化症、播種性硬化症、及び運動失調性硬化症、炎症性腸疾患(IBD)、クローン病、大腸炎、潰瘍性大腸炎(ulcerative colitis)、潰瘍性大腸炎(colitis ulcerosa)、顕微鏡的大腸炎、コラーゲン性大腸炎、ポリープ状大腸炎、壊死性腸炎、経壁性大腸炎、自己免疫性炎症性腸疾患、壊疽性膿皮症、結節性紅斑、原発性硬化性胆管炎、上強膜炎、呼吸促拍症候群、成人又は急性の呼吸促拍症候群(ARDS)、髄膜炎、ブドウ膜の全部若しくは一部の炎症、虹彩炎、脈絡膜炎、自己免疫性血液障害、リウマチ性脊椎炎、突発難聴、IgEにより媒介される疾患、例えばアナフィラキシー及びアレルギー性鼻炎及びアトピー性鼻炎、脳炎、ラスムッセン脳炎、辺縁系及び/又は脳幹の脳炎、ブドウ膜炎、前部ブドウ膜炎、急性前部ブドウ膜炎、肉芽腫性ブドウ膜炎、非肉芽腫性ブドウ膜炎、水晶体抗原性ブドウ膜炎、後部ブドウ膜炎、自己免疫性ブドウ膜炎、糸球体腎炎(GN)、特発性膜性糸球体腎炎又は特発性膜性糸球体腎炎、膜性又は膜性増殖性糸球体腎炎(MPGN)、急速進行性糸球体腎炎、アレルギー症状、自己免疫性心筋炎、白血球粘着不全症、全身性エリテマトーデス(erythematosus)(SLE)又は全身性エリテマトーデス(erythematodes)、例えば皮膚全身性エリテマトーデス、亜急性皮膚エリテマトーデス、新生児エリテマトーデス(NLE)、播種性エリテマトーデス、ループス(腎炎、脳炎、小児性、非腎性、腎外性、円板状、脱毛症を含む)、若年発症型(I型)糖尿病(小児インシュリン依存性糖尿病(IDDM)を含む)、成人発症型糖尿病(II型糖尿病)、自己免疫性糖尿病、特発性尿崩症、サイトカイン及びTリンパ球によって媒介される急性型及び遅延型過敏症を伴う免疫応答、結核、類肉腫症、肉芽腫症、リンパ腫様肉芽腫症、ウェゲナー肉芽腫症、無顆粒球症、脈管炎(例えば血管炎、大型血管炎を含む)、リウマチ性多発筋痛症、巨細胞(高安)動脈炎、中型血管炎、川崎病、結節性多発動脈炎、顕微鏡的多発動脈炎、中枢神経性血管炎、壊死性、皮膚性、過敏性血管炎、全身性壊死性血管炎、及びANCA関連血管炎、例えばチャーグ・ストラウス血管炎又は症候群(CSS)、側頭動脈炎、再生不良性貧血、自己免疫性再生不良性貧血、クームス陽性貧血、ダイアモンド・ブラックファン貧血、溶血性貧血又は免疫性溶血性貧血(例えば自己免疫性溶血性貧血(AIHA)を含む)、悪性貧血(pernicious anemia)(悪性貧血、anemia perniciosa)、アジソン病、赤血球無形成又は形成不全(PRCA)、第VIII因子欠損症、血友病A、自己免疫性好中球減少症、汎血球減少症、白血球減少症、白血球の血管外漏出を併発する疾患、中枢神経性炎症性疾患、多臓器機能障害症候群、例えば敗血症、外傷、若しくは出血に続発するもの、抗原抗体複合体により媒介される疾患、抗糸球体基底膜抗体病、抗リン脂質抗体症候群、アレルギー性神経炎、ベーチェット(Bechet)病又はベーチェット(Behcet)病、キャッスルマン症候群、グッドパスチャー症候群、レイノー症候群、シェーグレン症候群、スティーブンジョンソン症候群、類天疱瘡、例えば水疱性類天疱瘡及び皮膚類天疱瘡、天疱瘡、場合により尋常性天疱瘡、落葉状天疱瘡、天疱瘡、粘膜類天疱瘡、紅斑性天疱瘡、自己免疫性多腺性内分泌障害、ライター病若しくは症候群、免疫複合体腎炎、抗体により媒介される腎炎、視神経脊髄炎、多発神経障害、慢性神経障害、IgM多発性神経障害、IgM媒介性神経障害、血小板減少症、血栓性血小板減少性紫斑病(TTP)、特発性血小板減少性紫斑病(ITP)、自己免疫性精巣炎及び卵巣炎、原発性甲状腺機能低下症、副甲状腺機能低下症、自己免疫性甲状腺炎、橋本病、慢性甲状腺炎(橋本甲状腺炎);亜急性甲状腺炎、自己免疫性甲状腺疾患、特発性甲状腺機能低下症、グレーブス病、多腺性症候群、例えば自己免疫性多腺性症候群(又は多腺性内分泌障害症候群)、傍腫瘍性症候群(例えば傍腫瘍性神経症候群、例えばランバート・イートン筋無力症候群又はイートン・ランバート症候群を含む)、全身硬直(stiff-man又はstiff-person)症候群、脳脊髄炎、アレルギー性脳脊髄炎、実験的アレルギー性脳脊髄炎(EAE)、重症筋無力症、胸腺腫に関連した重症筋無力症、小脳変性、神経性筋強直症、眼球クローヌス又は眼球クローヌス・ミオクローヌス症候群(OMS)、及び感覚神経障害、多巣性運動神経障害、シーハン症候群、自己免疫性肝炎、慢性肝炎、ルポイド肝炎、巨細胞肝炎、慢性活動性肝炎又は自己免疫性慢性活動性肝炎、リンパ性間質性肺炎、閉塞性細気管支炎(移植片ではない)vs特異的間質性肺炎、ギランバレー症候群、ベルジェ病(IgA腎症)、特発性IgA腎症、線状IgA皮膚症、原発性胆管性肝硬変、肺線維症、自己免疫性腸症症候群、セリアック(Celiac)病、セリアック(Coeliac)病、セリアックスプルー(グルテン腸症)、難治性スプルー、特発性スプルー、低温型グロブリン血症、筋萎縮性側索硬化症(ALS;ルー・ゲーリック病)、冠動脈疾患、自己免疫性眼疾患、例えば自己免疫性内耳疾患(AGED)、自己免疫性難聴、眼球クローヌス・ミオクローヌス症候群(OMS)、多発性軟骨炎、例えば難治性又は再発性多発性軟骨炎、肺胞タンパク質症、アミロイドーシス、胸膜炎、非癌性リンパ球増加症、単クローン性B細胞リンパ球増加症を含む原発性リンパ球増加症、場合により良性単クローン性γグロブリン血症、又は意義不明の単クローン性γグロブリン血症(MGUS)、末梢神経障害、腫瘍随伴症候群、チャネル病、例えば癲癇、偏頭痛、不整脈、筋障害、難聴、盲目、周期性四肢麻痺、及び中枢神経系のチャネル病、自閉症、炎症性筋疾患、巣状分節性糸球体硬化症(FSGS)、内分泌性眼障害、ブドウ膜網膜炎、脈絡網膜炎、自己免疫性肝障害、線維筋痛症、多発性内分泌腺不全症、シュミット症候群、副腎炎、胃萎縮、初老期認知症、脱髄性疾患、例えば自己免疫性脱髄性疾患、糖尿病性腎症、ドレスラー症候群、円形脱毛症、クレスト症候群(石灰沈着症、レイノー現象、食道運動障害、強指症)及び毛細血管拡張症)、男性及び女性の自己免疫性不妊、混合性結合組織疾患、シャーガス病、リウマチ熱、反復流産、農夫肺、多形性紅斑、心切開術後症候群、クッシング症候群、鳥飼病、アレルギー性肉芽腫性血管炎、良性リンパ球性血管炎、アルポート症候群、肺胞炎、例えばアレルギー性肺胞炎及び線維化性肺胞炎、間質性肺疾患、輸血副作用、ライ病、マラリア、リーシュマニア症、トリパノソーマ症(kypanosomiasis)、住血吸虫症、回虫症、アルペルギルス症、サムプター(Sampter)症候群、カプラン症候群、デング熱、心内膜炎、心内膜心筋線維症、びまん性間質性肺線維症、間質性肺線維症、特発性肺線維症、膿疱性線維症、眼内炎、持久性隆起性紅斑、胎児赤芽球症、好酸球性筋膜炎、シャルマン症候群、フェルティ症候群、フィラリア症、毛様体炎、例えば慢性毛様体炎、異虹彩色性毛様体炎、虹彩毛様体炎、又はフックス毛様体炎、ヘノッホ・シェーンライン紫斑病、ヒト免疫不全ウイルス(HIV)感染、エコーウイルス感染、心筋症、アルツハイマー病、パルボウイルス感染、風疹ウイルス感染、ワクチン接種後症候群、先天性風疹感染、エプシュタイン・バーウイルス感染、おたふくかぜ、エバンス症候群、自己免疫性性腺機能不全、シデナム舞踏病、連鎖球菌感染後腎炎、閉塞性血栓性血管炎、甲状腺中毒症、脊髄癆、脈絡膜炎、巨細胞性多発性筋痛症、内分泌性眼障害、慢性過敏性肺炎、乾性角結膜炎、流行性角結膜炎、特発性腎炎症候群、微小変化型ネフローゼ、良性家族性及び虚血再灌流障害、網膜の自己免疫、関節炎、気管支炎、慢性閉塞性気道疾患、ケイ肺症、アフタ、アフタ性口内炎、動脈硬化性障害、無精子形成(aspermiogenase)、自己免疫性溶血、ベック病、低温型グロブリン血症、デュピュイトラン拘縮、水晶体過敏性眼内炎、アレルギー性腸炎、らい性結節性紅斑、特発性顔面麻痺、慢性疲労症候群、リウマチ熱、ハンマン・リッチ病、感音難聴、発作性ヘモグロビン尿症、性腺機能低下症、限局性回腸炎、白血球減少症、伝染性単核球症、横断性脊髄炎、原発性特発性粘液水腫、ネフローゼ、交感性眼炎、精巣肉様腫、膵炎、急性多発性神経根炎、壊疽性膿皮症、亜急性甲状腺炎、後天性脾臓萎縮、抗スペルマトゾーン抗体に起因する不妊、非悪性胸腺腫、尋常性白斑、重症複合型免疫不全症及びエプシュタイン・バーウイルスに関連した疾患、後天性免疫不全症候群(エイズ)、寄生虫症、例えばリーシュマニア症、中毒性ショック症候群、食中毒、T細胞の浸潤を併発する容態、白血球接着不全症、サイトカイン及びTリンパ球によって媒介される急性型及び遅延型の過敏症を伴う免疫応答、白血球の血管外漏出を併発する疾患、多発臓器機能障害症候群、抗原抗体複合体により媒介される疾患、抗糸球体基底膜抗体病、アレルギー性神経炎、自己免疫性多腺性内分泌障害、卵巣炎、原発性粘液水腫、自己免疫性萎縮性胃炎、交感性眼炎、リウマチ疾患、混合性結合組織疾患、ネフローゼ症候群、膵島炎、多内分泌腺不全、末梢神経障害、多腺性自己免疫症候群I型、成人発症型特発性副甲状腺機能低下症(AOIH)、完全脱毛症、拡張型心筋症、後天性表皮水疱症(EBA)、ヘモクロマトーシス、心筋炎、ネフローゼ症候群、原発性硬化性胆管炎、化膿性又は非化膿性の副鼻腔炎、急性又は慢性の副鼻腔炎、篩骨洞炎、前頭洞炎、上顎洞炎、又は蝶形骨洞炎、好酸球に関連した障害、例えば好酸球増加症、好酸球増加症を伴う肺浸潤、好酸球増多筋痛症候群、レフラー症候群、慢性好酸球性肺炎、熱帯性肺好酸球増加症、気管支肺アルペルギルス症、アスペルギルス腫、又は好酸球を含有する肉芽腫、アナフィラキシー、血清反応陰性脊椎関節炎、多内分泌性自己免疫疾患、硬化性胆管炎、強膜、上強膜、慢性皮膚粘膜カンジダ症、ブルトン(Bruton)症候群、小児一過性低γグロブリン血症、ウィスコット・オルドリッチ症候群、毛細血管拡張性運動失調症、膠原病を伴う自己免疫疾患、リウマチ、神経疾患、虚血再灌流障害、血圧反応低下、血管機能不全、血管拡張症、組織損傷、心血管虚血、痛覚過敏、脳虚血、及び血管新生を伴う疾患、アレルギー性過敏症、糸球体腎炎、再灌流障害、心筋又は他の組織の再灌流障害、急性炎症性要素を伴う皮膚病、急性化膿性髄膜炎、又は他の中枢神経系の炎症性障害、眼及び眼窩の炎症性障害、顆粒球輸血関連症候群、サイトカイン誘導毒性、急性で深刻な炎症、慢性で頑固な炎症、腎盂炎、肺硬変、糖尿病性網膜症、糖尿病性大動脈障害、動脈内膜過形成、消化性潰瘍、弁膜炎、及び子宮内膜症からなる群より選択される。
【0091】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、感染症を診断するのに特に適している。本明細書において使用する「感染症」という用語は、ウイルス、細菌、原虫、カビ、又は真菌によって引き起こされる任意の感染を含む。いくつかの実施態様では、ウイルス感染は、アレナウイルス科、アストロウイルス科、ビルナウイルス科、ブロモウイルス科、ブニヤウイルス科、カリシウイルス科、クロステロウイルス科、コモウイルス科、シストウイルス科、フラビウイルス科、フレキシウイルス科、ヘペウイルス科、レビウイルス科、ルテオウイルス科、モノネガウイルス科、モザイクウイルス科、ニドウイルス科、ノダウイルス科、オルトミクソウイルス科、ピコビルナウイルス科、ピコルナウイルス科、ポティウイルス科、レオウイルス科、レトロウイルス科、セクイウイルス科、テヌイウイルス科、トガウイルス科、トンブスウイルス科、トティウイルス科、ティモウイルス科、ヘパドナウイルス科、ヘルペスウイルス科、パラミクソウイルス科、又はパピローマウイルス科のウイルスからなる群より選択される1つ以上のウイルスによる感染を含む。RNAウイルスの関連する分類ファミリーとしては、アストロウイルス科、ビルナウイルス科、ブロモウイルス科、カリシウイルス科、クロステロウイルス科、コモウイルス科、シストウイルス科、フラビウイルス科、フレキシウイルス科、ヘペウイルス科、レビウイルス科、ルテオウイルス科、モノネガウイルス科、モザイクウイルス科、ニドウイルス科、ノダウイルス科、オルトミクソウイルス科、ピコビルナウイルス科、ピコルナウイルス科、ポティウイルス科、レオウイルス科、レトロウイルス科、セクイウイルス科、テヌイウイルス科、トガウイルス科、トンブスウイルス科、トティウイルス科、及びティモウイルス科のウイルスが挙げられるがこれらに限定されない。いくつかの実施態様では、ウイルス感染は、アデノウイルス、ライノウイルス、肝炎ウイルス、免疫不全ウイルス、ポリオウイルス、麻疹ウイルス、エボラウイルス、コクサッキーウイルス、ライノウイルス、ウェストナイルウイルス、天然痘ウイルス、脳炎ウイルス、黄熱病ウイルス、デング熱ウイルス、インフルエンザウイルス(ヒト、トリ及びブタを含む)、ラッサウイルス、リンパ性脈絡髄膜炎ウイルス、フニンウイルス、マチュポウイルス、グアナリトウイルス、ハンタウイルス、リフトバレー熱ウイルス、ラクロスウイルス、カリフォルニア脳炎ウイルス、クリミア・コンゴウイルス、マールブルグウイルス、日本脳炎ウイルス、キャサヌール森林病ウイルス、ベネゼエラウマ脳炎ウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス、重症急性呼吸器症候群(SARS)ウイルス、パラインフルエンザウイルス、呼吸器合胞体ウイルス、プンタトロウイルス、タカリベウイルス、パチンダエ(pachindae)ウイルス、アデノウイルス、デング熱ウイルス、A型インフルエンザウイルス及びB型インフルエンザウイルス(ヒト、トリ及びブタを含む)、フニンウイルス、麻疹ウイルス、パラインフルエンザウイルス、ピチンデウイルス、プンタトロウイルス、呼吸器合胞体ウイルス、ライノウイルス、リフトバレー熱ウイルス、重症急性呼吸器症候群(SARS)ウイルス、タカリベウイルス、ベネゼエラウマ脳炎ウイルス、ウェストナイルウイルス、及び黄熱病ウイルス、ダニ媒介脳炎ウイルス、日本脳炎ウイルス、セントルイス脳炎ウイルス、マレー渓谷ウイルス、ポワサンウイルス、ロシオウイルス、跳躍病ウイルス、バンジウイルス、イルヘウイルス、ココベラウイルス、クンジンウイルス、アルファイ(Alfuy)ウイルス、ウシ下痢症ウイルス、及びキャサヌール森林病ウイルスからなる群より選択される1つ以上のウイルスによる感染を含む。本発明に従って処置され得る細菌感染としては、以下によって引き起こされる感染が挙げられるがこれらに限定されない:ブドウ球菌属;連鎖球菌属、例えば化膿性連鎖球菌属;腸球菌属;桿菌属、例えば炭疽菌、及びラクトバチルス属;リステリア属;コリネバクテリウム・ジフテリエ(Corynebacterium diphtheriae);ガードネレラ属、例えばG.バギナリス(G. vaginalis);ノルカジア属;ストレプトマイセス属;サーモアクチノマイセス・ブルガリス(Thermoactinomyces vulgaris);トレポネーマ属;カンピロバクター属、シュードモナス属、例えば緑膿菌;レジオネラ属:ナイセリア属、例えば淋菌及び髄膜炎菌;フラボバクテリウム属、例えばF.メニンゴセプチカム(F. meningosepticum)及びF.オドラタム(F. odoraturn);ブルセラ属;ボルデテラ属、例えば百日咳菌及びB.ブロンキセプチカ(B. bronchiseptica);エシュリヒア属、例えば大腸菌(E.coli)、クレブシエラ属;エンテロバクター属、セラチア属、例えば霊菌及びS.リクファシエンス(S. liquefaciens);エドワードジエラ属;プロテウス属、例えばP.ミラビリス(P. mirabilis)及びP.ブルガリス(P. vulgaris);ストレプトバチルス属;リケッチア属、例えばR.フィッケツフィ(R. fickettsfi)、クラミジア属、例えばオウム病クラミジア及びC.トラコマチス(C. trachornatis);マイコバクテリウム属、例えば結核菌、M.イントラセルラーレ(M. intracellulare);M.フォーチュイタム(M. folluiturn)、ライ菌、M.アビウム(M. avium)、M.ボビス(M. bovis)、M.アフリカヌム(M. africanum)、カンサシ菌、M.イントラセルラーレ、及びM.レプラエルヌリウム(M. lepraernurium);及び、ノカルジア属。本発明に従って処置され得る原虫感染としては、リーシュマニア、コクジディオア(kokzidioa)、及びトリパノソーマによって引き起こされる感染が挙げられるがこれらに限定されない。感染症の完全なリストは、米国疾病予防管理センター(CDC)における国立感染症センター(NCID)のウェブサイト(ワールドワイドウェブ(www)のcdc.gov/ncidod/diseases/)に見られ得、このリストは参照により本明細書に組み入れられる。該疾患は全て、本発明に記載の組成物を使用した処置のための候補である。
【0092】
本発明のRNAseq法及び/又はシングルセルRNAseq法は、癌を診断するのに又は癌の進行をモニタリングするのにも特に適している。今回、腫瘍に対する免疫応答の特徴付けは、生存期間を予測するだけでなく、いくつかの治療法、特に、免疫チェックポイント阻害剤(例えば抗PD1抗体)を用いて実施された免疫療法に対する応答を予測するのにも特に適していることが十分に確立されている。本明細書において使用する「がん」という用語は当技術分野におけるその一般的な意味を有し、これには固形腫瘍及び血液性腫瘍が挙げられるがこれらに限定されない。がんという用語は、皮膚、組織、器官、骨、軟骨、血液、及び脈管の疾患を含む。「がん」という用語はさらに、原発性及び転移性の両方のがんを包含する。本発明の方法及び組成物によって処置され得るがんの例としては、膀胱、血液、骨、骨髄、脳、乳房、大腸、食道、消化管、歯肉、頭部、腎臓、肝臓、肺、鼻咽頭、頸部、卵巣、前立腺、皮膚、胃、精巣、舌、又は子宮に由来するがん細胞が挙げられるがこれらに限定されない。いくつかの実施態様では、被験者は、棘細胞腫、腺房細胞癌、聴神経腫瘍、末端黒子型黒色腫、先端汗腺腫、急性好酸球性白血病、急性リンパ芽球性白血病、急性巨核芽球性白血病、急性単球性白血病、成熟を伴う急性骨髄芽球性白血病、急性骨髄樹状細胞性白血病、急性骨髄性白血病、急性前骨髄球性白血病、アダマンチノーマ、腺癌、腺様嚢胞癌、腺腫、腺様歯原性腫瘍、副腎髄質癌、成人T細胞性白血病、高悪性度のNK細胞白血病、エイズ関連がん、エイズ関連リンパ腫、胞巣状軟部肉腫、エナメル上皮線維腫、肛門癌、未分化大細胞リンパ腫、未分化甲状腺癌、血管免疫芽球性T細胞リンパ腫、血管筋脂肪腫、血管肉腫、虫垂癌、星状細胞腫、非定型奇形腫様/横紋筋肉腫様腫瘍、基底細胞癌、基底細胞様癌、B細胞白血病、B細胞リンパ腫、ベリーニ管癌、胆道癌、膀胱癌、芽腫、骨癌、骨腫瘍、脳幹神経膠腫、脳腫瘍、乳癌、ブレンナー腫瘍、気管支腫瘍、細気管支肺胞癌、褐色腫、バーキットリンパ腫、原発不明癌、カルチノイド腫瘍、癌腫、上皮内癌、陰茎癌、原発不明癌、癌肉腫、キャッスルマン病、中枢神経系の胚芽腫、小脳星状細胞腫、大脳星状細胞腫、子宮頸癌、胆管癌、軟骨腫、軟骨肉腫、脊索腫、絨毛癌、脈絡叢乳頭腫、慢性リンパ球性白血病、慢性単球性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、慢性好中球性白血病、明細胞腫瘍、大腸癌、結腸直腸癌、頭蓋咽頭癌、皮膚T細胞リンパ腫、デゴス病、隆起性皮膚線維肉腫、類皮嚢胞、線維形成性小円形細胞腫瘍、びまん性大細胞型B細胞リンパ腫、胚芽異形成神経上皮腫瘍、胚性癌腫、内胚葉洞腫瘍、子宮内膜癌、子宮体癌、子宮内膜性腫瘍、腸症関連T細胞リンパ腫、上衣芽細胞腫、上衣腫、類上皮肉腫、赤白血病、食道癌、感覚神経芽腫、ユーイング腫瘍ファミリー、ユーイングファミリー肉腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管癌、乳房外パジェット病、卵管癌、封入奇形胎児、線維腫、線維肉腫、濾胞性リンパ腫、濾胞性甲状腺癌、膀胱癌、神経節腫瘍、神経節神経腫、胃癌、胃リンパ腫、消化器癌、消化器カルチノイド腫瘍、消化器間質腫瘍、胚細胞腫瘍、胚細胞腫、妊娠性絨毛癌、妊娠性絨毛性腫瘍、骨巨細胞腫、多形神経膠芽腫、神経膠腫、大脳神経膠腫症、グロームス腫瘍、グルカゴン産生腫瘍、生殖腺芽細胞腫、顆粒膜細胞腫、有毛細胞白血病、有毛細胞白血病、頭頸部癌、頭頸部癌、心臓癌、血管芽細胞腫、血管周囲細胞腫、血管肉腫、悪性血液疾患、肝細胞癌、肝脾T細胞リンパ腫、遺伝性乳癌卵巣癌症候群、ホジキンリンパ腫、ホジキンのリンパ腫、下咽頭癌、視床下部神経膠腫、炎症性乳癌、眼球内黒色腫、膵島細胞癌、膵島細胞腫瘍、若年性骨髄単球性白血病、カポジ肉腫、カポジの肉腫、腎癌、クラツキン腫瘍、クルケンベルグ腫瘍、喉頭癌、喉頭癌、悪性黒子黒色腫、白血病、白血病、口唇及び口腔癌、脂肪肉腫、肺癌、黄体腫、リンパ管腫、リンパ管肉腫、リンパ上皮腫、リンパ球性白血病、リンパ腫、マクログロブリン血症、悪性線維性組織球腫、骨の悪性線維性組織球腫、悪性神経膠腫、悪性中皮腫、悪性末梢神経鞘腫瘍、悪性ラブドイド腫瘍、悪性トリトン腫瘍、粘膜関連リンパ組織リンパ腫、マントル細胞リンパ腫、肥満細胞白血病、縦隔胚細胞腫瘍、縦隔腫瘍、甲状腺髄様癌、髄芽腫、髄芽腫、髄上皮腫、黒色腫、黒色腫、髄膜腫、メルケル細胞癌、中皮腫、中皮腫、原発不明の転移性頸部扁平上皮癌、転移性尿路上皮癌、混合ミュラー腫瘍、単球性白血病、口腔癌、ムチン性腫瘍、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫、菌状息肉症、菌状息肉症、骨髄異形成疾患、骨髄異形成症候群、骨髄性白血病、骨髄肉腫、骨髄増殖性疾患、粘液腫、鼻腔癌、鼻咽頭癌、鼻咽頭癌腫、新生物、神経鞘腫、神経芽細胞腫、神経芽細胞腫、神経線維腫、神経腫、結節型黒色腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、慢性閉塞性肺疾患(COPD)と共存する非小細胞肺癌(NSCLC)、眼腫瘍、乏突起星状細胞腫、乏突起神経膠腫、膨大細胞腫、視神経鞘髄膜腫、口腔癌、口腔癌、中咽頭癌、骨肉腫、骨肉腫、卵巣癌、卵巣癌、上皮性卵巣癌、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、乳房パジェット病、パンコースト腫瘍、膵臓癌、膵臓癌、甲状腺乳頭癌、乳頭腫、傍神経節腫、副鼻腔癌、甲状腺癌、陰茎癌、血管周囲類上皮細胞腫瘍、咽頭癌、褐色細胞腫、中分化の松果体実質腫瘍、松果体芽細胞腫、下垂体細胞腫、下垂体腺腫、下垂体腫瘍、形質細胞腫瘍、胸膜肺芽腫、多胚腫、前駆Tリンパ芽球性リンパ腫、原発性中枢神経系リンパ腫、原発性滲出性リンパ腫、原発性肝細胞癌、原発性肝癌、原発性腹膜癌、原始神経外胚葉性腫瘍、前立腺癌、腹膜偽粘液腫、直腸癌、腎細胞癌、第15番染色体上のNUT遺伝子の関与する気道癌、網膜芽細胞腫、横紋筋腫、横紋筋肉腫、リヒタートランスフォーメーション、仙尾部奇形腫、唾液腺癌、肉腫、シュワン細胞腫、脂腺癌、続発性腫瘍、精上皮腫、漿液腫瘍、セルトリ・ライディッヒ細胞腫瘍、性索間質性腫瘍、セザリー症候群、印環細胞癌、皮膚癌、青色小円形細胞腫瘍、小細胞癌、小細胞肺癌、小細胞型リンパ腫、小腸癌、軟組織肉腫、ソマトスタチン産生腫瘍、煤煙性いぼ、脊髄腫瘍、脊椎腫瘍、脾臓辺縁帯リンパ腫、扁平上皮細胞癌、胃癌、表在拡大型黒色腫、原始神経外胚葉性腫瘍、表面上皮間質腫瘍、滑膜肉腫、T細胞急性リンパ芽球性白血病、T細胞性大顆粒リンパ球性白血病、T細胞性白血病、T細胞性リンパ腫、T細胞性前リンパ球性白血病、奇形腫、末期リンパ腺癌、精巣癌、卵胞膜細胞腫、咽喉癌、胸腺癌、胸腺腫、甲状腺癌、腎盂と尿管の移行上皮癌、移行上皮癌、尿膜管癌、尿道癌、泌尿生殖器腫瘍、子宮肉腫、ブドウ膜黒色腫、膣癌、ヴェルナー・モリソン症候群、いぼ状癌、視経路神経膠腫、外陰癌、ワルデンストレームマクログロブリン血症、ワルチン腫瘍、ウィルムス腫瘍、又はその任意の組合せからなる群より選択されるがんを患っている。
【0093】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、治療後又は治療中の免疫応答の確立をモニタリングするのに特に適している。したがって、本発明のRNAseq法及び/又はシングルセルRNAseq法は、試料中の免疫レパートリーを分析し、その情報に基づいて、標的化された免疫応答を刺激又は抑制するのに最適である、適切な治療法、用量、処置様式などを選択することによって、治療法を最適化するのに適し得る。例えば、患者を、自己免疫疾患に関する免疫レパートリーについて評価し得、全身性又は標的化された免疫抑制レジメンを、その情報に基づいて選択し得る。
【0094】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、ワクチン応答を評価するのに特に適している。いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、ワクチンの投与に応答した免疫学的多様性を測定するのに適している。したがって、試料は、ワクチン接種後に得られ得、そしてワクチン投与前の時点の又はワクチン投与後の複数の時点の、試料とさらに比較され得る。例えば、ワクチン接種の前後に存在する免疫学的受容体の多様性の比較は、ワクチンに対する生物の応答の分析を支え得る。よって、本発明のRNAseq法及び/又はシングルセルRNAseq法は、候補ワクチンの選択において、候補ワクチンに対する個体の応答を決定するのに有用であり得る。
【0095】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、リンパ腫に起こる、クローン性再編成及び/又は染色体転座を評価するのに特に適している。「リンパ腫」という用語は、リンパ系から派生するがんを指す。リンパ腫は、リンパ球、すなわちBリンパ球及びTリンパ球(すなわちB細胞及びT細胞)の悪性腫瘍によって特徴付けられる。リンパ腫は一般的に、リンパ節、又は胃若しくは腸を含むがこれらに限定されない器官のリンパ組織の集合場所において始まる。リンパ腫は、場合によっては、骨髄及び血液に併発し得る。リンパ腫は、生体の一か所の部位から他の部分へと広がり得る。リンパ腫としては、ホジキンリンパ腫、非ホジキンリンパ腫、皮膚B細胞リンパ腫、活性化B細胞リンパ腫、びまん性大細胞型B細胞リンパ腫(DLBCL)、マンテル細胞リンパ腫(MCL)、濾胞中心リンパ腫、形質転換腫、中分化型リンパ球性リンパ腫、中悪性度リンパ球性リンパ腫(ILL)、びまん性低分化型リンパ球性リンパ腫(PDL)、中心細胞性リンパ腫、びまん性小分割細胞型リンパ腫(DSCCL)、末梢T細胞リンパ腫(PTCL)、皮膚T細胞リンパ腫、及びマントル層リンパ腫、及び低悪性度濾胞性リンパ腫が挙げられるがこれらに限定されない。
【0096】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法はまた、移植にも適用を見出し得る。特に、本発明のRNAseq法及び/又はシングルセルRNAseq法は、移植片拒絶に至る可能性のある、免疫応答を評価するのに適し得る。本明細書において使用する「移植」という用語は、「移植片(transplant)」又は「移植片(graft)」と呼ばれる細胞、組織、又は器官を、1人の被験者から採取し、そしてそれを又はそれらを、(通常は)異なる被験者に入れるプロセスを指す。移植片を提供する被験者は「ドナー」と呼ばれ、移植片を受ける被験者は「レシピエント」と呼ばれる。同じ種の2つの遺伝子的に異なる被験者間で移植された器官すなわち移植片は、「同種移植片」と呼ばれる。異なる種の被験者間で移植された移植片は、「異種移植片」と呼ばれる。典型的には、該被験者は、心臓、腎臓、肺、肝臓、膵臓、膵島、脳組織、胃、大腸、小腸、角膜、皮膚、気管、骨、骨髄、筋肉、又は膀胱からなる群より選択される移植片で移植されたことがあり得る。
【0097】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、被験者の免疫老化を評価するのに特に適している。本明細書において使用する「免疫老化」という用語は、例えば、がん、ワクチン接種、とりわけ感染性病原体に対する免疫応答の障害をもたらす、免疫機能の低下を指す。それは、感染に応答する宿主の能力、及び、特にワクチン接種による長期免疫記憶の発達の両方に関わる。この免疫力低下は遍在的であり、実際の年齢よりも平均寿命に対する年齢の関数として、短命及び長命の種の両方において見られる。免疫力低下は、高齢者の間の罹患率及び死亡率の頻度の上昇に対する主な寄与因子であると考えられる。免疫老化は、無作為な劣化現象ではなく、むしろそれは進化パターンに逆行するように繰り返され、免疫老化によって影響を受けるパラメーターの大半は、遺伝子制御下にあるようである。免疫老化はまた、ウイルス及び細菌などの様々な抗原に対する不可避的な曝露という連続的な攻撃の結果と時に考え得られ得る。免疫老化は、例えば、高齢の集団における多くの病理学的に重要な健康問題をもたらす、多因子容態である。
【0098】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、免疫力低下を診断するのに特に適している。例えば、V(D)Jの組換え異常は、晩期発症型複合免疫不全症及び自己免疫などの、幅広い免疫徴候を有する重症複合免疫不全症(すなわちT/B重症複合免疫不全症)を引き起こし得る。これらの患者の最初期の分子的診断は、特に造血幹細胞移植のための骨髄破壊的移植前治療レジメンの関与する場合には、最善の治療戦略を採用する必要がある。本発明のRNAseq法及び/又はシングルセルRNAseq法は、この必要性を充足する。
【0099】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、T細胞及びB細胞の発生に関する基本的な研究にも適用され得る。現在、どのようにT細胞及びB細胞が様々な表現型へと発達していくかを解明するために、多くの努力が費やされている。特定のクローンを追跡及び定量する能力は、この努力において必須である。記載の方法は、迅速で高感度で高い解像度で、関連するT細胞及びB細胞の集団のモニタリングを可能とする。
【0100】
いくつかの実施態様では、本発明のRNAseq法及び/又はシングルセルRNAseq法は、関連する抗体の選択に、特に治療法に使用することのできる抗体の選択に有用であり得る。特に、本発明のRNAseq法及び/又はシングルセルRNAseq法は、抗体産生細胞のクローン性を決定するのに特に有用である。抗体産生細胞は、抗体を産生する細胞である。このような細胞は典型的には、哺乳動物免疫応答に関し(例えばBリンパ球及び形質細胞)、かつ宿主の免疫系によって「自然に対を形成」している免疫グロブリン重鎖及び軽鎖を産生する細胞である。抗体産生細胞としては、抗体を産生するハイブリドーマ細胞が挙げられる。抗体産生細胞は、選択された抗原、例えばペプチドを用いて免疫化された動物、選択された抗原を用いて免疫化されていない動物(例えば、自己免疫疾患を有する動物)又は疾患若しくは感染の結果として抗原に対する免疫応答を発達させた動物から得ることができる。動物は、免疫応答を生じるのに適した当技術分野において周知の技術のいずれかを使用して、選択された抗原を用いて免疫化され得る(Handbook of Experimental Immunology D. M. Weir (編), Vol 4, Blackwell Scientific Publishers, Oxford, England, 1986参照)。本発明の脈絡では、「選択された抗原」という語句は、これに対して抗体が作製され得る任意の物質、例えば、とりわけ、タンパク質、糖質、無機若しくは有機分子、酵素プロセスの中間体に似た遷移状態類似体、核酸、細胞、例えば癌細胞、細胞抽出物、病原体、例えば生ウイルス又は弱毒化ウイルス、細菌、ワクチンなどを含む。当業者には理解されるであろうように、免疫原性の低い抗原は、免疫応答を増加させるためのアジュバント若しくはハプテン(例えば完全又は不完全フロイントアジュバント)を、又はキーホールリムペットヘモシアニン(KLH)などの担体を伴っていてもよい。したがって、本発明のさらなる目的は、(a)関心対象の抗原を用いて動物を免疫化する工程;(b)免疫化動物から複数のB細胞を単離する工程;(c)本発明のRNAseq法及び/又はシングルセルRNAseq法を実施することによって複数のB細胞を特徴付ける工程、並びに(d)関心対象の抗体の配列を提供する工程を含む、関心対象の抗原に特異的に結合する抗体を選択するための方法に関する。
【0101】
本発明のキット:
本発明のさらなる目的は、上記の1つ以上の方法を実施するためのキット又は試薬に関する。対象試薬及びそのキットは、大きく変更されてもよい。例えば、試薬は、あるクラス若しくはサブタイプの免疫学的受容体のcDNA合成用、PCR増幅用、及び/又はハイスループットシークエンス用のプライマーセットを含み得る。特に、本発明のキットは、本発明の少なくとも1つのTSOを含む。いくつかの実施態様では、本発明のキットは、異なるUMI配列の存在によって特徴付けられる、複数のTSOを含む。いくつかの実施態様では、本発明のキットは、上記のような96個のTSOを含む。該キットはまた、様々な方法で使用される試薬、例えば細胞選別用の一団の抗体、プライマー、予め混合されていても別々でもよいdNTP、1つ以上の固有に標識されたdNTP、上記のようなアダプター配列、又は他の合成後標識用試薬、例えば蛍光色素の化学的に活性な誘導体、酵素、例えば逆転写酵素、DNAポリメラーゼ、RNAポリメラーゼ、トランスポザーゼなど、様々な緩衝媒体、例えばハイブリダイゼーション用及び洗浄用緩衝液、精製用ビーズなども含み得る。該キットはさらに、統計分析用のソフトウェアパッケージを含み得、そして、2つのレパートリー間の一致の確率を計算するための参照データベースを含み得る。上記の成分に加えて、対象キットはさらに、対象の方法を実施するための説明書を含むだろう。これらの説明書は、対象キットに様々な形式で存在し得、その1つ以上はキット内に存在し得る。これらの説明書が存在し得る1つの形式は、キット包装内の添付文書においてなどの、例えば、情報が印刷されている1枚若しくは数枚の紙などの、適切な媒体若しくは基材上に印字された情報として存在し得る。さらに別の手段は、コンピューターで読み出し可能な媒体であり、この上に情報が記録されている。存在し得るさらに別の手段は、ウェブサイトアドレスであり、これはインターネットを介して使用することにより、削除されたサイトの情報にアクセスし得る。任意の慣用的な手段がキットに存在し得る。上記の分析法は、本発明の様々な態様を実施するためにコンピューターによって実行可能な指示のプログラムとして具現化され得る。上記の任意の技術は、コンピューターに積載されたソフトウェアコンポーネント又は他の情報機器若しくはデジタルデバイスを用いて実施され得る。このようなことが可能となった場合、コンピューター、機器又はデバイスは次いで、上記の技術を実施して、上記の様式で複数の遺伝子に関連した数値のセットの分析を補助し得るか、又はこのような関連した数値を比較し得る。ソフトウェアコンポーネントは、固定媒体からローディングされても、又は、インターネット若しくは他の種類のコンピューターネットワークなどの通信媒体を通してアクセスされてもよい。1つ以上のコンピュータープログラムに実装された上記フィーチャーは、このようなプログラムを実行する1つ以上のコンピューターによって実施され得る。ソフトウェア製品(又はコンポーネント)は、機械可読型媒体に明白に実装され得、そして、a)複数の免疫学的受容体又はその断片からシークエンスデータをクラスタリングする工程;及びb)該シークエンスデータに関する統計分析出力を提供する工程を含む、操作の実行を1つ以上のデータ処理装置が引き起こすように操作可能な指示を含む。また本明細書において、機械可読型媒体に明白に実装されたソフトウェア製品(又はコンポーネント)も提供され、そしてそれは、多数のシークエンスリードについてのシークエンスデータを保存する工程を含む、操作の実行を1つ以上のデータ処理装置が引き起こすように操作可能な指示を含む。いくつかの例では、ソフトウェア製品(又はコンポーネント)は、シークエンスデータをV、D、J、C、VJ、VDJ、VJC、VDJC、若しくはVJ/VDJ系統使用クラスに割り当てるための指示、又は、多次元プロットで分析出力を提示するための指示を含む。場合によっては、多次元プロットは、以下の1つについての全ての可能な数値を列挙する:V、D、J又はC(例えば、全ての可能なV値を列挙する1つの軸、全ての可能なD値を列挙する第二の軸、及び全ての可能なJ値を列挙する第三の軸を含む、3次元プロット)。場合によっては、ソフトウェア製品(又はコンポーネント)は、容態に関連した単一の試料から1つ以上の固有のパターンを同定するための指示を含む。ソフトウェア製品(又はコンポーネント)はまた、増幅の偏りを正規化するための指示も含み得る。いくつかの例では、ソフトウェア製品(又はコンポーネント)は、シークエンスエラーについて正規化するための制御データを使用するための、又は、シークエンスエラーを減らすためのクラスタリングプロセスを使用するための、指示を含み得る。ソフトウェア製品(又はコンポーネント)はまた、シークエンスエラーを減らすための2つの別々のプライマーセット又はPCRフィルターを使用するための指示も含み得る。
【0102】
本発明は、以下の図面及び実施例によってさらに説明されるだろう。しかしながら、これらの実施例及び図面は、いずれにしても、本発明の範囲を制限するものと解釈されるべきではない。
【図面の簡単な説明】
【0103】
【
図1】FB5Pseq(FACSベースの5プライム末端シークエンス)実験ワークフローの概観。対を形成した可変性のB細胞受容体配列のコンピューター上での再構築を可能とする、IGH及びIGK又はIGLの増幅されたcDNAに対する、リード1配列のマッピングの図解。
【
図2】FB5Pseq生物情報学ワークフローの概観。単一細胞遺伝子発現マトリックス及びBCR又はTCRのレパートリー配列の作製のための、リード1及びリード2のFASTQファイルから出発した生物情報学パイプラインの主な工程。
【
図3A-E】ヒト扁桃B細胞サブセットに関するFB5seq品質の測度。(A)FB5Pseqを用いてヒト扁桃B細胞サブセットを研究するための実験ワークフロー。(B)記憶(Memory)B細胞(Mem、n=73扁桃1、n=65扁桃2)、胚中心B細胞(GC、n=235扁桃1、n=242扁桃2)、及び形質芽細胞/形質細胞(n=78扁桃1、n=152扁桃2)についての、ERCC(外部RNA標準コンソーシアム)スパイクインmRNA検出(方法参照)に基づいてコンピューター計算された、FB5Pseqの1細胞あたりの定量的精度。黒線は、中央値と95%信頼区間エラーバーを示す。(C)2つの別個の実験におけるERCCスパイクインmRNA検出率(方法参照)に基づいてコンピューター計算された、FB5Pseqの分子的感度。点線は、50%の検出確率に到達するに必要とされるERCC分子数を示す。(D~E)ヒト扁桃記憶B細胞(n=73扁桃1、n=65扁桃2)、胚中心B細胞(n=235扁桃1、n=242扁桃2)及び形質芽細胞/形質細胞(n=78扁桃1、n=152扁桃2)において検出された、固有な遺伝子(D)及び分子(E)の総数。黒線は、中央値と95%信頼区間エラーバーを示す。(F)扁桃1及び扁桃2の試料に由来する記憶B細胞、胚中心B細胞、及び形質芽細胞/形質細胞の中で、再構成された生産的なIGH配列及びIGK/L配列を有する(1)、IGK/L配列のみを有する(2)、IGH配列のみを有する(3)、又はB細胞受容体配列を全く有さない(白色)、細胞の相対的比率を示した円グラフ。各サブセットについて分析された細胞の総数は、円グラフの中心に示されている。
【
図3F】ヒト扁桃B細胞サブセットに関するFB5seq品質の測度。(A)FB5Pseqを用いてヒト扁桃B細胞サブセットを研究するための実験ワークフロー。(B)記憶(Memory)B細胞(Mem、n=73扁桃1、n=65扁桃2)、胚中心B細胞(GC、n=235扁桃1、n=242扁桃2)、及び形質芽細胞/形質細胞(n=78扁桃1、n=152扁桃2)についての、ERCC(外部RNA標準コンソーシアム)スパイクインmRNA検出(方法参照)に基づいてコンピューター計算された、FB5Pseqの1細胞あたりの定量的精度。黒線は、中央値と95%信頼区間エラーバーを示す。(C)2つの別個の実験におけるERCCスパイクインmRNA検出率(方法参照)に基づいてコンピューター計算された、FB5Pseqの分子的感度。点線は、50%の検出確率に到達するに必要とされるERCC分子数を示す。(D~E)ヒト扁桃記憶B細胞(n=73扁桃1、n=65扁桃2)、胚中心B細胞(n=235扁桃1、n=242扁桃2)及び形質芽細胞/形質細胞(n=78扁桃1、n=152扁桃2)において検出された、固有な遺伝子(D)及び分子(E)の総数。黒線は、中央値と95%信頼区間エラーバーを示す。(F)扁桃1及び扁桃2の試料に由来する記憶B細胞、胚中心B細胞、及び形質芽細胞/形質細胞の中で、再構成された生産的なIGH配列及びIGK/L配列を有する(1)、IGK/L配列のみを有する(2)、IGH配列のみを有する(3)、又はB細胞受容体配列を全く有さない(白色)、細胞の相対的比率を示した円グラフ。各サブセットについて分析された細胞の総数は、円グラフの中心に示されている。
【
図4A】ヒト扁桃B細胞サブセットのFB5Pseq分析。(A)そのIGHアイソタイプ及び表現型によって選別されたヒト扁桃1(丸)及び扁桃2(三角)のB細胞のIGH突然変異頻度を示した散布図(記憶B細胞:n=11 IgM/IgD陽性、n=37 IgG陽性、及びn=26 IgA陽性;胚中心B細胞:n=55 IgM/IgD陽性、n=174 IgG陽性、及びn=32 IgA陽性;形質芽細胞/形質細胞:n=4 IgM/IgD陽性、n=179 IgG陽性、及びn=42 IgA陽性形質芽細胞/形質細胞)。黒線は、中央値を示す。(B)そのIGK/Lアイソタイプ及び表現型によって選別されたヒト扁桃1(丸)及び扁桃2(三角)のB細胞のIGK/L突然変異頻度を示した散布図(記憶B細胞:n=71 Igκ陽性、n=51 Igλ陽性;胚中心B細胞:n=253 Igκ陽性、n=163 Igλ陽性;形質芽細胞/形質細胞:n=139 Igκ陽性、n=84 Igλ陽性)。
【
図4B】ヒト扁桃B細胞サブセットのFB5Pseq分析。(A)そのIGHアイソタイプ及び表現型によって選別されたヒト扁桃1(丸)及び扁桃2(三角)のB細胞のIGH突然変異頻度を示した散布図(記憶B細胞:n=11 IgM/IgD陽性、n=37 IgG陽性、及びn=26 IgA陽性;胚中心B細胞:n=55 IgM/IgD陽性、n=174 IgG陽性、及びn=32 IgA陽性;形質芽細胞/形質細胞:n=4 IgM/IgD陽性、n=179 IgG陽性、及びn=42 IgA陽性形質芽細胞/形質細胞)。黒線は、中央値を示す。(B)そのIGK/Lアイソタイプ及び表現型によって選別されたヒト扁桃1(丸)及び扁桃2(三角)のB細胞のIGK/L突然変異頻度を示した散布図(記憶B細胞:n=71 Igκ陽性、n=51 Igλ陽性;胚中心B細胞:n=253 Igκ陽性、n=163 Igλ陽性;形質芽細胞/形質細胞:n=139 Igκ陽性、n=84 Igλ陽性)。
【
図5A-E】ヒト末梢血中の抗原特異的CD4T細胞のFB5Pseq分析。(A)FB5Pseqを用いた、ヒト末梢血中のカンジダ・アルビカンス(Candida albicans)特異的なCD4T細胞を研究するための実験ワークフロー。(B)カンジダ・アルビカンス特異的なCD4T細胞(n=82)についてのERCCスパイクインmRNA検出(方法を参照)に基づいてコンピューター計算されたFB5Pseqの1細胞あたりの定量的精度。黒線は、中央値と95%信頼区間エラーバーを示す。(C)カンジダ・アルビカンス特異的なCD4T細胞(n=82)において検出された固有の遺伝子の総数。黒線は、中央値と95%信頼区間エラーバーを示す。(D)カンジダ・アルビカンス特異的なCD4T細胞の中で(n=82)、再構築された生産的なTCRA及びTCRBの配列を有する(黒色)、TCRB配列のみを有する(3)、TCRA配列のみを有する(2)、又はTCR配列を全く有さない(1)、細胞の相対的比率を示した円グラフ。(E)カンジダ・アルビカンス特異的なCD4T細胞(n=67)の中でのTCRBクローンの分布。黒いセクターは、分析された単一細胞内のTCRBクローン(2個以上の細胞によって発現されているクローン型)の比率を示す(白いセクター:固有のクローン型)。
【0104】
実施例1:
材料及び方法
ヒト試料
35歳男性(扁桃1)及び30歳女性(扁桃2)の非悪性扁桃試料が、Carnot/Calym研究所(フランス国立研究機構、フランス、https://www.calym.org/-Viable-cell-collection-CeVi-.html)のCeViコレクションから凍結生細胞懸濁液として得られた。末梢血単核細胞(PBMC)が、ナント大学病院において収集され、そしてカンジダ・アルビカンス特異的T細胞を単離するためのペプチド再刺激アッセイにおいて新鮮なままで使用された。書面によるインフォームドコンセントをドナーから得た。
【0105】
B細胞サブセットのフローサイトメトリー及び細胞選別
凍結生細胞懸濁液を、RPMI+10%ウシ胎児血清中37℃で解凍し、その後、FACS緩衝液(PBS+5%ウシ胎児血清+2mM EDTA)に108個の細胞/mlの濃度で染色のために再懸濁した。細胞をまず、2%の正常マウス血清及びFc-Block(BDバイオサイエンシーズ社)と共に氷上で10分間インキュベートした。その後、細胞を、フルオロフォアのコンジュゲートした抗体の混合物と共に氷上で30分間インキュベートした。細胞をPBSで洗浄し、その後、氷上で10分間、Live/Dead Fixable Aqua死細胞染色液(サーモフィッシャー社)と共にインキュベートした。FACS緩衝液中で最終洗浄後、細胞を、4レーザーBD FACS Influx(BDバイオサイエンシーズ社)での細胞選別のために、107個の細胞/mlの濃度で、FACS緩衝液に再懸濁した。
【0106】
記憶B細胞は、CD3陰性CD14陰性IgD陰性CD20陽性CD10陰性CD38loCD27陽性SSClo単一生細胞としてゲーティングされた。胚中心B細胞は、CD3陰性CD14陰性IgD陰性CD20陽性CD10陽性CD38陽性単一生細胞としてゲーティングされた。形質芽細胞/形質細胞は、CD3陰性CD14陰性IgD陰性CD38hiCD27陽性SSChi単一生細胞としてゲーティングされた。
【0107】
抗原特異的T細胞の再刺激及び細胞選別
新鮮な末梢血単核細胞(10~20×106個の細胞、最終濃度10×106個の細胞/ml)を、1μg/mlの抗CD40抗体(HB14、ミルテニーバイオテク社)の存在下で、RPMI+5%ヒト血清中、0.6nmol/mlのPepTivatorカンジダ・アルビカンスMP65(11アミノ酸が重複している15アミノ酸長のペプチドのプール、ミルテニーバイオテク社)を用いて37℃で3時間刺激した。刺激後、末梢血単核細胞を、フィコエリトリン(PE)にコンジュゲートさせた抗CD154抗体(5C8、ミルテニーバイオテク社)を用いて標識し、抗PE磁気ビーズ(ミルテニーバイオテク社)を用いて濃縮した。濃縮後、細胞を、PerCP-Cy5.5抗CD4抗体(RPA-T4、バイオレジェンド社)、AlexaFluor700抗CD3抗体(SK7、バイオレジェンド社)及びAPC-Cy7抗CD45RA抗体(HI100、バイオレジェンド社)を用いて染色し、抗原特異的T細胞を、単一細胞選別のために、CD3陽性CD4陽性CD45RA陰性CD154陽性単一生細胞としてゲーティングした。
【0108】
シングルセルRNAシークエンス
単一細胞を、1ウェルあたり2μlの溶解ミックスを含有している、氷冷96ウェルPCRプレート(サーモフィッシャー社)にFACSで選別した。溶解ミックスは、0.5μlの0.4%(v/v)のTriton X-100(シグマアルドリッチ社)、0.05μlの40U/μlのRnaseOUT(サーモフィッシャー社)、0.08μlの25mMのdNTPミックス(サーモフィッシャー社)、0.5μlの10μMの(dT)30_Smarterプライマー、0.05μlの0.5pg/μlの外部RNA標準コンソーシアム(ERCC)スパイクインミックス(サーモフィッシャー社)、及び0.82μlのPCR等級のH2O(キアゲン社)を含有していた。
【0109】
B細胞サブセットの選別のために、インデックス選別モードを作動させて、各々の選別された単一細胞の様々な蛍光強度を記録した。インデックス選別FCSファイルは、FlowJoソフトウェアで可視化され、補正されたパラメーター値がさらなる処理のためにCSVの表にエキスポートされた。Rプログラミングソフトウェアにおける線形目盛りでの可視化のために、本発明者らは、蛍光パラメーターに双曲線逆正弦変換を適用した。どの96ウェルプレートにおいても、2つのウェル(H1、H12)は空のままにし、プロトコール全体を通して陰性対照として処理された。
【0110】
細胞選別直後、各プレートを、接着フィルム(サーモフィッシャー社)で覆い、ベンチトップ型卓上遠心分離機で短時間遠心沈殿させ、ドライアイス上で凍結させた。溶解ミックス中に単一細胞を含有しているプレートを-80℃で保存し、さらに処理されるまでドライアイス上で(T細胞のみ)出荷した。
【0111】
溶解ミックス中に単一細胞を含有しているプレートを、氷上で解凍し、ベンチトップ型卓上遠心分離機で短時間遠心沈殿させ、サーマルサイクラー(蓋の温度は72℃)で72℃で3分間インキュベートした。直後、プレートを、氷の上に置き戻し、3μlの逆転写マスターミックスを各ウェルに加えた。逆転写マスターミックスは、0.25μlの200U/μlのSuperScript II(サーモフィッシャー社)、0.25μlの40U/μlのRnaseOUT(サーモフィッシャー社)、及び2.5μlの2×逆転写マスターミックスを含有していた。2×逆転写マスターミックスは、1μlの5×SuperScript II緩衝液(サーモフィッシャー社)、0.25μlの100mMのDTT(サーモフィッシャー社)、1μlの5Mのベタイン(シグマアルドリッチ社)、0.03μlの1M MgCl2(シグマアルドリッチ社)、0.125μlの100μMのウェル特異的な鋳型乗換えオリゴヌクレオチドTSO_BCx_UMI5_TATA、及び0.095μlのPCR等級のH2O(キアゲン社)を含有していた。逆転写は、サーマルサイクラー(蓋の温度は70℃)中で42℃で90分間、それに続いて、50℃で2分間、及び42℃で2分間、次いで70℃で15分間を10サイクルにより行なわれた。単一細胞のcDNAを有するプレートは、さらに処理されるまで-20℃で保存された。
【0112】
cDNAの増幅のために、7.5μlのLD-PCRマスターミックスを各ウェルに加えた。LD-PCRマスターミックスは、6.25μlの2×KAPAハイファイホットスタートレディーミックス(ロシュ・ダイアグノスティックス社)、0.125μlの20μMのPCR_Satija正方向プライマー、0.125μlの20μMのSmarterR逆方向プライマー、及び1μlのPCR等級のH2O(キアゲン社)を含有していた。増幅は、サーマルサイクラー(蓋の温度は98℃)中で98℃で3分間、それに続いて、98℃で15秒間、67℃で20秒間、72℃で6分間を22サイクル、次いで72℃で5分間かけての最終伸長により行なわれた。増幅された単一細胞のcDNAを含むプレートは、さらに処理されるまで-20℃で保存された。
【0113】
ライブラリーの調製のために、96ウェルプレートの各ウェルから5μlの増幅cDNAをプールし、PCR等級のH2O(キアゲン社)を用いて500μlとした。2回の0.6×固相可逆的固定化ビーズ(アンピュアXP、ベックマン、又はCleanNGS、Proteigene)による清浄を使用して、100μlのプールされたcDNAを精製し、最終的に15μlのPCR等級のH2O(キアゲン社)中に溶出した。Qubit dsDNA HSアッセイ(サーモフィッシャー社)を用いた定量後、800pgの精製cDNAプールを、Nextera XT DNA試料調製キット(イルミナ社)を用いて、ライブラリーPCR中にタグメンテーションされたcDNAの5'末端を濃縮するために、改変を加えた製造業者の説明書に従って処理した。タグメンテーション及び中和後、25μlのタグメンテーションされたcDNAを、15μlのNextera PCRマスターミックス、5μlのNextera i5プライマー(S5xx、イルミナ社)、及び5μlのカスタムi7プライマーミックス(0.5μMのi7_BCx+10μMのi7_プライマー)を用いて増幅した。増幅は、サーマルサイクラー(蓋の温度は72℃)で、72℃で3分間、95℃で30秒間、続いて、95℃で10秒間、55℃で30秒間、72℃で30秒間を12サイクル、その後、72℃で5分間の最終伸長により行なわれた。結果として得られたライブラリーは、0.8×固相可逆的固定ビーズ(アンピュアXP、ベックマン、又はCleanNGS、Proteigene)を用いて精製された。
【0114】
単一細胞の複数の96ウェルプレートから作製され、かつ別個のi7バーコードを有するライブラリーを、以下のプライマー及びサイクルを用いて、ペアエンドシングルインデックスモードで1細胞あたり5×105個のリードに標的化する、高出力75サイクルフローセルを含む、イルミナ社のNextSeq550プラットフォームでのシークエンスのためにプールした。リード1(リード1_SP、67サイクル)、リードi7(i7_SP、8サイクル)、リード2(リード2_SP、16サイクル)。
【0115】
シングルセルRNAシークエンスデータの処理
本発明者らは、カスタム生物情報パイプラインを使用してfastqファイルを処理し、単一細胞遺伝子発現マトリックス及びBCR又はTCR配列ファイルを作成した。FB5P-seq生物情報パイプラインを操作するための詳細な説明書は、https://github.com/MilpiedLab/に見られ得る。簡潔に言えば、遺伝子発現マトリックスを得るためのパイプラインは、リード2からの細胞バーコード及びUMIを抽出すること、並びにSTAR及びHTSeqCountを使用して参照ゲノムに対してリード1を整列させることに依拠した、Drop-seqパイプラインから適応させた。BCR又はTCRの配列再構築のために、本発明者らは、リード1配列に基づいた各細胞についてのデノボトランスクリプトームアセンブリのためにTrinityを使用し、その後、MigMap、Blastn及びKallistoを使用して、生産的なBCR配列又はTCR配列について、得られたアイソフォームをフィルターにかけた。簡潔に言えば、MigMapを使用して、再構築されたコンティグが、生産的なV(D)J再編成に対応しているかどうかを評価し、そして、各コンティグについて生殖系列V、D及びJ遺伝子並びにCDR配列を同定した。各細胞について、同じV(D)J再編成に対応する再構築されたコンティグを、さらなる分析のために最大の配列は取って置きつつ、合わせた。本発明者らは、Blastnを使用して、定常領域遺伝子の参照配列に対して、再構築されたBCR又はTCRコンティグを整列させ、V(D)J再編成のインフレームで同定された定常領域を全く含まないコンティグを廃棄した。最後に、本発明者らは、シュードアライナーKallistoを使用して、各細胞のFB5Pseqリード1配列を、その再構築されたコンティグ上にマッピングし、そして、コンティグの発現を定量した。同じBCR鎖又はTCR鎖に対応するいくつかのコンティグが上記のフィルターを通過した場合には、本発明者らは、最も高い発現レベルを有するコンティグを保持した。
【0116】
1ウェルあたりの正確度(
図3B)は、log
10(UMI
ERCC-xxxxx+1)とlog
10(分子数
ERCC-xxxxx+1)との間のピアソン相関関数としてコンピューター計算され、ここでのUMI
ERCC-xxxxxは、ウェル内の遺伝子ERCC-xxxxxのUMI計数であり、そして分子数
ERCC-xxxxxは、ウェル内のERCC-xxxxxの実際の分子数である(1ウェルあたり2μlの溶解ミックス中の1:2,000,000の希釈率に基づいて)。各ウェルについて、検出されたERCC-xxxxx(UMI
ERCC-xxxxx>0)のみが、正確度の計算のために考慮された。
【0117】
感度を推定するために(
図3C)、少なくとも1つの分子が検出された(UMI
ERCC-xxxxx>0)ウェルの比率を、それぞれ扁桃1又は扁桃2から選別されたヒトB細胞に対応する5個又は6個の96ウェルプレートの全てのウェルについて計算した。各ERCC-xxxxx遺伝子の数値を、log
10(分子数
ERCC-xxxxx)に対してプロットし、標準曲線を、グラフパッドプリズム8.1.2の非対称シグモイド5PLモデルで補間して、各データセットのEC50をコンピューター計算した。
【0118】
遺伝子上の正規化されたカバレッジ(データは示されていない)を、扁桃1及び扁桃2から選別されたヒトB細胞に対応する、11個のシングルセルRNAseqの96ウェルプレートから、RSeQCのgeneBody_coverage on bamファイルを用いてコンピューター計算した。
【0119】
シングルセル遺伝子発現分析
各々のデータセット(扁桃1、扁桃2、T細胞)に対する品質制御を、品質の悪い細胞を除去するために独立的に実施した。250個未満の遺伝子の検出された細胞は除去された。本発明者らはさらに、UMI計数、検出された遺伝子の数、又はERCCの正確度について、中央値から3中央絶対偏差(MAD)未満の数値を有する細胞を除外し、及び、ERCC転写物の比率について、中央値から3MADを超える数値を有する細胞を除外した。
【0120】
各細胞の遺伝子発現UMI計数値は、10,000のスケールファクターを用いてSeurat v3正規化データを用いて対数正規化された。扁桃1及び扁桃2のB細胞のデータは一緒に分析された。カンジダ・アルビカンス特異的T細胞のデータは別々に分析された。BCR遺伝子又はTCR遺伝子を除外した、4000個の可変遺伝子が、Seurat FindVariableFeaturesを用いて同定された。Seuratのスケールデータを用いてスケーリングした後、主成分分析が、SeuratのRunPCAを用いて可変遺伝子に対して実施され、40個の主成分に対してSeuratのRunTSNEを用いて2次元tSNE(t分布型確率的近傍埋め込み法)のプロットに埋め込まれた。細胞周期の期間は、SeuratのCellCycleScoringを用いて帰属させた。タンパク質の発現又は他のメタデータ(BCR又はTCRの配列に関連した情報を含む)をインデックスで選別することによって着色されたtSNEの埋め込みを示したプロットは、ggplot2 ggplotを用いて作成された。遺伝子発現によって着色されたtSNEの埋め込みを示したプロットは、SeuratのFeaturePlotを用いて作成された。遺伝子発現ヒートマップは、カスタム機能を用いてプロットされた(リクエストすれば入手可能)。
【0121】
結果
FB5Pseq実験ワークフロー
本発明者らは、FB5Pseq実験ワークフローの設計について、既存の完全長
3及び5'末端
4,5のscRNAseqプロトコールを基盤とした。FB5Pseqの主な独創性は、逆転写中に、細胞特異的バーコード付与を実施し、5bpのUMIを組み込み、そして、増幅cDNAの5'末端を転写開始部位からではなく、それらの3'末端からシークエンスしたことであった(
図1A~B)。FB5Pseqでは、96ウェルプレート中の関心対象の単一細胞を、FACSによって、慣例的には10色の染色戦略を使用して選別して、インデックス選別を通して全パラメーターを記録しながら、B細胞又はT細胞の特定のサブセットを同定及び濃縮する。単一細胞を、外部RNA標準コンソーシアム(ERCC)スパイクインmRNA(1ウェルあたり0.025pg)を含有している溶解緩衝液に収集し、選別されたプレートをドライアイス上で直ちに凍結させ、さらに処理するまで-80℃で保存した。各ウェルに添加されたERCCスパイクインmRNAの量は、一般的に殆どmRNAを含有していないリンパ球を研究する場合、ERCC遺伝子をカバーしているシークエンスリードの約5%が得られるように最適化された。mRNAの逆転写(RT)、cDNAの5'末端におけるバーコード付与、及びPCR増幅は、鋳型乗換え(TS)アプローチを用いて実施される。特に、本発明者らのTSO設計は、PCRハンドル(逆転写開始時に3'末端に導入されたものとは異なる)、8bpのウェル特異的なバーコード、それに続く5bpのUMI、TATAスペーサー
6、及び3つのリボグアニンを含んでいた。本発明者らは、FB5Pseqライブラリー内のTSOコンカテマーを回避するために、96個のウェル特異的なバーコード配列を経験的に選択した。増幅後、各ウェルのバーコード付与された完全長cDNAを、精製及び1チューブライブラリー調製のためにプールした。各プレートについて、バーコード付与されたcDNAの5'末端に標的化するイルミナシークエンスライブラリーは、プレートに関連したi7バーコードを取り込んだ、改変されたトランスポザーゼに基づいた方法によって調製される。FB5Pseqライブラリー調製プロトコールは、費用対効果が高く(96ウェルプレートのライブラリー調製については260ユーロ)、容易にスケールアップでき、ピペッターロボットに装備され得る。
【0122】
FB5Pseqライブラリーは、ペアエンドシングルインデックスモードで、その3'末端からの遺伝子挿入断片をカバーしているリード1、プレートバーコードに割り当てられたリードi7、並びにウェルのバーコード及びUMIをカバーしているリード2を用いてシークエンスされる。FB5Pseqライブラリーは、100~850bpの遺伝子挿入断片を含む、幅広いサイズ分布を有するので、リード1配列は、転写開始部位の約30から850塩基下流の転写物の5'末端をカバーする。結果として、シークエンスリードは、IGH及びIGK/Lから発現されるmRNAの全可変領域及び定常領域のかなりの部分をカバーし(
図1)、scRNAシークエンスデータからのBCRレパートリーのコンピューター計算でのアセンブリ及び再構築が可能となる。TCRα及びTCRβの遺伝子は、類似した構造を共有しているので、FB5Pseqは、T細胞が分析される場合、scRNAシークエンスデータからTCRレパートリーを再構築するのに同等に適している。
【0123】
FB5Pseqの生物情報学的ワークフロー
FB5Pseqデータを処理することにより、それぞれB細胞又はT細胞を分析する場合、単一細胞の遺伝子数のマトリックス及び単一細胞のBCR又はTCRのレパートリー配列の両方が発生する。ウェル特異的なバーコード及びUMIをリード2配列から抽出し、低品質又は割り当てられていないリードをフィルターで除去した後、本発明者らは、遺伝子発現及びレパートリーの分析のために、2つの別々のパイプラインを使用する(
図2)。トランスクリプトーム分析パイプラインは、Droqシークエンスパイプラインから導き出された
7。簡潔に言えば、それは、全リード1配列を参照ゲノムにマッピングし、その後、各細胞内の各遺伝子について、UMI配列を通して固有分子の数を定量することからなる。実験における全ての96ウェルプレートのデータを合わせた後、本発明者らは、結果として得られた細胞毎の遺伝子数マトリックスをフィルターにかけて、低品質の細胞を除外し、1細胞あたりの全UMI含量によって正規化する。
【0124】
FB5PseqデータからBCR又はTCRのレパートリー配列を抽出するために、本発明者らは、デノボ単一細胞トランスクリプトームアセンブリ、及び、再構築された長い転写物(コンティグ又はアイソフォーム)の、可変免疫グロブリン又はTCR遺伝子の公共データベース上へのマッピングに基づいて、本発明者独自のパイプラインを開発した。本発明者らは、同定された定常領域遺伝子のインフレームにある、生産的なV(D)J再編成に対応する、コンティグを同定及び選択する。複数のアイソフォームが、単一細胞内の所与の鎖(例えばIGH)について同定される場合、本発明者らは、最も高度に発現されたアイソフォームを割り当て、その他(群)は廃棄する。初期の検証実験において、本発明者らのパイプラインは、IGH可変領域分析のためのRT-PCR、それに続くサンガーシークエンス(データは示されていない)と同等に有効かつ正確であり、主な利点は、同じscRNAシークエンスの実行から、IGH及びIGK/L、又はTCRA及びTCRBの両方の、完全な可変領域及び定常領域の大部分を読み出すことである。
【0125】
ヒト扁桃B細胞サブセットに関するFB5Pseq品質の測度
本発明者らのscRNAseqプロトコールの成績を示すために、本発明者らは、2人の成人ヒトドナーから、扁桃1及び扁桃2と呼ばれる、非悪性扁桃細胞懸濁液を入手した。表面マーカー染色に基づいて、本発明者らは、単球、T細胞、及びナイーブB細胞を除外し、そしてFB5Pseq分析のために、記憶(Mem)B細胞、胚中心(GC)B細胞、及び形質芽細胞又は形質細胞(PB/PC)を選別した(
図3A)。本発明者らは、2つの別々の実験において扁桃1及び扁桃2の試料を処理し、それぞれ5個及び6個のプレートからライブラリーを作成した。ライブラリーは、1細胞あたり約500,000個のリードの平均深度でシークエンスされた(データは示されていない)。生物情報学による品質制御後、本発明者らは、遺伝子発現データセットにおける90%を超える細胞を保持した(データは示されていない)。本発明者らは、それぞれERCCスパイクイン検出レベル及び検出率に基づいて、1細胞あたりの正確度(
図3B)及び1回の実験あたりの感度(
図3C)をコンピューター計算した
1,2。全ての細胞が、それらの表現型とは独立して高い定量的精度を示し、全体の平均相関係数は0.83であった(
図3B)。分子的感度は、9.5から21.2の範囲であり(
図3C)、これは、他の現在のscRNAseqプロトコールと優るとも劣らない
2。本発明者らは、それぞれ記憶B細胞、胚中心B細胞、及び形質芽細胞/形質細胞において、1細胞あたり平均して987個、1712個、及び1307個の遺伝子を検出した(
図3D)。胚中心B細胞及び記憶B細胞は、形質芽細胞/形質細胞(平均UMI数は67,861個)よりも高い全分子数(平均UMI数は、それぞれ192,765個及び145,356個)を示した(
図3E)。
【0126】
方法の設計から予想されるように、FB5Pseqのリード1配列のカバレッジは、遺伝子本体の5’末端の方に偏り、遺伝子本体の長さの平均して3%から60%を強力にカバーする幅広い分布を有する(データは示されていない)。扁桃1及び扁桃2のB細胞サブセットでは、BCRの再構築のパイプラインは、大半の細胞について少なくとも1つの生産的BCR鎖を取り戻した(
図3F)。持続した抗体産生においてのBCR遺伝子転写物の高い発現と一致して、本発明者らは、大半の形質芽細胞/形質細胞について、対を形成したIGH及びIGK/Lレパートリーを得た。記憶B細胞及び胚中心B細胞では、本発明者らは、細胞の約50%において対を形成したIGH及びIGK/L配列を得て、残りの殆どの細胞においてはIGK/L配列のみを得た。IGK/L配列の回収率が優勢である可能性があった。なぜなら、IGK/L配列の発現レベルは、本発明者らのFB5PseqデータにおけるIGHの約2倍であったからである(データは示されていない)。
【0127】
要するに、正確度、感度、遺伝子カバレッジ、及びBCR配列回収率は、単一B細胞におけるトランスクリプトーム及びBCRレパートリーの統合解析における、FB5Pseq法の高い性能を強調した。
【0128】
ヒト扁桃B細胞サブセットのFB5Pseq分析
生物学的な概念実証として、本発明者らはさらに、扁桃1及び扁桃2のデータセットを分析した。遺伝子発現データに関するt分布型確率的近傍埋め込み(t-SNE)分析は、3つの主要な細胞クラスターを識別した。扁桃B細胞は、それらの選別される表現型(記憶B細胞、胚中心B細胞、又は形質芽細胞/形質細胞)に基づいてクラスターを形成し、試料の起源によってはクラスターを形成しなかった(データは示されていない)。細胞周期状態はさらに、非周期(G1期)胚中心B細胞から周期胚中心B細胞(S期及びG2期/M期)を分離した(データは示されていない)。インデックス選別を通して記録された表面タンパク質マーカーの発現レベルは、記憶B細胞(CD20+CD38loCD10-CD27+)、胚中心B細胞(CD20+CD38+CD10+)、及び形質芽細胞/形質細胞(CD38hiCD27hi)のゲーティング戦略と一致した(データは示されていない)。対応するmRNAの発現は、タンパク質の発現を反映したが(データは示されていない)、中間又は高いレベルのタンパク質にも関わらず、mRNAが検出されなかった数多くの細胞が判明した。さらに、本発明者らは、対応するクラスターにおける、記憶B細胞(CCR7、SELL、GPR183)、胚中心B細胞(AICDA、MK167、CD81)、又は形質芽細胞/形質細胞(XBP1、PRDM1、IRF4)について、既知のマーカー遺伝子の発現を検出し(データは示されていない)、各細胞サブセットについて最上位のマーカー遺伝子を同定した(データは示されていない)。そうした分析は、ヒトB細胞サブセットの以前のシングルセル定量PCR分析8及びバルクマイクロアレイ分析9,10に一致していた。
【0129】
単一細胞のBCRレパートリーデータをt-SNEへの埋め込みに統合することにより、本発明者らは、扁桃B細胞サブセットのIGH及びIGK/Lレパートリーがポリクローナルであったことを明らかとした(データは示されていない)。興味深いことには、体細胞突然変異の負荷量は、記憶B細胞、胚中心B細胞、及び形質芽細胞/形質細胞のIgκ鎖及びIgλ鎖において等しかったが(
図4B)、IGH突然変異率はアイソタイプに依存し、IgA陽性細胞は、表現型又は試料の起源に関わらず、最も突然変異したBCRを発現していた(
図4A)。これとは対照的に、IgM/IgD陽性細胞は、最も低い体細胞突然変異の負荷量を示した(
図4A)。
【0130】
全体的には、そうした分析は、FB5Pseq法が、ヒトB細胞における、タンパク質、全トランスクリプトーム、及びBCR配列の同時分析に妥当であることを確認した。
【0131】
ヒト扁桃B細胞サブセットのFB5Pseq分析
本発明者らのプロトコールが、T細胞においても有効であるかどうかを試験するために、本発明者らは、新鮮な末梢血単核細胞をMP65抗原由来ペプチドプールで短時間再刺激した後に選別された、カンジダ・アルビカンス特異的なヒトCD4T細胞に、FB5Pseqを適用した(
図5A及び方法)。カンジダ・アルビカンスは、T
H17プロファイルを有する抗原特異的な循環する記憶CD4T細胞を生成することが知られている、ヒトにおいて一般的な共生生物である。B細胞データセットと同じように、T細胞データセットは、1細胞あたりの高い正確度(
図5B)及び1細胞あたり平均1890個検出された遺伝子(
図5C)を示した。遺伝子発現分析は、そうした再賦活化された抗原特異的T細胞における、T細胞マーカー遺伝子(CD3E)、活性化遺伝子(CD40LG、EGR2、NR4A1、IL2)、及びTH17特異的遺伝子(CCL20、CSF2、IL22、IL23A、IL17A)の効率的な検出を示した(データは示されていない)。本発明者らは、細胞の88%において、少なくとも1つの生産的なTCRα鎖又はTCRβ鎖を回収し、細胞の61%において対を形成したTCRαβレパートリーを回収した(
図5D)。さらに、CDR3β配列分析は、MP65抗原特異性に関連しているようである、いくつかの増幅したTCRβクローン型を明らかとした(
図5E)。遺伝子発現データの主成分分析(PCA)及びV
β-J
βTCR再編成の可視化により、異なるクローン型を発現している抗原特異的T細胞の明らかな分離は判明しなかった(データは示されていない)。
【0132】
要するに、これらのデータは、本発明者らの方法が、ヒトT細胞の統合シングルセルRNAseq分析にも妥当であることを示す。
【0133】
実施例2:
本発明者らは、バルクRNAシークエンスによる、多様な刺激の組合せに対する、ヒト胚中心B細胞の転写応答を研究するためにFB5Pseqを適応させた。簡潔に言えば、本発明者らは、FACSによってヒト扁桃から胚中心B細胞をバルク選別し、それらをインビトロで、5つの刺激の任意の可能な組合せ(IL4、IL10、IL21、CD40L、抗BCR抗体、合計32個の組合せ)の存在下で、1ウェルあたり500個の細胞の密度で培養した。6時間後、細胞をPBSで洗浄し、RLT緩衝液に溶かし、RNAをSPRI(固相可逆的固定)ビーズによる沈降によって補足した。その後、捕捉されたRNAを、FB5Pseq溶解緩衝液中で溶出し、各500個の細胞のRNA試料を、適応させたFB5Pseqプロトコールを用いて処理した(cDNAの増幅のために僅か16サイクルのPCRを用いる)。4つの96ウェルプレートに対応するライブラリー(3つのヒトドナー×32個の条件×3つのレプリケート+対照条件)を調製し、75サイクルの高出力イルミナNextSeq550の実行でシークエンスし、1回の実行で300個を超える試料についてのRNAシークエンス結果が得られた。
【0134】
対応するデータを分析して、単一刺激による活性化により誘導された上位10個の遺伝子及びそれらの発現を全ての組合せにおいて同定した(データは示されていない)。
【0135】
参考文献:
本出願全体を通して、様々な参考文献が、本発明が属する技術分野の最新技術を記載している。これらの参考文献の開示は、本開示への参照によりここに組み入れられる。
【0136】
【配列表】
【国際調査報告】