IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アブビトロ リミテッド ライアビリティ カンパニーの特許一覧

特許7308187ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法
<>
  • 特許-ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法 図1A
  • 特許-ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法 図1B
  • 特許-ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法 図2
  • 特許-ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法 図3
  • 特許-ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-05
(45)【発行日】2023-07-13
(54)【発明の名称】ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法
(51)【国際特許分類】
   C12Q 1/6855 20180101AFI20230706BHJP
   C40B 40/06 20060101ALI20230706BHJP
   C12N 15/10 20060101ALI20230706BHJP
   C12Q 1/6806 20180101ALI20230706BHJP
   C12N 15/12 20060101ALI20230706BHJP
   C12N 15/13 20060101ALI20230706BHJP
   C12Q 1/02 20060101ALI20230706BHJP
   C12Q 1/6869 20180101ALI20230706BHJP
   C12Q 1/6851 20180101ALI20230706BHJP
【FI】
C12Q1/6855 Z ZNA
C40B40/06
C12N15/10 Z
C12Q1/6806 Z
C12N15/12
C12N15/13
C12Q1/02
C12Q1/6869 Z
C12Q1/6851 Z
【請求項の数】 32
(21)【出願番号】P 2020515835
(86)(22)【出願日】2018-05-25
(65)【公表番号】
(43)【公表日】2020-08-06
(86)【国際出願番号】 US2018034768
(87)【国際公開番号】W WO2018218222
(87)【国際公開日】2018-11-29
【審査請求日】2021-05-20
(31)【優先権主張番号】62/511,949
(32)【優先日】2017-05-26
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】519419670
【氏名又は名称】アブビトロ リミテッド ライアビリティ カンパニー
(74)【代理人】
【識別番号】100102978
【弁理士】
【氏名又は名称】清水 初志
(74)【代理人】
【識別番号】100102118
【弁理士】
【氏名又は名称】春名 雅夫
(74)【代理人】
【識別番号】100160923
【弁理士】
【氏名又は名称】山口 裕孝
(74)【代理人】
【識別番号】100119507
【弁理士】
【氏名又は名称】刑部 俊
(74)【代理人】
【識別番号】100142929
【弁理士】
【氏名又は名称】井上 隆一
(74)【代理人】
【識別番号】100148699
【弁理士】
【氏名又は名称】佐藤 利光
(74)【代理人】
【識別番号】100128048
【弁理士】
【氏名又は名称】新見 浩一
(74)【代理人】
【識別番号】100129506
【弁理士】
【氏名又は名称】小林 智彦
(74)【代理人】
【識別番号】100205707
【弁理士】
【氏名又は名称】小寺 秀紀
(74)【代理人】
【識別番号】100114340
【弁理士】
【氏名又は名称】大関 雅人
(74)【代理人】
【識別番号】100121072
【弁理士】
【氏名又は名称】川本 和弥
(72)【発明者】
【氏名】ゴールドフレス スティーブン ジェイコブ
(72)【発明者】
【氏名】ブリッグズ エイドリアン ランガム
(72)【発明者】
【氏名】チャリ ラヤゴパル
(72)【発明者】
【氏名】ジアン ユエ
(72)【発明者】
【氏名】ハウゼ ロナルド
(72)【発明者】
【氏名】ヴィニョー フランソワ
【審査官】山本 晋也
(56)【参考文献】
【文献】国際公開第2016/126871(WO,A2)
【文献】米国特許出願公開第2015/0376609(US,A1)
【文献】特表2016-526889(JP,A)
【文献】国際公開第2017/053905(WO,A1)
【文献】国際公開第2016/100977(WO,A1)
【文献】国際公開第2016/044227(WO,A1)
【文献】国際公開第2016/168584(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
G01N
C40B
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
以下の工程を含む、ポリヌクレオチドライブラリーを作製する方法:
(a)ベッセルのそれぞれが、細胞の集団からの細胞を含み、かつ複数の分子バーコード化オリゴヌクレオチド、1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、および第1アダプターまたは第1アダプターのプールをさらに含む、複数のベッセルのそれぞれの中で、細胞を溶解する工程;
(b)(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチド転写産物に相補的である1つまたは複数の標的ポリヌクレオチドを、1つまたは複数の標的特異的プライマーを使って作製することであって、1つまたは複数の標的ポリヌクレオチドが標的遺伝子の全長コーディング配列を含む、前記作成することと、および(ii)リヌクレオチドの集合体を、ランダムオリゴプライマーを使って作製することであって、前記ポリヌクレオチドの集合体におけるポリヌクレオチドのそれぞれが前記細胞中のポリヌクレオチド転写産物に個別に相補的である、前記作製することとを含む、各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程;
(c)複数の相補的ポリヌクレオチドを前記複数の分子バーコード化オリゴヌクレオチドのうちの1つに取り付ける工程であって、それによって、ユニークな分子バーコードをそれぞれが含む複数の分子バーコード化ポリヌクレオチドを生成させる、工程;
(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物および前記第1アダプターもしくは第1アダプターのプールの1つまたはその増幅産物を、前記複数の分子バーコード化ポリヌクレオチドに取り付ける工程であって、それによって、複数の二重バーコード化ポリヌクレオチドを生成させる、工程、ここで二重バーコード化ポリヌクレオチドのそれぞれは分子バーコードとベッセルバーコードとを含み、かつ同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む;
(e)前記複数の二重バーコード化ポリヌクレオチドのそれぞれの一本鎖アンプリコンを作製し、それによって、二重バーコード化一本鎖ポリヌクレオチドを生成させる工程、ここで、複数の二重バーコード化一本鎖ポリヌクレオチドのそれぞれは、各一本鎖ポリヌクレオチドまたはその増幅産物にユニークである分子バーコードをさらに含む;および
(f)前記一本鎖アンプリコンのそれぞれに第2アダプターを付加することによって、二重バーコード化一本鎖ポリヌクレオチドに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在し、第1アダプターおよび/または第2アダプターが少なくとも1つのユニバーサルプライミング部位を含む、工程。
【請求項2】
ベッセルの各細胞からのバーコード化一本鎖ポリヌクレオチドの集合体が、全体として、各細胞のトランスクリプトームまたは部分的トランスクリプトームの相補的DNA(cDNA)鎖を含む、請求項1記載の方法。
【請求項3】
ベッセルの各細胞からのポリヌクレオチドの集合体が、全体として、各細胞のトランスクリプトームまたは部分的トランスクリプトームのポリヌクレオチド転写産物に相補的な配列を含む、請求項1または2記載の方法。
【請求項4】
トランスクリプトームまたは部分的トランスクリプトームが、全体として、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、請求項3記載の方法。
【請求項5】
前記(b)の相補的ポリヌクレオチドのそれぞれまたは(b)の相補的ポリヌクレオチドのうちの1つもしくは複数がcDNAである、請求項1~4のいずれか一項記載の方法。
【請求項6】
バーコード化一本鎖ポリヌクレオチドのそれぞれまたはバーコード化一本鎖ポリヌクレオチドのうちの1つもしくは複数がcDNAの鎖である、請求項1~5のいずれか一項記載の方法。
【請求項7】
第1アダプターが第1ユニバーサルプライミング部位を含み、および第2アダプターが少なくとも1つのユニバーサルプライミング部位を含む、請求項1~6のいずれか一項記載の方法。
【請求項8】
第2アダプターを付加する工程が、スプリントオリゴヌクレオチドを、二重バーコード化一本鎖ポリヌクレオチドのそれぞれに、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドの存在下でハイブリダイズさせることを含み、スプリントオリゴヌクレオチドは(i)第2ユニバーサルプライミング部位に相補的な配列と(ii)バーコード化一本鎖ポリヌクレオチドの3'端にランダムにアニールする能力を有する縮重オーバーハング配列とを含み、かつ、
ハイブリダイゼーションに先だって、スプリントオリゴヌクレオチドと、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドとをアニールさせることで、スプリント-アダプター二重鎖を形成させる、
請求項1~7のいずれか一項記載の方法。
【請求項9】
縮重オーバーハング配列が配列NNNNNN(SEQ ID NO:24)を含み、ここでNは任意のヌクレオチドである、
スプリントオリゴヌクレオチドが配列
(SEQ ID NO:26)を含み、ここでNは任意のアミノ酸である、かつ/または
第2ユニバーサルプライミング部位を含むオリゴヌクレオチドが配列
を含む、
請求項8記載の方法。
【請求項10】
ベッセルバーコード化オリゴヌクレオチドが、
縮重配列、または
配列(N)14~17、ここでNは任意のヌクレオチドである、
を含む、請求項1~9のいずれか一項記載の方法。
【請求項11】
各ベッセルは、ベッセルバーコード化オリゴヌクレオチドのプールを含む第1アダプターのプールを含み、第1アダプターのプールの各ベッセルバーコード化オリゴヌクレオチドは、前記プール中の他のベッセルバーコード化オリゴヌクレオチドの少なくとも1つと比較して、少なくとも1つの塩基シフトまたは塩基付加を含む、請求項1~10のいずれか一項記載の方法。
【請求項12】
工程(d)において、
(i)1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールを増幅すること、または
1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールを含む、1つの第1アダプターもしくは第1アダプターのプール
を増幅することをさらに含み、
前記増幅が、ベッセルバーコード化オリゴヌクレオチドの取り付けに先だってまたはベッセルバーコード化オリゴヌクレオチドの取り付けと同時に実施される;または
(ii)取り付ける工程の後に、複数の分子バーコード化ポリヌクレオチドのそれぞれを伸長して複数の二重バーコード化ポリヌクレオチドを生成させることを含む、
請求項1~11のいずれか一項記載の方法。
【請求項13】
工程(b)において、
1つまたは複数の標的ポリヌクレオチドは、逆転写酵素および標的ポリヌクレオチドの標的配列に相補的な1つまたは複数の標的特異的プライマーの存在下で、標的ポリヌクレオチド転写産物の逆転写によって作製され、かつ/または
ポリヌクレオチドの集合体は、逆転写酵素および細胞中のポリヌクレオチド転写産物に相補的な1つまたは複数のトランスクリプトームプライマーの存在下で、細胞中のポリヌクレオチド転写産物の逆転写によって作製され、
ここで、1つもしくは複数の標的特異的プライマーおよび/または1つもしくは複数のトランスクリプトームプライマーがポリ(T)配列、またはランダムヘキサマーオリゴヌクレオチドプライマーの混合物を含む、かつ/または
複数の相補的ポリヌクレオチドを作製する工程は、非テンプレートターミナルトランスフェラーゼの使用を含み、3つ以上の非テンプレートヌクレオチド、リボヌクレオチドまたはその類似体が、作製された各相補的ポリヌクレオチドの3'端に付加される、
請求項1~12のいずれか一項記載の方法。
【請求項14】
1つまたは複数の標的ポリヌクレオチドがT細胞受容体アルファ(TCRα)をコードする第1ポリヌクレオチドおよびT細胞受容体(TCRβ)をコードする第2ポリヌクレオチド;
T細胞受容体ガンマ(TCRγ)をコードする第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRδ)をコードする第2ポリヌクレオチド;または
重鎖免疫グロブリン(IgH)をコードする第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)をコードする第2ポリヌクレオチドを含む、
請求項1~13のいずれか一項記載の方法。
【請求項15】
1つまたは複数の標的ポリヌクレオチドおよびポリヌクレオチドの集合体が、同じ反応体積中のベッセル内で作製される、請求項1~14のいずれか一項記載の方法。
【請求項16】
工程(c)において、取り付ける工程は、複数の分子バーコード化オリゴヌクレオチドのうちの1つの一領域を、相補的ポリヌクレオチドのそれぞれの3つ以上の非テンプレートヌクレオチドにハイブリダイズさせることを含み、
複数の分子バーコード化オリゴヌクレオチドは、それぞれが3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチオリゴヌクレオチドとして提供される、または
テンプレートスイッチオリゴヌクレオチドは第1アダプターの一部分に相補的である5'末領域をさらに含み、第1アダプターはベッセルバーコード化オリゴヌクレオチドを含む、
請求項1~15のいずれか一項記載の方法。
【請求項17】
ベッセルが、ウェル、エマルジョン、液滴、またはマイクロカプセルである、請求項1~16のいずれか一項記載の方法。
【請求項18】
二重バーコード化一本鎖ポリヌクレオチドが、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含む、請求項1~17のいずれか一項記載の方法。
【請求項19】
工程(a)~(f)のうちの1つまたは複数が、
溶解状態で実行され、または
固体支持体の存在下では実行されず、
少なくとも工程(c)および(d)が、
溶解状態で実行され、または
固体支持体の存在下では実行されず、または
工程(a)~(e)のそれぞれが、
溶解状態で実行され、または
固体支持体の存在下では実行されない、
請求項1~18のいずれか一項記載の方法。
【請求項20】
細胞の集団が、少なくとも1×103細胞を含む、またはおよそ少なくとも1×103細胞を含む、請求項1~19のいずれか一項記載の方法。
【請求項21】
細胞の集団が、リンパ球もしくはそのサブタイプ、B細胞もしくはそのサブタイプ、T細胞もしくはそのサブタイプ、またはそれらの組合せを含む、請求項1~20のいずれか一項記載の方法。
【請求項22】
細胞の集団が、CD4+T細胞またはCD8+T細胞を含む、請求項21記載の方法。
【請求項23】
複数の二重バーコード化一本鎖ポリヌクレオチドを増幅する工程であって、それによって、複数のポリヌクレオチドテンプレートを生成させる、工程であって、
複数の二重バーコード化一本鎖ポリヌクレオチドの増幅が、第1アダプター配列に相補的な第1プライマーと第2アダプター配列に相補的な第2プライマーとを含む第1プライマーセットの存在下で実行される、工程
をさらに含む、請求項1~22のいずれか一項記載の方法。
【請求項24】
請求項1~23のいずれか一項記載の方法によって作製される複数の二重バーコード化ポリヌクレオチドを含む、ポリヌクレオチドライブラリー。
【請求項25】
1つもしくは複数の標的ポリヌクレオチドまたは1つもしくは複数の細胞の完全なもしくは部分的なトランスクリプトームをシーケンシングするための方法であって、請求項1~23のいずれか一項によって作製される、複数の二重バーコード化ポリヌクレオチドのうちの1つまたは複数をシーケンシングする工程を含む、方法。
【請求項26】
シーケンシングに先だって、完全なトランスクリプトームまたはその一部分を増幅する工程であって、それぞれ第1アダプター配列と第2アダプター配列に特異的な第1プライマーと第2プライマーとを含む第1プライマーセットを使って実行される、工程;
シーケンシングに先だって、複数の二重バーコード化ポリヌクレオチドから1つまたは複数の標的ポリヌクレオチドを増幅する工程であって、1つまたは複数の標的ポリヌクレオチドの全長配列が増幅される、工程;
1つまたは複数の二重バーコード化ポリヌクレオチドの細胞起源を決定する工程;かつ/または
同じバーコードを持つポリヌクレオチドの数を、定量または決定する工程、
をさらに含む、請求項25記載の方法。
【請求項27】
以下の工程を含む、トランスクリプトーム解析のための方法:
(a)請求項1~23のいずれか一項記載の方法によって作製される複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドをシーケンシングする工程であって、それによって、複数の細胞から標的ポリヌクレオチドに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;
(b)請求項1~23のいずれか一項記載の方法によって作製される複数のバーコード化ポリヌクレオチドから、全トランスクリプトームまたはその一部分をシーケンシングする工程であって、それによって、前記複数の細胞からトランスクリプトームデータを生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;および
(c)同じベッセルバーコードを有する(a)からの配列情報および(b)からの配列情報を、同じ細胞からのものであると同定する工程。
【請求項28】
以下の工程を含む、選択された単一細胞のトランスクリプトームを解析する方法:
(a)請求項1~23のいずれか一項記載の方法によって作製される複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドを増幅する、かつシーケンシングする工程であって、それによって、複数の細胞のうちの少なくとも1つにおける標的ポリヌクレオチドのそれぞれに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;
(b)(a)においてシーケンシングされた標的ポリヌクレオチド配列のうちの1つに関連するベッセルバーコードを同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する選択された単一細胞を同定する、工程;
(c)(b)において同定されたベッセルバーコードを保持する細胞の複数の二重バーコード化ポリヌクレオチドからトランスクリプトームまたはその一部分を増幅する、かつシーケンシングする工程であって、それによって、選択された標的ポリペプチド発現細胞からトランスクリプトームデータを生成させる、工程。
【請求項29】
トランスクリプトームまたはその一部分が、選択された細胞から、(b)において同定されたベッセルバーコードに特異的なプライマーと二重バーコード化ポリヌクレオチドの第2アダプター配列に特異的なプライマーとを使って増幅またはシーケンシングされる、請求項28記載の方法。
【請求項30】
同じ細胞からのトランスクリプトームまたはその一部分の配列情報と標的ポリヌクレオチドのうちの少なくとも1つの配列情報とをマッチングさせる工程を含む、トランスクリプトーム解析のための方法であって、配列情報が、請求項1~23のいずれか一項記載の方法によって作製される複数のバーコード化ポリヌクレオチドから決定され、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドであり、または請求項25または26記載の方法から決定される、方法。
【請求項31】
同じベッセルバーコードを有する配列は、同じ細胞からのものであるとしてマッチングされる、請求項30記載の方法。
【請求項32】
トランスクリプトームデータが、細胞の機能または活性に関連するパラメータ、特性、特徴または表現型を含む、または
トランスクリプトームデータが、細胞の活性化、疲弊または増殖活性に関連する、
請求項27~31のいずれか一項記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2017年5月26日に出願された「HIGH-THROUGHPUT POLYNUCLEOTIDE LIBRARY SEQUENCING AND TRANSCRIPTOME ANALYSIS」と題する米国仮出願第62/511,949号に基づく優先権を主張し、その内容は参照によりその全体が本明細書に組み入れられる。
【0002】
配列表の参照による組入れ
本願は電子形式の配列表と共に出願されている。配列表は、2018年5月25日に作製された735042011740SeqList.txtという名称のファイルとして提供され、サイズは444,416バイトである。配列表の電子形式での情報はその全体が参照により本明細書に組み入れられる。
【0003】
分野
本開示は、標的遺伝子シーケンシングおよび単一細胞バーコード化の方法ならびに単一細胞における遺伝子発現の解析方法に関する。いくつかの態様において、標的遺伝子は、抗体またはTCRなどの免疫分子である。いくつかの態様において、本方法は、ある細胞の免疫レパトアおよびトランスクリプトームに関する情報を決定することができるように、全受容体免疫受容体配列(full receptor immune receptor sequence)とペアリングされた単一細胞のトランスクリプトームを捕捉するための、トランスクリプトームシーケンシング、例えばRNAシーケンシングを実行するために使用することができる。本開示は、トランスクリプトーム解析および免疫分子シーケンシング、例えば抗体シーケンシングまたはTCRシーケンシングを実行する際に使用されるポリヌクレオチドライブラリーにも関係する。
【背景技術】
【0004】
背景
細胞または組織のトランスクリプトーム内容物の決定(すなわち「遺伝子発現プロファイリング」)は、その細胞もしくは組織の「状態」に関する特性決定情報を与えること、または細胞亜集団の特性を同定することを含めて、正常細胞および疾患細胞または正常組織および疾患組織の機能解析のための方法になる。単一細胞トランスクリプトームシーケンシングのための既存のツールは、それらのスループットに限界があり、かつ/または全長免疫受容体配列を捕捉する能力を有しない。したがって改良された方法が必要とされている。そのような必要を満たす方法および組成物が提供される。
【発明の概要】
【0005】
概要
個々の細胞または複数の細胞からポリヌクレオチドライブラリーを作製する方法であって、1つまたは複数の全長バーコード化標的ポリヌクレオチド配列またはその選択されたフラグメントが作製されると共に、多数のバーコード化ポリヌクレオチド配列を同時生成させ、それらの集合体が、ある細胞または複数の細胞のトランスクリプトームもしくはゲノムを実質的に表す、方法、が提供される。バーコード化は、同じ細胞からのポリヌクレオチドの発現または存在の解析および定量を可能にする。本明細書の方法によって作製されるポリヌクレオチドライブラリーも提供される。単一細胞または多数の細胞からのトランスクリプトーム解析の方法およびトランスクリプトーム解析を標的配列の解析と組み合わせる方法も提供される。
【0006】
いくつかの態様において、本方法は、複数のバーコード化一本鎖ポリヌクレオチドのそれぞれの、バーコード化一本鎖ポリヌクレオチドのそれぞれに取り付けられた第1アダプターとは反対側の末端またはその近傍に、第2アダプターを付加することを含む、ポリヌクレオチドライブラリーを作製する工程を含み、前記複数のバーコード化一本鎖ポリヌクレオチドは、(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンまたはその相補体を含む1つまたは複数の標的一本鎖ポリヌクレオチドと、(ii)それぞれが前記細胞中のポリヌクレオチドのアンプリコンまたはその相補体を含有する一本鎖ポリヌクレオチドの集合体とを含有し、前記複数のバーコード化一本鎖ポリヌクレオチドのそれぞれは、前記細胞の集団の同じ細胞に由来する(i)および(ii)からのすべてのポリヌクレオチドについて同じであるベッセルバーコード(vessel barcode)を含む。
【0007】
いくつかの態様において、複数のバーコード化一本鎖ポリヌクレオチドは、細胞の集団中の複数の細胞の前記(i)および(ii)のポリヌクレオチドを含む。いくつかの態様において、複数のバーコード化一本鎖ポリヌクレオチドは、各一本鎖ポリヌクレオチドまたはその増幅産物にユニークである分子バーコードをさらに含有する。
【0008】
いくつかの態様において、細胞の集団の各細胞からの一本鎖ポリヌクレオチドの集合体は、全体として、トランスクリプトームまたは部分的トランスクリプトームの相補的DNA(cDNA)鎖を含有する。いくつかの態様において、トランスクリプトームまたは部分的トランスクリプトームは、全体として、その細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含有する。
【0009】
本方法のいくつかの態様において、バーコード化一本鎖ポリヌクレオチドのそれぞれは、50塩基対超または約50塩基対超、100塩基対超または200塩基対超であるサイズを有する。いくつかの態様において、バーコード化一本鎖ポリヌクレオチドのそれぞれは、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する。
【0010】
本方法のいくつかの態様において、第2アダプターは複数のバーコード化一本鎖ポリヌクレオチドを含有する均一混合物において付加される。
【0011】
いくつかの態様において、第1アダプターはベッセルバーコードを含有する。
【0012】
ポリヌクレオチドライブラリーを作製する方法のいくつかの態様において、本方法は、(a)複数のベッセルのそれぞれの中で細胞を溶解する工程であって、該ベッセルのそれぞれが、細胞の集団を含有する試料からの細胞を含有する、工程;(b)(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的ポリヌクレオチドを、1つまたは複数の標的特異的プライマーを使って作製することと(ii)それぞれが前記細胞中のポリヌクレオチドに相補的であるポリヌクレオチドの集合体を作製することとを含む、各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程、を含む。いくつかの態様において、(ii)におけるポリヌクレオチドの集合体は、ランダムおよび/または縮重および/または非特異的オリゴプライマーを使って作製される。いくつかの態様において、(ii)におけるポリヌクレオチドの集合体は、オリゴdTプライマーを使って作製される。
【0013】
いくつかの態様において、該ベッセルのそれぞれは、複数の分子バーコード化オリゴヌクレオチド、ベッセルバーコード化オリゴヌクレオチドのプール、および任意で第1アダプターをさらに含有し、本方法は、(c)複数の相補的ポリヌクレオチドに、任意で複数の相補的ポリヌクレオチドのそれぞれに、前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、分子バーコードをそれぞれが含有する複数のバーコード化ポリヌクレオチド、例えば分子バーコード化ポリヌクレオチドを生成させる、工程、任意で、ここで分子バーコードは、前記複数の分子バーコード化オリゴヌクレオチド内の他のバーコード化ポリヌクレオチドに含有される分子バーコードとは相異なり、かつ/またはユニークな分子バーコードである;(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物を、複数のバーコード化ポリヌクレオチドに、任意でバーコード化ポリヌクレオチドのそれぞれに、取り付ける工程であって、それによって、同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれが同じベッセルバーコードを含有する複数の二重バーコード化ポリヌクレオチドを生成させる、工程、をさらに含む。いくつかの態様において、工程(d)は、前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物、および前記第1アダプターもしくは前記第1アダプターのプールの1つまたはその増幅産物を、複数の前記分子バーコード化ポリヌクレオチドに、任意で前記分子バーコード化ポリヌクレオチドのそれぞれに、取り付けることであって、それによって、それぞれが分子バーコードとベッセルバーコードとを含む複数の二重バーコード化ポリヌクレオチドを、任意で一本鎖二重バーコード化ポリヌクレオチドを、生成させること、ここで同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む、を含む。
【0014】
いくつかの態様において、本方法は、(e)複数の二重バーコード化ポリヌクレオチドの、任意で複数の二重バーコード化ポリヌクレオチドのそれぞれの、一本鎖アンプリコンを作製する工程;および/または(f)前記一本鎖アンプリコンのそれぞれに第2アダプターを付加することによって二重バーコード化一本鎖ポリヌクレオチドにアダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程、をさらに含む。
【0015】
いくつかの態様において、ポリヌクレオチドライブラリーを作製する方法は、以下の工程を含む:(a)複数のベッセルのそれぞれの中で細胞を溶解する工程であって、該ベッセルのそれぞれが、細胞の集団を含有する試料からの細胞、複数の分子バーコード化オリゴヌクレオチド、および1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、ならびに任意で第1アダプターまたは第1アダプターのプールを含有する、工程;(b)(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的ポリヌクレオチドを作製することと(ii)それぞれが前記細胞中のポリヌクレオチドに個別に相補的であるポリヌクレオチドの集合体を作製することとを含む、各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程;(c)各相補的ポリヌクレオチドに前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、ユニークな分子バーコードをそれぞれが含有する複数のバーコード化ポリヌクレオチドを生成させる、工程;(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物および前記第1アダプターもしくは前記第1アダプターのプールの1つまたはその増幅産物を、前記バーコード化ポリヌクレオチドのそれぞれに取り付ける工程であって、それによって、複数の二重バーコード化ポリヌクレオチドを、任意で一本鎖二重バーコード化ポリヌクレオチドを、生成させる、工程、ここで二重バーコード化ポリヌクレオチドのそれぞれは分子バーコードおよびベッセルバーコードを含み、かつ同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む;(e)前記複数の二重バーコード化ポリヌクレオチドのそれぞれの一本鎖アンプリコンを作製する工程;および(f)前記一本鎖アンプリコンのそれぞれに第2アダプターを付加することによって、二重バーコード化一本鎖ポリヌクレオチドに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程。
【0016】
いくつかの態様において、アダプター、例えば第1アダプターは、ベッセルバーコード化オリゴヌクレオチドを含有する。いくつかの態様において、ベッセルバーコード化オリゴヌクレオチドは第1アダプターを含有する。いくつかの態様において、前記細胞の集団の各細胞からのポリヌクレオチドの集合体は、全体として、ある細胞のトランスクリプトームまたは部分的トランスクリプトームの転写産物に相補的な配列を含有する。いくつかの態様において、トランスクリプトームまたは部分的トランスクリプトームは、その細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含有する。
【0017】
いくつかの態様において、細胞中の1つもしくは複数の標的ポリヌクレオチドおよび/またはポリヌクレオチドはDNAである。いくつかの態様において、(i)におけるアンプリコンおよび/または(ii)におけるアンプリコンが由来する、(i)からの1つもしくは複数の標的ポリヌクレオチドおよび/または(ii)からのポリヌクレオチドは、DNAである。いくつかの態様において、細胞中の1つもしくは複数の標的ポリヌクレオチドおよび/またはポリヌクレオチドはRNA、例えばmRNAである。いくつかの態様において、(i)におけるアンプリコンおよび/または(ii)におけるアンプリコンが由来する、(i)からの1つもしくは複数の標的ポリヌクレオチドおよび/または(ii)からのポリヌクレオチドはRNA、例えばmRNAである。
【0018】
いくつかの態様において、(b)の相補的ポリヌクレオチドのそれぞれまたは(b)の相補的ポリヌクレオチドのうちの1つもしくは複数はcDNAである。いくつかの態様において、バーコード化一本鎖ポリヌクレオチドのそれぞれまたはバーコード化一本鎖ポリヌクレオチドのうちの1つもしくは複数は、cDNAの鎖である。
【0019】
本方法のいくつかの態様において、第1アダプターおよび/または第2アダプターは、少なくとも1つのユニバーサルプライミング部位を含有する。いくつかの態様において、第1アダプターと第2アダプターとは異なり、かつ/または第1アダプターは第1ユニバーサルプライミング部位を含有し、第2アダプターは第2ユニバーサルプライミング部位を含有し、任意で第1ユニバーサルプライミング部位と第2ユニバーサルプライミング部位とは異なる。いくつかの態様において、第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位もしくはその連続する一部分を含有し、任意で前記その連続する一部分は相補的配列にアニールするのに十分である。いくつかの態様において、第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含有し、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含有する。いくつかの態様において、P7プライミング部位(C7)は配列
を含有するか、またはその連続する一部分である。いくつかの態様において、P5プライミング部位は配列
を含有するか、またはその連続する一部分である。いくつかの態様において、連続する一部分は少なくとも15、20、25もしくは30ヌクレオチド長を含有する、または少なくとも約15、20、25もしくは30ヌクレオチド長を含有する。いくつかの態様において、P5プライミング部位は、SEQ ID NO:25
に示す連続する一部分である。
【0020】
いくつかの態様において、第2アダプターを付加する工程は、スプリントオリゴヌクレオチド(splint oligonucleotide)を、バーコード化一本鎖ポリヌクレオチドのそれぞれに、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドの存在下でハイブリダイズさせることを含み、スプリントオリゴヌクレオチドは(i)第2ユニバーサルプライミング部位に相補的な配列と(ii)バーコード化一本鎖ポリヌクレオチドの3'端にランダムにアニールする能力を有する縮重オーバーハング配列とを含有する。場合によっては、ハイブリダイゼーションに先だって、スプリントオリゴヌクレオチドと第2ユニバーサルプライミング部位を含有するオリゴヌクレオチドとをアニールさせることで、スプリント-アダプター二重鎖を形成させる。いくつかの局面において、縮重オーバーハング配列は配列(N)3~12を含有し、ここでNは任意のヌクレオチドである。
【0021】
任意のそのような態様のいくつかにおいて、縮重オーバーハング配列は配列NNNNNN(SEQ ID NO:24)を含有し、ここでNは任意のヌクレオチドである。いくつかの態様において、スプリントオリゴヌクレオチドは配列
(SEQ ID NO:26)を含有し、ここでNは任意のアミノ酸である。任意のそのような態様のいくつかにおいて、第2ユニバーサルプライミング部位を含有するオリゴヌクレオチドは配列
を含有する。
【0022】
任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含有する、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含有する。任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは10~30ヌクレオチドまたは約10~30ヌクレオチドを含有する。任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは縮重配列を含有する。任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは配列(N)14~17を含有し、ここでNは任意のヌクレオチドであり、任意で、配列中の少なくとも1つまたは2つのNはWであり、ここでWはアデニンまたはチミンである。任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは、配列
を含有し、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである。
【0023】
任意のそのような態様のいくつかにおいて、各ベッセルは第1アダプターのプールを含有し、第1アダプターのプールの各ベッセルバーコード化オリゴヌクレオチドは、前記プール中の他のベッセルバーコード化オリゴヌクレオチドの少なくとも1つと比較して、少なくとも1つの塩基シフトまたは塩基付加を含有する。任意のそのような態様のいくつかにおいて、第1アダプターのプールのベッセルバーコード化オリゴヌクレオチドは、配列
を含有し、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである。
【0024】
任意のそのような態様のいくつかにおいて、本方法は、工程(d)において、1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールまたは1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールを含む1つの第1アダプターもしくは第1アダプターのプールを増幅することをさらに含み、増幅は、分子バーコード化ポリヌクレオチドへのベッセルバーコード化オリゴヌクレオチドの取り付けに先だってまたは分子バーコード化ポリヌクレオチドへのベッセルバーコード化オリゴヌクレオチドの取り付けと同時に実施される。いくつかの態様において、ベッセルバーコード化オリゴヌクレオチドを取り付ける工程は、ベッセルバーコード化オリゴヌクレオチドの一領域を、相補的ポリヌクレオチドのそれぞれの一領域に、または分子バーコードを含有する分子バーコード化ポリヌクレオチドのそれぞれの一領域に、ハイブリダイズさせることを含む。場合により、前記領域は、バーコード化ポリヌクレオチドの分子バーコードの3'末領域に相補的である3'タグ付けポリヌクレオチド(tagging polynucleotide)を含有する。いくつかの態様において、前記領域は、分子バーコード化オリゴヌクレオチドの5'末領域に相補的である3'タグ付けポリヌクレオチドを含有する。
【0025】
任意のそのような態様のいくつかでは、工程(b)において、1つまたは複数の標的ポリヌクレオチドが、逆転写酵素および標的ポリヌクレオチドの標的配列に相補的な1つまたは複数の標的特異的プライマーの存在下で、標的ポリヌクレオチドの逆転写によって作製され、かつ/またはポリヌクレオチドの集合体は、逆転写酵素および細胞中のポリヌクレオチド、例えばポリヌクレオチド転写産物に相補的な1つまたは複数のトランスクリプトームプライマーの存在下で、細胞中のポリヌクレオチド、例えばポリヌクレオチド転写産物の逆転写によって作製される。
【0026】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、免疫分子またはその鎖のポリヌクレオチドを含有する。任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、それぞれが免疫分子鎖のポリヌクレオチドを含有する少なくとも2つの標的ポリヌクレオチドを含有する。
【0027】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドはTCRまたはその鎖のポリヌクレオチドを含有する。任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、T細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、T細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ)の第2ポリヌクレオチドを含有する。
【0028】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、抗体またはその鎖のポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含有する。いくつかの態様において、1つもしくは複数の標的特異的プライマーおよび/または1つもしくは複数のトランスクリプトームプライマーはポリ(T)配列を含む。
【0029】
任意のそのような態様のいくつかにおいて、1つまたは複数のトランスクリプトームプライマーは、ランダムヘキサマーオリゴヌクレオチドプライマーの混合物を含有する。いくつかの態様において、1つまたは複数の標的特異的プライマーは、標的ポリヌクレオチドの標的配列の配列に相補的な1つまたは複数のプライマーを含有する。場合により、1つまたは複数の標的特異的プライマーは、少なくとも2つのプライマー、例えば第1プライマーと第2プライマーとを含む。いくつかの態様において、1つまたは複数の標的特異的プライマーは、それぞれが免疫分子またはその鎖をコードする複数の標的ポリヌクレオチドの標的配列に対するプライマーを含有する。いくつかの局面において、免疫分子はT細胞受容体または抗体である。
【0030】
任意のそのような態様のいくつかにおいて、少なくとも第1プライマーは、ある免疫分子の第1鎖のポリヌクレオチドの標的配列に相補的であり、かつ第2プライマーは、前記免疫分子の第2鎖のポリヌクレオチドの標的配列に相補的である。いくつかの態様において、第1プライマーおよび第2プライマーは、あるTCRの異なるTCR鎖ポリヌクレオチドの標的配列に相補的である。
【0031】
任意のそのような態様のいくつかにおいて、第1プライマーはTCRアルファポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーはTCRベータポリヌクレオチド配列の標的配列に相補的であるか、または第1プライマーはTCRガンマポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーはTCRデルタポリヌクレオチド配列の標的配列に相補的である。いくつかの局面において、TCR鎖ポリヌクレオチドの標的配列は定常領域配列である。
【0032】
任意のそのような態様のいくつかにおいて、第1プライマーはTCRアルファ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーはTCRベータ定常領域ポリヌクレオチド配列の標的配列に相補的であるか、または第1プライマーはTCRガンマ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーはTCRデルタ定常領域ポリヌクレオチド配列の標的配列に相補的である。いくつかの態様において、少なくとも第1プライマーおよび第2プライマーは、ある抗体の、異なる抗体鎖ポリヌクレオチドの標的配列に相補的である。いくつかの態様において、第1プライマーは重鎖免疫グロブリン(IgH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーは軽鎖免疫グロブリン(IgL)ポリヌクレオチド配列の標的配列に相補的である。いくつかの態様において、抗体鎖ポリヌクレオチドの標的配列は定常領域配列である。
【0033】
任意のそのような態様のいくつかにおいて、第1プライマーは重鎖定常領域(CH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーは軽鎖定常領域(CL)ポリヌクレオチド配列の標的配列に相補的である。場合により、CHポリヌクレオチドの標的配列は、IgM、IgD、IgA、IgEもしくはIgG、またはそれらの組合せに由来し、かつ/あるいはCLポリヌクレオチド配列の標的配列はIgカッパ、Igラムダまたはそれらの組合せに由来する。
【0034】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは全長コーディング配列を含有する。任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドおよびポリヌクレオチドの集合体は、同じ反応体積中のベッセル内で作製される。
【0035】
本方法の任意のそのような態様のいくつかにおいて、工程(b)では、複数の相補的ポリヌクレオチドを作製する工程が、非テンプレートターミナルトランスフェラーゼの使用を含み、3つ以上の非テンプレートヌクレオチド、リボヌクレオチドまたはそれらの類似体が、作製された各相補的ポリヌクレオチドの3'端に付加される。場合により、非テンプレートターミナルトランスフェラーゼは逆転写酵素またはポリメラーゼである。いくつかの局面において、非テンプレートターミナルトランスフェラーゼは逆転写酵素であり、その逆転写酵素は、Superscript II逆転写酵素、Maxima逆転写酵素、Protoscript II逆転写酵素、マロニー(Maloney)マウス白血病ウイルス逆転写酵素(MMLV-RT)、HighScriber逆転写酵素、鳥類骨髄芽球症ウイルス(AMV)逆転写酵素、ターミナルデオキシヌクレオチジルトランスフェラーゼ活性を含む任意の逆転写酵素、およびそれらの組合せから選択される。
【0036】
本方法の任意のそのような態様のいくつかにおいて、工程(c)では、取り付ける工程が、複数の分子バーコード化オリゴヌクレオチドのうちの1つの一領域を、相補的ポリヌクレオチドのそれぞれの3つ以上の非テンプレートヌクレオチドにハイブリダイズさせることを含む。いくつかの態様において、複数の分子バーコード化オリゴヌクレオチドは、それぞれが3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチ(template switch)オリゴヌクレオチドとして提供される。場合により、テンプレートスイッチオリゴヌクレオチドは、ベッセルバーコードを含む第1アダプターの3'タグ付けポリヌクレオチドに相補的である5'末領域を、さらに含む。場合により、テンプレートスイッチオリゴヌクレオチドは、第1アダプターの一部分に相補的である5'末領域をさらに含み、第1アダプターはベッセルバーコード化オリゴヌクレオチドを含む。
【0037】
任意のそのような態様のいくつかにおいて、逆転写酵素はテンプレートスイッチング活性を有し、複数の作製された相補的ポリヌクレオチドのうちの少なくともいくつかの鎖は、3つ以上の非テンプレートヌクレオチドを含有する3'オーバーハングを含有し、複数の分子バーコード化オリゴヌクレオチドは、それぞれが(1)第1アダプターおよびベッセルバーコード化オリゴヌクレオチドを含む3'タグ付けオリゴヌクレオチドに相補的である5'末領域、(2)分子バーコードならびに(3)前記3'オーバーハングの前記3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含有する複数のテンプレートスイッチオリゴヌクレオチドとして提供され、テンプレートスイッチオリゴヌクレオチドは、分子バーコードが各相補的ポリヌクレオチドに組み入れられて分子バーコード化ポリヌクレオチドが作製されるように、逆転写酵素のテンプレートとして役立つ。
【0038】
任意のそのような態様のいくつかにおいて、3つ以上の非テンプレートヌクレオチドに相補的な3'部分は、ヌクレオチド、リボヌクレオチドまたはそれらの類似体を含む。任意のそのような態様のいくつかにおいて、3つ以上の非テンプレートヌクレオチドは3つ以上のCヌクレオチドを含み、3つ以上の非テンプレートヌクレオチドに相補的な3'部分は1つまたは複数のGヌクレオチドもしくはリボヌクレオチドまたはそれらの類似体を含有する。
【0039】
任意のそのような態様のいくつかにおいて、テンプレートスイッチオリゴヌクレオチドは、逆転写酵素またはDNAポリメラーゼによるテンプレートスイッチオリゴヌクレオチドの伸長を阻止する3'修飾ヌクレオチドをさらに含有する。場合により、修飾は3'末ヌクレオチドのデオキシ、リン酸、アミノ、またはアルキル修飾である。
【0040】
本方法の任意のそのような態様のいくつかにおいて、工程(d)は、取り付ける工程の後に複数の相補的ポリヌクレオチドのそれぞれを伸長する工程をさらに含む。いくつかの態様において、工程(d)は、取り付ける工程の後に複数の分子バーコード化ポリヌクレオチドのそれぞれを伸長して複数の二重バーコード化ポリヌクレオチドを生成させる工程を、さらに含む。
【0041】
任意のそのような態様のいくつかにおいて、ベッセル(vessel)は、ウェル、エマルジョン、液滴、またはマイクロカプセルである。
【0042】
任意のそのような態様のいくつかにおいて、本方法は、工程(e)の前に、複数のベッセルのうちの2つまたはそれ以上の内容物を合わせる工程であって、それによって、複数の二重バーコード化一本鎖ポリヌクレオチドのうちの2つまたはそれ以上を含む均一混合物を生成させる、工程、を含む。いくつかの局面において、複数のベッセルの内容物を合わせる工程は、複数のベッセルのうちの2つまたはそれ以上を破壊して、2つまたはそれ以上の破壊されたベッセルからの二重バーコード化一本鎖ポリヌクレオチドをプールすることを含む。
【0043】
いくつかの態様において、本方法は、工程(e)の前に、50塩基対超または約50塩基対超、100塩基対超、または200塩基対超であるサイズを有する二重バーコード化一本鎖ポリヌクレオチドを選択または精製する工程を含む。いくつかの態様において、本方法は、工程(e)の前に、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する二重バーコード化一本鎖ポリヌクレオチドを選択または精製する工程を含む。
【0044】
任意のそのような態様のいくつかにおいて、二重バーコード化一本鎖ポリヌクレオチドは、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含有する。任意のそのような態様のいくつかにおいて、第1アダプターは、一本鎖バーコード化ポリヌクレオチドの、任意で二重バーコード化一本鎖ポリヌクレオチドの、5'領域またはその近傍に位置する。任意のそのような態様のいくつかにおいて、第2アダプターは、一本鎖バーコード化ポリヌクレオチドの、任意で二重バーコード化一本鎖ポリヌクレオチドの、3'領域またはその近傍に位置する。
【0045】
本方法の任意のそのような態様のいくつかにおいて、工程(a)~(f)のうちの1つまたは複数は、溶解状態で実行され、かつ/または(任意でビーズである)固体支持体の存在下では実行されない。任意のそのような態様のいくつかにおいて、少なくとも工程(c)および(d)は、溶解状態で実行され、かつ/または(任意でビーズである)固体支持体の存在下では実行されない。いくつかの態様において、工程(a)~(e)のそれぞれは、溶解状態で実行され、かつ/または(任意でビーズである)固体支持体の存在下では実行されない。
【0046】
任意のそのような態様のいくつかにおいて、細胞の集団は、少なくとも1×103、5×103、1×104、5×104、1×105、5×105、1×106、または5×106細胞を含有する、またはおよそ少なくとも1×103、5×103、1×104、5×104、1×105、5×105、1×106、または5×106細胞を含有する。いくつかの態様において、細胞の集団は、対象からの生物学的試料に由来する。いくつかの例において、生物学的試料は、全血試料、バフィーコート試料、末梢血単核球(PBMC)試料、未分画T細胞試料、リンパ球試料、白血球試料、アフェレーシス産物、または白血球アフェレーシス産物であるか、それを含有する。
【0047】
任意のそのような態様のいくつかにおいて、細胞の集団は免疫細胞を含有する。いくつかの態様において、免疫細胞はリンパ球または抗原提示細胞を含有する。任意のそのような態様のいくつかにおいて、免疫細胞は、リンパ球もしくはそのサブタイプ、B細胞もしくはそのサブタイプ、T細胞もしくはそのサブタイプ、またはそれらの組合せである。いくつかの例において、免疫細胞は、CD4+および/またはCD8+T細胞であるT細胞である。
【0048】
任意のそのような態様のいくつかにおいて、細胞の集団は、セントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞(stem central memory T cell)、エフェクターT細胞および制御性T細胞が濃縮されているか、またはそれらを含有する。任意のそのような態様のいくつかにおいて、細胞の集団は、メモリーB細胞、ナイーブB細胞または形質芽球B細胞が濃縮されている。
【0049】
任意のそのような態様のいくつかにおいて、対象はヒト対象である。いくつかの態様において、対象は、がん、感染症または自己免疫状態を有する。場合により、感染症は、ウイルス感染症、細菌感染症または真菌感染症である。
【0050】
任意のそのような態様のいくつかにおいて、本方法は、複数のバーコード化一本鎖ポリヌクレオチドを増幅する工程であって、それによって、複数のポリヌクレオチドテンプレートを生成させる、工程、をさらに含む。任意のそのような態様のいくつかにおいて、複数のバーコード化一本鎖ポリヌクレオチドの増幅は、第1アダプター配列に相補的な第1プライマーと第2アダプター配列に相補的な第2プライマーとを含む第1プライマーセットの存在下で実行される。いくつかの局面において、第1プライマーおよび/または第2プライマーはユニバーサルプライマーである。場合により、第1プライマーおよび/または第2プライマーは、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である。場合により、第1プライマーはP7プライミング部位(C7)またはその連続する一部分に相補的であり、第2プライマーはP5プライミング部位(C5)またはその連続する一部分に相補的である。いくつかの態様において、P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーは、配列
を有するか、もしくは同配列を含有し、かつ/またはP5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーは、配列
を含有する。任意のそのような態様のいくつかにおいて、第1プライマーおよび/または第2プライマーはシーケンシングアダプターをさらに含有する。いくつかの態様において、P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーは配列
をさらに含有し、かつ/またはP5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーは配列
を含有する。
【0051】
いくつかの態様において、本方法は、複数の一本鎖バーコード化ポリヌクレオチド、任意で一本鎖二重バーコード化ポリヌクレオチドのそれぞれを精製する工程を、さらに含む。
【0052】
記載する態様のいずれかの方法によって作製される複数のバーコード化ポリヌクレオチドを含有するポリヌクレオチドライブラリーが提供される。複数のバーコード化ポリヌクレオチドを含有するポリヌクレオチドライブラリーであって、前記複数のバーコード化ポリヌクレオチドが、(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンを含有する1つまたは複数の標的ポリヌクレオチドと(ii)それぞれが前記細胞中のポリヌクレオチドのアンプリコンを含有するポリヌクレオチドの集合体とを含有し、各バーコード化ポリヌクレオチドが、第1ユニバーサルプライマーに相補的である第1ユニバーサルプライミング部位を含む第1アダプター、前記細胞の集団の同じ細胞に由来する(i)および(ii)からのすべてのバーコード化ポリヌクレオチドについては同じであるベッセルバーコードを含むベッセルバーコード化オリゴヌクレオチド、ならびに第2ユニバーサルプライマーに相補的である第2ユニバーサルプライミング部位を含有する第2アダプター配列を含有するポリヌクレオチドライブラリーも提供される。
【0053】
いくつかの態様において、複数のバーコード化ポリヌクレオチドのそれぞれは、各ポリヌクレオチドまたはポリヌクレオチドテンプレートにユニークである分子バーコードを含有する。いくつかの局面において、細胞の集団の各細胞からのバーコード化ポリヌクレオチドテンプレートの集合体は、全体として、トランスクリプトームもしくは部分的トランスクリプトームの相補的DNA(cDNA)鎖またはその相補体を含有する。いくつかの態様において、トランスクリプトームまたは部分的トランスクリプトームは、全体として、その細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含有する。
【0054】
任意のそのような態様のいくつかにおいて、前記バーコード化ポリヌクレオチドのそれぞれは、50塩基対超または約50塩基対超、100塩基対超または200塩基対超であるサイズを有する。いくつかの態様において、バーコード化一本鎖ポリヌクレオチドのそれぞれは、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する。
【0055】
任意のそのような態様のいくつかにおいて、第1アダプターはベッセルバーコードを含有する。いくつかの態様において、バーコード化ポリヌクレオチドは一本鎖である。いくつかの態様において、バーコード化ポリヌクレオチドは二本鎖である。いくつかの態様において、第1アダプターと第2アダプターとは異なる。
【0056】
任意のそのような態様のいくつかにおいて、第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分を含有し、任意で前記その連続する一部分は相補的配列にアニールするのに十分である。いくつかの態様において、第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含有し、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含有する。いくつかの局面において、P7プライミング部位(C7)は配列
を含有するか、またはその連続する一部分である。いくつかの例において、P5プライミング部位は配列
を含有するか、またはその連続する一部分である。
【0057】
任意のそのような態様のいくつかにおいて、連続する一部分は少なくとも15、20、25もしくは30ヌクレオチド長を含有する、または少なくとも約15、20、25もしくは30ヌクレオチド長を含有する。いくつかの態様において、P5プライミング部位は、SEQ ID NO:25
に示す連続する一部分である。
【0058】
任意のそのような態様のいくつかにおいて、ベッセルバーコード化オリゴヌクレオチドは、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含有する、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含有する。いくつかの態様において、ベッセルバーコード化オリゴヌクレオチドは10~30ヌクレオチドまたは約10~30ヌクレオチドを含有する。
【0059】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、免疫分子またはその鎖のポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは少なくとも2つの標的ポリヌクレオチドを含有し、そのそれぞれが免疫分子鎖のポリヌクレオチドを含有する。
【0060】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、TCRまたはその鎖の1つまたは複数のポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、T細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、T細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ)の第2ポリヌクレオチドを含有する。
【0061】
任意のそのような態様のいくつかにおいて、1つまたは複数の標的ポリヌクレオチドは、抗体またはその鎖の1つまたは複数のポリヌクレオチドを含有する。いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含有する。
【0062】
任意のそのような態様のいくつかにおいて、バーコード化ポリヌクレオチドは、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含有する。いくつかの態様において、第1アダプターは、二重バーコード化一本鎖ポリヌクレオチドの5'領域またはその近傍に位置する。いくつかの態様において、第2アダプターは、二重バーコード化一本鎖ポリヌクレオチドの3'領域またはその近傍に位置する。
【0063】
記載する態様のいずれかによって作製される、または記載するポリヌクレオチドライブラリーの態様のいずれかからの、複数のポリヌクレオチド、例えばバーコード化ポリヌクレオチド(例えば二重バーコード化ポリヌクレオチド)のうちの1つまたは複数をシーケンシングする工程を含む、シーケンシング方法が提供される。いくつかの例では、複数のポリヌクレオチドからの、例えばポリヌクレオチドテンプレートからの、トランスクリプトームがシーケンシングされる。場合により、本方法は、シーケンシングに先だって、全トランスクリプトームまたはその一部分を増幅する工程を、さらに含む。いくつかの局面において、増幅は、それぞれ第1アダプター配列と第2アダプター配列に特異的な第1プライマーと第2プライマーとを含む第1プライマーセットを使って実行される。
【0064】
いくつかの態様では、複数のポリヌクレオチドテンプレートからの1つまたは複数の標的ポリヌクレオチドがシーケンシングされる。場合により、本方法は、シーケンシングに先だって、複数のポリヌクレオチドテンプレートから1つまたは複数の標的ポリヌクレオチドを増幅する工程を、さらに含む。いくつかの例では、1つまたは複数の標的ポリヌクレオチドの全長配列が増幅される。
【0065】
いくつかの態様において、増幅は、1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーと第1アダプター配列に相補的な第2プライマーとを含む第2プライマーセットの存在下で実行される。場合により、第2プライマーセットの第2プライマーは、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である。いくつかの局面において、第2プライマーセットの第2プライマーは、P7プライミング部位(C7)またはその連続する一部分に相補的である。いくつかの態様において、第2プライマーセットの第2プライマーは、配列
を有するか、または同配列を含有する。
【0066】
いくつかの態様において、1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーは、免疫分子またはその鎖の標的配列に特異的である。場合により、免疫分子はT細胞受容体または抗体である。いくつかの局面において、1つまたは複数の第1プライマーは、免疫分子の定常領域の標的配列に特異的である。
【0067】
いくつかの態様において、免疫分子はTCRであり、かつ1つまたは複数の第1プライマーは
またはそれらの組合せを含む。いくつかの態様において、免疫分子は抗体であり、かつ1つまたは複数の第1プライマーはSEQ ID NO:29~36のいずれかまたはそれらの組合せを含む。
【0068】
任意のそのような態様のいくつかにおいて、本方法は、1つまたは複数のバーコード化ポリヌクレオチドの、任意で二重バーコード化ポリヌクレオチドの、細胞起源を決定する工程を含む。場合により、細胞起源を決定する工程は、同じベッセルバーコードを有する配列情報または二重バーコード化ポリヌクレオチドの配列を、同じ細胞からのものであると同定することを含む。
【0069】
任意のそのような態様のいくつかにおいて、標的ポリヌクレオチドは、第1ポリヌクレオチド鎖および第2ポリヌクレオチド鎖を含有する免疫分子であり、本方法は、シーケンシングされた二重バーコード化ポリヌクレオチド中の同じベッセルバーコードの存在によって、第1ポリヌクレオチド鎖と第2ポリヌクレオチド鎖とを同じ細胞にマッチングさせる工程を含む。いくつかの態様において、本方法は、同じバーコードを持つ、任意で同じ分子バーコードおよび/またはベッセルバーコードを持つ、ポリヌクレオチドの数を、定量または決定する工程をさらに含む。
【0070】
任意のそのような態様のいくつかにおいて、複数のバーコード化ポリヌクレオチドは、分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドであり、本方法は、同じベッセルバーコードを有するトランスクリプトーム配列および標的ポリヌクレオチド配列を同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する細胞のトランスクリプトーム情報を同定する、工程、をさらに含む。
【0071】
(a)記載する方法のいずれかによって作製される複数のバーコード化ポリヌクレオチドから、または記載するポリヌクレオチドライブラリーのいずれかの複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドをシーケンシングする工程であって、それによって、複数の細胞から標的ポリヌクレオチドに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;(b)記載する方法のいずれかによって作製される複数のバーコード化ポリヌクレオチドから、または記載するポリヌクレオチドライブラリーのいずれかの複数のバーコード化ポリヌクレオチドから、全トランスクリプトームまたはその一部分をシーケンシングする工程であって、それによって、前記複数の細胞からトランスクリプトームデータを生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;および(c)同じベッセルバーコードを有する(a)からの配列情報および(b)からの配列情報を同じ細胞からのものであると同定する工程、を含む、トランスクリプトーム解析の方法が提供される。
【0072】
(a)記載する方法のいずれかによって作製される複数の複数のバーコード化ポリヌクレオチドから、または記載するポリヌクレオチドライブラリーのいずれかの複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドを増幅し、かつシーケンシングする工程であって、それによって、複数の細胞のうちの少なくとも1つにおける標的ポリヌクレオチドのそれぞれに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;(b)(a)においてシーケンシングされた標的ポリヌクレオチド配列のうちの1つに関連するベッセルバーコードを同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する選択された単一細胞を同定する、工程;(c)(b)において同定されたベッセルバーコードを保持する細胞の複数のバーコード化ポリヌクレオチドからトランスクリプトームまたはその一部分を増幅し、かつシーケンシングする工程であって、それによって、選択された標的ポリペプチド発現細胞からトランスクリプトームデータを生成させる、工程、を含む、選択された単一細胞のトランスクリプトームを解析するための方法が提供される。いくつかの態様では、トランスクリプトームまたはその一部分が、選択された細胞から、(b)において同定されたベッセルバーコードに特異的なプライマーとバーコード化ポリヌクレオチドの第2アダプター配列に特異的なプライマーとを使って増幅またはシーケンシングされる。
【0073】
いくつかの態様において、本方法は、同じ細胞からのトランスクリプトームまたはその一部分の配列情報と標的ポリヌクレオチドのうちの少なくとも1つの配列情報とをマッチングさせる工程を含み、配列情報は、記載する方法のいずれかによって作製される複数のバーコード化ポリヌクレオチドから、もしくは記載するポリヌクレオチドライブラリーのいずれかの複数のバーコード化ポリヌクレオチドから決定されるか、または記載する方法のいずれかから決定され、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである。場合により、同じベッセルバーコードを有する配列は、同じ細胞からのものであるとしてマッチングされる。いくつかの態様において、トランスクリプトームデータは、細胞の機能または活性に関連するパラメータ、特性、特徴または表現型を含む。場合により、トランスクリプトームデータは、細胞の活性化、疲弊または増殖活性に関連する。
[本発明1001]
複数の一本鎖バーコード化ポリヌクレオチドのそれぞれの、一本鎖バーコード化ポリヌクレオチドのそれぞれに取り付けられた第1アダプターとは反対側の末端またはその近傍に、第2アダプターを付加する工程を含む、ポリヌクレオチドライブラリーを作製する方法であって、
第1アダプターはベッセルバーコードを含み、
前記複数の一本鎖バーコード化ポリヌクレオチドは、
(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンまたはその相補体を含む、1つまたは複数の標的一本鎖ポリヌクレオチドと、
(ii)それぞれが前記細胞の集団の細胞中のポリヌクレオチドのアンプリコンまたはその相補体を含む、一本鎖ポリヌクレオチドの集合体と
を含み、
前記細胞の集団の同じ細胞に由来する(i)および(ii)からのポリヌクレオチドのそれぞれが同じベッセルバーコード配列を含む、方法。
[本発明1002]
複数の一本鎖バーコード化ポリヌクレオチドが細胞の集団中の複数の細胞の(i)および(ii)のポリヌクレオチドを含む、本発明1001の方法。
[本発明1003]
複数の一本鎖バーコード化ポリヌクレオチドのそれぞれが、各一本鎖ポリヌクレオチドまたはその増幅産物にユニークである分子バーコードをさらに含む、本発明1001または本発明1002の方法。
[本発明1004]
細胞の集団の各細胞からの一本鎖バーコード化ポリヌクレオチドの集合体が、全体として、トランスクリプトームまたは部分的トランスクリプトームの相補的DNA(cDNA)鎖を含む、本発明1001~1003のいずれかの方法。
[本発明1005]
トランスクリプトームまたは部分的トランスクリプトームが、全体として、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、本発明1004の方法。
[本発明1006]
一本鎖バーコード化ポリヌクレオチドのそれぞれが、50塩基対超もしくは約50塩基対超、100塩基対超もしくは約100塩基対長、または200塩基対超もしくは約200塩基対長であるサイズを有する、本発明1001~1005のいずれかの方法。
[本発明1007]
一本鎖バーコード化ポリヌクレオチドのそれぞれが、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する、本発明1001~1006のいずれかの方法。
[本発明1008]
第2アダプターを付加する工程が、複数の一本鎖バーコード化ポリヌクレオチドを含む均一混合物において実行される、本発明1001~1007のいずれかの方法。
[本発明1009]
以下の工程を含む、ポリヌクレオチドライブラリーを作製する方法:
(a)ベッセルのそれぞれが細胞の集団からの細胞を含む複数のベッセルのそれぞれの中で、細胞を溶解する工程;
(b)各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程であって、該作製工程が、(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的ポリヌクレオチドを、1つまたは複数の標的特異的プライマーを使って作製することと(ii)それぞれが前記細胞中のポリヌクレオチド転写物に相補的であるポリヌクレオチドの集合体を作製することとを含む、工程。
[本発明1010]
前記(ii)におけるポリヌクレオチドの集合体が、ランダムオリゴプライマーを使って作製される、本発明1009の方法。
[本発明1011]
ベッセルのそれぞれが、複数の分子バーコード化オリゴヌクレオチド、1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、および第1アダプターまたは第1アダプターのプールをさらに含み、
(c)複数の相補的ポリヌクレオチドに、任意で複数の相補的ポリヌクレオチドのそれぞれに、前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、分子バーコードをそれぞれが含む複数の分子バーコード化ポリヌクレオチドを生成させる、工程、任意で、ここで前記分子バーコード化ポリヌクレオチドのそれぞれの分子バーコードは、前記複数の分子バーコード化オリゴヌクレオチド内の他の分子バーコード化ポリヌクレオチドに含まれる分子バーコードとは相異なり、かつ/またはユニークな分子バーコードである;
(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物、および第1アダプターもしくは第1アダプターのプールの1つまたはその増幅産物を、複数の分子バーコード化ポリヌクレオチドに、任意で分子バーコード化ポリヌクレオチドのそれぞれに、取り付ける工程であって、それによって、それぞれが分子バーコードとベッセルバーコードとを含む複数の二重バーコード化ポリヌクレオチドを、任意で一本鎖二重バーコード化ポリヌクレオチドを、生成させる、工程、ここで同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む
をさらに含む、本発明1009または本発明1010の方法。
[本発明1012]
(e)複数の二重バーコード化ポリヌクレオチドの、任意で複数の二重バーコード化ポリヌクレオチドのそれぞれの、一本鎖アンプリコンを作製する工程
をさらに含む、本発明1011の方法。
[本発明1013]
(f)一本鎖アンプリコンのそれぞれに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程
をさらに含む、本発明1012の方法。
[本発明1014]
以下の工程を含む、ポリヌクレオチドライブラリーを作製する方法:
(a)ベッセルのそれぞれが、細胞の集団を含む試料からの細胞、複数の分子バーコード化オリゴヌクレオチド、1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、および第1アダプターまたは第1アダプターのプールを含む、複数のベッセルのそれぞれの中で、細胞を溶解する工程;
(b)(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチド転写産物に相補的である1つまたは複数の標的ポリヌクレオチドを作製することと(ii)それぞれが前記細胞中のポリヌクレオチド転写産物に個別に相補的であるポリヌクレオチドの集合体を作製することとを含む、各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程;
(c)各相補的ポリヌクレオチドに前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、ユニークな分子バーコードをそれぞれが含む複数のバーコード化ポリヌクレオチドを生成させる、工程;
(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物および前記第1アダプターもしくは第1アダプターのプールの1つまたはその増幅産物を、前記バーコード化ポリヌクレオチドのそれぞれに取り付ける工程であって、それによって、複数の二重バーコード化ポリヌクレオチドを、任意で一本鎖二重バーコード化ポリヌクレオチドを、生成させる、工程、ここで二重バーコード化ポリヌクレオチドのそれぞれは分子バーコードとベッセルバーコードとを含み、かつ同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む;
(e)前記複数の二重バーコード化ポリヌクレオチドのそれぞれの一本鎖アンプリコンを作製する工程;および
(f)前記一本鎖アンプリコンのそれぞれに第2アダプターを付加することによって、二重バーコード化一本鎖ポリヌクレオチドに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程。
[本発明1015]
第1アダプターがベッセルバーコード化オリゴヌクレオチドを含む、本発明1011~1014のいずれかの方法。
[本発明1016]
細胞の集団の各細胞からのポリヌクレオチドの集合体が、全体として、細胞のトランスクリプトームまたは部分的トランスクリプトームの転写産物に相補的な配列を含む、本発明1009~1015のいずれかの方法。
[本発明1017]
トランスクリプトームまたは部分的トランスクリプトームが、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、本発明1016の方法。
[本発明1018]
前記(i)におけるアンプリコンおよび/または(ii)におけるアンプリコンが由来する、(i)からの1つもしくは複数の標的ポリヌクレオチドおよび/または(ii)からのポリヌクレオチドがDNAである、本発明1001~1017のいずれかの方法。
[本発明1019]
前記(i)におけるアンプリコンおよび/または(ii)におけるアンプリコンが由来する、(i)からの1つもしくは複数の標的ポリヌクレオチドおよび/または(ii)からのポリヌクレオチドがRNAである、本発明1001~1018のいずれかの方法。
[本発明1020]
RNAがmRNAである、本発明1019の方法。
[本発明1021]
前記(b)の相補的ポリヌクレオチドのそれぞれまたは(b)の相補的ポリヌクレオチドのうちの1つもしくは複数がcDNAである、本発明1009~1020のいずれかの方法。
[本発明1022]
バーコード化一本鎖ポリヌクレオチドのそれぞれまたはバーコード化一本鎖ポリヌクレオチドのうちの1つもしくは複数がcDNAの鎖である、本発明1001~1021のいずれかの方法。
[本発明1023]
第1アダプターおよび/または第2アダプターが少なくとも1つのユニバーサルプライミング部位を含む、本発明1001~1022のいずれかの方法。
[本発明1024]
第1アダプターと第2アダプターとは異なり、かつ/または
第1アダプターは第1ユニバーサルプライミング部位を含み、第2アダプターは第2ユニバーサルプライミング部位を含み、任意で第1ユニバーサルプライミング部位と第2ユニバーサルプライミング部位とは異なる、
本発明1001~1023のいずれかの方法。
[本発明1025]
第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分を含み、任意で前記その連続する一部分は相補的配列にアニールするのに十分である、本発明1024の方法。
[本発明1026]
第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含み、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含む、本発明1024または本発明1025の方法。
[本発明1027]
P7プライミング部位(C7)が配列
を含むか、またはその連続する一部分である、本発明1025または本発明1026の方法。
[本発明1028]
P5プライミング部位が配列
を含むか、またはその連続する一部分である、本発明1025または本発明1026の方法。
[本発明1029]
連続する一部分が少なくとも15、20、25もしくは30ヌクレオチド長を含む、または少なくとも約15、20、25もしくは30ヌクレオチド長を含む、本発明1025~1028のいずれかの方法。
[本発明1030]
P5プライミング部位がSEQ ID NO:25
に示す連続する一部分である、本発明1025、1026、1028または1029のいずれかの方法。
[本発明1031]
第2アダプターを付加する工程が、スプリントオリゴヌクレオチドを、バーコード化一本鎖ポリヌクレオチドのそれぞれに、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドの存在下でハイブリダイズさせることを含み、スプリントオリゴヌクレオチドは(i)第2ユニバーサルプライミング部位に相補的な配列と(ii)バーコード化一本鎖ポリヌクレオチドの3'端にランダムにアニールする能力を有する縮重オーバーハング配列とを含む、本発明1001~1008および本発明1013~1030のいずれかの方法。
[本発明1032]
ハイブリダイゼーションに先だって、スプリントオリゴヌクレオチドと、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドとをアニールさせることで、スプリント-アダプター二重鎖を形成させる、本発明1031の方法。
[本発明1033]
縮重オーバーハング配列が配列(N) 3~12 を含み、ここでNは任意のヌクレオチドである、本発明1031または本発明1032の方法。
[本発明1034]
縮重オーバーハング配列が配列NNNNNN(SEQ ID NO:24)を含み、ここでNは任意のヌクレオチドである、本発明1031~1033のいずれかの方法。
[本発明1035]
スプリントオリゴヌクレオチドが配列
(SEQ ID NO:26)を含み、ここでNは任意のアミノ酸である、本発明1031~1034のいずれかの方法。
[本発明1036]
第2ユニバーサルプライミング部位を含むオリゴヌクレオチドが配列
を含む、本発明1031~1035のいずれかの方法。
[本発明1037]
ベッセルバーコード化オリゴヌクレオチドが、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、本発明1001~1008および本発明1011~1036のいずれかの方法。
[本発明1038]
ベッセルバーコード化オリゴヌクレオチドが10~30ヌクレオチドまたは約10~30ヌクレオチドを含む、本発明1001~1008および本発明1011~1037のいずれかの方法。
[本発明1039]
ベッセルバーコード化オリゴヌクレオチドが縮重配列を含む、本発明1001~1008および本発明1011~1038のいずれかの方法。
[本発明1040]
ベッセルバーコード化オリゴヌクレオチドが配列(N) 14~17 を含み、ここでNは任意のヌクレオチドであり、任意で、配列中の少なくとも1つまたは2つのNはWであり、ここでWはアデニンまたはチミンである、本発明1001~1008および本発明1011~1039のいずれかの方法。
[本発明1041]
ベッセルバーコード化オリゴヌクレオチドが配列
を含み、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである、本発明1001~1008および本発明1011~1040のいずれかの方法。
[本発明1042]
各ベッセルは、ベッセルバーコード化オリゴヌクレオチドのプールを含む第1アダプターのプールを含み、第1アダプターのプールの各ベッセルバーコード化オリゴヌクレオチドは、前記プール中の他のベッセルバーコード化オリゴヌクレオチドの少なくとも1つと比較して、少なくとも1つの塩基シフトまたは塩基付加を含む、本発明1011~1041のいずれかの方法。
[本発明1043]
第1アダプターのプールのベッセルバーコード化オリゴヌクレオチドが配列
を含み、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである、本発明1042の方法。
[本発明1044]
工程(d)において、
1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプール、または
1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールを含む、1つの第1アダプターもしくは第1アダプターのプール
を増幅することをさらに含み、
前記増幅が、ベッセルバーコード化オリゴヌクレオチドの取り付けに先だってまたはベッセルバーコード化オリゴヌクレオチドの取り付けと同時に実施される、本発明1011~1043のいずれかの方法。
[本発明1045]
ベッセルバーコード化オリゴヌクレオチドを取り付ける工程が、ベッセルバーコード化オリゴヌクレオチドの一領域を、相補的ポリヌクレオチドのそれぞれの一領域に、または分子バーコード化ポリヌクレオチドのそれぞれの一領域に、ハイブリダイズさせることを含む、本発明1011~1044のいずれかの方法。
[本発明1046]
前記領域が、分子バーコード化ポリヌクレオチドの分子バーコードの3'末領域に相補的である3'タグ付けポリヌクレオチドを含む、本発明1045の方法。
[本発明1047]
工程(b)において、
1つまたは複数の標的ポリヌクレオチドは、逆転写酵素および標的ポリヌクレオチドの標的配列に相補的な1つまたは複数の標的特異的プライマーの存在下で、標的ポリヌクレオチドの逆転写によって作製され、かつ/または
ポリヌクレオチドの集合体は、逆転写酵素および細胞中のポリヌクレオチド転写産物に相補的な1つまたは複数のトランスクリプトームプライマーの存在下で、細胞中のポリヌクレオチド転写産物の逆転写によって作製される、
本発明1009~1046のいずれかの方法。
[本発明1048]
1つまたは複数の標的ポリヌクレオチドが免疫分子またはその鎖のポリヌクレオチドを含む、本発明1001~1047のいずれかの方法。
[本発明1049]
1つまたは複数の標的ポリヌクレオチドは、それぞれが免疫分子鎖のポリヌクレオチドを含む少なくとも2つの標的ポリヌクレオチドを含む、本発明1001~1048のいずれかの方法。
[本発明1050]
1つまたは複数の標的ポリヌクレオチドがTCRまたはその鎖のポリヌクレオチドを含む、本発明1001~1049のいずれかの方法。
[本発明1051]
1つまたは複数の標的ポリヌクレオチドがT細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含む、本発明1001~1050のいずれかの方法。
[本発明1052]
1つまたは複数の標的ポリヌクレオチドがT細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ、TCR δ )の第2ポリヌクレオチドを含む、本発明1001~1050のいずれかの方法。
[本発明1053]
1つまたは複数の標的ポリヌクレオチドが抗体またはその鎖のポリヌクレオチドを含む、本発明1001~1049のいずれかの方法。
[本発明1054]
1つまたは複数の標的ポリヌクレオチドが重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含む、本発明1001~1049および本発明1053のいずれかの方法。
[本発明1055]
1つもしくは複数の標的特異的プライマーおよび/または1つもしくは複数のトランスクリプトームプライマーがポリ(T)配列を含む、本発明1047~1054のいずれかの方法。
[本発明1056]
1つまたは複数のトランスクリプトームプライマーがランダムヘキサマーオリゴヌクレオチドプライマーの混合物を含む、本発明1047~1054のいずれかの方法。
[本発明1057]
1つまたは複数の標的特異的プライマーが標的ポリヌクレオチドの標的配列の配列に相補的な1つまたは複数のプライマーを含む、本発明1047~1056のいずれかの方法。
[本発明1058]
1つまたは複数の標的特異的プライマーが少なくとも第1プライマーと第2プライマーとを含む、本発明1057の方法。
[本発明1059]
1つまたは複数の標的特異的プライマーは、それぞれが免疫分子またはその鎖をコードする複数の標的ポリヌクレオチドの標的配列に対するプライマーを含む、本発明1057または本発明1058の方法。
[本発明1060]
免疫分子がT細胞受容体または抗体である、本発明1059の方法。
[本発明1061]
少なくとも第1プライマーは、免疫分子の第1鎖のポリヌクレオチドの標的配列に相補的であり、かつ第2プライマーは、前記免疫分子の第2鎖のポリヌクレオチドの標的配列に相補的である、本発明1058~1060のいずれかの方法。
[本発明1062]
第1プライマーおよび第2プライマーが、あるTCRの異なるTCR鎖ポリヌクレオチドの標的配列に相補的である、本発明1058~1061のいずれかの方法。
[本発明1063]
第1プライマーがTCRアルファポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRベータポリヌクレオチド配列の標的配列に相補的であるか、または
第1プライマーがTCRガンマポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRデルタポリヌクレオチド配列の標的配列に相補的である、
本発明1058~1062のいずれかの方法。
[本発明1064]
TCR鎖ポリヌクレオチドの標的配列が定常領域配列である、本発明1062または本発明1063の方法。
[本発明1065]
第1プライマーがTCRアルファ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRベータ定常領域ポリヌクレオチド配列の標的配列に相補的であるか、または
第1プライマーがTCRガンマ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRデルタ定常領域ポリヌクレオチド配列の標的配列に相補的である、
本発明1058~1064のいずれかの方法。
[本発明1066]
少なくとも第1プライマーおよび第2プライマーが、抗体の、異なる抗体鎖ポリヌクレオチドの標的配列に相補的である、本発明1058~1061のいずれかの方法。
[本発明1067]
第1プライマーが重鎖免疫グロブリン(IgH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーが軽鎖免疫グロブリン(IgL)ポリヌクレオチド配列の標的配列に相補的である、本発明1058~1061および本発明1066のいずれかの方法。
[本発明1068]
抗体鎖ポリヌクレオチドの標的配列が定常領域配列である、本発明1066または本発明1067の方法。
[本発明1069]
第1プライマーが重鎖定常領域(CH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーが軽鎖定常領域(CL)ポリヌクレオチド配列の標的配列に相補的である、本発明1058~1061および本発明1066~1068のいずれかの方法。
[本発明1070]
C H ポリヌクレオチドの標的配列がIgM、IgD、IgA、IgEもしくはIgG、またはそれらの組合せに由来し、かつ/あるいは
C L ポリヌクレオチド配列の標的配列がIgカッパ、Igラムダまたはそれらの組合せに由来する、本発明1068または本発明1069の方法。
[本発明1071]
1つまたは複数の標的ポリヌクレオチドが全長コーディング配列を含む、本発明1001~1070のいずれかの方法。
[本発明1072]
1つまたは複数の標的ポリヌクレオチドおよびポリヌクレオチドの集合体が、同じ反応体積中のベッセル内で作製される、本発明1009~1071のいずれかの方法。
[本発明1073]
工程(b)において、複数の相補的ポリヌクレオチドを作製する工程は、非テンプレートターミナルトランスフェラーゼの使用を含み、3つ以上の非テンプレートヌクレオチド、リボヌクレオチドまたはその類似体が、作製された各相補的ポリヌクレオチドの3'端に付加される、本発明1009~1072のいずれかの方法。
[本発明1074]
非テンプレートターミナルトランスフェラーゼが逆転写酵素またはポリメラーゼである、本発明1073の方法。
[本発明1075]
非テンプレートターミナルトランスフェラーゼが逆転写酵素であり、逆転写酵素は、Superscript II逆転写酵素、Maxima逆転写酵素、Protoscript II逆転写酵素、マロニー(Maloney)マウス白血病ウイルス逆転写酵素(MMLV-RT)、HighScriber逆転写酵素、鳥類骨髄芽球症ウイルス(AMV)逆転写酵素、ターミナルデオキシヌクレオチジルトランスフェラーゼ活性を含む任意の逆転写酵素、およびそれらの組合せから選択される、本発明1073または本発明1074の方法。
[本発明1076]
工程(c)において、取り付ける工程は、複数の分子バーコード化オリゴヌクレオチドのうちの1つの一領域を、相補的ポリヌクレオチドのそれぞれの3つ以上の非テンプレートヌクレオチドにハイブリダイズさせることを含む、本発明1011~1075のいずれかの方法。
[本発明1077]
複数の分子バーコード化オリゴヌクレオチドは、それぞれが3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチオリゴヌクレオチドとして提供される、本発明1076の方法。
[本発明1078]
テンプレートスイッチオリゴヌクレオチドは第1アダプターの一部分に相補的である5'末領域をさらに含み、第1アダプターはベッセルバーコード化オリゴヌクレオチドを含む、本発明1077の方法。
[本発明1079]
逆転写酵素はテンプレートスイッチング活性を有し、
複数の作製された相補的ポリヌクレオチドのうちの少なくともいくつかの鎖は、3つ以上の非テンプレートヌクレオチドを含む3'オーバーハングを含み、
複数の分子バーコード化オリゴヌクレオチドは、それぞれが(1)第1アダプターおよびベッセルバーコード化オリゴヌクレオチドを含む3'タグ付けオリゴヌクレオチドに相補的である5'末領域、(2)分子バーコードならびに(3)前記3'オーバーハングの前記3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチオリゴヌクレオチドとして提供され、
テンプレートスイッチオリゴヌクレオチドは、分子バーコードが各相補的ポリヌクレオチドに組み入れられて分子バーコード化ポリヌクレオチドを作製するように、逆転写酵素のテンプレートとして役立つ、
本発明1047~1078のいずれかの方法。
[本発明1080]
3つ以上の非テンプレートヌクレオチドに相補的な3'部分が、ヌクレオチド、リボヌクレオチドまたはそれらの類似体を含む、本発明1077~1079のいずれかの方法。
[本発明1081]
3つ以上の非テンプレートヌクレオチドが3つ以上のCヌクレオチドを含み、3つ以上の非テンプレートヌクレオチドに相補的な3'部分が1つまたは複数のGヌクレオチドもしくはリボヌクレオチドまたはそれらの類似体を含む、本発明1073~1080のいずれかの方法。
[本発明1082]
テンプレートスイッチオリゴヌクレオチドが、逆転写酵素またはDNAポリメラーゼによるテンプレートスイッチオリゴヌクレオチドの伸長を阻止する3'修飾ヌクレオチドをさらに含む、本発明1073~1081のいずれかの方法。
[本発明1083]
修飾が3'末ヌクレオチドのデオキシ、リン酸、アミノ、またはアルキル修飾である、本発明1082の方法。
[本発明1084]
工程(d)は、取り付ける工程の後に、複数の分子バーコード化ポリヌクレオチドのそれぞれを伸長して複数の二重バーコード化ポリヌクレオチドを生成させることをさらに含む、本発明1011~1083のいずれかの方法。
[本発明1085]
ベッセルが、ウェル、エマルジョン、液滴、またはマイクロカプセルである、本発明1001~1084のいずれかの方法。
[本発明1086]
工程(e)の前に、
複数のベッセルのうちの2つまたはそれ以上の内容物を合わせる工程であって、それによって、複数の一本鎖二重バーコード化ポリヌクレオチドのうちの2つまたはそれ以上を含む均一混合物を生成させる、工程
を含む、本発明1012~1085のいずれかの方法。
[本発明1087]
複数のベッセルの内容物を合わせる工程が、複数のベッセルの2つまたはそれ以上を破壊して、2つまたはそれ以上の破壊されたベッセルからの一本鎖二重バーコード化ポリヌクレオチドをプールすることを含む、本発明1086の方法。
[本発明1088]
工程(e)の前に、50塩基対超または約50塩基対超、100塩基対超、または200塩基対超であるサイズを有する一本鎖二重バーコード化ポリヌクレオチドを選択または精製する工程を含む、本発明1086または本発明1087の方法。
[本発明1089]
工程(e)の前に、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する一本鎖二重バーコード化ポリヌクレオチドを選択または精製する工程を含む、本発明1086~1088のいずれかの方法。
[本発明1090]
一本鎖二重バーコード化ポリヌクレオチドが、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含む、本発明1001~1089のいずれかの方法。
[本発明1091]
第1アダプターが、一本鎖バーコード化ポリヌクレオチドの、任意で一本鎖二重バーコード化ポリヌクレオチドの、5'領域またはその近傍に位置する、本発明1001~1090のいずれかの方法。
[本発明1092]
第2アダプターが、一本鎖バーコード化ポリヌクレオチドの、任意で一本鎖二重バーコード化ポリヌクレオチドの、3'領域またはその近傍に位置する、本発明1001~1091のいずれかの方法。
[本発明1093]
工程(a)~(f)のうちの1つまたは複数が、
溶解状態で実行され、かつ/または
固体支持体の存在下では実行されず、
ここで固体支持体は任意でビーズであるかビーズを含む、
本発明1013~1092のいずれかの方法。
[本発明1094]
少なくとも工程(c)および(d)が、
溶解状態で実行され、かつ/または
固体支持体の存在下では実行されず、
ここで固体支持体は任意でビーズである、
本発明1011~1093のいずれかの方法。
[本発明1095]
工程(a)~(e)のそれぞれが、
溶解状態で実行され、かつ/または
固体支持体の存在下では実行されず、
ここで固体支持体は任意でビーズである、
本発明1012~1094のいずれかの方法。
[本発明1096]
細胞の集団が、少なくとも1×10 3 、5×10 3 、1×10 4 、5×10 4 、1×10 5 、5×10 5 、1×10 6 、または5×10 6 細胞を含む、またはおよそ少なくとも1×10 3 、5×10 3 、1×10 4 、5×10 4 、1×10 5 、5×10 5 、1×10 6 、または5×10 6 細胞を含む、本発明1001~1095のいずれかの方法。
[本発明1097]
細胞の集団が、対象からの生物学的試料に由来する、本発明1001~1096のいずれかの方法。
[本発明1098]
生物学的試料が、全血試料、バフィーコート試料、末梢血単核球(PBMC)試料、未分画T細胞試料、リンパ球試料、白血球試料、アフェレーシス産物、または白血球アフェレーシス産物であるか、全血試料、バフィーコート試料、末梢血単核球(PBMC)試料、未分画T細胞試料、リンパ球試料、白血球試料、アフェレーシス産物、または白血球アフェレーシス産物を含む、本発明1097の方法。
[本発明1099]
細胞の集団が免疫細胞を含む、本発明1001~1098のいずれかの方法。
[本発明1100]
免疫細胞がリンパ球または抗原提示細胞を含む、本発明1099の方法。
[本発明1101]
免疫細胞が、リンパ球もしくはそのサブタイプ、B細胞もしくはそのサブタイプ、T細胞もしくはそのサブタイプ、またはそれらの組合せである、本発明1099または本発明1100の方法。
[本発明1102]
免疫細胞が、CD4+および/またはCD8+T細胞であるT細胞である、本発明1101の方法。
[本発明1103]
細胞の集団は、セントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞、エフェクターT細胞および制御性T細胞が濃縮されているか、またはセントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞、エフェクターT細胞および制御性T細胞を含む、本発明1001~1102のいずれかの方法。
[本発明1104]
細胞の集団は、メモリーB細胞、ナイーブB細胞または形質芽球B細胞が濃縮されている、本発明1001~1101のいずれかの方法。
[本発明1105]
対象がヒト対象である、本発明1097~1104のいずれかの方法。
[本発明1106]
対象が、がん、感染症または自己免疫状態を有する、本発明1097~1105のいずれかの方法。
[本発明1107]
感染症が、ウイルス感染症、細菌感染症または真菌感染症である、本発明1106の方法。
[本発明1108]
複数のバーコード化一本鎖ポリヌクレオチドを増幅する工程であって、それによって、複数のポリヌクレオチドテンプレートを生成させる、工程
をさらに含む、本発明1001~1107のいずれかの方法。
[本発明1109]
複数のバーコード化一本鎖ポリヌクレオチドの増幅が、第1アダプター配列に相補的な第1プライマーと第2アダプター配列に相補的な第2プライマーとを含む第1プライマーセットの存在下で実行される、本発明1108の方法。
[本発明1110]
第1プライマーおよび/または第2プライマーがユニバーサルプライマーである、本発明1109の方法。
[本発明1111]
第1プライマーおよび/または第2プライマーが、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である、本発明1110の方法。
[本発明1112]
第1プライマーがP7プライミング部位(C7)もしくはその連続する一部分に相補的であり、第2プライマーがP5プライミング部位(C5)もしくはその連続する一部分に相補的である、本発明1110または本発明1111の方法。
[本発明1113]
P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーが、配列
を有するか、もしくは同配列を含み、かつ/または
P5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーが、配列
を含む、
本発明1111または本発明1112の方法。
[本発明1114]
第1プライマーおよび/または第2プライマーがシーケンシングアダプターをさらに含む、本発明1109~1113のいずれかの方法。
[本発明1115]
P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーが配列
をさらに含み、かつ/または
P5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーが配列
を含む、
本発明1114の方法。
[本発明1116]
一本鎖バーコード化ポリヌクレオチドのそれぞれを、任意で一本鎖二重バーコード化ポリヌクレオチドのそれぞれを、精製する工程をさらに含む、本発明1001~1115のいずれかの方法。
[本発明1117]
本発明1001~1116のいずれかの方法によって作製される複数のバーコード化ポリヌクレオチドを含む、ポリヌクレオチドライブラリー。
[本発明1118]
複数のバーコード化ポリヌクレオチドを含むポリヌクレオチドライブラリーであって、
前記複数のバーコード化ポリヌクレオチドは、(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンを含む1つまたは複数の標的ポリヌクレオチドと(ii)それぞれが前記細胞中のポリヌクレオチドのアンプリコンを含むポリヌクレオチドの集合体とを含み、
各バーコード化ポリヌクレオチドは、
第1ユニバーサルプライマーに相補的である第1ユニバーサルプライミング部位を含む第1アダプター、
前記細胞の集団の同じ細胞に由来する(i)および(ii)からのすべてのバーコード化ポリヌクレオチドについて同じであるベッセルバーコードを含むベッセルバーコード化オリゴヌクレオチド、ならびに
第2ユニバーサルプライマーに相補的である第2ユニバーサルプライミング部位を含む第2アダプター配列
を含む、ポリヌクレオチドライブラリー。
[本発明1119]
複数のバーコード化ポリヌクレオチドのそれぞれが、各ポリヌクレオチドにユニークである分子バーコードを含む、本発明1118のポリヌクレオチドライブラリー。
[本発明1120]
細胞の集団の各細胞からのバーコード化ポリヌクレオチドテンプレートの集合体が、全体として、トランスクリプトームまたは部分的トランスクリプトームに対応する相補的DNA(cDNA)鎖を含む、本発明1118または本発明1119のポリヌクレオチドライブラリー。
[本発明1121]
トランスクリプトームまたは部分的トランスクリプトームが、全体として、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、本発明1118~1120のいずれかのポリヌクレオチドライブラリー。
[本発明1122]
バーコード化ポリヌクレオチドテンプレートのそれぞれが、50塩基対超または約50塩基対超、100塩基対超または200塩基対超であるサイズを有する、本発明1118~1121のいずれかのポリヌクレオチドライブラリー。
[本発明1123]
バーコード化ポリヌクレオチドのそれぞれが、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する、本発明1118~1122のいずれかのポリヌクレオチドライブラリー。
[本発明1124]
第1アダプターがベッセルバーコードを含む、本発明1118~1123のいずれかのポリヌクレオチドライブラリー。
[本発明1125]
バーコード化ポリヌクレオチドが一本鎖である、本発明1118~1124のいずれかのポリヌクレオチドライブラリー。
[本発明1126]
第1アダプターと第2アダプターとが異なる、本発明1118~1125のいずれかのポリヌクレオチドライブラリー。
[本発明1127]
第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分を含み、任意で前記その連続する一部分は相補的配列にアニールするのに十分である、本発明1118~1126のいずれかのポリヌクレオチドライブラリー。
[本発明1128]
第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含み、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含む、本発明1118~1127のいずれかのポリヌクレオチドライブラリー。
[本発明1129]
P7プライミング部位(C7)が配列
を含むか、またはその連続する一部分である、本発明1127または本発明1128のポリヌクレオチドライブラリー。
[本発明1130]
P5プライミング部位が配列
を含むか、またはその連続する一部分である、本発明1127~1129のいずれかのポリヌクレオチドライブラリー。
[本発明1131]
連続する一部分が少なくとも15、20、25もしくは30ヌクレオチド長を含む、または少なくとも約15、20、25もしくは30ヌクレオチド長を含む、本発明1127~1130のいずれかのポリヌクレオチドライブラリー。
[本発明1132]
P5プライミング部位がSEQ ID NO:25
に示す連続する一部分である、本発明1127~1131のいずれかのポリヌクレオチドライブラリー。
[本発明1133]
ベッセルバーコード化オリゴヌクレオチドが、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、本発明1118~1132のいずれかのポリヌクレオチドライブラリー。
[本発明1134]
ベッセルバーコード化オリゴヌクレオチドが10~30ヌクレオチドまたは約10~30ヌクレオチドを含む、本発明1118~1133のいずれかのポリヌクレオチドライブラリー。
[本発明1135]
1つまたは複数の標的ポリヌクレオチドが免疫分子またはその鎖のポリヌクレオチドを含む、本発明1118~1134のいずれかのポリヌクレオチドライブラリー。
[本発明1136]
1つまたは複数の標的ポリヌクレオチドは、それぞれが免疫分子鎖のポリヌクレオチドを含む少なくとも2つの標的ポリヌクレオチドを含む、本発明1118~1135のいずれかのポリヌクレオチドライブラリー。
[本発明1137]
1つまたは複数の標的ポリヌクレオチドがTCRまたはその鎖の1つまたは複数のポリヌクレオチドを含む、本発明1118~1136のいずれかのポリヌクレオチドライブラリー。
[本発明1138]
1つまたは複数の標的ポリヌクレオチドがT細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含む、本発明1118~1137のいずれかのポリヌクレオチドライブラリー。
[本発明1139]
1つまたは複数の標的ポリヌクレオチドがT細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ)の第2ポリヌクレオチドを含む、本発明1118~1137のいずれかのポリヌクレオチドライブラリー。
[本発明1140]
1つまたは複数の標的ポリヌクレオチドが抗体またはその鎖の1つまたは複数のポリヌクレオチドを含む、本発明1118~1136のいずれかのポリヌクレオチドライブラリー。
[本発明1141]
1つまたは複数の標的ポリヌクレオチドが重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含む、本発明1118~1136および本発明1140のいずれかのポリヌクレオチドライブラリー。
[本発明1142]
バーコード化ポリヌクレオチドが、順に(5'から3'へ)、第1アダプター、ベッセルバーコードオリゴヌクレオチド、分子バーコードおよび第2アダプターを含む、本発明1118~1141のいずれかのポリヌクレオチドライブラリー。
[本発明1143]
第1アダプターが二重バーコード化一本鎖ポリヌクレオチドの5'領域またはその近傍に位置する、本発明1118~1142のいずれかのポリヌクレオチドライブラリー。
[本発明1144]
第2アダプターが二重バーコード化一本鎖ポリヌクレオチドの3'領域またはその近傍に位置する、本発明1118~1143のいずれかのポリヌクレオチドライブラリー。
[本発明1145]
1つもしくは複数の標的ポリヌクレオチドおよび/または1つもしくは複数の細胞の完全なもしくは部分的なトランスクリプトームをシーケンシングするための方法であって、本発明1001~1116のいずれかによって作製される、または本発明1117~1142のいずれかのポリヌクレオチドライブラリーからの、複数のバーコード化ポリヌクレオチド、任意で二重バーコード化ポリヌクレオチドのうちの1つまたは複数をシーケンシングする工程を含む、方法。
[本発明1146]
1つまたは複数の細胞の完全なまたは部分的なトランスクリプトームがシーケンシングされる、本発明1145の方法。
[本発明1147]
シーケンシングに先だって、完全なトランスクリプトームまたはその一部分を増幅する工程をさらに含む、本発明1146の方法。
[本発明1148]
増幅が、それぞれ第1アダプター配列と第2アダプター配列に特異的な第1プライマーと第2プライマーとを含む第1プライマーセットを使って実行される、本発明1147の方法。
[本発明1149]
複数のバーコード化ポリヌクレオチドからの1つまたは複数の標的ポリヌクレオチドがシーケンシングされる、本発明1144~1148のいずれかの方法。
[本発明1150]
シーケンシングに先だって、複数のバーコード化ポリヌクレオチドから1つまたは複数の標的ポリヌクレオチドを増幅する工程をさらに含む、本発明1149の方法。
[本発明1151]
1つまたは複数の標的ポリヌクレオチドの全長配列が増幅される、本発明1150の方法。
[本発明1152]
増幅が、1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーと第1アダプター配列に相補的な第2プライマーとを含む第2プライマーセットの存在下で実行される、本発明1150または本発明1151の方法。
[本発明1153]
第2プライマーセットの第2プライマーが、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である、本発明1152の方法。
[本発明1154]
第2プライマーセットの第2プライマーが、P7プライミング部位(C7)またはその連続する一部分に相補的である、本発明1152または本発明1153の方法。
[本発明1155]
第2プライマーセットの第2プライマーが、配列
を有するか、または同配列を含む、本発明1152~1154のいずれかの方法。
[本発明1156]
1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーが、免疫分子またはその鎖の標的配列に特異的である、本発明1152~1155のいずれかの方法。
[本発明1157]
免疫分子がT細胞受容体または抗体である、本発明1156の方法。
[本発明1158]
1つまたは複数の第1プライマーが、免疫分子の定常領域の標的配列に特異的である、本発明1156または本発明1157の方法。
[本発明1159]
免疫分子がTCRであり、かつ1つまたは複数の第1プライマーが
またはそれらの組合せを含む、本発明1156~1158のいずれかの方法。
[本発明1160]
免疫分子が抗体であり、1つまたは複数の第1プライマーがSEQ ID NO:29~36のいずれかまたはそれらの組合せを含む、本発明1156~1159のいずれかの方法。
[本発明1161]
1つまたは複数のバーコード化ポリヌクレオチドの、任意で二重バーコード化ポリヌクレオチドの、細胞起源を決定する工程をさらに含む、本発明1145~1160のいずれかの方法。
[本発明1162]
細胞起源を決定する工程が、同じベッセルバーコードを有する二重バーコード化ポリヌクレオチドの配列を、同じ細胞からのものであると同定することを含む、本発明1161の方法。
[本発明1163]
標的ポリヌクレオチドが、第1ポリヌクレオチド鎖および第2ポリヌクレオチド鎖を含む免疫分子であり、
シーケンシングされた二重バーコード化ポリヌクレオチド中の同じベッセルバーコードの存在によって、第1ポリヌクレオチド鎖と第2ポリヌクレオチド鎖とを同じ細胞にマッチングさせる工程を含む、本発明1161または本発明1162の方法。
[本発明1164]
同じバーコードを持つ、任意で同じ分子バーコードを持つ、ポリヌクレオチドの数を、定量または決定する工程をさらに含む、本発明1155~1163のいずれかの方法。
[本発明1165]
複数のバーコード化ポリヌクレオチドが分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドであり、
同じベッセルバーコードを有するトランスクリプトーム配列および標的ポリヌクレオチド配列を同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する細胞のトランスクリプトーム情報を同定する、工程
をさらに含む、本発明1155~1164のいずれかの方法。
[本発明1166]
以下の工程を含む、トランスクリプトーム解析のための方法:
(a)本発明1001~1116のいずれかの方法によって作製される複数の複数のバーコード化ポリヌクレオチドから、または本発明1117~1142のいずれかのポリヌクレオチドライブラリーの複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドをシーケンシングする工程であって、それによって、複数の細胞から標的ポリヌクレオチドに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;
(b)本発明1001~1116のいずれかの方法によって作製される複数のバーコード化ポリヌクレオチドから、または本発明1117~1142のいずれかのポリヌクレオチドライブラリーの複数のバーコード化ポリヌクレオチドから、全トランスクリプトームまたはその一部分をシーケンシングする工程であって、それによって、前記複数の細胞からトランスクリプトームデータを生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;および
(c)同じベッセルバーコードを有する(a)からの配列情報および(b)からの配列情報を、同じ細胞からのものであると同定する工程。
[本発明1167]
以下の工程を含む、選択された単一細胞のトランスクリプトームを解析する方法:
(a)本発明1001~1116のいずれかの方法によって作製される複数のバーコード化ポリヌクレオチドから、または本発明1117~1142のいずれかのポリヌクレオチドライブラリーの複数の複数のバーコード化ポリヌクレオチドから、1つまたは複数の標的ポリヌクレオチドを増幅する、かつシーケンシングする工程であって、それによって、複数の細胞のうちの少なくとも1つにおける標的ポリヌクレオチドのそれぞれに関する配列情報を生成させる、工程、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドである;
(b)(a)においてシーケンシングされた標的ポリヌクレオチド配列のうちの1つに関連するベッセルバーコードを同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する選択された単一細胞を同定する、工程;
(c)(b)において同定されたベッセルバーコードを保持する細胞の複数のバーコード化ポリヌクレオチドからトランスクリプトームまたはその一部分を増幅する、かつシーケンシングする工程であって、それによって、選択された標的ポリペプチド発現細胞からトランスクリプトームデータを生成させる、工程。
[本発明1168]
トランスクリプトームまたはその一部分が、選択された細胞から、(b)において同定されたベッセルバーコードに特異的なプライマーとバーコード化ポリヌクレオチドの第2アダプター配列に特異的なプライマーとを使って増幅またはシーケンシングされる、本発明1167の方法。
[本発明1169]
同じ細胞からのトランスクリプトームまたはその一部分の配列情報と標的ポリヌクレオチドのうちの少なくとも1つの配列情報とをマッチングさせる工程を含む、トランスクリプトーム解析のための方法であって、配列情報が、本発明1001~1114のいずれかの方法によって作製される複数のバーコード化ポリヌクレオチドから決定されるか、本発明1117~1142のいずれかのポリヌクレオチドライブラリーの複数のバーコード化ポリヌクレオチドから決定され、ここでバーコード化ポリヌクレオチドは分子バーコードとベッセルバーコードとを含む二重バーコード化ポリヌクレオチドであり、または本発明1155~1165のいずれかの方法から決定される、方法。
[本発明1170]
同じベッセルバーコードを有する配列は、同じ細胞からのものであるとしてマッチングされる、本発明1169の方法。
[本発明1171]
トランスクリプトームデータが、細胞の機能または活性に関連するパラメータ、特性、特徴または表現型を含む、本発明1166~1170のいずれかの方法。
[本発明1172]
トランスクリプトームデータが、細胞の活性化、疲弊または増殖活性に関連する、本発明1171の方法。
【図面の簡単な説明】
【0074】
図1A】本明細書に記載する例示的方法のバーコード化相の概略図である。この略図は、ライブラリー調製および免疫シーケンシングのために、2つまたはそれ以上のポリヌクレオチド、例えば標的ポリヌクレオチドと1つもしくは複数のゲノムポリヌクレオチドもしくはトランスクリプトームポリヌクレオチド、またはペアリングされた(paired)配列、例えばペアリングされた可変Ig(例えばVHおよびVL mRNA)もしくはTCR配列(例えばVα/VβおよびVγ/Vδ mRNA)を、増幅し、バーコード化する方法を表している。ベッセルバーコード(VB)、分子バーコード(MB)。(上)単一細胞と他の反応構成要素(例えば酵素、緩衝液、オリゴヌクレオチド)とを含有する、例示的なベッセルとしての、エマルジョンの(複数の液滴のうちの)単一の液滴。(中)細胞溶解、ならびに標的特異的プライマー、ランダムプライマーおよび/またはオリゴdT逆転写プライマーを利用する、溶解された細胞のRNAの逆転写の例示的な方法。(下)逆転写相における単一分子のテンプレートスイッチ相および分子バーコード(MB)タグ付け。
図1B】本明細書に記載する例示的な方法の増幅相の概略図である。この略図は、ライブラリー調製および免疫シーケンシングのために、2つまたはそれ以上のポリヌクレオチド、例えば標的ポリヌクレオチドと1つもしくは複数のゲノムポリヌクレオチドもしくはトランスクリプトームポリヌクレオチド、またはペアリングされた配列、例えばペアリングされた可変Ig(例えばVHおよびVL mRNA)およびTCR配列(例えばVα/VβおよびVγ/Vδ mRNA)を、増幅し、バーコード化する方法を表している。(上)ベッセルバーコード(VB)の独立した増幅は、各液滴内で同一VBの複数のコピーを生成させる。分子バーコード化(MB)cDNA分子は、増幅のアニーリング相および伸長相において、VBで同時にタグ付けされる。(中)増幅サイクルにおける二重バーコード化cDNA分子の同時増幅。(下)さらなるプロセシング(例えば精製、サイズ選択、アダプターライゲーション、増幅およびシーケンシング)の準備が整った例示的な二重バーコード化cDNA分子。
図2】は、本明細書に記載する例示的な方法である二重バーコード化転写産物の増幅およびシーケンシングを図示している。(上)第1アダプターのユニバーサルプライミング配列に特異的なプライマーと標的特異的プライマーとを使った、関心対象の標的遺伝子をコードする転写産物の増幅およびシーケンシング。各プライマーはシーケンシング用のシーケンシングアダプターに連結されている。(中)第1アダプターのユニバーサルプライミング配列に特異的なプライマーと第2アダプターのユニバーサルプライミング配列に特異的なプライマーとを使った、1つまたは複数の細胞のライブラリー中の全転写産物、例えばトランスクリプトーム、またはその一部分の増幅およびシーケンシング。(下)同じ細胞からのポリヌクレオチドに共通する決定されたベッセルバーコード(VB)に特異的なプライマーと第2アダプターのユニバーサルプライミング配列に特異的なプライマーとを使った、選択された関心対象の細胞、例えば関心対象の標的遺伝子のmRNA転写産物を含有すると決定された細胞に関するトランスクリプトームの増幅およびシーケンシング。
図3】Seuratソフトウェアツールによる推定クラスター属性(inferred cluster identity)で色分けされた(A、破線は主として同じ色を呈するイベントのクラスターを示す)、またはシーケンシングされた全長免疫受容体のタイプ、B細胞受容体(BCR)もしくはT細胞受容体(TCR)で色分けされた(B、破線は主として同じ色を示すイベントのクラスターを示す)、単一細胞トランスクリプトームデータのt-SNEプロットを図示している。
図4】同定された配列、Toll様受容体7(TLR7;A)、T細胞表面糖タンパク質CD3イプシロン鎖(CD3E;B)、ナチュラルキラー細胞顆粒タンパク質7(NKG7;C)、マンノース受容体Cタイプ1(MRC1;D)を発現する細胞を同定するために色分けされた、図3の単一細胞トランスクリプトームデータのt-SNEプロットを図示している。
【発明を実施するための形態】
【0075】
詳細な説明
単一細胞における遺伝子発現または複数の単一細胞における遺伝子発現を解析するための方法および組成物が、本明細書において提供される。提供される方法は、完全なトランスクリプトームまたはその一部分からのポリヌクレオチド、および関心対象の標的遺伝子、例えばペアリングされた全長免疫受容体産物、例えばTCRまたは抗体の、1つまたは複数の全長ポリヌクレオチド配列を含有する、複数の単一細胞高品質ポリヌクレオチド(例えばDNA)シーケンシングライブラリーの効率のよい生成を可能にし、それにより、同じ細胞に由来する標的ポリヌクレオチドと完全なまたは部分的なトランスクリプトームからのポリヌクレオチドとを同定することができる。いくつかの態様において、ライブラリー中の複数のポリヌクレオチドのそれぞれは、実験の実施時に決めなければならない特異的遺伝子ではなく回収された産物全体の次世代シーケンシングを可能にするアダプター配列(例えば第1アダプターおよび第2アダプター)を含有する。したがって、提供される方法のいくつかの局面において、後続のPCR増幅は、これらのアダプター配列に特異的なプライマーおよび/または関心対象の標的ポリヌクレオチドに特異的なプライマーおよび/または細胞特異的プライマーを使って実行することができる。いくつかの態様において、提供される方法は、1回の実験で数万または数十万の細胞を処理することを可能にし、それによって全長免疫分子配列、例えば抗体またはTCRと組み合わされた単一細胞シーケンシングデータ、例えばRNA-seqデータ、例えばmRNAカウントを、効率よく高いスループットで与える。
【0076】
場合により、組織のゲノム内容物およびmRNA内容物の全部または一部のダイレクトシーケンシングは、既に公知である遺伝子を前もって選択する必要なく、選択的スプライシング、調節/プロモーター領域、およびポリアデニル化シグナルの解析を可能にするために使用されることが増えている(Cloonan et al.,Nat Methods 5(7):613-9(2008))。しかし、細胞のmRNA内容物をダイレクトシーケンシングで解析する現行の方法は、典型的には何百万もの細胞を含有する組織試料から得られるバルクmRNAの解析に頼っている。これは、バルクmRNAにおいて遺伝子発現を解析した場合には、単一細胞中に存在する機能情報の多くが失われるまたは不鮮明になることを意味する。加えて、集団平均では、細胞周期などの動的過程における遺伝子発現を観察することは難しい。それゆえに、いくつかの応用では、単一細胞ベースのダイレクトシーケンシングアプローチが、バルク試料より好ましい。
【0077】
いくつかの例では、選択された細胞の、例えば関心対象の1つまたは複数の特定遺伝子、例えば標的遺伝子を発現する細胞の、ゲノム内容物またはmRNA内容物を解析することが望ましい。いくつかの例では、選択された細胞のゲノム内容物またはトランスクリプトーム内容物を得ると同時に、免疫受容体などの標的遺伝子の全長配列も得ることが望ましい。単一細胞トランスクリプトームシーケンシングのための既存のツールとしては、マイクロアレイ、96ウェルベースの方法、例えばウェルへの伝統的なFACS選別、およびFluidigm C1などのマイクロ流体機器が挙げられる。これらのツールは、全トランスクリプトームおよび標的ライブラリーを調製するために使用することができるが、解析することができる細胞の数に限界があるので(例えば数百~数千細胞)、それらのスループットは限られている。
【0078】
いくつかの例では、選択された細胞の、例えば関心対象の1つまたは複数の特定遺伝子、例えば標的遺伝子(例えば免疫受容体)を発現する細胞の、ゲノム内容物またはmRNA内容物を解析することが望ましい。マイクロウェルアレイまたはエマルジョンを用いる超ハイスループット法では全単一細胞トランスクリプトームシーケンシングが可能であると記載されているが(例えばKlein et al.,Cell(2015)161(5):1187-1201、Macosko et al.,Cell(2015)161(5):1202-1214、WO/2015/164212、WO/2016/040476参照)、全長免疫受容体配列などの全長標的配列の効率のよい捕捉は、既存の技術では不可能である。これらの方法も、1細胞あたりにより大きな液滴およびより大きな反応体積を必要とするビーズベースのアプローチが課す制限ゆえに、典型的には数千までと少数の細胞に限定される。
【0079】
提供される方法の態様では、複数の細胞の標的配列、例えば標的免疫分子(例えば抗体またはTCR)とゲノムまたはトランスクリプトーム配列とが、1つの同時反応で作製され、同じ細胞に由来する配列の配列情報を結びつけるための機序を提供する。いくつかの局面において、ここに開示する方法は、ハイスループットシーケンシング技術と連携させると、多数の単一細胞を解析し、1つの単一反応アッセイでの解析を達成することを可能にする。原理的には、任意の数の細胞および1細胞あたり任意の数のターゲット領域をシーケンシングすることができる。いくつかの局面において、処理することができる単一細胞の数は、ハイスループットシーケンシングの速度などといった実用上の制約によってのみ制限される。いくつかの態様において、本明細書に開示する方法は、ビーズでの使用に適合させることができる。別の態様において、本明細書に開示する方法は、ビーズベースのシーケンシングまたは増幅工程を含まない。
【0080】
いくつかの局面において、提供される方法は、複数の単一細胞における遺伝子発現を解析するために使用することができるcDNAライブラリーを調製する方法を提供することによって、既存の方法の課題を克服または低減する。いくつかの態様において、提供される方法は、ペアリングされたヘテロ二量体型標的または多量体型標的の配列を含む、そのまま合成に使える(synthesis-ready)全長標的配列の回収を可能にすると共に、その標的配列を発現すると同定された細胞の補完的な定量的ゲノムまたはトランスクリプトーム情報を同時に捕捉する、超ハイスループットシーケンシング用のポリヌクレオチドライブラリーの作製をもたらす。
【0081】
特に、提供される方法は、複数の単一細胞からポリヌクレオチドライブラリー、例えばcDNAライブラリーを調製するための方法である。本方法は、個々の細胞の集団からの遺伝子発現レベルを決定することに基づき、これは、遺伝子発現の自然変動を細胞ごとのレベルで同定するために使用することができる。本方法は、適切な細胞表面マーカーが存在しない場合を含めて、細胞の集団の細胞組成を同定し、特徴づけるためにも使用することができる。古典的な方法によって調製されるcDNAライブラリーが、典型的には、大きな集団から単離された全RNAを必要とするのに対して、本明細書に記載する方法には、単一細胞を使って細胞集団中のRNA内容物を表現するcDNAライブラリーを生成するという利点がある。したがっていくつかの局面において、提供される方法を使って作製されるcDNAライブラリーでは、本明細書に記載するさらなる利点と共に、個々の細胞のより小さな亜集団を利用して細胞の集団中のRNA内容物の少なくとも等価な表現が可能になる。
【0082】
提供される態様は、単一細胞標的シーケンシング、例えば免疫標的シーケンシングと、トランスクリプトーム解析のための、エマルジョンベースの方法に基づく。いくつかの局面では、細胞の集団を含有する試料からの細胞が、例えばマイクロ流体エマルジョンベースの方法を使って、単一細胞ベッセル(例えば液滴)に封入される。次に、エマルジョン液滴内でベッセル(例えば液滴)特異的バーコードを標的ポリヌクレオチド(例えば標的mRNA転写産物のアンプリコン)および/または複数のポリヌクレオチド(例えば完全なまたは部分的なトランスクリプトームのmRNA転写産物のアンプリコン)に取り付け、それによって、液滴内に含まれている単一細胞のハイスループットな遺伝子解析および/または発現解析を可能にするための方法が実行される。いくつかの局面において、ベッセルバーコードは、最初は、既知のプライマー部位に挟まれたランダム化中央配列部分を持つ単一分子DNAテンプレートとして存在する。テンプレートは、液滴などのベッセル内で、逆転写されてアンプリコンを生成しかつ/またはPCR増幅されて、1つまたは複数のアンプリコンを与えることができ、配列オーバーラップによって細胞由来の核酸に取り付けられた状態になりうる。本方法のいくつかの局面において、細胞由来の核酸は、関心対象の1つまたは複数の標的遺伝子、例えば抗体またはT細胞受容体(TCR)などの免疫分子を増幅するために、遺伝子特異的PCRプライマーを使って増幅される。場合により、数種類の標的遺伝子を増幅することができれば、その細胞のさまざまな特徴、例えばその細胞の表現型、活性または他の特徴に関する情報を得ることができる。
【0083】
場合によっては、さらなる標的遺伝子を加えることにより、特定免疫分子、例えばTCRに関する情報を、細胞の細胞表現型情報と結びつけることができる。本方法のさらなる局面において、バーコード化全トランスクリプトーム細胞由来核酸は、細胞の完全なトランスクリプトームまたはその一部分をシーケンシングできるようにするプライマーを使って増幅することができ、同じ細胞に由来する転写産物をマッチングさせることができる。いくつかの局面において、ランダム逆転写プライマーは、トランスクリプトームの転写産物に対応するアンプリコンを生成させるために使用される。一定の態様では、ライブラリー全体をバルクで増幅し、ハイスループットショットガン方式でシーケンシングすることができるように、バーコード化ポリヌクレオチドの端部に、例えば付加された第1アダプターおよび第2アダプターによって、ユニバーサルプライミング部位を付加することができる。
【0084】
いくつかの態様において、細胞由来の核酸を増幅するための反応は、a)細胞溶解、b)標的mRNA逆転写、c)各cDNAの分子バーコード化、d)ベッセル特異的DNAバーコードのPCR増幅、およびe)各cDNAへのベッセルバーコードのコピーの取り付け、を実施することができるワンポット反応で、実行することができる。いくつかの態様では、産物を回収し、例えばさまざまなシーケンシングプラットフォームのいずれかを使って、シーケンシングすることができる。例えばIllumina MiSeqプラットフォームを使用し、325×300bpを使って、各産物の全長をシーケンシングすることができる。いくつかの局面において、液滴バーコードは、各単一細胞からのすべての産物の同定を可能にする。一定の局面において、分子バーコードは各細胞についての発現の定量を可能にし、場合により、シーケンシングエラーおよびRT-PCRエラーの排除を可能にする。
【0085】
提供される態様において、増幅されたライブラリーは別々に処理することができるので、トランスクリプトームシーケンシングの過程は、数個の選ばれた転写産物、例えばTCRのターゲットシーケンシングとは別個に実施することができる。これにより、本方法は、同じ増幅されたバーコード化ライブラリーに対して、別々のアリコートで、何回も実施することが可能になる。同じ増幅されたバーコード化ライブラリーで、その時々で異なる実験を実施することができるので、提供される方法により、種々の有用なアプローチを実現することができる。一例では、本方法を使って、まず、試料中の関心対象の標的分子、例えばTCRのターゲットシーケンシングを実行することができ、これは関心対象の数個の特定細胞の同定につながりうる。いくつかの局面では、関心対象の細胞を表すベッセルバーコードを標的とするPCRオリゴヌクレオチドまたは捕捉オリゴヌクレオチドをデザインすることで、それらの細胞の全バーコード化転写産物のみの捕捉およびシーケンシングを可能にすることができる。いくつかの局面において、これは、ライブラリー全体をシーケンシングするシーケンシングコストを大きく低減させる。
【0086】
一定の局面において、本明細書に記載する方法および組成物は、例えば複雑な細胞試料のゲノム、トランスクリプトーム、プロテオーム、代謝経路などを研究するための、単一細胞解析に役立つ。複雑な試料または混合物を研究する場合、不均一な細胞集団中の複数の細胞の解析は、特に有用である。複雑な試料または細胞混合物としては、例えば末梢血単核球(PBMC)試料、メタゲノム試料、正常組織切片およびがん性組織切片、胚細胞コロニーおよび幹細胞コロニーが挙げられる。ゲノムシーケンシングおよびトランスクリプトームシーケンシングは多様な細胞タイプを同定するのに、または活性化、疲弊もしくは増殖の異なる段階など、一定の段階にある細胞を同定するのに、望ましい。特定の応用として、分子T細胞受容体およびB細胞受容体プロファイリング、ハプロタイピングおよびHLAタイピングが挙げられる。
【0087】
「メタゲノム試料」とは、複数の起源からの、例えば複数の種からの、ゲノムを含有する試料を指す。例えば、本アプローチを細菌種の混合物に応用することで、複数の細菌からの核酸のシーケンシングを1回のアッセイで行い、続いてそれらの配列を同じ細菌細胞に相関させることができる。同様に、腫瘍に浸潤する免疫細胞など、細胞タイプが異なる細胞の中の1細胞タイプの核酸配列。そのような例では、本明細書において提供される方法を使って、腫瘍に浸潤する免疫細胞の核酸を、免疫受容体の全長配列またはその結合性フラグメントと相関させることができる。
【0088】
提供される方法の態様は、多数の単一細胞のサンプリングも可能にする。発現パターンの類似性を使って、細胞がどのように関係しているかを示す細胞のマップを構築することができる。このマップは、近縁細胞のクラスターを検出することによって、インシリコで細胞タイプを識別するために使用することができる。少数ではなく多数の単一細胞をサンプリングすることにより、発現パターンの類似性を使って、細胞のマップを構築し、それらがどのように関係しているかを示すことができる。この方法は、細胞タイプを事前精製する必要なく、集団中に存在するすべての相異なる細胞タイプからの希釈されていない発現データへのアクセスを可能にする。加えて、公知のマーカーを利用できる場合には、それらをインシリコで使用して、関心対象の細胞を叙述することができる。
【0089】
提供される態様には、各単一細胞からmRNAを放出させて、各個別mRNA試料中のmRNAが単一細胞に由来する複数の個別試料を得ること、各個別mRNA試料中のmRNAからcDNAの第1鎖(すなわちアンプリコン)を合成すること、およびヌクレオチドバーコード(例えば分子バーコードおよび/またはベッセルバーコード)をcDNAアンプリコンに組み入れて複数のバーコード化(例えば二重バーコード化)cDNA試料を得ること(すなわち各バーコード化cDNA試料中のcDNAは単一細胞からのmRNAに相補的である)、それらバーコード化cDNA試料をプールすること、およびプールされたcDNA試料を増幅してバーコード化二本鎖cDNAを含むcDNAライブラリーを生成させることによって、複数の単一細胞からポリヌクレオチドライブラリー、例えばcDNAライブラリーを調製する方法が含まれる。いくつかの態様において、結果として生じるアンプリコンは二重バーコード化一本鎖cDNA、例えば1つまたは複数のmRNAテンプレートに対応する二重バーコード化一本鎖cDNAである。いくつかの態様では、シーケンシングを容易にするためのアダプターなどのアダプターの付加が容易になるように、バーコード化二本鎖cDNAを変性させて、バーコード化一本鎖cDNAを生成する。上記の方法を利用することにより、数百の単一細胞から短時間でシーケンシング用の試料を調製することが可能である。シーケンシング用にRNAからフラグメントライブラリーを調製するための伝統的な方法には、手間のかかるゲル切出し工程が含まれる。本明細書に記載する方法のいくつかの局面では、複数の細胞が(cDNA合成後に)単一試料として調製され、これにより、複数の細胞、例えば数百の細胞をシーケンス用に調製することが可能になる。加えて、複数の細胞の各セットは一緒に(単一のチューブで)調製されるので、技術的変動を最小限に抑えることができる。
【0090】
本発明のいくつかの局面では、単一細胞から得られた各cDNA試料がバーコードでタグ付けされ、これにより、遺伝子発現を単一細胞のレベルで解析することが可能になる。これにより、細胞周期などの動的過程における発現を研究することおよび複雑な組織(例えば脳)の中の相異なる細胞タイプを解析することが可能になる。いくつかの局面において、cDNA試料は、解析に先だってプールすることができる。試料をプールする工程は、各単一細胞からの試料の取扱いを単純化し、単一細胞における遺伝子発現を解析するのに要する時間を低減することにより、遺伝子発現のハイスループット解析を可能にする。増幅前のcDNA試料をプールすることには、試料間の技術的ばらつきが事実上排除されるという利点もある。加えて、cDNA試料は増幅前にプールされるので、各単一細胞からのcDNA試料を個別に増幅し処理する場合と比べると、後続の解析のために十分な量のcDNAを生成させるのに必要な増幅も少なくなる。これは、増幅バイアスを低減すると共に、いかなるバイアスも、プールされたcDNA試料を提供するために使用されたすべての細胞間で類似したものになることを意味する。RNAの精製、貯蔵および取扱いも必要がなく、これは、RNAの不安定な性質が引き起こす問題を排除するのに役立つ。
【0091】
T細胞受容体鎖ペアおよび抗体免疫グロブリン鎖ペアは、どちらも、ここに開示する方法を使ってシーケンシングすることが想定されるタイプの免疫受容体である。いくつかの態様において、提供される方法は、1つまたは複数の標的配列の配列、例えば免疫受容体の1つまたは複数の配列、ならびに組み合わせることでゲノムシーケンシング情報および/またはトランスクリプトームシーケンシング情報を得ることができる配列を含む、ハイスループットシーケンシングおよび遺伝子発現解析用のポリヌクレオチドライブラリーの生成を可能にする。いくつかの態様では、特定の共通属性を持つ患者またはコホートからの抗体および/またはTCR発見のためのヒト由来ライブラリーパネルであるポリヌクレオチドライブラリーを開発することができる。提供される方法のいくつかの態様において、出発材料は、関心対象の標的ポリヌクレオチド、例えば免疫分子または免疫受容体、例えば抗体またはTCRを含有するまたは含有する可能性が高い関心対象の細胞の集団を含有する任意の供給源であることができる。いくつかの態様において、出発材料は末梢血であるか、組織生検によるものであることができ、所望であれば、そこから、免疫細胞を包括的に単離するか、ナイーブ細胞、メモリー細胞および/または抗体分泌細胞(ASC)をサブソートする。いくつかの態様において、提供される方法は、複数の異なるタイプの、単独のまたはペアリングされた可変配列、例えばT細胞受容体鎖ペアおよび抗体免疫グロブリン鎖ペアに適用することができる。
【0092】
いくつかの局面において、提供される方法によって作製されるcDNAライブラリーは、ダイレクトシーケンシングによる単一細胞の遺伝子発現プロファイルの解析に適しており、これらのライブラリーを使って、遺伝子の発現、例えば関心対象の特定標的ポリヌクレオチドと関連する、例えば抗原、抗体またはTCRなどの免疫分子または免疫受容体と関連する、遺伝子の発現、またはそれらを保持する細胞を研究することが可能である。いくつかの態様では、今まで公知でなかった遺伝子発現プロファイルを解析することができる。いくつかの態様において、提供される方法は、試料からの複数の細胞のそれぞれを、それぞれの転写細胞状態、例えば細胞の活性化、疲弊、増殖もしくは他の所望のパラメータまたは属性について、特徴づけまたは比較するために使用することができる。いくつかの態様において、提供される方法は、関心対象の抗原に特異的な特定TCRを保持する特定細胞の応答を見ることによって、治療候補、例えばTCRの発見を容易にするために使用することができる。提供される方法のいくつかの態様では、所望の応答、例えばT細胞活性化の性質または程度に関連するTCRを発現する細胞を同定することが可能である。いくつかの態様において、提供される方法は、予備知識および/または候補遺伝子のより小さなパネルの選択を必要とする既存の方法とは異なり、全トランスクリプトームの解析によって、よりリッチなデータセットを捕捉することを可能にする。
【0093】
I. 標的およびトランスクリプトーム解析のためのポリヌクレオチドライブラリー
いくつかの態様では、本明細書において提供される方法が、1つまたは複数の標的ポリヌクレオチド分子の増幅およびシーケンシングならびにポリヌクレオチドの集合体の増幅およびシーケンシング、例えば単一細胞または細胞の集団からの1つまたは複数の標的分子とポリヌクレオチドの集合体の増幅およびシーケンシングに向けられる。いくつかの態様において、本明細書に記載する方法および組成物は、複雑な細胞試料のゲノム、トランスクリプトーム、プロテオーム、代謝経路などを研究するための、単一細胞解析に役立つ。別の局面において、本明細書に記載する方法および組成物は、例えば単一B細胞中および単一T細胞中の免疫グロブリンまたはT細胞受容体の重鎖と軽鎖をペアリングすることなどによる免疫受容体の発見、ならびにHLAタイピングに使用することができる。別の態様では、抗体ペアリング情報と単一細胞解析とを組み合わせて、細胞機能情報または細胞状態情報を同定された免疫受容体配列の発現と関連づけることができる。さらに別の局面では、診断のために、または新しい薬物もしくは処置レジメンを発見するために、本明細書に記載する方法および組成物を使って、複雑な正常試料またはがん性試料における低分子および薬物または免疫治療の影響およびそれらの効果をモニタリングすることができる。さらなる別態様において、本方法および組成物は、生物学的試料中の標的病原体、例えば細菌またはウイルスを検出し、解析するために使用することができる。
【0094】
いくつかの態様において、提供される方法は、国際公開番号WO2012/048341、WO2014/144495、WO2016/044227、WO2016/176322、またはWO2017/053902に記載されている方法のさまざまな特徴を含むことができ、これらはそれぞれ参照によりその全体が本明細書に組み入れられる。
【0095】
本発明は、シーケンシング用のポリヌクレオチドのライブラリーを生成するために核酸が操作される工程を利用する。いくつかの態様において、本発明は、標的ポリヌクレオチド分子、例えば免疫受容体の、例えば免疫細胞によって産生される抗体またはTCRの、可変領域を含む配列を作製するために核酸が操作される工程を利用する。場合により、前記標的ポリヌクレオチド分子は組換えモノクローナル抗体を含む。いくつかの態様において、本発明は、1つまたは複数の細胞のトランスクリプトームまたはゲノムを表すポリヌクレオチドを作製するために核酸が操作される工程を利用する。一般に、本発明のいくつかの態様では、細胞の、例えば免疫細胞のおよび/またはT細胞の、遺伝物質の増幅、例えば逆転写ポリメラーゼ連鎖反応(逆転写PCR)を使って、免疫細胞遺伝物質のcDNA増幅を行う。
【0096】
いくつかの態様において、本方法は、細胞内の関心対象の標的ポリヌクレオチド、例えばTCRまたは抗体に関する配列情報を得るために使用することができる。標的遺伝子は、試料からのまたは細胞の集団からの細胞のゲノムDNAまたはmRNAから得ることができる。試料または細胞の集団は免疫細胞を含むことができる。例えば標的抗体分子の場合は、免疫グロブリン遺伝子を免疫細胞またはT細胞のゲノムDNAまたはmRNAから得ることができる。RNAは重鎖(V、D、Jセグメント)または軽鎖(V、Jセグメント)であることができる。いくつかの態様において、出発材料は、抗体をコードするV、D、J遺伝子セグメントから構成される免疫細胞からのRNAであり、定常領域を含有する。
【0097】
いくつかの態様において、関心対象の標的ポリヌクレオチドの、例えば抗体またはTCRなどの免疫分子の、全長配列データを得ることに加えて、提供される方法は、全トランスクリプトーム産物からの、そしてまた全長標的ポリヌクレオチド、例えば多サブユニット標的ポリヌクレオチド、例えば抗体またはTCR、例えばペアリングされた全長免疫受容体産物からの、高品質DNAシーケンシングライブラリーの効率のよい生成も可能にする。
【0098】
いくつかの態様において、そのような方法は、一本鎖ポリヌクレオチド産物へのアダプターDNA配列の付加(例えばライゲーション)を含み、これは、単一細胞の、または複数の単一細胞の、トランスクリプトームの増幅および次世代シーケンシングを可能にすることができる。
【0099】
A. ポリヌクレオチドライブラリー
本明細書に記載する方法に従って作製されるライブラリーは、ベッセルバーコードおよび分子バーコードなどの適当なバーコードを持つ、抗体配列またはTCR配列などの大きな標的配列または全長標的配列を含む、ライブラリーであることができる。いくつかの態様において、ライブラリーは、それぞれがベッセルバーコードおよび分子バーコードを持つ、大きな標的配列または全長標的配列、例えば抗体またはTCRの両鎖を含む抗体配列またはTCR配列と、標的配列が由来する細胞の、例えば抗体またはTCRが由来する細胞の、部分的なまたは完全なトランスクリプトームの1つまたは複数の転写産物に対応する配列とを含有する。そのような態様において、大きな標的配列または全長標的配列、例えば抗体配列またはTCR配列と、標的配列が由来する細胞の、例えば抗体またはTCRが由来する細胞の、部分的なまたは完全なトランスクリプトームの1つまたは複数の転写産物に対応する配列とは、同じベッセルバーコードを含有し、そのトランスクリプトームの元の各転写産物にユニークである分子バーコードを含有する。いくつかの局面において、ベッセルバーコードは、各標的ポリヌクレオチドとトランスクリプトームの転写産物を表すポリヌクレオチドの集合体の各ポリヌクレオチドとに取り付けられる第1アダプター内に含まれる。
【0100】
いくつかの態様では、アダプター(以下、第2アダプターともいう)が、複数の、先にタグ付けされたまたは第1アダプターでタグ付けされたバーコード化一本鎖ポリヌクレオチドのそれぞれに、それらのアダプターがポリヌクレオチドの反対の端に存在することになるように付加される、ポリヌクレオチドライブラリーの作製方法が提供され、ここで、前記複数のバーコード化一本鎖ポリヌクレオチドは、(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の標的一本鎖ポリヌクレオチドと、(ii)それぞれが前記細胞中のポリヌクレオチドに相補的である一本鎖ポリヌクレオチドの集合体とを含み、前記複数のバーコード化一本鎖ポリヌクレオチドのそれぞれは、前記細胞の集団の同じ細胞からのすべての相補的ポリヌクレオチドについて同じであるベッセルバーコードを含有する。アダプター、例えば第1アダプターおよび第2アダプターのそれぞれは、ユニバーサルプライミング配列を含有し、それをアダプタータグ付き二重バーコード化ポリヌクレオチドの増幅またはシーケンシングに使用することができる。
【0101】
いくつかの態様において、ポリヌクレオチドのライブラリーはシーケンシングすることができる。いくつかの態様において、本明細書に記載する方法に従って作製されたライブラリーは、シーケンシング用の適当なクラスタリングセグメントを含有することができる。いくつかの態様では、同一分子バーコードのコピーを多数生成させることができる。いくつかの態様では、各出発ユニーク標的ポリヌクレオチド分子ごとに、同一分子バーコードを含有するポリヌクレオチドのコピーを多数生成させることができる。いくつかの態様では、ベッセルバーコードでタグ付けされた各出発ユニーク標的ポリヌクレオチド分子ごとに、同一分子バーコードを含有するポリヌクレオチドのコピーを多数生成させることができる。例えば標的配列を発現する細胞の完全なまたは部分的なトランスクリプトームを決定するために、配列の一部または全部をシーケンシングし、ペアリングすることができる。
【0102】
出発材料は、細胞からの、例えば免疫細胞またはT細胞からの、RNAまたはDNAでありうる。場合により、細胞は、所望の標的ポリヌクレオチド、例えば免疫受容体、例えばTCRまたは抗体を含有することが公知であるか、またはそれを含有すると疑われるものであることができる。例えば抗体の場合、標的細胞は、抗体をコードするV、D、J遺伝子セグメントを含み、定常領域を含有するものである。いくつかの態様において、標的ポリヌクレオチドは、重鎖セグメント(V、D、Jセグメント)または軽鎖セグメント(V、Jセグメント)を含む。
【0103】
RNAなどのポリヌクレオチド出発材料は、1つのポリヌクレオチドまたはポリヌクレオチドのプールを使って、cDNAに逆転写することができる。標的ポリヌクレオチドを逆転写するためのポリヌクレオチドのプール中のプライマーの例は標的ポリヌクレオチドの一領域に相補的な部分を含むことができ、かつ/または全トランスクリプトームまたはその一部分の逆転写のための配列を含むことができる。場合により、ポリヌクレオチドは、標的RNAの、例えば標的の定常領域中の、一領域に相補的な部分、またはmRNAのポリAテールに相補的な部分を含むことができる。いくつかの場合には、複数のオリゴヌクレオチド、例えばプライマーを、1つまたは複数の標的配列、例えば定常領域へのアニーリングに使用することができる。いくつかの局面において、1つまたは複数のポリヌクレオチドは、配列特異的プライマー、ポリdTプライマーおよび/またはランダムヘキサマープライマーを含む。
【0104】
逆転写反応を実行するために逆転写酵素を使用することができる。特定の態様において、逆転写酵素は非テンプレートターミナルトランスフェラーゼ活性を含むことができる。非テンプレートターミナルトランスフェラーゼ活性を含む逆転写酵素は、テンプレートの端に到達したときに、3つ以上の非テンプレート残基、例えば3つ以上の非テンプレートシトシン残基を付加することができる。いくつかの態様では、Superscript II(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、Maxima(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、Protoscript II(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、マロニー(Maloney)マウス白血病ウイルス逆転写酵素(MMLV-RT)が、この目的のために使用される。いくつかの態様では、HighScriber(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、ターミナルデオキシヌクレオチジルトランスフェラーゼが、この目的のために使用される。いくつかの態様では、トリ骨髄芽球症ウイルス(AMV)逆転写酵素が、この目的のために使用される。RNAを転写する能力を有する逆転写酵素であって非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。RNAを転写する能力を有するリバースポリメラーゼ(reverse polymerase)であって非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。DNAを転写する能力を有するリバースポリメラーゼであって、非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。逆転写の結果生じるcDNAは、1つまたは複数のバーコードでタグ付けすることができる。いくつかの例において、逆転写の結果生じるcDNAは、ベッセルバーコードおよび分子バーコードでタグ付けすることができる。バーコードタグ付けには、特定デザインのさまざまなオリゴヌクレオチドを使用することができる。
【0105】
いくつかの態様では、ライブラリーを生成するために、例えば免疫レパトアシーケンシングおよび/またはトランスクリプトーム解析用のライブラリーを生成するために、テンプレートスイッチングを使用することができる。例えば、テンプレートスイッチングを逆転写中に使用することで、逆転写の産物上に、ベッセルバーコード化ポリヌクレオチドまたは分子バーコード化ポリヌクレオチドなどのバーコードを内包するポリヌクレオチドに相補的な領域を生成させることができる。テンプレートスイッチングを逆転写中に使用することで、PCRバイアスの問題を取り除くことができる。これらの方法は、例えばハイスループットシーケンシングプラットフォームの使用による、抗体シーケンシングに使用することができる。
【0106】
いくつかの態様において、ベッセルバーコードは、公知のプライマー部位に挟まれたランダム化された配列部分を含む。例えばcDNAを、1つまたは複数の既知の挿入塩基位置を持つ、または持たない、約20個の縮重ヌクレオチドのストレッチを含むことができるベッセルバーコード、例えば
;ここでNは任意のヌクレオチドであり、WはAまたはTである既知の挿入塩基である)または
;ここでNは任意のヌクレオチドであり、WはAまたはTである既知の挿入塩基であり、IはA、T、GまたはC(すなわちN)である既知の挿入塩基であり、SはGまたはCである挿入塩基であり、Cは既知の挿入シトシンである)でタグ付けすることができる。ベッセルバーコード化オリゴヌクレオチドに含まれる別の例示的配列としては
が挙げられ、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである。ベッセルバーコードは、それらが転写産物にアニーリングなどによって取り付けまたはタグ付けされる前に、反応混合物においてベッセルバーコードを増幅するためのフォワードプライマーおよびリバースプライマーによって認識されうる既知のプライマー部位も含むことができる。例示的なベッセルバーコードプライマーをSEQ ID NO:4およびSEQ ID NO:5またはSEQ ID NO:10およびSEQ ID NO:11に示す。場合によっては、シーケンシング時の多様性を増加させるために塩基シフトを起こしたタグ付きポリヌクレオチド産物がもたらされるように、同じプライマー部位を含有するが縮重部分に塩基シフトを起こしているベッセルバーコードのプール、例えばSEQ ID NO:80、81、83、99または100のいずれかに示す2つまたはそれ以上のベッセルバーコードが、ベッセルに供給される。いくつかの態様において、ベッセルバーコードを含有するオリゴヌクレオチドは、ユニバーサルプライマー部位(例えばP7)を含有するアダプター、例えば第1アダプターの一部である。本明細書に記載する第1アダプターは、ユニバーサルプライミング部位およびベッセルバーコードを含むことができる。ユニバーサルプライマー部位、縮重部位およびプライマーを含む、ベッセルバーコードを含有するそのようなオリゴヌクレオチドの例は、SEQ ID NO:2、6、7、8または9に示されるか、SEQ ID NO:6、7、8もしくは9のうちの任意の2つまたはそれ以上のプールである。場合によっては、同じベッセル内で処理されるcDNA分子をタグ付けするために、ベッセルバーコード、またはベッセルバーコードのプールが使用される。特定の例において、同じベッセル内で処理されるcDNA分子は、同じ細胞からのRNA分子に相補的である。
【0107】
いくつかの態様において、分子バーコードは、逆転写反応からのポリヌクレオチド転写産物をユニークにタグ付けするための縮重配列を含む。いくつかの局面において、分子バーコードはテンプレートスイッチオリゴヌクレオチドの一部であり、ここでテンプレートスイッチオリゴヌクレオチドは、分子バーコードが各相補的ポリヌクレオチドに組み入れられるように、逆転写酵素用のテンプレート配列を含む。いくつかの態様において、テンプレートスイッチオリゴヌクレオチドは、(1)ベッセルバーコードを含有する第1アダプターの3'タグ付けポリヌクレオチドに相補的である5'末領域、(2)分子バーコードおよび(3)3'オーバーハングに相補的な3'部分を含有することができる。いくつかの態様において、テンプレートスイッチング分子、例えばバーコード(例えば分子バーコード)を含有するテンプレートスイッチオリゴヌクレオチドには、アーチファクトの形成を最小限に抑えるために修飾塩基を組み入れることができる。例示的な分子バーコードを含有する例示的なテンプレートスイッチオリゴヌクレオチドをSEQ ID NO:3に示す。
【0108】
逆転写反応、例えば上述したものは、3'タグ付けポリヌクレオチドの存在下で行うことができる。3'タグ付けポリヌクレオチドは、選択されたポリヌクレオチドの、例えば標的cDNAの、3'端に、または細胞中のトランスクリプトームの転写産物に相補的なポリヌクレオチド(例えばcDNA)に、核酸を付加するために使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、標的ポリヌクレオチドの、例えばcDNAの、3'端に核酸を付加するためのテンプレートとして使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、cDNAなどの標的ポリヌクレオチドの3'端にハイブリダイズするポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、cDNAなどの標的ポリヌクレオチドの3'端にハイブリダイズする3'領域、例えば3'末領域を含有するポリヌクレオチドであることができる。例えば、3'タグ付けポリヌクレオチドは、3つ以上の非テンプレート残基にアニールするセグメントなどといったセグメントを含むことができる。いくつかの態様において、3'タグ付けポリヌクレオチドは分子バーコードポリヌクレオチドである。いくつかの態様において、3'タグ付けポリヌクレオチドは分子バーコードを含むことができる。いくつかの態様において、3'タグ付けポリヌクレオチドは、その3'端に、逆転写酵素によって作製される鎖(例えば配列CCC)に相補的であってそこにアニールされる3'リボグアノシン残基またはその類似体(rGrGrG)(RNA塩基)を含むことができる。いくつかの態様では、リボグアノシン残基の代わりに3つ以上のグアニン残基(RNAヌクレオチドの代わりにDNAヌクレオチド)を使用することができる。いくつかの態様において、3'タグ付けポリヌクレオチドは、逆転写酵素によって作製される鎖(例えばCCC)に相補的であってそこにアニールされる、3'端の1つまたは2つのリボグアノシン残基と3'端のリボグアノシン残基またはその類似体(rGrGG)とを含むことができる。
【0109】
cDNA鎖のCCCに3'タグ付けポリヌクレオチドがアニールすると、逆転写酵素は、そのタグ付けポリヌクレオチドへとcDNAを伸長し続けることができ、それによって、分子バーコードまたはその相補体を、反応中のポリヌクレオチドの、例えばcDNAの、標的集団に取り付ける。例えば、3'タグ付けポリヌクレオチドは、標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域を含有するポリヌクレオチドであることができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、cDNAなどの標的ポリヌクレオチドに対して相補的でない領域を含むことができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は分子バーコードを含むことができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、ベッセルバーコード化ポリヌクレオチドまたはその相補体に相補的な領域を含むことができる。別の実験では、テンプレートスイッチングを別個の反応で実施することができる。例えば、逆転写反応後に3'タグ付けポリヌクレオチドを付加することができ、逆転写酵素またはポリメラーゼなどの酵素を使ってタグ付けポリヌクレオチドへと伸長することができる。タグ付けポリヌクレオチドは、ベッセル中の各分子上にユニークな縮重分子バーコードを内包することができるので、ベッセル中の各cDNAを分子バーコードでユニークにタグ付けすることができる。いくつかの態様において、テンプレートスイッチングは、逆転写反応を行うのと同時に実施することができる。
【0110】
いくつかの態様において、分子バーコード化ポリヌクレオチドなどの3'タグ付けポリヌクレオチドは、5'領域を、例えばベッセルバーコードなどの別のバーコードを含有する3'タグ付けポリヌクレオチドまたはその相補体に相補的である5'末領域を、さらに含むことができる。いくつかの態様において、分子バーコードまたはその相補体を含有する標的ポリヌクレオチド、例えばタグ付きcDNA分子は、3'領域を、例えばベッセルバーコードなどの別のバーコードを含有する3'タグ付けポリヌクレオチドまたはその相補体に相補的である3'末領域を、含むことができる。
【0111】
いくつかの態様において、3'タグ付けポリヌクレオチドはベッセルバーコード化ポリヌクレオチドである。分子バーコードまたはその相補体を含有するポリヌクレオチドが標的ポリヌクレオチドから生成したら、その分子バーコード化標的ポリヌクレオチドにベッセルバーコードを付加することができる。3'タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなどの標的ポリヌクレオチドの3'端に核酸を付加するために使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなどの標的ポリヌクレオチドの3'端に核酸を付加するためのテンプレートとして使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなどの標的ポリヌクレオチドの3'端にハイブリダイズするポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドなどの標的ポリヌクレオチドの3'端にハイブリダイズする3'領域、例えば3'末領域を含有するポリヌクレオチドであることができる。ベッセルバーコード化ポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域、例えば3'末領域を含むことができる。
【0112】
分子バーコード化標的ポリヌクレオチドに3'タグ付けポリヌクレオチドがアニールすると、逆転写酵素は、その3'タグ付けポリヌクレオチド、例えばベッセルバーコード化ポリヌクレオチドへと、cDNAを伸長し続けることができ、それによって、ベッセルバーコードまたはその相補体を、反応中のポリヌクレオチドの、例えば分子バーコード化標的ポリヌクレオチドの、標的集団に取り付ける。例えば、3'タグ付けポリヌクレオチドは、分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域を含有するポリヌクレオチドであることができる。分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、標的ポリヌクレオチドまたは分子バーコード化標的ポリヌクレオチドに相補的でない領域を含むことができる。分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、ベッセルバーコードを含むことができる。
【0113】
いくつかの態様において、3'タグ付けポリヌクレオチドは増幅産物である。いくつかの態様において、3'タグ付けポリヌクレオチドは単一分子に由来する増幅産物である。いくつかの態様において、3'タグ付けポリヌクレオチドはベッセルバーコード化ポリヌクレオチドの増幅産物である。いくつかの態様において、3'タグ付けポリヌクレオチドは単一のベッセルバーコード化ポリヌクレオチドに由来する増幅産物である。分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、プライマーまたはその相補体に相補的な領域を含むことができる。分子バーコード化標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、ベッセルバーコード化ポリヌクレオチドを増幅するために使用されたプライマーまたはその相補体に相補的な領域を含むことができる。
【0114】
いくつかの態様において、3'タグ付けポリヌクレオチドは、分子バーコード化cDNAを増幅するためのプライマー、例えばフォワードプライマーとして作用することができ、DNAポリメラーゼは、その配列を伸長することで、cDNAに相補的であり、かつベッセルバーコード、分子バーコードおよび標的遺伝子または転写産物のコーディング配列を含有する二重バーコード化一本鎖ポリヌクレオチド分子を生成させることができる。いくつかの態様において、二重バーコード化一本鎖ポリヌクレオチド分子は、5'から3'に向かって、ベッセルバーコード、分子バーコード、標的遺伝子または転写産物のコーディング配列、および第1アダプターを含有する。いくつかの態様において、ベッセルバーコードを含有するオリゴヌクレオチドは第2アダプターを含有し、二重バーコード化一本鎖ポリヌクレオチド分子は、5'から3'に向かって、第2アダプター、ベッセルバーコード、分子バーコード、標的遺伝子または転写産物のコーディング配列、および第1アダプターを含有する。
【0115】
逆転写によって生じたタグ付きcDNAは、例えばPCR増幅によって、1回または複数回、増幅することができる。増幅には特定デザインのさまざまなプライマーを使用することができる。PCRなどの第1増幅反応の産物は、第1または第2PCR相などの第2増幅反応を使って増幅することができる。増幅工程にはさまざまなプライマーを使用することができる。増幅されたポリヌクレオチドのライブラリーは、本明細書に記載する方法を使って生成させることができる。いくつかの例において、結果として生じるライブラリーは、適当な分子バーコードおよびベッセルバーコードを持つ、完全なまたは部分的な、抗体配列またはTCR配列を含むことができる。ライブラリーは、適当な分子バーコードおよびベッセルバーコードを持つ、部分的なまたは完全なトランスクリプトームの1つまたは複数の転写産物に対応する配列も含有することができる。
【0116】
二重バーコード化標的ポリヌクレオチド、例えば分子バーコードおよびベッセルバーコードを含有するcDNAは、次に、例えばPCRによって、増幅することができる。その場合、PCRは、例えばプライマーセットを使うことによって、行うことができる。次に、前述のPCR反応の産物を、例えば1ラウンドまたは複数ラウンドのPCRによって、1回または複数回増幅するか、または直接シーケンシングすることができる。いくつかの態様において、プライマーセットは、第1アダプターおよび/または第2アダプターに特異的なフォワードプライマーおよび/またはリバースプライマーを含むことができる。いくつかの態様において、プライマーセットは、フォワードプライマーとしてのベッセルバーコード含有オリゴヌクレオチドと、第1アダプターに特異的であるリバースプライマーとを含むことができる。いくつかの態様において、プライマーセットは、第2アダプターおよび第1アダプターに結合するフォワードプライマーおよびリバースプライマーと、追加プライマーとしての、例えば追加フォワードプライマーとしての、ベッセルバーコード含有オリゴヌクレオチドとを含むプライマーセットを含むことができる。例示的なプライマーは本明細書の実施例に記載する。
【0117】
シーケンシングが終わったら、同一分子バーコードを持つ配列をマッチングまたはペアリングすることができる。シーケンシングが終わったら、同一ベッセルバーコードを持つ配列をマッチングまたはペアリングすることができる。シーケンシングが終わったら、同一ターゲット配列を持つ配列をマッチングまたはペアリングすることができる。いくつかの態様では、シーケンシングリードをコンセンサス配列に縮約(collapse)することができる。マッチングまたはペアリングされたシーケンシングリードをコンセンサス配列に縮約することにより、シーケンシングエラーおよびPCRエラーを低減または排除することができる。シーケンシングは第1リードについて第1プライマー部位を使って実施することができる。シーケンシングは第2リードについて第1プライマー部位を使って実施することができる。シーケンシングは第2リードについて第2プライマー部位を使って実施することができる。
【0118】
いくつかの態様では、同じベッセルバーコードを含有する免疫受容体の鎖、例えばTCRまたは抗体の鎖をペアリングすることができる。場合によっては、同じベッセルバーコードを含有する抗体の重鎖および軽鎖をペアリングすることができる。いくつかの態様では、ペアリングされた鎖を哺乳動物ベクター系にクローニングすることができる。抗体などの免疫受容体のコンストラクトは、別のヒト宿主細胞系または哺乳動物宿主細胞系で発現させることができる。次に、発現された関心対象の抗体またはTCRの一過性トランスフェクションアッセイおよびウェスタンブロット解析によって、コンストラクトを検証することができる。
【0119】
一定の局面において、本発明は、各コンストラクトがユニークなNマーおよび機能的Nマーを含む複数の核酸コンストラクトを得る工程を含む、ユニークにバーコード化された重鎖および軽鎖抗体配列ならびに/またはアルファ鎖およびベータ鎖TCR配列ならびに/またはガンマ鎖およびデルタ鎖TCR配列のライブラリーを作製する方法を提供する。機能的NマーはランダムNマー、PCRプライマー、ユニバーサルプライマー、抗体、付着端、または他の任意の配列であることができる。本方法は、それぞれが1コピーまたは複数コピーのユニークなコンストラクトを含有する数Nの流体コンパートメントをMセット作製する工程を含むことができる。本方法は、あるセット中の各コンパートメントに追加のコンストラクトを加え、各セットについてそれを繰り返して、それぞれがコンストラクトのユニークなペアを含有するM個のコンパートメントを作製することによって、さらに複雑度の高いバーコードライブラリーを作ることができる。前記ペアをハイブリダイズさせるか、ライゲートすることで、新しいコンストラクトを作製することができる。バーコードライブラリー中の各コンストラクトでは、各ユニークNマーを、シーケンシング、プローブハイブリダイゼーション、他の方法、または方法の組合せによる同定に適合させることができる。
【0120】
RNAまたはDNAの増幅方法は周知であり、本明細書に提示する教示および指針に基づいて、甚だしい実験を伴わずに、本発明に従って使用することができる。公知のDNAまたはRNA増幅方法としては、ポリメラーゼ連鎖反応(PCR)および関連増幅プロセス(例えば、Mullisらの米国特許出願第4,683,195号、同第4,683,202号、同第4,800,159号、同第4,965,188号;Taborらの同第4,795,699号および同第4,921,794号;Innisの同第5,142,033号;Wilsonらの同第5,122,464号;Innisの同第5,091,310号;Gyllenstenらの同第5,066,584号;Gelfandらの同第4,889,818号;Silverらの同第4,994,370号;Biswasの同第4,766,067号;Ringoldの同第4,656,134参照)ならびに標的配列に対するアンチセンスRNAを二本鎖DNA合成のためのテンプレートとして使用するRNA媒介増幅(Malekの米国特許第5,130,238号、商標NASBA)が挙げられるが、それらに限定されるわけではなく、これらの参考文献の内容はすべて参照により本明細書に組み入れられる(例えばCurrent Protocols in Molecular Biology(CPMB)(Fred M.Ausubel et al.ed.,John Wiley and Sons,Inc.)またはJ.Sambrook et al.“Molecular Cloning:A Laboratory Manual”1989,2nd Ed.,Cold Spring Harbour Laboratory Press:New York,N.Y.参照)。
【0121】
好都合なことに、本明細書に記載する方法の工程、例えば増幅、シーケンシングなどは、複数の基質、例えば抗原などが固定化された固相、例えばアレイを使用するマルチプレックスアッセイフォーマットで実行してもよいし、そうしなくてもよい。いくつかの態様において、アレイはタンパク質バイオチップである。タンパク質バイオチップを使用すれば、数百の抗原、さらには数千数万の抗原を、スクリーニングすることができる。本明細書にいう「アレイ」、「マイクロアレイ」または「バイオチップ」とは、概して平坦な表面を有し、そこに吸着材が取り付けられている固体の基板を指す。バイオチップの表面は、多くの場合、複数のアドレス可能な場所を含み、それらの場所のそれぞれに吸着剤が結合している。バイオチップは、プローブ界面を係合するように適合させることができ、それゆえにプローブとして機能することができる。「タンパク質バイオチップ」とは、ポリペプチドの捕捉に適合したバイオチップを指す。当技術分野では数多くのタンパク質バイオチップが記載されている。ポリペプチドアレイを作製する方法は、例えばDe Wildt et al,2000,Nat.Biotechnol.18:989-994、Lueking et al.,1999,Anal.Biochem.270:103-111、Ge,2000,Nucleic Acids Res.28,e3,1-VH、MacBeath and Schreiber,2000,Science 289:1760-1763、WO 01/40803およびWO 99/51773A1に記載されている。アレイを使用すると、スクリーニングなどのいくつかの工程を、ロボットでかつ/またはハイスループットで実施することが可能になる。アレイ用のポリペプチドは、例えば市販のロボット装置、例えばGenetic MicroSystems製またはBioRobotics製のものを使って、高速にスポットすることができる。アレイ基板は、例えばニトロセルロース、プラスチック、ガラス、例えば表面改質ガラスであることができる。アレイは、多孔性マトリックス、例えばアクリルアミド、アガロースまたは他のポリマーも含むことができる。
【0122】
解析物は、バイオチップ上に捕捉すれば、例えば気相イオン分光法(gas phase ion spectrometry method)、光学的方法、電気化学的方法、原子間力顕微鏡法および高周波法(radio frequency method)から選択されるさまざまな検出方法によって検出することができる。特に興味深いのは、質量分析、特にSELDIの使用である。光学的方法としては、例えば蛍光、発光、化学発光、吸光度、反射率、透過率、複屈折または屈折率の検出(例えば表面プラズモン共鳴、エリプソメトリー、共振ミラー法、グレーティングカプラ導波管法または干渉法)が挙げられる。光学的方法には、顕微鏡(共焦点法および非共焦点法)、イメージング法および非イメージング法が含まれる。さまざまなフォーマットのイムノアッセイ(例えばELISA)は、固相上に捕捉された解析物を検出するためのポピュラーな方法である。電気化学的方法としてはボルタンメトリー法およびアンペロメトリー法が挙げられる。高周波法としては多重極共鳴分光法(multipolar resonance spectroscopy)が挙げられる。
【0123】
本発明のいくつかの態様では、単一細胞を扱うための、または細胞の特定集団を選択するための、確立された技法が使用される。例示的な技法の一つには、FACSにおいて単一細胞を別々の容器へと偏向させるために使用することができる特別な補助器具が組み入れられる。そのような補助器具は市販されており、当技術分野において周知である。そのような補助器具は単一細胞を、例えば標準的な96ウェルマイクロタイター培養プレートなどの、選択されたコンパートメントに分配するのに有用である。あるいは、単一細胞の分配が保証されるように限界希釈法でマクロタイタープレートに単一細胞を分配してもよい。
【0124】
別の技法は、任意で単一の免疫細胞のトランスクリプトームを増幅することに加えて、VHおよびVLまたはVαおよびVβまたはVγおよびVδセグメントを増幅するために単一の免疫細胞で実施されるPCRである。いくつかの態様において、単一細胞PCRは、単一細胞におけるVLおよびVHまたはVαおよびVβまたはVγおよびVδのネイティブなペアリングを保つために使用される。抗体またはTCRの特異性は、それぞれVL領域およびVH領域内の、またはVαおよびVβもしくはVγおよびVδ領域内の、相補性決定領域(CDR)によって決まる。
【0125】
単一細胞PCRを実施するための方法は周知である(例えばLarrick,J.W.et al.,Bio/Technology 7:934(1989))。例えば、B細胞ライブラリーからの抗体産生B細胞またはT細胞ライブラリーからのTCR産生T細胞を固定剤溶液またはホルムアルデヒド、グルタルアルデヒドなどの化学物質を含有する溶液で固定しうる。次に細胞を、例えば洗浄剤などを含む透過処理溶液で透過処理する。固定および透過処理プロセスは、細胞コンパートメントまたはその中の核酸を甚だしく破壊することなく、酵素、ヌクレオチドおよび他の試薬が細胞内に進入することを可能にするのに十分な多孔性を与えるはずである。次に、酵素およびヌクレオチドを加えると、それらは細胞に進入して、VHおよびVLまたはVαおよびVβまたはVγおよびVδ mRNAを含む細胞mRNAを、例えば対応するcDNA配列に逆転写しうる。別の例では、本明細書に記載するように、溶解された固定されていない細胞から、溶解状態で、単一細胞PCRを実施することができる。
【0126】
逆転写は、逆転写酵素、十分な量の4種のdNTP、およびmRNAに結合して逆転写酵素が重合を開始するための3'ヒドロキシル基を提供するプライマーを使って、単一工程で、または任意でPCR手順と一緒に実施しうる。標的特異的プライマーおよび/またはランダムヘキサマーオリゴヌクレオチドプライマーを使用して、逆転写反応を開始させ、高品質シーケンシングライブラリーを生成させることができる。
【0127】
標的配列には、標的mRNAに相補的な任意のプライマーを使用しうるが、可変領域mRNAの選択が容易になるように、VHおよびVLまたはVαおよびVβまたはVγおよびVδ分子の3'末端に相補的なプライマーを使用することが好ましい。VHおよびVLまたはVαおよびVβまたはVγおよびVδ用の5'端プライマーとして役立つように縮重ポリヌクレオチドを調製できることは、数多くの研究が示している。ターゲティング分子(targeting molecule)を作製するコンビナトリアルライブラリー法は、そのようなプライマーに依拠する。さらにまた、PCRが関心対象の遺伝子セグメント、例えばVHおよびVLまたはVαおよびVβまたはVγおよびVδを、単一細胞から増幅できることも、数多くの実験が示している。単一細胞でも扱えるので、このPCRアプローチは、関心対象の免疫細胞が低頻度にしか存在しない場合でも、抗体を生成させることができる。
【0128】
いくつかの態様では、FACS選別後に、免疫細胞ライブラリーの細胞をプールし、細胞プール全体に対して逆転写PCRを実施する。抗体またはTCRをクローニングするためのmRNAの生成は、抗体またはTCRを調製し特徴づけるための周知の手順によって、容易に達成される(例えばAntibodies:A Laboratory Manual,1988参照、この文献は参照により本明細書に組み入れられる)。例えば、当技術分野において標準的であり常套的である適当な方法によって、B細胞ライブラリーから全RNAを抽出する。次に適当な方法によって、例えばランダムヘキサマーポリヌクレオチドまたはC遺伝子もしくはC遺伝子ファミリー特異的プライマーまたはV遺伝子もしくはV遺伝子ファミリー特異的プライマーを使って、RNAからcDNAを合成する。これらもまた、上に説明したとおり当業者にとっては公知のプロセスである。B細胞ライブラリーまたはT細胞ライブラリーに由来する核酸分子のライブラリーを、例えばそのようなBリンパ球またはTリンパ球に由来するRNA分子またはcDNA分子のライブラリーを、発現ベクターにクローニングすることで、発現ライブラリーを形成させてもよい。いくつかの態様では、免疫細胞ライブラリーに由来するVHまたはVαもしくはVγドメインだけを増幅して、VHまたはVαもしくはVγドメインのライブラリーを生成させる。別の供給源からのVLまたはVβもしくはVδライブラリーを、VHまたはVαもしくはVγライブラリーと組み合わせて使用することで、本明細書に記載する方法を使って抗体またはTCRを生成させる。抗体フラグメントまたはTCRフラグメントのライブラリーは、VHおよびVLまたはVαおよびVβまたはVγおよびVδライブラリーを、当業者に公知の多くの方法で、一つに組み合わせることによって構築することができる。例えば、各ライブラリーを異なるベクター中に作り、それらのベクターをインビトロまたはインビボで組換えることができる。あるいは、ライブラリーを同じベクター中に逐次的にクローニングするか、PCRによって一つにアセンブルしてからクローニングしてもよい。PCRアセンブリは、VHおよびVLまたはVαおよびVβまたはVγおよびVδDNAを、フレキシブルなペプチドスペーサーをコードするDNAと接合して、本明細書に項を改めて記載する単鎖Fv(scFv)ライブラリーを形成させるためにも使用することができる。さらに別の技法では、PCRによってリンパ球内でVHおよびVLまたはVαおよびVβまたはVγおよびVδ遺伝子を組み合わせるために、細胞内PCRアセンブリが使用される。
【0129】
1. 標的ポリヌクレオチド
諸態様において、本明細書において提供される方法は、標的ポリヌクレオチド分子の、例えば細胞からのポリヌクレオチド分子の、増幅およびシーケンシングに向けられる。場合により、本明細書において提供される方法は、標的ポリヌクレオチド分子の2つまたはそれ以上の領域の増幅およびシーケンシングに向けられる。場合により、本明細書において提供される方法は、2つまたはそれ以上の標的ポリヌクレオチド分子の、例えば2つまたはそれ以上の本来ペアリングされている分子の、増幅およびシーケンシングに向けられる。一局面において、標的ポリヌクレオチドはRNAである。一局面において、標的ポリヌクレオチドはゲノム核酸である。特定生物の染色体中の遺伝物質に由来するDNAは、ゲノムDNAでありうる。
【0130】
いくつかの態様において、「標的核酸分子」、「標的ポリヌクレオチド」、「標的ポリヌクレオチド分子」への言及は、任意の関心対象の核酸を指す。
【0131】
いくつかの態様において、標的ポリヌクレオチドは、免疫受容体の、例えば免疫細胞によって産生される抗体またはTCRの、可変領域を含む配列を含む。
【0132】
いくつかの態様において、標的ポリヌクレオチドは、本来ペアリングされて免疫受容体またはその結合性フラグメントを生成している免疫受容体の2つまたはそれ以上の鎖を含む。いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生される抗体の重鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生される抗体の軽鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、同じ免疫細胞によって産生される抗体の、重鎖の可変領域を含む配列と可変軽鎖を含む配列とを含む。
【0133】
したがって、本明細書における用語「抗体」は、最も広義に使用され、ポリクローナル抗体およびモノクローナル抗体、例えばインタクト抗体およびその機能的(抗原結合性)抗体フラグメント、例えばFab(Fragment antigen binding)フラグメント、F(ab')2フラグメント、Fab'フラグメント、Fvフラグメント、組換えIgG(rIgG)フラグメント、一本鎖抗体フラグメント、例えば単鎖可変フラグメント(scFv)および単一ドメイン抗体(例えばsdAb、sdFv、ナノボディ)フラグメントを包含する。この用語は、遺伝子改変型および/または他の修飾型の免疫グロブリン、例えばイントラボディ、ペプチボディ、キメラ抗体、完全ヒト抗体、ヒト化抗体、およびヘテロコンジュゲート抗体、多重特異性、例えば二重特異性、抗体、ダイアボディ、トリアボディ(triabody)、およびテトラボディ、タンデムジ-scFv、タンデムトリ-scFvを包含する。別段の言明がある場合を除き、「抗体」という用語は、その機能的抗体フラグメントを包含すると理解されるべきである。この用語は、インタクト抗体または全長抗体、例えばIgGおよびそのサブクラス、IgM、IgE、IgAならびにIgDなど、任意のクラスまたはサブクラスの抗体も包含する。
【0134】
「相補性決定領域」および「CDR」は、「超可変領域」または「HVR」と同義であって、これらが、抗原特異性および/または結合アフィニティーを付与する抗体可変領域内の非連続アミノ酸配列を指すことは、当技術分野において公知である。一般に、各重鎖可変領域に3つのCDR(CDR-H1、CDR-H2およびCDR-H3)と各軽鎖可変領域に3つのCDR(CDR-L1、CDR-L2およびCDR-L3)がある。「フレームワーク領域」および「FR」が、重鎖および軽鎖の可変領域の非CDR部分を指すことは、当技術分野において公知である。一般的には、各全長重鎖可変領域に4つのFR(FR-H1、FR-H2、FR-H3およびFR-H4)と各全長軽鎖可変領域に4つのFR(FR-L1、FR-L2、FR-L3およびFR-L4)がある。
【0135】
所与のCDRまたはFRの正確なアミノ酸配列境界は、Kabat et al.(1991),“Sequences of Proteins of Immunological Interest”,5th Ed.Public Health Service,National Institutes of Health,Bethesda,MD(「Kabat」ナンバリングスキーム)、Al-Lazikani et al.,(1997)JMB 273,927-948(「Chothia」ナンバリングスキーム)、MacCallum et al.,J.Mol.Biol.262:732-745(1996),“Antibody-antigen interactions:Contact analysis and binding site topograph”J.Mol.Biol.262,732-745(「Contact」ナンバリングスキーム)、Lefranc MP et al.,“IMGT unique numbering for immunoglobulin and T cell receptor variable domains and Ig superfamily V-like domains”Dev Comp Immunol,2003 Jan;27(1):55-77(「IMGT」ナンバリングスキーム)、およびHonegger A and Plueckthun A,“Yet another numbering scheme for immunoglobulin variable domains:an automatic modeling and analysis tool”,J Mol Biol,2001 Jun 8;309(3):657-70(「Aho」ナンバリングスキーム)に記載されているものを含めて、いくつかある周知のスキームのいずれかを使って容易に決定することができる。
【0136】
したがって、別段の指定がある場合を除き、所与の抗体またはその領域の、例えばその可変領域の、「CDR」もしくは「相補性決定領域」または指定された個々のCDR(例えばCDR-H1、CDR-H2)は、上述のスキームのいずれかによって定義される相補性決定領域(または具体的相補性決定領域)を包含すると理解されるべきである。例えば、所与のVHまたはVLアミノ酸配列において、特定CDR(例えばCDR-H3)が、対応するCDRのアミノ酸配列を含有すると言明された場合、そのようなCDRは、可変領域内に、上述のスキームのいずれかによって定義される対応するCDR(例えばCDR-H3)の配列を有すると理解される。いくつかの態様において、指定されたCDR配列は指定される。
【0137】
同様に、別段の指定がある場合を除き、所与の抗体またはその領域、例えばその可変領域のFRまたは指定された個々のFR(例えばFR-H1、FR-H2)は、公知のスキームのいずれかによって定義されるフレームワーク領域(または具体的フレームワーク領域)を包含すると理解されるべきである。いくつかの例では、Kabat、ChotihaまたはContact法によって定義されるCDRなど、特定のCDR、FRまたは複数のFRもしくは複数のCDRを同定するためのスキームが指定される。別の場合にはCDRまたはFRの特定アミノ酸配列が与えられる。
【0138】
「可変領域」または「可変ドメイン」という用語は、抗原に対する抗体の結合に関与する抗体重鎖または抗体軽鎖のドメインを指す。ネイティブ抗体の重鎖および軽鎖の可変ドメイン(それぞれVHおよびVL)は一般に類似する構造を有し、各ドメインは4つの保存されたフレームワーク領域(FR)と3つのCDRとを含んでいる。(例えばKindt et al.Kuby Immunology,6th ed.,W.H.Freeman and Co.,page 91(2007)参照。単一のVHドメインまたはVLドメインでも、抗原結合特異性を付与するには十分でありうる。さらにまた、特定の抗原に結合する抗体は、その抗原に結合する抗体からのVHドメインまたはVLドメインを使ってそれぞれ相補的なVLドメインまたはVHドメインのライブラリーをスクリーニングすることによって、単離しうる。例えばPortolano et al.,J.Immunol.150:880-887(1993)、Clarkson et al.,Nature 352:624-628(1991)参照。
【0139】
提供される抗体には抗体フラグメントが含まれる。「抗体フラグメント」とは、インタクト抗体のうち、インタクト抗体が結合する抗原に結合する部分を含む、インタクト抗体以外の分子を指す。抗体フラグメントの例として、Fv、Fab、Fab'、Fab'-SH、F(ab')2、ダイアボディ、線状抗体、一本鎖抗体分子(例えばscFv)、および抗体フラグメントから形成される多重特異性抗体が挙げられるが、それらに限定されるわけではない。特定の態様において、抗体は、可変重鎖領域および/または可変軽鎖領域を含む単鎖抗体フラグメント、例えばscFvである。
【0140】
B細胞によって発現される免疫グロブリン(Ig)は、いくつかの局面において、H2L2構造を形成する4つのポリペプチド鎖、すなわち2つの重鎖(IgH)および2つの軽鎖(IgL)からなるタンパク質である。IgH鎖とIgL鎖の各ペアは、VL領域およびVH領域からなる超可変ドメインと、定常ドメインとを含有する。IgのIgH鎖は、μ、δ、γ、αおよびβという、いくつかのタイプがある。個体におけるIgの多様性は主に超可変ドメイン(hypervariable domain)によって決まる。TCRと同様に、IgH鎖のVドメインは、VH、DHおよびJH遺伝子セグメントのコンビナトリアルな接合によって作られる。Ig遺伝子再編成過程中のVH-DH、DH-JHおよびVH-JH接合部におけるヌクレオチドの独立した付加および欠失は、超可変ドメイン配列の多様性をさらに増加させる。ここで、免疫能はIgの多様性に反映される。
【0141】
「可変領域」または「可変ドメイン」という用語は、抗原に対する抗体の結合に関与する抗体重鎖または抗体軽鎖のドメインを指す。ネイティブ抗体の重鎖および軽鎖の可変ドメイン(それぞれVHおよびVL)は一般に類似する構造を有し、各ドメインは4つの保存されたフレームワーク領域(FR)と3つのCDRとを含んでいる。(例えばKindt et al.Kuby Immunology,6th ed.,W.H.Freeman and Co.,page 91(2007)参照。単一のVHドメインまたはVLドメインでも、抗原結合特異性を付与するには十分でありうる。さらにまた、特定の抗原に結合する抗体は、その抗原に結合する抗体からのVHドメインまたはVLドメインを使ってそれぞれ相補的なVLドメインまたはVHドメインのライブラリーをスクリーニングすることによって、単離しうる。例えばPortolano et al.,J.Immunol.150:880-887(1993)、Clarkson et al.,Nature 352:624-628(1991)参照。
【0142】
「超可変領域」とは、抗原結合を担う抗体またはTCRのアミノ酸残基を指す。超可変領域は相補性決定領域またはCDRからのアミノ酸残基を含む。フレームワーク残基、すなわちFR残基は、本明細書において定義される超可変領域残基以外の可変ドメイン残基である。
【0143】
提供される抗体には抗体フラグメントが含まれる。「抗体フラグメント」とは、インタクト抗体のうち、インタクト抗体が結合する抗原に結合する部分を含む、インタクト抗体以外の分子を指す。抗体フラグメントの例として、Fv、Fab、Fab'、Fab'-SH、F(ab')2、ダイアボディ、線状抗体、一本鎖抗体分子(例えばscFv)、および抗体フラグメントから形成される多重特異性抗体が挙げられるが、それらに限定されるわけではない。特定の態様において、抗体は、可変重鎖領域および/または可変軽鎖領域を含む単鎖抗体フラグメント、例えばscFvである。
【0144】
単一ドメイン抗体は、抗体の重鎖可変ドメインの全部もしくは一部または軽鎖可変ドメインの全部もしくは一部を含む抗体フラグメントである。一定の態様において、単一ドメイン抗体は、ヒト単一ドメイン抗体である。
【0145】
抗体フラグメントは、さまざまな技法によって、例えば限定するわけではないがインタクト抗体のタンパク質分解消化および組換え宿主細胞による生産などによって、作製することができる。いくつかの態様において、抗体は組換え生産されたフラグメント、例えば自然には生じない配置を含むフラグメント、例えば2つまたはそれ以上の抗体領域または抗体鎖が合成リンカー、例えばペプチドリンカーで接合されているもの、および/または天然のインタクト抗体の酵素消化では生じえない配置を含むフラグメントである。いくつかの局面において、抗体フラグメントはscFvである。
【0146】
抗原結合ポリペプチドには、重鎖二量体、例えばラクダ科動物およびサメ類からの抗体なども含まれる。ラクダ科動物およびサメの抗体は、V様ドメインとC様ドメインの2本の鎖のホモ二量体型ペアを含む(どちらも軽鎖は有しない)。ラクダ科動物における重鎖二量体IgGのVH領域は軽鎖と疎水性相互作用する必要がないので、通常は軽鎖と接触している重鎖中の領域が、ラクダ科動物では親水性アミノ酸残基に変わっている。重鎖二量体IgGのVHドメインはVHHドメインと呼ばれる。サメIg-NARは、1つの可変ドメイン(V-NARドメインと呼ばれる)および5つのC様定常ドメイン(C-NARドメイン)のホモ二量体を含む。ラクダ科動物において、抗体レパトアの多様性は、VHまたはVHH領域中のCDR1、CDR2およびCDR3によって決まる。ラクダ科VHH領域中のCDR3は、平均16アミノ酸という比較的長いその長さを特徴とする(Muyldermans et al.,1994,Protein Engineering 7(9):1129)。
【0147】
「ヒト化」抗体は、CDRアミノ酸残基のすべてまたは実質上すべてが非ヒトCDRに由来し、FRアミノ酸残基のすべてまたは実質上すべてがヒトFRに由来する抗体である。ヒト化抗体は、任意で、ヒト抗体に由来する抗体定常領域の少なくとも一部分を含みうる。非ヒト抗体の「ヒト化型」とは、典型的には、親非ヒト抗体の特異性およびアフィニティーを保ちつつ、ヒトに対する免疫原性を低減する目的で、ヒト化を受けた非ヒト抗体の変異体を指す。いくつかの態様において、ヒト化抗体中のいくつかのFR残基は、例えば抗体の特異性またはアフィニティーを回復または改良するために、非ヒト抗体(例えばCDR残基が由来する抗体)からの対応する残基で置換される。
【0148】
提供される抗体にはヒト抗体が含まれる。「ヒト抗体」は、ヒトもしくはヒト細胞によって生産される抗体の、またはヒト抗体レパトアもしくはヒト抗体ライブラリーを含む他のヒト抗体コード配列を利用する非ヒト供給源によって生産される抗体の、アミノ酸配列に対応するアミノ酸配列を持つ抗体である。非ヒト抗原結合領域を含むヒト化型の非ヒト抗体、例えばCDRのすべてまたは実質上すべてが非ヒトであるものは、この用語から除外される。
【0149】
ヒト抗体は、抗原チャレンジに応答してインタクトヒト抗体またはヒト可変領域を持つインタクト抗体を生産するように変更が加えられたトランスジェニック動物に免疫原を投与することによって調製しうる。そのような動物は、典型的には、ヒト免疫グロブリン座位の全部または一部分を含有しており、それらは内在性免疫グロブリン座位と置き換わっているか、染色体外に存在するか、またはその動物の染色体にランダムに組み込まれている。そのようなトランスジェニック動物では、内在性免疫グロブリン座位は一般に不活化されている。ヒト抗体は、ヒトレパトア由来の抗体コード配列を含有する、ファージディスプレイライブラリーおよび無細胞ライブラリーを含むヒト抗体ライブラリーにも由来しうる。
【0150】
提供される抗体には、モノクローナル抗体フラグメントを含むモノクローナル抗体が含まれる。本明細書において使用する用語「モノクローナル抗体」は、実質的に均一な抗体の集団から得られる、またはそのような集団内の、抗体を指す。すなわち、天然の変異を含有する変異体またはモノクローナル抗体調製物の生産中に生じる変異体(そのような変異体の存在量は一般に少ない)が考えられる点を除けば、前記集団を構成する個々の抗体は同一である。典型的には異なるエピトープに対する異なる抗体を含むポリクローナル抗体調製物とは対照的に、モノクローナル抗体調製物の各モノクローナル抗体は、1つの抗原上の単一のエピトープを指向する。この用語が、何らかの特定方法による抗体の生産を要求すると解釈してはならない。モノクローナル抗体は、限定するわけではないが、ハイブリドーマからの生成、組換えDNA法、ファージディスプレイおよび他の抗体ディスプレイ法を含む、さまざまな技法によって作製しうる。
【0151】
いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生されるTCRのアルファ鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生されるTCRのベータ鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、同じ免疫細胞によって産生される、TCRのアルファ鎖の可変領域を含む配列とTCRのベータ鎖の可変領域とを含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生されるTCRのガンマ鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、免疫細胞によって産生されるTCRのデルタ鎖の可変領域を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドは、同じ免疫細胞によって産生される、TCRのガンマ鎖の可変領域を含む配列とTCRのデルタ鎖の可変領域とを含む配列を含む。
【0152】
いくつかの態様において、TCRは完全なTCRを包含すると共に、その抗原結合部分または抗原結合性フラグメント(MHC-ペプチド結合性フラグメントともいう)も包含する。いくつかの態様において、TCRはインタクトTCRまたは全長TCRである。いくつかの態様において、TCRは、全長TCRより短いが、MHC分子に結合した(すなわちMHC分子を背景とする)特異的抗原ペプチド、すなわちMHC-ペプチド複合体に結合する抗原結合部分である。場合により、TCRの抗原結合部分または抗原結合性フラグメントは、全長TCRまたはインタクトTCRの構造ドメインの一部分だけを含有しうるが、それでもなお、完全なTCRが結合するエピトープ(例えばMHC-ペプチド複合体)に結合することができる。場合により、TCRの抗原結合部分または抗原結合性フラグメントは、特異的MHC-ペプチド複合体に結合するための結合部位を形成するのに十分なTCRの可変ドメイン、例えばTCRの可変α鎖および可変β鎖、例えば一般的には各鎖が3つの相補性決定領域を含有するものを含有する。抗原結合ドメインである結合ドメインを有するポリペプチドもしくはタンパク質または抗原結合ドメインと相同である結合ドメインを有するポリペプチドもしくはタンパク質は含まれる。相補性決定領域(CDR)移植された抗体およびTCRならびに他のヒト化された抗体およびTCR(CDR修飾およびフレームワーク領域修飾を含む)も、これらの用語によって想定されている。免疫グロブリン鎖(例えば重鎖および軽鎖)にしか言及しないかもしれないが、開示される発明は、他の複数の異なるタイプのペアになった配列、例えばT細胞受容体鎖ペア(TCRα鎖およびTCRβ鎖ならびにTCRγ鎖およびTCRδ鎖)にも応用することができ、免疫グロブリンに限定されないことに注意すべきである。
【0153】
さまざまながんまたは感染性生物に関連する抗原を認識するT細胞の能力は、そのTCRによって付与され、これは、アルファ(α)鎖とベータ(β)鎖との両方またはガンマ(γ)鎖とデルタ(δ)鎖との両方で構成されている。これらの鎖を構成するタンパク質はDNAによってコードされており、それは、TCRの極めて大きい多様性を生成させるためにユニークな機序を使用する。この多サブユニット免疫認識受容体はCD3複合体と会合し、抗原提示細胞(APC)の表面にMHCクラスIおよびクラスIIタンパク質によって提示されるペプチドに結合する。APC上の抗原ペプチドに対するTCRの結合はT細胞活性化の中心的イベントであり、これは、T細胞とAPCとの接触点の免疫シナプスで起こる。
【0154】
各TCRは可変相補性決定領域(CDR)とフレームワーク領域(FR)とを含む。主として、α鎖およびβ鎖可変ドメインの第3相補性決定領域(CDR3)ループのアミノ酸配列が、β鎖座位中のvariable(可変)(Vβ)遺伝子セグメント、diversity(多様性)(Dβ)遺伝子セグメントおよびjoining(連結)(Jβ)遺伝子セグメント間の組換えならびにα鎖座位中の類似するVα遺伝子セグメントおよびJα遺伝子セグメント間の組換えによって生じるαβ型T細胞の配列多様性を決める。TCRのα鎖座位およびβ鎖座位におけるそのような複数の遺伝子セグメントの存在が、多数の相異なるCDR3配列がコードされることを可能にしている。TCR遺伝子再編成の過程におけるVβ-Dβ、Dβ-JβおよびVα-Jα接合部でのヌクレオチドの独立した付加および欠失は、CDR3配列の多様性をさらに増加させる。この点で、免疫能はTCRの多様性に反映される。
【0155】
抗原結合性フラグメントを含むTCRフラグメントも提供される。いくつかの態様において、TCRはその抗原結合部分、例えばその膜貫通領域および/または細胞質領域を含有しない全長TCRの変異体であり、これは完全可溶性TCRと呼ぶこともできる。いくつかの態様において、TCRは二量体型TCR(dTCR)である。いくつかの態様において、TCRは単鎖TCR(scTCR)、例えばPCT特許公開番号WO 03/020763、WO 04/033685またはWO 2011/044186に記載の構造を有するscTCRである。一定の態様において、TCRは、ベータ鎖可変領域に連結されたアルファ鎖可変領域を含む単鎖TCRフラグメント、例えばscTvである。いくつかの態様において、scTvはscFvとも呼ばれる。
【0156】
単鎖FvまたはscFvとは、いくつかの局面において、抗体の可変重鎖(VH)ドメインおよび可変軽鎖(VL)ドメインまたはTCRの可変アルファ鎖もしくは可変ガンマ鎖(VαまたはVγ)ドメインおよび可変ベータ鎖もしくは可変デルタ鎖(VβまたはVδ)ドメインを含み、これらのドメインが単一ポリペプチド鎖中に存在する、抗体フラグメントまたはTCRフラグメントを指す。一般に、Fvポリペプチドは、VHドメインとVLドメインの間またはVαドメインとVβドメインもしくはVγドメインとVδドメインの間に、scFvが抗原結合にとって望ましい構造をとることを可能にするポリペプチドリンカーを、さらに含む。
【0157】
ダイアボディとは、いくつかの局面において、2つの抗原結合部位を持つ小さな抗体フラグメントおよび/または小さなTCRフラグメントを指し、このフラグメントは、同じポリペプチド鎖中でVLにつながられたVH(VH-VL)または同じポリペプチド鎖中でVβにつながれたVα(Vα-Vβ)または同じポリペプチド鎖中でVδにつながれたVγ(Vγ-Vδ)を含む。短すぎて同じ鎖上の2つのドメイン間でのペアリングを許さないリンカーを使用することにより、ドメインはもう一つの鎖の相補的ドメインとペアを形成して2つの抗原結合部位を作ることを強いられる。例示的なダイアボディは、例えばEP404097およびWO93111161にさらに詳しく説明されている。
【0158】
二重特異性抗体または二重特異性TCRとは、いくつかの局面において、タイプが異なる2つの抗原に対して特異性を示す抗体またはTCRを指す。本明細書において使用する場合、これらの用語には、標的抗原に対する結合特異性と特定組織への送達を容易にする別の標的に対する結合特異性とを示す抗体およびTCRが、特に含まれるが、それらに限定されるわけではない。同様に、多重特異性抗体および多重特異性TCRも、2つまたはそれ以上の結合特異性を有する。
【0159】
線状抗体または「線状TCとは、いくつかの局面において、抗原結合領域のペアを形成するタンデムFdセグメント(例えばVH-CH1-VH-CH1またはVα-Cα1-Vα-Cα1)のペアを指す。線状抗体および線状TCRは、例えばZapata et al.,Protein Eng.8(10):1057-1062(1995)に記載されているように、二重特異性または単一特異性であることができる。
【0160】
抗原結合ドメインとは、いくつかの局面において、抗原に特異的に結合する能力を保っている抗体またはTCRの1つまたは複数のフラグメントを指す。このような用語に包含される抗体フラグメントの非限定的な例としては、(i)Fabフラグメント、VL、VH、CLおよびCH1ドメインからなる一価フラグメント、(ii)F(ab')2フラグメント、ヒンジ領域におけるジスルフィド架橋によって連結された2つのFabフラグメントを含有する二価フラグメント、(iii)VHドメインとCH1ドメインとからなるFdフラグメント、(iv)抗体の単一アームのVLドメインとVHドメインとを含有するFvフラグメント、scFvを含む、(v)VHドメインを含有するdAbフラグメント(Ward et al.,(1989)Nature 341:544 546)、および(vi)単離されたCDRが挙げられるが、それらに限定されるわけではない。この定義には、単一の重鎖と単一の軽鎖とを含む抗体、または単一のアルファ鎖と単一のベータ鎖とを持つTCRも包含される。
【0161】
「F(ab')2」部分および「Fab'」部分は、Igを、ペプシンおよびパパインなどのプロテアーゼで処理することによって作製することができ、免疫グロブリンを、2つの重鎖のそれぞれのヒンジ領域間に存在するジスルフィド結合の近くで消化することによって生成する抗体フラグメントを包含する。例えばパパインは、2つの重鎖のそれぞれのヒンジ領域間に存在するジスルフィド結合の上流でIgGを切断することで、VLおよびCLから構成される軽鎖とVHおよびCHγ1(重鎖の定常領域中のγ1領域)から構成される重鎖フラグメントとがそれぞれのC末領域でジスルフィド結合によってつながれている2つの相同な抗体フラグメントを生成させる。これらの2つの相同な抗体フラグメントのそれぞれは'Fab'と呼ばれる。また、ペプシンはIgGを、2つの重鎖のそれぞれのヒンジ領域間に存在するジスルフィド結合の下流でIgGを切断することで、上記2つの'Fab'がヒンジ領域でつながれたフラグメントよりもわずかに大きい抗体フラグメントを生成する。この抗体フラグメントはF('ab')2と呼ばれる。Fabフラグメントは、軽鎖の定常ドメインおよび重鎖の第1定常ドメイン(CH1)も含有する。'Fab'フラグメントは、重鎖CH1ドメインのカルボキシル末に、抗体ヒンジ領域からの1つまたは複数のシステインを含む数残基が付加されている点で、Fabフラグメントとは異なる。Fab'-SHは、定常ドメインのシステイン残基が遊離チオール基を保持しているFab'の、本明細書における名称である。F(ab')2抗体フラグメントは、元々は、Fab'フラグメントのペアであって、それらの間にヒンジシステインを有するものとして作製される。
【0162】
Fvは、いくつかの局面において、完全な抗原認識および抗原結合部位を含有する抗体フラグメントまたはTCRフラグメントを指す。この領域は、非共有結合で固く会合した1つの重鎖可変ドメインおよび1つの軽鎖可変ドメインまたは1つのTCRα鎖および1つのTCRβ鎖または1つのTCRγ鎖および1つのTCRδ鎖からなる。各可変ドメインの3つのCDRが相互作用して、VH-VL二量体またはVα-Vβ二量体またはVγ-Vδ二量体の表面に抗原結合部位を規定するのは、この相対的配置でのことである。VH鎖およびVL鎖またはVα鎖およびVβ鎖またはVγ鎖およびVδ鎖のそれぞれからのCDRのうちの1つまたは複数の組合せが、全体として、抗体またはTCRに抗原結合特異性を付与する。例えば、選択されたレシピエント抗体、TCR、またはそれらの抗原結合性フラグメントのVH鎖およびVL鎖またはVα鎖およびVβ鎖またはVγ鎖およびVδ鎖に移入する場合には、抗体またはTCRに抗原結合特異性を付与するには、CDRH3とCDRL3とで十分でありうること、そしてCDRのこの組合せを結合、アフィニティーなどについて試験できることは、理解されるであろう。第2の可変ドメインと組み合わされた場合よりもアフィニティーは低いだろうが、単一の可変ドメイン(または抗原に特異的な3つのCDRだけを含むFvの半分)でも、抗原を認識し抗原に結合する能力を有する。さらにまた、Fvフラグメントの2つのドメイン(VLおよびVHまたはVαおよびVβまたはVγおよびVδ)は別々の遺伝子によってコードされているが、それらは、それらを、VL鎖領域とVH鎖領域またはVα鎖領域とVβ鎖領域またはVγ鎖領域とVδ鎖領域とがペアになって一価分子を形成する単一のタンパク質鎖として作製することを可能にする合成リンカーにより、組換え法を使って接合することができる(単鎖Fv(scFv)として公知である;Bird et al.(1988)Science 242:423-426、Huston et al.(1988)Proc.Natl.Acad.Sci.USA 85:5879-5883およびOsbourn et al.(1998)Nat.Biotechnol.16:778)。そのようなscFvも、抗体の「抗原結合部分」という用語に包含されるものとする。完全なIg(例えばIgG)分子または他のアイソタイプをコードする発現ベクターを生成させるために、特異的scFvの任意のVH配列およびVL配列を、Fc領域のcDNA配列またはゲノム配列に連結することができる。VHおよびVLは、タンパク質化学または組換えDNA技術のいずれかを使ったFab、FvまたはIgの他のフラグメントの生成にも使用することができる。
【0163】
「生殖細胞系配列」は、生殖細胞系(配偶子およびそこから形成される二倍体細胞)からの遺伝子配列を指す。生殖細胞系DNAは単一のIg重鎖もしくは軽鎖または単一のTCRα鎖もしくはTCRβ鎖または単一のTCRγ鎖もしくはTCRδ鎖をコードする複数の遺伝子セグメントを含有する。これらの遺伝子セグメントは生殖細胞に保持されているが、機能的遺伝子に編成されるまでは転写、翻訳されることはできない。骨髄におけるB細胞およびT細胞の分化中にこれらの遺伝子セグメントは、108を超える特異性を生成させる能力を有する動的遺伝子系(dynamic genetic system)によって、ランダムにシャッフルされる。これらの遺伝子セグメントの大半は、生殖細胞系データベースによって公表され、収集されている。
【0164】
いくつかの態様において、免疫分子は、中和抗体または中和TCRでありうる、または中和抗体または中和TCRである可能性が高い。いくつかの局面において、中和抗体または中和TCRは、ウイルスまたは細菌などの病原体の複製を阻害する抗体またはTCRであり、中和を達成する機序は問わない。
【0165】
いくつかの態様において、試料、例えば細胞の集団または単一細胞は、免疫レパトア、例えば抗体レパトアまたはTCRレパトアを含有することができ、それを、提供される方法によって解明することができる。いくつかの態様において、抗体レパトアまたはTCRレパトアとは、抗体、TCR、またはそれらのフラグメントの集合体を指す。いくつかの態様において、抗体レパトアは、例えば、特定の抗体を選択するため、または結合能、結合特異性、胃腸輸送能、安定性、アフィニティーなどといった特定の特性についてスクリーニングするために使用することができる。この用語は、あらゆる形態のコンビナトリアルライブラリーを含む抗体ライブラリーおよびTCRライブラリーを特に包含し、これには、例えば、限定するわけではないが任意の供給源からの単鎖Fv(scFv)抗体ファージディスプレイライブラリーおよびFab抗体ファージディスプレイライブラリーなどといった抗体ファージディスプレイライブラリーが含まれ、ナイーブライブラリー、合成ライブラリーおよび半合成ライブラリーが含まれる。
【0166】
標的ポリヌクレオチドは、事実上任意の供給源から得ることができ、当技術分野において公知の方法を使って調製することができる。例えば標的ポリヌクレオチドは、限定するわけではないが、生物または細胞(例えば免疫細胞)からゲノムDNAまたはmRNAのフラグメントを抽出して標的ポリヌクレオチドを得る工程を含む、当技術分野において公知の方法を使って、増幅なしで直接単離することができる。標的ポリヌクレオチドは、逆転写PCRによってRNA(mRNAなど)から生成させたcDNAも包含することができる。場合により、標的ポリヌクレオチドはRNA分子である。場合により、標的ポリヌクレオチドはmRNA分子またはそのmRNA分子から作製されたcDNAである。場合により、標的ポリヌクレオチドは、単一の免疫細胞からのmRNA分子またはそのmRNA分子から作製されたcDNA分子である。場合により、標的ポリヌクレオチドは、個々の免疫細胞からのmRNA分子またはそのmRNA分子から作製されたcDNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは個々の免疫細胞からの重鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの重鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、個々の免疫細胞からの軽鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの軽鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、個々の免疫細胞からの抗体可変配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの可変抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、個々の免疫細胞からの可変軽鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの可変軽鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、個々の免疫細胞からの可変重鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは、単一の免疫細胞からの可変重鎖抗体配列をコードするmRNA分子である。場合により、標的ポリヌクレオチドは無細胞核酸、例えばDNAまたはRNAであることができる。場合により、標的ポリヌクレオチドは、個々の免疫細胞からの可変アルファ、ベータ、ガンマ、および/またはデルタ鎖TCR配列をコードするmRNA分子である。
【0167】
本明細書に記載する方法は、シーケンシングのために、1つまたは複数の標的ポリヌクレオチドからポリヌクレオチドのライブラリーを生成させるために使用することができる。標的ポリヌクレオチドは、増幅反応の産物ではない任意の関心対象ポリヌクレオチドを含む。例えば標的ポリヌクレオチドは生物学的試料中のポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドはPCR反応の産物を含まない。例えば標的ポリヌクレオチドは、増幅反応の産物を生成させるためのポリヌクレオチドテンプレートを含みうるが、増幅産物そのものを含まない。例えば標的ポリヌクレオチドは、逆転写反応またはプライマー伸長反応の産物を生成させるためのポリヌクレオチドテンプレートを含み、逆転写反応産物またはプライマー伸長反応産物そのものも含みうる。例えば標的ポリヌクレオチドは、逆転写反応またはプライマー伸長反応に供することができる関心対象のポリヌクレオチドを含む。例えば標的ポリヌクレオチドはRNAまたはDNAを含む。例えば標的ポリヌクレオチドはcDNAを含む。いくつかの態様において標的RNAポリヌクレオチドはmRNAである。いくつかの態様において標的RNAポリヌクレオチドはポリアデニル化されている。いくつかの態様においてRNAポリヌクレオチドはポリアデニル化されていない。いくつかの態様において標的ポリヌクレオチドはDNAポリヌクレオチドである。DNAポリヌクレオチドはゲノムDNAでありうる。DNAポリヌクレオチドは、エクソン、イントロン、非翻訳領域、またはそれらの任意の組合せを含みうる。
【0168】
いくつかの態様において、ライブラリーは標的ポリヌクレオチドの2つまたはそれ以上の領域から生成させることができる。いくつかの態様において、ライブラリーは、2つまたはそれ以上の標的ポリヌクレオチドから生成させることができる。いくつかの態様において、標的ポリヌクレオチドは、染色体に由来するゲノム核酸またはDNAである。いくつかの態様において、標的ポリヌクレオチドは、多型または突然変異などの変異体を含む配列を含む。いくつかの態様において、標的ポリヌクレオチドはDNAを含み、RNAを含まない。いくつかの態様において、標的ポリヌクレオチドはRNAを含み、DNAを含まない。いくつかの態様において、標的ポリヌクレオチドはDNAおよびRNAを含む。いくつかの態様において、標的ポリヌクレオチドはmRNA分子である。いくつかの態様において、標的ポリヌクレオチドはDNA分子である。いくつかの態様において、標的ポリヌクレオチドは一本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは二本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは二本鎖ポリヌクレオチドのうちの単一の鎖である。
【0169】
標的ポリヌクレオチドは、任意の生物学的試料から入手することができ、当技術分野において公知の方法を使って調製することができる。いくつかの態様において、標的ポリヌクレオチドは増幅なしで直接単離される。直接単離の方法は当技術分野において公知である。非限定的な例には、生物学的試料、生物または細胞からゲノムDNAまたはmRNAを抽出することが含まれる。
【0170】
いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは生物学的試料から精製される。いくつかの態様において、標的ポリヌクレオチドは、それを含有する生物学的試料から精製されない。いくつかの態様において、標的ポリヌクレオチドは生物的試料から単離される。いくつかの態様において、標的ポリヌクレオチドは、それを含有する生物学的試料から単離されない。いくつかの態様において、標的ポリヌクレオチドは無細胞核酸であることができる。いくつかの態様において、標的ポリヌクレオチドはフラグメント化された核酸であることができる。いくつかの態様において、標的ポリヌクレオチドは転写された核酸であることができる。いくつかの態様において、標的ポリヌクレオチドは修飾ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは非修飾ポリヌクレオチドである。
【0171】
いくつかの態様において、標的ポリヌクレオチドは単一細胞からのポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは個々の細胞からのポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは複数の細胞を含有する試料からのポリヌクレオチドである。
【0172】
いくつかの態様において、標的ポリヌクレオチドはバイオマーカー配列をコードする。いくつかの態様において、標的ポリヌクレオチドは2つまたはそれ以上のバイオマーカー配列をコードする。いくつかの態様では、複数の標的ポリヌクレオチドが1つのバイオマーカー配列をコードする。いくつかの態様では、複数の標的ポリヌクレオチドが2つまたはそれ以上のバイオマーカー配列をコードする。いくつかの態様では、複数の標的ポリヌクレオチドが、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、もしくは100またはそれ以上のバイオマーカー配列をコードする。
【0173】
いくつかの態様では、複数の標的ポリヌクレオチドが、免疫グロブリン配列のパネルを含む。いくつかの態様では、複数の標的ポリヌクレオチドが、TCR配列のパネルを含む。例えば、免疫グロブリン配列のパネルはVH配列および/またはVL配列であることができる。いくつかの態様において、免疫グロブリン配列またはTCR配列のパネルは、1、2、3、4、5、6、7、8、9、または10の免疫グロブリン配列またはTCR配列を含有する。いくつかの態様において、免疫グロブリン配列またはTCR配列のパネルは、少なくとも約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、3000、4000、5000、6000、7000、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、または9×1012の免疫グロブリン配列またはTCR配列を含有する。いくつかの態様において、免疫グロブリン配列またはTCR配列のパネルは、最大で約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011,6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、または9×1012の免疫グロブリン配列またはTCR配列を含有する。いくつかの態様において、免疫グロブリン配列またはTCR配列のパネルは、約10~20、10~30、10~40、10~30、10~40、10~50、10~60、10~70、10~80、10~90、10~100、50~60、50~70、50~80、50~90、50~100、100~200、100~300、100~400、100~300、100~400、100~500、100~600、100~700、100~800、100~900、100~1000、500~600、500~700、500~800、500~900、500~1000、1000~2000、1000~3000、1000~4000、1000~3000、1000~4000、1000~5000、1000~6000、1000~7000、1000~8000、1000~9000、1000~10000、5000~6000、5000~7000、5000~8000、5000~9000、5000~10000、1~1×105、1~2×105、1~3×105、1~4×105、1~5×105、1~6×105、1~7×105、1~8×105、9×105、1~1×106、1~2×106、1~3×106、1~4×106、1~5×106、1~6×106、1~7×106、1~8×106、9×106、1~1×107、1~2×107、1~3×107、1~4×107、1~5×107、1~6×107、1~7×107、1~8×107、1~9×107、1~1×108、1~2×108、1~3×108、1~4×108、1~5×108、1~6×108、1~7×108、1~8×108、1~9×108、1~1×109、1~2×109、1~3×109、1~4×109、1~5×109、1~6×109、1~7×109、1~8×109、1~9×109、1~1×1010、1~2×1010、1~3×1010、1~4×1010、1~5×1010、1~6×1010、1~7×1010、1~81010、1~9×1010、1~1×1011、1~2×1011、1~3×1011、1~4×1011、1~5×1011、1~6×1011、1~7×1011、1~8×1011、1~9×1011、1~1×1012、1~2×1012、1~3×1012、1~4×1012、1~5×1012、1~6×1012、1~7×1012、1~8×1012、または1~9×1012の免疫グロブリン配列またはTCR配列を含有する。
【0174】
いくつかの態様において、標的ポリヌクレオチドは、約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対長である。いくつかの態様において、標的ポリヌクレオチドは、少なくとも約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対長である。いくつかの態様において、標的ポリヌクレオチドは、最大で約10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、もしくは20,000塩基または塩基対長である。いくつかの態様において、標的ポリヌクレオチドは、約10~20、10~30、10~40、10~30、10~40、10~50、10~60、10~70、10~80、10~90、10~100、50~60、50~70、50~80、50~90、50~100、100~200、100~300、100~400、100~300、100~400、100~500、100~600、100~700、100~800、100~900、100~1000、500~600、500~700、500~800、500~900、500~1000、1000~2000、1000~3000、1000~4000、1000~3000、1000~4000、1000~5000、1000~6000、1000~7000、1000~8000、1000~9000、1000~10000、5000~6000、5000~7000、5000~8000、5000~9000、または5000~10000塩基または塩基対長である。いくつかの態様において、標的ポリヌクレオチドまたはそのフラグメントの平均長は、約100、200、300、400、500、または800塩基対未満、または約5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、または200ヌクレオチド未満、または約1、2、5、10、20、30、40、50、60、70、80、90、100キロベース未満であることができる。いくつかの態様において、標的ポリヌクレオチドを含有する試料など、比較的短いテンプレートからの標的配列は、約40、45、50、55、60、65、70、75、80、85、90、95、または100塩基である。一定の態様において、シーケンシングデータは、疾患または状態と関連する配列または免疫グロブリン配列もしくはTCR配列を含有するデータベースを使って、公知の配列または予想される配列に対してアライメントされる。
【0175】
2. ポリヌクレオチドの集合体、例えばトランスクリプトーム
ゲノムポリヌクレオチドまたはトランスクリプトームポリヌクレオチドに対応するポリヌクレオチドの集合体は、1つの細胞または複数の細胞など、事実上任意の供給源から得ることができ、当技術分野において公知の方法を使って調製することができる。例えば、ポリヌクレオチドの集合体は、限定するわけではないが、生物または細胞(例えば免疫細胞)からゲノムDNAまたはmRNAのフラグメントを抽出してポリヌクレオチドの集合体を得る工程を含む、当技術分野において公知の方法を使って、単一細胞または複数の細胞から、増幅なしで直接単離することができる。ゲノムポリヌクレオチドまたはトランスクリプトームポリヌクレオチドの集合体は、逆転写PCRによってRNA(mRNAなど)から生成させたcDNAも包含することができる。場合により、ポリヌクレオチドの集合体はRNA分子の集合体である。場合により、ポリヌクレオチドの集合体は、mRNA分子の集合体、またはmRNA分子から作製されたcDNA分子の集合体である。場合により、ポリヌクレオチドの集合体は、単一の免疫細胞からの、mRNA分子の集合体、またはmRNA分子から作製されたcDNA分子の集合体である。場合により、ポリヌクレオチドの集合体は、個々の免疫細胞からの、mRNA分子の集合体、またはmRNA分子から作製されたcDNA分子の集合体である。
【0176】
本明細書に記載する方法は、シーケンシングのために、1つまたは複数の細胞からポリヌクレオチドの集合体を含有するライブラリーを生成させるために使用することができる。ポリヌクレオチドの集合体は、生物学的試料からの1つまたは複数の細胞のmRNA転写産物など、ゲノムDNAまたはRNAに由来することができる。例えば、ゲノムDNAまたは細胞RNA、例えばmRNAは、逆転写反応またはプライマー伸長反応などの増幅反応の産物を生成させるためのテンプレートとして使用することができる。いくつかの例において、ポリペプチドの集合体は、cDNAから生成させることができる。いくつかの態様では、ポリヌクレオチドの集合体を、mRNAであるRNAポリヌクレオチドから生成させ、その集合体は、生物学的試料からの1つまたは複数の細胞のトランスクリプトームを実質的に表す。いくつかの態様では、ポリヌクレオチドの集合体を、ポリアデニル化されたRNAポリヌクレオチドから生成させる。いくつかの態様においてRNAポリヌクレオチドはポリアデニル化されていない。いくつかの態様では、ポリヌクレオチドの集合体をDNAポリヌクレオチドから生成させる。DNAポリヌクレオチドはゲノムDNAでありうる。DNAポリヌクレオチドは、エクソン、イントロン、非翻訳領域、またはそれらの任意の組合せを含みうる。例えば、本発明のポリヌクレオチドの集合体は、少なくとも5、10、100、250、500、750、1,000、2,500、5,000、10,000、25,000、50,000、75,000、10,000、250,000、500,000、750,000、1,000,000、2,500,000、5,000,000、7,500,000、もしくは10,000,000個の、細胞のサブセットまたは個々の細胞の、例えば異なる抗体もしくはTCRを発現する免疫細胞のサブセットまたは個々の免疫細胞の、ゲノム情報またはトランスクリプトーム情報を含有することができる。
【0177】
いくつかの態様において、ポリヌクレオチドの集合体は、ランダムヘキサマープライマーを使った逆転写酵素反応またはプライマー伸長反応によって、生成させることができる。いくつかの態様において、ポリヌクレオチドの集合体は、ポリAヌクレオチド配列に対するプライマーを使った逆転写酵素反応またはプライマー伸長反応によって、生成させることができる。いくつかの例において、ポリヌクレオチドの集合体は、オリゴdTを使った逆転写酵素反応またはプライマー伸長反応によって、生成させることができる。いくつかの例において、プライマーはビオチン化することができる。ポリヌクレオチドの集合体は、任意で、逆転写反応またはプライマー伸長反応に続いて精製することができる。例えば、ビオチン化プライマーを使って生成させたポリヌクレオチドの集合体は、任意で、ストレプトアビジン精製技法を使って精製することができる。別の態様において、ポリヌクレオチドは、1つまたは複数のアフィニティー精製、アガロースゲル電気泳動によって精製することができる。
【0178】
3. 液滴ライブラリー
一般に、液滴ライブラリーは、単一の集合体にまとめてプールされるいくつかのライブラリー要素から構成される。ライブラリーの複雑度は、単一のライブラリー要素から1×1015またはそれ以上のライブラリー要素までさまざまでありうる。各ライブラリー要素は、固定された濃度の、1つまたは複数の所与の構成要素である。要素は、細胞、ビーズ、アミノ酸、タンパク質、ポリペプチド、核酸、ポリヌクレオチドまたは低分子化合物でありうるが、それらに限定されるわけではない。要素は、分子バーコード、ベッセルバーコード、またはその両方などといった識別子を含有しうる。
【0179】
細胞ライブラリー要素は、ハイブリドーマ、B細胞、T細胞、初代細胞、培養細胞株、がん細胞、幹細胞、または他の任意の細胞タイプを含むことができるが、それらに限定されるわけではない。細胞ライブラリー要素は、千~数万の細胞を個々の液滴に封入することによって調製される。封入される細胞の数は、通常、細胞の数密度および液滴の体積から、ポアソン統計によって与えられる。しかし、この数は、Edd et al.,“Controlled encapsulation of single-cells into monodisperse picoliter drops”Lab Chip,8(8):1262-1264,2008に記載されているように、ポアソン統計から逸脱する場合もある。細胞は離散的性質を持つので、すべてが単一の出発媒質中に存在する複数の細胞変異体、例えばそれぞれが1つの抗体またはTCRを産生する免疫細胞を使って、一まとめにして、ライブラリーを調製することができ、次に、その媒質が、せいぜい1個の細胞を含有する個々のベッセル、例えば液滴またはカプセルへと分割される。液滴またはカプセルなどの個々のベッセル内の細胞は、次に溶解され、溶解された細胞からベッセル内に放出されたポリヌクレオチド、例えば標的mRNAまたは標的DNA(例えば重鎖および軽鎖ポリヌクレオチドならびに/またはアルファ鎖およびベータ鎖ポリヌクレオチドならびに/またはガンマ鎖およびデルタ鎖ポリヌクレオチド)を含む細胞mRNAおよびゲノムDNAは、分子バーコードおよびベッセルバーコードでバーコード化され、増幅される。次に、その二重バーコード化ポリヌクレオチド産物をあわせて、またはプールして、トランスクリプトームまたはゲノムライブラリー要素と標的(例えば重鎖および軽鎖ならびに/またはアルファ鎖およびベータ鎖ならびに/またはガンマ鎖およびデルタ鎖)ライブラリー要素とからなるライブラリーを形成させる。特に、トランスクリプトームおよび標的ライブラリーがプールされる。
【0180】
ビーズベースのライブラリー要素は1つまたは複数のビーズを含有し、抗体、酵素または他のタンパク質などといった他の試薬も含有しうる。すべてのライブラリー要素が異なるタイプのビーズを含有するが、周囲の培地は同じである場合、ライブラリー要素は、すべて単一の出発流体から調製するか、またはさまざまな出発流体を有することができる。変異体の集合体から一まとめにして調製される細胞ライブラリーの場合、ライブラリー要素は、さまざまな出発流体から調製されることになる。複数の細胞から出発する場合は、液滴は1つにつき正確に1つの細胞を有し、2つ以上の細胞を含有する液滴はわずかしかないことが望ましい。場合により、ポアソン統計からの変動を達成して、液滴1つにつき細胞が正確に一つである液滴が増えて、空の液滴または2つ以上の細胞を含有する液滴がわずかな例外になるように、液滴のローディングを強化することができる。
【0181】
いくつかの態様において、複数のベッセルバーコード化ポリヌクレオチドから出発する場合、液滴は1つにつき正確に1つのベッセルバーコード化ポリヌクレオチドを有し、2つ以上のベッセルバーコード化ポリヌクレオチドを含有する液滴はわずかしかないことが望ましい。場合により、ポアソン統計からの変動を達成して、液滴1つにつきベッセルバーコード化ポリヌクレオチドが正確に一つである液滴が増えて、空の液滴または2つ以上のベッセルバーコード化ポリヌクレオチドを含有する液滴がわずかな例外になるように、液滴のローディングを強化することができる。
【0182】
液滴ライブラリーの例は、ビーズ、細胞、低分子、DNA、プライマー、抗体、およびバーコード化ポリヌクレオチドなど、さまざまな内容物を有する液滴の集合体である。液滴のサイズは、直径がおよそ0.5ミクロン~500ミクロンの範囲にあり、これは約1ピコリットル~1ナノリットルに対応する。しかし液滴は、小さければ5ミクロン程度であることも、大きければ500ミクロン程度であることもできる。好ましくは、液滴は直径100ミクロン未満、直径約1ミクロン~約100ミクロンである。最も好ましいサイズは直径約20~40ミクロン(10~100ピコリットル)である。検討される液滴ライブラリーの好ましい性質には、浸透圧バランス、一様なサイズ、およびサイズ範囲が含まれる。
【0183】
本発明によって提供される液滴ライブラリー内に含まれる液滴は、好ましくは、サイズが一様である。すなわち、ライブラリー内の任意の液滴の直径を、同じライブラリー内の他の液滴の直径と比較した場合のばらつきは、5%未満、4%未満、3%未満、2%未満、1%未満または0.5%未満であるだろう。ライブラリー内の液滴の均一なサイズは、液滴の安定性および完全性を維持するのに極めて重要になりうるし、ライブラリー内の液滴を引き続いて、本明細書に記載するさまざまな生物学的アッセイおよび化学的アッセイに使用するために不可欠でもありうる。
【0184】
本発明は、不混和性流体内に複数の水性液滴を含む液滴ライブラリーであって、各液滴は、好ましくは、サイズが実質的に一様であり、異なるライブラリー要素を含む、液滴ライブラリー、を提供する。本発明は、異なるライブラリー要素を含む単一の水性流体を用意する工程、各ライブラリー要素を不混和性流体内の水性液滴中に封入する工程を含む、液滴ライブラリーを形成するための方法を提供する。
【0185】
一定の態様では、異なるタイプの要素(例えば細胞またはビーズ)を、同じ媒質に含まれる単一の供給源に、プールすることができる。次に、初期のプールすることの後に、要素が液滴に封入されて、液滴のライブラリーを生成する。ここでは、異なるタイプのビーズまたは細胞を持つ各液滴が、異なるライブラリー要素となる。初期溶液の希釈によって封入プロセスが可能になる。いくつかの態様において、形成される液滴は、単一の要素を含有するか、または何も含有しない、すなわち空になるだろう。別の態様において、形成される液滴は、複数コピーのライブラリー要素を含有することになる。封入される要素は、一般的には、1タイプの変異体である。一例において、要素は血液試料の免疫細胞であり、各免疫細胞は、その免疫細胞中のヌクレオチドの抗体配列を増幅し、バーコード化するために封入される。
【0186】
例えば、あるタイプのエマルジョンライブラリーには、異なる媒質中に異なる粒子、すなわち細胞またはバーコード化ポリヌクレオチドを有し、かつプールすることに先だって封入される、ライブラリー要素が存在する。一例では、指定された数のライブラリー要素、すなわち数nの異なる細胞またはバーコード化ポリヌクレオチドが、異なる媒質内に含まれる。ライブラリー要素のそれぞれは個別に乳化され、プールされ、この時点で、プールされた数nの異なるライブラリー要素のそれぞれが合わされて、単一のプールへとプールされる。結果として生じたプールは、それぞれが異なるタイプの粒子を含有する複数の油中水型エマルジョン液滴を含有する。
【0187】
いくつかの態様において、形成された液滴は、単一ライブラリー要素を含有するか、または何も含有しない、すなわち空になるだろう。別の態様において、形成される液滴は、複数コピーのライブラリー要素を含有することになる。ビーズの内容物はポアソン分布に従う。この場合は、いくつかのイベントが直前のイベントからの時間に依存することなく既知の平均速度で生起する場合に、それらのイベントが所与の期間中に生起する確率を表す離散的確率分布が存在する。ライブラリーを作るために使用される油および界面活性剤は、液滴間でのライブラリー内容物の交換を防ぐ。
【0188】
B. 単一細胞二重バーコード化ポリヌクレオチドライブラリーを作製する方法
いくつかの態様では、以下の工程を含む、ポリヌクレオチドライブラリーを作製するための方法が提供される:(a)複数のベッセルのそれぞれの中で細胞を溶解する工程であって、該ベッセルのそれぞれが、細胞の集団を含む試料からの細胞と、複数の分子バーコード化オリゴヌクレオチドと、ベッセルバーコード化オリゴヌクレオチドを含む第1アダプターとを含む、工程;(b)各ベッセル中で、(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的一本鎖ポリヌクレオチドと(ii)それぞれが前記細胞中のポリヌクレオチドに相補的である一本鎖ポリヌクレオチドの集合体とを含む、複数の一本鎖ポリヌクレオチドを作製する工程;(c)各一本鎖ポリヌクレオチドに前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、ユニークな分子バーコードをそれぞれが含む複数のバーコード化一本鎖ポリヌクレオチドを生成させる、工程;(d)前記ベッセルバーコード化オリゴヌクレオチドもしくはその増幅産物を含む第1アダプターを、前記バーコード化一本鎖ポリヌクレオチドのそれぞれに取り付ける工程であって、それによって、複数の二重バーコード化一本鎖ポリヌクレオチドを生成させる、工程、ここで同じベッセル内の二重バーコード化一本鎖ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む;ならびに(e)第2アダプターを前記二重バーコード化一本鎖ポリヌクレオチドのそれぞれに付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程。ポリヌクレオチドライブラリーがその中で作製される例示的なベッセルとしては、ウェル、エマルジョン、液滴またはマイクロカプセルが挙げられる。
【0189】
1. 試料調製
本明細書に記載する方法では、ポリヌクレオチドを含有する細胞の集団を含有する試料など、任意の生物学的試料を使用することができる。本明細書に記載する方法では、一般に、細胞を含有する任意の試料を使用することができる。例えば試料は、RNAまたはDNAを含有する、対象からの生物学的試料またはそれに由来する試料であることができる。ポリヌクレオチドは生物学的試料から抽出するか、またはポリヌクレオチドの抽出もしくは精製を行わずにそのまま本方法に供することができる。試料は、抽出または単離されたDNAまたはRNAであることができる。試料は、生物学的検体から抽出された全RNAもしくはDNA、cDNAライブラリー、ウイルスDNAまたはゲノムDNAであることもできる。一態様において、ポリヌクレオチドは、タンパク質、脂質および非テンプレート核酸などといったさまざまな他の構成要素を含有する生物学的試料から単離される。核酸テンプレート分子は、動物、植物、細菌、真菌、または他の任意の細胞性生物から得られる任意の細胞材料から得ることができる。
【0190】
一定の態様において、ポリヌクレオチドは、単一細胞から、例えば細胞の集団中に存在する細胞から、得られる。ポリヌクレオチドは生物から直接得るか、または生物から得られる生物学的試料から得ることができる。任意の組織検体または体液検体を、本発明において使用するための核酸の供給源として使用しうる。ポリヌクレオチドは、初代細胞培養または細胞株などの培養細胞から単離することもできる。いくつかの態様において、細胞は、血液細胞、免疫細胞、組織細胞または腫瘍細胞であることができる。いくつかの態様において、細胞は、B細胞またはT細胞などの免疫細胞である。B細胞は、形質芽球、メモリーB細胞または形質細胞であることができる。テンプレート核酸が得られる細胞または組織は、ウイルスまたは他の細胞内病原体に感染していてもよい。
【0191】
いくつかの態様において、細胞の集団、例えば免疫細胞を含有する集団は、対象または宿主の、例えばヒトまたは他の動物の、例えば免疫されたヒトもしくは他の動物、または感染症、がん、自己免疫状態もしくは他の任意の疾患を患っているヒトもしくは他の動物の、血液または他の生物学的試料から単離することができる。いくつかの態様において、ヒトは、ある疾患と診断されたヒト、ある疾患の症状を呈しているヒト、ある疾患とは診断されていないヒト、またはある疾患の症状を呈していないヒトでありうる。いくつかの態様において、対象または宿主、例えばヒト対象は、感染性因子(例えばウイルス、細菌、寄生虫、プリオンなど)、抗原、疾患、または疾患もしくは状態に関連する抗原、例えば腫瘍関連抗原に曝露され、かつ/あるいはそれらに対するTCRを産生することができるものでありうる。いくつかの態様において、免疫細胞は、PBMC、脾臓または他のリンパ器官中に存在する細胞など、T細胞を含有する任意の生物学的試料からのものであることができる。いくつかの態様において、免疫細胞は、正常または健常対象のT細胞供給源からのものである。いくつかの態様において、免疫細胞は、疾患対象のT細胞供給源からのものである。いくつかの態様では、CD4またはCD8細胞を単離し、または得ることができる。場合により、末梢血単核球(PBMC)を単離し、または得ることができる。場合により、腫瘍浸潤リンパ球(TIL)を単離し、または得ることができる。
【0192】
一定の態様では、臨床的意義を持つ可能性がある病原体特異的、腫瘍特異的および/または疾患特異的な抗体またはTCRを同定するために、抗体またはTCRを産生する免疫細胞を、対象または宿主の、例えばヒトまたは他の動物の、例えば免疫されたヒトもしくは他の動物、または感染症、がん、自己免疫状態もしくは他の任意の疾患を患っているヒトもしくは他の動物の、血液または他の生物学的試料から単離することができる。例えば、ヒトは、ある疾患と診断されたヒト、ある疾患の症状を呈しているヒト、ある疾患とは診断されていないヒト、またはある疾患の症状を呈していないヒトでありうる。例えばヒトは、感染性因子(例えばウイルス、細菌、寄生虫、プリオンなど)、抗原または疾患に曝露され、かつ/またはそれらに対して有用な抗体もしくはTCRを作ることができるヒトでありうる。例えば動物は、感染性因子(例えばウイルス、細菌、寄生虫、プリオンなど)、抗原または疾患に曝露され、かつ/またはそれらに対して有用な抗体もしくはTCRを作ることができる動物でありうる。いくつかの例において、ヒトなどの前記動物は、もはや疾患または状態の症状を呈さない。免疫された宿主からの一定の免疫細胞は、1つもしくは複数の標的抗原および/または1つもしくは複数の未知抗原に対して抗体またはTCRを作る。本発明では、抗体鎖をシーケンシングし、抗体を作製し、または1つもしくは複数の発現ライブラリーを作製する前に、試料から複数の免疫細胞を、例えば免疫細胞ライブラリーを生成させるために、任意の適切な方法によって、例えば蛍光活性化細胞選別法(FACS)、磁気活性化細胞選別法(MACS)、パンニング法または他のスクリーニング方法を使って細胞をスクリーニングし選別することによって、リンパ球プールを、所望の免疫細胞について濃縮することができる。異なる抗体を発現する免疫細胞のサブセットを少しだけ、それゆえに可変ドメインの天然の組合せを少しだけ提供することになる、先行技術の濃縮方法とは対照的に、本発明の免疫細胞ライブラリーは、異なる抗体またはTCRを発現する免疫細胞のサブセットまたは個々の免疫細胞を少なくとも2つは含有する。例えば、本発明の免疫細胞ライブラリーは、異なる抗体またはTCRを発現する免疫細胞のサブセットまたは個々の免疫細胞を、少なくとも5、10、100、250、500、750、1,000、2,500、5,000、10,000、25,000、50,000、75,000、10,000、250,000、500,000、750,000、1,000,000、2,500,000、5,000,000、7,500,000もしくは10,000,000個は含有することができる。本発明の方法は免疫細胞の回収率を最大化し、極めて高い多様性をもたらす。
【0193】
T細胞は、末梢血単核球、骨髄、胸腺、組織生検、腫瘍、リンパ節組織、腸管関連リンパ組織、粘膜関連リンパ組織、脾臓組織、または他の任意のリンパ組織、および腫瘍を含む、いくつかの供給源から得ることができる。T細胞は、T細胞株から得ることができ、自家供給源または同種異系供給源から得ることができる。T細胞は、単一個体から得てもよいし、個体の集団から、例えば全員ががんまたは感染性疾患などの同じ疾患を患っている個体の集団から、得てもよい。いくつかの態様では、アフェレーシスまたは白血球アフェレーシスによって、個体の循環血から細胞が得られる。アフェレーシス産物は典型的には、T細胞を含むリンパ球、単球、顆粒球、B細胞、他の有核白血球、赤血球、および血小板を含有する。一態様では、アフェレーシスまたは白血球アフェレーシスによって収集された細胞を洗浄することで、血漿画分を除去し、後続の処理工程のための適当な緩衝液または培地に、細胞を入れることができる。本発明の一態様において、細胞はリン酸緩衝食塩水(PBS)で洗浄される。代替的態様において、洗浄溶液はカルシウムを欠き、またマグネシウムを欠いてもよく、あるいはすべてではないとしても多くの二価カチオンを欠いてもよい。当業者にはすぐに理解されるであろうとおり、洗浄工程は、当業者に公知の方法によって、例えば半自動「フロースルー」遠心分離機を使用することなどによって、達成されうる。
【0194】
洗浄後は、細胞を、例えばCa++/Mg++非含有PBSなどのさまざまな生体適合性緩衝液に再懸濁しうる。あるいは、アフェレーシス試料の望ましくない構成要素を除去して、細胞を培養培地に直接再懸濁してもよい。別の態様では、赤血球を溶解し、PERCOLL(商標)勾配で遠心分離することによって、末梢血リンパ球からT細胞が単離される。T細胞の特定亜集団、例えばCD28+、CD4+、CD8+、CD45RA+およびCD45RO+T細胞を、陽性選択技法または陰性選択技法によって、さらに単離することができる。例えば、CD3+、CD28+T細胞は、CD3/CD28コンジュゲート磁気ビーズ(例えばDYNABEADS(登録商標)M-450 CD3/CD28 T Cell Expander)を使って陽性選択することができる。
【0195】
いくつかの態様において、陰性選択によるT細胞集団の濃縮は、陰性選択される細胞にユニークな表面マーカーに対する抗体の組合せを使って達成することができる。そのような方法の一つは、陰性選択される細胞上に存在する細胞表面マーカーに対するモノクローナル抗体のカクテルを使用する陰性磁気免疫付着(negative magnetic immunoadherence)またはフローサイトメトリーによる細胞の選別および/または選択である。例えば、陰性選択によってCD4+細胞を濃縮するために、モノクローナル抗体カクテルは、典型的には、CD14、CD20、CD11b、CD16、HLA-DRおよびCD8に対する抗体を含む。刺激用にT細胞を調製するための別の方法は、洗浄後に細胞を凍結することであり、これは単球除去工程を必要としない。凍結とそれに続く解凍工程は細胞集団中の顆粒球と、ある程度は単球とを除去することによって、より一様な産物を与えることができる。血漿および血小板を除去する洗浄工程後に、細胞を凍結溶液に懸濁しうる。数多くの凍結溶液および凍結パラメータが当技術分野では公知であり、この状況下で有用であるだろうが、一つの方法では、20%DMSOおよび8%ヒト血清アルブミン(HSA)を含有するPBSまたは他の適切な細胞凍結培地を使用する。次にこれを、DMSOおよびHSAの最終濃度がそれぞれ10%および4%になるように、培地で1:1希釈する。次に細胞を毎分1℃の速度で-80℃まで冷凍し、液体窒素貯蔵タンクの蒸気相で貯蔵する。
【0196】
いくつかの態様において、細胞の集団は試料から濃縮される。いくつかの態様において、細胞は、特定サブセットまたは特定サブタイプの細胞について濃縮される。いくつかの態様において、細胞の集団は、T細胞もしくはB細胞が濃縮されているか、またはT細胞もしくはB細胞を含有する。いくつかの態様において、細胞の集団は、CD4+もしくはCD8+細胞が濃縮されているか、またはCD4+もしくはCD8+細胞を含有する。いくつかの態様において、細胞の集団は、セントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞、エフェクターT細胞および制御性T細胞が濃縮されているか、またはそれらを含有する。いくつかの態様において、細胞の集団は、メモリーB細胞、ナイーブB細胞または形質芽球B細胞が濃縮されているか、またはそれらを含有する。
【0197】
いくつかの態様において、免疫細胞は、その細胞からの免疫受容体の、選択された標的抗原または標的複合体に対するアフィニティーに基づいて選択することができる。いくつかの局面において、アフィニティーとは、2つの作用物質の可逆的結合に関する平衡定数を指し、KDで表される。リガンドに対する結合タンパク質のアフィニティー、例えばエピトープに対する抗体のアフィニティーまたはMHC-ペプチド複合体に対するTCRのアフィニティーは、例えば約100ナノモル濃度(nM)~約0.1nM、約100nM~約1ピコモル濃度(pM)、または約100nM~約1フェムトモル濃度(fM)であることができる。用語「アビディティー」は、2つまたはそれ以上の作用物質の複合体の、希釈後の解離に対する抵抗を指す。
【0198】
いくつかの態様において、エピトープとは、いくつかの局面において、抗原または他の高分子のうち、抗体またはTCRの可変領域結合ポケットとの結合相互作用を形成する能力を有する部分を指す。そのような結合相互作用は、1つまたは複数のCDRの1つまたは複数のアミノ酸残基との分子間接触として明示されうる。抗原結合は、CDR3、CDR3ペア、またはいくつかの例ではVH鎖およびVL鎖の最大で6つすべてのCDRの相互作用を必要としうる。エピトープは、線状ペプチド配列(すなわち「連続」エピトープ)でありうるか、または非連続アミノ酸配列で構成されうる(すなわち「コンフォメーショナル」エピトープまたは「不連続」エピトープ)。抗体またはTCRは、1つまたは複数のアミノ酸配列を認識することができるので、エピトープは、2つ以上の相異なるアミノ酸配列を規定することができる。いくつかの局面において、TCRは、MHC分子を背景とする1つまたは複数のアミノ酸配列またはエピトープを認識することができる。抗体およびTCRによって認識されるエピトープは、当業者に周知のペプチドマッピング技法および配列解析技法によって決定することができる。結合相互作用は、CDRの1つまたは複数のアミノ酸残基との分子間接触として明示される。
【0199】
いくつかの態様において、特異的結合を伴う免疫受容体への言及、例えば抗体またはTCRなど、免疫細胞上に発現されるものへの言及は、抗体またはTCRが、その抗原またはTCRによって認識されるエピトープを含有する抗原以外の分子には有意な結合を何も示さない状況を指す。この用語は、例えば抗原結合ドメインが、いくつかの抗原によって保持されている特定エピトープに特異的である場合にも適用することができ、その場合、選択された抗体、TCRまたは抗原結合ドメインを保持するそれらの抗原結合性フラグメントは、そのエピトープを保持するさまざまな抗原に結合することができるだろう。
【0200】
「優先的に結合する」または「特異的に結合する」という用語は、抗体、TCR、またはそれらのフラグメントが、無関係なアミノ酸配列への結合よりも高いアフィニティーでエピトープに結合すること、およびそのエピトープを含有する他のポリペプチドへの交差反応性がある場合には、ヒトへの投与に使用するために処方されるレベルでは毒性でないことを意味する。一局面において、そのようなアフィニティーは、無関係なアミノ酸配列に対するその抗体、TCR、またはそれらのフラグメントのアフィニティーよりも、少なくとも1倍、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、または少なくとも1000倍強い。「結合」という用語は、例えば生理的条件下での共有結合、静電相互作用、疎水相互作用、ならびにイオンおよび/または水素結合相互作用などによる、2つの分子の間の直接的会合を指し、塩架橋および水架橋などの相互作用、ならびに結合の他の任意の通常の意味を包含する。
【0201】
いくつかの態様において、「結合」という用語は、例えば生理的条件下での共有結合、静電相互作用、疎水相互作用、ならびにイオンおよび/または水素結合相互作用などによる、2つの分子の間の直接的会合を指し、塩架橋および水架橋などの相互作用、ならびに結合の他の任意の通常の意味を包含する。
【0202】
いくつかの態様において、免疫細胞は、その細胞からの免疫受容体の、例えばTCRの、テトラマーまたは他のMHC-ペプチドマルチマーに対するアフィニティーに基づいて選択することができる。いくつかの態様において、「テトラマー」(tetramer)という用語は、細胞の集団に結合することで細胞の集団を同定することができる、単一のストレプトアビジン分子に結合した4つのサブユニットを含む複合体を指しうる。サブユニットはMHC-ペプチド複合体であることができる。サブユニットはペプチドが会合していないMHCであってもよい。サブユニットはB細胞受容体抗原であることができる。テトラマーによって同定される細胞の集団は、テトラマーのサブユニットに結合する、TCRまたはBCRなどの受容体を発現する集団であることができる。細胞の集団は抗原特異的T細胞であることができる。細胞の集団は抗原特異的B細胞であることができる。テトラマーは蛍光標識されうる。本明細書にいうMHC-ペプチドテトラマーは、pMHCと相互可換的に使用することができる。
【0203】
いくつかの例において、免疫細胞は、アフィニティーオリゴヌクレオチドコンジュゲート(affinity oligonucleotide conjugate)に対するアフィニティーに基づいて選択することができる(例えばWO 2017/053905参照)。アフィニティーオリゴヌクレオチドコンジュゲートなどの選択された標的抗原もしくは標的複合体への結合またはそれら標的抗原もしくは標的複合体の認識に基づいて選択された細胞は、本明細書に記載する陽性または陰性選択技法によって、さらに単離することができる。
【0204】
いくつかの態様では、免疫されていないヒトまたは非ヒトドナーからの免疫細胞を利用する。動物のナイーブレパトア(抗原チャレンジ前のレパトア)は、本質的に任意の非自己分子に対して中等度のアフィニティー(KAが約1×10-6~1×10-7M)で結合することができる抗体またはTCRを持つ動物をもたらす。抗体またはTCR結合部位の配列多様性は、生殖細胞系において直接コードされているわけではなく、V遺伝子セグメントから組合せ的にアセンブルされる。免疫化は、免疫原に結合することで増殖(クローン拡大)し上述のように対応する抗体を分泌する、VH-VLまたはVα-VβまたはVγ-Vδの組合せを任意の免疫細胞が作るきっかけとなる。しかし、免疫されていない対象からの脾細胞および/または免疫細胞または他の末梢血リンパ球(PBL)を使用することで、可能な抗体レパトアまたはTCRレパトアのより良い表現を得ることができ、続いて、任意の動物種を使って、B細胞またはT細胞の抗体ライブラリーまたはTCRライブラリーを構築することも可能になる。
【0205】
いくつかの態様において、試料は唾液である。いくつかの態様において、試料は全血である。いくつかの態様では、試験するのに十分な量のポリヌクレオチドを得るために、少なくとも約0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45、または50mLの血液量が採取される。場合によっては、試験するの十分な核酸を得るために、少なくとも0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45、または50mLの血液量が採取される。
【0206】
場合により、出発材料は末梢血である。末梢血細胞は、特定細胞タイプ(例えば単核球、赤血球、CD4+細胞、CD8+細胞、免疫細胞、T細胞、NK細胞など)について濃縮することができる。末梢血細胞は、特定細胞タイプ(例えば単核球、赤血球、CD4+細胞、CD8+細胞、免疫細胞、T細胞、NK細胞など)を選択的に枯渇させることもできる。
【0207】
場合により、出発材料は、固体組織を含む組織試料であることができ、非限定的な例として、皮膚、脳、肝臓、肺、腎臓、前立腺、卵巣、脾臓、リンパ節(扁桃を含む)、甲状腺、膵臓、心臓、骨格筋、腸、喉頭、食道、および胃が挙げられる。別の場合には、出発材料は、核酸を含有する細胞、免疫細胞、特にB細胞またはT細胞であることができる。場合により、出発材料は、遺伝物質を得ることができる、任意の生物からの、核酸を含有する試料であることができる。場合により、試料は流体、例えば血液、唾液、リンパ液または尿である。
【0208】
試料は、ある状態を持つ対象から採取することができる。場合により、試料が採取される対象は患者、例えばがん患者またはがんを有すると疑われる患者であることができる。対象は哺乳動物、例えばヒトであることができ、雄または雌であることができる。場合により、雌は妊娠している。試料は腫瘍生検であることができる。生検は、例えば医師、医師助手、看護師、獣医師、歯科医、カイロプラクター、医療補助者、皮膚科医、腫瘍学者、胃腸科医、または外科医を含む医療提供者によって実施されうる。
【0209】
場合により、非核酸材料は、酵素処理(プロテアーゼ消化など)を使って、出発材料から除去することができる。
【0210】
場合により、血液は、限定するわけではないがEDTAなどのマグネシウムキレート剤を含有する装置に収集して、4℃で貯蔵される。任意で、限定するわけではないがEGTAなどのカルシウムキレート剤を加えることができる。別の場合では、細胞溶解阻害剤、限定するわけではないが、例えばホルムアルデヒド、ホルムアルデヒド誘導体、ホルマリン、グルタルアルデヒド、グルタルアルデヒド誘導体、タンパク質架橋剤、核酸架橋剤、タンパク質および核酸架橋剤、1級アミン反応性架橋剤、スルフヒドリル反応性架橋剤、スルフヒドリル付加またはジスルフィド還元、糖質反応性架橋剤、カルボキシル反応性架橋剤、光反応性架橋剤、または切断可能な架橋剤などが、血液に加えられる。
【0211】
場合により、抽出された材料が一本鎖RNA、二本鎖RNA、またはDNA-RNAハイブリッドを含む場合は、当分野において公知の技法を使って、これらの分子を二本鎖DNAに変換することができる。例えば、RNA分子からDNAを合成するには、逆転写酵素を使用することができる。場合により、RNAをDNAに変換するには、RNAにリンカーフラグメントをライゲートすることによって、ユニバーサルプライマーを使って逆転写を開始させることができるように、事前のライゲーション工程が必要になりうる。別の場合には、逆転写を開始させるために、例えばmRNA分子のポリAテールを使用することができる。DNAへの変換に続いて、場合により、所望の配列を捕捉し、選択し、タグ付けし、または単離するために、本明細書に詳述する方法を使用することができる。
【0212】
核酸分子にはデオキシリボ核酸(DNA)および/またはリボ核酸(RNA)が包含される。核酸分子は合成するか、天然の供給源から誘導することができる。一態様において、核酸分子は、タンパク質、脂質および非テンプレート核酸などといったさまざまな他の構成要素を含有する生物学的試料から単離される。核酸テンプレート分子は、動物、植物、細菌、真菌、または他の任意の細胞性生物から得られる任意の細胞材料から得ることができる。一定の態様において、核酸分子は単一細胞から得られる。本発明において使用される生物学的試料は、ウイルス粒子またはウイルス調製物を含む。核酸分子は、生物から直接的に得るか、または生物から得られた生物学的試料から、例えば血液、尿、脳脊髄液、精液、唾液、喀痰、糞便および組織から、得ることができる。任意の組織検体または体液検体を、本発明において使用するための核酸の供給源として使用しうる。核酸分子は、初代細胞培養または細胞株などの培養細胞から単離することもできる。テンプレート核酸が得られる細胞または組織は、ウイルスまたは他の細胞内病原体に感染していてもよい。
【0213】
試料は、生物学的検体から抽出された全RNA、cDNAライブラリー、ウイルスDNAまたはゲノムDNAであることもできる。一定の態様において、核酸分子は、他の標的分子、例えばタンパク質、酵素、基質、抗体、結合因子、ビーズ、低分子、ペプチド、または他の任意の分子に結合している。一般に核酸は、Sambrook and Russell,Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor,N.Y.(2001)に記載の技法など、さまざまな技法によって、生物学的試料から抽出することができる。核酸分子は、一本鎖、二本鎖、または一本鎖領域を持つ二本鎖(例えばステム・ループ構造)でありうる。
【0214】
DNA抽出の方法は当技術分野において周知である。古典的なDNA単離プロトコールは、フェノールとクロロホルムの混合物などといった有機溶媒を使った抽出と、それに続くエタノールによる沈殿に基づく(J.Sambrook et al.,“Molecular Cloning:A Laboratory Manual”,1989,2nd Ed.,Cold Spring Harbour Laboratory Press:New York,N.Y.)。他の方法には以下に挙げるものがある:塩析DNA抽出(P.Sunnucks et al.,Genetics,1996,144:747-756、S.M.Aljanabi et al.,Nucl.Acids Res.1997,25:4692-4693)、トリメチルアンモニウム臭化物塩DNA抽出(S.Gustincich et al.,BioTechniques,1991,11:298-302)およびグアニジニウムチオシアネートDNA抽出(J.B.W.Hammond et al.,Biochemistry,1996,240:298-300)。生物学的試料からDNAを抽出するために、さまざまなキットが市販されている(例えばBD Biosciences Clontech(カリフォルニア州パロアルト)、Epicentre Technologies(ウィスコンシン州マディソン)、Gentra Systems,Inc.(ミネソタ州ミネアポリス)、MicroProbe Corp.(ワシントン州ボセル)、Organon Teknika(ノースカロライナ州ダーラム)およびQiagen Inc.(カリフォルニア州バレンシア))。
【0215】
RNA抽出の方法も当技術分野において周知であり(例えばJ.Sambrook et al.,“Molecular Cloning:A Laboratory Manual”1989,211d Ed.,Cold Spring Harbour Laboratory Press:New York)、体液からのRNA抽出のためのキットは市販されている(例えばAmbion,Inc.(テキサス州オースティン)、Amersham Biosciences(ニュージャージー州ピスカタウェイ)、BD Biosciences Clontech(カリフォルニア州パロアルト)、BioRad Laboratories(カリフォルニア州ハーキュリーズ)、Dynal Biotech Inc.(ニューヨーク州レイク・サクセス)、Epicentre Technologies(ウィスコンシン州マディソン)、Gentra Systems,Inc.(ミネソタ州ミネアポリス)、GIBCO BRL(メリーランド州ゲイサーズバーグ)、Invitrogen Life Technologies(カリフォルニア州カールズバッド)、MicroProbe Corp.(ワシントン州ボセル)、Organon Teknika(ノースカロライナ州ダーラム)、Promega,Inc.(ウィスコンシン州マディソン)およびQiagen Inc.(カリフォルニア州バレンシア))。
【0216】
1つまたは複数の試料は、1つまたは複数の供給源に由来することができる。試料のうちの1つまたは複数は2つまたはそれ以上の供給源に由来しうる。試料のうちの1つまたは複数は1または複数の対象に由来しうる。試料のうちの1つまたは複数は2またはそれ以上の対象に由来しうる。試料のうちの1つまたは複数は同じ対象に由来しうる。1または複数の対象は同じ種に由来しうる。1または複数の対象は異なる種に由来しうる。前記1または複数の対象は健常でありうる。前記1または複数の対象は、疾患、障害または状態に冒されていてもよい。
【0217】
いくつかの態様において、試料は流体、例えば血液、唾液、リンパ液、尿、脳脊髄液、精液、喀痰、糞便、または組織ホモジネートなどである。
【0218】
試料は、ある状態を持つ対象から採取することができる。いくつかの態様において、試料が採取される対象は患者、例えばがん患者またはがんを有すると疑われる患者であることができる。対象は哺乳動物、例えばヒトであることができ、雄または雌であることができる。いくつかの態様において、雌は妊娠している。試料は腫瘍生検であることができる。生検は、例えば医師、医師助手、看護師、獣医師、歯科医、カイロプラクター、医療補助者、皮膚科医、腫瘍学者、胃腸科医、または外科医を含む医療提供者によって実施されうる。
【0219】
いくつかの態様において、ポリヌクレオチドは、他の標的分子、例えばタンパク質、酵素、基質、抗体、結合因子、ビーズ、低分子、ペプチド、または他の任意の分子に結合している。いくつかの態様において、ポリヌクレオチドは固体支持体には結合していない。核酸は、さまざまな技法によって、生物学的試料から抽出することができる(Sambrook et al.,Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor,N.Y.(2001))。
【0220】
いくつかの態様では、解析前に細胞懸濁液を予熱することができる。いくつかの態様では、細胞懸濁液を、エマルジョン生成の直前に、細胞内部のDNAポリメラーゼの活性は増強するが、RNA分解などの望ましくない効果は最小限に抑えるために、ある温度に、十分な期間にわたって、加熱する(下記B.2項に記載)。このように細胞は、本明細書において提供される方法の収率を最適化するために加熱される。いくつかの例において、細胞は、およそ30℃~70℃、例えば30~60℃、25~60℃、30~60℃、40~60℃、45~55℃に、1、2 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20分の期間にわたって加熱される。細胞を加熱した後、細胞懸濁液は、エマルジョンを形成させる前に、30秒~最大4時間、例えば30秒、45秒、1分、2分、3分、4分、5分、6分、7分、8分、9分、10分、15分、20分、25分、30分、35分、40分、45分、1時間、1.5時間、2時間、2.5時間、3時間、3.5時間または4時間にわたって、室温に保つか、または氷上に置くことができる。
【0221】
複数の試料は、少なくとも2、3、4、5、10、20、30、40、50、60、70、80、90もしくは100個またはそれ以上の試料を含みうる。複数の試料は少なくとも約100、200、300、400、500、600、700、800、900もしくは1000個またはそれ以上の試料を含みうる。複数の試料は、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000個の試料、9000、または10,000個の試料、または100,000個の試料、または1,000,000個もしくはそれ以上の試料を含みうる。複数の試料は少なくとも約10,000個の試料を含みうる。
【0222】
第1試料中の1つまたは複数のポリヌクレオチドは、第2試料中の1つまたは複数のポリヌクレオチドとは異なりうる。第1試料中の1つまたは複数のポリヌクレオチドは、複数の試料中の1つまたは複数のポリヌクレオチドとは異なりうる。ある試料中の1つまたは複数のポリヌクレオチドは、少なくとも約80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を含むことができる。いくつかの態様において、ある試料中の1つまたは複数のポリヌクレオチド間の相違は、約100、90、80、70、60、50、40、30、25、20、25、10、9、8、7、6、5、4、3、2、または1ヌクレオチドまたは塩基対未満であることができる。複数の試料のうちの1つまたは複数の試料中の複数のポリヌクレオチドは、2つまたはそれ以上の同一配列を含むことができる。複数の試料のうちの1つまたは複数の中の全ポリヌクレオチドの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%または100%が、同じ配列を含みうる。複数の試料のうちの1つまたは複数の試料の中の複数のポリヌクレオチドは、少なくとも2つの異なる配列を含みうる。複数の試料のうちの1つまたは複数の中の全ポリヌクレオチドの少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%が、少なくとも2つの異なる配列を含みうる。いくつかの態様において、1つまたは複数のポリヌクレオチドは互いに変異体である。例えば、1つまたは複数のポリヌクレオチドは、一塩基多型または他のタイプの変異を含有しうる。別の例において、1つまたは複数のポリヌクレオチドはスプライス変異体である。
【0223】
第1試料は1つまたは複数の細胞を含み、第2試料は1つまたは複数の細胞を含みうる。第1試料の1つまたは複数の細胞は、第2試料の1つまたは複数の細胞と同じ細胞タイプでありうる。第1試料の1つまたは複数の細胞は、複数の試料の1つまたは複数の異なる細胞とは異なる細胞タイプでありうる。
【0224】
複数の試料は並行して得ることができる。複数の試料は同時に得ることができる。複数の試料は逐次的に得ることができる。複数の試料は、1つまたは複数の異なる試料を得てから、数年にわたって、例えば100年、10年、5年、4年、3年、2年または1年にわたって得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約1年以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから12ヶ月、11ヶ月、10ヶ月、9ヶ月、8ヶ月、7ヶ月、6ヶ月、5ヶ月、4ヶ月、3ヶ月、2ヶ月または1ヶ月以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから30日、28日、26日、24日、21日、20日、18日、17日、16日、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日または1日以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約24時間、22時間、20時間、18時間、16時間、14時間、12時間、10時間、8時間、6時間、4時間、2時間または1時間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約60秒、45秒、30秒、20秒、10秒、5秒、2秒または1秒以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから1秒未満以内に得ることができる。
【0225】
ある試料の異なるポリヌクレオチドは、その試料中に、異なる濃度または異なる量(例えば異なる分子数)で存在することができる。例えば、あるポリヌクレオチドの濃度または量は、その試料中の別の1ポリヌクレオチドの濃度または量より大きい場合がある。いくつかの態様において、試料中の少なくとも1つのポリヌクレオチドの濃度または量は、その試料中の少なくとも1つの他のポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍またはそれ以上である。別の例において、あるポリヌクレオチドの濃度または量は、その試料中の別の1ポリヌクレオチドの濃度または量より低い。試料中の少なくとも1つのポリヌクレオチドの濃度または量は、その試料中の少なくとも1つの他のポリヌクレオチドの濃度または量より、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍またはそれ以上、少なくてもよい。
【0226】
いくつかの態様では、2つまたはそれ以上の試料が異なる量または濃度のポリヌクレオチドを含有しうる。いくつかの態様において、ある試料中のあるポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドの濃度または量よりも大きい場合がありうる。例えば血液試料は尿試料より多量の特定ポリヌクレオチドを含有しうる。あるいは、単一の試料を2つまたはそれ以上の部分試料に分割することができる。部分試料は異なる量または異なる濃度の同じポリヌクレオチドを含有しうる。ある試料中の少なくとも1つのポリヌクレオチドの濃度または量は、別の1試料中の同じポリヌクレオチドの濃度または量の、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍またはそれ以上でありうる。あるいは、ある試料中のあるポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドの濃度または量より低い場合がありうる。例えば、ある試料における少なくとも1つのポリヌクレオチドの濃度または量は、別の1試料中の同じポリヌクレオチドの濃度または量より、少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍またはそれ以上、少なくてもよい。
【0227】
2. 液滴の生成および単一細胞バーコード化
ベッセルバーコードおよび分子バーコードによる単一細胞バーコード化のために、油中水型エマルジョンなどのベッセルを、結果として生じるベッセルが1ベッセルあたり1つ以下の細胞を含有するように作ることができる。ベッセルは、結果として生じるベッセルが1ベッセルあたり1つのベッセルバーコードも含有するように作ることができる。ベッセルは、結果として生じるベッセルが1ベッセルあたり1分子のバーコード化ポリヌクレオチドも含有するように作ることができる。ベッセルは、1ベッセルあたり2つもしくはそれ以上または複数の分子バーコード化ポリヌクレオチドも含有するように作ることができる。細胞/ベッセルは、本明細書に記載するRNAまたはDNA単一バーコード化プロトコールに供することができ、ベッセルバーコードおよび各ベッセルの1つまたは複数の分子バーコードを、細胞ポリヌクレオチドなどの関心対象の標的と融合することができる。いくつかの態様では、マッチするベッセルバーコード化ポリヌクレオチドを、1つまたは複数の分子バーコード化ポリヌクレオチドと同じベッセル中に存在する細胞構成要素に融合することができる。シーケンシングに続いて、ベッセルバーコードおよび分子バーコードデコンボリューションを使って、どのRNA(またはDNA)がどの細胞に由来したかを同定することができる。いくつかの態様において、油中水型エマルジョンなどのベッセルは、結果として生じるエマルジョンが1エマルジョンあたり1細胞以上を含有するように作ることができる。いくつかの態様において、油中水型エマルジョンは、結果として生じるエマルジョンが、1ベッセルあたり1つのベッセルバーコード化ポリヌクレオチドと2つまたはそれ以上の分子バーコード化ポリヌクレオチドとを含有するように作ることができる。いくつかの態様において、ベッセルは、結果として生じるベッセルが、1ベッセルあたり2つ以上のベッセルバーコード化ポリヌクレオチドと2つまたはそれ以上の分子バーコード化ポリヌクレオチドとを含有するように作ることができる。いくつかの態様において、ベッセルバーコードおよび分子バーコードは、溶解状態にあるときに、ベッセルに導入することができる。いくつかの態様において、ベッセルバーコードおよび分子バーコードは、ビーズなどの固体支持体に取り付けられていないときに、ベッセルに導入することができる。例示的なベッセルとして、ウェル、エマルジョン、液滴およびマイクロカプセルが挙げられる。
【0228】
いくつかの局面では、単一細胞を、コンパートメント(例えばベッセル)として振る舞うことができるエマルジョンの内部に隔離することができる。細胞を溶解して、細胞からの転写産物をバーコード化することができる。同じベッセルバーコードを持つ2つまたはそれ以上のRNA転写産物が検出された場合に、それらが同じ出発細胞に由来したものであると決定することができるように、転写産物のそれぞれを、分子バーコードまたはベッセルバーコードと融合することができる。これは多くの異なるタイプの配列に応用することができる。具体的応用の一つは、抗体配列およびTCR配列のVH鎖とVL鎖またはVα鎖とVβ鎖またはVγ鎖とVδ鎖を結びつけることでありうる。
【0229】
1つまたは複数のエマルジョンの1つのベッセル、例えば液滴が、最大で1個以下の細胞を含有しうるように、1つまたは複数の単一細胞を、1つまたは複数のエマルジョンにおいて、ベッセルバーコードおよび分子バーコードの存在下で隔離することができる。細胞は、エマルジョンに含まれる緩衝液によって化学的に溶解するか、凍結解凍によって溶解し、それによって、エマルジョン中で細胞の内容物を遊離させることができる。
【0230】
単一細胞のRNAはcDNAに逆転写することができる。逆転写反応は、上述のように約3つのシトシン残基を付加する非テンプレートターミナルトランスフェラーゼ活性を有する逆転写酵素を使って行うことができる。逆転写緩衝液、酵素およびヌクレオチドはすべて、エマルジョンを形成させるときに存在しうる。いくつかの態様において、プライマーは、すべてのmRNAを標的とするために、汎用であることができる(ポリdT配列を含むポリヌクレオチドなど)。いくつかの態様ではDNAを使用することができる。いくつかの態様では、3つ以上のRNAを標的とすることができる。
【0231】
いくつかの態様では、ベッセルバーコードを、逆転写中に、RNAに連結することができる。いくつかの態様では、分子バーコードを、逆転写中に、RNAに連結することができる。いくつかの態様では、ベッセルバーコードおよび分子バーコードを、逆転写中に、RNAに連結することができる。複数の細胞の試料を小さな反応体積に分割する工程を、複数の細胞に由来する個々の細胞からのポリヌクレオチドの、または複数の細胞に由来する個々の細胞から誘導されたポリヌクレオチドの、分子バーコード化およびベッセルバーコード化と連携させることにより、バイオマーカー配列などといった配列のレパトアのハイスループットシーケンシングを可能にすることができる。
【0232】
複数の細胞の試料を小さな反応体積または1つもしくは複数の細胞を含有するベッセルに分割する工程を、複数の細胞に由来する個々の細胞からのポリヌクレオチドの、または複数の細胞に由来する個々の細胞から誘導されたポリヌクレオチドの、分子バーコード化およびベッセルバーコード化と連携させることにより、ある生物のトランスクリプトームの一部に相当する配列などといった配列のレパトアのハイスループットシーケンシングを可能にすることができる。例えば、配列のレパトアは、ある生物のトランスクリプトームの少なくとも約0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、30%、35%、40%、45,50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%に相当する複数の配列を含むことができる。
【0233】
免疫細胞の試料を小さな反応体積または1つもしくは複数の免疫細胞を含有するベッセルに分割する工程を、複数の免疫細胞に由来する個々の免疫細胞からのポリヌクレオチドの、または複数の免疫細胞に由来する個々の免疫細胞から誘導されたポリヌクレオチドの、分子バーコード化およびベッセルバーコード化と連携させることにより、重鎖配列および軽鎖配列のレパトアのハイスループットシーケンシングが可能になる。これらの方法では、バーコード化された配列に基づくシーケンシング後に、重鎖と軽鎖のペアリングも可能である。本明細書に記載するように試料を小さな反応体積に分割することによって、試薬の使用量を低減することも可能になり、それによって解析の材料費が低下する。
【0234】
場合により、逆転写反応および/または増幅反応(例えばPCR)は液滴中で、例えば液滴デジタルPCRで実行される。一定の局面において、本発明は、標的材料の全部または一部を含有する流体コンパートメントまたはベッセルを提供する。いくつかの態様において、コンパートメントまたはベッセルは液滴である。本明細書の全体を通して「液滴」に言及するが、この用語は、別段の表示がある場合を除き、流体コンパートメントおよび流体パーティションと相互可換的に使用される。ベッセルは、そのような流体コンパートメントまたは流体パーティションを含むか、そのような流体コンパートメントまたは流体パーティションからなることができる。別段の表示がある場合を除き、便宜上、「液滴」が使用され、任意の流体パーティションまたは流体コンパートメントが使用されうる。本明細書にいう液滴は、例えば米国特許第7,622,280号に記載のエマルジョン組成物(または2つもしくはそれ以上の不混和性流体の混合物)を含むことができる。液滴は、WO/2010/036352に記載のデバイスによって生成させることができる。本明細書において使用するエマルジョンという用語は、不混和性液体(油と水など)の混合物を指すことができる。油相および/または油中水型エマルジョンでは、反応混合物を水性液滴内にコンパートメント化することができる。エマルジョンは連続油相内に水性液滴を含むことができる。本明細書において提供されるエマルジョンは、液滴が連続水相内の油液滴である水中油型エマルジョンであることができる。本明細書に記載する液滴は、コンパートメント間の混合を防止するようにデザインされ、各コンパートメントは、その内容物を、蒸発および/または他のコンパートメントの内容物との合一から保護する。
【0235】
本明細書に記載する混合物またはエマルジョンは、安定である場合も、不安定である場合もある。エマルジョンは比較的安定であって、合一は最小限であることができる。合一は、小さな液体同士が合わさって次第に大きな液滴を形成するときに起こる。場合によっては、液滴生成装置から生成した液滴の0.00001%未満、0.00005%未満、0.00010%未満、0.00050%未満、0.001%未満、0.005%未満、0.01%未満、0.05%未満、0.1%未満、0.5%未満、1%未満、2%未満、2.5%未満、3%未満、3.5%未満、4%未満、4.5%未満、5%未満、6%未満、7%未満、8%未満、9%未満、または10%未満が、他の液滴と合一する。エマルジョンは、分散相が懸濁液から綿状に析出する過程である凝集(flocculation)も限定的でありうる。
【0236】
約0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400もしくは500ミクロン、または約0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400もしくは500ミクロン未満、または約0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400もしくは500ミクロン超、または少なくとも約0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400もしくは500ミクロンの平均直径を有する液滴を生成させることができる。液滴は約0.001~約500、約0.01~約500、約0.1~約500、約0.1~約100、約0.01~約100、または約1~約100ミクロンの平均直径を有することができる。マイクロチャネルクロスフローフォーカシング(microchannel cross-flow focusing)または物理的撹拌を使ってエマルジョン液滴を作製するマイクロ流体法は、単分散エマルジョンまたは多分散エマルジョンのいずれかを作製することが公知である。液滴は単分散液滴または単分散ベッセルであることができる。液滴のサイズが液滴の平均サイズの±5%を超えて変動しないように、液滴を生成させることができる。場合によっては、液滴のサイズが液滴の平均サイズの±2%を超えて変動しないように、液滴を生成させる。液滴生成装置は、どの液滴も液滴の全集団の平均サイズの±約0.1%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%、または10%を超えてサイズが変動しない液滴の集団を、単一の試料から生成させることができる。
【0237】
液滴またはベッセルは、油相を水性試料に通すことによって形成させることができる。水相は、増幅反応を実施するための緩衝溶液および試薬、例えば細胞、ヌクレオチド、ヌクレオチド類似体、分子バーコード化ポリヌクレオチド、ベッセルバーコード化ポリヌクレオチドプライマー、テンプレート核酸、ならびに酵素、例えばDNAポリメラーゼ、RNAポリメラーゼ、および/または逆転写酵素を含むことができる。いくつかの態様において、水相は、化学的細胞溶解試薬などの細胞溶解試薬を含有することができる。
【0238】
水相は、ビーズなどの固体表面を使ってまたは固体表面を使わずに増幅反応を実施するための緩衝溶液および試薬を含むことができる。緩衝溶液は、約1、5、10、15、20、30、50、100もしくは200mM、または約1、5、10、15、20、30、50、100もしくは200mM超、または約1、5、10、15、20、30、50、100もしくは200mM未満のTrisを含むことができる。場合により、塩化カリウムの濃度は、約10、20、30、40、50、60、80、100、200mM、または約10、20、30、40、50、60、80、100、200mM超、または約10、20、30、40、50、60、80、100、200mM未満であることができる。緩衝溶液は、約15mM Trisおよび50mM KC1を含むことができる。ヌクレオチドは、それぞれ約50、100、200、300、400、500、600もしくは700μM、またはそれぞれ約50、100、200、300、400、500、600もしくは700μM超、またはそれぞれ約50、100、200、300、400、500、600もしくは700μM未満の濃度で、dATP、dCTP、dGTPおよびdTTPを含むデオキシリボヌクレオチド三リン酸分子を含むことができる。場合によっては、約50、100、200、300、400、500、600、もしくは700、800、900、もしくは1000μM、または約50、100、200、300、400、500、600、もしくは700、800、900、もしくは1000μM超、または約50、100、200、300、400、500、600、もしくは700、800、900、もしくは1000μM未満の濃度になるように、dUTPを水相内に加える。場合によっては、塩化マグネシウムまたは酢酸マグネシウム(MgClは約1.0、2.0、3.0、4.0もしくは5.0mM、または約1.0、2.0、3.0、4.0もしくは5.0mM超、または約1.0、2.0、3.0、4.0もしくは5.0mM未満の濃度で水相に加えられる)。MgClの濃度は約3.2mMであることができる。場合により、酢酸マグネシウムまたはマグネシウムが使用される。場合により、硫酸マグネシウムが使用される。
【0239】
BSAまたはウシ皮膚由来のゼラチンなどといった非特異的ブロッキング剤を使用することができ、その場合、ゼラチンまたはBSAはおよそ0.1~0.9%w/vの濃度範囲で存在する。他の考えうるブロッキング剤としては、ベータラクトグロブリン、カゼイン、粉乳、または他の一般的ブロッキング剤を挙げることができる。場合により、BSAおよびゼラチンの好ましい濃度は約0.1%w/vである。
【0240】
水相内の増幅用プライマーは、約0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7もしくは2.0μM、または約0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7もしくは2.0μM超、または約0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7もしくは2.0μM未満の濃度を有しうる。水相内のプライマー濃度は、約0.05~約2、約0.1~約1.0、約0.2~約1.0、約0.3~約1.0、約0.4~約1.0、または約0.5~約1.0μMであることができる。プライマーの濃度は約0.5μMであることができる。PCRにおける標的核酸濃度の受け入れられる範囲としては、約1pg~約500ngが挙げられるが、それに限定されるわけではない。
【0241】
場合により、水相は、限定するわけではないが、非特異的バックグラウンド/ブロッキング核酸(例えばサケ精子DNA)、バイオプリザバティブ(biopreservative)(例えばアジ化ナトリウム)、PCR増強剤(例えばベタイン、トレハロースなど)および阻害剤(例えばRNAse阻害剤)を含む添加剤も含むことができる。他の添加剤としては、例えばジメチルスルホキシド(DMSO)、グリセロール、ベタイン(一)水和物(N,N,N-トリメチルグリシン=[カルボキシメチル]トリメチルアンモニウム)、トレハロース、7-デアザ-2'-デオキシグアノシン三リン酸(dC7GTPまたは7-デアザ-2'-dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、塩化テトラメチルアンモニウム(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば塩化テトラエチルアンモニウム(TEA-C1)および塩化テトラプロピルアンモニウム(TPrA-Cl)、非イオン洗浄剤(例えばTriton X-100、TWEEN(登録商標)20、Nonidet P-40(NP-40))またはPREXCEL-Qを挙げることができる。場合により、水相は、0、1、2、3、4、5、6、7、8、9または10種の異なる添加剤を含むことができる。別の場合には、水相は、少なくとも0、1、2、3、4、5、6、7、8、9または10種の異なる添加剤を含むことができる。
【0242】
場合によっては、非イオン性エチレンオキシド/プロピレンオキシドブロックコポリマーを約0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、または1.0%の濃度で水相に加えることができる。一般的な生物界面活性剤(biosurfactant)としては、Pluronic F-68、TetronicsおよびZonyl FSNなどの非イオン性界面活性剤が挙げられる。Pluronic F-68は約0.5%w/vの濃度で存在することができる。
【0243】
場合によっては、塩化マグネシウムの代わりに硫酸マグネシウムを類似する濃度で使用することができる。さまざまな供給元から市販されている広範な一般的PCR緩衝液を、前記緩衝溶液の代わりに使用することができる。
【0244】
周囲相との液体様界面または固体様界面を呈するベッセルが想定される。例えば、いくつかの態様において、加熱することによって、固体様界面薄膜を有するマイクロカプセルに変換することができる、液体様界面薄膜を有する、ベッセルとして役立つ単分散性の高い液滴が作製されるように、エマルジョンを処方することができ、そのようなマイクロカプセルは、PCR増幅などの反応過程の間、それらの内容物を保持することができるバイオリアクターとして挙動することができる。ベッセル型からマイクロカプセル型への変換は加熱時に起こりうる。例えばそのような変換は、約50℃、60℃、70℃、80℃、90℃または95℃を上回る温度で起こりうる。場合により、この加熱はサーモサイクラーを使って行われる。加熱過程中は、蒸発を防ぐために流体または鉱油の重層を使用することができる。過剰な連続相油は、加熱に先だって除去できる場合も、除去できない場合もある。生体適合性カプセルは、広範囲にわたる熱処理および機械処理で、合一および/または凝集に対して耐性であることができる。変換後は、カプセルを、約3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃もしくは40℃、または約3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃もしくは40℃超、または約3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃もしくは40℃未満で貯蔵することができる。これらカプセル型のベッセルは、生物医学的応用、例えば高分子の、特に核酸もしくはタンパク質の混合物またはその両方を含有する水性生体液の、安定でデジタル化された封入;薬物およびワクチンの送達;生体分子ライブラリー;臨床イメージング応用などに役立ちうる。
【0245】
マイクロカプセルは、1つまたは複数のポリヌクレオチドを含有することができ、合一に、特に高温での合一に、抵抗することができる。したがってPCR増幅反応を極めて高い密度(例えば単位体積あたりの反応数)で行うことができる。場合により、1mlあたり100,000、500,000、1,000,000、1,500,000、2,000,000、2,500,000、5,000,000、または10,000,000を上回る個別の反応を行うことができる。場合により、反応は、単一のウェル内で、例えばマイクロタイタープレートのウェル内で、反応体積間の相互混合を起こさずに行われる。マイクロカプセルは、逆転写、プライマー伸長および/またはPCR反応が起こることを可能にするのに必要な他の構成要素、例えばプライマー、プローブ、dNTP、DNAポリメラーゼまたはRNAポリメラーゼなども含有することができる。これらカプセル型のベッセルは、広範囲にわたる熱処理および機械処理で、合一および/または凝集に対する耐性を呈する。
【0246】
場合により、増幅工程は、マイクロ流体に基づくデジタルPCRまたは液滴デジタルPCRなどのデジタルPCRを実施することによって実行される。
【0247】
いくつかの態様において、ベッセルは液滴であることができる。液滴は、マイクロ流体システムまたはマイクロ流体デバイスを使って生成させることができる。本明細書において使用する場合、「マイクロ」という接頭辞(例えば「マイクロチャネル」または「マイクロ流体」など)は、一般に、約1mm未満の、場合によっては約100ミクロン(マイクロメートル)未満の、幅または直径を有する要素または物品を指す。場合により、前記要素または物品には、流体が流れることのできるチャネルが含まれる。加えて、本明細書にいう「マイクロ流体」は、マイクロスケールのチャネルを少なくとも1つは含むデバイス、装置またはシステムを指す。
【0248】
マイクロ流体システムおよびマイクロ流体デバイスは、さまざまな背景で、典型的には小型化ラボ分析(例えば臨床分析)を背景として、記載されている。他の用途も記載されている。例えば、国際特許出願公開番号WO 01/89788、WO 2006/040551、WO 2006/040554、WO 2004/002627、WO 2008/063227、WO 2004/091763、WO 2005/021 151、WO 2006/096571、WO 2007/089541、WO 2007/081385およびWO 2008/063227。
【0249】
液滴は一般に、ある量の第1試料流体を第2キャリア流体中に含む。液滴を形成させるための当技術分野において公知の技法はいずれも、本発明の方法と共に使用しうる。例示的な方法では、標的材料(例えば免疫細胞)を含有する試料流体の流れを、それが、流動するキャリア流体の2つの対向する流れと交差するように流す。キャリア流体は、試料流体とは不混和性である。流動するキャリア流体の2つの対向する流れとの試料流体の交差は、標的材料を含有する個々の試料液滴(これはベッセルとして役立ちうる)への試料流体の分配をもたらす。
【0250】
キャリア流体は、試料流体とは不混和性の任意の流体でありうる。例示的なキャリア流体は油である。一定の態様において、キャリア流体は界面活性剤を含む。
【0251】
同じ方法を応用して、他の試薬、例えば増幅反応のための試薬、例えばポリメラーゼ連鎖反応(PCR)もしくは多重鎖置換増幅(multi-strand displacement amplification)などの非PCRベースの増幅反応または当業者に公知の他の方法のための試薬を含有する、個々の液滴またはベッセルを作りうる。PCRベースの増幅反応を行うための適切な試薬は当業者には公知であり、DNAポリメラーゼ、フォワードプライマーおよびリバースプライマー、デオキシヌクレオチド三リン酸(dNTP)、ならびに1つまたは複数の緩衝液などがあるが、それらに限定されるわけではない。
【0252】
一定の態様において、流体コンパートメントは、標的材料(例えば免疫細胞および/またはビーズなどの固体支持体)を含む第1流体パーティション(例えば液滴)と第2流体(例えば流体流としてまたは液滴内に)とを用意することによって形成される。第1流体と第2流体とを合体させて、提供される方法のベッセルとして役立ちうる液滴を形成させる。合体は、2つの流体への電場の印加によって達成することができる。一定の態様において、第2流体は、ポリメラーゼ連鎖反応または増幅反応などの増幅反応を行うための試薬を含有する。
【0253】
マイクロ流体操作および高せん断力流体処理(higher-shear fluidic processing)(例えばマイクロ流体キャピラリーでの処理または流路における90度方向転換、例えばバルブによる処理)には、高い機械的安定性が役立ちうる。熱処理前および熱処理後の液滴ベッセルまたはカプセルベッセルは、標準的なピペット操作および遠心分離に対して、機械的に安定であることができる。
【0254】
3. 逆転写
場合により、標的ポリヌクレオチドは、mRNAなどのRNAから逆転写によって調製される。場合により、標的ポリヌクレオチドは、DNAからプライマー伸長により、例えばポリメラーゼを使って調製される。逆転写反応中に、mRNAなどの細胞RNAは逆転写されて相補的DNA(cDNA)を与え、ユニークな分子バーコードが各cDNAに付加されて、細胞の転写産物に相補的なバーコード化一本鎖ポリヌクレオチドを生成する。そのようなバーコード化一本鎖ポリヌクレオチドが、トランスクリプトーム中の転写産物ごとに生成されうる。
【0255】
本明細書に記載する方法は、連携された逆転写-PCR(逆転写-PCR)において使用することができる。例えば、逆転写およびPCRは、2つの相異なる工程で実行することができる。試料mRNAの第1cDNAコピーは、ポリヌクレオチドdTプライマー、配列特異的プライマー、ユニバーサルプライマー、ランダムヘキサマーオリゴヌクレオチドプライマーの混合物、または本明細書に記載する任意のプライマーを使って合成することができる。いくつかの例において、RNAのcDNAコピーは、例えばある細胞の特異的標的RNA分子を捕捉すると共に、同じ細胞のトランスクリプトームに実質上対応するポリヌクレオチドの集合体を捕捉するために、配列特異的プライマーとランダムヘキサマーオリゴヌクレオチドプライマーの混合物とを使用するなど、プライマーの混合物を使って生成させることができる。
【0256】
逆転写とPCRは単一の閉じたベッセル反応において実行することができる。例えば、同じ閉じたベッセル内で、多数のプライマー、すなわち逆転写用の1つまたは複数のプライマーと、PCR用の2つまたはそれ以上のプライマーとを使用することができる。逆転写のプライマーは、第1PCRアンプリコンの位置の3'側で、mRNAに結合することができる。いくつかの態様では、第1アダプターまたは第1アダプターのプールに特異的なプライマーを使って増幅を第1アダプターまたは第1アダプターのプールに実質上限定し、より大きな分子バーコード化cDNAの増幅を制限するために、PCRの条件を変更することができる。必須ではないものの、逆転写プライマーは、mRNAにハイブリダイズさせた場合にRNase Hの基質を形成しないRNA残基または2'-O-メチルRNA塩基などの修飾類似体を含むことができる。
【0257】
逆転写反応を実行するための温度は、使用している逆転写酵素に依存する。場合によっては、耐熱性逆転写酵素が使用され、逆転写反応は、約37℃~約75℃、約37℃~約50℃、約37℃~約55℃、約37℃~約60℃、約55℃~約75℃、約55℃~約60℃、約37℃、または約60℃で実行される。場合によっては、転写された産物の末端に3つまたはそれ以上の非テンプレート末端ヌクレオチドを転移させる逆転写酵素が使用される。
【0258】
本明細書に記載する逆転写反応とPCR反応は、チューブ、マイクロタイタープレート、マイクロ流体デバイス、または好ましくは液滴での実行など、当技術分野において公知のさまざまなフォーマットで実行することができる。
【0259】
逆転写反応は、5μL~100μLの範囲の体積で、または10μL~20μLの反応体積で、実行することができる。液滴では、反応体積は1pL~100nLまたは10pL~1nLの範囲にわたりうる。場合により、逆転写反応は、約1nLまたは1nL未満の体積を有する液滴内で実行される。
【0260】
1つまたは複数の逆転写プライマーを使ってRNAなどの標的ポリヌクレオチドをcDNAに逆転写することができる。1つまたは複数の逆転写プライマーは、RNAの一領域に相補的な領域、例えば定常領域(例えば重鎖もしくは軽鎖定常領域またはmRNAのポリAテール)に相補的な領域を含むことができる。いくつかの態様において、逆転写プライマーは、第1RNAの定常領域に相補的な領域を持つ第1逆転写プライマーおよび第2RNAの定常領域に相補的な領域を持つ第2逆転写プライマーを含むことができる。いくつかの態様において、逆転写プライマーは、それぞれ、第1RNAの定常領域に相補的な領域を持つ第1逆転写プライマーおよび1つまたは複数のRNAの定常領域に相補的な領域を持つ1つまたは複数の逆転写プライマーを含むことができる。
【0261】
いくつかの態様において、逆転写プライマーは、反応におけるプライマー二量体またはプライマー-テンプレートスイッチ産物の指数的増幅によるアーチファクト形成が最小限に抑えられるように修飾することができる。いくつかの態様において、逆転写プライマーは、プライマーの1つまたは複数の塩基の2'-O-メチル化の追加によって修飾される。いくつかの態様において、1つまたは複数の2'-O-メチル化塩基は、プライマー配列の中央近くに位置する。そのような修飾プライマーは、典型的には、2'O-メチル修飾残基と向かい合う塩基を組み込むことができないDNAポリメラーゼを含有する反応において使用される。例示的な2'O-メチル-修飾プライマーをSEQ ID NO:12~22)に示す。
【0262】
いくつかの態様において、逆転写プライマーはランダムヘキサマーオリゴヌクレオチドの混合物である。そのようなプライマーは、ランダムな場所でRNAに結合し、それによって未知配列の逆転写反応をプライミングする。そのような例では、本質的に細胞のトランスクリプトームの逆転写が達成されるように、十分な供給量のランダムヘキサマープライマーが使用される。したがって、そのような態様では、その細胞のトランスクリプトームに対応するcDNAポリヌクレオチドの集合体などといったポリヌクレオチドの集合体が生成する。
【0263】
いくつかの態様において、逆転写プライマーはバーコードを含まない。
【0264】
逆転写プライマーは、RNAの一領域に相補的でない領域を、さらに含むことができる。いくつかの態様において、RNAの一領域に相補的でない領域は、RNAに相補的なプライマーの領域の5'側にある。いくつかの態様において、RNAの一領域に相補的でない領域は、RNAに相補的なプライマーの領域の3'側にある。いくつかの態様において、RNAの一領域に相補的でない領域は、5'オーバーハング領域である。いくつかの態様において、RNAの一領域に相補的でない領域は、増幅および/またはシーケンシング反応のためのプライミング部位、例えばアダプターを含む。本明細書に記載する1つまたは複数のプライマーを使用することで、RNA分子は、当技術分野において公知の適切な試薬を使って逆転写される。
【0265】
特定の態様において、逆転写酵素は非テンプレートターミナルトランスフェラーゼ活性を含むことができる。非テンプレートターミナルトランスフェラーゼ活性を含む逆転写酵素は、テンプレートの端に到達したときに、3つ以上の非テンプレート残基、例えば3つ以上の非テンプレートシトシン残基を付加することができる。いくつかの態様では、Superscript II(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、Maxima(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、Protoscript II(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、マロニー(Maloney)マウス白血病ウイルス逆転写酵素(MMLV-RT)が、この目的のために使用される。いくつかの態様では、HighScriber(商標)逆転写酵素が、この目的のために使用される。いくつかの態様では、ターミナルデオキシヌクレオチジルトランスフェラーゼが、この目的のために使用される。いくつかの態様では、トリ骨髄芽球症ウイルス(AMV)逆転写酵素が、この目的のために使用される。RNAを転写する能力を有する逆転写酵素であって非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。RNAを転写する能力を有するリバースポリメラーゼであって非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。DNAを転写する能力を有するリバースポリメラーゼであって非テンプレートターミナルトランスフェラーゼ活性を有するものは、どれでも使用することができる。
【0266】
逆転写反応、例えば上述したものは、3'タグ付けポリヌクレオチドの存在下で行うことができる。3'タグ付けポリヌクレオチドは、cDNAなどの標的ポリヌクレオチドの3'端に核酸を付加するために使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、標的ポリヌクレオチドの、例えばcDNAの、3'端に核酸を付加するためのテンプレートとして使用されるポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、cDNAなどの標的ポリヌクレオチドの3'端にハイブリダイズするポリヌクレオチドであることができる。3'タグ付けポリヌクレオチドは、cDNAなどの標的ポリヌクレオチドの3'端にハイブリダイズする3'領域、例えば3'末領域を含有するポリヌクレオチドであることができる。例えば、3'タグ付けポリヌクレオチドは、3つ以上の非テンプレート残基にアニールするセグメントなどといったセグメントを含むことができる。いくつかの態様において、3'タグ付けポリヌクレオチドは分子バーコードポリヌクレオチドである。いくつかの態様において、3'タグ付けポリヌクレオチドは分子バーコードを含むことができる。いくつかの態様において、3'タグ付けポリヌクレオチドは、その3'端に、逆転写酵素によって作製される鎖に相補的であってそこにアニールされる3'リボグアノシン残基またはその類似体(rGrGrG)(RNA塩基)を含むことができる。いくつかの態様では、リボグアノシンの代わりに3つ以上のグアニン残基(RNAヌクレオチドの代わりにDNAヌクレオチド)を使用することができる。いくつかの態様において、3'タグ付けポリヌクレオチドは、逆転写酵素によって作製される鎖に相補的であってそこにアニールされる、3'端の1つまたは2つのリボグアノシン残基と3'端のリボグアノシン残基またはその類似体(rGrGG)とを含むことができる。
【0267】
cDNA鎖のCCCに3'タグ付けポリヌクレオチドがアニールすると、逆転写酵素は、そのタグ付けポリヌクレオチドへとcDNAを伸長し続けることができ、それによって、分子バーコードまたはその相補体を、反応中のポリヌクレオチドの、例えばcDNAの、標的集団に取り付ける。例えば、3'タグ付けポリヌクレオチドは、標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域を含有するポリヌクレオチドであることができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、cDNAなどの標的ポリヌクレオチドに対して相補的でない領域を含むことができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は分子バーコードを含むことができる。標的ポリヌクレオチドの3'端にハイブリダイズする3'領域の5'側にある領域は、ベッセルバーコード化ポリヌクレオチドまたはその相補体に相補的な領域を含むことができる。別の実験では、テンプレートスイッチングを別個の反応で実施することができる。例えば、逆転写反応後に3'タグ付けポリヌクレオチドを付加することができ、逆転写酵素またはポリメラーゼなどの酵素を使ってタグ付けポリヌクレオチドへと伸長することができる。タグ付けポリヌクレオチドは、ベッセル中の各分子上にユニークな縮重分子バーコードを内包することができるので、ベッセル中の各cDNAを分子バーコードでユニークにタグ付けすることができる。いくつかの態様において、テンプレートスイッチングは、逆転写反応を行うのと同時に実施することができる。
【0268】
逆転写反応は3'タグ付けポリヌクレオチドの存在下で行うことができる。3'タグ付けポリヌクレオチドは、シーケンシングプライマーをアニールさせるために使用することができるP7セグメントを含むことができる。3'タグ付けポリヌクレオチドは、ベッセルバーコードまたは分子バーコードを含むことができる。3'タグ付けポリヌクレオチドは、3'端上に、逆転写酵素によって作製される鎖に相補的であってそこにアニールされうる3'リボグアノシン残基(rGrGrG)(RNA塩基)を含むことができる。こうして、ベッセルバーコードおよび分子バーコードを、逆転写酵素により、この同じエマルジョンにおいて、cDNAの末端に付加することができる。いくつかの態様では、リボグアノシンの代わりにグアニン残基(RNAヌクレオチドの代わりにDNAヌクレオチド)を使用することができる。cDNA鎖のCCCに3'タグ付けポリヌクレオチドがアニールすると、逆転写酵素はcDNAを3'タグ付けポリヌクレオチドへと伸長し続け、それによって1つの反応においてすべてのcDNAに分子バーコード化タグを作る。分子バーコード化cDNAの一領域に3'タグ付けポリヌクレオチドがアニールすると、逆転写酵素またはポリメラーゼが、分子バーコード化cDNAをもう一つの3'タグ付けポリヌクレオチドへと伸長し続け、それによって1つの反応においてすべてのcDNAにベッセルバーコード化タグを作る。
【0269】
いくつかの態様において、テンプレートスイッチングは、逆転転写反応を行うことができる時に同時に行うのではなく、別個の反応で行うことができる。いくつかの態様では、逆転写反応後に3'タグ付けポリヌクレオチドを付加することができ、逆転写酵素またはポリメラーゼなどの酵素を使って、同様にタグ付けポリヌクレオチドへと伸長することができる。3'タグ付けポリヌクレオチドは、各単一分子上にユニークな縮重分子バーコードを内包することができるので、各cDNAを分子バーコードでユニークにタグ付けすることができる。3'タグ付けポリヌクレオチドは単一ベッセルからの各単一分子上に同じ縮重ベッセルバーコードを内包することができるので、各cDNAをそのベッセルにユニークなベッセルバーコードでタグ付けすることができる。
【0270】
いくつかの態様において、テンプレートスイッチング分子、例えばバーコード(例えば分子バーコード)を含有するテンプレートスイッチオリゴヌクレオチドには、アーチファクトの形成を最小限に抑えるために修飾塩基を組み入れることができる。いくつかの例において、テンプレートスイッチオリゴヌクレオチドは、逆転写はされうるがDNAポリメラーゼによって複製されることはできない2'デオキシウリジンを、含有することができる。いくつかの態様では、リボグアノシンをテンプレートスイッチオリゴヌクレオチドに組み入れることができる。いくつかの態様において、テンプレートスイッチオリゴヌクレオチドは、逆転写酵素またはDNAポリメラーゼによる伸長を防ぐために、3'端を修飾することができる。そのような修飾として、プライマー伸長の阻止を達成するための3'デオキシ修飾、3'リン酸修飾、3'アミノ修飾および3'アルキル修飾が挙げられる。
【0271】
4. ポリメラーゼ連鎖反応(PCR)
RNA分子の逆転写反応を実施した後に、結果として生じた単一バーコード化cDNA分子をベッセルバーコードで同時にバーコード化し、1つまたは複数のPCR反応によって増幅することで、1つまたは複数のアンプリコンを得ることができる。いくつかの例において、PCRは、mRNA転写産物配列に対応するコーディング配列を含有し逆転写酵素反応中に生成したcDNA鎖に相補的である二重バーコード化cDNA鎖を生成させるために使用される。PCRのための酵素およびプライマーデザインは公知であり、本明細書にはそのような試薬の非限定的な例を記載する。提供される方法におけるPCRには、そのような試薬はどれでも選択して、使用することができる。
【0272】
場合により、PCR反応は、1pL~100nL、好ましくは10pL~1nLの反応体積範囲を有する液滴中で行われる。場合により、PCR反応は、約1nLまたは1nL未満の体積を有する液滴中で実行される。場合により、逆転写反応およびPCR反応は1pL~100nLまたは10pL~1nLの反応体積範囲を有する同じ液滴中で実行される。場合により、逆転写反応およびPCR反応は、約1nLもしくは1nL未満の体積または約1pLもしくは1pL未満の体積を有する液滴中で実行される。場合により、逆転写反応とPCR反応は、異なる液滴中で実行される。場合により、逆転写反応およびPCR反応は、それぞれが1pL~100nLまたは10pL~1nLの反応体積範囲を有する複数の液滴中で実行される。場合により、逆転写反応およびPCR反応は、それぞれが約1nLまたは1nL未満の体積を有する複数の液滴中で実行される。
【0273】
場合により、第1PCR反応は、1pL~100nL、好ましくは10pL~1nLの反応体積範囲を有する第1液滴中で行われ、第2PCR反応は、1pL~100nL、好ましくは10pL~1nLの反応体積範囲を有する第2液滴で行われる。場合により、第1PCR反応は、約1nLまたは1nL未満の体積を有する第1液滴で行われ、第2PCR反応は約1nLまたは1nL未満の体積を有する第2液滴中で行われる。
【0274】
場合により、第1PCR反応および第2PCR反応は、それぞれが1pL~100nLまたは10pL~1nLの反応体積範囲を有する複数の液滴中で実行される。場合により、第1PCR反応および第2PCR反応は、それぞれが約1nLまたは1nL未満の体積を有する複数の液滴中で実行される。
【0275】
本明細書において提供される方法のいくつかの態様では、選択された配列の増幅を達成し、他の配列の増幅を最小限に抑えるために、反応の条件を変更することができる。そのような変更には、PCR熱サイクリング中の融解温度などの温度を変化させることを含めることができる。例えば、短いオリゴヌクレオチドを選択的に増幅するために、「コールド」(cold)サイクルのPCRを使用することができる。「コールド」PCRサイクルは「ホット」(hot)PCRサイクルとはその変性温度が異なる。「コールド」サイクルのPCRは、長い二本鎖配列よりも容易に変性する短い配列がなるべく増幅されるように、低い温度で変性を達成する。したがって「コールド」サイクルのPCRは、長い配列の増幅を制限しつつ短い配列を増幅するために使用される。いくつかの例では、所望のアンプリコンを生成させるために、「コールド」サイクルと「ホットサイクル」との組合せを使用する。
【0276】
いくつかの態様において、PCRの変性工程、プライミング工程および/または伸長工程の継続時間は、反応体積中の特定配列を選択的にまたはなるべく増幅するために、変更することができる。いくつかの例において、PCR増幅に使用されるプライマーは、特定条件下でのPCR増幅を低減または増強するために、選択または修飾することができる。いくつかの例では、オリゴヌクレオチドプライマーが低温では不活性だが、ひとたび高温に曝されると活性になるように、熱に不安定な付属基を、大半の塩基の3'端にホスホジエステル結合を介して付加することができる。いくつかの例では、オリゴヌクレオチドが低温、例えば逆転写酵素反応が起こる温度ではプライマー伸長能を有しないが、例えばPCRの前またはPCR中にそれより高い温度に曝されると活性になるように、熱に不安定な付属基に3'端で連結されたオリゴヌクレオチドが、提供される方法において使用される。
【0277】
RNA分子の逆転写反応またはゲノム分子のプライマー伸長を実施した後、ベッセルバーコードを含有するオリゴヌクレオチドをポリメラーゼ連鎖反応で増幅することで、分子バーコード化ポリヌクレオチドに付け加えられるべき複数のコピーを生成させる。いくつかの例において、ベッセルバーコードを含有するオリゴヌクレオチドは、逆転写酵素反応中のプライマー伸長は防止するが、PCR中はプライマー伸長とそれに続く増幅が可能になるように、熱に不安定な付属基の付加によって3'端が修飾されたプライマーを使って増幅される。いくつかの態様では、ベッセルバーコードを含有するオリゴヌクレオチドの増幅が、本明細書に記載するように「コールド」熱サイクリングを使って実行された。
【0278】
RNA分子の逆転写反応を実施した後に、結果として生じるcDNA分子を分子バーコードおよびベッセルバーコードでバーコード化し、1つまたは複数のPCR反応によって、例えば第1PCR反応および/または第2PCR反応によって、増幅することができる。第1PCR反応および/または第2PCR反応は、プライマーのペアまたは複数のプライマーペアを利用することができる。第1PCR反応および/または第2PCR反応では複数のフォワード/リバースプライマーおよび1つのリバースプライマーを利用することができる。第1PCR反応および/または第2PCR反応は複数のフォワード/リバースプライマーおよび1つのフォワードプライマーを利用することができる。複数のフォワード/リバースプライマーのうちの第1プライマーおよび/または第2プライマーは、cDNA分子またはバーコード化cDNA分子に相補的な領域を含有するフォワード/リバースプライマーであることができる。複数のフォワード/リバースプライマーのうちの第1プライマーおよび/または第2プライマーは、バーコード化cDNA分子に相補的な領域を含有するフォワード/リバースプライマーであることができる。
【0279】
いくつかの態様において、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、前記複数のフォワード/リバースプライマー中のフォワード/リバースプライマーのそれぞれがcDNAまたはバーコード化cDNAのVセグメントの1つまたは複数の上流または下流領域に相補的な領域を含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントの上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントの1つまたは複数の別の上流または下流領域に相補的な領域を含む1つまたは複数の別のフォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのVセグメントの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのVセグメントの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマー、cDNAまたはバーコード化cDNAのVセグメントの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマー、およびcDNAまたはバーコード化cDNAのVセグメントの第3上流または下流領域に相補的な領域を含む第3フォワード/リバースプライマーなどを含む。前記複数のフォワード/リバースプライマー中のプライマーを使って、試料中の免疫B細胞またはT細胞などといった細胞によって発現されるすべてのVセグメントの考えうるすべての上流または下流領域にアニールさせることができる。
【0280】
いくつかの態様において、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、前記複数のフォワード/リバースプライマー中のフォワード/リバースプライマーのそれぞれがcDNAまたはバーコード化cDNAのCセグメントの1つまたは複数の上流または下流領域に相補的な領域を含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントの上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントの1つまたは複数の別の上流または下流領域に相補的な領域を含む1つまたは複数の別のフォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマーと、cDNAまたはバーコード化cDNAのCセグメントの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、cDNAまたはバーコード化cDNAのCセグメントの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマー、cDNAまたはバーコード化cDNAのCセグメントの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマー、およびcDNAまたはバーコード化cDNAのCセグメントの第3上流または下流領域に相補的な領域を含む第3フォワード/リバースプライマーなどを含む。前記複数のフォワード/リバースプライマー中のプライマーを使って、試料中の免疫B細胞またはT細胞などといった細胞によって発現されるすべてのCセグメントの考えうるすべての上流または下流領域にアニールさせることができる。
【0281】
いくつかの態様において、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、前記複数のフォワード/リバースプライマー中のフォワード/リバースプライマーのそれぞれがバーコード化cDNAの分子バーコードの1つまたは複数の上流または下流領域に相補的な領域を含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードの上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、バーコード化cDNAの分子バーコードの1つまたは複数の別の上流または下流領域に相補的な領域を含む1つまたは複数の別のフォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマーと、バーコード化cDNAの分子バーコードの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAの分子バーコードの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマー、バーコード化cDNAの分子バーコードの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマー、およびバーコード化cDNAの分子バーコードの第3上流または下流領域に相補的な領域を含む第3フォワード/リバースプライマーなどを含む。前記複数のフォワード/リバースプライマーを使って、試料中の免疫B細胞またはT細胞などといった細胞によって発現されるすべての分子バーコードの考えうるすべての上流または下流領域にアニールさせることができる。
【0282】
いくつかの態様において、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、前記複数のフォワード/リバースプライマー中のフォワード/リバースプライマーのそれぞれがバーコード化cDNAのベッセルバーコードの1つまたは複数の上流または下流領域に相補的な領域を含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAのベッセルバーコードの上流または下流領域に相補的な領域を含むフォワード/リバースプライマーと、バーコード化cDNAのベッセルバーコードの1つまたは複数の別の上流または下流領域に相補的な領域を含む1つまたは複数の別のフォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAのベッセルバーコードの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマーと、バーコード化cDNAのベッセルバーコードの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマーとを含む。例えば複数のフォワード/リバースプライマーは、バーコード化cDNAのベッセルバーコードの第1および/または第2上流または下流領域に相補的な領域を含む第1および/または第2フォワード/リバースプライマー、バーコード化cDNAのベッセルバーコードの第2上流または下流領域に相補的な領域を含む第2フォワード/リバースプライマー、およびバーコード化cDNAのベッセルバーコードの第3上流または下流領域に相補的な領域を含む第3フォワード/リバースプライマーなどを含む。前記複数のフォワード/リバースプライマー中のプライマーを使って、試料中の免疫B細胞またはT細胞などといった細胞によって発現されるすべてのベッセルバーコードの考えうるすべての上流または下流領域にアニールさせることができる。
【0283】
前記複数のフォワード/リバースプライマー中のフォワード/リバースプライマーは、RNAの一領域に相補的でない領域をさらに含む。いくつかの態様において、RNAの一領域に相補的でない領域は、RNAに相補的であるフォワード/リバースプライマーの領域(すなわちVセグメントの上流または下流領域)の5'側にある。いくつかの態様において、RNAの一領域に相補的でない領域は、RNAに相補的であるフォワード/リバースプライマーの領域の3'側にある。いくつかの態様において、RNAの一領域に相補的でない領域は5'オーバーハング領域である。いくつかの態様において、RNAの一領域に相補的でない領域は、増幅および/または第2シーケンシング反応のためのプライミング部位を含む。いくつかの態様において、RNAの一領域に相補的でない領域は、増幅および/または第3シーケンシング反応のためのプライミング部位を含む。いくつかの態様において、RNAの一領域に相補的でない領域は、第2および第3シーケンシング反応のためのプライミング部位を含む。いくつかの態様において、第2および第3シーケンシング反応のためのプライミング部位の配列は同じである。cDNA分子は、本明細書に記載する1つまたは複数のフォワード/リバースプライマーおよびリバースプライマーを使用し、当技術分野において公知の適切な試薬を使って、増幅される。いくつかの態様において、ある領域はRNAの一領域、例えば定常領域またはmRNAのポリAテールに相補的である。
【0284】
5. バーコード
バーコードは分子バーコードまたはベッセルバーコードであることができる。いくつかの態様において、分子バーコードまたはベッセルバーコードなどのバーコードは、それぞれ、2~36ヌクレオチド、4~36ヌクレオチド、または6~30ヌクレオチド、または8~20ヌクレオチド、2~20ヌクレオチド、4~20ヌクレオチド、または6~20ヌクレオチドの範囲内の長さを有することができる。一定の局面において、あるセット内のバーコードの融解温度は、互いに10℃以内、互いに5℃以内、または互いに2℃以内である。一定の局面において、あるセット内のバーコードの融解温度は、互いに10℃以内ではないか、互いに5℃以内ではないか、または互いに2℃以内ではない。別の局面において、バーコードは、最小交差ハイブリダイゼーションセット(minimally cross-hybridizing set)のメンバーである。例えば、そのようなセットの各メンバーのヌクレオチド配列は、どのメンバーも、ストリンジェントなハイブリダイゼーション条件下で、他のどのメンバーの相補体とも安定な二重鎖を形成することができないほど十分に、そのセットの他のどのメンバーのヌクレオチド配列とも異なる。いくつかの態様において、最小交差ハイブリダイゼーションセットの各メンバーのヌクレオチド配列は、他のどのメンバーのヌクレオチド配列とも、少なくとも2つのヌクレオチドで異なっている。バーコード技術は、Winzeler et al.(1999)Science 285:901、Brenner(2000)Genome Biol.1:1、Kumar et al.(2001)Nature Rev.2:302;、Giaever et al.(2004)Proc.Natl.Acad.Sci.USA 101:793、Eason et al.(2004)Proc.Natl.Acad.Sci.USA 101:1 1046およびBrenner(2004)Genome Biol.5:240に記載されている。
【0285】
本明細書にいう分子バーコードは、単一細胞または単一ベッセルからの単一分子にユニークな情報、あるいは2つもしくはそれ以上の単一細胞または2つもしくはそれ以上の単一ベッセルからの複数の分子もしくは分子ライブラリーのうちの2つもしくはそれ以上の分子にユニークな情報を含む。本明細書にいうベッセルバーコードは、異なる単一細胞または異なる単一ベッセルからのポリヌクレオチドと比較して、ある単一細胞もしくは単一ベッセルからのポリヌクレオチドにユニークである情報を含む。いくつかの態様においてユニークな情報はユニークなヌクレオチド配列を含む。例えば分子バーコードまたはベッセルバーコードの配列は、分子バーコードまたはベッセルバーコードを含むヌクレオチドのユニークなまたはランダムな配列の実体および順序を決定することによって決定することができる。いくつかの態様において、第1アダプターはベッセルバーコード配列を含む。
【0286】
いくつかの態様において、ユニークな情報は、標的ポリヌクレオチドの配列を同定するためには使用することができない。例えば、分子バーコードを1つの標的ポリヌクレオチドに取り付けることはできるが、その分子バーコードを使って、それが取り付けられた標的ポリヌクレオチドを決定することはできない。いくつかの態様において、ユニークな情報は、標的ポリヌクレオチドの配列の実体に結びつけられた既知配列ではない。例えば、ベッセルバーコードを1つまたは複数の標的ポリヌクレオチドに取り付けることはできるが、そのベッセルバーコードを使って、それが取り付けられた1つまたは複数の標的ポリヌクレオチドを決定することはできない。いくつかの態様において、ユニークな情報はヌクレオチドのランダムな配列を含む。いくつかの態様において、ユニークな情報は、ポリヌクレオチド上のヌクレオチドの1つまたは複数のユニークな配列を含む。いくつかの態様において、ユニークな情報は縮重ヌクレオチド配列または縮重バーコードを含む。縮重バーコードは、可変的なヌクレオチド塩基組成またはヌクレオチド塩基配列を含むことができる。例えば縮重バーコードはランダムな配列であることができる。いくつかの態様において、分子バーコードまたはベッセルバーコードの相補配列もまた、分子バーコード配列またはベッセルバーコード配列である。
【0287】
分子バーコードまたはベッセルバーコードは、任意の長さのヌクレオチドを含むことができる。例えば分子バーコードまたはベッセルバーコードは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを含むことができる。例えば分子バーコードまたはベッセルバーコードは、最大で約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを含むことができる。いくつかの態様において、分子バーコードまたはベッセルバーコードは特定のヌクレオチド長を有する。例えば、分子バーコードまたはベッセルバーコードは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。
【0288】
いくつかの態様において、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは少なくとも約2つのヌクレオチドを有する。例えば、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。いくつかの態様において、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは最大で約1000個のヌクレオチドを有する。例えば、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは、最大で約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。いくつかの態様において、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは同じヌクレオチド長を有する。例えば、複数の分子バーコードまたはベッセルバーコード中の各分子バーコードまたはベッセルバーコードは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。いくつかの態様において、複数の分子バーコードまたはベッセルバーコード中の1つまたは複数の分子バーコードまたはベッセルバーコードは、異なる長さのヌクレオチドを有する。例えば複数の分子バーコードまたはベッセルバーコード中の1つまたは複数の第1分子バーコードまたはベッセルバーコードは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、もしくは1000個のヌクレオチドを有することができ、または少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、もしくは1000個のヌクレオチドを有することができ、複数の分子バーコードまたはベッセルバーコード中の1つまたは複数の第2分子バーコードまたはベッセルバーコードは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを有することができて、前記1つまたは複数の第1分子バーコードまたはベッセルバーコードのヌクレオチドの数は、前記1つまたは複数の第2分子バーコードまたはベッセルバーコードとは異なる。
【0289】
分子バーコードの数は、複数のベッセル中の標識されるべき分子の総数を上回りうる。ベッセルバーコードの数は、複数のベッセル中の標識されるべき分子の総数を上回りうる。例えば、分子バーコードまたはベッセルバーコードの数は、複数のベッセル中の標識されるべき分子の総数の少なくとも約2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍であることができる。
【0290】
異なる分子バーコードの数は、複数のベッセル中の標識されるべき分子の総数を上回りうる。いくつかの態様において、異なる分子バーコードの数は、複数のベッセル中の標識されるべき分子の総数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0291】
単一ベッセル中の異なる分子バーコードの数は、単一ベッセル中の標識されるべき異なる分子の数を上回りうる。いくつかの態様において、単一ベッセル中の異なる分子バーコードの数は、単一ベッセル中の標識されるべき異なる分子の数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0292】
異なるベッセルバーコードの数は複数のベッセル中の標識されるべき分子の総数より少なくてもよい。いくつかの態様において、異なるベッセルバーコードの数は、複数のベッセル中の標識されるべき分子の総数の、少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍、少ない。
【0293】
単一ベッセル中のベッセルバーコード化ポリヌクレオチド分子からの増幅産物分子の数は、単一ベッセル中の標識されるべき異なる分子の数を上回りうる。いくつかの態様において、単一ベッセル中のベッセルバーコード化ポリヌクレオチド分子からの増幅産物分子の数は、単一ベッセル中の標識されるべき異なる分子の数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
【0294】
単一ベッセル中のベッセルバーコード化ポリヌクレオチド分子の数は、単一ベッセル中の標識されるべき異なる分子の数より少なくてもよい。いくつかの態様において、単一ベッセル中のベッセルバーコード化ポリヌクレオチド分子の数は、単一ベッセル中の標識されるべき異なる分子の数の、少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍、少ない。
【0295】
単一ベッセル中のベッセルバーコード化ポリヌクレオチド分子の数は1分子であることができる。単一ベッセル中の未増幅ベッセルバーコード化ポリヌクレオチド分子の数は1分子であることができる。
【0296】
いくつかの態様において、異なる分子バーコードのうちの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、同じ濃度を有する。いくつかの態様において、異なるベッセルバーコードのうちの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、同じ濃度を有する。
【0297】
いくつかの態様において、異なる分子バーコードのうちの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、異なる濃度を有する。いくつかの態様において、異なるベッセルバーコードのうちの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、異なる濃度を有する。
【0298】
分子バーコードまたはベッセルバーコードの集団中の分子バーコードまたはベッセルバーコードは、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000またはそれ以上の異なる配列を有することができる。例えば、ある集団中の分子バーコードまたはベッセルバーコードは、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000またはそれ以上の異なる配列を有することができる。したがって複数の分子バーコードまたはベッセルバーコードを使って、1つまたは複数のポリヌクレオチド、例えば標的ポリヌクレオチドから、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000またはそれ以上の異なる配列を生成させることができる。例えば、複数の分子バーコードまたはベッセルバーコードを使って、1つまたは複数のポリヌクレオチド、例えば標的ポリヌクレオチドから、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012またはそれ以上の異なる配列を生成させることができる。例えば、複数の分子バーコードまたはベッセルバーコードを使って、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012またはそれ以上の標的ポリヌクレオチドから、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012またはそれ以上の異なる配列を生成させることができる。
【0299】
いくつかの態様では、1つまたは複数の分子バーコードを使って、配列がグループ分けまたはビニングされる。いくつかの態様では、1つまたは複数の分子バーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は同じ分子バーコードを含有する。いくつかの態様では、1つまたは複数の分子バーコードまたはベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列はアンプリコンセットを含む。いくつかの態様では、1つまたは複数の分子バーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は、複数の配列であって、当該複数の配列が生成する元となったポリヌクレオチドが、増幅反応において同じポリヌクレオチド分子に由来したものである配列を含む。
【0300】
いくつかの態様では、1つまたは複数のベッセルバーコードを使って配列がグループ分けまたはビニングされる。いくつかの態様では、1つまたは複数のベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は同じベッセルバーコードを含有する。いくつかの態様では、1つまたは複数のベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は1つまたは複数のアンプリコンセットを含む。いくつかの態様では、1つまたは複数のベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は複数の配列であって、当該複数の配列が生成する元となったポリヌクレオチドが、単一ベッセルまたは単一細胞からのポリヌクレオチドに由来したものである配列を含む。
【0301】
いくつかの態様では、1つまたは複数の分子バーコードおよびベッセルバーコードを使って配列がグループ分けまたはビニングされる。いくつかの態様では、1つまたは複数の分子バーコードおよびベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は同じ分子バーコードおよび同じベッセルバーコードを含有する。いくつかの態様では、1つまたは複数の分子バーコードおよびベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は1つまたは複数のアンプリコンセットを含む。いくつかの態様では、1つまたは複数の分子バーコードおよびベッセルバーコードを使って配列がグループ分けまたはビニングされ、各ビン中の配列は複数の配列であって、当該複数の配列が生成する元となったポリヌクレオチドが、増幅反応において同じポリヌクレオチドに由来し、かつ同じ単一細胞または単一ベッセルに由来したものである配列を含む。いくつかの態様において、1つまたは複数の分子バーコードおよびベッセルバーコードは、配列をアライメントするために使用されない。
【0302】
いくつかの態様において、1つまたは複数の分子バーコードは、配列をアライメントするために使用されない。いくつかの態様において、1つまたは複数の分子バーコードは、配列をアライメントするために使用される。いくつかの態様において、1つまたは複数の分子バーコードは配列をグループ分けまたはビニングするために使用され、標的特異的な領域は配列をアライメントするために使用される。いくつかの態様において、1つまたは複数のベッセルバーコードは、配列をアライメントするために使用されない。いくつかの態様において、1つまたは複数のベッセルバーコードは、配列をアライメントするために使用される。いくつかの態様において、1つまたは複数のベッセルバーコードは配列をグループ分けまたはビニングするために使用され、標的特異的領域は配列をアライメントするために使用される。いくつかの態様において、1つまたは複数の分子バーコードおよびベッセルバーコードは、配列をアライメントするために使用される。いくつかの態様において、1つまたは複数の分子バーコードおよびベッセルバーコードは配列をグループ分けまたはビニングするために使用され、標的特異的領域は配列をアライメントするために使用される。
【0303】
いくつかの態様において、アライメントされる配列は同じ分子バーコードを含有する。いくつかの態様において、アライメントされる配列は同じベッセルバーコードを含有する。いくつかの態様において、アライメントされる配列は同じ分子バーコードおよびベッセルバーコードを含有する。いくつかの態様において、1つまたは複数の分子バーコードまたはベッセルバーコードは配列をアライメントするために使用され、アライメントされる配列はアンプリコンセットからの2つまたはそれ以上の配列を含む。いくつかの態様において、1つまたは複数の分子バーコードまたはベッセルバーコードは配列をアライメントするために使用され、アライメントされる配列は、複数の配列であって、当該複数の配列が生成する元となったポリヌクレオチドが、増幅反応において同じポリヌクレオチド分子に由来したものである配列を含む。いくつかの態様において、1つまたは複数の分子バーコードまたはベッセルバーコードは配列をアライメントするために使用され、アライメントされる配列は複数の配列であって、当該複数の配列が生成する元となったポリヌクレオチドが、単一細胞または単一ベッセルに由来したものである配列を含む。
【0304】
C.アダプターライゲーション
アダプターライゲーションに先だって、二重バーコード化ポリヌクレオチドまたはアンプリコンを精製しかつ/またはサイズ選択することができる。二重バーコード化ポリヌクレオチドのサイズは、選択したシーケンシング方法を最適化するために選択することができる。望ましいポリヌクレオチドサイズは、シーケンシング機器の限界および具体的シーケンシング応用によって決まる。いくつかの例において、望ましいポリヌクレオチドサイズは0塩基対(bp)~100,000bp(100キロベース(kb))、50bp~50kb、100bp~25kbである。いくつかの態様では、ここで生成させたポリヌクレオチドを、ショートリードシーケンサーを使ってシーケンシングする。一般に、ショートリードシーケンサーに最適なポリヌクレオチドサイズは、長さが約20塩基対(bp)~2000bp、50bp~1500bp、50bp~1250bp、50bp~1000bp、50bp~750bp、50bp~500bp、100bp~1500bp、100bp~1250bp、100bp~1000bp、100bp~750bp、100bp~500bp、200bp~1500bp、200bp~1250bp、200bp~1000bp、200bp~750bpまたは250bp~500bpの範囲にある。
【0305】
いくつかの態様では、ここで生成させたポリヌクレオチドを、ロングリードシーケンサーを使ってシーケンシングする。一般に、ショートリードシーケンサーに最適なポリヌクレオチドサイズは、長さが約1キロベース(kb)~100kb、例えば1kb~50kb、5kb~25kb、5kb~20kb、またはおよそ1kb、5kb、10kb、15kb、もしくは20kbの範囲にある。
【0306】
望ましいサイズのポリヌクレオチドの集合体を生成させるために、逆転写反応またはプライマー伸長反応の条件を変更することによって、例えば反応の伸長工程の時間を変更することによって、ポリヌクレオチドの集合体をサイズ調節することができる。いくつかの態様において、ポリヌクレオチドの集合体は、物理的方法(すなわち音響せん断(acoustic shearing)および音波処理)または酵素的方法(すなわち非特異的エンドヌクレアーゼカクテルおよびトランスポザーゼタグメンテーション反応)によって、望ましい長さにフラグメント化またはサイズ調節することができる。望ましいサイズのポリヌクレオチドは、変性ゲル電気泳動などのアガロースゲル電気泳動、サイズ排除法、または自動化された方法もしくは市販のキットによって単離することができる(Quail et al,Electrophoresis(2012)33(23):3521-3528、Duhaime et al.,Environ Microbiol(2012)14(9):2526-2537)。
【0307】
いくつかの態様では、サイズ選択に先だって、アフィニティー精製などによって二本鎖二重バーコード化ポリヌクレオチドを精製する。いくつかの態様では、サイズ選択に先だって、二本鎖二重バーコード化ポリヌクレオチドを変性させる。いくつかの態様では、DNAの相補鎖間の水素結合を破壊することによって、二本鎖二重バーコード化ポリヌクレオチドを変性させる。いくつかの態様では、酸もしくは塩基、高濃度の無機塩、有機溶媒(例えばアルコールまたはクロロホルム)、放射線または熱の適用によって、二本鎖DNAの変性が達成される。いくつかの態様では、ホルムアミド、グアニジン、サリチル酸ナトリウム、ジメチルスルホキシド(DMS)、プロピレングリコール、尿素、またはNaOHなどの化学的作用物質への曝露によって、二本鎖DNAの変性が達成される。いくつかの態様では、二本鎖DNA分子をNaOH、例えば0.1M NaOHで処理することで、一本鎖分子を生成させる。
【0308】
サイズ選択および/または精製に続いて、本方法によって生成させたポリヌクレオチドであってユニバーサルプライミング配列、ベッセルバーコードおよび分子バーコードを持つ第1アダプターを含有するアダプタータグ付き二重バーコード化ポリヌクレオチドに、第2アダプターを付加することができる。このアダプターは、アダプタータグ付き二重バーコード化ポリヌクレオチドの増幅またはシーケンシングに使用することができるユニバーサルプライミング配列を含有する。これらのアダプターは任意の公知ユニバーサルプライミング配列またはそのフラグメントを含有することができる。例示的なユニバーサルプライミング配列として、P7、C7、P5またはC5プライミング配列が挙げられる。
【0309】
第2アダプターの付加は任意の公知の方法を使って達成することができる。アダプターは一本鎖ポリヌクレオチドまたは二本鎖ポリヌクレオチドに付加することができる。いくつかの例において、アダプターは一本鎖ポリヌクレオチドに付加される。別の例では、アダプター、例えば二本鎖アダプターが、二本鎖ポリヌクレオチドに付加される。いくつかの態様では、リガーゼを使って一本鎖アダプターをライゲートする。例えば、耐熱性Appリガーゼ(NEB)またはCircLigase II(Epicentre)を使って、第2アダプターを一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドに付加することができる。
【0310】
いくつかの態様では、縮重スプリントアダプターをアニールさせることによって、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドに、第2アダプターを付加することができる。例えば、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの一端にスプリントアダプター二重鎖を付加することによって、第2アダプターを付加することができる。そのようなスプリントアダプター二重鎖は、分子の一端に縮重オーバーハングを有する対合した二本鎖オリゴヌクレオチドを含有する。縮重オーバーハングは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20塩基であることができる。分子のオーバーハング部分の縮重ヌクレオチドを、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの、第1アダプター配列の端とは反対側の端にアニールさせる。本方法のいくつかの態様では、3'オーバーハングを持つスプリントアダプター二重鎖を、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの、第1アダプターとは反対側の3'端にアニールさせる。本方法のいくつかの態様では、5'オーバーハングを持つスプリントアダプター二重鎖を、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの、第1アダプターとは反対側の5'端にアニールさせる。平滑末端/TAリガーゼ(blunt/TA ligase)などのリガーゼは、スプリントアダプター二重鎖と一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドとのアニーリングを促進することができる。
【0311】
本方法のいくつかの態様では、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの、アダプターをアニールさせる端部に、非テンプレートヌクレオチドの酵素的付加を追加することができる。いくつかの態様では、相補的塩基対合を使って非テンプレートヌクレオチドに第2アダプターを直接アニールさせる。いくつかの態様では、スプリントアダプター二重鎖を非テンプレートヌクレオチドにアニールさせることで、分子のその端部へのアダプターの付加を達成することができる。いくつかの態様において、アダプターは、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの3'端に付加される。いくつかの態様において、アダプターは、一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドの5'端に付加される。平滑末端/TAリガーゼなどのリガーゼは、第2アダプターまたはスプリントアダプター二重鎖と一本鎖アダプタータグ付き二重バーコード化ポリヌクレオチドとのアニーリングを促進することができる。
【0312】
第2アダプターは、ユニバーサルプライミング配列またはユニバーサルプライミング部位を含有するか、相補的配列へのアニーリングにとって十分な、ユニバーサルプライミング配列またはユニバーサルプライミング部位の連続する一部分を含有する。ユニバーサルプライミング配列またはユニバーサルプライミング部位は、ユニバーサルプライマーまたはその連続する一部分に相補的であるオリゴヌクレオチド配列を含有する。例示的なユニバーサルプライマーは下記D項に列挙する。
【0313】
D.増幅およびシーケンシング
上記の手順で生成した、細胞の1つもしくは複数の標的ポリヌクレオチド配列および/または細胞のトランスクリプトームの全部もしくは一部に対応する二重バーコード化ポリヌクレオチドであって、二重バーコード化ポリヌクレオチドの反対の端またはその近傍に第1アダプターおよび第2アダプターを持つものを含有する試料は、二重バーコード化ポリヌクレオチドライブラリーの多重コピーを生成させるために、増幅することができる。増幅はシーケンシングに先だって実施することができる。いくつかの態様では、ライブラリー中の1つまたは複数の配列を増幅するために、シーケンシングアダプターを持つプライマーを使用することができる。いくつかの態様では、選択された転写産物を増幅し、シーケンシング用に調製することができる。
【0314】
いくつかの態様では、シーケンシングアダプターを持つアダプタープライマーを使って、ライブラリー中のすべての転写産物を増幅し、それをシーケンシング用に調製する。いくつかの態様では、シーケンシングアダプターを持つアダプタープライマーと、シーケンシングアダプターを持つ標的特異的プライマーとを使って、標的遺伝子を増幅し、標的遺伝子をシーケンシング用に調製する。いくつかの態様では、シーケンシングアダプターを持つ細胞特異的プライマー、例えばベッセルバーコードに対するプライマーと、シーケンシングアダプターを持つベッセルバーコードとは転写産物の反対の端にあるアダプターに対するプライマーとを使って、選択された細胞のトランスクリプトームを増幅し、それをシーケンシング用に調製する。図2に、本明細書に記載する選択されたプライマーの使用による、生成したライブラリー中のポリヌクレオチドの例示的な選択された増幅を図示する。
【0315】
1. 増幅
標的ポリヌクレオチドを含有する試料は、完全なmRNA転写産物またはそのフラグメントに対応するDNAを含むことができ、それを増幅することができる。場合により、対応するmRNA転写産物またはそのフラグメントの平均長は、約100、200、300、400、500もしくは800塩基対未満、または約5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190もしくは200ヌクレオチド未満、または約1、2、5、10、20、30、40、50、60、70、80、90、100キロベース未満であることができる。場合によっては、比較的短いテンプレートからの標的配列、例えば約40、45、50、55、60、65、70、75、80、85、90、95または100塩基であるテンプレートを含有する試料が増幅される。
【0316】
増幅反応は1つまたは複数の添加剤を含むことができる。場合により、前記1つまたは複数の添加剤は、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン(一)水和物(N,N,N-トリメチルグリシン=[カルボキシメチル]トリメチルアンモニウム)、トレハロース、7-デアザ-2'-デオキシグアノシン三リン酸(dC7GTPまたは7-デアザ-2'-dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、塩化テトラメチルアンモニウム(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば塩化テトラエチルアンモニウム(TEA-C1)および塩化テトラプロピルアンモニウム(TPrA-Cl)、非イオン洗浄剤(例えばTriton X-100、TWEEN(登録商標)20、Nonidet P-40(NP-40))またはPREXCEL-Qである。場合により、増幅反応は、0、1、2、3、4、5、6、7、8、9または10種の異なる添加剤を含む。別の場合には、増幅反応は、少なくとも0、1、2、3、4、5、6、7、8、9、または10種の異なる添加剤を含む。
【0317】
反応体積(例えば液滴)中に含まれる試料に対して、熱サイクリング反応を実施することができる。液滴は多分散系または好ましくは単分散系であることができ、当業者は、液滴を、撹拌または超音波処理によって生成させるか、またはT型混合流路もしくは他の手段によってマイクロ流体的に生成させることができる。密度は20,000液滴/40μL(1nL液滴)、200,000液滴/40μL(100pL液滴)を上回りうる。液滴は、熱サイクリング中も無傷のままであることができる。液滴は、約10,000液滴/μL、100,000液滴/μL、200,000液滴/μL、300,000液滴/μL、400,000液滴/μL、500,000液滴/μL、600,000液滴/μL、700,000液滴/μL、800,000液滴/μL、900,000液滴/μL、または1,000,000液滴/μLの密度において、熱サイクリング中も無傷のままであることができる。別の場合において、熱サイクリング中に2つまたはそれ以上の液滴が合一することはない。別の場合において、熱サイクリング中に合一する液滴は100以下または1,000以下である。
【0318】
限定するわけではないが、例えば大腸菌(E.coli)DNAポリメラーゼ、大腸菌DNAポリメラーゼ1のクレノウフラグメント、T7 DNAポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、Pfu DNAポリメラーゼ、Vent DNAポリメラーゼ、バクテリオファージ29、REDTaq(商標)ゲノムDNAポリメラーゼ、またはシークエナーゼなど、プライマー伸長を触媒する任意のDNAポリメラーゼを使用することができる。場合によっては耐熱性DNAポリメラーゼが使用される。反応を95℃に2分間加熱してからポリメラーゼを添加するかまたは第1サイクルの最初の加熱時まではポリメラーゼを不活性に保っておくことができるホットスタートPCRも、実施することができる。ホットスタートPCRは非特異的増幅を最小限に抑えるために使用することができる。
【0319】
DNAの増幅には、例えば約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44もしくは45サイクル、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44もしくは45サイクル超、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44もしくは45サイクル未満など、任意のPCRサイクル数を使用することができる。増幅サイクル数は、約1~45、10~45、20~45、30~45、35~45、10~40、10~30、10~25、10~20、10~15、20~35、25~35、30~35、または35~40であることができる。
【0320】
標的核酸の増幅は任意の公知手段によって実施することができる。標的核酸はポリメラーゼ連鎖反応(PCR)または等温DNA増幅によって増幅することができる。使用することができるPCR技法の例としては、定量PCR、定量蛍光PCR(QF-PCR)、マルチプレックス蛍光PCR(MF-PCR)、リアルタイムPCR(逆転写-PCR)、単一細胞PCR、制限断片長多型PCR(PCR-RFLP)、PCR-RFLP/逆転写-PCR-RFLP、ホットスタートPCR、ネステッドPCR、インサイチューポロニー(polony)PCR、インサイチューローリングサークル増幅(RCA)、デジタルPCR(dPCR)、液滴デジタルPCR(ddPCR)、ブリッジPCR、ピコリットルPCRおよびエマルジョンPCRが挙げられるが、それらに限定されるわけではない。他の適切な増幅方法として、リガーゼ連鎖反応(LCR)、転写増幅、分子内反転プローブ(molecular inversion probe)(MIP)PCR、自家持続配列複製法、標的ポリヌクレオチド配列の選択的増幅(selective amplification of target polynucleotide sequences)、コンセンサス配列プライムド(consensus sequence primed)ポリメラーゼ連鎖反応(CP-PCR)、無作為プライムド(arbitrarily primed)ポリメラーゼ連鎖反応(AP-PCR)、縮重ポリヌクレオチドプライムドPCR(DOP-PCR)および核酸ベース配列増幅(nucleic acid based sequence amplification)(NABSA)が挙げられる。ここで使用することができる他の増幅方法として、米国特許出願第5,242,794号、同第5,494,810号、同第4,988,617号および同第6,582,938号に記載されているもの、ならびにQベータレプリカーゼ媒介(Q beta replicase mediated)RNA増幅が挙げられる。増幅は等温増幅、例えば等温線形増幅であることができる。
【0321】
いくつかの態様において、増幅は固体支持体上では行われない。いくつかの態様において、増幅は液滴中の固体支持体上では行われない。いくつかの態様において、増幅が液滴中で行われない場合に、増幅は固体支持体上で行われる。
【0322】
増幅反応は1つまたは複数の添加剤を含むことができる。いくつかの態様において、前記1つまたは複数の添加剤は、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン(一)水和物(N,N,N-トリメチルグリシン=[カルボキシメチル]トリメチルアンモニウム)、トレハロース、7-デアザ-2'-デオキシグアノシン三リン酸(dC7GTPまたは7-デアザ-2'-dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、塩化テトラメチルアンモニウム(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば塩化テトラエチルアンモニウム(TEA-C1)および塩化テトラプロピルアンモニウム(TPrA-Cl)、非イオン洗浄剤(例えばTriton X-100、TWEEN(登録商標)20、Nonidet P-40(NP-40))またはPREXCEL-Qである。いくつかの態様において、増幅反応は、0、1、2、3、4、5、6、7、8、9、または10種の異なる添加剤を含むことができる。別の場合には、増幅反応は、少なくとも0、1、2、3、4、5、6、7、8、9、または10種の異なる添加剤を含むことができる。
【0323】
一般に、増幅反応では1つまたは複数のプライマーペアを使用することができる。この場合、あるプライマーペアのうちの一方のプライマーはフォワードプライマーであることができ、あるプライマーペアのうちの一方のプライマーはリバースプライマーであることができる。
【0324】
場合により、増幅反応では第1プライマーペアを使用することができる。この場合、第1ペアのうちの一方のプライマーは、第1標的ポリヌクレオチド分子の配列に相補的なフォワードプライマーであることができ、第1ペアのうちの一方のプライマーは、第1標的ポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第1標的座位は第1配列と第2配列との間に存在しうる。いくつかの態様において、第1標的座位はVH配列またはVα配列またはVγ配列を含む。
【0325】
場合により、増幅反応では第2プライマーペアを使用することができる。この場合、第2ペアのうちの一方のプライマーは、第2標的ポリヌクレオチド分子の第1配列に相補的なフォワードプライマーであることができ、第2ペアのうちの一方のプライマーは、第2標的ポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第2標的座位は第1配列と第2配列との間に存在しうる。いくつかの態様において、第2標的座位はVL配列またはVβ配列またはVδ配列を含む。
【0326】
場合により、増幅反応では第3プライマーペアを使用することができる。この場合、第3ペアのうちの一方のプライマーは、第3標的ポリヌクレオチド分子の第1配列に相補的なフォワードプライマーであることができ、第3ペアのうちの一方のプライマーは、第3標的ポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第3標的座位は第1配列と第2配列との間に存在しうる。いくつかの態様において、第3標的座位は分子バーコードまたはベッセルバーコードなどのバーコードを含む。
【0327】
場合により、増幅反応では複数のプライマーペアを使用することができる。いくつかの実施例において、あるプライマーペアのうちの一方のプライマーは、第1アダプター配列に相補的なフォワードプライマーであることができ、そのプライマーペアのうちの一方のプライマーは第2アダプター配列に対するリバースプライマーであることができる。いくつかの実施例において、あるプライマーペアのうちの一方のプライマーは、第2アダプター配列に相補的なフォワードプライマーであることができ、そのプライマーペアのうちの一方のプライマーは第1アダプター配列に対するリバースプライマーであることができる。
【0328】
フォワードプライマーおよびリバースプライマーの長さは、標的ポリヌクレオチドおよび標的座位の配列に依存しうる。例えば、フォワードプライマーおよびリバースプライマーの長さおよび/またはTを最適化することができる。場合により、プライマーは約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長であるか、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長を上回るか、または約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長未満であることができる。場合により、プライマーは約15~約20、約15~約25、約15~約30、約15~約40、約15~約45、約15~約50、約15~約55、約15~約60、約20~約25、約20~約30、約20~約35、約20~約40、約20~約45、約20~約50、約20~約55または約20~約60ヌクレオチド長である。
【0329】
プライマーは、テンプレートポリヌクレオチドに結合する前は、一本鎖DNAであることができる。場合により、プライマーは最初は二本鎖配列を含む。適当なプライマー長はそのプライマーの意図する用途に依存しうるが、約6~約50ヌクレオチドまたは約15~約35ヌクレオチドの範囲でありうる。短いプライマー分子は、テンプレートとの十分に安定なハイブリッド複合体を形成するために、一般に、より低い温度を必要としうる。いくつかの態様において、プライマーは、テンプレート核酸の正確な配列を反映する必要はなく、それでもテンプレートとハイブリダイズするには十分に相補的であることができる。場合により、プライマーは、テンプレートポリヌクレオチドに結合する前は、部分的に二本鎖であることができる。二本鎖配列を持つプライマーは、塩基数が約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19もしくは20、または約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19もしくは20超、または約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19もしくは20未満であるヘアピンループを有することができる。プライマーの二本鎖部分は、約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49もしくは50塩基対、または約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49もしくは50塩基対超、または約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49もしくは50塩基対未満、または少なくとも約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49もしくは50塩基対であることができる。与えられた標的配列の増幅に適したプライマーのデザインは当技術分野において周知である。
【0330】
プライマーには、プライマーの検出または固定化を可能にするが、プライマーの基本的性質(例えばDNA合成の開始点としての作用)を変化させない追加の特徴を組み込むことができる。例えばプライマーは、標的核酸にはハイブリダイズしないが、増幅産物のクローニングまたはさらなる増幅またはシーケンシングを容易にする追加の核酸配列を、5'端に含有することができる。例えば、追加の配列は、アダプターであることができるユニバーサルプライマー結合部位などのプライマー結合部位を含むことができる。プライマーのうち、テンプレートに対して十分に相補的であってハイブリダイズする領域を、本明細書では、ハイブリダイズ領域と呼ぶ場合がある。
【0331】
また場合により、本明細書に記載する方法および組成物において利用されるプライマーは、1つまたは複数のユニバーサルヌクレオシドを含むことができる。ユニバーサルヌクレオシドの非限定的な例は、米国特許出願公開第2009/0325169号および第2010/0167353号に記載されているように、5-ニトロインドールおよびイノシンである。
【0332】
プライマーは、二次構造および自己ハイブリダイゼーションを避けるために、公知のパラメータに従ってデザインすることができる。異なるプライマーペアは、ほぼ同じ温度で、例えば別のプライマーペアから1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃または10℃以内の温度で、アニールし、融解することができる。場合により、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000個超またはそれ以上のプライマーが、最初に使用される。そのようなプライマーは本明細書に記載する標的ポリヌクレオチドにハイブリダイズすることができる。
【0333】
プライマーは、当技術分野において周知の方法を使用し、例えば限定するわけではないが適当な配列のクローニングおよび直接的化学合成を含むさまざまな方法によって、調製することができる(Narang et al,Methods Enzymol.68:90(1979)、Brown et al,Methods Enzymol.68:109(1979))。プライマーは商業的供給源から入手することもできる。プライマーは同一の融解温度を有することができる。プライマーは同一でない融解温度を有することができる。プライマーの長さは、所望の融解温度を持つプライマーを作製するために、5'端または3'端で延長または短縮することができる。プライマーペアのプライマーの一方は他方のプライマーより長くてもよい。プライマーペア内のプライマーの3'アニーリング長は異なりうる。また、プライマーペアの配列と長さが所望の融解温度を与えるように、各プライマーペアのアニーリング位置もデザインすることができる。25塩基対より小さなプライマーの融解温度を決定するための等式は、ウォレス則(Wallace Rule)(T=2(A+T)+4(G+C))である。コンピュータプログラムを使ってプライマーをデザインすることもできる。各プライマーのTM(融解温度またはアニーリング温度)はソフトウェアプログラムを使って計算することができる。プライマーのアニーリング温度は、任意の増幅サイクル後に、例えば限定するわけではないが第1、2、3、4、5サイクル後、第6~10サイクル後、第10~15サイクル後、第15~20サイクル後、第20~25サイクル後、第25~30サイクル後、第30~35サイクル後、または第35~40サイクル後に、再計算して、増加させることができる。初期増幅サイクル後は、プライマーの5'側の半分が、関心対象の各座位からの産物に組み込まれうるので、各プライマーの5'側の半分および3'側の半分の両配列に基づいてTMを再計算することができる。
【0334】
本明細書に開示する方法の1つまたは複数の反応を行う工程は、1つまたは複数のプライマーの使用を含みうる。本明細書にいうプライマーは、テンプレートポリヌクレオチドにハイブリダイズするのに十分に相補的である二本鎖、一本鎖、または部分的に一本鎖のポリヌクレオチドを含む。プライマーは、テンプレートポリヌクレオチドに結合する前は、一本鎖DNAであることができる。いくつかの態様において、プライマーは最初は二本鎖配列を含む。プライマー部位は、テンプレートのうち、プライマーがハイブリダイズする領域を含む。いくつかの態様において、プライマーは、テンプレート指向核酸合成(template-directed nucleic acid synthesis)の開始点として作用する能力を有する。例えばプライマーは、4種の異なるヌクレオチドおよび重合剤または重合酵素、例えばDNAポリメラーゼもしくはRNAポリメラーゼまたは逆転写酵素を添加すれば、テンプレート指向核酸合成を開始することができる。
【0335】
プライマーペアは2つのプライマー、すなわちテンプレート配列の5'端にハイブリダイズする5'上流領域を持つ第1プライマーと、テンプレート配列の3'端の相補物にハイブリダイズする3'下流領域を持つ第2プライマーとを含む。プライマーセットは、2つまたはそれ以上のプライマー、すなわちテンプレート配列または複数のテンプレート配列の5'端にハイブリダイズする5'上流領域を持つ第1プライマーまたは第1の複数プライマーと、テンプレート配列または複数のテンプレート配列の3'端の相補物にハイブリダイズする3'下流領域を持つ第2プライマーまたは第2の複数プライマーとを含む。
【0336】
いくつかの態様において、プライマーは標的特異的配列を含む。いくつかの態様において、プライマーは試料バーコード配列を含む。いくつかの態様において、プライマーはユニバーサルプライミング配列を含む。いくつかの態様において、プライマーはPCRプライミング配列を含む。いくつかの態様において、プライマーは、ポリヌクレオチドの増幅を開始させるために使用されるPCRプライミング配列を含む。(Dieffenbach,PCR Primer:A Laboratory Manual,2nd Edition(Cold Spring Harbor Press,New York(2003))。ユニバーサルプライマー結合部位またはユニバーサルプライマー結合配列は、ポリヌクレオチドおよび/またはアンプリコンへのユニバーサルプライマーの取り付けを可能にする。ユニバーサルプライマーは当技術分野において周知であり、-47F(M13F)、alfaMF、AOX3'、AOX5'、BGHr、CMV-30、CMV-50、CVMf、LACrmt、lambda gt 10F、lambda gt 10R、lambda gt 11F、lambda gt 11R、M13 rev、M13Forward(-20)、M13Reverse、male、pQEproseq、pQE、pA-120、pet4、pGAP Forward、pGLRVpr3、pGLpr2R、pKLAC14、pQEFS、pQERS、pucUl、pucU2、reversA、seqIREStam、seqIRESzpet、seqori、seqPCR、seqpIRES-、seqpIRES+、seqpSecTag、seqpSecTag+、seqretro+PSI、SP6、T3-prom、T7-prom、およびT7-termInvが挙げられるが、それらに限定されるわけではない。
【0337】
本明細書において、取り付けるとは、共有結合的相互作用および非共有結合的相互作用の両方または一方を指しうる。ユニバーサルプライマー結合部位へのユニバーサルプライマーの取り付けは、ポリヌクレオチドおよび/またはアンプリコンの増幅、検出および/またはシーケンシングに使用しうる。ユニバーサルプライマー結合部位は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900または1000個のヌクレオチドまたは塩基対を含みうる。別の一例において、ユニバーサルプライマー結合部位は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000個のヌクレオチドまたは塩基対を含む。いくつかの態様において、ユニバーサルプライマー結合部位は、1~10、10~20、10~30または10~100個のヌクレオチドまたは塩基対を含む。いくつかの態様において、ユニバーサルプライマー結合部位は、約1~90、1~80、1~70、1~60、1~50、1~40、1~30、1~20、1~10、2~90、2~80、2~70、2~60、2~50、2~40、2~30、2~20、2~10、1~900、1~800、1~700、1~600、1~500、1~400、1~300、1~200、1~100、2~900、2~800、2~700、2~600、2~500、2~400、2~300、2~200、2~100、5~90、5~80、5~70、5~60、5~50、5~40、5~30、5~20、5~10、10~90、10~80、10~70、10~60、10~50、10~40、10~30、10~20、10~10、5~900、5~800、5~700、5~600、5~500、5~400、5~300、5~200、5~100、10~900、10~800、10~700、10~600、10~500、10~400、10~300、10~200、10~100、25~900、25~800、25~700、25~600、25~500、25~400、25~300、25~200、25~100、100~1000、100~900、100~800、100~700、100~600、100~500、100~400、100~300、100~200、200~1000、200~900、200~800、200~700、200~600、200~500、200~400、200~300、300~1000、300~900、300~800、300~700、300~600、300~500、300~400、400~1000、400~900、400~800、400~700、400~600、400~500、500~1000、500~900、500~800、500~700、500~600、600~1000、600~900、600~800、600~700、700~1000、700~900、700~800、800~1000,800~900、または900~1000個のヌクレオチドまたは塩基対を含む。
【0338】
プライマーは、プライマー伸長産物の合成におけるその使用に適合した長さを有することができる。プライマーは、8~200ヌクレオチド長のポリヌクレオチドであることができる。プライマーの長さはテンプレートポリヌクレオチドの配列およびテンプレートの座位に依存しうる。例えば、プライマーまたはプライマーセットの長さおよび/または融解温度(TM)は最適化することができる。場合により、プライマーは約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長であるか、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長を上回るか、または約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59もしくは60ヌクレオチド長未満であることができる。いくつかの態様において、プライマーは、約8~100ヌクレオチド長、例えば10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40、7~9、12~15、15~20、15~25、15~30、15~45、15~50、15~55、15~60、20~25、20~30、20~35、20~45、20~50、20~55、または20~60ヌクレオチド長およびそれらの間の任意の長さである。いくつかの態様において、プライマーは最大で約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95または100ヌクレオチド長である。
【0339】
一般に、指数増幅反応では1つまたは複数のプライマーペアを使用することができる。この場合、あるプライマーペアのうちの一方のプライマーはフォワードプライマーであることができ、あるプライマーペアのうちの一方のプライマーはリバースプライマーであることができる。いくつかの態様において、指数増幅反応では第1プライマーペアを使用することができる。この場合、第1ペアのうちの一方のプライマーは、第1テンプレートポリヌクレオチド分子の配列に相補的なフォワードプライマーであることができ、第1ペアのうちの一方のプライマーは、第1テンプレートポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第1テンプレート座位は第1配列と第2配列との間に存在しうる。いくつかの態様において、増幅反応では第2プライマーペアを使用することができる。この場合、第2ペアのうちの一方のプライマーは、第2標的ポリヌクレオチド分子の第1配列に相補的なフォワードプライマーであることができ、第2ペアのうちの一方のプライマーは、第2標的ポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第2標的座位は第1配列と第2配列との間に存在しうる。いくつかの態様において、第2標的座位は可変軽鎖抗体配列を含む。いくつかの態様において、増幅反応では第3プライマーペアを使用することができる。この場合、第3ペアのうちの一方のプライマーは、第3テンプレートポリヌクレオチド分子の第1配列に相補的なフォワードプライマーであることができ、第3ペアのうちの一方のプライマーは、第3テンプレートポリヌクレオチド分子の第2配列に相補的なリバースプライマーであることができ、第3テンプレート座位は第1配列と第2配列との間に存在しうる。
【0340】
1つまたは複数のプライマーは、複数のテンプレートポリヌクレオチドの少なくとも一部分にアニールすることができる。1つまたは複数のプライマーは複数のテンプレートポリヌクレオチドの3'端および/または5'端にアニールすることができる。1つまたは複数のプライマーは複数のテンプレートポリヌクレオチドの内部領域にアニールすることができる。内部領域は、複数のテンプレートポリヌクレオチドの3'端または5'端から少なくとも約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900または1000ヌクレオチドであることができる。1つまたは複数のプライマーは、ある決まったプライマーパネルを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数のカスタムプライマーを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数の対照プライマーを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数のハウスキーピング遺伝子プライマーを含むことができる。1つまたは複数のプライマーは、ユニバーサルプライマーを含むことができる。ユニバーサルプライマーはユニバーサルプライマー結合部位にアニールすることができる。いくつかの態様において、1つまたは複数のカスタムプライマーは、SBC、標的特異的領域、その相補体、またはそれらの任意の組合せにアニールする。1つまたは複数のプライマーは、ユニバーサルプライマーを含むことができる。1つもしくは複数の標的ポリヌクレオチドもしくはテンプレートポリヌクレオチドを増幅するために、または1つもしくは複数の標的ポリヌクレオチドもしくはテンプレートポリヌクレオチドのプライマー伸長、逆転写、線形拡大(linear extension)、非指数増幅、指数増幅、PCR、もしくは他の任意の増幅法を実施するために、1つまたは複数のプライマープライマーをデザインすることができる。
【0341】
標的特異的領域は、少なくとも約1、2、3、4、5、6、7、8,9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39,40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270,280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900または1000個のヌクレオチドまたは塩基対を含むことができる。別の一例において、標的特異的領域は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000個のヌクレオチドまたは基対を含む。いくつかの態様において、標的特異的領域は、約5~10、10~15、10~20、10~30、15~30、10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40、7~9、12~15、15~20、15~25、15~30、15~45、15~50、15~55、15~60、20~25、20~30、20~35、20~45、20~50、20~55、20~60、2~900、2~800、2~700、2~600、2~500、2~400、2~300、2~200、2~100、25~900、25~800、25~700、25~600、25~500、25~400、25~300、25~200、25~100、100~1000、100~900、100~800、100~700、100~600、100~500、100~400、100~300、100~200、200~1000、200~900、200~800、200~700、200~600、200~500、200~400、200~300、300~1000、300~900、300~800、300~700、300~600、300~500、300~400、400~1000、400~900、400~800、400~700、400~600、400~500、500~1000、500~900、500~800、500~700、500~600、600~1000、600~900、600~800、600~700、700~1000、700~900、700~800、800~1000、800~900、または900~1000個のヌクレオチドまたは塩基対を含む。
【0342】
プライマーは、二次構造および自己ハイブリダイゼーションを避けるために、公知のパラメータに従ってデザインすることができる。いくつかの態様において、異なるプライマーペアは、ほぼ同じ温度で、例えば別のプライマーペアから1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃または10℃以内の温度で、アニールし、融解することができる。いくつかの態様において、複数のプライマーのうち、1つまたは複数のプライマーは、ほぼ同じ温度で、例えば当該複数のプライマーのうちの別のプライマーペアから1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃または10℃以内の温度で、アニールし、融解することができる。いくつかの態様において、複数のプライマーのうち、1つまたは複数のプライマーは、当該複数のプライマーのうちの別のプライマーとは異なる温度でアニールおよび融解することができる。
【0343】
本明細書に記載する方法の1つまたは複数の工程のための複数のプライマーは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000種、または最大で約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000種、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000種の異なるプライマーを含む複数のプライマーを含むことができる。例えば、複数のプライマー中の各プライマーは、異なる標的特異的またはテンプレート特異的な領域または配列を含むことができる。
【0344】
図2に、本明細書において提供される方法によって生成する本明細書において提供されるポリヌクレオチドライブラリーの増幅のための例示的増幅を図示する。本明細書において提供される例示的方法において、シーケンシングのためのライブラリーの増幅では、次世代シーケンシングなどのシーケンシングに使用されるシーケンシングアダプターに連結されたプライマーを使用する。そのようなプライマーは公知であり、本明細書に記載する。シーケンシングアダプタータグ付きプライマーは、以下に記載する例示的応用において使用される。
【0345】
いくつかの態様において、標的遺伝子はシーケンシングのために増幅される。いくつかの態様において、標的遺伝子は、ポリヌクレオチドの一端にあるアダプター配列に対するプライマーと、全長標的ポリペプチドまたはその選択された一部分がシーケンシングされるような位置にある標的特異的プライマーとを使って増幅される。いくつかの実施例において、標的配列は、単一細胞または複数の細胞からのライブラリー中に存在しうる。いくつかの態様では、ポリヌクレオチドのユニバーサルプライミング配列に特異的なプライマーと1つまたは複数の標的特異的プライマーとを使って、1つまたは複数の標的配列を増幅する。いくつかの態様では、それぞれ記載のユニバーサル配列および標的特異的プライマーを使って、2つまたはそれ以上の標的配列を増幅する。いくつかの態様では、2つまたはそれ以上の標的配列、例えばある細胞内で共発現される2つの標的配列、例えば二量体(例えばヘテロ二量体)として発現される標的配列が、結びつけられる。したがって提供される態様を使用すれば、ペアリングされた配列情報、例えばペアリングされた全長配列情報を、提供される方法を使って得ることができる。
【0346】
いくつかの態様では、第1アダプターのユニバーサルプライミング配列に特異的なプライマーと第2アダプターのユニバーサルプライミング配列に特異的なプライマーとを使って、調製済みのポリヌクレオチドライブラリー全体をシーケンシングのために増幅することができる。ライブラリーのポリヌクレオチドの両端にあるユニバーサルプライミング配列に特異的なプライマーを使った、本明細書において提供されるポリヌクレオチドライブラリーの増幅は、そのライブラリーを作るために使用したすべての細胞のトランスクリプトームもしくはゲノムまたはその一部分を与えることができる。そのようなトランスクリプトーム情報は、後にマイニングに使用することができ、かつ/または試料の調製に使った細胞の集団内でのいくつかの遺伝子の発現を(転写産物レベルで)評価するために使用することができる。いくつかの態様では、すべての細胞のトランスクリプトーム情報を解析し、ライブラリーを作製する元となった細胞の全集団から類似する転写産物プロファイルを持つ細胞のクラスターを生成させるために使用することができる。
【0347】
いくつかの態様では、ベッセルバーコード配列に特異的なプライマーと、第2アダプター中に存在するユニバーサルプライミング部位に特異的なプライマーとを使って、単一細胞からのポリヌクレオチドを特異的に増幅し、シーケンシングすることができる。そのような態様では、1つまたは複数の標的配列が上述のように増幅され、関心対象であると同定された標的配列において、ベッセルバーコードが同定される。同じ細胞からのポリヌクレオチドはすべて同じベッセルバーコードでバーコード化されているので、本方法のこの応用は、選択された1つまたは複数の細胞からのすべてのポリヌクレオチドの配列情報を与える。次に、選択された1つまたは複数の細胞からのライブラリー中のすべてのポリヌクレオチドを増幅すれば、1つまたは複数の特定標的配列を発現する1つまたは複数の細胞の発現プロファイルまたは遺伝子プロファイルを得ることができる。
【0348】
2. シーケンシング
本明細書に記載する方法または方法工程のうちの1つまたは複数を実施した後、生成したポリヌクレオチドのライブラリーをシーケンシングすることができる。
【0349】
シーケンシングは、当技術分野において公知の任意のシーケンシング方法によって実施することができる。いくつかの態様において、シーケンシングは、ハイスループットで実施することができる。適切な次世代シーケンシング技術には、454Life Sciencesプラットフォーム(Roche、コネティカット州ブラッドフォード)(Margulies et al.,Nature,437,376-380(2005))、Illuminaのゲノムアナライザー(Genome Analyzer)、GoldenGateメチル化アッセイ(Methylation Assay)またはInfiniumメチル化アッセイ、すなわちInfiniumヒトメチル化27Kビーズアレイ(HumanMethylation 27K BeadArray)またはVeraCode GoldenGateメチル化アレイ(Illumina、カリフォルニア州サンディエゴ、Bibkova et al,Genome Res.16,383-393(2006)および米国特許第6,306,597号、同第7,598,035号、同第7,232,656号)、またはライゲーションによるDNAシーケンシング(DNA Sequencing by Ligation)、SOLiDシステム(Applied Biosystems/Life Technologies、米国特許第6,797,470,7,083,917号、同第7,166,434号、同第7,320,865号、同第7,332,285号、同第7,364,858号、および同第7,429,453号)、またはHelicos True Single Molecule DNAシーケンシング技術(Harris et al,Science,320,106-109(2008)および米国特許第7,037,687号、同第7,645,596号、同第7,169,560号および同第7,769,400号)、Pacific Biosciencesの単一分子リアルタイム(single molecule,real-time)(SMRT(商標))技術およびシーケンシング(Soni et al,Clin.Chem.53,1996-2001(2007))などがある。これらの系では、試料から単離された多くのポリヌクレオチドのマルチプレックス化された並列シーケンシングが可能である(Dear,Brief Funct.Genomic Proteomic,1(4),397-416(2003)およびMcCaughan et al,J.Pathol,220,297-306(2010))。
【0350】
いくつかの態様において、ポリヌクレオチドは、色素修飾プローブのライゲーションによるシーケンシング、パイロシーケンシング、または単一分子シーケンシングによってシーケンシングされる。ポリヌクレオチドの配列の決定は、Helioscope(商標)単一分子シーケンシング、Nanopore DNAシーケンシング、Lynx Therapeuticsの超並列シグネチャーシーケンシング(Massively Parallel Signature Sequencing)(MPSS)、454パイロシーケンシング、単一分子リアルタイム(Single Molecule real time)(RNAP)シーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent(商標)イオン半導体シーケンシング、単一分子SMRT(商標)シーケンシング、ポロニーシーケンシング、DNAナノボールシーケンシングおよびVisiGen Biotechnologiesアプローチなどのシーケンシング法によって実施しうる。あるいは、ポリヌクレオチド配列の決定では、例えば限定するわけではないが、Illuminaが提供するGenome Analyzer IIx、HiSeqおよびMiSeq、Pacific Biosciences(カリフォルニア州)が提供するPacBio RSシステムおよびSolexaシーケンサーなどの単一分子リアルタイム(SMRT(商標))技術、Helicos Inc.(マサチューセッツ州ケンブリッジ)が提供するHeliScope(商標)シーケンサーなどのTrue Single Moleculeシーケンシング(tSMS(商標))技術を含むシーケンシングプラットフォームを使用してもよい。シーケンシングはMiSeqシーケンシングを含むことができる。シーケンシングはHiSeqシーケンシングを含むことができる。いくつかの態様において、ポリヌクレオチドの配列を決定する工程は、ペアエンドシーケンシング、ナノポアシーケンシング、ハイスループットシーケンシング、ショットガンシーケンシング、ダイターミネーターシーケンシング、マルチプルプライマー(multiple-primer)DNAシーケンシング、プライマーウォーキング、サンガージデオキシシーケンシング、マキサム-ギルバート(Maxim-Gilbert)シーケンシング、パイロシーケンシング、true single moleculeシーケンシングまたはそれらの任意の組合せを含む。あるいは、ポリヌクレオチド配列を電子顕微鏡法または化学感応性電界効果トランジスタ(chemFET)アレイによって決定することもできる。
【0351】
ある方法は、ライブラリー中の1つまたは複数のポリヌクレオチドをシーケンシングする工程をさらに含むことができる。ある方法は、ライブラリー中の1つまたは複数のポリヌクレオチド配列、配列リード、アンプリコン配列またはアンプリコンセット配列を互いにアライメントする工程をさらに含むことができる。
【0352】
本明細書にいうアライメントする工程は、配列リードなどの試験配列を1つまたは複数の他の試験配列、リファレンス配列、またはそれらの組合せと比較する工程を含む。いくつかの態様において、アライメントする工程は、複数の配列またはアライメントされた配列からコンセンサス配列を決定するために使用することができる。いくつかの態様において、アライメントする工程は、それぞれが同一の分子バーコードまたはベッセルバーコードを有する複数の配列からコンセンサス配列を決定する工程を含む。いくつかの態様において、比較のためにアライメントされる配列の長さは、リファレンス配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つまたはそれ以上の配列の実際の比較は、周知の方法によって、例えば数学的アルゴリズムを使って達成することができる。そのような数学的アルゴリズムの限定でない例は、Karlin,S.and Altschul,S.,Proc.Natl.Acad.Sci.USA,90-5873-5877(1993)に記載されている。そのようなアルゴリズムは、Altschul,S.et al.,Nucleic Acids Res.,25:3389-3402(1997)に記載されているように、NBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に組み入れられている。BLASTプログラムおよびGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えばNBLAST)の任意の関連パラメータを使用することができる。例えば、配列比較のためのパラメータは、score=100、word length=12に設定することができ、これを変更することもできる(例えばW=5またはW=20)。他の例として、Myers and Miller,CABIOS(1989)のアルゴリズム、ADVANCE、ADAM、BLAT、およびFASTAが挙げられる。いくつかの態様において、2つのアミノ酸配列間の同一性パーセントは、例えばGCGソフトウェアパッケージ(Accelrys、英国ケンブリッジ)中のGAPプログラムを使って達成することができる。
【0353】
シーケンシングは、ポリヌクレオチドの少なくとも約10、20、30、40、50、60、70、80、90もしくは100個またはそれ以上のヌクレオチドまたは塩基対のシーケンシングを含むことができる。いくつかの態様において、シーケンシングは、ポリヌクレオチドの少なくとも約200、300、400、500、600、700、800、900もしくは1000個またはそれ以上のヌクレオチドまたは塩基対のシーケンシングを含む。別の例では、シーケンシングが、ポリヌクレオチドの少なくとも約1500、2000、3000、4000、5000、6000、7000、8000、9000もしくは10,000個またはそれ以上のヌクレオチドまたは塩基対のシーケンシングを含む。
【0354】
シーケンシングは、1ランあたり少なくとも約200、300、400、500、600、700、800、900もしくは1000またはそれ以上のシーケンシングリードを含むことができる。本明細書にいう配列リードは、シーケンシング技法によって生成したデータのシーケンスまたはデータのストリームから決定されるヌクレオチドの配列を含む。いくつかの態様において、シーケンシングは、1ランあたり少なくとも約1500、2000、3000、4000、5000、6000、7000、8000、9000もしくは10,000またはそれ以上のシーケンシングリードのシーケンシングを含む。シーケンシングは、1ランあたり約1,000,000,000シーケンシングリード超または1ランあたり約1,000,000,000シーケンシングリード未満、または1ランあたり約1,000,000,000シーケンシングリードを含むことができる。シーケンシングは、1ランあたり約200,000,000リード超、または1ランあたり約200,000,000リード未満、または1ランあたり約200,000,000リードを含むことができる。
【0355】
いくつかの態様において、コンセンサス配列を決定するために使用される配列リードの数は約2~1000配列リードである。例えば、コンセンサス配列を決定するために使用される配列リードの数は、約2~900、2~800、2~700、2~600、2~500、2~400、2~300、2~200、2~100、25~900、25~800、25~700、25~600、25~500、25~400、25~300、25~200、25~100、100~1000、100~900、100~800、100~700、100~600、100~500、100~400、100~300、100~200、200~1000、200~900、200~800、200~700、200~600、200~500、200~400、200~300、300~1000、300~900、300~800、300~700、300~600、300~500、300~400、400~1000、400~900、400~800、400~700、400~600、400~500、500~1000、500~900、500~800、500~700、500~600、600~1000、600~900、600~800、600~700、700~1000、700~900、700~800、800~1000、800~900、または900~1000配列リードであることができる。いくつかの態様において、コンセンサス配列を決定するために使用される配列リードの数は、少なくとも約1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000,35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000、1,000,000、50,000,000、または100,000,000リードである。いくつかの態様において、コンセンサス配列を決定するために使用される配列リードの数は、最大で約1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000,35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000、1,000,000、50,000,000、または100,000,000リードである。
【0356】
ある方法はシーケンシングミスリードを含みうる。ある方法は、例えば反応条件を決定しまたはプライマー配列をデザインするために、ミスリードの数を決定する工程を含みうる。1つまたは複数の第1条件または第1条件セットの下で生成したミスリードの数を比較することで、好ましい条件または好ましい条件セットを決定することができる。例えば第1の方法をPCR反応中は高塩濃度で実行し、第2の方法をPCR反応中は低塩濃度で実行して、塩濃度の相違の他は第1および第2の方法を実質的に同じように実行する。第1の方法がより多くのミスリードをもたらす場合には、例えば特定の標的ポリヌクレオチド配列またはプライマーについてミスリードの数が多い場合には、その特定標的ポリヌクレオチドまたはプライマーには低塩反応条件が好ましいと決定することができる。
【0357】
II. 標的遺伝子のクローニングおよび発現
いくつかの態様では、提供される方法に従って同定されシーケンシングされた標的遺伝子を、細胞における発現または細胞からの発現のために、ベクターにクローニングすることができる。免疫受容体などの、例えば抗体またはTCRの、標的遺伝子の発現ライブラリーを生成させることができる。
【0358】
本明細書にいう「抗体発現ライブラリー」または「TCR発現ライブラリー」または「発現ライブラリー」は、核酸レベルまたはタンパク質レベルでの分子の集合体(すなわち2つまたはそれ以上の分子)を指しうる。したがってこの用語は、複数の抗体分子またはTCR分子をコードする発現ベクターの(すなわち核酸レベルでの)集合体を指すか、適当な発現系において発現した後の抗体分子またはTCR分子の(すなわちタンパク質レベルでの)集合体を指すことができる。あるいは、発現ベクター/発現ライブラリーは、それらが発現することのできる適切な宿主細胞に含まれていてもよい。本発明の発現ライブラリーにおいてコードされまたは発現される抗体分子は、任意の適当なフォーマットをとることができる。例えば、全抗体分子または全TCR分子であってもよいし、抗体フラグメントまたはTCRフラグメント、例えば一本鎖抗体(例えばscFv抗体)、Fv抗体、Fab'抗体、(Fab')2フラグメント、ダイアボディなどであってもよい。ある特定酵素を「コードする」核酸配列またはある特定酵素を「コードする」DNAコーディング配列もしくはヌクレオチド配列などという場合の「コードする」(encoding/coding for)という用語は、他の類義語と共に、適当な調節配列の制御下に置かれた場合に、転写されて酵素に翻訳されるDNA配列を指す。「プロモーター配列」は、細胞内でRNAポリメラーゼに結合して下流(3'方向)のコーディング配列の転写を開始させる能力を有するDNA調節領域である。プロモーターはDNA配列の一部である。この配列領域はその3'末に開始コドンを有する。プロモーター配列は、バックグラウンドを上回る検出可能なレベルで転写を開始させるのに必要な要素を持つ最小数の塩基を含む。しかしRNAポリメラーゼが配列に結合して、転写が開始コドン(プロモーターの3'末)で始まった後は、転写は3'方向に下流へと進行する。プロモーター配列内には転写開始部位(ヌクレアーゼSIによるマッピングで都合よく規定される)ならびにRNAポリメラーゼの結合を担うタンパク質結合ドメイン(コンセンサス配列)が見つかるだろう。
【0359】
本発明の抗体発現ライブラリーもしくはTCR発現ライブラリーによって同定され、本発明の抗体発現ライブラリーもしくはTCR発現ライブラリーから誘導され、本発明の抗体発現ライブラリーもしくはTCR発現ライブラリーから選択され、または本発明の抗体発現ライブラリーもしくはTCR発現ライブラリーから得られる抗体分子またはTCR分子は、本発明のさらなる局面を形成する。ここでも、これらの抗体分子またはTCR分子は、タンパク質であってもよいし、抗体分子またはTCR分子をコードする核酸であってもよく、核酸であるなら、それらの核酸は適当な発現ベクターに組み入れられかつ/または適切な宿主細胞に含まれていてもよい。
【0360】
cDNAプールは、抗体遺伝子の重鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体遺伝子またはTCR遺伝子のVH鎖領域またはVα鎖領域またはVγ鎖領域の5'端にハイブリダイズするポリヌクレオチドとを使って、PCR反応に供することができる。cDNAプールは、抗体遺伝子またはTCR遺伝子の重鎖またはアルファ鎖またはガンマ鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体配列またはTCR配列を含むバーコード化ポリヌクレオチドのVH鎖領域またはVα鎖領域またはVγ鎖領域の5'端に対して5'側の領域にハイブリダイズするポリヌクレオチドとを使って、PCR反応に供することができる。PCR反応は、例えばカッパクラスおよびラムダクラスのVL鎖プールまたはVβ鎖プールまたはVγ鎖プールの増幅のために設定することもできる。cDNAプールは、抗体遺伝子の軽鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体遺伝子またはTCR遺伝子のVL鎖領域またはVβ鎖領域またはVγ鎖領域の5'端にハイブリダイズするポリヌクレオチドとを使って、PCR反応に供することができる。cDNAプールは、抗体遺伝子の軽鎖の定常領域にハイブリダイズするポリヌクレオチドと、抗体配列またはTCR配列を含むバーコード化ポリヌクレオチドのVL鎖領域またはVβ鎖領域またはVγ鎖領域の5'端に対して5'側の領域にハイブリダイズするポリヌクレオチドとを使って、PCR反応に供することができる。そのようなオリゴヌクレオチドまたはプライマーは、公に利用できる公知の免疫グロブリン遺伝子配列またはTCR遺伝子配列データベース情報に基づいてデザインすることができる。
【0361】
いくつかの態様において、VHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列は、重鎖遺伝子または軽鎖遺伝子に特異的でない1つまたは複数のプライマー、特にVHおよびVLポリヌクレオチドまたはVαおよびVβポリヌクレオチドまたはVγおよびVδポリヌクレオチドの末端領域の一方または両方に特異的でない1つまたは複数のプライマーを使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから、都合よく得ることができる。いくつかの態様において、VHおよびVL配列は、ベッセルバーコード化ポリヌクレオチドの一領域に特異的なプライマーを使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから、都合よく得ることができる。いくつかの態様において、VHおよびVL配列は、C遺伝子ファミリー特異的プライマーまたはC遺伝子特異的プライマーを使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから、都合よく得ることができる。いくつかの態様において、VHおよびVL配列は、ベッセルバーコード化ポリヌクレオチドの一領域に特異的な第1プライマーと、C遺伝子ファミリー特異的プライマーまたはC遺伝子特異的プライマーである第2プライマーまたは複数の第2プライマーとのプライマーセットを使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから、都合よく得ることができる。いくつかの態様において、VHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列は、ベッセルバーコード化ポリヌクレオチドの一領域に特異的な第1プライマーとユニバーサル配列に特異的な第2プライマーとのプライマーセットを使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから、都合よく得ることができる。
【0362】
いくつかの態様では、逆転写後に、結果として生じるcDNA配列を、免疫グロブリン遺伝子に特異的な、特にVHおよびVLポリヌクレオチドまたはVαおよびVβポリヌクレオチドまたはVγおよびVδポリヌクレオチドの末端領域の一方または両方に特異的な、1つまたは複数のプライマーを用いるPCRによって増幅しうる。いくつかの態様において、VHおよびVL配列は、V遺伝子ファミリー特異的プライマーまたはV遺伝子特異的プライマー(Nicholls et al,J.Immunol.Meth.,1993,165:81、W093/12227)を使ったPCR増幅によって作製されるVHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列のライブラリーから得ることができるか、または利用可能な配列情報に基づいて当技術分野公知の標準的方法に従ってデザインされる。(VH配列とVL配列またはVα配列とVβ配列またはVγ配列とVδ配列を、通常は介在スペーサー配列(例えばインフレームのフレキシブルなペプチドスペーサーをコードするもの)を使ってライゲートすることで、単鎖抗体をコードするカセットを形成させることができる)。V領域配列は、免疫グロブリン発現細胞のために、cDNAとして、またはPCR増幅産物として、都合よくクローニングすることができる。VHおよびVL領域またはVαおよびVβ領域またはVγおよびVδ領域は、本明細書に記載する方法では、特に記載のとおり一定の工程後(例えば単一細胞PCR後、哺乳動物細胞表面ディスプレイ後または他の細胞表面ディスプレイ後、FACSスクリーニング後など)に、任意で、シーケンシングされる。シーケンシングは、数ある理由のなかでも特に、多様性のレベルが許容されうるレベルであることを検証するために使用することができる。シーケンシングは、ハイスループットシーケンシング、ディープシーケンシング(同じ遺伝子が、配列の相違を同定するために、複数の個別試料からシーケンシングされる)、またはそれら2つの組合せを含みうる。
【0363】
いくつかの態様において、本明細書に記載する方法を使って天然のVHとVLまたはVαとVβまたはVγとVδの組合せを物理的に連結する必要はない。いくつかの態様において、cDNA、バーコード化ポリヌクレオチド、またはPCR増幅されたバーコード化cDNAは、物理的に連結されない。いくつかの態様において、cDNA、バーコード化ポリヌクレオチド、またはPCR増幅されたバーコード化cDNAは、同じ反応またはベッセルにおいて物理的に連結されない。
【0364】
いくつかの態様において、天然のVHとVLまたはVαとVβまたはVγとVδの組合せは、cDNAプライマーの他に、VH遺伝子またはVα遺伝子またはVγ遺伝子の5'端に対する1つまたは複数のプライマーと、VL遺伝子またはVβ遺伝子またはVδ遺伝子の5'端に対する別の1つまたは複数のプライマーとを使って、物理的に連結される。これらのプライマーは、VHおよびVL遺伝子またはVαおよびVβ遺伝子またはVγおよびVδ遺伝子の自己集合を可能にするために、追加配列の相補的テールも含有する。PCR増幅および連結後に、偶然にも混合された産物、言い換えると混合された可変領域が得られる確率は、ごくわずかである。なぜなら増幅反応と連結反応は各細胞内で実施されたからである。混合のリスクは、V領域cDNAペアが細胞コンパートメントから離れて混じり合うことなく、PCR増幅および連結のために細胞内に留まることをさらに確実にするために、ジゴキシゲニン標識ヌクレオチドなどの嵩高い試薬を利用することによって、さらに低下させることができる。増幅された配列は、相補的末端配列のハイブリダイゼーションによって連結される。連結後は、本明細書に記載するさらなる方法工程において使用するために、配列を細胞から回収しうる。例えば回収されたDNAは末端プライマーを使ってPCR増幅することができ、必要であれば、ベクターにクローニングすることができ、ベクターは、後述するように、プラスミド、ファージ、コスミド、ファージミド、ウイルスベクターまたはそれらの組合せでありうる。クローニングを容易にするために、ハイブリッド形成した配列には都合のよい制限酵素部位を組み入れることができる。これらのベクターは、連結された可変領域のライブラリーとして、後の使用のために保存しておいてもよい。
【0365】
さらなるVHとVLまたはVαとVβまたはVγとVδの組合せを提供することが望まれるいくつかの態様では、それが容易になるように、発現系が選ばれる。例えばバクテリオファージ発現系は、重鎖配列と軽鎖配列のランダムな組換えを可能にする。他の適切な発現系は当業者には公知である。
【0366】
VHおよびVL配列またはVαおよびVβ配列またはVγおよびVδ配列がヒト以外に由来する場合、いくつかの態様では、それらの配列を完全にヒトのFcとキメラ化することが好ましい場合があることに留意すべきである。本明細書にいう「キメラ化」とは、重鎖可変領域と軽鎖可変領域またはVα領域とVβ領域またはVγ領域とVδ領域がヒト起源のものではなく、重鎖と軽鎖またはVα鎖とVβ鎖またはVγ鎖とVδ鎖の定常領域がヒト起源のものである、免疫グロブリンまたはTCRを指す。これは、可変ドメインを増幅しヒトFcにクローニングすることによって達成される。ヒトFcは、ベクターの一部であるか、別個の分子中に存在することができ、Fcのライブラリーを使用することもできる。好ましい一態様では、キメラ化された分子を、CHO細胞などの哺乳動物細胞中で増殖させ、FACSで2回スクリーニングすることで、関心対象の抗体を発現する細胞について細胞集団を濃縮する。キメラ化抗体またはキメラ化TCRは、シーケンシングとそれに続く機能的特徴づけによって、または直接的な機能的特徴づけもしくは速度論によって特徴づけられる。増殖、スクリーニングおよび特徴づけについては以下に詳述する。
【0367】
上述のPCR反応がIgG型の抗体のクローニングについて記載されている点に注目することは重要である。これらの抗体は好ましい。というのも、これらの抗体は、一般に、より成熟した免疫応答に関連し、一般にIgM抗体より高いアフィニティーを呈することから、一定の治療的応用および診断的応用にとって、より望ましいからである。しかし、所望であれば、またはそれが適当であれば、他の形態の免疫グロブリン分子、例えばIgM、IgA、IgEおよびIgDのうちの1つまたは複数のクローニングを可能にするポリヌクレオチドをデザインできることは明らかである。
【0368】
抗体またはTCRが同定され、当該細胞の適当な集団が適当な時点で単離され、任意で上述のように濃縮されたら、その細胞に含まれている遺伝物質が無傷のまま保たれ、それによって後日、ライブラリーを作ることが可能である限り、抗体発現ライブラリーまたはTCR発現ライブラリーを直ちに生成させる必要はない。したがって例えば細胞、細胞溶解物、または核酸、例えばRNAまたはそこから得られたDNAを、例えば凍結など適当な方法で、後日まで保存しておき、所望した時に、後日、発現ライブラリーを生成させることができる。
【0369】
発現ベクターのライブラリーを生成させたら、次に、コードされている抗体分子を、適当な発現系で発現させ、当技術分野において周知であり詳しく記録されている適当な技法を使って、スクリーニングすることができる。したがって、上に定義した本発明の方法は、以下にさらに詳しく述べるように、適当な発現系で発現ベクターのライブラリーを発現させ、発現したライブラリーを所望の特性を持つ抗体についてスクリーニングするという、さらなる工程を含みうる。
【0370】
本明細書に示すとおり、抗体配列またはTCR配列をコードするポリヌクレオチドを含む、本開示の方法によって調製されるポリヌクレオチドは、限定するわけではないが、抗体フラグメントまたはTCRフラグメントのアミノ酸配列を単独でコードするもの、抗体もしくはTCRの全体またはその一部分の非コーディング配列、抗体もしくはTCR、フラグメントまたは部分のコーディング配列、ならびに前述の追加コーディング配列を伴うまたは伴わない、追加配列、例えば少なくとも1つのシグナルリーダーまたは融合ペプチドのコーディング配列、例えば少なくとも1つのイントロン、ならびに追加非コーディング配列、例えば限定するわけではないが、非コーディング5'および3'配列、例えば転写やスプライシングおよびポリアデニル化シグナルなどといったmRNAプロセシング(例えばリボソーム結合およびmRNAの安定性)に関与する転写非翻訳配列、追加のアミノ酸、例えば追加機能を提供するものなどをコードする追加コーディング配列を含むことができる。したがって抗体をコードする配列は、マーカー配列に、例えば抗体もしくはTCRのフラグメントまたは部分を含む融合抗体または融合TCRの精製を容易にするペプチドをコードする配列に、融合することができる。
【0371】
次に、一次PCR産物は、任意で、抗体またはTCRの可変ドメインVH、VLカッパおよびVLラムダまたはVαおよびvまたはVγおよびVδの5'端および3'端にハイブリダイズする新しいポリヌクレオチドセット(新しいポリヌクレオチドセットと共に使用される一次PCR反応が、重鎖もしくは軽鎖抗体遺伝子の一部を増幅するようにデザインされたのか、VαもしくはVβ TCR遺伝子の一部を増幅するようにデザインされたのか、VγもしくはVδ TCR遺伝子の一部を増幅するようにデザインされたのかに、適宜依存する)を使った二次PCR反応に供することができる。これらのポリヌクレオチドは、以降のクローニングのために所定の制限酵素セットに特異的なDNA配列(すなわち制限酵素部位)を含むと有利である。選択される制限酵素は、ヒトの抗体またはTCRのV遺伝子セグメント内を切断することがないように、選択されなければならない。そのようなポリヌクレオチドは、公に利用できる公知の免疫グロブリン遺伝子配列またはTCR遺伝子配列および制限酵素データベース情報に基づいてデザインすることができる。しかし、含めることが好ましい制限酵素部位は、NcoI、Hind III、MおよびNotIである。そのような二次PCR反応の産物は、さまざまなV重鎖、V軽鎖カッパおよびV軽鎖ラムダ抗体フラグメント/ドメインのレパトアである。それゆえに、このタイプの二次PCR反応は、一般に、関心対象の発現ライブラリーフォーマットが、抗体またはTCRのVHおよびVLドメインまたはVαおよびVドメインまたはVγおよびVδドメインだけが存在するscFvフォーマットまたはFvフォーマットである場合に実行される。
【0372】
PCR産物は、バーコード化ポリヌクレオチドの5'端および3'端にハイブリダイズする新しいプライマーセットを使ったPCR反応に供することもできる。これらのポリヌクレオチドは、以降のクローニングのために所定の制限酵素セットに特異的なDNA配列(すなわち制限酵素部位)を有利に含むことができる。選択される制限酵素は、ヒトの抗体またはTCRのV遺伝子セグメント内を切断することがないように、選択されなければならない。そのようなポリヌクレオチドは、公に利用できる公知の免疫グロブリン遺伝子配列またはTCR遺伝子配列および制限酵素データベース情報に基づいてデザインすることができる。しかし、含めることが好ましい制限酵素部位は、NcoI、Hind III、MluIおよびNotIである。そのような二次PCR反応の産物は、さまざまなVH、VLカッパおよびVLラムダ抗体フラグメント/ドメインまたはVαおよびVβもしくはVγおよびVδ TCRフラグメント/ドメインのレパトアである。
【0373】
重鎖もしくは軽鎖またはVα鎖もしくはVβ鎖またはVγ鎖もしくはVδ鎖のFvまたはFabフラグメント、あるいは単鎖抗体または単鎖TCRも、この系で使用しうることは、当業者にはわかるであろう。重鎖もしくは軽鎖またはVα鎖もしくはVβ鎖またはVγ鎖もしくはVδ鎖に変異を導入した後、相補的な鎖を溶液に加えることができる。次に、それら2つの鎖を組み合わせて機能的な抗体フラグメントを形成させる。ランダムな非特異的軽鎖もしくは重鎖またはVα鎖もしくはVβ鎖またはVγ鎖もしくはVδ鎖の配列を加えれば、多様なメンバーのライブラリーを生成させるためのコンビナトリアル系を作製することができる。
【0374】
本明細書に定義する免疫チャレンジを受けた宿主のBリンパ球またはTリンパ球に由来する抗体遺伝子またはTCR遺伝子の可変重鎖もしくはVα鎖もしくはVγ鎖領域またはそのフラグメント、および/あるいは可変軽鎖もしくはVβ鎖もしくはVδ鎖領域またはそのフラグメントを含む、クローニングされたフラグメントのそのようなレパトアのライブラリーは、本発明のさらなる局面を形成する。クローニングされた可変領域を含むこれらのライブラリーを、任意で、発現ベクターに挿入することで、発現ライブラリーを形成させてもよい。
【0375】
いくつかの態様では、単離された免疫細胞集団に含まれるさまざまな抗体鎖またはTCR鎖の定常領域の全部または一部を保持するように、PCR反応を設定することができる。発現ライブラリーのフォーマットが、重鎖またはα鎖またはγ鎖構成要素がVHまたはVαまたはVγドメインとCHまたはCαまたはCγドメインとを含み、かつ軽鎖またはVβ鎖またはVγ鎖構成要素がVLまたはVβまたはVδ鎖とCLまたはCβまたはCδドメインとを含むFabフォーマットである場合には、これが望ましい。ここでも、抗体鎖またはTCR鎖の定常領域の全部または一部を含む、そのようなクローニングされたフラグメントのライブラリーは、本発明のさらなる局面を形成する。
【0376】
これらの核酸は、本発明のポリヌクレオチドの他にも、配列を好都合に含むことができる。例えば、ポリヌクレオチドの単離を助けるために、1つまたは複数のエンドヌクレアーゼ制限部位を含むマルチクローニング部位を、核酸に挿入することができる。また、翻訳された本発明のポリヌクレオチドの単離を助けるために、翻訳可能な配列を挿入することもできる。例えば、ヘキサ-ヒスチジンマーカー配列は、本発明のタンパク質を精製するための便利な手段を提供する。本発明の核酸は、コーディング配列を除けば、任意で、本発明のポリヌクレオチドのクローニングおよび/または発現のためのベクター、アダプター、またはリンカーである。
【0377】
そのようなクローニングおよび/または発現配列には、クローニングおよび/または発現におけるそれらの機能を最適化するために、ポリヌクレオチドの単離に役立つように、または細胞へのポリヌクレオチドの導入を改良するために、追加の配列を付加することができる。クローニングベクター、発現ベクター、アダプターおよびリンカーの使用は当技術分野において周知である。(例えばCurrent Protocols in Molecular Biology(CPMB)(Fred M.Ausubel,et al.ed.,John Wiley and Sons,Inc.)またはJ.Sambrook et al.,“Molecular Cloning:A Laboratory Manual”,1989,2nd Ed.,Cold Spring Harbour Laboratory Press:New York,N.Y.参照)。
【0378】
本明細書に開示するライブラリーは、さまざまな応用に使用しうる。本明細書にいうライブラリーは複数の分子を含む。いくつかの態様において、ライブラリーは複数のポリヌクレオチドを含む。いくつかの態様において、ライブラリーは複数のプライマーを含む。いくつかの態様において、ライブラリーは、1つまたは複数のポリヌクレオチド、アンプリコン、またはアンプリコンセットからの複数の配列リードを含む。ライブラリーは貯蔵して、解析用の試料を生成させるために、何度も使用することができる。応用例をいくつか挙げると、例えば、多型の遺伝子タイピング、RNAプロセシングの研究、および本明細書において提供される方法に従ってシーケンシングを行うためのクローン標本(clonal representatives)の選択などがある。複数のポリヌクレオチドを含むライブラリー、例えばシーケンシングまたは増幅用のプライマーまたはライブラリーであって、複数のポリヌクレオチドが、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、90、100、200、300、400、500、600、700、800、900、1000、15000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、もしくは100,000,000個またはそれ以上の分子バーコードまたはベッセルバーコードを含むライブラリーを、生成させることができる。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、もしくは100,000,000個またはそれ以上のユニークなポリヌクレオチドを含み、それらユニークなポリヌクレオチドは、それぞれ、1つまたは複数の分子バーコードおよびベッセルバーコードを含む。
【0379】
III. トランスクリプトーム解析
いくつかの態様において、提供される方法は、細胞に関するトランスクリプトーム情報を解明するために使用することができ、それを、特定細胞の標的ポリヌクレオチド配列の捕捉と、例えば抗体またはTCRの捕捉と、組み合わせることができる。いくつかの態様において、標的ポリヌクレオチド配列によって同定された細胞または複数の細胞は、例えばその細胞の特定の状態、特徴または属性などに関して、それらの細胞の転写状態によって特徴づけることができる。いくつかの態様では、細胞の個別化されたトランスクリプトームプロファイルを決定し、与えられた情報を細胞の1つまたは複数の特徴に関係づけることができる。そのような特徴の例として、活性化状態、増殖状態、疲弊状態、遷移状態、細胞周期段階または細胞の機能的もしくは表現型的状態と関連する他のパラメータが挙げられるが、それらに限定されるわけではない。
【0380】
いくつかの態様において、転写状態情報は、所望の応答または興味深い応答を呈する特定の標的遺伝子、例えば抗体またはTCRを発現する細胞を同定するために使用することができる。いくつかの局面において、提供される方法では、ある細胞のトランスクリプトームプロファイルの、その細胞から増幅またはシーケンシングされた標的ポリヌクレオチド、例えば抗体またはTCRへのマッチングが可能である。特定の態様では、トランスクリプトーム情報と、標的ポリヌクレオチドの配列とが、増幅されシーケンシングされたトランスクリプトームと標的ポリヌクレオチドとが、同じ細胞に由来したトランスクリプトームプロファイルと標的ポリヌクレオチドとを同定する同じベッセルバーコードを有することに基づいて、マッチングされる。
【0381】
当技術分野ではトランスクリプトームデータを処理するためのさまざまな方法が公知である。いくつかの局面では、本方法から得られたデータをマップ上で視覚化することができる。試料からの標的の数および場所のマップは、本明細書に記載する方法を使って生成させた情報を使って構築することができる。マップを使って標的の物理的な場所を特定することができる。マップを使って複数の標的の場所を同定することができる。
【0382】
いくつかの態様において、システムは、提供される方法から生成した配列データに関するデータ解析を行うためのコードを含むコンピュータ読み取り可能な記録媒体を含む。データ解析ソフトウェアによって提供されうるデータ解析機能の例としては、(i)ポリヌクレオチドライブラリーのシーケンシングによって提供される試料のベッセルバーコード、分子バーコード、および標的配列またはトランスクリプトームデータのデコーディング/デマルチプレキシングのためのアルゴリズム、(ii)データに基づいて細胞あたり遺伝子あたりのリードの数および細胞あたり遺伝子あたりのユニークな転写産物分子の数を決定し、要約表を作るためのアルゴリズム、(iii)例えば遺伝子発現データによる細胞のクラスタリングのための、または細胞あたり遺伝子あたりの転写産物分子の数の決定に関する信頼区間を予想するための、配列データの統計解析、(iv)例えば主成分分析、階層的クラスタリング、k平均クラスタリング、自己組織化マップ、ニューラルネットワークなどを使って、希少細胞の亜集団を同定するためのアルゴリズム、(v)遺伝子配列データと公知リファレンス配列とのアライメントならびに変異、多型マーカーおよびスプライス変異体の検出のための配列アライメント機能、ならびに(vi)増幅エラーまたはシーケンシングエラーを補償するための分子ラベルの自動クラスタリングが挙げられるが、それらに限定されるわけではない。
【0383】
いくつかの態様では、計算プログラムを使ってトランスクリプトームアセンブリを作製することができる。ショートリードアセンブリ用の例示的な計算プログラムとして、Robertson et al.,Nat Methods.2010;7:909-12、Grabherr et al.,Nat Biotechnol.2011;29:644-52、Schulz et al.,Bioinformatics.2012;28:1086-92、およびXie et al.,Bioinformatics.2014;30:1660-6に記載されているものが挙げられる。トランスクリプトームアセンブリは、転写産物間の発現レベルの大きなばらつき、シーケンシングバイアスおよび選択的スプライシングゆえに困難な場合がある。そこで、k-mer長に基づく、または固定k-mer値を用いる、トランスクリプトームアセンブリのマージを使って、転写産物量の程度の相違を相殺し、トランスクリプトームアセンブリを改良することができる(例えばRobertson et al.,Nat Methods.2010;7:909-12、Grabherr et al.,Nat Biotechnol.2011;29:644-52およびSurget-Groba Genome Res.2010;20:1432-40参照)。
【0384】
いくつかの態様では、市販のソフトウェアを使ってデータ解析の全部または一部を実施することができる。いくつかの態様において、データ解析ソフトウェアは、シーケンシング結果を有用なグラフィックフォーマットで出力するためのオプション、例えば細胞の集合体の各細胞に存在する1つまたは複数の遺伝子のコピー数を示すヒートマップを含むことができる。いくつかの態様において、データ解析ソフトウェアは、例えば細胞の集合体の各細胞に存在する1つまたは複数の遺伝子のコピー数を細胞のタイプ、希少細胞のタイプまたは具体的な疾患もしくは状態を有する対象に由来する細胞と相関させることなどによって、シーケンシング結果から生物学的な意味を抽出するためのアルゴリズムを、さらに含むことができる。いくつかの態様において、データ解析ソフトウェアは、異なる生物学的試料間で細胞の集団を比較するためのアルゴリズムをさらに含むことができる。
【0385】
いくつかの態様では、データ解析機能のすべてが、単一のソフトウェアパッケージ内にパッケージングされうる。いくつかの態様では、データ解析の機能一式がソフトウェアパッケージスイートを構成しうる。いくつかの態様において、データ解析ソフトウェアは、アッセイ機器システムには依存せずにユーザーが利用できるようになっているスタンドアロンパッケージでありうる。いくつかの態様において、ソフトウェアはウェブベースであって、ユーザーによるデータの共有を可能にすることができる。
【0386】
いくつかの例では、1つまたは複数の異なる細胞集団を同定するために、クラスター解析を実施することができる。いくつかの実施例において、細胞集団は1つまたは複数の標的遺伝子の発現に基づいてクラスタリングされる。複数の細胞内の細胞をクラスタリングするために、細胞の転写状態を表す公知の遺伝子または転写産物の存在、アップレギュレーションまたはダウンレギュレーションを使用することができる。
【0387】
いくつかの態様において、関心対象のトランスクリプトーム遺伝子はそれらのベッセルバーコードによって同定され、関心対象の全長標的分子、例えば抗体またはTCRの増幅およびシーケンシングの出力とマッチングされまたは連結される。したがって、提供される方法の実施により、各ベッセルバーコードは、遺伝子カウント(例えばトランスクリプトーム)および標的分子(例えば全長抗体またはTCR)情報とマッチングされ、またはそれらを使ってアノテーションを付与することができる。
【0388】
いくつかの態様では、トランスクリプトーム中に存在する核酸配列によって代表される発現プロファイルを生成させることができる。細胞のサブセット、例えば1つまたは複数の標的遺伝子を発現し、あるベッセルバーコードを共通して有する細胞の、発現プロファイルを生成させることができる。
【0389】
IV. 診断
いくつかの態様において、方法は、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。いくつかの態様において、方法は、標的ポリヌクレオチドの有無もしくはレベルおよび/または細胞の特定転写状態、例えば本明細書において上述した細胞状態に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。いくつかの態様において、方法は、1つもしくは複数の標的ポリヌクレオチドの有無もしくはレベルおよび/または1つもしくは複数の細胞の転写状態に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。
【0390】
いくつかの態様において、方法は、本明細書に記載する方法を使って得られる配列のうちの1つまたは複数の有無、レベルまたは配列に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。例えば、疾患の診断は、本明細書に記載する方法を使って得られる変異体配列の有無、レベルまたは配列に基づいて下すことができる。いくつかの態様において、方法は、本明細書に記載する方法を使って得られる配列リードのうちの1つまたは複数の有無、レベルまたは配列に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。いくつかの態様において、方法は、本明細書に記載する方法を使って得られるコンセンサス配列のうちの1つまたは複数の有無、レベルまたは配列に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。いくつかの態様において、方法は、試料中の標的ポリヌクレオチドのレベル(例えば量または濃度)の決定に基づいて、対象において、疾患、障害、症状および/または状態を診断し、予後予測し、モニタリングし、処置し、改善しかつ/または防止する工程を、さらに含むことができる。試料中の標的ポリヌクレオチドのレベルは、1つまたは複数の配列リード、配列、コンセンサス配列、またはそれらの任意の組合せに基づいて決定することができる。試料中の複数の標的ポリヌクレオチドのそれぞれのレベルは本明細書に記載する方法を使って決定することができる。試料中の複数の標的ポリヌクレオチドのそれぞれのレベルは、複数の標的ポリヌクレオチド中の各標的ポリヌクレオチドの、いくつかの配列リード、配列、コンセンサス配列、またはそれらの任意の組合せに基づいて決定することができる。例えば、第1標的ポリヌクレオチドのレベルおよび第2標的ポリヌクレオチドのレベルを、本明細書に記載する方法を使って決定することができる。
【0391】
いくつかの態様において、複数の標的ポリヌクレオチドのうちの第1標的ポリヌクレオチドと第2標的ポリヌクレオチドは同じである。例えば、第1標的ポリヌクレオチドはmRNA分子の第1コピーを含むことができ、第2標的ポリヌクレオチドはmRNA分子の第2コピーを含むことができる。いくつかの態様において、第1標的ポリヌクレオチドと第2標的ポリヌクレオチドは異なる。例えば、第1標的ポリヌクレオチドは第1mRNA分子を含むことができ、第2標的ポリヌクレオチドは、第1mRNA分子とは異なる遺伝子から転写された第2mRNA分子を含むことができる。例えば第1標的ポリヌクレオチドは第1アレルを含むことができ、第2標的ポリヌクレオチドは第2アレルを含むことができる。例えば第1標的ポリヌクレオチドは野生型配列を含むことができ、第2標的ポリヌクレオチドは変異体配列を含むことができる。
【0392】
いくつかの態様において、方法は、疾患、障害、症状および/または状態を持つ対象を少なくとも50%の信頼度で診断しまたは予後予測する工程を、さらに含むことができる。例えば疾患、障害、症状および/または状態を持つ対象の診断または予後予測は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%の信頼度で決定することができる。いくつかの態様において、疾患、障害、症状および/または状態を持つ対象の診断または予後予測は、50%~100%の信頼度で決定することができる。例えば疾患、障害、症状および/または状態を持つ対象の診断または予後予測は、60%~100%、70%~100%、80%~100%、90%~100%、50%~90%、50%~80%、50%~70%、50%~60%、60%~90%、60%~80%、60%~70%、70%~90%、70%~80%、または80%~90%の信頼度で決定することができる。
【0393】
いくつかの態様では、バイオマーカーなど、対象における標的ポリヌクレオチドの有無、レベル、配列またはそれらの任意の組合せを、少なくとも50%の信頼度で決定することができる。例えば、対象における標的ポリヌクレオチドの有無、レベル、配列またはそれらの任意の組合せは、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%の信頼度で決定することができる。いくつかの態様において、対象における標的ポリヌクレオチドの有無、レベル、配列またはそれらの任意の組合せは、50%~100%の信頼度で決定することができる。例えば、対象における標的ポリヌクレオチドの有無、レベル、配列またはそれらの任意の組合せは、60%~100%、70%~100%、80%~100%、90%~100%、50%~90%、50%~80%、50%~70%、50%~60%、60%~90%、60%~80%、60%~70%、70%~90%、70%~80%、または80%~90%の信頼度で決定することができる。
【0394】
V. 酵素
本明細書に開示する方法およびキットは1つまたは複数の酵素を含みうる。酵素の例としては、リガーゼ、逆転写酵素、ポリメラーゼ、および制限ヌクレアーゼが挙げられるが、それらに限定されるわけではない。
【0395】
いくつかの態様において、ポリヌクレオチドへのアダプターの取り付けは、1つまたは複数のリガーゼの使用を含む。リガーゼの例としては、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIV、およびT4 DNAリガーゼなどのDNAリガーゼ、ならびにT4 RNAリガーゼIおよびT4 RNAリガーゼIIなどのRNAリガーゼが挙げられるが、それらに限定されるわけではない。
【0396】
本明細書に開示する方法およびキットは、1つまたは複数の逆転写酵素の使用を、さらに含みうる。いくつかの態様において、逆転写酵素はHIV-1逆転写酵素、MMLV逆転写酵素、AMV逆転写酵素、およびテロメラーゼ逆転写酵素である。いくつかの態様において、逆転写酵素はM-MLV逆転写酵素である。
【0397】
いくつかの態様において、本明細書に開示する方法およびキットは、1つまたは複数のプロテアーゼの使用を含む。
【0398】
いくつかの態様において、本明細書に開示する方法およびキットは、1つまたは複数のポリメラーゼの使用を含む。ポリメラーゼの例としては、DNAポリメラーゼおよびRNAポリメラーゼが挙げられるが、それらに限定されるわけではない。いくつかの態様において、DNAポリメラーゼはDNAポリメラーゼI、DNAポリメラーゼII、DNAポリメラーゼIIIホロ酵素、およびDNAポリメラーゼIVである。市販のDNAポリメラーゼとして、Bst 2.0 DNAポリメラーゼ、Bst 2.0 WarmStart(商標)DNAポリメラーゼ、Bst DNAポリメラーゼ、スルフォロブス(Sulfolobus)DNAポリメラーゼIV、Taq DNAポリメラーゼ、9°NTMm DNAポリメラーゼ、Deep VentR(商標)(エキソ-)DNAポリメラーゼ、Deep VentR(商標)DNAポリメラーゼ、Hemo KlenTaq(商標)、LongAmp(登録商標)Taq DNAポリメラーゼ、OneTaq(登録商標)DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、Q5TM High-Fidelity DNAポリメラーゼ、Therminator(商標)γ DNAポリメラーゼ、Therminator(商標)DNAポリメラーゼ、Therminator(商標)II DNAポリメラーゼ、Therminator(商標)III DNAポリメラーゼ、VentR(登録商標)DNAポリメラーゼ、VentR(登録商標)(エキソ-)DNAポリメラーゼ、Bsu DNAポリメラーゼ、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、ターミナルトランスフェラーゼ、Titanium(登録商標)Taqポリメラーゼ、KAPA Taq DNAポリメラーゼおよびKAPA TaqホットスタートDNAポリメラーゼが挙げられるが、それらに限定されるわけではない。
【0399】
いくつかの態様において、ポリメラーゼは、RNAポリメラーゼI、RNAポリメラーゼII、RNAポリメラーゼIII、大腸菌ポリ(A)ポリメラーゼ、phi6 RNAポリメラーゼ(RdRP)、ポリ(U)ポリメラーゼ、SP6 RNAポリメラーゼ、およびT7 RNAポリメラーゼなどのRNAポリメラーゼである。
【0400】
VI. キットおよび他の試薬
提供される方法を実行するための1つまたは複数の試薬を含む製品またはキットが、本明細書において提供される。キットは、任意で、1つまたは複数の構成要素、例えば使用説明書、デバイスおよびさらなる試薬(例えば試薬または構成要素を希釈および/または再構成するための滅菌水または食塩水)、ならびに本方法を実施するためのチューブ、容器およびシリンジなどの構成要素を含むことができる。いくつかの態様において、キットは、試料の収集または試料の調製および処理のための試薬をさらに含有することができる。いくつかの態様において、キットは、キットの試薬および構成要素を梱包するための梱包材料を含む製品として提供することができる。例えばキットは、キットの構成要素を隔離しまたは整理するのに適した容器、ボトル、チューブ、バイアルおよび任意のパッケージング材料を含有することができる。
【0401】
本明細書に開示する方法およびキットは、1つまたは複数の試薬の使用を含みうる。試薬の例として、PCR試薬、ライゲーション試薬、逆転写試薬、酵素試薬、ハイブリダイゼーション試薬、試料調製試薬、アフィニティー捕捉試薬、ビーズなどの固体支持体ならびに核酸精製および/または核酸単離のための試薬が挙げられるが、それらに限定されるわけではない。
【0402】
固体支持体は、事実上不溶性または固体の材料を含むことができ、多くの場合、水に不溶の固体支持体組成物が選択される。例えば、固体支持体は、シリカゲル、ガラス(例えば制御された多孔質ガラス(controlled-pore glass(CPG))、ナイロン、Sephadex(登録商標)、Sepharose(登録商標)、セルロース、金属表面(例えば鋼、金、銀、アルミニウム、ケイ素および銅)、磁気材料、プラスチック材料(例えばポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、二フッ化ポリビニリデン(PVDF))などを含むか、または本質的にそれらからなることができる。これらの態様に従って使用されるビーズの例は、ビーズが核酸分子と相互作用することを可能にするアフィニティー部分を含むことができる。固相(例えばビーズ)は、結合ペアのメンバー(例えばアビジン、ストレプトアビジンまたはその誘導体)を含むことができる。例えばビーズは、ストレプトアビジン被覆ビーズであってよく、ビーズに固定化される核酸分子はビオチン部分を含むことができる。場合により、各ポリヌクレオチド分子は、ポリヌクレオチドをさらに安定化するために、2つのアフィニティー部分、例えばビオチンを含むことができる。ビーズは、核酸の固定化に使用される他の特徴または下流のスクリーニングプロセスもしくは選択プロセスにおいて使用することができる他の特徴も含むことができる。例えばビーズは、結合部分、蛍光ラベルまたは蛍光クエンチャーを含みうる。場合により、ビーズは磁気ビーズであることができる。いくつかの例において、固体支持体はビーズである。ビーズの例として、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynaビーズ(登録商標)、MACS(登録商標)マイクロビーズ、抗体コンジュゲートビーズ(例えば抗免疫グロブリンマイクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、ポリヌクレオチド-dTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗蛍光色素マイクロビーズ、およびBcMag(商標)カルボキシ末端磁気ビーズが挙げられるが、それらに限定されるわけではない。ビーズまたは粒子は膨潤性(例えばWang樹脂などのポリマービーズ)または非膨潤性(例えばCPG)でありうる。いくつかの態様において固相は実質的に親水性である。いくつかの態様において固相(例えばビーズ)は実質的に疎水性である。いくつかの態様において固相は、結合ペアのメンバー(例えばアビジン、ストレプトアビジンまたはその誘導体)を含み、実質的に疎水性または実質的に親水性である。いくつかの態様において、固相は、結合ペアのメンバー(例えばアビジン、ストレプトアビジンまたはその誘導体)を含み、固体支持体1mgあたり遊離捕捉作用物質(例えば遊離ビオチン)約1350ピコモル超の結合容量を有する。いくつかの態様において、結合ペアのメンバーを含む固相の結合容量は、固体支持体1mgあたり遊離捕捉作用物質800、900、1000、1100、1200、1250、1300、1350、1400、1450、1500、1600、1800、2000ピコモル超である。本発明に適したビーズの他の例は、金コロイド、またはポリスチレンビーズもしくはシリカビーズなどのビーズである。実質的に任意のビーズ半径を使用しうる。ビーズの例として、150ナノメートル~10ミクロンの範囲の半径を有するビーズを挙げることができる。他のサイズも使用しうる。
【0403】
本明細書に開示する方法およびキットは、1つまたは複数の緩衝液の使用を含みうる。緩衝液の例として、洗浄緩衝液、ライゲーション緩衝液、ハイブリダイゼーション緩衝液、増幅緩衝液、および逆転写緩衝液が挙げられるが、それらに限定されるわけではない。いくつかの態様において、ハイブリダイゼーション緩衝液は、TMAC Hyb溶液、SSPEハイブリダイゼーション溶液、およびECONO(商標)ハイブリダイゼーション緩衝液などといった市販の緩衝液である。本明細書に開示する緩衝液は、1つまたは複数の洗浄剤を含みうる。
【0404】
本明細書に開示する方法およびキットは、1つまたは複数のキャリアの使用を含みうる。キャリアは、本明細書に開示する1つまたは複数の反応(例えばライゲーション反応、逆転写、増幅、ハイブリダイゼーション)の効率を増強または改良しうる。キャリアは、分子またはその任意の産物(例えばポリヌクレオチドおよび/またはアンプリコン)の非特異的損失を減少させまたは防止しうる。例えばキャリアは、表面への吸収によるポリヌクレオチドの非特異的損失を減少させうる。キャリアは、表面または基板(例えば容器、エッペンドルフチューブ、ピペットチップ)に対するポリヌクレオチドのアフィニティーを減少させうる。あるいは、キャリアは、表面または基板(例えばビーズ、アレイ、ガラス、スライド、またはチップ)に対するポリヌクレオチドのアフィニティーを増加させうる。キャリアはポリヌクレオチドを分解から保護しうる。例えばキャリアはRNA分子をリボヌクレアーゼから保護しうる。あるいは、キャリアはDNA分子をDNaseから保護しうる。キャリアの例として、DNAおよび/もしくはRNAなどのポリヌクレオチドまたはポリペプチドが挙げられるが、それらに限定されるわけではない。DNAキャリアの例としては、プラスミド、ベクター、ポリアデニル化DNA、およびDNAポリヌクレオチドが挙げられる。RNAキャリアの例としては、ポリアデニル化RNA、ファージRNA、ファージMS2 RNA、大腸菌RNA、酵母RNA、酵母tRNA、哺乳動物RNA、哺乳動物tRNA、短いポリアデニル化合成リボヌクレオチドおよびRNAポリヌクレオチドが挙げられる。RNAキャリアはポリアデニル化RNAでありうる。あるいはRNAキャリアは非ポリアデニル化RNAでありうる。いくつかの態様において、キャリアは細菌、酵母またはウイルスに由来する。例えばキャリアは、細菌、酵母またはウイルスに由来するポリヌクレオチドまたはポリペプチドでありうる。例えばキャリアは枯草菌からのタンパク質である。別の一例において、キャリアは大腸菌からのポリヌクレオチドである。あるいはキャリアは、哺乳動物(例えばヒト、マウス、ヤギ、ラット、ウシ、ヒツジ、ブタ、イヌ、またはウサギ)、鳥類、両生類、または爬虫類からのポリヌクレオチドまたはペプチドである。
【0405】
本明細書に開示する方法およびキットは、1つまたは複数の対照因子の使用を含みうる。対照因子には、対照ポリヌクレオチド、不活性酵素、および/または非特異的競合因子が含まれうる。あるいは、対照因子は、ブライトハイブリダイゼーション(bright hybridization)、ブライトプローブ対照(bright probe control)、核酸テンプレート、スパイクイン(spike-in)対照、PCR増幅対照を含む。PCR増幅対照は陽性対照でありうる。別の例において、PCR増幅対照は陰性対照である。核酸テンプレート対照は既知の濃度を有しうる。対照因子は1つまたは複数のラベルを含みうる。
【0406】
スパイクイン対照は、反応または試料に添加されるテンプレートでありうる。例えばスパイクインテンプレートは増幅反応に添加しうる。スパイクインテンプレートは第1増幅サイクル後の任意の時点で増幅反応に添加することができる。いくつかの態様において、スパイクインテンプレートは、第2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、または50サイクル後に増幅反応に添加される。スパイクインテンプレートは、最終増幅サイクル前の任意の時点で増幅反応に添加しうる。スパイクインテンプレートは1つまたは複数のヌクレオチドまたは核酸塩基対を含みうる。スパイクインテンプレートはDNA、RNA、またはそれらの任意の組合せを含みうる。スパイクインテンプレートは1つまたは複数のラベルを含みうる。
【0407】
本明細書には、本明細書に開示する方法および組成物に使用することができる、または本明細書に開示する方法および組成物と共に使用することができる、または本明細書に開示する方法および組成物の調製に使用することができる、または本明細書に開示する方法および組成物の産物である、分子、材料、組成物および構成要素が開示される。これらの材料の組合せ、サブセット、相互作用、群などが開示され、その一方で、これらの分子および化合物のさまざまな各個物ならびに集合的な組合せおよび順列への具体的言及を明示的には開示できない場合も、それぞれは本明細書に具体的に想定され、記載されていると理解される。例えばあるヌクレオチドまたは核酸が開示され議論されており、そのヌクレオチドまたは核酸を含むいくつかの分子に加えることができるいくつかの修飾が議論されている場合は、別段の具体的表示がある場合を除き、ヌクレオチドまたは核酸と修飾との考えうるありとあらゆる組合せおよび順列が、具体的に想定される。この考えは、限定するわけではないが、開示される方法および組成物を作製し使用する方法における工程を含めて、本願のあらゆる局面に適用される。したがって、実施することができる多様な追加工程がある場合、それら追加工程のそれぞれは、開示される方法の任意の具体的態様または態様の組合せと共に実施することができ、そのような組合せのそれぞれは具体的に想定されており、開示されていると見なすべきであると、理解される。
【0408】
本明細書には、本明細書に記載する態様をいくつか示し、説明したが、そのような態様は例示にすぎない。当業者は、今や、本明細書において提供される開示から逸脱することなく、数多くの変形、変更および置換を思いつくだろう。本明細書に記載する方法の実施には、本明細書に記載する態様のさまざまな代替態様を使用することができると理解すべきである。
【0409】
別段の説明がある場合を除き、本明細書において使用される技術用語および科学用語はすべて、この開示が属する技術分野の当業者に一般に理解されているものと同じ意味を有する。以下の参考文献には、ここで使用することができる方法および組成物が含まれている:The Merck Manual of Diagnosis and Therapy,18th Edition,Merck Research Laboratories刊,2006(ISBN 0-91 19102)、Benjamin Lewin,Genes IX,Jones&Bartlett Publishing刊,2007(ISBN-13:9780763740634)、Kendrew et al.(eds.),The Encyclopedia of Mol.Biology,Blackwell Science Ltd.刊,1994(ISBN 0-632-02182-9)、およびRobert A.Meyers(ed.),Mol.Biology and Biotechnology:a Comprehensive Desk Reference,VCH Publishers,Inc.刊,1995(ISBN 1-56081-569-8)。
【0410】
本開示の標準的手順は、例えばManiatis et al,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(1982)、Sambrook et al.,Molecular Cloning:A Laboratory Manual(2 ed.),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(1989)、Davis et al,Basic Methods in Molecular Biology,Elsevier Science Publishing,Inc.,New York,USA(1986)またはMethods in Enzymology:Guide to Molecular Cloning Techniques Vol.152,S.L.Berger and A.R.Kimmerl(eds.),Academic Press Inc.,San Diego,USA(1987))に記載されている。Current Protocols in Molecular Biology(CPMB)(Fred M.Ausubel,et al.ed.,John Wiley and Sons,Inc.)、Current Protocols in Protein Science(CPPS)(John E.Coligan,et.al.,ed.,John Wiley and Sons,Inc.)、Current Protocols in Immunology(CPI)(John E.Coligan,et.al.,ed.John Wiley and Sons,Inc.)、Current Protocols in Cell Biology(CPCB)(Juan S.Bonifacino et.al.ed.,John Wiley and Sons,Inc.)、Culture of Animal Cells:A Manual of Basic Technique,R.Ian Freshney著,出版社:Wiley-Liss;5th edition(2005)、およびAnimal Cell Culture Methods(Methods in Cell Biology,Vol.57,編者Jennie P.MatherおよびDavid Barnes,Academic Press,第1版,1998)。
【0411】
VII. 定義
本明細書において使用する術語には、特定の例を説明する目的しかなく、限定を意図していない。別段の定義がある場合を除き、本明細書において使用される専門用語、表記ならびに他の技術的および科学的な用語および術語はすべて、本願請求項の対象が属する技術分野の当業者が一般に理解している意味と同じ意味を有するものとする。場合によっては、一般に理解されている意味を持つ用語を、明確な記述のためにかつ/またはすぐに参照できるように、本明細書において定義するが、そのような定義を本明細書に含めることは、必ずしも、当技術分野において一般に理解されているものとの実質的相違を表すと解釈されるべきではない。
【0412】
本明細書において使用される単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈上そうでないことが明らかである場合を除き、複数形も包含するものとする。さらにまた、「を包含する」(including、includes)、「を有する」(having、has)、「を持つ」(with)またはそれらの変形が詳細な説明および/または請求項のいずれかにおいて使用される限りにおいて、これらの用語は、「を含む」(comprising)と同様に、包含的(inclusive)であるものとする。
【0413】
「約」または「およそ」という用語は、当業者によって決定される特定の値に関して、許容誤差範囲内であることを意味することができ、それは、一つには、その値が測定または決定される方法、すなわち測定システムの制約に依存するであろう。例えば「約」は、当技術分野における慣例によれば、1(または1超の)標準偏差内であることを意味することができる。あるいは、「約」は、所与の値の、20%まで、10%まで、5%まで、または1%までの範囲を意味することができる。あるいは、特に生物学的なシステムまたは過程に関して、この用語は、ある値の、一桁以内、5倍以内、より好ましくは2倍以内を意味することができる。本願および特許請求の範囲において特定の値が記載される場合は、別段の言明がある場合を除き、その特定の値の許容誤差範囲内を意味する用語「約」が想定されるべきである。
【0414】
「ポリペプチド」および「タンパク質」という用語は、アミノ酸残基のポリマーを指すために相互可換的に使用され、最小長の制約を受けない。提供される抗体および抗体鎖ならびに他のペプチド、例えばリンカーおよび結合ペプチドなどといったポリペプチドは、天然アミノ酸残基および/または非天然アミノ酸残基を含むアミノ酸残基を含みうる。これらの用語は、ポリペプチドの発現後修飾、例えばグリコシル化、シアリル化、アセチル化、リン酸化なども包含する。いくつかの局面において、ポリペプチドは、タンパク質が所望の活性を維持している限り、ネイティブ配列または天然配列に関する修飾を含有しうる。これらの修飾は、部位指定変異導入による故意の修飾であってもよいし、タンパク質を産生する宿主の変異またはPCR増幅ゆえのエラーなどによる偶発的修飾であってもよい。
【0415】
ポリメラーゼ連鎖反応(PCR)とは、二本鎖ポリヌクレオチドの相補的鎖の同時プライマー伸長によるポリヌクレオチド配列のインビトロ増幅反応を指す。PCR反応では、プライマー結合部位に挟まれたテンプレートポリヌクレオチドのコピーが作製される。各サイクルで両鎖が複製されるので、2つのプライマーによる結果は、各サイクルでの両鎖のテンプレートポリヌクレオチドコピー数の指数的増加である。ポリヌクレオチド二重鎖は、使用したプライマーの端部に対応する末部を有する。PCRは、テンプレートポリヌクレオチドを変性させる工程、プライマー結合部位にプライマーをアニールさせる工程、およびヌクレオチドの存在下でDNAポリメラーゼまたはRNAポリメラーゼによってプライマーを伸長する工程の、1回または複数回の繰り返しを含みうる。各工程での具体的温度、持続時間、および工程間の変化速度は、当業者に周知の数多くの因子に依存する。(McPherson et al.,IRL Press,Oxford(1991および1995))。例えばTaq DNAポリメラーゼを用いる従来のPCRでは、>90℃で二本鎖テンプレートポリヌクレオチドを変性させ、50~75℃の範囲の温度でプライマーをアニールさせ、72~78℃の範囲の温度でプライマーを伸長することができる。いくつかの態様において、PCRは逆転写PCR(RT-PCR)、リアルタイムPCR、ネステッドPCR、定量PCR、マルチプレックスPCRなどを含む。いくつかの態様においてPCRはRT-PCRを含まない。(米国特許第5,168,038号、同第5,210,015号、同第6,174,670号、同第6,569,627号および同第5,925,517号、Mackay et al.,Nucleic Acids Research,30:1292-1305(2002))。RT-PCRはPCR反応の前に逆転写反応を含み、その結果生じたcDNAが増幅される。ネステッドPCRは2段階のPCRを含む。第1プライマーセットを用いる第1PCR反応のアンプリコンが、少なくとも一方が第1PCR反応のアンプリコンの内部の場所に結合する第2プライマーセットを用いる第2PCR反応にとっての試料になる。マルチプレックスPCRは、複数のポリヌクレオチド配列が同時に同じ反応混合物におけるPCRに供されるPCR反応を含む。PCR反応体積は0.2pLから1000μLまでのいずれかでありうる。定量PCRは、試料中の1つまたは複数の配列の絶対量もしくは相対量、存在量または濃度を測定するために設計されたPCR反応を含む。定量的測定は、1つまたは複数のリファレンス配列または標準を関心対象のポリヌクレオチド配列と比較する工程を含むことができる。(Freeman et al.,Biotechniques,26:112-126(1999)、Becker-Andre et al.,Nucleic Acids Research,17:9437-9447(1989)、Zimmerman et al.,Biotechniques,21:268-279(1996)、Diviacco et al.,Gene,122:3013-3020(1992)、Becker-Andre et al.,Nucleic Acids Research,17:9437-9446(1989))。
【0416】
本明細書にいう「ヌクレオチド」、「ヌクレオシド」、「ヌクレオチド残基」および「ヌクレオシド残基」とは、デオキシリボヌクレオチド残基もしくはリボヌクレオチド残基、または増幅反応(例えばPCR反応)における使用に適したプライマーの構成要素として役立ちうる他の類似するヌクレオシド類似体を意味しうる。そのようなヌクレオチドおよびそれらの誘導体は、別段の表示がある場合を除き、本明細書に記載するプライマーのビルディングブロックとして使用することができる。本願において、増幅反応におけるそれらの安定性または有用性を増強するために化学修飾されたヌクレオチド誘導体または塩基の利用は、その化学修飾が、ポリメラーゼによる適宜、デオキシグアニン、デオキシシトシン、デオキシチミジン、またはデオキシアデニンとしてのそれらの認識を妨害しない限り、排除されることはない。いくつかの態様において、ヌクレオチド類似体はハイブリッド形成を安定化することができる。いくつかの態様において、ヌクレオチド類似体はハイブリッド形成を不安定化することができる。いくつかの態様において、ヌクレオチド類似体はハイブリダイゼーションの特異性を増強することができる。いくつかの態様において、ヌクレオチド類似体はハイブリダイゼーションの特異性を低減することができる。
【0417】
「核酸」または文法上等価な用語は、単一のヌクレオチドを指すか、または共有結合で互いに連結された少なくとも2つのヌクレオチドを指す。
【0418】
「ポリヌクレオチド」または文法上等価な用語は、共有結合で互いに連結された少なくとも2つのヌクレオチドを指す。ポリヌクレオチドは2つまたはそれ以上のヌクレオチドを含有する分子を含む。ポリヌクレオチドは、プリン塩基およびピリミジン塩基を含むか、他の天然ヌクレオチド塩基、化学的もしくは生化学的に修飾された非天然ヌクレオチド塩基、またはヌクレオチド塩基の誘導体を含む、任意の長さのポリマー型ヌクレオチド、リボヌクレオチド、デオキシリボヌクレオチドまたはペプチド核酸(PNA)のいずれかを含む。ポリヌクレオチドの主鎖は、糖およびリン酸基を含むか、修飾または置換された糖またはリン酸基を含むことができる。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド類似体などの修飾ヌクレオチドを含むことができる。ヌクレオチドの配列は非ヌクレオチド構成要素で中断されていてもよい。ポリヌクレオチドは他の分子、例えばハイブリダイズした別のポリヌクレオチドを含むことができる。ポリヌクレオチドは、デオキシリボ核酸(DNA)、リボ核酸(RNA)、またはその両方の配列を含む。ポリヌクレオチドの非限定的な例としては、遺伝子、遺伝子フラグメント、エクソン、イントロン、遺伝子間DNA(ヘテロクロマチンDNAを含むが、それに限定されるわけではない)、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、低分子干渉RNA(siRNA)、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、ある配列の単離されたDNA、ある配列の単離されたRNA、核酸プローブおよびプライマーが挙げられる。ポリヌクレオチドは天然供給源から単離されるか、組換え体であるか、または人工的に合成することができる。
【0419】
ポリヌクレオチドは、非標準ヌクレオチド、例えばヌクレオチド類似体または修飾ヌクレオチドを含むことができる。いくつかの態様において、非標準ヌクレオチドはハイブリッド形成を安定化することができる。いくつかの態様において、非標準ヌクレオチドはハイブリッド形成を不安定化することができる。いくつかの態様において、非標準ヌクレオチドはハイブリダイゼーションの特異性を増強することができる。いくつかの態様において、非標準ヌクレオチドはハイブリダイゼーションの特異性を低減することができる。非標準ヌクレオチド修飾の例としては、2'O-Me、2'O-アリル、2'O-プロパルギル、2'O-アルキル、2'フルオロ、2'アラビノ、2'キシロ、2'フルオロアラビノ、ホスホロチオエート、ホスホロジチオエート、ホスホロアミデート、2'アミノ、5-アルキル置換ピリミジン、3'デオキシグアノシン、5-ハロ置換ピリミジン、アルキル置換プリン、ハロ置換プリン、二環式ヌクレオチド、2'MOE、PNA分子、LNA分子、LNA様分子、ジアミノプリン、S2T、5-フルオロウラシル、5-ブロモウラシル、5-クロロウラシル、5-ヨードウラシル、ヒポキサンチン、キサンチン(xantine)、4-アセチルシトシン、5-(カルボキシヒドロキシルメチル)ウラシル、5-カルボキシメチルアミノメチル-2-チオウリジン、5-カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ-D-ガラクトシルキューオシン、イノシン、N6-イソペンテニルアデニン、1-メチルグアニン、1-メチルイノシン、2,2-ジメチルグアニン、2-メチルアデニン、2-メチルグアニン、3-メチルシトシン、5-メチルシトシン、N6-アデニン、7-メチルグアニン、5-メチルアミノメチルウラシル、5-メトキシアミノメチル-2-チオウラシル、ベータ-D-マンノシルキューオシン、5'5'-メトキシカルボキシメチルウラシル、5-メトキシウラシル、2-メチルチオ-D46-イソペンテニルアデニン、ウラシル-5-オキシ酢酸(v)、ワイブトキソシン、シュードウラシル、キューオシン、2-チオシトシン、5-メチル-2-チオウラシル、2-チオウラシル、4-チオウラシル、5-メチルウラシル、ウラシル-5-オキシ酢酸メチルエステル、ウラシル-5-オキシ酢酸(v)、5-メチル-2-チオウラシル、3-(3-アミノ-3-N-2-カルボキシプロピル)ウラシル、(acp3)w、2,6-ジアミノプリン、およびそれらの誘導体が挙げられる。
【0420】
「対象」、「個体」、「宿主」または「患者」とは、哺乳動物などの生体を指す。対象および宿主の例として、ウマ、ウシ、ラクダ、ヒツジ、ブタ、ヤギ、イヌ、ネコ、ウサギ、モルモット、ラット、マウス(例えばヒト化マウス)、アレチネズミ、非ヒト霊長類(例えばマカク)、ヒトなど、ならびに例えば鳥類(例えばニワトリまたはアヒル)、魚類(例えばサメ)またはカエル(例えばゼノパス)などの非哺乳類脊椎動物および非哺乳類無脊椎動物を含む非哺乳動物、ならびにそれらのトランスジェニック種が挙げられるが、それらに限定されるわけではない。一定の局面において、対象とは単一の生物(例えばヒト)を指す。一定の局面において、研究しようとする共通の免疫因子および/もしくは疾患を有する小さなコホートならびに/または疾患を持たない個体のコホート(例えば陰性/正常対照)を構成する個体の群が提供される。試料が採取される対象は、疾患および/または障害(例えば1つまたは複数のアレルギー、感染症、がんまたは自己免疫障害など)を患っていてもよく、疾患に冒されていない陰性対照の対象と比較することができる。
【0421】
「キット」とは、本明細書に開示する方法を実行するための材料または試薬を送達するための送達システムを指す。いくつかの態様において、キットは、ある場所から別の場所への、反応試薬(例えば適当な容器に入っているプローブ、酵素など)および/もしくは補助材料(例えば緩衝液、アッセイを実施するための説明書など)の貯蔵、輸送または送達を可能にするシステムを含む。例えば、キットは、関連する反応試薬および/または補助材料が入っている1つまたは複数の筐体(例えば箱)を含む。そのような内容物は、意図したレシピエントに一緒にまたは別々に送達されうる。例えば第1容器はアッセイに使用される酵素を含有してもよく、一方、第2容器は複数のプライマーを含有する。
【0422】
「ポリペプチド」とは、いくつかの局面において、少なくとも2つのアミノ酸を含む分子を指す。いくつかの態様において、ポリペプチドは単一のペプチドからなる。いくつかの態様において、ポリペプチドは2つまたはそれ以上のペプチドを含む。例えば、ポリペプチドは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000個のペプチドまたはアミノ酸を含むことができる。ポリペプチドの例としては、アミノ酸鎖、タンパク質、ペプチド、ホルモン、ポリペプチド糖類、脂質、糖脂質、リン脂質、抗体、酵素、キナーゼ、受容体、転写因子、およびリガンドが挙げられるが、それらに限定されるわけではない。
【0423】
「試料」とは、いくつかの局面において、生物学的試料、環境試料、医学的試料、対象もしくは患者の試料、または標的ポリヌクレオチドなどのポリヌクレオチドを含有する試料を指す。
【0424】
「薬学的に許容される」とは、生理学的に認容でき、典型的には、ヒトに投与された場合に、アレルギー反応または類似の有害な反応、例えば急性胃蠕動異常亢進、めまいなどを生じない、分子実体および組成物を指す。
【0425】
「防止」とは、過剰なタンパク質レベルに関連するまたはタンパク質活性と相関する疾患または障害の予防、症状の発生の防止、進行の防止を指す。
【0426】
「阻害」、「処置」、および「処置する」は、相互可換的に使用され、例えば過剰なタンパク質レベルに関連するまたはタンパク質活性と相関する状態、疾患または障害の症状の停止、延命、症状の部分的なまたは完全な改善、および部分的なまたは完全な根絶を指す。例えば、がんの処置は、がん性増殖または腫瘍の停止、部分的除去または完全な排除を含むが、それらに限定されない。処置または部分的排除は、例えば成長または腫瘍サイズおよび/もしくは腫瘍体積の倍率低減(fold reduction)、例えば約2倍、約3倍、約4倍、約5倍、約10倍、約20倍、約50倍、またはその間の任意の倍率低減を含む。同様に、処置または部分的排除は、増殖または腫瘍サイズおよび/もしくは腫瘍体積の低減率、例えば約1%、2%、3%、4%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、またはその間の任意の低減率を含みうる。
【0427】
本願において言及する刊行物は、特許文書、科学論文およびデータベースを含めていずれも、あたかも個々の刊行物が参照により個別に本明細書に組み入れられた場合と同じ程度に、あらゆる目的で、その全体が本明細書に組み入れられる。本明細書に示される定義が参照により本明細書に組み入れられる特許、出願、出願公開および他の刊行物に示される定義と相反するか、または他の形で整合しない場合は、参照により本明細書に組み入れられる定義よりも本明細書に示される定義が優先される。
【0428】
例示のために応用例に関していくつかの局面を以下に記載する。本明細書に記載する特徴が完全に理解されるように、数多くの具体的詳細、関係および方法が示されることを理解すべきである。しかし、本明細書に記載する特徴を、具体的詳細のうちの1つまたは複数がなくても実施できることまたは他の方法でも実施できることは、関連技術分野の当業者にはすぐにわかるであろう。本明細書に記載する特徴は、例示した行為またはイベントの順序に限定されない。一部の行為は、異なる順序で行うことおよび/または他の行為またはイベントと並行して行うことができるからである。さらにまた、本明細書に記載する特徴に従って方法を履行するのに、例示された行為またはイベントのすべてが必要なわけではない。
【0429】
本明細書において使用する項目見出しは構成のみを目的とし、記載される主題を限定するものと解釈されるべきではない。
【0430】
VIII. 例示的な態様
提供される態様には以下の態様が含まれる。
1. 複数のバーコード化一本鎖ポリヌクレオチドのそれぞれの、バーコード化一本鎖ポリヌクレオチドのそれぞれに取り付けられた第1アダプターとは反対側の末端またはその近傍に、第2アダプターを付加する工程を含む、ポリヌクレオチドライブラリーを作製する方法であって、
前記複数のバーコード化一本鎖ポリヌクレオチドは、
(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンまたはその相補体を含む1つまたは複数の標的一本鎖ポリヌクレオチドと、
(ii)それぞれが前記細胞中のポリヌクレオチドのアンプリコンまたはその相補体を含む一本鎖ポリヌクレオチドの集合体と
を含み、
前記複数のバーコード化一本鎖ポリヌクレオチドのそれぞれは、前記細胞の集団の同じ細胞に由来する(i)および(ii)からのすべてのポリヌクレオチドについて同じであるベッセルバーコードを含む、方法。
2. 複数のバーコード化一本鎖ポリヌクレオチドが、細胞の集団中の複数の細胞の(i)および(ii)のポリヌクレオチドを含む、態様1記載の方法。
3. 複数のバーコード化一本鎖ポリヌクレオチドのそれぞれが、各一本鎖ポリヌクレオチドにユニークである分子バーコードをさらに含む、態様1または態様2記載の方法。
4. 細胞の集団の各細胞からの一本鎖ポリヌクレオチドの集合体が、全体として、トランスクリプトームまたは部分的トランスクリプトームの相補的DNA(cDNA)鎖を含む、態様1~3のいずれかに記載の方法。
5. トランスクリプトームまたは部分的トランスクリプトームが、全体として、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、態様1~4のいずれかに記載の方法。
6. バーコード化一本鎖ポリヌクレオチドのそれぞれが、50塩基対超または約50塩基対超、100塩基対超または200塩基対超であるサイズを有する、態様1~5のいずれかに記載の方法。
7. バーコード化一本鎖ポリヌクレオチドのそれぞれが、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する、態様1~6のいずれかに記載の方法。
8. 第2アダプターを付加する工程が、複数のバーコード化一本鎖ポリヌクレオチドを含む均一混合物において実行される、態様1~7のいずれかに記載の方法。
9. 第1アダプターがベッセルバーコードを含む、態様1~8のいずれかに記載の方法。
10. 以下の工程を含む、ポリヌクレオチドライブラリーを作製する方法:
(a)複数のベッセルのそれぞれの中で細胞を溶解する工程であって、該ベッセルのそれぞれが、細胞の集団を含む試料からの細胞を含む、工程;
(b)各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程であって、(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的ポリヌクレオチドを、1つまたは複数の標的特異的プライマーを使って作製することと(ii)それぞれが前記細胞中のポリヌクレオチドに相補的であるポリヌクレオチドの集合体をランダムオリゴプライマーを使って作製することとを含む、工程。
11. ベッセルのそれぞれが、複数の分子バーコード化オリゴヌクレオチド、1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、および任意で、第1アダプターをさらに含み、
(c)複数の相補的ポリヌクレオチドに、任意で複数の相補的ポリヌクレオチドのそれぞれに、前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、分子バーコードをそれぞれが含む複数の分子バーコード化ポリヌクレオチドを生成させる、工程、任意で、ここで前記分子バーコード化ポリヌクレオチドのそれぞれの分子バーコードは、前記複数の分子バーコード化オリゴヌクレオチド内の他の分子バーコード化ポリヌクレオチドに含まれる分子バーコードとは相異なり、かつ/またはユニークな分子バーコードである;
(d)前記1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つおよび第1アダプターまたはその増幅産物を、複数のバーコード化ポリヌクレオチドに、任意でバーコード化ポリヌクレオチドのそれぞれに、取り付ける工程であって、それによって、同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれが同じベッセルバーコードを含む、複数の二重バーコード化ポリヌクレオチドを生成させる、工程
をさらに含む、態様10記載の方法。
12. (e)複数の二重バーコード化ポリヌクレオチドの、任意で複数の二重バーコード化ポリヌクレオチドのそれぞれの、一本鎖アンプリコンを作製する工程
をさらに含む、態様11記載の方法。
13. (f)一本鎖アンプリコンのそれぞれに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程
をさらに含む、態様11記載の方法。
14. 以下の工程を含む、ポリヌクレオチドライブラリーを作製する方法:
(a)複数のベッセルのそれぞれの中で細胞を溶解する工程であって、該ベッセルのそれぞれが、細胞の集団を含む試料からの細胞、複数の分子バーコード化オリゴヌクレオチド、および1つのベッセルバーコード化オリゴヌクレオチドまたはベッセルバーコード化オリゴヌクレオチドのプール、ならびに任意で第1アダプターを含む、工程;
(b)(i)前記細胞中に存在する1つまたは複数の標的ポリヌクレオチドに相補的である1つまたは複数の標的ポリヌクレオチドを作製することと(ii)それぞれが前記細胞中のポリヌクレオチドに個別に相補的であるポリヌクレオチドの集合体を作製することとを含む、各ベッセル中で複数の相補的ポリヌクレオチドを作製する工程;
(c)各相補的ポリヌクレオチドに前記複数の分子バーコード化オリゴヌクレオチドのうちの1つを取り付ける工程であって、それによって、ユニークな分子バーコードをそれぞれが含む複数のバーコード化ポリヌクレオチドを生成させる、工程;
(d)前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールのうちの1つまたはその増幅産物を、前記バーコード化ポリヌクレオチドのそれぞれに取り付ける工程であって、それによって、複数の二重バーコード化ポリヌクレオチドを生成させる、工程、ここで同じベッセル内の二重バーコード化ポリヌクレオチドのそれぞれは同じベッセルバーコードを含む;
(e)前記複数の二重バーコード化ポリヌクレオチドのそれぞれの一本鎖アンプリコンを作製する工程;および
(f)前記一本鎖アンプリコンのそれぞれに第2アダプターを付加することによって、二重バーコード化一本鎖ポリヌクレオチドに第2アダプターを付加する工程であって、第1アダプターと第2アダプターとが二重バーコード化一本鎖ポリヌクレオチドのそれぞれの反対の端またはその近傍に存在する、工程。
15. 第1アダプターがベッセルバーコード化オリゴヌクレオチドを含む、態様11~14のいずれかに記載の方法。
16. 細胞の集団の各細胞からのポリヌクレオチドの集合体が、全体として、細胞のトランスクリプトームまたは部分的トランスクリプトームの転写産物に相補的な配列を含む、態様10~15のいずれかに記載の方法。
17. トランスクリプトームまたは部分的トランスクリプトームが、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、態様16記載の方法。
18. 細胞中の1つもしくは複数の標的ポリヌクレオチドおよび/またはポリヌクレオチドがDNAである、態様1~17のいずれかに記載の方法。
19. 細胞中の1つもしくは複数の標的ポリヌクレオチドおよび/またはポリヌクレオチドがRNAである、態様1~18のいずれかに記載の方法。
20. RNAがmRNAである、態様19記載の方法。
21. 前記(b)の相補的ポリヌクレオチドのそれぞれまたは(b)の相補的ポリヌクレオチドのうちの1つもしくは複数がcDNAである、態様10~20のいずれかに記載の方法。
22. バーコード化一本鎖ポリヌクレオチドのそれぞれまたはバーコード化一本鎖ポリヌクレオチドのうちの1つもしくは複数が、cDNAの鎖である、態様1~21のいずれかに記載の方法。
23. 第1アダプターおよび/または第2アダプターが少なくとも1つのユニバーサルプライミング部位を含む、態様1~22のいずれかに記載の方法。
24. 第1アダプターと第2アダプターとは異なり、かつ/または
第1アダプターは第1ユニバーサルプライミング部位を含み、第2アダプターは第2ユニバーサルプライミング部位を含み、任意で第1ユニバーサルプライミング部位と第2ユニバーサルプライミング部位とは異なる、
態様1~23のいずれかに記載の方法。
25. 第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分を含み、任意で前記その連続する一部分は相補的配列にアニールするのに十分である、態様24記載の方法。
26. 第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含み、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含む、態様24または態様25記載の方法。
27. P7プライミング部位(C7)が配列
を含むか、またはその連続する一部分である、態様25または態様26記載の方法。
28. P5プライミング部位が配列
を含むか、またはその連続する一部分である、態様25または態様26記載の方法。
29. 連続する一部分が少なくとも15、20、25もしくは30ヌクレオチド長を含む、または少なくとも約15、20、25もしくは30ヌクレオチド長を含む、態様25~28のいずれかに記載の方法。
30. P5プライミング部位がSEQ ID NO:25
に示す連続する一部分である、態様25、26、28または29のいずれかに記載の方法。
31. 第2アダプターを付加する工程が、スプリントオリゴヌクレオチドを、バーコード化一本鎖ポリヌクレオチドのそれぞれに、第2ユニバーサルプライミング部位を含むオリゴヌクレオチドの存在下でハイブリダイズさせる工程を含み、スプリントオリゴヌクレオチドは(i)第2ユニバーサルプライミング部位に相補的な配列と(ii)バーコード化一本鎖ポリヌクレオチドの3'端にランダムにアニールする能力を有する縮重オーバーハング配列とを含む、態様1~9および態様13~30のいずれかに記載の方法。
32. ハイブリダイゼーションに先だって、スプリントオリゴヌクレオチドと第2ユニバーサルプライミング部位を含むオリゴヌクレオチドとをアニールさせることで、スプリント-アダプター二重鎖を形成させる、態様31記載の方法。
33. 縮重オーバーハング配列が配列(N)3~12を含み、ここでNは任意のヌクレオチドである、態様31または態様32記載の方法。
34. 縮重オーバーハング配列が配列NNNNNN(SEQ ID NO:24)を含み、ここでNは任意のヌクレオチドである、態様31~33のいずれかに記載の方法。
35. スプリントオリゴヌクレオチドが配列
(SEQ ID NO:26)を含み、ここでNは任意のアミノ酸である、態様31~34のいずれかに記載の方法。
36. 第2ユニバーサルプライミング部位を含むオリゴヌクレオチドが配列
を含む、態様31~35のいずれかに記載の方法。
37. ベッセルバーコード化オリゴヌクレオチドが、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、態様1~9および態様11~36のいずれかに記載の方法。
38. ベッセルバーコード化オリゴヌクレオチドが10~30ヌクレオチドまたは約10~30ヌクレオチドを含む、態様1~9および態様11~37のいずれかに記載の方法。
39. ベッセルバーコード化オリゴヌクレオチドが縮重配列を含む、態様1~38のいずれかに記載の方法。
40. ベッセルバーコード化オリゴヌクレオチドが配列(N)14~17を含み、ここでNは任意のヌクレオチドであり、任意で、配列中の少なくとも1つまたは2つのNはWであり、ここでWはアデニンまたはチミンである、態様1~9および態様11~39のいずれかに記載の方法。
41. ベッセルバーコード化オリゴヌクレオチドが配列
を含み、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである、態様1~9および態様11~40のいずれかに記載の方法。
42. 各ベッセルは第1アダプターのプールを含み、第1アダプターのプールの各ベッセルバーコード化オリゴヌクレオチドは、前記プール中の他のベッセルバーコード化オリゴヌクレオチドの少なくとも1つと比較して、少なくとも1つの塩基シフトまたは塩基付加を含む、態様11~41のいずれかに記載の方法。
43. 第1アダプターのプールのベッセルバーコード化オリゴヌクレオチドが配列
を含み、ここでNは任意のヌクレオチドであり、Wはアデニンまたはチミンである、態様42記載の方法。
44. 工程(d)において、
1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプール、または
前記1つのベッセルバーコード化オリゴヌクレオチドもしくはベッセルバーコード化オリゴヌクレオチドのプールを含む、第1アダプター
を増幅することをさらに含み、
前記増幅が、ベッセルバーコード化オリゴヌクレオチドの取り付けに先だってまたはベッセルバーコード化オリゴヌクレオチドの取り付けと同時に実施される、態様11~43のいずれかに記載の方法。
45. ベッセルバーコード化オリゴヌクレオチドを取り付ける工程が、ベッセルバーコード化オリゴヌクレオチドの一領域を、相補的ポリヌクレオチドのそれぞれの一領域に、または分子バーコードを含む分子バーコード化ポリヌクレオチドのそれぞれの一領域に、ハイブリダイズさせることを含む、態様11~44のいずれかに記載の方法。
46. 領域が分子バーコード化ポリヌクレオチドの分子バーコードの5'末領域に相補的である3'タグ付けポリヌクレオチドを含む、態様45記載の方法。
47. 工程(b)において、
1つまたは複数の標的ポリヌクレオチドは、逆転写酵素および標的ポリヌクレオチドの標的配列に相補的な1つまたは複数の標的特異的プライマーの存在下で、標的ポリヌクレオチドの逆転写によって作製され、かつ/または
ポリヌクレオチドの集合体は、逆転写酵素および細胞中のポリヌクレオチドに相補的な1つまたは複数のトランスクリプトームプライマーの存在下で、細胞中のポリヌクレオチドの逆転写によって作製される、
態様10~46のいずれかに記載の方法。
48. 1つまたは複数の標的ポリヌクレオチドが免疫分子またはその鎖のポリヌクレオチドを含む、態様1~47のいずれかに記載の方法。
49. 1つまたは複数の標的ポリヌクレオチドは、それぞれが免疫分子鎖のポリヌクレオチドを含む少なくとも2つの標的ポリヌクレオチドを含む、態様1~48のいずれかに記載の方法。
50. 1つまたは複数の標的ポリヌクレオチドがTCRまたはその鎖のポリヌクレオチドを含む、態様1~49のいずれかに記載の方法。
51. 1つまたは複数の標的ポリヌクレオチドがT細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含む、態様1~50のいずれかに記載の方法。
52. 1つまたは複数の標的ポリヌクレオチドがT細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ)の第2ポリヌクレオチドを含む、態様1~50のいずれかに記載の方法。
53. 1つまたは複数の標的ポリヌクレオチドが抗体またはその鎖のポリヌクレオチドを含む、態様1~49のいずれかに記載の方法。
54. 1つまたは複数の標的ポリヌクレオチドが重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含む、態様1~49および態様53のいずれかに記載の方法。
55. 1つもしくは複数の標的特異的プライマーおよび/または1つもしくは複数のトランスクリプトームプライマーがポリ(T)配列を含む、態様47~54のいずれかに記載の方法。
56. 1つまたは複数のトランスクリプトームプライマーがランダムヘキサマーオリゴヌクレオチドプライマーの混合物を含む、態様47~54のいずれかに記載の方法。
57. 1つまたは複数の標的特異的プライマーが標的ポリヌクレオチドの標的配列の配列に相補的な1つまたは複数のプライマーを含む、態様47~56のいずれかに記載の方法。
58. 1つまたは複数の標的特異的プライマーが少なくとも第1プライマーと第2プライマーとを含む、態様57記載の方法。
59. 1つまたは複数の標的特異的プライマーが、複数の免疫分子またはその鎖の標的配列に対するプライマーを含む、態様57または態様58記載の方法。
60. 免疫分子がT細胞受容体または抗体である、態様59記載の方法。
61. 少なくとも第1プライマーは、免疫分子の第1鎖のポリヌクレオチドの標的配列に相補的であり、かつ第2プライマーは、前記免疫分子の第2鎖のポリヌクレオチドの標的配列に相補的である、態様58~60のいずれかに記載の方法。
62. 第1プライマーおよび第2プライマーが、あるTCRの異なるTCR鎖ポリヌクレオチドの標的配列に相補的である、態様58~61のいずれかに記載の方法。
63. 第1プライマーがTCRアルファポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRベータポリヌクレオチド配列の標的配列に相補的であるか、または
第1プライマーがTCRガンマポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRデルタポリヌクレオチド配列の標的配列に相補的である、
態様58~62のいずれかに記載の方法。
64. TCR鎖ポリヌクレオチドの標的配列が定常領域配列である、態様62または態様63記載の方法。
65. 第1プライマーがTCRアルファ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRベータ定常領域ポリヌクレオチド配列の標的配列に相補的であるか、または
第1プライマーがTCRガンマ定常領域ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーがTCRデルタ定常領域ポリヌクレオチド配列の標的配列に相補的である、
態様58~64のいずれかに記載の方法。
66. 少なくとも第1プライマーおよび第2プライマーは、抗体の、異なる抗体鎖ポリヌクレオチドの標的配列に相補的である、態様58~61のいずれかに記載の方法。
67. 第1プライマーが重鎖免疫グロブリン(IgH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーが軽鎖免疫グロブリン(IgL)ポリヌクレオチド配列の標的配列に相補的である、態様58~61および態様66のいずれかに記載の方法。
68. 抗体鎖ポリヌクレオチドの標的配列が定常領域配列である、態様66または態様67記載の方法。
69. 第1プライマーが重鎖定常領域(CH)ポリヌクレオチド配列の標的配列に相補的であり、かつ第2プライマーが軽鎖定常領域(CL)ポリヌクレオチド配列の標的配列に相補的である、態様58~61および態様66~68のいずれかに記載の方法。
70. CHポリヌクレオチドの標的配列がIgM、IgD、IgA、IgEもしくはIgG、またはそれらの組合せに由来し、かつ/あるいは
CLポリヌクレオチド配列の標的配列がIgカッパ、Igラムダまたはそれらの組合せに由来する、
態様68または態様69記載の方法。
71. 1つまたは複数の標的ポリヌクレオチドが全長コーディング配列を含む、態様1~70のいずれかに記載の方法。
72. 1つまたは複数の標的ポリヌクレオチドおよびポリヌクレオチドの集合体が、同じ反応体積中のベッセル内で作製される、態様10~71のいずれかに記載の方法。
73. 工程(b)において、複数の相補的ポリヌクレオチドを作製する工程は、非テンプレートターミナルトランスフェラーゼの使用を含み、3つ以上の非テンプレートヌクレオチド、リボヌクレオチドまたはその類似体が、作製された各相補的ポリヌクレオチドの3'端に付加される、態様10~72のいずれかに記載の方法。
74. 非テンプレートターミナルトランスフェラーゼが逆転写酵素またはポリメラーゼである、態様73記載の方法。
75. 非テンプレートターミナルトランスフェラーゼが逆転写酵素であり、逆転写酵素は、Superscript II逆転写酵素、Maxima逆転写酵素、Protoscript II逆転写酵素、マロニー(Maloney)マウス白血病ウイルス逆転写酵素(MMLV-RT)、HighScriber逆転写酵素、鳥類骨髄芽球症ウイルス(AMV)逆転写酵素、ターミナルデオキシヌクレオチジルトランスフェラーゼ活性を含む任意の逆転写酵素、およびそれらの組合せから選択される、態様73または態様74記載の方法。
76. 工程(c)において、取り付ける工程は、前記分子バーコード化オリゴヌクレオチドのうちの1つの一領域を、相補的ポリヌクレオチドのそれぞれの3つ以上の非テンプレートヌクレオチドにハイブリダイズさせることを含む、態様11~75のいずれかに記載の方法。
77. 複数の分子バーコード化オリゴヌクレオチドは、それぞれが3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチオリゴヌクレオチドとして提供される、態様73~75のいずれかに記載の方法。
78. テンプレートスイッチオリゴヌクレオチドは、ベッセルバーコードを含む第1アダプターの3'タグ付けオリゴヌクレオチドに相補的である5'末領域を、さらに含む、態様77記載の方法。
79.逆転写酵素はテンプレートスイッチング活性を有し、
複数の作製された相補的ポリヌクレオチドのうちの少なくともいくつかの鎖は、3つ以上の非テンプレートヌクレオチドを含む3'オーバーハングを含み、
複数の分子バーコード化オリゴヌクレオチドは、それぞれが(1)ベッセルバーコードを含む第1アダプターの3'タグ付けオリゴヌクレオチドに相補的である5'末領域、(2)分子バーコードならびに(3)前記3'オーバーハングの前記3つ以上の非テンプレートヌクレオチドに相補的な3'部分を含む複数のテンプレートスイッチオリゴヌクレオチドとして提供され、
テンプレートスイッチオリゴヌクレオチドは、分子バーコードが各相補的ポリヌクレオチドに組み入れられるように、逆転写酵素のテンプレートとして役立つ、
態様11~78のいずれかに記載の方法。
80. 3つ以上の非テンプレートヌクレオチドに相補的な3'部分が、ヌクレオチド、リボヌクレオチドまたはそれらの類似体を含む、態様77~79のいずれかに記載の方法。
81. 3つ以上の非テンプレートヌクレオチドが3つ以上のCヌクレオチドを含み、3つ以上の非テンプレートヌクレオチドに相補的な3'部分が1つまたは複数のGヌクレオチドもしくはリボヌクレオチドまたはそれらの類似体を含む、態様73~80のいずれかに記載の方法。
82. テンプレートスイッチオリゴヌクレオチドが、逆転写酵素またはDNAポリメラーゼによる伸長を阻止する3'修飾ヌクレオチドをさらに含む、態様73~77のいずれかに記載の方法。
83. 修飾が3'ヌクレオチドのデオキシ、リン酸、アミノ、またはアルキル修飾である、態様82記載の方法。
84. 工程(d)が、取り付ける工程の後に複数の相補的分子バーコード化ポリヌクレオチドのそれぞれを伸長する工程をさらに含む、態様11~83のいずれかに記載の方法。
85. ベッセルがウェル、エマルジョンまたは液滴である、態様1~84のいずれかに記載の方法。
86. 工程(e)の前に、複数のベッセルのうちの2つまたはそれ以上の内容物を合わる工程であって、それによって、複数の二重バーコード化一本鎖ポリヌクレオチドのうちの2つまたはそれ以上を含む均一混合物を生成させる、工程
を含む、態様12~85のいずれかに記載の方法。
87. 複数のベッセルの内容物を合わせる工程が、複数のベッセルの2つまたはそれ以上を破壊して、2つまたはそれ以上の破壊されたベッセルからの二重バーコード化一本鎖ポリヌクレオチドをプールすることを含む、態様86記載の方法。
88.工程(e)の前に、50塩基対超または約50塩基対超、100塩基対超、または200塩基対超であるサイズを有する二重バーコード化一本鎖ポリヌクレオチドを選択または精製する工程を含む、態様86または態様87記載の方法。
89.工程(e)の前に、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する二重バーコード化一本鎖ポリヌクレオチドを選択または精製する工程を含む、態様86~88のいずれかに記載の方法。
90. 二重バーコード化一本鎖ポリヌクレオチドが、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含む、態様1~89のいずれかに記載の方法。
91. 第1アダプターが二重バーコード化一本鎖ポリヌクレオチドの5'領域またはその近傍に位置する、態様1~90のいずれかに記載の方法。
92. 第2アダプターが二重バーコード化一本鎖ポリヌクレオチドの3'領域またはその近傍に位置する、態様1~91のいずれかに記載の方法。
93. 工程(a)~(f)のうちの1つまたは複数が
溶解状態で実行され、かつ/または
固体支持体(任意でビーズ)の存在下では実行されない、
態様10~92のいずれかに記載の方法。
94. 少なくとも工程(c)および(d)が
溶解状態で実行され、かつ/または
固体支持体(任意でビーズ)の存在下では実行されない、
態様11~93のいずれかに記載の方法。
95. 工程(a)~(e)のそれぞれが
溶解状態で実行され、かつ/または
固体支持体(任意でビーズ)の存在下では実行されない、
態様10~94のいずれかに記載の方法。
96. 細胞の集団が、少なくとも1×103、5×103、1×104、5×104、1×105、5×105、1×106、または5×106細胞を含む、またはおよそ少なくとも1×103、5×103、1×104、5×104、1×105、5×105、1×106、または5×106細胞を含む、態様1~95のいずれかに記載の方法。
97. 細胞の集団が、対象からの生物学的試料に由来する、態様1~96のいずれかに記載の方法。
98. 生物学的試料が、全血試料、バフィーコート試料、末梢血単核球(PBMC)試料、未分画T細胞試料、リンパ球試料、白血球試料、アフェレーシス産物、または白血球アフェレーシス産物であるか、全血試料、バフィーコート試料、末梢血単核球(PBMC)試料、未分画T細胞試料、リンパ球試料、白血球試料、アフェレーシス産物、または白血球アフェレーシス産物を含む、態様97記載の方法。
99. 細胞の集団が免疫細胞を含む、態様1~98のいずれかに記載の方法。
100. 免疫細胞がリンパ球または抗原提示細胞を含む、態様1~99のいずれかに記載の方法。
101. 免疫細胞が、リンパ球もしくはそのサブタイプ、B細胞もしくはそのサブタイプ、T細胞もしくはそのサブタイプ、またはそれらの組合せである、態様1~100のいずれかに記載の方法。
102. 免疫細胞が、CD4+および/またはCD8+T細胞であるT細胞である、態様101記載の方法。
103. 細胞の集団は、セントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞、エフェクターT細胞および制御性T細胞が濃縮されているか、またはセントラルメモリーT細胞、エフェクターメモリーT細胞、ナイーブT細胞、幹セントラルメモリーT細胞、エフェクターT細胞および制御性T細胞を含む、態様1~102のいずれかに記載の方法。
104. 細胞の集団は、メモリーB細胞、ナイーブB細胞または形質芽球B細胞が濃縮されている、態様1~101のいずれかに記載の方法。
105. 対象がヒト対象である、態様97~104のいずれかに記載の方法。
106. 対象が、がん、感染症または自己免疫状態を有する、態様97~105のいずれかに記載の方法。
107. 感染症がウイルス感染症、細菌感染症または真菌感染症である、態様106記載の方法。
108. 複数のバーコード化一本鎖ポリヌクレオチドを増幅する工程であって、それによって、複数のポリヌクレオチドテンプレートを生成させる、工程
をさらに含む、態様1~107のいずれかに記載の方法。
109. 増幅が、第1アダプター配列に相補的な第1プライマーと第2アダプター配列に相補的な第2プライマーとを含む第1プライマーセットの存在下で実行される、態様1~108のいずれかに記載の方法。
110. 第1プライマーおよび/または第2プライマーがユニバーサルプライマーである、態様109記載の方法。
111. 第1プライマーおよび/または第2プライマーが、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である、態様110記載の方法。
112. 第1プライマーがP7プライミング部位(C7)またはその連続する一部分に相補的であり、第2プライマーがP5プライミング部位(C5)またはその連続する一部分に相補的である、態様110または態様111記載の方法。
113. P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーが、配列
を有するか、もしくは同配列を含み、かつ/または
P5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーが、配列
を含む、
態様111または態様112記載の方法。
114. 第1プライマーおよび/または第2プライマーがシーケンシングアダプターをさらに含む、態様109~113のいずれかに記載の方法。
115. P7プライミング部位(C7)またはその連続する一部分に相補的であるプライマーが配列
をさらに含み、かつ/または
P5プライミング部位(C5)もしくはその連続する一部分に相補的であるプライマーが配列
を含む、
態様114記載の方法。
116. 複数のバーコード化ポリヌクレオチドのそれぞれを精製する工程をさらに含む、態様115記載の方法。
117. 態様1~116のいずれかに記載の方法によって作製される複数のバーコード化ポリヌクレオチドを含む、ポリヌクレオチドライブラリー。
118. 複数のバーコード化ポリヌクレオチドを含むポリヌクレオチドライブラリーであって、
前記複数のバーコード化ポリヌクレオチドは、(i)細胞の集団の細胞中に存在する1つまたは複数の標的ポリヌクレオチドのアンプリコンを含む1つまたは複数の標的ポリヌクレオチドと(ii)それぞれが前記細胞中のポリヌクレオチドのアンプリコンを含むポリヌクレオチドの集合体とを含み、
各バーコード化ポリヌクレオチドは、
第1ユニバーサルプライマーに相補的である第1ユニバーサルプライミング部位を含む第1アダプター、
前記細胞の集団の同じ細胞に由来する(i)および(ii)からのバーコード化ポリヌクレオチドについてはすべて同じであるベッセルバーコード、ならびに
第2ユニバーサルプライマーに相補的である第2ユニバーサルプライミング部位を含む第2アダプター配列
を含む、ポリヌクレオチドライブラリー。
119. 複数のバーコード化ポリヌクレオチドテンプレートのそれぞれが、各ポリヌクレオチドテンプレートにユニークである分子バーコードを含む、態様118記載のポリヌクレオチドライブラリー。
120. 細胞の集団の各細胞からのバーコード化ポリヌクレオチドテンプレートの集合体が、全体として、トランスクリプトームまたは部分的トランスクリプトームの相補的DNA(cDNA)鎖を含む、態様118または態様119記載のポリヌクレオチドライブラリー。
121. トランスクリプトームまたは部分的トランスクリプトームが、全体として、細胞のゲノムに存在する転写産物のうちの少なくとも60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%を含む、態様118~120のいずれかに記載のポリヌクレオチドライブラリー。
122. バーコード化ポリヌクレオチドテンプレートのそれぞれが、50塩基対超または約50塩基対超、100塩基対超または200塩基対超であるサイズを有する、態様118~121のいずれかに記載のポリヌクレオチドライブラリー。
123. バーコード化一本鎖ポリヌクレオチドのそれぞれが、50塩基対(bp)~1500bpもしくは約50bp~1500bp、50bp~1250bpもしくは約50bp~1250bp、50bp~1000bpもしくは約50bp~1000bp、50bp~750bpもしくは約50bp~750bp、50bp~500bpもしくは約50bp~500bp、100bp~1500bpもしくは約100bp~1500bp、100bp~1250bpもしくは約100bp~1250bp、100bp~1000bpもしくは約100bp~1000bp、100bp~750bpもしくは約100bp~750bp、100bp~500bpもしくは約100bp~500bp、200bp~1500bpもしくは約200bp~1500bp、200bp~1250bpもしくは約200bp~1250bp、200bp~1000bpもしくは約200bp~1000bp、200bp~750bpもしくは約200bp~750bpまたは250bp~500bpもしくは約250bp~500bpのサイズを有する、態様118~122のいずれかに記載のポリヌクレオチドライブラリー。
124. 第1アダプターがベッセルバーコードを含む、態様118~123のいずれかに記載のポリヌクレオチドライブラリー。
125. 第1アダプターと第2アダプターとが異なる、態様118~124のいずれかに記載のポリヌクレオチドライブラリー。
126. 第1ユニバーサルプライミング部位および/または第2ユニバーサルプライミング部位は、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分であるか、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分を含み、任意で前記その連続する一部分は相補的配列にアニールするのに十分である、態様118~125のいずれかに記載のポリヌクレオチドライブラリー。
127. 第1ユニバーサルプライミング部位はP7プライミング部位(C7)もしくはその連続する一部分であるか、またはP7プライミング部位(C7)もしくはその連続する一部分を含み、第2ユニバーサルプライミング部位はP5プライミング部位(C5)もしくはその連続する一部分であるか、またはP5プライミング部位(C5)もしくはその連続する一部分を含む、態様118~126のいずれかに記載のポリヌクレオチドライブラリー。
128. P7プライミング部位(C7)が配列
を含むか、またはその連続する一部分である、態様126または態様127記載のポリヌクレオチドライブラリー。
129. P5プライミング部位が配列
を含むか、またはその連続する一部分である、態様126または態様127記載のポリヌクレオチドライブラリー。
130. 連続する一部分が少なくとも15、20、25もしくは30ヌクレオチド長を含む、または少なくとも約15、20、25もしくは30ヌクレオチド長を含む、態様126~129のいずれかに記載のポリヌクレオチドライブラリー。
131. P5プライミング部位がSEQ ID NO:25
に示す連続する一部分である、態様129または態様130記載のポリヌクレオチドライブラリー。
132. ベッセルバーコード化オリゴヌクレオチドが、少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、またはおよそ少なくとも3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレオチドを含む、態様118~131のいずれかに記載のポリヌクレオチドライブラリー。
133. ベッセルバーコード化オリゴヌクレオチドが10~30ヌクレオチドまたは約10~30ヌクレオチドを含む、態様118~132のいずれかに記載のポリヌクレオチドライブラリー。
134. 1つまたは複数の標的ポリヌクレオチドが免疫分子またはその鎖のポリヌクレオチドを含む、態様118~133のいずれかに記載のポリヌクレオチドライブラリー。
135. 1つまたは複数の標的ポリヌクレオチドは、それぞれが免疫分子鎖のポリヌクレオチドを含む少なくとも2つの標的ポリヌクレオチドを含む、態様118~134のいずれかに記載のポリヌクレオチドライブラリー。
136. 1つまたは複数の標的ポリヌクレオチドがTCRまたはその鎖のポリヌクレオチドを含む、態様118~135のいずれかに記載のポリヌクレオチドライブラリー。
137. 1つまたは複数の標的ポリヌクレオチドがT細胞受容体アルファ(TCRα)の第1ポリヌクレオチドおよびT細胞受容体(TCRβ)の第2ポリヌクレオチドを含む、態様118~136のいずれかに記載のポリヌクレオチドライブラリー。
138. 1つまたは複数の標的ポリヌクレオチドがT細胞受容体ガンマ(TCRγ)の第1ポリヌクレオチドおよびT細胞受容体デルタ(TCRデルタ)の第2ポリヌクレオチドを含む、態様118~136のいずれかに記載のポリヌクレオチドライブラリー。
139. 1つまたは複数の標的ポリヌクレオチドが抗体またはその鎖のポリヌクレオチドを含む、態様118~135のいずれかに記載のポリヌクレオチドライブラリー。
140. 1つまたは複数の標的ポリヌクレオチドが重鎖免疫グロブリン(IgH)ポリヌクレオチドの第1ポリヌクレオチドおよび軽鎖免疫グロブリン(IgL)ポリヌクレオチドの第2ポリヌクレオチドを含む、態様118~135および態様139のいずれかに記載のポリヌクレオチドライブラリー。
141. バーコード化ポリヌクレオチドが、順に(5'から3'へ)、第1アダプター、ベッセルバーコード、分子バーコードおよび第2アダプターを含む、態様118~140のいずれかに記載のポリヌクレオチドライブラリー。
142. 第1アダプターが二重バーコード化一本鎖ポリヌクレオチドの5'領域またはその近傍に位置する、態様118~1141のいずれかに記載のポリヌクレオチドライブラリー。
143. 第2アダプターが二重バーコード化一本鎖ポリヌクレオチドの3'領域またはその近傍に位置する、態様118~137のいずれかに記載のポリヌクレオチドライブラリー。
144.態様1~116のいずれかによって作製される、または態様118~141のいずれかに記載のポリヌクレオチドライブラリーからの、複数のバーコード化ポリヌクレオチドのうちの1つまたは複数をシーケンシングする工程を含む、シーケンシングの方法。
145. 複数のバーコード化ポリヌクレオチドからのトランスクリプトームがシーケンシングされる、態様144記載の方法。
146. シーケンシングに先だって、全トランスクリプトームまたはその一部分を増幅する工程をさらに含む、態様145記載の方法。
147. 増幅が、それぞれ第1アダプター配列と第2アダプター配列に特異的な第1プライマーと第2プライマーとを含む第1プライマーセットを使って実行される、態様146記載の方法。
148 .複数のバーコード化ポリヌクレオチドからの1つまたは複数の標的ポリヌクレオチドがシーケンシングされる、態様146または態様147記載の方法。
149. シーケンシングに先だって、複数のポリヌクレオチドテンプレートから1つまたは複数の標的ポリヌクレオチドを増幅する工程をさらに含む、態様148記載の方法。
150. 1つまたは複数の標的ポリヌクレオチドの全長配列が増幅される、態様149記載の方法。
151. 増幅が、1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーと第1アダプター配列に相補的な第2プライマーとを含む第2プライマーセットの存在下で実行される、態様149または態様150記載の方法。
152. 第2プライマーセットの第2プライマーが、P7プライミング部位(C7)もしくはその連続する一部分またはP5プライミング部位(C5)もしくはその連続する一部分に相補的である、態様151記載の方法。
153. 第2プライマーセットの第2プライマーが、P7プライミング部位(C7)またはその連続する一部分に相補的である、態様151または態様152記載の方法。
154. 第2プライマーセットの第2プライマーが、配列
を有するか、または同配列を含む、態様151~153のいずれかに記載の方法。
155. 1つまたは複数の標的ポリヌクレオチドに相補的な1つまたは複数の第1プライマーが、免疫分子またはその鎖の標的配列に特異的である、態様151~154のいずれかに記載の方法。
156. 免疫分子がT細胞受容体または抗体である、態様155記載の方法。
157. 1つまたは複数の第1プライマーが、免疫分子の定常領域の標的配列に特異的である、態様155または態様156記載の方法。
158. 免疫分子がTCRであり、かつ1つまたは複数の第1プライマーが
またはそれらの組合せを含む、態様155~157のいずれかに記載の方法。
159. 免疫分子が抗体であり、1つまたは複数の第1プライマーがSEQ ID NO:29~36のいずれかまたはそれらの組合せを含む、態様155~158のいずれかに記載の方法。
160. 1つまたは複数のバーコード化ポリヌクレオチドの細胞起源を決定する工程を含む、態様144~159のいずれかに記載の方法。
161. 細胞起源を決定する工程が、同じベッセルバーコードを有する配列情報を、同じ細胞からのものであると同定することを含む、態様160記載の方法。
162. 標的ポリヌクレオチドが、第1ポリヌクレオチド鎖および第2ポリヌクレオチド鎖を含む免疫分子であり、
同じベッセルバーコードの存在によって、第1ポリヌクレオチド鎖と第2ポリヌクレオチド鎖とを同じ細胞にマッチングさせる工程を含む、態様144~161のいずれかに記載の方法。
163. 同じ分子バーコードを持つポリヌクレオチドの数を定量または決定する工程をさらに含む、態様154~162のいずれかに記載の方法。
164. 同じベッセルバーコードを有するトランスクリプトーム配列および標的ポリヌクレオチド配列を同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する細胞のトランスクリプトーム情報を同定する、工程
を含む、態様154~163のいずれかに記載の方法。
165. 以下の工程を含む、トランスクリプトーム解析のための方法:
(a)態様1~116のいずれかに記載の方法によって作製される複数のバーコード化ポリヌクレオチドから、または態様118~141のいずれかに記載のポリヌクレオチドライブラリーの複数のバーコード化ポリヌクレオチドから、標的ポリヌクレオチドをシーケンシングする工程であって、それによって、複数の細胞から標的ポリヌクレオチドに関する配列情報を生成させる、工程;
(b)態様1~116のいずれかに記載の方法のいずれかによって作製される複数のバーコード化ポリヌクレオチドから、または態様118~141のいずれかに記載のポリヌクレオチドライブラリーの複数のバーコード化ポリヌクレオチドから、全トランスクリプトームまたはその一部分をシーケンシングする工程であって、それによって、前記複数の細胞からトランスクリプトームデータを生成させる、工程;および
(c)同じベッセルバーコードを有する(a)からの配列情報および(b)からの配列情報を同じ細胞からのものであると同定する工程。
166. 以下の工程を含む、選択された単一細胞のトランスクリプトームを解析する方法:
(a)態様1~116のいずれかに記載の方法によって作製される複数のバーコード化ポリヌクレオチドから、または態様118~141のいずれかに記載のポリヌクレオチドライブラリーの複数の複数のバーコード化ポリヌクレオチドから、標的ポリヌクレオチドを増幅する、かつシーケンシングする工程であって、それによって、複数の細胞のうちの少なくとも1つにおける標的ポリヌクレオチドのそれぞれに関する配列情報を生成させる、工程;
(b)(a)においてシーケンシングされた標的ポリヌクレオチドのうちの1つに関連するベッセルバーコードを同定する工程であって、それによって、前記標的ポリヌクレオチドを保持する選択された単一細胞を同定する、工程;
(c)前記ベッセルバーコードを保持する細胞の複数のバーコード化ポリヌクレオチドからトランスクリプトームまたはその一部分を増幅する、かつシーケンシングする工程であって、それによって、選択された標的ポリペプチド発現細胞からトランスクリプトームデータを生成させる、工程。
167. トランスクリプトームまたはその一部分が、選択された細胞から、(b)において同定されたベッセルバーコードに特異的なプライマーとバーコード化ポリヌクレオチドの第2アダプター配列に特異的なプライマーとを使って増幅またはシーケンシングされる、態様166記載の方法。
168. 同じ細胞からのトランスクリプトームまたはその一部分の配列情報と標的ポリヌクレオチドのうちの少なくとも1つの配列情報とをマッチングさせる工程を含む、トランスクリプトーム解析のための方法であって、配列情報が、態様1~114のいずれかに記載の方法によって作製される複数のバーコード化ポリヌクレオチドから決定されるか、態様118~141のいずれかに記載のポリヌクレオチドライブラリーの複数のポリヌクレオチドテンプレートから決定されるか、または態様154~164のいずれかに記載の方法から決定される、方法。
169. 同じベッセルバーコードを有する配列は、同じ細胞からのものであるとしてマッチングされる、態様168記載の方法。
170. トランスクリプトームデータが、細胞の機能または活性に関連するパラメータ、特性、特徴または表現型を含む、態様165~169のいずれかに記載の方法。
171. トランスクリプトームデータが、細胞の活性化、疲弊または増殖活性に関連する、態様170記載の方法。
【実施例
【0431】
IX.実施例
以下の実施例は例示のために含まれるに過ぎず、本発明の範囲を限定しようとするものではない。
【0432】
実施例1-単一細胞ポリヌクレオチドシーケンシングのためのエマルジョンにおける転写産物のバーコード化
A. 細胞の調製
単一細胞ポリヌクレオチドシーケンシングを実行するための単一細胞懸濁液を全末梢血単核球(PBMC)から得た。およそ50mLの血液をナトリウムヘパリンが入っているVacutainer CPT細胞調製用チューブ(BD)に採取し、1800×gで20分遠心分離し、血小板を除去するために200×gでの遠心を使って細胞調製緩衝液(2%ウシ胎児血清および2mM EDTAを補足した1×PBS)で2回洗浄し、結果として生じたPBMCをRPMI-1640培地(Life Technologies)+20%ウシ胎児血清+10%DMSO中、-80℃で、必要になるまで凍結保存した。エマルジョン生成に先だって、PBMCを解凍し、遠心分離(200×gで10分)により、細胞緩衝液(Cell Buffer)、すなわち1×ダルベッコのリン酸緩衝食塩水(PBS)で2回洗浄した。次に細胞を、3.5×106細胞/mLの細胞濃度まで、細胞緩衝液で希釈した。次に、その懸濁液を、20μmセルストレーナーを通してピペッティングした。
【0433】
B. エマルジョンにおけるバーコード化
調製された細胞および反応混合物を含有するエマルジョンを形成させた。反応ミックスは2×濃縮液として調製され、それが液滴形成過程において細胞懸濁液と1:1の体積比で混合された。
【0434】
1. エマルジョン反応混合物の調製
下記表E1の試薬およびオリゴヌクレオチドを含有するエマルジョン反応混合物を、PCRクリーンフード中、室温で混合した。
【0435】
(表E1)エマルジョン反応混合物
/5BiosG/=5'ビオチン修飾
/iSp18/=18炭素スペーサー
V=A、C、またはG
N=任意の塩基
rG=リボグアノシン
W=AまたはT
【0436】
2. 単一細胞からの二重バーコード化転写産物ライブラリーの生成
二重バーコード化ポリヌクレオチドライブラリーを生成させる例示的方法の概要を図1Aおよび図1Bに図示する。調製された細胞および反応混合物を使ってエマルジョンを形成させた。エマルジョン生成プラットフォームは、親フルオロカーボン性(fluorophilic)にコーティングされた石英製Dolomite小型2試薬(Small 2-Reagent)チップへの2つの水相と1つの親フルオロカーボン性オイル連続相とのコンピュータ制御された流れが可能になるようにそれぞれがMitos流量センサーを持つ、単一のエアコンプレッサーによって駆動される3つのMitos P-ポンプ(Dolomite Microfluidics)を備えた。一方の水系インプットチャネルは、所望の1液滴あたりの細胞占有レベル(いくつかの態様において、この所望の1液滴あたりの細胞占有レベルは1である)が得られるように、細胞を必要な密度で含有し、一方、もう一つの水系チャネルは溶解・反応混合物を含有した。
【0437】
100μLハミルトンマイクロリットルシリンジを使用し、それぞれ約100μLの反応混合物の注入を2回行って、100μL内径PEEK管試料ループに過装填(overload)した。100μLハミルトン気密シリンジを使って、内径0.2mmで約110μLのFEP管ループに、約110μLの細胞懸濁液を装填した。細胞が沈降および/または凝集するのを防止するために細胞ループを1~2秒ごとにおよそ1回、絶えず反転させるメカニカルローテーターにループを取り付けた。エマルジョンは、チップ中の2つのオイルチャネルからのオイルが同時に流れているDolomite2試薬チップに、水相を同一の流速で集中流噴射(focused flow jetting)することによって形成させた。外側のオイルチャネルはHFE7500(Novec 7500)フルオロカーボンオイル中の0.5~5.0%(w/v)ポリエチレングリコール系界面活性剤を含有していた。エマルジョンジェットを(細胞相チャネルと反応相チャネルにおいて等しい)一定の流量で流した。エマルジョンチップの排出物は、内径0.5mmで12cmのPEEKチューブを通して、冷却したブロック中で約0℃に保った0.2mL PCRストリップチューブ(Eppendorf)中に滴下することによって収集した。
【0438】
過剰なオイルを、キャピラリーマイクロピペットで各チューブの底から除去した。各エマルジョンフラクションに40μLの重層溶液(Overlay Solution)、すなわち25mM Na-EDTA、pH8.0を静かに重層した。
【0439】
それらのエマルジョンを、転写産物タグ付け反応のためにサーマルサイクラー中でインキュベートした。簡単に述べると、45分間の逆転写(RT)工程中は、ポリA特異的RTプライマー(オリゴ-dTプライマー)(SEQ ID NO:1)を使って、RNAを42℃で逆転写すると共に、ランダム化された分子バーコードを含有するユニバーサルアダプター配列(SEQ ID NO:3)の、テンプレートスイッチに基づく付加を行った(例えば図1A参照)。RTに続いて、初期溶解・反応ミックス中に30,000コピー(cp)/μLになるように希釈して最終混合物中の濃度を15,000cp/μLまたは約65pL液滴あたり約1にしたベッセルバーコードテンプレート(SEQ ID NO:2)のPCR増幅を実施するために、エマルジョンを40サイクルの熱サイクリング(各サイクル:82℃で10秒、65℃で25秒)に供した(例えば図1B参照)。ベッセルバーコード(本明細書では「液滴バーコード」ともいう)の一端は、Illuminaリード2(「P7」)プライマー部位(SEQ ID NO:77)を含有し、一方、他端はユニバーサルアダプターオリゴヌクレオチドの共通配列に適合する(SEQ ID NO:4)。したがってPCR中は、テンプレートスイッチしたcDNA(template-switched cDNA)が増幅されたベッセルバーコード鎖にアニールし、オーバーラップ伸長によってスプライスされることで、分子バーコード配列とベッセルバーコード配列とを含有する全長産物が生じうる。
【0440】
上述の方法は、実施例5で述べるとおり、アダプターが付加されるように変更を加えることができ、また実施例6~8で述べるとおり、トランスクリプトームおよび標的特異的解析に使用することもできる。
【0441】
実施例2-単一細胞ポリヌクレオチドシーケンシングのための標的特異的プライマーを使ったエマルジョンにおける転写産物のバーコード化
A. 細胞の調製
50mLの血液をナトリウムヘパリンが入っているVacutainer CPT細胞調製用チューブ(BD)に採取し、1800×gで20分遠心分離し、血小板を除去するために200×gでの遠心を使って細胞調製緩衝液(2%ウシ胎児血清および2mM EDTAを補足した1×PBS)で2回洗浄し、結果として生じたPBMCをRPMI-1640培地(Life Technologies)+20%ウシ胎児血清+10%DMSO中、-80℃で、必要になるまで凍結保存した。エマルジョン生成に先だって、PBMCを解凍し、細胞調製緩衝液で2回洗浄し、計数した。陰性選択に基づくヒトB細胞濃縮キット(Stem Cell Technologies)を使ってB細胞を単離した。20ミクロンセルストレーナーに細胞を通し、細胞調製緩衝液で6.2E+06細胞/ml(300万B細胞実験)または3.1E+06細胞/ml(PGTドナー実験および卵巣腫瘍実験)に希釈した。
【0442】
B. エマルジョンにおける免疫受容体バーコード化
エマルジョン生成プラットフォームは、親フルオロカーボン性にコーティングされた石英Dolomite小型2試薬チップへの2つの水相と1つの親フルオロカーボン性オイル連続相とのコンピュータ制御された流れが可能になるようにそれぞれがMitos流量センサーを持つ、単一のエアコンプレッサーによって駆動される3つのMitos P-ポンプ(Dolomite Microfluidics)からなった。一方の水系インプットチャネルは、所望の1液滴あたりの細胞占有レベルが得られるように、細胞を必要な密度で含有し、一方、もう一つの水系チャネルは、反応緩衝液および下記表E2に示すオリゴヌクレオチド、5単位/μLのMuMLVベースの逆転写酵素(Thermo Scientific)ならびに0.1単位/μLのHerculase II PCRポリメラーゼからなる溶解・反応ミックスを含有した。100μLハミルトンマイクロリットルシリンジを使用し、それぞれ約100μLのLRミックスの注入を2回行って、100μL内径PEEK管試料ループに過装填した。100μLハミルトン気密シリンジを使って、内径0.2mmで約100μLのFEP管ループに、約110μLの細胞懸濁液を装填した。エマルジョンは、チップ中の2つのオイルチャネルからのオイルが同時に流れている2試薬チップに、水相を同一の流速で集中流噴射することによって形成させた。チップの出口チャネルから出るエマルジョンを、冷ブロック上の0.2ml PCRストリップチューブ(Eppendorf)に滴下した後、過剰なオイルをチューブの底からピペッティングによって除去し、40μLの重層溶液を加え(25mM Na-EDTA、pH8.0)、転写産物タグ付け反応のために、チューブを標準的なサーモサイクラーに移した。
【0443】
(表E2)標的特異的RTプライマー
【0444】
45分間の逆転写(RT)工程中は、以前に記述されているように(Shugay,M.et al.Towards error-free profiling of immune repertoires.Nat.Methods 11,653-655(2014)、Islam,S.et al.Highly multiplexed and strand-specific single-cell RNA 5' end sequencing.Nat.Protoc.7,813-828(2012))、標的特異的RTプライマー(表E2)を使って42℃でRNAを逆転写すると共に、ランダム化された分子バーコードを含有するユニバーサルアダプター配列の、テンプレートスイッチに基づく付加を行った(例えば図1A参照)。RTに続いて、初期溶解・反応ミックス中に30,000cp/μLになるように希釈して最終混合物中の濃度を15,000cp/μLまたは約65pL液滴あたり約1にした液滴バーコードテンプレートのPCR増幅を実施するために、エマルジョンを40サイクルの熱サイクリング(各サイクル:82℃で10秒、65℃で25秒)に供した。ベッセルバーコード(液滴バーコード)の一端は、Illuminaリード2(「P7」)プライマー部位(SEQ ID NO:77)を含み、一方、他端はユニバーサルアダプターオリゴヌクレオチドの共通配列に適合した(SEQ ID NO:4)(例えば図1B参照)。したがってPCR中は、テンプレートスイッチしたcDNAが増幅されたベッセルバーコード鎖にアニールし、オーバーラップ伸長によってスプライスされることで、標的配列、分子バーコード配列およびベッセルバーコード配列を含有する全長産物が生じうる。
【0445】
上述の方法は、トランスクリプトームまたはその一部分を逆転写するためのプライマーを含むように、例えば逆転写相中にランダムヘキサマーオリゴヌクレオチドを含めることなどによって、変更を加えることができる。これらの方法は、実施例5で述べるとおり、アダプターが付加されるように変更を加えることができ、また実施例6~8で述べるとおり、トランスクリプトームおよび標的特異的解析に使用することもできる。
【0446】
実施例3-単一細胞ポリヌクレオチドシーケンシングのためにエマルジョン中で標的配列およびトランスクリプトームの転写産物をバーコード化する方法
A. 細胞の調製
凍結保存PBMC懸濁液を素早く解凍し、室温で10体積のRPMI+10%FBSに加えた。350×gで8分間の遠心分離によって細胞をペレット化し、2×10^6細胞/mLになるように、RPMI+10%FBSに再懸濁した。PBMCを組織培養インキュベーター中で約16時間休止(rest)させた。
【0447】
休止させたPBMC(rested PBMC)を約10:1のPBMC:APC比で自家抗原提示細胞と共培養した。この場合、APCは、照射HSV感染HeLa細胞に曝露された自家単球由来樹状細胞であった。この共培養物を5時間インキュベートした。本明細書に記載する方法に限定するつもりはないが、約5時間というインキュベーション時間は、抗原特異的細胞に、抗原に応答して、または他の細胞によって培地中に放出されたサイトカインに応答して、新しいmRNAを発現させるには十分であると考えられる。
【0448】
静かに上下にピペッティングして、新しいチューブに移すことによって、PBMCを共培養物から取り出した。細胞を氷上に置き、CELL緩衝液(20g/L魚皮ゼラチン(Biotium)、155mM KCl、0.05%アジ化ナトリウム、5mM HEPES-Na、pH7.5)+2mM EDTAで洗浄し、次にCELL緩衝液で洗浄し、最後に20ミクロンメッシュストレイナーで濾し、CELL緩衝液に再懸濁した。細胞を計数し、アクリジンオレンジ-ヨウ化プロピジウムによる染色で生存率を評価した。最終細胞密度を3.5×10^6個の生(ヨウ化プロピジウム陰性)細胞/mLに調節し、氷上に保った。
【0449】
エマルジョン生成の直前に、細胞懸濁液を加熱し、氷上に1分間戻した。
【0450】
B. エマルジョンにおけるバーコード化
先の実施例の場合と同様に、単一細胞ポリヌクレオチド分子に分子バーコードとベッセルバーコードとを付加するために、調製された細胞と後続の転写産物タグ付け反応のための反応混合物とを含有するエマルジョンを形成させた。反応ミックスは2×濃縮液として調製され、それが液滴形成過程において細胞懸濁液と1:1の体積比で混合される。
【0451】
1. エマルジョン反応混合物の調製
下記表E3の試薬およびオリゴヌクレオチドを含有する反応ミックスを調製した。シーケンシング時の多様性を増加させるべく、アンプリコンの塩基シフト(base-shifted)(スタガード(staggered))アンサンブルを作製するために、VBオリゴ1(SEQ ID NO:6)、2(SEQ ID NO:7)、3(SEQ ID NO:8)および4(SEQ ID NO:9)を、等モル混合物として加えた。反応混合物を、先の実施例で述べたエマルジョン生成装置の反応試料ループに装填した。
【0452】
(表E3)エマルジョン反応混合物
*はホスホロチオエート結合を示す。
N=A/T/C/G
W=A/T
mA/mG/mC=2'O-メチルA/G/C
U=2'デオキシウリジン
(po)rG=リボグアノシン(RNA塩基)
【0453】
2. 単一細胞からの二重バーコード化転写産物ライブラリーの生成
調製された細胞および反応混合物を使ってエマルジョンを形成させた。エマルジョン生成プラットフォームは、親フルオロカーボン性にコーティングされた石英製Dolomite小型2試薬チップへの2つの水相と1つの親フルオロカーボン性オイル連続相とのコンピュータ制御された流れが可能になるようにそれぞれがMitos流量センサーを持つ、単一のエアコンプレッサーによって駆動される3つのMitos P-ポンプ(Dolomite Microfluidics)を備えた。一方の水系インプットチャネルは、所望の1液滴あたりの細胞占有レベルが得られるように、細胞を必要な密度で含有し、一方、もう一つの水系チャネルは溶解・反応混合物を含有した。
【0454】
100μLハミルトンマイクロリットルシリンジを使用し、それぞれ約100μLの反応混合物の注入を2回行って、100μL内径PEEK管試料ループに過装填した。100μLハミルトン気密シリンジを使って、内径0.2mmで約110μLのFEP管ループに、約110μLの細胞懸濁液を装填した。細胞が沈降および/または凝集するのを防止するために細胞ループを1~2秒ごとにおよそ1回、絶えず反転させるメカニカルローテーターにループを取り付けた。エマルジョンは、チップ中の2つのオイルチャネルからのオイルが同時に流れているDolomite2試薬チップに、水相を同一の流速で集中流噴射することによって形成させた。外側のオイルチャネルはHFE7500(Novec 7500)フルオロカーボンオイル中の0.5~5.0%(w/v)ポリエチレングリコール系界面活性剤を含有していた。エマルジョンジェットを(細胞相チャネルと反応相チャネルにおいて等しい)一定の流量で流した。エマルジョンチップの排出物は、内径0.5mmで12cmのPEEKチューブを通して、冷却したブロック中で約0℃に保った4つの複製0.2mL PCRストリップチューブ(Eppendorf)中に滴下することによって収集した。過剰なオイルを、キャピラリーマイクロピペットで各チューブの底から除去した。
【0455】
それらのエマルジョンを、転写産物タグ付け反応のためにサーマルサイクラー中でインキュベートした。簡単に述べると、反応を事前に4℃で10分間冷却した。次に、45分間の逆転写(RT)工程中に、標的特異的プライマーを使って、またはヘキサマーオリゴヌクレオチドの結合に基づくランダムプライミングによって、37℃でRNAを逆転写し、ランダム化された分子バーコードを含有するユニバーサルアダプター配列の、テンプレートスイッチに基づく付加を行って、ユニークな分子識別子(バーコード)をそれぞれが持つcDNA分子を生成させた。RTに続いて、温度を94℃で10分間保持した。次に、ベッセルバーコードオリゴを増幅するために、エマルジョンを50サイクルの熱サイクリング(各サイクル:83℃で10秒(変性)、65℃で25秒(伸長))に供した。VBオリゴの増幅後に、エマルジョンを10サイクルの高温熱サイクリング(各サイクル:95℃で10秒(変性)、63℃で25秒(アニーリング)、72℃で2分20秒(伸長))に供した。熱サイクリングサイクルが完了した後は、エマルジョンを4℃に保持した。
【0456】
実施例4-二重バーコード化cDNAの精製
各エマルジョンフラクションチューブについて、上記の実施例において生成したcDNA転写産物を二重バーコード化した後、等体積の1:1(v:v)パーフルオロオクタノール:FC-40と混合することによってエマルジョンを(PCR後に)破壊し、DNA重合を停止させるためにEDTAを5mMの最終濃度になるように加えた。およそ0.1体積のQiagenプロテアーゼを加え、破壊されたエマルジョンを50℃で10~15分間インキュベートした後、チューブを95℃で3分間インキュベートすることによって、プロテアーゼを熱失活させた。チューブを手短に遠心分離し、上側の水相を新しいチューブに移した。
【0457】
1.8体積のAMPure XP(Beckman Coulter)による精製を製造者の指示に従って行うことにより、二重バーコード化cDNAを濃縮し、脱塩した。cDNAをビーズから溶出させ、8μLの0.1M水酸化ナトリウム+1mM EDTAを加えて50℃に3分間加熱することによって変性させた。RTプライマーの5'ビオチン化ゆえに全長産物がビオチンを含有する場合は、そのような全長産物を、ストレプトアビジンビーズでの浄化によって、過剰の液滴バーコードPCR産物から分離した。
【0458】
2μLの6×DNAローディング色素(New England Biolabs)を加えてから、変性した一本鎖cDNAを、30mM NaOH+1mM EDTA中の1.5%(w/v)アガロースゲルにおいて、5V/cmで35分間、分離した。ゲルのpHを中和した後、100~1000ntに対応するサイズ範囲内のcDNAを含有するゲルを切り出し、切り出したアガロースから、DNA回収キット(例えばZymoclean(商標)Gel DNA Recovery Kit、Zymo Research)を使って、cDNAを精製し、20μLの10mM Tris-Cl、pH8.5+0.05%TWEEN(登録商標)20中に溶出させた。cDNAを1.8体積のAMPure XPビーズでさらに脱塩し、95℃で10秒間加熱することによって10.5μLの10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させ、氷上に置くことによって沈殿させた。
【0459】
実施例5-二重バーコード化cDNA転写産物への3'アダプター配列のライゲーション
公知のプライミング部位を含有するアダプター配列を、実施例3で述べたように生成させた二重バーコード化cDNA転写産物に、実施例4で述べた精製後に付加した。アダプター配列の付加により、公知プライマーによるあらゆる転写産物の増幅、クローニング、または次世代シーケンシングなどのシーケンシングが可能になる。ここで使用される例示的P5アダプター配列など、いくつかのアダプター配列は公知であり、シーケンシングに日常的に使用されている。
【0460】
1. 3'アダプター配列付加の方法
一本鎖、二重バーコード化cDNA配列の未知の3'端にアダプター配列を付加するために、いくつかの方法を使用した。ssDNAアダプターをライゲートする耐熱性Appリガーゼ(NEB)およびCircLigase II(Epicentre)などのリガーゼを使って、二重バーコード化cDNA転写産物の3'端にアダプター配列を付加した。cDNAの3'端への非テンプレートヌクレオチドの酵素的付加に基づく市販のキット(Swift Biosciences Accel-NGS 1S DNA Kit)も、アダプター配列を付加するために使用した。さらに、6ヌクレオチドまでの縮重オーバーハング(すなわちNNNNNN;SEQ ID NO:24)を使って、cDNAの3'端に突き出したアダプターにアニールさせた縮重スプリントを使用する方法も使用した。縮重オーバーハングとしては、試験したプロトコールではNNNNNN(SEQ ID NO:24)が最もうまくいくようであった。
【0461】
2. 6-ヌクレオチドオーバーハングを持つ縮重スプリントを使った二重バーコード化cDNAへの3'アダプター配列の付加
ショートP5(short P5)プライミング配列
を含有するオリゴヌクレオチドと、
として示されるスプリングオリゴヌクレオチドとを、1.2:1の比で混合することによって、スプリント-アダプター二重鎖分子を形成させた。アニーリング緩衝液を30mM HEPES-Na pH7.5、0.1M KClに加えた。その溶液をサーモサイクラーにおいて85℃で2分間加熱し、0.1℃/秒の速度で37℃まで冷却した。
【0462】
次に、上記パートAから回収された二重バーコード化cDNA転写産物をスプリント-アダプター溶液と混合した。次に、その混合物に等体積のBlunt/TAリガーゼマスターミックス(New England Biolabs)を加えて室温でインキュベートすることにより、アダプターをcDNA転写産物にライゲートした。混合物をAMPureXPで精製し、DNAを10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させることにより、過剰のアダプターDNAを除去した。
【0463】
実施例6-トランスクリプトームライブラリーのPCR増幅およびシーケンシング
A. ポリヌクレオチドのライブラリーを増幅する
精製された二重バーコード化およびユニバーサルアダプター標識配列を、二重バーコードおよび転写産物のコーディング配列の5'(cDNA転写産物の5'端)に位置するC7ユニバーサルアダプター配列に相補的なフォワードプライマー(SEQ ID NO:28)と、二重バーコードおよび転写産物のコーディング配列の3'(cDNA転写産物の3'端)に位置するP5ユニバーサルアダプター配列に相補的なリバースプライマー(SEQ ID NO:27)とを使って、8サイクルにわたってPCR増幅した(PCR0)。
【0464】
PCR0反応混合物(アダプターがライゲートされたcDNA(実施例5で生成したもの)DNAポリメラーゼ、C7フォワードプライマー、P5リバースプライマー、dNTP、および反応緩衝液を含有するもの)を、まず98℃で1分間変性させ、次に8サイクルの熱サイクリング(各サイクル:98℃で10秒、69℃で20秒、72℃で10秒)を行い、72℃で2分間の最終伸長時間を設けた。PCRの完了後は混合物を4℃で保持した。
【0465】
PCR0で生成した各cDNA配列は、C7アダプター配列、ベッセルバーコード(宿主細胞同定用)の配列、分子バーコード(転写産物同定用)の配列、転写産物の配列、およびP5アダプター配列を含有した。次に、増幅されたライブラリー(PCR0産物)をAMPure XPビーズで精製し、10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させた。
【0466】
次に、精製されたトランスクリプトームライブラリーを使って、後述するように、以下の1つまたは複数をシーケンシングした:1つまたは複数の全長ターゲット遺伝子、例えば免疫受容体、エマルジョン中のすべての細胞のトランスクリプトーム、および/またはエマルジョン内の1つまたは複数の選択された細胞のトランスクリプトーム。
【0467】
B. ターゲット遺伝子のシーケンシング
1. PCR1:標的遺伝子の増幅
選択された標的遺伝子を増幅するために、PCR0に使用したユニバーサルフォワードプライマー(C7-インデックス-P7プライマー;SEQ ID NO:28)と所望の標的に特異的なリバースプライマー(例えば免疫グロブリン特異的プライマーまたはT細胞受容体特異的プライマー)とを使って、PCR0産物を増幅した。PCR1反応に使用した例示的標的プライマーを下記表E4に示す。
【0468】
(表E4)例示的な標的特異的リバースプライマー配列
【0469】
PCR1反応混合物(PCR0産物(上記パートAで生成したもの)、DNAポリメラーゼ、C7-インデックス-P7フォワードプライマー、標的特異的リバースプライマー、dNTPおよび反応緩衝液を含有するもの)を、まず98℃で1分間変性させ、次に10サイクルの熱サイクリング(各サイクル:98℃で10秒、61℃で20秒、72℃で20秒)を行い、72℃で2分間の最終伸長時間を設けた。PCR1の完了後は混合物を4℃で保持した。PCR1産物(標的遺伝子配列)をAMPure XPビーズで精製し、10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させた。
【0470】
2. PCR2:標的遺伝子の増幅、3'シーケンシングアダプター配列の付加
精製されたPCR1産物を、C7フォワードプライマー(SEQ ID NO:39)とユニバーサルプライミングP5ショート(P5short)配列を含有する標的特異的リバースプライマーとを使って増幅した。PCR2反応に使用した例示的なプライマーを下記表E5に示す。
【0471】
(表E5)例示的PCR2プライマー
【0472】
PCR2反応混合物(PCR1産物(上記パートB1で生成したもの)、DNAポリメラーゼ、C7フォワードプライマー(SEQ ID NO:39)、標的特異的ショートP5リバースプライマー、dNTPおよび反応緩衝液を含有するもの)を、まず98℃で1分間変性させ、次に6サイクルの熱サイクリング(各サイクル:98℃で10秒、65℃で20秒、72℃で20秒)を行い、72℃で2分間の最終伸長時間を設けた。PCR2の完了後は混合物を4℃で保持した。PCR2産物(標的遺伝子配列)をAMPure XPビーズで精製し、10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させた。
【0473】
3. 標的遺伝子の定量PCR(qPCR3)およびシーケンシング
精製されたPCR2産物またはPCR0産物を、定量PCR(qPCR)に使って、qPCR3エンドポイントを達成するまでの増幅サイクル数を決定した。予備増幅してアダプターをライゲートしたPCR0からの材料、またはPCR2からの全長IGまたはTR材料を、C7(フォワード;SEQ ID NO:39)プライマーとC5-P5(リバース;SEQ ID NO:76)プライマーとで増幅した。
【0474】
簡単に述べると、qPCR3反応混合物(PCR0産物またはPCR2産物(それぞれ上記パートAまたはパートB1で生成したもの)、DNAポリメラーゼ、C7フォワードプライマー(SEQ ID NO:39)、C5-P5リバースプライマー(SEQ ID NO:76)、dNTP、EvaGreen、および反応緩衝液を含有するもの)を、まず98℃で1分間変性させ、次に3サイクルの熱サイクリング(各サイクル:98℃で10秒、60℃で20秒、72℃で20秒)を行い、次に30サイクルの第2ラウンドの熱サイクリング(各サイクル:98℃で10秒、70℃で20秒、72℃で20秒)を行った。qPCR強度プロットを調べて、蛍光強度は最大であるが、DNAの増幅はまだ終わっていない増幅サイクルを決定した。これをqPCR3エンドポイントの最終サイクル数であると決定した。
【0475】
各ライブラリーを指数期まで増幅するのに必要なPCRサイクルの数を決定した後、同じPCRを所望のサイクル数まで非定量的に繰り返し、1AMPure XPで精製し、10mM Tris-Cl、pH8.0+0.05%TWEEN(登録商標)20に溶出させた。任意で、qPCR3結果をDASHによって規格化した(Gu et al.,Genome Biology 2016,17:41)。結果をAgilent Tapestation D1000テープで解析し、KAPA NGS Quant Kit for Illuminaで定量し、アダプターをライゲートしたライブラリーの場合はIllumina NextSeq高出力75サイクルキット(例えば32サイクルのリード1、6サイクルのインデックスリードI7、54サイクルのリード2)で、または全長IGおよびTRライブラリーの場合はIllumina MiSeq V3 600サイクルキット(例えば325サイクルのリード1、6サイクルのインデックスリードI7、300サイクルのリード2)でシーケンシングした。場合により、NextSeqシーケンサーは、56サイクルのリード1、6サイクルのインデックスリードI7および33サイクルのリード2を使用した。
【0476】
C. 全細胞からのトランスクリプトームをシーケンシングする
全細胞からトランスクリプトームライブラリーを生成させるために、標的特異的リバースプライマーを、3'アダプター配列に対するユニバーサルリバースプライマー(例えばSEQ ID NO:27および76)で置き換えて、増幅のためにユニバーサルフォワードプライマー(例えばSEQ ID NO:28および39)と組合せて使用する点以外は、上述のように、PCR1反応、PCR2反応およびqPCR3反応を実行する。したがって、エマルジョン中の全細胞のすべての転写産物をシーケンシングするために、ユニバーサルフォワードプライマーおよびユニバーサルリバースプライマーを使用することができる。
【0477】
D. 選択された細胞からのトランスクリプトームをシーケンシングする
選択された細胞からトランスクリプトームライブラリーを生成させるために、1つまたは複数の所望の細胞の、例えば上記パートAでシーケンシングされた関心対象のIg分子またはTCRを含有する1つまたは複数の細胞の、ベッセルバーコード(VB)に相補的なフォワードプライマーと、3'アダプター配列に対するユニバーサルリバースプライマー(例えばSEQ ID NO:27および76)とを使用する点以外は上述のように、PCR1反応、PCR2反応およびqPCR3反応を実行する。
【0478】
実施例7-配列データの解析
Illumina MiSeqリードを処理して、mRNA分子および液滴に関する全長コンセンサス配列を生成させ、IgBLASTおよびIMGT/HighV-QUESTでアノテーションを付与し、カスタムスクリプトおよびChange-Oパッケージで処理することで、統計および図を生成させた。Illuminaソフトウェアを使ってMiSeqリードをデマルチプレキシングした。Phredクオリティ5未満の位置をNでマスクした。アイソタイプ特異的プライマー、ベッセルバーコード(VB)、分子バーコード(MB)およびアダプター配列をアンプリコン中に同定し、pRESTO MaskPrimers-cutを使用し、0.2の最大エラー(maximum error)で、トリミングした。
【0479】
A. 選択された免疫受容体配列データ配列データの解析
一例として、ターゲット免疫受容体の全長配列を調製しシーケンシングした。同じ元の起源mRNA分子から生じるPCR複製物であるVBとMBを一緒に含むユニークな分子識別子(UMI)によってグループ分けされたリードから、各mRNAについて、リード1コンセンサス配列およびリード2コンセンサス配列を別々に生成させた。UMIリード群をMUSCLEでアライメントし、pRESTOを使って、以下のパラメータでコンセンサス配列を構築した:maxdiv=0.1;bf PRIMER;prfreq=0.6;maxmiss=0.5;q=5;リード群についてコールされたPCRプライマー配列の一致(called PCR primer sequence agreement for the read group)>60%;maximum nucleotide diversity=0.1;インデル位置では多数決を使用;および事後(コンセンサス)クオリティの低いアライメントカラムをマスキング。次に、ペアードエンドコンセンサス配列を、2ラウンドでスティッチングした。まず、各リードペアのコンセンサス配列末端の、ギャップを施さないアライメントを、Zスコア近似を使って最適化し、以下のパラメータにより、pRESTO AssemblePairs-alignに実装される二項検定のp値で、スコア化した:minimum length=8;alpha 1×105;およびmaximum error=0.3。この方法でスティッチングできないリードペアについては、pRESTOのAssemblePairs-referenceパラメータ:minimum identity=0.5;e値1×10 5を使って、スティッチングまたはギャップを施したリード結合の前に、各リードの足場を組むように、ヒトBCRおよびTCR生殖細胞系列のVエクソンを使用して、スティッチングを試みた。
【0480】
1. VDJセグメントアノテーションおよびアイソタイプの確認
IgBLAST、Change-Oおよびカスタムスクリプトを使って、起源の生殖細胞系V(D)J遺伝子を同定し、mRNA配列をV(D)J領域にトリミングし、CDR3領域を同定し、生殖細胞系列Vヌクレオチド配列からの変異を算定した。IgBLASTはNをミスマッチとしてカウントするが、6つを超えるV領域Nを持つmRNA配列には、変異解析およびクロスフラクションペアリング精度解析(cross-fraction pairing precision analysis)のためにフィルターをかけた。IG重鎖については、pRESTO MaskPrimers-scoreパラメータ:start=0;maximum error=0.2を使って非プライマーC領域(定常領域エクソン)を予想される配列とマッチングすることによって、アイソタイプの実体を確認した。プライマー/非プライマーC領域コールが一致しないアンプリコンは、特異的プライマークロストークイベントが目視検査によって解消された2つのプライマー/非プライマーの組合せを除いて、捨てた。
【0481】
2. V(D)J配列のクローン系統へのグループ分け
重み付けされたクローン内距離によるシングルリンケージクラスタリング(single-linkage clustering)を使って、V(D)J配列をグループ分けした。クラスタリングは、Change-OパッケージのDefineClone-by groupパラメータ:model=mln;gene=first;dist=4.0;norm=noneで行った。まず、同じ初期組換えイベントから生じる可能性がある配列が(IMGT/HighV-QUESTによって同定されるベストマッチIg VH遺伝子、ベストマッチIgJH遺伝子および結合部長(junction length)に基づいて)一つにビニングされるように、すべての機能的IgVH鎖の液滴コンセンサス配列を、V-J結合部ビンにビニングした。クローン内距離のしきい値は、Change-OのshmパッケージのdistToNearest関数を使って、各IgVHビン内で最近傍距離のヒストグラムを生成し、ヒストグラムを自然距離カットオフ(二峰性ヒストグラムのトラフ内)について目視検査することによって選んだ。軽鎖のクローンクラスターは、同じ距離モデルおよびしきい値を使って規定した。
【0482】
3. 液滴フィルタリング、ペアリング忠実度計算
重鎖-軽鎖ペアリングの信頼度を2つの独立した方法で、すなわち液滴内mRNA配列一致および複製物間ペア一致を使用して、評価した。液滴内mRNA一致はある座位内のV(D)J配列の平均ペアワイズヌクレオチド差異(Neiのpi(Nei's pi)<0.02)として規定した。mRNA配列は、IgBLASTアノテーションを使ってV(D)Jヌクレオチドコーディング配列にトリミングした。各液滴内で、すべての有効(productive)mRNA配列を、V座位によってグループ分けした。各グループ内で、pRESTO AlignStetsに実装されたMUSCLEを使用し、デフォルトパラメータを使って、複数の配列をアライメントした。液滴コンセンサス鎖は、pRESTOパラメータ:BuildConsensus.py;maximum div=0.2;maximum miss=0.5を使って、1つの座位につき複数のmRNAから構築した。ランダムにシャッフルされた液滴を使って、多様性カットオフpi<0.02を選択した。シャッフルされた液滴内で、重鎖座位の0.01%未満(軽鎖座位の<0.2%)が、この基準を満たした。複数の細胞または免疫受容体を含む液滴(multi-cell or immune-receptor included droplet)を、さらなる精度解析のために分離した。
【0483】
ペアリング精度は、単一の系統だけを含有する可能性が高い、すなわち単一のV(D)JおよびVJ再構成とそれに続く拡大から生じた可能性が高いVDJクラスターに焦点を当てた、複数の複製物(別々のエマルジョン実験)にわたる同じクローンペアの観察に基づいて算出した。類似するVDJ再構成が個々の複数の独立した時間内で生じて、複数の異なる軽鎖VJ再構成とネイティブにペアリングした同じ重鎖V(D)J再構成をもたらしうる。希少なV(D)J再構成は、本明細書に記載する方法によって達成される技術的精度の、より正確な尺度を与えるであろうから、長い重鎖CDR3(CDR3H)を(より希少なV(D)J再構成の代理として)この解析の焦点とした。クローン割り当ての信頼度を増加させるために、Nが>6の配列も除去した。ペアリング精度は、フラクション間で観察された最も長い四分位のクローン(結合部長≧54ntの2604クローン)について、CDR3H長と共に96%超まで増加した。クローンペア一致の確率は、2回の独立した実験における真のペアの同時確率であるから、ペアリング精度は、以下のように算出される複製物間のペアリング一致の平方根として見積った。ここで、
は、物理的フラクションfに見いだされる、ペアリングされた重鎖クローンhと軽鎖クローンlを持つベッセルバーコードの数dである。各実験についての平均(平方)ペアリング精度は、重鎖クローンhおよびすべてのフラクションペア(f,g)にわたって、ペアリングされた軽鎖クローン(l,k)の一致を平均することによって見積られる。
【0484】
したがってこの例示的実験では、各実験の平均精度(実験間の精度の分散内まで)は96.1%であった。
【0485】
B. トランスクリプトーム配列データ解析
トランスクリプトーム配列データについて、同じVBを含むリードを縮約し、転写産物を同定するために、配列をヒトリファレンスゲノムにアライメントした(HiSAT2)。出力ファイルのアライメントはsamtoolsを使って操作し、リードをゲノム位置によって転写産物に割り当てた。
【0486】
各VB-ゲノムマッピングについて、リードをMBによって縮約した。マトリックスはMBカウントで構成され、液滴あたりの各個別リファレンス遺伝子にマッピングされた。次にこれらのデータを標的データ、例えばパートAで上述したように処理した免疫受容体配列データとマージした。各VB(液滴)からのデータに、遺伝子カウントおよび受容体情報でアノテーションを付与した。次に、合わせたデータセットを解析して、単一細胞RNA配列プロファイルを調べた(scRNAseq)。次元削減、クラスタリングおよび視覚化は、t-SNE、Seurat、ZIFA、PCA、LDAなどの例示的プログラムを使って実行した。
【0487】
実施例8-多数の単一細胞からの例示的ハイスループットトランスクリプトーム配列データ解析およびプロッティング
上記実施例4Aおよび4Bで概説したように、約7000個のPBMCを調製し、トランスクリプトームおよび全長BCRおよびTCR受容体をシーケンシングした。
【0488】
Illumina NextSeqによる解析に先だって、実施例4Bで述べたように調製されたエマルジョンのトランスクリプトームシーケンシングライブラリーを、D1000 DNA tapestationで解析した。トランスクリプトームは、およそ170~900bpのサイズにわたる配列によって表された。実施例4Aで述べたターゲットシーケンシングによってシーケンシングされた全長TCR配列も、NextSeq解析に先だってD1000 DNA tapestationで解析したところ、TCRアルファおよびTCRベータピークがそれぞれ628bpおよび664bpに示された。
【0489】
NextSeq解析後に、>1,000リードであるすべての液滴細胞プロファイル(n=6,707)を、t分布型確率的近傍埋め込み法(t-distributed stochastic neighbor embedding)(t-SNE)およびSeuratクラスタリングによって解析した。多次元単一細胞トランスクリプトームデータをt-SNEプロットを使って視覚化し、類似する転写プロファイルを持つ細胞のSeuratクラスタリングに基づいて(図3A)またはシーケンシングされた免疫受容体の性質(すなわちBCR(赤/ミディアムグレー)またはTCR(緑/ダークグレー))によって(図3B)、細胞を色分けして、類似する表現型を持つ細胞のクラスタリングを示した。
【0490】
シーケンシングされた細胞中の例示的遺伝子に関するトランスクリプトームデータを解析し、シーケンシングされた免疫受容体と同じベッセルバーコードを持つ配列情報を、同じ細胞からのものであると同定した。トランスクリプトーム中の例示的遺伝子に関する単一細胞トランスクリプトームデータを発現レベルのヒートマップに基づいて色分けして、Toll様受容体7(TLR7;図4A)、T細胞表面糖タンパク質CD3イプシロン鎖(CD3E;図4B)、ナチュラルキラー細胞顆粒タンパク質7(NKG7;図4C)、MRC1マンノース受容体Cタイプ1(MRC1;図4D)について示す。
【0491】
これらの結果は、T細胞(CD3E)またはB細胞(TLR7)に関連する遺伝子マーカーが一般にそれぞれ全長TCRまたはBCRを発現する細胞に一緒にクラスタリングされるので、ゲノムワイドなRNA発現プロファイルを免疫受容体と一緒にハイスループットで捕捉できることを示している。また、T細胞やB細胞と関連しない遺伝子マーカー、例えば例示的NK細胞マーカーNKG7または例示的単球マーカーMRC1は、全長TCRまたはBCR免疫受容体を持つ細胞にはクラスタリングされないようだった。
【0492】
開示した特定態様は本発明のさまざまな局面を例示するなどといった目的で提供されているのであって、本発明の範囲は、それら特定態様に限定されるものではない。記載の組成物および方法のさまざまな変更態様は、本明細書における記載および教示から、明らかになるであろう。そのような変形は、本開示の範囲および要旨から逸脱することなく実施することができ、本発明の範囲に包含されるものとする。
【0493】
配列
図1A
図1B
図2
図3
図4
【配列表】
0007308187000001.app